Jesteś autorem/wydawcą tego dokumentu/książki i zauważyłeś że ktoś wgrał ją bez Twojej zgody? Nie życzysz sobie, aby podgląd był dostępny w naszym serwisie? Napisz na adres
a my odpowiemy na skargę i usuniemy zabroniony dokument w ciągu 24 godzin.
Zobacz podgląd pliku o nazwie 12190 PDF poniżej lub pobierz go na swoje urządzenie za darmo bez rejestracji. Możesz również pozostać na naszej stronie i czytać dokument online bez limitów.
Seria WYKŁADY Z PSYCHOLOGII
Redaktor naukowy: Jerzy Brzeziński
tom 6
Seria Wykłady z Psychologii obejmuje autorskie ujęcie podstawowych dziedzin psychologii, wchodzących w obręb programu pięcioletnich studiów magisterskich na tym kierunku. Poszczególne książki z tej serii, napisane przez badaczy o długoletnim doświadczeniu dydaktycznym i znaczących osiągnięciach naukowych, adresowane są przede wszystkim do studentów psychologii, ale mogą też być z pożytkiem wykorzystane przez studentów pokrewnych kierunków.
W serii Wykłady z Psychologii będą ukazywały się książki, które odnoszą się do przedmiotów ujętych w Minimalnych wymaganiach programowych opracowanych przez Radę Główną Szkolnictwa Wyższego oraz w Standardach akredytacji kierunku studiów psychologia Uniwersyteckiej Komisji Akredytacyjnej — zarówno z grupy przedmiotów podstawowych, jak i grupy przedmiotów ujętych w programach różnych specjalności (psychologii klinicznej, psychologii edukacji, psychologii organizacji i zarządzania itd.). Zaprezentowane zostaną także najnowsze obszary badań w zakresie podstaw i zastosowań psychologii, m.in.: neuronauka poznawcza, genetyka behawioralna, psychologia polityczna, psychologia środowiskowa, psy-chologiareklamy.
Elżbieta Hornowska
Testy psychologiczne
Teoria i praktyka
?
Wydawnictwo Naukowe SCHOLAK
Redaktor: Filip Modrzejewski
Korekta: TLespól
Projekt okładki: Katarzyna Juras
Copyright © 2001, 2003 by Wydawnictwo Naukowe „Scholar", Warszawa
?
ISBN: 83-7383-056-1
St u kknłczaei. p"«Vi.rsr4f>tfn cum-
Wydawnictwo Naukowe „Scholar", Spółka z o.o. .i* tui Łś
ul. Krakowskie Przedmieście 62, 00-322 Warszawa
tel./fax 828 95 63, 826 59 21, 828 93 91
dział handlowy: 635 74 04 w. 219 lub jw. wew. 108
e-mail
[email protected]
http://www.scholar.com.pl
Wydanie drugie
Skład i łamanie: WN „Scholar" (Stanisław Beczek) Drukarnia Diecezjalna w Sandomierzu tel. (0-15) 832-31-92
r
?
Spis treści
Wstęp.............................................
Część I
Podstawowe problemy psychometrii
Rozdział 1. Wnioskowanie psychometryczne................
1.1. Czym zajmuje się psychometria?.......................
1.2. Definicja testu i rodzaje testów........................
Definicja testu....................................
Rodzaje testów...................................
1.3. Kryteria dobroci testów psychologicznych.........
Obiektywność, czyli niezależność wyników testowania
Standaryzacja, czyli jednolitość warunków badania..........
Rzetelność, czyli dokładność pomiaru...................
Trafność, czyli obszar zastosowania testu.................
Normy, czyli nadawanie znaczenia wynikom testowym.......
Właściwa adaptacja, czyli dopasowanie testu do polskich warunków
1.4. Proces wnioskowania psychometrycznego.................
1.5. Dwa słowa o historii testowania.......................
Podstawowe pojęcia...................................
Literatura zalecana....................................
n
17 17 21 21 22 25 25 26 28 28 29 29 32 35 38 40
Rozdział 2. Klasyczna teoria testów jako podstawa wnioskowania
o rzetelności testu.................................... 41
2.1. Źródła błędu w pomiarze testowym..................... 41
Konstrukcja testu.................................. 42
Sytuacja testowania................................ 42
Sposób oceny wyników............................. 43
2.2. Model wyniku prawdziwego i jego założenia
- klasyczna teoria testów............................ 43
2.3. Definicja rzetelności................................ 45
Interpretacja współczynnika rzetelności.................. 48
2.4. Metody badania rzetelności........................... 49
Badanie rzetelności metodą powtarzania testu
(tzw. technika test-retest)............................ 49
Rzetelność szacowana metodą wersji równoległych (alternatywnych) 51 Rzetelność szacowania na podstawie wyników jednokrotnego
badania danym testem.............................. 52
Rzetelność jako zgodność ocen........................ 55
Porównanie poszczególnych współczynników rzetelności...... 55
Rzetelność testów szybkości.......................... 57
Rzetelność testów zorientowanych na kryterium (standard wykonania) 59
Czynniki wpływające na wielkość współczynnika rzetelności ... 60
2.5. Ocena rzetelności indywidualnego wyniku................ 63
Standardowy błąd pomiaru........................... 63
Standardowy błąd różnicy między dwoma wynikami......... 67
2.6. Teoria uniwersalizacji jako odmiana klasycznej teorii testów ... 69
Wariancja wyników testowych........................ 70
Źródła wariancji.................................. 71
Wariancja prawdziwa oraz wariancja błędu................ 72
Schematy badawcze................................ 72
Podstawowe pojęcia................................... 79
Literatura zalecana.................................... 79
3.2. 3.3.
3.4.
Rozdział 3. Trafność, czyli określanie obszaru zastosowania testu . 80
3.1. Pojęcie trafności.................................. 80
Rodzaje trafności.................................. 82
Sposoby badania trafności............................ 85
Trafność treściowa................................. 85
Trafność kryterialna................................ 90
Trafność teoretyczna............................... 94
Stronniczość testów................................100
Definicja stronniczości..............................102
Potencjalne źródła stronniczości testu....................104
Stronniczość testu a trafność treściowa...................107
Stronniczość testu a trafność kryterialna..................109
Stronniczość testu a trafność teoretyczna.................110
Techniki szacowania stronniczości testu..................111
Wykorzystanie testów dla celów selekcyjnych..............114
Indywidualizm nieograniczony........................119
Indywidualizm ograniczony..........................121
Dobór kwotowy...................................123
Podstawowe pojęcia...................................127
Literatura zalecana....................................127
3.5
Rozdział 4. Normy, czyli nadawanie znaczenia wynikom testowym 128
4.1. Pojęcie normy w psychometrii........................128
Znaczenie grupy odniesienia..........................129
Normy ogólnokrajowe..............................131
Normy lokalne...................................133
4.2. Rodzaje norm ze względu na sposób ich konstrukcji.........134
Normy standardowe................................134
Normy rangowe...................................146
Normy typu równoważnikowego.......................150
4.3. Interpretacja wyników testów zorientowanych na kryterium .... 154
Podstawowe pojęcia...................................156
Literatura zalecana....................................157
Rozdział 5. Konstruowanie testu - podstawowe procedury......158
5.1. Od czego zaczynamy?..............................160
Określanie celu pomiaru.............................160
Określanie obszaru zachowań identyfikowanych z mierzonym konstruktem (procedura operacjonalizacji)................160
5.2. Zasady budowania pozycji testowych....................162
5.3. Analiza zadań....................................167
Analiza językowo-treściowa..........................167
Badanie pilotażowe................................169
Wskaźnik trudności................................170
Współczynniki mocy dyskryminacyjnej..................175
Rzetelność \ trafność pozycji testowej...................182
Analiza zadań w testach szybkości......................184
Analiza zadań w testach zorientowanych na kryterium........184
5.4. Stronniczości pozycji testowych - zjawisko zróżnicowanego funkcjonowania pozycji.............................186
5.5. Ostateczna rewizja testu.............................191
Walidacja krzyżowa................................191
5.6. Teoria odpowiadania na pozycje testu...................193
Ograniczenia modelu klasycznego......................193
Założenia IRT....................................195
Krzywa charakterystyczna pozycji testowej................195
Parametry pozycji testowej i skala cechy latentnej...........197
Modele formułowane w ramach IRT....................199
Gdzie wykorzystuje się modele IRT?....................202
Podstawowe pojęcia...................................204
Literatura zalecana....................................204
Rozdział 6. Społeczny kontekst stosowania testów psychologicznych 205
6.\. Testowanie psychologiczne - społeczne niebezpieczeństwa.....205
6.2. Prawa osób badanych...............................213
Prawo do wyrażenia świadomej zgody na badanie testem......213
Prawo do informacji o wynikach testowania...............214
Prawo do minimalizowania skutków etykietowania ..........215
Prawo do zachowania tajemnicy o wynikach testowania.......215
Prawo do prywatności..............................217
6.3. Testy przed sądem.................................217
6.4. Testy jako produkty rynkowe.........................220
Podstawowe pojęcia...................................224
Literatura zalecana....................................
Część II
Krótki przewodnik, czyli jak samemu zbudować
TEST
Poradnik dla studentów................................
Llteratura.........................................
Indeks nazwisk......................................
227 241 255
-
?
8
i\ ioioir?
Spis rysunków
Rys. 1.1. Definicje semantyczne i syntaktyczne ......................... 19
Rys. 1.2. Podział testów ze względu na rodzaj możliwej odpowiedzi .......... 24
Rys. 1.3. Podział testów ze względu na rodzaj interpretacji wyniku testowego ... 25
Rys. 1.4. Proces wnioskowania psychometrycznego ...................... 35
Rys. 2.1. Źródła błędu losowego w badaniu testowym .................... 42
Rys. 2.2. Metody badania rzetelności ................................ 56
Rys. 2.3. Rzetelność testu jako funkcja jego długości ..................... 61
Rys. 2.4. Schemat badawczy dla układu krzyżowego oraz układu gniazdowego . . 76
Rys. 2.5. Kolejne etapy postępowania w ramach teorii uniwersalizacji ......... 78
Rys. 3.1. Definicja i rodzaje trafności ............................... 86
Rys. 3.2. Kiedy test jest trafny treściowo? ............................ 88
Rys. 3.3. Diagramy korelacyjne przedstawiające rodzaje relacji między wynikami
testowymi (X) i zmienną kryterialną (Y) w grupie większości i mniejszości 113 Rys. 3.4. Podział populacji starających się o pracę przy uwzględnieniu
kwalifikacyjnego wyniku testu psychologicznego (oś X) oraz kryterium
pracy zawodowej (oś Y) .................................. 116
Rys. 3.5. Różne kombinacje stosunku wyboru i stosunku powodzenia przy różnych
stopniach trafności prognostycznej testu ....................... 117
Rys. 4.1. Normy typu standardowego ................................ 135
Rys. 4.2. Rozkład normalny a skala staninowa ......................... 137
Rys. 4.3. Wykorzystanie skali standardowej o szerokim zakresie wyników (Skala
T) i skali standardowej o wąskim zakresie wyników (skala staninowa) do
przedstawienia wyników dwóch osób (X) i (Y) .................. 139
Rys. 4.4. Efekt niezgodności między długością skali wyników surowych a długością
skali wyników przeliczonych............................... 141
Rys. 4.5. Graficzna reprezentacja istoty procesu normalizacji ............... 143
Rys. 4.6. Etapy procedury normalizacji .............................. 145
Rys. 4.7. Skala centylowa ........................................ 148
Rys. 4.8. Związek między centylami a rozkładem normalnym .............. 149
Rys. 4.9. Siatka centylowa obrazująca możliwość porównywania dwóch wyników
wyrażonych w centylach .................................. 150
Rys. 5.1. Etapy tworzenia testu .................................... 159
Rys. 5.2. Rodzaje związków między wynikiem danej pozycji testowej a ogólnym
wynikiem w teście ...................................... 176
Rys. 5.3. Ilustracja problemu nakładania się zakresów .................... 181
Rys. 5.4. Związek między wynikiem otrzymanym w teście a poziomem mierzonej
cechy w klasycznej teorii testów oraz w IRT .................... 194
Rys. 5.5. Przykład hipotetycznej krzywej charakterystycznej pozycji testowej (item
characteristic curve, ICC) ................................. 196
Rys. 5.6. Dwie krzywe ICC różniące się współczynnikami mocy dyskryminacyjnej
pozycji testowej ........................................ 197
Rys. 5.7. Dwie krzywe ICC różniące się współczynnikami trudności pozycji testowej 198
Rys. 5.8. Dwie krzywe ICC różniące się współczynnikami zgadywania ........ 200
Rys. 5.9. Trzy hipotetyczne sytuacje, w których stronniczość pozycji testowych
wynika z (a) różnej mocy dyskryminacyjnej pozycji testowej w obu grupach,
(b) różnej trudności i (c) różnego współczynnika zgadywania ........ 203
Spis tabel
10
Tab. 1.1. Elementy sytuacji badania testem objęte procedurą standaryzacji ...... 27
Tab. 1.2. Kryteria pozwalające odróżnić dobry test od testu złego ............ 31
Tab. 1.3. Najważniejsze daty w historii pomiaru psychologicznego ........... 39
Tab. 2.1. Podstawowe źródła błędu w różnych metodach szacowania rzetelności . 57
Tab. 3.1. Minimalne wartości współczynnika trafności treściowej (CVR), pozwalające
uznać otrzymaną wielkość CVR za istotną statystycznie (dla a = 0,05) . . 89
Tab. 4.1. Kwotowy układ polskiej próby normalizacyjnej dla testu WAIS-R(PL) . 132
Tab. 4.2. Przykład normalizacji rozkładu oraz obliczania norm typu standardowego 144
Tab. 4.3. Przykład obliczania norm typu centylowego .................... 147
Tab. 4.4. Wady i zalety norm typu równoważnikowego ................... 153
Tab. 5.1. Konstruowanie pozycji testowej wielokategorialnej zjedna opcją do wyboru 167 Tab. 5.2. Wartości wskaźnika trudności dla poszczególnych pozycji oraz średnia
trudność testu Słownik z baterii WAIS-R (PL) .................. 172
Tab. 5.3. Rozkład wartości poprawionego wskaźnika trudności (To) dla pozycji
posiadających różną liczbę kategorii odpowiedzi ................. 174
Tab. 5.4. Przykładowe wyniki dla trzech wybranych pozycji testowych ........ 177
Wstęp
W tym roku mija 113 lat od ukazania się pierwszej pracy poświęconej statystycznej teorii wyników testowych (Edgeworth, 1888, 1892)1. W ciągu ponad stulecia psychometria - dział psychologii zajmujący się budowaniem teorii wyników otrzymywanych za pomocą testów psychologicznych - osiągnęła status samodzielnej dyscypliny naukowej, a praktyczne konstruowanie i stosowanie testów stało się przemysłem rynkowym. W okresie tym ukazały się tak znaczące prace, jak An Introduction to the Theory of Mentol and Sociał Measurement E.L. Thorndike'a (1919), Theories of Mentol Tests H. Gulliksena (1950), A Theory ofTest Scores RM. Lorda (1952), Probabilis-tic Models for Some Intelligence and Attainment Tests G. Rascha (1960), Statistical Theories ofMental Test Scores F.M. Lorda i M.R. Novicka (1968) czy The Dependability of Behavioral Measurement L.J. Cronbacha, G.C. Gleser, H. Nandy, N. Rajaratnama (1972) - by wymienić tylko najważniejsze. Prace te wyznaczyły sposób myślenia badaczy oraz kierunek podstawowych rozwiązań, jakie wypracowano w tej dziedzinie.
Robert Sternberg (1992, s. 134) - wybitny teoretyk inteligencji - opisując drogę, jaką przebyła psychometria, posłużył się interesującą metaforą. Na przełomie wieków obraz świata uległ ogromnej zmianie dzięki nowemu rewolucyjnemu wynalazkowi - samochodowi. Na początku przyjmowany nieufnie, samochód szybko przekonał ogromne rzesze ludzi o swojej użyteczności. Dzisiejsze marki, chociaż różniące się wyglądem i parametrami technicznymi, w gruncie rzeczy niewiele odbiegają od swojego pierwowzoru: mają cztery koła, silnik i kierownicę, a ich zadaniem jest dowieźć nas tam, gdzie sobie życzymy. Podobnie przedstawia się sytuacja z testami. Dzisiejsze metody testowe - mimo innych opakowań, nieco lepszej trafności i rzetelności - niewiele się różnią od pierwszego testu opracowanego przez Bineta i Simona (1905a, b, c). Składają się z pozycji testowych i mają służyć oszacowaniu wartości określonych cech psychologicznych. Tu jednak kończą się podobieństwa. Szacowanie wartości cech psychologicznych nie jest samo w sobie celem - na podstawie ich wyników podejmowane są decyzje o dużej doniosłości społecznej (to, gdzie ludzie jeżdżą samochodami, nie budzi wszak większego zainteresowania społecznego).
Rzeczywisty cel stosowania testów psychologicznych jest jednak znacznie poważniejszy: „Psychologowie (...) mierzą za pomocą testów, by osiągnąć
1 Prawdopodobnie pierwszą polską pracą z dziedziny psychometrii jest praca Bolesława Błażka pt Studya psychometrycwe. Pomiary na uczniach, wydana w roku 1900, we Lwowie, nakładem Towarzystwa Wydawniczego. Panu Prof. Jerzemu Brzezińskiemu serdecznie dziękuję za udostępnienie egzemplarza tej książki.
11
Wstęp
12
jeden z dwóch celów (lub oba te cele jednocześnie): albo opisać badaną osobę ze względu na interesujące psychologa parametry lub aby przewidywać zachowanie tej osoby w określonej sytuacji" (Paluchowski, 1991, s. 58). Co więcej, ów opis lub przewidywanie są wykorzystywane dalej w procesie „aktywnego poszukiwania danych potrzebnych do podjęcia decyzji o działa-niach zmierzających do zmiany aktualnego stanu (położenia) psychospołecznego ludzi" {ibidem, s. 32).
Testy będą z całą pewnością w coraz szerszym użyciu - od szkoły począwszy na rynku pracy skończywszy. Pytania dotyczące ich uczciwego stosowania będą zyskiwały coraz większe społeczne uznanie. Wraz z rosnącymi wymogami posiadania bardziej pogłębionego wykształcenia ogólnego oraz z coraz częściej obserwowaną tendencją do zmniejszania się znaczenia formalnych ocen szkolnych czy formalnych dyplomów osoby odpowiedzialne za dobór kadr będą poszukiwać bardziej precyzyjnych i bardziej obiektywnych metod oceny kwalifikacji kandydatów, bardziej trafnych metod selekcji np. osób starających się o pracę. Standaryzowane testy w sposób niekwestionowany udowodniły swoją przydatność dla tych celów. Psychologowie, jako grupa zawodowa, muszą jednak umieć odpowiedzieć na pytania: na czym polega idea wnioskowania psychometrycznego; jakie kryteria powinien spełniać dobry test; czy testy zastosowane w konkretnej sytuacji nie są stronnicze (w sensie psychometrycz-nym); czy procedura selekcji oparta na wynikach testowych jest uczciwa w stosunku do wszystkich zainteresowanych osób i jakie są społeczne konsekwencje testowania. Książka ta poświęcona jest tym właśnie zagadnieniom.
Struktura książki
Praca ta składa się z dwóch części. W części pierwszej omówione zostały podstawowe zagadnienia psychometryczne, takie jak definicja testu i rodzaje testów, klasyczna teoria testów i jej współczesne odmiany, teoria rzetelności, zagadnienia trafności oraz koncepcja norm. Osobny rozdział poświęcony został problematyce konstrukcji testów. Wszystkie te problemy zostały przedstawione w sposób maksymalnie nietechniczny, aby zwrócić uwagę Czytelnika na istotę zagadnień psychometrycznych, która często - w gąszczu wzorów i reguł - schodzi na dalszy plan. Czytelników zainteresowanych bardziej matematycznym wykładem prezentowanych treści odsyłam przede wszystkim do prac Lorda i Novicka (1968), Nowakowskiej (1975), Magnus-sona (1981) czy Machowskiego (1993). Ostatni rozdział tej części poświęcony został omówieniu społecznych konsekwencji testowania. Takie problemy jak prawa osób rozwiązujących testy czy testy jako produkty rynkowe wymagają bowiem - jak sądzę - oddzielnego i szczegółowego omówienia. W części drugiej omówione zostały zasady obowiązujące przy konstruowania metod testowych; ma ona formę poradnika przeznaczonego dla studentów. I chociaż w większości wypadków korzystamy dziś z gotowych metod testowych, zdarza się i tak (szczególnie często dotyczy to studentów), że
Wstęp
trzeba opracować metodę niezbędną do realizacji konkretnych celów diagnostycznych. Ten przewodnik ma pomóc studentom w rozstrzyganiu wątpliwości, jakie towarzyszą takiemu zadaniu.
Na zakończenie chciałabym złożyć serdeczne podziękowania Recenzentom podręcznika - Panu Profesorowi Jerzemu Brzezińskiemu oraz Panu Profesorowi Tadeuszowi Markowi. Ich uwagi pozwoliły mi na lepsze wyartykułowanie omawianych problemów.
Poznań, sierpień 2001 roku
Elżbieta Hornowska
?
13
.
Część I Podstawowe problemy psychometrii
'
Wszystko, co istnieje, istnieje w jakiejś mierze. Aby dobrze poznać dany obiekt, należy go określić zarówno pod kątem jakościowym, jak i ilościowym.
E.L. Thorndike (1904)
Rozdział 1
Wnioskowanie psychometryczne
1.1. CZYM ZAJMUJE SIĘ PSYCHOMETRIA?
Jak mówi Słownik języka polskiego (Szymczak, 1979, tom 2, s. 1071): „psychometria (...) to dział psychologii zajmujący się teorią i opracowywaniem testów psychologicznych", zaś według Słownika psychologicznego (Szewczuk, 1979, s. 239) to „dział metodologii psychologicznej zajmujący się pomiarem zachowań ludzkich w aspekcie psychologicznym". Z kolei według Słownika psychologii (Reber, 2000, s. 597) psychometria to „dziedzina obejmująca badania psychometryczne (...) na ogół odnoszące się do różnych aspektów procesów psychicznych, w tym badania osobowości, inteligencji, określania zdolności (...) [odnosząca się też - przyp. E.H.] (...) do kwestii zastosowania zasad matematycznych i statystycznych w psychologii".
Aby dokładnie zrozumieć, co kryje się pod tymi dość ogólnikowymi definicjami, przeanalizujmy trzy następujące sytuacje:
a) psycholog zatrudniony w firmie doradztwa personalnego tworzy test zdolności korektorskich, na podstawie którego chce zaproponować kandydatów na stanowisko w firmie komputerowej;
b) psycholog szkolny opracowuje skalę pozwalającą mu określić zakres słów, jakie opanowało dziecko;
c) psycholog - stosując test inteligencji - pomaga klientowi poznać jego własne, mocne strony.
Wszystkie te sytuacje, choć opisujące różne cele, są do siebie podobne. Wszystkie one dotyczą pomiaru wartości cech psychologicznych1. Cechy te (konstrukty teoretyczne) nie są bezpośrednio obserwowalne (mierzalne). Takie pojęcia bowiem, jak „sukces w pracy na określonym stanowisku", „zakres posiadanego słownictwa" czy „mocne strony", zanim będą mogły zostać wyrażone ilościowo, wymagają najpierw operacyjnego zdefiniowania (są bezpośrednio nieobserwowalne). Ta właśnie charakterystyka pomiaru
1 Nie będziemy tu wnikać w kontrowersje wynikające z różnych sposobów definiow pojęcia cechy. Wystarczy, że przyjmiemy, iż „wartość cechy u danego człowieka prostu (...) parametrem rozkładu charakteryzującego częstości występowania okre; zachowań się tego człowieka w danych sytuacjach" (por. Nowakowska, 1975, s. 20)1
Rozdział 1
18
psychologicznego (czyli poznawanie nieobserwowalnych bezpośrednio właściwości) sprawia, że niezbędne staje się opracowanie teorii wiążącej efekty badania za pomocą narzędzia pomiarowego (np. testu psychologicznego) z cechą psychologiczną, którą owe efekty (np. wartości liczbowe) odzwierciedlają.
Dokładna analiza przedstawionych wyżej i innych sytuacji pozwala na sformułowanie pięciu zasad (reguł), które charakteryzują pomiar cech psychologicznych (por. Crocker, Algina, 1986, s. 6-7). Są to następujące reguły:
1. Cechy psychologiczne powinny być definiowane nie tylko w terminach operacyjnych, ale także w terminach związków z innymi konstruktami teoretycznymi czy obserwowalnymi zjawiskami. Wyniki pomiaru psychologicznego nie będą użyteczne, jeżeli nie będzie ich można odnieść do mierzonego konstruktu. Z tego też powodu Lord i Novick (1968, s. 15) podkreślali, że konstrukry psychologiczne powinny być zawsze definiowane na dwóch poziomach. Po pierwsze, mierzony konstrukt powinien zostać zdefiniowany w terminach zjawisk obserwowalnych. Ten rodzaj definicji (zwanych przez autorów definicjami semantycznymi) określa przedmiot pomiaru (tj. zakres obserwowalnych zachowań, które będą rejestrowane). Definicje te stanowią bowiem reguły korespondencji między teoretycznymi konstruktami i obserwowalnymi zachowaniami. Po drugie, mierzony konstrukt powinien zostać powiązany z innymi konstruktami w ramach określonego systemu teoretycznego. Ten drugi rodzaj definicji (nazywanych przez Lorda i Novicka definicjami syntaktycznymi) dostarcza ramy interpretowania otrzymanych wyników. Definicje te są wyrażane w postaci formalnych związków logicznych (matematycznych). Bez definicji syntaktycznych pomiar psychologiczny nie będzie miał żadnej użytecznej wartości (por. rys. l.l)2.
2. Żadna realizacja pomiaru psychologicznego nie ma charakteru uniwersalnego. Ponieważ pomiar cech psychologicznych jest zawsze pomiarem pośrednim, opartym na obserwowalnych bezpośrednio zachowaniach, ten sam konstrukt psychologiczny może zostać powiązany z różnym zbiorem zachowań. Różne definicje operacyjne prowadzą zaś do różnych procedur pomiarowych; te z kolei mogą prowadzić do różnych wniosków końcowych. Dobrym przykładem ilustrującym ten stan rzeczy jest pomiar inteligencji. I tak np. inteligencja rozumiana jako „(...) zagregowana (ogólna) zdolność jednostki do podejmowania działań celowych, racjonalnego myślenia i do efektywnego radzenia sobie we własnym środowisku" (Wechsler, 1998, s. 16) znalazła swój wyraz w - opracowanej przez D. Wechslera (1939) - baterii składającej się z 11 testów, mierzących różne aspekty przystosowania do środowiska. Z kolei inteligencja pojmowana jako zdolność edukacji (tj. zdolność uzyskiwania nowego wglądu,
----------------------------
2 W sprawie pojęcia i zasad operacjonalizacji por. też Hornowska, 1989, 2000a.
Wnioskowanie psychometryczne
Rys. 1.1. Defitiicje semantyczne i syntaktyczne (opracowano na podstawie Lord i Novick, 1968, s. 17)
Poziom obserwacji (zachowania)
Poziom teoretyczny
Wynik obserwowany X
Założony rozkład wartości X
Zachowanie X Brak zachowania X
Szacowana średnia częstość pojawiania się zachowania X
x=1
f(x/p)
Prób (X=11 p)=p Prob(X=0|p)=1-p
:
? (X| p) = p
-------------j-----------------------------------------------------
w dużej liczbie pomiarów
i
definicje semantyczne (reguły korespondencji) semantyczna interpretacja
definicje syntaktyczne
spostrzegania i określania relacji) może być mierzona za pomocą Testu Matryc opracowanego przez J.C. Ravena (Raven, Court, Raven, 1994).
Mówiąc o pomiarze psychologicznym, nie wystarczy zatem wskazywać na mierzony konstrukt. Aby wyniki pomiaru zostały właściwie zinterpretowane, niezbędna jest znajomość teorii, w ramach której mierzony konstrukt został zdefiniowany. Ten sam wynik uzyskany za pomocą różnych narzędzi ma bowiem zupełnie inne znaczenie psychologiczne.
3. Pomiar psychologiczny jest najczęściej oparty na ograniczonej próbce zachowań. Formułując definicje semantyczne, trudno jest uwzględnić cały możliwy repertuar zachowań, które mogą zostać powiązane z mierzoną cechą psychologiczną. Dlatego też dokonując pomiaru psychologicznego, zawężamy zarazem interesujący nas obszar zachowań do tych zachowań, które uważamy za najbardziej adekwatne. Określenie kryteriów wyboru takiej próbki zachowań staje się wtedy koniecznością.
4. Wyniki pomiaru psychologicznego są zawsze obarczone określonym błędem. Ponieważ pomiar psychologiczny jest ograniczony do wybranej próbki zachowań i najczęściej dokonuje się go tylko w jednym punkcie czasowym, nie odzwierciedla on w sposób jedno-
19
Rozdział 1
znacznie dokładny rzeczywistej wartości mierzonej cechy czy funkcji psychologicznej. Gdyby przeprowadzić ten sam pomiar powtórnie, to najpewniej jego wyniki będą nieco inne. Przyczyną tego stanu rzeczy mogą być takie czynniki, jak np. zapominanie, chwilowe fluktuacje uwagi, zgadywanie czy wreszcie uczenie się. Każdy z nich (a także inne) wpływa na wyniki dokonanego pomiaru. Istotnym elementem pomiaru psychologicznego jest zatem ustalenie sposobu określania wielkości błędu popełnionego przy zastosowaniu danej procedury pomiarowej.
5. Wyniki pomiaru psychologicznego nie zawsze przekładają się na skale o dobrze zdefiniowanych jednostkach. W jakim stopniu wyniki otrzymane w pomiarze psychologicznym odzwierciedlają rzeczywiste różnice między badanymi osobami? Czy „zerowy" wynik w teście oznacza zerowy poziom cechy psychologicznej? Na te i inne pytania dotyczące interpretacji otrzymanych wyników także trzeba odpowiedzieć, zanim zastosuje się określone narzędzie pomiarowe.
Problemami opisanymi powyżej zajmuje się rozwinięta dziś gałąź psychologii -tj. psychometria, inaczej teoria testów. W ramach psycho-metrii podejmuje się wiele zagadnień szczegółowych, takich jak sposoby budowania pozycji testowych (ang. test items), opracowywanie kryteriów wyboru pozycji testowych o najlepszych parametrach, zasady przekształcania odpowiedzi testowych na wyniki liczbowe, zasady oceny jakości tych wyników, zasady ich interpretacji czy wreszcie zasady określania stopnia stronniczości wyników testowych względem określonej grupy społecznej.
Psychometria (czyli teoria testów) dostarcza modelowych rozwiązań, i w tym sensie różni się od - mającego bardziej aplikacyjne znaczenie - pomiaru psychologicznego. To ostatnie pojęcie wiąże się raczej ze szczegółowymi zasadami posługiwania się konkretnymi metodami. Wypracowane w ramach teorii testów rozwiązania mogą być natomiast uogólniane na sytuacje pomiaru różnych cech psychologicznych. Rozwiązania te, najczęściej w postaci modeli matematycznych czy statystycznych, są największym dorobkiem psychometrii3.
>• Psychometria jest to gałąź psychologii zajmująca się określaniem warunków, jakie powinny spełniać narzędzia wykorzystywane do pomiaru cech psychologicznych, oraz budowaniem modeli wiążących wyniki takich pomiarów z rzeczywistymi wartościami mierzonych cech.
20
3 W psychologii często wprowadza się rozróżnienie między tzw. diagnozą psychometryczną a diagnozą kliniczną (por. np. Geller, Kość, 1976; Paluchowski, 1991). Osiowymi pojęciami diagnozy psychometrycznej mają być jej obiektywność, standaryzacja, trafność, rzetelność i odniesienie do norm. Diagnozą kliniczną zaś opisuje się niekiedy jako impresjonistyczną, podkreślając w ten sposób fakt korzystania z różnych przesłanek wychodzących poza dane pomiarowe, a będących podstawą wnioskowania i przewidywania przez nią (też Cronbach, 1990, s. 34). W tej pracy koncentrować się będziemy na specyficznej klasie narzędzi diagnozy psychologicznej, jaką są metody testowe. Te zaś - bez względu na cel ich zastosowania - muszą spełniać określone kryteria, opisywane w skrócie jako kryteria psychometryczne.
Wnioskowanie psychometrygzne
Współcześnie można mówić o dwóch podstawowych teoriach psychomet-rycznych: teorii losowego doboru próby {random sampling theory) i teorii odpowiadania na pozycje testu (item response theory - Lord, 1952a). Każda z tych teorii w odmienny sposób wiąże wynik pomiaru testowego (wynik obserwowany) z tzw. wynikiem prawdziwym danej osoby. W ramach teorii losowego doboru próby rozpatrywane są dwa podstawowe modele: klasyczny (Gulliksen, 1950) wraz z modyfikacjami (Lord, Novick, 1968) oraz model znany jako teoria uniwersalizacji (Cronbach, Gleser, Nanda, Rajaratnam, 1972). Związek między wynikiem obserwowanym i prawdziwą wartością mierzonej cechy w teorii losowego doboru próby ujmuje się jako problem generalizacji danych z próby na większe populacje (uniwersa). Z kolei w ramach teorii odpowiadania na pozycje testu przyjmuje się, że określenie sposobu, w jaki osoba badana odpowiada na kolejne pozycje testu, pozwala na bezpośrednie określenie rzeczywistego wyniku tej osoby. O obu tych podejściach będzie mowa w niniejszej pracy.
ja
I
1.2. DEFINICJA TESTU I RODZAJE TESTÓW eflnicja testu
Omawiając podstawowe zadania teorii testów, posługiwaliśmy się - na razie
sposób nieformalny - pojęciem testu. Pora zatem na bliższe przyjrzenie się temu, czym jest test psychologiczny i jakie są jego podstawowe cechy charakterystyczne.
Test jest narzędziem pomiarowym i jak każde narzędzie tego typu może lostarczać użytecznych wyników. I podobnie jak w wypadku każdego narzędzia pomiarowego, posługiwanie się złym testem musi prowadzić do błędnych, a także szkodliwych społecznie decyzji.
Czym są zatem testy psychologiczne, jakie powinny być ich właściwości oraz jakich korzyści powinny oczekiwać osoby badane - to pytania, na które przede
szystkim należy odpowiedzieć. Zgodnie z definicją sformułowaną przez Amerykańskie Towarzystwo Psychologiczne w Standardach dla testów stosowanych w psychologii i pedagogice (APA, 1985a, s. 8) „test psychologiczny jest specyficzną procedurą diagnozowania. Może on być zbiorem zadań lub pytań, które - w standardowych warunkach - mają wywoływać określone rodzaje zachowań i dostarczać wyników o pożądanych właściwościach psychometrycz-nych, tj. posiadających wysoką rzetelność i wysoką trafność". Podobnie definiują test Anastasi i Urbina (1999, s. 21), dla których jest to „obiektywna i wy standaryzowana miara próbki zachowania". Cronbach (1990, s. 32) z kolei podkreśla, że „test to systematyczna procedura obserwowania zachowania i opisywania tego zachowania za pomocą skal numerycznych lub ustalonych kategorii". Wreszcie -według Choynowskiego (1971, s. 66) - „testy to zbiory pytań lub sytuacje, służące do badania własności jednostek lub grup ludzkich przez wywoływanie u nich określonych obserwowalnych reakcji werbalnych lub niewerbalnych, będących w miarę możności reprezentatywnymi próbkami ich zachowania się".
21
Rozdział 1
Jeszcze inaczej określa test Paluchowski (1991, s. 41). Jego zdaniem „badanie testowe to taka sytuacja, w której osoba badana uczestniczy dobrowolnie, świadoma celu, jakim jest jej ocena. Jest to sytuacja tworzona specjalnie dla celów diagnostycznych, w której wywołuje się zachowania typowe pod względem tej charakterystyki, jaka ma być przedmiotem celowej obserwacji. Jest to sytuacja, która od diagnosty nie wymaga osobistego zaangażowania i w której jasno jest określony zakres i rodzaj dopuszczalnych zachowań". W definicji tej autor zwraca uwagę na warunek kooperacyjnej postawy osób badanych, który stanowi milczące założenie każdego twórcy testu. Psycholog stosujący metody testowe powinien umieć taką postawę uaktywniać. W rozważaniach dotyczących testów psychologicznych warunek ten, niestety, często jest pomijany.
Podsumowując ten krótki przegląd definicji testu, można stwierdzić, że test psychologiczny jest narzędziem, które:
a) pozwala na uzyskanie takiej próbki zachowań, o których można przyjąć (np. na podstawie założeń teoretycznych), że są wskaźnikami interesującej nas cechy psychologicznej. Zachowania te nie muszą ściśle przypominać zachowań, które chcemy oszacować na podstawie testu. Wystarczy wykazać, że istnieje między nimi określony związek;
b) dostarcza reguł obliczania wartości mierzonej cechy;
c) spełnia określone kryteria formalne, takie jak obiektywność, standaryzacja, rzetelność, trafność i normalizacja;
d) jasno określa zakres i rodzaj dopuszczalnych zachowań ze strony diagnosty;
e) zakłada kooperacyjną postawę osoby badanej.
>Test psychologiczny jest to narzędzie pozwalające na uzyskanie takiej reprezentatywnej próbki zachowań, o których można przyjąć (np. na podstawie założeń teoretycznych lub związków empirycznych), że są one wskaźnikami interesującej nas cechy psychologicznej. Jest to narzędzie obiektywne, wystandaryzowa-ne, trafne, rzetelne i znormalizowane, wyposażone w reguły obliczania wartości mierzonej cechy psychologicznej oraz jasno określające zakres i rodzaj dopuszczalnych zachowań ze strony diagnosty. Nadto, badanie testowe to taka sytuacja, w której osoba badana uczestniczy dobrowolnie, świadoma celu, jakim jest jej ocena.
22
Rodzaje testów
W literaturze można spotkać wiele różnych klasyfikacji metod testowych (por. Cronbach, 1990; Anastasi, Urbina, 1999). Jedna z takich klasyfikacji dzieli testy na techniki standaryzowane i niestandaryzowane. Testy standaryzowane to takie testy, które posiadają dokładnie sprecyzowane zasady ich stosowania oraz zostały wyposażone w normy, otrzymane w wyniku przebadania reprezentatywnej próby pochodzącej z populacji, dla której test ma być stosowany. Normy te stanowią podstawę interpretacji wyników otrzymanych przez osoby badane. Z kolei do testów niestandaryzowanych można zaliczyć np. testy wiadomości budowane przez nauczycieli na ich
Wnioskowanie psychometryczne
własny użytek, w których dopuszcza się możliwość interakcyjnego modyfikowania sytuacji badania. Testy takie często są stosowane tylko jeden raz. W innej klasyfikacji wyróżnia się testy indywidualne i grupowe. Testami indywidualnymi można badać osoby jedynie pojedynczo, podczas gdy testy grupowe pozwalają na jednoczesne testowanie dużych grup osób. Podział na testy indywidualne i grupowe ma u swoich podstaw kryterium wydajności, a kolejny podział na testy szybkości i mocy odwołuje się do kryterium czasowego. Testy szybkości to takie testy, których czas rozwiązania jest ograniczony i - z założenia - żadna osoba badana nie powinna go ukończyć w wyznaczonym czasie. W teście szybkości różnice indywidualne są głównie determinowane szybkością wykonania. Składa się on z zadań generalnie niezbyt trudnych, tj. takich, które mogą zostać rozwiązane przez osoby, dla których przeznaczony jest test. Z kolei testy mocy to testy stwarzające każdej osobie badanej szansę na podjęcie próby rozwiązania wszystkich pozycji testu. Trudność zadań w takim teście stopniowo rośnie. Znajdują się w nim również takie zadania, które są na tyle trudne, że mało kto trafi je rozwiązać. Tym samym jedynie niewielka liczba osób ma szansę itrzymać w takim teście maksymalny wynik. W tym wypadku otrzymany ynik jest determinowany przede wszystkim poziomem mierzonej cechy. Czwarty rodzaj klasyfikacji wyróżnia testy obiektywne i nieobiekty-n e. Tu z kolei kryterium klasyfikacji jest sposób obliczania wyników w teście osoba oceniająca ma swój udział w „tworzeniu" wyniku). Testy obiektywne posiadają tak starannie opracowane, stałe metody obliczania wyników, że sam wynik może zostać obliczony nawet przez osobę bez przygotowania psychologicznego (najczęściej procedura obliczania wyników polega na przyłożeniu szablonu arkusza odpowiedzi). Inaczej w testach nieobiekty wnych - ocena odpowiedzi ;oby badanej wymaga zazwyczaj dużej znajomości przedmiotu pomiaru otrzymany wynik często odzwierciedla subiektywne umiejętności psychologa. Testy mogą zostać także poklasyfikowane ze względu na rodzaj zadań, jakich są zbudowane. Ten podział pozwała wyróżnić testy słowne i bezsłowne. Niektóre testy zawierają zadania zbudowane wyłącznie z materiału werbalnego (jak np. testy wiadomości), inne mogą polegać na wykonywaniu określonych czynności, np. wskazywaniu brakujących elementów czy też rysowaniu drogi w labiryncie. W zadaniach słownych jednym z kryteriów branych pod uwagę przy ocenie stopnia wykonania takiego zadania jest sprawność językowa osoby badanej, w zadaniach bezsłownych słabe opanowanie języka nie jest czynnikiem wpływającym istotnie na otrzymywane wyniki. I wreszcie przedostatni rodzaj klasyfikacji - najważniejszy z psycho-metrycznego punktu widzenia, bo wskazujący na dwie odmienne klasy problemów natury psychometrycznej, które muszą zostać rozwiązane - to podział metod na testy właściwości poznawczych i właściwości afekty wnyc h. Te pierwsze, czyli testy właściwości poznawczych, to testy mierzące wytwory procesów poznawczych (np. testy zdolności,
23
Rozdział 1
uwagi, pojemności pamięci), te drugie z kolei to testy mierzące postawy, wartości, zainteresowania czy inne, pozapoznawcze, aspekty osobowości. W pierwszym wypadku każde zadanie testowe ma ściśle określoną odpowiedź prawidłową, a dodatkowym problemem, który należy tu wziąć pod uwagę, jest problem zgadywania. W drugim wypadku w ogóle nie istnieje kategoria odpowiedzi prawidłowej4, a problemem, z jakim trzeba się uporać, jest problem trafności samoopisu dokonywanego przez osobę badaną (por. rys. 1.2).
Rys. 1.2. Podział testów ze względu na rodzaj możliwej odpowiedzi
Testy
wiedza umiejętności zdolności
/
uczucia postawy osobowość
właściwości poznawcze
właściwości afektywne
r
i
emocje wierzenia
istnieje odpowiedź prawidłowa
autoekspresja brak odpowiedzi prawidłowej
1
ZGADYWANIE
TRAFNOŚĆ
1
SAMOOPISU
Na koniec warto wspomnieć o jeszcze jednym podziale testów, podziale na testy zorientowane na normy oraz zorientowane na kryte r i u m5. Tutaj kryterium podziału stanowi sposób interpretacji wyników. W testach zorientowanych na normy punktem odniesienia dla interpretacji wyników jest konkretna populacja osób, a w testach zorientowanych na kryterium tym punktem jest konkretny zakres wiedzy. Ta ostatnia kategoria testów pozwala na dokonanie opisu badanej jednostki w kategoriach specyficznych umiejętności, jakie udało się jej opanować (por. rys. 1.3). Z kolei w testach zorientowanych na normy punktem odniesienia jest przeciętny
24
4 Trudno np. twierdzić, że istnieje prawidłowa odpowiedź na pytanie „Czy zdarza ci się lubić ludzi, którzy wyznają inne wartości niż ty?". W takim wypadku możemy mówić jedynie o odpowiedzi diagnostycznej (zgodnej z kluczem) lub o odpowiedzi niediagnostycznej (niezgodnej z kluczem).
5 Termin test „zorientowany na kryterium" został zaproponowany przez Glasera (1963), jednak stosowany był dość dowolnie. Dlatego też dzisiaj proponuje się w jego miejsce termin „test zorientowany na standard wykonania" (por. dyskusję w tej sprawie Anastasi i Urbina, 1999, s. 111). Co więcej, termin kryterium bywa również stosowany na określenie trafności kryterialnej i ma - w tym kontekście - inne znaczenie. Tutaj termin „kryterium" czy „standard wykonania" oznacza pewien wzór, iw takim sensie będzie używany dalej.
Wnioskowanie psychometryczne Rys. 1.3. Podział testów ze względu na rodzaj interpretacji wyniku testowego
Wynik testowy
rodzaj interpretacji
podstawa interpretacji
efekt interpretacji
normatywna
względem kryterium
grupa odniesienia
zdefiniowane kryterium
statystyczny ile osób jest lepszych lub gorszych
stopień realizacji kryterium
poziom wykonania testu w określonej grupie odniesienia. Tym samym normatywna interpretacja wyniku testowego jest interpretacją relatywną i zależy od tego, kto wchodził w skład badanej grupy osób.
1.3. KRYTERIA DOBROCI TESTÓW PSYCHOLOGICZNYCH
Testem psychologicznym nie jest każdy zbiór pytań lub zadań, a tylko taki zbiór, który spełnia wszystkie - wymienione w definicji - warunki. Co więcej, test psychologiczny powinien również spełniać określone kryteria formalne, które za Brzezińskim (1984, s. 9) najczęściej określane są jako tzw. kryteria dobroci testów; tj. test powinien być obiektywny, wystandaryzowany, rzetelny, trafny i znormalizowany. Omówimy je pokrótce, dodając jeszcze jedno kryterium - właściwą adaptację, które ma szczególne znaczenie wtedy, gdy na rynku polskim stosuje się testy opracowane za granicą.
Obiektywność, czyli niezależność wyników testowania
Test jest obiektywny, jeżeli dwie różne osoby opracowujące jego wyniki dochodzą do tego samego rezultatu. Aby było to możliwe, test musi posiadać jasno określony klucz oceniania odpowiedzi, zmniejszający do minimum wpływ subiektywnych interpretacji. Najbardziej klasyczną metodą badania stopnia obiektywności testu jest technika tzw. ślepej diagnozy. Technika ta polega na rozesłaniu tego samego, wypełnionego arkusza testowego do różnych osób oceniających. Jeżeli otrzymane wyniki i ich interpretacje będą do siebie podobne, można uznać dany test za obiektywny. Jest to diagnoza ślepa, bo jest dokonywana bez kontaktu z osobą badaną. W sytuacji rzeczywistej diagnozy kontakt z osobą badaną jest bardzo ważnym źródłem informacji. W tej
25
Rozdział 1
konkretnej sytuacji chodzi jednak o to, aby indywidualne umiejętności korzystania z takich źródeł informacji nie wpływały na sposób oceniania wyników testowych. Warunek obiektywności zatem oznacza, że niezależnie od tego kto, gdzie i kiedy dokonuje oceny wyników tego samego testu, wykonanego przez tę samą osobę, powinien otrzymać takie same rezultaty.
Standaryzacja, czyli jednolitość warunków badania
Aby wyniki danego testu można było ze sobą porównywać, dany test powinien być zawsze przeprowadzany w identycznych warunkach. Tylko wtedy bowiem różnice w wynikach testowych badanych osób można przypisać czynnikom indywidualnym, a nie np. zewnętrznym warunkom badania. Jeżeli w trakcie interpretacji wyników testowych będziemy chcieli skorzystać z norm testowych, to jednolitość warunków badania testem (standaryzacja) jest warunkiem absolutnie koniecznym.
Warunek standaryzacji obejmuje następujące elementy sytuacji testowania (por. tab. 1.1): instrukcję, pomoce oraz zasady oceniania i interpretowania wyników. Szczególną rolę w badaniu testowym odgrywa instrukcja stosowania testu. Jej przestrzeganie jest podstawowym elementem gwarantującym powtarzalność warunków badania. W podręczniku testowym znajdziemy wszystkie ważne informacje dotyczące zasad badania testem, a więc: czy jest to badanie grupowe czy indywidualne, jaki jest czas badania, jaka jest kolejność zadań lub testów, czy istnieje możliwość powrotu do poprzednich zadań i wreszcie: jaki jest zakres pomocy udzielanej badanemu (por. też Anastasi, Urbina, 1999; Jaworowska, 1996).
Przestrzeganie instrukcji podawanej osobie badanej jest tak ważnym czynnikiem decydującym o wyrównaniu warunków badania, że w Standardach dla testów stosowanych w psychologii i pedagogice (1985a, s. 25) zaleca się, aby w trudnych sytuacjach, tj. takich, w których modulacja głosu, pauzy czy wyraz twarzy osoby badającej mogą mieć znaczenie, nagrać instrukcję na taśmę magnetofonową. I choć na pierwszy rzut oka takie zalecenie wydaje się sensowne, to jednak z uwagi na obowiązek motywowania osób badanych i nawiązywania z nimi sprzyjającego kontaktu trudno pogodzić się z wprowadzaniem „bezdusznej" maszyny w miejsce rzeczywistych relacji. Sądzę, że dobre szkolenia osób badających, obejmujące techniki nawiązywania kontaktów, są lepszym gwarantem rozumienia konieczności przestrzegania procedury standaryzacji przewidzianej dla danego testu niż mechaniczne odtwarzanie instrukcji z magnetofonu.
Rozumiejąc istotę procedury standaryzacji, trudno zakceptować wcale nierzadkie fakty stosowania np. testu przeznaczonego do badań indywidualnych w sposób grupowy, tworzenia własnych, samodzielnie wykonanych pomocy testowych (bo te oryginalne są drogie i należy je kupić za granicą), podawania instrukcji w różny sposób (np. podawania więcej informacji tym, którzy z jakichś względów są nam bliżsi) czy też zadawania tylko części 26 pytań zawartych w danym teście (bo reszta wydaje się niepotrzebna).
Wnioskowanie psychometryczne
Tab. 1.1. Elementy sytuacji badania testem objęte procedurą standaryzacji (opracowano na podstawie Standardów dla testów stosowanych w psychologii i pedagogice, 1985a, b; 1999)
Czego dotyczy procedura standaryzacji?
Procedura badania testem
Zasady ogólne
Wskazówki dotyczące badania testem powinny być przedstawione na tyle jasno i wyraźnie, aby testujący mógł i chciał powtórzyć sposób badania zastosowany przy ustalaniu norm.
Stosując metody testowe, należy dokładnie przestrzegać procedury badania testem opisanej w podręczniku.
Instrukcja
W instrukcji należy omówić takie zagadnienia, jak fakt badania indywidualnego czy grupowego, liczebność badanej grupy, limity czasowe, sposoby zaznaczania odpowiedzi na arkuszach, możliwość powrotu do poprzednich zadań lub pytań, problem zgadywania, kolejność stosowania testów lub zadań oraz zakres pomocy udzielanej badanemu.
Jeżeli dopuszcza się możliwość rozsze