Pamięci Matki Jerzy Brzeziński Metodologia badań psychologicznych ? • ? Warszawa 1997 Wydawnictwo Naukowe PWN Jerzy Brzeziński Metodologia badań psychologicznych ? ? . Warszawa 1997 Wydawnictwo Naukowe PWN Okładkę i strony tytułowe projektował Maurycy Gomulicki Redaktor Małgorzata Kasprzewska Redaktor techniczny Teresa Skrzypkowska Tytuł dotowany przez Ministra Edukacji Narodowej Copyright © by Wydawnictwo Naukowe PWN Sp. z o.o. Warszawa 1996 ISBN 83-01-12117-3 Wydawnictwo Naukowe PWN Sp. z o.o. Wydanie drugie Arkuszy drukarskich 42,5 Skład LogoScript, Warszawa Druk ukończono we wrześniu 1997 r. Drukarnia Rzeszowskie Zakłady Graficzne Rzeszów, ul. płk. L. Lisa- Kuli 19 Zam. 6115/97 Spis treści • ? Wprowadzenie: dlaczego metodologia? 15 1. Różne rozumienia metodologii 15 2. Dwa cele nauczania metodologii 17 2.1. Znajomość bierna 18 2.2. Znajomość czynna 20 3. Podstawowa literatura z zakresu metodologii badań psychologicznych i dyscyplin pokrewnych 23 - Część I. NATURA PROCESU BADAWCZEGO W PS\CHO1A>GH Rozdział!. Struktura procesu badawczego w psychologii 1. Wprowadzenie •• 2. Cele poznania naukowego — zewnętrzne i wewnętrzne 3. Schemat poznania naukowego ; •' • • 4. Etapy postępowania badawczego w naukach empirycznych (wg M. Bunge'a) 5. Struktura procesu badawczego w psychologii (ujęcie własne) 6. Między „odkryciem" a „uzasadnieniem" 7. Podsumowanie 29 29 30 34 35 37 44 46 Rozdział 2. Zewnętrzne determinanty procesu badawczego w psychologu — psychologia a praktyka społeczna 48 1. Wprowadzenie 48 2. Między zewnętrznymi a wewnętrznymi uwarunkowaniami procesu badawczego w psy chologii 49 3. Psychologia stosowana czy stosowanie psychologii — jedna, albo wiele psychologii? . . 51 4. Psychologia a model tzw. nauk praktycznych 57 5. Obieg informacji między sferą praktyki społecznej i sferą nauki 60 6. Podsumowanie 62 Rozdział 3. Wewnętrzne determinanty procesu badawczego (I) — wpływ świadomości metodologicznej na rezultaty procesu badaw czego 64 1. Wprowadzenie 64 2. Trafność badania psychologicznego 65 2.1. Trafność wewnętrzna 65 2.2. Trafność zewnętrzna 68 3. Proces badawczy w kontekście świadomości metodologicznej 71 4. Poza kontekstem świadomości metodologicznej 82 5. Podsumowanie 86 Rozdział 4. Wewnętrzne determinanty procesu badawczego (II) — badanie psychologiczne jako interakcja: „badacz-osoba badana" .... 88 1. Wprowadzenie 88 2. Osobliwości badania psychologicznego (wg S. Rosenzweiga) 89 3. Nastawienia badacza na potwierdzenie hipotezy badawczej — efekt oczekiwań interper sonalnych badacza OIB (wg R. B. Rosenthala) 89 3.1. Pojecie efektu oczekiwań interpersonalnych badacza OIB— efekt Golema i efekt Galatei 89 3.2. Czynniki kształtujące OIB 90 3.3. Rosenthala teoria czterech czynników pośredniczących w powstawaniu OIB .... 93 3.4. Zapobieganie występowaniu efektu OIB 94 4. Postrzeganie przez osobę badaną sytuacji badawczej 95 4.1. Status motywacyjny osoby badanej, SM 95 4.2. Koncepcja wskazówek sugerujących osobie badanej treść hipotezy badawczej WSH (wg M. T. Orne'a) 96 4.2.1. Charakterystyka zmiennych WSH 96 4.2.2. Trzy procedury kontroli WSH 103 4.2.2.1. Badanie posteksperymentalne 104 4.2.2.2. Niby-eksperyment 105 4.2.2.3. Symulacja eksperymentalna 106 4.2.3. Nowe plany eksperymentalne do badania efektów WSH 106 4.3. Koncepcja lęku osoby badanej przed oceną wystawianą przez badacza, LPO (wg M. J. Rosenberga) 109 4.3.1. LPO jako zmienna pośrednicząca 109 4.3.2. Dwie metody badania wpływu LPO na wyniki badania psychologicznego . 112 4.3.2.1. Metoda powtórnego przeprowadzenia badania wg zmienionego scenariusza 112 4.3.2.2. Metoda manipulowania pobudzeniem emocjonalnym 114 4.3.3. Czynniki wyzwalające u osób badanych LPO 116 4.4. Czy osoba badana nastawiona jest na współpracę z badaczem? 118 4.5. Oczekiwania interpersonalne osoby badanej formułowane pod adresem badacza, OIOB 120 5. Powiązania między zmiennymi kontekstu psychologicznego badania psychologicznego . 121 6. Podsumowanie 124 Rozdział 5. Etyczne problemy psychologii (I) — między kodeksem etycznym a laboratorium 125 1. Wprowadzenie 125 2. Szczególnie etycznie wątpliwe aspekty działalności badawczej psychologa 129 2.1. Okłamywanie osób badanych 132 2.2. Narażanie osób badanych na cierpienie, wstyd, lęk przed oceną oraz zaniżanie ich samooceny 138 2.3. Psycholog (wykładowca i egzaminator) a student w roli osoby badanej 142 3. Informowanie społeczności uczonych o uzyskanych rezultatach badawczych 144 3.1. Ukrywanie niedoskonałości warsztatowych 145 3.2. Kłopoty z trafnością zewnętrzną ; . . 147 3.3. Nastawienie na potwierdzanie hipotez — „pomaganie" hipotezom 148 3.4. Intersubiektywna kontrolowalność rezultatu badawczego — problem repetycji badań psychologicznych 150 4. Podsumowanie 152 Rozdział 6. Etyczne problemy psychologii (II) — między kodeksem etycznym a praktyką społeczną 154 1. Wprowadzenie ' 154 2. Rezultat badawczy jako podstawa praktycznego działania 155 3. Psycholog jako nauczyciel i mistrz — jedność badania i nauczania 157 4. Testy psychologiczne w rękach psychologa 165 4.1. Test psychologiczny i jego użytkownik 166 4.2. Adaptacja obcego testu 169 4.3. Intencja twórcy testu a zakres jego rzeczywistych zastosowań 172 4.4. Prawa osoby badanej 175 4.5. Uwagi końcowe 178 5. Podsumowanie 178 Część II. ZMIENNE — PROBLEMY — HIPOTEZY Rozdział 7. Zmienne i ich operacjonalizacja 183 1. Wprowadzenie 183 2. Pojęcie zmiennej 184 3. Konstrukcja mnogościowa zmiennej ilościowej 186 4. S. S. Stevensa klasyfikacja zmiennych: nominalne, porządkowe, internatowe i ilorazowe 188 5. Zmienne — zależne i niezależne. Klasyfikacja zmiennych 189 6. Zasady wprowadzania terminów teoretycznych do nauk empirycznych (wg J. Kmity) . 192 7. Wskaźniki 195 7.1. Pojecie wskaźnika — wskaźniki rzeczowe i definicyjne 195 7.2. Klasyfikacja wskaźników (wg S. Nowaka) 198 7.3. Moc rozdzielcza wskaźników empirycznych 200 8. Wyniki uzyskane na skalach narzędzi pomiarowych jako wskaźniki zmiennych ilościowych 203 8.1. Założenia dotyczące natury narzędzia pomiarowego n 203 8.2. Pojęcie funkcji operacyjnej 204 8.3. Pojecie idealnego narzędzia nu 205 0S3 3J3ZBIMZ StlSJ9A AMOIUI] -peSez ? wi j?? O33UOZ3IUKJ§O 3IU 3IU 3Iire I3SOMOSO] 3tU piM anre/woscri 3MOdtu3 3IUEAVOSOq 0^2 Xqcud BIUBMOSOJ McjBui3q3s Xirennpo '?> 5?2 q3XjWOSOJ qZ3I] IUIB3I{qB) 5lS pBMl3t1{SOd 5JBf "Z'p g?2 BIUBMOSOI niuzniBq33ai i BIUBMOSO] njujado aiosfod -yp 9?2 BMOSOI Bqcjj 'f ^BZOIUUOJJS jsaf A\o^raioq30 z BUOZOJZ Bqąid OSSZOBJCJ 'i 3IU3ZpBMOld^ "1 Bqojj 6 |Bizpzo^j H3AN ZDAX SAXV 1S M ffl ^^ 3ziqop Xq333 — Z3iodiq 3nrejXd BU zp3|A\odpo "9 '? nui3[qojd riuaiupdo p Bi 3Zjqop Avpso — si 3IU3ZpBM0jdyW I 912 siuBMoumspoj f\Z npBfn^zjd Bzipjuy ?6 fauusiinz jeiuiod i o83MoiBiuiod BizpaziBU fauuauuz aiUEMoaijsuo^ 'A\O>(IUZT:^SA\ 3iin;j3iqop lpsoi(i3i 502 P5Oj[|3iM ufo^ansuo-s) toSauzDAjsJoaj EjjniuXz3 Bfojpujsuo^sa 'YZ'6 ifaBziiBuopBisdo Xjnp3oaid XdBjg "j BIU9Z0JBZ SMOMBłSpOJ XY6 BUU3IUIZ ?5O3n3IM 5JIUUXZ3 TT6 lf3BZl[BUOf3BJ3dO Xjnp33Old BJOJSI "l 902 (fopiSMOiuoH '3 3M) q3Xuz3i3oioqoXsd q3Xuu3iuiz ipuzifEuopcjado nui3{qojd spsfn 3. Metoda oceny „liniowości" i „odchylenia od liniowości" związku dwóch zmiennych . . 251 4. Wybór optymalnej miary siły związku między zmiennymi 256 5. Podsumowanie 259 Rozdział 11. Testy istotności różnic — wybrane zagadnienia 260 i. 2. 5. Wprowad zenie 260 Warunki poprawne go stosowan ia testów istotności różnic w badaniac h empirycz nych . 261 2.1. Res pektowan ie zasady randomiz acji 261 2.2. Gru py (dane) niezależn e versus grupy (dane) zależne 262 2.3. Res pektowan ie założenia o rozkładzi e zmiennej zależnej w populacji 263 2.4. Pro blem homogeni czności (jednorod ności) porówny wanych grup 264 2.5. Ska la pomiarow a zmiennej zależnej 265 2.6. Lic zba porówny wanych grup 265 2.7. Du że N versus małe N Wybór optymaln ego testu statystycz nego — grupy (dane) niezależn e . . 3.1. Naj bardziej rozpowsz echnione testy statystycz ne w praktyce badawcze j psycholog ów 267 3.2. Alg orytm wyboru optymaln ego testu 272 Wybór optymaln ego testu statystycz nego — grupy (dane) zależne 273 4.1. Naj bardziej rozpowsz echnione testy statystycz ne w praktyce badawczej psycholog ów 273 4.2. Alg orytm wyboru optymaln ego testu 277 Podsumo wanie 277 Część IV. MODELE SPRAWDZANIA HIPOTEZ 282 Rozdział 12. Model eksperymentalny (E) 1. Wprowadzenie 282 2. Charakterystyka modelu eksperymentalnego (E) 284 2.1. Model eksperymentalny (E) a model quasi-eksperymentalny (qE) 284 2.2. Pojęcie kontroli zmiennych niezależnych 290 2.2.1. Dwie metody kontroli zmiennych niezależnych stosowane w planach jedno- -jednozmiennowych, dwuwartościowych („0-1") 292 2.2.2. Statystyczny aspekt kontroli zmiennych — analiza wariancji zmiennej zależnej 296 2.3. Znaczenie randomizacji 303 2.4. Rola instrukcji maskujących cel eksperymentu w psychologii („decepcja") 304 2.5. Realizm życiowy i realizm psychologiczny 307 3. Pojęcie planu eksperymentalnego i ąuasi-eksperymentalnego 309 4. Trafność planu eksperymentalnego i czynniki ją zakłócające 313 4.1. Trafność wewnętrzna i czynniki ją zakłócające 313 4.2. Trafność zewnętrzna i czynniki ją zakłócające 318 4.3. Statystyczny kontekst trafności , 322 4.4. Odniesienie do teorii 323 5. Odmiany planów eksperymentalnych 323 5.1. Plany jedno-jednozmiennowe, dwuwartościowe („0 -1") 323 5.1.1. Plan 1. — z grupą kontrolną, z pomiarem początkowym i końcowym zmiennej zależnej 325 5.1.2. Plan 2. — z grupą kontrolną, bez pomiaru początkowego zmiennej zależnej 326 5A.1. ?\an ?}. — z pomiarem poczatowym i końcowym zmiennej latóaej w t6Ł- - Łi 5.1.4. Plan 4. — czterogrupowy, Solomona wjfijl 5.1.5. Plan 5. — trzygrupowy, z podwojonym pomiarem początkowym i jednym pomiarem końcowym zmiennej zależnej 332 5.1.6. Plan 6. — czterogrupowy, z pomiarem początkowym i końcowym zmiennej zależnej na różnych grupach 332 5.2. Ograniczenia planów „0-1" 333 5.3. Plany jedno-wielozmiennowe, wielowartościowe — kilka uwag wprowadzających . 334 6. Ocena istotności zmiennych niezależnych w modelu eksperymentalnym 337 6.1. Poziom istotności statystycznej a a faktyczna istotność zmiennej X (postępowania ^ eksperymentalnego) dla danej zmiennej zależnej Y 337 " 6.1.1. Jak liczne powinny być grupy: eksperymentalna i kontrolna? Duża próba ver- sus mała próba 337 6.1.2. Nastawienie na kontrolę błędu I lub U rodzaju 338 6.2. Wskaźniki istotności zmiennej X (postępowania eksperymentalnego) 340 7. Podsumowanie 341 ?u*), SMWWJSH pabwrfjfc^ .1 C Rozdział 13. Model wielokrotnej regresji (MR) 343 1. Wprowadzenie — model analizy wariancji (ANOVA) a model wielokrotnej regresji (MR) 343 2. Zmienne (niezależne) ilościowe w liniowym modelu MR 346 2.1. Podstawowe odmiany MR 346 2.1.1. Model liniowy: jedno-jednozmiennowy 347 2.1.2. Model liniowy: jedno-wielozmiennowy 354 2.2. Wprowadzenie interakcji zmiennych ilościowych do modelu MR 362 3. Zmienne jakościowe w modelu MR — konstruowanie zmiennych instrumentalnych . . . 363 3.1. Jedna zmienna dwukategorialna — analiza przykładu: test t, test F, współczynnik korelacji r 363 3.2. Jedna zmienna wielokategorialna ."'.".*. *. '. . 1". !.".Kr!'. .... 370 3.2.1. Analiza przykładu z wykorzystaniem kodowania zero-jedynkowego 370 3.2.2. Analiza przykładu z wykorzystaniem kodowania quasi-eksperymentalnego 379 3.2.3. Analiza przykładu z wykorzystaniem kodowania ortogonalnego 388 3.3. Dwie zmienne wielokategorialne — zagadnienie interakcji między zmiennymi jakościo wymi 396 3.3.1. Analiza przykładu z wykorzystaniem kodowania ortogonalnego 398 -r- 3.3.2. Analiza przykładu z wykorzystaniem kodowania quasi-eksperymentalnego . 402 ***•"* 3.3.3. Interakcja między zmiennymi jakościowymi a kodowanie zero-jedynkowe . 423 3.4. Kodowanie interakcji wielu zmiennych jakościowych 425 4. Ustalenie porządku istotnościowego w obrębie zmiennych niezależnych wprowadzonych do modelu MR 426 5. Podsumowanie '-Vegeliusa dla testów o wynikach wyrażonych na skali dwubiegunowej 564 3.4. Wykorzystanie współczynnika korelacji rangowej (rs-Spearmana lub nr-Kendalla) dla testów wielopunktowych 566 3.5. Współczynnik roCohena dla wyników testowych wyrażonych na skalach stan dardowych 568 3.5.1. Wyniki testowe wyrażone na jednolitej skali standardowej 568 3.5.2. Wyniki testowe wyrażone na różnych skalach standardowych 571 4. Podsumowanie 574 Rozdział 20. Problemy adaptacji kulturowej testów 576 1. Wprowadzenie 576 2. Czy testy psychologiczne powstałe w warunkach innej kultury powinny być poddane adap tacji kulturowej? 576 2.1. Dystynkcja: emic — etic 577 2.2. Czy możliwe jest skonstruowanie testu neutralnego kulturowo — problem testów: culture-free, culture-fair oraz culture-reduced 579 2.3. Znaczenie back translation 581 2.4. Transkrypcja — translacja — trawestacja — parafraza — rekonstrukcja 583 3. Sprawdzanie równoważności testów (wg R. Ł. Drwala) 584 4. Konteksty adaptacji kulturowej testów 586 4.1. Kontekst teorii psychologicznej 588 4.2. Kontekst psychometryczny 589 4.3. Kontekst celu 590 4.4. Kontekst doświadczenia kulturowego osoby badanej 592 4.5. Kontekst świadomości społecznej 593 4.6. Kontekst kwalifikacji zawodowych użytkownika testu 594 4.7. Kontekst użycia 594 5. Podsumowanie 595 Podziękowania 597 Nota bibliograficzna 598 Dodatek A. Jak pisać raport z badań psychologicznych? 599 Dodatek B. Tablice statystyczne i psychometryczne 604 Tablica 1. Liczby losowe 606 Tablica 2. Dystrybuanta rozkładu normalnego 615 Tablica 3. Wartości krytyczne rozkładu t Studenta 617 Tablica 4. Wartości krytyczne rozkładu ?? 619 Tablica 5. Wartości krytyczne rozkładu F Snedecora 623 Tablica 6a. Wartości krytyczne statystyki k' testu serii Walda-Wolfowitza 633 Tablica 6b. Wartości krytyczne statystyki k" testu serii Walda-Wolfowitza 634 Tablica 7. Wartości z odpowiadające danym wartościom r 635 Tablica 8. Krytyczne wartości r 639 Tablica 9. Współczynniki m — tablice Flanagana 641 Tablica 10. Współczynniki 0 — tablice Jurgensena 645 Tablica lla. Wartości krytyczne S współczynnika zgodności W Kendalla 657 Tablica llb. Wartości krytyczne S współczynnika zgodności W Kendalla 657 Literatura 658 . ? ? Wprowadzenie: dlaczego metodologia? 1. Różne rozumienia metodologii Zacznijmy od tego, że psychologia jest nauką i to nauką empiryczną. To na pozór banalne stwierdzenie ma jednak poważne konsekwencje zarówno dla samej psy- chologii jako dyscypliny naukowej, jak i dla tych, którzy chcą ją twórczo uprawiać, którzy chcą ją rozbudowywać rozwijając i tworząc nowe teorie (a jest to główne zadanie psychologii por. np. Schmidt, 1995, s. 25), rozbudowując jej instrumen- tarium (tzn. zastępując przestarzałe metody nowymi, bardziej precyzyjnymi i wpro- wadzając całkiem nowe metody), proponując nowe systemy interpretacyjne uzyski- wanych, za pomocą różnorakich metod, wyników badawczych. Mówiąc „nauka" mamy na myśli dwa sensy tego terminu: „termin «nauka» bywa dwojako rozumiany. Przy jednym jego rozumieniu nauka to tyle, co rzemios- ło uczonych, czyli ogół czynności wykonywanych przez uczonych jako takich. Przy drugim rozumieniu terminu «nauka» określa się nim wytwór tych czynności, a więc system twierdzeń, do których uznania doszli uczeni w swym dążeniu do poznania rzeczywistości" (Ajdukiewicz, 1965, s. 173). Podobnie rozróżnia dwa sensy termi- nu „nauka" Kmita (1976, s. 93) pisząc: „istnieją, jak wiadomo, dwa podstawowe dla rozważań teoriopoznawczych sposoby pojmowania terminu: «nauka». Z jednej bowiem strony odnoszony jest on do określonego systemu czynności badawczych, z drugiej zaś strony stosuje się go do odpowiedniego zbioru założeń badań nauko- wych oraz ich rezultatów wyrażonych w postaci zdań". W pierwszym przypadku Kmita mówi o „praktyce badawczej", zaś w drugim pozostaje przy terminie „na- uka". Nauka, dwojako rozumiana, jest przedmiotem zainteresowań metodologii. Metodologia dzieli się na (Ajdukiewicz, 1965, s. 174; Topolski, 1984, s. 14): (a) metodologię ogólną — traktującą o prawidłowościach rządzących proce sem poznawczym, wspólnych dla wszystkich nauk (np. klasyfikowanie, definiowa nie, wnioskowanie, wyjaśnianie itp.), (b) metodologię szczegółową (metodologie szczegółowe) — dotyczącą danej dyscypliny naukowej i zajmującą się charakterystycznymi dla tej właśnie dyscypli ny naukowej procedurami poznawczymi (np. planowanie eksperymentów w psy chologii czy budowa testów psychologicznych). 15 Badania nad działaniami poznawczymi (Nowak L., 1977, s. 29) mogą być prowadzone w dwojaki sposób (Topolski, 1984, s. 14; Nowak S., 1985, s. 23; Kamiński, 1992, s. 43): (a) można dokonywać rekonstrukcji i opisu rzeczywistego postępowania ba dawczego osób zajmujących się nauką (tu: psychologów) i wówczas będziemy mówili o metodologii opisowej. Tak też pojmuje zakres zadań adresowanych do metodologii L. Nowak (1977, s. 29): „Traktuje ona (metodologia J. B.) o tym, w jaki sposób typowy uczestnik procesu poznawczego realizuje swoje cele. A zatem jakie środki stosuje, aby cele te osiągnąć. Rekonstrukcja i hierarchizacja tych celów oraz analiza tych środków (metod postępowania, procedur poznawczych) stanowi zadanie teorii działań poznawczych, albo inaczej, metodologii nauk. Mówiąc do kładniej, idzie tu o metodologię nauk empirycznych" (podkr. J. B.). Tak rozumiana metodologia, to metodologia opisowa. (b) można też wskazywać badaczom jak powinni postępować, aby zminima lizować błędy i zmaksymalizować osiągnięcia badawcze. Można tedy pojmować metodologię tak jak to czyni S. Nowak (1985, s. 24; także Ajdukiewicz, 1965, s. 175; Topolski, 1984, s. 14; Giedymin, 1962, s. 919, 1964, s. 17, 177). I tak, na przykład, S. Nowak tak formułuje zadania metodologii: „O tym jak te czynności (badawcze J. B.) realizować w sposób poprawny, mówią te reguły metodologiczne, których zasadność uznajemy. Kiedy reguły te stosujemy jako kryteria oceny nauki istniejącej lub jako normy własnego postępowania badawczego i wzorce pożąda nego kształtu jego wytworów, przechodzimy na teren metodologii pojmowanej w sposób normatywny. Tak uprawiana metodologia jest też nauką praktyczną, reguły jej mówią bowiem jak w poszczególnych przypadkach należy postępować, aby zrealizować określone — etapowe czy bardziej ogólne — cele procesu badawcze go" (Nowak S., 1985, s. 24). Tak rozumiana metodologia, to metodologia normatywna. Można z kolei zadać pytanie o źródła owych norm postępowania badawczego, które będzie poprawne1 z metodologicznego punktu widzenia. Na to pytanie udziela odpowiedzi cytowany już Ajdukiewicz (s. 175): „Normy poprawności procedury naukowej, które formułuje metodologia, nie są przez nią z góry dyktowane uczo- nym specjalistom. Normy te wyczytuje metodologia z praktyki specjalistów, którzy pewne pociągnięcia w robocie naukowej aprobują, a inne dezaprobują, odrzucając je jako nieudane. Lecz specjaliści, oceniając własne i cudze postępowanie naukowe, osądzają je w sposób zgodny z tymi normami, ale nie uświadamiają ich sobie na tyle wyraźnie, aby mogli z nich w sformułowaniu słownym zdać sprawę. Inaczej mówiąc, uczeni specjaliści mają wyrobione przez praktykę sumienie naukowe, ale nie zawsze zdają sobie wyraźnie sprawę z zasad, które głosem tego sumienia kie- rują. Skodyfikowanie zasad tego naukowego sumienia jest zadaniem metodologii (podkr. /. B.). Chciałbym w tej wypowiedzi wybitnego logika zaakcentować jedno „Metodologia nazywa mianowicie poprawnym w danej nauce takie postępowanie, które przy- czynia się do osiągnięcia jej zadania, zaś niepoprawnym takie, które osiągnięciu tego zadania nie służy, a tym bardziej takie, które temu zadaniu przeszkadza" (Ajdukiewicz, 1965, s. 175). 16 określenie, a mianowicie: „naukowe sumienie". Tak bowiem, jak nieetyczne jest złe traktowanie przez psychologa-klinicyste powierzonego jego opiece terapeutycz- nej pacjenta, tak też nieetyczne jest prowadzenie badania naukowego bez gruntow- nej znajomości zasad regulujących to postępowanie badawcze. Po trzydziestu latach od daty publikacji Logiki pragmatycznej, do analogicznego stanowiska w kwestii ważności zasad metodologicznych doszedł psycholog, Rosenthal (1994), który też powiązał etyczność postępowania badacza z metodologiczną jakością prowadzo- nych przez niego badań — „zła nauka przyczynia się do złej etyki". I jeszcze jeden podział. Wyróżnia się (Nowak L., 1977, s. 29): (a) metodologię nauk empirycznych (psychologii, pedagogiki, fizyki, biologii, chemii itp.), (b) metodologię nauk formalnych (matematyki, logiki). W niniejszym podręczniku metodologia będzie rozumiana jako: (1) metodologia szczegółowa — bo dotycząca jednej dyscypliny, psychologii (albo jednej grupy dyscyplin nauk behawioralnych: psychologii, socjologii, peda gogiki); (2) metodologia normatywna — jest to podręcznik, który ma kształtować świadomość metodologiczną kandydatów na badaczy (czy młodych badaczy) czyli ma wskazywać wzorcowe rozwiązania warsztatowe, których akceptacja pozwoli im na uniknięcie błędów w prowadzonych badaniach empirycznych; (3) metodologia nauk empirycznych — bo psychologia jest nauką empiryczną. W tym podręczniku będę posługiwał się pierwszym rozumieniem terminu „na- uka" (w sensie Kmitowej „praktyki badawczej"). Interesować mnie tedy będą osob- liwości procesu badawczego w psychologii. 2. Dwa cele nauczania metodologii Czemu służy wiedza z zakresu metodologii badań psychologicznych? Jak sądzę, na to pytanie można udzielić dwóch uzupełniających się odpowiedzi. Po pierwsze, psychologowi (także studentowi psychologii) metodologia niezbędna jest do zrozu- mienia naukowych tekstów i procedur, z którymi zapoznaje się w trakcie lektury naukowych opracowań z zakresu psychologii, a zwłaszcza tych ich części, które zdają sprawozdanie z przeprowadzonych przez danego autora badań empirycznych. Psycholog-czytelnik nie powinien wierzyć autorowi „na słowo" i powinien umieć sformułować własną opinię na temat wartości poznawczej wyników, o których traktuje dane opracowanie. Do tego jednak niezbędna jest znajomość metodologii. Po drugie, psycholog (także student psychologii) powinien umieć: (1) samodziel- nie zaprojektować badanie empiryczne, (2) samodzielnie je przeprowadzić, $ (3) samodzielnie zinterpretować i uogólnić uzyskane wyniki. Aby było to możliw musi on posiąść odpowiednie kompetencje metodologiczne. 2 — Metodologia badań.. Respektując powyżej wprowadzone rozróżnienie dwóch sposobów opanowania wiedzy metodologicznej będę mówił o: (a) biernej znajomości metodologii, (b) czynnej znajomości metodologii. Pisząc niniejszy podręcznik zwracałem uwagę, aby służył on zarówno tym (studenci pierwszych lat studiów), którzy wpierw chcą zrozumieć przekazywaną im wiedzę psychologiczną, pochodzącą wszak — przypominam, iż psychologia jest nauką empiryczną! — z badania empirycznego, zanim przejdą do jej wykorzysty- wania we własnej praktyce (diagnostycznej, terapeutycznej, profilaktycznej), jak i tym, którzy sami chcą wiedzę psychologiczną (naukową!) wzbogacać prowadząc samodzielne badania empiryczne — dla studentów taką pierwszą, poważną okazją będzie praca magisterska, a dla słuchaczy studiów doktoranckich będzie to praca doktorska. 2.1. Znajomość bierna Mówiąc o biernej znajomości metodologii mam na myśli trzy zasadnicze konteksty korzystania z wiedzy metodologicznej dotyczącej standardów prowadzenia badań empirycznych w psychologii (i dyscyplinach pokrewnych): (a) kontekst studiowania, ze zrozumieniem, literatury psychologicznej, (b) kontekst poprawnego wykorzystania, w praktyce psychologicznej, rezulta tów badawczych zaczerpniętych z literatury przedmiotu, (c) kontekst umiejętnego formułowania pytań adresowanych do specjalistów z zakresu metodologii i statystyki. Kontekst (a). Już na pierwszym roku studiów psychologicznych student zobo- wiązany jest do lektury nie tylko pisanych z myślą o nim elementarnych skryptów, ale także fragmentów poważnych książek i artykułów drukowanych w profesjonal- nych czasopismach naukowych. Udział tych ostatnich w zestawach lektur wzrasta wraz z przechodzeniem studenta na wyższe lata studiów i — w zasadzie — nie podlega żadnym ograniczeniom w okresie przygotowywania przez niego pracy ma- gisterskiej (ta zaś powinna być pracą naukową i empiryczną — wszak pisana jest na uniwersytecie, a to zobowiązuje do uszanowania podstawowych wartości, któ- rym wierni są „ludzie uniwersytetu", por. Brzeziński, 1994, 1996; także rozdz. 6., pkt. 3.). Chcąc czytać, ze zrozumieniem, teksty naukowe z psychologii, zwłaszcza te referujące przebieg badań empirycznych oraz prezentujące wyniki tych badań, Czy- telnik powinien umieć rozszyfrować specjalistyczne terminy, symbole i wzory. Po- winien wyrobić sobie krytyczny sąd na temat zastosowanej przez autora danego artykułu procedury badawczej, narzędzia pomiarowego, techniki doboru próby, za- stosowanych testów statystycznych i współczynników korelacji. Bo co przeciętne- mu nie-psychologowi mówią takie zwroty: „badanie empiryczne przeprowadzono wg modelu ex post facto", „eksperyment przeprowadzono zgodnie z planem So- 18 lomona", „w badaniu kontrolowano efekt pretestu" "współczynnik rzetelności testu (stabilność bezwzględna) wynosi: r„ - 0,86", „trafność treściową kwestionariusza badano...", „współczynnik zgodności sędziów W-Kendalla wyniósł: W - 0,72", „in- terakcja zmiennych A i B okazała się istotna na poziomie p < 0,01", „do testowania hipotezy Ho: p = 0 posłużono się testem t", „j2 = 12,34; df = 1; p < 0,001 (test dwustronny)"? Zapewne niewiele! Oczywiście, zawsze można trudne momenty w tekście opuścić i czytać tylko to, co napisane „ludzkim" językiem (bez tych wszy- stkich utrudnień technicznych). Tylko — rodzi się pytanie — czy takie czytanie można nazwać studiowaniem literatury przedmiotu? Czy można mówić, że się zro- zumiało dany tekst naukowy z psychologii, jeżeli nie zrozumiało się istotnych jego elementów? Czy można polegać jedynie na tym, co sam o swoim wytworze napisał autor (jeżeli, przykładowo, napisał on o zastosowanym przez siebie teście uzdolnień matematycznych, że jego rzetelność wyniosła r„ = 0,55 i że była ona wysoka, gdy faktycznie, w przypadku testów uzdolnień nie jest ona nawet wystarczająca)? Moja odpowiedź — nie! Zatem, tak samo ważne jest studiowanie teorii psychologi- cznych, jak i studiowanie metodologii ułatwiającej dokonanie krytycznej oceny ich „dobroci". Kontekst (b). Jeżeli psycholog zdołał opanować takie kwantum wiedzy meto- dologicznej, że może dokonać oceny wartości metodologicznej teorii psychologicz- nych, o większym lub mniejszym zasięgu, opisanych w naukowych monografiach i periodykach, to jest też gotowy do wykorzystania tych teorii w swojej praktyce psychologicznej. Psycholog nie powinien bezkrytycznie zawierzyć, na słowo, auto- rowi danego opracowania, że przedstawiona przez niego koncepcja rzeczywiście zasługuje na miano teorii empirycznej w sensie kryteriów metodologicznych. Zbyt wiele pojawia się opracowań, nieraz pod bardzo nęcącymi tytułami, które prezen- tują koncepcje (świadomie unikam terminu „teoria", gdy nie ma pewności co do rzeczywistego statusu teoriopoznawczego takich „produktów") nie sprawdzone w przyjęty w społeczności psychologów-badaczy sposób, jeśli oferowane przez auto- rów takich opracowań metody diagnostyczne nie spełniają określonych standardów ujętych w swoistym kodeksie obowiązującym psychologa konstruującego i stosu- jącego metody diagnostyczne (np. APA, 1985a, 1985b). Zanim tedy psycholog sięgnie po taką koncepcję, winien się wpierw upewnić, czy rzeczywiście zasługuje ona na miano „teorii" i czy jako taka może stać się podstawą do wykorzystania w rozwiązaniu określonego problemu praktycznego (piszę o tym szczegółowo w rozdz. 2.), a dopiero potem przystąpić do wyprowadzenia z jej twierdzeń dyrektyw praktycznego działania. Uważam, że nie sposób odpowiedzialnie przystąpić do samodzielnego (a więc twórczego, a nie tylko odtwórczego, przypominającego pracę inżyniera konstruują- cego jakieś urządzenie techniczne na podstawie szczegółowego planu ujętego w licencji) zastosowania czyjejś koncepcji w celu usprawnienia własnej praktyki psy- chologicznej bez dobrej znajomości metodologii. Metodologia dostarcza bowiem psychologowi ostrych kryteriów umożliwiających oddzielenie ziaren od plew. Kontekst (c). Tak, jak od psychologa-praktyka oczekuje się, że rozwiązując trudny problem zawodowy (z zakresu diagnostyki czy terapii) zwróci się o pomoc 2' 19 do specjalisty, który legitymuje się bogatszym od niego doświadczeniem zawodo- wym oraz gruntowniej szą wiedzą teoretyczną, tak od psychologa-badacza (zwłasz- cza dopiero stawiającego pierwsze samodzielne kroki badawcze) oczekuje się, iż będzie zwracał się on o pomoc do specjalisty — metodologa, psychometry czy statystyka. Nie pizynosi mu ujmy to, że czegoś nie wie. Gwałtowny rozwój meto- dologii badań empirycznych (także komputeryzacja psychometrii i statystyki) unie- możliwia — zwłaszcza psychologowi, który musi śledzić rozwój wiedzy w zakresie swojej specjalizacji — dotrzymywanie kroku specjalistom z zakresu metodologii, którzy tylko nią się profesjonalnie zajmują. Przynosi natomiast ujmę (powiem ostrzej — dyskwalifikuje go jako badacza!) postawa nieujawniania swojej niewiedzy metodologicznej w obawie przed utratą swoiście pojmowanego prestiżu zawodowego (Rosenbergowski „lęk przed oceną")- Zatem można sformułować dyrektywę dla wszystkich psychologów (a zwłaszcza dla tych, którzy debiutują w roli badaczy) — w miarę możliwości konsultuj projekty badawcze ze specjalistą z zakresu metodologii, psychometrii i statystyki. Ale żeby efektywnie z takiej pomocy specjalistycznej skorzystać, trzeba umieć zadawać pytania. Do tego zaś niezbędne są pewne minimalne kompetencje metodologiczne. Chodzi bowiem o wysławianie się w języku zrozumiałym dla specjalisty i chodzi też o to, aby zrozumieć to, co nam specjalista powie. Nie możemy, tak po prostu, pokazać zbioru danych i po- wiedzieć — „proszę nam to jakoś obliczyć". Na tak sformułowaną prośbę, przy całej życzliwości specjalisty do nas, trudno oczekiwać wartościowej odpowiedzi. Żeby zaś zadać pytanie sensownie, trzeba wpierw opanować język, w którym takie pytanie będzie zadane. Tym językiem jest język metodologii. Wypada się tedy zgodzić z S. Nowakiem (1985, s. 35), który pisze, że: „specjalista w swej dziedzinie nauki to człowiek, który nie tylko umie znajdować odpowiedzi na pytania, lecz także pytania te poprawnie formułować". Pamiętajmy, że od metodologa nie możemy oczekiwać, iż rozwiąże on nam nasz problem badawczy, gdyż nie jest on psychologiem klinicznym czy psychologiem społecznym. Nie ma on obowiązku — nawet jako metodolog-psycholog — znać problematyki teoretycznej (psycho- logicznej) równie dobrze, jak psycholog specjalizujący się w danym zagadnieniu. Nie. Natomiast na badaczu-psychologu spoczywa obowiązek znajomości metodo- logii w takim zakresie, który umożliwi nie tylko zadanie sensownych pytań spe- cjaliście z zakresu metodologii czy statystyki, ale także zrozumienie tego co nam ów specjalista odpowie. I to jest ten kontekst umiejętnego formułowania pytań. 2.2. Znajomość czynna Czynna znajomość metodologii badań psychologicznych obejmuje cztery konteksty: (a) kontekst prowadzenia własnych badań empirycznych, (b) kontekst integrowania rezultatów badawczych powstałych w różnych pra cowniach, (c) kontekst powtarzania (replikacji) badań empirycznych, 20 (d) kontekst psychologii badania empirycznego (psychologicznego!) i etyki zachowań badawczych psychologa. Kontekst (a). Na ogół mówiąc o nauczaniu metodologii (zwłaszcza rozumia- nej, tak jak w niniejszym podręczniku — normatywnie) myślimy o tym, że słu- chacz naszych wykładów czy czytelnik naszego podręcznika wykorzysta przyswo- joną wiedzę z zakresu metodologii do prawidłowego przeprowadzenia badań em- pirycznych. I rzeczywiście jest to główny cel wykładu metodologii — nie tylko tego, który zawarty jest w niniejszym podręczniku. Przecież to, jaka będzie psy- chologia jako nauka — zależy przede wszystkim od tego, jaka będzie świadomość metodologiczna społeczności psychologów, a więc jakie będą kompetencje meto- dologiczne psychologów-badaczy. I taki jest kontekst (bodajże najważniejszy) zna- jomości metodologii. Idealny psycholog, to taki, który nie tylko zna teorie psycho- logiczne, umie posłużyć się nimi w procesie diagnostycznym i terapeutycznym, ale także potrafi samodzielnie przeprowadzić badanie empiryczne, w którym poddane będą kontroli empirycznej jego oryginalne pomysły teoretyczne. Rzecz jasna, real- nemu psychologowi dość daleko do typu idealnego. Nic jednak nie stoi na prze- szkodzie, aby usiłować zbliżać się do tego ideału, czemu sprzyja między innymi zwiększanie kompetencji metodologicznych psychologa. Pamiętajmy, że nawet naj- bardziej oryginalnie brzmiąca i obiecująca pod względem potencjalnych zastosowań „teoria" jest niewiele warta, jeżeli nie będzie ona poddana surowemu testowi empi- rycznemu. Aby zaś taki test teorii przeprowadzić, niezbędna jest bardzo pogłębiona wiedza z zakresu metodologii badań psychologicznych. Mam nadzieję, że Czytel- nik, który sięgnął po niniejszy podręcznik będzie w stanie poradzić sobie w pro- blemowej sytuacji badania empirycznego. Kontekst (b). Znajomość metodologii jest pomocna także wówczas, gdy chce- my dokonać integracji wyników badań tego samego problemu, prowadzonych przez różnych badaczy, w określonym przedziale czasu. Takie zestawienia rezultatów badawczych są ostatnio prowadzone z wykorzy- staniem nowoczesnych metod tzw. metaanalizy (ang. meta-analysis). Jednym z bardziej reprezentatywnych i wyczerpujących ujęć tej nowoczesnej metody integra- cji danych empirycznych jest licząca prawie 600 stron monografia Huntera i Schmidta (1990; por. także: Rosenthal, 1991c). Schmidt (1995), autor jedynego dostępnego w języku polskim opracowania na temat metaanalizy, wskazuje na na- stępujące zalety tej nowej, zaawansowanej metody analizy danych i tworzenia no- wych teorii: „Niektórzy twierdzą, że metaanaliza nie jest niczym więcej niż nową, ilościową metodą prowadzenia przeglądów literatury (Guzzo, Jackson i Katzell, 1986). Gdyby tak faktycznie było, jej oddziaływanie byłoby w pełni oceniane je- dynie poprzez sprawdzanie różnic we wnioskach płynących z metaanalitycznych versus tradycyjnych przeglądów literatury. Różnice te są istotne, wskazują bowiem, że wnioski z przeglądów opisowych, opartych na tradycyjnych procedurach testów statystycznej istotności, są często błędne. Niemniej jednak, metaanaliza to coś zna- cznie więcej niż nowa metoda dokonywania przeglądów. (...) Metaanaliza wyjaśnia krytyczną rolę błędu próby, błędu pomiaru oraz innych artefaktów w determinowa- niu obserwowanych rezultatów oraz mocy statystycznej poszczególnych badań. W 21 ten sposób metaanaliza ujawnia, jak niewiele informacji zawartych jest w pojedyn- czym badaniu, co dowodzi, inaczej niż głosi to powszechnie przyjęty pogląd, że żadne jednostkowe badanie nie jest w stanie rozwiązać danej kwestii czy znaleźć odpowiedzi na dane pytanie. (...) Dlatego każde pojedyncze badanie musi być roz- ważane jako pojedynczy element danych stanowiących wkład do przyszłej meta- analizy". Przykładu integracji danych rozproszonych w różnych opracowaniach do- starcza praca Rosenthala i Rubina (1978), zestawiająca rezultaty 345 studiów em- pirycznych nad efektem oczekiwań interpersonalnych. W podręczniku podstaw metodologii badań psychologicznych nie znalazło się miejsce na przedstawienie tej nowej metody zaawansowanej analizy danych. Nie- mniej jednak, Czytelnik, który przejdzie przez podstawowy kurs metodologii będzie przygotowany do podjęcia wysiłku doskonalenia swoich kompetencji metodologi- cznych. To tak, jak z teorią eksperymentu. Najpierw wystarczyła znajomość zasad eksperymentowania, wyprowadzonych z kanonów Millowskich (por. rozdz. 12.), poparta znajomością prostych testów istotności statystycznej różnic. Później trzeba było opanować zasady eksperymentowania oparte na statystycznym modelu jed- nowymiarowej analizy wariancji ANOVA (np. w zakresie podręcznika Brzezińskiego i Stachowskiego, 1984), aby przejść do eksperymentowania opartego na modelu wielowymiarowej analizy wariancji MANOVA (por. Aranowska, 1987), połączo- nego z metodą analizy ścieżek (ang. path analysis — por. Gaul, Machowski, 1987). A co trzeba będzie opanować jutro, aby prowadzone badania empiryczne nie od- stawały od coraz bardziej wyśrubowanych standardów metodologicznych, bez speł- nienia których nie można liczyć na opublikowanie artykułu w prestiżowych pis- mach naukowych? Kontekst (c). Znajomość metodologii jest przydatna także w sytuacji, gdy ba- dacz chce dokonać replikacji badania empirycznego przeprowadzonego przez innego psychologa i opisanego w literaturze przedmiotu. Nie zawsze dane badanie jest powtarzane ze 100% odtworzeniem oryginalnych warunków. Czasem nowe badanie prowadzone jest ze zmianami scenariusza badania, albo w odmiennych warunkach kulturowych. Bywa też i tak, że badacz powtarza dane badanie, ale z użyciem nowych, bardziej precyzyjnych narządzi badawczych. Psychologia jest — przez przedmiot swoich badań (jest nim żywy człowiek) i psychologiczny charakter ba- dania psychologicznego (osoba badana wchodzi z badaczem w interakcję!) — na tyle osobliwą dyscypliną naukową (por. Rosenzweig, 1933), że trudno osiągnąć pełny sukces w powtarzaniu już przez kogoś przeprowadzonych badań (zwłaszcza w eksperymentalnej psychologii społecznej czy psychologii osobowości). Zagroże- niem dla pełnej replikowalności badań psychologicznych są takie zmienne, jak: OCZe\5T*!ania "mXeTpexsona\nc >oa<\acx&, -«sVLax»AajYei teić hipotez badawczych, lęk przed oceną, status motywacyjny osoby badanej itp. (o tych zmiennych traktuje rozdz. 4.). Wreszcie, badacz może chcieć powtórzyć czyjeś badania aby upewnić się, czy rzeczywiście dany efekt eksperymentalny wystąpił. Kompetencje metodologiczne wymagane od badacza przystępującego do replikacji jakichś badań są takie same, jak przy przeprowadzaniu badań oryginalnych (kontekst (a)). 22 Problematyce replikacji badań empirycznych w naukach społecznych poświę- cony jest zbiór kilkudziesięciu artykułów zredagowany przez Neuliepa (1991). Za- chęcam do jego lektury. Kontekst (d). Już zaznaczyłem, iż osobliwością badań empirycznych prowa- dzonych przez psychologów jest to, że wchodzą oni, jako badacze, w interakcję z osobami badanymi, co ma poważne konsekwencje metodologiczne (wyniki badań empirycznych mogą się różnić z powtórzenia na powtórzenie) oraz etyczne (nie wszystko, co technicznie wykonalne, możliwe jest do przeprowadzenia, gdyż nie pozwalają na to zasady etyczne). Stoję na stanowisku, że podnosząc swoje kwalifikacje metodologiczne badacz — jako psycholog! — nie może stać się tylko bezdusznym „dodatkiem" do kom- putera, aparatury ekspozycyjno-pomiarowej oraz testów psychologicznych. Na nim, jako człowieku i członku społeczności psychologicznej (np. Polskiego Towa- rzystwa Psychologicznego), spoczywa szczególna odpowiedzialność za to, jak bę- dzie się czuła osoba badana (a zwłaszcza dziecko czy osoba chora), która mu zaufała i zgodziła się wziąć udział w prowadzonych przez niego (i niekoniecznie przyjemnych) badaniach. Można tu powtórzyć za wybitnym psychologiem społe- cznym, Aronsonem (1995, s. 513): „...osoby badane w eksperymentach powinny być zawsze chronione". I nie mogę zaakceptować stanowiska zajętego przez Zim- bardo, autora głośnych badań (Stanfordzki eksperyment więzienny — por. Zimbar- do, 1973; także dobre omówienie w: Eysenck, Eysenck, 1996, rozdz. 5.: Ekspery- mentalna symulacja więzienna, s. 59-68), który zapytany, czy powtórzyłby swój eksperyment powiedział: „...przeprowadziłbym ten eksperyment. (...) Jeżeli jednak wprowadzimy zakaz prowadzenia badań budzących jakiekolwiek wątpliwości ety- czne lub kontrolowanych eksperymentów, oznaczać to będzie, że pewnych obsza- rów natury ludzkiej nigdy nie poznamy" (McDermott, 1995, s. 6). Oczywiście to badacz sam zdecyduje, jakie zajmie stanowisko w kwestii ochrony praw osoby badanej do informacji (pełnej) i swobody decydowania co do udziału w badaniu psychologicznym. Niemniej jednak warto, mówiąc o sprawach warsztatu badaw- czego psychologii, nie zapomnieć i o osobie badanej. Zagadnieniom psychologii i etyki badań psychologicznych poświęcone są w niniejszym podręczniku aż trzy rozdziały — rozdz. 4., 5. i 6. 3. Podstawowa literatura z zakresu metodologii badań psychologicznych i dyscyplin pokrewnych Po każdym z rozdziałów, w Podsumowaniu, Czytelnik znajdzie informacje o pod- stawowych, dostępnych w języku polskim, tekstach — i tych o charakterze pod- ręcznikowym, i tych bardziej zaawansowanych, których lektura, ze zrozumie- niem(\), wymaga co najmniej znajomości treści danego rozdziału. Także zamiesz- czona na końcu podręcznika literatura cytowana (książki i artykuły) może okazać 23 się pomocna dla kogoś, kto zechciałby pogłębić swoje wiadomości z metodologii. Tam znajdzie też Czytelnik literaturę obcojęzyczną. Tutaj zaś chciałbym zwrócić uwagę na pozycje książkowe, dostępne w języku polskim, najbardziej podstawowe dla pogłębienia wiadomości z metodologii badań psychologicznych i dyscyplin po- krewnych. 1. Podstawy logiczne badań naukowych Ajdukiewicz K. (1965), Logika pragmatyczna. Warszawa, PWN. Batog T. (1994), Podstawy logiki, Poznań, Wyd. Nauk. UAM. Giedymin J. (1964), Problemy, założenia, rozstrzygnięcia, Poznań, PTE. Kmita J. (1973), Wykłady z logiki i metodologii nauk, Warszawa, PWN. Marciszewski W. (red.)(1988), Mała encyklopedia logiki, Wrocław, Ossolineum. Pawłowski T. (1986), Tworzenie pojęć i definowanie w naukach humanistycznych, Warszawa, PWN. Ziembiński Z. (1995), Logika praktyczna, Warszawa, Wyd. Nauk. PWN. 2. Metodologia ogólna Amsterdamski S. (1983a), Między historią a metodą, Warszawa, PIW. Amsterdamski S. (1983b), Nauka a porządek świata, Warszawa, PWN. Feyerabend P. K. (1979), Jak być dobrym empirystą?, Warszawa, PWN. Hempel C. G. (1968), Podstawy nauk przyrodniczych, Warszawa, WNT. Kamiński S. (1992), Nauka i metoda. Pojęcie nauki i klasyfikacja nauk, Lublin, Tow. Nauk. KUL. Kmita J. (1976), Szkice z teorii poznania naukowego. Warszawa, PWN. Kuhn T. S. (1968), Struktura rewolucji naukowych, Warszawa, PWN. Kuhn T. S. (1985), Dwa bieguny. Tradycja i nowatorstwo w badaniach naukowych. Warszawa, PIW. Lakatos I. (1995), Pisma z filozofii nauk empirycznych, Warszawa, Wyd. Nauk. PWN. Nagel E. (1970), Struktura nauki, Warszawa, PWN. Nowak L. (1977), "Wstęp do idealizacyjnej teorii nauk. Warszawa, PWN. Popper K. R. (1977), Logika odkrycia naukowego, Warszawa, PWN. Popper K. R. (1992), Wiedza obiektywna. Ewolucyjna teoria epistemologiczna, Warszawa, Wyd. Nauk. PWN. Siemianowski A. (1976), Poznawcze i praktyczne funkcje nauk empirycznych, Warszawa, PWN. Such J. (1975), Problemy weryfikacji wiedzy, Warszawa, PWN. 3. Metodologia badań psychologicznych i pokrewnych Brzeziński J., Siuta J. (red.)(1991), Społeczny kontekst badań psychologicznych i pedagogicznych. Wy- bór tekstów, Poznań, Wyd. Nauk. UAM. Gaul M. (1990), Idealizacyjne modele poznania naukowego w psychologii, Warszawa-Poznań, PWN. Jakubowska U. (1993), Czynności badawcze w psychologii i pedagogice. Zarys problematyki, Byd- goszcz, Wyd. WSP. Maruszewski T. (1983), Analiza procesów poznawczych jednostki w świetle idealizacyjnej teorii nauki, Poznań, Wyd. Nauk. UAM. Nowak S. (red.)(1965), Metody badań socjologicznych. Wybór tekstów, Warszawa, PWN. Nowak S. (1985), Metodologia badań społecznych, Warszawa, PWN. Paszkiewicz E. (1983), Struktura teorii psychologicznych, Warszawa, PWN. Topolski J. (1984), Metodologia historii, Warszawa, PWN. Zamiara K. (1974), Metodologiczne znaczenie sporu o status poznawczy teorii, Warszawa, PWN. Zamiara K. (1995), Dynamika pojęć i programów psychologicznych. Szkice metodologiczne, Szczecin, Wyd. Fundacja im. Kazimierza Ajdukiewicza na rzecz Rozwoju Nauk Filozoficznych. 24 4. Eksperyment, pomiar, psychometria, statystyka Amerykańskie Towarzystwo Psychologiczne, APA (1985), Standardy dla testów stosowanych w psy- chologii i pedagogice. Warszawa, Poi. Tow. Psychol., Lab. Technik Diagnostycznych, „Biblioteka Psychologa Praktyka", tom 1. Bielą A. (1992), Skalowanie wielowymiarowe jako metoda badań naukowych, Lublin, Tow. Nauk. KUL. Blalock H. M. (1975), Statystyka dla socjologów. Warszawa, PWN. Brzeziński J. (red.)(1977), Wielozmiennowe modele statystyczne w badaniach psychologicznych, War- szawa, PWN. Brzeziński J. (red.)(1984), Wybrane zagadnienia z psychometrii i diagnostyki psychologicznej, Poznań, Wyd. Nauk. UAM. Brzeziński J. (red.)(1988), Problemy teorii, rzetelności, konstrukcji i analizy wyników testów psycholo- gicznych, Warszawa, Poi. Tow. Psychol., Lab. Technik Diagnostycznych, „Biblioteka Psychologa Praktyka", tom 2. Brzeziński J. (red.)(1993), Psychologiczne i psychometryczne problemy diagnostyki psychologicznej, Poznań, Wyd. Nauk. UAM. Brzeziński J. (red.)(1995), Z zagadnień diagnostyki psychologicznej, Poznań, Wyd. Fundacji Humanio- ra. Brzeziński J., Hornowska E. (red.)(1993a), Z psychometrycznych problemów diagnostyki psychologicz- nej, Poznań, Wyd. Nauk. UAM. Brzeziński J., Hornowska E. (red.)(1993b), Skala Inteligencji WAIS-R Wechslera. Polska adaptacja, standaryzacja, normalizacja i wykorzystanie w diagnostyce psychologicznej, Warszawa, Wyd. Nauk. PWN. Brzeziński J., Stachowski R. (1984), Zastosowanie analizy wariancji w eksperymentalnych badaniach psychologicznych, Warszawa, PWN. Domański Cz. (1979), Statystyczne testy nieparametryczne, Warszawa, PWE. Drwal R. Ł. (1995)., Adaptacja kwestionariuszy osobowości, Warszawa, Wyd. Nauk. PWN. Góralski A. (1980), Metody opisu i wnioskowania statystycznego w psychologii i pedagogice. Warsza- wa, PWN. Greń J. (1987), Statystyka matematyczna. Podręcznik programowany, Warszawa, PWN. Hornowska E. (1989), Operacjonalizacja wielkości psychologicznych. Założenia — struktura — kon- sekwencje, Wrocław, Ossolineum. Kozielecki J. (red.)(1971), Problemy psychologii matematycznej. Warszawa, PWN. Machowski A. (1993), Rzetelność testów psychologicznych. Dwa ujęcia modelowe, Warszawa-Poznań, Wyd. Nauk. PWN. Matczak A. (1994), Diagnoza intelektu. Warszawa, Wyd. Inst. Psychol. PAN. Magnusson D. (1991), Wprowadzenie do teorii testów, Warszawa, PWN. Marek T. (1989), Analiza skupień w badaniach empirycznych. Metody SAHN, Warszawa, PWN. Niemierko B. (1990), Pomiar sprawdzający w dydaktyce. Teoria i zastosowania. Warszawa, PWN. Nowakowska M. (1975), Psychologia ilościowa z elementami naukometrii, Warszawa, PWN. Paluchowski Wł. J. (1983), Z zagadnień diagnostyki osobowości, Wrocław, Ossolineum. Paluchowski Wł. J. (1991), Diagnozowanie osobowości Testowanie — interpretacja — interwencja, Poznań, Wyd. Nauk. UAM i Nakom. Paluchowski Wł. J. (red.)(1992), Współczesne techniki badawcze w psychologii klinicznej, Warsza- wa, Poi. Tow. Psychol., Lab. Technik Diagnostycznych, „Biblioteka Psychologa Praktyka", tom 2. Paszkiewicz E., Szustrowa T. (red.)(1985), Metody badań psychologicznych, „Materiały do nauczania psychologii", seria III, tom 4., Warszawa, PWN. Pawłowski Z. (1972), Wstęp do statystycznej metody reprezentacyjnej, Warszawa, PWN. Seul S. (1995), Oczekiwania nauczyciela a wyniki nauczania, Szczecin, Wyd. Uniwersytetu Szczeciń- skiego. Sosnowski T., Zimmer K. (Eds.)(1993), Metody psychofizjologiczne w badaniach psychologicznych, Warszawa, Wyd. Nauk. PWN. Sutek A. (1975), Eksperyment w badaniach społecznych, Warszawa, PWN. 25 Wieczorkowska-Siarkiewicz G. (1987), Skalowanie wielowymiarowe jako metoda badania percepcji, Warszawa, Wyd. Uniwersytetu Warszawskiego. Zakrzewska M. (1994), Analiza czynnikowa w budowaniu i sprawdzaniu modeli psychologicznych, Poznań, Wyd. Nauk. UAM. 5. Etyka badania naukowego ? Bernard J. (1994), Od biologii do etyki. Nowe horyzonty wiedzy, nowe obowiązki człowieka. Warszawa, Wyd. Nauk. PWN. Brzeziński J., Poznaniak W. (red.)(1994), Etyczne problemy działalności badawczej i praktycznej psy- chologów, Poznań, Wyd. Fundacji Humaniora. Goćkowski J., Kisiel P. (red.)(1994), Patologia i terapia tycia naukowego, Kraków, Universitas. Goćkowski }., Pigori K. (red.)(1991), Etyka zawodowa ludzi nauki, Wrocław, Ossolineum. Komitet Etyki w Nauce PAN (1994), Dobre obyczaje w nauce. Zbiór zasad i wytycznych, Warszawa. Polskie Towarzystwo Psychologiczne (1992), Kodeks etyczno-zawodowy psychologa. Warszawa, PTP. . natura procesu badawczego w psychologii . Rozdział i. Struktura procesu badawczego ? w psychologii 1 Worowłidzciiit.' „Najogólniej mówiąc podstawowym przedmiotem psychologii — jak pisze nestor polskiej psychologii profesor Tadeusz Tomaszewski w najbardziej popularnym w Polsce podręczniku akademickim psychologii (1975, s. 8)1 — jest człowiek i jego zachowanie się. Obydwa elementy tego określenia są ściśle ze sobą związane: kiedy mówimy o psychologii jako nauce o człowieku, to interesujemy się nim głównie jako podmiotem zachowania się; kiedy zaś mówimy o psychologii jako nauce o zachowaniu się, to mamy na myśli przede wszystkim najwyższe, specyfi- cznie ludzkie formy zachowania się". Nie tylko psychologia uczyniła z człowieka i jego zachowania przedmiot swo- ich badań. Ale to właśnie psychologia wyróżnia się spośród tych dyscyplin nauko- wych tym, że: „...jej właściwym przedmiotem staje się coraz wyraźniej zachowanie najwyżej zorganizowane, jakim jest zachowanie się celowe, ukierunkowane na osiągnięcie określonego stanu końcowego, które jest jego wynikiem. Tę formę za- chowania się nazywamy w języku polskim czynnością, a jeśli chcemy podkreślić, że czynności człowieka mają swój przedmiot, na który są skierowane i który pod ich wpływem podlega zmianom, mówimy o działaniu lub o czynnościach przed- miotowych" (tamże, s. 9). Konsekwencją takiego rozumienia psychologii jest po- dana, w tym samym podręczniku, jej definicja (tamże, s. 9): „Psychologia jest to nauka o czynnościach człowieka i o człowieku jako ich podmiocie" Tak określony przedmiot nadaje specyficzny sens ogólnym schematom meto- dologicznym, wedle których badacze-psychologowie stawiają pytania badawcze Psychologia pod redakcją Tomaszewskiego miała do 1992 roku aż sześć wydań. Od 1992 roku ukazały się dwa wydania nowej edytorsko wersji tego podręcznika w czterech tomach: tom 1. J. Ko- zielecki: Percepcja, myślenie, decyzje; tom 2. J. Reykowski: Emocje, motywacje, osobowość; tom 3. I. Kurcz: Pamięć, uczenie się, język; tom 4. J. Strelau: Temperament, inteligencja. Całość nosi tytuł Psychologia ogólna i jej redaktorem naukowym pozostał T. Tomaszewski. 29 (problemy), formułują prawdopodobne na nie odpowiedzi (hipotezy), dokonują po- miaru interesujących ich zmiennych i — wreszcie — sprawdzają zgodność sfor- mułowanych hipotez badawczych z danymi doświadczenia. Mówiąc krótko, stoso- wane procedury badawcze muszą uwzględniać fakt, iż przedmiotem badania nie jest metal, minerał, promieniowanie, ale człowiek i jego zachowanie się. Dlatego też nie będzie, ani w tym rozdziale, ani w całej książce, mowy o sztuce prowa- dzenia badań naukowych w ogóle, ale wyłącznie o sztuce prowadzenia naukowych badań psychologicznych. Niemniej jednak trzeba zacząć od ukazania ogólnego schematu poznania na- ukowego, aby poprzez jego uszczegółowienie dojść do takiego schematu, wedle którego Czytelnik będzie mógł przeprowadzać badania mające na celu rozwiązanie określonych problemów naukowych należących do psychologii. Zacznę tedy od zaprezentowania celów poznania naukowego, aby z kolei przejść do naszkicowania ogólnego schematu poznania naukowego. Następnie przedstawię proces badawczy w postaci łańcucha następujących po sobie ogniw (etapów, kroków, faz). Wreszcie, w ostatnim punkcie niniejszego rozdziału zapo- znam Czytelnika z własnym ujęciem procesu badawczego w psychologii. Mówiąc jeszcze inaczej, nowe ujęcie procesu badawczego w psychologii, które tu zostanie przedstawione, będzie stanowiło swoistą ramę konstrukcyjną całego wykładu me- todologii badań psychologicznych. 2. Cele poznania naukowego — zewnętrzne i wewnętrzne Nie każde poznanie może być uznane za poznanie naukowe. Aby można je było za takie uznać, musi ono realizować określone cele. Za Suchem (1973, s. 16) można wyróżnić dwa rodzaje celów: zewnętrzne i wewnętrzne: „cele zewnętrzne wynikają z funkcji, jakie pełni nauka w społeczeństwie, w życiu ludzi, a więc «na zewnątrz», gdy jest stosowana do realizacji pewnych zadań teoretycznych lub pra- ktycznych. Cele wewnętrzne — to cele — jakie sobie uczony zwykle stawia bez- pośrednio w swej pracy badawczej, cele czysto poznawcze". Zwykło się mówić, iż każdy badacz zmierza do tego, by poznać prawdę, by dać prawdziwy obraz tego wycinka rzeczywistości, który bada. Byłaby tedy prawda celem najgłówniejszym poznania naukowego. Myślę, że trafnie ujął to znany filo- zof krakowski Wł. Stróżewski, gdy pisał następujące słowa: „Gdy św. Augustyn, po drugich poszukiwaniach, znalazł wreszcie zadowalającą go odpowiedź na pyta- nie, czym jest szczęście, sformułował ją następująco: beata ąuippe vita est gaudium de veritate (życie szczęśliwe to radowanie się z prawdy). Myślę, że odpowiedź ta musi z konieczności odnosić się do życia człowieka nauki. Nie ma większej radości niż radość znalezienia prawdy. I nie ma większej troski nad to, by to, co znajdowane, było istotnie prawdą" (Stróżewski, 1991, s. 72). 30 Jednakże nie każda prawda jest celem badacza. Taka, która go interesuje (po- winna interesować!), cechuje się: (1) ogólnością, (2) ścisłością, (3) wysoką informatywną zawartością, (4) pewnością, (5) prostotą. Mimo pozornej niemożności realizacji wszystkich pięciu celów jednocześnie, przy bliższej ich analizie metodologicznej okazuje się, że nie tylko są one ściśle ze sobą powiązane, ale też wzajemnie warunkują się. Nie jest to widoczne na pierwszy rzut oka, gdyż związki między wyróżnionymi celami mają zazwyczaj charakter pośredni — co ilustruje schemat przedstawiony na rys. 1.1. (Such 1973, s. 18). ogólność 1 prostota informatywną zawartość (stopień sprawdzalności) pewność ćricJ Rys. 1.1. Wzajemne powiązania celów poznania naukowego Centralne miejsce w tym schemacie — jak widać — zajmuje cel: informatyw- ną zawartość (wysoka). Jest on związany z pozostałymi celami. Jego centralne położenie uzasadnione jest i tym, że warunkuje on bezpośrednio stopień sprawdzal- ności wiedzy, gdyż im więcej dane twierdzenie (hipoteza badawcza) mówi o rze- czywistości, im bogatsze jest w treść, im wreszcie więcej można z niego wypro- wadzić różnorodnych konsekwencji logicznych i doświadczalnych, tym łatwiej (i dokładniej) można je będzie sprawdzić (liczniejszy i bardziej różnorodny będzie materiał empiryczny, na którym twierdzenie będzie potwierdzone). Z kolei infor- matywną zawartość wiedzy uwarunkowana jest jej ogólnością wyrażającą się liczbą zdań (wniosków — w tym empirycznych), które dadzą się z tej wiedzy wyprowa- dzić. Im bardziej jest ona ogólna, tym więcej można z niej wyprowadzić wniosków konfrontowanych z rzeczywistością. Tym też tłumaczy się rozwój nauki w kierunku formułowania coraz bardziej ogólnych twierdzeń obejmujących klasy zjawisk i do- tyczących jak największej liczby przypadków. Z tego samego powodu dąży się do tego, by wiedzę naukową cechowała jak największa ścisłość. Pociąga to za sobą matematyzację poszczególnych dyscyplin naukowych — nie ominęła ona i psycho- logii, o czym może się Czytelnik przekonać z elementarnego wprowadzenia w dziedzinę psychologii matematycznej pióra Coombsa, Dawesa i Tverskyego (1977). .Matematyczne" ujęcie twierdzeń danej dyscypliny naukowej nadaje im matema- tyczną ścisłość, a także — poprzez zwiększenie stopnia precyzji wyprowadzania 31 wniosków i konsekwencji — wysoki stopień ich sprawdzalności. Tym samym wy- rażenie twierdzeń w ścisłej postaci matematycznej zwiększa ich informatywną za- wartość. Jeżeli chodzi o następny wewnętrzny cel: prostotę, to zacząć należy od tego, że wyróżnia się dwa rodzaje prostoty wiedzy: (a) prostotę matematyczną i (b) prostotę logiczną. Oba rodzaje prostoty są ze sobą ujemnie skorelowane. Otóż, im dana teoria zawiera mniej założeń wyjściowych (tzw. postulatów), i jednocześnie większa jest ich zawartość informatywną, tym większy jest stopień jej prostoty logicznej. Z drugiej jednak strony taka prosta logicznie teoria wymaga dość skomplikowanego i zaawansowanego aparatu matematycznego, za pomocą którego będzie można wyprowadzić z niej logiczne i empiryczne konsekwencje. Rozwój nauki przebiega w kierunku formułowania twierdzeń coraz prostszych logicznie, a tym samym wymagających stosowania coraz bardziej skomplikowanego aparatu mate- matycznego. Wreszcie, ostatnim elementem przedstawionego wyżej schematu jest pewność wiedzy, przy czym wyróżnia się trzy jej rodzaje: (a) pewność psychologiczną, (b) pewność epistemologiczną, (c) pewność logiczną. Pewność psychologiczna oz- nacza wiarygodność, stopień subiektywnego przekonania o tym, że dane twierdzenie (hipoteza badawcza, teoria) jest prawdziwe. Pewność epistemologiczna z Y.o\ei mówi o stopniu potwierdzenia (konfirmacji) danego twierdzenia (hipotezy badaw- czej, teorii) w świetle uzyskanych danych empirycznych. Zaś pewność logiczna określa stopień jej niezawodności w sensie teorii prawdopodobieństwa. Wśród me- todologów spotyka się sąd, iż wiedza naukowa osiąga wysoki stopień pewności psychologicznej oraz epistemologicznej, natomiast stopień jej niezawodności (pew- ności logicznej) może być dość niski. Nie wykluczają oni bowiem tego, iż pewność w sensie logicznym nie idzie w parze z ogólnością i ścisłością wiedzy. Dlatego też cytowany tu Such sugeruje, by przez pewność, w powyższym schemacie, rozumieć tylko pewność epistemologiczną, a ostatecznie także pewność psychologiczną — ale już nie pewność logiczną. Scharakteryzowane tu cele wewnętrzne są podporządkowane celom zewnętrz- nym. Są środkami ich realizacji. Cele zewnętrzne wiążą się z funkcjami, jakie nauka pełni w społeczeństwie. Ponieważ nauka wyrosła z potrzeb czysto utylitarnych (praktycznych), więc jednym z jej celów zewnętrznych jest cel praktyczny — umo- żliwienie człowiekowi jak najefektywniejszego działania (na ten temat więcej w rozdz. 2.). Efektywne działanie wymaga opanowania umiejętności godzenia ze sobą środków i celów. Trzeba bowiem z jednej strony dobierać środki pod kątem celów, które chcemy osiągnąć, a z drugiej strony formułować takie cele, które są dostępne naszemu poznaniu. Koordynacja środków i celów wymaga umiejętności przewidy- wania przyszłych zjawisk. Jest tedy przewidywanie bezpośrednią funkcją praktycz- ną nauki. Kozielecki (1975, s. 24) w odniesieniu do teorii psychologicznych tak to sformułował: „...ważną funkcją teorii naukowej jest przewidywanie zachowania człowieka. Niektórzy badacze, jak np. behawioryści uważali, że predykcja jest jej funkcją podstawową, a nawet jedyną. Chociaż takie radykalne stanowisko nie wy- daje się słuszne, to jednak nie ulega wątpliwości, że jednym z ważnych kryteriów 32 oceny użyteczności teorii jest stopień trafności opierających się na niej przewidy- wań zachowania (...). Im wyższe jest prawdopodobieństwo trafnego przewidywania zjawiska przez daną teorię, tym większa jest jej wartość predyktywna". Człowiek jednak nie tylko chce efektywnie działać w świecie, w którym żyje, ale chce go także poznać, zrozumieć. Drugim zatem celem zewnętrznym nauki jest wyjaśnianie. Jest ono funkcją teoretyczną nauki. I znowu przywołam, w tym kon- tekście, wypowiedź Kozieleckiego (tamże, s. 25-26): „Coraz więcej badaczy (...) zwraca uwagę, że celem psychologii jest nie tylko przewidywanie zachowania lu- dzi, ale również — a nawet przede wszystkim — wyjaśnianie go, a więc poznanie procesów psychicznych, które warunkują zachowanie. Czasem psychologowie mó- wią, że dobra teoria powinna opisać mechanizmy działania. Funkcję teorii, która polega na opisie i wyjaśnianiu wewnętrznych mechanizmów czynności ludzkich, będę nazywał funkcją eksplanacyjną". Jakie zachodzi powiązanie obu rodzajów celów — wewnętrznych i zewnę- trznych? Badacz opisuje rzeczywistość, aby ją wyjaśnić oraz by przewidywać zajście nowych stanów rzeczy. Jednocześnie owo wyjaśnianie i przewidywanie podporządkowane jest temu, aby daną rzeczywistość można było ujmować racjo- nalnie i racjonalnie ją przekształcać. Im dokładniejsza i głębsza jest wiedza na- ukowa, tym lepiej spełnia ona swoje cele zewnętrzne. Cele wewnętrzne nauki można sprowadzić do tego, „że nauka stara się wiernie i głęboko opisać świat" (Such 1973, s. 25). Odpowiednio możemy mówić o trzech podstawowych funkcjach nauki: 1) funkcji deskryptywnej (opis), 2) funkcji eksplanacyjnej (wyjaśnianie), 3) funkcji prognostycznej (predykcja, przewidywanie). formalne Nauki empiryczn e F logika matematyka przyrodnicze fizyczne biologiczne ? D. Historia E. Nauki polityczne F. Prawo G. Językoznawstwo H. Filozofia naukowa społeczne A. Psychologia B. Socjologia r Rys. 1.2. Klasyfikacja nauk (wg. Such 1973, s. 41-47) Metodologia ujmuje naukę dwojako, raz jako proces zdobywania wiedzy, proces badania (por. Wprowadzenie, s. 15), a raz jako rezultat tego procesu (wiedza kowa), sumę wiedzy. Zapoznajmy się teraz z klasyfikacją nauk, czyli podziałem Metodologia badań.. 33 „wiedzy naukowej" na poszczególne dyscypliny. Pozwoli to nam na umiejscowie- nie psychologii w systemie innych nauk. Schemat przedstawiony na rys. 1.2. pre- zentuje jeden z możliwych podziałów. 3. Schemat poznania naukowego Wróćmy do spojrzenia na naukę, jako proces zdobywania wiedzy, jako proces poznawania otaczającej badacza rzeczywistości. Proces poznania naukowego można przedstawić w postaci czteroogniwowego łańcucha: fakty (1) teoria (2) przewid y w an ie (3 ) fakty. (4) Jest więc tak, jak powiedział kiedyś Einstein, że punktem wyjścia każdej nauki muszą być fakty i one też muszą być jej punktem docelowym. W sposób bardziej poglądowy kolejne stadia poznania naukowego prezentuje rys. 1.3. TEORIE dedukcja » PRZEWIDYWANIA świat konstrukcji teoretycznych budowanie teorii i i sprawdzanie świat faktów empirycznych i FAKTY FAKTY Rys. 1.3. Schemat poznania naukowego (wg Such 1973, s. 169) Nad linią przerywaną mamy świat konstrukcji teoretycznych, w którym działa badacz jako teoretyk, natomiast pod linią mamy świat faktów empirycznych, w którym działa badacz jako eksperymentator. W pierwszym kroku badacz formułuje teorie. W drugim wyprowadza z nich na drodze dedukcji określone przewidywania (predykcje). Wreszcie w trzecim kroku sprawdza teorie przez konfrontację przewi- dywań z faktami ustalonymi w drodze obserwacji czy eksperymentu. 4. Etapy postępowania badawczego w naukach empirycznych (wg M. Bunge'a) Wiemy już, czym jest nauka i jak z punktu widzenia metodologa wygląda w ogól- nych zarysach schemat poznania naukowego. Tu musimy zająć się nim bliżej. Po- stępowanie badawcze przebiega według z góry określonych etapów, kroków, czy faz, które charakteryzuje to, iż stanowią pewną zamkniętą całość wyodrębniającą się na tle całego procesu badawczego. Ujęcie procesu badawczego jako łańcucha następujących po sobie etapów ma też walory dydaktyczne, gdyż pokazuje Czytel- nikowi, jakie czynności badawcze musi wykonać w trakcie rozwiązywania określo- nego problemu naukowego. Na wstępie zapoznajmy się — tytułem przykładu — ze schematami spotyka- nymi w literaturze metodologicznej. Jednym z bardziej reprezentatywnych jest sche- mat zaproponowany przez Bunge'a (1959; cyt. za: Rudniański, 1975, s. 20-21; 1976). Wyróżnia się w nim 5 etapów, a na każdym z nich od 2 do 4 podetapów: Etap 1. Ujęcie problemu 1. Dokonanie przeglądu faktów (zebranie określonej grupy faktów, ich wstę pna ocena i selekcja z punktu widzenia problemu naukowego). 2. Rozpoznanie problemu (ocena sytuacji i występujących w danej dziedzinie wiedzy, podlegającej penetracji badacza, nieadekwatności, luk, niekonsekwencji). 3. Postawienie problemu (sformułowanie pytania; odpowiedź na nie miałaby lepiej niż dotychczas wyjaśnić dany skrawek rzeczywistości). Etap 2. Zbudowanie modelu teoretycznego 1. Dokonanie selekcji ważnych czynników (wysunięcie założeń o zmiennych potencjalnie istotnych). 2. Wysunięcie centralnych hipotez i pomocniczych założeń (zaproponowanie założeń mówiących o charakterze związków łączących zmienne, próba sformuło wania twierdzeń, które mają wyjaśnić zaobserwowane fakty). 3. Dokonanie przekładu na język matematyki (wyrażenie — w miarę możli wości — hipotez w języku matematyki). Etap 3. Wyprowadzenie szczegółowych konsekwencji 1. Wyszukanie racjonalnych ujęć (uporządkowanie konsekwencji, jakie mogą być zweryfikowane). 2. Wyszukanie podstaw empirycznych (postawienie prognoz — na podstawie modelu i danych empirycznych — z uwzględnieniem dostępnych badaczowi tech nik ich weryfikacji). Etap 4. Sprawdzenie hipotez 1. Zaplanowanie sprawdzenia (zaplanowanie sposobów sprawdzania prognoz, zaplanowanie różnego typu działań, takich jak: obserwacje, pomiary, eksperymenty itp.). 2. Wykonanie sprawdzenia (przeprowadzenie odpowiednich działań i zebranie danych). 3. Usystematyzowanie danych (ich klasyfikacja, analiza i ocena ich wartości, wyeliminowanie z pola rozważań danych zbędnych). j. 35 4. Wyprowadzenie wniosków (interpretacja danych w terminach przyjętego modelu teoretycznego). Etap 5. Wprowadzenie do teorii wniosków z badań empirycznych 1. Dokonanie porównania wniosków z prognozami (ocena stopnia, w jakim uzyskane wyniki potwierdzają lub obalają założony model teoretyczny). 2. Zmodyfikowanie modelu (wprowadzenie do modelu pewnych zmian lub nawet zastąpienie go innym). 3. Przedstawienie sugestii dla dalszej pracy (wyszukiwanie luk i błędów w ca łym toku postępowania badawczego, gdy model został obalony oraz poszukiwanie możliwości rozszerzenia modelu, gdy model został potwierdzony). W kolejnej książce: Scientific Research, t.l (1967, s. 9, rys. 1.1) Bunge do- konał zmian w tym schemacie — m. in. skrócił go do 8 etapów, bez wyróżniania „podetapów". Zaprezentowany wyżej schemat jest na tyle ogólny, iż obejmuje różne dyscy- pliny naukowe. Dla takich dyscyplin naukowych, jak psychologia, pedagogika czy socjologia, Townsend (1953, s. 38-39) zaproponował podział procesu badawczego na etapy jako odpowiedzi na następujące pytania: ? 1. Jaki jest problem? 2. Jaka jest hipoteza? 3. Jaka jest zmienna (zmienne) niezależna? 4. Jaka jest zmienna (zmienne) zależna? 5. W jaki sposób ma być mierzona zmienna zależna? 6. Co trzeba kontrolować? 7. Jaka będzie procedura przeprowadzania eksperymentu? a) jakie aparaty będą potrzebne? b) w jaki sposób i w jakiej kolejności planuje się przeprowadzenie ekspe rymentu? c) w jaki sposób będą analizowane rezultaty? 8. Czy będzie można wykorzystać rezultaty tego eksperymentu do przyjęcia lub odrzucenia hipotezy? Czy nie popełniono żadnych błędów? Te dwa przedstawione podziały wystarczą, by zorientować się, jak badacze widzą kolejne kroki rozwiązywania problemu naukowego. Zauważmy, że poważ- nym mankamentem pierwszego schematu (Bunge) jest to, iż zbyt mało uwagi po- święca się w nim analizie układu zmiennych niezależnych potencjalnie istotnych dla danej zmiennej zależnej Y. To samo można powiedzieć o drugim schemacie (Townsend). Oba podziały pomijają pewne ważne etapy oraz nie uwzględniają zachodzących w trakcie badania sprzężeń między określonymi czynnościami ba- dawczymi, wykonywanymi na danych etapach procesu badawczego. Dlatego też w następnym punkcie proponuję nowy podział procesu badawcze- go, któremu podporządkowany będzie wykład całości materiału w tym podręczni- ku. Jest on na tyle szczegółowy, że Czytelnik będzie mógł zgodnie z nim przepro- wadzić swoje pierwsze badania naukowe — czy to przygotowując pracę semina- ryjną, czy przystępując do pisania pracy magisterskiej. 36 5. Struktura procesu badawczego w psychologu (ujęcie własne) Zgodnie z tym, co wyżej powiedziałem proponuję rozbicie procesu badawczego w psychologii na następujące etapy: 1. Sformułowanie problemu badawczego oraz hipotezy badawczej. 2. Określenie obrazu przestrzeni zmiennych (oczywiście — niezależnych Xi,..J(n) istotnych dla zmiennej zależnej Y, czyli skrótowo: O(PY) oraz obrazu struktury przestrzeni zmiennej Y, czyli skrótowo: O(SY). 3. Operacjonalizacja zmiennych. 4. Wybór modelu badawczego: 4a. Model eksperymentalny, 4b. Model korelacyjny. 5. Dobór próby z populacji. 6. Wybór modelu statystycznego: 6a. Model testu t lub ANOVA lub MANOVA, 6b. Model wielokrotnej regresji MR. 7. Akceptacja lub odrzucenie hipotezy. 8. Ocena, interpretacja i generalizacja rezultatu badawczego. W formie graficznej schemat procesu badawczego przedstawiony został na rys. 1.4. Scharakteryzujmy teraz bliżej poszczególne etapy. Etap 1. Badanie naukowe zaczyna się od zwerbalizowania przez badacza pro- blemu naukowego w postaci pytania: „Od jakiej zmiennej niezależnej Xj (zmien- nych: Xu...,Xn), i jak, zależy dana zmienna zależna F?". Pytanie to rodzi się jako rezultat konstatacji pewnych luk w systemie wiedzy, niekonsekwencji stanowisk znajdujących odbicie w literaturze przedmiotu. Badacz może też pokusić się o ustalenie nowych praw, lepiej opisujących prawidłowości zachodzące w otaczającym go świecie. Czytelnik nie powinien oczekiwać od au- tora, iż ten wskaże mu receptę na formułowanie ciekawych poznawczo i wartościo- wych problemów badawczych. Powinien wiedzieć, iż takie czynniki, jak intuicja, znajomość literatury przedmiotu, możliwość prowadzenia dyskusji w gronie osób obeznanych z danym zagadnieniem, wytrwałość w dążeniu do celu mają olbrzymi wpływ na formułowanie ważkich problemów badawczych i znajdowanie dróg ich rozwiązania. Zapoznanie się z arcyciekawą i pouczającą monografią pióra Selyego (Od marzenia sennego do odkrycia naukowego), czy równie ciekawą książką na- pisaną przez Beveridge'a (Sztuka badań naukowych) ukaże Czytelnikowi całą zło- żoność zagadnienia tu poruszonego. Tam też przedstawiono autentyczne przykłady, aczerpnięte z historii nauki, wpadania na ciekawe pytania i ich rozwiązania. Po- lecam także zapoznanie się z nieco trudniejszymi opracowaniami problematyki my- ślenia twórczego w nauce, dokonanymi przez Nęckę (1987, 1994a, 1994b). Do tej problematyki powrócimy jeszcze w rozdz. 8. 37 ki .'li Problem, hipoteza 2 O(Pr) O(Sy) i o Operacjonalizacja zmiennych J Model 4 badawczy t 4a 4b eksperymentaln y korelacyjny 5 Próba 1 / b ł 6 Model statystyczny / b 1 Sa 6b f/ANOVA/ MANOVA wielokrotna regresja | Akceptaqa / odrzucenie hipotezy ł 8 Ocena, interpretacja i generalizacja RB Rys. 1.4. Schemat procesu badawczego Próbując udzielić odpowiedzi na pytanie badawcze (problem badawczy) psy- cholog stara się nie tylko wskazać zmienne, od których zależy interesująca go zmienna zależna Y, ale stara się też określić postać związku (zależności) łączącego zmienną zależną Y ze zmienną niezależną Xj(j= 1, ..., n) lub z wieloma zmiennymi niezależnymi (gdy badacz chce określić łączny wpływ zmiennych Xu ..., Xn na zmienną Y). Owa odpowiedź na pytanie badawcze, to hipoteza badawcza. Jeżeli zadajemy pytanie o postać związku łączącego zmienną zależną i zmien- ną (lub zmienne) niezależną dla niej istotną, to próbując na nie odpowiedzieć ba- dacz będzie też musiał odpowiedzieć na pytanie: Jakie w ogóle zmienne niezależne są istotne dla danej zmiennej zależnej Yl Nie można przecież rozpatrywać wpływu jakiejś zmiennej Xj na zmienną Y nie respektując wpływów innych zmiennych istotnych dla Y. Z chwilą sformułowania tego drugiego pytania badanie wkracza w drugą fazę. Bywa niekiedy i tak, że badacz jest zainteresowany tylko udzieleniem od- powiedzi na pytanie: Jakie zmienne niezależne wpływają (są istotne dla...) na zmienną Yl Tutaj jednak nie będzie nas interesował taki „szczątkowy" proces badawczy. Etap 2. Schemat procesu badawczego w drugiej fazie obejmuje problemy istotnościowe, hipotezy istotnościowe oraz hipotetyczne układy zmiennych nieza- leżnych. Proces badawczy w tej fazie zaczyna się od sformułowania problemu istotnościowego 1.: 1. Jakie zmienne niezależne są istotne dla zmiennej Yl Próbą odpowiedzi na to pytanie jest hipoteza istotnościowa 1. postaci: 1'. Zmienne niezależne Xx, ..., X„ są istotne dla Y. Zbiór zmiennych niezależnych, uznanych przez badacza za istotne dla Y, two- rzy obraz przestrzeni zmiennych istotnych dla Y. Używamy tu sformułowania obraz przestrzeni... [symbolicznie O(PY)], a nie przestrzeń... (symbolicznie: PY) dla odróżnienia tego, co jest ustaleniem — nieko- niecznie trafnym — badacza, od tego, co istnieje rzeczywiście. Mówiąc inaczej, termin „obraz przestrzeni..." jest terminem epistemologicznym, natomiast „prze- strzeń..." jest terminem ontologicznym. Sens tego rozróżnienia, wprowadzonego przez L. Nowaka (Nowak L., 1974, 1977, 1980) w odniesieniu do pary terminów: „przestrzeń wielkości istotnych dla wielkości określanej... — obraz przestrzeni...", jest taki, iż badacz nie zna zbioru zmiennych niezależnych istotnych dla Y. Jedy- nym, co może zrobić, to zmierzać do jak najwierniejszego jego odwzorowania. Tak więc badacz formułując hipotezę 1'. może się mylić, gdyż: (a) wyliczył zbyt mało zmiennych niezależnych de facto istotnych dla Y, (b) wyliczył zbyt dużo zmiennych, a tym samym tylko część z nich jest de facto istotna dla Y. Po utworzeniu O(PY) badacz formułuje problem istotnościowy 2.: 2. Jaki jest porządek istotnościowy w obrębie zmiennych zaliczonych do O(Py)l Hipoteza istotnościowa 2.', będąca próbą odpowiedzi badacza na ten problem, przyjmuje postać następującego sformułowania: 39 2'. Zmienne z O(PY) uporządkowane są — wg relacji „bycia bardziej istotną dla Y niż..." — w następujący sposób... Przyjęcie tej hipotezy wprowadzającej do O(PY) porządek istotnościowy daje w efekcie obraz struktury przestrzeni zmiennej Y (symbolicznie: O(SY)). Zmienne wchodzące do O{SY) mogą oddziaływać niezależnie na Y — mówimy wtedy, że mamy do czynienia z obrazem izolowanej struktury przestrzeni zmiennej Y — bądź mogą wchodzić one ze sobą w interakcje i łącznie wpływać na zmienną Y i mówimy wówczas o obrazie interakcyjnej struktury przestrzeni zmiennej Y. Dla ich odróżnienia używam następujących oznaczeń: Otz{SY) — obraz izolowanej struktury..., Oi„{Sy) — obraz interakcyjnej struktury..., * w o« ?oąui 5 b, c a, X, (a) (b) Uys. 1.5. Wykres obrazujący brak interakcji (rys. a) między zmiennymi Xt i X2oraz wykres obrazujący występowanie interakcji między zmiennymi X, i X2 (rys. b) Co to znaczy, że zmienne wchodzą ze sobą w interakcje? Wedle Ackoffa (1969, s. 309-391): „dwie zmienne są w interakcji, jeśli wpływ, który jedna z nich ma na zależne od niej zjawisko, zależy od wartości, jakie przyjmuje druga zmienna". Mówiąc inaczej, interakcja dwóch zmiennych jest miarą ich współzależności. Wyobraźmy sobie, że dla danej zmiennej Y istotne są tylko dwie zmienne X, i X2. Każda z nich przyjmuje dla osób badanych następujące wartości: v(X,) = {a,, a2} i v(X2) = {bt, b2}. Prostym efektem działania zmiennej Xx na Y nazywamy jej od- działywanie na zmienną Y, gdy druga zmienna X2 przyjmuje jedną z dwóch war- tości. Tak więc można tu mówić o dwóch efektach prostych zmiennej Xu jednym przy wartości bx i drugim przy wartości b2 zmiennej X2. Sumę efektów prostych zmiennej X] lub X2 określa się mianem efektu głównego zmiennej X\ lub X2. Mo- żemy powiedzieć, iż zmienne Xx i X2 wchodzą ze sobą w interakcję, jeżeli ich proste efekty różnią się, jeżeli natomiast ich efekty proste są sobie równe — in- terakcja Xi X2 jest zerowa (Oktaba, 1966, s. 232). Rys. 1.5 ilustruje powyższe s nia rozważania. Trzeba zaznaczyć, iż w taki właśnie sposób określa się pojęcie inter- akcji w układzie czynnikowym analizy wariancji ANOVA (bliżej o pojęciu inter- akcji zmiennych oraz pojęciu efektu prostego por. Brzeziński, Stachowski, 1984, -,. 191-200) stanowiącym statystyczną podstawę współczesnego eksperymentowa- (por. etapy: 4a i 6a procesu badawczego). W psychologii mamy wiele przypadków interakcyjnych obrazów struktur przestrzeni zmiennej Y. Rozważa się np. efekt współdziałania określonych elemen- tów sytuacji z pewnymi cechami osobowości człowieka (jest to program teorety- czny i metodologiczny tzw. psychologii interakcyjnej bUÓPWPJpflfflMfflMS-ma i Endlera; por. Magnusson, Endler, 1977; Endler, Maenussoii 1976- Mac nusson, 1981; Endler, 1983). Dalej, na podstawie zajścia bądź niezajścia interak| :y zmiennymi w badaniach nad sposobem integrowania informacji przez ba-anych stwierdza się, iż integrują oni informacje w sposób konfiguracyjny lub a dytywny (Stachowski, 1976). I trzeci przykład, inteligencja człowieka kształtuje Jb efekt interakcji dwóch czynników - genotypu („tego co wrodzone") środoW1ska („tego co nabyte") (Seligman, 1995). Zresztą do badania oddziały-dziedziczności i środowiska na ludzkie zachowania stosuje się takie modele tystycznejaknp ANOVA, które umożliwiają określanie procentowego udziału interakcji obu czynników w wyjaśnianiu zmienności zmiennej zależnej Y (por Wahlsten, 1990). Trzeci z problemów istotnościowych sprowadza się tedy do pytania: 3. Jaki jest rodzaj obrazu struktury przestrzennej zmiennej Y? Odpowiedź na nie, w postaci trzeciej hipotezy istotnościowej brzmi: 3'a. O(Sy) jest interakcyjny — Oin (Py), r 3'b. O(Sy) jest izolowany — Oiz (Pr). Układ powiązań zachodzących między tymi trzema problemami i hipotezami istotnościowymi — „wypełniającymi" etap drugi badania naukowego — przedsta- wiony został na rys. 1.6. ETAP 2. Problem 3. Hipoteza 3. 4 Problem 2. Hipoteza 2. Ł Problem 1. Hipoteza 1. O,(SY> O(PY) O(SY) O,„(Sy) OeiSy) . \.6. Problemy i hipotezy istotnościowe 41 rozważania. Trzeba zaznaczyć, iż w taki właśnie sposób określa się pojęcie inter- akcji w układzie czynnikowym analizy wariancji ANOVA (bliżej o pojęciu inter- akcji zmiennych oraz pojęciu efektu prostego por. Brzeziński, Stachowski, 1984, s. 191-200) stanowiącym statystyczną podstawę współczesnego eksperymentowa- nia (por. etapy: 4a i 6a procesu badawczego). W psychologii mamy wiele przypadków interakcyjnych obrazów struktur przestrzeni zmiennej Y. Rozważa się np. efekt współdziałania określonych elemen- tów sytuacji z pewnymi cechami osobowości człowieka (jest to program teorety- czny i metodologiczny tzw. psychologii interakcyjnej budowanej przez Magnus- sona i Endlera; por. Magnusson, Endler, 1977; Endler, Magnusson, 1976; Mag- nusson, 1981; Endler, 1983). Dalej, na podstawie zajścia bądź niezajścia interakcji między zmiennymi w badaniach nad sposobem integrowania informacji przez ba- danych stwierdza się, iż integrują oni informacje w sposób konfiguracyjny lub addytywny (Stachowski, 1976). I trzeci przykład, inteligencja człowieka kształtuje się jako efekt interakcji dwóch czynników — genotypu („tego co wrodzone") i środowiska („tego co nabyte") (Seligman, 1995). Zresztą do badania oddziały- wań dziedziczności i środowiska na ludzkie zachowania stosuje się takie modele statystyczne, jak np. ANOVA, które umożliwiają określanie procentowego udziału interakcji obu czynników w wyjaśnianiu zmienności zmiennej zależnej Y (por. Wahlsten, 1990). Trzeci z problemów istotnościowych sprowadza się tedy do pytania: 3. Jaki jest rodzaj obrazu struktury przestrzennej zmiennej F? Odpowiedź na nie, w postaci trzeciej hipotezy istotnościowej brzmi: 3'a. OiSy) jest interakcyjny — Oin (PY), 3'b. O(Sy) jest izolowany — Oiz (PY). Układ powiązań zachodzących między tymi trzema problemami i hipotezami istotnościowymi — „wypełniającymi" etap drugi badania naukowego — przedsta- wiony został na rys. 1.6. * . ETAP 2. Problem Hipoteza 3. 3. 4 i ! Problem 2. Hipoteza 2. Problem 1. Hipoteza 1. i 1 i S N O(PY) O(SY) O,(SY) Rys. 1.6. Problemy i hipotezy istotnościowe 41 Przyjęcie przez badacza jednej z dwóch postaci hipotezy 3'. — a lub b daje w efekcie określony rodzaj O(SY)- Po jego określeniu badanie wchodzi w fazę następną. Etap 3. Poprzez nadanie zmiennym (które mają jeszcze status zmiennych teo- retycznych) określonego sensu empirycznego dokonany zostaje — używając termi- nologii Carnapa (1959, s. 38) — przekład z języka teoretycznego (ang. theoretical language) na język obserwacyjny (ang. observational language). Czynność tę okre- ślam mianem operacjonalizacji zmiennych. Problematyce operacjonalizacji zmiennych, ze szczególnym zwróceniem uwagi na oryginalną koncepcję autorstwa Elżbiety Hornowskiej (1989), poświęcony jest rozdz. 7. Operacjonalizacja zmiennych wymaga, jak nietrudno się domyśleć, zasto- sowania narzędzi pomiarowych, ze względu na które poszczególne zmienne będą operacjonalizowane. Będą to bądź narzędzia już gotowe — np. testy psychologicz- ne, aparatura laboratoryjna — bądź też specjalnie dla danego badania konstruowane czy tylko standaryzowane. Ogólne zasady konstrukcji, standaryzacji i adaptacji kulturowej najczęściej sto- sowanych przez psychologów narzędzi, jakimi są testy psychologiczne, omawiam w części V (rozdz. 15.-20.). Etap 4. Z hipotezy badawczej wyprowadza się następnie dostępne obserwacji konsekwencje, formułuje się prognozy. One to będą podlegały bezpośredniemu sprawdzaniu empirycznemu poprzez porównanie z faktami. Przystępując do zaplanowania badania empirycznego nastawionego na spraw- dzenie hipotezy badawczej psycholog musi odwołać się do jakiegoś modelu badaw- czego — co stanowi treść etapu 6. badania naukowego. Tradycyjnie już — za Cronbachem (1957, 1975) — wyodrębniam dwie klasy modeli badawczych: pierw- szą, obejmującą te modele, które zakładają manipulację zmiennymi niezależny- mi istotnymi dla Y i tradycyjnie określane są mianem jmodeli eksperymentalnych (etap 4a) oraz drugą, obejmującą te modele, które nie zakładają manipulacji zmien- nymi i określane są mianem modeli korelacyjnych czy regresyjnych (por. Cohen, Cohen, 1983). We wprowadzeniu do części IV oraz na rys. IV. 1. dokładniej poka- załem, jakie to odmiany modeli badawczych stosowane są w praktyce badawczej psychologii. W rozdz. 12.-14. omawiam podstawowe odmiany trzech modeli badawczych. Etap 5. Kolejnym krokiem, który badacz musi wykonać jest dobór próby z populacji. To właśnie na próbie psycholog przeprowadza określoną procedurę sprawdzania hipotez, wyprowadzoną bądź z modelu eksperymentalnego (etap 4a), bądź z modelu korelacyjnego (etap 4b). Aby próba mogła być uznana za w pełni reprezentatywną musi ona być po- brana z populacji w sposób losowy. Inne sposoby wyłaniania próby z populacji prowadzą do tego, że uzyskany rezultat badawczy będzie obciążony większym lub mniejszym błędem. Zagadnieniom tym poświęcam odrębny rozdz. 9., w którym omawiam podsta- wowe techniki doboru próby (nie tylko losowego) z populacji stosowane w prakty- ce badawczej psychologów. 42 Po zakończeniu badań empirycznych badacz przystępuje do porządkowania zebranych danych. Dokonuje ich tabelaryzacji, prezentacji graficznej na wykresach oraz opisu w języku statystyki opisowej. Piszę o tym w rozdz. 10. Etap 6. Po uporządkowaniu danych psycholog musi dokonać wyboru modelu statystycznego, w ramach którego testowane będą hipotezy. Ten etap badania sprzężony jest z etapem 4. I tak, modelowi eksperymentalnemu badań (etap 4a) odpowiadają modele statystyczne (etap 6a): model testu t (albo modele tes- tów nieparametrycznych), model ANOVA, model MANOVA. Z kolei mo- delowi korelacyjnemu (etap 4b) odpowiada model statystyczny (por. Cohen, Co- hen, 1983) wielokrotnej regresji/korelacji (ang. multiple regression /correlatiori) (etap 4b). Problemy metodologiczne związane z testowaniem hipotez (za pomocą testów istotności oraz przedziałów ufności) omawiam w rozdz. 11. Etap 7. Na tym etapie procesu badawczego badacz musi podjąć decyzję do- tyczącą tego, czy sprawdzaną hipotezę można uznać za potwierdzoną czy też za nie potwierdzoną. W przypadku drugiej odpowiedzi, badanie można uznać za za- kończone niepowodzeniem — w tym sensie, że hipoteza, do której badacz się przywiązał nie uzyskała w świetle danych empirycznych wystarczającego potwier- dzenia. Może jednak być i tak, że opisywana w hipotezie zależność Y od X miała miejsce, ale błędy metodologiczne popełnione przez badacza uniemożliwiły jej wy- dobycie na światło dzienne. Badacz nie powinien tedy, bez zastanowienia, od razu odrzucać sprawdzanej hipotezy, ale powinien spróbować przeanalizować krytycznie cały tok postępowania badawczego pod kątem ewentualnych błędów warsztatowych, których naprawienie być może dałoby inny rezultat badawczy i sprawdzana hipoteza „obroniłaby się". Tak czy inaczej, akceptacja hipotezy lub jej odrzucenie kończy ten etap postępo- wania badawczego i badanie wchodzi w ostatni, ósmy etap. Etap 8. Ostatnie pytania, na które badacz musi odpowiedzieć, by zakończyć proces badawczy, to pytania o: (a) Jakość metodologiczną przeprowadzonego badania Krytyczna ocena strony metodologicznej procesu badawczego powinna skłonić badacza do wnikliwego przeanalizowania czynności badawczych wykonanych na poprzednich etapach badania naukowego. O tym, że badacz powinien cofnąć się do wcześniejszych etapów procesu badawczego i wprowadzić do nich istotne ko- rekty, informują go zaznaczone na rys. 1.4. sprzężenia zwrotne oznaczone nume- rami: 1-6. Najbardziej brzemienne i najdalej idące ingerencje w proces badawczy, zmieniające cały jego przebieg, związane są ze zmianami: (a) treści hipotez badaw- czych oraz (b) budowy O(Py) i O(SY). Są to ingerencje w etap 1. i 2. Kolejne ingerencje dotyczą etapów: 3.-6. Cofanie się do wcześniejszych etapów badania naukowego może nie zakoń- czyć się na przejściu tylko jednego cyklu badawczego. Może być ich więcej, przy czym kolejne cykle mogą być realizowane przez innego badacza. Tak też najczę- ściej bywa. 43 (b) Znaczenie psychologiczne uzyskanego rezultatu badawczego W tym miejscu badacz musi odwołać się do teorii, w języku której sfor- mułowane zostały problem badawczy i hipoteza badawcza oraz zdefiniowane zo- stały zmienne. Posługując się tym językiem (dokładniej, jest to język Teorii Ba- danego Obiektu, TBO — por. rozdz. 3., pkt. 3.) psycholog ocenia znaczenie uzy- skanego rezultatu badawczego — po pierwsze, dla rozbudowy (lub zakwestio- nowania) danej teorii psychologicznej oraz po drugie, dla praktyki psychologicz- nej, która będzie nadbudowana na uzyskanym rezultacie badawczym (por. rozdz. 2.). (c) Zasięg wniosków, które sformułował po zakończeniu badania Jeśli chodzi o pkt (c), to jest to — inaczej mówiąc — problem generalizowal- ności wniosków z badania. Zagadnienie to wiąże się z problemem tzw. trafności zewnętrznej badania (por. rozdz. 3., pkt. 2.2.). Planując badanie empiryczne badacz powinien zdawać sobie sprawę z faktu, iż nie jest w stanie, z powodu ograniczeń ekonomicznych i technicznych, przebadać całej populacji, ale tylko pewien jej frag- ment, tzn. próbę. Jednakże wnioski chce rozciągnąć na całą populację. Aby to było możliwe, próba musi być reprezentatywna dla danej populacji. Zakres wniosków zależy także od przyjętych przez badacza procedur manipu- lowania zmiennymi. Jak Czytelnik może się przekonać na podstawie lektury rozdz. 12. (pkt. 2.2.1), niektóre procedury, jak np. ustalanie stałego podzakresu wartości zmiennych, bardzo ograniczają zasięg wniosków (inaczej: ograniczają wielkość po- pulacji, na którą mogą być uogólnione). 6. Między „odkryciem" a „uzasadnieniem" Współczesna praktyka badawcza, charakteryzująca psychologię i inne spo- krewnione z nią dyscypliny naukowe, takie jak: pedagogika czy socjologia, a na- wet, w pewnym zakresie, psychiatria, zaciera różnice między stosowanymi przez badaczy procedurami dochodzenia do określonego rezultatu badawczego i proce- durami empirycznego potwierdzania (uzasadniania) tego rezultatu. Zaczęło to być bardzo widoczne, zwłaszcza w latach sześćdziesiątych i siedemdziesiątych (a w Polsce w latach osiemdziesiątych), gdy stosunkowo łatwo dostępne stało się bogate oprogramowanie w zakresie wielozmiennowych modeli statystycznych, takich jak wielokrotna korelacja/regresja (por. rozdz. 13.), jednozmiennowa analiza wariancji ANOVA (por. Brzeziński, Stachowski, 1984), wielozmiennowa analiza wariancji MANOVA (por. Aranowska, 1987), analiza skupień (por. Marek, 1989), skalowa- nie wielowymiarowe (por. Bielą, 1992, 1995), analiza kanoniczna (por. Nosal, 1987) czy analiza czynnikowa (por. Zakrzewska, 1994), adresowane wprost do badacza, np. psychologa. Mam tu na myśli zwłaszcza takie biblioteki programów statystycznych, jak: SPSS PC+, SYSTAT, CSS STATISTICA. Te pakiety statysty- czne doczekały się już omówień adresowanych do przedstawicieli określonych grup użytkowników (w Polsce mogę wskazać na pracę Wywiała, 1994, a z publikacji amerykańskich — na pracę Heddersona, 1991; obie dotyczą pakietu SPSS PC+). Wskazane wyżej wielozmiennowe modele statystyczne walnie przyczyniły się do wzbogacenia warsztatu badawczego i to nie tylko w zakresie istotnego posze- rzenia środków technicznych związanych z procedurami sprawdzania hipotez, ale także (a nawet przede wszystkim) z możliwościami formułowania nowych hipotez, które stały się „testowalne" w laboratorium badacza. Przed „erą" wielowymiarowych modeli statystycznych (dla ich „panoramicz- nego" przeglądu — por. Brzeziński, 1987) niepodzielnie panowały bądź testy istot- ności różnic, odwołujące się do porównań dwugrupowych, takich jak w prezento- wanych w rozdz. 12. planach eksperymentalnych typu „wszystko albo nic" (test t, test z, test x2' test Manna-Whitneya itp.), bądź współczynniki korelacji dwu- zmiennych (współczynnik r-Pearsona, współczynnik rs -Spearmana, współczynnik rjf-Kendalla) i współczynniki siły związku między dwiema zmiennymi (współczyn- nik LOGICZNY^ (a) \-/ ^ Rys 2.3. Obieg informacji między sferą praktyki społecznej i sferą praktyki badawczej Podejmowane postępowanie realizujące nadbudowane na nowej teorii dyrekty- wy praktycznego działania musi jeszcze być sprawdzone pod kątem etycznej dopu- szczalności. Chodzi o to, aby pomagając jednocześnie nie szkodzić. Aby, odwołu- jąc się do przykładu, nowa metoda postępowania z dziećmi nie wyzwalała u nich stanów lękowych, frustracji, zagrożenia ich poczucia własnej wartości. Zatem jesz- cze jeden filtr włączony w obieg informacji, filtr etyczny (por. blok 6.). Pozytywny wynik dopuszcza nową propozycję do upowszechnienia w danym obszarze praktyki społecznej. Negatywne wyniki wszystkich filtrów względnie tylko jednego z nich, „cofa- ją" nas znowu do bloku 2. Ponownie aktualne staje się pytanie o nowe propozycje programu działania bardziej efektywnego od dotychczas obowiązującego. Wyżej naszkicowany obieg informacji można by nazwać normalnym. Jednak obok normalnego obiegu informacji w praktyce spotykamy się z jego wypaczeniami. Owe wypaczenia polegają bądź na pominięciu któregoś z filtrów (co na rys. 2.3 ilustrują linie a, b, c), bądź na wprowadzeniu dodatkowego, czwar- tego filtru (linia d do bloku 7.). I tak, nowa propozycja teoretycznego ujęcia danego zjawiska może być od razu (poza filtrem metodologicznym) wykorzystana jako podstawa zaprogramowania działań praktycznych (linia a), które bez uprzedniego sprawdzenia ich skuteczności (pominięcie filtru prakseologicznego) mogą być „od razu" wprowadzone do sfery praktyki społecznej (linia b). Takie przyspieszone postępowanie może — wbrew nadziejom psychologa — zakończyć się fiaskiem. 61 Także w przypadku uwzględnienia filtru metodologicznego, a opuszczenia filtru prakseologicznego może okazać się, że mimo dobrej podstawy teoretycznej pro- gram działania okazał się nieefektywny, gdyż wadliwie przełożono twierdzenia teorii na dyrektywy praktycznego działania. Uwzględnienie filtru prakseologicznego zapobiegłoby upowszechnieniu wadliwego programu działania. Wreszcie — linia c — program działania nie poddany „atestacji etycznej" może doprowadzić do tego, że psycholog (lub inny realizator ze sfery praktyki społecznej) chcąc pomagać będzie jednocześnie szkodził — jego działania będą odbierane lękowo, będą wy- zwalały frustracje, czy zagrażały jego poczuciu własnej wartości. Takie jatrogenne działanie jest, rzecz jasna, nie do zaakceptowania. Wypaczenia obiegu informacji, jego patologizacja, mogą być związane nie tylko z wypadnięciem jednego, dwóch lub wszystkich trzech filtrów. W systemach totalitarnych w obieg informacji między sferę praktyki społecznej i sferę praktyki badawczej wprowadzony jest jeszcze dodatkowy filtr, któremu przypisywana jest rola cenzorska. Jest to filtr ideologiczny. To on w instancji ostatecznej „decyduje" 0 tym, czy dany program (bez względu na wyniki filtrów: metodologicznego, pra kseologicznego i etycznego) będzie upowszechniony czy też nie. Jakie z tego tytułu konsekwencje ponosi społeczeństwo pozostające w okowach rządów totalitarnych, nie trzeba tutaj pisać. Wystarczy wspomnieć o losach genetyki w ZSRR ery stali nowskiej, losach fizyki „niearyjskiej" w III Rzeszy, czy o losach wyników badań społecznych nie respektujących dogmatu marksistowsko-leninowskiego w krajach opartych na rządach komunistycznych. To wypaczenie ilustruje na rys. 2.3 linia d 1 blok 7. Przystępując do realizacji jakiegoś projektu badawczego badacz podlega omó- wionym wyżej uwarunkowaniom, nie może się od nich uwolnić. Jest w jakiejś mierze zaprogramowany społecznie. Nie można tedy w pełni zrozumieć postępowania badacza w trakcie realizacji procesu badawczego, zrozumieć podejmowanych przez niego decyzji badawczych, jeżeli nie spojrzy się na niego jako na uczestniczącego (z jednej strony biernie, bo przyjmującego zalecenia praktyki społecznej, a z drugiej strony czynnie, bo stara- jącego się zmienić stan praktyki społecznej) w opisanym wyżej obiegu informacji. W szczególności jednak praktyka społeczna — co pokazane zostanie w następnym rozdziale — oddziałuje na badaczy modyfikując ich stan świadomości metodologi- cznej. 6. Podsumowanie W niniejszy rozdziale ukazane zostały powiązania między sferą praktyki społecz- nej, w jakiejś mierze obsługiwaną przez psychologię, jako dostarczającą jej efe- ktywnych metod umożliwiających sprawne funkcjonowanie, oraz sferą praktyki ba- dawczej, „wymyślającej" (i sprawdzającej) nowe teorie i nowe metody działania — z inspiracji praktyki społecznej. Naszkicowane tu ujęcie powiązań obu tych sfer 62 zrywa z zakorzenionym w środowisku psychologów-praktyków przekonaniem, iż dla prawidłowej „obsługi" praktyki społecznej niezbędne jest powołanie, obok psy- chologii akademickiej (mało przydatnej, bo oderwanej od życia; por. Straś-Roma- nowska, 1992), psychologii stosowanych (wielu!). Zgodnie jednak z prezentowa- nym w tej książce stanowiskiem istnieje tylko jedna psychologia o wielu prakty- cznych zastosowaniach, w różnych dziedzinach życia społecznego. Czytelnikowi zainteresowanemu poznaniem innych ujęć rozważanego, na gruncie psychologii, problemu „teoria a praktyka" polecam następujące opracowa- nia: Kowalik S. Upośledzenie umysłowe. Teoria i praktyka rehabilitacji; Kowalik S. i Sęk H. Psychologia kliniczna i psychologia społeczna — pojęcia, przedmiot i wzajemne związki; Tomaszewski T. Wstęp do psychologii, rozdz. 5.: Psychologia jako nauka społecznie użyteczna; Franus E. Struktura i ogólna metodologia nauki ergonomii, część III., pkt. VIII. Zasada integracji teorii z praktyką. ? Rozdział 3. Wewnętrzne determinanty w*** procesu badawczego (I) — * wpływ świadomości metodologicznej w ^ na rezultaty procesu badawczego 1. Wprowadzenie Empiryczne badania psychologiczne w większości przypadków realizowane są — tak, jak to przed laty pokazał Cronbach (1957, 1975) — w dwóch nurtach: (a) eksperymentalnym, (b) korelacyjnym. W opracowaniach metodologicznych mówi się o modelowych ich uję- ciach (mniej lub bardziej wyidealizowanych). W rozdziałach: 12., 13. i 14. mode- le te zostaną dokładnie przedstawione. Zakładają one pewną standardową postać procesu badawczego (por. rozdz. 1.), który powinien być odtwarzany — krok po kroku — przez psychologa, aby zminimalizować obciążenie uzyskanych re- zultatów badawczych wywołane pominięciem lub niezbyt dokładnym (czy na- wet złym) wykonaniem elementów szeroko pojętej, standardowej procedury badawczej — owego wzorca „umieszczonego" w świadomości metodologicznej psychologów. Trzeba jednak pamiętać, że źródłem artefaktów w badaniach psychologicznych jest nie tylko metodologiczna (w sensie rzeczywistego stanu społecznej świadomo- ści metodologicznej — por. Kmita, 1976) niedoskonałość psychologii jako dyscy- pliny naukowej. Drugim niezmiernie ważnym źródłem artefaktów są wskazane w klasycznej już dziś pracy Rosenzweiga (1993; por. także: rozdz. 4., pkt. 2.) osob- liwości odróżniające badanie psychologiczne od analogicznych badań fizycznych, biologicznych czy chemicznych. Wreszcie, rezultaty badania psychologicznego mogą ulegać daleko idącej transformacji zmieniającej ich pierwotny sens wówczas, gdy są „odczytywane" przez reprezentantów instytucji społecznych, które są zainteresowane ich wykorzy- staniem jako podstawy (naukowej!) do podejmowania określonych działań prakty- cznych. Owe wyniki legitymizują podejmowane przez instytucję decyzje, zwłaszcza wówczas, gdy nie mogą one liczyć na popularność w społeczeństwie. Instytucje takie mogą też czuć się uprawnione do takich interpretacyjnych manipulacji zwłaszcza wówczas, gdy to one sponsorowały owe badania psychologiczne. Także 64 sam badacz może ulec „czarowi" instytucji sponsorującej prowadzone przez niego badania, i przeprowadzić je tak (niekoniecznie uświadamiając to sobie), aby ich rezultaty nie rozminęły się ze znanymi mu oczekiwaniami instytucji. O tym pisałem dokładniej w poprzednim rozdziale (rozdz. 2.). Aspekty etyczne tego zagadnienia poruszone są w rozdz. 6., pkt. 2. W tym zaś rozdziale chciałbym położyć nacisk na te elementy świadomości metodologicznej (i ich wzajemne powiązania), które — jak mi się wydaje — od- grywają szczególną rolę w powstawaniu wspomnianych wyżej obciążeń czy arte- faktów. Chciałbym też zwrócić uwagę na zniekształcające — i intencje badacza, i uzyskane przez niego rezultaty badawcze — oddziaływanie kontekstów (innych niż kontekst świadomości metodologicznej), w których „zanurzone" są zarówno czynności badawcze (dochodzenie do rezultatu badawczego czy, inaczej mówiąc, do rozwiązania problemu badawczego), jak i czynności związane z aplikacją rezul- tatu badawczego (przeniesienie przetworzonego, ale nie przez badacza (!), rezultatu badawczego z laboratorium do praktyki społecznej). W tym miejscu będą one tylko umieszczone w ogólnym schemacie; ich dokładniejsze omówienie znajdzie Czytel- nik w innych rozdziałach tej części. 2. Trafność badania psychologicznego Analizując postępowanie badawcze psychologa możemy próbować poszukać odpo- wiedzi na dwa, jak się wydaje, bardzo podstawowe pytania. Odpowiedź na nie przesądza bowiem o wartości poznawczej i praktycznej uzyskanego przez psycho- loga rezultatu badawczego (dalej RB)1. ? 2.1. Trafność wewnętrzna Pierwsze pytanie związane jest z wyborem procedury badawczej (obejmującym istotne jej elementy), umożliwiającej dokonanie trafnej oceny sformułowanej przez badacza hipotezy, jako odpowiedzi na postawiony problem badawczy. Pytanie to zatem dotyczy „logiki procesu badawczego", a dokładniej, związane jest z obowią- zującym w danej dyscyplinie naukowej (empirycznej) standardem realizacji procesu badawczego, a także aspektów treściowych podejmowanych przez psychologa de- cyzji związanych z wyborami określonych rozwiązań metodologicznych w poszcze- gólnych krokach procesu badawczego (tzw. węzłach decyzyjnych). Owe wybory przesądzać będą, w ostatecznej instancji, o tym, czy uzyskany przez psychologa RB będzie mógł stanowić podstawę (empiryczną) zaakceptowania merytorycznie Na końcu tego rozdziału zamieszczony został — dla wygody Czytelnika — wykaz skrótów, którymi posługuję się tu. 5 — Metodologia badań. 65 poprawnej (trafnej) hipotezy lub podstawę jej odrzucenia, gdyby ona sama okazała się nietrafna. Odwołajmy się do prostej ilustracji empirycznej. Otóż w psychologii znane jest tzw. prawo Yerkesa-Dodsona mówiące o nieliniowej zależności, „U"-kształtnej, między poziomem wykonania jakiegoś zadania oraz poziomem aktywacji (moty- wacji) podmiotu je wykonującego. Zgodnie z tym prawem, wraz ze wzrostem, ale do pewnego optymalnego punktu, poziomu aktywacji organizmu zwiększa się po- ziom wykonania zadania (mierzony, na przykład, liczbą popełnionych błędów). Jednakże po przekroczeniu tegoż optimum poziomu aktywacji, dalszy jego wzrost powoduje spadek poziomu wykonania zadania. Gdybyśmy zaplanowali ekspery- mentalne potwierdzenie tej hipotezy i zaprojektowali badanie wedle jednego z kla- sycznych planów „zero-jeden" (takich jak omówione w rozdz. 12., pkt. 5.), to okazałoby się, że — w zależności od doboru dwóch wartości poziomu aktywacji: „niższego" i „wyższego" — albo potwierdzilibyśmy hipotezę o zależności liniowej (rosnącej lub malejącej), albo też obalilibyśmy hipotezę o jakimkolwiek związku — liniowym czy krzywoliniowym. Rzecz jasna, brak wiedzy badacza na temat ograniczeń zastosowań tych planów eksperymentalnych do empirycznego spraw- dzania wyłącznie hipotez o zależnościach liniowych powoduje, że przeprowadzone przez niego badanie empiryczne nie będzie mogło dostarczyć RB przesądzającego 0 trafności hipotezy, nawet gdy jest ona de facto prawdziwa. Inny przykład dotyczy wyboru miary związku między zmienną niezależną 1 zmienną zależną. Wybór współczynnika determinacji (r2) opartego na współczyn niku korelacji liniowej w sytuacji, gdy dane empiryczne wykazują wyraźny trend krzywoliniowy, może doprowadzić do bardzo znacznego niedoszacowania badanej zależności. Właściwy w takiej sytuacji byłby albo wybór wskaźnika eta-kwadrat {rj1), albo postępowanie oparte na analizie składowych regresyjnych (por. rozdz. 12., pkt. 7. oraz rozdz. 13., pkt. 4.). W tym przykładzie mieliśmy sytuację, w której mimo wyboru trafnego planu badawczego, umożliwiającego testowanie hipotez tra ktujących o zależnościach nieliniowych, „niedouczenie" statystyczne badacza spo wodowało, że nie doszacował on (i to znacząco!) siły związku między zmienną niezależną a zmienną zależną. Przykłady można by mnożyć, ale — jak sądzę — te dwa dobrze ilustrują typ błędów, o których tu piszę. Zauważmy jeszcze, że czym innym jest trafna /nietrafna (w sensie opisywa- nia faktycznej zależności) hipoteza sformułowana przez badacza, jako — na grun- cie jego wiedzy — najbardziej prawdopodobna odpowiedź na pytanie badawcze, a czym innym jest trafna/nietrafna (w wyżej wyłożonym sensie) procedura ba- dawcza umożliwiająca/uniemożliwiająca potwierdzenie/odrzucenie hipotezy ba- dawczej. Ponadto, prowadząc badanie stwarzające metodologiczne warunki do potwier- dzenia /odrzucenia trafnej /nietrafnej hipotezy, badacz mimo wszystko może podjąć decyzję — w efekcie błędnego zinterpretowania RB - błędną bo: (a) nakazującą odrzucenie prawdziwej (trafnej) hipotezy — błąd typu A, (b) nakazującą akceptację fałszywej (nietrafnej) hipotezy — błąd typu B. 66 Trudno z kolei określić rodzaj błędu popełnianego przez psychologa prowadzącego badanie nietrafne, a tym samym uniemożliwiające uzyskanie trafnego RB (chyba że przez przypadek). Mogą wystąpić dwie takie sytuacje: (1) testowanie trafnej hipotezy w warunkach badania psychologicznego cechu jącego się brakiem trafności, oraz (2) testowanie nietrafnej hipotezy w warunkach badania cechującego się bra kiem trafności. Ciąg: I. hipoteza — II. badanie empiryczne — III. RB — IV. decyzja, ;órego ogniwa poddane są ocenie „zero-jedynkowej" (trafne versus nietrafne) zo- stał przedstawiony na rys. 3.1. Stan metodologicznie i psychologicznie „pożądany" pokazują ścieżki nakreślone pogrubioną linią. ^HIPOTEZA II. BADANIE TRAFNE NIETRAFN E - TRAFNE NIETRAF NE - III. REZU LTAT B A D A W C Z Y [ R B ] -? TRAFNY ->? ? -? TRAFNY IV. DECYZJA TRAFNA [akceptacj a trafnej hipotezy] BŁĄD A [odrzuceni e trafnej hipotezy] TRAF NA [odrzuceni e nie- trafnej hipotezy] BŁĄD B [pozostawi enie nietrafnej hipotezy] Rys. 3.1. Cztery rodzaje trafności występujące w badaniu psychologicznym: I. Trafność hipotezy, n. Trafność badania empirycznego, III. Trafność RB, IV. Trafność decyzji badacza Opisany wyżej rodzaj trafności badania psychologicznego nazwiemy trafnością wewnętrzną2. Za badanie trafne wewnętrznie będziemy zaś uznawać badanie prze- prowadzone w sposób umożliwiający uzyskanie prawdziwej odpowiedzi na sfor- Nawiazuję tu do pojęcia internat validity (trafność wewnętrzna) wprowadzonego w pracy Campbella (1957) i rozwiniętego w pracach Campbella i Stanleya (1963) oraz Cooka i Campbella (1979). Wprowadzone przez Campbella rozróżnienie między trafnością wewnętrzną i trafnością zew- nętrzną spotkało się nie tylko z aprobatą — choć ta w efekcie przeważyła — ale też z uwagami krytycznymi (por. Kruglanski, Kroy, 1975; Hultsh, Hickey, 1978), które, jak mi się wydaje, Cook i Campbell przekonywająco odparli (1979, s. 85-94). 67 mułowane przez badacza pytanie (umożliwiające rozwiązanie problemu badawcze- go). Inaczej mówiąc, badanie trafne wewnętrznie stwarza możliwość uzyskania po- twierdzenia hipotezy, jeżeli jest ona prawdziwa, i jej odrzucenia, jeżeli jest ona fałszywa. 2.2. Trafność zewnętrzna Przejdźmy teraz do pytania drugiego. Załóżmy na początek, że psycholog przeprowadził trafne wewnętrznie badanie empiryczne i podjął, także trafną, decyzję dotyczącą hipotezy badawczej. I co da- lej? Otóż powinien on teraz uogólnić (zgeneralizować) RB (dokładniej: treść hipo- tezy potwierdzonej w badaniu empirycznym) na wszystkie te elementy populacji (najczęściej populacja obejmuje zbiór osób o znanych badaczowi właściwościach), które reprezentowane były w próbie, na której przeprowadzono właściwe badanie empiryczne testujące hipotezę badawczą. Taki jest zresztą sens prowadzenia badań na reprezentatywnych próbach (o stosunkowo niewielkich liczebnościach) pobiera- nych z populacji obejmujących dużo osób i przez to trudnych (technicznie czy ekonomicznie) do objęcia danych badaniem. Generalizowaniu podlegają także ele- menty sytuacji badania (wytworzone przez badacza w laboratorium), w której w określony sposób zachowują się osoby badane wchodzące w skład próby. Zakłada się przy tym milcząco, że elementy sytuacji badania stanowią uproszczony, ale w miarę wierny, obraz realnej sytuacji życiowej. Dlatego też (np. Aronson i inni, 1994, s. 58) mówi się o: (1) realizmie psychologicznym (psychological realism) i (2) realizmie życiowym (mundane realism), którymi powinien być nacechowany każdy eksperyment przeprowadzony przez psychologa (o czym dokładniej w rozdz. 12., pkt. 2.5.). Generalizowanie wniosków z poziomu próby na poziom populacji jest uzasa- dnione wówczas, gdy zmienne niezależne zaliczone przez badacza do obrazu prze- strzeni zmiennych istotnych dla zmiennej zależnej, tj. O{PY), będą przyjmowały dla elementów (osób) z próby wartości z tych samych podzakresów wartości co dla elementów (osób) z populacji. Zatem nie tylko: = O(/3y)-populacji, ale także, na poziomie próby, uwzględnione są te same podzakresy wartości zmien- nych zaliczonych do 0{Py). Nie jest to wcale warunek łatwy do spełnienia w przypadku dyscyplin nauko- wych zaliczanych do nauk behawioralnych, a więc i w przypadku psychologii. Jednym z powodów, dla których wspomniany zabieg uogólniania RB z próby (przebadanej!) na populację (nie poddaną badaniom!) może być — i najczęściej jest — nieuprawniony, jest to, że Xj istotne dla Y (najczęściej zmienne zakłócające) przyjmują dla osób z próby wartości z innego podzakresu wartości niż dla osób z populacji. Zilustruję to następującym przykładem: 68 Kinsey i jego współpracownicy przeprowadzili w latach czterdziestych i pięć- dziesiątych słynne badania nad zachowaniem seksualnym mężczyzn i kobiet (Kin- sey i inni, 1948; Kinsey i inni, 1953). Przeprowadzone nad wzorcem zachowań seksualnych badania objęły 8 tys. mężczyzn i 12 tys. kobiet. Badania miały cha- rakter ankietowy i objęły tylko ochotników. Z wcześniej przeprowadzonych przez Masłowa (1942) badań nad związkiem zachowań seksualnych kobiet z ich poczu- ciem własnej wartości wynikało, że osoby, które uzyskiwały wysokie wyniki w teście badającym tę zmienną, wykazywały tendencję do przyjmowania niekonwe- ncjonalnych postaw wobec zachowań seksualnych. Z kolei późniejsze badania Mas- łowa i Sakody (por. Maslow, Sakoda, 1952) przeprowadzone na części osób ba- danych przez Kinseya i jego współpracowników wykazały, że osoby biorące ochotniczo udział w badaniach ankietowych uzyskiwały wyższe wyniki na skali poczucia własnej wartości niż nieochotnicy. Podsumowując wyniki owych badań można powiedzieć (Rosenthal, Rosnow, 1984, s. 186), że badania przeprowadzone przez zespół Kinseya dostarczyły RB kreślących nieprawdziwy obraz wzorców zachowań seksualnych obowiązujących w społeczeństwie amerykańskim lat czter- dziestych naszego wieku. Społeczeństwo amerykańskie nie było aż tak niekonwe- ncjonalne, jeśli chodzi o sferę zachowań seksualnych, jak by to wynikało z badań Kinseya. Niestety, w psychologii stosunkowo dużo badań empirycznych prowadzi się na próbach skompletowanych z ochotników. Rosnow i Rosenthal (1976) szacu ją ich liczbę na 70 — 90% (są to zazwyczaj studenci pierwszych lat studiów, i to studiów psychologicznych!). Stawia to pod znakiem zapytania możliwość poprawnego generalizowania RB z tak dobieranych (nie losowo) prób na po pulacje. _ Ten rodzaj trafności, który związany jest z prawomocnością zabiegu generali- zowania RB z próby na populację, nazwiemy trafnością zewnętrzną3. Darie badanie empiryczne jest trafne zewnętrznie, jeżeli na poziom populacji opisanej podzakresami wartości zmiennych niezależnych oraz zmiennej zależnej można będzie przenieść RB uzyskany z badania przeprowadzonego na poziomie próby. Inaczej mówiąc, zabieg przeniesienia (generalizowania) RB z próby na po- pulację będzie uprawniony, jeżeli O(PY)-próby będzie tożsamy z O^rJ-populacji pod względem tych samych podzakresów wartości Xj oraz Y opisujących próbę i populację. Zbierzmy, to co dotychczas powiedzieliśmy o ograniczeniach trafności zew- nętrznej. Ograniczenia generalizowania wniosków z poziomu próby na poziom po- pulacji (a więc ograniczenia trafności zewnętrznej badań psychologicznych) zwią- zane są z: (a) — brakiem symetrii 0(/V)-próby i 0(/V)-populacji pod względem: (a-1): liczby zmiennych ważnych (nieadekwatność O(Pr)-próby względem zawartości ć>(Py)-populacji, 3 Campbell (1957; także: Campbell, Stanley, 1963; Cook, Campbell, 1979) wprowadził pojęcie etternal validity (trafność zewnętrzna). 69 (a-2): podzakresów wartości tych samych zmiennych ważnych (nie- adekwatność O(PY)-próby względem zakresów wartości zmien- nych ważnych z O(/V)-populacji; (b) — brakiem symetrii O(PY)-próby i ©(P^-populacji pod względem zawartości podzbioru zmiennych zakłócających w O(PY)-próby\ pewne zmienne w nim występujące nie pojawią się w O(PK)-populacji: (b-1): stosowanie pomiaru zmiennych, a zwłaszcza pomiaru zmiennej zależnej (kontekst pomiaru), przed (tzw. efekt pretestu) i po wprowadzeniu manipulacji eksperymentalnej (posttest), w celu ustalenia wielkości efektu eksperymentalnego; (b-2): dobór osób do grup porównawczych (np. eksperymentalnej i kontrolnej) nie respektujący zasady randomiazacji (kontekst selekcji), a zwłaszcza wykorzystywanie w badaniach: (b-2.1): ochotników, (b-2.2): osób „specjalnych" (np. więźniów, żołnierzy, studentów psychologii (!), osób zamieszkujących wyraźnie wyod- rębnione i „nietypowe" terytoria), (b-2.3): osób w jakiś sposób uzależnionych od badacza (np. stu- dentów zdających egzamin u profesora prowadzącego nieprzyjemne badania nad stresem); (b-3): prowadzenie badań w warunkach nie odpowiadających warun- kom, na które będą uogólniane wyniki badania (kontekst wa- runków); (b-4): oddziaływanie na osoby badane z próby, w czasie trwania ba- dania, zdarzeń „zewnętrznych" wobec sytuacji badawczej (kon- tekst historyczny), które nie wystąpią lub wystąpią z inną intensywnością wtedy, gdy badacz będzie odnosił wyniki otrzymane na podstawie badania próby do osób z całej popu- lacji; (b-5): wchodzenie osób badanych w interakcje z badaczem (kontekst psychologiczny), co związane jest z oddziaływaniem na zmien- ną zależną takich zmiennych kontekstu psychologicznego (por. rozdz. 4.), jak: (b-5.1): lęk osoby badanej przed oceną (por. rozdz. 4., pkt. 4.3.), (b-5.2): wskazówki sugerujące osobie badanej treść hipotezy badawczej (por. rozdz. 4., pkt. 4.2.), (b-5.3): motywacyja osoby badanej (por. rozdz. 4., pkt. 4.1.), (b-5.4): oczekiwania interpersonalne badacza (por. rozdz. 4., pkt. 3.1-3.3); (b-6): wchodzenie badaczy w interakcję z instytucjami (kontekst so- cjologiczny) zamawiającymi przeprowadzenie badań (sponsoru- jącymi je). 70 Rysunek 3.2. ilustruje postępowanie badacza w kontekście trafności zewnętrz- nej i trafności wewnętrznej badania empirycznego przeprowadzanego w psychologii. DOBÓR PRÓBY ZEWNĘTRZNA generalizowanie [n«N\ badanie naukowe TRAFNOŚĆ WEWNĘTRZNA poziom populacji poziom próby Rys. 3.2. Trafność wewnętrzna a trafność zewnętrzna badania psychologicznego 3. Proces badawczy w kontekście świadomości metodologicznej Rozpatrując proces badawczy w kontekście takiego konstruktu teoretycznego, ja- kim jest SM (świadomość metodologiczna), nie sposób pominąć — aby uzyskać w miarę pełny obraz uwarunkowań tego procesu — pozostałych kontekstów, pozametodologicznych, a wynikających z psychologicznej i socjologicznej natury badania empirycznego realizowanego przez psychologa (o czym, jako jeden z pierwszych, pisał wspomniany już Rosenzweig, 1933). Jest to tym bardziej istotne, że — jak się wydaje — owe pozametodologiczne wpływy w jakiś sposób przy- czyniają się do kształtowania oblicza indywidualnej SM, a w konsekwencji i spo- łecznej SM. Jak to ujął Kmita (1976), zapotrzebowanie społeczne, o którym była mowa w poprzednim rozdziale, zgłaszane pod adresem określonej dyscypliny naukowej „tra- fia" na określony stan społecznej świadomości metodologicznej. To, jaką wartość będzie miała odpowiedź psychologii na zapotrzebowanie społeczne zgłaszane przez sferę praktyki społecznej, będzie w znaczącym stopniu zależało od stanu owej świadomości. 71 Ist otę owego powiąz ania stanu SM społecz ności uczony ch z zapotrz ebowa- niem praktyk i społecz nej na nowy, określo ny typ wynikó w badawc zych ujął Kmita (1976, s. 97): „Pierw otnie obiekty wne jest zawsze zapotrz ebowa nie na określo ny typ wynikó w badawc zych, zaś świado mość metodo logiczn a stanowi subiekt ywną repreze ntację tego zapotrz ebowa nia. Jeżeli przy tym jest to repreze ntacja dostate cznie adekw atna, a więc oparta na niej subiekt ywnie praktyk a badaw cza jest efe- ktywna — staje się ona społecz nym względ nie trwały m kontek stem subiekt ywnym tej praktyk i i przez dłuższy okres występ uje w roli samodz ielnego «sędzie go» dal- szych wynikó w badaw czych". An alogicz nie zachod zi powiąz anie stanu społecz nej SM z realizo waną na gruncie danej dyscypl iny naukow ej praktyk ą badawc zą. Owa praktyk a realizo wana jest przez poszcze gólnych badaczy , których cechuje określo ny stan indywid ualnej SM. Indywi dualna SM jest swoistą konkret yzacją idealnej SM (społec znej) — swoistą dla różnych badaczy . Zauważ my jeszcze, że (Kmita, 1976, s. 20-22): „Teo- retyczn e wyjaśni enie zjawisk z dziedzi ny świado mości indywid ualnej zawsze musi dokony wać się w termina ch zjawisk z dziedzi ny świado mości społecz nej, jakkol- wiek z reguły niezbęd ne tu są jeszcze dodatko we przesła nki eksplan acyjne. Co więcej, sam opis danego bloku przekon ań indywi dualnyc h może być dokona ny jedynie w termina ch zakładaj ących określo ną charakt erystyk ę odpowi edniego bloku przekon ań ze sfery świado mości społecz nej: w termina ch różnic dzieląc ych ten pierwsz y blok od jego idealne go odpowi ednika społecz nego. (...) Oczywi ście mo- żliwość wytwar zania przez jednost ki istotnie nowych idei, czyli możliw ość twór- czości w szeroki m tego słowa znaczen iu, oparta jest (...) na tym, iż stosune k świa- domośc i indywid ualnej do świado mości społecz nej uregulo wany jest (...) przez za- łożenie o racjonal ności — odniesi one do poszcze gólnych jednoste k. Stąd właśnie możliw e są różnego rodzaju innowa cyjne «defor macje» indywid ualne świado mości społecz nej, z których pewne okazują się być następn ie twórcze w węższy m (tym razem) znaczen iu tego słowa: odpowi adają dostatec znie adekwa tnie na nowo po- wstałe zapotrz ebowan ie obiekty wne, dzięki czemu przecho dzą do sfery świado mości społecz nej". Po wtórzm y, w skrócie , to co wyżej zostało powied ziane. Ze strony praktyk i społecz nej pojawi a się zapotrz ebowa nie na określo nego rodzaju rezultat y badawc ze (o ważkic h konsek wencja ch teorety cznych i metodo logiczn ych także dla praktyk i badawc zej). Znajduj e ono odzwie rciedle nie w społecz nej SM. Jeżeli przy tym su- biekty wna prakty ka badaw cza oparta na tej ostatni ej jest efekty wna, to SM staje się — jak zauważ a Kmita (1976, s. 97): „(...) społecz nym, względ nie trwały m konteks tem obiekty wnym tej praktyk i i przez dłuższy okres występ uje w roli sa- modzie lnego «sędzie go» dalszyc h wynikó w badaw czych". Je st tak, aż do pojawi enia się nowyc h zapotrz ebowa ń ze strony prakty ki spo- łecznej , które nie są zaspok ajane przez rezultat y badaw cze uzyski wane na gruncie dotych czasow ego stanu społec znej SM. Z ajmijm y się teraz opisani em struktu ry SM, która decydu je o jakości „filtru metodo logiczn ego" ingeruj ącego w obieg inform acji przedst awiony w rozdz. 2. na rys. 2.3. 72 To, co przede wszystkim charakteryzuje badacza, to jego wiedza na temat badanego obiektu. Powinien on umiejętnie posługiwać się „obowiązującym" w da- nej społeczności badaczy kanonem teorii naukowych. Z ich pomocą móc opisywać, wyjaśniać i przewidywać zachodzenie zmian badanych zjawisk. Jednakże nie wy- starczy znać jedynie „czyste" teorie psychologiczne. Trzeba jeszcze wykazać się znajomością swoistych dla tych teorii metod badawczych. Znajomość narzędzi właściwych psychologii umożliwia z jednej strony popra- wne formułowanie twierdzeń i teorii naukowych, a także prawidłowe ocenianie natężenia rozpoznanych w trakcie badania czynników istotnie modyfikujących za- chowanie się osoby badanej, a z drugiej strony — poddanie ich empirycznej mo- dyfikacji. Poznanie narzędzi badawczych to nie tylko wiedza o: (a) zakresie ich stosowania w praktyce badawczej psychologii, (b) psychologicznym sensie uzyski- wanych z ich pomocą wyników, (c) znaczeniu danego wyniku dla wyjaśnienia zachowania się osoby badanej, ale także (d) wiedza-umiejętność budowy, analogi- cznych do wersji prototypowych, nowych narzędzi. Badacz musi także posiąść wiedzę dotyczącą sposobów empirycznej weryfi- kacji formułowanych przez siebie teorii, luźniejszych grup twierdzeń czy pojedyn- czych hipotez. Nawet najciekawsza poznawczo i najbardziej obiecująca, jeśli chodzi o konsekwencje (potencjalne) dla praktyki społecznej, hipoteza (czy teoria), jest tylko tworem umysłu, który wpierw musi być skonfrontowany z „twardą" rzeczy- wistością, aby mógł być odpowiedzialnie upowszechniony. Każdy pomysł badaw- czy, czy to jest teoria, czy nowa metoda badawcza, musi być zatem poddany empirycznej weryfikacji. Psychologia dysponuje szerokim wachlarzem modeli badawczych, które w takich przypadkach znajdują zastosowanie. Trzeba zatem, aby badacz posiadł rów- nież wiedzę na ich temat. Bez tej znajomości trudno uznać jego kompetencje za pełne. Sumując, badacz musi dysponować wiedzą o modelach badań psychologii. Powinna to być wiedza operatywna, umożliwiająca mu nie tylko powielanie, „od- bijanie z matrycy", typowych rozwiązań badawczych opisanych w podręcznikach, ale również — czy przede wszystkim! — stosowanie twórczych przekształceń zna- nych rozwiązań w nowych, niestandardowych sytuacjach badawczych. W ten spo- sób dochodzić będzie do bardzo pożądanych sprzężeń rozwoju teoretycznego psy- chologii z rozwojem jej instrumentarium (w sensie wykluczania nieefektywnych procedur badawczych, uzupełniania i korygowania już funkcjonujących oraz wpro- wadzania nowych podejść badawczych). Oczekuje się tedy od badacza, aby nie był skostniały, aby nie zatrzymywał się w swoim rozwoju teoretycznym i metodologicznym na poziomie wiedzy prze- kazanej mu w okresie, gdy był studentem, ale aby był otwarty na nowe idee i po- glądy, aby stale unowocześniał swój warsztat badawczy. Opanowanie języka teorii i metod danej dyscypliny naukowej i swobodne nimi operowanie przez badacza świadczy o jego dobrym przygotowaniu do rozwiązy- wania problemów badawczych. Czy zatem można uznać za modelowe swobodne, elastyczne operowanie przez badacza dorobkiem współczesnej psychologii? Czy 73 jest tak, że do danego problemu dobiera on najlepiej mu „pasującą" teorię psycho- logiczną, a do oceny natężenia czynników hipotetycznych, istotnie wywierających wpływ na zachowanie się osoby badanej, dobiera metody najlepiej mu znane względnie te, które sobie upodobał? Otóż taki obraz badacza „fruwającego beztrosko z kwiatka na kwiatek", z teo- rii na teorię, z narzędzi na narzędzia byłby obrazem nie zalecanym. Co więcej, należy przeciwstawić się ewentualnemu upowszechnieniu takiego obrazu badacza — „erudyty". Niestety, obserwujemy, iż taki obraz „naukowego" funkcjonowania badaczy znajduje dość duże wzięcie wśród nich samych. Wydaje się on zaprzecze- niem skostnienia teoretycznego i świadectwem swoiście rozumianych kompetencji zawodowych. Zatem jakie jest modelowe ujęcie powiązań między: (a) teoriami i (b) narzędziami badawczymi? Spróbujmy na to pytanie odpowiedzieć. Zanim badacz zacznie posługiwać się językiem określonej teorii i stosować określone narzędzia badawcze, musi najpierw dokonać wyboru natury bardziej pod- stawowej, bo filozoficznej. Musi bowiem dokonać wyboru pewnego modelu świata odpowiadając na pytanie o zakładaną przez siebie ontologię (pytanie: „Jaka jest natura rzeczywistości?") i na pytanie o zakładaną epistemologię (wybór języka, w którym będzie opisywał poznawaną rzeczywistość). Zatem musi zacząć od ustosun- kowania się do podstawowych kwestii natury filozoficznej — ontologicznych i epi- stemologicznych. O ile wiedza o modelach badań jest niekiedy dość znacząco zróżnicowana w obrębie społeczności uczonych, o tyle rozwiązania problemów ontologicznych i epistemologicznych przyjęte przez badacza są na ogół zgodne z tymi, które są akceptowane przez większość członków społeczności badaczy. Często jest i tak, że badacz nie angażuje się w rozwiązywanie kwestii natury filozoficznej (podstawo- wej), ale po prostu akceptuje to, co akceptuje społeczność, z którą się identyfikuje. Jeśli chodzi o poglądy na naturę poznawanej przez niego rzeczywistości, to zawie- rają się one w jego światopoglądzie. Na ogół poglądy ontologiczne badacze „otrzy- mują w spadku" po swoich mistrzach, przejmują je w ramach szkoły naukowej, której stają się członkami, której poglądy mniej lub bardziej ostentacyjnie głoszą i są skłonni bronić ich w naukowych dysputach. Badacz strukturuje rzeczywistość uznając pewne typy ontologiczne za pod- stawowe, a inne za pochodne — sprowadzalne do tych pierwszych. Strukturaliza- cja rzeczywistości wskazuje badaczowi, z jakich składa się ona przedmiotów — czy są to na przykład rzeczy (strukturalizacja substancjalistyczna), czy zdarzenia (strukturalizacja ewentystyczna), czy rzeczy i zbiory (substancjalizm mnogościo- wy), itd. Wskazuje ona zatem, jakim to przedmiotom przysługują zmienne (wiel- kości, czynniki), które interesują badacza. Wskazuje ona również na rodzaj syste- mów relacyjnych, którymi badacz będzie się zajmował w swojej praktyce badaw- czej. Taki system relacyjny obejmuje uniwersum (zbiór przedmiotów typu podsta- wowego) oraz zmienne, które charakteryzują przedmioty zaliczone do danego uni- wersum. Następnie badacz przeprowadza stratyfikację esencjalną zmiennych, wyróżnia- jąc ze zbioru wszystkich możliwych zmiennych te, które są istotne (wywierają 74 wpływ) dla zmiennych określonego rodzaju — zmiennych zależnych. Badacz po- sługuje się klasyfikacyjnymi zasadami stratyfikacji esencjalnej. Wreszcie dokonuje on stratyfikacji zbioru zmiennych, które uznał za istotne dla innego zbioru zmiennych (j^nej zmiennej zależnej — w szczególności). W tym przypadku odwołuje się do porządkujących zasad stratyfikacji esencjalnej. Zmienne zostają uporządkowane od najbardziej do najmniej istotnych. Kolejny krok to określenie rodzaju zależności wiążących zmienne zależne (zmienną zależną) ze zmiennymi dla nich (dla niej) istotnymi; chodzi o ustalenie ad związków ontologicznych. Przykładowo badacz może stać przed wyborem: nizm versus indeterminizm. Zasady stratyfikacji esencjalnej wraz z zasadami związków ontologicznych ładają się na perspektywę ontologiczną. Zatem perspektywa ontologiczna to spo- podejścia badacza do rozwiązywania kwestii ontologicznych, to jego poglądy Mitologiczne. Zauważmy — tytułem przykładu — że dwa wielkie paradygmaty sychologiczne — introspekcjonizm i behawioryzm — zakładają dwie odmienne erspektywy ontologiczne, co w efekcie doprowadziło do nieprzekładalności twier-eń i wyników badań wyrażonych w języku jednej z nich na język drugiej. W ramach perspektywy ontologicznej dokonuje się zatem ustaleń co do natury viata. Z kolei to, jak naukowo poznawać świat, ustala się w ramach perspektywy tistemologicznej. Psycholog tym różni się na przykład od fizyka, że jego działania badawcze eprowadzane są na innych osobach, a nie na przedmiotach martwych. Prowadząc badanie naukowe musi on odpowiedzieć na pytanie, czy to, jak będzie traktował osobę badaną, nie wywoła u niej urazu, czy nie będzie to dla niej przykre, czy nie sprawi jej bólu. Dokonując wyboru strategii badawczej i narzędzi badawczych musi tedy badacz nie tylko kierować się kryteriami metodologicznymi czy teoretycznymi, ale także brać pod uwagę fakt, że osoba badana musi być traktowana podmiotowo, a nie przedmiotowo. Mówiąc krótko, ważna jest jeszcze perspektywa aksjologiczna, w której ulo- kują się pozostałe wybory: filozoficzne, teoretyczne i związane z przyjętą strategią badawczą. Ważne jest zdanie sobie sprawy z faktu, że wszystko, co badacz w procesie badawczym będzie robił, podlega ocenie moralnej. Owa perspektywa aksjologiczna musi być zatem tą, która niejako w pierwszej instancji kwalifikuje wybory badacza jako dopuszczalne (z etycznego punktu widzenia) bądź jako nie- dopuszczalne. Racje etyczne muszą być racjami pierwszorzędowymi, muszą po- przedzać pozostałe — teoretyczne, metodologiczne czy praktyczne. Zauważmy jeszcze, że działania badacza podlegają kwalifikacji etycznej dwu- krotnie. Pierwszy raz, gdy jako uczony przeprowadza on badanie empiryczne, zo- rientowane na sprawdzenie hipotez teoretycznych za pomocą jakichś metod psy- chologicznych (o tym traktowała perspektywa aksjologiczna). Drugi raz zaś, gdy jako psycholog proponuje podjęcie jakichś działań uznanych za skuteczne z punktu widzenia prakseologicznego i opartych na sprawdzonych empirycznie teoriach (o tej kwalifikacji mówiłem prezentując, w rozdz. 2., pkt. 4., obieg informacji między sferą praktyki społecznej i sferą nauki). 75 Podsumowując można powiedzieć, że rozwiązanie w określony sposób pro- blemów natury ontologicznej ma wpływ na to, jak badacz rozwiąże problemy epi- stemologiczne, a to z kolei wyznacza przyjętą przez niego taktykę postępowania badawczego. Owe zaś decyzje metodologiczne rozpatrywane są w perspektywie aksjologicznej. Każde poważne badanie naukowe w psychologii (a także w każdej innej dyscyplinie empirycznej) rozpoczyna się od sformułowania problemu badawczego w postaci pytania o naturę związku łączącego daną, wyróżnioną przez badacza zmienną niezależną z jedną lub z większą liczbą zmiennych niezależnych, uzna- nych przez badacza za hipotetycznie ważne dla danej Y. W tym miejscu psycholog — poszukując nowych powiązań między jakąś Y oraz jakimiś zmiennymi nieza- leżnymi — odwołuje się, nawet niekoniecznie świadomie, do swojej dotychcza- sowej wiedzy teoretycznej, ulegając określonym preferencjom w teoretycznym „osadzeniu" pytania badawczego. Może on bowiem patrzeć na rzeczywistość przez okulary neobehawiorysty, a może też postrzegać ją w kategoriach psycho- logii poznawczej. Co więcej, jego wcześniejsze opcje teoretyczne (wybór określo- nej perspektywy ontologicznej — o czym była mowa wyżej) związane z — jak powiedział Topolski (1983, s. 130) — „wizją świata i człowieka" nie tylko suge- rują badaczowi szukanie takich, a nie innych ujęć teoretycznych problemu badaw- czego, ale także, wprowadzając w krąg jego zainteresowań badawczych określone układy zmiennych, równocześnie blokują możliwości formułowania innych pytań badawczych, uwzględniających inne zestawy zmiennych i powiązań między nimi niż te, które dopuszcza założona przez SM badacza perspektywa ontologiczna, a dokładniej — wybrana (i zaaprobowana) przez niego określona Teoria badanego obiektu (TBO). W jednej z wcześniejszych prac (Brzeziński, 1978, s. 13-15) ująłem opozycję dwóch wielkich teoretycznych programów (paradygmatów) psychologii, introspe- kcjonizmu i behawioryzmu, jako kontrowersję dwóch odmiennych perspektyw ontologicznych operujących różnymi TBO, lokowanymi w różnych perspektywach ontologicznych, co najdobitniej szy wyraz znalazło w programach teoretycznych ich „ojców" — Wundta (1908) oraz Watsona (1919). Dla introspekcjonizmu podsta- wowym typem ontologicznym w sferze faktów psychologicznych była kategoria przeżyć wewnętrznych (stanów świadomościowych) człowieka, a zmiennymi nie- zależnymi ważnymi dla Y (rozważanego typu) były zmienne typu „wewnętrznego" (psychologicznego). Z kolei dla behawioryzmu podstawowym typem ontologicz- nym w sferze faktów psychologicznych była kategoria zachowań się człowieka. I odpowiednio zmiennymi niezależnymi ważnymi dla Y były zmienne typu „zew- nętrznego" (bodźcowego). Sformułowanie pytania badawczego oraz hipotezy badawczej, jako możliwej na nie odpowiedzi traktującej o naturze związku (liniowy versus krzywoliniowy) łączącego Y z określoną Xp zakładającego u jego podstaw zaakceptowaną przez badacza (czy raczej przez szkołę naukową, z którą się on identyfikuje) określoną TBO, inicjuje proces badawczy stanowiąc jego pierwszy krok. Należy tu zwrócić uwagę na to, że ów pierwszy krok ściśle powiązany jest z dokonaną wcześniej 76 przez badacza akceptacją określonej TBO. To zaś rodzi, rzecz jasna, określone konsekwencje w postaci: „zahamowania postępu w badaniach" (por. Greenwald i inni, 1986), „nastawienia na konfirmację hipotez" (por. Magnusson, 1992) czy zawężenia zakresu formułowanych pytań badawczych (na co z kolei zwrócił uwagę, w odniesieniu do badań psychologicznych, Barber, 1991). Wspomnę tu jeszcze „osobę nr 1" Kuhna (1968), który pierwszy, tak wyraziście, przedstawił istotę para- dygmatu, ukierunkowującego myślenie wielu pokoleń badaczy. Związanie się badacza z określoną TBO ma też konsekwencje dla drugiego kroku procesu badawczego, to jest dla utworzenia przez badacza (na gruncie jego wiedzy naukowej — tu: psychologicznej) O(JPY). O(PY) stanowi podzbiór zmiennych niezależnych — uznanych przez badacza za istotne w stosunku do zbioru zmiennych niezależnych de facto istotnych dla Y. Otóż tylko zmienne niezależne uznane przez badacza, a nie zmienne faktycznie istotne dla Y, będą poddane — w przeprowadzanym badaniu empirycznym — kontroli. Mówiąc inaczej, językiem technicznym, tylko zmienne ważne zaliczone przez badacza do O(PY) będą traktowane przez niego jako źródło wariancji wyjaś- nionej Y. Faktycznie zaś istotne (i te ważne, i te zakłócające) zmienne niezależne dla y mogą być, w części lub wszystkie, potraktowane jako źródło drugiej części wariancji Y — nie kontrolowanej przez badacza — to jest wariancji resztowej zmiennej zależnej. Pozostawienie poza kontrolą części zmiennych niezależnych obniży trafność wewnętrzną badania empirycznego (spójrzmy jeszcze raz na rys. 3.1.). Może bo- wiem zdarzyć się tak, że prawidłowo rozpoznana zależność między Y i Xj (inaczej: trafna hipoteza sformułowana przez badacza) nie będzie jako taka potwierdzona w badaniu, gdyż nieadekwatny O(PY) względem PY może spowodować otrzymanie „rozmytego" RB, który nie będzie mógł stanowić dostatecznie mocnej — z meto- dologicznego punktu widzenia — podstawy do tego, aby ją zaakceptować. Także taki „rozmyty" RB nie będzie uzasadnieniem dla decyzji odrzucającej hipotezę, gdy jest ona faktycznie nietrafna. Decydując się na określoną TBO (w ramach danej perspektywy ontologicznej) badacz przesądza — jak to już zostało wyżej powiedziane — o tym, jakie będzie formułował pytania badawcze (por. zawężający eksplorację badawczą wpływ przy- jętego przez badacza paradygmatu — Barber, 1991) i które zmienne niezależne będą przez niego efektywnie kontrolowane, stając się tym samym systematycznym źródłem wariancji wyjaśnionej Y, co ma znaczący wpływ na trafność wewnętrzną przeprowadzanego przez psychologa badania. Jeżeli jest ono nietrafne wewnętrznie, to na podstawie jego RB nie można dokonać jednoznacznej oceny trafności testo- wanej hipotezy badawczej. Podsumowując, możemy powiedzieć, że podejmowane przez badacza w dwóch pierwszych krokach procesu badawczego czynności badawcze zdetermino- wane są przez przyjętą przez tego badacza TBO, która — jak sądzę — stanowi podstawowy element SM psychologa. Kolejny etap badania naukowego związany jest z bardzo ważnym, z meto- dologicznego punktu widzenia, zabiegiem operacjonalizacji zmiennych. Ta zaś 77 związana jest z doborem i konstrukcją (lub adaptacją już istniejących — w sensie adaptacji kulturowej; por. rozdz. 20.) narzędzi pomiarowych (tj. m. in. testów psy chologicznych — testów inteligencji, skal postaw, kwestionariuszy osobowości). Operacjonalizacja zmiennych przeprowadzana jest przez badacza w celu nadania zmiennym z O(PY) mającym status konstruktu teoretycznego — sensu empi rycznego. To, jaka będzie postać finalna konstruowanego przez psychologa testu psychologicznego, zależeć będzie przede wszystkim od założonej w punkcie wyj ścia Teorii operacjonalizacji zmiennych (TOZ). Przekonywającą i spójną teorię operacjonalizacji zmiennych w badaniach psy- chologicznych, wywodzącą swój rodowód filozoficzny i teoretyczny z Idealizacyj- nej teorii nauki (ITN) stworzonej przez L. Nowaka (1980) i rozwijanej na gruncie psychologii przez Brzezińskiego (1978b), Gaula (1990) czy Maruszewskiego (1983), stworzyła Hornowska (1989) — por. rozdz. 7. To, jaki będzie efekt przeprowadzonej operacjonalizacji zmiennych zależeć będzie od przyjętej przez badacza TOZ. Jeżeli — dla przykładu — ograniczymy się do modeli psychometrycznych, to i tutaj psycholog musi dokonać wyboru mię- dzy konkurencyjnymi czy uzupełniającymi się modelami — „klasyczną" teorią te- stów (Gulliksen, 1950), „statystyczną" teorią testów (Lord, Novick, 1968), teorią generalizacji i teorią wyników genetycznych (Cronbach i inni, 1972) czy całej rodziny tzw. Item Response Theory (IRT) (Guttman, 1950; Torgerson, 1958; La- zarsfeld, 1959; Lord, 1980; por. dla przeglądu problematyki IRT: Hulin i inni, 1983). Uzyskany za pomocą narzędzia pomiarowego (tu: testu psychologicznego) wy- nik musi być interpretowalny w terminach przyjętej przez badacza TBO. Mówiąc inaczej, narzędzie, którym posłuży się psycholog, musi przystawać do określonej teorii psychologicznej (musi traktować ją jako swoją), którą zaakceptował on jako teoretyczną podstawę do sformułowania — w kroku 1. — problemu badawczego i hipotezy badawczej oraz jako „ramę" interpretacyjną RB. Nie może tedy być tak, że w procedurze operacjonalizacji badacz posłużył się techniką Rorschacha i kwe- stionariuszem 16 PF Cattella, gdyż w pierwszym przypadku TBO jest teorią psy- choanalityczną, a w drugim przypadku teorią czynnikową. Obie zaś lokują się w różnych perspektywach ontologicznych. Zatem teorie leżące u podstaw poszczegól- nych narzędzi pomiarowych wykorzystanych w procedurze operacjonalizacji po- winny być porównywalne i zakładające tę samą TBO, która leży także u podstaw interpretacji poszczególnych wyników i finalnego RB (podjęcie przez badacza de- cyzji o akceptacji lub odrzuceniu hipotezy — krok 7.) oraz generalizacji RB z pró- by na populację (krok 8.). W każdym razie — żeby odwołać się do jakiejś prostej ilustracji — niedopu- szczalne jest, aby takie zmienne jak: inteligencja, potrzeby, samoocena, przystoso- wanie, neurotyzm zaliczone do jednego O(PY) były operacjonałizowane za pomocą takich dobrze psychologom znanych narzędzi, jak — odpowiednio — WAIS-R, TAT, ACL, technika Ro, MPI, gdyż zostały one wywiedzione z różnych teorii psy- chologicznych, „przypisanych" do różnych paradygmatów. Co więcej, zostały one skonstruowane w ramach różnych TOZ. 78 Z tego, co dotychczas napisałem, wyłaniają się następujące sekwencje „ele- mentów" SM — w sensie warunkowania jednych przez drugie: TBO —» TIRB —> TGRB, TBO —» TOZ, TOZ —> TIRB, TOZ —> TGRB. W kolejnym, czwartym, kroku badawczym psycholog dokonuje wyboru mo- delu badawczego. Ten krok jest sprzężony z krokiem szóstym, wyborem modelu statystycznego, w którego ramach testowane będą — na podstawie uzyskanego z przeprowadzonego badania empirycznego (eksperymentalnego lub korelacyjnego) RB — hipotezy badawcze. Kolejna teoria, której znajomość musi posiąść badacz, to Teoria badania empi- rycznego (TBE). Jej znajomość i konsekwentne przestrzeganie przy planowaniu badania empirycznego umożliwi, po pierwsze, uzyskanie rzetelnego RB, a ten z kolei, po drugie, umożliwi podjęcie trafnej decyzji co do hipotezy badawczej (por. s. 3.1). TBE obejmuje zbiór zasad odnoszących się do planowania i prowadzenia badania sprawdzającego hipotezę badawczą. W przypadku psychologii w grę mogą wchodzić dwie duże klasy modeli badawczych — eksperymentalne i korelacyjne. I jedne i drugie można podzielić — z uwagi na liczbę uwzględnianych w badaniach zmiennych X i Y — na następujące odmiany: (a)17— IX, (b)lY—nX, (c) m Y — 1 X, (d) m Y — n X. Wiedza dotycząca obu klas modeli badawczych jest w psychologii bardzo rozbudowana. W kształceniu uniwersyteckim psychologów (ono zaś formuje przy- szłego badacza-psychologa) kładzie się duży nacisk na jej opanowanie (por. Mata- razzo, 1987 — Appendix A, s. 903; Kimble, 1984; Ellis, 1992; Hoshmand, Pol- kinghorne, 1992). Od bogactwa tej wiedzy oraz umiejętnego jej wykorzystania w konkretnych sytuacjach badawczych zależeć będzie to, czy uzyskany przez badacza RB będzie umożliwiał podjęcie przez niego trafnej decyzji w odniesieniu do testo- wanej hipotezy, a więc czy RB będzie trafny i rzetelny (nie obciążony konsekwen- cjami złych wyborów metodologicznych badacza). Pochodną owej wiedzy będzie zatem to, że badacz będzie ustalał „fakty", a nie „artefakty". Krok 4. sprzężony jest zarówno z krokiem 6. (o czym dokładniej niżej) — w tym sensie, że wybór modelu badawczego przesądza wybór adekwatnego do niego modelu statystycznego (i na odwrót, jeżeli badacz wykazuje preferencje do określonego modelu statystycznego, w którym chciałby „opracować" hipotezę ba- dawczą, to musi, właśnie pod ten model, dokonać wyboru modelu badawczego) — jak też z krokiem 5. (wybór techniki doboru próby) i z krokiem 7., w którym badacz, na podstawie przeprowadzonych analiz statystycznych (tj. testów istotności 79 różnic między średnimi wartościami Y w grupach kryterialnych), dokonuje oceny hipotezy badawczej w kategoriach jej akceptacji lub odrzucenia. Na ,jakość" realizacji procesu badawczego w krokach 5.-7. mają wpływ kom- petencje badacza w zakresie teorii statystyki — statystyki opisowej, statystyki in- dukcyjnej (testowanie hipotez): jednowymiarowa versus wielowymiarowa — oraz techniki doboru próby: losowa versus nielosowa (np. kwotowa). Nadużycia staty- styki dokonywane przez niedoświadczonych badaczy związane są najczęściej z wy- borem niewłaściwych testów statystycznych, błędnym opracowaniem schematu pró- by, błędną (lub niepełną) interpretacją wyników przeprowadzonej analizy statysty- cznej, z poprzestaniem jedynie na obliczaniu poziomu istotności statystycznej przy jednoczesnym ignorowaniu innych metod, np. wskaźników wielkości efektu {ejfect size) (por. Chów, 1988; Cohen, 1988, 1990, 1992, 1994; Borenstein, Cohen, 1988; Hunter, Schmidt, 1990; Di Nuovo, 1992). Wiadomo (por. Morrison, Henkel, 1970), iż manipulowanie przez badaczy poziomem istotności statystycznej tak, aby zma- ksymalizować szansę publikacji raportu z badań w czasopismach naukowych spra- wiło, że stosowanie testów istotności (tylko) poddawane było ostrej krytyce (por. także: Cohen, 1994). Na rys. 3.3 pokazuję — w skrótowej formie — najbardziej rozpowszechnione wśród psychologów techniki statystyczne (stosowane w ramach bądź modelu kore- lacyjnego — zacieniowane trójkąty, bądź modelu eksperymentalnego — białe trój- kąty) przypisane do każdej z czterech wyżej wymienionych odmian modeli badaw- czych. Strzałki ilustrują trendy rozwojowe poszczególnych modeli statystycznych. U podstaw każdej techniki statystycznej wykorzystywanej przez badacza w procesie empirycznej kontroli hipotez znajdują się założenia dotyczące natury wnio- skowania statystycznego: procedury klasyczne wg ujęcia Neymana-Pearsona i Fis- hera (Fisher, 1925, 1935; Lehmann, 1968), ujęcia Bayesa (por. Edwards, Lindman, Savage, 1963; Philips 1973; Bortz, 1984), analizy sekwencyjne wg Walda (Wald, 1947; Marek, Noworol, 1987), założenie o losowości próby (Johnstone, 1989). To wszystko zaś składa się na wymienioną już Teorię statystyki (TS), która obok TBE przesądza o jakości kroków 4.-7. procesu badawczego. Obie teorie są bardzo ważnymi elementami SM. Obie też muszą być zgodne z TBO. Mamy zatem: TBO —> TBE/TS , TBE /TS —> TIRB, TBE/T S —> TGRB. W kroku 8. procesu badawczego dokonuje się oceny uzyskanego w trakcie przeprowadzonego eksperymentu (krok 4a) lub badania korelacyjnego (krok 4b) RB oraz — w przypadku jego zaakceptowania — interpretacji i generalizacji. Oczywiście interpretacja RB dokonywana jest w ramach pojęciowych TIRB, która z kolei musi być kompatybilna z wyjściową TBO. Także generalizacja nie yssa& — N< ^RRSAS, teBSStojCLTOjTSi — vj^Vxa.cxać ^oxa ob\e teotve \ tj. TIRB oraz TBO. Ponieważ T*B zos\& uz^sYar^ za pomocąYoriKieta^ 80 1 n a 1Y-1X b łY-nX \ \ \ r ' " \ R t \^ r 1 \] F - ANOVA \ \ F-ANOVA \ \ \ \ CA m muli t CA r,x,v \ MANOVA 4 s r, x, v \ MANOVA \ \ c mY-1X d mY-nX Rys. 3.3. Odmiany modelu badawczego i odpowiadające im modele statystyczne (najbardziej rozpo- wszechnione w praktyce badawczej psychologów). Modele eksperymentalne — białe trójkąty; modele statystyczne — zacieniowane trójkąty. Klucz: t — test t; F — test F; ANOVA — jednowymiarowa analiza wariancji: jednoczynnikowa i wieloczynnikowa; MANOVA — wielowymiarowa analiza wariancji: jednoczynnikowa i wieloczyn- nikowa; mult. t. — wielokrotny test r, r — współczynnik korelacji liniowej Pearsona; R — współczynnik korelacji wielokrotnej; CA — analiza kanoniczna; F— test Hotellinga; V— test Rao; / — test Wilksa. pomiarowych, a te z kolei zostały skonstruowane z respektowaniem bazowej dla nich TOZ, więc TGRB wykorzystana przez badacza przy generalizowaniu RB z poziomu próby na poziom populacji musi uwzględniać ograniczenia interpretacyjne będące pochodną natury TOZ. Podobne ograniczenia nakłada na TGRB zastosowa- na przez badacza TBE /TS. Mamy zatem: TBO —> TIRB —> TGRB, TBO —> TBE /TS —> TGRB, TBO —?> TOZ —> TGRB. Omówione wyżej powiązania elementów SM ujęte zostały w formie graficznej na rys. 3.4 (por. blok I, obwiedziony przerywaną linią). Z kolei na rys. 3.5 powtó- 6 — Metodologia badań.. 81 rzono — za rozdz. 1., rys. 1.4. — schemat procesu badawczego. Literami: a — e (tak samo jak na rys. 3.4) oznaczono wpływ poszczególnych, wyżej omówionych, elementów SM na kolejne kroki procesu badawczego. Rys. 3.4. Elementy kontekstu świadomości metodologicznej (K-SM) — ich uwarunkowania oraz wza- jemne powiązania 4. Poza kontekstem świadomości metodologicznej W poprzednim punkcie przeanalizowaliśmy, jeszcze raz, osiem kolejnych kroków procesu badawczego, ale tym razem pod kątem tego, w jaki sposób na czynności badawcze podejmowane przez psychologa oddziałuje stan jego SM. Musimy jednak pamiętać o systemie powiązań między sferą praktyki badawczej — zajmowaliśmy się nią w rozdz. 2. — i sferą praktyki społecznej. To zapotrzebowanie społeczne płynące z tej drugiej sfery wymusza na badaczach podejmowanie określonych za- dań badawczych. Można też — odpowiednio — mówić o zewnętrznych i wewnę- trznych determinantach procesu badawczego w psychologii. Jeśli chodzi o determinanty wewnętrzne, to związane są one bądź: (a) ze stanem SM (czym już się zajmowaliśmy), bądź też z (b) psychologicznym charakterem badania, którego wyrazem jest zachodząca między obydwoma podmiotami tego badania, badaczem-psychologiem i osobą ba daną, interakcja. Ignorowanie tego psychologicznego kontekstu i skupianie uwagi jedynie na analizie kontekstu świadomościowego może doprowadzić do bardzo przykrych dla badacza konsekwencji, gdyż zamiast mówić o faktach, będzie on mówił o artefak- tach. 82 ? PORB 9 10 PARB Rys. 3.5. Powiązanie elementów świadomości metodologicznej (SM) z poszczególnymi krokami procesu badawczego Do najważniejszych czynników kontekstu interakcji: „badacz — osoba bada- na", które bezwzględnie powinny być uwzględnione przez badacza i także przez niego w miarę możliwości kontrolowane należą: (a) oczekiwania badacza, (b) zmienne sugerujące hipotezę badawczą, (c) lęk przed oceną, (d) status moty- wacyjny osoby badanej, (e) aprobata społeczna. Analiza tego kontekstu przeprowa- dzona została w rozdz. 4. Wróćmy jednak do wątku dotyczącego związku łączącego dwie sfery — nauki i praktyki społecznej. Dotychczas interesowała nas wyłącznie pierwsza sfera w kontekście jej wewnętrznych uwarunkowań — tych związanych z logiką wewnę- trzną procesu badawczego oraz z psychologicznym charakterem badania empirycz- nego realizowanego przez psychologa. Na rys. 3.5 w pierwszym, obwiedzionym przerywaną linią prostokącie mamy przedstawiony, w ujęciu schematycznym, pro- ces badawczy. Z kolei drugi prostokąt obejmuje jeszcze 2 kroki — dziewiąty i dziesiąty — które, mimo, że nie wykonuje ich sam badacz, stanowią swoiste dopełnienie procesu badawczego sensu stricto. Kroki te bowiem należą nie do naukowca, ale do praktyka, który występuje w imieniu instytucji społecznej zgła- szającej zapotrzebowanie na określony RB, pozwalający jej podjąć działania pra- ktyczne — owym wynikiem uzasadnione i usprawiedliwione — umożliwiające osiągnięcie pożądanego stanu praktyki społecznej, a tym samym zaspokojenie zapo- trzebowania społecznego adresowanego do sfery praktyki badawczej (por. rozdz. 2., rys 2.1). Praca psychologa-badacza zakończyła się w momencie oceny RB (załóżmy, że badanie cechowała wysoka trafność wewnętrzna) i dokonaniu jego generalizacji (załóżmy też, że badanie cechowała równie wysoka trafność zewnętrzna). Niestety, badacz na ogół nie ma wpływu na to, jak RB będzie odczytany i odebrany przez psychologa-praktyka czy innego przedstawiciela praktyki społecznej (nauczyciela, terapeutę, pracownika socjalnego itp.), jaki będzie mu nadany sens praktyczny, co w nim interesującego dostrzeże praktyk i wreszcie, jakim podda go zabiegom adaptacyjnym, aby mógł — postfactum (i taka praktyka „aplikacyjna" też, niestety, ma miejsce) — uprawomocnić działania podejmowane przez daną instytucję spo- łeczną (szkołę, poradnię zdrowia psychicznego, zakład karny itp.). Na rys. 3.5 ujęte to zostało w postaci kroku 9.: odbiór RB oraz kroku 10.: podjęcie działania pra- ktycznego. Oba zaś kroki polegające na transformacji „czystego" RB na konkretne działania uzależnione są od przyjętej — w danej sferze praktyki społecznej i w danym momencie jej rozwoju — Praktyki odbioru rezultatu badawczego (PORB) oraz Praktyki aplikacji rezultatu badawczego (PARB). Te zaś pozostają pod wpły- wem kontekstu interakcji: „badacz — instytucja społeczna" (IBIS) — (por. rys. 3.4, kontekst C). Owe oddziaływania mogą kształtować PARB w dwojaki sposób. Dana insty- tucja społeczna zleca wprost przeprowadzenie badań ukierunkowanych na rozwią- zanie interesującego ją problemu praktycznego. Oczekuje ona tedy, że psycholog, który podjął się tego zadania, dostarczy jej takiego RB, który będzie mógł być wykorzystany do zaplanowania i przeprowadzenia określonej strategii postępowania praktycznego, umożliwiającego satysfakcjonujące rozwiązanie problemu praktycz- 84 nego. Przykładowo, instytucja oświatowa zleca wykonanie badań naukowych (psy- chologicznych) dotyczących specyfiki procesów emocjonalnych i poznawczych u dzieci z rozpoznaniem MBD (minimal brain disorders), w celu opracowania takiej strategii nauczania w klasie szkolnej, która by uwzględniła rozpoznaną przez psy- chologa ich charakterystykę. Badacz, znając oczekiwania instytucji, a więc pracując nie dla wyłącznej sa- tysfakcji poznawczej, ale — przede wszystkim! — dla uzyskania określonej graty- fikacji ze strony sponsorującej badania instytucji, może starać się tak je przepro- wadzić oraz tak sporządzić finalny raport, aby zmaksymalizować szansę uzyskania ponownego zamówienia. Mówiąc inaczej, nie będzie to całkowicie „chłodny", obie- ktywny raport pokazujący wszystkie trudności metodologiczne i ograniczenia inter- pretacyjne uzyskanego RB, z którymi zetknął się sam badacz (i nie z wszystkimi z nich dostatecznie dobrze sobie poradził), a które poważnie ograniczyłyby „apli- kowalność" RB, gdyby rzetelnie je uwzględnić. W konsekwencji instytucja finan- sująca badania nie byłaby zadowolona z takiego „rozmytego" RB, bowiem trudno oprzeć na nim strategię działania praktycznego, które ma cechować przede wszy- stkim wysoka efektywność. Mogłoby zdarzyć się i tak, że instytucja ta nie przyję- łaby raportu nie spełniającego jej oczekiwań, a wówczas badacz zmuszony byłby zrekompensować poniesione przez nią straty finansowe. Nawet gdyby instytucja zrezygnowała ze zwrotu źle — w jej ocenie — „ulokowanych" pieniędzy, to po- zostaje jeszcze problem zagrożenia poczucia własnej wartości i poczucia kompe- tencji zawodowej badacza. Omawiając powyższy przykład niespełnienia przez badacza oczekiwania zama- wiającej dane badanie instytucji społecznej, chciałem wskazać na niebezpieczeństwo związane z bezpośrednim uzależnieniem badacza od danej instytucji społecznej, z prowadzeniem badań pod jej dyktando. Przynajmniej w części takie bezpośrednie powiązania badacza z instytucją społeczną sponsorującą badania na ściśle przez nią określony temat mogą stawiać pod znakiem zapytania obiektywność tych badań. Może też badacz, znając oczekiwania określonej instytucji społecznej, opako- wać interpretacyjnie uzyskany RB, aby kupiła ona od niego raport badawczy i tym samym sponsorowała, post factum, przeprowadzone badania. W tym przypadku badacz będzie pomagał danej instytucji odczytać RB, narzucając jej własne ujęcie PARB, dopasowane do merytorycznego profilu prowadzonej przez nią działalności praktycznej. Oba wyżej opisane sposoby oddziaływania instytucji społecznej zgłaszającej zapotrzebowanie na określony RB w jakiś sposób uzależniają od niej badacza. Tym samym zachodzić może podejrzenie, że dany RB jest obciążony i że obciążona jest także PORB. W konsekwencji zaprojektowane działanie praktyczne może być mało skuteczne, gdyż oparte zostało na nierzetelnych podstawach. Znacznie tedy korzystniejsza — oczywiście z omawianego punktu widzenia — jest taka sytuacja gdy dana instytucja sięga po wyniki badań, które nie są przez nią bezpośrednio sponsorowane (tzn. są one dla niej anonimowe) albo gdy pocho- dzą one z tzw. badań podstawowych (w warunkach polskich, na przykład, sponso- rowane przez Komitet Badań Naukowych). 85 Pozostaje jeszcze jedno niebezpieczeństwo nadużycia RB. Mamy z nim do czynienia wówczas, gdy jakaś instytucja potrzebuje naukowego uzasadnienia swojej — niekoniecznie moralnie czystej — działalności. Przykładu może dostarczyć wprowadzenie w byłych krajach komunistycznych (w niedalekiej jeszcze przeszło ści), reform szkolnych — zgodnych z ideologią komunistyczną — które odwoły wały się do „naukowych" ekspertyz przeprowadzonych przez dyspozycyjnych wo bec władzy profesorów pedagogiki i psychologii. W badaniach empirycznych prowadzonych w naukach behawioralnych trudno — z uwagi na ich psychologiczny charakter — spełnić fundamentalny warunek powtarzalności RB (uzyskanie tego samego RB przez innego badacza przeprowa dzającego — z zachowaniem wszystkich elementów procedury badawczej — ba danie będące, w istocie, repliką badania wyjściowego) i trudno takie badania pod dać rygorystycznej kontroli — na wzór tej, której poddawane są badania realizo wane przez fizyków czy biologów. Znając tedy ograniczenia psychologii jako nauki empirycznej, powinniśmy starać się minimalizować zniekształcające RB i (utrud niające jego powtórzenie) wpływy nie kontrolowanych przez badacza czynników kontekstu IBIS (por. Neuliep, 1991) 5. Podsumowanie W psychologii, a także w pozostałych dyscyplinach naukowych zaliczanych do nauk behawioralnych, badanie naukowe można traktować jako proces rozwiązywania problemów (Nickles, 1988). Rozpoczyna się ono bowiem sformułowaniem problemu badawczego, przybierającego postać pytania, oraz sformułowaniem najbardziej prawdopodobnego (na gruncie wiedzy badacza) rozwiązania, które przybiera postać hipotezy badawczej. Kolejne, wykonywane przez badacza — na ogół wystandaryzowane w danej społeczności badaczy (tj. psychologów) — czynności dotyczą próby konfirmacji tej hipotezy na podstawie uzyskanego RB. Jego akcep- tacja, interpretacja oraz generalizacja kończy ów proces badawczy. i indywidualnej SM. W pkt. 3. tpu* „*. — ""~"r„ / f „a poszcZegól- jakiclpozostające względem ^ie zależnej ^^D^rn obok SM, xve kroki, wykonywane przez badacza W_P^_^6 M^bad^cz^ iest kontekst UJJJIJIG' ^J 86 W pkt. 4. przedstawione zostały dalsze losy RB, który w określony sposób odczytany przez praktyków (krok 9.), staje się podstawą do zaprojektowania przez jakąś instytucję społeczną działania praktycznego (krok 10.). Tak jak o jakości procesu badawczego (kroki: 1.-8.) decydował kontekst IBOB, tak o jakości apli- kacji RB (kroki: 9.-10.) decyduje w jakiejś mierze kontekst IBIS. Możliwe nega- tywne oddziaływania tego kontekstu na wykorzystywanie RB, dokonujące się na styku: „sfera badawcza — sfera praktyki społecznej" omówiłem w poprzednim punkcie. Stosunkowo najwięcej uwagi poświęciłem na omówienie wpływu kontekstu SM na proces badawczy. Nie oznacza to jednak wcale, że pozostałe, „pozaświa- domościowe" konteksty są mniej ważne. Rozwinięcie poruszanych w tym rozdziale zagadnień znajdzie Czytelnik w kilku, dostępnych w języku polskim, książkach. I tak, problematyka świadomości metodologicznej oraz stosunek indywidualnej SM do społecznej SM przedstawione zostały, w oryginalnym ujęciu, w pracy: Kmita J.: Szkice z teorii poznania społe- cznego. Opozycję dwóch podstawowych w psychologii perspektyw ontologicznych — introspekcjonizmu oraz behawioryzmu — przedstawiłem w swojej wcześniejszej pracy: Metodologiczne i psychologiczne wyznaczniki procesu badawczego w psy- chologii. Polecam też trzy monografie poświęcone tej problematyce: Zamiara K. Dynamika pojęć i programów psychologicznych. Szkice metodologiczne; Paszkie- wicz E. Struktura teorii psychologicznych oraz Kozielecki J. Koncepcje psychologi- czne człowieka. Skróty stosowane w tekście SM RB (a) TBO (b) TOZ (c) TBE/TS (d) TIRB (e) TGRB (f ) PORB (g) PARB (A) K-SM (B) K IBOB (C) K-IBIS ś w i a d o m o ś ć m e t o d o l o g i c z n a R e z u l t a t b a d a w c z y T e o r i a b a d a n e g o o b i e k t u T e o r i a o p e r a c j o n a l i z a c j i z m i e n n y c h Teoria badania empiryczne go/Teoria statystyki Teoria interpretacji rezultatu badawczeg o Teoria generalizacj i rezultatu badawczeg o Praktyka odbioru rezultatu badawczeg o Praktyka aplikacji rezultatu badawczeg o Kontekst świadomoś ci metodologi cznej Kontekst interakcji: badacz — osoba badana Kontekst interakcji: badacz — instytucja społeczna Rozdział 4. Wewnętrzne determinanty procesu badawczego (II) — badanie psychologiczne jako interakcja „badacz- osoba badana" 88 1. Wpr owa dzen ie Porzuć my teraz, charak terysty czny dla tradyc yjnej metod ologii, zorient owane j na logikę proces u badaw czego, punkt widzen ia na prakty kę badaw czą, polegaj ący na: (a) b ądź rekonst rukcji przebie gu poszcz ególny ch faz proces u badaw czego na stawio nego na potwie rdzeni e, czy też, jak chce Popper (1977), na falsyfi kację hi potez stanow iących najbar dziej prawd opodo bne (z punktu widzen ia wiedzy bada cza) rozwią zanie proble mu badaw czego, (b) b ądź wskaz ywaniu badacz owi jak ma postęp ować, aby zmaks ymaliz ować uzyska nie trafnej (w sensie: rozdz. 3., pkt. 2.) odpow iedzi na pytani e badaw cze. Zaj mijmy się natomia st uwarun kowani ami wewnęt rznymi procesu badawc zego związan ymi z jego psychol ogią. Ich źródeł będzie my szukać w zachow aniu się głównyc h „aktoró w" tego „psycho logiczne go teatru" (Sioma, 1983) — badacza , z jednej strony i osoby badanej , z drugiej. Sy stem uznawa nych wartośc i, zajmow ane postaw y, kierowa nie się chwilo wymi prefere ncjami, uprzedn ie doświa dczenia badawc ze, intelige ncja, wiedza, tempe- rament współd etermin ują styl odegra nia wspom nianych ról: roli badacz a i roli osoby badanej . To, jak zachow uje się osoba badana w sytuacji badawc zej, w dużej mierze zależy od postrze ganego przez nią zachow ania się badacz a w tej samej sytuacji . I odwrot nie, zachow anie się badacz a w jakiejś mierze też jest modyfi kowane przez zachow anie się osoby badanej (Jamies on i in., 1987). M ówiąc inaczej, o specyfi ce psycho logiczn ego badani a nauko wego stanow i interak cja dwóch podmi otów proces u badawc zego — badacz a (psych ologa) i osoby badane j (ucznia , student a, „człow ieka z ulicy" itp.). 2. Osobliwości badania psychologicznego (wg S. Rosenzweiga) Rosenzweig (1933, s. 353-354) zwracał uwagę na trojakiego rodzaju osobliwości, odróżniające naukowe badanie psychologiczne od analogicznego badania prowa- dzonego przez fizyka czy chemika. t Pierwszą osobliwością psychologicznego eksperymentowania jest to, że osoba badana może przyjmować status eksperymentatora (jest tak, gdy musi ona dokony- wać samoobserwacji i zdawać z niej relację badaczowi). Druga osobliwość związana jest z możliwością reagowania nie tylko na pro- gramowo wprowadzone przez badacza elementy postępowania eksperymentalnego, ale także na cały kontekst owego postępowania, który w jakiejś mierze będzie modyfikował zachowanie się osoby badanej, znajdującej się w sytuacji psycholo- gicznego badania naukowego. Z kolei trzecia osobliwość polega na możliwości traktowania badacza przez osobę badaną jako „...części materiału eksperymentalnego" i na tym, że w konse- kwencji osoba badana „...może reagować na osobowość eksperymentatora" (tamże). Sytuacja badania naukowego stanowi „problem psychologiczny" (jak to ujął cytowany tu Rosenzweig) nie tylko dla osoby badanej, ale ma ona problemowy charakter też dla badacza. Nie jest bowiem badacz osobą z „zewnątrz" układu badawczego, która jedynie planuje i czuwa nad prawidłowym przebiegiem procesu badawczego sama się weń nie angażując. Interakcyjny układ „badacz-osoba badana" zanurzony jest w określonym kon- tekście społecznym, który w istotny sposób modyfikuje przebieg tej interakcji. 3. Nastawienia badacza na potwierdzenie hipotezy badawczej — efekt oczekiwań interpersonalnych badacza, OIB (wg R. B. Rosenthala) 3.1. Pojęcie efektu oczekiwań interpersonalnych badacza OIB efekt Golenia i efekt Galatei Jedną z ważniejszych zmiennych kontekstu psychologicznego badania psycholo- gicznego jest bez wątpienia zmienna oczekiwań interpersonalnych (ang. interper- sonal expectations) czy inaczej, zmienna oczekiwań badacza (ang. researcher's expectationś), będąca od wielu lat obiektem intensywnych badań prowadzonych przez Rosenthala i jego współpracowników (por. Rosenthal, 1966, 1969, 1973, 1991a, 1991b, 1993, 1994b; Rosenthal, Rubin, 1978; Rosenthal, Jacobson, 1968, 1992; Rosenthal, Rosnow, 1984, 1991; Babad, Inbar, Rosenthal, 1982; Babad, 1993; Harris, Rosenthal, 1985; Harris, 1993) oraz innych psychologów (np. Barber, Silver, 1968 — krytycznie; Cooper, 1979, 1985; Brophy, 1983, 1985; Jussim, 1986; Gilly, 1987; Darley, Oleson, 1993; Seul, 1995; Brzeziński, Kowalik, 1993a). Przez nią „przełamują się" pozostałe zmienne charakteryzujące badacza. Ona jest źródłem efektu samospełniającego się proroctwa (ang. self-fułfilling prophecy effeci), efektu Pigmaliona (ang. Pygmalion effect), efektu Galatei (efekt pozytywnych oczekiwań — ang. positive expectations effect, Galatea effect), efektu Golema (efekt negatyw- nych oczekiwań — ang. negative expectations effect, Golem effect), stronniczości eksperymentatora (ang. experimenter bias) czy, ogólnie rzecz ujmując, efektu Ro- senthala. Dalej będę posługiwał się skrótem — OIB (od: oczekiwania interpersonalne badacza). 3.2. Czynniki kształtujące OIB Badacz nawiązujący kontakt z osobą badaną nie od razu dysponuje jej pełnym portretem psychologicznym. Jego oczekiwania co do funkcjonowania osoby bada- nej też nie są w pełni ukształtowane. Trzeba tedy mówić o wstępnych OIB, które będą ulegały poszerzeniu, aż przyjmą postać skonkretyzowaną (albo zgodną z kie- runkiem wstępnych oczekiwań, albo, w wyniku dokonanych przez badacza zmian, niezgodną z kierunkiem wstępnych oczekiwań). Mówiąc o wstępnych OIB i ich rozwijaniu w kierunku pierwotnym lub zmia- nie i rozbudowie w kierunku przeciwnym do pierwotnie założonego musimy wziąć pod uwagę dwa kluczowe problemy: (1) problem wstępnych OIB, (2) problem listy potencjalnych czynników wpływających na rozbudowę (lub zmianę) wstępnych OIB. Pierwszym źródłem wstępnych OIB jest osobowość badacza (postawy, prze- konania, uznawane wartości). Badania porównawcze przeprowadzone nad osobami cechującymi się odpowiednio wysokim i niskim poziomem OIB pozwalają stwo- rzyć portrety psychologiczne tych osób. Głównym rysem portretu badacza o wy- sokim poziomie OIB jest autorytaryzm (w sensie: Adorno i in., cyt. wyd. 1969) i dogmatyczny styl myślenia (w sensie: Rokeach, 1960). Badania Babad i in. (1982; Babad, 1993) „rozpoznały" jeszcze takie zmienne, charakteryzujące osoby o wysokim poziomie OIB, jak: brak tolerancji na odmienność, sztywność myśle- nia, poszukiwanie aprobaty społecznej. Osoby o wysokim poziomie OIB różnią się od osób o niskim poziomie OIB także pod względem postrzegania innych w kategoriach stereotypów społecznych i przesądów. Są też one bardziej inercyjne, jeśli chodzi o przyswajanie informacji odnoszących się do aktualnego funkcjono- wania osoby badanej (odporność na informacje nie potwierdzające oczekiwań ba- dacza). 90 Drugim ważnym źródłem wstępnych OIB jest wiedza badacza (znajomość aktualnych teorii psychologicznych, współczesnych wyników badań empirycznych, metodologii psychologii), jego doświadczenie zawodowe, a także to wszystko, co składa się na skrótowe określenie: kompetencje zawodowe. Trudno to źródło pre- cyzujnie oddzielić od pierwszego. W zasadzie oba one stanowią jedno „duże" źródło wstępnych OIB. Trzecim źródłem wstępnych OIB, tkwiącym poza badaczem, są dane, które uzyskuje on o osobie badanej zanim nawiąże z nią kontakt. Te dane mogą być dwojakiego rodzaju. Z jednej strony będą to dane obiektywne: fizjologiczne, spo- łeczno-demograficzne, wyniki obiektywnych testów psychologicznych. Z drugiej zaś strony badacz korzysta z takich danych, jak pewne stereotypowe charaktery- styki osób, wynikające z ich przynależności do określonych grup społecznych, wspólnot religijnych, mniejszości narodowych itd., z danych, które mają sens tylko dla danego badacza, wynikających z tzw. pierwszego wrażenia (sylwetka osoby badanej, sposób jej zachowania się w pierwszym kontakcie z badaczem, styl mó- wienia, mimika, pantomimika itp.). Będą to dane subiektywne. Przymiotnik: „subiektywny" tu użyty ma podwójny sens. Pierwszy odpowiada sensowi psychometrycznemu dychotomii: „dane obiektywne — dane subiektywne" i związany jest z niemożnością precyzyjnego wystandaryzowania sposobów zbie- rania tych danych i nadawania im jednolitej i trafnej interpretacji niezależnej od badacza. Drugi wiąże się z tym, że te same dane będą różnie interpretowane przez badaczy o wysokim i niskim poziomie OIB; na dodatek oczekiwania badaczy róż- nią się jeszcze zmiennymi osobowościowymi stanowiącymi pierwsze, wyżej omó- wione, źródło wstępnych OIB. żuje Przykładowo, badacz, który uzyskuje wysokie wyniki na skalach autorytaryzmu i dogmatyzmu, i którego cechuje jednocześnie wysoki poziom OIB, przywią- większą wagę do stereotypowych charakterystyk osób badanych. Będzie on oby badane z grupy spodziewanych zachowań potwierdzających hipotezę badaw- traktował odmiennie od osób badanych z grupy spodziewanych zachowań hi- tezy badawczej nie potwierdzających. Atrybucje sukcesu w pierwszej grupie niepowodzenia w grupie drugiej dokonywane przez badacza będą miały charakter otowy (odnoszone będą do charakterystyki osoby badanej). Z kolei atrybucja iepowodzenia w pierwszej grupie i sukcesu w drugiej grupie będzie miała charak- sytuacyjny (odnoszona będzie do charakterystyki sytuacji zadaniowej). Korzystając z wyżej wyszczególnionych i scharakteryzowanych źródeł wstępnych OIB, badacz formułuje je względem zachowania się osoby badanej. Odróż-iamy OIB dotyczące spodziewanych niepowodzeń osoby badanej (w skrócie: :kiwania negatywne) od oczekiwań dotyczących spodziewanych sukcesów tej iby (w skrócie: oczekiwania pozytywne). Negatywne OIB prowadzą do efektu lema, a pozytywne do efektu Galatei (por. Babad i in., 1982). Wstępne OIB nie mają — zgodnie ze swą nazwą — postaci ugruntowanego zamkniętego systemu. Podlegają one ewolucji, rzecz jasna zróżnicowanej, w za- lości od działania takich czynników, jak: (a) charakter informacji o osobie badanej, lokalizowanych na wymiarze: „informacje jednoznaczne — informacje dwuznaczne", 91 (b) charakter OIB lokalizowanych na wymiarze: „oczekiwania elastyczne — oczekiwania sztywne", (c) stopień potwierdzenia wstępnych OIB przez zachowanie się osoby badanej lokalizowany na wymiarze: „niski stopień niepotwierdzenia — wysoki stopień nie- potwierdzenia". Są to najważniejsze czynniki wpływające na ewolucję wstępnych OIB. Jeśli chodzi o wymiar ,jednoznaczności-dwuznaczności", to jego związek z wymiarem „utrzymania-zmiany" wstępnych OIB jest taki, że badacze interpretują docierające do nich dwuznaczne informacje, dotyczące charakterystyki zachowania się osób badanych, zgodnie z wytworzonymi wcześniej OIB. Zatem im więcej dopływa do badacza informacji niejednoznacznych, tym mniejsza szansa na to, że zmieni on pierwotnie wytworzone OIB (niezależnie od ewidentnej — dla osoby postronnej — ich nietrafności). Informacje zgodne ze wstępnymi OIB są przez badacza łatwiej zauważane w polu informacyjnym i łatwiej zapamiętywane. Łatwiej też podlegają rekonstrukcji te zdarzenia, które miały miejsce w przeszłości, jeżeli były zgodne z wytworzonymi OIB i mogą służyć ich podtrzymaniu. Mówiąc krótko, zachowania osoby badanej będą interpretowane w sposób zgodny z wstępnie ukształtowanymi OIB i to w stopniu tym większym, im większa będzie niejednoznaczność napływających do badacza informacji. Jeżeli wytworzone przez badacza oczekiwania oparte są na jednoznacznych, stabilnych i pewnych informacjach, to będą one miały charakter sztywny i trudno będą się poddawały oddziaływaniom nakierowanym na ich zmianę. Określone pre- dyspozycje osobowościowe badacza skłaniają go do wytwarzania raczej sztywnych niż elastycznych wstępnych OIB i to niekoniecznie opartych na jednoznacznych i pewnych informacjach. Osoby autorytarne, dogmatyczne, przesądne będą częściej skłonne do formułowania przewidywań, których nie będą chciały zmieniać. Czę- ściej też będą napływające do nich dane (zwłaszcza te niejednoznaczne) reinterpre- tować w duchu wcześniej wytworzonych OIB. Tacy „sztywni" badacze, wchodząc w interakcję z osobami badanymi, będą traktować je w sposób wynikający z włas- nych nastawień. Z kolei badacze o niskim poziomie oczekiwań skłonni są dosto- sowywać swoje zachowania w interakcji z osobami badanymi do ich zachowań, a nie do obrazu tych zachowań narzucanego przez wstępne OIB. Mówiąc krótko, „sztywność" nastawień podwyższa próg wrażliwości badacza na występującą zmienność zachowania osoby badanej. Zatem jednoznaczne, stabilne i pewne in- formacje mogą stanowić podstawę do formowania opornych na zmianę „sztyw- nych" OIB. W przeciwnym przypadku będziemy mieli do czynienia z „elastyczny- mi", podatnymi na zmianę OIB. Jaka jest odporność wstępnych OIB — tych „sztywnych" i tych „elastycz- nych" — na nowe informacje podważające trafność tych informacji, które legły u podstaw wstępnie sformułowanych OIB? Nietrudno odpowiedzieć na to pytanie. Rzecz jasna, „sztywne" OIB — niejako na mocy ich definicji — są bardziej od- porne na informacje je dyskonfirmujące niż oczekiwania „elastyczne". 92 Zachowania osoby badanej mogą być jednoznacznie zgodne z OIB, ale może być i tak, że ich zgodność z OIB wcale nie jest jednoznaczna i można je równie dobrze uznać za potwierdzające wstępne OIB, jak i za nie potwierdzające tych oczekiwań. Z takiej niejednoznacznej sytuacji obronną ręką częściej wychodzą OIB „sztywne" niż OIB „elastyczne". Z kolei elastyczne wstępne OIB są bardziej otwarte na informacje ich nie potwierdzające i w konsekwencji są bardziej podatne na towana jest przez osobę badaną jako sytuacja problemowa. To, co przede wszystkim osoba badana stara się ustalić, to cel badania, w którym bierze udział. Zdaje ona sobie sprawę z tego, że ma dość ściśle określony status, że badacz „czegoś" od niej oczekuje, że pewne jej zachowania, odpowiedzi testowe mają większe znaczenie, że pewnych jej zachowań badacz oczekuje, że przynoszą mu one satysfakcję (bo trafnie ich wystąpienie przewidział), gdy inne są mu obojętne czy wręcz go martwią (bo burzą jego hipotezę, oczekiwania, dyskonfirmują te oczekiwania). Wyobrażając sobie cel badania i oceniając swój w nim udział pod kątem zagrożenia poczucia własnej wartości, osoba badana będzie postępowała bądź tak, aby jej zachowanie było zgodne z jej rekonstrukcją hipotezy badacza (udział w badaniu uznany został przez osobę badaną za „neutralny" dla jej poczucia własnej wartości), bądź tak, by jej zachowanie falsyfikowało zrekonstruowaną przez nią hipotezę badacza (udział w badaniu uznany został przez osobę badaną za „zagrażający" jej poczuciu własnej wartości). Zdaniem Orne'a, w typowej sytuacji badawczej, a więc przy dobrowolnym udziale w badaniach psychologicznych i braku poczucia zagrożenia poczucia włas- nej wartości, osoba badana jest skłonna współpracować z badaczem. Mówiąc ina- czej, osoba badana będzie pozytywnie zmotywowana do tego, aby odegrać rolę „dobrej" osoby badanej i „...będzie się starała swoim zachowaniem potwierdzić postawioną przez eksperymentatora hipotezę" (Orne, 1991, s. 22-23). Zwróćmy uwagę na zakładany przez Orne'a SM — o którym była wyżej mowa — oraz na zakładany przez niego, jako konsekwencja pierwszego założenia, brak zagrożenia poczucia własnej wartości. Skupmy się teraz na Orneowskiej koncepcji osoby badanej, dobrowolnie bio- rącej udział w badaniu psychologicznym i nie percepującej jego przyszłych wyni- ków jako zagrażających jej poczuciu własnej wartości. Taka osoba badana, współ- pracując z badaczem w trakcie badania empirycznego, po jego zakończeniu ocze- kuje od badacza aprobaty dla swego zachowania. Takie nastawienie osoby badanej — mimo jej afirmującego stosunku do badacza — powinno budzić niepokój meto- dologiczny, gdyż zagraża ono obiektywności badania psychologicznego. Badanie psychologiczne staje się, poprzez subtelne oddziaływanie na zmienną zależną do- datkowych, nie kontrolowanych przez badacza zmiennych — których źródłem jest interakcja: „badacz-osoba badana" — trudne do wiernego powtórzenia przez innych badaczy. Niepowtarzalny — w innych warunkach społecznych (inny badacz, inna osoba badana) — charakter interakcji zachodzącej między badaczem i osobą badaną jest „odpowiedzialny" za to, że przy takich powtórzeniach nie uzyskuje się tych samych rezultatów. Badania Orne'a (1959b) nad zachowaniem się osób poddanych hipnozie poka- zały, że występowanie efektu eksperymentalnego miało miejsce tylko wówczas, gdy osoby badane uświadamiały sobie hipotezę badacza. Nie rejestrowano natomiast występowania efektu eksperymentalnego wówczas, gdy osoba badana nie była w stanie zwerbalizować hipotezy badawczej. Oznaczałoby to, że werbalizacja hipotezy przez osobę badaną jest stosunkowo trafnym predyktorem zachowania się tej oso- by. Widać tedy wyraźnie, że zachowanie się osoby badanej w sytuacji badania 7 — Metodologia badań... 97 psychologicznego jest funkcją roli przez nią tworzonej i przez nią granej. Jest to rola „dobrej" osoby badanej (rzecz jasna, przy założeniu, że osoba badana bierze udział w badaniu na zasadach dobrowolnego zgłoszenia i że przyszły wynik bada- nia nie jest postrzegany przez nią jako zagrażający jej poczuciu własnej wartości!). Jeżeli cel badania nie jest oczywisty, jeżeli jest on rozmyty, to osoby badane będą formułować wiele konkurencyjnych interpretacji tego celu. W efekcie nie dopro- wadzi to do jasnych, jednoznacznych rezultatów badania. Druga skrajność, to jest, gdy osoba badana jest w pełni świadoma hipotez badacza, może doprowadzić do zachowań „przekornych". Osoba badana nie zechce skorzystać z nazbyt oczywis- tych wskazówek i będzie się zachowywać naturalnie, uczciwie, albo przeciwnie niż to sugerują WSH. Może być i tak, że nazbyt oczywiste (z punktu wiedzenia osoby badanej!) WSH mogą sprowokować osobę badaną do zastanawiania się nad tym, co tak „naprawdę" badacz chce ukryć przed nią i co „naprawdę" eksperyment bada. Ponieważ, akceptując punkt widzenia Orne'a, nie sposób wyobrazić sobie osobę badaną, która nie przypisywałaby żadnego znaczenia manipulacjom badacza i dla której cel badania byłby całkiem obojętny, zatem trudno byłoby zaaranżować takie badanie naukowe, z którego jego WSH byłyby całkowicie wyeliminowane. Trzeba tedy nie tyle eliminować z badania jego WSH (bo jak to zrobić?), ile poddać je efektywnej kontroli. Działaniem WSH można wytłumaczyć fakt, że tak mało znamy badań psy- chologicznych, które, powtórzone przez innego badacza, na innych osobach bada- nych, ale z wiernym zachowaniem wszystkich elementów scenariusza badania, do- starczają tych samych rezultatów. Bardzo spektakularny jest w tym względzie przykład badań przeprowadzonych przez Ellisona, Davisa, Saltzmana i Burkego (1952 — podaję za: Orne, 1969; także: Silverman, 1977, s. 57-58) oraz powtórzonych przez Gustafsona i Orne'a (por. Gustafson, Orne, 1965), a dotyczących zagadnienia wykrywalności kłamstwa za pomocą detektora kłamstwa (z GSR jako zmienną zależną). Zapoznam teraz dokładniej Czytelnika z przebiegiem tych badań, gdyż stanowią one dobrą ilustrację wpływu zmiennych WSH na wyniki badania psychologicznego. Ellison i in. badali wpływ znajomości wyniku uzyskanego na podstawie ba- dania detektorem kłamstwa na wielkość reakcji skórno-galwanicznej (GSR). Po przeprowadzeniu pierwszej próby z detektorem kłamstwa części osób badanych powiedziano, że ich kłamstwo zostało przez badacza wykryte, zaś pozostałym, że ich kłamstwa nie zdołano wykryć. Podanie tej informacji wpłynęło na wyniki dru- giej części eksperymentu. Otóż kłamstwa tych osób badanych, które uwierzyły, że detektor wykazał, iż kłamały, stały się trudniejsze do wykrycia za drugim razem. Natomiast kłamstwa osób, którym wydawało się, iż zdołały badacza wprowadzić w błąd stawały się łatwiejsze do wykrycia w drugiej próbie. Osiągnięte przez El- lisona i in. rezultaty okazały się dość paradoksalne i niezgodne z rezultatami osiąg- niętymi przez osoby posługujące się detektorami kłamstwa w codziennej praktyce zawodowej (np. badania sądowe). W praktyce przecież obsługujący detektor kłam- stwa stara się tak postępować, by osoba badana była przekonana, że nie jest w stanie „oszukać" detektor. Zatem w świetle wyżej przedstawionych wyników, za- 98 biegi te prowadziłyby do zmniejszenia stopnia wykrywalności kłamstw, a nie — jak tego chcą osoby prowadzące badanie — do zwiększenia stopnia wykrywalności. Jak zatem wytłumaczyć rozbieżność danych pochodzących z laboratorium z danymi, jakich dostarcza rzeczywista praktyka? Odpowiedzi na to pytanie starali się udzielić Gustafson i Orne. Założyli oni, że w badaniu przeprowadzonym przez El- lisona i in. działały dodatkowe zmienne, których wspomniani badacze nie kontrolo- wali. Były to zmienne WSH. Z rozmów przeprowadzonych z badanymi studentami wynikało, że część z nich uważa, iż detektor kłamstwa nadaje się jedynie do wy- krywania kłamstw zwykłych osób, i że tylko nałogowym kłamcom udaje się wpro- wadzić „go" w błąd. Zatem wartością, do której zmierzali studenci, było wykrycie ich kłamstw (wszyscy uważali się za normalnych, a nie za nałogowych kłamców). Tak więc sytuacja badanych studentów jest różna od sytuacji badanego-podejrzane- go, który za wszelką cenę chciałby ukryć fakt kłamstwa. Mając informacje o akcep- towanych przez osoby badane wartościach, możliwe jest manipulowanie tymi prze- konaniami, a tym samym zmienianie WSH danej sytuacji eksperymantalnej. Tak też uczynili Gustafson i Orne. Podzielili oni osoby badane na dwie grupy. Każda grupa otrzymała odmienne instrukcje. I tak, pierwszej grupie powiedziano, że: ,Jest to eksperyment nad wykrywaniem oszukiwania. Próbujemy sprawdzić, jak dobrze pracuje detektor kłamstwa. Jak wiesz, niemożliwe jest wykrycie kłamstwa w przypadku osobowości psychopatycznych czy nałogowych kłamców. Chcemy, byś spróbował «okpić» jak umiesz najlepiej detektor podczas eksperymentu". In- strukcja ta miała na celu zwiększenie tego rodzaju WSH, które wystąpiły w badaniu Ellisona i in. Drugiej grupie podano instrukcję, wedle której postępowały osoby badane — jak się wydawało — w eksperymencie przeprowadzonym przez Ellisona i in. Była ona następująca: „Jest to badanie nad wykrywaniem kłamstwa i choć bardzo trudno jest oszukać detektor — to jednak ludzie bardzo inteligentni, emo- cjonalnie stabilni i dojrzali umieją to uczynić". W tym przypadku WSH miały zwiększyć tendencję badanych do oszukiwania. Następnie osoby badane z obu grup losowały jedną kartkę z numerem, którego miały nie ujawniać badaczowi. Tabela 4.1. Liczba trafnych i nietrafnych detekcji w pierwszej próbie eksperymentu i Orne'a Gustafsona Podań; i informacja o: / wykryciu kłamstwa niewykryciu kłamstwa między kolumnami Grupa z „potrzebą wykrycia" wykryci 9 13 1,3 nie wykryci Grupa z „potrzebą oszukania" 7 3 n.i. wykryci 13 11 0,17 nie wykryci 3 5 n.i. X1 między wierszami 1,31 n.i. 0,17 n.i. uwaga, osobom badanym podano informacje o „wykryciu" dopiero po próbie, z której pochodzą te dane 99 Tabela 4.2. Liczba trafnych i nietrafnych detekcji w drugiej próbie eksperymentu Gustafsona i Orne'a Podana informacja o: ł wykryciu kłamstwa niewykryciu kłamstwa między kolumnami Grupa z „potrzebą wykrycia" wykryci 4 14 10,28 nie wykryci 12 2 a < 0,005 Grupa z „potrzebą oszukania" wykryci 15 3 15,36 nie wykryci 1 13 a < 0,001 X2 między wierszami 12,96 a < 0,001 12,55 a < 0,001 uwaga: x2 pokazuje, że ani podanie informacji, ani motywacja osób badanych nie były istotne: 0,25 (a > 0,95) i 0,001; df=\. Jednakże trafna detekcja zależała od interakcji informacji i motywacji: ^=30,94; dfi=\, a < 0,001 Z kolei badacz prezentował każdej osobie badanej kolejno wszystkie numery, a detektor kłamstwa rejestrował wielkość reakcji GSR. W pierwszej próbie różnica „stosunku oczekiwania" (względna wielkość krytyczna GSR) w obu grupach była nieistotna (por. tab. 4.1). Po przeprowadzeniu pierwszej próby badacz informował połowę osób z pierwszej i połowę z drugiej grupy, że ich kłamstwa zostały wykryte przez detektor (badacz miał niezależny dostęp do kart z numerami), a drugą połowę osób badanych, że nie zostały wykryte. O tym, czy dana osoba znalazła się w grupie „wykrytych" czy „nie wykrytych" decydowano w sposób losowy. Druga próba polegała na powtórzeniu badania, ale z inną kartą. Uzyskane wyniki (tab. 4.2) okazały się bardzo interesujące. Wysokie wyniki GSR uzyskano od 2 rodzajów osób badanych: (a) tych, które chciały być wykryte, ale nie zostały wykryte, (b) tych, które chciały oszukać, ale im się to nie udało (jest to grupa podobna do osób badanych w autentycznych warunkach życiowych). Tak więc osoby, których oczekiwania (nadzieje) zostały spełnione miały słab- sze reakcje skórno-galwaniczne i tym samym ich kłamstwa stawały się trudniejsze do wykrycia — wbrew ich własnym nadziejom. Osoby, które chciały być „wykry- te" i rzeczywiście zostały „wykryte", zachowywały się (pod względem wielkości GSR) analogicznie, jak osoby, które chciały oszukać i rzeczywiście oszukały. Oka- zało się zatem, że manipulacja WSH w interakcji ze zmienną niezależną, jaką był „rodzaj instrukcji", doprowadziła do różnych rezultatów. Manipulacja ta była sku- teczna, gdyż instrukcje podawane osobom badanym odzwierciedlały ich poglądy ujawnione we wcześniejszej rozmowie. Wiarogodność instrukcji oraz zgodność z procedurą eksperymentalną okazały się rzetelną drogą do zmiany WSH sytuacji badawczej. W badaniu Gustafsona i Orne'a instrukcje nie były opracowane z myślą o bezpośredniej manipulacji postawami osób badanych, ale z myślą o dostarczeniu im różnych, podstawowych informacji o eksperymencie, w którym brały udział. Instrukcje te okazały się skuteczne, gdyż zmieniły percepcję sytuacji badawczej 100 osób badanych. Oczywiście, co nietrudno zauważyć, instrukcje podawane badanym nie mówiły im wprost, jak mają się zachować! Badanie przeprowadzone wedle układu Gustafsona i Orne'a pozwoliło m. in. na wytworzenie takiej sytuacji, która nie odbiegałaby od realnej sytuacji życiowej {Realizm życiowy — por. rozdz. 12., pkt. 2.5). Pozwoliło to jednocześnie na wy- jaśnienie różnic w rezultatach osiąganych w laboratorium i w praktyce. Oczywiście aby uzyskać zamierzone efekty instrukcje muszą być dokładnie przemyślane i po- dawane bardzo ostrożnie. Bywa i tak, że trudno przewidzieć, w jaki sposób zmienić WSH sytuacji badawczej. Pewne nie zidentyfikowane przez badacza aspekty sytu- acji badawczej mogą w sposób o wiele silniejszy wyznaczać WSH niż mozolnie opracowane przez niego instrukcje zmiany WSH. W takich przypadkach trudno się spodziewać sukcesów podobnych do tych, jakie były udziałem Gustafsona i Orne'a. Sytuacja badania, w jakiej znajduje się dana osoba, traktowana jest przez nią jako typowa sytuacja rozwiązywania problemów. Stara się ona ustalić cel badania, w którym uczestniczy i w zależności od nastawienia, swej postawy wobec badania, będzie starała się zachowywać tak, by zgodnie z własnymi wyobrażeniami odnośnie hipotezy badawczej albo ją potwierdzać, albo też falsyfikować. W przeciętnej sy- tuacji badania naukowego, a więc przy dobrowolnym udziale w badaniach i braku zagrożenia poczucia własnej wartości ze strony eksperymentatora osoba badana stara się współpracować z nim, tzn. postępować zgodnie z własnymi wyobrażenia- mi dotyczącymi oczekiwań co do sprawdzanej hipotezy. Mówiąc inaczej, osoba badana chce jak najlepiej zagrać rolę „dobrej" osoby badanej i często już po za- kończeniu badania oczekuje od badacza aprobaty dla swego zachowania się w trakcie tego badania. Pomimo tego, że osobą badaną kierują pozytywne pobudki, takie jej nastawienie wobec badania psychologicznego stwarza poważne zagrożenie dla jego obiektywności i może spowodować, że jego trafność zewnętrzna będzie dość niska. Zdając sobie sprawę z faktu, że osoby badane chcą poznać cel ekspe- rymentu i postępować tak, by potwierdzić oczekiwania eksperymentatora, badacze starają się różnymi dostępnymi środkami zamaskować prawdziwy cel badania w nadziei, że pozwoli to uratować zagrożoną trafność zewnętrzną. Często stosowanym wybiegiem jest podawanie fałszywego celu badania. Jednakże jest to strategia ra- czej znana typowym osobom badanym, tzn. studentom; jest to populacja najczęściej poddawana badaniom przez badaczy-psychologów. Można nawet mówić nie o psy- chologii jako nauce o zachowaniu się człowieka, ale jako o nauce o zachowaniu się studenta psychologii (!). Stwarza to dość paradoksalną sytuację, gdyż nawet badaczowi, który stara się postępować z badanymi uczciwie i nie maskować — przez podawanie fałszywych danych — prawdziwego celu badania, osoby badane nie wierzą, odbierając jego deklaracje co do prawdziwości podawanych danych jako perfidne kłamstwo. Tak czy inaczej, osoby badane będą reagowały nie tylko na wprowadzone do układu badawczego zmienne niezależne, o których traktują hipotezy, ale także na różne wskaźniki celu badania, których dostarczają badanym: (a) osoba badacza (jej zachowanie się w trakcie badania, stosunek do badanych), (b) wypowiedzi osób towarzyszących badaczowi, (c) aparatura, sposób przeprowadzania pomiarów i re- 101 jestrowania wyników, (d) pomieszczenie, w którym przeprowadzane jest badanie, (e) sposób eksponowania bodźców, treść pytań zadawanych badanym, (f) atmosfera w pomieszczeniu, w którym odbywa się badanie itp. Z tego też względu badania przeprowadzane według planów, zgodnie z którymi dokonuje się kilkakrotnego testowania (pomiaru zmiennej zależnej) tej samej osoby, mają niewielką wartość, gdyż: (1) zestaw pytań (w przypadku kwestionariusza wywiadu czy też testu wia- domości) nie będzie już czymś nowym dla osoby badanej i będzie mogła ona udzielić tych samych odpowiedzi co za pierwszym razem, względnie je „popra- wiać", gdy uzna, że jej poprzednia odpowiedź nie była dobra, (2) sam fakt poda- wania jednej i tej samej osobie badanej wielokrotnie tego samego testu wystarczy, nawet niezbyt inteligentnej jednostce, by domyśliła się, że prawdopodobnie badacz prosi ją znowu o wypełnienie tego samego testu dlatego, że oczekuje, iż wypełni go ona inaczej niż poprzednio, a zatem pozostaje jej tylko odpowiedzieć sobie na pytanie: „Jakich to zmian oczekuje ode mnie badacz?". Trudność tę można wyeliminować przez dokonywanie pomiarów na różnych losowo równoważnych grupach. Dobrze, ale co uczynić, gdy takie równoważne losowo grupy są badaczowi niedostępne, albo gdy muszą to być takie same osoby? Sprawa się oczywiście komplikuje, gdyż wymaga opracowania bardziej złożonych planów badawczych, co może dostarczyć dodatkowych wskaźników WSH osobom badanym. Dalej pokażę warianty postępowania badawczego w różnym stopniu minimalizujące wpływ WSH na zmienną zależną. Rzecz jasna, że WSH tego sa- mego badania będzie różne dla różnych osób. Może być i tak, że część WSH będzie postrzegana jednolicie przez wszystkie osoby badane, a część nie. Może być też i tak, że inne WSH będą postrzegane przez jeden typ środowiska, z którego rekrutują się badani, np. studenci, a inne przez inne środowisko, np. przez żołnie- rzy. W każdym razie musimy przyjąć następujące założenie: na każdą osobę badaną oddziałują dwie grupy zmiennych: (1) zmienne niezależne ważne dla Y, (2) postrzegane WSH sytuacji badawczej (wraz z innymi zmiennymi zakłó cającymi). Wielkość wariancji zmiennej zależnej Y wyjaśnianej wpływami WSH decyduje o stopniu powtarzalności badania i o stopniu jego trafności ekologicznej. Im ta wariancja będzie mniejsza, tym większy będzie stopień powtarzalności samego ba- dania i większa jego trafność zewnętrzna. Nasuwa się kolejne pytanie: w jaki sposób oddzielić wariancję zmiennej Y wprowadzoną przez WSH od wariancji wprowadzonej przez zmienne ważne dla Y, jeżeli nie sposób całkowicie wyeliminować WSH z badania? Postaram się teraz udzielić odpowiedzi na to pytanie. Procedury pozwalające określić i oddzielić wariancję zmiennej Y wprowadzo- ną przez WSH muszą uwzględnić fakt, że efekty wpływu WSH na Y są wynikiem aktywnego podejścia badanych do reagowania i to nie na pojedynczą zmienną niezależną wprowadzoną do układu przez badacza, ale na cały kontekst ekspery- mentalny, a więc na aktualnie działający na osobę badaną kompleks zmiennych. Z badań eksperymentalnych przeprowadzonych przez Orne'a wynikało, że wystę- 102 powanie efektu eksperymentalnego miało miejsce tylko wówczas, gdy badani uświadamiali sobie hipotezę testowaną przez badacza. Nie stwierdzono natomiast występowania efektu eksperymentalnego w zachowaniach tych osób badanych, któ- re nie były zdolne do werbalizacji hipotezy badawczej. Oznacza to, że postrzeganie hipotezy testowanej przez badacza jest trafniejszym predyktorem wystąpienia efe- ktu eksperymentalnego w zachowaniu się osoby badanej w sytuacji eksperymental- nej niż deklaracja tejże osoby zdająca sprawę z tego, co myśli ona o swoim za- chowaniu się w trakcie badania (jak reagowała na zmienne eksperymentalne wpro- wadzone przez badacza do układu eksperymentalnego). W świetle przedstawionych dalej rozważań na temat grania przez osobę bada- ną roli „dobrej (współpracującej z badaczem) osoby badanej" widać wyraźnie, iż jej zachowanie się w sytuacji badania naukowego jest funkcją roli stworzonej przez nią i przez nią granej. Jeżeli cel badania nie jest oczywisty, osoby badane będą formułowały wiele różnych, konkurencyjnych hipotez odnośnie tegoż celu. W efek- cie WSH nie doprowadzą do jasnych rezultatów. Druga skrajność, tzn. sytuacja, w której osoby badane są w pełni świadome hipotez badacza (cel badania jest jedno- znaczny i oczywisty), może wywołać u nich tendencję do zachowania się „prze- kornego" (osoba badana nie chce skorzystać z możliwości, jakie stwarzają zbyt oczywiste WSH) — uczciwego. W skrajnych przypadkach może wystąpić tenden- cja do zachowania się przeciwnego niż to, które sugerują WSH. Wydaje się, że bardzo ważne jest określenie tych sytuacji, w których WSH wyzwalają zachowania osób badanych wzmacniające efekty zmiennych niezależnych oraz tych sytuacji, w których WSH wyzwalają zachowania badanych zmierzające do osłabienia tychże efektów. Ważne jest także rozpoznanie sytuacji, w których WSH nie odgrywają większej roli w modyfikowaniu efektów eksperymentalnych. Ponieważ — podkreślam raz jeszcze — trudno wyobrazić sobie osobę badaną, która nie przypisywałaby żadnego znaczenia manipulacjom eksperymentatora i któ- ra nie wyobrażałaby sobie domniemanego celu badania, w którym bierze udział, zatem trudno tak zaaranżować badanie, by całkowicie wyeliminować jego WSH. Proponuje się zatem, by tak projektować badanie empiryczne, aby możliwe było manipulowanie zmiennymi WSH sytuacji badawczej oraz określenie stopnia ich wpływu na zmienną zależną (określenie i oddzielenie wariancji zmiennej Y wpro- wadzonej przez WSH). Niestety takie badania są technicznie złożone. 4.2.2. Trzy procedury kontroli WSH Do badania WSH Orne zaproponował użycie tzw. procedur quasi-kontrolnych. Są to: (1) badanie posteksperymentalne (ang. postexperimental inąuiry), (2) niby-eksperyment (ang. non-experiment), (3) symulacja eksperymentalna (ang. simulatioń). Orne wysuwa także analogię między badaniem farmakologicznym z użyciem placebo a badaniem WSH. Przedstawię teraz wymienione procedury wraz z ich krytyczną dyskusją i zaproponuję kilka planów eksperymentalnych, które pozwala- yby nie tylko na pogłębioną analizę efektów WSH, ale także na jednoczesne kon- 103 trałowanie innych, inferencyjnych wpływów na zmienną zależną, takich jak: wpływ pomiaru początkowego zmiennej Y przed wprowadzeniem manipulacji eksperymen- talnej (tzw. pretestu) oraz wpływ instrukcji maskujących (ang. deception) podawa- nych przez badacza. Ten ostatni wpływ jest ściśle związany z wpływem WSH i dlatego powinno się je badać łącznie. 4.2.2.1. Badanie posteksperymentalne Badanie posteksperymentalne polega na przeprowadzeniu z osobami badanymi wy- wiadów na temat tego, co myślą o procedurze, której oddziaływaniu były poddane. Takie badanie jest dość trudne do przeprowadzenia i to nie ze względów obiektyw- nych, ale ze względów natury psychologicznej. Badacz chce, by badanie okazało się rzetelne, by instrukcje maskujące były na tyle „dobre", aby uniemożliwiały rozpoznanie przez osobę badaną prawdziwego celu badania. Jeżeli okaże się, że uświadamiała ona sobie cel badania w takim stopniu, który może podważać rzetel- ność jej odpowiedzi, badacz będzie zmuszony zrezygnować albo z jej wyników (wyniki nie będą poddawane dalszej obróbce, np. statystycznej), albo z dalszego jej udziału w badaniach. Oznacza to podwyższenie kosztów badania. Dlatego też badacze mogą odczuwać podświadomą niechęć do zbyt daleko „idącego w głąb" wywiadu, do nadmiernego „drążenia" problemu. Przeprowadzenie wywiadu z oso- bami badanymi może napotykać na różne przeszkody, np. w postaci trudności w werbalizowaniu przez badanych odczuć, jakich doznawali w trakcie eksperymentu, niechęci do ujawniania tego, co wiedzą lub czego się domyślają na temat celu badania. Także sam wywiad przeprowadzony po zakończonym badaniu może zmie- niać jego WSH. W efekcie badanie posteksperymentalne, nastawione na określenie stopnia wpływu WSH na zmienną zależną, może wypaść zadowalająco mimo tego, że WSH miały duży udział w wyjaśnianiu zmienności zmiennej Y. Może się tak stać, gdyż i osoby badane są w jakiejś mierze zainteresowane w uznaniu badania za rzetelne, ponieważ w przeciwnym przypadku mogą być narażone na utratę okre- ślonych gratyfikacji za udział w badaniu. Sądzę, iż można by podnieść skuteczność takiego badania posteksperymental- nego, jeżeli wywiad przeprowadzałaby inna osoba niż prowadzący badanie ekspery- mentalne psycholog (pod warunkiem, że nie będzie ona postrzegana przez osoby badane jako zwierzchnik eksperymentatora) i jeżeli sam wywiad miałby charakter rozmowy klinicznej w wersji standaryzowanych informacji, najlepiej z wykorzysta- niem wielopunktowych skal szacunkowych. Można by też skonstruować kwestio- nariusz wywiadu wedhig formalnego schematu kwestionariusza dynamicznego za- proponowanego przez Nowakowską (1975). Zdaniem Newberry'ego (1973) o wiele skuteczniejszy od wywiadu ustnego jest wywiad pisemny z możliwością udzielania przez badanego więcej niż dwóch odpowiedzi. Orne (1969) sugeruje pewną mody- fikację badania posteksperymentalnego, która polegałaby na przeprowadzeniu nie jednego wywiadu po zakończeniu całego badania właściwego, ale serii wywiadów po każdym ważniejszym etapie procedury badawczej. Modyfikacja ta jest dość kosztowna i uciążliwa, gdyż wymaga wprowadzenia tylu grup badanych, ile prze- widuje się wywiadów. Każda grupa osób badanych kończyłaby swój udział w eks- 104 perymencie w innym momencie, coraz bardziej oddalonym od momentu wyjścio- wego. W ten sposób można by śledzić dynamikę zmian WSH w trakcie trwania samego badania. Potrzebne tu jednak byłoby jedno, moim zdaniem, dość istotne założenie o losowej równoważności osób badanych należących do różnych grup (zasada randomizacji!). Założenie to pozwalałoby na traktowanie WSH jako takich samych dla poszczególnych grup badawczych. Niemniej otwarta pozostaje kwestia: jak zbadać zasadność takiego założenia? Badanie tej samej grupy osób jest nie- wskazane ze względu na duże obciążenie i fizyczne, i psychiczne (przede wszy- stkim!), a także dlatego, że w wyniku wielokrotnego pytania tych samych osób badanych o te same informacje możemy im „wmówić" percepcję określonych WSH. Wydaje się, że mimo różnych wad badanie posteksperymentalne warto prze- prowadzać, jeżeli nie po właściwym badaniu, to już na pewno po poprzedzającym je badaniu pilotażowym. Wszak wnioski z takiego badania mogą okazać się bardzo istotne dla samej procedury eksperymentalnej, którą można będzie skorygować, a tym samym zaoszczędzić kosztów, jakie pociągałyby za sobą zmiany właściwego badania. Badanie posteksperymentalne przeprowadzone w fazie pilotażowej badania właściwego przyczyni się też do zwiększenia trafności tego ostatniego. Nie należy zapominać i o tym, że samo badanie posteksperymentalne także jest źródłem okre- ślonych WSH, które mogą być wskaźnikami WSH właściwego badania. W każdym bądź razie problem wcale nie jest łatwy do „rozgryzienia" i na pewno go w pełni nie rozwiążemy za pomocą jedynie badania posteksperymentalnego. 4.2.2.2. Niby-eksperyment Badanie WSH za pomocą procedury „niby-eksperymentalnej" wymaga dwu rów- noważnych grup osób badanych wylosowanych z tej samej populacji. Najlepiej, gdy reprezentacyjną dla danej populacji próbę rozdzielimy losowo na dwie grupy: A i B. Z kolei grupę A poddaje się działaniu procedury eksperymentalnej, a osoby z grupy B prosi się, aby wyobraziły sobie, że są osobami poddanymi badaniom właściwym. W tym celu zapoznaje się je ze scenariuszem badania, z aparaturą i narzędziami pomiarowymi, z pomieszczeniem, w którym będzie przeprowadzane badanie, z osobami przeprowadzającymi i nadzorującymi przebieg badania itp. Udziela się im także tych samych instrukcji co osobom z grupy A. Obie grupy różni jedynie to, że osoby z grupy A będą rzeczywiście poddane badaniom właściwym, a osoby z grupy B — nie. Z kolei osoby z grupy A poddane są właściwym badaniom, a osoby z grupy B prosi się, by zachowywały się tak (tzn. udzielały odpowiedzi na pytania testowe), jak wyobrażają sobie, że zachowywać się powinni prawdziwi badani (osoby te grają rolę „prawdziwych" osób badanych — w sensie biernego interpretacyjnego grania roli, por. Greenwood, 1991, s. 184-185). Następnie badacz porównuje rezultaty otrzymane z badania obu grup. Jeżeli okaże się, że rezultaty te są zbieżne, można przypuszczać, że osoby poddane ba- daniom odgadły ich cel. To jednak nie może jeszcze stanowić podstawy do wyda- wania sądu, że odgadnięcie właściwego celu badania było tym, co przede wszy- stkim determinowało zachowanie się osób badanych w trakcie eksperymentu. Naj- 105 lepiej, w celu wyeliminowania wpływu czynnika stronniczości badacza, gdy bada- nie grupy B będzie prowadzone przez innego badacza, takiego, który nie jest zo- rientowany w zachowaniu się osób z grupy A. Osoby badane z grupy B mogą być następnie poddane wywiadowi opisanemu w pkt. 4.2.2.1. 4.2.2.3. Symulacja eksperymentalna W procedurze symulacji eksperymentalnej zadaniem osób badanych jest symulo- wanie rzeczywistego zachowania się osób poddanych oddziaływaniom zmiennych eksperymentalnych. Oczywiście osoby te nie są poddane oddziaływaniom jakich- kolwiek zmiennych. Procedura ta wymaga, by inny badacz planował badanie i ana- lizował jego wyniki, a inny przeprowadzał samo badanie (tak jak to sugeruje Bar- ber, 1991, s. 400). Ten drugi badacz nie wie, że w badanej grupie znajdują się osoby, które nie reagują na zmienne eksperymentalne w sposób naturalny, ale je- dynie symulują to reagowanie. Osoby badane-symulujące powinny być poinformo- wane, że osoba przeprowadzająca badanie nie zna ich statusu. Niedoinformowanie badacza ma na celu kontrolowanie czynnika jego stronniczości. Przykładu zastoso- wania tej procedury dostarczają badania nad hipnozą oraz nad deprywacją senso- ryczną przeprowadzone przez Orne'a i współpracowników (por. Damaser, Shor, Orne, 1963; Orne, 1959b; 1969; Orne, Scheibe, 1964). W badaniach nad hipnozą okazało się, że osoby badane symulujące trans hipnotyczny potrafiły wprowadzić w błąd nawet bardzo wytrawnych zawodowych hipnotyzerów. Naśladowały one zachowanie się „prawdziwych" osób badanych opierając się przy tym tylko na różnych wskaźnikach, jakich dostarczała im sytuacja badawcza. Taki schemat postępowania umożliwia oddzielenie efektu stronniczości bada- cza od efektu WSH. Można także pytać przeprowadzającego badanie, czy osoba badana rzeczywiście zachowuje się tak, jak on to obserwuje, ponieważ jest pod wpływem działania manipulacji eksperymentalnej, np. sugestii hipnotycznej, czy też po prostu symuluje zachowanie się faktycznej osoby badanej. To, w jakim stopniu osoby symulujące kopiują zachowanie się rzeczywistych badanych, jest wskaźnikiem udziału WSH w determinowaniu zachowania się osób badanych. Z te- go, że nie stwierdzono różnic między zachowaniem się osób badanych rzeczywis- tych i symulujących, nie wynika jeszcze, że zaobserwowane zjawiska psychologicz- ne wywołane zostały działaniem WSH sytuacji badawczej. Prawdopodobnie zostały one jednak wywołane, jak sądzi Orne, zadziałaniem zmiennej eksperymentalnej na Y. Niemniej jednak dopiero zarejestrowanie różnic w zachowaniu się osób bada- nych i osób symulujących może nas upewnić, że zmienne WSH nie miały istotnego wpływu na zmienną zależną. 4.2.3. Nowe plany eksperymentalne do badania efektów WSH Chciałbym teraz zaproponować kilka nowych planów eksperymentalnych, które po- zwoliłyby badaczowi kontrolować wpływy omawianych poprzednio czynników za- kłócających trafność uzyskanych w badaniu rezultatów. Chodzi tu o kontrolowanie 106 wpływów WSH sytuacji badawczej, wpływów instrukcji maskujących na zachowa- nie się osoby badanej w trakcie badania i wpływów efektu pretestu. Wprowadźmy następujące oznaczenia, które pomogą nam w symbolicznym przedstawieniu planów eksperymentalnych. I tak: X — zmienna niezależna-główna dla Y (manipulacja eksperymentalna), Yip, ..., Y5p — pomiary początkowe zmiennej zależnej Y, Yxk, ..., Y5k— pomiary końcowe zmiennej zależnej Y, X — symulacja zachowania się w sytuacji badawczej, takiego, jakie wg wy- obrażeń danej osoby potwierdza hipotezę badacza, X — symulacja zachowania się w sytuacji badawczej, jakie wg wyobrażeń danej osoby nie potwierdza hipotezy badacza. Schemat badania z zastosowaniem procedury symulacyjnej wedle Orne'a wy- gląda następująco: (la) X-i x-y (lb) Ylp-X-Ylk 2p "? lk grupa A grupa B grupa A grupa B W planie (la) należy przyjąć założenie, że grupy A i B są losowo równoważ- ne, tzn. „startują" z tego samego poziomu natężenia zmiennej zależnej. Założenie to jednak ma sens tylko wówczas, gdy grupy A i B są dostatecznie liczne. Ponie- waż w psychologii dość często prowadzi się badania na małych grupach, konieczne jest sprawdzenie przed wprowadzeniem manipulacji eksperymentalnej, czy rzeczy- wiście grupy A i B nie różnią się pod względem natężenia zmiennej zależnej. Postulat ten spełnia plan (lb). Jednakże w planie tym nie kontroluje się efektu pretestu, którego kontrola jest bardzo ważna (por. rozdz. 12., pkt. 4.1), zwłaszcza dla badań w zakresie psychologii społecznej (problematyka zmiany postaw). Nale- żałoby zatem przeprowadzić badanie WSH wedle układu opracowanego na kanwie planu Solomona (por. rozdział 12., pkt. 5.1.4 — plan 4.). Ponadto schematy zapro- ponowane przez Orne'a należy uzupełnić o wprowadzenie jeszcze jednej grupy: grupy kontrolnej, gdyż grupa symulująca nie realizuje celów prawdziwej grupy kontrolnej. Jest ona „grupą kontrolną" w innym sensie, gdyż wprowadza się ją w celu wykrycia wpływów WSH na zmienną zależną; tymczasem klasyczną grupę kontrolną wprowadza się dla sprawdzenia, czy zmiany zachowania zarejestrowane po zakończeniu badania rzeczywiście wystąpiły tylko w grupie, która wystawiono na działanie manipulacji eksperymentalnej, a nie wystąpiły w grupie, która była odizolowana od wpływów zmiennej niezależnej-głównej na Y. Łącząc postulat kon- trolowania efektu pretestu zmiennej zależnej z postulatem dołączenia do układu grupy kontrolnej, możemy zaproponować następujący plan eksperymentalny: (2) -X - Ylk grupa A -X- Yn grupa B -K3* grupa C X- Yu grupa D Ysk grupa E 107 Badacz może uznać, że kontrolował w danym badaniu efekty WSH i pretestu zmiennej zależnej, jeżeli wykaże, że: ocena istotności zmiennej X dla Y oraz kontrola efektu pretestu Y, kontrola czynnika dojrzewan ia, = r,„ yM < Yik kontrola WSH. hc Y^ = YU = r5, Jednakże przed przystąpieniem do badań należy wykazać, że: Y — Y — Y Ł \p ~ Ł2p ?* 3p' Stwierdzenie tych równości będzie potwierdzeniem słuszności założenia o równoważności grup porównawczych (ściślej: uprawdopodobnieniem tego założe- nia, gdyż na pięć grup sprawdzamy tylko trzy). Dla bardziej „subtelnych" analiz wpływu WSH na zachowanie się osób bada- nych w trakcie eksperymentu proponuję zróżnicowanie grupy symulującej na dwie podgrupy. Jedna opowiadałaby dotychczasowej grupie symulującej, tzn. starałaby się postępować tak, by potwierdzić nieznaną jej (badacz jej o tym nie informuje) hipotezę badawczą. Druga natomiast miałaby zachowywać się tak, by hipoteza badacza nie została potwierdzona. Jeżeli WSH wpływa na rezultaty badania, to wyniki otrzymane od grupy symulującej życzliwie dla badacza powinny być takie same, jak wyniki otrzymane od grupy poddanej działaniu manipulacji eksperymen- talnej. Analogicznie, wyniki grupy symulującej „nieżyczliwie" dla badacza powin- ny się diametralnie różnić od wyników grupy poddanej działaniu postępowania eksperymentalnego. Jeżeli faktycznie wykonanie grupy eksperymentalnej jest lepsze od wykonania grupy kontrolnej, to wykonanie grupy symulującej „nieżyczliwie" powinno być jeszcze gorsze od wykonania grupy kontrolnej, i na odwrót. W przy- padku, gdy WSH nie miały wpływu na rezultaty badania, grupy symulujące „ży- czliwie" i „nieżyczliwie" powinny uzyskiwać podobne wyniki, jak grupa kontrolna. Zatem schematy: (la), (lb) i (2) można rozbudować do następującej postaci: (la') X-Yik (lb') Y X-Yu ł ip A *ik \* ) + Yip-X- Y\k , Yip-X-Yik grupa A grupa B Yip-K-Yu grupa B' Y}p-Yu _ k _ g^P3 c x-y3ł grupa D Y5 t grupa E Do zapisanych wyżej porównań należy dodatkowo wprowadzić: da') (W) (T) >-** Podane plany są planami eksperymentalnymi, a więc badacz jest zobowiązany do przestrzegania zasady randomizacji (por. rozdz. 12., pkt. 2.3). Stosowanie procedur kontroli efektów WSH w badaniach prowadzonych przez badaczy-psychologów na pewno przyczyni się do poprawienia schematów niejed- nego badania i to na etapie poprzedzających je badań pilotażowych. Podwyższy to w efekcie trafność zewnętrzną tych badań i przyczyni się do zwiększenia stopnia ich powtarzalności. Należy jednak pamiętać, że ani przedstawione powyżej proce- dury quasi-kontrolne, ani nowe plany eksperymentalne nie wyeliminują nam z ba- dania wpływów WSH, pozwolą natomiast poddać je efektywnej kontroli. Dodatko- we korzyści wynikają z przydzielania funkcji badacza dwóm osobom, z których jedna planuje przebieg badania i zna jego cel, a druga zajmuje się jego stroną techniczną — przeprowadza je, wydaje instrukcje i dokonuje niezbędnych pomia- rów zmiennej zależnej w wyróżnionych grupach osób badanych: eksperymental- nych, kontrolnych i symulujących. Ma to na celu kontrolowanie wpływu stronni- czości badacza przeprowadzającego badanie. Nierozpoznanie przez osobę badającą osób symulujących w grupie badanych (wszak nie wie ona, które z nich symulują, a które w sposób naturalny reagują na wpływy manipulacji eksperymentalnej) może być wskaźnikiem osłabionego krytycyzmu badacza, albo też wskaźnikiem postawy przyjmowania wszelkich zachowań osoby badanej „za dobrą monetę" jeżeli tylko w jakimś stopniu „podpadają" one pod wytworzony obraz zachowania się bada- nych, wywołanego oddziaływaniem manipulacji eksperymentalnej. Zauważmy jesz- cze, iż status osób symulujących jest inny niż status osób należących do grup eksperymentalnych i kontrolnych. Są one pomocnikami badacza i od ich chęci współpracy z badaczem (Orne bardzo w nią wierzy) zależy ich użyteczność w wykrywaniu WSH sytuacji (procedury) badawczej. Osoby symulujące zachowanie się „prawdziwych" osób badanych wchodzą w swoistą interakcję z badaczem. Sto- sowanie procedur quasi-kontrolnych przyczynia się zatem do wypracowania takich procedur badawczych, które zbliżają model badania laboratoryjnego do naturalnych badań terenowych. 4.3. Koncepcja lęku osoby badanej przed oceną wystawianą przez badacza, LPO (wg M. J. Rosenberga) 4.3.1. LPO jako zmienna pośrednicząca Przejdźmy teraz do omówienia kolejnej najważniejszej — moim zdaniem — zmiennej pośredniczącej, to jest LPO. LPO, tak jak ją określił Rosenberg (1965 — poi. wyd. 1991a), jest najważniejszą zmienną „podmiotową" (charakteryzującą na- 109 stawienia osoby badanej w sytuacji wystawienia jej na potencjalną krytykę innych osób — w szczególności badacza), pośredniczącą przy oddziaływaniu na zachowa- nie się osoby badanej w sytuacji badania psychologicznego takich zmiennych, jak: WSH, OIB, gotowość osoby badanej do współpracy z badaczem. Wprowadzony przez Rosenberga konstrukt LPO pozwala na głębsze zrozu- mienie istoty interakcji: „badacz — osoba badana". Badacz nawiązując kontakt z osobą badaną musi w swoim postępowaniu wziąć pod uwagę to, że spostrzega ona relację zachodzącą między nimi jako relację niesymetryczną. To badacz ocenia, a osoba badana jest oceniana, a nie na odwrót. W tym kontakcie ulega zderzeniu koncepcja własnego ,ja" (dokładniej: to, jaką osoba badana sama siebie widzi i jaką chciałaby być widziana przez innych) z obrazem zdrowia psychicznego, poziomu intelektualnego, przystosowania społe- cznego, umiejętności funkcjonowania społecznego itp., który wyłania się z prze- prowadzonego przez badacza badania. Obraz ten na ogół odbiega od tego, co o samej sobie sądzi osoba badana. Chce ona uniknąć takiej konfrontacji obu obrazów. Gdy jednak jest to nieuniknione, gdy musi się wystawić na ocenę badacza, to pojawia się u niej uczucie niepokoju. Niepokój — Rosenbergowski LPO — w zależności od stopnia jego nasilenia, będzie blokował spontaniczność zachowania się osoby badanej w sytuacji badawczej. Niepokój ten może się także stać podstawą tendencyjnego postrzegania intencji kierujących badaczem, analizującym poszcze- gólne sfery funkcjonowania osoby badanej. Zrodzony w ten sposób brak zaufania do badacza skutecznie może przesądzić o niekorzystnym (z metodologicznego pun- ktu widzenia) rozwoju interakcji: „badacz — osoba badana". Należy tedy, za wszel- ką cenę, starać się zredukować poziom LPO u osoby badanej, zanim przystąpi się do zbierania danych. Sam Rosenberg tak opisał wprowadzoną przez siebie nową zmienną (Rosen- berg, 1991a, s. 34-35): „Zakłada się, że typowy badany ujmuje typowy ekspery- ment psychologiczny opierając się na wstępnym założeniu, że psycholog może podejmować próbę oceny jego przystosowania emocjonalnego, zdrowia psychicz- nego, czy też jego braku. Przedstawiciele opinii publicznej łącznie ze studentami młodszych lat psychologii zazwyczaj już wiedzą (pomimo naszych okazjonalnych wysiłków mających na celu wykazanie, że jest na odwrót), że osoby, których praca obejmuje umiejętności i zainteresowania psychologiczne posiadają specjalne zdol- ności wykrywania powyższych właściwości i stanów. Nawet wówczas, kiedy ba- dany jest przekonany o tym, że nie bada się bezpośrednio jego przystosowania, przypuszczalnie sądzi on, że eksperymentator winien być uwrażliwiony na wszy- stkie zachowania, które świadczą o złym przystosowaniu albo o niedojrzałości. Występujące w eksperymencie początkowe podejrzenie badanego, że może zostać on poddany ocenie, będzie zazwyczaj potwierdzane lub odrzucane (w zależ- ności od tego, jak to jest spostrzegane we wczesnych stadiach kontaktu z ekspe- rymentatorem). Gdy jest ono potwierdzane lub też, gdy podejrzenie to jest potwier- dzane w pewnym stopniu, typowy badany będzie prawdopodobnie przeżywał lęk przed oceną; jest to aktywne, zabarwione lękowo zainteresowanie dotyczące tego, czy (badany) uzyska ocenę pozytywną ze strony eksperymentatora albo czy przy- 110 najmniej nie stworzy podstawy do oceny negatywnej. Zmienne osobowościowe będą w pewnym stopniu wiązały się z zakresem działania tego lęku. Lecz równie ważne są różne aspekty modelu eksperymentalnego, takie jak wyjaśnienia udzielane przez eksperymentatora, rodzaje wykorzystywanych miar, a także same manipulacje eksperymentalne. Takie czynniki mogą działać z równą siłą we wszystkich kombinacjach wa- runków eksperymentalnych; lecz tu skoncentrujemy się na kłopotliwej sytuacji, w której różnice zabiegów stosowanych wobec kolejnych grup eksperymentalnych wywołują zróżnicowany poziom wzbudzenia i potwierdzenia lęku przed oceną. Szczególną trudność związaną z tym stanem rzeczy stanowi fakt, iż badani w grupach przeżywających wysoki poziom lęku przed oceną będą bardziej podatni na interpretowanie instrukcji i wyjaśnień podawanych przez eksperymentatora oraz stosowanych przez niego miar jako związanych z reakcjami, które mogą być roz- patrywane jako normalne albo patologiczne, dojrzałe albo niedojrzałe. Innymi sło- wy, będą oni wysuwali hipotezy na temat tego, jak uzyskać ocenę pozytywną albo jak uniknąć oceny negatywnej. Ponieważ badani w takiej grupie eksperymentalnej wykazują dostateczne podobieństwo w zakresie percepcyjnego ujęcia sytuacji, doj- dą oni niezależnie od siebie do bardzo podobnych hipotez. Z kolei podobieństwo to może wpływać w systematyczny sposób na reagowanie w eksperymencie w taki sposób, który sprzyja fałszywemu potwierdzeniu oczekiwań eksperymentatora". Jeżeli prześledzić różne artykuły stanowiące raporty z badań psychologicz- nych, wyłania się z nich obraz osoby badanej jako takiej, która jest pozytywnie nastawiona do badacza i do roli, jaką on jej naznaczył. Zakłada się także, że osoba badana w każdej sytuacji chce współpracować z badaczem bez względu na konse- kwencje dla jej samopoczucia, jakie niesie ta współpraca. Mało przy tym zwracano uwagi na fakt, że uczestniczenie w badaniach naukowych jest formą wystawiania się osoby badanej na ocenę, że różne elementy jej obrazu siebie samej mogą, po wysłuchaniu przewidzianych dla danego badania instrukcji maskujących i po per- cepcji WSH sytuacji badawczej, ulec niekiedy dość daleko idącym zmianom (tym bardziej, że skuteczność zabiegów wyprowadzających osoby badane z sytuacji ba- dawczej jest dość problematyczna). Z drugiej strony wiemy, jak trudno wywołać zmiany w obrazie siebie samego u osób o pozytywnej i stabilnej samoocenie, zwłaszcza, gdy zmianom mają podlegać tzw. osiowe elementy obrazu siebie same- go. Z kolei u osób o chwiejnej, niestabilnej samoocenie (w sensie: Brzezińska, Kofta, 1975), o nieadekwatnej kontroli emocjonalnej (w sensie: Kofta, 1979) wy- stępuje tendencja do unikania sytuacji, w których mogłyby one być wystawione na krytykę własnego „ja". Mówiąc inaczej, starają się one, niekiedy za wszelką cenę, nie przyjmować informacji sprzecznych z wytworzonym obrazem siebie samego. Wszelkie informacje zagrażające poczuciu własnej wartości takiej osoby stają się dla niej bardzo dolegliwe, gdyż nie umie ona sobie z nimi poradzić. Jeżeli teraz postawimy taką osobę w sytuacji badania psychologicznego, w której badacz ma- nipuluje instrukcjami stresującymi, to znajdzie się ona w sytuacji autentycznego konfliktu. Z jednej strony chciałaby wypełniać rolę dobrej osoby badanej, a z dru- giej — nie chce dopuścić do tego, by okazało się, że pod jakimś względem jest 111 gorsza niż to sobie wyobrażała. Tym co determinuje zachowanie się osoby badanej w takiej i podobnych sytuacjach jest właśnie zmienna LPO Gdyby przeprowadzić badanie posteksperymentalne, takie jak opisane niżej, okazałoby się, że osoby badane zadawałyby m. in. takie pytania: , Jaki był prawdzi- wy cel eksperymentu?", „Czy badacz nie wykorzysta wyników badań przeciwko mnie?", „Czy wypadłem zadawalająco?", „Czy zachowywałem się jak inni normal- ni ludzie?", „Czy reagowałem inteligentnie?". Osoby badane, które nurtują podobne problemy będą reagowały w sposób lękowy na zmienne niezależne wprowadzane przez badacza. W efekcie badacz otrzyma fałszywy obraz zależności między daną zmienną niezależną-główną dla Y i zmienną zależną. Z badań przeprowadzonych przez Rosenberga i współpracowników, które w skrócie zreferuję, wynika, że raz wywołany u osób badanych LPO będzie w istotny sposób wywierał wpływ na zmienną zależną i że wpływ ten nie tylko wywołuje wzrost wariancji błędu, ale także powoduje „nachylenie" wyników zmiennej zależ- nej bądź w jednym, bądź w drugim kierunku na kontinuum jej wartości. Naraża to badacza na formułowanie fikcyjnych wniosków. W tym kontekście niezmiernie ważne staje się wychwycenie czynników, które mogą przyczyniać się do powsta- wania u osób badanych LPO. Poznanie czynników tkwiących w sytuacji badawczej i w samym badaczu może istotnie obniżyć wpływ LPO na rezultaty badania psy- chologicznego. 4.3.2. Dwie metody badania wpływu LPO na wyniki badania psychologicznego Przedstawię teraz (za: Rosenberg, 1991b) dwie metody badania wpływów zmiennej LPO na zmienną zależną. 4.3.2.1. Metoda powtórnego przeprowadzenia badania wg zmienionego scenariusza Metoda polega na powtórnym przeprowadzeniu tego samego badania, ale wedle zmienionego scenariusza. Zmiany wprowadzane do scenariusza badania mają na celu wyeliminowanie tych elementów procedury badawczej, które mogą być hipo- tetycznymi czynnikami wywołującymi u badanych LPO. Jeżeli po przestrukturowa- niu badania okaże się, że prowadzi ono do takich samych rezultatów, prawdopo- dobne jest, że w danym badaniu u osób badanych nie wystąpił LPO, przynajmniej w tych fazach, które zostały przez badacza skorygowane. Jeżeli natomiast zastąpie- nie elementów lękotwórczych procedury badawczej elementami lękowo obojętnymi da w efekcie wyniki odmienne od pierwotnie otrzymanych, powinno to być dla badacza sygnałem, iż zmienna LPO w tym badaniu nie była czynnikiem obojętnym z punktu widzenia trafności tego badania. Przeanalizujmy teraz przykład stanowiący ilustrację zastosowania tej metody. Posłużył się nią Rosenberg przy sprawdzaniu trafności hipotez dotyczących dyso- nansu poznawczego. Chodziło mu głównie o hipotezę głoszącą, iż w warunkach wysokiej nagrody dochodzi do mniejszych zmian postaw niż w warunkach niskiej 112 nagrody, gdyż w pierwszej sytuacji u danej jednostki występuje dysonans o niższym natężeniu niż w drugiej. W badaniach, które potwierdziły tę hipotezę, a przeprowa- dzonych przez Cohena (por. Brehm, Cohen, 1962), jako nagrody używano określo- nej sumy pieniędzy. Stawiało to badanych, zwłaszcza tych w warunkach dysonansu o niskim natężeniu (wysoka nagroda pieniężna), w dość dwuznacznej i kłopotliwej, przynajmniej dla części z nich, sytuacji. Mogli oni przecież postrzegać oferowaną im sumę jako próbę przekupienia za dokonanie zmian swoich poglądów, postaw, ten sposób percepowana sytuacja badawcza wytwarzała (czy ostrożniej: mogła wytwarzać) u osoby badanej zagrożenie, że może być ona potraktowana przez ba- czą jako przekupna albo, że całe badanie w rzeczywistości przeprowadzane jest ylko po to, by badacz mógł się przekonać, które z osób pod wpływem odpowied- lich sum pieniężnych łatwo godzą się na zmianę własnych poglądów. Badania przeprowadzono na grupie studentów Uniwersytetu w Yale. Zadaniem ianych było napisanie eseju na temat: „Dlaczego działania policji w New Haven były usprawiedliwione?". Chodziło tu o akcję sił policyjnych po zajściach, jakie miały miejsce na kampusie. Akcja ta spotkała się z negatywną oceną ze strony studentów. Zatem „wypracowanie", jakie mieli napisać badani, było sprzeczne z ich postawami wobec policji. Badacz podzielił studentów na podgrupy. Jako na- grodę badani otrzymywali: 0,50 dol., 1 dol., 5 dol., 10 dol. Po napisaniu eseju wypełniali ankietę, która dotyczyła stopnia aprobaty działań policji na terenie uni- wersytetu. Na koniec osoby badane miały podać argumenty, jakimi posłużyły się w trakcie pisania niezgodnego z ich poglądami eseju. Otrzymane rezultaty potwier- dziły oczekiwania Cohena. Grupa o najniższej nagrodzie (0,50 dol.) wykazała sto- sunkowo największą zmianę postaw w kierunku propolicyjnym, a grupy o nagro- dach najwyższych (5 i 10 dol.) nie różniły się od grupy kontrolnej, która bez jakiejkolwiek obrony postawy przeciwnej wypełniała ankietę dotyczącą słuszności działań policji. Rosenberg kwestionuje te rezultaty mówiąc, że stopień zmian postaw będzie funkcją rosnącą wielkości nagrody pieniężnej, a nie jej funkcją malejącą, jak to wynika z badań Cohena. Dlaczego? Rezultaty Cohena można wytłumaczyć w ka- tegoriach lęku przed oceną. Zresztą przeprowadzając podobne badania, ale z wy- eliminowaniem z procedury badawczej elementów wzbudzających lęk przed oceną, Rosenberg (199la) otrzymał wyniki, które potwierdzały zasadność jego zarzutów stawianych Cohenowi. Jego zdaniem dostarczanie osobom badanym w niektórych eksperymentach psychologicznych wysokich nagród dla wywołania argumentów skierowanych przeciwko ich postawom może im się wydać dziwne i mogą one uważać eksperymentatora za osobę, która traktuje je nieszczerze. To z kolei wy- wołuje u nich poczucie, że poddane są jakiejś próbie, ocenie. W ten sposób u osoby badanej może wytworzyć się dość silny LPO, który będzie modyfikował jej zacho- wanie się. Niewspółmiernie wysoka — zdaniem osoby badanej — nagroda powo- duje, że zaczyna ona podejrzewać, iż zasadniczym celem badania jest sprawdzenie jej uczciwości, odporności na pokusy czy też nieprzekupności. Na końcu tego łań- cucha domysłów może leżeć stwierdzenie: „Muszę twardo trzymać się swoich wcześniej wyrażonych poglądów, gdyż inaczej potraktuje mnie on jako przekupne- I — Metodologia badań.. 113 go!". W rezultacie odpowiedzi osoby badanej w ankiecie do badania zmian postaw będą obciążone efektem nastawienia odpowiedzi (ang. response-set). Aby wyeliminować z badania Cohena LPO należałoby — jak sugeruje Rosen- berg — podzielić badanie na dwie fazy: pierwszą, obciążoną LPO, w której badacz wywołuje dysonans, i drugą, obojętną, w której badacz dokonuje pomiaru postaw. Badanie powinno być realizowane przez dwóch badaczy pozornie nie mających ze sobą nic wspólnego. W ten sposób negatywne emocje wyzwolone przez badacza oferującego „łapówkę" kosztem domniemanej autonomii osoby badanej nie wpły- wałyby na jej odpowiedzi w ankiecie stosowanej przez drugiego badacza, w cał- kowicie innym badaniu — jak to sugeruje się osobom badanym. Rosenberg zdaje się jednak nie dostrzegać jednego, a mianowicie tego, że mamy do czynienia z klasycznym problemem stosowania instrukcji maskujących drugiego rodzaju (dla zamaskowania instrukcji pierwszego rodzaju). Możemy snuć obawy, czy rzeczywiście wszystkie osoby badane dadzą się przekonać, że nie ma związku pomiędzy jednym a drugim badaniem. W każdym razie badania przepro- wadzone przez Rosenberga nad dysonansem poznawczym z wyżej omówionymi modyfikacjami okazały się zgodne z jego oczekiwaniami1. Zostały one także po- twierdzone przez Lindera, Coopera i Jonesa (1967). 4.3.2.2. Metoda manipulowania pobudzeniem emocjonalnym Kolej teraz na przedstawienie drugiej metody. Jest to metoda manipulowania po- budzeniem emocjonalnym i dostarczania odpowiednich wskazówek zachowania się. Zacznijmy od opisu eksperymentu. Dwóm grupom osób badanych zaproponowano udział w badaniu percepcji społecznej. Badani mieli oceniać stopień, w jakim „lubią", bądź „nie lubią", przedstawione im na fotografiach osoby. Badanie zostało poprzedzone informacją, że reakcje „lubienia—nielubienia" są skorelowane z osobo- wością, a szczególnie z dojrzałością psychiczną osoby oceniającej fotografie. Pier- wszej grupie powiedziano następnie, że osoby dojrzałe i zdrowe psychicznie udzie- lały raczej odpowiedzi typu „lubienie". Drugą grupę poinformowano, że osoby niedojrzałe i psychicznie niezdrowe wykazywały tendencje do udzielania odpowie- dzi typu „nielubienie". Obie grupy zostały dodatkowo poinformowane, że poprze- dnie badania, które dostarczyły odczytanych im wniosków, prowadzone były w takiej postaci, że każdorazowo osoba badana ustosunkowywała się do innej „żywej" osoby. Teraz badaczowi chodzi o sprawdzenie, czy te wnioski można odnieść także do fotografii. Wcześniej jednak — jak dalej informowano osoby badane — nie- zbędne jest wystandaryzowanie fotografii w celu określenia stopnia, w jakim wy- zwalają one reakcje „lubienia—nielubienia". Oczywiście, jak sugerowano, standary- zacja fotografii wolna będzie od oceny osobowościowej badanych. Ocena ta zosta- nie przeprowadzona później poprzez porównanie uzyskanych szacunków z ocenami zebranymi od osób o określonych cechach osobowości. Czytelnikowi polecani zapoznanie się z wnikliwą krytyką eksperymentu Rosenberga i jego interpretacji hipotezy dysonansu poznawczego przeprowadzoną przez Nuttina (1982). 114 Rzecz jasna, że takie instrukcje musiały wywołać uczucie zagrożenia przypi- sania domniemanej cechy osobowości i to w nieprzyjemnych dla badanych kate- goriach braku dojrzałości i zdrowia psychicznego. Są to dość typowe odczucia, jakie wywołują u większości osób badanych eksperymenty psychologiczne. Z kolei przez dostarczanie różnych wskaźników (informacje o tym, co pokazały poprzednio przeprowadzone badania) wprowadzano do eksperymentu zmienne WSH. Trzecią grupą badawczą, o której tu jeszcze nie było mowy, była grupa kon- trolna. Otrzymała ona tylko krótki, neutralny komunikat — bez celowego wprowa- dzania zmiennych: LPO i WSH. Gdyby nie stwierdzono różnic w odpowiedziach tych grup, świadczyłoby to, że albo nie udało się wywołać efektu oddziaływania na zmienną zależną zmiennej LPO, albo też, że zmienna ta nie miała wpływu na zachowanie się osób badanych w sytuacji eksperymentu psychologicznego. Rezultaty okazały się bardzo interesujące. Dla 12 fotografii mężczyzn (każda szacowana na skali 21-punktowej: od -10 do +10) obliczono sumę punktów uzy- skanych od każdej osoby badanej oraz średnie arytmetyczne (oddzielnie dla kobiet i mężczyzn). Do porównań międzygrupowych zastosowano test f/-Manna-Whit- neya. Rezultaty przedstawiam niżej: grupa zorientowana na „lubienie" grupa kontrolna grupa zorientowana na „nielubienie" mężczyźni: +23,20 -11,25 -8,65 a < 0,0001 11 n.i. 1 L a < 0,0001 1 kobiety: +25,90 +4,15 -25,45 1 a<0,03 ^ _tt _ ?:.'J niektórzy z nich, mają tendencję do nadmiernego uogólniania wniosków z prze- prowadzonego, nie tak rzadko na próbach wcale nie reprezentatywnych, badania empirycznego. Przykładem takiego dość spektakularnego nadużycia jest sporządza- nie norm testowch (chodzi o testy psychologiczne) na podstawie badań przeprowa- dzonych na próbach skompletowanych z osób, do których badacz ma stosunkowo łatwy dostęp: np. taką „łatwo" dostępną populacją dla psychologów-pracowników uniwersyteckich są studenci. Niestety w parze z ową łatwością nie idzie wysoka trafność przeprowadzonych na takich próbach badań. Nie można bowiem standa- ryzować i normalizować jakiegoś testu na próbie studentów, a potem stosować go nie tylko do studentów, czy przede wszystkim do nie-studentów. Żeby nie być gołosłownym, przytoczę tu, tytułem przykładu, skład próby normalizacyjnej dla polskiej adaptacji kwestionariusza osobowości CP/-Gougha — „1100 studentów różnych kierunków studiów..." (Choynowski i inni, 1968, s. 221). 3.3. Nastawienie na potwierdzanie hipotez — „pomaganie" hipotezom Tak jak w pkt. 3.1 mówiliśmy o ukrywaniu niedoskonałości warsztatowych bada- nia, którego wyniki badacz zdecydował się opublikować, tak tutaj zajmiemy się aspektem etycznym takiego postępowania badacza, które nastawione jest na po- twierdzenie — „za wszelką cenę" — swojej hipotezy roboczej. Owe „wyrozumiałe" traktowanie przez badacza hipotezy roboczej może ujawniać się w dwóch fazach: (a) w fazie planowania i prowadzenia samych badań empirycznych oraz (b) w fazie przygotowywania do druku raportu z tych badań. Taka praktyka badawcza jest dokładną odwrotnością dyrektyw płynących z metodologii popperowskiej, która pokazuje badacza jako tego, który szuka — i to niekiedy z niemałym trudem — przypadków obalających jego hipotezę roboczą, a nie jako osobę skrzętnie zbiera- jącą wszystkie te przypadki, które właśnie potwierdzałyby hipotezę. To, że badacze chętniej rejestrują przypadki „za", niż „przeciw" i że tym pierwszym dają większy „posłuch", można jeszcze od strony psychologicznej zro- zumieć iyide Rosenthala koncepcja efektu oczekiwań interpersonalnych opisana w pkt. 3. rozdz. 4.), ale trudniej zrozumieć decyzje wydawców specjalistycznych cza- sopism naukowych, którzy niechętnie (jeżeli w ogóle) podejmują się druku artyku- łów, w których autorzy donoszą, iż w efekcie przeprowadzenia kosztownych i żmudnych badań obalili własną hipotezę roboczą. Za obalenie hipotezy (własnej!) też nie otrzymuje się — na ogół — tytułu magistra czy stopnia naukowego. Są to, moim zdaniem, główne czynniki odpowiedzialne za to, że psycholog — spoza danego zespołu badawczego — niewiele wie na temat już odrzuconych hipotez i zmuszany bywa do wchodzenia jeszcze raz na ścieżkę, która prowadzi donikąd — marnując przy tym czas i środki finansowe. Interesujące badania na temat decyzji podejmowanych przez redakcje czaso- pism naukowych w sprawie artykułów zdających sprawę z badań, które nie zakoń- 148 czyły się sukcesem w postaci odrzucenia hipotezy zerowej (Ho), przeprowadził przed laty Sterling (1959). Przeanalizował on cztery prestiżowe amerykańskie na- ukowe pisma psychologiczne (po jednym kompletnym roczniku z każdego tytułu). Na ogólną liczbę 264 artykułów, w których posłużono się testami istotności różnic w celu ewentualnego odrzucenia Ho opublikowano aż... 8 artykułów (co, jak łatwo obliczyć, stanowiło niecałe 3% wszystkich opublikowanych artykułów), których autorzy donosili, iż nie udało im się odrzucić hipotezy zerowej, a tym samym potwierdzić swojej hipotezy roboczej. Warto też przytoczyć słowa A. W. Meltona, przez 12 lat redaktora czasopisma „Journal of Experimental Psychology": „...przy wydawaniu «Journal» istniała silna niechęć do akceptowania i publikowania wyni- ków badań, gdy owe wyniki były istotne na poziomie 0,05 (zwracam uwagę na podniesienie poprzeczki, jeśli chodzi o poziom istotności różnic, co jeszcze bardziej zwiększyło liczbę odrzucanych przez redakcję artykułów — J.B.), niezależnie od tego, czy test był jedno- czy dwustronny. Nie implikuje to niewolniczego zachwytu dla poziomu 0,01, jak mogliby zarzucić nam krytycy. Odzwierciedla to raczej prze- konanie, iż istnieje odpowiedzialność badacza dotyczącą takiego ustalania rezulta- tów badań, by żaden rozsądny człowiek nie mógł tych rezultatów zdyskredytować poprzez stwierdzenie, iż są one bez pokrycia..." (Melton, 1962). Jak sądzę, taka praktyka kwalifikowania do druku artykułów staje się szybko rozpoznawalna przez potencjalnych autorów. Jedną z jej konsekwencji, jest niechęć badaczy, zwłaszcza młodych, dopiero zaczynających kolekcjonowanie artykułów, do podejmowania prób opublikowania artykułów mówiących o różnicach — mię- dzy, np. grupami: eksperymentalną i kontrolną — występujących na poziomie „le- pszym" od a = 0,05. Taka polityka wydawnicza sprzyja powstawaniu artefaktów, gdyż — zwłaszcza w czasach powszechnej dostępności bogatych i łatwych w uży- ciu pakietów statystycznych w rodzaju SPSS PC+, czy CSS STATISTICA — ba- dacze, których cechuje niższy poziom rygoryzmu etycznego w odniesieniu do standardów własnej pracy naukowej, będą tak długo przeliczać, za pomocą różnych dostępnych testów istotności różnic, wyniki własnych badań empirycznych, aż uzy- skają pożądany poziom istotności 0,01, czy „tylko" 0,05. Zauważmy jeszcze, że stwarzanie takiej bariery zaporowej, pod postacią wskaźnika a, wyzwala u badaczy dość silną motywację do „poprawiania" wyników surowych w kierunku ich zgodności z testowaną hipotezą. Oto próbka takiej mo- żliwej racjonalizacji: „odrzucam skrajne wyniki, gdyż dokładniejsza analiza zacho- wania się tych osób badanych w trakcie eksperymentu wskazuje na to, że zacho- wywały się one tendencyjnie" (albo inne sformułowanie, które też może być wy- korzystane — „nienaturalnie"). Bogata wiedza z zakresu statystyki oraz umiejęt- ność posługiwania się pakietami statystycznymi, przy jednoczesnych brakach w etyce zawodowej, mogą przyczyniać się do tego, że badacz będzie wprowadzał „poprawki" do wyników badań, i że będą one trudno wykrywalne. W pogoni za „wynikami statystycznie istotnymi" badacze starają się przebadać jak najwięcej osób, nie zdając sobie niekiedy sprawy z faktu, że tym samym fa- woryzują hipotezę roboczą (maksymalizacja błędu I rodzaju — piszę o tym w rozdz. 12.). Zwiększając tylko liczebność grup porównawczych możemy doprowa- 149 dzić do tego, że potwierdzimy istotność statystyczną nawet najbardziej trywialnego związku między zmiennymi. Hays, autor uznanego i wznawianego (cztery wydania do roku 1981) w USA podręcznika statystyki, adresowanego do przedstawicieli nauk społecznych, a więc i psychologii, jeden z podrozdziałów zatytułował zna- miennie: Can a sample size be too large? („Czy próba badawcza może być za duża?")- Na tytułowe pytanie odpowiada on twierdząco (Hays, 1973, s. 422). Dlatego też — jak o tym piszę w rozdz. 12.-14. — w miejsce wskaźnika a, używanego w roli miernika ważności jakiejś zmiennej niezależnej X dla danej zmiennej zależnej Y, należy posługiwać się pojęciem wariancji zmiennej zależnej, wyjaśnianej wpływem na tę zmienną danej zmiennej niezależnej (np. wspomniany tu Hays zaproponował taki wskaźnik, który nazwał mianem co2 — „omega-kwa- drat"; może być on stosowany w miejsce statystyki t czy statystyki F; (por. pkt.7. rozdz. 12.). Zilustrujmy to, co zostało tu krytycznie powiedziane o kryterium a, wynikami badań przeprowadzonych przez Bąkana (1966). Nawiasem mówiąc, nie są to jedyne badania na ten temat ukazujące jak niedoświadczony (w statystyce) badacz i mało krytyczny czytelnik mogą być wyprowadzeni na manowce, jeżeli swoją wiedzę o sile wpływu jakiejś zmiennej na inną zmienną opierać będą na wielkości a. Bakan przeprowadził za pomocą testów istotności różnic różnorakie porównania między- grupowe, które objęły aż... 60 tys. osób przebadanych za pomocą baterii testów psychologicznych. I cóż się okazało? Jak nietrudno się domyśleć, wszystkie prze- prowadzone porównania były istotne statystycznie. Między tymi porównaniami znalazły się i tak „egzotyczne", jak: „grupa osób mieszkających na wschód od rzeki Missisipi versus grupa osób mieszkających na zachód od Missisipi", „osoby ze stanu Maine versus osoby z pozostałych stanów", „osoby mieszkające na Północy versus osoby mieszkające na Południu". Gdyby jednak w ślad za testami istotności różnic zastosowano jakieś mierniki w rodzaju wspomnianego już wskaźnika „ome- ga-kwadrat" Haysa, to okazałoby się, jak niewielki procent wariancji wspólnej mają te zmienne. 3.4. Intersubiektywna kontrolowalność rezultatu badawczego — problem repetycji badań psychologicznych Dla rozwoju badań naukowych ważne jest nie tylko powstawanie (i publikowanie) oryginalnych prac badawczych, donoszących o odkryciach nowych zależności mię- dzy zmiennymi, ale także ogłaszanie drukiem dwojakiego rodzaju innych prac. Jedne, już w poprzednim punkcie wspominane, informują społeczność uczonych o nieudanych próbach potwierdzenia jakiejś hipotezy roboczej (lub mówiąc językiem statystyki — o nieudanej próbie odrzucenia Ho). Drugie zaś, to prace powtarzające badania już wcześniej przez kogoś wykonane. Chciałbym mocno zaakcentować to, iż możliwość powtórzenia cudzych badań i opublikowania ich w specjalistycznym periodyku przyczynia się, i to istotnie, do zwiększenia stopnia intersubiektywnej 150 kontrolowalności badań naukowych. Zdaniem Campbella (1969) metoda powtarza- nia badań jest jedną z głównych metod kontrolowania artefaktów. Powtarzanie badań umożliwia też dokonywanie korekt, które mogą mieć istotny wpływ zarówno na rzetelność samych badań, jak i na ich trafność. Mówiąc krótko, możliwość powtórzenia badań jest niezbędna jako forma korekty wiedzy naukowej (podobny pogląd na ten temat przedstawił Lamal, 1991). Jeżeli tak wielką rolę — i słusznie — przypisuje się repetycji już przeprowa- dzonych, przez kogoś innego, a więc nieoryginalnych badań, to powinno się też stworzyć warunki ułatwiające opublikowanie ich rezultatów. I chociaż wszyscy specjaliści wypowiadają się „za" — por. np. tom kilkudziesięciu prac na ten temat: Replication research in the social sciences (Neuliep, 1991) — to praktyka wy- dawnicza jest przekorna i w pismach fachowych niewiele można znaleźć badań stanowiących repetycje badań już przeprowadzonych. Wróćmy do wyników badań Sterlinga (1959), o których wspomnieliśmy w pkt. 3.3. Na ogólną liczbę 362 prze- analizowanych artykułów opublikowanych w czterech liczących się periodykach psychologicznych, nie było ani jednego artykułu referującego wyniki pochodzące z powtórzenia badań. Czy nie jest to znamienne? Taka praktyka wydawnicza jest szybko rozpoznawana przez początkujących badaczy, którzy nie chcą angażować swego czasu i środków finansowych w przedsięwzięcie, które z punktu widzenia rozwoju ich kariery naukowej nie ma żadnego znaczenia. Wszak trudno wpisać sobie w rocznym sprawozdaniu jako publikację, coś co nie stało się nią na skutek właśnie takich upodobań wydawców czasopism naukowych w naukach społecz- nych. Młody, i nie tylko młody, badacz „goni" za publikacjami, gdyż ich liczba (zwłaszcza gdy są one zamieszczone w renomowanych pismach) jest główną pod- stawą awansu naukowego na kolejny stopień naukowy i kolejne stanowisko w akademickiej drabince awansowej. Wszystkim badaczom znane jest powiedzenie, które przywędrowało z amerykańskich uniwersytetów: publish or perish (publiko- wać lub zginąć). To, że tak trudno opublikować replikacje czyichś badań, stwarza zagrożenie dla działania normy intersubiektywnej kontrolowalności wyników badań naukowych. Obniżeniu ulega lęk badaczy przed oceną ich ze strony innych bada- czy, gdyż prawdopodobieństwo tego, że ich badania zostaną przez kogoś powtó- rzone, i że na dodatek ich wyniki będą opublikowane, jest tak niewielkie, że mogą oni spokojnie spać nie niepokojąc się o to, że zostaną wykryte ewentualne błędy oraz niedociągnięcia warsztatowe — zwłaszcza w zakresie analizy statystycznej danych, która zawsze stanowiła piętę achillesową psychologów. Zauważmy jeszcze i to, że przy ocenie powtórzonych wyników badań też bierze się pod uwagę kry- terium a. Rosenthal (199Id) w swoim metodologicznym wprowadzeniu do tomu prac poświęconych tematyce replikacji badań w naukach społecznych przytacza (s. 14) tabelkę decyzyjną wykorzystywaną przy ocenie sukcesu lub fiaska w po- wtórzeniu jakichś badań. Zauważmy, iż kryterium decyzyjnym jest znowu poziom istotności statystycznej er. Zarówno pierwsze badanie (podstawowe), jak i drugie (replikacja) oceniane są za pomocą dychotomicznego kryterium: „er < 0,05; cr> 0,05". Tylko w sytuacji, gdy oba badania spełniają kryterium: a < 0,05 replikacje uznaje się za skuteczną. Sytuacje: (a) pierwsze badanie — a < 0,05 , drugie badanie 151 — a > 0,05 oraz (b) pierwsze badanie — a > 0,05, drugie badanie — a < 0,05 uznaje się za niepowodzenie replikacji. Podsumowując, chciałbym przekonać początkujących badaczy, a wszak do nich przede wszystkim adresowany jest niniejszy podręcznik, iż należy tak przed- stawiać stronę warsztatową badania empirycznego (METODOLOGIA!), aby możli- we było dokonanie jego replikacji. 4. Podsumowanie W dwóch punktach niniejszego rozdziału skupiłem się na kilku aspektach tradycyj- nie pojmowanego (a więc na wzór bardziej dojrzałych metodologicznie dyscyplin empirycznych, takich jak: fizyka czy biologia) badania empirycznego w psychologii (przede wszystkim eksperymentu — wszak z niego, z laboratorium Wundta, wzięła się cała naukowa psychologia!), które rodzą problemy natury etycznej. Ideą naczelną tego rozdziału (i w jakiejś mierze również następnego — też „etycznego") jest przekonanie badacza, głównie tego „na starcie", że równie ważne (a w moim głębokim przekonaniu — ważniejsze!) jak przestrzeganie dyrektyw metodologicznych zawartych w podręcznikach metodologii (jak choćby ten, który Czytelnik akurat przegląda) jest respektowanie dyrektyw etycznych spisanych w kodeksach etyki zawodowej psychologów czy pracowników nauki. W niniejszym rozdziale starałem się zapoznać Czytelnika z czterema takimi kodeksami. Najbardziej z nich ogólne, to dwa kodeksy — polski i amerykański — regulujące całokształt postępowania (nie tylko badawczego) psychologa. Kolejny kodeks reguluje postępowanie psychologa jako badacza względem li tylko osób badanych. Ostatni zaś z kodeksów odnosi się do postępowania „pracownika nauki" (nie tylko rzecz jasna psychologa uniwersyteckiego, ale każdego badacza związa- nego ze zinstytucjonalizowaną nauką). Na tle różnych kodeksów regulujących na płaszczyźnie etycznej działalność zawodową psychologów, polski Kodeks etyczno-- zawodowy psychologa wyróżnia się tym —jak to podkreślił Strelau (1994, s. 113) — że „...z niespotykaną konsekwencją podkreśla godność i podmiotowość człowie- ka oraz jego prawo kierowania się w relacji psycholog-osoba badana, klient czy pacjent własnym systemem wartości i możliwością dokonywania wyborów. W pra- ktyce psychologicznej uznaje priorytet klienta. (...)Zasady KEZP zmierzają w kie- runku minimalizacji, co więcej, likwidacji, niesymetrycznej relacji między psycho- logiem-badaczem a osobą badaną, między psychologiem-praktykiem a klientem (pacjentem), a także między psychologiem-nauczycielem a studentem". Uważam, że każdy absolwent studiów psychologicznych powinien opuszczać uczelnię nie tylko z dyplomem w ręce,ale także winien być zaopatrzony w egzemplarz Kodeksu. Zaś psychologowie-nauczyciele powinni zadbać o to, aby zawarte w kodeksie re- gulacje nie były dla świeżo wypromowanego magistra psychologii tylko regulacja- mi „papierowymi". 152 Drugie ważne zagadnienie poruszone w tym rozdziale związane jest z aktyw- nością zawodową psychologa na forum społeczności uczonych — z pisaniem prac naukowych i wygłaszaniem referatów na konferencjach naukowych. Także i ten specyficzny rodzaj aktywności poddany jest regulacji objętej kodeksami — w pol- skim przypadku jest to zbiór zasad: Dobre obyczaje w nauce. Także te problemy, bezpośrednio dotykające warsztatu badacza, są kluczowe dla poprawnego funkcjo- nowania badacza w społeczności uczonych. Być może ich „etyczność" jest mniej widoczna, gdyż to, co dzieje się między psychologiem-badaczem, a osobą badaną bezpośrednio dotyka tę ostatnią (wywołuje jej lęk, cierpienie, dyskomfort), a to co związane z upowszechnianiem wyników badań empirycznych jest, tak naprawdę, interesujące tylko dla społeczności uczonych, jest to ich wewnętrzna sprawa. Nie można jednak oddzielać kontekstu metodologicznego badania naukowego od kon- tekstu etycznego po prostu. Nie można oddzielać etyki od prawdy, w służbie której pozostaje nauka. Można tedy, jak sądzę, przytoczyć, na zakończenie, słowa prof. Bartnika, autora Hermeneutyki personalistycznej (Bartnik, 1994, s. 267): „...sama struktura prawdy wiąże się ze strukturą dobra: bonitas veri i veritas boni, rectitudo veritatis i rectitudo boni; że poznanie jako czynność i proces podlega etyce; że etyka dochodzi do głosu w samym «wnętrzu» prawdy i jest ważna przy prawdo- podobieństwach, wątpliwościach czy wahaniach, a nade wszystko przy komunikacji prawdy i jej operacjonalizacji. Etyka jest istotnym warunkiem w przekazie prawdy i interpretacji znaku: rectitudo". Jakie lektury można polecić Czytelnikowi? Po pierwsze, chciałbym zachęcić do uważnego przeczytania przeanalizowanych w niniejszym rozdziale kodeksów - szczególnie: Kodeksu etyczno-zawodowego psychologa. Po drugie zachęcam do le- ktury pracy zbiorowej pod redakcją J. Brzezińskiego i W. Poznaniaka: Etyczne problemy działalności badawczej i praktycznej psychologów. Książka zawiera 15 opracowań pogrupowanych w następujących częściach: /. Psycholog jako twórca, II. Psycholog jako diagnosta, III. Psycholog jako specjalista udzielający pomocy psychologicznej, IV. Psycholog jako ekspert i V. Psycholog jako nauczyciel. Warto też przeczytać książkę J. Bernarda: Od biologii do etyki. Nowe hory- zonty wiedzy, nowe obowiązki człowieka. sSS rirsS W yB mm H ? Rozdział 6. Etyczne problemy psychologii (II) — n^- ,, między kodeksem etycznym •**!*»•- a praktyką społeczną 1. Wprowadzenie W poprzednim rozdziale rozważana była — z etycznego punktu widzenia — dzia- łalność psychologa występującego w roli (a) osoby prowadzącej badanie empiry- czne oraz (b) osoby upowszechniającej rezultaty tego badania (w formie artykułu lub innej publikacji, lub też w formie referatu wygłoszonego na konferencji nauko- wej). Problemy etyczne, które badacz powinien odpowiednio rozwiązać, łączą się z charakterem badania psychologicznego, przyjmującego — jak wiemy — formę społecznej interakcji. Dlatego też owe kluczowe problemy etyczne dotyczyły spo- sobu, w jaki badacz (psycholog!) traktuje osobę badaną — utajnianie przed nią prawdziwego celu badania (okłamywanie osób badanych), narażanie jej na cierpie- nie, wstyd, lęk (ogólniej, na przebywanie w sytuacji dyskomfortu fizycznego i psy- chicznego). Odrębnym zagadnieniem było „posługiwanie się", w charakterze osób badanych, osobami, które są w jakimś stopniu uzależnione od badacza (np. studenci od profesora prowadzącego badanie empiryczne i jednocześnie prowadzącego dla tych samych osób wykład zakończony egzaminem). Z kolei rozpatrując działalność badacza ogłaszającego wyniki swoich badań, poddającego je intersubiektywnej kon- troli, zwróciliśmy uwagę na tak istotne z etycznego punktu widzenia zagadnienia, jak: ukrywanie przez badacza niedoskonałości warsztatowych, przejawianie przez niego tendencji do nadmiernego poszerzania zakresu wnioskowania z pozyskanych danych empirycznych (problem trafności zewnętrznej badania), nastawienie na po- szukiwanie (niekiedy za wszelką cenę!) danych potwierdzających hipotezę roboczą. Przedyskutowaliśmy także problem takiego informowania o szczegółach warsztato- wych, aby możliwe było przeprowadzenie (przez zainteresowanych członków spo- łeczności badaczy) replikacji badania zrealizowanego przez badacza. O ile nasza uwaga w rodziale 5. skupiona była na tym wszystkim, co dzieje się między badaczem z jednej strony, a osobami badanymi i innymi badaczami z drugiej, o tyle tutaj skupimy się na analizie etycznego kontekstu działalności ba- dacza poza jego grupą zawodową — w kontakcie z instytucjami praktyki społecz- nej. To, co nas będzie interesowało szczególnie, to: (a) wykorzystywanie wiedzy 154 psychologicznej na użytek praktyki społecznej, poprawianie efektywności jej fun- kcjonowania oraz (b) występowanie badacza-psychologa w roli nauczyciela (pra- cownika uniwersytetu), który przekazuje naukową wiedzę psychologiczną studen- tom psychologii, a także w roli mistrza formującego młodych badaczy. Odrębnym zagadnieniem, wzbudzającym sporo emocji, jest posługiwanie się w celach diagno- stycznych specyficznymi dla psychologii narzędziami, jakimi są testy psychologi- czne; dlatego też w pkt. 4. spróbuję odpowiedzieć na kilka ważnych, z etycznego punktu widzenia, pytań z tym związanych. 2. Rezultat badawczy jako podstawa praktycznego działania Wróćmy do rys. 5.1., na którym ukazane zostały relacje, w jakie psycholog wcho- dzi prowadząc działalność badawczą sensu proprio, nauczycielską, ekspertalną i — wreszcie — podejmując rolę zawodową psychologa-praktyka. W tym punkcie bę- dzie nas szczególnie interesowała relacja c, z reprezentantami sfery praktyki spo- łecznej, którzy oczekują od psychologii, że rozwiąże ona problemy efektywnego funkcjonowania tej sfery. Oczekuje się tedy od psychologa, że ten, wykorzystując swoje kompetencje naukowe, opracuje „receptę" na skuteczne działanie. Wystąpił- by zatem psycholog w roli służebnej względem sfery praktyki społecznej — tak jak to zresztą pokazuje schemat obiegu informacji między obiema sferami: sferą praktyki badawczej i sferą praktyki społecznej (por. rozdz. 2., rys. 2.1.). Chciałbym jednak wyraźnie zaznaczyć, że nie należy owej, tu metaforycznie ujętej, „służeb- ności" pojmować zbyt dosłownie. Psycholog — i o tym będzie niżej mowa — nie powinien uczestniczyć w nadużywaniu wiedzy psychologicznej do celów narusza- jących godność człowieka. Nie powinien też, post factum, autorytetem nauki (tu: psychologii) uwiarygodniać wątpliwych etycznie działań jakiejś instytucji ze sfery praktyki społecznej. Przytoczę teraz wybrane fragmenty DON (Rozdział 6. Pracownik nauki jako ekspert) dotyczące tej sfery działalności psychologa. W KEZP nie znalazłem zasad wprost regulujących ten zakres aktywności zawodowej psychologa. DON (pkt. 6.3): „Pracownik nauki opracowuje każdą ekspertyzę rzetelnie i odpowiedzialnie, w oparciu o aktualny stan wiedzy naukowej i pełne rozpoznanie istotnych faktów i okoliczności"; pkt. 6.4: „Przy opracowaniu ekspertyzy pracownik naukowy nie sugeruje się oczekiwaniami zleceniodawcy i nie dopuszcza, aby presja zleceniodawcy wywarła wpływ na merytoryczną zawartość ekspertyzy"; pkt. 6.5: „Aby uniknąć podejrzenia o stronniczość, pracownik nauki odmawia opracowania ekspertyzy, której część i końcowe wnioski miałyby związek z jego interesem osobistym. W takim przypadku pracownik nauki powinien powiadomić zleceniodawcę o przyczynie odmowy"; 155 mmm^ ?PC'J-V ? I pkt. 6.6: „Informacji uzyskanych w związku z opracowaniem ekspertyzy, pra- cownik nauki nie wykorzystuje na szkodę zleceniodawcy ani dla osiągnięcia nie- słusznych korzyści własnych. W przypadku konfliktu interesów ekspert powinien stawiać wyżej dobro ogólne niż interes zleceniodawcy". Jakie są obszary praktycznego działania, w obrębie których psycholog-badacz może — z uwagi na domniemywane wysokie (i niezastępowalne) kompetencje naukowe — być postrzegany przez decydentów ze sfery praktyki społecznej jako osoba mogąca istotnie przyczynić się do poprawy funkcjonowania tej sfery? Są one następujące: (a) instytucje służby zdrowia, (b) szkolnictwo, (c) media, (d) wojsko, (e) przemysł, organizacja i zarządzanie, (e) sądownictwo, (f) instytucje samorządo- we, (g) partie i organizacje polityczne i społeczne (h) instytucje rządowe, (i) usługi i reklama. Świadczone przez psychologów usługi ekspertalne nie rozkładają się równo- miernie między wymienionych wyżej potencjalnych ich odbiorców. Jak sądzę, sto- sunkowo najwięcej opracowań psychologicznych zamawianych jest przez już „tra- dycyjnych" klientów — służbę zdrowia, szkolnictwo, wymiar sprawiedliwości. Gwałtowny rozwój prywatnego sektora przemysłowego, dynamicznie rozbudowu- jący się rynek usług oraz rozwój reklamy otworzył nowe możliwości (i pokusy!) przed psychologami dysponującymi wiedzą i metodami subtelnych oddziaływań na człowieka. Psycholog, który zdecyduje się przyjąć zamówienie na wykonanie specjalisty- cznej ekspertyzy, powinien wpierw odpowiedzieć na kilka ważnych, brzemiennych w etyczne konsekwencje, pytań. Pierwsze pytanie dotyczy kompetencji psychologa do rzetelnego wykonania powierzonego mu zadania. Możliwe jest posłużenie się przez instytucję zamawia- jącą ekspertyzę zewnętrzną opinią o kwalifikacjach osoby, która deklaruje goto- wość realizacji zamówienia, ale wcale nie zwalnia to psychologa od przeprowadze- nia krytycznej samooceny — nawet, gdy ocena zewnętrzna była pozytywna. Jeżeli psycholog uzna, że nie jest dostatecznie kompetentny, to nie powinien przyjmować zlecenia. Nie przynosi mu ujmy odstąpienie od wykonania jakiegoś zadania z po- wodu nieznajomości danej problematyki czy specjalistycznych metod, które powin- ny być zastosowane w celu rozwiązania tego zadania. Jest to zresztą wpisane w KEZP w dziale tzw. zasad ogólnych: „Psycholog jest świadomy szczególnej odpo- wiedzialności, wynikającej ze specyfiki wykonywanego zawodu. Powinien znać granice swoich kompetencji i nie podejmuje zadań przekraczających jego możliwo- ści. Dokłada wszelkich starań, aby zapewnić jak najwyższy poziom wykonywanej pracy" (podkr. /. B.). Drugie pytanie dotyczy etyczności celów, w jakich opracowanie psychologa ma być wykorzystane przez zamawiającą je instytucję. Cel instytucji nie może być sprzeczny z dobrem człowieka. Psycholog jest zobowiązany właśnie to dobro chro- nić, a nie przyzwalać (i to przez czynny w tym udział), aby jakaś instytucja (np. metodą psychologicznie „wzmocnionych" oddziaływań) wzbogacała się i uzależ- niała od siebie swoich klientów. 156 Trzecie pytanie związane jest z faktyczną — psychologiczną, ekonomiczną i zawodową — niezależnością psychologa podejmującego się wykonania jakiegoś opracowania dla instytucji zlecającej jego wykonanie. Psycholog nie może działać w warunkach jakiejkolwiek zależności. W szczególności nie może on wykonywać swojego zadania, jeżeli pobudkami do jego wykonania były lęk, „lizusostwo", albo chęć wzbogacenia się. Psycholog nie podejmuje się współpracy z instytucją, która stara się mu narzucić, korzystne z punktu widzenia jej interesów, swoiste „warunki brzegowe", nie pisze też „pod dyktando", ani nie „autoryzuje" nie swoich opraco- wań. I znowu odwołam się do KEZP (zasada 13.): Psycholog nie może akceptować warunków pracy, które ograniczają jego niezależność zawodową, a zwłaszcza ta- kich, które uniemożliwiają stosowanie zasad etyki zawodowej. Psycholog powinien domagać się poszanowania dla własnej niezależności, bez względu na pozycję jaką zajmuje w hierarchii zawodowej. Każdy psycholog ma obowiązek występować w obronie niezależności swych kolegów" (podkr. J. B.). Jak sądzę, są to najważniejsze pytania, których postawienia przed przyjęciem zlecenia na wykonanie jakiejś ekspertyzy czy innego opracowania wymagającego wiedzy psychologicznej, żaden psycholog nie może uniknąć. Jeżeli odpowiedź na nie będzie zgodna z kodeksami etycznymi — DON i KEZP — to wówczas można uznać, że spełnione zostały warunki etyczne umożliwiające podjęcie danego za- dania. Czytelnika zainteresowanego bardziej szczegółowo problematyką etycznych aspektów działalności ekspertalnej odsyłam do następujących opracowań: Z. Rataj- czak Etyka ekspertów, A. Bańki Wiarygodność i odpowiedzialność etyczna psycho- loga jako eksperta, J. Stanika Etyczno-zawodowe problemy biegłego sądowego psy- chologa, zamieszczonych w pracy pod redakcją J. Brzezińskiego i W. Poznaniaka. Polecam także artykuł T. Tomaszewskiego i Z. Ratajczak Treść ekspertyz nauko- wych i współdziałanie eksperta z użytkownikiem. 3. Psycholog jako nauczyciel i mistrz —jedność badania i nauczania Zacznijmy, podobnie jak w poprzednim punkcie, od przytoczenia tych fragmentów kodeksów etycznych, które odnoszą się do zasygnalizowanej problematyki. Dodat- kowo przywołamy jeszcze jeden, w tym kontekście ważny dokument, a mianowicie Wielką kartę uniwersytetów europejskich (w skrócie: WKUE), uchwaloną w kolebce eurepejskich uniwersytetów, w Bolonii, w dziewięćsetną rocznicę powołania naj- starszego w Europie uniwersytetu (pełny tekst Karty znajdzie Czytelnik u Drozdo- wicza, 1995). WKUE (zasada 2.): „Działalność naukowa i dydaktyczna w uniwersytetach musi być ze sobą nierozerwalnie związana, jeśli nauczanie ma sprostać zmieniają- cym się warunkom, potrzebom społeczeństwa oraz postępowi wiedzy"; 157 ?P8- zasada 3.: „Swoboda prowadzenia badań naukowych i kształcenia jest najbar- dziej fundamentalną zasadą życia uniwersyteckiego, a rządy i uniwersytety, w miarę swoich możliwości, muszą zapewnić poszanowanie dla tego podstawowego warunku. Odrzucając nietolerancję i pozostając zawsze gotowym do dialogu, uniwersytet stanowi zatem najlepsze miejsce, w którym spotykają się nauczyciele, umiejący przekazać swą wiedzę, dobrze przygotowani do rozwijania jej poprzez badania naukowe i nowatorstwo oraz studenci, którzy potrafią, chcą i są gotowi wzbogacać swe umysły tą wiedzą". DON (pkt. 4.2.): „Pracownik nauki dba o ustawiczne doskonalenie jakości na- uczania. (...) Treść zajęć dydaktycznych powinna być zgodna z aktualnym stanem nauki światowej. Jeżeli treść taka byłaby niezgodna z wewnętrznym przeświadcze- niem pracownika nauki, to jest on obowiązany dodać własny odrębny komentarz. W wykładach należy uzgadniać rywalizujące ze sobą teorie i interpretacje faktów". KEZP (zasada 43.): „(...) Występując w roli nauczyciela przekazującego wie- dzę psychologiczną, psycholog powinien zaznaczyć, kiedy prezentuje osobisty punkt widzenia; obowiązuje go jednak znajomość i rzetelne przedstawienie innych stanowisk"; zasada 50.: „Upowszechniając wiedzę psychologiczną, psycholog dba o zgod- ność przekazywanych treści ze współczesnym stanem nauki, uwzględnia różnicę między hipotezami i dobrze udokumentowanymi twierdzeniami i w sposób rzetelny przedstawia praktyczne możliwości psychologii. Szczególnie starannie psycholog przedstawia te treści, które są niezgodne z obiegową wiedzą psychologiczną lub podatne na różnorakie interpretacje". Psychologia, jako kierunek studiów, prowadzona jest przez uniwersytety. Od- powiednie rady wydziałów mają uprawnienia do nadawania tytułów zawodowych magistra psychologii. Także wyższe kwalifikacje naukowe — stopnie naukowe: doktora i doktora habilitowanego nauk humanistycznych w zakresie psychologii — można uzyskać na wydziałach uniwersyteckich, ale nie wszystkich uniwersytetów; tylko tych skupiających dostatecznie silne naukowo i dydaktycznie zespoły psycho- logów, które (poprzez udokumentowane osiągnięcia naukowe — publikacje, prace ekspertalne, znaczące realizacje projektów badawczych itp.) gwarantują wysoką ja- kość nauczania — wykładów, seminariów, ćwiczeń. Już to, jakiego typu uczelnie uprawnione są do prowadzenia studiów psychologicznych (a te w Polsce realizo- wane są tylko na poziomie studiów magisterskich i raczej nie przewiduje się uru- chamiania studiów psychologicznych typu zawodowego — na poziomie licencjac- kim), świadczy o tym, jak dużą wagę przywiązuje się do tego, aby studia psycho- logiczne prowadzone były w znaczących naukowo ośrodkach, aby psychologii na- uczali specjaliści legitymujący się również dorobkiem naukowym — i to znaczą- cym. Zatem, przynajmniej z formalnego punktu widzenia, zadbano o to, aby cyto- wana 2. zasada WKUE była respektowana. Czy to tak ważne, aby przyszli psychologowie stawali się nimi właśnie w murach uniwersyteckich, aby swoją wiedzę przekazywali im właśnie kompetentni badacze, uczeni, a nie wprawieni w arkana praktycznego wykonywania zawodu — psychologowie-praktycy? Jestem głęboko przekonany, że jest to bardzo ważne. 158 Spróbuję teraz uzasadnić swoje stanowisko. Przy czym — uprzedzam — nie będę zajmował się tu problematyką nauczania psychologii jako sztuki pomagania ludziom oczekującym pomocy psychologicznej (przygotowanie do wykonywania zawodu psychologa). Tutaj interesuje mnie etyczny kontekst transferu naukowej wiedzy psychologicznej z laboratorium badacza do sali wykładowej i laboratorium studenckiego — czynniki go ułatwiające i utrudniające, ale lokowane na stosunko- wo wysokim poziomie ogólności. Uniwersytet (m. in. jako to szczególne miejsce, w którym student psychologii przekształca się w psychologa) tylko wówczas jest zdolny realizować swoje zada- nia, kiedy zniesiona jest w nim granica dzieląca sferę badań naukowych i sferę wykładów i ćwiczeń, kiedy zniesiony jest podział na tych, którzy wyłącznie pro- wadzą badania naukowe i tych, którzy wyłącznie nauczają, nie angażując się w badania. Do wykładu uniwersyteckiego muszą przenikać najnowsze wyniki badań, je- szcze „gorące", jeszcze „stające się". Zaś dobrym profesorem może być tylko ten badacz, który nie ogranicza wykładu do streszczenia poglądów innych autorów, których prace może przeczytać, zanim i tak dotrą do nich ci najbardziej wytrwali i poszukujący (faktycznie studiujący!) słuchacze. Osobliwością uniwersytetu jest, jak sądzę, owa jedność dwóch procesów wza- jemnie się przenikających — procesu badania naukowego, z jednej strony oraz procesu nauczania, z drugiej. Jeżeli oderwalibyśmy nauczanie od badania, to doko- nalibyśmy redukcji roli profesora uniwersytetu do roli nauczyciela szkoły średniej czy szkoły wyższej typu zawodowego, np. pedagogicznej, szkolącej przyszłych nauczycieli dla szkół szczebla średniego czy podstawowego. Zaś różnica między nimi miałaby wyłącznie charakter ilościowy, lecz nie jakościowy. W nauczaniu uniwersyteckim nie idzie jednak o to, aby mówić więcej i językiem ezoterycznym. Idzie natomiast o to, aby przybliżyć studentowi metodę, za pomocą której profesor prowadzący wykład sam uzyskał pewne wyniki, które wspólnie ze studentami oma- wia — pełen jeszcze wątpliwości i krytycyzmu co do ich rzeczywistej wartości i relacji, w jakich pozostają one do innych wyników, uzyskanych przez innych uczonych, stosujących inne metody. Zwracał już uwagę na ową zależność nauczania uniwersyteckiego od badania naukowego wybitny polski filozof, twórca filozoficznej szkoły lwowsko-warsza- wskiej, Kazimierz Twardowski (1933), gdy w swoim wykładzie O dostojeństwie Uniwersytetu (okazją do wygłoszenia w 1932 roku tego wykładu była uroczystość nadania mu tytułu doktora honoris causa przez senat Uniwersytetu Poznańskiego) mówił: „rdzeniem i jądrem pracy uniwersyteckiej jest tedy twórczość naukowa, zarówno pod względem merytorycznym, jak i pod względem metodycznym". Pod- kreślił przy tym, iż „praca nauczycielska" profesora (ta zaś polegałaby na „wyra- bianiu w studentach umiejętności myślenia i badania naukowego") „ma za podsta- wę własną pracę badawczą nauczyciela" (podkr. /. B.). „Spójnia badań i wykładu — jak pisał przed laty inny wybitny uczony, peda- gog Hessen (1931, s. 358) — obok autonomii (w sensie niezależności uniwersytetu od instytucji ekonomicznych, politycznych i kościelnych) należy do głównych 159 I = I ^H ^; ? • ;t ii * i A.i> czynników kształtujących uniwersytet i wyróżniających go wśród innego typu szkół wyższych (typu zawodowego) czy zakładów naukowych". Podobnie widzi ten problem socjolog nauki, Goćkowski (1981), gdy formułuje szóstą ze swoich tez o uniwersytecie: „praca uniwersytecka to jedność czynności naukowych i czynności nauczycielskich". Aby można było mówić o uniwersytecie sensu proprio muszą wystąpić dwa istotne elementy — muszą w nim być profesorowie prowadzący aktywne życie naukowe i muszą w nim być studenci studiujący pod kierunkiem profesorów, przyswajający elementy ich warsztatu badawczego, uczący się samo- dzielnego dochodzenia, naukową drogą, do własnych wyników badawczych, któ- rych będą umieli środkami naukowymi bronić, i które będą zdolni, bez żalu, jeżeli nie wytrzymają one krytyki naukowej, odrzucić. Profesorowie zajmują w uniwersytecie szczególną pozycję, różną od tej, jaką zajmują nauczyciele w szkołach „niższych". Dobrym nauczycielem uniwersyteckim może być bowiem tylko dobry badacz. Na nic zdolności pedagogiczne, jeżeli nie są one podbudowane umiejętnościami badawczymi i znaczącym dorobkiem nauko- wym, który jest w jakimś sensie konsekwencją tych umiejętności. Cóż bowiem z tego, że profesor będzie wykładał porywająco i zgodnie z kanonami sztuki peda- gogicznej, jeżeli nie będzie dysponował własnym, oryginalnym warsztatem badaw- czym. Powiedzenie o kimś, że co prawda nie prowadzi badań naukowych, nie jest czynny naukowo, ale za to jest dobrym wykładowcą, jest wewnętrznie sprzeczna. Ten ktoś może być dobrym nauczycielem w szkole średniej, ale uniwersytet stawia mu inne wymagania. Ma on być przede wszystkim czynnym badaczem, a dopiero potem dydaktykiem. Student bowiem powinien nie tyle słuchać tego, co mówi profesor, a co można i tak przeczytać, ile powinien — bo nie jest uczniem, ale jest studiosus — poznawać wiedzę w procesie jej stawania się, tworzenia w pracowni profesora. Położyłbym tedy nacisk na procesualny (dynamiczny) charakter nauki, na czynności, które należy wykonać, aby posiąść pewną wiedzę naukową, a nie na wiedzę jako rezultat działań badawczych (charakter statyczny), jako wynik procesu badawczego. Proszę zauważyć, że w taki sposób traktuję wykład metodologii ujęty w tym podręczniku. Warto w tym miejscu przytoczyć, in extenso, to co na temat jedności kontek- stu badania i kontekstu nauczania na uniwersytecie pisał Hessen (1931, s. 356-358). Możemy tę wypowiedź uporządkować w kilku punktach. I tak: (1) „zadanie wykładającego w uniwersytecie polega nie na tym, żeby uczyć, lecz na tym, żeby pracować w swojej nauce, w której może kształcić tylko w miarę swej pracy badawczej"; (2) „student jest tym lepszy, im więcej okazał samodzielności w pracy nauko wej, im więcej daje nadziei jako przyszły uczony"; (3) „profesor jest tym lepszy, im więcej stoi jako uczony, (...) wielki uczony nawet przy minimum posiadanych środków wyrażenia zawsze jest lepszy jako pro fesor niż doskonały lektor, nie będący w swej dziedzinie badaczem"; (4) „profesor jest tym lepszym nauczycielem, im więcej (...) kieruje swe wy- 160 siłki na badanie samego przedmiotu, a nie na sposoby przystępnego wyłożenia go słuchaczom"; (5) „dlatego, w odróżnieniu od nauczyciela szkolnego, wykształcenie pedago- giczne profesora wyczerpuje się jego wykształceniem naukowym. Dlatego też me- todyka wykładu kursu naukowego nie tylko wspiera się na metodologii odpowied- niej nauki, lecz wprost się z nią zlewa". Pełna realizacja idei autonomii uniwersytetu oraz jedności badania i nauczania wymaga nie tylko tego, aby uczony miał pełną swobodę wyboru celu badania i środków do jego realizacji (w granicach zakreślonych przez zasady etyczne pro- wadzenia badań naukowych), ale aby miał także swobodę doboru treści nauczania i środków metodycznych (także w granicach zakreślonych przez etykę). Również słuchacze wykładu muszą mieć swobodę w wyborze profesora, którego wykładu zechcą wysłuchać. Nie można ich administracyjnymi środkami przypisywać do po- szczególnych profesorów. Dar swobody wyboru musi być dany podmiotom procesu dydaktycznego — profesorowi i studentowi. Osobiście znany jest mi przykład uni- wersytetu, w którym studentów podzielono, według porządku alfabetycznego, na dwie grupy, które słuchały dwóch różniących się pod kilkoma względami wy- kładów z psychologii. Władzom tego uniwersytetu chodziło zaś tylko o to, aby studenci równomiernie wypełnili obie sale wykładowe (a może chodziło o coś jeszcze?). Student zapisujący się na uniwersytet jest osobą dorosłą i wolną. Nie mamy prawa domniemywać, że nie będzie on zdolny umiejętnie wykorzystywać danego mu przez Naturę i Prawo daru wolności. Pozwólmy mu zatem, aby wybierał i zas- tanówmy się, dlaczego nie wybrał profesora X. Niech i profesor X spróbuje wy- jaśnić sobie ów prosty fakt. Ograniczenie wyboru (jakby go „uczenie" nie tłuma- czyć) jest pierwszym krokiem do dalszych ograniczeń. Te zaś, z istoty swej, nie dadzą się pogodzić z ideą uniwersytetu. Ów zrodzony w warunkach swobody wy- boru kontakt profesora i studenta, może, na wyższym etapie kształcenia, przerodzić się w kontakt mistrza i ucznia. Aby tak się jednak stało, niezbędne jest poczucie obu stron, że wchodzą w ten układ dobrowolnie. Uniwersytet jest tym szczególnym miejscem, w którym mogą (powinny) spo- tykać się osoby o różnych orientacjach filozoficznych, przedstawiciele różnych, nieraz konkurencyjnych szkół naukowych. W dysputach naukowych rodzą się treści przyszłych wykładów i seminariów. Ich aktywny odbiór przez dociekliwych i kry- tycznych studentów owocuje — może nie zawsze — korektami do opracowywanej przez profesora nowej koncepcji. Jeżeli ten naszkicowany pastelową kredką sielan- kowy obraz chociaż w jakiejś części miałby mieć znamiona rzeczywistości, speł- niony musi być jeden, ale zasadniczej wagi warunek. Uniwersytet musi być otwarty na różnorodność. Nie może hołdować jednej li tylko szkole myślenia o świecie. Ograniczenia dyskusji, priorytetowe traktowanie pewnych teorii, nie z uwagi na ich walory merytoryczne i metodologiczny poziom opracowania, ale ze względu na osobę (osoby) ich twórcy czy szczególny przedmiot, którym się zajmują, grozi dogmatyzmem i oddaleniem się od ideałów bliskich „społeczeństwu nauki", że odwołam się do tytułu znanej książki Zimana (1972). U — Metodologia badań.. 161 Owa zasada wielości punktów widzenia tego samego problemu musi być zaakceptowana przez każdą osobę przekraczającą próg uniwersytetu — i to w równej mierze przez profesorów, jak i przez studentów. Ci pierwsi nie mogą domagać się (czy wręcz wymuszać) uznania przez samorząd uniwersytetu wyjątkowego traktowania „ich" teorii czy metody, niezależnie od zajmowanej pozycji w „społeczeństwie nauki". Mają natomiast prawo do swobodnego (w granicach etyki) prowadzenia badań naukowych równolegle do innych badaczy z tego samego (czy innego uniwersytetu). Zajmowana pozycja nie powinna mieć wpływu rozstrzygającego na akceptację przez społeczność uniwersytecką programu badawczego. Z kolei studenci nie mogą się domagać głoszenia przez profesora poglądów niezgodnych z aprobowanymi przez niego poglądami naukowymi. Obie strony muszą w tym przypadku akceptować odmienność swoich preferencji światopoglądowych, teoretycznych i metodologicznych. Uniwersytet jest bowiem szczególnym miejscem, w którym młody człowiek, kandydat na badacza, uczy się nie tylko biegłości instrumentalnej i nie tylko opanowuje pewien zasób wiedzy, ale uczy się — co jest ważne, jeżeli nie ważniejsze, niż opanowanie określonego zasobu wiedzy — tolerancji na od- mienność, poszanowania cudzych poglądów, oraz reguł osobliwej gry zwanej kry- tyką naukową (por. Ziman, 1972, rozdz. VI.: Porozumiewanie się w ramach wspól- noty; Szaniawski, 1991). Jedność kontekstu badania i kontekstu nauczania wymaga stworzenia takich warunków, aby mogła się ona ujawnić w praktyce uniwersyteckiej. Owe warunki, to nie skrępowana żadnymi politycznymi, administracyjnymi i religijnymi zakazami i nakazami wolność badania i nauczania. To także poszanowanie cudzych poglądów naukowych oraz zrozumienie dla innych, niż własny, systemów wartości i przeko- nań. „Spójnia badań i wykładu" nastąpi wówczas, gdy wykład uniwersytecki nie będzie skrępowany żadnymi ograniczeniami administracyjnymi, gdy jego treść bę- dzie zależała tylko od profesora, a jedyne ograniczenia wypływać będą — jak pisze Hessen (1931, s. 360) — „z samej istoty pracy badawczej". Wolność studiowania zaś związana jest z prawem wyboru przez słuchacza tych wykładów, które odpo- wiadają jego zainteresowaniom. Aktualne, i to bardzo, jest stwierdzenie Hessena (tamże, s. 361-362), iż: „obecność kilku wykładających tę sama naukę i swobodny wybór nauczyciela przez słuchacza cechuje ducha nauczania uniwersyteckiego. (...) istotna zasada uniwersytecka, różniąca go od szkoły specjalnej, polega właśnie na tym, że jest on przeniknięty duchem wolności". „Zadaniem uniwersytetu jest zdobywanie prawd..." pisał Twardowski. Zada- niem prowadzących badania naukowe profesorów jest też uczenie studentów i swo- ich następców skutecznych metod dochodzenia do prawdy. Mówiąc inaczej, rozwi- janie świadomości metodologicznej w celu znajdowania prawdy i samo jej znajdo- wanie na — jak to ujął w swoim wykładzie inauguracyjnym, wygłoszonym 1 października 1981 roku na Uniwersytcie Warszawskim, logik i socjolog Klemens Szaniawski (1981, 1993) — „drodze logiki i doświadczenia, bez oglądania się na jakiekolwiek względy uboczne" jest jedynym celem działalności badawczej i na- uczycielskiej profesora uniwersytetu. Universitas, to (wg Stróżewskiego, 1992, s.22) „królestwo wartości". Prawda 162 zaś w owym królestwie należy, obok dobra i piękna, do triady wartości najwyż- szych. Zamach na jedną z tych wartości jest równoznaczny z zamachem na dwie pozostałe. Nie ma tedy innych punktów orientacyjnych na drodze uczonego ponad prawdę i dobro osób badanych (w przypadku uczonego-psychologa). Niezależnie od tego, jak uciążliwa i długa byłaby droga dochodzenia do niej i jak silne byłyby pokusy błyskotliwego jej skrócenia, winien on trwać przy jednym — szukać tej jedynej, prawdziwej odpowiedzi na pytania badawcze. Taki też wzór postępowania winien on przekazać studentom i młodszym współpracownikom. Także oni powinni zrozumieć, iż prowadzenie badań naukowych oznacza zawsze tylko jedno — po- szukiwanie prawdy. Ta zaś nie zawsze (a można zaryzykować sąd, iż raczej rzadko) kryje się pod efektownymi rezultatami. Na ogół satysfakcją dla badacza musi być sam fakt uzyskania nowego wyniku badawczego i możliwość opublikowania go w postaci artykułu, który nie będzie miał wielu czytelników. Kolejna ważna sprawa, na którą chciałbym zwrócić szczególną uwagę Czytel- nika, dotyczy charakteru badań naukowych, które podejmowane są przez ludzi uni- wersytetu. Na uniwersytecie szuka się — co jest jedną z cech specyficznych tej instytucji — odpowiedzi na pytania podstawowe, które niekoniecznie mają jakikol- wiek związek z praktycznymi zastosowaniami. Praktyka społeczna, jej ulepszanie, tak „od zaraz", nie może być jedynym kryterium działalności uniwersytetu. Jedyne co powinno krępować badacza, „człowieka uniwersytetu", to etyczność postępowa- nia badawczego i wymóg zmierzania jak najprostszą drogą ku prawdzie. Trzeba tedy odrzucić — choćby w imię autonomii uniwersytetu — wszelkie naciski fał- szywych mecenasów, warunkujących sponsorowanie tylko tych badań, które dają się od zaraz zastosować i, w konsekwencji, przyczyniają się do pomnożenia kapi- tału mecenasa. Jeżeli odniesiemy te uwagi do psychologii, to trzeba powiedzieć, że nie ma nic lepszego niż dobra (także w sensie metodologicznym!) teoria. Ją bowiem należy stosować, a nie — jak to już pisałem w pkt. 2. rozdz. 2. — obmyślać quasi-teorie o charakterze czysto aplikacyjnym. Nie należy bowiem wprowadzać fałszywej opo- zycji: psychologia teoretyczna (czytaj: akademicka i „wydumana") versus psycho- logia stosowana (czytaj: prawdziwa, bliska życiu). Ten pogląd jest zbieżny z po- glądami wyłożonymi w pracy Ellisa (1992, s. 573), który nie widzi możliwości efektywnych zastosowań w praktyce wiedzy psychologicznej, jeżeli na uniwersyte- tach nie będzie się, przede wszystkim, wykładało naukowych podstaw psychologii — biologicznych, społecznych, kognitywnych, a także psychologii różnic indywi- dualnych. Do tego kanonu przedmiotów podstawowych dokłada on jeszcze zasady planowania badań empirycznych, statystykę i metodologię. Nie można z użytecz- ności praktycznej, z wielkości dobra, które ma być pomnożone przez podjęcie określonego tematu, lub z wielkości dobra, które może być zaoszczędzone, jeżeli się zrezygnuje z danego tematu, uczynić absolutnego kryterium doboru tematów badawczych realizowanych w pracowniach uniwersyteckich. Bardzo trafnie ujął to Kołakowski (1993): „Uniwersytet jest najoczywiściej zarówno organem bieżącego życia społecznego, jak organem ogólnoludzkiego pędu do poznania świata. Z jednej strony dochodzi do głosu w Europie (mniej może w Ameryce, gdzie najlepsze u* 163 ? ? ??&$ >?* ^^^ H il ii ;\\$m uniwersytety są w większości prywatne) pokusa żądania, aby uniwersytet, przez państwo finansowany, wykazywał swoją użyteczność, a nawet niekiedy, żeby się sam finansował wykonując rozmaite zlecenia i zamówienia. Można tę tendencję tak streścić: «Każdemu wolno, jeśli chce, studiować język Hetytów, czarne dziury, różnice między św. Cyprianem a św. Augustynem w interpretacji sakramentu chrztu albo japońskie ogrody Zen, dlaczego jednak podatnik ma za to płacić? I jaki pożytek ma ów podatnik z takich zatrudnień?* Gdyby takie nastawienie zwyciężyło, oznaczałoby to zagładę uniwersytetu, a również w znacznym stopniu ruinę cywilizacji. Pytania wspomniane są niebezpieczne, ale też źle postawione. Niepodobna, w rzeczy samej, udowodnić, że każdy podatnik odnosi widoczne i wymierne korzyści z tego, że ktoś inny zna język hetycki lub japońskie ogrody; należy raczej postawić pytanie ogólniejsze: po co w ogóle istnieje kultura, która nie służy ani postępowi technicznemu, ani pomnażaniu materialnego dobrobytu? Na to pytanie jest jednakowoż tylko jedna odpowiedź", po to, by ludzkość była tym, czym była zawsze. Jeśli kultura jest luksusem, to może dlatego, że sama ludzkość jest luksusem natury". Jak sądzę, jakikolwiek komentarz jest tu zby- teczny. Jakie tedy, wobec marnej — zwłaszcza dziś! — kondycji finansowej uniwer- sytetu, niewolniczego niekiedy trybu pracy i konieczności ponoszenia wielu wy- rzeczeń, korzyści niesie praca na uniwersytecie? Widzę ich kilka. Po pierwsze, praca nauczycielska ze studentami, z ludźmi młodymi o otwartych i chłonnych umysłach stwarza unikatową okazję konfrontowania własnych, jeszcze nie dopra- cowanych koncepcji i zarysów przyszłych teorii z osądem ich pierwszych słucha- czy i krytyków. Po drugie, obcowanie z młodymi ludźmi czyni profesora młodego duchem, nie pozwala mu się szybko zestarzeć. Wymusza na nim gotowość fun- kcjonowania intelektualnego i społecznego na „wysokich obrotach". Wreszcie po trzecie, i najważniejsze, praca uniwersytecka, między innymi przez swoją progra- mową „apraktyczność" i wewnątrzsterowność, stwarza możność bezinteresownego dotarcia do prawd podstawowych (pot. Ellis, 1992; Kolakowski, 1993). Tylko tyle i aż tyle. Powyższe uwagi są na tyle ogólne, że można je odnieść nie tylko do relacji zachodzących między profesorem psychologii a studentem psychologii, zachodzą- cych w jednej z podstawowych instytucji kulturotwórczych, jakie kiedykolwiek ludzkość wymyśliła. Można je odnieść do innych dziedzin nauki — pedagogiki, socjologii, biologii itd. Podobnie, uwagi odnoszące się do „etyczności" relacji „ba- dacz-osoba badana", poczynione w poprzednim rozdziale, są w jakiejś mierze trafne i dla innych dyscyplin behawioralnych. Nauka jest, tak naprawdę, jedna — niezależnie od szerokości geograficznej kraju, w którym jest uprawiana, niezależnie od płci i wieku badacza, jego wyznania czy przynależności etnicznej, niezależnie od jego upodobań życiowych. Także uniwersytet jest jeden — ponadlokalny i ponadczasowy. Jednego wszak uniwersytet nie toleruje — totalitaryzmu, kseno- fobii, dogmatyzmu. Uniwersytet, i cała nauka, potrzebują wolności, autonomii, to- lerancji, demokracji. 164 4. Testy psychologiczne w rękach psychologa Z trzech głównych obszarów działalności zawodowej psychologa — badawczego (psycholog w roli uczonego, odkrywcy i eksperymentatora, współkształtującego psychologię jako dyscyplinę naukową), diagnostycznego (psycholog w roli badacza indywidualnej psychiki swego klienta) oraz terapeutycznego (psycholog w roli ko- jącego cierpienia i przywracającego do stanu równowagi swego klienta) — najbar- dziej tajemniczy wydaje się być ten obszar działalności, który, posługuje się m. in. specyficznymi narzędziami badawczymi, jakimi są testy psychologiczne. Naukowo usankcjonowane i zazdrośnie strzeżone przez wyspecjalizowane agendy korporacji zawodowych (psychologicznych) stały się od momentu skonstruowania pierwszych testów inteligencji, aż po ostatnie, wyrafinowane testy osobowości i skale inteli- gencji, obiektem zarówno bezkrytycznej afirmacji, jak i napastliwej krytyki. Psy- chologowie zaś podzielili się na tych, którzy z czasem stali się jedynie „dodatkiem" do mechanicznie stosowanych testów, nie umiejąc oderwać się od wpisanych w nie szablonowych quasi-orzeczeń psychologicznych, oraz na tych, którzy w trosce (?) 0 zgłębienie indywidualnej, niepowtarzalnej natury klienta, zwracającego się do nich o pomoc, odrzucili je jako mało przydatne w poznawaniu indywidualnej Oso by (uznając za grzech pierwotny wystandaryzowanie całej procedury badawczej, dyskwalifikujące test jako narzędzie pracy psychologa-humanisty). Także społe czeństwa różnych krajów co jakiś czas wypowiadały się (i wypowiadają — por. dyskusja o testach inteligencji dobrze zrelacjonowana przez Seligmana, 1995) — 1 to nie zawsze ustami czy piórami psychologów — krytycznie na temat testów. Chyba nie ma drugiego takiego narzędzia poznania, naukowego!, na temat którego napisano by tak dużo (w czym pokaźny udział mają niefachowcy), jak test psycho logiczny. Wszystko to nie ułatwia pracy tym psychologom, którzy posługują się testami zgodnie z wypracowanymi przez samych psychologów standardami. Nie stety, i oni nie są bez winy, gdyż niejednokrotnie nie przestrzegają owych swois tych norm postępowania zawodowego, co rodzi określone konsekwencje etyczne — o nich będzie mowa w niniejszym punkcie. Działalność zawodową psychologa (w szerokim sensie tego pojęcia) na aszczyźnie etycznej normują, przyjęte przez daną organizację zawodową skupia-ą czynnych zawodowo psychologów w jakimś kraju, kodeksy etyczne (por. np. APA, 1992; PTP, 1992). Każdy z nich zawiera wyodrębniony zbiór zasad dotyczących praktyki posługiwania się testami psychologicznymi. W Kodeksie etyczno-za- wodowym obowiązującym psychologów skupionych w Polskim Towarzystwie Psy- chologicznym są to zasady: 4., 12., 20. (można je odnieść do praktyki diagnosty- cznej, posługującej się m.in. testami psychologicznymi). Są to jednak zasady tak ogólne, że z równym powodzeniem można by je odnieść do jakichkolwiek narzędzi badawczych, nie tylko do testów psychologicznych. Te ostatnie są zaś niezwykle złożone, jeśli oceniać ich budowę i rodowód teoretyczno-psychologiczny, oraz nie- jednoznaczne, jeśli weźmie się pod uwagę to, co można sensownie z ich rezultatów .wyczytać" (mam tu na myśli zwłaszcza tzw. testy projekcyjne, a wśród nich test .."/' 165 < r. * <.-* 5 '.w rft.^4 Rorscha cha — np. w Polsce stosowa ne są, w zależno ści od regionu, dwa podsta- wowe systemy interpret acyjne: Piotrow skiego i Klopfer a, a ostatni mi laty intensy wnie wprowa dzany jest trzeci, „całości owy" system autorst wa Exnera — por. Exner, 1986; Stasiaki ewicz, 1984). Dlatego też główny m kodekse m, czy, odwołuj ąc się do metafor y, „biblią psycho metrycz ną", są — począw szy od wczesn ych lat pięćdzie siątych — opraco wane przez Ameryk ańskie Towarz ystwo Psychol ogiczne Stand- ardy dla testów stosowa nych w psychol ogii i pedago gice. Ich pierwsz e wydani e ukazało się w USA, w roku 1954, a kolejne wydani a w 1966, 1974 (to, 3. wydani e stało się podstaw ą polskie go wydani a w 1985 r.; por. APA, 1985a) i w 1985 roku. W przygot owaniu (por. Adler, 1993) jest następn e, 5. wydanie . Do tych dwóch podstaw owych dokume ntów można (należy) też dołączy ć trzeci, opraco wany przez APA, Ethical principl es in the conduct of researc h with human particip ants (por. APA, 1982). Ich omówie nie znajdzi e czytelni k w pkt. 2., rozdz. 5. 4.1. Test psychologiczny i jego użytkownik Kim jest użytkownik testu psychologicznego (ang. test userj! Na to pytanie odpowiadają autorzy Standardów (APA, 1985a, s. 7): jest nim osoba, która „...dokonuje wyboru me- tody, interpretuje wyniki testowe lub podejmuje decyzje oparte na tych wynikach. Ci, którzy jedynie rutynowo przeprowadzają badanie testem bądź obliczają wyniki, nie są objęci tą definicją, chociaż osoby stosujące testy często wykonują również i te czyn- ności". Z kolei od twórcy testu (ang. test developer) te same Standardy (s. 7) wy- magają, aby: „...dostarczył takiej ilości informacji o teście, by jego wykwalifikowany odbiorca mógł ocenić, z jak wielkim zaufaniem może tę metodę stosować". W po- danych wyżej definicjach „użytkownika testu" i „twórcy testu" milcząco zakłada się, że są oni wykwalifikowani i kompetentni. „Kompetencja — jak piszą autorzy Stan- dardów... (s. 12) — w wypadku badania testem jest wypadkową wiedzy o zasadach psychometrycznych, wiedzy o charakterze sytuacji badania testem, umiejętności technicznych i po prostu ogólnie — zdrowego rozsądku". Uważam, iż są to sformułowania nazbyt ogólne. Także krąg potencjalnych użytkowników testu jest zbyt duży (m.in.: „nauczyciele oraz urzędnicy wybierający i interpretujący metody testowe dla potrzeb własnych instytucji" — APA, 1985a, s. 7). Myślę, że praźródłem kontrowersji etycznych związanych z konstruowaniem oraz stosowaniem różnorakich testów psychologicznych jest niezbyt precyzyjne określenie „warunków brzegowych", które muszą być spełnione przez: (1) kandy- data na twórcę i użytkownika testu psychologicznego oraz (2) „kandydata" na test psychologiczny. Określenie owych standardów (i ich spełnienie) można traktować jako zdanie kolokwium wejściowego na seminarium specjalistyczne na uniwersy- tecie. Spróbujmy więc zastanowić się nad owymi „warunkami brzegowymi". Test psychologiczny (świadomie pomijam tu testy stosowane przez pedago- gów — testy osiągnięć szkolnych, por. Niemierko, 1975; a także tzw. testy spraw- dzające, stosowane w dydaktyce, por. Niemierko, 1990) musi: 166 — być odniesiony do określonej teorii psychologicznej, której operacjonaliza- cję (por. rozdz. 7.) w zamierzeniu jego twórcy, będzie stanowił. Oczywiście przyj muję tu, w trybie idealizującym, iż teoria psychologiczna, o której mowa, jest teorią naukową, empirycznie potwierdzoną; — być odniesiony do określonej teorii psychometrycznej, a to oznacza, iż: (a) będzie on skonstruowany w sposób przewidziany przez tę teorię i (b) jego charakterystyki psychometryczne będą przewyższały pewne minimalne wartości pa rametrów, określające „od dołu" sensowność psychometryczną przeprowadzonego, za jego pomocą, zabiegu operacjonalizacji danej wielkości psychologicznej; — być stosowany w standardowy sposób, dokładnie opisany przez jego twór cę — kto może być poddany badaniu za pomocą tego testu, kto może przeprowa dzać takie badanie, jaki powinno mieć ono przebieg. Mówiąc inaczej, test musi być rozpatrywany w kontekście optymalnej dla niego sytuacji badawczej, której ele menty muszą być jednoznacznie określone przed przystąpieniem do badania tak, aby możliwe było pełne, nieskrępowane ujawnienie się w niej zachowania testo wego osoby badanej; — być interpretowany (a dokładniej jego rezultat czy rezultaty) w formalnych ramach narzuconych przez daną teorię psychometryczną i w ramach psychologicz nych narzuconych przez daną teorię psychologiczną, stanowiącą psychologiczny punkt wyjścia w procesie jego tworzenia. Zatem, jakieś narzędzie badawcze może być uznane za test psychologiczny jedynie w kontekście określonej teorii psychologicznej, której istotnym elementem jest dana wielkość psychologiczna, właśnie przez ten test operacjonalizowana, oraz w kontekście określonej teorii psychometrycznej (ta zaś zakłada jakąś teorię staty- styczną) nadającej sens pomiarowy owemu narzędziu, właśnie jako testowi psy- chologicznemu. W języku tej samej teorii psychometrycznej wyrażony jest wynik testu i w języku tej samej teorii psychologicznej wynik ten jest interpretowany. Owe teorie określają też granice sensownego (i uzasadnionego!) użycia testu. Za- tem nie wszystko, co z wyglądu przypomina profesjonalny test psychologiczny, jest testem psychologicznym sensu proprio. Nie każdy zestaw tablic zawierających róż- nokolorowe plamy atramentowe jest testem projekcyjnym d la test Rorschacha, nie każdy zestaw pytań (jakiekolwiek „mądre" by były) jest kwestionariuszem osobo- wości itp. Także nie każdy pomysłowy rysownik czy literat może uznać swój produkt za test psychologiczny, gdy ... przypomina on swoim wyglądem znane mu testy psychologiczne (mówiło się kiedyś o tzw. trafności fasadowej, wedle której kandydat na test X musiał wyglądać jak test X). Sądzę, że można już sformułować podstawową zasadę etyczną, której powinni przestrzegać i twórcy, i użytkownicy testów psychologicznych. Mówi ona o tym, kto może być twórcą i kto może być użytkownikiem testów psychologicznych. Twórcą/użytkownikiem testu psychologicznego może być osoba, którą cechuje reślony poziom świadomości metodologicznej (w sensie nadanym temu pojęciu | pkt. 3., rozdz. 3.) pozwalający na adekwatne posłużenie się teorią psychologicz-i teorią psychometryczną w procesie tworzenia testu, jego stosowania i inter- pretowania jego wyników. 167 ł« ? * i-' Oczywiście, osoba tworząca test psychologiczny nie musi za jego pomocą prowadzić badania naukowego czy diagnostycznego, ani tym bardziej, nie musi interpretować jego wyników. Na ogół inna osoba (zespół osób) tworzy test, a inna go stosuje i interpretuje jego wyniki. Co więcej, dość mechaniczną czynność — w wypadku niektórych testów (np. prostych kwestionariuszy osobowości czy skal po- staw) — przeprowadzenia samego badania i sporządzenia wstępnych obliczeń (np. zakodowanie odpowiedzi na pozycje testowe wg jednoznacznego klucza) oddziela się od niewspółmiernie bardziej złożonych i wymagających określonych kwalifikacji merytorycznych, czynności interpretowania wyników i sporządzenia raportu diagnostycznego. Uważam, iż osobą potencjalnie odpowiadającą omawianym kryteriom jest psy- cholog, gdyż studia psychologiczne (uniwersyteckie!) przygotowały go do rozum- nego posługiwania się teorią psychologiczną oraz podstawowymi metodami staty- stycznymi, niezbędnymi do zrozumienia (co najmniej!) operacji statystycznych i psychometrycznych, związanych z psychometryczno-statystycznymi podstawami interpretacji wyników testowych. Jego kwalifikacje zawodowe obejmują też umie- jętności prowadzenia psychologicznych badań naukowych oraz stosowania podsta- wowych technik diagnostycznych (w tym głównych reprezentantów takich grup testów, jak: skale inteligencji i uzdolnień specjalnych, kwestionariusze osobowości, skale postaw i wartości, testy projekcyjne) i sporządzania diagnoz. Oczywiście mówię o modelowym absolwencie studiów psychologicznych, jak mówię o mode- lowym teście psychologicznym. W praktyce może się okazać (i okazuje się), że owe kompetencje (zwłaszcza w zakresie dogłębnej znajomości teorii psychologicz- nych i umiejętności psychometrycznych) rozłożone są zgodnie z prawem rozkładu normalnego. Pesymiści powiedzą, że jest on, niestety, silnie prawoskośny. Tak, jak bez znajomości budowy OUN i neurologii nie można oczekiwać prawidłowego odczytania tomograficznego obrazu zmienionego chorobowo mózgo- wia, tak też nie należy spodziewać się, iż ktoś, kto wyuczył się tylko — na podsta- wie lektury podręcznika testowego — poprawnego (w sensie odtworzenia krok po kroku, procedury badawczej) stosowania Skali Inteligencji WAIS/WAIS-R, będzie mógł sformułować trafną (w sensie trafności wewnętrznej i zewnętrznej — por. rozdz. 3. i 12.) hipotezę diagnostyczną dotyczącą analizowanych zaburzeń zachowa- nia pacjenta, u którego występują objawy psychozy afektywnej, jeżeli nie zna on: (a) „zaplecza" teoretycznego i psychometrycznego zastosowanych testów psy chologicznych; (b) obrazu psychologicznego zaburzonego zachowania (tu osób cierpiących na psychozę afektywną); (c) wskaźników testowych charakterystycznych dla danego zaburzenia (tu: przede wszystkim dane z profilu WAIS-R — jego wysokość, kształt i dyspersja). Jest to na ogół bardzo bogata literatura, na różnym poziomie ogólności (i tak jeśli chodzi na przykład o psychozy, to w wypadku zastosowania WAIS/WAIS-R można wskazać na bardzo obszerną literaturę omawiającą zastosowania w praktyce diag nostyki klinicznej skal inteligencji: WAIS i WAIS-R — por. reprezentatywną bib liografię tego problemu w: Kowalik, 1993); 168 (d) swoistych ograniczeń poszczególnych testów odniesionych do konkretnego problemu diagnostycznego. Jest bowiem na ogół tak, że test X może być czułym detektorem jakiejś dysfunkcji zachowania A i być całkowicie nieprzydatny w in- nym postępowaniu diagnostycznym, np. jako narzędzie diagnostyczne jakiejś dys- funkcji zachowania B. Mówiąc inaczej, chodzi o to, że nie wystarczy się wyuczyć mechanicznie „poprawnego" (tak jak roli teatralnej wg tekstu sztuki) stosowania kilku czy nawet kilkunastu testów psychologicznych, aby uważać się za osobę uprawnioną do po- sługiwania się nimi w praktyce psychologicznej. Zbyt często wymóg standaryzacji procedury badania za pomocą testu psychologicznego jest traktowany jako jedyny warunek poprawnego stosowania testu. A jest to tylko jeden z warunków i to wcale nie najważniejszy, a przynajmniej nie „wyposażający" osoby, która opanuje me- chaniczną stronę stosowania testów, w kompetencje dyplomowanego, doświadczo- nego zawodowo psychologa. Zatem psycholog, i tylko psycholog odpowiednio przygotowany może w spo- sób odpowiedzialny przystąpić do konstrukcji oryginalnego testu psychologicznego czy do posłużenia się nim w celach: badawczym lub diagnostycznym. Wyżej sta- rałem się dookreślić to, co rozumiem — w kontekście praktyki „testowania" — przez zwrot: „odpowiednio przygotowany". Oczywiście, nie sposób podać szcze- gółowej listy zagadnień, które powinien opanować psycholog (twórca czy użytkow- nik testu), który chce skorzystać dla celów badawczych czy diagnostycznych z testu psychologicznego. Zresztą lista ta wymagałaby, co pewien czas (tak samo zresztą jak np. testy inteligencji — jeśli chodzi o ich trafność treściową; nawiasem mówiąc, treść pozycji testowych Skali Inteligencji Wechslera dla Dorosłych była moderni- zowana w tempie: 1939 — W-B I, 1955 — WAIS, 1981 — WAIS-R, a jej „kon- kurentka" Skala Inteligencji Stanford-Bineta w tempie: 1916, 1937, 1960/1972, 1986, natomiast cytowane tu Standardy... — 1954, 1966, 1974, 1985b) uzupełnie- nia o nowe treści i usunięcia treści zdezaktualizowanych (jeżeli miałaby to być bardzo szczegółowa lista). Jest to problem, który ma także swój ciężar etyczny (bo wyposażając kogoś w dyplom uniwersytecki, czy wydając mu licencję uprawniającą do wykonywania zawodu, określone autorytety uznają go za specjalistę do wy- konywania określonych wąskospecjalistycznych czynności zawodowych), ale jego rozwiązanie możemy pozostawić radom wydziałów, ustalającym treści programowe studiów psychologicznych, czy specjalistycznym komisjom szkoleniowym PTP, które będą współdecydowały (z kim?) o wydawaniu odpowiednich licencji, po- twierdzających opanowanie przez psychologa wymaganych umiejętności. 4.2. Adaptacja obcego testu Przejdźmy teraz do rozważenia kolejnego problemu, także brzemiennego w konse- kwencje etyczne, a związanego z tym, że psychologowie w różnych krajach posłu- gują się nie tylko „swoimi" testami, ale także wykorzystują w praktyce badawczej 169 "U i diagnostycznej testy skonstruowane w innym kraju, o niekiedy odmiennej tradycji kulturowej i innym stylu życia (pomijam tu oczywiste różnice wynikające z od- mienności języka). Testy te — nawet po dokonaniu przekładu z języka oryginału na język kraju, w którym mają być użyte — nie będą przystawały do nowych warunków kulturowych, tak jak przystawały w wersji oryginalnej. Wymagają tedy, co wszyscy zaznajomieni z tematem zdają się wiedzieć, nie tylko przeprowadzenia prostych zabiegów translatorskich, ale także — czy przede wszystkim — adaptacji kulturowej treści poszczególnych pozycji testowych (zwłaszcza takich jak: test „Słownik" czy test „Wiadomości" ze Skal Inteligencji Wechslera) oraz instrukcji adresowanych do osoby badanej. Z badań przeprowadzonych przez Wolińską i Drwala (por. Drwal, 1994) nad polskimi odpowiednikami ACL (Test Przymiotni- kowy) wynika, iż dobieranie przez autorów polskich adaptacji odpowiedników po- zycji oryginalnych może budzić zastrzeżenia co do trafności (w sensie odpowied- niości kulturowej). Niech za przykład takiego nie trafionego doboru posłuży za- czerpnięty z przywołanej pracy cytat: „...dla niektórych przymiotników zaliczanych w oryginale do «negatywnych» wybrano polskie odpowiedniki w znaczeniu przy- chylnym (np: opinionated — «bezkompromisowy», rigid — «nieugięty») i odwrot- nie (np. forgiving — «pobłażliwy»)" (s. 83). Można postawić pytanie: Czy lepsza (trafniejsza) jest adaptacja kulturowa ob- cego testu, ale nieudolnie przeprowadzona, od poprawnego, pod względem filolo- gicznym, jedynie przetłumaczenia go z jednego języka na drugi? Nie, nie jest lepsza. Ale ta odpowiedź wcale nie oznacza aprobaty dla takiej praktyki przyswa- jania polskiej diagnostyce psychologicznej obcych testów, która sprowadzałaby się li tylko do przeprowadzenia wiernego filologicznie przekładu z języka X na język polski (z oczywistymi w wypadku takich testów, jak testy inteligencji, podmianami pozycji, których treść zbyt mocno odwołuje się do kontekstu historii, literatury, geografii danego kraju, np. pytanie o kolory flagi USA w WAIS-R). Lepiej więc zamiast nieudolnością zabiegów translacyjnych sprowadzać nieza- służoną krytykę na autora testu oryginalnego, skonstruować test wg własnego po- mysłu teoretycznego i konstrukcyjnego, albo też — trzecie rozwiązanie — wyko- rzystując koncepcję testu X zbudować jego parafrazę (w sensie występującym u Drwala, 1985, 1995). Nawiasem mówiąc, granica między poprawnie przeprowadzoną i podyktowaną przyczynami merytorycznymi trawestacją jakiegoś testu (zwłaszcza testu dotyczącego uzdolnień werbalnych) a jego parafrazą jest czasami trudna do ustalenia. Oczywiście, niezależnie od tego czy jest to tylko transkrypcja, czy aż parafraza, nie zwalnia to jej autora od przeprowadzenia, „od początku", tak jak w przypadku testu oryginalnego, wszystkich niezbędnych, i wyszczególnionych w Standardach..., operacji i obliczeń psychometrycznych i statystycznych. Dlatego też dość rozpowszechniona w Polsce (i nie tylko) praktyka polegająca na tym, iż przy- swajanie obcego testu polegało na tłumaczeniu jego instrukcji, podręcznika i treści pozycji testowych (z wprowadzeniem do niego niezbędnych kulturowo odpowied- ników), z zachowaniem w stanie nienaruszonym strony psychometrycznej (w tym — zachowanie oryginału norm; przykład: wersja włoska WAIS czy polska W-B I) jest niedopuszczalna. Takie bowiem postępowanie jest niezgodne z zaleceniami 170 Standardów... (APA, 1985a, standardy: Dl, D2, D4, s. 27-30; jeśli chodzi o tzw. normalizację testu to obowiązuje standard 13.4 — obowiązek sprawdzania rzetel- ności i trafności testu po jego przekładzie na inny język, APA, 1985b, s. 75). Takimi, niestety, pseudoadaptacjami są polskie wersje W-B I (wg: PTHP, 1972), WISC (wg: Kostrzewski, 1970), ACL (wg: Ostrowska, 1986), MMPl (wg: Płużek, 1971 — WISKAD-MMPI). I jeszcze jedno, autor adaptacji musi też zadbać o to, aby teoria, która stano- wiła podstawę konstrukcji danego testu, była znana jego nowym odbiorcom. Jeżeli tak nie jest, to jest on zobowiązany do jej upowszechnienia. Nie można bowiem, tak mi się wydaje, pozostać tylko przy zaleceniu, aby psycholog-praktyk (a głównie on będzie odbiorcą nowego testu) zapoznał się z teorią i jej praktycznymi impli- kacjami poprzez przestudiowanie, wskazanej w podręczniku oryginalnego testu, li- teratury (nie dość, że obcojęzycznej, to jeszcze trudno dostępnej). Nie wystarczy tedy jedynie dokonać adaptacji kwestionariusza NEO-PI-R (Costa, McCrae, 1992), ale trzeba też przyswoić całe podłoże teoretyczne i metodologiczne związane z teoretyczną konstrukcją tzw. wielkiej piątki (ang. Big Five). Wybrałem ten przy- kład, gdyż jak dotychczas na temat „wielkiej piątki" w polskiej literaturze psycho- logicznej nie napisano prawie nic (jedynie: Jarmuż, 1995), a być może znajdzie się ktoś, kto zechce ten popularny kwestionariusz w Polsce wydać (bez „zaplecza" teoretycznego nie będzie on wiele wart). Rozważając problem kulturowej adaptacji jakiegoś testu zagranicznego, musi- my rozpatrzyć konteksty: (1) teorii psychologicznej, (2) psychometryczny, (3) celu, (4) doświadczenia kulturowego osoby badanej, (5) świadomości społecznej, (6) kwalifikacji zawodowych użytkownika testu i (7) użycia (o nich szeroko w pkt. 4., rozdz. 20.). Jeżeli testy obcojęzyczne, na dodatek powstałe w kraju o odmiennych trady- cjach kulturowych od kraju, w którym, po przekładzie i adaptacji, mają funkcjo- nować na równi z testami rodzimymi, wymagają tak złożonych — i nie zawsze kończących się pełnym powodzeniem — zabiegów adaptacyjnych, to zasadne wy- daje się to, co zaproponował przed laty Cattell (1944; por. też: Kostrzewski, 1985), a mianowicie skonstruowanie testów, które w jak najmniejszym, jeżeli nie zero- wym, stopniu uzależnione będą od kontekstu kulturowego. Skonstruował on testy inteligencji, oparte na materiale niewerbalnym, graficznym (na wzór testu Matryc Ravena), tzw. culture-free, culture-fair oraz culture-reduced test. Uważam jednak (podobnie jak: Jensen, 1980; Matczak, 1994; por. też rozdz. 20.), że nawet Cattel- lowskie testy „neutralne kulturowo" czy „zredukowane kulturowo", nie są całko- wicie wolne od wpływów kulturowych (reprezentuję tu stanowisko radykalnego relatywizmu kulturowego), gdyż — jak to syntetycznie ujęła Matczak (1994, s. 24-26) — testy te, próbując oderwać się od jakichkolwiek realiów kulturowych, stają się, dla osoby badanej, bardzo sztuczne, nie związane z rzeczywistością (ce- chuje je niski poziom realizmu życiowego), a zatem nie mierzą inteligencji, lecz raczej „zdolność do rozwiązywania abstrakcyjnych problemów" (to pierwszy za- rzut). Nie da się obronić neutralności kulturowej testów Cattella, gdyż i one są w jakimś stopniu „łatwiejsze" dla osób, które miały już kontakt (publikacje zawiera- 171 ? M i jące różnorakie łamigłówki umysłowe, uprzednie doświadczenia testowe itp.) z ma- teriałem podobnym do testowego (to drugi zarzut). Podsumowując to, co dotychczas napisałem na temat kulturowej adaptacji te- stów skonstruowanych z myślą o osobach władających innym językiem i dysponu- jących odmiennym od „naszych" badanych (i nas samych) doświadczeniem kultu- rowym, proponuję, aby — jeżeli przekracza to nasze możliwości — zrezygnować z pseudoadaptacji kulturowej, nawet bardziej znanych i nęcących nas testów, na rzecz albo testów w pełni naszego autorstwa, albo na rzecz dobrych parafraz. Prze- strzeganie tego ważnego etycznie — nazwijmy go tak — standardu obowiązywać powinno nie tylko potencjalnego twórcę adaptacji jakiegoś testu zagranicznego (choć jego przede wszystkim), ale także jego bezpośredniego użytkownika, który powi- nien wiedzieć, że ma do czynienia z faktyczną adaptacją, a nie tylko z jej namia- stką. Ważne jest też, aby ucząc studentów i szkoląc psychologów na kursach i stu- diach podyplomowych, nie prezentować im na zajęciach owych pseudoadaptacji. 4.3. Intencja twórcy testu a zakres jego rzeczywistych zastosowań Kolejnym, ważkim problemem, który związany jest ze zjawiskiem — nie zawsze kontrolowanym — rozprzestrzeniania się określonych testów (np. swoista moda na niektóre z nich w określonych latach — tak było z testami Witkina, kwestionariu- szem Af/Y-Eysencka czy testem Rorschacha), jest zagadnienie stosowania testu zgodnie z intencją jego twórcy. Sądzę, że problem ten można sprowadzić do roz- ważenia trzech kontekstów: (a) celu, (b) treści i (c) generalizacji (wnioskowania). Zauważmy jeszcze, że pierwsze dwa konteksty można odnieść do dwóch rodzajów, a właściwie aspektów, trafności: kryterialnej (diagnostycznej lub prognostycznej) oraz treściowej (wewnętrznej). Trzeci zaś kontekst można powiązać z trafnością zewnętrzną. Należy sobie zdawać sprawę z tego, że „bezpiecznie" test psychologiczny może być stosowany tylko dokładnie tak, jak to zostało opisane w podręczniku testowym. Praktyka badawcza pokazuje jednak, iż stosunkowo często użycie testu wykracza (i to niekiedy znacząco) poza pole zastosowań określone przez twórcę testu. Co więcej, nowe zastosowania usuwają niekiedy w cień te, które były przy- pisane testowi w momencie, gdy rozpoczynał swą „karierę" diagnostyczną. Tak np. stało się ze Skalą Inteligencji Wechslera-Bellevue (W-B I), która, skonstruowana jako metoda wyznaczania II, stała się popularnym, wśród klinicystów testem osobowości, wykorzystywanym do celów diagnostyki różnicowej: norma versus różne postacie zaburzeń i chorób psychicznych oraz zaburzenie A versus zaburze- nie B. Powstała też o wiele bogatsza literatura dokumentująca przydatność W-B I oraz WAIS/WAIS-R (podobnie WISC I WISC-R) do realizacji tych nowych celów (z punktu widzenia założeń wyjściowych, które przyjął Wechsler, chociaż i jemu nie- obca była — zresztą pracował w szpitalu psychiatrycznym Bellevue w Nowym Jorku — idea klinicznego wykorzystania W-B I, por. Wechsler, 1939), że wskażę 172 te najbardziej głośne opracowania: Rapaport, 1945; Rapaport i in., 1968; Zimmer- man, Woo-Sam, 1973; Frank, 1984. Drugi przykład dotyczy kwestionariusza MMPI. Z wyjściowej wersji liczącej 504 pozycje powstały, liczące po kilkadziesiąt pytań, nowe kwestionariusze. Bar- dziej znane z nich to (por. Matkowski, 1992): Skala Lęku (A) i Skala Represji (R) — Welsha, Skala Jawnego Niepokoju (MAS) — Taylor, Skala Statusu Społecznego (St) — Gougha, Skala Odpowiedzialności Społecznej (Re) — Gougha, Mc Clo- skyego i Meehla, Skala Siły Ego (Es) — Barrona, czy Skala Represji-Uwrażliwie- nia (R-S) — Byrnea. Oczywiście te nowe kwestionariusze zostały prawidłowo opra- cowane pod względem psychometrycznym oraz uzyskały teoretyczne oparcie w teoriach opracowanych przez ich twórców. Nowe zastosowania jakiegoś testu psychologicznego nie mogą być sprzeczne z jego założeniami teoretycznymi. Przy ustalaniu trafności teoretycznej (a ta zawsze powinna być ustalana) konstruktor testu odwołał się do określonej teorii psycho- logicznej (zapożyczonej lub własnej). Owa teoria została wyrażona explicite (jak w wypadku Kwestionariusza Temperamentu Strelaua — wersja podstawowa KTS i zmodyfikowana KTS-Z, por. Strelau, 1992, rozdz. 6.-8.), bądź trzeba ją odtwo- rzyć, jak to zrobiła Hornowska (1993c) w przypadku skali WAIS-R, odnosząc ją do modelu intelektu SOI Guilforda, modelu inteligencji płynnej i skrystalizowanej Cattella-Horna, gdyż jak trafnie zauważył Sternberg (1985, s. 336): „...testy We- chslera czy Stanford-Bineta nie dają należytego pojęcia o koncepcji natury inteli- gencji przyjętej przez ich twórców". Przy testach uzdolnień, osiągnięć szkolnych czy przydatności zawodowej, sto- sowanych w celach selekcyjnych (w szkolnictwie, przemyśle, wojsku itp.), nie- zmiernie ważna jest analiza kontekstu treści pozycji testowych. Posłużenie się zna- nym testem, opracowanym pod kątem określonych treści w sytuacji, która niezbyt przystaje do owych „starych" treści, niesie z sobą niebezpieczeństwo uzyskania przez badaną osobę wyniku obciążonego, a wielkość owego obciążenia (ang. bias) będzie funkcją niezgodności rzeczywiście badanych za pomocą testu osiągnięć szkolnych treści (np. aktualnie realizowanego programu nauczania matematyki w klasie X) z treścią jego pozycji odnoszących się do programu nauczania matema- tyki, który był aktualny wówczas, gdy test ten powstawał. Wyraźnie zostało to ujęte w standardzie El2.3: „Jeśli w podręczniku testowym określa się związek pozycji testowych z przedmiotem nauczania (lub innym — «źródłem treści»), należy podać, kiedy został opracowany program tego przedmiotu" oraz w standardzie E12.4: .Je- żeli jakiś test jest traktowany jako trafny treściowo dla określonego zawodu lub grupy zawodów, to przedstawiając dane o jego trafności, należy również podać pełen opis czynności podejmowanych w danym zawodzie oraz informacje o ich natężeniu i poziomie umiejętności, niezbędnych do ich wykonania" (APA, 1985a, s. 56). Analiza treści testu jest szczególnie ważna, gdy przystępujemy do adaptacji narzędzia stosowanego w odmiennych warunkach kulturowych (rzecz jasna i języ- kowych) — zwłaszcza gdy chcielibyśmy adaptować któryś z testów osiągnięć szkolnych, powstałych w warunkach całkowicie odmiennej, od naszej, organizacji 173 szkolnictwa i nasycenia programów szkolnych (nie tylko z tak kulturowo obciążo- nych przedmiotów, jak historia czy język i literatura) odmiennymi treściami, czy któryś z testów przydatności zawodowej. Tak samo ważne jest sprawdzenie, przed użyciem testu, czy — mimo iż jest „kulturowo dopasowany" — nie obejmuje on takiego obrazu treściowego, który już nie przystaje do aktualnych wymagań insty- tucji edukacyjnych albo instytucji dobierających nowych pracowników pod kątem określonych uzdolnień i sprawności. Należy upewnić się, czy aktualna operacyjna definicja jakiegoś zawodu odpowiada tej, którą posłużyli się autorzy danego testu. Przykładem dobrze przeprowadzonych prac nad konstrukcją metody, umożliwiają- cej międzykulturowe badanie motywacji do pracy oraz podejmowania różnych ról społecznych (z dobrze przeprowadzoną analizą treści pozycji testowych), jest pol- ska adaptacja trzech testów wchodzących w skład Supertechniki badania ważności pracy, przeprowadzona przez Hornowską i Paluchowskiego (1993) — Kwestiona- riusza Preferowanych Wartości Ogólnych, Kwestionariusza Znaczenia Ról Społe- cznych oraz Kwestionariusza Wartości Realizowanych w Rolach. Nie można, rzecz jasna, zakazać posługiwania się testami psychologicznymi w innych, niż przewidziane podręcznikiem testowym, sytuacjach badawczych i diagnostycznych. Nie, ale zawsze w takich sytuacjach trzeba sprawdzić co naj- mniej trafność treściową i rzetelność testu stosowanego w niestandardowych wa- runkach. W skrajnych wypadkach może się okazać, iż należy skonstruować nowy test z powodu niezadowalającej trafności treściowej dotychczas stosowanego. Z psychometrycznego punktu widzenia konstrukcja rewizji danego testu nie różni się od konstrukcji testu „starego" — por. np. operacje psychometryczne przepro- wadzone przy konstrukcji WAIS i WAIS-R. Śledząc rozwój polskiej diagnostyki psychometrycznej odnoszę wrażenie, iż o ile zwraca się już dostatecznie dużo uwagi na stronę formalną konstrukcji testów (analiza pozycji z punktu widzenia ich trudności i mocy dyskryminacyjnej, badania rzetelności, badania trafności kryterialnej, ale na ogół tylko diagnostycznej, kon- strukcja norm z wykorzystaniem takich skal jak: centylowa, tenowa, stenowa), o tyle zbyt mało wagi przywiązuje się do analizy nowego testu w kontekście dwóch aspektów trafności — treściowego i teoretycznego. Pamiętajmy jednak, że rzetel- ność testu jeszcze nie wyznacza automatycznie jego trafności. Wyraźnie podkreślają to autorzy Standardów... (s. 80), gdy piszą: „...rzetelność jest koniecznym, lecz niewystarczającym warunkiem trafności. Współczynniki rzetelności są związane z trafnością w sensie negatywnym, tzn. nierzetelne wyniki nie mogą być trafne, na- tomiast rzetelne nie są ipso facto trafne". Przystępując do interpretacji wyniku testowego i na jego podstawie do prób uogólniania (generalizowania) wniosków, musimy rozważyć nasze postępowanie w kontekście tego kryterium, które nazywamy trafnością zewnętrzną. Trafność zew- nętrzna testu informuje badacza o dopuszczalnym zakresie wniosków, które można sformułować na podstawie badania przeprowadzonego danym testem. Normy testo- we pokazują psychologowi zakres dopuszczalnych wnioskowań, które może on przeprowadzić na podstawie uzyskanego przez osobę badaną wyniku. Osoba bada- na nie może być sensownie porównywana — z uwagi na uzyskany wynik (jego 174 I wartość) lub jego strukturę, gdy przyjmuje on postać profilu, jak w MMPI, ACL czy WAIS-R i WISC-R; mówić możemy wówczas o takich jego właściwościach jak: poziom, kształt, dyspersja — z określoną grupą odniesienia, jeżeli test swoim „za- sięgiem" tej grupy (populacji) nie obejmuje. I tak, przykładowo, za pomocą WAIS-R można w sposób statystycznie uzasadniony diagnozować iloraz inteligencji badanych osób, jeżeli nie wykracza on poza przedział wartości: <średnia (100) -3 2/3 odchyl, stand. (15); średnia (100) + 3 1/3 odchyl, stand. (15)>, czyli: 45-150. Niektórzy psychologowie, stosując metody ekstrapolacji (z wykorzysta- niem równań regresji liniowej), opracowali tabele zawierające estymowane wartości II, przekraczające 150 (por. Sattler, 1988, tab. C-30, s. 845-847) oraz niższe od 45 (do 35) (por. Silverstein, 1963). Są to jednak tylko wartości szacunkowe i jako takie powinny być traktowane z dużą ostrożnością. Osobiście uważam, iż postępo- wanie takie, nie liczące się z ograniczeniami trafności zewnętrznej testu, przyczynia się do wytwarzania artefaktów i jako takie powinno być zaniechane. Problem ten znalazł także swoje odzwierciedlenie w Standardach... — por. standardy: J5, J5.1 i J5.2. W komentarzu do standardu J5.2 napisano wprost: „poważnym błędem inter- pretacyjnym jest ekstrapolowanie (podkr. J. B.) poziomu rozwoju poza zakresem, dla którego test został przewidziany". Ostatni problem, który chciałbym tutaj poruszyć, jest bodajże najbardziej „ety- czny", gdyż wiąże się bezpośrednio z relacją, jaka zachodzi między psychologiem-- użytkownikiem testu z jednej strony a kilentem (osobą badaną) z drugiej, w sytu- acji badania psychologicznego (naukowego lub diagnostycznego) przeprowadzone- go z wykorzystaniem testu psychologicznego. Jest to bardzo trudny problem, tak z psychologicznego (jednostkowego), jak i ze społecznego punktu widzenia. Nie jest on związany, rzecz jasna, ani z problemem kompetencji merytorycznych, którymi powinien się legitymować psycholog biorący do ręki test psychologiczny, ani z ja- kością danego testu psychologicznego jako narzędzia pomiarowego. 4.4. Prawa osoby badanej Problem ów można wyrazić w następujących szczegółowych pytaniach: 1. Czy można poddać badaniom testowym osobę bez jej zgody (lub zgody jej prawnych opiekunów)? 2. Czy osobę badaną należy poinformować o celu badania i jego ewentualnych konsekwencjach dla niej? 3. Czy osobie badanej należy udzielić, przed badaniem lub po jego zakończeniu, wyczerpujących informacji o teście, za pomocą którego przeprowadza się badanie? 4. Czy osobę badaną należy poinformować o uzyskanym przez nią wyniku? 5. Komu i w jakiej postaci psycholog może (powinien) udostępnić informacje o osobie badanej, uzyskane w wyniku przeprowadzonego badania testowego? O ważności tych zagadnień może zaświadczyć to, że w 4. (i jak dotychczas ostatnim) wydaniu Standardów... wyodrębniono dotyczące tej problematyki stan- 175 dardy (jest ich 10) w postaci rozdział u 16., zatytuło wanego : Protecłi ng the rights oftest takers („Ochro na praw osób badanyc h testami" )- W poprzed nim, 3. wydani u, nie było tego rozdział u; częścio wo przedsta wiono problem praw osoby badanej w pkt. J (standar dy: J, Jl, J2.1, J2.2, J2.3). Nie ulega wątpliw ości — por. standar d 16.1 (APA, 1985b, s. 85) — iż psychol og jest zobowi ązany, przed przystą pieniem do badania psychol ogiczne go, w którym posłuży się on jakimś testem (nie ma znaczen ia czy jest to „tylko" test badając y opinię, czy też test intelige ncji lub test badając y jakieś aspekty zdrowia psychic znego), uzyskać zgodę potencja lnej osoby badanej na poddani e jej badanio m testowy m. Psychol og nie może się powoły wać na zbyt młody wiek osoby (np. dziecka) , niedoro zwój umysło wy czy chorobę psy- chiczną jako na czynnik i usprawi edliwiaj ące niepyta nie się o zgodę na stosowa nie testów psychol ogiczny ch. Nawet małym dziecio m można spróbo wać wyjaśni ć, dla- czego chcielib yśmy je poddać badanio m testowy m. Jeżeli dana osoba sama, mimo wszystk o, nie jest zdolna do świado mego udzielen ia takiej zgody, to powinn a jej udzielić osoba będąca jej prawny m opiekun em lub ją repreze ntująca. Według stan- dardu 16.1 dopuszc za się trzy sytuacje , które nie wymag ają uzyskan ia przed bada- niem zgody danej osoby na poddani e się badaniu testowe mu: (a) gdy stanowi ono element postępo wania regulow anego odpowi ednimi przepisa mi prawny mi, (b) gdy jest ono przewid ziane jako stały element organiz acji edukacj i i (c) gdy zgoda na poddani e się badaniu testowe mu jest jednozn acznie założon a w postępo waniu danej instytuc ji (np. przed podjęci em pracy w określo nych zawoda ch: pilota, kierowc y). W pozostał ych przypad kach psychol og powinie n poinfor mować daną osobę, że bez wyraże nia przez nią zgody na udział w badania ch testowy ch nie będzie on mógł z nią takich badań przepro wadzić. Tak więc, o udziale w badaniu testowy m decyduj e sama osoba (lub jej prawny opiekun ), a nie psychol og. Do niej należy w tej sprawie ostatnie słowo. Takie są bowiem jej prawa. Ta k jak psychol og powinie n uzyskać zgodę osoby, którą zamierz a poddać badaniu testowe mu, tak też powinie n udzielić jej wyczer pującyc h informa cji na temat celu tego badania , jego przewid ywaneg o przebie gu oraz tego, jaki zachodz i związek między samym badanie m a realizac ją oczekiw ań tej osoby. Informa cja nie powinn a być udziela na w języku „techni cznym" , ale w taki sposób, aby osoba badana (niepsy cholog i niepsyc hometra ) była w stanie ją zrozumi eć. Oczywi ście, informa cji o samym teście, a zwłaszc za o treści jego pozycji i sposobi e oblicza nia wyniku, należy udzielać w takim zakresie (m.in. przez dobór odpowi ednich przy- kładów pozycji , które nie występ ują w danym teście, a które stanowi ą jedynie dobre ich ilustracj e) i w taki sposób, aby nie popaść w konflikt ze standar dem: 1.5. (APA, 1985a, s. 78): „Zarów no badając y testami, jak i autorzy testów oraz osoby rozpow szechni ające, mają obowią zek odpowi ednio zabezpi eczyć test". Zdanie m au- torów Standar dów... „osoba badana ma prawo nie tylko do informa cji o celach badania , o jego konsek wencja ch dla niej, ale ma także prawo do informa cji o uzyskan ym wyniku i jego interpre tacji" (APA, 1985a, s. 80). Normuj e to standar d J2.1: „Badan y (jego pełnom ocnik lub opiekun ) mają prawo poznać swoje wyniki oraz ich interpre tacje. W niektór ych wypadk ach powinn o się również udostęp nić wyniki, jakie badany uzyskał w poszcze gólnych pozycja ch testu" (s. 80). W podo- 176 bnym duchu wypowiadają się standardy: 16.2 i 16.4 (APA, 1985b, s. 86). Czy udzielenie informacji o teście nie stoi w sprzeczności z obowiązkiem zabezpiecze- nia go (por. standard 15.)? W jakiejś mierze tak, ale — jak piszą autorzy Stan- dardów... — „...nie ograniczając praw jednostki do poznawania podstaw decyzji, która jest dla niej niekorzystna, należy jednak zrobić wszystko, aby ochronić tajem- nicę testu. Przekazanie informacji będzie mniej «groźne» z punktu widzenia ochrony tajemnicy testu, jeżeli wykorzysta się do tego osoby wykwalifikowane i życzliwie nastawione wobec badanych" (s. 80). Tak, czy inaczej, sposób postępowania w takiej sytuacji musi być indywidualnie dopasowany i do charakteru informacji, która ma być przekazana, i do osoby badanej (jej charakterystyki osobowościowej, poziomu inteligencji, wykonywanego zawodu, rodzaju problemów, z którymi zwró- ciła się do psychologa itp.). Jest to na pewno trudniejsze od sprawnego przepro- wadzenia samego badania testowego. Pamiętajmy i o tym, że jeśli przeprowadzimy tę rozmowę nieudolnie, to możemy wytworzyć u osoby badanej trwałe negatywne nastawienie do udziału (dobrowolnego) w badaniach psychologicznych (i to nie tylko testowych). Wyniki przeprowadzonego badania powinny być udostępnione instytucji zle- cającej jego przeprowadzenie (jeżeli rzecz jasna, była ona do tego upoważniona), w takiej postaci, aby osoba, która będzie zapoznawała się z nimi, potrafiła je po- prawnie odczytać i podjąć adekwatne do nich decyzje dotyczące osoby badanej. Normuje to standard J2 (APA, 1985a, s. 79-80): „Informacje o wynikach testowych powinny być przekazywane jedynie osobom, które mają wystarczające kwalifikacje, aby je zinterpretować". Wyniki udostępniane należy uzupełnić takimi wyjaśnienia- mi, aby osoba, dla której są przeznaczone, potrafiła je poprawnie zinterpretować. Jak zapisano w Standardach...: „...ciekawość nie jest tu wystarczającym powodem. Racje, dla których jakaś instytucja chce poznać charakterystykę psychologiczną ;j osoby zapisaną w jej wynikach testowych, muszą być racjami naprawdę rytorycznymi, a nie tylko wynikać z chęci zaspokojenia ciekawości czy zdobycia argumentów» przeciwko danej osobie". Nie należy tedy przekazywać surowych ników badania testowego II, np. badanego ucznia wychowawcy klasowemu. Na-ży jednak, jak sądzę, przekazywać „wynik przetworzony", podany w postaci zro-iałej dla odbiorcy (nie jest on przecież psychologiem!). Należy też unikać po-igiwania się w orzeczeniu psychologicznym pojęciami, które mają w języku co-iennym swoje dodatkowe znaczenia. Mówiąc inaczej, nie należy stwarzać okazji stygmatyzacji. Normuje to standard J2.3 (APA, 1985a, s. 80) i standard 16.6 (APA, 1985b, s. 86). Nie uważam, aby nauczycielowi była potrzebna informacja o wartości II ucznia. Informacja ta może jednak — jak dowodnie wykazały wyniki rozlicznych badań przeprowadzonych przez Rosenthala i jego współpracowników, a także innych badaczy (por. rozdz. 4., pkt. 3.) — wywołać efekt nastawień inter- personalnych (dokładniej — efekt Golema), jeżeli wartość II ucznia znajduje się poniżej normy. Należy unikać pisania skrótowych diagnoz — operują nimi niektóre komputerowe wersje testów. Jest to zapewne oszczędna i wygodna forma opisu wyników badania, ale, na ogół, staje się ona punktem wyjścia do nieuprawnionych generalizacji (nie zawsze w interesie osoby badanej). „Stosowanie skrótowych ety- 12 — Metodologia badań. 177 kietek wiąże się zazwyczaj z wartościowaniem. Niestety, słowa, jakie są w tym wypadku używane, pochodzą często z języka potocznego i z tego powodu mogą być fałszywie interpretowane. Badający powinien precyzyjnie określić znaczenie stosowanych terminów (np. terminu «opóźniony»), chociaż nie może mieć żadnego wpływu na to, jak to samo słowo będą interpretować sędzia, nauczyciel, rodzice czy dziecko" (APA, 1985a, s.80). 4.5. Uwagi końcowe W tym punkcie starałem się przedstawić, z konieczności w postaci skondensowa- nej, najważniejsze (zdając sobie sprawę z tego, że jest to wybór subiektywny) etyczne aspekty związane ze stosowaniem w praktyce diagnostycznej (przede wszy- stkim) testów psychologicznych. O ile postępowanie badawcze psychologa jest dość szczegółowo regulowane przez kodeksy etycznozawodowe, o tyle postępowa- nie diagnostyczne związane z wykorzystaniem testów psychologicznych nie jest tak szczegółowo przez te kodeksy omawiane. Chcąc tedy poznać granice etycznego użycia testu psychologicznego, trzeba wyjść od specyfiki metodologicznej i psy- chologicznej, tego tak bardzo charakterystycznego dla psychologii (jako dyscypliny naukowej!) narzędzia poznania (jeszcze raz podkreślam — naukowego!) psychiki innego człowieka. Trzeba zatem odpowiedzieć na pytanie: co może być a co nie może być uznane za test psychologiczny — to po pierwsze. Trzeba też odpowiedzieć — to po drugie — na pytanie: kto może a kto nie może odpowiedzialnie (i sensownie) posłużyć się, świadcząc określoną pomoc innemu człowiekowi (klientowi), testem psychologicznym. Trzeba także odpowiedzieć na trzecie pytanie: jak powinno a jak nie powinno wyglądać badanie testem psychologicznym (w tym pytaniu ukryte jest dodatkowe pytanie o zakres świadomego uczestnictwa osoby badanej w owym badaniu). Posiłkując się wydanymi przez APA (1985a, 1985b) Standardami... sta- rałem się udzielić jasnej odpowiedzi na te trzy, fundamentalne pytania. 5. Podsumowanie Jeżeli Czytelnik zechce powrócić do rys. 5.1. zamieszczonego w rozdz. 5., to za- uważy — będąc już po lekturze niniejszego rozdziału — że poruszane tu zagad- nienia odnosiły się do etycznego „zanurzenia" relacji psychologa z: (1) przedstawi- cielami różnorakich instytucji społecznych (relacja c), (2) studentami (relacja b). Odrębnym zagadnieniem poruszonym w pkt. 4. była analiza etycznego kontekstu konstruowania oryginalnych i adaptacji obcojęzycznych testów psychologicznych oraz ich stosowania (kompetencje użytkownika testów psychologicznych oraz pra- wa osoby badanej!). 178 Jeśli chodzi o dalsze lektury, to zalecam: do pkt. 2.: A. Brzezińska Kształcenie psychologów: pytania o relację naucza- nia i jej wymiar etyczny; Z. Toeplitz Etyczne dylematy nauczania psychologii; do pkt. 3.: J. Goćkowski, K. Pigoń (red.) Etyka zawodowa ludzi nauki; S. Hes- sen Podstawy pedagogiki (rozdz. XII, Szczebel kursu naukowego, czyli teoria uni- wersytetu); J. Ziman Społeczeństwo nauki; do pkt. 4.: Standardy dla testów stosowanych w psychologii i pedagogice; D. Seligman O inteligencji prawie wszystko. Kontrowersje wokół ilorazu inteligen- cji — dobrze, przystępnie napisana praca, skupiająca się na kontrowersjach doty- czących testów inteligencji wykorzystywanych przez różne instytucje, głównie do celów przesiewowych. 12* ? zmienne - problemy - hipotezy ? Rozdział 7. Zmienne i ich operacjonalizacja 1. Wprowadzenie Drugi etap procesu badawczego (por. rys. 1.4) związany jest z wyłonieniem przez badacza zmiennych, które tworzą obraz przestrzeni zmiennych istotnych dla Y, i o których mówi sformułowany problem badawczy oraz hipoteza badawcza. Pojęcie zmiennej (ang. variable) jest jednym z podstawowych pojęć słownika, którym posługuje się każdy psycholog-badacz. Zaczniemy tedy niniejszy rozdział od zdefiniowania tego pojęcia oraz zaproponowania nowej klasyfikacji zmiennych, która może być przydatna przy planowaniu badań empirycznych oraz analizie sta- tystycznej danych. Trzeba zdawać sobie sprawę z tego, iż w nauce posługujemy się dwoma językami (Carnap, 1959): językiem obserwacji (ang. observational language) i ję- zykiem teorii (ang. theoretical language). W języku obserwacji używa się termi- nów, które denotują obiekty fizyczne. Inaczej, dla opisu obserwowalnych rzeczy czy zdarzeń używa się w nim takich terminów, które oznaczają obserwowalne właściwości i relacje. Natomiast w języku teorii używa się terminów, które odnoszą się do nieobserwowalnych aspektów jakichś obiektów czy właściwości zdarzeń. Nietrudno podać przykłady terminów teoretycznych typowo psychologicznych. Są to np. ego, popęd, ekstrawersja, lęk, frustracja, inteligencja, potrzeba, autorytaryzm, jakość życia, dobrostan psychiczny, depresja. Jeżeli chcemy posługiwać się takimi terminami jak wyżej przytoczone, tzn. terminami teoretycznymi, przy wyjaśnianiu i przewidywaniu obserwowalnych zdarzeń, muszą one być w jakiś sposób powią- zane — bezpośrednio lub pośrednio — z terminami obserwacyjnymi (etap 3. pro- cesu badawczego — por. rys. 1.4). Nie będę tu przedstawiał całej złożonej problematyki stosunku języka teorii do języka obserwacyjnego, gdyż jest to zagadnienie zbyt złożone i trudne. Docie- kliwy Czytelnik może sięgnąć do propozycji Carnapa na ten temat, który w swojej pracy (1959) poświęca sporo miejsca terminom teoretycznym psychologii. Tam Czytelnik może zapoznać się też z ewolucją stanowisk, jakie zajmowali filozofowie w tej kwestii. Przedstawia tę sprawę także Przełęcki (1966b). Tutaj zaś zapoznam 183 Czytelnika z jedną z koncepcji metodologicznych, która podaje kryteria, jakim po- winien odpowiadać dany termin teoretyczny, aby uzasadnione było jego używanie w twierdzeniach nauk empirycznych. Jest to koncepcja Kmity (1973). Przedstawiciele nauk społecznych, zwłaszcza socjologowie, przy wprowadza- niu terminów teoretycznych, posługują się wskaźnikami, po to, aby powiedzieć, po czym można poznać, jakie obserwowalne fakty i procesy należy dostrzec, aby moż- na było orzec, czy zachodzi czy też nie zachodzi zjawisko oznaczane przez termin, jakim się posługujemy (Nowak S., 1965a, s. 245). Psychologowie budują też wskaźniki wykorzystując do tego celu specyficzne dla swojej dyscypliny naukowej narzędzia pomiarowe, jakimi są testy psychologi- czne (można je traktować jako odmianę narzędzi kalibrowanych). Koncepcja opera- cjonalizacji zmiennych psychologicznych opracowana przez Hornowską (1986) — i nawiązująca do ustaleń Nowaka L. (1977, 1980) oraz Brzezińskiego (1976), Tu- chańskiej (1990) i Gaula (1990) — odwołuje się do tej szczególnej praktyki po- miarowej. Uważam ją za bardzo przydatną dla psychologów-badaczy i dlatego bę- dzie tu ona dość szczegółowo zreferowana. 2. Poiecie zmiennei Weźmy jako przykład taki termin, jak: „inteligencja". Jest to pewna właści- wość, przyjmująca różne wartości dla takich „obiektów", jak ludzie. Jeżeli o danej właściwości możemy powiedzieć, że przyjmuje ona różne (i co najmniej dwie) wartości, to jest to zmienna (ang. variable). Tak definiuje zmienną np. Kerlinger (1986, s. 27): „...zmienna jest właściwością, która przybiera różne wartości". Tak więc zmiennymi są na przykład: płeć, poziom wykształcenia, poziom aspiracji, poziom aktywacji, inteligencja, neurotyzm, ekstrawersja, lęk, poczucie winy. Ze względu na wielkość zbioru, z którego dana zmienna przyjmuje wartości, przyjęło się wyróżniać: (a) zmienne dwuwartościowe, inaczej: dychotomiczne (ang. dichotomous va- riable), (b) zmienne wielo wartościowe, inaczej: politomiczne (ang. polytomous va- riable). Stosunkowo często psychologowie posługują się jeszcze zmiennymi, które przyjmują wartości ze zbioru trójelementowego (np. popularny system odpowiedzi na pytania kwestionariuszowe: tak, nie, nie wiem), są to: (c) zmienne trójwartościowe, inaczej: trychotomiczne (ang. trichotomous va- riable). Przykładem (a) może być zmienna „płeć", gdyż przyjmuje ona tylko dwie wartości: „mężczyźni" i „kobiety". Przykładem (b) jest „neurotyzm" — zmienna ta dla osób w populacji przyjmuje wiele różnych (aczkolwiek ich liczba jest ogra- 184 niczona) wartości. Przykładem (c) jest wspomniany już system odpowiedzi na py- tania kwestonariusza osobowości. Odróżnia się zmienne dychotomiczne, które w naturalny sposób przyjmują tyl- ko wartości ze zbioru dwuelementowego (jak wspomniana „płeć": mężczyźni-ko- biety), od zmiennych de facto wielowartościowych, które jednak badacz, dla jakichś celów, sprowadził do postaci dwuwartościowej (określać je będę mianem zmien- nych zdychotomizowanych). Przykładowo, mógł on w ten sposób potraktować zmienną „wzrost" przez wyróżnienie tylko dwóch jej możliwych wartości: wysoki (powyżej 170 cm) i niski (równy i poniżej 170 cm), czy II (powyżej 100 oraz równe i poniżej 100). Mówimy też o: (a) zmiennych ciągłych (ang. continuous variabłe), (b) zmiennych dyskretnych (ang. discrete variable). Zmienna jest ciągła, jeżeli zbiór jej wartości tworzy kontinuum i jeżeli po- między dwiema sąsiednimi wartościami zmiennej możliwe jest znalezienie trzeciej wartości (Wolman, 1973, s. 400). Mówiąc inaczej dana zmienna jest ciągła, gdy dla różnych osób z populacji może ona przyjmować różne wartości, przy czym wartości te nie są ograniczone do zbioru dyskretnego (por. Nowakowska, 1975, s. 118). W tym sensie zmienną ciągłą jest np. „wzrost". Jeżeli pomiędzy dwiema sąsiednimi wartościami zmiennej nie występuje trzecia wartość, to jest to zmienna dyskretna. Taką zmienną jest np. „płeć" czy „typ wykształcenia" (w sensie: medy- czne, przyrodnicze, techniczne, ekonomiczne, humanistyczne, rolnicze). Zwykło się jeszcze wyróżniać: (a) zmienne jakościowe, kategorialne (ang. qualitative, categorical variable), do których zaliczamy wcześniej przez nas wymienione zmienne dychotomiczne, a także te zmienne politomiczne, które są — z punktu widzenia logiki — klasyfika cjami. Jak wiadomo (por. np. Ziembiński, 1993, s. 234-239), od klasyfikacji wy maga się, aby była ona: (1) podziałem wyczerpującym, a więc, aby obejmowała wszystkie elementy objęte jej zasięgiem i (2) podziałem rozłącznym, tzn. aby każdy element znalazł się tylko w jednej klasie. Zmienna dychotomiczna „płeć" (wartości: męska, kobieca) jest zmienną jakościową, gdyż spełnia opisane wyżej oba warunki. Podobnie zmienna politomiczna wyznanie religijne (wartości: katolickie, prawo- awne, ewangelickie, inne wyznania, nie wierzący) jest zmienną jakościową, gdyż iżda z zapytanych przez badacza osób mieści się w jednej z wymienionych ka- tegorii. (b) zmienne ilościowe (ang. quantitative variable), którymi są wyróżnione wyżej zmienne ciągłe. W praktyce badawczej psychologowie zwykli podciągać pod pojęcie zmiennych ilościowych — obok takich ewidentnie ilościowych zmiennych, jak: czas reakcji, wartości GSR — zmienne zoperacjonalizowane za pomocą wy- standaryzowanych testów psychologicznych, takie jak II mierzone skalami Wech- jslera (WPPSf-R, WISC-R, WAIS-R) czy Stanford-Bineta (np. S-B FE), zmienne osobowościowe mierzone za pomocą skal kwestionariuszy 16 PF-Cattella, MMPI- cKinleya i Hathawaya, ACL-Gougha, itp. 185 3. Konstrukcja mnogościowa zmiennej ilościowej Załóżmy (Nowak L., 1974, s. 9-10), że dany jest zbiór przedmiotów U (np. osób). Zbiór ten jest częściowo uporządkowany przez relację S, która jest przeciwsymet- ryczna i przechodnia w tym zbiorze, ale nie jest spójna. Można więc w zbiorze U wyróżnić przedmioty, między którymi relacja S nie zachodzi. Między tymi przed- miotami zachodzi natomiast relacja nieodróżnialności Q pod względem S: xQy wtedy i tylko wtedy, gdy nie jest tak, że xSy i nie jest tak, że ySx. Jeżeli chodzi o relację Q, zakłada się, iż jest ona zwrotna, symetryczna i prze- chodnia w zbiorze U. Jest więc Q relacją równościową w tym zbiorze. Zachodzi ona między tymi przedmiotami, pomiędzy którymi nie zachodzi wyjściowa relacja 5. Jeżeli U jest na przykład zbiorem osób, to relacją częściowo porządkującą ten zbiór może być relacja 5: „bycia bardziej inteligentnym niż...". Porządkuje ona zbiór osób wg stopnia, w jakim każdej osobie przysługuje cecha „inteligencji" — od osoby najmniej inteligentnej do najbardziej inteligentnej. Relacja „bycia bardziej inteligentnym niż ..." nie zachodzi pomiędzy tymi osobami, które są równointeli- gentne (cecha „inteligencji" przysługuje im w tym samym stopniu). Zachodzi mię- dzy nimi relacja nieodróżnialności Q, która jest stosunkiem „równointeligencji"; dwie osoby x i y są równointeligentne wtedy i tylko wtedy, gdy ani osoba x nie jest bardziej inteligentna od osoby y, ani osoba y nie jest bardziej inteligentna od osoby x. O relacji Q powiemy, że dzieli ona rozważany zbiór U na klasy abstrakcji. Klasy abstrakcji stanowią podzbiory (grupy) osób, które są równointeligentne. Mię- dzy elementami każdej takiej grupy nie zachodzi wyjściowa relacja „bycia bardziej inteligentnym niż...". Ogólnie określamy pojęcie klasy abstrakcji w sposób nastę- pujący. Niech x należy do U (pamiętajmy, że jest na nim określona relacja rów- nościowa 0. Symbolem [x]Q oznaczamy klasę abstrakcji ze względu na relację Q wyznaczoną przez element x. Mamy tedy dla każdego elementu y należącego do zbioru U: y e [x]Q = xQy, co czytamy: y należy do klasy abstrakcji [X]Q wtedy i tylko wtedy, gdy y jest równy x-owi pod względem Q (w naszym przykładzie, gdy y jest równointeligentny z x-em). W danym zbiorze możemy wyróżnić tyle różnych klas abstrakcji, ile można w nim wyróżnić jednolitych (homogenicznych) podzbiorów elementów, którym dana cecha przysługuje w tym samym stopniu. Podzbiory te są, oczywiście, rozłączne (nie mają elementów wspólnych) i w sumie dają zbiór U. Oznaczmy symbolem A zbiór klas abstrakcji od relacji Q. Na zbiorze A dana jest relacja wyprzedzania generalnego S'. Niech Z, i Zj są dowolnymi klasami abstrakcji. Wobec tego mamy: ZiS'Zj wtedy i tylko wtedy, gdy dla każdego x ze zbioru Z, i dla każdego y ze zbioru Z; jest: xSy. Reasumując, relacja S zachodzi między przedmiotami należącymi do różnych klas abstrakcji, relacja Q zachodzi między elementami należącymi do tej samej 186 S' S' S' S' F } < 1 r i r i r U: ••• « Q n ... -i+2 Rys. 7.1. Ilustracja zachodzenia na zbiorze U relacji S' i Q klasy abstrakcji, zaś relacja 5' zachodzi między samymi klasami abstrakcji. Sche- matycznie przedstawia to rys. 7.1. Niech dany będzie podzbiór R zbioru liczb rzeczywistych, który jest uporząd- kowany przez relację mniejszości (<). Funkcję określoną na zbiorze przedmiotów U i przybierającą wartości w zbiorze R nazywać będziemy funkcją skalującą (s) zbiór przedmiotów U. Spełnia ona warunek: dla dowolnych x, y ze zbioru U: jeżeli x i y należą do Z, to s(x)=s(y). Rodzinę klas abstrakcji A uporządkowaną przez relację wyprzedzania general- nego 5' nazywać będziemy zmienną ilościową wtedy i tylko wtedy, gdy istnieje taki podzbiór liczb rzeczywistych R uporządkowany przez relację mniejszości < oraz funkcja skalująca s, że dla każdego x należącego do zbioru Z, i dla każdego y należącego do zbioru Zj zachodzi: s(x) U(x)]" jest twierdzeniem psychologii. Przez T(x) oznaczamy jeden (albo całą koniunkcję) z predykatów obserwacyjnych: „u x-a występuje wzmożone bicie serca", „u x-a wil- gotnieje skóra dłoni", „u x-a występuje przyspieszone tętno". Jak wiemy, są to obserwacyjne korelaty uczucia strachu. Można zatem napisać zdanie, które jest twierdzeniem psychologii: ,Ą[U(x) -» T(x)]". Ze zdań: ,,Ą[S(x) -> U(x)]" i,Ą[(Ux) -> T(x)]" wynika logicznie zdanie: ,,Ą[S(x) -> T(x)f (tamże, s. 131), gdyż wyrażenie: Ą[/{x) —> g(x)] n A[g(x) -» h(x)] —»A \j{x) —> h(x)], jest sche- matem tautologicznym. „Jest tedy — pisze Kmita — zdanie «A[S'(;c) —» T(x)]» potwierdzoną hipotezą psychologiczną, pozwalającą twierdzić o danej osobie «a», że gdy znajdzie się ona w sytuacji scharakteryzowanej przez predykat S(x), to doznając uczucia strachu objawi symptomy (obserwowalne!) scharakteryzowane przez predykat T(x). Krócej: stwierdzając, że S(x) możemy przewidzieć, że T(x). Tak więc w odniesieniu do 13 — Metodologia badań.. 193 przeprowadzonego tu rozumowania dotyczącego osoby «a» przewidywanie ma na- stępującą budowę logiczną: S(a) n [S(a) -> U(a)] n [U(a) -> T(a)] -» T{a), albo: [S(a) -> U(a)] n [U(a) -> T(a)] -> [S(a) -»r(a)]" (tamże, s. 131). Ok res warunk owy: ,,S(a) — >r(a)" ma charakt er syntety czny (zakład amy, że termin jednost kowy „a" jest termine m pierwot nym oraz, że każdy obiekt indywi- dualny wyposa żony jest w termin tego typu). Wobec tego koniunk cja (oznacz ona symbol em Z^): ,,[S(a) —> ?/(a)] n [?/(a) —> T(a)]" nie jest zdanie m analityc znym, gdyż wynikaj ący z niej logiczni e okres warunk owy: ,,S(a) — >T{a)" też musiałb y być zdanie m analityc znym, a tak nie jest. Zatem jeden ze składni ków koniun kcji Zv nie jest zdanie m analityc znym. Dalej Kmita (tamże, s. 132) zauważ a, iż: (1) z sa m eg o Z^ ni e w yn ik a lo gi cz ni e T( a), (2) g dyby z koniun kcji Zv wstawi ć w miejsce predyka tu U(x) jakiś inny, nie- równoz naczny z nim predyka t U'(x), to otrzyma łoby się zdanie ZU: Gdyby okazało się, że z tego Z^ wynika Zv, to w świetle powyżs zych danych należał oby uznać, że to nie predyka t U{x) ale co najwyż ej predyka t U'(x) stanowi niezbęd ne ogniwo w przewid ywaniu S(a) tego, że T(a). Nie mieliby śmy więc gwaran cji, iż U(x) jest niezbęd ny, aby przepro wadzić powyżs ze przewid ywanie (tzn. że ma on tę właści wość, którą określa ć się będzie mianem mocy predykt ywnej). W szczegó lności Zv wynikał oby z Zy (przy nierów noznac zności predyka tów U(x) i U'(x)), gdyby zda niami analityc znymi były: (1) U(a) — > U'(a), (2) S(a) —» U(a), (jest to przykła d czysto umown y, gdyż żadne twierdz enie psychol ogiczne o zapisie (2) nie może być zdanie m analityc znym). Wtedy drugi człon koniun kcji Zv wynika łby z drugieg o członu koniun kcji Zv- i ze zdania (1), a pierwsz y człon koniun kcji Zv wynika łby z Zj/> i zdania (2). Tak więc sprawd zaniu empiry cznemu podlega ją tylko drugie człony koniun kcji Zv i ZV; gdyż pierwsz e są zdania mi anality cznymi . Z jednej strony, potwier dzony empiry cznie okres warunk owy ,,A[U'(x ) —> T(x)]" pozwal a — po dołącze niu odpowi ednich zdań analityc znych — na przewid ywanie tego sa mego, co okres warunk owy ,J\.[U(x ) —> T(x)]"- Z drugiej zaś strony, okres warun kowy: ,,A[U'(x ) —> T(x)]" przekaz uje „swą własną akcepta cję empiry czną" okre sowi warunk owemu: ,,A[U(x ) —> T(x)T- Poniew aż predyka t U'(x) ma szerszą de- notację niż predyk at U(x), więc mamy prawo przypus zczać, że ten pierwsz y ma większ y zakres zastoso wań przy przewid ywaniu z użycie m innych niż S(x) i T(x) predyka tów od predyka tu U(x). Uogóln iając powyżs ze rozważ ania Kmita (tamże, s. 133- 134) pisze tak: „Predyk at teoretyc zny T, występ ujący w języku J systemu wiedzy empiryc znej E, posiada na gruncie E moc predykt ywną wtedy i tylko wtedy, gdy: (1) w języku J (w którym zakłada my, że dyspon uje termina mi jednost kowymi nazywaj ącymi wszelki e indywid ua swego uniwers um, przy czym są to jego wyra- żenia pierwot ne) istnieją dwa predyka ty obserw acyjne (z uwagi na E): j{xh x2, ..., x„) oraz g(xu x2, ..., *„) takie, że: 194 Ą\f(xu x2, ..., xn) -» g(xu x2, ..., x„)] należy do E, a przy tym: (2) dla dowolnej n-tki a\, a2, ..., a„ terminów jednostkowych denotujących obiekty obserwowalne, z koniunkcji f(au a2, ..., an) n ZT gdzie Z? symbolizuje zaakceptowane w ramach E zdanie języka J zawierające predykat T, wynika zdanie g{ax, a2, ..., a„) z zastrzeżeniem, że nie wynika ono z samego zdania ZT oraz — że koniunkcja/(a], a2, ..., a„) n ZT nie jest zdaniem kontradyktorycznym w J; (3) nie istnieje w J taki predykat T', że spełnione byłyby jednocześnie nastę pujące warunki: a) T' jest nierównoznaczny w J z T, b) zdanie Zr powstałe z Zj- przez zastąpienie w nim predykatu T predykatem T na wszystkich pozycjach zaj mowanych przez T, należy do E, c) z koniunkcji (niekontradyktorycznej)/(ai, a2, ..., a„) n Zj- wynika g'(ai, a2, ..., an), d) ZT wynika z Zr. I dalej (tamże, s. 135): „Moc predyktywna predykatów teoretycznych nie tylko gwarantuje sprawdzal- ność hipotez, w których one występują, ale ponadto zapewnia ona ich niezbędność. Jeżeli bowiem przewidywane zdania obserwacyjne nie wynikają wyłącznie ze zdań obserwacyjnych typu: f(ax, a2, ..., a„), które będziemy nazywali w dalszym ciągu warunkami początkowymi — znaczy to, że odnośne zdanie ZT zawiera predykat teoretyczny T, komunikuje «coś więcej» niż same warunki początkowe: nie jest z nimi równoznaczne." W przypadkach predykatów teoretycznych wyższych rzędów ich powiązanie z odpowiednimi predykatami obserwacyjnymi jest nieraz bardzo skomplikowane i uzależnione od różnych znaczeń, jakie nadaje się tym terminom. Metoda zaproponowana przez Kmitę pozwala na wyrugowanie z języka danej dyscypliny empirycznej takich terminów teoretycznych, które — gdy występują w hipotezach badawczych — przesądzają z góry na „nie" ich sprawdzalność, gdyż nie mają te predykaty teoretyczne odpowiednich powiązań z predykatami obserwa- cyjnymi. Spróbujmy bowiem, na przykład, pokazać takie powiązania dla predykatu teoretycznego: „x ma duszę nieśmiertelną". 7. Wskaźniki 7.1. Pojęcie wskaźnika — wskaźniki rzeczowe i definicyjne Wyjdźmy od definicji zaproponowanej przez S. Nowaka (1985, s. 165): „Wskaźnik zdarzenia (własności) Z to takie zdarzenie (taka własność) W, że stwierdzenie (jej) istnienia, pojawienia się lub stopnia intensywności bądź faktycznie jest wykorzy- stane jako przesłanka, bądź zasadnie nadaje się na przesłankę wnioskowania, iż w określonych przypadkach z pewnością, z określonym prawdopodobieństwem lub o* 195 przynajmniej z prawdopodobieństwem wyższym niż przeciętne wystąpiło zdarzenie (własność) Z'. W wersji dla cech posiadanych przez jakiś przedmiot mamy następującą postać definicji (Nowak S., 1965a, s. 247): „cecha W jest wskaźnikiem posiadania cechy Z przez przedmiot P, jeżeli na podstawie tego, iż przedmiot ten posiada cechę W, możemy orzec, iż posiada on cechę Z lub też, iż cecha W pociąga za sobą określoną, lub też wyższą od przeciętnej szansę posiadania cechy Z przez nasz przedmiot". Z powyższych definicji wynika, iż wskaźnik musi być zawsze „czymś", co da się zaobserwować, natomiast zjawisko (cecha) wskaźnikowane, czyli indicatum, najczęściej jest nieobserwowalne (chociaż może być także obserwowalne). I tak, na przykład, zmienną nieobserwowalną jest neurotyzm, wskaźnikiem — charakterystyczny dla osoby obdarzonej wysokim natężeniem tej cechy, sposób udzielania odpowiedzi na pytania kwestionariusza M/V-Eysencka (lub innego, po- dobnego, kwestionariusza) ujęty liczbowo w postaci sumy punktów obliczonej wg specjalnego klucza, określającego, które odpowiedzi osoby badanej uważane są za diagnostyczne (czyli ujawniające występowanie w niej cechy neurotyzmu), a które jako takie traktowane być nie mogą (na ten temat piszę w pkt. 8.). Jakieś zjawisko czy cecha może być wskaźnikiem innego zjawiska (cechy) wtedy i tylko wtedy, gdy zachodzi między nimi określony związek. Związek ten może mieć charakter bezwyjątkowej lub statystycznej regularności. Zdanie, które stwierdza zachodzenie jakiegoś związku między wskaźnikami i indicatum, T. Pa- włowski (1969) nazywa zdaniem wprowadzającym wskaźnik. Określone zdanie może wprowadzać bądź jeden wskaźnik, bądź więcej. I tak — własność A jest wprowadzona przez zdanie (a) jako wskaźnik własności B. Natomiast zdanie (b) wprowadza własność A jako wskaźnik własności B i własność nie-,4 jako wskaźnik własności nie-fi (Pawłowski T., 1969, s. 176): A[A(x) (7.1) (co czytamy: dla każdego x, jeżeli x posiada własność A to x posiada również własność B). A[A(x) = (7.2) (co czytamy: dla każdego x, jeżeli zachodzi A(x) to zachodzi B(x) i jeżeli nie zachodzi A(x) to nie zachodzi B(x), albo inaczej: dla każdego x A(x) jest równo- ważne B(x)). Najczęściej wskaźnikami zmiennych osobowościowych są wyniki uzyskane przez osoby badane w kwestionariuszach osobowości. T. Pawłowski (tamże, s. 177) podaje zapis zdania wprowadzającego taki wskaźnik: A [W(x) (7.3) Zdanie to wprowadza koniunkcję własności A i W jako wskaźnik własności C. Zdanie to czytamy: dla każdego x, jeżeli x ma własność A, to fakt, że x ma własność W pociąga za sobą to, że ma własność C. Niech dalej A(x) oznacza, że x został przebadany kwestionariuszem osobowo- 196 ści A. W(x) niech oznacza, że x uzyskał w tym kwestionariuszu osobowości A wynik W. Wreszcie, C(x) niech oznacza, że x ma określoną cechę osobowości C. Zdanie (7.3) nie stanowi pełnego sformułowania wskaźnika własności C. Milcząco zakłada się tu wiele założeń idealizujących (w sensie, jaki występuje w: Nowak L., 1980), mówiących o tym, że osoba badana ma otwartą postawę wobec badania, że rozumie treść pytań, że cechuje ją określona samowiedza, pozwalająca zgodnie ze stanem faktycznym udzielić odpowiedzi na pytania kwestionariusza osobowości. Wprowadzenie jednak powyższych warunków do zdania (7.3) sprawiłoby, że stwierdzenie ich zachodzenia byłoby równie kłopotliwe, co stwierdzenie zachodze- nia indicatum. Nie sposób niekiedy ominąć tę trudność. Stąd niska wartość pew- nych wskaźników zmiennych osobowościowych, których konstrukcja nawiązuje do badań kwestionariuszowych. Praktykowane są dwa sposoby omijania wyżej sygnalizowanych trudności (tamże, s. 178). Pierwszy zaleca wprowadzenie tych dodatkowych warunków do sformułowania wskaźnika w taki sposób, który nie zmuszałby do dołączania do wskaźnika nieobserwowalnych zmiennych psychologicznych. Jest to — w pewnym stopniu — możliwe, jeżeli wprowadzi się behawiorystyczną charakterystykę tych warunków. Nie da się jednak w ten sposób scharakteryzować wszystkich warun- ków. Drugi sposób zaleca zaniechanie wprowadzania owych dodatkowych warun- ków i traktowanie zdania (7.3) jako pełnego sformułowania wskaźnika własności C. Nie trzeba więc odwoływać się do behawiorystycznej charakterystyki warunków. Jednak przy stosowaniu tego sposobu uzyskanie przez osobę badaną w kwestiona- riuszu osobowości jakiegoś wyniku jest co najwyżej wskaźnikiem probabilistycznym danej zmiennej osobowościowej. Zauważmy, że niebranie pod uwagę dodatkowych warunków zmienia częstość, z jaką wskaźnikowi towarzyszy indicatum. Związki zachodzące między wskaźnikiem a indicatum różnią się: (1) pod względem struktury logicznej, (2) pod względem charakteru związku. Różnicom tym odpowiadają równoważne im różnice dotyczące zdań wprowadzających wskaźniki. Zdania wprowadzające wskaźniki mogą przyjmować postać: (a) implikacji, (b) równoważności, (c) zależności probabilistycznej. Związek łączący wskaźnik z indicatum może mieć charakter związku albo (a) naturalnego, albo (b) umownego. W pierwszym przypadku zdanie wprowadza- jące wskaźnik jest twierdzeniem empirycznym (prawdziwym lub fałszywym — w zależności od jego zgodności ze stanem faktycznym). W drugim przypadku zdanie to jest postulatem znaczeniowym (ustala ono sens indicatum za pomocą wskaź- nika). Powróćmy jeszcze raz do zdania (7.1). Jeżeli potraktujemy je jako twierdzenie empiryczne, to zakładamy przy tym, że sens terminu B oraz kryteria jego stoso- walności zostały wcześniej ustalone i to niezależnie od terminu A. To czy *-owi przysługuje własność B, czy też nie, ocenia się na podstawie owego wcześniej, niezależnie od terminu A, ustalonego kryterium stosowalności terminu B. Jeżeli jednak zdanie (7.1) traktujemy jako postulat znaczeniowy, to termin A ustala zna- czenie terminu B (ustala kryteria stosowalności terminu B). 197 Jeżeli zdanie wprowadzające wskaźnik jest twierdzeniem empirycznym, to sam wskaźnik T. Pawłowski (tamże, s. 181) proponuje nazwać rzeczowym. W przypadku, gdy zdanie wprowadzające wskaźnik jest ustaleniem terminologicz- nym, to sam wskaźnik nazywać będziemy definicyjnym. Rozróżnienie wskaźników na rzeczowe i definicyjne jest bardzo ważne. Nie- respektowanie tego podziału może być źródłem wielu błędów. W cytowanej tu pracy T. Pawłowskiego Czytelnik znajdzie bardzo wnikliwą analizę przykładów obu rodzajów wskaźników. 7.2. Klasyfikacja wskaźników (wg S. Nowaka) Stefan Nowak (1965a) wyróżnił trzy typy wskaźników w zależności od charakteru indicatum oraz typu związku łączącego wskaźnik z indicatum: (a) empiryczne, (b) definicyjne, (c) inferencyjne. Oto ich krótka charakterystyka. (a) Wskaźniki empiryczne. Mówimy o nich wtedy, gdy indicatum (czyli zja wisko wskazywane Z — w terminologii S. Nowaka) jest obserwowalne. Wtedy bowiem związek łączący wskaźnik W z indicatum ma charakter związku empiry cznego. Na przykład, wskaźnikiem empirycznym stanu temperatury jakiejś osoby może być wysokość słupka rtęci w termometrze, chociaż to, czy owa osoba ma podwyższoną temperaturę można stwierdzić na podstawie tego, że ma wypieki na twarzy, że błyszczą jej oczy, ma spocone ciało itp. Zaletą tego typu wskaźników jest to, iż znacznie łatwiej stwierdzić ich występowanie niż wystąpienie obserwo- walnego indicatum. Mówiąc ogólnie, wskaźniki empiryczne to takie wskaźniki „przy pomocy któ- rych teza o zachodzeniu pewnej korelacji między wskaźnikiem a zjawiskiem prze- zeń wskazywanym jest tezą empiryczną, rozstrzygalną na drodze obserwacyjnej" (tamże, s. 249). (b) Wskaźniki definicyjne. W niektórych przypadkach dobór wskaźników wią że się jednocześnie z podaniem definicji indicatum. W takich przypadkach S. No wak mówi o wskaźnikach definicyjnych. Wskaźnikiem jest tu definiens danego zjawiska wskazywanego Z. Tak, na przykład, liczba wyborów uzyskanych w teście socjometrycznym przez osobę badaną jest wskaźnikiem pozycji społecznej tej oso by w grupie. Jednocześnie liczba wyborów w teście socjometrycznym jest definien- sem definiowanego terminu „pozycja społeczna jednostki w grupie". (c) Wskaźniki inferencyjne. O inferencyjnym wskaźniku W zjawiska Z mówi my wówczas, gdy: (1) wskaźnik W nie jest definiensem (albo inaczej: nie wchodzi do definicji) indicatum Z, którego znaczenie zostało wcześniej, niezależnie od W ustalone; 198 (2) indicatum Z nie jest obserwowalne, a o jego wystąpieniu wnioskujemy (inferujemy) z tego, iż wystąpił wskaźnik W. Indicatum jest więc jakąś ukrytą, hipotetyczną zmienną (nieobserwowalną), ale posiadającą określone, obserwowalne następstwa (tamże, s. 253). Wskaźniki empiryczne i inferencyjne S. Nowak włącza do ogólniejszej klasy wskaźników zewnętrznych wobec indicatum, gdyż nie wchodzą one do indicatum, którego są wskaźnikami. Na przykład wysoka pozycja socjometryczna nie wchodzi do treści pojęcia „wysokiej samooceny" (tamże, s. 254). Jest to przykład wskaźnika zewnętrznego. Natomiast wskaźniki definicyjne S. Nowak traktuje jako wewnętrzne, gdyż albo stanowią całość indicatum (gdy są definicjami pełnymi), albo do niego wcho- dzą (gdy są definicjami cząstkowymi). Stosunkowo często badacze posługują się wskaźnikami mieszanymi. Stefan Nowak wymienia cztery kategorie takich wskaźników: (a) empiryczno-definicyjne, (b) definicyjno-inferencyjne, (c) empiryczno-inferencyjne, (d) empiryczno-inferencyjno-definicyjne. Oto ich krótka charakterystyka. (a) Wskaźniki empiryczno-definicyjne. Badacze spotykają się niekiedy z taką sytuacją, w której termin będący wskaźnikiem jakiejś zmiennej jest wobec poszcze gólnych skorelowanych ze sobą elementów, składających się na tę zmienną (zmien ną syndromatyczną — gdyż jest ona określona przez syndrom składających się na nią elementów), zewnętrznym wskaźnikiem empirycznym, ale jednocześnie wobec samej zmiennej jest wewnętrznym wskaźnikiem definicyjnym (stanowi jej definicję cząstkową, tak jak pozostałe elementy tej zmiennej). Posiadanie przez x-a samo chodu jest zewnętrznym wskaźnikiem empirycznym wobec każdego z syndromu skorelowanych ze sobą elementów, składających się na taką zmienną teoretyczną, jak „poziom konsumpcji" (tymi elementami są np. „sposób odżywiania się", „wy datki na wycieczki", „sposób ubierania się"). Jest to jednocześnie wewnętrzny wskaźnik definicyjny poziomu konsumpcji, gdyż stanowi jego definicję cząstkową (wchodzi do indicatum). (b) Wskaźniki definicyjno-inferencyjne. Zdarza się, iż wskaźnik W, z którego wystąpienia inferujemy zajście jakiegoś zjawiska wskaźnikowego Z (indicatum), wcho dzi do definicji tego zjawiska. W przypadku „czystych" wskaźników inferencyjnych termin oznaczający wskaźnik zjawiska Z nie wchodzi do jego definicji. Z zachowa nia się pacjenta wnioskujemy — na przykład — iż jest on pobudzony emocjonalnie, a jednocześnie zachowania te wchodzą do definicji terminu „pobudzenie emocjonal ne" (obok innych elementów nieobserwowalnych, jak przebieg procesów myślo wych, percepcja otoczenia itp.). Mamy więc do czynienia — jak pisze S. Nowak (tamże, s. 257) „z pewnym złożonym konstruktem cechującym się tym, iż: (1) pewne jego elementy mają charakter obserwowalny, zaś inne nie, przy czym te elementy obserwowalne są wskaźnikami inferencyjnymi elementów nie- obserwowalnych, 199 (2) ale i jedne i drugie składają się łącznie na całość zjawiska oznaczanego przez nasz konstrukt złożony, z tym, iż elementy obserwowalne są wówczas wskaź- nikami definicyjnymi tego złożonego konstruktu, jego definicjami cząstkowymi." (c) Wskaźniki empiryczno-inferencyjne. Są takie zmienne, które cechują się tym, iż mają powiązania korelacyjne z dużą liczbą innych zmiennych. Jednocześnie można na ich podstawie wnioskować o wielu innych zjawiskach. Weźmy pod uwa gę następujący przykład. Jeżeli osoba badana uzyskała wysoki wynik w Skali Po staw Wobec Kościoła Thurstone'a i Chave'a, wynik pozwalający ją określić jako bardzo wierzącą i praktykującą, to mamy prawo przypuszczać, że jest to osoba, która regularnie uczęszcza do kościoła, zdejmuje nakrycie głowy przed krzyżem itp. Wobec tych zachowań wysoki wynik w skali postaw jest, jak nietrudno zauwa żyć, wskaźnikiem empirycznym. Na podstawie wyniku uzyskanego przez tę osobę można także wnioskować — opierając się na wiedzy teoretycznej, którą dysponu jemy — o uczuciach, jakie przeżywa ona w trakcie modlitwy. Wobec tych uczuć wynik uzyskany przez tę osobę jest wskaźnikiem inferencyjnym. (d) Wskaźniki empiryczno-inferencyjno-definicyjne. Bywa, że pewne zachowa nia skorelowane z wysokimi wynikami w jakimś kwestionariuszu oraz stany, które można na jego podstawie wywnioskować, obejmuje się jednym pojęciem. Wówczas dany wskaźnik (wynik w kwestionariuszu) pełni obok funkcji empirycznych i in- ferencyjnych (patrz wyżej) także funkcje definicyjne (wchodzi do indicatum i sta nowi jego definicję cząstkową). 7.3. Moc rozdzielcza wskaźników empirycznych Wspomniałem już, że związki łączące wskaźnik z indicatum mogą mieć charakter albo związków bezwyjątkowych, albo związków probabilistycznych. W naukach społecznych (a więc i w psychologii) w zasadzie posługujemy się takimi wskaź- nikami, które ze zmiennymi przez nie wskazywanymi łączą związki statystyczne (probabilistyczne). Doskonalenie narzędzi badawczych (piszę o tym w odniesieniu do narzędzi psychologii w pkt. 8., a także w części V) przyczynia się m. in. do podwyższenia wartości korelacji między wskaźnikiem i indicatum, a tym samym do podniesienia wartości prognostycznej wskaźnika. Spróbujmy teraz — pod tym kątem — spojrzeć na wskaźniki empiryczne. Tutaj stosunkowo łatwo jest obliczyć stopień statystycznej zależności między ob- serwowalnym indicatum i obserwowalnym wskaźnikiem. Stefan Nowak wyróżnia trzy rodzaje statystycznych powiązań między wskaź- nikiem empirycznym i zjawiskiem przezeń wskazywanym. Owe powiązania określa on mianem mocy rozdzielczej wskaźnika. Rozpatrzmy sytuację, w której badacz zainteresowany jest tym, aby w zakresie skonstruowanego przez niego wskaźnika znalazły się tylko określone indicata. Mó- wiąc inaczej chodzi o to, aby np. wszystkie (lub prawie wszystkie) osoby wydzie- lone z populacji przez wskaźnik posiadały cechę przezeń wskazywaną, bez względu 200 na to, ile osób posiadających daną cechę nie wejdzie do grupy wydzielonej przez wskaźnik. Takim, z powyższego punktu widzenia, dobrym wskaźnikiem powodze- nia w przyszłych studiach z danej dziedziny wiedzy jest zajęcie przez ucznia pierw- szego miejsca w olimpiadzie, której przedmiotem jest ta właśnie dziedzina wiedzy, np. fizyka. Musimy przy tym zdawać sobie sprawę z faktu, iż wskaźnik ten nie wyodrębnia z populacji dużej liczby uczniów, którzy nie brali udziału w olimpia- dzie, a mogą okazać się — w przyszłości — dobrymi studentami. Taka strategia doboru wskaźników oparta jest na zasadzie maksymalizacji pra- wdopodobieństwa zajścia indicatum (I) ze względu na zajście wskaźnika (W), czyli — używając zapisu symbolicznego — na maksymalizacji: pI/W (tamże, s. 267). Ten typ mocy rozdzielczej nazywa S. Nowak mocą odrzucenia (MO) danego wskaźnika W (na podkreślenie tego, iż chodzi tu o odrzucenie wszystkich nie-/) i zapisujemy go w postaci wzoru (7.4): MO = — — > (7.4) N(W) gdzie: N(IW) — liczba przedmiotów posiadających dane indicatum w ramach za- kresu wyróżnionego przez wskaźnik; N(W) — liczba przedmiotów wydzielonych przez wskaźnik. Współczynnik MO przyjmuje wartość maksymalną 1,00 wtedy, gdy liczby przedmiotów: (N(IW) i N(W)) są takie same. Możemy też przy konstrukcji wskaźnika kierować się całkowicie odmienną zasadą. Można bowiem tak skonstruować wskaźnik W, aby w jego granicach zna- lazły się wszystkie (lub prawie wszystkie) przedmioty posiadające dane indicatum. Na przykład, badaczowi może zależeć na tym, by wyodrębnić z danej populacji wszystkie osoby neurotyczne, bez względu na to, ile osób nieneurotycznych wej- dzie do grupy wyodrębnionej przez wskaźnik. Może on w tym celu skonstruować odpowiedni kwestionariusz osobowości — na przykład na wzór kwestionariusza MPI Eysencka — za pomocą którego będzie wyodrębniał osoby posiadające cechę neurotyczności. Ponieważ nie jest to narzędzie doskonałe, więc do grupy będą także włączane osoby de facto nie posiadające cechy neurotyczności. Badacz jednak zain- teresowany jest tym, by w grupie znalazło się jak najwięcej osób neurotycznych, więc już stosunkowo niewysoki wskaźnik tej cechy uzyskany przez x-a w kwestio- nariuszu osobowości będzie traktował jako wskaźnik posiadania przez x-a cechy neurotyczności. Oczywiście, przy zastosowaniu takiej strategii w wyróżnionej przez badacza grupie znajdzie się dużo *-ów nie posiadających cechy neurotyczności. Powyższa strategia oparta jest na zasadzie maksymalizacji prawdopodobień- stwa: p~I/~W. Ten typ mocy rozdzielczej nazywa S. Nowak mocą zawierania (MZ) danego wskaźnika W i zapisuje go w postaci wzoru (7.5): N(~W) (7.5) Często badacze są zainteresowani tym, by dany wskaźnik jedncześnie maksy- malizował moc zawierania i moc odrzucania, by — mówiąc inaczej — był w maksymalnym stopniu skorelowany z indicatum. W takim przypadku mówimy po prostu o mocy rozdzielczej (MR) danego wskaźnika: 201 MR = (7.6) gdzie: Rnv — stopień korelacji indicatum ze wskaźnikiem; MR — osiąga wartość maksymalną 1,00 wtedy, gdy MO = 1,00 i MZ = 1,00. Przy dobieraniu osób badanych z populacji do dwóch grup porównawczych zależy nam na tym, by w jednej grupie znalazły się wszystkie (lub prawie wszy- stkie) osoby posiadające cechę C (i wyłącznie lub prawie wyłącznie te osoby), a w drugiej wszystkie (lub prawie wszystkie) osoby nie posiadające cechy C, czyli posiadające cechę ~C (i wyłącznie lub prawie wyłącznie te osoby). W takim przy- padku najlepszy jest wskaźnik o maksymalnej mocy rozdzielczej MR. Tak się to przedstawia, gdy przeprowadzamy klasyfikację opierając się na jednym wskaźniku. Przy dokonywaniu klasyfikacji za pomocą dwóch wskaźników możemy postępo- wać tak jak pisze S. Nowak (tamże, s. 296-270): „(...) możemy dobrać jeden wskaźnik o maksymalnej MZ, drugi o maksymalnej MO i tym samym uzyskać dwie grupy różniące się od siebie maksymalnie (ze względu na nasze możliwości badawcze) częstością występowania indicatum. Poza zasięgiem obu wskaźników znajdzie się wówczas pewien mniejszy lub większy zakres rzeczywistości stano- wiący «obszar nieoznaczoności*, naszej baterii wskaźników (...). Im mniejszy jest ten obszar nieoznaczoności, tym większą moc rozdzielczą ma nasza bateria wskaźników". Można to wyrazić schematycznie, jak na rys. 7.3 w2 ~w2 w,, w2 1 obszar nieoznaczoności ~w,, ~w2 ~l w, ~WĄ Rys. 7.3. Moc rozdzielcza wskaźników empirycznych — na przykładzie dwóch wskaźników: W{ oraz W2 Oczywiście, oba wskaźniki Wi i W2 wskazują to samo indicatum (/). Krańco- we, nie zacieniowane prostokąty przedstawiają jednorodne grupy osób, wskazywa- ne przez baterię wskaźników Wt i W2 jako posiadające indicatum (/) — lewy prostokąt i nie posiadające indicatum (~I) — prawy prostokąt. Prostokąt środkowy, mocno zacieniowany, obejmuje osoby bądź posiadające indicatum (/), bądź go nie posiadające (~/). Z zagadnieniem mocy rozdzielczej wskaźników definicyjnych i inferencyj- nych Czytelnik może zapoznać się w cytowanej tu pracy S. Nowaka, w paragrafie pt: Zagadnienie mocy rozdzielczej wskaźników definicyjnych i inferencyjnych (s. 270-281). 202 8. Wyniki uzyskane na skalach narzędzi pomiarowych jako wskaźniki zmiennych ilościowych Przedstawiając problematykę doboru wskaźników do zmiennych obserwowalnych i nieobserwowalnych, kilkakrotnie wspomniałem, iż w psychologicznej praktyce badawczej bardzo często stosuje się wskaźniki, które są odpowiedziami w różnego typu testach psychologicznych — testach inteligencji (typowy przykład: Skala In- teligencji WAIS-R Wechslera czy test Matryc Ravena), kwestionariuszach osobo- wości (typowy przykład: MPI Eysencka czy 16PF Cattella), testach wiadomości. Po zakodowaniu, wg specjalnego klucza, odpowiedzi te wyrażone są w postaci jakiegoś wyniku ilościowego. Ten zaś traktowany jest jako wskaźnik danej zmien- nej. Oczywiście, takich wyników mogą nam dostarczyć nie tylko testy psychologicz- ne ale także specjalistyczne aparaty, np. aparat do pomiaru czasu reakcji (RT) czy galwanometr do pomiaru reakcji skórno-galwanicznej (GSR). Procedura konstruowania wskaźników w przypadku zmiennych ilościo- wych w postaci wyników uzyskanych przez osoby badane na skalach odpowied- nich narzędzi pomiarowych wymaga bardziej szczegółowych wyjaśnień. O nich niżej. 8.1. Założenia dotyczące natury narzędzia pomiarowego n Zacznijmy od założenia dotyczącego pojęcia zmiennej w ujęciu przedstawionym w rozdz. 7. pkt. 3. Musimy też poczynić pewne założenia odnośnie do natury narzędzi badawczych. O danym narzędziu n służącym do pomiaru natężenia zmiennej A zakłada się tylko tyle, iż ma ono skalę (podziałkę). Skalę narzędzia oznaczać będzie- my symbolem v(n), przy czym v(n) jest podzbiorem właściwym zbioru wszyst- kich miar zmiennej A. Ponadto zbiór v(n) jest zbiorem skończonym i uporządko- wanym od minimum do maksimum. Można w nim wyróżnić minimum: (m^) i maksimum {mx). Przyjmuje się więc, że: istnieje takie m0 należące do zbioru v(n), że dla każ- dego n € v(n) mamy: n 3= m^ oraz, że istnieje takie mx należące do v(n), że dla każdego n e v(n) mamy: n 3= mx . Można wyróżnić operacyjną funkcję skalującą S/. Przyporządkowuje ona licz- by ze zbioru v(n) przedmiotom należącym do zakresu zmiennej A (oznaczać go będziemy przez Z(A)). Czyli: 5/ jest określona na Z(A), a przybiera wartości ze zbioru v(n). Wprowadźmy teraz pojęcie relacji nieodróżnialności narzędzia n na miarach zmiennej A. Oznaczać ją będziemy symbolem NDRn. Dla dwóch różnych przedmiotów x, y mamy: v(n) = S?(y) = q]. 203 Powyższy zapis znaczy tyle, iż narzędzie n przyporządkowuje różnym przed- miotom x i y tę samą miarę q, czyli inaczej: narzędzie n pokazuje przedmioty x, y jako równe. Zauważmy, iż w grę mogą wchodzić dwa przypadki: (1) x i y należą do tej samej klasy abstrakcji, a więc zmienna A przyjmuje dla nich tę samą wartość i mamy wtedy: (2) x i y należą do różnych klas abstrakcji, a więc zmienna A przyjmuje dla nich różne wartości; mamy więc: SAn(x)*SA(x)iS/(y)*SA(y), ale o ile Sf(x) = S/(y), o tyle SA(x)*SA(y). Relacja NDRn jest więc równością w zbiorze Z(A), tj. w zakresie zmiennej A (czyli w zbiorze U). Dzieli ona zbiór U=Z(A) na skończoną liczbę klas abstrakcji: iv A - ivh..., ivp. ?„.., Np_u Np}, i Zachodzi jedno-jednoznaczne izomorficzne odwzorowanie zbioru NA na zbiór v(n) wg schematu: NA* = {Ni, N2, N III {<7i, q2, q3 ? przy czym dla każdych x, y należących do /-tej klasy abstrakcji Af, zachodzi: SA(x) = SA(y) = %. Oznacza to, iż dla każdego przedmiotu x, y należącego do klasy abstrakcji A', przyrząd n ustala tę samą miarę qt. 8.2. Pojęcie funkcji operacyjnej Zdefini ujmy teraz pojęcie funkcji operacy jnej ze względ u na narzędz ie: f*. Otóż, funkcja operacy jna ze względ u na narzędz ie n przeksz tałca zmienn ą A na zbiór v(7r). Ma ona postać: V(7T). Jej dziedziną jest zbiór A, a przeciwdziedziną zbiór miar zmiennej A wyróż- nionych na skali narzędzia n czyli zbiór v(n). Zachodzi tu przekształcenie wielo-- jednoznaczne (homomorficzne). 8.3. Pojęcie idealnego narzędzia Dla badacza pożądany jest taki stan, kiedy funkcja operacyjna byłaby funkcją jed- no-jednoznaczną, a więc przyporządkowywałaby poszczególnym, różnym przed- miotom z zakresu zmiennej A różne liczby (przekształcenie izomorficzne). Narzędzie n, ze względu na które funkcja operacyjna jest funkcją jedno-- jednoznaczną jest narzędziem idealnym wtedy i tylko wtedy, gdy zbiór N/ jest identyczny ze zbiorem A. W konsekwencji mamy: v(n) jest identyczne z v(A), zaś S/id=SA. O narzędziu n można powiedzieć, że jest bardziej dyskryminatywne od narzędzia n' ze względu na zmienną A wtedy i tylko wtedy, gdy dla większej licz- by klas abstrakcji składających się na N/ niż na A^ spełniony jest warunek: N, jest podzbiorem właściwym N\. Zatem narzędzie idealne cechuje maksymalna dys- kryminatywność. Oczywiście, dyskryminatywność narzędzi rzeczywistych jest mniejsza (niekiedy dużo mniejsza) od dyskryminatywności narzędzi idealnych. Jeżeli narzędzie n jest takie, że v(n) jest identyczne z v(A), to poza tym, że cechuje je (1) maksymalna dyskryminatywność, jest ono jeszcze (2) narzędziem o idealnym zakresie pomiarowym. Z takiego narzędzia można utworzyć zbiór narzę- dzi o wszystkich możliwych podzakresach pomiarowych. Można zatem powiedzieć, iż dla każdej zmiennej istnieje narzędzie o idealnym zakresie pomiarowym, a więc o idealnej dyskryminatywności, oraz że można utwo- rzyć zbiór narzędzi rzeczywistych o niepełnych zakresach pomiarowych odpowia- dających różnym podzakresom zmiennej A. Rozważmy następujący przykład. Bardzo rozpowszechnionym wśród psycho- logów i często przez nich stosowanym w różnych badaniach narzędziem do pomiaru poziomu inteligencji (między innymi ilorazu inteligencji — II) jest Skala Inteligencji Wechslera WAIS-R. Jest ona typowym przykładem narzędzia o niepełnym zakresie pomiarowym. Różnicuje jedynie osoby z określonego przedziału wartości II = 45 — 150 (Skala Pełna WAIS-R; por. Brzeziński, Hornowska, 1993). Nie można za pomocą tego narzędzia zmierzyć poziomu inteligencji osób, których II jest mniejszy od minimum lub większy od maksimum skali narzędzia. Jest ono zatem zupełnie nie- przydatne, jeżeh' chodzi o badanie osób upośledzonych umysłowo w stopniu znacznym i głębokim gdyż jego zakres nie obejmuje dolnej części zakresu badanej zmiennej. Do tego celu należałoby użyć innego narzędzia, takiego, którego zakres pomiarowy pokrywałby się z rozważanym podzakresem zmiennej inteligencji. Spełnia to kryterium np. Skala Inteligencji Stanford-Bineta (S-B FE) (por. Thorndike i in., 1986). Wyżej przytoczony przykład narzędzia o niepełnym zakresie pomiarowym można zilustrować na schemacie: V(A) V(ń) m0 45 H — I 150 n 205 9. Nowe ujęcie problemu operacjonalizacji zmiennych psychologicznych (wg E. Hornowskiej) W latach osiemdziesiątych powstała oryginalna i ciekawa koncepcja nadawania terminom teoretycznym (w psychologii powiemy — zmiennym) sensu empirycz- nego. Koncepcja ta opracowana została przez psychologa, Elżbietę Hornowską (1989). Nawiązuje ona do idealizacyjnej teorii nauki (L. Nowak, 1977, 1980), a także do prac metodologicznych powstałych w kręgu Szkoły Poznańskiej, inspiro- wanych pracami jednego z jej twórców, Leszka Nowaka (Brzeziński, 1978b; Gaul, 1990; Kupracz, 1991; Maruszewski, 1983; Tuchańska, 1980). Wydaje się, że jest to jedna z ciekawszych propozycji metodologicznych, jakie powstały w ostatnich latach na temat operacjonalizacji zmiennych. Jest to szczególnie ciekawa propozy- cja dla nauk społecznych, a przede wszystkim dla psychologii. 9.1. Istota procedury operacjonalizacji Zacznijmy od ogólnej charakterystyki procedury operacjonalizacji, dokonanej przez autorkę omawianej w tym punkcie koncepcji, aby zorientować się, na co położony został w niej nacisk i aby dowiedzieć się, na jakie pytania badacz, który posłuży się tą koncepcją, może uzyskać odpowiedzi (Hornowską, 1989, s. 52-53): „W przedstawionej tu koncepcji operacjonalizacja rozumiana będzie jako pro- cedura konstruowania sensu empirycznego terminów teoretycznych, procedura, któ- ra ma umożliwić badaczowi udzielenie odpowiedzi na następujące pytania: 1. Do jakich aspektów świata rzeczywistego odnosi się jego problem badawczy? 2. Jak dalece wybrane przez niego wielkości i istniejące między nimi powią zania dostępne są obserwacji? 3. W jakim zakresie wybrane przez niego obserwacje dostarczą mu informacji o wyjściowym problemie badawczym? Procedura ta nie jest więc tu sprowadzona wyłącznie do zabiegu doboru — dla określonej wielkości teoretycznej — jej obserwowalnych wskaźników (tak jak to zostało opisane w pkt. 7. niniejszego rozdziału — przyp. J. B.). Jeśli zabieg taki rozumiany jest jako bezpośrednie przełożenie wielkości teoretycznej na język «ope- racji badawczych* (tak jak to miało miejsce w operacjonizmie Bridgmana(1927), który bardzo szybko przeniknął do psychologii — przyp. J. B.)2, to w gruncie S tevens (1935) tak charaktery zował ten nowy sposób myślenia naukoweg o w psycholog ii: „operacjo nizm polega po prostu na definiowa niu pojęć przez odnoszeni e ich do konkretny ch operacji, przy pomocy których zdobywa my wiedzę o rzeczach" . Wyznawc y „nowej wiary" w psycholo gii (ale nie tylko w niej) — operacjon izmu — doprowad zili go do karykatur alnego wypaczen ia. Niech przykładu dostarczy próba operacyjn ego zdefiniow ania terminu ,.inteligen cja" dokonana przez znanego psy- chologa amerykań skiego, Boringa (cyt. za: Seligman D., 1995, s. 29): „Inteligen cja, jako dająca się zmierzyć zdolność, musi od razu zostać określona jako umiejętno ść osiągania dobrych wyników w teście inteligenc ji. Inteligenc ja jest tym, co mierzą testy inteligenc ji". Ta i podobne „definicje " spro- wadziły na ich autorów zasłużoną krytykę (por. „Psychol. Rev." 1945). 206 rzeczy operacjonalizacja sprowadza się do zastępowania jednych pojęć innymi. W rezultacie można oczywiście uzyskać dane empiryczne, nie można jednak za- gwarantować, że analizowanie tych danych wniesie cokolwiek do wiedzy o wyj- ściowym problemie badawczym". 9.1.1. Czynnik — wielkość — zmienna Kluczowe dla zrozumienia istoty dokonanego przez Hornowską ujęcia procedury operacjonalizacji jest rozróżnienie znaczeniowe trzech pojęć: „czynnika", „wielko- ści" i „zmiennej". Zacznijmy tedy od przybliżenia tych pojęć. „Czynnik" jest pojęciem o charakterze ontologicznym, które odnosi się do opisywanej przez badacza rzeczywistości; mówi o tym, jaka jest badana rzeczywi- stość. Definiuje się go jako rodzinę klas abstrakcji od relacji równościowej okre- ślonej w zbiorze obiektów U (dokładniej, jest to czynnik nominalny — por. pkt 3.). Jeżeli ponadto rodzina ta uporządkowana jest przez relację generalnego upo- rządkowania, to mamy do czynienia z czynnikiem porządkowym. Jak definiowany jest czynnik ilościowy (interwałowy i ilorazowy) szczegółowo pokazane zostało w pkt. 3. niniejszego rozdziału. „Wielkość" i „zmienna", w odróżnieniu od pojęcia „czynnika", są pojęciami o charakterze epistemologicznym, zdającymi sprawę z tego, w jaki sposób badacz postrzega rzeczywistość, którą analizuje. „Wielkość" jest obrazem czynnika ustalo- nym na gruncie określonej wiedzy badacza (założeń akceptowanej przez niego teo- rii — por. pojęcie TBO, rozdz. 3., pkt. 3.). Z kolei „zmienna" to: „przyjęty przez badacza sposób przejawiania się wielkości na poziomie manifestacji (obserwacji)" (tamże, s. 71). Hornowską utożsamia tak rozumiane pojęcie zmiennej z klasycznym rozumieniem pojęcia „wskaźnika" (w sensie T. Pawłowskiego i S. Nowaka — por. pkt. 7. niniejszego rozdziału). To rozróżnienie jest ważne dla omawianego ujęcia procedury operacjonaliza- cji, gdyż pozwala na wyróżnienie dwóch głównych jej etapów: (1) konstruowania wielkości, czyli tworzenia obrazów czynnika teoretycznego i (2) tworzenia zmien- nej, czyli budowania zoperacjonalizowanego obrazu wielkości. Zauważmy, iż Hornowską budowała swoją koncepcję operacjonalizacji wy- chodząc z tradycji, także terminologicznych, idealizacyjnej teorii nauki. Psycholo- gia, a ściślej jej praktyka badawcza, formowana była poza tą tradycją. Podstawo- wym tedy pojęciem dla badacza-psychologa jest pojęcie zmiennej, które zostało Czytelnikowi przybliżone w pkt. 2.-5. niniejszego rozdziału. Pojęcie zmiennej uży- wane jest z dodatkowym dookreśleniem, pozwalającym na rozróżnianie podobne do tego, które wprowadziła Hornowską posługując się w tym celu trzema pojęcia- mi, wyżej zdefiniowanymi. Można, jak sądzę, wprowadzić następujące znaki rów- ności: czynnik = zmienna teoretyczna, wielkość = obraz zmiennej teoretycznej, zmienna = wskaźnik. Zatem operacjonalizacja zmiennej, z grubsza rzecz ujmując, polega na: (1) tworzeniu obrazu (wielkości) zmiennej teoretycznej (czynnika) oraz (2) dobiera- niu do niego wskaźników (zmiennej, jako zoperacjonalizowanego obrazu wielkości). 207 9.1.2. Podstawowe założenia Wyróżnia się czynnik T, który jest istotny (w sensie wywierania wpływu — tak jak to ujmuje na gruncie idealizacyjnej teorii nauki L. Nowak, 1980) dla pewnych czyn- ników tworzących zbiór WT. Ów zbiór nazywać będziemy bezpośrednim obszarem wpływu czynnika T. Inaczej mówiąc, zbiór ten obejmuje wszystkie te czynniki, które powiązane są z czynnikiem T relacją istotności. O danym czynniku S należą- cym do zbioru WT powiemy, że jest powiązany z czynnikiem T relacją istotnościo- wego następstwa Nist. Tak jak czynnik 5 należy do obszaru wpływu czynnika T, tak z kolei do obszaru wpływu czynnika 5 należy jakiś czynnik P. Mielibyśmy zatem taki ciąg czynników T, S, P, że pomiędzy T i 5 oraz S i P zachodziłaby relacja istotnościowego następstwa. O ile czynnik S należy do bezpośredniego, pierwszego rzędu obszaru wpływu czynnika T, o tyle czynnik P należy do pośredniego, drugiego rzędu wpływu czynnika T; co oznaczać będziemy jako: WTl, WT2, ..., WT', ..., WTa. Suma zbiorów: WT\ ..., WTa tworzy przestrzeń wpływu czynnika T. Jeżeli pierwszy obszar wpływu czynnika T czyli WTl zawiera jakiś czynnik obserwowalny (czyli jego zakres obejmuje obiekty obserwowalne), to powiemy, że zawiera on identyfikator dla T, rzecz jasna, że identyfikatorów może być większa liczba. Zbiór wszystkich identyfikatorów z WTl to obszar identyfikacji pierwszego stopnia czynnika T-IT\ Odpowiednio możemy mówić o obszarach identyfikacji drugiego stopnia, trzeciego stopnia itd. Obszarów identyfikacji czynnika T może być co najwyżej tyle, ile jest obszarów wpływu tego czynnika. Jeżeli w ciągu obszarów wpływów danego czynnika T istnieje taki ciąg czyn- ników, że każdy z nich połączony jest z następnym w tym ciągu relacją istotno- ściowego następstwa, oraz że pierwszy czynnik jest czynnikiem głównym dla dru- giego, drugi jest czynnikiem głównym dla trzeciego itd., aż do ostatniego w ciągu, który jest czynnikiem obserwowalnym, to obszar identyfikacji utworzony przez czynnik T określamy mianem obszaru mocnej identyfikacji czynnika T, a relację istotnościowego następstwa wiążącą dwa kolejne czynniki w tym ciągu określamy mianem mocnej relacji istotnościowego następstwa Nist*. Relację nie spełniającą powyższych warunków określamy z kolei mianem słabej Nist . „Zakłada się zatem — pisze Hornowska (tamże, s. 56) — że dla każdego czynnika teoretycznego istnieją takie obserwowalne stany rzeczy, które zależą mniej lub bardziej pośrednio od wartości czynnika teoretycznego. Wskazując ob- szar identyfikacji czynnika teoretycznego określamy tym samym kryteria stosowal- ności empirycznej pojęcia denotującego ten czynnik. Przyjmujemy, że związek po- między czynnikiem teoretycznym a odpowiadającymi mu obserwowalnymi stanami rzeczy jest związkiem nie tylko na poziomie epistemologicznym, ale także związ- kiem na poziomie ontologicznym." Jakiś czynnik obserwowalny Qk może być identyfikatorem nie tylko jednego, wyróżnionego czynnika, ale może być identyfikatorem wielu czynników. Zbiór tych wszystkich czynników teoretycznych, które pozostają w relacji istot- nościowego następstwa z danym czynnikiem obserwowalnym nazywać będziemy obszarem znaczeniowym (/"-stopnia) danego identyfikatora — Z(QkY. Suma obsza- 208 rów znaczeniowych, pierwszego, drugiego i dalszych stopni, to przestrzeń znacze- niowa identyfikatora Qk. Tym samym dopuszcza się, „że dany czynnik obserwo- walny (lub zbiór takich czynników) przyporządkowany jest nie jednemu czynni- kowi T, lecz całej rodzinie czynników [71, przy założeniu, że T należy do [T\. Czynnikom obserwowalnym jest zatem przypisany zbiór znaczeń; są one wielo- znaczne" (tamże, s. 57). Każdy identyfikator posiada charakterystyczną dla siebie strukturę esencjalną (istotnościową). Zależy ona od rodzaju relacji istotnościowego następstwa i jest: (a) mocna (Nist*) lub (b) słaba (Nist). W przypadku (a) powiemy, że dany czynnik T Jest czynnikiem bardziej istotnym dla danego czynnika obserwowalnego Qk niż inny czynnik H" (tamże, s. 58). W przypadku (b) powiemy z kolei, że dany czynnik T ,jest czynnikiem mniej istotnym dla Qk niż inny czynnik H" (tamże, s. 58). W przypadku (a) czynnik Qk jest trafniejszym identyfikatorem dla czynnika T ani- żeli w przypadku (b). Obie struktury esencjalne będą wyglądały następująco: (a) S(QK): T T, H (b) S(QK): H H, T Kolejne kroki doprowadziły nas do tezy, iż „dla każdego czynnika teoretycz- nego, który może zostać określony na gruncie założeń teoretycznych przyjmowa- nych przez daną dyscyplinę empiryczną, istnieją zawsze jakieś jego obserwowalne konsekwencje" (tamże, s. 60). W pkt. 6. omówiona została koncepcja Kmity wpro- wadzania do nauk empirycznych terminów teoretycznych (czynników teoretycz- nych — wg terminologii Hornowskiej), która oparta jest na tej samej zasadzie — zasadzie empiryzmu. W sformułowaniu Hornowskiej brzmi ona: „dla każdego czynnika teoretycznego T istnieje w jego przestrzeni wpływu jakiś jego obszar identyfikacji" (tamże, s. 60). W takim sformułowaniu jest to słabsza wersja zasady empiryzmu. Jej postać mocniejsza brzmi: „dla każdego czynnika teoretycznego ist- nieje w jego przestrzeni wpływu obszar jego mocnej identyfikacji" (tamże, s. 60). 9.2. Etapy procedury operacjonalizacji Procedura operacjonalizacji przeprowadzana jest w następujących po sobie etapach: (1) rekonstrukcja czynnika teoretycznego; konstrukcja wielkości; (2) konceptualizacja wielkości, dobieranie wskaźników; konstruowanie zmiennej; (3) dobór narzędzia pomiarowego i pomiar zmiennej. W trzech kolejnych punktach omówię te etapy. 9.2.1. Rekonstrukcja czynnika teoretycznego; konstrukcja wielkości Każdy badacz, przedstawiciel nauk empirycznych, a więc psycholog, socjolog czy pedagog, który zamierza dokonać operacjonalizacji — tu: wielkości psychologicz- nej — zaczyna od ustalenia obrazu czynnika, czyli od „odtworzenia" tego czynnika. 14 — Metodologia badań. 209 Budując obraz interesującego go czynnika T, czyli konstruując wielkość T, badacz musi określić empiryczną i numeryczną strukturę relacyjną tego czynnika (dokonuje jego rekonstrukcji). Dokonując rekonstrukcji czynnika T badacz przyjmuje, że (tam- że, s. 62; także: Tuchańska 1980, s. 10): (1) czynnik T określony jest na zbiorze obiektów Z charakteryzujących się określonymi własnościami, (2) klasy abstrakcji czynnika T wyznaczone są przez jakąś relację równościo wą R, (3) zbiór Z jest podzbiorem pola relacji R. Tak jak wielkość T jest obrazem czynnika T, tak, odpowiednio, zbiór Z' i relacja /?' są obrazami — zbioru Z i relacji R. Konstruując wielkość T badacz jednocześnie ustala zbiór obiektów przez tę wielkość charakteryzowanych. Równocześnie ustala on relacje M{", ..., Mm' zacho- dzące między obiektami wchodzącymi do tego zbioru. Relacje te są obrazami re- lacji M\ , ..., Mm\ które wyznaczają typ czynnika. Określone przez badacza relacje dookreślają empiryczną strukturę relacyjną wielkości 7"'. Ona zaś jest obrazem stru- ktury relacyjnej (czyli typu) czynnika T. Jak już wiemy, możemy mieć do czynienia z następującymi typami czynnika i wielkości — nominalnymi, porządkowymi, in- terwałowymi i ilorazowymi. Na tym etapie procedury operacjonalizacji dochodzi do ustalenia obrazu czyn- nika czyli skonstruowania wielkości. Jak pamiętamy z rozdz. 1. (pkt. 5.) wprowa- dziliśmy rozróżnienie między przestrzenią zmiennych istotnych dla Y (zawierającą zmienne niezależne de facto istotne dla Y) oraz jej obrazem (zawierającym zmien- ne, które jak się wydaje badaczowi są istotne dla Y). Konsekwencją tego rozróż- nienia jest to, że możemy mówić o różnych stopniach nieadekwatności O(PY) względem PY. Podobnie i tutaj, można mówić o różnych stopniach nieadekwatności ustalonego przez badacza obrazu czynnika teoretycznego T względem czynnika T. Inaczej, można mówić o różnym stopniu trafności 7" względem T. Jak pisze Hornowska: „Warunkiem trafności ustaleń badacza jest zgodność klas abstrakcji i relacji między obiektami należącymi do tych klas i określającymi czynnik T a ich odpowiednikami skonstruowanymi przez badacza. Możliwe są trzy zasadnicze przypadki nieadekwatności: (a) badacz nietrafnie rozpoznał typ czynnika T, (b) badacz nietrafnie rozpoznał klasy abstrakcji czynnika T, (c) badacz nietrafnie rozpoznał relacje między obiektami, na których określony jest czynnik 7"' (tamże, s. 67). Ustalenie empirycznej struktury relacyjnej wielkości 7" nie jest równoznaczne z ustaleniem, iż skonstruowana przez badacza wielkość dopuszcza pomiar czyli daje się homomorficznie (w sensie: Nowakowska, 1975 s. 204-206) odwzorować w odpowiedni liczbowy system relacyjny. Aby tak było, badacz musi udowodnić, iż możliwe jest wyróżnionym przez niego klasom abstrakcji przyporządkowywanie liczb w taki sposób, aby odzwierciedlone zostały relacje faktycznie zachodzące między obiektami, którym przypisana jest dana wielkość. Badacz musi tedy wy- kazać, iż odtworzona przez niego struktura relacyjna jest homomorficzna z okre- ślonym systemem relacyjnym. Jeżeli tak się stanie, to możliwe będzie rozstrzyg- 210 nięcie stopnia, w jakim możliwe jest jednoznaczne przyporządkowanie liczb da- nym obiektom. Mówiąc inaczej, rozwiązany jest problem rodzaju skali pomiaro- wej. „Określając — jak pisze Hornowska (tamże, s. 65) — odpowiednią skalę pomiarową, badacz jednocześnie ustala własności operacji, jakie można przepro- wadzać na obiektach pomiaru. Własności skali opisują bowiem jedynie własności operacji, jakie dla danej wielkości są wykonalne, a nie własności wielkości będą- cej przedmiotem pomiaru. Na przykład, dwie różne skale do pomiaru neurotyzmu (np. nominalna i porządkowa) określają jedynie dwa różne zbiory operacji, jakie można «przeprowadzić» na badanych osobach, tj. w pierwszym przypadku badacz przyjmuje, że osoby badane można wyłącznie klasyfikować ze względu na posia- dany stopień neurotyzmu, w drugim zaś, można je uporządkować — nie określają natomiast różnych neurotyzmów. Odmienne znaczenia nadawane temu samemu terminowi wyznaczone są bowiem nie skalą pomiarową, ale zespołem twierdzeń teoretycznych, w których pojęcie to jest uwikłane" (podkr. J. B.). 9.2.2. Konceptualizacja wielkości, dobieranie wskaźników, konstruowanie zmiennej Na tym etapie procedury operacjonalizacji badacz wykonuje następujące czynności: (a) dokonuje konceptualizacji wielkości T', która — przypominam — stanowi obraz czynnika teoretycznego T; (b) dobiera wskaźniki danej wielkości; (c) konstruuje indeks, który jest zagregowaną miarą, utworzoną z dwóch (i większej liczby) wskaźników, wielkości. Pokrótce opiszemy teraz te trzy podetapy procedury operacjonalizacji. (a) Konceptualizacja wielkości. Podkreślony fragment wypowiedzi Hornow- skiej, który kończy poprzedni punkt, wyraźnie wskazuje na to, że nie wystarczy tylko ustalenie empirycznego i liczbowego systemu relacyjnego dla nadania danej wielkości określonego sensu empirycznego. Co więcej, nie pozwala to jeszcze na dobranie najlepszego (w sensie trafności) narzędzia pomiarowego. Do tego po- trzebne jest określenie relacji łączącej wielkość teoretyczną T z jej konsekwencja- mi obserwowalnymi. I w tym miejscu rodzi się podstawowe, dla tego etapu pro- cedury operacjonalizacji, pytanie: W jakiej dziedzinie rzeczywistości (rzecz jasna, że obserwowalnej!) wielkość ta będzie „spełniona"? Chcąc efektywnie badać daną wielkość (a więc i odpowiadać na powyższe pytanie) należy dokonać jej konceptu- alizacji czyli, jak pisze Hornowska (tamże, s. 67): „zdecydować się na wybór aparatu pojęciowego, za pomocą którego wielkość ta będzie opisywana". Doko- nując konceptualizacji wielkości badacz „patrzy" na nią pod określonym kątem, analizuje pewne, a nie wszystkie, jej własności; zwraca uwagę tylko na pewne związki tej wielkości z innymi wielkościami, a inne związki pomija (abstrahuje od nich). Mówiąc krótko, badacz „mówi" innym badaczom co on rozumie przez daną wielkość. Na tym etapie procedury operacjonalizacji dokonuje się rekonstru- kcja (ale z punktu widzenia badacza!) obszarów wpływu operacjonalizowanej wielkości. Podkreślam, iż będą to obrazy obszarów wpływu czynnika teoretycz- 14- 211 nego T. Suma obszarów wpływu wielkości T jest obrazem przestrzeni wpływu czynnika T. Oczywiście nie jest tak, że „obowiązujący" jest tylko jeden obraz takiej przestrzeni. Tak naprawdę, to można mówić o całej rodzinie możliwych obrazów przestrzeni wpływu czynnika T, rekonstruowanych przez różnych bada- czy. Nie należy się tedy spodziewać, iż w literaturze przedmiotu, dotyczącej ja- kiegoś problemu psychologicznego, spotkamy tylko jedno rozumienie obrazu wiel- kości T (czyli T), obrazów obszarów wpływu T i obrazu przestrzeni wpływu czynnika T. Badacze skłonni są opowiadać się za wybranymi, określonymi teo- retycznymi ujęciami badanego czynnika teoretycznego (TBO oraz TOZ w struktu- rze świadomości metodologicznej badacza — por. rozdz. 3., pkt. 3.). Od czego to zależy? „Jak się wydaje, podstawową rolę w tym względzie odgrywać mogą do- tychczasowe tradycje danej dyscypliny naukowej, twierdzenia teorii, na gruncie której definiowana jest operacjonalizowana wielkość czy doświadczenie badacza" (tamże, s. 68). „Celem zabiegu określonego jako konceptualizacja jest wyprecyzowanie zna- czenia operacjonalizowanej wielkości, a utworzony w jego efekcie łańcuch definicji tworzy jej pełną definicję. Kolejne definicje, tj. rekonstruowanie kolejnych obsza- rów wpływu, zmierzają do coraz precyzyjniejszego dookreślenia sensu wielkości. Formułując owe definicje, badacz świadomie rezygnuje z niektórych konotacji da- nej wielkości, po to, aby pozostałe uczynić bardziej precyzyjnymi i bardziej podat- nymi na weryfikację" (tamże, s. 69). (b) Wskaźniki. Charakterystycznym rysem współczesnej praktyki badawczej nauk behawioralnych (a więc i psychologii) jest położenie nacisku na wielowymia rowe ujmowanie badanych zjawisk — co, jak sądzę, związane jest z dynamicznym rozwojem, w ostatnich kilkudziesięciu latach, wielowymiarowych modeli statysty cznych i psychometrycznych oraz z łatwo dostępnym oprogramowaniem kompute rowym tych modeli. Posługiwanie się nie jednym — czy nawet wieloma, ale tra ktowanymi niezależnie od siebie — wskaźnikiem, ale ich zbiorem tworzącym za gregowaną miarę wielkości (na określenie tego zbioru wskaźników Hornowska po służyła się terminem „indeks") daje najlepszą (także w sensie psychometrycznym — zbiór pomiarów jest bardziej stabilny i stanowi mniej obciążony estymator danej wielkości aniżeli pojedyncza miara) miarę wielkości. (c) Indeks. Odrębnym, metodologicznym, problemem jest udzielenie odpowie dzi na pytanie dotyczące stopnia „dobroci" indeksu jako miary wielkości. Badacz może — i jest to najefektywniejsza droga — dokonać analizy zbioru korelacji zachodzących między indeksem i pojedynczymi zmiennymi współtworzącymi ten indeks. Powinien też — analizując związki różnych indeksów z różnymi wielko ściami — określić trafność skonstruowanego przez siebie indeksu danej wielkości. Jedną z empirycznych metod badania (właśnie tym sposobem) trafności indeksu jest opisana w rozdz. 17., pkt. 4. metoda analizy macierzy „wielu cech-wielu me tod". Po wykonaniu przez badacza wszystkich opisanych wyżej czynności, mamy: zdefiniowany czynnik T, skonstruowaną wielkość T (jako obraz tego czynnika 7), 212 przeprowadzoną konceptualizację wielkości I' oraz zoperacjonalizowany obraz wielkości 7" (zmienne — konstrukcja indeksu). 9.2.3. Dobór narzędzia pomiarowego i pomiar zmiennej Do ujętego wyżej ciągu czynności badacz musi dodać jeszcze jedną, która będzie stanowiła „ukoronowanie" procedury operacjonalizacji — przeprowadzenie pomia- ru zmiennych (będących operacjonalizacją danego czynnika). „Pozwoli to — wg Hornowskiej (tamże, s. 87) — na ustalenie, do której z klas abstrakcji — wyróż- nionych przez badacza na etapie rekonstrukcji tego czynnika — należy badany obiekt. Podobnie jak poprzednio i ten etap można formalnie opisać jako wyróżnia- nie w zbiorze badanych obiektów klas abstrakcji oraz przyporządkowywanie rodzi- nie takich klas liczbowego systemu relacyjnego". Przeprowadzenie pomiaru zmiennych wymaga wcześniejszego skonstruowania stosownego narzędzia pomiarowego, które umożliwi przeprowadzenie pomiaru wielkości 7" (a pośrednio rekonstruowanego przez badacza czynnika 7) dla obiektu z. Na tym etapie operacjonalizacji badacz musi przestrzegać określonych założeń związanych z pomiarową naturą narzędzia — o nich traktuje pkt. 8. niniejszego rozdziału. Założenia te zostały przejęte przez Hornowską do jej koncepcji opera- cjonalizacji. Przeprowadzenie pomiaru zmiennej dla danego obiektu związane jest z przy- porządkowaniem tego obiektu do określonej (tylko jednej! — zasada rozłączności) klasy abstrakcji tej zmiennej. To zaś umożliwia badaczowi wnioskowanie, do której z klas abstrakcji operacjonalizowanej wielkości T należy ten obiekt. Po dokonaniu pomiaru zmiennej Xj dla obiektu z badacz odtwarza teoretyczną wielkość 7". Jego postępowanie na tym etapie jest analogiczne, jak na etapie pier- wszym. Tworzy on bowiem obraz pomiarowy zmiennej. Zmienna jest — na tym etapie — przekształcana w zbiór opisujących ją wartości skalowych, których „do- starcza" narzędzie pomiarowe. Rzecz jasna, że skonstruowana przez badacza zmienna może mieć wiele obrazów pomiarowych. To, jaki obraz wybierze badacz zależy od wielu parametrów. Może on, na przykład, kierować się typem opera- cjonalizowanej wielkości (w sensie klasyfikacji Stevensa — nominalny, porządko- wy, interwałowy czy ilorazowy). Obraz pomiarowy zmiennej musi być zgodny z założonym typem wielkości. Interpretacja wartości skalowych musi być dopusz- czana przez założony przez badacza typ wielkości. Innymi słowy, jeżeli, na przy- kład, badacz założył, że dana wielkość jest typu porządkowego, to wartości skalowe zmiennej mogą być interpretowane jedynie jako wartości typu porządkowego, a nie (mimo formalnej poprawności) typu interwałowego. Całą tedy operacjonalizację możemy ująć w następujący ciąg czynności wykonywanych przez badacza: Operacjonalizacją czynnika T: czynnik T —> (1) konstrukcja wielkości 7" (jako obrazu czynnika 7) —> (2) konceptualizacja wielkości T (zmienne — konstrukcja indeksu) —» (3) dobór narzędzia pomiarowego (wartości skalowe zmiennej). 213 9.3. Analiza przykładu Zilustrujmy etapy procedury operacjonalizacji przykładem3 ilustrującym postępowa- nie badawcze autorów książki The authoritarian personality (Adorno i in., 1950; cyt. wyd. 1969). Do szczegółowej analizy wybrany został czynnik teoretyczny T: „postawa (osobowość) antydemokratyczna". „Podstawowym założeniem przyjętym przez autorów było uznanie, że pojęcie postawy (osobowości) antydemokratycznej opisuje złożony syndrom przekonań oraz własności osobowości i że adekwatne narzędzie do jej pomiaru można skon- struować jedynie wtedy, gdy syndrom ten rozłoży się na jego komponenty, tak doprecyzowując znaczenie każdego z nich, by można było wskazać na te zacho- wania (lub inne fakty empiryczne), na podstawie których będzie można inferować istnienie takiej postawy" (Hornowska, 1989, s. 74). Omawiając ten przykład będę podawał, za Hornowska, strony pracy Adorno i in., na których Czytelnik znajdzie pełne definicje pojęć. Postawa antydemokratyczna została rozbita na trzy wymiary: 1. Ideologia. 2. Właściwości indywidualne. 3. Warunki społeczne. Każdy z tych wymiarów Hornowska rozbija na wymiary bardziej szczegóło- we. Zajmijmy się tu tylko wymiarem 1.: „Ideologia": 1.1. Antysemicka (s. 58). 1.2. Etnocentryczna (s. 101). 1.3. Prefaszystowska (s. 221). I znowu zajmijmy się tylko jednym wymiarem — 1.1.: „Ideologia antyse- micka": 1.1.1. Zaborczość (s. 63; „Żydzi preferują najbardziej luksusowe, ekstrawa ganckie i zmysłowe strony życia", s. 63). 1.1.2. Zagrożenie (s. 63; „Żydów należy traktować jako negatywnie wpływa jących na kulturę i cywilizację chrześcijańską", s. 64). 1.1.3. Postawy (s. 64; „Każdy, kto zatrudnia wielu ludzi, powinien dbać, aby nie zatrudniać zbyt wysokiego procentu Żydów", s. 65). 1.1.4. Odosobnienie (s. 65; „Żydzi zbyt mocno trzymają się między sobą, za miast wyrażać właściwe zainteresowanie problemami społeczeństwa i rządu", s. 65). 1.1.5. Narzucanie (s. 65; „Żydzi posuwają się zbyt daleko w odrzucaniu włas nego pochodzenia, zmieniając zwłaszcza swoje nazwiska, prostując nosy czy imi tując chrześcijańskie maniery i zwyczaje", s. 66). W powyższym przykładzie przytoczyłem trzy obszary wpływu pierwszego rzędu (1.1.-1.3.) i jeden obszar wpływu drugiego rzędu (1.1.1.-1.1.5.) czynnika „postawa antydemokratyczna" jako ilustrację konceptualizacji wielkości. Ostatni Przykład zaczerpnięty został z cytowanej tu pracy Homowskiej, za zgodą autorki, której chciałbym podziękować za wyrażenie zgody na jego przytoczenie oraz za przeprowadzoną autoryzację dokonanego w tym punkcie, 9., streszczenia koncepcji operacjonalizacji. 214 obszar wpływu (tu: drugi) zawiera już wielkości obserwowalne czyli obszar iden- tyfikacji operacjonalizowanej wielkości. Te wielkości obserwowalne wskazują na fakty „o których autorzy założyli, że są one powiązane relacją istotnościowego następstwa z operacjonalizowaną wielkością" (tamże, s. 80). Jest to jednocześnie przykład przestrzeni znaczeniowej identyfikatora, gdyż te same stwierdzenia wystę- pują w narzędziach pomiarowych (np. stwierdzenie 1.1.5. występuje w Ogólnej Skali Antysemityzmu (ang. Total Anń-Semitism Scalę) (Adorno i in., 1969, s. 69). 10. Podsumowanie Operacjonalizacja zmiennych to bardzo złożona procedura. Wymaga ona od bada- cza głębokiej wiedzy zarówno w zakresie teorii badanej zmiennej (tu: teorii psy- chologicznej — badacz musi „uruchomić" element TBO świadomości metodologi- cznej), jak i teorii pomiaru psychologicznego (włączając w nią, specyficzną dla psychologii, psychometrię jako podstawę teoriopomiarową testów psychologicz- nych). Najbardziej dojrzałą i zalecaną przeze mnie koncepcję operacjonalizacji za- proponowała Hornowska (1989). Przedstawiłem ją w pkt. 9. tego rozdziału. Podstawowe wiadomości na temat wskaźników Czytelnik znajdzie w pracach: No- wak S. Pojęcia i wskaźniki; Nowak S. Metodologia badań społecznych (rozdz. 3.: Definiowanie pojęć i dobór wskaźników w badaniach, s. 124-196); Pawłowski T. Metodologiczne zagadnienia humanistyki (rozdz. 5.: Pojęcie wskaźnika w naukach społecznych, s. 169-205); Pawłowski T. Pojęcia i metody współczesnej humanistyki (rozdz. VII: Pojęcie wskaźnika w naukach społecznych, s. 194-224); Pawłowski T. Tworzenie pojęć i definiowanie w naukach humanistycznych (rozdz. 9.: Pojęcie wskaźnika w naukach społecznych, s. 181-203). Różne koncepcje wprowadzania terminów teoretycznych do twierdzeń nauki omawia: Przełęcki M. Pojęcia teoretyczne a doświadczenie. Oryginalną koncepcję operacjonalizacji zmiennych w psychologii, do której odwoływałem się w tym rozdziale, przedstawiają: Hornowska E. Operacjonalizacja wielkości psychologicznych. Założenia-struktura-konsekwencje; Tuchańska B. Czynnik-wielkość-związek-zależność (praca ta poświęcona jest tej samej problema- tyce co poprzednia, aczkolwiek w warstwie przykładowej odwołuje się do socjo- logii. Obie zaś autorki nawiązują do koncepcji idealizacyjnej teorii nauki L. No- waka, 1977, 1980). Problematyka teorii pomiaru w psychologii i skal pomiarowych — wg klasy- fikacji Stevensa — jest dokładnie przedstawiona w języku polskim w pracach: Nowakowska M. Psychologia ilościowa z elementami naukoznawstwa. (rozdz. 4.: Wybrane zagadnienia teorii pomiaru, s. 198-263); Choynowski M. Pomiar w psy- chologii; Ackoff R. L. Decyzje optymalne w badaniach stosowanych (rozdz. 6.: Pomiar). Rozdział 8. Problemy badawcze i hipotezy badawcze 1. Wprowadzenie Badanie naukowe rozpoczyna się od sformułowania problemu badawczego, który dotyczy — najogólniej mówiąc — relacji zachodzących między zmiennymi (takie rozumienie problemu znajdzie Czytelnik u Kerlingera, 1986, s. 16). Dodajmy, że chodzi tu o zmienną zależną Y (lub ich zbiór) oraz zmienne niezależne Xb ..., X„, traktowane przez badacza jako pozostające w związku przyczynowo-skutkowym ze zmienną Y. Badacza będzie zatem interesowało nie tylko to: (1) czy dana zmienna Xj rzeczywiście wpływa na Y (Xj jako przyczyna Y), ale także, czy nawet przede wszystkim, (2) jak dana zmienna Xj wpływa na Y (określenie postaci związku łączącego Y z Xf, w psychologii często jest to alternatywa: związek liniowy — związek krzywoliniowy; por. rozdz. 10., pkt. 2.-3.). W niniejszym rozdziale zajmiemy się pierwszym etapem procesu badawczego (wg rys. 1.4), to jest sformułowaniem problemu badawczego oraz najbardziej praw- dopodobnej, na gruncie wiedzy badacza, nań odpowiedzi czyli hipotezy badawczej. Częściowo zagadnienie to było już przedmiotem naszej uwagi w rozdziale 1. Tutaj spróbujemy odpowiedzieć na pytanie o kryteria poprawnego, z punktu widzenia metodologii, formułowania problemów i hipotez badawczych przez psychologów prowadzących naukowe badania empiryczne. 2. Problem badawczy jako pytanie — cechy dobrze sformułowanego problemu badawczego W literaturze z zakresu metodologii spotykamy najczęściej rozumienie problemu badawczego jako pytania czy zbioru pytań. I tak S. Nowak, wybitny polski socjolog pisał, iż: „problem badawczy to tyle, co pewne pytanie lub zespół pytań, na które odpowiedzi ma dostarczyć badanie" (1970, s. 214); i, w ostatniej swojej monografii poświęconej metodologii badań społecznych (nie tylko socjologicznych!): „pun- 216 ktem wyjścia wszelkiego procesu badawczego jest sformułowanie pewnego pytania czy mniej lub bardziej uporządkowanego zbioru pytań. Pytania te czasem pojawiają się w świadomości badacza w sposób bezrefleksyjny — czasem zaś uprzytamnia on sobie mniej lub bardziej wyraźnie, dlaczego na te, a nie inne pytania chciałby uzyskać odpowiedź poprzez wyniki swoich badań" (1985, s. 26). Od tego, jak dany problem badawczy będzie sformułowany zależy stopień jego dojrzałości. Co to znaczy? Otóż, formułując jakikolwiek problem badawczy wyznaczamy jakieś ramy jego rozwiązania. Co więcej, bywa i tak, że już w mo- mencie jego formułowania możemy podać mniej lub bardziej ogólną postać hipotez stanowiących jego przypuszczalne rozwiązania. Przy stawianiu jakiegokolwiek py- tania (a więc i problemu badawczego) zakładamy pewną wiedzę, od której nie sposób abstrahować, a która dotyczy fragmentu rzeczywistości ujmowanego w pro- blemie badawczym. Na mocy tej wiedzy przyjmujemy określone rozstrzygnięcie co do pytań bardziej podstawowych, logicznie wcześniejszych od pytania będącego naszym problemem badawczym. To z kolei eliminuje z pola naszych rozważań pewne klasy odpowiedzi na rzecz innych, sprawia, że procesy formułowania pro- blemów badawczych i wysuwania na nie odpowiedzi (hipotez badawczych) są wza- jemnie ze sobą związane. Zarazem, sformułowanie problemów badawczych prze- sądza już, w jakimś stopniu, stosunek badacza do pytań bardziej podstawowych, np. dotyczących natury badanej rzeczywistości oraz charakteru związków w niej zachodzących (por. rozdz. 3.). Trzeba tedy zgodzić się z Suchem (1975a, s. 29), który pisze: „stopień, w którym sformułowanie problemu mieści w sobie wskazówki co do jego rozwiąza- nia, należy uznać za jedno z kryteriów dojrzałości problemu. Zawieranie w sobie takich wskazówek jest też zapewne jednym z warunków (kryteriów) sensowności poznawczej problemu. Problem, który nie zawierałby żadnych wskazówek co do swego rozwiązania, byłby zapewne typowym pseudoproblemem. Szczególnie wczes- ny neopozytywizm oraz skrajny operacjonizm — głosząc tezę, że sens zdania za- wiera się w metodzie jego sprawdzania — kładły nacisk na takie formułowanie problemów, które by dostarczało wyraźnych wskazówek co do sposobów ich roz- wiązania. (...) Aczkolwiek w obu wspomnianych kierunkach występują sformułowa- nia w sposób oczywisty przesadne (taki charakter ma na przykład teza, że «w sensie pytania zawarte są drogi jego rozwiązania*), to jednak położenie nacisku na takie stawianie problemów, by zawierały one jak najwięcej wskazówek co do ich roz- strzygnięć, jest zaleceniem ze wszech miar użytecznym i heurystycznie płodnym". Do pierwszych sformułowań problemu dochodzi się nieraz na drodze żmud- nych dociekań teoretycznych, popartych wynikami wstępnych badań eksploracyj- nych. Jest rzeczą niemożliwą wskazanie Czytelnikowi jakiegoś algorytmu docho- dzenia do ciekawych teoretycznie i płodnych w hipotezy problemów badawczych. Dużą rolę w procesie formułowania problemów badawczych odgrywa intuicja ba- dacza. Jej rolę w twórczym wysiłku badacza podkreślają Bunge (1962) czy Selye (1959). Są to zagadnienia z zakresu psychologii twórczości (por. Nęcka, 1987, 1994a, 1994b; Kozielecki, 1992; Jakubowska, 1993). Zauważmy jeszcze, iż akt badania naukowego, a zaczyna się on właśnie od postawienia pytania badawczego 217 (i zależy od tego, jakie jest ono w swojej treści!), jest przede wszystkim aktem twórczym. Można go analizować w kategoriach teorii rozwiązywania problemów (Nickles, 1988; Simon, 1977). Nie zawsze jest też tak, że już pierwsze sformułowanie problemu jest na tyle precyzyjne i dojrzałe, iż zadawala badacza. Upływa pewien okres od momentu, gdy badacz sformułował pierwsze, intuicyjne i bardzo mgliste pytania do momentu, gdy problem uzyskał już zadawalający stopień dojrzałości. Mówimy więc, iż problem stopniowo „dojrzewa", tzn. że kolejne jego przeformułowania zawierają większą liczbę wskazówek co do jego rozwiązania. Z kolei wskazówki te są bardziej efe- ktywne. Problem, który zawiera dostateczną liczbę wskazówek co do jego rozwią- zania za pomocą dostępnych, na danym etapie rozwoju konkretnej dyscypliny na- ukowej, środków badawczych, jest problemem rozstrzygalnym (dokładniej — pra- ktycznie rozstrzygalnym, por. Nowak S., 1985, s. 36). Oczywiście, problem nie- rozstrzygalny na danym etapie rozwoju nauki może stać się rozstrzygalnym na wyższym etapie jej rozwoju. 2.1. Pytania rozstrzygnięcia i pytania dopełnienia Jak już zaznaczyłem, problemy przybierają postać pytań. Spróbujmy więc określić, jakiego rodzaju mogą to być pytania. Zgodnie z najbardziej znaną klasyfikacją pytań (Ajdukiewicz, 1965; Giedymin, 1964; Cackowski, 1964) wyróżnia się dwa ich rodzaje: (a) pytania rozstrzygnięcia, (b) pytania dopełnienia. Pytania rozstrzygnięcia rozpoczynają się od partykuły pytajnej „czy" i można udzielić na nie jednej z dwóch wykluczających się odpowiedzi: „tak" lub „nie". Po partykule pytajnej „czy" występuje człon będący zdaniem oznajmującym. W zależ- ności od liczby prezentowanych przez pytanie alternatyw, wyróżniamy pytania roz- strzygnięcia o różnej liczbie członów. Stosunkowo najczęściej formułuje się dwu- członowe pytania-rozstrzygnięcia. Oto przykład takiego pytania: „Czy dziecko w wieku trzech lat jest zdolne do myślenia abstrakcyjnego?". W odpowiedzi na to pytanie należy wybrać jedyną prawdziwą z dwóch alternatyw: „tak, dziecko w wieku 3 lat jest zdolne do myślenia abstrakcyjnego", „nie dziecko w wieku 3 lat nie jest zdolne do myślenia abstrakcyjnego". Pytania rozstrzygnięcia można zamienić na zdania oznajmujące o postaci wie- loczłonowej alternatywy. Przysługuje im wtedy wartość logiczna, tak jak innym zdaniom w sensie logicznym. Tak przeformułowane pytanie jest prawdziwe, gdy jedna z alternatyw jest prawdziwa. O ile pytania rozstrzygnięcia ujawniają swoje alternatywy, o tyle pytania do- pełnienia ich nie ujawniają. Podają one tylko ogólny schemat odpowiedzi. Jest nim funkcja zdaniowa. Po podstawieniu odpowiednich wartości w miejsce zmiennej (lub zmiennych) otrzymuje się każdorazowo nowe zdanie — prawdziwe lub fał- 218 szywe. Jest ono jedną z możliwych odpowiedzi na pytanie dopełnienia (Such, 1975a, s. 26-27). Oto odpowiedni przykład: „Od którego roku życia dziecko jest zdolne do przeprowadzania operacji formalnych?", jak widać, pytanie to nie ujaw- nia swoich alternatyw. Prawdziwą, bezpośrednią odpowiedzią na nie jest prawdziwa alternatywa postaci: „Dziecko jest zdolne do przeprowadzania operacji formalnych od... roku życia". W miejsce wykropkowane musimy wstawić konkretną wartość zmiennej (tu: rok życia). * * * O ile sformułowanie problemu w postaci pytania rozstrzygnięcia jest podaniem klasy alternatywnych hipotez, z których jedna jest jego rozwiązaniem, o tyle w przypadku problemu sformułowanego w postaci pytania dopełnienia tak nie jest. Jednak i w tym przypadku podany jest zakres możliwych hipotez jako rozwiązań problemu. Nie są tylko dokładnie wymienione poszczególne alternatywne hipotezy. Już z tego krótkiego zestawienia charakterystyk obu rodzajów pytań wynika, iż pytania rozstrzygnięcia zawierają więcej bardziej jednoznacznych wskazówek co do dróg ich rozstrzygania niż pytania dopełnienia. Z tego też względu większość pro- blemów badawczych przyjmuje postać pytań rozstrzygnięcia. Tylko one dają cał- kowitą pewność, że są poprawnie sformułowane. Należy unikać zbyt szerokiego stawiania problemu badawczego, gdyż może to utrudnić jego rozwiązanie. Dlatego też, jeszcze raz podkreślam, z ogólnego py- tania należy przejść do sformułowania pytania uszczegółowionego, względnie kilku takich pytań, będących odrębnymi problemami szczegółowymi. Jasne zdefiniowa- nie pojęć występujących w problemie oraz zrozumienie relacji zachodzących mię- dzy nimi znacznie ułatwi nam rozwiązanie problemu. Definiując pojęcia występu- jące w problemie możemy odwołać się do już istniejących ich definicji podawanych w literaturze przedmiotu, względnie wprowadzamy nowe, własne rozumienie tych pojęć na zasadzie definicji projektujących. Poprawne sformułowanie problemu badawczego w dużej mierze przesądza o sukcesie badawczym. Zależy ono od kompetencji badacza, a te określone są jego świadomością metodologiczną. Pytania badawcze nie są zawieszone w próżni teo- retycznej i metodologicznej. Literatura przedmiotu zawiera informacje o dotychcza- sowych ustaleniach na interesujący badacza temat. Nie można się od niej odcinać! W przeciwnym bowiem przypadku badacz może tracić czas i pieniądze (często nie swoje, a instytucji badania te sponsorującej) na udzielanie odpowiedzi na pytania, na które już ktoś precyzyjnie odpowiedział, albo posłużyć się metodami, które rażąco odbiegają pod względem rzetelności i trafności od metod już opublikowa- nych w literaturze przedmiotu. Przypomnijmy tedy, kończąc te ogólne uwagi na temat problemów badaw- czych, kogo uważał S. Nowak (1985, s. 35) za specjalistę (tu: psychologa-bada- cza): „specjalista w swej dziedzinie nauki to człowiek, który nie tylko umie znaj- dować odpowiedzi na pytania, lecz także pytania te poprawnie formułować" (podkr. J. B.). 219 2.2. N. Belna pa klasy fikacj a pytań W pracy: An analysis of ąuestio ns opublik owanej w 1963 r. Belnap wyłożył własną teorię pytań oraz dokonał ich klasyfik acji (przedst awiam ją za: Pawłow ski T., 1969, s. 67- 121). W edle Belnap a każde pytanie przedst awia określo ny zbiór alternat yw. Odpowi edź natomia st dokonuj e wyboru pewneg o podzbio ru tego zbioru. W zależ- ności od tego, w jaki sposób wybór ten ma być przepro wadzon y, z tego samego zbioru alternat yw można zbudow ać różne pytania. Mówiąc inaczej, to co te pytania różni między sobą, to żądanie wyboru . Weźmy jako przykła d dwa następu jące pytania: 1) „Który z niżej wymien ionych psychol ogów jest twórcą psychoa nalizy: E. Fromm, Z. Freud, D. Hebb, C. Hull, J. Piaget? ", 2) „Którzy z niżej wymien ionych psycho logów są przedst awiciel ami psycho analizy : E. Fromm , Z. Freud, D. Hebb, C. Hull, J. Piaget? " I w jednym i w drugim przypad ku zbiór alternat yw jest taki sam. Jednakż e w pierwsz ym pytaniu Czyteln ik powinie n wskaza ć jedno nazwisk o (Z. Freuda) , a w drugim wszystk ie nazwisk a, które spełniaj ą warune k określo ny w pytaniu, tj. dwa nazwisk a (E. Fromm a i Z. Freuda). Pytania mogą się różnić między sobą co do żądania wyboru także i wtedy, gdy oparte są na różnych zbiorac h alternat yw. Po za wymien ionymi już czynnik ami determi nujący mi typ pytania, tj. zbiorem alternat yw i żądanie m wyboru, Belnap wymien ia jeszcze jeden, który nazywa żą- daniem roszcze nia zupełno ści. Określa ono, jaka część prawdzi wych alternat yw zawarty ch w tym pytaniu znajduj e się, wedle osoby odpowi adającej na to pytanie, w bezpośr edniej odpowi edzi na nie. Pytania różnią się między sobą co do stopnia żądania roszcze nia zupełno ści. Krańco we są takie pytania, w których zawarte jest bądź maksy malne, bądź minimal ne żądanie roszcze nia zupełno ści. Przykła dem pierwsz ego jest następuj ące pytanie: „Jakieg o znasz przedsta wiciela kierunk u psy- choanal ityczne go?". Pytany wybiera jąc jakąś alternat ywę jako odpowi edź na to pytanie nie określa tego, jaką część alternat yw prawdzi wych prezent owanyc h przez to pytanie stanowi ą alternat ywy przez niego wybran e (tu: jedna alternat ywa). Na- tomiast przykła dem drugieg o pytania jest takie: „Którzy z niżej wymien ionych psychol ogów są przedst awiciel ami kierunk u psycho anality cznego: a) Skinner , b) Fromm, c) Freud, d) Szuman , e) Horney, f) Thorndi ke?". Tutaj zadanie m bada- nego jest wymien ienie wszystk ich (tj. trzech) prawdzi wych alternat yw ze zbioru prawdzi wych alternat yw prezent owanyc h przez to pytanie. Oczywi ście, pytanie o maksy malnym żądaniu roszcze nia zupełno ści może zawiera ć tylko jednoel emen- towy zbiór prawdzi wych alternat yw i w odpowi edzi na nie należy tę jedną praw- dziwą alternat ywę wskaza ć. Na przykła d „Czy najważn iejszym, zdanie m Pana, czynnik iem przy formuło waniu diagnoz y psychol ogicznej jest: a) wiedza klinicys ty, b) doświad czenie klinicys ty, c) znajom ość testów psychol ogiczny ch, d) umiejęt ność nawiąz ywania kontakt u z pacjent em, e) wiek klinicys ty, f) płeć klinicys ty?". O ile żądanie wyboru można zawsze ściśle liczbow o określić , o tyle żądanie roszcze nia zupełno ści określa się za pomocą takich zwrotó w, jak: „wszyst kie alter- natywy ", „wszyst kie alternat ywy z wyjątki em...", „x procent ..." itp. 220 Tylko pytania o maksymalnym żądaniu roszczenia zupełności wymagają po- dania wszystkich prawdziwych alternatyw. Dlaczego więc nie zawsze formułuje się właśnie takie pytania? Wiąże się to z tym, że niekiedy pytanie ma dużą liczbę alternatyw, których wymienienie byłoby bardzo uciążliwe, czy wręcz niemożliwe. Czasami wystarczy, dla celów praktycznych, podanie tylko części prawdziwych alternatyw. Zanim przystąpię do omówienia klasyfikacji pytań w ujęciu Belnapa chciałbym jeszcze poświęcić kilka słów omówieniu sposobów, w jakie formułuje się w pytaniu alternatywy. Jeden sposób polega na wymienieniu w pytaniu wszystkich alternatyw; takie pytania zaczyna się zwykle od partykuły pytajnej „czy" (takie pytanie — jak pamiętamy — Ajdukiewicz nazwał pytaniem rozstrzygnięcia). Ze względu na k al- ternatyw w nim zawartych nosi ono bardziej szczegółową nazwę ^-członowego py- tania rozstrzygnięcia. Wyżej przedstawione pytanie: „Czy najważniejszym czynni- kiem, zdaniem Pana, przy formułowaniu diagnozy psychologicznej jest: ...?" jest sześcioczłonowym pytaniem rozstrzygnięcia. Takie pytania nazywa Belnap pytaniami typu „czy". Drugi rodzaj pytań, nazywany przez Belnapa pytaniami typu „który" nie ujawnia zawartych w nich alternatyw. Można jednak zrekonstruować ich ogólną postać. Każda alternatywa w takim pytaniu będzie podstawieniem danej funkcji zda- niowej. W sposób jednoznaczny zbiór alternatyw będzie określony przez funkcję wyznaczającą zakres podstawień w miejsce danej zmiennej. Zilustrujmy ten rodzaj pytań przykładem podanym przez Pawłowskiego (tamże, s. 79): „Jaka liczba natu- ralna jest równa sumie 7 + 5?". Ogólna postać alternatyw „ukrytych" w tym pytaniu st: 7 + 5 = x. Funkcja, która wyznacza zakres podstawień pod x jest następująca: V(x) s x jest liczbą naturalną". Predykat N mówiący o tym, jakie to nazwy przed- dotów należy podstawiać pod x nazywa Belnap orzecznikiem kategorialnym. Pełna owiedź bezpośrednia na powyższe pytanie brzmi: „Liczba 12 jest równa sumie ' + 5, a nadto wszelka liczba naturalna równa sumie 7 + 5 jest identyczna z licz-12". Oczywiście, może być tak, że zajdzie potrzeba posłużenia się większą liczbą orzeczników kategorialnych, których musi być dokładnie tyle, ile jest zmiennych, ytania typu „który" w terminologii Ajdukiewicza noszą nazwę pytań dopełnienia. Formułując jakiekolwiek pytanie zakładamy jakieś twierdzenie. Na przykład pytaniu: „W którym roku założono pierwsze laboratorium psychologiczne na viecie?" zakładamy, iż takie laboratorium zostało w ogóle założone. Otóż, twier- enie zakładane przy wypowiadaniu jakiegokolwiek pytania Belnap nazywa zało-liem pytania. Wedle niego, w każdym pytaniu zawarte jest tylko jedno założenie uówiące, iż prawdziwa jest co najmniej jedna odpowiedź bezpośrednia na nie. W swojej klasyfikacji opartej na trzech cechach pytań: (a) sposobie prezentowania alternatyw, (b) żądaniu wyboru, (c) żądaniu roszczenia zupełności, Selnap wymienia sześć typów pytań. Oto ich krótka charakterystyka (bardziej szcze- iłowe omówienie znajdzie Czytelnik u cytowanego tu Pawłowskiego T., 1969). 1. Pytanie typu „czy" o jednej alternatywie. Może to być dowolne ^-członowe lie rozstrzygnięcia żądające odpowiedzi wskazującej jedną alternatywę praw- 221 dziwa, przy czym ma to być jedyna alternatywa prawdziwa. Jest to więc pytanie 0 maksymalnym żądaniu roszczenia zupełności. Żądanie wyboru wymaga podania w odpowiedzi bezpośredniej jednej z alternatyw. Odpowiedź bezpośrednia na to pytanie ma postać koniunkcji, w której stwierdza się prawdziwość jednej alterna tywy i neguje pozostałe. Przykład pytania: „Czy u małego normalnego dziecka do... tygodnia życia odruch Babińskiego przyjmuje postać patologiczną?". Odpowiedź: „Tak, odruch Babińskiego przyjmuje postać patologiczną u małego, normalnego dziecka do ... tygodnia życia i nieprawda, że odruch Babińskiego nie przyjmuje postaci patologicznej u małego, normalnego dziecka do ... tygodnia życia." Zwykle formułuje się skrócone odpowiedzi, których postać automatycznie wyklucza wystą pienie innych alternatyw. Postępujemy tak zwłaszcza w pytaniu dwuczłonowym. Gdyby jednak taka skrócona odpowiedź miała wprowadzić niejasność, należy sfor mułować pełną odpowiedź. 2. Pytanie typu „który" o jednej alternatywie. Ze względu na stopień żądania roszczenia zupełności i żądania wyboru pytanie tego typu jest identyczne z typem omówionym poprzednio. Różni się jednak od niego sposobem prezentowania alter natyw. Mówiłem o tym przy okazji podawania ogólnej charakterystyki pytań typu „który". Odpowiedź bezpośrednia na takie pytanie ma postać dwuczłonową. Pier wszy człon wybiera jedną z alternatyw zawartych w pytaniu, a drugi stwierdza po prostu, że jest to jedyna prawdziwa alternatywa. Przykład takiego pytania oraz bezpośredniej odpowiedzi na nie został przedstawiony wyżej. 3. Pytanie typu „czy" o pełnej liczbie alternatyw. 7& względu na sposób prezentowania alternatyw jest ono podobne do pytania typu 1. Wymaga jednak, by w odpowiedzi bezpośredniej na nie znalazły się wszystkie prawdziwe alternatywy. Odpowiedź bezpośrednia na to pytanie ma postać koniunkcji, w której każde zdanie jest albo stwierdzeniem prawdziwości kolejnej alternatywy, albo też jej zaprzecze niem, przy czym co najmniej jedno zdanie jest stwierdzeniem prawdziwości jednej alternatywy. Przykład pytania: „Czy następujące testy istotności różnic można sto sować w przypadku, gdy pomiar zmiennej Y dokonany został na skali nominalnej: a) test chi-kwadrat, b) test Manna-Whitneya, c) test Kruskala-Wallisa, d) test McNemara?". Odpowiedź: „W przypadku, gdy pomiar zmiennej Y dokonany był na skali nominalnej można stosować test chi-kwadrat oraz test McNemara, ale nie można stosować testu Manna-Whitneya oraz testu Kruskala-Wallisa (poprawność tej odpowiedzi może Czytelnik sprawdzić na rys. 11.1 i 11.2.). 4. Pytanie typu „który" o pełnej liczbie alternatyw. Pytanie tego typu różni się od pytania typu 3. tylko sposobem prezentowania alternatyw. W odpowiedzi bezpośredniej na nie należy wymienić wszystkie prawdziwe alternatywy. Odpo wiedź taka jest dwuczłonowa; pierwszy człon jest koniunkcją wszystkich — zda niem udzielającego odpowiedzi — prawdziwych alternatyw. Drugi zawiera stwier dzenie, iż wymienione w odpowiedzi alternatywy są jedynymi prawdziwymi alter natywami (w członie tym wyrażone jest maksymalne żądanie roszczenia zupełno ści). Przykład pytania: „Kto jest twórcą kwestionariusza osobowości MMPIT. Odpowiedź: „Twórcami kwestionariusza osobowości MMPI są Starkę R. Hathaway 1 J. Charnley McKinley i są to jedyni autorzy tego kwestionariusza". 222 5. Pytanie typu „czy" o nierozłącznej liczbie alternatyw. Tego typu pytanie zawiera minimalne żądanie roszczenia zupełności, natomiast zawarte w nim żądanie wyboru wymaga, by odpowiedź bezpośrednia na nie podawała tylko jedną z praw dziwych alternatyw. Nie wyklucza to jednak prawdziwości pozostałych, nie uwzględnionych w pytaniu alternatyw. Odpowiedź bezpośrednia na nie wskazuje tylko tę jedną prawdziwą alternatywę, nie mówiąc przy tym nic o wartości logicz nej pozostałych, nie wymienionych w pytaniu alternatyw. Przykład pytania: „Czy internalizacja norm społecznych jest istotnym mechanizmem kształtowania osobo wości?". Odpowiedź: „Internalizacja norm społecznych jest istotnym mechanizmem kształtowania osobowości". Zauważmy, że w pytaniu tym nie wystąpiła chociażby taka prawdziwa alternatywa jak: mechanizm identyfikacji z osobami znaczącymi. 6. Pytanie typu „który" o nierozłącznej liczbie alternatyw. Od pytań typu 5. różni się charakteryzowany tu typ pytań tylko sposobem prezentowania alternatyw. Także od odpowiedzi bezpośredniej na takie pytanie wymaga się tylko, aby poda wała jedną prawdziwą alternatywę, nie wykluczając przy tym prawdziwości innych, nie wymienionych alternatyw. Przykład pytania: „Który z testów istotności różnic dla dwóch grup niezależnych jest właściwym testem w przypadku, gdy pomiar zmiennej zależnej dokonany został na skali porządkowej?". W odpowiedzi na to pytanie można wskazać np. test Manna-Whitneya. Wiemy jednak, że wskazanie testu Kołmogorowa-Smirnowa czy testu Walda-Wolfowitza też byłoby odpowiedzią prawdziwą (por. rys. 11.1). * * * Przedstawiona wyżej klasyfikacja pytań jest dla badacza ważna dlatego, iż znajomość jej umożliwia mu poprawne formułowanie pytań, unikanie błędów. Zgodnie z tą klasyfikacją można wymienić trzy rodzaje wad pytań: (1) wady związane ze sposobem prezentowania przez pytanie alternatyw, (2) wady związane z zawartym w pytaniu żądaniem wyboru, (3) wady związane z żądaniem roszczenia zupełności. Szczegółową dyskusję tych i innych wad przeprowadza w cytowanej już pracy T. Pawłowski. 3. Klasyfikacja problemów badawczych W zależności od tego, czego dotyczy pytanie wyróżnia się rozmaite kategorie pro- blemów badawczych. I tak, S. Nowak (1985, s. 41-42) wymienia dwie kategorie problemów. Pierwsza dotyczy „samych własności przedmiotów i zmian, jakim one podle- gają: czy przedmioty te cechują się posiadaniem określonych własności bądź pod- legają (podlegały) określonym zdarzeniom, zmianom i procesom, jakie było natę- 223 żenię pewnych cech o charakterze ilościowym czy intensywność przemian i proce- sów przedmioty te charakteryzujących" (s. 41). Ten rodzaj pytań S. Nowak określa mianem pytań o „przekrojowe lub dynamiczne własności przedmiotów lub o zda- rzenia i procesy, jakim te przedmioty podlegają" (s. 41). Są to więc, uogólniając, pytania o wartości zmiennych. Druga kategoria problemów badawczych dotyczy tego, „czy zachodzą pewne relacje (zależności) między własnościami badanych przedmiotów" (s. 41). Są to więc pytania o zależności między zmiennymi — dokładniej, między zmienną za- leżną Y (zmiennymi zależnymi Y\,..., Ym) oraz zmienną niezależną Xj (zmiennymi niezależnymi Xi,..., X„). W tej pracy uszczegółowimy tę użyteczną klasyfikację problemów badaw- czych. Mamy zatem: I. Problemy dotyczące wartości zmiennych. „Jaką wartość przyjmuje dana zmienna zależna Y, gdy zmienna niezależna Xj przyjmuje pewną wyróżnioną wartość v (X7) = m?" Lub: „Jaką wartość przyjmuje dana zmienna niezależna Xj, gdy zmienna zależna Y przyjmuje pewną wyróżnioną wartość v (Y) = w?" Często w przypadku problemów tej klasy spotykamy się z takim sformułowa- niem: „Jaką wartość przyjmuje zmienna zależna Y w populacji P?". Otóż zwrot: „... w populacji P" jest równoznaczny ze zwrotem: „... gdy zmienna (lub zmienne) niezależna przyjmuje wyróżnioną wartość". Jest to oczywiste, gdyż mówiąc o jakiejś populacji mamy na myśli w miarę jednorodny — ze względu na wartości, jakie przyjmują zmienne niezależne — zbiór osób. I tak, populacja osób z wykształceniem podstawowym to taki zbiór osób, dla których zmienna „poziom wykształcenia" przyjmuje tylko jedną wartość, a mianowicie „wykształcenie podstawowe". II. Problemy dotyczące zależności między zmiennymi. 1. Problemy istotnościowe, które obejmują pytania o istotność zmiennych (nie zależnych) dla innej zmiennej (zależnej), w ramach których wyróżniamy z kolei następujące pytania szczegółowe (por. rozdz. 1., pkt. 5., także: rys. 1.6): la: „Jakie zmienne niezależne są istotne dla zmiennej F?" Inaczej mówiąc, chcemy ustalić zbiór zmiennych niezależnych istotnych dla zmiennej zależnej Y (czyli wywierających wpływ na Y) — „Jakie zmienne wchodzą do O (PYW lb: „Które ze zmiennych niezależnych są bardziej, a które mniej istotne dla danej zmiennej zależnej F?" Inaczej mówiąc, chcemy się dowiedzieć: „Jaki jest porządek istotnościowy w obrębie zmiennych zaliczonych do O (Py)?" lc: „Czy zmienne niezależne wpływają na daną zmienną zależną, każda nie- zależnie od pozostałych, czy też wchodzą ze sobą w interakcje?" Inaczej mówiąc, chcemy zadać pytanie: , Jaki jest rodzaj O (Sr)7". 2. Problemy dotyczące „kształtu" zależności zmiennej zależnej Y od określonej zmiennej niezależnej dla niej istotnej, czyli pytania postaci: ,Jaka jest zależność zmiennej Y od zmiennej niezależnej X;?" Albo inaczej: , Jakiej postaci związek łączy zmienną zależną Y ze zmienną niezależną XjT' Zilustrujmy przykładem szczegółowy problem należący do klasy I. Pytanie tej postaci sformułował Kostrzewski (1963). „Wyróżnioną wartością" zmiennej 224 zależnej była jedna z postaci niedorozwoju umysłowego wrodzonego, a mianowicie zespół Downa. Zmienną niezależną był wiek matki w chwili urodzenia dziecka, u którego stwierdzono zespół Downa. Kostrzewski pytał o to, jaką wartość przyj- muje zmienna niezależna w badanej populacji matek, u których dzieci stwierdzono zespół Downa. Przeprowadzone badania pokazały, iż przeciętna wieku matek w badanej grupie (#=200) w chwili urodzenia dziecka z chorobą Downa wyno- siła 35,08 lat. A oto przykład problemu II.2. „Jaka jest zależność między stabilnością samo- oceny i odpornością na stres?" (Brzezińska, Kofta, 1974). Zmienną niezależną jest tu stabilność samooceny, a zmienną zależną — odporność na stres. W problemie „ukryte" jest pytanie o postać związku łączącego obie zmienne (liniowy versus krzywoliniowy). 4. Hipoteza jako odpowiedź na pytanie badawcze — cechy dobrze sformułowanej hipotezy Z dobrze postawionego problemu powinna jasno wynikać hipoteza (lub hipotezy) badawcza, jako odpowiedź na pytanie zawarte w problemie. Dane stwierdzenie może być uznane za hipotezę naukową, jeżeli jest spraw- dzalne. Hipoteza, której nie można poddać procedurze sprawdzania empirycznego nie może pretendować do miana hipotezy naukowej. Kmita (1973, s. 129) tak to ujmuje: „Aby zaproponowane do przyjęcia hipotezy mogły być sprawdzone, muszą być sprawdzalne (podkr. /. B.), tzn. muszą być powiązane (...) związkami wynika- nia ze zdaniami obserwacyjnymi; zdania te może obserwacja bezpośrednio potwier- dzić i wtedy sprawdzane hipotezy są również potwierdzone, bądź też zdania te mogą okazać się — w świetle obserwacji — fałszywe i wtedy sprawdzane hipotezy na ogół odrzucimy. Sprawdzalność zatem zdań proponowanych na twierdzenia da- nej dyscypliny empirycznej, a więc sprawdzalność hipotez nakłada określone wa- runki na sposób ich formułowania: na dobór terminów, za pomocą których hipotezy te, a więc ostatecznie wszelkie twierdzenia syntetyczne, są budowane." Kmita chce, aby terminy teoretyczne (predykaty teoretyczne) występujące w hipotezach posiadały moc predyktywną. Była o tym mowa w rozdz. 7., pkt. 7. Jeżeli hipoteza jest „zdolna" wyjaśnić tylko te fakty, do wyjaśnienia których została sformułowana i nie jest zdolna do przewidywania nowych faktów (prognoz zjawisk innego typu), to może ona zasługiwać jedynie na miano hipotezy ad hoc1, inaczej: doraźnej. Takie hipotezy, które — jak pisze Such (1975b, s. 105) — W odróżnieniu od tzw. hipotez pomocniczych ad hoc, których celem jest „ratowanie" zagro- żonych przez nowe fakty teorii macierzystych, wyróżnia się jeszcze hipotezy samodzielne ad hoc, które służą wyjaśnieniu jakichś nowych zjwisk (Such, 1975b, s. 95 i nast). W tekście piszę o hipotezach samodzielnych ad hoc. 15 — Metodologia badań.. 225 postulują „coś" i znajdują swoje potwierdzenie wyłącznie w faktach, do wyjaśnie- nia których zostały powołane, noszą nazwę hipotez metodologicznie wadliwych. Bywa i tak, że to „coś" posiada tylko te cechy, które służą wyjaśnieniu faktów, ze względu na które dokonuje się wspomnianego postulowania. Wówczas możemy mówić o metodologicznym błędnym kole (tamże). Jak unikać formułowania takich hipotez ad hocl Najlepszym sposobem jest wyprowadzanie jak największej liczby różnorodnych konsekwencji empirycznych, które dadzą się skonfrontować z do- świadczeniem. Jeżeli chodzi o zidentyfikowanie hipotezy ad hoc, to pomocne w tym względzie okazać się może jej określenie zaproponowane przez Sucha (tamże, s. 107): ,,(...)samodzielną hipotezę ad hoc można określić jako hipotezę, która dla swej obrony w obliczu faktów doświadczalnych nowych typów wymaga wprowa- dzania wciąż nowych, komplikujących ją, hipotez (które zresztą przeważnie same okazują się również hipotezami ad hoc; w ten sposób jedne hipotezy ad hoc są często notowane za pomocą innych hipotez ad hoc)". Sformułujmy dalsze kryteria poprawności formułowania hipotez naukowych (Nowak S., 1985, s. 31-37; Kerlinger, 1986, s. 17-18; Jakubowska, 1993, s. 54-58): — hipoteza musi być adekwatną odpowiedzią na problem, — hipoteza musi być najprostszą odpowiedzią na problem, gdyż im bardziej prostą przyjmie postać — tym łatwiej będzie można ją sprawdzić, — hipoteza musi być tak sformułowana, by łatwo można było ją przyjąć, względnie odrzucić, — hipoteza nie powinna przyjmować postaci szerokiej generalizacji. Musimy pamiętać też i o tym, że sprawdzona, zaakceptowana przez badacza hipoteza nie jest na stałe włączona do zbioru twierdzeń danej dyscypliny empiry- cznej, zawsze może być ona odrzucona przy okazji sprawdzania następnych, no- wych hipotez. Owa „nietrwałość" hipotez jest rezultatem stosowania przez badaczy zasady intersubiektywnej kontrolowalności. Gdyby w świecie nauki nie obowiązy- wała owa zasada, raz sprawdzonej przez danego badacza hipotezie nie groziłoby, że spróbuje ją podważyć później (czy w momencie jej ogłoszenia) inny badacz (Kmita, 1973, s. 128). W odpowiedzi na problemy cząstkowe badacz formułuje takie same, cząstko- we hipotezy. Ich zaletą jest to, że wyraźniej ukierunkowują badacza, jeżeli chodzi o wyprowadzanie z nich określonych obserwowalnych konsekwencji, które — w procesie sprawdzania — badacz będzie konfrontował z faktami. Chciałbym jeszcze raz podkreślić, na zakończenie tego punktu, iż hipotezy zawsze formułuje się w postaci twierdzącej. 5. Klasyfikacja hipotez badawczych ' ? Przez analogię do przedstawionego w pkt. 3. podziału problemów proponuję nastę- pującą klasyfikację hipotez badawczych: 226 I. Hipotezy dotyczące wartości zmiennych. „Jeżeli zmienna niezależna X3 przyjmuje wyróżnioną wartość: v (Xj) = m, zmienna zależna Y przyjmuje wartość v (Y) = w." Lub: „Dla danej zmiennej zależnej Y, która przyjmuje wyróżnioną wartość v(Y) = w, zmienna niezależna Xj przyjmuje wartość v (Xj) = m." II. Hipotezy dotyczące zależności między zmiennymi. 1. Hipotezy istotnościowe, czyli twierdzenia postaci: la. „Zmienne niezależne Xj, ..., X„ są istotne dla Y\ lb. „Zmienne z O (PY), uporządkowane są — wg relacji bycia bardziej istotną dla Y niż... — w następujący sposób..." Albo inaczej: „Zmienna Xt jest bardziej istotna dla zmiennej zależnej Y niż zmienna X2". lc'. ,,O(SY) jest interakcyjny — Oin(PY)". Inaczej: „Zmienne niezależne Xu ..., X„ wpływają na zmienną zależną Y wchodząc ze sobą w interakcje". Albo też, gdy tylko część zmiennych, wedle wiedzy badacza (przyjętych przez niego założeń teoretycznych) wchodzi ze sobą w intrakcje: „Zmienne niezależne Xi, X2 wchodzą ze sobą w interakcje, a zmienne X}, X4 nie wchodzą ze sobą, ani z pozostałymi zmiennymi w interakcje". lc" ,,O(Sy) jest izolowany — Oiz(PY)". Inaczej: „Zmienne niezależne Xi,..., X„ wpływają na zmienną zależną Y nie wchodząc ze sobą w interakcje". 2. Hipotezy dotyczące „kształtu" zależności zmiennej zależnej Y od określonej zmiennej niezależnej X/. „Zmienną zależną Y łączy związek funkcyjny ze zmienną niezależną Xj po- staci: Y = f(Xj)". Pod / podstawiamy określony „kształt" funkcji. Przypomi- nam, iż psychologowie ograniczają się w tym przypadku jedynie do określenia, czy jest to funkcja liniowa, czy nieliniowa. Przykładowe „techniczne" rozwiązanie problemu liniowa versus nieliniowa zależność Y od Xj przedstawione zostało w rozdz. 10., pkt. 2.-3. 6. Podsumowanie taiejętne postawienie pytania badawczego na ogół już dostatecznie dokładnie do- treść hipotezy badawczej, stanowiącej najbardziej prawdopodobną, na grun- dotychczasowej wiedzy badacza, odpowiedź na ten problem — zwłaszcza gdy on wyrażony w postaci pytania rozstrzygnięcia. Niniejszy rozdział poświęcony właśnie temu, jak najlepiej formułować pytania badawcze i odpowiedzi na nie. Jeżeli chodzi o literaturę, dostępną w języku polskim, dotyczącą omawianej problematyki, to polecam uwadze Czytelnika następujące prace: Cackowski Pro- my i pseudoproblemy; Giedymin Problemy, założenia, rozstrzygnięcia; Such bierny weryfikacji wiedzy (Wstęp); Ajdukiewicz Logika pragmatyczna (cz. I, L 6.); S. Nowak Metodologia badań społecznych, (rozdz. 1.). 227 Te orię pytań w ujęciu Belnapa przedsta wia T. Pawłow ski w Metodol ogiczny ch zagadni eniach humani styki (rozdz. 3. Teoria pytań i jej zastoso wania, s. 67- 121). Sp oro miejsca proble matyce hipotez badawc zych poświę ca Hempel w pracy: Podsta wy nauk przyrod niczych . Na tomiast to, jakie (z uwagi na ich treści i typ formaln y pytań) formułu ją problem y badawc ze psychol ogowie, najlepie j poznać czytając artykuły — stano- wiące sprawo zdania z prowad zonych badań empiryc znych — regular nie pisane przez nich samych do fachow ych pism psychol ogiczny ch. W Polsce są to przede wszystk im czasopis ma o zasięgu ogólnop olskim: „Czaso pismo Psychol ogiczne " (wydaw ane i redago wane przez Instytut Psychol ogii UAM w Poznani u), „Polish Psychol ogical Bulletin " (wydaw any przez Komitet Nauk Psychol ogiczny ch PAN, a redago wany w Katedrz e Psychol ogii Uniwer sytetu Opolski ego), „Przegl ąd Psychol ogiczny " (wydaw any przez Polskie Towarz ystwo Psychol ogiczne, a reda- gowany w Instytuc ie Psychol ogii UG w Gdańsk u), „Studia Psychol ogiczne " (wy- dawane przez Komitet Nauk Psychol ogiczny ch PAN, a redagow ane w Instytuci e Psy- chologii PAN w Warsza wie), „Psycho logia Wycho wawcza " (wydaw ana przez Związek Nauczyc ielstwa Polskieg o, a redagow ana na Wydzial e Psychol ogii UW w Warsza wie). w stronę metod statystycznych . ? Rozdział 9. Próba - 1. Wprowadzenie Badacz stojący przed problemem doboru próby (ang. sample) do badań ma do wyboru trzy możliwe sposoby działania: (1) może on sam, lub odwołując się do opinii eksperta, wybrać określone osoby do grupy badawczej — jest to tzw. dobór celowy (ang. purposive sam- pling), albo inaczej: nieprobabilistyczny (ang. nonprobability sampling); jego po- pularną odmianą, zwłaszcza wśród socjologów (por. Blalock, 1975, s. 459; Nowak S., 1985, s. 301), jest dobór kwotowy (ang. ąuota sampling), a także — absolutnie nie polecany — dobór całkowicie przypadkowy (ang. accidental sampling); (2) może skompletować próbę na podstawie zgłoszeń ochotników (ang. vo- lunteers); (3) może pobrać próbę z populacji w sposób losowy (ang. random sampling). Który z tych sposobów daje próbę reprezentatywną (ang. representative sample)? Dziś już nie mamy wątpliwości co do tego, iż jedynie losowy dobór jednostek (tu: osób lub złożonych z nich grup; ang. population/sample elements) gwarantuje uzyskanie próby reprezentatywnej. Jedynie na niej przeprowadzone badanie empi- ryczne będzie cechowała wysoka trafność zewnętrzna (por. rozdz. 3. pkt. 2.2.). Trzeba przyznać, iż istnieją takie sytuacje (np. badania prowadzone przez psy- chologów klinicznych na niewielkich grupach chorych psychicznie na terenie danej kliniki psychiatrycznej), w których z konieczności musimy stosować dobór celowy osób. Jednak przy dokonywaniu oszacowań opartych na tak dobranej grupie ba- dawczej trzeba być bardzo ostrożnym w formułowaniu wniosków, które miałyby wykraczać poza naszą grupę, gdyż może ona nieadekwatnie odzwierciedlać stru- kturę całej populacji (w tym przypadku: populację wszystkich osób dotkniętych daną chorobą). Także odwoływanie się do opinii eksperta, np. psychiatry, w zakre- sie doboru osób z określonym rozpoznaniem psychiatrycznym nie rozwiązuje pro- blemu. Diagnoza psychiatryczna daleka jest jeszcze od jednoznaczności i precyzji. Nadal można spotkać się z diagnozami, które wzajemnie się wykluczają. Z podob- nych powodów niereprezentatywna może okazać się próba skompletowana na pod- 231 stawie ochotniczych zgłoszeń. Może najbardziej godna zaufania — z nielosowych sposobów budowy próby — jest ta, która została utworzona techniką doboru kwo- towego. O każdym z tych sposobów, a o losowym najwięcej, będzie mowa w kolej- nych punktach niniejszego rozdziału. 2. Dlaczego próba złożona z ochotników jest stronnicza? Tylko pozornie próba skompletowana w wyniku ochotniczych zgłoszeń do udziału w badaniach empirycznych może być reprezentatywna. W rzeczywistości jest ona w pewnym (jakim?) stopniu tendencyjna, gdyż grupa ochotników różni się tym od pozostałych osób, że wyraziła zgodę na udział w badaniach, który nie był obowiąz- kowy, że uważnie czytała prasę codzienną zwracając uwagę na ogłoszenia. Ochot- nicy różnią się od nieochotników także pod innymi względami, a to może spowo- dować, że uzyskane przez nich wyniki będą nietypowe dla populacji jako całości. Zasięg naszych wniosków z badań przeprowadzonych na takich osobach byłby ograniczony tylko do pewnego fragmentu populacji. Przed błędami spowodowany- mi faktem, że badaniom poddano ochotników ostrzegają m. in. Reid (1972, s. 89-90) oraz Rosenthal i Rosnow (1975, 1984, s. 187; Rosnow, Rosenthal, 1976). Zreferujmy teraz wyniki badań Rosenthala i Rosnowa, przeprowadzonych nad „portretem psychologicznym" osoby ochotniczo zgłaszającej się do udziału w ba- daniach psychologicznych. Dokonany przez wyżej wymienionych psychologów przegląd badań empirycznych, w których wykorzystano ochotników, doprowadził ich do sporządzenia „portretu psychologicznego" ochotnika, obejmującego 17 cech. Cechy charakterystyczne, różniące ochotników od nieochotników ujęte zostały w trzy grupy. Pierwsza grupa obejmuje 5 cech, które — jak sądzę można tak powie- dzieć — są w tym portrecie najbardziej dominujące i najlepiej udokumentowane. Należą do nich: (1) wyższy poziom wykształcenia, (2) przynależność do wyższej klasy społeczno-ekonomicznej; wyższy status społeczny, (3) wyższy poziom inteligencji, (4) wyższy poziom zmiennej aprobaty społecznej (w sensie: Nederhof, 1991; Drwal, 1995 s. 57-66), (5) większe zsocjalizowanie. Druga grupa obejmuje 6 cech, średnio udokumentowanych. Są to: (6) zwiększona tendencja do poszukiwania stymulacji; widoczne jest to zwła szcza w chęci uczestniczenia w badaniach nad stresem, deprywacją sensoryczną czy hipnozą, 232 stawie ochotniczych zgłoszeń. Może najbardziej godna zaufania — z nielosowych sposobów budowy próby — jest ta, która została utworzona techniką doboru kwo- towego. O każdym z tych sposobów, a o losowym najwięcej, będzie mowa w kolej- nych punktach niniejszego rozdziału. 2. Dlaczego próba złożona z ochotników jest stronnicza? Tylko pozornie próba skompletowana w wyniku ochotniczych zgłoszeń do udziału w badaniach empirycznych może być reprezentatywna. W rzeczywistości jest ona w pewnym (jakim?) stopniu tendencyjna, gdyż grupa ochotników różni się tym od pozostałych osób, że wyraziła zgodę na udział w badaniach, który nie był obowiąz- kowy, że uważnie czytała prasę codzienną zwracając uwagę na ogłoszenia. Ochot- nicy różnią się od nieochotników także pod innymi względami, a to może spowo- dować, że uzyskane przez nich wyniki będą nietypowe dla populacji jako całości. Zasięg naszych wniosków z badań przeprowadzonych na takich osobach byłby ograniczony tylko do pewnego fragmentu populacji. Przed błędami spowodowanymi faktem, że badaniom poddano ochotników ostrzegają m. in. Reid (1972, s. 89-90) oraz Rosenthal i Rosnow (1975, 1984, s. 187; Rosnow, Rosenthal, 1976). Zreferujmy teraz wyniki badań Rosenthala i Rosnowa, przeprowadzonych nad „portretem psychologicznym" osoby ochotniczo zgłaszającej się do udziału w ba- daniach psychologicznych. Dokonany przez wyżej wymienionych psychologów przegląd badań empirycznych, w których wykorzystano ochotników, doprowadził ich do sporządzenia „portretu psychologicznego" ochotnika, obejmującego 17 cech. Cechy charakterystyczne, różniące ochotników od nieochotników ujęte zostały w trzy grupy. Pierwsza grupa obejmuje 5 cech, które — jak sądzę można tak powie- dzieć — są w tym portrecie najbardziej dominujące i najlepiej udokumentowane. Należą do nich: (1) wyższy poziom wykształcenia, (2) przynależność do wyższej klasy społeczno-ekonomicznej; wyższy status społeczny, (3) wyższy poziom inteligencji, (4) wyższy poziom zmiennej aprobaty społecznej (w sensie: Nederhof, 1991; Drwal, 1995 s. 57-66), (5) większe zsocjalizowanie. Druga grupa obejmuje 6 cech, średnio udokumentowanych. Są to: (6) zwiększona tendencja do poszukiwania stymulacji; widoczne jest to zwła szcza w chęci uczestniczenia w badaniach nad stresem, deprywacją sensoryczną czy hipnozą, 232 (7) zwiększona tendencja do zachowań niekonwencjonalnych (np. w sferze zachowań seksualnych), (8) ochotnikami są raczej kobiety, ale w przypadku badań nad stresem są to raczej mężczyźni, (9) niższy poziom autorytaryzmu, (10) ochotnikami są raczej wyznawcy religii żydowskiej niż protestanckiej i raczej protestanckiej aniżeli katolickiej (uwaga: badania dotyczyły populacji ame rykańskiej), (11) niższy poziom konformizmu, ale w przypadku kobiet biorących udział w badaniach o profilu klinicznym jest odwrotnie. Trzecia grupa obejmuje 6 cech najmniej udokumentowanych. Są to: (12) ochotnicy pochodzą z niniejszych miast (zwłaszcza gdy są to badania 0 charakterze kwestionariuszowym), (13) zwiększone zainteresowanie religią (też raczej w badaniach kwestionariu szowych), (14) większy poziom altruizmu, (15) ochotnicy są bardziej otwarci (ang. sełf-disclosing), (16) w badaniach nad lekami, hipnozą czy ogólniej, w badaniach typu me dycznego ochotnicy wykazują niższy poziom przystosowania, (17) ochotnicy są młodsi, chyba że badania mają charakter laboratoryjny 1 biorą w nich udział kobiety. Ilustracją błędów wynikających z doboru ochotników do badań mogą być doświadczenia z LSD, jakie przeprowadzili przed laty dwaj psychologowie amery- kańscy Timothy Leary i Richard Alpert. Zainteresował ich wpływ LSD na osobo- wość przestępcy; zakładali, iż dzięki faktowi, że LSD wywołuje u danej jednostki specyficzne przeżycia psychiczne, można go będzie wykorzystać do lepszego po- znania siebie, a tym samym do pełniejszego rozwoju osobowości. Za zgodą władz i więźniów Leary i Alpert przeprowadzili swoje badania. Wyniki potwierdziły ich przewidywania. Stwierdzili m. in. spadek recydywy po opuszczeniu więzienia przez osoby poddane działaniu LSD. Jednakże dalsze obserwacje, a także badania powtó- rzone w innych ośrodkach przez innych badaczy, przy zastosowaniu specjalnych metod kontroli, nie potwierdziły pierwotnych wyników. Okazało się, że czynni- kiem powodującym spadek recydywy nie był LSD, ale cechy osób wyselekcjo- nowanych do badań. Oparto je bowiem na ochotnikach i w ten sposób stworzono możliwość zgłaszania się przestępcom, u których szansa powtórnego trafienia do więzienia była znikoma. Wydaje mi się, że mogły to być osoby, które do więzienia trafiły przypadkowo i sam pobyt w nim był dla nich czynnikiem tak traumatyzu- jącym, że za wszelką cenę chciały się uwolnić od niego, a tym samym uniknąć możliwości powrotu. Dlatego też zgłosiły się do badań, z którymi wiązały określo- ne na zieje. Informacje o powyższych badaniach podałem za Janków skini (1972, s. 80-87). 233 In na ilustrac ja. Na ochotn ikach prowa dzone były przed laty słynne badani a grupy Kinsey a (Kinse y i in., 1948, 1953). Dotycz yły one wzorcó w zacho wań se- ksualn ych mężcz yzn i kobiet i objęły 8 tys. mężcz yzn i 12 tys. kobiet. Badani a miały charakt er ankieto wy i przepr owadz one były na osobac h, które ochotn iczo zgłosił y się aby wziąć w nich udział. Z wcześ niej przepr owadz onych przez Mas- łowa (1942; por. Rosent hal, Rosno w, 1984, s. 186- 187) badań nad związk iem zacho wań seksual nych kobiet z poczuc iem ich własne j wartoś ci wynika ło, iż osoby, które cecho wał wysoki pozio m tej zmienn ej charakt eryzow ała jednoc ześnie tenden- cja do podej mowan ia zacho wań niekon wencjo nalnyc h w sferze seksu. Z kolei póź- niejsze badani a (Maslo w, Sakoda , 1952; por. Rosent hal, Rosno w, 1984, s. 186- 187), które objęły część próby Kinsey a pokaza ły, iż ci badani plasow ali się w strefie wysoki ch wynik ów skal mierzą cych poczuc ie własne j wartoś ci. Te dane prowa dzą do wniosk u, że oparcie na ochotni kach badań nad wzorca mi zacho wań seksual nych dało w efekcie wyniki obciąż one — nastąpił o błędne oszaco wanie wartoś ci badane j zmienn ej. Mówią c inaczej, społecz eństwo ameryk ańskie lat czterdzi estych naszeg o stu- lecia nie było tak niekon wencjo nalne w zacho waniac h seksual nych, jakby to wynika ło z badań zrefero wanyc h przez Kinsey a i jego współp racown ików. Pr zypuść my, że psycho log chce przepr owadzi ć badani a psycho metryc zne nad nowy m testem intelig encji. Jeżeli skonstr uuje próbę na podsta wie zgłosz eń ochot- niczyc h, to do finalne j wersji testu wejdą pozycj e testow e zbyt trudne dla całej popula cji (bo badani, którzy znaleźl i się w próbie są bardzi ej intelig entni i lepiej wyedu kowan i). Nie powin niśmy tedy prowa dzić takich badań na ochotn ikach. Ja ka jest skala wykor zystyw ania ochotn ików w badani ach psycho logiczn ych? Rosent hal i Rosno w szacuj ą ją na 70- 90%! Przew ażają studen ci pierws zych lat studió w psycho logicz nych (dodat kowa zmien na zakłóc ająca). D odajm y jeszcze , kończą c ten punkt, iż nie należy zbyt dosłow nie brać tego, co opisali w swoich badani ach Rosent hal i Rosno w. Trzeba pamięt ać, iż rzeczy wistość ma charakt er probab ilistycz ny i tak trzeba patrzeć na te ustalen ia. Jak sądzę, najbar dziej „pewn e" są zmienn e z pierws zej grupy. T emat stronni czości próby złożon ej z ochotn ików podej mowa ny był w pracac h: Krugla nski (1973; stanow isko odmie nne od tego, które zajęli Rosent hal i Rosno w; replika w: Rosno w, Rosent hal, 1974), MacD onald (1979) , Bell (1962; charak tery- styka osobo wości owa ochotn ików), Kohn i in. (1981) , Cowle s i Davis (1987) . 3. Prób a kwot owa Próba kwoto wa (ang. ąuota sampl e; od łac. ąuotus — ,jakiej liczby, jak wiele" , por. Kopali ński 1988) jest najbar dziej rozpo wszech niona wśród badacz y opinii pub- licznej oraz wśród psycho metró w standar yzując ych i normal izujący ch nowe testy psycho logicz ne. Badac z, który chce posłuż yć się próbą kwoto wą, musi znać pro- cento we rozkła dy interes ującyc h go zmien nych. Wiedz a ta jest potrze bna po to, 234 aby procentowe rozkłady tych zmiennych odtworzyć w próbie. I tak, jeżeli rozkład jakiejś zmiennej dychotomicznej w populacji, jest: 50% do 50%, to i w próbie powinna znaleźć się równa liczba osób, dla których ta zmienna przyjmie jedną i drugą wartość, na przykład: 50% kobiet i 50% mężczyzn. Postępowanie w przypadku posłużenia się próbą kwotową jest stosunkowo proste. Badacz nie wciąga do próby konkretnej wylosowanej osoby, tak jak to ma miejsce w próbach losowych, ale ,jakąś" osobę, która spełnia, wcześniej określone przez badacza, kryteria przynależności do próby. Jeżeli tymi kryteriami są, na przy- kład: płeć, wiek, wykształcenie miejsce zamieszkania, to układ próby (ang. sample design) wskazuje na liczby (frekwencje) osób o określonych kombinacjach wartości tych zmiennych. Badacz wie zatem, że musi przebadać, np. 5 kobiet (płeć) w wieku 30-40 lat (wiek) z wykształceniem wyższym (wykształcenie) zamieszkałych na wsi (miejsce zamieszkania), czy 13 mężczyzn (płeć) w wieku 40-50 lat (wiek) z wy- kształceniem średnim (wykształcenie) zamieszkałych w dużym mieście (miejsce zamieszkania) itp. Przy czym nie jest ważne, czy ową kobietą będzie Maria Ko- walska czy Anna Karenina. Ważne bowiem jest tylko to, aby „zgadzał się", prze- widziany układem próby rozkład procentowy zmiennych. Odwołajmy się do jeszcze jednej ilustracji. Polska adaptacja, standaryzacja i normalizacja znanej w świecie Skali Inteligencji Wechslera WAIS- R (por. Brzeziński, Hornowska, 1993b) przeprowadzona była na próbie pobranej w sposób kwotowy. Przy czym w celu uzyskania informacji o rozkładach ważnych zmiennych oparto się na danych pochodzących z Mikrospisu Ludności przeprowadzonego w 1984 roku przez Główny Urząd Statystyczny w Warszawie. Te zmienne to: wiek, płeć, miejsce zamieszkania, wykształcenie. W tab. 5a-5c (Gaul, Zakrzewska, 1993, s. 116-117) Czytelnik znajdzie procentowy udział osób o poszczególnych kombinacjach wartości owych czterech zmiennych w próbie standaryzacyjnej i normalizacyjnej. Socjologowie zdają sobie sprawę z tego, że nie jest to doskonały sposób kon- struowania próby reprezentatywnej. Niestety trzeba się liczyć z tym, iż uzyskane wyniki badawcze mogą być obciążone błędem, którego wielkości nie da się tak precyzyjnie jak w przypadku prób losowych ustalić. Oto dwie opinie na temat wartości prób kwotowych. Według Blalocka (1975, s. 459-460): „Ankieterowi określa się w takim przypadku (próby kwotowej — J. B.), że musi przebadać: tyle i tyle kobiet w wieku powyżej 40 lat, tyle i tyle osób z dochodem mniejszym niż 3000 dolarów, lub że taki a taki ma być odsetek katolików wśród osób przez niego ankietowanych. Jednakże tylko od niego zależy, które kobiety w wieku powyżej 40 lat i którzy katolicy zostaną zbadani. A że jest on tylko człowiekiem, z pew- nością będzie skłonny wybierać tych, którzy są dla niego najłatwiej dostępni. Cho- dząc po domach, będzie zastawał tych, którzy są w domu podczas jego odwiedzin. Nawet jeśli jest on świadom możliwości skrzywienia próby, wprowadzenie poprawki nie będzie łatwe. Wyjątkowo sumienny ankieter może nawet skrzywić próbę w odwrotnym kierunku i przebadać zbyt wiele osób, które rzadko bywają w domu lub osób z klasy niższej. Być może dałoby się wyszkolić ankieterów tak, by ich decyzje w tej materii dawały wyniki zbliżone do próby losowej. Sprawdzenie tego 235 będzie jednak bardzo trudne lub nawet niemożliwe. Jeśli grupa niedoreprezentowa- na lub nadreprezentowana różni się znacznie od pozostałych grup pod względem badanej zmiennej, próba może być poważnie obciążona. Co więcej, nie mamy możliwości oceny tego obciążenia". I druga opinia, S. Nowaka (1985, s. 301): „... dla uzasadnienia pewnych uo- gólnień indukcyjnych próba celowa o znanej reprezentatywności jest całkiem nie- przydatna. Aby ją dobrać, musimy przecież przedtem mieć odpowiednią wiedzę o całej populacji, tymczasem zdobycie tej wiedzy o populacji (przez uogólnienie wy- ników z próby na populację) jest często właśnie celem naszych badań na próbie. Jeśli pewne parametry struktury populacji — rozkładów zmiennych i związków między nimi — zostały założone w doborze próby, to byłoby bezprzedmiotowe wnioskowanie o tych rozkładach i związkach w populacji z badania tej próby właś- nie. Jednak wiele badań socjologicznych realizowanych jest na próbach kwotowych. Opiera to się na założeniu, które jest na ogół — w swej generalnej tendencji — słuszne, iż jeśli próba jest reprezentatywna dla populacji w wielu jej ważnych aspek- tach, to zapewne będzie ona dla niej reprezentatywna również w innych aspektach. Jednakże próba kwotowa nie daje możliwości jednoznacznego ustalenia ani stopnia jej podobieństwa do populacji pod innymi niż stanowiące kryteria doboru próby względami, ani też prawdopodobieństwa, iż będzie ona do niej zbliżona w określo- nym stopniu. Do wniosków takich uprawnia natomiast losowy dobór próby". 4. Próba losowa „Losowość próby statystycznej nie tylko sprzyja uzyskiwaniu prób reprezentatyw- nych (tzn. charakteryzujących się rozkładem badanej cechy nieistotnie różniącym się od rozkładu populacji), ale umożliwia ponadto wnioskowanie o populacji oparte na gruncie probabilistycznym (tzn. rachunku prawdopodobieństwa, pozwalającym na ocenę dokładności wnioskowania)" (Greń, 1987, s. 96). Jakie zatem warunki musi spełniać dobór osób, by mógł być uznany za w pełni losowy, a próba w ten sposób utworzona za reprezentatywną? W kolejnych podpunktach spróbuję odpo- wiedzieć na to pytanie. Jak już wiemy, reprezentatywną dla danej populacji próbę uzyskuje się na drodze losowania. Zanim jednak przystąpimy do losowania próby, musimy określić charakter populacji, z której będziemy próbę tę pobierać (etap 5. procesu badaw- czego) i na którą będziemy uogólniać wyniki uzyskane na podstawie przeprowa- dzonego badania empirycznego próby, (etap 8. procesu badawczego). Statystycy dzielą populacje na: (a) skończone, (b) nieskończone. „Pojęcie populacji generalnej (zbiorowości statystycznej) utożsamia się zazwy- czaj ze zbiorem pewnych rzeczywistych elementów różniących się wartością bada- nej cechy. Tak rozumiana populacja generalna jest zwykle skończona" (Greń, 1987, s. 96). Z populacjami skończonymi (rzeczywiście istniejącymi, realnymi), obejmu- jącymi np.: dzieci, dorosłych, pacjentów, uczniów, studentów, mieszkańców okre- ślonego regionu, osoby o wyróżnionych poglądach, postawach, cechach osobowo- ści, mamy do czynienia w badaniach psychologicznych (a także socjologicznych czy pedagogicznych). Z kolei populacja nieskończona rozumiana jest jako „zbiór nieskończony możliwych powtórzeń pewnego eksperymentu, w którym obserwuje się wartości pewnych zmiennych" (tamże). W tym sensie taka populacja ma status hipotetyczny. Można wyróżnić — posługując się różnymi kryteriami podziału (por. Greń, 1987, s. 97) — co najmniej cztery podstawowe podziały schematów losowania próby. 1. Losowanie niezależne versus losowanie zależne. Losowanie zależne, zwane też losowaniem bezzwrotnym czy losowaniem bez zwracania, polega na tym, że raz wylosowany element populacji nie jest do niej zwracany. Nie może zatem więcej niż jeden raz pojawić się w próbie. Oznacza to, że po każdym kolejnym losowaniu liczebność populacji pomniejsza się o 1. Tak więc pierwsze losowanie odbywa się z populacji o liczebności N, drugie — z populacji o liczebności AM, trzecie — z N-2 i n-te — z populacji o liczebności N-n. Losowanie zależne jest częściej stosowane w takich przypadkach, gdy pobieramy próby z populacji skoń czonych (przeliczalnych). W badaniach psychologicznych stosujemy ten właśnie wariant losowania. Z kolei losowanie niezależne, zwane też losowaniem zwrotnym czy losowaniem ze zwracaniem, polega na tym, że każdy wylosowany z populacji element jest do niej zwracany. Tak więc, prawdopodobieństwo wylosowania pierw szego oraz ostatniego elementu (niezależnie od wielkości losowanej próby) nie ulega zmianie, jest takie samo. Tym wariantem losowania posługujemy się w przy padku populacji nieskończonych. 2. Losowanie indywidualne versus losowanie zespołowe (grupowe). Losowa nie indywidualne odnosi się do populacji obejmującej pojedyncze, nie pogrupowane elementy, np. pojedyncze osoby (uczniów, robotników, pacjentów, żołnierzy itp.). Z kolei losowanie zespołowe wymaga pogrupowania jednostek danej populacji w grupy (np. taka grupą może być klasa szkolna czy mieszkańcy budynku). Zatem jed nostką losowania jest, w określony sposób zdefiniowana, grupa. Operatem losowania zaś będzie ponumerowany wykaz grup, na które podzielona jest populacja, np. ponu merowany wykaz wszystkich klas szkolnych szkół podstawowych gminy czy miasta. 3. Losowanie jednostopniowe versus wielostopniowe. W przypadku losowania jednostopniowego próbę tworzą elementy populacji bezpośrednio z niej wylosowa ne. Z kolei losowanie wielostopniowe zakłada kilka etapów (co najmniej dwa) losowania. Przykładowo, wpierw możemy losować zespoły elementów, a następnie, z każdego zespołu losujemy same elementy. Może być i tak, że kolejno losujemy z większych zespołów mniejsze, z tych zaś jeszcze mniejsze, aż na samym końcu losujemy pojedyncze elementy. 4. Losowanie nieograniczone versus losowanie ograniczone. Losowanie nie ograniczone odbywa się bezpośrednio z całej populacji (ma charakter jednostopniowy). 237 Losowanie ograniczone polega na tym, że próbę kompletujemy na podstawie od- rębnych losowań elementów z poszczególnych części populacji, na które została ona uprzednio podzielona przez badacza; np. badacz dzieli populację na jednorodne i rozłączne podzbiory (warstwy) i następnie z każdej warstwy, odrębnie, losuje podpróby elementów, aby, po ich złożeniu, uzyskać cały zbiór-próbę. Przykład typowych warstw wykorzystywanych w socjologicznych badaniach opinii społecz- nej (CBOS 1995): podział dorosłych obywateli Polski wg miejsca zamieszkania na pięć podzbiorów-warstw: mieszkańców wsi, mieszkańców miast posiadających do 20 tys. osób, mieszkańców miast posiadających od 21 tys. do 100 tys., mieszkań- ców miast posiadających od 101 tys. do 500 tys., oraz mieszkańców miast mają- cych 501 tys. i więcej mieszkańców. Inny przykład (zaczerpnięty z tego samego źródła) — podział Polski na regiony: region pomocny, region zachodni, region środkowo-zachodni, region środkowy, region wschodni, region południowo-- wschodni, region południowo-zachodni. Próby losowe dzielimy jeszcze na proste i złożone. Próby proste ze skończo- nych populacji uzyskuje się z wykorzystaniem do tego celu losowania: (1) indywidualnego, (2) nieograniczonego, (3) niezależnego (ze zwracaniem elementów do populacji po każdym akcie losowania). Z kolei próby złożone ze skończonych populacji uzyskuje się wykorzystując bardziej zaawansowane schematy losowania (np. złożone, zależne). W badaniach społecznych (też psychologicznych) mamy najczęściej do czy- nienia z populacjami skończonymi, a próby z nich losowane są na ogół próbami złożonymi (uzyskanymi z posłużenia się schematami losowań zwrotnych i wielo- stopniowych). 4.1. Pojęcie operatu losowania i mechanizmu losowania Losowanie jednostek (osób, grup itp.) z populacji musi być oparte na pewnym mechanizmie losowym decydującym o tym, która jednostka powinna wejść do próby, a która nie. Dobry mechanizm losowania powinien przede wszystkim dawać możliwość otrzymania jednoznacznej odpowiedzi czy daną jednostkę włączyć do próby, czy też nie. Powinien też być niezbyt skomplikowany, nawet dla niefachow- ca nie obeznanego z metodą reprezentacyjną. Kryterium włączania jednostek do próby powinno być niezależne od postępowania eksperymentalnego (Pawłowski Z., 1972, s. 28). Takim odpowiednim mechanizmem losowym są tablice liczb loso- wych. Podają je większe podręczniki statystyki, a także specjalistyczne wydaw- nictwa (por. np. Zieliński, 1972). Liczby losowe mogą też być generowane za pomocą specjalnego programu komputerowego. Oprócz mechanizmu losowego potrzebujemy jeszcze ponumerowanego spisu wszystkich jednostek składających się na daną populację, czyli tzw. operatu loso- wania. Takim operatem losowania dla populacji mieszkańców Poznania byłby spis (ponumerowany) wszystkich mieszkańców tego miasta. Operatem losowania dla populacji studentów psychologii będzie ponumerowany spis studentów psychologii wszystkich lat studiów danej uczelni. Jednostką losowania niekoniecznie musi być osoba, może nią być także klasa szkolna, określony sektor z planu miasta, szpital psychiatryczny, gmina, województwo itp. Jeżeli badacza interesuje np. próba zło- żona z 10 szpitali w kraju, musi on posłużyć się operatem losowania, którym jest ponumerowany spis wszystkich szpitali danego typu w Polsce. 4.2. Jak posługiwać się tablicami liczb losowych Poniżej podaję fragment takich tablic liczb losowych dla zorientowania Czytelnika w ich układzie: 04433 80674 24520 18222 10610 60298 47829 72648 37414 75755 67884 59651 67533 68123 17730 89512 32155 51906 61662 64130 32653 01895 12506 88535 36553 95913 15405 13772 76638 48423 Sposób posługiwania się tymi tablicami jest bardzo prosty. Przypuśćmy, że mamy pobrać z populacji N = 1000 osób próbę o wielkości n - 100 osób. Załóżmy również, że dysponujemy odpowiednim operatem losowania, który każdej osobie z populacji przypisał kolejny numer. Aby jednak liczbie losowej „0" odpowiadał również element populacji, podstawiamy ją w miejsce liczby „1000". Największą liczbą, która identyfikuje element populacji jest „999". Po ustaleniu powyższych danych przystępujemy do odczytania z tablic liczb losowych tylu liczb, ile elemen- tów ma liczyć próba (w naszym przykładzie — 100). Otwieramy więc tablice na dowolnej stronie i bierzemy pod uwagę dowolną kolumnę fc-cyfrową; załóżmy, iż będzie to kolumna trzycyfrowa, pierwsza z lewej w wyżej przedstawionym frag- mencie tablicy liczb losowych. Jest to kolumna właśnie trzycyfrowa, gdyż nume- rowi „1000" odpowiada liczba losowa „0". Przesuwając się kolejno z dołu ku górze (lub odwrotnie) odczytujemy wszystkie liczby mniejsze od N (od N-\ do 0). Jeżeli w trakcie odczytywania natrafimy na liczbę, która już była zapisana, to ją po prostu pomijamy i odczytujemy następną. Po odczytaniu wszystkich liczb losowych w danej kolumnie przechodzimy do następnej kolumny. Procedurę tę powtarzamy tak długo, aż uzyskamy zbiór n różnych liczb losowych odpowiadających n ele- mentom próby. W naszym przykładzie pierwsze sześć elementów próby ma nastę- pujące numery: 044, 602, 678, 895, 326, 959, ...; w przytoczonym wyżej fragmen- cie tablic liczb losowych zostały one wyróżnione drukiem półgrubym. 239 4.3. Odmiany schematów losowania próby Za Pawłowskim Z. (1972), Zasępą (1962), Greniem (1987) czy Blalockiem (1975) można wyróżnić następujące schematy losowania: (1) losowanie nieograniczone indywidualne, (2) losowanie systematyczne indywidualne, (3) losowanie warstwowe, (4) losowanie grupowe, (5) losowanie wielostopniowe. 4.3.1. Losowanie nieograniczone indywidualne Losowanie tego typu jest najprostszym sposobem doboru próby losowej. Jednakże jest ono mało efektywne i dlatego w praktyce badawczej stosuje się najczęściej inne rozwiązania. Decydujemy się na zastosowanie tego schematu losowania, gdy populacja, z której mamy pobrać próbę jest: (a) niezbyt duża, a jednocześnie mamy o niej mało dodatkowych informacji, (b) jest jednorodna (homogeniczna). Losowanie nieograniczone indywidualne polega na tym, iż próbę pobieramy z całej, nie podzielonej na części populacji. Jednostką losowania jest element po- pulacji (np. osoba). Losowanie przeprowadzamy w sposób bezzwrotny, gdyż jest to sposób najbardziej korzystny. Aby zastosować ten schemat musimy dysponować rzetelnym operatem loso- wania. Jako mechanizmu losowania możemy użyć tablic liczb losowych. Ten schemat losowania stosujemy na ogół w ostatnim etapie losowania wielo- stopniowego, np. warstwowo-indywidualnego. 4.3.2. Losowanie systematyczne indywidualne Schemat losowania systematycznego indywidualnego lub, jak się go inaczej nazy- wa, schemat losowania co &-ty element jest równie prosty pod względem techni- cznym, jak wyżej omówiony. Procedura losowania systematycznego indywidualne- go nie wymaga użycia tablic liczb losowych, co ułatwia pobór próby osobom nie obeznanym ze sposobem posługiwania się nimi oraz wydatnie skraca czas przezna- czony na pobór próby. J Załóżmy, że mamy populację o liczebności N elementów i chcemy z niej pobrać próbę o liczebności n elementów. Pierwszy krok to ustalenie tzw. odstępu losowania — k; jest to liczba całkowita, nie przekraczająca wartości ułamka: Nin. Drugą czynnością jest wybór losowy liczby naturalnej No odpowiadającej nastę- pującemu kryterium: J ^ No ^ k. Liczba No jednoznacznie określa pobraną próbę. Próba ta składa sjc ze wszystk/efi ełementów popuJac//, ktorycłr ni/merymż/i/a s/e wchodzą zatem następujące elementy (Pawłowski Z., 1972, s. 153): No; No + k; No + 2k; NQ + 3k; No + 4/fc; ... . Omawiany tu sposób pobierania próby jest szczególnie wygodny, gdy dyspo- nujemy jakimś gotowym spisem elementów populacji, np. wykazem uczniów w szkole. Schemat losowania systematycznego indywidualnego musimy jednak stoso- wać bardzo ostrożnie w sytuacjach, gdy podejrzewamy występowanie cyklicznych wahań badanej zmiennej. Może bowiem zdarzyć się tak, że długość cyklu odpo- wiada wielkości odstępu losowania k. Gdyby tak się stało, to każdy element próby odpowiadałby „szczytowi" albo „dołowi" wahań, czyli próba dostarczyłaby błęd- nych informacji o wartości zmiennej w populacji. Zakończmy omawianie schematu losowania systematycznego indywidualnego prostym przykładem. Przypuśćmy, że z N= 50-elementowej populacji chcemy po- brać próbę o liczebności n =10. Określamy wartość k: k = N/n = 50/10 = 5. A^ musi spełniać nierówność: 1«JVO^5. Niech No = 3. Wobec tego do próby wchodzą elementy o numerach: 3; 3 + 5; 3+10; 3 + 15; 3 + 20; 3 + 25; 3 + 30; 3 + 35; 3 + 40; 3 + 45. Operatem losowania jest ponumerowana lista wszystkich elementów populacji. 4.3.3. Losowanie warstwowe Gdy populacja wykazuje duże zróżnicowanie ze względu na badaną zmienną (np. przynależność do określonych grup zawodowych mieszkańców wielkiego miasta może się przedstawiać różnie w poszczególnych dzielnicach) losowanie nieograni- czone indywidualne może nam nie dać adekwatnego obrazu, gdyż pewne części populacji mogą być reprezentowane w próbie zbyt licznie, niedostatecznie. W takiej sytuacji zadawalającym schematem losowania jest taki, który uwzględniłby okre- ślone zróżnicowanie populacji przy doborze próby. Temu kryterium odpowiada schemat losowania warstwowego (ang. stratified sampling). Losowanie warstwowe polega na podzieleniu całej populacji na warstwy (ang. strata) i losowaniu w sposób niezależny z każdej warstwy określonej liczby ele- mentów. Podział populacji na warstwy musi być przeprowadzony w taki sposób, by każdy element wchodził do jednej i tylko jednej warstwy oraz by każdy element znalazł się w jakiejś warstwie. Mówiąc inaczej, podział musi być kompletny i rozłączny. Warstwy wyodrębniamy wg takiego kryterium, które w istotny sposób różnicuje populację pod względem badanej zmiennej. Takim istotnym kryterium it np. podział ludności wielkiego miasta na warstwy wg wysokości dochodów, ly interesuje nas standard życia mieszkańców. Należy dążyć do takiego powar- stwowania populacji, by warstwy różniły się między sobą poziomem badanej zmien- j, natomiast wewnątrz każdej warstwy zróżnicowanie pod względem wielkości tej zmiennej powinno być niewielkie. Mówiąc inaczej, należy: zminimalizować cję wewnątrzwarstwową i zmaksymalizować wariancję międzywarstwową. Nawet gdy mamy ustaloną wielkość próby, nadal otwartym problemem pozo-ije wielkość prób losowanych z warstw. Czy próby te powinny być równoliczne też różnoliczne? Mamy dwa sposoby określania tych wielkości, zwane: 16 — Metodologia badań.. 241 (a) wariantem proporcjonalnym, (b) wariantem optymalnym. Wariant proporcjonalny. Jak sama nazwa wskazuje, przy zastosowaniu wa- riantu proporcjonalnego losowania warstwowego wielkość prób losowych z warstw jest proporcjonalna do wielkości samych warstw. Jeżeli przez n określimy ogólną wielkość próby, na którą składają się próby o wielkości nw losowane z warstw, a przez pw proporcję elementów z danej warstwy w całej populacji, to wielkość próby, którą powinniśmy wylosować z warstwy można obliczyć wg wzoru: _ Przypuśćmy, że interesuje nas natężenie danej cechy osobowości, o której wiemy, iż jest skorelowana z płcią u osób chorych na nerwicę histeryczną. Chcąc otrzymać trafny obraz natężenia danej cechy, powinniśmy podzielić populację cho- rych na nerwicę histeryczną na dwie warstwy: mężczyzn i kobiet. Wielkość prób losowanych niezależnie z warstw powinna być proporcjonalna do wielkości samych warstw, czyli powinniśmy uwzględniać frakcję (proporcję) mężczyzn i kobiet cho- rych na nerwicę histeryczną. Obserwacje kliniczne wskazują, że na nerwicę histe- ryczną choruje znacznie więcej kobiet niż mężczyzn. Dobranie równolicznych prób z warstw dałoby w efekcie fałszywy obraz natężenia badanej cechy osobowości. Wariant optymalny. W wariancie optymalnym wielkość próby, która ma być wylosowana z każdej warstwy jest proporcjonalna nie tylko do wielkości samych warstw, ale także do wielkości odchylenia standardowego badanej zmiennej w określonej warstwie. Wariant ten został opracowany przez polskiego statystyka, Jerzego Spławę-Neymana w 1933 roku. Zastosowanie tego wariantu jest nieco skomplikowane technicznie, gdyż wymaga oszacowania wartości odchylenia stan- dardowego na podstawie badania wstępnych próbek. Dlatego też nie omawiam tego dokładniej. Wariant optymalny jest jednak zawsze bardziej korzystny od wariantu propor- cjonalnego w przypadku, gdy mamy oszacować tylko jeden parametr populacji. Jednakże w badaniach psychologicznych interesuje nas zazwyczaj oszacowanie wię- cej niż jednego parametru, a wtedy najprościej jest wybrać wariant proporcjonalny. Jest to jednocześnie najbardziej ostrożne rozwiązanie (Pawłowski Z., 1972, s. 90). Operatem losowania dla schematu losowania warstwowego jest ponumerowa- ny spis wszystkich elementów — oddzielnie dla każdej warstwy. Mechanizmem losowania mogą być np. tablice liczb losowych. 4.3.4. Losowanie grupowe Obok schematu losowania warstwowego najczęściej stosowany w praktyce jest schemat losowania grupowego (ang. cluster sampling). Cechą charakterystyczną tego schematu jest to, że jednostkami losowania nie są poszczególne elementy populacji, ale ich skupiska, czyli tzw. grupy. Schemat ten znajduje zastosowanie tam, gdzie populacja jest bardzo liczna i jednocześnie brak rzetelnego operatu losowania. W grę mogą wchodzić również 242 względy natury ekonomicznej. Rozważmy np. taką sytuację: chcemy wylosować próbę reprezentatywną z populacji liczącej kilka milionów osób. Po pierwsze, mie- libyśmy ogromne kłopoty ze sporządzeniem odpowiedniego operatu losowania i z posługiwaniem się nim. Po drugie, koszt takich badań byłby bardzo wysoki ze względu na pokrycie wydatków związanych z dotarciem do każdej osoby oddziel- nie. O wiele mniej wysiłku włożymy w dobór próby, jeżeli elementy populacji połączymy w zespoły wg określonego kryterium. Taki jeden zespół, zwany grupą, stanowi jednostkę losowania. Tak więc posługując się schematem losowania gru- powego, losujemy nie pojedyncze elementy, ale grupy. W zasadzie sposób tworze- nia grup jest dowolny; można jednak podać pewne zasady: (a) wskazane jest, by grupy były zróżnicowane wewnętrznie, czyli zmierzamy do zmaksymalizowania wariancji wewnątrzgrupowej; (b) należy dążyć do małego zróżnicowania między grupami, czyli zmierzać do zminimalizowania wariancji między grupowej; jeżeli wariancja między grupowa jest duża, to próba powinna składać się z dużej liczby grup wylosowanych z po pulacji również składającej się z dużej liczby grup; gdy wariancja międzygrupowa jest mała wystarczy nam liczba wylosowanych grup; (c) od tego, jak zdefiniujemy grupę (w definicji grupy zawarte jest również określenie jej wielkości oraz liczba grup w populacji) zależy efektywność schematu losowania; należy unikać czysto mechanicznego określania charakteru grup; (d) względy natury technicznej przemawiają za tym, by za grupę uznać zespól elementów populacji tworzących naturalny (w pewnym stopniu) zespół, np. gmina, wieś, szpital, szkoła, internat, klasa szkolna, kierunek studiów, budynek mieszkalny. Operatem losowania dla schematu losowania grupowego jest ponumerowany spis grup, a mechanizmem losowania mogą być tablice liczb losowych. 4.3.5. Losowanie wielostopniowe Schemat ten jest kombinacją omówionych już wyżej schematów losowania. W naj- prostszej wersji jest to schemat losowania dwustopniowego. W pierwszym etapie losowania dobieramy na podstawie odpowiedniego operatu losowania próbę złożo- ną z k grup (etap losowania grupowego). W drugim etapie sporządzamy dla każdej z ifc grup odrębny operat losowania i losujemy z każdej grupy pewną liczbę ele- mentów (etap losowania nieograniczonego indywidualnego). Oto sposób przeprowadzenia losowania wielostopniowego: etap 1. — warstwujemy populację, etap 2. — z każdej warstwy losujemy niezależnie, wg oddzielnych operatów losowania, pewną liczbę grup, etap 3. — z każdej grupy, w ramach każdej warstwy, oddzielnie losujemy zależnie pewną liczbę elementów (wg schematu nieograniczonego indywidualnego albo systematycznego). W losowaniu wielostopniowym zakładamy, że poszczególne losowania są od siebie niezależne. Mimo faktu, że losowanie wielostopniowe jest mniej efektywne od losowania grupowego jednostopniowego, względy natury praktycznej (łatwiej i6« 243 skonstruować odpowiednie operaty losowania, mniejszy koszt badania) decydują o tym, że wielu badaczy decyduje się na taki sposób doboru próby. Rozpatrzmy teraz, na przykładach, konkretne zastosowanie przedstawionego wyżej schematu losowania. Dobór uczniów klas VIII do próby z populacji uczniów tych klas szkół pod- stawowych dużego miasta można przeprowadzić wg schematu wielostopniowego: warstwowo-grupowo-indywidualnego. Traktujemy dzielnice miasta jako warstwy, a szkoły jako grupy. Rozporządzając spisem dzielnic w mieście, wykazem szkół w dzielnicach i spisem uczniów klas VIII, możemy na podstawie tablic liczb loso- wych prawidłowo przeprowadzić wylosowanie próby. Będzie to przebiegało wg następujących etapów: (1) wylosowanie z każdej dzielnicy k szkół, (2) wylosowanie z każdej szkoły np. jednej klasy VIII, (3) wylosowanie z każdej klasy VIII / ucz- niów. W badaniach Tyszkowej (1972, s. 127) np. wylosowano z 80 szkół podsta- wowych w Poznaniu 4 szkoły. Następnie z każdej wylosowanej szkoły losowano kolejno klasy, oddziały i dzieci. Według podobnego schematu dobrał próbę dzieci z klas I Rembowski (1972, s. 81). Z 73 szkół podstawowych w Gdańsku wylosował on 11, w których były łącznie 33 klasy I. Z każdej z 33 klas I losował w sposób systematyczny co trzecie dziecko, poshigując się dziennikiem lekcyjnym, jako ope- ratem losowania. 4.4. Testowanie losowości próby Po pobraniu elementów populacji do próby badacz powinien przystąpić do testo- wania hipotezy mówiącej o tym, że pobrana przez niego próba jest próbą losową. Mówiąc inaczej, chodzi tu o sprawdzenie, czy porządek (kolejność) w jakim po- szczególne elementy były pobierane z populacji jest porządkiem losowym. Do tego celu stosuje się test serii Walda-Wolfowitza (podaję go za: Siegel, 1956, s. 52-58; wybór testów przeznaczonych do weryfikacji hipotezy, że próba ma charakter lo- sowy zawarty jest w pracy Domańskiego, 1979, rozdz. 3.). Test ten oparty jest na teońi serii: „serią nazywamy każdy podciąg złożony z kolejnych elementów jed- nego rodzaju, utworzony w ciągu uporządkowanych w dowolny sposób elementów dwu rodzajów" (Greń, 1975, s. 139). Przypuśćmy, że badacz zainteresował się tym, czy wśród dzieci przebywają cych w przedszkolu i bawiących się w jednym pomieszczeniu występuje wyraźna przewaga jednej z płci (dziewczynek), jeżeli chodzi o zwracanie się o pomoc do wychowawczyni. W tym celu w obranym okresie notował on kolejno płeć dzieci zgłaszających się o pomoc do wychowawczyni (stosował oznaczenia: K dziew czynki, M — chłopcy). Uzyskał ciąg złożony z 30 elementów: XXX M X MM X MM XXXX M XX MM XX MM XX M XXXX Zgodnie z wyżej przytoczoną definicją serii mamy w naszym ciągu 30 ele- mentów aż 15 (k = 15) podciągów złożonych bądź z elementów K, bądź z elemen- tów M, czyli 15 serii. Czy ta liczba ?=15 serii świadczy o losowości prezentowa- nego tu porządku? Na to pytanie odpowiemy po zapoznaniu się z testem Walda-- Wolfowitza. Zastosujmy następujące oznaczenia: niech ni oznacza liczbę elementów jed- nego rodzaju w ciągu, a n2 liczbę elementów drugiego rodzaju; nx + n2 = N. Przez k oznaczać będziemy liczbę serii. Jest ona statystyką testu Walda-Wolfowitza. W tab. la i Ib (por. Dodatek A) podano wartości krytyczne statystyki k na poziomie a=0,05, gdy n2 *? 20 i nx =s 20. Odrzucamy hipotezę o losowości próby, gdy liczba serii jest równa lub mniejsza od wartości k' leżącej na przecięciu wiersza odpowia- dającego «] i kolumny odpowiadającej n2 w tab. la (zbyt mało serii), lub gdy liczba serii jest równa lub większa od wartości k" w tab. Ib (zbyt dużo serii). Jeżeli natomiast liczba serii jest większa od k' i jednocześnie mniejsza od k" to nie mamy podstaw do odrzucenia hipotezy o losowości próby. Zapiszmy to symbolicznie: (a) odrzucamy hipotezę o losowości próby: k^k lub ks* k", (b) nie mamy podstaw do odrzucenia hipotezy o losowości próby: k < k < k" . Wracając do naszego przykładu mamy: nx = 19, n2= 11, 19 + 11 = 30, k= 15. Z tab. la i Ib odczytujemy: k' = 9 i ifcH=21. Ponieważ zachodzi przypadek (b) 9 < k < 21, więc nie mamy podstaw do odrzucenia hipotezy o losowości zaob- serwowanego przez badacza porządku. W przypadku, gdy pomiar zmiennej zależnej przeprowadzany jest na skali porządkowej, przy wyznaczaniu liczby serii najlepiej posłużyć się wartością media- ny. W całej próbie wylosowanej z populacji wyznaczamy medianę (ME). Następnie respektując porządek, w jakim badacz włączał poszczególne elementy do próby sprawdzamy kolejno, czy dany wynik jest większy od mediany (jeżeli tak, to ozna- czamy go symbolem „+"), czy też mniejszy (jeżeli tak, to oznaczamy go symbolem „-"). Wyniki równe medianie odrzucamy. Przez nx oznaczmy liczbę „plusów", a przez n2 liczbę „minusów". W przypadku, gdy bądź nx bądź n2 jest większe od 20, stosujemy aproksymację rozkładu statystyki k do rozkładu normalnego ze średnią: + 1 i odchyleniem standardowym: n2 - «i - n2) n2 n2 Wartość statystyki z obliczamy wg wzoru: 245 z = Odrzucamy hipotezę o losowości próby na danym poziomie istotności staty- stycznej a, gdy: Z S= Za lub Z =5 -Za Na przykład: dla a = 0,05, z„= 1,96, a dla a = 0,01, z„ = 2,58. W przypadku, gdy: z < zo lub z > -za nie mamy podstaw do odrzucenia hipotezy o losowości próby. 4.5. Wyznaczanie niezbędnej wielkości próby — przykład ze schematem losowania nieograniczonego indywidualnego Badacz dokonujący oszacowania nieznanej wartości jakiegoś parametru populacji (np. średniej arytmetycznej, frakcji, współczynnika korelacji) chce zazwyczaj znać odpowiedź na pytanie: „Jak wielka powinna być próba, by umożliwiała uzasadnie- nie twierdzeń o populacji z określonym prawdopodobieństwem i w ramach okre- ślonego przedziału ufności?" (Nowak S., 1965b, s. 534). W zależności od tego, jakim schematem losowania badacz chce się posłużyć i jaki parametr populacji chce oszacować, wzór na obliczenie niezbędnej wielkości próby przyjmuje różną postać. Ponieważ jest on stosunkowo najprostszy dla wartości frakcji elementów wyróżnionych w populacji (tzw. wskaźnik struktury) w odniesieniu do schematu losowania nieograniczonego indywidualnego, więc tylko o tym wzorze będę tu mówił. Jeżeli Czytelnik zechce poznać wzory odpowiednie dla innych schematów losowania — odsyłam go do literatury, głównie do pracy Z. Pawłowskiego (1972), Grenia (1975, 1984), Zasępy (1962) czy Steczkowskiego (1995). Należy podkreślić, iż zaprezentowane w tym rozdziale schematy losowania opierają się na losowaniu zależnym (bezzwrotnym). Dlatego też w odpowiednich wzorach na estymatory parametrów populacji czy we wzorach przedziałów ufności uwzględnić należy tzw. poprawkę na bezzwrotność losowania, która przyjmuje po- stać: l-n/N, gdzie n — wielkość próby, N — wielkość populacji. Jednakże, gdy próba nie przekracza 5% populacji można poprawkę tę pominąć, gdyż nie ma ona wtedy praktycznego znaczenia (Pawłowski Z. 1972, s. 59). Między niezbędną wielkością próby pobraną w sposób zwrotny (nz) z popu- lacji o wielkości N i niezbędną wielkością próby pobranej w sposób bezzwrotny (nb) zachodzi następujący związek (tamże, s. 63): 246 Z powyższego wzoru wynika, iż zawsze nb < nz. Tak więc w przypadku za- stosowania przez badacza wariantu bezzwrotnego potrzebna jest mniejsza próba niż w przypadku zastosowania wariantu zwrotnego. Wzór na niezbędną wielkość próby (nb) przy oszacowaniu frakcji elementów wyróżnionych w populacji ma postać (J. Greń, 1975, s. 245): 1 + ~ źpą gdzie: N — liczebność populacji; p — spodziewany rząd wielkości szacowanej frakcji; q= 1 -p; za= 1,64 dla a = 0,10; 1,96 dla er = 0,05; 2,58 dla cr=0,01; d — dopuszczalny błąd szacunku frakcji p (podany w ułamku dziesiętnym). W odniesieniu do badanej populacji badacz nie zna frakcji elementów posia- dających daną cechę, czyli nie zna wartości wyrażenia: MIN (gdzie: M — liczba elementów posiadających daną cechę). Chce jej wartość oszacować na podstawie wartości frakcji w próbie. Jeżeli nie zna rzędu wielkości szacowanej frakcji, może za iloczyn pq we wzorze na nb przyjąć jego maksymalną wartość tj. 1/4. Otrzyma wtedy wzór przybliżony na nb: N Ad2(N-l) Rozważmy przykład zaczerpnięty z cytowanej już pracy Grenia (1975, s. 247): „W pewnej uczelni liczącej 5000 studentów należy za pomocą ankiety oszacować nieznany procent studentów, którzy kiedykolwiek byli za granicą. Ilu studentów tej uczelni należy wylosować niezależnie do próby, by przy współczynniku ufności 0,90 oszacować nieznany odsetek studentów, którzy byli za granicą, z maksymal- nym błędem 4%". Przy wyznaczaniu nb posłużymy się wzorem przybliżonym. W zadaniu podano następujące informacje: N= 5000; d = 4% = 0,04; P = 0,90; wobec tego: a= 1 -P= 1-0,90 = 0,10; zo,io= 1.64- Po podstawieniu powyższych danych do wzoru mamy: 390. 4 (0,04)2 (5000-1) 1,642 5000 1 + Do próby należy losowo pobrać z populacji 390 studentów. 247 5. Podsumowanie _&-- To, w jaki sposób dobrać próbę jest jedną z ważniejszych decyzji, które musi podjąć badacz planujący badanie empiryczne. Od reprezentatywności tej próby za- leżeć będzie trafność (dokładniej — trafność zewnętrzna) uzyskanych rezultatów badawczych (o czym pisałem w rozdz. 3.). Nie należy tedy lekceważyć tego etapu procesu badawczego. Warto włożyć sporo wysiłku i zaangażować znaczne środki finansowe w przygotowanie takiego układu próby, który uczyni zasadnym (z meto- dologicznego punktu widzenia) uogólnienie wniosków z przeprowadzonego badania na interesującą badacza populację. Jak już Czytelnik zdążył się zorientować, re- komenduję dobór losowy próby. Nie zawsze jednak badacz może sobie pozwolić na posłużenie się jednym ze schematów takiego doboru próby. W takiej sytuacji pozostaje mu próba kwotowa, musi jednak pamiętać o jej ograniczeniach. Czytelnika, który chciałby zgłębić wiadomości na temat doboru reprezenta- tywnej próby z populacji odsyłam do specjalistycznych opracowań tego problemu dostępnych w języku polskim: Steczkowski J. Metoda reprezentacyjna w badaniach zjawisk ekonomiczno-społecznych; Greń J. Statystyka matematyczna. Podręcznik programowany (rozdz. 1.-7.: Pojęcie statystycznej próby losowej); Pawłowski Z. Wstęp do statystycznej metody reprezentacyjnej; Zasępa R. Badania statystyczne metodą reprezentacyjną; Lissowski G. Z zagadnień doboru próby; Blalock H. M. Statystyka dla socjologów (rozdz. 22.: Dobór próby); Nowak S. (red.) Metody ba- dań socjologicznych. Wybór tekstów (część IV, rozdz. XVI: Dobór próby); Nowak S. Metodologia badań społecznych, (rozdz. 5., pkt. 6.: Uogólnianie rozkładów i zależności z reprezentatywnej próby na populację. Próby celowe i losowe); Domań- ski Cz. Statystyczne testy nieparametryczne (rozdz. 3.: Testy weryfikujące hipotezę, że próba ma charakter losowy); Zieliński R. Tablice statystyczne. (Tablica 62. Cyfry losowe; tablica zawiera 5 000 pięciocyfrowych liczb losowych) Rozdział io. Miary siły związku między zmiennymi — wybrane zagadnienia 1. Wprowadzenie Problem badawczy wyrażony w języku psychologicznym, np. „Czy i jak poziom sprawności funkcjonowania człowieka w danej sytuacji zadaniowej zależy od po- ziomu aktywacji jego organizmu?", może być przeformułowany i wyrażony w języku statystyki, np. „Czy zmienna «poziom sprawności funkcjonowania» koreluje ze zmienną «poziom aktywacji»?". Ponieważ w pytaniu jest mowa o korelacji dwóch zmiennych, więc — jak to najczęściej początkującemu badaczowi się wy- daje — wystarczy sięgnąć do podręcznika statystyki po , jakiś" wzór na współczyn- nik korelacji dwóch zmiennych (niejako automatycznie myśli się tu o współczyn- niku korelacji r-Pearsona) lub też przekazać dane do pracowni komputerowej („oni" już będą wiedzieli jaki wzór jest dla mnie dobry!) i po uzyskaniu informacji o wartości współczynnika korelacji przystąpić do jego merytorycznej interpretacji (tu: psychologicznej). Można by takie postępowanie zaakceptować, gdyby nie fakt, że nieobojętne jest, jakiego rodzaju zależność zachodzi pomiędzy zmienną A i zmienną B. Wyra- żając rzecz jeszcze dobitniej — aby zastosować jakiś współczynnik siły związku między zmiennymi, musimy wpierw sprawdzić, czy mamy do czynienia z: (a) zależnością liniową A i B, (b) zależnością krzywoliniową A i B. Współczynnik r-Pearsona jest współczynnikiem korelacji liniowej i jego uży- cie w przypadku stwierdzenia zależności nieliniowej (jak w przytoczonym na po- czątku pytaniu badawczym stanowiącym nieco zmienione pytanie Yerkesa i Do- dsona) jest — mówiąc oględnie — nadużyciem. W skrajnym przypadku możemy — z jego pomocą — stwierdzić brak zależności, gdy w rzeczywistości ona wystę- puje i to silna (por. analizę tego problemu przeprowadzoną w rozdz. 12.). Właściwy do rozwiązywania problemów krzywoliniowych zależności między zmiennymi jest współczynnik korelacji krzywoliniowej (stosunek korelacyjny) — eta-kwadrat (T/2). Traktuje o nim np. podręcznik Guilforda (1964), czy artykuł Szar- kowskiego (1968). Piszę też o nim w rozdz. 13. 249 2. Związek liniowy versus związek krzywoliniowy Podstawowym zatem pytaniem, na które powinien odpowiedzieć psycholog przy- stępujący do oceny siły związku między zmiennymi ilościowymi (ilorazowe lub interwałowe) jest pytanie następujące: „Czy hipotetyczny związek między dwo- ma zmiennymi jest związkiem liniowym?". Twierdząca odpowiedź na to pytanie upoważnia badacza do posłużenia się do oceny siły tego związku współczynni- kiem korelacji r-Pearsona (mierzy on jakość dopasowania prostej wyznaczonej me- todą najmniejszych kwadratów do danych empirycznych — por. rozdz. 13.). Od- powiedź przecząca przekreśla powyższe rozwiązanie i badacz musi odwołać się do wspomnianego współczynnika korelacji krzywoliniowej, tj. stosunku korelacyj- nego — rj1. W przypadkach niejasnych, w których trudno zdecydować czy najlepiej dopa- sowana do danych empirycznych będzie prosta, czy też krzywa, można przeprowa- dzić, z wykorzystaniem analizy wariancji, w układzie grup kompletnie zrandomi- zowanych (por. Brzeziński, Stachowski, 1984), badanie „liniowości" związku dwóch zmiennych. W przypadku testowania hipotezy postaci: Y=fiX) mamy do czynienia z co najmniej dwoma źródłami wariancji zmiennej Y. Jednym jest zmienna X — zda- niem badacza istotna dla Y. Drugim są zmienne pominięte przez badacza (inaczej: nie kontrolowane w danym badaniu i stanowiące o błędzie tego badania). Zatem wariancja zmiennej Y rozbija się na dwie wariancje cząstkowe: (a) wariancję „wyjaśnioną" wpływami X na Y, (b) wariancję „resztową", czyli wariancję błędu. W układzie jednoczynnikowej analizy wariancji dokonuje się podziału repre- zentacyjnej dla danej populacji próby na p grup porównawczych (nie mniej niż trzy! — aby możliwe było stwierdzenie krzywoliniowości związku Y i X). Każda z grup porównawczych poddana jest „działaniu" określonej wartości zmiennej X. Mogą to być np. różne instrukcje, wywołujące zróżnicowane natężenie lęku u osób badanych. Zakłada się przy tym, przypominam, że grupy różnią się między sobą tylko co do wartości zmiennej X, a osoby wewnątrz grup nie różnią się. Mówimy, iż grupy są homogeniczne. Dlatego też przyjęło się określać wariancję zmiennej Y tłumaczoną wpływami zmiennej X mianem wariancji między grupowej, a pozostałą część wariancji Y mianem wariancji wewnątrzgrupowej (jest ona miarą niejedno- rodności grup porównawczych). Mamy zatem: varY vaĄY\X) + var(Y\biąd) wariancja = wariancja + wariancja całkowita między grupowa wewnątrzgrupowa Wariancja „międzygrupowa" zmiennej Y może być wprowadzona w efekcie liniowej zależności Y od X (inaczej: średnie wartości zmiennej Y w poszczegól- nych grupach porównawczych „układają się" na linii prostej) lub też jakiejś krzy- woliniowej zależności Y od X (nie precyzując o jaką krzywą w danym przypadku 250 chodzi). Można tedy rozbić wariancję międzygrupową na tę część, która jest wy- jaśniona związkiem liniowym Y i X (regresja liniowa) i tę część, którą można tłumaczyć krzywoliniowością związku Y i X (odchylenie od regresji liniowej). Od- wołując się do metody analizy wariancji, można obiektywnie stwierdzić, czy zare- jestrowane odchylenie od regresji liniowej jest na tyle duże, że nie usprawiedliwia uznania związku Y i X za liniowy. 3. Metoda oceny „liniowości" i „odchylenia od liniowości" związku dwóch zmiennych Przedstawię teraz metodę rozstrzygania wyżej zarysowanego problemu (wg Haysa, 1973). Zakładam tutaj, że Czytelnik zna (w zakresie rozdziału pierwszego podrę- cznika Brzezińskiego i Stachowskiego, 1984) analizę wariancji dla układu grup kompletnie zrandomizowanych (układ jednoczynnikowy — KRG-p(n > 1)1). Zacznijmy od następującego przykładu. Grupę 50 pacjentów z danym rozpo- znaniem psychiatrycznym podzielono na p = 5 równolicznych (po n = 10 pacjentów) grup. Tym, co różniło te grupy między sobą, był poziom leku X (uwzględniono 5 poziomów: xu x2, x3, xA, x5). Pierwsza grupa otrzymała dawkę minimalną, a każda następna dawkę powiększoną w stosunku do poprzedniej o tę samą wielkość. Tak więc zachowano między grupami równe odstępy, jeśli chodzi o wartość (poziomy) zmiennej X. Pacjenci po upływie określonego czasu od momentu podania leku (od- cinek czasu był zawsze ten sam) rozwiązywali zadanie sprawnościowe oceniane na standardowej skali testowej (interwałowej) — zmienna Y. Pytanie brzmi: „Czy zacho- dzi związek między Y i X i jaka jest jego siła?". Wyniki badania prezentuje tab. 10.1. Tabela 10.1. Wyniki surowe eksperymentu n, =...= n5 = 10; p = 5. Wartości zmiennej zależnej Y w grupach porównawczych wyróżnionych ze względu na wartości zmiennej niezależnej X: xi,,...,jt5 Xl 8 14 10 16 13 19 17 13 12 18 24 26 29 23 30 32 25 20 14 22 7 15 11 16 14 15 19 12 15 22 20 22 25 20 29 30 27 17 14 18 30 31 35 33 40 41 38 27 40 46 suma 140 245 146 222 361 średnia 14,0 24,5 14,6 22,2 36,1 Źródło: obliczenia własne Kolumny oznaczone: xi,...,xs odpowiadają kolejnym grupom porównawczym 251 W efekcie przeprowadzenia analizy wariancji wedle układu KRG-p (n > 1) I dowiedzieliśmy się, że zmienna X wywiera istotny wpływ na Y. Informuje nas o tym wartość testu F, która znacznie przewyższa wartość krytyczną F dla poziomu istotności a =0,05 (a także dla a = 0,01) — por. tab. 10.2. Tabela 10.2. Tabela analizy wariancji KRG-p(n = 10)1 (do danych z tab. 10.1) Wariancja SS df MS F Fa, dfu d/2 0,05 0,01 międzygrupowa wewnątrzgrupowa 3234,68 1087,40 4 45 808,7 24,15 33,48 2,57 3,76 całkowita 4322,08 49 Źródło: obliczenia własne Rozbicie całkowitej sumy kwadratów (SScała) na cząstkowe sumy kwadratów, to jest na SS^^y^ oraz SSwewnątrzgr pokazuje kolumna SS w tab. 10.2. Aby odpowiedzieć na pytanie, czy Y pozostaje w związku liniowym czy też krzywoliniowym z X, musimy dokonać rozbicia sumy kwadratów międzygrupowej na cząstkowe sumy kwadratów związane ze „składnikiem liniowym" związku Y z X oraz ze „składnikiem krzywoliniowym" związku Y z X. A zatem (10.1): . CC lin. regr. '^ odchyl, lin. regr. SS cała (10.1) Zanim przejdziemy do obliczenia wartości SSiin regr. oraz SS^ty] lin regr przeprowadzimy wpierw obliczenia pomocnicze (podobnie jak przy analizie wa- riancji wedle układu: KRG-p (n>l)I). Przydadzą się one do obliczenia wartości SSiin. regr- Wróćmy tedy do naszego przykładu i danych zawartych w tab. 10.1. (5 ) (1) X E *M = CD (8) +•••+ CD (18) + (2) (24) +...+ (5) (30)+ ...+ (5) (46) = 3761. (2) j/wyc, = (10) (1) + (10) (2) +...+ (10) (5) = 150. h{ , i *V I. « I M„ ! «: ' fi . (3)(?nf x,)2 = 1502 = 22500. 1 ! ;J i I! p ( 4 ) ^ n r f = ( 1 0 ) ( I 2 ) + ( 1 0 ) ( 2 2 ) + . . . + ( 1 0 ) ( 5 2 ) = 5 5 0 . i = i P n . . . + 4 0 + 4 6 = 1 1 1 4 . E 1=1 k=l P gflb i=l k=l 252 Możemy teraz przystąpić do obliczenia cząstkowych sum kwadratów. W miej- sce (1) ... (5) podstawiamy do wzoru (10.2) wyliczone wartości pomocnicze: 3761, 150, 22500, 550, 1114. (5) (10) 3761- SS Iin.regr. pnUl) - (2) (5 pn ( 1 5 0 ( 1 1 1 4 ) \ 2 ( 5 ) ( 1 0 ) ) (50) (550)- 22500 = 1755,61 . (10.2) . - SSUn.regr. = 3234,68-1755,61 = 1479,07. Stopnie swobody (df) wynoszą: 4fiin.regr. = U ^/odchyl, lin. regr. = (P ~ 1) - 1 = (5 - 1) ~ 1 = 3. Tabela 10.3. Analiza wariancji KRG-p(n=10)I dla oceny liniowości związku Y i X (do danych z tab. 10.1) Wariancja SS df MS F Fa, d/u dfi 0,05 0,01 miedzygrupowa 3234,68 1755,61 1479,07 1087,40 4 1 3 45 1755,61 493,02 24,15 72,69 20,41 4,06 2,82 7,24 4,26 lin. regr. odchyl, lin. regr. wewnątrzgrupowa cała 4322,08 49 Źródło: obliczenia własne Uwaga: wartości krytyczne F podano w przybliżeniu Wniosek, jaki nasuwa przeprowadzona analiza wariancji jest taki, że wariancja zmiennej zależnej Y może być tłumaczona po części liniową zależnością Y od X, jak też, po części, nieliniową zależnością Y od X. Świadczą o tym wysokie wartości testu F, znacznie przewyższające wartości krytyczne dla poziomu er = 0,01. Osza- cujmy zatem procent wariancji zmiennej zależnej, który można by tłumaczyć linio- wym związkiem Y i X oraz procent wariancji zmiennej zależnej, który można by tłumaczyć jakimś nieliniowej postaci związkiem Y i X (jakim? — aby odpowiedzieć na to pytanie, trzeba by przeprowadzić bardziej dokładną analizę tzw. składników regresyjnych, wyższych stopni niż liniowy). Oszacowanie wariancji Y będącej udziałem „składnika liniowego" związku Y i X przeprowadzamy wg wzoru (10.3): var (ł1AOin.regr)) - _ SS^ regr - MSwewnątrzgr _ - , MS rała T 1V1OU ^wewnątrzgr. 1755,61-24,15 4322,08 + 24,15 = 0,39 ? 100% = 39%. (10.3) 253 Oszacowanie wariancji Y będącej udziałem „składnika krzywoliniowego" związku Y i X jest następujące (10.4): tr<' i' var (p 2) TS*i J u-.id«??J = 1479,07-(5-2) (24,15) = 4322,08 + 24,15 (10.4) Ogólnie związek Y z X tłumaczy następujący procent wariancji (10.5): var(Y\X) = var (yiX(lin.regr)) + var (yiX(odchyUin.regr)) = 39% + 32% = 71%. (10.5) Pozostałe: 100%-71% = 29% wariancji zmiennej Y tłumaczą wpływy na Y innych, nie kontrolowanych przez badacza, zmiennych niezależnych. Gdybyśmy nie przeprowadzili wyżej zaprezentowanej procedury i od razu przystąpili do oszacowania siły związku między zmiennymi Y i X (przy założeniu, że jest on liniowy) z pomocą współczynnika korelacji liniowej r-Pearsona, to uzys- kalibyśmy następujący wynik (wg wzoru na współczynnik korelacji liniowej obli- czany z danych z tabeli analizy wariancji): r = Oczywiście, można wyliczyć wartość r metodą „tradycyjną" wg wzoru (10.6): k=i ,«! 1 I- < J * ' , ? Wyrażenie z licznika: Y yk xk obliczamy następująco: (10.6) (8) (1) + (14) (1) + ... + (12) (1) + (18) (1) + (24) (2) + ... + (14) (2) + (22) (2) + ... + (30) (5) + (31) (5) + ... + (40) (5) + (46) (5) = 3761. n k= l n c = 8 + ... + 46 = 1114, x\-łh) n-{ \u miop njv\«MV dwą.;.1 ąi; ^ xk = 1 + ... + 1 + 2 + ... + 2 + 3 + ... + 3 + 4 + ... + 4 + 5 + ... + 5 = 150 = *=• = (10) (1) + (10) (2) + (10) (3) + (10) (4) + (10) (5) = 150, j>? 2 2 = 29142, 254 ? 4 = (10) (l2) + (10) (22) + (10) (32) + (10) (42) + (10) (52) = 550, k=i X^)2= U 142 = 1240996, X **)* =150* = 22500. = (50) (3761)-(1114) (150) V((50) (29142) - 1240996) ((50) (550) - 22500^ Jak widać, uzyskaliśmy dokładnie tę samą wartość. Z kolei współczynnik if (stosunek korelacyjny) pokazuje nam siłę związku (krzywoliniowego) zmiennych Y i X: Porównanie obu wyliczonych wartości r i 77 pokazuje wyraźnie, że w przy- padku zastosowania współczynnika korelacji liniowej popełnilibyśmy błąd (i to niemały — 0,865 versus 0,637) niedoszacowania siły związku między obiema zmiennymi. Jak to już zostało wyżej powiedziane, dany związek można opisać — biorąc pod uwagę kształt krzywej — za pomocą równania typu: Y = b0 + bxX\ + b2X\ +...+ hĄ. Jeżeli wszystkie współczynniki: b2, b3, ..., l\ są równe zero, a współczynniki: b0 i b\ są różne od zera, to uzyskujemy równanie prezentujące linię prostą, albo — inaczej — wielomian stopnia pierwszego. Jeżeli z kolei współczynniki: bo, bx, b2 są różne od zera, to uzyskujemy równanie reprezentujące wielomian stopnia dru- giego (parabolę), itd. Ogólnie rzecz biorąc, najwyższy wykładnik potęgi „iksa" określa nam stopień wielomianu. Wielomiany, o których tu mowa, cechuje bardzo ważna własność. Otóż stopień wielomianu informuje nas o liczbie punktów prze- gięcia krzywej najlepiej pasującej do danych empirycznych. Liczba ich równa się liczbie oznaczającej stopień wielomianu minus jeden. I tak, wielomian stopnia pier- wszego, wyrażony równaniem: Y = b0 + b}X, ma ,jeden minus jeden", czyli zero punktów przegięcia, a jego graficznym obrazem jest linia prosta. Rysunek 10.2 przedstawia równania stopnia: pierwszego (e), drugiego (f), trzeciego (g) i czwartego (h). Kropki na tych rysunkach symbolizują pojedyncze, hipotetyczne wyniki. Na tym samym rysunku, obok schematycznego ujęcia wielomianu danego stopnia, przed- stawiony jest wykres odnoszący się do danych z tab. 10.1, omówionych wyżej przy testowaniu liniowości związku Y i X oraz odchylenia od „liniowości" związku Y i X. Rysunek 10.2(a) stanowi powtórzenie rys. 10.1 i pokazuje najlepiej dopasowaną do danych empirycznych (reprezentowanych tu przez linię przerywaną łączącą 255 Y. 45" 40 35 30 25 20 15 10 5 14,0 24,5 14,6 22,2 36,1 Rys. 10.1 tab. 10.1 Dopasow anie wielomia nu stopnia pierwsze go (linii prostej) do danych empirycz nych z średnie wartości zmiennej zależnej dla poszczególnych wartości zmiennej niezależ- nej) linię prostą, czyli wielomian stopnia pierwszego (linia ciągła). Kolejne rysunki: (b)-(d) ukazują najlepiej dopasowaną do danych empirycznych krzywą wielomia- nową stopnia drugiego, trzeciego i czwartego. Wartości współczynników: b0, bu ..., b4 obliczono dokonując analizy (opartej na analizie wariancji) trendu między zmiennymi. Z opisem tej skomplikowanej metody analizy trendu Czytelnik może zapoznać się u Oktaby (1980), Kirka (1982) czy Winera (1971 — 2. wyd.; Winer, Brown, Michels, 1991 — 3. wyd.). Metoda ta ujęta jest w pakiecie statystycznym SPSS PC+ oraz CSS STATISTICA. Dość często zmienna zależna operacjonalizowana jest za pomocą testu psycholo- gicznego. Jeżeli wyników takiego testu nie można wyrazić na skali interwałowej, to na pewno można to zrobić na skali porządkowej. Zachodzi tedy potrzeba opracowania metodyki rozpoznawania krzywej obrazującej związek między zmienną Y i X, gdy ta pierwsza mierzona jest na skali porządkowej. Metodykę taką, odwołującą się do krzy- wych wielomianowych, opracowali Marascuilo i McSweeney (1967; omówienie z przykładami zawiera praca Brzezińskiego i Maruszewskiego, 1981). 4. Wybór optymalnej miary siły związku między zmiennymi Badacz, który chce ocenić siłę związku między zmiennymi za pomocą jakiegoś współczynnika siły związku między zmiennymi, stoi przed dość złożonym wybo- 256 r 45 40 35- 30 (a) 25- t * • 20 .—*^ 15 5- 1 y"=4,19X+9,71 (e) 46 40- 35- 30 (b) 25- 20- *• * 15- 10- 5- 1 Y ' I ./? -\ • I" "V • 0 J * VB)=-6,25X+1,74X2+21,89 O) ' = 46,38X-18,23X2+2,23X3-15,57 (h) JX 0 " = 211,66X-118,87X2+26,58X3-2,03X<-103,08| krzywa "empiryczna" krzywa wielomianowa Rys. 10.2. Dopasowanie wielomianów kolejnych stopni do danych empirycznych z tab. 10.1 Ile jest zmiennych? l 2 zmienne p(p>2) zmiennych I T - Jaka jest skala pomiarowa? Jaka jest skala pomiarowa? r * ?*? * nominalna porządkowa internatowa i ilorazowa porządkowa interwatowa i ilorazowa 1)(p-Yulea 2) Q - Kendalla 3) C - Pearsona 4) V - Cramera 5) T - Czuprowa 6) X - Goodmana i Kruskala 1)rk(t)- Kendalla 2) r, (p) - Spearmana 1)r-Pearsona 2)rf (stosunek korelacyjny) 1) współczynnik wielokrotnej korelacji ran-gowej- Kendalla 2) współczynnik korelacji czą- stkowej-Kendalla 1) współczynnik korelacji wielokrotnej-R- Pearsona 2) współczynnik korelacji czą- stkowej-Pearsona . ( c ) (d) Rys. 10.3. Algorytm wyboru współczynnika siły związku między zmiennymi w zależności od liczby zmiennych i skali pomiarowej zmiennych rem. Chcąc ułatwić Czytelnikowi podjęcie prawidłowej decyzji, podaję na rys. 10.3 algorytm wyboru optymalnego współczynnika siły związku między zmiennymi. Po- dane na tym rysunku bloki: (a)-(e) zawierają — rzecz jasna — najbardziej „repre- zentatywne" współczynniki. Przystępując do zastosowania jakiegoś współczynnika siły związku między zmiennymi, badacz powinien wykonać następujące kroki: krok 1: zebranie informacji dotyczących: (a) liczby zmiennych — dwie lub więcej, (b) skali pomiarowej zmiennych — jedna z czterech podanych przez Stevensa, (c) wielkości próby (AO, (d) charakteru zależności — liniowa versus krzywoliniowa; krok 2: pobranie próby z populacji; krok 3: dokonanie pomiaru zmiennych u poszczególnych osób badanych; krok 4: dobór współczynników odpowiadających kryteriom ustalonym w kro- ku 1. — pomocny tu będzie algorytm z rys. 10.3; krok 5: porównanie wybranych współczynników pod kątem ich ograniczeń i wybranie takiego, którego użycie byłoby obciążone jak najmniej- szym błędem; krok 6: wykonanie obliczeń; krok 7: przetestowanie hipotezy zerowej o braku zależności pomiędzy zmien- nymi — Ho : p - 0 za pomocą odpowiedniego testu istotności. Większe podręczniki statystyki — np. Blalocka (1975) — zawierają informa- cje o wymienionych na rys. 10.3 współczynnikach oraz o testach ich istotności. 258 5. Podsumowanie Ponieważ dobór odpowiedniego miernika siły związku między zmiennymi wymaga dobrej orientacji w różnego rodzaju współczynnikach siły związku między dwiema i większą liczbą zmiennych (co nie jest łatwe dla przeciętnego psychologa), więc rozdział ten miał ułatwić dokonanie takiego wyboru — zwłaszcza tych współczyn- ników, które w praktyce badawczej psychologów stosowane są najczęściej. Bardzo przydatny może się okazać dla Czytelnika algorytm wyboru optymal- nego miernika siły związku między zmiennymi, zaprezentowany na rys. 10.3. Kolejny ważny dla psychologów problem, to problem określania kształtu za- leżności między zmienną zależną i zmienną niezależną — liniowy versus krzywo- liniowy. W niniejszym rozdziale przedstawiona została jedna metoda, oparta na modelu analizy wariancji, określania kształtu związku między zmiennymi. Informacje o współczynnikach siły związku między zmiennymi znajdzie Czy- telnik w takich podręcznikach statystyki, jak: Blalock H. M. Statystyka dla socjo- logów (podręcznik ten zawiera omówienie współczynników siły związku między zmiennymi dla skali nominalnej: ę, C, T, V, Q, X — Goodmana i Kruskala — skali porządkowej: rs, rK, dla skali interwałowej i ilorazowej: r, R, korelacja cząstkowa); Góralski A. Metody opisu i wnioskowania statystycznego w psychologii; Guilford J. P. Podstawowe metody statystyczne w psychologii i pedagogice (m. in. współ- czynnik n2). Rozdziału. Testy istotności różnic — wybrane zagadnienia 1. Wprowadzenie Dyskusja, która toczy się — od czasu do czasu — na temat zastosowań testów istotności różnic (np. Henkel, Morrison, 1970; Cohen, 1990, 1994; Schmidt, 1995; Brzeziński, 1995c) w badaniach empirycznych w psychologii wciąga w krąg spo- rów najczęściej osoby reprezentujące dwa skrajne stanowiska. Z jednej bowiem strony wypowiadają się przeciwnicy wszelkiej kwantyfikacji w psychologii, uważający za bezsensowne posługiwanie się metodami statystyki przy opracowywaniu wyników badań empirycznych. Uważają oni, iż człowiek jest zbyt „skomplikowany", aby można było wyrazić jego osobowość, czy zachowanie, za pomocą jakichś tam „regułek statystycznych". Z kolei druga grupa uznaje tylko takie badania, w których wszystkie zmienne zostały skwantyfikowane, a wyniki badań poddane — niekiedy dość kunsztow- nej — analizie statystycznej (por. dla przykładu: Oleś, 1995). Przedstawiciele tej grupy są często zwolennikami zastosowań statystyki za wszelką cenę. Co wię- cej, uważają oni, że im bardziej wyrafinowanymi i skomplikowanymi testami statystycznymi (w rodzaju testów MAN0VA — na przykład) posłużą się, tym bardziej „naukowy" będzie przygotowywany przez nich raport z badań empi- rycznych. „Naukowe" spory toczą reprezentanci wyżej scharakteryzowanych obozów, natomiast trzecia, najliczniejsza grupa badaczy, po prostu stosuje, mniej lub bar- dziej udolnie, te testy. Takiej, dość niefrasobliwej, praktyce służy łatwo dostępne, przyjazne oprogramowanie komputerowe dużej grupy testów (np. SPSS PC+ czy SYSTAT). I tu dopiero rodzi się problem, gdyż obok dobrych (prawidłowych) zastosowań, pojawia się dużo, w mniejszym lub w większym stopniu, złych. Biorąc powyższe pod uwagę, wydaje się celowe przedstawienie wstępnych warunków, jakie badacz musi rozpoznać (w odniesieniu do materiału empiryczne- go), zanim przystąpi do stosowania jakiegokolwiek testu istotności. Każdy psycholog (badacz, czy też praktyk) powinien orientować się w zagad- nieniach zastosowań testów istotności na tyle, aby mógł swobodnie porozumieć się 260 z programistą czy też ekspertem od statystyki lub metodologii (bierna znajo- mość metodologii! — por. Wprowadzenie). Chodzi bowiem o to, aby wspólnie z nim mógł zaprogramować odpowiedni (do problemów i hipotez badawczych oraz specyfiki zebranego materiału empirycznego) tok postępowania w zakresie zastosowania metod statystycznych, a nie żeby zastępował komputer i znał różne sposoby na obliczenie wartości, np. współczynnika korelacji (i te skrócone, i te przybliżone — podawały je starsze wydania podręczników statystycznych, w okresie, gdy dostęp do komputerów miały tylko elity naukowe — por. np. Obli- czanie współczynnika korelacji Pearsona z wykresu rozrzutu, Guilford, 1964, s. 153-157). Przy planowaniu badań empirycznych i przygotowywaniu zebranego materiału empirycznego do przeprowadzenia jego analizy statystycznej z wykorzystaniem do tego celu testów istotności (np. istotności różnic między średnimi), należy zwrócić uwagę na kilka punktów — nazwijmy je krytycznymi — gdyż ułatwi to badaczowi dokonanie wyboru optymalnego rozwiązania. Postaram się teraz krótko scharakteryzować poszczególne punkty krytyczne, wskazać wzorcowe rozwiązania oraz omówić konsekwencje ich rozwiązań niewła- ściwych. Dalsze moje wywody nie będą zatem miały charakteru czysto opisowego, ale będą miały po części charakter normatywny. Nie będzie to więc opis niewła- ściwego (z metodologicznego i statystycznego punktu widzenia) postępowania psy- chologów. Będzie to natomiast próba udzielenia odpowiedzi na pytanie: jak postę- pować, aby postępować dobrze? 2. Warunki poprawnego stosowania testów istotności różnic w badaniach empirycznych 2.1. Respektowanie zasady randomizacji Na ogół jest tak, że badacz prowadzi badania naukowe na niewielkiej grupie osób badanych (próbie) stanowiących podzbiór znacznie liczniejszego zbioru osób tej samej kategorii (populacji). Rzecz jasna, że jeżeli chce on uogólnić wnioski wyni- kające z tego konkretnego badania na cały zbiór osób, to musi zagwarantować reprezentatywność próby dla populacji — pisałem o tym problemie i w rozdz. 3., pkt. 2. i w rozdz. 9. Jest rzeczą dowiedzioną — że przypomnę to, co już napisałem w rozdz. 9. — iż jedynie dobór losowy próby z populacji gwarantuje jej reprezen- tatywność. Jeżeli nie, losujemy, to w konsekwengjijue możgniy_uogólniać dokonanych _ustaleń_z^próby na populacje. Nierespektowanie pierwszej zasady randomiza- cji (czyli zasady losowego doboru próby z populacji) sprawia, że badanie empi- ryczne przeprowadzone na próbie utworzonej w sposób arbitralny cechuje ni- ska trafność zewnętrzna. Po prostu wnioski są prawomocne tylko dla uczniów 261 danej szkoły, studentów danego kierunku studiów (np. psychologii), pacjentów z danego szpitala czy z danego oddziału, osób z danego przedziału wieku, danej płci itp. Przy ocenie skuteczności metod nauczania, metod psychokorekcyjnych, od- działywania na opinię publiczną itp., powinniśmy badania przeprowadzać na co najmniej dwóch równoważnych grupach osób badanych — w celu znalezienia me- tody najbardziej skutecznej czy dla sprawdzenia skuteczności „nowej" metody w stosunku do „tradycyjnej". Rzecz w tym, aby decyzja o tym, jakiej metodzie od- działywania dana osoba ma być poddana, podejmowana była przez badacza w sposób losowy (np. badania efektywności technik psychoterapeutycznych — Selig- man M.E.P., 1995, s. 965; ewaluacja programów profilaktycznych — Hawkins, Nederhood, 1993, s. 41; badania edukacyjne — Jankowski, 1974); traktuje o tym druga zasada randomizacji. Ową drugą zasadę randomizacji zakładają wszystkie testy istotności różnic. W przypadku respektowania przez badacza drugiej zasady randomizacji, tzn. podzielenia losowo próby na p grup porównawczych, występowanie różnic między tymi grupami (dokładniej: między np. średnimi wartościami zmiennej zależnej) można będzie tłumaczyć w kategoriach zmiennej niezależnej-głównej (np. metody nauczania czy metody psychoterapeutycznej), przy czym badacz będzie mógł abs- trahować od wpływu czynników związanych z osobami badanymi (wpływ arbitral- nego doboru i rozdzielanie osób z próby na p grup porównawczych — por. rozdz. 12., pkt. 4.), czego nie mógłby zrobić w przypadku niestosowania się do zasady randomizacji. Mówiąc inaczej, badanie bez respektowania drugiej zasady randomi- zacji narażone jest na zakłócający trafność zewnętrzną wpływ czynnika selekcji (por. rozdz. 12., pkt. 4.). Nakaz respektowania zasady randomizacji podnoszony jest w opracowaniach takich autorów, jak: Fisher (1935), Oktaba (1966, 1980), Lehmann (1968), Basu (1980), Folks (1984) czy Johnstone (1989). 2.2. Grupy (dane) niezależne versus grupy (dane) zależne W badaniach empirycznych w psychologii (ale też w pedagogice, socjologii, psy- chiatrii) interesują nas dwa rodzaje porównań. Pierwszy rodzaj porównań wymaga dwóch (i większej liczby) grup, róż- niących się poziomami zmiennej niezależnej charakteryzującymi je w tym sa- mym czasie. W najprostszym przypadku mamy dwie grupy: kontijolną i eks- perymentalną. Drugi rodzaj porównań uwzględnia tę samą grupę osób, ale badaną wie- lokrotnie (co najmniej dwukrotnie) w czasie. Na przykład, badamy „wyjścio- wy" poziom lęku (tzw. pomiar początkowy, albo inaczej pretest) w grupie pa- cjentów przed przeprowadzeniem psychoterapii, następnie przeprowadzamy psychoterapię i powtórnie dokonujemy pomiaru poziomu lęku (tzw. pomiar koń- 262 cowy, albo inaczej posttest). Ten drugi pomiar może być pomiarem końcowym, ale może też być jednym z serii pomiarów poziomu lęku. W tego typu bada- niach każda osoba badana nie jest „źródłem" tylko jednego wyniku, ale „źród- łem" tylu wyników, ile pomiarów zmiennej zależnej badacz na niej przepro- wadził. W przypadku pierwszego rodzaju porównań mówimy o grupach niezależnych (ang. independent groups) lub danych niezależnych (ang. independent data). Z ko- lei w przypadku drugiego rodzaju porównań mówimy o grupach zależnych (ang. dependent groups) lub danych zależnych (ang. dependent data). W świetle powyższych uwag możemy cały zbiór testów istotności różnic po- dzielić na dwa podzbiory: (a) jeden obejmujący testy przeznaczone do testowania istotności różnic mię dzy grupami niezależnymi (testy dla danych niezależnych), (b) drugi obejmujący testy dla grup zależnych (testy dla danych zależnych). 2.3. Respektowanie założenia o rozkładzie zmiennej zależnej w populacji Wiadomo już, iż pierwszym warunkiem sensownego posługiwania się testami istot- ności różnic jest respektowanie pierwszej i drugiej (zwłaszcza) zasady randomiza- cji. Drugim warunkiem jest respektowanie kolejnego założenia, które obowiązuje dla części testów istotności różnic — założenia o charakterze rozkładu zmiennej zależnej. W związku z powyższym wszystkie testy istotności różnic można podzie- lić na dwie klasy: (a) pierwszą, obejmującą te testy, które traktują o istotności różnic wartości parametrów rozkładów zmiennej zależnej w porównywanych populacjach (śred- nich, wariancji), np. najczęściej stosowany przez psychologów (i nie tylko) test (- Studenta, (b) drugą, „obojętną" na wartości parametrów rozkładów zmiennej zależnej. Testy z pierwszej klasy to testy parametryczne, a pozostałe to testy nieparame- tryczne. Jeżeli więc chcemy testować istotność różnic między wartościami parametrów rozkładów zmiennej zależnej dwóch populacji, np. różnicę między średnimi warto- ściami poziomu lęku po psychoterapii — grupowej i indywidualnej — za pomocą testu parametrycznego (np. testu z), to musimy mieć gwarancję, iż rzeczywiście mamy do czynienia z rozkładami normalnymi poziomu lęku w obu porównywa- nych populacjach. Istnieją specjalne testy statystyczne pozwalające na ocenę zgodności danego rozkładu empirycznego z rozkładem modelowym. Do częściej stosowanych należą: test chi-kwadrat, test Kołmogorowa czy test Cramera-Smirnowa (por. Domański, 1979). Przed użyciem testu parametrycznego do testowania hipotez (postaci: Ho: H\ = fi2t Ho: a\ = 02 ) o różnicy wartości parametrów rozkładów zmiennej zależ- 263 nej w porównywanych populacjach niezbędne jest zbadanie, czy mamy do czynie- nia z rozkładami normalnymi interesujących nas cech w porównywanych popula- cjach. 2 . 4 . P r o b l e m h o m o g e n i c z n o ś c i ( j e d n o r o d n o ś c i ) p o r ó w n y w a n y c h g r u p To, co zostało dotych czas napisan e, może sugero wać, że najlepi ej — ze względ u na niepew ność związa ną ze spełnie niem założen ia o normal ności rozkład ów i trud- ności natury technic znej, jakie pociąga za sobą stosow anie testów zgodno ści roz- kładu empiry cznego z rozkład em normal nym — zrezygn ować z testów parame tryczny ch i od razu przejść do stosow ania (wyłąc znego) testów niepara metryc znych. Ot óż reakcja na taką sugesti ę musi być negaty wna. Genera lnie rzecz biorąc, testy niepara metryc zne są w porówn aniu z testami parame tryczny mi mniej skute- czne, tj. mają mniejsz ą zdolnoś ć odrzuce nia de facto fałszyw ych hipotez zerowy ch. Często mówi się o ich konser watyzm ie, czyli tendenc ji do nieodrz ucania Ho (jej zachow ania), gdy de facto jest ona fałszyw a. Jeżeli skutecz ność wzorco wego testu parame tryczne go oznacz ymy jako 100%, to niekied y, stosując bardzo proste testy niepara metryc zne, osiąga my jedynie 30- procent ową skutecz ność. Z drugiej strony są testy niepara metrycz ne, których skutecz ność zbliżon a jest do skutecz ności testów parame tryczny ch. Na przykła d skutecz ność testu [/- Manna- Whitne ya wynosi około 98% skutecz ności testu t. M ożna tedy sformuł ować następu jący wniose k. Gdziek olwiek to możliw e, po- winno się stosowa ć testy paramet ryczne (jako najskut eczniejs ze), jeżeli jednak jest to niemożl iwe (rozkład y nie są normal ne, albo znacząc o od normal ności odbiega ją), to wybiera my z puli testów niepara metrycz nych ten test, który można w danych warunk ach zastoso wać, i który cechuje stosunk owo najwyżs za skutecz ność w relacji do wzorco wego testu paramet ryczneg o. Jeżeli chodzi o praktyk ę badawc zą psy- chologii , to psychol og (zwłasz cza psychol og kliniczn y czy psychol og wycho waw- czy) będzie miał raczej rzadkie okazje do stosow ania testów parame tryczny ch (w rodzaju testu f). Jeżeli będzie jednak możliw e odwoła nie się do testu parame- tryczne go (w rodzaju testu F — analizy warianc ji), to należy to zrobić.' D o najbard ziej popula rnych testów parame tryczny ch należą: test t i test F. W obu przypa dkach wymag ana jest homog eniczno ść warianc ji rozkład ów zmienn ej zależne j w porówn ywany ch popula cjach. Niedop ełnieni e tego warunk u prowad zi do obciąż enia błędem rezulta tów testu t i testu F. Po dobnie jak w przypa dku założen ia normal ności rozkład ów zmienn ej zależ- nej, tak i tutaj przed przystą pienie m do stosow ania testu t i F musim y się upewni ć, czy warian cje są homog eniczne . Do tego celu służą specjal ne testy. Są to: test Hartley a, test Cochra na, test Bartlett a (ich omówi enie w: Brzezi ński, Stacho wski, 264 1984, rozdz. 3., pkt. 3.2.1: Testy homogeniczności wariancji — testy Hartleya, Cochrana i Bartletta, s. 119-133). W przypadku, gdy zastosowane testy wykazały heterogeniczność wariancji, to zamiast standardowego testu t musimy posłużyć się jednym z dwóch alternatyw- nych testów opracowanych w tym celu: testem Cochrana i Cox lub testem Welcha (por. Brzeziński, 1975a; Ferguson, Takane, 1989). Możemy jeszcze posłużyć się metodą transformacji wyników surowych nowej skali eliminującej ową heterogeni- czność wariancji. W znanym artykule; The use of transformation, Bartlett (1947) podał kilka podstawowych transformacji oraz określił sytuacje, w których celowe jest posłużenie się nimi. Kilka podstawowych transformacji, wraz z regułą wyboru optymalnej, z punktu widzenia struktury danych empirycznych, transformacji, za- prezentowano też w: Brzeziński, Stachowski (1984, rozdz. 3., pkt. 3.2.4.: Transfor- macja wyników surowych, s. 182-186). 2.5. Skala pomiarowa zmiennej zależnej Jak wiemy (por. rozdz. 7., pkt. 4.), Stevens opracował koncepcję pomiaru zmien- nych w naukach społecznych oraz podał klasyfikację skal pomiarowych. Wyróżnił on cztery rodzaje skal: nominalne (przykład: różnego rodzaju klasyfikacje), porząd- kowe (przykład: rangi), interwałowe (przykład: skala temperatury Celsjusza, stan- dardowe skale testów psychologicznych) i ilorazowe (przykład: skala temperatury KeMna, pomiar czasu, długości, masy). W zależności od tego, na jakiej skali wyrażony jest pomiar zmiennej zależ- nej, musimy wybrać test statystyczny z danej, dopuszczalnej przez dany poziom pomiaru, kategorii testów. I tak, testy parametryczne zakładają co najmniej poziom interwałowy pomiaru, a testy nieparametryczne dzielą się na dwie kla- sy. Jedna zakłada poziom porządkowy pomiaru zmiennej zależnej, np. test Wil- coxona. Druga klasa zakłada tylko poziom nominalny, np. test chi-kwadrat (j2). Przy wyborze testu statystycznego właściwego dla danego zbioru wyników i hi- potezy zerowej niezmiernie ważna jest więc znajomość skali pomiarowej zmiennej zależnej. 2.6. Liczba porównywanych grup Biorąc pod uwagę liczbę porównywanych grup (niezależnych i zależnych), można mówić o: (a) porównaniach dwóch grup, (b) porównaniach trzech i większej liczby grup. Rozwój metodologii badań empirycznych i statystyki prowadzi od koncepcji porównań dwugrupowych do koncepcji porównań wielogrupowych. Jednakże pra- ktykę badawczą cechuje pewna inercyjność i problemy, w których de facto chodzi o przepro wadzeni e porówn ań wielu grup, badacze sprowa dzają „na siłę" do pro- blemów porówn ań dwugru powych . Zamiast całościo wego porówn ania p- grupow e-go, badacze przepro wadzają — co jest nie tylko niepopr awne ze statysty cznego punktu widzeni a, ale także nieekon omiczne — p (p - 1):2 porówn ań dwugru powych. Przy podejści u „całości owym" badacz stosuje jeden test statysty czny przezna czony do przepro wadzani a tego rodzaju porówn ań (np. test Friedma na — skala porządk owa, dane zależne) . Dodatk owo stosuje jakiś test wielokr otnych porówn ań (np. oparty na statysty ce wspom nianego testu Friedm ana — por. Brzeziń ski, Marusz ewski, 1981) w celu wyelimi nowani a porówn ań nieistot nych. Jak zatem widzim y, już względ y natury ekonom icznej przema wiają za testami przezna czonym i dla wielu grup. 2.7. Duże N versus małe N Badania empiryczne prowadzone są na próbach o różnej liczebności. Często rodzi się pytanie, czy są ograniczenia „od dołu" wielkości grup porównawczych z uwagi na dany test istotności różnic, którym badacz chce się posłużyć. Tak, przy czym każdy test ma własne, „indywidualne" ograniczenia. Są testy, które są bardzo sku- teczne dla małych grup (np. test t) i są takie, które są przeznaczone dla dużych grup (np. test z). W każdym razie w „metryczce" danego testu podana jest minimalna wielkość grup porównawczych, przy której można go poprawnie stosować. Są też takie testy, które mają kilka wariantów dla różnych przedziałów wielkości grup. Na przykład test [/-Manna-Whitneya — jeżeli n2 >nx, to mamy trzy warianty: (1) 3 =? /i2 *? 8, (2) 9 =? n2 ^ 20, (3) n2 > 20. Musimy o tym pamiętać przy wyborze właściwego testu, czy też właściwego wariantu testu. * * * W punktach 2.1-2.7 przedstawione zostały kryteria wyboru testu istotności różnic adekwatnego do hipotezy badawczej i struktury danych empirycznych. Kry- teria te — powtórzmy — to: . (a) randomizacja I i II, (b) kształt rozkładu zmiennej, (c) homogeniczność wariancji rozkładów zmiennej zależnej, (d) skala pomiarowa zmiennej zależnej, (e) charakter grup porównawczych: niezależne versus zależne, (f) liczba porównywanych grup: 2 versus p (p>2), (g) wielkość grup porównawczych: duże N versus małe N. Nierespektowanie któregoś z siedmiu wyżej wymienionych kryteriów może wpędzić badacza w kłopoty metodologiczne. Warto o tym pamiętać! 266 Nie miejsce w tak krótkim i syntetycznym opracowaniu, jak rozdział w podręcz- niku z zakresu metodologii badań psychologicznych, na szczegółową charaktery- stykę poszczególnych testów — tym bardziej, że dostępne są w języku polskim opracowania, w których testy te, w sposób przystępny, są zaprezentowane. Ogra- niczę się tedy do podania krótkiej charakterystyki testów, które na rys. 11.1 zgru- powane są w blokach: (a)-(h). Jednocześnie przy każdym teście podam literaturę, dostępną w języku polskim, w której można będzie znaleźć pełne informacje o danym teście. (a)-(b) Test t oraz test z. Z uwagi na fakt, że psycholog prowadzi badania empiryczne na stosunkowo małych próbach, rozpocznę omówienie testów od testu r-Studenta, jako najbardziej reprezentatywnego testu parametrycznego, bardzo chęt- nie stosowanego przez psychologów. Test t znajduje zastosowanie w przypadku sprawdzania hipotezy o braku róż- nic między średnimi: y~\ i y2 obliczonymi dla dwóch małych prób o liczebności ri\ i «2 wylosowanych z populacji o rozkładach normalnych zmiennej zależnej: #i(/*i, a\), N2(ji2, <Ą)- Wartości <Ą i <Ą są badaczowi nie znane, ale zakłada się, że zachodzi: a\ = (Ą (warunek homogeniczności wariancji — por. pkt. 2.4.). W ich miejsce badacz wprowadza wartości: s\ i s2 uzyskane dla dwóch małych prób. Hipoteza zerowa przyjmuje postać: H0:nx-n2 = 0. Statystyka / obliczona według wzoru (11.1): 3. Wybór optymalnego testu statystycznego — grupy (dane) niezależne 3.1. Najbardziej rozpowszechnione testy statystyczne w praktyce badawczej psychologów t = + n2- 2\nl + n2 (11.1) ma — przy założeniu słuszności Ho — rozkład /-Studenta o stopniach swobody: df= «[ + n2 - 2. Odrzucamy Ho, na danym poziomie istotności a, jeżeli: \t\ > t^^ (test dwustronny), t 3= t^ (test prawostronny), t < -tajĘ (test lewostronny). W przypadku gdy badacz ma do czynienia z dużymi próbami, zastosowanie znajduje test z. Statystyka z dana wzorem (11.2): z = (11.2) przy założeniu słuszności Ho — ma rozkład normalny z fj. = 0 i a2 = 1. Odrzucamy Ho, na danym poziomie istotności a, jeżeli: Izl & Za/2 (test dwustronny), z s* za (test prawostronny), z =* -za (test lewostronny). 267 2 grupy Ile jest grup porównawczych? p(p>2) grup Jaka jest skala pomiarowa zmiennej zależnej V? Jaka jest skala pomiarowa zmiennej zależnej V? ilorazowa i interwałowa porządkowa nominalna ilorazowa i interwałowa porządkowa nominalna NIE Czy rozkład zmiennej zależnej jest normalny? J± L NIE TAK Czy rozkład zmiennej zależnej jest normalny? TAK Jaka jest wielkość grup porównawczych -n,? Czy wariancje są homoge- niczne? ?-',ii-y, iilrraion duża: n>30 mała: n<30 TAK NIE Czy wariancje są homo- geniczne? TAK NIE test z test f test: Coch-rana i Cox Welcha test: Manna- -Whitneya Kolmogo- rowa-- Smirnowa test: X2 dokładneg o prawdopo- dobieństwa -Fishera test: F analizy wariancji test: Kruskala- -Wallisa test: x2 (a) (b) (c) (d) (•) (0 (g) (h) Rys. 11.1. Algorytm wyboru testu istotności różnic — dane niezależne Literatura: Greń (1975, 1984), Oktaba (1966, 1980), Blalock (1975), Góralski (1980). (c) Test Cochrana i Cox oraz test Welcha. Testy te zastępują standardowy test t w sytuacji, gdy pogwałcone jest założenie homogeniczności wariancji rozkła- dów zmiennej zależnej porównywanych populacji. Literatura: Brzeziński (1975a) — test Cochrana i Cox, Oktaba (1966, 1980), Góralski (1980). (d) W tej grupie testów istotności chciałbym zapoznać Czytelnika z trzema testami. (d-1) Test U-Manna-Whitneya. Znajduje on zastosowanie w przypadku testo- wania różnic między rozkładami zmiennej zależnej w grupach o liczebności nx i «2 (w przypadku, gdy grupy nie są równoliczne przyjmuje się, że nx 20 W wersji (xxx) wykorzystuje się fakt, iż rozkład U z próby jest w przybliżeniu normalny, ze średnią — fiy i wariancją — a\j : , - nl n2 («1 +«2 + ~T2" Następnie oblicza się wartość statystyki z wg wzoru (11.7): _U-Hu Z~ 7T7, ' (11.5) (11.6) (11:7) //0 odrzucamy, gdy: Izl > z„/2 (test dwustronny), z > Za (test prawostronny), z ^ -za (test lewostronny). Literatura: Blalock (1975), Domański (1979). W pracy Blalocka (1975) oraz Jaworowskiej i Michalićka (1978) zawarty jest komplet tablic statystycznych dla wersji: (x) i (xx) testu U. (d-2) Test Kołmogorowa-Smirnowa. Test ten służy do sprawdzania hipotezy, że dwie próby o liczebnościach: n\ i n2 pochodzą z tej samej populacji. Zakłada się tu, że rozkłady zmiennej zależnej w porównywanych populacjach mają dystry- buanty ciągłe: Fx(y) i F2(y). Zatem hipoteza zerowa ma postać Ho: Fx(y) = F2(y). 269 Wyniki otrzyma ne z przebad ania nx + n2 osób podlega ją grupow aniu w stosunk owo wąskie przedzi ały — im więcej przedzi ałów zbuduje badacz, tym lepiej. Test Kołmog orowa- Smirno wa występ uje w następu jących wersjac h: (x) nx - n2 - n or az n ^ 40 (xx ) nx = n2 lub nx ^ n2 ora z nx > 40 lub n2 > 40 (xx x) nx * n2 ora z n2 < 40 (n2 > "i) Lit era tur a: Br zez ińs ki (19 75 a), Do ma ńs ki (19 79) . (d- 3) Test Walda- Wolfowi tza (test „serii") . Test ten służy do sprawdz ania hipotezy , że dwie próby o liczebno ści: nx i n2 pochodz ą z tej samej populacj i. Test oparty jest na rozkładz ie liczby serii. Wyniki nx + n2 osób porządk ujemy od wyniku najmnie jszego do najwięk szego. Oznacz amy symbol em a wyniki z próby nx, a symbol em b wyniki z próby n2. Następn ie odczytu jemy liczbę serii w tym ciągu. Na przykła d w ciągu: aaa bb a bb aa bbb a bb aaa 12 3 4 5 6 7 8 9 mamy k = 9 serii («, = 10, n2 = 9). ?*> "U i '^" ??^am* rioówb ,\ ffiwbi/iM w * Dja M] , „2 zawartych w przedziale 2-20 znajdujemy w specjalnie skonstruowanych tablicach (w Dodatkach do niniejszego podręcznika) dla różnych poziomów istotności krytyczną liczbę serii ka. Jeżeli: k ^ ka (test lewostronny), to odrzucamy Ho i uznajemy, że dwie próby pochodzą z de facto różnych populacji. Uwaga: hipotezę zerową odrzucamy tylko wówczas gdy liczba serii jest zbyt mała! Dla n2 > 20 (n2 > nx) rozkład statystyki k z próby jest w przybliżeniu normalny o średniej — fik i wariancji — (Ą : 2 *** * VH n1+n2 + 1- 8t«fcT<> %i ,/Olj.nn.j ? (11.8) , _ 2nx n2 (2nx n2-nx- n2) k (nx+n2 ?(nx+n 2-\) ' (11-9) Następnie obliczamy wartość z informującą nas o rozstępie, między rzeczywi- stą i przewidywaną przez Ho liczbą serii, wyrażonym w jednostkach odchylenia standardowego (11.10): i fjnitm&$ffiną jpi; „:. ^ (11.10) Odrzucamy Ho, jeżeli: z "S -Z Literatura: Blalock (1975), Greń (1975, 1984), Domański (1979). Test ten omówiony jest szczegółowo w rozdz. 9., pkt. 4.4 niniejszego podręcznika jako test losowości próby. (e) W tej grupie zaprezentuję dwa bardzo popularne testy. (e-1) Test niezależności chi-kwadrat (X2). Testem tym możemy posłużyć się w przypadku porównywania dwóch prób o liczebności nx i n2, pobranych niezależ- 270 nie z właściwych im populacji, gdy zmienna zależna-normalna ma postać klasyfi- kacji dwu- i więcej kategorialnej. Sporządza się tabelę o liczbie kolumn odpowia- dającej liczbie porównywanych prób (tu: dwie kolumny) i liczbie wierszy odpo- wiadającej liczbie kategorii zmiennej zależnej (tu: dwie i więcej). Tabela taka ma zatem wymiary: liczba wierszy (w) x liczba kolumn (p). Każda osoba badana z uwagi na przynależność do danej kategorii zmiennej zależnej i jednej z dwóch grup porównawczych może znaleźć się tylko w jednej kratce (polu) tabeli. Po sklasyfi- kowaniu w wyżej opisanej tabeli wszystkich nx + n2 osób badanych otrzymamy macierz liczebności empirycznych. Oprócz niej sporządzamy macierz liczebności teoretycznych (oczekiwanych). Każdej liczebności zaobserwowanej w poszczegól- nych polach macierzy liczebności empirycznych leżących na przecięciu /-tego wier- sza i y-tej kolumny (O,-,-) odpowiada liczebność teoretyczna (Etj) poszczególnych pól. Otrzymuje się ją przez pomnożenie liczebności brzegowej /-tego wiersza O, przez liczebność brzegową y-tej kolumny (Oj) i podzielenie otrzymanego rezultatu przez ogólną liczebność: n, + n2: Porównanie elementów obu macierzy można przeprowadzić za pomocą staty- styki chi-kwadrat (%2) danej wzorem (11.11): *? M (11.11) Odrzucamy Ho, jeżeli: x2 * %\df> gdzie: df (liczba stopni swobody = (w-1) (p-1), tu: (w-\) 2. W przypadku, gdy zmienna zależna jest dychotomiczna, mamy do czynienia z tabelą typu 2x2. Przy takich tabelach wymaga się, aby liczebności teoretyczne poszczególnych pól nie były mniejsze od 5. W przypadku tabel o liczbie pól więk- szej niż cztery dopuszcza się — zgodnie z tym co pisze Siegel (1956, s. 110) — nie więcej niż 20% pól o liczebnościach teoretycznych od 1 do 4. Literatura: Brzeziński (1975a), Blalock (1975), Greń (1975, 1984), Guilford (1964), Góralski (1980), Domański (1979), Jaworowska, Michalićka (1978). (e-2) Test dokładnego prawdopodobieństwa Fishera. Stosujemy go do tabel typu: 2x2, gdy jakaś liczebność teoretyczna Ey jest mniejsza od 5. Literatura: Blalock (1975). (f) Test F analizy wariancji. Ze względu na bogactwo zastosowań tego testu w badaniach empirycznych w psychologii oraz dostępność podręcznika analizy wa riancji adresowanego do psychologów odsyłam czytelnika do tej pracy (Zastoso wanie analizy wariancji w eksperymentalnych badaniach psychologicznych, Brze ziński, Stachowski, 1984). Literatura: Brzeziński, Stachowski (1984). (g) Test H-Kruskala-Wallisa. Test ten znajduje zastosowanie w warunkach badawczych podobnych do tych, w jakich znajduje zastosowanie test U Manna- 271 -Whitneya — z tą tylko różnicą, że przeznaczony on jest do testowania hipotezy zerowej mówiącej o pochodzeniu p (p > 2) prób z tej samej populacji. Po poran- gowaniu wyników — wg tych samych zasad co w teście Manna-Whitneya — obliczamy wartość statystyki H wg wzoru (11.12): (11.12) gdzie: /?, — suma rang w j-tej grupie porównawczej (i-tej kolumnie); AT = ny + n2 + + ... +np. Odrzucamy Ho, jeżeli H 5= Haflx_n . Wartości krytyczne H dla: n, «= 5 i & = 3 odczytujemy ze specjalnych tablic, które podają: Jaworowska i Michalićka (1978). Dla większych «, statystyka H ma w przybliżeniu rozkład j2 ze stopniami swobody df-p-l. Odrzucamy Ho, jeżeli: H 3* /^. W przypadku występowania rang wią- zanych stosujemy test H z odpowiednią poprawką. Literatura: Blalock (1975), Jaworowska, Michalićka (1978), Brzeziński, Ma- ruszewski (1981), Siegel (1956), Hollander i Wolfe (1973). (h) Test niezależności chi-kwadrat (y1). Analogicznie jak w (e-1), z tą różnicą, że tabela wyników składa się nie z dwóch kolumn, ale z p (p>2) kolumn o li- czebnościach brzegowych: Oi=nu O2=n2, ... ,Op-np. Literatura: jak w (e-1). 3.2. Algorytm wyboru optymalnego testu Przeprowadzanie badań empirycznych, w których badacz będzie dokonywał po- miaru zmiennej zależnej w grupach porównawczych różniących się poziomami zmiennej niezależnej, prowadzi do wyróżnienia dwóch rodzajów takich porównań, którym odpowiadają dwie grupy testów statystycznych: (a) obejmująca testy dla 2 grup porównawczych, (b) obejmująca testy dla p (p > 2) grup porównawczych. Odpowiedź na pytanie: „Ile jest grup porównawczych?" jest tedy pierwszą, ukierunkowującą poszukiwania testu istotności różnic, właściwego dla danej hipo- tezy roboczej. Pokazuje to również wyrysowany na rys. 11.1 algorytm wyboru testu istotności różnic. Niezależnie od tego, jaka będzie odpowiedź na pierwsze pytanie, psycholog musi rozstrzygnąć kwestię dotyczącą skali pomiarowej zmiennej zależnej (por. pkt. 2.5.). Rysunek 11.1 pokazuje, iż są tu trzy możliwości wyboru. Dwie z nich: skala porządkowa i skala nominalna prowadzą badacza wprost do danej klasy testów istotności: (d), (e), (g), (h) — przykładowo reprezentowanej przez najbardziej znane i najczęściej stosowane w praktyce badawczej psychologów klinicznych testy istot- ności. Trzecia odpowiedź: „skala ilorazowa i interwałowa" daje początek bardziej skomplikowanej drodze wyboru testu. Prowadzi ona do testów parametrycznych, a 272 te, jak wiemy z lektury pkt. 2.3. i 2.4., wymagają spełnienia przez materiał empi- ryczny dodatkowych założeń. Są one uwidocznione na rys. 11.1 w postaci pytań. Jedno z założeń dotyczy rozkładu w populacji analizowanej zmiennej zależnej. Jeżeli jest on normalny, to możemy zastosować test z grup: (a)-(c). Jeżeli tak nie jest, to musimy zastosować test z grupy (d). Następnie orientujemy się w liczebności grup. Jeżeli są one duże (tu za dolną granicę liczebności uznaje się: n = 30), to wybór pada na test z (przez niektórych autorów, np. Grenia (1975, 1984) określany mianem testu u). W przypadku małych grup odwołujemy się do testu /-Studenta. Ważnym założeniem, które musi być spełnione, aby posługiwanie się testem t było poprawne, jest założenie homogeniczności wariancji rozkładów zmiennej zależnej w porównywanych populacjach (por. pkt. 2.4.). To, czy wariancje są ho- mogeniczne, a tym samym czy mamy prawo posłużyć się testem t do sprawdzenia istotności różnic między średnimi w dwóch grupach porównawczych, okazuje się po zastosowaniu pomocniczego testu jednorodności wariancji (por. pkt. 2.4). Jeżeli wariancje nie są jednorodne, to — jak pokazuje blok (c) na rys. 11.1 — posłużyć się musimy testem Cochrana i Cox lub testem Welcha. Podobnie postępujemy w przypadku większej od 2 liczby grup porównawczych. 4. Wybór optymalnego testu statystycznego grupy (dane) zależne 4.1. Najbardziej rozpowszechnione testy statystyczne w praktyce badawczej psychologów Podobnie jak w pkt. 3. scharakteryzuję obecnie podstawowe testy statystyczne wy- szczególnione na rys. 11.2, w blokach: (a)-(g). (a)-(b) Test z oraz test t-Studenta. Rozpoczynam — tak jak w pkt. 3.1 — od bardziej popularnego i częściej wykorzystywanego przez psychologów testu t. Z je- go pomocą sprawdzamy hipotezę postaci: Ho: Ud - 0, tzn. średnia jud w populacji różnic równa jest zero. Zakłada się tu, że z danej populacji podlega losowaniu mała próba o liczebności n. Każda osoba badana jest dwukrotnie — przed i po postępo- waniu eksperymentalnym (np. psychoterapii). Dla każdej fc-tej osoby badanej oblicza się różnicę: dk = yik - y2k- Zakłada się, że rozkład wartości d w populacji jest nor- malny. Nieznaną wartość wariancji tego rozkładu badacz zastępuje wartością sd ob- liczoną dla małej próby. Statystyka t przyjmuje postać daną wzorem (11.13): t = dj ~i ' (11.13) gdzie: d — średnia różnic obliczona dla n par wyników; d ma — przy założeniu słuszności Ho — rozkład f-Studenta o stopniach swobody df-n- 1. Odrzucamy 18 — Metodologia badań. 273 Ile jest grup porównawczych? 2 grupy p(p>2) grup Jaka jest skala pomiarow a zmiennej zależnej Y? Jaka jest skala pomiarow a zmiennej zależnej V? ilorazowa i interwałow a porządkow a nominalna ilorazowa i interwałowa porządkow a nominalna Czy rozkład zmiennej za- leżnej jest normalny? Czy rozkład różnic d jest normalny? ZŁ TAK NIE TAK NIE Jaka jest wielkość grupy- n? Czy macierz wanancji-- kowariancji jest równa i syme- tryczna? 1 duża: n>30 mała: n,s30 TAK NIE konserwatywny test F lub T2 test z test t test Wilco- xona test McNe- mara test F analizy wariancji test Fried- mana test Cochrana (a) (b) (c) (d) (e) Rys. 11.2. Algorytm wyboru testu istotności różnic — dane zależne (ł) (9) Ho, jeżeli: Ifl > taadf (test dwustronny), t > tadf (test prawostronny), t « -t^ą (test lewostronny). W przypadku, gdy n jest duże, korzystamy z testu z dla danych zależnych. Literatura: Oktaba (1966, 1980), Blalock (1975), Guilford (1964), Greń (1984). (c) Test T-Wilcoxona. Z populacji losujemy próbę n-elementową. Dla każdej z n osób dokonujemy pomiaru zmiennej zależnej przed i po wprowadzeniu postę- powania eksperymentalnego. Następnie obliczamy dla &-tej osoby wartość różnicy: dk = yu ~ yik- P° wyeliminowaniu z dalszych analiz par wyników, dla których dk - 0, rangujemy bezwzględne wartości różnic, tj. \dk\ od wartości najniższej do najwyższej. Następnie oddzielnie sumujemy te rangi, które zostały przypisane róż- nicom: dk > 0 i oddzielnie te rangi, które zostały przypisane różnicom: dk < 0. 274 Mniejsza z dwóch sum stanowi statystykę T. Hipoteza zerowa zakłada, że suma rang różnic o ujemnym znaku jest równa sumie rang różnic o znaku dodatnim, czyli T równe jest połowie całkowitej sumy rang. Im bardziej otrzymana wartość T odbiega od zakładanej przez Ho wartości T, tym bardziej zwiększają się szansę odrzucenia Ho. Tak więc odrzucamy Ho, gdy T =s Ta. Test T występuje w dwóch wariantach: (x) dla liczby par o dk*0, która zawiera się w przedziale: 6-25. Wartości krytyczne statystyki T zawarte są w specjalnych tablicach statystycznych (por. literatura). (xx) dla liczby par o dk*0, które przewyższą 25, rozkład T z próby jest w przybliżeniu normalny o średniej //, i wariancji (Ą (n > 25): _n(n+l)(2n 24 CFT — Następnie obliczamy wartość statystyki z ze wzoru (11.14): T-M, oT (11.14) a Ho odrzucamy, gdy: Izl * Zan (test dwustronny), z> za (test prawostronny), z ^-za (test lewostronny). Literatura: Brzeziński (1975a), Jaworowska, Michalićka (1978), Blalock (1975), Domański (1978). (d) Test McNemara. Test ten stosujemy w analogicznych warunkach jak test Wilcoxona, z tą tylko różnicą, że zmienna zależna mierzona jest na skali nominal- nej. Dokładniej traktuje się ją jako dychotomiczną („0-1"). Każdą z n osób ocenia się dwukrotnie: przed i po (brak poprawy — poprawa) wprowadzeniu postępowania eksperymentalnego. Następnie sporządzamy tabelę typu: 2x2: „po a b c d „przed" a + b c + d n a + c b + d Hipoteza zerowa mówi, iż połowa zmian: (a+d):2 będzie typu: 1-0, a połowa typu: 0-1. Mówiąc inaczej, oddziaływanie psychologa (np. psychoterapeuty) nie ma wpływu na zmienną zależną. Następnie obliczamy wartość statystyki ??? wg wzoru (11.15): (11.15) , (la-dl-I)2 „ , Odrzucamy Ho, jeżeli: X2 > ń# Możemy korzystać z powyższego wzoru, jeżeli [(a + d): 2] > 5. Literatura: Brzeziński (1975a), Jaworowska, Michalićka (1978), Siegel (1956). (e) Test F — analizy wariancji. Por. pkt. 3.1 — blok (f). W przypadku jednak 18* 275 (tu omawianym) grup zależnych badacz musi sprawdzić czy spełnione jest dodat- kowe założenie o symetrii i równości macierzy wariancji-kowariancji (por. Brze- ziński, Stachowski, 1984, s. 133-159). Gdy zastosowane testy Boxa (1950; także: Brzeziński, Stachowski, 1984, s. 146-159) dadzą wynik negatywny, to badacz po- winien odwołać się do tzw. testu konserwatywnego F i dokładnego testu T2-Hotel- linga (tamże, s. 159-164 — por. zwłaszcza rys. 3.1, s. 161). (f) Test S-Friedmana. Testem tym posługujemy się w podobnych warunkach (inna jest tylko liczba przeprowadzanych pomiarów na każdej osobie badanej) jak te, w których znajduje zastosowanie test T-Wilcoxona. Tutaj wylosowaną z popu- lacji próbę poddajemy działaniu p (p > 2) warunków eksperymentalnych (np. p spotkań terapeutycznych kończących się pomiarem poziomu samoakceptacji lub poziomu lęku społecznego). Wyniki umieszczamy w tabeli o liczbie wierszy odpo- wiadającej liczbie osób i liczbie kolumn odpowiadającej liczbie przeprowadzonych na każdej osobie pomiarów zmiennej zależnej. Następnie rangujemy wyniki (dla każdej osoby oddzielnie) — od wyniku najniższego do najwyższego. W kolejnym kroku obliczamy wartość statystyki S wg wzoru (11.16): S = 12 np (p + 1) U- 3n(p+l), (11.16) gdzie: Rt — suma rang w /-tym pomiarze zmiennej zależnej (Mej kolumnie tabeli wynikowej). Odrzucamy Ho, o pochodzeniu p prób z tej samej populacji, jeżeli: 5 s= S(cr, p, ń). Wartości krytyczne statystyki 5 dla: (a) * = 3in = 2,...,13, (b) k = 4 i n = 2,..., 8, (c) k = 5 i n = 3, ..., 5, zawarte są w specjalnych tablicach, które podają Jaworowska i Michalićka (1978). Dla większych n statystyka S ma w przybliżeniu rozkład x2 ze stopniami swobody df=p - 1. Odrzucamy Ho, jeżeli 5^-3= Xa,df ? W przypadku występowania rang wią- zanych stosujemy test S z odpowiednią poprawką. Literatura: Blalock (1975), Jaworowska, Michalićka (1978), Brzeziński, Ma- ruszewski (1981). (g) Test Q-Cochrana. W przypadku testu McNemary traktowano zmienną za- leżną jako dychotomiczną, a jej pomiaru dokonywano dwukrotnie: „przed" i „po". Tutaj także traktuje się zmienną zależną jako „0-1" punktową, ale dokonuje się całej serii — p (p > 2) — pomiarów. Wyniki zapisuje się w tabeli o liczbie wierszy odpowiadającej liczbie przebadanych osób oraz liczbie kolumn odpowiadającej li- czbie pomiarów zmiennej zależnej. Wyniki wpisuje się w postaci „0-1". Wartość statystyki Q oblicza się wg wzoru (11.17): (11.17) ?„w*,Ui.t >> . J./.^ ._... , *=i 276 gdzie: yL — suma wyników w /-tym pomiarze (/-tej kolumnie) zmiennej zależnej; yk — suma wyników dla &-tej osoby badanej (?-tego wiersza). Jeżeli n nie jest zbyt małe, to Q ma w przybliżeniu rozkład X1, ze stopniami swobody df-p- 1. Odrzucamy Ho jeżeli: Q 5= xl^f • Literatura: Jaworowska, Michalićka (1978). 4.2. Algorytm wyboru optymalnego testu ? W pkt. 3.1 zapoznaliśmy się z zasadami postępowania badacza w sytuacji wyboru optymalnego testu istotności różnic. To, co jednak różni opisane tam postępowanie przy dokonywaniu wyboru optymalnego, do charakteru danych empirycznych testu, od postępowania opisanego w tym punkcie, to charakter grup porównawczych. W pierwszym przypadku mówiło się bowiem o grupach (danych) niezależnych. Tutaj natomiast mówi się o grupach (danych) zależnych. Najczęstszą sytuacją badawczą, w której badacz, psycholog czy pedagog, spo- tyka się z danymi zależnymi, jest sytuacja empirycznej kontroli skuteczności róż- norakich zabiegów psychokorekcyjnych (różne odmiany psychoterapii, oddziaływa- nia o charakterze rehabilitacyjnym, itp.) czy edukacyjnych. Praktyka badawcza psy- chologii pokazuje, iż dane zależne można w opisanej wyżej sytuacji uzyskać w dwojaki sposób: (a) przez porównanie stanu „początkowego" ze stanem „końcowym" zmiennej zależnej, przy czym pomiary tej zmiennej przeprowadzane są na tej samej grupie osób badanych (albo na grupach równoważnych, uzyskanych metodą „doboru pa rami" — por. rozdz. 12., pkt. 2.2.1); (b) przez przeprowadzenie serii p(p>2) porównań stanów zmiennej zależnej: „pierwszego", „drugiego", ..., „ostatniego", przy czym pomiary te są przeprowa dzane na tej samej grupie (lub p grupach równoważnych). W efekcie takiego rozróżnienia mamy dwa podzbiory testów. Algorytm wyboru testu istotności dla danych zależnych pokazuje rys. 11.2. Jest on skonstruowany podobnie jak algorytm z rys. 11.1 (por. jego opis w pkt. 3.2). 5. Podsumowanie Psychologowie testując hipotezy statystyczne stosunkowo często sięgają po testy nieparametryczne — z uwagi na niezbyt doskonałe narzędzia pomiarowe, gwaran- tujące pomiar zmiennych dość często co najwyżej na poziomie skali porządkowej, a bardzo rzadko na poziomie skali interwałowej. Stąd bardzo bogata literatura do- tycząca testów nieparametrycznych. Trzeba jednak pamiętać, że nie zawsze wybór testu nieparametrycznego jest wyborem trafnym. Jest to wybór nietrafny, gdy ba- dacz może posłużyć się — bo pozwala na to natura pomiarowa zmiennej oraz 277 charakter rozkładu zmiennej zależnej w populacji — odpowiednim testem parame- trycznym. Ponieważ dobór odpowiedniego testu istotności różnic nie jest zadaniem łatwym dla psychologa nie dysponującego odpowiednim doświadczeniem w tym zakresie, więc rozdział ten stanowił, w intencji autora, rodzaj przewodnika po te- stach istotności różnic — zwłaszcza tych, które najczęściej stosowane są w praktyce badawczej psychologów. Czytelnikowi zainteresowanemu testami nieparametrycznymi polecam książkę zawierającą bogaty ich wybór: Domański Cz. Statystyczne testy nieparametryczne. Wybór testów nieparametrycznych przedstawia też artykuł (zawierający rów- nież komplet tablic statystycznych do prezentowanych testów): Jaworowska A., Michalidka M. Zastosowanie niektórych testów nieparametrycznych w badaniach psychologicznych i pedagogicznych. Warto sięgnąć też do podręczników: Góralski A. Metody opisu i wnioskowania statystycznego w psychologii (rozdz. 10.: Testy istotności dotyczące miar położenia); Guilford J. P. Podstawowe metody statystyczne w psychologii i pedagogice. Testy parametryczne, takie jak test z i test t, przedstawione zostały — poza podręcznikami Góralskiego i Guilforda — w: Greń J. Statystyka matematyczna — modele i zadania; Blalock H. M. Statystyka dla socjologów (podręcznik ten zawiera także omówienie kilku najbardziej rozpowszechnionych testów nieparametrycz- nych). Analizę wariancji (test F) w zastosowaniach do eksperymentalnych badań psy- chologicznych przedstawiają: Brzeziński J., Stachowski R. Zastosowanie analizy wariancji w eksperymentalnych badaniach psychologicznych. Nieparametryczną analizę trendu między zmiennymi (zmienna zależna mierzona na skali porządkowej) omawiają: Brzeziński J., Maruszewski T. Nieparametryczne analizy statystyczne w protoidealizacyjnym modelu nauki. - ? modele sprawdzania hipotez ? ? W czwartym kroku procesu badawczego (por. rozdz.l. pkt 6.) psycholog musi dokonać wyboru modelu badawczego, zgodnie z którym przeprowadzi badania em- piryczne nastawione na sprawdzanie hipotezy badawczej. Jak sądzę, pierwszym, podstawowym kryterium wyróżniania różnych podejść (modeli) badawczych jest kryterium manipulacji zmienną (zmiennymi) niezależną-- główną (niezależnymi-głównymi). Możemy tedy wyróżnić dwie klasy modeli ba- dawczych: (at) zakładające manipulację co najmniej jedną zmienną niezależną, (a2) wykluczające manipulację zmiennymi niezależnymi. Drugim z kolei kryterium jest kryterium jednoczesności oddziaływania zmien- nej X na zmienną Y oraz pomiaru skutków tego oddziaływania. I w tym przypadku wyróżnić możemy dwie odmiany modeli: (bO zakładające równoczesność oddziaływania jednej zmiennej na drugą oraz pomiaru skutków tego oddziaływania; w momencie oddziaływania zmiennej X na zmienną Y („dziś") badacz dokonuje pomiaru skutków tego oddziaływania (także „dziś"); (b2) zakładające przesunięcie w czasie oddziaływania zmiennej X na zmienną Y oraz pomiaru skutków tego oddziaływania. Jeśli chodzi o b2, to umownie przyjmujemy, iż możemy mieć do czynienia z dwiema możliwościami: (b2-l) „wczoraj-dziś" — zmienna X oddziaływała na zmienną Y w mniej lub bardziej odległej przeszłości („wczoraj"), przez krótszy lub dłuższy okres czasu, a badacz „dziś" (tzw. posttest) próbuje dokonać identyfikacji owej zmiennej oraz określić wielkość tego oddziaływania; (t>2-2) „dziś-jutro" — zmienna X oddziałuje na zmienną Y w momencie okre- ślonym przez badacza („dziś"), który jednocześnie (bezpośrednio po, czyli ,jutro" — posttest — albo także w trakcie — tzw. intertest) dokonuje pomiaru skutków tego oddziaływania; dość często badacz dokonuje także pomiaru zmiennej Y bez- pośrednio przed — tzw. pretest. Model badawczy, który zakłada manipulację co najmniej jedną zmienną nie- zależną, czyli al5 to model eksperymentalny (będzie o nim mowa w rozdz. 12.). Modele, które owej manipulacji nie zakładają, czyli a2, to: model wielokrot- nej regresji, też znany jako model korelacyjny (takiego określenia użył Cron- bach, 1957, 1975) czy jako model wielokrotnej regresji/korelacji, MCR (wg Cohen i Cohena, 1983 — multiple regression/correlation model) — będzie o nim mowa w rozdz. 13. — oraz model ex post facto (będzie o nim mowa w rozdz. 14.). W przypadku modelu ex post facto jest to badanie typu „wczoraj-- dziś" (b2-l). Z kolei model eksperymentalny mieści się w schemacie badania „dziś- jutro" (b2-2). W przypadku modelu wielokrotnej regresji jest to badanie typu „dziś-dziś" (bi). Schematycznie owe trzy odmiany modeli badawczych wykorzystywanych w praktyce badawczej psychologów zostały przedstawione na rys. IV. 1. 280 oddziaływanie zmiana „i r ! Y oddziaływanie pomiar oddziaływanie zmiana y ; identyfikacja pomiar pomiar czas "wczoraj" "dziś" badanie symultaniczne "dziś"(X) - "dziś"(Y) "jutro" badanie retrospektywne "wczoraj"(X) - "dziś"(Y) badacz badanie prognostyczne "dziś"(X)-"jutro"(Y) Rys. IV. 1. Odmiany modeli badawczych, wyróżnione w zależności od czasu zadziałania zmiennej niezależnej X na zmienną zależną Y oraz czasu dokonania pomiaru skutków tego oddziaływania Rozdział 12. Model eksperymentalny (E) 1. Wprowadzenie O dojrzałości danej dyscypliny empirycznej świadczy to, w jakim stopniu formu- łowane w jej obrębie hipotezy sprawdzane są na drodze eksperymentalnej. Najbar- dziej pod tym względem zaawansowana jest fizyka, a stosunkowo mniej psycho- logia. Jak pisze Kozielecki (1995, s. 284), jest ona nadal dyscypliną „rozwijającą się". Jeśli chodzi o psychologię, a zwłaszcza o niektóre jej działy, takie jak psy- chofizyka, psychologia uczenia się i pamięci, psychologia emocji czy psychologi- czna teoria decyzji, to prawie wszystkie hipotezy wysuwane przez badaczy spraw- dzane są w warunkach eksperymentu laboratoryjnego. Niemniej psycholog klinicz- ny czy psycholog wychowawczy jeszcze niezbyt często odwołują się, w praktyce badawczej, do eksperymentu jako metody uzasadniania hipotez roboczych. Nadal dominującym w ich warsztacie badawczym pozostaje opisany w rozdz. 14. model ex post facto. Coraz więcej jednak psychologów sięga po eksperyment jako najbar- dziej efektywną metodę sprawdzania — w warunkach kontrolowanych! — hipotez badawczych. Jednym z gorących orędowników oparcia psychologii społecznej (jak się wydaje raczej Jakościowej" pod względem metodologicznym gałęzi psycholo- gii) na systemie twierdzeń sprawdzonych w laboratorium psychologicznym jest wybitny psycholog społeczny, autor znanej i w Polsce z kilku wydań, monografii Człowiek istota społeczna (Aronson, 1995) i współedytor monumentalnego, kilkuto- mowego podręcznika The Handbook of social psychology (por. Lindzey, Aronson, 1968-1969). Elliot Aronson tak uzasadnił powody, dla których psychologowie spo- łeczni prowadzą eksperymenty: aby uzyskać „definitywne dowody" na rzecz jakie- goś twierdzenia psychologicznego należy zaprojektować eksperyment, który po- zwoli „...kontrolować uboczne zmienne i sprawdzić wpływ błędu na atrakcyjność (w tym konkretnym przykładzie jest to zmienna zależna — przyp. J.B.) w mniej złożonej sytuacji. Z tego właśnie powodu psychologowie społeczni przeprowadzają eksperymenty. Chociaż niektóre eksperymenty są interesujące i fascynujące pod względem formy, jak i treści, to jednak proces projektowania i przeprowadzania eksperymentów w psychologii społecznej nie jest zabawą ani żartem. Jest to cza- 282 sochłonna i mozolna praca, która ponadto prawie zawsze stawia eksperymentatora w sytuacji trudnej z etycznego punktu widzenia. W dodatku eksperymentator, dążąc do zapewnienia kontroli, musi często wymyślać sytuacje mało przypominające tę sytuację ze świata rzeczywistego, z której zaczerpnął swój pierwotny pomysł. Istot- nie, często wysuwa się zarzut, że eksperymenty laboratoryjne są nierealistycznymi i «wymyślonymi» imitacjami ludzkich interakcji, nie odzwierciedlają w ogóle rze- czywistego świata». Czy jednak jest to prawdą?" (Aronson, 1995, s. 495-496). Wraz z rozwojem świadomości metodologicznej badaczy-psychologów i do- skonaleniem stosowanych przez nich narzędzi pomiarowych wzrasta rola modelu eksperymentalnego w projektowaniu badań empirycznych nastawionych na kontrolę empiryczną formułowanych przez psychologów twierdzeń naukowych (a właściwie — odwołując się do terminologii stosowanej przez Patryasa, 1976, s. 8-9 — „twierdzeń pretendujących" do tego, aby je uznać za twierdzenia naukowe). Od- wołajmy się jeszcze raz do wypowiedzi znanego psychologa, tym razem rodzime- go: „Poznawcze i praktyczne znaczenie teorii w dużej mierze zależy od metod formułowania jej twierdzeń i uzasadniania. Jeśli np. twierdzenia teorii cząstek ele- mentarnych mają większą wartość predyktywną i wyjaśniającą niż twierdzenia teorii dydaktycznych, to przede wszystkim dlatego, że te pierwsze zostały sformułowane i zweryfikowane za pomocą rzetelnych metod formalnych i empirycznych (eksperymentalnych — przyp. J. B.) (...) Czy psychologia współczesna ma do dys- pozycji taką «dobrą metodę»? Chociaż jest ona nauką młodą i nie osiągnęła takiego stopnia rozwoju jak nauki zaawansowane (tzw. hard sciences), to jednak w ostat- nich latach psychologowie opracowali wiele rzetelnych metod i technik badaw- czych, które pozwalają na poprawne formułowanie dobrze uzasadnionych twierdzeń naukowych. (...) O ile w pewnych naukach, np. ekonomii, eksperyment traktuje się jako metodę pomocniczą, o tyle w psychologii jest on bez wątpienia metodą do- minującą. Droga do poznania zachowania się człowieka prowadzi przez laborato- rium" (Kozielecki, 1975, s. 20-21). Dodajmy jeszcze, że w latach, które dzielą moment napisania tych słów od dnia dzisiejszego bardzo wzrósł dostęp przeciętne- go badacza do komputera oraz do dobrych bibliotek oprogramowania statystyczne- go. To zaś sprawiło, że praktycznie każdy badacz może — bez pomocy specjalisty od komputerów i statystyki — samodzielnie zaprojektować badanie eksperymental- ne oparte na statystycznym modelu jednozmiennowej (w sensie uwzględnienia w planie eksperymentalnym jednej zmiennej zależnej) analizy wariancji ANOVA czy wielozmiennowej (w sensie uwzględnienia wielu zmiennych zależnych) analizy wa- riancji MANOVA oraz, także samodzielnie, przeprowadzić skomplikowane oblicze- nia statystyczne. Pisząc, wraz z kolegą, ponad 15 lat temu, pierwszy polski podręcznik analizy wariancji adresowany do psychologów — Zastosowanie analizy wariancji w eksperymentalnych badaniach psychologicznych (Brzeziński, Stacho- wski, 1984) — nie zakładaliśmy tak gwałtownego rozwoju komputerów osobistych i związanego z tym dostępu do łatwego w użyciu oprogramowania statystycznego (m. in. ANOVA), takiego jak pakiet SPSS PC+ czy CSS STATISTICA. Dziś należałoby ten podręcznik napisać inaczej, np. zrezygnować z podawania wzorów 283 w postaci ułatwiającej obliczanie poszczególnych składowych złożonych wzorów ANOVA za pomocą kalkulatora. Model eksperymentalny niewiele ma jednak wspólnego z rozpowszechnionym w społeczeństwie pojęciem eksperymentu. Wymaga on, i należy to wyraźnie za- akcentować, aby badacz podporządkował się określonym rygorom natury metodolo- gicznej i techniczno-organizacyjnej. Nie można go stosować ad hoc, a wręcz prze- ciwnie — wymaga on dokładnego zaplanowania całego toku postępowania badaw- czego oraz spełnienia określonych założeń — w tym związanych z przyjętym mo- delem statystycznym opracowania (statystycznego) danych z badania empiryczne- go. Planowanie to związane jest też z wyborem adekwatnego, do sformułowanej przez badacza hipotezy badawczej, planu eksperymentalnego. Poświęcę tej proble- matyce w tym rozdziale sporo miejsca. Chciałbym bowiem zapoznać Czytelnika z podstawowym zestawem takich planów wraz ze wskazówkami, które mają mu ułatwić wybór tego spośród nich, który będzie najbardziej odpowiedni do sformu- łowane) przez badacza hipotezy badawczej. 2. Charakterystyka modelu eksperymentalnego (E) 2.1. Model eksperymentalny (E) a model quasi-ekspery mentalny (qE) Zanim podam dokładną definicję modelu eksperymentalnego i jego słabszej odmia- ny — modelu quasi-eksperymentalnego, przytoczę jego definicje podawane przez autorów prac z zakresu metodologii badań behawioralnych (a więc — przypomi- nam — psychologii, socjologii, pedagogiki itp.). Poprzez ich analizę spróbuję wy- eksplikować taką definicję modelu eksperymentalnego, w której wystąpiłyby wszy- stkie jego istotne cechy. Definicje, o których mowa i które zostaną niżej przyto- czone, różnią się między sobą stopniem precyzji definiowania, rozłożeniem akcen- tów na różne cechy modelu eksperymentalnego i, wreszcie, różnią się pominię- ciem niektórych (zdaniem danego autora) nieistotnych czy mniej istotnych cech, a uwzględnieniem czy uwypukleniem innych, jako istotnych. 1. W ujęciu Campbella i Stanleya (1967, s. 171) „przez eksperyment rozumie się ten typ badania, w którym manipuluje się pewnymi zmiennymi i obserwuje ich wpływ na inne zmienne". Jak nietrudno zauważyć, jest to definicja dość ogólnikowa; mówi ona bowiem ogólnie o manipulowaniu „pewnymi zmiennymi", nie precyzując jakie to zmienne, oraz o obserwowaniu wpływów tych zmiennych na inne zmienne. Nie precyzuje jednak, na czym ta manipulacja ma polegać. 2. Podobną definicję podaje Kerlinger (1986, s. 293): „Eksperyment to ta ki rodzaj badania naukowego, w którym badacz manipuluje i kontroluje jedną lub więcej zmiennych niezależnych oraz obserwuje zmienną czy zmienne zależ- 284 ne z punktu widzenia tych zmian jakie towarzyszą manipulacji zmiennymi niezależnymi". 3. Z kolei Wolman (1973, s. 132) tak definiuje eksperyment: „Eksperyment to takie kontrolowane ustawienie i manipulowanie warunkami, aby w sposób sy stematyczny obserwować poszczególne zjawiska w celu określenia wpływów, ja kim podlegają i związków, w jakie wchodzą. Zmienne te i warunki w eksperymen cie stanowią zmienną eksperymentalną, którą badacz w sposób systematyczny ma nipuluje czy zmienia. Zmienna zależna to zjawisko, które ma być obserwowane i co do którego zakłada się, że zmienia się pod wpływem manipulowania zmienną eksperymentalną. Wszystkie okoliczności uboczne tak dalece, jak to możliwe utrzy muje się na stałym poziomie, aby nie zaciemniały (właściwych) rezultatów". Jednakże i ta definicja nie precyzuje istoty manipulowania zmiennymi. Mówi iynie, co należy czynić ze zmiennymi niezależnymi-ubocznymi. 4. Równie szczegółowa jest definicja czwarta, która wylicza co badacz musi obić chcąc posłużyć się eksperymentem: „W badaniu o charakterze eksperymen- ilnym badacz musi (1) ustalić wartości albo kategorie zmiennej (zmiennych) nie- ileżnej, które mają być porównywane, (2) wyselekcjonować osoby do badań, zastosować procedury, na mocy których badanym' przydziela się poszczególne vartości lub kategorie zmiennej niezależnej, (4) sprecyzować — jakiego typu ob- vacji czy pomiarów należy dokonać odnośnie każdego badanego" (Ferguson, akane, 1989, s. 237). 5. Wedle Wigginsa (1968, s. 392): „Metoda eksperymentalna polega na mani- ulowaniu, przez eksperymentatora, zmiennością jednej lub większej liczby zmien nych niezależnych, a następnie dokonaniu pomiaru zmienności zmiennej lub zmien nych zależnych". Nie jest to definicja tak szczegółowa, jak obie poprzednie, ale uwzględnia ona de istotne cechy eksperymentu, jak manipulacja i pomiar. 6. Kolejna, szósta, definicja zbliżona jest do poprzedniej: „W badaniach o cha- Icterze przyczynowym (causal research) eksperyment ma dwie zalety w stosunku do badania surveyowego: po pierwsze, badacz może tak jak chce manipulować bodźcami, określając ich intensywność i czas trwania; po drugie, może decydować, wobec których badanych osób zastosuje każdy bodziec. Podejście eksperymentalne zezwala na losowe przydzielanie bodźców badanym, wyrównując różnice między nimi przed zadziałaniem bodźca" (Ross, Smith, 1968, s. 333). 7. Sułek (1979, s. 15) podał następującą definicję: „Eksperyment jest to po wtarzalny zabieg polegający na planowej zmianie przez badacza jednych czynni ków w badanej sytuacji, przy równoczesnej kontroli innych czynników, podjęty w celu uzyskania w drodze obserwacji odpowiedzi na pytanie o skutki tej zmiany". Biorąc pod uwagę wszystkie definicje jednocześnie, można sporządzić listę istotnych cech eksperymentu odróżniających go od innych modeli badawczych. Będą to zatem następujące cechy: (1) manipulacja — co najmniej jedną zmienną niezależną (wedle przyjętej w rozdz. 7., pkt. 5. klasyfikacji zmiennych, będzie to zmienna niezależna-główna); 285 (2) kontrola — zmiennych niezależnych-ubocznych i zmiennych niezależnych- -zaklócających zaliczonych przez badacza do O(PY); (3) obserwacja / pomiar — zmienności zmiennej zależnej wywołanej zamie rzonymi (intencjonalnymi) przez badacza wpływami na nią zmiennej (zmiennych) niezależnej-głównej. Sądzę, że po tych wstępnych objaśnieniach można się pokusić o skonstruowa- nie własnej definicji modelu eksperymentalnego. Oto ona: Model eksperymentalny (E), to taki model sprawdzania hipotez o zależnoś- ciach miedzy zmienną (zmiennymi) zależną i zmienną (zmiennymi) niezależną-- główną, który zakłada: (a) manipulację co najmniej jedną zmienną niezależną-główną, (b) kontrolowanie pozostałych zmiennych, ubocznych i zakłócających uzna nych przez badacza za istotne dla zmiennej zależnej, oraz (c) dokonywanie pomiaru zmienności zmiennej (zmiennych) zależnej, spo wodowanej zamierzonym przez badacza oddziaływaniem na nią (na nie) zmiennej (zmiennych) niezależnej-głównej. Manipulowanie zmienną niezależną-główną polega na przydzielaniu poszcze- gólnych jej wartości (ze zbioru liczącego co najmniej dwie wartości!) osobom badanym z próby pobranej przez badacza z populacji (w jaki sposób ta próba powinna być pobierana z populacji — por. rozdz. 9.) tak, aby jednej osobie przy- pisywana była tylko jedna wartość zmiennej lub jedna kombinacja wartości zmien- nych, gdy ich liczba jest większa. Manipulowanie zmiennymi, o którym mówi model eksperymentalny, to nie jakiekolwiek przydzielanie wartości zmiennej (zmiennych) niezależnej-głównej oso- bom badanym. Owo przydzielanie musi się odbywać z respektowaniem zasady randomizacji, czyli przydzielania poszczególnych wartości jednej zmiennej nieza- leżnej-głównej (lub jednej kombinacji zmiennych niezależnych, gdy ich liczba jest większa) w sposób losowy osobom badanym (więcej na ten temat w pkt. 2.3). Wymóg randomizacji jest bardzo ważny, a jego niespełnienie sprawia, że mo- del eksperymentalny — nie odpowiadając wymogom definicyjnym — staje się modelem quasi-eksperymentalnym (qE). Podchodząc tak rygorystycznie do spełnia- nia przez badacza wymogu randomizacji i, w konsekwencji, odmawiając statusu modelu E tym badaniom, które spełniają wymagania definicyjne, poza tym jednym, związanym z randomizacją, aprobuję tym samym, także rygorystyczne, w tej spra- wie stanowisko, które zajęli Cook i Campbell (1979), wyróżniając „prawdziwe plany eksperymentalne" (true experimental designś) respektujące zasadę randomi- zacji i „plany quasi-eksperymentalne" {quasi-experimental designs). Przeciwnego zdania jest np. Krathwohl (1984, s. 467), który uważa, że te tzw. quasi-ekspery- menty są i „popularne" i „użyteczne", a określanie mianem „prawdziwe" jedynie eksperymentów respektujących zasadę randomizacji może sugerować, że ich rezul- taty nie podlegają alternatywnym wyjaśnieniom, jako że uzyskane zostały w „pra- wdziwym" eksperymencie. Można by się zgodzić z krytyką tego rozróżnienia, gdyby nie to, że badacz sięgający do metody eksperymentalnej zobowiązany jest — 286 o czym Czytelnik przekona się w pkt. 4. niniejszego rozdziału — właśnie do roz- patrzenia podatności uzyskanych z badania eksperymentalnego wyników na wpływ innych czynników, aniżeli te o których mówiła hipoteza badawcza, a więc do uwzględnienia wspomnianych „alternatywnych" wyjaśnień. Chciałbym tedy wyraźnie, jeszcze raz (!), podkreślić, iż w przypadku nie- przestrzegania przez badacza zasady randomizacji mieć będziemy do czynienia z pseudomanipulacją, a w konsekwencji jedynie z modelem qE! W najprostszym wariancie modelu E, badacz manipuluje jedną zmienną nie- zależną-główną, która — w sposób naturalny, albo wymuszony przez badacza — jest zmienną dwu wartościową („0-1"). W takim przypadku manipulowanie zmien- ną polega na tym, że badacz połowie osób z próby — na zasadzie losowej — przydziela wartość: „1", a drugiej połowie — wartość: „0". Stosunkowo często psychologowie decydują się na przeprowadzenie zabiegu dychotomizacji zakresu wartości zmiennej niezależnej, jeżeli, tak naprawdę, jest ona zmienną wielowartościową. Co więcej, ów zabieg dychotomizacji pojmowany jest dość specyficznie. Przyjęło się bowiem postępować według reguły: „wszystko albo nic" (ang. all-or-nothing). W jednej grupie, zwanej grupą eksperymentalną, przydziela się osobom badanym (rzecz jasna, że w sposób losowy!) określoną war- tość zmiennej niezależnej-głównej, np. musi ona rozwiązywać określone zadania w „warunkach stresowych". „Warunki stresowe", to wartość „1" zmiennej niezależnej- głównej. Z kolei druga grupa, zwana grupą kontrolną, pracuje nad tymi samymi zadaniami, ale w „warunkach relaksowych". „Warunki relaksowe" to wartość „0" zmiennej niezależnej-głównej. Czytelnik zapewne zauważył, że w powyższym przykładzie posłużono się ma- ło precyzyjnym określeniem: „warunki stresowe", czy „warunki relaksowe". Oczy- wiście badacz je operacyjnie doprecyzuje. Tutaj chciałem zwrócić jedynie uwagę na specyficzny sposób postępowania psychologów, który polega na tym, że „coś" się robi z osobami losowo przydzielonymi do grupy eksperymentalnej, czego nie robi się z osobami z grupy kontrolnej. Jedynie to „coś" powinno różnić między sobą osoby badane z obu grup. Określenie: „wszystko albo nic" jest bardzo trafne. „Wszystko" oznacza bowiem wystawienie osób badanych z grupy eksperymentalnej na działanie warunków eksperymentalnych (np. stres, lęk, psychoterapia, hałas, środki farmakologiczne, treść instrukcji obniżającej samoocenę). Z kolei „nic" oznacza pozostawienie osób z grupy kontrolnej w warunkach komfortu psychicz- nego i fizycznego, nie stresowanie ich, nie poddawanie psychoterapii, w miejsce leku podawanie im placebo itp. Od dobrze zaplanowanego eksperymentu oczekuje się, iż grupa eksperymentalna od grupy kontrolnej różni się jedynie co do wartości („0-1") zmiennej niezależnej- głównej. Pod każdym innym względem, uznanym przez badacza za istotny, grupy te są takie same (rzecz jasna w granicach założonego błędu). Grupy nie powinny się różnić pod względem płci, jeżeli ta zmienna została zaliczona, jako zmienna niezależna- uboczna, do O(PY). Grupy mogą się różnić pod względem koloru oczu, jeżeli ta zmienna nie została uznana przez badacza za zmienną istotną m dla Y. Takie postępowanie wprost nawiązuje do kanonu (metody) różnicy, sfor- 287 imitowanego przez angielskiego filozofa i logika Johna Stuarta Milla, jako jednego z pięciu kanonów wnioskowania przyczynowego opisanych w jego wydanym w 1843 roku podstawowym dziele: System logiki dedukcyjnej i indukcyjnej (wyd. poi. 1962, t. 1 i 2). Kanon różnicy, stanowiący podstawę ?wnioskowania ptzez uu\\&qc eliminacyjną, w oryginalnym sformułowaniu Milla brzmi następująco: „Jeżeli przy- padek, w którym dane zjawisko badane zachodzi, oraz przypadek, w którym ono nie zachodzi, mają wszelkie okoliczności wspólne, wyjąwszy jedną, i przy tym ta jedna zachodzi tylko w przypadku pierwszym, to okoliczność, co do której jedynie te dwa przypadki się różnią, jest skutkiem albo przyczyną, albo nieodzowną częścią przyczyny danego zjawiska" (t. 1, s. 606). Przełóżmy pojęcia zawarte w Millowskim sformułowaniu kanonu różnicy na język, którym posługują się badacze-psychologowie. „...przypadek, w którym dane zjawisko badane zachodzi, oraz przypadek, w którym ono nie zachodzi", to wyróż- nione przez badacza dwie grupy porównawcze — eksperymentalna i kontrolna — różniące się co do wartości zmiennej niezależnej-głównej (wartość „1" w grupie eksperymentalnej i wartość „0" w grupie kontrolnej). Z kolei: „...dane zjawisko badane...", to wartości zmiennej zależnej (odpowiadające wartości „1" zmiennej niezależnej-głównej), które — zgodnie z oczekiwaniami badacza, wyartykułowany- mi w hipotezie roboczej — przyjmuje ona dla osób z grupy eksperymentalnej („przypadek w którym badane zjawisko zachodzi"). Wartości zmiennej zależnej (odpowiadające wartości „0" zmiennej niezależnej-głównej) przyjmowane przez nią dla osób z grupy kontrolnej, to — wg Milla — niezachodzenie „danego zjawiska badanego". I dalej: „...okoliczności wspólne, wyjąwszy jedną...", to zmienne nieza- leżne-uboczne i zmienne niezależne-zakłócające, zaliczone przez badacza do O(PY), które przyjmują te same (rzecz jasna w granicach dopuszczalnej przez badacza, bo uznanej za nieistotną, różnicy) wartości dla każdej osoby, tak z grupy eksperymen- talnej, jak i z grupy kontrolnej. Inna sprawa, jak to, w sensie technicznym zrobić, ale o tym będzie jeszcze mowa. Ajdukiewicz (1965, s. 157-164) przeprowadził bardzo wnikliwą i krytyczną analizę wnioskowania opartego na kanonie różnicy i wykazał, iż w praktyce nie- możliwe jest posłużenie się tą metodą. Słusznie bowiem zauważył on, iż: „...w rzeczywistości jednak ten, kto pragnie wykryć przyczynę jakiegoś zjawiska, nie jest tabula rasa, nie jest wyzuty z wszelkiej teoretycznej wiedzy. Ta wiedza teoretyczna pozwala mu, gdy zaobserwuje w jakimś wypadku zjawisko B, którego przyczyny szuka, od razu wyróżnić spośród towarzyszących mu w tym wypadku zjawisk te, które mogłyby być tą przyczyną, i oddzielić je od wszystkich innych, które wpraw- dzie w tym wypadku również wystąpiły, ale o których wie skądinąd, że nie mogą mieć żadnego wpływu na zjawisko B. Nie zaczyna więc — jak chce Mili — od stwierdzenia, że przyczyną zjawiska B jest któreś z wyraźnie wyróżnionych spośród wszystkich zjawisk występujących w danym wypadku wraz ze zjawiskiem B, co do których przypuszcza, że mogą one mieć wpływ na zjawisko B. Zaczyna więc od razu od postawienia alternatywy, której członami nie są wszystkie zjawiska towarzyszące zjawisku B, ale niektóre z nich, wyraźnie wymienione" (s. 163-164). Zaproponowana przez Ajdukiewicza metoda wnioskowania przez indukcję eli- 288 minacyjną została przez niego wyartykułowana w postaci następującej praktycznej dyrektywy, która z kolei znalazła zastosowanie w wersji „wszystko albo nic" mo- delu E. Oto ona (Ajdukiewicz, 1965, s. 156-157): „Jeżeli chcesz znaleźć przyczynę zjawiska B, a wiadomo ci, że przyczyną tą jest zjawisko A\ lub A2, ..., lub A„, rozwiążesz to zadanie, gdy uda ci się dla każdego ze zjawisk A^, A2, ..., A„, z wyjątkiem jednego, znaleźć taki wypadek, w którym to zjawisko zachodzi, a nie zachodzi zjawisko B. Wtedy to jedno zjawisko, dla którego nie znalazłeś wypadku, w którym ono zachodziło, zaś brak było zjawiska B, możesz uznać za przyczynę zjawiska B". Badanie eksperymentalne zaplanowane zgodnie z powyższą dyrektywą musi być tak przeprowadzone, aby badacz miał mocną podstawę sądzić, iż — przy spełnieniu tych wymagań — rzeczywiście wykrył przyczynę obserwowanego skut- ku. Idzie bowiem o to, aby nie potraktował jako przyczyny „czegoś", co nią fa- ktycznie nie jest. W tym miejscu warto przytoczyć przykład takiej pomyłki. Oka- zuje się, iż w poszukiwaniu przyczyn pożarów powstających w miastach można dojść do takiego zaskakującego wniosku. Ta liczba zależy, i to bardzo wyraźnie, od ... liczby wozów bojowych, jaką dysponuje lokalna straż pożarna. Oczywiście jest to — mówiąc językiem fachowym — zależność pozorna. Gdyż, tak naprawdę, i liczba wybuchających w mieście pożarów, i liczba wozów bojowych straży po- żarnej zależą od jednej rzeczywistej przyczyny, którą jest wielkość miasta wyrażana liczbą jego mieszkańców. Ktoś może powiedzieć, iż przykład jest odległy od psy- chologii i na tyle „gruby", że żaden dostatecznie krytyczny badacz nie popełniłby takiego jaskrawego błędu. Zapewne jest to słuszne, ale rzeczywistość, którą anali- zuje — z punktu widzenia psychologa — badacz jest o wiele bardziej złożona i „wykrywane" przez niego z mozołem zależności mogą mieć charakter pozorny, tyle, że nie tak spektakularny, jak w opisanym wyżej przykładzie ze strażami po- żarnymi i pożarami. Musi tedy badacz być bardzo krytyczny wobec tego co zarejes- truje w przeprowadzonym badaniu. Współczesne, bardziej zaawansowane badania eksperymentalne nie są prowadzone wg takich prostych schematów „wszystko albo nic". Jednakże są takie badania, dla których proste realizacje dyrektywy Ajdukiewi- cza w zupełności wystarczą. Trzeba tylko krytycznie zdawać sobie sprawę z czyha- jącego na badacza niebezpieczeństwa mówienia nie o faktach, a o artefaktach. 289 Psychologowie dopracowali się specjalistycznej terminologii, którą posługują się w kontekście modelu E w wersji „wszystko albo nic". I tak, zmienna niezależ-na- główna, której wpływ na zmienną zależną starają się określić w eksperymencie, to postępowanie eksperymentalne (ang. experimental treatment), albo też, ale rzadziej: czynnik eksperymentalny, zmienna eksperymentalna. Wartość „1" (wszystko) zmiennej niezależnej-głównej, to warunki eksperymentalne, a wartość „0" (nic), to warunki kontrolne. Z eksperymentów farmakologicznych przejęto termin „placebo" na określenie czegoś, co zewnętrznie przypomina lek, ale nim nie jest, np. podobna co do wielkości i koloru tabletka, która jest fizjologicznie obojętna dla organizmu, ale badanemu sugeruje się, że jest to lek; podawanie placebo ma na celu wyeli- minowanie kontrwyjaśnienia, że to przekonanie (autosugestia) osoby badanej, iż jest poddana terapii za pomocą „cudownego" leku miało status zmiennej niezależ- 19 — Metodologia badań.. nej-głównej, a nie — jak chciałby badacz — ów „cudowny lek". Czytelnik może też spotkać się z zawężeniem określenia „postępowanie eksperymentalne" do war- tości „1" zmiennej niezależnej-głównej, czy jeszcze inaczej mówiąc — warunków eksperymentalnych. Oczywiście owe warunki eksperymentalne kontrastowane są z warunkami kontrolnymi, np. — odwołując się do prostej ilustracji — jeżeli mó- wimy, że badamy wpływ stresu psychologicznego na jakość i tempo rozwiązywania zadań umysłowych (zmienna zależna) przez kandydatów na pilotów, to tak napra- wdę chcemy powiedzieć to, że badani rozwiązujący standardowy zestaw zadań w warunkach stresu psychologicznego (wartość „1" zmiennej niezależnej-głównej) byli (są) porównywani z badanymi rozwiązującymi identyczny zestaw zadań, ale w warunkach relaksu (wartość „0" zmiennej niezależnej-głównej). Zarejestrowane różnice w tempie i jakości rozwiązywania tych zadań przez obie grupy (zgodnie z dyrektywą indukcji eliminacyjnej Ajdukiewicza różniące się tylko co do nieistot- nych cech, np. tu: koloru włosów czy karnacji skóry) tłumaczone będą tym, co obie grupy różniło, a różniło je, przypomnijmy, postępowanie eksperymentalne: „stres-brak stresu". Zapamiętajmy: jeżeli badacz analizuje zachowanie się tylko jednej grupy osób poddanych specyficznym oddziaływaniom, np. stresowi, to nie jest to eksperyment w wyłożonym wyżej sensie. Aby dane postępowanie badawcze mogło być uznane za eksperymentalne, niezbędne jest porównanie osób poddanych jakimś oddziały- waniom z osobami, które takim oddziaływaniom nie zostały poddane. Stąd też wymóg, aby do grupy eksperymentalnej dobrana została, ale nie w sposób całko- wicie dowolny(!), grupa kontrolna. Wariant „wszystko albo nic" modelu E wymaga grupy kontrolnej, która jest tak samo ważna, jak grupa eksperymentalna. Mówienie, że przeprowadziło się badanie eksperymentalne, kiedy dysponowało się jedynie grupą eksperymentalną, jest nadużyciem. Ogólnie, w jakimkolwiek wariancie mo- delu E, zawsze muszą być uwzględnione co najmniej dwie grupy porównawcze, różniące się wartościami zmiennej niezależnej-głównej. 2.2. Pojęcie kontroli zmiennych niezależnych Tytułowe pojęcie kontroli, obok pojęcia manipulacji (w sensie: randomizacji) jest kluczowym pojęciem dookreślającym model E. To „manipulacja" i „kontrola" od- różniają model E od wszystkich innych modeli badawczych, a w szczególności od modelu ex post facto (por. rozdz. 14.), którego istotną wadą jest właśnie niemoż- ność manipulowania zmienną niezależną-główną i znacznie ograniczona kontrola zmiennych niezależnych, istotnych dla Y. Pojęciu kontroli zmiennych w kontekście modelu E będziemy nadawali dwojaki sens. Pierwszy, związany będzie z zabiegami „technicznymi", które psycholog-eks- perymentator wykonu/e w ceiupoddania kontroii zmiennych niezaieżnych istotnych 120 (wg klasyfi kacji Wechsl era wartoś ci IQ przewy ższając e 120 charakt eryzują kategor ie osób o inteli- gencji określa nej jako wysoka i bardzo wysoka ; takich osób w popula cji jest niecałe 9% — por. Brzezi ński, Horno wska, 1993b, s. 90). Uzyska ny z przepr owadz onego badania wynik stanowi podsta wę do wyciąg nięcia wniosk ów dotyczą cych np. wpły- wu zmęcze nia psychi cznego na orygin alność myślen ia, ale nie wobec wszyst kich osób w popula cji o dowoln ych wartoś ciach tych dwóch zmienn ych: wieku i pozio- mu intelige ncji (wyraż onego IQ mierzo nym za pomoc ą WAIS- R), a jedynie wobec tych osób z popula cji, których wiek mieści się w granic ach: 20-25, a intelige ncja charakt eryzuje się wskaźn ikiem IQ przewy ższając ym wartoś ć 120 (wg Skali Inte- ligencj i WAIS- R). Być może badacz nie popełni błędu, jeżeli odniesi e te wniosk i do osób w wieku: 20-50 lat, o wartoś ciach IQ> 115 (warto ść IQ= 115 stanow i granic ę jedneg o odchyl enia statyst yczneg o od średnie j równej 100, a osób o IQ powyże j 120 jest w popula cji około 16%). Mniej byłbym jednak pewien zasadn ości osób tv uogóJni enia Jeżeli badacz chce przeprowadzić badania na populacji określanej mianem „nor- malnej", to o ile stosunkowo łatwo określić tzw. normalny przedział IQ, jako ten, który odpowiada tzw. normie statystycznej, tj. IQ: 85-100 (średnia 100 +/- jedno odchylenie standardowe 15), o tyle bardzo trudne będzie określenie typowego prze- działu zmiennych: doświadczenie życiowe, czy samoocena. Błąd, który popełniają badacze posługujący się tą metodą polega zatem na tym, że w fazie ósmej procesu badawczego (faza uogólniania wniosków z próby na populację) zapominają, iż wnioski mogą być prawomocne tylko dla tych osób, dla których kontrolowane zmienne przyjmują wartości z podzakresów ustalonych przez badacza. Wbrew tym ograniczeniom badacze postępują na ogół jednak tak, jak gdyby ich nie wprowadzili. Może najbardziej spektakularnym przykładem ta- kiego nagannego postępowania jest praktyka standaryzacji (wraz z normalizacją!) nowych testów psychologicznych. Ponieważ najłatwiej dostępną populacją jest po- pulacja studentów, a studentów psychologii pierwszego roku studiów (ci są najła- twiej dostępni dla swych starszych kolegów przygotowujących prace magisterskie) przede wszystkim, to ich właśnie wykorzystuje się do tego celu. Oczywiście, nowe narzędzie opuszcza „pracownię psychometryczną" i jest stosowane wobec różnych osób — studenci stanowią jednak znikomy procent tych, wobec których stosowany będzie nowy „test psychologiczny". Odwołując się do pojęcia, które będzie wpro- wadzone dopiero w pkt. 4. niniejszego rozdziału, powiemy, że takie postępowanie badacza obniża trafność zewnętrzną całego badania. Przejdźmy teraz do oceny drugiej metody. Przede wszystkim, trzeba zwrócić uwagę na to, że wcale nie jest łatwe skonstruowanie par dla zmiennych typowo psychologicznych. O ile nie nastręcza większych trudności dobieranie w pary osób takich samych z uwagi na zmienne: płeć, wiek, miejsce zamieszkania, wykształce- nie, status ekonomiczny, status rodzinny itp., o tyle znacznie trudniej kompletować pary z osób o takich samych ilorazach inteligencji, takiej samej odporności na stres, takiej samej stabilności samooceny itd. W takich przypadkach metoda tworzenia par, „eksperymentalnych bliźniąt monozygotycznych" zawodzi, a nawet gdyby uda- ło się skompletować wymaganą liczbę „bliźniąt", to i tak odbyłoby się to dużym kosztem — ile trzeba by wstępnie przebadać osób, aby znaleźć dwie podobne pod względem wyróżnionych przez badacza kryteriów (wartości, albo wąskich ich pod- zakresów, zmiennych niezależnych-ubocznych) osoby? Ominięciem tych trudności jest posłużenie się odmianą tej metody — opisaną wyżej — polegającą na tym, że każda osoba jest badana dwukrotnie, w zmienionych warunkach — tworzy parę sama z sobą. Rzeczywiście jest to doskonała metoda tworzenia par, ale nie nadaje się ona do zastosowania w tych przypadkach, w których wystąpić może efekt wyuczenia się czy transferu, gdy ważne jest, aby osoba badana miała tylko jedno- razowy kontakt z sytuacją badawczą. Ta metoda, podobnie jak metoda pierwsza, nie pozwala na ilościowe określenie procentowego udziału danej zmiennej nieza- leżnej-ubocznej w wyjaśnianiu zmienności całkowitej zmiennej zależnej Y. Dobrze jest, aby zdawać sobie sprawę z ograniczeń przedstawionych tu metod kontroli zmiennych niezależnych-ubocznych w jedno-jednozmiennowej odmianie modelu E, ale trzeba pamiętać i o tym, że są to jedyne metody kontroli dostępne 295 badaczowi. Jeżeli nie zadowalają go, to musi zarzucić tę odmianę modelu E na rzecz odmiany opartej na statystycznym modelu ANOVA czy MANOVA. Osobi- ście zachęcam każdego psychologa, aby — jeżeli chce posłużyć się modelem eks- perymentalnym — sięgnął po jakiś z planów ANOVA czy MANOVA, a zrezyg- nował z mało precyzyjnej odmiany „wszystko albo nic" modelu E. Czytelnik mógłby w tym momencie zapytać, dlaczego piszę o tak niedoskonałej odmianie modelu E, jeżeli można się posłużyć jej bardzo precyzyjną odmianą. Piszę o niej, bo jest jeszcze przez psychologów dość powszechnie stosowana i do sprawdzania mało skomplikowanych hipotez (a z takimi na ogół ma do czynienia student przygoto- wując pracę magisterską) przydatna. Poza tym, stosowanie jakieś metody wymaga znajomości nie tylko jej zalet, ale także — czy przede wszystkim — ograniczeń. Tych zaś metoda „wszystko albo nic" ma więcej niż zalet. 2.2.2. Statystyczny aspekt kontroli zmiennych — analiza wariancji zmiennej zależnej Nie trzeba być specjalnie bystrym obserwatorem, a już na pewno nie uczonym psychologiem, aby — obserwując otaczającą nas społeczną rzeczywistość — dojść do wniosku, że ludzie różnią się między sobą pod względem rozmaitych, mniej lub bardziej ukrytych przed okiem obserwatora właściwości. Takie ich właściwości (my powiemy — zmienne), jak: wzrost, sposób poruszania się, język, którym się mię- dzy sobą komunikują, sposób ubierania się, wiek itp. są dostępne bezpośredniej obserwacji. Z kolei właściwości, które przede wszystkim interesują psychologa (zmienne psychologiczne) są ukryte i aby dotrzeć do nich niezbędne jest posłużenie się specjalnymi narzędziami (psycholog dysponuje takimi „specjalnymi" narzędzia- mi — są nimi testy psychologiczne: skale inteligencji, skale postaw, kwestionariu- sze osobowości, testy projekcyjne, itp.). Chcąc tedy zdobyć informacje na temat zróżnicowania interindywidualnego (zmienności) w obrębie jakiejś zbiorowości, pod względem takiej „ukrytej" cechy (zmiennej), jaką jest np. poziom inteligencji, psycholog (bo on właśnie jest predy- stynowany do prowadzenia takich obserwacji, z uwagi na posiadane kwalifikacje — także metodologiczne!) sięga po jakiś test inteligencji. W efekcie jego zastoso- wania okaże się, że część przebadanych osób uzyskała identyczne wyniki, a część uzyskała wyniki różniące się między sobą. Jeżeli z osób, które uzyskały identyczne wyniki testu inteligencji utworzymy odrębną podgrupę (wyodrębnioną z wyjściowej „dużej" grupy), to to, co ją będzie charakteryzowało, odróżniało od drugiej pod- grupy obejmującej osoby o różnych wynikach testu inteligencji, można wyrazić w takim oto, kluczowym dla eksperymentatora określeniu — pierwszą podgrupę ce- chuje brak zróżnicowania wewnątrzgrupowego (a drugą podgrupę cechuje jakieś zróżnicowanie wewnątrzgrupowe). Oczywiście ta obserwacja jest prawdziwa tylko w odniesieniu do przebadanych osób i tylko w odniesieniu do zmiennej inteligencji. Informacja o zróżnicowaniu badanych osób z uwagi na badaną zmienną (jest nią oczywiście zmienna zależna Y) jest bodajże najważniejszą informacją dla psycho- 296 loga-eksperymentatora, który planuje przeprowadzenie eksperymentu! Gdyby „nasz" psycholog przeprowadził rozległe badania nad zróżnicowaniem (zmiennością) cechy inteligencji wśród ludzi, to doszedłby do wniosku, że przy dużym ? zróżnicowaniu, które daje się zaobserwować w całej populacji przebadanych przez niego osób, można też zaobserwować znacznie mniejsze, a nawet zerowe, zróżnicowanie tych osób, jeżeli pogrupuje on je wedle innego, niż poziom inteligencji, kryterium (zmienna niezależna!). Takim kryterium klasyfikującym osoby badane może być, na przykład, wykształcenie. Gdyby teraz psycholog pogrupował wyniki testu inteligencji zgodnie z kryterium wykształcenia badanych osób, to okazałoby się, że zróżnicowanie wewnątrzgrupowe w każdej „podgrupie wykształceniowej" jest mniejsze od zróżnicowania całkowitego całej przebadanej grupy wyjściowej. Na tym nie koniec. Porównując, pod względem zróżnicowania, wyróżnione „podgrupy wykształceniowe" dochodzimy do konstatacji, iż także one (traktowane ' jako odrębne „całości") różnią się między sobą. To zróżnicowanie przyjęło się nazywać zróżnicowaniem między grupowym. Gdybyśmy, bawiąc się naszymi danymi, zaczęli zmieniać kryterium wyodrębniania podgrup, to mogłoby się okazać, iż pewne kryteria mogłyby spowodować takie przemieszczenie się osób badanych do nowych podgrup, w efekcie którego otrzymalibyśmy jeszcze większe zróżnicowanie międzygrupowe i mniejsze zróżnicowanie wewnątrzgrupowe. Być może takim kryterium bardziej różnicującym podgrupy i jednocześnie obniżającym ich hete-rogeniczność (inaczej: zwiększającym ich homogeniczność) byłoby kryterium wykonywanego zawodu. Mogłoby być i tak, że jakieś kryterium obniżyłoby zróżnicowanie międzygrupowe, a zwiększyłoby zróżnicowanie wewnątrzgrupowe. Wreszcie mogłoby się okazać, że są takie kryteria, które nie wpływają na zróżnicowanie międzygrupowe i zróżnicowanie wewnątrzgrupowe. Idąc jeszcze dalej w naszym rozumowaniu, powiemy, że te kryteria, które wyraźnie zwiększają zróżnicowanie międzygrupowe i obniżają zróżnicowanie wewnątrzgrupowe badanych osób pod względem wartości zmiennej zależnej, to są kryteria istotne z uwagi na zmienną zależną, albo, że są to zmienne niezależne istotne dla Y. Różne, wyodrębnione przez badacza zmienne niezależne będą w różnym stopniu zwiększały owo zróżnicowanie międzygrupowe zmiennej Y i zmniejszały zróżnicowanie wewnątrzgrupowe. Dociekliwy Czytelnik zapyta się w tym momencie: Czy istnieje jakaś miara owego zróżnicowania osób badanych z uwagi na interesującą badacza zmienną zależną, miara która pozwoliłaby na udzielenie odpowiedzi na następujące, bardziej szczegółowe pytania: (a) w jaki sposób oddzielić zmienne istotnie, w sensie staty- stycznym (będzie o tym mowa w pkt. 7. niniejszego rozdziału), od zmiennych nieistotnych? (b) w jaki sposób określić stopień całkowitego zróżnicowania (zmien- ności) zmiennej zależnej, wprowadzonego przez daną zmienną niezależną? Na szczęście, psycholog-eksperymentator dysponuje bardzo dobrym kryterium odpowiadającym na obydwa pytania. Jest nim wariancja. Spotkał się już z nią Czytelnik w podstawowym kursie statystyki. Niemniej odświeżmy sobie informacje na jej temat. Jak wiemy, jeżeli chcemy opisać, w sposób bardzo zwięzły jakiś, zwłaszcza duży, zbiór wyników, to możemy podać jego średnią arytmetyczną (przy założeni u, że dana miara wyrażo na jest na skali co najmnie j interwał owej!). W ten sposób GUS informu je obywate li o zarobka ch w poszcze gólnych gałęziac h gospo- darki narodo wej. Wiemy też, że tę samą średnią można otrzym ać, gdy wyniki są w niewiel kim stopniu zróżnic owane i gdy są one znaczni e zróżnic owane. Rozpa- trzmy prosty przykła d. Przypuś ćmy, że chcieliś my sprawd zić hipotez ę mówiąc ą o tym, że pewna zmienn a niezależ na X („0-1") wyjaśni a obserw owaną w 10- oso- bowej grupie osób (oznacz my ją jako Gr. C) zmienn ość (zróżnic owanie) zmienne j zależne j Y. Niech osoby, dla których ta zmienn a X przyjęła wartość „1" tworzą grupę A. Z kolei osoby, dla których zmienn a X przyjęła wartość „0" tworzą grupę B. Niech też będzie tak, że obie grupy okazały się równoli czne (n = 5; nA + nB= = N = 10). Po przepro wadzen iu badania uzyskal iśmy dwa zbiory danych: A i B: zbiór A: {5, 2, 1, 4, 3}, zbiór B: {3, 3, 3, 3, 3}. Średnia w zbiorze A wynosi 3 i w zbiorze B też wynosi 3. Także w zbiorze C wynosi 3. Gdybyśmy pozostali tylko przy informacji o średniej, to oba zbiory należałoby potraktować jako identyczne, a tak przecież nie jest. Pierwszy cechuje duże zróżnicowanie wewnątrzgmpowe, a drugi brak zróżnicowania wewnątrzgrupo- wego. Dlatego też obok informacji o średnich powinniśmy podawać jakąś informa- cję o wielkości owego zróżnicowania; może to być np. dyspersja wyników1. Zna- cznie jednak przydatniejsza okazała się miara, której obliczanie polega na przyrów- nywaniu każdego wyniku do średniej grupowej. Przeprowadźmy tę operacje na obu zbiorach: zbiór A: (3-5), (3-2), (3-1), (3^ł), (3-3) i zbiór B: (3-3), (3-3), (3-3), (3-3), (3-3). Prostą miarą tego zróżnicowania może być suma „odległości" każdego wyniku od średniej. Rzut oka na dane nakazuje nam wycofanie się z tego „proste- go" rozwiązania, gdyż suma odchyleń poszczególnych wyników od ich średniej zawsze będzie wynosiła — co łatwo obliczyć — zero. Jeżeli jednak wartość każ- dego odchylenia podniesiemy do kwadratu i dopiero potem dokonamy sumowania, to zlikwidujemy ową trudność. Tak, jak obliczamy średnią z wyników, tak też możemy obliczyć średnią z kwadratów odchyleń wyników od ich średniej. Jeżeli tak postąpimy, to otrzymamy nową miarę zmienności, którą nazwano wariancją (symbolicznie oznacza się ją: s2, o2, var). Równolegle stosowana jest pochodna względem niej miara — odchylenie standardowe, obliczane jako pierwiastek kwa- dratowy z wariancji. Wariancja zmiennej Y w zbiorze A wynosi: varA = 2,0, a wariancja zmiennej Y w zbiorze B wynosi: varB = 0,0. Całkowita wariancja Y w zbiorze C obejmującym obydwa zbiory A i B wynosi: varc = 2,0. Czytelnik zechce sam, tytułem ćwiczenia, sprawdzić poprawność tych obliczeń, pamiętając, że należy wykonać w tym celu następujące kroki: (a) każdy wynik odjąć od średniej arytme- tycznej, (b) każde odchylenie podnieść do kwadratu, (c) zsumować kwadraty od- chyleń i (d) podzielić otrzymaną sumę kwadratów odchyleń przez liczbę wyników, czyli obliczyć średnią arytmetyczną. Dlatego też, przy analizowaniu różnic między grupami pod względem wysokości średnich wartości zmiennej zależnej Y, zaleca się uwzględnianie informacji o wielkości zróżnicowania wewnątrz każdej z porównywanych grup (por. Feingold, 1995). Wariancja została wybrana jako miara zróżnicowania wewnątrzgrupowego, międzygrupowego i całkowitego z uwagi na swą jedną ważną dla eksperymentatora właściwość. Otóż wariancję całkowitą jakiegoś zbioru wyników można rozbić na wariancje cząstkowe (składowe) odnoszące się do wyodrębnionych za pomocą ja- kiegoś kryterium (tu: jakiejś zmiennej niezależnej uznawanej przez badacza za istotną dla Y) podzbiorów. Zatem wariancja całkowita rozpada się na dwie warian- cje cząstkowe — wariancję międzygrupową i wariancję wewnątrzgrupową. Wariancję wewnątrzgrupową (WG) liczymy jako średnią arytmetyczną po- szczególnych wariancji grupowych. W naszym przykładzie mamy: varA = 2,0; varB = 0,0 i wobec tego wzrWG = (2,0 + 0,0) : 2 = 1. Wariancję międzygrupową (MG) liczymy jako wariancję średnich arytmetycz- nych wyróżnionych grup. W naszym przykładzie mamy dwie grupy o średnich: Gr. A: 3,0 i Gr. B: 3,0. Średnia całkowita, czyli średnia grupy C, równa się 3,0. Obliczmy teraz wariancję tego dwuelementowego zbioru wyników: varMG = (3,0 -- 3,0)2 + (3,0 - 3,0)2 = 0,0. Obliczenia zostały przeprowadzone w następujący sposób: (a) obliczono średnią całkowitą dla grupy C, (b) obliczono średnie dla grup, na które podzielona została grupa C, czyli dla grup: A i B, (c) każdą średnią odjęto od średniej całkowitej, czyli średniej całej grupy C, (d) otrzymane różnice podniesiono do kwadratu, a uzyskaną sumę podzielono przez liczbę grup składowych. Wariancję całkowitą obliczamy podobnie jak wariancję Gr. A i wariancję Gr. B. Wynosi ona — varc = 1,0. Zbierzmy teraz uzyskane informacje o średnich i wariancjach z naszego fik- cyjnego przykładu: varMG = 0,0; varWG = 1,00; varc = 1,0. Zgodnie z tym, co wyżej stało napisane, wariancja całkowita rozkłada się na dwie wariancje cząstkowe: varc = varMG + varWG. I tak jest rzeczywiście: 1,0 = 0,0 + 1,0. Jaka jest interpretacja tych danych o średnich i wariancjach? Jest ona, w świetle powyższych danych, jednoznaczna. Po pierwsze, widzimy, że obie grupy A i B nie różnią się między sobą jeśli weźmiemy pod uwagę ich średnie arytmetyczne; drugie każda ze średnich składowych nie różni się od średniej całkowitej całej upy C. Po trzecie, odpowiadająca temu zróżnicowaniu, a właściwie jego brakowi, wariancja międzygrupową jest zerowa — tłumaczy bowiem ona (0,0/1,0) x 100%= wariancji całkowitej zmiennej zależnej Y. Dzieląc grupę C na dwie grupy iadowe A i B nie uzyskaliśmy redukcji wariancji wewnątrzgrupowej. Z tego unktu widzenia wprowadzona przez nas zmienna niezależna nie kontrolowała, najmniejszym nawet procencie, zmienności zmiennej zależnej. Po czwarte, pro- entowy udział wariancji wewnątrzgrupowej, wynoszący tu aż 100%, bo: 1,0/1,0) x 100% = 100%, wskazuje jednoznacznie na brak kontroli — w tym niu — zmiennej zależnej; cała bowiem zmienność zmiennej zależnej jest „ulo- owana" wewnątrz grup, czyli jest „tłumaczona" przez jakąś inną (jakieś inne) nienną niezależną (zmienne niezależne). Niestety nie potrafiliśmy udzielić odpo- iedzi na pytanie, jaka to zmienna czy zmienne? Generalny wniosek z tego badania st następujący. Hipoteza o wpływie zmiennej niezależnej X (kryterium, wg któ- go dokonaliśmy podziału całej grupy C na grupy składowe: A i B) nie została vierdzona — mówi o tym stosunek wariancji składowych: varMG / varWG = 299 = 0,0/ 1,0 = 0,0. Przy mniej jednoznacznych wartościach tego stosunku badacz od- wołuje się do testu F analizy wariancji (ANOVA), którego statystyka testowa taką ma właśnie postać (por. Brzeziński, Stachowski, 1984, s. 57-60). Wariancję wewnątrzgrupową zwykło się traktować jako miarę precyzji ekspe- rymentu. Pamiętajmy, że najlepsza grupa, to taka, którą tworzą osoby idealnie do siebie podobne, np. stworzone techniką klonowania (Czytelnik zechce mi wybaczyć ten żart genetyczny), a najlepszy eksperyment to taki, w którym porównuje się grupy idealnie homogeniczne {var-^G = 0). Wówczas całą obserwowaną zmienność zmiennej zależnej można tłumaczyć wpływem na nią zmiennej niezależnej, kon- trolowanej przez badacza, a będącej źródłem wariancji międzygrupowej (ang. be- tween-groups variance) (varMG = 1,0). W związku z tym wariancję międzygrupową określa się też mianem wariancji kontrolowanej, a wariancję wewnątrzgrupową (ang. within-groups variance) określa się mianem wariancji błędu, wariancji resztowej (ang. error variance, residual va- riance). Badacz powinien zmierzać do tego, aby minimalizować wielkość wariancji wewnątrzgrupowej i maksymalizować wielkość wariancji międzygrupowej. Jest to oczywiście niemożliwe w eksperymentach typu „wszystko albo nic". Tak napra- wdę, to jedynie analiza wariancji (ANOVA) daje taką możliwość. W analizowanym w tym punkcie eksperymencie możliwe jest poddanie takiej, jak wyżej opisana, kontroli tylko jednej zmiennej niezależnej (jest nią zmienna główna). Chcąc zmi- nimalizować wielkość wariancji wewnątrzgrupowej możemy jedynie odwołać się do „starego" Milla — z wyżej opisanymi konsekwencjami dla trafności zewnętrznej wniosków. Wariancję międzygrupową można rozbić na dowolną liczbę wariancji składo- wych, których źródłami są hipotetyczne zmienne niezależne istotne dla Y. Ten sposób postępowania prowadzi do zmniejszenia wariancji wewnątrzgrupowej (nie kontrolowanej przez badacza) na rzecz zwiększenia wariancji międzygrupowej (kontrolowanej przez badacza). Eksperyment — zaplanowany zgodnie z logiką mo- delu ANOVA — staje się w ten sposób eksperymentem dwuzmiennowym, trój- zmiennowym, itd. (w terminologii ANOVA mówi się o „eksperymentach czynni- kowych"). Przeanalizujmy jeszcze jeden, nie tak jednoznaczny w wymowie, przykład. Powiążemy go bezpośrednio z kontrolą jednej zmiennej niezależnej (jednej, bo takie są możliwości odmiany „wszystko albo nic" modelu E). Oczywiście, to czy jest to tylko jedna zmienna, czy jest ich, powiedzmy, dziesięć nic zasadniczo nie zmienia (por. Brzeziński, Stachowski, 1984). Zasada jest ta sama, a jedynie wzrasta pracochłonność obliczeń, ale kto dziś, w erze komputerów osobistych, przeprowa- dza takie skomplikowane obliczenia „na piechotę"? Nawiasem mówiąc dobre opro- gramowanie analizy wariancji (ANOVA) adresowane na IBM PC zawiera popularny w środowisku psychologów pakiet statystyczny SPSS PC+ (por. Norusis, 1992). W pewnym eksperymencie psycholog postanowił sprawdzić hipotezę mówiącą o wpływie zmiennej niezależnej-głównej X na zmienną zależną Y. W tym celu poddał badaniom 10 osób — 5 osób tworzyło grupę eksperymentalną (zmienna Y 300 dla tych osób przyjmowała wartość „1"), a 5 osobo grupę kontrolną (zmienna Y dla tych osób przyjmowała wartość „0")- Osoby do obu grup porównawczych wy- znaczone były losowo (badacz respektował zasadę randomizacji!). Jeżeli zmienna niezależna X kontroluje zmienność zmiennej Y, to wariancja kontrolowana zmiennej Y (wariancja międzygrupowa) powinna przewyższać wariancję nie kontrolowaną zmiennej Y (wariancję wewnątrzgrupową). Wnikliwy Czytelnik zapyta, w jaki spo- sób uznawać, że ów stosunek jest wystarczająco duży? Oczywiście musi to być sposób akceptowany przez całą społeczność psychologów. Takim akceptowanym „sposobem" jest posłużenie się testem F analizy wariancji (ANOVA). Uznajemy, że dana zmienna X istotnie kontroluje zmienność Y, jeżeli wartość statystyki testo- wej testu F obliczona dla danych uzyskanych z przeprowadzonego badania ekspe- rymentalnego przewyższa (albo jest równa) wartość progową ustaloną dla określo- nego poziomu istotności statystycznej a, czyli: F^ F„, Przejdźmy teraz do wykonania niezbędnych obliczeń. Odpowiednie dane za- wiera tab. 12. la oraz tab. 12. lb. Tabela 12. la. talną (nE = 10 Wyniki hipotetycznego badania obejmującego dwie grupy porównawcze - oraz kontrolną (nK =10) - eksperymen- (0) (1) (2) (3) (4) (5) (6) Lp. Grupa eksperymentalna (E) Grupa kontrolna (K) >v i"kf-rŁ (Yli-Y2)2 Yu Y2i-Y2. \ (Yn-Y2)2 1 6 -0,8 0,64 2 0,1 0,01 2 6 -0,8 0,64 2 0,1 0,01 3 8 1,2 1,44 3 1,1 1,21 4 7 0,2 0,04 3 1,1 1,21 5 6 -0,8 0,64 2 0,1 0,01 6 6 -0,8 0,64 1 -0,9 10,81 7 6 -0,8 0,64 1 -0,9 10,81 8 8 1,2 1,44 1 -0,9 10,81 9 8 1,2 1,44 2 0,1 0,01 10 7 0,2 0,04 2 0,1 0,01 I 68 7,60 19 4,90 Yi =6,8 Y2 =1,9 Zacznijmy od obliczenia wartości średnich arytmetycznych — w Gr. E, Gr. K oraz łącznie w Gr. C (Gr. E + Gr. K). Wynosząone odpowiednio: w Gr. E: 6,8; w Gr. K: 1,9 oraz w Gr. C: 4,35. Z kolei wariancje — varMG = 6,0025; varWG = 0,625; varc-6,63. Aby obliczyć wariancję wewnątrzgrupową musieliśmy wpierw obli- czyć wariancje w obu grupach porównawczych: varE - 0,76; varK = 0,49. Następnie obliczyliśmy średnią z obu wariancji, która jest wariancją wewnątrzgrupową: (0,76 + 0,49): 2 = 0,625. Z kolei wyznaczenie wariancji między grupowej wymaga wpierw obliczenia odchyleń średnich obu grup (E i K) od ich średniej: 6,8^4,35; 1,9-4,35. Następnie obliczamy sumę kwadratów odchyleń. Po jej podzieleniu przez 301 Tabela 12.1b. Wyniki hipotetycznego badania obejmującego łącznie 2 grupy (nc = nE + nK = 20) (0) (1) (2) (3) (4) Lp. Yik Yik-Y- (Yik-Y..f Grupa 1 6 1,65 2,7225 2 6 1,65 2,7225 3 8 3,65 13,3225 4 7 2,65 7,0225 5 6 1,65 2,7225 Gr. E 6 6 1,65 2,7225 7 6 1,65 2,7225 8 8 3,65 13,3225 9 8 3,65 13,3225 10 7 2,65 7,0225 11 2 -2,35 5,5225 12 2 -2,35 5,5225 13 3 -1,35 1,8225 14 2 -2,35 5,5225 15 1 -3,35 11,2225 Gr. K 16 1 -3,35 11,2225 17 1 -3,35 11,2225 18 2 -2,35 5,5225 19 2 -2,35 5,5225 20 3 -1,35 1,8225 I 87 132,5440 ?..= 4,35 liczbę grup (tu: 2) otrzymujemy wariancję międzygrupową: (6,0025 + 6,0025): 2 = = 6,0025. Wariancja całkowita to suma obu wariancji składowych: va/-WG + + varMC = 0,625 + 6,0025 = 6,6275 (w zaokrągleniu: 6,63). Jak widzimy, obliczona w ten sposób wartość varc równa jest wartości obliczonej wprost z danych surowych (132,5440/20 — dane z tab. 12.1b). Spróbujmy teraz zinterpretować uzyskane informacje o wariancji zmiennej Y. Po pierwsze, aż 90,5% całkowitej wariancji zmiennej Y jest kontrolowane przez zmienną X. Mówiąc inaczej, zmienność zmiennej Y w 90,5% zależy od zmienności zmiennej X, która została w sposób planowy wprowadzona przez badacza do eks- perymentu. Po drugie stosunek: varMG I varWG = 6,0025/0,625 = 9,6 jest dodatkowym potwierdzeniem istotności zmiennej X dla zmiennej Y. Po trzecie, 100% — 90,5% = 9,5% zmienności Y tłumaczone jest zróżnicowaniem wewnątrzgrupowym, które, jak to już powiedzieliśmy, jest traktowane jako miara precyzji eksperymentu. Badaczowi zostało do wyjaśnienia — innymi wpływami na Y aniżeli zmienna X — tylko 9,5% wariancji całkowitej zmiennej zależnej (myślę, że stało się teraz jasne, dlaczego wariancję wewnątrzgrupową określa się też mianem wariancji re- sztowej). Gdyby to nie był „biedny" eksperyment jednozmiennowy, a eksperyment wielozmiennowy, oparty na modelu ANOVA, to badacz zapewne nie ograniczyłby 302 się — w fazie planowania badania eksperymentalnego — do uwzględnienia tylko jednego źródła wariancji wyjaśnionej (kontrolowanej) zmiennej Y, a — zmierzając do minimalizacji wariancji resztowej (wewnątrzgrupowej) — uwzględniłby więcej źródeł wariancji międzygrupowej w postaci zmiennych niezależnych wbudowanych w plan eksperymentalny. Te dwie, ważne z punktu widzenia metodyki prowadzenia nowoczesnego eks- perymentu w psychologii, wariancje składowe są wykorzystywane przez bada- czy jako: (a) miara stopnia kontroli zmienności zmiennej zależnej przez wprowadzoną do eksperymentu zmienną niezależną X — wariancja międzygrupowa (inaczej: wariancja kontrolowana), (b) miara precyzji przeprowadzonego eksperymentu czy, inaczej mówiąc, miara wielkości błędu popełnionego przez badacza kontrolującego zmien ność zmiennej zależnej Y za pomocą zmiennej niezależnej X — wariancja wewnątrzgrupowa (inaczej: wariancja nie kontrolowana). Jeżeli przełożyć to, co wyżej napisałem na temat statystycznego sensu terminu „kontrola zmiennych", na język dyrektyw adresowanych do psychologa-ekspery- mentatora, to, jak sądzę, możliwe jest sformułowanie dwóch wzajemnie się uzu- pełniających dyrektyw: Dyrektywa A. Dobieraj osoby do grup porównawczych tak, aby zminimalizować wariancję wewnątrzgrupowa. Dyrektywa B. Tak manipuluj daną zmienną niezależną, aby zmaksymalizować wariancję międzygrupowa. Zaprezentowane wyżej podejście do kontroli zmiennych w eksperymencie — polegające na kontroli wariancji zmiennej zależnej Y przez intencjonalnie wprowa- dzone przez badacza do planu eksperymentalnego zmienne niezależne zakwalifi- kowane przez tegoż badacza do O(PY) — zdominowało praktykę badawczą psy- chologii. Tytułem przykładu mogę odesłać Czytelnika do tak reprezentatywnych monografii jak: Kirk (1982), Winer, Brown, Michels (1991), Kerlinger (1986) czy, z rodzimej literatury przedmiotu, Paszkiewicz (1985b, zwłaszcza pkt. 2.: Pro- ces badawczy jako proces kontroli wariancji), Brzeziński, Stachowski (1984). Niestety, w jedno-jednozmiennowej odmianie modelu E możliwe jest kontrolowanie zmienności tylko jednej zmiennej zależnej przez tylko jedną zmienną niezależną. 2.3. Znaczenie randomizacji Jednym z ważniejszych czynników zakłócających trafność wewnętrzną planu eks- perymentalnego jest — jak dowiemy się w pkt. 4.1. niniejszego rozdziału — sele- kcja osób do grup porównawczych: eksperymentalnej i kontrolnej (w skrócie — selekcja). Badacz nie jest w stanie kontrolować — w sposób opisany w poprzednim punkcie — wpływów wszystkich możliwych zmiennych zakłócających. Nierówno- mierne rozłożenie tych wpływów w obu grupach może doprowadzić do tego, że postępowanie eksperymentalne (zmienna niezależna X) trafi na bardziej podatny „grunt" w grupie eksperymentalnej niż w grupie kontrolnej, a to może zaowocować „nachyleniem" rozkładu zmiennej zależnej Y (przeszacowanie lub niedoszacowanie wartości średniej zmiennej zależnej). Jeżeli złożyło by się tak, iż do grupy, w której psycholog sprawdzałby skuteczność nowej techniki terapeutycznej opartej na hipno- zie weszłyby osoby o zwiększonej (w porównaniu z osobami z grupy kontrolnej) podatności na hipnozę, to mógłby on, w efekcie, przeszacować skuteczność owej nowej techniki terapeutycznej. Można też wyobrazić sobie sytuację odwrotną, gdy w grupie eksperymentalnej znalazłyby się osoby o „właściwościach" antagonisty- cznych względem postępowania eksperymentalnego; wówczas psycholog nie do- szacowałby skuteczności oddziaływania eksperymentalnego. Tak, czy inaczej, obie sytuacje nie są korzystne z metodologicznego punktu widzenia (chociaż, podświa- domie, psycholog mógłby być zadowolony z „korzystnego" dla jego hipotezy ro- boczej „współdziałania" zmiennych zakłócających z postępowaniem eksperymen- talnym). Aby uniknąć takich kłopotliwych sytuacji i równie kłopotliwego posądze- nia o tendencyjne przydzielanie osób do obu grup porównawczych (wg kryterium: osoby „lepsze" do grupy eksperymentalnej, a „gorsze" do grupy kontrolnej!) należy przydzielać osoby do grup w sposób losowy. O tym właśnie mówi zasada rando- mizacji (od ang. random — losowy). Przywołajmy tu jeszcze raz psychologa społecznego, Aronsona, którego zda- niem najważniejszą cechą odróżniającą badanie typu eksperymentalnego od innego rodzaju badań empirycznych jest to: „...że badanych można w sposób losowy przy- dzielić do różnych grup eksperymentalnych. Oznacza to, że każdy badany ma równe szansę znaleźć się w każdej z przewidzianych sytuacji eksperymentalnych. W grun- cie rzeczy losowe przydzielanie badanych do poszczególnych grup stanowi decydu- jącą różnicę między metodą eksperymentalna a metodami nieeksperymentalnymi. Wielką zaletą tego sposobu postępowania jest to, że wszelkie zmienne, które nie podlegają dokładnej kontroli, niemal na pewno zostaną rozdzielone losowo pomię- dzy różne sytuacje. Znaczy to, że jest niezwykle mało prawdopodobne, aby te czyn- niki mogły wpływać systematycznie na nasze wyniki" (Aronson, 1995, s. 500-501). I jeszcze raz przypomnijmy, że pojęcie randomizacji jest nierozerwalnie zwią- zane z pojęciem manipulacji zmienną niezależną-główną (zmiennymi), które wy- stępuje w definicji modelu E i zgodnie z którym badacz jest zobowiązany do losowego przydzielania osób badanych do grup — eksperymentalnej i kontrolnej (ogólniej: porównawczych). - 2.4. Rola instrukcji maskujących cel eksperymentu w psychologii („decepcja") Jedną z charakterystycznych cech eksperymentowania w psychologii jest utajnianie przed osobami badanymi prawdziwego celu eksperymentu. Psychologowie posłu- 304 gują się w tym celu tzw. instrukcjami maskującymi ów cel. Stosując „kalkę" w tłu- maczeniu stosownego terminu z fachowej literatury psychologicznej moglibyśmy, nieczuli na poprawność językową, powiedzieć, że psychologowie posługują się „de- cepcją" (od ang. deception — „oszukaństwo; oszukiwanie; szachrajstwo; podstęp; wprowadzenie w błąd; okłamanie/ywanie", Stanisławski, 1968). Terminem decep- tion posługuje się, na przykład, Aronson i in. (1994, s. 65). Józef Radzicki tłumacz polskiego, PWN-owskiego wydania jego bardzo znanej pracy The social animal (poi. wyd.: Człowiek istota społeczna, 1995), przełożył ten termin jako „wprowa- dzanie w błąd" (s. 508). Osobiście wolę określenie: instrukcja maskująca ..., i nim będę się posługiwał, a nie „kalką" — „decepcja". Aronson (1995, s. 508) tak uzasadnia odwołanie się do tej, jak Czytelnik zorientuje się z lektury rozdz. 5., mało etycznej procedury: „...często konieczne jest ukrycie prawdziwego celu badań. Stawia to eksperymentatora-psychologa społecz- nego w pozycji reżysera filmowego, który ustala scenerię akcji, lecz nie mówi aktorowi, o czym jest cały film. Taka oprawa nosi nazwę historyjki fasadowej (ang. cover story — 7. B.) i ma na celu zwiększenie realizmu eksperymentalnego (ostat- nio Aronson i in., 1994, używają określenia realizm psychologiczny — por. pkt. 2.5.) przez stworzenie sytuacji, w której badany może zachowywać się w sposób naturalny, gdyż nie wiedząc, jaki właściwie aspekt jego zachowania jest przedmio- tem badania, nie jest zahamowany w swych reakcjach." Większość znanych eksperymentów, zwłaszcza z zakresu psychologii społecznej, odwoływała się do instrukcji maskujących. Bez nich psychologowi nie udałoby się uzyskać zamierzonego efektu. Dość wspomnieć tu chociażby tak znane ekspe- rymenty, jak Ascha nad konformizmem (uleganie naciskowi grupowemu) czy Mil- grama nad posłuszeństwem (podporządkowywanie się autorytetowi). Eksperymenty te nie ujawniłyby tak spektakularnych wyników, gdyby osoby badane były poin- formowane o prawdziwym celu oraz znały prawdziwy scenariusz eksperymentu. Badani, którzy wiedzieliby, że — jak w eksperymencie Ascha opisanym przez niego w pracy Opinie i nacisk społeczny (por. Asch, 1969; omówienie także w: Aronson, 1995, s. 34-39) — cztery osoby porównujące długość odcinków i zgodnie zeznające inaczej niż to widzi osoba badana wcześniej zostały poinstruowane przez dacza, że tak właśnie, niezgodnie ze stanem faktycznym mają postępować, nie ejmowałyby się tym ani trochę i mówiłyby to, co widzą „naprawdę" (wszak ozostałe cztery osoby badane też widzą to samo, a jedynie eksperymentator kazał i mówić „coś innego"). Utajnienie przed „prawdziwą" osobą badaną rzeczywiste- statusu osób wspólnie z nią oceniających długość narysowanych odcinków do- owadziło do tego, że aż 35% osób badanych ulegało naciskowi grupowemu i po- awało odpowiedzi zgodne z odpowiedziami współpracowników eksperymentatora, i niezgodne ze stanem faktycznym. Można zatem powiedzieć, że okłamując osoby ne Asch uzyskał bardzo ciekawy wynik informujący o psychologicznych me- lizmach nacisku grupowego. Pomysłowość badacza pozwoliła, stosunkowo nie- ielkimi kosztami („koszty" psychologiczne obciążające tego rodzaju eksperymen- są dyskutowane w rozdz. 5., pkt. 2.1. — Okłamywanie osób badanych) i za 20 — Metodologia badań. 305 pomocą prostych środków technicznych, wymodelować „kawałek" rzeczywistości psychologicznej. Jak Czytelnik już zdążył się zorientować, pomysłowość badacza połączona z łatwowiernością osoby badanej dały — uzyskane przez Ascha, Milgrama, Zim- bardo i innych psychologów — te, tak ciekawe i bulwersujące wyniki. Mogą one być, i faktycznie są, zachętą do nieograniczonego odwoływania się do tych, co prawda nieetycznych, ale pozwalających na spektakularne eksperymentowanie, pro- cedur maskujących cel badania. Czy jednak tylko względy natury etycznej powinny powstrzymywać psycho- logów przed bezrefleksyjnym stosowaniem instrukcji maskujących cel badana? Nie, nie tylko. Są jeszcze względy natury metodologicznej. O nich teraz kilka słów. Podstawą stosowania instrukcji maskujących jest przyjęcie założenia, że znajomość prawdziwych celów badania eksperymentalnego uniemożliwiłaby osobom badanym spontaniczne zachowanie się w sytuacji eksperymentalnej. W konsekwencji tego stanu rzeczy badacze nie mogliby wysuwać trafnych wniosków z przeprowadzo- nych badań. Można jednak zapytać psychologów-eksperymentatorów: skąd brać „nieskażonych" udziałem w badaniach psychologicznych badanych, którzy, na do- datek, powinni być tak naiwni, że uwierzą w to wszystko, co im psycholog-eks- perymentator powie (por. instrukcje stosowane przez Milgrama)? Na pewno nie spełniają tych kryteriów studenci, a studenci psychologii (a z nich rekrutują się na ogół badani) w szczególności. Osoby badane, niezależnie od stopnia pomysłowości badaczy włożonej w takie sformułowanie instrukcji maskujących, by badani nie domyślili się prawdziwego celu badania, i tak starają się dociec tego prawdziwego celu (pomocne są tu odczytywane przez nich oczekiwania badacza, wskazówki, których dostarczają elementy sytuacji badawczej itp. — por. rozdz. 4.), a ich za- chowanie się w sytuacji badawczej modyfikowane jest także przez tak silnie dzia- łającą zmienną jaką jest lęk przed oceną. Myślę tedy, że realistyczne będzie przy- jęcie założenia, iż osoba badana raczej nie ufa eksperymentatorowi i stara się sama odkryć prawdziwy cel eksperymentu. Może to wyzwalać u osób badanych dwojaką tendencję: (a) poznania oczekiwań badacza i zachowania się zgodnego z nimi oraz (b) poznania oczekiwań badacza i zachowania się niezgodnego z nimi, na przekór badaczowi. Dla zachowania w tajemnicy prawdziwego celu eksperymentu (treści hipotezy badawczej) psycholog nie może objaśnić wszystkich elementów procedury badawczej, a i instrukcja maskująca, nawet najbardziej pomysłowa, też nie jest w stanie ich objaśnić w sposób nie budzący, zwłaszcza u inteligentnej osoby badanej, żadnych wątpliwości. Sytuacja badawcza staje się więc w pewnym stopniu dwu- znaczna, a u osoby badanej wyzwala się szczególna motywacja do rozwikłania tej dwuznaczności. Kieruje się ona przy tym własną interpretacją celu badania, w którym bierze udział (zakładam tu, że ten udział jest całkowicie dobrowolny!), co wprowadza dodatkowe źródło zmienności zmiennej zależnej (dodatkową wariancję cząstkową Y). Konkludując, nierealistyczne jest przyjęcie założenia, że osoba badana jest uległa, łatwowierna i postrzega sytuację badawczą tak, jak to założył sobie eks- perymentator. Przyjęcie takiego założenia świadczyłoby bowiem o naiwności bada- 306 cza, który snując bardzo subtelne wywody teoretyczne stara się nie dopuszczać do świadomości faktu (bo tak mu wygodnie!), że „potężnym" źródłem wariancji błędu w badaniach psychologicznych jest interakcja, która zawiązuje się między bada- czem i osobą badaną, że osoba badana nie jest tylko „dwunożnym" szczurem labo- ratoryjnym, posłusznie i nabożnie reagującym tak, jak tego sobie życzy psycholog-- eksperymentator. Niestety, to źródło wariancji błędu nie zawsze jest przez psycho- logów kontrolowane na zadowalającym poziomie. Zdają się oni bowiem zapominać o wskazanych przez Rosenzweiga (1933) osobliwościach badania psychologiczne- go. W badaniach tego typu, co opisane badanie Ascha, należałoby zawsze wyjaśnić uzyskany wynik nie tylko w ramach danej teorii psychologicznej, ale, co nie mniej ważne, także próbować wyjaśnić go w kategoriach zmiennych kontekstu psycholo- gicznego przeprowadzonego badania — wskazówek sugerujących osobie badanej treść hipotezy badawczej, oczekiwań badacza, statusu motywacyjnego osoby bada- nej, jej lęku przed oceną, nastawienia kooperacyjnego itp. Względy natury etycznej i metodologicznej nakładają na badacza szczególny obowiązek dokładnego przeanalizowania instrukcji maskującej, którą zamierza się posłużyć. Z tą dyrektywą związana jest treść rozdz. 5. i następnego punktu niniej- szego rozdziału. 2.5. Realizm życiowy i realizm psychologiczny Nie jest łatwą sztuką zaplanować i przeprowadzić eksperyment z udziałem ludzi w charakterze obiektów badanych. W poprzednim punkcie starałem się pokazać, jakie „kłopoty" metodologiczne (pominąłem „kłopoty" etyczne) ma psycholog, który chce skutecznie zamaskować przed osobą badaną prawdziwy cel badania ekspe- rymentalnego. Obmyślenie prawdopodobnej „historyjki fasadowej" (cover story), w którą osoba badana byłaby skłonna „bez reszty" uwierzyć, nie jest wcale łatwe i — jak sądzę — niewiele jest wartościowych (w sensie: nie prowadzących do trywial- nych rezultatów w rodzaju: „różni ludzie w różnych sytuacjach zachowują się róż- nie") badań eksperymentalnych opartych na instrukcjach maskujących cel badania, które nie budziłyby wątpliwości metodologicznych krytycznie usposobionego psy- chologa. W pkt. 2.2 sporo miejsca poświęciłem na objaśnienie bardzo ważnego w psy- chologii empirycznej pojęcia kontroli zmiennych niezależnych istotnych dla danej Y. Idealny eksperyment to taki, w którym psycholog kontroluje wszystkie wpływy, jakim podlega osoba badana — i te, pochodzące od intencjonalnie wprowadzonych do planu eksperymentalnego zmiennych niezależnych (tzw. postępowanie ekspery- ntalne), o wpływie których na Y traktują hipotezy badawcze, i te, związane ze iennymi niezależnymi-ubocznymi, i wreszcie te, których źródłem są wszelkiego aju zmienne niezależne-zakłócające (w tym, bodajże najważniejsze dla psycho-ga, zmienne kontekstu psychologicznego). Rzecz jasna idealne eksperymenty ist-ieją tylko w wyobraźni badacza. W rzeczywistości musi on często dokonywać borów kompromisowych. 307 I I Jeden z kompromisów związany jest z wyborem między dobrze kontrolowa- nymi, ale za to dalece odbiegającymi od sytuacji życiowej, warunkami prowadze- nia badania eksperymentalnego (maksymalizacja kryterium metodologicznego), a dobrą imitacją sytuacji życiowej (maksymalizacja kryterium psychologicznego), ale, niestety, ubogą kontrolą zmiennych ważnych i zakłócających dla Y. Mówiąc jeszcze inaczej, jest to wybór między kontrolą a wiernością imitacji warunków życiowych przez warunki stworzone przez badacza w laboratorium psychologicz- nym. Niestety, nie da się zapewnić jednocześnie wysokiego stopnia kontroli zmiennych i równie wysokiego stopnia odtworzenia warunków życiowych w sy- tuacji eksperymentalnej. Teraz kilka słów o wierności imitowania przez warunki sytuacji eksperymen talnej, wytworzonej sztucznie w laboratorium, rzeczywistych warunków życia. I znowu odwołam się do Aronsona (por. Aronson i in., 1994, s. 58) i jego koncep cji „realistyczności" eksperymentu. Aronson mówi, iż każdy eksperyment może być realistyczny dwojako. ,SBfiStó# fpfts3uępiitnx cunr. ~ 'nmgjp-*? *?• Po pierwsze, można na niego patrzeć pod kątem jego podobieństwa do sytu- acji, którą „wymyśla" życie. Można wówczas mówić o realizmie życiowym (ang. mundane realism). Nie sądzę, aby eksperymenty Milgrama nad uległością cechował wysoki stopień realizmu życiowego. Po drugie, eksperyment, jak dobry film, powinien „wciągać" osobę badaną. Powinna ona wczuć się w swoją rolę, tak jak gdyby rzeczywiście była strażnikiem czy więźniem (eksperyment Zimbardo), rzeczywiście karała, występując w roli na- uczyciela, nieposłusznego ucznia, aplikując mu elektrowstrząsy do wysokości 450 V (eksperyment Milgrama). Identyfikowanie się osoby badanej z narzuconą jej, przez scenariusz badania eksperymentalnego, rolą oraz utożsamianie warunków eksperymentalnych z warunkami życiowymi, określa realizm psychologiczny (ang. psychological realism). Jeżeli spojrzymy, z tego punktu widzenia, na eksperymenty Milgrama i Zimbardo, to możemy powiedzieć, że cechował je wysoki stopień re- alizmu psychologicznego. Milgram jeszcze po roku spotykał się z częścią osób badanych w celach konsultacji ich udziału w jego badaniach. Z kolei Zimbardo był zmuszony przerwać swoje badania już po sześciu dniach, gdyż stopień identyfikacji osób badanych z rolami „strażników" i „więźniów" był tak wysoki, że przeraził eksperymentatorów: „... niektórzy chłopcy («strażnicy») traktują pozostałych jak nędzne zwierzęta, znajdując przyjemność w okrucieństwie, podczas gdy inni chłopcy («więźniowie») stali się służalczymi, odczłowieczonymi robotami, myślącymi jedynie o ucieczce, o swym własnym, indywidualnym przetrwaniu i o swej wzra- stającej nienawiści do strażników" (cyt. za: Aronson, 1995, s. 25). V Zapewniając planowanemu eksperymentowi wysoki stopień realizmu życiowe- go i psychologicznego, a zwłaszcza tego ostatniego, powinniśmy (o czym dokładnie wmzriz JJ zwracać i/wą?e /?a konsekwencje ełyczne udzJału osób badanych w dfe jt iv "" _\ i ' -t- | ł <- ! [i. r t > ir *• ł. f r t J r i *Vv I 1 , v » i » t » / t ! . • ,i ; n [ \ } ] ', m Grupa 1. I -I' s Grupa 2. Rys. 12.3. Nietrafny obraz (linia ciągła) rzeczywistej (linia przerywana) zależności Y od X — badacz ustalił, iż zależność Y od X ma charakter liniowy, gdy de facto ma ona charakter krzywoliniowy . r s G r u p a 3 . G r u p a 4 . Rys. 12.4 . Traf ny obra z (lini a ciąg ła) rzec zyw istej (lini a prze ryw ana) zale żnoś ci Y od X — bada cz ustal ił, iż zale żnoś ć Y od X ma char akte r krzy woli nio wy i de fact o ma ona char akte r krzy woli nio wy G dy jedn ak bada cz wyr óżni więk szą Jicz bę grup poró wna wcz ych (co naj mni ej jedn ak trzy. '), np. czte ry, któr ym przy pisa ne będą wart ości X: m, n, r, s: I 1 t 1 t 1 ł 1 t 1 [ X ] m in m n r s max JJJ to uzyska trafny obraz hipotetycznej zależności — por. rys. 12.4. Linia przerywana ilustruje faktyczną zależność, a linia ciągła — obraz tej zależności ustalony przez badacza. Ważne tu jest jeszcze jedno. Wartości zmiennej X, wyróżnione przez badacza powinny być równomiernie rozłożone wzdłuż kontinuum wartości X. Do jakiego wniosku prowadzi nas analiza tego przykładu? Jeżeli zmienna X, o której wpływie na Y traktuje hipoteza badawcza, jest zmienną de facto wielowar- tościową i postulowany w hipotezie związek Y z X jest związkiem krzywolinio- wym, to nie należy prowadzić badania eksperymentalnego opartego na porównaniu tylko dwóch grup (dwie wartości zmiennej X), gdyż może to nas doprowadzić do błędnych wniosków (por. rys. 12.1-3). Należy natomiast zadbać o to, aby wybrane wartości X rozłożone były równomiernie wzdłuż całego kontinuum wartości zmien- nej X (tak, jak to pokazuje rys. 12.4.). 4. Trafność planu eksperymentalnego i czynniki ją zakłócające Każdy plan E i qE należy rozpatrywać w kontekście (Campbell, Stanley, 1967; Cook, Campbell, 1979): (a) trafności wewnętrznej, (b) trafności zewnętrznej. Omówię teraz oba rodzaje trafności oraz czynniki je zakłócające. 4.1. Trafność wewnętrzna i czynniki ją zakłócające Trafność wewnętrzna planu eksperymentalnego jest warunkiem niezbędnym, bez spełnienia którego wyniki uzyskane na podstawie przeprowadzonego badania eksperymentalnego nie mogą być interpretowane w kategoriach jakiejś koncepcji psychologicznej, z,której została wywiedziona testowana przez badacza hipoteza traktująca o zależności zmiennej zależnej Y od zmiennej niezależnej-głównej X (por. TBO w świadomości metodologicznej — rozdz. 3., pkt. 3.). Pytanie o trafność wewnętrzną planu E czy qE, to pytanie o to, czy dana zmienna niezależna X rzeczywiście zadziałała na Y w badaniu realizowanym wg tego planu? Jeżeli na to pytanie ma paść odpowiedź twierdząca, to: (1) plan musi być adekwatny do danej hipotezy (i tak, na przykład, plany „0-1" nie są adekwatne do testowania hipotez zakładających zależność krzywoli niową zmiennej Y od zmiennej X); (2) badacz powinien kontrolować wszystkie czynniki mogące mieć — poza zmienną X (o części z nich mowa będzie niżej) — wpływ na zachowanie się (także to niespecyficzne) osób badanych w trakcie badania eksperymentalnego; (3) badacz powinien efektywnie manipulować zmienną X czyli powinien stwo- 313 rzyć takie warunki badania, które zapewnią maksymalizację wariancji zmiennej Y wyjaśnionej oddziaływaniem na tę zmienną postępowania eksperymentalnego X (efekty jego wpływu na Y można będzie oddzielić od szumu pochodzącego z nie kontrolowanych przez badacza źródeł). lsoj mrrrMmonwdi >vd '/nriiwoą SVJKLL'1 Najkrócej ujmując, plan trafny wewnętrznie to taki plan, który pozwala wy- eliminować alternatywne — do ujętych w hipotezie badawczej — wyjaśnienia za- obserwowanej zmienności zmiennej Y. Jest to podstawowa funkcja planu ekspe- rymentalnego (Czytelnik zwrócił zapewne w tym momencie uwagę na zbieżność idei trafności wewnętrznej z Ajdukiewicza metodą wnioskowania przez indukcję eliminacyjną — por. pkt. 2.1). Owe „alternatywne" wyjaśnienia zmienności Y zwią- zane są z czynnikami odnoszącymi się do sposobu organizacji, przebiegu samego badania eksperymentalnego realizowanego według danego planu, niespecyficznymi zachowaniami się osób badanych w sytuacji badania eksperymentalnego oraz wpły- wem czynników z otoczenia fizycznego i społecznego sytuacji badawczej. Do czynników zakłócających trafność wewnętrzną planu eksperymentalnego czy planu quasi-eksperymentalnego należą (Cook, Campbell, 1979, rozdz. 2. Vali- dity, s. 37-94): 1. Historia (ang. history). Im dłuższy czas dzieli pretest Y i posttest Y, tym bardziej prawdopodobne staje się to, że na osoby badane, poza postępowaniem eksperymentalnym (w grupie eksperymentalnej), zadziały jakieś zmienne z konteks tu zewnętrznego, w którym „zanurzone" jest prowadzone badanie. Mogą to być dokonujące się właśnie ważne przemiany społeczne, które mogą oddziaływać wzmacniając (albo osłabiając) wpływ zmiennej X na zmienną zależną. Sułek (1979 s. 73) podaje przykład badań rynkowych, w których oceniana jest skuteczność reklamy określonego towaru. Nie przewidziane przez badacza pojawienie się na rynku bardzo atrakcyjnego, nowego towaru, o tym samym przeznaczeniu co towar reklamowany, może spowodować spadek zainteresowania pierwszym towarem, a badacz może dojść do błędnego wniosku, iż reklama okazała się mało skuteczna. Czynnik historii może mieć duży, aczkolwiek ukryty, wpływ na uczniów w bada niach nad skutecznością oddziaływań wychowawczych i nauczających; w tego typu badaniach na ogół pretest Y przeprowadza się na początku roku szkolnego, a post test Y na końcu tego roku. Od wpływu tego czynnika wolne są na ogół ekspery menty laboratoryjne, prowadzone w dobTze kontrolowanych warunkach (m. in. za pewniona jest izolacja osób badanych od wpływów zewnętrznych, pozalaboratoryj- nych). Niestety, prowadząc badania w warunkach naturalnych (klasa szkolna, szpi tal, rodzina, fabryka), nie możemy, najczęściej, pozwolić sobie na taki „luksus". Musimy tedy radzić sobie inaczej — np. przez wybór takiego planu eksperymen talnego, w którym możliwa jest kontrola czynnika historii. 2. Do/rzewame (ang. mz/ura/żo/i). Działanie tego czynnika jest podobne do działama czynnika Aistoiii, z ta Jednak różnicy że źródłem zakłóceń Jest sam or- z efektami postępowania eksperymentalnego. Szczególnie narażone na oddziaływa- nie tego czynnika mogą być badania prowadzone na dzieciach. 3. Selekcja (ang. selectiori). Stronniczy dobór osób do grup — eksperymen talnej i kontrolnej może zwiększać prawdopodobieństwo potwierdzenia hipotezy badawczej. Wystarczy, że na przykład badacz dobierze do grupy ekspery- na rzecz obrony życia poczętego), a do grupy kontrolnej osoby Z ruchu feministy- cznego, aby uzyskać silny efekt oddziaływania eksperymentalnego, polegającego na kształtowaniu postaw antyaborcyjnych. „Odwracając" grupy, możemy uzyskać silny efekt postępowania eksperymentalnego polegającego na kształtowaniu postaw proaborcyjnych. W badaniach szkolnych dobór uczniów uzdolnionych do grupy eksperymentalnej „ułatwi" potwierdzenie hipotezy mówiącej o większej skuteczno- ści nowego programu nauczania. Jedynym antidotum na działanie tego czynnika jest randomizacja. Wszystkie badania, które nie są prowadzone wg planów zakła- dających randomizację (a więc wg planów qE), czyli losowe rozdzielanie osób z też losowo (a przynajmniej kwotowo) pobranej próby, podlegają wpływom tego czynnika. 4. Testowanie (ang. testing). Aby poznać „wyjściowy" poziom zmiennej za- leżnej w obu grupach, eksperymentalnej i kontrolnej, przed wprowadzeniem do grupy eksperymentalnej postępowania eksperymentalnego X badacz dokonuje po- miaru zmiennej Y (pretest Y). Takie pomiary, jak czas reakcji RT czy reakcja skórno-galwaniczna GSR nie mają wpływu na to, jak osoba badana „przyjmie" postępowanie eksperymentalne, ani na wyniki pomiaru końcowego zmiennej Y (posttest Y). Mówiąc inaczej, pomiary te nie uwrażliwiają osób badanych, a więc nie stanowią dodatkowego źródła wariancji zmiennej Y. Nie wchodzą też w inter- akcję ze zmienną X. Inaczej jednak przedstawia się sprawa z pomiarem ilorazu inteligencji IQ za pomocą np. Skali Inteligencji WAIS-R, z pomiarem opinii i po- staw za pomocą kwestionariuszy i skal postaw czy też z pomiarem wiadomości za pomocą standaryzowanych testów wiadomości. Może być bowiem tak, że to nie postępowanie eksperymentalne jest głównym (czy jedynym) źródłem zmienności Y, a fakt poddania pretestowi zmiennej Y osób z grup porównawczych lub (i) inter- akcja pretestu Y ze zmienną X. Sułek (1979, s. 76) zwraca też uwagę na to, że: „...sam fakt bycia badanym zmienia ludzi pod tymi względami, które są przedmio- tem badania. Przede wszystkim aktywizuje ich poznawczo: zwraca ich uwagę na pewne sprawy, skłania do szukania nowych o nich informacji, zachęca do myślenia o rzeczach, o których dotąd być może nawet nie myśleli, ukazuje nowe możliwości patrzenia na jakieś zagadnienia". Ponieważ badacz, na ogół, nie chce (i moim zdaniem — nie powinien!) rezygnować z przeprowadzenia pretestu Y, więc musi przeprowadzić badanie w taki sposób, aby nie rezygnując z pretestu Y, kontrolować jego wpływ na Y. Jest to w pełni możliwe jedynie wówczas, jeżeli badanie będzie przeprowadzone wg planu Solomona (plan 4.). Problemy metodologiczne, które rodzi stosowanie w badaniach psychologicznych (i nie tylko) pretestu Y zostały szczegółowo przedyskutowane w pracy autora (Brzeziński, 1989b): Eksperymentalne badanie zmian — metodologiczne problemy stosowania pretestu zmiennej zależnej. 315 5. Instrumentacja (ang. instrumentatioń). Wpływ tego czynnika związany jest z różnorakimi zmianami narzędzi pomiarowych, procedury ich stosowania i obli czania wyników (w mniejszym stopniu dotyczy to testów psychologicznych, któ rych istotą jest standaryzacja warunków ich stosowania — o ile, rzecz jasna, badacz nie złamie konwencji psychometrycznej), ze zwiększeniem doświadczenia (większa wprawa) osób stosujących te narzędzia, zmianą osób dokonujących pomiarów za pomocą owych narzędzi itp. Zmiany te obejmują okres dzielący pretest Y od post- testu Y. Oczywiście należy skrupulatnie przestrzegać standaryzacji warunków sto sowania pretestu Y oraz posttestu Y. Nie należy dokonywać zmian osób kodujących wyniki w pierwszym i drugim badaniu. Niestety nie da się uniknąć (może z wy łączeniem starannie wystandaryzowanych testów psychologicznych, jak np. skale inteligencji: WISC-R, WAIS-R; test Matryc Ravena; kwestionariusze osobowości: MMPI, 16 PF, STAI; kwestionarusz temperamentu FCZ-KT Strelaua i Zawadzkie go) wpływu czynnika nabywania wprawy z badania na badanie. Można jednak zminimalizować jego wpływ poprzez przeprowadzenie z osobami, które będą do konywać pomiarów, intensywnego treningu — na wzór opisanego w rozdz. 14. treningu sędziów kompetentnych. 6. Regresja statystyczna (ang. statistical regression). Zjawisko regresji staty stycznej związane jest z tendencją do podwyższania, w postteście Y, skrajnie ni skich i obniżania skrajnie wysokich wyników uzyskanych przez osoby badane w preteście Y. Wyniki mają tendencję do uśredniania się. Objaśnijmy do na przykła dzie zjawiska regresji do średniej, której podlegają ilorazy inteligencji dzieci wzglę dem ilorazów inteligencji ich rodziców: „Zgodnie z tą regułą, dziecko rodziców o inteligencji wyższej niż przeciętna będzie najprawdopodobniej miało II trochę niższy od nich, ale cały czas wyższy od równej 100 średniej dla populacji. Innymi słowy, iloraz inteligencji dziecka «ulega regresji», zbliżając się do średniej wartości II całej populacji. Gdyby poziom inteligencji rodziców był niższy od przeciętnego, wówczas ich dziecko miałoby II wyższy niż oni, ale jednak cały czas niższy od 100. W obu wypadkach można powiedzieć, że najlepszą prognozą dla dziecka jest liczba mieszcząca się w przedziale między średnią II jego rodziców a średnią po- pulacji wynoszącą 100" (Seligman D., 1995, s. 101). W przypadku badań prowa- dzonych na osobach, które zostały rozdzielone do grup porównawczych z uwagi na swe skrajnie niskie/wysokie wyniki uzyskane w preteście Y można się spodzie- wać, że przynajmniej niektóre z tych osób podwyższą/obniżą wyniki posttestu Y nie na skutek zastosowanej przez badacza manipulacji eksperymentalnej, ale na skutek zadziałania czynnika regresji statystycznej. Efekt regresji statystycznej może nałożyć się na efekt postępowania eksperymentalnego, co z kolei może doprowa- dzić do przeszacowania wielkości tego ostatniego. Rada dla badacza: nie należy prowadzić badań na osobach o skrajnie niskich/wysokich wynikach w preteście Y (np. uczniowie „dwójkowi" czy „szóstkowi"; osoby manifestujące skrajnie ni- skie/wysokie nasilenie postaw). 7. Utrata osób badanych (ang. mortality). Jeżeli eksperyment prowadzony jest przez dłuższy czas (np. okres jednego roku szkolnego), to należy liczyć się z tym, iż liczebność próby ulegnie zmniejszeniu. Jeżeli z grupy eksperymentalnej, podda- 316 nej intensywnemu oddziaływaniu eksperymentalnemu, ubędą osoby, które mogłyby uzyskać w postteście Y wyniki bardzo się różniące od wyników pretestu Y, to średni wynik pomiaru końcowego zmiennej Y w porównaniu ze średnim wynikiem pretestu będzie w jakimś stopniu zaniżony. Podobnie, gdy ubędą z grupy ekspery- mentalnej (np. klasy szkolnej, w której prowadzony jest „eksperyment pedagogicz- ny") osoby uzyskujące słabe oceny (np. uczniowie „dwójkowi"), to będzie to miało wpływ na średni wynik posttestu Y; w konsekwencji tego pomyślnego dla hipotezy badawczej biegu zdarzeń różnica między średnimi wynikami posttestu w grupach, eksperymentalnej i kontrolnej, będzie zawyżona. Przy dużych ubytkach osób o skrajnie niskich/wysokich wynikach pretestu Y może dojść do znaczących zafałszo- wań końcowych rezultatów, w świetle których badacz przyjmie lub odrzuci hipo- tezę badawczą. 8. Interakcja selekcji z (ang. interactions with selection): (8—a) historią, (8-b) dojrzewaniem, (8-c) instrumentacją. W tym przypadku mamy do czynienia z nie korzystnym zbiegnięciem się wpływów czynnika selekcji, który wchodzi w inter akcję z, kolejno, historią, dojrzewaniem i instrumentacją. Dobór dzieci o zróżnico wanym tempie rozwoju umysłowego do grup porównawczych i prowadzenie badań przez dłuższy okres (np. jednego roku) może być źródłem różnicy wzrostu wyni ków w posttestach zmiennej zależnej Y. Podobne efekty interakcyjne wystąpić mo gą w przypadku dwóch pozostałych czynników — historii i instrumentacji. 9. Przenikanie informacji związanych z postępowaniem eksperymentalnym z grupy do grupy, albo imitowanie postępowania eksperymentalnego (ang. diffusion or imitation of treatmeni). Niemożność fizycznego odseparowania grup, ekspery mentalnej i kontrolnej, od siebie i — tym samym — umożliwienie osobom z grupy eksperymentalnej nawiązania kontaktów z osobami z grupy kontrolnej (i na odwrót) może być niepożądanym źródłem dodatkowej wariancji zmiennej Y. Osoby z jednej grupy mogą uczyć się „prawidłowego" zachowania się, którego, ich zdaniem, ocze kuje od nich badacz. W konsekwencji owej nie chcianej przez badacza komunikacji osób z obu grup, zatarciu (lub pomniejszeniu) mogą ulec różnice (zaplanowane przez badacza!) między obiema grupami, które — w intencji badacza — mają tłumaczyć zmienność zmiennej Y. Ten czynnik może być szczególnie trudny do kontrolowania w tzw. eksperymentach terenowych, prowadzonych w warunkach naturalnych, w których możemy, na przykład, porównywać skuteczność różnych akcji profilaktycznych (odnośnie palenia papierosów czy używania narkotyków). Jeżeli w sąsiadujących ze sobą gminach, czy nawet województwach, prowadzimy badania nad konkurencyjnymi programami społecznymi, to informacje o nich będą zapewne przenikać do osób, do których nie są one (zgodnie z planem badania) adresowane. Oczywiście, badania typu laboratoryjnego, w których mamy możli wość izolowania osób, do których kierowane są różne instrukcje oraz oddziaływa nia eksperymentalne, wolne są od tego typu zakłóceń. 10. Kompensujące, programowe zróżnicowanie grup porównawczych, wyrów nanie ich traktowania (ang. compensatory eąualization of treatments). Znowu, jak w pkt. 9., czynnik ten dotyczy przede wszystkim badań prowadzonych w warunkach naturalnych. Jeżeli, w szeroko zakrojonych badaniach terenowych, grupa ekspery- 317 mentalna potraktowana została przez badacza w sposób postrzegany przez społecz- ność jako „wyróżniający" jej członków (np. specjalny program wsparcia społecz- nego obejmujący dzieci pochodzące ze środowisk kulturowo zaniedbanych), to spo- łeczność lokalna może nie zaaprobować owej „dyskryminacji" osób nie objętych „specjalnym" programem adresowanym jedynie do członków grupy eksperymental- nej i będzie podejmować inicjatywy mające na celu zniesienie różnic międzygru- powych, wprowadzonych przez eksperymentatora. 11. Kompensowanie mniej pożądanych warunków i spowodowane nim rywa- łizacyjne zachowanie się osób badanych (ang. compensatory rivalry by respondents recehing less desirable treatments). Także i ten czynnik występuje w badaniach prowadzonych w warunkach naturalnych — zwłaszcza gdy prowadzone są one na „scenie społecznej", gdy budzą szczególne zainteresowanie społeczne. Jeżeli postę powanie eksperymentalne postrzegane jest jako atrakcyjne i wyróżniające osoby z grupy eksperymentalnej, to może to wywołać u osób z grupy kontrolnej zacho wania rywalizacyjne (nie muszę, rzecz jasna, dodawać, że nie są one pożądane z punktu widzenia eksperymentatora), których celem jest pokazanie badaczowi, że są one równie dobre, jak osoby z grupy eksperymentalnej i też zasługują na takie, „lepsze" traktowanie. W efekcie, zmniejszone będą (a w skrajnym wypadku nawet zniesione) różnice między grupami — eksperymentalną i kontrolną. 12. Obrażanie się osób badanych, które znalazły się w mniej pożądanych warunkach (ang. resentful demoralization of respondents receiving less desirable treatments). Osoby z grupy kontrolnej, które znalazły się w „gorszych" — w po równaniu z grupą eksperymentalną — warunkach, mogą demonstrować swoją nie chęć wobec eksperymentatora i zachowywać się specjalnie gorzej, poniżej swoich możliwości; jest to reakcja na pozbawienie ich pożądanych wartości, które dostępne są, za sprawą eksperymentatora (tak to postrzegają osoby z grupy kontrolnej!), osobom z grupy eksperymentalnej. Takie zachowanie się osób z grupy kontrolnej powiększy różnice dzielące grupę eksperymentalną i kontrolną i będzie stwarzało korzystniejsze warunki akceptowania hipotezy badawczej (przeszacowanie wielko ści efektu eksperymentalnego). Efekt działania tego czynnika wystąpi wówczas, gdy nie ma możności zablokowania informacji o grupie eksperymentalnej dociera jących do grupy kontrolnej, a więc w badaniach prowadzonych w warunkach tere nowych, a nie laboratoryjnych. Tyle, jeśli chodzi o krótką charakterystykę czynników zakłócających trafność wewnętrzną planu eksperymentalnego i quasi-eksperymentalnego. Przejdźmy teraz do omówienia drugiego rodzaju trafności — trafności zewnętrznej oraz czynników ją zakłócających. 4.2. Trafność zewnętrzna i czynniki ją zakłócające Trafność zewnętrzna planu eksperymentalnego (czy planu quasi-eksperymentalne- go) związana jest z pytaniem o zakres wniosków, które badacz sformułował na 318 podstawie wyników uzyskanych z badania eksperymentalnego. Mówiąc inaczej, dotyczy ona zakresu generalizacji (uogólniania) tych wniosków. Przeanalizujmy teraz warunki od których zależy trafność zewnętrzna planu E czy qE. Po pierwsze, badacz chce (i powinien) wiedzieć, czy uzyskane wyniki mogą być podstawą do formułowania uogólnień na większą zbiorowość osób, na całą populację, czy też mogą być potraktowane jedynie jako podstawa do sporządzenia psychologicznego portretu osób z przebadanych grup — eksperymentalnej i kon- trolnej. Czytelnik wie już, że badanie na stosunkowo mało licznych grupach nie jest prowadzone po to, aby dowiedzieć się „czegoś" o specyfice psychologicznej tych grup, ale po to, aby dowiedzieć się czegoś o specyfice całej zbiorowości (populacji), z której te osoby zostały wyłonione, i które można traktować jako typowe dla tej zbiorowości. Oczywiście najlepszym rozwiązaniem jest posłużenie się próbą losową, albo — jeżeli losowy dobór próby przekracza możliwości eko- nomiczne i techniczne badacza — próbą kwotową. Po drugie, problem trafności zewnętrznej, to nie tylko problem reprezentatyw- ności próby, na której przeprowadzone było badanie empiryczne, ale to także prob- lem reprezentatywności warunków, w których przeprowadzono badanie. Inaczej mówiąc, jest to problem typowosci warunków badania dla warunków pozaekspe- rymentalnych, na które będą uogólniane wyniki przeprowadzonego badania. Trochę to przypomina Aronsonowskie (por. pkt. 2.5) pojęcie realizmu życiowego. Prowa- dząc badanie w laboratorium imitującym, na przykład, klasę szkolną i uzyskując jakieś wyniki, badacz musi się zastanowić nad tym, na ile możliwe będzie uzyska- nie takich samych (czy maksymalnie zbliżonych) wyników gdy — na podstawie opublikowanych przez niego rezultatów badawczych — „prawdziwy" nauczyciel będzie prowadził lekcje w „prawdziwej" klasie szkolnej, w której ławkach siedzieć będą „wylosowani przez życie uczniowie". Warunki, w których sprawdzano skute- czność jakiejś manipulacji eksperymentalnej, np. nowego programu terapeutyczne- go czy nowego programu reklamowego, nie powinny odbiegać od tych, w jakich będzie — już poza laboratorium — stosowany dany program terapeutyczny, edu- kacyjny czy reklamowy wobec osób, które z przeprowadzonymi przez badacza badaniami nie miały nic wspólnego. Osoby, wobec których badacz stosuje określo- ne pomiary (posługując się aparaturą, testami, obserwacją, rozmową) nabywają no- wego doświadczenia związanego z uczestniczeniem w badaniach naukowych, z graniem roli osoby badanej. To zaś może mieć wpływ na sposób ich zachowania się w sytuacji eksperymentalnej. To zachowanie wcale nie musi być takie samo (i na ogół nie jest) w przypadku osób, które nie będą miały żadnego kontaktu ani z badaczem, ani ze stosowanym przez niego instrumentarium. Mówiąc krótko, jeżeli wyniki eksperymentu mają być przeniesione poza labo- ratorium, doświadczenie eksperymentalne osób badanych nie powinno mieć żadne- go wpływu na wielkość stwierdzanego przez badacza efektu eksperymentalnego (ani na jego kierunek). Niestety wiele badań prowadzonych przez psychologów, pedagogów czy socjologów nie jest wolnych od owych wpływów ograniczających — niekiedy drastycznie — zakres formułowanych przez badacza wniosków. I jeszcze jedno, w dużych badaniach eksperymentalnych prowadzonych w wa- rankach naturalnych badacz korzysta z pomocy wielu współpracowników, których zadaniem jest prowadzenie pomiarów, ocenianie skuteczności postępowania ekspe- rymentalnego (sędziowie kompetentni) czy prowadzenie zabiegów eksperymental- nych (np. zabiegów terapeutycznych czy lekcji w eksperymentalnych klasach szkol- nych). Osoby te są specjalnie przygotowane do pełnienia wyznaczonych im przez scenariusz badania ról. Ich kompetencje będą zapewne wyższe od kompetencji „zwykłych" terapeutów czy nauczycieli. Zatem należy się spodziewać, że sposób prowadzenia programów oraz oceny ich skuteczności będą się różniły od tych, które będą stosowane w praktyce. Po trzecie, o trafności zewnętrznej traktuje też następujące pytanie: czy uzy- skiwane przez badacza wartości zmiennych zoperacjonalizowanych (z uwagi na określone narzędzie pomiarowe) nie zniekształcają rzeczywistych wartości zmien- nych przysługujących osobom z populacji, które nie będą — w warunkach „życio- wych" — przed wprowadzaniem określonego postępowania, wzorowanego na po- stępowaniu eksperymentalnym, poddawane pretestom Yl Wyobraźmy sobie następującą sytuację, w której badacz przystępuje do opera- cjonalizacji zmiennej „lęk". Można ją przeprowadzić na trzy sposoby. Po pierwsze, można przyjąć, iż odmienne instrukcje słowne udzielane osobom badanym będą wywoływały lęk o różnym natężeniu. Po drugie, można założyć, iż zagrożenie uderzeniem prądem elektrycznym (jak w badaniach Milgrama) o różnym napięciu będzie wywoływało u osób badanych proporcjonalne do napięcia prądu natężenie lęku. Wreszcie po trzecie, można dobrać osoby tak, by różniły się stopniem natę- żenia lęku, przy czym każdej wartości tej zmiennej odpowiadałaby pewna liczba punktów uzyskana przez nie w teście psychologicznym (np. STAI) przeznaczonym do pomiaru lęku. Rodzi się zaraz pytanie: czy trzy, wyżej przedstawione metody operacjonalizacji zmiennej „lęk" są równoważne? Psycholog-specjalista od proble- matyki osobowości i różnic indywidualnych odpowie, że nie. Zwłaszcza trzeci spo- sób wyraźnie odstaje od pozostałych. Ten problem pociąga za sobą kolejne pytania. Który z wyżej przedstawionych sposobów operacjonalizacji jest najlepszy? Czy przedstawione sposoby są w ogóle poprawne? Czy istnieje jakiś inny sposób i do- piero on jest poprawny? Jak widać są to trudne pytania. Niełatwo na nie udzielić jednoznacznej odpowiedzi. Po czwarte, z trafnością zewnętrzną związany jest też problem czasu, w któ- rym badacz przeprowadził badanie. Między czasem, w którym przeprowadzono badanie i czasem, w którym dokonano generalizacji wyników z tego badania oraz ich ewentualnej aplikacji może występować długa przerwa. Może ulec zmianie cały kontekst historyczny, w którym osadzone było badanie. Zwłaszcza badania świa- domości społecznej są wrażliwe na tego typu zmiany. Próbę, na której prowadzone były badania może cechować inne doświadczenie historyczne, niż populację, na którą będą uogólniane wyniki tego badania. Do czynników zakłócających trafność zewnętrzną planu eksperymentalnego czy planu quasi-eksperymentalnego należą (Cook, Campbell, 1979, s. 73-74): 1. Interakcja selekcji z postępowaniem eksperymentalnym (ang. interaction of selection and treatmeni). Nierespektowanie zasady randomizacji doprowadzić mo- 320 że do tego, że w grupie eksperymentalnej znajdą się osoby bardziej podatne na postępowanie eksperymentalne niż w populacji, o której zakładamy, że z niej pochodzi badana próba. Z kolei w grupie kontrolnej znajdą się osoby znacząco mniej podatne na postępowanie eksperymentalne niż populacja, na którą badacz ma zamiar uogólnić wnioski z badania. Wystąpi wówczas efekt interakcji selekcji osób do obu grup porównawczych ze zmienną X. Przykładowo, nowa metoda nauczania może dać bardzo dobre rezultaty w jednej grupie, a w drugiej nie, gdyż w pierwszej (eksperymentalnej) były dzieci o wysokim poziomie inteligencji, a w drugiej (kontrolnej) poziom inteligencji dzieci był niższy od przeciętnej w popu- lacji. 2. Interakcja warunków badania z postępowaniem eksperymentalnym (ang. interaction of setting and treatment). Badania prowadzone w „cieplarnianych" wa runkach, tj. na przykład, w tzw. szkołach eksperymentalnych stale współpracu jących z opiekującymi się nimi uniwersytetami (na ogół pracują w takich szko łach lepiej przygotowani profesjonalnie nauczyciele, szkoły są lepiej wyposażone, la i uczniowie różnią się od uczniów z typowych szkół) dadzą wyniki, które — można spodziewać się tego — będą obciążone. Podobnie, prowadzenie badań w uczelnianych klinikach psychiatrycznych może dać rezultaty inne od tych, które uzyskać można gdy badania prowadzone są w dużych, prowincjonalnych szpitalach psychiatrycznych. 3. Interakcja historii z postępowaniem eksperymentalnym (ang. interaction of history and treatment). Prowadzenie badań w okresie historycznym szczególnie brzemiennym w wydarzenia absorbujące osoby badane (np. w okresie transfor macji ustrojowej) może „sprzyjać" hipotezie badawczej. Gdyby powtórzyć ta kie badanie w innych, „spokojniejszych" warunkach historycznych, to mogłoby się okazać, że wyniki tego drugiego badania nie pokrywają się z wynikami po przednimi. Ważnym czynnikiem zakłócającym trafność zewnętrzną planu eksperymental- nego, wyróżnionym w innych opracowaniach (por. Campbell, Stanley, 1967; Ro- senthal, Rosnow, 1984), który, jak sądzę, warto wyraźnie wyodrębnić, zwłaszcza gdy się rozważa praktykę badawczą takich nauk, jak psychologia, socjologia czy pedagogika jest: 4. Interakcja pretestu Y z postępowaniem eksperymentalnym (ang. interaction ofpretesting and treatment). Wiele stosowanych w naukach behawioralnych narzę dzi pomiarowych (w szczególności testów inteligencji, testów wiadomości, skal postaw) uwrażliwia osoby badane, które zostały poddane pretestowi Y. Są to osoby „inaczej" podatne na oddziaływanie zmiennej X, niż osoby, które nie są (nie będą) poddawane procedurze pretestu Y. Populacja, na którą badacz będzie chciał uogól nić wnioski z badania, oczywiście nie będzie poddawana pretestowi Y przed zasto sowaniem wobec niej określonych zabiegów opartych na wynikach wcześniej prze prowadzonych badań eksperymentalnych, poprzedzonych przeprowadzeniem prete stu Y. W rezultacie wystąpienia efektu interakcji pretestu Y ze zmienną X może okazać się, że wyniki uzyskane z końcowego badania grupy osób poddanych pre testowi Y będą niereprezentacyjne dla populacji, która nie będzie podlegała testo- 21 — Metodologia badań.. 321 waniu, a z której pobrano próbę do badania. Na przykład, samo badanie postaw przed wprowadzeniem postępowania eksperymentalnego, którego celem jest wywo- łanie ich zmian, może przyczynić się do tego, że osoby badane zaczną zwracać uwagę na pewne obiekty w swoim otoczeniu, zaczną analizować swoje zachowanie w stosunku do pewnych osób, postępowań itp., mimo iż dotychczas tego nie robiły. To uwrażliwienie może zwiększyć podatność osób badanych na postępowanie eks- perymentalne, a w konsekwencji zmiany postaw będą głębsze. Jednakże nie może- my spodziewać się zmian o takiej samej wielkości w przypadku całej populacji, która przecież — powtarzam — nie będzie poddana procedurze pretestu Y. 4.3. Statystyczny kontekst trafności Trafność planu eksperymentalnego musi być też rozpatrywana w kontekście sto- sowanej przez badacza analizy statystycznej danych pozyskanych z przeprowa- dzonego badania. W przypadku odmiany jedno-jednozmiennowej badacz posługuje się testami istotności różnic — parametrycznymi (test i) i nieparametrycznymi (np. test chi-kwadrat czy test Wilcoxona). Z kolei plany eksperymentalne jedno-- wielozmiennowe i wielo-wielozmiennowe oparte są na statystycznym modelu jednowymiarowej analizy wariancji (ANOVA) i wielowymiarowej analizy warian- cji (MANOVA). Posłużenie się jakimś testem statystycznym zakłada respektowa- nie określonych założeń tworzących jego model statystyczny. W przypadku bardzo popularnego testu t są to: (a) założenie o normalności rozkładu zmiennej Y w porównywanych populacjach oraz (b) założenie o homogeniczności wariancji roz- kładów zmiennej Y w porównywanych populacjach. Pogwałcenie przez badacza owych założeń doprowadzić może do nietrafnych decyzji odnośnie testowanych hipotez. Pamiętać też należy o tym, że badacz dokonuje zabiegu operacjonalizacji zmiennych. Zatem porównywane przez niego wyniki (zmiennej Y): posttestów Y, pretestów Y czy posttestu Y z pretestem Y w różnych kombinacjach grup porów- nawczych będą w jakiejś mierze obciążone realną rzetelnością narzędzi pomiaro- wych (np. testów psychologicznych, za pomocą których badacz określa początko- wy i końcowy poziom zmiennej Y w porównywanych grupach — przed wprowa- dzeniem i po zakończeniu postępowania eksperymentalnego). Problem ten zgłę- biam w pracy: Brzeziński (1989b). Tam też zwracam uwagę na problemy meto- dologiczne, jakie rodzą się, gdy badacz zechce ocenić wielkość efektu ekspe- rymentalnego na podstawie tzw. wyników różnicowych („posttest Y — pretest ł"1 — w grupie eksperymentalnej i kontrolnej, odpowiednio) — m.in. analizuję pa- radoks pomiarowy występujący przy pomiarze zmian, a opisany przez Overalla i Woodwarda (1975). Nie będę tu więcej pisał na ten temat, gdyż problemy związane ze stosowa- niem testów statystycznych w badaniach eksperymentalnych omawiam w pkt. 6. niniejszego rozdziału oraz w rozdz. 11. (zwłaszcza pkt. 2.-4.). 322 4.4. Odniesienie do teorii To wszystko co badacz przeprowadził przygotowując dane badanie eksperymental- ne, a więc: (a) sformułowanie hipotezy badawczej (por. rozdz. 8.), (b) zdefiniowanie zmiennych oraz ich operacjonalizacja (por. rozdz. 7.), (c) wybór adekwatnego do hipotezy planu eksperymentalnego (por. pkt. 5. tego rozdziału), (d) dobór próby z populacji oraz jej podział na grupy porównawcze (por. rozdz. 9.), ma swoje uzasadnienie w teorii psychologicznej, która stanowi rację dla zaplanowa- nego i przeprowadzonego przez badacza badania eksperymentalnego. Eksperyment rozpatrywany poza kontekstem teorii (tak jak to chciał przed laty Skinner, gdy formułował słynne pytanie: „Czy teorie uczenia się są niezbędne?" i odpowiadał na nie przecząco — por. Skinner B.F., 1950) stanowi jedynie pustą atrapę. Czytel- nik zechce wrócić do rozdz. 3., pkt. 3., w którym omówiona została struktura świadomości metodologicznej badacza oraz zwrócić — jeszcze raz! — uwagę na podstawowy jej element TBO (Teoria badanego obiektu). Wyjście z określonej teorii psychologicznej (TBO), i powrót do niej, w celu zinterpretowania uzyskanych w eksperymencie (trafność wewnętrzna!) wyników przed ich uogólnieniem (traf- ność zewnętrzna!) na daną populację i warunki „życiowe", przesądza o naukowości podejmowanego przez badacza badania eksperymentalnego. Poza teorią psychologi- czną nie ma eksperymentu psychologicznego, chyba, że przestaniemy traktować psychologię jako naukę empiryczną. 5. Odmiany planów eksperymentalnych 5.1. Plany jedno-jednozmiennowe, dwuwartościowe („0-1") W tym punkcie przedstawię cztery najbardziej rozpowszechnione plany ekspery- mentalne (plany: 1.—4.) oraz dwa mniej typowe, które mają zobrazować Czytelni- kowi możliwości konstruowania nowych planów w zależności od konkretnych po- trzeb (plany: 5. i 6.). Nie będę tu natomiast omawiał planów qE, gdyż można je stworzyć przez pogwałcenie założeń definicyjnych planu E (np. nierespektowanie zasady randomizacji czy nieuwzględnianie grupy kontrolnej, jak to ma miejsce w planach jednogrupowych). Wygodnie będzie, jeżeli wpierw objaśnię oznaczenia, które wystąpią przy pre- zentacji poszczególnych planów. X — zmienna niezależna-główna (inaczej: postępowanie eksperymentalne); zmienna X przyjmuje dwie wartości — w grupie eksperymentalnej przyjmuje war- 2i« 323 tość „1" (po prostu oddziałuje na zmienną Y; osoby badane są poddane jej wpły- wowi); ~X — zmienna niezależna-główna przyjmuje, w grupie kontrolnej, wartość „0" (nie oddziałuje ona na zmienną Y; osoby z tej grupy nie są poddane jej wpływowi); czasami osobom z grupy kontrolnej podaje się tzw. placebo, czyli np. jeżeli osoby z grupy eksperymentalnej otrzymują jakiś lek, to osoby z grupy kontrolnej otrzy- mują „coś", co łudząco przypomina ten lek, ale nie zawiera żadnych substancji aktywnych chemicznie (idzie o to, aby wyeliminować, jako potencjalne źródło wy- jaśnienia zaobserwowanej zmienności Y, zarówno samą czynność podawania leku, jak i świadomość jego otrzymywania czy wiarę w jego skuteczność); Y — zmienna zależna; Yp — pomiar początkowy zmiennej zależnej Y (inaczej: pretest Y), czyli po- miar zmiennej Y przeprowadzony na początku badania — przed wprowadzeniem postępowania eksperymentalnego do grupy eksperymentalnej oraz przed wprowa- dzeniem placebo do grupy kontrolnej (jeżeli badacz nie przewiduje wprowadzania placebo do grupy kontrolnej, to jedynie przeprowadza pretest Y w tym samym czasie co w grupie eksperymentalnej); obok symbolu p będzie występowało też oznaczenie grupy, np. Y2p należy odczytać jako: „pomiar początkowy zmiennej Y w grupie drugiej"; Yk — pomiar końcowy zmiennej zależnej Y (inaczej: posttest Y), czyli pomiar zmiennej zależnej Y przeprowadzony po zakończeniu badania — po wprowadzeniu do grupy eksperymentalnej zmiennej X (postępowania eksperymentalnego); obok symbolu k będzie występowało też oznaczenie grupy, np. Y1k należy odczytać jako: „pomiar końcowy zmiennej Y w grupie pierwszej"; R — randomizacja czyli losowe rozdzielenie osób badanych do grup porów- nawczych; > — w przypadku hipotez kierunkowych (jednostronnych — prawostronnych czy lewostronnych) przeciętna wartość zmiennej zależnej w danej grupie powinna być „lepsza" (tzn. albo wyższa, albo niższa — w zależności od „kierunku" różnicy) od przeciętnej wartości zmiennej zależnej w drugiej grupie, z którą ta pierwsza jest porównywana; „lepsza", tzn. albo wyniki pierwszej grupy przewyższają wyniki grupy drugiej (np. wyższy wynik w teście wiadomości z matematyki, wyższy iloraz inteligencji w skali inteligencji WAIS-R), albo są od wyników drugiej grupy niższe (np. niższy wynik w kwestionariuszu objawów depresyjnych BDI, niższy wynik w kwestionariuszu lęku STAF); jeżeli badacz testuje hipotezy bezkierunkowe (dwu- stronne), to powinien wykazać jedynie, że porównywane grupy różnią się (znak „>" należy zastąpić znakiem „*"). Poszczególne plany omawiane będą wg tego samego porządku: (a) graficzny schemat planu, (b) przebieg badania — kolejne kroki, które badacz musi wykonać, (c) warunki potwierdzenia hipotezy badawczej, (d) kontrola czynników zakłócających trafność wewnętrzną i zewnętrzną planu, (e) zastosowania planu. 324 5.1.1. Plan 1. — z grupą kontrolną, z pomiarem początkowym i końcowym zmiennej zależnej (a) R R Yi,, X Yu Grupa 1. Grupa 2. Plan 1. Plan z grupą kontrolną, z pomiarem początkowym i końcowym zmiennej zależnej (b) Badanie wg tego planu przebiega w trzech etapach. Pierwszy — przepro wadzenie pretestu Y w grupie 1. i 2. Drugi — wprowadzenie do grupy 1. (ekspe rymentalnej) zmiennej X (postępowania eksperymentalnego) oraz pozostawienie w warunkach nie zmienionych (lub podanie placebo) grupy 2. (kontrolnej). Trzeci — przeprowadzenie posttestu Y w obu grupach. (c) Aby potwierdzić hipotezę badawczą, powinno się wykazać, iż: — Spełniony jest warunek wstępny, bez czego nie można przejść do dalszych analiz: v - v Warunek wstępny mówi, iż grupy powinny „startować" z tego samego pozio- mu zmiennej Y. Gdyby tak nie było, to trudno byłoby — po zakończeniu całego badania — ocenić wielkość rzeczywistego (czystego) przyrostu lub obniżenia war- tości zmiennej Y wskutek oddziaływania na nią zmiennej X. Jeżeli wyjściowy po- ziom zmiennej Y w grupie eksperymentalnej byłby wyższy od wyjściowego pozio- mu tej zmiennej w grupie kontrolnej (i byłoby to zgodne z kierunkiem różnicy zakładanym w hipotezie), to hipoteza badawcza znalazłaby się w korzystniejszej sytuacji testowej. Końcowe porównanie wartości zmiennej 7 w obu grupach byłoby przeszacowane (na „korzyść" hipotezy badawczej). — Spełnione są następujące warunki potwierdzenia hipotezy: Ylk > Y2k, jeżeli nie zakładamy, iż w grupie kontrolnej też powinny wystąpić zmiany w danym kierunku (np. klasa szkolna nauczana wg tradycyjnego programu nauczania czy pacjenci leczeni tylko farmakologicznie, bez wspomagania psychoterapeuty- cznego), to powinniśmy dodatkowo oczekiwać, iż: W przypadku sprawdzania hipotez mówiących o względnej efektywności (na- uczania, terapii, modyfikacji zachowania itp.) dwóch różnych programów oddzia- ływania, warunek potwierdzenia hipotezy badawczej najlepiej wyrazić w postaci następującego porównania: D\ > D2, gdzie: D, = Ylk - ylp, D2 = Y2k - Y2p. Zauważmy, że absurdalne jest założenie, iż Dx * D2, gdyż w takiej sytuacji oba wyniki (Z), > D2 oraz Dx < D2) uznane byłyby przez badacza za równie „do- 325 bre". To zaś, po przełożeniu na język praktyki oznaczałoby, iż nowa metoda może być albo „lepsza" od tradycyjnej (przyjęcie takiego założenia teoretycznego i prak- tycznego czyni zasadnym całe badanie), albo „gorsza" (!) od niej (czego raczej trudno oczekiwać od sensownie myślącego badacza, gdyż zakłada on, w najgor- szym przypadku, iż okaże się ona co najmniej równie dobra co metoda tradycyjna; oczywiście trudno taki wynik uznać za sukces badacza). Ważne jest to, nie tylko w kontekście tego planu, iż badacz musi dostosować warunki potwierdzenia hipotezy („<", „>", „*") do kierunku różnicy, lub jego braku, założonego w hipotezie badawczej. W przeciwnym przypadku będzie się stosowało kryteria bezkierunkowe („*") wobec hipotez de facto kierunkowych („>", „<")• (d) Randomizacja i przeprowadzenie w obu grupach zarówno pretestu Y, jak i posttestu Y sprawia, że kontrolowane są wszystkie czynniki zakłócające trafność — z wyjątkiem interakcji pretestu Y z postępowaniem eksperymentalnym X, zakłó cającej trafność zewnętrzną. Jeżeli badacz podejrzewa, że zastosowana przez niego metoda pomiaru zmiennej Y (jak np. skala postaw, test wiadomości) może uwra żliwić osoby badane, to powinien, bezwzględnie, zrezygnować z tego planu — najlepiej na rzecz planu 4. (e) Jest to podstawowy plan E i — jak się Czytelnik przekona — wchodzi on w skład bardziej rozbudowanych planów, np. planu 4. Zawodzi on w przypadku posługiwania się przez badacza metodami, które wprowadzają tzw. efekt pretestu i są dodatkowym, nie kontrolowanym przez badacza źródłem wariancji zmiennej Y. 5.1.2. Plan 2. — z grupą kontrolną, bez pomiaru początkowego zmiennej zależnej (a) R X Tu Grupa 1. R ~x Yik Grupa 2. Plan 2 . Plan z grupą kontrolną, bez pomiaru początkoweg o zmienne j zależnej VJ dvióc\v elacadv. W pierwszym badacz wprowadza do grupy eksperymentalnej zmienną X. Grupa kontrolna pozostaje w tym czasie w nie zmienionych warunkach, albo otrzymuje placebo. W drugim etapie badacz przeprowadza w obu grupach posttest Y. (c) Hipoteza badawcza może być uznana za potwierdzoną, jeżeli: V V l2k (d) Problem uwrażliwiającego wpływu na osoby badane pretestu Y został roz- wiązany w najprostszy z możliwych sposobów — został on przez badacza wyeli- minowany. Randomizacja pozwala zakładać, iż grupa eksperymentalna i kontrolna rzeczywiście „startują" z tego samego poziomu zmiennej Y. Jeżeli jednak grupy te są mało liczne, badacz może nie uzyskać równomiernego rozłożenia wszystkich zmiennych, nie kontrolowanych metodą ustalania stałego ich poziomu w obu gru- pach. Ponadto dość często chcielibyśmy poznać wyjściowy poziom zmiennej Y, aby móc — po zakończeniu badania — poznać wielkość zmiany (przyrostu, albo spad- ku wartości zmiennej Y) jaka została wywołana zamierzonym postępowaniem eks- perymentalnym (takie właśnie postępowanie badawcze zalecane jest w badaniach ewaluacyjnych — por. Hawkins, Nederhood, 1994, rozdz. 4.: Schemat ewaluacji, s. 39-56). Dlatego też, nie traktowałbym tego planu jako najlepszej metody radze- nia sobie z uwrażliwiającym wpływem pretestu Y. Inne czynniki zakłócające traf- ność planu są kontrolowane. (e) Plan stosowany jest jako prosty sposób na wyeliminowanie efektu pretestu. 5.1.3. Plan 3. — z pomiarem początkowym i końcowym zmiennej zależnej w różnych grupach (a) R R X ~x Yik G r u p a 1 . G r u p a 2 . Plan 3. Plan z pomiarem początkowym i końcowym zmiennej zależnej w różnych grupach (b) Badanie według tego planu przebiega w trzech kolejnych krokach. Pier wszy sprowadza się do przeprowadzenia pretestu Y w grupie 2. (kontrolnej). Drugi polega na wprowadzeniu do grupy 1. (eksperymentalnej) zmiennej X oraz pozosta wieniu grupy 2. (kontrolnej) w nie zmienionych warunkach lub podaniu jej placebo. Wreszcie trzeci krok polega na wykonaniu posttestu Y w grupie 1. (eksperymen talnej). (c) Hipotezę można uznać za potwierdzoną, jeżeli: (d) Plan ten stanowi inne, niż przyjęte w planie 2., rozwiązanie problemu uwrażliwiającego wpływu pretestu Y. Trafność wewnętrzna tego planu jest za chwiana przez wpływ czynnika dojrzewania i historii. Randomizacja zapewnia kon- >lę czynnika selekcji. (e) Plan ten może być stosowany wówczas, gdy okoliczności nie pozwalają równoległą obserwację — zarówno grupy eksperymentalnej, jak i grupy kon- Inej — oraz na przeprowadzenie, na tej podstawie, posttestu Y. Plan ten — w iji qE (nierespektowanie zasady randomizacji) bywa wykorzystywany w bada- li edukacyjnych — „... musi być czasem stosowany, gdy działanie eksperymen- nakierowane jest na całą zbiorowość (np. szkoła lub kilka szkół) i jego re- 327 zultaty powinny przynieść widoczne skutki u wszystkich osób będących obiektem eksperymentu" (Janowski, 1974, s. 212-213). 5.1.4. Plan 4. — czterogrupowy, Solomona (a) R Yip X Ku Grupa 1 . R Y2p ~X Y2k Grupa 2 . UIIUT' X Yik Grupa 3 . • f - Y4k Grupa 4 . Plan 4. Plan czterogrupowy, Solomona r ( b) Czterogrupowy plan zaproponowany przez Solomona (1949; Solomon, Lessa c, 1968) — stąd jego orygi nalna nazw a: Solom on's four group desig n — trakto wany jest przez wielu metod ologó w nauk behaw ioraln ych jako swoist y ideał w tej grupie planó w eksper yment alnyc h, tj. planó w „0- 1" (por. Camp bell, Stanle y, 1967; Rosen thal, Rosno w, 1984; Janow ski, 1974; Walto n, Brave r, Brave r, 1988; Helm stadte r, 1970) . Plan ten, a zwłas zcza statyst yczna analiz a danyc h empir ycz nych uzysk anych z badan ia przepr owad zaneg o zgodn ie z jego wyma gania mi, był przez lata dosko nalon y (por. zwłas zcza: Walto n, Brave r, Brave r, 1988; Huck, Sand- ler, 1973; Oliver , Berge r, 1980; Brzez iński, 1989b ). J ak nietru dno zauwa żyć, plan Solom ona składa się z dwóch planó w do siebie „doda nych" — planu 1. i planu 2. Jego główn ą zaletą, która mu przysp orzyła takiej popul arnośc i w środo wisku psych ologó w, socjol ogów, psychi atrów i pedag ogów jest możli wość kontro lowani a efektu pretest u bez rezygn owani a z przepr owadz enia pomia ru począt kowe go zmien nej Y. B adani e wg tego planu przebi ega w trzech etapac h. Pierw szy etap, to prze- prowa dzeni e w pierw szej grupie ekspe rymen talnej (grup a 1.) oraz w pierw szej gru- pie kontr olnej (grup a 2.) pretes tu Y. W drugi m etapie badac z wpro wadz a do obu grup ekspe ryme ntaln ych (grup y: 1. i 3.) postę powa nie ekspe ryme ntalne , a obie grupy kontr olne (grup y: 2. i 4.) pozos tawia bez zmian lub wpro wadz a do nich place bo. Etap trzeci, kończ ący badan ie, wyma ga wyko nania przez badac za postte stu Y w obu grupa ch ekspe ryme ntaln ych (grup y: 1. i 3.). ( c) Analizę wyników w planie Solomona można przeprowadzić na dwa spo soby — elemen tarny i zaawa nsowa ny. Zacznij my od pierws zego. E lement arna analiz a wynik ów. Dla uzyska nia potwie rdzeni a hipote zy badaw czej należy przepr owadz ić następ ujące porów nania: V v . V V ^ V V V kontrola efektu pretestu — wymagane jest aby: Ytl'= Yv oraz jC= YAt. Jeżeli warunki eksperymentu zakładają, że w grupie kontrolnej nie powinny wystąpić celowe zmiany, to dodatkowo badacz musi wykazać, iż: Y4k= YXp oraz Zaawansowana analiza wyników. Ten sposób analizy, zalecany przez wielu metodologów (por. Walton, Braver, Braver, 1988; Huck, Sandler, 1973; Oliver, Berger, 1980; Brzeziński, 1989b) odwołuje się do tak zaawansowanych wielowy- miarowych modeli statystycznych, jak analiza wariancji ANOVA, analiza kowa- riancji ANCOVA czy analiza regresji wielokrotnej MR. Dostępność dobrego i sto- sunkowo prostego w obsłudze oprogramowania statystycznego, adresowanego m. in. do środowiska psychologów, socjologów i pedagogów (np. SPSS PC+, CSS STATISTICA) sprawia, iż badacz powinien przejść na ten bardziej złożony, ale dostarczający znacznie więcej informacji sposób analizy danych zebranych zgodnie z planem Solomona. Tutaj ograniczę się jedynie do pokazania korzyści wnikających z zastosowania modelu ANOVA. Zastosowanie znajdzie tu model dwuczynnikowej ANOVA w układzie grup kompletnie zrandomizowanych (na ten temat por. Brzeziński, Stachowski, 1984, rozdz. 4., pkt. 4.3. — Plan eksperymentu dwuczynnikowego KRG-pq (n > 1)1, s. 190-221). W przyjętym statystycznym modelu opracowania danych zakłada się, że badacz ma do czynienia z dwoma czynnikami, każdym występującym na dwóch poziomach: (1) postępowanie eksperymentalne X („1" — występuje, „0" — nie występuje), (2) pretest Y („1" — występuje, „0" — nie występuje). Analizę wariancji przeprowadza się na wynikach posttestów Y, przeprowadzo- nych we wszystkich czterech grupach. Wyniki wprowadzamy do tabeli, takiej, jak tab. 12.3. Tabela 12.3. Tabela wyników 2x2 przygotowana do przeprowa- dzenia analizy wariancji wyników z eksperymentu przeprowadzo- nego wg planu Solomona występuje pretest Y nie występuje pretest Y X Ylt Yu Yu Y4k Wariancję Y można rozbić na wariancje cząstkowe (składowe): (a) wariancję wprowadzoną przez zmienną X (postępowanie eksperymental ne) — badacz zainteresowany jest jej maksymalizacją, varya\ (b) wariancję wprowadzoną przez pretest Y — badacz zainteresowany jest jej minimalizacją, varn pretest, 329 zj, (c) warianc ję wprow adzoną przez interak cję zmienn ej X z preteste m Y — badacz zaintere sowany jest jej minimal izacją, vary\ xpretest; (d) warian cję wprow adzoną przez inne, nie kontrol owane przez badacz a1 zmienn e (tzw. warianc ja resztow a) — badacz zaintere sowany jest jej mi- nimaliza cją, var„ reszta. Za pomocą odpowi ednich wskaźn ików (wyraż onych procent owo) badacz może określić procent owy udział poszcze gólnyc h warianc ji cząstko wych w warianc ji całkow itej Y. Zaś za pomoc ą testu F- ANOV A może on określi ć istotnoś ć: (a) zmienn ej X, (b) pretest u Y, (c) interak cji X z preteste m Y. Dla pełnej trafnoś ci zewnętr znej wymag a się, aby istotna okazała się jedynie zmienn a X (postęp owanie ekspery mental ne). -n^» Z możliw ych do wykorz ystania propon uję następu jące wskaźn iki (Brzezi ński, 1985b, 1989b): ( p - l ) ( M S x - M S r e s z t a ) ' ( a ) v a r „ x = npq (b) (c) npq -l) ( M SX pret est - M Sre saa ) n p q gdzie: p — liczba poziomów zmiennej X (tu: 2); q — liczba poziomów zmiennej pretest Y (tu: 2); n — liczba osób w jednej grupie (zakłada się, że grupy są równoliczne); MS — średni kwadrat (wzięty z sumarycznej tabeli ANOVA). Przemnażając poszczególne wartości wariancji składowych przez 100% otrzy- mamy procentowe udziały poszczególnych wariancji cząstkowych w wariancji cał- kowitej Y. Po dodaniu do siebie wariancji (a), (b), (c) i odjęciu otrzymanej sumy od 100% otrzymamy procentowy udział wariancji resztowej w wariancji całkowitej Y. W przypadku otrzymania ujemnej wartości danego wskaźnika, podstawiamy za nią zero, a wariancję cząstkową traktujemy jako zerową. Więcej informacji na temat zaawansowanej analizy danych uzyskanych z badania eksperymentalnego przeprowadzonego wg planu Solomona Czytelnik znajdzie w innej mojej pracy (Brzeziński, 1989b). (d) Plan Solomona pozwala na kontrolę wszystkich czynników zakłócających jego trafność wewnętrzną i zewnętrzną, a zwłaszcza bardzo dolegliwego wpływu czynnika testowania. (e) Plan Solomona znajduje zastosowania szczególnie w badaniach: nad efek tywnością psychoterapii (Czabała i in., 1973), nad zmianą postaw i opinii (Lana, 1969; Brzeziński, 1989b), edukacyjnych (Janowski, 1974), nad rozwojem (Lessac, Solomon, 1969). Zatrzymajmy się jeszcze chwilę — dla ilustracji możliwości wykorzystania- planu Solomona w praktyce badawczej — przy problematyce oceny efektywności technik zmian postaw. 330 Przy badaniu efektywności jakichkolwiek technik zmian postaw, gdyby je przeprowadzać wg planu 1., badacz musi odpowiedzieć na pytanie: czy zaobser- wowane efekty rzeczywiście są skutkiem zastosowania w stosunku do osób z grupy eksperymentalnej danej techniki zmian postaw? Mimo, iż w planie 1. wpływ ważnych czynników zakłócających trafność wewnętrzną i zewnętrzną zo- stał wyeliminowany (z wyjątkiem jednego), to jednak otwartą sprawą pozostaje problem reaktywności pretestu Y przeprowadzanego w obu grupach za pomocą jakiejś skali postaw. W takiej sytuacji badawczej problem uwrażliwienia osób badanych ma kapitalne znaczenie, jeżeli chodzi o określenie rzeczywistego wpły- wu danej zmiennej niezależnej X (tu: techniki zmian postaw) na zmienną Y. Mamy prawo przypuszczać, że wstępny pomiar może zwrócić uwagę osób badanych na pewne obiekty w ich otoczeniu, co doprowadzić może do tego, że zaczną anali- zować swoje zachowanie w stosunku do pewnych osób, postępowań itp., mimo, iż dotychczas tego nie czyniły. Może to również doprowadzić do zmian postaw osób badanych. Z drugiej strony, po sprawdzeniu skuteczności danej techniki zmian postaw na określonej próbie (rzecz jasna, że reprezentatywnej!) musimy odpowiedzieć na kolejne pytanie: czy po zastosowaniu danej techniki zmian po- staw do dowolnych osób z interesującej badacza populacji należy spodziewać się takich samych efektów, jak zaobserwowane w badanej próbie? Udzielając odpo- wiedzi na to pytanie musimy sobie zdawać sprawę z faktu, że zaobserwowane zmiany postaw w badanej próbie mogły (chociaż nie musiały) być rezultatem działania dwóch czynników: samej techniki zmian postaw i zastosowanego narzę- dzia pomiaru postaw (pretestu Y). Jeżeli nie potrafimy oddzielić zmian spowodowanych zastosowaniem okre- ślonej techniki zmian postaw od zmian wywołanych aktem pomiaru postaw, to nie możemy udzielić twierdzącej odpowiedzi na wyżej sformułowane pytanie. Jest tak, gdyż populacja nie będzie przecież, przed zastosowaniem określonej te- chniki zmian postaw, testowana (nie będzie wobec niej stosowany pretest Y). Oczywiście, może być i tak, że pomiar początkowy Y wchodzi w interakcję z techniką zmian postaw — a tym samym zmiany postaw osób badanych mogą być tłumaczone: (a) zadziałaniem techniki zmian postaw (postępowanie eksperymentalne X), (b) uwrażliwiającym osoby badane wpływem na nie pretestu Y, (c) interakcją postępowania eksperymentalnego X z pretestem Y, (d) innymi, nie kontrolowanymi przez badacza, zmiennymi, które stanowią źródło wariancji resztowej. Najbardziej optymalnym — z metodologicznego punktu widzenia — rozwią- zaniem jest znalezienie takiej metodyki eksperymentalnej, która pozwoliłaby na dokładne określenie stopnia wpływu wymienionych czynników na zmienną Y, oraz określenie „czystego" wpływu danej techniki zmian postaw na postawy osób ba- danych. Cele te badacz może osiągnąć — jak Czytelnik bez trudu się domyślił — przez odwołanie się do planu Solomona i zastosowanie zaawansowanej analizy danych (ANOVA). 331 5.1.5. Plan 5. — trzygrupowy, z podwojonym pomiarem początkowym M; , j, i jednym pomiarem końcowym zmiennej zależnej (a) R X Yu Grupa 1. R Y2p Grupa 2. R Grupa 3. Plan 5. Plan trzygrupowy, z podwójnym pomiarem początkowym i jednym pomiarem końcowym zmiennej zależnej (b) Plan 5. obejmuje dwie grupy kontrolne i jedną grupę eksperymentalną. Badanie eksperymentalne przeprowadzone wg tego planu wymaga od badacza aby: (1) przeprowadził pretest Y w grupie 3., (2) przeprowadził pretest Y w grupie 2., (3) wprowadził postępowanie eksperymentalne do grupy 1. (eksperymentalna), a obie grupy kontrolne (grupa 2. i 3.) pozostawił w nie zmienionych warunkach lub wprowadził do nich placebo, (4) przeprowadził posttest Y w grupie 1. Odstępy czasu dzielące Y3p i Y2p oraz Y^ i Ylk powinny być równe. (c) W celu potwierdzenia hipotezy badawczej badacz musi wykazać, iż: Y > Y Y > Y Y = Y riC' ?" ' ma Jeżeli nie zadziałał czynnik dojrzewania, to: ... -i>i. tv v \ ^ lv V ?* ("lk ~ *2p) > \I2p ~ I3p)- Jeżeli zaś między pomiarami Y nie zachodzi ta relacja, to nie można wykluczyć, iż zaobserwowana różnica Yik - Y^ została wywołana przez czynnik dojrzewania. . (d) Kontrola czynników zakłócających trafność planu jest podobna jak w planie 3. — z wyjątkiem czynnika dojrzewania, który w tym planie jest poddany szczególnej kontroli. *a (e) Planem tym posługujemy się wówczas, gdy jesteśmy szczególnie zaintere sowani sprawdzeniem tego, czy obserwowana zmiana Y nie została, tak naprawdę, wywołana czynnikiem dojrzewania, a nie manipulacją eksperymentalną. Plan 5. znajduje zastosowanie w badaniach edukacyjnych. '-' ' 5.1.6. Plan 6. — czterogrupowy, z pomiarem początkowym i końcowym zmiennej zależnej w różnych grupach (a) R X Yu Grupa 1. R Grupa 2. «f^ *»hfl*Śi{'f R --...,„,..,.. X Yu Grupa 3. R . i «n *»}?oq YAP ~X Grupa 4. .-., - Plan 6. Plan czterogrupowy, z pomiarem początkowym i końcowym zmiennej zależnej w różnych grupach (b) Plan ten powstał przez podwojenie planu 3. Zauważmy jeszcze, że pomiar końcowy Y w grupie 1. przeprowadzany jest w tym samym czasie co pomiar po czątkowy Y w grupie 4. Można zatem powiedzieć, że zakończenie pierwszej części badania (realizowanego zgodnie z planem 3.) zbiega się w czasie z rozpoczęciem części drugiej badania (też realizowanej wg planu 3.). W miarę potrzeb plan ten może być rozbudowany o kolejną część, też obejmującą dwie grupy — piątą i szóstą. Badanie przeprowadzone wg tego planu przebiega w pięciu etapach. W pierw- szym etapie przeprowadza się pretest Y w grupie 2. (kontrolna 1.). W drugim — wprowadza się do grupy 1. (eksperymentalna 1.) postępowanie eksperymentalne; grupę 2. pozostawia się w nie zmienionych warunkach, albo wprowadza do niej placebo. W trzecim etapie przeprowadza się, równolegle, w grupie 1. i 4. (kontrolna 2.) pomiar końcowy Y (grupa 1.) oraz pretest Y (grupa 4.). Etap czwarty, to kolejne wprowadzenie postępowania eksperymentalnego, ale tym razem do grupy 3. (eks- perymentalna 2.); grupę 4. pozostawia się w nie zmienionych warunkach, albo aplikuje się jej placebo. Badanie kończy się etapem piątym — przeprowadzeniem pomiaru końcowego zmiennej Y w grupie 3. (eksperymentalnej 2.). (c) W celu potwierdzenia hipotezy badawczej badacz musi wykazać, iż: Y]k > Y2p oraz Y3k > YĄp. Jeżeli nie zadziałał czynnik historii, to różnica: Yxk - Y^ nie powinna być więk- sza (albo mniejsza) od różnicy: Y3k- Yip. (d) Plan ten skonstruowany został z myślą o uzyskaniu potwierdzenia, iż w badaniu nie wystąpił efekt czynnika historii. (e) Plan znajduje zastosowanie w badaniach edukacyjnych i socjologicznych, prowadzonych w warunkach braku stabilności społecznej i politycznej, gdy w oto czeniu osób badanych zachodzą ważne wydarzenia mogące mieć wpływ na „od biór" przez nie postępowania eksperymentalnego. 5.2. Ograniczenia planów „0-1" Ograniczenia, w zakresie testowania hipotez badawczych, planów „0-1" można sprowadzić do kilku punktów. Oto one: 1. Jedno badanie —jedna zmienna. 2. Niemożność testowania hipotez o wpływie na zmienną zależną interakcji między zmiennymi niezależnymi. 3. Konieczność badania wpływu na Y tylko zmiennych dwu wartościowych. 4. Testowanie wyłącznie zależności liniowych między zmiennymi: Y i X. Teraz, pokrótce, je scharakteryzuję. 1. Jedno badanie —jedna zmienna. Niestety najpoważniejszym ograniczeniem planów „0-1" jest to, że nadają się one jedynie do testowania hipotez mówiących o związku jednej zmiennej zależnej z też jedną zmienną niezależną. Zgodnie z de- finicją klasycznego eksperymentu opartą na zasadzie indukcji eliminacyjnej (Ajdu- kiewicza), każdy taki plan zakłada manipulowanie tylko jedną zmienną niezależną- 333 -główną (postępowanie eksperymentalne) i dodatkowo nakłada na badacza nieprzy- jemne ograniczenie, polegające na tym iż pozostałe zmienne istotne dla Y muszą być utrzymane na stałym poziomie. Chcąc tedy testować hipotezy mówiące o związku zmiennej Y z większą liczbą zmiennych niezależnych, badacz musi sięgnąć po plany oparte na statystycznym modelu ANOVA. 2. Niemożność testowania hipotez o wpływie na zmienną zależną interakcji między zmiennymi niezależnymi. To ograniczenie jest konsekwencją wyżej omówio nego. O interakcji można mówić wówczas, gdy rozpatrujemy co najmniej dwie zmienne niezależne. Badanie jej istotności też zakłada równoczesne oddziaływanie na zmienną Y co najmniej dwóch zmiennych niezależnych: Xx i X2, a to umożli wiają jedynie tzw. plany czynnikowe (ang. factorial designs), oparte na statystycz nym modelu analizy wariancji ANOVA (na ich temat: Brzeziński, Stachowski, 1984, rozdz. 4.: Plan eksperymentu wieloczynnikowego w grupach kompletnie zran- domizowanych; a zwłaszcza pkt. 4.3.2. Pojęcie i istota interakcji, s. 192-197). Jak sądzę, rzeczywistość nas otaczająca ma naturę „interakcyjną" i poza prostymi eks perymentami analizującymi wpływ pojedynczych zmiennych na inną zmienną, je dynie eksperymenty oparte na modelu ANOVA, czy opisane w rozdz. 13. badania oparte na modelu wielokrotnej regresji MR, umożliwiają dotarcie do niej. 3. Konieczność badania wpływu na Y tylko zmiennych dwuwartościowych. Od miana modelu eksperymentalnego „wszystko albo nic" wymusza na badaczu stoso wanie wobec zmiennych de facto wielowartościowych zabiegu dychotomizacji. Musi on, arbitralnie, zadecydować co to znaczy, że zmienna X przyjmie dla grupy ekspe rymentalnej wartość „1". Jeżeli osoby z grupy eksperymentalnej mają pracować w warunkach określonego obciążenia psychicznego, to jak określić jego wartość? Naj lepiej, gdyby badacz mógł wprowadzić różne wartości tego obciążenia do grup porów nawczych. To jednak w przypadku tych planów nie jest możliwe. Badacz może bowiem do jednej grupy wprowadzić określoną (jaką?) wartość tego obciążenia, a dru gą — kontrolną — pozostawić w warunkach standardowych czy relaksowych. Nie fortunny dobór wartości zmiennej X — gdy faktyczna zależność FodXma charak ter krzywoliniowy — może doprowadzić do uzyskania wyników dających nietrafny obraz tej zależności; por. przeprowadzoną w pkt. 3. analizę takiego przypadku. 4. Testowanie wyłącznie zależności liniowych między zmiennymi Y i X. Ponie waż badacz porównuje jedynie dwie grupy różniące się wartościami wprowadzonej do nich zmiennej X, więc może on testować takie hipotezy, które dopuszczają jedy nie związek liniowy zmiennych Y i X. Do czego to może doprowadzić? — por. pkt. 3. 5.3. Plany jedno-wielozmiennowe, wielowartościowe kilka uwag wprowadzających Omówionych w pkt. 5.2 ograniczeń pozbawione są plany eksperymentalne jedno-- wielozmiennowe, oparte na statystycznym modelu ANOVA. W szczególności po- zwalają one na testowanie, w ,jednym badaniu", złożonych hipotez traktujących o: 334 (a) wpływie na Y dowolnej liczby zmiennych niezależnych Xx, X2, X3, ... (oczywiście owa liczba jest, realistycznie podchodząc do tego zagadnienia, ograni czona możliwościami technicznymi badacza czy pojemnością oprogramowania sta tystycznego, którym on dysponuje); (b) wpływie na Y interakcji zmiennych niezależnych, co pozwala na rozbicie efektu interakcji, powiedzmy, dwóch zmiennych, Xx i X2 na tzw. efekty proste pokazujące wpływ zmiennej Xx na Y przy poszczególnych wartościach zmiennej X2: b\, ...,bj,..., bq, czyli: Xx\bj oraz wpływ zmiennej X2 na Y przy poszczególnych wartościach zmiennej X,: ax,..., a,,..., ap, czyli: X2\at. Mówiąc inaczej, rozbijając efekt interakcji na poszczególne efekty proste otrzymujemy precyzyjną informację 0 wpływie na Y jednej zmiennej niezależnej (poprzez wszystkie wartości jakie ona przyjmuje w danym badaniu), gdy druga zmienna niezależna przyjmuje wpierw wartość pierwszą, następnie drugą itd. (na ten temat por. pkt. 4.3.2.: Pojęcie i istota interakcji p x q oraz pkt. 4.3.2.: Pojęcie efektu prostego w: Brzeziński, Stachowski, 1984, s. 192-199). W możliwości testowania hipotez o wpływie na Y interakcji zmiennych niezależnych istotnych dla Y upatruję główny walor tej odmiany modelu E. Tak naprawdę, rzeczywistość nas otaczająca ma charakter „interakcyjny" i traf nym obrazem PY jest taki, który zakłada interakcje (liczba mnoga!) między zmien nymi istotnymi dla rozważanej przez badacza zmiennej zależnej Y, a więc: Oin{PY). Badając tedy wpływ jakichś układów zmiennych niezależnych na Y rozsądnie bę dzie, na początek, przyjąć hipotezę istotnościową, zakładającą Oin(PY). Bardzo prze konującym przykładem może być stanowisko w sprawie udziału czynnika środo wiska i genotypu w formowaniu inteligencji człowieka — ani wpływ jedynie śro dowiska, ani wpływ jedynie genetycznego wyposażenia człowieka, lecz ich inter akcja przesądza o ukształtowaniu się inteligencji — i pod względem struktury, 1 pod względem poziomu (por. Seligman D., 1995; Strelau, 1987). Zastosowanie modelu ANOVA do badań nad rolą obu czynników w kształtowaniu inteligencji, a zwłaszcza do badania wpływu ich interakcji na inteligencję, zostało bardzo grun townie przedstawione w artykule Wahlstena: Insensitivity ofthe analysis ofvarian- ce to heredity-environment interaction (1990). Bardzo zachęcam, bardziej dociekli wego Czytelnika, do jego lektury oraz zawartej w tym samym numerze czasopisma „Behavioral and Brain Sciences" obszernej dyskusji nad jego treścią; (c) wpływie na Y zmiennych, które mogą być wielowartościowe, ale nie ciąg łe; wielowartościowe zmienne niezależne muszą być sprowadzone do zmiennych dyskretnych — np. kontinuum poziomu hałasu musi być podzielone na interwały wyznaczone co n-ty decybel; oczywiście tym nowym wartościom zmiennej mogą być przypisane określające je „etykietki": skrajnie niski poziom, niski, niższy od przeciętnego, przeciętny, ponadprzeciętny, wysoki, skrajnie wysoki; (d) zależnościach nie tylko liniowych, ale także krzywoliniowych — por. pkt. 2.-3., rozdz. 10; (e) dynamice zmian zmiennej zależnej Y pod wpływem wielokrotnego stoso wania, na tej samej grupie (grupach) osób postępowania eksperymentalnego; każ dorazowo dokonywane są pomiary zmiennej Y (wielokrotnie stosowany wobec tej samej grupy osób posttest Y) — umożliwiają to plany eksperymentów jednoczyn- 335 nikowych i wieloczynnikowych z powtarzaniem pomiarów zmiennej zależnej (por. Brzeziński, Stachowski, 1984, rozdz. 6.: Plany eksperymentów jednoczynnikowych i wieloczynnikowych z powtarzanymi pomiarami zmiennej zależnej, s. 278-319, rozdz. 7.: Eksperymenty wieloczynnikowe z częściowym powtarzaniem pomiarów zmiennej zależnej, s. 320-372). Są to tedy, jak Czytelnik widzi, znacznie większe możliwości jeśli chodzi o treść hipotez, które badacz chciałby poddać empirycznej kontroli. Nic dziwne- go tedy, że nowoczesne eksperymentowanie w psychologii rozwinęło się w ści- słym powiązaniu z modelem statystycznym ANOVA. Dodajmy jeszcze, że bardziej złożony strukturalnie model MANOVA pozwala badać nie jedną zmien- ną 7, ale większą ich liczbę. Można tedy, zmienną zależną: „inteligencja" wyra- żać nie za pomocą jednego wskaźnika, ilorazu inteligencji (IQ), ale za pomo- cą 11 wskaźników, odpowiadających wynikom przeliczonym 11 testów składają- cych się na Skalę Inteligencji WAIS-R. Znacznie powiększa to możliwości opera- cyjne badacza i stanowi zdecydowane odejście od ubogiego modelu „wszystko albo nic". Stosowanie planów E opartych na modelu ANOVA wymaga od badacza speł- nienia dość restryktywnych założeń. Jak wiadomo, stosowany w analizie wariancji test F-Snedecora ma swój rodowód w teście ^-Studenta. Obowiązują też podobne założenia, z których dwa najważniejsze dotyczą (por. rys. 11.1): (a) normalności rozkładów zmiennej zależnej Y w porównywanych populacjach, (b) homogeniczności wariancji rozkładów zmiennej zależnej Y w porównywa nych populacjach. W „specjalnych" planach, takich jak plany z powtarzaniem pomiarów zmien- nej zależnej Y, wymagane jest jeszcze respektowanie dodatkowych założeń o (por. rys. 11.2): (c) symetrii macierzy wariancji-kowariancji, 'SĄ- (d) równości macierzy wariancji-kowariancji. ri Zakłada się też, iż: (e) pomiar zmiennej zależnej Y dokonywany jest na poziomie co najmniej skali interwałowej (w sensie Stevensa; por. rys. 11.1-11.2). Wreszcie, co jednak nie różni postępowania badacza odwołującego się do modelu ANOVA od postępowania w przypadku „klasycznego" modelu E: (f) wartości zmiennej X (lub kombinacje wartości wielu zmiennych: Xh X2, X3, ...) przydzielane są do grup porównawczych losowo — zasada randmizacji! ?-??, W rozdz. 3. (Założenia ANOVA i metody ich sprawdzania) pracy Brzeziń skiego i Stachowskiego (1984, s. 112-186) Czytelnik znajdzie szczegółowe omó wienie tych założeń wraz z metodami sprawdzania ich spełnienia w danym eks- perymencie. OS/AS W; fVprąyp#dfcu mode/u MA/VOVA i/wąg/ędn/o/ja /ni/s/'źyć/n/b/mac/a dotyczgca 22 Metodologa nikowy ch i wielocz ynniko wych z powtarz aniem pomiar ów zmienn ej zależnej (por. Brzeziń ski, Stacho wski, 1984, rozdz. 6.: Plany ekspery mentów jednocz ynniko wych i wielocz ynniko wych z powtarz anymi pomiar ami zmienn ej zależnej , s. 278— 319, rozdz. 7.: Ekspery menty wielocz ynniko we z częścio wym powtarz aniem pomiar ów zmienne j zależnej , s. 320— 372). Są to tedy, jak Czytel nik widzi, znaczni e większ e możliw ości jeśli chodzi o treść hipotez , które badacz chciałb y poddać empiry cznej kontrol i. Nic dziwne go tedy, że nowocz esne ekspery mento wanie w psychol ogii rozwin ęło się w ści- słym powiąz aniu z modele m statyst yczny m ANOV A. Dodaj my jeszcze , że bardzie j złożony struktur alnie model MANO VA pozwal a badać nie jedną zmien- ną Y, ale większ ą ich liczbę. Można tedy, zmienn ą zależną : „intelig encja" wyra- żać nie za pomoc ą jedneg o wskaźn ika, ilorazu intelige ncji (IQ), ale za pomo- cą 11 wskaźn ików, odpowi adający ch wyniko m przelicz onym 11 testów składaj ących się na Skalę Intelige ncji WAIS- R. Znaczni e powięk sza to możliw ości opera- cyjne badacz a i stanowi zdecyd owane odejści e od ubogie go modelu „wszys tko albo nic". St osowan ie planów E opartyc h na modelu ANOV A wymag a od badacza speł- nienia dość restrykt ywnych założeń . Jak wiado mo, stosow any w analizie warianc ji test F- Snedec ora ma swój rodowó d w teście ^- Student a. Obowią zują też podobn e założen ia, z których dwa najważ niejsze dotyczą (por. rys. 11.1): (a) n or ma lno ści roz kła dó w zm ien nej zal eż nej Y w po ró wn yw an yc h po pul acj ac h, (b) h omogen icznośc i warianc ji rozkład ów zmienn ej zależne j Y w porówn ywa nych populac jach. W „specjal nych" planach , takich jak plany z powtarz aniem pomiar ów zmien- nej zależne j Y, wymag ane jest jeszcze respekt owanie dodatko wych założeń o (por. rys. 11.2): (c) symetrii macierzy wariancji-kowariancji, ( d ) r ó w n o ś c i m a c i e r z y w a r i a n c j i - k o w a r i a n c j i . Z a k ł a d a s i ę t e ż , i ż : (e) pomiar zmiennej zależnej Y dokonywany jest na poziomie co najmniej skali interwa łowej (w sensie Stevens a; por. rys. 11.1- 11.2). W reszcie, co jednak nie różni postępo wania badacz a odwołu jącego się do modelu ANOV A od postępo wania w przypa dku „klasyc znego" modelu E: (f) wartości zmiennej X (lub kombinacje wartości wielu zmiennych: Xt, X2, X3, ...) przydzi elane są do grup porówn awczyc h losowo — zasada randmiz acji! W rozdz. 3. (Założe nia ANOV A i metody ich sprawd zania) pracy Brzeziń skiego i Stacho wskieg o (1984, s. 112- 186) Czyteln ik znajdzi e szczegó łowe omó- wienie tych założeń wraz z metoda mi sprawd zania ich spełnie nia w danym eks- peryme ncie. W przypad ku modelu MANO VA uwzględ niona musi być informa cja dotyczą ca wielkoś ci interkor elacji między zmienn ymi zależny mi: Yx Y2, Y3, ... (na ten temat por. Cole i in., 1994). Cz ytelnika zaintere sowane go grunto wnym opanow aniem planow ania ekspery mentó w w psychol ogii i dyscypl inach pokrew nych, oparteg o na modelu ANOV A, 336 mogę odesłać do trzech, moim zdaniem najbardziej kompetentnie (i z troską o czy- telnika-psychologa) napisanych monografii — Edwardsa (1972), Kirka (1982) oraz — zwłaszcza do niej! — Winera, Browna i Michelsa (1991; wcześniejsze, 2. wy- danie: Winer 1971). ? 6. Ocena istotności zmiennych niezależnych w modelu eksperymentalnym 6.1. Poziom istotności statystycznej a a faktyczna istotność zmiennej X (postępowania eksperymentalnego) dla danej zmiennej zależnej Y 6.1.1. Jak liczne powinny być grupy: eksperymentalna i kontrolna? Duża próba versus mała próba 1 Zacznę od prowok acyjneg o pytania, zaczerp niętego ze znanego w kręgach psycho- logów, głównie jednak ameryk ańskich, podręcz nika statysty ki autorst wa Haysa (Hays, 1973, s. 422): „Czy wielkoś ć próby może być zbyt duża?". Odpowi edź na to pytanie sformuł owana przez Haysa jest jednozn aczna. Pokazuj e on bowiem , jak myśleni e o „dobroc i" danego badania w kategori ach liczby (jak najwięk szej!) osób, które badacz powinie n przebad ać, aby uprawd opodob nić wystąpi enie sukcesu ba- dawcze go — potwier dzenie hipotez y badawc zej o związku zmienne j Y z postępo waniem ekspery mentaln ym X — prowadz i go faktyczn ie na manowc e, gdyż każdą, nawet błahą zależno ść uznaje on za doniosłą teoretyc znie. Zdanie m Haysa: „Try- wialne związki mogą być ukazane jako istotne wówcza s, gdy wielkoś ć próby będzie bardzo duża" (s. 424). Poniewa ż badacz nie chciałby być autorem trywialn ych rezultat ów badawc zych (zresztą, kto by mu je opublik ował?), więc powinie n zmie- nić swoje myśleni e na ten temat. Tak ie, jak Haysa, spojrze nie na wielkoś ć próby zdaje się przeczy ć wymag aniom metody repreze ntatywn ej, o czym pisałem w rozdz. 9. Wszak duża próba daje gwaranc ję jej repreze ntatywn ości (próba nie może być zbyt mała). Spróbuj my tedy wskaza ć drogę właściw ego postępo wania badawc zego, które — nie wchodz ąc w kolizję z założeni ami procedu r statysty cznych (m. in. tych związan ych z wielkoś cią próby, a tym samym i grup — ekspery mentaln ej i kontrol nej) — uchroni psycho- loga przed ośmiesz ającymi go pseudo wynika mi naukow ymi (artefak tami). Każ dy psychol og, a także dojrzały naukow o student, kandyda t na psychol oga-- badacza wie, że aby opublik ować w czasopi śmie naukow ym, np. „Przegl ądzie Psychol ogiczny m", artykuł przedsta wiający sprawoz danie z przepro wadzon ych ba- dań ekspery mentaln ych, albo uzyskać akcepta cję promoto ra i recenze nta dla pracy magiste rskiej referują cej wyniki badań ekspery mentaln ych, powinie n wykaza ć, iż zastoso wany przez niego test istotnoś ci „nakaże " mu odrzuce nie Ho (na rzecz Hx) 22 — Metodologia badań... 337 mogę odesłać do trzech, moim zdaniem najbardziej kompetentnie (i z troską o czy- telnika-psychologa) napisanych monografii — Edwardsa (1972), Kirka (1982) oraz — zwłaszcza do niej! — Winera, Browna i Michelsa (1991; wcześniejsze, 2. wy- danie: Winer 1971). 6. Ocena istotności zmiennych niezależnych w modelu eksperymentalnym 6.1. Poziom istotności statystycznej a a faktyczna istotność zmiennej X (postępowania eksperymentalnego) dla danej zmiennej zależnej Y 6.1.1. Jak liczne powinny być grupy: eksperymentalna i kontrolna? Duża próba versus mała próba Zacznę od prowokacyjnego pytania, zaczerpniętego ze znanego w kręgach psycho- logów, głównie jednak amerykańskich, podręcznika statystyki autorstwa Haysa (Hays, 1973, s. 422): „Czy wielkość próby może być zbyt duża?". Odpowiedź na to pytanie sformułowana przez Haysa jest jednoznaczna. Pokazuje on bowiem, jak myślenie o „dobroci" danego badania w kategoriach liczby (jak największej!) osób, które badacz powinien przebadać, aby uprawdopodobnić wystąpienie sukcesu ba- dawczego — potwierdzenie hipotezy badawczej o związku zmiennej Y z postępo- waniem eksperymentalnym X — prowadzi go faktycznie na manowce, gdyż każdą, nawet błahą zależność uznaje on za doniosłą teoretycznie. Zdaniem Haysa: „Try- wialne związki mogą być ukazane jako istotne wówczas, gdy wielkość próby bę- dzie bardzo duża" (s. 424). Ponieważ badacz nie chciałby być autorem trywialnych rezultatów badawczych (zresztą, kto by mu je opublikował?), więc powinien zmie- nić swoje myślenie na ten temat. Takie, jak Haysa, spojrzenie na wielkość próby zdaje się przeczyć wymaga- niom metody reprezentatywnej, o czym pisałem w rozdz. 9. Wszak duża próba daje gwarancję jej reprezentatywności (próba nie może być zbyt mała). Spróbujmy tedy wskazać drogę właściwego postępowania badawczego, które — nie wchodząc w kolizję z założeniami procedur statystycznych (m. in. tych związanych z wielkością próby, a tym samym i grup — eksperymentalnej i kontrolnej) — uchroni psycho- loga przed ośmieszającymi go pseudo wynikami naukowymi (artefaktami). Każdy psycholog, a także dojrzały naukowo student, kandydat na psychologa-- badacza wie, że aby opublikować w czasopiśmie naukowym, np. „Przeglądzie Psychologicznym", artykuł przedstawiający sprawozdanie z przeprowadzonych ba- dań eksperymentalnych, albo uzyskać akceptację promotora i recenzenta dla pracy magisterskiej referującej wyniki badań eksperymentalnych, powinien wykazać, iż zastosowany przez niego test istotności „nakaże" mu odrzucenie Ho (na rzecz H]) 22 — Metodologia badań... 337 o braku różnicy między średnim i wartości ami Y w porówn ywanyc h grupach — ekspery mentaln ej i kontrol nej. Wie on, iż kryteriu m istotnoś ci, które musi być spełnio ne, aby można było uznać różnicę między średnim i czy korelacj ę między zmienn ymi za istotne, jest poziom istotnoś ci statysty cznej — „magicz na" (Cohen, 1994, mówi: „...święt e kryteriu m 0,05") a = 0,05! Przy czym, tak napraw dę, niekoni ecznie jest on zaintere sowany oszaco waniem rzeczyw istej wielkoś ci owej różnicy, czy współcz ynnika korelacj i, ale chciałb y, aby wartość statysty ki testowej „nakazy wała" mu odrzuce nie Ho na poziomi e p < a. Im bardziej wartość p będzie odbiega ła od wartośc i a = 0,05, tym większa będzie radość badacza z dokona nego ustaleni a. I tak, p = 0,001 jest „lepsze" , niż p = 0,005. Najlepi ej zaś, gdy komput er wyświe tli na ekranie wartość : ,,0.000 0"(!). Skądiną d wiadom o, że im większa próba, tym łatwiej odrzuci ć hipotez ę zerową. Wystarc zy tedy przebad ać dostate- cznie dużą próbę, aby odpowi edni test statysty czny zdołał odrzuci ć hipotez ę ze- rową. Bakan (cyt. za Henkel i Morris on, 1970, s. 423- 437) przepro wadził za pomocą testów istotnoś ci różnic różnora kie porówn ania intergru powe 60 tys. osób przebad anych baterią testów psychol ogiczny ch. Wszyst kie z przepro wadzon ych porówn ań okazały się istotne statysty cznie na bardzo „wyśru bowany ch" pozio- mach istotnoś ci. Wśród tych „istotny ch" porówn ań znalazły się i takie „kwiatk i": osoby mieszk ające na wschód od rzeki Missisi pi versus osoby mieszk ające na zachód od tej rzeki, osoby ze stanu Maine versus osoby z pozosta łych stanów, osoby mieszka jące na Północy versus osoby mieszka jące na Południ u, itp. Także Coheno wi (1990) „udało się" wykaza ć, bardzo istotną statysty cznie korelacj ę, za- chodząc ą między wzroste m i iloraze m intelige ncji w grupie 14 tys. dzieci w wieku szkolny m. 6.1.2. Nastaw ienie na kontrol ę błędu I lub II rodzaju Badacz przystępujący do testowania jakiejś hipotezy statystycznej może podjąć jed- ną z czterech decyzji, z których dwie są obarczone błędem — odpowiednio, błędem I rodzaju oraz błędem II rodzaju. Ilustruje to tabela decyzyjna (tab. 12.4). Tabela 12.4. Błąd I rodzaju a błąd II rodzaju ^"\^^ Ho: Decyzja ^^-^^ Ho prawdziwa Ho fałszywa odrzucenie Ho błąd I rodzaju decyzja poprawna nieodrzucenie Ho decyzja poprawna błąd II rodzaju Prawdopodobieństwo popełnienia błędu I rodzaju równe jest er czyli stawia się znak równości między prawdopodobieństwem popełnienia błędu I rodzaju i pozio- 338 mem istotności statystycznej. Z kolei prawdopodobieństwo popełnienia błędu II rodzaju równe jest fi. Z pojęciem błędu II rodzaju związane jest pojęcie mocy testu, którą definiuje się jako prawdopodobieństwo odrzucenia Ho, gdy w rzeczywistości jest ona fałszywa, czyli: moc testu = 1 -fi. Utrzymując na stałym poziomie błąd I rodzaju badacz może zmniejszyć błąd II rodzaju dokonując stosunkowo prostego zabiegu, a mianowicie zwiększając liczebność próby. Co jednak zrobić, gdy taki „prosty" zabieg z różnych powodów nie jest możliwy do przeprowadzenia (np. badacza na to nie stać)? Wówczas badacz powinien dobrać taki test, który zagwarantuje kompromis między wielkością błędu I rodzaju i wielkością błędu II rodzaju. Pomocna w tym jest znajomość mocy testu oraz jego efektywności (jak praktycznie korzystać z obu tych narzędzi statystycznych — por. Brzeziński, Stachowski, 1984, s. 20, 61-64). Ten krótki wgląd w naturę podejmowania decyzji statystycznych ukazuje złożoność procesu decyzyjnego. Pokazuje też, że badacz powinien nie tylko umieć sprawnie obsługiwać pakiet statystyczny (to o wiele za mało!), ale powinien (i znowu wra- camy do świadomości metodologicznej, a dokładniej do jej elementu — TBE/TS) stosunkowo dobrze orientować się w warunkach brzegowych stosowania poszcze- gólnych testów (w pakietach ujęte zostały tylko te, które są najczęściej stosowane w najczęściej spotykanych warunkach). Uważam, że ważniejsza jest nie tyle zna- jomość „techniczna" pakietu statystycznego, ile znajomość „ducha" testowania. Idzie bowiem o to, aby psycholog nie stał się tylko „dodatkiem" do komputera. Niestety lektura wielu tekstów skłania mnie raczej do pesymistycznej opinii na ten temat — psycholog chce nie tyle zrozumieć, to, co „oferuje" mu dany pakiet statystyczny (np. SPSS PC+), ile, za wszelką cenę (przy czym niezrozumienie sensu merytorycznego dokonywanej obróbki statystycznej danych jest stosunkowo najniższą ceną, którą jest skłonny zapłacić za przekroczenie progu wyznaczonego magiczną liczbą a =0,05), chce odrzucić Ho. Zilustrujmy nasze rozważania jakimiś stosunkowo prostymi, a spektakular- nymi przykładami. Przykład pierwszy. Aby odrzucić Ho: p = 0 na a = 0,05 (test jednostronny) wystarczy, aby obliczona wartość współczynnika korelacji wynosiła r = 0,497, przy wielkości próby n- 10, i tylko r = 0,164, przy n= 100. Jeżeli jednak psycholog zechciałby poznać wielkość wariancji wspólnej wyjaśnianej przez związek obu zmiennych, to powinien obliczyć wartość tzw. współczynnika determinacji — r2. W naszym przykładzie mamy: (0,164)2 = 0,027, czyli wspólna wariancja obu zmiennych (ujmując ją procentowo) wynosi tylko 2,7%; oczywiście współczynnik korelacji okazał się istotny! Przykład drugi (dane liczbowe z: Hays, 1973, s. 417-418) — z zastosowa- niem testu istotności różnic między średnimi, testu t (dwie próby niezależne). Przy «i = n2 = 30 badacz uzyskał następujące wartości średnich arytmetycznych w obu grupach porównawczych: Gr. 1: A/] = 65,5; Gr.2: M2 = 69; varx = 20,69 i var2 -= 28,96. Wartość statystyki testowej testu / wyniosła: t = -2,71; df - n, + n2- 2 -= 58. Przy założeniu poziomu istotności a = 0,05 (test dwustronny) badacz miał podstawy do odrzucenia Ho: fi\ =ju2 (na rzecz H\. fi ^/J-i), bo: %)5;58 ~ -1,67. Co 22« 339 więcej, uzyskany poziom istotności statystycznej okazał się lepszy od a = 0,001! Czy to oznacza, że badacz odkrył czynnik o dużym „wpływie" na interesującą go zmienną? Niestety nie (por. pkt. 6.2, w którym kontynuowany jest ten przykład). 6.2. Wskaźniki istotności zmiennej X (postępowania eksperymentalnego) Aby sprowadzić bujającego w obłokach badacza na ziemię, powinniśmy przejść na jakąś miarę ukazującą rzeczywisty udział tego hipotetycznego czynnika (zmiennej X) w wyjaśnianiu wariancji całkowitej danej zmiennej (zależnej). Jeżeli zastosowaliśmy test /-Studenta, to możemy odwołać się do propagowanej przez Haysa jego własnej miary, tzw. wskaźnika omega-kwadrat (co2). Po przemno- żeniu jego wartości przez 100% uzyskujemy procentowo wyrażoną tę część warian- cji całkowitej zmiennej zależnej, która tłumaczona jest przez zmienną niezależną X. Dla danych z naszego, z pkt. 6.2, przykładu mamy: co2 - 0,096, a więc 9,6% całko- witej wariancji zmiennej tłumaczy dany czynnik. To raczej niedużo i sądzę, że przeciętny psycholog spodziewałby się uzyskać (na podstawie informacji, iż p < < 0,001) wyższe oszacowania wariancji wyjaśnionej danej zmiennej. Dla kontrastu, zobaczmy, jaki jest udział hipotetycznego czynnika w wyjaśnianiu wariancji całko- witej danej zmiennej, gdy różnica między średnimi jest taka sama, jak w poprzed- nim przykładzie, ale liczebność porównywanych grup jest znacznie mniejsza: ri\ = = n2= 10; var, = 5,55 i var2 = 7,78 (Czytelnik zapewne zauważył, że grupy są teraz bardziej homogeniczne, co wpływa na wielkość mianownika stosunku /!); / = -3,04 (przy df = 18 mamy: ?<%»i; isJ test jednostronny), a obliczona wartość wskaźnika omega-kwadrat wynosi: co2 = 0,29; co oznacza, iż hipotetyczny czynnik tłumaczy 29% wariancji całkowitej danej zmiennej. Nie jest to może dużo, ale jednak więcej niż w pierwszym przypadku. Okazuje się, że wartość p w roli miary istotności jakiejś zmiennej dla innej zmiennej jest bardzo zawodna i należy zgodzić się z negatywną oceną tej miary dokonaną przez Haysa (tamże, s. 418). Sam od wielu lat „zniechęcam" (ale z niewielkim skutkiem) psychologów do posługiwania się „istotnością statystyczną" jako miarą istotności zmiennych niezależnych dla danej zmiennej zależnej. Rekomendowaną przez metodologów miarą istotności zmiennych jest miara ukazująca wkład tej zmiennej w wyjaśnianie całkowitej wariancji zmiennej za- leżnej. W przypadku testu t (dla danych niezależnych) można odwołać się do wspom- nianego już wyżej wskaźnika omega-kwadrat opracowanego przez Haysa (1973, s. 417): ro2 = -—ŁxJ /2 + «1 + n2-l W odmianie jedno-wielozmiennowej modelu E zastosowanie znajdują wskaźniki informujące badacza o wielkości wariancji całkowitej zmiennej Y wyjaś- 340 nionej przez poszczególne zmienne Xh X2, X3, ... oraz ich interakcje. Dla planów , jedno-, dwu- oraz trójczynnikowych, w modelu efektów stałych, losowych i mieszanych ANOVA gotowe wzory obliczeniowe znajdzie Czytelnik w innej mojej pracy (Brzeziński, 1985b). Tam też zostały podane reguły konstruowania takich wzorów dla planów E o dowolnej liczbie zmiennych niezależnych i ich interakcji. Ten sposób oceniania stopnia istotności poszczególnych zmiennych niezależnych w planach opartych na modelu statystycznym ANOVA uważam za najlepszy. Znane też są inne wskaźniki, wykorzystywane w planach jednoczynnikowych (omega--kwadrat czy, dla zależności nieliniowych, eta-kwadrat) i dwuczynnikowych (np. omega-kwadrat i in.) — na ich temat por. Brzeziński, Stachowski (1984, s. 76-82). 7. Podsumowanie Stosunkowo dużo miejsca, a i tak zbyt mało dla pełnej prezentacji, poświęciłem tu na omówienie podstaw eksperymentowania w psychologii, ze szczególnym zwró- ceniem uwagi na plany typu „wszystko albo nic" (odmiana jedno-jednozmiennowa modelu E), które — wywiedzione z kanonu jedynej różnicy J. S. Milla (z „popraw- ką" K. Ajdukiewicza — wnioskowanie przez indukcję eliminacyjną) — stanowią swoisty „wstęp" do nowoczesnego eksperymentowania w psychologii i naukach pokrewnych, opartego na statystycznym modelu jednowymiarowej (jedna zmienna zależna Y — czyli odmiana jedno-wielozmiennowa modelu E) lub wielowymiaro- wej (wiele zmiennych zależnych Yu Y2,... — czyli odmiana wielo-wielozmiennowa modelu E) analizy wariancji ANOVA. Uważam, iż psycholog powinien — nieza- leżnie od tego czy zechce w przyszłości posłużyć się modelem E, tym mniej skom- plikowanym (o którym przede wszystkim pisałem w tym rozdziale), czy tym bar- dziej zaawansowanym, odwołującym się do ANOVA i MANOVA — gruntowanie poznać podstawy eksperymentowania w psychologii. Wszak takie, eksperymentalne (poczynając od Wundta, Ebbinghausa, a w Polsce od Heinricha), są korzenie psy- chologii naukowej. Jeśli chodzi o sugestie dotyczące lektury, to polecam sięgnięcie po monografię Ajdukiewicza: Logika pragmatyczna w zakresie logicznych podstaw eksperymentu. Z kolei praca Sułka: Eksperyment w badaniach społecznych daje bardzo dobry wgląd w zastosowania modelu E w naukach społecznych. W pkt. 5.2 nie mogłem szczegółowo opisać odmiany wielo-wielozmiennowej modelu E nawiązującej do ANOVA. Wspólnie z R. Stachowskim zrobiłem to w monografii (Zastosowanie analizy wariancji w eksperymentalnych badaniach psychologicznych) poświęconej w całości szczegółowej prezentacji, wraz z omówieniem możliwych zastosowań, analizy wariancji. Z kolei wprowadzenie w problematykę MANOVA daje praca Aronowskiej: Elementy zastosowań modelu wielowymiarowej analizy wariancji (MANOVA) w badaniach psychologicznych. Czytelnik zainteresowany bardzo dobrym opanowaniem sztuki eksperymento- 341 wania opartej na modelach ANOVA i MANOVA powinien jednak sięgnąć po anglojęzyczne opracowania tej problematyki. Do najbardziej znanych w świecie należą książki: Edwardsa (1972. 4. wyd.), Scheffe'a (1959), Kirka (1982, 2. wyd.), Winera, Browna i Michelsa (1991, 3. wyd.), Timma (1975). Problematyka oceny wielkości efektu eksperymentalnego (polegająca na roz- biciu wariancji całkowitej Y na wariancje składowe, których źródłem są poszcze- gólne zmienne niezależne Xi, X2, X3,...) została gruntownie wyłożona w mojej pracy: Ocena efektu eksperymentalnego w układach eksperymentalnych analizy wa- riancji. Przeglądu popularnych wskaźników stosowanych do oceny istotności zmien- nych niezależnych dokonała Paszkiewicz: O zastosowaniu mierników wielkości efektu eksperymentalnego. Chciałbym jeszcze zwrócić uwagę Czytelnika na jedno. Otóż dobre opanowa- nie modelu E wymaga równie dobrego opanowania zasad wnioskowania statysty- cznego wraz ze znajomością ANOVA, MANOVA oraz klasycznych, parametrycz- nych i nieparametrycznych testów istotności. Zakładam, że Czytelnik zapoznał się, przed lekturą tego rozdziału, z rozdz. 10. i 11. Zwłaszcza bardzo przydatne mogą okazać się dwa schematy, które prowadząc „za rękę", pozwolą dokonać optymal- nego wyboru testu istotności różnic w analizowanych, w danym planie, porównań — por. rys. 11.1, dla grup (danych) niezależnych oraz rys. 11.2, dla grup (danych) zależnych. Z podręczników wprowadzających psychologów, socjologów i pedagogów w zagadnienia statystyki polecić mogę, przede wszystkim, PWN-owskie wydanie bar- dzo dobrego, adresowanego właśnie do psychologów i pedagogów opracowania pióra Fergusona i Takaneego (w przygotowaniu; oryg. wyd. 1989), a także PWN- owskie wydanie znanego w środowisku socjologów podręcznika Blalocka (Staty- styka dla socjologów). Podręcznik prowadzący Czytelnika „za rękę", od problemu do problemu, napisany jako tzw. „podręcznik programowany", to — także wydana przez PWN — praca polskiego statystyka Grenia: Statystyka matematyczna. Pod- ręcznik programowany. Polecam także opracowanie tegoż autora: Statystyka mate- matyczna — modele i zadania. W dzisiejszej dobie nie sposób pracować bez obsługi komputerowej. Dla na- szych celów szczególnie przydatne będą dwa pakiety statystyczne — SPSS PC+ oraz CSS STATISTICA — zawierające moduły MANOVA, ANOVA, testy istot- ności różnic: parametryczne i nieparametryczne. Rozdział 13. Model wielokrotnej regresji (MR) 1. Wprowadzenie — model analizy wariancji (ANOVA) a model wielokrotnej regresji (MR) Model RM, obok modelu ANOVA, należy do najczęściej stosowanych przez psy- chologów wielozmiennowych modeli statystycznych. Tak jak na temat modelu ANOVA napisano wiele monografii i podręczników (por. np. Scheffe, 1959; Winer, 1971; Winer i in., 1991; Oktaba, 1971, 1980; Edwards, 1972; Krishnaiah, 1980; Brzeziński, Stachowski, 1984), tak i na temat modelu MR — zwłaszcza w latach siedemdziesiątych i osiemdziesiątych — powstało wiele publikacji (por. zwłaszcza adresowane do przedstawicieli nauk behawioralnych: Kerlinger, Pedhazur, 1973; Pedhazur, 1982; Tukey, Mosteller, 1977; Lindeman, Merenda, Gold 1980; Cohen, Cohen, 1975, 1983; Gunst, Mason, 1980; Aiken, West, 1991). Dominujące w latach sześćdziesiątych i pierwszych latach siedemdziesiątych podejście ANOVA do pla- nowania badań psychologicznych (zwłaszcza eksperymentalnych) zostało wyraźnie zdominowane w ostatnich latach przez podejście MR. W dużym stopniu do spopu- laryzowania modelu korelacyjno-regresyjnego, jako podstawy planowania badań i analizy danych w psychologii, przyczyniły się, często cytowane przez psycholo- gów, artykuły Cohena (1968)1 i Darlingtona (1968). Godne uwagi są też artykuły: Overalla i Spiegla, (1969), czy Woodwarda i Overalla (1975). Jak czytelnikowi zapewne wiadomo, jednym z ważnych i, niestety, często „blokujących" psychologa założeń modelu MR jest założenie o co najmniej interwałowym (w sensie przed- stawionym przez Stevensa, 1951) poziomie pomiaru zmiennych niezależnych (pre- dyktorów), wprowadzonych przez badacza do modelu MR. Psychologia jest dys- cypliną nauk behawioralnych, której poziom rozwoju osiągnął taki etap, że jeszcze wiele badań empirycznych prowadzonych jest na zmiennych, których operacjona- lizacja zakłada nominalną skalę pomiaru (tzw. zmienne jakościowe). Ważną rolę w takich badaniach odgrywają też zmienne „z natury" jakościowe, jak: płeć, pocho- dzenie środowiskowe, rodzaj zaburzeń zachowania, wzorzec reagowania, typ tem- Artykuł J.Cohena (1968) znalazł się na liście 100 najczęściej cytowanych artykułów z zakresu nauk społecznych, w latach 1969-1977. Lista ta była opublikowana przez E.Garfielda w „Current Contents: Social and Behavioral Sciences" (1978, 32, s. 5-14) i przedrukowana w „Zagadnieniach naukoznawstwa" przez J.Daszkowskiego (1980, 2, s. 170-182). 343 peramentalny itp. Poziom świadomości metodologicznej przeciętnego psychologa jest taki, że wie on, iż zmienne jakościowe (dwu- i wielokategorialne) stosunkowo łatwo może wbudować w plan eksperymentalny modelu ANOVA (jedno z założeń dopuszcza nominalny charakter zmiennych niezależnych). Jeżeli możemy się posługiwać dobrym i wypróbowanym modelem ANOVA, to po co szukać innych, równoległych rozwiązań statystycznych? Myślę, że racje dla takiego poszukiwania są następujące (por. m.in. Overall i Klett, 1972; Pedhazur, 1982): 1. O ile w przypadku jednej zmiennej niezależnej, takiej jak np. „płeć", przyj mującej dla poszczególnych osób badanych jedną z dwóch wartości: „mężczyzna- -kobieta", koszt badania (liczony w stosunku do liczby osób badanych) jest wiel kością nieznaczącą, o tyle wzrasta on zdecydowanie przy kolejnym dołączaniu nowych zmiennych (nawet wyłącznie dwuwartościowych). Jeżeli minimalna, zało żona przez badacza, liczebność grupy porównawczej wynosi n = 10 osób, co i tak jest liczbą niewielką z punktu widzenia zagwarantowania rezultatom badania nie za niskiej trafności zewnętrznej — wszak chcemy uzyskać wyniki reprezentacyjne dla danej populacji, także w sensie ilościowym (próba reprezentatywna nie może być zbyt mała; por. Pawłowski Z., 1972) — to badanie obejmujące trzy zmienne niezależne dwuwartościowe wymaga: N=n-2-2-2 = S0 osób. Dołączenie czwar tej zmiennej zwiększa nam ogólną liczbę osób badanych do N= 2 • 80= 160 osób. Z kolei dołączenie piątej zmiennej daje już nam N = 320 osób itd. Jeżeli przeba danie każdej osoby jest kosztowne i na dodatek trudno daną osobę pozyskać do badania (np. pacjenci o nietypowych wzorach osobowości), to oczywiste jest szu kanie modeli mniej „kapitałochłonnych" od modelu ANOVA. 2. Chcąc posłużyć się modelem ANOVA musimy dość często rezygnować z mierzenia danej zmiennej niezależnej na poziomie skali interwałowej czy nawet ilorazowej, i w sposób sztuczny — via procedura operacjonalizacji — sprowadzać ją na poziom pomiaru skali nominalnej. Na przykład zmienna „poziom inteligencji" zoperacjonalizowana za pomocą Skali Inteligencji WAIS-R (wskaźnik IQ wyrażony na skali interwałowej) sprowadzona jest do postaci trójkategorialnej: „IQ poniżej normy — IQ w normie — IQ powyżej normy" lub — co gorsza — do postaci dwukategorialnej: „IQ poniżej mediany lub równe medianie — IQ powyżej media ny". Najbardziej „kosztowne", jeżeli chodzi o utratę informacji, są zabiegi dycho- tomizacji zakresu wartości zmiennej ilościowej (Cohen, 1983). Zresztą zabieg dy- chotomizacji został bardzo spopularyzowany przez socjologów, między innymi za sprawą pracy Lazarsfelda Algebra systemów dychotomicznych (1968). 3. Często jest tak, że część zmiennych niezależnych jest ze swej natury jako ściowa (np. płeć), a część ilościowa, i ze względów podniesionych przez cytowa nego wyżej Cohena niewskazane byłoby upieranie się przy modelu ANOVA jako podstawie analizy danych. Najkorzystniej zatem byłoby odwołać się do takiego modelu, który pozwalałby na zachowanie natury pomiarowej zmiennej, tzn. nie wymuszałby zabiegu sprowadzania skali interwałowej (czy ilorazowej) do skali nominalnej. 4. Jak wiadomo, analiza wariancji wykorzystywana jest przez psychologów w wariancie ortogonalnym — w przeważającej części przypadków — który za- 344 kładą równą lub proporcjonalną liczebność grup porównawczych („kratek"). Z jed- nej strony taki, jak wyżej wspomniany, układ liczebności grup porównawczych sprawia, że test F-Snedecora jest najbardziej czuły, a warunki utrzymania założeń (zwłaszcza założenia o homogeniczności wariancji pochodzących ze źródeł nie kontrolowanych przez badacza — por. Brzeziński, Stachowski, 1984, rozdz. 3.) są optymalne. Z drugiej strony, technika obliczeń jest o wiele prostsza w warian- cie o równym n, od techniki obliczeń wymuszonej przez wariant nieortogonalny (por. Winer, 1971; Kirk, 1982). W przypadku planów eksperymentalnych wielo- czynnikowych, technika obliczeniowa jest skomplikowana, żmudna i niezbyt efek- tywna. 5. Trafność zewnętrzna planu eksperymentalnego (w sensie przedstawionym w rozdz. 12.) wymaga, aby badanie przeprowadzone było na próbie reprezentatyw nej dla całej populacji. Rozkład liczebności w poszczególnych grupach porównaw czych, odpowiadających wartościom danej zmiennej niezależnej (nominalnej) po winien pokrywać się z analogicznym rozkładem liczebności w populacjach porów nawczych. Nie można tedy prowadzić badania w wariancie ortogonalnym ANOVA, jeżeli populacje porównawcze nie mają takich samych rozkładów liczebności. Jeżeli na przykład w populacji ogólnej jest znacząca przewaga liczebności jednej płci w stosunku do drugiej, a płeć jest zmienną istotną dla zmiennej zależnej, to ta prze waga musi być również utrzymana w próbie. W przeciwnym przypadku nie można tej próby uznać za reprezentatywną. Wyrównanie liczebności — ze względów czy sto technicznych — może prowadzić do ustalenia przez psychologa artefaktów. Trzeba zatem poszukać takiego modelu statystycznego, w którym nierówna liczeb ność grup porównawczych traktowana będzie nie jako „zło konieczne", ale jako jeszcze jeden wyróżnik danego badania. 6. Kolejny ważny punkt, którego nie sposób pominąć, to problem dychotomii: „liniowość versus krzywoliniowość" związku Y i X. W modelu ANOVA postać związku Y i X określona jest za pomocą metody wielomianów ortogonalnych (tzw. analiza trendu między zmiennymi — por. Oktaba, 1971; 1980; Winer, 1971; Ed- wards, 1972; a także rozdz. 10. pkt 2.-3.). Aby jednak posłużyć się tą metodą, niezbędne jest przeprowadzenie zabiegu ułatwiającego obliczenia (w przeciwnym przypadku obliczenia stają się bardzo żmudne), to jest pogrupowanie osób bada nych w przedziałach odpowiadających kolejnym podzbiorom wartości zmiennej niezależnej, ilościowej (por. wyżej, pkt. 2. i 3.). 7. Nie sposób określić, w modelu ANOVA, efektów interakcyjnych dwóch czynników, z których jeden ma charakter ilościowy, a drugi jakościowy, bez uprzedniego sprowadzenia tego pierwszego też do postaci jakościowej. Może się jednak okazać, że jest to zabieg niemożliwy do przeprowadzenia. Wyżej przytoczona lista ograniczeń stosowania w badaniach psychologicznych (zwłaszcza nieeksperymentalnych, a takich jest w psychologii najwięcej) modeli ANOVA jest jednocześnie swoistą listą zalet modelu MR, rekomendującą go do zastosowań psychologicznych. W niniejszym rozdziale nie będzie — zgodnie z jego tytułem — mowy o wszystkich problemach związanych z wykorzystaniem modelu MR w praktyce 345 badawczej psychologii. Trzeba by na to całej książki. Skupię się jedynie na zagad- nieniach stosunkowo najmniej znanych polskiemu psychologowi, zwłaszcza temu, który nie sięga po specjalistyczne obcojęzyczne opracowania z dziedziny statystyki. Chciałbym mianowicie uprzystępnić problematykę — ważną dla psychologa ope- rującego na terenie .jakościowych" działów psychologii, jak na przykład psycho- logii klinicznej — wprowadzenia do modelu MR zmiennych jakościowych. Omó- wię więc także zagadnienie jednej zmiennej jakościowej w modelu MR i na tym przykładzie wykażę, iż oba modele, to jest ANOVA i MR, są strukturalnie tożsame, to znaczy prowadzą do dokładnie takich samych rezultatów. Następnie na przykła- dzie dwóch zmiennych jakościowych omówię zagadnienie wprowadzenia do mo- delu MR ich interakcji. Wpierw jednak wprowadzę podstawowe pojęcia i wzory obliczeniowe zwią- zane z odmianą ilościową modelu MR (gdy badacz operuje predyktorami ilościo- wymi — na poziomie skali interwałowej i ilorazowej). 2. Zmienne (niezależne) ilościowe w liniowym modelu MR 2.1. Podstawowe odmiany MR Zagadnienia związane z budową (i zastosowaniem) modelu MR najlepiej wyłożyć wyodrębniając jego dwie odmiany, z uwagi na liczbę zaliczonych przez badacza do obrazu przestrzeni zmiennych istotnych dla zmiennej zależnej Y, tj. O(PY), zmiennych niezależnych. W pierwszej odmianie modelu MR mamy tylko jedną zmienną niezależną, istotną dla Y. Nazwijmy tę odmianę jednozmiennową. Druga odmiana, którą nazwiemy wielozmiennową, obejmuje dwie (i większą liczbę) zmienne niezależne istotne dla Y. W przypadku obu odmian możemy rozpatrywać przypadek prostej operacjona- lizacji zmiennej zależnej Y oraz przypadek operacjonalizacji złożonej. Jeżeli w efe- kcie operacjonalizacji zmiennej zależnej (np. z użyciem Skali Inteligencji WAIS-R Wechslera w celu pomiaru IQ osób badanych) uzyskamy dla N-osobowej grupy badanej wektor wyników o wymiarach „N? 1", to będzie to przypadek operacjona- lizacji prostej. O tak zoperacjonalizowanej zmiennej zależnej powiemy, że jest ona jednowymiarowa. Rzeczywistość jest jednak, jak wiemy, bardziej złożona niżby sobie tego życzył badacz i nie zawsze prosta operacjonalizacja zmiennej zależnej prowadzi do zadowalających rezultatów. Dlatego też powstaje konieczność uwzględ- nienia kilku kryteriów operacyjnych dla jednej zmiennej zależnej. Nie otrzymamy wtedy dla iV-osobowej grupy badanej jednego wektora wyników, ale macierz wy- ników o wymiarach: N ? r (r — liczba zastosowanych przez badacza kryteriów operacyjnych dla danej zmiennej zależnej; np. oceny struktury inteligencji danej osoby można dokonać na podstawie przeprowadzonego badania za pomocą wyżej 346 już wspomnianej skali WAIS-R Wechslera, która składa się z 11 testów; w takim przypadku dla N-osobowej grupy badanej uzyskamy macierz wyników o wymia- rach: JVx 11"). Zmienna zależna operacjonalizowana za pomocą wielu kryteriów — to zmienna wielowymiarowa. Uwzględniając wyżej zaproponowane podziały, otrzymamy cztery odmiany modelu MR: (a) odmiana jedno-jednozmiennowa (zmienna zależna jednowymiarowa oraz jedna zmienna niezależna), (b) odmiana jedno-wielozmiennowa (zmienna zależna jednowymiarowa oraz wiele zmiennych niezależnych), (c) odmiana wielo-jednozmiennowa (zmienna zależna wielowymiarowa oraz jedna zmienna niezależna), (d) odmiana wielo-wielozmiennowa (zmienna zależna wielowymiarowa oraz wiele zmiennych niezależnych). Jeśli chodzi o postać zależności wiążącej zmienną Y ze zmiennymi dla niej istotnymi, to znowu możemy mówić o dwóch odmianach modelu MR. Najczęściej psychologowie formułują twierdzenie orzekające zależność liniową Y od Xj — zwłaszcza wtedy, gdy są analizowane wielozmiennowe uwarunkowania Y (podob- nie postępują też ekonomiści — por. Hellwig, 1960; Goldberger, 1975). Rzadziej — a w przypadku odmian jedno-wielozmiennowej oraz wielo-wielozmiennowej modelu MR bardzo rzadko — psychologowie mówią o zależnościach krzywolinio wych (tzn. dających się opisać wielomianami wyższych niż liniowy stopni). Mamy więc: (1) odmianę liniową MR, (2) odmianę krzywoliniową MR. 2.1.1. Model liniowy: jedno-jednozmiennowy Każdy podstawowy kurs statystyki dla psychologów, pedagogów i socjologów obejmuje problematykę opisu statystycznego szeregu dwucechowego (dwuzmien- nowego) oraz problematykę regresji liniowej jednej zmiennej ilościowej (w sensie skali interwałowej i ilorazowej) względem drugiej zmiennej, też ilościowej. Kurs taki obejmuje też zagadnienie korelacji liniowej (wedle Pearsona) dwóch zmien- nych ilościowych. Wobec powszechnej dostępności opracowań dydaktycznych po- dejmujących zagadnienie korelacji (regresji dwóch zmiennych ilościowych), przy- toczę tylko podstawowe założenia modelu statystycznego odmiany jedno-jedno- zmiennowej oraz podstawowe wzory, które będą stanowiły punkt wyjścia do pre- zentowania bardziej skomplikowanych odmian modelu MR. Przypomnijmy, że w przypadku jednej zmiennej zależnej Y względem Xu uważanej przez badacza za istotną dla Y, równanie regresji liniowej Y względem l przyjmuje postać: F = + a, (13.1) 347 już wspomnianej skali WAIS-R Wechslera, która składa się z 11 testów; w takim przypadku dla N-osobowej grupy badanej uzyskamy macierz wyników o wymia- rach: ,J\fx 11"). Zmienna zależna operacjonalizowana za pomocą wielu kryteriów — to zmienna wielowymiarowa. Uwzględniając wyżej zaproponowane podziały, otrzymamy cztery odmiany modelu MR: (a) odmiana jedno-jednozmiennowa (zmienna zależna jednowymiarowa oraz jedna zmienna niezależna), (b) odmiana jedno-wielozmiennowa (zmienna zależna jednowymiarowa oraz wiele zmiennych niezależnych), (c) odmiana wielo-jednozmiennowa (zmienna zależna wielowymiarowa oraz jedna zmienna niezależna), (d) odmiana wielo-wielozmiennowa (zmienna zależna wielowymiarowa oraz wiele zmiennych niezależnych). Jeśli chodzi o postać zależności wiążącej zmienną Y ze zmiennymi dla niej istotnymi, to znowu możemy mówić o dwóch odmianach modelu MR. Najczęściej psychologowie formułują twierdzenie orzekające zależność liniową Y od Xj — zwłaszcza wtedy, gdy są analizowane wielozmiennowe uwarunkowania Y (podob- nie postępują też ekonomiści — por. Hellwig, 1960; Goldberger, 1975). Rzadziej — a w przypadku odmian jedno-wielozmiennowej oraz wielo-wielozmiennowej modelu MR bardzo rzadko — psychologowie mówią o zależnościach krzywolinio wych (tzn. dających się opisać wielomianami wyższych niż liniowy stopni). Mamy więc: (1) odmianę liniową MR, (2) odmianę krzywoliniową MR. 2.1.1. Modei liniowy: jedno-jednozmiennowy Każdy podstawowy kurs statystyki dla psychologów, pedagogów i socjologów obejmuje problematykę opisu statystycznego szeregu dwucechowego (dwuzmien- nowego) oraz problematykę regresji liniowej jednej zmiennej ilościowej (w sensie skali interwałowej i ilorazowej) względem drugiej zmiennej, też ilościowej. Kurs taki obejmuje też zagadnienie korelacji liniowej (wedle Pearsona) dwóch zmien- nych ilościowych. Wobec powszechnej dostępności opracowań dydaktycznych po- dejmujących zagadnienie korelacji (regresji dwóch zmiennych ilościowych), przy- toczę tylko podstawowe założenia modelu statystycznego odmiany jedno-jedno- zmiennowej oraz podstawowe wzory, które będą stanowiły punkt wyjścia do pre- zentowania bardziej skomplikowanych odmian modelu MR. Przypomnijmy, że w przypadku jednej zmiennej zależnej Y względem Xh uważanej przez badacza za istotną dla Y, równanie regresji liniowej Y względem przyjmuje postać: r = bY\X{ + a, (131) 347 gdzie: Y — przewidywane wyniki zmiennej zależnej Y\ bY\ — współczynnik re- gresji; a — stała regresji. Współczynnik b mówi nam o kącie nachylenia linii regresji względem osi odciętych układu współrzędnych, zaś współczynnik a wskazuje punkt przecięcia linii regresji z osią rzędnych. Schematycznie pokazuje to rys. 13.1. Pojedyncze punkty nad i pod linią regresji przedstawioną na rys. 13.2 obrazują wyniki uzyskane przez poszczególne osoby: a-tą, b-tą, c-tą itd., w teście przezna- ' I " x? Rys. 13.1. Linia regresji wyznaczona równaniem: Y' = bylXt + a Zmienna Y 80 75 70 65 'eo 55 50 c . e • 9' r = 0,6708X, - 11,25 b 1 0 0 105 110 115 120 125 130 135 Z m i e n n a X , podstawie danych z tab. 13.1) 348 Rys. 13.2. Ilustracja zastosowania metody najmniejszych kwadratów do wyznaczania linii regresji (na czonym do pomiaru zmiennej Xt (oś odciętych). Jeżeli każdy punkt pomiarowy połączymy odcinkiem prostopadłym do osi odciętych (zmienna X{) z linią regresji, to dla każdej osoby badanej otrzymamy odległości: Y—Y'. Linia regresji została „ulokowana" w układzie współrzędnych tak, że spełnione jest: fJ(Yk-rk) = min. Stąd nazwa tej linii regresji: linia najmniejszych kwadratów. Tabela 13.1 po- kazuje wzorcowo przygotowane dane do wyznaczenia linii najmniejszych kwadra- tów, która została wykreślona na rys. 13.2. Ostatnia kolumna tej tabeli zawiera wyniki przewidywane: Y' uzyskane z równania regresji (13.1). Tabela 13.1. Tabela wyników do wyznaczenia równania regresji zmiennej Y (poziom osiągnięć w czytaniu) względem zmiennej X, (iloraz inteligencji — II) (1) (2) (3) (4) (5) (6) (7) Osoby badane Y Xi X.2 Y2 XiY r a 66 118 13 924 4 356 7 788 68 b 50 99 9 801 2 500 4 950 55 c 73 118 13 924 5 329 8 614 68 d 69 121 14 641 4 761 8 349 70 e 72 123 15 129 5 184 8 856 71 f 54 98 9 604 2916 5 292 54 g 74 131 17 161 5 476 9 694 77 h 70 121 14641 4 900 8 470 70 i 65 108 11664 4 225 7 020 61 j 62 111 12 321 3 844 6 882 63 k 65 118 13 924 4 225 7 670 68 1 63 112 12 544 3 969 7 056 64 m 67 113 12 769 4 489 7 571 65 n 59 111 12 321 3 481 6 549 63 0 60 106 11236 3 600 6 360 60 P 59 102 10404 3 481 6 018 57 r 70 113 12 769 4 900 7 910 65 s 57 101 10 201 3 249 5 757 57 Suma 1155 2024 228 978 74 885 130 806 1 156 Źródło: na podstawie tab. 8.1 (Ferguson, Takane, 1989, s. 120) Współczynniki bY\ oraz a najprościej można obliczyć według wzorów, do tórych dane zawiera tab. 13.1. ' (13-2) a = v yv =Y- bnXh (13.3) 349 gdzie: ? xu X Y — suma M^ i F-°w (kolumny: 2. i 3. tab. 13.1); Z^K — suma iloczynów ^-ów i 7-ów (kolumna 6. tab. 13.1); ^Jf2 — suma xi-ów (ko- lumna 4. tab. 13.1); J,, F— s'rednie Xrów i 7-ów; ? r2 — suma 72-ów (koi. 5. tab. 13.1). Wstawiając do wzorów (13.2) i (13.3) dane z tabeli 13.1, otrzymamy równanie regresji Y względem Xx o następującej postaci: Y'= 0,6708 *,- 11,25. „Dobroć" dopasowania linii najmniejszych kwadratów do punktów empirycz- nych (por. rys. 13.2) określamy za pomocą współczynnika determinacji (przemno- żonego przez 100%), obliczonego według wzoru: (13.4) 'n x 100%, 350 gdzie: rYi — współczynnik korelacji według momentu iloczynowego (Pearsona). Jak pamiętamy, współczynnik r-Pearsona jest współczynnikiem korelacji dwóch zmiennych ilościowych. Jego użycie jest uzasadnione jeżeli: 1) zależność między dwiema zmiennymi jest liniowa. Dla typowych funkcji nieliniowych opracowano metody transformacji danych wyjściowych, które pozwa lają na otrzymywanie nowych funkcji liniowych (por. Hellwig, 1960); 2) rozkłady obu zmiennych są symetryczne. Jeżeli nie są one symetryczne, tzn. albo są lewoskośne, albo prawoskośne, to ważne jest, aby oba rozkłady cecho wała ta sama skośność (albo oba były lewoskośne, albo oba prawoskośne). Współczynnik korelacji r przyjmuje wartość od -1 do +1. W przypadku, gdy linia najmniejszych kwadratów idealnie pokrywa (tak jak na rys. 13.3a) wszystkie punkty empiryczne (w liczbie N) otrzymamy: r= 1 (albo - 1), a współczynnik determinacji będzie równy: (l,0)2 • 100% = 100%. Oznacza to, że wspólna wariancja obu zmiennych: Y i X\ wynosi 100%, czyli, że zmienna Xt wyjaśnia całkowitą zmienność Y. Mówiąc jeszcze inaczej, zmienna X\ jest jedynym (bo wyjaśniającym 100%) źródłem wariancji zmiennej Y. Jeżeli punkty empiryczne są losowo rozrzucone wokół linii najmniejszych kwadratów, tak jak na rys. 13.3b, to r = 0,0, a współczynnik determinacji jest równy (0,0)2 ? 100% = 0%, co oznacza, że wspólna wariancja obu zmiennych wynosi 0%. Inaczej: zmienna Xt nie jest źródłem zmienności Y, czyli nie wchodzi ot do przestrzeni zmiennych istotnych dla Y. Wreszcie, gdy mamy do czynienia z takim usytuowaniem linii najmniejszych kwadratów względem punktów empirycz- nych, jak na rys. 13.2 (por. też rys. 13.3c), to współczynnik r przyjmuje wartość z przedziału: (0,0; 1,0), a współczynnik determinacji przyjmuje wartość z przedziału: (0%,100%). Oznacza to, że zmienna Y ma wspólną wariancję ze zmienną Xb ale także z jakąś inną (innymi) zmienną. Wyrażenie: (1 - r?() • 100% określa pro- centowy udział innych wpływów na Y stanowiących dodatkowe źródło zmienności Y. Całą wariancję Ymożna podzielić na dwie części: (a) część wyjaśnioną wpływem na y zmiennej JT, (czyli warianc/a yy (bj ććf stanomaca e/bfc oc/dz/a/ywania na Fzmiennych niezależ- (bj gdzie: 2^XU 2^Y— suma X]-ów i y-ów (kolumny: 2. i 3. tab. 13.1); 2_,X\Y — suma iloczynów Xrów i y-ów (kolumna 6. tab. 13.1); z\xj — suma X2-ów (ko- lumna 4. tab. 13.1); Xu Y— średnie Xrów i y-ów; 2_,Y — suma Y-ów (koi. 5. tab. 13.1). Wstawiając do wzorów (13.2) i (13.3) dane z tabeli 13.1, otrzymamy równanie regresji Y względem Xi o następującej postaci: Y'= 0,6708*, - 11,25. „Dobroć" dopasowania linii najmniejszych kwadratów do punktów empirycz- nych (por. rys. 13.2) określamy za pomocą współczynnika determinacji (przemno- żonego przez 100%), obliczonego wedhig wzoru: /y2, x 100%, (13.4) gdzie: rY\ — współczynnik korelacji wedhig momentu iloczynowego (Pearsona). Jak pamiętamy, współczynnik r-Pearsona jest współczynnikiem korelacji dwóch zmiennych ilościowych. Jego użycie jest uzasadnione jeżeli: 1) zależność między dwiema zmiennymi jest liniowa. Dla typowych funkcji nieliniowych opracowano metody transformacji danych wyjściowych, które pozwa lają na otrzymywanie nowych funkcji liniowych (por. Hellwig, 1960); 2) rozkłady obu zmiennych są symetryczne. Jeżeli nie są one symetryczne, tzn. albo są lewoskośne, albo prawoskośne, to ważne jest, aby oba rozkłady cecho wała ta sama skośność (albo oba były lewoskośne, albo oba prawoskośne). Współczynnik korelacji r przyjmuje wartość od -1 do +1. W przypadku, gdy linia najmniejszych kwadratów idealnie pokrywa (tak jak na rys. 13.3a) wszystkie punkty empiryczne (w liczbie AO otrzymamy: r= 1 (albo - 1), a współczynnik determinacji będzie równy: (l,0)2 • 100% = 100%. Oznacza to, że wspólna wariancja obu zmiennych: Y i X\ wynosi 100%, czyli, że zmienna X\ wyjaśnia całkowitą zmienność Y. Mówiąc jeszcze inaczej, zmienna X\ jest jedynym (bo wyjaśniającym 100%) źródłem wariancji zmiennej Y. rów- Jeżeli punkty empiryczne są losowo rozrzucone wokół linii najmniejszych kwadratów, tak jak na rys. 13.3b, to r = 0,0, a współczynnik determinacji jest ny (0,0)2 ? 100% = 0%, co oznacza, że wspólna wariancja obu zmiennych si 0%. Inaczej: zmienna Xx nie jest źródłem zmienności Y, czyli nie wchodzi ona do przestrzeni zmiennych istotnych dla Y. Wreszcie, gdy mamy do czynienia z takim usytuowaniem linii najmniejszych kwadratów względem punktów empirycznych, jak na rys. 13.2 (por. też rys. 13.3c), to współczynnik r przyjmuje wartość z przedziału: (0,0; 1,0), a współczynnik determinacji przyjmuje wartość z przedziału: (0%,100%). Oznacza to, że zmienna Y ma wspólną wariancję ze zmienną Xh ale także z jakąś inną (innymi) zmienną. Wyrażenie: (1 - r$t) • 100% określa centowy udział innych wpływów na Y stanowiących dodatkowe źródło żmii ści Y. Całą wariancję Y można podzielić na dwie części: (a) część wyjaśnioną wpływem na Y zmiennej X\ (czyli wariancja wyjaśniona Y), (b) część pozostałą, stanowiącą efekt oddziaływania na Y zmiennych niezależ- 350 ł a) b) c) — » * a • • • • • • 4 i • • • • m • • • • • # « • a> '/• • • • • • • i i • * 1 • • * i r • • • / • • • • • . • ( ' i * • • • • • ? • • Zmienna X, r„=1,0 0% -? ," ' I Uwaga: mianownik wzoru (13.7) przyjmuje postać: N- 1, jeżeli uwzględnimy wzór na odchylenie standardowe zmiennej Xt w postaci: s = N-l Jeżeli jednak przyjmiemy, że wzór na s ma postać: 352 to wówczas w mianowniku wzoru (13.7) wstawiamy wyrażenie N; s obliczone według wzoru pierwszego stanowi nieobciążony estymator a, a s obliczone według wzoru drugiego stanowi obciążony estymator a. Związek między współczynnikiem regresji bn i współczynnikiem korelacji rYX jest następujący: (13.8) , Gdy dwie zmienne są wystandaryzowane według wzoru (13.6), to: sr = Si = 1, a współczynnik regresji bYl = rY\. W takiej sytuacji przyjęło się w miejsce współ- czynnika bYU mówić o wadze beta —J3Yi lub fix. Tutaj: fin = rn. Waga beta (Ji) jest standaryzowanym współczynnikiem regresji. Mówi nam ona o tym, o ile zmieni się Y wskutek standaryzowanej zmiany zmiennej X{ (tj. o 1 odchylenie standardowe). Z kolei równanie regresji liniowej Y względem Xj przyjmuje postać: ZV= lub Z'Y = (13.9) W przypadku gdy r= 11,01, kąt między linią regresji a osią y-ów wynosi 45°. Dla r = 0,0 kąt wynosi 0°, czyli linia regresji pokrywa się z osią y-ów. Gdy siła związku pomiędzy dwoma zmiennymi wystandaryzowanymi ZY i Zx jest wyrażona współczynnikiem korelacji r o wartości leżącej między zerem oraz 11,01, to kąt między linią regresji oraz osią y-ów jest większy od 0°, ale mniejszy od 45°. W każdym z wyżej rozpatrzonych przypadków linia regresji przechodzi przez po- czątek układu współrzędnych (por. rys. 13.4). Załóżmy, że otrzymaliśmy równanie regresji zmiennej Y względem zmiennej I X\. O „dobroci" dopasowania linii najmniejszych kwadratów do punktów empirycz- nych mówi nam wskaźnik r2 (100%), który — załóżmy — jest większy od 0%. Pytanie, czy można uznać zmienną Xi za istotną dla Y, ponieważ r2(100%)>0? Tak, jeżeli r2 „znacząco" odbiega od zera. Aby się przekonać czy wartość r2 (100%), albo prościej wartość r „znacząco" odbiega od zera, trzeba przeprowadzić testowanie istotności współczynnika r. Testujemy Ho: pYi - 0 przeciwko H\. pn * 0. Zastosowanie znajduje tu test /.: ^ df=N-2 t - 1 - Odrzucamy Ho na rzecz Hu jeżeli: (13.10) {a,df- Zauważmy, że ze wzrostem wielkości próby (AO maleje wartość r, która na danym poziomie a stanowi granicę istotności danej Xi dla Y. Aby więc odrzucić Ho na a= 0,01, przy N=20, potrzeba r ? 0,537, ale przy N- 100 wystarczy już, aby r ^ 0,254. Dlatego też test istotności (tutaj f) służy nam jedynie jako kryterium decyzyjne na etapie 6. procesu badawczego (por. rys. 1.4, roz. 1.). W celu oceny 23 — Metodologia badań.. 353 1 równanie regresji Irl kąt między osią ty a linią regresji zV=O,Oz, 1,0 45' z\=rz, (0,0-1,0) (0--45-) z'y=1,0z, 0,0 0* Rys. 13.4. Usytuowanie linii regresji w przypadku zmiennych wystandaryzowanych wg wzoru 13.6, odpowiadające trzem różnym wartościom współczynnika korelacji między nimi stopnia istotności danej zmiennej niezależnej dla Y (uwaga: nie mylić z istotnością statystyczną!) odwołamy się do innego wskaźnika, np. ^(100%), który pokaże nam procentowy udział tej zmiennej w wyjaśnieniu zmienności Y. Z dwóch zmiennych X, i Xj ta jest bardziej istotna dla Y, dla której wskaźnik r2(100%) przyjmuje wyższą wartość. Można również wskazać o ile jest ona bardziej istotna. W przypadku wskaźnika t (czy też w przypadku samego r) nie jest możliwe udzielenie odpowie- dzi na to pytanie! 2.1.2. Model liniowy: jedno-wielozmiennowy W odmianie jedno-wielozmiennowej MR badacz rozpatruje zależność zmiennej Y od wielu (2 i większej liczby) zmiennych niezależnych. Dla przejrzystości wykładu charakterystyka tej odmiany modelu MR będzie tutaj przeprowadzona na przykła- 354 dzie dwóch zmiennych niezależnych: Xi i X2. Podam też proste wzory obliczenio- we dla trzech zmiennych niezależnych. Większa liczba zmiennych niezależnych wymaga już odwołania się do pomocy elektronicznej techniki obliczeniowej. W tym celu opracowano różne strategie budowy modelu MR (por. Draper, Smith, 1973). Równanie regresji liniowej w przypadku dwóch zmiennych niezależnych X\ oraz X2 przyjmuje postać: (13.11) gdzie: bn2, bY2i — cząstkowe współczynniki regresji; a — stała regresji. Modelem geometrycznym nowego równania jest płaszczyzna, otrzymana metodą najmniejszych kwadratów (podobnie jak w przypadku odmiany jedno-jed- nozmiennowej modelem geometrycznym była prosta najmniejszych kwadratów), leżąca w przestrzeni trójwymiarowej (liczba wymiarów tej przestrzeni jest okre- ślona przez liczbę zmiennych niezależnych, wprowadzonych do modelu, plus zmienna zależna, a więc: 2+1) — por. rys. 13.5. Wokół tej płaszczyzny (ozna- czonej literami ABCD) skupiają się punkty empiryczne (reprezentujące wyni- ki uzyskane przez poszczególne osoby badane w Xu X2 i.Y). Jeżeli — tak jak w naszym przypadku — wszystkie korelacje pomiędzy zmiennymi są dodatnie, tj. rY\ > 0, TY2 > 0, r]2 > 0, to punkty reprezentujące wyniki będą leżały wzdłuż przekątnej OZ. Odległość OA jest równoważna stałej regresji a i pokazuje miejsce przecięcia płaszczyzny najmniejszych kwadratów z osią Y. Linie: AD i AB, to linie najmniejszych kwadratów o równaniach: Y' = b{Xx + a oraz Y' = b2X2+a. Jeżeli zmienne wystandaryzujemy, wedle wzoru (13.6), to równanie (13.11) przyjmie postać wystandaryzowaną, analogiczną do (13.9): 7' — li 7 j. R 7 (11 11\ Z- — yJyi 2^1 + PY2.i^2 > (IJ.IZ) PY\.2> fin.\ — standaryzowane cząstkowe współczynniki regresji, w skrócie: „wagi beta". Związek między wagami beta a cząstkowymi współczynnikami regresji jest następujący: , si „ S2 PY\2 = »KI.2 ^~. PY2.\ - bY2.i -r-- (13.13) Cząstkowe współczynniki regresji obliczamy według stosunkowo prostych wzorów (Kerlinger, Pedhazur, 1973, s. 34): (13.14) 24* 355 YĘ=bvl2X,+by2,X2+a I / Rys 13 5 Płaszczyzna najmniejszych kwadratów wyznaczona równaniem regresji 13 11 , / f f . I FU usua^n < u _ (X*?) (X^)-(Xx^ (X^) ^ r.vxo« (13 {t °Y2.l a = Y- Ci. X ?"%?' X y2' X ^i^' X ^z^, X xixz — sumy kwadratów i iloczynów ob- liczane według wzoru: ^ jcf, ^ Ą — obliczamy analogicznie. X ;C2>'' X ^1^2 — obliczamy analogicznie Xi, X2, Y to wyniki surowe zawarte w tabeli 13 2, która obejmuje dane pocho- dzące z badań nad związkiem między poziomem osiągnięć w czytaniu (Y) oraz liniową kombinacją zmiennych zdolności werbalne (X{) i motywacja osiągnięć (X2) 356 Tabela 13.2 Tabela wyników do wyznaczania równania regresji zmiennej Y ( poziom osiągnięć w czytaniu) oraz Xi (motywacja osiągnięć) (1) (2) (3) (4) (5) (6) Osoby badane Y Xl Xi Y' Y-Y' 1 2 2 4 3,0305 -1,0305 2 1 2 4 3,0305 -2,0305 3 1 1 4 2,3534 -1,3534 4 1 1 3 1,9600 -0,9600 5 5 3 6 4,4944 0,5056 6 7 4 7 4 5 6 3 5,1715 4,6684 -1,1715 2,3316 8 6 5 4 5,0618 0,9382 9 7 7 3 6,0226 0,9774 10 8 6 3 5,3455 2,6545 11 3 4 5 4,7781 -1,7781 12 3 3 5 4,1010 -1,1010 13 6 6 9 7,7059 -1,7059 14 6 6 8 7,3125 -1,3125 15 10 8 6 7,8799 2,1201 16 9 9 7 8,9504 0,0496 17 6 10 5 8,8407 -2,8407 18 6 9 5 8,1636 -2,1636 19 9 4 7 5,5649 3,4351 20 10 4 7 5,5649 4,4351 Suma 110 99 104 Średnia 5,50 4,95 5,20 Źródło: na podstawie tab. 3.1 (Kerlinger, Pedhazur, 1973, s. 33) - Kolumny: (2)-(4) obejmują wyniki surowe zmiennych: Y, Xu X2. Kolumna (5) zawiera przewidywane wyniki zmiennej Y, czyli Y' otrzymane na podstawie równania regresji 13.11. Jeżeli oś rzędnych będzie reprezentowała wyniki zmiennej Y, a oś odciętych wyniki przewidywane zmiennej Y, czyli Y', to poszczególne punkty układające się wzdłuż przekątnej reprezentują pary wyników (Yk, Y'k), k=\, ...,N. W przypadku uzyskania idealnego dopasowania płaszczyzny najmniejszych kwadratów do da- nych, owe punkty będą się układały dokładnie w linii prostej leżącej pod kątem 45° względem osi odciętych i wychodzącej z początku układu współrzędnych (przypadek dokładnej korelacji zmiennej Y z liniową, w sensie najmniejszych kwa- dratów, kombinacją zmiennych: Zj i X2). W odniesieniu do danych z tab. 13.2 ilustruje to rys. 13.6. Za pomocą współczynnika korelacji wielokrotnej RY.\2 określamy siłę związku (liniowego) między zmienną Y oraz zmiennymi Xi i X2 (traktowanymi łącznie). 357 - Ry,2(max) =1,00 V 12 11 10 r | | / / / 6 9 10 1 1 1 2 V Ky12=0,71 • A, l =81,60 Rys. 13.6. Usytuowanie par punktów odpowiadających wartościom: Y i Y' — na podstawie danych z tab. 13.2 (równanie 13.11) Ł 2*.' ".łi,€I jij;3i33T błnanwfti'^ry/fij^Ui'; - Współczynnik R, w odróżnieniu od r przyjmuje wartość z przedziału: <0,0; l,0>. Z kolei współczynnik wielokrotnej determinacji: R2 przemnożony przez 100 procent informuje nas o procencie wariancji zmiennej Y wyjaśnianej przez liniową (w sen- sie najmniejszych kwadratów) kombinację zmiennych X\ i X2. Jest on interpretowany podobnie jak współczynnik determinacji— ryi (i= l,...,k). -" ~l Z kilku możliwych sposobów obliczania wartości Ry.n zalecam ten, który „wychodzi" od standaryzowanego równania regresji: . . -..,' . , / .; e RY.i2-Pn.2rn+Pr2.\rri, »- ^ - '. U3.1o) • ,"$•'. - ogólniej: Tńu -1 i / i's''M.,i;ii;n w>- \ $nuA<, • '\\tism ;•"??; •/' Fa^^2. Często badacza nie zadowala znajomość tylko procentowej wartości wariancji zmiennej Y wyjaśnianej przez liniową kombinację zmiennych niezależnych wystę- pujących w równaniu regresji (w naszym przypadku: Xi i X2). Chce on jeszcze poznać udział (procentowy) każdej zmiennej oddzielnie w wyjaśnianiu wariancji zmiennej Y. Nie można do tego celu użyć prostych współczynników korelacji: rn i rj7,, gdyż najczęściej obie zmienne niezależne w jakimś stopniu ze sobą korelują. Mówiąc inaczej mają wspólną wariancję. Określając tedy wspólną wariancję zmien- nej Y oraz zmiennej Xi, musimy uwzględnić fakt, że jakaś część owej wariancji jest również wspólna ze zmienną X2. Zależności te najlepiej widać, gdy wariancje zmiennych przedstawimy graficznie w postaci zachodzących na siebie kół, tak jak to prezentuje rys. 13.7. Do oceny „czystego" wpływu danej zmiennej niezależnej, „uwolnionego" od związków tej zmiennej z pozostałymi zmiennymi występującymi w równaniu re- gresji, zostały opracowane dwa rodzaje współczynników. Jeżeli chcemy poznać „czystą" wariancję wspólną zmiennej Y oraz zmiennej Xx („uwolnioną" od wpły- wów na Xt zmiennej X2), to musimy się posłużyć współczynnikiem determinacji semicząstkowej (w skrócie: ry(] 2> lub sĄ). Współczynnik determinacji semicząstkowej dla i-tej zmiennej możemy obli czyć według wzoru (Cohen, Cohen, 1975, s. 96), z którego można wywieść szcze gółowe wzory na współczynniki poszczególnych rzędów: pierwszego (kontrola jed nej zmiennej niezależnej), drugiego (kontrola dwóch zmiennych niezależnych) itd. Dany współczynnik determinacji semicząstkowej otrzymujemy przez porównanie dwóch współczynników determinacji wielokrotnej — jednego obliczonego dla k zmiennych niezależnych (a więc obejmującego także daną /-tą zmienną), tj. H:i..... i, ...,*• oraz drugiego, obliczonego dla k-l zmiennych niezależnych (a więc nie obejmującego i-tej zmiennej), tj. Ry.i (i), ...,*• Ą&L.... (0,.... *) = Rh i..... * ~ Rh.... (,) k. (13.20) (0 — oznacza tu zmienną wykluczoną ze zbioru k zmiennych stanowiących łączne źródło (w sensie liniowej kombinacji) wariancji wyjaśnionej Y. 359 Zmienna X. Zmienna X, R \ ,2=a+b+c r\,=a+c ipfu>ncw A.J '_>f ?»' *=a r2 = a r "<2 a+d ' V(21) ° ' ^_ piuhu - *&,?> xv , r2 b+c Rys. 13.7. Geometryczna ilustracja korelacji między zmiennymi: Y oraz X, i X2 — z wykorzystaniem współczynnika korelacji wielokrotnej, cząstkowej i semicząstkowej (13.21) (13.22) W przypadku dwóch zmiennych niezależnych (por. rys. 13.7) mamy: ?v 'yn 2^ — "Yii — "Yi — ^» -3! i'l|u.łC,l /» ..'" v ' „ ^ ". '.'JJ 5-'nsoq ^fnoirio ii ^ _^2 _^2 _^ ^n;. fffi" 1 Oczywiście: /$.i = 4i> ^K.2 = 42- * '<'!"I*ll«s/;-' -t% ?''" suto , (13.23) (13.24) Współczynniki determinacji cząstkowej dla każdej z k zmiennych niezależnych oddzielnie można obliczyć przez porównanie dwóch współczynników determinacji 360 wielokrotnej, jednego wykluczającego daną i-tą zmienną /?y.i,...,(,) * oraz drugie- go, obejmującego i-tą zmienną Ryx...,k (wg Ezekiela i Foxa, 1959, s. 193-194): Y.I k Yil (0,..., k 1-RY.I (,),...,* (i) — oznacza tu zmienną wykluczoną ze zbioru k zmiennych stanowiących łączne źródło (w sensie liniowej kombinacji) wariancji wyjaśnionej Y. W przypadku dwóch zmiennych niezależnych — jak w naszym przykładzie — mamy: -«F.12 l-R2 Rzecz jasna, że. R\.i = Ąi i R\.2 = Ąi ? Test istotności dla współczynników korelacji cząstkowej (lub semicząstkowej) jest następujący: (13.28) (13.25) (13.26) (13.27) Y.2 Y.n Ą(\2) F,= przy stopniach swobody: dla licznika: dfl = \\ dla mianownika: df2-N-k-l. Uznajemy współczynnik rn.2 za istotny na danym poziomie a, jeżeli: Uznajemy współczynnik za istotny na danym poziomie a, jeżeli: ^ > ?ffi ą. Wyżej opisałem jedynie współczynniki korelacji cząstkowej, odnoszące się do statystycznej kontroli zmiennych niezależnych „zamazujących" wpływ jednej zmiennej niezależnej na Y. Takie współczynniki noszą nazwę współczynników ko- relacji cząstkowej rzędu pierwszego, rzędu drugiego, trzeciego itd. W zależności od liczby zmiennych niezależnych, które chcemy kontrolować możemy też mówić o współczynnikach wielokrotnej determinacji cząstkowej. Na przykład „czysty" wpływ liniowej kombinacji zmiennych: .X\ X2 i X3 na zmienną zależną Y przy jednoczesnej kontroli zmiennych niezależnych: X4 i X5 można oznaczyć za pomocą współczynnika: /?y(i23.45)- Szerzej na ten temat piszą: Cohen i Cohen (1975). Kończąc rozważania na temat odmiany jedno-wielozmiennowej MR, chciał- bym jeszcze podać Czytelnikowi (zwłaszcza temu, który jeszcze na co dzień ma kontakt tylko z kalkulatorem) proste wzory obliczeniowe dla wersji modelu z trze- ma zmiennymi niezależnymi (wg Aikena, 1974): Możemy tez zastosować wzór alternatywny: - rn (ri2 - rnrn) - rn (rn ~ri2r23) (13.30) 2r12r13r23 - ni ~ H3 - 361 -3! ».nh v - r13r23) - rn (r23 - rX2rn) (13.31) ('?" f n Po pująco: _ -rx2rn) - Ą 2 ) - (13.32) l -'i2- 'i3-'23 + 2r12r13r 23 obliczen iu wartości fiYX 23, wartości j3y213 orazj3j3 12 można obliczyć nastę- />y2.i3= rYl ~ 1-^23 ~ r13 ~ (13.35) fin.n = rn - rx3jiYX11, - r2ipn.i3 ? (13.34) Współczynnik /?y123 obliczamy według wzoru (13.17). Test na istotność /?y123 przedstawia wzór (13.19). Gdybyśmy chcieli wyliczyć wartość R2 wprost z macierzy korelacji zmien- nych, to pomocny będzie wzór: - 2rnrj7 (r12 - r13r23) - I - r12r23) - 1rY2rYi(r23 ~ r12r13)l ^ [1 ~ M2 ~ ^13 ~ >23 + 2r12r13r23]. i i ?? ~ X; ,-JroyufiftRrm cih i r %*i i iim id i n; •/f^irI'ł\W, 11 ^^ or\ Chcąc poznać czysty wpływ poszczególnych zmiennych niezależnych na Y oddzielony od wpływów dwóch pozostałych zmiennych niezależnych, możemy się odwołać do współczynnika determinacji cząstkowej. Wychodząc z wzoru (13.25) mamy: D2 ~KYl23 (13.36) Cy23 Ay7 t-i—\ (13.37) ?1 >•".!? ?2 y.22 ?M,H;t (13.38) Możemy też wyjść ze wzoru (13.20) i obliczyć współczynnik determinacji semicząstkowej. 2.2. Wprowadzanie interakcji zmiennych ilościowych do modelu MR W modelu MR możliwe jest wprowadzenie nie tylko nowych zmiennych niezależ- nych, ale także składnika interakcji dwóch i większej liczby zmiennych niezależ- nych. Konieczność wprowadzenia do równania regresji iloczynu predyktorów (tak wtedy, gdy nie jest spełnione założenie, że korelacja między jedną zmienną X]( a zmienną zależną Y jest taka sama dla wszystkich wartości drugiej zmiennej X2 (zwanej — moderator variable). Mówiąc inaczej, zachodzi zależność: rY\-g(X2). W takim przypadku wyjściowy model addytywny postaci (13.11) musimy zastąpić modelem nieaddytywnym postaci: bn.l3X2 + bnA2X,X2 + a, (13.39) lub (gdyż iloczyn: ,JC\X2" można traktować jako nową zmienną: X3): F = bn,23Xx + bnAiX2 + bY3.l2X3 + a. (13.40) Można też to zapisać w postaci standaryzowanej: Z\=finl3Zx +A7.13Z2 +AmZ3- (13.41) Wykorzystując wzory: (13.30)-(13.32) oraz (13.13) można stosunkowo prosto wyznaczyć wartości wag beta lub cząstkowych współczynników regresji oraz rów- nanie postaci (13.41) lub (13.40). Za pomocą współczynnika determinacji wielokrotnej RY,\23 (100%) oceniamy procent wariancji wyjaśnionej zmiennej Y, wprowadzony przez zmienne Xi i X2 oraz ich interakcję. Wartość współczynnika korelacji wielokrotnej znajdujemy na podstawie wzoru (13.17). Prześledźmy teraz jak wygląda od strony numerycznej wprowadzenie nowego składnika (tu: interakcji: X\X2) do równania regresji. Nie jest ono wcale skompli- kowane i każdy psycholog może tę interakcję sam opracować. Przypuśćmy, że od 3 osób (N = 3) uzyskano wyniki dla dwóch zmiennych niezależnych: X\ i X2 oraz zmiennej Y: Lp. Zmienna zależna Y: Xi'. X2: X,X2 [Xs]: 1. 10 4 5 20 (4x5) 2. 26 7 9 63 (7x9) 3. 8 3 2 6 (3x2) Oczywiście powyższe zestawienie powinno mieć tyle kolumn, ile składników występuje w danym równaniu regresji. Problematyka wprowadzenia do równania regresji interakcji zmiennych została bardzo szczegółowo omówiona przez Aiken i Westa (1991). 3. Zmienne jakościowe w modelu MR — konstruowanie zmiennych instrumentalnych ajprostsze badanie eksperymentalne polega — zgodnie z podstawowym jego schematem — na przebadaniu dwóch równoważnych losowo grup, z których jedna, 363 ł ll. Jedna zmienna dwukategorialna - analiza przykładu: test t, test F, współczynnik korelacji r Na zwana eksperymentalną, obejmuje te osoby, wobec których psycholog stosuje okre- ślony zabieg eksperymentalny (podaje im lek, stosuje wobec nich psychoterapię, wyzwala u nich silne emocje itp.), a druga, zwana kontrolną, obejmuje te osoby, które badacz pozostawia w nie zmienionych warunkach (placebo, tradycyjne lecze- nie, relaks itp.). Mówiąc inaczej, w takim badaniu zmienna niezależna (nawet de facto ilościowa) traktowana jest jako zmienna jakościowa (dychotomiczna), przyj- mująca wartości ze zbioru: (0,1). Jeżeli zmienna zależna Y mierzona jest na skali interwałowej lub ilorazowej i jeżeli jej rozkład w populacji ma znamiona rozkładu normalnego, to hipotezę zerową postaci: Ho: H\= n2 można zweryfikować za pomocą testu t dla dwóch grup niezależnych. Można też dojść do identycznego rezultatu inną drogą, stosując mo- del ANOVA w układzie jednoczynnikowym: AN0VA-KRG-/?(« > 1)T — por. Brzeziński, Stachowski (1984, s. 65-69) — gdzie: p (liczba poziomów zmiennej niezależnej X) = 2. Można też, co jest już mniej znane przeciętnemu „konsumento- wi" statystyki, dojść do tego samego rezultatu porzucając paradygmat eksperymen- talny i model ANOVA (test F jest, jak wiadomo, analogonem testu t, opracowanym z myślą o porównywaniu większej niż dwie liczby średnich arytmetycznych) i przechodząc na obszar paradygmatu nieeksperymentalnego, przez zastosowanie modelu MR, tu w najprostszej jego odmianie jedno-jednozmiennowej. Problem jest tylko jeden. W jaki sposób wprowadzić zmienną zero-jedynkową do modelu MR? Dochodzimy zatem do tytułowego problemu. Prześledźmy teraz postępowanie badacza — na fikcyjnym przykładzie — w ramach wymienionych wyżej dwóch paradygmatów: (a) eksperymentalnego (test t i test F) oraz (b) nieeksperymentalnego (korelacyjno-regresyjnego — współ- czynnik korelacji według momentu iloczynowego r). /: test t Wylosowano z populacji (według zasady randomizacji I) N=\Q osób bada- nych i rozdzielono losowo (według zasady randomizacji II) na dwie równoliczne (rti = n2 = n- 5) grupy. W pierwszej grupie (eksperymentalnej) psycholog zastoso- wał manipulację eksperymentalną polegającą na stworzeniu osobom badanym sty- mulacyjnych warunków pracy. Z kolei drugiej grupie (kontrolnej) stworzone zostały relaksowe warunki pracy. Zatem zmienna niezależna, eksperymentalna X jest dwuwartościowa: „warunki stymulacyjne (1) — warunki relaksowe (0)". Oceniano, za pomocą odpowiedniej skali standaryzowanej, poziom funkcjonowania osób ba- danych (zmienna zależna Y mierzona na skali dziesięciopunktowej, stenowej, na które) kraniec \ oznacza! z\e funkcjonowanie, a kraniec \0 dobre funkcjonowanie). Oczekiwano, iż przeciętne funkcjonowanie osób z grupy eksperymentalnej będzie lepsze (średnia bliższa będzie górnemu krańcowi skali) od przeciętnego funkcjono- wania osób z grupy kontrolnej (średnia bliższa będzie dolnemu krańcowi skali). Tabela 13.3. Dane do przykładu (m = m = n = 5) (0) (1) (2) Lp. Grupa eksperymentalna Grupa kontrolna 1 2 3 5 6 5 7 7 3 2 1 1 2 Suma (yj 33 9 Średnia (7,) 6.6 1.8 Suma kwadratów odchyleń (SS) 5.2 2.8 ), k=l,...5(n) Ł_1 K_l (13.42) Sumy kwadratów odchyleń (SS): (13.43) Testujemy hipotezę zerową Ho: //i =//2 przeciwko hipotezie roboczej (jedno- stronnej) Hy. Hi >/i2 ? Załóżmy, że spełnione zostały wszystkie warunki stosowania testu t. Podstawiając dane z tabeli 13.3 do wzoru na statystykę t otrzymujemy: t = (13.44) 2>i* + 2>2*| \ |_ «i + n2 - 2 Y —Y t- 6,6- 1,8 5,2 + 2,8 U1 + I 5+5- 2 5 5 = 7,59 365 /" i,* i \ .f«- vtiiK-44Uin.iy.sA df-n\ + n2-2-5 + 5-2. *-vr*. *<„; <»(y-..ie c Dla a = 0,05 i stopni swobody df= 8 (prawostronny obszar odrzuceń Ho) warl tość krytyczna statystyki testowej wynosi: ^0,05,8- 1,680. Ponieważ t > 1,860, więc* mamy podstawy do odrzucenia Ho i przyjęcia H\. Wniosek, przeciętny poziom funkcjonowania grupy eksperymentalnej oka się lepszy od przeciętnego funkcjonowania grupy kontrolnej. /': test F Tabelę 13.3 możemy potraktować jako tabelę danych właściwą dla planu ANOVA-KRG-2 (n = 5)1 — por. Brzeziński, Stachowski (1984, s. 65-69). W ana- lizowanym przykładzie całkowitą sumę kwadratów (SScala) można rozbić na dwie składowe: (a) sumę kwadratów między grupami (SSmiędzy), odnoszącą się do zmien- ności wyników wynikającej z różnic w traktowaniu osób z porównywanych dwóch grup i (b) sumę kwadratów wewnątrz grup, lub inaczej resztową (SSwewnatrz), odnoszącą się do zmienności, której źródłem są nie kontrolowane przez badacza różnice indywidualne występujące w każdej z dwóch grup. Inaczej: błąd eksperymentalny. Mamy zatem: + SS wewnaJrz , (13.45) SScaja = S lub w terminach wariancji: var(Y) = var(Y\X) + var(Y\Teszta). > #ó,V;ibswi * SSwewnątrz = (ii> - (iii). ~ P ~ t»< i ci ? (13.49) (13.: = pn-\. SScała = (ii) - (i), Wyniki przeprowadzonej analizy wariancji zebrane zostały w tabeli 13.4. ] ar = 0,01 i stopni swobody: dfmiędzy=l i dfwewnątrz = 8 wartość krytyczna statyst testowej wynosi: F0fi5; 1; s = 5,32. Ponieważ F> F^ więc mamy podstawy do c rzucenia Ho i przyjęcia Ht. Tabela 13.4. Analiza wariancji do danych z przykładu 1. (0) (1) (2) (3) (4) Źródło wariancji Y SS df MS F Między Wewnątrz 57.6 8 1 8 57.6 1 57.6** Cała 65.6 9 * n<0,05, /w i 8 = 5.32 **p<0,01, Fojau |. 8= 11,3 Obliczmy jeszcze procent wariancji wyjaśnionej zmiennej y, tłumaczonej wpływem na Y czynnika X. Do tego celu możemy użyć wskaźnika n2 pomnożonego przez 100% (Kirk, 1982, s. 162): SS 17^x100%= gjjT^ x 100% , (13.53) rfcx x 100% = |^| 100% = 87,80% . Zatem rozbicie wariancji całkowitej Y na wariancje składowe wygląda następująco: var(Y) = vaĄY\X) + 100% = 87,80% + 12,20%. Wniosek: jak w I. Czy rzeczywiście wartość statystyki F jest identyczna z wartością statystyki f! Przypomnijmy, iż między statystyką t i statystyką F zachodzi związek (Brzeziń- ski, Stachowski, 1984, s. 71): Ądfl^Fihdfj. (13.54) Zatem statystyka F ze stopniami swobody: df\ = 1 i df2 równa jest kwadratowi statystyki t ze stopniami swobody df= df2. W naszym przypadku zachodzi równość: 7,592 = 57,60, 57,60 = 57,60. Doszliśmy zatem do tego samego rezultatu. //: współczynnik r Aby dostosować dane do wymogów modelu MR musimy w odniesieniu do czynnika X przeprowadzić zabieg kodowania. Ponieważ czynnik X w analizowa- nym przykładzie jest czynnikiem dychotomicznym, więc użyjemy tu kodu zero-je- dynkowego. Zasada kodowania jest następująca. Każda osoba należąca do grupy eksperymentalnej otrzyma współczynnik 1, a każda osoba należąca do grupy kon- trolnej otrzyma współczynnik 0. Tak więc wektor X będzie się składał z samych jedynek i zer. Zmodyfikujemy teraz tabelę 13.3 tak, aby odpowiadała ona nowym wymaganiom. Po modyfikacji obejmuje ona (por. tab. 13.5) wektor wyników zmiennej zależnej Y (kolumna 2.) i wektor wyników czynnika X (kolumna 3). 367 Tabela 13.5 Dane do przykładu 1. przystosowane do obliczania współczynnika korelacji ryx (na podstawie tabeli 13.3.) r ?? .*?? (0) (1) (2) (3) Lp. Grupy Zmienna zależna Y X 1 2 3 4 5 grupa eksperymentalna 6 5 7 8 7 1 1 1 1 1 6 7 8 9 10 grupa kontrolna 3 2 1 1 2 o o o o o Suma 42 5 Średnia 4.2 0.5 Suma kwadratów odchyleń (SS) 65.6 2.5 Suma iloczynów (SP) 12 yras^ffS" ; Wzory: — sumy kwadratów odchyleń (por. wzór 13.43), — suma iloczynów (SP): ,U '.?ij.TOO'! i:\ N j=l JV N I 1=1 1 7 >>o?;w7S', >:>.v ^^X ^.~ >=l /' ' ^^.y.:r;'« (13.55) aĄXl' yi=Yj-Y., ^ = ^-^(1=1,...,^), .s.>,,.— sumy kwadratów: J . • . . - . SSregresja = tyySP, (13.56) i €- bjpoza regresją (reszta) = ^caia ~ ^regresja* (13.57) — współczynniki regresji: - - .'i-t-i- - - ? N ^ob^^otomA, (]35g) — współczynnik korelacji liniowej (według Pearsona): lub: / ?^regresja rYX - i V SScaia N N 'X Ty N 1=1 1=1 /=1 (13.61) (13.62) 1=1 — test istotności współczynnika r: (13.63) dfi = m, df2 = N -m-\, m — liczba wektorów czynnika X (tu: 1), lub: (13.64) Podobnie jak w V, całkowita suma kwadratów może być rozbita na dwie składowe sumy kwadratów: (a) sumę kwadratów związaną z regresją zmiennej Y względem zmiennej X (SSregreSja) oraz (b) sumę kwadratów poza regresją (SSreszta): ^^cała = ^*^regresja + ^^reszta- (1 J.Oj) Podstawiając dane z tabeli 13.5 do odpowiednich wzorów otrzymujemy: — współczynniki regresji: byx = Y^ = Ą$, a = 4,2 - (4,8)(0,5) = 1,8, Y' = 4 ;8 X + 1,8, — równanie regresji: — sumy kwadratów: SSregresja= (4,8)(12) = 57,6 (ze wzoru 13.56), SSreszta= 65,6 - 57,6 = 8,0 (ze wzoru 13.57), SScała = 242 - 422 : 10 = 65,6 (ze wzoru 13.52), — współczynnik korelacji r. *'?% = 0,9370. „Dobroć" dopasowania linii najmniejszych kwadratów do danych empirycz- nych określona jest za pomocą współczynnika determinacji (pomnożonego przez 100%) 24 — Metodologia badań.. 369 Ąx x 100% = (0,9370)2 • 100% = 87,80%. Współczynnik Ąxx 100% mówi nam — przypominam — o procencie wa- riancji zmiennej Y wyjaśnionej wpływem na nią zmiennej X (inaczej: współczynnik ten informuje badacza o wielkości wariancji wspólnej zmiennych Y i X). Z kolei wskaźnik (1 - Ąx) x 100% mówi o wielkości wariancji resztowej (poza regresją). W naszym przykładzie wynosi ona 12,20%. Zauważmy, iż uzyskaliśmy analogicz- ny wynik, jak w przypadku wskaźnika Y\Y\ X 100% obliczonego w I'. Na koniec pozostało nam jeszcze testowanie hipotezy zerowej, która w przy- padku współczynnika korelacji przyjmuje postać Ho: pn = 0. Hipoteza robocza bę- dzie miała w naszym przykładzie postać kierunkową Hx: />xx>0. Do tego celu możemy wykorzystać bądź test t, bądź test F. Mamy zatem: t = 0,9370 F = / 10-2 1-0,8780 = 7 , 5 8 7 6 , d f = 1 0 - 2 = 8 , - = 57,5737, ( 0 , 8 7 8 0 ): 1 (1- 0,8780 ): (10- 1-1) /2=10-l-l=8. I znowu uzyskaliśmy wyniki identyczne z tymi, które otrzymaliśmy w pkt. Iii'. Jeżeli możliwe jest — via zabieg kodowania — włączenie jednej zmiennej niezależnej dwukategorialnej do modelu MR, to zapewne możliwe jest też włącze- nie do tego modelu jednej zmiennej niezależnej wielokategorialnej (odpowiednik modelu: ANOVA-KRG-p), a także wielu zmiennych niezależnych wielokategorial- nych, na przykład dwóch zmiennych (odpowiednik modelu ANOVA-KRG-/?0). Zabieg kodowania zero-jedynkowego ułatwia — i to znacznie — przeprowa- dzanie obliczeń. I tak współczynnik korelacji między dwiema zmiennymi instru- mentalnymi: T, i Tj dany jest wzorem (Cohen, Cohen, 1975 s. 180): TI"J n.n PiPj (l-p,)(l-Pj) (13.67) gdzie: N — ogólna liczebn ość badane j próby; n„ rij — liczba osób odpowi ednio w /-tej i y-tej grupie porówn awczej (dla /- tej i ./- tej kategor ii zmienn ej X); p„ pj — propor cja osób odpowi ednio w /-tej i 7-tej grupie. G dy «! = ... = np = n, to w zó r (1 3. 67 ) up ra sz cz a si ę do po st ac i: 1 (13.68) W pr zy pa dk u ta be li 13 .6 m a m y ry = - 0, 33 33 . Ta kże i współc zynniki korelac ji między zmienn ą zależną Y i zmienn ą instru- mental ną w (w= 1,..., m) można wyrazi ć za pomoc ą uprosz czoneg o wzoru , gdyż N N w licznik u wzoru (13.62) wyraże nie V ĘX, można zastąpi ć wyraże niem: V Ywk (tj. M „ „ * = i suma Y w grupie, której przypis ano jedynk i); wyraże nie ^ Xwk - ^ X^k = n, czyli równe jest liczbie osób w grupie, której przypis ano jedynki . Zi lustruj my to, co dotychc zas zostało powied ziane na temat kodowa nia zero-- jedynk owego, przykła dem wprow adzenia do modelu MR jednej zmienn ej jako- ściowej o p = 3 kategor iach. Rozważ ymy wpierw ten przykła d w układzi e ANO- VA- KRG- p(/z = 5)1, a następn ie w układzi e MR (odmia na jedno- wieloz mienno wa). Pr zykład 2. Próbę N- 15 osób wyloso wano z populac ji i, także na drodze losowej , rozdziel ono ją na 3 grupy o liczebn ości n^ = n2 = "3 = " = 5. Osoby badane rozwiąz ywały standar dowe zadanie , w trzech różnych warunk ach (A= {ah a2, a3}). Pomiar u zmienn ej zależne j Y dokona no na skali ilorazo wej (czas wykona nia zada nia). Wyniki badania zestawi ono w tabeli 13.7. W celu uproszcz enia zapisów, współczy nniki regresji: bn 23, bn 13 itp. będziemy dalej pisać w postaci skrótowe j: bn, bn itp. 372 Tabela 13.7. Dane do przykładu 2. (ni = m = ni = n = 5) (0) 0) (2) (3) Osoby Zmienna A «1 a2 a3 1 4 4 3 2 3 3 4 3 2 5 7 4 3 6 8 5 2 6 9 Suma 14 24 31 Średnia 2,8 4,8 6,2 Wyliczamy teraz ze wzorów (13.47)-(13.49) wartości sum kwadratów: ... + 92 = 383, (iii) j (142 + 242 + 312) = 346,6, ^ 346,6-317,4 = 29,2, SSwewnątra = 383 - 346,6 - 36,4, #=3-1=2, #=3(5-1) = 12, SScata = 383 - 317,4 = 65,6, #=3-5-1 = 14. Wyniki przeprowadzonej analizy wariancji zawiera tabela 13.8. Tabela 13.8. Analiza wariancji do danych z przykładu 2. (0) (1) (2) (3) (4) Źródło wariancji Y SS df MS F Między Wewnątrz 29,2 36,4 2 12 14,600 3,033 4,813* Cała 65,6 14 *p<0,05, /•0.05;2;12 = 3,89, **p<0,0UFm.2. 12 = 6,93. Ponieważ F>F005. 2; 12. więc mamy podstawy do odrzucenia Ho (Ho: er, = O, dla wszystkich i), a zatem słuszna jest HY {Hx: a^O dla pewnych /)• Jaki procent wariancji Y wyjaśniony jest wpływem na Y zmiennej A? Odpo- wiedzi na to pytanie można udzielić odwołując się do wskaźnika rjyA (por. wzór (13.53)): 29 2 x 100% = 100% = 44,51%. Zatem rozbicie wariancji całkowitej zmiennej Y na wariancje składowe wy- ;ląda następująco: var(Y) = var(Y\A) + var(Y\Teszta), 100% = 44,51%+ 55,49%. 373 Zanalizujmy teraz ten sam przykład w paradygmacie korelacyjno-regresyjnym. Zacznijmy od utworzenia, na drodze kodowania „zero-jedynkowego", m = p - 1 = 3- 1=2, nowych zmiennych instrumentalnych: T\, T2. Przekształćmy zatem tabelę (13.7) w tabelę (13.9). Tabela 13.9. Zakodowane (kodowanie zero-jedynkowe) dane do przykładu 2. (0) (1) (2) (3) (4) Lp. Kategorie Zmienna Zmienne instrumentalne zmiennej A zależna Y T2 1 4 1 0 2 3 1 0 3 2 1 0 4 3 1 0 5 2 1 0 6 4 0 1 7 3 0 1 8 a2 5 0 1 9 6 0 1 10 6 0 1 11 3 0 0 12 4 0 0 13 a3 7 0 0 14 8 0 0 15 9 0 0 Suma 69,0 5,0 5,0 Średnia 4,6 0,333 0,333 Odchylenie standardowe 2,1646 0,4879 0,4879 Równanie regresji przyjmuje postać: 2 + a, lub postać standaryzowaną: (13.69) (13.70) Obliczenia pomocnicze: — sumy kwadratów (ze wzoru (13.43)): N ?y? = 383 -^- = 65,6 = 88^, ,. (,. • ^tt »^,ji,l.ir- J>y 1=1 v łji'):c^j. Inną też interpretację nadajemy cząstkowym współczynnikom regresji a oraz bYw- 7,SL- chodzi tu ścisła analogia z interpretacją modelu jednoczynnikowego ANOVA (mo- del efektów stałych): ANOVA-KRG-p (n > 1)1. Przypomnijmy, iż struktura poje- dynczego wyniku k-tej osoby badanej należącej do i-tej grupy porównawczej wy- gląda następująco (Brzeziński, Stachowski, 1984, s. 39-41): 379 (13.8 gdzie: Yik — wynik &-tej (k= 1,..., n) osoby pochodzącej z i-tej (i= 1, ...,/?) grupy j porównawczej; // — średni wynik zmiennej Y w populacji; c^ — efekt oddziały- p wania na zmienną zależną Y poziomu i (wartości) czynnika A: Ta, = 0; e i=i błąd eksperymentalny, którego rozkład w populacji jest normalny, ze średnią 0 i j odchyleniem standardowym aE. Oszacowaniem parametrów modelu (13.82) są: (a) » = (b) ą = 7L-7.., (c) em = Yik - Yt Zatem (13.82) możemy zapisać w postaci: (13.83) (13.84)1 (13.85): j F,). (13.86) j Zwróćmy uwagę na podkreślony element równania (13.86). Jest to efekt Mego poziomu postępowania eksperymentalnego, zdefiniowany jako różnica średniej z danej grupy porównawczej i średniej ogólnej. Zapamiętajmy to. ^ Przekształcając (13.82) lub (13.86) możemy wyznaczyć s,k: ?ik — Yik ~ M ~ lub (13.88) ?ik=Ylk-Yi.-Yik-Y..-(Yi.-Y..). Wróćmy teraz do pytania o sens empiryczny nadawany współczynnikom a i bYu w równaniu regresji otrzymanym dla zmiennych instrumentalnych skonstruo- wanych via kodowanie quasi-eksperymentalne. Otóż a to tyle, co średnia ogól zmiennej zależnej: a = ?.., (13.89) natomiast współczynniki bYw równają się odchyleniu danej średniej grupowej, dla której zmienna instrumentalna przyjmuje wartości +1, od średniej ogólnej. Zatem dla grupy a, (por. tab. 13.17) mamy: bY, = F, - Y. = «,, (13.90) (13.87) dla grupy a2: = 72.-7.. = a2, (13.91) dla grupy a3: bn = F3 - K. = ff3, (13.92) 380 Porównajmy zapisy (13.90) — (13.92) z podkreślonym elementem równania (13.86). Są identyczne4. Zatem współczynnik bn to tyle, co efekt eksperymentalny pierwszego poziomu czynnika A(ori), bn to tyle, co efekt eksperymentalny drugiego poziomu czynnika A(«2) itd. W jaki sposób jednak określić wielkość efektu ekspe- rymentalnego czwartego poziomu czynnika A (a4), gdy w równaniu regresji wystę- pują jedynie p-l=4-l=3 zmienne instrumentalne? Efekt czwartego poziomu (odpowiadający grupie porównawczej, dla osób której wszystkie zmienne instru- mentalne przyjmują wartości: -1) czynnika A (ogólnie p-tego poziomu) wyznaczamy korzystając ze wzoru: i*.. (13.93) Yi.-Y..). (13.94) Zatem: i=\ A A a2 + a3 A A A ff4 = O, 0t4 = -(«! A cr2 Ogólnie efekt eksperymentalny poziomu p czynnika A równy jest: (13.95) i=i Sumując, wynik każdej osoby badanej Yjk można rozbić na trzy składowe: (a) ogólną średnią Y.. = a, (b) efekt /-tego poziomu czynnika A, rozumianego jako odchylenie /-tej śred niej grupowej od średniej ogólnej F, - 7..; w równaniu regresji otrzyma nym metodą kodowania quasi-eksperymentalnego kolejnym efektom po ziomów czynnika A, od pierwszego do (p-l) odpowiadają wartości współczynników regresji bYU ..., bYp_u a efektowi poziomu p czynnika A (c) o d p o w i a d a w y r a ż e n i e : - 2 j i = \ resztę, czyli Yik- PŁ; resztę z równani a regresji wyznac zamy przez odjęcie wyniku zaobser wowane go k-tej osoby z /-tej grupy porówn awczej (Yjk) od wyniku otrzyma nego z równani a regresji (Y'ik): Yjk- Y'% Zrozumiałe teraz staje się określenie: kodowanie quasi-eksperymentalne. Oddaje ono po prostu ( analogię między pojęciem współczynnika regresji bYw i pojęciem „efektu eksperymentalnego" w dizie wariancji. Ponieważ osoby do grup porównawczych są wyznaczane nie losowo (podobnie jak r procedurze quasi-eksperymentalnej), więc nie użyłem tu określenia „...eksperymentalne", ale „...qu- si-eksperymentalne". Wydaje mi się, że jest to stosunkowo najlepszy polski odpowiednik terminu ngielskiego effect coding (pełniejszym określeniem byłoby treatment effect coding). Nie wydało mi : szczęśliwe, z językowego punktu widzenia, tłumaczenie go jako „kodowanie efektowe". W dostę- lej mi literaturze polskiej nie spotkałem polskiego odpowiednika effect coding. Zdecydowałem się ' na termin „kodowanie quasi-eksperymentalne". 381 Całkowitą sumę kwadratów (SScala) możemy rozbić na sumę kwadratów dla regresji (SSregresja) oraz na resztową sumę kwadratów (SSreszta): Zatem: - F..)2 = (13.96) '=1 Równanie regresji dla danych z tabeli 13.10 ma postać: uS* 'JS 3łH>^«?S W.rA) Y'^bnTl + bY2T2 + bnT3 + a. (13.97) Spróbujmy teraz to, co dotychczas zostało powiedziane na temat właściwości kodowania quasi-eksperymentalnego, zilustrować konkretnym przykładem. Przykład 3. Psychologa interesuje związek zmiennej zależnej Y (skala pomiaru — interwałowa) ze zmienną niezależną A. Zmienna A jest zmienną jakościową, czterokategorialną: A-{ah a2, a3, a4}. Każda grupa porównawcza (a,) liczy po n = 3 osoby. Razem przebadano: p ? n = 4 • 3 = 12 osób. Wyniki zawiera tabela 13.11. Tabela 13.11. Dane do przykładu 3. (nt = n2 = n3 = n4 = n = 3) (0) (1) (2) (3) (4) Lp. Zmienna A a, a, a4 1 2 3 2 3 2 8 10 12 18 19 19 25 28 30 Suma 7 30 56 83 Średnia 2,33333 10,00000 18,66666 27,66666 = p n = \ 2 , Y . . = 1 7 6 , 0 , Y . . = 1 4 , 6 6 6 6 7 . Przeprowadzając analizę wariancji według układu: ANOVA-KRG-4 (n = 3)1 dowiedzieliśmy się, że związek Y z A jest istotny statystycznie na poziomie a= 0,01. Tabela 13.12 prezentuje rezultaty przeprowadzonej analizy wariancji (otrzymane w sposób opisany w pkt. 3.2.1, przykład 2.). -i.wr i -Łi Hw, ,tf\tm fói Procent wariancji zmiennej Y wyjaśnionej przez czynnik A obliczamy odwo- łując się do wskaźnika tf (por. wzór 13.53): ui •o., uą >n» 3,. VYA x 100% = {ocg'^ 100% = 97,997% - 98%. 4(T,MOT\ ,ł Zatem rozbicie wariancji całkowitej Y na wariancje składowe przedstawia się następująco: '•-w* vaĄY) = var(Y\A) + var(ł1reszta), -łwo/l-sw \ . . 100% = 98% + 2%. .• ?««* *•<*»>* , 'i any >,, ,? 382 Tabela 13.12. Analiza wariancji do danych z przykładu 3. (0) (1) (2) (3) (4) Źródło wariancji Y SS df MS F Między 1076,6667 3 358,889 130,505** Wewnątrz 22 8 2,75 Cała 1098,6667 11 p < 0,05 ^0,05; 3; 8 = 4,07, F0,01;3;8=7,59. Chcąc dane z tabeli 13.11 opracować w modelu MR, musimy wpierw prze- prowadzić zabieg kodowania quasi-eksperymentalnego. Wyniki5 zmiennej Y, wyniki kodowania przeprowadzonego na zmiennej A oraz niektóre obliczenia statystyczne (średnie, ry , Ry.m) przedstawione są w tabeli 13.13. Tabela 13.13. Zakodowane (kodowanie quasi-eksperymentalne) dane do przykładu 3. (0) (i) (2) (3) (4) (5) Lp. Grupy Zmienna zależna Y Zmienne instrumentalne 1 2 3 1 2 3 "i 2 3 2 1 1 1 0 0 0 0 0 0 4 5 6 a2 8 10 12 0 0 0 1 1 1 0 0 0 7 8 9 -, 18 19 19 0 0 0 0 0 0 1 10 11 12 a4 25 28 30 -1 - 1 -1 -1 - 1 -1 Suma 176 0,0 0,0 0,0 Średnia 14,66667 0,0 0,0 0,0 s 9,99394 0,73855 0,73855 0,73855 -0,93606 -0,65278 -0,33255 Ąw 0,87621 0,42612 0,11059 Wartość współczynnika korelacji wielokrotnej (Rym) oraz wartość współczynnika determinacji wielokrotnej (Ry.m) równa jest: RY.123 = 0,98994, ^.,23 = 0,97998, rn= r13 = r23 = 0,50000. Przy prezentowaniu niniejszego przykładu wykorzystuję część danych z wydruku programu MULTIPLE REGRESSION [dzięki uprzejmości p. dra Cz. Noworola (UJ)], pochodzącego z biblioteki SSP zastosowanego do przeprowadzenia obliczeń statystycznych na zbiorze danych zawartych w tabeli 13.13 (wektor Y oraz wektory instrumentalne T,, T2, T3). Układ tabel: 13.13, 13.14, 13.15 — własny. 383 Wartość współczynnika korelacji rYw obliczamy korzystając z uproszczonego^ wzoru: "-.•V" : '?• ",'??s» " ?j *{W, '{vi ' ( v>v (13.98; r^= 1 v -"•"*!' 6.,, ^ gdzie: vv = 1,..., m. Wyrażenie w mianowniku wzoru (13.98) przyjmuje stałą wartość dla poszcze- gólnych współczynników korelacji: rn,..., rYm. Wystarczy tedy raz obliczoną jego wartość, dla danego zbioru zmiennych instrumentalnych reprezentujących zmienną niezależną A, podstawić do mianownika wzoru na współczynnik korelacji zmiennej zależnej Y z kolejnymi wektorami instrumentalnymi 7,, ..., Tm. Rezultaty przeprowadzonej analizy wariancji dla regresji Y względem zmien- nej A przedstawiono w tabeli 13.14. Pokrywają się one z wynikami analizy wa- riancji zawartymi w tabeli 13.12 (podobnie, w przykładzie 2. uzyskaliśmy identy- czne rezultaty, przeprowadzając analizę statystyczną danych, raz w paradygmacie ANOVA, a drugi raz w paradygmacie MR). Współczynnik korelacji wielokrotnej można obliczyć ze wzoru: *cała (13.99) Tabela 13.14. Analiza wariancji dla regresji Y względem A - do danych z przykładu 3. (tab. 13.13) (0) O) (2) (3) (4) Źródło wariancji Y SS df MS F Regresja (R2) 1076,66663 3 358,88889 130,505** Odchylenie od regresji (reszta) 22,00000 8 2,75 Cała 1098,66663 11 * p<0,5 F0,05 i s = 4,07, **p<0,l F0,01',3',8 = 7,59. Po podstawieniu danych z tabeli 13.14 mamy. ?, ,r??.123 = 0,98994. -i «fif-fii'rn' Czytelnik obeznany z modelem ANOVA wie, iż test F, wykazując istotność zmiennej niezależnej dla V, nie informuje o tym, czy wszystkie średnie grupowe istotnie różnią się między sobą, czy też tylko jedna średnia grupowa istotnie różni s^> -="— =*%, jt? nych porównań (kontrastów) między średnimi. Najbardziej znane testy tego typu, to testy: Tukeya, Scheffego, Duncana (na ich temat por. Kirk, 1982, rozdz. 3.). Tutaj pokażę zastosowanie testu Tukeya, jako testu o stosunkowo największej efektywności — na przykład w porównaniu z najbardziej konserwatywnym testem Scheffćgo — pozwalającego na wykrycie największej liczby istotnych różnic mię- dzy średnimi grupowymi. Test Tukeya przeznaczony jest dla grup o równej li- czebności, a tylko o takich tutaj mówimy. W przypadku nierównej liczebności grup należy posłużyć się testem Scheffego. Dokładny opis testu Tukeya znajdzie czytelnik u Brzezińskiego i Stachowskiego (1984, s. 71-76). Przejdę tedy od razu do zastosowania testu Tukeya wobec danych z naszego przykładu. W analizowanym przykładzie mamy cztery grupy porównawcze (p=4). Zatem wszystkich możliwych różnic między dwiema średnimi grupowymi jest p(p-l):2=6. Tabela 13.11 podaje wartości średnich grupowych. Sześć możliwych porównań to (po ich uporządkowaniu): Z), = F4. - Fj. - 25,33333, D2 = F4. - F2. = 17,66666, D3 = F4. - F3. = 9,00000, D4 = F3. - F2. = 8,66666, D5 = F3. - F,. = 16,33333, D6 = F2. - YL = 7,66667. Obliczamy teraz wartość statystyki Q testu Tukeya dla każdego porównania: F - 7 Q = ,—— '"• - . (13.100) V|MSwewnątrz MSwewn4trz = 2,75 (por. tab. 13.14). Q\ = ^5'33333 = 26,46, Q2 = 18,45, Q3 P 9,40, V 3 2,75 <24 - 9,05, Q5 = 17,06, Q6 = 8,00. Kolejny krok polega na znalezieniu wartości krytycznej statystyki Q o sto- pniach swobody: dfwev/nątrz = p (n - 1) = 8. Drugi parametr, od wartości którego uza- leżniona jest wartość statystyki Q, to liczba porównywanych średnich (tu 4). Przyj- mując poziom istotności a = 0,05 mamy: Li0,05; 4; 8 - Uznajemy dane porównanie (różnicę między średnimi dwóch grup) za istotne na danym poziomie a, gdy \Q\ Ss Q„. W analizowanym przykładzie 10 >4,53. Po- nieważ każde z sześciu porównań spełnia ten warunek, więc możemy powiedzieć, iż wszystkie możliwe różnice między średnimi dwóch grup są istotne, co najmniej na poziomie a = 0,05. Wróćmy jednak do modelu MR. Otrzymaliśmy następujące wartości współ- czynników regresji: a = 14,66667, bn =-12,33333, ^ = -4,66667, ^ = 4,00000. - Metodologia badań.. 385 Łatwo sprawdzić, iż te same wartości współczynników regresji można otrzy-1 mać przyjmując za punkt wyjścia właściwości kodowania quasi-eksperymentalnego. ] I tak: -?uj' onafr: f* a = 7..= 14,66667, bn = 7X-Y.. = -12,33333, ^ł ,u.s s^ ^ F2 - Y- = -4'66661' *» = Fs - F" = 4'°000()- r, ^ Równanie regresji przedstawia się zatem następująco: .=: Y'= -12,333337, - 4,6666772 + 4,0O0O0r3 + 14,66667. Poszczególne efekty eksperymentalne możemy oszacować na podstawie: „, , _ ax = bn= -12,33333, a2 = bn = ^,66667, a3 = bn = 4,00000, r: x- ci 4 n ax=-i -12,33333 - 4,66667 + 4,00000) = 13,00000 W jaki sposób korzystać z zapisanego wyżej równania regresji? Najlepiej po kazać to na przykładzie. Weźmy pod uwagę wynik osoby nr 1, tj. Yn (osoba z grupy a,). W poszczególnych wektorach instrumentalnych Tx, T2, T3 uzyskała on wyniki 1, 0, 0 (por. tab. 13.13). Po podstawieniu tych wyników do równania gresji mamy: .... — „,, ._ ^^ r i, = -12,33333(1) - 4,66667(0) + 4,00000(0) + 14,66667 = 2,33333, Yu - Txx = 2,0 - 2,33333 = -0,33333. Weźmy teraz wynik osoby nr 9, tj. Y33 (osoba z grupy a3). W poszczególnych wektorach instrumentalnych Tx, T2, T3 uzyskała ona wyniki 0, 0, 1. r33 = -12,33333(0) - 4,66667(0) + 4,00000(1) + 14,66667 = 18,66667, *33 = 19,0, Y33 - = 19,0 - 18,6666 = 0,33333. Postępując analogicznie z każdym wynikiem, otrzymamy tabelę reszt (por. tab. 13.15). Sumy kolumn (3), (4), (5) w tabeli 13.15 to odpowiednie sumy kwadratów (por. wzór (13.96)) — ich wartości zawiera także tabela 13.14 (kolumna 1.). 386 regresja* Tabela 13.15. Tabela reszt — do przykładu 3. — przystosowana do obliczeń sum kwadratów: SS, (0) (1) (2) (3) (4) (5) Lp. Y* rik (Yfi-T-f (T *-???? (Yfi-7'ilf 1 2 2,33333 160,44453 152,11128 0,11111 2 3 2,33333 136,11119 152,11128 0,44445 3 2 2,33333 160,44453 152,11128 0,11111 4 8 10,00000 44,44449 21,77781 4,00000 5 10 10,00000 21,77781 21,77781 0,00000 6 12 10,00000 7,11113 21,77781 4,00000 7 18 18,66667 11,11109 16,00000 0,44445 8 19 18,66667 18,77775 16,00000 0,11111 9 19 18,66667 18,77775 16,00000 0,11111 10 25 27,66667 106,77771 169,00000 7,11113 11 28 27,66667 177,,77769 169,00000 0,11111 12 30 27,66667 235,11101 169,00000 5,44443 Suma 1098,66670 1076,66730 22,00001 P n regresja ~ ^ Z-i reszta S S S S ,(rik -Y..)2 = 1076,66 730, »- y«vt)2 = 22,0000 1, SScala = :-Y..)2= 1098,66 670. Dzieląc wartości SS przez odpowiadające im wartości stopni swobody, tj. przez = p-U ^/reszta = P in-Y) otrzymamy wartości MS, tj: • *?/ regresja> MSreszta - SS resaa : dfKSZta :dfK (13.101) (13.102) Z kolei: (13.103) MSregresja:MSreszta = F. W ten sposób doszliśmy do wyników, które zawiera tabela 13.14. Wyżej powiedzieliśmy, iż wynik każdej osoby badanej składa się z trzech części. Weźmy tedy — tytułem przykładu — jeszcze raz pod uwagę dwa wyniki F„ i Y33. Dla Yn części składowe są następujące: (a) 7.. = a = 14,66667, (b) F, - F.. = Z>n =-12,33333, (c)Yn-Fh = Yu-rn = -0,33333, y„ = 2,00001 25- 387 Dl a Y3 3 częśc i składowe są następujące: (a) F.. = a 14,66667, ,Ł. i' ^ "'ii (b) F3- Y.. = b Yi = 4,00000, f * (c) y33- F3 =1 ^33— ł"33 = = 0,33333, Ą y« = : 19.00000.^! i! W przypadku zmiennej jakościowej dwu i trójkategorialnej, przy oblicz wartości współczynników regresji możemy korzystać z uproszczonych wzoróv bądź wprost na współczynniki bYw, bądź na wagi fi. Korzystaliśmy z nich pr analizie przykładu 2. Także zmienna czterokategorialna może być „opracowana" — z wykorzystaniem uproszczonych wzorów (Aiken, 1974, a także wzory 13.30-1 13.34 w niniejszym rozdziale) — za pomocą kalkulatora. Zmienne o większej] liczbie kategorii najlepiej „opracowywać" wykorzystując do tego celu komputer lub mikrokomputer i dowolny program komputerowy na wielokrotną regresję. Ta-i kie gotowe programy zawierają podstawowe biblioteki oprogramowania statysty-] cznego każdego komputera oraz specjalne biblioteki programów statystycznych ad-! resowanych do przedstawicieli nauk empirycznych, takie jak: SPSS, SPSS PC+, BMD, BMDP, SSP, SPP, CSS STATISTICA. Praca Marka i Noworola (1985) zawiera gotowy program na wielokrotną regresję liniową napisany w język FORTRAN IV. Rzecz jasna standardowy wydruk któregoś z wymienionych tu programów wielokrotną regresję liniową zawiera obok informacji dla nas użytecznych, równie informacje nieużyteczne, gdy rozpatrujemy jedynie kodowanie zmiennej jakościo- wej, a programy te pisane były z myślą o zmiennych ilościowych. Tak naprawdę, to niezbędny jest wydruk informacji zawartych w tabeli 13.14 (tabela analizy wa- riancji dla regresji), wartości współczynników regresji, wartości współczynnikóv korelacji rYw i wartość współczynnika korelacji wielokrotnej Rym..., a także warte ści średnich arytmetycznych i odchyleń standardowych. Dla pełnej interpretacji równania regresji wskazany jest wydruk wartości reszt ł^- Yik. 3.2.3. Analiza przykładu z wykorzystaniem kodowania ortogonalnego Trzeci system kodowania jest szczególnie przydatny, gdy nie mamy dostępu do komputera, a dysponujemy jedynie dobrym kalkulatorem. Szczególne właściwości kodowania ortogonalnego (ang. orthogonal coding) powodują, iż prowadzenie ob- ! liczeń statystycznych (zwłaszcza wag Ji) jest maksymalnie uproszczone. Kodowanie ortogonalne polega bowiem, mówiąc ogólnie, na skonstruowaniu nowych, instru- mentalnych zmiennych (wektorów), które nie są między sobą skorelowane. Współ- czynnik korelacji między dwoma wektorami instrumentalnymi równy jest zero, jeżeli spełniają one kryterium porównań ortogonalnych. Wyjaśnijmy najpierw, co to znaczy, że dwa porównania są ortogonalne. Jeżeli mamy p grup porównawczych, to możemy przeprowadzić p - 1 (liczba grup minus jeden) porównań ortogonalnych. Liczba takich porównań równa jest 388 liczbie wektorów instrumentalnych, które można utworzyć za pomocą kodowania. Każdej grupie w wektorze instrumentalnym przypisany jest jakiś współczynnik. W poprzednio omówionych systemach kodowania były to współczynniki: 1 i 0 (kodowanie zero-jedynkowe) oraz 1, 0 i -1 (kodowanie quasi-eksperymentalne). W przypadku omawianego w tym punkcie systemu kodowania, doborem współ- czynników rządzi zasada porównań ortogonalnych. Dwa porównania uznajemy za ortogonalne, gdy suma iloczynów współczyn- ników odpowiadających im elementów dwóch wektorów jest równa zero. Jeżeli na przykład p = 3, to mamy trzy średnie: YL, Y2, Y3. Utwórzmy dwa porównania. W pierwszym Yu skontrastowane jest z Y2.. W drugim Yh i Y2. łącznie (czyli średnia arytmetyczna z Yx i Y2.) skontrastowane jest z Y3, co możemy zapisać w postaci: (i) -1)F2. + (0)F3, (ii) (_ (13.104) (13.105) Jeżeli po przemnożeniu współczynników w (i) i (ii) i zsumowaniu kolejnych ilo- czynów otrzymamy sumę zerową, to owe porównania możemy uznać za ortogo- nalne. W naszym przykładzie mamy: (i) x (ii) (1) (-~) + (-1)(-|) + (0)( 1) = 0. Zatem porównania (i) i (ii) są ortogonalne. Zauważmy, że suma współczynników w każdym wektorze instrumentalnym równa jest zero: (i) (D + (H) KM-I) = 0, Porównania ortogonalne — poprzez odpowiedni dobór współczynników przy średnich grupowych — tworzymy kierując się: (a) hipotezą roboczą lub (b) regułą ułatwiającą przeprowadzenie obliczeń związanych z analizą wielokrotnej regresji liniowej. Rozpatrzmy wpierw przypadek (a). Załóżmy, że badacza interesuje porówna- nie przeciętnego poziomu agresywności chłopców należących do jednej z trzech grup porównawczych: ax — chłopcy pozbawieni rodziców i wychowywani w domu dziecka, a2 — chłopcy pozbawieni ojców i wychowywani przez matki i a3 — chłopcy wychowywani przez rodziców. Badacz może potraktować grupę a3 jako swoistą grupę odniesienia („kontrolną") dla dwóch pozostałych grup. Może on tedy utworzyć dwa porównania ortogonalne (bo: 3-1=2). W pierwszym, skontrastuje on średni poziom agresywności chłopców z grupy a{ (Fi.) ze średnim poziomem agresywności chłopców z grupy a2 (F2). W drugim porównaniu skontrastuje on łącznie średni poziom agresywności chłopców z grupy at i a2 (Yl oraz Y2) ze średnim poziomem agresywności chłopców z grupy 389 .Bin Przy pade k (b) będz ie tu szcz egół owo omó wion y jako reguł a kons truo wa zmie nnyc h instr ume ntaln ych, gdyż kodo wani e orto gona lne zalec ane tu jest ja spos ób ułat wiaj ący prze prow adza nie oblic zeń. Dl a wygody oblicze ń nie używa my współc zynnik ów w postaci ułamkó w, — przemn ażając każdy współc zynnik przez stałą — doprow adzamy je do liczb całkow itych. W przypa dku porówn ania (ii) — wzór (13.105 ) — zamiast sać: i*'ttwl*!* *iMą ,;*uu <^» (_—) Y\ + (-x) F2 + (1) F3 , piszem y, po przemn ożeniu każdeg o współc zynnika przez 2, tj. przez wartość mia nownik a współc zynnika przy Yl i F2: v' '> •< '> (-1) F, + (-1) F2 + (2) F3. KfiP- W przykła dzie z cztere ma grupam i i tworze nia porówn ania przez skontra sto- wanie średnie j z trzech pierws zych grup ze średnią z czwart ej grupy zamias t: I , l > ? U 1 1 1 ? ' v ( i ) F i . + ( i ) F 2 . + ( ^ ) F 3 . + ( l ) F 4 . , . ( 1 3 . 1 0 6 ) piszem y: " lX wie^iv., i.in'eics «- (D FL + (1) F2. + (1)F3. + (-3) F4, " (13.107) Pr zejdźm y teraz, zgodnie z zapowi edzią, do omówie nia zasady konstru owania zmienn ych (wektor ów) instrum entalny ch. Podana tu zasada ma na celu ułatwie nie badacz owi przepro wadzen ia oblicze ń. Nie będzie on więc interpre tował merytor ycznie porówn ań, gdyż przy ich tworzen iu nie kierowa ł się hipotez ami roboczy mi (takimi, jak w analizo wanym wyżej przykła dzie porówn ań średnie go poziom u agre- sywnoś ci chłopcó w wycho wywan ych w różnyc h warunk ach). K odowan ie p- kategori alnej zmienn ej jakości owej A o wartośc iach: a1( a2, ..., ap prowad zi do utworze nia m = p-l wektor ów instrum entalny ch: T\, T2, ..., Tm. Wektor 1. powstaj e przez skontra stowani e średniej z grupy ax (Fj) ze średnią z grupy a2 (F2). Osobo m z grupy a.\ przypis ujemy współcz ynniki 1, a osobom z grupy a2 przypis ujemy współcz ynniki - 1. Osobo m z pozostał ych grup przypis ujemy współcz ynniki 0. Wektor 2. powstaj e jako rezultat łączneg o skontra stowani a śred- nich grup: a\ i a2 (Ft i F2) ze średnią grupy a3(F3). Osobo m z grup ax i a2 przypis ujemy współcz ynniki 1, osobom z grupy a3 przypis ujemy współcz ynniki - 2, a osobom z pozosta łych grup przypis ujemy współcz ynniki 0. Wektor 3. powstaj e przez łączne skontra stowani e średnic h grup: au a2, a3, (Yim, F2, F3), ze średnią grupy a4(Y4). Osobo m z grup: au a2, a3, (Yx, F2., F3), przypis ujemy wspócz ynniki 1. Osobo m z grupy a4 współcz ynniki - 3. Osobo m z pozostał ych grup przypis ujemy współcz ynniki 0. Wektor m (ostatni ) tworzy my przez łączne skontra stowani e śred- nich grup: au a2, ..., ap_x, (YL, F2, ...,Yp_i) ze średnią grupy ap (Yp). Osobo m z grup: O], a2, ..., Qp_\ przypis ujemy współcz ynniki 1, a osobom z grupy ap współcz ynniki równe -m (przykładowo, gdy mamy p = 4 grupy, to m = p- 1=4- 1 = 3, a zatem będzie to współczynnik -3). Kierując się tą zasadą, zakodowano metodą kodowania ortogonalnego zmienną jakościową, czterokategorialną: „miejsce zamieszkania". Kodowanie zero-jedynko- we tej zmiennej przedstawione jest w tabeli 13.6, a kodowanie quasi-eksperymen- talne w tabeli 13.10. Z kolei rezultaty kodowania ortogonalnego prezentuje tabela 13.16. Tabela 13.16. Kodowanie ortogonalne zmiennej jakościowej A („miejsce zamieszkania") o p = 4 ka- tegoriach, n = 3 (0) (1) (2) (3) (4) (5) Lp. Kategorie zmiennej A Zmienna zależna Y Zmienne instrumentalne Ti T2 7-3 1 2 3 wieś «i Yu Kl2 Yl3 1 1 1 1 1 1 I 4 5 6 małe miasto a2 Yu Y22 Y23 1 1 1 1 1 1 7 8 9 średnie miasto "3 fti Y32 Y33 0 0 0 -2 - 2 -2 1 1 1 10 11 12 duże miasto a4 fti Y42 Y43 0 0 0 0 0 0 -3 - 3 - 3 Suma K. 0,0 0,0 0,0 Kodowanie ortogonalne cechują następujące właściwości: (1) Zmienne instrumentalne Th ..., Tm nie są skorelowane, tj.: (2) z uwagi na (1) mamy: ryw =fiyw, dla w = 1,..., m, (3) z uwagi na (1) mamy: (13.108) (13.109) (13.110) w=l (4) sumy wyników zmiennych Tx,..., Tm równe są zero, (13.111) (5) średnie wyników zmiennych Tu ..., Tm równe są zero, (13.112) (6) sumy kwadratów odchyleń (SS) zmiennych T\, .... Tm równe są sumom kwadratów poszczególnych wyników, np. dla zmiennej T\ SS] = 6, (13.113) 391 f (7) sumy iloczynów (SP) odchyleń dwóch zmiennych instrumentalnych róv ne są zero (wszak porównania są ortogonalne!), (13.114| p (8) sumy iloczynów odchyleń zmiennej Y i zmiennej instrumentalnej równe ] -oiifi/kl* są sumie iloczynów wyników tych zmiennych, (13.115)j (9) współczynnik regresji a = 7. (analogicznie jak w kodowaniu ąuasn Ł -eksperymentalnym), (13.116)1 (10) współczynniki regresji bYw odzwierciedlają porównania ujęte w odpowia-| dających im wektorach. I tak, współczynnik bn odzwierciedla porówna- ^ i nie Y\ z Y2, ponieważ współczynniki przy średnich Y\ i Y2 w wektorze j Tx wynoszą 1 i -1, więc: (13.117) Współczynnik regresji b^2 odzwierciedla porównanie Yx i Y2 z K3, czyli: (13.118) Z kolei współczynnik regresji bn odzwierciedla porównanie Yx i F2, F3 z F4, czyli: ^ ^ ? .?ł i i (13.119) Współc zynniki regresji bYv/ można obliczyć z uproszc zonych wzorów : N bn- i=i 1=1 (13.120) "»O P"'"?' N N •t '-.i bn = (13.121)' MifAf N N (13.122) ? P1 (korzystamy tu z właściwości (6) i (8), wzory (13.113) i (13.115)). i! A * Przejdźmy teraz do prześledzenia — na konkretnym przykładzie — zastoso- wania opisanej wyżej procedury kodowania ortogonalnego zmiennej jakościowej, wielokategorialnej. Przykład 4. Przeprowadźmy zabieg kodowania ortogonalnego na tych samych danych liczbowych, co w przykładzie 3. W ten sposób Czytelnik będzie mógł 392 ? iwdz ić, iż rzeczyw iście — niezależ nie od metody kodowa nia — otrzyma my te same rezultat y. Gdyby na tych samych danych przepro wadzić kodowa nie zero-je- dynkow e, też otrzyma libyśmy te same rezultat y (z dokładn ością do błędu zaokrą- glenia oblicze ń na którymś miejscu po przecin ku). Czyteln ik mógłby, tytułem ćwi- czenia, zakodo wać dane metodą zero- jedynko wą i przepro wadzić analogi cznie, do tutaj przepro wadzon ych, oblicze nia. W tabeli 13.17 powtór zony został wektor Y z tabeli 13.13 (przykł ad 3.). Kolumn y (3)- (5) to wektory instrum entalne skon- struowa ne metodą kodowa nia „ortogo nalnego ". Pię ć ostatnic h wierszy tabeli 13.17 zawiera niezbęd ne dane do zbudow ania równani a regresji liniowej , oblicze nia współcz ynnika determi nacji wielokr otnej RY.U3 oraz do obliczen ia wartości statysty ki testowej F. Korzyst ając z właściw ości (1) kodowa nia ortogon alnego (rtj = 0, i >j) możemy obliczyć wartość Ry^23 (korzy- stając z właściw ości (3) — wzór (13.110 )): R \ m = 0 , 0 8 0 2 5 + 0 , 2 8 4 4 4 + 0 , 6 1 5 2 8 = 0 , 9 7 9 9 7 . Tabela 13.17. Zakodowane dane (kodowanie ortogonalne) do przykładu 4. — dane takie same jak w tabeli 13.11 (0) (1) (2) (3) (4) (5) Lp. Grupy Zmienna zależna Y Zmienne instrumentalne 2 3 1 2 3 a\ 2 3 2 1 4 5 6 a2 8 10 12 7 8 9 a3 18 19 19 0 0 0 -2 -2 _2 10 11 12 25 28 30 0 0 0 0 0 0 _3 - 3 - 3 Suma 176 0,0 0,0 0,0 Średnia 14,66667 0,0 0,0 0,0 s 9,99394 0,73855 1,27920 1,80907 rYw 0,28328 -0,53333 -0,78440 IYw 0,08025 0,28444 0,61528 #=12, p = 4, n = 3, r,2 = r13= rM $.123 = 0,97997, RY123 = 0,98993 =0, Wyrażając wartość Ry.m procentowo, otrzymujemy procent wariancji zmiennej Y wyjaśnionej przez liniową kombinację zmiennych instrumentalnych Tx, T2, T3: RI123 x 100% m 98% = vaĄYIA). 393 Z ko lei wa ria ncj a res zto wa wy no si: (1 - Rl.123) x 100% = 2% = var(Hre szta). Ist otność współcz ynnika /?r.i23 testuje my za pomocą testu F (wzór (13.78)) poziomi e istotnoś ci er = 0,05: ( 0 , 9 7 9 9 7 ) : ( 3 ) F- = 1 3 0 , 6 6 4 . ( 1 0 , 9 7 9 9 7 ) : ( 1 2 - 3 - 1 ) P oniewa ż F > F0)05;3; 8. więc może my odrzuc ić Ho: Ry.m = 0 na rze H\- ^y.i23 >0. P rzepro wadzo ne wyżej oblicz enia kończ ymy zebra niem ich wynik ów w sur ryczn ej tabeli (por. tabela 13.18 ). Tabela 13.18. Analiza wariancji dla regresji Y względe m A — do danych z przykładu 3. (tab. 13.1S (0) (1) (2) (3) (4) (5) Lp. Źródło wariancji Y Proporcja wariancji Y wyjaśnionej przez dane źródło df df F 1 2 3 4 5 regresja (R1) wektor 1 (r?,) wektor 2 (r^) wektor 3 (r^) reszta (l- R2) 0,97997 0,08025 0,28444 0,61528 0,02003 3 8 0,32666 130,644** 6 cała 1,00000 11 1 p<0,05, p<0,01, F005 F0,01.3.g 3 8 = 4,07, = 7,59 Współczynniki regresji: a=Y.. = 14,66667 (na podstawie właściwości 9.) — wzór (13.116), bv\ — I YiTu 0* _ J,OJ 55 J, 1=1 I YtT2i ( 3 0 ) ( 0 ) _ - l i1 3i (3Xl)+-+(30)(- 3);= ...+ (_3)2 _: i ',' aw»' i=i (na podstawie właściwości 10.) — wzory (13.117) — (13.122). 394 Możemy też przekonać się, że poszczególne współczynniki regresji bn, bn, bn rzeczywiście odzwierciedlają dane porównania ujęte w wektorach instrumental- nych Tu T2, T3 (z wzorów (13.117) — (13.119)): bn = -3,83333: 2,33333 - 10,00000 = (-3,83333)(1) - (-3,83333)(-l), -7,66667 « -7,66666, = -4,16667: 2,33333 + 10,00000 , = ^,33333: Y^-Y^bniD-bni- D, - 18,66666 = (- 4,16667)(1) - (- 4,16667)(-2), -12,50000--12,50001, - fera( -3), 2,33333 + 10,00000 + 18,66666 - 27,66666 = (-4,33333)(1) - (-4,33333)(-3), -17,33333 =-17,33332. Jak widzimy, aby obliczyć wartość R\\2j, wystarczy obliczyć wartość współ- czynników korelacji zmiennej zależnej Y z kolejnymi wektorami instrumentalnymi. Współczynniki te możemy obliczyć z uproszczonego wzoru na rYw: N 1=1 1 Ji, r N N if y M 1=1 Wyrażenie w mianowniku: przyjmuje stałą wartość dla poszczegółnych współczynników korelacji rYl, rn, ..., rYm. Wystarczy tedy, raz obliczoną jego wartość podstawiać kolejno do wzoru na rYw 395 Możemy też wykorzystać gotowy program na obliczanie macierzy korelacji lub wag fi (bo rYw =fiyw)- Kodowanie ortogonalne prowadzi nas zatem najprostszą drogą do równania regresji liniowej. 3.3. Dwie zmienne wielokategorialne — zagadnienie interakcji między zmiennymi jakościowymi Jeżeli mamy do czynienia z co najmniej dwiema zmiennymi niezależnymi wielo- kategorialnymi, to w miejsce zmiennych X] i X2 należy wprowadzić nowe zmienne (wektory) instrumentalne. Przemnażając kolejno wektory instrumentalne (wszy- stkie) odnoszące się do X1? najpierw przez pierwszy wektor instrumentalny, następnie przez drugi wektor instrumentalny itd., odnoszące się do zmiennej X2 otrzymujemy nowe wektory odnoszące się do iloczynu X[X2. Jeżeli na przykład mamy dwie zmienne jakościowe X[ = {a!, a2, a3} i X2= {bh b2, b^}, to w ich miejsce utworzymy dwa wektory instrumentalne odpowiadające zmiennej X{ (wektory 1 i 2), dwa wektory instrumentalne odpowiadające zmiennej X2 (wektory 3 i 4) oraz cztery wektory instrumentalne odpowiadające interakcji zmiennych Xx i X2 (wektory 1x3, 1x4, 2x3, 2x4). Tabela 13.19. Kodowanie ortogonalne dwóch zmiennych jakościowych: A i B i ich interakcji (0) (1) (2) (3) 1 (4) (5) (6) (7) (8) (9) (10) Lp. Grupy Zmienna zależna Y Zmienna A Zmienna B Interakcja AB 1 2 3 4 5 1x3 6 1x4 7 2x3 8 2x4 1 2 Ym Ym 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 3 4 axbi Ym Kl22 1 1 1 1 -1 - 1 1 1 -1 - 1 1 1 -1 - 1 1 1 5 6 "1*3 Kl31 Kl32 1 1 1 1 0 0 -2 -2 0 0 -2 - 2 0 0 -2 - 2 7 8 "2*1 Y2H K212 -1 1 1 1 1 1 1 -1 -1 -1 _j 1 1 1 1 9 10 02*2 K221 K222 -1 1 1 -1 - 1 1 1 1 1 -1 - 1 -1 - 1 1 1 11 12 «2*3 Y23l Y232 -1 1 1 0 0 -2 - 2 0 0 2 2 0 0 -2 - 2 13 14 "3*1 Ym Y312 0 0 _2 - 2 1 1 1 1 0 0 0 0 -2 - 2 -2 - 2 15 16 a3b2 Ym K322 0 0 -2 - 2 -1 - 1 -1 - 1 0 0 0 0 2 2 -2 - 2 17 18 a3fc3 Y331 K332 0 0 _2 - 2 0 0 -2 -2 0 0 0 0 0 0 4 4 = 3, q = 3, n = 2 396 Zasady kodowania ortogonalnego dwóch zmiennych jakościowych i ich inter- akcji łatwiej będzie zrozumieć, jeżeli odwołamy się do prostej ilustracji. Niech A - {ah a2, a3}, B = {bx, b2, b3), n = 2, W = 3 x 3 x 2 = 18. Mamy zatem dziewięć grup porównawczych, którym odpowiadają następujące kombinacje wartości zmien- nych A i B: ai&i, a\b2, a\b3, a2b\, a2b2, a2b3, a3bx, a3b2, a3b3. Tabela 13.19 zawiera wektor Y (kolumna 2.), wektory instrumentalne: 1,2 (kolumny 3.,4.), wektory instrumentalne: 3,4 (kolumny 5.,6.), a także wektory instrumentalne odpowiadające interakcji zmiennych A i B: wektory 5, 6, 7, 8 (kolumny 7., 8., 9., 10.). Objaśnijmy teraz, w jaki sposób utworzyliśmy wektory 1,2 (zmienna A), 3,4 (zmienna B). Obowiązuje tu ta sama zasada, co przy kodowaniu jednej zmiennej jakościowej. Wektor 1 powstaje w ten sposób, że osobom z grupy, której przypo- rządkowano wartość ax przypisujemy współczynnik 1. Grupę tę kontrastujemy z grupą o wartości a2 zmiennej A i przypisujemy jej współczynnik -1, a trzeciej grupie, o wartości a3 zmiennej A, przypisujemy współczynnik 0. Jeżeli teraz dodamy do siebie współczynniki, to powinniśmy otrzymać zero. I taką też sumę otrzy- maliśmy. Wektor 2 powstaje jako efekt łącznego skontrastowania grup o warto- ściach zmiennej A: ah a2 z grupą o wartości a3 zmiennej A. Zatem osobom z dwóch pierwszych grup przypisujemy współczynniki 1, a trzeciej grupie (a3) przypisujemy współczynniki -1, gdyż obowiązuje nas warunek: suma współczyn- ników musi równać się zero (tu suma jedynek i minus jedynek równa się zero). Ponieważ zmienna A ma tylko trzy wartości, więc suma potrzebnych wektorów wynosi: 3-1=2. Z kolei zmienna B też jest trójwartościowa, a więc musimy również utworzyć dwa wektory instrumentalne: wektor 3 i 4 (bo 3-1=2). Wektor 3 tworzymy w ten sposób, że kontrastujemy grupę o wartości bt zmiennej B z grupą o wartości b2 zmiennej B. Zatem osobom z grupy Bx przypisujemy współczynniki 1, a osobom z grupy b2 - współczynniki -1. Osobom z grupy b3 przypisujemy współczynniki 0. Wektor 4 tworzymy podobnie, jak wektor 2, tzn. kontrastujemy łącznie grupy bx i b2 z grupą b3. Przypisujemy zatem osobom z grup bx i b2 współczynniki 1, a osobom z grupy b3 - współczynniki 2 (suma współczynników musi równać się zero!). Teraz możemy przejść do wektorów reprezentujących in- terakcję AB. Postępujemy tu analogicznie, jak w przypadku zmiennych ilościowych (por. pkt. 2.2), tzn. mnożymy wartości wektorów odnoszących się do czynnika A i wektorów odnoszących się do czynnika B według kolejności: wektor 1 x wektor 3, wektor 1 x wektor 4, wektor 2 x wektor 3, wektor 2 x wektor 4. Dane zawarte w tabeli 13.19 można opracować bądź za pomocą analizy wa- riancji w układzie czynnikowym (model efektów stałych — I): ANOVA-33 (n = 2) I, bądź za pomocą modelu MR (odmiana nieaddytywna — równanie (13.39)). W rów- naniu tym musimy uwzględnić 8 predyktorow (wektory: 1, 2, 3, 4, 5, 6, 7, 8): Y'= Y6T6 bnT2 + bnT3 + bY4T4 + bY5T5 + bY6T a. (13.123) talne; Mając opanowane zasady kodowania zero-jedynkowego i quasi-eksperymen-:go jednej zmiennej jakościowej, Czytelnik z łatwością — wzorując się na tabeli 13.19 — przeprowadzi kodowanie większej liczby zmiennych jakościowych (i ich interakcji). Tabele 13.20 i 13.21 służyć mają jako pomoc. 397 Tabel a 13.20. Kodowanie zero-jedynkowe dwóch zmiennych jakościowych: A i ? i ich interakcji (0) (1) (2) (3) (4) (5) (6) (7) (8) (9) (10) Lp. Grupy Zmienna zależna Y Zmienna A Zmienna B Interakcja AB 1 2 3 4 5 1x3 6 1x4 7 2x3 8 2x4 1 a,bi *ii 1 0 1 0 1 0 0 0 2 °\b2 1 0 0 1 0 1 0 0 3 IV, 1 0 0 0 0 0 0 0 4 a?b, r*i 0 1 1 0 0 0 1 0 5 a?b-> &? 0 1 0 1 0 0 0 1 6 aibi Y23 0 1 0 0 0 0 0 0 7 mb\ Yn. 0 0 1 0 0 0 0 0 8 O3b2 Yi2. 0 0 0 1 0 0 0 0 9 aibi Y33. 0 0 0 0 0 0 0 0 N=3x3xn, p = 3, q = 3 Tabela 13.21. Kodowanie ąuasi-eksperymentalne dwóch zmiennych jakościowych: A i B i ich inter- akcji (0) (1) (2) (3) (4) (5) (6) (7) (8) (9) (10) Lp. Grupy Zmienna zależna Y Zmienna A Zmienna B Interakcja AB 1 2 3 4 5 1x3 6 1x4 7 2x3 8 2x4 1 a\b\ Yu. 1 0 1 0 1 0 0 0 2 a\bi Yn. 1 0 0 1 0 1 0 0 3 a\bi Yn. 1 0 -1 -1 -1 -1 0 0 4 O2bl Yu. 0 1 0 0 0 1 0 5 aiłn Y22. 0 0 1 0 0 0 1 6 aibi Y23. 0 -1 _J 0 0 -1 -1 7 a-ib\ Yu. -1 1 0 -1 0 -1 0 8 aiin Yn. -1 - 0 1 0 -1 0 -1 9 aibi Yn. -1 -1 -1 -1 1 1 1 1 N=3x3x n, p = 3, q = 3 3.3.1. Analiza przykła du z wykorz ystanie m kodow ania ortogon alnego Przean alizuje my teraz przykł ad z wykor zystan iem kodow ania ortogo nalneg o jako — moim zdanie m — bardzo przyda tnego (zwłas zcza dla użytko wnikó w kalkul ato- rów) w prakty ce oblicz eniow ej i proste go w zastos owani u. Pr zykład 5. Badacz a interes uje związe k pozio mu osiągni ęć szkoln ych ucznió w pierws zej klasy szkoły podsta wowej z takimi czynni kami, jak: stosow ana przez nauczy ciela metoda naucza nia (czynni k A) oraz doświa dczeni e dydakt yczne nauczy ciela (czynn ik B). Badac z chciałb y też uzyska ć odpow iedź na pytani e, czy nie jest tak, że najkorz ystniej szy (jeśli chodzi o wielko ść warian cji wyjaśn ionej zmienn ej y) jest pewie n układ wartoś ci czynni ka A i czynni ka B, tzn. najwy ższy przeci ętny pozio m osiągni ęć szkoln ych możli wy będzie do otrzym ania wówcz as, gdy czynni k A będzie przyjm ował wyróżn ioną wartość \ 20 -1 1 i -1 1 11 16 -1 1 i -1 1 12 21 -1 i -1 1 13 18 -1 -l 1 -1 14 aiłn 14 -1 -i 1 -1 15 10 -1 1 -1 16 15 -1 1 -1 17 14 0 -2 0 -2 18 aib\ 12 0 -2 0 -2 19 10 0 -2 0 -2 20 11 0 -2 0 -2 21 20 0 -2 -i 0 2 22 aytn 18 0 -2 -i 0 2 23 16 0 -2 -i 0 2 24 17 0 -2 -i 0 2 Suma 408,0000 0,0 0.0 0,0 0,0 0,0 Średni a 17,0000 0,0 0,0 0,0 0,0 0,0 4,2324 0,8340 1,1795 1,0215 0,8340 1,1795 Ty* 0,1724 0,3840 0,2614 0,0246 0,6969 Jt 0,0297 0,1475 0,0683 0,0006 0,4857 399 Z tabeli 13.22 najważniejszy jest dla nas wiersz: Ąw. Zawiera on warte kolejnych współczynników determinacji. Jak wiemy (wzór (13.110)): W gdy zmienne są ortogonal ne, tj. r,y = O (i>j). w=l Ten warunek, dzięki zabiegowi kodowania ortogonalnego spełniają wsz wektory instrumentalne (1 - 5) podane w kolumnach (3) - (7) tabeli 13.22. A zatemf| Ry 12345 = 0,0297 + 0,1475 + 0,0683 + 0,0006 + 0,4857 = 0,7318. Wyrażając wartość R\ 12345 procentowo, otrzymujemy procent wariancji| zmiennej Y wyjaśnionej przez liniową kombinację wszystkich wektorów: ?l'1' Ry 12345 x 100% = 85,55%. **»> ws^ato^ ~ * Ł ftiMttftS Z kolei wariancja resztowa wynosi: 1 (1 - Ry 12345) x 100% = 26,82% = var(ł1reszta). Dodając do siebie wartości współczynników Ą\ i Ą2 oraz Ą4 i Ą5 otrzymujemy po przemnożeniu przez 100% — procentowe wielkości wariancji składowych wyjaśnionych przez czynnik A i interakcję AB: r^ + Ą2 = 0,0297 + 0,1475 = 0,1772, 44 + trs = 0,0006 + 0,4857 = 0,4863, (4i + ryi) x 100% = 17,72% = var(Y\A ), (4ł + rfe) x 100% = 48,63% = var(Y\B ). Współczynnik r^ x 100% = 0,0683 x 100% = 6,83% = vaĄY\B). Przeprowadzone wyżej rozbicie wariancji całkowitej Y na poszczególne wariancji składowe — w postaci skondensowanej — przedstawione jest w tabeli 13.23. W kolumnie (3) tabeli 13.23 podano liczbę stopni swobody obliczoną według reguł: df dla RY12345 równe jest m, czyli ogólnej liczbie wektorów (m = 5); df dla A i równe jest p-l, czyli liczbie wektorów odnoszących się do czynnika A (p-l) = \ = 3-1 = 2); df dla B równe jest q-\, czyli liczbie wektorów odnoszących się doj czynnika B (q - 1 = 2 - 1 = 1); df dla reszty równe jest pq(n - 1), tu 3 x 2(4 - 1) =| = 18; df dla całkowitej wariancji Y równe jest pqn - 1, tu 3x2x4-1 = 23. Kolumna (4) tabeli 13.23 zawiera wartości ilorazów powstałych przez podzie- lenie wielkości proporcji wariancji Y wyjaśnionej danym źródłem zmienności (tu A, B, AB, reszta) przez odpowiadającą mu liczbę stopni swobody (tu dfA, dfB, dfAB, "Jreszta)- Wreszcie, kolumna (5) tabeli 13.23 zawiera wartości statystyki F otrzymane .... , . .. , proporcja dla regresji, A, B, AB przez wartość przez podzielenie wartości ilorazów: —r,. J 400 *p<0,05, FoK, 1; 18 = 4,41, ^0,05; 2; 18 = 3,55, ^0,05; 5; 18 = 2,77, Tabel a 13.23. Analiza wariancji dla regresji względem A, B i interakcji AB do danych z przykładu 5. (tab. 13 .22) (0) (1) (2) (3) (4) (5) Lp. Źródło wariancji Y Proporcja wariancji Y wyjaśnionej przez dane df df F źródło aJ 1 Regresja (R1) 0,7318 5 0,1464 9,825** 2 czynnik A 0,1772 2 0,0886 5,946* 3 wektor 1 (Drf,) 0,0297 1 4 wektor 2 (/^) 0,1475 1 5 czynnik B 0,0683 1 0,0683 4,583* 6 wektor 3 (/?,) 0,0683 1 7 interakcja Ali 0,4863 2 0,2431 16,315* 8 wektor 4 (rj4) 0,0006 1 9 wektor 5 (ry5) 0,4857 1 10 reszta (1-/J2) 0,2682 18 0,0149 11 cała 1,0000 23 **/7<0,01, ^0,01 1; 18 =8,29, ^0,01; 2; 18 = 6,01, ^0,01; 5; 18 = 4,25. ilorazu: ProP°rcJa dla reszty (czyli dzielimy wiersze tabeli 13.23: 1:10, 2:10, 5:10, 7:10). Podana w kolumnie (5) w wierszu 1. wartość statystyki F informuje nas 0 istotności związku zmiennej Y z liniową kombinacją A, B, AB. Pod tabelą podane zostały wartości krytyczne statystyki F dla dwóch poziomów istotności er tj. a= 0,05 1 1)1 dla danych z przykładu 5. (0) (1) (2) (3) (4) Źródło wariancji Y SS df MS F A B AB Reszta 73,0000 28,1667 200,3333 110,5000 2 1 2 18 36,5000 28,1667 100,1666 6,1389 5,946** 4,588* 16,317** | Cała 412,0000 23 *p<0,05, **p<0,01, ^0.05; i; 18 = 4,41, Fmuu* 8,29 ^0,05; 2; 18 = 3.55, F001; 2; 18 = 6,01, (Uwaga: różnice między wartościami statystyki F, na trzecim miejscu po przecinku, powstały na skutek „zaokrąglania" obliczeń.) Gdyby Czytelnik zechciał zapisać równanie regresji, to powinien przekształcić wartości fi na cząstkowe współczynniki regresji bYw, pamiętając o tym, że w przy- padku kodowania ortogonalnego mamy rYw=fiYw (wartości rYw zawiera tabela 13.22) i że bYw-fiYw(sy/swy, wartości sw też zawiera tabela 13.22. Współczynnik a, to tyle co 7... Jeszcze raz chciałbym przypomnieć, iż pojedyncza zmienna instrumentalna, np. T5, nie ma żadnego odniesienia do rzeczywistości. Także równanie regresji badacz może interpretować jedynie w kategoriach informacji pomocniczych, jakie niosą po- szczególne współczynniki bYw czy fi, a nie w kategoriach rzeczywistych (literalnych) powiązań miedzy zmiennymi, którym one zostały przypisane, a zmienną zależną Y. Dlatego też niecelowe jest wypisywanie całego równania regresji (niekiedy obejmują cego kilkadziesiąt zmiennych instrumentalnych) w przypadku rozwiązywania — za pomocą kodowania ortogonalnego w wersji ułatwiającej przeprowadzanie obliczeń (a taka tu została zaprezentowana) — problemu zwanego w modelu ANOVA układem czynnikowym (tu dwuczynnikowym) lub m-way classification (tu m = 2). 3.3.2 Analiza przykładu z wykorzystaniem kodowania quasi-eksperymentalnego Prezentowany w niniejszym punkcie sposób kodowania dwóch zmiennych jakościo- wych, w celu wprowadzenia ich (a także ich interakcji) do równania regresji linio- wej, nie prowadzi tak prostą i stosunkowo łatwą (w sensie operacji obliczeniowych drogą do informacji o wartościach liczbowych współczynników regresji, współ- czynnika korelacji wielokrotnej i statystyki testowej testu F, jak to było w przy- padku omówionego w poprzednim punkcie kodowania ortogonalnego. Zalecam te- 402 dy kodowanie quasi-eksperymentalne przede wszystkim w tych przypadkach, w których można skorzystać z pomocy komputera osobistego. Sam sposób kodowania quasi-eksperymentalnego omówiony już został w pkt. 3.2.2, a tabela 13.21 zawiera współczynniki przypisywane poszczególnym grupom porównawczym (o liczebności n) w kolejnych wektorach instrumentalnych Tu ..., r8, za pomocą których można opracować w modelu MR układ dwuczynnikowy: 3x3; można go też opracować za pomocą modelu analizy wariancji jako układ: ANOVA-33(n > 1)1. I tak, wektory 1 i 2 reprezentują czynnik A = {ah a2, a3}, wektory 3 i 4 reprezentują czynnik B= {bu b2, bj}, a wektory 5, 6, 7, 8 reprezen- tują interakcję czynników A i B. Przykład 6. Przeanalizujemy jeszcze raz te same dane, co w przykładzie 5. Zatem wektor Y w tabeli 13.25 (kolumna 2.) będzie powtórzeniem tego samego wektora z tabeli 13.22. Tabela 13.25. Zakodowane dane (kodowanie cjuasi-eksperymentalne) do przykładu 6. (0) (1) (2) (3) (4) (5) (6) (7) Lp. Grupy Zmienna zależna 7 Zmienrma A Zmienna B Interakcja AB 1 2 3 4 1x3 5 2x3 1 2 3 4 a\b\ 25 22 19 23 I 1 1 1 o o o o 1 1 1 1 1 1 1 1 o o o o 5 6 7 8 a\bi 18 16 14 15 1 1 1 o o o o 7 7 7 7 7 7 7 7 o o o o 9 10 11 12 aib\ 24 20 16 21 o o o o o o o o 1 1 1 1 13 14 15 16 a\bi 18 14 10 15 o o o o 1 i i i i o o o o 7 7 7 7 17 18 19 20 mb] 14 12 10 11 1 1 1 1 7 7 7 7 -1 - 1 -1 21 22 23 24 - 20 18 16 17 1 1 1 1 -1 - 1 -1 -1 i i i i 1 1 1 1 Suma 408,0000 0,0 0,0 0,0 0,0 0,0 Średnia 17,0000 0,0 0,0 0,0 0,0 0,0 s 4,2324 0,83406 0,83406 1,02151 0,83406 0,83406 0,41876 0,24633 0,26147 0,61583 0,59120 j. 0,17536 0,06068 0,06837 0,37925 0,34952 2, «=4, m=5 26* 403 JiJs; Współczynniki regresji są następujące: bn = 2,00000, bY4 = 2,16667, a = 17,00 000, ft„= 1,083 33, = 0, 7 3 1 7 9, bn = 0,25000, 6H= 1,91667. = 0,85545. Tabela 13.26 zawiera wyniki analizy wariancji z uwzględnieniem dwóch pod- stawowych źródeł wariancji Y: zmiennych pozostających w związku liniowym zmienną Y (regresja) i zmiennych poza regresją (reszta). Tabela 13.26. Analiza wariancji dla regresji Y względem A, B i AB dla danych z przykładu 6. (tab. 13.25) (0) (1) (2) (3) (4) Źródło wariancji Y SS df MS F Regresja (R2) Reszta (l-R2) 301,50000 110,50000 5 18 60,30000 6,13889 9,823** Cała 412,00000 23 * p<0,05, ^0,05; 5; 18 = 2,77, * * / 7 < 0 , 0 1 , ^ 0 , 0 1 ; 5 1 8 = 4 , 2 5 . ? Czytelnik zechce wrócić do tabeli 13.23 (wiersz 1.), aby przekonać się, że otrzymaliśmy tam — inną drogą — tę samą wartość statystyki testowej F. Wartość F mówi nam jedynie, że zarejestrowany związek Y z liniową kombinacją wektorów 1, 2, 3, 4, 5, reprezentujących czynniki A i B oraz ich interakcję AB, jest istotny statystycznie na danym poziomie a. Na tej jednak informacji nie możemy poprze- stać. Chcemy wszak dowiedzieć się, czy istotny jest związek Y z A, Y z B\Y z AB, a także, jak wielki jest procent wariancji zmiennej Y wyjaśnionej przez po- szczególne źródła zmienności. Musimy tedy dojść do takiej samej tabeli, jak tabela 13.23. Jednak w przypadku kodowania quasi-eksperymentalnego nie jest to tak proste, jak w przypadku kodowania ortogonalnego. Aby otrzymać informacje o procencie wariancji zmiennej Y wyjaśnionej przez poszczególne wektory instrumentalne T\, ..., T5, musimy wyjść od następującego wzoru na /?y.i23.... który ujmuje wartość R2 jako sumę współczynników6: (a) deter- minacji 4i oraz (b) determinacji semicząstkowej pozostałych wektorów 4l + 4(2.1) + 4(3.12) + •••+ rY(mA23...m-\y $.123... = Ą\ + 4(2.1) + 4(3.12) +??•+ rr(m.l23...m-l)- (13.124) Drugi sposób obliczania wartości współczynnika determinacji semicząstkowej sprowadza się do porównania dwóch współczynników determinacji wielokrotnej — Czytelnik zechce zwrócić uwagę na fakt, iż wektory instrumentalne są w przypadku kodowa- nia quasi-eksperymentalnego skorelowane w stopniu r = 0,50. Chcąc tedy poznać „czysty" wpływ zmiennej A (lub B) na Y, nie możemy odwołać się, jak w przypadku kodowania ortogonalnego (r,=0, i>j), do porównania wielkości dwóch współczynników determinacji: r2^ i r2^. Musimy tu oprzeć się na współczynnikach determinacji semicząstkowej — r*Y oraz drugiego, obliczonego dla m-\ wektorów (a więc nie obej- mującego /-tego wektora), tj. Rr.i2...(i)..m- — ffT T.l2-.Lilt ~ gdzie (/)- wektor wykluczony ze zbioru m wektorów stanowiących łączne źródło (w sensie liniowej kombinacji) wariancji Y. Przystępując do obliczania proporcji wariancji zmiennej Y wyjaśnionej przez kolejne wektory instrumentalne — według pierwszego sposobu — musimy zwrócić uwagę na jedną ważną właściwość kodowania quasi-eksperymentalnego. Otóż we- ktory reprezentujące ten sam czynnik (tu A i B) oraz interakcję (tu AB) nie są ortogonalne (są skorelowane w stopniu r = 0,50). Natomiast wektory reprezentujące różne czynniki (np. jeden reprezentujący czynnik A i drugi reprezentujący czynnik B) nie są skorelowane (są ortogonalne!). Odwołując się do naszego przykładu otrzymujemy: ri2 = r45 = 0,50, ^13 ? r23 = r14 = r15 = r24 = r25=r34 = r35 = 0,00. Przejdźmy teraz do obliczenia proporcji wariancji zmiennej Y wyjaśnionej przez kolejne wektory i czynniki. Krok a: (13.125) (13.126) I (ł1ktl) Ą o17536 var(ł1wektorl) = Ąx f o,17536, _ 0,24633 - (0,41876)(0,50000) _ - -.„. " vi -(o5oooo)* -°'04267' vaKtfwektor 2) ? (0,04267)2 = 0,00182. Wektory 1 i 2 składają się na czynnik A. Zatem proporcja wariancji zmiennej Y wyjaśnionej przez czynnik A jest sumą proporcji wariancji Y wyjaśnionej przez wektory 1 i 2, tj.: vaĄY\A) = R2YA2 = 4i + 4(2.1) = 0,17536 + 0,00182 = 0,17718 (13.127) (por. kolumna (2), wiersz 2., tab. 13.23 — kodowanie ortogonalne danych z ana- lizowanego przykładu). Krok b: var(yiwektor 3) = Ą? = 0,06837 (13.128) Ponieważ wektor 3 jest jedynym wektorem reprezentującym czynnik B, więc: variY\B) = ĄT, = 0,06837 (13.129) (por. kolumna (2), wiersz 5., tab. 13.23 — kodowanie ortogonalne danych z ana- lizowanego przykładu). 405 rI-(5.4) Krok c: var(Mwektor 4) = Ą4 = 0,37925, var(ł1wektor 5) — por. wzór (13.126), rys- rY4rĄ5 _ 0,59120 - (0,61583)(0,50000) = Vl- (0,50000)2 4(5.4) = (0,32711)2 = 0,10700. (13.13 (13.131 Wektory 4 i 5 składają się na interakcję AB. Zatem proporcja wariancji zmien- nej Y wyjaśnionej przez interakcję AB jest sumą proporcji wariancji zmiennej Y wyjaśnionej przez wektory 4 i 5, tj.: var(Y\AB) = R\A5 = Ą4 + Ą(SA) = 0,37925 + 0,10700 = 0,48625 (13.132) (por. kolumna (2), wiersz 7., tab. 13.23 — kodowanie ortogonalne danych z ana- lizowanego przykładu). Krok d: = 1 - * 1 - 0,73179 = 0,26821 (13.133) (por. kolumna (2), wiersz 10., tab. 13.23 — kodowanie ortogonalne danych z lizowanego przykładu). Postępując dalej analogicznie jak w przypadku kodowania ortogonalnego, tj. wykonując operacje z kolumn: (3) - (5) tabeli 13.23, otrzymamy identyczne rezul- taty, jeśli chodzi o testowanie istotności poszczególnych czynników (A i B) oraz ich interakcji (AB), jak te, które zawiera tabela 13.23. Nie będę tedy przepisywał tych samych danych. Znając proporcje wariancji zmiennej Y wyjaśnionej przez poszczególne wekto- ry instrumentalne, można obliczyć sumę kwadratów regresji dla każdego wektora instrumentalnego, a w konsekwencji i dla każdego czynnika i interakcji czynników. Mnożąc każdą proporcję wariancji wyjaśnionej zmiennej Y przez całkowitą sumę kwadratów (SS^a), otrzymamy sumę kwadratów regresji dla każdego wekto- ra. Przypominam, że 88,^ = 412,00. Zatem: SS x var(ł1wektor 1) = (412)(0,17536) = 72,24832, SSregr.(1) = S SSregr(2) = SScała x var(ł1wektor 2) = (412)(0,00182) = 0,74984, SSregr(A) = SSregr.(1) + SSregr.(2) = 72,24832 + 0,74984 = 72,99816, x var(ł1wektor 3) = (412)(0,06837) = 28,16844, regr(3) = 28,16844, SS regr(3) = SSregr.(B) = SS SSregr(4) = SScała x yaKiiwektor 4) = (412)(0,37925) m 156,25100, SSregr(5) = SScalax vaKHwektor 5) - (412)(0,10700) = 44,08400, (13.134)1 (13.135)1 (13.136); (13.131 (13.138) (13.139) (13.140) SSregr.^) = SSregr(4) + SSrcgr(5) = 156,25100 + 44,08400 = 200,33500, (13.141) SSr x vaK^res zta) = (412)(0, 26821) = 110,502 52. (13.142) 406 Dzieląc poszczególne sumy kwadratów (SSregr(i4), SSregr(B), SS^^j, SSreszta) przez odpowiadające im liczby stopni swobody (obliczone tak samo, jak w tab. 13.23), otrzymujemy średnie kwadraty. Dzieląc średnie kwadraty dla A, B, AB przez MSreszta, otrzymujemy wartości statystyk testu F. Są one takie same jak te, które zawiera tabela 13.23. Zatrzymajmy się jeszcze krótko przy drugim sposobie obliczania współczyn- ników determinacji jako mierników proporcji wariancji zmiennej Y wyjaśnionej przez poszczególne wektory instrumentalne (a w konsekwencji i przez czynniki A, B oraz ich interakcję AB). Wykorzystany wyżej program komputerowy na re- gresję MULTIPLE REGRESSION, pochodzący z biblioteki SSP nie jest w tym przypadku przydatny, gdyż wykazuje on tylko jedną wartość współczynnika de- terminacji wielokrotnej, a mianowicie wartość /?Y. 12345* tj. dla wszystkich predy- ktorów łącznie. Stosując jednak jakiś program na „regresję krokową", np. STEP-- WISE MULTIPLE REGRESSION z tej samej biblioteki SSP, otrzymujemy, po wykonaniu każdego kroku — polegającego na dodaniu nowego predyktora (tu wektora instrumentalnego Tw) do zbioru predyktorów już ujętych w modelu — wartość współczynnika /?KI23..- Kolejne kroki w odniesieniu do naszego przykładu wyglądają następująco: CF.1234> krok 1.: krok 2.: krok 3.: krok 4.: krok 5.: wektor 1 — ^ Ryu wektor 1 + wektor 2 —^ ^y.i2> wektory 1, 2 + wektor 3 —^ ^?y.i23» wektor y 1, 2, 3 + wektor 4 — ^ wektory 1, 2, 3, 4 + wektor 5 — > Odejmując wartość Ry.i23...w+i uzyskaną w kroku w+\ od wartości Ry,i23...w uzyskanej w kroku w, otrzymujemy wartość proporcji wariancji zmiennej Y wyjaś- nionej przez wektor instrumentalny wprowadzony do równania regresji liniowej w kroku w + 1. Równa jest ona oczywiście wartości współczynnika determinacji se- micząstkowej dla wektora wprowadzonego w kroku w+ 1, wskazującego „czystą" wariancję wspólną zmiennej Y i wektora wprowadzonego w kroku w+ 1, „uwol- nioną" od wpływów na Y tych predyktorów instrumentalnych, które były wprowa- dzone do równania regresji w kroku poprzednim: (w). Odwołując się do naszego przykładu spróbujmy porównać krok 1. i krok 2.: — w kroku 1. wprowadziliśmy wektor Ąx =0,17536 (por. tab. 13.25), — w kroku 2. wprowadziliśmy wektor /?y12 = 0,17718. Wykonując odejmo wanie mamy: Ry.n -ry\ = 0,17718 - 0,17536 = 0,00182= 407 Najlepiej dane z takiej analizy porównawczej przedstawić w tabeli sumarycznej, wzorowanej na tabeli 13.27. Tabela 13.27. Analiza porównawcza wartości współczynników determinacji w kolejnych krokach wprowadzania zmiennych instrumentalnych do równania regresji liniowej — do przykładu 6. (0) (1) (2) (3) Lp. Wektory uwzględnione w kolejnym kroku KY.i2... Różnica Kr.n...w+i ~Kr.n...w Krok 1. 4. 4,-0 Krok 2. : l + 2 Ry.i ~ 4.12 Krok 3. 1, 2 + 3 "Vi 23 ^KI23 ~ "Vl2 Krok 4. : 1, 2, 3, + 4 tA Af.l234 Ol 02 AKI234 — "K123 Krok 5. : 1. 2, 3, 4, + 5 "V 12345 ^K12345 - ""r.1234 Ry. 12345 - 4i + (Ry.12 " 4i) + (Ry123 - Rrn) + (Ry.12n~Ry.123) + ("Y.12345 - ^ r.1234) -= 4l + 4(2.1) + 4(3.12) + 4(4.123) + ^(5.1234) Proporcja wariancji zmiennej Y wyjaśnionej przez czynnik a (wektory: 1 + 2) równa jest Ry.ii- Proporcja analogicznej wariancji wyjaśnionej przez czynnik B (wektor 3) równa jest Ą^ (gdyż tylko jeden wektor reprezentuje czynnik B\). Z kolei proporcja wariancji zmiennej Y wyjaśnionej przez czynniki A i B pozostające w interakcji (wektory: 4 + 5) równa jest RYAS. Takie „dzielenie" wariancji zmiennej Y usprawiedliwione jest wyżej podaną właściwością kodowania quasi-eksperymen- talnego mówiącą, iż wektory reprezentujące poszczególne czynniki i ich interakcje są wzajemnie ortogonalne, czyli wektory należące do zestawów reprezentujących różne czynniki i interakcje nie są skorelowane, a wektory należące do tego samego zestawu reprezentującego ten sam czynnik są skorelowane w stopniu r = 0,50. Poszczególne współczynniki determinacji wielokrotnej możemy testować w dwojaki sposób. Bądź tak, jak pokazano w tabeli 13.23 (wiersze: 2., 5., 7., 10.), bądź też odwołując się do tzw. częściowego testu Fj, za pomocą którego ocenia się istotność zabiegu rozszerzania modelu regresji liniowej o nowe predyktory: (13.143) J~ ^/licznik = Wi- W2, ^mianownik = N - W{ - 1, w, — licz ba wek toró w dla wsp ółcz ynni ka Ryn 3 ° wię ksze j wart ości , r>h IH w2 — licz ba wek toró w dla wsp ółcz ynni ka Rym ° nini ejsz ej wart ości .' *' Chc ąc dla przy kład u testo wać istot ność czyn nika A, mus imy obli czyć : (13.144) K Y \ 2 M 5 ~ ( = 3, 408 liczeni * i: (13. 145) (0,73179 - (0,06837 + 0,48625)): (5 - 3) > (1 - 0,73179): (24 - 5 - 1) >y ^ Dla oceny istotności czynnika B musimy dokonać obliczenia: w, =5, w2 = 4. Dla oceny istotności interakcji AB musimy dokonać obliczenia: (13.146) = 5, Czytelnik może — tytułem przykładu — obliczyć wartości statystyki F dla czynnika B i interakcji AB. Będą one takie same (z dokładnością do błędu wy- nikającego z zaokrąglania obliczeń po przecinku) jak te, które zawiera tabela 13.23. Przejdźmy teraz do omówienia reguł interpretacji równania regresji w przy- padku wprowadzenia do niego obok czynników, także ich interakcji. W punkcie 3.2.2 przedstawiona została interpretacja równania regresji w przypadku wprowadze- nia do niego jednej zmiennej jakościowej (w postaci m wektorów instrumentalnych). Przeprowadziliśmy wówczas analogię z interpretacją modelu liniowego jednozmien- nowej analizy wariancji (model efektów stałych): ANOVA-KRG-/?(n > 1)1. W przy- kładzie aktualnie rozważanym nasuwa się analogia z modelem liniowym dwuczyn- nikowej analizy wariancji (model efektów stałych): ANOVA-KRG-pq(n > 1)1. Struktura wyniku ?-tej osoby badanej należącej do (/-tej grupy porównawczej przedstawia się następująco (Brzeziński, Stachowski, 1984, s. 191): Yijk=/i + or, jij + em, (13.147) gdzie: Yijk — wynik fc-tej osoby badanej (k= 1,..., ri) pochodzącej z (/-tej grupy porównawczej (i=l,...,p, j=\,...,q); fi — średni wynik zmiennej zależnej w populacji; er, — efekt oddziaływania na zmienną zależną Y poziomu / czynnika A: a, = 0; A — efekt oddziaływania na zmienną zależną Y poziomu j czynnika B: = 0: ajij — efekt interakcji /-tego i ./'-tego poziomu czynników A i B: Z, Z< a ek(if) — błąd eksperymentalny, którego rozkład w populacji jest nor- malny, ze średnią 0 i odchyleniem standardowym ae. W tabeli 13.28 podano — dla ułatwienia — zestawienie średnich i efektów w układzie dwuczynnikowym AxB. Oszacowaniem parametrów modelu 13.147 są: 409 Tabela 13.28. Średnie „kratkowe", „wierszowe " i „kolumnow e" oraz efekty główne czynników A i B w układzie dwuczynnik owym 3x2 A/B b2 y,. y.i.-y... ai Fu. F,2. F,.. y.i.-y... °i F21. F22. F2.. F.2.-F.. F31. F32. F3.. y^.-y... F,. F2. F r.L-y... y.i.-y.. F2.-F.. (*) M-Z ' ,(cf • + u fa - ?fŁsl fr (c)>=F,.-F, Te) ? •? = F- — F" Możemy tedy (13.147) zapisać w postaci (13.153): * • 5- (13.148) (13.149) (13.150) (13.151) (13.152) (13.153) Tak jak w przypadku pojedynczej zmiennej jakościowej wprowadzonej do rów- nania regresji liniowej za pomocą kodowania quasi-eksperymentalnego, tak i tutaj współczynniki regresji bn, bn, ... równe są efektom eksperymentalnym poszczegól- nych poziomów czynników A i B. Dokładniej, współczynniki bY\, byi, równe są odchyleniu danej średniej grupowej (F( , F2.), dla której wektor instrumentalny (we- ktor 1 i 2) przyjmuje wartość 1, od średniej ogólnej F; współczynnik bn równy jest odchyleniu średniej grupowej Yy, dla której wektor instrumentalny (wektor 3) przyj- muje wartość 1, od średniej ogólnej F . Jeśli chodzi o wielkość efektów ekspery- mentalnych /J-tego poziomu czynnika A (tu trzeciego — c^) i 22,25 15,75 19,00 2,00 a? 20,25 14,25 17,25 0,25 th 11,75 17,75 14,75 -2,25 7j 18,08333 15,91667 7 =17 F,-F.. 1,08333 -1,08333 . 410 Mamy tedy: (13.154) (13.155) (13.156) (13.157) = -A =-1,08333. (13.158) Wyznaczmy teraz wielkości efektów interakcji /-tego poziomu czynnika A iy-tego poziomu czynnika B. Stosując wzór (13.151) otrzymujemy: al=bn = 2, , = ^ = 0,25, a3 m -(?, + a2) = -(2 + 0,25) = -2,25, fii = bn = 1,08333, możemy wyznaczyć poszczególne efekty interakcyjne. Zostały one zestawione w tabeli 13.30. Na przykład afa = 22,25 - 19 - 18,08333 + 17 = 2,16666. Tabela 1330. Efekty interakcyjne: afó (i = 1, 2, 3, j= 1, 2) dla danych z przykładu 6. AIB bx b2 Suma a\ ai «3 2,16667 1,91667 - 4,08333 -2,16667 - 1,91667 4,08333 0,0 0,0 0,0 Suma 0,00001 -0,00001 Gdyby różnica między średnią grupową (Yy) i średnią ogólną (Y ) równa była sumie efektów /-tego i y-tego poziomu czynników A i 5, znaczyłoby to, że nie występuje interakcja /-tego i y-tego poziomu czynników A i B. Przeanalizowanie tabeli 13.30 upoważnia do stwierdzenia, że żaden efekt interakcyjny nie jest zero- wy. A zatem każdy wynik indywidualny musi być wyrażony w postaci sumy na- stępujących składowych: ogólnej średniej, efektów głównych A i B, efektów inter- akcyjnych i reszty (błędu). W równaniu regresji interakcja AB reprezentowana jest przez dwa wektory: 4 i 5. Wektor 4 otrzymany został przez pomnożenie wektora 1 przez wektor 3, a wektor 5 przez pomnożenie wektora 2 przez 3 (por. tab. 13.25). Wektor 1 przyj- muje wartości 1 dla grupy b\. Zatem współczynnik regresji bYĄ (związany z wek- torem 4) związany jest z grupą axb\, a dokładniej: b?4 = a, j3, m 2,16667. (13.159) Wektor 2 przyjmuje wartości 1 dla grupy a2, a wektor 3 przyjmuje wartości 1 dla grupy bx. Zatem współczynnik regresji bK (związany z wektorem 5) związany jest z grupą a2b\, a dokładniej: = 1,91667. (13.160) 411 Równanie regresji wygląda następująco: F = 2,07! + 0,25r2 + l,08333r3 + 2,16667r4 + l,91667r5 + 17. Po podstawieniu wyników każdej osoby do powyższego równania, otrzymu- jemy wyniki przewidywane (Y'). Na przykład osoba nr 5 z grupy axb2 o wyniku y12, = 18 (por. tab.24): Y' = 2,0(1) + 0,25(0) + l,O8333(- l) + 1,91667(0 ) + 17, Y'm = 15,75, y,21 = 18, Yl2l-Y'm = 18 -15,75 = 2,25. Wynik każdej osoby badanej można rozbić na następujące składowe: (a) średnią ogólną, (b) efekt Mego poziomu czynnika A, (c) efekt y-tego poziomu czynnika B, (d) efekt interakcji j-tego poziomu czynnika A i j-tego poziomu czynnika B, (e) resztę (Y - Y'). Na przykład wynik osoby nr 5 (Ym = 18) ma następujące składowe: (a) Y (b) A = 2,0 ' «• (c) = -1,08333, (d) h = -2,16667, (e) 1 - I"l21 = 2,25 Y,„ = 18,00. Analizę danych naszego przykładu można zakończyć skonstruowaniem tabeli reszt (wzorując się na tab. 13.15 — por. tab. 13.31). Wykorzystując tabelę 13.31, tabelę 13.29 (ostatnia kolumna i ostatni wiersz zawierają wielkości poszczególnych efektów czynnika A i B) i tabelę 13.30 (tabelę efektów interakcji i-tego i y-tego poziomu czynnika A i B) można przeprowadzić rozbicie każdego wyniku na jego składowe, (a) - (e) — tak }ak wyże} przeprowadzone rozbicie wyniku osoby nr 5. Poszczególne wyniki Yijk wyrażone w postaci składowych modelu liniowego zamie- szczone zostały w tabeli 13.32. Gdyby w naszym przykładzie okazało się, że istotne są tylko efekty główne czynników A i B, wtedy można by analizę statystyczną danych zakończyć na prze- prowadzeniu testu wielokrotnych porównań (test Tukeya na przykład) średnich gru- powych (dla czynnika A: F, , F2 , F3 ; dla czynnika B: FL, F2). Najistotniejsze jednak okazały się efekty interakcyjne: ccfy. To interakcja AB tłumaczy aż 48,6% wariancji zmiennej zależnej Y, gdy pozostałe czynniki wyjaśniają relatywnie mniejszy procent wariancji zmiennej Y — czynnik A tłumaczy bowiem 17,7%, a czynnik B jedynie 6,8%. Przeanalizowanie poszczególnych wierszy tabeli 13.32 pozwala nam na podkreślenie, iż spośród trzech składowych pojedynczego wyniku, tj. _^l^i—! '- | A |6r SS^+SS« SSBla,(72) 13.9. Rozbicie całkowitej sumy kwadratów na cząstkowe sumy kwadratów — dane z przykładu 6. Obliczenia, których rezultaty zostały zawarte w tabeli 13.33, wykonane zostały i podstawie danych z tabeli 13.32 (kolumny (4) i (6)). Na przykład dla kombinacji b\ mamy: 4(2 = 2,1666102 = 4(17,36114) - 69,44456. i sprawdzenia: , A\bj = SSA+ SSAB, 248,66668 + 24,66668 = 73 + 200,33328, (13.164) 273,33336 - 273,33328. 27 — Metodologia badań. 417 4.1!. ,tx i**jkl*i •am. »u- D. > \ > , Tabela 13.34. Dane pomocnicze do obliczania wartości SSAV,J — do przykładu 6. (0) (1) (2) (3) A B \ b\ b2 42,25 42,25 36 36 36 36 Suma 84,50 72 72 Obliczenia, których rezultaty zostały zawarte w tabeli 13.34, wykonane zostały na podstawie danych z tabeli 13.32 (kolumny (5) i (6)). Na przykład dla kombinacji axbx mamy: ,_,,,, „,„, K ,. 4(1,08333+ 2,16667)2 = 4(10,5625) = 42,25. Dla sprawdzenia: B\a,,= SSB + (13.165) 84,5 + 12 + 12 = 28,1664 + 200,33328, 228,5 = 228,49968. Stopnie swobody dla poszczególnych efektów prostych równe są stopniom swobody dla poszczególnych czynników — odpowiednio dla A i B. I tak dfMb = 2, dfB/a. = 1. Dzieląc sumy kwadratów przez odpowiadające im liczby stopni swobody, otrzymujemy średnie kwadraty dla efektów prostych. Średni kwadrat dla reszty (MSreszta) jest taki sam, jak w tabeli 13.26, tj. MSreszta= 110,5 : 18 = 6,13889. Wyniki analizy wariancji efektów prostych zawiera tabela 13.35. Wartości statystyki testowej testu F zamieszczono w kolumnie (4) tabeli 13.35. Informują one o tym, iż wszystkie efekty proste BAz, są istotne, chociaż — jak to pokazują profile wykreślone na rys. 13.8 b — kierunek różnic między śred- Tabela 13.35. Analiza wariancji efektów prostych A\bj i Bla, — dane z przykładu 6. (0) (1) (2) (3) (4) Źródło wariancji Y SS df MS F A\b, Alft2 B\a{ B\a3 Reszta 248,66668 24,66668 84,50000 72,00000 72,00000 110,50000 2 2 1 1 1 18 124,33334 12,33334 84,50000 72,00000 72,00000 6,13889 20,25** 2,01 13,76** 11,73** 11,73** * p<0,05 ^0,05; 1; 18 = 4,41, **p<0,01 ^0,01; 1; 18 = 8,29, ^0,05; 2; 18 - 3'55, ^0,01; 2; 18 - 6,01. 418 nimi na poziomach czynnika .A: a\ i a2 jest odmienny od kierunku różnicy między średnimi na poziomie czynnika A: a3. Tu. > F12, F2, > F22, ale: F3, > F32, (a2bx) (a2b2) (a3?,) (a3b) Natomiast w przypadku efektów prostych A\bj istotny statystycznie jest tylko efekt prosty A\bj. Kierunek różnic między średnimi (por. rys. 13.8 a) na poziomie czynnika B: b{ jest następujący: F3 Fu. F21. 31, Różnica 7U.-T2\, jest najmniejsza (2 pkt). Różnica F11.-T31. jest najwię- ksza (10,5 pkt.). Różnica Y21.-731. jest pośrednia (8,5 pkt.). Rodzi się kolejne pytanie: Które z przytoczonych trzech różnic między średnimi „kratkowymi" są istotne na danym poziomie er? Czy pierwsza, czy druga, czy też trzecia? Może wszystkie, może dwie, a może tylko jedna z nich? Aby na to pytanie — już ostatnie w analizie danych — odpowiedzieć, musimy odwołać się do jakiegoś testu wielo- krotnych porównań między średnimi „kratkowymi". Zastosujmy znany już nam test Tukeya (por. pkt 3.2.2). Do porównania mamy trzy średnie Fu., F2j, F3!: Dx = (DF„. + (-DF31. = 22,25 - 11,75 = 10,5, D2 = (l)F2i. + (-1)F31. = 20,25 - 11,75 = 8,5, D3 = (1)F„. + (-1)F21. = 22,25 - 20,25 - 2,0. Wartość statystyki g-Tukeya obliczamy ze wzoru (Kirk, 1982, s. 116): Yn.-Yn. (13.166) Q = gdzie: MSreszta = 6,13889 (z tab. 13.35); n — liczebność /-tej grupy porównawczej (tu n - 4). Krytyczną wartość statystyki Q znajdujemy w tab. D — Brzeziński, Stachow- ski, 1984, s. 416-417. Wyznaczają ją dwa parametry: (1) liczba porównywanych średnich równa: pq = 3x2 = 6 oraz (2) liczba stopni swobody równa: dfKSZtz , tj. pq(n- l)= 18. Przyjmując poziom istotności er = 0,05, otrzymamy następującą wartość krytyczną Q: Go,O5;6;18 =4,49. Uznajemy daną różnicę między dwiema średnimi za istotną na poziomie a = 0,05, jeżeli 101 2* Qa. Przeprowadźmy teraz niezbędne obliczenia: Di = 10,5, D2 — 8,5, D3 = 2,0, 419 10,5 = = 8,48, 1 |(6,13889) Q2 = 6,86, Q3 = 1,61. Decyzje dotyczące porównań: 1(3,1 > 4,49, I02I>4,49, IQ3I<4,49. Wniosek: na poziomie istotności a = 0,05 zarejestrowano istotne różnice mię- dzy średnimi Yu i Y3i oraz F2i. i f$i.. Za pomocą testu Tukeya można testować istotność różnic między średnimi brzegowymi, tj. między średnimi wartościami zmiennej zależnej w grupach o TÓiM nych wartościach czynnika A, a następnie w grupach o różnych wartościach czyn- nika B. W naszym przykładzie byłyby to porównania: (a) D3 = YL,-Y2.., D2 = F2.-F3., D^Y^-Y^, (b) D=YA-Y2.. Porównania (a) i (b) testujemy tylko wówczas, gdy główne efekty czynnika A i B są istotne i nie stwierdzono istotności efektów interakcyjnych. Konstrukcja wzoru na Q nie ulega zmianie w przypadku porównań typu (a) i (b). Odpowi wzory mają postać (Kirk, 1982, s. 364—365): ad. (a): F, -Yv Q= ,—^— df=pq(n-l), liczba średnich =p; (13.167) 1 nq : ' df=pq(n- 1), liczba średnich = q. (13.168) 7 - 7- V »-i Uznajemy daną różnicę między dwiema średnimi brzegowymi za istotną na danym poziomie a, jeżeli \Q\ ^ Qa Mimo, iż stosowaliśmy test Tukeya do porównań średnich „kratkowych" (ana- liza istotnego prostego efektu A\bh gdyż istotne okazały się efekty interakcyjne ajij — por. tab. 13.35), to jednak — tytułem ćwiczenia — przeprowadzimy obli- czenia Q dla porównań średnich brzegowych czynników A i B: — dla porównań typu (a): D, = 19 -14,75 = 4,25, D2= 17,25 - 14,75 = 2,5 ?>3= 19- 17,25= 1,75, 4,25 = 4,85, 7^(6,13889) w*™ Ftl»b 'r' "*• 2 = 2,85, Q3 = 2,0, ' v~is; ?-n^ ';< ^'f-i.p\- i Go,O5. 3, 18 = 3,61. • • ' ,°i MS reszta ad. (b): Q MSr, Qi = 420 Decyzje dotyczące porównań: ljg,l>3,61, \Q2\<3,61, \Q3\<3,61. — dla porównali typu (b): D = T\-Y.2. = 18,08333 - 15,91667 = 2,16, 2,16 Q = = 3,02, 13889) V4 • 3 (6> Qo,O5; 2; 18 - 2,97. Decyzje dotyczące porównania: 101 > 2,97. Wniosek: z poszczególnych porównań między średnimi brzegowymi: 7[ , F2., F3 istotna statystycznie okazała się tylko jedna różnica, tj. Yl - F3 . Z kolei porównanie Y\ - F2. także okazało się istotne na poziomie a = 0,05. Czytelnik zechce sam sprawdzić, że przy a =0,01 żadne porównanie w obrębie czynnika A i czynnika B nie jest istotne. Do tego samego wniosku prowadzi lustracja kolumny (4) w tab. 13.24. Wartości krytyczne Fo.oi dla efektów głównych przewyższają wartości F efektów głównych, a zatem nie można uznać tych efektów za istotne na poziomie a =0,01. Interpretacja wyników przykładu. Spróbujmy teraz podsumować otrzymane w kolejnych krokach analizy informacje o wpływie czynników: „stosowana przez nauczyciela metoda nauczania" (czynnik A: at — metoda problemowa-indywidu- alna, a2 — metoda problemowa-zespołowa, a3 — metoda nauczania programowa- nego), „doświadczenie dydaktyczne nauczyciela" (czynnik B: bx — długoletnie do- świadczenie, piętnastoletnie, b2 — krótkie doświadczenie, pięcioletnie) i ich inter- akcja na poziom osiągnięć szkolnych uczniów pierwszej klasy szkoły podstawowej (zmienna zależna Y). Ponieważ współczynnik determinacji wielokrotnej /?y. 12345 jest istotny statysty- cznie na or = 0,01 (F>FOfii — por. tab. 13.26), więc możemy powiedzieć, iż za- chodzi powiązanie zmiennej Y z liniową kombinacją czynników A i B oraz inter- akcji AB. Aż 73% wariancji zmiennej Y (osiągnięć szkolnych) wyjaśnia liniowa kombinacja: A, B, AB. Dalsza analiza pokazała, iż istotne na poziomie er =0,05 okazały się oba czynniki: A i B, a na poziomie a =0,01 — interakcja tych czyn- ników (por. tab. 13.23 lub tab. 13.24 — te same wyniki uzyskane za pomocą ANOVA). Rozbijając całkowitą wariancję zmiennej zależnej na wariancje składo- we, dowiedzieliśmy się, iż największy jej procent (bo aż 48,6) wyjaśnia interakcja stosowanej przez nauczyciela metody nauczania z jego doświadczeniem dydakty- cznym. Natomiast czynnik stosowanej metody wyjaśnia 17,5% wariancji poziomu osiągnięć szkolnych uczniów, a czynnik doświadczenia dydaktycznego nauczyciela 421 wyjaśni a zaledwi e 6,8% warianc ji Y. Pozosta łe 26,8% warianc ji Y nie zostało w tym, tylko dwuczy nnikow ym, badaniu wyjaśni one. Powinn o to zdoping ować badacza do powtórz enia badania wzboga conego o trzecią, a może i o czwartą zmienną niezależ ną, aby zminim alizowa ć owe 26,8% warianc ji resztow ej zmienne j zależnej . Poniew aż istotne są efekty interakc yjne (ajij) — i to znaczni e bardziej istotne niż efekty główne czynnik ów (a^pj) — więc nie można poprzes tać na analizie wyżej przepro wadzon ej. Można bowiem domnie mywać, iż to, jaki jest wpływ sto- sowanej przez nauczyc iela metody nauczan ia na wyniki osiągnię ć szkolny ch ucz- niów, uzależni one jest od tego, jak długim stażem pracy dydakty cznej legitym uje się nauczyc iel. Nie będziem y tedy poprzest awać na interpret acji efektów głównyc h, ale musimy przepro wadzić interpret ację efektów prostych . Mówiąc inaczej, musimy zobaczy ć, jaka jest charakte rystyka wpływu czynnik a A na zmienną zależną, raz przy wartości b\ czynnik a B, a drugi raz przy wartości b2 tego czynnik a. Podobni e mu- simy przeana lizować wpływ czynnik a B na Y. Aby ułatwić przepro wadzeni e tej analizy, na rys. 13.8 a i b wykreśl ono profile efektów prostyc h: A\bj oraz B\at. Wykreśl ono je opierają c się na tabeli 13.29. Ocena istotnoś ci poszcze gólnych efektów prostyc h (via test F) upoważ nia nas do stwierdz enia, że istotnie różne wyniki osiągnię ć szkolny ch uzyskan o w grupach uczniów nauczan ych przez nauczyc ieli o długim stażu pracy (B: b{); przy czym najkorz ystniejs zy — z punktu widzeni a zmienne j zależnej — okazał się układ wartości a\b\, tj. połącze nie metody nauczan ia problem owej- indywid ualnej z długolet nim doświad czeniem dydakty cznym nauczy- ciela, a najmnie j korzyst ny okazał się układ wartości a3bu tj. połącze nie metody nauczan ia program owaneg o z długolet nim doświad czeniem dydakty cznym. Także korzyst ny, ale nieco mniej, okazał się układ wartości a2b\, tj. połącze nie metody nauczan ia problem owo- zespoło wej z długolet nim doświad czeniem dydakty cznym. W świetle wyniku testu F efektu prostego A\b2, obserwo wane na rys. 13.8a zróżni- cowanie wewnątr zprofilo we jest pozorne. Nie można powiedz ieć, że grupy nauczan e przez nauczyc ieli o tym samym krótkim doświad czeniu dydakty cznym (B: b2) różnią się pod względe m przecięt nego poziom u osiągnię ć szkolny ch w zależno ści od sto- sowanej przez nauczyc iela metody nauczan ia (ax lub a2 lub a3). Zostań my jednak jeszcze przy interpre tacji efektu prosteg o A\bx. Co to znaczy, że grupy uczniów nauczan e trzema różnymi metoda mi przez nauczyc ieli o tym samym doświad czeniu dydakty cznym różnią się, jeśli chodzi o poziom osiągnię ć szkolny ch? Musimy od- powiedz ieć na już ostatnie pytanie: Czy istotnie różni się średni poziom osiągnię ć szkolny ch uczniów z grupy a\bx od średnieg o poziom u osiągnię ć uczniów z grupy a2bx, czy istotnie różnią się średnie grup a.\bx i &3bh czy też średnie grup a2b\ i a- ^>{l W przypad ku większe j od dwóch liczby poziom ów czynnik a A (u nas trzy) infor- macje, że efekt prosty Alfy jest istotny na danym poziomi e a są niewyst arczając e. „Istotn y" może tu bowie m znaczy ć, że „istotn e" jest jedno porówn anie, albo że „istotn e" są dwa porówn ania, albo też, że „istotn e" są wszyst kie trzy porówn ania. Przepro wadzon a, za pomocą testu wielokr otnych porówn ań między średnim i Yn, 72\.> ^3i.> analiza porówn ań wykazał a, że istotnie różnią się (zarówn o na pozio mie a = 0,05, jak i na pozio mie a =0,01) średni e „kratk owe" ^li. i *3i. oraz ^21. i ^3i- Zatem nie zarejestr owano istotnyc h różnic między średnimi 422 wynikami osiągnięć szkolnych uczniów nauczanych przez nauczycieli o krótkim doświadczeniu dydaktycznym, stosujących metodę nauczania problemowego-indy- widualnego i problemowego-zespołowego. Jednak każda z tych dwóch grup istotnie różni się od trzeciej grupy, w której nauczyciele stosowali metodę nauczania pro- gramowanego. Analiza rys. 13.8b pokazuje, iż najlepsze wyniki osiągali uczniowie nauczani przez nauczycieli o długoletnim doświadczeniu dydaktycznym stosujących metody: problemową-indywidualną i problemową-zespołową (por. profile ax i a2) — przy czym lepsze wyniki dydaktyczne osiągają nauczyciele bardziej doświadczeni (B: b\). Z kolei lepsze rezultaty dydaktyczne osiągają nauczyciele mniej doświadczeni (B: a2) w przypadku stosowania metody nauczania programowanego (por. profil a3). W przypadku nauczycieli bardziej doświadczonych stosowane przez nich me- tody nauczania można uporządkować według efektywności następująco: problemo- wa-indywidualna, problemowa-zespołowa i nauczanie programowane; przy czym ta ostatnia metoda mocno „odbiega" od dwóch pozostałych. Natomiast porządek me- tod w przypadku nauczycieli mniej doświadczonych dydaktycznie jest odmienny: nauczanie programowane, problemowe-indywidualne, problemowe-zespołowe. Zróżnicowanie efektywności stosowanych metod jest tu nieistotne (por. wyżej prze- prowadzoną analizę efektów prostych: A\b}). Bardziej dociekliwy Czytelnik może jeszcze zająć się interpretacją poszczególnych indywidualnych wyników pod kątem składowych, na które można je rozbić, tzn. względnego udziału w nich składowych odpowiadających poszczególnym efektom «„,/>,, afij i reszcie (por, tab. 13.32). 3.3.3. Interakcja miedzy zmiennymi jakościowymi a kodowanie zero-jedynkowe Pozostało nam jeszcze omówienie trzeciego systemu kodowania, kodowania zero-- jedynkowego w kontekście wprowadzania do modelu MR interakcji zmiennych jakościowych. Kodowanie zero-jedynkowe jest najbardziej uciążliwe, jeśli chodzi o kodowanie interakcji. Nie ułatwia obliczeń tak znacznie, jak kodowanie ortogo- nalne, a równanie regresji tą metodą otrzymane nie jest tak bliskie — w sensie interpretacyjnym — modelu ANOVA, jak równanie regresji otrzymane za pomocą kodowania quasi-eksperymentalnego. Najważniejszym powodem, dla którego system kodowania zero-jedynkowego p nie jest rekomendowany w przypadku analizowania układów czynnikowych, jest skorelowanie wektorów reprezentujących czynniki z wektorami reprezentującymi in- terakcję czynników (Pedhazur, 1982, s. 369). Jak pamiętamy, w przypadku kodo- wania ortogonalnego wszystkie wektory były nieskorelowane, a w przypadku kodo- wania quasi-eksperymentalnego skorelowane były tylko wektory czy to w obrębie czynnika, który reprezentowały, czy też w obrębie interakcji, którą reprezentowały. Nie występowała natomiast korelacja między wektorami reprezentującymi różne czynniki, czy wektorami reprezentującymi czynniki i interakcję. W przypadku ko- dowania zero-jedynkowego nieskorelowane są tylko wektory reprezentujące różne czynniki, ale już wektory reprezentujące jakiś czynnik i interakcję są skorelowane. O ile w przypadku kodowania ąuasi-eksperymentalnego można było napis (żeby pozostać przy naszym poprzednim przykładzie): ^K12345 = ^K 12 + ry.3 + ^K.45. (13.1( o tyle kodowanie zero-jedynkowe nie upoważnia nas do tego. Jest bowiem: Ry.12345 ^Ry 12 ~^~ tyj ~ł~Ry45, (13.170): co wynika stąd, że między wektorami 1, 2 oraz 3 i między wektorami 4, 5 zachodzi korelacja (nie występowała ona, gdy wektory były skonstruowane metodą kodowa- nia ąuasi-eksperymentalnego). Chcąc tedy obliczyć wartości współczynników determinacji, musimy postępo- wać tak, aby uwolnić się od wspomnianej interkorelacji między wektorami. I tak, wartości współczynników determinacji obliczamy jak niżej: i - (Ry 12+ rh), 1 - Ry12345' /?2 ... rrrnńi *Y 12345- czynnik A: R\.\iy czynnik B: interakcja AB: reszta: !> A, B, AB: Podobnie musimy postąpić w przypadku układu dwuczynnikowego (A: au a2, a3; B: b\, b2, b3), przedstawionego w tabeli 13.20. Czynnik A jest tam reprezen- towany przez wektory 1 i 2, czynnik B przez wektory 3 i 4, a interakcja AB reprezentowana jest przez poszczególne jej źródła; musimy postąpić jak wyżej: czynnik A: Ry.i2, czynnik B: RYM, interakcja AB: p2 (T Ky 12345678 ~ U1 reszta: 1 -Ry. 12345678 A, B, AB: ^y.12345678- Oczywiście, to co przedstawia trudność dla badacza posługującego się skromnymi środkami z zakresu techniki obliczeniowej, nie stanowi problemu dla badacza dysponu- jącego komputerem. Trzeba jedynie pamiętać o tej niedogodności związanej z kodo- waniem zero-jedynkowym. Pozostałe właściwości kodowania zero-jedynkowego są ta- kie same — w przypadku układu czynnikowego —jak opisane w pkt. 3.2.1. Nie będę tutaj jeszcze raz przeliczał tego samego przykładu, gdyż otrzymali- byśmy i tak te same wyniki. Czytelnik mógłby — tytułem ćwiczenia — sam opra- cować dane z przykładu 5. w systemie kodowania zero-jedynkowego7. Dla ułatwienia pracy podaję wartości współczynników korelacji zmiennej Y z poszczególnymi wektorami instrumentalnymi oraz wartości współczynników regresji: rn =0,34133, rra = 0,04267, r„ = 0,26147, /y4 = 0,56667, rw = O,35O8O; bn = -2,0, bn = -3,5, bn= -6,0, br4= 12,49999, bK = 11,99999; a =17,75. 424 3.4. Kodowanie interakcji wielu zmiennych jakościowych Rzecz jasna, do równania regresji liniowej można wprowadzić więcej niż dwie zmienne niezależne. Jeżeli mamy trzy zmienne (czynniki) jakościowe, to powstaje problem zakodowania interakcji: (a) trzech interakcji pierwszego rzędu AB, AC, BC i (b) jednej interakcji drugiego rzędu ABC. Rozpatrzmy przykład układu trójczyn- nikowego, w którym każdy czynnik będzie przyjmował trzy wartości: A = {ab a2, a3}, B={bh b2, b3}, C={cu c2, c3}. Układ taki można opracować za pomocą analizy wariancji jako układ: ANOVA-pqĄn > 1)1 albo w ramach modelu MR. Li- czba niezbędnych wektorów instrumentalnych, które trzeba skonstruować, aby mo- żliwe było opracowanie tego układu za pomocą regresji liniowej, równa jest sumie liczby stopni swobody dla czynników i ich możliwych interakcji albo inaczej pqr-\: liczba wektorów: (3 - 1) = 2 (3-D = 2 (3 - 1) = 2 (3-l)(3-l) = 4 (3-l)(3-l) = 4 1) = 8 -1) (3- 26 Razem źródło wariancji: df A (P-D B (q-D C (r-l) AB (p-l)(q-l) AC (p-l)(r-l) BC (q-l)(r-l) ABC (p-l)(q-l) Poszczególne interakcje kodujemy w ten sposób, że mnożymy wektory repre- zentujące jeden czynnik przez wektory reprezentujące drugi czynnik wchodzący z tym pierwszym w interakcję. Na przykład interakcja AB reprezentowana jest przez wektory: czynniki: A B AB wektory: 12 34 1x3 1x4 2x3 2x4, a interakcja ABC reprezentowana jest przez wektory: czynniki: ABC ABC wektory: 12 34 56 1x3x5 1x3x6 1x4x5 1x4x6 2x3x5 2x3x6 2x4x5 2x4x6. Zatem układ trójczynnikowy 3x3x3 reprezentowany jest przez równanie re- gresji liniowej obejmujące 26 wektorów instrumentalnych: źródło wariancji wektory A 1, 2 B 3, 4 C 5, 6 AB 7, 8, 9, 10 AC 11, 12, 13, 14 BC 15, 16, 17, 18 ABC 19, 20, 21, 22, 23, 24, 25, 26. 425 Można owe wektory instrumentalne uzyskać za pomocą jednego z przedsta- wionych w niniejszej pracy systemów kodowania. Rekomendujemy jednak tutaj w pierwszej kolejności kodowanie quasi-eksperymentalne, a w drugiej kolejności ko- dowanie ortogonalne (z uwagi na łatwość przeprowadzania obliczeń). Kończąc te krótkie uwagi o wprowadzaniu do równania regresji liniowej większej liczby inter- akcji, zachęcam Czytelnika do zakodowania, według systemu kodowania quasi-- eksperymentalnego, układu trójczynnikowego 3x3x3. 4. Ustalenie porządku istotnościowego w obrębie zmiennych niezależnych wprowadzonych do modelu MR W momencie, w którym badacz zakończył proces wprowadzania nowych zmien- nych niezależnych do modelu, ocenił ich istotność, określił charakter modelu (ad- dytywny — nieaddytywny, liniowy — krzywoliniowy) oraz ocenił jego „dobroć" (poprzez test F współczynnika RY\ t), powinien on ustalić porządek istotnościowy w obrębie zmiennych niezależnych uznanych za istotne dla Y. Tę operację empiryczną przeprowadza się na podstawie wstainikó-w istotności zmiennych. Chciałbym teraz spróbować udzielić odpowiedzi na pytanie: na podstawie jakiego wskaźnika dokonać owego uporządkowania? Najbardziej dostępną miarą istotności danej zmiennej niezależnej (także w sensie standardowych strategii budowy modelu MR via komputer) jest przyrost wariancji wyjaśnionej zmiennej zależnej „spowodowany" wprowadzeniem do mo- delu tej zmiennej. Aby dokonać oceny procentowo wyrażonego przyrostu wariancji wyjaśnionej zmiennej X, spowodowanego rozszerzeniem „wyjściowego" modelu MR (obejmującego k2 zmiennych niezależnych) o nową zmienną (tym samym modę/ będzie obejmował k2 + 1 zmiennych), musimy zacząć od wyznaczenia wartości dwóch współczynników: Ry.i, ^; RYA, k , (Jtt > k2). Jidżn/ca wartościprocentowe/ dwócfi wspo/czyn/tiArów w/e/oAro/j7ę/ dete/7/2/- ?«^ *. ^E-jfe , Jża /tor, Można owe wektory instrumentalne uzyskać za pomocą jednego z przedsta- wionych w niniejszej pracy systemów kodowania. Rekomendujemy jednak tutaj w pierwszej kolejności kodowanie quasi-eksperymentalne, a w drugiej kolejności ko dowanie ortogonalne (z uwagi na łatwość przeprowadzania obliczeń). Kończąc krótkie uwagi o wprowadzaniu do równania regresji liniowej większej liczby inter- akcji, zachęcam Czytelnika do zakodowania, według systemu kodowania qua - eksperymentalnego, układu trójczynnikowego 3x3x3. 4. Ustalenie porządku istotnościowego w obrębie zmiennych niezależnych wprowadzonych do modelu MR W momencie, w którym badacz zakończył proces wprowadzania nowych zmien- nych niezależnych do modelu, ocenił ich istotność, określił charakter modelu (ad- dytywny — nieaddytywny, liniowy — krzywoliniowy) oraz ocenił jego „dobroć" (poprzez test F współczynnika /?ju, ...,*)> powinien on ustalić porządek istotnościo- wy w obrębie zmiennych niezależnych uznanych za istotne dla Y. Tę operację empiryczną przeprowadza się na podstawie wskaźników istotności zmiennych. Chciałbym teraz spróbować udzielić odpowiedzi na pytanie: na podstawie jakiego wskaźnika dokonać owego uporządkowania? Najbardziej dostępną miarą istotności danej zmiennej niezależnej (także w sensie standardowych strategii budowy modelu MR via komputer) jest przyrost wariancji wyjaśnionej zmiennej zależnej „spowodowany" wprowadzeniem do mo- delu tej zmiennej. Aby dokonać oceny procentowo wyrażonego przyrostu wariancji wyjaśnionej zmiennej X, spowodowanego rozszerzeniem „wyjściowego" modelu MR (obejmującego k2 zmiennych niezależnych) o nową zmienną (tym samym mo- del będzie obejmował k2 + 1 zmiennych), musimy zacząć od wyznaczenia wartości dwóch współczynników: RY.I, ..., i^', RY.I*,> (&i > k2). Różnica wartości procentowej dwóch współczynników wielokrotnej determi- nacji jest wskaźnikiem „udziału" nowej zmiennej w wyjaśnianiu wariancji zmiennej zależnej Y, bowiem: (a) wskaźnik: RY.\,...,)C2 (100%) określa nam „dobroć" modelu wyjściowego o k2 zmiennych niezależnych, (b) wskaźnik /?y.i,..., ^ (100%) określa nam „dobroć" modelu rozszerzonego o nową zmienną A}, obejmującego kx zmiennych niezależnych {kx > k2), (c) różnica Ąlt t| (100%) - R2YX..., ^ (100%) = var(Y/XJ) mówi nam o przy roście wariancji wyjaśnionej zmiennej Y, spowodowanym rozszerzeniem „wyjścio wej" wersji (fc2-składnikowej) modelu do „ostatecznej" wersji modelu (/^-składni kowej). Rodzi się jednak pytanie: czy każdy przyrost wariancji wyjaśnionej zmiennej 426 K(np. 1%) można uznać za wystarczający do uzasadnienia zaliczenia tej zmiennej do 0{PY). Aby odpowiedź nie miała charakteru czysto arbitralnego, odwołujemy się do pomocy tzw. częściowego testu Ff, jest to — jak Czytelnik zapewne pamięta — już wyżej omawiany wzór (13.143). Nawiasem mówiąc, za pomocą tego testu możemy ocenić każdy zabieg rozszerzenia modelu. Ci?2 p2 \ • (h V \ T?.= ' r-iA —*2' v i *?> i n_T?l..- . \ ? (KI ^ h. _ n ' '?"(N-ki-l) (13-171) przy stopniach swobody: dla licznika: df\ = kx- k2, w przypadku rozszerzenia mo- delu o jedną zmienną niezależną df\ = \; dla mianownika: df2 = N-k{ - 1; kx — liczba zmiennych niezależnych o większej wartości R2\ k2 — liczba zmiennych niezależnych o mniejszej wartości R2. Uznajemy rozszerzenie modelu za istotne na danym a jeżeli: Fj > Fa,dfx4f2- Wyżej opisany sposób nie jest jedynym, jeśli chodzi o stosowanie współczyn- nika determinacji wielokrotnej jako wskaźnika wariancji wyjaśnionej zmiennej Y przez daną zmienną niezależną. Obliczenie „przyrostu" lub „spadku" wartości /?2(100%) jest punktem wyjścia do dokonania uporządkowania zbioru zmiennych niezależnych zaliczonych do modelu MR wedle procentowo wyrażonej wartości owego „przyrostu" (lub „spadku") wariancji wyjaśnionej zmiennej Y, spowodowa- nego bądź wprowadzeniem do modelu nowej zmiennej, bądź wycofaniem z modelu zmiennej już w nim obecnej. Generalnie rzecz biorąc Hope (1968, s. 157) pokazał, że wskaźnika i?2(100%) używa się w praktyce badawczej na 1 z 5 sposobów: (1) najpierw obliczamy wartość /?2(100%) dla Y i Xx, potem dla Y oraz Xx i X2 itp. Analiza kończy się w momencie, gdy dodanie następnej zmiennej niezależnej do modelu nie daje już pożądanego przyrostu wartości /?2(100%); (2) najpierw obliczamy wartość /?2(100%) dla Y oraz wszystkich zmiennych niezależnych: Xu ...,Xk włączonych do modelu MR, potem dla Y oraz X\, ...,Xk_u następnie dla Y oraz X\,..., Xk_2. Analiza kończy się z chwilą, gdy spadek wartości /J2(100%) przewyższy kryterium przyjęte przez badacza; (3) najpierw obliczamy wartość /?2(100%) dla Y oraz zmiennej o najwyższej wartości prostego współczynnika korelacji ze zmienną Y (R2 = r2), następnie doda jemy zmienną niezależną, która daje największy przyrost wartości /?2(100%). Ana liza kończy się, gdy przyrost wartości /?2(100%) przestaje spełniać dane kryterium; (4) obliczamy wartości R2(l00%) dla w dowolny sposób wybranych podzbio rów (być może krzyżujących się) zmiennych niezależnych i zmiennej Y, aby wybrać ten podzbiór zmiennych niezależnych, który daje najwyższą wartość /?2(100%); (5) najpierw obliczamy wartość /?2(100%) dla Y oraz zmiennych niezależnych X2, ..., Xk, potem dla Y oraz zmiennych Xi, X2, XĄ, X5,..., Xk itd. Ze zbioru zmien nych niezależnych Xi,..., Xk eliminujemy tę zmienną, której opuszczenie daje naj- większy spadek wartości /?2(100%); Ze współczynnikiem determinacji wielokrotnej wiąże się — jak to widać we 427 wzorach 13.20 i 13.25 — współczynnik determinacji semicząstkowej oraz deter- minacji cząstkowej. Pisałem już o nich wyżej. Także wedle ich wartości (zwłasz- cza wedle wartości współczynnika determinacji cząstkowej) badacz może uporząd- kować zbiór zmiennych począwszy od zmiennej, która wyjaśnia największy pro- cent wariancji Y, a kończąc na zmiennej wyjaśniającej najmniejszy procent wa- riancji Y. Darlington (1968) omawia wskaźnik fiYj rYj, wedle wysokości którego można uporządkować zbiór zmiennych włączonych do modelu MR. Czytelnik zechce za- uważyć, że wskaźnik ten jest składnikiem wzoru (13.17). Suma takich iloczynów składa się na Ry.i,...^- Trzeba jednak pamiętać, że wskaźnik ten jest rzetelny, jeżeli interkorelacje zmiennych niezależnych są zerowe. Zerowe korelacje między zmien- nymi niezależnymi występują jednak w badaniach psychologicznych bardzo rzadko, stąd i niewielka przydatność tego wskaźnika. Mamy tu podobną sytuację, jak w przypadku wskaźnika, Ąj{\00%), j- 1, ..., gdzie także musi być spełnione założe- nie: ry = 0 (i * j). Na koniec jeszcze o jednej metodzie wyznaczania porządku istotnościowego w obrębie O(PY). Jest to metoda współczynników wyodrębnionej determinacji (co- efficients of separate determinatioń) Ezekiela (1946, s. 498). Rozpatrzmy następu- jący przykład: niech O(PY) = (Xi, X2, X3). Aby wyznaczyć względną ważność zmiennej X{ dla Y, przy ustalonych wpływach na Y pozostałych zmiennych X2 i X3 musimy wyznaczyć wartość współczynnika wyodrębnionej determinacji rfn.2.3: R2v K dn. 23 ~ 'n.23 y.123 r.123 (13.172) gdzie: "52 1 Y.l.23 KYl23~ Ł- N-l N + k+l (13.173) /??j23 — nieobciążony estymator RY.i23> ^y2 — suma kwadratów, ^y*i — suma iloczynów (obliczona jak przy wzorach: 13.14, 13.15). Suma poszczególnych współczynników wyodrębnionej determinacji równa jest wartości współczynnika wielokrotnej determinacji fly.i23- Jeżeli między zmiennymi niezależnymi występuje wysoka korelacja, to współczynniki wyodrębnionej determinacji mogą być obarczone błędami. Ponad- to współczynniki wyodrębnionej determinacji mają taką wadę, że są mniej stabil- ne i bardziej niż inne miary istotności narażone na wpływy czynników zakłóca- jących-okazjonalnych (tzw. błędy losowe). Dla większej przejrzystości — przy ustalaniu porządku istotnościowego w obrębie O(PY) — można poszczególne współczynniki wyrażać jako procent ogólnej sumy wartości wszystkich współ- czynników. 428 5. Podsumowanie W niniejszym rozdziale pokazano — odwołując się do strukturalnej tożsamości modeli: analizy wariancji i wielokrotnej korelacji-regresji (Cohen, 1968) — w jaki sposób badacz, operując pomiarem zmiennych niezależnych (czynników wyjaśnia- jących) na poziomie skali nominalnej, może podstawowe układy ANOVA, jedno- czynnikowy i wieloczynnikowe, opracować w modelu wielokrotnej regresji linio- wej. Aby jednak możliwe było wprowadzenie zmiennych jakościowych (A, B, C, ...) do równania regresji liniowej, należy wpierw owe zmienne poddać zabiegowi ko- dowania. Efektem zabiegu kodowania jest utworzenie nowych zmiennych — zwa- nych zmiennymi instrumentalnymi (Tlt..., Tm). W literaturze przedmiotu (np. Ker- linger, Pedhazur, 1973; Pedhazur, 1982; Cohen, Cohen, 1975, 1983; Draper, Smith, 1973; Ward, 1969; Ferguson, Takane, 1989) wyróżnione zostały trzy systemy ko- dowania zmiennych jakościowych: (a) zero-jedynkowy, (b) quasi-eksperymentalny, (c) ortogonalny. Każdy z tych systemów został tu szczegółowo zaprezentowany i zilustrowany dokładnie zanalizowanymi przykładami jednej i dwóch zmiennych jakościowych. Każdy też przykład rozwiązywany był dwukrotnie: raz w modelu analizy wariancji, a raz w modelu wielokrotnej regresji liniowej. Procedura obli- czeniowa, którą tu pokazano, nie wymaga znajomości aparatu algebry macierzy. Wszystkie obliczenia można przeprowadzić za pomocą kalkulatora — chociaż mogą być one bardzo żmudne. Idealnym rozwiązaniem byłoby posłużenie się kom- puterem. W wielu miejscach tego rozdziału pokazano, więcej niż jedną drogę do- chodzenia do danego rezultatu (np. do sum kwadratów, do wartości współczynni- ka korelacji wielokrotnej). Chodziło bowiem o to, aby Czytelnik sam wybrał wzór najbardziej mu odpowiadający pod względem techniki obliczeniowej, któ- rą zechce wykorzystać w swoich badaniach. Przedstawienie trzech systemów kodowania (prowadzących do identycznych rezultatów) miało na celu pozostawie- nie Czytelnikowi swobody wyboru także w tym zakresie. Zarekomendowano ko- dowanie quasi-eksperymentalne, uzasadniając ten wybór tym, że rozwiązywa- nie układu czynnikowego, właśnie w ten sposób zakodowanego, najbardziej przy- pomina rozwiązywanie układu czynnikowego w modelu analizy wariancji (mo- del efektów stałych). Z kolei Czytelnikowi zainteresowanemu prostotą i ułatwie- niami technicznymi przy przeprowadzaniu obliczeń zalecono kodowanie ortogo- nalne. Stosunkowo najmniej napisano o kodowaniu zero-jedynkowym, jako że uważa się je — w porównaniu z dwoma pozostałymi systemami — za najmniej użyteczne. Trzeba na koniec powiedzieć również o ograniczeniach, które zostały na ten rozdział nałożone. Po pierwsze, przyjęto założenie o równej liczebności grup po- równawczych (równe n). Po drugie, nie podjęto analizy trendu między zmiennymi — zależną i niezależną. Przeanalizowanie tych zagadnień na poziomie szczegóło- wości przyjętej w niniejszej pracy wymagałoby znacznego zwiększenia i tak już pokaźnej objętości. Po trzecie, przyjęto, że zmienna zależna Y mierzona jest na 429 poziomie skali co najmniej interwałowej. Po czwarte, że zmienna zależna jest je nowymiarowa (nie czyniono tedy analogii między modelem MR i modelem ANC VA). Podstawowe wiadomości o modelu ANOVA i modelu MR nie wykracz poza zakres pracy Brzezińskiego i Stachowskiego: Zastosowanie analizy waria w eksperymentalnych badaniach psychologicznych (rozdz. 1.4). Rozdział 14. Model ex post facto (EPF) 1. Wprowadzenie Stosowanie przez badaczy-psychologów modelu EPF w badaniach empirycznych (zwłaszcza w psychologii klinicznej, psychologii wychowawczej czy psychologii osobowości) powodowane jest tym, że nie zawsze możliwe jest używanie, bez ograniczeń, mocniejszego — alternatywnego do modelu EPF — modelu E. Badacz wyznający pogląd: „iż droga do poznania zachowania się człowieka prowadzi przez laboratorium" (KozieJecki, 1975, s. 21) zapewne postawiłby pod znakiem zapytania rezultaty badawcze uzyskane przez psychologów stosujących model EPF. Czy na- leżałoby się z nim zgodzić? Moim zdaniem — nie. W każdym razie nie zawsze. W przeciwnym bowiem razie trzeba by umieścić część dyscyplin psychologicznych (w tym i te wyżej wymienione) poza granicami „prawdziwej nauki". Zgadzam się zatem z poglądem, iż tam, gdzie to możliwe, powinno się stoso- wać w badaniach naukowych model eksperymentalny. Jednakże model EPF pozwala badaczom na udzielenie odpowiedzi na takie pytania, które musiałyby pozostać na- dal otwarte w przypadku uznania przez nich modelu eksperymentalnego jako jedynej rzetelnej metody uzasadniania hipotez naukowych w psychologii. Odpowiedzi te są, co prawda, mniej precyzyjne, gdyż są obciążone większym (i to niekiedy bardzo dużym) błędem. Są to jednak odpowiedzi na takie pytania, na które — ze względów natury estetycznej, ekonomicznej i technicznej — nie sposób udzielić odpowiedzi na drodze eksperymentalnej. Są to niekiedy kwestie badawcze tak ważne, iż nie można pozostawić ich bez odpowiedzi w oczekiwaniu na wypracowanie przez psy- chologię bardziej precyzyjnych metod o charakterze eksperymentalnym. Jeżeli już uprawomocniamy słabszy od eksperymentalnego model badawczy w psychologii, zastanówmy się nad tym, jak zwiększyć jego moc eksplanacyjną oraz jak zmniejszyć, dość duży nieraz, margines błędów występujących w bada- niach nieeksperymentalnych. Spróbuję zatem przedstawić model EPF w takiej po- staci, która zapewniałaby minimalizację wariancji błędu. 2. Model eksperymentalny a model EPF Rysunek 14.1 schematycznie przedstawia to, co różni model EPF od modelu E. • Jak widać, model EPF stanowi jak gdyby odwrócenie — w stosunku do modelu 431 eksperymentalnego — kolejności czynności badawczych, które muszą być wyko- nane przez psychologa. Przykładu dostarczają tu znane badania Bandury i Waltersa nad agresją występującą u chłopców w okresie dorastania (1968), czy też badania nad osobowością autorytarną przeprowadzone przez zespół Adorno (por. Ador i in., 1950, 1969). oddziaływani e oddziaływanie i X, identyfikacja i ex post model ex post facto t, model eksperymentalny 1 Rys. 14.1. Model eksperymentalny a model ex post facto O ile w modelu E chodziło o to, by poprzez manipulację co najmniej jedną zmienną niezależną-główną wywołać obserwowanie zmiany zmiennej zależnej, 0 tyle w modelu EPF badacz usiłuje zidentyfikować nie znane mu zmienne nieza leżne, które spowodowały, iż zmienna zależna przyjęła określone wartości dla osób z badanych populacji. Ponieważ nie znane badaczowi zmienne niezależne już za działały, niekiedy bardzo dawno, na daną zmienną zależną, zatem jedyne co mu pozostało, to próba ich identyfikacji drogą analizy ex post. W zależności od stopnia wiedzy badacza na temat danej zmiennej zależnej Y 1 jej uwarunkowań, wyróżniam dwie odmiany modelu ex post facto, tj.: (a) odmianę eksploracyjną (w skrócie: EPF-E), (b) odmianę konfirmacyjną (w skrócie: EPF-K). 3. Dwie odmiany modelu EPF 3.1. Odmiana eksploracyjna (EPF-E) Odmianę EPF-E badacze stosują w przypadku rozwiązywania problemów istotno- ściowych, które przyjmują postać następujących kwestii: „Jakie zmienne niezależne są istotne dla danej zmiennej zależnej?" Aby rozwiązać tego typu problem, za pomocą badania typu ex post badacz powinien wykonać kroki przedstawione na rys. 14.2. 432 Grupa A Przepro- wadzenie wywiadó w Grupa B Grupa C Zakodowanie danych z wywiadów -+ ANALIZA ~-- X, 0 1 Gr.A Gr. B Gr. C :i > 0 1 Gr A Gr B Gr . C XVIX„ ?f koniec analizy - Pyt1. Czy: XYIX> % (wartości progowej)? Badanie związku zmiennyc h Badanie związku zmiennyc h TAK NIE TAK NIE Eliminowani e zmiennych Pyt. 2. Czy zależn ość Y od X, jest zależn ością rzeczy wistą, a nie pozorn ą? Zespół reguł selekcyjnych Badanie zgodności Badanie zgodności TAK NIE TAK NIE (' .Pyt 3. i* ii | Pyt. 4. Które ze zmiennych: X, X„ należą do O(P,)? O b r a z p r z e s t r z e n i z m i e n n y c h i s t o t n y c h d l a Y O ( P r ) B a d a n i e s t o p n i a w a ż n o ś c i z m i e n n y c h d l a Y ł Które ze zmiennych z O(Py) są bardziej, a które mniej ważne dla Y? Obraz struktury przestrzeni zmiennych istotnych dla V O(S,) Eliminowani e zmiennych Rys. 14.2. Odmiana eksploracyjna modelu ex post facto 1. Operacjonalizacja zmiennej zależnej i dobór grup porównawczych. Na etapie formułowania problemu naukowego wyłonione przez badacza zmienne mają status zmiennych teoretycznych. Dlatego też przed przystąpieniem do badań powinno się ustalić kryteria empiryczne ich stosowalności, tzn. należy je zoperacjonali-zować. W tym celu badacz musi użyć gotowych narzędzi psychologicznych bądź też skonstruować nowe, specjalnie dostosowane do rozwiązywania danego problemu naukowego. Załóżmy, że dana zmienna zależna jest zmienną de facto ciągłą (wielowarto- ściową). Niech będzie to na przykład „poziom samooceny". Zmienna ta może być zoperacjonalizowana ze względu na narzędzie (np. kwestionariusz samooceny), na którego skali wyróżniono punkt minimum (m0) i punkt maksimum (mj. Można tedy na kontinuum wartości zmiennej Y (zoperacjonalizowanej) wyróżnić określoną liczbę podzbiorów wartości tej zmiennej. Musi być ich tyle, ile grup porównaw- czych planuje utworzyć badacz; powinny być jednak co najmniej dwie takie grupy. Dla osób z pierwszej grupy (grupa A) zmienna Y przyjmuje wartości z pierwszego podzbioru wartości, a dla drugiej grupy (grupa B) zmienna Y przyjmuje wartości z drugiego podzbioru wartości. Na ogół oba podzbiory wartości zajmują krańce kontinuum wartości zmiennej Y (zoperacjonalizowanej). Środkowy obszar kontinuum pozostaje nie wykorzystany. Postępuje się tak dlatego, że przy przeprowadzaniu porównań skrajnych grup ła- twiej będzie wychwycić zmienne niezależne istotne dla Y, których wpływ na tę zmienną nie jest zbyt silny. Najniższa wartość, jaką zmienna Y przyjmuje dla osób z grupy B jest większa od pewnej arbitralnie przez badacza ustalonej wartości krytycznej ms. Najniższa wartość, jaką zmienna Y przyjmuje dla osób z grupy A jest mniejsza od pewnej wartości krytycznej mr. Ilustruje to poniższy schemat: grupa A m0 grupa B -tr- -tr- -I Y mr mr (a) Bardziej korzystne jest jednak dobranie większej liczby grup porównawczych, np. trzech — co ilustruje poniższy schemat: g r u p a A grupa B grupa C -tr- -tr- m. m, m x ( b ) 0 i . . . J A ' W przypa dku doboru grup porówn awczyc h wedle schema tu (a) wykorz ystane są tylko krańco we odcinki kontinu um wartośc i zmienn ej Y — zoperac jonalizo wanej. W przypad ku (b) wykorz ystane jest całe kontinu um wartośc i zmienn ej Y — grupy porówn awcze rozmies zczone zostały równom iernie wzdłuż kontinu um war- tości. Jeż eli zmienn a Y jest zmienn ą dychoto miczną, przyjmu je ona dla osób z grupy A wartość „0", a dla osób z grupy B wartość „1". Dość często spotyka ne jest następu jące postępo wanie. Badacz e mając do czynien ia ze zmienn ą Y de facto ciągłą poddają ją zabiego wi dychoto mizacji (np. w punkcie median y). W ten spo- 434 sób zmienna zależna y-zdychotomizowana przyjmuje dla osób z jednej grupy war- tość „0", a dla osób z drugiej grupy wartość „1". Oto kilka przykładów: samoocena stabilna i niestabilna, zachowanie agresywne i nieagresywne, osobowość efektywna i nieefektywna. Stosując zabieg dychotomizacji musimy pamiętać o tym, że tracimy przez to informacje o stopniu zróżnicowania wpływów poszczególnych zmiennych niezależnych (identyfikowanych ex post) na zmienną zależną, w zależności od tego, jakie wartości przyjmują one ze zbiorów wartości tych zmiennych. 2. Określenie populacji, na których będą prowadzone badania. W tej fazie badacz decyduje się na to, jakie populacje mają być poddane badaniom. Inaczej, ustala zakres generalizowalności wniosków z badań. Po określeniu interesującej go populacji, badacz kontroluje wpływ tych zmiennych niezależnych, które opisują badaną populację (tzw. zmienne metryczkowe). Kontrola ta jest przeprowadzana za pomocą procedury ustalania stałego podzakresu wartości (lub danej wartości) zmiennych kontrolowanych (opis w rozdz. 12.). Konsekwencje tego postępowania są takie, iż badacz musi w fazie generalizo- wania wniosków z badanej próby na populację opatrzyć je klauzulą: „... tylko w odniesieniu do osób, dla których zmienna Xj przyjmuje wartości z podzakresu...". Jeżeli badania mają charakter pionierski w danej dziedzinie psychologii, to zdarza się, iż nie poddaje się kontroli (pojmowanej jak wyżej) żadnej zmiennej. Dopiero w następnych z kolei badaniach będzie się stosowało odpowiednie procedury kontrolne. 3. Opracowanie schematów wywiadów i systemu kodowania danych. Zidentyfi kowanie potencjalnych zmiennych niezależnych istotnych dla zmiennej zależnej mo żliwe jest w modelu EPF jedynie drogą wywiadów (najlepiej ustrukturowanych) prze prowadzanych z osobami z grup porównawczych oraz z osobami z ich otoczenia. Dlatego też ta faza badania jest niezmiernie ważna. Od dobrego opracowania schema tów wywiadów w dużym stopniu zależy powodzenie całego badania. Uzyskane z wy wiadów informacje mają na ogół charakter jakościowy. Dlatego też należy nadać im charakter ilościowy, dzięki czemu możliwe będzie przeprowadzenie porównań inter- i intraindywidualnych. Możliwe będzie także określenie stopnia istotności dla danej zmiennej zależnej zidentyfikowanych post factum zmiennych niezależnych. Dane z wywiadów mogą być kategoryzowane za pomocą skal szacunkowych. Wywiady winny być prowadzone przez specjalnie do tego celu przygotowane osoby, a kodowanie rezultatów powinno być wykonane przez co najmniej dwie inne osoby, także odpowiednio przeszkolone. Osoby dokonujące przekładu danych z języka Jakościowego" na „ilościowy" mają status sędziów kompetentnych. Sto- sujemy trening sędziów (o czym dokładniej w pkt. 4.2) by zapewnić sobie wysoki stopień ich kompetencji (trafność sądów) oraz równie wysoki stopień ich zgodności (rzetelność sądów). 4. Analiza danych: odpowiedź na pytanie 1. Po przeprowadzeniu wywiadów i zakodowaniu danych badacz przystępuje do udzielenia odpowiedzi na pierwsze pytanie w ramach analizy danych. Celem tej analizy jest wyszukanie potencjalnych zmiennych niezależnych istotnych dla Y. Za takie zmienne badacz uznaje w pierw szej fazie te zmienne, które przyjmują różne wartości w porównywanych grupach. Różnice te jednak muszą być dostatecznie duże, by można było uznać wstępnie a- 435 daną zmienną X} za istotną dla zmiennej Y. Stosuje się w tym celu odpowiednie porównania frekwencyjne, a oceny siły związku między zmiennymi Y i Xj dokonuje się za pomocą odpowiednich wskaźników (mierników siły związku). Jeżeli wartość danego wskaźnika przekracza arbitralnie przez badacza ustaloną wartość krytyczną, która jest tym wyższa im większe są koszty społeczne pomyłki, to dana zmienna Xj zostaje zakwalifikowana do dalszej analizy. Jeżeli jest odwrotnie, zmienna ta zostaje wyeliminowana. i Tak więc w pierwszej fazie analizy danych badacz musi odpowiedzieć na pytanie: „Czy wartość danego wskaźnika siły związku między zmiennymi Y i Xj przekracza wartość krytyczną ??". Wskaźniki siły związku oblicza się z tabel wie- lopolowych. Gdy zmienna Xj jest dychotomiczna lub zdychotomizowana, w zależ- ności od liczby grup porównawczych analizuje się tabelę typu: 2x2, 3x2, 4x2 itd. Na rys. 14.2, na którym przedstawiono schematycznie model EPF-E, pokazano zastosowanie tabel typu 3 x 2 do badania siły związku między zmiennymi. Nato- miast jako wskaźnika siły związku użyto wskaźnika /amfofa-Goodmana i Kruskala. Tak więc ogólnie sformułowane pytanie pierwsze można sprowadzić do następują- cej postaci szczegółowej: „Czy XYix jest większa od wartości progowej ??". Jeżeli także zmienna Kjest dychotomiczna (lub zdychotomizowana), oceny siły związku między zmiennymi można dokonać na podstawie analiz tabel typu 2x2, tak jak to pokazał Lazarsfeld (1968). W pola takiej tabeli czteropolowej wpisuje się czę- stości występowania poszczególnych kombinacji wartości zmiennej Y (grupy A i B) i wartości zmiennej Z; — „zero-jedynkowej". Ponieważ rozkład brzegowy zmiennej zależnej jest ustalony przez dane narzędzie pomiarowe, ze względu na które zmienna ta została zoperacjonalizowana, zatem odpowiednim wskaźnikiem siły związku między zmiennymi jest współczynnik g-Kendalla. Jego istotność te- stujemy za pomocą testu chi-kwadrat, przy df- 1. Czytelnik mógłby zapytać, dlaczego jako wskaźnik siły związku między zmiennymi proponuję współczynnik lambda-Goo&mana i Kruskala, a nie jakiś współczynnik oparty na rozkładzie /2? Otóż współczynniki opracowane przez Good- mana i Kruskala oparte są na całkowicie odmiennej zasadzie niż takie współczyn niki, jak C-Pearsona, V-Cramera czy T-Czuprowa. Są one oparte na zasadzie op tymalnej predykcji. Co to znaczy? Przypuśćmy, iż lambda = 0,86. Oznacza to, że dysponując informacją o zróżnicowaniu osób badanych według wartości zmiennej Xj popełniamy 86% mniej błędów niż przy przewidywaniu zróżnicowania osób badanych tylko wedle wartości zmiennej Y. Przy obliczaniu lambda korzystamy z następującego wzoru: i t&i( ,,w. „^ t ęi wm^t, ^^ ^^ *"" ftj-miafj t, ;j>o i n - gdzie: n — wielkość próby; fv — liczebność zaobserwowana w polu /-tej kolumny i 7-tego wiersza; max/j; — największa liczebność zaobserwowana w j-tej kolumnie; j max/; — największa liczebność brzegowa w ./'-tym wierszu. j 436 Z kolei badacz musi ustalić wartość progową (krytyczną) dla wskaźnika siły związku między zmiennymi Y i Xj. Jest ona funkcją wagi społecznej rozwiązywa- nego problemu. Jest to jednocześnie pierwsze sito selekcyjne. Do drugiego etapu analizy przechodzą tylko te zmienne niezależne, których wskaźniki lambda prze- wyższają wartość progową ?. Im wyższą badacz ustali wartość progową ?, tym bardziej surowe będzie kryterium wstępnej selekcji i tym więcej zmiennych nieza- leżnych zostanie na pierwszym etapie analizy wyeliminowanych. Chciałbym wyraźnie podkreślić, że nie można poprzestać tylko na tym etapie analizy danych (niezależnie od stopnia jej metodologicznej poprawności!). Niezbęd- ne jest także przeanalizowanie każdego dostatecznie silnego związku między zmiennymi Y i Xj w kontekście określonego paradygmatu teoretycznego (TBO w strukturze świadomości metodologicznej — por. rozdz. 3.), a także w celu wyeli- minowania tych zmiennych niezależnych, dla których związek ze zmienną zależną ma charakter związku pozornego (w sensie, jaki nadał temu terminowi Lazarsfeld). Jest to jednak przedmiotem drugiej fazy analizy danych. 5. Analiza danych: odpowiedź na pytanie 2. W tej fazie analizy danych badacz dokonuje selekcji zmiennych, które pomyślnie przeszły test pierwszej fazy. Zmien- ne te mają dostatecznie wysokie wskaźniki siły związku ze zmienną Y. Chodzi teraz tylko o to, by wychwycić te zmienne niezależne, które weszły w związki pozorne ze zmienną zależną. Dlatego też pytanie drugie brzmi: „Czy zależność Y od Xj jest zależnością rzeczywistą, a nie pozorną?". Odpowiedni zespół reguł selekcyjnych zastosowany w tej fazie analizy powinien ułatwić badaczowi wyeliminowanie tych zmiennych niezależnych, które weszły w pozorne związki ze zmienną zależną. Na zespół reguł selekcyjnych składają się z jednej strony prawa i twierdzenia uznanych na danym etapie rozwoju psychologii koncepcji teoretycznych (zaakceptowanych przez badacza wraz z TBO w strukturze świadomości metodologicznej) oraz uzna- ne wyniki wcześniej przeprowadzonych badari empirycznych, a z drugiej strony określone reguły eliminowania zależności pozornych. Reguły takie podał S. Nowak (1965b, 1985). W najprostszej postaci eliminowanie zależności pozornych między zmienną Y i Xj polega na wprowadzeniu do analizowanego układu trzeciej zmiennej Zj i zba-niu, jak ten układ się zachowa. O danej zależności powiemy, że jest zależnością orną, gdy znajdziemy zależności między zmiennymi pierwotnymi (Y i Xj) — zy którymi zachodzić powinna wedle hipotezy badacza zależność rzeczywista oraz trzecią zmienną, kontrolną (ZJ) (Jahoda, Deutsch, Cook, 1965b, s. 563): (a) — zależność między zmienną 2, i zmienną Xj (odgrywa ona rolę przyczyny I analizowanym układzie), przy czym zmienna Z, poprzedza czasowo zmienną Xj, (b) — zależność między zmienną Z, i zmienną Y (odgrywa ona rolę skutku w analizowanym układzie), przy czym zmienna Z} poprzedza czasowo zmienną Y, oraz: (c) — znika zależność między zmienną Xj i zmienną Y w podgrupach wyróżnio nych ze względu na wartości, jakie przyjmuje dla osób z tych podgrup zmienna Zj. Różni autorzy podkreślają dużą rangę analiz zależności pozornych w podejściu ex post facto. Przykładowo, Jahoda, Deutsch i Cook (1965b, s. 562) piszą: „...tam, 437 gdzie zależność lub związek między dwiema zmiennymi został ustalony w toku analizy ex post facto (tj. na podstawie operacji nie podyktowanych z góry planem eksperymentu kontrolowanego), tam w pewnym sensie wykonano zaledwie pier- wszy krok. Zanim będzie można orzec zachodzenie związku przyczynowego, na- leży stwierdzić, czy zależność nie ma charakteru zależności pozornej oraz określić jednoznaczne następstwo w czasie badanych zmiennych. Analiza ex post facto zbli- ża się do warunków eksperymentu kontrolowanego poprzez wprowadzanie metod kontroli w toku samej analizy, a nie w fazie gromadzenia materiału". 6. Analiza danych: odpowiedź na pytanie 3. Po wyeliminowaniu tych zmien nych niezależnych, które wchodziły w związki pozorne ze zmienną zależną Y badacz może udzielić odpowiedzi na pytanie trzecie: „Które ze zmiennych Xh ...,XW należą do obrazu przestrzeni zmiennych istotnych dla zmiennej YT'. Odpowiedź na to py tanie jest stosunkowo prosta. Do O(PY) wchodzą te zmienne, których wskaźniki różnicowania wyróżnionych grup porównawczych — np. lambda — przewyższały wartość ? i jednocześnie nie wchodziły one w zależności pozorne ze zmienną Y. 7. Analiza danych: odpowiedź na pytanie 4. Ostatnie pytanie, na które badacz musi udzielić odpowiedzi przyjmuje postać następującej kwestii: „Które ze zmien nych z O(PY) są bardziej, a które mniej ważne dla YT'. Odpowiedź na to pytanie wymaga uporządkowania zmiennych niezależnych według wysokości wskaźników różnicowania (np. lambda czy Q). Z dwóch zmiennych niezależnych Xr i Xz zmien na Xr jest bardziej istotną (ważniejszą) dla Y od zmiennej Xz, jeżeli: XY/xr > ^YIX (lub: Qr > Qzy Zbiór zmiennych niezależnych istotnych dla Y uporządkowany wedle relacji „bycia ważniejszą dla Y" stanowi O(SY). 3.2. Odmiana konfirmacyjna (EPF-K) Tok postępowania badawczego jest tu bardzo zbliżony do odmiany modelu EPF przedstawionej wyżej. Różnica między nimi jest taka, iż tu badacz formułuje hipo- tezę, która mówi, że zmienna Xj wpływa na zmienną Y. W związku z tym jest on nastawiony na udzielenie rozstrzygającej odpowiedzi (o ile takiej może udzielić w modelu EPF): albo zmienna Xj jest zmienną istotną dla Y, albo też nie jest. Sche- matycznie wersję konfirmacyjna modelu EPF przedstawia rys. 14.3. W celu spraw- dzenia danej hipotezy badacz musi wykonać kroki przedstawione na rysunku: 1. Operacjonalizacja zmiennej zależnej i dobór grup porównawczych. Przy dobieraniu grup porównawczych badacz kieruje się takimi samymi zasadami, jak w wersji eksploracyjnej modelu EPF. 2. Określenie populacji, na których prowadzone będą badania. Postępowanie badacza przebiega podobnie jak w EPF-E, przy czym szczególny nacisk położony jest tu na kontrolę tych zmiennych, które jego zdaniem mogłyby zaciemniać obraz wpływów zmiennej Xj (o której mówi sprawdzana hipoteza badawcza) na zmienną Y. Spośród różnego typu procedur kontrolnych, które „nakazują" badaczowi mani- pulowanie w określony sposób zmiennymi niezależnymi tu znajduje zastosowanie t/e 438 Grupa A Hipoteza teore- tyczna Grupa B Grupa C Hipoteza uszczegółowiona Hipoteza zopera-cjonali- zowana h 0 1 L G r A G r B r G r C XY\K koniec analizy Pyt 1 Czy dane krytenum Kt różnicuje grupy A.B.Ctzn . Badanie siły różnicowania Badanie siły różnicowania TAK NIE TAK NIE t _s v Eliminowanie kryteriów Pyt. 2. Czy dane kryterium K, różnicuje rzeczywiście, a nie pozornie gr: A, B, C? Zespół reguł selekcyjnych Badanie zgodności Badanie zgodności TAK NIE TAK NIE i Eliminowanie kryteriów Pyt. 3. W jakim stopniu hipoteza została potwierdzo na? DECYZJA Rys. 14.3. Odmiana konfirmacyjna modelu ex post facto procedura ustalania stałego podzakresu (lub konkretnej wartości) danej zmiennej (lub zmiennych) niezależnej. Bandura i Walters (1968) kontrolowali, w sposób wyżej podany, wpływ na zmienną zależną następujących zmiennych: poziom inteligencji, zmienne charak- teryzujące środowisko rodzinne badanych chłopców, pochodzenie etniczne: „Bada- nie ograniczyło się do chłopców o przeciętnej lub ponadprzeciętnej inteligencji, pochodzących z rodzin — z punktu widzenia prawnego — pełnych (nie rozbitych przez trwałą rozłąkę, rozwód czy śmierć jednego z rodziców), posiadających rodzi- ców o stałym zatrudnieniu i mieszkających w środowisku sąsiedzkim, w którym nie występowało ani upośledzenie materialne, ani też wysoki stopień przestępczości młodzieży. Chłopcy murzyńscy i pochodzenia meksykańskiego zostali wyłączeni (...)" (tamże, s. 19). Tym samym badacze zgodzili się na to, że wnioski, które wysuną na podstawie badań będą ograniczone do populacji osób, dla których wyżej wymienione zmienne przyjmują ustalone wartości. 3. Uszczegółowienie hipotezy badawczej. Uszczegółowienie hipotezy badaw czej polega na dokładnym zdefiniowaniu zmiennych, o których ona mówi. Przy jej uszczegóławianiu należy także zwrócić uwagę na to, by podać zestaw informacji, które należy zebrać, a które mogą być istotne przy określaniu stopnia potwierdzenia się danej hipotezy. W badaniach Szustrowej (1972) sprawdzano następującą hipotezę: „oczekuje się, że rozwój osobowościowych przesłanek dla regulacji nieegocentrycznej uwa- runkowany jest przez stosunek emocjonalny rodziców do dziecka. W doświadcze- niu osób o egocentrycznych właściwościach zachowania, częściej niż w doświad- czeniu osób o nieegocentrycznych właściwościach zachowania, wystąpiły przypu- szczalnie z jednej strony wrogość i odrzucenie oraz małe zainteresowanie ich fizy- cznymi i emocjonalnymi potrzebami, a z drugiej strony nadmierna czułość i opie- kuńczość". Była to, jak widać, hipoteza dość szczegółowa. Jednakże autorka tych badań sporządziła jeszcze listę informacji dotyczących: „— częstości okazywania przez rodziców ujemnych i dodatnich uczuć, — stopnia akceptacji dziecka przez rodziców, — relatywnego poziomu okazywanych uczuć i okazywanego zainteresowa nia jego potrzebami (w porównaniu do rodzeństwa), — współdziałania z dziećmi (udziału w zabawie i pomocy w rozwiązywaniu problemów)". 4. Zoperacjonalizowanie hipotezy badawczej. Polega ono na podaniu kryteriów operacyjnych (w skrajnym przypadku, gdy testowana hipoteza jest bardzo szczegó łowa i wąska — jednego), których stopień różnicowania grup porównawczych bę dzie przesądzał o stopniu potwierdzenia danej hipotezy. Takimi kryteriami mogą być np. pozycje (lub ich wiązki) w specjalnie opracowanym kwestionariuszu wy wiadu. Oczywiście dane z wywiadów podlegają procedurze kodowania przez co najmniej dwóch niezależnych sędziów. 5. Analiza danych: odpowiedź na pytanie 1. W pierwszej fazie analizy danych badacz musi ustalić odpowiedź na pytanie: „Czy dane kryterium Kj różnicuje grupy 440 porównawcze, tzn. czy Ay\K > ??"• Dla oceny stopnia zróżnicowania badacz stosuje albo wskaźniki lambda-Goodmana i Kruskala, albo — gdy zmienna Fjest dwu- wartościowa — wskaźnik <2-Kendalla. Kryteria, których wskaźniki różnicowania przewyższają wartość progową, ustaloną arbitralnie w zależności od wagi społecz- nej rozwiązywanego problemu, ?, przechodzą do drugiej fazy analizy. 6. Analiza danych: odpowiedź na pytanie 2. W drugiej fazie analizy danych badacz wyłapuje te kryteria, które pomyślnie przeszły przez pierwszą fazę analizy, a których wskaźniki XY\X 0ub 0 wcale nie pokazują faktycznego zróżnicowania grup porównawczych. Chodzi zatem, podobnie jak w wersji eksploracyjnej, o wy eliminowanie zależności pozornych. Znajdą tu zastosowanie te same metody, co opisane wyżej. 7. Podjęcie decyzji dotyczącej hipotezy badawczej. Na koniec badacz musi odpowiedzieć na pytanie: „W jakim stopniu hipoteza badawcza została potwierdzo na?". Odpowiedź na to pytanie jest uzależniona od liczby kryteriów, które pomy ślnie przeszły przez obie fazy analizy danych. Im więcej kryteriów okaże się istot nych, tym wyższy będzie stopień potwierdzenia hipotezy badawczej. W przypadku, gdy tylko część ich uzyska potwierdzenie, hipotezę można będzie uznać za tylko częściowo potwierdzoną. Jeżeli natomiast istotnych będzie tylko kilka mało waż nych kryteriów, trudno będzie daną hipotezę uznać za potwierdzoną. Należy pa miętać o tym, że silne potwierdzenie jakiejś hipotezy można uzyskać jedynie w wa runkach dobrze kontrolowanego eksperymentu. Głośne i do dziś powszechnie cytowane badania, przeprowadzone w latach czterdziestych naszego wieku w USA przez Frenkel-Brunswik, Levinsona i Sanfor- da (cyt. poi. wyd. 1962) w ramach szerszego programu badawczego nad tzw. oso- bowością autorytarną, kierowanego przez Adorno (por. Adorno i in., 1950, 1969), mogą posłużyć jako dobra ilustracja zastosowania modelu EPF (raczej w wersji K niż E, chociaż trudno tu o precyzyjne rozdzielenie). Badacze ci tak naszkicowali problem badawczy: „Myślą przewodnią tych ba- dań była koncepcja jednostki, której poglądy na człowieka i na społeczeństwo można określić jako antydemokratyczne, przy czym źródłem tych poglądów są najgłębsze tendencje emocjonalne danej jednostki. Czy można pokazać, że taka osobowość istnieje? Jeżeli tak, jak wygląda ona dokładniej? Co sprzyja myśli anty- demokratycznej? Jakie siły działają na jej rzecz w obrębie osobowości? Jeśli oso- bowość taka istnieje, jaki jest stopień jej rozpowszechnienia w naszym społeczeń- stwie (amerykańskim — /. B.)l I jakie czynniki powodowały jej rozwój?" (tamże, s. 303). Autorzy wyróżnili w obrębie osobowości antydemokratycznej „ideologię" i „głębsze potrzeby osobowościowe" (przy czym przez „ideologię" rozumieli „ze- spól powiązanych ze sobą poglądów, postaw i wartości"; s. 303). Wnikliwą analizę metodologiczną założeń teoretycznych przyjętych przez Adorno i in. przeprowadzi- ła Hornowska (1989, s. 74-80; por. także rozdz. 7., pkt. 9.3.). Przyjęcie założenia, iż tendencje antydemokratyczne opierają się na strukturze osobowości, pociągnęło za sobą pytanie o przebieg rozwoju tej struktury. Autorzy skłaniali się do przyjęcia założenia, że rozwój w pewnym stopniu uzależniony jest 441 od przebiegu wychowania dziecka w rodzinie (chodzi tu o szeroki kontekst społe- czny, a więc uwzględnia się wpływ takich czynników, jak: status ekonomiczny rodziców, ich przynależność etniczną, religijną itp.). Nie będę dalej szczegółowo omawiał koncepcji teoretycznych wyłożonych przez badaczy, ale przejdę od razu do charakterystyki podejścia badawczego, wiążącego się z interesującym nas pro- blemem. Punktem wyjścia było skonstruowanie odpowiedniego narzędzia pomiarowe- go, które pozwoliło badaczom na wyselekcjonowanie z populacji grupy osób o po- glądach antydemokratycznych (zwracam uwagę na celowy, a nie losowy, dobór osób!). Był to kwestionariusz wywiadu, który zawierał grupę pytań dotyczących różnych faktów z życia danej osoby badanej, grupę tzw. pytań projekcyjnych oraz zestaw skal do pomiaru poglądów i postaw. Skale te zawierały różne opinie anty- demokratyczne, a więc: antysemickie, etnocentryczne, reakcyjne, profaszystowskie, do których osoby badane musiały się ustosunkować. Za pomocą tego kwestionariusza wyodrębniono dwie grupy osób — w wyso- kim i w niskim stopniu aprobujące te poglądy (osoby badane nie były selekcjono- wane do grup porównawczych zgodnie z zasadą randomizacji — jak w modelu eksperymentalnym!). Następnie badacze zajęli się problematyką antysemityzmu (podobnie, jak wyżej, za pomocą skali mierzącej „gotowość osobnika do poparcia lub odrzucenia całokształtu ideologii antysemickiej" — Skala AS — wyróżniono dwie skrajne grupy osób, które poddano dalszym badaniom) oraz etnocentryzmu (za pomocą skali etnocentryzmu — Skali E, podobnej do Skali AS — zmierzono stosunek osób badanych do „swoich" i do „obcych"). Materiał empiryczny zebrany za pomocą wywiadów klinicznych był oceniany w ramach około 100 wcześniej ustalonych kategorii operacyjnych (kryteriów). Tak więc potencjalne zmienne niezależne zostały wstępnie zawężone do tych, które mogą przejawiać się w owych 100 kategoriach, stanowiących jak gdyby obszar penetracji badawczej autorów. Z kolei każdą kategorię rozpatrywano pod kątem możliwości uzyskania trzech informacji: (a) czy wywiad, w kontekście danej kate- gorii, ujawnił postawy odpowiadające niskim i wysokim wynikom w skali E, (b) czy można wyraźnie rozstrzygać o różnicach w kontekście danej kategorii, (c) czy materiału jest zbyt mało, by dokonać wyraźnego rozstrzygnięcia. W rezultacie przeprowadzonych porównań odrzucono niektóre kategorie, jako nie różnicujące osób o niskim i o wysokim stopniu etnocentryzmu, gdyż: „wypowiedzi o wysokiej i niskiej punktacji wystąpiły równie często w wywiadach osób zakwalifi- kowanych wysoko i nisko na podstawie kwestionariusza, albo dlatego, że był duży procent odpowiedzi neutralnych" (tamże, s. 318). Wśród kategorii, które najbardziej różnicowały osoby o niskim i o wysokim stopniu etnocentryzmu, znalazły się między innymi: tendencja do „idealizowania" rodziców, tendencja do „moralnego potępiania" innych ludzi, autogloryfikacja, nacisk na konwencjonalną moralność. Nieistotne oka- zały się między innymi: liczba rodzeństwa, kolejność urodzenia osób badanych, śmierć lub rozwód rodziców w okresie dzieciństwa osób badanych. Kategorie uznawano za istotne lub nieistotne na podstawie porównań względ- nej częstości występowania kryterium w jednej i drugiej grupie osób badanych. 4. Zbieranie i opracowywanie danych empirycznych pochodzących z wywiadów Jak Jak to już zostało powiedziane, psycholog decydujący się na posłużenie się mode- lem EPF „skazuje się" na dość ograniczony wybór, jeśli chodzi o metody zbierania danych empirycznych. W zasadzie jest to wywiad, przeprowadzany z osobami ba- danymi oraz osobami, które mogą dostarczyć ważnych informacji o aktualnym funkcjonowaniu osób badanych oraz o ich funkcjonowaniu w przeszłości, np. przed chorobą alkoholową, przed zawałem serca, w dzieciństwie itp. Wywiad (szkolny, kliniczny) nie jest rzetelnym źródłem informacji i stwarza wiele kłopotów związa- nych z merytorycznym przygotowaniem osób go przeprowadzających oraz z psy- chologicznymi mechanizmami blokującymi dostęp — zarówno u osoby przeprowa- dzającej wywiad, jak i u osoby jemu poddanej (np. lęk, mechanizmy obronne, aprobata społeczna, nastawienia) — do istotnych informacji o przyczynach okre- ślonego funkcjonowania osoby badanej (ucznia, pacjenta, osoby zachowującej się agresywnie itp.) (por. Wallen, 1964, rozdz. V i VI; Gerstmann, 1972; Brzeziński, Kowalik, 1993b, część II, rozdz. 7.; Meehl, 1960; Johnson, 1991). Ponieważ psycholog nie może zrezygnować z tego, niezbyt pewnego, źródła informacji, więc jedyne co mu pozostaje, to spróbować je ulepszyć. Przede wszy- stkim powinien: (a) opracować schemat zbierania danych za pomocą wywiadu, (b) przeszkolić osoby, które będą prowadzić wywiad, (c) przeszkolić osoby, które wystąpią w roli sędziów kompetentnych przeno szących dane z wywiadu na skale szacunkowe, (d) opracować zestaw skal szacunkowych, którymi będą posługiwać się sę dziowie kompetentni, (e) wypracować kryteria, zgodnie z którymi psycholog będzie uznawał skale szacunkowe za rzetelne źródło skwantyfikowanych informacji pochodzących z przeprowadzonych wywiadów. Omówmy teraz, pokrótce, wyszczególnione problemy techniczne. 4.1. Opracowanie schematu zbierania danych za pomocą wywiadu Podstawowym źródłem informacji o uwarunkowaniach (zmiennych niezależnych istotnych) zmiennej zależnej Y jest wywiad. Od jego rzetelności zależeć będzie rzetelność zebranych przez psychologa informacji o hipotetycznych uwarunkowa- niach zmiennej zależnej. Wywiad przeprowadzany jest, przede wszystkim z osoba- mi badanymi (np. z chłopcami przejawiającymi antyspołeczne zachowania oraz chłopcami takich zachowań nie przejawiającymi — badania Bandury i Waltersa; z osobami głoszącymi poglądy antysemickie i osobami głoszącymi poglądy demo- kratyczne — badania Adorno i jego współpracowników), a także z osobami zna- czącymi dla osób badanych (np. z ich rodzicami — badania Bandury i Waltersa). 443 Wywiad, zwłaszcza zaś gdy sięga do odległej przeszłości, nie jest narzędziem, które jest tak rzetelne jak wystandaryzowany test psychologiczny — zwracał na to uwagę Johnson w swoim bardzo pouczającym opracowaniu Pułapki w badaniu: wywiad jako model przykładowy (1991). Trzeba o tej słabości podstawowego w modelu EPF narzędzia badawczego pamiętać. Przed przystąpieniem do przeprowadzania wywiadu należy wpierw sporządzić — na podstawie dostępnej wiedzy psychologicznej — listę istotnych (z punktu widzenia interesującej badacza zmiennej zależnej Y) kryteriów, które — jeżeli będą różnicowały osoby o wysokim i niskim natężeniu zmiennej zależnej — będą mogły być uznane za wskaźniki zmiennych niezależnych istotnych dla Y, czyli wchodzą- cych do jej O(PY)- Następnie kryteria te badacz obudowuje szczegółowymi pyta- niami, które mają umożliwić dotarcie osobie prowadzącej wywiad do informacji, na podstawie których można będzie podjąć decyzję co do stopnia istotności każ- dego kryterium. Zalecaną formą prowadzenia wywiadu jest ta, która pozwoli uzyskać od wszy- stkich osób, z którymi przeprowadzany będzie wywiad, informacje na temat wy- różnionych wcześniej kryteriów. Będzie tedy taki wywiad bardziej podobny do kwestionariusza osobowości, aniżeli do swobodnej rozmowy klinicznej. Mówiąc dobitnie, opowiadam się za standaryzowaną formą wywiadu. Podzielam tym sa- mym opinię (por. Macoby, Macoby, 1954), iż wywiad standaryzowany jest bardziej odpowiedni w sytuacjach, w których badacz musi dokonywać porównań interindy- widualnych; w takich bowiem przypadkach ważne jest, aby wszystkie uzyskiwane przez osobę prowadzącą wywiad odpowiedzi były ze sobą porównywalne. Co wię- cej, jednoznaczność pytań zadawanych przez różne osoby prowadzące wywiady sprzyja minimalizacji wariancji międzyosobowej — a o to m. in. chodzi. Im mniej ustrukturalizowana postać wywiadu, tym większe prawdopodobieństwo wystąpienia błędów związanych z osobami prowadzącymi wywiady (np. różnice doświadczenia w posługiwaniu się wywiadem). Każda osoba prowadząca wywiad powinna być zaopatrzona w bardzo szcze- gółowy kwestionariusz, w którym będzie zapisywała (niezależnie od nagrania mag- netofonowego) wszystkie informacje uzyskane od osoby, z którą go przeprowadzi- ła. Przykładowo, kwestionariusze wywiadu z rodzicami oraz chłopcami zastosowa- ne przez Bandurę i Waltersa (1968, por. Aneks A i B, s. 349-367) zawierały od- powiednio 43 i 40 pytań. Przytoczmy, dla ilustracji, treść pkt. 17. z wywiadu przeprowadzonego z ro- dzicami badanych chłopców (Bandura, Walters, 1968, s. 352): „17. Czy odnosi Pan(i) wrażenie, iż spędza Pan(i) z tak samo dużo czasu jak inni ojcowie (inne matki), czy może jeszcze więcej? a. Kiedy Pan(i) przebywa z nim sam(a), co wówczas robicie? b. Czy często zabiera go Pan(i) idąc po zakupy, na przedstawienie, itp.? (Jak często?) c. Czy w takich wypadkach żona (mąż) towarzyszy wam również, czy też raczej Pan(i) idzie wyłącznie z ? 444 d. Czy ma jakieś hobby? Jakiego rodzaju? Chodzi o rzeczy, które by go interesowały i zajęły, kiedy jest w domu. e. Czy znajduje Pan(i) czas na pomaganie mu w tych zajęciach, na pokazy wanie mu jak się te rzeczy robi? Co Pan(i) sam potrafi w tym zakresie? f. A w okresie gdy chodził on jeszcze do szkoły podstawowej, jakiego rodzaju rzeczy robił Pan(i) z nim wspólnie i ile czasu Pan(i) z nim wówczas spędzał? Czy teraz jest inaczej? g. Czy, ogólnie rzecz biorąc, lubi Pan(i), kiedy przebywa razem z Pa- nem(nią), czy też woli Pan(i) raczej, aby gdzieś wyszedł z kolegami? h. A jak Pan(i) sądzi, czy lubi spędzać czas z Panem(nią) na jakichś wspólnych zajęciach lub wychodzić gdzieś razem? i. Czy może zdarzało się kiedykolwiek, że przesadnie chciał spędzać każdą chwilę z Panem(nią)? Jak ta sprawa wyglądała kiedy był młodszy? Co Pan(i) wów- czas robił(a)?" Jedno z ważniejszych przykazań, które powinno być bardzo sumiennie przestrze- gane przez każdego badacza sięgającego po wywiad jako narzędzie badawcze (a nie jako metoda diagnostyczno-terapeutyczna stosowana przez klinicystów), brzmi następująco: Badacz znający treść problemów i hipotez badawczych nie może sam prowa- dzić wywiadu. Dlaczego? Odpowiedź na to pytanie zawarta jest w rozdz. 4., w pkt. 3.: Na- stawienie badacza na potwierdzenie hipotezy badawczej — efekt oczekiwań inter- personalnych badacza OIB (wg R. B. Rosenthala). Piszą też o tym przywoływani już Johnson (1991) czy Barber (1991). Badacz pozostający pod wpływem określo- nego paradygmatu teoretycznego będzie „mimo woli" zwracał większą uwagę na jedne treści wypowiedzi osoby badanej, a inne będzie lekceważył, jako nieistotne z punktu widzenia wyznawanego paradygmatu (np. inna będzie technika prowadze-1 nia wywiadu przez zwolennika paradygmatu behawiorystycznego, a inna przez zwolennika paradygmatu psychoanalitycznego, por. Johnson, 1991, s. 434-435; Barber, 1991, s. 401-403). Kolejne ważne przykazanie: Osoba prowadząca wywiad nie może jednocześnie dokonywać kwantyfikacji odpowiedzi osób badanych. I w tym przypadku uzasadnienie ograniczenia jest takie samo jak wyżej przy- toczone. W celu zobiektywizowania zabiegu kwantyfikacji danych jakościowych („surowe" odpowiedzi osób badanych) należy wyeliminować tak poważne źródło wariancji błędu, jakim jest osoba prowadząca wywiad. Gdybyśmy w jej rękach pozostawili zamianę odpowiedzi zapisanych w kwestionariuszu ankiety na dane 4.2. Przeszkolenie osób prowadzących wywiady oraz sędziów kompetentnych 445 numeryczne (np. kategorie skal szacunkowych), to musielibyśmy się pogodzić i z j tym, że będzie ona skłonna faworyzować pewne osoby poprzez nadawanie wię- kszego znaczenia określonym odpowiedziom, bo — jak może racjonalizować swoje postępowanie — jej doświadczenie (np. kliniczne), intuicja i dobry wgląd w osobę badaną „upoważniają" ją do korzystania nie tylko z tego co usłyszała i zapisała w protokole (i co jedynie jest intersubiektywnie komunikowalne!), ale też z danych niewerbalnych. Aby uniknąć takich sytuacji „podrasowywania" danych należy od- dzielić funkcję osoby jedynie zbierającej dane od funkcji osoby dane te przetwa- rzającej. Kolejne przykazanie odnosi się do troski o rzetelność danych ilościowych uzyskiwanych w rezultacie przełożenia odpowiedzi na pytania ankiety (dane jako- ściowe) na dane liczbowe, które mogą już być przez badacza wykorzystane w po- równaniach interindywidualnych (Jaś versus Małgosia) oraz intergrupowych (osoby uprzedzone versus osoby nieuprzedzone): Przekładu danych z wywiadu na dane ilościowe powinny dokonywać, nieza- leżnie, co najmniej dwie osoby o statusie sędziów kompetentnych; nie powinien to być sam badacz, ani też osoby przeprowadzające wywiady. Doszliśmy teraz do bardzo ważnego punktu związanego z takim przeszkole- niem osób dokonujących owego przekładu (a także osób prowadzących wywiady), aby zminimalizować wariancję międzyosobową. Mówiąc inaczej, zanim badacz skieruje swoich współpracowników w teren, aby przeprowadzili wywiady i zanim przekaże zebrane protokoły i taśmy magnetofonowe sędziom kompetentnym, aby dokonali kwantyfikacji danych z tych wywiadów, wpierw musi zadbać o to, aby osoby te były rzeczywiście — a nie tylko z nazwy — kompetentne i do przepro- wadzania skomplikowanego wywiadu, i do jego kodowania. Aby uzyskać zadowa- lający poziom kompetencji tych dwóch kategorii „pomocników" badacz musi prze- prowadzić z nimi tzw. trening sędziów kompetentnych. Na konkretnym przykładzie zilustruję na czym polega taki trening. Ryans (1960) w swojej pracy Characteristics of teachers opisał szkolenie sę- dziów kompetentnych w zakresie posługiwania się skalami szacunkowymi wyko- rzystywanymi w przekładzie danych z obserwacji pracy nauczyciela w klasie szkol- nej na dane ilościowe. Oczywiście, zamiast danych z obserwacji mogą wystąpić dane z wywiadu. Opisany przez niego trening grupowy przyszłych sędziów kom- petentnych przebiegał w następujących etapach: (a) instruktor omawia z osobami poddawanymi treningowi podstawowe zagad nienia związane z przeprowadzaniem obserwacji (czy wywiadu), zapoznaje je z różnymi kwestionariuszami wywiadu i arkuszami obserwacyjnym, a także z róż nymi odmianami skal szacunkowych; (b) kandydaci na sędziów kompetentnych sami zapoznają się z budową róż nych skal, kwestionariuszy i arkuszy; (c) wspólnie z instruktorem przeprowadzają próbne obserwacje i niezależnie od siebie dokonują oszacowań; (d) następuje porównanie oszacowań, dyskusja, wyjaśnianie trudności itp.; (e) ponowna wspólna obserwacja, porównywanie oszacowań i dyskusja; 446 (f) w końcowej fazie treningu sędziowie kompetentni oraz instruktor przepro- wadzają obserwację (Ryans stosował obserwację 45-minutową) tych samych osób badanych (u Ryansa — nauczycieli), ale w różnym czasie (w poprzednich etapach — w tym samym czasie) i dokonuje się porównania otrzymanych oszacowań. Podczas trwania treningu oblicza się korelacje między oszacowaniami instruk- tora i osób poddawanych treningowi. Ryans, po przeprowadzeniu całego treningu, uzyskiwał zgodność ocen instruktora i osób szkolonych w przedziale: 0,80-0,90. Jak już wspominałem, sędziowie kompetentni (co zresztą sugeruje określenie: „kompetentni") muszą mieć dobre rozeznanie w przedmiocie dokonywanych osza- cowań. Muszą to być doświadczeni psychologowie kliniczni, jeżeli badania pocho- dzą z obszaru uwarunkowań zaburzeń psychicznych, czy doświadczeni psycholo- gowie szkolni, jeżeli badania dotyczą determinant niepowodzeń szkolnych uczniów na początkowym etapie nauczania szkoły podstawowej. Muszą przecież rozumieć (w sensie psychologicznym!) relacje między treścią uzyskiwanych odpowiedzi na pytania kwestionariusza wywiadu a treścią opisów poszczególnych punktów skal szacunkowych, którymi muszą się posłużyć w trakcie dokonywania przekładu z ję- zyka Jakościowego" na język „ilościowy". 4.3. Przygotowanie skal szacunkowych i ich akceptowanie przez badacza Nie mniej ważnym, niż przeszkolenie osób przeprowadzających wywiady i sędziów kompetentnych oraz przygotowanie kwestionariusza wywiadu(-ów), jest opracowa- nie zestawu skal szacunkowych, na których sędziowie kompetentni będą dokony- wać oszacowań. W literaturze przedmiotu przyjął się następujący podział skal szacunkowych (Brzeziński, 1978a, cz. II., rozdz. 4.: Skale szacunkowe, s. 204—220): (a) skale numeryczne, (b) skale graficzne, (c) skale z wymuszonym wyborem, (d) skale skumulowanych ocen. Moim zdaniem, najbardziej przydatne dla naszego celu są dwie pierwsze kategorie skal szacunkowych. Skalę numeryczną stanowi pewien zbiór kategorii opisujących poszczególne punkty określonego kontinuum zmiennej (np. postawy demokratycznej, jak w ba- daniach Adorno i in.). Kategoriom tym przypisywane są liczby, w określonym porządku sugerującym bądź spadek natężenia danej cechy (zmiennej), bądź jego wzrost. Implicite przyjmuje się, że odległości psychologiczne między wyróżniony- mi kategoriami są równe. Z kolei skalę graficzną stanowi odcinek, poziomy lub pionowy. Krańcom tego odcinka przyporządkowane są pewne kategorie opisowe. Odcinek ten może być podzielony na pewną liczbę równych części, a punktom podziału mogą być (i za- zwyczaj są) przypisane kategorie opisowe. Skale numeryczne i skale graficzne można podzielić na dwie kategorie ze względu na stopień dokładności opisu kategorii krańcowych: 447 (a) p unkty krańco we (zakotw iczenia) są bardzo dokładn ie opisane, np. przez podanie próbek określo nego zachow ania się osób badanyc h, które, zdanie m bada cza, odpowi ada punkto m minimu m i maksim um na skali; (b) p unkty krańco we są opisane za pomocą takich par słów, jak: „występ uje — nie występ uje", „brak lęku — duży lęk", lub też, po prostu, jeden kraniec skali oznaczo ny jest liczbą odpowi adającą minimal nemu natężeni u cechy, a drugi liczbą odpowi adającą jej maksy malnem u natężeni u. Ni ekiedy badacz e posługu ją się skalami z dokład nie opisany mi wszyst kimi punkta mi. Tego rodzaju skale stosuje się wówcz as, gdy zachod zi koniecz ność za- kodowa nia informa cji uzyska nych z wywiad u. I ten sposób postępo wania rekome nduję jako najbard ziej odpowi edni w przypa dku stosow ania modelu EPF. Zaczer- pnijmy ilustra cję z badań Bandur y i Walter sa. Wyżej przyto czyłem punkt 17. z kwestio nariusz a wywiad u z rodzica mi. Informa cje uzyska ne w tym punkcie były przekła dane na język ilościo wy za pomocą następu jących skal szacunk owych: skala 27.: „Ilość czasu spędza nego przez chłopca w towarz ystwie ojca (matki) — według oceny ojca (matki) "; skala 28.: „Permi sywnoś ć ojca (matki) wobec spędza nia przez chłopc a czasu w jego (jej) towarz ystwie" ; skala 29.: „Punity wność ojca (matki) wobec chęci chłopc a do spędza nia czasu w jego (jej) towarz ystwie" ; skala 30.: „Opór chłopca wobec spędza nia czasu z rodzica mi." Poniżej dokład nie przedst awiam skalę 29.: „S kal a 29. P unityw ność ojca (matki) wobec chęci chłopc a do spędza nia czasu w jego (jej) towarz ystwie. (Pyt. 16., 17.). 1. N ie wy stę puj e. 2. R az lub dw a wy łaj ał( a) lub oś mi esz ał( a) chł op ca z teg o po wo du. 3. W ypowie dzi świadcz ą o tym, że chłopie c był w pewien sposób karany za taki rodzaj zachow ania dawniej lub w ostatnic h latach. 4. W yraźna wypowi edź świadcz ąca o tym, że dawniej lub obecnie ojciec (mat ka) sporad ycznie karci, wyśmie wa i szydzi («Czy napraw dę nie masz żadnyc h swoich kolegó w?»). 5. O jciec (matka) w wielu wypadk ach stosuje (lub stosowa ł(a) poprzed nio) wyżej opisane sposoby karania chłopca . Ewentu alnie stosowa ł(a) bardziej surowe kary, kiedy chłopie c był młodsz y". Rz etelność każdej skali szacunk owej sprawd zamy w ten sposób, że niezależ nych oszaco wań na niej dokonu je co najmnie j dwóch sędzió w. Miarą zaś rzetelno ści skali jest stopień zgodno ści niezależ nych oszaco wań dokona nych przez sędziów kompet entnych . Jeżeli są to tylko dwaj sędzio wie, to miarą ich zgodno ści jest współc zynnik korelacj i (np. r- Kendall a, por. Brzeziń ski, 1978a, s. 108- 113). Jeżeli natomia st jest ich trzech (i więcej), to należy posłuży ć się współcz ynnikie m zgod- ności sędzió w W- Kendall a (por. rozdz. 15., pkt. 10.). Te skale, dla których współcz ynnik zgodno ści jest niski, należy odrzuci ć. Jaka wysoko ść współcz ynnikó w z czy W jest wymag ana? Jak najwyżs za. W badania ch Bandur y i Walters a (1968), żeby znowu odwoła ć się do jakiego ś przykła du, dwóch sędzió w dokony wało oszaco wań materia łu empiry cznego, uzyska nego z trzech ro- dząjów wywiadów, na pięciopunktowych skalach szacunkowych. Wartości trzech współczynników korelacji leżały w przedziałach: — dla wywiadu z matkami: 0,67-0,98 (mediana = 0,91), — dla wywiadu z ojcami: 0,64-1,00 (mediana = 0,82), — dla wywiadu z chłopcami: 0,81-0,96 (mediana = 0,83). Przywoływany już Ryans (1960) akceptował zgodność wyrażoną wartością korelacji równą 0,80. 5. Ocena istotności zmiennych w modelu EPF Pewne uwagi na temat empirycznych kryteriów rozstrzygnięcia o istotności zmien- nych niezależnych dla danej zmiennej zależnej Y poczyniłem już przy okazji opi- sywania kolejnych etapów stosowania dwóch wersji modelu EPF. Była tam mowa 0 wskaźniku g-Kendalla i wskaźniku łambda-Goodmana i Kruskala. Tutaj chciał bym, podobnie jak to uczyniłem w przypadku modelu E czy modelu MR, pokazać, jakie testy statystyczne mogą stosować badacze oraz jakie stosują procedury — niekiedy „słabe" — uzasadniania hipotez istotnościowych. W przypadku modelu EPF testem statystycznym, który najczęściej jest stoso- wany (o ile spełnione są założenia objęte modelem statystycznym tego testu) jest test chi-kwadrat (j2). Jeżeli wartość statystyki /2 wpada w obszar odrzuceń hipo- tezy zerowej, uznaje się daną zmienną za istotną dla zmiennej Y. Natomiast jako wskaźnika stopnia, w jakim dana zmienna Xj jest istotna dla Y, używa się współ- czynnika korelacji punktowo-czteropolowej (ę), albo też współczynnika g-Kendalla czy współczynnika A-Goodmana i Kruskala. Bywa i tak (i to wcale nierzadko!), że o tym, czy dana zmienna Xj jest istotna dla Y badacze decydują na podstawie przeprowadzonych porównań frekwencyj- nych, które mogą wyglądać następująco: zmienną zależną Y, jeżeli jest ona zmienną de facto wielowartościową, poddaje się zabiegowi dychotomizacji w jakimś pun- kcie krytycznym (np. mediana wyników określonego narzędzia pomiarowego) 1 wyróżnia się dwie grupy osób, np. dzieci z trudnościami w nauce (grupa A — wartość: „1") i dzieci bez takowych trudności (grupa B — wartość: „0"). Także jako dychotomiczną traktuje się zmienną niezależną Xj i dzieli się całą próbę ba daną na te osoby, dla których zmienna Xj przyjmuje wartość „1" oraz te, dla órych przyjmuje ona wartość „0", np. dzieci, u których we wczesnym dziecinnie wystąpiły urazy czaszkowe (wartość: „1") i dzieci, u których te urazy nie wystąpiły (wartość: „0"). Następnie oblicza się procent osób, dla których zmienna Y przyjmuje wartość „1" — w odniesieniu do liczebności grupy osób, dla których zmienna Xj przyjmuje także wartość „1". Oblicza się też procent osób, dla których zmienna Y przyjmuje wartość „1", ale w odniesieniu do liczebności grupy osób, dla których zmienna Xj przyjmuje wartość „0". I tak, w grupie dzieci, u których stwierdzono wystąpienie we wczesnym dzieciństwie urazów czaszkowych, oblicza 29 — Metodologia badań.. 449 się procent tych dzieci, które przejawiają trudności w nauce szkolnej; także w gru- pie dzieci, u których we wczesnym dzieciństwie nie stwierdzono wystąpienia ura- zów czaszkowych oblicza się procent tych dzieci, które przejawiają trudności w nauce szkolnej. Z kolei oblicza się różnicę między tymi procentami. Różnica prze- kraczająca arbitralnie przez badacza ustaloną wartość progową jest wskaźnikiem istotności zmiennej Xj dla zmiennej Y. Trudno taką praktykę uznać za modelową, gdyż musielibyśmy odpowiedzieć na pytanie: „Jaka powinna być ta minimalna różnica, by uznać zmienną Xj za istotną dla F?". Nie jest to pytanie łatwe. Odpowiedź dość popularna wśród bada- czy-psychologów stosujących model EPF: „dostatecznie duża" niczego, tak napra- wdę, nie rozwiązuje. 6. Wady i zalety modelu EPF Zacznę od wad. Poważną wadą modelu ex post facto jest brak możliwości mani- pulowania (na drodze randomizacji) zmiennymi niezależnymi istotnymi, gdyż za- działały już one na zmienną Y w jakiejś chwili tt, nieraz bardzo odległej od chwili, w której badacz dokonuje pomiaru zmiennej zależnej Y. Tak więc dana zmienna Xj zadziałała na zmienną Y w przeszłości. Mogło to być oddziaływanie jednorazo- we, krótkotrwałe, lub też długotrwałe czy wielokrotne, rozłożone w czasie, w pew- nym jego interwale. Natomiast badacz może tylko zaobserwować efekty tych od- działywań po upływie określonego czasu, przy czym zawsze trzeba dopuszczać ewentualność, iż nie będzie to „czysty" obraz wpływów danej zmiennej Xj na zmienną Y. Mogło być przecież tak, że na wpływy zmiennej Xj nałożyły się póź- niejsze wpływy innej zmiennej X„ względnie zmienna Xj weszła w interakcję ze zmienną X, i w rzeczywistości badacz obserwuje efekty interakcji zmiennych Xj i X„ a nie wyłącznie efekt oddziaływania zmiennej Xj. Metody zbierania danych i ich opracowywania (wywiady i skale szacunkowe) są dość „grubymi" metodami, wprowadzającymi dużą wariancję błędu. Stosując je badacz może pominąć pewne zmienne de facto istotne dla Y, gdyż niedokładnie spenetrował materiał badawczy. Wreszcie, może on za potencjalną zmienną nieza- leżną istotną dla Y uznać zmienną X„, która de facto nie jest istotna, ale jest obserwowalnym korelatem zmiennej rzeczywiście dla Y istotnej. Metody elimino- wania zależności pozornych mogły się w tym wypadku okazać zawodne. Trzeba wreszcie powiedzieć o pewnych niedogodnościach natury praktycznej. Otóż model ex post facto wymaga celowego doboru grup porównawczych (brak możliwości odwołania się do zasady randomizacji przy rozdziale osób do grup porównawczych!). Osoby właściwe z punktu widzenia problemu badawczego i za- stosowanej procedury operacjonalizacji trzeba wybrać niekiedy z bardzo dużej, wstępnie przebadanej grupy osób — co zniechęca, zwłaszcza młodych, niecierpli- wych badaczy i prowadzi do stosowania „grubych" metod selekcji i analizy danych. Po tych wszystkich uwagach krytycznych dotyczących modelu EPF trzeba, 450 gwoli sprawiedliwości, powiedzieć o jego zaletach. Bywa, iż względy natury ety- cznej czy technicznej (nie można umieszczać np. dzieci losowo pobranych z po- pulacji w warunkach skrajnej izolacji społecznej, by sprawdzić eksperymentalnie hipotezę traktującą o upośledzającym rozwój psychiczny dziecka wpływie przeby- wania przez długi okres w warunkach takiej izolacji) nie pozwalają badaczowi na zastosowanie modelu eksperymentalnego do rozwiązania danego problemu badaw- czego. Trzeba zatem w podobnych sytuacjach zastosować model EPF, zdając sobie sprawę z jego niedoskonałości lub też zaniechać badań. Rzecz jasna, opowiemy się za pierwszą propozycją. Krytyczną analizę kontroli zmiennych niezależnych-ubocznych w planach ba- dawczych wywiedzionych z modelu EPF zawiera praca Meehla (1970). Kończąc omawianie modelu EPF przytoczę jeszcze jego ocenę sformułowaną przez Kerlingera w pierwszym wydaniu jego bardzo znanego podręcznika metodo- logii badań behawioralnych Foundations ofbehavioral research (1964, s. 372-373 — rozdz. 20.: Ex post facto research; w ostatnim, trzecim wydaniu tej pracy z 1986 r. Kerlinger usunął ten rozdział i rozbudował znacząco rozdziały poświęcone modelowi eksperymentalnemu i wielokrotnej regresji, a problematykę badań ex post przedstawił w rozdz. 22.: Nonexperimental research): „...w psychologii, socjologii i pedagogice podejmuje się wiele badań typu ex post facto — pomimo ich wad — ponieważ sporo problemów badawczych w naukach społecznych i pedagogicznych nie nadaje się do badań eksperymentalnych. Refleksja nad niektórymi ważnymi w badaniach pedagogicznych zmiennymi — jak np. inteligencja, zdolności, doświad- czenie, wychowanie w rodzinie, osobowość nauczyciela, atmosfera w szkole — pokazuje, iż są to zjawiska niemanipulowalne. Badanie kontrolowane jest tu oczy- wiście możliwe, ale prawdziwe eksperymentowanie — nie (...). Nawet gdybyśmy chcieli uniknąć badań typu ex post facto, jest to niemożliwe. Można nawet powie- dzieć, iż badania typu ex post facto są ważniejsze niż badania eksperymentalne (nie podzielam tej oceny — J.B.). Nie jest to, oczywiście, obserwacja metodologiczna. Oznacza to raczej, iż większość ważnych problemów badawczych z zakresu nauk społecznych i pedagogicznych nie nadaje się do rozwiązywania na drodze ekspe- rymentalnej, chociaż na wiele z nich można odpowiedzieć poprzez kontrolowane badanie typu ex post facto (...)". 7. Podsumowanie Przedstawiony w tym rozdziale model EPF należy do „najuboższych" modeli ba- dawczych. Niestety nie zawsze jest możliwe odwołanie się do mocnego modelu eksperymentalnego, że jednak możliwe jest uzyskiwanie nawet w przypadku tak słabego metodologicznie modelu użytecznych naukowo informacji, pokazują bada- nia przeprowadzone przez Bandurę i Waltersa oraz Adorno, Frenkel-Brunswik, Le- 451 vinsona i Sanforda. Czytelnika zachęcam do zapoznania się z monografią: Bandura A., Walters R. H. Agresja w okresie dorastania. Wiadomości na temat wywiadu, podstawowego narzędzia zbierania informacji w modelu EPF, Czytelnik znajdzie w następujących pracach: Brzeziński J., Kowalik S. Charakterystyka wybranych metod diagnozy klinicznej; Gerstmann S. Rozmowa i wywiad w psychologii; Johnson R. F. Q. Pułapki w badaniu: wywiad jako model przykładowy; Nowak S. (red.) Metody badań socjologicznych. Wybór tekstów (rozdz. III.: Wywiad, s. 61-97; rozdz. IV: Problemy budowy kwestiona- riusza, s. 98-139); Szustrowa T. (red.) Swobodne techniki diagnostyczne. Wywiad i obserwacja; Wallen R. Psychologia kliniczna (rozdz. 5.: Wywiad: dane obser- wacyjne, s. 115-132; rozdz. 6.: Przeprowadzanie wywiadu: nawiązywanie kontaktu, s. 133-156). ?) podst awy konstr ukcji testó w psych ologic znych i interp retacj i ilości owej dany ch testo wych . ? i Rozdział 15. Rzetelność i błąd standardowy 1. Wprowadzenie Testy psychologiczne' należą do najczęściej stosowanych przez psychologów na- rzędzi pomiarowych. Budzą też — także wśród samych psychologów — skrajne opinie. Zwłaszcza złą „sławą" cieszą się testy inteligencji (pisze o tym m. in. D, Seligman, 1995). Ich konstruktorzy i użytkownicy są krytykowani (co ciekawe, głównie przez osoby nie obeznane z problematyką psychometryczną)2. Testy psy- chologiczne mają swoich zagorzałych zwolenników, a także równie zagorzałych przeciwników. W Polsce do takich zwolenników i propagatorów testów psycholo- gicznych należał Choynowski, autor pierwszego, ogłoszonego po wojnie artykułu na temat podstaw psychometrycznych testów psychologicznych — Elementy teorii testów psychologicznych (Choynowski, 1959; por. także: Choynowski, 1971b). Zaś krytycznie na temat testów psychologicznych wypowiadał się Kreutz w swoim, dziś niesłusznie zapomnianym, podręczniku: Metody współczesnej psychologii (1962 — rozdz. 10.: Metoda testów psychologicznych, rozdz. 11.: Zmienność rezultatów te- stów, rozdz. 12.: Metody badania wiarygodności testów). Uważam, że dziś, po latach rozwoju testów psychologicznych nie ma podstaw do odrzucenia tych specyficznych narządzi pomiarowych. Trzeba natomiast elimino- wać z „obiegu" złe testy czy wytwory działalnościpseudopsychometrów, którzy bez opamiętania produkują różne „potworki" psychometryczne udające prawdziwe testy psychologiczne. Przypomnijmy, iż pojęcie testu psyc/io/ogicznego zostało wprowadzone do psychologii przez psychologa amerykańskiego, ucznia Wilhelma Wundta, Jamesa McK. Cattella w pracy. Mental test and measurements (J. McK. Cattell, 1890). Opisał on w niej 10 testów służących do pomiaru zdolności umysłowych; były to takie próby, na przykład, jak: szybkość ruchów, czas reakcji czy czas nazywania kolorów (por.: Strelau, 1987, s. 35). 2 Na ten temat pisali m.in. D. Seligman (1995), Nowakowska (1975), Matczak (1994). Wiele kontrowersji wywołała praca psychologa Hermsteina i socjologa Murraya The beli curve, której autorzy i wykazali, iż rozkłady IQ w badanych grupach białych i czarnych Amerykanów przesunięte są wzglę- dem siebie (i to na niekorzyść czarnych) o jedno odchylenie standardowe. Krytycy źródeł tego „arte- faktualnego" (ich zdaniem) wyniku dopatrywali się w tendencyjności zastosowanego testu inteligencji, który faworyzował osoby białe. 455 I Trzeba też wskazywać na poprawne zastosowania testów w praktyce badaw- czej i diagnostycznej, a także — co może jeszcze ważniejsze — na ich nadużycia (a tych wcale niemało). W podręczniku metodologii badań psychologicznych, ad- resowanym do studentów i doktorantów, nie powinno zabraknąć miejsca na tę ważną problematykę (poświęciłem jej pkt. 4. w rozdz. 6.)- Idzie bowiem o to, aby kształtować — zgodnie z przyjętym w tej pracy normatywnym pojmowaniem me- todologii — praktykę konstruowania i stosowania testów psychologicznych oraz nie doprowadzić do powstawania artefaktów. Rzecz jasna tematyka psychometry- czna jest bardzo rozległa i, tak naprawdę, wymagałaby odrębnej i obszernej mono- grafii (takiej jak prace: Gulliksena, 1950; Lorda i Novicka, 1968; Cronbacha i in., 1972; Cronbacha, 1990; Anastazi, 1982 czy Nunnallyego, 1978). W przypadku włączania treści psychometrycznych do podręcznika metodologii niezbędne jest dokonanie daleko idącej ich redukcji. Nie sposób, i to jeszcze szcze- gółowo, poruszyć wszystkich zagadnień psychometrycznych. Trzeba dokonać ja- kiejś selekcji materiału. Kierując się własnym doświadczeniem dydaktycznym i do- świadczeniem związanym z konstruowaniem testów psychologicznych postanowi- łem, w tym i następnych rozdziałach, skupić się na węzłowych problemach pomiaru testowego tak, aby Czytelnik mógł samodzielnie i poprawnie skonstruować (lub dokonać adaptacji kulturowej) prosty test psychologiczny oraz poprawnie zinterpre- tować wyniki badania takim testem. Dociekliwy Czytelnik, któremu nie wystarczy niniejszy wykład, będzie mógł sięgnąć po bardziej specjalistyczne opracowania, dostępne także w języku polskim (jak np. Magnusson, 1991; Brzeziński, 1988; Machowski, 1993). Można także rozdziały w tej części podręcznika (15.-20.) po- traktować jako przewodnik bibliograficzny po specjalistycznych opracowaniach z zakresu psychometńi. Jedynie psycholog jest przygotowany merytorycznie i uprawniony do posługi- wania się testami psychologicznymi, a także do ich konstrukcji czy adaptacji kul- turowej. Mówiąc inaczej, to psycholog jest kompetentną3 osobą, która może odpo- wiedzialnie posłużyć się testem psychologicznym w praktyce badawczej i — w szczególności! — diagnostycznej. Nie wystarczy bowiem wyuczenie się procedury, znowu nie tak skomplikowanej, stosowania jakiegoś testu oraz kilku „szablono- wych" interpretacji wyniku testowego. Wynik testowy musi być wkomponowany w określoną teorię psychologiczną, która legła u podstaw konstrukcji testu oraz zakreśla ramy interpretacyjne jego wyniku (por. strukturę świadomości metodolo- gicznej — rozdz. 3., pkt. 3.). Co więcej, taki wynik testowy na ogól współwystę- puje z wynikami innych testów psychologicznych czy innych narzędzi pomiaro- wych, a na badaczu (psychologu!) spoczywa obowiązek integracji teoretycznej tych różnych wyników. Użytkownik musi znać ograniczenia formalne danego testu W Standardach... (APA, 1985b, s. 12) czytamy: „kompetencja w przypadku badania testem jest wypadkową wiedzy o zasadach psychometrycznych, wiedzy o charakterze sytuacji badania testem, umiejętności technicznych i po prostu ogólnie — zdrowego rozsądku". -/S/f psychologicznej i teorii psychometrycznej stanowi warunek konieczny sensownego posługiwania się testami psychologicznymi. W sześciu rozdziałach niniejszej części będzie mowa o wybranych zagadnie- niach (wywiedzionych z teorii psychometrycznej) odnoszących się do konstrukcji „prawdziwego" testu psychologicznego oraz formalnej interpretacji jego wyniku. 0 danej teorii psychologicznej, w terminach której formalnie zinterpretowany wy- nik będzie poddany interpretacji, np. klinicznej czy rozwojowej, Czytelnik musi się dowiedzieć ze specjalistycznych opracowań prezentujących określone teorie psy- chologiczne. Zaś o jego profesjonalizmie świadczyć będzie to, jak udatnie połączy on w jedną „całość" obie interpretacje. Wszelkie wątpliwości związane z psychometrycznymi wymogami stawianymi testom Czytelnik będzie mógł rozstrzygnąć sięgając do „biblii" psychometrycznej — Standardów dla testów stosowanych w psychologii i pedagogice (APA, 1985a). Testy psychologiczne definiowane jako: „zbiory pytań lub sytuacje, służące do badania własności jednostek lub grup ludzkich przez wywoływanie u nich okre- ślonych obserwowalnych reakcji werbalnych lub niewerbalnych, będących w miarę możności reprezentatywnymi próbkami ich zachowania się" (Choynowski, 1971b, s. 66) muszą spełniać określone kryteria (APA, 1985a, 1985b). Dwa z nich są podstawowe:4 (a) rzetelność (por. rozdz. 15.), (b) trafność (por. rozdz. 17.). Z rzetelnością testu związany jest: błąd standardowy (por. rozdz. 15., pkt. 3.), który powinien być jak najmniejszy. Od testu wymaga się też, aby był: (c) obiektywny (por. rozdz. 18., pkt. 2.), (d) wystandaryzowany (por. rozdz. 18., pkt. 2., (e) znormalizowany (por. rozdz. 18., pkt. 3.-5.). Pozycje składające się na dany testy musi cechować: moc dyskryminacyjna (wysoka)(por. rozdz. 16.). Badanie przeprowadzone za pomocą jakiegokolwiek testu psychologicznego musi odpowiedzieć na następujące pytania (Choynowski, 1959): (1) Co można powiedzieć o całym, tego samego typu, możliwym zachowaniu się osoby badanej w tym samym czasie? Przykład. Co można powiedzieć o zasobie słownikowym danej osoby, jeżeli podała ona prawidłowe znaczenie 80% słów w teście „Słownik" WAIS-R? (2) Co można powiedzieć o innego typu możliwym zachowaniu się osoby badanej w tym samym czasie? Standardy... (APA, 1985a, s. 8) włączają je do definicji testu psychologicznego: „test jest specyficzną procedurą diagnozowania. Może on być zbiorem zadań lub pytań, które — w standar- dowych warunkach — mają wywoływać określone rodzaje zachowań i dostarczać wyników o pożąda- nych właściwościach psychometrycznych tj. posiadających wysoką rzetelność i trafność" (podkr. — J.D.) Przykład. Co można powiedzieć o zręczności manualnej dziecka, jeżeli bada- nie go testem polegało na nawlekaniu koralików na drut? (3) Co można powiedzieć o przynależności osoby badanej do jakiejś wyróż nionej, za pomocą innego niż wynik testowy kryterium, grupy? Przykład. Czy rzeczywiście osoba badana, zgodnie ze wskazaniem testowego, jest osobą depresyjną, uzdolnioną matematycznie, o wysokiej odporno- ści na stres itp.? (4) Co można powiedzieć o pewnych procesach fizjologicznych zachodzących w organizmie osoby badanej? Przykład. Co można powiedzieć o pobudliwości emocjonalnej osoby badanej, jeżeli obrysowuje ona figurę testową drżącą kreską? (5) Co można powiedzieć o zachowaniu się osoby badanej w przyszłości? Przykład. Co można powiedzieć o przyszłych sukcesach w nauce szkolnej badanego ucznia, jeżeli uzyskał on bardzo wysoki wynik w teście uzdolnień mate- matycznych? 2. Założenia klasycznej teorii rzetelności testów psychologicznych Nie ma nic odkrywczego w stwierdzeniu, że pomiar dokonywany za pomocą ja- kiegokolwiek testu psychologicznego jest obarczony jakimś błędem. Zatem rzetel- ność można potraktować jako miarę dokładności pomiaru dokonywanego za pomocą testu. Im wyższa tedy rzetelność testu, tym większa dokładność, z jaką mierzy on daną zmienną i mniejszy błąd pomiaru. Najbardziej rozpowszechnionym wśród psychometrów i jednocześnie najstarszym modelem psychometrycznym testu, który rozwiązuje problem rzetelności testu jest model, zwany klasycznym, zaproponowany przez Gulliksena (1950). Model ten, mimo upływu wielu już lat i opracowania nowszych, bardziej zaawansowanych od strony formalnej i statystycznej modeli (rekonceptualizacja modelu Gulliksena dokonana przez Lorda i Novicka, 1968; teo- ria wyników generycznych i teoria uniwersalizacji — por. Cronbach i in., 1972; Item Response Theory — por. Lord, 1980; Hulin, Drasgow, Parsons, 1983; model Mokkena, 1971, także: Machowski, 1993) stanowi podstawę wszystkich liczących się w świecie psychologicznym testów, że wspomnę tylko kilka z nich: wechsle- rowskie skale inteligencji, MMPI, ACL, 16 PF, kwestionariusze Eysencka, STAI, kwestionariusze temperamentu Strelaua. Dlatego też, a także dlatego, że nowe modele wymagają dobrej znajomości zaawansowanego aparatu statystyki wielowymiarowej (a to znacznie wykracza poza ramy niniejszego podręcznika, który, przypominam, nie jest monografią psychome- tryczną) ograniczę wykład podstaw psychometrycznych testów psychologicznych do przedstawienia zrębów teorii gulliksenowskiej. Bardziej wnikliwą jej prezentację znajdzie Czytelnik w specjalistycznych pracach dostępnych w języku polskim — 458 por. Magnusson (1991), Nowakowska (1975), Brzeziński (1988), Machowski (1993). Nowakowska (1975) przedstawia też zarys dwóch kolejnych modeli — Lorda i Novicka oraz Cronbacha i in. Przejdźmy zatem do przedstawienia zrębów teorii rzetelności w ujęciu klasy- cznego modelu testów. Podstawowe równanie Gulliksena teorii testów psychologi- cznych mówi, iż na wynik otrzymany (X,) składają się (por. równanie 15.1): (a) wynik prawdziwy (X„), (b) składnik błędu (Xe): Y j. V (15.1) Czym jest, wg Gulliksena, wynik prawdziwy? Otóż jest to „granica, do jakiej zmierza przeciętna wyników /-tej osoby w danej liczbie testów, jeżeli ta liczba testów równoległych (K) wzrasta nieograniczenie" (Gulliksen, 1950, s. 28). Co można zapisać następująco (15.2): g=i lxig = lim ?? (15.2) Według Guilforda (1954, w: Brzeziński, 1988, s. 21) „składnik prawdziwy X„ (inaczej wynik prawdziwy) bywa definiowany w różny sposób. Jednym z nich jest przyjęcie, iż X jest wynikiem osoby badanej otrzymanym w idealnych warunkach lub za pomocą idealnego narzędzia pomiarowego. Innym — że X„ jest średnim wynikiem danej osoby uzyskanym w nieskończenie wielu niezależnych badaniach tym samym testem. Chociaż praktycznie badanie takie nie jest możliwe, to jednak owo potencjalne podejście eksperymentalne dostarcza podstaw do sformułowania quasi-operacyjnej definicji wyniku prawdziwego. Składnik błędu (inaczej: błąd) jest wartością dodatnią lub ujemną będącą funkcją warunków testowania konkretnej osoby w konkretnym badaniu. Źródeł błędu jest wiele i choć niektóre z nich można zidentyfikować, to jednak większość z nich jest nieznanym źródłem zmienności". Taka interpretacja wyniku prawdziwego jako wyniku uzyskanego w idealnych wa- runkach badania za pomocą idealnego narzędzia bliska jest idei operacjonalizacji zmiennych teoretycznych przedstawionej w rozdz. 7. Równanie 15.2 oparte jest na trzech założeniach (Gulliksen, 1950, s. 6-7): Założenie 1. Średnia arytmetyczna błędów wynosi zero (jie= 0). Założenie 2. Korelacja wyniku prawdziwego i składnika błędu jest zerowa (/W = 0). Założenie 3. Korelacja składników błędu dwóch równoległych testów jest ze- rowa (peU2 =0). Ponieważ średnia sumy nieważonych składników równa jest sumie średnich więc i średnia wyników otrzymanych (X,) równa jest średniej wyników prawdzi- wych (X*,), co jest prostą konsekwencją założenia 1.: Oczywiście w przypadku krótkiej serii pomiarów Xe ź 0 i X, (15.3) Po nieważ warianc ja sumy nieważo nych składni ków równa jest sumie warian- cji, o ile składni ki te nie są skorelo wane (a o tym mówi założen ie 2.), a zatem warianc ja otrzyma na (vart) równa jest sumie warianc ji prawdzi wej (var„) i warian- cji błędu (vare): . . . . . v a r , = v a r « , + v a r e . ( 1 5 . 4 ) Rzetelność (r„) jest to stosunek wariancji prawdziwej do wariancji otrzymanej: r„ = vare. (15.5) Z równania 15.4 wiemy, iż: = var, - vare. (15.6) Zatem, po podstawieniu do wzoru (15.5) — w miejsce wyrażenia varx — prawej strony równania (15.6) otrzymamy nowy wzór na r„: r„ - [var, - vare] I vare = 1 - vare I var,. (15.7) Stosując statystyczny model analizy wariancji ANOVA można wyliczyć, na podstawie przebadania danym testem jakiejś grupy osób, wartości vare i var, i, po ich podstawieniu do wzoru (15.7), uzyskać wartość r„. Taką metodykę postępowa- nia przy obliczaniu wartości współczynnika rzetelności zastosował Hoyt a ja oma- wiam ją w pkt. 8.3. Czytelnik zechce zapoznać się z tą metodą. Badacz powinien przestrzegać następującej reguły maksyminowej: var, —> max oraz vare —> min. (15.8) Należy zatem, konstruując test tak postępować, aby jak największą proporcję obserwowanej zmienności wyników testu można było wytłumaczyć w kategoriach różnic indywidualnych, a jak najmniejszą proporcję w kategoriach błędu badacza (ten zaś spowodowany jest m. in. wadliwą konstrukcją testu, np. niejasnością sfor- mułowań pozycji testowych, która prowadzi do różnych odpowiedzi na te pozycje nie dlatego, że mierzona cecha przyjmuje dla nich de facto różne wartości, ale dlatego, że dana pozycja nie jest jednoznacznie rozumiana przez wszystkie osoby badane). Dysponując niezależną metodą empirycznego oszacowania wartości r„ można wyliczyć, po dokonaniu przekształceń, z wzoru (15.7) wartość vare: r„vart = var, - vare, vare = var, - r„var„ vare = var,{\ - r„). (15 9) Jeżeli wyciągniemy pierwiastek z lewej i prawej strony równania (15.9), to otrzymamy wzór na błąd standardowy pomiaru (SEM — ang. standard error of measurement): 460 SEM = SD, (15.10) gdzie: SD, — odchylenie standardowe rozkładu wyników testowych (X,) w badanej próbie; r„ — współczynnik rzetelności testu obliczony jedną z metod opisanych w pkt. 5.-10. niniejszego rozdziału. SEM, mimo że jest najczęściej obliczanym przez psychologów błędem, to nie jest jedynym możliwym do oznaczenia, w ramach klasycznej teorii testów, błędem standardowym. Jest on natomiast stosowany w procedurach estymacji przedziało- wej wartości wyniku prawdziwego, mimo że nie zawsze jest to merytorycznie uzasadnione. Warto tedy, aby psychologowie przystępujący do konstrukcji jakiegoś testu psychologicznego przynajmniej zdawali sobie sprawę z tego, że obliczenie SEM nie wyczerpuje wcale możliwości estymacji wyniku prawdziwego. Różne od- miany błędu standardowego omawiam w następnym punkcie. 3. Odmiany błędu standardowego W praktyce pomiarowej opartej na klasycznej teorii testów (por. równanie 15.1 i 15.4) najczęściej wykorzystywany jest tylko jeden z błędów standardowych, a mianowicie błąd standardowy pomiaru SEM, którego wyprowadzenie przedstawi- łem w pkt. 2. niniejszego rozdziału. Jest on określany wzorem (15.10). Różne odmiany błędu standardowego (oraz wskazanie sensownego ich wykorzystania w praktyce pomiarowej) zostały kompetentnie przedstawione w pracy Machowskiego (1993). Jest to jedyne w polskiej literaturze psychometrycznej opracowanie problemu błędów standardowych. Zauważmy jeszcze, że popularny wykład psychometrii w pracy Magnussona (1991) zawiera omówienie tylko SEM. Prezentując różne rodzaje błędów standardowych i omawiając zakres ich sensownego wykorzystania [w praktyce szacowania wartości Xx opierałem się na monografii Machowskiego (1993, s. 26-37): Rzetelność testów psychologicznych. Dwa ujęcia modelowe. Oma- wia on następujące rodzaje błędów standardowych: (1) błąd pomiaru wyniku otrzymanego, (2) błąd estymacji wyniku prawdziwego, (3) błąd pomiaru wyniku prawdziwego, (4) błąd prognozy, (5) błąd zastąpienia. 3.1. Błąd pomiaru wyniku otrzymanego Ten rodzaj błędu został przedstawiony w pkt. 2. i określony jest wzorem (15.10) | a SEM jest definiowany jako odchylenie standardowe rozkładu różnic: X, - X„a. 461 3.2. Błąd estymacji wyniku prawdziwego Estymacji wyniku prawdziwego dokonuje się wg wzoru (15.11): 1 -- ,1 ,SJ«,.injf (15.11) Błąd estymacji wyniku prawdziwego SEE dany jest wzorem (15.12): SEE = ^, SEM, (15.12)1 gdzie: SEM — błąd pomiaru wyniku otrzymanego dany wzorem (15.10). SEE jest różnicą między estymowaną przez badacza wartością wyniku pra- wdziwego a jego rzeczywistą wartością: ,X'«, -XJ\ Jest to błąd powstały na skutek niedokładności odtworzenia faktycznej wartości wyniku prawdziwego. SEE jest od- chyleniem standardowym rozkładu z próby różnicy ,^C'O.-XOO". 3.3. Błąd pomiaru wyniku prawdziwego Dokonując pomiaru testowego uzyskujemy określone wartości wyniku otrzymanego (Xt). Na tej podstawie możemy dokonywać estymacji wartości wyników prawdzi- wych (X„). W rzeczywistości jest jednak tak, że osoby o identycznych wynikach prawdziwych (X*oo) mogą otrzymywać różne estymowane wyniki prawdziwe (X'„), gdyż uzyskały one różne wyniki otrzymane (X,). Owa rozbieżność zachodząca między estymowanymi wynikami prawdziwymi (X'aa) uzyskanymi przez osoby o identycznych wynikach prawdziwych (X*oo), to właśnie błąd pomiaru wyniku pra- wdziwego SEM„ (15.13): m r„SEM, (15.13) gdzie: SEM — błąd pomiaru wyniku otrzymanego dany wzorem (15.10). SEM„ jest odchyleniem standardowym rozkładu z próby różnic: ,JC'„-X*J X*«,k to &-ta średnia estymowanych wyników prawdziwych osób badanych, które uzyskały ten sam wynik prawdziwy. Między tymi dwoma wynikami zachodzi na- stepujący związek: X*„ = r„Xx + (1 - r„)Xt. (15.14) 3.4. Błąd prognozy SEP związany jest z formułowaniem prognozy wyniku testu równoległego (X*,) na podstawie wyniku danego testu (^T,). Ten błąd, to różnica owych dwóch wyników: ,jrt - x*,". SEP dany jest wzorem (15.15): 462 (15.15) gdzie: SEM — błąd standardowy pomiaru wyniku otrzymanego dany wzorem (15.10). 3.5. Błąd zastąpienia Z błędem zastąpienia SES mamy do czynienia wówczas, gdy dokonując prognozy wyniku otrzymanego w jednym teście równoległym na podstawie wyniku otrzyma- nego w drugim teście zakładamy, że wynik w teście równoległym (Xrt) jest równy wynikowi w drugim teście (X,). SES jest więc różnicą: ,JC, - Xr". Jest on odchyle- niem standardowym rozkładu z próby owych różnic (15.16): SES = SEM^l , (15.16) gdzie: SEM — błąd standardowy pomiaru wyniku otrzymanego dany wzorem (15.10). 3.6. Analiza porównawcza błędów Czytelnik zechce zapewne zadać teraz pytanie o konkretne sytuacje, w których sensowne jest oparcie się na wartości danego błędu przy szacowaniu wartości wy- niku prawdziwego. Już na pierwszy rzut oka widać, że w zależności od przyjętego błędu otrzymamy różne wartości oszacowania wyniku prawdziwego. Rzecz jasna, w warunkach idealnych wszystkie błędy są sobie równe i mają tę samą wartość, tzn. zero. Przeprowadzona przez Machowskiego (1993, s. 33-36) symulacja pokazała, że w sytuacji gdy r„< 1,0 błędy można uporządkować wg ich wielkości (15.17): SEM„ < SEE < SEM < SEP < SES. (15.17) Trzy błędy: SEM, SEP i SES monotonicznie rosną w miarę spadku wartości współczynnika r„. Pozostałe dwa zachowują się dość osobliwie. Początkowo, wraz ze spadkiem rzetelności testu do wartości r„ = 0,5, SEE wzrasta i przyjmuje naj- większą wartość dla r„ = 0,5. Następnie także i jego wartość spada wraz ze spad- kiem rzetelności testu. W przypadku błędu SEMX ten punkt przegięcia znajduje się w r„ = 0,6 - 0,7. Przeprowadzona symulacja pokazała także, że: „podział testów na «gorsze», tj. o rzetelności mniejszej niż 0,5 i «lepsze», tj. o rzetelności większej niż 0,5, nie opiera się na przypisywaniu jakiegoś magicznego znaczenia wartości rzetelności wynoszącej akurat połowę maksymalnej wartości, ale że ów podział ma bardzo dobre uzasadnienie teoretyczne i jest ważny z praktycznego punktu widze- nia (...) Z tych powodów rzetelność równa 0,5 powinna być traktowana jako dolna dopuszczalna granica rzetelności" (Machowski, 1993, s. 36). 463 Wybór właściwego błędu ma wpływ na dokładność przedziałowej estymacji wyniku prawdziwego — o czym traktuje następny punkt. 3.7. Punktowa i przedziałowa estymacja wyniku prawdziwego Psycholog może skorzystać z dwóch metod estymacji wyniku prawdziwego: (a) estymacja punktowa, (b) estymacja przedziałowa. Estymacja punktowa przeprowadzona jest z wykorzystaniem modelu regresji liniowej. Aby dokonać takiej estymacji niezbędna jest znajomość trzech elementów: wyniku otrzymanego w teście (X,), współczynnika rzetelności testu (r„), średniej wyników otrzymanych w teście z próby (X,) (por. Choynowski, 1971b, s. 111): . = X, + r„(X,-Xt) = raXt + (1 - r„)Xt. (15.18) Zauważmy, że w przypadku testu o idealnej rzetelności, tj. gdy r„=l,0, X'x = X,. Także wariancja prawdziwa będzie równa wariancji otrzymanej. Z kolei w przypadku testu idealnie nierzetelnego, tj. gdy r„ = 0,0, X'„ = X„ a wariancja prawdziwa będzie równa zero. Gdy 0,0, (15.19) gdzie: Za/2 — wartość statystyki z rozkładu normalnego dla danego poziomu ufności (l-cr)100%. I tak, np. dla cr=0,05 mamy 95% przedział ufności o Zo,o5/2 = 1,96. SEM dany jest wzorem 15.10. Tę metodę budowania przedziału ufności wykorzy- stano w rozdz. 19. pkt. 3. w procesie analizy intraprofilowej. Przedział ufności symetryczny wokół estymowanego wyniku prawdziwego Jego konstrukcja jest następująca: - zd2SEE; zd2SEE >, (15.20) ponieważ (por. 15.11): cić we wzór (15.21): f'„, = rttX,+ (1 - r„)X„ więc wzór (15.20) można przekształ- _ X»6< rrfX, + (1 - r„)X, - z^SfE; r„X, + (1 - r„)X, + Za/2SEE >. (15.21) Budowę przedziału ufności wg wzoru (15.21) zaleca się (np. Machowski, 1993, s. 37) dla wyników testów o r„ > 0,5. Czy popełnia się duże „przestępstwo" odstępując od budowania przedziału ufności wg wzoru (15.21)? Zdaniem Choynowskiego (1971b, s. 112) — nie. We- dług niego bowiem: „ściśle rzecz biorąc, do estymacji przedziału powinniśmy sto- sować nie błąd standardowy pomiaru sB (w naszej terminologii: SEM — przyp. J.B.) lecz błąd standardowy estymacji sE (w naszej terminologii: SEE — przyp. J.B.), wszakże nie czynimy tego, aby uniknąć skomplikowania nie mającego wiel- kiego znaczenia praktycznego, gdyż różnica liczbowa między tymi dwoma błędami nie jest duża". Ta różnica wyraża się wzorem (15.22): SiFF — fFM ^fr~ fK W Choynowski (1971b, s. 112) obliczył 95% przedział ufności dla Skali Neu- rotyczności kwestionariusza MPI Eysencka (A-„ = 0,88; SEM = 4; X,= 24,3>\, X,= 30). Przedział ufności, symetryczny względem wyniku otrzymanego, wynosił od 22 do 37 pkt.; przedział ufności, symetryczny względem estymowanego wyniku praw- dziwego, wynosił od 22 do 38 pkt. Jak widać różnica była nieznaczna. Jest ona tym mniejsza, im mniej wyniki otrzymane odbiegają od średniej. Na co zwracamy uwagę przy budowaniu przedziału ufności? Przede wszy- stkim, na poziom ufności. Im bardziej jest on „wyśrubowany", tym bardziej wzrasta nasza pewność (ufność), że zbudowany przedział (symetrycznie wokół albo wyniku otrzymanego, por. wzór 15.20, albo wyniku prawdziwego, por. wzór 15.21) będzie ) — Metodologia badań.. pokrywał nie znaną, a poszukiwaną przez nas wartość wyniku prawdziwej „Decydują" o tym wyrażenia: ,z„nSEM" we wzorze 15.20 i ,?anSEE'1 we wz 15.22. Jeżeli bowiem przejdziemy od wyższego poziomu ufności P = 85% (zo,i5/2 = 1,44) do niższego P-99% (ZQI01/2 = 2,58), to granice przedziału wydłużą się, gdyż stałą wartość błędu standardowego będziemy przemnażać — przy obliczaniu wartości jego dolnej i górnej granicy — nie przez 1,44, ale przez 2,58. Zatem ceną, jaką musimy „zapłacić" za wzrost pewności jest spadek precyzji estymacji (zamiast „krótkiego" otrzymujemy „długi" przedział ufności). Z kolei, gdy chcemy uzyskać precyzyjniejszą estymację wyniku prawdziwego (krótszy przedział ufności), to mu simy wstawić do wzoru na przedział ufności wartość Zaii jak najniższą — zamiast z = 2,58 dla P = 99%, wartość z = 1,0 dla P = 68%. Jednak co z tego, że będziemy dysponowali krótkim przedziałem ufności, dającym precyzyjną estymację wyniku prawdziwego, gdy zaufanie do uzyskanego wyniku jest niskie? No cóż, badacz musi znaleźć złoty środek między precyzją estymacji i stopniem zaufania do niej. Nie można podać jednej prostej reguły postępowania. Można jednak sformułować w miarę ogólną dyrektywę. Może ona brzmieć następująco: jeżeli wynik prowa- dzonego badania nie będzie miał groźnych dla osoby badanej następstw lub gdy prowadzone przez nas badania mają charakter pilotażowy, to wybierajmy krótsze przedziały ufności (oparte na niskich wartościach statystyki Zaa)- Jeżeli zdecydujemy się — w takich sytuacjach badawczych, które nie są groźne w ewentualne przykre konsekwencje dla osoby badanej — na wybór pozio- mu ufności (rekomendowanego przez np. Choynowskiego, 1971, s. 111) P = 68%, to zbudowanie przedziału ufności sprowadzi się do prostej operacji odjęcia i dodania do wyniku otrzymanego wartości błędu standardowego, gdyż 20,32/2= 1.0. Interpretacja przedziału ufności jest bardzo prosta. Mówimy, że przedział ufności obejmuje (zawiera w sobie), z prawdopodobieństwem 1-a, szacowany wynik prawdziwy testu. Ręko mendowane przez statystyków i psychometrów poziomy ufności 1-a, to: 0,68 (z = 1.0); 0,85 (z = 1,44); 0,90 (z = 1,64); 0,95 (z = 1,96); 0,99 (z = 2,58); 0,999 (z = 3,29) (Greń, 1987, s. 302; Choynowski, 1971, s. 111; Brzeziński, Gaul, 1993, s. 112). Przytoczmy jeszcze, na koniec, zalecenie Standardów... (1985a, s.80): standard J.2.2. „Interpretując wyniki testowe trzeba brać pod uwagę raczej ich przedziały ufności niż ich wartości absolutne". 4. Sześć empirycznych metod estymacji rzetelności testu psychologicznego Wyróżniam sześć empirycznych metod estymacji rzetelności testu psychologiczne- go (co obejmuje, z grubsza, metody wymieniane w opracowaniach z zakresu psy- chometrii, np. Guilford, 1954; APA, 1985a, 1985b; Nunnally, 1978; Magnusson, 1991; Choynowski, 1971). Metodom tym poświęcone są punkty 5.-10. niniejszego rozdziału. 466 Stosunkowo najwięcej miejsca przeznaczam na omówienie metody wykorzy- stującej statystyczny model analizy wariancji ANOVA, gdyż uważam (podobnie: Winer, 1971; Machowski, 1993 czy Cronbach i in., 1972), iż umożliwia ona do- konanie najpełniejszego wglądu we właściwości statystyczne samego testu, jak i je- go „składowych" czyli poszczególnych pozycji (ang. items). Powszechna (prawie) dostępność do łatwego w użyciu oprogramowania komputerowego przeznaczonego dla komputerów osobistych klasy IBM sprawia, że metodę tę można spokojnie rekomendować każdemu psychologowi, który posiadł umiejętność korzystania z jakiegoś pakietu statystycznego, np. SPSS PC+. Sześć wspomnianych metod to: 1. Metody oparte na porównaniu dwukrotnych badań tym samym testem (ang. test-retest reliability). Te metody są bardzo zawodne (na co zwracali już uwagę: Kreutz, 1962 czy Nowakowska, 1975), gdyż trudno (o ile w ogóle jest to możliwe) spełnić założenie o „równoległości" warunków badania „testu" i „retestu". 2. Metody oparte na porównaniu form alternatywnych (równoległych) testu (ang. alternate-forms method; parallel-tests method; equivalent forms method). 3. Metody oparte na porównaniu części (połówek itp.) tego samego testu (ang. split-half reliability). Najczęściej połówki tworzy się w ten sposób, iż jedna składa się z pozycji testowych o numeracji nieparzystej (1, 3, 5, ...; ang. odd-numbered test items), a druga z pozycji testowych o numeracji parzystej (2, 4, 6, ...; ang. even-numbered test items) — stąd inna, skrótowa, angielska nazwa tej metody: odd-even reliability. 4. Metody oparte na analizie właściwości statystycznych pozycji testowych (ang. internal reliability). W tej bardzo rozbudowanej grupie metod mieści się metoda Cronbacha (er), ale także metoda Kudera i Richardsona (wzory: K-R 20. i K-R 21.), Hoyta, Winera, Brzezińskiego. Oczywiście nie są to metody całkowicie równoległe, mimo że zali- czone do tej samej grupy metod. W zależności od charakteru testu należy dobrać najbardziej odpowiednią (w sensie spełniania przez dane testowe i warunki stoso- wania testu odpowiednich założeń, np. testy szybkości versus testy mocy) metodę. Osobiście polecam z tej grupy metod: metodę Winera (Winer, 1971) czy własną (por. Brzeziński, 1984b; także Machowski, 1993). 5. Metody oparte na analizie związku pozycji testowych z ogólnym wynikiem testu. W tej grupie metod godna polecenia jest metoda Spearmana-Browna. Oczy- wiście, dane narzędzie z założenia traktowane jest jako jednorodne, np. czynniko- wo. 6. Grupa metod oparta na badaniu stopnia zgodności sędziów kompetentnych oceniających odpowiedzi testowe. Polecam dwie metody z tej grupy: współczynnik zgodności sędziów W-Ken- dalla oraz metodę analizy wariancji (por. Brzeziński, Maruszewski, 1978a). Tyle, jeśli chodzi o, w pewien sposób usystematyzowany, przegląd metod badania rzetelności testu. 30* 467 Me ma jednej, uniwersalnej metody estymacji współczynnika rzetelności, któ- ra zawsze będzie odpowiednia. Pogłębione badanie rzetelności testu wymaga za- stosowania kilku, wzajemnie się uzupełniających metod (podobnie jak badanie traf- ności). Chciałbym jeszcze zaznaczyć, że to, co będę tu pisał na temat metod estymacji rzetelności testu odnosić się będzie do tzw. klasycznego modelu testu Gulliksena, o którym pisałem w pkt. 2. i 3. niniejszego rozdziału. Zatem, aby zbadać rzetelność jakiegoś testu nie wystarczy wprowadzić uzy- skanych z badania próby standaryzacyjnej wyników do komputera i dostępnym programem psychometrycznym obliczyć wartość dowolnego, dostępnego w opro- gramowaniu współczynnika (w przypadku SPSS PC+ jest to współczynnik Cron- bacha). 5. Metody oparte na porównaniu dwukrotnego badania tym samym testem Dwukrotne przeprowadzenie badania tej samej grupy osób tym samym testem na- leży do najbardziej rozpowszechnionych metod badania jego rzetelności. Badanie może być przeprowadzone na dwa sposoby: (a) między badaniem pierwszym (test) oraz drugim (retest) — stąd popularna nazwa metody: test-retest — mija jakiś czas (procedura nie przewiduje określone go, standardowego odstępu czasu), np. 1 tydzień; (b) badanie drugie następuje zaraz po zakończeniu badania pierwszego. W pierwszym przypadku mówimy o estymacji stabilności bezwzględnej testu (używana jest też nazwa - stałość testu), zaś w drugim (np. Choynowski, 197 lb, s. 84) o estymacji wiarygodności testu. Badanie wiarygodności testu cechuje w zasadzie więcej wad, aniżeli zalet. Dlatego nie jest on nazbyt często stosowaną miarą rzetelności. W pełni tedy zga- dzam się z dokonaną przez Choynowskiego (tamże, s. 89) oceną tej metody: „na wariancję błędu przy dwukrotnym badaniu raz po raz w ciągu tej samej sesji skła- dają się przede wszystkim chwilowe oscylacje funkcji, wszakże nie można całko- wicie pominąć stanu organizmu, niewątpliwie bowiem należy się liczyć z takimi czynnikami, jak pamięć poprzedniego badania i nabyta przy nim wprawa (które zresztą w różnych testach grają różną rolę), a także zapewne zmęczenie lub zmiany w motywacji (nie mówiąc o losowej reszcie błędu)". Tą metodą badania rzetelności testu możemy się posłużyć, gdy jesteśmy pewni, że czynnik pamięci nie miał wpły- wu na wyniki retestu, np. w badaniu czasu reakcji jako wskaźnika wykonania testu. Generalnie rzecz biorąc, nie polecam tej metody badania rzetelności testu, a oma- wiam ją tutaj tylko dlatego, że jeszcze spotyka się opracowania testów, w których właśnie w ten sposób badano rzetelność. Jako miarę wiarygodności testu przyjmuje się współczynnik korelacji dwóch 468 zbiorów wyników, pochodzących z dwukrotnego (test i retest) badania tej samej grupy osób. Badanie stabilności bezwzględnej (inaczej stałości) testu przypomina badanie jego wiarygodności. Jedyna różnica związana jest z przerwą, która dzieli pierwsze badanie (test) od drugiego (retest). Jest to też najpoważniejsze źródło kłopotów metodologicznych. Otóż nie określono jednolitych wymagań co do długości przer- wy oddzielającej jedno badanie od drugiego. Musimy sobie zdawać sprawę z tego, że im krótszy będzie ten odcinek czasu, tym wyższego należy się spodziewać współczynnika korelacji między dwoma zbiorami wyników. Będzie to szczególnie drastycznie widoczne w tych testach, w których dużą rolę odgrywa czynnik pamię- ci, np. w teście „Wiadomości" WAIS-R. Załóżmy, że w teście tym znajduje się pozycja (której tak naprawdę w tym teście nie ma!) o następującej treści: „W któ- rym roku Cronbach opublikował artykuł na temat współczynnika rzetelności ar?" Przeciętny student psychologii badany tym testem zapewne nie odpowie na to py- tanie. Ale, dręczony swą niewiedzą, po powrocie do domu zajrzy do podręcznika psychometrii, albo do niniejszego podręcznika i dowie się, że chodzi o rok 1951. Zapytany o to samo w trakcie powtórnego badania, odpowie prawidłowo, jeżeli badanie to będzie miało miejsce po upływie niezbyt długiego czasu (np. 2 tygodni) od badania pierwszego. Być może znowu na nie nie odpowie, jeżeli badania dzieliła dłuższa przerwa, np. 2 miesiące. Ponadto niebagatelną rolę odgrywają tu różnice indywidualne w zakresie pamięci osób badanych. Ale co to za metoda (naukowa!), jeżeli zależna jest od dwóch czynników subiektywnych: (a) czynnika związanego z osobą badacza — bo to badacz decyduje kiedy powtórzyć badanie i (b) czynnika związanego z osobą badaną — bo to stan pamięci osoby badanej także wpływa na wysokość wyniku ogólnego drugiego badania. W grę wchodzi jeszcze trzeci czyn- nik zakłócający związany z niemożnością pełnego odtworzenia warunków, w któ- rych przebiegało pierwsze badanie. Zgadzam się tedy z tym, co pisze Nowakowska (1975, s. 38): „...możliwy wpływ różnych czynników ubocznych, takich jak zapa- miętywanie, uczenie się, ewentualne różnice w warunkach badania itp. stawiają pod znakiem zapytania adekwatność założenia równoległości". I jeszcze jedna opinia na temat tej metody (APA, 1985a, s. 58-59): „Ograniczenia natury praktycznej oraz teoretycznej sprawiają, że nie jest to pożądana technika oceniania rzetelności. Dzieje się tak dlatego, że badani odpowiadając po raz drugi mogą pamiętać swoje poprzednie odpowiedzi. W ten sposób pamięć staje się systematycznym źródłem wariancji. W efekcie korelacja między dwoma zbiorami wyników może okazać się wyższa niż korelacja dwóch zbiorów wyników otrzymanych dzięki użyciu paralel- nych wersji testu (...) w technice test-retest na uzyskany rezultat wpływa nie tylko zmienność wynikająca z losowego odpowiadania i zmian w cechach i funkcjach osób badanych, lecz również różnice w badaniu testem (zwłaszcza wprowadzone przez różne osoby badające za pierwszym i drugim razem)". 469 6. Metody oparte na porównaniu form alternatywnych (równoległych) testu Jeżeli psycholog, konstruujący test i badający jego rzetelność, nie jest w stanie dopełnić warunku równoległości testu i retestu — z powodów wyłożonych w po- przednim punkcie — to może on postąpić inaczej, a mianowicie może skonstruo- wać dwa identyczne testy. Określa się je mianem testów równoległych, paralelnych (ang. parallel tests, alternate forms of test). Jakie testy możemy określić mianem testów równoległych? Otóż takie, które spełniają następujące kryteria (Gulliksen, 1950; Guilford, 1954): (a) równość średnich wyników badania jednym i drugim testem, (b) równość wariancji, (c) równość interkorelacji pozycji każdego z obu testów. Dodatkowo należałoby wprowadzić jeszcze jedno kryterium (Yaremko i in., 1982, s. 169) — (d) tej samej korelacji wyniku ogólnego z kryterium zewnętrznym (aspekt trafności). Zdaniem Gulliksena, dla określenia równoległości testów najle- piej wyjść od trzech form równoległych i w wyniku przeprowadzonych analiz (zwłaszcza analiz trzech par macierzy interkorelacji — AB, AC, BC) wybrać dwie najbardziej równoległe formy tego samego testu. Technika badania rzetelności przypomina bądź badanie wiarygodności testu (badanie drugą formą testu następuje bezpośrednio po badaniu pierwszą formą), bądź badanie stabilności bezwzględnej testu (badanie drugą formą testu oddziela od badania formą pierwszą pewien czas). Łączy zatem badanie prowadzone za pomocą form równoległych cechy badania wiarygodności i stabilności bezwzględ- nej. Choynowski (1971b, s. 96) określa tę metodę estymacji rzetelności testu mia- nem stabilności bezwzględnej. Zauważmy, że w przypadku badania rzetelności me- todą testów równoległych badacz musi uwzględnić dodatkowe źródło wariancji, którego nie musiał brać pod uwagę, gdy badał wiarygodność lub stabilność bez- względną testu. To dodatkowe źródło wariancji związane jest z treścią pozycji, która przecież nie jest identyczna w obu testach. W efekcie nie można oczekiwać, że testy te będą dawały identyczne wyniki prawdziwe. Tak naprawdę, to pozycje do obu wersji powinny być niezależnie wylosowane z jakiejś dużej populacji po- zycji, a tego przecież na ogół psychologowie nie robią. Autorzy Standardów... (APA, 1985a, s. 63) wyraźnie akcentują: „...jeżeli jednak zastosuje się (w miejsce techniki losowania pozycji — przyp. J.B.) technikę dopasowywania pozycji do pozycji lub jeśli druga forma będzie tworzona jedynie przez zmianę frazeologii (stylu) pierwszej, to otrzymane podobieństwo między formami testu będzie w spo- sób sztuczny zawyżone. Współczynnik rzetelności tak tworzonych form będzie również zawyżony, ponieważ nie będzie uwzględniał błędu wynikającego z loso- wania pozycji z uniwersum pozycji testowych". Badanie stabilności względnej prowadzi do ustalenia dolnej granicy rzetelności testu. Współczynnik r„ ustalony tą metodą będzie najniższy z wszystkich możli- wych do ustalenia, za pomocą innych metod, współczynników rzetelności. Jest to więc —jak pisze Choynowski (1971b, s. 97) — „metoda najostrożniejsza". 470 7. Metody oparte na porównaniu części (np. połówek) tego samego testu Test można podzielić na pewną liczbę części. W skrajnych przypadkach będą to: (a) dwie części — inaczej: połówki, (b) n części — inaczej: pojedyncze pozycje testu. Szczególną uwagę psychometrów zwrócił podział na dwie części, a metoda obliczania rzetelności na podstawie oddzielnego badania wpierw jedną połówką testu, a zaraz potem drugą nosi nazwę metody połówkowej (ang. split-half relia- bility). Współczynnik korelacji między wynikami obu połówek testu nosi nazwę współczynnika równoważności międzypołówkowej (Choynowski, 1971b, s. 97). Nie każdy jednak podział na połówki spełnia kryteria metody. Dobry podział, to taki, który gwarantuje włączenie do każdej połówki pozycji jak najbardziej do siebie podobnych nie tylko pod względem parametrów statystycznych (takich jak trudność, wariancja), ale także równoważnych pod względem treściowym. Połówki zaś traktowane są tak, jak testy równoległe opisane w poprzednim punkcie. Nie można tedy tą metodą obliczać współczynnika rzetelności testów szybkości5, gdyż nie wszystkie osoby badane odpowiedzą, przy założonym limicie czasu, na tę samą liczbę pozycji. W macierzy wyników testowych będą puste pola, odpowiadające pozycjom testu nie rozwiązanym przez osoby badane. Można tedy badać nią jedy- nie rzetelność testów mocy. Nie można też tą metodą posłużyć się wówczas, gdy test nie jest pod względem treściowym testem homogenicznym. Najbardziej znanym sposobem przepołowiania testu jest, po uporządkowaniu pozycji wg stopnia ich trudności, wyodrębnienie podzbioru pozycji o numeracji nieparzystej (1, 3, 5, 7, itd.) oraz podzbioru pozycji o numeracji parzystej (2, 4, 6, 8, itd.). Stąd wzięła się angielska nazwa metody — odd-even reliability. Jeżeli pozycje nie są jednolite pod względem treściowym — test jest heterogeniczny — to pozycje porządkujemy parami, kierując się trudnością i treścią pozycji zaliczo- nych do tej samej pary. Zwracam uwagę Czytelnika, iż nie wolno przepołowiać testu w ten sposób, osoba badana najpierw odpowiada na pierwsze 50% pozycji, a następnie na drugie 50% pozycji. Nie można tak postąpić, gdyż w pierwszej połowie mogą się znaleźć pozycje o niższej trudności, aniżeli w drugiej połowie. Podział testu na dwie połówki: pierwsze 50% i drugie 50% pozycji stosuje się tylko wówczas, gdy mamy do czynienia z testami mocy. Wtedy, tak pojęte połówki traktujemy jako bne testy i badamy nimi, z zachowaniem tego samego limitu czasu rozwiązania tu, raz po razie daną grupę osób. Przyjęło się rozróżniać testy szybkości (ang. speed tests), z wprowadzonym limitem czasu na 'konanie testu, oraz testy mocy czy wydolności (ang. power tests), bez ograniczeń czasowych. Po dokonaniu podziału testu na dwie połówki, np. parzyste-nieparzyste, postę- ijemy w następujący sposób: 471 (a) obliczamy współczynnik korelacji między wynikami ogólnymi obu testów „połówkowych", (b) dokonujemy oszacowania rzetelności testu korzystając ze wzoru Spearma- na-Browna (15.23): r« = - +rn (15.23) gdzie: roe — współczynnik korelacji wyników dwóch połówek: nieparzystej (o) parzystej (e). Rulon (1939; por. Magnusson, 1991, s. 165) przy podziale pozycji testu na dwie połówki — parzystą i nieparzystą — nie założył równości wariancji w oby- dwu połówkach. Przyjął on, że wariancja rozkładu różnic wyników ogólnych obu połówek (vard) stanowi podstawę do dokonania oszacowania rzetelności całego testu (15.24): r„ = 1 - vard lvarc, (15.24) gdzie: vard — wariancja rozkładu różnic w wynikach ogólnych, jednej i drugiej połówki, obliczanych dla poszczególnych osób badanych: dj = XOi-Xei; i= l,...,N\ varc — wariancja rozkładu wyników w całym teście X (X — Xo + Xe). Czasem wygodniej posłużyć się modyfikacją wzoru Rulona (15.25): N 14 Nvarc (15.25) gdzie: N — liczba osób w próbie; dt — różnica wyników ogólnych i-tej osoby badanej w nieparzystej i parzystej połówce testu; varc — wariancja rozkładu wy- ników w całym teście X (X = XO + Xe). Inny wzór na współczynnik rzetelności podał Guttman (1945; por. Choyno- wski, 1971b, s. rn = varo + vare — C (15.26) gdzie: varo, vare — wariancje rozkładu wyników w obu połówkach; varc — wa- riancja rozkładu wyników w całym teście X (X = Xo + Xe). Według Cronbacha (1951), który dokonał analizy 5 wzorów na współczynnik r„ liczony metodą połówkową, wzory: Rulona oraz Guttmana dają najlepsze osza- cowanie rzetelności testu. 472 8. Metody oparte na analizie właściwości statystycznych pozycji testowych Metody opisane w tym oraz w następnym punkcie są, z uwagi na swą prostotę, brak uciążliwości związanej bądź z dwukrotnym badaniem tym samym testem, bądź z koniecznością konstruowania dwóch testów (równoległych), a także z po- wodu swojej formalnej elegancji, chętnie stosowane przez psychometrów. Mało tego, bywa, że ograniczają oni badanie rzetelności testu tylko do wyboru jednej z metod spośród opisanej niżej bardzo licznej grupy różnych wzorów. Za pomocą metod analizujących właściwości statystyczne pozycji testowych i ich związek z ogólnym wynikiem testu bada się zgodność wewnętrzną testu (ang. internat consistency) czyli stopień w jakim „...test jest czystą miarą mierzonej zmiennej i w jakim stopniu odpowiedzi na poszczególne pytania mierzą to samo co wynik w całym teście" (Choynowski, 1971b, s. 103). Od czego zależy wysokość współczynnika wewnętrznej zgodności testu? Na to pytanie odpowiada Guilford (1964, s. 461): „...gdy 1. Korelacje między zadaniami są największe. 2. Wariancja zadań jest największa; jest ona największa wówczas, gdy proporcja tych, którzy rozwiązali zadanie, wynosi 0,50. 3. Zadania są jednakowej trudności; wówczas korelacje między zadaniami są największe". Standardy... (APA, 1985a, s. 63) zalecają obliczanie współczynnika zgodności wewnętrznej dla każdego testu (oczywiście nie dla testów szybkości), ale jedno- cześnie ich autorzy przestrzegają psychologa: „...miar zgodności wewnętrznej nie należy traktować jako substytutów innych typów miar". 8.1. Wzory K-R 20 i K-R 21 Kudera i Richardsona W latach trzydziestych Kuder i Richardson (por. Kuder, Richardson, 1937) opra- cowali serię wzorów pozwalających na oszacowanie rzetelności testu na podstawie właściwości statystycznych poszczególnych pozycji, z których składa się test. Pun- ktem wyjścia do konstrukcji nowych wzorów była krytyka, której poddali oni, opisaną w pkt. 7., metodę połówkową. Aby uzyskać połówki testu, można go, jak wiadomo, podzielić na wiele spo- sobów. Każdy taki podział na połówki daje inne oszacowanie rzetelności testu. Aby tego uniknąć, Kuder i Richardson zaproponowali podział testu składającego się z « pozycji (zadań) na ...n części (zatem, jedna jego część, to jedna pozycja). Pod- stawowym założeniem, na którym opiera się pomysł jest założenie o równoległości ozycji testowych. Mówiąc inaczej, przyjmuje się, że pozycje są jednolite czynni- kowo. Dla pozycji ocenianych 0 lub 1 i o równej trudności, tzn. gdy frakcja od- powiedzi zgodnych z kluczem (p) równa jest frakcji odpowiedzi z kluczem nie- godnych (q) uzyskujemy maksymalną wartość wariancji /-tej pozycji testowej: vart=pfo; q,?.= 1 - p,?. (15.27) 473 Nietrudno zauważyć, iż wariancja pozycji jest największa, gdy /?, = qt = 0,50 (gdyż: 0,50x0,50 = 0,25). Najbardziej znane wzory opracowane przez tę dwójkę psychometrów to KR 20 oraz K-R 21. Oto one: wzór K-R 20: " 2 (15.28) n-\ -oq \ w-$i8 & <'rtjvfi,ij!ofr* r = " r" n- wzór KR 21: n varc- npq varc (15.29) gdzie: varc — wariancja całkowita wyników całego testu; p,q, — wariancja /-tej pozycji testu; n — liczba pozycji w teście; p — średnia wartość p w zbiorze n pozycji testu; q — średnia wartość q w zbiorze n pozycji testu. J w M> Wzór K-R 21 znajduje zastosowanie w sytuacji, gdy psycholog nie zna stopnia trudności poszczególnych, składających się na dany test, pozycji testowych. Jeżeli zaś możemy przyjąć, iż trudność poszczególnych pozycji jest do siebie zbliżona, n to wówczas wyrażenie ze wzoru (15.28): „^ pt q" możemy zastąpić wyrażeniem: ,/ip ~q". Dokonując niewielkich przekształceń we wzorze K-R 21 możemy otrzymać jego wygodną do obliczeń postać (15.30): . - - » nvarc-Mdn-Mc)^ ^ ^ n-1 (n- \)varc - - -' '? -A i OL 5U* riojW 1 gdzie: MC = XA. * - .. « . MŁr>< -.' v " , .c -pirio tCf '=1 Jakie są słabości K-R 20, albo mówiąc inaczej, jakie odstępstwa od wyjścio- wych założeń mają zauważalny wpływ na dokładność obliczonego tą metodą współczynnika r„? Na to pytanie usiłował odpowiedzieć Brogden (1946; podaję za: Guilford, 1954, s. 383). Manipulując średnimi wartościami p (od 0,3 do 0,97), wartościami interkorelacji pozycji testowych (od 0,2 do 0,8) oraz liczbą pozycji w teście (od 9 do 153) i zakładając jedną z trzech postaci rozkładu p — rozkład normalny, rozkład prostokątny oraz rozkład skośny — Brogden doszedł do wnio- sku, iż metoda ta daje obciążone wartości r„ w przypadku testów krótkich (9-18 pozycji) i o wysokich interkorelacjach pozycji testowych (0,60-0,0,80). Guilford podkreśla, że nie powinno się stosować, ani K-R 20, ani K-R 21 w przypadku badania z ograniczeniem czasu (testy szybkości). Kuder i Richardson opracowali swoje wzory dla testów o pozycjach punkto- wanych „0-1". Ferguson (1951) zaadaptował wzór K-R 20 do pozycji m-kategorial- n nych. W miejsce wyrażenia V px ql we wzorze (15.28) zaproponował on wstawię- 474 nie nowego wyrażenia, uwzględniającego ważenie odpowiedzi, np. „+1", „0", „-1" czy „0", „1", „2", „3", „4". Wariancję /-tej pozycji w teście, wymagającej udzie- lenia przez osobę badaną jednej z m kategorii odpowiedzi, Ferguson proponuje obliczać wg wzoru (15.31): m m Po zsumowaniu wszystkich n wariancji pozycji testowych otrzymaną sumę wstawia się do wzoru (15.28) w miejsce wyrażenia y^P.tfi"- / = i Dla stosunkowo często używanych testów składających się z pozycji trójkate- gorialnych (tak — „1", nie wiem — „0", nie — „-1") wzór (15.31) przyjmuje uproszczoną postać (15.32): vari=p2-p21 + 4pip3, (15.32) gdzie: px — proporcja osób, które udzieliły odpowiedzi o wadze „+1"; p2 — pro- porcja osób, które udzieliły odpowiedzi o wadze „0"; p3 — proporcja osób, które udzieliły odpowiedzi o wadze „-1"; wk — waga &-tej (/= l,...,m) odpowiedzi na /- tą pozycję testu. Po zsumowaniu wszystkich wariancji obliczonych wg wzoru (15.32), obliczo- ną sumę wstawiamy do wzoru (15.28) w miejsce wyrażenia: 8.2. Wzór Cronbacha Cronbach (1951) podał wygodny w użyciu wzór (15.33) na współczynnik rzetel- ności, stanowiący uogólnienie wzoru K-R 20 dla pozycji ocenianych w dowolny sposób, tj. nie tylko „0-1". Wzór ten bywa stosowany do obliczania współczynnika rzetelności skal postaw i kwestionariuszy osobowości, których pozycje wymagają wyboru jednej z kilku możliwych kategorii odpowiedzi (np. „tak", „nie wiem", „nie"; „zgadzam się", „raczej zgadzam się", „raczej nie zgadzam się", „nie zga- dzam się"). r,,= n-\ varc (15.33) gdzie: varc — wariancja całkowita wyników całego testu; vart — wariancja /-tej pozycji testu; n — liczba pozycji w teście. Spróbujmy teraz podsumować to, co powiedzieliśmy o metodach Kudera-Ri- chardsona (por. pkt. 8.1) oraz Cronbacha. Przypomnijmy, od czego zależy wariancja całkowita testu? Jeżeli test składa się z n pozycji, to jego wariancja całkowita wyraża się wzorem: 475 varc = , (/ * fc). (15.34) Wyrażenie: rfkSDiSDi, to kowariancja /-tej i &-tej pozycji testu (covarljfc), a SD;, SDj. to odchylenia standardowe i-tej i fc-tej pozycji testu. Z punktu widzenia wzoru na wariancję całkowitą testu (15.34), wartość skon- struowanego przez psychologa testu zależy od: (a) wariancji poszczególnych pozycji testu oraz od korelacji między nimi; (b) od iloczynu: pt x ąt , gdy pozostałe warunki utrzymane są na stałym po- ziomie; (c) od korelacji pozycji testowych rik (i * k), gdy pozostałe warunki utrzymane są na stałym poziomie. Spełnienie wymienionych wyżej założeń jest szczególnie ważne, jak pokazały to cytowane wyżej wyniki badań Brogdena, w przypadku testów o małej liczbie pozycji. Podsumowując, podejście Kudera-Richardsona-Cronbacha można rekomendo- wać jedynie w przypadku gdy: (a) test ma strukturę jednoczynnikową, tzn. zakłada się, że pozycje testu mie rzą tę samą zmienną; (b) test zbudowany jest z pozycji równoległych. W takiej sytuacji omawiane podejście daje najlepsze oszacowanie wewnętrznej zgodności testu. Jego wartość będzie zatem tym większa, im bardziej jednorodna będzie próbka pozycji tworzących test, pobrana z populacji pozycji. Psycholog, który sięga po tę stosunkowo łatwą w stosowaniu i interpretacji miarę rzetelności testu musi o tym pamiętać. Nie jest ona bowiem ani miarą uniwersalną (nie bada wszystkich aspektów rzetelności), ani też nie jest wolna od ograniczeń. O tych ostatnich psycholog najczęściej zdaje się zapominać. Warto może zwrócić uwagę na jeszcze jedną właściwość współczynnika oc- Cronbacha. Może on z powodzeniem zastąpić, w przypadku obliczania rzetelności baterii testów, współczynnik Mosiera (1943; por. Guilford, 1954, s. 393) — por. Cronbach (1951, s. 321-323). 8.3. Podejście Hoyta • Myśl posłużenia się analizą wariancji przy badaniu rzetelności testu nie jest nowa. Jako jeden z pierwszych podjął się takiej próby Hoyt (1941). Zdaniem Choyno- wskiego (1971b, s. 107) analiza wariancji daje najlepszą („najbardziej bezpośred- nią") estymację zgodności wewnętrznej testu psychometrycznego. I ja tę opinię podzielam. Hoyt oparł badanie wewnętrznej zgodności testu (rzetelności) na dwuczynni- kowej analizie wariancji w układzie krzyżowym, z liczebnością kratki: n= 1. Pokażę teraz istotę tej metody. Referował ją będę w kategoriach zastosowa- nego przez Hoyta planu analizy wariancji, aby wskazać na błędy i ograniczenia tej metody analizy rzetelności testu. Nie będzie to więc streszczenie pracy Hoyta, a 476 przeanalizowanie konsekwencji wynikających z przyjętego przez niego punktu wi- dzenia. Jednym czynnikiem jest tu: „grupa osób" (w postaci próby reprezentacyj- nej dla danej populacji). Ma on tyle poziomów, ile osób liczy ta grupa, a więc: A = (a\, ..., a„ ..., ap). Z kolei drugim czynnikiem jest: „test psychologiczny" o liczbie poziomów równej liczbie pozycji. Mamy tedy: B = (bh ..., bj, ..., bq). Wyjściowa tabela wyników składa się z p wierszy i q kolumn, a w każdej kratce B=1. Odpowiedzi osoby badanej punktowane są: „0", „I"6. Dopuszczając nieaddytywny model dwuczynnikowej analizy wariancji postaci (15.35): ym = em, (15.35) gdzie: // — ogólna średnia populacyjna; or, — efekt zadziałania /-tego poziomu czynnika, który jest stały dla wszystkich osób z /-tej populacji, tzn. ^a, = 0; fi{ — i=i efekt zadziałania y-tego poziomu czynnika, który jest stały dla wszystkich osób z y-tej populacji, tzn. 2J$j - 0; afij — efekt, który przedstawia nieaddytywność efe- 7=1 któw: at i fij, albo inaczej, efekt interakcji /-tego i y-tego poziomu czynnika A i B, 3j = 0 , ^Lafij = 0; eum — błąd eksperymentalny, którego rozkład jest normal ki ż=i ny ze średnią = 0 i wariancją = a\ , musimy przyjąć, iż n> 1, tzn. liczebność każdej kratki w tabeli wyników surowych jest równa, co najmniej, 2. Jest tak, ponieważ chcąc oszacować wariancję błędu za pomocą wyrażenia: „MSbłędu" musimy dysponować liczbą stopni swobody równą: df=(n- \)pq — równą co najmniej 1 (liczba stopni swobody wchodzi do mianownika wzoru na MS). Aby jednak można było przeprowadzić analizę wariancji w przypadku: n = 1 musimy zrezygnować z modelu postaci (15.35) na rzecz modelu addytywnego, postaci (15.36): yijk = H + ai+fij + em. (15.36) W przypadku modelu (15.36), wobec niemożności wyliczenia wartości: MSWędu przyjmuje się, iż oszacowaniem wariancji błędu będzie wyrażenie: MS,^, a więc średni kwadrat dla interakcji czynników A i B. A zatem: MS>AB —> of. W późniejszych pracach Hoyt (Hoyt, Stunkard, 1951; Hoyt, Krishnaiah, 1960) zrezygnował z założenia o dychotomicznej postaci pozycji testowych, tj. takich, które wymagają od badanego udzie- lenia jednej z tylko dwóch możliwych odpowiezi: „tak" lub „nie". Zauważmy, iż metoda Hoyta, przy przyjęciu tego założenia jest tożsama z metodą zaproponowaną przez Kudera i Richardsona (tzw. wzór 20). Jeżeli zrezygnujemy z założenia o „zero-jedynkowej" postaci pozycji, to metoda Hoyta daje takie same rezultaty co metoda Cronbacha (wzór a). Model addytywny można jednak przyjąć tylko wówczas, gdy interakcja nie niesie istotnych dla badacza informacji7. Mówiąc inaczej, gdy wariancja cz stkowa, której interakcja AB jest źródłem może być potraktowana jako składov wariancji resztowej (błędu). Aby nie przesądzać „na oko" o tym, który model addytywny czy nieaddytywny — można dla danego zestawu wyników przyjąć, należy posłużyć się specjalnym testem addytywności opracowanym przez Tukeya. Z jego wykorzystaniem do wyżej opisanego celu można zapoznać się w Brzezińskiego i Stachowskiego (1984). Rezultaty przeprowadzonej analizy wariancji zawieramy w tabeli wzorowanej na tab. 15.1. Tabela 15.1. Tabela dwuczynnikowej analizy wariancji (n = 1) Źródło wariancji SS df MS F A (osoby) B (pozycje) AB = reszta SSA SSB SSAB p-1 q-\ (p-\)(q-\) MS„ MSs USAB FA FB Cała SScala pqn-\ Wariancję całkowitą wyników danego testu psychologicznego (varc) można rozbić na trzy wariancje cząstkowe: varA(osoby), varB(pozyCje), varR(reszta). Rzetelność testu można wyrazić jako stosunek wariancji prawdziwej do wariancji otrzymanej. Zakładając, że oszacowaniem varA jest wyrażenie MSA, a oszacowaniem varR wyrażenie: MS^ mamy: (15.37) - MSR r„- MS, Taką też formułę podaje Hoyt. Prześledźmy teraz zastosowanie metody Hoyta przeliczając „krok po kro ku" dane zaczerpnięte z pracy Guilforda (1954, s. 381). Reprezentacyjną próbę (A) liczącą p = 10 osób poddano badaniom za pomocą testu psychologicznego (R) liczącego 12 pozycji. Odpowiedzi były punktowane wg klucza: „1" — odpowiedź poprawna, „0" — odpowiedź zła. Tabela 15.2 zawiera wyniki suro we. 7 Z krytyką metody Hoyta wystąpił także Lu (1971). Krytyka ta dotyczyła tego, że w założonym przez Hoyta addytywnym modelu AN0VA przyjmuje się, iż oszacowaniem wariancji błędu jest wy- rażenie MS^. Zdaniem Lu rozwiązanie przyjęte przez Hoyta prowadzi do przeszacowania wartości wariancji błędu, a tym samym do niedoszacowania wartości współczynnika rzetelności. Nie wchodząc w szczegóły techniczne modyfikacji zaproponowanej przez Lu, polegające, z grupsza rzecz biorąc, na przyjęciu innego modelu analizy wariancji jako schematu statystycznej analizy testu psychometryczne- go, przytoczę tylko wniosek jaki sformułowali Schuyler, Chuang i Ranney (1981) na końcu artykułu, w którym poddali wnikliwej i krytycznej analizie rozważanie podane przez Lu. Otóż ich zdaniem rozwiązanie to nie jest wolne od przeszacowania wartości wariancji błędu. 478 I Tabela 15.2. Wyniki surowe 10 osób przebadanych testem składającym się z 12 pozycji Osoby (A) Pozycje (B) Suma 1 2 3 4 5 6 7 8 9 10 11 12 1 1 0 1 0 0 0 0 0 0 0 0 0 2 2 1 1 1 0 0 1 0 0 0 0 0 0 4 3 1 1 1 1 0 0 0 0 0 0 0 0 4 4 1 1 0 1 1 0 0 1 0 0 0 0 5 5 1 1 1 1 1 0 0 0 0 0 0 0 5 6 1 1 1 0 1 1 1 0 0 0 0 0 6 7 1 1 1 1 1 1 1 0 0 0 0 0 7 8 1 1 1 1 0 1 1 1 1 J 0 0 9 9 1 1 1 1 1 1 1 1 1 1 1 0 11 10 1 1 1 1 1 1 1 1 1 1 1 1 12 Suma: 10 9 9 7 6 6 5 3 3 3 2 1 65 ŹnSdto: (Guilford, 1954, s. 381) Ob licz eni a po mo cni cze : (1) = 3 5 , 2 0 8 6 , ( 2 ) t t 1 ^ = 6 5 , ( 3 ) ^ ? ^ . = 4 3 , 0 8 3 , < = i j = i k = i H (4) ~tń = 44,7, , = 6 5 1 = 1 j = \ Su my kwadra tów: SS,, = (3) - (1) = 43,083 - 35,208 = 7,875, SSB = (4) - (1) = = 44,7 - 35,208 = 9,492, SSR = (5) - (3) - (4) + (1) = 65 - 43,083 - 44,7 + 35,208 = = 12,425, SS^ = (2) - (1) = 65 - 35,208 = 29,792. St opnie swob ody: dfA= p- 1 = 10- 1 = 9, dfB = q-l = 12- 1 = 11, dfR = (p - \){q- 1) = (10- l)(12 -l) = 99, dfcaia = npq- l=(l) (10)( \2)- 1 = 119. Śre dnie kwadra ty: USA = SS^ : dfA = 7,875 : 9 = 0,875, MSB = SS5 : dfB = 9,492 : : 11 = 0,863, MS* = SS« : dfR = 12,425 : 99 = 0,126. Sto sunki F: FA = MS„ : MS* = 0,875 : 0,126 = 6,94, FB = MS* : MS* = 0,863 : .0,126 = 6,84. W tab. 15. 3 za mi esz czo no rez ulta ty prz epr ow adz one j ana lizy wa ria ncji : Tabela 15.3. Tabela analizy wariancji dla danych z tabeli 15.2. Źródło wariancji SS df MS F Osoby (A) 7,875 9 0,875 6,94 Pozycje (5) 9,492 11 0,863 6,84 Reszta (R) 12,425 99 0,126 Cała 29,792 119 Źródło: obliczenia własne Fn,05;ll;9= 1,92 479 Po podstawieniu danych do wzoru (15.37) uzyskujemy poszukiwaną warte _ 0,875-0,126 r«~ 0875 -0,857. Obliczona tą metodą wartość r„ stanowi dolną granicę rzetelności danego te- stu. Mówiąc inaczej, metoda ta wykazuje tendencję (zwłaszcza w przypadku „krót- kich" testów) do niedoszacowywania rzetelności testu. Przejdźmy teraz do uwag krytycznych, które można zawrzeć w dwóch pun- ktach: 1. Pierwsze i najpoważniejsze zastrzeżenie wiąże się z tym, iż j-ta osoba odpowiada kolejno na wszystkie ^-pozycje, a zastosowany tu układ analizy warian cji zakłada, że każda kombinacja poziomów czynników A i B (czyli kombinacja: „/-ta osoba — j-ta pozycja") występuje tylko raz. Jest to więc nieprzydatny dla analiz psychometrycznych układ analizy wariancji, gdyż każda osoba jest badana całym testem, składającym się z q pozycji, a nie tylko jedną pozycją. 2. Drugie zastrzeżenie związane jest z wykorzystaniem testu dla celów diagnozy różnicowej. Tak prowadzone badanie rzetelności testu uniemożliwia udzielenie pozytywnej odpowiedzi na pytanie o reprezentatywność próby, na której chcemy przeprowadzić to badanie, np. w zakresie: „norma — różne po staci patologii". 8.4. Podejście Lorda i Novicka oraz Cronbacha, Gleser, Nandy i Rąjaratnama O ile Hoyt pokazywał zastosowanie analizy wariancji do obliczania współczyn- nika rzetelności testu psychologicznego, to wymienieni w tytule tego punktu autorzy wykorzystują analizę wariancji jako metodę planowania eksperymentów, za pomocą których usiłują dokonać oceny wpływu różnych czynników na zmienność wyników testowych. Rozbijając całą wariancję na wariancje składo- we można, przez porównanie, ocenić ważność poszczególnych czynników sta- nowiących źródła owych wariancji składowych. Dlatego też Lord i Novick mó- wią o analizie składowych wariancji (ang. analysis of variance components). Jest to podstawowa metoda dla autorów teorii wyników generycznych oraz teo- rii uniwersalizacji (Lord, Novick, 1968; Cronbach i in., 1972; por. omówienie obu teorii: Nowakowska, 1975). Nie wchodząc w szczegóły obu teorii zwróćmy uwagę na zastosowanie ana- lizy wariancji przez wspomnianych badaczy. Badają oni — przede wszystkim — dwa rodzaje czynników wyznaczających wariancję wyników testowych. Jednym jest czynnik: „osoby badane", występujący na tylu poziomach, ile osób liczy ba- dana próba, tzn. 1, 2, ..., N. Drugi to czynnik: „wersje testu", występujący na tylu 480 poziomach, ile wersji „równoległych" badacz skonstruował, tzn. 1, 2, ..., n. Wre- szcie, bada się łączny wpływ obu czynników w jednym eksperymencie. Łatwo się zorientować, że znajdują tu zastosowanie plany analizy warian- cji jedno- i dwuczynnikowe. Dodatkowo Cronbach i in. propagują plany gniaz- dowe (ang. nested design). Poziomy czynników, albo są arbitralnie przez bada- czy ustalane, np. 5 wersji równoległych testu, które (wszystkie) są wykorzysty- wane w jednym eksperymencie, i wówczas mówi się o modelu efektów stałych (model I), albo też badacz losuje określoną liczbę poziomów czynnika ze zna- cznie większej puli poziomów, np. puli możliwych wersji równoległych testu, i wówczas mówi się o modelu efektów losowych (model II). W badaniach Lorda i Novicka oraz Cronbacha ze współpracownikami przeważa zastosowanie modelu II. Zanim zaprezentuję podstawowe plany eksperymentów znajdujące zasto- vanie w praktyce psychometrycznej inspirowanej przez cytowane tu prace, ciąłbym wyjaśnić jeszcze jedno. Otóż autorzy mówią przy analizowaniu pla- ów analizy wariancji, że albo dany plan zakłada powtórzenia (replikacje), albo ; ich nie zakłada; dana kombinacja poziomów czynnika (czy też dany poziom czynnika w planie jednoczynnikowym) występuje tylko raz, w odniesieniu do jednej osoby (^=1), albo też występuje wielokrotnie (r>2). Należy przy tym odróżnić eksperyment, który jest r(r > 2) razy powtarzany na niezależnych lo- sowych próbach pobranych z populacji — przy czym na każdą „kratkę" przy- pada w jednym powtórzeniu jedna osoba (lub więcej osób: r > 2) — od ekspe- rymentu niepowtarzalnego, w którym na jedną „kratkę" przypada jedna osoba (n=l) lub więcej osób (r>2). W pierwszym przypadku mówimy o r(r>2) powtórzeniach eksperymentu o liczebności kratki: n = 1, a w drugim przypadku o r-\ wykonaniu eksperymentu o liczebności kratki: r>2 (Winer, 1971, s. 391). Ogólna liczba osób biorących udział w eksperymencie będzie w obu przy- padkach taka sama. Na przykład, w eksperymencie dwuczynnikowym (wedle klasyfikacji krzyżowej): p ? q ? n ? r. Jakie są tedy powody, dla których znajdują zastosowanie eksperymenty o r>2? Otóż zdarza się, że nie można przeprowadzić eksperymentu (na danej liczbie osób) w jednym miejscu i w tym samym czasie. Wyjście z tego technicznie trudnego problemu jest takie, że badacz przeprowadza w danym miejscu (lub czasie) ekspe- ryment na próbie pomniejszonej do tego stopnia, że nie zachodzi obawa, iż został naruszony warunek Jedności miejsca i czasu". Mówiąc inaczej, liczebność kratki w danym r-tym powtórzeniu eksperymentu wynosi: n : r. Porównajmy jeszcze źródła wariancji i stopnie swobody w eksperymencie dwuczynnikowym (krzyżowym) — powtarzanym r xdiVj i nie powtarzanym. Niech tedy czynnik A występuje na p poziomach, a czynnik B na q poziomach i niech r oznacza liczbę powtórzeń, a n liczebność kratki, na którą przypada dana y-ta kom- binacja poziomów czynników A i B. Wk 31 — Metodologia badań... 481 Eksperyment bez powtórzeń o liczebności kratki: n>\ Eksperymenty o r-powtórzeniach i o liczebności kratki: (n : r) > 1 stopnie swobody p-\ q-\ źródło stopnie źródło wariancji A swobody wariancji p-1 B AB powtórzenia: A x powtórzenia B x powtórzenia AB x powtórzenia wewnątrz grup (błąd) cała fff . fi.t/jo*- międzygrupowe: lut) i»f .,. *oq ff! czynniki powtórzenia ' „ rei. >,>VTit , ' " )-O' ^*r ll (p^-lKr-l) wewnątrzgrupowe pqr[(n : r) - 1] Ponieważ kroki w eksperymentach powtarzanych są na ogół bardziej jedno- rodne, więc i wariancja wewnątrzgrupowa (wariancja błędu) jest mniejsza od ana- logicznej wariancji w eksperymentach bez powtórzeń. Po zapoznaniu się z punktem widzenia teorii eksperymentu można przejść do „specyficznego" rozumienia terminu: „replikacja" przez Lorda i Novicka. Otóż — wbrew temu, co wyżej zostało powiedziane — Lord i Novick (1968) oraz Cronbach i in. (1972) traktują powtórzenia jako r-krotne testowanie tej samej osoby w y-tych warunkach („repłicate measurements are those obtained by retesting either with the same form or with parallel forms" — Lord, Novick, 1968, s. 160). Podobnie rozumie powtarzanie Nowakowska (1975, s. 69): „(...) każda osoba odpowiada r razy na każdą z n wersji testu". Widzimy zatem, iż nie o powtarzanie eksperymentu tu chodzi, ale o wielokrotne testowanie tych samych osób. Powinno się tedy wy- korzystywać eksperymenty zakładające powtarzanie pomiarów zmiennej zależnej w obrębie jednego lub większej liczby czynników. Opis takich planów analizy wa- riancji, w których zakłada się wielokrotne powtarzanie pomiarów zmiennej zależnej 482 na tych samych osobach, znajdzie Czytelnik u Winera (1971, rozdz. 4. i 7.) pod nazwą: ,jingle-factor (multifactor) experiment(s) having repeated measures on the same elements", u Kirka (1982, rozdz. 11.) pod nazwą: ,jplit-plot factorial design: design with group-treatment confounding" oraz u Brzezińskiego i Stachowskiego (1984, rozdz. 6. i 7.) pod nazwą: „eksperymenty z powtarzanymi pomiarami zmien- nej zależnej...". Tak więc podstawowy zarzut, który można tu sformułować, jest bądź odmianą zarzutu I stawianego metodzie Hoyta, gdy analizujemy plany ekspe- rymentów z powtórzeniami, bądź jest on taki sam jak zarzut I, gdy analizujemy układy bez powtórzeń. W obu przypadkach analiza statystyczna oparta jest na nie- właściwych układach analizy wariancji. W efekcie wyliczone z danych otrzyma- nych na podstawie przeprowadzonych eksperymentów średnie kwadraty (MS) dla czynników, ich interakcji oraz błędu są obciążonymi estymatorami odpowiednich wariancji składowych. Oto podstawowe plany eksperymentów wykorzystywane przez cytowanych tu psychometrów: Plan 1. —jednoczynnikowy (Lord, Novick, 1968, s.160) czynnik: „osoby badane" na N poziomach, r{r > 2) powtórzeń (w sensie r-testowania każdej osoby w kratce) źródło wariancji: stopnie swobody: między osobami N-l powtórzenia N(r-1) Nr-I I Plan 2. - jednoczynnikowy (tamże, s. 168) czynnik: „wersje testu" na n poziomach, bez powtarzania (r= 1) — ale każdą wersję testu rozwiązuje N osób źródło wariancji: stopnie swobody: między testami n-l wewnątrz testów n(N-l) cała nN-l Plan 3. — dwuczynnikowy (tamże, s. 163) czynnik A: „osoby badane" na N poziomach, czynnik B: „wersje testu" na n poziomach, r(r>2) powtórzeń (w sensie r-testowania każdej osoby w kratce) źródło wariancji: stopnie swobody: między osobami A^— 1 między testami n-l interakcja (N - l)(n - 1) powtórzenia nN(r -1) cała nNr - 1 483 Plan 4. — dwuczynnikowy (tamże, s. 168) czynniki A i B — jak w planie 3., bez powtarzania (r - 1) — jak u Hoyta (1941) źródło wariancji: stopnie swobody: między osobami N - 1 ... między testami n - 1 interakcja (*-!)(«-D cała nN-l Oprócz planów wyżej przedstawionych Cronbach i in. (1972, rozdz. 2. i n.) przedstawiają plany trójczynnikowe, a także gniazdowe — z tymi samymi uchybie- niami. Wszystkie wyżej przedstawione plany rozważane są w ramach modelu II (efektów losowych). 8.5. Podejście Winera W swojej propozycji Winer za punkt wyjścia przyjmuje macierz wyników o I wierszach odpowiadających osobom badanym i p kolumnach odpowiadających pozycjom testowym. Jest to więc taka sama tabela jak u Hoyta (por. tab. 15.2). To co różni ujęcie (problemu rzetelności testu psychometrycznego analizowanego via analiza wariancji) Hoyta od ujęcia Winera, to wybór planu analizy wariancji. U Hoyta — jak pamiętamy — był to plan dwuczynnikowy typu: „osoby x pozycje" (n = 1). Z kolei u Winera jest to plan jednoczynnikowy z wielokrotnym powtarzaniem pomiarów zmiennej zależnej u każdej osoby badanej. Jeżeli test składa się z p pozycji, to każda z n osób udziela p odpowiedzi (odpowiednio na pierwszą, drugą, ..., p-tą pozycję). Nie stosuje się zatem do rozwiązania zaproponowanego przez Winera uwaga I do metody Hoyta, ale nadal w mocy pozostaje uwaga II. Przejdźmy teraz do prezentacji planu analizy wariancji, zgodnie z którym Wi- ner proponuje rozwiązać problem rzetelności testu. Prześledźmy kolejny przykład. Niech próba losowa n osób będzie badana za pomocą testu A składającego się z losowej próby p pozycji. Przez yik oznaczmy odpowiedź fe-tej osoby na i-tą pozycję. Uzyskane dane umieszczamy w tab. 15.4. Tabela 15.4. Schemat tabeli wyników surowych do przeprow adzenia analizy wariancji Osoby Pozycje (A) y\ 1 ... i ... p y.k 1 k n yn yik ym yn yik ym yP\ yPk ypn y.\ y.k y.n ń ń A 7i y\. yi y*. y. y2 484 Struktura wyniku y,*jest następująca: yilc = U + OCi + 7lk + Bun, (1 J.JO) gdzie: n — ogólna średnia populacyjna (średnia wszystkich możliwych wyników testowych w populacji); c, — efekt zadziałania /-tego poziomu czynnika A, który jest stały dla wszystkich elementów z /-tej populacji, tzn. ^ a,? = 0; nk — stała ;=i związana z k-tą osobą; ek^ — błąd eksperymentalny. W dalszych rozważaniach mogą być brane pod uwagę dwa warianty wyjścio- wego modelu (15.38). Pierwszy zakłada brak interakcji: „osoby x pozycje" i przyj- muje postać (15.38). Drugi z kolei zakłada występowanie interakcji: „osoby x po- zycje" i przyjmuje postać (15.38a): yik = n + ą; + nk + atnk + em, (15.38a) oznaczenia: jak wyżej; a,7rt — efekt interakcji fc-tej osoby badanej z ?-tą pozycją. Omówię tu tylko wariant pierwszy (15.38) (wg Winera, 1971, s. 276-278), gdyż on stanowi podstawę do badania rzetelności testu; o drugim wariancie można przeczytać także u Winera (tamże, s. 278-281). Równanie (15.38) możemy rozpisać następująco: Pozycja 1. , Pozycja 2. (...), Pozycja p. y2. = > k=\ k=l ap=np-n, k=l zatem: (...) «[ + ...+ er, + ... + ap = 0. Możemy założyć, że rozkład nk w populacji jest normalny ze średnią zero i wariancją a2K. Wewnątrz każdej populacji związanej z i-tą pozycją rozkład e^,) jest też normalny ze średnią zero i wariancją cĄ , a więc: of( = ?j.O : Ed8.fi « "\ -H Jbi Wielkość : (15.44) ib - P —"" ^ Prawą stronę wzoru (15.44) możemy odczytać jako: „stosunek wariancji pra- wdziwej do wariancji otrzymanej". Wprowadźmy parametr: 0 definiowany jako: &=ą^ .c.-^p^' (1545) Możemy teraz wyrażenie (15.44) zapisać w postaci: ^i*1 m.osob. ~ (15.51) f Utrzymując w mocy założenie o normalnych rozkładach i niezależności para- metrów n i rj możemy wyprowadzić estymator 0: Ą _ &n _ . - MSW osób w.osób (15.52) który jest jednak obciążony. W terminach tego estymatora oszacowanie współczynnika pp rzetelności jest dane wzorem: MS m.osob. _ MSwosób 'm.osob . (15.53) Dla rx mamy: [=P\ = .osob. - MSw.0SÓb (15.54) Z kolei nieobciążony estymator 0, czyli & dany jest wzorem (15.55): A, = MSnŁ0Mb. - \n(p - l)[n(p - lp(pl)[fl(pl) -mMSW0SÓb. (15.55) , . n{p-\) gdzie: m = . _ .._? ? Analogicznie: rP = Zachodzi zależność: A, A oraz: /-'^ < rp . (15.56) (15.57) Jeżeli przyjrzymy się dokładnie równaniu (15.39), to zauważymy, że można na jego podstawie mówić tylko o wariancji „między osobami" i wariancji „we- 489 wnątrz osób". Ta ostatnia nie podlegała dalszemu rozbiciu. Jednakże, przez analo-1 gię do przedstawionego wyżej schematycznego rozbicia całej wariancji w planie | jednoczynnikowym z powtarzanymi pomiarami, można i tę wariancję rozbić muj wariancję „testową" i wariancję „resztową" (wariancję błędu). Można tedy zamiast (15.39) napisać: 0/% Zmienią się teraz oszacowania wariancji w (15.58): \tó — wariancja „między osobami" (MSm osob): ?(MSm osob) = ajj + po — wariancja „testowa" (MStest): Z^MS^t) = a\ + ncĄ,, "* — wariancja „resztowa" (MSbłąd): ^MS^aj) = ai. >Ti w '?* (15.58) u t?v, Biorąc to pod uwagę mamy: 1 2 A > r c ^ \ ( T n = M ^ . ~ C A - t S Wycho dząc z kolei z (15.51) mamy: s ^' x^ISJS>» ^??O r- _ 12 0,499 */•"... ri2 1 + 12 • 0,499 gdzie: 0'= 0,499. TLĆO/O VSDT V . o iilvj jr^nm aiwa^bi 490 , _ 12 • 0,488 _ n _ Q r 12~ 1 + 12 • 0,488 -°'899> gdzie: 0' = 0,488. 8.6. Podejście Brzezińskiego 8.6.1. Uwagi krytyczne o dotychczasowych ujęciach problemu rzetelności testu Z punktu widzenia jednak jednej z zasad prowadzenia badań empirycznych, zasa- dy holizmu, celowe jest opracowanie całościowego podejścia do analizy testu psy- chologicznego. Moim zdaniem szansę takiego całościowego podejścia — co w poprzednich punktach: 8.3-8.5 zostało pokazane — do badania testu psychologicz- nego stwarza analiza wariancji. Trzeba jednak jeszcze raz spojrzeć na możliwości zastosowania tej analizy w psychometrii i na korzyści, jakie z tego zastosowania płyną. Przypomnijmy, że psycholog konstruujący jakiś test psychologiczny musi — po opracowaniu określonej jego koncepcji teoretycznej — wykonać następujące kroki: (a) pobrać z populacji próbę (reprezentatywną), która będzie przebadana „wyj ściową" wersją testu, (b) zanalizować moc dyskryminacyjną poszczególnych pozycji testu oraz wyselekcjonować z wyjściowej puli pozycji te, które spełniają określone kryterium dobroci testu i ułożyć z nich ostateczną wersję testu, (c) określić rzetelność testu, (d) określić trafność testu. Spróbuję obecnie wykazać trudności, jakie rodzi tradycyjny sposób konstruo- wania testów psychometrycznych. Dla większej przejrzystości wywodu uwagi te pogrupuję według wyżej przedstawionego schematu: (a)-(d). a—b. Na jakiej próbie przeprowadzać analizę mocy dyskryminacyjnej pozycji testowych? Myślę, że pierwsza, spontaniczna odpowiedź, jaka nasunie się każdemu psy- chologowi, a która będzie brzmiała: „analizę mocy dyskryminacyjnej pozycji na- leży przeprowadzić na reprezentatywnej dla danej populacji próbie" (por. rozdz. 16.), pozornie tylko sugeruje, iż pytanie było trywialnie proste. Klasyczny sposób podejścia do analizy pozycji sprawia, iż pytanie to nie tylko nie jest proste, ale — co więcej — może pozostać bez konstruktywnej odpowiedzi. Jak wiadomo, dobra pozycja, to taka, która różnicuje osoby o różnym natężeniu cechy, do po- miaru której jest ona przez psychologa przeznaczona. Pozycję taką, mówimy, ce- chuje wysoka moc dyskryminacyjna. Tę ostatnią ujmuje się — o czym piszę do- kładnie w rozdz. 16. —jako stopień korelacji danej pozycji z ogólnym wynikiem testu (rozumianym jako suma punktacji wszystkich odpowiedzi uznanych za diag- 491 nostyczne, czy inaczej, odpowiedzi zgodnych z kluczem dołączonym do testu), którego ta pozycja została przez psychologa włączona. Niezależnie od tego, jakim współczynnikiem korelacji posłuży się konst testu, analiza mocy dyskryminacyjnej polega na: (a) przebadaniu całej próby (ale jakiej?) wyjściową wersją testu, (b) obliczeniu wstępnego, ogólnego wyniku testu dla każdej osoby (pytanie: skąd badacz wie, że wolno mu wyniki cząstkowe dodawać do siebie?), (c) uszeregowaniu osób od „najgorszych" do „najlepszych" według wysokości wyników ogólnych, (d) wyłonieniu dwóch równolicznych grup osób o skrajnych wynikach, „ni skich" i „wysokich" liczących po, np. 10%, 25%, 50% liczebności całej próby, (e) obliczeniu frakcji w obu grupach osób, które odpowiedziały diagnostycznie na kolejną pozycję, (f) obliczeniu wartości współczynnika korelacji, stanowiącego operacyjną mia rę mocy dyskryminacyjnej. Jeżeli test przeznaczony jest przez psychologa do formułowania diagnozy róż- nicowej, na przykład: „psychoza — norma" czy: „psychoza — nerwica — norma", to badanie mocy dyskryminacyjnej tradycyjną metodą korelacyjną komplikuje się. Rzecz w tym, iż nie bardzo teraz wiadomo, dla jakiej populacji winna być repre- zentatywna próba, na której będzie przeprowadzane badanie standaryzacyjne. Czy mają to być — na przykład — psychotycy? A może normalni? A może też po części psychotycy, a po części normalni? Lista pytań wydłuży się, jeżeli pozycja ma różnicować nie dwie, lecz kilka grup diagnostycznych. Z uwagi na wyżej sformułowane pytania nie wydaje mi się poprawne rozwią- zanie, które przyjął Choynowski (1968, s. 51-95) standaryzując polską adaptację znanego testu Eysencka — MPI — na populacji studentów. To, że studenci, nor- malni (rzecz jasna w jakimś stopniu neurotyczni), odpowiedzieli w jakiś sposób na daną pozycję, wcale nie musi sugerować, że neurotycy — na przykład — będą odpowiadać w sposób odmienny. Ze statystycznego punktu widzenia z jednorodnej populacji powinno się pobrać równie jednorodną próbę. Jeżeli jednak populacja jest heterogeniczna, to należy wpierw podzielić ją na jednorodne warstwy (podpopula- cje) — w sposób opisany w rozdz. 9., pkt. 4.3.3. — uwzględniając jedną i większą liczbę zmiennych, takich jak: płeć, wiek, rodzaj choroby czy zaburzenia psychicz- nego itp., a następnie wylosować z tych warstw jednorodne podgrupy, łącznie skła- dające się na próbę. Jest to postępowanie zgodne z zasadą: minimalizacji wariancji intragrupowej-maksymalizacji wariancji intergrupowej. Tak więc, jeżeli możemy założyć z góry, że będziemy mieli do czynienia nie z jedną, jednorodną populacją, ale że będą to dwie (i więcej) populacje, to postę- powanie standaryzacyjne powinno uwzględniać ten fakt. Mówiąc krótko, należy je przeprowadzać na dwóch (i więcej) jednorodnych grupach (grupy te będę nazywać grupami kryterialnymi, czy też grupami diagnostycznymi). Takie postępowanie wy- maga jednak zmiany klasycznej techniki analizy mocy dyskryminacyjnej pozycji. Nie można tedy mówić o jednym, ogólnym wyniku testowym osoby z próby, wedle wysokości którego będziemy szeregować osoby badane (należące przecież do róż- nych populacji, a tym samym i do różnych grup kryteriałnych). Nie ma wszak sensu dodawanie do siebie punktów z odpowiedzi na pozycje testowe uzyskane raz od psychotyka, raz od neurotyka, a raz od osoby normalnej. W pkt. 8.6.2 pokażę inną — jak się wydaje wolną od powyższych zarzutów — metodę analizy mocy dyskryminacyjnej pozycji testowych. c. W jaki sposób bada się rzetelność testu? Z dotychczas stosowanych metod badania rzetelności testu psychologicznego (por. poprzednie punkty niniejszego rozdziału) bodajże największą popularnością wśród psychologów cieszą się dwie techniki: badanie stabilności bezwzględnej (por. pkt. 5.) oraz metoda oparta na analizie niektórych właściwości statysty stycz- nych pozycji testowych — zwłaszcza wzór Cronbacha (por. pkt. 8.2) i Spearma-na- Browna (por. pkt. 9.1). Krytyczne uwagi dotyczące pierwszej metody koncentrują się głównie na tym, że nie można spełnić warunku równoległości pierwszego i drugiego badania tym samym testem tej samej grupy osób, a także na tym, że nie jest ściśle określony standardowy okres, jaki winien dzielić jedno badanie od drugiego. Jeśli chodzi o drugą metodę, to dotyczą jej sygnalizowane trudności metodologiczne związane z reprezentatywnością próby — w przypadku konstruo- wania testu przeznaczonego do diagnozy różnicowej. Nowa metoda badania rzetelności testu psychometrycznego powinna być wol- na od tych ograniczeń. d. W jaki sposób bada się trafność testu? Najczęściej stosowane podejścia do badania trafności testu sprowadzają się do wyznaczenia wartości procentowej, tzw. wariancji wspólnej, nowego i już uznanego przez psychologów testu. Procedura ta nosi nazwę ustalania trafności diagnostycz- nej (piszę o niej w rozdz. 17., pkt. 2.2.1). Pojęcie trafności powinno się jednak odnosić nie tylko do testu jako pewnej „całości" złożonej z części (pozycji), ale także do owych części składowych (pozycji). Wszak nie zawsze jest usprawiedli- wione obliczanie wyniku ogólnego jako sumy punktów uzyskanych przez osobę badaną w odpowiedzi na poszczególne pozycje. Taka, uwzględniająca poszczególne pozycje testu, analiza jego trafności związana jest z procedurą analizy czynnikowej [por. rozdz. 17., pkt. 5.2). Uważam też, że należy połączyć dwie — dotychczas różne — procedury: ustalania mocy dyskryminacyjnej pozycji i ustalania trafności ^nie całego testu, ale jego składowych!) w jedną procedurę, którą można by określić nianem procedury ustalania dobroci pozycji testowych. W niżej opisanej proce- lurze właśnie tak się postępuje. $.6.2. Wskaźnik DT ak się wydaje, prezentowane w niniejszym punkcie plany analizy wariancji w zastosowaniach psychometrycznych usuwają ostatni zarzut, jaki można było jeszcze •ostawić koncepcji Winera, czyli zarzut pokazujący nieadekwatność takiego podej- cia w przypadku konstruowania testów do diagnozy różnicowej (pytanie o repre- 493 zentatywność n-elementowej próby). Jednocześnie prezentowane tu plany umożli- wiają „całościowe" zbadanie dobroci testu, a wiec tego, co określone jest mianem rzetelności, trafności i dyskryminatywności. Opisane niżej podejście do badania dobroci testu psychologicznego oparte jest na wykorzystaniu planu dwuczynnikowego analizy wariancji z częściowym powta- rzaniem pomiarów zmiennej zależnej w obrębie jednego czynnika. Plan, który będzie tu omówiony, należy do tej samej klasy planów analizy wariancji, co omówiony — za Winerem — w punkcie poprzednim. Także i tu jedynym czynnikiem powtarzanym jest czynnik: „test psychologiczny". W celu wyeliminowania zróżnicowania w obrębie próby osób badanych dzieli się ją na warstwy (grupy kryterialne, porównawcze) odpowiadające poszczególnym pozio- mom czynnika. W ten sposób minimalizujemy (a o to przecież m. in. chodzi) wariancję wewnątrzgrupową. Takimi grupami kryterialnymi mogą być grupy: „nor- ma — nerwica — psychoza", grupy, w stosunku do których stosuje się różne instrukcje, grupy osób o różnym wykształceniu, o różnym stażu pracy na danym stanowisku (np. operatora dźwigu) itp. Struktura wyniku yijk jest następująca: yijk = nm (15.62) gdzie: ytjk — odpowiedź udzielona przez k-tą osobę badaną losowo pobraną z /-tej populacji na ./'-tą pozycję; // — ogólna średnia populacyjna; a, — efekt Mego poziomu czynnika A (przynależności osoby badanej do i-tej populacji), który jest stały dla wszystkich osób badanych pochodzących z Mej populacji; /?, — efekt y- tego poziomu czynnika B (udzielona odpowiedź na y-tą pozycję testu), który jest stały dla wszystkich osób badanych pochodzących z y-tej populacji; nk(i) — stała związana z k-tą osobą badaną, dla której czynnik .A występuje na Mym po- CAŁA WARIANC JA wariancja wariancja mędzy wewnątrz osobami osób wariancja wariancja wariancja wariancja wariancja wprowa- wprowa- wprowa- wprowadzo- wprowa- dzona dzona dzona na przez dzona przez przez przez interakcje przez czynnik/ł błąd/t czynnik 8 A\B błądfi Rys. 15.2. Podział całej wariancji na wariancje składowe w planie dwuczynnikowej analizy wariancji z powtarzanymi pomiarami zmiennej zależnej w obrębie czynnika B 494 ziomie; aĄ — efekt, który przedstawia nieaddytywność efektów a, oraz fij albo inaczej efekt interakcji /-tego i y-tego poziomu czynnika A i B; /?/r*(,) — efekt, który przedstawia nieaddytywność efektów; e^ — błąd eksperymentalny o roz- kładzie normalnym ze średnią równą zero i odchyleniem standardowym rów- nym <Ą. Założenia, przy których uzasadnione jest posługiwanie się tym planem to: założenie normalności rozkładów zmiennej zależnej w porównywanych popula- cjach, założenie homogeniczności wariancji porównywanych populacji, założenie równości q(q-\):2 kowariancji z p poziomów czynnika A. Metody sprawdzania tego, czy owe założenia są spełnione przez dany materiał empiryczny przedstawio- ne są u Brzezińskiego i Stachowskiego (1984, rozdz. 3.). Całą wariancję wyników testu można rozbić na wariancje składowe, tak jak to zostało pokazane na rys. 15.2. Dane uzyskane z badania n osób (w każdej z p grup kryterialnych) testem złożonym z q pozycji zamieszczamy w tabelach wzorowanych na tab. 15.7 i 15.8. Tabela 15.7. Schemat wyjściowej tabeli do analizy danych z przebadania c-itemowym testem psychometrycznym />-grup kryterialnych Osoby w Pozycje (B) grupach (A) b\ bj b. 1 y\n ym y,qi y\.\ ;? ,m yu n ynn V, /l/n y\.n 1 yPu yPn yPą\ yp.i ap k yplk yPjk yP.k n ypU ypjn v Jpqfi yp.n Suma: y- Tabela 15.8. Schemat pomocniczej tabeli do analizy danych (do tab. 15.7) A B Suma b\ ... bj ... bq a\ yu. yij. y\q. yP\. ypi. yPq. 7\. Suma Vi V ? V y.\. J .j. J .q. y... 495 Po przeprowadzeniu analizy wariancji jej rezultaty umieszczamy w tabeli wzo- rowanej na tab. 15.9. Tabela 15.9. Schemat tabeli analizy wariancji według planu dwuczynnikowego z powtarzanymi po- miarami zmiennej zależnej w obrębie czynnika B wariancji Między osobami A Osoby w gr (błąd A) Wewnątrz osób "W B AB fi-osoby w gr (błąd B) Suma kwadratów SS Stopnie swobody df Ś r e d n i k w a d r a t M S E f i S U \ > > H < & 3 t f C 3 g t ; ? ?iTCi ' rosa* 'riosł^dib M {mrumakitni jptsoc, Stosunek F Cała Przed przystąpieniem do obliczenia wartości SS-ów musimy wyliczyć wartościj pomocnicze: ?, — - —__,.,-i-,.-..- _ _4 • ^-* , . ? ??" Ui go, >e ! 1 CKi}' ' >: " i1 •> n«)( c .u j: ' "tF* " } 1 pn" (=1 /=! *=1 i=l i=l *=l kwadratów (SS): SS^^y = (6) - (1), SSA = (3) - (1), SSosot,.^. = (6) - - (3), SSwewnątrz = (2) - (6), SSfi = (4) - (1), SSAB = (5) - (3) - (4) + (1), SS^ob.w.gr. = (2) - (5) - (6) + (3), SS^ (2) - (1). Średnie kwadraty: MS,i= SSA : df^, MSosobwgr = SSosobwgr. : 4fosobw.gr.. MSB = = SSg : djg, MSBosobw.gr. ~ SSg.osob.w.gr. : H/B.osob.w.gr- Stosunki F: FA = MSA : MSosobwgr., FB - MSB : MSB.osob.wgr, FAB = MSAB : . c • °fi.osob.w.gr. Następny etap to analiza efektów prostych: A w bj. Efekty proste informują badacza o tym, czy dana pozycja różnicuje grupy kryterialne. Jest to więc metoda analizy trafności pozycji. Po jej przeprowadzeniu możemy wyeliminować te pozy- cje, dla których stosunek FA w bJ przyjmował wartości z obszaru odrzuceń Ho. Mówiąc inaczej, test F dla czynnika A informował nas tylko o tym, czy grupy kryterialne różnią się na danym poziomie istotności statystycznej. Nie informował nas jednak — w przypadku stwierdzenia istotności różnic — czy różnice te zacho- dzą w obrębie wszystkich pozycji, czy też w obrębie części z nich. O tym infor- muje nas test F efektów prostych. W przypadku większej od dwóch liczby grup 496 kryterialnych trzeba by jeszcze odwołać się do pomocy testu istotności różnic mię- dzy średnimi wartościami zmiennej zależnej poszczególnych grup kryterialnych dla ;'-tej pozycji. W ten sposób dowiemy się dokładnie, które pary grup kryterialnych różnicuje j-ta pozycja. Sumy kwadratów dla efektów prostych czynnika A na poszczególnych pozio- mach czynnika B obliczamy wg wzorów: SS 'Awb, 'Awi, 1=1 <=1 1=1 (15.63) Suma kwadratów efektów prostych A w ty równa jest: Po wyliczeniu wartości SS-ów kolej na średnie kwadraty, które obliczamy dzieląc poszczególne sumy kwadratów przez stopnie swobody, których liczba rów- na się: df=p- 1. Przy testowaniu istotności efektów prostych A w ty, jako oszacowania warian- cji błędu używamy wyrażenia: ^^osoby.w.gr. ~ (15.64) p(n - 1) + p(n - l)(q - 1) Wyrażenie (15.64) przedstawia połączone błędy dla A i B. Uznajemy efekty proste A w ty za istotne na danym poziomie a, jeżeli: Rezultaty analizy wariancji efektów prostych zaprezentowane są w tab. 5.13 zawierającej dane z kolejnego przykładu (jest to zarazem wzór tego typu ibeli). Ze wstępnej wersji eliminujemy te pozycje, które w świetle testu F-efektów itych A w ty okazały się nieistotne na danym poziomie a. Po tym zabiegu zyszczającym" test z pozycji niedyskryminujących grupy kryterialne przepro- powtórnie analizę wariancji w celu oszacowania składowych wariancji :ecznej wersji testu. O psychometrycznej wartości testu informuje nas wskaźnik DT, który propo- iję obliczać wg wzoru (15.65): MSJ — MSn<.ohv w er DT= Xifo 100% • ? (15.65) 497 .32 — Metodologia badań. Wskaźnik Dl* pokazuje stosunek czystej wariancji między osobami do ca wariancji między osobami wyrażony procentowo. Prześledźmy teraz — na kolejnym przykładzie — zastosowanie omawianeg wyżej planu analizy wariancji do następujących danych. Wyjściową wersją (traktowaną jako czynnik B) zawierającą #= 10 pozycji przebadano osoby z p- 2 grup kryterialnych o różnych rozpoznaniach klinicznych (traktowanych tu ja czynnik .A), po n = 5 osób w każdej grupie. Zgodnie z hipotezą badacza test ten powinien różnicować osoby należące do obu grup. Uzyskane wyniki przedstawione są w tab. 15.10 i 15.11. Tabela 15.10. Wyjściowa tabela wyników do analizonego przykładu Grupy Pożycie Suma 1 2 3 4 5 6 7 9 10 1 7 8 7 6 8 7 9 7 6 7 72 2 7 7 7 8 6 7 9 9 7 7 74 at 3 8 8 7 9 8 7 9 8 8 8 80 4 8 7 6 6 8 8 8 8 9 7 75 5 9 9 6 9 9 7 7 8 7 7 78 6 3 3 3 2 3 3 4 5 5 36 1 7 4 4 4 3 4 6 6 5 4 2 40 o, 8 1 1 4 4 3 2 2 1 1 3 21 ! 9 4 4 4 1 5 1 1 2 2 2 31 10 4 4 5 3 4 5 5 3 2 3 38 Tabela 15.11 Pomocnicza tabela wyników do analizowanego przykładu f -o Grupy Pożycie Suma 1 2 3 4 5 6 7 9 10 fli 38 39 33 38 39 36 42 40 37 36 379 a? 16 16 21 14 18 17 20 15 14 15 166 Suma 55 55 54 52 57 53 62 55 51 51 545 Po wykonaniu pomocniczych obliczeń — (1) = 2970,25, (2) = 3541,00, (3) = = 3423,94, (4) = 2979,90, (5) = 3445,80, (6) = 3451,10 — przeprowadzamy analizę wariancji (por. tab. 15.12). Tabela 15.12. Tabela analizy wariancji do analizowanego przykładu Źródło wariancji SS df MS F Między osobami 480,85 9 A 453,695 1 453,695 133,634 Osoby w. gr. 27,16 8 3,395 Wewnątrz osób 89,90 90 B 9,65 9 1,072 1,134 AB 12,21 9 1,356 1,435 B-osobv w gr. 68,04 72 0.945 Cała 570.75 99 5,32 2,00 Machowski (1993, s. 50-54) zaproponował obliczanie nieobciążonego estymatora mojego wskaźnika dobroci testu. Daje on wyniki „lepsze", aczkolwiek tylko nieznacznie różniące się (wyższe) od wartości wskaźnika liczonej wg wzoru (15.65). 498 Następnie analizujemy efekty proste A w b}. Rezultaty analizy wariancji tych efektów przedstawia tab. 15.13. Tabela 15.13. Tabela analizy wariancji dla efektów prostych: A w bj do analizowanego przykładu Źródło wariancji SS df MS F h 52,9 1 52,9 44,45 52,9 1 52,9 44,45 h 14,4 1 14,4 12,10 57,6 1 57,6 48,40 b, 44,1 1 44,1 37,05 h 36,1 1 36,1 30,33 h, 48,4 1 48,4 40,67 b* 62,5 1 62,5 52,52 b9 52,9 1 52,9 44,45 44,1 1 44,1 37,05 MSbląd - 1,19 FmA#0 » 2,00 Okazuje się, że wszystkie pozycje różnicują — na założonym przez nas po- ziomie istotności a = 0,05 — grupy kryterialne. Tak więc ostateczna wersja testu równa jest wersji wyjściowej. Po podstawieniu danych z tab. 15.12 do wzoru (15.65) mamy: _ 453,69 - 89,90 DT= •100% = 80,18%. 453,69 Można wobec tego przyjąć, iż zaprojektowany przez nas test psychologiczny jest narzędziem dobrym, pomocnym w formułowaniu diagnozy różnicowej w za- kresie różnicowania grup kryterialnych: ax i a2. 9. Metody oparte na analizie związku pozycji testowych z ogólnym wynikiem testu 9.1. Wzór Spearmana-Browna Niejako ubocznym produktem analizy pozycji testowych (badanie ich mocy dys- kryminacyjnej pojmowanej jako korelacja pozycji testowej z ogólnym wynikiem testu — por. rozdz. 16.) jest zbiór współczynników korelacji (punktowo-dwuseryj- nej) każdej pozycji z wynikiem ogólnym testu. Możemy też obliczyć średnią tych korelacji — rit. Zachodzi związek między średnią interkorelacją pozycji testowych (/•„?) i średnią korelacją pozycji z ogólnym wynikiem testowym (rit): rir = rit2. 32* 499 Współczynnik Spearmana-Browna oblicza się wg wzoru (15.66a, 15.66b): Tt,~ " 1 (15.66a) gdzie: r„ — średnia korelacja (punktowo-dwuseryjna) pozycji testowych z ogólnym wynikiem testu; n — liczba pozycji w teście, lub: r i - ,.t'-. (15.66b) gdzie: ru— średnia interkorelacja pozycji testowych; n — liczba pozycji w teście. 9.2. Wzór Gulliksena Ł <*» Gulliksen (1950, s. 378) zaproponował wzór (15.67) na r„, wykorzystujący zarówno informacje o wariancjach poszczególnych pozycji testowych, jak i o ko- relacjach poszczególnych pozycji z ogólnym wynikiem testu (traktowanym jako suma odpowiedzi na poszczególne pozycje): n-\ 1- (15.67) gdzie: var, — wariancja i-tej pozycji testowej; r„ — współczynnik korelacji pun- ktowo-dwuseryjnej pozycji z ogólnym wynikiem testu; s, — odchylenie stan- dardowe i-tej pozycji. Zdaniem Guilforda (1954, s. 386) wzór (15.67) ma tendencje do niedoszaco- wywania rzetelności testu. ,, , . , 10. Metody oparte na badaniu stopnia zgodności sędziów kompetentnych (współczynnik W-Kendalla) W tym punkcie zapoznam Czytelnika ze sposobem oceny stopnia zgodności wy- dawanych przez sędziów kompetentnych ocen, dotyczących odpowiedzi osób ba- danych na poszczególne pozycje testu psychologicznego (ale dotyczy to także ja- kiejkolwiek innej metody diagnostycznej). Metoda badania zgodności ocen sędziów kompetentnych bywa też wykorzystywana do oceny rzetelności zestawów kryteriów ocen jakiejś formy zachowania się osób badanych. Takimi sędziami mogą być 500 I doświa dczeni klinicy ści, oceniaj ący na specjal nie opraco wanyc h skalach szacun ko- wych postęp y pacjent a poddan ego psycho terapii, wycho wawcy w zakłada ch peni- tencjar nych oceniaj ący zachow anie się więźni ów, nauczy ciele oceniaj ący wytwor y ucznió w itp. W takich i innych przypa dkach, gdzie mamy do czynie nia z wielom a zbiora mi ocen, a każdy taki zbiór pochod zi od innej osoby, interes uje nas stopień zbieżn ości tych ocen. Mówią c inaczej , interes uje nas stopień korelac ji między k zbiora mi ocen dotycz ących n obiektó w. Miarą tej współz ależnoś ci jest współc zynnik zgodno ści (ang. coeffici ent of concor dance) W- Kendal la (1961). Współc zynnik ten znajduj e także zastoso wanie przy rozdzie laniu pozycji do różnyc h kategor ii (wymia rów) ??- sortu. Ws półczyn nik W przyjm uje wartośc i od „0" (brak zgodno ści) do „+1" (całko- wita zgodno ść). Jest on wyrażo ny na skali porządk owej. Wysoki istotny wynik W interpre tujemy jako fakt zgodno ści sędzió w co do kryterió w, którymi posługi wali się przy ocenian iu danych obiektó w. Musim y zdawać sobie sprawę z faktu, iż oblicza nie współc zynnika W ma sens tylko wtedy, gdy sędzio wie umieją posługi wać się w sposób rzeteln y pewny m kryteriu m oceny i gdy każdy z nich dokonu je tej oceny niezale żnie od drugieg o. Trzeba także podkreś lić, iż wysoka wartość współc zynnika W wcale nie oznacza , że ocena określo nych obiektó w jest popraw na. Może być tak, że sędzio wie posługu jąc się fałszyw ym kryteriu m (z punktu widzeni a kryteriu m zewnętr znego) doszli do zgodny ch opinii. Zatem wysoka zgod- ność sędzió w wcale nie oznacza wysoki ej trafnośc i kryteriu m, którym posługi wali się dokonuj ąc swoich niezale żnych ocen. Prz ykłado wo, Kowali k (1981) badał wpływ system ów rehabili tacyjny ch na kształto wanie się osobow ości upośled zonych umysło wo. Badania były przepro wa- dzone na obozie letnim. Trzech sędziów kompet entnych oceniał o stopień ukształ- towania się pięciu cech osobow ości u 14 osób upośled zonych umysło wo. Postępo wanie badawc ze wygląd ało następu jąco: „każde mu z sędziów kompet entnych do- kładnie scharak teryzow ano cechy osobow ości, ze względ u na które mieli oni ocenić upośled zonych. Następn ie każdy z sędziów otrzyma ł 14 kartecz ek z nazwisk ami badany ch, które należał o uszereg ować ze względ u na stopień rozwoju u osób upo- śledzon ych umysło wo badany ch cech osobow ości" (Kowali k, 1981, s. 151). Poniż- sze zestawi enie pokazuj e stopień zgodno ści ocen sędzió w dla każdej cechy osobo- wości (tamże, s. 152): Wartość W: 0,80 0,78 0,85 0,95 Cecha osobowości: (1) (2) inicjatywa stabilność zadaniowa (3) współdziałanie (4) wytrwałość (5) inteligencja a : 0,01 0,01 0,01 0,75 0,05 Współczynnik W jest współczynnikiem obliczanym dla danych wyrażonych na skali porządkowej i wymaga uprzedniego porangowania wyników podanych przez 501 sędziów. Ponieważ z praktyki dydaktycznej wiem, iż studenci nie zawsze wie- dzą jak rangować wyniki powtarzające się w zbiorze wyników, więc zanim przy- stąpię do omówienia metody Kendalla, zapoznam Czytelnika z zasadami rango- wania. Zasady rangowania Rangowanie polega na przypisywaniu uporządkowanemu zbiorowi wyników surowych liczb naturalnych tzw. rang. Możemy uporządkować wyniki surowe od najmniejszego do największego lub też w kolejności odwrotnej. Załóżmy że mamy zbiór składający sie z pięciu wyników: /. wyniki: 8, 3, 10, 11, 9. Najpierw musimy zbiór ten uporządkować, np. w kolejności rosnącej: //. wyniki: 3, 8, 9, 10, 11. Kolejnym krokiem jest przyporządkowanie każdemu wynikowi, począwszy od najmniej- szego, kolejnych liczb całkowitych: 1, 2, 3, ... Są to tzw. rangi: ///. wyniki: 3, 8, 9, 10, 11, rangi: 1, 2, 3, 4, 5. Bardziej skomplikowane jest rangowanie w przypadku występowania kilku takich samych wyników, jak w poniższym przykładzie - dla zbioru 10 wyników surowych: /. wyniki: 10, 10, 50, 30, 100, 100, 100, 100, 100, 70. Po uporządkowaniu wyników, np. w kolejności malejącej, i przypisaniu każdemu z nich (począwszy od największego) kolejnych liczb całkowitych uzyskujemy dwa ciągi liczb: //. wyniki: 100, 100, 100, 100, 100, 70, 50, 30, 10, 10, liczby: 1, 2, 3, 4, 5, 6, 7, 8, 9, 10. Powtarzają się tutaj: dwukrotnie wynik 10 i pięciokrotnie wynik 100. Dla tych samych wyników należy obliczyć wspólne rangi, tzw. rangi wiązane (ang. ties). Oblicza się je w ten sposób, iż dzieli sie sumę liczb przyporządkowanych tym samym wynikom przez liczbę tych samych wyników, np. dla wyniku 10 mamy: (9+ 10): 2 = 9,5. Po przeprowadzeniu tych operacji mamy: ///. wyniki: 100, 100, 100, 100, 100, 70, 50, 30, 10, 10, liczby: 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 7, 8, rangi: 3, 6, 7, 8, 9,5. Po skasowaniu środkowego wiersza otrzymujemy: IV. wyniki: 100, 100, 100, 100, 100, 70, 50, 30, 10, 10, rangi: 3; 3; 3; 3; 3; 6; 7; 8; 9,5; 9,5. Technika obliczania współczynnika W. Przed przystąpieniem do obliczania współczynnika W musimy porangować k zbiorów ocen. Rangując obiekty, rangę 1 przypisujemy obiektowi „najlepszemu" pod danym względem, rangę W obiektowi „najgorszemu". Następnie sporządzamy tabelę obliczeniową o k (liczba sędziów) wierszach i N (liczba ocenianych obiektów) kolumnach, czyli tabelę kx N.W pola tabeli wpisujemy rangi ocen poszczególnych obiektów. Sporządźmy taką tabelę fikcyjnych ocen dokonanych przez 3 sędziów dla 10 osób. Już porangowane dane zawiera tab. 15.14. 502 Tab. 15.14. Tabela pomocnicza do obliczania współczynnika W; wg tabeli 9.13 Tabela zawiera wyniki już porangowane (Siege l, 1956, s. 234). 1 2 3 4 5 6 7 8 9 10 11 12 ^N. Osoby Sedziowie^\^ 1 2 3 4 5 6 7 8 9 10 I A B C 1 2,5 2 4,5 1 1 2 2,5 4,5 4,5 4,5 4,5 3,0 4,5 4,5 7,5 8 4,5 6 9 8 9 6,5 8 7,5 10 8 10 6,5 10 Rj 5,5 6,5 9,0 13,5 12 20 23 23,5 25,5 26,5 165 \Rj-M\ 11 10 7,5 3 4,5 3,5 6,5 7 9 10 (Rj-Af)2 121 100 56,25 9 20,25 12,25 42,25 49 81 100 591 Oznaczenia Rj — suma rang przypisanych przez sędziów y-tej osobie; Y,Rj — suma sum cząstkowych R/, M = (2_,RJ: N); N — liczba ocenianych osób; k — liczba sędziów. Po wpisaniu rang w pola tabeli obliczamy sumę rang dla poszczególnych ocenionych osób i wpisujemy ją w wiersz oznaczony Rj. Następnie dodajemy wszy- stkie sumy cząstkowe, a otrzymany wynik dzielimy przez ogólną liczbę ocenionych obiektów. W naszym przykładzie mamy: 165/10 = 16,5. W kolejny wiersz wpisują jemy wynik odejmowania poszczególnych Rj od średniej czyli od V Rj /NP. U nas: odejmujemy dziesięć razy Rj od 16,5. W ostatnim wierszu tabeli zamieszczamy kwadraty otrzymanych różnic. Suma kwadratów tych różnic daje wartość oznaczo- ną symbolem 5. Tutaj: 5= 591. Uzyskane dane: k = 3, N= 10, 5= 591 wstawiamy do wzoru (15.70) na W — po przeprowadzeniu jeszcze jednej operacji, a miano- wicie obliczeniu tzw. poprawki na rangi wiązane (o ile takie występują) wg wzoru: i, w' ?-''?'' gdzie: T - 12 (15.69) t — liczba ocen związanych tą samą rangą. Obliczamy poprawkę dla naszego przykładu: 12 _(23-2) + (23-2) TA- 12 - 1, _(23- 2) (23- 2). , _ _ (43 - 4) + (33 - 3) _ „ Tc~ 12 - 7, 503 =1 + 1,5 + 7 = 9,5. Wzór na W ma postać: w= ? i I I , -4 4 -I (15.70) 1=1 Po podstawieniu odpowiednich danych do wzoru (15.70) mamy: W= = 0,828. 591 1/12 x32(103- 10)- 3x9,5 Oczywiście w przypadku braku rang wiązanych poprawka równa się zero i wzór przyjmuje postać prostszą: W= - (15.71) Aby ocenić procent ogólnej wariancji ocen wydanych przez sędziów tłuma- czonej przez daną wartość W musimy obliczyć wg wzoru (15.72) średnią korelację rangową ocen (por. Ferguson, Takane, 1989, s. 423): Tr = f^; - ? - (.5.72, gdzie: rr — średnia korelacja rangowa ocen, inne oznaczenia — jak wyżej. Po podniesieniu wartości rr do kwadratu i przemnożeniu przez 100% uzyskamy procent wanancji ogólnej ocen tłumaczonej przez daną wartość W. Pozostały procent wariancji tłumaczą różnice indywidualne w sposobie oceny obiektów przez sędziów itp. Po podstawieniu danych z naszego przykładu do wzoru (15.72) mamy: _ 3 x 0 , 8 2 8 - 1 V r ~ 3 - 1 (rr)2 m (0,742)2 - 0,55 x 100% = 55%. Tak więc wartość W =0,828 tłumaczy około 55% wariancji ocen (jest to wa- riancja wspólna ocen). Resztę, tj. 45% tłumaczą różnice indywidualne w sposobie oceny badanych osób przez sędziów (jest to wariancja resztowa). Testowanie istotności W. Nie wystarczy tylko obliczyć wartość W, należy także przekonać się czy jest ona statystycznie istotna na danym poziomie a. A. W przypadku, gdy : (1) 3 < k<20 i (2) 3 Sa to przyjmujemy, że współczynnik W jest istotny na tym poziomie a. B. W przypadku, gdy N>1 dokonujemy aproksymacji rozkładu W do rozkładu chi-kwadrat ze stopniami swobody df=N- 1 wg wzoru: I f = W m . ( 1 5 . 7 3 ) Spr aw dza my zat em isto tno ść W pop rze z isto tno ść chi - kw adr at. Po nieważ w naszy m przykł adzie N= 10 więc musim y zastos ować sposób te- stowan ia opisan y w punkci e B. Mamy zatem po podsta wieniu do wzoru (15.73 ) naszyc h danych : j 2 = 3 x ( 1 0 - 1 ) x 0 , 8 2 8 = 2 2 , 3 5 6 ; d f = 1 0 - 1 = 9 . Ta blice krytyc znych wartoś ci x2 (tablic e te zawier a każdy podręc znik statyst yki) pokaz ują, że x2 — 22,356 przy df= 9 jest istotne na pozio mie a = 0,01. Gd ybyśm y chcieli wybra ć „najlep szy" obiekt powin niśmy kierow ać się wiel- kością Rj jako kryteri um. „Najle pszym " obiekt em jest ten, który uzyska ł najmni ejszą wartoś ć Rj. W naszy m przykł adzie jest to osoba nr 1. „Najg orsza" jest osoba nr 10. 11. Podsumowanie Proble matyka rzeteln ości i błędu standar doweg o, nawet ogranic zona do prezent acji tylko jedneg o modelu , tj. modelu klasycz nego, przedst awione go w podsta wowej monog rafii Gulliks ena Theory ofment al tests (1950), znaczn ie wykrac za poza ramy jedneg o rozdzia łu podręc znika metodo logii badań psycho logiczn ych. Z tego też powod u można w nim było zapreze ntować jedynie zarys tej proble matyki. Podsta- wowy m kryteri um selekcj i materia łu oraz sposob u jego ujęcia było dla mnie przed- stawie nie podsta w, umożli wiając ych, z jednej strony zrozum ienie istoty teorii rze- telnośc i testów psycho logiczn ych, a z drugiej samod zielne skonstr uowani e testu, który odpowi adałby standar dom psycho metryc znym (przede wszyst kim tym, które wyłożo ne są w podsta wowy m opraco waniu APA, 1985a) . O mawiaj ąc różne podejś cia do badani a rzeteln ości starałe m się zaakce ntować zarówn o „plusy" , jak i „minus y" każdeg o z nich. Wieloś ć podejść do badani a rzetel- ności nie oznacz a, że Czytel nik może swobo dnie wybrać sobie jedno z nich i całe badani e rzeteln ości „swoje go" testu ogranic zyć tylko do tego jedneg o podejśc ia, np. badani a wewnę trznej zgodno ści testu. Takie postęp owanie należy uznać za niepełn e. Otóż, w zależno ści od charakt eru testu, jego przezna czenia, psychol og powini en zbadać różne aspekty rzeteln ości testu, związa ne z różnym i źródła mi warian cji błędu (podob nie jest zresztą w przypa dku badani a trafnoś ci testu, o czym piszę w rozdz. 17.). Ta k samo powin no się analizo wać różne estyma tory błędu standar doweg o, a nie ograni czać się jedynie do określa nia błędu pomiar u wynik u prawdz iwego (ESM) przy 505 konstruowaniu przedziału ufności dla wyniku prawdziwego. Takim alternatywny rozwiązaniem jest posłużenie się błędem estymacji wyniku prawdziwego (SEE). Czytelnik, który dotarł, za autorem, aż do tego miejsca, zapewne się zapyta, jaka minimalna rzetelność testu uprawnia jego użytkownika do posłużenia się nim w celach badawczych czy diagnostycznych? Otóż odpowiedź na to pytanie jest jed- nocześnie prosta i złożona. Można bowiem odpowiedzieć krótko — jak najwyższa! Taka odpowiedź nie może jednak zadowolić Czytelnika, który konstruując test na ogół nie spodziewa się, że jego rzetelność będzie wynosiła, powiedzmy, r„ = 0,95. Spróbujmy tedy udzielić tej drugiej, bardziej złożonej odpowiedzi. Ogólnie uważa się, że do oceny indywidualnej zupełnie wystarczy, gdy r„ = 0,80, a zdaniem Davisa (por. Choynowski, 197 lb, s. 114) nawet 0,75. Im subtelniej szych chcemy dokonać rozróżnień między osobami badanymi za pomocą danego testu, tym wię- kszą rzetelnością powinien charakteryzować się test i tym mniejszy powinien być błąd standardowy, a w konsekwencji zbudowany przez psychologa przedział ufno- ści będzie stosunkowo „krótki". Problematyka poruszona w tym rozdziale jest przedstawiona także w następu- jących opracowaniach: Guilford J.P. Teoria testów psychologicznych; Guilford J.P. Rzetelność i traf- ność pomiarów; Machowski A. Rzetelność testów psychologicznych. Dwa ujęcia modelowe; Magnusson D. Wprowadzenie do teorii testów (rozdz. 5.: Rzetelność, s. 92-118; rozdz. 6.: Standardowy błąd pomiaru, s. 119-134); Niemierko B. Testy osiągnięć szkolnych. Podstawowe pojęcia i techniki obliczeniowe (rozdz. V: Rze- telność testu, s. 220-280); Nowakowska M. Psychologia ilościowa z elementami naukometrii (rozdz. 1.: Zarys współczesnej teorii testów, s. 16-83). Alternatywne, do metody Kendalla, podejście do badania zgodności sędziów kompetentnych z wykorzystaniem analizy wariancji omówione jest w: Brzeziński J., Maruszewski T. Metoda sędziów kompetentnych i jej zastosowanie w badaniach pedagogicznych; Guilford J.P. Rzetelność i trafność pomiarów (s. 81-85). . . 1. Wprowadzenie Moc dyskryminacyjna danej pozycji danego testu (ang. itetń) mówi nam o tym, w jakim stopniu różnicuje ona daną populację pod względem cechy (zmiennej), której dotyczy. W ujęciu operacyjnym moc dyskryminacyjna wyraża się współczynnikiem korelacji między pozycją i wynikiem ogólnym testu, traktowanym jako suma od- powiedzi zgodnych z kluczem (np. suma odpowiedzi poprawnych na 29 pytań testu „Wiadomości" Skali Inteligencji WAIS-R Wechslera — por. Brzeziński, I993c). Zagadnienie oszacowania mocy dyskryminacyjnej poszczególnych pozycji testu można więc sprowadzić do kwestii doboru odpowiedniego współczynnika korelacji między pozycją i wynikiem testu. Najczęściej jako miary mocy dyskryminacyjnej używa się jednego z trzech współczynników korelacji: (a) współczynnika korelacji punktowo-dwuseryjnej (rpbi), (b) współczynnika korelacji dwuseryjnej (rbi), (c) współczynnika korelacji punktowo-czteropolowej (. Zaletą tego współczynnika jest to, że może on być stosowany nawet wtedy, gdy rozkłady wyników znacznie odbiegają od kształtu rozkładu normalnego. Na podstawie śred- niej korelacji punktowo-dwuseryjnej obliczonej między poszczególnymi pozycjami testu i wynikiem ogólnym można dokonać estymacji rzetelności kwestionariusza wg wzoru Spearmana-Browna tak, jak to zaleca Guilford (tamże, s. 459). Jest on opisany w rozdz. 15., pkt. 9.1. Jednakże współczynnik korelacji punktowo-dwuseryjnej ma znacznie więcej wad niż zalet. Po pierwsze, jego wartość zależy od trudności pozycji testu. Tak więc zmiana trudności pozycji testu na kontinuum: 0,0-1,0 począwszy od 0,50 w obu kierunkach, powoduje spadek największej możliwej wartości współczynnika (Hubbard i Clemans, 1972, s. 61). Po drugie, w warunkach, w których można stosować współczynnik rw — współczynnik rpbi da znacznie niższe od rbi oszacowanie współczynnika r-Pearsona, nawet w sytuacji, gdy zmienna nie ma rozkładu normalnego. Opisanych wad nie ma trzeci z wymienionych wyżej współczynników kore- lacji — rbi. 2.3. Współczynnik korelacji dwuseryjnej — korzystanie z tablic Flanagana (metoda dolnych i górnych 27% próby) Współczynnik korelacji dwuseryjnej stosuje się w takich samych sytuacjach, co omówiony poprzednio współczynnik, tzn., gdy jedna ze zmiennych została sprowa- dzona do dwóch klas, przy czym zmienna ta ma w rzeczywistości rozkład normalny (wymaganie rozkładu normalnego odnosi się do kształtu rozkładu w populacji, a nie w próbie). Przed przystąpieniem do obliczania wartości rbi dla /-tej pozycji musimy podzielić badaną próbę na dwie grupy: tych którzy odpowiedzieli na i-tą pozycję zgodnie z kluczem i tych, którzy odpowiedzieli na i-tą pozycję niezgodnie z kluczem. Następnie obliczamy średnie ogólne wyniki w teście w obu grupach i odchylenie standardowe rozkładu wyników testu w całej próbie. Uzyskane dane podstawiamy do wzoru (Guilford, 1954, s. 427): Mp-Mq (16.4) gdzie: Mp, Mq, s, p, q — oznaczenia jak we wzorze (16.3); y — rzędna roz- kładu normalnego odpowiadająca punktowi p (np. Guilford, 1964, Tablica G., s. 548-549). Współczynnik rbi przyjmuje wartości z przedziału <-l, +1>, gdy rozkład wy- ników nie odbiega od normalnego. W sytuacji analizy dwóch grup skrajnych (liczących po 27% liczebności całej próby) można posłużyć się specjalnie do tego celu opracowanymi przez Flanagana (w: Thorndike, 1961, s. 345-351) tablicami. Zostały one zamieszczone w Dodatku B, tablica 9. Korzystanie z nich jest bardzo proste — do „boczku" i „główki" tablicy wstawiamy proporcje odpowiedzi zgodnych z kluczem, odpowiednio w dolnej i górnej grupie próby standaryzacyjnej. Wspólną zaletą omówionych wyżej dwóch współczynników korelacji: rpbi i rbi jest to, że można ich wartości przeliczać na wartości z-Fishera wg wzoru: z = 0,5/n l+r 1 -r (16.5) lub korzystając ze specjalnej tabeli, którą Czytelnik znajdzie w Dodatku B, tab. 7. Przekształcenie z-Fishera upoważnia do wykonywania działań pozwalających osza- cować różnice między współczynnikami korelacji. Ma to znaczenie, gdy konstru- ujemy kwestionariusz wielowymiarowy i interesuje nas stopień korelacji pozycji z każdym czynnikiem (skalą) kwestionariusza oddzielnie, przy czym daną pozycję włączamy do tego wymiaru (skali), z którym ona najwyżej koreluje. Poza tym współ- czynnik korelacji pozycji ze skalą, do której ta pozycja została włączona powinien znacznie różnić się od współczynnika korelacji tej pozycji z pozostałymi skalami kwes- tionariusza. Powyższych ocen dokonujemy korzystając z wartości z, gdyż na „czys- tych" współczynnikach korelacji nie można wykonywać działań arytmetycznych. Przekształceniem z posłużył się Choynowski (1968) przy wstępnym roz- dzielaniu pozycji oryginalnej wersji M/Y-Eysencka do trzech skal wersji adap- tacyjnej (skali neurotyczności, skali ekstrawersji i skali kłamstwa) oraz przy obliczaniu różnic w wartościach z pozycji dla jednej skali z wartościami z dla dwóch pozostałych skal. Obliczone wartości winie pozwoliły Choynowskiemu na dobór do poszczególnych skal tylko tych pozycji, dla których różnice w wartościach z były największe. Kryterium włączenia pozycji do danej skali kwe- stionariusza było uzależnione od rozpiętości uzyskanych różnic w wartościach z. Do danej skali włączono tylko pozycje o najwyższych wartościach z uporząd- kowanego szeregu wartości z. Omówiona procedura zapewnia utrzymanie pewnej niezależności poszczegól- nych wymiarów kwestionariusza. I 2.4. Sprowadzanie pozycji wielokategorialnej do postaci dwukategorialnej (metoda Ed wardsa- Kilpatricka) Dotychczasowe rozważania dotyczyły obliczania mocy dyskryminacyjnej tych po- zycji testu, które miały postać dwukategorialną („0-1"), tzn. takich, na które od- powiedzi zgodne z kluczem były oceniane jako 1 pkt., a odpowiedzi niezgod- ne z kluczem jako 0 pkt. Problem komplikuje się, gdy chcemy obliczyć moc dys- kryminacyjną pozycji wielokategorialnych, jak np. w skalach postaw typu Likerta. 511 Zapoznajmy się teraz z regułą, wg której można sprowadzić pozycję wielo- kategorialną do postaci dwukategorialnej — zero-jedynkowej, która umożliwi za- stosowanie powyższych technik obliczania mocy dyskryminacyjnej. Jest to reguła podana przez Edwardsa i Kilpatricka (Edwards, 1957, s. 213). Tabela 16.1. przed- stawia hipotetyczne rozkłady odpowiedzi na i-tą pozycję testu w dolnej i górnej grupie 27% całej próby. Tabela 16.1. Pozycja 20. ze Skali Kontroli Antycypacyjnej KKE — rozkłady odpowiedzi w dolnej i górnej grupie 27% (n = 200) Kategorie odpowiedzi Punkty Dolna grupa 27% Górna grupa 27% nigdy rzadko 3 2 8 ]31 23 często zawsze 1 0 31 15 18 5 suma 54 54 Aby sprowadzić pozycję do postaci zero-jedynkowej musimy przeprowadzić linię podziału między kategoriami. Nasuwa się pytanie: między którymi kategoria- mi przeprowadzić tę linię? Można ją przeprowadzić między punktami 3 i 2, albo między 2 i 1 lub też między 1 i 0. Nasza decyzja co do przeprowadzenia tej linii nie może być arbitralna; musi ona opierać się na jakiejś zasadzie, regule. Jest nią właśnie reguła Edwardsa-Kilpatricka, która mówi: linia podziału musi być przepro- wadzona w takim miejscu, aby całkowita suma wyników nad linią w dolnej grupie i pod linią w grupie górnej była najniższa z możliwych sum. W naszym przykładzie będą to trzy sumy: — między punktami 3 i 2: (0) + (23 + 18 + 5) = 46, — między punktami 2 i 1: (0 + 8) + (18 + 5) = 31, — między punktami 1 i 0: (0 + 8 + 31) + (5) = 44. Suma=31 pokazuje nam, iż linię podziału należy przeprowadzić między pun- ktami 2 ii, jak przedstawia tabela 16.1. Kategoriom nad linią podziału przypisu- jemy 1 pkt, a kategoriom pod linią — 0 pkt. Dodajemy teraz do siebie liczebności nad linią podziału w dolnej i górnej grupie i otrzymujemy: — w dolnej grupie: 0 + 8 = 8, — w górnej grupie: 8 + 23 = 31. Obliczamy proporcję powyższych sum w dolnej i górnej grupie. Proporcje te wynoszą odpowiednio: 8/54 = 0,14 i 31/54 = 0,57. Wartości 0,14 i 0,57 wstawiamy do „boczku" i „główki" jednej z czterech tablic Flanagana i otrzymujemy poszu- kiwaną wartość współczynnika korelacji dwuseryjnej, która wynosi w naszym przy- kładzie 0,475. W przypadku obliczania współczynnika ę z powyższych danych, wartości 0,14 i 0,57 musimy wstawić do „boczku" i „główki" jednej z tablic Jur- gensena. 512 Sporządzając dla każdej pozycji z eksperymentalnej wersji testu tabelkę po- dobną do tabeli 16.1, sprowadzamy każdorazowo pozycję testu do postaci zero-je- dynkowej, możemy więc obliczyć dla wszystkich pozycji wskaźniki mocy dys- kryminacyjnej. Istnieje pewne powiązanie między mocą dyskryminacyjną pozycji testu i jego rzetelnością. Widać to wyraźnie na przykładzie wzoru Spearmana-Browna (por. rozdz. 15., pkt. 9.1), wg którego dokonuje się estymacji rzetelności testu ze średniej korelacji pozycji z ogólnym wynikiem testu. Im wyższe są wskaźniki mocy dys- kryminacyjnej, tym wyższa jest rzetelność testu (w sensie jego jednolitości). 3. Podsumowanie Czytelnika zainteresowanego pogłębieniem wiadomości na temat mocy dyskrymi- nacyjnej pozycji testowych odsyłam do następujących publikacji dostępnych w ję- zyku polskim: Brzeziński J. (red.) Problemy teorii, rzetelności, konstrukcji i analizy wyników testów psychologicznych, tom II (rozdz. 3.: Tworzenie testu, s. 104-175); Magnusson D.E. Wprowadzenie do teorii testów (rozdz. 14.: Analiza zadań, s. 292-331). Rozdział 17. TrafllOŚĆ 1. Wprowadzenie Jednym z podstawowych problemów nurtujących psychologiczną praktykę badaw- czą i diagnostyczną jest pytanie o to, co tak naprawdę mierzą testy psychologiczne, za pomocą których psychologowie pozyskują dane empiryczne. O ile psychologo- wie — i ci prowadzący badania naukowe, i ci prowadzący badania o charakterze użytkowym (diagnostyczne i selekcyjne) — starają się zwracać uwagę na takie parametry testu jak rzetelność (por. rozdz. 15.) czy błąd standardowy pomiaru (por. rozdz. 16.), to ich zainteresowanie kolejnym ważnym parametrem jakim jest traf- ność jest (tak to wygląda z mego punktu obserwacyjnego) nazbyt słabe (wbrew zaleceniom zawartym w standardach obowiązujących i konstruktora, i użytkownika testu — por. APA., 1985a, 1985b). W Standardach... (1985a, s. 33) czytamy: „Pytanie o trafność to pytanie o to, co można poprawnie wywnioskować na podstawie wyniku testowego. Pojęcie traf- ności dotyczy poprawności wniosków wyprowadzanych na podstawie wyników te- stowych lub innych form badania. Wszelkie potencjalne pytania o trafność dadzą się sprowadzić do dwóch: a) jakie wnioski można wyciągnąć na temat tego, co jest mierzone przez test; oraz b) jakie wnioski można sformułować o innych (pozate- stowych) zachowaniach? Pytanie pierwsze dotyczy istoty pomiaru jako takiego. Test — będący tu in- strumentem pomiarowym można bowiem traktować jako definicję operacyjną okre- ślonej dziedziny zdolności, bądź też cechy stanowiącej przedmiot zainteresowania autora testu lub jego użytkownika. W tym wypadku podstawowym zagadnieniem jest ustalenie, jak wiernie wyniki testu odzwierciedlają tę dziedzinę; stąd owo pytanie jest pytaniem o trafność pomiaru. Pytanie drugie dotyczy użyteczności pomiaru jako wskaźnika jakiejś innej zmiennej, jako elementu umożliwiającego przewidywanie zachowań. Teraz naczel- ną kwestią jest ustalenie, w jakim stopniu wyniki testowe są powiązane z innymi zachowaniami, a zatem mamy tu do czynienia z pytaniem o siłę związku między zmiennymi." 514 Psycholog, z większym lub mniejszym zaufaniem, interpretuje — odwołując się do jakiejś teorii psychologicznej — uzyskany wynik testowy. Chciałbym wyraźnie podkreślić, iż wynik testowy istnieje tylko w kontekście określonej teorii psychologicznej (pisałem o tym, jak się wydaje bardzo wyraźnie, w rozdz. 3., pkt. 3.). Co prawda, niektórzy psychologowie sądzą, że możliwe jest skonstruowanie wartościowego testu psychologicznego bez odwołania się do teorii psychologicznej, ale takie podejście jest niezgodne z „duchem" procedury operacjonalizacji zmien- nych teoretycznych (por. rozdz. 7.). Przykładowo, Jakubowski (1983, s. 226) wska- zuje na skalę F MMPI1 jako taką, która nie jest powiązana z żadną teorią, gdyż składa się z twierdzeń „na które 90% próbki normalizacyjnej odpowiadało tak samo; treść twierdzeń nie była brana pod uwagę". Uważam jednak, że u podstaw skali F leżą określone założenia teoretyczne (ukryte) dotyczące stylu udzielania odpowiedzi na pytania kwestionariuszowe. Można je „wydobyć" z opisu skali i za- sad interpretacji jej wyników przedstawionych w podręczniku Matkowskiego (1992, s. 26-28). Można też, na przykład, odwołać się do modelu udzielania od- powiedzi na pytania kwestionariuszowe opracowanego przez Nowakowską (1975, s. 154), a empirycznie zilustrowanego danymi z badania kwestionariuszem 16 PF Cattella. Także Cronbach i Meehl (1955) zauważyli, iż możliwe jest powiązanie wyników poszczególnych skal MMPI z jakąś teorią psychologiczną: „...chociaż MMPI powstał na podstawie empirycznego różnicowania między grupami pacjen- tów i tak zwanymi normalnymi (trafność diagnostyczna), późniejsze badania pró- bowały stworzyć podstawę dla opisu osobowości związanej z każdym układem cech. Takie interpretacje pozwalają klinicyście na przewidywanie funkcjonowania ze względu na kryteria, które dotychczas nie były stosowane w empirycznych ba- daniach nad trafnością". Jeżeli owa interpretacja ma być sensowna (sensowna na gruncie określonej, wbudowanej w świadomość metodologiczną psychologa, teorii psychologicznej — por. rozdz. 3., pkt. 3.), to psycholog musi wpierw odpowiedzieć na podstawowe pytanie: co tak naprawdę mierzy ten test psychologiczny, a dokładniej: (a) jego wynik ogólny, (b) wyniki cząstkowe, powstałe po pogrupowaniu tych pozycji, które uznane zostały za podobne pod jakimś względem (np. o wysokich ładunkach czynniko wych na tym samym czynniku), (c) odpowiedzi na poszczególne, pojedyncze pozycje (zadania testu inteligencji czy pytania kwestionariusza osobowości)? Przykładem dobrej, pod tym względem, roboty psychometrycznej są analizy poszczególnych pozycji testów wchodzących w skład Skali Inteligencji W-B We- chslera przeprowadzone przez Rapaporta (1945). Pytanie o trafność testu jest pytaniem dla psychologa-empiryka podstawowym. Bez udzielenia na nie jasnej, jednoznacznej odpowiedzi nie sposób poważnie (w I „Skalę F tworzą 64 twierdzenia, na które jedynie niewielki procent ludzi (10% i mniej) odpo- wiada zgodnie z kluczem. Zadaniem tej skali miało być wykrywanie nietypowych i dewiacyjnych sposobów odpowiadania na pytania testu" (Matkowski, 1992, s. 26). 515 zgodzie z obowiązującymi psychologa standardami psychometrycznymi) interpre- tować rezultatów badania testowego. 2. Cztery aspekty trafności W psychometrii wyodrębnia się cztery podstawowe, można powiedzieć: „kanoni- czne", aspekty (rodzaje) trafności (APA, 1985a, 1985b; Loevinger 1957; Jakubo- wski, 1982; Curreton, 1951; Cronbach, 1971; Campbell, 1960; Messick, 1980, 1989, 1995; Magnusson, 1991; Niemierko, 1975). O trzech z nich (trafności: diag- nostycznej, prognostycznej i treściowej) będzie mowa w pkt. 2., a o czwartym, trafności teoretycznej (wg.: Cronbach, Meehl 1955) — jako w mojej opinii naj- ważniejszym — i dwóch głównych metodach analizy tego aspektu trafności trakto- wać będą trzy punkty 3., 4. i 5. Trudno powiedzieć, dlaczego utrwaliło się wśród psychologów przekonanie, że oprócz tzw. Holy Trinity (por. Guion, 1980), tj.: (1) trafności kryterialnej — diagnostycznej i prognostycznej (ang. criterion oriented validity — concurrent validity i predictive validity), (2) trafności treściowej (ang. content validity), (3) trafności teoretycznej (ang. construct validity), wyróżnia się jeszcze czwarty rodzaj „trafności", a właściwie pseudotrafności: (4) trafność fasadową (ang. face validity). „Trafność fasadową" (celowo używam cudzysłowu, aby podkreślić, iż mamy w tym przypadku do czynienia z pseudotrafnością) określił przed wielu laty Guil- ford (1954, s. 400; też: Guilford, 1988, s. 88): „termin trafność fasadowa ma wiele znaczeń i stosowany jest nader swobodnie. Najczęściej wiąże się go z faktem, że test wydaje się trafny i to szczególnie tym osobom, które nie posiadają profesjo- nalnego wykształcenia w dziedzinie badań testowych. To, że test wydaje się trafny, nie jest jeszcze oczywiście żadną gwarancją rzeczywistej trafności tego testu (...) i nawet doświadczony psycholog powinien być bardzo ostrożny wobec tego typu informacji. Niektórzy mówiąc o zasadach akceptacji niektórych testów twierdzą żartobliwie, że są one stosowane na zasadzie wiary w trafność (faith validity)". Inny wybitny psychometra, Mosier (1947; cyt. za: Guilford, 1988a, s. 88) poddając krytycznej analizie pojęcie „trafności fasadowej" zwrócił uwagę na tzw. trafność na mocy założenia (ang. validity by assumptioń), co Guilford skomentował nastę- pująco: „istnieją takie miary (np. wyniki testu osiągnięć), których trafność przyj- mowana jest na mocy umowy. Innymi słowy zakładamy, że wyniki testowe rze- czywiście mierzą to, co chcemy aby mierzyły. (...) trafność niektórych testów (in- nych niż testy osiągnięć) również przyjmowana jest na mocy umowy. (...) Prawdzi- wym przeżyciem poznawczym jest praca nad testem, który tak dobrze wydaje się mierzyć daną cechę, że z całą pewnością nie może chybiać, a po zastosowaniu analizy korelacyjnej okazuje się mierzyć zupełnie inne czynniki". Błąd tkwi w 516 ekonaniu, że: „dwie rzeczy, mające tę samą nazwę (...) są skutkiem tego tym nym" (Bechtoldt, 1968, s. 37). I jeszcze jeden cytat. Tym razem zaczerpnięty ze ndardów... (APA, 1985a, s. 34): „Tak zwana trafność fasadowa będąca tylko zorem trafności, nie jest właściwą podstawą wniosków wyprowadzanych z wy- ków testowych". Ten rodzaj pseudotrafności upowszechnił się w Polsce, jak sądzę, za sprawą oynowskiego, który opublikował, skądinąd ważny i wartościowy artykuł Bech- toldta, specjalisty (nawiasem mówiąc krytyka trafności teoretycznej — por. Bech- toldt, 1959) od zagadnień trafności testów psychologicznych, pt.: Teoretyczne pod- stawy metod testowych: trafność i prognoza (Bechtoldt, 1968). To w tym artykule czytamy m. in.: „termin trafność fasadowa dotyczy sposobu, w jaki badani reagują na wygląd testu i na metodę testowania — niektóre testy są dla badanych bardziej strawne niż inne. Bardziej ogólnym terminem oddającym to, o co tu chodzi, jest kontakt stworzony między badanym a badającym przez instrukcję i postępowanie przy testowaniu" (s. 41). Uważam, że nie należało tu odwoływać się do terminu „trafność". Dla psychologów społecznych, posługujących się narzędziami „docierającymi" do opinii i postaw osób badanych, czy dla psychologów szkolnych, badających strukturę i poziom zdolności i umiejętności uczniów, niezmiernie ważne jest też zapewnienie wysokiej trafności treściowej. Jej znajomość jest szczególnie ważna gdy psycholog „...jest zainteresowany oceną zachowania badanego we wszystkich sytuacjach, które test (z założenia) ma reprezentować" i gdy chce wykazać, że „...zachowania demonstrowane w badaniu testowym są reprezentatywną próbą za- chowań ujawniających się w interesującej badacza sferze" (APA, 1985a, s. 36). W ostatnich latach znacznie rozwinęła się teoria trafności (por. np. Messick, 1995; Wainer, Braun, 1988) i dziś już nie wystarczy ogłosić, iż test psychologiczny, a właściwie kandydat do miana testu, koreluje z jakimś kryterium zewnętrznym (np. innym, podobnym testem psychologicznym), aby uznać sprawę określenia traf- ności testu za pozytywnie załatwioną. 2.1. Trafność kryterialna Na ogół pojęcie trafności kojarzy się psychologom z procedurą ustalania korelacji między wynikami nowego testu i jakimś zewnętrznym kryterium. I znowu, najczę- ściej owym kryterium jest inny test psychologiczny o uznanej już trafności. Rza- dziej jest to kryterium nie-testowe, np. diagnoza psychiatryczna (por. np. Zawadzki, 1970, s. 217-218; APA, 1985a, standard E4.4.2, E4.4.3, s. 44), kryteria wypraco- wane przez sędziów kompetentnych (np. APA, 1985a, standard E4, s. 43), miary fizjologiczne, np. wskaźniki wyłonione ze struktury zapisu EEG, EKG czy GSR (np. Strelau, 1992, rozdz. 9.: Wskaźniki psychofizjolgiczne i psychofizyczne w ba- daniach nad diagnozą temperamentu/osobowości i nad pomiarem trafności teore- tycznej kwestionariuszy, s. 160-176; Sosnowski, Zimmer, 1993). 517 1 Należy być bardzo ostrożnym w przyjmowaniu (akceptacji) danych dotyczą- cych trafności jakiegoś nowego testu, jeżeli w jego „metryczce psychometrycznej" istnieje informacja, że trafność kryterialną tego testu ustalono przez skorelowanie jego wyników z wynikami innego testu. Być może, gdybyśmy zadali sobie trud zajrzenia do „metryczki psychometrycznej" testu-kryterium, okazałoby się, że jego trafność ustalono identycznie itd. Ustalanie trafności kryterialnej metodą test by test świadczy raczej o ubóstwie warsztatowym diagnostyki psychometyrycznej, niż o jej wyrafinowaniu i chęci pozostawania w bliskości z rzeczywistością, która ma przecież charakter nietestowy. Moim zdaniem (także: Drwal, 1995, s. 27; APA, 1985b, pkt. 1. Validity, s. 16 — Standards 1.8-1.10), każdy nowy test powinien być wprowadzany po wykazaniu jego zbieżności (aspekt zbieżny trafności) nie tylko z innymi testami, ale — przede wszystkim — z kryteriami faktycznie zewnętrznymi (a więc nietestowy mi!), wg których można dokonanać oceny tej samej zmiennej. Ponadto należy wykazać brak zbieżności testu (aspekt różnicowy trafności) z podobnymi miarami testowymi i nietestowymi, ale przeznaczonymi do oceny innych zmiennych. Mówiąc krótko, idzie o to, aby badanie trafności testu przeprowadzić metodą Campbella i Fiskego (1959), którą szczegółowo prezentuję w pkt. 4. Jak już napisałem wyżej, jeżeli kryterium jest zastosowane równolegle w cza- sie do testu, to mówimy o trafności diagnostycznej, a jeżeli na podstawie wyników testu chcemy przewidzieć wystąpienie zachowania opisanego przez kryterium, to mówimy o trafności prognostycznej. Na co należy zwracać uwagę przy ustalaniu trafności kryterialnej za pomocą pojedynczego wskaźnika, np. współczynnika korelacji? Na to pytanie odpowiadają Standardy... (APA, 1985a, s. 35-36). Po pierwsze, podobnie jak to ma miejsce przy ustalaniu rzetelności testu metodą test-retest (stabilność bezwzględna), może okazać się, że warunki w jakich przeprowadzono pierwsze badanie (za pomocą testu), w procesie ustalania trafności prognostycznej, będą istotnie odbiegać od warunków końcowych, w jakich dokonano pomiaru kryterium (zakłada się, że warunki po- czątkowe i końcowe będą zasadniczo do siebie podobne). Po drugie, mimo przy- jęcia założenia o trafności samego kryterium (np. ocen szkolnych, diagnozy psy- chiatrycznej czy innego testu), w rzeczywistości jego trafność może pozostawiać wiele do życzenia. Wcale nie tak łatwo dobrać trafne kryterium. Bardzo tedy ku- sząca jest droga walidowania testu poprzez wykazanie jego wysokiej korelacji z ... innym testem. Po trzecie, zakłada się, że próba jest de facto reprezentatywna, a w rzeczywistości obejmuje ona osoby, które były stosunkowo łatwo dostępne bada- czowi (np. studentów psychologii uczęszczających na wykład autora testu i zdają- cych u niego egzamin — jak w tej sytuacji student może „bezpiecznie" odmówić udziału w takich badaniach i w jakim stopniu studenci psychologii są podobni do reszty społeczeństwa?). Po czwarte, nie należy prowadzić badań na zbyt mało li- cznych próbach, gdyż będą kłopoty z trafnością zewnętrzną (por, rozdz. 3., pkt. 2.2). Na kłopoty metodologiczne, jakie sprawia posługiwanie się pojedynczym wskaźnikiem kryterium (na polu selekcji) zwraca uwagę Dunnete (1963). Wymagania związane z ustalaniem trafności kryterialnej podane zostały w Standardach... (APA, 1985a, standardy: E3-E10, s. 42-55). I jeszcze jedno, ustalanie trafności kryterialnej związane jest z koniecznością posługiwania się poprawką na obniżenie (rozcieńczenie) trafności (ang. correction for attenuationf (Guilford, 1988, s. 89). Jest ona związana z nierzetelnością (od- biegającą od rzetelności idealnej, wyrażającej się współczynnikiem rtt=l,0) tak samego testu, jak i kryterium. Chcąc tedy poznać faktyczną korelację testu z kry- terium musimy, przy jej obliczeniu, uwzględnić wartości obu współczynników rze- telności. Sam wzór (17.1) na taką „poprawioną" korelację wygląda następująco: gdzie: rTK — poprawiona korelacja wyników testu i kryterium; r„ — współczynnik rzetelności testu; rtt — współczynnik rzetelności kryterium. Otrzymana wartość korelacji testu z kryterium po uwzględnieniu wartości współczynników rzetelności będzie wyższa, aniżeli wartość tej korelacji obliczona bez uwzględnienia wartości współczynników rzetelności testu i kryterium. Więcej, bardziej szczegółowych informacji na temat trafności kryterialnej znajdzie Czytel- nik u Magnussona (1991), Niemierki (1975) i Guilforda (1964, 1988)3. 2.2. Trafność treściowa (wewnętrzna) Trafność treściowa (wewnętrzna) jest — jak mi się wydaje — zaniedbywana przez psychologów. Skupiają oni swoją uwagę raczej na trafności kryterialnej. Większą wagę do analizy trafności treściowej przykładają pedagodzy, którzy konstruując testy osiągnięć są zainteresowani tym, aby zbiór zadań tworzących test stanowił rzeczywiście reprezentatywną próbę dla uniwersum pozycji, które jest uza- sadnione przez oficjalne programy nauczania. Niemierko (1975, s. 172) pisze: „traf- ność wewnętrzna testu osiągnięć szkolnych polega na zgodności treści testu z pro- gramem nauczania. Ustalamy ją porównując czynności wykonywane przez ucznia w celu rozwiązania zadań testu z czynnościami, których opanowanie jest wymaga- ne". Trafność treściowa jest szczególnie ważna dla testów uzdolnień, umiejętności, osiągnięć szkolnych i wiadomości, dla kwestionariuszy osobowości, skal postaw i opinii oraz dla arkuszy obserwacyjnych. Standardy... (APA, 1985a, s. 36-37) tak mówią o badaniu trafności treściowej: „Aby potwierdzić trafność treściową zbioru wyników otrzymanych w teście należy Tłumacz pracy Magnussona (1991, s. 218-222) przetłumaczył angielski termin jako „poprawkę na nierzetelność". 3 Guilford (1988, s. 90) przestrzega przed „pokładaniem zbyt wielkiej wiary we współczynnik poprawiony ze względu na obniżenie trafności". Czytelnik zechce się zaznajomić z argumentami Guil- forda. 519 I wykazać, że zachowania demonstrowane w badaniu testowym są reprezentatywną próbą zachowań ujawniających się w interesującej badacza sferze. Określenie tej sfery, określenie realizowanych przez badacza celów oraz metody dobierania próby jest szczególnie ważne w wypadku trafności treściowej. W badaniu trafności tre- ściowej wymaga się, aby autor testu lub jego użytkownicy sprecyzowali stawiane przez siebie cele oraz dokładnie zdefiniowali — w świetle tych celów — badaną sferę zachowań. Aby można było określić stopień, w jakim poszczególne zadania składają się na całą sferę zachowań, jej definicja powinna być sformułowana raczej w terminach efektów uczenia się niż procesów (autorzy omawiają zagadnienie traf- ności treściowej odnosząc się w warstwie przykładowej do testów osiągnięć — przyp. J.B.), dzięki którym uczenie się jest i wystarczająco szczegółowe i zorgani- zowane". Chciałbym przestrzec Czytelnika, przed utożsamianiem ustalania trafności tre- ściowej testu z ustalaniem tzw. trafności fasadowej, gdyż ta ostatnia związana jest jedynie z powierzchowną oceną tego, czy test X sprawia wrażenie testu określonego typu, czy wygląda jak „prawdziwy" test. Z kolei ustalanie trafności treściowej wymaga, aby badacz zdefiniował uniwersum pozycji i aby wykazał, że pozycje włączone do testu stanowią faktycznie reprezentatywną dla tego uniwersum ich próbę. W celu określenia stopnia reprezentatywności próby pozycji psycholog po- winien się odwołać do ekspertów. Z kolei do oceny stopnia zgodności ich sądów należy wykorzystać np. współczynnik zgodności sędziów kompetentnych W-Ken- dalla, opisany w rozdz. 15., pkt. 10.1. 3. Trafność teoretyczna (wg L. J. Cronbacha i P. E. Meehla) Według mnie najważniejszym aspektem (czy rodzajem) trafności jest trafność teo- retyczna (w sensie: Cronbach, Meehl, 1955; także: Campbell, 1960; APA, 1985a, 1985b; Frederiksen, 1986; Messick, 1995), pokazująca związek narzędzia pomiaro- wego z konstruktem teoretycznym (zmienną teoretyczną) zaczerpniętym z danej teorii psychologicznej, a najlepszym operacyjnym podejściem do jej badania jest opracowana przez Campbella i Fiskego (1959; por. pkt. 4. niniejszego rozdziału) metoda analizy macierzy „wielu cech — wielu metod" (por. też Angoff, 1988, s. 26). Zdaniem zaś Guiona (1980) do trafności teoretycznej można sprowadzić zarówno trafność treściową, jak i trafność kryterialną. W miejsce tedy „triadowej" koncepcji trafności Guion proponuje unitarną koncepcję trafności — rzecz jasna ma to być koncepcja trafności teoretycznej (w oryginale występuje opozycja: tri- nitarian doctrine of validity vs unitarian doctrine of validity; trinitarian — od trinitas, łac. trójca; Trójca Św.). „Określenie trafności teoretycznej występuje wtedy, kiedy test ma być inter- pretowany jako miara pewnego atrybutu lub pewnej właściwości, które nie są zde- 520 finiowane operacyjnie. Problem, w obliczu którego stoi badacz, przedstawia się następująco: «Jakie konstrukty4 wyjaśniają wariancję wyników rozwiązywanego te- stu?*" (Cronbach, Meehl, 1955). Dla lepszego zrozumienia istoty ustalania trafności teoretycznej testu odwołaj- my się do dwóch przykładów — jednego zaczerpniętego wprost od Cronbacha i Meehla (1955) oraz drugiego (Hornowska, 1993c), pokazującego w jaki sposób można dokonać rekonstrukcji założeń teoretycznych testu, który, pozornie, wprost danej teorii nie zakładał. Przykład I Nałóżmy, że miara X koreluje na poziomie 0,50 z Y czyli wielkością zmiany elektrycznego przewodnictwa skóry pojawiającego się wtedy, kiedy informujemy studenta, że oblał egzamin z psychologii. Współczynnik ten trafnie opisuje trafność prognostyczną X dla Y dla danej próbki i danych warunków. Gdyby ktoś miał zapytać «Czy nie istnieje być może inny sposób interpretowania tej korelacji?» albo «Jakie inne rodzaje danych mógłbyś dostarczyć dla potwierdzenia tej interpretacji?* z trudem zrozumielibyśmy, czego dotyczy pytanie, ponieważ nie podaje się kore- lacji jako dowodu na to, że «test X mierzy skłonność do lęku». Możliwe są inter- pretacje alternatywne; być może test mierzy np. aspiracje akademickie i w tym przypadku oczekiwalibyśmy odmiennych rezultatów, kiedy wywołalibyśmy zmianę elektrycznego przewodnictwa skóry za pomocą zagrożenia ekonomicznego. Czy zatem jest sensowne poszukiwanie innych rodzajów dowodów? Połączmy te fakty z danymi z późniejszych badań. Test X koreluje na pozio- mie 0,45 z oceną napięcia podaną przez innych studentów. Test X koreluje na poziomie 0,55 z wielkością dezorganizacji intelektualnej wywołanej przez bolesny szok elektryczny, a na poziomie 0,68 z wynikiem Skali Lęku Objawowego MAS Talor. Średnia X obniża się w czterech grupach diagnostycznych w następującej kolejności: stany lękowe, depresja reaktywna, normalni oraz osobowość psycho- patyczna. I wreszcie elektryczne przewodnictwo skóry przy zagrożeniu niepowo- dzeniem w przypadku psychologii koreluje na poziomie 0,60 z przewodnictwem w przypadku zagrożenia niepowodzeniem w zakresie matematyki. Wyniki negatywne eliminują konkurencyjne wyjaśnienia wyniku X; tak więc, stwierdzenie nieistotnych korelacji między X i klasą społeczną, celami zawodowymi i orientacją na wartości usprawiedliwiają bezpieczne odrzucenie sugestii, że test X mierzy aspiracje akade- mickie. Możemy mieć zatem znaczne zaufanie do tego, że X mierzy skłonność do I „Konstrukt jest pewną postulowaną właściwością ludzi, o której zakłada, się, że ujawnia się ona w rozwiązywaniu testu. Podczas procedury określenia trafności testu konstruktem jest atrybut, na temat którego wypowiadamy pewne twierdzenia interpretując test. Oczekujemy — piszą Cronbach i Meehl (1955) — że osoba w dowolnym momencie czasowym posiada, bądź też nie posiada pewnej właściwości jakościowej (amnezja) albo struktury albo też posiada pewien poziom właściwości ilościo- wej. Konstrukt posiada też pewne skojarzenia, przenoszone przez twierdzenia o charakterze ogólnym: ludzie, którzy posiadają tę właściwość będą w sytuacji X działać w sposób Y (z określonym prawdopo- dobieństwem). Dążymy do wyszczególnienia, jak bronić proponowanej interpretacji testu; nie rekomen- dujemy żadnego określonego rodzaju interpretacje. 521 lęku, jeśli aktualna teoria lęku może obejmować wszystkie zależności, które dopro- wadziły do pojawienia się korelacji dodatnich oraz nie przewidywać korelacji, które nie zostały wykryte". Chciałbym — uprzedzając to, co jest napisane w kolejnym, 4. pkt. — powiedzieć, że przeprowadzona w drugiej części przykładu I analiza korelacji prowadzona jest w „duchu" kilka lat później ogłoszonej przez Campbella i Fiskego (1959) metody analizy macierzy WCWM. Przykład II Bodajże najbardziej rozpowszechniona w świecie testowa miara inteligencji, jaką jest Skala Inteligencji Wechslera (począwszy od W-B I/II przez WAIS do WAIS-R) nie miała wyraźnie określonych przez swego autora podstaw teoretycz- nych. Wechsler nie skonstruował „dużej" teorii inteligencji, z której logicznie wy- prowadziłby 11 składających się na tę skalę testów. Krytyczna analiza będącej wówczas w powszechnym użyciu Skali Inteligencji Stanford-Bineta (z 1916 r.), opartej na stemowskim rozumieniu ilorazu inteligencji IQ (piszę o tym szczegóło- wo w: Brzeziński, 1993a) zakładającym pojęcie „wieku umysłowego" (ang. mental age) zaczerpniętego od Bineta, konstruktora pierwszego testu inteligencji (Wechsle- rowi znana była krytyka pojęcia „wieku umysłowego" przeprowadzona przez Thur- stone'a, 1926) oraz doświadczenie kliniczne zdobywane w pracy z pacjentami du- żego szpitala psychiatrycznego Bellevue w Nowym Jorku skłoniły Wechslera do odrzucenia dotychczas „panujących" poglądów na naturę inteligencji i zapropono- wania takiej definicji inteligencji, która nie oddzielałaby jej od „reszty osobowo- ści". Zatem: „Inteligencja jest to zagregowana (ogólna) zdolność jednostki do po- dejmowania działań celowych, racjonalnego myślenia i do efektywnego radzenia sobie we własnym środowisku. Jest ona globalna, ponieważ charakteryzuje zacho- wanie jednostki jako całości, jest zagregowana, gdyż składa się z elementów (zdol- ności), które chociaż nie są całkowicie niezależne, ale są jakościowo odróżnialne (...) Inteligencja nie jest jednakże tożsama z prostą sumą owych zdolności. Składają się na to trzy przyczyny: 1) efekty końcowe zachowań inteligentnych nie są wyłą- cznie funkcją liczby zdolności lub ich poziomu, lecz również sposobu ich kombi- nacji, a więc zależą od ich konfiguracji; 2) czynniki inne niż zdolności intelektu- alne, np. popęd czy podniety są także składową inteligentnych zachowań; 3) wre- szcie gdy różne klasy inteligentnych zachowań mogą wymagać zdolności intelektu- alnych o różnym poziomie, to nadwyżka każdej ze zdolności może stosunkowo niewiele przyczyniać się do zwiększenia efektywności zachowania jako całości" (Wechsler, 1993, s. 16). Wychodząc od tej definicji i innych twierdzeń Wechslera na temat natury inteligencji i możliwości dokonywania jej pomiaru poprzez pomiar określonych zdolności, Hornowska dokonała rekonstrukcji mierzonych przez 11 testów skali funkcji intelektualnych: (1) sprawność funkcji poznawczych, (2) zakres posiadanej wiedzy, (3) zdolność do koncentracji i (4) umiejętność koordynacji wzrokowo-ru- chowej. Następnie każdy z wymiarów został rozbity na — łącznie — 10 podwy- miarów. Tym zaś zostały przyporządkowane wechslerowskie testy (1, 2, 3, a nawet 5 testów do każdego podwymiaru) (Hornowska, 1993c, tab. 1., s. 27). Nie poprze- 522 stając na rekonstrukcji poglądów Wechslera, Hornowska dokonała analizy testów składających się na Skalę Inteligencji Wechslera z punktu widzenia takich ważnych teorii inteligencji, jak: (1) teoria czynnika ogólnego g Spearmana, (2) teoria inteli- gencji płynnej i skrystalizowanej Cattella-Horna, (3) teoria struktury intelektu SOI Guilforda. Czytelnik, który będzie sięgał po Skalę Inteligencji Wechslera powinien wpierw zapoznać się z tą bardzo ważną — dla rozumnego posługiwania się którąś ze skal wechslerowskich — pracą ustalającą trafność teoretyczną tej skali. Przejdźmy teraz do udzielenia odpowiedzi na pytanie: W jaki sposób można ustalid trafność teoretyczną testu? Czy tak, jak w przypadku trafności kryterialnej, można posłużyć się jednym współczynnikiem korelacji (na wzór korelacji: test-kry- terium)? Już zapoznanie się z przytoczonymi wyżej przykładami daje odpowiedź na drugie pytanie, iż raczej nie jest możliwe sprowadzenie zadania ustalenia traf- ności teoretycznej testu do ustalenia wysokości jednego współczynnika, np. współ- czynnika korelacji. Podobnie piszą autorzy Standardów... (APA, 1985a, s. 38): „Ocena trafności teoretycznej nie sprowadza się do przeprowadzenia jednego ba- dania; wymaga raczej kumulacji wyników badań. Zbieranie danych potrzebnych do określenia trafności teoretycznej rozpoczyna się od formułowania hipotez o właści- wościach osób uzyskujących wysokie wyniki testowe w przeciwieństwie do osób uzyskujących niskie wyniki. Zbiór hipotez tego typu tworzy wstępną teorię doty- czącą istoty konstruktu, który test z założenia ma mierzyć. W pełnym programie badań nad trafnością teoretyczną test może być traktowany raz jako zmienna za- leżna, a innym razem jako zmienna niezależna. Niektóre hipotezy mogą być «kontr- hipotezami» wynikającymi z konkurencyjnej teorii lub interpretacji. Hipotezy tego typu lub twierdzenia teoretyczne umożliwiają przewidywanie zachowań, jakie osoby uzyskujące określone wyniki w teście będą ujawniać w niektórych innych testach czy w niektórych sytuacjach. Jeżeli teoria badacza o tym, co test mierzy jest zasadniczo poprawna, to większość przewidywań powinna zo- stać potwierdzona. Jeżeli tak się nie stanie, badacz winien zrewidować bądź defi- nicję, bądź test, by stanowił lepszą miarę konstruktu. Dzięki sukcesywnej weryfi- kacji, modyfikacji i eliminacji hipotez badacz zaczyna coraz lepiej rozumieć istotę cech mierzonych przez test. Potwierdzając lub odrzucając kolejne hipotezy, doko- ijąc rewizji testu oraz przeprowadzając nowe badania ze zrewidowanym narzę- dziem — badacz zwiększa użyteczność testu jako miary danego konstruktu. Należy zaznaczyć, że dane badanie trafności teoretycznej odnosi się do kon- kretnego testu i może okazać się nieadekwatne w stosunku do innych testów o tej samej nazwie". Jak sami piszą, zaakceptowali oni wyodrębnione przez Macfarlane'a (1942) procedury stoso- wane do oceny trafności metod projekcyjnych. 523 Cronbach i Meehl (1955) zaproponowali pięć procedur ustalania trafności teo- cznej testu5. Procedury te spotkały się z powszechnym przyjęciem i są oma- wiane przez różnych autorów opracowań na temat trafności teoretycznej (np. Jaku- bowski, 1983; Magnusson, 1991). Oto ich krótka charakterystyka: 1. Analiza różnic między grupowych (ang. group dijferences). Jeżeli w świetle teorii psychologicznej wynik testowy powinien stanowić podstawę do dokonywania prognoz mówiących, iż osoby o wysokim wyniku testowym powinny zachowywać się w określony sposób i osoby o niskim wyniku też powinny zachowywać się w określony, ale odmienny od pierwszego, sposób, to test można uznać za trafny. Cronbach i Meehl podają przykład Skali Postaw Wobec Kościoła Thurstone'a i Chave'a. Badacze ci określali trafność swojej skali poprzez wykazanie różnic w wynikach uzyskiwanych przez osoby chodzące i niechodzące do kościoła. Inny przykład znajdujemy u Jakubowskiego (1983, s. 234): „dla sprawdzenia czy skala Es [skala Siły Ego Barrona z MMPI; «... osoby z wysokimi wynikami w tej skali są lepiej przystosowane psychologicznie, znacznie lepiej radzą sobie z codziennymi problemami życiowymi, lepiej też rokują w psychoterapii (...) jeżeli w ogóle szu kają pomocy psychologicznej to najczęściej powodem tego jest określona presja sytuacyjna. (...) osoby z niskimi wynikami są znacznie gorzej przystosowane psy chologicznie, nie są też przygotowane do radzenia sobie ze stojącymi przed nimi problemami. Czują się bezwartościowe, zagubione i nierzadko wyolbrzymiają przed otoczeniem swoje problemy po to, aby uzyskać pomoc z zewnątrz», Matkowski, 1992, s. 64 — przyp. J.B.] mierzy siłę ego, możemy wyodrębnić dwie grupy osób: do jednej wejdą te, które zgłaszają się po pomoc do psychologa, a do drugiej te, które nie zgłaszają się po pomoc do psychologa i nigdy takiej potrzeby nie czuły. O trafności teoretycznej testu będą świadczyły istotnie wyższe wyniki, uzyskane przez drugą grupę, ponieważ to przewidujemy na podstawie konstruktu określają cego, co to jest «siła ego»". 2. Analiza macierzy korelacji i analiza czynnikowa (ang. correlation matrices and factor analysis). Najodpowiedniejszą metodą będzie ta, którą zaproponowali Campbell i Fiske (1959), znana pod nazwą analizy macierzy „wielu cech - wielu metod". Metodę tę opisuję w pkt. 4. niniejszego rozdziału. Z kolei w pkt. 5. po krótce charakteryzuję metody analizy czynnikowej, która też jest proponowana jako metoda sprawdzania trafności teoretycznej testu (najlepsze opracowanie tej problematyki w polskojęzycznej literaturze daje praca Zakrzewskiej, 1994). 3. Analiza struktury wewnętrznej testu (ang. studies of internal structure). Zdaniem Cronbacha i Meehla (1955) jeżeli dana teoria zakłada, że pozycje jakiegoś testu powinny wysoko ze sobą korelować, albo powinny wysoko korelować z ogól nym wynikiem testu (mówiąc inaczej — jeżeli będą stanowiły homogeniczną grupę pozycji), to taki test będzie trafny. Także teoria może zakładać występowanie uje mnych współczynników korelacji określonych pozycji z ogólnym wynikiem testu (wówczas, gdy nie są one związane z danym konstruktem i służą jako zmienne tłumiące). 4. Analiza zmian nieprzypadkowych wyników testu (ang. studies of change over occasions). Jak wiemy (por. rozdz. 15., pkt. 5.) dwukrotne badanie, w jakimś odstępie czasu, tym samym testem, przeprowadzone na tej samej grupie osób dostarcza empirycznej miary rzetelności testu zwanej stabilnością bezwzględną. Wadą takiego postępowania jest to, że między pierwszym (test) i drugim badaniem (retest) dzieje się „coś", co na ogół nie jest kontrolowane przez badacza. Dlatego 524 też Cronbach i Meehl proponują, aby po pierwszym badaniu wprowadzić do bada- nej grupy jakąś manipulację eksperymentalną, która powinna — o czym mówi teoria psychologiczna! — wywołać określone zmiany zachowania osób badanych; zmiany te zaś powinny być wychwycone przez test psychologiczny — osoby ba- dane powinny uzyskać wyniki, które będą się istotnie różniły (w zakładanym przez teorię kierunku) od wyników pierwszego badania. „Można wysunąć hipotezę, że efekt Zeigarnik jest miarą zaangażowania ego, tj. że wskutek zaangażowania ego człowiek przypomina sobie więcej zadań niedokończonych. Aby potwierdzić taką interpretację, eksperymentator będzie próbował wywołać zaangażowanie ego w pewnym zadaniu za pomocą odpowiednich wskazówek i będzie porównywał przy- pominanie badanych z przypominaniem w innych zadaniach, kiedy udzielał wska- zówek przeciwstawnych" (Cronbach, Meehl, 1955). 5. Analiza procesu rozwiązywania testu (ang. studies of process). Zdaniem Cronbacha i Meehla jedną z najlepszych metod badania przyczyn zmienności wy- ników testu jest przeanalizowanie procesu rozwiązywania testu przez osoby badane. Pozwala to na poprawienie konstrukcji samego testu. Taka procedurę analizy od- powiedzi na pytania kwestionariusza 16 PF Cattella zastosowała Nowakowska (1975), posługując się specjalnie skonstruowanym przez siebie kwestionariuszem, który osoby badane musiały wypełniać w stosunku do każdego pytania 16 PF. 4. Aspekt zbieżny (konwergentny) i różnicowy (dyskryminaty wny) trafności — analiza macierzy „wielu cech — wielu metod" D. T. Campbella i D. W. Fiskego LI. Aspekt zbieżny i aspekt różnicowy trafności za sugestią Angoffa (1988, s. 26), iż pomysł Campbella i Fiskego (1959) na izę macierzy korelacji występujących między różnymi miarami testowymi róż-rch cech (macierzy WCWAf) można wykorzystać do badania trafności teoretycznej tu, chciałbym w niniejszym punkcie przedstawić właśnie tę metodę — poczyna-od analizy opisanej przez jej autorów, a kończąc na wskazaniu rozwiązań od- ijących się do wielowymiarowych modeli statystycznych. Stosunkowo często (zbyt często!) psychologowie ograniczają badanie trafności stu do ustalenia jej tylko w jednym z aspektów, a mianowicie w aspekcie kryte-rialnym, a dokładniej — diagnostycznym. Co więcej, posługują się oni w procesie ustalania trafności testami, których trafność ustalana była podobnie, tzn. przez wykazanie wysokiej korelacji z innym testem! Podobną procedurę można by jeszcze zaakceptować, gdyby owym kryterium zewnętrznym (które, rzecz jasna, też musi się cechować wysoką trafnością!) w przypadku metod „papierowych" nie była po- 525 dobna metoda, np. aby kwestionariusz temperamentu nie był „walidowany" za po- mocą innego kwestionariusza temperamentu, ale za pomocą wskaźników uzyska- nych z eksperymentu laboratoryjnego, albo z danych obserwacyjnych. Owe nastawienie na szukanie, za wszelką cenę, zbieżności wyników jednego testu z jakimś innym testem (nawet bez zatroszczenia się o to, czy został on wy- wiedziony z tej samej teorii psychologicznej) stało się swoistym „standardem" po- stępowania psychologów. Trzeba się tedy zgodzić z krytycznym osądem praktyk badawczej, którego dokonał Drwal (1995, s. 27): „...trafny test pewnej cechy po- winien silniej korelować z innymi testami tej samej cechy niż z testami, które mają mierzyć coś innego. Wysoka korelacja między testami tej samej cechy świadczy o trafności zbieżnej (TZ), natomiast niska korelacja z testami innych cech świadczy o trafności różnicowej (TR). W psychologii dominują nadal badania nad trafnością zbieżną i często się zdarza, że twórca nowego testu jest zadowolony z każdej istotnej korelacji, jaką może podać, nie zważając, że niektóre w gruncie rzeczy kompromitują trafność jego testu (przykłady łatwo znaleźć również w publikacjach z ostatnich lat)". Wymaganie badania — w przypadku każdego testu, a zwłaszcza takiego o złożonej strukturze teoretycznej — nie tylko aspektu zbieżnego (i to za wszelką cenę!), ale także aspektu różnicowego trafności zostało ujęte w najnowszym wy- daniu Standards... (APA, 1985b, pkt. 1. Validity, s. 16 — standardy 1.8-1.10.). Analiza trafności teoretycznej przeprowadzona metodą analizy macierzy „wielu cech — wielu metod", WCWM (wg: Campbell, Fiske, 1959), umożliwiająca nie tylko zbadanie aspektu zbieżnego, ale także zanalizowanie aspektu różnicowe- go, jest — według mnie — jedyną sensowną metodą kompleksowego badania trafności teoretycznej testu psychologicznego. Do realizacji tego celu zaleca się dziś posłużenie się konfirmacyjną analizą czynnikową CFA (na ten temat por. Kenny, Kashy, 1992) przeprowadzoną za po- mocą programu komputerowego z rodziny LISREL (np. LISREL VII — por. Jóreskog, Sorbom, 1989). Podejście WCWM do badania trafności jest wykorzystywane w zaawansowa- nych badaniach trafności baterii złożonych z wielu testów czy zestawów testów stanowiących operacjonalizację tego samego konstruktu teoretycznego. I tak, przy- kładowo, Drwal (1995, cz. I, rozdz. 3.: Trafność zbieżna i różnicowa czterech inwentarzy agresji, s. 36-53) poddał analizie trafność następujących inwentarzy agresji: (1) Inwentarz Bussa-Durkee w dwóch, w Polsce znanych wersjach — (la) Skala Agresji Bussa-Durkee SABD oraz (lb) Nastroje i Humory NH, (2) Wie- lowymiarowy Inwentarz Agresji Interpersonalnej Chłopców WIAICH Olweusa, (3) Inwentarz Psychologiczny Syndromu Agresji IPSA Gasia, a także: (4) skale poczucia winy zaczerpnięte z SABD, NH i WIAICH oraz Kwestionariusz Poczucia Winy KPW Kofty, Ignaczaka i Brzezińskiego; ponadto uwzględnione zostały: (5) skale aprobaty społecznej — skala K zaczerpnięta z WIAiCH i Kwestionariusz Aprobaty Społecznej KAS Drwala i Wilczyńskiej, (6) Próbki Zachowań PZ („tech- nika typu socjometrycznego przeznaczona do pomiaru agresji w ocenie rówieśni- ków"). 526 Metoda klasyczna analizy macierzy WCWM Źródłem systematycznej wariancji wyników testowych może być zróżnicowa- nie osób badanych pod względem danej cechy oraz zróżnicowanie tych samych osób z uwagi na właściwości metody zastosowanej do pomiaru danej cechy. Ba- daczowi zależy na tym, aby móc precyzyjnie oddzielić od siebie te dwie wariancje składowe. Zasługą Campbella i Fiskego (1959) było pokazanie, jak stosunkowo prosto można dokonać analizy zmienności wyników testowych w kategoriach wła- ściwości cechy i właściwości metody. Nie wchodząc w szczegóły uzasadnienia takiego rozumowania (na ten temat por. Gaul, 1989) przejdę od razu do scharakte- ryzowania samej macierzy WCWM oraz podstawowych warunków, jakie muszą być spełnione przez ujęte w niej interkorelacje, aby — zdaniem Campbella i Fiskego (dalej będę używał skrótowego określenia: metoda C-F) — test można było uznać za trafny z uwagi na oba aspekty: zbieżny oraz różnicowy. Aby przeprowadzić pełne badanie trafności należy uwzględnić co najmniej dwie cechy mierzone przez co najmniej dwie niezależne metody. Tabela 17.1. po- kazuje macierz WCWM utworzoną z interkorelacji zachodzących między 3 meto- dami zastosowanymi do pomiaru 3 cech. Ponieważ jest ona symetryczna, więc zaprezentowane zostały jedynie dane znajdujące się w jej dolnej połowie. Uogólniając, macierz zawiera korelacje pochodzące z zestawienia wyników pomiaru /-tej (j=l,...,q) cechy za pomocą /-tej metody (/= 1,...,/?). Zatem dwa pierwsze indeksy przy r (symbol współczynnika korelacji), to indeksy metod, a dwa dalsze indeksy, po kropce, to indeksy cech. Na przykład r3123 należy czytać jako: korelacja cechy 2. mierzonej za pomocą metody 3. z cechą 3. mierzoną za pomocą metody 1. W macierzy ujęte zostały następujące grupy współczynników korelacji: (a) przekątne współczynników rzetelności, po jednej dla każdej metody (uło- ie są wzdłuż głównej przekątnej całej macierzy) — jedna cecha, jedna metoda 'CJM; dla wyróżnienia współczynniki te zostały zapisane kursywą; (b) przekątne współczynników trafności — jedna cecha, różne metody JCRM, jednej dla każdej kombinacji dwóch metod; dla wyróżnienia współczynniki te itały zapisane czcionką półgrubą; (d) trójkąty różnych cech, jednej metody RCJM, po jednym dla każdej meto- ; dla wyróżnienia oznaczono je linią ciągłą; (e) trójkąty różnych cech, różnych metod RCRM, po dwa przylegające do lej przekątnej trafności; dla wyróżnienia oznaczono je linią przerywaną. Zauważmy, że wartości współczynników korelacji leżące w trójkątach RCRM muszą być identyczne — dla przykładu: r3]2i niekoniecznie musi być takie jak r3l 12, gdyż w pierwszym przypadku za pomocą metody 3. dokonano :aru cechy 1. i za pomocą metody 1. dokonano pomiaru cechy 1., a w drugim padku za pomocą metody 3. przeprowadzono pomiar cechy 2. i za pomocą ly 1. przeprowadzono pomiar cechy 2. Campbell i Fiske w macierzy WCWM wyodrębniają: 527 Tab. 17.1. Wzorcowy układ „wielu cech — wielu metod" Metoda Metoda 1. Metoda 2. Metoda 3. Cecha Cecha 1. Cecha 2. Cecha 3. Cecha! Cecha 2. Cecha 3. Cecha 1. Cecha 2. Cecha 3. 1. 1. 2. \ 1*11.21 3. ' 11.31 1*1132 ~\^11.33 VJ*21.12 2. 1. "T.21.11 1*21.13 ^2.11 2. 1*21 21 "~^J21.23 '2221 \^22.22 3. ""21 31 1*2132 v-|*21.33 ^22.31 \ "*22 32 ^i2SL33 "n>^'SŁ12 3. 1. ~T3i.il 1*31.13 ~T32.II "^3213 ^[33.11 2. *Vi21 -T31.22 N,*31JJ 1*32.21 ^32.22 V-J*32 23 1*3321 \T33.22 3. 1*31.31 "31 32 ^T31.33 ^32.31 r32.32 ;:_T?2.33 •"33.31 ^3332 (a) blok jednej metody JM — składają się na niego: przekątna rzetelności JCJM oraz przylegający do niej jeden trójkąt RCJM; (b) blok różnych metod RM — składają się na niego: przekątna trafności JCRM oraz przylegające do niej dwa trójkąty RCRM. Test można uznać za w pełni trafny (w obu aspektach — zbieżnym i różni- cowym), jeżeli (Campbell, Fiske, 1959, s. 82-83): (1) wartości współczynników leżące na przekątnej trafności JCRM są istotnie wyższe od zera (i wystarczająco wysokie) — jest to podstawowy warunek, którego spełnienie czyni sensowną dalszą analizę macierzy WCWM; w ten sposób dokonuje się oceny aspektu zbieżnego trafności (w rzeczywistości psychologowie zwykli poprze stawać na tym kroku — por. ocenę trafności diagnostycznej i prognostycznej); (2) wartość jakiegoś współczynnika leżąca na przekątnej trafności JCRM jest wyższa od wartości współczynników leżących w tym samym wierszu i kolumnie trójkątów RCRM (trójkąt obwiedziony linią przerywaną); oznacza to, że wartość danego współczynnika z przekątnej trafności, czyli JCRM powinna być wyższa od wartości współczynnika korelacji tej cechy z innymi cechami, ale mierzonymi in nymi metodami; (3) wartość jakiegoś współczynnika leżąca na przekątnej trafności JCRM jest wyższa od wartości odpowiednich współczynników leżących w trójkątach RCJM (trójkąt obwiedziony linią ciągłą); innymi słowy: dana cecha powinna wyżej kore lować z niezależnymi pomiarami tej samej cechy JCRM, aniżeli z pomiarami in nych cech uzyskanymi za pomocą tej samej metody RCJM; (4) konfiguracja wartości współczynników korelacji występująca w trójkątach RC (zarówno w bloku JM, jak i w blokach RM) jest taka sama — mimo, rzecz jasna, różnic w poziomie wartości współczynników Spełnienie warunku pierwszego związane jest z aspektem zbieżnym trafności, a spełnienie warunków drugiego, trzeciego i czwartego z aspektem różnicowym trafności. Zwykło się utożsamiać stwierdzenie występowania zbyt niskich wartości współczynników korelacji leżących na przekątnej trafności JCRM z brakiem traf- ności (w aspekcie zbieżnym). Trzeba jednak pamiętać — na co szczególnie silny nacisk położyli właśnie Campbell i Fiske — że mogą też być nietrafne gdyż zbyt silnie korelują z innymi testami przeznaczonymi do pomiaru innych cech (aspekt różnicowy). Informują o tym wartości współczynników leżące w trójkątach RCRM zestawione z wartościami współczynników z przekątnej trafności oraz wartości z trójkąta RCJM zestawione z wartościami współczynników z przekątnej rzetelności. Metoda C-F bardzo szybko się upowszechniła, chociaż bardziej wśród psy- chometrów badających jej ograniczenia i możliwości (por. Alwin, 1974) niż wśród psychologów konstruujących nowe testy. W Polsce, poza teoretyczną pracą Gaula (1989) pokazującą zastosowanie modelu analizy ścieżek (w sensie: Werts i in., 1978) do danych z macierzy WCWM, odnotowałem tylko jedną próbę pełnego (i krytycznego) posłużenia się metodą C-F przez Drwala (1995). Jeszcze raz oka- zało się, że standardy „wymyślane" przez „prokuratorów" psychometrów-metodo- logów sobie, a codzienna, szara praktyka diagnostyczna sobie. 34 — Metodologia badań... Posługiwanie się klasyczną metodą C-F jest żmudne i nie zawsze daje jedno- znaczne rezultaty. „Kryteria Campbella i Fiskego to proste reguły, intuicyjnie bar- dzo trafne, ale w praktyce bardzo pracochłonne, bowiem już macierz trzech cech i trzech metod (jak tab. 17.1. — J.B.) wymaga dokonania ponad stu porównań. Co może ważniejsze, nie uzyskujemy jasnych i jednoznacznych odpowiedzi. Nie wia- domo, które kryteria są ważniejsze, jakie odstępstwa można tolerować, jak porów- nywać stopień trafności w różnych macierzach MTMM (angielski ospowiednik WCWM — przyp. red.) itd." (Drwal, 1995, s. 30). Przed przejściem do następnego punktu, w którym przedstawię bardziej zło- żone, kompleksowe metody analizy macierzy WCWM warto jeszcze na chwilę za- trzymać się przy wskazówkach o charakterze technicznym, które sformułowali Campbell i Fiske (tamże, s. 103-104) dla potencjalnych użytkowników ich metody. Po pierwsze, każda z metod powinna być wyprowadzona z tej samej teorii psychologicznej, której elementem jest analizowana cecha (trafność teoretyczna!); mówiąc inaczej, można rozpatrzyć alternatywne procedury operacjonalizacji tej sa- mej cechy. Po drugie, należy starać się, aby wybrane do analizy metody były w jak największym stopniu niezależne; mówiąc językiem technicznym: idzie o to, aby wariancja wspólna metod była zerowa (aby wartości współczynników w trójkątach RCRM zmierzały do zera). Od siebie mogę dodać, że z uwagi na elastyczność aplikacji różnych modeli wielozmiennowych wymiary macierzy WCWM nie powin- ny być mniejsze niż 3x3 (metoda C-F dopuszcza macierze o wymiarach 2 x 2). 4.3. Wykorzystanie wielowymiarowych modeli statystycznych do analizy macierzy WCWM Jak to już zaznaczyłem, idea „podwójnego" badania trafności testu psychologicz- nego (jej aspektu zbieżnego i różnicowego) spotkała się ze zrozumieniem w śro- dowisku psychologów zainteresowanych konstrukcją testów psychologicznych. Zwrócenie uwagi na nielosowe źródła wariancji wyniku testowego — na wariancję metody — a zwłaszcza ich uwzględnienie w planie analizy trafności testu jest niewątpliwie zasługą Campbella i Fiskego. Pisali oni: „każde psychologiczne na- rzędzie pomiarowe zawiera określone bodźce, czy właściwości wprowadzone spe- cyficznie dla reprezentacji cechy, którą owo narzędzie ma w intencji mierzyć. Ma także inne właściwości, które są charakterystyczne dla stosowanej metody, właści- wości, które mogłyby również występować przy próbach pomiaru innych, całkiem odmiennych cech. Test, skala szacunkowa lub inne narzędzie pomiaru prawie za- wsze ujawniają wariancję systematyczną odpowiedzi, związaną zarówno z pier- wszą, jak i drugą grupą właściwości. W takim stopniu, w jakim ta niespecyficzna wariancja metody kształtuje otrzymane wyniki, są one nietrafne" (tamże, s. 84). Analiza macierzy WCWM ma na celu właśnie określenie względnego udziału w wariancji całkowitej wyniku testowego jej głównych części składowych — wa- 530 I riancji wspólnej analizowanych zmiennych (konstruktów teoretycznych) oraz wa- riancji wspólnej (i kowariancji) metod ujętych w macierzy WCWM. W sposób najbardziej systematyczny nowe ujęcia analizy macierzy WCWM, wolne od pewnej arbitralności (metoda C-F opierała się wyłącznie na ocenie porównawczej układów korelacji, co w przypadku większych macierzy musiało prowadzić do uproszczeń i błędnych rozstrzygnięć) w określaniu stopnia, w jakim analizowane metody wpro- wadzają do wariancji wyniku testowego wariancję metody, po raz pierwszy przed- stawił Alwin (1974). On też wskazał na słabe punkty metody C-F. Najbardziej interesujące — wg Gaula (1989) — okazały się trzy nurty wykorzystania modeli wielozmiennowych do analizy macierzy WCWM (Stanley, 1961; Alwin, 1974; Jackson, 1969; Borach i in., 1970; Werts i in., 1970, 1978; Schmitt, Stults, 1986; Kenny, Kashy, 1992; Drwal, 1995): (a) zastosowanie analizy wariancji ANOVA (por. Stanley, 1961), (b) zastosowanie analizy czynnikowej (zwłaszcza w jej odmianie konfirmacyj- nej CFA — por. Rezmowic, Rezmowic, 1981; Marsh, Hocevar, 1983; Cole, 1987; Marsh, 1990; Kenny, Kashy, 1992), (c) zastosowanie analizy równań strukturalnych; ta grupa modeli obejmuje (Gaul, 1989, s. 436): analizę ścieżek, analizę kauzalną, systemy równań jednoczes nych, liniowe schematy przyczynowe oraz analizę zależności (por. Kalleberg, Klue- gel, 1975; Schwarzer, 1983; zwłaszcza polecam pracę Gaula, 1989 — zawiera ona pełną interpretację macierzy WCWM, o wymiarach 3x3, w modelu analizy ście żek; por. ryc. 2., s. 439 przedstawiającą diagram ścieżek dla trzech cech mierzo nych za pomocą trzech metod). W moim przekonaniu najbardziej owocną analizę macierzy WCWM można przeprowadzić bądź za pomocą analizy równań strukturalnych z odwołaniem się do specjalistycznego oprogramowania — najlepiej do programu LISREL 7 i 8 (por. Jóreskog, Sórbom, 1989, 1995) lub EQS (por. Bentler, 1985 — co najlepiej w polskiej literaturze przedmiotu przedstawił Gaul, 1989; ostatnia wersja z 1995 roku to EQS 5), bądź za pomocą konfirmacyjnej analizy czynnikowej CFA (por. na temat CFA: Zakrzewska, 1994 — z odwołaniem się do programu LISREL 7). Starsze odmiany analizy czynnikowej (np. podejście zaproponowane przez Jacksona, multimethod factor analysis MFA, 1969, a także późniejsza wersja, re- visedM?A.: Jackson, 1975; por. dla ich krytycznej analizy: Drwal, 1995, s. 31-32) czy wykorzystanie analizy wariancji (np. wg Stanley a, 1961 czy Borucha i in. 1970) nie są już spotykane w literaturze przedmiotu. W Polsce ta metoda całościowego badania trafności testu była dotychczas zbyt mało spopularyzowana (chociaż pierwsze informacje na ten temat pojawiły się już wcześniej — por. Choynowski, 1968 s. 273-276; Brzeziński, 1978a, s. 193-196, Magnusson, 1991, s. 199-204). Być może swoistą przeszkodę stanowił fakt, że „profesjonalne" posłużenie się tą metodą wymaga znajomości złożonych modeli statystycznych oraz odwołania się do pomocy komputera. Przed laty była to rze- czywista przeszkoda dla polskiego psychologa. Jednakże dziś, przy dość powszech- nym dostępie i do dobrych komputerów, i do bogatego oprogramowania, przestało być problemem poprawne zanalizowanie macierzy WCWM. Dlatego też, przy braku 34- 531 wspomnianych technicznych ograniczeń, warto tę metodę popularyzować, gdyż jest to najlepszy sposób badania trafności testu — zwłaszcza trafności teoretycznej (w sensie: Cronbach i Meehl, 1955; też: Angoff, 1988). 5. Badanie trafności z wykorzystaniem modelu analizy czynnikowej (tzw. trafność czynnikowa) Spopularyzowanie pakietów statystycznych w rodzaju SPSS PC+, CSS STATISTICA czy LISREL 7 i 8 (por. Jóreskog, Sorbom, 1989, 1995) zwiększyło zainteresowanie psychologów zastosowaniami modelu analizy czynnikowej (FA — od ang. factor ana- lysis) w psychometrii, do badania tzw. trafności czynnikowej. Analiza czynnikowa bywa jednak stosowana niezgodnie z jej założeniami i z charakterem danych empiry- cznych uzyskiwanych za pomocą różnorakich testów psychologicznych. FA może być stosowana w jednej z dwóch odmian: (1) eksploracyjnej EFA, (2) konfirmacyjnej CFA. Psycholog, który decyduje się na zastosowanie modelu FA postępuje tak, aby zastąpić dotychczasowy opis badanej rzeczywistości przeprowadzony za pomocą wielu (kilkunastu, kilkudziesięciu czy nawet kilkuset) „wyjściowych" zmiennych (mniej lub bardziej złożonych — np. mogą to być albo pojedyncze słowa, albo pojedyncze testy ułożone w jakąś baterię diagnostyczną czy skalę, jak WAIS-R). Redukując „wyjściowy" zbiór zmiennych do znacznie mniejszej liczby „nowych" zmiennych (czynników) badacz postępuje ekonomicznie, ale też dowiaduje się czy ów „wyjściowy" układ zmiennych był homogeniczny (i w jakim stopniu), czy też stosunkowo łatwo dał się rozbić na pewną liczbę dobrze wyodrębnionych „no- wych" zmiennych. Tak np. postąpiło wielu badaczy prowadzących badania nad rzeczywistą strukturą Skali Inteligencji W-B I/II, WAIS czy WAIS-R (Leckliter i in., 1986), wyodrębniając najczęściej trzy czynniki łącznie grupujące 11 testów. Jeżeli konstruujemy nowe narzędzie, to też chcemy dowiedzieć się czy owe kilkadziesiąt czy kilkaset pozycji tworzących wstępną wersję narzędzia mierzy jeden konstrukt teoretyczny X (jednolity, homogeniczny) czy też da się go podzielić na kilka, a może nawet kilkanaście jednolitych podzbiorów, z których każdy dotyczy innego konstruktu. Takie, jak wyżej opisane, wykorzystanie modelu FA (odmiana eksplo- racyjna, EFA) znane jest od początku jej stosowania. Poddawane też było krytyce za arbitralność podejmowanych przez niego decyzji, które w znaczącym stopniu zależą od poczynionych przez badacza założeń wyjściowych (pisała na ten temat przed laty Nowakowska, 1975, a całkiem niedawno bardzo pogłębioną analizę FA przeprowadziła Zakrzewska, 1994 — por. rozdz. 4. Decyzje arbitralne w analizie czynnikowej, s. 52-77). Podstawowe decyzje, które musi podjąć badacz związane są z: (1) selekcją zmiennych; pomocne wskazówki na temat liczby zmiennych, ich pomiaru, współ- 532 czynników korelacji wykorzystanych w budowie macierzy korelacji ważne z punktu widzenia poprawnego użycia FA podaje Zakrzewska (tamże, s. 52-56); (2) dobo- rem osób badanych; liczba osób badanych powinna dwu-trzykrotnie przewyższać liczbę poddanych analizie zmiennych, a jej minimalna wielkość nie powinna być, wg różnych szacunków, mniejsza niż 100-200; (3) wyborem metody szacowania zasobu zmienności wspólnej, czyli tej części wariancji całkowitej danej zmiennej, która jest wspólna z pozostałymi zmiennymi badanymi przez psychologa; zasób zmienności wspólnej, to po prostu suma kwadratów ładunków czynnikowych danej zmiennej (z wymienionych przez Zakrzewska sześciu metod osobiście polecam metodę obliczania kwadratu korelacji wielokrotnej danej zmiennej z pozostałymi zmiennymi ujętymi w macierzy korelacji); (4) liczbą czynników, które badacz za- mierza ująć w strukturze czynnikowej badanego fenomenu (także i tu mamy do wyboru wiele różniących się metod; trzeba być naprawdę dobrym specjalistą, aby dokonany wybór był trafny — niestety pakiety statystyczne tego nie uczą, a zresztą nie są one adresowane do nieprofesjonalistów!); (5) wyborem kryterium rotacji czynników; nie wchodząc w szczegóły tego bardzo złożonego problemu powiem tylko tyle, że badacz musi wybierać między rotacją ortogonalną, a rotacją ukośną, czyli między strukturą obejmującą czynniki ze sobą nieskorelowane (wzajemnie niezależne), a strukturą złożoną z czynników, które mogą (ale nie muszą!) być w jakimś stopniu skorelowane (wzajemnie zależne). Stosunkowo dużo nieporozumienia narosło wokół tego ostatniego problemu. Zacznijmy od pytania podstawowego: jaka jest rzeczywistość, którą ma modelowo odwzorować stworzona przez badacza jej struktura czynnikowa? Czy jest ona, jak chciał Guilford, dobrze interpretowana przez układ wzajemnie niezależnych czyn- ników teoretycznych — wówczas należy stosować rotację ortogonalną (także pro- stszą pod względem obliczeniowym i łatwiejszą do interpretacji) — czy też lepiej oddaje ją układ czynników w jakimś stopniu skorelowanych (to pogląd Cattella), jako że i opisywana, i interpretowana rzeczywistość jest też „skorelowana". Prze- waga rotacji ukośnej nad ortogonalną przejawia się i w tym, że o ile ta druga niejako z góry przesądza, że czynniki nie będą ze sobą skorelowane, to rotacja ukośna z góry nie zakłada występowania korelacji między czynnikami (jej rezulta- tem może być struktura ortogonalna). I jeszcze jeden, bardziej techniczny problem, wielu dostępnych programów komputerowych największą sławę zdobył program ,y na technice rotacji ortogonalnej VARIMAX (do prostej struktury), opraco-!J w 1958 roku przez Kaisera (1958). Mimo późniejszych rozwinięć technik liczeniowych związanych z modelem FA, kryterium VARIMAX jest często sto- wane jako jedyne, niestety, znane badaczowi kryterium. Drugą techniką rotacji prostej struktury jest QUARTIMAX. Nie dają one identycznych rezultatów, sza minimalizuje liczbę zmiennych, które cechują się wysokimi ładunkami :ynnikowymi. Druga z kolei minimalizuje liczbę czynników niezbędnych do wy- mienia zmienności jakiejś zmiennej. Gdyby psycholog zakładał, iż w strukturze czynnikowej powinien znaleźć się czynnik ogólny, to powinien on sięgnąć po te- chnikę QUARTIMAX. Niestety obie techniki „kreowania" struktury czynnikowej stawiają badacza przed faktami dokonanymi, bez możliwości zweryfikowania tego, 533 czy adekwatna jest struktura z czynnikiem ogólnym, czy bez niego. Jeżeli z wiedzy badacza nie wynika w sposób oczywisty, że owa struktura jest taka, a nie inna, to powinien on raczej zrezygnować z tego rozwiązania i sięgnąć po jedną z technik rotacji ukośnej, albo posłużyć się modelem CFA (wg komputerowego rozwiązania ujętego w pakiecie LISREL 7 czy LISREL 8 — najlepszy w polskiej literaturze psychologicznej opis CFA znajdzie Czytelnik u Zakrzewskiej, 1994). Zdaniem Zakrzewskiej (tamże, s. 75) najlepszymi technikami rotacji ukośnej są: PROMAX oraz OBLIMIN. W każdym razie zawsze „bezpieczniej" jest posłu- żyć się techniką rotacji ukośnej (np. OBLIMIN), aniżeli techniką rotacji ortogonal- nej (np. VARIMAX). Zarówno technika VARIMAX, jak i technika OBLIMIN dostępne są w pakiecie SPSS PC+. Z kolei inny popularny pakiet CSS STATISTI- CA oferuje jedynie kilka technik rotacji ortogonalnej (w tym VARIMAX i QUAR- TIMAX). Jak Czytelnik zdołał już się przekonać, nie jest obojętne jaką posłuży się techniką rotacji w celu uzyskania struktury czynnikowej zgodnej z przyjętymi przez niego założeniami teoretycznymi. 6. Podsumowanie . Problematyka ustalania trafności testu psychologicznego jest tak samo ważna, jak problematyka ustalania jego rzetelności. Mimo tego, znacznie więcej opracowań poświęcono precyzji pomiaru (rzetelność), aniżeli jego adekwatności (trafność). Zwykło się zaglądać w metryczkę testu głównie po to, aby dowiedzieć się jaka jest wysokość jego współczynnika rzetelności oraz wielkość jakiegoś błędu stan- dardowego. Nie można jednak tak jednostronnego „faworyzowania" jednego kry- terium psychometrycznej dobroci testu akceptować. Stosownie do większego zainteresowania problematyką rzetelności w literatu- rze zagranicznej, także i w polskiej literaturze psychometrycznej znacznie bardziej rozbudowana jest problematyka rzetelnościowa. Do jakich zatem pozycji polskoję- zycznych mógłbym odesłać Czytelnika? Sądzę, że warto zarekomendować kilka opracowań. I tak, dobre wprowadzenie w problematykę trafności (głównie treścio- wej, wewnętrznej — co ma kapitalne znaczenie dla pedagogów konstruujących testy wiadomości i osiągnięć szkolnych) daje praca: Niemierko B. Testy osiągnięć szkolnych. Podstawowe pojęcia i techniki obliczeniowe (rozdz. IV. Trafność testu, s. 169-219). Uwypuklenie problematyki klasyfikacji i selekcji osób w kontekście trafności zawiera praca: Magnusson D. Wprowadzenie do teorii testów (cz. III. Zagadnienia trafności — rozdz. 10. Trafność, rozdz. 11. Rzetelność przewidywania, rozdz. 12. Prognoza indywidualna. Klasyfikacja i selekcja — s. 181-263). Ponadto Czytelnik może sięgnąć do następujących opracowań: Guilford J.P. Podstawowe metody statystyczne w psychologii i pedagogice (rozdz. XVIII: Traf- ność pomiarów, s. 466-490); Jakubowski J.S. Elementy klasycznej teorii trafności 534 testów psychologicznych; Bechtoldt H.P. Teoretyczne podstawy metod testowych: trafność i prognoza. Nade wszystko jednak, Czytelnik powinien zaznajomić się ze standardami wyznaczonymi dla testów psychologicznych, w zakresie ich trafności, przez „biblię psychometryczną", tj. American Psychological Association, APA Standardy dla testów stosowanych w psychologii i pedagogice (E. Trafność, s. 33-58). Rozdział 18. Standaryzacja — obiektywność — normalizacja 1. Wprowadzenie W celu ujednolicenia postępowania badawczego osobom badanym podaje się in- strukcję, z którą muszą się one zapoznać zanim przystąpią do rozwiązywania testu psychologicznego. W instrukcji powinno znaleźć się wyjaśnienie dotyczące sposo- bu udzielania odpowiedzi na poszczególne pozycje testu. Powinno z niej jasno wynikać, czy na wszystkie pozycje należy odpowiadać kolejno, czy też kolejność nie jest obowiązkowa. Jeżeli osoba badana ma udzielać odpowiedzi na specjalnym arkuszu, musi ona umieć się nim posługiwać. Test psychologiczny zakłada też ujednolicony, niezależny od kompetencji oso- by przeprowadzającej badanie, sposób oceniania odpowiedzi osoby badanej. Kolejnym kryterium, które musi uwzględnić badacz konstruujący test jest jego normalizacja. Normalizację testu przeprowadzamy na reprezentatywnej dla danej populacji próbie (w tej sprawie por. rozdz. 9.). Po przebadaniu całej próby danym narzędziem przeliczamy otrzymany zbiór wyników surowych na wyniki jednej ze skal standardowych. Ta procedura ma na celu zorientowanie psychologa posługują- cego się znormalizowanym testem co do miejsca badanej osoby w grupie, dla której obliczono tzw. normy. W najprostszym przypadku normalizacja testu będzie polegała nie na transfor- macji wyników surowych na wyniki skal standardowych, lecz na obliczeniu śred- nich i odchyleń standardowych dla różnych grup. Mogą to być grupy kliniczne, zawodowe, wiekowe, terytorialne itd. Dla psychologa klinicznego bardzo przydatny będzie zestaw norm dla różnych grup klinicznych. Porównanie wyników uzyska- nych przez pacjenta z charakterystycznymi średnimi wynikami różnych grup klini- cznych ułatwi przyporządkowanie go do jednej z nich. 536 2. Standaryzacja i obiektywność testu Pierwsza właściwość dobrego testu psychologicznego wiąże się z jego wystandary- zowaniem. Przy czym przez standaryzację rozumie się, najczęściej, ujednolicony sposób posługiwania się testem. Ma on zminimalizować zależność wyników testu od wpływów czynników ubocznych, takich jak: (a) zachowanie się osoby przeprowadzającej badanie, (b) warunki, w których to badanie jest przeprowadzane. Rzadziej spotyka się szersze rozumienie standaryzacji testu, jako ogółu czyn- ności związanych z jego opracowaniem (por. Kostrzewski, 1970, s. 11). W tym rozdziale przyjęto pierwsze, węższe rozumienie tego pojęcia. Zatem, dobrze wystandaryzowany test posiada: (1) instrukcję, którą podajemy w dosłownym brzmieniu, w sposób ściśle okre ślony przez autora testu, (2) klucz czyli określone zasady, wg których ocenia się odpowiedzi na poszcze gólne pozycje testu i interpretuje się wyniki; najczęściej zamieszcza się go w tzw. podręczniku testowym dołączonym przez konstruktora testu do właściwego testu. Ze standaryzacją wiąże się drugie kryterium — obiektywność. Test jest obie- ktywny, jeżeli dwie różne osoby opracowujące jego wyniki dochodzą do tego sa- mego rezultatu. Dlatego też należy podawać jednoznacznie brzmiące reguły prze- liczania wyników surowych na wyniki określonej skali standardowej, w której wy- rażone są normy dla danego testu. Test zaopatrzony w jasną instrukcję, odpowiednio sporządzony arkusz odpo- wiedzi i należycie opracowany klucz, wg którego ocenia się odpowiedzi, to warun- ki spełnienia kryterium standaryzacji i obiektywności. A oto przykład instrukcji dla osoby badanej (Kwestionariusz Kontroli Emo- cjonalnej — J. Brzezińskiego): Instrukcja. Za chwilę zostaną odczytane różne stwierdzenia dotyczące Pani (Pana) zachowania się. Cechuje je różny stopień ogólności. Jedne z nich dotyczą zachowania się w różnych specyficznych sytuacjach, np. podczas egzaminu, inne opisują bardziej ogólnie zachowanie się człowieka. Oczywiście, nie u każdego człowieka określone zachowanie opisywane przez dane stwierdzenie występuje z równą częstotliwością. Dlatego więc przy każdym stwierdzeniu należy skreślić tylko jedną z czterech podanych możliwości — mówiących o częstości występowania tego zachowania. Tak więc ma Pani (Pan) do wyboru następujące możliwości odpowiedzi: — zawsze — często — rzadko — nigdy Proszę skreślić tę, która Pani (Pana) zdaniem najlepiej charakteryzuje dane stwierdzenie odnośnie do Pani (Pana) zachowania się. Proszę odpowiadać kolejno na każde stwierdzenie i żadnego nie opuszczać. 537 1 Tyle o instrukcji, zajmiemy się teraz arkuszem odpowiedzi i kluczem, odpowiedzi powinien zawierać ponumerowane wiersze, w liczbie odpowiadają liczbie pozycji w teście. Kolejnej pozycji w teście musi odpowiadać kolejny wier na arkuszu odpowiedzi. W każdym wierszu piszemy wszystkie możliwe odpowie-^ dzi, z których badany ma wybrać tę, z którą się zgadza. Większość testów ma dwukategorialny system odpowiedzi: „tak", „nie"; „zga- \ dzam się", „nie zgadzam się". Niekiedy dochodzi jeszcze trzecia kategoria: „nie wiem"; „?". Nawiasem mówiąc kategoria „nie wiem" stwarza wiele problemów natury, interpretacyjnej. Bo, co tak naprawdę oznacza to, że osoba badana na pytanie kwe-1 stionariusza osobowości czy skali postaw odpowiada „nie wiem"? Czytelnika za- chęcam do zapoznania się z gruntowną analizą tej kategorii odpowiedzi, którą prze- prowadził Sułek (1993). W testach uzdolnień np. prosi się osobę badaną o udzielenie lub o wskazanie prawidłowej odpowiedzi (jako jednej z kilku do wyboru — w testach wielokrotne- go wyboru), która jest ściśle przez autora testu określona; prawidłową odpowiedź ocenia się 1 pkt., a nieprawidłową — 0 pkt. Taki system dwukategorialny jest bardzo wygodny, ale — w przypadku testów osobowości, np. kwestionariuszy — większą rzetelność zapewnia wielokategorialny system odpowiadania (por. Guil- ford, 1954, s. 289-291). Optymalna liczba kategorii odpowiedzi zawarta jest w granicach 3-7. Badania przeprowadzone przez Komoritę i Grahama (1965) poka- zały, iż należy zwiększać liczbę kategorii odpowiedzi w krótkich kwestionariuszach osobowości oraz wtedy, gdy interesuje nas kierunek i intensywność odpowiedzi. Ponadto wprowadzenie większej liczby kategorii odpowiedzi w pewnym stopniu eliminuje występującą u badanych tendencję do zgadzania się, która zniekształca wynik kwestionariusza. Przez odpowiednie rozłożenie kategorii odpowiedzi w po- szczególnych wierszach arkusza odpowiedzi można stworzyć bardzo prosty w uży- ciu schemat obliczania wyników ogólnych testu. Na koniec jeszcze jedna uwaga natury technicznej. Przy formułowaniu pozycji 1 postępujemy tak, aby około połowa z nich była oceniana inaczej niż druga połowa. Przykładowo, w systemie odpowiedzi dwukategorialnych odpowiedzi „tak" raz przypisujemy 1 pkt., a raz 0. Można to osiągnąć przez sformułowanie pozycji w postaci przeczącej lub przez opis zachowania świadczącego o braku danej cechy. Utrudnia to w pewnym stopniu odruchowe podkreślanie kategorii tylko w jednej kolumnie, a tym samym zmusza badanych do sumiennego wypełniania arkusza odpowiedzi (pisała o tym Marody, 1974). . 538 3. Skale standardowe oparte na modelu rozkładu normalnego 3.1. Skala tenowa (T) Jedną z najbardziej rozpowszechnionych skal standardowych jest skala tenowa {T) opracowana przez McCalla, a spopularyzowana przede wszystkim przez kwestio- nariusz MMPI, którego normy opracowane zostały zgodnie z założeniami tej skali. Jej parametry są następujące: średnia = 50, odchylenie standardowe = 10. Jest to skala 100-punktowa, odpowiadająca zakresowo rozkładowi normalnemu wyników mieszczącemu się w granicach od -5 odchyleń standardowych do +5 odchyleń standardowych. Ma ona największy zakres ze znanych skal standardowych. Przy- pomnijmy, że w granicach ±3 odchylenia standardowego mieści się około 99,74% powierzchni pod krzywą normalną. Jedna jednostka (ten) skali tenowej odpowiada 0,1 odchylenia standardowego. Zdaniem Guilforda (1964, s. 504) jest to niekiedy zbyteczna dokładność, zwłaszcza, gdy odchylenie standardowe rozkładu surowych wyników jest o wiele mniejsze niż 10. Także wtedy, gdy błąd standardowy danego narzędzia jest tak duży, że najmniejsza rzeczywista różnica, którą można zaobser- wować wynosi 0,5 odchylenia standardowego. W takiej sytuacji wystarczającą do- kładność zapewnia skala stenowa, albo zaproponowana przez Guilforda (tamże, s. 504-507) 11-punktowa skala C. Tabela 18.1. podaje procent powierzchni pod krzywą normalną przypadający na każde 10 jednostek skali T (por. też — rys. 18.1). I Tabela 18.1. Procent powierzchni pod krzywą normalną dla skali T T 0-20 20-30 30-40 40-50 50-60 60-70 70-80 80-100 % 0,13 2,14 13,59 34,13 34,13 13,59 2,14 0,13 Gdy rozkład wyników surowych jest normalny, skala T odpowiada skali Z, wyrażającej się formułą: Z=10z + 50, (18.1) gdzie: z — wynik standaryzowany odpowiadający danemu wynikowi surowemu, z = [X - X] : s, gdzie: X — wynik surowy; X — średnia wyników surowych w próbie normali- zacyjnej; ^ — odchylenie standardowe wyników surowych w próbie normaliza- cyjnej. Jednak wyniki Z pochodzące z dwóch lub więcej rozkładów wyników mogą być ze sobą porównywane tylko wtedy, gdy rozkłady te tylko nieznacznie różnią się kształtem od „dzwonowatego" kształtu rozkładu normalnego (o czym decyduje 539 wielko ść odchyl enia standar doweg o — platyku rtyczno ść lub leptoku rtyczno ść roz- kładu — oraz jego symetr ycznoś ć — prawos kośnoś ć lub lewosk ośność) . Przelic zenie wynikó w surowy ch na wyniki skali T — wedle niżej opisane j proced ury — normal izuje rozkład wynikó w i umożli wia przepr owadz enie takich porów nań. Ja ko przykła dem posłuż ymy się Skalą Kontro li Ekspre sji, Kwesti onarius za Kontrol i Emocj onalnej Brzeziń skiego, KKE, którą przeba dano 200 osób. Wyniki zawier a tab. 18.2. Tabela 18.2. Normy tenowe dla Skali Kontroli Ekspresji KKE (n = 200) (1) (2) (3) (4) (5) (6) (7) w f cf cf poniżej danego wiersza + 0,5/ 7 T J dla danego wiersza V 27 1 200 199,5 0,9975 2,81 78 26 3 199 197,5 0,9875 2,24 72 25 3 196 194,5 0,9725 1,92 69 24 4 193 191 0,9520 1,66 67 23 5 189 186,5 0,9325 1,49 65 22 12 184 178 0,8900 1,23 62 21 17 172 163,5 0,8175 0,91 59 20 19 155 145,5 0,7275 0,61 56 19 16 136 128 0,6400 0,36 54 18 18 120 111 0,5520 0,13 51 17 15 102 94,5 0,4725 -0,07 50 16 24 87 75 0,3750 -0,32 47 15 12 63 57 0,2850 -0,60 44 14 16 51 43 0,2150 -0,79 42 13 9 35 30,5 0,1525 -1,03 40 12 10 26 21 0,1050 -1,25 38 11 7 16 12,5 0,0625 -1,53 35 10 5 9 6,5 0,0325 32 i 9 2 4 3 0,0150 -2,17 28 8 0 2 2 0,0100 -2,33 27 7 1 2 1,5 0,0075 -2,43 26 6 0 1 1 0,0050 -2,57 24 5 0 1 1 0,0050 -2,57 24 4 1 1 0,5 0,0025 -2,81 22 W kolumn ie 1. tabeli przelicz eniowej zamiesz czamy albo uporząd kowane wyniki surowe, albo środki przedzi ałów wynikó w pogrupo wanych w klasy. W naszym przypad ku są to uporząd kowane wyniki surowe. Kolumn a 2. zawiera liczebn ości wynikó w surowy ch, a kolumn a 3. liczebn ości skumul owane. W kolumn ie 4. dla każdeg o wiersza oblicza my następu jącą wartość : skumul owana liczebn ość poniżej danego wyniku (lub środka przedzi ału klasowe go) plus połowa liczebn ości dla danego wyniku (środka przedzi ału). W kolumn ie 5. mamy proporc ję (p) poszcze gól- 540 nych wartości kolumny 4. W kolumnie 6. wpisujemy wartości z odpowiadające wartościom: (cf- l/N) z kolumny 4. Znajdujemy je w tablicach zawierających war- tości dystrybuanty rozkładu normalnego. Podaje je, z wymaganą dokładnością do 0,01, Greń (1987, s. 505-508, Tablica 3.; u Grenia symbol z zastąpiony został symbolem u; też przedruk tych tablic w Dodatku — tablica 2.). W ostatniej ko- lumnie, 7. wpisujemy wyniki T obliczone wg formuły: T- 10z + 50. Wyniki kwestionariuszy osobowości takich jak: MMPI, WISKAD, CPI, ACL przekraczające 707" traktuje się jako istotnie wyższe i przekraczające granice normy (Wallen, 1964, s. 290; Płużek, 1971, s. 161). Zdaniem Płużek (tamże, s. 12) idealny profil osobowości powinien być płaski i zawierać się między 50 a 707. Czy jednak nie jest to ten sam „mit płaskiego profilu", który opisał Kaufman w odniesieniu do profilu psychometrycznego Skal Inteligencji dla Dzieci Wechslera (por. rozdz. 19., pkt. 2.3). Wyniki poniżej 30J traktuje się jako istotnie zaniżone. Taką inter- pretację wyników skali tenowej przyjęto także w przypadku norm dla KKE Brze- zińskiego. 3.2. Skala stenowa I i Zapozna jmy się teraz ze sposobe m przekszt ałcenia zbioru wynikó w surowyc h testu na wyniki skali stenowe j. Skalę stenową (od ang. standar d ten — standard owa dziesiąt ka) cechują następuj ące paramet ry: średnia = 5,5, odchyle nie standar dowe -= 2,0. Składa się ona z 10 jednoste k — stenów. Jedna jednost ka równa się 0,5 odchyle nia standard owego. Każdej jednostc e skali odpowia da pewien procent po- wierzc hni pod krzywą normal ną rozkład u wynikó w, tak jak to przedst awia tab. 18.3. Tabela 18.3. Powierzchnie pod krzywą normalną odpowiadające poszczególnym stenom (Choynowski, 1966, s. 133) (1) (2) (3) Steń Wyniki standaryzowane z Procent powierzchni pod krzywą normalną (w przybliżeniu) 10 +2,00 do +°° 2 9 + 1,50 do +1,99 5 8 + 1,00 do +1,49 9 7 +0,50 do +0,99 15 6 +0,00 do +0,49 19 5 -0,50 do -0,01 19 4 -1,00 do -51 15 3 -1,50 do -1,01 9 2 -2,00 do -1,51 5 1 -°° do -2,01 2 541 Wyniki z przedziału: 5-6 sten traktuje się jako przeciętne, wyniki z przedzia- łu: 7-10 sten uważa się za wysokie, a wyniki z przedziału: 1-4 sten za niskie. Omówienie podstaw teoretycznych skali stenowej znajdzie Czytelnik u Canfielda (1951). Tabela 18.4. Normy stenowe dla Kwestionariusza Poczucia Winy (KPW) — dla mężczyzn, n = 200 (wg Kofty, Brzezińskiego i Ignaczaka, 1977, s. 107) (1) (2) (3) (4) (5) Wyniki f cf cf- l/n Sten 42 1 200 1,000 10 41 1 199 0,995 10 40 5 198 0,990 10 39 3 193 0,965 9 38 0 190 0,950 9 37 1 190 0,950 9 36 6 189 0,945 9 35 9 183 0,915 8 34 6 174 0,870 8 33 7 168 0,840 7 32 7 161 0,805 7 31 4 154 0,770 7 30 9 150 0,750 7 29 7 141 0,705 7 27 9 130 0,650 6 26 Q 121 0,605 25 5 113 0,565 6 24 8 108 0,540 6 23 7 100 0,500 5 22 11 93 0,465 5 21 6 82 0,410 5 20 7 76 0,380 5 19 4 69 0,345 5 18 11 65 0.325 5 17 5 54 0,270 4 16 5 49 0,245 4 15 7 44 0,220 4 14 3 37 0,185 4 13 6 34 0,170 4 12 7 28 0,140 3 11 0 21 0,105 3 10 5 21 0,105 3 9 2 16 0,080 3 8 2 14 0,070 3 7 4 12 0,060 2 6 1 8 0,040 2 5 3 7 0,035 2 4 2 4 0,020 1 3 2 2 0,010 1 2 0 0 0,000 1 1 0 0 0,000 1 0 0 0 0,000 1 Razem: 200 542 Sposób przejścia od wyników surowych do stenów przedstawia tab. 18.4., w której zawarte są wyniki surowe uzyskane przez grupę n = 200 mężczyzn w kwe- stionariuszu KPW (Kwestionariusz Poczucia Winy; por. Kofta, Brzeziński, Igna- czak, 1977). Tabela 18.4. zawiera uporządkowane wyniki surowe w kolumnie 1., ale można także zamieścić tu wyniki pogrupowane w klasy, których liczba nie powinna być mniejsza niż 12 (najlepiej: 15-20). W kolumnie 2. wpisujemy liczeb- ności wyników, a w kolumnie 3. — skumulowane liczebności. Skumulowane li- czebności przemnażamy w poszczególnych wierszach tabeli przez wyrażenie: l/n i zamieszczamy w kolumnie 4. W kolumnie 5. wpisujemy steny odpowiadające wy- nikom surowym na podstawie wielkości wyrażenia (cf- l/n). Zakresy wielkości tego wyrażenia dla poszczególnych stenów zawiera tabela 18.5. Procedurę przeli- czania wyników surowych na wyniki skali stenowej przytoczyłem za Dobruszkiem (1971, s. 92-94). Tabela 18.5. Tabela zakresu wartości wyrażenia: cf- l/n dla poszczególnych stenów (Dobruszek, 1971, s. 94) (1) (2) (3) (4) Steń Zakres wartości wyrażenia: cf- l/n Steń Zakres wartości wyrażenia: cf- lin 10 0,978-1,000 5 0,309 - 0,500 9 0,934-0,977 4 0,160-0,308 8 0,842-0,933 3 0,068-0,159 7 0,693-0,841 2 0,024 - 0,067 6 0,501-0,692 1 0,000 - 0,023 4. Porównanie skal standardowych Porównajmy teraz najbardziej rozpowszechnione skale standardowe oparte na mo- delu rozkładu normalnego — z odniesieniem do tegoż modelu. Takie zestawienie tych skal zostało ujęte na rys. 18.1. Poza omówionymi wyżej skalami — tenową i stenową — przedstawione zostały także dwie skale standardowe, które wykorzystał Wechsler w całej rodzinie Skal Inteligencji — W-B Uli, WA1S, WAIS-R, WISC, WISC-R, WPPSl, WPPSl-R (por. Brzeziński, 1993a). Te skale to: (a) skala wyników przeliczonych WP o parame- trach: średnia=\0 i odchylenie standardowe^^ (rozpiętość: 1-19 pkt.), (b) skala ilorazów inteligencji IQ o parametrach: średnia=100 i odchylenie standardowe=15 (rozpiętość: 45-150). Bezpośrednio pod rysunkiem krzywej normalnej podane zostały „skumulowa- ne procenty". Jak korzystać z tej informacji? Jeżeli, przykładowo weźmiemy pod uwagę wartość 97,7%, to informuje ona badacza o tym, iż 97,7% populacji ma wyniki równe i niższe od wyniku uzyskanego przez osobę badaną (która uzyskała wynik w teście odpowiadający, jak pokazuje to rys. 18.1, 70 jednostkom w skali 54 j \ \ f B / \ - 'iv. / \ ~ - 2,14%/(3,59 % 34,13% 34,13% 13,59% S. .2, 14% 0,13% I K\ tii padków -4P> r - Rys. 19.1 Profil psychometryczny wraz z zaznaczonymi przedziałami ufności Testy wchodzące w skład WAIS-R różnią się między sobą pod względem wartości współczynników rzetelności (r„) i błędów standardowych pomiaru (SEMT). Dlatego też wyniki otrzymane przez osobę badaną w poszczególnych testach WAIS-R informują nas, z różną dokładnością, o prawdopodobnej wartości wyniku prawdziwego. Jedną z powszechnie stosowanych metod oszacowania, na podstawie znajomości wyniku otrzymanego T, przez osobę badaną w teście, nieznanej wartości wyniku praw- dziwego (Ts,) jest metoda przedziału ufności (por. Lord, Novick, 1968). Przedział ufności dla wyniku prawdziwego Ts, oszacowanego na poziomie ufności (1 -p) 100% z wyniku otrzymanego T, ma postać: Tą € (Ti - zp/2SEMTi; r, + zp/2SEMTi >. (19.6) Przykład: Jan Kowalski (wiek: 25 lat) w teście „Słownik" WAIS-R otrzymał nastę- pujący wynik przeliczony: T= 10. Parametry psychometryczne testu „Słownik" są następujące: r„ = 0,96; SEMT=0,61 (por. Wechsler, 1981, s. 30, 33). Przyjmijmy: p = 0,15. Zatem możemy zbudować 85% przedział ufności dla Ts testu „Słownik": 552 Tse (10-(l,44)(0,67); 10+ (1,44X0,67)), Tse (9,04; 10,96), w zaokrągleniu: 7>e<9; 11). Otrzymaliśmy zatem przedział ufności o dolnej granicy 9 pkt. i górnej granicy równej 11 pkt. Interpretacja otrzymanego rezultatu jest następująca. Otóż, z pra- wdopodobieństwem 0,85, przedział ufności o granicach: 9 i 11 pkt. pokrywa nie- znaną wartość wyniku prawdziwego Ts w teście „Słownik" WAIS-R. Czyli, mówiąc jeszcze inaczej, Jan Kowalski mógł równie dobrze otrzymać w tym teście wynik równy 9 pkt. jak i równy 11 pkt. Rzecz jasna mógł też otrzymać wynik jeszcze bardziej skrajny — mniejszy od 9 pkt. albo większy od 11 pkt. ale prawdopodo- bieństwo tego jest równe 0,15. Przeprowadzając powyższą operację dla każdego testu danej baterii testów otrzymamy m wartości górnych granic, które połączone linią dadzą tzw. profil górnych granic (P-g) oraz otrzymamy m wartości dolnych granic, które połączone linią dadzą tzw. profil dolnych granic (P-d). Zatem na jednym wykresie będziemy mieli trzy profile — profil otrzymany przez osobę badaną oraz profil dolnych i profil górnych granic przedziałów ufności (por. rys. 19.1). Wynik każdego testu baterii musimy interpretować biorąc pod uwagę możliwą jego dolną i górną granicę. Rys. 19.2 pokazuje profile wykreślone przy danym poziomie istotności a =0,05. 2.3. Analiza dyspersji profilu — wskaźnik: G-D Otrzym ując do interpret acji psychol ogicznej jakiś profil psycho metrycz ny musimy — zanim zacznie my go interpret ować — wpierw odpowie dzieć na pytanie o unikato wość (względ nie typowoś ć) uzyskan ego kształtu profilu. Mówiąc inaczej, musimy zoriento wać się, na ile uzyskan y przez osobę badaną profil jest nietypo wy (co do kształtu) , odbiegaj ący od kształtu tzw. profilu normaln ego, typoweg o dla danej populacj i. Jed nym z dość rozpows zechnio nych wskaźni ków rozpięto ści profilu psycho me- tryczne go takich baterii jak: WAIS- R, WISC- R, WPPSI (por. Kaufma n, 1976b; Rey- nolds, Gutkin, 1981; Silverste in, 1987, 1988) jest wielkoś ć różnicy między wynikie m najwyżs zym (górny m — G) i najniższ ym (dolnym — D) profilu: „G-D". Przykła d. Jan Kowals ki uzyskał następu jącą sekwen cję wynikó w przelicz onych w WISC-R (wersja 10- testowa) : WISC-R W R A P S BO PO K U sc Skal a Pełna (F) 10 8 7 12 8 10 9 15 11 9 Skal a Słowna (V) 10 8 7 12 8 10 — — — — Skal a Bezsłowna (P) — — — — — 9 15 11 9 Wartości wskaźnika „G-D" dla poszczególnych skal są następujące: F:(G-Z))=15-7 = 8, V : (G-D)= 12-7 = 5, P : (G-D)= 15-9 = 6. 553 WAIS-R (b) 19 _ 18 _ 17 _ 16 _ 15 _ 14 _ 13 _ 12 _ 11 _ 10 9 _ 8 _ 7 _ 6 _ 5 _ 4 _ 3 _ 2 _ 1 _ BO PO K u sc SKALA BEZSŁOWNA (P) 6 5 5 5 7 Pf=8,0 przedział wieku: 16-17 WAIS-R (a 19 _ 18 _ 17 _ 16 _ 15 _ 14 _ 13 _ 12 _ 11 _ ? 10 9 _ 8 _ 7 _ O 5 _ 4 _ 3 _ 2 _ 1 _ W PC s A R P SKALA SŁOWNA (V) 6 8 12 10 12 12 P„=10,0 PP=5,6 a=0,05 WAIS-R (c) 19 _ 18 _ 17 _ 16 _ 15 _ 14 _ 13 _ 12 _ 11 _ 10 9 _ 8 L 7 _ 6 _ 5 I 4 3 1 2 J 1 J w PC s A R P BO PO K U SC S K A L A P E Ł N A ( F ) 1 0 1 2 1 2 6 P-9 8 10 13 12 14 14 9 8 7 8 9 P-d 4 6 11 8 10 10 3 2 3 2 5 6 8 12 Rys. 19.2. Przykładowa analiza trzech profilów WAIS-R: (a) P\, (b) Ą>, (c) PF 2.4. Analiza odchyleń wyników poszczególnych testów (7",) od średniego profil u (P) — wskaźnik Ti - P: 2.4.1. Średnia obliczona z uwzględnieniem testu Ti Psychologiczna interpretacja odchyleń wyniku uzyskanego przez osobę badaną w jakimś teście WAIS-R od przeciętnego wyniku wszystkich testów, tj. od średniego profilu, musi mieć swoje statystyczne uzasadnienie. Możemy o nim mówić wów- czas, gdy wynik danego testu w sposób statystycznie istotny (na przyjętym pozio- mie istotności) odchyla się (in plus lub in minus) od średniej uzyskanej dla wszy- stkich testów wchodzących w skład Skali — Słownej czy Bezsłownej. Zacznijmy od analizy dwóch przeciętnych profilów — jednego dla Skali Słownej (Fv) i jednego dla Skali Bezsłownej (PP) WAIS-R. Przy ocenie statystycznej istotności różnicy: Tt-Pv, Tt-Pp czy T^-Pf korzy- stać będziemy z metody przedziału ufności, wykorzystywanego tu w roli testu istotności różnic. Aby daną różnicę Tt-P uznać za istotną, jej wartość bezwzględna powinna spełnić na danym poziomie istotności p następujące kryterium: ir,-?l>z^5?M(,,_?). (19.7) Wartości SEMD(j-._p i SEMD(T._pp) dla poszczególnych skal inteligencji — WAIS-R — zostały obliczone przez Brzezińskiego i Gaula (1993, tab. 13a, s. 129- 130) i tu przedrukowane w tab. 19.1. ? Przykład. Pokażemy teraz technikę obliczeń wartości SEMD(T._p) dla oceny istotności różnicy między wynikiem uzyskanym przez Annę Kowalską (wiek: 40 lat) w teście „Wiadomości" WAIS-R oraz przeciętnym profilem skali słownej (Pv). Osoba badana uzyskała następujące wyniki przeliczone w sześciu testach Skali Słownej WAIS-R: ? Osoba badana: 14 10 13 12 13 10 SEMTmad = 0,91, a = 0,05 20,05/2 = 1,96, Tw. = 14 Pv = 12. Korzystając ze wzorów przytoczonych w pkt. 9. i 10. zestawienia oznaczeń obliczamy wartość SEMD (Tt - Pv): = (0,91)2 + (1,21)2 + (1,19)2 + (1,22)2 + (1,27)2 = 7,2065, (0'91)2 = °'8673 ' Zo,05aSEMD(Ti_pv) = (l,96)(0,8673) = 1,6999, 555 Tabela 19.1. WAIS-R. Błędy standardowe pomiaru różnicy między danym testem (T,) a średnim pro- filem SkaJi Słownej — SEMDiT._pv), Skali Bezsłownej — SEMD(r_pp), oraz Skali Pełnej — SEMD(Tt_pF) (0) (1) (2) (3) (4) (5) (6) (7) (8) (9) Test Przedziały wiekowe 16-17 18-19 20-24 25-34 35^4 45-54 55-64 65-69 70-74 SEMD(T,-PV) W 0,82 0,82 0,88 0,92 0,87 0,99 0,84 0,90 0,88 PC 1,26 1,26 0,92 0,92 1,08 1,13 1,12 1,12 1,13 S 0,61 0,61 0,70 0,70 0,68 0,70 0,68 0,64 0,71 A 1,08 1,02 1,06 1,08 1,07 1,03 0,92 0,97 1,01 R 1,05 1,04 1,17 1,11 1,09 1,05 1,08 1,00 1,06 P 1,15 1,02 1,23 1,15 1,13 1,09 1,03 1,11 1,07 SEMD(j,-pp) BO 1,29 1,25 1,15 1,08 1,15 1,15 1,17 0,99 0,97 PO 1,32 1,33 1,34 1,30 1,26 1,20 1,26 1,17 0,97 K 1,00 0,99 0,98 0,97 0,97 1,03 0,97 0,87 0,84 U 1,62 1,36 1,38 1,45 1,29 1,23 1,26 1,19 1,20 SC 1,36 1,34 1,04 1,04 1,12 1,11 1,12 1,09 1,08 SEMD(Ti-PF) W 0,86 0,85 0,91 0,97 0,90 1,04 0,88 0,94 0,90 PC 1,36 1,36 0,96 0,96 1,15 1,20 1,20 1,20 1,20 S 0,59 0,60 0,70 0,71 0,68 0,69 0,69 0,63 0,70 A 1,09 1,09 1,12 1,15 1,14 1,09 0,97 1,02 1,06 R 1,12 1,12 1,25 1,19 1,16 1,11 1,16 1,05 1,12 P 1,23 1,09 1,32 1,23 1,20 1,15 1,10 1,18 1,13 BO 1,35 1,31 1,21 1,12 1,21 1,22 1,24 1,04 1,01 PO 1,39 1,42 1,45 1,41 1,35 1,28 1,36 1,27 1,01 K 0,96 0,96 0,98 0,97 0,97 1,07 0,97 0,86 0,86 U 1,77 1,45 1,50 1,60 1,40 1,33 1,36 1,29 1,31 SC 1,44 1,43 1,06 1,06 1,18 1,17 1,17 1,16 1,16 Źródło: Brzeziński, Gaul (1993, tab. 13a, s. 129-130). Pomocnicze wartości: SEMT, oraz EVT, zawiera tab. 19.2. Tabela 19.2. WAIS-R. Błędy standardowe pomiaru dla testów (a — 5?A/r.) i wariancje błędu pomiaru testów (b — (0) (1) (2) (3) (4) (5) (6) (7) (8) (9) Testy Przedziały wiekowe 16-17 18-19 20-24 25-34 35^4 45-54 55-64 65-69 70-74 W a 0,84 0,85 0,85 0,99 0,91 1,08 0,89 0,97 0,93 b 0,71 0,72 0,72 0,98 0,83 1,17 0,79 0,94 0,86 PC a 1,44 (1,44) (0,44) 0,98 1,21 1,27 (1,27) (1,27) (1,27) b 2,07 (2,07) (0,07) 0,96 1,46 1,61 (1,61) (1,61) (1,61) s a 0,49 0,52 0,52 0,67 0,63 0,63 0,65 0,65 0,68 b 0,24 0,27 0,27 0,45 0,40 0,42 0,42 0,34 0,46 A a 1,20 1,13 1,13 1,21 1,19 1,14 1,00 1,06 1,11 b 1,44 1,28 1,28 1,46 1,42 1,30 1,00 1,12 1,23 R a 1,16 1,16 1,16 1,25 1,22 1,16 1,22 1,10 1,18 b 1,35 1,35 1,35 1,56 1,49 1,35 1,49 1,21 1,39 P a 1,29 1,16 1,13 1,30 1,27 1,21 1,15 1,25 1,19 b 1,66 1,28 1,28 1,69 1,61 1,46 1,32 1,56 1,42 BO a 1,39 1,39 1,27 1,17 1,28 1,29 1,31 1,08 1,06 b 2,93 1,93 1,61 1,37 1,64 1,66 1,72 1,17 1,12 PO a 1,51 1,51 1,55 1,50 1,44 1,36 1,45 1,35 1,07 b 2,28 2,28 2,40 2,25 2,07 1,85 2,10 1,82 1,14 K a 0,98 0,98 1,00 0,99 1,00 1,11 1,00 0,88 0,87 b 0,96 0,96 1,00 0,98 1,00 1,23 1,00 0,77 0,76 U a 1,55 1,55 1,61 1,71 1,49 1,41 1,45 1,37 1,40 b 3,40 2,40 2,59 2,92 2,22 1,99 2,10 1,88 1,96 sc a 1,53 (1,53) (1,10) 1,10 1,24 1,23 (1,23) (1,23) (1,23) b 2,34 (2,34) (1,21) 1,21 1,54 1,51 (1,51) (1,51) (1,51) W nawiasach podano wartości aproksymowane Źródło: Brzeziński, Gaul (1993, tab. 14a, s. 132) — Aby można uznać różnicę: 7\viad -Pw = 2 pkt. za istotną statystycznie na po- aomie a = 0,05 musi ona przewyższać (lub być co najmniej równa) wartość 5nSEMD(Ti_-pw). Ponieważ tak właśnie jest, gdyż przewyższa ona wartość tego yterium, więc otrzymana różnica 2 pkt. może być uznana za statystycznie istotną poziomie a = 0,05. .4.2. Średnia obliczona bez uwzględnienia testu Ti ykład. Pokażemy teraz technikę obliczeń wartości SEMDg- _ p) dla oceny istotności nicy między wynikiem uzyskanym przez Annę Kowalską (wiek: 40 lat) w teście „Wiadomości" WAIS-R oraz przeciętnym profilem skali słownej (Pv). Tym razem jed-; wynik testu nie był uwzględniany przy obliczaniu średniej. Osoba badana uzyskała ujące wyniki przeliczone w sześciu testach w Skali Słownej WAIS-R: 557 Osoba badana: 14 10 13 12 13 10 SEMTmad. = 0,91, a = 0,05 7\viad. = 14 PV = 11,6. Zo,o5/2 = 1,96, Korzystając ze wzorów prztoczonych w pkt. 9. i 10. zestawienia oznaczeń obliczamy wartość = (0,91)2 (1,22)2 + (1,27)2 = 7,2065, i' 7 ( 0 , 9 1 ) ^ = 1 , 0 1 4 0 , t t c . - ' , U0- ł?.v >j f i GŁ.i Zo,o5nS EMD(Ti_ py) = (l,96)(l,0 140) = 1,9874, ' Wiad _ pv = 14 - 12 = 2. Aby można uznać różnicę: rWiad - Pv = 2 pkt. za istotną statystycznie na poziomie a = 0,05 musi ona przewyższać (lub być co najmniej równa) wartość ZofisaSEMD^- Py) ? Ponieważ tak właśnie jest, gdyż przewyższa ona wartość tego kryterium, więc otrzymana różnica 2 pkt. może być uznana za statystycznie istotną na poziomie a = 0,05. Wyłączenie wyniku testu „Wiadomości" z obliczania wielkości różnicy Tw - 1 - Py dało więc, w tym konkretnym przypadku, ten sam rezultat co w przypadku, gdy wynik tego testu „wchodził" do średniej. Stało się tak, gdyż obie średnie nie różniły się znacząco — 12 (6 testów) i 11,6 (5 testów). 2.5. Ocena istotności różnic wyników dwóch testów: A "' d ' Tiii Tj — wskaźnik:d(Tii-Tj) r-i i es ?u fc Ostatnim krokiem w analizie intraindywidualnej profilu pojedynczej osoby ba- danej będzie dokonanie porównań każdego testu z każdym {T z T'). Chodzi bowiem o to, aby ocenić różnice między wynikami poszczególnych testów wg zasady: „każdy z każdym". Trzeba oddzielić te pary testów, których wyniki uzyskane przez osobę badaną różniły się istotnie (na danym c) od tych par testów, których wyniki nie różniły się istotnie. Dalszej, psychologicznej inter- pretacji poddajemy tylko te różnice, które były istotne statystycznie. Zastoso- wana tu będzie ta sama procedura statystyczna, co w przypadku wykreślania profilów dolnych i górnych granic przedziałów ufności dla danego, otrzymanego przez osobę badaną, profilu psychometrycznego. Będzie to zatem sygnalizowana już metoda przedziału ufności. Przedział ufności dla różnicy dwóch wyników prawdziwych : „T-Tś\ na danym poziomie ufności: (1 -a) 100%, ma postać: J} xhlJS ,iv*,. (Ts-Ts')e ((T-T O- r-,; (T- T ') + ). (19.8) Jak interpretujemy przedział ufności dla różnicy: „Ts - Ts"7 Aby różnicę wy- ników: TiT' uznać za istotną na danym poziomie a, musi ona (jej wartość 558 bezwzględna) przewyższać (lub być co najmniej równa) wartość półprzedziału uf- ności: ,^2SEMD(7-_7-)". Albo inaczej: jeżeli dolna granica przedziału ufności bę- dzie liczbą ujemną, to będzie to oznaczało, iż dana różnica: T-T' nie jest istotna statystycznie, a zaobserwowana różnica: T-T' nie będzie podlegała psychologicz- nej interpretacji. Ten sposób oceny istotności różnic wyników dwóch testów wcho- dzących w skład baterii testów rekomendują Lord i Novick (1968, rozdz. 7.), Mag- nusson (1991, rozdz. 7.), Brzeziński i Noworol (1984). Przykład. Genowefa Nowak (lat: 45) uzyskała w teście „Wiadomości" (J,) i w teście „Arytmetyki" (T2) WAIS-R następujące wyniki: Tt = 15, T2 = 13. Współczynniki rzetelności obu testów, dla przedziału wieku: 45-54 są nastę- pujące (por. Wechsler, 1981, tab. 10, s. 30): »Va> m 0,87 (J, : Wiad.), rm = 0,84 (T2 : Arytm.). Korzystając ze wzoru (por. punkt 14. w wykazie oznaczeń) na mamy: SEMD(T I-T2) = 3(2 - 0,87 - 0,84)05 =1,61. Czy zaobserwowana różnica: „15 -13 = 2 pkt." może być uznana za statysty- cznie istotną na poziomie a = 0,05? Aby odpowiedzieć na to pytanie musimy zbu- dować półprzedział ufności: 1) = 3,15; w zaokrągleniu: 3 pkt. Ponieważ różnica Tx-T2 = 2 pkt. jest mniejsza od wartości półprzedziału uf- ności równej 3 pkt. więc nie można jej uznać za istotną statystycznie. Aby owa różnica mogła być uznana za istotną, musiałaby wynosić co najmniej 3 pkt. 3. Analiza interprofilowa 3.1. Współczynnik G-Holleya i Guilforda — testy dychotomiczne („0,1") Bardzo często w swojej praktyce badawczej psycholog, a zwłaszcza psycholog praktyk, np. klinicysta, musi dokonać oceny funkcjonowania ucznia czy pacjenta na skalach szacunkowych, na których koduje się bądź obserwacje zachowania ucz- nia w klasie szkolnej czy pacjenta na oddziale szpitalnym, bądź uzyskane w wy- wiadzie informacje o jego funkcjonowaniu (np. w rodzinie), bądź też on sam wy- pełnia proste kwestionariusze samoobserwacyjne. W swej najprostszej postaci skale szacunkowe przybierają postać skal dwubiegunowych, zero-jedynkowych. Możemy 559 bowiem punktować „postępy w uczeniu się" jako 1 pkt, a „brak postępów" jako i pkt. Możemy stwierdzać występowanie objawów wchodzących w skład syndron objawów klinicznych (1 pkt) lub też możemy nie stwierdzić ich występowania (0 pkt). Osoba badana może udzielić odpowiedzi „diagnostycznej" (1 pkt) lub „nie diagnostycznej" (0 pkt). Skale szacunkowe mogą być zebrane w jedną baterię ze względu na pewne kryteria, np. dotyczą różnych aspektów funkcjonowania osoby badanej (jak np. w badaniach Bandury i Waltersa, 1968). Taka bateria może zawierać od kilku do kilkudziesięciu (a nawet przeszło stu) skal dwupunktowych. „Wynik" osoby badanej to seria zer i jedynek (łącznie zer i jedynek będzie tyle, ile skal liczy bateria). Jestem przeciwny dodawaniu do siebie wyników cząstkowych w celu uzyskania jednego wyniku ogólnego, gdyż prowadzi to jedynie do utraty infor- macji o owych charakterystycznych cechach funkcjonowania, o których infor- mują psychologa pojedyncze skale szacunkowe. Dlatego też proponuję, aby w przypadku baterii fc-skalowej zapisać wynik osoby badanej w postaci sekwencji ife zer i jedynek. Mówiąc inaczej, chodzi o to, by posługiwać się profilem, czyli krzywą łączącą, odpowiadające osobie badanej, punkty na odcinkach reprezen- tujących poszczególne skale. Przykładowo, w 10-skalowej baterii samoobserwacyjnej osoba badana może uzyskać następujący wynik: skala: wynik: To samo możemy przedstawić graficznie jako profil — por. rys. 19.3. Skale: I II ni rv V VI VII VII IX X 0 0 i i 0 1 0 1 0 0 ? o J Rys. 19.3. Przykładowy profil utworzony ze zmiennych (skal) dychotomicznych Dla każdej z badanych osób możemy wykreślić profil (taki, jak na rysunku 19.3) lub też wypisać sekwencję zer i jedynek. Jeżeli mamy w grupie badanej 10 osób, to możemy dokonać 45 porównań — każdej z każdą — a z otrzymanych wskaźników podobieństwa osób badanych względem siebie utworzyć macierz po- dobieństwa postaci: 560 Osoby: O, O2 O3 O„-i O„ O, — Gn Gn G\,n-\ Gin O2 — G23 G2,n-i Gin O3 Gi.n-1 Gin — O„-i — Gn-l,n o„ Główna przekątna tej macierzy jest nie wypełniona, gdyż na niej musiałyby znaleźć się współczynniki podobieństwa danej osoby z ... nią samą. Poza główną przekątną mamy wskaźniki podobieństwa we wszystkich parach osób badanych. Macierz jest symetryczna (podobieństwo: O] i O2 jest takie samo jak O2 i O]!) i dlatego nie została wypełniona poniżej głównej przekątnej. Pozostaje jeszcze pytanie, w jaki sposób obliczyć miarę podobieństwa profi- lów dwóch osób badanych, która w macierzy oznaczona jest literą G. Użyteczną i statystycznie poprawną miarę podobieństwa zaproponowali Holley i Guilford (1964; Guliford, Fruchter, 1978). Wskaźnik G — bo o nim mowa — wyraża się wzorem (19.9): (a + d)-(b + c) Uk-k' a + b + c + d ' Test istotności współczynnika G skonstruował Vegelius (1981). Oblicza się go podobnie jak współczynnik <|) — Youla, na podstawie danych częstościowych za- wartych w tabeli typu: 2x2 postaci: (19.9) Osoba k': „1' „0" Osoba k: „1" a b „0" c d Pola tej tabeli: a, b, c, d zawierają liczbę skal, na których porównywane osoby wypadły następująco: Osoby badane o profilach takich samych (całkowicie, tj. bądź „1-zgodnych", bądź „0-zgodnych") uzyskują wskaźnik podobieństwa G=l,00. Osoby o G< 1 są w różnym stopniu niepodobne. Przykład. Osoba O] i osoba O2 uzyskały w 10-skalowej baterii samoobserwacyjnej następujące wyniki: (por. rys. 19.4) Pole 1 Osoba k' 1 * 0 Osoba k: Wy nik i: (1) — zgodne n i e z g o d n e n i e z g o d n e (0) — zgodne 36 — Metodologia badań.. Skale: 1 n o J IV V IX V I V I I V I I I K \ 1 1 \ \ \ \ \ \ osoba 1. — — — — — osoba 2. Rys. 19.4. Profile osób badanych 1. i 2. w zestawie zmiennych (skal) dychotomicznych Skale: I Osoba 1: 1 Osoba 2: 1 II 1 1 ni 0 1 IV 1 o V 1 o VI o o VII o o VIII 1 o IX 1 1 X 1 1 Po podstawieniu danych do tabeli czteropolowej mamy: >^ Osoba k': „1" „0" Osoba k' „1" 4 3 „0" 1 2 2=10. Z kolei po podstawieniu danych do wzoru (19.9) mamy: 4+3+ 2+1 6-4 10 ' O = 0,20 -- - Widzimy, iż podobieństwo obu osób badanych, z uwagi na konfigurację wy- ników w 10 skalach dychotomicznych, jest raczej niskie. 3.2. Współczynnik Gr-Vegeliusa — testy trychotomiczne („-1,0, +1") Wiele kwestionariuszy osobowości obok odpowiedzi typu „tak" i „nie" dopuszcza jeszcze trzeci typ odpowiedzi: „?", „nie wiem", „nie mam zdania". A zatem osoba badana ma do dyspozycji trzy sposoby zareagowania na każde pytanie. Odpowiedziom przypisujemy następującą punktację: „+1", „0", „-1". Inaczej: odpowiedź zgodna z kluczem (kryterium) uzyskuje punktację „+1", odpowiedź nie- zgodna z kluczem (kryterium) uzyskuje punktację „-1", a odpowiedź neutralna — „0". 562 Chcąc ocenić stopień podobieństwa dwóch osób: k i k' musimy wprowadzić wyniki uzyskane przez nie na skalach szacunkowych (czy punktację odpowiedzi na pytania kwestionariusza) do tabeli wzorowanej na tabeli skonstruowanej przez Hol- leya i Guilforda do obliczania wskaźnika G: Osoba k': +1 0 -1 Osoba k: +1 k 1 m 0 n 0 P -1 q r s Vegelius (1979) zaadaptował współczynnik G do systemu punktacji trycho- tomicznej (wzór 19.10): k-m-q + s (19.10) (*,*') = Litery: k, m itd. oznaczają liczby skal, na których porównywane osoby ba- dane uzyskały następujące oceny: Pole : Osoba k. k +1 1 + 1 m +1 n 0 o 0 P 0 q -1 r -1 s Osoba k' Wyniki: +1 (+1) — zgodne 0 niezgodne -1 niezgodne +1 niezgodne 0 (0) — zgodne 0 -1 niezgodne +1 niezgodne 0 niezgodne -1 (-1) — zgodne Najwyższą zgodność dwóch profilów reprezentuje wskaźnik: GT-l,00. Roz- atrzmy kolejny przykład. I II III IV V VI VII VIII IX X +1 o- -1 osoba 1. osoba 2. s. 19.5. Profile osób badanych: 1. i 2. w zestawie zmiennych (skal) trychotomicznych 563 Chcąc ocenić stopień podobieństwa dwóch osób: k i k' musimy wprowadzić wyniki uzyskane przez nie na skalach szacunkowych (czy punktację odpowiedzi na pytania kwestionariusza) do tabeli wzorowanej na tabeli skonstruowanej przez Hol- leya i Guilforda do obliczania wskaźnika G: Osoba k': +1 0 -1 Osoba fc +1 k 1 m 0 n 0 P -1 q r s Vegelius (1979) zaadaptował współczynnik G do systemu punktacji trycho- tomicznej (wzór 19.10): ,*') = k-m- q+s (19.10) Litery: k, m itd. oznaczają liczby skal, na których porównywane osoby ba- dane uzyskały następujące oceny: Pole : Osoba k: Osoba k' Wyniki: k +1 +1 (+1) — zgodne 1 +1 0 niezgodne m + 1 -1 niezgodne n 0 +1 niezgodne o 0 0 (0) — zgodne P 0 _j niezgodne q -1 +1 niezgodne r -1 0 niezgodne s -1 (-1) — zgodne li Najwyższą zgodność dwóch profilów reprezentuje wskaźnik: GT=l,00. Roz- patrzmy kolejny przykład. III IV +1- 0 -1 osoba 1. osoba 2. i Rys. 19.5. Profile osób badanych: 1. i 2. w zestawie zmiennych (skal) trychotomicznych 563 Przykład. Rysunek 19.5 pokazuje odpowiedzi dwóch osób badanych: Oj i 02 dziesięć wybranych skal z Mapy Osobowości B. Zawadzkiego (o punktacji: +1, -1) zapisane w postaci profilów. Po podstawieniu danych do tabeli dziewięciopolowej mamy: Osoba k': „+1" „0" —1" Osoba k. ,,+r 3 1 1 „0" 1 2 0 0 1 1 Cr(W) = 3-1-0+1 35 V3+1+ 1+0+1 +1V3+ 1+1+0 +0+1 6-477 - 0,463. W tym przypadku podobieństwo profilów (a tym samym i pacjentów) jes przeciętne. 3.3. Współczynnik rBp-Vegeliusa — dla testów o wynikach wyrażonych na skali dwubiegunowej Psychologom, zwłaszcza zaś psychologom klinicznym znana jest Mapa Osobowo- ści B. Zawadzkiego. Jej charakterystyczną cechą jest konstrukcja składających się na nią skal. Oto jeden przykład: łatwo zniec hęcaj ący się -3 -2 -1 0 + 1 wytrwał y, uparty +2 +3 Jak widać, skala zawiera punkt neutralny, od którego, na lewo i na prawo, wzrasta natężenie cechy, aby osiągnąć swoje maksimum na krańcach. Jest to więc skala porządkowa o charakterze dwubiegunowym. Aby obliczyć współczynnik podobieństwa dwóch osób badanych, przebada- nych zestawem skal dwubiegunowych, musimy wykonać następujące kroki (zilu- strujemy je przykładem z rys. 19.6). Przykład: Posłużmy się danymi przedstawionymi na rys. 19.6 Krok 1.: dla pierwszej (O{) i drugiej (O2) osoby wypisujemy bezwzględne wartości (punkty), jakie otrzymały one na poszczególnych skalach. W naszym przy- kładzie mamy: Oy. 1 1 1 0 1 1 2 2 2 2 2 2 2 2 1 1 1 Skale: r+3 osoba 1. na O, • >*- L-3 - - - - - osoba 2. Rys. 19.6. Profile osób badanych: 1. i 2. dla wybranych zmiennych (skala) dwubiegunowych-trzypun- ttowych A/ap^ Osobowości Zawadzkiego Krok 2.: rangujemy wartości skalowe dla każdej osoby, począwszy od zera, które otrzymuje rangę „1". Wracając do przykładu mamy: Oi: 444144888 O2: 2,5 7 7 7 7 7 2,5 2,5 2,5 Krok 3.: poszczególnym rangom przypisujemy te znaki (+ lub -), które przy- sługiwały oryginalnym wartościom skalowym. W miejsce rangi przypisanej warto- ści skalowej „0" wpisujemy, tak jak to jest w profilu, zero. W przykładzie mamy: -8 8 2,5 -2,5 4 7 4 -8 7 2,5 (19.11) O,: -4-4 0 Krok 4.: obliczamy wartość współczynnika rBP wg wzoru (19.11) (Vegelius, 6, s. 25): O2: -2,5 -7 -7 -7 gdzie:;, k — symbol osoby 1. i osoby 2.; r(> — ranga /-tej wartości skalowej dla osoby j; rik — ranga /-tej wartości dla osoby k; n — liczba skal w zestawie. 565 Po podstawieniu danych z przykładu mamy: + (-8X2,5) + (-8X2,5) + (8)(-2,5) = 42, oLhkł ' - ' + (4X7) + .3 --J *pta4A«* r Współczynnik rB/> interpretujemy podobnie jak współczynnik korelacji rango- wej, tzn. najwyższą zgodność uporządkowań (w tym samym kierunku) oznacza współczynnik rBP=l,0. Przy całkowitym braku zgodności uporządkowań współ- czynnik uzyskuje wartość „0". 3.4. Wykorzystanie współczynnika korelacji rangowej (r.s-Spearmana lub r^-Kendalla) dla testów wielopunktowych Przykład. Psychologa interesuje podobieństwo dwóch osób: Oi i O2 przebadanych za pomocą dyferencjału semantycznego. Może to być — na przykład — dyferen- cjał, którym posłużyła się Skarżyńska (1976) do oceny postrzegania badacza przez osobę badaną. Dane zapisane w postaci profilów zawiera rys. 19.7. Widzimy na nim dwa profile przechodzące przez punkty skal zakreślone przez osoby badane. Ponieważ skale wchodzące w skład dyferencjału mają naturę po- rządkową (osoba badana dysponuje siedmioma stopniowalnymi kategoriami do umiejscowienia własnej pozycji na skali), można więc uporządkować skale od tej, na której pozycja badanego oznacza maksymalne natężenie cechy (przez przypo- rządkowanie jej rangi 1) do tej, na której pozycja badanego oznacza minimalne natężenie cechy (przez przyporządkowanie jej rangi najniższej). Jeżeli: n ? liczba skal w zestawie, r, = ranga i-tej skali, to mamy (19.12): 1 vł * ł*3j !'i? *!? T \*f tjg suma rang = n(n + 1) (19.12) ^ ^ f'5 Kij|f SiV * f Zasady rangowania (w tym tworzenie rang wiązanych) podaję w rozdz. 15., pkt. 10, s. 502. W celu wyliczenia stopnia podobieństwa obu profilów pochodzących od osób Oi i O2 można skorzystać ze współczynnika r^Spearmana (albo r^Kendalla). War- tość tego współczynnika równa +1,00 oznacza najwyższą zgodność profilów (w życzliwa łacina i- III odpowiedzialna i > IV przyjazna i— V rozsądna VI taktowna > 1 ^ VII inteligentna VIII elegancka IX mądra X zgrabna XI ambitna XII sympaty czna nieżyczliwa brzydka nieodpowiedzialna wroga nierozsądna nietaktowna nieinteligentna zaniedbana głupia niezgrabna bez ambicji niesympatyczna 7 6 5 4 3 2 1 osoba 1 osoba 2 Rys. 19.7. Profile osób badanych: 1. i 2. przebadanych za pomocą dyferencjału semantycznego (wg układu Skarżyńskiej, 1978) sensie zgodności obu rangowań w tym kierunku). W przypadku dokładnego od- wrócenia kierunków rangowania współczynnik rs będzie wynosił -1,00. Wartość 0 oznacza brak jakiegokolwiek podobieństwa uporządkowań. Pomocna w przeprowa- dzeniu obliczeń wartości rs będzie tabela — por. tab. 19.3. Wzór na rs jest następujący (19.13): 567 Tabela 19.3. Tabela obliczeniowa do współczynnika podobieństwa profilów (skale porządkowe) — do rys. 19.7 Skale Wyniki surowe Rangi Różnica i Osoba 1 Osoba 2 Osoba 1 Osoba 2 rang d, I 6 2 2 7,5 -5,5 30,25 II 5 2 5 7,5 -2,5 6,25 m 5 3 5 2 3 9 IV 4 2 9 7,5 1,5 2,25 V 5 3 5 2 3 9 VI 4 2 9 7,5 1,5 2,25 VII 3 2 11,5 7,5 4 16 VIII 3 2 11,5 7,5 4 16 rx 4 1 9 12 -3 9 X 5 2 5 7,5 -2,5 6,25 XI 5 3 5 2 3 9 xn 7 2 1 7,5 -6,5 42,25 0,0 157,50 Źródło obliczenia własne Po podstawieniu do tego wzoru naszych danych mamy: . -JLi^5p_ = 0(452 Wartość rs = 0,452 mówi nam, iż profile wykazują przeciętne podobieństwo. 3.5. Współczynnik rc-Cohena — dla wyników testowych wyrażonych na skalach standardowych 3.5.1. Wyniki testowe wyrażone na jednolitej skali standardowej Wielowymiarowe kwestionariusze osobowości (np. ACL, MMPI, 16 PF, CPI) czy skale inteligencji (np. WAIS-R, WISC-R, WPPSI-R) znormalizowane są za pomocą takich skal standardowych, jak np. skala tenowa, stenowa, skala wyników przeli- czonych WAIS-R i skala IQ. Skale te są skalami interwałowymi (w sensie klasyfi- kacji Stevensa). Wynik w kwestionariuszu 16 PF, to profil ukazujący konfigurację natężeń 16 czynników osobowości osoby badanej. Chcąc ocenić stopień podobień- stwa osób badanych, możemy skorzystać ze współczynnika (wzór 19.14) zapro- ponowanego przez Cohena (1988, s. 243): n n n i=l i=l i=l rJł *i'». ;?l-(;^'^v, ] {±A2 + nm2-2m±A){±B2 + nm2-2m±B) (19.14) "•-i- 568 gdzie: n — liczba cech (wymiarów, czynników) występujących w analizowanych profilach; m — punkt środkowy skali, na której wyrażony jest profil; i tak: dla skali stenowej m = 5,5 tj. (1 + 10): 2; dla skali tenowej m = 50, tj. (0 + 100) : 2; dla skali wyników przeliczonych WAIS-R m= 10, tj. (1 + 19) :2; Ą — wynik w i-tej skali wchodzącej w skład profilu osoby A; Bt — wynik w /-tej skali wchodzącej w skład profilu osoby B. Punktem wyjścia przeprowadzenia analizy porównawczej jest umieszczenie danych w tabeli sporządzonej wg wzoru tabeli 19.4. analizowanej w poniższym przykładzie. Obok porównań typu: „profil osoby A — profil osoby B" można także prze- prowadzać porównania typu: „przeciętny profil grupy diagnostycznej A — przecięt- ny profil grupy diagnostycznej B", czy: „profil osoby A — przeciętny profil grupy stanowiącej dla osoby A układ odniesienia". Przykład. W pracy Nowakowskiej (1970) nad polską adaptacją Kwestionariusza Osobowości 16 PF Cattella zawarta jest uwaga, iż test ten dobrze różnicuje popu- lacje: neurotyków i zdrowych. Jeżeli tak jest, to przeciętne profile obu grup winno cechować niskie podobieństwo. Rys. 19.8 przedstawia takie profile, zaczerpnięte z cytowanej tu pracy Nowakowskiej. Dane liczbowe zawarte zostały w tab. 19.4. Tabela 19.4. Przeciętne profile grupy „zdrowych" i „neurotyków" w kwestionariuszu 16 PF Cattella Skale A B A2 B2 AB 1 5 4 25 16 20 2 5 5 25 25 25 3 6 3 36 9 18 4 5 4 25 16 20 5 4 4 16 16 16 6 6 6 36 36 36 7 5 4 25 16 20 8 6 7 36 49 42 9 5 6 25 36 30 10 6 6 36 36 36 11 5 5 25 25 25 12 6 8 36 64 48 13 5 6 25 36 30 14 6 5 36 25 30 15 6 5 36 25 30 16 5 8 25 64 40 Suma: 86 Źródło: obliczenia własne Po podstawieniu danych z tab. 19.4 do wzoru (19.14) uzyskaliśmy następującą wartość współczynnika rc: 569 Czynnik A B C E F G H I L M N 0 Q, Q2 Q3 Q4 10- I ; 0 i 9- )» -li-. f ?i **. i 3. 8- i - 7- '- i # # o 3 * t # 9 9 o > 9 S f \ / 9 ^^^ c / '. S - 5 $ %% / 9 9 s ?3 i 4~ r — - * f - 1J _ 2 . " ! " Zl 3- 2- ! V *» - t 4i « f *•• D 9 ? r- i" i UJ "i — K a; 4 i; ^ —- zdrowi - - - neurotycy Rys. 19.8. Przeciętne profile „zdrowych" oraz „neurotyków" uzyskane na podstawie badania Kwestionariuszem Osobowości 16 PF Cattella (dane z pracy Nowakowskiej, 1970) = 0,289. 466 + (16)(5,5)2 - (5,5)(86 + 86) V[468 + (16)(5,5)2 - (2)(5,5)(86)] [494 + (16)(5,5)2 - (2)(5,5)(86)] A zatem współczynnik podobieństwa profilów (przeciętnych) grupy osób zdro- wych i grupy osób neurotycznych jest — zgodnie z oczekiwaniami — niski. 11 3.5.2. Wyniki testowe wyrażone na różnych skalach standardowych Zdarza się czasem, iż psycholog posługuje się baterią testów znormalizowanych na różnych skalach standardowych. Na przykład, może on wykorzystać kilka skal z kwestionariusza MMPI (wyniki w 100-punktowej skali tenowej) i kilka skal z testu 16 PF-Cattella (wyniki w 10-punktowej skali stenowej). W takim przypadku profile nie są porównywalne. Chcąc je jednak ze sobą porównać, możemy skorzystać z adaptacji współczynnika rc — Cohena przeprowadzonej przez Vegeliusa (1976, s. 31-32). Jeżeli mamy kilka (kilkanaście) skal o różnej liczbie punktów, to musimy zacząć od tego, że dokonamy transformacji każdego wyniku wyrażonego w „starej" skali na wyniki „nowej" skali wg wzoru (19.15): r r i=l,2, ...,r. (19.15) gdzie: w, — przekształcony i-ty wynik w r-punktowej „starej" skali, r — liczba punktów „starej" skali; C — maksymalny wynik w „nowej", wspólnej dla wszy- stkich testów skali; C/2 — „nowy" punkt środkowy standardowej skali. Najlepiej prześledzić zabieg przekształcenia wyników ze skal o różnej liczbie punktów na kolejnym przykładzie. Przykład. Niech w baterii 5-testowej znajdują się: — 2 testy o 10-punktowych skalach, — 2 testy o 20-punktowych skalach, — 1 test o 30-punktowej skali. Wyniki osoby A i osoby B są następujące: Skale: Osoba A: Osoba B: r: I 3 4 10 II 6 6 10 ni 12 10 20 IV 10 10 20 8 9 30 Kolejne kroki analizy danych: Krok 1.: znajdujemy taką liczbę C, która dzieli się bez reszty przez liczby stanowiące maksymalne punkty „starych" skal testowych wchodzących do baterii, tj. przez liczbę r dla każdej skali, a także przez liczbę 2r. W naszym przykładzie mamy: 571 dla: r=10i 2r = 20 Hd8K?.,ŁX?i-1« r = 20 i 2r = 40 \ C=120 = 30i 2r = 60 i Krok 2.: przeprowadzamy teraz przekształcenie „starych" skal w „nowe": stara: nowa: . = 6 = 30 114 = 3 - 1.7 = 2 2 10 + (1 lj 10 120 ,„ ,,120 skala o r= 10 iŁ>?fłOlnBttnńt2tl'M 120 1 — \ &>$? ra1:'* bfijjs^no^1/ 2 — S 10- AXi*ij 6aaii9§3V %7}ną [Smy^tE 'reną T " skala o r = 20 20 20-1 — "łgk,U„ # .J^SPOSST/W I 2-20 120 2-20 Si 120 " ^ 20 o r = 30 Ys«w sfb pnifwr^,«/ x 2-30 ' 30 120 30 — 120 30 \\h\h BSgtthi m /w) sliar in/v3łoq«w iid 'fnBJIC li 'ib JS ,.)"oi bo :». ińsrtą [gin- Krok 3.: zamieniamy „stare" wyniki osób A i B na „nowe", korzystając z dokonanych w kroku 2. przekształceń: Skale: I H III IV V Osoba A: 30 66 69 57 30 Osoba B: 42 66 57 57 34 Krok 4: po dokonaniu operacji transformacji wykreślamy profile obu osób wyrażone w nowej standardowej skali o r- 120. Przedstawia je rys. 19.9. Krok 5.: przekształcone wyniki osób A i B wstawiamy do wzoru (19.16): rC(AJ3) ~ (=1 1=1 2; Cv 2' _,;LibnN . S J (1916) 572 iv 80 __ 75 ' 70 65 60 55 - 50 ~ 45 40 35 " 30 ~ / / -- -_ ~ 25 20 " -- _- ? i , i ? ł osoba A osoba B Rys. 19.9. Profile osób badanych: A i B Obliczamy najpierw wartości licznika wzoru na rc: X (Ai - ^) (B,- -1) = (30 - 60)(42 - 60) + (66 - 60)(66 - 60) + ... + + (30 -60X34 -60) =1338. 573 Obliczamu teraz wartości wyrażeń w mianowniku: (Ą. _ ±f = V(30 - 60)2 + ... + (57 - 60)2 + (30 - 60)2 = 43,88 , ?. _ ±f = V(42 - 60)2 + ... + (57 - 60)2 + (34 - 60)2 = 32,46 , Podstawiając powyższe dane do wzoru (19.16) na rc mamy: 1338 43,88- 32,46 _ ^ g-g Jak widać, podobieństwo pacjentów A i B jest wysokie. Przedstawione w niniejszym punkcie współczynniki podobieństwa profilowego dla skal reprezentujących różny poziom pomiaru (w sensie klasyfikacji Stevensa) nie wyczerpują, rzecz jasna, całości problematyki. Pokazałem tylko te współczyn- niki, które dzięki swojej prostocie, mogą być stosowane zarówno przez studenta opracowującego wyniki badań zrealizowanych w ramach pracy magisterskiej, jak i przez psychologa-praktyka prowadzącego niewielkie badania empiryczne o charakterze eksploracyjnym. 4. Podsumowanie W praktyce badawczej, a zwłaszcza diagnostycznej, zwiększa się udział nowoczes- nych baterii testowych złożonych z kilku, często nawet kilkunastu, testów. Także znane w całym świecie kwestionariusze osobowości, takie jak MMPI, 16 PF, ACl czy skale inteligencji, jak WAIS-R, WISC-R, WPPSI czy S-B FE to, tak naprawdę, baterie składające się z wielu pojedynczych testów. To, co łączy te tak różne przecież narzędzia poznania psychiki człowieka, to postać „wyniku", którym jest profil psychometryczny. Ten zaś wymaga od psychologa — jeżeli chce on spożyt- kować wszystkie zawarte w nim informacje — zastosowania specjalnych metod analizy, tzw. analizy profilowej. O niej (a, tak naprawdę, o niektórych jej meto- dach) była mowa w tym rozdziale. Literatura na temat analizy profilowej, dostępna w języku polskim, nie jest bogata. Niemniej warto do niej sięgnąć. Pisząc o porównaniach średnich profilów dla dwóch grup, podałem współ- czynnik rc-Cohena jako stosunkowo prostą i szybką metodę zanalizowania podo- bieństwa dwóch przeciętnych profilów. Znacznie bardziej zaawansowane i reko- mendowane przeze mnie są metody oparte na statystycznym modelu ANOVA i MANOYA. Umożliwiają one przeprowadzenie porównań k grup (k średnich profi- 574 lów) pod względem zróżnicowania intergrupowego oraz intragrupowego. Wymagają jednak odwołania się do specjalistycznego oprogramowania komputerowego, np. SPSS PC+. W przypadku, gdy grupy są mało liczne można sobie poradzić dyspo- nując dobrym kalkulatorem (metoda oparta na ANOVA). W przystępny sposób metody te opisane zostały — wraz z ilustracją wykorzystującą wyniki Skali Inte- ligencji Wechslera-Bellevue — w artykule: Brzeziński J., Maruszewski T. Metoda badania zgodności profilów psychometrycznych. Jeśli zaś chodzi o zagadnienia metodologiczne związane z analizą profilową, to uwagę Czytelnika chciałbym skierować na cztery prace zamieszczone w zreda- gowanym przeze mnie zbiorze: pt. Problemy teorii, rzetelności, konstrukcji i ana- lizy wyników testów psychologicznych: Cronbach L.J., Gleser G.C. Szacowanie po- dobieństwa profilów; Cronbach L.J. Propozycje analitycznego podejścia do ocen uzyskiwanych w percepcji społecznej; Nunnally J. Analiza danych profilowych; Co- hen J. Współczynnik rc jako miara podobieństwa profilów niezmienna względem odwracania zmiennych. ? 1 1 1 1 1 ? i Obliczamu teraz wartości wyrażeń w mianowniku: J y (A, -%-f = V(30 - 60)2 + ... + (57 - 60)2 + (30 - 60)2 = 43,88 , ? (Bt - y)2 = V(42 - 60)2 + ... + (57 - 60)2 + (34 - 60)2 = 32,46 , M Podstawiając powyższe dane do wzoru (19.16) na rc mamy: _ 1338 _ 0 gg rc ON ?x LA >— H- ^O -?*? |OtO CA O © LA 4^ -J tOLA -J LA O vi © N© LA tO & S 3 UJ LA tO LA Ja. NO O U UJ t—i O O O -t^ UJ VO LA *— •— K> - JONLA 3! Ul 8 vl Ul UJ ON C ON UJ UJ -* O 00 Ul ON 00 LA ON UJ ~ O un ON O OO UJ U*l UJ ON UJ NJ N) UJ 4A OO UJ 4>. f\ O UJ to oo ON UJ i—* O O "-J tO i—' NO LA UJ a I NO tO NJ *-* 4a NO Ja u w ON tO vi © vi ON vi NO 00 ON UlUlOO ?— Ja H- *-* Ul Ja, O0 ON Ja 00 Ja Ul O 2 Ul NO tO ON VO v] O0 O •— to © NO NO 4a _ ON O 56 UJ « H U M 2 I UJ ONUUIOO t « si u g tOUJUJH- 4^ IOOOOI U 4 ? U l s D U J — U l t O O N U J U I O O H - O N U J O t O s (OO^t ONONONUI « s i u g o o ~ i ^ i ~ ) > — UJ UJ Ul to vi |O Ja. ON UJ oo UJ Ul ON 00 vi 8 t o Ul ON ON UI NO "*J UJ Ul Ul vi OO 2 t o NO UJ 00 o tvJ vi tO ON UJ NO O ON 00 v] NO NO tO Ul oo *- oo oo oo v] Ja u 4a to ON OOON^- * J U) UJ © tO Ul ON — IO 4a 4a ON >-- Ui © 00 Ul ON ON UJ vi UJ Ul © vi ON a 6 O N O N O N t o i— UJ ?—'O M UJ Ja. Ja v] O Ul Ul OO ON ON LA ^J OO \O UJ vi ^ oo ^- to oo 00 OO LA O O NO ON NO ON VO L/l -J LA UJ L/i l— ON UJ ON NO OO 8 to vi vi s g oo Ł H- © UJ ^J H- ON 00 UJ t- oo NO to tO NO UJ to o -J 00 -J to i— ON vi >— ON UJ4^ ONNO 00 W ONtO O »* it S Ji . o to to UJ Ul M 3 NO to tO ON Ui UJ 00 tO H- UJ 8 U l vi 00 to to vi -ta i a ON o 'ul NO 00 t o Ul UJ 00 UJ H- to Ul 9 2 9 X o vi c to to o g UJ 4 oo c a to Ul 00 to v] ?V) v] 5 0 0 NO ON to © NO vi UJ 00 00 to t o v] vi to NO to e Ul oo oo Ui UJ U) UJ NO ON o to t o s U J to 0 0 Ui t o 00 U J $ UJ i i i - t a i—' LA O LA >—' W i- N) O\ vi OO *• O\ W W O\ ł^ H >J OO W 00 LA*>.ON -JLA - O 00 00 XI 4^ »C M ui o\ ł> — Os H- CA NO UJ 00 OO 7i OJ ^ W Ni -J w 00 LA to oo LA OO ON LA S NO to NO 3 1 to v] Ul UJ NO oo UJ Ul s * o UJ NO Ul LA O N /-> ~* O O O CO OO ł~H CO CN o co ^ r- m co '-H oo ON oł ON 8 O1ON00 ON oo oo ON r^ ^H » — < O N » n o o OO OO CO Ol OJ ^ NO ł—' f*~ CO 00 OO NO »—i t- OO ON >O ^H I-. O ON oo Ol co S a m OJ ON <—i ON »-* co NO <—< w~i O oo 00 »—* CO NO Ol ON NO OO ON CO W) NO 00 ON Tf ^H O O >ri —< -H ON CO 00 oo o r- co co oi m NO CO ON O */*) O CO 3 V>00OlCO (N IT Tl Tf g Ocnr-oo oo»-"cooo 00 CO 00 O Oł ON OJ i—? oo r— ON M h f t O h t oo >o r- ON 4 O t r) oo co ts CN in i- r- co >/?) ON NO ON r~ p- a f- oo t m P0ON oo N o H o ~^ P ~ H- OJ OO OO " 00 OJ OJ OsUlO OOOOJ NOUllO"-- , i i 2 l Ł < 3 v i S J > « S U l 4 > v i C O U J O J tO OJ OJNJtO OO UJ UJ UJ vi w- I* ^ ?? O H M Ul b O Ul "- 0000 UlOsU ltO— OOtOO JJ>OJ NO J> O0 IO OJ Ul vi P Os 00 Os v O ON OJ OO vi 4- 0 0 t o Ul to N O Os vi U l Ul J> tO 4* - t o ON Ul *- NO to 4> NO P O Os to OJ OJ ?— Ul — o c 00 J> Os ON Ul OJ o 6234 6806 9 6 4 0 ON 00 NO OJ 00 8 vi 00 OJ OJ 6 4 9 9 9 3 1 3 7 1 7 4 3 8 2 0 NO Ui OO O Os 4> IO OJ Os OJ NO J> Os ~J to to NO O NO * U » H Ul 4i *- OJ Ł P Os ( t o vi 4^ NO o © NO J> OO P OO ( .JL. — O J Ul OJ NO OJ Ul -J vi u l v i Ul O> Ul ^ o 0 6 1 vi — p OJ v] ( p\ OJ © OJ L / l o O J Os NO IO IO $ o c L/l 4^ 4^ OO g Ńo i f* NO OJ O g ON ON vi Os Os — NO ?- >— u> o to NO - H- Ul NO 00 4^ O 00 — -J -J OJ 4Ł — oo NO m to vi totooot oto U i O s — — 4 i O J 3 8 O O t O O J O t O i — U > t O O \ U l ~ J O N O O s t o N O 0 0 O \ O 0 O > - U l O J O O H - > — oo ON •— p Ul NO OOOstOUi^J 00 4>OJUINOOS Ui i> ^ O\ « oo Et-- to -JONOOIOON OJ tONOtO-JP NOOJ^-^IP Ul i— NO O0 Ul -J 4^ 00 Ul — tO OJ ^- ^J tO Ul Os 4*. P OJ 00 i— NO OJ "- 00 00 NO ~) *- tO Ul OJ tO -J OJ OJ to J> ON ^] NO P Ul Os (V Ul Ul 00 P Os to 4^ 4^ oo *~ — NO Os O 4^ L/1 L/l 4^ O >-* O N> Lft to to ui os Os N- ^- os oo OJ Ul P K- tO po w « NO Os NO ~J OJ Os Os p i—* -J . tO NO OJ tO — to — ~J — i— NO ^J tO 00 to ^- OJ NO to 00 W - vi v] OJ 4^ Ul vi ^J P Ul Os OJ 4> Ul p to p o c ON -J Ul J> 3 vj Ul Ul to O J OJ OJ Ul OJ 00 NO Ul ~J Ul Ul OJ 00 to oo Ul o o t o -J oc p 4> . Ul 00 IO OJ to oo i o Ul OJ oo 00 g tO NO NO -J ON 8 -J OJ OJ to 00 OJ OJ NO to p OJ oo p 00 ON 00 Ul OJ OJ NO NO NO Ul ON IO Ul OJ NO ON to NO ON 2O O s) U Ul ON \O *- OJ N> IO OJ O0 J OO O O O N O 00 — OJ O0 -J H— L/l i—• LA L/tOJOOOJOJ L/i Ui H-»OOJ^OOO ON OJ O ON ON oo 00 ON N O Ul Ol Ul to O J 1 1 4^ © 3 0 1 2 1 2 7 1 3 Ós 00 NO Ul — Os 5 0 1 OJ p 5 8 4 6 4 4 6 0 4 3 2 7 1 4 8 1 7 4 4* C NO 0C 1 OJ Ui g NC * OJ N O ui c 1 ON ON NO Ul N O u oc 1 - J to o o Ul U l t o OJ ?o 4> OJ ON Ul OJ to o p NO 69 6 vi OO 00 OJ OJ to Ul 00 Ul vi -J o 00 vi U l U l Ul OJ to oo v] 00 t o 00 OJ Ul 4> Ul p p vi 8 4 0 IO 00 t o 00 00 00 vi P OJ UJ to NO t o Ul Ul p N C r o 00 CM in s 5 X co r o 1 O NO O ; i g CN CO r - ) O CO CN ł^- OO 00 <—< VI <—i CN O co ^- i—i CN CO O (**? 0O F*- ^O NO ON CN VI ^J r^ ismmoo r —< oo vo oo -™ o\ r~ o ov vo r- m — c^i m ^H oo Vi \O Vł co r*- vi r- O co ON 00 —< oo ON CN ^ ^5 0 0 NO ON co — CN CN r^ oo s c o c o ( N ON NO NO CO c o O N 00 O c o c o r - t N ON Tt CN O N c n r- r- ON CN 8 CO O0 CN 00 ON co 00 ^ co o o (N CN CN »— • c ? NO CN ON m n - O CO NO ON r o o c oo n o\ co H cONOO oo O m i OO^HCO r^ N oo ONNONO U- i^rO CN o r- t> ^ CN NO CN O Tfr ^H NO CO O CO O Tt C ?•) i—t OO NO NO CM ON O CN C O oo c h vi r- 00 U0 NO NO O O co c [«». o o O ó o NO ON CN 00 r > ?^" 0 co CN CN ON CN O r- r ON CO ON ON co CN ON <— o o cnNOm ^ t^ H COONIO tOO p; S; 2 oo •—'O coONVi\Dcn co viviso r-ooNcNr- g mroo T1COCN OI^IO 1-^ l-H ^ ON ON co O ON Vi CN I— Vi \O O ^- f- ^O CO CN ON r> r oo NO CN ON NO co in « m ON ?* NO o co o o c o m oo r ~ C N ?<*• _ ON * oo r ~ > n CN —» ON •"-* Ul >— 00 K » U UJ UJ vi N)00O ON tO Ul U to .— U O UJ UJ vi Ul UJ OO to . ON ON N)00ON >— NO H- Ui ON 00 ^* — v] — Ul vi Ul *— UJ 00 UJ >— tO Ul Ul Ul O -0 W ON 00 to vi © UJ UJ Ul vi O 00 Ul UJ vi 1^ H -J N vi KJ UJ 00 U) .— h— 00 tO O 00 " >— NO NJ 00 NO 4*. vi tO UJ *- 00 UJ NO Ul (O OO 4* tO i— 8 ON IO >— *>? O O O Ul — UJ vi — 00 ON ON ON ON 00 vi to NO tO tO 00 UJ 4i tO Ul NO NO H- NO tO NO vi 4*. U O O U\ Ul Ui NJ Ui c c c c 4> NO a So UJ ON 4^ oo Ul UJ to o ON o Ul L 0 Ul U J o po UJ to Ul p 8 Ul 22 S S 8 UJ ON UJ 1 NO to ON 00 Ul v) vi 4*. 4i t oo NO ?vi UJ S 5 E ? 5 0 7 Ul to UJ UJ UJ Ul Q •—' O0 2 o 4* Ul NO O0 Ul 00 to C 2 to c c s UJ sO tO .& Ui 4^ UJ UJ 00 © O O Nj 5 UJ Ul 00 ON 00 U> UJ -J NO . o to >— o J *> tsJ -J UJ Ul UJ •—' Ul tO O Ul _ ON O SD N> ^ O0 H- M KJ^DUlN— Ui O Ui 4^ o to NO tO UJ 4^ 00 vi UJ NJ 0 Ul J tO NO NO 00 cc UJ I g ON UJ Ul UJ i. UJ UJ vi u > U J O0 K- IN to oo U J Ul -^ ON Ul Ul to c 3 ON ON oc 00 UJ Ul OO UJ UJ -J tO UJ 4? UJ o c t^ to oo o c c UJ X © tO U l v i Ul 0 0 s to NO UJ 1 UJ 1 5 ^ ? o 8 ui UJ vi ON ^^ ui _ NO UJ NO 00 ON VO Ul Ul Ul UJ ON Ul vi Ul 00 tO vi Ul tO : *?? NO H- Ul tO © vi ©ON V]*O4*IONO >° ?— UJ © -t^ O ON to UJ NO S vi ui © ON O N o Ul to ON t o v i -J 00 Ul Ul 00 00 UJ 00 N O t o Ul UJ Ul NO UJ ON UJ t o 3 to 8 00 ON to 00 UJ UJ vi vi Ul Ul to &. NO ON N O - J ON UJ f^i ^^ y~^ ^^ \& ^**4 ^^ ^0 ON ^*^I ^^ O\ 00 i- Ul Ul ? M ^ UJONONUII— M U to H-t-NOvlOO NOIOOOOOK- ONOONO iONOlOOOUl 4i.vltOtOUl UJ OO © ^* 2 O - Nb vi Ul UJ ON v!4*. i— tO v) tO i— Ul4^4^4^ON Ui NO UJ UJ ON — CC 4^ — cc u» UJ ON Ui ^ cc — vi UJ Ui \O łN M 4» 4^-4> tO Ul Ul vi . -J Ul H- vi O0 00 Ul 00 UJ ON NO *- ui J>. K- ON UJ Ul Ul Ul 4» vl UJ vi UJ vi UJ NO ON J> 00 UJ © 4> Ul — S M M M 5 sl *>• ON O H- tO Ul ON vi ?k 00 4^- Ul Ul v] UJ vi Ul 00 UJ H- ON NO ON ON ON © to ?— oo w o o - ui >S ,— oo ?— i— ON ON UJ 4^ 00 00 NO -J ~J 4>- NO W A O v] vi O U >1 -1 i- 4N Ul 4N OO H 00 O Ul ^ K CC CC UJ©NOON© 00tON04>N0 vltO 0000vltO0N 4>H-ON4i.UJ 4^- Ul ?— ON tO tO 4^-OOONH-tO 00_ IOON-O.UIS1 O0^-UJUJUl ^-vl WUJO UJ|OVOON>— vi UJ to UJ Ui i— to ON ON NO IO O 00 ON H- vi vi tO UJ U l NO C 5 UJ 4^ O ON 00 UJ >— to UJ 0625 3 9941 3 ?- vi vi J ON 3 3 - J 00 UJ i oo vi Ul s u! -0 to UJ 00 NO Ul H- Ul 00 UJ © to U J o © J 4^ 2 Ul Ul o ON OO 00 © S B Ul NO ON UJ Ul t— ' S 00 \O O '—' t~~ ^H ^H 00 ^H O co i—i o NO r- Tf ~ 00 CN C4 CM ^O OO NO 00 ~ ON CM CO f- . V) O ON ON CO NO CM i/"l ON — O ON Ol 00 — ON ON NO NO © UI — ^D cO ON n m -H 3 ? $ 01 t- ON — — Ol — ?* ON f- «o oo ci © NO io h io ON ^^ ON O5 ON 00 ^5 "^" r^* Tl* *~* 00 ON Cl ON f"^ r~* Tf Ol ^ ^f ci r** ^ ci oo ON ^^ m (-— o o -t 00 NO H Ol ut r O O NO oo ~H ON NO OO rtt^NO^ ^^ oo Tt ND ^ NO ^f « tn tn 0 oi io vi s t m IO t-~ Tt 00 00 f~ 00 oo o r^- m n N 1 S S 5 es t~- — u -, ON r- Ol m Ol O N 5 4 1 r- 1 8 6 7 4 6 3 2 3 3 5 P § m r- ON co O l NO 00 ^r Ol NO C O 0 0 0 OO 8 7 4 2 3 4 2 9 3 0 9 6 1 9 1 0 NO -H ON NO 00 \O V>. O0 i—< O ^ tN X T ŃO r- co r- co co o n \o ^o CN o oo N d (N Tt OO O0 i—" ON *-H O Tf ?—i O ON ^^ co ON *O r*1* *n o ^f (N -—i CN o O ON C~l CO ^H t**- Q\ oo o\ r- ^ r-* ^ u^ O CN <* (N >n n — r- — Ol NO 00 Ol NO o O0 t/~i Ol o Ol r- 00 NO V) O oo O J Ol 00 Ul ^ ON Ol oo o r- ^ ł—< *O O t*- ooołnr ON CN oo in 00 ^H t CO VO O O fN CO CN CO O\ 00 V) 00 »—' CN r- ON 00 00 oo O\ ON Ol ON NO m — 7 3 7 1 6 0 5 8 0 00 0 4 3 5 4 7 7 3 2 30 1 5 2 5 m es es oo o NO ^ f 00 tr\ oo ON 00 CO oo cn 00 li ?> ON O 00 —• cn ^ t S 8 Tf o) co o) O r- CM r^- o o O0 (M 00 i—i \O rf oo oo —i o CM O ON CO Wi ON CO 00 ^^ IN- I— O VI ^" O\ CM ^ t- r- oo Tf 00 UJLA ON - J i —' ON L A UJ004^ O i—'OtO -J *O • — sl U ONUJLA O to to so o ^ - ^ oc ^ . w -J w w Ul O UJ tO Ji oo u) LI N! to tO ON ON tO H- LA U> U> UJ tO UJ H- 00 SJ ON LA 00 NO ON O\ O t*o "»j 4^ J> NO ON to a M o u UJ ON UJ Ui 4^ -J tO Ul I J ^ NI u oo e NI i— ON — 00 00 ON tO ?— O NO 4^ to O 4^ to UJ tO Ul H- O OOO OOO N tOOO OOON UJNI ^-NO NO 0O Ni ON NO NO OO NI 41 4^ to 00 o to t o to ON UJ Ni Ul Ul UJ O Ni Ul N) Ni ON 00 Ul N] Ul O N 00 — Ni Ni 8 00 ON 00 Ni 00 Ni 0 0 "- ON UJ NO Ni UJ NO NO Ul OO Ul Ni to ON UJ t o O UJ UJ ON N] to oo UJ oo H- tO NI UJ Ul Ul ON 4*- ON ON " tO ON Ul IO OOLA tOVOONQN4^ Ul -sj |O Ji O NO-J \OtO004lk^- LA ?— 00 M s] .. -o, ^5 ^^ O ^5 oo i—1 to ^o oo oo UJ \O UJ M G\ -^-JONUJOO »O ^ W O 00 Ji.^-NO-J - M S) \O M N> ^ CO 00 Ul o 00 ON ^3 U l ^ o 4^. LA 8 o oo ON ON H- OO NO UJ 00 tO Ni to Ni Os « ON Ul UJ o c ON 00 to J> NO t—1 Ni 00 ON o c 41 UJ 00 N! UJ Ul 00 UJ o c 00 UJ to 41 Ni OO UUt O\ OO ~ ]i - O ON UJ t Ol H' 00 tO 00 00 Ul ^ O 00 v^UJL/iUJLń i—' 00 UJ -J O UJ 00 4^. 00 UJ \O U J 8 00 Ul Ul UJ 8 Ni » S " ~ O N ^ — Ni ON Ni Ul 00 4i X N C 8 8 5 00 UJ ON -J o NO Os UJ — UJ i— IO tO U J ON N- 00 NO ' OO NO 00 O >J 0O Ul 4^ O0 H U| 00 O ON UJ i— 00 Ul s] O0 VO 00 ^O W W O O0 N> LA UJ O 00 5 VO 4^ NJ NJ O\ vi t NO NO LA 4^- to to H- to to tO LA O NO NO -J -J -J -J -J ON 4^ LA O Ul tO O Ul tO O " •— Ni N- <— O N- to ON NO Ul O NI ^- 2 O tO U Ni — Ni 00 N! tm Ji S 3 *i S , OUJUJNIOO ONONI M Ul O> 4N ^ 41 '->J '— Ni Ni *- O O — UJ tO UJ Ul Ul Ui Os O NO I UJ 00 NI 00 4 00 ^- Ul Ul NI UJ O 4I ON 00 i— . Ul Ul UJ tO NO * M Ul « O UlN OU JtO O ON INI U) O NI O\ ?- 00 00 NINOOOOON NONONIUJ _J> J>OO 00Ul OOOOONINO UlUlONtO H-O\VO"-UJ I OOSOSOOOO H « NI A O " — ON IO Ul 00 ti LO Ul 00 NI NI « w U ONtOtOOUl 4 10000O ^J ^^N rj^ ^^j ^^* tj^ N^j ^T^ ^-^" (Sco^eNco oo i—i ir» (-? 1\ O N X ON © Vł f- ? es m t-~ mt-csco sr-cor- r- co oo m es m r- vi ci 1 »n r NO t- s Vi © S 3 r^ ON ON NO 00 5 1O (N r~ o oo (vi NO ~- 00 ON 0 5 7 0 7 49 08 8 4 3 9 5 1 0 4 8 3 8 74 29 1 61 27 5 6 5 2 4 8 37 56 2 31 37 4 10 53 6 17 44 3 6 1 0 2 0 3 3 6 9 7 80 76 7 61 88 6 21 55 1 3 9 2 6 9 1 9 8 1 8 19 36 0 4 9 3 2 5 3 8 8 3 1 44 90 1 91 62 3 4 6 8 3 3 90 37 9 92 34 4 53 84 1 03 82 9 3 3 1 4 1 8 8 8 7 4 99 43 9 96 69 3 96 00 9 0 7 8 5 5 (S ON N O r - S 0 0 1 0 2 1 4 0 2 8 6 0 3 6 7 NO Vi NO es es NO ON CS r*~ O CS NO S CS NO —' tS 00 e s 9 7 5 2 6 7 1 7 0 5 3 1 00 8 8 2 i o o ON o r - 00 NO 00 00 00 00 o r- 0 0 o 1 O 00 00 ON N O TT f- Vi C 1 Cl CN 0 0 0 0 N ?* 00 N O Cl NO < 00 ON V i 0 0 C) o o c 1 t— o - t 8 3 © 8 00 Cl oo rs r*- co Vi ON CO ON rs rs V) ć s s •>* t- —* 00 rs oo rs t*- ^t t*** oo "^ C"*" t*"* S r^ co © ON IT) — NO ^-O r- oo NO vi in ^ Ul 6 9 5 t o ui ON to oo ro O NO •"- O NO Uł J> g NO o\ Ul Ul Ń o NO Ul vi NO 2 o J vi o ON vi NO ON oo 8 S J8 IO J »- © - ^} IO -J tO Ul © Ul N> ON NO NO (O VC O0 - Ul 00 O0 - U « « Ul 00 00 U) U) NO NO M W Ol J^ - O ON tO UJ U) to to NO w N>^ *—j 4* \*n Ul ON O O -J ON NO ?- OO *. S O 00 © Ul >— i—' C Lft N> ^ sj (Oi-- UI-J-JONO UI I— UJ 00 -J w M SJ \D UiUJ^vOUl O0 ? — H- Ul O 00 H— 4*.-JO 0O Ui K> H 00 OOtOUlUl * Jk M NO NO H- UitOUl NO Ul NO *» O0 -J OO 00 00 Ul Ul — NJ ^ O O tO S -^ NO ON UJ O Ui O ON Ui Oo Ui O N© Ui 00 N> i—' 4^ ON UJ Uł •—' UI^OONH- - JUINO X to 77 3 vi J^ J> NO NO o Ul to oc vi "- — o Ul 00 > UJ to Uł 00 Ul to o Ul 00 Ul IO Ul vi Ul to o o O\ Ui 1 to oo 00 ~J NO 1 Ul < 00 Ul - to oo ON Ul 5 Ń UJ Ul Ń o to Ul Ul ON UJ Ul 00 UJ s 3 00 00 NO ON 00 "- 00 Q0 v] - Ul ^ 00 Ul ^O-^-©^- UlUlH- W Ul —. v] .U -JUlO O « St lO t. 00 O tO I O 00 Ul 0 0 NO to ~J U l t o to -J 00 Ul ^1 Ul Ul t o ?J Ul J 00 > to tO NO NO W - NO 4± U 4 7 2 4 6 1 2 8 9 9 6 6 1 9 3 6 9 3 1 ? 6 5 6 2 6 8 8 8 5 3 0 7 s o o NO vi Ul Ul 00 t o Kl IO IO OO -J t o o ui 00 IO UIO Ul Ul ~J — •J NO 4^ H- O Ul Kl to J> Ui — NO NONOtO ś S O U •J - w fj Lfl 4k W Ol M N -J ON UI O ^1 — J ON O NO W Ol * « vi to Ul tO Ul Ul J * H- 00 Ul U) - J ON ON O O to Ul O tO Uł ON ON NO NO to U to O ON to Ul OO OO IO Ul tO Ol O0 ON tO U Ul -O *- Ul Ol 0O tO "• ON O NO O ON -O. ON ooooo ooooo n oo ^ ON ON ÓN ON I es rt .-i o o o O N N O v~t oo ON t-» co r*- O\ v*> t— ON "-H OO 00 00 ON ON o5oO O\^ O^ O\^ O^ ÓŃ^ O^ O\ O^ Ifl ID IO 1 ""Ł s & - cs ci ci -H Tt « ;p ^o 8 ci ci v-i r-l oo ic w> »o wi ©ci P~ P~ © P~ io r~„ t-, r- _ co oo oo « co os os. oo ?* oo rs r- io s 22 S ON NO r- 00 ON ON 00 'O c*^ •—' *n ON cn r- s 3 •^ ^HO OOC S^H Ol Ol -* Cl Cł 00C N1O —< ci ci Oi rt o\ ci ^ ^t ^-"n ci t t « oi o oi P- ^ oi-^-r- C^OOOO OOOOOOO lOS Ol O\ Ol 5 Ol Ol O "i N H « r m r> eo o »n O N O O C S ^ " O - — ' O O 0 0 O N O N f - " * r o N t ^O h C l I O H T f V " > ( N • — < ^ - < Q ?g- inOd '—' ONNO W"!^1 ^ ON^O Or- ON CN »—i O 1O O o S •o oo oi p- —i r- oo oi * « S ^HON •^?ON^^'^00 Cl 1O es 3: S LTi Ul 4* Ji 4^ L>1 O CC O1-. -fc* . * - * p ON ON ^ ON ON ^j -^j -j -j -4 L/i ON ON -*4 -4 -J *- U» O N> ON ON ON ON ON -J -O ^J --J -J -4 OC GO CC \C ON O W ON O O "ON Os ON ON ON 00 00 OO 00 o E » w *s> to to ^D ^D ^D "Jo Ni to JNi Vi V> 00 CC 00 00 O O -pi L/1 -J 00 O i—? r-J UJ +*? ^ \O 00 Ni ON >—'O K) 00 sl 00 — -J 4^ t>J ^>J \*i Xti \*i X*i 1>J Xti X*J \»J Xii K-S) Uj2uivl00 O 1- N W ^-O N-IOUIOON 4^4^Uiv] o "to NO O a J J go -J oo o K> -J Ni ON oo O ON ON ON O\ a NO ON NO NO 3 i— 5. — uo 222 2 S O tO Ul 0C ^- ONNO- fc.*- — S 00 to 2 to UJ s 1° UJ "UJ UJ UJ UJ UJ O Ul O ON 00 vi vi NO lvJ UJ N> 00 ON tO H- Ul ON S UJ UJ 00 UJ ON Ui ON 4^ -t* ?— oo — to UJ vi vi ?t- UJ I bo oo I lv) UJ bo oo 4i. ON a ON Ni W Ut 8 '»— "— — "t—• Ni N> Ni Ni NiNiN>NiNi L*J UJ UJ U) U> UJ LA N] OO \O i—' N) W L/l ONON-JOONO O •—» W ^. O\ 00 S! vi U i— Ul NO UJ UJ 0> tO Ul Ul Ul i ' © O >—'ON <—' 00 -4 ON ON ON^NJ-JLA *-rt 00 -& "^4 >^ 4^ ^O ^^ ??^ ^5 ^O ^3 ON ^O Ui Ni W U) UJ - to io m w NO 6 OJ vo UJ UJ UJ UJ 4^ -t- -ti UJ Ul vj Vp O H^ UJ NO ON UJ O H- ON Ui 00 ON Ul Ul NO UJ O w UJ Ul Ul U l U l U l U l » i O N U l O N 0 0 Q t v ) ? — U l I O © — 00 ^- O 00 v) O vi *- Ul vi 00 8 § § 8§§8 Ul Ul 4^ Ul O 00 UJ UJ UJ tO NJ to 00 ON 4» Is) O NO OO -J oo os y \ s ** 01 cn TJ- ol cn (— 1/1 t— ol os os © co o- cn © os oo os o ol vi os cn oo ol t-* co oo co os in © *© oł os "o co oi ^i 1 "1 9, o s\ o\ oo oo x r-^c--^vo 00 o C © " ** of co" co" Tt" vS* so" c-* oo" oś" ©" ~-* _ „ H „ H r t — - M r t - H r t r t M O J O l O O — OJ cn 0 ^^ c*" cn 1 r~ ol os oo, SĄ vj. co^ cn OJ ol ol - ol ol - o oi » r- _ oo" os" os" o" —" Ol CO TT ol — >—< cn " 2 S„ S o- oo" os os" 8 O o —i — oj O Ol Tt O t> OJ Os 00 O oo u-i cn Ttr-r~ oiojr-sooo vi t r- oi cn ^p , , i/^ i , i/~) ,»H o* T^ ,™^ oo ^f ^O TT Cn ^^ O 00 O* ^O Tf ff^ r—* CJ oo" os" © —* ol" of co Tf" in VD" t~-" oo" O 3 00 Tf — 00 O o O —' ~ oJoJcn oo r- OJ s t- Ol ?o ćo oo os o O *?« oi — oo os * « in O oł vo rń cn OJ ~ f-i O i/^ *?* o — cn r- o" o" o" o* » n « o o o « f *o os co r~ « o" o" o" o" o" o" o* —* —" of of co" co" ?*" « 3 ' S t * » OJ 00 Tf O VO M 00 *o" v^ r-^ oo" oo* oś" oś — o- co CN T* 00 OS Tł O O O O Ol o" o" o" o" o" o *^ooo~coos "TtTtt--~*cn OJSO « ooosirivir~- co — — T+OO TJ- — m. "1 *. ". *. oo N vo q * °! ""t o" G? o" ~* ** ^" of of co" co" co" ^t* - O) 00 Os io O \d K oo* I S ih n oo osmooi V f^_ '•"• ^^? W~t Os 00 ,"?* f*- OOO O— Ol-tft— O> o" o" o" o" o" o" o* o" o" V"> f-T*-l/-){--00 SOOOSOIOO SOTf vo oo co o Os o cn oo co *?"* os os co ol mosco^o— «-iOsTfOsco oo * CO CO t SD M —" M CN Of oo os ^ 1 O —< ol co 22 2 8 S?!8 S 619 ? & 00 & Ul UJ ± s UJ NO OJ oc q OJ ON OJ Ul UJ OJ OJ UJ to UJ UJ o to NO to 00 to to Os to Ul to UJ to to to to to to O NO OO 1 8 1 7 Os ON Ul Ul 1 4 OJ 1 3 1 2 o O NO NO 00 o s ii NO 1 2 1 4* -O. Ul NO Os 4^ 1 3 7 4 8 2 : 8 3 2 1 8 6 5 4 4 9 0 6 2 7 3 6 4 4 0 2 0 4 0 1 7 8 8 1 7 6 5 7 6 9 7 9 3 8 9 8 0 4 2 2 7 1 6 5 6 0 9 3 5 3 8 9 9 1 ,99 95 J> OJ UJ t o o NC OO ^i ON Ui Ul j> 4i UJ to to — o o NO NO OO 3 9 8 3 2 9 5 6 1 0 92 9 2 5 1 5 7 6 9 0 5 2 3 8 5 7 5 9 1 6 2 6 2 6 6 1 9 6 5 3 2 4 6 8 8 0 5 7 4 3 1 8 1 1 1 9 6 5 8 8 9 8 6 3 9 1 ? 0 8 2 2 2 6 4 9 -o - J ON b l Ul t o to o NO NO oo ~j ON Ul Ui J> UJ UJ to — K- o ,99 1 2 4 9 5 1 1 7 7 5 g 3 1 1 5 8 4 8 5 9 1 3 8 4 2 1 7 0 7 : ; 96 6 2 8 9 : 5 8 6 8 8 7 1 9 2 5 0 1 8 1 5 1 3 4 4 5 8 7 8 7 to ? — 1 6 0 5 2 0 ),99 5 NO 00 o c ON Ul Ul OJ to to & NO NO oo ~j Os Ul j> 4^ OJ to to . — ,70 7 ,9 41 , 1 7 7 4 1 6 ,657 1 0 6 1 4 8 3 9 8 6 5 0 9 0 6 1 6 4 4 2 6 6 9 1 0 9 6 2 3 3 5 0 9 7 8 9 0 7 3 3 6 2 6 5 5 9 5 3 2 5 6 5 6 5 8 7 9 1 9 8 5 2 4 0,9 9 to o NO Ńo OO - J ON Ul i/ i OJ t o k j o NO NO o o ^i Os ON Ul OJ OJ ,35 7 5 5 5 7 5 5 9 5 6 16 0 3 6 6 5 7 5 7 8 5 9 0 9 2 1 5 4 3 3 6 5 4 8 7 8 1 0 6 3 3 6 5 6 9 : 9 0 8 0 4 7 : 2 9 1 : 5 3 9 7 9 1 0 4 7 3 0 8 5 7 3 8 4 4 1 2 0 Ul w OT 00 - J Ul UJ to o o NO oo ON Os Ul 4^ ,76 4 9 3 0 0 9 8 8 9 2 43 9 6 1 2 7 8 7 9 6 5 1 4 4 3 2 6 5 0 9 6 9 5 8 8 4 0 7 5 2 6 9 4 6 5 6 6 4 ? 9 8 0 7 2 2 8 1 4 9 3 7 0 8 8 2 6 1 5 1 3 7 9 o "NO Ul UJ UJ l/l Ul UJ Ul 3 2 UJ UJ O 2 9 to to g to Ul 2 4 to UJ to UJ to to Ń o 5 3 1 8 1 6 6 8 9 8 1 8 9 4 9 0 8 1 21 5 3 5 0 4 8 7 6 2 5 7 6 5 9 0 7 0 5 1 1 9 6 3 4 3 4 9 2 6 4 3 7 9 7 9 5 2 1 1 0 2 7 1 4 3 4 5 9 9 7 6 8 9 3 9 1 1 4 2 9 2 4 7 3 o 8 ? UJ NO UJ 00 OJ UJ ON OJ Ul u> Ul UJ UJ UJ to UJ 3 0 to NO S o 2 7 2 6 to ON 2 4 to UJ 1 3 to 8 1 9 1 8 ,44 9 u , 6 2 1 7 0 8 79 5 8 8 4 9 7 4 0 6 5 1 5 7 2 5 1 3 4 5 4 4 1 5 3 7 6 3 5 ? ? ? 8 3 6 9 3 8 0 4 2 1 4 8 2 5 5 3 6 4 4 7 5 5 8 8 7 0 3 8 2 0 9 4 0 0,8 0 ? UJ t o UJ NO UJ 00 3 7 3 6 3 5 UJ J> 3 3 UJ to 3 2 OJ 3 0 2 9 to 00 2 7 to Os 2 5 to 2 3 2 2 to 2 0 ,31 3 3 6 6 4 2 0 4 7 4 52 9 5 8 5 6 4 1 6 9 8 7 5 5 8 1 3 8 7 2 9 3 2 9 9 2 0 5 3 1 1 5 00 2 4 2 3 0 7 3 7 3 4 4 0 5 0 8 5 7 7 6 4 7 7 1 9 7 9 2 8 6 7 0,7 0 & S l w 4, t * UJ NO UJ 00 3 7 UJ ON 3 5 UJ 3 3 3 2 UJ S 2 9 2 8 2 7 2 6 to Ul to 2 3 2 2 ,86 4 ,8 89 , 9 1 5 ,9 42 ,968 9 5 5 ,0 22 0 5 0 0 7 7 1 0 5 1 3 4 1 6 3 1 9 2 2 2 2 2 5 2 2 8 2 3 1 3 3 4 4 3 7 6 4 0 9 4 4 2 4 7 5 5 0 9 5 4 4 5 7 9 6 1 6 0,6 0 Ul O I OC * to ? OJ NO OJ 00 OJ OJ ON UJ Ul OJ UJ UJ UJ to UJ g to NO to 00 • to Ul a \ - *— mmm m ^ ^ MB m m ?? ? ^ ~ 1 \ m tn m NO K 00 ON g Ńo CN NO ro 3 10 NC 8 OO NO Os O o Ol K NO 0,6 0 8 3 8 8 1 3 7 8 8 7 6 4 7 3 9 7 1 5 6 9 1 6 6 7 6 4 3 6 2 0 5 9 7 5 7 4 5 5 1 5 2 8 5 0 6 4 8 4 4 6 1 4 4 0 4 1 8 3 9 6 3 7 5 3 5 3 3 3 2 3 1 1 2 9 0 270 OO 4 9 5 0 ? CN Vi m 5 6 00 VI ON s NO Ol NO cn 3 NC NO 00 NO 6 9 7 0 s oi r» 0,7 0 2 6 1 2 0 9 1 5 7 1 0 6 0 5 4 0 0 5 9 5 6 9 0 6 8 5 7 8 0 9 7 6 1 7 1 4 6 6 6 6 1 9 5 2 7 4 8 1 4 3 6 3 9 1 3 4 6 3 0 2 00 CN 2 1 4 1 7 0 1 2 7 084 "O « 4 7 00 4 9 S ? 3 in 5 2 5 3 R VI 3 o 5 9 s Ńo g co NO 3 m NO 8 6 7 oc NO Os NO 0,8 0 3 6 5 2 8 1 1 9 9 1 1 7 0 3 6 9 5 5 8 7 6 7 9 7 7 1 8 6 4 1 5 6 4 4 8 7 4 1 2 3 3 6 2 6 2 1 8 8 0 4 2 9 7 0 8 9 8 8 2 7 7 5 6 6 8 6 6 1 6 5 4 7 478 ro W ? * 4 9 5 0 5 CN 5 3 "O 5 6 00 00 5 9 s Ńo e ro NC 3 s 0,9 0 5 6 0 4 3 3 3 0 8 1 8 3 0 6 0 9 3 7 8 1 6 6 9 6 5 7 7 4 5 9 3 4 2 9 2 2 1 1 1 9 9 6 8 8 3 7 7 0 6 5 9 5 4 8 4 3 8 3 2 9 2 2 1 1 1 3 0 0 6 9 0 0 7 9 5 690 3 8 3 9 i ? 4 2 m « 4 7 4 8 4 9 4 9 5 0 CN cn 5 4 VI VI 5 6 VI 00 00 5 9 s 0,9 5 6 0 0 4 3 7 2 7 6 1 1 6 9 5 8 8 0 1 6 4 6 4 9 2 3 3 9 1 8 8 0 3 8 6 8 8 7 4 1 5 9 5 4 5 0 3 0 5 1 6 2 0 2 0 8 7 9 7 3 9 6 0 0 4 6 2 3 2 5 ON 00 0 5 4 920 3 5 3 6 / , ? 3 8 3 8 3 9 • 4 2 ro 4 5 9 4 8 4 9 o 5 0 V) CN cn Vi TT 5 5 5 6 56 ),9 75 1 6 2 8 9 6 7 7 6 5 8 6 3 9 8 CN Ol 0 2 7 8 4 4 2 9 9 4 8 2 3 0 3 1 2 6 9 5 0 7 7 6 ? 0 9 4 3 1 2 6 1 0 9 2 9 2 4 7 5 8 5 9 2 4 2 8 2 6 5 1 0 3 9 4 2 782 ? ? ? ? cn 3 5 3 6 3 7 3 8 3 8 rh 4 2 4 2 4 3 4 6 4 7 00 4 9 V, 5 2 5 2 53 0,9 9 4 7 5 2 4 6 0 1 8 7 9 3 5 7 0 3 5 0 1 3 1 9 1 3 8 6 9 4 8 5 2 7 3 0 6 3 8 5 5 6 4 9 4 4 4 2 4 0 0 3 8 8 3 8 6 3 9 4 4 2 2 4 6 0 5 1 8 5 8 9 9 9 4 7 5 286 o — C N Ol ro in >/?> NC r — 00 ON ON o — CN co ro T Vi NC r~ 00 Os S 1 ),9 95 7 3 5 4 8 1 : 2 3 0 I 9 8 1 7 3 5 : 4 9 0 2 4 8 0 0 8 : 7 7 0 : 5 3 5 : 3 0 1 0 6 8 : 3 8 3 : 6 1 0 i 3 8 3 i 1 5 8 - 9 3 5 i 7 1 3 \ 4 9 4 i 27 5 i 0 5 8 i 84 3 i 6 2 9 4 1 7 i 2 0 6 i 997 00 CN 2 9 3 0 R ro 3 2 cn cn 3 4 Jt ro 3 5 3 6 co r- ro 3 8 3 9 4 0 9 4 2 4 3 4 4 4 5 5 ? 4 7 r- I 3 6 8 0 6 5 7 6 5 4 6 8 1 7 3 8 8 1 5 9 2 3 0 5 0 2 0 7 3 8 4 5 9 1 8 1 9 0 6 6 3 3 3 6 2 0 9 3 8 2 6 5 6 1 8 6 2 0 3 6 7 7 7 5 2 0 2 6 4 0 1 0 7 5 7 s 2 5 2 6 r- ro NO 1 1M I MM ??? ? ? ? ? IM tm m M ? ? m * m u ? i 621 mwmmmmw m ZZ9 % . NO SO SO SD so 00 OO 00 00 00 00 OO o c 00 00 —] / 00 -J Os OO -J ON UJ NJ o OO ?4 ' a LA LA Ul 00 Ul Ul ON Ul 5 5 Ul 5 3 Ul UJ 5 2 Ul 5 0 Ul o SO 4 8 4 7 4 5 4 4 4 3 4 2 o 00 NJ Os 5 9 UJ 3 $ *! 7 9 0 s 2 7 5 2 - ~J o ON 5 1 7 6 0 2 2 7 5 3 7 9 0 5 3 1 5 7 ON OO to , ] UJ o NO NJ ON Ul 4>, LA (A Os UJ _. — UJ ON so Ul 3 i sO 00 00 Os LA *! *! U) NJ O NO 00 00 Os Ul Ul U l 3 5 5 7 ? > 8 t j 4 7 to Ul 3 8 ON 00 Ul 5 5 sn 0 3 5 2 o J o "sS ^O 00 Os "^ SO to Os NJ c o Ul ON o LA o -j OS ON ^1 o o 00 Ul Ul Ul Ul LA Ul Ul Ul Ul Ul Ul Ul 4» ON L/ l 4 ^ UJ NJ ^ ) SO 00 —] Os LA Jk UJ NJ H^ o ^ o 00 3 2 5 1 00 -J 2 5 4 3 6 2 00 8 Ńn 3 8 Ul 00 7 6 ON 3 7 5 8 00 *NO OO o 00 UJ o LA Ul LA ON so UJ o CO NO to Os NJ 00 LA o Os ON OO Os ON ON Ul B 6 3 s Os s g Ul NO LA OO 5 7 LA 5 5 Ul U, 5 3 5 2 Ui ,—i Ul 8 2 3 $ * 7 3 SO u 00 7 5 o 2 7 4 5 CO 3 5 7 2 9 1 O Ul o OS to o 00 00 00 sO c c UJ sO Os U) UJ o Ul o ^> ~ J - .i -J - o. Os Os Os ON Os Os 9| ON Os g Ui Ul Ul LA Ul t J> UJ 1O o SO SO OO -J ON Ul UJ UJ to — NO 00 -J ON Ul 2 2 UJ ON ? 7 8 to s 2 1 UJ 8 2 s 2 3 S 8 LA ON " f 9 NJ NJ u. ON . UJ so so SO NJ OO UJ so UJ LA ~ J -J --] ^i -J ON ON ON ON Os Os ON ly i Ul t/ l -J ON Ul 4^ UJ NJ O o SO 00 Ul UJ UJ NJ o s o 00 9 2 s o n 5 2 7 6 0 00 00 8 — to 3 7 6 2 7 4 9 UJ 3 9 Ul Os Ul 7 8 O SO NJ o NJ UJ Os U) 00 UJ SO ON NJ NJ ON Ul 8 2 OO 8 00 7 7 7 6 7 6 7 4 -O - 7 0 OS ON ON ON ON Os 2 s s Os * f S to 8 1 9 1 — s jo 3 8 00 6 7 7 7 3 2 7 4 8 Ul OO o 00 NO UJ LA OO NJ Os -J 4> SO ON OS ON Os 00 OO U) Os s OO oo 00 OO 00 00 00 00 - o. -~.i ~- l -1 ON ON 8 ~J OS Ul UJ NJ o 00 -j ON LA UJ NJ NJ ^- O sO OO 9 4 5 0 0 5 0 6 5 9 2 1 1 8 7 2 4 8 3 0 9 3 7 1 4 3 3 4 9 6 5 5 8 6 2 2 6 8 5 7 4 9 8 1 3 8 7 8 9 4 3 8 0 0 0 7 4 1 4 0 2 0 7 2 7 4 3 4 1 4 0 9 0,8 0 NO NO § 8 9 00 00 00 8 6 00 00 00 00 00 8 0 - o. 7 7 7 6 7 5 7 4 7 3 7 0 7 0 ^_ , 1 NJ to to UJ UJ UJ 41 . 4= - Ul Ul LA ON ON - .i 00 00 SO sO o SO 1 1 SO Os 1 UJ UJ -J to s ^1 O ° Ul NJ UJ Ul Ut -J NO NJ 70 v n sn sn 00 OO 00 OO 00 00 00 00 00 00 00 -0 -1 -1 ~- l ^1 Ul U) NJ SO 00 ~J Os Ul Ul J> UJ to o 00 ON Ul 2 UJ 8 0 8 8 2 6 8 4 4 8 6 2 8 8 1 6 6 8 9 1 7 3 9 6 9 5 5 9 7 4 9 9 3 0 1 2 0 3 1 0 5 0 0 6 9 0 8 9 1 0 8 1 2 8 1 4 8 1 6 8 1 8 8 2 0 8 8 2 2 2 4 9 0,6 0 NO SO SO OO OO 00 OO 00 OO 00 OO 00 -j 00 -J Os 00 -J Os Ul JA NJ o NO OO \ Tablica 5. Wartości krytyczne rozkładu F Snedecora a = 0,10 S 1 2 3 4 5 6 7 8 9 10 15 20 30 50 100 200 500 i 39,9 49,5 53,6 55,8 57,2 58,2 58,9 59,4 59,9 60,2 61,2 61,7 62,3 62,7 63,0 63,2 63,3 63,3 1 2 8,53 9,00 9,16 9,24 9,29 9,33 9,35 9,37 9,38 9,39 9,42 9,44 9,46 9,47 9,48 9,49 9,49 9,49 2 3 5,54 5,46 5,39 5,34 5,31 5,28 5,27 5,25 5,24 5,23 5,20 5,18 5,17 5,15 5,14 5,14 5,14 5,13 3 4 4,54 4,32 4,19 4,11 4,05 4,01 3,98 3,95 3,94 3,92 3,87 3,84 3,82 3,80 3,78 3,77 3,76 3,76 4 5 ,06 3,78 3,62 3,52 3,45 3,40 ,37 ,34 ,32 ,30 ,24 ,21 ,17 ,15 ,13 ,12 ,11 ,10 5 6 3,78 3,46 3,29 3,18 3,11 3,05 3,01 2,98 2,96 2,94 2,87 2,84 2,80 2,77 2,75 2,73 2,73 2,72 6 7 ,59 ,26 ,07 2,96 2,88 2,83 2,78 ,75 ,72 ,70 ,63 ,59 ,56 ,52 ,50 ,48 ,48 ,47 7 8 ,46 ,11 2,92 ,81 ,73 ,67 ,62 ,59 ,56 ,54 ,46 ,42 ,38 ,35 ,32 ,31 ,30 ,29 8 9 ,36 ,01 ,81 ,69 ,61 ,55 ,51 ,47 ,44 ,42 ,34 ,30 ,25 ,22 ,19 ,17 ,17 ,16 9 10 ,28 2,92 ,73 ,61 ,52 ,46 ,41 ,38 ,35 ,32 ,24 ,20 ,16 ,12 ,09 ,07 ,06 ,06 10 11 3,23 2,86 2,66 2,54 2,45 2,39 2,34 2,30 2,27 2,25 2,17 2,12 2,08 2,04 2,00 1,99 1,98 1,97 11 12 ,18 ,81 ,61 ,48 ,39 ,33 ,28 ,24 ,21 ,19 ,10 ,06 ,01 1,97 1,94 ,92 ,91 ,90 12 13 ,14 ,76 ,56 ,43 ,35 ,28 ,23 ,20 ,16 ,14 ,05 ,01 1,96 ,92 ,88 ,86 ,85 ,85 13 14 ,10 ,73 ,52 ,39 ,31 ,24 ,19 ,15 ,12 ,10 ,01 1,96 ,91 ,87 ,83 ,82 ,80 ,80 14 15 ,07 ,70 ,49 ,36 ,27 ,21 ,16 ,12 ,09 ,06 1,97 ,92 ,87 ,83 ,79 ,77 ,76 ,76 15 16 3,05 2,67 2,46 2,33 2,24 2,18 2,13 2,09 2,06 2,03 1,94 1,89 1,84 1,79 1,76 1,74 1,73 1,72 16 17 ,03 ,64 ,44 ,31 ,22 ,15 ,10 ,06 ,03 ,00 ,91 ,86 ,81 ,76 ,73 ,71 ,69 ,69 17 18 ,01 ,62 ,42 ,29 ,20 ,13 ,08 ,04 ,00 1,98 ,89 ,84 ,78 ,74 ,70 ,68 ,67 ,66 18 19 2,99 ,61 ,40 ,27 ,18 ,11 ,06 ,02 1,98 ,96 ,86 ,81 ,76 ,71 ,67 ,65 ,64 ,63 19 20 ,97 ,59 ,38 ,25 ,16 ,09 ,04 ,00 ,96 ,94 ,84 ,79 ,74 ,69 ,65 ,63 ,62 ,61 20 22 2,95 2,56 2,35 2,22 2,13 2,06 2,01 1,97 1,93 1,90 1,81 1,76 1,70 1,65 1,61 1,59 1,58 1,57 22 24 ,93 ,54 ,33 ,19 ,10 ,04 1,98 ,94 ,91 ,88 ,78 ,73 ,67 ,62 ,58 ,56 ,54 ,53 24 o - 5 NO 00 ON Ul UJ r o 1 J> Ul ON - J S to 3 2 5 9 NO NO 6 1 7 1 u , UJ UI Ul ON NO to 8 9 8 o $ i t 7 9 i Ul Ul o UJ UJ 4i Ul O N NO — to Ui NO 7 1 00 ON 0 7 UJ Ul 4 1 5 9 '( O ON UJ UJ ?&. Ui ON NO „ to UJ ON 6 3 2 IO 5 3 Ńo UJ NO to Ul UJ UJ Ui ON NO l to - 8 3 3 fe S UJ NO 0 5 0 1 UJ ° UJ UJ _^ ON 00 l t to 8 8 to 3 7 5 8 00 ^1 to 00 9 5 s s "U J M UJ UJ 4, 21 4, 88 6, 09 8, 89 19 ,4 23 7 9 1 0 1 ^ o Ul o to UJ O N oo 19 ,4 23 9 00 te 9 5 S u i 7 3 u i B s 8 5 to UJ O N 00 t to 8 8 S 00 3 9 ON 00 o 7 7 8 00 , 7 5 2, 85 2, 98 S , 3 5 3, 64 4, 06 4, 74 5 , 9 6 8, 79 19 ,4 24 2 o to to UJ - u Ul 00 ^_ 24 4 2 3 Ul 8 § s 9 1 7 4 "JJ» to 2, 74 2, 86 , 0 3 , 2 4 , 5 3 3, 96 4, 64 5, 87 8, 71 19 ,4 24 5 * to IO UJ Ul 00 to 8 7 0 8 3 $ 2 0 9 2 s 2 6 9 ON to to UJ Ul 00 _ 24 7 6 7 g 4 7 s 5 8 B 6 7 00 to to UJ Ul 00 ? 8 s u i 2 3 g S 00 o O NO 00 ON Ul UJ r o X o o 8 i 2 0 0 1 0 0 cc o g Ul o • UJ o to OC to ON t to to 7 1 a 7 3 7 6 5 . 3 ) 8 1 00 oo oc 9 1 to to UJ UJ UJ UJ UJ L i ? 4^ Ui Ul to UJ ON NO NO o to to „ „ 't o 00 o u , 00 o UJ 00 NO — 1 , to 9 4 t Z. 6 0 0 0 2 8 0 6 3 -J ?**? J__, to 8 5 00 ON 88 1 9 2 is aa 8 05 1 s Ul 7 7 NO ° oo UJ 00 Ul s 93 1 00 8 0 1 ON ~. l 00 o c 00 NO NO S -J t o UJ Ul 00 NO to -J UJ r * r r - -4 J -J -J 00 00 oo NO NO OO -j 00 O UJ Ul -J o UJ 00 o to 6 3 66 1 7 0 -J 7 4 7 6 79 1 00 Ul 00 oo 00 s 6 1 6 3 s 7 1 7 3 7 6 oo to 00 ON o , 4 9 , 5 0 1, 52 1 , 5 6 , 5 7 , 6 0 , 6 3 1, 66 1 , 7 2 , 7 4 , 7 6 1 5 2 0 : 4 2 ? 46 1 4 9 Ul Ul Ui 61 1 6 7 s 7 1 s ta UJ 00 4 2 ? 4 8 ° Ul 6 1 UJ 8 5 o 2 6 2 8 3 1 3 5 3 8 4 1 ? 4 8 5 5 5 7 S S o M , 2 1 1, 24 , 2 9 , 3 2 , 3 6 , 3 9 1,4 3 , 5 1 , 5 3 , 5 5 0 0 1 ? _. to pa l ro to to UJ UJ Ul Ul o UJ O ON 00 UJ 00 ° UJ ^_ . Ul , i 1 1 to to UJ UJ UJ 4^ 4^ Ul o -J NO 8 S to 3 3 UJ 00 S 8 -/i 2 0 0 1 0 0 s Ul o to 00 to ON 1 CO TT l/l NO — 00 ON o es ćs CN cs cs CN ć s O CO es co CO NO co 00 co 00 n- 8 , 3 9 , 3 3 2, 28 , 2 3 ON \D es o B 0 5 s 0 1 $ S! 9 1 8 9 | 8 7 8 5 t eo oo 00 s 7 9 es 1 ' X 00 4 1 3 5 S CN CN cs 00 m es o 0 7 0 5 S 0 2 g ON ON 9 7 NO ON cs ON 9 0 00 00 8 7 8 6 S co 00 8 2 es es cs ™~ ™— in 4 4 00 co 3 3 2 5 ćs oo NO co - s 0 7 0 5 s s 0 1 ON 9 7 9 5 9 3 9 2 ON 00 8 8 8 7 5 5 00 4 2 es cs co 3 3 ON es p. co 09 2 S 8 0 5 s 01 1 8 ! W $ 1^ cs 9 1 es es cs es 1 ' 8 ro 00 9 00 CO co 00 n es o oo NO r, co CN o s B S co e 8 00 es es cs es c s 7, ON 00 CO co cs co O co es J s CN cs es o cs ON 00 NO cs - s 00 8 s 3 s es es es es , 7 1 . ON 9 cs 2, 37 • , 3 2 , 3 0 , 2 8 2, 27 , 2 5 , 2 4 , 2 2 , 2 1 ON r- ę es o , 0 9 00 CN es' r- O S ON l/l u - 00 V) es ą r> CO NO co cs CO CO o- 00 CN t~ es S co CN cs o- oo t— NO » es es cs es es1 00 s 7 1 1 6 1 oc 5 1 4 9 ą 4 2 R CO NO CO 1/1 CO 3 3 eo 00 es NO 2 5 2 4 CO cs 2 2 2 1 es es cs es es n CO es O 00 co NO CO co co eN co CO o o, (N es cs cs es es 0 3 9 6 O 8 5 8 1 7 7 7 4 p 6 8 ą 6 2 s 5 9 r- m co V") K 4 9 4 8 ą 4 5 4 3 4 2 4 1 cs es es CN es Ol 00 - 8 O ON 9 3 o 8 7 8 4 8 2 8 0 7 8 7 6 7 4 7 3 7 1 7 0 s 6 7 6 5 6 3 6 2 6 1 5 9 oc r- r- eo CS es cs es es - ON s o a ro o t— © 2 0 3 o ON ON 00 ON 9 6 9 5 co ON 9 2 O 8 8 8 7 8 5 s 8 3 8 2 8 1 8 0 co co CS CN es es 00 7 4 6 8 6 3 ON 5 5 5 2 4 9 4 7 ą 4 2 o 3 9 3 7 3 5 3 4 3 3 3 2 2 9 2 8 iq 2 2 2 1 2 0 eo co CO co CO - , 6 7 , 6 0 , 5 4 ON m - 00 >n es co 00 cs * co cs CN ON CN o co es co Tf ro NO CO 00 co * * 9 00 40 — Metodologia badań.. 625 to s o NO 00 ON Ul 4- Ul to - 1 , 5 2 2, 63 , 7 5 2, 92 , 1 3 , 4 3 3, 86 4, 54 5, 79 8, 65 19 ,5 24 9 H to t o UJ LA 00 , 24 9 5 1 6 1 7 4 s t o 4 1 Ul UJ ? to to UJ Ul 00 , , 24 9 to Ul NO 7 2 00 NO o 8 3 5 2 7 6 8 u, 2, 58 , 7 1 2, 87 , 0 9 , 3 9 3, 82 4, 50 5, 75 8, 62 19 ,5 25 0 * to t o Ul LA 00 05 3 UJ 4 7 5 7 3 8 ! s UJ 00 00 5 Ś 7 5 S u. 2, 55 t o Ul Ul 8, 60 19 ,5 25 1 UJ Ul fc S 8 k E 7 3 to t o UJ 4^ LA o o Ul UJ 8 2 5 2 te & Ul NO u, , 4 1 2, 52 , 6 5 2, 81 , 0 3 , 3 3 3, 76 4, 45 5, 71 8, 59 19 ,5 25 1 2, 51 , 6 4 2, 80 UJ ?u Ul 8, 58 19 ,5 25 2 * s 3 2 7 5 c l , 3 8 2, 49 , 6 2 2, 79 o , 3 0 3, 74 4, 43 5, 69 8, 57 19 ,5 25 2 s to t o UJ - t- Ul 00 t . to oo U) ON 4 7 s 7 7 NO NO t g 4 1 6 7 Ul ON LA to to to UJ Ul OO t . to l . UJ Ul & Ul NO 7 6 9 7 2 1 7 1 4 1 5 5 LA UJ 8 , 3 2 2, 43 , 5 6 a ' 2, 95 , 2 5 3, 69 4, 39 5, 65 8, 54 19 ,5 25 4 2 0 0 to to UJ Ul 00 25 4 Ul Ul 5 5 7 2 $ k § 5 3 7 ? Ul Ul Ul to to UJ Ul 00 ! , to 1 3 0 S 7 1 9 3 2 3 3 3 7 3 5 3 Ul 5 s o NO 00 ON Ul Ul to u o 8 5 0 0 3 0 0 00 3 1 5 0 1 2 5 1 0 0 00 o s Ul o 1 , 8 4 , 8 5 , 8 6 , 8 7 3,8 9 , 9 0 , 9 2 , 9 4 3, 96 4, 00 , 0 3 UJ U) 8 8 0 1 0 3 2 8 3 0 9 | - LA oo , 6 0 , 6 1 , 6 2 , 6 3 2,6 5 , 6 6 , 6 8 , 7 0 , 7 2 2, 76 , 7 9 UJ , 3 7 . 3 8 , 3 9 " ś * Ul , 4 4 , 4 6 , 4 9 2, 53 , 5 6 - , 2 1 , 2 2 , 2 3 , 2 4 2,2 6 , 2 7 , 2 9 UJ , 3 3 2, 37 , 4 0 Ul , 2 1 2, 25 , 2 8 ON o — t o UJ ON " * NO , 0 1 , 0 2 , 0 3 , 0 4 2,0 6 , 0 7 , 0 8 , 1 0 , 1 3 2, 17 -J , 0 6 2, 10 UJ 00 9 5 NO 00 8 0 1 s 00 00 , 8 9 , 9 0 , 9 1 1, 93 1 , 9 4 , 9 6 1, 97 , 0 0 2, 04 1 , 0 7 NO 8 3 2 8 5 00 ON 00 9 1 9 3 9 5 8 o 7 5 7 6 7 7 7 8 8 0 1 E S 8 3 5 8 8 8 9 2 1 to 6 9 7 0 7 1 7 2 7 6 -o -o 3 8 2 86 1 8 9 6 5 8 7 1 -0 to 7 5 7 7 82 1 00 Ul ON S 6 1 S ? 3 NO 7 3 78 1 00 00 LA Ul 00 Ul NO ON 8 ? a a 7 0 7 5 ° 8 00 01 0 0 5 3 0 0 00 3 1 5 0 1 2 5 1 0 0 S s ss co Ul NO IX oo ON R ĆM C M a R s O Cl CM TT CO 00 1 00 Tt 2 1 co B 0 1 S ! 8 8 a 81 7 8 I 7 6 7 3 | i 6 7 s 3 6 2 ON 5 7 CO _ 4 9 00 4 5 ii 2 2 § 0 2 2 ON 9 3 ON 00 ? 82 1 8 0 LL 7 5 7 3 71 1 ON NO 6 7 U") NO 3 6 1 1 5 9 5 6 5 3 /-> wo CN ? 4 9 R 2 6 ON fN 07 2 0 2 1 s 5 Ń g 8 5 3 S 00 76 1 7 4 7 3 g 67 1 8 s 6 1 5 9 5 7 1 5 5 5 5 0 6 0 8 0 1 2 7 ^ 08 2 0 3 9 9 1 - s s N O 0 0 2 C M S 78 1 NO 7 4 7 3 |x s 8 3 6 2 6 1 -H K 5 7 3 1 , 3 0 2 2 NO CN 0 6 0 2 1 9 8 9 5 92 1 8 9 8 4 8 2 80 1 7 9 P 7 5 7 4 71 1 8 6 7 6 5 6 2 1 6 1 6 0 5 9 2 4 00 12 2 8 s 0 0 1 94 1 9 1 88 N O 8 4 82 1 oo P s |x 6 9 6 8 NO NO 65 1 NO 3 9 6 1 3 3 2 5 ON CM s 0 5 0 1 9 8 1 95 1 9 2 8 8 8 8 6 •—i 2 8 2 8 0 7 9 p : ?o 7 3 r- s 6 7 66 1 6 5 3 6 2 3 4 2 7 O CM 15 2 o 8 0 3 9 9 1 9 6 1 r f O N ON O N 0 0 00 m 00 8 4 CM 00 8 1 ON 7 7 1 7 3 6 9 00 NO 6 7 NO 6 4 NO co 8 2 2 CN CM 00 0 5 0 1 1 98 1 93 9 1 8 9 87 1 8 6 00 8 3 8 1 79 1 7 5 7 3 7 2 70 1 s 6 7 m 00 Cl 3 1 a 19 2 ID 0 7 3 01 1 8 6 Z 9 2 8 GO 00 8 7 8 5 8 4 82 1 8 0 7 8 7 6 7 4 co 7 2 7 0 ON 3 2 2 6 21 2 NO IN 0 8 0 5 CM g 0 0 1 9 7 9 5 9 3 ÓN 00 8 5 83 1 7 9 7 7 s ? ? 7 2 « 4 1 3 3 2 7 22 2 p. CO o 0 7 CN 3 0 1 99 1 9 7 K 93 1 9 1 g 00 00 r~ 00 85 1 8 2 8 1 7 9 7 7 NO 7 5 7 4 7 3 4 2 _ ON CN fN ON f 0 8 0 5 2 0 3 00 1 9 8 g 95 1 9 3 9 1 g ON ? 3 CM 00 >—? 00 ON 78 1 7 7 NO P IN 4 4 3 7 3 1 25 2 2 1 co o CN B 2 02 0 0 1 9 8 95 1 9 5 9 3 9 2 9 1 88 1 00 8 3 81 ? P 7 8 fl CM CN c o Ul NO 00 ON ĆM R 8 s » 00 CM * CN CO co 00 CO CN 00 627 to - o OO OS Ol UJ to - 1 NO 1 0 ? 2 1 2 UJ ON to & NO 00 40 UJ UJ 6 5 o ON U) to Ul to Ol ON 00 NO o Ul o o 3 0 50 0 to 8 2 1 ON 6 6 5 5 5 NO Ul o 00 o Ol ON ON -j GO NO to 9 1 2 9 NO NO Z u. Ul Ul « Ol NO 4 5 7 8 -J Ol to Ul Ul Os -J NO - 5 Ś to oo 8 56 41 6 7 * 4 2 00 Ol Ol o -J to Ol Ol ON -4 00 g Ol 2 8 Oi Ul 3 2 8 UJ o ; o Ol (O UJ Ol Ul ON 00 1 0 o i 2 7 NO NO Oi 3 UJ g U) -J Ń o 4 7 -4 to NO UJ Ol Os 00 1 0 Ol t J $ 59 ? S 8 ON ó o s Ol o * ? 4, 74 , 0 6 5, 47 , 0 3 6, 84 8, 10 10 ,3 14 ,8 27 ,5 99 ,4 59 8 00 4, 63 4, 94 , 3 5 5, 91 6, 72 7, 98 10 ,2 14 ,7 27 ,3 99 ,4 60 2 NO O\ ON 1 0 1 4 to -o s $ - K oo Ol o ! 8 1 6 2 2 3 Ol t o •" 4* Ol ON -o NO 1 4 $ ON „ 4 0 - o S 6 7 4 7 Z L 00 NO * * s 4, 29 4, 60 8 5, 56 6, 36 7, 60 9, 77 14 ,2 26 ,9 99 ,4 61 4 3, 97 4, 21 , 5 2 4, 92 5, 48 6, 27 7, 52 9, 68 14 ,2 26 ,8 99 ,4 ON oś w Oi ON -j NO 1 4 2 6 « O\ 9 1 u & S N 4 1 2 1 4 5 ON i—. o o 3. 86 4, 10 , 4 1 4, 81 5, 36 6, 16 7, 40 9, 55 14 ,0 26 ,7 99 ,4 62 1 o 1 3 - 3 NO 00 - J ON Ol UJ H - o 0 10 00 5 0 0 3 0 0 2 0 0 1 5 0 1 2 5 1 0 0 8 8 Ol o 1 i , 1, 72 1 ,7 6 -2 22 5 5 ON 5 8 8 6 1 a 6 5 ON X Ol bO Ol UJ Se 5 5 Ol -J 5 9 s 6 3 6 5 ° 7 4 Ol 5 1 5 2 ? ? 55 1, 5 7 5 8 6 1 ON UJ 68 1, 7 2 oo NO o - Ul Ot Ol NO ON to 3 ,4 6 , 4 7 , 4 8 , 5 0 1, 52 1 ?? ' , 5 5 , 5 7 , 6 0 1, 65 1 ,6 9 3 0 3 4 2 4 5 4 8 5 5 5 2 5 3 8 s ,3 9 , 4 1 , 4 2 , 4 3 1, 46 , 4 8 , 4 9 , 5 2 , 5 4 1, 59 , 6 3 a n 1, 57 1 , 6 1 4 5 5 0 o -J o 00 Ś Ul Ul J NO Ol to fai te 4 1 4 5 Ol Ul ON 8 ,_, 8 bo UJ UJ Ul NO - t o Ol 00 UJ 7-/1 00 | . 00 bJ ta 3 2 Ul Ol Ul 3 9 4 1 4 5 ° Se ,2 4 , 2 6 = 1, 32 1 , 3 9 , 4 3 oo ,5 2 2 00 1 Ń o 2 1 2 3 to ON 2 9 UJ 3 4 3 8 44 1 48 UJ o ś Ń o 22 1 2 5 3 1 ? ? 41 1 X 8 g - o ! Ńo B IO 00 3 2 $ 8 10 00 5 0 0 3 0 0 00 2 1 5 0 1 2 5 1 0 0 8 8 Ul o I 1 CO ! t ?O NO 00 ON o Ol Ol O l Ol co OJ CN CM 00 Ol o co CO r o c o 00 ro * 00 6 6 iż-! 3 7 o ? NO 8 8 z 8 8 8 3 | 7 8 7 4 1 70 8 6 3 s 5 7 | R 4 3 ? co Ol co o 00 co Ol Ol Ol CM CN (N r- NO in 4 2 co 2 1 c o 0 5 ON 9 3 00 00 co 00 75 7 2 00 SO 6 5 6 3 s $ — 00 4 5 4 2 4 0 CO 5 3 co Ol OJ Ol CN CM 7 8 6 2 ON P ; 2 7 2 Ol 0 5 g s 9 4 ON 81 7 8 7 5 7 2 6 9 6 6 6 2 00 u-, 5 1 9 4 6 4 2 4 0 — r o CO co Ol Ol CM CM 7 0 5 6 4 5 NO Ol 00 ON CM 2 4 CM 1O ? * ?3- o — NO CO 2 3 - o 9 3 *n 00 00 7 2 Ng 3 t— •T) ro m 4 9 4 5 4 2 ON co 3 4 ON Ol 2 5 Ol 00 Ul Ol O ( S NO u-i * n m 0 7 8 6 00 NO co 4 0 2 9 00 O 02 9 5 00 00 C M 0 0 77 CM r- 3 g NO m 5 0 o 3 5 co 2 8 2 5 2 2 2 — 00 oo 00 c" r- 1 r o T T u" > NO 00 fl Ol Ol Ol co 3 CM NO CM r- OJ 00 Ol i OI co r o oo ro i i 629 1 2 3 4 5 6 7 8 9 10 12 14 16 18 20 50 ,17 ,06 ,20 ,72 ,41 ,19 ,02 ,89 ,79 ,70 ,56 ,46 ,38 ,32 ,27 50 60 7,08 4,98 4,13 3,65 3,34 3,12 2,95 2,82 2,72 2,63 2,50 2,39 2,31 2,25 2,20 60 80 6,96 ,88 ,04 ,56 ,26 ,04 ,87 ,74 ,64 ,55 ,42 ,31 ,23 ,17 ,12 80 100 ,90 ,82 3,98 ,51 ,21 2,99 ,82 ,69 ,59 ,50 ,37 ,26 ,19 ,12 ,07 100 125 ,84 ,78 ,94 ,47 ,17 ,95 ,79 ,66 ,55 ,47 ,33 ,23 ,15 ,08 ,03 125 150 ,81 ,75 ,92 ,45 ,14 ,92 ,76 ,63 ,53 ,44 ,31 ,20 ,12 ,06 ,00 150 200 6,76 4,71 3,88 3,41 3,11 2,89 2,73 2,60 2,50 2,41 2,27 2,17 2,09 2,02 1,97 200 300 ,72 ,68 ,85 ,38 ,08 ,86 ,70 ,57 ,47 ,38 ,24 ,14 ,06 1,99 ,94 300 500 ,69 ,65 ,82 ,36 ,05 ,84 ,68 ,55 ,44 ,36 ,22 ,12 ,04 ,97 ,92 500 1000 ,66 ,63 ,80 ,34 ,04 ,82 ,66 ,53 ,43 ,34 ,20 ,10 ,02 ,95 ,90 1OOO oo ,63 ,61 ,78 ,32 ,02 ,80 ,64 ,51 ,41 ,32 ,18 ,08 ,00 ,93 ,88 oo Liczby w pierwszy m wierszu (dfi =1) należy pomnoży ć przez 10 c = 0,01 22 24 26 28 30 35 40 45 50 60 80 100 200 500 i 622 623 624 625 626 628 629 630 630 631 633 633 635 636 637 1 2 99,5 99,5 99,5 99,5 99,5 99,5 99,5 99,5 99,5 99,5 99,5 99,5 99,5 99,5 99,5 2 3 26,6 26,6 26,6 26,5 26,5 26,5 26,4 26,4 26,4 26,3 26,3 26,2 26,2 26,1 26,1 3 4 14,0 13,9 13,9 13,9 13,8 13,8 13,7 13,7 13,7 13,7 13,6 13,6 13,5 13,5 13,5 4 5 9,51 9,47 9,43 9,40 9,38 9,33 9,29 9,26 9,24 9,20 9,16 9,13 9,08 9,04 9,02 5 6 7,35 7,31 7,28 7,25 7,23 7,18 7,14 7,11 7,09 7,06 7,01 6,99 6,93 6,90 6,88 6 7 6,11 6,07 6,04 6,02 5,99 5,94 5,91 5,88 5,86 5,82 5,78 5,75 5,70 5,67 5,65 7 8 5,32 5,28 5,25 5,22 ,20 ,15 ,12 ,09 ,07 ,03 4,99 4,96 4,91 4,88 4,86 8 9 4,77 4,73 4,70 4,67 4,65 4,60 4,57 4,54 4,52 4,48 ,44 ,42 ,36 ,33 ,31 9 10 ,36 ,33 ,30 ,27 ,25 ,20 ,17 ,14 ,12 ,08 ,04 ,01 3,96 3,93 3,91 10 11 4,06 4,02 3,99 3,96 3,94 3,89 3,86 3,83 3,81 3,78 3,73 3,71 3.62 3,60 li J c o Vi NO 00 O N 8 ĆN CO CN s CN 1 CN CO a 00 CO oo ! R 8 8 7 p 4 9 4 2 co ć o 2 1 P . CO o S S 0 1 8 9 1 | 3 g 7 8 | Ul CO 1 oi Ol Ol OJ i i '^H R 3 8 ON 0 3 8 9 00 r- s ON I/I 5 1 3 8 3 3 2 8 2 4 ON NO Ol s 0 6 0 3 9 8 g r o 8 6 8 3 8 0 7 8 7 5 co c o o i ol Ol CM 1 ' R 4 1 2 2 8 9 2 8 1 - 6 2 48 4 2 3 6 3 2 CN CO 2 vO CO o S s 9 8 1 o 00 8 5 8 2 o 00 7 8 Ol Ol Ol OJ O) R 4 7 2 7 - 8 7 6 00 VD s 00 4 2 3 7 3 3 2 9 2 2 ON NO co g 3 8 s 9 1 ON 8 6 3 CN Ol CN OJ Ol g 4 9 3 0 8 8 9 ON O co NO 5 ? 9 3 6 3 2 8 2 5 ON NO -. 8 0 3 8 S N 8 8 8 Ol Ol O) Ol 5 4 00 0 5 9 3 CO 00 r - 6 7 6 1 V. o V, 4 5 9 vO CO co co 2 9 2 6 CO CN 2 1 NO Ol 0 8 0 5 S a 9 5 9 3 5 7 3 8 2 2 0 8 9 7 2 8 7 7 8 s 5 8 2 CO 4 8 4 0 CM CO 3 3 o Ol "O CN 20 2 NO Ol g NO 0 3 1 0 1 a Ol Ol CN Ol Ol ON "O 4 0 2 4 o a ó o c o r- 67 NO Ul V, 4 2 ON CO v> co 3 2 O CO r-- Ol 2 2 00 a s s 0 3 o g Ol Ol Ol Ol Ol * " 6 2 4 3 co s g s 7 6 6 9 s 5 8 5 4 4 9 4 5 4 2 3 8 3 5 3 3 3 0 a 2 1 r - ? g g 8 s 0 2 9 CO CN Ol Ol Ol Ol NO 4 6 o co r- 0 5 g 00 o CO 6 7 CN 5 7 CO V, 4 9 4 5 4 2 ON CO NO CO ON CM 2 5 2 1 00 vi co o 0 8 S ci co CN Ol Ol CM OJ O 5 1 3 5 ĆM o 8 9 2 8 4 78 7 2 6 7 6 2 5 8 5 4 5 0 4 7 4 1 3 9 3 4 3 0 ą CO 2 0 00 r i CO CM co CN Ol Ol Ol Ol 7 2 co V, CO 2 4 Ol S 8 7 o 00 7 4 6 9 s 6 0 5 6 5 3 4 9 4 6 4 1 3 6 3 2 2 9 2 6 2 3 2 0 00 NO CN co CN CN Ol Ol Ol 8 •T ) NO O o 5 Vi 0 5 g - 00 co 00 7 2 6 7 co NO ON V, CN 4 9 ON co Vi CO CN ro 2 8 NO Ol 2 3 Ć N ON i- CO CN CM Ol Ol OJ s 00 5 9 4 3 2 9 00 s 8 C N ON 86 O 00 7 5 7 0 s 6 2 5 8 5 5 5 2 4 9 4 7 4 2 00 co 3 5 3 2 2 9 2 6 2 4 Ol Ol c o co Ol Ol CN Ol Ol 3 , 8 2 CN NO 4 6 CO co 2 2 C N 0 3 2 , 9 6 , 9 0 2, 84 7 4 7 0 VD NO 6 2 ON Ul NO 1/1 CO V) 5 1 2, 46 , 4 2 , 3 8 , 3 5 , 3 3 2, 30 , 2 8 , 2 6 co Ol y N CO V, I— OO ON o ? Ol CN CN CN s V> CN Ol 00 CN cN I Ol co * | oo ro Ol s 00 631 N & T2. i ? I 2 ?I I n 1 R 5 I ?a i o 8 0 0 0 1 5 0 0 3 0 0 00 3 1 5 0 1 2 5 1 0 0 8 LA o 1 ^_ , 0 7 SI' 3 33' 8 3 8 8 7 8 9 3 9 6 OO 0 2 , 7 9 00 , 8 3 1,8 9 , 9 2 , 9 4 1, 98 , 0 3 2, 12 , 1 8 t . . 8 2, 08 , 1 5 7 6 i S 00 Ul a 9 1 . , M to 7 2 7 4 * 00 to oo LA 00 S 9 7 1 0 5 2 to Lo 7 0 • 79 1 es 8 « S o 7 4 s 8 $ 0 5 1, 94 1 , 0 1 4 0 4 6 1 a 6 6 s a 7 6 § 5 5 8 O s I O 66 1 d 7 6 o o 9 0 1 Ul to Ul Os 5 9 6 3 s 7 3 S 9 5 , 4 7 , 5 0 , 5 2 , 5 5 1, 58 1, 39 ' , 6 5 , 6 9 , 7 5 1, 84 1, , 9 1 s oo u > Ul o o o * UJ s -J oo , 3 6 , 3 8 , 4 1 1, 48 1 , 5 2 , 5 5 , 6 0 , 6 6 1, 75 1 , 8 2 1 0 0 2 K 00 LO a 3 9 UJ 4 7 5 2 5 8 6 8 7 6 LA 5 , 2 3 , 2 8 1,3 3 , 3 8 , 4 1 , 4 7 , 5 3 1,6 3 , 7 1 5 0 0 , 0 0 , 1 1 , 1 6 H 1,2 8 , 3 3 , 3 7 , 4 3 , 4 9 1, 60 , 6 8 8 8 0 0 0 1 5 0 0 3 0 0 00 3 O SI 1 2 5 1 0 0 § s LA O Tablica 6a. Wartości krytyczne statystyki *> testu serii Walda-Wolfowitza «Nl2 2 3 4 m 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 2 2 2 2 2 2 2 2 2 2 3 4 ' 2 es es es es 2 3 2 3 2 3 2 3 es co 2 3 2 3 eo co 3 n 4 3 4 3 4 3 4 3 4 5 6 2 es es es co 3 3 t, 3 3 3 3 3 4 3 4 4 4 4 4 4 5 4 5 4 5 ' 4 5 4 a 5 t Ul Ul 5 6 5 6 7 2 2 3 3 3 4 U 4 5 5 5 5 5 6 6 6 ? 6 6 6 8 2 3 , 3 3 's r 4 4 1 5 5 5 6 6 < 6 6 6 7 *, 7 7 7 9 2 3 3 4 ?i 4 5 > ir 5 5 6 6 6 7 7 7 7 » 8 8 8 10 2 3 3 4 5 5 5 6 6 7 7 i ) 7 j 8 8 8 8 9 11 2 3 4 4 J i 5 5 6 6 *)> I 7 7 7 ' 8 8 8 9 9 9 9 12 2 2 3 4 4 •"»,& 5 6 6 7 i i i ? 7 7 8 i 8 8 9 f 9 9 10 10 13 2 2 3 4 5 5 6 6 7 i / , \ 7 8 8 9 9 , 9 iorł1 10 10 10 14 2 2 3 4 5 5 6 E 7 7 i * Iii 8 8 9 9 9 10 10 11 11 15 2 3 3 4 5 1 6 6 7 7 i** 8 8 9 9 10 J< io 11 11 11 12 16 2 3 4 4 5 6 6 7 8 8 9 9 10 10 ' 11 U f',» 11 12 12 17 2 3 4 4 5 6 7 7 8 9 9 10 10 11 ?w u 11 12 12 13 18 2 3 4 5 5 6 7 8 8 9 9 10 10 11 11 12 12 13 13 19 2 3 4 5 6 6 7 8 8 9 10 10 11 11 12 12 13 13 13 20 2 3 4 5 6 6 7 8 9 9 10 10 11 12 12 13 13 13 14 Tablica 6b. Wartości krytyczne statystyki k" testu serii Walda-Wolfowitza 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 2 3 4 9 9 5 9 10 10 11 11 6 7 9 10 11 11 12 12 13 12 13 13 14 13 14 13 14 13 14 15 15 15 8 11 12 13 14 14 15 15 16 16 16 16 17 17 17 17 17 9 13 14 14 15 16 16 16 17 17 18 18 18 18 18 18 10 13 14 15 16 16 17 17 18 18 18 19 19 19 20 20 11 13 14 15 16 17 17 18 19 19 19 20 20 20 21 21 12 13 14 16 16 17 18 19 19 20 20 21 21 21 22 22 13 15 16 17 18 19 19 20 20 21 21 22 22 23 23 14 15 16 17 18 19 20 20 21 22 22 23 23 23 24 15 15 16 18 18 19 20 21 22 22 23 23 24 24 25 16 17 18 19 20 21 21 22 23 23 24 25 25 25 17 17 18 19 20 21 22 23 23 24 25 25 26 26 18 17 18 19 20 21 . 22 23 24 25 25 26 26 27 19 17 18 20 21 22 23 23 24 25 26 26 27 27 20 17 18 20 21 22 23 24 25 25 26 27 27 28 o 8 o 1 t OS _l g co Os e t ID OS i s - m o c o Ol „ c o 8 § o 8 co o 3 ID o o § i 2 Ol c o ID t— o o o o ? Ol Ol Ol CO Ol s o o o o o O o o o o O o O o o O o o o o O o o o o 00 o 00 o 00 0 2 8 0 B o oo 00 o o Ol oo CM OO co 00 - 00 [?> 00 OS OS co Os ? 1 19 03 ID Ć M o 1 s 8 i 00 o s 2 CM CO to Ol 0, 21 Ol ol CO CM 0, 24 o o o o o o o o o o o o o O O O O o o o O o o o o o o o CS co ON co SO Os CM 8 r - r - r - r - r - r - 1 0 7 r - r - 00 00 OC as O o o 8 8 e t 8 t— O 8 CM c o ID SO h - 00 Os Ol Ol CO CM CN o o o o o o o o O o o o o O o O O o o O o O o O O i s o to S o so SO SO 2 co g 00 so CO r- sO OS Ol 00 9 s 8 ir > 8 g o g i 3 8 s ? 2 '—' OJ CO 2 SO r - 00 Os Ol Ol CO Ol Ol o o o o o o o o o o o o " O o o o o O o o O o o o O o ID g o o o _ CM co ID r - 00 ID 5 ? cn to 16 65 oo sn Ol f» ID Os 00 OS 00 | 8 8 o CM o co o o 00 o $ o T-< CO r - 00 Os 0, 20 0, 21 o i o o o o o o o O o o o o O O O o o o o o O O O o s o s 8 _ _ CM co 3 13 48 o ID Ol ID ID "D oo ID • Z ID tO Os TT r- ? I 8 g o s co O o O 00 o s y CM ??» ID tO r - o o OS Ol Ol o j CM ' © o o o o o o o o o o o o O o o O O o o o 3 o O O o a e o o CS co 00 es 00 Os CO 00 co r n co co co r o ro CO co co c o co 1 5 4 9 ID s o 8 o o CO o 2 s 8 O fe o ?^ CM co i j o o OS es " CM Ol Ol co Ol o o o o o o o o O o o o O O o o o o O o o O O o o § o CM cs o o es r — oo CO 00 co oj CM CM es CM rM CM es 1 0 2 CS CM CM co co co co Tf SO o X O CM O R o O O O ^^ Ol CO 2 2 r - 00 2 es CM o i ol o o O O o o o o O O o o o O o o O o o o o o * O o O o o o o o „ . Ol es co ID sO 00 OS es 9 r - 8 g 00 CM p . CO 8 8 o R o o R 8 O CM c o 1 5 ; tO 1 7 : 00 Os o Ol 0, 21 < o l 0, 23 ! o* o o o o o o o o o o O O O o o o o o o o o O 00 0 1 0 1 0 0 0 2 0 0 8 co O 1 05 01 i 1 o 0 8 0 2 09 02 10 03 11 05 90 31 13 08 14 09 15 11 16 14 17 17 18 20 19 23 20 27 2 1 3 2 2 2 3 7 Ol o o o o O o o o o o o o o o o o o o o o o o o o o o g g o o s o o o 1 0 0 1 1 0 1 2 0 1 3 0 1 4 0 s 1 7 0 1 8 0 1 9 0 00 3 2 1 0 2 2 0 2 3 0 o o o o o o o o o o o o o o o o o o o o o o o o I ? 635 9C9 o o o o o o o o o o o o o o o o o o o o o o o o o o 4 9 0 4 8 0 o k 4 5 0 UJ o 4 2 0 o 8 3 9 0 3 8 0 3 7 0 3 6 0 3 5 0 3 4 0 3 3 0 3 2 0 3 1 0 8 2 9 0 2 8 0 2 7 0 2 6 0 o 2 4 0 o o o o o o o o o o o o o o o o o o o o o o o o o o 5 3 6 1 5 2 3 0 51 01 4 9 7 3 48 47 47 22 4 5 9 9 4 4 7 7 4 3 5 6 42 36 41 18 40 01 3 8 8 4 3 7 6 9 36 54 35 41 s to oc 3 3 1 7 32 06 30 95 29 86 2 8 7 7 27 69 26 61 25 54 i 00 ,00 0 o o o o o o o o o o o o o o o o o o o o o o o o o o 5 3 7 4 5 2 4 3 5 1 1 4 4 9 8 6 48 60 47 35 4 6 1 1 4 4 8 9 4 3 6 8 42 48 41 30 4 0 1 2 3 8 9 6 3 7 8 0 36 66 35 52 34 39 3 3 2 8 32 17 31 06 29 97 28 88 27 79 2 6 7 2 25 65 24 58 ,001 o o o o o o o o o o o o o o o o o o o o o o o o o o Ul 00 -J 5 2 5 6 5 1 2 6 4 9 9 9 48 72 47 47 4 6 2 3 45 01 4 3 8 0 42 60 41 42 4 0 2 4 3 9 0 7 3 7 9 2 36 77 35 64 34 51 3 3 3 9 32 28 31 17 30 08 2 8 9 8 27 90 2 8 9 2 25 75 24 69 o o o o o o o o o o o o o o o o o o o o o o o o o o o 5 4 0 0 5 2 7 9 5 1 3 9 50 11 48 85 47 60 4 6 3 6 4 5 1 3 4 3 9 2 42 72 41 53 4 0 3 6 3 9 1 9 3 8 0 3 36 89 ?? ?? 34 62 3 3 5 0 32 39 31 28 30 19 2 9 0 9 28 01 26 93 25 86 24 80 i o o o o o o o o o o o o o o o o o o o o o o o o o o 5 4 1 3 5 2 8 2 5 1 5 2 5 0 2 4 48 97 47 72 4 6 4 8 4 5 2 6 4 4 0 4 42 84 41 65 4 0 4 7 39 31 38 15 37 00 35 86 34 73 3 3 6 1 32 50 31 39 30 29 0 2 6 2 28 12 2 7 0 4 25 97 24 90 ,00 4 o o o o o o o o o o o o o o o o o o o o o o o o o o <—> 5 4 2 7 5 2 9 5 5 1 6 5 5 0 3 7 49 10 47 84 4 6 6 0 4 5 3 8 4 4 1 6 42 96 41 77 4 0 5 9 3 9 4 2 3 8 2 6 37 12 35 97 34 84 3 3 7 2 32 61 31 50 30 40 29 31 28 23 27 15 26 08 250 1 ,005 o o o o o o o o o o o o o o o o o o o o o o o o o o Ul 5 3 0 8 5 1 7 8 5 0 4 9 49 23 47 97 4 6 7 3 4 5 5 0 4 4 2 9 43 08 41 89 40 71 3 9 5 4 3 8 3 8 37 23 36 09 34 96 3 3 8 4 32 72 31 61 30 51 t o 28 33 2 7 2 6 26 18 251 1 ,00 6 O o o o o o o o o o o o o o o o o o o o o o o o o o 5 4 5 3 u, UJ to 51 91 5 0 6 2 49 35 47 09 4 6 8 5 4 5 6 2 4 4 4 1 43 20 42 01 4 0 8 3 3 9 6 6 3 8 5 0 37 34 36 20 35 07 3 3 9 5 32 82 31 72 30 62 2 9 5 3 28 44 2 7 3 6 26 29 25 22 o o o o o o o o o o o o o o o o o o o o o o o o o o o i 5 3 3 4 5 2 0 4 5 0 7 5 49 48 48 22 4 6 9 7 4 5 7 4 4 4 5 3 43 32 42 13 4 0 9 4 3 9 7 7 38 61 37 46 36 32 35 18 3 4 0 6 32 94 31 83 30 73 2 9 6 4 28 55 27 47 26 40 ?? ?2 o o o o o o o o o o o o o o o o o o o o o o o o o o 5 4 8 0 5 3 4 7 ? 1 2 ? 5 0 8 8 49 61 48 35 4 7 1 0 4 5 8 7 4 4 6 5 43 44 42 25 4 1 0 6 3 9 8 9 3 8 7 3 ?? ?? 36 43 35 30 3 4 1 7 33 05 31 95 30 84 SO Ul 28 66 2 7 5 8 26 50 25 43 o 00 r — O NO ro 00 1/1 NO O ON ro co CN NO NO ro r- ON in ro ON NO CO 8 0 8 NO NO o CO o 5 6 5 7 5 8 s 6 1 co NO 3 8 6 7 6 9 7 0 7 2 ? ? 7 5 f- r-- ON 00 3 OO 00 9 2 ON 9 7 8 ! o o © © o O o © o o o © o o © O © o o O o © © O © o I m 5 7 3 6 5 8 7 4 6 0 1 3 61 55 62 99 6 4 4 6 6 5 9 4 6 7 4 6 69 00 70 57 72 18 7 3 8 1 75 48 77 18 78 93 80 71 8 2 5 4 8 4 4 2 86 34 88 32 9 0 3 5 9 2 4 5 94 61 96 84 51 66 O o © © © © © o © © © © o © © © © o o © © © © o o o r- (N ON wi ON vi CM Ul ro NO ro ro ON CM 8. 5 5 8 5 7 2 5 9 9 6 1 4 6 2 8 6 4 3 6 5 7 6 7 3 6 8 8 7 2 0 r- 7 5 3 7 7 0 7 8 7 5 0 8 8 2 3 8 4 2 8 6 1 8 8 1 9 0 1 9 2 2 9 4 3 9 6 6 68 6 O o © c o © © o o o o © © © © © o © o o © © © © © © Ą 55 73 5 7 0 9 5 8 4 6 5 9 8 5 61 27 62 70 6 4 1 6 6 5 6 5 6 7 1 5 68 69 70 26 71 85 7 3 4 8 75 14 76 84 78 58 8 0 3 5 8 2 1 7 3 OO 85 95 87 92 8 9 9 4 9 2 0 2 9 4 1 7 96 39 98 68 © o o © © © © o © © © © © o © © © © o © © o © o © © i 5 6 0 6 9 5 8 3 2 t— 1 1 2 95 2 S 5 5 0 7 0 0 0 1 0 1 6 9 3 3 2 4 9 7 6 6 7 8 4 0 0 1 7 1 9 9 3 8 5 5 7 6 7 7 2 9 7 3 1 8 1 3 9 5 6 1 6 8 4 5 ui ui Ul i/> NO NO NO NO NO r- r^ t— r — t— oo OO oo oo 00 00 ON ON ON ON o O o © © © O © O O © © O © © © o o © o o" o o © O O O r- oo 00 r- 00 ro © ro a 1 NO CN ro ro CN o n 00 ro co m 00 CN 00 Ul Ul Ul ON CN to OO ON CN ro oo ro NO OO ro Ul r~ ON co 00 U1 1/1 VI NO NO NO NO NO NO NO r- [— r- 00 00 oo 00 00 ON ON ON ON o" © O © © © o © o © © © © o © o o © O © © © © © O O 1 5 3 3 | 8 0 5 ro i 60 84 2 2 7 3 7 2 5 2 0 6 6 7 0 8 2 3 OO 5 1 3 7 2 9 9 3 6 3 3 8 0 5 00 ON 1 6 2 3 4 7 5 3 7 7 3 2 ro ro ON 1 3 9 3 5 2 5 7 1 7 9 9 Ul !/1 ui NO NO NO NO NO r^ r- r- r~ t- oo 00 00 00 00 ON ON ON ON © O © © o © O o o © © O © © © o O © O © O © © © © O 8 5 2 0 6 5 4 7 9 1 6 2 6 60 70 2 1 3 3 5 8 5 0 5 6 6 5 5 S OO 9 6 3 1 2 1 2 8 3 4 4 7 6 1 6 7 8 8 9 6 4 1 4 4 3 2 8 5 1 8 7 1 2 9 1 2 1 1 8 3 3 0 5 4 9 7 7 5 Ul u-. 1/1 ui NO NO NO NO NO r- r- 00 00 00 oo 00 ON ON ON ON © O © © © © © © © O © o © © O © © © © o o o O O O O 6 4 1 r- Ul NO Ul OO ON ro O oo © CN ui r- » Ul Ul Ul NO NO t— f- r- 00 00 00 00 ON ON ON ON O o O © © o" ©" © o © © © © o © © © O © © O ©* o © O O O R © o © ro o O ul c i B O - © ro o o o ° s 8 © © ro ° o *O. ui 1/1 NO NO NO 'O NO NO ^ o NO r- r- r- O o © O © o" © © © O o © © © O © © © o © © © o © o o 637 8?9 p © p o p "NO VO *NO "NO O O c> o p p o \o Ńo *NO 2 tO ł-* O O pppp © ©? § 00 00 00 •vi o © p p p p p p p p ^o ^o "bo ^o *>J Vi Vi vi w ro — o NO oo vi o\ o o o © o © o © K 8 ? 8 M Ul H w \o oo s g ui W i *? * u u w w to — — — O vi to -4 Ul NO Ul to 00 Ul tO VD >i to »- m UJ UJ O\ >— vi ot vi oo Ul M \O 00 H- 4*. >— tO O 00 © O\ tO O Ul -P*. N) « 00 Is) U> Ul 00 >—> Os Ui Ul ^. 4^ Os ^ U> -J tO L/l Ul U» -J ON v© Os -fc. U\ K> »— .— N- to to to i- "vi Ul «• *VO Ul Ul tO vi 00 O vi tO vi vi U> i— o o vi O N Ul Ul vi vi Ul Ul © UJ 00 UJ to NO tO i— „. to UJ 00 ON vi | L _ __ Q ON UJ p vi C3i U K) S ON © © NO •-? 00 Ul 8 -h. 00 O Ul Ul UJ vi vi Ul P P 00 -J Os Os Ul -^ O\ Os 00 O -^ 00 4-* •— 00 Ul O0 L/l i—' VO W U) 4^ U) OJ 00 85 S o o to »- Ul NO O vi Ul tO S \O UJ vi UJ Ul M v) 4k o 00 „ to ui tO Vi ON Ul +k łk UJ UJ UJ — Ul ^O •& NO •(» O Ul N— UJ H- UJ NO 00 vi UJ vi Ul 00 00 NO K> to — — — UJ © ON UJ © 4^ *—• NO 00 ^J NO — tO 00 00 S28 o ui to oo JO tO tO tO M J NO ^ ^-* O ^0 \c 5 co - oo +> U Ji t> Ul Ul O\ v] O vi vi O\ CJN Ul NO NO tO 00 NO tO Ul tO O\ tO vi O 00 vi ON Ji. tO tO N> W - 5 to St Ul r $ g P po "N) N) O« In IA « S Sg S " ^ ^ W U LA O Ui — H (>) OO O\ OOWOO --J 4^ — 0O sl O\ Ul Ul O t— U) OS i— H- S) O\ VO O ^O \O O\ 00 W 85 W W N) W M h- N- >• ?— ^Tyi^o^D^o oo Vi a bi ui ui ^ ui to i—* ro *». -J L^N) LA V^^ ^^^ ^^^ ^^A ^^ L^N) ^^ UI ji. V UJ u> to >— 91 M Ol IO 00 ON M to vi 4^ UI o oo 4-* O NO vi to to — — — ł. - 00 Ul U vO 4^ — O '— O -t* vj vj to O NO U> N) |O tO tO M N-* H-• )— h— •— I—» I—» I—» I—II— 00 Ul "lO O "^O 00 "-J OS Ul Ul V V *W U» ło O ^O sj NJ W tJ S) Ul OO tO Os i—> sl N) 00 O oo ru ui OJ i— *o •—• to ?—» sj si H »o ^ ts>00\OOsU> OsUiOUt-^J O •-* -^ O Ul to ON to*-.— *- oopo vi 4 UJ 4^ 00 NO 00 ?-• Ul 00 tO vi 00 00 00 NO Tablica 8. Krytyczne wartości r ' 0,1 0,05 — 0,02 0,01 — 0,001 1 0,98769 0,99692 0,999507 0,999877 0,9999988 2 ,90000 ,95000 ,980000 ,990000 ,99900 3 ,8054 ,8783 ,93433 ,95873 ,99116 4 ,7293 ,8114 ,8822 ,91720 ,97406 5 ,6694 ,7545 ,8329 ,8745 ,95074 6 0,6215 0,7067 0,7887 0,8343 0,92493 7 ,5822 ,6664 ,7498 ,7977 ,8982 8 9 ,5494 ,5214 ,6319 ,6021 ,7155 ,6851 ,7646 ,7348 ,8721 ,8471 10 ,4973 ,5760 ,6581 ,7079 ,8233 11 0,4762 ? 0,5529 0,6339 0,6835 0,8010 12 ,4575 ,5324 ,6120 ,6614 ,7800 13 14 15 ,4409 ,4259 ,4124 ,5139 ,4973 ,4821 ,5923 ,5742 ,5577 ,6411 ,6226 ,6055 ,7603 ,7420 ,7246 16 0,4000 0,4683 0,5425 0,5897 0,7084 17 ,3887 ,4555 ,5285 ,5751 ,6932 18 ,3783 ,4438 ,5155 ,5614 ,6787 19 ,3687 ,4329 ,5034 ,5487 ,6652 20 ,3598 ,4227 ,4921 ,5368 ,6524 25 0,3233 0,3809 0,4451 0,4869 0,5974 ? 30 ,2960 ,3494 ,4093 ,4487 ,5541 35 ,2746 ,3246 ,3810 ,4182 ,5189 40 ,2573 ,3044 ,3578 ,3932 ,4896 3 8 s -J o c to 00 Os s C OC 3^ 00 S 8 fc fe fe JS ^1 M o O N> \O w fe o p k> 1 o VJ U ) Ln i 7\ 00 o to O - J 0 0 » - J H- Lft 00 \O 00 OJ Tablica 9. Współczynniki rbi — tablice Flanagana Proporcja odpowiedzi zgodnych z kluczem w górnej grupie 27% 01 02 04 06 08 10 12 14 16 18 20 22 24 26 28 30 32 34 36 38 40 42 44 46 48 50 01 0 11 23 30 35 40 43 46 49 51 53 55 57 59 61 62 63 65 66 67 68 69 70 71 72 72 02 - 11 0 12 19 25 30 34 37 40 43 46 48 50 51 53 55 56 58 59 61 62 63 64 66 67 68 04 - 23 -12 0 08 14 19 23 26 30 33 36 38 40 42 44 46 48 49 51 53 54 56 57 58 60 61 06 - 30 -19 -4)8 0 06 11 15 19 23 26 29 31 33 36 38 40 42 44 45 47 48 50 52 53 55 56 08 - 35 -25 -14 - 06 0 05 09 13 17 20 23 25 28 30 32 35 37 38 40 42 44 45 47 49 51 52 10 - 40 -30 -19 - 11 -05 0 04 08 12 15 18 21 23 26 28 30 32 34 36 38 40 41 43 45 47 48 12 - 43 -34 -23 - 15 -09 -04 0 04 07 11 13 16 19 21 24 26 28 30 32 34 36 38 39 41 43 45 14 - 46 -37 -26 - 19 -13 -08 -04 0 03 07 10 12 15 18 20 22 25 27 29 31 33 34 36 38 40 42 16 -^t9 -40 -30 - 23 -17 -12 -07 -03 0 03 06 09 12 14 17 19 21 24 26 28 30 31 33 35 37 39 18 - 51 -^3 -33 - 26 -20 -15 -11 -07 -03 0 03 06 08 11 13 16 18 20 23 25 27 28 30 32 34 36 20 - 53 -46 -36 - 29 -23 -18 -13 -10 -06 -03 0 03 06 08 11 13 15 17 19 22 24 26 27 29 31 33 22 - 55 -48 -38 - 31 -25 -21 -16 -12 -09 -06 -03 0 03 06 08 10 12 15 17 19 21 23 25 27 29 31 24 - 57 -50 -^0 - 33 -28 -23 -19 -15 -12 -08 -06 -03 0 03 05 08 10 12 14 16 18 20 22 24 26 28 26 - 59 -51 -41 - 36 -30 -26 -21 -18 -14 -11 -08 -06 -03 0 02 05 07 09 12 14 16 18 20 22 24 26 28 - 61 -53 -44 - 38 -32 -28 -24 -20 -17 -13 -11 -08 -05 -02 0 02 04 07 09 11 13 15 17 19 21 23 30 - 62 -55 -46 - 40 -35 -30 -26 -22 -19 -16 -13 -10 -08 -05 -02 0 02 04 07 09 11 13 15 17 19 21 32 - 63 -56 -4% - 42 -37 -32 -28 -25 -21 -18 -15 -12 -10 -07 -04 -02 0 02 04 07 09 11 13 15 17 19 34 - 65 -58 -49 - 44 -38 -34 -30 -27 -24 -20 -17 -15 -12 -09 -07 -04 -02 0 02 04 06 09 11 13 15 17 36 - 66 -59 -51 - 45 -40 -36 -32 -29 -26 -23 -19 -17 -14 -12 -09 -07 -04 -02 0 02 04 06 08 11 13 15 38 - 67 -61 -53 - 47 -42 -38 -34 -31 -28 -25 -22 -19 -16 -14 -11 -09 -07 -04 -02 0 02 04 06 08 11 13 40 - 68 -62 -54 - 48 -44 -40 -36 -33 -30 -27 -24 -21 -18 -16 -13 -11 -09 -06 -04 -02 0 02 04 06 08 10 42 - 69 -63 -56 - 50 - 4Ś -41 -38 -34 -31 -28 -26 -23 -20 -18 -15 -13 -11 -09 -06 -04 -02 0 02 04 06 08 44 - 70 -64 -57 - 52 -41 - A3 -39 -36 -33 -30 -27 -25 -22 -20 -17 -15 -13 -11 -08 -06 -04 -02 0 02 04 06 Proporcja odpowiedzi zgodnych z kluczem w dolnej grupie 27% $ sO GO s 4^ ts s oo OO oo Os OC oo to 00 o * Os to o s s 2 Os to s Ul oc Ul Os Ul Ul to Ul o ? - 9 3 - 9 2 - 9 1 - 9 0 - 89 1 oo oo - 8 7 - 8 7 - 8 6 - 85 - 84 - 8 3 - 8 3 - 8 2 -82 - 8 1 - 8 0 - 79 - 7 8 -78 - 7 7 - 7 6 - 7 5 - 7 4 - 73 - 72 - 7 2 - 71 o - 9 2 - 9 1 - 9 0 - 8 8 - 8 7 - 86 - 8 5 - 8 4 - 8 3 - 82 - 81 - 8 0 - 8 0 - 7 9 -78 - 7 7 - 7 6 - 75 - 7 4 -73 - 7 3 - 7 2 - 7 1 - 7 0 - 69 - 68 - 6 7 - 6 6 8 h - 9 0 i oc oc - 8 6 - 8 4 - 83 - 8 2 - 8 1 - 8 0 - 78 - 77 - 7 6 - 7 5 - 7 4 -73 - 7 2 - 7 1 - 7 0 - 6 9 -68 - 6 7 - 6 6 - 6 4 - 6 3 - 62 - 61 - 6 0 - 5 8 t - 9 0 - 8 8 - 8 6 - 8 4 - 8 2 - 81 - 8 0 - 7 8 - 7 7 - 76 - 74 - 7 3 - 7 2 - 7 1 -70 - 6 8 - 6 7 - 6 6 - 6 5 -64 - 6 2 - 6 1 - 6 0 - 5 9 - 57 - 56 - 5 5 - 5 3 S - 8 9 - 8 7 - 8 4 - 8 2 - 81 - 79 - 7 7 - 7 6 - 7 5 - 73 - 72 - 7 0 - 6 9 - 6 8 -66 - 6 5 - 6 4 - 6 3 - 6 1 -60 - 5 9 - 5 8 - 5 6 - 5 5 - 53 - 52 - 5 1 k o 00 - 8 8 - 8 6 - 8 3 - 8 1 - 7 9 - 77 - 7 6 - 7 4 - 7 2 - 71 - 70 - 6 8 - 6 7 - 6 5 -64 - 6 3 - 6 1 - 6 0 - 5 8 -57 - 5 6 - 5 4 - 5 3 - 5 1 - 50 ^ 8 - 4 7 - 4 5 o - 8 7 - 8 5 - 8 2 - 8 0 - 7 7 - 76 - 7 3 - 7 2 - 7 0 - 69 - 67 - 6 6 - 6 4 - 6 3 -61 - 6 0 - 5 8 - 5 7 - 5 5 -54 - 5 2 - 5 1 - 1 9 OC k - 45 - 4 3 - 4 1 to - 8 7 - 8 4 - 8 1 - 7 8 - 7 6 - 74 - 7 2 - 7 0 - 6 8 - 67 - 65 - 6 3 - 6 2 - 6 0 -59 - 5 7 - 5 6 - 5 4 - 5 3 -51 - 5 0 - 1 8 - 1 7 ^ 5 - 13 ^ 12 k - 3 8 - 8 6 - 8 3 - 8 0 - 7 7 - 7 5 - 72 - 7 0 - 6 8 - 6 7 - 65 - 63 - 6 1 - 6 0 - 5 8 -57 - 5 5 - 5 3 - 5 2 o s - -49 - 4 1 ^ 5 - 4 A h k - 39 - 3 7 - 3 5 oś - 8 5 - 8 2 - 7 8 - 7 6 - 7 3 - 71 - 6 9 - 6 7 - 6 5 - 63 - 61 - 6 0 - 5 8 - 5 6 -54 - 5 3 - 5 1 - 1 9 k -41 k UJ k - 3 9 - 38 - 36 - 3 4 - 3 2 00 - 8 4 - 8 1 - 7 7 - 7 4 - 7 2 - 70 - 6 7 - 6 5 - 6 3 A s - 60 - 5 7 - 5 6 - 5 4 -52 - 5 1 - 1 9 - 4 7 - 1 6 k z v - - 4 0 - 3 9 - 3 7 - 35 - 33 - 3 1 - 2 9 8 - 8 3 - 8 0 - 7 6 - 7 3 - 7 0 - 68 - 6 6 - 6 3 - 6 1 - 60 - 57 - 5 6 - 5 4 - 5 2 -50 k - 4 7 - 1 5 ^ 1 3 zv - k - 3 8 - 3 6 - 3 4 - 33 - 31 - 2 9 - 2 7 to to - 8 3 - 8 0 - 7 5 - 7 2 - 6 9 - 67 - 6 4 - 6 2 - 6 0 - 58 - 56 - 5 4 - 5 2 - 5 0 -48 k k LO - 1 1 -39 - 3 7 - 3 6 - 3 4 - 3 2 - 30 - 28 - 2 6 - 2 4 g - 8 2 - 7 9 - 7 4 - 7 1 - 6 8 - 65 - 6 3 - 6 0 - 5 8 - 56 - 54 - 5 2 - 5 0 o o -46 k k to k - 3 9 -37 - 3 5 - 3 3 - 3 2 - 3 0 - 28 - 26 - 2 4 - 2 2 to Os - 8 2 - 7 8 - 7 3 - 7 0 k - 64 - 6 1 - 5 9 - 5 7 - 54 - 52 - 5 0 - 1 8 - 4 6 k Z V ~ - 4 0 - 3 9 - 3 7 -35 - 3 3 - 3 1 - 2 9 - 2 7 - 26 - 23 - 2 1 - 1 9 S o - 8 1 - 7 7 - 7 2 - 6 8 - 6 5 - 63 - 6 0 - 5 7 - 5 5 - 53 - 51 k - 4 6 - 1 4 zv - o v - - 3 8 - 3 7 - 3 5 -33 - 3 1 - 2 9 - 2 7 - 2 5 - 23 - 21 - 1 9 - 1 7 Ul o - 8 0 - 7 6 i - 6 7 - 6 4 - 61 - 5 8 - 5 6 - 5 3 - 51 k - 4 7 - 4 5 z v - k - 3 8 - 3 7 - 3 5 - 3 3 -31 - 2 9 - 2 7 - 2 5 - 2 3 - 21 - 19 - 1 7 - 1 5 u> to - 7 9 - 7 5 - 7 0 - 6 6 - 6 3 - 60 - 5 7 - 5 4 - 5 2 - 19 - 41 - 1 5 i UJ - 1 1 -39 - 3 7 - 3 5 - 3 3 - 3 1 -29 - 2 7 - 2 5 - 2 3 - 2 1 - 19 - 17 - 1 5 - 1 3 t - 7 8 - 7 4 - 6 9 - 6 5 - 61 - 58 - 5 5 - 5 3 - 5 0 i 00 k k - 3 9 -37 - 3 5 - 3 3 - 3 1 - 2 9 -27 - 2 5 - 2 2 - 2 1 - 1 9 - 17 - 15 - 1 3 - 1 1 Ul Os - 7 8 - 7 3 - 6 8 - 6 4 - 6 0 - 57 - 5 4 - 5 1 - 1 9 - 47 k k - 3 9 - 3 7 -35 - 3 3 - 3 1 - 2 9 - 2 7 -25 - 2 2 - 2 0 i i i i i - 0 8 u> 00 00 Os Ul UJ - - 7 7 - 7 3 - 6 7 - 6 2 - 5 9 - 56 - 5 2 - 5 0 - 1 7 - 15 - 42 - 4 0 - 3 7 - 3 5 -33 k - 2 9 - 2 7 - 2 5 -22 - 2 1 - 1 8 - 1 6 - 1 4 - 12 - 10 - 0 8 - 06 i - 7 6 - 7 2 - 6 6 - 6 1 - 5 8 - 54 - 5 1 i 00 - 4 5 k k - 3 8 - 3 6 - 3 3 -31 - 2 9 - 2 7 - 2 5 - 2 2 -20 i i i i i - 08 - 0 6 - 0 4 00 Os to o - 7 5 - 7 1 - 6 4 - 6 0 - 5 6 - 53 k - 4 7 k k - 39 - 3 6 - 3 4 - 3 2 -29 - 2 7 - 2 5 - 2 3 - 2 1 -18 - 1 6 - 1 4 - 1 2 - 1 0 - 08 - 06 - 0 4 - 0 2 * - 7 4 - 7 0 - 6 3 - 5 9 - 5 5 - 51 k OC k Z P ~ - 39 - 37 - 3 4 - 3 2 - 3 0 -27 - 2 5 - 2 3 - 2 1 i i i i - 0 8 - 06 - 04 - 0 2 o SO Os to o - 7 3 - 6 9 - 6 2 - 5 7 - 5 3 - 50 k Os k UJ k - 38 - 35 - 3 3 - 3 0 - 2 8 -26 - 2 3 - 2 1 i 1 1 i 1 - 0 8 - 0 6 - 04 s o s 00 sD Ul t o o l - 6 8 - 6 1 - 5 6 - 5 2 k oo k h - 3 9 - 36 - 33 - 3 1 o o - 2 6 -23 - 1 9 - 1 7 - 1 5 -13 1 o - 0 8 - 0 6 - 0 4 - 02 o s 2 -/o -75 -74 -73 -72 s P roporcj a odpowi edzi zgodny ch z klucze m w górnej grupie 27% 52 54 56 58 60 62 64 66 68 70 72 74 76 78 80 82 84 86 88 90 92 94 96 98 99 73 74 75 76 77 78 78 19 80 81 82 82 83 83 84 85 86 87 87 88 89 90 91 92 93 69 70 71 72 73 73 74 75 76 77 78 79 80 80 81 82 83 84 85 86 87 88 90 91 91 62 63 64 66 67 68 69 70 71 72 73 74 75 76 77 78 80 81 82 83 84 86 88 90 91 57 59 60 61 62 64 65 66 67 68 70 71 72 73 74 76 77 78 80 81 82 84 86 88 90 53 55 56 58 59 60 61 63 64 65 66 68 69 70 72 73 75 76 77 79 81 82 84 87 89 50 51 53 54 56 57 58 60 61 63 64 65 67 68 70 71 72 74 76 77 79 81 83 86 88 46 48 49 51 52 54 55 57 58 60 61 63 64 66 67 69 70 72 73 76 77 80 82 85 87 43 45 47 48 50 51 53 54 56 57 59 60 62 63 65 67 68 70 72 74 76 78 81 84 87 40 42 44 45 47 49 50 52 53 55 57 58 60 61 63 65 67 68 70 72 75 77 80 83 86 38 39 41 43 45 47 48 49 51 53 54 56 58 60 61 63 65 67 69 71 73 76 78 82 85 35 37 39 40 42 44 46 47 49 51 52 54 56 57 60 61 63 65 67 70 72 74 77 81 84 33 34 36 38 40 42 43 45 47 49 50 52 54 56 57 60 61 63 66 68 70 73 76 80 83 30 32 34 36 37 39 41 43 45 46 48 50 52 54 56 58 60 62 64 67 69 72 75 80 83 28 30 32 33 35 37 39 41 42 44 46 48 50 52 54 56 58 60 63 65 68 71 74 79 82 26 27 29 31 33 35 37 39 40 42 44 46 48 50 52 54 57 59 61 64 66 70 73 78 82 23 25 27 29 31 33 35 37 38 40 42 44 46 49 51 53 55 57 60 63 65 68 72 77 81 21 23 25 27 29 31 33 35 37 38 40 42 45 47 49 51 53 56 58 61 64 67 71 76 80 19 21 23 25 27 29 31 33 35 37 39 41 43 45 47 49 52 54 57 60 63 66 70 75 79 17 19 21 22 25 27 29 31 33 35 37 39 41 43 46 48 50 53 55 58 61 65 69 74 78 15 16 18 20 22 25 27 29 31 33 35 37 39 42 44 47 49 51 54 57 60 64 68 73 78 12 14 16 18 21 22 25 27 29 31 33 35 37 40 42 45 47 50 52 56 59 62 67 73 77 10 12 14 16 18 20 22 25 27 29 31 33 36 38 40 43 45 48 51 54 58 61 66 72 76 08 10 12 14 16 18 21 23 25 27 29 32 34 36 39 41 44 47 49 53 56 60 64 71 75 06 08 10 12 14 16 19 21 23 25 27 30 32 34 37 39 42 45 48 51 55 59 63 70 74 04 06 08 10 12 15 17 19 21 23 26 28 30 33 35 38 40 43 46 50 53 57 62 69 73 Proporcja odpowiedzi zgodnych z kluczem w dolnej grupie 27% es es —< o ON t-- f- r~- NO NO m cn es ~H ON NO NO NO NO N O VI vi cn -H m o cn —i o cn cn es -« 3 tn es oo ON 00 t> NO \Q NO *O -" O 00 NO NO VI NO NO NO W! ? — ON 00 NO S 9 K 8 O N e s o - " O es 7 Tt 00 N O c n O N e s e s — ON 7 2 2 s 8 es o oo vj cn - 0 6 — ON VI Tt cn en cn cn cn es 77 2 8 3 3 ° 3, °3^ ?77 cn o o O cn i $ oo NO cn -H oo ts es ts ts ^H Tt ^ ON NO cn es es — —? -H es O cn en oo NO es es 9\ 00 «O cn cn cn r- ^t CN ON ^o cn '—' oo ^ cn ~ ^ o o o ?{ g 22 !2 2 2 S t- - c n c n cn cn c n 00 es NO Tt es es e s O N c n CN cn s es Vj cn co ts es 00 O cn I =? 7 c n O N 7 7 r - c n t s ^ ON O t —?< cn I I 7 NO t— es cn ON i 7 cn cn i~— 7 7 7 - 5 3 f- NO Tt es ts es es ON r--es — —i v>cn —H oo NO tn o cnNOOc noo ^"-- OO° t- ON - 21 - 2 4 - 2 6 - 2 9 - 31 - 34 - 3 7 - 4 0 - 4 3 - 41 - 51 - 5 5 - 6 0 - 6 7 - 7 2 i i 1 i 1 644 Tablica ,0. WSp«raynniki * _ SD ^ ON ON ON ON ON ON 4\ Ui Ol N] OO \O -J -J -J -J -J O H- (O UJ +». Ui Ul Ul Ul Ul 4^ Ń O s] Ul — IO Ui UJ -t- OV ^ H- \D ^J ONONONONO NONV1V1V1 V1 v)vlvlvlvl UlO\vlvlOO NOO^-*-tO UJ45.UIUIO N UltOOOOON 45.tOOOOON 45.IOOOOON Ui Ui Ui UIUIUIUIUIONONONONOS U) 4^. Ui ON --J -J, oo ^o ^5 ^3 H-> to UJ ©Os 4^ tO O OO ON UJ >—' >O sj Ui W . -J 00 OO NO © H- ^slUlWi-^>JUiW >-* M3 --J Ul Ul Ui Ul Ui Ui to UJ Ui -U Ui ON U> •—' \O -sj Ul U) 3 23 UlO\^^ \O O i— ^- Ul Ui (—' \O ON ON ON ON ON ON OS ON O\ K>UJ?.UIUION -J00\© - JUIUJ"—'^O- JONJ^tO Ul Ul UlUiUiUłUlUlUlUlUlON d\ ^^ tO *** ^D ^J Uł UJ ^^ ^D vi Ui ON ON O^ O\ >— N) U) U> +». to o oo J 0 i-» O Ul Ul UlUlUlUlUtUtUlUlUlUl Q N)U^UU9]00\O ON ON ON ON Os i* Ul Ul ON -J to O oo -j ui O^ Os --J -^J -»J OO \O Q Q >—' ^ N) O ^ 00 ON ON Ul ON 4^ t>) *?* 4^ UiUiUiUlUtUiUiUiUtUl \O Q ?—'»S>tOUJ4>UiON--J-J U» Ul ON ON Os ON ON 00 v?> Q i— tO tO U) s] Ul ( |O M \O \] ON ON ON ON -J '? 00 \D Q 00 -J ON 4>. 4^ 4* 4^ -sj oo MD \O UJ to o oo Ul Ul Ul -J 00 vfl 4^. Ui ?— ON OI ON ON ON I— to UJ Ł ui Oi Ul 4i M M MD O0 -J Ul ?k4*.4> ^^-UUUlUlUlUl UlUlOs -JOO^OO1—' >—'tOUJ O \O 00 ONUiUJtOOsO-JON Ul >—' O NO -J ON ON ON ON Ł K) UJ UJ UJ — o NO Oi ON ON ON ON Ł Ui ON ~J oo vi ON UI 4* to § UlUlUl UlUt UlUlUl UlUlUl ON ON >—' Ni OO --4 ON ON ON Ul ON vi UJ tO — UlUlUlUlUlUlUlUl UJ45.UlONvlOOOONO ON ON ON ON OI — to UJ 4^ ui Ul 4i. UJ tO "- 4* 4* 4^ 4— 4— — — to UJ i^- O NO 00 ON Ui 4u 4^. 45. 45. 45. ui ui Ol v) 00 00 iO ^5 ""^ UJ Is) O NO 00 vi Ul UIUIUIUIUI UIUIUIUION ONONONONO N tOUJ45.UlU lONvlOONO O u S> U U I 45. UJ to O O O v l O N U l U J t O ? — O N O 0 0 s s ~ 4 % 45. Ul % s UlUlUl UlUlUl UlUlUl Ul ONONO NONON >— tOUJUJ4 5.UlONv lOONO Ol— ?— tO UJ IOH- ONOvlO NUl45. UJtO K- ONOOO V] Ul Ul Ul Ul Ul Ul Ul Ul Ul Ul vi oi - O IO OOvlONUl45. tO'— ONO 45.45.U1U1U1U1U1U1 U1U1 UIUIUIONON 00 ^O ^y ^"^ tO UJ ^. ui ON ON ^^ 00 ^0 ^^ ^^ 00v)^UlłiWtO»- O^ OOOO^OONUI t .^ f .^ t.j f.^ ^ .j ^^^ ^^^ »^^ 4^5> 4^ UlONvl 00 NO O — tO UJ S oooo-j oi ui 5 w M >- o 4^ 4^ Ul ON O0 vi 4i. 4^ 4^ UI UI UI Ul UI Ul UI Ul Ul Ul Ul -ooovoo^-tou>4^4^<-ft ON-JOO\O OiUi^WWW-o^OO -J-JOsUi UJ UJ WWW^*-^*>^^^ UlON --400\00>— ?— IOU>4XU| Uiiifc ^WW^O^OOOOO^ON 4*. ON U 45. 45. 45. Ul Ul Ul Ul Ul lOONOOtOUJ Ul Ul Ul Ul Ul Ul Ul Ul Ul U O i 00 O^śjÓO^^OO^WW 4^. Ui MWHO«OOOONJON Ul Ul W W 4^ W W W !jj W 41 41 4> 4^. U 4^ Ul 0\-J0000^O^WW 4^U)tO tOH-ONOOOOO^JONUi 45.45.45.45.45.45.UIUIUIUI U0^»*lOONW O\O00--4--JONUl4^UJUJ tOi— U) UJ UJ UJ UJ U) UJ UJ UJ 4^ 4^ 4^ ^. tOUJ4^. UiUlON-JOO^OO'—'tOUi to 1— o 4=» 4^- 4^ Ui Ui Ui Ui Ui Ui Ui Ui N4 00 ^O O H (O W f Ul O\ NJ VOOO- J^JONUI Ul 4^ Oi UJ tO W Uł UJ UJ UJ UJ UJ UJ UJ UJ 4^ 4^ ^ — — ro ui4^uiON-JooNOOh-tsj ONOOO 00-JO\^UI^-^WWH- 4>4>4>4^-4^4^4^4^UiUi UtUiUiUiUi u55u>(ji^oo\oo«- touJ4^uiON i-O^0000>4aO\UlA 4^U)UJtOtO 4^ 4^ 4^ 4^ 4^ ? UJ 4*- ui 00 -^ sj tO K- H! O NO Is) UJ Ui Ui U) UJ Ui 'JJ Ui UJ UJ -U 4i. \0 O >—» S>U)4^UION-~JOO\OOI—' 00 ij vi o\ 01 ui *? ? 4i. 4^ 4^. Ui Ui Ui Ui Ui Ul ON OS O ON 00 CO CO CO CO S S B CN O OO v~t CO NO W> CO CN —i O O oooooooooooooor^c^- ĆN CN CO CO CO CN CN CN CN CN CO CO CO CO CN CN CN 00 Os Os O " o * oś " 8 Os 00 NO NO m rt co CN -H ON O — — CN M O OS 00 t- NO co c4 *-< r--r--r- - oooooOQO X h vo f oo o> o\ o {O CN »i «— < CO CO CO CO s —i os CN O 1 JQ S 3 2 3 coeoeoeoeoeoco eococoeNcseNescNcses es es es ^^ o oo *o r- 05 ^t co S ~* es co Tt mcommcn 3 co es *-* o ON oo co co co co es es * CO CN CN — O OS OO OS O CN — « O * t t CO eocoeo eocoeN es escses esescs eS'-'^^ -H CO ^ CO CN ON O -—' CS CO oo oo r- *O Ti CO CO CO CO CO $ a a co co co cs eSeseN eseNes cNeSeN *^ ^ r- ON co 5- ^O ^C* r*^ 00 ON ^^ ^H ^^ co co co co co co co co cococo coeses^ H — ONOO coeses escses csescs es o es co vi v© oo ON r- oo co co co O O ON ON oo r-00 t~* >/") ^t CO CN fN CS CN CN CN O\ '—' CO \O OO ? CO CO CN ^ O 4 ^O OOOCSCOIO^O OOON-—'CS ^ś^n ^r ^^i ^^* ^r ^^r ^^i ^^« C^J c j ^ i eocoeoeo cococoeo eoeo 3 7 3 3 6 4 3 5 5 3 4 6 3 3 7 3 2 7 3 1 7 3 0 8 2 9 8 2 8 8 2 7 7 3 9 2 3 8 3 3 7 5 3 6 6 3 5 7 3 4 8 2 2 9 3 2 9 3 2 0 3 1 0 3 0 0 4 1 2 4 0 3 3 9 5 3 8 7 3 7 8 3 6 9 3 6 0 3 5 2 3 4 3 3 3 3 3 2 4 O s r M 00 CM CM rN a CO CN CN IN Os 647 8 O => S o "?J vi --J -J 00 00 Ul vi 00 NO O i— NO O i— UJ Ui ON UI ON vi 00 O i— UJ S to to t o t o t o t o t o S ^JNDOi — tO4 ^Ul ON^ J00 O\ O E vi NO> — UJ&? >.Ul ON NO 2 i S w 1— i— ON -J ON NO O Ul Ul ON 00 -o. ~J ~J t Ul » .-10$. O O O i— i— >— uJUioo otoui IO NO tO tO ?— 00 — i— tO tO tO 00 NO Q tO U> U) ON 35 i— UJ to to 4^ Ul Ui ON --J v] vi vi vi vi U> ?>. Ui ON vi NO t\> ^ UI N] vO ^ S O O O i— i— Ul ~J NO i— tO -J i— tO tO O ON -J v> vi v] vi ~J to to 8 C -J ~J ~J -J - o. W w Ul O\ s] ON 00 O tO Ul i i OtO*>.ON~J NO^- tO^UlON- jNO tOtoŁoo Ui — UiSuJ- JNOtO vj -o. -J -J --J ~J © .— UJ -t^- m ON O* 00 O to *. ON O •— UJ Ul NO UJ ON O ON -J -J O NO Q to UJ -J ND i— U> 8 ON ON ~0 ~) -J -J 00 NO O i— N> -U O tO ^ ~J NO tO s g s 28 83 NO ~J *>? O o o o So Ul i— O -^ oo O O t— s ON ON ON -»J ^J -J 00 NO O IO >— ^ ON 00 »— ON ON ON ~J -J -J O\ ~J 00 Q •— to W m 00 O UJ ON o 2 S 2 S to ON to ~j to o o o O i— UJ -t^. ON i— Ul o o ul o 00 ON NO o o Ul ~J NO UJ to u! 00 NO ON NO O O ON 00 — 00 O ON ON ON Ui ON 00 4*- -J »— ui ^i ob NO UJ ON o U l U l S 2 NO UJ 2 S *» 00 o S Ul ON ON NO 2 S ;— Ui o o ON ^ ON ON ON ON - w w m a >J to t_* oo ^- Lft oo ON ON ON ON ON i- W ^ Ul -sj ^J O W -J O O\ ON ON ON to u) 4^- O tO Ul 55 N> co o r- oo r- m m w> m '— o -H o os oo r- —i — —i —' O O r** so ID *r co CN m v~> »n NOWO coco S CO ~ CO CN oo r* ID ID oo t— NO V) ^" CO CN •—< O ON iri in m ic t N « - ??? -H ^H O O O O Q CN —< Q ON OO f- NO ^ ^ ^" CO CO CO CO s CN i—' ON oo ON 00 NO VI »n in >n »n m in in »n »o N -i -< - — o o o o o o co o) ^^ ^? ON oo t^-"^ ^f ^h ^ co co co ONr-NOTfCN ^QOOr-NO»OIOrfCOCO m^tcooł'—? ©oŃf-NOin^corN'—<© NONONONONO NO»n»o»oin»oiov^»oir) ~- ~ —* Q © o o CN ^-< 8 8 co co 8 K S? o o o CO CN ^^ rr ?* •* ID CO CN O CO CO CN CN »n TJ- co CN io in in io o o co CN - r^ *O NO CO — ^ 3 NO NO COCO CNCN -H r- i — i—' O 5 co ID ID n N M ^ H H NO io in D CO r o CM CM _ 5 9 0 o o o o o o ^_ — CN CN CM P R 1 OO sO s s CO CM SO 3 s 00 ID ID ID ID ID * ro ID CM ID o ID Os 00 s 7 3 8 7 2 7 7 1 6 7 0 5 6 9 4 6 8 3 6 7 3 6 6 2 6 5 2 6 4 1 6 3 1 6 2 0 6 1 0 6 0 0 5 9 0 5 8 0 5 7 0 5 6 0 5 5 0 5 4 0 5 3 1 5 2 1 5 1 1 CN CM O Os 4 8 2 4 7 3 7 4 7 7 3 6 7 2 5 7 1 4 7 0 4 6 9 3 6 8 2 6 7 2 6 6 1 6 5 1 6 4 1 6 3 0 6 2 0 6 1 0 6 0 0 5 9 0 1 58 0 5 7 0 5 6 0 [ 5 5 1 5 4 1 5 3 1 5 2 2 CN CO ID ID 4 9 3 | 4 8 3 5 CO CM 8 Os o o r - sO ID • r o CN _ o OS o c SO r o CM M O OS CC a s Os Ó s 00 c c c c o c OO 00 c c OO OC 00 r - r- . r- SO 649 4-* 4^ 4- 4-» 4- - w u 5 ui ON ON ON UJ i- Ul tOtOlOtOtOtOtOtOUJ Ul UJ UJ UJ UJ UlUJ4^UlONvlOONOO *- tO UJ -fc- Ul UJ UJ UJ s) 00 ^O )— O O 4- 4-- •— to CC -J 4i -t- +* Ui ON vi Ui Ui 4> tototototototototo UJUJUJUJUJUJUJUJUJUJ ON OS ON O^ L/i L/i 4^ 4^ 4^ UJ UJ tO *•* ^^ ^^ CT*? ^Q 00 00 UJUJUJ tOUJUJ UJ 00 O\ UJ UJ UJ UJ UJ — torotototototoro K>N)U>UJUJUJUJUJUJU> VO O •—' W W Ji Ul O\ 'J OO^OOH[OW^UIO\ UJ UJ 00 SD L/t 4^ to to to to to S O\ -J 00 \Q \O ^O 00 00 to to to O0 00 sj UJ UJ UJ UJ UJ «- K> UJ 4> L/l -J -J ON OŃ LA UJ UJ UJ M M w O\ Ul Lft UJ Ul 4- UJ UJ 00 NO UJ tO to to to to to touJUJUJUJ 0OSJUJ UJ UJ UJ Ui ON UJ UJ UJ UJ vi 00 to to ______ to toto tOtOfOlOlOtOtOUJUJUJ 4^ Ul ON vi 00 NO O "~ NJ UJ 41 Ul ON ^ 00 NO O — tO 00 00 00 00 00 ~^J ^-] ^*J ^O ON ON ON Ul ^-/t '—'i 4-^ 4-* 4-* UJ UJ UJ to to to to UJ UJ UJ UJ UJ UJ 4- to to UJ UJ UJ UJ UJ Ul ON vi 00 \Q tototo tototo tototo uj i— tOUJ4 >UiO\- J00\0O ui L/I 4- 4- 4- UJ UJ r-o ro to UJ UJ UJ UJ 4^ L/l ON -J H- ^- N-t O M u M ^o o *- 4i. UJ UJ t o W 4i Ul C ^ vi 00 NO Ul Ul Ul Ul 1. t\ Ul Ul 4^ A s] Q0 H 4- 4^ 2 >— to UJ t 4^ ^ UJ UJ UJ UJ UJ UJ — IOUJ*>.UION _ »~ H~ » oo to to tOtOtOtOtOtOtOtOtO tO UJUJUJUJUJUJUJ t o UJ t o to to UJ Ul UJ U J U l t o ON to vi IO 00 o t o g Q 4^ 00O OtO UJUl UJUJUJ tOSJtO NJtO to to UJ UJ UJ UJ oo NO o *- to UJ H- H' k- O O O vi OO NO O — OOOO tOU4UlON lOO UJUJUJUJUJUJUJUJUJ UJtOtO to to to to o ?-* to UJ S S 8 3 tO N) tO IO tO UJ UJ UJ UJ SS85 UIONV10O8O»- tOUJ J>Ul5Ń _tototototototo»- ___ to to to to vi 00 NO O — tO UJ S 8 o ? S $ S So Ul ON vi O0 to to to to s M M W 885 ONvlOONOO^- tO UJ J> Ul O- vi M W NJtOtOtOtOt OtOtO 8 gŚS ^S tototototototobo o o o 8 2 a § 1 s S8S tM _ ,H „ o 8 3 8 S S m CJ v i v j «* j "^r ^ T) r* J tN ^^ O ON OO t*1"" Mp *Ó ^" Cl CS *•?* <3 T^ ^^ »"H ^^ <^^ ^^i ^^ f^i (^^ ^S g^^ ^^i <^^ ^^ l^} ^^ ^CJ ł^ ^^ O\ QQ ^^p ^O 4^1 Tf C**l eS *^ c^i oo r**"* vo ^^i ^^ co es *^H ^^ QN C*^ ^p ^*) ^f co es ^*^ ^^ ^^ ^^ ^™< ^H ^^ ^^ ł^H ^H <^5 ^^^ ^^ ^^ <^^ ^^ <^^ f^^ ^^i ^^^i ^^r ^r ^^" ^T c^^ c^^ e^^ T^"H ^^^ [j"\ ^Q ^^^ ^^^ ^^r e^ł ^j^ oo r^^ \^jj ^^^ ^^* c^j e^ł ^"^ * j fj% oo ^^? i^ j ^y c^^ e*N ^™^ ^ ^ ^^ F*H ^M ^H ^^ ł^H ^H ^^ ^^ ^^ ^^ f^^ ^^ f^S ^^) ^^ ^} ^^\ oo j1"^ V^*J ^^^ ^^r (^i e^ł ^m^ ~~j - ^j^ oo ^^^ ^* j ^y c^^ e^^ ^^ (i ^ _^„„„ — „„_„ oooooooo 30 oo oo oo oo oo oo r^^ ^^^ ^f^ ^^^ ^^^ ^^^ c^^ ^^ ^|^ oo ^^^ ^^^ e^^ r^ t"i ^^ QO r^* ^D ^^ ^^ co es ^^ ^^ os oo r***^ ^D ^f co es ^^ c? CM CM — -^—<-H — -->—< — ^ — OOOOOOOO ^^ Os oo r*^ ^D ^o ^^ co es ^^ ^^ ^^ oo t*'1** ^o ^*i ^^* co es ^^ c^ co co co co co co co co co co es es es es es es es es es es 3 S r- co ?* co 651 NO NO J> Ul OO NO 4^.4>4^ 4>4^4^. LALA UJ4^LA ON-- 4000^- H- N> UJ Ul ON OO © Ni LA LA LA LA LA Ui 4^ ON -J OO ON v© w 4^ ~J 4^ 4^. 4^ 4^. LA LA ON -J NO O ON --J NO >-> Ui a LA LA LA LA LA LA W g U, ON -J 4 4 4 ^- tO UJ Ni UJ LA Ul Ul Ul i- U f NO to J>. UJ Ui UJ Ui UJ O H- tO UJ 4*. Ui 4^ 4^ LA ON tO Ui UJ UJ UJ vO Q i— to Ui UJ 4^ LA LA ON 3 UJ ON xc Ui 4> NO O O •—' t t. ^ t *. 5 Ul -J OO NO UJ Ul ^1 00 O tO J> J> J> Ji J> IO UJ -U OS oi oo M> H. Ul Ul Ul Ul ON Ul - *J 00 NO *"* -j o - U - o « Ul Ul Ul Ul Ul Ul Ul « to u> J> ON -J oo O UJ ON NO tO ON *O u> u> UJ UJ J> ON 00 NO O UJ Ul o to UJ u> u> VO O ?— IO J> Ul ON ~-l U) to 00 IOU)U> X©©>— 100NO UJ U> -J 00 i— IO UJ UJ ON -O. — UJ Ui UJ LA ON to ?. 5 -J J> ?&. J> Ul ^ CO U) ? J> -fe. J> .fe. ? \O o — UJ J> Ul ON ON 00 NO ~ UJ ON 00 5 Ui Ui UJ LALALALAL ALALALA Oi—? Ni 4i. LA ON 00 NO (O J> ^1 - łi vj — 'ji LA LA LA LA -J O0 NO UJ -J LA LA LA O t— UJ ON NO tO 4^ LA LA LA LA NO •—' tO Ui. LA -J O 4^. --4 i—» o i O0 O UJ ON 4^ LA LA LA LA LA LA 00 O •— tO 4*. LA -J *O N> LA v?) Ui -0 H- tOtOtOIOtOU)UJUJ J^UOlOOOtO Ui Ui UJ Ui Ui 4^. LA ON Ui LA ON O0 4*. LA 4^ 4^ LA LA LA LA LA vO O Ni UJ 4^. ON Ui -J — LA NO Ui o ? Ui UJUiUJ UiUiUi Ui4>-|^ tOUi4^ LA- JOO\© ONi 4^4^4^, 4^.LALA LALA 'JI ^1 X C - N) - U 'N/I 00 H Ul 00 N) O\ •- LA N> NJ tO łO N> UJ 4^- <-A ON 00 NO O tO U) ^ 6 ->J CO \Q O\vl00\00-W^ ui Ui UJ ui UJ UJ UJ ui -^ 4^ M-tOUJLAON- JOO^O'—'tO 4^ON00ON)4^0N00 — 4i. UJ UJ UJ UJ UJ UJ UJ 4^ 4^. HK)^UIÓ\- VJ00O|-' - JO0OtO4^.-- Jv©tOLA 4^ to -U 4- 4- LA ON -J O UJ ON 4^ LA ON Ul Ul Ul Ul 2 00 tO ^ Ul Ul Ul *- to UJ O -fe. NO tO tO tO tO Ni Ni Ni ^J 00 NO O *- Ui 4^ 4^ Ł Ji Ji UJ J> Ul -J tO Ul NO UJ O 4^ ?^J ^O tO LA 00 N- i— tOlONitOtONltO NOO^-N>4^LAON-J 0>--J00\0ON>UJ4^. OONOO^— UJ4^.LAON ON-- J00NO'—'NJUJLA to to UJ UJ UJ UJ UJ UJ UJ UJ 00 NO ^~* NJ Ui 4^ Ul "-J 00 NO ONOOONJ4i.ONOO' — 4^-J NJ tO UJ UJ UJ UJ UJ UJ UJ UJ -JOOO^- NiUi^ON-JOO ON 00 O N> 4i. 4^ 4^ 4^. O0 tO ON -fc. J> ^1 NO NO UJ 4i. 4^ O Ul Ui Ul o ui i-* •—i i— Ni N> N> N> NJ to ON ?— H M w K) ^ fj [O ON -J 0© Q >—' N> Ui * •O 00 NO O •—' NJ *" \O O ^- ON N> O •— UJ Ui UJ ON -J ON NO N> N) NJ UJ UJ UJ ON ^J N© O ?— N> -J VO ^- Ui LA -4 tO tO tO N> UJ UJ UJ UJ UJ UJ LAONOONDO^^UJ^ LA-J -JNOI—'UiONOOi— UiONO Ui UJ Ui UJ Ni UJ 4i- ON W ji sj O NiNJNiNiNJNiUJU iUJUi UJLAON- 400N0'— NiUJLA OOONi4>'ONvOtOLA OO>— a LA NO UJ J> NO H- --J O U) J> 00 O 00 K) Ui Ui J> "— U) ON O 6 ON ~1 IO -J -U 4i Ui ON UJ 00 Ul 4 9 2 5 0 7 4 8 3 4 9 9 4 7 5 4 9 1 J> J> 3 23 _ — — to -J 00 NO O O •—' UJ LA NJ tO NJ NJ tO tO UJ UJ UJ UJ Ni4^U»O N-- JłOQi— 'Ni-^- OOONJ4 ^-- JONJUiN ONi Ui Ui UJ J> NO — 00 UJ &o UJ J> J> Ul -J NO Ul § 8 3 8 1 i ° oj -H —, — o O ^ Vi ^" ^ O C co o) —"OO^odr^^io^-moJ •—•o ^^ ^-HOOOOOOOO O ^^ c^ o^ oł ^i ^^ ^~* ^^ ^ _i'j ^^ ^^> Tf- *owi"^-cool-H©o\ooc^ O ^5 O »O Tf ro O O O O ^^«« OOOOO ^HOCtOO ^'Ol/I^CO - H-HOO OOOOO o o o O\ 00 o o o "O O o O o -H O O oooo oo ^^ oo "J Ol Ol ?3 fM Ol Ot » o s §1 ( N — — — - H O O > ? > v > 1 - c i < N — i o i _H _ « — -H O OO t--»oi/- )tm(M — O «««^ QO OOOO OO oo r- ~to>o^c o oi-- ooŃoor^ «__rt — ^ „ ^ -H O O O o o S o o o s s o o Ol Ol Ol Ol Ol Ól -H r-. -H O O O V D U l O O O O m (S —< o o o O s o o g O (N CM ul *t m w H o oo — o O o o S g 2 5 a „ „ ^ ^ Q ^J- co ol -H o Ol Ol Ol Ol Ol —• O O W N "-1 M M CS 3 "o T ci rt rn o O O O O O O O 1^ vo m TT co o) — i i o s o o (NJ ^H r~> —I —. Ol Ol Ol Ol Ol 2 g " co ° m ol •"-" S N N (S M M 0 o o Cl M H 01 Ol O) 8 R S o o o o\ oo r- o o o o »n TJ co ol o o -i O S R o o -H o to to O Ot 00 to 653 ON© LO LO UO i—' LO Ul ^D *>? O N^tOLOLOLOLOUOLO OtO^U]O t-O t J to tOtOU>U)U> W^W <100Q U> HMHMMMtOtJ tOtOtOtOLOLOLOLOLOL04^ H^ LO 4^ tjf^ ^^J OO r'' j ^^ t'J 4^ t^^\ ^ ^ y^^ ? ^^ ^^^ f*|^ 00 '' *^ ^-^^-^-^ H-^-IO tOtOtOtOtOU>LOLOLOLOLO O — ^- — — — — — tOtOtOtOtOtOLOLOLOLOLO OO^Ot—tOLOUlONOO ^O^^tO^ONOO^Ot—i w Ui sj SC — — _ — _ — ^^tOtOtOtOtOtOLOLOLOLO 35 © ?— (O 4^ Ul »J 00©i—'LOUi^J00©tO4^ON LO OOO©'-1'—'•—'>— •—'"—'"— tOtOtOtOtOLOLOUi OO©©©«—>i—'H- i—»ł—'i— tOlOtOtOtOtOLOLO 00 ^i^— ^P^ 00 ^ij ^^^ i Ł ^^ ^^ 00 L/l ^^^ i^^^ 00 ^^J ^w.,1 00 * t - ^ t ^ oocooooooooocooo o \o łOLO^UiON-JOO^O ©i—' NitOtOtOtOLOLOLO L 4^UION00*O©I—'LO -j WUl-JOWO\^W ó\ O totototototoLou> w w W^Uis]00\O^tO LOUi tO tO LO (OtONłtONitOtOLO tOLOU0J\00 N> tO tO tO tO tO tO i—* (sj 4^. Ul O\ GO vO tO tO tO tO LO '00 \O •—' Ui OO M ^ sj M U) ^©>— LO4>Ul-Jwu LOUtCOH-^OOH-Ul — — ro to [O to to to (O OO^CtOLO^ON-J NO tOUtOO'— ^ OO •-'Ul © — — ro to to to -O. 0O \Q i— tO LO Ul N) Ul X >- 4^ 00 M — — — t J * 8 -O 00 © i—» LO Ul Ui \O 4^- O Ui © uiO ONH-ONtO-JLO©-O LO LO t>J LO -P^ 4i- 4^ |^ LOLOLOLO4^4^4^4^ LOUIONOO©*—'LOUI COL0004i.©ONLO^- LO LO LO -t» ^ J^ 4^ L/1 '•^J ^O ^^ tO p-- (^ ^O Ui i—' 00 Ul (O »—• LO LO 4^ oo \o ^- tO vo O\ I U>U>U>4^-^- OV00VOU) LO '-*J LO LO LO 4^. 4^ tO LO Ul --0 ^D © tO tO 00 Ul LO H- \O 00 s ? i o 6 o 0 2 0 0 3 0 f O 4 1 i o 0 1 0 0 2 0 0 3 0 -U to c 0 1 0 0 2 0 Co o 0 1 0 i o a S * co a 1 Ul o Ul Ul LA to Ul LO LA LO Ul Ul LA Ut Ul o\ Uł O\ Ul Ul Ul 00 Ul oo Ul vo Ul a 2 <=> i O O o 3S S 2 O o §3 lig 3 3 3 s « 5 m M « O O O O O ON 00 O O O g o oo o o TJ- co «—. 8 S 5 1- to M N N) S) W L>\ NC |J (> C |i \C ^ OONWOOO-^JCTN^OO OOOOOO O1—' MHi-Mi-iKJWtJto ^ ^ j ?? ^ ^.^ f j ^ [ ^f^ ^^^ OO y^^ ^"^ t"^^ ^^^ ^^^ "'"J ^^5 ^^* f^^ f^^ — l j U)O\\OW- JNJ-JN) OO^t—'00-^J«-AL/iOS--J OOOO OOO MMk-MN-wiotOW OJ -J O '-'i sD -t- ^O LAtOSJN> O ^ tO ^ Ol >J 00 O^^WL/i —] \O ^^ V>) <./! UJ -J >—• CTN H-» ^ tO^O^-^SlbOtOUON OO OO O O^-^-^-H-K-K>ION) O^-*bJ- ^t-/i—J OOO^-^-^^ONi-f^ łi OC W X W ^O O\ ^ i-'O^OONJUt r^^N. ^^ł ^^ ^^ <^i ^^ ^i— — t*^ i-^— —^ ^J ^J O i~~ tO -ti '- -/i -~j O — tO -t^ ON 00 — '-»-> 4^- ^C 4^ - O ONKJOOO--J-^JOOOI>J O O O OOO«—1^-k|—?^-*|—'to O "—> UJ ^ ^-J^Oi—' U ^OOQ^--^ONOOO ł J \ " ^ - ^ J - ^ N ł O ^ O O | " — ^ ^ O O O O Q O ^ — ^ - H - N - H - O ^ ^ O J ? & ^ ^ 0 0 ^ 5 t O ^ " ^ J ^ O O N t o ^ o s i u i w y i ^ H o s OOOOO>—ti— '»—*^- O ł - W U i N j ^ h - W W i O O O N U J N - O O * — ' U J - J U J NO l , O O O O — " O >— W Ul ~J O tO 00 ~J ~J OO ?- ON O O O O "-O — LO ON 00 g o o to to a s i Tablica lla. Wartości krytyczne S współczynnika zgodności W Kendalla a = 0,05 Tablica 11 b. Wartości krytyczne S współczynnika zgodności W Kendalla a = 0,01 N 3 4 5 6 7 3 4 5 6 7 3 64,4 103,9 157,3 3 75,6 122,8 185,6 4 49,5 84,4 143,3 217,0 4 61,4 109,3 176,2 265,0 5 62,6 112,3 182,4 276,2 5 80,5 142,8 229,4 343,8 6 75,7 136,1 221,4 335,2 6 99,5 171,1 282,4 422,6 8 48,1 101,7 183,7 299,0 453,1 8 66,8 137,4 242,7 388,3 579,9 9 54,0 — — — — 9 75,9 — — — — 10 60,0 127,8 231,2 376,7 571,0 10 85,1 175,3 309,1 494,0 737,0 12 71,9 — — — — 12 103,5 — — — — 14 83,8 — — — — 14 121,9 — — — — 15 89,8 192,9 349,8 570,5 864,9 15 131,0 269,8 475,2 758,2 1129,5 16 95,8 — — — — 16 140,2 — — — — 18 107,7 — — — — 18 158,6 — — — — 20 119,7 258,0 468,5 764,4 1158,7 20 177,0 364,2 641,2 1022,2 1521,9 - ? 42 — Metodologia badań.. Literatura ? Abell P. (1975). Modele w socjologii , Warszaw a, PWN. Ackoff R. L. (1969), Decyzje optymaln e w badaniac h stosowan ych, Warszaw a, PWN. Adler T. (1993), APA, two other groups to revise test standards , "The APA Monitor", 24 (9), 24-25. Adorno T. W., Frenkel- Brunswik E., Levinson D. J., Sanford R. N. (1950), The authorito rian perso- nali ty, New York, Norton Library. Adorno T. W., Frenkel- Brunswik E., Levinson D. J., Sanford R. N. (1969), The authorito rian perso- nali ty, Ne w Yor k, Nor ton Libr ary. Aebli H. (1982), Dydaktyk a psycholog iczna (wyd. 2.), Warszaw a, PWN. Aiken L. R. (1974), Some simple computati onal formulas for multiple regressio n, „Educatio nal and Psy chologica l Measure ment", 34, 767- 769. Aiken L. S. West S. G. (1991), Multiple regressio n: Testing and interpreti ng interactio ns, Newbury Par k, CA, Sag ę Ajdukiew icz K. (1965), Logika pragmaty czna, Warszaw a, PWN. Alwin D. F. (1974), Approach es to the interpreta ńon of relationshi ps in the mulritrait- mulńmeth od matrix, w: H. L. Cost ner (red. ), Soci olog ical met hod olog y 197 3- 197 4 (s. 106- 127) , San Fran cisc o: Jose y- - Bass. American Psycholo gical Associati on (1973), Ethical principles in the conduct of research with human part icip ants, Was hing ton. DC, Aut hor. American Psycholo gical Associati on, APA (1992), Ethical principles of psycholog ist and code of conduct, .America n Psycholo gist", 47, 1597- 1611. American Psycholo gical Associati on, APA (1985a), Standard y dla testów stosowan ych w psycholog i i pedagogi ce („Bibliote ka Psycholo ga Praktyka" , T. I.), Warszaw a, Poi. Tow. Psychol. American Psycholo gical Associati on, APA (1985b), Standards for education al and psycholog ical te stin g, (wyd. 4.) Washingt on, DC, APA. American Psycholo gical Associati on, APA (1994), Publicatio n manuał of the American psycholog ica Ass ocia tion (wy d. 4.), Was hing ton, DC, Aut hor. American Psycholo gist (1965), Special issue: Testing and public policy, 20, No.ll. Amsterda mski S. (1983a), Między historią a metodą, Warszaw a, PIW. Amsterda mski S. (1983b), Nauka a porządek świata, Warszaw a, PWN. Kwas.\as\ K.. ^.V)%1), Psycholog ical testing (wyd. 5.\ New YOIVL, Macmitta n. Anderson G. L. (1971), Istota i metody psycholog ii wychowa wczej, w. Ch. B. SVinnet (te&.\ Ps>cVi log ia wychow awcza (s. 11- 47), Warsza wa, PWN. Angoff W. H. (1988), Validity: An evolving concept, w: H. Wainer, H. I. Braun (red.), Test valid (s. 19-32). ffillsdal e, NJ, L. Erlbau m. Aranow ska E. (1987), Element y zastoso wań modelu wielowy miarowe j analizy wariancj i (MANO YA) 658 badaniach psychologicznych, w: J. Brzeziński (red.), Wielozmiennowe modele statystyczne w ba- daniach psychologicznych (s. 115-151), Warszawa-Poznań, PWN. Aronson E. (1995), Człowiek istota społeczna, Warszawa, Wyd. Nauk. PWN. Aronson E., Carlsmith J. M. (1968), Experimentation in social psychology, w: G. Lindzey, E. Aronson (red.), The handbook of social psychology, t. 2 (s. 1-79). Reading,MA, Addison-Wesley. Aronson E., Wilson T. D., Akert R. M. (1994), Social psychology. The heart and the mind, New York, Harper Collins. Arystoteles (1956), Etyka Nikomachejska, Warszawa, PWN. Arystoteles (1983), Metafizyka, Warszawa, PWN. Asch S. E. (1952), Social psychology, New York, Prentice-Hall. Asch S. E. (1969), Opinie i nacisk społeczny, w: K. Jankowski (red.), Środowisko a życie psychiczne (s. 288-302), Warszawa, PWN. E. Y. (1993), Pygmalion — 25 years after interpersonal expectations in the classroom, w: P. D. Blanek (red.), (1993), Interpersonal expectations. Theory, research, and applications (s. 125-153). Cambridge, Cambridge University Press. Babad E. Y., Inbar J., Rosenthal R. (1982), Pygmalion, Galatea, and the Golem: Investigations of biased and unbiased teachers, .Journal of Educational Psychology", 74, 459-474. Bakan D. (1966), The test of significance in psychological research, „Psychological Bulletin", 66, 423-437. Bandura A., Walters R. H. (1968), Agresja w okresie dorastania. Warszawa, PWN. Bańka A. (1994), Wiarygodność i odpowiedzialność etyczna psychologa jako eksperta, w: J. Brzeziński, W. Poznaniak (red.), Etyczne problemy działalności badawczej i praktycznej psychologów (s. 185-196), Poznań, Wyd. Fundacji Humaniora. Barber T. X. (1976), Pitfalls in human research: Ten pivotal points, New York, Pergamon Press. Barber T. X. (1991), Pułapki w badanich: dziewięć rodzajów wpływów związanych z osobami badacza i eksperymentatora, w: J. Brzeziński, J. Siuta (red.), Społeczny kontekst badań psychologicznych i pedagogicznych. Wybór tekstów (s. 399-431), Poznań, Wyd. Nauk. UAM. Barber T. X., Silver M. (1968), Fact, fietion, and the experimenter bias effect, „Psychological Bulletin, Monograph Supplement", 70 (nr 6, cz. 2), 1-29. Bartlett M. S. (1947), The use of transformations, „Biometrics," i, 39-52. Bartnik C. S. (1994), Hermeneutyka personalistyczna, Lublin, Katolicki Uniwesytet Lubelski. Basu D. (1980), Randomization analysis of experimental data: The Fisher randomization test (with discussion), .Journal of the American Statistical Association", 75, 575-595. Batog T. (1994), Podstawy logiki, Poznań, Wyd. Nauk. UAM. Bechtoldt H. P. (1959), Construct validity: A critiąue, „American Psychologist", 14, 619-629. Bechtoldt H. P. (1968), Teoretyczne podstawy metod testowych: trafność i prognoza, w: M. Choyno- wski (red.), „Biuletyn Psychometryczny", T. II (s. 7^f9). Wrocław, Ossolineum. Bell C. R. (1962), Personality characteristics of volunteers for psychological studies, „British Journal of Social and Clinical Psychology", 1, 81-95. Belnap (1963), An analysis of ąuestions; Preliminary report, California. Bentler T. M. (1985), Theory and implementation of EQS: A structural eąuation program, Los Ange- les,CA, BMDP Statistical Software. Bernard J. (1994), Od biologii do etyki. Nowe horyzonty wiedzy, nowe obowiązki człowieka, Warszawa, Wyd. Nauk. PWN. Berry J. (1969), On cross-cultural comparability, „International Journal of Psychology", 4, 199— -128. Berry J. (1980), Introduction to methodology, w: H. C. Triandis, J. W. Berry (red.), Handbook of cross-cultural psychology, t. 2, Methodology (s. 1-28), Boston, Allyn, Bacon. Berry J. W., Poortinga Y. H., Segall M. H., Dasen P. R. (1992), Cross-cultural psychology: Research and applications, Cambridge, Cambridge Univerity Press. Berscheid E., Baron R. S., Dermer M., Lebman M. (1973), Anticipating informal consent: An empirical approach „American Psychologist", 28, 913-925. Beveridge W. J. B. (1963), Sztuka badań naukowych, Warszawa, PZWL. Bielą A. (1992), Skalowanie wielowymiarowe jako metoda badań naukowych, Lublin, Tow. Nauk. KUL. 659 Bielą A. (19 95), Skal owa nie wiel owy mia row e w ana liza ch eko nom iczn ych i beh awi oral nyc h, Lub lin Nor berti num . Blalock H. M. (1975), Statystyk a dla socjologó w. Warszaw a, PWN. Blan e k P . D . ( E d . ) ( 1 9 9 3 ) , I n t e r p e r s o n a l e x p e c t a t i o n s . T h e o r y , r e s e a r c h , a n d a p p l i c a t i o n s , C a m b r i C a m b r i d g e U n i v e r s i t y P r e s s . Bohm D. (1961), Przyczyn owość i przypade k w fizyce współcze snej, Warszaw a, KiW. Bore n s t e i n M . , C o h e n J . ( 1 9 8 8 ) , S t a t i s t i c a l p o w e r a n a l y s i s : A c o m p u t e r p r o g r a m , H i l s d a l e , L . E r l b a u m . Bortz J. (1984), Lehrbuch der empirisch en Forschun g, Berlin, Springer- Verlag Boruch R. F., La rk in J. D. , W oli ns L. , M ac Ki nn ey A. C. (1 97 0), Al te rn ati ve m et ho ds of an al ys is: M ult itr ait - m ult im et ho d da ta, .. E du ca tio na l an d Ps yc ho lo gi ca l M ea su re m en t", 30 , 83 3- 85 3. Box G. E. P. (19 50), Pro ble ms in the ana lysi s of gro wth and wea r cur ves, ,3io met rics ", 6, 36 - 389 . Brehm J. W., Cohen A. R. (1962), Explorati ons in cognitive dissonan ce, New York, J. Wiley. Brishlin R. W. (1 97 6), Co m pa rat ive res ea rc h me th od ol og y: Cr os s- cul tur al stu die s, „I nte rn ati on al Jo ur- na l of Ps yc ho lo gy ", 11 , 21 5- 22 9. Brogden H. E. (1 94 6), Va ria tio n in tes t val idi ty wi th va ria tio n in the dis tri bu tio n of ite m dif fic ult ies , nu m be r of ite ms , an d de gr ee of th eir int er co rr el ati on , „P sy ch o m etr ik a", 11 , 19 7- 21 4. Brophy J. E. (19 83) , Re sea rch on the sel f- fulf illi ng pr op he cy an d tea ch er ex pe cta tio n, ,Jo urn al of Ed uc ati on al Ps yc hol og y", 75, 63 1- 66 1. Brophy J. E. (19 85) , Te ac her - stu de nt int era cti on, w: J. Du sek (re d.), „T eac her ex pe cta nci es" (s. 30 3-- 32 8). Hil lsd ale , NJ , L. Erl ba um . Brzezińs ka A. (19 94) , Ks zta łce nie psy ch olo gó w: pyt ani a o rel acj ę na ucz ani a i jej wy mi ar ety czn y, w: J. Br zez ińs ki, W. Po zn ani ak (re d.), Ety czn e pr obl em y dzi ała lno ści ba da wc zej i pr akt ycz nej psy ch olo gó w (s. 24 1- 26 8), Po zn ań, W yd. Fu nd acj i Hu ma nio ra. Brzezińs ka A., Ko fta M. (19 74) , Sta bili ty of self - im ag e, tol era nce to str es, an d aw cie ty, „P oli sh Ps y- ch olo gic al Bu llet in" , 5, 3- 10. Brzezińsk i J. (1975a), Metody badań pschologi cznych w zarysie, Poznań, Wyd. Nauk. UAM. Brzezińs ki J. (19 75 b), Eks per ym ent aln a kon trol a sku tec zno ści zab ieg ów psy cho kor ekc yjn ych , „Pr zeg ląd Ps yc hol ogi czn y", 18 (4) , 55 7- 56 5. Brzezińs ki J. (19 76) , Str ukt ura pro ces u ba da wc zeg o w na uk ac h be ha wi ora lny ch, Wa rsz aw a- Po zna ń, P W N. Brzezińsk i J. (1978a), Elementy metodolo gii badań psycholog icznych, Warszaw a, Wyd. Nauk. PWN. Brzezińs ki J. (19 78 b), Me tod olo gic zne i psy cho log icz ne wy zna czn iki pro ces u ba da wc zeg o w psy cho lo- gii, Po zna ń, W yd. Na uk. U A M. Brzezińs ki J. (19 83) , Wa rto ść eks per ym ent u pat ops ych olo gic zne go dla dia gn ost yki psy ch olo gic zne j, w: W. J. Pal uch ow ski (re d.), Z zag ad nie ń dia gn ost yki oso bo wo ści (s. 93- 10 6), Wr ocł aw, Os so- line um . Brzezińs ki J. (re d.)( 19 84a ), Wy bra ne zag ad nie nia z psy cho met rii i dia gn ost yki psy cho log icz nej , Po- zna ń, W yd. Na uk. U A M Brzezińs ki J. (19 84b ), Ba dan ie test u psy cho met ryc zne go met odą ana lizy wa ria ncji , w: J. Brz ezi ńsk i (re d.), Wy bra ne zag adn ieni a z psy cho met rii i dia gno styk i psy cho log icz nej (s. 9- 45) , Poz nań , Wy d. Na uk. UA M. Brzezińs ki J. (19 85a ), Lin iow y mo del kor ela cyj no- reg res yjn y w bad ani ach psy cho logi czn ych . Wy bra ne zag adn ieni a, w: E. Pas zki ewi cz, T. Szu stro wa (re d.), Ma teri ały do nau cza nia psy cho logi i, seri a III, t. 4 (s. 9- 38) , Wa rsz aw a, Wy d. Na uk. P W N. Brzezińs ki J. (19 85 b), Oc ena efe ktu eks per ym ent aln ego w ukł ad ach eks per ym ent aln ych an aliz y wa ria n- cji, w: E. Pas zki ew icz, T. Sz ust ro wa (re d.), Ma teri ały do na ucz ani a psy ch olo gii, ser ia III, t. 4. (s. 89- 99) , Wa rsz aw a, W yd. Na uk. P W N. Brzezińs ki J. (19 85c ), Zas ady stat yst ycz neg o opr aco wa nia dan ych w psy cho log ii kli nic zne j, w: B. Wa - lig óra (re d.), Ele me nty psy ch olo gii kli nic zne j (s. 10 7- 16 0), Po zna ń, W yd. Na uk. U A M. Brzezińs ki J. (19 85 d), Me tod olo gic zny pro gra m psy ch olo gii int era kcy jne j, „R ocz nik i Fil oz ofi czn e", t. X X XII I, z. 4: Ps ych olo gia , 53- 66. Brzezińsk i 3. (Ed.) (1987a), Wielozm iennowe modele statystyc zne w badaniac h psycholo gicznych , War- szawa, PWN. Brzezińs ki J. (1987b), Zmienne jakościo we w psycholo gicznych zastoso waniach modelu wielokro tnej 660 regresji liniowej, w: J. Brzeziński (red.), Wielozmiennowe modele statystyczne w badaniach psy- chologicznych (s. 12-81). Warszawa, Wyd. Nauk. PWN. Brzeziński J. (red.) (1988), Problemy teorii, rzetelności, konstrukcji i analizy wyników testów psycholo- gicznych (,,$%YioteYa Psychologa Praktyka", t. U), Warszawa, Wyd. Poi. Tow. Psychol. Brzeziński J. (1989a), O związkach teorii z praktyką społeczną. Na przykładzie związków teorii psy- chologicznych z praktyką społeczną, w: J. Brzeziński, K. Łastowski (red.), Filozoficzne i meto- dologiczne podstawy teorii naukowych (s. 287-305)(„Poznańskie Studia z Filozofii Nauki", t. 11), Warszawa-Poznań, PWN. Brzeziński J. (1989b), Eksperymentalne badanie zmian — metodologiczne problemy stosowania prete- stii zmiennej zależnej, „Przegląd Socjologiczny", 37, 113-139. Brzeziński J. (1990), O adaptacji kulturowej testów psychologicznych, w: A. Ciechanowicz (red.) Kul- turowa adaptacja testów (s. 185-202), Warszawa, Poi. Tow. Psychol.; Lab. Technik Diagn. Brzeziński J. (1991), Zewnętrzne i wewnętrzne uwarunkowania procesu badawczego w psychologii, „Przegląd Psychologiczny", 34 (2), 329-364. Brzeziński J. (1993a), Standardowe skale wyników WAIS-R: skala dewiacyjnych ilorazów inteligencji i skala wyników przeliczonych, w: J. Brzeziński, E. Hornowska (red.), Skala Inteligencji WAIS-R Wechslera. Polska adaptacja, standaryzacja, normalizacja i wykorzystanie w diagnostyce psycho- logicznej (s. 84-99), Warszawa, Wyd. Nauk. PWN. Brzeziński J. (1993b), Wiadomości, w: J. Brzeziński, E. Hornowska (red.), Skala Inteligencji WAIS-R Wechslera. Polska adaptacja, standaryzacja, normalizacja i wykorzystanie w diagnostyce psycho- logicznej (s. 131-164), Warszawa, Wyd. Nauk. PWN. Brzeziński J. (Ed.) (1993c), Psychologiczne i psychometryczne problemy diagnostyki psychologicznej, Poznari, Wyd. Nauk. UAM. Brzeziński J. (1994a), Proces badawczy w psychologii w kontekście świadomości metodologicznej ba- dacza, w: A. Falkowski, P. Francuz (red.), Model, badanie, eksperyment, analiza danych („Psy- chologia Matematyczna VI")(s. 5-30), Kraków, Wyd. UJ. Brzeziński J. (1994b), Etyczny kontekst badań naukowych w psychologii, J. Brzeziński, W. Poznaniak (red.), Etyczne problemy działalności badawczej i praktycznej psychologów (s. 11-38), Poznań, Wyd. Fundacji Humaniora. Brzeziński J. (1994c), Testy psychologiczne i ich użytkownicy — analiza kontekstu etycznego, J. Brze- ziński, W. Poznaniak (red.), Etyczne problemy działalności badawczej i praktycznej psychologów (s. 83-101), Poznań, Wyd. Fundacji Humaniora. Brzeziński J. (1994d), Rozważania o uniwersytecie, w: J. Brzeziński, L. Witkowski (red.), Edukacja wobec zmiany społecznej (s. 23-47), Toruń, Edytor. Brzeziński J. (1994e), Problemy metodologiczne związane z ustalaniem trafności zewnętrznej badań em- pirycznych nad zachowaniem się człowieka w warunkach ekstremalnych, „Ergonomia", 17, 181-193. Brzeziński J. (19940, Metodologiczny i etyczny kontekst badań nad jakością tycia, w: A. Bańka, R. Derbis (red.), Psychologiczne i pedagogiczne wymiary jakości życia (s. 11-18), Poznań, Inst. Psychol. UAM. Brzeziński J. (red.) (1995a), Z zagadnień diagnostyki psychologicznej, Poznań, Wyd. Fundacji Huma- niora. Brzeziński J. (1995b), Całościowe badanie trafności testu psychologicznego metodą analizy macierzy wielu cech — wielu metod, w: A. Bielą, J. Brzeziński, T. Marek (red.), Społeczne, eksperymen- talne i metodologiczne konteksty procesów poznawczych człowieka (s. 375-387), Poznań, Wyd. Fundacji Humaniora. Brzeziński J. (1995c), Metodologiczne źródła artefaktów w badaniach psychologów społecznych inspi- rowanych socjologicznymi badaniami opinii publicznej, w: B. Wojciszke (red.), Jacy są Polacy? Badania opinii społecznej jako źródło wiedzy psychologicznej, („Kolokwia Psychologiczne", t. 4)(s. 83-111), Warszawa, Wyd. Inst. Psychol. PAN. Brzeziński J. (1995d), Rzetelność i trafność testów psychologicznych —jak jest i jak być powinno, w: J. Brzeziński (red.), Z zagadnień diagnostyki psychologicznej (s. 109-123), Poznań, Wyd. Fun- dacji Humaniora. Brzeziński J. (1996), Jaki uniwersytet? „Humaniora", Biuletyn, 4, (s. 49-59), Poznań, Wyd. Fundacji Humaniora Brzeziński J., Gaul M. (1993), PROFINT 1.0: komputerowy program interpretacji profilu psychome- trycznego Skal Inteligencji D. Wechslera (WPPSI, WISC-R, WAIS-R), w: J. Brzeziński, E. Hor- 661 regresji liniowej, w: J. Brzeziński (red.), Wielozmiennowe modele statystyczne w badaniach psy- chologicznych (s. 12-81). Warszawa, Wyd. Nauk. PWN. Brzeziński J. (red.) (1988), Problemy teorii, rzetelności, konstrukcji i analizy wyników testów psycholo- gicznych („Biblioteka Psychologa Praktyka", t. II), Warszawa, Wyd. Poi. Tow. Psychol. Brzeziński J. (1989a), O związkach teorii z praktyką społeczną. Na przykładzie związków teorii psy- chologicznych z praktyką społeczną, w: J. Brzeziński, K. Łastowski (red.), Filozoficzne i meto- dologiczne podstawy teorii naukowych (s. 287-305)(,.Poznańskie Studia z Filozofii Nauki", t. 11), Warszawa-Poznań, PWN. Brzeziński J. (1989b), Eksperymentalne badanie zmian — metodologiczne problemy stosowania prete- stu zmiennej zależnej, „Przegląd Socjologiczny", 37, 113-139. Brzeziński J. (1990), O adaptacji kulturowej testów psychologicznych, w: A. Ciechanowicz (red.) Kul- turowa adaptacja testów (s. 185-202), Warszawa, Poi. Tow. Psychol.; Lab. Technik Diagn. Brzeziński J. (1991), Zewnętrzne i wewnętrzne uwarunkowania procesu badawczego w psychologii, „Przegląd Psychologiczny", 34 (2), 329-364. Brzeziński J. (1993a), Standardowe skale wyników WAIS-R: skala dewiacyjnych ilorazów inteligencji i skala wyników przeliczonych, w: J. Brzeziński, E. Hornowska (red.), Skala Inteligencji WAIS-R Wechslera. Polska adaptacja, standaryzacja, normalizacja i wykorzystanie w diagnostyce psychologicznej (s. 84-99), Warszawa, Wyd. Nauk. PWN. Brzeziński J. (1993b), Wiadomości, w: J. Brzeziński, E. Hornowska (red.), Skala Inteligencji WAIS-R Wechslera. Polska adaptacja, standaryzacja, normalizacja i wykorzystanie w diagnostyce psycho- logicznej (s. 131-164), Warszawa, Wyd. Nauk. PWN. Brzeziński J. (Ed.) (1993c), Psychologiczne i psychometryczne problemy diagnostyki psychologicznej, Poznań, Wyd. Nauk. UAM. Brzeziński J. (1994a), Proces badawczy w psychologii w kontekście świadomości metodologicznej ba- dacza, w: A. Falkowski, P. Francuz (red.), Model, badanie, eksperyment, analiza danych („Psy- chologia Matematyczna VI")(s. 5-30), Kraków, Wyd. UJ. Brzeziński J. (1994b), Etyczny kontekst badań naukowych w psychologii, J. Brzeziński, W. Poznaniak (red.), Etyczne problemy działalności badawczej i praktycznej psychologów (s. 11—38), Poznań, Wyd. Fundacji Humaniora. Brzeziński J. (1994c), Testy psychologiczne i ich użytkownicy — analiza kontekstu etycznego, J. Brze- ziński, W. Poznaniak (red.), Etyczne problemy działalności badawczej i praktycznej psychologów (s. 83-101), Poznań, Wyd. Fundacji Humaniora. Brzeziński J. (1994d), Rozważania o uniwersytecie, w: J. Brzeziński, L. Witkowski (red.), Edukacja wobec zmiany społecznej (s. 23—47), Toruń, Edytor. Brzeziński J. (1994e), Problemy metodologiczne związane z ustalaniem trafności zewnętrznej badań em- pirycznych nad zachowaniem się człowieka w warunkach ekstremalnych, „Ergonomia", 17, 181-193. Brzeziński J. (1994f), Metodologiczny i etyczny kontekst badań nad jakością życia, w: A. Bańka, R. Derbis (red.), Psychologiczne i pedagogiczne wymiary jakości życia (s. 11-18), Poznań, Inst. Psychol. UAM. Brzeziński J. (red.) (1995a), Z zagadnień diagnostyki psychologicznej, Poznań, Wyd. Fundacji Huma- niora. Brzeziński J. (1995b), Całościowe badanie trafności testu psychologicznego metodą analizy macierzy wielu cech — wielu metod, w: A. Bielą, J. Brzeziński, T. Marek (red.), Społeczne, eksperymen- talne i metodologiczne konteksty procesów poznawczych człowieka (s. 375-387), Poznań, Wyd. Fundacji Humaniora. Brzeziński J. (1995c), Metodologiczne źródła artefaktów w badaniach psychologów społecznych inspi- rowanych socjologicznymi badaniami opinii publicznej, w: B. Wojciszke (red.), Jacy są Polacy? Badania opinii społecznej jako źródło wiedzy psychologicznej, („Kolokwia Psychologiczne", t. 4)(s. 83-111), Warszawa, Wyd. Inst. Psychol. PAN. Brzeziński J. (1995d), Rzetelność i trafność testów psychologicznych —jak jest i jak być powinno, w: J. Brzeziński (red.), Z zagadnień diagnostyki psychologicznej (s. 109-123), Poznań, Wyd. Fun- dacji Humaniora. Brzeziński J. (1996), Jaki uniwersytet? „Humaniora", Biuletyn, 4, (s. 49-59), Poznań, Wyd. Fundacji Humaniora Brzeziński J., Gaul M. (1993), PROFINT 1.0: komputerowy program interpretacji profilu psychome- trycznego Skal Inteligencji D. Wechslera (WPPSI, WISC-R, WAIS-R), w: J. Brzeziński, E. Hor- 661 n o w s k a ( r e d . ) , Z p s y c h o m e t r y c z n y c h p r o b l e m ó w d i a g n o s t y k i p s y c h o l o g i c z n e j ( s . 1 1 1 - 1 5 0 ) , z n a ń , W y d . N a u k . U A M . Brze z i ń s k i J . , H o r n o w s k a E . ( r e d . ) ( 1 9 9 3 a ) , Z p s y c h o m e t r y c z n y c h p r o b l e m ó w d i a g n o s t y k i p s y c h n e j , P o z n a ń , W y d . N a u k . U A M . Brzezińs ki J., Hor no wsk a E. (red .)(1 993 b), Ska la Inte lige ncji WA IS- R We chsl era. Pol ska ada pta cj stan dar yza cja, nor mal izac ja i wyk orz ysta nie w dia gno styc e psy cho logi czn ej, Wa rsza wa, Wy d Nau k. PW N. Brzezińs ki J., Ko wal ik S. (19 93a ), Mo del ują cy wyn iki bad ani a psy cho logi czn ego (dia gno styc zne g wpł yw oso by bad anej (pa cjen ta) i bad acz a (kli nicy sty), w: H. Sęk (red .), Spo łecz na psy chol ogi a klin iczn a (s. 269 - 302 ), Wa rsza wa, Wy d. Nau k. PW N. Brzezińs ki J., Ko wa lik S. (1 99 3b ), Ch ar akt er yst yk a wy br an yc h me to d di ag no zy kli nic zn ej, w: H. Sę k (re d.) , Sp oł ec zn a ps yc ho lo gi a kli ni cz na (s. 31 4- 36 4), W ars za wa , W yd . Na uk . P W N. Brzezińs ki J., Ma rus ze ws ki T. (19 78 a), Me tod a sęd zió w ko mp ete ntn ych i jej zas tos ow ani e w ba da nia ch pe da go gic zny ch, „K wa rtal nik Pe da go gic zn y", 23 (1) , 56 9- 58 7. Brzezińs ki J., Ma rus ze ws ki T. (19 78 b), Me tod a ba da nia zg od no ści pr ofil ów psy ch om etr ycz ny ch, „Pr ze- glą d Ps yc hol ogi cz ny ", 11 (3) , 56 9- 58 7. Brzezińs ki J„ Ma rus ze ws ki T. (19 81) , Ni ep ar am etr ycz ne an ali zy sta tyst ycz ne w pr oto ide ali zac yjn ym mo del u na uki , „K wa rta lni k Pe da go gic zn y", 26 (1) , 59 - 75. Brzezińs ki J., No wo rol C. (19 84) , An ali za por ów na ń int erp rof ilo wy ch w wie lo wy mi aro wy ch kw esti o- nar ius zac h (za sto so wa nie pro gra mó w ko mp ute ro wy ch w jęz yku BA SI C ora z FO RT RA N IV) , „Pr zeg ląd Ps yc hol ogi czn y", 27, 50 1- 51 7. Brzezińs ki J., Po zna nia k W. (re d.)( 19 94) , Ety czn e pro ble my dzi ała lno ści ba da wc zej i pra kty czn ej psy ch olo gó w, Po zna ń, W yd. Fu nd acj i Hu ma nio ra. Brzezińs ki J., Siu ta J. (re d.)( 19 91) , Sp ołe czn y kon tek st ba da ń psy cho log icz nyc h i ped ag ogi czn ych . Wy bór tek stó w, Po zna ń, W yd. Na uk. U A M. Brzezińs ki J., Sta cho ws ki R. (19 84), Zas tos ow ani e ana lizy war ian cji w eks per ym ent aln ych bad ani ach psy cho logi czn ych (wy d. 2), Wa rsz aw a, PW N. Brzezińsk i J., Witkows ki L. (red.)(199 4), Edukacja wobec zmiany społeczne j, Toruń, Edytor. Bunge M. (1959), Metascie ntific Queries, Springfiel d, IL, Ch. C. Thomas, Publisher . Bunge M. (1962), Intuition and science, Englewo od Cliffs, NJ, Prentice- Hall. Bunge M. (1967), Scientific Research I. The search for system, Berlin, Springer- Verlag. Cackows ki Z. (1964), Problemy i pseudopr oblemy, Warszaw a, KiW. Campbell D. T. (1957), Factor relevant to the validity of experime nt in social settings, „Psycholo gical Bull etin", 54, 297-312. Campbell D. T., Stanley J. C. (1967), Experime ntal and quasi- experime ntal designs for research on teac hin g, w: N. L. Gag e (red .), Han dbo ok of rese arc h on teac hin g (s. 171 - 246 ), Chi cag o.IL , Ran d McNally. Campbell D. T. (1960), Recomme ndations for APA test Standards regarding construct, trait, or discri- min ant validity, „America n Psycholo gist", 15, 546-553. Campbell D. T. (1969), Prospecti ve: Artifact and control, w: R. Rosentha l, R. L. Rosnow (red.), Arti fact in behavior al research (s. 351- 381), New York, Academi c Press. Campbell D. T., Fiske D. W. (1959), Converge nt and discrimin ant validatio n by the multitrait -multi- met hod matrix, „Psychol ogical Bulletin", 56, 81- 105. Canfield A. A. (1951), The „ten" scalę — a modified C-scale, „Educati onal and Psycholo gical Meas- ure ment", 11,295- 297. Carnap R. (1959), The methodol ogical character of theoretic al concepts, w: H. Feigel, M. Scriven (red .), Min nes ota Stu dies in the Phil oso phy of Scie nce s, t. I (s. 38- 76) Min nea poli s,M N, Uni ver- sity of Mi nne sota Pre ss. Carson R. C. (1970), Interacti on concepts of personali ty, London, G. Allen & Unwin Ltd. Cattell J. McK. (1890), Mentol tests and measure ments, „Mind", 15, 373- 381. Cattel R. B. (1971), Abilities: Their structre, growth, and action. Boston, Houghto n Mifflin. Cattell R. B., Eber H. W., Tatsuoka M. M. (1970), Handboo k for the Sixteen Personal ity Factor Q u e s t i o n n a i r e ( 1 6 P F ) , C h a m p a i g n J L , I n s t i t u t e f o r P e r s o n a l i t y a n d A b i l i t y T e s t i n g . C B O S ( 1 9 9 5 ) , S e r w i s I n f o r m a c y j n y , n r 1 , W a r s z a w a , C e n t r u m B a d a n i a O p i n i i S p o ł e c z n e j . C h ó w S . L . ( 1 9 8 8 ) , S i g n i f i c a n c e t e s t o r e f f e c t s i z e ? „ P s y c h o l o g i c a l B u l l e t i n " , 5 2 , 1 0 5 - 1 1 0 . 662 Choynowski M. (1959), Elementy teorii testów psychologicznych, „Przegląd Psychologiczny", 3, 151- -170. Choynowski M. (1966), Opracowanie zestawu testów dla prognozy powodzenia w podoficerskich szko- łach Milicji Obywatelskiej, Wrocław, Ossolineum. Choynowski M. (1971a), Pomiar w psychologii, w: J. Kozielecki (red.), Problemy psychologii mate- matycznej (s. 15-42), Warszawa, PWN. Choynowski M. (1971b), Podstawy i zastosowania teorii rzetelności testów psychologicznych, w: J. Kozielecki (red.), Problemy psychologii matematycznej (s. 65-118), Warszawa, PWN. Choynowski M. (red.) (1968), „Biuletyn Psychometryczny", t. II, Wrocław, Ossolineum. Choynowski M., Dobruszek Z., Kottas A., Leszczyńska E., Manturzewska M, Markowska B., Nowa-kowska M., Skrzypek E., Strzałecki A. (1968), Rozwój, założenia i dorobek Pracowni Psychome-trycznej PAN. Opracowanie testów, w: Choynowski M. (red.), „Biuletyn Psychometryczny", t. II (s. 205-264), Wrocław, Ossolineum. Chwalisz P., Kowalik P., Nowak L., Stefański M. (1976), Osobliwości badań praktycznych, w: L. No- wak (red.), Teoria a rzeczywistość (s. 189-213) („Poznańskie Studia z Filozofii Nauki", t. 1), Warszawa-Poznari, PWN. Cialdini R. B. (1994), Wywieranie wpływu na ludzi, Gdańsk, Gdańskie Wydawnictwo Psychologiczne. Ciechanowicz A. (1990a), Adaptacja kulturowa testów, w: A. Ciechanowicz (red.), Kulturowa adap- tacja testów (s. 9-30), Warszawa, Poi. Tow. Psychol.; Lab. Technik Diagn. Ciechanowicz A. (red.)(1990b), Kulturowa adaptacja testów, Warszawa, Poi. Tow. Psychol.; Lab. Technik Diagn. Cohen J. (1968), Multiple regression as a generał data-analytic system, „Psychological Bulletin", 70, 426-443. Cohen J. (1969), Profile similarity coefficient invariant over variable reflection, „Psychological Bulle- tin", 71, 281-284. Cohen J. (1983), The cost of dichotomization, „Applied Psychological Measurement", 7, 249-253. Cohen J. (1988), Statistical power analysis for the behavioral sciences (wyd. 2), Hillsdale, NJ, L. Erl- baum. Cohen J. (1988), Współczynnik rcjako miara podobieństwa profilów niezmienna względem odwracania zmiennych, w: J. Brzeziński (red.), Problemy teorii, rzetelności, konstrukcji i analizy wyników testów psychologicznych (s. 240-247) („Biblioteka Psychologa Praktyka", t. II), Warszawa, Wyd. Poi. Tow. Psychol. Cohen J. (1990), Things I have learned (so far), .American Psychologist", 45, 1304-1312. Cohen J. (1992), A power primer, „Psychological Bulletin", 112, 155-159. Cohen J. (1994), The Earth is round (p < .05), „American Psychologist", 49, 997-1003. Cohen J., Cohen P. (1975), Applied multiple regression/correlation analysis for the behavioral science, Hillsdale, NJ, L. Erlbaum. Cohen J., Cohen P. (1983). Applied multiple regression/correlation analysis for the behavioral science (wyd. 2). Hillsdale, NJ: L. Erlbaum. Cole D. A. (1987), Utility of confirmatory factor analysis in test validation research, .Journal of Consulting and Clinical Psychology", 55, 584-594. Cook T. D., Campbell D. T. (1979), Quasi- experimentation. Design and analysis issues for field settings. Boston, Houghton Mifflin Co. Coombs, C. H., Dawes R. M, Tversky A. (1977), Wprowadzenie do psychologii matematycznej. War- szawa, PWN. Cooper H. M. (1979), Pygmalion grows up: A model for teacher expectation communication and performance influence, „Review of Educational Research", 49, 389-410. Cooper H. M. (1985), Models for teacher expectation communication, w: J. Dusek (red.), Teacher expectancies (s.135-158), Hillsdale,NJ, L. Erlbaum. Cooper J. (1976), Deception and role- playing: On telling the good guysfrom the bad guys,, American Psychologist", 31, 605-610. Costa P. T., Jr„ McCrae R. R. (1992), NEO-PI-R. Professional Manuał, Odessa, FL, Psychological Assessment Resources. Cowles M., Davis C. (1987), The subject matter of psychology: Volunteers, „The British Journal of Social Psychology", 26, cz. 2, 97-102. 663 Craig J. R., Metze L. P. (1986), Methods of psycholo gical reseaarc h (wyd. 2.), Montere y, CA, Bro oks /Co le Pub l. Cronbach L. J. (1951), Coefficien t alpha and the internat structure oftests, „Psycho metrika", 16, 297- 334. Cronbac h L. J. (1957), The two discipline s of scientific psycholo gy, „Americ an Psycholo gist", 12, 671 -684. Cronbach L. J. (1971), Test validatio n, w: R. L. Thorndik e (Ed.), Educatio nal measure ment (wyd. 2.)( s. 443- 507), Washingt on, DC, America n Council of Educatio n. Cronbach L. J. (1975), Beyond the two discipline s of scientific psycholo gy, „America n Psycholo gist", 30, 116 - 127 . Cronbac h L. J. (1 98 8), Pr op oz ycj e an ali tyc zn eg o po dej ści a do oc en uz ys ki wa ny ch w pe rc ep cji sp ołe cz nej , w: J. Br ze ziń ski (re d.) , Pr ob le my teo rii, rze tel no ści , ko nst ru kcj i i an ali zy wy nik ów tes tó w psy chol ogic zny ch (s. 197 - 227 )(,3i blio teka Psy chol oga Pra kty ka", t. II), War sza wa, Wy d. Poi. To w. Psy chol . Cronbach L. J. (1990), Essential s of psycholo gical testing (wyd. 5.), New York, Harper and Row. Cronbac h L. J., Gleser G. C. (1988), Szacowa nie podobień stwa profilów, w: J. Brzezińs ki (red.), Pro ble my teor ii, rzet elno ści, kon stru kcji i ana lizy wyn ikó w test ów psy chol ogic zny ch (s. 179 — - 196)(„Bi blioteka Psycholo ga Praktyka ", t. II). Warsza wa, Wyd. Poi. Tow. Psychol. Cronbac h L. J., Meehl P. E. (1955), Construc t validity in psycholo gical tests, „Psychol ogical Bulletin" , 52, 281-302. Cronbac h L. J., Rajaratn am L., Nanda H., Gleser G. C. (1972), The dependa bility of behavior al mea surement s: Theory of generaliz ability for scores and profiles, New York, J. Wiley. Crown D. P., Marlowe D. (1964), The approval motive: Studies in evaluative dependen ce, New York, J. Wiley. Cureton E. E. (1950), Validity, w: E. F. Lindąuist (red.), Educatio nal measure ment (s. 621-694), Wa shington, DC, American Council of Education . Czabała C, Leder S., Pohoreck a A. (1973), Badania nad psychoter apią grupową, w: H. Wardaszk o- - Łyskows ka (red.), Terapia grupowa w psychiatr ii (s. 181- 209), Warszaw a, PZWL. Czapińsk i J. (1994), Uziemien ie polskiej duszy, „Kultura i Społecze ństwo", 38 (3), 17-37. Czapińsk i J., Górecki, B., Gucwa- Leśny E., Tyszka T. (1994), Polski generaln y sondaż jakości życia. War sza wa, Inst ytut Stu dió w Spo łecz nyc h. Damaser E. C, Sho r R. R., Orn e M. T. (19 63), Phy siol ogi cal effe cts dur ing hyp noti call y- reą uest ed em otio ns, „Ps ych oso mat ic Me dici ne", 25, 334 - 343 . Darley J. M., Ole son K. C. (19 93), Intr odu ctio n to res ear ch on inte rpe rso nal exp ect atio ns, w: P. D. Bla nek (red .), Inte rpe rso nal exp ect atio ns. The ory, res ear ch, and app lica tion s (s. 45- 63), Ca m- brid ge, Ca mb ridg e Uni ver sity Pre ss. Darlingto n R. B. (19 68), Mul tipl e reg ress ion in psy cho logi cal rese arc h and pra ctic e, „Ps ych olo gica l Bul leti n", 69, 161 - 182 . Daszkow ski J. (19 80), Ana liza częs tośc i cyto wa ń pub lika cji (na prz ykła dzie nau k spo łecz nyc h), „Za gad nie nia Na uko zna wst wa" , 2 (62 ), 170 - 182 . Davis F. (19 59), Inte rpre tati on of diff ere nce s amo ng ave rag es and indi vidu al test scor es, .Jou rnal of Edu cati onal Psy chol ogy ", 50, 162 - 170 . Di Nu ovo S. (19 92), La spe rim ent azio ne in psic olo gia app lica ta. Pro bier ni di met odo logi a e ana lisi dei dati , Mil an, Fra nco An geli . Dobrusze k Z. (19 71), Do bór pra cow nik ów, w: J. Ok oń (red .), Psy cho logi a prz emy sło wa (s. 28- 98), Wa rsza wa, PW N. Domańsk i C. (1979), Statystycz ne testy nieparam etryczne, Warszaw a, PWE. Draper N. R., Smith H. (1973), Analiza regresji stosowan a, Warszaw a, WNT. Drozdowi cz Z. (1995), Excellenti a universita s. Szkice o uniwersyt ecie, Poznań, Wyd. Fundacji Humanior a. Drwal R. Ł. (19 78), Poc zuci e kon trol i jak o wy mia r oso bow ości — pod sta wy teor etyc zne, tech niki bad awc ze i wyn iki bad ań, w: E. Pas zkie wic z (red .), Mat eria ły do nau cza nia psy cho logi i, seri a DI, t. 3 (s. 307 - 345 ), Wa rsza wa, PW N. Drwal R. Ł. (19 81), Oso bo woś ć wyc ho wa nkó w zakł adó w pop raw czy ch. Bad ani a nad fun kcja mi pod - kult ury zakł ado wej, Wr ocł aw, Oss olin eu m. Drwal R. Ł. (1990), Problemy kulturowe j adaptacji testów kwestiona riuszy osobowoś ci, w: A. Ciecha- 664 nowicz (red.), Kulturowa adaptacja testów (s. 115-138), Warszawa, Poi. Tow. Psychol.; Lab. Technik Diagn. Drwal R. Ł. (1995), Adaptacja kwestionariuszy osobowości, Warszawa, Wyd. Nauk. PWN. Duncan S. D., Rosenthal R. (1969), Vocal emphasis in experimenters instruction reading as unintendent determinant of subjects responses, „Language and Speech", 11, 20-26. Duncan S. D., Rosenberg M. J., Finkelstein J. (1969), The paralanguage of experimenter bias, „So- ciometry", 32, 207-219. Dunnette M. D. (1963), A notę on the criterion, „Journal of Applied Psychology", 47, 251-254. Edwards A. L. (1957), Techniąues of attitude scalę construction, New York, Appleton-Century-Crofts Inc. Edwards A. L. (1970), The measurement of personality traits by scales and inventories, New York, Holt, Rinehart and Winston. Edwards A. L. (1972), Experimental design in psychological research (wyd. 4), New York, Holt, Rinahart and Winston. Edwards W., Lindman H„ Savage L. J. (1963), Bayesian statistical inferences for psychological re- search, „Psychological Review", 70, 193-242. Ellis H. C. (1992), Graduate education in psychology. Past, present, and future, „American Psycho- logist", 47, 570-576. Ellison D. G., Davis R. C, Saltzman I. J., Burkę C. J. (1952), A report on research on detection of deception, Bloomington, IN, Dept. of Psychol., Indiana University. Encyklopedia fizyki, t. 1. (1972), Warszawa, PWN. Endler N. S. (1983), Interactionism: A personality model, but not yet a theory, w: M. M. Page (red.), Nebraska Symposium on Motivation 1982: Personality — current theory and research, Lincoln, NE, University of Nebraska Press. Exner J. E. (1986), The Rorschach: A comprehensive system, t. 1, Basic foundations (wyd. 2), New York, J. Wiley. Eysenck H., Eysenck M. (1996), Podpatrywanie umysłu. Dlaczego ludzie zachowują się tak, jak się zachowują.?, Gdańsk, Gdańskie Wydawnictwo Psychologiczne. Ezekiel M. (1945), Methods of correlation analysis, New York, J. Wiley. Feingold A. (1995), The additive effects of dijferences in central tendency and variability are important in comparisons between grups, „American Psychologist", 50, 5-13. Ferguson G. A. (1951), A notę of Kuder-Richardson formuła, „Educational and Psychological Meas- urement", 11,612-615. Ferguson G. A. (1976), Statistical analysis in psychology and education (wyd. 4), New York, McGraw- Hill. Ferguson G. A., Takane Y. (1989), Statistical analysis in psychology and education (wyd. 6), New York, McGraw-Hill. Feyerabend P. K. (1979), Jak być dobrym empirystą? Warszawa, PWN. Fisher G. (1974), Einfiihrung in die Theorie psychologischer Test, Bern, Verlag Hans Huber. Fisher R. A. (1925), Statistical methods for research workers, London, Oliver and Boyd. Fisher R. A. (1935), The design of experiments, Edinburgh, Oliver and Boyd. Folks J. L. (1984), Use of randomization in experimental research, w: K. Hinkelmann (red.), Experi- mental design, statistical models, and genetic statistics: Essays in Honor of Oscar Kempthorne (s. 17-32), Marcel Dekker. Frank G. (1984), Wechsler enterprise, Oxford, Pergamon Press. Franus E. (1992), Struktura i ogólna metodologia nauki ergonomii, Kraków, Universitas. Fraczek A. (1979), Czynności agresywne jako przedmiot studiów eksperymentalnej psychologii społe- cznej, w: A. Fraczek (red.), Studia nad psychologicznymi mechanizmami czynności agresywnych (s. 9-32), Wrocław, Ossolineum. Frederiksen N. (1986), Construct validity and construct similarity: Methods for use in test development and test wlidation, „Multivariate Behavioral Research", 21, 3-28. Freedman J. L. (1969), Role playing: Psychology by consensus, ,Journal of Personality and Social Psychology", 13, 107-114. J 43 — Metodologia badań... 665 Frenkel- Brunswik E., Levinson D. J., Sanford R. N. (1962), Osobowo ść autorytar na, w: A. Malewski ] ( r e d . ) , Z a g a d n i e n i a p s y c h o l o g i i s p o ł e c z n e j ( s . 3 0 3 - 3 2 2 ) , W a r s z a w a , P W N . F r e u n d J . ( 1 9 7 1 ) , P o d s t a w y n o w o c z e s n e j s t a t y s t y k i , W a r s z a w a , P W E . Garfield E. (1 97 8), Th e 10 0 bo ok s m os t cit ed by so ci al sci en tis t, 19 69 - 19 77 , „ C ur re nt C on te nt s: B e- ha vi or al an d So ci al Sc ie nc es ", 37 , 5- 16 . Gaul M. (19 89), Oce na traf noś ci test u za po moc ą mo deli rów nań stru ktur aln ych, „Pr zegl ąd Psy cho -i logi czn y", 32 (2), 435 - 449 . Gaul M. (1990) Idealizacy jne modele poznania naukoweg o w psycholog ii, Warszaw a-Poznań, PWN. i Gaul M. (1 99 3a ), Po do bie ńst wa , w: J. Br ze ziń ski , E. Ho rn ow sk a (re d.) , Sk al a Int eli ge ncj i W AI S- R W ec hsl er a. Po lsk a ad ap tac ja, sta nd ar yz acj a, no rm ali za cja i wy ko rzy sta nie w di ag no sty ce ps yc ho lo gi cz ne j (s. 20 5- 22 4), W ars za wa , W yd . Na uk . P W N. Gaul M. (19 93b ), Bra ki w Obr azk ach, w: J. Brz eziń ski, E. Hor now ska (red .), Skal a Inte lige ncji WA IS- R \ Wec hsle ra. Pol ska ada ptac ja, stan dar yza cja, nor mal izac ja i wyk orzy stan ie w dia gno styc e psy chol ogi czn ej (s. 225 - 240 ), Wa rsza wa, Wy d. Nau k. PW N. Gaul M. (199 3c), Por ządk owa nie Obr azkó w, w: J. Brz eziń ski, E. Hor now ska (red .), Skal a Intel ig WAI S-R Wec hsle ra. Pols ka ada ptac ja, stan dary zacj a, nor mali zacj a i wyk orzy stan ie w diag nost ) psyc holo gicz nej (s. 224 1- 254 ), War sza wa, Wy d. Nau k. PW N. Gaul M., Ma cho wsk i A. (19 87), Ele men ty ana lizy ście żek, w: J. Brz eziń ski (red .), Wie loz mie nno mo dele stat ysty czn e w bad ani ach psy chol ogic zny ch (s. 82- 112 ), Wa rsza wa- Poz nań, PW N. Gaul M., Za krz ew ska M. (19 93) , Ch ara kte rys tyk a am ery kań ski ej i pol ski ej pró by sta nd ary zac yjn i nor mal iza cyj nej, w: J. Brz ezi ńsk i, E. Hor no ws ka (re d.) Ska la Inte lige ncji WA IS- R We chs ler a. Pol ska ada pta cja, sta nda ryz acj a, nor mal iza cja i wy kor zyst ani e w dia gno sty ce psy cho log icz nej (s. 107 - 118 ). Wa rsz aw a, Wy d. Na uk. PW N. Gerstman n S. (1972), Rozmowa i wywiad w psycholo gii, Warszaw a, PWN. Giedymi n J. (19 62) , Hi pot ezy , me tod olo gia opi so wa, wyj aśn ian ie, „K wa rta lni k his tor ycz ny" , LX IX, z. 4, 91 7- 92 2. Giedymin J. (1964), Problemy , założenia, rozstrzyg nięcia, Poznań, PTE. Gilly M. (1987), Nauczyci el-uczeń. Role instytucjo nalne a reprezent acje, Warszaw a, PWN. Goćkows ki J. (1981), Tezy o uniwersy tecie, „Teksty", 2, 5-37. Goćkows ki J., Kisiel P. (red.)(19 94), Patologia i terapia życia naukowe go, Kraków, Universit as. Goćkows ki J., Pigoń K. (red.)(19 91), Etyka zawodow a ludzi nauki, Wrocław, Ossoline um. Goldberg er A. S. (1975), Teoria ekonomet rii, Warszaw a, PWE. Góralski A. (19 80) , Me tod y opi su i wni osk ow ani a stat ysty czn ego w psy cho log ii i ped ago gic e (w yd. 2), Wa rsz aw a, PW N. Greenwal d A. G., Pra tka nis A. R., Lie ppe M. R., Ba um gar dne r M. H. (19 86), Un der wh at con diti ons doe s the ory obs tru ct res ear ch pro gre ss?, „Ps ych olo gic al Re vie w", 93, 216 - 229 . Greenw oo d J. D. (19 91) , Gr ani e rol i jak o str ate gia eks per ym ent aln a w psy cho log ii spo łec zne j, w: J. Brz ezi ńsk i, J. Siu ta (re d.), Spo łec zny kon tek st bad ań psy cho log icz nyc h i ped ago gic zny ch. Wy bór tek stó w (s. 18 3- 20 9), Po zna ń, Wy d. Na uk. UA M. Greń J. (1975), Statystyk a matematy czna. Modele i zadania. Warszaw a, PWN. Greń J. (1984), Statystyk a matematy czna. Modele i zadania. Warszaw a, PWN. Greń J. (1987), Statystyka matematy czna. Podręczn ik programo wany, Warszaw a, PWN. Guilford J. P. (1954), Psychom etric methods (wyd. 2.), New York, McGraw- Hill. Guilford J. P. (19 64) , Po dst aw ow e met ody stat yst ycz ne w psy cho log ii i ped ago gic e (w yd. 2.), Wa rsz a- wa, PW N. Guilford J. P. (19 88), Teo ria test ów psy cho logi czn ych , Rze teln ość i traf noś ć po mia rów , Tw orz eni e test u, w: J. Brz ezi ńsk i (re d.). Pro ble my teo rii, rzet eln ośc i, kon stru kcji i ana lizy wy nik ów test ów psy cho log icz nyc h („B ibli ote ka Psy cho log a Pra kty ka" , t. II), Wa rsz aw a, Wy d. Poi . To w. Psy cho l. Guilford J. P., Fru cht er B. (19 78) , Fu nda me nta l stat isti cs in psy cho log y and edu cati on, Ne w Yo rk, Mc Gra w- Hill . Guion R. M. (1980), On trinitaria n doctrines of validity, „Professi onal Psycholo gy", 11, 385-398. Gulliksen H. (1950), Theory of mental tests, New York, J. Wiley. Gunst R. F., Ma son R. L. (19 80) , Re gre ssi on ana lysi s and its app lica tio n. A dat a ori ent ed app roa ch, Ne w Yo rk, Ma rce l De kke r. 666 Gustafson L. A., Orne M. T. (1965), Effects of perceived role and role success on the detection of deception, , Journal of Applied Psychology", 49, 412—417. Guttman L. (1945), A basie for analyzing test-retest reliability, „Psychometrika", 10, 255-282. Guttman L. (1950), Rozdziały: 2, 3, 6, 8, 9 w: A. Stouffer (red.), Measurement andpredietion. Studies in social psychology in World War II, t. 2, Princeton,NJ, Princeton University Press. Guzzo R. A., Jackson S. E., Katzell R. E. (1986), Meta-analysis analysis, w: L. L. Cummings, B. M. Staw (red.), Research in organizational behavior, t. 9, Greenwich, CT, JAI Press. Harris M. J. (1993), Issues in studying the mediation of expectancy effects: A taxonomy of expectancy situations, w: P. D. Blanek (red.), Interpersonal expectations. Theory, research, and applications (s. 350-378), Cambridge, Cambridge University Press. Harris M. J., Rosenthal R. (1985), The mediation of interpersonal expectancy effects: 31 meta-analyses, „Psychological Bulletin", 97, 363-386. Hathaway S. R., J. C. McKinley (1963), Minnesota Multiphasic Personality Inventory — Manuał, New York, The Psychological Corporation. Hawkins J. D., Nederhood B. (1994), Podręcznik ewaluacji programów profilaktycznych. Nadużywanie substancji uzależniających i inne problemy społeczne, Warszawa-Olsztyn, Poi. Tow. Psychol., Pracownia Wydawnicza. Hays W. L. (1973), Statistics for social sciences (wyd. 2.), New York, Holt, Rinehart and Winston. Hays W. L. (1981), Statistics (wyd. 4.), New York, Holt, Rinehart and Winston. Hedderson J. (1991), SPSS/PC + madę simple, Belmont, CA, Wadsworth Hellwig Z. (1960), Regresja liniowa i jej zastosowanie w ekonometrii, Warszawa, PWE. Helmstadter C. (1970), Research concept in human behayior: Education, psychology, sociology, New York, Appleton-Century-Crofts. Hempel C. G. (1968), Podstawy nauk przyrodniczych, Warszawa, WNT. Henkel R. E., Morrison D. E. (red.)(1970), The significance test controversy, London, Butterworths. Herrnstein R. J., Murray Ch. (1994), The belle curve. Intelligence and class structure in American life, New York, Free Press. Hessen S. (1931), Podstawy pedagogiki. Warszawa, Nasza Księgarnia. Hollander M., Wolfe D. A. (1973), Nonparametric statistical methods, New York, J. Wiley. Holley J. W., Guilford J. P. (1964), A notę on the G index of agreement, „Educational and Psychological Measurement", 24, 749-753. Hope K. (1968), Methods of multwariate analysis, London, University of London Press. Hornowska E. (1989), Operacjonalizacja wielkości psychologicznych. Założenia — struktura — konsekwencje, Wrocław, Ossolineum. Homowska E. (1993a), Słownik, w: J. Brzeziński, E. Hornowska (red.), Skala Inteligencji WAIS-R Wechslera. Polska adaptacja, standaryzacja, normalizacja i wykorzystanie w diagnostyce psycho- logicznej (s. 168-182), Warszawa, Wyd. Nauk. PWN. Homowska E. (1993b), Rozumienie, w: J. Brzeziński, E. Hornowska (red.), Skala Inteligencji WAIS-R Wechslera. Polska adaptacja, standaryzacja, normalizacja i wykorzystanie w diagnostyce psycho- logicznej (s. 192-204), Warszawa, Wyd. Nauk. PWN. Hornowska E. (1993c), Skala Inteligencji Davida Wechslera w świetle teorii inteligencji, w: J. Brze- ziński, E. Hornowska (red.), Skala Inteligencji WAIS-R Wechslera. Polska adaptacja, standary- zacja, normalizacja i wykorzystanie w diagnostyce psychologicznej (s. 21-48), Warszawa, Wyd. Nauk. PWN. Hornowska E. (1995), Stronniczość testów psychologicznych — mit czy rzeczywistość? w: A. Bielą, J. Brzeziński, T. Marek (red.), Społeczne, eksperymentalne i metodologiczne konteksty procesów poznawczych człowieka (s. 359-374), Poznań, Wyd. Fundacji Humaniora. Hornowska E., Paluchowski W. J. (1987), Rysunek postaci ludzkiej według Goodenough-Harrisa (DAMT). Wyniki badań dzieci polskich, Poznań, Wyd. Nauk. UAM. Hornowska E., Paluchowski W. J. (1993), Technika badania ważności pracy, w: J. Brzeziński (red.), Psychologiczne i psychometryczne problemy diagnostyki psychologicznej (s. 105-119), Poznań, Wyd. Nauk. UAM. Hoshmand L. T., Polkinghorne D. E. (1992), Redefining the science-practice relationships and profes- sional training, „American Psychologist", 47, 55-66. Hoyt C. (1941), Test reliability estimated by analysis of variance, „Psychometrika", 6, 153-160. 667 Hoyt C, Stunkard C. L. (1951), Estimatio n of test reliabilit y for unrestric ted item scoring methods, „Ed ucational and Psycholo gical Measure ment", 12, 756- 758. Hoyt C, Krishnai ach P. R. (1960), Estimatio n of test reliabilit y by anałysis of variance, .Journal of j Exp erimental Educatio n", 28, 17-24. Hubbard J. P., Clemans W. V. (1972), Metodyka egzaminó w testowych w kształceni u lekarzy, Warsza- I wa, PZWL. Huck S., Sandler H. M. (1973), A notę on the Solomon 4-group design. Appropri ate statistical anałysis, I .Jo urnal of Experim ental Educatio n", 42, 54-55. Hulin C. L., Drasgow F., Parsons C. K. (1983), Item response theory. Applicati on to psycholo gical mea surement, Homewo od.IL, Dow Jones- Irwin. Hultsch D. F., Hickey T. (1978), External validity in the study ofhuman developm ent: Theoretic al and\ met hodologiz ed issues, „Human Develop ment", 21, 76- 91. Hunter J. E., Schmidt F. L. (1990), Methods of meta- analysis. Correctin g error and bras in research j find ings , Ne wbu ry Par k, CA, Sag ę. Joreskog K. G., Sórbom D. (1989), LISREL 7 users reference guide, Mooresvi lle, IN Scientific Sof-j twa re, Inc. Joreskog K. G., Sorbom D. (1995), USER 8; Structural eąuation modeling with the SIMPLIS command ] lan gua ge, Chi cag o, IL, SSI , Sci enti fic Sof twa re Inte rnat ion al and Gro nin gen , The Net herl and s, Pro GAMMA . Jackson D. N. (1969), Multimet hod factor anałysis in the evaluatio n of converge nt and discrimin vałi dity, „Psychol ogical Bulletin", 72, 30- 49. Jackson D. N. (1975), Multimet hod factor anałysis: A reformul ation, „Multiva riate Behavior al Re-j sear ch", 10, 259-275. Jahoda M., Deutsch M, Cook S. W. (1965a), Skale nominaln e, porządko we, interwało we i ilorazowe , ? w: S. No wa k (red .), Met ody bad ań socj olo gicz nyc h. Wy bór teks tów (s. 274 - 278 ), Wa rsza wa, PW N. Jahoda M, Deutsch M., Cook S. W. (1965b), Ustalanie związków przyczyno wych w badaniac h nieeks- I pery men taln ych, w: S. No wak (red. ), Met ody bad ań socj olog iczn ych. Wyb ór tekst ów (s. 561- 571) , ] War sza wa, PW N. Jakubow ska U. (1993), Czynnoś ci badawcz e w psycholo gii i pedagog ice. Zarys problem atyki, Byd- goszcz, Wyd. WSP. Jakubow ski J. S. (1983), Element y klasyczn ej teorii trafności testów psycholo gicznych , w: W. J. Palu- cho wski (red.), Z zagadnie ń diagnosty ki osobowoś ci (s. 223- 247), Wrocław, Ossolineu m. Jamieson D.W., Lydon J. E., Stewart G., Zanna M. P. (1987), Pygmalio n revisited: New evidence for stud ent expectanc y effects in the classroo m, .Journal of Education al Psycholo gy", 79, 461-466. Jankowsk i K. (1972), Hipisi w poszukiw aniu ziemi obiecanej . Warszaw a, KiW. Janowski A. (1974), Eksperym ent badania zjawisk wychowa wczych jako technika, w: R. Wroczyńs ki, T. Pilch (red.), Metodolo gia pedagogi ki społeczne j (s. 183- 217), Wrocław, Ossolineu m. Jaworows ka A., Michalićk a M. (1978), Zastosow anie niektóryc h testów nieparam etrycznyc h w bada- nich psy chol ogic zny ch i ped ago gicz nyc h, w: L. Woł osz yno wa (red .), Mat eria ły do nau cza nia psyc hologii, seria III, t. 3 (s. 749-753), Warszaw a, PWN. Jaworows ka A., Szustrow a T. (1990), Ogólne problemy kulturowe j adaptacji testów, w: A. Ciechano- wic z (red .)(1 990 ), Kult uro wa ada ptac ja test ów (s. 31^ 7). War sza wa, Poi. To w. Psy chol .; Lab . Tec hnik Diagn. Jaworows ka A., Szustrow a T. (1991), Podręczni k do Testu Matryc Ravena. Wersja Standard (1956). Pols ka stan dar yzac ja 198 9 (5;1 1- 15; 11), War sza wa, Prac own ia Test ów Psy chol ogic zny ch Poi. To w. Psy chol . Jensen A. R. (1980), Bias in mental testing, New York, Free Press. Johnson R. F. Q. (1991), Pułapki w badaniu: wywiad jako model przykład owy, w: J. Brzezińs ki, J. Siut a (red .), Spo łecz ny kont ekst bad ań psy chol ogic zny ch i ped ago gicz nyc h. Wy bór teks tów (s. 433-450), Poznań, Wyd. Nauk. UAM. Johnstone D. J. (1989), On the necessity for random sampling, „The British Journal for the Philosoph y of Science", 40, 443^157. Jurgense n C. E. (1968), Tablice współczy nników phi, w: Choyno wski M. (red.), Biuletyn Psychom e- try czn y, t. II (s. 189 - 202 ), Wr ocł aw, Oss oli neu m. 668 Jurkowski A. (1990), Adaptacja testów słownikowych, w: A. Ciechanowicz (red.)(1990), Kulturowa adaptacja testów (s. 77-91), Warszawa, Poi. Tow. Psychol.; Lab. Technik Diagn. Jussim L. (1986), Self-fulfilling prophiecies: A theoretical and integrative review, , .Psychological Review", 93, 429-445. • Kaiser H. F. (1958), The varimax criterion for analytic rotation in factor analysis, „Psychometrika", 23, 187-200. Kalleberg A. L., Kluegel J. R. (1975), Analysis ofthe multitrait-multimethod matrix: Some limitations and an alternative, .Journal of Applied Psychology", 60, 1-9. Kamiński S. (1992), Nauka i metoda. Pojęcie nauki i klasyfikacja nauk, Lublin, Tow. Nauk. KUL. Kaufman A. S. (1976a), Do normal children have flat profiles? „Psychology in the schools", 13, 284-285. Kaufman A. S. (1976b), A new approach to the interpretation of test scatter on the WISC-R, , Journal of Learning Disabilities", 9, 160-168. Kaufman A. S. (1976c), Verbal-Performance IQ discrepancies on the WISC-R, „Journal of Consulting and Clinical Psychology", 44, 739-744. Kelman H. C. (1967), Human use ofhuman subjects: The problem ofdeception in social psychological experiments, „Psychological Bulletin", 67, 1—11. Kendall M. G. (1970), Rank correlation methods (wyd. 4.), London, Ch. Griffin. Kenny D. A., Kashy D. A. (1992), Analysis ofthe multitrait-multimethod matrix by confirmatory factor analysis, „Psychological Bulletin", 112, 165-172. Kerlinger F. N. (1964), Foundations of behavioral resarch, New York, Holt, Rinehart & Winston. Kerlinger F. N. (1986), Foundations ofbehavioral research (wyd. 3.), New York, Holt, Rinehart and Winston. Kerlinger F. N., Pedhazur E. (1973), Multiple regression in behayioral research, New York, Holt, Rinehart and Winston. Kimble G. A. (1984), Psychology's two cultures, „American Psychologist", 39, 833-839. Kinsey A. C, Pomeroy W. B., Martin C. E. (1948), Sexual behavior in the human małe, Philadelphia, Saunders. Kinsey A. C, Pomeroy W. B., Martin C. E., Gebhard P. H. (1953), Sexual behavior in the human female, Philadelphia, Saunders. Kirk R. E. (1968), Experimental design: Procedures for the behavioral sciences, Belmont, CA, Brooks Kirk R. E. (1982), Experimental design: Procedures for the behavioral sciences (wyd. 2.), Belmont, CA, Brooks. Kmita J. (1973), Wykłady z logiki i metodologii nauk, Warszawa, PWN. Kmita J. (1976), Szkice z teorii poznania naukowego, Warszawa, PWN. Kofta M. (1979), Samokontrola a emocje. Warszawa, PWN. Kofta M„ Malak B. (1983), Psychologiczne przestanki podatności na manipulację, „Nowiny Psycho- logiczne", 3(10), 6-18. Kofta M., Brzeziński J., Ignaczak M. (1977), Analizapsychometryczna Kwestionariusza Poczucia Winy, „Studia Psychologiczne", 15, z. 1, 93-113. Kohn P. M., Hunt R. W., Davis C. A., Cowles P. M. (1981), Volunteering in principle, volunteering infact, and experience seeking, „The Psychological Record", 32, 205-213. Komorita S. S., Graham W. K. (1965), Number of scalę points and the reliability of scales, „Educa- tional and Psychological Measurement", 25, 987-995. Kołakowski L. (1993), Po co uniwersytet? Tekst wykładu wygłoszonego na konferencji „Dylematy szkolnictwa wyższego", zorganizowanej przez Institut fur Wissenschaften vom Menschen (w Wiedniu) w Warszawie, w czerwcu 1993 roku. Komitet Etyki w Nauce PAN (1994), Dobre obyczaje w nauce. Zbiór zasad i wytycznych, Warszawa, PAN. Kopaliński W. (1988), Słownik wyrazów obcych i zwrotów obcojęzycznych (wyd. 16.), Warszawa, Wiedza Powszechna. Kosnarewicz A. (1989), Kilka uwag o dystynkcji kontekst odkrycia — kontekst uzasadniania, w: J. Brzeziński, K. Łastowski (red.), Filozoficzne i metodologiczne podstawy teorii naukowych (s. 275-285) („Poznańskie Studia z Filozofii Nauki", t. 11), Warszawa-Poznaii, PWN. 669 Kostrzew ski J. (1963), Wiek obojga rodziców a choroba L. Downa, „Polski Tygodnik Lekarski" , U 117 5-1180. Kostrzew ski J. (1970), Wprowad zenie do Skali Inteligenc ji D. Wechsler a dla Dzieci od 5 do 15 lat, War szawa- Łódź, Wyd. PTHP. Kostrzew ski J. (1976), Użyteczn ość badań psycholog icznych dla rewalidac ji, w: J. Kostrzew ski (red.), Z zag adn ień psy chol ogii dzie ci umy sło wo upo śled zon ych, t. 1 (s. 77- 103 ), War sza wa, Wy ższa Szk oła Pedagogi ki Specjalne j. Kostrzew ski J. (1985), Testy inteligenc ji culture- fair, w: A. Ciechano wicz (red.), Kulturow a adaptacja test ów (s. 49- 75), Warszaw a, Poi. Tow. Psychol.; Lab. Technik Diagn. Kotarbińs ki T. (1972), Pojęcia i zagadnie nia metodolo gii, „Studia Filozofic zne", 1(74), 5- 12. Kowalik S. (1981), Upośledz enie umysłowe a rozwój społeczny , Warszaw a, PWN. Kowalik S. (1984), Zasady interpreta cji skali Wechsler a w praktyce diagnosty cznej, w: J. Brzezińsk i (red .), Wyb ran e zag adni enia z psyc hom etrii i diag nost yki psyc holo gicz nej (s. 151 - 180 ), Poz nań, Wy d. Nau k. UA M. Kowalik S. (1989), Upośledz enie umysłowe . Teoria i praktyka rehabilita cji, Warszaw a, PWN. Kowalik S. (1993), Kliniczna interpreta cja Skal Inteligenc ji: W-B, I/II, WAIS, WAIS-R, w: J. Brzeziń- ski, E. Hornows ka (red.), Skala Inteligenc ji WAIS-R Wechsler a. Polska adaptacja , standaryz acje normaliz acja i wykorzyst anie w diagnosty ce psycholo gicznej (s. 386-462), Warszaw a, Wyd. Nauk. PWN. Kowalik S., Sęk H. (1993), Psycholo gia kliniczna i psycholo gia społeczn a — pojęcia, przea i wza jem ne zwi ązki , w: H. Sęk (red .), Spo łecz na psy cho logi a klin iczn a (wy d. 2.) (s. 17- 33), War szawa, Wyd. Nauk. PWN. Kozieleck i J. (1972a), Osobliwo ści procesu myślenia a twórczość naukowa, „Zagadni enia Naukozna w- stw a", 8, 311-322. Kozielec ki J. (1972b), Struktura myślenia krytyczne go w nauce, „Zagadni enia Naukozn awstwa", 8, 486 ^97 . Kozieleck i J. (1975), Psycholo giczna teoria decyzji, Warszaw a, PWN. Kozielec ki J. (1976), Metodolo giczne niepokoje , „Przegląd Psycholo giczny", 19 (4), 543-556. Kozieleck i J. (1995), Koncepcj e psycholog iczne człowieka (wyd. 5.), Warszaw a, Wyd. Żak. Kozieleck i J. (Ed.)(197 1), Problemy psycholog ii matematy cznej, Warszaw a, PWN. Krajewsk i Wł. (1979), Ideałizacy jna koncepcja rozwoju nauki, w: A. Klawiter, L. Nowak (red.), Odkrycie, abstrakcj a, prawda, empiria, historia a idealizacj a (s. 203- 210), Warszaw a- Poznań, PW N. Krathwoh l D. R. (1984), Experime ntal deigns, w: R. J. Corsini (red.), Encyclop edia of psycholo gy, t. 2 (s. 466 ^70 ), Ne w Yor k, J. Wil ey. Kreutz M. (1962), Metody współczes nej psycholog ii, Warszaw a, PWN. Krishnaia h P. R. (1980), Handboo k of statisties, t. 1, Analysis ofwriance , Amsterda m, North- Holland. Kruglans ki A. (1973), Much ado about the volunteer artifacts, .Journal of Personali ty and Social Psy chology", 28, 348- 354. Kruglans ki A., Kroy M. (1975), Outcome validity in experime ntal research: A re- conceptu alization, .Jou rnal of Represent ative Research in Social Psycholo gy", 7, 18-178. Kuder G. F., Richardso n M. W. (1937), The theory of the estimatio n of test reliability , „Psycho metri- ka", 2, 151 - 160 . Kuhn T. S. (1968), Struktura rewolucji naukowyc h, Warszaw a, PWN. Kuhn T. S. (1971), Notes on Lakatos, w: R. Buck, R. S. Cohen (red.), In memory of Rudolf Carnap („B osto n Stu dies in the Phil oso phy of Scie nce s", t. 8), Dor drec ht, D. Rei del. Kuhn T. S. (1985), Dwa bieguny. Tradycja i nowatorst wo w badaniac h naukowyc h, Warszaw a, PIW. Kupracz A. (1991), O dwóch ujęciach metody idealizacj i w naukach empirycz nych. Próba analizy poró wna wcz ej, Poz nań, Ośr ode k Wy daw nict w Nau kow ych. Lakatos I. (1995), Pisma z filozofii nauk empirycz nych, Warszaw a, Wyd. Nauk. PWN. Lamal P. A. (1991), On the importan ce of replicatio n, w. Neuliep ). W. (red.), Replicati on research in the social sciences (s. 31- 35), Newbury Park, CA, Sagę. Lana R. E. (1969), Pretest sensitizati on, w: W: R. Rosenthal , R. L. Rosnow (red.), Artifact in beha- vior al rese arc h (s. 121 - 140 ), Ne w Yor k, Aca de mic Pre ss. Lazarsfeld P. F. (1968), Algebra systemów dychotomicznych. Zastosowania matematyki w badanich socjologicznych, Warszawa, PWN. Leckliter I. N., Matarazzo J. D. (1986), A literaturę review offactor analytic studies of the WAIS-R, Journal of Clinical Psychology", 42, 332-342. Lehmann E. L. (1968), Testowanie hipotez statystycznych, Warszawa, PWN. Lessac M. S., Solomon R. L. (1969), Effects of early isolation on the later adaptive behavior of beagles, „Developmental Psychology", 1, 14-25. Lindeman R. H., Merenda P. F., Gold R. Z. (1980), Introduction to bivariate and multivariate analysis, Glenview,IL, Scott, Foresman and Co. Linder D. E., Cooper J., Jones E. E. (1967), Decision freedom as a determinant ofthe role ofincentive magnitude in attitude chanie, ,Journal of Personality and Social Psychology", 6, 244-254. Lindzey G., Aionson E. (red.) (1968-1969), The handbook of social psychology, Reading, MA, Addi- son-Wesley. Lissowski G. (1968), Z zagadnień doboru próby, w: K. Szaniawski (red.), Metody statystyczne w socjologii (s. 11-69), Warszawa, PWN. Loevinger J. (1957), Objective tests as Instruments of psychological theory, „Psychological Reports", 3, 635-694. Lord F. M. (1980), Introduction to item response theory, Hillsdale, NJ, L. Erlbaum. Lord F. M., Novick M. R. (1968), Statistical theories of mental test scores, Reading, MA, Addison- -Wesley. Lu K. H. (1971), Statistical control of impurity in the estimation of test reliability, „Educational and Psychological Measurement", 31, 641-655. Maccoby E. E., Maccoby N. (1954), The intemiew: A tool for social science, w: G. Lindzey (red.), Handbook of social psychology, t. 1 (s. 449-487), Cambridge, MA, Addison-Wesley. MacDonald M. L. (1979), Social psychology of psychologist: Volunteer vs. nonvolunteer therapists, „Psychological Report", 44, 311-314. Machowski A. (1993), Rzetelność testów psychologicznych. Dwa ujęcia modelowe, Warsza wa-Poznań, Wyd. Nauk. PWN. Magnusson D. (1991), Wprowadzenie do teorii testów (wyd. 2.), Warszawa, Wyd. Nauk. PWN. Magnusson D. (1992), Back to phenomena: Theory, methods, and statistics in psychological research, „European Journal of Personality", 6, 1-14. Magnusson D. (red.)(1981), Toward a psychology of situations. An interactional perspectiye, Hillsdale, NJ, L. Erlbaum. Magnusson D., Endler N. S. (red.)(1977), Personality at the crossroads: Current issues in interactional psychology, Hillsdale, NJ, L. Erlbaum. Marasculio L. A., McSweeney M. (1967), Nonparametric post hoc comparisons for trend, „Psycholo- gical Bulletin", 67, 401-412. Marciniak M., Szaniawski J. (1992), Słownik angielsko-polski dla informatyków (wyd. 2.), Warszawa, WNT. Marciszewski W. (red.)(1988), Mata encyklpedia logiki, Wrocław, Ossolineum. Marek T. (1989), Analiza skupień w badaniach empirycznych. Metody SAHN, Warszawa, PWN. Marek T., Noworol C. (1985), Wprowadzenie do wielozmiennowej analizy regresji, Kraków, Wyd. UJ. Marek T., Noworol C. (1987), Analiza sekwencyjna w badaniach psychologicznych, Warszawa, PWN. Marody M. (1974), Response-style — za i przeciw, „Studia Socjologiczne", 52, 141-158. Marsh H. W. (1990), Confirmatory factor analysis of multitrait-multimethod data: The construct vali- dation of multidimensional self-concept responses, .Journal of Personality", 58, 661-692. Marsh H. W., Hocevar D. (1983), Confirmatory factor analysis of multitrait-multimethod matrices, .Journal of Educational Measurement", 20, 231-248. Maruszewski T. (1983), Analiza procesów poznawczych jednostki w świetle idealizacyjnej teorii nauki, Poznań, Wyd. Nauk. UAM. Maslow A. H. (1942), Self-esteem (dominance feelings) and sexuality in women, .Journal of Social Psychology", 16, 259-293. Maslow A. H., Sakoda J. M. (1952), Volunteer-error in the Kinsey study, .Journal of Abnormal and Social Psychology", 47, 259-262. 671 Matarazzo J. D. (1987), There is only one psychology, no specialties, but many appłications, .American Psychologist", 42, 893-903. Matczak A. (1994), Diagnoza intelektu, Warszawa, Wyd. Inst. Psychol. PAN. Matczak A., Piotrowska A., Ciarkowska W. (1991), Skala inteligencji D. Wechslera dla Dzieci — wersja zmodyfikowana — WISC-R. Podręcznik, Warszawa, Pracownia Testów Psychologicznych Poi. Tow. Psychol. Matkowski M. (1992), MMPI: badanie — opracowanie — interpretacja, Poznań, Pracownia Terapii i Rozwoju Osobowości. Matuszewski A. (1984), Interpretacja formalna wyników w testach psychologicznych, w: J. Brzeziński (red.), Wybrane zagadnienia z psychometrii i diagnostyki psychologicznej (s. 47-71), Poznań, Wyd. Nauk. UAM. McDermott M. (1995), Okrucieństwo, etyka i eksperymenty. Portret Philipa G. Zirnbardo, „Nowiny Psychologiczne", 4, 5-12. Meehl P. E. (1960), Clinical versus statistical prediction. A theoretical analysis and review of the evidence, Minneapolis, MN, University of Minnesota Press. Meehl P. E. (1970), Nuisance variables and the ex post facto design, w: M. Radner, S. Winokur (red.), Minnesota Studies in Philosophy of Science, t. 4 (s. 373^402), Minneapolis, MN, University of Minnesota Press. Melton A. W. (1962), Editorial, ,Journal of Experimental Psychology", 64, 553-557. Messick S. (1980), Test validity and the ethics of assessment, „American Psychologist", 35, 1012-1027. Messick S. (1989), Validity, w: R. L. Linn (red.), Educational measurement (wyd. 3.)(s. 13-103), New York, Macmillan. Messick S. (1995), Validity of psychological assessment. Validation of inferences from persons respon- ses and performances as scientific iąuiry into score meaning, „American Psychologist", 50, 741-749. Milgram S. (1963), Behavioral study of obedience, .Journal of Abnormal and Social Psychology", 67, 371-378. Milgram S. (1970), The individual in a social world: Essays and experiments, Reading, MA, Addison- -Wesley. Mili J. S. (1962), System logiki dedukcyjnej i indukcyjnej, t. 1-2. Warszawa, PWN. Miller A. G. (1972), Role-playing: An alternative to deception? „American Psychologist", 27, 623-636. Mokken R. J. (1971), A theory and procedurę of scalę analysis, Paris, Mouton. Morrison D. F. (1970), Multivariate statistical methods (wyd. 3.), New York, McGraw, Hill. Morrison D. F. (1990), Wielowymiarowa analiza statystyczna, Warszawa, Wyd. Nauk. PWN. Mosier C. I. (1943), On the reliability of a weighted composite, „Psychometrika", 8, 161-168. Mosier C. I. (1947), A crińcal examination of the concepts offace validity, „Psychometrika", 7, 191-205. Muszyński H. (1971), Wstęp do metodologii pedagogiki, Warszawa, PWN. Muszyński H. (1976), Zarys teorii wychowania, Warszawa, PWN. Nagel E. (1970), Struktura nauki, Warszawa, PWN. Nederhof A., J. (1991), Metody korygowania zniekształcającego wpływu zmiennej aprobaty społecznej; przegląd badań, w: J. Brzeziński, J. Siuta (red.), Społeczny kontekst badań psychologicznych i pedagogicznych. Wybór tekstów (s. 33-59), Poznań, Wyd. Nauk. UAM. Neuliep J. W. (red.)(1991), Replication research in the social sciences, Newbury Park, CA, Sagę. Newberry B, H. (1973), Truth telling in subjects with information about experiments: Who is being deceived? ,Journal of Personalny and Social Psychology", 25, 364-374. Nęcka E. (1987), Proces twórczy i jego ograniczenia, Kraków, Wyd. UJ. Nęcka E. (1994a), Inteligencja i procesy poznawcze, Kraków, Oficyna Wydawnicza Impuls. Nęcka E. (1994b), TROP... Twórcze rozwiązywanie problemów, Kraków, Oficyna Wydawnicza „Impuls". Nęcka E., Stocki R. (1991), Jak pisać prace naukowe z psychologii, Kraków, Uniwersitas. Nickles T. (1988), Questioning and problems in philosophy of science: Problem solving versus directly truth-seeking epistemologies, w: M. Meyer (red.), Questions and ąuestioning (s. 43-67), Berlin, Walter de Gruyter. Nickles T. (1989), Justification and experiment, w: D. Gooding, T. Pinch, S. Schaffer (red.), The use of experiment: Studies of experiment in the natural sciences (s. 299-333), Cambridge, Cambridge University Press. 672 Niemierko B. (1975), Testy osiągnięć szkolnych. Podstawowe pojęcia i techniki obliczeniowe, Warszawa, WSiP. Niemierko B. (1990), Pomiar sprawdzający w dydaktyce. Teoria i zastosowania, Warszawa, PWN. Noruśis M. J. (1992), SPSS / PC +; Base system users's guide. Version 5.0; Professional statistics; Advanced statistics; Trends for time series analysis, Chicago.IL, SPSS INC. Nosal C. S. (1977), Psychologia pracy. Organizacja psychiki i działania człowieka, Wrocław, Wyd. Nauk. Politechniki Wrocławskiej. Nosal C. S. (1987), Interpretacja zależności między zbiorami zmiennych w ramach modelu analizy kanonicznej, w: J. Brzeziński (red.), Wielozmiennowe modele statystyczne w badaniach psycholo- gicznych (s. 152-170), Warszawa-Poznań, PWN. Nowak L. (1974), Zasady marksistowskiej filozofii nauki, Warszawa, PWN. Nowak L. (1977), Wstęp do idealizacyjnej teorii nauk, Warszawa, PWN. Nowak L. (1980), The stmcture of idealization, Dordrecht, D. Reidel. Nowak S. (1965a), Pojęcia i wskaźniki, w: S. Nowak (red.), Studia z metodologii nauk społecznych (s. 245-281), Warszawa, PWN. Nowak S. (red.)(1965b), Metody badań socjologicznych. Wybór tekstów, Warszawa, PWN. Nowak S. (1968), Przyczynowe interpretacje zależności statystycznych w nieekspery mentalnych bada- niach socjologicznych, w: K. Szaniawski (red.), Metody statystyczne w socjologii (s. 91-182), Warszawa, PWN. Nowak S. (1970), Metodologia badań socjologicznych, Warszawa, PWN. Nowak S. (1985), Metodologia badań społecznych, Warszawa, PWN. Nowakowska M. (1970), Polska adaptacja 16-czynnikowego Kwestionariusza Osobowości R. B. Cat- tella, „Psychologia Wychowawcza", 13, 478-500. Nowakowska M. (1975), Psychologia ilościowa z elementami naukometrii, Warszawa, Wyd. Nauk. PWN. Nunnally J. C. (1978), Psychometric theory (wyd. 2.), New York, McGraw-Hill. Nunnally J. C. (1988), Analiza danych profilowych, w: J. Brzeziński (red.). Problemy teorii, rzetelności, konstrukcji i analizy wyników testów psychologicznych (s. 228-239) (Biblioteka Psychologa Prak- tyka, T. II), Warszawa, Wyd. Poi. Tow. Psychol. Nuttin J. M.,Jr. (1982), Kontrowersje wokół zmiany postaw. W kierunku teorii perswazji opartej na rozprzestrzenianiu się reakcji, Warszawa, PWN. Oktaba W. (1966), Elementy statystyki matematycznej i elementy doświadczalnictwa, Warszawa, PWN. Oktaba W. (1971), Metody statystyki matematycznej w doświadczalnictwie, Warszawa, PWN. Oktaba W. (1980), Metody statystytki matematycznej w doświadczalnictwie (wyd. 3.), Warszawa, PWN. Oleś P. (1995), Kryzys połowy życia u mężczyzn. Psychologiczne badania empiryczne, Lublin, Katolicki Uniwersytet Lubelski. Oliver R. L., Berger P. K. (1980), Advisability ofpretest designs in psychological research, „Perceptual and Motor Skills", 51, 463^71. Orne M. T. (1959a), The demand characteristics of an experimental design and their implications, Paper read at American Psychological Association, Cincinnati. Orne M. T. (1959b), The naturę of hypnosis: Artifact and essence, .Journal of Abnormal and Social Psychology", 58, 277-299. Orne M. T. (1962), On the social psychology of the psychological experiment: With particular refe- rence to demand characteristics and their implication, „American Psychologist", 17, 776-783. Orne M. T. (1969), Demand characteristics and the concept of ąuasi-controls, w: R. Rosenthal, R. L. Rosnow (red.), Artifact in behavioral research (s. 143-179), New York, Academic Press. Orne M. T. (1970), Hypnosis, motivation, and the ecological validity of the psychological experiment, w: W. J. Arnold, M. M. Page (red.), Nebraska Symposium on Motiration (s. 187-265), Lincoln, NE, University of Nebraska Press. Orne M. T. (1973), Communication by the total experimental situation: Why it is important, how it is evaluated, and its significance for ecological validity of findings, w: P. Pliner, L. Krames, T. Alloway (red.), Communication and effect (s. 157-191), New York, Academic Press. Orne M. T. (1991), Eksperyment psychologiczny z punktu widzenia psychologii społecznej ze szczególnym uwzględnieniem wpływu zmiennych sugerujących hipotezę i ich implikacji, w: J. Brzeziński, 673 J. Siut a (red .), Spo łecz ny kon teks t bad ań psy cho logi czn ych i ped ago gicz nyc h. Wy bór teks tów (s. 15-32), Poznań, Wyd. Nauk. UAM. Ome M. T. (1993), Komunik owanie się w sytuacji eksperym entalnej: dlaczego jest istotne, jak jest oce nia ne i jaki e ma zna cze nie dla traf noś ci ekol ogic znej , w: J. Brz eziń ski (red .), Psy chol ogic zne i psychome tryczne problemy diagnosty ki psycholog icznej (s. 3-68), Poznań, Wyd. Nauk. UAM. Orne M. T., Scheibe K. E. (1964), The contributi on of non- deprivati on factors in the productio n of sens ory dep riva tion effe cts: The psyc holo gy of the pani e butt on, , Jour nal of Abn orm al nad Soci al P sych olog y", 68, 3-12. Ostro wska K. (198 6), Test Przy miot niko wy H. Gou gha i A. Heilb runa. Opra cowa nie psyc home tr War sza wa, Aka dem ia Teo logi i Kat olic kiej. Oerall J. E., Klett C. J. (1972), Applied multivari ate analysis, New York, McGraw- Hill. Overall J. E., Spiegel D. K. (1969), Concerni ng least sąuares analysis of experime ntal data, „Psyc logi cal Bulletin", 72, 311- 322. Overall J. E., Woodwar d J. A. (1975), Unreliabi lity of difference scores: A paradox for measure ment ofc han ge „Ps ych olo gica l Bul leti n", 82, 85- 86. Paluchow ski Wł. J. (red.)(198 3), Z zagadnie ń diagnosty ki osobowoś ci, Wrocław, Ossolineu m. Palucho ws ki Wł . J. (19 91) , Di ag noz ow ani e oso bo wo ści. Tes to wa nie — int erp ret acj a — int er we ncj a, Po zn ań, W yd. Na uk. U A M i Na ko m. Palucho ws ki Wł . J. (re d.) (19 92) , Ws pół cze sne tec hni ki ba da wc ze w psy ch olo gii kli nic zne j, W ars za wa , Poi . To w. Ps yc hol . La b. Te ch nik Di ag no sty cz ny ch, („ Bi bli ote ka Ps yc hol og a Pra kty ka" , to m 2.). Paszkiew icz E. (19 77) , Th e con text of dis cov ery an d the con text of just ific ati on — an op pos itio n or a co mp lem ent arit y? „P ozn ań Stu die s in the Phi los op hy of the Sci enc es and the Hu ma niti es" , 3, 25 6- 26 4. A ms ter da m, B. R. Gr un er. Paszkiew icz E. (1983), Struktura teorii psycholo gicznych, Warszaw a, PWN. Paszkiew icz E. (19 85a ), O zas tos ow ani u mie rni kó w wie lko ści efe ktu eks per ym ent aln ego , w: E. Pas z- kie wic z, T. Szu stro wa (re d.), Ma teri ały do nau cza nia psy cho log ii, seri a III, t. 4 (s. 100 - 108 ), Wa rsz aw a, Wy d. Na uk. P W N. Paszkiewi cz E. (19 85b ), Pod sta wy pro ces u bad awc zeg o w psy cho logi i, w: E. Pas zkie wic z, T. Szu stro wa (red .), Ma teri ały do nau cza nia psy cho logi i, seri a III, t. 4 (s. 128 - 164 ), Wa rsza wa, Wy d. Na uk. PW N. Paszkiew icz E., Szu stro wa T. (red .)(1 985 ), Met ody bad ań psy chol ogic zny ch, Mat eria ły do nau cza nia psy cho logi i, seri a III, tom 4, Wa rsza wa, PW N. Patryas W. (1976), Eksperym ent a idealizacj a, Warszaw a-Poznań, PWN. Pawłows ka B. (19 83), Zas ady ling wist ycz nej ada pta cji met od kwe stio nar iusz owy ch, w: Wł. J. Pal uch o- ws ki (re d.) Z zag adn ień dia gno styk i oso bo woś ci (s. 291 - 300 ), Wr ocł aw, Oss olin eu m. Pawłows ki T. (1969), Metodolo giczne zagadnie nia humanist yki, Warszaw a, PWN. Pawłows ki T. (1986), Tworzeni e pojęć i definowa nie w naukach humanist ycznych. Warszaw a, PWN Pawłows ki Z. (1972), Wstęp do statystycz nej metody reprezent acyjnej, Warszaw a, PWN. PBS (19 95), Og óln opo lska pró ba los ow o- udz iało wa, Sop ot, Pra co wni a Bad ań Spo łecz nyc h (ma szy no- pis) . Pedhazur E. (19 82), Mul tipl e reg ress ion in beh avi oral rese arc h. Exp lan atio n and pre diet ion, (wy d. 2.), Ne w Yor k, Hol t, Rin eha rt and Wi nst on. Petrażyck i L. (1939), Nowe podstawy logiki i klasyfikac ji umiejętno ści, Warszaw a. Philips L. D. (1973), Bayesian statisties for social sciences, London, Nelson. Płużek Z. (19 71), Wa rtoś ć test u WI SK AD - M MP I dla dia gno zy róż nic ow ej w zak resi e noz olo gii psy chi atr ycz nej, Lu blin , Kat olic ki Uni wer syt et Lu bel ski. Podgórec ki A. (1957), Założeni a polityki prawa, Warszaw a, PWN Podgórec ki A. (1962), Charakte rystyka nauk praktyczn ych, Warszaw a, PWN. Polkingh orn e D. E. (19 91), Tw o con flict ing call s for met hod olo gic al refo rm, „Th e Co uns elin g Psy cho - logi st", 19, 103 - 114 . Polskie To war zyst wo Hig ieny Psy chic znej , PT HP (19 72), Inst ruk cja do Skal i Inte lige ncji D. Wec hsle ra dla mło dzie ży i dor osły ch, Wa rsza wa, PT HP. Polskie To war zyst wo Psy cho logi czn e, PT P (19 92), Ko dek s etyc zno - zaw odo wy psy cho log a, Wa rsza wa, PTP . Popper K. R. (1977), Logika odkrycia naukowe go, Warszaw a, PWN. 674 Popper K. R. (1992), Wiedza obiektywna. Ewolucyjna teoria epistemologiczna, Warszawa, Wyd. Nauk. PWN. Poznaniak W. (1991), Dylematy etyczne w psychologii, w: J. Goćkowski, K. Pigoń (red.), Etyka za- wodowa ludzi nauki (s. 131-144), Wrocław, Ossolineum. Przełęcki M. (1966a), Operacjonizm, w: T. Pawłowski (red.), Logiczna teoria nauki (s. 122-129), Warszawa, PWN. Przełęcki M. (1966b), Pojęcia teoretyczne a doświadczenie, w: T. Pawłowski (red.), Logiczna teoria nauki (s. 449-504), Warszawa, PWN. „Psychol. Rev." (1945), Symposium on operationism, 52 (5), cały numer. Rapaport D. (1945), Diagnostic psychological testing, t. 1, Chicago, IL, Yearbook Publ. Rapaport D., Gili M. M, Schafer R. (1968). Diagnostic psychological testing (wyd. zm.), New York, International Universities Press. Ratajczak Z. (1994), Etyka ekspertów, w: J. Brzeziński, W. Poznaniak (red.), Etyczne problemy dzia- łalności badawczej i praktycznej psychologów (s. 175-183), Poznań, Wyd. Fundacji Humaniora. Raven J. C, Court H. J., Raven J. (1985), Manuał for Ravens Progressive Matrices and Vocabulary Scales. cz. 1, r. 1, General overview, London, H. K. Lewis and Co (polski przekład: Warszawa, Poi. Tow. Psychol., 1991). Reichenbach H. (1960), Powstanie filozofii naukowej. Warszawa, PWN. Reid D. D. (1972), Metody epidemiologiczne w badaniu zaburzeń psychicznych. Warszawa, PZWL. Rembowski J. (1972), Więzi uczuciowe w rodzinie. Warszawa, PWN. Reynolds C. R., Gutkin T. B. (1981), Test scatter on the WPPSI: Normative analyses of the stan- dardization sample, .Journal of Learning Disabilities", 14, 460-464. Rezmowic E., L., Rezmowic V. (1981), A confirmatory factor analysis approach to construct valida- tion, „Educational and Psychological Measurement", 41, 61-72. Ricks J. H., Jr. (1993), Normy lokalne — kiedy i dlaczego? w: J. Brzeziński, E. Hornowska (red.), Z psychometrycznych problemów diagnostyki psychologicznej (s. 49—58), Poznań, Wyd. Nauk. UAM. Riecken H. (1962), A program for research on experiments in social psychology, w: N. F. Washburne (red.), Decisions, values and groups, t. II (s. 25^łl), Elmsford, NY, Pergamon Press. Rokeach M. (1960), The open and closed mind, New York, Basic Books. Rosenberg M. J. (1965), When dissonance fails: On eliminating evaluation apprehension from attitude measurement, , Journal of Personality and Social Psychology", 1, 2%-M. Rosenberg M. J. (199la), Gdy dysonans zawodzi: o eliminowaniu leku przed oceną z pomiaru postaw, w: J. Brzeziński, J. Siuta (red.), Społeczny kontekst badań psychologicznych i pedagogicznych. Wybór tekstów (s. 33-59), Poznań, Wyd. Nauk. UAM. Rosenberg M. J. (1991b), Warunki powstawania oraz konsekwencje lęku przed oceną, w: J. Brzeziński, J. Siuta (red.), Społeczny kontekst badań psychologicznych i pedagogicznych. Wybór tekstów (s. 61-135), Poznań, Wyd. Nauk. UAM. Rosenthal R. (1966), Experimenter effects in behavioral research, New York, Appleton-Century-Crofts. Rosenthal R. (1969), Interpersonal expectations, w: R. Rosenthal, R. L. Rosnow (red.), Artifact in behavioral research (s. 181-277), New York, Academic Press. Rosenthal R. (1973), The mediation of Pygmalion effects: A four-factor theory, „Papua New Guinea Journal of Education", 8, 95-116. Rosenthal R. (199la), Oczekiwania interpersonalne. Skutki przyjętej przez badacza hipotezy, w: J. Brzeziński, J. Siuta (red.), Społeczny kontekst badań psychologicznych i pedagogicznych. Wybór tekstów (s. 235-339), Poznań, Wyd. Nauk. UAM. Rosenthal R. (1991 b), O społecznej psychologii samospełniającego się proroctwa. Dalsze dane po- twierdzjace istnienie efektów Pigmaliona i mechanizmów pośredniczących w ich występowaniu, w: J. Brzeziński, J. Siuta (red.), Społeczny kontekst badań psychologicznych i pedagogicznych. Wybór tekstów (s. 341-387). Poznań, Wyd. Nauk. UAM. Rosenthal R. (1991c), Meta-analytic procedures for social research (wyd. 2.), Newbury Park.CA, Sagę. Rosenthal R. (199Id), Replication in behavioral research, w: J. W. Neuliep (red.), Replication research in the social sciences (s. 1-30), Newbury Park, CA, Sagę. Rosenthal R. (1993), Interpersonal expectations: Some antecedents and some conseąuences, w: 675 P. D. Blanek (red.), lnterpersonal expectations. Theory, research, and applications (s. 3-24), Cambridge, Cambridge University Press. Rosenthal R. (1994a), Science and ethics in condueting, analyzing, and reporting psychological re- search, „Psychological Science", 5, 127-139. Rosenthal R. (1994b), On being ones own study: Experimenter effects in behavioral research — 30 years later, w: W. R. Shadish, S. Fuller (red.), The social psychology of science (s. 214-229), New York, The Guilford Press. Rosenthal R., Jacobson L. (1968), Pygmalion in the elassroom, New York, Holt, Rinehart and Winston. Rosenthal R., Jacobson L. (1992), Pygmalion in the elassroom (wyd. zm.), New York, Holt, Rinehart and Winston. Rosenthal R., Rosnow R. L. (1984), Essentials of behavioral research. Methods and data analysis, New York, McGraw-Hill. Rosenthal R., Rubin D. B. (1978), lnterpersonal expectancy effects: Thefirst 345 studies, „Behav/oraJ and Brain Sciences", 3, 377-386. Rosenthal R., Rosnow R. L. (1975), The volunteer subject, New York, Wiley-Interscience. Rosenthal R., Rosnow R. L. (1984), Essentials of behavioral research. Methods and data analysis, New York, McGraw-Hill. Rosenthal R., Rosnow R. L. (1991), Essentials of behavioral research. Methods and data analysis (wyd. 2.), New York, McGraw-Hill. Rosenzweig S. (1933), The experimental situation as a psychological problem, „Psychological Re- view", 40, 337-354. Rosnow R. L., Rosenthal R. (1974), Taming of the volunteer problem: On coping with artifacts by benign neglect, „Journal of Personalny and Social Psychology", 30, 188-190. Rosnow R. L., Rosenthal R. (1976), The yolunteer subject revisited, „Australian Journal of Psycholo- gy", 28, 97-108. Ross J., Smith P. (1968), Orthodox experimental designs, w: H. M. Blalock, Jr., A. B. Blalock (red.), Methodology in social research, New York, McGraw-Hill. Rotter J. B. (1966), Generalized expectancies for internat versus external control of reinforcement, „Psychological Monographs", 80, cały numer. Rubinsztejn S. J. (1979), Metody patopsychologii eksperymentalnej. Podręcznik metodyczny. Warszawa, PAWL. Rudniański J. (1975), Fazy rozwiązywania problemów naukowych, „Zagadnienia Naukoznawstwa", 11, 19-45. Rulon P. J. (1939), A simplified procedurę for determining the reliability of a test by split-hahes, „Harvard Educational Review", 9, 99-103. Ryans D. G. (1960), Characteristics of teachers, Washington, DC, American Council of Education. Sattler J. M. (1988), Assessment ofchildren (wyd. 3.), San Diego, CA, Author. Scheffe H. (1959), The analysis ofvariance, New York, J. Wiley. Schmidt F. L. (1995), Co naprawdę oznaczają dane? Wyniki badawcze, metaanaliza i wiedza kumu- latywna w psychologii, „Czasopismo Psychologiczne", 1 (1-2), 1931 Schmitt N., Stults D. M. (1986), Methodological review: Analysis of multitrait-multimethod matrices, „Applied Psychological Measurement", 10, 1-22. Schuyler W. H., Chuang I., Ranney G. (1981), An empirical investigation of Lus method of reliability estimation, „Educational and Psychological Measurement", 41, 23-34. Schwarzer R. (1983), The evaluation of convergent and discriminant validity by use of structural eąuations, „Arch. Psychol.", 135, 219-243. Seligman D. (1995), O inteligencji prawie wszystko. Kontrowersje wokół ilorazu inteligencji, Warsza- wa, Wyd. Nauk. PWN. Seligman M. E. P. (1995), The effectiveness of psychoterapy. The consumer reports study, „American Psychologist", 50, 965-974. Selye H. (1967), Od marzenia do odkrycia naukowego. Warszawa, PZWL. Seul S. (1995), Oczekiwania nauczyciela a wyniki nauczania, Szczecin, Wyd. Uniwersytetu Szczeciń- skiego. Sęk H. (1969), Zadania psychologa w klinice psychiatrycznej, w. A. Lewicki (red.), Psychologia kli- niczna (s. 157-383), Warszawa, PWN. 676 Sherif M., Sherif C. (1953), Groups in harmony and tension, New York, Harper. Sieber J. E. (1982), Deception in social research I: Kinds of deception and the wrongs they may involve, „IRB: A Review of Human Subjects Research", 4 (9), 1-6. Siegel S. (1956), Nonparametric statistics for the behavioral sciences, New York, McGraw-Hill. Siemianowski A. (1976), Poznawcze i praktyczne funkcje nauk empirycznych, Warszawa, PWN. Sigall H., Aronson E., Van Hoose T. (1970), The cooperative subject: Myth or reality? „Journal of Experimental Social Psychology", 6, 1-10. Silverstein A. B. (1963), W1SC and WA1S lQs for the mentally retarded, „American Journal of Mental Deficiency", 67, 617-618. Silverstein A. B. (1987), Two indices of subtest scatter on Wechslers intelligence scales: Estimated vs. empirical values, „Journal of Clinical Psychology", 43, 409-414. Silverstein A. B. (1988), Estimated vs. empirical values of scaled-score ranges on Wechslers intelli- gence scales: A correction, , Journal of Clinical Psychology", 44, 259-261. Simon H. A. (1977), Models of discovery and other topics in the methods of science, Dordrecht, D. Reidel. Skarżyńska K. (1976), Postawy interpersonalne a karanie i nagradzanie, w: S. Mika (red.), Studia nad postawami interpersonalnymi (s. 15-78), Wrocław, Ossolineum. Skinner B. F. (1950), Are theories of learning necessary?, „Psychological Review", 57, 193-216. Skinner Ch. E. (red.)(1971), Psychologia wychowawcza, Warszawa, PWN. Słoma J. (1983), Psychological experiment as experimental theater, „Polish Psychological Bulletin", 14, 159-169. Słownik naukowo-techniczny angielsko-polski (1983), Warszawa, WNT. Solomon R. L. (1949), An extension of control group design, „Psychological Bulletin", 46, 137-150. Solomon R. L., Lessac M. S. (1968), A control group design for experimental studies of developmental processes, „Psychological Bulletin", 70, 145-150. Sosnowski T., Zimmer K. (red.)(1993), Metody psychofizjologiczne w badaniach psychologicznych. Warszawa, Wyd. Nauk. PWN. Stachowski R. (1976), Sprawdzalnośc empirycznej trafności ilościowych praw psychologii jako funkcja trafności skali pomiarowej, „Studia Metodologiczne", 13, 133-142. Stanik J. (1994), Etyczno-zawodowe problemy biegłego sądowego psychologa, w: J. Brzeziński, W. Po- znaniak (red.), Etyczne problemy działalności badawczej i praktycznej psychologów (s. 197-226), Poznań, Wyd. Fundacji Humaniora. Stanisławski J. (1968), Wielki słownik angielsko-polski. Warszawa, Wiedza Powszechna. Stanley J. C. (1961), Analysis of unreplicated three way classifications with applications to rater bias and trait independence, „Psychometrika", 26, 205-219. Stasiakiewicz M. (1984), Podmiotowe i sytuacyjne wyznaczniki badania testem Rorschacha, Poznań, Wyd. Nauk. UAM. Steczkowski J. (1995), Metoda reprezentacyjna w badaniach zjawisk ekonomiczno-społecznych, War- szawa, Wyd. Nauk. PWN. Sterling T. D. (1959), Publication decisions and their possible effects on inferences drawn from tests of significance — or vice versa, .Journal of the American Statistical Association", 54, 30-34. Sternberg R. J. (1985), Beyond IQ. A triarchic theory of human intelligence, Cambridge, Cambridge University Press. Sternberg R. J. (1995), The psychologist's companion. A guide to scientific writing for students and researchers (wyd. 3.), Cambridge, MA, Cambridge University Press. Stevens S. S. (1935), The operational basis of psychology, „American Journal of Psychology", 47, 323-330. Stevens S. S. (1951), Mathematics, measurement andpsychophysics, w: S. S. Stevens (red.), Handbook of experimental psychology (s. 1-49), New York, J. Wiley. Stevens S. S. (1959), Measurement, psychophysics and utility, w: C. W. Churchman, Ph. Ratoosh (red.), Measurement. Definitions and theories (s. 18—63), New York, J. Wiley. Stonert H. (1967), Charakterystyka twierdzeń nauk praktycznych w aspekcie metodologicznym, „Pra- kseologia", 28, 21-71. Straś-Romanowska M. (1992), Los człowieka jako problem psychologiczny- Podstawy teoretyczne, Wrocław, Wyd. Uniwersytetu Wrocławskiego. Strelau J. (1985), Temperament — osobowość— działanie, Warszawa, PWN. \ 677 Strelau J. (1987), O inteligencji człowieka, Warszawa, Wiedza Powszechna. Strelau J. (1992), Badania nad temperamentem. Teoria, diagnoza, zastosowania, Wrocław, Ossolineum. Strelau J. (1994), Kodeks etyczno-zawodowy psychologa. Wybrane refleksje na jego tle, „Nauka", 4, 109-114. Stróżewski W. (1991), Kilka uwag o prawdzie, w: J. Goćkowski, K. Pigoń (red.), Etyka zawodowa ludzi nauki (s. 65-72), Wrocław, Ossolineum. Stróżewski W. (1992), O idei uniwersytetu, w: W. Stróżewski, W kręgu wartości (s. 7-26), Kraków, Wyd. Znak. Strzyżewski W., Brzeziński J. (1979), Metodyczne aspekty doboru grup chorych do badań leków psy- chotropowych, „Psychiatria Polska", 13, 161-164. Such J. (1973), Wstęp do metodologii ogólnej nauk, Poznań, Wyd. Nauk. UAM. Such J. (1975a), Problemy weryfikacji wiedzy, Warszawa, PWN. Such J. (1975b), Pojęcie hipotezy ad hoc, „Studia Filozoficzne", 118, 95-110. Suits D. (1957), Use ofdummy variables in regression eąuations, „Joumal of the American Statistical Association", 52, 548-551. Sułek A. (1979), Eksperyment w badaniach społecznych, Warszawa, PWN. Sułek A. (1993), Jak działa filtr „nie wiem"? O perspektywie poznawczej w metodologii badań son- dażowych, „Kultura i Społeczeństwo", 37 (3), 31-44. Szaniawski K. (1991), Etyka krytyki naukowej, w: J. Goćkowski, K. Pigoń (red.), Etyka zawodowa ludzi nauki (s. 167-175), Wrocław, Ossolineum. Szaniawski K. (1993), Plus ratio ąuam vis (prwdr. 1981), w: K. Szaniawski, O nauce, rozumowaniu i wartościach. Pisma wybrane (s. 523-530), Warszawa, Wyd. Nauk. PWN. Szarkowski A. (1968), O miernikach zależności między zmiennymi losowymi, W: K. Szaniawski (red.), Metody statystyczne w socjologii (s. 183-231), Warszawa, PWN. Szustrowa T. (1972), Zdolność do działania na rzecz celów pozaosobistych a niektóre właściwości rodzinnego treningu wychowawczego, w: J. Reykowski (red.), Studia z psychologii osobowości (s. 12-80), Warszawa, Wyd. UW. Szustrowa T. (red.)(1987), Swobodne techniki diagnostyczne. Wywiad i obserwacja, Warszawa, Wyd. Uniw. Warszawskiego. Terelak J., Cieciura M, Terelak H. (1991), Warszawski system testów psychologicznych „PSYCHO- KOMP": założenia psychologiczne i informatyczne, „Przegląd Psychologiczny", 34, 647-656. Thorndike R. L. (1961), Personnel selection. Test and measurement techniąues, New York, J. Wiley. Thorndike R. L., Hagen E. P., Sattler J. M. (1986), The Stanford-Binet Intelligence Scalę: Fourth Edition, Chicago, Riverside. Thurstone L. L. (1926), The Mental-age concept, „Psychological Review", 33, 268-278. Timm N. H. (1975), Multivariate anałysis with appłications in education and psychology, Monterey, Brooks/Cole Pub. Co. Toeplitz Z. (1994), Etyczne dylematy nauczania psychologii, w: J. Brzeziński, W. Poznaniak (red.), Etyczne problemy działalności badawczej i praktycznej psychologów (s. 227-239), Poznań, Wyd. Fundacji Humaniora. Tomaszewski T. (1963), Wstęp do psychologu, Warszawa, PWN. Tomaszewski T. (red.)(1975), Psychologia, Warszawa, PWN. Tomaszewski T. (red.)(1992), Psychologia ogólna (t. 1.: Kozielecki J. Percepcja, myślenie, decyzje; t. 2.: Reykowski J. Emocje, motywacja, osobowość; t. 3: Kurcz I.: Pamięć, uczenie się, język; t. 4.: Strelau J. Temperament, inteligencja), Warszawa, PWN. Tomaszewski T., Ratajczak Z. (1988), Treść ekspertyz naukowych i współdziałanie eksperta z użytkow- nikiem, w: Z. Ratajczak (red.), Ekspertyzy naukowe a praktyka społeczna (s. 11-23), Katowice, Wyd. Nauk. UŚ1. Topolski J. (1983), Teoria wiedzy historycznej, Poznań, Wyd. Poznańskie. Topolski J. (1984), Metodologia historii (wyd. 3.), Warszawa, PWN. Torgerson W. S. (1958), Theory and methods of scaling, New York, J. Wiley. Townsend J. C. (1953), Introduction to experimental method, New York, McGraw-Hill. Tuchańska B. (1980), Czynnik — wielkość — związek — zależność, Warszawa- Poznań, PWN. Tukey J. W., Mosteller F. (1977), Data anałysis and regression. A second course in statistics, Reading, MA, Addison-Wesley. 678 Twardowski K. (1933), O dostojeństwie Uniwersytetu, Poznań, Uniwersytet Poznański, Rolnicza Dru- karnia i Księgarnia Nakładowa. Tyszkowa M. (1972), Zachowanie się dzieci szkolnych w sytuacjach trudnych, Warszawa, PWN. Vegelius J. (1976), On various G index generalizations and their applicability within the clinical domain, „Studia Psychologica Uppsaliensia", 4 Upsala, Acta Universitatis Uppsaliensis. Vegelius J. (1979), A G index generalization for trichotomized data, „Educational and Psychological Measurement", 39, 23-27. Vegelius i. (1981), Significance testsfor the GTindex, „Educational and Psychological Measurement", 41, 99-108. Wahlsten (1990), lnsensitivity of the analysis ofvariance to heredity-environment interaction, „Beha- vioral and Brain Sciences", 13, 109-161. Wainer H., Braun H. I. (1988), Test validity, Hillsdale.NJ, L. Erlbaum. Wald A. (1947), Seąuential analysis, New York, J. Wiley. Wallen R. (1964), Psychologia kliniczna, Warszawa, PWN. Walton Braver M. C, Braver S. L. (1988), Statistical treatment of the Solomon four-group design: A meta-analytic approach, „Psychological Bulletin", 104, 150-154. Ward J. H., Jr. (1969), Modele wielokrotnej regresji liniowej, w: H. Borko (red.), Maszyny cyfrowe w badaniach naukowych (s. 72-104), Warszawa, WNT. Watson J. B. (1919), Psychology from standpoint of a behaviorist, Philadelphia, Lippicott. Vatson J. B. (1990), Behawioryzm oraz Psychologia, jak widzi ją behawiorysta, Warszawa, PWN. Vechsler D. (1939), The measurement of adult intelligence, Baltimore, Wiliams and Wilkins. Wechsler D. (1981), Wechsler Adult Intelligence Scale-Revised. WAIS-R manuał, New York, The Psychological Corporation. Wechsler D. (1993), Definicja i natura inteligencji, w: J. Brzeziński, E. Hornowska (red.), Skala Inteligencji WAIS-R Wechslera. Polska adaptacja, standaryzacja, normalizacja i wykorzystanie w diagnostyce psychologicznej (s. 15—20), Warszawa, Wyd. Nauk. PWN. Werts C. E., Linn R. L. (1970), Path analysis: Psychological examples, „Psychological Bulletin", 74, 193-212. Werts C. E., Linn R. L., Joreskog K. G. (1978), Estimating the parameters of path models involving unmeasured variables, w: H. M. Blalock (red.), Causal models in the social sciences (s. 400- -409), Chicago, Aldine. Wieczorkowska-Siarkiewicz G. (1987), Skalowanie wielowymiarowe jako metoda badania percepcji, Warszawa, Wyd. Uniwersytetu Warszawskiego. Wiggins J. S. (1968), Personality and prediction: Principles of personality assessment, Reading, MA, Addison-Wesley. Winer B. J. (1971), Statistical principles in experimental design (wyd. 2.). New York, McGraw-Hill. Winer B. J., Brown D. R., Michels K. M. (1991), Statistical principles in experimental design (wyd. 3.), New York, McGraw-Hill. Wolman B. B. (1973), Dictionary ofbehavioral science, New York, Van Nostrand Reinhold. Woodward J. A. Overall J. E. (1975), Multivariate analysis ofvariance by multiple regression methods, „Psychological Bulletin", 82, 21-32. Wundt W. (1908), Grundziige der physiologischen Psychologie, Leipzig, Engelmann. Wywiał J. (1994), Przykłady wnioskowania statystycznego za pomocą komputerowego pakietu SPSS, Warszawa, Wydawnictwo PLJ. Yaremko R. M., Harari H., Harrison R. C, Lynn E. (1982), Reference handbook ofresearch and statistical methods in psychology: For students and professionals, Cambridge, MA, Harper and Row. Zakrzewska M. (1993), Analiza czynnikowa wyników: W-B I, WAIS, WAIS-R, w: J. Brzeziński, E. Hor- nowska (red.), Skala Inteligencji Wechslera WAIS-R. Polska adaptacja, standaryzacja, normali- zacja i wykorzystanie w diagnostyce psychologicznej (s. 295-326), Warszawa, Wyd. Nauk. PWN. Zakrzewska M. (1994), Analiza czynnikowa w budowaniu i sprawdzaniu modeli psychologicznych, Poznań, Wyd. Nauk. UAM. 679 Zakrzewska M. (1995), Konfirmacyjna analiza czynnikowa polskiej adaptacji Skali Inteligencji We- chslera — WAIS-R(PL). Wyniki wstępne, w: J. Brzeziński (red.), Z zagadnień diagnostyki psy- chologicznej (s. 53-74), Poznań, Wyd. Fundacji Humaniora. Zamiara K. (1974), Metodologiczne znaczenie sporu o status poznawczy teorii, Warszawa, PWN Zamiara K. (1995), Dynamika pojęć i programów psychologicznych. Szkice metodologiczne, Szczecin,. Wyd. Fundacja im. Kazimierza Ąjdukiewicza na rzecz Rozwoju Nauk Filozoficznych. Zasępa R. (1962), Badania statystyczne metodą reprezentacyjną, Warszawa, PWN. Zawadzki B. (1970), Wstęp do teorii osobowości, Warszawa, PWN. Zeigarnik B. W. (1969), Patologia myślenia', Warszawa, PWN. Zeigarnik B. W. (1978), Podstawy patopsychologii klinicznej, Warszawa, PWN. Zieliński R. (1972), Tablice statystyczne, Warszawa, PWN. Ziembiński Z. (1993), Logika praktyczna (wyd. 16.), Warszawa, Wyd. Nauk. PWN. Ziembiński Z. (1995), Logika praktyczna (wyd. 17.), Warszawa, Wyd. Nauk. PWN. Ziemski T., (1973), Problemy dobrej diagnozy, Warszawa, Wiedza Powszechna. Ziman J. (1972), Społeczeństwo nauki, Warszawa, PIW. Zimbardo P. G. (1973), On the ethics of internention in human psychological research: With speciai reference to the Stanford Prison Experiment, „Cognition", 2. 243—256. Zimbardo P. G., Ruch F. L. (1994), Psychologia i życie (wyd. 2.), Warszawa, Wyd. Nauk. PWN. Zimmerman I. L., Woo-Sam J. M. (1973), Clinical interpretation of the Wechsler Adult Intelhgenct Scalę, New York, Gnine and Stratton. 1 Zakrzewska M. (1995), Konfirmacyjna analiza czynnikowa polskiej adaptacji Skali Inteligencji We-- chslera — WAIS-R(PL). Wyniki wstępne, w: J. Brzeziński (red.), Z zagadnień diagnostyki psy- chologicznej (s. 53-74), Poznań, Wyd. Fundacji Humaniora. Zamiara K. (1974), Metodologiczne znaczenie sporu o status poznawczy teorii, Warszawa, PWN. Zamiara K. (1995), Dynamika pojęć i programów psychologicznych. Szkice metodologiczne, Szczecin, Wyd. Fundacja im. Kazimierza Ąjdukiewicza na rzecz Rozwoju Nauk Filozoficznych. Zasępa R. (1962), Badania statystyczne metodą reprezentacyjną, Warszawa, PWN. Zawadzki B. (1970), Wstęp do teorii osobowości, Warszawa, PWN. Zeigarnik B. W. (1969), Patologia myślenia", Warszawa, PWN. Zeigarnik B. W. (1978), Podstawy patopsychologii klinicznej, Warszawa, PWN. Zieliński R. (1972), Tablice statystyczne, Warszawa, PWN. Ziembiński Z. (1993), Logika praktyczna (wyd. 16.), Warszawa, Wyd. Nauk. PWN. Ziembiński Z. (1995), Logika praktyczna (wyd. 17.), Warszawa, Wyd. Nauk. PWN. Ziemski T., (1973), Problemy dobrej diagnozy, Warszawa, Wiedza Powszechna. Ziman J. (1972), Społeczeństwo nauki, Warszawa, PIW. Zimbardo P. G. (1973), On the ethics of internention in human psychological research: With speciai reference to the Stanford Prison Experiment, „Cognition", 2, 243—256. Zimbardo P. G., Ruch F. L. (1994), Psychologia i życie (wyd. 2.), Warszawa, Wyd. Nauk. PWN. Zimmerman I. L., Woo-Sam J. M. (1973), Clinical interpretation of the Wechsler Adult Intelligenct Scalę, New York, Griine and Stratton. ? .,*: