Uwagi dla czytelnika wersji elektronicznej „Procesów przetwarzania informacji u człowieka” Petera H. Lindsaya i Donalda A. Normana.: Numeracja znajduje się na górze strony. Indeksy nazwisk i rzeczowy zostały usunięte. Spis treści znajduje się na początku książki. Większość tabel została zamieniona na tekst i przystosowana do użytku dla czytelnika niewidomego. Do prawidłowego odczytania ich zawartości przez program Screen Reader, należy ustawić opcję CZYTANIE DOKUMENTÓW na wypowiadanie wszystkich znaków. Włączenie tej opcji konieczne jest również wtedy, gdy w tekście podane są wartości liczbowe z dokładnością do kilku miejsc po przecinku, aby mieć pewność, co do poprawności odczytania danych. We wzorach matematycznych i działaniach na liczbach zastąpiono słowami znaki: plus, minus, równa się, razy, podzielić, większy mniejszy. W przypadku wątpliwości, co do właściwego odczytu wzoru (np. obecność nawiasów) należy ustawić opcję CZYTANIE DOKUMENTÓW na wypowiadanie wszystkich znaków. Wszystkie rysunki schematy i wykresy zostały usunięte. W wielu przypadkach podjęto próbę zastąpienia ich opisem w nawiasach kwadratowych. Procesy przetwarzania informacji u człowieka wprowadzenie do psychologii Peter H.Lindsay Donald A. Norman Tłumaczył Artur Kowaliszyn Wydawnictwo Naukowe PWN Warszawa 1991 Z oryginału angielskiego: HUMAN INFORMATION PROCESSING. An Introduction to Psychology Copyright © 1972 by Harcourt Brace Jovanovich, Inc. Published by arrangement with Harcourt Brace Jovanovich, Inc. Redaktor naukowy Ida Kurcz Dodatki tłumaczyli Herbert Szafraniec (A) i Józef Radzicki (B) Redaktor Irena Kaltenberg Układ typograficzny Tadeusz Piasecki Korektorki Ewa Bojara, Ewa Dąbrowska, Janina Wanat Okładkę projektował Zygmunt Ziemka © Copyright for the Polish edition by Państwowe Wydawnictwo Naukowe Warszawa 1984 ISBN 83-01-04689-9 Wydawnictwo Naukowe PWN Wydanie drugie Arkuszy wydawniczych 55,25; drukarskich 43,5 Papier offsetowy klasy III 70 g, 70 x 100 cm Oddano do reprodukcji 9 grudnia 1991 r. Druk ukończono w lutym 1992 r. Zamówienie 2326/91 Olsztyńskie Zakłady Graficzne im. Seweryna Pieniężnego Spis treści Przedmowa do wydania polskiego... 17 Przedmowa... 19 Podziękowania... 21 Uwagi dla Czytelnika... 25 1. Spostrzeganie INTERPRETACJA PRZEKAZÓW SENSORYCZNYCH... 29 Dopasowywanie do wzorca... 29 ROZPOZNAWANIE OBRAZÓW... 35 Organizowanie niepełnych obrazów... 36 Obrazy konkurencyjne... 37 ORGANIZOWANIE INFORMACJI SŁUCHOWEJ.. 38 Obrazy pozbawione znaczenia... 39 Naginanie danych sensorycznych do przyjętej Interpretacji... 42 ZNACZENIE REGUŁ... 44 Spostrzeganie przestrzeni... 46 Znaczenie kontekstu... 55 ANALIZA CECH... 59 Zatrzymywanie obrazu... 61 Efekty następcze... 66 JAK UZYSKAĆ EFEKTY NASTĘPCZE RUCHU?... 67 Wyjaśnienie efektów następczych... 68 Adaptacja do barwy uzależniona od kierunku... 70 SPOSTRZEGANIE BEZ WYODRĘBNIANIA CECH... 72 Widzenie skórne... 72 2. Przetwarzanie informacji przez układ nerwowy OKO ŻABY... 77 ANATOMIA DETEKTORÓW 78 METODY FIZJOLOGICZNE... 80 Neuron... 80 Rejestracja reakcji neuronów... 82 TWORZENIE OBWODÓW NEURONOWYCH... 84 OBWODY PODSTAWOWE... 85 Budowa bloków... 85 WYODRĘBNIANIE KONTURÓW... 88 Wrażliwość a czułość sensoryczna... 88 Hamowanie oboczne... 89 Obwody służące do wyodrębniania konturów... 93 Pola centralne i peryferyjne... 101 Obwody włączeniowo-wyłączeniowe... 105 REAKCJE W CZASIE... 108 Obwody służące do wytwarzania przemijających reakcji... 109 REAGOWANIE NA RUCH... 112 Obwody służące do wykrywania ruchu... 114 PRZETWARZANIE SYGNAŁÓW W CIELE KOLANKOWATYM BOCZNYM 118 WYODRĘBNIANIE CECH... 120 Proste komórki... 120 DIPOLE... 127 Komórki złożone... 128 Komórki superzłożone... 130 WNIOSKI... 136 3. Teorie rozpoznawania obrazów PANDEMONIUM... 139 Cechy związane z rozpoznawaniem liter... 141 Jak zbudować pandemonium?... 141 Cechy związane z rozpoznawaniem mowy... 149 Detektory cech związane z analizą mowy... 151 Podsumowanie dotyczące analizy cech... 153 ANALIZA PRZEZ SYNTEZĘ... 154 Znaczenie kontekstu... 154 Mokre skarpetki... 156 Ważna rola redundancji... 158 DOKONYWANIE SYNTEZY PRZEKAZU SENSORYCZNEGO... 158 KOLEJNOŚĆ OPERACJI... 164 CECHY A OCZEKIWANIA... 165 4. System wzrokowy ŚWIATŁO... 171 DECYBELE... 172 DROGA WZROKOWA... 173 Źrenica... 173 Soczewka... 175 Siatkówka... 178 REAKCJE CHEMICZNE NA ŚWIATŁO... 178 Reakcja fotochemiczna... 179 NEUROANATOMIA WIDZENIA... 180 Sieć nerwowa siatkówki... 182 DROGA DO MÓZGU... 185 WYBÓR INFORMACJI WZROKOWEJ... 185 Ruchy oka... 185 Lokalizacja przedmiotów... 189 Widzenie bez udziału kory wzrokowej... 191 Widzenie bez udziału wzgórków czworaczych górnych... 193 5. Podstawowe właściwości widzenia SPOSTRZEGANIE JASNOŚCI... 195 Pasy Macha... 195 Kontrast jasności... 200 JASNOŚĆ A GŁĘBIA 203 ADAPTACJA... 206 Warstwice równej jasności... 209 WŁAŚCIWOŚCI WIDZENIA ZWIĄZANE Z CZASEM... 211 Czas integracji... 211 Kiedy migające światło wydaje się ciągłe?... 211 Krytyczna częstotliwość migotania... 212 BARWA... 214 MIESZANIE BARW... 215 Koło barw... 215 BARWNIKI I ŚWIATŁA 220 Obrazy następcze... 222 WRAŻLIWOŚĆ CZOPKÓW NA BARWY... 223 Teoria widzenia barwnego oparta na procesach przeciwstawnych... 225 Kontrast indukowany... 230 6. System słuchowy FIZYKA DŹWIĘKU... 234 Częstotliwość dźwięku... 235 Intensywność dźwięku... 237 DECYBELE 238 BUDOWA I FUNKCJONOWANIE UCHA... 239 Ucho wewnętrzne... 239 Ruchy błony podstawowej... 241 Komórki włoskowe (włosowate)... 243 REAKCJE ELEKTRYCZNE NA DŹWIĘK... 246 Krzywe strojenia (tonów)... 246 Charakterystyka czasowa reakcji neuronów... 247 Kodowanie intensywności informacji... 249 Przetwarzanie informacji słuchowej... 251 7. Wymiary dźwięku GŁOŚNOŚĆ... 259 Warstwice równej głośności... 260 Słuchanie muzyki... 261 Maskowanie... 265 Pomiar głośności... 268 WYSOKOŚĆ DŹWIĘKU... 269 Skala muzyczna... 269 Skala melowa... 270 Teoria miejsca: położenie na błonie podstawowej... 270 Cykliczność wysokości dźwięku... 274 Maskowanie nieobecnego tonu podstawowego... 277 ODRÓŻNIANIE WYSOKOŚCI DŹWIĘKU „ BEZ UDZIAŁU BŁONY PODSTAWOWEJ. 279 Argumenty przeciw teorii periodyczności spostrzegania wysokości tonu... 281 Dwoistość teorii spostrzegania wysokości dźwięku... 282 KRYTYCZNE PASMO CZĘSTOTLIWOŚCI... 283 PRZESTRZENNE SPOSTRZEGANIE DŹWIĘKU... 286 Lokalizacja... 286 Interakcje dwuuszne... 290 Znaczenie słyszenia dwuusznego... 291 Zapis dźwięku... 293 Efekt pierwszeństwa. ..295 8. Nerwowe podłoże pamięci SYSTEMY PAMIĘCI... 299 System przechowywania informacji sensorycznej... 299 Pamięć krótkotrwała... 300 Pamięć długotrwała... 301 PRZECHOWYWANIE INFORMACJI... 302 Obwody nerwowe pamięci... 303 CHEMIA PAMIĘCI... 309 Zmiany w RNA a uczenie się... 309 Uczenie się po wprowadzeniu zmian w RNA... 310 Przekazywanie pamięci. ..313 ZABURZENIA PAMIĘCI... 314 Wstrząsy elektryczne... 315 Amnezje... 316 Przypadki H.M. i N.A ...321 Mechanizmy pamięci ...323 POSZUKIWANIE LOKALIZACJI PAMIĘCI DŁUGOTRWAŁEJ... 324 JEDEN MÓZG CZY DWA MÓZGI?... 325 Rozszczepienie mózgu u zwierząt... 327 Rozszczepienie mózgu u człowieka... 329 Dwa mózgi: niezmienność czy plastyczność?... 333 WNIOSKI... 335 9. Pamięć przemijająca PRZECHOWYWANIE INFORMACJI SENSORYCZNEJ... 337 TACH1STOSKOP 338 Pojemność systemu SIS... 340 PAMIĘĆ KRÓTKOTRWAŁA... 344 Błędy w przypominaniu z pamięci krótkotrwałej... 346 Powtarzanie... 348 Zapominanie... 349 Właściwości pamięci... 353 OD PAMIĘCI KRÓTKOTRWAŁEJ DO PAMIĘCI DŁUGOTRWAŁEJ... 357 ZJAWISKA UWAGI... 362 Wybór przekazów... 363 Przetwarzanie odrzuconego przekazu... 366 Pamięć bez uwagi... 368 TEORIE UWAGI... 371 Model osłabiacza... 371 Model procesu aktywnej syntezy... 373 10. Struktura pamięci ODPOWIADANIE NA PYTANIA... 379 Kiedy należy poszukiwać informacji?... 380 Odszukiwanie obrazu... 381 Odszukiwanie informacji jako proces rozwiązywania problemów... 383 Poszukiwanie i rozumienie... 384 DONIOSŁOŚĆ ROZUMIENIA... 385 MODEL PAMIĘCI... 391 Zapamiętywanie pojęć... 391 Pojęcia pierwotne i wtórne... 397 Zapamiętywanie zdarzeń... 399 11. Procesy pamięci MECHANIZMY WEJŚCIA I WYJŚCIA... 409 Przetwarzanie na wejściu... 410 Udzielanie odpowiedzi... 411 WNIOSKOWANIE O STRUKTURZE PAMIĘĆ 1 LUDZKIEJ 412 POSZUKIWANIE INFORMACJI W PAMIĘCI... 414 Wieloetapowy proces poszukiwań. ..417 REORGANIZACJA STRUKTUR PAMIĘCI POPRZEZ PROCESY MYŚLOWE... 421 Korygowanie błędów... 424 Ocenianie na wejściu... 429 PENETRACJA BANKU DANYCH 432 ROZUMIENIE A ZAPAMIĘTYWANIE... 435 PAMIĘĆ JAKO PROCES PRZETWARZANIA INFORMACJI... 437 12. Język Nabywanie znaczenia poprzez działanie... 441 Znaczenie nazw... 442 STRUKTURA JĘZYKA... 443 Struktura znaczeniowa a struktura powierzchniowa... 444 GRAMATYKA ANGIELSKA 449 Przekazywanie struktury... 455 Przekazywanie znaczenia... 457 UCZENIE SIĘ JĘZYKA... 459 Uczenie się reguł... 459 Naśladownictwo... 460 Język jako środek komunikowania się... 461 Pierwsze kroki w komunikowaniu się... 462 Rozumienie... 465 13. Uczenie się i rozwój poznawczy SCHEMATY SENSORYCZNO-MOTORYCZNE... 471 Schemat sensoryczno-motoryczny... 472 ZJAWISKA UCZENIA SIĘ... 476 Zbieżności miedzy czynnościami a wynikami... 476 Wykrywanie korelacji... 481 Zbieżności miedzy warunkami zewnętrznymi a wynikami... 483 Podsumowanie... 486 WARUNKOWANIE KLASYCZNE 487 UCZENIE SIĘ POZNAWCZE... 488 Wzmocnienie jako sygnał... 488 Uczenie się i świadomość... 490 Uczenie się przez eksperymentowanie... 490 Znaczenie oczekiwań... 491 ROZWÓJ POZNAWCZY... 493 Uczenie się sensoryczno-motoryczne... 493 ROZWÓJ OBRAZÓW 494 Myślenie przedoperacyjne... 495 Operacje konkretne... 497 Operacje formalne... 498 MYŚLENIE... 498 14. Rozwiązywanie problemów ANATOMIA PROBLEMU... 501 Protokoły... 502 Protokół rozwiązywania problemu DONALD plus GERALD... 503 Graf rozwiązywania problemu... 505 STRATEGIE ROZWIĄZYWANIA PROBLEMÓW... 509 Poszukiwanie rozwiązań... 512 Wybór operatorów... 512 Ograniczenia metody analizy protokołów... 515 STANY WEWNĘTRZNE A STANY ZANOTOWANE W PROTOKOLE 517 MECHANIZMY MYŚLENIA... 520 Reguły a fakty... 520 Podprogramy... 521 Pamięć krótkotrwała... 522 15. Podejmowanie decyzji OKREŚLANIE WARTOŚCI... 528 Psychologiczna wartość pieniędzy... 529 Wartość złożonych alternatyw... 529 Przeciążenie poznawcze... 533 Co jest przedmiotem optymalizacji?... 534 LOGIKA WYBORU ... 535 PODEJMOWANIE DECYZJI RYZYKOWNYCH... 539 Użyteczność w sytuacji ryzykownego wyboru... 539 Prawdopodobieństwo... 540 Oczekiwana wartość... 541 Prawdopodobieństwo subiektywne... 542 Reprezentatywność i dostępność... 543 Subiektywnie oczekiwana użyteczność... 545 GROMADZENIE DOWODÓW... 546 Szanse... 546 Testowanie raka... 547 EFEKTY NASTĘPCZE PODEJMOWANIA DECYZJI... 550 Racjonalizacja. ..550 O konikach polnych i innych rzeczach... 551 Racjonalizacja podecyzyjna. ..552 WNIOSKI... 553 16. Społeczny kontekst decyzji WPŁYW CZYNNIKÓW SPOŁECZNYCH NA PODEJMOWANIE DECYZJI... 555 ZACHOWANIE SIĘ OSÓB POSTRONNYCH... 556 Apatia osób postronnych... 558 Podporządkowanie się autorytetowi... 559 DECYZJE INTERAKCYJNE... 564 Targowanie się... 564 Procedura targowania się... 565 Proces negocjacji... 567 Negocjacje strategiczne... 572 Taktyka konfliktu... 573 GRY I DECYZJE 575 17. Motywacja MÓZGOWE MECHANIZMY MOTYWACJI... 583 Elektryczna regulacja głodu i pragnienia... 583 Zaburzenia systemu regulacji motywacyjnej... 584 SYSTEMY REGULACJI MOTYWACYJNEJ... 585 Sprawdzian liczbowy. ..591 Zakończenie jedzenia... 594 Czynniki pozabiologiczne... 599 REAGOWANIE NA NIEPEWNOŚĆ... 600 Reakcje na stres... 600 BIOCHEMICZNE REAKCJE NA STRES 602 Reakcje na konflikt... 606 Reakcja na nic... 609 Nerwowe mechanizmy wzbudzenia... 611 SEN 614 INTERPRETACJA WZBUDZENIA EMOCJONALNEGO... 616 Emocje: jedna czy wiele?. ..616 Jak wywołać gniew lub euforię?... 619 MOTYWACJA A POZNANIE... 622 Wkładka kolorowa... 626 Mierzenie zmiennych psychologicznych DODATEK A DOZNANIA ZMYSŁOWE... 627 SKALOWANIE... 629 Rodzaje skal... 630 Techniki skalowania... 631 Ocenianie wielkości... 633 Prawo potęgowe... 634 ,,Ile" wobec , Jakiego rodzaju"?... 635 Interpretacja funkcji potęgowej... 636 Zakres zastosowania... 637 Porównywanie miedzy modalnościami... 638 Jak skalować?... 642 Charakterystyki funkcjonowania DODATEK B PROBLEM DECYZJI... 649 GRA W KOŚCI... 649 Reguła określania kryterium... 651 Oceny pewności... 655 Rozkład normalny... 657 PROBLEMY... 662 Problem tryskaczy przeciwpożarowych... 662 Pamięć... 664 Gra w kości po raz drugi... 665 Bibliografia WSKAZÓWKI BIBLIOGRAFICZNE... 667 Roczne Przeglądy (Annual Reviews)... 667 Abstrakty Psychologiczne (Psychological Abstracts)... 667 Indeks Cytowań (The Science Citation Index)... 668 Czasopisma... 668 PODRĘCZNIKI... 669 Zbiory artykułów... 670 BIBLIOGRAFIA... 671 Indeks nazwisk... usunięty Indeks rzeczowy... usunięty 17 Przedmowa do wydania polskiego Po kilku latach pracy tłumaczy i zespołu redakcyjnego oddajemy do rąk Czytelnika polskiego podręcznik psychologii poznawczej Lindsaya i Normana, wydany w 1972 roku. Jak długi był ten okres pracy zespołu polskiego, niech świadczy fakt, że w tym czasie zdążyło się ukazać drugie, poprawione wydanie podręcznika w języku angielskim (w 1977 roku) i ono miało już kilka kolejnych wydań. Mam nadzieję, że doczekamy się tego poprawionego wydania w wersji polskiej. Podręcznik Lindsaya i Normana zdobył sobie zasłużoną sławę na uniwersytetach amerykańskich i innych na całym świecie, tłumaczony na wiele języków. W zamierzeniu autorów stanowić miał kurs wstępny psychologii, używany jest jednak powszechnie jako podręcznik podstawowego kursu psychologii procesów poznawczych. Jego wielką zaletą jest z jednej strony pokazanie fizjologicznych podstaw poznawczego modelu funkcjonowania umysłu ludzkiego, a z drugiej ukazanie związku tego modelu z problematyką motywacji i zachowania społecznego. Podręcznik ten przyczynił się niewątpliwie do tego. że podejście poznawcze w psychologii amerykańskiej stało się dominujące i objęło stopniowo wszelkie jej dziedziny - od psychologii percepcji, pamięci i myślenia do psychologii społecznej i osobowości. Ta nowa psychologia („New Look", jak ją określano) wyznaczyła nowy paradygmat myślenia psychologów amerykańskich, który zaczyna być tak powszechnie stosowany i obowiązujący, jak ongiś był paradygmat behavioryzmu. Ten poznawczy paradygmat myślenia wyłonił się na przełomie lat pięćdziesiątych i sześćdziesiątych z jednej strony w wyniku badań nad modelami sztucznej inteligencji i symulowanego myślenia. Modele opracowane dla maszyny zaczęły prowokować badaczy jako możliwe modele pracy umysłu ludzkiego, dając zarazem klucz do otwarcia szczelnie dotąd przez behaviorystów zamkniętej „czarnej skrzynki". Z drugiej strony dzięki bujnemu w owych czasach rozwojowi teorii i badań psycholingwistycznych nad przyswajaniem i używaniem języka przez człowieka wykazano kompletną nieprzydatność koncepcji behaviorystycznych do zrozumienia rzeczywistych mechanizmów zachowań językowych. Podręcznik Lindsaya i Normana powstawał w czasie (początek lat siedemdziesiątych), kiedy psychologia poznawcza zaczyna się umacniać w badaniach i teoriach psychologicznych. Jest to okres tworzenia modeli i teorii reprezentacji świata w umyśle ludzkim, modeli o charakterze strukturalistycznym, obrazujących złożoną, zwykle hierarchiczną organizację tego, co określano jako pamięć semantyczną i epizodyczną, a co stanowiło właśnie ową reprezentację świata w pamięci trwałej. Lindsay i Norman przedstawiają własny model struktury pamięci, nie analizując bliżej innych modeli ani nie wnikając w dyskusje, jakie toczyły się i toczą nadal nad zaletami i wadami różnych modeli 18 reprezentacji świata, jak też nad kodami tej reprezentacji: obrazowym i abstrakcyjnym (analogowym i analitycznym) versus tylko abstrakcyjnym. W ostatnim okresie to strukturalistyczne podejście w psychologii poznawczej bywa zastępowane podejściem bardziej procesualnym, funkcjonalnym, akcentującym dynamiczny, proceduralny charakter reprezentacji świata w umyśle, rolę procesów decydujących o ciągłej jej transformacji, o przechodzeniu od jednego stanu pamięci, myśli itp. do innego. Panujące w amerykańskiej psychologii podejście poznawcze, tak jak ongiś podejście beheviorystyczne, wpływa też na inne nauki humanistyczne dając w wyniku podstawy do wyłonienia się nowej interdyscyplinarnej dziedziny wiedzy, którą określa się jako badania nad poznaniem -cognitive science. W Europie, gdzie tradycje behaviorystyczne nie były nigdy zbyt silne, to nowe podejście, które po długiej przerwie ponownie powraca do problematyki świadomości i analiz wewnętrznych procesów psychicznych, wywołało zainteresowanie i żywy odzew, zwłaszcza dlatego, że nie jest trudno pokazać jego korzenie tkwiące w europejskiej psychologii postaci i piagetowskim strukturalizmie. W polskiej psychologii również nowe podejście poznawcze napotyka bardzo podatny grunt. Ukazało się wiele prac, szczególnie w PWN - owskiej serii „Biblioteka Psychologii Współczesnej", które należą do nurtu poznawczego. Wpływ psychologii poznawczej na polskich psychologów da się zaobserwować we wszystkich dziedzinach tej nauki, a zwłaszcza w rozwijanych w Polsce teoriach osobowości. Najbardziej reprezentatywnym autorem jest Józef Kozielecki, który od deklaracji swego akcesu do psychologii poznawczej w Koncepcjach psychologicznych człowieka przechodzi do przedstawienia własnej teorii typu „poznawczego" w Psychologicznej teorii samowiedzy. Chociaż w polskiej literaturze psychologicznej, oryginalnej i tłumaczonej, jest wiele prac reprezentujących orientację poznawczą, artykułów i monografii, to brak jest podręcznika akademickiego, który by konsekwentnie taką wiedzę wykładał. Lukę tę w zamierzeniu naszym ma zapełnić podręcznik Lindsaya i Normana. Słowo o autorach. Normana jest wybitnym reprezentantem nurtu poznawczego, wywodzącego się z badań nad sztuczną inteligencją, aktualnie żywo zaangażowany w rozwijaniu cognitive science. Lindsay jest psychologiem fizjologicznym i jego to kompetencji zawdzięczamy, że w prezentowanym podręczniku abstrakcyjne modele symulujące pracę umysłu znalazły realne podstawy w przedstawianych modelach funkcjonowania układu nerwowego. Książka Procesy przetwarzania informacji u człowieka powinna więc dobrze służyć studentom i wykładowcom psychologii, jak też wszystkim zainteresowanym tą dziedziną wiedzy, ze względu na bezsporne zalety merytoryczne i formalne. Jest przykładem bardzo kompetentnego przedstawienia podejścia poznawczego, a zarazem twórczego wykorzystania wiedzy neurofizjologicznej (na co wskazuje chociażby posługiwanie się w książce koncepcją hamowania obocznego). Cechującą autorów lekkość stylu i jasność wykładu zapewne nie zawsze potrafiliśmy oddać w polskim przekładzie, ale bogata i dowcipna szata graficzna (tak rzadko spotykana w pracach rodzimych) powinna ułatwić odbiór prezentowanego tekstu. Ida Kurcz Warszawa, w czerwcu 1982 roku 19 Przedmowa Wszystko zaczęło się latem 1966 roku, kiedy obaj spotkaliśmy się po raz pierwszy na konferencji w Driebergen w Holandii. Dojeżdżaliśmy wtedy obaj do La Jolla - P. H. Lindsay z Toronto, D. A. Norman z Harvardu. Uniwersytet Kalifornijski otworzył właśnie swój oddział w San Diego i nie opracowano jeszcze programu z zakresu psychologii dla studentów pierwszych lat. Postanowiliśmy wspólnie prowadzić wykłady z tego przedmiotu. Celem naszym było zafascynowanie początkujących studentów współczesną psychologią eksperymentalną. Chcieliśmy im wyjaśnić, jak prowadzimy badania, co robimy w naszych laboratoriach. Pragnęliśmy skłonić studentów do aktywnego obcowania z pojęciami z zakresu psychologii, zamiast wbijania sobie do głowy długich list faktów i eksperymentów. Chcieliśmy przekazać im, jak myślimy i jak widzimy badania nad psychiką ludzką. Nie odnieśliśmy jednak błyskawicznego sukcesu. Przykre było odkrycie, że sprawy, które nam wydawały się bardzo interesujące, nie zawsze były takimi dla studentów: jednocześnie i my uczyliśmy się, w jaki sposób nauczać wstępnego kursu psychologii. W miarę jak zdobywaliśmy doświadczenie, rozwijał się nasz zestaw notatek i pomysłów. Nasze wykłady utrzymywały się przez kolejne lata, zgłaszało się na nie coraz więcej chętnych, ale sprawiał nam trudności brak odpowiedniego podręcznika. Doszliśmy zatem do wniosku, że jedynym sposobem zdobycia takiego podręcznika będzie napisanie go. I oto on. Wiele nauczyliśmy się zarówno w toku nauczania, jak i pisania tej książki. Zmusiło to nas do skrystalizowania naszych idei i dziś sami jesteśmy bardziej zafascynowani psychologią niż wtedy, gdy zaczynaliśmy ten kurs. Czekamy z niecierpliwością na postępy, jakie niewątpliwie uczyni ona w ciągu najbliższych lat. Sposób podejścia zaprezentowany w tej książce ukierunkował nasze studia z zakresu psychologii. 21 Podziękowania Wiele osób poświęciło nam bezinteresownie swój czas, swoje działania i swoje myśli. Szczególnie wiele zawdzięczamy Davidowi Rumelhartowi, który współpracując z nami w naszych badaniach i w zajęciach dydaktycznych wniósł do nich poważny wkład intelektualny. Odegrał on szczególnie stymulującą rolę w opracowaniu i rozwinięciu modelu pamięci-materiału, który został przedstawiony w rozdziałach 10 i 11, i ukierunkował organizację materiału w rozdziałach 12 i 13. (Patrz artykuł napisany przez Rumelharta, Lindsaya i Normana, 1972.) Podobnie uczestnicy „grupy badawczej LNR" (Lindsaya, Normana i Rumelharta- przyp. red. pol.) w ciągu lat jej działania przyczynili się do wskazania sposobu, w jaki widzimy procesy poznawcze od percepcji do myślenia. Wielu (chyba z pięćdziesięciu) doktorantów i asystentów pomagało nam w prowadzeniu wykładu, który stał się punktem wyjścia tej książki. Każdy z nich indywidualnie i wszyscy razem zasługują na naszą wdzięczność. W szczególności pragnęlibyśmy podziękować za pomoc, jakiej udzielili nam kierownicy grup asystenckich: Richard Meltzer, Jim Levin i Marc Eisenstadt. Leanne Hinton wiele nam pomogła w toku pisania tej książki. Najpierw nagrywała nasze wykłady na taśmie magnetofonowej, następnie je uporządkowała i przepisała, sprawdziła bibliografię i w ogóle pomagała we wszystkich fazach naszej pracy nad książką. Ponadto jeszcze przygotowała szkice rysunków, na podstawie których wykonano ilustracje do druku. Jej rysunki anatomiczne, czarujące demony i niekształtne ciała przyczyniają się do tworzenia atmosfery tej książki i rozjaśniają tekst. Cathy Cox pomogła nam w transkrypcji wykładów na temat słyszenia, które stanowią rozdziały 6 i 7. Prace, edytorską nad książką wykonała Margaret Jackson, natomiast Julie Lustig zajmowała się w ostatnim roku sprawdzaniem i nadzorem nad końcowymi pracami. Marlene Farnum, Julie Lustig i Martha Norman sporządziły indeks rzeczowy w czasie jednego nadmiernie przydługiego, maratońskiego weekendu. Wiele osób przeczytało poszczególne rozdziały i poczyniło niezwykle cenne uwagi. Uwagi Petera Deana pomogły nam w opracowaniu ostatecznej wersji tekstu na temat rozwiązywania problemów i w odniesieniu do współczesnej sztuki. Larry Squires przeczytał i skomentował rozdział 8, Allen Newell - rozdział 14, George Mandler-rozdział 17, Ed Fantino - materiał na temat uczenia się sprawczego, Jack Nachmias i Charles Harris poczynili uwagi do pierwszej wersji rozdziałów 1-7. Uwagi Ulrica Neissera i kilku anonimowych recenzentów pomogły nam wnieść poprawki w różnych partiach książki. Chcielibyśmy zwłaszcza podziękować Recenzentowi nr 3, którego uwagi, chociaż ostre i przykre, były bardzo inspirujące i użyteczne. 22 Wreszcie powinniśmy wyrazić wdzięczność naszym cierpliwym wydawcom, którzy z perspektywy Nowego Jorku i San Francisco musieli widzieć całe nasze przedsięwzięcie jako chaotyczne i niepewne, lecz mimo to ich pomoc pozwoliła na ostateczne edytorskie wykończenie pracy. ŹRÓDŁA RYSUNKÓW I TABEL Rys. 1-38 From M. Luckiesh, Visual illusions. New York: Dover Publication, Inc., 1965, Reprinted through permission of the publisher. Rys. 1-45 From R. M. Pritchard, Stabilized images on the retina. Copyright © 1961 by Ścieńtific American, Inc. Ali rights reserved. Rys. 2-1 From Pomeranz and Chung (l970). Copyright 1970 by the American Association for the Advancement of Science. Rys. 2-6 i 4-7 From S. Polyak. The vertebrate visualsystem. Copyright© 1957 by the Uniyersity of Chicago Press and used by permission. Tabela 3-2 i rys. 6-4 i 6-5 From Denes and Pinson (1963). Courtesy of Bell Tele-phone Laboratories, Incorporated. Rys. 5-8From S. S. Stevens (1961b). Copyright 1961 by the American Association for the Advancement of Science. Rys. 5-18 From D. B. Judd, Basic correlates of the visual stimulus. In S. S. Stevens (Ed.), Handbook of experimental psychology. New York: Wiley, 1951. By permission John Wiley & Sons, Inc. Rys. 5-28 From Wald (1964). Copyright 1964 by the American Association for the Advancement of Science. Rys. 5-29Based on DeYalois and Jacobs (1968). Copyright 1968 by the American Association for the Advancement of Science. Rys. 6-11After G. L. Rasmussen and W. F. Windle (Eds.), Neural mechanisms of the auditory and vestibular systems, 1960. Courtesy of Charles C. Thomas, Publisher, Springfield, Illinois. Rys. 6-13 Photo is from Bredbergaz (1970). Copyright 1970 by the American Association for the Advancement of Science. Rys. 7-1 From Robinson and Dadson (1956). By permission of the Institute of Physics and the Physical Society. 23 Rys. 7-2 Illustration courtesy of C. G. Conn, Ltd., Oak Brook, Illinois. Rys. 7-6 i 7-8 From E. Zwicker and B. Scharf, Model of loudness summation. Psychology Review, 1965, 72, 3-26. Copyright 1965 by the American Psychological Association, and reproduced by permission. Rys. 7-11,7-12,17-21 From J. Zwislocki, Analysis of some auditory characteri-stics, In D. R. Luce, R. R. Bush, and E. Galanter (Eds.), Handbook of mathematical psychology, Vol. III. New York: Wiley, 1965. By permission of John Wiley & Sons, Inc. Rys. 7-18 From R. R. Fay, Auditory frequency stimulation in the goldfish (Carassius Auratus). Journal of Comparative & Physiological Psychology, 1970, 73 (2), 175-180. Copyright 1970 by the American Psychological Association, and reproduced by permission. Rys. 8-15 Graph from E. H. Lenneberg, Biological foundatlons of language. New York: Wiley, 1967. By permission of John Wiley & Sons, Inc. Rys. 9-8 From B. B. Murdock, Jr., The retention of individual items. Journal of Experimental Psychology, 1961, 62, 618-625. Copyright 1961 by the American Psychological Association, and reproduced by permission. Rys. 9-11 oraz 9-14 From B. B. Murdock, Jr., The serial effect of free recall. Journal of Experimental Psychology, 1962,64,482-488, Copyright 1962 by the American Psychological Association, and reproduced by permission. Tabela 12-2 From R. Brown and C. Hanlon, Deriyational complexity and order of acquisition in child speech. In J. R. Hayes (Ed.), Cognition and the development of language. New York: Wiley, 1970. By permission of John Wiley & Sons, Inc. Rys. 14-7 From Herbert A. Simon and Allen Newell, Human problem solving© 1971. By permission of Prentice-Hall, Inc. Englewood Cliffs, New Jersey. Rys. 16-4 i 16-5 From S. Siegal and L. E. Fouraker, Bargaining and group decision making: Experiments in bilateral monopoly. Copyright 1960 by McGraw-Hill, Inc. used with permission of McGraw-Hill Book Company. Rys. 17-14 From N. Kleitman, Sleep and wakefulness (2nd ed.). Copyright © 1963 by the University of Chicago Press, and used by permission. Rys. 17-15 Reprinted from D. B. Lindsley, Psychophysiology and motivation. 24 In M. R. Jones (Ed.), Nebraska symposium on motivation, by permission of University of Nebraska Press. Copyright © 1957 by The University of Nebraska Press. Rys. A-3 i A-6 i tabela A-3 Reprinted from S. S. Stevens, The psychophysics of sensory function. In W. A. Rosenblith (Ed.), Sensory communi-cation, by permission of The M.I.T. Press, Cambridge, Massachusetts. Copyright © 1961 by the M.I.T. Press. Rys. A-4 i A-5 From Stevens (1966a), Copyright 1966 by the American Association for the Advancement of Science. ŹRÓDŁA CYTATÓW Str. . . 322 From B. Milner, S. Corkin, and H. L. Teuber, Further analysis of the hipocampal amnesic syndrome: 14 year follow-up study of H. M. Neuropsychologica, 1968, 6, 215-234, Reprinted with permission from Pergamon Press. Str. .... 332 From Michael S. Gazzaniga, The bisected brain. Copyright © 1970 by Meredith Corporation. Reprinted by permission of Appleton-Century-Crofts, Educational Diyision, Meredith Corporation. Str. ... 478, 483 From B. Spock, Baby and child care. New York: Pocket Books, inc. Copyright © 1945, 1946, 1957, 1968 By Benjamin Spock, M. D. Reprinted by permission of Pocket Books, a division of Simon and Schuster, Inc. Str. ... 527 From the book Now we are six by A. A. Milne. Copyright 1927 by E. P. Dutton, Inc. Renewal © 1955 by A. A. Milne. Published by E. P. Dutton & Co., Inc. and Methuen & Co., Ltd., and used with their permission. Str. ... 559 From S. Milgram, Behavioral study of obedience, Journal of Abnormal and Social Psychology, 1963,67, 371-378, Copyright 1963 by the American Psychological Association and reproduced by permission: Str. ... 561 From S. Milgram, Some conditions obedience and disobedience to authority. Human Relations, 1965, 18, 57-75. Reprinted by permission of Plenum Publishing Corp. 25 Uwagi dla Czytelnika Ciągle jeszcze świadomość ludzka stanowi dla nas zagadkę. Potrafimy już jednak stawiać właściwe pytania. Książka ta wprowadza Czytelnika w metody badania czynności psychicznych człowieka, przy czym główny nacisk położony został nie na to, co już znane, i nie na to, co jeszcze nie zostało poznane, lecz na sposoby dochodzenia do tego poznania. Na kolejnych stronach tej książki próbowaliśmy budować modele charakteryzujące istotę opisywanych zjawisk. Stosując modele możemy odkrywać zasady leżące u podstaw teoretycznego wyjaśnienia tego czy innego zjawiska i ujawnić zarazem zalety i niedostatki teorii. Modele, jakimi posługujemy się w książce, nie mogą, oczywiście, ukazać procesów myślowych człowieka w całej ich złożoności i precyzji, pomagają jednak wyłonić najistotniejsze elementy badanego problemu, odsuwając to, co nie jest istotne. Zresztą w fazie początkowej modele z konieczności są proste: należy pamiętać o tym, że człowiek dopiero zaczyna zbliżać się do poznawania własnej psychiki. W pierwszych siedmiu rozdziałach książki rozpatrujemy wybrane zagadnienia związane z percepcją i wyjaśniamy, jak powinien funkcjonować system, który posiadałby właściwości percepcji ludzkiej. Rozważywszy kilka problemów teoretycznych, przejdziemy następnie do szczegółowej analizy niektórych rzeczywistych mechanizmów fizjologicznych. W szczególności zajmiemy się budową połączeń nerwowych będących podłożem wielu podstawowych operacji przy rozpoznawaniu obrazów. Po prześledzeniu głównych właściwości połączeń nerwowych, jak też systemów wzrokowego i słuchowego, ponownie wrócimy do ogólnych zagadnień percepcji i pokażemy, że nasza wiedza o fizjologicznych mechanizmach percepcji jest niewystarczająca, aby zbudować pełny obraz wyjaśniający to zjawisko; szereg bardzo istotnych problemów psychologicznych do tej pory pozostaje nierozwiązanych. Od percepcji i rozpoznawania obrazów przejdziemy do pamięci; problem ten omawiamy w rozdziałach 8-11. Pamięć odgrywa nadzwyczaj ważną rolę w działalności intelektualnej człowieka, dlatego też jej istota i funkcje wymagają wnikliwej analizy. Analizujemy procesy intelektualne człowieka, koncentrując się na właściwościach pamięci. W rozdziale 8 omawiamy nerwowe mechanizmy pamięci, jak również to, co jest wiadome o jej podłożu fizjologicznym oraz o dysfunkcjach pamięci wywołanych przez różne zaburzenia procesów fizjologicznych. W rozdziale 9 podajemy przegląd badań nad pamięcią krótkotrwałą z uwagą, analizując odtwórcze właściwości pamięci krótkotrwałej i jej rolę w wybranych rodzajach działań ludzkich. W kolejnych rozdziałach 10 i 11 omawiamy jeden z prawdopodobnych modeli przechowywania informacji w pamięci długotrwałej. Obszar ten ciągle jeszcze nie spenetrowany, 26 rzadko był badany, a poznanie tej dziedziny jest niezbędne do zrozumienia wyższych czynności psychicznych człowieka. W następnych rozdziałach prezentowany model pamięci zajmuje główne miejsce. Ostatnia część książki (rozdziały 12-17) poświęcona jest analizie procesów poznawczych. W rozdziale 12 staramy się przedstawić badania nad językiem jako środkiem komunikowania się ludzi. Porozumiewanie się ludzi między sobą wydaje się podstawowym warunkiem powstania języka u człowieka. Wychodząc z tego punktu widzenia, wyjaśniamy rozwój mowy dziecka. Rozdział 13 dotyczy mechanizmów uczenia się oraz stadiów rozwoju inteligencji dziecka, poczynając od jego narodzin, a kończąc na okresie dojrzewania. W rozdziałach 14-16 poddajemy analizie czynności intelektualne dorosłego człowieka, przy czym szczególnie zajmujemy się analizą rozwiązywania problemów i procesami decyzyjnymi oraz społecznym kontekstem decyzji podejmowanych przez ludzi. W rozdziale ostatnim rozpatrujemy zagadnienia dotyczące motywacji i emocji. Czyniąc to wracamy do pewnych kwestii podnoszonych w rozdziałach 1 i 3. Wychodząc od prototypowego modelu systemu motywacji, poszukujemy sposobu, w jaki stany chemiczne i biologiczne ciała, współdziałając z procesami poznawczymi, regulują emocje i zachowanie człowieka. Rozdziały 1-17 składają się na pełny tekst książki, uzupełniające go Dodatki przynoszą obszerny materiał dotyczący technik. W Dodatku A przedstawiony jest skrótowo problem pomiaru w psychologii, zwrócono także uwagę na procedury oceniania wprowadzając pewne proste zadania. W Dodatku B przedstawione są zagadnienia dotyczące podejmowania decyzji, zawiera on również wprowadzenie w ważną technikę tzw. charakterystyk funkcjonowania. Literatura naukowa stanowi podstawę danej dziedziny nauki. Wprowadzamy ją zarówno w tekście, jak i w spisie bibliografii na końcu książki, stanowiącym przewodnik dla tych czytelników, którzy pragną poznać dane zagadnienie bardziej szczegółowo. Podane tam źródła mogą prowadzić do bardziej specyficznych (i zwykle trudniejszych) lektur. Często cytujemy prace, które w toku naszych studiów nad danym tematem wydały się nam interesujące, choć nie mają one bezpośredniego związku z materiałem prezentowanym w danym rozdziale. Informacje o tym, jak szukać dodatkowych pozycji, podajemy w paragrafie „Wskazówki bibliograficzne" (s.667). Pełną informację bibliograficzną o każdej cytowanej pozycji zawiera „Bibliografia" zamieszczona na s. 671. 1. Spostrzeganie INTERPRETACJA PRZEKAZÓW SENSORYCZNYCH Dopasowywanie do wzorca ROZPOZNAWANIE OBRAZÓW Organizowanie niepełnych obrazów Obrazy konkurencyjne ORGANIZOWANIE INFORMACJI SŁUCHOWEJ Obrazy pozbawione znaczenia Naginanie danych sensorycznych do przyjętej interpretacji ZNACZENIE REGUŁ Spostrzeganie przestrzeni Niemożliwe organizacje figur Znaczenie kontekstu ANALIZA CECH Zatrzymywanie obrazu Efekty następcze Efekty następcze ruchu JAK UZYSKAĆ EFEKTY NASTĘPCZE RUCHU? Efekty następcze barwy Wyjaśnienie efektów następczych Adaptacja do barwy uzależniona od kierunku SPOSTRZEGANIE BEZ WYODRĘBNIANIA CECH ,,Widzenie skórne" 29 Celem naszym jest zrozumienie mechanizmów spostrzegania. Zadanie to polega na ujawnieniu procesów psychologicznych, biorących udział w spostrzeganiu, oraz na zorientowaniu się na tyle, na ile jest to możliwe, w systemie połączeń nerwowych. Problemów jest tu wiele. Na przykład, w czasie czytania znaków drukarskich zapełniających stronicę tekstu szybko i bez widocznego wysiłku przekładamy w myśli symbole wzrokowe na sensowne zdania. Podobnie mowę ludzką odbieramy od razu jako sensowne słowa, a niejako mieszaninę dźwięków, które należy jakoś uporządkować, aby nadać im dopiero określony sens. Człowiek, idąc ulicą, szybko i bez wysiłku poznaje otaczające go przedmioty. Jeżeli z lewej strony rozlegnie się dźwięk, to z tej strony słyszy go. Po dojściu do brzegu chodnika, w odpowiedniej chwili wstępuje nań lub schodzi zeń. Biorąc ołówek do ręki, nie zastanawia się w sposób świadomy ani nad tym, jakie cechy odróżniają ołówek od innych przedmiotów, ani nad tym, jak należy kierować ruchami ręki i dłoni, aby go uchwycić, ani też nad tym, jak należy umieścić ołówek w ręku, aby móc nim się posługiwać. 29 INTERPRETACJA PRZEKAZÓW SENSORYCZNYCH Zajmując się spostrzeganiem zaczniemy od analizy rozpoznawania układów bodźcowych. W jaki sposób sygnały płynące z zewnątrz i oddziałujące na narządy zmysłowe przekształcają się w mające sens doznania sensoryczne? Zwykle rozpoznajemy otaczające nas przedmioty i zdarzenia na pozór tak łatwo i szybko, iż nasuwa się przypuszczenie, że związane z rozpoznawaniem operacje również są proste i bezpośrednie. Doświadczenia inżynierów wskazują jednak, że pogląd taki daleko odbiega od prawdy. Nie skonstruowano takich maszyn, które byłyby zdolne do rozpoznawania symboli i dźwięków występujących w otaczającym nas środowisku. Wielokrotnie ponawiane próby skonstruowania maszyn zdolnych do rozpoznawania obrazów dały rezultaty znacznie odbiegające od możliwości, jakie mają w tym zakresie narządy percepcyjne najbardziej prymitywnych organizmów zwierzęcych. Zaczniemy od zbadania, dlaczego zadanie to jest aż tak trudne. Dopasowywanie do wzorca Dopasowywanie do wzorca to najprostszy z możliwych sposobów klasyfikacji i rozpoznawania obrazów. Aby móc posługiwać się tą metodą, konieczna jest określona reprezentacja-wzorzec dla każdego obrazu, podlegającego rozpoznaniu. Rozpoznawanie dokonuje się w drodze dopasowywania sygnału płynącego z zewnątrz do wzorca wewnętrznego. Odnalezienie wzorca, który lepiej od innych odpowiada sygnałowi, prowadzi do zidentyfikowania tego ostatniego. Popatrzmy, jak działa taki system przy odbieraniu sygnałów wzrokowych. Załóżmy, że zadanie polega na rozpoznawaniu liter alfabetu. Dla naszych potrzeb można przyjąć, 30 że obraz prezentowanej litery pada na wewnętrzną powierzchnię oka, na jej siatkówkę. Siatkówka składa się z wielu setek tysięcy światłoczułych komórek nerwowych, zwanych receptorami. Działanie tych receptorów omówimy później, teraz zajmiemy się tym, jak muszą być one ze sobą połączone, aby rozpoznawanie liter alfabetu było możliwe. Podczas prezentacji litery A na siatkówce oka ulega pobudzeniu układ receptorów (rys. 1-1). Gdybyśmy połączyli wszystkie te pobudzone receptory z jedną komórką detekcyjną, otrzymalibyśmy wzorzec komórek receptorycznych, specyficznie przystosowanych do wykrywania wystąpień litery A. Taki możliwy wzorzec dla A przedstawiony jest na rysunku 1-2. Jeżeli układ świateł rozkłada się na siatkówce tak, że pobudza tylko ów określony zbiór receptorów, „detektor litery A" zaczyna intensywnie reagować (rys. 1-3). Inny zespół receptorów stanowi wzorzec dla litery L (rys. 1-4), jeszcze inny dla litery N; w ten sposób można zbudować wzorzec dla rozpoznawania dowolnego obrazu. 33 Takie dopasowywanie do wzorca można przyjąć za najprostszy schemat rozpoznawania obrazów. Zauważmy, że schemat ten ma jedną specyficzną właściwość: układ napływających sygnałów dopasowywany jest do wszystkich możliwych wzorców równocześnie, odpada konieczność żmudnego kolejnego sprawdzania wszystkich istniejących wzorców w poszukiwaniu najbardziej odpowiedniego. Pobudzeniu ulegają jednocześnie wszystkie możliwe wzorce i ten z nich, który reaguje na dany układ silniej niż inne, to poszukiwany, właściwy wzorzec. Jednakże ten prosty schemat nie nadaje się zbytnio jako model rozpoznawania obrazów przez człowieka. Wystarczy spojrzeć na rysunki 1-5a, 1-5b, 1-5c [litera A nie pokrywa się z wzorcem], aby zrozumieć, co zajdzie, jeżeli litera będzie lekko pochylona albo rozmiary jej okażą się trochę mniejsze (lub większe) od wzorcowych. Przedstawiony tu system rozpoznawania okazuje się mało przydatny, jeżeli nie zawiera odpowiedniego wzorca dla danego obrazu. Można jednak znaleźć różne sposoby udoskonalenia rozpatrywanego schematu rozpoznawania przez porównywanie z wzorcem. Można np. zwiększyć ilość wzorców, przewidziawszy wszystkie możliwe warianty wielkości oraz wszystkie możliwe nachylenia liter (rys. 1-6). Inny sposób podejścia wymaga wcześniejszego procesu przekształcania liter na jakiś standardowy format zanim nastąpi proces porównywania z wzorcem. Wiele programów dla maszyn liczących i urządzeń posługujących się techniką porównywania z wzorcem w celu rozpoznania układów sygnałów przewiduje wcześniejsze przekształcenie tych sygnałów. W tym celu zanim rozpocznie się proces rozpoznawania litery obraca się ją tak, aby jej dłuższa oś znalazła się w położeniu pionowym. Następnie za pomocą skalowania rozmiary jej. zostają sprowadzone do wcześniej ustalonych wielkości. 34 I dopiero wówczas tak przekształcony sygnał jest porównywany ze standardowym zbiorem wzorców (rys. 1-7). Najprostszy przykład praktycznego wykorzystania systemu porównywania z wzorcem (który zresztą dość wyraźnie pokazuje pewne słabości tego systemu)-to sortowanie czeków bankowych. Na dole każdego czeku numer seryjny i numer konta wydrukowane są specjalnymi czcionkami (rys. 1-8), które mogą być odczytane zarówno przez człowieka, jaki przez bankowy komputer. Maszyna „czyta" cyfry prześwietlając kopertę, to znaczy odbiera ona rozkład światła w wyznaczonym polu. System elektroniczny, zawierający wzorcowe rozkłady odbicia światła, odpowiadające każdej z dziesięciu możliwych cyfr, pozwala na rozpoznanie danej cyfry i w ten sposób również całego kodu bankowego. Zwróćcie uwagę na kształty cyfr (rys. 1-8) [Brak zaokrągleń, tylko proste odcinki, niektóre pogrubione] Podczas opracowywania metod prezentacji cyfr cały wysiłek skierowano na to, aby były one najmniej podobne do siebie; „klatki" dla cyfr wyraźnie zaznaczono, a to dlatego, żeby układ, rozmiar, kształt każdej z cyfr był narzucony jednoznacznie, w przeciwnym bowiem razie urządzenie odczytujące czeki myliłoby się. Porównywanie z wzorcem to najprostsza, ale zarazem najbardziej zawodna metoda rozpoznawania. Wydaje się mało prawdopodobne, aby rozpoznawanie obrazów przez człowieka posługiwało się tym mechanizmem. Wielka różnorodność obrazów, z jakimi styka się człowiek, stwarza olbrzymie trudności dla tego schematu. Można by sobie w zasadzie z tymi trudnościami poradzić, ale wówczas każdy nowy przypadek należałoby rozpatrywać oddzielnie, co uczyniłoby system nadzwyczaj złożonym i mało elastycznym. W dodatku schemat porównywania z wzorcem nie przewiduje rozpoznawania nowych wariantów układów, dla których nie ma wzorców. A człowiek potrafi to robić. Wynika z tego jasno, że zdolność człowieka do rozpoznawania obrazów oparta jest na jakimś innym, bardziej pewnym i elastycznym systemie niż porównywanie z wzorcem. ROZPOZNAWANIE OBRAZÓW Nieprzydatna okazała się analiza za pomocą porównywania z wzorcem. Nie ma potrzeby przeprowadzania dodatkowych eksperymentów, aby się o tym przekonać, wystarczy prosta logika. Jakie są zatem alternatywy? Należy najpierw prześledzić zjawiska spostrzegania. Otaczające nas przedmioty nie zawsze wydają się nam takimi, jakimi są w rzeczywistości. Nie zawsze widzimy i słyszymy to, co w istocie zachodzi. System spostrzegania popełnia często omyłki. Czasem błędy te polegają na złudzeniach, kiedy indziej powstają w efekcie długotrwałej stymulacji, po której system spostrzegania musi przyjść do siebie, lub są wynikiem braku czasu na interpretację przedstawionego mu obrazu. Wszystkie te zjawiska są ważne dla nas, ponieważ często mechanizmy tego czy innego systemu najlepiej daje się odsłonić w wyniku analizy jego błędów i zaburzeń. Trudno zdecydować, od czego zacząć poszukiwania, jeżeli wszystko przebiega sprawnie. Ale w momencie, kiedy odkrywamy błędy, ich analiza może być bardzo pomocna. Z tego też względu zaczniemy od prześledzenia kilku zjawisk z dziedziny spostrzegania w celu poznania podstawowych zasad, jakie udało się z nich wyprowadzić. Zaczniemy przede wszystkim od zbadania, jak są interpretowane informacje sensoryczne. Proces interpretacji możemy uczynić w pełni świadomym, jeżeli zastosujemy specjalne tricki: po pierwsze, usuwając pewne elementy obrazu czynimy jego interpretację trudną (jeśli nie niemożliwą). Po drugie, stworzymy możliwość konkurencyjnej organizacji obrazu przez dostarczenie kilku sprzecznych interpretacji tego samego obrazu. Po trzecie, pokażemy obrazy pozbawione znaczenia, aby zobaczyć, jaki wpływ na proces interpretacji wywiera uprzednie doświadczenie. 36 Organizowanie niepełnych obrazów Zazwyczaj interpretacja przekazów sensorycznych przebiega tak szybko i automatycznie, że rzadko zdajemy sobie sprawę, jakie to skomplikowane zadanie. W celu ujawnienia uwikłanych tu mechanizmów, musimy zwolnić przebieg tego procesu. Jeden sposób takiego zwolnienia polega na ograniczeniu dostępnej informacji wzrokowej. Obserwując rysunek 1-9,[na pierwszy rzut oka widać tylko zbiór czarnych i białych plam] możemy też prześledzić procesy organizowania obrazu, zachodzące podczas interpretowania obrazu wzrokowego. Kiedy dodamy informację, że można na nim zobaczyć psa - dalmatyńczyka (z głową skierowaną na lewo), to wystarczy raz zobaczyć psa i już trudno go nie dostrzec. Tak więc wiedza na temat tego, co przedstawia obraz, przyspiesza cały proces interpretacji: kiedy wiemy, czego szukamy, łatwiej jest to odnaleźć. 37 Obrazy konkurencyjne Obraz może okazać się dwuznaczny wskutek braku istotnej informacji lub też nadmiaru nieistotnych danych. Może on też być dwuznaczny, ponieważ istnieje wiele sensownych sposobów jego interpretowania. W takich warunkach trudno jest interpretować obraz na dwa różne sposoby równocześnie. Ilustruje to praca artysty Salvadora Dali (rys. 1-10). Tytuł obrazu: „Targ niewolników wraz ze znikającym popiersiem Waltera" dostarcza wskazówek dla alternatywnych interpretacji przedstawionej sceny. W samym centrum obrazu stoją dwie małe zakonnice dotykając się ramionami. Ale przy innej organizacji percepcyjnej obrazu twarze mniszek -zamieniają się w oczy Woltera, ich połączone ramionami sylwetki w jego nos, a białe części ich ubioru w talii - w jego podbródek. W tym wypadku jeden sposób organizowania informacji prowadzi do spostrzegania małych figurek ludzkich, a drugi do spostrzegania powiększonego popiersia. 38 Do pewnego stopnia te dwa sposoby organizowania informacji wzrokowej wzajemnie się wykluczają: trudno spostrzegać oba obrazy jednocześnie. ORGANIZOWANIE INFORMACJI SŁUCHOWEJ Tendencja do wybiórczego wyodrębniania i organizowania danych dostarczanych przez system sensoryczny to jedna z podstawowych cech wszystkich doznań spostrzeżeniowych. Kiedy jedna z wielu rozmów prowadzonych obok nas zostaje wyodrębniona, rozmowa ta staje się figurą, a wszystkie pozostałe dźwięki stają się tłem. Efekt ten występuje szczególnie wyraźnie na dużym i gwarnym przyjęciu, gdzie możliwe jest przerzucanie uwagi z jednej rozmowy na inną. Za każdym razem, kiedy w świadomości pojawia się wyraźnie nowa rozmowa, wszystkie pozostałe schodzą na dalszy plan. Organizowanie naszych spostrzeżeń w figurę i tło jest znane w muzyce. Kompozytorzy często podają dwa różne tematy równocześnie, wiedząc, że słuchacz wybierze jeden jako główny. Niektóre kompozycje napisane są tak, iż w dźwięku jednego instrumentu grającego solo można równocześnie usłyszeć dwa różne tematy. W takim wypadku grający przechodzi na przemian od tonów wysokich do niskich, a słuchacz, przysłuchując się wysokim tonom, spostrzega jedną melodię, a przysłuchując się niskim tonom - inną; kolejne następowanie po sobie tonów wysokich i niskich może być odebrane jako dwa oddzielne ciągi dźwięków - dwa różne tematy muzyczne. Przykładem podobnej kompozycji jest fragment solówki dla fletu, przedstawiony na rysunku 1-11. Zauważcie, że w tym wypadku kompozytor (Telemann) dokładnie oddziela dwa tematy, zmuszając wykonawcę przez cały czas do przechodzenia od jednego do drugiego. Słuchacz może zgodnie z własnym wyborem śledzić jeden temat lub drugi. Ten temat, który przyciąga jego uwagę, staje się „figurą", a wszystkie pozostałe dźwięki spostrzegane są jako tło czy akompaniament. Bogactwo odbioru muzyki w dużej mierze uzależnione jest od organizacji percepcyjnej. Słuchając orkiestry, wybieramy sobie temat i śledzimy go. Słyszymy kontrabas i przez chwilę tylko go słyszymy, a potem przełączamy się na inny instrument Uczymy się śledzić układ melodii, przenosząc uwagę z jednego instrumentu na drugi. Słuchając jakiegoś utworu ponownie, odkrywamy w nim nowe tematy, i tak zdarza się wiele razy. Temat wyodrębniony w danej chwili staje się figurą, wszystko pozostałe tworzy tło. Spróbujcie wsłuchać się w muzykę trudniejszą Bacha czy Strawińskiego lub nawet dobry jazz czy rock. Wypróbujcie różne sposoby wsłuchiwania się w muzykę. Bogactwo i różnorodność możliwych organizacji percepcyjnych pojawi się stopniowo. 39 Być może trzeba będzie dziesięć razy przesłuchać ten sam kawałek, zanim określony układ pojawi się wyraźnie i jasno. Tu, podobnie jak przy spostrzeganiu wzrokowym, jeżeli wiemy czego szukać, łatwiej to znajdujemy; lecz kiedy słuchacz odkryje określony sposób organizacji percepcyjnej dzieła muzycznego, trudno mu będzie potem go uniknąć. Obrazy pozbawione znaczenia Czy nasza zdolność organizowania i wyodrębniania określonych komponentów obrazu wzrokowego jest w pełni niezależna od umiejętności tworzenia znanych spostrzeżeń? Wcale nie. Interpretując przekaz wzrokowy, wyodrębniamy jako jednostki takie ugrupowania, które mają wyróżniające się cechy. Wiązki elementów o podobnym kształcie albo też przerwy w powtarzającym się układzie jawią się nam jako figury. Klasyczna maksyma kompozycji ciekawej struktury graficznej wymaga wprowadzenia punktu ogniskowania uwagi poprzez zaburzenie powtarzającego się układu. Wielu malarzy współczesnych - to mistrzowie w odkrywaniu różnorodnych kompozycji, które można wykorzystać jako ciekawe przykłady zależności między figurą a tłem. 40 Rysunki 1-12 i 1-13 przedstawiają próbki ich prac. Jak odbieracie te obrazy? Na co patrzycie? Z jakiego powodu na niektórych obrazach tego typu organizacja pola bezustannie się zmienia? Obrazy te pozwalają nam wykryć bardzo istotne sprawy. Po pierwsze, zasady organizacji percepcyjnej działają niezależnie od tego, czy przedmiot ma jakieś znaczenie i czy jest on nam znany. Po drugie, trudno jest, a czasem wręcz niemożliwie, zapobiec organizacji informacji. Uważnie przyjrzyjcie się tym obrazom. 41 Organizacja ich jest niestała, przyjmuje raz taką, raz inną formę. Ale jakaś struktura obrazu zawsze występuje i to nawet wówczas, gdy artysta świadomie starał się uniknąć standardowej formy organizacji obrazu. Strukturę tę wnosi sam widz. Wyjątkowo interesujący jest obraz „ Tremor "(rys. 1-14), a to dlatego, że jest on odbierany jako zbiór długich poziomych to znów pionowych, prostokątnych rurek lub jako układ dużych przesuwających się trójkątów, przy czym jeden z tych układów występuje zawsze. Obraz może być sensowny lub bez sensu, znany lub obcy proces spostrzegania wzrokowego zawsze nadaje mu jakąś organizację. 42 Naginanie danych sensorycznych do przyjętej interpretacji Inne ważne aspekty organizacji informacji wzrokowej można przedstawić na przykładzie złudzeń. Istota wywołania złudzenia polega na tym, żeby wprowadzając na wejście systemu wzrokowego wieloznaczną informację sensoryczną i poddając analizie błędy, jakie system spostrzegania przy tym popełnia, odsłonić pewne ukryte właściwości tego systemu. W ten sposób udaje się często poznać lepiej szczegóły operacji systemu spostrzegania niż byłoby to możliwe w normalnych warunkach. Spójrzmy na rysunek 1-15. Przedstawia on figurę, którą można spostrzegać jako przedmiot „leżący" (rys. 1-16) albo „stojący" (rys. 1-17). [Złudzenia te najlepiej sprawdzić samemu, nie ograniczając się jedynie do przeczytania opisanego tu zjawiska.] Przygotujcie kawałek twardego kartonu złóżcie i ustawcie tak, jak to przedstawia rysunek 1-18 [przyjmując, że złożony karton symbolizuje książkę, kładziemy go grzbietem do góry, opierając na zewnętrznych krawędziach]. Następnie popatrzcie nań jednym okiem, tak aby oko i linia kartonu znalazły się na jednej płaszczyźnie, a oko znajdowało się nieco wyżej od linii zgięcia. Punkt fiksacji wzroku nazwiemy punktem O. Początkowo przedmiot wygląda tak, jak to widać na rysunku 1-16, [czyli tak jak go położyliśmy: rozchylone boki, grzbiet w górze], jednak po dłuższym wpatrywaniu się weń karton nagle podnosi się i wygląda tak, jak na rysunku 1-17 [grzbiet staje się wewnętrzną krawędzią otwartej i ustawionej w pionie symbolicznej książki]. Aby uzyskać omawiany efekt, musimy zdobyć się na chwilę koncentracji oraz cierpliwości. Złudzenie warte jest tego. Kiedy dostrzeżecie przedmiot w pionie (rys. 1-17), lekko poruszcie głową w przód i w tył (pamiętając o tym, że używamy ciągle jednego oka). Zwróćcie uwagę na zmiany kształtu przedmiotu przy ruchach głowy. Istnieją dwa różne sposoby organizacji obrazu tej figury. Kiedy przedmiot spostrzegany jest jako leżący, wszelkie informacje dotyczące głębi pasują do siebie. Kiedy przedmiot spostrzegany jest jako stojący, rozmieszczenie jego konturów i cieni wydaje się nieco inne niż powinno być (dzięki czemu przedmiot wydaje się lekko świecący). Kiedy obserwator porusza głową, to wydaje mu się, że przedmiot sporządzony jest z jakiegoś elastycznego materiału, ponieważ wygina się jakby był z gumy. A zachodzi to dzięki temu, że przy obrotach głowy obraz najbliższego punktu zgięcia przemieszcza się na siatkówce oka szybciej niż obraz bardziej oddalonego punktu. Układ stymulacji podobnego typu pojawia się podczas obserwacji sceny, której poszczególne części znajdują się w różnej głębi; zjawisko to nazywamy paralaksą ruchową. Kiedy przedmiot widoczny jest w jego prawidłowej orientacji przestrzennej, to wskazówki związane z paralaksą ruchową zbiegają się z rzeczywistym ruchem przedmiotu. Ale jeżeli przedmiot spostrzegany jest jako „stojący", wszystkie punkty zgięcia wydają się jednakowo oddalone; zgodność orientacji pionowej ze wskazówkami paralaksy ruchowej możliwa jest tylko w takim wypadku, gdy sam przedmiot wygina się i skręca. I chociaż dobrze wiemy, że przedmiot obserwowany nie może się tak zachowywać, dane sensoryczne zmuszają nas do spostrzegania go właśnie w ten sposób. Wszystkie dane sensoryczne służą do konstruowania spójnej interpretacji świata widzialnego. Zanim odłożycie ten kawałek kartonu, spróbujcie przeprowadzić jeszcze jedno doświadczenie. 44 Ustawcie przedmiot w ten sposób, aby jedna jego strona była silnie oświetlona. Kiedy nastąpi iluzoryczna zmiana położenia przedmiotu z pozycji poziomej w pionową, zwróćcie szczególną uwagę na zmianę pozornej jasności tej strony przedmiotu, która znajduje się w cieniu. Czy możecie wyjaśnić te różnice jasności? ZNACZENIE REGUŁ Przytoczone w tekście przykłady ilustrują ogólną tezę teoretyczną, mówiącą o konieczności interpretowania danych sensorycznych. Jakie reguły rządzą procesem interpretacji? Spójrzcie na rysunek 1-19. Spostrzegamy go od razu jako zbiór trójwymiarowych ciał, częściowo zasłaniających się wzajemnie. Pytanie dotyczy tego, z jakiej informacji korzystamy, aby zadecydować, jak poszczególne powierzchnie brył współgrają w tworzeniu figur percepcyjnych? Skąd wiadomo, że powierzchnie 20 i 18 albo też (trudniejszy przykład) powierzchnie 3 i 29 należą do jednej bryły? Aby rozwiązać to zadanie, należy rozpatrzyć poszczególne linie i kąty, wyodrębnione z całego obrazu. Okazuje się jednak, że obraz można rozczłonkować za pomocą różnorodnych metod. Przykład ten zapożyczyliśmy z pracy Guzmana (1969). Autor ten, będąc specjalistą od maszyn liczących, 45 próbował ustalić zasady, za pomocą których maszyna licząca mogłaby rozwiązywać podobne zadanie. Guzman przeanalizował szereg zadań tego typu i wywnioskował, że najważniejszych informacji dotyczących zasłaniania jednych brył przez drugie dostarcza analiza przecięć, to znaczy tych miejsc, w których przecinają się kontury (rys. 1-20). Jeżeli przecięcie ma na przykład kształt litery L, to powierzchnie lewa a [kąt ostry] i prawa b [kąt rozwarty], według wszelkiego prawdopodobieństwa, należą do różnych ciał. Przy przecięciach w kształcie widełek [litera Y, trzy przecinające się linie tworzą kąty mniejsze od 180 stopni] wszystkie trzy powierzchnie: d, e, f mogą należeć do tego samego ciała. Strzałka zazwyczaj wyznacza przynależność trzech powierzchni do dwu różnych ciał: powierzchni h i i [kąty ostre] do jednego, a powierzchni j [kąt większy od 180 stopni] do drugiego. 46 Szczególnie ważnych wskazówek dla ostatecznej rekonstrukcji obrazu dostarcza przecięcie typu T. Takie przecięcie często oznacza, że jeden przedmiot umieszczony jest przed drugim w taki sposób, że powierzchnie k i l należą do jednego ciała, które rozpościera się z tyłu ciała m. Dlatego też po odkryciu przecięcia typu T należy sprawdzić, czy w pobliżu nie ma innych przecięć tego typu, a jeżeli są, to jak one łączą się z pierwszym? Na rysunku 1-21 [prostopadłościan np. gruba książka, leżąca, widoczne trzy powierzchnie, zasłonięta częściowo przez duży trójkąt] są dwa przecięcia typu T, stanowią one dostateczne wskazówki, że powierzchnie o i p [widoczne z lewej strony trójkąta części grzbietu i okładki] są powiązane ze sobą, podobnie jak powierzchnie s i r [to co widać z prawej strony trójkątnej zasłony], i że o i r [czyli lewa i prawa część okładki] stanowią tę samą powierzchnię, podobnie jak p i s [obie części grzbietu]. Uzupełniająca informacja, jakiej dostarczają widełki, a świadcząca o przynależności r, s i z [trzecia powierzchnia książki] do jednego ciała, pozwala na jednoznaczną interpretację całej figury: q [czyli trójkąt] - jest jednym ciałem, natomiast f, p, r, s i z [książka] - drugim; u stanowi tło. W przytoczonym tu przykładzie niewątpliwie wykorzystuje się dwa różne źródła informacji: pierwsze - specyficzną informację o obrazie, jakiej dostarcza analiza przecinających się linii; drugie - interpretację znaczenia przekazywanego przez przecięcia tych linii. W taki to sposób informacja zawarta w cechach samego obrazu łączy się tu z interpretacją struktur widzianych całościowo. Z tym podwójnym procesem - wyodrębnienia cech oraz ich interpretacją w kontekście całości - spotykamy się ciągle podczas badania procesu spostrzegania. Co więcej, ta dwoistość procesu spostrzegania zaznacza się wyraźnie nie tylko w toku analizy prostych brył, ale i w tych przypadkach, kiedy występuje sprzeczność między cechami specyficznymi a całościową interpretacją danego przedmiotu; kiedy taka sprzeczność się wyłoni, wynikające zeń spostrzeżenie ujawni ją w pełni. Spostrzeganie przestrzeni Zazwyczaj spostrzegamy przestrzeń jako trójwymiarową. Odległe przedmioty widziane są pod mniejszym kątem aniżeli przedmioty tej samej wielkości, leżące bliżej nas. 49 Zmienia się struktura powierzchni widzianej z różnych odległości i pod różnymi kątami. Linie równoległe zdają się stykać w oddali. Ponieważ człowiek żyje i porusza się w świecie trójwymiarowym, jest rzeczą naturalną, że ma on tak ukształtowany w procesie ewolucji aparat wzrokowy, aby był przystosowany do tworzenia trójwymiarowej reprezentacji tych obrazów, które spostrzega. Spróbujemy rozpatrzyć szereg reguł wykorzystywanych prawdopodobnie przez aparat wzrokowy do tego celu i wyjaśnimy zasady ich działania przy powstawaniu niektórych znanych zjawisk. We wszystkich przypadkach, kiedy mamy do czynienia z układem obrazów wzrokowych, zawierających zbiegające się linie lub krawędzie, możliwe są dwa podejścia interpretacyjne. Może to być albo przedmiot dwuwymiarowy, ustawiony frontalnie, i w tym przypadku linie istotnie zbiegają się, albo też przedmiot trójwymiarowy, widziany pod pewnym kątem-i wówczas linie w rzeczywistości mogą być równoległe, a pozorne ich schodzenie się-to rezultat odległości. Wybór jednego z możliwych sposobów interpretacji dokonuje się, jak widać, na podstawie analizy wszystkich dostępnych informacji. Rozpatrzmy dwie stożkowate figury na obrazie Magritte'a (rys. 1-22). Oba stożki nakreślone są niemal identycznie, ale przedstawiają dwie różne rzeczy. Lewy stożek wyraźnie jest ustawiony pionowo. Jego brzegi nie wydają się równoległe. [Stanowi zwieńczenie wieży w kształcie walca i znajduje się na pierwszym planie widoku z okna lub namalowanego obrazu stojącego na tle okna i idealnie wkomponowanego w widok za oknem]. Stożek z prawej strony, mający te same rozmiary, przedstawia ulicę oddalającą się w stosunku do obserwatora. Jego brzegi wydają się równoległe. I oto ta sama informacja wzrokowa może być interpretowana zupełnie inaczej. Zdolność widzenia głębi nie zależy od stopnia znajomości przedmiotu obserwacji. Na obrazie Jeffreya Steele'a (rys. 1-23) złudzenie głębi tworzy się dzięki umiejętnemu wykorzystaniu perspektywy przy niekończących się powtórzeniach danego układu. Poziome kontury, rozmieszczone w równych odstępach w przestrzeni, rzutowane są na siatkówkę w coraz mniejszych odstępach. Przypatrzcie się układowi na rysunku 1-24. Jeżeli zaczynając od środka przenosimy wzrok w prawo i pojawia się wrażenie cofania się w głąb, to jest tak dlatego, że odstępy między liniami stopniowo się zmniejszają. Jeżeli uważnie przestudiujecie geometrię rysunku, to możecie się przekonać, że gradient zmniejszania się tych odstępów daje wystarczająco dokładną informację o kątach i o odległościach. Na rysunku 1-25 gradienty różnych linii, które widzi obserwator, przedstawione są w postaci gładkiej powierzchni z naniesionymi na nią w równych odstępach liniami, przy czym powierzchnia nachylona jest w kierunku od patrzącego. Gradient odstępów linii pozwala obserwatorowi bezbłędnie ocenić kąt nachylenia. 55 Odległość nie jest jednak znana, ponieważ w przedstawionym przypadku ten sam gradient odstępów może być obserwowany z dowolnej odległości (pod warunkiem, że obserwator nie zna rzeczywistych odstępów między poziomymi liniami). Należy jednak pamiętać, że jeśli (tak jak w pokazanym przypadku) położenie brzegów płaszczyzny jest znane, sytuacja podlega dalszym ograniczeniom. Na rysunku 1-25 płaska powierzchnia jest nachylona, wywołuje to nie tylko zgęszczenie linii w dalszych partiach obrazu na siatkówce (w rzeczywistości linie te rozmieszczone są równomiernie), ale także zmniejszenie długości linii w rzucie. To dobrze znane nam zjawisko, jakim jest gradient odległości, stanowi częste źródło licznych złudzeń wzrokowych. Pierwszy rodzaj takiego złudzenia przedstawia rysunek 1-24, ta część przedmiotu, która wydaje się znacznie bardziej oddalona, równocześnie robi wrażenie większej, pomimo że (a w istocie właśnie dlatego) wszystkie pionowe linie na rysunku mają jednakową długość. Rysunek ten dostarcza obserwatorowi sprzecznych informacji, nic więc dziwnego, że jego interpretacja też jest sprzeczna (patrz również rys. 1-37 s. 57). Nie trzeba wiele, aby pojawiła się informacja o głębi. Do tego celu nadają się np. różnorodne rodzaje gradientów płaszczyzny (rys. 1-26). Jeżeli przedmiot prostokątny jest oglądany na wprost, to obserwator widzi, że tworzące go linie przecinają się pod kątem prostym. Jeżeli przedmiot ten jest nachylony lub obraca się w przestrzeni, w obrazie siatkówkowym kąty są rozbieżne. Stopień rozbieżności kątów od kąta prostego zależny jest od ukierunkowania przedmiotu w przestrzeni. Interpretując oddalenie się od kąta prostego jako informację o głębi, uzyskujemy informację o odległości. Tak więc na rysunku 1-27 [krzyż z dwoma poprzeczkami; górna pod katem prostym, dolna nieco przekręcona] łatwo możemy stwierdzić, że górna poprzeczka krzyża przecina linię pionową pod kątem prostym; jeżeli jednak uzupełni się te informacje dodatkową informacją o głębi, to te same przecięcia odbierane są zupełnie inaczej, jak na rysunku 1-28 [ten sam krzyż został umieszczony na bocznej ściance prostopadłościanu narysowanego w perspektywie; wydaje się, że górna poprzeczka krzyża również jest odchylona od pionu]. Niemożliwe organizacje figur. Inny sposób pozwalający ujawnić nasze wysiłki umiejscowienia przedmiotów w trzech wymiarach polega na zbudowaniu figur, których części nie da się logicznie połączyć w jedną całość. Na rysunku 1-29 przedstawione są fragmenty, które wyglądają jak kąty i boki jakiegoś trójwymiarowego przedmiotu. Spróbujmy je połączyć (rys. 1-30). Co otrzymaliśmy? Okazuje się, że fragmenty te niezupełnie pasują do siebie; w zasadzie nie ma nic nienormalnego w jakimkolwiek połączeniu tych linii i kątów na rysunku, a jednak w tym przypadku interpretacja oddzielnych części zaprzecza całości. Na rysunkach 1-31, 1-32 i 1-33 przedstawiamy jeszcze kilka figur tego typu. Znaczenie kontekstu Niczego nie spostrzegamy w izolacji. Każda informacja musi być zintegrowana w jakąś spójną interpretację całego obrazu wzrokowego. Trzy baryłeczki na rysunku 1-34 58 wyraźnie różnią się wymiarami. Łatwo jednak możemy zmienić istniejące stosunki wielkości między nimi: wystarczy tylko dodać informację, która stworzy określony kontekst (rys. 1-35 i 1-36). [Na jednym rysunku trzy baryłeczki narysowano na tle trójwymiarowego pomieszczenia, którego wszystkie ściany są pokratkowane. Walce stoją przy ścianie jeden za drugim od najmniejszego do największego. Chociaż wymiary ich są identyczne z tymi na białym tle to wydaje się, że te w pomieszczeni z głębią mają zupełnie inne proporcje. Na drugim rysunku walce ustawiono w odwrotnej kolejności tzn. największy jest na pierwszym planie. Widzimy, że baryłeczki są różnej wysokości i średnicy, ale dodana głębia każe nam stwierdzić, że przy ścianie stoją trzy jednakowe walce.] Zwróćcie uwagę na to, że kontekst działa nie tylko w przypadku, kiedy mamy do czynienia ze znanymi przedmiotami. Jego rola ujawnia się nawet w bardzo prostych rysunkach linii (rys. 1-37 i 1-38). [Na tle kilku prostych rozbieżnych linii narysowano dwa równoległe i równe odcinki. Pierwszy bliższy oku przecina dwie linie; drugi dalszy (z powodu zbieżności linii) – cztery. Odcinek przecinający cztery linie wydaje się wyraźnie dłuższy; Idealne koło zostało narysowane na tle zbieżnych i równoległych linii. Koło wydaje się nieregularne; Dwie poziome równoległe linie na tle promieniście wychodzących z jednego punktu półprostych. W miejscu zagęszczenia linii tła wydaje się, że odległość między prostymi jest większa niż na zewnątrz, gdzie zagęszczenie linii jest mniejsze. Trudno przyznać, że patrzymy na proste równoległe.] W zwykłych warunkach wszelkie informacje stanowiące kontekst pasują do siebie. Kiedy przedmiot oddala się od obserwatora, wielkość jego obrazu odpowiednio się zmniejsza. Stosunek wielkości i odległości jest dokładnie taki, jaki powinien być, Jednakże ani artysta, ani psycholog nie ograniczają swych zainteresowań do zwykłych sytuacji życiowych. A surrealiści w swych dziełach odkrywają, a nawet z rozmysłem zniekształcają prawa logicznej proporcji obrazu wzrokowego (rys. 1-39). [ Obraz Rene Magritte, „The Listening Room" przedstawia pomieszczenie wypełnione od podłogi po sufit, od ściany do okna jednym jabłkiem. Za oknem w oddali widać dymiący wysoki komin i jakiś budynek.] 59 Możemy zgodzić się na to jabłko pod warunkiem, że pokój jest bardzo malutki. Ale Magritte zrobił, co mógł, aby wielkość jabłka i pokoju były odbierane jako normalne, tak że ani jedno, ani drugie nie jest odbierane w pomniejszonej skali. Świadomie naruszając reguły, artysta osiąga interesujący efekt. Wszystkie zjawiska tego typu świadczą o tym, że w toku integracji informacji sensorycznych powstaje spójny obraz realnego świata. W warunkach laboratoryjnych możemy stwarzać sytuacje, w których informacja wzrokowa może być wieloznaczna lub niepełna. Na przykład, w doświadczeniu ze złożonym kartonem brakowało informacji o prawdziwym położeniu przedmiotu, a to dlatego, że obserwowaliśmy go jednym okiem przy względnie stałym położeniu głowy. Jak tylko pojawiło się złudzenie, zrobiliśmy ruch głową, co w efekcie dostarczyło nam dodatkowe wskaźniki głębi, ale tym razem wskaźniki ruchu zostały zinterpretowane jako zupełnie nowe spostrzeżenie. Tak długo, jak długo interpretacja okazywała się możliwa (nawet jeżeli obraz był nieznany lub jedyny w swoim rodzaju), złudzenie utrzymywało się. ANALIZA CECH Poprzednie partie tego rozdziału dotyczyły interpretacji cech sensorycznych i reguł działających w toku spostrzegania. Ale, co możemy powiedzieć o samych cechach? Jaką informację wyławia układ nerwowy z sygnałów docierających poprzez narządy zmysłowe? I znowu przychodzi nam z pomocą obserwacja anomalii w spostrzeganiu. W badaniu działania systemu sensorycznego można wykorzystać metody rejestracji i bezpośredniego pomiaru aktywności włókien nerwowych, stosowane w fizjologii. Rezultaty tych badań zostaną omówione w rozdziale 2, jak również w rozdziałach 4-7. Zanim zajmiemy się jednak pracą układu nerwowego, pomocne będzie prześledzenie pewnych bardziej ogólnych właściwości systemu wyodrębniania cech poprzez przyjrzenie się, jak wpływa on na spostrzeganie. Prześledźmy uważnie rysunek 1-40 i 1-41. Patrząc na rysunek 1-40 (krata Heringa) [czarne kwadraty o boku 1 cm umieszczone na białym tle w jednakowej odległości od siebie w kilku rzędach i kolumnach, albo inaczej opisując ten sam obrazek, czarna płaszczyzna pokratkowana białymi równoległymi kilkumilimetrowymi ścieżkami biegnącymi w pionie i poziomie w tych samych odstępach od siebie], widzimy małe szare plamki na skrzyżowaniach wszystkich białych pasów, z wyjątkiem tego jednego, na którym spoczywa nasz wzrok w danym momencie. Kiedy patrzymy na rysunek 1-41 [cztery kwadraty o różnych odcieniach szarości wewnątrz których znajdują się małe kwadraty o tym samym odcieniu koloru szarego], to wydaje się nam, że kwadraty wewnętrzne mają różne odcienie szarości, chociaż w istocie są takie same. Te dwa rysunki ilustrują jedno z praw analizy sensorycznej: wzajemnego oddziaływania na siebie komórek nerwowych. Tak więc praca receptorów, na które pada część obrazu, okazuje się być zależna od sąsiadujących z nimi receptorów. Żaden z opisanych wyżej efektów nie miałby miejsca, gdyby receptory działały niezależnie od siebie, a każdy posyłałby po prostu własny niezależny sygnał do mózgu. W istocie jest jedno takie miejsce na siatkówce, gdzie receptory nie współdziałają zbytnio ze sobą i nie zachodzi w nim efekt pojawiania się szarych plamek na skrzyżowaniach-jest to mały obszar siatkówki dokładnie odpowiadający punktowi fiksacji. Nosi on nazwę plamki żółtej (fovea), (patrz też rozdziały 4 i 5). Podobny efekt możemy zauważyć również na rysunku 1-42. Kiedy nań patrzymy, między kwadratami dostrzegamy szare ukośne linie. [Złudzenie to, polegające na pojawieniu się szarych ukośnych linii (których tu nie ma), odkryte zostało przez Roberta Springera.] 60 W istocie żadnych ukośnych linii na rysunku nie ma. Dodatkowy obraz jest efektem współdziałania komórek nerwowych siatkówki. Wszystkie te proste przykłady pozwalają nam zaobserwować, jak silny wpływ ma mechanizm wyodrębnienia cech na nasze spostrzeganie, ale nie wnoszą nic nowego do zrozumienia działania tego mechanizmu. Nieco więcej możemy dowiedzieć się o mechanizmach wyodrębniania cech korzystając z dwu procedur psychologicznych: 61 Pierwsza z nich uwzględnia stałe ruchy gałek ocznych. Jeśli zatrzymać ruchy oka, oglądany przedmiot stopniowo zanika. Sposób, w jaki obraz przestaje być widoczny, kiedy ruchy oka są zatrzymane, ujawnia pewne właściwości mechanizmu wyodrębniania cech. Druga wykorzystuje obrazy następcze - ślady, jakie nakładają się na odbiór danego przedmiotu, jeśli uprzednio przez długi odcinek czasu obserwowany był inny przedmiot. Zatrzymywanie obrazu Obraz, który odbiera oko, znajduje się w ciągłym ruchu, i to nie tylko z powodu ruchów otoczenia, ale i w efekcie ciągłego tremoru samego oka-drobnych drgań, które nazywamy nystagmusem fizjologicznym. Można wyróżnić kilka typów mimowolnych i subiektywnie niedostrzegalnych ruchów oczu: Bardzo szybkie i drobne ruchy, kiedy oko porusza się około 20 sekund kątowych z szybkością 30-70 razy na sekundę. (Przypomnijmy, że minuta kątowa składa się z 60 sekund, a w stopniu kątowym mieści się 60 minut; 20 sekund kątowych stanowi jedną stu osiemdziesiątą stopnia). Drugi rodzaj to ruch powolny oscylujący. I trzeci - szybkie skoki o amplitudzie około 5 minut kątowych, które często korygują ruch powolny. Spróbujmy zobaczyć ten efekt wynikający z ruchów oczu, przypatrując się rysunkowi 1-43 [na kracie Herringa (rys 1-40) naniesiono dwa małe punkty; czarny na przecięciu białych linii w środku kraty i biały na środku sąsiadującego czarnego pola]. Jeżeli wpatrujemy się w czarny punkt fiksacji (kropka w środku rysunku) bez odrywania wzroku, to po około 30 sekundach czarne i białe części obrazu zaczynają migotać. 62 Wtedy przenieśmy wzrok na biały punkt. Powinniśmy dostrzec zbiór białych kwadratów na czarnym tle (tzn. obraz następczy - przyp. tłum.) nałożony na właściwy rysunek. Obraz następczy kraty będzie przez cały czas przemieszczał się na rysunku bez względu na wysiłki „utrzymania" go na miejscu. To właśnie jest efekt nystagmusa fizjologicznego. Szczególnie interesujący jest nie tyle fakt ciągłego ruchu gałek ocznych, ile zjawisko znikania obrazu w rezultacie zatrzymania ruchów oka. Zjawisko to dostarcza nam ważnych informacji o pracy systemu receptorycznego, analizującego informacje sensoryczne. Istnieje szereg technik stabilizacji obrazu na siatkówce, to znaczy zatrzymania jego ruchu na siatkówce. (Riggs, Ratliff, Cornswett, 1952). Jeden z nich przedstawiony jest na rysunku 1-44 [do lusterka umieszczonego na szkle kontaktowym oka wpada promień z projektora, odbija się od niego, następnie biegnie do ekranu znajdującego się przed patrzącym, odbija się od ekranu i następnie od czterech luster i wpada do oka.]. 63 Do szkła kontaktowego w oku przymocowano małe lusterko, na które z projektora rzutowano obrazy, jakie osoba badana miała oglądać. Tak odbity obraz pada la powierzchnię receptoryczną. Za pomocą tego urządzenia uzyskujemy to, że kiedy oko porusza się w prawo, to wraz z nim przesuwa się lusterko, a tym samym i rzutowany obraz. Przy starannej kalibracji można doprowadzić do sytuacji, w której przestrzeń poruszania się obrazu będzie ściśle odpowiadała kątowi widzenia oka; wtedy żadne ruchy oczu nie doprowadzą do zmiany położenia obrazu na siatkówce. Obserwując za pomocą tego urządzenia jakąkolwiek scenę, widziany obraz już po kilku sekundach zaczyna stopniowo znikać, tak że w efekcie pozostaje puste jednorodne pole w miejscu, gdzie uprzednio był obraz. Znikanie obrazu przebiega w sposób dość szczególny. Obraz „nie roztapia się". Nikną kolejno jego sensowne fragmenty. Znikają jedne części, inne pozostają nietknięte. Obraz utrzymuje się tym dłużej, im bardziej sensowna jest jego struktura. Ta część obrazu, na którą świadomie zwraca uwagę obserwator, trwa najdłużej (rys. 1-45). Możemy sami zaobserwować znikanie obrazu dzięki reprodukcji obrazu angielskiego artysty Petera Sedgleya Lustrzana suita nr 9" (rys. 1-46 - wkładka kolorowa) [Rysunek przedstawia białe współśrodkowe kręgi o niewyraźnych konturach na żółtym tle.] Jeśli będziecie wpatrywać się w środek rysunku z odległości ok. 15 cm nie poruszając oczami, to po pewnym czasie koła zaczną się jakby zamazywać. Wyjaśnienie te go faktu, patrz rysunek 1-47. . Zwróćcie uwagę przede wszystkim na pewne cechy specyficzne rysunku. Obrzeża koncentrycznych kół namalowane są tak, jakby się rozpływały. Nie jest to przypadek. Właśnie dzięki temu można uzyskać określony efekt. Skierujmy wzrok na środek obrazu (z bliskiej odległości) 64 i nie odrywając go nie poruszajmy też oczami. Nie spieszmy się zbytnio, a po chwili jako pierwszy zniknie krąg centralny, a następnie zaczną znikać części innych kręgów, i to nie powoli, ale od razu w większych częściach. W końcu kręgi całkiem znikną i pozostanie jednolita żółta płaszczyzna. Ale, jeśli choć odrobinę poruszymy oczami, kręgi znowu się pojawią. (Nie zniechęcajcie się, jeżeli upływa dłuższy czas, zanim kręgi zaczną znikać. Jest to sprawa praktyki: im częściej będziecie to powtarzać, tym szybciej pojawi się pożądany efekt. Początkowo dość trudno jest wywołać go, ale nie rezygnujcie. Doznanie jest tego warte.) Kręgi zniknęły, a miejsce ich zajęło żółte pole. Ilekroć układ nerwowy zaprzestaje normalnie działać, jego braki nie są odczuwalne. W tym wypadku znika obraz kręgów, ale pozostaje informacja o barwie: od tej chwili widzimy tylko ją. Jak wyjaśnić te zjawiska? Najpopularniejsze wyjaśnienie dotyczy faktu, że percepcja obrazu jest zależna od pracy bardzo złożonych detektorów cech - obwodów nerwowych odkrywających linie, krawędzie, kąty, a nawet koła. Dopóki od receptorów nerwowych siatkówki dociera wystarczająca ilość informacji, dopóty detektory te ciągle pracują i widzimy cały obraz. Kiedy oko przestaje się poruszać, receptory wzrokowe przestają reagować, to znaczy przestają przesyłać sygnały do centrum. W efekcie braku sygnałów detektory te przestają funkcjonować i obraz wzrokowy znika w całości. Wyjaśniałoby to względnie długi okres trwania odbioru skomplikowanych obrazów w porównaniu z prostszymi; pozwala również wyjaśnić nagłe znikanie całych fragmentów obrazu; w końcu w tym tkwi przyczyna zniekształconego spostrzegania złożonych obrazów, mającego miejsce w momencie, kiedy wygasający sygnał sensoryczny powoduje, że mechanizmy spostrzegania błędnie interpretują tę informację sensoryczną, która jeszcze pozostaje dostępna. Należy odpowiedzieć na dwa pytania. Po pierwsze, czy podobnie zachowują się inne zmysły? Na przykład, czy po pewnym czasie przestajemy słyszeć jednostajny sygnał dźwiękowy? Po drugie, dlaczego znikają kręgi Sedgleya, chociaż nie stosowaliśmy specjalnej aparatury w celu stabilizacji obrazu na siatkówce? Łatwo możemy znaleźć odpowiedź na pierwsze pytanie. Jednostajne sygnały dźwiękowe nie istnieją. Nawet te dźwięki, które wydają się stałe ze względu na ich wysokość i głośność, są niczym innym jak stałym układem drgań ciśnienia powietrza. Sygnały dźwiękowe charakteryzują się towarzyszącym im ruchem, a system wzrokowy wymaga sztucznego wprowadzenia ruchu. Inne systemy (zmysły smaku i dotyku) mają zdolność do adaptacji. Na przykład, pasek do zegarka przestajemy odczuwać po jakimś czasie, a ponownie przypomina nam on o swoim istnieniu w momencie, gdy poruszymy zegarkiem. Wrażenie smakowe lub zapachowe również znika po pewnym czasie, jeśli pobudzenie nie ulega zmianie. Jak widać, wszystkie systemy sensoryczne są zdolne do długotrwałego odbierania sygnałów tylko w takich warunkach, kiedy sygnały te są zmienne. Zatrzymajmy obraz-to przestaniemy go spostrzegać. A jak wygląda odpowiedź na drugie pytanie? Kręgi znikały dlatego, że miały rozpływające się brzegi. Kiedy spoglądacie na rysunek, wasze oczy mimowolnie poruszają się, ale te ruchy o nieznacznej amplitudzie prowadzą jedynie do wibracji obrazu na receptorach siatkówki (rys. 1-47). Przejście od jednego koloru do drugiego następuje tak płynnie, 65 że ruch rozpływającego się brzegu nie może wywołać na tyle silnej stymulacji, aby była zauważalna przez receptory. Należy zachować ostrożność przy wyciąganiu wniosków o mechanizmach nerwowych na podstawie tego typu danych behawioralnych. Wszelkie alternatywne wyjaśnienia trzeba też starannie rozpatrzyć. Znikanie i pojawianie się na nowo obrazów może być np. skutkiem technicznych trudności aparatu, takich jak przesuwanie się soczewek. RYSUNEK 1-47. U góry: Wyjaśnienie, dlaczego znika tylko krąg zamglony, a nie krąg wyraźny. Mimowolne ruchy gałek ocznych (nystagmus fizjologiczny) prowadzą do znacznej zmiany intensywności obrazu na nitkowce (a), kiedy fiksacja oka jest na wyraźnym kręgu, ale te same ruchy oczu powodują jedynie nieznaczne zmiany w intensywności zamglonego kręgu (b). Czy wyjaśnia to znikanie kręgów na obrazie Petera Sedgleya (rysunek 1-46 na wkładce kolorowej)? Na dole: Przedstawiono wpływ nagłych zmian intensywności. Jeżeli będziecie nieruchomo wpatrywać się w czarny punkt na rysunku b (lepiej zamknąć jedno oko), to zamglony krąg szybko zniknie. Pojawi się natomiast ponownie z chwila, kiedy mrugniemy okiem lub też przeniesiemy wzrok na punkt X. Wyraźnie zarysowany krąg (a) oczywiście nie znika. Rysunki te pochodzą z pracy Cornsweeta (1969). 66 Może obraz nie został idealnie zatrzymany. Może tylko dlatego sądzimy, że znikają sensowne składniki obrazu, ponieważ są to jedyne zmiany w percepcji, jakie potrafimy bez trudu opisać. Problemów tych nie należy oczywiście traktować jako podstaw do odrzucenia opisywanego zjawiska, ale jedynie jako impuls do dalszych badań. Eksperymenty nad zatrzymywaniem obrazu stanowią zapewne użyteczny pomost między naszym doświadczeniem percepcyjnym a mechanizmami nerwowymi leżącymi u podłoża systemu wzrokowego człowieka. Efekty następcze Drugim ważnym źródłem dostarczającym informacji o procesie spostrzegania jest analiza następstw silnej stymulacji. Obserwatorowi, który początkowo patrzy na jaskrawo oświetloną kolorową płaszczyznę, a następnie przenosi wzrok na powierzchnię gładką i białą, ta wydaje się nie biała, lecz kolorowa-w kolorze dopełniającym do uprzednio oglądanego. Tak więc, jeżeli obserwujemy powierzchnię o barwie czerwonej, to oglądana następnie biała powierzchnia wyda się nam zielona. Jeżeli pierwotne oświetlenie było niebieskie, to obraz następczy będzie żółty, a jeżeli początkowo obserwowaliśmy czarną powierzchnię, to obraz następczy będzie biały. Analogiczne efekty charakteryzują również system mięśniowy. Stańcie w otwartych drzwiach, a następnie silnie „odpychajcie" rękoma framugę nad głową, tak jakbyście chcieli powiększyć przejście, kiedy odejdziecie na bok i rozluźnicie mięśnie rąk, odniesiecie wrażenie, jakby ręce same podnosiły się do góry. I w tym przypadku efekt następczy silnej stymulacji mówi nam co nieco o wewnętrznym funkcjonowaniu systemu. Efekty następcze ruchu. Szczególnie wyraziście prezentują się efekty następcze ruchu. Poobserwujcie poruszający się przedmiot. Klasycznym przykładem jest efekt wodospadu, ale możemy też znaleźć i inne przedmioty. Podstawowy warunek - obserwator bez przerwy patrzy w jeden punkt, utrzymując w absolutnym bezruchu wzrok przez kilka minut, w czasie których trwa ruch. Jeżeli potem przeniesie wzrok na przedmiot o wyraźnej fakturze (na przykład na ścianę albo jeszcze lepiej na tkaninę o delikatnej fakturze, np. zasłonę lub prześcieradło), to odniesie wrażenie pozornego ruchu, który będzie się odbywał w kierunku odwrotnym w stosunku do obserwowanego wcześniej. Jeżeli przedmiot poruszał się z góry na dół, to obraz następczy przemieszcza się z dołu do góry; jeżeli obserwujemy rozwijającą się spiralę, to w obrazie następczym będzie się zwijała. Przyglądając się uważnie powierzchni z określoną fakturą, zauważymy, że w istocie nie ma żadnego ruchu: obraz wzrokowy jest nieruchomy. Odbieramy wrażenie ruchu pozornego przy braku poruszającego się obrazu. 67 JAK UZYSKAĆ EFEKTY NASTĘPCZE RUCHU? Niezwykle efektywnym źródłem ruchu jest wirownica obracająca się z prędkością 3-4 obrotów na sekundę. Na wirownicy należy narysować linie, które wyraźnie kontrastują z tłem krążka, ułatwi to obserwację ruchu. Najwyraźniejszy efekt ruchu można uzyskać rysując na krążku spiralę, a następnie obserwując obracający się krążek odnosimy wrażenie, że spirala ta zwija się lub rozwija, zależnie od kierunku obrotów. Aby ułatwić wam obserwację efektu następczego ruchu, zaopatrzyliśmy was w odpowiednią spiralę (rys. 1-48), którą po przerysowaniu na karton należy umieścić na talerzu gramofonu. 68 Spirala ta została przystosowana do szybkości 33 i jedna trzecia obrotów na minutę. Jeżeli nie dysponujecie gramofonem, można po prostu umieścić w centrum spirali ołówek i wprawiać ją w ruch obrotowy. Starajcie się jednak obracać ją dosyć wolno, w przybliżeniu z prędkością około 33 i jedna trzecia obrotów na minutę. Następnie wpatrujcie się w środek wirującej spirali nie odrywając wzroku co najmniej przez 30 sekund, a potem przenieście wzrok na dowolne przedmioty znajdujące się w pokoju lub na czyjąkolwiek twarz. Jak już wspominaliśmy, główne efekty następcze ruchu powstają w wyniku długotrwałej obserwacji wodospadu. Jeśli nie możecie znaleźć wodospadu i nie chcecie lub nie potraficie skonstruować wirownicy, to istnieje jeszcze jedna alternatywna metoda znalezienia ruchu. Taką metodą jest użycie telewizora; po ustawieniu obrazu na maksymalną jasność i maksymalny kontrast należy ostrożnie manipulować pokrętłami synchronizacji poziomej, tak aby obraz przesuwał się przez ekran w sposób ciągły w górę lub w dół. Niestety obraz, zwłaszcza w dobrym telewizorze, będzie drgał, co przeszkadza w uzyskaniu efektu. Należy w takiej sytuacji wpatrywać się weń dłużej (róbcie to przy wyłączonym dźwięku). Wreszcie można symulować wodospad odkręcając maksymalny strumień wody w wannie lub prysznicach i wpatrując się weń przez co najmniej jedną minutę. Metody tej specjalnie nie polecamy, ale daje ona pożądany efekt. Efekty następcze barwy. Zapoznajcie się z rysunkiem 1-49 (wkładka kolorowa). [ Rysunek przedstawia dwa białe trapezy na czarnym tle z zaznaczonym punktem fiksacji. Lewy trapez pokryty jest zielonymi serduszkami, prawy jest cały biały. Wpatrujcie się uporczywie w czarny punkt z lewej strony, tam, gdzie znajdują się zielone serduszka.] Starajcie się nie poruszać głową i nie odrywać oczu tak długo aż cała figura zacznie migotać. Wówczas przenieście wzrok na drugi czarny punkt, ten z prawej strony, na białym tle. Powinniście zobaczyć szereg czerwonych serduszek (obraz następczy łatwiej pojawi się, jeżeli mrugniecie kilkakrotnie powiekami). Obraz następczy, który występuje w wyniku intensywnego wpatrywania się w daną barwę, polega na pojawieniu się barwy dopełniającej w stosunku do poprzednio działającej lub-jeśli wolicie-barwy przeciwstawnej. Można dostrzec efekt następczy oddziaływania barwy wykorzystując dowolną barwną powierzchnię, w tym również te, które znajdują się na wkładkach barwnych. Wyjaśnienie efektów następczych Zwróćcie uwagę na dwa aspekty dotyczące efektu następczego. Po pierwsze, efekt następczy zawsze jest w swej istocie przeciwstawny lub dopełniający w stosunku do oddziaływania początkowego, dotyczy to zarówno ruchu, jak i napięcia mięśniowego lub barwy (kiedy zajmiemy się mechanizmami widzenia barw, zrozumiemy, dlaczego barwa czerwona jest dopełniającą w stosunku do zielonej). Może to świadczyć o istnieniu dwu antagonistycznych systemów, których działanie jest wzajemnie przeciwstawne. Po drugie, dowolny efekt następczy pojawia się w wyniku długotrwałej stymulacji jednego z tych antagonistycznych systemów: długotrwałej ekspozycji jednej z barw dopełniających lub długotrwałego ruchu w jednym kierunku. Można zatem przypuszczać, że zaangażowane tu mechanizmy nerwowe ulegają procesowi adaptacji lub zmęczeniu, 69 co w konsekwencji prowadzi do obniżenia ich wrażliwości na sygnały płynące z zewnątrz. Rozpatrzmy na przykład efekt następczy ruchu. Załóżmy, że istnieją w układzie nerwowym specyficzne detektory ruchu, w dodatku detektory ruchu odbywającego się w jednym kierunku występują w parze z detektorami ruchu w kierunku przeciwnym. Przyjmijmy dalej, że oba typy detektorów są antagonistyczne, to znaczy aktywność jednych hamuje równocześnie aktywność drugich. Musimy jeszcze przyjąć, że detektory ruchu są tak ze sobą połączone, iż tworzą nową jednostkę-detektor wyższego rzędu. Jednostka ta reaguje wzmocnieniem reakcji neuronów w wypadku ruchu w jednym kierunku i osłabieniem ich reakcji, kiedy ruch pojawia się w kierunku przeciwnym. Kiedy ruch nie występuje, oba typy detektorów znajdują się w równowadze i wówczas na wyjściu tej nowej jednostki detektora występuje pewien stały niski poziom wyładowań - potencjał tła, który wskazuje brak ruchu. Teraz musimy przyjąć nowe założenie, że przy długotrwałej jednostajnej stymulacji detektory zasilające ten obwód wyższego rzędu ulegają zmęczeniu. Z tego względu w następstwie nadmiernej stymulacji (i zmęczenia), kiedy obserwujemy ten sam przedmiot, zmęczone detektory nie mogą przyczynić się w wystarczającym stopniu do zrównoważenia aktywności przeciwstawnych im detektorów i cały obwód sygnalizuje ruch przeciwny do tego, który był charakterystyczny dla stymulacji początkowej. W analogiczny sposób można wyjaśnić również efekty następcze barwy. Również i tu komórki nerwowe połączone są parami, w każdej parze komórki reagują na dwa różne rodzaje bodźców; reakcja na wyjściu takiej pary będzie stanowiła różnicę reakcji obu komórek. Jeżeli receptor czerwieni znajduje się w jednej parze z receptorem zieleni, to oba reagują identycznie na obecność światła białego i na wyjściu połączonych komórek brak będzie sygnałów. Ale komórka „czerwona" będzie reagowała na czerwone światło i na wyjściu pary pojawi się reakcja pozytywna, a komórka „zielona" będzie reagowała na światło zielone i na wyjściu pary pojawi się reakcja negatywna. Oba komponenty systemu reagują identycznie na białe światło i na wyjściu połączonych komórek znajduje się jedynie potencjał tła. Przypuśćmy teraz, że oko obserwuje przez pewien czas czerwoną powierzchnię. Stopniowo receptory czerwieni ulegają zmęczeniu i tracą swą zdolność do reagowania. Jeżeli po tym włączymy białe światło, to receptory zieleni będą reagowały normalnie, ale normalna reakcja zmęczonych receptorów czerwieni jest zahamowana; tym sposobem „zielone" reakcje przeważą nad „czerwonymi" i w efekcie białe światło będzie odbierane jako zielone. Efekty następcze wskazują, że w pewnym momencie jedno z ogniw w łańcuchu procesów prowadzących do spostrzegania ulega zmęczeniu w wyniku długotrwałej stymulacji, ale samo wystąpienie efektu nie daje informacji o tym, która część całego systemu spostrzegania uległa zmęczeniu. Aby móc to wyjaśnić, potrzebne są dodatkowe fakty. Podstawowy sposób uzyskania tych faktów polega na oddzieleniu pól widzenia obu oczu, tak aby można było sprawdzić możliwość transferu efektu następczego z jednego oka na drugie: jeżeli stymulacja jednego oka prowadzi do pojawienia się efektu następczego w drugim oku, to zmęczenie obejmuje centralną część systemu, jeśli zaś transfer nie wystąpi, dotyczy ono jedynie części obwodowej. 70 Opisane wcześniej efekty następcze barwy nie przenoszą się z jednego oka na drugie, można zatem traktować je jako wynik zmęczenia lub adaptacji mechanizmów obwodowych, związany prawdopodobnie z wyczerpaniem się zapasów substancji chemicznej w receptorach barw siatkówki. Trudno natomiast określić dokładną lokalizację zmęczenia leżącego u podstaw efektów następczych ruchu. Jedne badania wykazały, że możliwy jest transfer tego efektu z jednego oka na drugie, co pozwalałoby na wysunięcie sugestii, że zmęczeniu ulegają procesy ośrodkowe. Inne prace jednak tego nie potwierdzają. Wniosek jest tu oczywisty: efekty następcze świadczą zarówno o występowaniu specyficznych obwodów nerwowych w systemie analizy sensorycznej, jak i o istnieniu specyficznych detektorów ruchu i barwy. Adaptacja do barwy uzależniona od kierunku Stosunkowo niedawno odkryto szereg dość zagadkowych efektów następczych. Zjawiska te po raz pierwszy opisała McCollough w 1965 r. i zostały one nazwane efektem McCollough (McCollough, 1965). Wyjaśnienie tego efektu wiąże się ponownie z założeniem dotyczącym istnienia w systemie spostrzegania człowieka specyficznych detektorów cech. Wysuwaliśmy już przypuszczenie dotyczące istnienia specyficznych detektorów linii. Teraz przyjmijmy, że istnieją również specjalne detektory kolorowych linii w systemie widzenia człowieka. Jak zademonstrować ich obecność? Rozważania w poprzedniej części rozdziału wskazują, iż należy wywołać zmęczenie jednego rodzaju detektorów linii, a następnie zaprezentować neutralny bodziec. Jeżeli istnieje antagonistyczna grupa detektorów, to ujawni się ona w wystąpieniu efektu następczego. Przypuśćmy, że istnieją odrębne detektory dla czerwonych i zielonych poziomych linii. Po długotrwałej ekspozycji zielonych linii poziomych, białe linie poziome powinny wydawać się czerwonawe (ponieważ białe światło składa się z równych ilości czerwonego i zielonego światła). Czy efekt ten ogranicza się wyłącznie do linii poziomych, czy też jest przejawem ogólnej adaptacji do koloru zielonego? Aby to ustalić, trzeba równocześnie wywołać także zmęczenie odpowiednich detektorów czerwonych pionowych linii, tak aby białe pionowe linie ukazały się zabarwione na zielono. To właśnie zjawisko jest efektem McCollough. W ciągu 5 minut osobie badanej pokazywane są na przemian czerwone pionowe linie (rys. 1-50a) [szereg czerwonych linii milimetrowej szerokości na przemian z liniami czarnymi tej samej szerokości] i zielone poziome linie (rys. 1-50b) [poziomy układ zielonych i czarnych linii, każda milimetrowej szerokości], każdy wzorzec eksponowany jest przez około 5 sekund. Następnie prezentuje się osobie badanej wzorzec kontrolny złożony z białych i czarnych linii ułożonych w różnych kierunkach (rys. 1-50c); białe linie poziome mają czerwonawy odcień, białe pionowe - odcień zielonkawy, a linie ukośne biały. Jeżeli badany przechyla głowę w taki sposób, że linie ukośne staną się poziome lub pionowe, to przybiorą one wówczas odpowiednie zabarwienie. Efekt ten niesie kilka niespodzianek. Jedna z nich to fakt, że jest on niezwykle trwały. Niektórzy ludzie nawet po upływie 8-10 godzin od zakończenia eksperymentu 71 ciągle jeszcze spostrzegają białe linie jako zabarwione. A są i tacy, którzy twierdzą, że efekt następczy utrzymuje się około tygodnia; jest to niezwykle długotrwałe utrzymywanie się zjawiska stosunkowo prostego dla systemu spostrzegania. Efekt ten wyraźnie nie jest prostym obrazem następczym w rodzaju białego obrazu następczego, jawiącego się po obserwacji czarnego kwadratu. Efekt następczy wymaga długotrwałej stymulacji przy nieruchomych oczach. Ale najdziwniejsze w tym wszystkim jest to, że efekt ten nie jest zgodny z dwiema intuicyjnie wysuniętymi tezami dotyczącymi detektorów linii. Jeśli te specyficzne efekty adaptacji do barwy byłyby wynikiem istnienia specyficznych obwodów detektorów linii, należałoby oczekiwać zniknięcia efektu w sytuacji rozmycia konturów, rozpływania się granic między czarnymi a białymi liniami na wzorcu kontrolnym. Z kolei zmiana stopnia kontrastu między czarnymi i białymi liniami na wzorcu kontrolnym nie powinna mieć wpływu na efekt następczy dopóty, dopóki linie są wyraźnie widoczne. Jednak w toku sprawdzania uzyskano odwrotny rezultat: zmiany ostrości nie miały wpływu na efekt, a zwiększenie kontrastu nawet zwiększało efekt następczy. Efekt McCollough służy do zademonstrowania organizacji funkcjonalnej dwu uzupełniających się wzajemnie systemów, wrażliwych na pewne układy cech zawarte w bodźcu wzrokowym. Jak dowiemy się później, pewna liczba detektorów linii barwnych, to znaczy jednostek funkcjonalnych, które mają maksymalną wrażliwość na linie o określonej barwie, została niedawno wykryta w mózgu małp. Nie należy jednak zbyt pochopnie wyciągać wniosków. Detektory linii są znacznie bardziej złożone niż byłoby to niezbędne do wyjaśnienia omawianego tu zjawiska. Kiedy zajmiemy się omawianiem obwodów nerwowych, służących do rozpoznawania cech, przekonamy się o tym, że lepszego wyjaśnienia danych eksperymentalnych, jakimi dysponujemy, dostarcza nam model znacznie prostszego detektora (patrz s. 127). Zanim skończymy omawianie efektu McCollough, chcemy odnotować interesujące zjawisko, otóż efekt ten utrzymuje się również w sytuacji spostrzegania poruszających się obrazów. 72 Początkowo osobie badanej prezentowany jest obraz składający się z poziomych pasów, które mogą poruszać się w górę lub w dół, przy czym w momencie poruszania się w górę pasy zabarwiają się na zielono, zaś przy ruchu w dół na czerwono. Osoba badana obserwuje całość przez 5 minut, przy czym ruch przebiega naprzemiennie- 5 sekund w górę, potem 5 sekund w dół i tak dalej. Po 5 minutach eksponuje się osobie badanej wzorzec kontrolny, składający się z czarnych i białych linii poziomych, poruszających się w górę lub w dół. Kiedy obraz kontrolny porusza się w górę, linie wydają się czerwonawe, zaś przy ruchu w dół przybierają barwę zielonkawą (Stromeyer, 1969; Stromeyer i Mansfield, 1970). Jest to zjawisko analogiczne do efektu McCollough. Zmieniony został tylko jeden warunek: zamiast nieruchomych linii położonych w różnych kierunkach eksponowano linie poruszające się w różnych kierunkach. Czy oznacza to, że istnieją rzeczywiście wrażliwe na barwy detektory ruchu? SPOSTRZEGANIE BEZ WYODRĘBNIANIA CECH Badania nad zatrzymywaniem obrazów oraz nad efektami następczymi dają nam wyobrażenie o tym, jakie metody mają zastosowanie przy poznawaniu tych rodzajów detektorów cech, które prawdopodobnie funkcjonują w systemie wzrokowym człowieka. Nie ulega bowiem wątpliwości, że człowiek rzeczywiście ma detektory do wykrywania cech specyficznych. Jednakże ciągle jeszcze nie znamy dokładnie ich ogólnej roli w procesie spostrzegania, nie zostały też wyodrębnione poszczególne typy tych detektorów. W każdym razie jeden z wybitnych neurofizjologów (Spinelli, 1967) twierdzi, że detektory cech są niezbędne wyłącznie dla niższych gatunków zwierząt, a u człowieka stanowią coś w rodzaju niedopatrzenia, które zachowało się dzięki słynnej rozrzutności procesu ewolucji. Pewne właściwości ludzkiego spostrzegania dość trudno wyjaśnić, odwołując się do systemów zawierających detektory cech. Przeanalizujcie raz jeszcze ilustracje zamieszczone w tym rozdziale. Spójrzcie na cętkowanego psa lub też na inne rysunki. Jakie cechy specyficzne są tam przedstawione? Jak rekonstruowany jest obraz psa z różnorodnych plamek, które nie zawierają ani linii, ani też wyrazistych konturów? Jak rywalizują ze sobą różne obrazy na płótnie Salvadora Dali albo też różne interpretacje form stożkowatych w obrazie Magritte'a? Jak to wyjaśnić opierając się wyłącznie na detektorach cech? Pozwólcie, że przeanalizujemy jeszcze problem „widzenia skórnego". „ Widzenie skórne" Jeżeli ktoś „nakreśli" palcem na waszych plecach lub dłoni jakąś dużą literę, bez trudu uda się Wam ją rozpoznać. Czyżby skóra posiadała detektory cech pozwalające na rozwiązanie tego zadania? W celu zinterpretowania tego typu wrażeń skórnych człowiek musi być zdolny do odtworzenia drogi, jaką przebył palec na jego skórze, i zdecydować, 73 jaką literę ona przedstawia. Jeżeli rozpoznawanie obrazów na podstawie wrażeń dotykowych może odbywać się bez pomocy detektorów cech, to czy są one potrzebne w normalnym rozpoznawaniu wzrokowym? Rozpatrzmy sytuację bardziej kontrolowaną, w której założony obraz wzrokowy „rysuje się" nie na fotoreceptorach siatkówki oka, lecz na dotykowych receptorach skórnych. Dane te uzyskano w toku ostatnich badań nad systemami zastępującymi wzrok i przeznaczonymi dla osób niewidomych. Aparat przekształcający obraz wzrokowy na obraz dotykowy składa się z kamery telewizyjnej, połączonej z zestawem wibratorów pobudzających dotykowe receptory skóry. Jeden z takich aparatów przetwarza obraz wzrokowy na dotykowy w następujący sposób: 400 wibratorów dotykowych umieszczonych w kwadratowej kracie (bok kwadratu wynosi 25 centymetrów) jest przymocowanych do oparcia krzesła. Wibratory przejmują wzorzec z kamery (aparat ten został skonstruowany i wypróbowany przez Withe'a, Saundersa, Scaddena, Bach-y-Rita i Collinsa, 1970). Obserwator siedzi na krześle plecami do wibratorów. Fragmenty obrazu wzrokowego, którym towarzyszy wysoka intensywność oświetlenia, aktywizują wibratory w odpowiadających im miejscach kraty, wibratory odpowiadające fragmentom obrazu o niskiej intensywności są nieaktywne. W ten sposób, kiedy obserwator przesuwa obraz kamery telewizyjnej wzdłuż obserwowanej sceny, układ intensywności oświetlenia tej sceny zostaje przetworzony na obrazy dotykowe na skórze pleców (rys. 1-51). Biorąc pod uwagę prymitywność obrazów dotykowych, zdolność obserwatorów zarówno widzących (z oczyma zasłoniętymi), jak i niewidomych, do rozpoznawania obrazów przy użyciu tej aparatury jest w istocie bardzo duża. Udaje się im bardzo łatwo, już przy pierwszej próbie, odróżnić pasy pionowe od poziomych. Szybko uczą się odróżniać proste figury geometryczne - koła, kwadraty, trójkąty. Większego doświadczenia wymaga rozpoznawanie przedmiotów bardziej złożonych, jak np. filiżanka czy telefon. Po nabyciu wprawy, zarówno niewidomi, jak i osoby widzące biorące udział w eksperymencie 74 mogą na podstawie obrazów dotykowych rozpoznawać 25 przedmiotów codziennego użytku. Co więcej, jeżeli przedmioty były rozmieszczone na stole i obserwowane nieco z góry, obserwatorzy potrafili opisać ich wzajemne położenie oraz względną głębię obrazu. Ta ostatnia zdolność do odbioru głębi obrazu na podstawie dwuwymiarowego obrazu dotykowego jest szczególnie interesująca. Główną wskazówkę pozwalającą na ukierunkowanie przedmiotów w przestrzeni stanowi niewątpliwie względna wysokość przedmiotów znajdujących się w różnej odległości od obserwatora. Część obserwatorów dostrzegła również związek między odległością przedmiotu a jego odbieraną wielkością. Jeden z niewidomych, z zawodu psycholog, który wielokrotnie opowiadał studentom o zmianach wielkości przedmiotów wraz ze zmianą ich odległości, poinformował o tym, jak po raz pierwszy odkrył związek między modyfikacją dotykowo odbieranej wielkości przedmiotu a jego odległością: efekt ten wykrył nagle, na zasadzie wglądu (typu reakcji ,,aha") w czasie przybliżania obserwowanego przedmiotu do obiektywu kamery telewizyjnej. W zasadzie niewidomi od urodzenia wykonywali to zadanie nie gorzej niż obserwatorzy mający normalny wzrok. Kiedy jednak niewidomemu obserwatorowi eksponowano przedmiot, którego kształty nie były mu znane z wcześniejszych doświadczeń dotykowych, nie mógł go rozpoznać. Warto dodać, iż prawidłowe rozpoznanie ułatwiła obserwatorowi sytuacja, kiedy sam posługiwał się telekamerą. Wiele przedmiotów, których badani nie mogli nauczyć się rozpoznawać, kiedy kamera pozostawała nieruchoma, łatwiej identyfikowano w sytuacji, kiedy obserwatorowi pozwolono swobodnie poruszać plecami, tak że obraz dotykowy przesuwał się po plecach drażniąc różne receptory. Badanie systemów zastępujących widzenie pozwala na postawienie zasadniczych pytań dotyczących struktury analizy percepcyjnej. W omawianym przypadku skóra odbiera układ kropek-gruba analogia obrazu wzrokowego, pobudzającego receptory siatkówki. A jednak tą drogą rozpoznawane są skomplikowane obrazy. Nawet niektórych złudzeń wzrokowych można doświadczyć w ten sposób, chociaż zazwyczaj uważa się, że takie złudzenia pojawiają się na stosunkowo wysokim poziomie analizy percepcyjnej; w tym celu niezbędne jest wykorzystanie odpowiednich bodźców dotykowych, tzn. badany czuje, choć nie widzi, linie rysunku. Tak więc nawet ludzie niewidomi mogą doznawać złudzeń „wzrokowych". Czy to, co powiedzieliśmy do tej pory, upoważnia nas do stwierdzenia, że kanały nerwowe przekazujące informację dotykową funkcjonują podobnie jak kanały przekazujące dane wzrokowe? Czy zatem system analizujący informację dotykową posiada detektory linii oraz detektory kątów? A jeżeli nie, to w jaki sposób analizowane są złożone obrazy dotykowe? Być może złożone detektory nie są aż tak ważne i stanowią „przedmiot luksusu" w systemie wzrokowym? Wszystkie te pytania są zapewne niezmiernie intrygujące, ale nie potrafimy jeszcze odpowiedzieć na nie. Należy szczególnie zaznaczyć istotną rolę aktywnego ruchu w rozpoznawaniu obrazów dotykowych. Ruch odgrywa ważną rolę w przetwarzaniu informacji wzrokowej. Można więc sądzić, że na ogół systemy spostrzegania są tak zaprogramowane, iż uzyskują więcej 75 informacji z następstwa zjawisk wywołanego poruszającym się obrazem, aniżeli z reakcji na sygnał statyczny dochodzący z otoczenia. Trzeba tu dodać, że dotyczy to tylko tych ruchów, które obserwator może sam regulować. Jeżeli ktoś inny porusza przedmiotem (lub kamerą telewizyjną), to wywołany w ten sposób ruch nie ułatwia spostrzegania. Dysponujemy analogicznymi danymi dotyczącymi ruchów oczu - aktywnych i pasywnych. Kiedy oko wykonuje naturalne ruchy, regulowane przez mięśnie oczne, otaczający nas świat wygląda normalnie. Przy pasywnych ruchach oczu, wywołanych przez lekkie naciskanie palcami, uzyskujemy wrażenie, że wszystko wokół porusza się. Ten fałszywy efekt kompensuje się tylko w toku aktywnych ruchów oczu. Możliwe, że tak samo wygląda sprawa ruchu dla wrażeń dotykowych. Mamy za sobą pierwsze kroki w zakresie badania problemów dotyczących rozpoznawania obrazów. W dwu następnych rozdziałach rozpatrzymy niektóre z tych problemów bardziej szczegółowo. Skoncentrujemy się zarówno na operacjach zachodzących w komórkach odpowiedzialnych za wstępne przetwarzanie sygnałów, jak i na ocenie wybranych teorii rozpoznawania obrazów. Przekonamy się, że proces wyodrębniania cech odgrywa ważną rolę tak w badaniu mechanizmów fizjologicznych, jak i w konstrukcjach teoretycznych. Ale, jak wskazują materiały zawarte w tym rozdziale, analiza cech nie może być uważana za wystarczającą do wyjaśnienia wszystkich właściwości ludzkiego spostrzegania. 2. Przetwarzanie informacji przez układ nerwowy OKO ŻABY ANATOMIA DETEKTORÓW METODY FIZJOLOGICZNE Neuron Rejestracja reakcji neuronów TWORZENIE OBWODÓW NEURONOWYCH OBWODY PODSTAWOWE Budowa bloków Receptor Komórka nerwowa WYODRĘBNIANIE KONTURÓW Wrażliwość a czułość sensoryczna Hamowanie oboczne Obwody służące do wyodrębniania konturów Pola centralne i peryferyjne (center-surround fields) Obwody włączeniowo-wyłączeniowe REAKCJE W CZASIE Obwody służące do wytwarzania przemijających reakcji REAGOWANIE NA RUCH Obwody służące do wykrywania ruchu Światło porusza się z lewej strony na prawą Światło porusza się z prawej strony na lewą PRZETWARZANIE SYGNAŁÓW W CIELE KOLANKOWATYM BOCZNYM WYODRĘBNIANIE CECH Proste komórki Charakterystyczne reakcje Jak zbudować detektory szczeliny i detektory linii? DIPOLE Komórki złożone Jak zbudować komórki złożone? Komórki superzłożone Jak zbudować komórkę superzłożoną? WNIOSKI 77 OKO ŻABY Od czego należy zacząć badanie nad przetwarzaniem informacji w układzie nerwowym? Jeden ze sposobów podejścia zaprezentowany został w klasycznej już dziś pracy Lettvina, Maturany, McCullocha i Pittsa (1959), dotyczącej badań nad systemem wzrokowym żaby: „Postanowiliśmy, że nasza praca powinna wyglądać następująco: Po pierwsze, należało znaleźć sposób rejestracji impulsów nerwowych... z włókien nieuszkodzonego nerwu wzrokowego. Po drugie, należało eksponować żabie możliwie zróżnicowany zestaw bodźców wzrokowych: nie tylko plamki świetlne, lecz również takie przedmioty, które byłyby dla niej jadalne, takie, które mogłaby odebrać jako zagrażające, różnorodne figury geometryczne, nieruchome i poruszające się itp. W efekcie chcieliśmy ustalić, jakie cechy wspólne z całego bogactwa bodźców są wyodrębniane przez określone włókna albo też grupy włókien znajdujące się w nerwie wzrokowym. Po trzecie zaś, chcieliśmy spróbować znaleźć podłoże anatomiczne grupowania percepcyjnego". Co badacze ci spodziewali się znaleźć w oku żaby? Pozornie świat wzrokowy żaby nie wygląda na zbyt skomplikowany. Żaba wydaje się na ogół nie zwracać uwagi na wiele rzeczy, które ją otaczają, i wykazuje względnie słabą aktywność poznawczą. Właśnie z powodu braku aktywności poznawczej łatwo jest ją złapać - wystarczy zbliżyć się do niej od tyłu. Wydaje się, że główny sygnał niebezpieczeństwa, jaki dociera do żaby, stanowią poruszające się cienie, które to uprzedzają ją o zbliżającym się napastniku. Właściwie jedyną oznaką, że żaba robi użytek ze swego wzroku, jest jej umiejętność chwytania poruszających się szybko owadów. Oczekuje ona momentu, kiedy owad znajdzie się dostatecznie blisko, po czym łowi go szybkim i precyzyjnym ruchem języka. Analizując system wzrokowy żaby, Lettvin i jego współpracownicy stwierdzili, że odpowiada on w pełni zachowaniu żaby. Oko żaby okazuje się być zdolne do wyławiania z sygnału wzrokowego tylko czterech typów informacji. Z czterech detektorów, jakie posiada, trzy związane są z wyodrębnieniem względnie ogólnych cech sytuacji wzrokowej: Są to: detektory ostrości, silnie reagujące na granicę między jasnymi i ciemnymi częściami; detektory kontrastu ruchu, reagujące tylko wtedy, kiedy ta granica porusza się, i detektory ciemności, reagujące na ogólne obniżenie oświetlenia. Najbardziej interesujące są jednak detektory czwartego typu-detektory wypukłych krawędzi, reagujące tylko w tych przypadkach, kiedy w polu widzenia porusza się mały ciemny przedmiot. Aby ten detektor zaczął działać, przedmiot musi być ciemny, powinien się poruszać i mieć względnie okrągły kształt. Jak tylko taki przedmiot pojawi się w polu widzenia, detektor wypukłych krawędzi zaczyna wysyłać słabe impulsy. W miarę jak przedmiot zbliża się do żaby, impulsy stają się coraz silniejsze. Detektor kontynuuje swą pracę nawet wtedy, gdy przedmiot nagle zniknie z pola widzenia (ale impulsy zanikają, jeżeli nagle zmieni się oświetlenie, np. w wyniku mrugnięcia). Detektor ten jest oczywiście detektorem owadów, przeznaczonym do wyszukiwania pokarmu: 78 dostarcza właśnie takich informacji, jakie są niezbędne do efektywnego łapania much. Tak więc należy przypuszczać, że oko żaby zawiera wzorzec nerwowy pozwalający rozpoznawać muchy i inne owady. Mózg żaby jest dość prymitywny. Dzięki istnieniu w oku żaby detektora owadów cały proces koordynacji wzrokowo-ruchowej związanej z łapaniem much zostaje znacznie uproszczony. Wystarczy jednak umieścić żabę w nowych warunkach, na przykład rozsypać wokół niej świeżo zabite muchy, a ona, mimo takiego nadmiaru pożywienia, może zginąć z głodu: w efekcie braku ruchu wzorzec zawodzi i żaba nie zwróci najmniejszej uwagi na otaczające ją martwe muchy. Taka specjalizacja żabiego oka świadczy z jednej strony o wysokiej efektywności i skomplikowaniu mechanizmów nerwowych, z drugiej ogranicza możliwości przystosowawcze. System rozpoznawania bodźców wzrokowych, jaki przedstawiliśmy, nie jest odpowiednio elastyczny, aby przystosowywać się do nowych warunków. ANATOMIA DETEKTORÓW Różnorodne funkcje czterech typów detektorów odkrytych w oku żaby mają swoje odpowiedniki w morfologii komórek nerwowych. Ponadto detektory te wysyłają impulsy do różnych części mózgu i każdy z nich wygląda inaczej. Rysunek 2-1 przedstawia: a) klasyfikację komórek nerwowych postulowaną przez Lettvina i współpracowników (1961); b) klasyfikację neuronów rzeczywiście odkrytych u kijanki przez Pomeranza i Chunga (1970); i c) fotografie komórek odkrytych przez Pomeranza i Chunga. Niełatwo jest określić, które komórki odpowiadają receptorom każdego z tych typów. Oczywiście można zrobić sekcję oka żaby i oglądać je pod mikroskopem. Wtedy rzeczywiście widzimy cztery typy komórek. Ale na pytanie, która z tych komórek odpowiada danemu receptorowi, nie znajdujemy odpowiedzi. Ustalenie związku między typem detektora a rodzajem komórki wymagało dużego sprytu. Podstawowa trudność polega na tym, że na preparacie mikroskopowym widzimy martwe komórki. Nie potrafimy badać komórki pod mikroskopem i w tym samym czasie odprowadzać od niej impulsy elektryczne, aby móc równocześnie określić nie tylko, jak ona wygląda, ale i jak funkcjonuje. Przygotowanie histologiczne zawsze narusza struktury nerwowe. Przygotowanie komórki wzrokowej do badań mikroskopowych musi naruszyć jej funkcjonowanie jako detektora bodźców. Dlatego też Pomeranz i Chung szukali wsparcia w logice dedukcyjnej. Obrali za przedmiot swych badań kijankę, nie żabę. Oko kijanki ma bowiem nie cztery, lecz trzy rodzaje różnych komórek (rys. 2-1). Pozwoliło to na zidentyfikowanie komórek określonego rodzaju-tych, których brak jest w oku kijanki; szczegółowe badania fizjologiczne dokonane na żywych kijankach wykazały, że nie mają one detektora kontrastu. Widocznie ten detektor pojawia się w późniejszej fazie rozwoju u dorosłego osobnika. Następnie udało się ustalić, że na peryferiach siatkówki oka kijanki znajdują się komórki wyłącznie jednego rodzaju. Rejestrując reakcje żywych kijanek na peryferyczne bodźce, udało się ustalić, że są to detektory wypukłych krawędzi. Pozostały już tylko do wyodrębnienia dwa rodzaje komórek: detektora kontrastu ruchu i detektora ciemności. I tu znowu odwołano się do logiki dedukcyjnej. 80 Spośród dwu pozostałych komórek jedna jest dwuwarstwowa, druga zaś jednowarstwowa, przy tym komórek drugiego rodzaju było znacznie więcej. Wskaźniki te okazały się wystarczające do rozwiązania zagadki. Ponieważ detektor ciemności ma większe pole recepcyjne i w dodatku spełnia znacznie prostsze funkcje niż detektor kontrastu ruchu, powinien zatem mieć prostszą jednowarstwową strukturę. Badania nad okiem żaby ilustrują metody i założenia będące podstawą badań fizjologicznych. Rezultatem tych badań było wykazanie, że żaba ma dość skomplikowany system analizy sensorycznej, przeznaczony do wyodrębniania specyficznych informacji z obrazu wzrokowego. Oczywiście nie należy oczekiwać, że detektory owadów znajdziemy u wszystkich zwierząt. W istocie u wyżej niż żaba zorganizowanych osobników system przetwarzania informacji sensorycznych jest zbudowany w pewnym sensie znacznie prościej, ale jest równocześnie bardziej precyzyjny i elastyczny. Proces ten przebiega małymi krokami, regulowany poprzez proste, lecz skuteczne zasady łączenia, przegrupowywania i analizowania danych, dostarczanych przez receptory z otaczającego środowiska. Aby móc zrozumieć te zasady, musimy najpierw zapoznać się z podstawową jednostką układu nerwowego - neuronem - i metodami badania jego zachowania. Następnie musimy poznać sposoby połączeń neuronów w obwody nerwowe, w których dokonuje się analiza informacji dostarczanej przez narządy zmysłów. METODY FIZJOLOGICZNE Neuron Podstawowym elementem układu nerwowego jest neuron-komórka, przez którą przechodzi informacja przekazywana z jednej części organizmu do drugiej. Ograniczymy się do wyłożenia podstawowych danych dotyczących budowy i funkcji neuronu. Pojedynczy neuron składa się z kilku części: ciała komórki (zwanego sumą) oraz włókna nerwowego (zwanego aksonem), po którym informacja przechodzi od jednego neuronu do drugiego; część, w której pobudzenie jednego neuronu przekazywane jest do drugiego, nosi nazwę synapsy (rys. 2-2). W połączeniach między neuronami bierze udział samo ciało komórki lub też jej cienkie wypustki - dendryty. Akson jest zakończony albo niewielką liczbą odgałęzień, albo też odgałęzień tych jest wiele i wówczas możliwa jest znaczna liczba połączeń synaptycznych z innymi neuronami. Podobnie ciało komórkowe jednego neuronu może odbierać sygnały od niewielu lub też od tysięcy różnych neuronów. Włókna nerwowe i dendryty można rozpatrywać jako izolowane przewodniki, którymi przekazywane są sygnały specyficzne dla układu nerwowego-impulsy elektryczne. Te elektryczne (a ściślej jonowe) sygnały są generowane w ciele komórki jako reakcje na pobudzenie wejść synaptycznych. W samej synapsie pod wpływem napływającego impulsu 82 uwolniona zostaje specyficzna substancja chemiczna - mediator, która wypełnia lukę miedzy zakończeniem aksonu od przekazującego impuls neuronu a częścią odbiorczą następnego neuronu, co wywołuje zmianę normalnego potencjału elektrycznego tego neuronu; jeżeli ilość mediatora jest dostatecznie duża, zmiana potencjału elektrycznego ciała komórkowego neuronu osiąga wystarczający poziom do wzbudzenia impulsu, który poprzez akson dociera do następnego połączenia synaptycznego, gdzie cały ten proces powtarza się od nowa. Jedynie w rzadkich przypadkach pobudzenie jednej synapsy wystarczy do pojawienia się impulsu w komórce odbiorczej. Zwykle neuron musi otrzymać wiele impulsów, zanim w jego ciele komórkowym pojawi się impuls - reakcja. Wszystkie połączenia synaptyczne można podzielić na pobudzeniowe i hamujące. Pobudzenie pierwszych zwiększa prawdopodobieństwo reakcji neuronu, pobudzenie zaś drugich zmniejsza je. Reakcja komórek na pobudzenie wszystkich synaps jest rezultatem jakby „głosowania chemicznego": stosunek „głosów" płynących z synaps pobudzeniowych i hamujących na wejściu danego neuronu determinuje poziom jego finalnej aktywności. Częstotliwość reakcji neuronu zależy na ogół od częstotliwości i rodzaju impulsów na wejściu synaps, ale występują tu również pewne ograniczenia. Po wytworzeniu impulsu neuron przestaje działać przez okres 0,001 sek. w celu regeneracji. Tak więc, teoretycznie maksymalna częstotliwość reakcji neuronu wynosi ok. 1000 impulsów na sekundę, praktycznie zaś jest znacznie niższa i waha się w granicach 300 do 800 impulsów na sekundę. Znamy obecnie wiele różnych rodzajów komórek nerwowych, każda z nich spełnia wyspecjalizowane funkcje. Dla nas szczególnie interesujące są tzw. receptury - komórki przetwarzające energię fizyczną przekazywaną z sygnału zewnętrznego w impulsy elektryczne. Przykładem takich komórek (receptorów) są pręciki i czopki w siatkówce oka, które przekształcają elektromagnetyczną energię padającego na nie światła w impulsy nerwowe. Podobnie komórki włoskowe (włosowate) ucha wewnętrznego przekształcają energię mechaniczną sygnałów akustycznych w kod nerwowy. Rejestracja reakcji neuronów Reakcja neuronu stanowi krótkie wyładowanie elektryczne, dlatego też jego aktywność można rejestrować jedynie wówczas, gdy uda się nam połączyć przewodniki elektryczne z neuronami. Przyrządem rejestrującym jest tu elektroda. Zwykle łączy się ją z wzmacniaczem elektrycznym, aby słabe impulsy elektryczne komórki stały się dostępne dla obserwatora. Sygnał z wyjścia wzmacniacza przekazywany jest na monitor elektroniczny, aby dać możność obserwatorowi zarówno widzenia, jak i słyszenia reakcji neuronów wywołanych przez sygnały zewnętrzne (rys. 2-3).[Rysunek pokazuje schemat podłączenia kota do urządzeń rejestrujących. W głowie zwierzęcia umieszczona jest elektroda, która przesyła sygnał do wzmacniacza. Wzmacniacz daje sygnał do głośnika lub do komputera, który przetwarza sygnał i wyświetla go na ekranie oscyloskopu.] W celu rejestracji obrazu zmian napięć w neuronie w ciągu określonego czasu posługujemy się zazwyczaj oscylografem. W momencie, kiedy impulsy nerwowe przechodzą przez elektrodę, na ekranie pojawiają się małe punkciki lub kreski. Jeżeli sygnał ten zostanie przekazany do głośnika, można usłyszeć trzask w momencie, gdy neuron wytwarza impuls. Ponadto aktywność neuronu przebiegającą w określonym czasie 83 możemy zapisać na taśmie magnetofonowej, co pozwala na dokonanie analizy po jakimś czasie; podobnie można fotografować obraz pojawiający się na ekranie oscylografu lub też analiza pojawiających się impulsów może być dokonana za pomocą komputera. Dla większości systemów sensorycznych charakterystyczne są cienkie włókna nerwowe o średnicy 3 do 5 mikronów. Aby zarejestrować aktywność pojedynczego neuronu, używa się bardzo małych elektrod - mikroelektrod. Zależnie od rodzaju mikroelektrody, jej końcówka ma średnicę od 0,1 do 1 mikrona. W celu rejestracji aktywności grupy leżących obok siebie włókien stosuje się makroelektrody, mające nieco większą średnicę. Czasem końcówka mikroelektrody jest tak cienka, że nie udaje się jej dostrzec pod normalnym mikroskopem i widoczna staje się dopiero przy użyciu mikroskopu elektronowego. W użyciu są zarówno makroelektrody, jak i mikroelektrody, zależnie od potrzeb badawczych. Często duże liczby sąsiadujących ze sobą neuronów zdają się wydobywać z nadchodzącego sygnału podobną informację, tak że pojedyncze włókno nie może być odpowiedzialne za dostarczenie właściwej informacji do mózgu. W takim wypadku wygodniej jest badać średnią aktywność sąsiadujących neuronów za pomocą makroelektrody. Z drugiej strony, oddzielne neurony w toku analizy i kodowania sygnałów sensorycznych współdziałają często z innymi w sposób złożony. 84 W celu wyjaśnienia istoty tych interakcji konieczne jest dokładne badanie pracy każdego neuronu z osobna. W takich sytuacjach wykorzystuje się mikroelektrody. Gdzie należy umieszczać elektrody? Dla sygnałów sensorycznych charakterystyczne jest łączne występowanie synaps włókien przewodzących informację sensoryczną w miejscu zwanym stacją synaptyczną lub stacją przekaźnikową. Ponieważ większość operacji, jakich dokonuje układ nerwowy, przeprowadzana jest na połączeniach między neuronami, badanie stacji synaptycznych jest niezmiernie użyteczne. Analizując to, co dajemy na wejściu, i to, co otrzymujemy na wyjściu, próbujemy dociec, jak jest przekształcana informacja sensoryczną, kiedy przechodzi przez stację synaptyczną. Wybór zwierzęcia eksperymentalnego zależy od wielu czynników. Przeprowadzono liczne badania podstawowe nad okiem ostrogona (Limulusa), a to dlatego, że neurony jego siatkówki są dostatecznie duże i dostęp do nich jest łatwy. Im bardziej chcemy zbliżyć się do człowieka, tym bardziej złożone organizmy musimy wybierać do badań. Najczęściej eksperymentuje się z małpami i kotami. Inne zwierzęta, takie jak ryby, rzadko ptaki, bada się tylko wówczas, gdy ich systemy sensoryczne dają nam większe możliwości w badaniu specyficznych typów kodowania nerwowego. Eksperymenty z ludźmi są zjawiskiem niezmiernie rzadkim. Możliwe są tylko wtedy, gdy konieczne jest dokonanie operacji neurochirurgicznych, w czasie których rejestracja neuronów stanowi dopuszczalny margines samej operacji lub stanowi niezbędny element jej przebiegu. TWORZENIE OBWODÓW NEURONOWYCH Mamy już teraz wszelkie niezbędne dane do utworzenia obwodów nerwowych. Rozpatrzmy problem wykrywania poruszającego się przedmiotu. Jak przejść od prostej reakcji światłoczułych receptorów oka do neuronu reagującego tylko wtedy, kiedy przedmiot porusza się z lewej strony, wszerz pola widzenia? Jak sformułować teorię obwodów neuronowych? Na kolejnych stronach tej książki będziemy tworzyć obwody neuronowe, zdolne do wykrywania konturów figur, ruchu, koloru i innych cech przedmiotów. Zaczniemy od bardzo prostych interakcji układu nerwowego i stopniowo będziemy postępować w ten sposób, aby przejść (teoretycznie) do systemu neuronów reagujących tylko na bardzo złożone przedmioty, na przykład na pojawienie się w polu widzenia naszej babci. Będziemy jednak musieli zatrzymać się w pewnym miejscu, nie dochodząc do tego ostatniego etapu, w przeciwnym razie napotkamy trudność, jaką zasygnalizowaliśmy na początku książki. Czy rzeczywiście można utworzyć detektor babci? Czy istnieje w mózgu komórka, która reaguje w specyficzny sposób tylko wtedy, gdy ona pojawi się w polu widzenia? Analiza i rozpoznanie złożonych obrazów będzie tematem rozważań w następnym rozdziale. A tymczasem, zanim przejdziemy do wyczerpującego omówienia problemu, powinniśmy zorientować się, jak łączyć neurony, aby sprawnie funkcjonowały. Zaczniemy od prostych obwodów, przechodząc stopniowo do bardziej złożonych. 85 Oznacza to, że zaczniemy od systemów sensorycznych, a następnie prześledzimy drogi nerwowe wiodące od nich do mózgu. Podstawowym przedmiotem naszego zainteresowania będzie system wzrokowy, po pierwsze dlatego, że stanowi materiał dla naszych celów dogodny, a po drugie dlatego, że o połączeniach neuronów w oku oraz o wzrokowych ośrodkach mózgu wiemy więcej niż o innych systemach sensorycznych. Zasady budowy bloków strukturalnych układu nerwowego są takie same dla wszystkich modalności zmysłowych. Kiedy poznamy już zasady budowy obwodów nerwowych dokonujących analizy sygnałów wzrokowych, łatwo będziemy mogli opracować analogiczne obwody dla innych systemów sensorycznych. Zanim jednak przystąpimy do stojącego przed nami zadania, musimy ostrzec Czytelnika. W toku badania różnorodnych typów analizy informacji w systemach sensorycznych należy zawsze pamiętać o nieprawdopodobnym stopniu złożoności połączeń elementów nerwowych mózgu. System wzrokowy człowieka zawiera około 125 milionów podstawowych elementów receptorycznych w każdym oku. Na jeden centymetr sześcienny mózgu przypada aż 40 milionów synaps. Pojedynczy neuron kory mózgu (a jest ich setki milionów) obejmuje, w zależności od tego, do jakiej części mózgu należy, 6000 do 60 000 synaps. W świetle tych liczb oraz uwzględniając czułość mikroelektrod używanych do badania pojedynczych neuronów i wiele czynników biologicznych, mechanicznych i elektronicznych, które także wpływają na pomyślny przebieg każdego badania tego typu, należy wyrazić uznanie, że mimo to udało się nam nauczyć tak wiele. Część materiału przedstawionego w tym rozdziale to precyzyjnie ustalone fakty; pozostałą część stanowią konstrukcje czysto teoretyczne. Niektóre z nich są ogólnie przyjęte, inne zaś ciągle wywołują dyskusje. Czytając kolejne paragrafy trzeba pamiętać, że badania dotyczące specyficznych funkcji pojedynczych komórek mózgu są w powijakach. Rezultaty, jakie uzyskano do dziś, są niezmiernie obiecujące, ale ciągle jeszcze niepełne. OBWODY PODSTAWOWE Budowa bloków Badając budowę obwodu sensorycznego, musimy wyróżnić dwa poziomy tego systemu: zespół komórek przetwarzających nadchodzące z zewnątrz sygnały fizyczne w wyjścia nerwowe- są to receptory lub odbiorniki oraz komórki, które w różny sposób zbierają i łączą nadchodzące impulsy nerwowe, zwane po prostu komórkami nerwowymi, a czasem określane jako dwubiegunowe (bipolars) lub zwojowe (ganglion cells). Nie będziemy sztywno posługiwać się terminologią przyjętą w neurologii i często będziemy używać takich terminów, jak receptor czy komórka zwojowa (ganglion), kiedy w istocie w grę wchodzi cały kompleks elementów - komórki amakrynowe, komórki horyzontalne, 86 różnorodne receptory i rozliczne rodzaje mechanizmów synaptycznych. Jednakże wyjaśnienie istotnych dla nas cech neuronu będzie łatwiejsze, gdy ograniczymy podział na dwa podstawowe typy: przetworniki i łączniki (transformers and combiners), albo - w terminologii neurofizjologicznej - receptory i komórki nerwowe. 87 Receptor. Receptor reaguje na sygnały zewnętrzne - światło, dźwięk, dotyk, działanie zynnika chemicznego - poprzez impuls nerwowy. Model receptora przedstawiony został na rysunku 2-4. Wyjścia receptora oznaczyliśmy liczbami: wskazują one na szybkość, z jaką receptor przewodzi impulsy nerwowe. Dla ułatwienia, z zasady będziemy pomijać mechanizmy przetwarzające intensywność sygnału fizycznego w częstotliwość poszczególnych reakcji. Tak więc intensywność sygnału będziemy przedstawiać za pomocą liczby impulsów nerwowych, które wytwarza on w receptorze. Sygnał intensywności 5 oznacza sygnał o takiej intensywności, dla której reakcja neuronu stanowi pięć jednostek umownych. Rysunek 2-4 jest przykładem stosowania przyjętych oznaczeń. 88 Komórka nerwowa (rys. 2-5). Jest to miejsce łączenia się różnych impulsów nerwowych. Komórkę nerwową oznaczamy kółkiem. Ma ona dwa rodzaje połączeń, czyli wejść: pobudzeniowe i hamujące. Neuron odbiera na wejściu znaczną liczbę impulsów, ale na wyjściu przekazuje tylko jeden (chociaż może być skierowany w różne miejsca). Neuron ma często własne „wewnętrzne" tempo (częstotliwość) wyładowań. Inaczej mówiąc, komórka nerwowa może wysyłać impulsy nawet w takich wypadkach, kiedy na jej wejściu brak jest jakichkolwiek sygnałów. W opisywanych niżej obwodach częstotliwość własna, odpowiadająca spontanicznej aktywności, często przyjmowana jest za 100. W pewnych wypadkach wielkość ta może być większa lub mniejsza od 100, a czasem nawet równa 0. Każdemu wejściu neuronu przypisana jest dodatnia lub ujemna wartość liczbowa-mnożnik. Wejście charakteryzujące się dodatnim (plus) mnożnikiem, to wejście pobudzeniowe, a wejście mające ujemny (minus) mnożnik, to wejście hamujące. Jeżeli na przykład mnożnik na wejściu wynosi „plus 0,5", oznacza to, że na każde 100 jednostek aktywności na wejściu, wyjście neuronu powiększa się o 50 jednostek (0,5 razy 100). Jeżeli wejście ma współczynnik „minus 0,5", to na wyjściu neuronu aktywność maleje o 50 jednostek na każde 100 znajdujących się na wejściu. Dla ułatwienia, połączenia pobudzeniowe (pobudzające) oznaczyliśmy na rysunku 2-5 strzałkami, a połączenia hamujące kropkami. Wartość wyjścia neuronu obliczamy jako sumę algebraiczną aktywności własnej plus aktywność na wszystkich wejściach pobudzeniowych, minus aktywność na wszystkich wejściach hamujących.[Przykłady obliczeń do rysunku 2-5. Dane: wartość pobudzająca 80, mnożnik 0,25, aktywność własna 100. Obliczamy reakcję: 100 plus 0,25 razy 80 równa się 120 Dane: wartość hamująca 80, mnożnik minus 0,25, aktywność własna 100. Obliczamy reakcję: 100 minus 0,25 razy 80 równa się 80 Dane: trzy wartości pobudzające: 78 o mnożniku 0,5, 75 o mnożniku 1 i 72 o mnożniku 0,125, oraz dwie wartości hamujące: 80 o mnożniku minus 0,125 i 70 o mnożniku minus 0,5, aktywność własna 100. Obliczamy reakcję: 100 plus (78 razy 0,5) plus (75 razy 1) plus (72 razy 0,125) minus (80 razy 0,125) minus (70 razy 05) równa się 178] WYODRĘBNIANIE KONTURÓW W obrazie na siatkówce najistotniejszą informację niosą zmiany intensywności światła padającego na poszczególne części powierzchni siatkówki. Zmiany te mogą się rozciągać na znacznej części oglądanej sceny, odpowiadając różnej jasności poszczególnych jej składników. W miejscach odpowiadających konturom przedmiotów mogą występować znaczne i bardziej gwałtowne zmiany intensywności. Rozmieszczenie połączeń nerwowych w aparacie receptorowym determinuje sposób kodowania tych zmian w postaci impulsów nerwowych w systemie wzrokowym. Wrażliwość a czułość sensoryczna Pożądane jest, aby systemy sensoryczne były możliwie jak najbardziej wrażliwe na sygnały dopływające z otoczenia zewnętrznego. Jednocześnie pożądane jest, aby przechowywały one jak najwięcej szczegółów rozkładu energii odpowiadającego sygnałowi dochodzącemu z zewnątrz. Oba te wymagania wydają się sprzeczne. Przeanalizujemy w ogólnych zarysach rozmieszczenie receptorów jednego z systemów sensorycznych - fotoreceptorów oka (słupki i czopki). 89 Na rysunku 2-6 możemy zobaczyć znaczną liczbę ciasno stłoczonych receptorów siatkówki. Energia świetlna docierając do oka rozkłada się na powierzchnię zbudowaną z oddzielnych receptorów. Aby system był dostatecznie wrażliwy, najprościej będzie przyłączyć do każdej z komórek kolejnego poziomu (komórki zwojowe) jak najwięcej receptorów - tak, aby ich reakcje sumowały się w jednej komórce zwojowej. Im więcej receptorów zostanie przyłączonych do jednej komórki zwojowej, tym wrażliwszy będzie system na słabe sygnały świetlne. Maksymalną reakcję komórki zwojowej uzyskuje się przez zsumowanie reakcji jak największej liczby receptorów (rys. 2-7). Ale za podwyższenie wrażliwości trzeba zapłacić określoną cenę. Jeżeli jedna i ta sama komórka zwojowa zbiera reakcje receptorów z dużego obszaru siatkówki, to zanika zdolność rozróżniania niejednakowych rozkładów światła w obrębie tego obszaru. Aby zachować szczegóły układów świetlnych, pole odbiorcze komórki zwojowej powinno być dość małe. Tak więc, rozważając najlepszy sposób rozmieszczenia receptorów na pierwszym poziomie sensorycznego przetwarzania informacji, zmuszeni jesteśmy pójść na kompromis między utrzymaniem wrażliwości a rejestrowaniem szczegółów struktury sygnału. Hamowanie o boczne Metody badania systemu połączeń w siatkówce oka są dość skomplikowane. Możemy badać równocześnie zaledwie kilka różnych komórek. Znaczna część wiedzy dotyczącej systemu połączeń neuronowych pochodzi z pewnych niezwykle pomysłowych eksperymentów. .Podstawowej wiedzy na temat oka dostarczyły badania nad okiem ostrogona (Limulusa)-(rys. 2-8). 91 Dogodnie umieszczone oko ostrogona ma grube włókna nerwu wzrokowego, dlatego łatwo można je preparować. Najpierw preparujemy oko w ten sposób, aby można było bezpośrednio stymulować odrębne receptory, z pominięciem soczewki i innych tkanek (rys. 2-9). Następnie umieszczamy elektrodę w komórce rojowej i włączamy światło. Załóżmy, że obserwowana jest reakcja komórki zwojowej, kiedy światło skierowane jest bezpośrednio na receptor A (rys. 2-10). Jeżeli pobudzenie komórki zwojowej wzrasta, możemy przyjąć, że jest ono związane z aktywnością receptora A. Skierujmy teraz światło na receptor B (rys. 2-11). Tym razem elektroda nie rejestruje innych zmian aktywności komórki zwojowej. Widocznie receptor B nie wpływa na aktywność komórki zwojowej A. Jednakże zanim stwierdzimy, że wyłącznie receptor A oddziałuje na komórkę, zobaczmy, co się stanie, kiedy podrażnimy jednocześnie oba receptory. Zaczniemy ponownie od włączenia źródła światła pobudzającego receptor A, a następnie oświetlimy receptor B. Jak się okazuje, siła reakcji komórki zwojowej maleje (rys. 2-12). Tak więc, chociaż światło padające na inne niż A receptory nie może wywołać reakcji w omawianej komórce zwojowej, to jednak obniża aktywność tej komórki (jeśli znajdowała się ona uprzednio w stanie aktywności). Ten prosty eksperyment pokazuje jeden z najważniejszych mechanizmów przetwarzania informacji sensorycznej - hamowanie oboczne (lateral inhibition): 93 aktywność jednej komórki jest modyfikowana przez aktywność sąsiadujących z nią komórek. Pozornie koncepcja ta jest dość prosta. Odzwierciedla ona działanie procesu hamowania, który powoduje, że reakcje jednej komórki mogą być odjęte od reakcji innej komórki; inaczej mówiąc, pozwala na obliczenie różnicy między dwoma wejściami. Prostota jest tu tylko pozorna. Daje to bowiem możliwość wyliczenia wszystkich przekształceń złożonego sygnału świetlnego, padającego na powierzchnię receptorów, w logicznie uporządkowany przekaz sensoryczny, który w efekcie końcowym będzie przesyłany do wyższych ośrodków nerwowych. Obwody służące do wyodrębniania konturów Przyjmując założenie o istnieniu mechanizmów hamowania obocznego, rozpatrzymy podstawowe cechy sieci wyodrębniania konturów figur. Zaczniemy od sieci jednowymiarowej, gdzie wszystkie receptory ustawione są w jednym rzędzie. Wszystkie zostają oświetlone. Problem wyodrębniania konturów polega na określeniu miejsca, gdzie następuje zmiana intensywności światła. Jeżeli receptory oraz komórki zwojowe byłyby połączone ze sobą w sposób prosty i bezpośredni, niewiele by to dało (rys. 2-13). Struktura aktywności neuronów byłaby wówczas jedynie bardziej lub mniej dokładnym powtórzeniem właściwości układu światła padającego na te receptory. Dla pewnych celów byłoby to wystarczające, ale nie może stanowić mechanizmu wyodrębniania konturów figury za pomocą takiej sieci. Niezbędne są jakieś czynniki dodatkowe. Dla wyróżnienia konturów niezbędny jest taki układ, w którym aktywność neuronów pobudzanych światłem o stałej intensywności byłaby stosunkowo słaba, natomiast przy zmianach oświetlenia aktywność ta musi się znacznie zwiększać. 95 Takie warunki może zapewnić hamowanie oboczne, dzięki któremu aktywność danego receptora zależy od aktywności receptorów leżących po obu jego stronach. Rozpatrzmy dla przykładu następujący przypadek: mamy stałe źródło światła 10 jednostek (oznacza to, że pobudzony tym światłem receptor wytwarza reakcję charakteryzującą się liczbą 10). Chcemy, aby komórka zwojowa w ogóle nie reagowała na to źródło światła. Musimy więc odjąć 10 jednostek aktywności, niech będzie po 5 z każdej strony. Łatwo to osiągnąć ustaliwszy współczynnik połączeń między komórką zwojową a sąsiednimi receptorami na minus 0,5. Rysunki 2-14 i 2-15 pokazują system, który wyodrębnia ze struktury pobudzenia świetlnego tylko kontury. Po uważnej analizie tych schematów można dostrzec, że system reaguje tylko przy zmianach różnic w intensywności światła padającego na kolejne pary sąsiadujących komórek. Schemat ten ilustruje kilka różnych zagadnień. Po pierwsze, staje się oczywista konieczność istnienia aktywności własnej komórki. Jeżeli by jej nie było, nie moglibyśmy uzyskać negatywnej części reakcji na pobudzenie, ponieważ negatywna aktywność to absurd. Dzięki istnieniu aktywności własnej możliwe są pozytywne i negatywne reakcje komórki: wyrażają się one w podwyższeniu lub obniżeniu jej normalnej aktywności. Ilustruje to wykres umieszczony u dołu rysunku 2-15, gdzie aktywność własna ustalona jest na 20 wyładowań na sekundę. Przedstawiony tu obwód reaguje wyłącznie na kontury. Przemienia świat w rysunek kreskowy. Nie uwzględnia różnic w oświetleniu padającym na różne części obrazu wzrokowego. Taki model jest zbyt jednostronny. Trzeba będzie poszukać kompromisu między dwoma typami obwodów, z których jeden zupełnie nie zmienia sygnału, a drugi pozostawia z niego jedynie kontury. Można to zrobić, na przykład, poprzez zmniejszenie efektu hamowania obocznego. Niech mnożnik wynosi „ minus 0,2" (rys. 2-16). I oto uzyskaliśmy bardzo interesujący wynik. Najsilniejsza reakcja pojawia się przy konturach, ale pozostaje również informacja o względnych intensywnościach światła padającego na różne części obrazu. W ten to sposób zachowując ten sam schemat zasadniczy, ale zmieniając stosunki w procesie hamowania, możemy zmienić również rodzaj informacji wydobywanej z obrazu wzrokowego. Musimy prowadzić bardzo staranne pomiary w celu ustalenia podstawowych wartości występujących w rzeczywistym procesie hamowania w układzie nerwowym. Na rysunku 2-17 przedstawione są zapisy graficzne aktywności neuronowej, zarejestrowanej w sytuacji prawie identycznej z opisaną powyżej. Tak jak i uprzednio obniża się częstotliwość impulsów nerwowych z chwilą, gdy włączymy źródło światła A. Neurony oddziałują na siebie wzajem: A oddziałuje na B tak jak B na A. Zauważcie również, że istnieje najwyraźniej pewien próg dla pojawienia się efektu hamowania: częstotliwość impulsów neuronu A zmienia się dopiero wtedy, gdy aktywność neuronu B osiągnie 10 wyładowań na sekundę. Jednak w momencie, kiedy pojawia się spadek częstotliwości wyładowań neuronów, hamowanie ma charakter liniowy. Wykres przedstawiony na rysunku 2-17 wskazuje, że wpływ jednego czynnego elementu na drugi jest wprost proporcjonalny do częstotliwości wyładowań. W omawianym przypadku współczynnik proporcjonalności jest równy 0,16. Przy zwiększeniu częstotliwości wyładowań 100 o każde 10 impulsów na sekundę uzyskuje się obniżenie efektu hamowania do wielkości równej 1,6 impulsów na sekundę. W ten sposób w obwodzie tym współczynnik hamowania osiąga minus 0,16, co jest dość bliskie minus 0,20 - współczynnikowi, który wspólnie wybraliśmy dla obwodu nakreślonego uprzednio. Dzięki temu rozkład reakcji w oku ostrogona powinien być niemal identyczny z tym, co przedstawiono na rysunku 2-16. 101 Rysunek 2-18 przedstawia rzeczywistą częstotliwość reakcji neuronu zarejestrowaną w oku kraba (ostrogona). Fotografia przedstawia ten sam test świetlny, który opisywaliśmy wcześniej. Elektrodę rejestrującą umieszczono na jednej komórce zwojowej. Aby odkryć reakcję na dany układ świateł, trzeba było przemieszczać światło tak, jak to pokazują strzałki, pozostawiając elektrodę w pozycji stałej. Jest to operacja równoważna z przemieszczaniem elektrody, ale znacznie łatwiejsza do przeprowadzenia. Początkowo światło eksponowano, nakrywszy przedtem oko maską, w której zrobiono maleńki stworek umieszczony dokładnie nad miejscem, gdzie znajdowała się elektroda (kółko z krzyżykiem na rysunku 2-18). Dzięki temu jedynie pobudzająca część pola recepcyjnego otrzymywała bodźce świetlne i krzywa oznaczona trójkącikami na rysunku 2-18 odzwierciedla wynik aktywności neuronu bez hamowania. Z kształtu krzywej wynika, że reakcja neuronów dokładnie oddaje układ pobudzenia świetlnego. Następnie maskę zdejmowano i na oko padał cały układ świateł. W tym momencie zaczynały działać wszystkie czynniki hamujące. Zarejestrowana aktywność przedstawiona została na rysunku 2-18 (krzywa oznaczona kółkami): sieć nerwowa nie produkuje już w prosty sposób bodźca świetlnego, zaznaczone są granice szybko zmieniających się intensywności światła. Zanim zakończymy ten eksperyment, przeanalizujcie uważnie pasma przedstawione rysunku 2-19. Czy występuje wrażenie, że zaciemnienie przedstawionych pasm zmienia się w sposób jednolity? Czy każde z pasm ma jednakową intensywność, która nie zmienia się w obrębie danego pasa? Spróbujcie odnaleźć typ reakcji neuronu na taki układ pasm opierając się na schemacie przedstawionym na rysunku 2-16; rezultat powinien odpowiadać waszemu spostrzeganiu tych pasm. Wszystkie badane przez nas do tej pory systemy sensoryczne zdają się mieć mechanizmy wyodrębniania konturów, oparte na hamowaniu obocznym. Jednakże ten podstawowy mechanizm jest wielce elastyczny i może być użyty do innych typów analizy obrazu wzrokowego. Pouczająca będzie próba narysowania takich obwodów. Pola centralne i peryferyjne (center-surround fields) U bardziej złożonych organizmów, na przykład ssaków, siatkówka działa nieco inaczej niż u kraba (ostrogona), ale podstawowe cechy analizy są podobne. Jednak w toku analizy tych bardziej złożonych systemów wzrokowych pojawiają się nowe problemy. Po pierwsze, pojedynczy receptor może się łączyć z wieloma różnymi komórkami zwojowymi i wtedy nie możemy tak ograniczyć źródła światła, aby pobudzało tylko jedną komórkę zwojową. Po drugie, połączenia między receptorami i komórkami zwojowymi u wyższych organizmów mogą być pobudzeniowe, jak i hamujące. W oku ostrogona dana komórka może mieć tylko negatywny wpływ na sąsiednie komórki. U innych zwierząt sprawa przedstawia się odmiennie. Sąsiednia komórka receptoryczna może wywołać zarówno zwiększenie, jak i obniżenie aktywności w danej komórce zwojowej. Rozważmy typowy zapis z siatkówki kota. Elektrodę wprowadzono do komórki zwojowej i rejestrowano reakcje na bodziec świetlny. Przemieszczając światło odnajdujemy tę część siatkówki, 102 której pobudzenie prowadzi do wzmocnienia reakcji-jest to obszar pobudzeniowy. Widać to na rysunku 2-20 [światło skierowano w okolice środka pola recepcyjnego]. Do rozkładu reakcji neuronu dołączyła się nowa właściwość: dana jednostka funkcjonalna reaguje na pobudzenie świetlne początkowym gwałtownym skokiem aktywności powyżej poziomu aktywności stałej, przy czym poziom aktywności występujący w ślad za gwałtownym skokiem może być tylko nieznacznie wyższy od poziomu spontanicznej aktywności własnej. Z kolei nieznacznie poruszając źródłem światła postaramy się dokładnie określić obszar na siatkówce, który może aktywizować daną komórkę zwojową. 103 Typowy kształt obszaru pobudzeniowego to wydłużone koło ze średnicą około 0,1 do 1 milimetra. Kiedy odbierane źródło światła wychodzi poza granice tego kolistego obszaru pobudzeniowego, rodzaj reakcji komórki ulega zmianie: zamiast obniżenia aktywności do poziomu stałej aktywności własnej, wyłączenie światła powoduje w komórce zwojowej krótkotrwały nagły skok aktywności. Obszar, w którym pojawia się reakcja na zgaszenie światła, ma także kształt kolisty i otacza strefę pobudzeniową (rys. 2-21)[światło skierowano na brzeg pola recepcyjnego]. 104 Taką jednostkę funkcjonalną-komórkę zwojową wraz z jej polem recepcyjnym - będziemy nazywać jednostką włączeniową (plus) pole centralne i wyłączeniową (minus ) pole peryferyjne (on center-off surround). Oświetlenie części centralnej prowadzi do wzmocnienia aktywności komórki zwojowej, oświetlenie peryferii - do obniżenia aktywności tej komórki, poprzedzonego jednak krótkotrwałą, wzmożoną aktywnością zaraz po wyłączeniu źródła światła. Rozproszone światło na całe poła recepcyjne, tzn. zarówno na centrum, 105 jak i na peryferie, może w ogóle nie wywołać żadnej obserwowalnej reakcji (rys. 2-22). Ogólnie możemy przyjąć, że układ nerwowy jest raczej symetryczny. Dlatego też, odkrywszy jakiś charakterystyczny dlań rodzaj reakcji, możemy się spodziewać, że powinien istnieć drugi, uzupełniający w stosunku do pierwszego, typ reakcji. A zatem jako uzupełniające w stosunku do jednostek włączeniowych pole centralne i wyłączeniowych pole peryferyjne istnieją w tej samej liczbie jednostki z odwrotnym typem organizacji, gdzie jednostka jest hamowana w momencie stymulacji obszaru centralnego, a pobudzana poprzez stymulację peryferii. Nazwiemy je jednostkami wyłączeniowymi pole centralne i włączeniowymi pole peryferyjne. Obwody włączeniowo- wyłączeniowe Jakie mechanizmy nerwowe prowadzą do takiego uzupełniającego układu włączeniowo-wyłączeniowego? Wykorzystując podstawowe mechanizmy receptor-komórka zwojowa, które dotychczas rozpatrywaliśmy, możemy bez większego wysiłku skonstruować odpowiednie obwody. Problem jednak w tym, jakim mechanizmem posługuje się rzeczywisty układ nerwowy? Możemy przyjąć, że istnieje tu szereg możliwości. Rozpatrzmy pole z „plus-centrum" i „minus-peryferie". Jedną z możliwości jest założenie, że obszar centralny jest całkowicie powiązany z pobudzeniowym systemem włączeniowym, a peryferie są w pełni powiązane z hamującym systemem wyłączeniowym (rys. 2-23). Stwarza to konieczność wprowadzenia widocznej na diagramie nowej komórki, zwanej komórką dwubiegunową. 107 Jedna komórka dwubiegunowa odbiera impulsy płynące od receptorów z części „minus" pola, a druga z części „plus". Połączenia z obu dwubiegunowych komórek zbiegają się w jednej komórce zwojowej. Jest to niewątpliwie proste uzupełnienie mechanizmu „plus"-„minus". Zakłada ono jednak, że istnieje ścisłe rozgraniczenie między obszarami centralnymi a peryferyjnymi, co dzieje się wówczas, kiedy nie ma tak ostrej granicy, a różnice są trudno uchwytne? Załóżmy, że reakcje receptorów, bez względu na ich usytuowanie w polu, mogą być hamujące lub pobudzeniowe, ale w obszarze „plus" przeważają połączenia pobudzeniowe, a w obszarze „minus" hamujące. W omawianym przypadku ogólny wzorzec reakcji będzie taki sam. W obszarze centralnym będą przeważać połączenia pobudzeniowe, 108 co doprowadzi do reakcji typu „plus", a na peryferiach połączenia hamujące, co da reakcję typu „minus" (rys. 2-24). Reakcja na sygnał, który nadchodzi z dowolnego punktu w dowolnym obszarze pola, będzie zależała od stosunku elementów pobudzeniowych do elementów hamujących na danym obszarze. Dla obszaru typu „plus-centrum", „minus-peryferie" układ stosunków jest odwrotny. Oba opisane tu sposoby połączeń komórek receptorycznych prowadzą do tych samych w zasadzie rezultatów. W siatkówce kota około 30 do 50 procent komórek zwojowych reaguje na pobudzenie w sposób zgodny z formułą „centrum-peryferie". Pozostałe komórki wykazują bardzo zróżnicowane upodobania. Jedne z nich reagują tylko na zapalenie albo tylko na zgaszenie światła, ale bez koncentrycznego pola recepcyjnego. Inne, a jest ich wiele, należą do typu „centrum-peryferie", ale z polami recepcyjnymi o przedziwnych kształtach. Jeszcze inne komórki wydają się nie reagować na żaden ze standardowych bodźców, stosowanych zazwyczaj w typowych eksperymentach. A nawet proste komórki zwojowe z koncentrycznymi polami recepcyjnymi w zmienionych warunkach wytwarzają dość skomplikowane układy reakcji. Na rysunku 2-25 przedstawione są reakcje komórki zwojowej typu „plus-centrum, minus-peryferie". Na rysunku 2-25a światło pada na obszar „plus", przedstawione są trzy warianty reakcji na dwa poziomy intensywności światła: na lewo-przy umiarkowanej intensywności światła, w środku-przy obniżonej intensywności i na prawo - ponownie przy umiarkowanej. Na rysunku 2-25b światło pobudza obszar „minus", pokazane zostały reakcje komórki na pobudzenie światłem o umiarkowanej i wysokiej intensywności; zwróćcie uwagę na skok reakcji typu „minus" przy zgaszeniu światła. Na rysunku 2-25 a plus b pokazana jest reakcja na połączenie oddziaływań a i b. Rezultat zależny jest od względnego zmieszania światła w obszarach „plus" i „minus". Ten podstawowy mechanizm „centrum-peryferie" może funkcjonować nie tylko przy oświetleniu światłem białym, ale też przy oświetleniu różnych obszarów różnymi barwami. Rysunek 2-26 przedstawia reakcje komórki zwojowej pochodzącej z siatkówki złotej rybki na pobudzenia światłem o różnych barwach. Pobudzana jest stale ta sama część pola recepcyjnego, ale za każdym razem bodźcem jest światło o innej długości fal. Jak się okazuje, po zmianie długości fal świetlnych komórka zwojowa przechodzi od reakcji „plus" do reakcji „minus". Ta ważna właściwość komórek wrażliwych na długość fal świetlnych będzie szczegółowo omówiona w rozdziale 5. REAKCJE W CZASIE Zwróciliśmy już uwagę na przemijający skok aktywności jako typową reakcję na zapalenie światła. Nie jest w pełni jasne, czy ta charakterystyczna reakcja to przejaw działania mechanizmów adaptacyjnych, zapewniających zmniejszenie szybkości reakcji komórki i uczynienie całego systemu mniej wrażliwym na długotrwałe pobudzenie, czy też jest to autentyczne zwiększenie wrażliwości właśnie na bodziec przemijający (krótkotrwałe oświetlenie). Jaki by nie był mechanizm tej przemijającej reakcji, 109 występuje ona bardzo wyraźnie. Rysunek 2-27 przedstawia krzywą przebiegu tej reakcji. Grupę receptorów oświetlano przez około 2 sekundy. Białe kółka odpowiadają reakcji komórki zwojowej, pracującej w „systemie plus-minus". Początkowo częstotliwość reakcji komórki gwałtownie wzrasta - do około 80 impulsów na sekundę, aby później równie szybko ustabilizować się na poziomie 40 impulsów na sekundę. Częstotliwość taka utrzymuje się do momentu zgaszenia światła; w omawianym wypadku aktywność własna komórki wynosiła 30 impulsów na sekundę, tak więc aktywność wzbudzona była znacznie wyższa. Czarne kółka na rysunku 2-27 pokazują reakcje komórki zwojowej, której aktywność hamowana jest pod wpływem bodźca świetlnego. W tej komórce następuje wyraźny krótkotrwały spadek aktywności do 5 impulsów na sekundę, to znaczy do poziomu znacznie niższego niż ten, który utrzymuje się w pozostałym czasie oddziaływania bodźca. Obwody służące do wytwarzania przemijających reakcji Łatwiej jest zbudować model mechanizmu nerwowego, wytwarzającego przemijającą reakcję, niż stwierdzić, jak to dokonuje się rzeczywiście w układzie nerwowym. Dla stworzenia modelu wystarczy wykorzystać zasady funkcjonowania obwodów podstawowych, a dla wyjaśnienia rzeczywistego mechanizmu niezbędne są uważne i trudne badania mikroanatomii poszczególnych komórek. Aktualnie jednak nie dysponujemy takimi danymi, mimo to spróbujemy coś wymyślić. Łatwo możemy uzyskać przemijającą reakcję przez wprowadzenie do systemu łączącego dwie komórki obok połączenia pobudzeniowego równoległego połączenia hamującego. Na rysunku 2-28 przedstawione jest takie połączenie między poziomem 110 komórek dwubiegunowych i zwojowych. Tendencja do pobudzenia wywołana pojawieniem się światła napotyka przeciwdziałanie ze strony równoległego połączenia hamującego. Aby nie doprowadzić do pełnego zablokowania reakcji, załóżmy, że proces hamowania rozwija się wolniej niż proces pobudzania. Wtedy po zapaleniu światła reakcja neuronów nasila się, ponieważ system pobudzenia działa szybciej. Nieco później, kiedy zaczyna działać proces hamowania, częstotliwość impulsów obniża się lub całkowicie zanika. Aktywność końcowa będzie zależała od stosunku oddziaływania kanału pobudzeniowego do oddziaływania kanału hamującego. Istnieje alternatywny obwód dla wywołania zachowania przemijającego: hamowanie zachodzi poprzez odrębny łańcuch neuronów (rys. 2-29), wówczas nie będzie dla tego samego neuronu równoczesnych połączeń pobudzeniowych i hamujących. Tak jak w poprzednim wypadku uzyskamy efekt przemijającej reakcji pod warunkiem, że rozchodzenie się impulsów hamujących będzie znacznie wolniejsze niż rozchodzenie się impulsów pobudzeniowych. W literaturze fachowej te dwa mechanizmy określane są jako hamowanie naprzednie (forward inhibition), w odróżnieniu od hamowania obocznego, lateralnego, które występuje między komórkami sąsiadującymi ze sobą. Jeszcze inny sposób uzyskania efektu reakcji przemijającej przedstawiony jest na rysunku 2-30. Reakcja komórki zwojowej wywiera wpływ zwrotny na komórki dostarczające jej impulsów wejściowych. Wykres pokazuje system hamowania w wyniku sprzężenia zwrotnego: reakcja na wyjściu komórki B działa hamująco na wyjście komórki A. Pośrednicząca komórka F zapewnia sprzężenie zwrotne. W odróżnieniu od innych mechanizmów, w tym obwodzie opóźnienie hamowania jest wmontowane w ten sam mechanizm i dlatego wszystkie jego 111 ogniwa mogą działać z jednakową prędkością. Oczywiście, można uprościć pętlę sprzężenia zwrotnego. Na przykład usuwając komórkę F tak, aby komórka B mogła bezpośrednio hamować A. Właściwie komórka A nie jest wcale niezbędna; można przekazać sygnał z wyjścia B wprost na jej wejście - i komórka będzie bezpośrednio hamować samą siebie. Takie systemy są dość powszechne w obwodach elektronicznych. Ale czy istnieją w obwodach nerwowych - do tej pory nie wiadomo. Zauważcie jednak, że tylko ten sposób hamowania poprzez sprzężenie zwrotne pozwala automatycznie wyjaśnić występowanie salwy szybkich impulsów przy zgaszeniu światła. 112 Badaliśmy trzy różne typy mechanizmów „pobudzenie-hamowanie": oboczny, naprzedni i typu sprzężenia zwrotnego. Hamowanie oboczne wpływa na zaostrzenie konturów; zapewnia dostosowanie się systemu wzrokowego do zmian w strukturze przestrzennej bodźca świetlnego. Hamowanie naprzednie oraz hamowanie typu sprzężenia zwrotnego pozwala na subtelne dostosowywanie reakcji neuronów do czasowych zmian w oświetleniu. Najwidoczniej podstawową strategią układu nerwowego jest przede wszystkim wykrywanie zmiennych aspektów sygnałów zewnętrznych, wyodrębnienie ich i hamowanie tych aspektów, które pozostają niezmienne. REAGOWANIE NA RUCH Ostatni z podstawowych problemów, jaki musi rozwiązać system wzrokowy, polega na wykryciu i ocenie ruchu. Większość dotychczas rozpatrywanych receptorów nie jest przeznaczona do odróżniania przedmiotów stałych i będących w ruchu. Oczywiście, reagują one zarówno na jedne, jak i na drugie. Na przykład, jeżeli przemieszczamy wiązkę świetlną z lewej strony na prawą poprzez jednostkę „centrum-peryferie", reakcja będzie ulegała zmianie zgodnie z lokalizacją światła w polu recepcyjnym tego systemu: początkowo, gdy światło będzie padało po lewej stronie peryferii, zanotujemy aktywność własną, później pojawi się efekt hamowania, potem zaś pobudzenie, znowu hamowanie i w końcu znów aktywność własna (rys. 2-31). Taka kolejność reakcji nie pozwala jeszcze na traktowanie danej jednostki jako detektora ruchu. Detektor ruchu powinien reagować wyłącznie na poruszający się przedmiot, a poza tym na nic innego. Idealny byłby taki detektor, który ma wybiórczą wrażliwość na kierunek, a nawet na szybkość poruszającego się bodźca. Poszukiwanie detektorów ruchu we wzrokowym systemie nerwowym zakończy się z pewnością ich wykryciem. Siatkówka oka królika, wiewiórki, żaby posiada elementy wyposażone w wybiórczą wrażliwość na określone rodzaje ruchu. Zapoznajmy się więc z dostępnymi informacjami o systemie wzrokowym królika (rys. 2-32). W środku rysunku przedstawiono układ pól odbiorczych. Obszar centralny wytwarza reakcje typu „plus-minus" (oznaczone symbolem ±); pobudzenie świetlne peryferii tego obszaru (przedstawione za pomocą symbolu O), jak widać, nie wywołuje żadnej reakcji. 114 Strzałki wskazują, w jakim kierunku porusza się plamka po polu recepcyjnym; dla każdego kierunku ruchu podano odpowiednią częstotliwość reakcji. Reakcję maksymalną (79 impulsów) wywołuje ruch bodźca pionowo w górę, reakcję minimalną-jego ruch w kierunku przeciwnym, to znaczy pionowo w dół (2 impulsy). Na dolnym wykresie przedstawiono częstotliwość reakcji przy poruszaniu się bodźca w pośrednich kierunkach. Obwody służące do wykrywania ruchu Jak pracuje detektor ruchu? Wiemy, że w normalnym polu recepcyjnym znajdują się mechanizmy hamowania obocznego. Widzieliśmy, że obwody te są szczególnie wrażliwe na kontury, ale nie reagują odmiennie w zależności od kierunku ruchu. Aby mechanizmy te reagowały w określonym kierunku, muszą cechować je dwie właściwości. Pierwszą jest to, że połączenia hamujące powinny być asymetryczne; drugą zaś to, że hamowanie oboczne ma pojawić się z pewnym opóźnieniem. Rysunek 2-33 pokazuje obwód podstawowy; przedstawiono tu mnożniki przyrostu dla każdego połączenia; dokonajmy niezbędnych obliczeń. Światło porusz a się z lewej strony naprawą. Prześledźmy rysunek 2-34. Liczby wskazują tu nie mnożnik przyrostu, lecz rzeczywistą częstotliwość reakcji. Najpierw (rys. 2-34a) komórka zwojowa nie reaguje. Początkowa intensywność światła jest równa 10 jednostkom. I dlatego na wyjściu każdego z receptorów jest ich 10. Impulsy te zostały całkowicie zniesione przez hamujący wpływ komórki położonej na prawo. 115 Kiedy jednak najjaśniejsza część plamki świetlnej (o intensywności równej 20) dociera do pierwszego receptora, zostaje on pobudzony do poziomu 20 jednostek (a wpływ hamujący utrzymuje się stale na poziomie minus 10) i wówczas komórka zwojowa wytwarza reakcję na wyjściu równą 10 jednostkom (patrz rys. 2-34b). Na rysunku 2-34c światło osiągnęło już dwa receptory. Ponieważ hamowanie jest opóźnione, pierwsza komórka ciągle jeszcze nie odebrała podwyższonego działania hamującego i obie komórki reagują na poziomie 20 jednostek, a hamowane są na poziomie minus 10; sumaryczna reakcja na wyjściu komórki zwojowej wzrasta do 20 jednostek. W momencie, kiedy światło dociera do trzeciego receptora (rys. 2-34d), hamowanie zaczyna działać. Teraz bodziec o wysokiej intensywności oddziałuje na trzy receptory, ale minęło już dość czasu od pobudzenia drugiego receptora, tak że może on już objąć wpływem hamującym pierwszy receptor. Dlatego, pomimo że trzy receptory odbierają silniejsze pobudzenie, reakcja komórki zwojowej pozostaje na stałym poziomie (20 jednostek). W miarę jak światło porusza się, w dalszym ciągu zachodzą zmiany analogiczne do opisanych. Reakcja komórki zwojowej będzie utrzymywała się na poziomie 20 jednostek (rys. 2-34e) aż do momentu, kiedy światło przekroczy granice pola recepcyjnego i opóźniony wpływ hamowania rozprzestrzeni się na całym polu. Wówczas reakcja komórki zwojowej obniży się do poziomu wyjściowego, w omawianym wypadku jest równa 0 (rys. 2-34f). Światło porusza się z prawej strony na lewą. W tym wypadku uzyskamy zupełnie inny wzorzec reakcji (rys. 2-35). Na rysunku 2-35b światło dotarło już do pierwszego receptora, ale ciągle jeszcze brak reakcji komórki zwojowej. Hamowanie z prawej strony nasila się już w momencie pobudzenia pierwszego receptora i uniemożliwia jego reakcję. Ale brak jeszcze nasilenia hamowania ze strony pierwszego receptora w stosunku do drugiego. Gdyby hamowanie nie było opóźnione, wówczas hamujący wpływ pierwszego receptora wzrastałby szybko, co w efekcie doprowadziłoby do zredukowania reakcji drugiego receptora, a w konsekwencji i komórki zwojowej do minus 10 jednostek. Ruch można byłoby wykryć przez obniżenie częstotliwości reakcji w stosunku do normalnego poziomu aktywności własnej. Jednak z powodu opóźnienia hamowania nie zachodzą żadne zmiany w reakcji komórki zwojowej, ani wzrost, ani obniżenie. Zbudowaliśmy detektor ruchu wrażliwy na jeden kierunek ruchu. Detektor ten nie reaguje ani na nieruchomy bodziec świetlny, ani też na bodziec poruszający się z prawa na lewo. Opóźnienie hamowania jest wyjątkowo ważne. Posługując się tym schematem podstawowym, możemy zbudować niezwykle skomplikowane detektory ruchu. Zwróćcie uwagę na przykład na fakt, że dobry detektor ruchu powinien reagować w sposób najbardziej aktywny na bodziec poruszający się z określoną prędkością, odpowiadającą prędkości rozchodzenia się hamowania w polu recepcyjnym. A opóźnienie hamowania oddziałującego na określony obszar receptorów może zależeć od tego, jak daleko znajduje się ten obszar od poruszającego się bodźca. Co więcej, czas reakcji zarówno procesów hamowania, jak i procesów pobudzenia w układzie nerwowym zależny jest od stopnia intensywności bodźca. Dlatego możemy oczekiwać, że reakcje detektorów będą zależeć 118 nie tylko od szybkości ruchu, lecz również od intensywności bodźca. Chociaż przedstawione obwody ilustrują możliwe mechanizmy służące do wykrywania ruchu, nie pozwalają jednak na wyjaśnienie wszystkich problemów, jakie powstają w dynamicznym środowisku wizualnym. Łatwo możemy „oszukać" detektor ruchu: wystarczy w tym celu przekazać krótki błysk światła na jeden receptor, a następnie, po określonej przerwie - błysk światła na sąsiedni receptor. Reakcja powinna być taka, jakby światło poruszało się w sposób ciągły z jednego receptora na drugi. W rzeczywistości widzimy ruch ciągły, jeżeli dwie lampki rozmieszczone w określonych względem siebie odstępach zapalają się naprzemiennie; zjawisko to nazywamy zjawiskiem fi. Odległość między lampkami pozwalająca na pojawienie się zjawiska fi musi być znacznie większa niż średnica pola recepcyjnego przeciętnego detektora ruchu w typowym systemie wzrokowym. W omawianych obwodach brak jest jakichkolwiek elementów pozwalających na odróżnienie ruchów wywołanych zmianą położenia głowy czy oka od ruchów wykonywanych aktualnie przez przedmioty zewnętrzne. Najwidoczniej wyższe mechanizmy mózgowe w jakiś sposób konfrontują informację płynącą od detektorów ruchu z nakazami motorycznymi, sterującymi ruchami głowy i oczu; w przeciwnym wypadku byłoby niemożliwe odróżnienie zmian obrazu na siatkówce, wywołanych ruchami głowy i oczu, od zmian wywołanych ruchami w świecie zewnętrznym. PRZETWARZANIE SYGNAŁÓW W CIELE KOLANKOWATYM BOCZNYM Przeprowadzona przez nas analiza pozwala opisać i wyjaśnić mechanizm wyodrębniania podstawowych cech obrazu wzrokowego. U większości zwierząt badano tylko te komórki, które znajdują się w samym oku, w jednej z trzech warstw komórek tworzących siatkówkę. Zachodzące tu procesy to zaledwie pierwszy poziom analizy sygnałów. Następnie bowiem sygnały nerwowe przewodzone są za pomocą nerwu wzrokowego do wyższych ośrodków, gdzie następuje ich przetwarzanie (rys. 2-36). Nadszedł czas, aby prześledzić tę drogę i zobaczyć, w jaki sposób informacja wzrokowa zostaje przetworzona w mózgu. Sygnały nerwowe z siatkówki płyną aksonami z komórek zwojowych do następnej stacji przekaźnikowej - ciała kolankowatego bocznego (Lateral Geniculate Nucleus - LGN). Tu włókna biegnące z komórek siatkówki tworzą połączenia synaptyczne z neuronami przekazującymi informację sensoryczną do projekcyjnych pól kory mózgowej (rys. 2-36). Włókna odchodzące z przyległych do siebie części siatkówki dochodzą do przyległych do siebie części LGN. Dlatego sąsiadujące ze sobą części LGN otrzymują informację nerwową od sąsiadujących ze sobą części pola widzenia. LGN zbudowane jest z oddzielnych warstw, leżących jedne na drugich podobnie jak w przekładańcu, trzy warstwy u kota, sześć u małpy i u człowieka. 119 dochodzą włókna nerwowe z jednego oka, do przylegającej warstwy dociera informacja z drugiego oka i tak na przemian. Sygnały płynące od widzianego przedmiotu, który pobudził aktywność nerwową w określonej części siatkówki jednego oka, docierają do określonego obszaru warstwy LGN, a sygnały z analogicznej części siatkówki drugiego oka (w którym aktywność wzbudził ten sam przedmiot) do odpowiedniego obszaru innej warstwy LGN, leżącej bezpośrednio nad warstwą poprzednią lub pod nią. Precyzja operacji przetwarzania informacji, jakie zachodzą w połączeniach synaptycznych siatkówki, a także przejrzysta struktura anatomiczna LGN sugerują, że dalsze przetwarzanie i analiza informacji sensorycznej powinny zachodzić w tym ośrodku mózgowym. Oczekiwanie to jednak nie znajduje potwierdzenia. Rola uporządkowanej, warstwowej budowy LGN do dziś jest dla nas zagadką. Wydaje się, że w LGN nie następuje żadna istotna faza przetwarzania informacji płynącej z siatkówki. Pola recepcyjne włókien wychodzących z LGN są niemal identyczne z polami recepcyjnymi komórek zwojowych siatkówki. Zbliżone są rozmiarami i zbudowane na tej samej zasadzie „centrum-peryferie". Być może, LGN jest w. rzeczywistości tylko stacją przekaźnikową, przesyłając informację wzrokową na następny poziom przetwarzania, bez żadnej deformacji. Kanały nerwowe, w odróżnieniu od innych systemów komunikacji, nie potrzebują wzmacniaczy, aby impuls był przekazywany dalej. Nie można również przypisać tej funkcji LGN. Do czego zatem ono służy? Zagadka ta ciągle jeszcze nie jest rozwiązana, możemy jedynie wymienić kilka hipotez, które wydają się dość prawdopodobne. Na przykład, należy pamiętać, że do LGN docierają 120 nie tylko impulsy z siatkówki, ale również sygnały z różnych części mózgu, a szczególnie z tworu siatkowatego (retkular formation) pnia mózgu. Przypuszcza się, że aktywność tych niesensorycznych dróg polega na tym, że pomagają one wybierać te sygnały sensoryczne, które należy przekazać dalej. Dlatego wydaje się możliwe, że LGN działa na zasadzie regulatora intensywności sygnałów wzrokowych, płynących z oka do mózgu. Jest to kusząca hipoteza. Na razie jednak nie została udowodniona. Po przejściu przez LGN informacja wzrokowa dochodzi do odpowiednich obszarów projekcyjnych kory mózgowej. W korze wzrokowej znowu pojawiają się obwody nerwowe, służące do przetwarzania sygnałów. Są one funkcjonalnie podobne do tych, które znajdują się w siatkówce oka. WYODRĘBNIANIE CECH W analizie informacji wzrokowej przesyłanej z LGN uczestniczą trzy różne części kory. Pola wzrokowe kory zbudowane są tak, że włókna odchodzące od sąsiadujących ze sobą części siatkówki docierają do sąsiadujących części kory. Z trzech części kory dwie otrzymują sygnały prosto z LGN; między wszystkimi trzema częściami istnieje mnóstwo wzajemnych połączeń. Włókna wychodzące ze wzrokowych pól kory dochodzą przede wszystkim do płatów skroniowych mózgu, które, jak się wydaje, zawiadują uczeniem się i przechowywaniem nawyków wzrokowych. Podobnie jak LGN, kora wzrokowa zbudowana jest warstwowo. Składa się z pięciu warstw. Włókna dochodzące z LGN kończą się głównie w czwartej i piątej warstwie (licząc od powierzchni kory). Jednakże w odróżnieniu od LGN, między warstwami kory istnieje wiele połączeń. Analiza sygnału sensorycznego zaczyna się w czwartej i piątej warstwie i jest kontynuowana w wyższych warstwach kory, po czym informacja wzrokowa przechodzi do innych części mózgu. Ogólny obraz procesu przetwarzania informacji w korze mózgowej obejmuje stopniowe przekształcanie i analizę specyficznych aspektów sygnału. Analiza dokonywana jest kolejno w różnych częściach kory, przy czym duża liczba oraz znaczne zróżnicowanie detektorów korowych w różnych obszarach kory pozwalają na specyficzną analizę cech sygnałów w danym obszarze. Czy są w obrazie kontury? Czy są krawędzie? Ciemne linie? Czy tło jest jaśniejsze? Czy też jest to świecący błysk na ciemnym tle? Jaki jest kierunek ruchu? Czy wychodzi poza dany obszar? Czy zmienia kierunek? Na wszystkie te pytania detektory korowe muszą znaleźć odpowiedź. Proste komórki Charakterystyka reakcji. Ciało kolankowate boczne przesyła informację bezpośrednio do czwartej warstwy kory, gdzie zaczyna się proces analizy. Jeżeli będziemy rejestrować aktywność elektryczną tej warstwy, ostrożnie wprowadzając elektrodę przez leżące nad nią trzy warstwy na głębokość kilku milimetrów, to zobaczymy, że istnieją w niej komórki, które reagują zawsze, kiedy mała plamka świetlna przemieszcza się na siatkówce. Jest jednak różnica między tymi komórkami a komórkami siatkówki. Reakcje detektorowych komórek siatkówki są nadzwyczaj specyficzne. Każda z nich kontroluje niewielki odcinek siatkówki - pole recepcyjne - i komórka zwojowa reaguje tylko wówczas, kiedy bodziec natrafi na to niewielkie określone pole. Kora ma zupełnie inny typ organizacji; 122 reakcje jej nie są ograniczone do małych kolistych pól recepcyjnych. W typowym wypadku plamka świetlna skierowana na dowolny punkt wzdłuż jakiejś linii zwiększa reakcję określonej komórki. Zazwyczaj, kiedy odnajdziemy taką pobudzeniową linię, to obok niej odkrywamy drugą, paralelną do pierwszej, ale z odwrotnym efektem: oświetlenie dowolnego punktu na drugiej linii wywołuje efekt hamowania - obniża aktywność tej komórki. Tak więc mamy do czynienia z dwoma leżącymi równolegle liniowymi polami recepcyjnymi: jedno-pobudzeniowe i drugie - hamujące. Taką konfigurację pól pobudzeniowych i hamujących ma detektor krawędzi: komórka reaguje maksymalnie na jasno oświetloną krawędź, położoną równolegle do osi obu pól. Każdy sygnał o innej strukturze wywoła reakcję niższą od maksymalnej (rys. 2-37). Inne proste komórki mają pole recepcyjne odmiennego typu. 123 Podobną, ale nieco bardziej złożoną organizację ma na przykład detektor szczeliny. W tym wypadku strefy hamowania rozmieszczone są symetrycznie po obu stronach strefy pobudzenia (rys. 2-38). Tak więc reakcję maksymalną wywoła pas świetlny, po bokach którego będą się znajdowały ciemne pola, reakcję minimalną zaś wywołuje ciemna linia otoczona jasnymi polami. Pamiętając o symetrii specyficznej dla układu nerwowego, możemy oczekiwać, że skoro odnaleźliśmy układ hamowanie-pobudzenie-hamowanie, to istnieją również układy o właściwościach dopełniających. I rzeczywiście tak jest. Jeśli pierwszy układ - detektor szczeliny - oznaczymy symbolami minus plus minus (rys. 2-3 8a), to drugi - detektor linii-przedstawimy jako plus minus plus (rys. 2-38b). Zwróćcie przy okazji uwagę, że informacja płynie z komórki nie tylko przy podwyższeniu się poziomu reagowania (w stosunku do stałego poziomu), ale również przy jego obniżeniu. Oba typy reakcji są bowiem informacyjne i jedna z reakcji nie może być uważana za bardziej istotną lub bardziej ważną niż druga. Układ nerwowy posługuje się zarówno wzrostem, jak i obniżeniem się poziomu reakcji komórki jako formą sygnału; dlatego błędem byłoby traktować reakcje „plus" jako bardziej podstawowe lub ważniejsze niż reakcje „minus". Ważną sprawą są pewne zmiany w aktywności. Detektory krawędzi, szczeliny i linii odbierają sygnały z określonych obszarów siatkówki. W granicach każdego obszaru krawędzie oraz linie powinny być ułożone odpowiednio, aby móc wywołać maksymalną reakcję. Jakkolwiek więc komórki te reagują na bardziej złożone cechy obrazu wzrokowego, mają jednak wybiórczą zdolność wyłowienia położenia i rodzaju sygnału, który wywołuje ich reakcje. Jak zbudować detektory szczeliny i linii? Zobaczymy, co wyniknie, gdy zestawimy razem te proste obwody. Model nasz będzie czysto spekulatywny, ponieważ nikt dotąd nie odnalazł takich obwodów w realnym układzie nerwowym. Zacznijmy od informacji płynącej z siatkówki. Podstawowy problem polega na tym, w jaki sposób informacja płynąca z jednostki typu „centrum-peryferie" łączy się, tworząc jednostki reagujące na linie i szczeliny. W celu uproszczenia naszych schematów wprowadzimy symbole w postaci pary kół koncentrycznych dla określenia układu reakcji komórek zwojowych siatkówki (rys. 2-39). Najprostsza metoda utworzenia detektora szczeliny lub detektora linii polega na tym, aby zebrać reakcje z tych komórek zwojowych, które leżą wzdłuż jednej linii w określonym obszarze siatkówki, podłączając ich wyjścia do jednej komórki korowej (rys. 2-40). Jeżeli komórki zwojowe należą do typu „plus-centrum", „minus-peryferie", uzyskamy detektor szczeliny, a jeżeli należą one do typu „minus-centrum", plus-peryferie", to otrzymamy detektor linii. Rozważmy charakterystyczne reakcje takiego obwodu. Zaczniemy od sytuacji, w której szczelina znajduje się nad pobudzeniowymi polami szeregu komórek zwojowych - dokładnie tak, jak to przedstawia rysunek 2-40. Detektor szczeliny wywołuje przy tym reakcje maksymalne. Zwiększając długość szczeliny poza obszar recepcyjny, nie wywołamy zwiększenia reakcji, ponieważ końce szczeliny znajdą się tam, gdzie nie ma receptorów, które mogłyby rejestrować jej wydłużenie. Kiedy skrócimy jej długość, to częstotliwość występowania reakcji korowej zostanie zmniejszona, 10 a w wypadku bardzo krótkiej szczeliny liczba pobudzonych komórek zwojowych będzie tak mała, że ich reakcja nie wystarcza do pobudzenia komórki korowej i przestaje ona reagować. Zacznijmy znowu od idealnego przypadku, kiedy szczelina umieszczona jest dokładnie nad polami pobudzeniowymi, i zobaczmy, co się stanie, jeżeli zwiększymy jej szerokość. W miarę jak światło będzie rozprzestrzeniało się na pola recepcyjne peryferii, wpływom pobudzeniowym centrów pól będą przeciwdziałać wpływy hamujące z peryferii i częstotliwość reakcji będzie spadać. Przy pewnej szerokości szczeliny te przeciwstawne oddziaływania wzajemne zniosą się i poziom reakcji komórki korowej powróci do poziomu równego spontanicznej aktywności własnej. A jak wygląda problem kierunku? Spójrzcie na rysunek 2-41. 125 Jeżeli przesuwamy szczelinę tak, aby jej położenie odchylało się coraz bardziej od pozycji wyjściowej - optymalnej, znajdzie się pod nią coraz mniejsza liczba centrów pobudzeniowych. Stopniowo maleje potok impulsów w nerwie wzrokowym i w efekcie końcowym detektor korowy znowu powraca do poziomu aktywności własnej. Właściwa reakcja dla określonego kąta położenia szczeliny zależy od stosunku wzajemnego pobudzeniowych i hamujących pól oświetlonych przez szczelinę. Ogólny obraz jest jasny: możemy łączyć ze sobą podstawowe jednostki typu „centrum-peryferie" i w ten sposób otrzymać jednostki służące do rozpoznawania różnych układów. 127 Istnieje przy tym dość dużo wariantów, ponieważ można nie tylko tworzyć jednostki typu „plus-centrum" i „minus-centrum", ale można też łączyć jedne i drugie w różne układy. Można na przykład doprowadzić do tego, że jednostki typu „plus-centrum" będą hamować komórkę korową, a jednostki typu „minus-centrum" będą ją pobudzać. Można również wykorzystać jednostki w siatkówce o odmiennych kształtach i typach pól recepcyjnych. Staje się jasne, że na tym pierwszym poziomie przetwarzania informacji sensorycznej w korze mózgowej można zbudować szereg różnorodnych detektorów. W przedstawionym poprzednio przykładzie mieliśmy do czynienia z projektowaniem detektora, który reagował jedynie na poruszającą się plamkę świetlną. Można zbudować również taki detektor, który będzie reagował wyłącznie na linię w określonym położeniu, poruszającą się w ustalonym kierunku-detektor poruszającej się linii. Jednostkę tę można zbudować tak, że nie będzie ona reagowała ani na linię nieruchomą, ani na poruszającą się pod innym niż „zadany" kątem, ani też na linię o tym samym położeniu co linia wzorcowa, ale poruszającą się w innym niż „zadany" kierunku. DIPOLE Czy pamiętacie zjawisko McCollough (s. 70)? Po długotrwałej stymulacji oka za pomocą poziomych linii czerwonych, białe linie poziome odbierane były jako zielone. Jedno z możliwych wyjaśnień tego zjawiska wiązało się z faktem zmęczenia detektorów linii barwnych. Możliwe jest jednak inne prostsze wyjaśnienie tego zjawiska. Istnieje nieskomplikowany schemat połączeń nerwowych wrażliwy na kierunek, zwany dipolem (Harris i Gibson, 1968). Dipol to dowolne asymetryczne urządzenie, które jest bardziej wrażliwe na jedno z dwu wejść z jednej strony i jednocześnie na inne z dwu wejść z drugiej strony (rys. 2-42). Na przykład, dipol może być z jednej strony bardziej wrażliwy na kolor czerwony, a z drugiej na zielony. Dowolne dwa pola mogą tworzyć dipol pod warunkiem, że nie są one do siebie dopasowane, przy czym kształt nie ma tu żadnego znaczenia. Dipol może mieć dowolny kształt, nawet „okrągły", wtedy jego część centralna jest bardziej wrażliwa na jedną barwę, a peryferyczna na inną. 128 Zawsze jednak jego kształt odbiegać będzie od prawdziwego koła, a granice części centralnej i peryferycznej nie będą koncentryczne. Dowolna jednostka typu „centrum-peryferie" może być dipolem, pod warunkiem, że obie jej części nie są rozmieszczone zbyt koncentrycznie. Wiemy już, że komórki wrażliwe na barwę należą do typu „centrum-peryferie" z przeciwstawnymi barwami - czerwoną i zieloną (a inne niebieską i żółtą, por. s. 108). Nawet więcej, komórki typu „centrum-peryferie" są z zasady asymetryczne. Bardzo rzadko trafiają się rzeczywiście okrągłe. Dipol stanowi znacznie prostsze urządzenie wrażliwe na położenie, niż detektor linii. Oświetlony cały dipol nie reaguje. Kiedy tylko światło pada na jedną jego część, zaczyna reagować adaptując się stopniowo do bodźca. Nie będąc w ścisłym znaczeniu detektorem linii, dipol nie jest wrażliwy na zamazanie się obrazu. Jest natomiast wrażliwy na intensywność bodźca. Jasne jest, że dipol zbudowany jest prościej niż detektor linii. Lepiej też wyjaśnia działanie efektu McCollough, aniżeli detektor linii barwnych. Komórki złożone Na następnym poziomie korowego przetwarzania informacji sprawa przedstawia się nieco inaczej. Podstawowe cechy podlegające rozpoznaniu, krawędzie, linie, szczeliny, poruszające się linie i inne-są te same, ale jest mniej ograniczeń. Prosta komórka-detektor linii reaguje tylko na tę linię, której położenie na siatkówce jest dokładnie określone. Na następnym, wyższym poziomie też jest wymagane, aby linia miała określoną szerokość i określone położenie, ale jej lokalizacja na siatkówce jest tu mniej istotna: linia może znajdować się na dowolnym miejscu siatkówki, w granicach dostatecznie dużego obszaru (rys. 2-43). Komórki na tym poziomie są nieco bardziej złożone niż komórki na niższym poziomie kory. Z tego też względu otrzymały nazwę komórek złożonych. 130 Podobnie jak komórki proste, tak i złożone komórki kory leżące w jej górnych warstwach nie reagują na takie zwiększenie rozciągłości bodźca, przy którym wychodzi on poza granice pola recepcyjnego. Komórki złożone, tak jak i komórki proste, reagują wówczas, kiedy odpowiedni bodziec porusza się w granicach ich pola recepcyjnego; często też wykazują one preferencję dla kierunku ruchu. Tak więc dla reakcji komórek złożonych ciągle jeszcze decydujące znaczenie ma typ, kierunek i rozpiętość bodźca. Jednakże informacja uzyskana od tych detektorów jest bardziej abstrakcyjna niż informacja pochodząca od detektorów rozmieszczonych na niższym poziomie, ponieważ w tej fazie położenie konturu w polu wzrokowym nie jest aż tak ważne. Części siatkówki, odpowiadające reakcjom złożonych detektorów na preferowane przez nie bodźce, są znacznie większe niż pola recepcyjne prostych detektorów korowych. Jak zbudować komórki złożone? Czym jest komórka złożona? Najprostsze wyjaśnienie jest takie, że jest to wytwór połączenia szeregu prostych komórek. Na rysunku 2-44 pokazujemy, jak można połączyć reakcje ośmiu prostych komórek, aby otrzymać jednostkę odpowiadającą komórce złożonej. Kiedy któraś z prostych komórek uaktywnia się, wówczas zaczyna reagować również złożony detektor linii. Jeżeli będziemy zmieniali położenie linii na obszarze siatkówki, na którym znajdują się pola recepcyjne prostych komórek, reakcje na wyjściach różnych, oddzielnych prostych komórek przekazywane będą do komórki złożonej. Zwróćcie uwagę, że szerokość i położenie linii mają tak samo decydujące znaczenie dla uaktywnienia komórki złożonej, jak i dla wywołania reakcji prostych komórek. Jeżeli z pewnych powodów prosta komórka nie reaguje na dany bodziec, nie zareaguje na niego również komórka złożona. Jest to jeden ze sposobów rozszerzenia pola reagującego siatkówki, nie zmniejszając dokładności w odróżnianiu typu układów bodźcowych potrzebnych do aktywizowania detektora złożonych cech. Komórki superzłożone Pewne cechy sygnału powinny podlegać dokładniejszej analizie, na przykład długość linii stanowiącej bodziec. Właśnie tym zajmują się komórki najwyższego z analizowanych poziomów kory, jeszcze bardziej złożone niż te komórki, które omawialiśmy uprzednio. Są to komórki superzłożone. Unikalną właściwością tych komórek jest to, że reagują w maksymalny sposób tylko w takim wypadku, gdy, krawędź lub linia kończy się w ściśle określonym miejscu. Na rysunkach 2-45 i 2-46 przedstawione zostały przykłady układów reakcji komórek superzłożonych. Komórka na rysunku 2-45 to detektor przemieszczającej się linii, reaguje on jedynie na linię poziomą przesuwającą się w dół. Linie o innym położeniu lub też poruszające się w innym kierunku wywołują słabszą (w porównaniu z maksymalną) reakcję. Jest to typowe zjawisko dla każdej komórki złożonej. Zauważcie jednak, co się stanie w momencie, kiedy zwiększymy długość linii tak, że jej końce znajdą się poza granicami pola recepcyjnego (obwiedzionego cienką linią); 131 komórka superzłożona przestaje reagować. Na tym poziomie przetwarzania informacji dochodzi nowy wymiar - określenie wielkości. Jak widać na rysunku, określenie wielkości nie jest precyzyjne. Jeżeli linia jest zbyt długa, jak na rysunkach 2-45 i 2-46, to reakcja będzie słaba albo też nie będzie jej wcale. Jeżeli tę samą linię przesunie się tak, żeby jeden jej koniec znalazł się w granicach pola, to komórka zareaguje (rys. 2-46). Komórki te mają jeszcze inną właściwość. Chociaż detektor ruchu z samej swej natury przystosowany jest do rejestrowania ruchu w jednym kierunku, komórki superzłożone niekiedy przejawiają specyficzną cechę oceny ruchu w dwu kierunkach. Na rysunku 2-47 można zaobserwować, że komórka reaguje zarówno na przesunięcie linii w górę i na prawo, jak i na przesunięcie jej w dół i w lewo. Ale, jeśli linia jest zbyt długa, komórka nie reaguje. Detektory krawędzi też uwzględniają wymiar długości. Rysunki 2-48 i 2-49 ilustrują reakcje detektora krawędzi na wąski prostokąt, który, poruszając się w górę, pojawia się w polu recepcyjnym w różnych jego miejscach i wywołuje typową reakcję komórki złożonej. Kiedy jednak szerokość prostokąta przekroczy określoną wielkość krytyczną, komórka przestaje reagować. 134 Na poziomie komórek superzłożonych mamy do czynienia z jeszcze jedną innowacją: detektorem kąta. Na rysunku 2-50 przedstawiona została komórka najbardziej wrażliwa na kąt prosty, który przesuwa się po polu recepcyjnym w górę. Reaguje ona również na inne kąty, ale poziom jej aktywności przy tym wyraźnie się obniża. Jak zbudować komórkę superzłożoną? Komórkę superzłożoną można utworzyć łącząc wyjścia komórek złożonych. Podstawową, nową właściwością takiego modelu jest to, że efekt hamowania odgrywa tu główną rolę. Na rysunku 2-51 pokazano, w jaki sposób należy połączyć trzy komórki złożone, aby otrzymać jedną superzłożoną komórkę, maksymalnie wrażliwą na bodziec - linię o określonym położeniu i długości. (Zwróćcie uwagę, że to samo można uzyskać bez hamowania, łącząc wyjścia trzech komórek: detektora szczeliny (minus plus minus) jako środkowego i dwu detektorów linii ( plus minus plus ) po jego bokach.). Na tym kończy się nasza analiza, ponieważ w tym miejscu gubimy ślad przekazów sensorycznych, 135 przesyłanych do centralnych części mózgu. Ich droga nie jest jeszcze zakończona, ale ciągle jeszcze nie wiemy, dokąd i którędy ona wiedzie. Na rysunku 2-52 przedstawione zostały wszystkie poznane już komórki. Daleko nam jeszcze do pełnego rozumienia mechanizmów rozpoznawania obrazów. Sieci nerwowe, służące do wyodrębniania cech, wydają się coraz bardziej skomplikowane w miarę jak śledzimy drogę informacji sensorycznej do mózgu, ciągle jednak nie znamy ich ostatnich ogniw. 136 WNIOSKI Przedstawiliśmy szereg zasad ogólnych, dotyczących procesów sensorycznych. Analiza przekazów sensorycznych odbywa się małymi etapami, na każdym z nich dokonuje się przetwarzanie informacji przejmowanej z etapu poprzedniego. Obliczenia odbywają się w miejscach przerw w drogach sensorycznych - w kolejnych stacjach przekaźnikowych, przez które przechodzi impuls w drodze od oka do centralnych ośrodków mózgu. Przy okazji kolejnego przetwarzania informacji sensorycznej wyodrębniane są nowe dane. Czasem następuje jedynie sprecyzowanie informacji uzyskanej w etapie poprzedzającym. Na przykład, detektory linii pierwszego poziomu kory nie są wrażliwe na długość, ale już na poziomach następnych charakteryzują się znaczną wybiórczością i reagują tylko na linie określonej długości. Czasem wyodrębniana jest cecha bardziej ogólna dzięki kombinacji reakcji specyficznych detektorów niższego poziomu. Drugi poziom przetwarzania korowego jest znacznie mniej wrażliwy na precyzyjne położenie linii niż poziom poprzedzający go bezpośrednio. Mówiąc ogólnie, w miarę jak ładunek informacji sensorycznej przechodzi na wyższy poziom układu nerwowego, ogólna ilość zawartych w nim informacji stopniowo maleje. Sygnały napływające od 125 milionów receptorów oka przekodowywane są w różne układy reakcji, w jakie wchodzi 800 tysięcy włókien nerwowych, wychodzących z komórek zwojowych siatkówki. W miarę przepływu informacji do mózgu coraz mniej neuronów reaguje na jeden określony sygnał. Tak więc linia pojawiająca się w odpowiedniej części siatkówki zmusza do działania wszystkie proste detektory linii, pracujące na tym obszarze, ale o dwa poziomy wyżej reagują już tylko te detektory, które są wrażliwe na linie o określonej długości. Na najwyższych poziomach neurony reagują głównie na te części obrazu, które są związane ze zmianą kierunku konturu, na kąty albo punkty, w których kończą się linie. Na wyższym poziomie znikają również inne właściwości typowe dla detektorów niższych poziomów, jak wysoki poziom aktywności spontanicznej i utrzymywanie się reakcji przy długotrwałej stymulacji. Kora jest względnie spokojna; rzadkie i krótkotrwałe, ale gwałtowne fale aktywności pojawiają się jedynie w takich wypadkach, kiedy sygnał przychodzący z zewnątrz uległ w jakiś sposób modyfikacji. Wydaje się mało prawdopodobne, aby redukcja informacji dokonywana w toku analizy sensorycznej była przypadkowa lub dowolna. Podstawowa zasada pracy układu nerwowego polega na wykrywaniu zmian w strukturze sygnału. Porównywana jest intensywność sygnałów nadchodzących z sąsiadujących części siatkówki; reakcje zależą od różnicy w stopniu intensywności tych sygnałów. Niektóre obwody porównują nadchodzący sygnał z bezpośrednio poprzedzającym. Jeżeli oba sygnały są jednakowe, reakcji nie będzie; jeżeli są różne, występuje silna, aczkolwiek krótkotrwała reakcja. Wydaje się, iż podstawowa strategia analizy polega na porównywaniu. Różnice są wyławiane; niezmienność nie jest notowana. Głównym mechanizmem porównywania jest rywalizacja wpływów pobudzeniowych i hamujących. Procesy dodawania i odejmowania na wejściu neuronu dostarczają możliwości 137 dokonania obliczeń niezbędnych dla skomplikowanej analizy obrazu wzrokowego. Proste zestawienie w pary wpływów hamujących i pobudzeniowych stanowi podstawę wszystkich obwodów nerwowych we wszystkich systemach sensorycznych u wszystkich zwierząt, które były badane. W zasadzie możemy kontynuować tę pracę i budować w tym samym stylu nawet bardziej skomplikowane detektory - detektory rozpoznawania babci, samochodów czy domów. Bardzo możliwe, że uzasadniona jest prosta ekstrapolacja mechanizmów już znanych i układ nerwowy, być może, posługuje się takimi mechanizmami w rozpoznawaniu przedmiotów nawet bardzo skomplikowanych. Jak przekonaliśmy się jednak czytając rozdział 1 i jak przekonamy się czytając rozdział następny, ekstrapolacje tego typu są niebezpieczne, kiedy badania dotyczą tak złożonego systemu, jak mózg ludzki. Dokładne badania dotyczące spostrzegania przez ludzi wykazują, że jest jeszcze wiele tajemnic, które trudno wyjaśnić odwołując się do podstawowych mechanizmów przetwarzania informacji przez układ nerwowy. 3. Teorie rozpoznawania obrazów PANDEMONIUM Cechy związane z rozpoznawaniem liter Jak zbudować pandemonium? Znaczenie błędów Reakcje na zniekształcone obrazy Cechy związane z rozpoznawaniem mowy Problem segmentacji Detektory cech związane z analizą mowy Fonemy Cechy dystynktywne Podsumowanie dotyczące analizy cech ANALIZA PRZEZ SYNTEZĘ Znaczenie kontekstu Mokre skarpetki Ważna rola redundancji DOKONYWANIE SYNTEZY PRZEKAZU SENSORYCZNEGO KOLEJNOŚĆ OPERACJI CECHY A OCZEKIWANIA 139 W rozdziale poprzednim poznaliśmy niektóre mechanizmy nerwowe leżące u podstaw naszego spostrzegania. Czy wystarczą te systemy detekcyjne, aby wyjaśnić zdolność człowieka do rozpoznawania obrazów? Po chwili zastanowienia nasuwają się istotne wątpliwości. Dowolny system modelujący zdolność człowieka do rozpoznawania obrazów powinien być przede wszystkim bardzo elastyczny. System taki powinien na przykład bezbłędnie rozpoznawać tę lub inną literę, niezależnie od WIELKOŚCI lub położenia konkretnej litery. Ponadto wszelkiego typu zakłócenia obrazu nie powinny mieć istotnego wpływu na rozpoznawanie. Człowiek potrafi rozpoznać dowolny obraz nawet wtedy, kiedy brak jest jakichś jego części [na przykład litera A ma wymazany fragment poprzeczki] lub kiedy zawiera on dodatkowe elementy, [litera na tle gęstej kratki] jak też w przypadku różnorodnych form druku tej samej litery [tu zaprezentowano przeróżne formy i kształty tej samej litery, proste, ozdobne, z zawijasami, pogrubione, małe i duże]. A nawet jeśli jesteśmy do tego zmuszeni, możemy odczytywać litery odwrócone „do góry nogami”.[ Co niniejszym uczyniła bez trudu osoba poprawiająca tę wersję elektroniczną, gdyż poprzednie zdanie zostało wydrukowane w książce „do góry nogami”.] Jest to bardzo obszerna lista wymagań. Wymaganiom tym musimy sprostać, jeżeli chcemy zrozumieć proces przetwarzania informacji sensorycznej. Spróbujemy ustalić, jaki powinien być system, który łączyłby zdolność wyodrębniania cech w procesie widzenia z siłą i elastycznością spostrzegania ludzkiego, inaczej mówiąc spróbujemy zbudować model rozpoznawania obrazów przez człowieka. PANDEMONIUM Jedną z możliwych metod wykorzystania analizy cech do rozpoznawania obrazów jest system zwany Pandemonium (Selfridge, 1959). System ten składa się z kolejnych demonów, które pracują nad odebranym obrazem i każdy z nich wykonuje inną czynność (rys. 3-1) Pierwszy zespół demonów - demony obrazu - wykonuje pracę najprostszą: po prostu rejestrują one pierwotny obraz sygnału zewnętrznego. Następnie obraz ten jest analizowany przez demony cech; każdy z nich szuka w przedstawionym obrazie określonych cech charakterystycznych: linię lub kąt pewnego rodzaju, określoną krzywą lub kontur itp. 140 Demony poznawcze śledzą reakcje demonów cech. Każdy demon poznawczy jest odpowiedzialny za rozpoznawanie określonego układu cech. Tak na przykład rozpoznaniem litery A zajmuje się jeden demon, rozpoznaniem litery B - drugi itd. Demon litery A stara się odszukać cechy odpowiadające literze A. Po odnalezieniu tej cechy demon wszczyna alarm. Im więcej wynajdzie cech charakterystycznych, tym głośniej alarmuje. W końcu demon podejmujący decyzję, który przysłuchuje się wrzawie wywołanej przez alarmujące demony poznawcze, wybiera tego, który „krzyczy" najgłośniej, wychodząc z założenia, że odpowiadający temu demonowi układ cech jest najbardziej prawdopodobny. System Pandemonium opisuje w ten sposób przypuszczalną kolejność operacji występujących w toku analizy cech obrazów. System ten różni się od systemu wyboru na podstawie porównywania z wzorcem (opisanego w rozdziale 1) tylko tym, że początkowy obraz zostaje przekodowany i rozbity na szereg cech, a nie jest bezpośrednio porównywany z posiadanymi wzorcami czy reprezentacjami. W obu systemach niewątpliwie jedno jest wspólne: analizują równocześnie wszystkie dostępne elementy obrazu. Każdy demon poznawczy powiadamia, w jakim stopniu sygnał na wejściu pasuje do należącego do niego zestawu cech. Atrakcyjność tego systemu wiąże się z jego elastycznością. Można na przykład skłonić go do uczenia się. Demony poznawcze mogą stopniowo uczyć się, jak należy interpretować różnorodne cechy związane z podlegającym im układem. Łatwo można też wprowadzić do systemu wpływ kontekstu na rozpoznawanie, włączając do niego demony kontekstu, które dołączą swoje głosy do ogólnej wrzawy. Ponadto system ten jest zgodny z tym, co wiemy o analizie sygnałów zewnętrznych w układzie nerwowym. W poprzednich rozdziałach wykazano, że typ reakcji specyficznych dla oddzielnych neuronów 141 systemu spostrzegania można identyfikować jako demony cech. Czy system zbudowany na rozpoznawaniu cech pozwala nam rozwiązać problemy wynikające że zmiany wymiarów, kierunku i położenia danego obrazu? Nie bezpośrednio. Wszystko zależy od natury analizowanej cechy. Załóżmy, że litera H opisana jest jako dwie linie pionowe plus krótka linia pozioma. Przy takim zestawie cech dowolna zmiana położenia litery H wyłoni takie same trudności dla systemu Pandemonium, jakie stwarza dla systemu porównywania z wzorcem. System Pandemonium mówi jedynie o tym, jak można wykorzystać cechy do rozpoznawania obrazów, ale niczego nie powie o tym, jakie cechy w istocie są wyławiane z nadchodzącej informacji sensorycznej. Cechy związane z rozpoznawaniem liter Przystępując do projektowania maszyny zdolnej do rozpoznawania obrazów wzrokowych, musimy przede wszystkim zbadać cały zestaw cech mających podlegać rozpoznaniu i spróbować określić te cechy, które stanowią o unikalności danego obrazu. W zasadzie mamy znaczną swobodę w wyborze określonej grupy cech, które, jak nam się zdaje, pozwalają z dużym prawdopodobieństwem odróżnić jeden obraz od wszystkich pozostałych. Należy tu posługiwać się następującymi kryteriami: zespół cech powinien być możliwie najprostszy, powinien też dawać jak największą gwarancję uniknięcia pomyłek oraz poddawać się analizie, przy której stosowalibyśmy proste obwody połączeń. Rozpatrzmy ponownie cały ten proces, ale w postaci nieco bardziej konkretnej. Spróbujmy wykorzystać to, co wiemy o układzie nerwowym człowieka, aby wybrać cechy, które, być może, są wykorzystywane w prawdziwym systemie rozpoznawania obrazów przez człowieka. Jak zbudować pandempnium? Badania nad rodzajami reakcji neuronów, wywołanych przez specyficzne sygnały na wejściu, dają podstawy do przypuszczeń, że systemy spostrzegania u większości organizmów żywych są zdolne do wyodrębniania z dowolnego obrazu wzrokowego ogromnej liczby charakterystycznych dla niego cech. Przypomnijmy, że w ośrodkach mózgowych, otrzymujących od receptorów informację sensoryczną, niektóre oddzielne neurony reagują wyłącznie na występowanie linii prostej o określonym kierunku w określonej części pola siatkówki. Reakcja ich jest niezależna od długości linii. Neurony ^siadujące z nimi mogą też wytwarzać maksymalną reakcję na linię o określonym kierunku, ale nie są tak drobiazgowe, jeżeli chodzi o dokładne jej położenie. Inne neurony przejawiają maksymalną wrażliwość na kontury określonego kształtu albo też na linie przecinające się pod określonym kątem. W ten sposób system wzrokowy z reguły wydobywa z obrazu wzrokowego ogromną liczbę szczegółowych informacji o jego cechach specyficznych. W rzeczywistości wydobywa on znacznie więcej informacji, niż jest to konieczne do rozpoznawania liter w systemie pandemonium. 142 Informację można skondensować stosując tę samą zasadę, z której korzystaliśmy przy konstruowaniu wzorców: po prostu należy połączyć pewną liczbę komórek, aby skonstruować bardziej ogólny detektor cech. Na przykład, można połączyć wszystkie neurony leżące w różnych częściach siatkówki, a reagujące na występowanie w obrazie linii pionowych: 143 otrzymamy ogólny detektor linii pionowych. Reakcja takiego detektora uzależniona będzie od liczby linii pionowych w danym obrazie bez względu na ich długość, intensywność czy „jakość". Można skonstruować analogicznego demona również dla linii poziomych lub skośnych. To samo można zrobić dla kątów: prostych, ostrych itd. Również pewna informacja powinna być zawarta w liniach krzywych. Dla naszych celów warto stworzyć dwa demony linii krzywej. Jeden z nich będzie reagował na skreśloną liczbę krzywych ciągłych (jak w literach O i Q), a drugi na pewną liczbę krzywych nieciągłych (jak w literach C i G). Po przeprowadzeniu niezbędnych połączeń otrzymamy system zbliżony do przedstawionego na rysunku 3-2. Mamy tu do czynienia z informacją sensoryczną, która została przeanalizowana ze względu na występowanie siedmiu typów cech ogólnych (tabela 3-1). Demon odpowiedzialny za każdą z cech zawiadamia, ile „swoich" cech znalazł w obrazie. [W tabeli zostały szczegółowo określone liczby cech występujących w danej literze. Opisano w ten sposób wszystkie litery od A do Z (wielkie), a cechy które analizowano to: linie pionowe, linie poziome, linie ukośne, kąty proste, kąty ostre, krzywe ciągłe, krzywe nieciągłe. Przykłady: litera A ma 1 linię poziomą, 2 linie ukośne, 3 kąty ostre, litera B ma 1 linię pionową, 3 linie poziome, 4 kąty proste, 2 krzywe nieciągłe litera C ma 1 krzywą nieciągłą litera M ma 2 linie pionowe, 2 linie ukośne, 3 kąty ostre. litera O ma 1 krzywą ciągłą litera S ma 2 krzywe nieciągłe litera W ma 4 linie ukośne, 3 kąty ostre itd.] 144 Demony poznawcze zwracają uwagę na te cechy, które wiążą się z odpowiadającym im układem cech, a sygnały wysyłane przez nie będą tym głośniejsze, im więcej takich cech zawiera informacja sensoryczna. Właściwy układ cech ustalony zostanie przez demona decyzji na podstawie doniesień tego z demonów poznawczych, który reaguje najbardziej energicznie. 145 Aby system ten mógł rozpocząć pracę, pozostaje do przezwyciężenia jeszcze jeden problem. Niektóre litery różnią się między sobą tylko tym, że mają pewne dodatkowe cechy. Na przykład litera F składa się z linii pionowej, dwóch linii poziomych i trzech kątów prostych. Litera P ma wszystkie te cechy plus krzywą nieciągłą. Jeżeli eksponowana jest litera P, to nie ma problemu: demon P zareaguje głośniej niż demon F. W wypadku ekspozycji litery F zarówno demon F, jak i demon P będą reagowały równie donośnie i demon decyzji będzie miał kłopot z ich odróżnieniem. Podobny problem pojawi się również w sytuacji wyboru między literami P i R, V i Y, O i Q itp. Problem ten możemy rozwiązać przez ustanowienie standardowego maksymalnego poziomu reakcji dla wszystkich demonów. Dany demon reaguje maksymalnie tylko wtedy, kiedy występują wszystkie poszukiwane przezeń cechy. Nieobecność jakiejkolwiek z poszukiwanych cech albo też wystąpienie dodatkowej cechy powoduje pewne stłumienie reakcji. Tak w zarysie wygląda schemat systemu rozpoznawania cech specyficznych. Czy może on działać? Jedynym sposobem sprawdzenia go jest wypróbowanie w działaniu. Zobaczymy, co się stanie, kiedy zaprezentujemy temu systemowi jakąkolwiek literę, na przykład R (rys. 3-3). Początkowo litera R zostanie zarejestrowana przez demony obrazu, a następnie informacja ta przekazana zostanie do dalszej obróbki. Zaczynają reagować demony cech. Jako pierwszy zareaguje demon linii pionowej. Reakcja ta jednak nie wystarczy do sklasyfikowania obrazu. Na rysunku pokazano znaczną liczbę demonów poznawczych reagujących na linię pionową. Spośród 26 możliwych liter alfabetu [Chodzi o liczbę liter alfabetu języka angielskiego (Przyp. red. pol.).] 13 ma po jednej linii pionowej, 6 zaś po dwie linie poziome. Dalej widzimy, że pozostałe cechy litery R pobudzają aktywność różnych demonów poznawczych. W tym wypadku demon decyzji łatwo dokona wyboru, ponieważ najgłośniej ze wszystkich reaguje demon litery R. Następna najbardziej zbliżona litera to P, której odpowiadają cztery z siedmiu możliwych cech, a kolejna litera D ma ich trzy. Znaczenie błędów. Zwróćcie uwagę na pewne istotne cechy charakteryzujące działanie takiego systemu rozpoznawania obrazów. Aby rozpoznać na przykład literę R, nie trzeba koniecznie korzystać z usług siedmiu demonów wyodrębniania cech. Wystarczy odnotować, że mamy do czynienia z kątem ostrym i zamkniętym konturem, albo też wystarczy posłużyć się informacją o kątach: występowanie trzech kątów prostych i jednego ostrego jest charakterystyczne tylko dla wzorca litery R. A zatem dla poszczególnych liter, siedem demonów wyodrębniania cech dostarcza nadmiar informacji. Oznacza to, że system będzie funkcjonował również w takim wypadku, kiedy niektórym demonom wyodrębniania cech zdarzy się popełnić błąd. Pełny zestaw siedmiu cech niezbędny będzie tylko wtedy, gdy wszystkie możliwe wzorce będą rozważane równocześnie. Inaczej mówiąc, gdy chcemy uzyskać pełny opis wszystkich liter i każdej litery oddzielnie, potrzebne nam są wszystkie cechy. Jeżeli dodalibyśmy do alfabetu nowe litery, 147 to należałoby wówczas również zwiększyć liczbę analizowanych cech, zaś rodzaj tych cech byłby uzależniony od cech charakterystycznych nowych liter. Należy zwrócić uwagę również na to, że rodzaje błędów, jakie mogą wystąpić w procesie rozpoznawania, są uzależnione od zestawu cech wybranych do rozpoznawania obrazów. Jeżeli pojawiają się błędy w czasie rozpoznawania litery R, to najczęściej wynikają z mylenia jej z literą P, kiedy bowiem sygnał jest przetwarzany przez demony cech, układ cech dla P jest najbardziej zbliżony do R. 148 Jedna z metod sprawdzania tej teorii polega na prezentowaniu ludziom różnych liter w warunkach utrudnionego rozpoznawania, a następnie na analizowaniu występujących błędów. Wyniki takich eksperymentów, tworzą matrycę pomyłek popełnianych przez osoby badane w trakcie rozpoznawania liter. Rysunek 3-4 przedstawia taką matrycę wyników eksperymentu, w którym litery i cyfry pokazane na rysunku 3-5 eksponowano przez krótki czas na ekranie, a osoby badane odczytywały to, co widziały w danym momencie (według danych uzyskanych przez Kinneya, Marsetta i Showmana, 1966). 149 Z lewej strony matrycy pionowo umieszczono litery, które były istotnie eksponowane, na górze zaś, poziomo, litery podawane przez osoby badane. Jeżeli odszukamy w lewej kolumnie R, to równocześnie w odpowiadającym jej szeregu poziomym możemy znaleźć odpowiedzi osób badanych, usiłujących rozpoznać tę literę; w danym wypadku spełniły one 6 błędów, w tym czterokrotnie pomyliły R z literą P. Jeszcze jedna sprawa zasługuje na naszą uwagę, otóż błędy pojawiające się przy rozpoznawaniu liter w wyniku analizy cech nie zawsze rozkładają się symetrycznie, weźmy na przykład literę C. Podczas prezentacji tej litery będzie reagował wyłącznie demon reagujący na otwarty kontur (krzywą nieciągłą). Z tego powodu demon decyzji będzie miał trudność w dokonaniu wyboru między C i G. Zwróćcie uwagę na błędy pojawiające się przy rozpoznawaniu tych liter. Osobom badanym najwięcej trudności ze wszystkich liter przysporzyło rozpoznanie litery C: 21 razy zamiast C odczytywali literę G; jednakże, jak to wynika z matrycy pomyłek, wśród błędów powstałych przy rozpoznaniu litery G litera C pojawiła się tylko raz. Reakcje na zniekształcone obrazy. Teraz, kiedy znamy już pewne właściwości systemu pandemonium, rozpatrzymy problemy związane ze zniekształceniami w strukturze sygnału zewnętrznego. Zmiany wielkości liter nie stwarzają żadnego problemu w toku wyodrębniania cech przez system. Demony cech otrzymują przecież informacje od detektorów linii, które nie są wrażliwe na ich długość. Również kąty proste pozostają prostymi, a ostre-ostrymi, niezależnie od wielkości litery. Inny problem stanowi położenie linii. Wystarczy przewrócić literę F „na bok" i demony znajdą się w kłopocie, ponieważ teraz, zamiast jednej linii pionowej i dwu poziomych prostych linii pojawia się jedna linia pozioma i dwie linie pionowe. Natomiast, kiedy odwrócimy literę „do góry nogami", system rozpoznawania nie będzie miał żadnych kłopotów: Demony linii pionowych i demony linii poziomych będą reagować dokładnie tak samo. Oczywiście można poprawić wrażliwość systemu na położenie, budując demony dla bardziej ogólnych cech, na przykład łącząc wszystkie demony linii prostych, uzyskamy demona reagującego na linie proste niezależnie od ich położenia (rys. 3-6). Teoretycznie wszystko to możemy łatwo wykonać. Czy jednak taki system rozpoznawania może być zdolny do identyfikowania wszystkich liter na podstawie zestawu ich cech ogólnych? Wcale nie. Myli on litery M i W, ponieważ każda z nich składa się z czterech linii prostych i trzech kątów prostych. Podobnie będzie z N i Z, ponieważ mają one po trzy linie proste i po dwa kąty ostre (rys. 3-7). Dorośli z reguły nie mylą tych liter, choć dzieciom to się czasem zdarza. Tak więc te ostatnie kombinacje cech nie stanowią właściwego zestawu cech w systemie rozpoznawania obrazów, funkcjonującym u człowieka. Cechy związane z rozpoznawaniem mowy Nietrudno zrozumieć, jak można posłużyć się schematem wyodrębniania cech do opracowania systemu rozpoznawania liter. Nawet bardzo prosty zbiór cech nieźle funkcjonuje 150 przy rozpoznawaniu liter. Kiedy jednak w grę wchodzi mowa, sprawa nie jest tak prosta. Sam kształt fal charakteryzujących mowę ludzką stwarza poważne trudności dla analizy. Pomimo ogromnych nakładów finansowych i wysiłków, wszystkie opracowane dotychczas sztuczne systemy rozpoznawania mowy mają bardzo ograniczone zdolności: rozpoznają wyrazy, które wolno i wyraźnie wypowiada jedna osoba z niewielkiej grupy ludzi. W celu skonstruowania systemu rozpoznawania mowy należy przezwyciężyć trzy podstawowe trudności. Po pierwsze-rozwiązać problem segmentacji mowy: jednostki, które należy rozpoznać, nie są wyraźnie rozgraniczone. Po drugie- częstotliwość i amplituda fal dźwiękowych odpowiadające jednemu i temu samemu wyrazowi są nadzwyczaj silnie zróżnicowane zarówno w wypadku, gdy wyraz ten wypowiadają różni ludzie, jak i nawet wtedy, gdy ta sama osoba wypowiada go w różnych kontekstach. I po trzecie-nie wiadomo, jakie są w istocie te podstawowe cechy, które można by było wykorzystać do rozpoznania mowy, a nawet czy w ogóle takie cechy istnieją. Problem segmentacji. W trakcie analizy tekstu drukowanego łatwo możemy odnaleźć poszczególne litery, każda z nich jest oddzielona od sąsiednich liter odstępem określonej wielkości, jeszcze większy odstęp znajduje się między wyrazami. W ten sposób wyznaczenie granic między literami, wyrazami i zdaniami w tekście drukowanym nie sprawia kłopotu; ale przy odbiorze słuchowym tego samego tekstu sprawa przedstawia się całkiem inaczej. Słuchając, jak ktoś mówi, odnosimy wrażenie, że rozróżniamy wyraźnie oddzielone i na ogół dobrze artykułowane wyrazy. To wszystko jest tylko złudzeniem. Tak wyraźnie odróżniane przerwy między oddzielnymi wyrazami w istocie w realnych sygnałach nie występują; stanowią bowiem jedynie rezultat procesu rozpoznawania obrazów. Ich odbiór jest wynikiem analizy. W rzeczywistości mowa ludzka to dziwaczne splątanie nieartykułowanych dźwięków, niewyraźnych zgłosek, przerw i skrótów. Co najgorsze, nie widać żadnego wyraźnego związku między przerwami w kształcie fali głosowej a granicami pomiędzy oddzielnymi wyrazami. Łatwo możemy przekonać się o tym przysłuchując się mowie człowieka w obcym dla nas języku. Jeżeli język nie jest nam znany, odnosimy wrażenie, jakby dźwięki płynęły nieprzerwanym potokiem. Nawet ten, kto rozpoczął naukę i opanował podstawowy zasób słów, odkrywa, że jest mu bardzo trudno wyławiać znane słowa z płynącego bez widocznych przerw potoku słów człowieka, dla którego jest to jego język ojczysty. W rzeczywistości ta płynność słów cudzoziemca w większości wypadków jest złudna. Różnice w odbieraniu szybkości mowy związane są z różnicą warunków jej rozpoznawania. W jednym wypadku dźwięki mają sens i wyrazy jawią się jako oddzielne jednostki; w drugim wypadku zaś te same dźwięki okazują się niezorganizowaną, bezsensowną plątaniną. Niektóre właściwości fizyczne fali głosowej można wykorzystać w celu segmentacji przekazu werbalnego. Jednak żadna ze zbadanych do dziś cech fizycznych fali głosowej nie może służyć za pewną podstawę do określenia granic między wyrazami. 151 I w wielu wypadkach okazuje się, że dla skutecznego odnajdowania granic między wyrazami niezbędna jest znajomość poprzednich wyrazów w zdaniu; jak na przykład rozczłonkować układ dźwięków p-o-w-ó-z, jeżeli nie wiemy, czy wyraz ten wchodzi w skład zdania „Powóz dopiero co zajechał" czy też zdania „Szofer przyszedł po wóz do garażu". Aby dokonać analizy fali głosowej, musimy posłużyć się znacznie bardziej skomplikowanym systemem rozpoznawania obrazów, omówionym w następnym paragrafie. Detektory cech związane z analizą mowy Fonemy. Lingwiści od dawna próbowali scharakteryzować dźwiękowe komponenty mowy. Jest oczywiste, że w tekście drukowanym sylaby i oddzielne litery stanowią elementarne jednostki wyrazu. Ale w mowie ludzkiej nie tak łatwo wyróżnić podstawowe jednostki. Dla doświadczonego ucha specjalisty istnieje jednak stosunkowo niewielki zbiór podstawowych dźwięków, z których tworzą się wszystkie wypowiadane wyrazy. Pojedynczy dźwięk zasługuje na miano jednostki podstawowej wówczas, gdy ma pewną funkcjonalną wartość. Weźmy pod uwagę wyrazy: bok, kok i lok. Każdy z tych wyrazów ma inne znaczenie; różnica sensu występuje w trakcie zmiany jednego dźwięku-w naszym przykładzie początkowego („b", „k" albo „l"). Dźwięk, który sam nie ma znaczenia, ale jest zdolny do zmiany znaczenia wyrazu, nazywa się fonemem. Dźwięki „a", „e", „i", „u" i inne również są fonemami. Na przykład, wstawiając w środek wyrazu lok „e" lub „a" możemy uzyskać wyrazy o nowych znaczeniach. Nie każda litera musi koniecznie odpowiadać fonemowi, a nawet liczba i rodzaj fonemów mogą być różne w różnych dialektach w obrębie tego samego języka. W pewnych rejonach USA na przykład, słowa merry, marry i Mary wymawia się identycznie, w innych zaś zupełnie inaczej. Różnice w dźwięku, jeżeli nie sygnalizują nam różnic w znaczeniu, na ogół są nie zauważane. Na przykład, fonem „d" wymawia się całkiem różnie w wyrazach: dom i brud, ale na ogół ani mówiący, ani słuchający nie uświadamiają sobie tych różnic. Jeżeli fonemy w swej istocie są podstawowymi cegiełkami służącymi do budowy wyrazów, to czy można by je wykorzystać jako cechy niezbędne w systemie rozpoznawania mowy typu pandemonium? Prawdopodobnie nie. Traktując fonemy jako cechy niewiele zyskamy. W przeciwieństwie do detektorów linii i kątów w systemie wzrokowym nie znamy obecnie sposobu analizowania i wyodrębniania fonemów z fali głosowej. Jak dotąd, tylko człowiek potrafi rozpoznawać fonemy w fali głosowej. Cechy dynstynktywne. Trudności związane z identyfikowaniem fonemów doprowadziły do przyjęcia innych systemów klasyfikacji dźwięków mowy. Jedna z metod polega na zbadaniu, jak mowa jest produkowana, aby stwierdzić, czy fala głosowa może być opisana przez odwołanie się do operacji niezbędnych dla wytwarzania dźwięków. Dźwięki mowy pojawiają się w rezultacie kompleksowego współdziałania różnych części aparatu głosowego. Tabela 3-2. Jedna z przyjętych klasyfikacji fonemów języka angielskiego" (Tabela usunieta) [Fonemy zostały sklasyfikowane na podstawie nastepujących cech: Tnąca/Nietnąca, Ciągła/Nieciągła, Napięta/Nienapięta, Nosowa/Ustna, Mollowa/Niemollowa, Ciemna/Jasna, Skupiona/Rozproszona, Spółgłoskowa/Samogłoskowa, Wokaliczna/Niewokaliczna 153 Przepona, unosząc się, przepycha powietrze przez tchawicę. Podniebienie miękkie odsłania i zasłania kanały nosowe w celu przepuszczenia powietrza. Język, wargi i zęby poruszają się jednocześnie, co zapewnia harmonijną i czasową strukturę produkowanych ciągów dźwiękowych. Dźwięki mowy możemy podzielić w zależności od sposobu i miejsca ich artykulacji w aparacie mowy. Jeżeli powietrze przechodząc przez tchawicę wywołuje wibrację strun głosowych, wytwarza się dźwięk dźwięczny, na przykład „a" lub „z". Jeżeli struny głosowe nie wibrują w trakcie artykułowania dźwięku, uzyskujemy dźwięk bezdźwięczny, na przykład „s" w słowie syk. Zauważcie, że dźwięki „z" i „s" różnią się jedynie dźwięcznością. Inna cecha dystynktywna tworzy się w wyniku ograniczenia strumienia powietrza gdzieś w ustach - wytwarzane są dźwięki szczelinowe „sz", „cz", „f” „w", „s". Przy wymawianiu innych dźwięków strumień powietrza zostaje przerwany na krótko, po czym nagle uwolniony produkuje dźwięki zwarte, na przykład „t" i „d"; dźwięki te tworzą przerwę w kształcie fali głosowej, nie ma ona jednak żadnego związku z odstępem między wyrazami. Na przykład, w czasie wymawiania słowa standard występują trzy wyraźne przerwy w toku mowy: jedna po ,,s", druga po „n" i trzecia po „r". Ale też tylko te trzy przerwy wystąpią przy wypowiadaniu zdania he uses standard oil. W ten sposób możemy przekodować dźwięki mowy na cechy dystynktywne związane z wytwarzaniem dźwięków przez aparat mowy, albowiem każdy dźwięk ma unikalne właściwości. W tabeli 3-2 przedstawiamy jedną ze stosowanych klasyfikacji cech dystynktywnych dla fonemów występujących w języku angielskim. Cechy dystynktywne, podobnie jak fonemy, trudno jest wyodrębnić z fali głosowej. W dodatku charakter dźwięków zmienia się zasadniczo zależnie od kontekstu. W rezultacie istnieje wiele sposobów klasyfikacji dźwięków, ale żaden z nich nie jest w pełni zadowalający. Niektórzy preferują systemy klasyfikacji oparte na wytwarzaniu dźwięków mowy; inni podkreślają wagę ich percepcji przez słuchaczy; wreszcie jeszcze inni starają się łączyć oba podejścia. Jak na razie nie udało się jednak opracować takiego systemu, który umożliwiałby maszynie efektywne rozpoznawanie mowy, nie mówiąc już o rozmowie prowadzonej przez kilka osób równocześnie. Podsumowanie dotyczące analizy cech Przedstawiony materiał pozwala nam w zasadzie przejść do rozważań nad metodą zbudowania systemu rozpoznawania obrazów, opartego na analizie cech. Przeanalizowaliśmy sposoby budowania i weryfikacji teorii rozpoznawania obrazów. Tworząc dowolną teorię musimy przede wszystkim ustalić, czy możliwe jest potwierdzenie jej w praktyce. Czy rzeczywiście wyodrębnione cechy nadają się do klasyfikowania i identyfikowania wszystkich obrazów danej modalności zmysłowej? Jeżeli budujemy maszynę do odczytywania adresów na kopertach i sortowania przesyłek, to staramy się, aby w miarę możliwości nie popełniała ona błędów. Ale błędy są rzeczą ludzką. Jeżeli zatem usiłujemy zbudować model rozpoznawania obrazów przez człowieka, to powinien on popełniać takie same błędy, jakie popełnia człowiek. Analiza błędów okazała się być 154 jednym z najważniejszych sposobów uzyskiwania informacji o działaniu systemu rozpoznawania obrazów przez człowieka. Takie ogólne podejście do problemu rozpoznawania obrazów jest słuszne, ale szczegóły są niewątpliwie fałszywe. Jedna z ważniejszych spraw dotyczy różnorodnych możliwych poziomów abstrakcji w systemie wyodrębniania cech. Na jednym z poziomów system może reagować na wiele pionowych, poziomych i skośnych linii danego obrazu. Na innym poziomie system mógłby tylko wyodrębniać ogólną liczbę linii niezależnie od ich położenia. Może byłoby lepiej, gdyby istniały jakieś pośrednie poziomy albo też analizatory jeszcze bardziej ogólnych cech. W przypadku człowieka – prawdopodobnie – odbierany obraz klasyfikowany jest równocześnie na różnych poziomach ogólności. Na najwyższym poziomie rejestrowane jest pojawienie się litery A. Niższe poziomy mogą sygnalizować na przykład, że A leży „na boku". Inne części systemu prawdopodobnie zajmują się różnymi szczegółami informacji na wejściu, rejestrując wszystkie dodatkowe kropki i spirale, które zostają odfiltrowane na wyższych poziomach przetwarzania informacji. W wypadku niektórych zadań wystarczy jedynie odkrycie bardzo ogólnych cech obrazu, na przykład jego nadmiernego wydłużenia lub krzywizny. Dla innych może okazać się konieczna szczegółowa analiza obrazu. Przy próbie budowania takich ogólnych schematów, które pozwalałyby rozpoznawać obrazy pomimo występujących zniekształceń, należałoby przewidywać możliwość takich zniekształceń w odbieranym sygnale. ANALIZA PRZEZ SYNTEZĘ Systemy działające na zasadzie wyodrębniania cech okazują się zawodne w wielu sytuacjach, które nie przedstawiają żadnej trudności dla człowieka. W jaki sposób analiza cech może być pomocna w ustaleniu, który z dwu dźwięków „noo-dis-plaee" oznacza słowa „new display", a który słowa „nudist play"? Jakie cechy mówią nam o tym, że symbole 13 są liczbą, kiedy pojawiają się w kontekście 13 579, lecz będą literą, kiedy pojawią się w kontekście |30Y( przed trójką stoi pionowa kreska)? A co ma robić system rozpoznawania cech z obrazem z rysunku 3-8 -jakie cechy określają katedrę? [Autorem litografii „Katedra nr 5” jest Roy Lichtenstein. Artysta w niezwykły sposób uzyskał efekt w postaci obrazu katedry. Litografia została wykonana na bazie będącej wizerunkiem plastra miodu (sześciokątne komórki z okrągłym wnętrzem ściśle przylegające do siebie). Efekt osiągnął autor zaczerniając wybrane ścianki komórek, inne pozostawiając białe, podobnie czyniąc z wnętrzami w kształcie kół. Obraz w książce ma wymiar prawie całej strony, a oglądanie go z normalnej odległości z trudem daje się zinterpretować. Dopiero odsunięcie książki na kilka metrów od obserwatora daje wyraźny wizerunek katedry.] Demony z pandemonium okazują się tu niewystarczające. Potrzeba więcej informacji, aby proces rozpoznawania obrazów osiągnął tę moc, jaką ma system rozpoznawania obrazów przez człowieka. W cóż jeszcze jest on wyposażony, co w nim się znajduje, gdy zawiodą systemy porównywania z wzorcem i rozpoznawania cech? Znaczenie kontekstu Interpretacja danych sensorycznych opiera się w poważnej mierze na wiedzy o tym, czym sygnał ma być, rzadziej zaś na informacji, jaką ten sygnał zawiera. Tę informację dodatkową dostarcza kontekst zdarzenia sensorycznego. Kontekst obejmuje całe środowisko, 156 w jakim zachodzi dane doświadczenie. Czytelnik wie sporo rzeczy o treści czytanej książki, w uzupełnieniu do konkretnych układów liter na danej stronicy. Wie, że tekst jest napisany po polsku, że dotyczy zarówno ogólnie psychologii, jak i psychologii rozpoznawania obrazów w szczególności. Więcej nawet, po pewnym czasie Czytelnik zapoznawszy się ze stylem autorów może z dużym prawdopodobieństwem przewidzieć, jakie słowa nastąpią uprzednio przeczytanych. Przewidywania te będą do tego stopnia prawidłowe, że czytający automatycznie będzie wstawiał brakujące wyrazy, jak na przykład słowo „po" opuszczone w poprzednim zdaniu, albo też, co na to samo wychodzi, nie zauważy jego braku. [Dobrym przykładem jest fakt, że maszynistka przepisująca ten tekst wstawiła automatycznie ten brakujący wyraz.] Ogromną ilość informacji, jaka jest nagromadzona i zazwyczaj automatycznie wykorzystana do zrozumienia zdarzeń, określamy mianem kontekstu tych zdarzeń. Zdolność do wykorzystywania kontekstu czyni system spostrzegania u człowieka znacznie doskonalszym i bardziej elastycznym, niż byłby jakikolwiek elektroniczny system rozpoznawania obrazów. Mokre skarpetki Efekt wpływu kontekstu łatwo jest udokumentować. Rysunek odbierany jest szybciej i łatwiej, jeśli zawiera jakąś myśl, niż wówczas, kiedy jest pustą dekoracją. Zdolność do czytania i zapamiętywania liter jest znacznie bardziej ograniczona, jeśli tworzą one ciąg bezsensowny- sgtooeurua- niż wtedy, gdy te same litery jawią się w sensownym porządku - outrageous (oburzający). A nawet wówczas, kiedy litery tworzą sensowne słowa - inm ycr aft ors ull ena rt - trudno jest je odebrać, gdy podzielone są w inny niż zazwyczaj sposób. [Właściwy podział na słowa przedstawia się następująco: „In my craft or sullen art". Tytuł wiersza Dylana Thomasa (przyp. red. pol.).] Opracowana została znaczna liczba technik eksperymentalnych, które pozwalają zademonstrować wpływ kontekstu na analizę percepcyjną napływających sygnałów. W jednym przykładzie (eksperyment przeprowadzony przez Millera, 1962a) osoba badana słuchała szeregu wyrazów, takich jak: socks, some, brought, wet, who (skarpetek, parę, przyniósł, mokrych, kto). Wyrazy wypowiadane były na tle szumu, każdy oddzielny wyraz udawało się rozpoznać prawidłowo jedynie w około 50 procentach przypadków. W następnym badaniu zmieniono w ten sposób porządek słów, że powstało sensowne zdanie: -kto, przyniósł, parę, mokrych, skarpetek. W tym wypadku rozpoznawanie wzrosło w istotny sposób 157 i odpowiadało takiemu poziomowi, jaki uzyskiwany był w pierwszym eksperymencie przy obniżaniu stopnia szumów o 50 procent uprzedniej wartości. Pamiętajmy, że fizycznie obie sytuacje - pierwsza i druga-były identyczne. To właśnie i czynnik kontekstu przyczynił się do poprawy dokładności spostrzegania przy identycznym sygnale fizycznym. Co się dzieje, kiedy słyszymy jakieś słowo bez kontekstu, na przykład słowo „brought"? Dźwięczy ono jak głuche burczenie na tle szumu; słuchający, być może, uchwyci tu szereg istotnych cech: na przykład może rozpoznać dźwięk „b" i określić, że cały wyraz składa się z jednej długiej sylaby. Te dwie cechy wystarczą, aby móc ustalić zasadę odrzucenia takich wyrazów, jak: hospital, Missisipi, bananas i boondocks, ale pozostaje jeszcze duża liczba innych możliwości, na przykład takie słowa, jak: brought, boy, brings, brags, boys, bought, bit, bones. Zatrzymajmy się na tych ośmiu wyrazach. Bez informacji dodatkowej nie uda się podjąć żadnej decyzji. Na tym etapie rozwiązanie może być prawidłowe w 1 przypadku na 8, prawdopodobieństwo prawidłowej odpowiedzi stanowi 12,5 procent. Załóżmy teraz, że ten sam wyraz wchodzi w zwrot, who b_ some wet socks (kto p_ parę mokrych skarpetek?) Jest to drugi wariant eksperymentu Millera. Liczba możliwych alternatyw kurczy się. Nie znany wyraz jest prawdopodobnie czasownikiem, więc można pominąć wyrazy boys i bones jako możliwe alternatywy. Musi też odnosić się do konkretnego przedmiotu. Nie można chwalić się (brag) skarpetkami, więc jeszcze jedna możliwość jest wyeliminowana. Musi też mieć jakiś prawdopodobny sens. „Who bit the wet socks" (kto gryzie mokre skarpetki) jest mało prawdopodobnym stwierdzeniem, zatem odrzućmy wyraz bit. Teraz mamy cztery alternatywy: brought, brings, buys i hought. A wraz z małą dodatkową informacją dotyczącą jakiejś cechy akustycznej tego wyrazu ograniczymy wybór jeszcze bardziej. Czy jest gdzieś syczący dźwięk „s"? Jeśli nie ma, to wyraz jest jednym z dwu: brought lub bought: tylko dwie możliwości. W tej sytuacji szansa odgadnięcia zwiększyła się znacznie, gdyż prawdopodobieństwo właściwego rozwiązania wzrosło od 12,5 procent do 50 procent. Jasne jest zatem znaczenie kontekstu. Można opracować reguły, które pozwoliłyby na ograniczenie możliwych alternatyw, jakie w danym momencie należy brać pod uwagę. Nie znaczy to wcale, że w spostrzeganiu uczestniczy świadomy proces prób i błędów dla wszystkich możliwych alternatyw w celu wybrania tej, która lepiej niż inne odpowiada danej konkretnej informacji kontekstowej. Dokładnie nie wiemy, jakie to mechanizmy zajmują się informacjami występującymi w kontekście; wiemy tylko jedno, kontekst istotnie odgrywa bardzo ważną rolę w naszym spostrzeganiu. Kontekst dostarcza zasad, które pozwalają na tworzenie się naszego percepcyjnego świata, dzięki niemu wiemy, czego możemy oczekiwać, i możemy sensownie interpretować nasze spostrzeżenia. Należy pamiętać, że aby w pełni wykorzystać informację płynącą z kontekstu, spostrzeganie musi „opóźniać się" w stosunku do informacji odebranej przez system sensoryczny. Odbiór wyrazu brought winien dopomóc nie tylko wyrazom pojawiającym przedtem (who), ale również wyrazom pojawiającym się po nim (socks). To opóźnienie między dopływem informacji sensorycznej a interpretacją końcową przekazu odgrywa ważną rolę w analizie percepcyjnej. Na przykład, podczas głośnego czytania oczy czytającego biegną szybciej po linijkach tekstu niż jego głos. 158 Kiedy sprawna maszynistka przepisuje rękopis, czyta tekst znacznie szybciej niż pisze go na maszynie. Poruszamy się ciągle do przodu starając się zebrać możliwie jak najwięcej informacji płynącej z kontekstu, zanim przystąpimy do tych działań, jakie stawia przed nami wykonywane zadanie. Im więcej wiemy o tym, co będzie za chwilę, tym łatwiej odbieramy to, co istnieje w danej chwili. Ważna rola redundancji Jak się wydaje, struktura języka może poprawiać i uzupełniać zdolność człowieka do wydobywania sensu z niepełnego, fragmentarycznego komunikatu. Język angielski jest w wysokim stopniu redundantny. Mówimy i piszemy znacznie więcej słów niż jest to konieczne dla zrozumienia tego, co chcemy powiedzieć lub też napisać. Opuszczenie wielu wyrazów uczyni tekst krótszym, ale nie będziecie mieć trudności ze zrozumieniem go. Jednym ze sposobów oceny redundancji wyrazów w języku jest zamieszczone zniekształcenie tekstu przez systematyczne opuszczanie określonych jego elementów, które czytający powinien odtworzyć. Łatwość, z jaką zadanie to może być wykonane, stanowi miarę redundancji języka. Możemy spokojnie usunąć co trzecią literę w tym tekście, a mimo to zrozumiecie go dobrze.[ Jeśli miejsce usuniętych liter pozostanie zaznaczone.] Zadanie będzie trudniejsze, gdy nie zapełnimy przerw. [ Brzmiałoby tak: Zaane bdze tudiesz gd ni zaełim prer. Gdyby język nasz był bardziej efektywny lub też, gdyby ludzie byli mniej zdolni do posługiwania się informacją kontekstową w ukierunkowaniu własnej percepcji, to porozumiewanie się stanowiłoby proces męczący i niepewny. Trzeba by było przysłuchiwać się uważnie każdemu słowu, jeden opuszczony czy zniekształcony wyraz i już całe zdanie traciłoby sens albo też zostałoby źle zrozumiane. Nie moglibyśmy ani na chwilę osłabić uwagi. Każdy nieprzewidziany hałas mógłby doprowadzić do katastrofy. Redundancja języka zatem pozwala nam koncentrować wybiórczo uwagę na oddzielnych częściach komunikatu, przewidywać następne jego części, skupić się na kluczowych słowach i frazach przenoszących główny sens przekazu. W efekcie możemy nawet odwracać uwagę ufni, że pomimo braku wielu szczegółów mowy czy pisma nie zagubimy przekazywanego znaczenia. DOKONYWANIE SYNTEZY PRZEKAZU SENSORYCZNEGO Znacznie łatwiej jest przedstawić efekty działania kontekstu niż rozpracować podstawowe mechanizmy korzystania z informacji kontekstowej dla interpretacji sygnałów sensorycznych. Zbyt mało jeszcze wiemy o procesach poznawczych i strukturze pamięci człowieka, aby zbudować w pełni adekwatny model. Niemniej jednak musimy zrobić tu jakiś początek, aby dać Wam możliwość uchwycenia istoty problemu. Dotychczasowe rozważania pozwalają przypuszczać, że na jednym końcu systemu sensorycznego pojawia się reakcja na zdarzenia zewnętrzne i przekaz sensoryczny przekształcony zostaje w zespół cech specyficznych. Na drugim zaś końcu znajduje się 159 system pamięci zawierający zapis minionych zdarzeń-danych i teorii niezbędnych dla interpretacji sygnałów sensorycznych. W jakiś sposób oba te źródła informacji muszą zbiegać się ze sobą. Dane sensoryczne muszą być skonfrontowane z nagromadzoną wcześniej informacją, aby było możliwe rozpoznanie sygnału. Jednak proces konfrontacji nie może być arbitralny. Nie jest możliwe, aby z pamięci wydobywane było pierwsze lepsze zdarzenie w nadziei, że jest ono w jakiś tam sposób związane z napływającym sygnałem sensorycznym. Jeśli zdarzenia byłyby wydobywane z pamięci przypadkowo, to trzeba by sporo czasu, aby zidentyfikować takie proste przedmioty, jak stoły i krzesła. 161 Teraz właśnie należy rozważyć rolę, jaką pełni kontekst. System pamięci zawiera nie tylko klucz do rozpoznawania nowych danych, ale także dane dotyczące dopiero co interpretowanych zdarzeń sensorycznych. Są to oczekiwania tego, co ma nastąpić, określonego zdarzenia sensorycznego, wynikającego z danych dopiero co spostrzeganych. Nawet więcej, oczekiwania bezustannie się zmieniają w miarę tego jak postępuje przetwarzanie sygnału. Powstawanie i weryfikowanie oczekiwań w trakcie interpretacji przekazu będziemy nazywali procesem aktywnej syntezy. Na rysunku 3-9 główna część modelu pandemonium, który opisaliśmy powyżej, jest zamknięta w skrzynce „analiza cech". Demon decyzji znajduje się zaś w skrzynce „procesu aktywnej syntezy" i ma on do czynienia nie tylko z danymi sensorycznymi, ale również z pamięcią. Praca procesu aktywnej syntezy polega na tworzeniu logicznie spójnego przekazu, zgodnego z obu źródłami informacji. Na razie skrzynka jest pusta. A teraz spróbujmy wyobrazić sobie to, co zachodzi wewnątrz skrzynki, chwytając procesy syntezy w połowie interpretacji przekazu. Na rysunku 3-10 zatrzymaliśmy proces w połowie czytania następującego zdania: THE BOY WORRIED HIS FATHER (CHŁOPIEC MARTWI SWEGO OJCA). System analizy sensorycznej przedstawiony został w momencie, kiedy zatrzymał się na literze R. Właśnie odkrył dwie linie proste jako cechy R w skrzynce analizy cech. W tym czasie system pamięci zawiera już zinterpretowaną część zdania: THE BOY WOR_. W środku między analizą sensoryczną a pamięcią leży proces aktywnej syntezy, próbujący porównać pojawiające się oczekiwania z napływającą informacją sensoryczną. Przyjrzyjmy się tym oczekiwaniom. Aktualnie analizowane słowo zaczyna się od WOR_. Przypuśćmy, że istnieją różne możliwe do uwzględnienia słowa, jak na przykład: WORSHIPPED, WORKED i WORRIED. Załóżmy, że są to dla tego systemu jedyne znane wyrazy, zgodne ze wszystkimi danymi posiadanymi do tej pory. Będą one rozpatrywane po pierwsze dlatego, że zaczynają się od WOR, i po drugie dlatego, że są czasownikami, które może przyjąć podmiot osobowy. Niewątpliwie analiza wyrazu zaczyna się od znacznie dłuższej listy możliwości. Jednakże w miarę jak interpretacja posuwa się naprzód, liczba ich ulega ograniczeniu do momentu aż pozostaną już tylko te trzy możliwości. Po zakończeniu procesu syntezy jednego segmentu przekazu system przechodzi do następnego. Informacja kontekstowa może nam sugerować, że należy oczekiwać jako kolejnej istotnej części przekazu dopełnienia orzeczenia będącego zapewne nazwą stopnia pokrewieństwa, ponieważ poprzednie zdanie dotyczyło już stosunków rodzinnych chłopca. W miarę rozwoju drobiazgowej analizy kolejnego wyrazu pojawiają się nowe oczekiwania, które poddawane są sprawdzeniu przez porównanie z danymi sensorycznymi (rys. 3-11). Przedstawiliśmy system rozpoznawania, w którym w miarę interpretacji przekazu sensorycznego bezustannie są konstruowane i sprawdzane oczekiwania odnośnie do tego, co jest spostrzegane. System ten nie opiera się wyłącznie na własnych modelach wewnętrznych czy też tylko na świadectwie narządów zmysłowych, lecz dopiero wówczas, kiedy dane z obu tych źródeł informacji są zbieżne, kończy się interpretacja sygnału wejściowego. Taki typ systemu rozpoznawania obrazów powinien mieć zdolność konstruowania i sprawdzania hipotez równocześnie na kilku poziomach. Reguły zawarte w gramatyce oraz znaczenie języka 163 pozwalają na tworzenie się oczekiwania, że wyraz jest czasownikiem, i kolejnego oczekiwania, że po nim nastąpi rzeczownik, mający związek z tym właśnie czasownikiem, i że użyte wyrazy powinny wiązać się z sytuacją rodzinną chłopca. W ramach tego ogólnego kontekstu mieści się jedynie niewielki zestaw słów, które odpowiadałyby zarówno kontekstowi, jak i zinterpretowanej już części odebranego przekazu. Oczekiwania te ze swej strony generują przewidywania dotyczące określonego układu cech aktualnie interpretowanego sygnału. Jak tylko demony konturów zaczynają podnosić alarm, cały kompleks oczekiwań zostaje poddany równoczesnemu sprawdzeniu i system może przejść do następnego segmentu przekazu. Na drugim krańcu system sensoryczny musi dostarczać wielu informacji sensorycznych i to na różnych poziomach. Dane sensoryczne o długości wyrazu oraz jego kształcie ogólnym łączą się z informacją kontekstową w celu zawężenia kręgu możliwych alternatyw. Informacja dotycząca przybliżonej długości wyrazów oraz ich liczby i kształtu wykorzystywana jest prawdopodobnie przy wyborze następnego segmentu do interpretacji. W uzupełnieniu do tych ogólnych cech zachodzi równocześnie szczegółowa analiza drobniejszych części przekazu. Wielka zaleta procesu aktywnej syntezy polega na tym, że stwarza on możliwości wyboru próbki informacji napływającej z otoczenia i poddania analizie tylko takiej niezbędnej ilości informacji, która wystarczy do jednoznacznej interpretacji sygnału. Proces syntezy kieruje uwagę na najistotniejsze części przekazu i na najważniejsze cechy obrazu. W procesie syntezy mogą pojawiać się fałszywe hipotezy i błędne przewidywania zdarzeń sensorycznych, jednak system dysponuje licznymi, wbudowanymi weń mechanizmami, zabezpieczającymi przed takimi błędami. Przypuśćmy, że po uzyskaniu wszystkich danych okazało się, że dane sensoryczne nie odpowiadają żadnej z oczekiwanych liter. Płynny bieg procesu przetwarzania informacji musi zostać przerwany na jakiś czas, przynajmniej dopóty, dopóki nie zostanie wyjaśnione to nieporozumienie. Rozważmy, jakie są możliwości, którymi dysponuje system, aby móc wykryć i poprawić ewentualne błędy. Może jakieś litery zostały opuszczone, trzeba to sprawdzić choćby wyrywkowo. Czy nowe dane sensoryczne zgodne są z oczekiwaniem? Jeżeli teraz mamy zgodność, to poprzednia niezgodność mogła być po prostu następstwem przekręconego lub też niewłaściwie odebranego sygnału na wejściu; w tym przypadku system może kontynuować swoją pracę. Jeśli niezgodność występuje nadal, to trzeba cofnąć się dalej, aby ponownie prześledzić przekaz i sprawdzić, czy nie została wybrana niewłaściwa droga. Możliwe, że np. słowo „houseboat" pojawiło się całkowicie w niezgodzie z kontekstem, wówczas trzeba będzie rozluźnić ograniczenia, jakie niesie kontekst, i pozwolić na zdominowanie sposobu interpretacji komunikatu sensorycznego przez bezpośrednie dane sensoryczne. Słowo, które nie zgadza się z kontekstem zdaniowym, można zrozumieć, chociaż może ono pobudzić system do powtórzenia całej analizy. Analizie mogą być poddawane i takie słowa, z którymi system wcześniej nigdy nie miał do czynienia, nie znajdzie on wtedy znaczenia dla takiego sygnału wejściowego. 164 KOLEJNOŚĆ OPERACJI W poprzednich przykładach dwie sprawy uległy uproszczeniu. Pierwsza, przy ocenie wpływu kontekstu przyjęto, że wszystkie wyrazy w zdaniu mogły być odebrane dokładnie, z wyjątkiem tego, który jest aktualnie przedmiotem analizy. Tak więc dopuszczamy, że zagłuszone szumem wyrazy stawały się zrozumiałe dzięki informacji kontekstowej, dostarczonej przez te wyrazy, które już zostały odebrane i pomogły zawęzić krąg możliwości. W eksperymencie Millera, opisanym powyżej, te inne wyrazy były również zagłuszane. Jak zatem zbiór źle odebranych wyrazów może pomóc rozszyfrować jeszcze jeden niejasny wyraz? Całkiem różne, chociaż związane z poprzednim założenie zostało przyjęte w omawianym przed chwilą przykładzie; przy analizie wyrazu WORRIED w zdaniu THE BOY WORRIED HIS FATHER. Przyjęto tu założenie, że analiza zdania postępowała litera po literze, przy czym częściowa interpretacja wyrazu WOR określała wybór następnych liter. Żadne z tych stwierdzeń nie jest nieprawdziwe, są one jednak pewnym uproszczeniem. Ważną sprawą w procesie analizy przez syntezę jest fakt, że proces ten może wykorzystywać wszystkie źródła informacji, zawierające dostępną informację, dotyczącą istoty analizowanego sygnału. Jeśli znaczenie może dopomóc, posłużymy się znaczeniem. Jeśli pojedyncza litera musi być przeanalizowana, aby móc zakończyć interpretację słowa, to litera ta zostanie przeanalizowana. Jeżeli cały człon wyrazu-lub też cały wyraz-nie wydają się niezbędne dla zrozumienia napływających zdarzeń sensorycznych, to zostaną one pominięte. Ponadto proces ten wcale nie musi zachodzić kolejno, segment po segmencie, litera po literze. Różne części mogą być analizowane w różnym porządku, a czasem nawet równocześnie. Naturalne było założenie, że proces analizy przebiega w miarę napływania sygnałów i, choć to jest wygodne (taki właśnie porządek przyjęliśmy w naszym przykładzie), to jednak nie zawsze tak musi być. Spróbujmy wyobrazić sobie, jak będą analizowane kolejne symbole, przedstawione na rysunku 3-12. Żadnej litery nie można rozpoznać. Ale jeżeli ten ciąg symboli włączymy do zdania (rys. 3-13), to można je rozszyfrować bez specjalnego wysiłku. Na rysunku 3-13 symbole, które były na rysunku 3-12, zostały przedstawione jako pokryte kleksem, ale teraz całkiem łatwo odczytujemy zdanie: THE WORK MUST GET DONE (PRACA MUSI BYĆ ZAKOŃCZONA). Zauważcie, że ta ilustracja trafia w obie omówione przez nas sprawy. Po pierwsze, odbiór zniekształconych kleksem części litery W pozwala nam teraz łatwiej rozpoznać literę R, tak jak rozpoznanie zakrytej litery R ułatwia nam rozpoznanie W. 165 Każda część tej sekwencji symboli pomaga w odbiorze innych jej części i, choć żadnej z liter nie widzimy dokładnie, to całe słowo możemy dość łatwo odczytać. Mamy tu do czynienia z sekwencją symboli, która nie poddaje się analizie litera po literze, lecz musi być analizowana jako całość. A nawet więcej, percepcji każdej z części pomaga kontekst trzech pozostałych, chociaż żadna z nich oddzielnie nie jest wyraźnie dostrzegana. CECHY A OCZEKIWANIA Dwie rzeczy są wykorzystywane w analizie informacji sensorycznej: cechy sensoryczne i oczekiwania. W większości naszych normalnych doświadczeń cechy i oczekiwania doskonale się uzupełniają, w efekcie tworzy się jednoznaczne spostrzeżenie. 167 Jednak w pewnych sytuacjach brak jednego z dwu wymienionych źródeł powoduje to, że cały obraz musi być interpretowany jedynie na podstawie drugiego. Oglądając ponownie niektóre ilustracje, przedstawione w poprzednich rozdziałach książki, możemy wyraźnie stwierdzić wzajemne współdziałanie informacji dostarczanej z wyodrębniania cech z informacją płynącą z kontekstu oczekiwań. Na rysunku 3-14 przedstawiona została fotografia, którą łatwo można zinterpretować: cechy i oczekiwania pasują do siebie.[Widok z lotu ptaka nadmorskiej miejscowości.] Ale spójrzcie na prosty rysunek 3-15.[Kontury dwóch brył prostopadłościennych połączonych ze sobą] Cechy łatwo można wyróżnić i oczekiwania tak jakby sprawdzały się, ale nie do końca. Staramy się podporządkować nasze spostrzeganie to jednym, to drugim regułom interpretacyjnym, lecz spostrzegany obraz ulega fluktuacji. 168 Jeśli korzystamy tylko z jednego źródła informacji - cech sensorycznych, przy braku oczekiwań, to cale spostrzeżenie nie poddaje się stabilnej interpretacji. Na rysunku 3-16 wyraziście wyłaniają się cechy, ale interpretacja nie jest ograniczona jakimikolwiek barierami, dlatego obraz zmienia się i spostrzegany jest bądź jako zbiór trójkątów, bądź też jako prostokątne rurki skierowane w głąb i rozmieszczone poziomo, pionowo czy jeszcze inaczej. W końcu przypomnijmy sobie obraz przedstawiający cętkowanego psa (rys. 3-17). Tu nie mamy do czynienia z wyraźnymi cechami, a tylko z interpretacją. Wystarczy jednak zwrócić uwagę na zarys psa, a proces syntezy przełoży ciemne i jasne plamy na obraz psa dalmatyńczyka, jednoznacznie i prawidłowo interpretując fotografię. Bez procesu interpretacji obraz byłby całkowicie nieczytelny. Dzięki niej zaś pies jawi się wyraziście i jasno. Aby zrozumieć proces rozpoznawania obrazów, musimy zrozumieć rozliczne i różnorodne etapy analizy informacji. Układy energii oddziaływujące na narządy zmysłowe 169 mogą być interpretowane jako sygnały sensowne tylko w rezultacie równoczesnego włączenia się do analizy sensorycznej procesów pamięci i myślenia. Analiza przez syntezę to taki system rozpoznawania obrazów, który rozpracowuje zadanie równocześnie ze wszystkich możliwych stron. Stara się przełożyć dane sensoryczne na formę przekazu, odpowiadającą temu, co wiemy o otaczającym nas świecie. Bezustannie konstruuje, sprawdza i rewiduje hipotezy o tym, co odbieramy za pomocą zmysłów. Kiedy oczekiwania nie sprawdzają się lub też brak jest kontekstu, system pracuje wolno, zdając się prawie wyłącznie na dane sensoryczne. Operując w znanym i wysoce przewidywalnym świecie, system pracuje szybko i efektywnie, wybierając do analizy tylko te dane, które są niezbędne do potwierdzenia aktualnych oczekiwań i uzupełniając to, czego nie spostrzega zgodnie z regułami swego modelu wewnętrznego. Ponadto, zasady procesu aktywnej syntezy stawiają różne zadania wobec pamięci i funkcji poznawczych. Niezbędna jest krótkotrwała pamięć rejestrująca rezultaty dokonywanej analizy. Do zadań jej będzie należało szybkie i bezbłędne wydobycie potrzebnej informacji z pamięci trwałej. Musi ona być zdolna do pracy z różnymi rodzajami informacji na różnych poziomach analizy w tym samym czasie, tak aby połączyć w całość procesy: sensoryczny, poznawczy i pamięciowy. Jest to niewątpliwie mechanizm skomplikowany, ale takim jest mózg ludzki. Cała jego złożoność jest w pełni niezbędna do wyjaśnienia systemu rozpoznawania obrazów przez człowieka. 4. System wzrokowy ŚWIATŁO DECYBELE DROGA WZROKOWA Źrenica Soczewka Ogniskowanie i konwergencja Siatkówka REAKCJE CHEMICZNE NA ŚWIATŁO Reakcja fotochemiczna NEUROANATOMIA WIDZENIA Sieć nerwowa siatkówki DROGA DO MÓZGU WYBÓR INFORMACJI WZROKOWEJ Ruchy oka Lokalizacja przedmiotów Widzenie bez udziału kory wzrokowej Widzenie bez udziału wzgórków czworaczych górnych 171 Zanim światło dotrze do siatkówki oka, przechodzi przez rogówkę, płyn wodnisty, tęczówkę, soczewkę i ciało szkliste. Każda część oka wykonuje proste zadanie, lecz każda wydaje się mieć wady. Z wielu względów możemy traktować oko jako bardzo dziwny przyrząd optyczny. Niewątpliwie, gdyby jakiś specjalista optyk postanowił zbudować oko, starałby się uniknąć niektórych wad specyficznych dla oka ludzkiego, ponieważ defekty te powodują, że oko nasze jest niedoskonałym i niepewnym narzędziem. Jak to jednak zazwyczaj bywa również z innymi częściami naszego ciała, w końcu okazuje się, że oko to wspaniały instrument, świetnie przystosowany do funkcji, jaką musi wykonywać, bardziej wrażliwy, bardziej elastyczny i bardziej niezawodny niż instrumenty zrobione przez człowieka. ŚWIATŁO [Zalecamy przeczytanie pierwszej części Dodatku A „Mierzenie zmiennych psychologicznych" przed czytaniem tego paragrafu.] Główne cechy charakterystyczne światła to częstotliwość i intensywność. Częstotliwość fali świetlnej to główny czynnik określający spostrzeganą barwę (odcień). Intensywność jest głównym czynnikiem określającym jasność. Widzialne światło stanowi część widma fal elektromagnetycznych. Częstotliwości odpowiadające widzialnej części widma leżą między częstotliwościami fal krótkich, ultrakrótkich i promieniowania infraczerwonego z jednej strony a częstotliwościami promieniowania ultrafioletowego i Roentgena z drugiej strony (rys. 4-1 - wkładka kolorowa). Ponieważ w widzialnej części widma częstotliwości fal elektromagnetycznych są bardzo duże (10 do potęgi 15 herców) [Jeden cykl na sekundę nosi nazwę jednego herca (w skrócie Hz). Nazwa ta wywodzi się od nazwiska niemieckiego fizyka, Heinricha R. Hertza (1857-1894), który wytwarzał i badał fale elektromagnetyczne. Będziemy często używali tej jednostki w rozdziale 6, w którym zajmujemy się systemem słuchowym.], dla ich opisu przyjęto nie ich częstotliwość, lecz długość fali, to znaczy odległość, jaką pokona światło w czasie niezbędnym do osiągnięcia jednego pełnego cyklu. Część widma odpowiadająca światłu widzialnemu zamyka się w przedziale drgań od 400 (widzialnym jako fioletowy) do 700 nanometrów (widzialnym jako czerwony) [Nanometr (nm) jest jedną miliardową metra (10 do potęgi minus 9 m). Czasem we wcześniej wydanych książkach długość fal określana bywa w milimikronach , angstremach lub nawet w calach. Jeden nanometr równa się jednemu milimikronowi, 10 angstremom, lub 40 razy 10 do potęgi minus 9 cala.] Dokładne określenie jednostek amplitudy, intensywności i energii światła zawsze jest zadaniem skomplikowanym. Ponieważ określenia te nie mają dla nas istotnego znaczenia, nie będziemy zatem posługiwać się jednostkami fizycznymi. Rozpiętość intensywności światła oddziałującego na oko jest olbrzymia. Najbardziej intensywne światło, jeszcze ciągle widzialne, a nie wywołujące uczucia bólu, jest milion miliardów razy intensywniejsze, aniżeli najsłabsze widzialne światło (w przybliżeniu rząd 10 do potęgi 16). Aby móc określić bliżej tę rozpiętość, trzeba porównywać dowolne dwa źródła światła, posługując się skalą logarytmiczną (o podstawie 10). Procedura ta po raz pierwszy zastosowana została przez inżynierów akustyków dla określenia siły dźwięków, z tego względu jednostka wyrażająca logarytm stosunku dwu intensywności otrzymała tę samą nazwę zarówno w akustyce, jak i w optyce, na cześć Alexandra Grahama Bella nazwano ją belem. Bel jest zbyt dużą jednostką, wygodniej posługiwać się jednostkami mniejszymi; dlatego stosunek dwu intensywności zazwyczaj określany jest za pomocą dziesiątych części bela - decybela (dB). Liczbowe określenie stosunku dwu intensywności światła I podzielić przez I0 (I ze znaczkiem 0) w decybelach wyraża się 10 log (I podzielić przez I0). 172 Tabela 4-1A Tabela podaje przy jakiej intensywności światła w decybelach, ma miejsce określone zjawisko psychologiczne, a mianowicie: 160 dB – Próg bólowy 140 dB do 120dB – Światło słoneczne pomiędzy 80 dB a 60 dB – Biała kartka w świetle lampy stołowej 60 dB – Ekran telewizora pomiędzy 40 dB a 20 dB – Najsłabsze oświetlenie dla widzenia barw 0 dB – Światło progowe dla oka zaadaptowanego do ciemności Tabela 4-1B Długość fali (nm); Odpowiednik psychologiczny 400; fioletowy 450; niebieski 500; zielony 550; żółtozielony 600; pomarańczowy 700; czerwony DECYBELE 1. Podwajając (lub zmniejszając o połowę) stosunek intensywności sygnałów dodaje się (lub odejmuje) 3 dB. 2. Mnożąc (lub dzieląc) stosunek intensywności sygnałów przez 10 dodaje się (lub odejmuje) 10dB. 3. Jeśli dwa światła różnią się o 10 razy n dB, to stosunek ich intensywności wynosi 10 do potęgi n. Na przykład różnica 60 - dB w intensywności dwu świateł oznacza, że jedno z nich jest 10 do potęgi 6 (1 milion) razy silniejsze niż drugie. Ponieważ decybele odnoszą się do stosunku dwu intensywności, stwierdzenie, że jakiś sygnał ma intensywność 65 dB jest całkowicie pozbawione sensu, chyba że znany jest poziom, z którym dokonujemy porównań. Na ogół, jeśli spotkacie takie określenie, oznacza to, że sygnał jest 65 dB intensywniejszy od standardowego poziomu odniesienia: 10 do potęgi minus 10 lambertów jest liczbą używaną w tej książce jako standard. Jest nim światło o bardzo niskiej intensywności, jest to w przybliżeniu minimalna intensywność światła, jakie może być odebrane przez oko ludzkie. 173 DROGA WZROKOWA Światło wpadając do oka napotyka najpierw zewnętrzną ochronną błonę - rogówkę (rys. 4-2). Właśnie zewnętrzna warstwa rogówki określa moc załamującą optyki oka. Następnie światło przechodzi przez płyn wodnisty (substancja galaretopodobna) wypełniający komorę przednią oka i dalej przez otwór źreniczny w tęczówce. Źrenica Źrenica kontroluje ilość światła przenikającego do oka. Przy bardzo silnym oświetleniu otwór źreniczny kurczy się (chroniąc oko przed nadmiarem światła), a przy słabym świetle rozszerza się (aby wpuścić możliwie najwięcej światła). Zwróćcie uwagę na następujący problem: najbardziej intensywne światło, jeszcze nie wywołujące odczuć bólowych, jest miliardy razy silniejsze od najsłabszego, jeszcze dostrzeganego światła. W porównaniu z tak olbrzymią rozpiętością zmiany otworu źrenicy są bardzo słabo zróżnicowane. Maksymalna średnica źrenicy wynosi 7-8 milimetrów (mm); minimalna zaś około 2-3 mm. Przy największym zwężeniu źrenica przepuszcza około jednej szesnastej tej ilości światła, 174 która dociera do oka w przypadku maksymalnego rozszerzenia źrenicy. Zmiany szerokości otworu źrenicznego zmniejszają intensywność pobudzenia świetlnego oddziałującego na oko około 16 razy (lub około 12 dB). Nie redukuje to jednak w sposób istotny zakresu intensywności padającego na oko światła. Rozpiętość od 10 miliardów do 1 (100 dB) zostaje zredukowana do rozpiętości od 0,6 miliarda do 1 (88 dB), nie czyni to zbyt wielkiej różnicy. Zmiany średnicy tęczówki przebiegają stosunkowo wolno. Przy przejściu od słabego do silnego światła, do pełnego zwężenia źrenicy potrzeba około 5 sekund; (w czasie 1,5 sekundy źrenica zmniejsza się do dwóch trzecich maksymalnej średnicy). Przy przechodzeniu od silnego do słabego światła potrzeba 10 sekund na rozszerzenie się do dwóch trzecich maksymalnej średnicy i aż 5 minut na pełne rozszerzenie. Jasne jest, że źrenica nie reguluje intensywności światła; podstawowa jej funkcja polega na tym, aby przepuścić tylko to światło, które pada na centralne części soczewki, gdzie ogniskowanie jest najbardziej precyzyjne. Zmniejszanie się źrenicy pozwala na uzyskiwanie większej głębi ostrości - największej możliwej w danych warunkach oświetlenia. 175 Stopień rozszerzania się źrenicy jest regulowany tak, aby zachodziła pewna równowaga między maksymalną głębią ostrości (w tym celu otwór musi być minimalny) a stopniem przepuszczenia dostatecznej ilości światła do siatkówki (w tym celu otwór powinien być maksymalnie szeroki). Trzeba zaznaczyć, że rozmiary źrenicy odzwierciedlają również stan układu nerwowego. Przy zmianach stanów emocjonalnych, w czasie myślenia - i rozwiązywania problemów, wielkość otworu źrenicznego zmienia się. Dla różnych celów prowadzono pomiary zmian wielkości źrenicy w badaniach nad rozwiązywaniem trudnych problemów przez człowieka, jak też przy różnorodnych reakcjach emocjonalnych. Soczewka Z kolei na drodze światła leży soczewka. Podstawową jej funkcją jest oczywiście ogniskowanie światła płynącego z przedmiotu zewnętrznego na światłoczułych receptorach leżących na dnie oka. Trzeba obiektywnie stwierdzić, że te biologiczne soczewki nie są najwyższej jakości. Soczewka składa się z pewnej liczby cienkich słojów przezroczystej tkanki, rozmieszczonych podobnie jak warstwy cebuli. Ogniskowanie odbywa się w wyniku zmian w wypukłości soczewki (tzn. zmian długości ogniskowej). Zmiany wypukłości zachodzą w efekcie pracy specjalnych mięśni, które są przymocowane do otaczającej soczewkę błony, tzw. torebki. Soczewka powoduje wiele zniekształceń. Promienie światła przechodzące przez jej części peryferyczne załamują się silniej niż promienie przechodzące przez część centralną; w tej sytuacji obraz ulega zniekształceniu - zjawisko to zwane jest aberracją sferyczną. Światło barwne, przechodząc przez soczewkę, też załamuje się w sposób zróżnicowany; występujące przy tym zjawisko zniekształcenia obrazu nosi nazwę aberracji chromatycznej. Ponadto soczewka stopniowo traci swoje właściwości w miarę starzenia się. Sprawa polega na tym, że wszystkie żywe komórki muszą być stale zasilane substancją odżywczą, którą otrzymują wraz z krwią. Tymczasem soczewka nie ma naczyń krwionośnych, ponieważ ich obecność zmniejszyłaby jej przezroczystość; dlatego tkanki soczewki pobierają substancję odżywczą zawartą w otaczającym ją płynie. W rezultacie wewnętrzne warstwy soczewki odżywiają się w niewystarczającej mierze i wraz z wiekiem stopniowo tracą swe główne właściwości: przezroczystość i elastyczność. Z wiekiem soczewka funkcjonuje coraz gorzej, zwłaszcza obniża się jej zdolność ogniskowania. Ogniskowanie i konwergencja. Aby zbadać, jak przebiega ogniskowanie, weźcie ołówek i trzymając go w wyciągniętej ręce skupcie na nim wzrok. Teraz stopniowo zbliżajcie go do nosa nie odrywając od niego oczu. Kiedy już ołówek znajdzie się na kilka centymetrów od nosa, jego kontury zaczną się rozpływać i wyraźnie odczujecie napięcie mięśni oczu. W miarę zbliżania ołówka zachodzą dwa zjawiska: jedna grupa mięśni zapewnia kierowanie obu osi wzrokowych na przedmiot (konwergencja); druga grupa mięśni bezustannie zwiększa krzywiznę soczewek obu oczu, wskutek czego promienie światła załamują się w każdym oku coraz bardziej 176 i obraz ołówka na siatkówce pozostaje wyraźny w czasie jego zbliżania się do oka (rys. 4-3). Kiedy ołówek oddalamy od oczu, obie grupy mięśni rozluźniają się, soczewka ponownie powraca do swego wydłużonego kształtu i gałki oczne obracają się na zewnątrz aż do momentu, kiedy ich osie wzrokowe staną się równoległe. Wraz z wiekiem słabnie zdolność do zwiększania krzywizny soczewki i dlatego dla starszych ludzi niezbędne są sztuczne soczewki (okulary) w celu ogniskowania promieni świetlnych na blisko położonych przedmiotach. Jest również inny sposób pozwalający na odczucie działania własnych mięśni oczu. Potrzymajcie palec w odległości około 15 centymetrów od oczu, a następnie przenieście wzrok na jakikolwiek oddalony przedmiot, umieszczony na tym samym poziomie, ale nieco wyżej od palca (im dalej będzie znajdował się ten przedmiot, tym lepiej). 177 Odczujecie wyraźną różnicę między stanem mięśni oczu przy przenoszeniu wzroku z przedmiotów dalszych na bliższe (aktywne ściągnięcie mięśni oczu zawiadujących konwergencją i akomodacją) i przy przenoszeniu wzroku z przedmiotu bliższego na dalszy (rozluźnienie odpowiednich mięśni). U człowieka stopień załamywania promieni przez soczewkę zmienia się dzięki zmianom jej grubości. Zarówno w aparacie fotograficznym, jak i w innych urządzeniach, a nawet i u niektórych zwierząt, np. u ryb, ogniskowanie następuje w drodze zmiany odległości między soczewką a powierzchnią światłoczułą, nie zaś w wyniku zmiany grubości soczewki. Mechanizm akomodacji oka ludzkiego ciągle stanowi dla nas tajemnicę. Nie wiadomo, jak oko reguluje ostrość widzenia przedmiotu. Możliwe, że mechanizm akomodacji oka polega na uzyskaniu ostrości widzenia przez utrzymanie maksymalnego kontrastu występującego w obrazie na siatkówce. 178 Wiadomo, że komórki nerwowe wrażliwe na kontury wytwarzają maksymalną reakcję na wyraźnie zogniskowany obraz (detektory krawędzi, detektory szczeliny i detektory linii). Zmiana krzywizny soczewki jest procesem automatycznym i mimowolnym, ale możliwa jest również świadoma zmiana akomodacji oka. Można nawet zmienić ogniskowanie oczu tak, że żaden przedmiot leżący na osi widzenia nie będzie wyraźnie widoczny. Tak dowolna regulacja byłaby niemożliwa w wypadku, gdyby mechanizm akomodacji oka był w pełni zautomatyzowany i niezależny od wyższych ośrodków nerwowych. Siatkówka Na koniec, po przejściu przez soczewkę oraz znajdującą się wewnątrz oka galaretowatą substancje (ciało szkliste), światło pada na siatkówkę, część oka odpowiedzialną za przekształcenia obrazu świetlnego w reakcje fizjologiczne. Jeszcze i tu światło natrafia na pewne utrudnienia. Siatkówka pokrywa wklęsłą wewnętrzną powierzchnię oka (dno oka), a jej elementy światłoczułe zwrócone są w kierunku przeciwnym do płynącego światła, tzn. zwrócone są do mózgu (rys. 4-4). Włókna nerwowe odchodzące od fotoreceptorów leżą w postaci bezładnie splątanej masy na drodze padającego światła. Ponadto włókna te znajdują się wewnątrz oka i aby się zeń mogły wydostać, musi istnieć otwór w tylnej części powierzchni oka-jest to tzw. plamka ślepa. REAKCJE CHEMICZNE NA ŚWIATŁO Jedna z pierwszych i przy tym najbardziej obrazowych demonstracji reakcji fotochemicznych oka otrzymała nazwę „optigramu". Zwierzę (np. żabę) trzymano w zupełnej ciemności przez kilka godzin, następnie zaś oświetlono je bardzo silnym światłem i od razu zabito, siatkówkę po wypreparowaniu z oka umieszczono w specjalnym roztworze o właściwościach utrwalających. W efekcie można zobaczyć reakcje fotochemiczne, jakie zaszły w siatkówce żaby w ostatniej chwili jej życia; to, co zwierzę zobaczyło, zostało utrwalone na siatkówce w jaskrawych żółto-czerwonych barwach. Eksperymenty te pobudziły wyobraźnię różnych pisarzy, którzy zaczęli pisać o mordercach wykrytych dzięki optigramom utrwalonym w oczach ich ofiar. Procesy fotochemiczne stanowią pierwszą reakcję oka na sygnał wzrokowy. W wyniku długotrwałego przebywania w ciemności siatkówka przybiera czerwono-purpurową barwę. Ze względu na tę charakterystyczną barwę, pigment znajdujący się w siatkówce otrzymał nazwę purpury wzrokowej. Jako reakcja na bodziec świetlny zmienia się barwa siatkówki: początkowo staje się ona bladożółta, a następnie blaknie stając się przezroczysta i bezbarwna. U zwierząt i ptaków żerujących nocą zawartość purpury wzrokowej w siatkówce jest zazwyczaj wyższa niż u zwierząt dziennych. Być może, jest to właściwe wyjaśnienie ich 179 doskonałych zdolności do widzenia w ciemnościach. U gadów, ptaków dziennych i różnych gatunków ryb również istnieje substancja światłoczuła, która staje się bezbarwna pod wpływem światła, ale różni się ona nieco od purpury wzrokowej swoją wrażliwością na światło o różnej długości fal. Podstawowa metoda pozwalająca na opisanie tych reakcji chemicznych polega na mierzeniu stopnia blaknięcia siatkówki przy świetle o stałej intensywności i zmiennej długości fali. Rezultat uzyskany w wyniku takich pomiarów nazwany jest widmem absorpcji substancji fotochemicznej. Reakcja fotochemiczna Reakcja fotochemiczna zachodząca w oku jest dziś dobrze znana. W ciemności następuje koncentracja w siatkówce znacznej ilości rodopsyny (nazwa chemiczna purpury wzrokowej). Pod wpływem światła rodopsyna przechodzi szereg zmian, w rezultacie których tworzy się substancja zwana retinene, przy długotrwałym oddziaływaniu światła wytwarza się końcowy produkt tych przekształceń -witamina A. Retinene nadaje siatkówce żółty kolor częściowo rozłożonego pigmentu. Przewaga witaminy A po długotrwałej ekspozycji światła powoduje, że siatkówka staje się bezbarwna. Logika dyktuje, że powinny istnieć mechanizmy powodujące syntezę i regenerację substancji światłoczułych w oku. Synteza rodopsyny dokonuje się dwoma sposobami. Pierwszy to stosunkowo szybkie odnowienie zawartości rodopsyny przez połączenie retinene i opsiny - produktów tworzących się przy częściowym rozkładzie rodopsyny. Drugi, znacznie wolniejszy proces odnowienia rodopsyny, to uzyskanie jej z końcowego produktu jej przekształcania, jakim jest witamina A. [Rola witaminy A w procesach fotochemicznych może prowadzić do przekonania, że jedzenie marchwi (bogatej w witaminę A) jest dobre dla oczu. W czasie II Wojny Światowej, podczas bitwy o Anglię, krążyły plotki, że lotnicy brytyjscy otrzymują specjalny wyciąg witaminowy, który nadzwyczaj poprawia ich widzenie nocne. W gruncie rzeczy rozpowszechnianie tej plotki było próbą zachowania w tajemnicy wynalazku radaru. W istocie witamina A przyjmowana w nadmiarze w stosunku do niewielkiej ilości, jaka jest potrzebna dziennie, nie przynosi żadnego pożytku. Na pewno nie poprawia wzroku.] Reakcje chemiczne w znacznym stopniu określają ogólne cechy wrażliwości wzrokowej. Ale niestety związek między wrażliwością wzrokową a zachodzącymi w receptorach siatkówki reakcjami fotochemicznymi nie jest wcale taki prosty. W naturalnych warunkach świetlnych tylko nieznaczna część rodopsyny ulega wyblaknięciu. A do tego wybielenie tylko 2 procent rodopsyny powoduje 50-krotne obniżenie wrażliwości siatkówki. Znaczne i wytrwałe wysiłki zmierzające do ustalenia rzeczywistej natury związku między reakcją fotochemiczną zachodzącą w siatkówce a pojawieniem się impulsów elektrycznych we włóknach nerwowych nie przyniosły jak dotąd rezultatów. Pytanie, w jaki sposób reakcje chemiczne wywołują impulsy nerwowe, niosące sygnał wzrokowy do mózgu, pozostaje nadal bez odpowiedzi. 180 NEUROANATOMIA WIDZENIA Siatkówka nie stanowi jednolitej powierzchni pokrytej materiałem światłoczułym. Składa się z bardzo dużej liczby oddzielnych elementów światłoczułych, czyli receptorów, każdy z nich reaguje na energię świetlną niezależnie od drugiego. Zarówno u człowieka, jak i u małpy występują dwa typy elementów światłoczułych: pręciki i czopki (rys. 4-5). U innych zwierząt występują albo pręciki, albo czopki. Gołębie mają tylko czopki, a koty prawie wyłącznie pręciki. Oprócz różnic morfologicznych, które były podstawą podziału fotoreceptorów na dwa typy, pręciki i czopki, różnią się one również ze względu na pełnione funkcje. W istocie oko posiada dwa oddzielne systemy wzrokowe. Każdy z nich charakteryzuje się specyficznymi właściwościami reakcji. Purpura wzrokowa – rodopsyna - znajduje się tylko w pręcikach, nie ma jej w czopkach. Czopki zawierają różnorodne substancje fotochemiczne, niezbędne do widzenia barw. Pręcik jest prawie 500 razy wrażliwszy na światło niż czopek, ale z kolei nie potrafi on reagować w sposób zróżnicowany na barwy. Oprócz tych różnic funkcjonalnych istnieje ponadto różnica w organizacji dróg nerwowych, po których informacja od pręcików i czopków dochodzi do mózgu. 181 W oku ludzkim znajduje się w przybliżeniu 6 milionów czopków, i około 120 milionów pręcików-w sumie około 125 milionów receptorów. Jest to nadzwyczaj bogate zagęszczenie receptorów. Dla porównania dodajmy, że obraz na ekranie telewizora składa się jedynie z 250 tysięcy niezależnych elementów. Największe zagęszczenie komórek światłoczułych występuje w środkowej części siatkówki i maleje w częściach peryferycznych (rys. 4-6). [Rysunek przedstawia przekrój gałki prawego oka. Do opisu posłużę się tarczą zegara. Oś widzenia przebiega na linii 12.00 – 6.00, przy czym źrenica znajduje się na 12.00, natomiast dołek środkowy (plamka żółta) a tym samym kąt zerowy na 6.00. Wyjście nerwu wzrokowego, czyli miejsce tzw. plamki ślepej znajduje się miedzy 5.00 a 6.00. Na rysunku zaznaczono na siatkówce pod jakim kątem pada światło na poszczególne receptory. I tak na godzinie 5.00 i 7.00 mamy kąt 20 stopni, na 4.00 i 8.00 – kąt 40 stopni, na 3.00 i 9.00 – kąt 60 stopni oraz na 2.00 i 10.00 – kąt 80 stopni. Wykres poniżej przedstawia liczbę receptorów na jeden mm kwadratowy w zależności od kąta wyrażonego w stopniach.] Pręciki i czopki rozmieszczone są w siatkówce niezbyt równomiernie: pręcików jest więcej na peryferiach, a czopków w centrum. W samym środku siatkówki znajduje się małe wgłębienie, składające się wyłącznie z czopków, nosi ono nazwę plamki żółtej. Zagęszczenie czopków w plamce żółtej osiąga 150 tysięcy na milimetr kwadratowy. Jest ona tak położona, że pada na nią część centralna obrazu, na który oko patrzy. Plamka żółta jest zarazem miejscem o największej ostrości widzenia. Chociaż znaczna część fotoreceptorów nie ma bezpośredniego połączenia z mózgiem, to pojedyncze elementy plamki żółtej związane są z wyższymi ośrodkami nerwowymi własnym systemem połączeń. 182 Tak więc dwoje ludzkich oczu gromadzi informacje napływające ze środowiska widzianego za pomocą 250 milionów receptorów i przesyła je do mózgu przez około 1 ,6 miliona włókien nerwowych. Dwa różnorodne typy receptorów uzupełniają się wzajemnie. System czopków charakteryzuje się wysoką zdolnością do wyławiania informacji dotyczącej barwy, ale wrażliwość jego jest ograniczona. System pręcików jest bardzo wrażliwy na światło, ale jego zdolności różnicujące są niewielkie i nie jest wrażliwy na barwę. Działając równocześnie, pręciki i czopki tworzą nadzwyczaj elastyczny i potężny system, który spełnia podstawową funkcję wzroku - reaguje na sygnały świetlne docierające ze środowiska. Sieć nerwowa siatkówki Przetwarzanie informacji wzrokowych zaczyna się w receptorach siatkówki. W rozdziale 2 rozpatrywaliśmy niektóre operacje zachodzące w siatkówce. Ze względu na budowę anatomiczną siatkówki możemy wydzielić w niej dwa typy organizacji dróg nerwowych: organizację pionową, dzięki której sygnały przekazywane są od receptorów do mózgu, i organizację poziomą, odpowiadającą za różnego typu interakcje między sąsiadującymi komórkami receptorów (rys. 4-7 i 4-8). W przekazywaniu sygnałów od receptorów do mózgu uczestniczą różne typy komórek. Z pręcików i czopków sygnał przechodzi siecią pionową poprzez dwie synapsy: pierwsza z nich leży między samym receptorem a komórką dwubiegunową, druga-między komórką dwubiegunową a komórką zwojową. Aksony komórek zwojowych tworzą pień nerwu wzrokowego, wychodzącego z oka. W tym samym czasie dokonuje się przetwarzanie sygnału w sieci organizacji poziomej siatkówki, przede wszystkim za pośrednictwem komórek, które noszą miano komórek poziomych. Komórki te tworzą połączenia między receptorami i w ten sposób modyfikują aktywność na poziomie przejścia sygnału z receptorów do komórek dwubiegunowych. Ponadto, na nieco wyższym poziomie proces przetwarzania sygnału zachodzi w komórkach amakrynowych. Komórki amakrynowe modyfikują aktywność w trakcie przechodzenia sygnału od komórek dwubiegunowych do zwojowych. Te dwie warstwy połączeń poziomych stanowią podłoże anatomiczne obwodów nerwowych siatkówki. Zagęszczenie połączeń poziomych nie jest równomierne w całej siatkówce. Na jej krańcach jedna komórka zwojowa otrzymuje informacje od znacznej liczby (czasem od wielu tysięcy) pręcików. W środku siatkówki, w obrębie plamki żółtej, pojedynczy czopek może poprzez oddzielną komórkę dwubiegunową łączyć się z pojedynczą komórką zwojową, nie wchodząc przy tym w jakiekolwiek interakcje z sąsiadującymi jednostkami. Takie bezpośrednie połączenia tworzone są przez komórki o małych rozmiarach - tzw. karłowate komórki dwubiegunowe i karłowate komórki zwojowe. Na ogół dana komórka zwojowa połączona jest albo wyłącznie z pręcikami, albo też wyłącznie z czopkami, ale zdarzają się również i w tym względzie wyjątki. 185 DROGA DO MÓZGU Każda komórka siatkówki łączy się z nerwem wzrokowym za pomocą jednego włókna; tak więc ogólna liczba tych włókien w nerwie wzrokowym sięga około 800 tysięcy, co daje w efekcie wiązkę grubości ołówka. U człowieka oraz u wielu wyżej rozwiniętych ssaków część włókien nerwu wzrokowego idących od każdego oka krzyżuje się, miejsce tego skrzyżowania nosi nazwę skrzyżowania wzrokowego (chiasma optica). [Chiasma jest podobna z wyglądu do litery greckiej (Chi), stąd nazwa]. U człowieka wszystkie włókna z lewej połowy siatkówek obu oczu kierują się do lewej półkuli mózgu, a wszystkie włókna z prawej polowy do prawej półkuli. W skrzyżowaniu wzrokowym nie następuje przerwanie dróg nerwowych ani nie pojawiają się nowe połączenia synaptyczne. Jak pokazano na rysunkach 4-9, 4-10 i 4-11, w wyniku przegrupowania włókien nerwów wzrokowych pole widzenia rozpada się na dwie połowy. Lewa część pola widzenia znajduje się w prawej półkuli mózgu, a prawa część-w lewej półkuli. (Pionowa granica między obydwiema połowami pola widzenia przechodzi przez punkt fiksacji. Należy również pamiętać o tym, że soczewki odwracają obraz: przedmiot znajdujący się z lewej strony punktu fiksacji zostanie odbity na prawej połowie siatkówki, od której to sygnał przejdzie następnie do prawej półkuli mózgu.) [Rysunek 4-9 służy do przeprowadzenia eksperymentu z plamką ślepą. Symetrycznie po prawej i po lewej stronie kartki narysowano czarne koła o średnicy 1 cm. W środku kartki między kołami zaznaczono punkt fiksacji. Po lewej stronie kartki znajduje się plamka ślepa dla lewego oka; wszystko, co oko widzi po tej stronie pola widzenia, kieruje się do prawej połowy siatkówki i do prawej półkuli mózgu. Po prawej stronie kartki znajduje się plamka ślepa dla prawego oka; wszystko, co oko widzi po tej stronie pola widzenia, kieruje się do lewej połowy siatkówki i do lewej półkuli mózgu.] Instrukcja: Zamknijcie prawe oko. Trzymajcie rysunek na wysokości oczu w odległości ok. 20 cm. Stronica powinna być ustawiona pionowo. Wpatrujcie się w punkt fiksacji. Dopasowujcie kąt patrzenia i odległość stronicy tak długo aż zniknie plamka ślepa dla lewego oka. • Otwórzcie prawe oko-plamka ślepa pojawi się ponownie (w dalszym ciągu wpatrujcie się w punkt fiksacji) • Zamknijcie lewe oko-plamka ślepa dla prawego oka powinna zniknąć. (Może być tu potrzebne ponowne dopasowanie stronicy). • Kiedy odnajdziecie plamkę ślepą, prowadźcie ołówek wzdłuż stronicy w kierunku plamki, obserwujcie, jak znika koniec ołówka. (Pamiętajcie, że jedno oko musi być zamknięte). WYBÓR INFORMACJI WZROKOWEJ Podstawowa część pracy związanej z wydobywaniem informacji wzrokowej dotyczy tej części obrazu, która leży w środku siatkówki-w rejonie plamki żółtej. Tam skoncentrowana jest większość czopków, jak to pokazano na rysunku 4-6. W korze wzrokowej ponad 50 procent neuronów zajmuje się analizą informacji napływającej z części odpowiadającej zaledwie 10 procent pola widzenia, z jego części centralnej. Peryferyczna część oka, bardziej wrażliwa na światło niż jego część centralna, nie jest nawet w przybliżeniu tak wrażliwa na subtelne szczegóły obrazu ani też na informacje o barwie, jak właśnie plamka żółta. Taka struktura organizacji siatkówki ma szereg oczywistych zalet. System rozpoznawania obrazów powinien jednak dysponować możliwością przenoszenia wzroku z jednej części pola widzenia na drugą, ponieważ w przeciwnym razie jedynie niewielka część jego pola może podlegać subtelnej analizie. Ruchy oka Oczy poruszają się nieustannie badając kolejno różne części pola widzenia. Ruchy gałek ocznych polegają na szeregu prawie niedostrzegalnych skoków lub też „sakkad" (saccades), które na ogół występują od 4 do 5 razy na sekundę. Ten ruch skokowy (sakkadowy) występuje dzięki aktywności zewnętrznych mięśni oka (jest ich 6), one to powodują szybkie zmiany położenia gałki ocznej. U człowieka ruchy oczu występują nie częściej jak 4 do 5 razy na sekundę. Ponadto ruch sakkadowy, jeżeli już się rozpocznie, jest kontynuowany bez jakichkolwiek poprawek aż do momentu osiągnięcia pożądanego położenia: podobny ruch w mechanice nazywany jest ruchem balistycznym. Nie jest on z pewnością podobny do ruchu ręki, która sięga po ołówek leżący na stole, w tym bowiem wypadku ruch jest nieustannie korygowany aż do momentu, kiedy palce uchwycą właściwy przedmiot. Ruch balistyczny przypomina lot piłki: w momencie, kiedy piłka odrywa się od ręki, nie ma ona już żadnego wpływu na jej dalszy lot. Mechanizmy nerwowe stosowane do „obliczania" i kontroli położenia oka nie zostały jeszcze dostatecznie poznane. Ostatnie ogniwa w łańcuchu działań prowadzących do ruchu oczu związane są zapewne z przednimi obszarami kory mózgowej -z czołowymi polami wzrokowymi. W wyniku stymulacji tych okolic kory za pomocą elektrody pojawiają się skokowe (sakkadowe) ruchy oczu, przy czym kierunek i amplituda tych ruchów zależy od miejsca przyłożenia elektrody. Na ogół stymulacja lewej półkuli powoduje ruchy sakkadowe oczu w prawą stronę, a przy podrażnieniu prawej półkuli - ruchy w lewo. Jeżeli natomiast równocześnie stymulujemy obie półkule, to rezultat jest kompromisowy: kierunek i zasięg ruchu zależy od względnej intensywności podrażnienia obu półkul. Mechanizmy odpowiedzialne za „obliczanie" kierunku i amplitudy ruchu na podstawie 189 analizy obrazu wzrokowego nie są znane. W niektórych wypadkach ruchy sakkadowe z pewnością są dokonywane automatycznie. Na przykład, kiedy ruch pojawia się w peryferycznej części pola widzenia, często występuje mimowolny ruch sakkadowy skierowany w stronę źródła ruchu. W większości wypadków jednak rodzaj ruchów oczu jest odzwierciedleniem systematycznego pobierania informacji z otoczenia, bazującego na interpretacji znaczenia napływających danych sensorycznych. Nawet w czasie snu występują ruchy sakkadowe oczu. W ciągu wielu lat ruchy te uważane były za główny wskaźnik występowania marzeń sennych. Lokalizacja przedmiotów Chociaż proces związany z określeniem lokalizacji przedmiotów będących w polu widzenia ciągle jeszcze nie jest dostatecznie zbadany, to jednak uzyskane stosunkowo niedawno dane pozwalają na przyjęcie założenia, że proces ten przebiega w kanale odrębnym od kanału rozpoznawania obrazów. Z reguły operacje niezbędne do zlokalizowania przedmiotu w polu widzenia świetnie współdziałają z operacjami niezbędnymi do jego rozpoznania. Jednakże analiza, której celem jest określenie, gdzie znajduje się dany przedmiot, musi w pewnym stopniu różnić się od analizy mającej określić, czym jest dana rzecz. W procesie identyfikowania obrazu wzrokowego przedmiotu (czy to będzie krzesło, czy człowiek), dokładne określenie kierunku przedmiotu, jego odległości czy też jego umiejscowienie w polu widzenia nie ma większego znaczenia. Idealny system rozpoznawania obrazów powinien ignorować te sprawy, koncentrując się jedynie na tych właściwościach, które są ważne ze względu na identyfikację przedmiotu - krzesła (czy człowieka). Dla lokalizacji przedmiotu nie jest istotna jego uprzednia identyfikacja; ważne jest bowiem tylko jego położenie w polu widzenia oraz ukierunkowanie. Czy zatem te niewątpliwie różne analizy dokonują się w dwu różnych kanałach nerwowych? Sądząc po budowie anatomicznej systemu wzrokowego jest to możliwe. Część włókien nerwu wzrokowego oddziela się od ogólnej masy i odchodzi nie do ciał kolankowatych bocznych, lecz do ośrodka mózgowego, zwanego wzgórkami czworaczymi górnymi (superior colliculus)-rysunki 4-12a i 4-12b. Analogicznie jak w ciałach kolankowatych bocznych i korze wzrokowej zakończenia włókien wychodzących z sąsiadujących części siatkówki trafiają do sąsiadujących ze sobą części wzgórków czworaczych górnych, w ten sposób przestrzenna projekcja siatkówki i tu pozostaje utrzymana. W odróżnieniu od kory wzrokowej we wzgórkach czworaczych górnych obszar plamki żółtej nie ma oddzielnej reprezentacji. Włókna wychodzące ze wzgórków czworaczych górnych kierują się do systemu kontrolującego ruchy oczu, położenie głowy oraz zmiany pozycji ciała. Mamy także pewne dowody na to, że do wzgórków czworaczych dochodzą również sygnały ze wzrokowych pól odbiorczych kory. Anatomiczna organizacja połączeń wzgórków czworaczych z systemem wzrokowym pozwala przypuszczać, że ten właśnie kanał zajmuje się lokalizowaniem przedmiotów w otoczeniu. 190 Jednakże oprócz dowodów anatomicznych istnieją inne bardziej przekonywające dowody. Kiedy podrażnimy elektrodami neurony wchodzące w skład rozpatrywanego kanału nerwowego, to u czuwającego zwierzęcia pojawią się ruchy głowy i zmiany pozycji ciała. Podczas drażnienia neuronów związanych z odpowiednimi częściami pola widzenia, pozycja ciała zwierzęcia zmienia się w taki sposób, że ustawia się ono właśnie w tę stronę, gdzie powinien znajdować się przedmiot wówczas, gdyby aktywność była wywołana przez normalny bodziec wzrokowy. [Pewne najnowsze dane wskazują, że wzgórek czworaczy łączy informacje zarówno o ruchu, jak i o położeniu. Ponadto komórki wrażliwe na stymulację słuchową zostały ostatnio odkryte we wzrokowych partiach wzgórka. Oznaczałoby to, że gdy ośrodek lokalizacji przedmiotów gromadzi informacje pochodzące od różnych modalności zmysłowych, to informacja o ruchu jest ściśle powiązana z informacją o położeniu, tak więc wzgórek czworaczy wydaje się odpowiednim miejscem do dokonywania łącznej ich analizy.] 191 Ilekroć uda się zidentyfikować strukturę nerwową związaną z określoną funkcją, przed eksperymentatorem otwierają się nowe możliwości. Co się zdarzy w procesie widzenia, kiedy uszkodzony zostanie jeden z dwu głównych kanałów wzrokowych? Rozpatrzmy najpierw skutki uszkodzenia kanału, który, jak się przypuszcza, zajmuje się głównie rozpoznawaniem obrazów. Widzenie bez udziału kory wzrokowej Kanał nerwowy związany z rozpoznawaniem obrazów możemy uszkodzić usuwając chirurgicznie korę wzrokową (cortical ablation). U kotów i u małp usunięcie kory wzrokowej wywołuje skutek, który w pierwszej chwili nie da się odróżnić od zupełnej ślepoty. Zwierzę traci zdolność widzenia przedmiotów z otoczenia, jak też zdolność do wzrokowo-motorycznej koordynacji i wyuczenia się wykonywania jakiegokolwiek lania wymagającego odróżniania sygnałów wzrokowych. Jednakże po dokładnym sprawdzeniu okazuje się, 192 że pewne szczątkowe zdolności widzenia utrzymują się. Zwierzę pozbawione kory wzrokowej może nauczyć się odróżniać przedmioty na podstawie różnic jasności, a być może też i wielkości. Ostatnio stwierdzono również, że małpy pozbawione kory wzrokowej zdolne są w pewnym stopniu do wzrokowego lokalizowania przedmiotów. Istotny przy tym okazał się czynnik ruchu. Jeżeli eksperymentator trzyma w ręku jakiś łakomy kąsek, na przykład orzech, małpa początkowo go nie zauważa, ale kiedy tylko eksperymentator zaczyna poruszać ręką, małpa sięga po orzech, wybierając właściwy kierunek. Popełnia jednak przy tym pomyłkę w ocenie głębi i nie może wyuczyć się rozwiązywania zadań polegających na wzrokowym różnicowaniu obrazów. Po uszkodzeniu kanału odpowiedzialnego za rozpoznawanie obrazów utrzymana zostaje w pewnym stopniu zdolność do lokalizowania. Ponieważ w czasie tej operacji wzgórki czworacze górne pozostają nienaruszone, możliwe jest, że właśnie te struktury przetwarzają informacje o położeniu przedmiotów. Aby to udowodnić, należałoby uszkodzić wzgórki czworacze, a następnie sprawdzić zdolność zwierzęcia do lokalizowania. Jeżeli oba te kanały funkcjonują niezależnie, to zdolność do rozpoznawania obrazów powinna pozostać nadal, a zdolność do lokalizowania ulegnie poważnemu zaburzeniu. Widzenie bez udziału wzgórków czworaczych górnych W tym wypadku zwierzęciem eksperymentalnym był chomik, u którego oba kanały, korowy i związany ze wzgórkami czworaczymi, są tak anatomicznie podzielone, że wygodnie jest dokonywać operacji. Po uszkodzeniu wzgórków czworaczych chomik całkowicie traci zdolność do lokalizowania przedmiotów. Kiedy podaje się mu pokarm (na przykład ziarna słonecznika), nie potrafi wykonać reakcji niezbędnych do tego, aby go osiągnąć. Ta niezdolność do lokalizowania jest, być może, następstwem niezdolności do rozpoznawania obrazów. Być może zwierzę po prostu nie rozpoznaje pokarmu? Eksperymentator natrafia tu na problem „łamigłówkę". Przeprowadzając standardowe badania eksperymentalne, stwierdzamy, że chomik nie może wyuczyć się odróżniania prostych obrazów wzrokowych. Na przykład, jeżeli stawia się go w sytuacji, w której musi rozróżniać dwa wzory rozmieszczone na końcach dwu korytarzy, z których tylko jeden prowadzi do pokarmu, chomik nie może wyuczyć się wybierania wzoru właściwego. Chomiki nie poddane operacji łatwo radzą sobie z tym zadaniem, szybko uczą się wybierać właściwy wzór i zawsze, kiedy znajdą się w skrzynce eksperymentalnej, otrzymują nagrodę w postaci jedzenia (rys. 4-13). [Chomik znajduje się w pudełku z którego wyjść można przez uchylne drzwiczki pomalowane w paski. Obok znajdują się drzwiczki, pomalowane w kropki, ale te nie dają się otworzyć. PROCEDURA EKSPERYMENTU Chomik idzie w dół dwu sąsiadujących drzwi, sporządzonych z pleksiglasu; na jednych drzwiach znajduje się wzór z czarnych kropek, a na drugich z czarnych pasów. Jedne drzwi otworzą się pod naciskiem, drugie pozostaną zamknięte. Za drzwiami znajduje się nagroda w postaci wody Chomiki z uszkodzonym wzgórkiem czworaczym górnym potrafią sobie poradzić z zadaniem polegającym na rozpoznaniu wzorów i wybierają właściwe drzwi, jeżeli stworzy się im warunki dotarcia do nich bez posługiwania się wzrokiem. Zwierzęta z uszkodzoną korą wzrokową nie są w stanie odróżnić wzoru w kropki od wzoru w pasy.] Zastanówcie się jednak nad samym zadaniem. Aby je rozwiązać, chomik musi rozpoznać właściwy wzór, a następnie zlokalizować go prawidłowo w przestrzeni. Wystarczy zaplanować zadanie tak, aby odpadła potrzeba lokalizowania, a uzyskamy inny rezultat. Zachowanie chomika ulegnie krańcowej zmianie. Posuwając się wzdłuż ściany skrzynki, chomik dotrze do pierwszych drzwi, na których wyrysowano jeden z wzorów. Wtedy staje na tylnych łapach i najwyraźniej bada wzór. Potem przechodzi przez drzwiczki 193 albo też ponownie idzie wzdłuż ściany aż dotrze do następnych drzwi, gdzie powtarza się cała czynność. Jeżeli chomik nie wejdzie w następne drzwiczki, to może kontynuować spacer wzdłuż ściany i obejdzie w ten sposób całą skrzynkę aż wróci do pierwszych drzwiczek i wszystko zaczyna od nowa. Eksperyment ten ilustruje różnicę między zdolnością lokalizowania a zdolnością rozpoznawania. [Por. G. E. Schneider (1969) w celu zapoznania się. ze szczegółami tego eksperymentu.] Niewiele jest jeszcze badań eksperymentalnych w tej dziedzinie i nie znamy szczegółów o pracy systemu regulującego lokalizację sygnału wzrokowego w przestrzeni. Uzyskane do tej pory rezultaty potwierdzają hipotezę o istnieniu dwu oddzielnych systemów: jeden przetwarza informacje, by odpowiedzieć na pytanie, gdzie znajduje się przedmiot, a drugi-na pytanie, czym on jest. W normalnych warunkach systemy te nie mogą funkcjonować niezależnie od siebie. Łącznie bowiem oba te kanały tworzą silny i niezawodny aparat do pobierania i analizowania informacji wzrokowej. 5. Podstawowe właściwości widzenia SPOSTRZEGANIE JASNOŚCI Pasy Macha Kontrast jasności JASNOŚĆ A GŁĘBIA ADAPTACJA Warstwice równej jasności WŁAŚCIWOŚCI WIDZENIA ZWIĄZANE Z CZASEM Czas integracji Kiedy migające światło wydaje się ciągłe? Krytyczna częstotliwość migotania BARWA MIESZANIE BARW Koło barw Mieszanie dwu świateł Mieszanie trzech świateł BARWNIKI I ŚWIATŁA Obrazy następcze WRAŻLIWOŚĆ CZOPKÓW NA BARWY Teoria widzenia barwnego oparta na procesach przeciwstawnych Kontrast indukowany 195 SPOSTRZEGANIE JASNOŚCI Obraz wzrokowy występujący w określonej części siatkówki wpływa również na spostrzeganie obrazu umiejscowionego w sąsiedztwie. Poziome połączenia nerwowe łączące receptory siatkówki poprzez komórki horyzontalne i amakrynowe powodują współdziałanie sąsiadujących części siatkówki. Interakcja ta odgrywa bardzo istotną rolę w procesie przetwarzania informacji wzrokowej i wyjaśnia pewne podstawowe zjawiska pcrcepcyjne. Odpowiednie mechanizmy nerwowe zostały dość dokładnie przeanalizowane w poprzednich rozdziałach (rys. 5-1). Teraz skoncentrujemy uwagę na pewnych zjawiskach psychologicznych, występujących w rezultacie tych współdziałań. Pasy Macha Jedno z bardziej interesujących zjawisk związanych z przestrzenną interakcją-to efekt kontrastu jasności, opisany po raz pierwszy przez naukowca austriackiego Ernsta Macha i określony jego nazwiskiem. Już w swych pierwszych badaniach dotyczących fizjologii narządów zmysłowych (w latach 1860-tych) Mach zauważył, że człowiek może widzieć jasne i ciemne pasma, mimo braku odpowiednich zmian fizycznych w intensywności światła. Zjawisko to jest związane z tym, że granica między słabo oświetlonym obszarem i obszarem intensywniej oświetlonym jest spostrzegana jako znacznie bardziej ostry spadek jasności (rys. 5-2 i 5-3), niż ma to miejsce w rzeczywistości, a nawet więcej, po obu stronach granicy między słabiej i silniej oświetlonymi obszarami są widoczne pasy jasny i ciemny; są to właśnie pasy Macha. Gradient oświetlenia można uzyskać w dwojaki sposób. W jednym wypadku należy posłużyć się tarczą z czarnymi i białymi częściami (rys. 5-2) [czarną część koła stanowi wycinek stanowiący na obwodzie jedną ósmą koła, a od połowy promienia zwężający się do jednej szesnastej] i obracać ją z taką prędkością, aż czarne i białe części złączą się i cała tarcza odbierana będzie jako jednorodna szara powierzchnia (szybkość powinna przekraczać 30 obrotów na sekundę). Inny sposób polega na tym, że na danej powierzchni tworzymy cienie o rozmytych konturach; w tym i celu w niewielkiej odległości od źródła światła umieszczamy przesłonę (rys. 5-3). W obu wypadkach uzyskujemy stopniową zmianę oświetlenia (jak to pokazują wykresy)-od najsilniejszego (oznaczonego literą alfa) do najmniej oświetlonej powierzchni (oznaczonej literą delta), przy czym obszar zmian oświetlenia leży między punktami beta i gamma Tak się przedstawia rzeczywisty rozkład światła odbitego od danej powierzchni. Nie odpowiada to jednak temu, co odbiera obserwator, który nie widzi płynnego przejścia od większej do mniejszej jasności czy też odwrotnie, ale jasną linię przechodzącą przez punkt beta i ciemną linię przechodzącą przez punkt gamma. Rysunek 5-4 przedstawia rzeczywisty rozkład intensywności oświetlenia (linia przerywana) oraz rozkład spostrzegany (linia ciągła). Zjawisko to jest rezultatem wzajemnego oddziaływania różnych części obrazu na siatkówce. Właśnie to zjawisko ilustruje rysunek 5-5 (patrz również rozważania w rozdziale 2, s. 101) RYSUNEK 5-2. Biała tarcza z czarnym sektorem w czasie szybkich obrotów wokół osi (nie mniej niż 1800 na minutę) uzyskuje średnią intensywność światła pokazaną na wykresie, która odbierana jest tak, jak to zostało przedstawione na rysunku 5-4; Pasy Macha. Źródło: Ratliff (1965). RYSUNEK 5-3. Prosta metoda uzyskania pasów Macha. Jeśli lampa znajduje się na wysokości ok. 30 centymetrów nad białym arkuszem papieru, to szerokość karty powinna wynosić 2,5 do 5 cm. Poprzez lekkie boczne ruchy ręki można łatwo uzyskać pojawienie się pasów Macha, Źródło: Ratliff (1965). 199 RYSUNEK 5-6. Wykres (linia ciągła) przedstawia aktywność neuronów, a linia przerywana rzeczywisty rozkład intensywności bodźca świetlnego. Źródło: Cornsweet (1970) Interakcje te są również odpowiedzialne za to, w jaki sposób oko ludzkie spostrzega pionowe pasy przedstawione na rysunku 5-6. Każdy z pasów charakteryzuje się stałą intensywnością barwy, a wydaje się, że jasność każdego z pasów jest niejednolita. Możemy to z łatwością wyjaśnić logicznie. W percepcji ważna jest lokalizacja granic przedmiotów, nawet w takich wypadkach, kiedy różnice w intensywności oświetlenia przedmiotu 200 i otaczających rzeczy są niezbyt duże. Spotęgowanie różnic w częstotliwości reakcji receptorów rozmieszczanych po obu stronach granicy różnych poziomów oświetlenia niewątpliwie ułatwia procesy rozpoznawania obrazów, dla urzeczywistnienia których konieczne jest wyodrębnienie konturów. Interakcje neuronów warunkujące występowanie opisywanych zjawisk są charakterystyczne również dla innych systemów sensorycznych. W istocie podobne wyostrzenie reakcji komórek nerwowych daje się zaobserwować prawie zawsze wówczas, gdy poszczególne receptory sensoryczne umiejscowione są obok siebie: wzrokowe, słuchowe, smakowe, dotykowe lub receptory węchowe. Interakcje między sąsiadującymi komórkami nerwowymi odgrywają decydującą rolę szczególnie w pierwszych etapach analizy informacji, i to we wszystkich systemach sensorycznych. Kontrast jasności Przyjrzyjmy się wszystkim wewnętrznym kwadratom pokazanym na rysunku 5-7 [cztery kwadraty o różnych odcieniach szarości wewnątrz których znajdują się małe kwadraty o tym samym odcieniu koloru szarego]. W rzeczywistości wszystkie one są identyczne, ta sama ilość światła jest odbijana przez każdy z nich. Pomimo to wydaje się, że kwadrat umieszczony na ciemnym tle (na lewym brzegu) jest jaśniejszy niż ten, który znajduje się na jasnym tle (pierwszy z prawej). Przywykliśmy do tego, że wraz ze wzrostem fizycznej siły bodźca wzrasta subiektywnie spostrzegana jego jasność. Tak więc, jeżeli przedmiot odbija więcej światła, to powinien być jaśniejszy, podobnie jak dźwięk o zwiększonej sile odbierany jest jako głośniejszy. Okazuje się jednak, że odbierana jasność przedmiotu zależna jest również od otaczającego tła. Zmiana w spostrzeganiu wynikająca ze zwiększenia padającego światła na przedmiot zależy również od tego, co otacza ten przedmiot. Weźmy dwa kwadraty z lewej strony rysunku 5-7. Nazwijmy wewnętrzny kwadrat figurą, a zewnętrzny tłem. Jeżeli będziemy zwiększać oświetlenie całości, to intensywność światła odbijanego od tła i figury wzrasta jednakowo (proporcjonalnie do współczynnika odbicia) i rzeczywisty kontrast między nimi pozostaje niezmieniony. Jednakże spostrzegana jasność figury nie musi wzrastać wraz ze zwiększeniem oświetlenia; może stać się jaśniejsza, pozostać niezmieniona, a nawet jej jasność może ulec zmniejszeniu - wszystko to bowiem zależy od stosunku intensywności światła odbitego od środka i od tła. Jak przebiega to zjawisko w wypadku zmiany jasności figury wraz ze wzrostem oświetlenia pokazuje nam rysunek 5-8, na którym przedstawiono dane dotyczące różnych stosunków 201 kontrastu jasności między figurą a tłem (w decybelach). [Pomiarów jasności dokonywano metodą oceny wielkości bezwzględnej S. S. Stevensa (196 1b), opisaną w Dodatku A do niniejszej książki.] Przy jednakowej jasności środka i tła (kontrast 0 dB) spostrzegana jasność środka wzrasta stopniowo wraz ze wzrostem fizykalnej intensywności oświetlenia, jak to pokazuje górna gruba linia na rysunku 5-8 [rysunek przedstawia wykresy jasności środka w zależności od ogólnej intensywności światła w dB przy różnych kontrastach]. W miarę jak wzrasta kontrast jasności między środkiem a tłem, przyrost odbieranej jasności środka nie zachodzi równomiernie wraz z przyrostem światła. Przy średnim ciemnoszarym kolorze figury (różnica w kontraście około 8 dB) osiągana jest pełna stałość spostrzegania jasności: odbierana jasność figury nie zmienia się przy wzroście oświetlenia. Przy większym kontraście występuje interesujące zjawisko: im bardziej wzrasta oświetlenie, tym ciemniejszy wydaje się środek. Każdy może przeprowadzić podobny eksperyment we własnym zakresie, posługując się kwadratami przedstawionymi na rysunku 5-7. W tym celu należy przejść do ciemnego pokoju, w którym można by zmieniać intensywność światła bez zmiany jego barwy. W typowych warunkach domowych można przyjąć dwa warianty postępowania. Pierwszy polega na tym, aby wejść do ciemnego pomieszczenia, zamknąć drzwi, a następnie powoli otwierać je coraz szerzej, regulując w ten sposób ilość światła przedostającego się do pomieszczenia (Zwróćcie uwagę na fakt, że kiedy drzwi otwieramy do jasno oświetlonego pomieszczenia, to wystarczy szpara kilkumilimetrowej szerokości, aby uzyskać odpowiednią ilość światła.) Druga metoda polega na wykorzystaniu odbiornika telewizyjnego jako źródła światła. Należy w ciemnym pokoju włączyć telewizor ustawiając go na nieczynny kanał. Tym razem regulator jasności ekranu służy nam 203 do regulowania oświetlenia w pokoju (regulator zaś kontrastu należy ustawić na minimum, aby przypadkowe pasy czy punkty nie przeszkadzały w eksperymencie). Spójrzcie teraz na kwadraty. Wraz ze wzrostem oświetlenia pokoju prawy kwadrat wydaje się coraz ciemniejszy. Jeżeli natomiast będziecie patrzeć na lewy kwadrat, to w miarę tego, jak w pokoju robi się coraz jaśniej, będzie wydawał się on coraz bardziej jaśniejszy. Nie należy zapominać o tym, że w istocie wszystkie kwadraty są absolutnie jednakowe, a odbierane są jako różne dlatego, że umieszczone zostały na różnym tle (uwaga: nie używajcie do zmiany oświetlenia przyciemniaczy, gdyż zmienia się wtedy także barwa światła). Chociaż początkowo może wydać się dziwnym fakt, że wzrost oświetlenia powoduje subiektywne ciemnienie figury, w istocie jest oczywiste, że inaczej być nie może. W warunkach minimalnego oświetlenia, kiedy żadne światło nie pada na siatkówkę, figura nie jest spostrzegana jako czarna, lecz jako szara, gdyż ten neutralny stan spostrzegania jasności wynika z aktywności własnej neuronów. Stan ten odpowiada spostrzeganiu „szarości". Zaczynamy spostrzegać czerń, kiedy pojawia się światło, ale tylko wtedy, gdy występują równocześnie jaśniejsze powierzchnie, które działają hamująco na powierzchnie ciemne. Rozpatrzmy obwód nerwowy przedstawiony na rysunku 5-9 [Na rysunku przedstawiono trzy komórki A, B, C o aktywności własnej 50]. Kiedy na żaden z trzech receptorów nie pada światło, każdy z nich reaguje na poziomie swojej aktywności własnej, przyjętej jako 50. Przy słabym świetle-dwa obszary o intensywności 20 otaczające z obu stron obszar o intensywności 10-dwa neurony odpowiadające obszarom A i C zaczynają reagować intensywniej wraz ze wzrostem intensywności światła, ale aktywność neuronu odpowiadającego środkowemu obszarowi B obniża się, bez względu na to, że na niego także pada teraz więcej światła niż przedtem. (Przy obliczaniu należy założyć, że obszary o zwiększonej intensywności oświetlenia rozciągają się nieograniczenie w obie strony.) Kiedy intensywność sygnału świetlnego wzrośnie czterokrotnie, tak że oświetlenie obszarów A i B osiągnie 80, a wewnętrznego obszaru B - 40, efekt utrzymuje się nadal: reakcje neuronów A i C wzrastają wraz ze zwiększeniem intensywności światła, a reakcja neuronu B jest jeszcze słabsza niż uprzednio. Prostym przykładem tego zjawiska może być ekran telewizora. Kiedy telewizor jest wyłączony, ekran ma szarą, neutralną jasność. Po włączeniu telewizora niektóre części ekranu wydają się znacznie ciemniejsze od szarości ekranu wyłączonego telewizora, a przecież włączenie aparatu może jedynie zwiększyć, a nie osłabić intensywność oświetlenia ekranu; wiązka elektronów wzbudzająca fluorescencję kineskopu może jedynie emitować, a nie pochłaniać światło. Pozorne ciemnienie odpowiednich części ekranu jest wynikiem występowania mechanizmu kontrastu równoczesnego w oku. JASNOŚĆ A GŁĘBIA Proste obliczenie jasności nie zawsze jest wystarczające do wyjaśnienia naszego spostrzegania. Zapoznajmy się z eksperymentem, który wyjaśnia współdziałanie między informacją o jasności a 204 informacją o głębi, w wyniku czego pojawia się spostrzeganie uwzględniające również inne czynniki (Hochberg i Beck, 1954): Na stole ustawionym w specjalnej kamerze rozmieszczono szereg białych przedmiotów (patrz rys. 5-10). Obserwator patrzy na stół przez otwór wycięty w jednej ze ścian kamery, dzięki czemu kąt patrzenia jest absolutnie stały, gdyż obserwator nie może ruszać głową (rys. 5-11). Osoba obserwująca widzi powierzchnię stołu, na której rozłożono szereg przedmiotów; wszystko to oświetlone jest jedną lampą umieszczoną na górze. Na jedne powierzchnie pada światło bezpośrednio, inne zaś pozostają w cieniu (rys. 5-11). Chociaż ilość światła odbijanego przez poszczególne powierzchnie jest różna, wszystkie wydają się mieć taką samą barwę-białą. Dlaczego tak się dzieje? Istota sprawy wiąże się z tym, że obserwator spostrzega przedmioty jako trójwymiarowe. Nie wszystkie powierzchnie tych przedmiotów oświetlone są jednakowo. Intensywność światła odbitego od danej powierzchni i dochodzącego do oka obserwatora jest uzależniona od położenia tej powierzchni względem światła i dlatego jasność tych powierzchni spostrzegana jest jako stała. Załóżmy, że kartkę papieru z narysowanym x ustawimy pionowo na stole przed źródłem światła (rys. 5-12). Kartka znajdzie się wówczas w cieniu i ilość odbitego przez nią światła wyraźnie się zmniejszy. 206 Mimo to obserwator nadal będzie uważał, że jest tak samo biała jak i wszystkie inne przedmioty umieszczone na stole. W ten sposób również i w tym wypadku prawidłowo spostrzegane położenie powierzchni względem padającego na nią światła zapewnia stałość spostrzegania jasności. Dokonajmy teraz zmiany spostrzeganej jasności kartki papieru przycinając jej brzegi tak, aby uzyskała kształt zbliżony do trapezu (rys. 5-13) i następnie połóżmy ją na stole pionowo w dawnym miejscu. Teraz obserwator interpretuje widziany przez siebie kształt kartki jako informację o tym, że kartka ta nie stoi pionowo, lecz jest poziomym prostokątem i w konsekwencji powinna odbijać znacznie więcej światła (rys. 5-14). A ponieważ kartka jest faktycznie w cieniu, nie odbija więc tej ilości światła, która odpowiadałaby poziomemu położeniu. Spostrzegana jasność zmienia się odpowiednio: kartka wydaje się bardziej szara aniżeli pozostałe przedmioty. Jeżeli jednak umieścimy za kartką pręcik, interpretacja dotycząca głębi nie zachodzi i położenie przestrzenne kartki ponownie odbierane jest jako pionowe-jasność jej ponownie się zwiększa. Przy spostrzeganiu jasności ten sam obraz wzrokowy może być interpretowany na różne sposoby, w zależności od ogólnej interpretacji wszystkich sygnałów wzrokowych odbieranych przez obserwatora. ADAPTACJA Jeżeli przyprowadzimy do laboratorium człowieka prosto z ulicy i zaczniemy badać jego wrażliwość wzrokową, to okaże się, że sprawa wcale nie jest tak prosta. I najprawdopodobniej zachowanie badanego będzie dla nas frustrujące. Załóżmy na przykład, że interesuje nas jego próg wrażliwości na światło, to znaczy najmniejsza intensywność światła, jaką człowiek jeszcze widzi. Określenie wartości progowej należy zacząć od eksponowania dość jasnego punktu świetlnego, a następnie stopniowo zmniejszać jasność aż do momentu, kiedy osoba badana powie, że nie widzi nic więcej; tak można uzyskać w dużym przybliżeniu wartość progową. Zanim jednak zdążycie zapisać tę wartość progową, badany nagłe oświadczy, że znowu widzi światło. Jeżeli ponownie spróbujemy zmniejszyć intensywność światła, historia powtórzy się na nowo, badany najpierw oznajmi, że nie widzi punktu świetlnego, a po kilku sekundach powie, że mimo wszystko widzi go nadal. W toku badania włączył się nowy element, proces adaptacji wzrokowej-zdolność oka do przystosowywania swej wrażliwości na światło stosownie do zmiany oświetlenia. Aby prześledzić ten proces bardziej szczegółowo, kierujemy najpierw na oczy osoby badanej bardzo silne źródło światła (w celu maksymalnego obniżenia jej wrażliwości na światło), następnie wprowadzamy ją do całkowicie ciemnego pomieszczenia i eksponujemy coraz słabsze światło mierząc jej wrażliwość wzrokową. Z upływem czasu jej wrażliwość na światło będzie wzrastała coraz bardziej. Na rysunku 5-15 przedstawiona jest krzywa zmian wrażliwości w czasie, jest to tzw. krzywa adaptacji do ciemności. [Na osi rzędnych (pionowej) - intensywność progowa światła w dB, na osi odciętych (poziomej) – czas przebywania w ciemności w minutach. Po 10 minutach intensywność spada do około 40 dB po czym następuje łagodniejszy spadek w czasie ponad pół godziny do około 20 dB ] Wystarczy rzut oka na krzywą, aby zauważyć, że na poziomie podziałki odpowiadającej 10 minucie zaczyna się coś dziać. Kiedy na krzywej obserwujemy załamanie, przypuszczamy, że do badanego procesu włączają się jakieś mechanizmy dodatkowe. 207 W odniesieniu do wzroku mamy pełne podstawy do takich przypuszczeń. W oku działają dwa systemy receptorów: pręciki i czopki. Należy przypuszczać, że załamanie na krzywej jest wynikiem interakcji tych dwu systemów. Możemy wykorzystać różnice morfologiczne i funkcjonalne między dwoma systemami dla wyodrębnienia z krzywej adaptacji do ciemności jej oddzielnych składników. Pręciki rozmieszczone są znacznie gęściej na peryferiach siatkówki, a czopki w jej środku. Jeżeli ograniczymy oddziaływanie światła do peryferii siatkówki, to powinniśmy otrzymać krzywą adaptacji pręcików, a jeżeli ograniczymy je do części centralnej siatkówki, uzyskamy krzywą odzwierciedlającą przede wszystkim zmiany wrażliwości czopków. 208 Ponadto jest rzeczą wiadomą, że maksymalna wrażliwość czopków i pręcików jest różna dla światła o różnej długości fal (rys. 5-16). Dlatego kształt krzywej adaptacji do ciemności powinien zależeć od barwy (długości fali) stosowanego w badaniu światła. W ten sposób możemy wybiórczo badać albo krzywą adaptacji pręcików, albo też krzywą adaptacji czopków. Oświetlając jedynie peryferie siatkówki albo też stosując światło fioletowe (długość fali poniżej 450 nm), powinniśmy otrzymać względnie czystą krzywą adaptacji pręcików. Oświetlając zaś wyłącznie środek siatkówki albo też posługując się światłem czerwonym (długość fali powyżej 650 nm), spodziewamy się uzyskać przede wszystkim krzywą adaptacji czopków. Istotnie, wszystkie nasze oczekiwania sprawdzają się. Na przykład, na rysunku 5-17 przedstawiony został zbiór krzywych adaptacji do ciemności. Różnice między przedstawionymi krzywymi są uwarunkowane tylko jednym czynnikiem zewnętrznym - długością fali stosowanego światła. Krzywa adaptacji do ciemności uzyskana przy stosowaniu światła czerwonego (długość fali powyżej 680 nm) nie ma załamania, jest to właściwa krzywa wrażliwości czopków. Wraz ze zmniejszeniem długości fal świetlnych na krzywej pojawia się załamanie, a przy długości fali rzędu 485-570 nm (zielone światło) krzywa osiąga praktycznie taki sam kształt, jaki ma przy białym świetle. Maksymalna wrażliwość i najwyższy stopień adaptacji występuje przy najkrótszych falach widzialnego światła-światło fioletowe (poniżej 485 nm); na sygnały świetlne tego typu reaguje przede wszystkim system pręcików. Podobne ułożenie krzywych uzyskuje się, kiedy światło przechodzi z centrum do obwodu siatkówki; pobudzenie centrum daje krzywą podobną do górnej krzywej na rysunku 5-17, a pobudzenie obwodu - krzywą podobną do dolnej krzywej na tym rysunku. 209 Warstwice równej jasności Istnieje również inny sposób wywołania efektu adaptacji do ciemności. Wraz ze zmianą długości fali świetlnej zmienia się również jasność światła. Warstwice równej jasności pokazują, jaka powinna być intensywność światła potrzebna do zachowania stałej jasności, mimo zmiany długości fali. Uzyskiwane krzywe są analogiczne do warstwic równej głośności, powstających w efekcie badania słuchu. Na rysunku 5-18 ilustrującym zbiór warstwic równej jasności pokazane są zmiany w przebiegu krzywych w różnych stadiach adaptacji do ciemności. Wraz ze zmianą poziomu adaptacji, krzywe równej jasności uwidaczniają zmiany maksymalnej wrażliwości na długość fali eksponowanego światła. Przyczyną tych zmian są różne ilości pręcików i czopków, działających na danym poziomie adaptacji. We wczesnym stadium adaptacji (górna krzywa) główną rolę odgrywa widzenie czopkowe i dlatego maksymalna wrażliwość przenosi się na światło o względnie dużej długości fali-właśnie takie światło wydaje się najbardziej jasne. W późniejszych stadiach adaptacji widzenie zachodzi głównie dzięki pręcikom i dlatego maksymalna wrażliwość przenosi się na tę część widma świetlnego, która charakteryzuje się krótkimi falami. Po raz pierwszy zauważył to czeski fizjolog, Jan Purkinje, i jako jeden z pierwszych określił różnicę między systemami czopków i pręcików na podstawie obserwacji zachowania. Zmiany wrażliwości mają określone znaczenie dla praktyki. W jasnym świetle czerwona barwa wydaje się jaśniejsza od niebieskiej, a przy świetle przyćmionym-odwrotnie. Przy stosowaniu sygnałów świetlnych różnego typu w godzinach nocnych 210 (np. znaki drogowe) należy uwzględniać to zjawisko zmian wrażliwości (rys. 5-19 - wkładka kolorowa). RYSUNEK 5-19. [Na czarnym prostokątnym tle widnieją dwa kwiatki; z lewej strony u dołu mniejszy, niebieski kwiatek, z prawej strony w środku większy czerwony kwiatek.] Zjawisko Parkinjego. Różnice między wrażliwością wzrokową w dzień i w nocy. Przedstawione na ilustracji dwa „kwiatki” czerwony i niebieski normalnie widziane są jednakowo dobrze, przy czym czerwony wydaje się jaśniejszy od niebieskiego. Oba spostrzegane są dzięki widzeniu czopkowemu. Jeśli będziemy patrzyli na oba kwiatki przy bardzo słabym świetle, to przykładowo po pięciu minutach czerwony kwiatek przestanie być widoczny, a widzieć będziemy tylko niebieski. Jeżeli światło jest dostatecznie słabe, działa jedynie widzenie pręcikowe. Możemy przyspieszyć pojawienie się tego efektu, jeżeli przez cały czas będziemy koncentrować wzrok na środku czerwonego kwiatka. W tym wypadku obraz pada na plamkę żółtą, praktycznie pozbawioną pręcików, a obraz kwiatka niebieskiego na obszar bogato usiany pręcikami (zmodyfikowane na podstawie The Color Tree, Interchemical Corp., New York, 1965). Jeżeli człowiek musi zachować oczy zaadaptowane do ciemności, a równocześnie powinien okresowo pracować w dobrze oświetlonym pomieszczeniu, powinien przedsięwziąć niezbędne środki w celu zachowania poziomu adaptacji widzenia pręcikowego. Można tego dokonać za pomocą prawidłowego wyboru długości fali świetlnej dla oświetlającego pokój światła. Na przykład, można nosić w jasnym pomieszczeniu okulary, które przepuszczałyby tylko promienie ciemnoczerwone. Okulary takie, nawet przy silnym świetle, chronią system pręcikowy i pozwalają na zachowanie jego zdolności adaptacyjnych, ponieważ podczas działania silnego czerwonego światła będą pracować tylko czopki. Po przejściu do ciemnego pomieszczenia i po zdjęciu okularów, człowiek odkryje, że dobrze widzi: pręciki zachowały wysoki stopień swojej adaptacji do ciemności, bez względu na to, że czopki w tym samym czasie osiągnęły adaptację do światła, a nie do ciemności. Na tym polega sens stosowania czerwonych szkieł albo oświetlenia czerwonym światłem pomieszczeń służących do odpoczynku dla takich pracowników, jak operatorzy stacji radiolokacyjnych, którzy muszą utrzymywać adaptację oczu do ciemności nawet w czasie przerw obiadowych i rekreacyjnych, kiedy to wolą przebywać w jasno oświetlonych miejscach (rys. 5-20). [Na wykresie przedstawiono względną efektywność receptorów (pręciki, czopki) w procentach, w zależności od długości fali w nanometrach. Obie krzywe wraz ze wzrostem długości fali są rosnące od 0 do 100 procent, po czym przy dalszym wzroście długości fali maleją do zera. Krzywa dla pręcików osiąga maksimum (100 procent względnej efektywności) przy długości fali około 525 nm, natomiast krzywa czopków przy 550 nm. Pionową linią zaznaczono miejsce w którym czerwony filtr (około 630 nm) odcina pozostałe długości światła.] Zakreskowana część oznacza rejon, w obrębie którego światło przechodzi przez czerwony filtr. Linia pionowa wskazuje miejsce, w którym filtr odcina pozostałe długości światła. Filtr przepuszcza jedną dziesiątą światła pobudzającego czopki i jedną setną pobudzającego pręciki. Źródło: Hechl i Hsia (1945). Ile czasu potrzeba dla wytworzenia się adaptacji do ciemności? Krzywa przedstawiona na rysunku 5-17 wskazuje, że najszybszy przyrost wrażliwości występuje w pierwszych 10-20 minutach. Dla większości celów praktycznych wystarczy 30 minut; jedynie szczegółowe obserwacje pozwalają stwierdzić, że wrażliwość rośnie bardzo wolno jeszcze w okresie do 6 godzin. Należy jednak pamiętać, że okres 20 do 30 minut odnosi się do takich sytuacji, w których badanego poddawano uprzednio działaniu bardzo silnego światła (typu fotograficznego flesza). Jeżeli wyjściowy poziom oświetlenia jest niski, na przykład taki, jaki jest w dużym pokoju oświetlonym kilkoma żarówkami 50 W, to może okazać się, że wystarczy tylko 5 minut, aby wytworzyła się dobra adaptacja do ciemności. Nawet, gdy po wytworzeniu się adaptacji zapalimy w pokoju słabe światło na 10 sekund, poziom jej prawie się nie zmieni: już po 60 sekundach powróci do poprzedniego stanu. Gdyby tak nie było, to prowadzenie samochodu nocą byłoby niezwykle uciążliwe, 211 ponieważ światła samochodów nadjeżdżających z przeciwka naruszałyby znacznie poziom adaptacji, w wyniku czego przez jakiś czas nic nie byłoby widać. Jak wiemy, oślepienie pojawiające się w takich wypadkach trwa bardzo krótko i wrażliwość szybko powraca. WŁAŚCIWOŚCI WIDZENIA ZWIĄZANE Z CZASEM Czas integracji Widzenie nie jest procesem natychmiastowym. Potrzeba czasu, aby wystąpiła reakcja na obraz wzrokowy, a kiedy już wystąpi, to trwa jeszcze chwile, nawet wówczas, kiedy obraz przestanie działać na narząd wzroku. Pojawienie się reakcji chemicznych, dzięki którym światło eksponowane przez określone źródło przeistoczy się w reakcję neuroelektryczną, wymaga czasu. Obraz na siatkówce znika bardzo wolno, pozostając jeszcze przez kilka dziesiętnych części sekundy (patrz omówienie problemu wzrokowej pamięci krótkotrwałej w rozdziale 9). Można ustalić pewien związek między siłą światła oddziałującego na oko a trwaniem jego wpływu. W przedziałach czasu reakcji oka znaczenie ma jedynie ogólna suma działającej na nie energii. Tak więc, jeżeli zmniejszymy intensywność światła o połowę, ale podwoimy czas oddziaływania bodźca, zdolność obserwatora do wykrycia sygnału nie ulegnie zmianie. Związek czasu i intensywności utrzymuje się w przedziale długości oddziaływania do 20 milisekund. Dla dłuższych błysków zmniejszenie intensywności światła nie da się w pełni zrekompensować wydłużeniem czasu oddziaływania. Jeżeli tylko długość trwania sygnału przekroczy np. jedną czwartą sekundy (250 milisekund), wszelka zależność między zdolnością obserwatora do wykrycia sygnału a długością tego ostatniego zanika i decydującym czynnikiem staje się intensywność światła. Ta wymienność między czasem a intensywnością nie jest jedynie specyficzna dla systemu wzrokowego. Jest ona wspólna dla procesów fotochemicznych wszystkich rodzajów. Na przykład, odpowiedni czas naświetlania błony fotograficznej można uzyskać przy różnorodnych zestawieniach długości czasu naświetlania (migawki) oraz intensywności światła (wielkość przesłony). Typowy czas naświetlania waha się w granicach od 0,001 do 1 sekundy, a więc rozpiętość znacznie większa aniżeli ta, jaką dysponuje oko. Natomiast wrażliwość systemu wzrokowego na światło jest znacznie wyższa aniżeli ta, jaką dysponuje typowa błona fotograficzna. Kiedy migające światło wydaje się ciągłe? Wrażenie wzrokowe utrzymuje się przez krótki czas nawet po tym, kiedy wywołujący je bodziec przestał już działać. To zjawisko utrzymywania się obrazu wzrokowego po raz pierwszy odkryte zostało przez pomysłowego wynalazcę w wieku XVII, 212 kiedy to przywiązawszy do jednego końca sznura żarzący się węgielek i trzymając w ręku drugi koniec zaczął nim szybko obracać-w ciemności pojawił się krąg ognisty. Możemy powtórzyć ten eksperyment, z tym że zamiast węgielka użyjemy zapalonej latarki elektrycznej. Jeżeli znamy szybkość obrotów, przy której widziane jest koło świetlne, możemy obliczyć długość czasu utrzymywania się obrazu świetlnego. Rezultat eksperymentu zawsze jest ten sam, niezależnie od tego, czy posługujemy się skomplikowaną elektroniczną aparaturą pomiarową, czy też zwykłą latarką lub rozżarzonym węgielkiem. Obraz wzrokowy przechowywany jest w ciągu około 150 milisekund. Wielkość ta jest bardzo zbliżona do trwania aktywności elektrycznej, wzbudzonej w siatkówce w wyniku krótkotrwałych błysków świetlnych. Zdolność systemu wzrokowego do przechowywania śladów bodźca świetlnego na przeciąg 150 do 250 milisekund okaże się niezwykle ważna w badaniach nad pamięcią (rozdziały 8 i 9). Krytyczna częstotliwość migotania Jeżeli prawidłowo ustalimy przerwy między błyskami, możemy uzyskać u obserwatora efekt światła ciągłego. Po pierwszym błysku występuje reakcja wzrokowa, która utrzymuje się w ciągu 100 milisekund. Jeżeli drugi błysk następuje dostatecznie szybko po pierwszym, to reakcja na ten błysk wystąpi już, zanim wygaśnie reakcja na błysk uprzedni. W ślad za drugim błyskiem można w tym samym czasie eksponować trzeci. Tak więc błyski światła wywołują w systemie wzrokowym reakcję ciągłą, która jest spostrzegana jako światło ciągłe. Częstotliwość migotania, w czasie którego szereg kolejnych błysków spostrzegany jest jako nieprzerwane światło ciągłe, nazywamy krytyczną częstotliwością migotania (Critical flicker frequency-CFF). [Czytelnicy obznajmieni z obwodami elektronicznymi zapewne zauważą, że właściwości oka związane z czasem są analogiczne do właściwości filtru pasmowego, wycinającego częstotliwości w przedziale od 10 do 50 Hz, zależnie od intensywności, co daje w efekcie minimalną lub żadną reakcję prądu stałego. Patrz Cornsweet, (1970) dla omówienia metody analizy filtru pasmowego.] Dowolny czynnik wpływający na szybkość integracji i na inercję w systemie wzrokowym zmienia również krytyczną częstotliwość migotania. Przy silnych błyskach czas integracji ulega skróceniu i dlatego jedynie przy bardzo dużej częstotliwości błyski-takie zlewają się i mogą być spostrzegane jako światło ciągłe. Słabe błyski zlewają się przy niższej częstotliwości migotania. Dla pręcików, które są najbardziej aktywne przy małej sile światła, krytyczna częstotliwość migotania jest mniejsza niż dla czopków. Znając mechanizm integracji bodźców, który powoduje zlewanie się światła, można przewidzieć, jaka powinna być jasność migającego światła. Wiadomo, że światło, dla którego czas trwania błysków jest równy czasowi trwania przerw między błyskami (przy częstotliwości migotania powyżej krytycznej), spostrzegane jest jako równe jasnością stałemu światłu o intensywności niższej o połowę (tzw. prawo Talbota). System wzrokowy sprowadza intensywność do średniego poziomu w czasie integracji błysków i odpowiednio do tego obniża się spostrzegana jasność. 213 Te integracyjne aspekty procesów przetwarzania informacji wzrokowej w sposób oczywisty ograniczają szybkość, z jaką oko może wykryć oraz prześledzić zmiany zachodzące w strukturze bodźca padającego na siatkówkę. Ten proces uśredniania bodźców zapewnia płynne zlewanie się następujących po sobie obrazów w nieprzerwany strumień spostrzegania wzrokowego. Właśnie w wyniku tego procesu następujące po sobie oddzielne kadry na ekranie kinowym czy też telewizyjnym stwarzają złudzenie ruchu ciągłego. Prawdę mówiąc, zarówno obrazy telewizyjne, jak i filmowe migotałyby w trakcie oglądania, gdyby nie zastosowano specjalnej metody. W kinie projekcja odbywa się z prędkością 24 kadrów na sekundę (czasem 30). Światło padające na ekran zostaje wygaszone na ten moment, który jest niezbędny do zmiany kadru, inaczej obserwowalibyśmy migotanie obrazu. Aby uniknąć migotania, każdy kadr rzutowany jest kilkakrotnie: tzn. zamiast projekcji ciągłej jednego kadru, światło przerywane jest raz lub kilkakrotnie. W ten to sposób, chociaż tylko 24 kadry są eksponowane w czasie jednej sekundy, ilość błysków odbieranych przez oko wynosi co najmniej 48 na sekundę; jest to w pełni wystarczające do uniknięcia migotania. (Niektóre aparaty projekcyjne pozwalają na uzyskanie 72 błysków na sekundę i w nich światło wygasza się dwukrotnie przy ekspozycji każdej klatki filmowej.) W telewizji mamy do czynienia z podobnym problemem. Na ekranie telewizora obraz tworzy się z oddzielnych punktów, a ściślej mówiąc z 525 linii, z których każda składa się z około 500 punktów. Pełny obraz prezentowany jest 30 razy na sekundę. Gdyby obraz tworzył się stopniowo, począwszy od lewego górnego rogu, i przechodził wzdłuż rzędów w dół do prawego dolnego rogu, wtedy wystąpiłoby migotanie, ponieważ pojawienie się każdego punktu (przy tak krótkich odcinkach czasu) zajęłoby tyle samo czasu, co pojawienie się całego obrazu. Nie odnosi się to do kina, gdyż tam każdy element obrazu jest eksponowany w momencie, kiedy cały ekran jest oświetlony. Aby uniknąć zjawiska migotania, prezentowana jest najpierw połowa obrazu i wiązka elektronów przebiega linie na jednej połowie. Trwa to około jednej sześćdziesiątej sekundy. Następnie wiązka elektronów powraca do punktu wyjścia i ponownie przebiega linie na drugiej połowie. W ten sposób, chociaż na pełną ekspozycję obrazu potrzeba zaledwie jedną trzydziestą sekundy, na ekranie obraz pojawia się co jedną sześćdziesiątą sekundy. Eliminuje to całkowicie migotanie. Ostatnio przemysł rozrywkowy ponownie wprowadził migotanie, pozwalające przekonać się naocznie, jak wyglądałby świat, gdyby w naszym systemie wzrokowym nie występowały mechanizmy integrujące. Przy światłach stroboskopowych wykorzystywanych czasami w świetlnych widowiskach estradowych stosuje się serię odrębnych zjawisk migawkowych, tak że kolejny prezentowany obraz zdąży zniknąć, zanim pojawi się następny. Przy dużej intensywności błysków i niskiej częstotliwości ich pojawiania się system wzrokowy nie nadąża łączyć kolejnych błysków i obserwator spostrzega nierealne, porozrywane obrazy. 214 BARWA Podstawą współczesnych teorii widzenia barw są obserwacje Izaaka Newtona, dotyczące rozszczepienia promienia świetlnego, przechodzącego przez pryzmat, na widmo świetlne. Na podstawie tego prostego faktu zbudowana była pierwsza teoria widzenia barw. Widziana barwa zależy od długości fali świetlnej wpadającej do oka. Tak jak w wielu innych teoriach okazało się, że chociaż fakty są prawdziwe, to teoria jest błędna (rys. 4-1 - wkładka kolorowa).[ Schematycznie opisano tu widmo elektromagnetyczne, zaznaczając, fale radiowe (do około 100 m), telewizyjne (około 10 m), następnie fale ultrakrótkie (do 0,001 m), potem mamy widmo widzialne od około 700 nanometrów do 400 nanometrów).Widmo widzialne przechodzi w ultrafiolet, następnie promienie X (kilka nanometrów), promienie gamma (rzędu 0,001 nm) i w końcu promienie kosmiczne (długość fali około 0,00001 nm)] W pryzmacie (albo jego ekwiwalencie w przyrodzie, w tęczy) białe światło słoneczne rozszczepia się na wiązki promieni o różnych długościach fali i wszystkie barwy od długich do krótkich fal układają się odpowiednio. Spostrzegamy widmo optyczne jako wstęgę barw-od czerwonej do fioletowej. Chyba to wszystko, co możemy powiedzieć o i widzeniu barw. A może istnieje specjalnego rodzaju receptor dla światła o określonej długości fali (tzn. dla każdego monochromatycznego światła), podobnie jak to jest w systemie słuchowym, gdzie znajdują się różne neurony reagujące w specyficzny sposób na dźwięki o różnej częstotliwości? Dokładne badanie spostrzegania barw wykazuje, że teoria taka byłaby zbyt uproszczona. W widmie optycznym wytworzonym przez pryzmat brak niektórych spostrzeganych przez nas barw, w tym na przykład: brązowej, różowej lub purpurowej. Barwy te najwidoczniej nie są monochromatyczne. Po zmieszaniu dwu różnej długości fal świetlnych widzimy nie dwie różne barwy, ale jedną nową-rezultat mieszania. Po zmieszaniu dwu monochromatycznych wiązek promieni oko ludzkie nie może dokładnie określić, jakie barwy weszły w skład tej mieszaniny. To zjawisko różni się w swej istocie od analogicznego doświadczenia ze słuchem: oddzielne tony tworzące akordy stosunkowo łatwo są identyfikowane przez słuchacza. Ponadto po zmieszaniu niektórych monochromatycznych fal świetlnych widzimy światło białe. Na przykład, jeżeli błękitnozielone światło monochromatyczne (o długości fali 490 nm) zmieszane zostanie z żółtoczerwonym światłem monochromatycznym (o długości fali 600 nm), i jeżeli dobrana zostanie odpowiednia ilość każdego z nich, to obie barwy zniosą się wzajemnie i człowiek zobaczy szarą plamę. Takie mieszanie świateł określamy jako pary barw dopełniających. Barwy dopełniające stanowią wskazówkę, jak należy przedstawiać widzenie barw przez człowieka. Przede wszystkim trzeba znaleźć sposób określenia wzajemnych zależności odpowiadających wszystkim możliwym przypadkom spostrzegania światła i barwy. Idealny model powinien pozwolić na przewidywanie barwy, jaką otrzymamy po zmieszaniu dowolnych barw monochromatycznych. Zazwyczaj dokonywanie takich przewidywań umożliwia narysowany diagram, na którym przedstawione są różne możliwe barwy i ich mieszaniny; istnieje zbiór zasad mieszania barw, pozwalających na przewidywanie wyników łączenia różnych monochromatycznych promieni świetlnych. Taki diagram (wraz z odpowiednim opisem matematycznym) nazywa się przestrzenią barw. Bywają bardzo różne przestrzenie barw, poczynając od prostego koła, a kończąc na skomplikowanych bryłach. 215 MIESZANIE BARW Posługując się parami barw dopełniających, możemy uzyskać pierwszy system pozwalający opisać mieszanie barw. Układ barw w widmie, wytworzony w pryzmacie, dostatecznie dobrze charakteryzuje spostrzeganie oddzielnych monochromatycznych wiązek świetlnych. Posłużymy się przykładem widma. Zwróćmy uwagę przede wszystkim na dwie rzeczy: po pierwsze, pewne barwy są „przeciwstawne" lub dopełniające w stosunku do innych; po drugie, oba końce widma są do siebie dość podobne (ciemnoniebieski lub fioletowy na końcu fal krótkich i purpurowy na końcu fal długich). Posługując się przedstawionymi faktami, dokonajmy prostej operacji: zachowajmy kolejność barw w takim układzie, jaki istnieje w widmie światła słonecznego i przedstawmy je w postaci koła, tak aby barwy dopełniające znalazły się naprzeciw siebie wzdłuż średnicy koła. Ze zdziwieniem stwierdzimy, że ten prosty schemat doskonale opisuje widzenie barw i to znacznie dokładniej niż można było oczekiwać ze względu na prostotę jego założenia. Zwróćcie uwagę, że jak dotychczas nie zajmujemy się teorią widzenia barw, lecz próbujemy jedynie opisać związki wzajemne między barwami spostrzeganymi przez człowieka. Koło barw Rysunek 5-21 przedstawia jeden z możliwych wariantów koła barw. Na obwodzie znalazły się nazwy barw i odpowiadające im długości fal świetlnych (na rys. 4-1 ten sam schemat przedstawiony został inaczej, to znaczy liniowo). Pary barw dopełniających można odnaleźć łącząc wzdłuż średnicy koła dowolne dwa przeciwstawne punkty na obwodzie koła. (Z wyjątkiem odcinka oznaczonego jako „purpurowy", ponieważ dla tej barwy nie ma odpowiednika w postaci monochromatycznej wiązki) Zanim jednak przystąpimy do analizy koła barw, musimy precyzyjnie zdefiniować termin barwa. Dowolną barwę charakteryzują trzy różne właściwości psychologiczne: jakość, nasycenie i jasność. Jakość (odcień) odpowiada barwie w potocznym rozumieniu tego słowa; zmienia się wraz ze zmianą długości fali świetlnej. Miejsce na obwodzie koła wyznacza właśnie jakość. Nasycenie określa względną ilość światła monochromatycznego, które należy zmieszać ze światłem białym, aby otrzymać spostrzeganą barwę. Wszystkie punkty na obwodzie koła odpowiadają barwom wysoko nasyconym. Idąc od obwodu do środka koła możemy zaobserwować obniżenie się nasycenia, punkt określony jako biały (środek koła) oznacza nasycenie zerowe, a punkt znajdujący się na przykład w połowie między białym a zielonym oznacza nasycenie w stopniu średnim. Jasność oznacza dokładnie to samo, co określaliśmy już tym terminem w poprzednich częściach tego rozdziału. Wymiar ten nie został uwzględniony w naszym kole barw. Najbardziej zbliżonym odpowiednikiem fizycznym jasności jest intensywność światła (z zastrzeżeniem, które omawialiśmy już wcześniej). 216 Mieszanie dwu świateł. Aby stwierdzić, jaką barwę otrzymamy po zmieszaniu dwu barw, należy odnaleźć na obwodzie koła odpowiadające tym dwu barwom punkty i połączyć je linią prostą. Dowolne zmieszanie dwu oddzielnych barw da nam barwę trzecią, której miejsce będzie gdzieś na tej linii. Dokładne położenie tej barwy zależy od ilości (intensywności) każdej z dwu mieszanych barw. Załóżmy, że mieszamy dwie monochromatyczne barwy dopełniające, oznaczone jako punkty B i Bc na rysunku 5-22 przedstawiającym koło. Punkt znajdujący się w środku koła odpowiada zmieszaniu, w wyniku którego barwa całkowicie zanika. Tak więc punkt w środku koła (W) odpowiada światłu białemu. Na tym rysunku wszystko, co jest spostrzegane jako bezbarwne, nazywa się białe, niezależnie od stopnia jasności. 217 Dlatego „białe" oznacza tu ogólną klasę spostrzeżeń w skali od czarnego (bardzo mała jasność) poprzez szare (pośredni stopień jasności) do białego (duża jasność). Dla opisu barwy wszystkie wymienione gradacje jasności są nieistotne. Przypuśćmy, że mieszamy dwie barwy nie będące dopełniającymi, na przykład A i B. W efekcie uzyskujemy jakąś nową barwę O1(O ze znaczkiem 1) (rys. 5-22). Jaka to jest barwa O1? Poszukiwanie odpowiedzi na to pytanie najłatwiej zacząć od rozpatrzenia zmian w spostrzeganiu, jakie wystąpią, kiedy będziemy poruszać się od punktu B leżącego na obwodzie koła w kierunku punktu W leżącego w środku. Punkt B odpowiada jednej z czysto monochromatycznych barw widmowych. Załóżmy, że punkt B jest niebieski. Poruszając się od punktu B do środka, mieszamy po prostu dwa światła, jedno z nich jest białe, a drugie monochromatyczne niebieskie. Stosunek tych dwu świateł zmienia się w miarę jak posuwamy się od punktu B (tylko niebieskie, brak białego), przez określony punkt, w którym intensywność obu świateł jest równa, do punktu W (tylko białe, brak niebieskiego). Zwróćcie uwagę, że zmienia się nie to, co większość ludzi nazywa „barwą", tylko jej nasycenie, „jasność" barwy. Aby tego dowieść, weźmy dowolny punkt na linii BW (z wyłączeniem punktów B i W) i polećmy obserwatorowi, aby wskazał, której z barw widma najbliższa jest prezentowana barwa: wybierze on barwę odpowiadającą punktowi B. Powróćmy teraz do pytania postawionego na początku: jakiej barwie odpowiada punkt O1 na rysunku 5-22? Wyprowadźmy promień ze środka koła W poprzez punkt O1 i znajdziemy punkt O na obwodzie (rys. 5-22). Punkt ten odpowiada określonej barwie. Dokładnie tak samo jak dla punktu B i dowolnego innego punktu między B i środkiem koła, barwa w punktach O i O1 będzie jednakowa, tylko że w punkcie O barwa będzie bardziej nasycona. Widzimy zatem, że zmieszanie B i A da barwę O, ale o mniejszym nasyceniu. Próba uzyskania O w wyniku zmieszania A i B jest z góry skazana na niepowodzenie, ponieważ jedyny możliwy efekt mieszania tych dwu barw będzie leżał na linii prostej AB, a jego miejsce na tej prostej zależy od względnych intensywności A i B. Im większa będzie intensywność A, tym bliższy A będzie wynik zmieszania. Tak więc najbliższym możliwym przybliżeniem do O, w wyniku zmieszania A i B, jest O1 o tej samej jakości co O, ale o mniejszym nasyceniu. Mieszanie trzech świateł. Trzy barwy monochromatyczne-nazwijmy je A, B i C-w połączeniu mogą dać dowolną barwę leżącą wewnątrz trójkąta o wierzchołkach A, B i C. Aby zrozumieć, w jaki sposób występuje to zjawisko, przeanalizujemy mieszanie barw A, B i C, dające w efekcie czwartą barwę Z. Rysunek 5-23 wyraźnie wskazuje, że barwy uzyskiwane w rezultacie mieszania dowolnych dwu barw (A z B, B z C albo A z C) leżą na prostych (linie przerywane) łączących odpowiednie punkty [A, B i C należą do okręgu.] Poszukiwana barwa Z nie znajduje się na żadnej z tych prostych. Nie znaczy to wcale, że barwy tej nie można uzyskać. Z połączenia A i B wybierzmy - punkt D. Pomimo że barwę D otrzymuje się w wyniku mieszania dwu monochromatycznych barw, stanowi ona jednak w kole barw taki sam element, jak inne czyste monochromatyczne wiązki światła. Dlatego też mieszając barwy C i D możemy uzyskać dowolną barwę leżącą na prostej łączącej C i D. 218 Tak więc, w celu uzyskania barwy Z, należy zmieszać A i B w takich proporcjach, aby punkt D znalazł się na linii prostej łączącej C i Z. Wtedy to mieszając C i D we właściwych proporcjach uzyskamy barwę Z. Analogiczne rozumowanie prowadzi do tego, że zawsze można zestawić taką kombinację barw A, B i C, aby uzyskać wcześniej założony punkt w trójkącie o wierzchołkach A, B i C. Czy istnieją takie trzy monochromatyczne światła, które po zmieszaniu mogą dawać wszystkie możliwe spostrzegalne barwy? Nazwijmy te trzy zasadnicze światła barwami podstawowymi. Jak wskazuje rysunek 5-24, większą skalę barw leżących wewnątrz trójkąta można uzyskać wtedy, gdy barwy podstawowe nie leżą zbyt blisko siebie. [ Rysunek przedstawia trzy koła z wpisanymi w nie trójkątami ABC. W pierwszym kole wierzchołki trójkąta leżą bardzo blisko siebie więc trójkąt ma małą powierzchnię. W drugim przypadku punkty A i C leżą blisko siebie, a punkt B leży na tej samej średnicy okręgu co punkt A. Trójkąt jest nieco większy od poprzedniego. W trzecim kole wpisano możliwie największy z trójkątów opartych na średnicy koła, ale nie jest to największy z trójkątów , który może być wpisany w koło.] Wiadomo też, że aby uzyskać wszystkie możliwe barwy, barwy podstawowe nie powinny być dopełniające względem siebie; ponadto powierzchnia trójkąta powinna być jak największa. 219 Zauważmy też, że gdyby wszystkie trzy punkty leżały na jednej połowie obwodu koła, uzyskanie pełnego zestawu barw byłoby nieosiągalne: środek koła barw powinien leżeć wewnątrz trójkąta. Ścisłe sformułowanie tych wymagań jest następujące: trzy barwy podstawowe powinny być dobrane tak, aby ani jedna z nich nie była dopełniającą w stosunku do dwu pozostałych i aby żadna z trzech barw nie mogła być uzyskana w wyniku zmieszania dwu pozostałych. Idealny zespół barw podstawowych przedstawiony został na rysunku 5-25; uzyskujemy duży trójkąt równoramienny, w który wpisane zostało całe koło barw. Na nieszczęście jednak podstawowe barwy A, B i C leżą poza kołem; oznacza to, że monochromatyczne źródła światła nie mogą dać takich barw. Jedyne, co możemy 220 uzyskać stosując jako źródło światło widzialne, to trójkąt równoboczny wpisany w koło (rys. 5-26). Koło barw dobrze przedstawia znaczną część zjawisk związanych ze spostrzeganiem barw. Ale jest to tylko opis zjawiska, a nie jego wyjaśnienie. Pokazuje nam, jak po zmieszaniu barw podstawowych można uzyskać dowolne spostrzegane przez nas barwy. Kiedy rozpatrujemy koło barw, podstawowymi mogą być trzy dowolne barwy wybrane zgodnie z przedstawionymi wyżej zasadami. Ale jeszcze do tej pory nie zastanawialiśmy się nad tym, jakie są rzeczywiste barwy podstawowe systemu wzrokowego. BARWNIKI I ŚWIATŁA Zasady koła barw dotyczą mieszania świateł, a nie barwników. Aby określić, jakie barwy uzyskamy przez zmieszanie farb, musimy pamiętać, że barwa farby zależy od stopnia pochłaniania przez nią całego światła wszystkich długości fal, z wyjątkiem jednej. To właśnie światło odbija się od pomalowanej powierzchni i powoduje, że spostrzegamy daną barwę. Aby określić rezultat zmieszania dwu barwników, musimy wiedzieć, jakiej długości fale będą pochłaniane przez tę mieszaninę. Ponieważ absorpcja barw jest najistotniejszą właściwością farby, mieszaniny te nazywamy absorpcyjnymi. Mieszaniny świateł nazywamy addytywnymi. Mieszanina świateł czerwonego i zielonego może dać światło żółte. Mieszanina światła niebieskiego i żółtego da nam światło szare (rys. 5-21). Takie są fakty z mieszania barw, choć niewątpliwie są one sprzeczne z tym, co większość ludzi dowiedziała się o mieszaniu barw na lekcjach rysunków. Skąd się biorą te różnice? Odpowiedź jest taka, że wiążą się one z różnicami między połączeniem dwu świateł a połączeniem dwu barwników, mimo że ich barwy mają tę samą nazwę. Aby odpowiedzieć na pytanie, jaką barwę uzyskamy po zmieszaniu, nie trzeba wiedzieć, jakie barwy były zmieszane. Ważniejsze jest inne pytanie: jakie barwy dostrzeże oko? Rozpatrzmy mieszaninę świateł (rys. 5-27). Promień niebieskiego światła pada na kartkę papieru: światło niebieskie odbite od kartki wpada do oka i kartka widziana jest jako niebieska. Oświetlmy kartkę światłem żółtym. Światło to odbija się również i widzimy żółtą kartkę. Teraz oświetlmy kartkę równocześnie światłem niebieskim i żółtym. Obie wiązki światła odbijają się od kartki i uzyskana w ten sposób barwa spostrzegana jest jako mieszanina obu wiązek: w tym wypadku szara. Rozpatrzmy mieszaninę barwników (rys. 5-27). Pomalujcie kartkę papieru na niebiesko. Następnie skierujcie na papier białe światło. Farba pochłonie z niego wszystkie składowe części o długich falach, tak że odbijają się tylko fale krótkie: zielona, niebieska i fioletowa. Oko widzi mieszaninę tych trzech barw - kartka jest niebieska (rys. 5-27). Pomalujcie białą kartkę na żółto. Skierujcie na nią białe światło. Farba pochłania wszystkie składowe części o krótkich falach, odbijając jedynie zielone, żółte, pomarańczowe i czerwone. Oko widzi mieszaninę tych barw - papier jest żółty (rys. 5-27). Pomalujcie kartkę papieru mieszaniną niebieskiej i żółtej farby, oświetlcie ją białym światłem. Niebieska farba pochłania wszystkie jego składniki o długich falach (żółty, pomarańczowy, czerwony), a farba żółta - wszystkie komponenty o falach krótkich (niebieski i fioletowy). 222 Pozostaje wyłącznie środkowa część widma: promienie zielone. I właśnie te promienie odbijają się od papieru. Mieszaninę farby niebieskiej i żółtej widzimy jako barwę zieloną (rys. 5-27). Co zrobić, aby barwniki mieszały się tak jak światło? Zasady mieszania barw ustalone w wyniku eksperymentów ze światłem stosują się również do mieszania farb. Załóżmy, że chcemy uzyskać barwę żółtą przez zmieszanie barwników czerwonego i zielonego. Podczas mieszania farb należy zachować daleko idącą ostrożność. Jeżeli po prostu wymieszamy farby, a następnie uzyskaną mieszaninę przeniesiemy na papier, to uzyskamy ciemną barwę, prawdopodobnie z czerwonym odcieniem. Dzieje się tak dlatego, że mieszając barwniki uzyskujemy efekt ich interferencji. Jeżeli przedtem nałożymy na papier czerwoną farbę w formie gęsto położonych kropek (z daleka papier wyglądać będzie jak czerwony), a następnie na ten sam papier nałożymy kropki zielonej barwy tak aby wypełniły one wszystkie luki między czerwonymi kropkami i żeby nigdzie nie nakładały się jedna na drugą, z bliska czerwone i zielone kropki widziane będą jako oddzielne. Jednak z daleka oddzielnych kropek już nie można odróżnić, oko odbierze mieszaninę czerwonego i zielonego światła i papier będzie wyglądał tak jakby był pomalowany żółtą farbą. Na tych właśnie zasadach opiera się telewizja kolorowa. Wystarczy spojrzeć na obraz z bliska, aby zobaczyć, że składa się on z oddzielnych kolorowych punktów. Na długo przed erą telewizji kolorowej malarz impresjonista, George Seurat (1859-1891), eksperymentował z addytywnymi mieszaninami barw; jego obrazy składają się z barwnych plam, które to oglądane z pewnej odległości dają zamierzony przez artystę efekt barwny. Obrazy następcze RYSUNEK 1-49. [ Rysunek przedstawia dwa białe trapezy na czarnym tle z zaznaczonym punktem fiksacji. Lewy trapez pokryty jest zielonymi serduszkami, prawy jest cały biały.] Wpatrujcie się w czarną kropkę na lewym rysunku nie poruszając głową ani oczami tak długo, aż cała figura zacznie migotać, drgać. Wtedy przenieście szybko wzrok na czarną kropkę prawego białego rysunku. Zobaczycie różowe serca na zielonkawym tle (kilkakrotne mrugnięcie okiem przyśpiesza pojawienie się efektu następczego). Różowa barwa to obraz następczy, zielona jest indukowana" (zmodyfikowane na podstawie The Color Tree, Interchemical Corp., New York 1965). Wpatrujcie się uparcie w barwny wzór przedstawiony na rysunku 1-49 (wkładka kolorowa ) tak długo aż obraz zacznie lekko „falować". Następnie przenieście wzrok na białą powierzchnię; zobaczycie obraz następczy barwnego wzoru. Barwa tego obrazu prawie dokładnie odpowiada barwie dopełniającej pierwotnie obserwowanego obrazu. Tak więc koło barw wskazuje nam również, jakie barwy wystąpią w obrazach następczych: barwa obrazu następczego leży nieomal naprzeciw barwy, na którą patrzył uprzednio obserwator (barwy dopełniające dla obrazu następczego nie są rozmieszczone dokładnie naprzeciw siebie, występuje tu pewne przesunięcie, które nie zostało jeszcze w pełni wyjaśnione; przypuszcza się, że ten niewielki błąd w przewidywaniu barwy wynika z nieznacznego zabarwienia wnętrza oka, które powoduje pewną wybiórczą absorpcję części widma świetlnego). Obrazy następcze są odwracalne. Jeżeli barwa niebieska daje obraz następczy o barwie żółtej, to żółta barwa daje obraz następczy o barwie niebieskiej. Jednak pewne odcienie zieleni dają purpurowe obrazy następcze, chociaż w widmie nie ma części monochromatycznej, odpowiadającej barwie purpurowej. Purpura oraz powiązane z nią barwy nie są barwami widmowymi. Barwy te możemy jednak umieścić w kole barw, pod warunkiem, że będziemy znali ich komponenty. Przedstawić je można przez określenie długości ich fal. Przypatrzmy się ponownie kołu barw-purpura zajmuje w nim miejsce między fioletem (długość fali 400 nm) i czerwienią (długość fali 700 nm), które to barwy po zmieszaniu dają intensywną purpurę. W ten sposób koło barw pozwala nie tylko wyjaśnić pochodzenie mieszaniny barw, 223 ale również określa prawidłowe miejsce barw pozawidmowych. Wyjaśnienie obrazów następczych jest łatwe. Przedłużające się oddziaływanie oglądanego obrazu wywołuje zmęczenie receptorów, co pozwala systemowi konkurencyjnemu wziąć górę, a to prowadzi do stymulacji neutralnej. Wykorzystując to zjawisko indukowania barwy, możemy uzyskać barwy „nienaturalne". Jeżeli będziemy patrzeć przez jakiś czas na nasyconą zieleń, a następnie przeniesiemy wzrok na nasyconą czerwień, to odbierzemy ją jako czerwień supernasyconą. Receptory zieleni uległy zmęczeniu. Nie mogą one już mieszać się z czerwienią i zmniejszać jej nasycenia. Taka barwa czerwona jest jaśniejsza aniżeli ta, którą wytwarzają zwykle promienie monochromatyczne. Efekt ten można wzmocnić przez dodanie indukowanej barwy. Popatrzcie na mocno czerwoną figurę leżącą na mocno zielonym tle, a następnie na mocno zieloną figurę leżącą na mocno czerwonym tle. Możecie zrobić to z łatwością sami mając do dyspozycji kolorowe diapozytywy, z tym że jeden powinien być negatywem, drugi zaś pozytywem (taśma kolorowa). Rzutujmy je następnie na ekran naprzemiennie, tak aby padały ściśle na to samo miejsce. Efekt wystąpi bardziej wyraziście przy szybkiej wymianie diapozytywów. WRAŻLIWOŚĆ CZOPKÓW NA BARWY W trakcie bezpośredniego mierzenia wrażliwości czopków na barwę wykryto trzy rodzaje czopków; każdy typ czopków zawiera specjalny pigment, który odpowiada określonej selektywnej wrażliwości na barwy. Różnorodne pigmenty w różnym stopniu pochłaniają światło, działają wybiórczo w odniesieniu do fal określonej długości. Jeden z nich pochłania przede wszystkim światło o długości fali od 445 do 450 nm, drugi od 525 do 535 nm; maksymalna selektywność ostatniego mieści się w granicach 555 do 570 nm. Ogólna charakterystyka pochłaniania światła przez różnorodne pigmenty jest zbliżona do tego, co zostało przedstawione na rysunku 5-28. Trzem podstawowym barwom odpowiadają trzy typy receptorów (A, B i C) warunkujących normalne widzenie wszystkich barw.[Rysunek 5-28 przedstawia wykres zależności proporcji kwantów światła padającego na rogówkę, które jest pochłaniane przez pigment wzrokowy, od długości fali w nanometrach dla receptorów typu A, B i C.] Na podstawie wrażliwości tych podstawowych receptorów można wyjaśnić niemal wszystkie zjawiska widzenia barw. Na przykład, z koła barw wynika fakt, że mieszanina zieleni (520 nm) i czerwieni (620 nm) nie powinna różnić się od barwy żółtej (o długości fali 564 nm). Jaki to ma związek z wrażliwością czopków przedstawionych na rysunku 5-28? Niech pionowa oś na wykresie przedstawia ilościową charakterystykę pobudzenia każdego z trzech receptorów barw przez światło o intensywności równej 100, przy danej długości fali przedstawionej na osi poziomej. Zastanówmy się teraz, co w wyniku tego trzymamy, kiedy 100 jednostek długości 620 nm zmiesza się ze 100 jednostkami długości 520 nm. 225 Odczytujemy z wykresu wartości A, B i C dla czerwonego i zielonego; wynoszą one odpowiednio: Czerwony (620 nm) – 10; 2; 0 Zielony (520 nm) – 7; 15; 0,2 Razem – 17; 17; 0,2 Suma wskazuje pobudzenie każdego z trzech receptorów przy oddziaływaniu 200 jednostek świetlnych: 100 z czerwienią i 100 z zielenią. Aby krzywe te można było wykorzystać, musimy przeskalować występujące tu wartości. Mamy w sumie 34,2 jednostek pobudzenia nerwowego, w tym receptor A otrzymuje 17 z 34,2, czyli 50 procent ogólnego pobudzenia, receptor B - tyle samo, a receptor C - 1 procent. Powróćmy teraz do krzywych przedstawionych na rysunku 5-28. Poszukajmy tej długości fali, przy której receptory A, B i C są pobudzane w przedstawionych powyżej proporcjach. W danym wypadku łatwo możemy ją odnaleźć. Praktycznie jedyne miejsce, któremu odpowiada równomierne pobudzenie A i B przy nieznacznym pobudzeniu C, mieści się w przedziale 560 i 565 nm. Tak więc mieszanina czerwieni i zieleni jest odbierana jako żółta. Koło barw daje nam tę samą odpowiedź: mieszanina przybierze barwę żółtą. Z przeprowadzonych obliczeń jasno wynika, że dysponujemy prostym, chociaż uciążliwym sposobem, pozwalającym obliczyć dla dowolnego połączenia świateł odpowiednie wielkości pobudzenia w każdym z trzech receptorów i zarazem wyznaczyć, jakie inne kombinacje świateł monochromatycznych wywołają takie samo pobudzenie receptorów. Ponieważ koło barw pozwala nam uzyskać ten sam rezultat, a posługiwać się nim jest znacznie łatwiej, dajemy mu pierwszeństwo. Musimy jeszcze zastanowić się nad tym, jak sygnały z receptorów podstawowych łączą się w systemie wzrokowym. Sprawa ta już od dawna jest powodem poważnych sporów, zasadnicza różnica poglądów dotyczy problemu, czy ośrodki mózgowe wykorzystują bezpośrednio informację płynącą z receptorów podstawowych czy też występują jakieś pośrednie etapy jej przetwarzania. Teoria widzenia barwnego oparta na procesach przeciwstawnych Jeżeli szarą plamę umieścimy w centrum czerwonego pola, to przybierze ona dla obserwatora odcień zielony, to znaczy przybiera barwę dopełniającą do barwy tła. Na spostrzeganie danej barwy duży wpływ wywiera kontekst barwny, który ją otacza, zjawisko to w połączeniu z informacją o barwach dopełniających i ślepocie na barwy stwarza podstawy do przypuszczeń, że w toku pracy aparatu widzenia barw uczestniczą procesy przeciwstawne. Jeszcze w 1878 r. Ewold Hering przedstawił teorię widzenia barw opartą na procesach przeciwstawnych. Zgodnie z tą teorią, barwy mieszają się parami dopełniającymi: niebieska z żółtą, czerwona z zieloną i biała z czarną. 226 RYSUNEK 5-29. Sieć fizjologiczna na podstawie De Valois i Jacobsa (1968).[Zobrazowano różne sposoby łączenia się receptorów, otrzymując pary: Czerwone (plus) Zielone (minus); Czerwone (minus) Zielone (plus); Czarne (minus) Białe (plus); Czarne (plus) Białe (minus); Niebieskie (plus) Żółte (minus); Niebieskie (minus) Żółte (plus);] Ocena jasności odbywa się na podstawie reakcji mechanizmu „czarny - biały", a barwy powstają w wyniku kombinacji mechanizmów „niebieski-żółty" i „czerwony-zielony". W systemie procesów przeciwstawnych trzy podstawowe receptory barwy, oznaczone na rysunku 5-29 literami A, B i C, łączą się ze sobą w różny sposób. Dokładnie nie wiadomo, jakie są te połączenia, rozpatrywano jednak szereg możliwych wariantów. Na przykład, jeden z takich schematów połączeń trzech receptorów, kiedy w efekcie otrzymujemy pary czerwony-zielony, czarny-biały i niebieski-żółty, jest pokazany na rysunku 5-29. Istnieją również inne możliwe połączenia. Należy przypuszczać, że badania fizjologiczne pozwolą w najbliższych latach na ustalenie rzeczywistych połączeń. Bez względu na to, że szczegóły ciągle pozostają niewyjaśnione, sam fakt występowania rozlicznych połączeń między receptorami został stwierdzony zarówno w eksperymentach psychofizycznych, jak i fizjologicznych. Na przykład, badania fizjologiczne włókien w ciałach kolankowatych bocznych u małp pozwoliły wykryć receptory, których aktywność rośnie w trakcie drażnienia światłem czerwonym, ale maleje pod wpływem zielonego światła. Jest to dokładnie taki sam efekt, jaki można przewidzieć opierając się na teorii procesów przeciwstawnych. Inne receptory reagują odwrotnie; aktywność ich wzrasta jako reakcja na światło zielone, a obniża się jako reakcja na światło czerwone (rys. 5-30 a, b, c). Wykryte zostały również pary niebieski-żółty, chociaż jest ich (przynajmniej u przebadanych małp) znacznie mniej niż par czerwony-zielony. Jest to zgodne z faktem, że system niebieski-żółty jest mniej wrażliwy aniżeli czerwony-zielony. 227 RYSUNEK 5-30a a) Reakcje zarejestrowane przez jedną mikroelektrodę wprowadzoną do ciała kolankowatego bocznego małpy pokazują nam procesy przeciwstawne komórki; (plus): reakcje na fale długie (czerwone) (minus): reakcje na fale krótkie. RYSUNEK 5-30b RYSUNEK 5-30c b, c) Średnie reakcje różnorodnych klas przeciwstawnych neuronów w mózgu małpy. Trzy krzywe na każdym z wykresów przedstawiają trzy różne poziomy intensywności (energii) mierzone w dowolnych jednostkach. Z publikowanych danych De Valois, Abramova iJacobsa (1966). 230 Kontrast indukowany Podczas spostrzegania przedmiotów zarówno barwnych, jak i czarno-białych widzenie jednych z nich ma wpływ na spostrzeganie innych. Jest to spowodowane hamowaniem obocznym. To samo zjawisko jest odpowiedzialne za wzrost kontrastu oraz stałość jasności. Jeżeli będziemy patrzeć na niebieską plamę pobudzającą daną część siatkówki, to stwierdzimy, że obniża się przy tym wrażliwość na barwę niebieską w sąsiednich częściach, a w następstwie wzrasta wrażliwość na barwę żółtą. Przy patrzeniu na biel zwiększa się wrażliwość na sąsiadującą czerwień, a przy patrzeniu na czerwień wzrasta wrażliwość na zieleń. Takim zjawiskom kontrastu nadano nazwę kontrastu przestrzennego albo kontrastu indukowanego: każda barwa indukuje barwę dopełniającą w sąsiadujących z nią częściach pola. Aby wyjaśnić te stwierdzenia, musimy przyjąć założenie, że jeden neuron podstawowy, będąc pobudzony, hamuje wszystkie otaczające go neurony tego samego rodzaju. Inaczej mówiąc, każdy z trzech podstawowych receptorów barw A, B i C hamuje otaczające receptory A, B i C. Ponieważ receptory te połączone są w pary i tworzą systemy przeciwstawne, hamowanie jednego receptora jest równoznaczne z zwiększeniem wrażliwości receptora przeciwstawnego. W wyniku mamy do czynienia z kontrastem barwy. Najsilniejszy efekt kontrastu uzyskujemy w wypadku barw dopełniających. W rzeczywistości patrzenie na pary barw dopełniających może wywołać przykre uczucie, ponieważ indukowana barwa wywołana oddziaływaniem przestrzennym jest spostrzegana jako bardziej intensywna, silniej nasycona, aniżeli przywykliśmy ją spostrzegać normalnie (patrz rys. 5-31 -wkładka kolorowa). RYSUNEK 5-31. [Rysunek przedstawia dwa prostokąty o tych samych wymiarach. Górny jest cały biały z zaznaczonym punktem fiksacji wzroku, dolny przedstawia spłaszczone niebieskie okręgi na czerwonym tle.] Wpatrujcie się w punkt fiksacji w środku dolnego rysunku. Następnie spójrzcie w punkt fiksacji górnego prostokąta. Zobaczycie pierścienie i tło w barwach dopełniających (zmodyfikowane na podstawie The Color Tree, Interchemical Corp., New York, 1965). Przyjrzyjcie się zielonym sercom na rysunku 1-49 (wkładka kolorowa). RYSUNEK 1-49. [ Rysunek przedstawia dwa białe trapezy na czarnym tle z zaznaczonym punktem fiksacji. Lewy trapez pokryty jest zielonymi serduszkami, prawy jest cały biały.] Wpatrujcie się w czarną kropkę na lewym rysunku nie poruszając głową ani oczami tak długo, aż cała figura zacznie migotać, drgać. Wtedy przenieście szybko wzrok na czarną kropkę prawego białego rysunku. Zobaczycie różowe serca na zielonkawym tle (kilkakrotne mrugnięcie okiem przyśpiesza pojawienie się efektu następczego). Różowa barwa to obraz następczy, zielona jest indukowana" (zmodyfikowane na podstawie The Color Tree, Interchemical Corp., New York 1965). Skoncentrujcie wzrok na czarnym punkcie, dopóki nie wystąpi migotanie obrazu, tzn. dopóki nie pojawi się obraz następczy. Przenieście teraz wzrok na białą powierzchnię. Tak, teraz widzicie obraz następczy z różowymi sercami, ale skąd znalazł się tam również kolor zielony? To właśnie efekt indukcji. Przy tej okazji zrozumieliście również, dlaczego zaczyna występować migotanie barw, jeżeli długo patrzymy na obraz. Zauważcie, że migotanie występuje silniej przy krawędziach obrazów. Nieuniknione drobne ruchy oczu wywołują drganie tej części obrazu, zmieniając jego położenie na siatkówce, co daje oscylacje między dwiema różnymi barwami po obu stronach krawędzi obrazu. Podczas nieruchomego obserwowania męczą się szybciej receptory odbierające tę część obrazu, gdzie barwa się nie zmienia, receptory odpowiadające krawędziom nie są tak zmęczone i bardziej podlegają wpływom kontrastu. Tak więc nierównomierna adaptacja receptorów powoduje migotanie spostrzeganego obrazu. Indukowanie barw zawiera w sobie wiele możliwości. Tak np. Edwinowi Land z Polaroid Corporation udało się zademonstrować możliwość uzyskania prawie pełnego zestawu spostrzeganych barw w wyniku posługiwania się mieszaniną dwu barw. Eksperymenty Landa przez jakiś czas bulwersowały zwolenników teorii trzech komponentów widzenia barwnego. Jednakże rezultaty uzyskane przez niego stanowiły najwyraźniej efekt 231 ukrytego działania systemu barw przeciwstawnych i były wynikiem kontrastu przestrzennego. Obie barwy, jakimi posłużył się Land, nie były monochromatyczne, lecz raczej były to dość duże obszary widma, jeden krótkofalowy, a drugi długofalowy. Gdyby zastosować metodę Landa wykorzystując obie monochromatyczne fale świetlne, to nie udałoby się otrzymać pełnego zestawu barw. Barwy uzyskane przez Landa pojawiają się tylko przy szerokiej gamie barw różnych przedmiotów, a w takich warunkach maksymalizują się efekty indukowanych barw. W wypadku dwu prostych wiązek promieni monochromatycznych, barwy Landa będą identyczne z tymi, jakich moglibyśmy oczekiwać stosując zasady koła barw. 6. System słuchowy FIZYKA DŹWIĘKU Częstotliwość dźwięku Intensywność dźwięku DECYBELE BUDOWA I FUNKCJONOWANIE UCHA Ucho wewnętrzne Ruchy błony podstawowej Komórki wioskowe (włosowate) REAKCJE ELEKTRYCZNE NA DŹWIĘK Krzywe strojenia (tonów) Charakterystyka czasowa reakcji neuronów Kodowanie intensywności informacji Przetwarzanie informacji słuchowej Detektory zmian częstotliwości 233 Ucho ludzkie jest nadzwyczaj skomplikowane. Na pierwszy rzut oka może się wydawać, że w istocie jest po prostu tubą, łączącą świat zewnętrzny z małą wewnętrzną membraną - błoną bębenkową. Drgania powietrza wywołują drgania błony bębenkowej. Jednak zewnętrzne części ucha, małżowina uszna, przewód słuchowy, błona bębenkowa, mają najmniejsze znaczenie dla jego prawidłowego funkcjonowania. Drgania błony bębenkowej jako reakcja na zmiany ciśnienia powietrza-to zaledwie początek długiego łańcucha zdarzeń, które w końcowym rezultacie prowadzą do odebrania dźwięku. Proces przechodzenia dźwięku przez ucho aż do wywołania sygnałów nerwowych obejmuje wiele złożonych etapów. Przyjrzyjcie się rysunkom 6-1 [rysunek głowy ludzkiej wraz z zaznaczeniem dokładnego umiejscowienia aparatu słuchowego] i 6-2 [rysunek ucha wraz z całym aparatem słuchowym]. Najpierw fala dźwięku dochodząca do ucha przechodzi przez przewód słuchowy i powoduje drgania błony znajdującej się na końcu tego przewodu - tzw. błony bębenkowej. Drgania te są przenoszone dalej do następnej błony, tzw. okienka owalnego poprzez trzy małe kosteczki ucha środkowego. Okienko owalne stanowi wejście do spiralnej struktury kostnej ucha wewnętrznego zwanej ślimakiem. 234 Drgania okienka owalnego wprowadzają w ruch płyn znajdujący się w ślimaku, który to ruch zostaje przekazany błonie leżącej wewnątrz wzdłuż spirali, tzw. błonie podstawowej. Drgania te odbierane są przez całe rzędy włosków leżących na błonie podstawowej, co powoduje, że komórki, z którymi są one powiązane, wytwarzają impulsy nerwowe niosące informację akustyczną do mózgu. Każdy z tych etapów ma swoje ważne miejsce w tym złożonym procesie. Zadanie nasze będzie polegało na wykryciu, jak każde z wymienionych tu ogniw drogi dźwięku przyczynia się do powstania przekazu nerwowego wysyłanego przez nerw słuchowy do mózgu i jak ten przekaz jest dekodowany na psychiczne doznania dźwięku, muzyki i mowy. FIZYKA DŹWIĘKU Dźwięk to zmiany ciśnienia powietrza. Jeżeli jakiś przedmiot „wydaje dźwięk", to powoduje on rozprzestrzenianie się fal dźwiękowych w otaczającym go środowisku. Ciśnienie dźwiękowe, mierzone w pewnej odległości od źródła dźwięku, nie daje pełnego obrazu 235 ciśnienia dźwięku generowanego przez źródło. Po części dzieje się tak dlatego, że fala rozprzestrzeniając się w powietrzu słabnie, ale po części wskutek różnego rodzaju odbijania i załamywania się fali, spowodowanego przez napotykane na jej drodze przedmioty. Częstotliwość dźwięku Zmiany ciśnienia powietrza w fali dźwiękowej można przedstawić graficznie w postaci sinusoidy (rys. 6-3). Aby opisać falę (o kształcie sinusoidy) należy określić trzy parametry: jak szybko się zmienia (częstotliwość fali), jak silne ciśnienie wytwarza (jej amplituda) i gdzie się zaczyna (faza). Ogólnie mówiąc (z pewnymi wyjątkami, które opiszemy dalej), im większa amplituda sinusoidy, tym silniejszy dźwięk, im większa częstotliwość, tym wyższy dźwięk. Na przykład, fala sinusoidalna o częstotliwości 261,63 drgań na sekundę odpowiada pod względem wysokości nucie środkowego C w skali muzycznej. Częstotliwość jednego herca (Hz) odpowiada jednemu drganiu na sekundę. [Jednostka częstotliwości pochodzi od nazwiska niemieckiego fizyka, Heinricha R. Hertza (1857-1894). Częstotliwość określa się też często w kilohercach (kHz), 1 kHz równa się 1000 Hz. Chociaż opis zmian ciśnienia dźwiękowego w czasie daje możliwość pełnego opisania dźwięku, często wygodniej jest opisać falę w zupełnie inny sposób. Spójrzcie na krzywe ilustrujące zmiany ciśnienia dźwiękowego, przedstawione na rysunkach 6-4 i 6-5. Te złożone fale są trudne do mierzenia. Łatwiej będzie, jeśli rozłożymy je na składniki, tzn. na szereg prostych fal sinusoidalnych. Rozumowanie to jest oparte na twierdzeniu matematyka Fouriera (1768-1839), który udowodnił, że dowolna skomplikowana fala (z pewnymi ograniczeniami) może być przedstawiona jako suma fal sinusoidalnych o określonej częstotliwości i intensywności. 236 Takie rozłożenie fali na jej składowe częstotliwości nazywa się analizą Fouriera (rys. 6-6). Przedstawienie złożonych fal w postaci ich sinusoidalnych składowych jest najbliższe temu, co rzeczywiście zachodzi w uchu. W istocie ucho przeprowadza, z grubsza biorąc, coś w rodzaju analizy Fouriera. Jeżeli brzmią jednocześnie dwa dźwięki harmoniczne z częstotliwością 440-Hz (nuta A powyżej środkowego C) i 698-Hz (F), to połączenie takie odbierane jest jako akord, a nie jako jeden złożony dźwięk. Fakt ten po raz pierwszy zarejestrował niemiecki fizyk, Georg Ohm (1787-1854), stąd odpowiedniość między tym, co słyszymy, 237 a tym, co dźwięk sobą przedstawia w postaci odrębnych składowych znana jest jako prawo Ohma (Jest to ten sam Ohm, który ogłosił prawo Ohma w dziedzinie elektryczności; ten sam Ohm, lecz prawo inne.) W odniesieniu do światła sprawa wygląda zupełnie inaczej. Kiedy czerwone światło (długość fali 671 nm) miesza się ze światłem zielonym (długość fali 536 nm), to w efekcie zmieszania uzyskujemy światło widziane jako żółte (długość fali 589 nm). W odróżnieniu od systemu słuchowego, system wzrokowy nie odbiera oddzielnie różnych częstotliwości, które oddziałują na niego. Fale wzrokowe łączą się w oku i nie ma śladu ich odrębnych składników. Intensywność dźwięku Podobnie jak intensywność światła, rozpiętość intensywności dźwięku jest ogromna - od najsłabszego dźwięku, ledwie odbieranego przez ucho ludzkie, do dźwięku wywołującego ból fizyczny. 238 Na przykład przy 2000 Hz największa intensywność dźwięku, jaką człowiek może jeszcze wytrzymać, jest tysiąc miliardów razy silniejsza od najsłabszego odbieranego dźwięku. Tej ogromnej rozpiętości intensywności natężenia nie da się przedstawić bezpośrednio. Stosuje się więc skondensowany zakres intensywności dźwięku poprzez wykorzystanie decybeli (dB) (tabela 6-1). Tabela 6-1 przedstawia jaką poszczególne dźwięki posiadają intensywność w decybelach Start rakiety kosmicznej z ludźmi na pokładzie (z odległości 45 m) – 180dB Próg bólu – 150dB Głośny grzmot, zespół rockowy – 110dB Krzyk – 100dB Rozmowa – 80dB Cichy szept – 30dB Próg słyszalności przy 1000 Hz – 0dB Dalsza część tabeli podaje częstotliwość dźwięków w hertzach Najniższa nuta na fortepianie – 27,5 Hz Najniższa nuta śpiewaka (bas) – 100 Hz Najniższa nuta na klarnecie – 104,8 Hz Środkowe C na fortepianie – 261,6 Hz Standardowa wysokość strojenia (A powyżej środkowego C) – 440 Hz Najwyższa nuta śpiewaczki (sopran) – 1000 Hz Najwyższa nuta na fortepianie – 4180 Hz Tony harmoniczne instrumentów muzycznych – 10000 Hz Granica słyszalności ludzi starszych – 12000 Hz Granica słyszalności – 16000 do 20000 Hz 239 DECYBELE 1. Podwajając (lub zmniejszając o połowę) stosunek intensywności sygnałów dodaje się (lub odejmuje) 3 dB 2. Mnożąc (lub dzieląc) stosunek intensywności sygnałów przez 10 dodaje się (lub odejmuje) 10dB. 3. Jeżeli dwa dźwięki różnią się o 10n dB, to stosunek ich intensywności wynosi 10 do potęgi n. Na przykład różnica 60 - dB w intensywności dwóch dźwięków oznacza, że jeden z nich jest 10 do potęgi szóstej (1 milion) razy silniejszy niż drugi. 4. Ponieważ decybele odnoszą się do stosunku dwu intensywności, stwierdzenie, że jakiś dźwięk ma intensywność 65 dB jest całkowicie pozbawiona sensu, chyba że znany jest poziom, z którym dokonujemy porównań. Na ogół, jeśli spotkacie takie określenie, oznacza to, że dany dźwięk jest 65 dB intensywniejszy od międzynarodowego standardowego poziomu odniesienia, za jaki przyjęto 0,0002 dyny na cm kwadratowy. Ten standard odnosi się do dźwięku o bardzo niskiej intensywności. Jest to w przybliżeniu najniższa intensywność dźwięku o częstotliwości 1000 Hz, jaką może wykryć ucho ludzkie. BUDOWA I FUNKCJONOWANIE UCHA Ucho wewnętrzne Dla psychologa jedną z najważniejszych części ucha jest niewielka spiralowata struktura kostna mieszcząca się w uchu wewnętrznym, zwana ślimakiem (rys. 6-7 i 6-8). Ślimak to przewód zakręcony 2,5 raza (u człowieka), wypełniony wewnątrz słonym roztworem. Ślimak człowieka ma 0,5 cm długości i 1 centymetr szerokości. W obudowie kostnej ślimaka znajdują się dwa otwory. Jeden z nich nazywany okienkiem owalnym okryty jest błoną, która łączy się z ostatnią z kosteczek słuchowych. 240 Drgania z błony bębenkowej poprzez kosteczki ucha środkowego przechodzą przez tę błonę do ślimaka. Ponieważ ślimak jest wypełniony nieściśliwym płynem, niezbędny jest jakiś mechanizm umożliwiający przekazanie ciśnienia wytwarzanego w okolicy okienka owalnego. Dokonuje się to dzięki istnieniu w ścianie kostnej drugiego małego otworu, również pokrytego cieniutką błoną; mieści się on w dolnej części ślimaka i nosi nazwę okienka okrągłego (rys. 6-7 i 6-8). Wewnątrz ślimaka znajduje się nadzwyczaj skomplikowany mechanizm, który przetwarza sygnały napływające z zewnątrz w postaci zmian ciśnienia w sygnał elektryczny, przekazywany do nerwu słuchowego. Łatwiej możemy przeanalizować ten mechanizm rozwijając ślimak (co można wykonać jedynie teoretycznie, gdyż praktycznie jest to nieosiągalne), aby zobaczyć, co kryje on w swym wnętrzu (rys. 6-9). Dwie błony biegnące wzdłuż całego ślimaka dzielą go na trzy wąskie kanały, wypełnione cieczą. Nas interesuje tu przede wszystkim błona podstawowa (rys. 6-10). Błona ta ciągnie się od początku ślimaka (podstawy), gdzie kosteczki ucha środkowego wywołują drgania okienka owalnego, prawie do jego końca (wierzchołka). 241 Między błoną i ściankami ślimaka pozostaje niewielka przestrzeń. Rozłożona błona podstawowa ma około 3,5 centymetra długości, a szerokość jej wzrasta w kierunku od okienka owalnego do wierzchołka. Powiększanie się szerokości błony podstawowej odgrywa bardzo ważną rolę w jej funkcjonowaniu. Ruchy błony podstawowej Ciśnienie oddziałujące z zewnątrz na okienko owalne powoduje ciśnienie w cieczy znajdującej się nad błoną podstawową i rozprzestrzenia się natychmiast wzdłuż całej błony. (Fala ciśnienia rozprzestrzenia się wzdłuż ślimaka w czasie jednej dwudziestej milionowej części sekundy.) Dzięki temu rodzaj aktywności wywołanej w błonie podstawowej 242 nie zależy od tego, w jakim miejscu ślimaka nastąpiło pobudzenie. Jeżeli bodziec działałby nie na okienko owalne, lecz na wierzchołek ślimaka, cały układ reagowałby równie sprawnie. Sama błona podstawowa nie reaguje natychmiast na działające na nią ciśnienie. Jeżeli zaczniemy obserwować błonę w momencie, kiedy okienko owalne zaczyna drgać, to zobaczymy zjawisko wędrującej fali. Początkowo wybrzusza się ona przy okienku owalnym, a następnie wybrzuszenie to stopniowo przemieszcza się wzdłuż błony aż do wierzchołka ślimaka. Fala przechodzi z jednego końca błony podstawowej do drugiego w ciągu kilku milisekund. Odległość, jaką pokonuje, i szybkość jej rozprzestrzeniania zależne są od częstotliwości fali dźwiękowej. Ta wędrująca fala jest rezultatem elastycznych właściwości błony. Przypomnijmy, że błona rozszerza się w kierunku od okienka owalnego do wierzchołka ślimaka. Twardość jej również zmienia się - w części wierzchołkowej jest ona 100 razy sztywniejsza niż przy okienku owalnym. 243 Czynniki te w połączeniu z kształtem geometrycznym, jaki ma ślimak, powodują stopniowy wzrost amplitudy wybrzuszenia, wywołanego przez fale dźwiękową, w miarę jak przechodzi ona dalej od okienka owalnego. Od częstotliwości dźwięku zależy, w jakim punkcie błony fala osiągnie największe rozmiary, po czym fala szybko wygasa w miarę jej dalszego przesuwania się do końca błony. Przy dźwiękach o wysokiej częstotliwości maksymalne wybrzuszenie występuje w tej części błony podstawowej, która znajduje się w pobliżu okienka owalnego, w pozostałej części błony aktywność jest słaba. Przy dźwiękach o niskiej częstotliwości wybrzuszenie przesuwa się do samego wierzchołka i osiąga maksymalną amplitudę dopiero na końcu błony (rys. 6-11 i 6-12). Istota tych drgań polega na tym, że dźwięki o różnych częstotliwościach przetwarzane są w aktywność zlokalizowaną w różnych punktach błony podstawowej. To przekodowanie częstotliwości sygnału dźwiękowego na drgania w określonym miejscu błony podstawowej potwierdza to, co powiedzieliśmy poprzednio, że „ucho dokonuje analizy Fouriera napływającego sygnału". Komórki włoskowe (włosowate) Błona podstawowa jest w istocie kawałkiem skóry i tak jak na skórze znajdują się na niej komórki włoskowe. Komórki te stanowią część złożonej struktury, zwanej narządem Cortiego, który jest umiejscowiony wzdłuż górnej części błony (rys. 6-13). Człowiek ma około 25 000 takich komórek włoskowych, które tworzą dwie warstwy rozdzielone łukowatym sklepieniem. Komórki znajdujące się po jednej stronie łuku, bliżej zewnętrznej strony ślimaka, mają nazwę komórek włoskowych zewnętrznych i ułożone są w 3 do 5 rzędów. Komórki włoskowe znajdujące się po drugiej stronie łuku zwane są komórkami włoskowymi wewnętrznymi; zazwyczaj rozmieszczone są w jednym rzędzie. Ogólna liczba zewnętrznych komórek wynosi około 25000, a z każdej z nich wystaje około stu włosków. Komórek włoskowych wewnętrznych jest zaledwie około 3500. Ponieważ komórki włoskowe są ściśnięte między dwiema błonami narządu Cortiego, każdy ruch błony podstawowej powoduje deformację ich włosków. A ponieważ błona podstawowa jest przymocowana, to oddziałuje silniej na komórki włoskowe zewnętrzne niż na wewnętrzne. 245 RYSUNEK 6-13. Mikrofotografia narządu Cortiego sporządzona za pomocą elektronowego mikroskopu skanningowego razy 370. Źródło: Bredberg, Lindeman, Ades, West i Engstrom (1970). 246 Naciski i naprężenia przekazywane na komórki włoskowe wywołują aktywność w powiązanych z nimi włóknach nerwowych, wytwarzając impulsy elektryczne, które są przenoszone przez nerw słuchowy. REAKCJE ELEKTRYCZNE NA DŹWIĘK Doskonale zorganizowane reakcje mechaniczne ucha nie miałyby żadnego znaczenia, gdyby nie było sposobu na przetworzenie tej aktywności na sygnały odbierane przez układ nerwowy. Reakcje mechaniczne przekształcają częstotliwość i natężenie dźwięku w drgania błony podstawowej. Informacja ta zostaje z kolei przeanalizowana przez komórki nerwowe, które przekazują sygnał poprzez odpowiednie drogi do mózgu. Krzywe strojenia (tonów) Dzięki precyzyjnym metodom chirurgicznym można wprowadzić bardzo małą elektrodę bezpośrednio do nerwu słuchowego, gdzie będzie ona rejestrowała wszystkie impulsy przepływające przez pojedyncze włókno. Pierwsza rzecz, jaką można zauważyć, to fakt, że włókno takie jest stale aktywne. Nawet w sytuacji braku jakichkolwiek bodźców dźwiękowych przekazuje ono do 150 impulsów na sekundę. Ta aktywność własna czy też spontaniczna, mimo braku jakiegokolwiek sygnału zewnętrznego, jest charakterystyczna dla większości neuronów sensorycznych. Badając neuron należy przede wszystkim ustalić, na jakiego rodzaju sygnały on reaguje. W tym celu zaczniemy od ekspozycji czystego tonu o umiarkowanej intensywności i wysokiej częstotliwości, powiedzmy 10000 Hz, i następnie powoli będziemy obniżać częstotliwość. Początkowo będzie nam się wydawało, że neuron zupełnie nie reaguje na ton; wykazuje on tylko aktywność spontaniczną. Kiedy częstotliwość osiąga pewną wielkość krytyczną 247 (tzw. częstotliwość krytyczną), reakcja neuronu nasila się i osiąga swój szczyt. W miarę dalszego obniżania częstotliwości, aktywność neuronu ponownie słabnie aż do momentu, kiedy osiągnie on wyjściowy poziom aktywności spontanicznej. Reakcje neuronu na różne częstotliwości przedstawione zostały na rysunku 6-14.[wykres tempa reakcji w impulsach na sekundę, w zależności od częstotliwości w hertzach] Neuron ten jest najbardziej wrażliwy na ton o częstotliwości 400 Hz. Przy wyższych częstotliwościach aktywność jego obniża się dość gwałtownie. Przy częstotliwościach niższych spadek aktywności jest znacznie wolniejszy. Właśnie tego typu reakcji należy oczekiwać, jeżeli badany neuron reaguje bezpośrednio na poziom aktywności w określonej części błony podstawowej. Załóżmy, że neuron rejestruje reakcje komórek włoskowych w części leżącej w odległości około 24 milimetrów od okienka owalnego. Maksymalne drgania błony w tym miejscu występują przy dźwięku o częstotliwości 400 Hz, ale pewna aktywność pojawia się również i przy innych częstotliwościach. Na rysunku 6-15 przedstawiona została amplituda drgań przy częstotliwości od 25 do 1600 Hz. Po prawej stronie przedstawiono amplitudę drgań błony jako funkcję częstotliwości. Charakterystyka czasowa reakcji neuronów Do tej pory interesowała nas jedynie liczba impulsów nerwowych wytwarzanych przez dany sygnał. Ważna również jest charakterystyka czasowa aktywności pojedynczych neuronów. Przeanalizujmy reakcję komórki nerwowej, której częstotliwość krytyczna wynosi 500 Hz. 248 Pełny cykl sygnału trwa dwie milisekundy. Impulsy płynące z komórki odzwierciedlają właściwości czasowe częstotliwości krytycznej: odstęp między impulsami wynosi w przybliżeniu 2 milisekundy. Wyładowania komórki są zsynchronizowane z sygnałem. Czasem impuls nie pojawia się we właściwym momencie, ale kiedy wystąpi ponownie, zostanie zsynchronizowany z powtarzającymi się cyklami sygnału płynącego z zewnątrz. Mówiąc krócej, ton o częstotliwości 500 Hz wywołuje regularną reakcję, której tempo wynosi 500 impulsów na sekundę. Nawet wówczas, gdy komórka nie może reagować z szybkością odpowiadającą jej częstotliwości krytycznej, synchronizacja nadal się utrzymuje. Załóżmy, że komórka o częstotliwości krytycznej równej 500-Hz może wytwarzać maksimum 250 lub 125 impulsów na sekundę. Będzie ona reagować z odpowiednio niższą częstotliwością, będącą wielokrotnością ,,w dół" częstotliwości sygnału, powiedzmy 250, 125 lub nawet 67,5 impulsów na sekundę, nie będzie jednakże reagować na dźwięk o częstotliwości 500 Hz wytwarzaniem 73 albo 187 impulsów na sekundę. W świetle rozważań o właściwościach drgań błony podstawowej taka zsynchronizowana 249 aktywność nie jest czymś nieoczekiwanym. Kiedy błona reagując na zmianę ciśnienia podnosi się w górę, deformując równocześnie komórki włoskowe, znajdujące się między nią a leżącą powyżej błoną pokrywającą, to wywołuje w ten sposób impuls nerwowy. Ruch błony w dół nie wywołuje natomiast żadnej reakcji na dźwięk. Ruch w górę pojawia się w wyniku obniżenia ciśnienia w płynie nad błoną, a następuje to tylko wówczas, gdy w fazie obniżonego ciśnienia (rozrzedzenia) okienko owalne uwypukla się na zewnątrz. Zdolność pojedynczych neuronów do reagowania na zmiany ciśnienia, wywołane przez napływający z zewnątrz sygnał, sugeruje nam jeden ze sposobów kodowania częstotliwości. Częstotliwość sygnału może być określona bezpośrednio przez tempo impulsów albo też przez średni odstęp między nimi. Fakt, że pojedyncze włókna mogą okazać się niezdolne do reagowania na pewne zmiany ciśnienia wywołane przez dany sygnał (szczególnie przy wyższych częstotliwościach) nie stanowi problemu. Wiele włókien bierze udział w rejestrowaniu ruchów dowolnej części błony podstawowej. Pojedyncze włókno może przepuścić kilka cykli, ale włókno sąsiadujące z nim, reagujące na tę samą częstotliwość, prawdopodobnie zareaguje na te opuszczone składniki. Reakcje wszystkich neuronów łącznie powodują salwę impulsów dla każdej fazy rozrzedzenia ciśnienia sygnału. To właśnie obserwujemy w badaniach fizjologicznych. Aktywność regularnie podnosi się i opada wraz ze zmianami ciśnienia sygnału. Nerw słuchowy potrafi rejestrować sygnały o tak wysokich częstotliwościach, jak 3000 do 4000 Hz. Częstotliwości te znacznie przewyższają częstotliwość, jaką może osiągnąć pojedynczy neuron. Przy częstotliwościach przekraczających 4000 Hz regularna, cykliczna reakcja nerwu słuchowego przekształca się w niezorganizowany, ciągły potok impulsów RYSUNEK 6-16. Teoria „salwy". Każdy cykl fali dźwiękowej wywołuje reakcję co najmniej w jednym szeregu włókien, tak że częstotliwość pobudzeń zostaje utrzymana w łącznym rozkładzie reakcji włókien a-f. Przy większej intensywności pobudzenia (niżej) na dany cykl reaguje nie jedno, lecz więcej włókien. Źródło: Wever (1970). Kodowanie intensywności informacji Reakcje neuronów nerwu słuchowego na zmiany intensywności są znacznie mniej złożone, aniżeli ich reakcje na zmiany częstotliwości. Reguła jest tu taka: jeżeli przy zwiększonym natężeniu sygnału jego częstotliwość pozostaje niezmieniona, to tempo reakcji neuronu wzrasta. Oczywiste jest, że istnieją granice tego wzrostu. W praktyce w pojedynczej komórce o poziomie aktywności własnej równym 200 wyładowaniom na sekundę, przy zmianie intensywności sygnału do 10 decybeli, częstotliwość może się podnieść, powiedzmy do 300 wyładowań na sekundę, jednak dalszy wzrost intensywności sygnału nie będzie prowadził do odpowiedniego podwyższenia tempa reakcji. Tak więc, skala intensywności sygnałów, którą zdolna jest kodować większość komórek, jest stosunkowo wąska, zwłaszcza w porównaniu z ogólną skalą słyszalności. Poza tym istnieje olbrzymia różnorodność zarówno podstawowych poziomów aktywności, jak i reakcji pojedynczych komórek na zwiększenie intensywności sygnału. Oczywiste jest też, że przy podwyższeniu tempa wyładowań komórki musi ono być wciąż zsynchronizowane z falą dźwiękową. A zatem, jeśli odrębna komórka ma własne tempo wyładowań 250 równe 200 impulsom na sekundę, to pierwszą jej reakcją na dźwięk będzie zmiana spontanicznej, niezorganizowanej aktywności na aktywność zsynchronizowaną z sygnałem, a dopiero potem nastąpi zwiększenie liczby impulsów nerwowych w reakcji na sygnał dźwiękowy, jednakże przy pełnej ich synchronizacji. Kiedy informacja o podstawowej częstotliwości i intensywności zostanie zakodowana przez nerw słuchowy, sygnał w końcu zostaje skierowany do mózgu. Na drodze sygnału do mózgu zachodzi szereg różnorodnych operacji (rys. 6-17a i 17b). Wydobyta zostaje specyficzna informacja słuchowa, zlokalizowane zostaje źródło dźwięku i w ogólnym zakresie określona zostaje siła i wysokość dźwięku. RYSUNEK 6-17a): Droga od ucha do kory słuchowej. Widok przekroju mózgu od tyłu. RYSUNEK 6-17b): Pień mózgu wraz z lokalizacją miejsc przedstawionych na rys. a). 251 Przetwarzanie informacji słuchowej Jak to zostało przedstawione w poprzednich rozdziałach, neurony tworzące system wzrokowy reagują zawsze na cechy istotne sygnału wzrokowego. Potrafią odróżnić linie i kąty, ruch i barwę. Istnieje cała hierarchia wyspecjalizowanych neuronów-detektorów: od neuronów typu „centrum-peryferie" do prostych, złożonych i superzłożonych detektorów. A co możemy powiedzieć o systemie słuchowym? Co dzieje się z informacją słuchową przekazywaną z ucha do mózgu? 252 Odpowiedź na to pytanie nie może być w pełni zadowalająca, ponieważ bardzo niewiele wiemy o istocie procesu przetwarzania informacji słuchowej w układzie nerwowym. W pewnym sensie nasz brak wiedzy jest odbiciem niedostatecznego rozumienia procesu analizy sygnałów słuchowych. W przypadku sygnałów wzrokowych wiadomo dokładnie, że linie i kontury, kąty i ruch odgrywają ważną rolę w rozpoznawaniu obrazów. A jakie są analogiczne właściwości dla sygnałów słuchowych? Czy w takiej roli występują czyste lub złożone tony, stałe czy też zmieniające się dźwięki. Tego po prostu nie wiemy. Właściwości mowy ludzkiej pozwalają przypuszczać, że dla jej odbioru posiadamy wyspecjalizowane detektory dźwięku. Mowa wraz ze wszystkimi swymi właściwościami jest, jak się wydaje, trwale związana ze specyfiką aparatów: głosowego i słuchowego, ale ciągle nie wiadomo, w jaki sposób właśnie mechanizmy słuchowe wyodrębniają specyficzne cechy mowy. Prawdą jest, że większość badań fizjologicznych dotyczących słuchu przeprowadza się przede wszystkim na kotach i małpach i chociaż zwierzęta te nie potrafią mówić, 253 można przypuszczać, że ich mechanizmy słuchowe powinny przejawiać pewne cechy specyficzne dla systemu rozpoznawania obrazów. Jest rzeczą oczywistą, że neurony kory słuchowej muszą przeprowadzać jakąś skomplikowaną analizę. Świadczy o tym chociażby fakt, że około 40 procent neuronów tej części kory zupełnie nie reaguje na czyste tony, a reaguje jedynie na dźwięki bardziej złożone, na przykład szumy albo zgrzyty (Whitfeld, 1967). Jest możliwe, że neurony te w rzeczywistości przeznaczone są do reagowania wyłącznie na specjalne, określone dźwięki, ale jak na razie zdołano jedynie stwierdzić, że tym określonym dźwiękiem jest po prostu zgrzyt albo szum. Nawet te 60 procent neuronów, które reagują na czyste tony, dokonuje tego w sposób wielce skomplikowany. Niektóre z nich reagują na pojawienie się tonu zwiększeniem tempa wyładowań (reakcja pobudzeniowa). Inne znów obniżają tempo wyładowań (reakcja hamująca). Niektóre odpowiadają tylko w momencie włączenia dźwięku (reakcja włączeniowa), inne-tylko w chwili wyłączenia go (reakcja wyłączeniowa), a jeszcze inne zarówno w chwili włączenia, jak i wyłączenia dźwięku (reakcja włączeniowo - wyłączeniowa) (patrz rys. 6-18). RYSUNEK 6-18. Różnorodne typy reakcji neuronu na pobudzenie dźwiękowe wywołane w pierwotnej korze słuchowej nie znieczulonego kota. Źródło: Whitfield (1967). Reakcje te są oczywiście zbliżone do reakcji zachodzących w systemie wzrokowym. Niektóre neurony kory słuchowej charakteryzują się stałą krzywą aktywności własnej o ostrych wierzchołkach, inne pozbawione są tej właściwości. Jeszcze inne reagują tylko na zmiany częstotliwości (detektory zmian częstotliwości). Czasem dźwięk o określonej częstotliwości powoduje wstrzymanie reakcji na dźwięk o innej częstotliwości (komórki interakcyjne). Detektory zmian częstotliwości. Liczne komórki w korze słuchowej (w każdym razie u kota) są wrażliwe wyłącznie na zmiany częstotliwości. Nie reagują one na czyste dźwięki o stałej częstotliwości, niezależnie od ich intensywności i częstotliwości. Dźwięk o stałej intensywności i zmieniającej się częstotliwości nosi nazwę sygnału o modulowanej częstotliwości albo sygnału o wędrującej częstotliwości. Na rysunku 6-19 przedstawiona została typowa reakcja neuronów wrażliwych na sygnał o modulowanej częstotliwości (częstotliwość sinusoidalnie obniżała się i podwyższała). Liniowe zmiany częstotliwości sygnału powodują pojawienie się schodkowej modulacji sygnału. Typowy sygnał wraz z odpowiadającą mu reakcją neuronu przedstawiono na rysunku 6-20. RYSUNEK 6-20. a) Neuron reaguje na podwyższenie, ale nie na obniżenie tonu w tym samym przedziale częstotliwości. b) Neuron reaguje na obniżenie, ale nie na podwyższenie tonu. Źródło: Whitfield i Evans (1965). Zwróćcie uwagę na to, że neurony odpowiadają jedynie na zmiany częstotliwości w określonych kierunkach. Przy modulacji sinusoidalnej pokazany neuron reaguje tylko na wzrost częstotliwości sygnału. Przy schodkowej modulacji częstotliwości zaprezentowano dwa różne typy neuronów: jeden reagujący wyłącznie na wzrost częstotliwości, a drugi-tylko na jej obniżenie. Jak wyglądałby obwód nerwowy dla tych detektorów zmian częstotliwości? Rozpatrując zmiany częstotliwości w błonie podstawowej, pojawiające się w trakcie zmian częstotliwości sygnału dźwiękowego, widzieliśmy, że zmianie częstotliwości towarzyszy przesuwanie się maksymalnej stymulacji wzdłuż błony podstawowej. 254 A zatem, jeżeli chcielibyśmy zbudować detektor przemieszczania się aktywności wzdłuż błony, to łącząc ze sobą komórki reagujące na odpowiednie częstotliwości podstawowe (zupełnie tak samo jak łączyliśmy jednostki typu centrum-peryferie w rozdziale 2) otrzymalibyśmy detektor zmiany częstotliwości. Podobnie jak detektory ruchu wrażliwe na ruch w jednym kierunku, detektor zmiany częstotliwości byłby wrażliwy tylko na podwyższenie lub tylko na obniżenie częstotliwości, ale nigdy na jedno i drugie równocześnie. U kota wykryto trzy różne typy detektorów modulacji częstotliwości (Whitfield, 1967). Wszystkie wrażliwe są tylko na częstotliwości w przedziałach określonego pasma, podobnie jak i wcześniej omawiane właściwości krzywej strojenia. Jednak reagują one nie na dowolny dźwięk w przedziale rozpiętości krzywej strojenia, a jedynie na dźwięki, których częstotliwość albo: 1. podwyższa się, 2. obniża się, 3. podnosi się w części skali o niskiej częstotliwości i obniża się w jej części o wysokiej częstotliwości (rys. 6-21). RYSUNEK 6-21. Po lewej: Neurony reagujące jedynie na podwyższenie tonu w dowolnym punkcie zakresu ich wrażliwości. W środku: Neurony reagujące na podwyższenie tonu w zakresie niskich częstotliwości i na obniżenie tonu w zakresie wysokich częstotliwości. Źródło: Whitfield i Evans (1965). 256 Po co potrzebne są kotu wymienione detektory zmiany częstotliwości? Tego nie wiemy. Wiadomo, że nietoperze mają ich niezwykle dużo, najwidoczniej są one istotne w procesach orientacyjnych nietoperzy, zwłaszcza przy ich zdolnościach echolokacyjnych, polegających na wysyłaniu sygnałów akustycznych, a następnie analizie fal odbitych, co pozwala nietoperzom określić rozmieszczenie oraz odległość przedmiotów w otaczającym je środowisku. Czy ludzie posługują się detektorami zmiany częstotliwości? Tego również nie wiemy. Jest jednak możliwe, że taka informacja byłaby użyteczna dla bardzo złożonych struktur dźwiękowych, z którymi mamy do czynienia podczas analizy mowy. 7. Wymiary dźwięku GŁOŚNOŚĆ Warstwice równej głośności Słuchanie muzyki Kompensatory głośności Maskowanie Eksperyment z maskowaniem Mechanizm maskowania Maskowanie w muzyce Pomiar głośności Sony WYSOKOŚĆ DŹWIĘKU Skala muzyczna Skala melowa Teoria miejsca: położenie błony podstawowej Cykliczność wysokości dźwięku Głośność i wysokość Nieobecność tonu podstawowego Argumenty przeciw nieliniowości Maskowanie nieobecnego tonu podstawowego Wyjaśnienie na podstawie teorii miejsca Wyjaśnienie na podstawie teorii periodyczności ODRÓŻNIANIE WYSOKOŚCI DŹWIĘKU BEZ UDZIAŁU BŁONY PODSTAWOWEJ Argumenty przeciw teorii periodyczności spostrzegania wysokości dźwięku Dwoistość teorii spostrzegania wysokości dźwięku KRYTYCZNE PASMO CZĘSTOTLIWOŚCI PRZESTRZENNE SPOSTRZEGANIE DŹWIĘKU Lokalizacja Interakcje dwuuszne Znaczenie słyszenia dwuusznego Lokalizacja Różnice poziomów maskowania Maskowanie Zapis dźwięku Efekt pierwszeństwa 259 Dźwięki orkiestry tworzą bogaty materiał dla doświadczenia słuchowego. Zespoły estradowe, muzyka elektroniczna, dźwięki syntetyzatorów - wszystko to wpływa w zróżnicowany sposób na emocje słuchaczy. Nowa technika zapisu dźwiękowego stwarza dla słuchaczy możliwość ponownego odtworzenia takich wydarzeń, jak konferencja, przemówienie, koncert, a także wytwarzanie nie istniejących w przyrodzie efektów dźwiękowych; jak dźwięki tworzone przez współczesnych kompozytorów dzięki odpowiedniej aparaturze elektronicznej. W tym samym czasie różne źródła hałasu zanieczyszczają środowisko człowieka. Huk samolotów przeszkadza i męczy; czasami hałas ten stanowi jedynie nieprzyjemną przeszkodę, a niekiedy wdziera się zakłócając tok normalnego życia, jak też powoduje zmęczenie psychiczne czy nawet trwałe uszkodzenie fizyczne. Wszystkie te właściwości dźwięku dotyczą sfery psychologii. Dzięki posiadanej wiedzy o mechanizmach funkcjonowania ucha i o psychologicznych wymiarach dźwięku, głośności i wysokości, oraz dzięki badaniom zjawisk maskowania i spostrzegania przestrzennego dźwięku, psycholog może wyjaśniać i przewidywać wiele właściwości spostrzegania słuchowego. W rozdziale tym zajmiemy się niektórymi z różnorodnych doznań słuchowych, wywołanych przez dźwięk. Przeanalizujemy cztery kwestie: głośność, wysokość, krytyczne pasmo częstotliwości i przestrzenne spostrzeganie dźwięku. W każdej kwestii zaczniemy od wyłożenia aktualnych danych naukowych, a następnie przeprowadzimy wywód o znaczeniu praktycznym rozpatrywanego zjawiska. Ponadto przeanalizujemy rolę tych czterech czynników w spostrzeganiu muzyki, mowy i hałasu. Bardziej techniczne aspekty mierzenia dźwięku przedstawione są w Dodatku A. GŁOŚNOŚĆ Głośność dźwięku zależy od jego intensywności (natężenia) i częstotliwości. Przy stałej częstotliwości dźwięki o większej intensywności wydają się głośniejsze niż dźwięki słabe. Ale przy stałej intensywności dźwięki o bardzo wysokiej i bardzo niskiej częstotliwości wydają się znacznie cichsze niż dźwięki o średniej częstotliwości. Jest to szczególnie obserwowalne na krańcach skali słyszalności. Niech sygnał dźwiękowy (gwizd) ma średnią częstotliwość przy średnim poziomie intensywności. Jeżeli utrzymując stałą intensywność będziemy zmieniać częstotliwość, tak aby spadła poniżej 20 Hz albo podniosła się powyżej 20 000 Hz (można to osiągnąć wyłącznie za pomocą aparatury elektronicznej - a nie po prostu gwiżdżąc), to utwierdzimy się w przekonaniu, że przy krańcowych częstotliwościach dźwięk przestanie być słyszalny. Głośność zależy więc od częstotliwości choćby z tego powodu, że skala częstotliwości odbieranych przez ucho ludzkie jest ograniczona. Ale głośność zależy również od częstotliwości w normalnych granicach skali słyszalności. 260 Warstwice równej głośności Wzajemny wpływ częstotliwości i natężenia na spostrzeganą głośność możemy z łatwością dostrzec, jeżeli poprosimy osoby badane o porównanie dwu tonów charakteryzujących się różnymi częstotliwościami i intensywnością. Posłużmy się jako wzorcem wybranym tonem o stałej częstotliwości 1000 Hz, intensywności 400 dB i czasie trwania 0,5 sek. i nazwijmy go tonem standardowym. Ton drugi będzie tonem porównywanym. Niech również trwa 0,5 sek., ale przy innej częstotliwości, na przykład 3000 Hz. Zadanie osoby badanej polega na przemiennym wsłuchiwaniu się w ton standardowy i ton porównywany i regulowaniu intensywności tego ostatniego tak, aż osiągnie dokładnie taką głośność, jaką ma ton standardowy. 261 Kiedy to nastąpi, przestawiamy ton porównywany na inną częstotliwość i powtarzamy całą procedurę. Typowy rezultat pokazany jest na rysunku 7-1. Każda z krzywych określa intensywności, przy których tony o różnych częstotliwościach charakteryzują się tą samą głośnością, jaką ma ton standardowy. Krzywa ta zwana jest krzywą warstwicy równej głośności. Poziom głośności, który ta krzywa przedstawia, jest równy głośności wzorca, a to dlatego, że przy jej tworzeniu zmieniano częstotliwość tonu, utrzymując głośność równą głośności tonu standardowego. Na rysunku 7-1 [Warstwice równej głośności na podstawie danych Robinsona i Dadsona (1956).] pokazane są wyniki eksperymentu, w którym wykorzystano wiele różnych tonów standardowych. Dla każdej krzywej ton standardowy zawsze miał częstotliwość 1000 Hz, ale jego intensywności były różne. Krzywa oznaczona liczbą 40 odpowiada omawianemu przypadkowi - ton standardowy miał intensywność 40 dB, a częstotliwość 1000 Hz. Krzywa oznaczona liczbą 100 przedstawia warstwicę równej głośności, uzyskaną przez porównanie różnych częstotliwości z tonem standardowym o intensywności 100 dB i częstotliwości również 1000 Hz. Najniższa warstwica (linia przerywana) wskazuje absolutny próg wrażliwości ucha na różne częstotliwości. Dźwięki poniżej tej linii są niesłyszalne. Dźwięki, których głośność pokrywa się z tą linią, są ledwie słyszalne (i z tego względu przyjmuje się, że są równoważne pod względem głośności). Druga linia krańcowa - najwyższa warstwica - odpowiada bardzo głośnym dźwiękom, wywołującym w uchu początkowo wrażenie „łechtania", a przy dalszym wzroście intensywności odczucie bólu. Dźwięki na tym poziomie mogą uszkodzić ucho. (Uszkodzenie ucha może być spowodowane także przez dźwięki o znacznie słabszej intensywności, jeżeli oddziałują one przez dłuższy czas.) Zwróćcie uwagę na to, że warstwica równej głośności, odpowiadająca progowi bólowemu, jest bardziej płaska niż warstwica, która odpowiada progowi słyszalności. Jeżeli dźwięki mają wysoką intensywność, to brzmią jednakowo głośno, bez względu na ich częstotliwość. Słuchanie muzyki Interesująco przedstawia się analiza miejsca, jakie zajmują różne instrumenty muzyczne na warstwicach równej głośności. Fortepian ma największą rozpiętość częstotliwości, w przybliżeniu od 30 do 4000 Hz. „Do" pierwszej oktawy, czyli środkowe C (C4) na fortepianie ma częstotliwość około 260 Hz (ściśle 261,63). [Indeksy przy literach wskazują, do jakiej oktawy należy dana nuta. Zastosowano tu standardowy system notacji używany przez akustyków, choć nie zawsze przez muzyków. Pierwsze C na klawiaturze fortepianu oznaczone jest C1. Wszystkie nuty wchodzące w oktawę, którą rozpoczyna C1, otrzymują indeks 1 :D1, E1,... B1. Drugie C na klawiaturze i wszystkie następujące po nim nuty otrzymują indeks 2: C2,... B2. Wedle tego schematu środkowe C na klawiaturze fortepianu ma indeks 4 (C4). Nuta strojenia instrumentów orkiestrowych to A4. Najwyższa nuta fortepianu to C8, a najniższa A0 (patrz: Backus, 1968). Aby lepiej wyobrazić sobie położenie tych częstotliwości na warstwicach równej głośności, na rysunku 7-1 przedstawiono klawiaturę fortepianu i wskazano, jakiej części krzywych ona odpowiada. 263 Na rysunku 7-2 przedstawiono rozpiętość częstotliwości dla różnych instrumentów muzycznych. Okazuje się, że większa część dźwięków wydawanych przez instrumenty muzyczne znajduje się w strefie, w której percepcja głośności uzależniona jest od zmian w częstotliwości. Fakt ten ma dwa następstwa: po pierwsze, jeżeli nie słuchacie muzyki symfonicznej na poziomie rozsądnej intensywności dźwięków, to wiele z częstotliwości emitowanych przez instrumenty nie będzie słyszalnych; po drugie, względna głośność brzmienia różnorodnych instrumentów, tak precyzyjnie obmyślona i regulowana przez dyrygenta, zależy od tego, czy słuchacie jej przy zachowaniu tej samej głośności, jaką przewidywał dyrygent dla jej wykonania w sali koncertowej. Słuchając w domu nagrań muzyki symfonicznej, z trudem możemy wyregulować aparaturę odtwarzającą, tak aby odtworzyć natężenie dźwięków występujące w sali koncertowej. Słyszycie muzykę nie na tych warstwicach głośności, na które zaplanował ją dyrygent; tak więc słyszycie inny utwór muzyczny niż ten, który dyrygent chciał wam zaprezentować. Dobrze znamy problem związany z odtworzeniem w warunkach domowych muzyki w takim brzmieniu, jakie miała w momencie nagrywania. Rozważmy fragment utworu symfonicznego, granego tak, aby jego głośność była w przybliżeniu jednakowa we wszystkich częstotliwościach (rys. 7-3). [W tym samym układzie współrzędnych naniesiono krzywą intensywności dźwięku podczas koncertu symfonicznego, intensywności dźwięku podczas nagrywania w domu, oraz krzywą progu słyszalności. Na osi pionowej – intensywność dźwięku w decybelach, na osi poziomej – częstotliwość w hertzach.] Przy odtwarzaniu zapisu tego fragmentu ogólny obraz wydaje się identyczny, ale intensywność dźwięku obniża się; wówczas okazuje się, że poziomy niektórych dźwięków znajdują się poniżej progu słyszalności. Niskie częstotliwości, które tak świetnie słyszymy na koncercie, teraz w ogóle nie występują. Ponadto wraz ze zmianą głośności zmienia się również względna głośność dźwięku na różnych poziomach częstotliwości. Jeżeli będziemy grać bardzo głośno gamę na organach, przechodząc od rejestrów dolnych do górnych, to- dla słuchaczy wszystkie dźwięki będą wydawały się w przybliżeniu jednakowo głośne 264 (przy wysokiej intensywności warstwice równej głośności są względnie płaskie). Jednakże, kiedy odtworzymy zapis tej gamy w domu na rozsądnym poziomie głośności, to nie tylko pewne niskie częstotliwości nie będą słyszalne, ale trafią do strefy, w której częstotliwość wpływa na głośność; będzie się wydawało, że dźwięki stają się coraz to głośniejsze aż do momentu osiągnięcia dwóch lub trzech oktaw powyżej środkowego C, wtedy głośność ich zacznie słabnąć. (Zwróćcie uwagę, że-jak to przedstawiono na rys. 7-1 -w miarę jak częstotliwość zaczyna się obniżać i przekraczać poziom 1000 Hz, natężenie dźwięku musi rosnąć tak, 265 aby dźwięki były odbierane jako jednakowo głośne; tak więc, jeśli natężenie jest stałe, to w momencie obniżenia częstotliwości dźwięki są odbierane jako cichsze.) Kompensatory głośności. Obecnie większość wysokiej jakości wzmacniaczy dźwięku konstruowana jest z myślą o uwzględnieniu wspomnianych czynników psychologicznych. Za pomocą kompensatora głośności, a czasem zwykłego regulatora głośności dźwięku, można wzmocnić bardzo niskie albo też bardzo wysokie dźwięki (przy niskich poziomach dźwięku). Przy wysokich poziomach dźwięku kompensator głośności wyłącza się automatycznie. Na rysunku 7-4 przedstawiono działanie regulatora głośności. W rezultacie otrzymujemy odbieraną głośność, podobną do przedstawionej na rysunku 7-5. Aby prawidłowo wykorzystać kompensator, należy uwzględnić akustykę pomieszczenia, w którym znajdują się kolumny głośnikowe, jak też parametry zestawu aparatury dźwiękowej, którą się posługujemy. Maskowanie Głośność dźwięku zależy nie tylko od jego intensywności lecz również od innych towarzyszących mu dźwięków. Dźwięki maskują się wzajemnie. Występowanie jednego dźwięku stwarza czasem trudności w usłyszeniu innych. Szelest papieru, oklaski, kaszel - wszystko to maskuje mowę czy muzykę. Aby określić efekt maskowania, należy zmierzyć, o ile wyższą intensywność musi mieć testowany dźwięk, aby był słyszalny, pomimo występowania dźwięku maskującego. W swej istocie procedura ta jest podobna do tej, jaką zastosowano w celu uzyskania warstwie równej głośności. Eksperyment z maskowaniem. Jedna z metod służących do przeprowadzenia takiego eksperymentu polega na tym, że badanemu przedstawia się dwa tony; jeden z nich nazywa się tonem testowym, drugi maskującym. Ton maskujący ma pewną stałą częstotliwość i intensywność. Ton testowy również ma jakąś stałą częstotliwość, a jego intensywność zmieniana jest tak długo aż ton ten stanie się ledwie słyszalny. Procedura ta jest powtarzana z tonami testowymi o różnej częstotliwości tak długo aż zostanie wykreślona cała krzywa maskowania, dokładnie wskazująca, jaką intensywność powinien mieć ton testowy przy różnych częstotliwościach, aby można go było wykryć mimo maskującego dźwięku. Kiedy krzywa maskowania dla danego dźwięku maskującego zostanie już ustalona, można zmienić jego częstotliwość lub intensywność i wykreślić nową krzywą maskowania. Typowy wynik takiego eksperymentu przedstawia rysunek 7-6. [W tym badaniu dźwięk maskujący nie był czystym tonem, ale wąskim pasmem szumu. Szum daje wyniki wyraźniejsze niż ton. Poza tym różnice w maskowaniu wywołanym przez czysty ton w porównaniu z wąskopasmowym szumem są niewielkie i raczej technicznej natury.] W tym wypadku częstotliwość tonu maskującego wynosiła 1200 Hz, a jego intensywność zmieniała się od 20 do 110 dB, skokami co 10 dB, tak że w efekcie otrzymano 10 różnych krzywych maskowania. 266 Najbardziej zadziwiającą właściwością tych wyników jest ich asymetria. Dźwięk maskujący wywiera względnie słaby wpływ na tony o niższej częstotliwości niż jego własna (1200 Hz), ale znacznie utrudnia słyszenie tonów o wyższej częstotliwości. Mechanizm maskowania. Jedno z wyjaśnień tej asymetrii pochodzi z badania nad rozchodzeniem się drgań w błonie podstawowej. Jak to widać na rysunku 7-7, dźwięki o niskiej częstotliwości wzbudzają aktywność względnie dużej części błony, podczas gdy wysokie częstotliwości oddziałują na znacznie bardziej ograniczony jej odcinek. Jeżeli zbadamy te zjawiska dokładniej (jak na rys. 7-8), będziemy mogli porównać drgania błony podstawowej wywołane dźwiękiem maskującym oraz tonami testowymi. Jeżeli ton testowy jest słaby i nieco przewyższa częstotliwością ton maskujący, nie obserwuje się żadnej aktywności błony poza wywołaną przez ton maskujący. Ale ten sam słaby ton, jeżeli ma niższą częstotliwość niż ton maskujący, wzbudza odrębną aktywność w innej części błony i zaczyna być słyszalny. Tak więc, wraz z podwyższeniem się poziomu sygnału, sygnał testowy i maskujący zamieniają się rolami. Ton testowy o niskiej częstotliwości i względnie wysokiej intensywności maskuje ton maskujący. Maskowanie w muzyce. Maskowanie stanowi jeszcze jeden dodatkowy czynnik spostrzegania głośności dźwięków i muzyki. Głośno brzmiące instrumenty o niskich częstotliwościach maskują dźwięki wydawane przez instrumenty cicho brzmiące o wysokich częstotliwościach. Altówki maskują skrzypce, kotły maskują altówki, miedziane instrumenty dęte maskują drewniane. Kiedy jednak wszystkie te dźwięki są odtwarzane w domu, intensywność ich jest niższa niż wtedy, gdy były nagrywane. W rezultacie zmienia się model maskowania i nagle stają się wyraźnie słyszalne delikatne dźwięki skrzypiec czy gitary, a to dlatego, że znacznie obniżono poziom dźwięków basowych. Czy o to chodziło? 268 Niezupełnie. Kompozytor, dyrygent, członkowie orkiestry nie liczyli na to; ich intuicja muzyczna uwzględniała efekt maskowania i jego wpływ na słuchaczy. Usunięcie efektu maskowania oznacza zniszczenie równowagi dźwiękowej między instrumentami, tak precyzyjnie przemyślanej i zgodnej z ich rozmieszczeniem. Pomiar głośności Pomiar głośności ma ważne znaczenie dla rozwiązywania wielu problemów praktycznych. Ponieważ psychologiczne spostrzeganie dźwięku nie odpowiada bezpośrednio fizycznym pomiarom jego intensywności, potrzebne są metody uwzględniające te różnice. Sony. Jedna z takich metod oparta jest na ocenie wielkości tonu (magnitude estimatiori). Osobie badanej prezentujemy dwa tony, oba o częstotliwości, powiedzmy, 1000 Hz, i pytamy ją, ile razy wydaje się głośniejszy jeden od drugiego. Pytanie jest trochę niezwykłe, ale osoby badane mogą sobie poradzić i dać odpowiedź sensowną. (Więcej informacji na ten temat i pewne przykłady zawiera Dodatek A.) Rezultaty uzyskane za pomocą metody oceniania wielkości wskazują, że głośność wzrasta wraz z pierwiastkiem sześciennym intensywności dźwięku. A zatem psychologiczna ocena głośności J zależy od fizycznej intensywności dźwięku I, zgodnie z prawem wyrażonym w postaci wzoru: J równa się kI do potęgi 0,3 Ta wartość wykładnika potęgowego (0,3) jest bardzo dogodna, zwłaszcza gdy intensywność dźwięku przedstawiamy w decybelach. Zwiększenie intensywności dźwięku o 10 decybeli zawsze zwiększa głośność dwukrotnie. Ilekroć podwyższamy intensywność fizyczną dziesięciokrotnie, psychologiczna głośność wzrasta dwukrotnie (rys. 7-9). Ta metoda pomiaru była standaryzowana przez Międzynarodową Organizację Normalizacji (International Standards Organization). Jednostką głośności jest son. Według definicji, jeden son to jednostka równa głośności tonu 1000 Hz o poziomie intensywności 40 decybeli. W celu uzyskania głośności tonu przy innych częstotliwościach można posługiwać się warstwicami równych głośności. Na rysunku 7-1 wszystkie tony na warstwicy równych głośności oznaczonej liczbą 40 mają głośność równą 1 sonowi. Te zaś, które leżą na warstwicy oznaczonej liczbą 50, mają głośność 2 sonów, a te, które leżą na warstwicy 60, głośność 4 sonów. Po każdorazowym wzroście o 10 decybeli liczba sonów podwaja się, zaś przy każdym obniżeniu o 10 decybeli zmniejsza się o połowę. Za pomocą sonów dokonujemy pomiaru odbieranej głośności tonów czystych. Głośność dźwięków złożonych, zawierających wiele komponentów częstotliwości, jak na przykład różne głosy, dźwięki orkiestry albo hałas samolotów i samochodów, określana jest za pomocą porównywania z tonem standardowym o częstotliwości 1000 Hz. Wielkość w sonach, przy której ton 1000 Hz wydaje się tak samo głośny jak dźwięk złożony, 269 stanowi równocześnie ocenę poziomu tego dźwięku. Wyrażone w sonach poziomy głośności dla niektórych typowych dźwięków zostały przedstawione na rysunku 7-9. [Odczytane z wykresu na rysunku 7-9 przybliżone wartości głośności w sonach i odpowiadające jej intensywności dźwięku w decybelach: szelest liści – 0,2 sona, 20 dB cichy pokój – 1 son, 40 dB cicha rozmowa – 3 sony, 60 dB mówca – 12 sonów, 80 dB ciężarówka – 100 sonów, 110 dB orkiestra rockowa – 400 sonów, 130 dB czucie bólu – 200 do 1500 sonów, 120 do 140 dB uruchomienie pojazdu kosmicznego (z odległości 45 m) – 8000 do 10000 sonów, 170 do 180 dB. WYSOKOŚĆ DŹWIĘKU Skala muzyczna Muzyczna skala wysokości dźwięku jest związana logarytmicznie z częstotliwością dźwięku. Każda następna oktawa standardowej skali muzycznej ma dokładnie dwukrotnie wyższą częstotliwość od poprzedniej. Nuta A4 (A powyżej środkowego C), jaką przyjmuje orkiestra w celu nastrojenia swoich instrumentów muzycznych, ma częstotliwość 440 Hz. 270 A wyższe o jedną i o dwie oktawy (A5 i A6) mają częstotliwość odpowiednio 880 i 1760 Hz. Podobnie A niższe o jedną oraz o dwie oktawy (A3 i A2) charakteryzuje się częstotliwością równą odpowiednio 220 i 110 Hz. A zatem na równomiernie stonowanej skali muzycznej podwyższenie nuty o oktawę powoduje podwojenie jej częstotliwości. Oprócz tego oktawa składa się z 12 dźwięków (licząc wszystkie tony i półtony). Aby dokonać podziału skali częstotliwości objętej oktawą na 12 różnych interwałów, częstotliwość każdej kolejnej nuty powinna być o 2 i iedna dwunasta raza wyższa od częstotliwości nuty, która ją poprzedza. Skala melowa Czy nuta w danej oktawie spostrzegana jest jako dwa razy wyższa niż ta sama nuta w oktawie poprzedniej? Nasza intuicja sugeruje nam odpowiedź twierdzącą, ale dane eksperymentalne wskazują, że odpowiedź jest przecząca. Kiedy osobie badanej eksponuje się różne nuty, a następnie musi ona porównać je pod względem ich wysokości, okazuje się wówczas, że spostrzegana wysokość nie odpowiada skali muzycznej. Podwojenie lub zmniejszenie częstotliwości o połowę nuty nie powoduje tego, że wysokość dźwięku odbierana przez osobę badaną podwaja się lub maleje o połowę (Rezultat ten wynika z procedury oceny wielkości opisanej w Dodatku A.) Rzeczywista zależność między częstotliwością a wysokością przedstawiona została na rysunku 7-10. Jednostką wysokości dźwięku przedstawioną na wykresie jest mel. Zgodnie z definicją, ton o częstotliwości 1000 Hz (przy 60 dB) ma wysokość równą 1000 melów. Chociaż wynik ten może nie odpowiadać naszemu intuicyjnemu wyobrażeniu o wysokości dźwięku, ściśle jednak odpowiada on pewnym pojęciom kompozycji muzycznej. Muzycy często analizują konsekwencje transpozycji utworu z jednej tonacji na inną. Jeżeli na przykład utwór został skomponowany w tonacji C major, a następnie transponowany na A major, jaki to ma wpływ? Jeżeli przejście od jednej do drugiej nuty psychologicznie oceniane jest jednakowo, niezależnie od tego, jakie to były nuty (podobnie podwyższenie nuty o oktawę powoduje podwojenie wysokości dźwięku), to dlaczego transpozycja całej melodii musi wpłynąć na jej odbiór? Psychologiczne różnice między nutami pozostaną takie same, niezależnie od tego, w jakiej tonacji grany jest utwór. Ale większość muzyków uważa, że transpozycja zmienia charakter utworu. Zmiany te są bardzo subtelne, niemniej jednak istnieją. Stwierdzenie to jest zgodne z psychologicznymi ocenami stosunku wysokości dźwięków. Zmiany odbieranej wysokości przy przejściu od C4 do D4 różnią się od zmian przy przejściu od F4 do G4 albo też z C5 do D5. 271 Teoria miejsca: położenie na błonie podstawowej Aby ustalić, co determinuje nasze spostrzeganie wysokości dźwięku, wróćmy ponownie do drgań błony podstawowej. Różnorodne częstotliwości wywołują w błonie specyficzną dla nich aktywność. W miarę przechodzenia od częstotliwości wysokich do niskich maksymalna amplituda drgań błony przemieszcza się od okienka owalnego do wierzchołka ślimaka. Jeszcze w roku 1863 niemiecki fizyk Helmholtz wysunął przypuszczenie, że wysokość tonu zależy od miejsca na błonie, w którym występuje maksymalna amplituda drgań. Chociaż jego rozumowanie było niezbyt ścisłe, wniosek okazał się trafny. Psychologiczna różnica między wysokością dwu tonów najwyraźniej zależy od fizycznej odległości między położeniem punktów maksymalnej aktywności, wywołanych tymi tonami. Obie te funkcje pokazane są na rysunku 7-11. Rozmieszczenie maksymalnej amplitudy drgań wywołanych przez tony o różnych częstotliwościach przedstawione zostało w miarach odległości (mm) od wierzchołka ślimaka. Odbierana wysokość przedstawiona została również w skali melowej. 272 Te dwie funkcje są podobne, ale nie identyczne. Dlaczego te odległości są czynnikiem decydującym? Nie miałyby one większego znaczenia, gdyby w systemie nerwowym nie było odpowiednich mechanizmów nerwowych, które pozwalają na wykorzystanie informacji o odległości. Sposób rozmieszczenia 30 000 włókien nerwu słuchowego wzdłuż błony wskazuje na istnienie takiego mechanizmu. W pobliżu okienka owalnego i w pierwszych zwojach ślimaka zagęszczenie neuronów okazuje się stałe-w przybliżeniu 1150 komórek zwojowych na milimetr. Jednak w miarę zbliżania się do wierzchołka zagęszczenie neuronów obniża się. Jeżeli większe zagęszczenie neuronów zapewnia bardziej dokładną informację, to taki ich rozkład pozwala założyć, że pas odbioru niskich częstotliwości - obszar rozciągający się bliżej wierzchołka ślimaka- powinien być mniej wrażliwy na zmiany aktywności błony. Kiedy krzywa jest skorygowana odpowiednio do zagęszczenia neuronów, widzimy pełną zgodność: każda zmiana wysokości na skali melowej o jeden mel jest w przybliżeniu równa rozprzestrzenianiu się drgań wzdłuż błony na 12 neuronów. Wrażliwość ucha na zmiany częstotliwości można mierzyć bezpośrednio i dokładnie eksponując kolejno osobie badanej pary tonów, a następnie prosząc ją o rozstrzygnięcie, czy miały one identyczną wysokość czy też różną. W ten sposób uzyskujemy pomiar wielkości progu za pomocą różnic ledwo dostrzegalnych (rld) [just noticeable difference (jnd)] między wysokością tonów. Zdolność do takiego różnicowania zmienia się wraz z częstotliwością. Przy częstotliwości 100 Hz niezbędna jest zmiana o 3 procenty (3 Hz), aby zmiana wysokości tonu została dostrzeżona. Ta procentowa wielkość systematycznie się obniża, aż osiągnie minimum-około 0,2 lub 0,3 procenta przy 1000 Hz. Dla niskich częstotliwości różnice ledwie dostrzegalne dla wysokości są w przybliżeniu stałe, tzn. procent zmian potrzebny do uchwycenia różnicy pozostaje względnie stały i wynosi około 0,3 procenta. [Rozkład zmian w różnicowaniu jest podobny dla wielu różnych wymiarów fizycznych, odbieranych przez różne systemy sensoryczne. Na przykład, różnicowanie intensywności sygnału słuchowego wykazuje podobny rozkład, tzn. rld są względnie stałe w wielkościach bezwzględnych sygnału dla niskich intensywności i wykazują mniej więcej stałą wartość procentową dla średnich intensywności obszaru słyszalności. Ten stały procent związany z różnicowaniem jest typowy dla wielu różnych narzędzi pomiarowych. Wynika on stąd, że zmienność pomiarów zależy często od mierzonego poziomu i wzrasta wraz z tym poziomem. W związku z tym wzrasta także bezwzględna wielkość różnicy między sygnałami, niezbędna dla ich odróżnienia. Kiedy te zrosty wielkości powodują stałą procentową zmianę wartości sygnału, to o takim systemie mówi się, że funkcjonuje zgodnie z Prawem Webera [od nazwiska fizjologa Webera (1795-1878) współczesnego Helmholowi]. Jeśli przyjmiemy deltaI za wielkość rld, czyli taką zmianę intensywności sygnału, aby została ona dostrzeżona, gdzie z oznacza intensywność sygnału, to Prawo Webera można zapisać w postaci: I równa się k razy I, gdzie k jest zmianą względną (100k jest zmianą procentową). 273 Jeżeli porównamy próg różnic ledwie dostrzegalnych dla wysokości tonu z odległościami między wierzchołkami maksymalnej aktywności na błonie podstawowej, wywołanymi przez dwie porównywane ze sobą częstotliwości, to zauważymy pełną zbieżność w strefie wysokich częstotliwości oraz rozbieżność w zakresie niskich częstotliwości (rys. 7-12). Ale podobnie jak i uprzednio, trzeba koniecznie uwzględnić rozmieszczenie komórek włoskowych wzdłuż błony. Jeżeli dokonamy modyfikacji krzywej uwzględniając przy tym odpowiednie zagęszczenie neuronów, zgodność wzrośnie. Możemy wykryć różnice między dwiema częstotliwościami pod warunkiem, że wierzchołki ich aktywności przedzielone są na błonie interwałami, odpowiadającymi około 52 neuronom. Określenie miejsca maksymalnej amplitudy drgań wzdłuż błony w połączeniu z uwzględnieniem rozmieszczenia neuronów daje w efekcie obraz zarówno subiektywnego spostrzegania wysokości tonu, jak i wrażliwości ucha na zmiany częstotliwości: 1 rld odpowiada w przybliżeniu 52 neuronom; 1 mel odpowiada w przybliżeniu 12 neuronom. Zwróćcie uwagę na to, że zmiana wysokości równa 1 melowi jest mniejsza od 1 rld, a więc nie może być wykryta. Aby osoba badana mogła zauważyć zmianę, wysokość powinna się zmienić o 4 lub 5 melów. Przy znacznie wyższych częstotliwościach (powyżej 500 lub 1000 Hz) w części, gdzie zagęszczenie neuronów wzdłuż błony jest względnie stałe, rld odpowiada stałej odległości na błonie-około 0,05 mm lub 0,002 cala. 274 Cykliczność wysokości dźwięku Analiza rozchodzenia się drgań wzdłuż błony podstawowej pozwala na wyjaśnienie szeregu zjawisk związanych z naszym spostrzeganiem wysokości dźwięku. Niektóre jednak zagadki pozostają nierozwiązane. Głośność i wysokość. Nasze ucho nie jest zbyt wrażliwe na dźwięki o niskich częstotliwościach, jednakże wiele instrumentów muzycznych wydaje dźwięki o takim zakresie częstotliwości. Tak więc, znaczna część energii cicho zagranej nuty nie jest przez nas odbierana. Co dzieje się z naszym spostrzeżeniem? Oczywiście, nuta grana coraz ciszej i ciszej dźwięczy mniej więcej podobnie, ale dlaczego? Czy ta sama nuta grana na fortepianie nie powinna zmieniać swej wysokości w miarę jak staje się coraz cichsza, ponieważ coraz więcej jej składowych, leżących w paśmie niskich częstotliwości, przestaje być słyszanych? Rozważmy nutę C3 („do" małej oktawy) graną na fortepianie, jest to niezbyt niska nuta. Ma ona tę samą wysokość, jaką ma ton o częstotliwości 131 Hz (dokładniej 130,9 Hz). Ale nuta grana na fortepianie to nie to samo co prosty ton. Spójrzcie na widmo przedstawione na rysunku 7-13. Chociaż przy częstotliwości 131 Hz potrzeba więcej energii niż przy innych częstotliwościach, to jednak i na te inne częstotliwości przypada część energii. Jeżeli nuta grana jest coraz ciszej i ciszej, intensywność składowych o niskiej częstotliwości znajduje się poniżej progu słyszalności. Jeżeli więc na normalnym poziomie głośności najniższa słyszana częstotliwość wynosi 131 Hz, to po obniżeniu poziomu głośności podnosi się ona do 262, następnie do 393 i w końcu do 524 Hz (przy umiarkowanie cichym graniu). Czysty ton o częstotliwości 524 Hz odpowiada wysokością nucie C5. Jest to dość wysoka nuta o całą oktawę wyższa niż środkowe C. Ale wyraźnie dostrzegamy, że zachodzi tu dziwne zjawisko, chociaż nuta muzyczna cichnie, nie wydaje się nam, aby wysokość jej ulegała zmianie (rys. 7-14).[Rysunek przedstawia trzy wykresy odbieranej głośności w funkcji częstotliwości dla różnych rodzajów dźwięku: intensywnego (80dB), średniego (50dB), słabego (20dB).]. Jeżeli wysokość tonu określona jest miejscem na błonie podstawowej, to dlaczego wysokość dźwięku złożonego, jakim jest nuta grana na fortepianie, wydaje się stała nawet po zmianie jej struktury w zakresie częstotliwości? W jaki sposób możemy nadal spostrzegać dźwięk nuty fortepianu zgodnie z jej częstotliwością podstawową na poziomie 131 Hz, 275 kiedy najniższa ze słyszalnych częstotliwości jest równa 524 Hz? W jaki sposób słyszymy nieobecny ton podstawowy? Nieobecność tonu podstawowego. RYSUNEK 7-15. Fluktuacja ogólnego ciśnienia dźwięku pojawiająca się w wyniku nałożenia się dwu sinusoidalnych fal o różnej częstotliwości, tzw. dudnienie. Powstała częstotliwość jest równa różnicy dwu komponentów wyjściowych. Wdanym przypadku sinusoida o częstotliwości 1000Hz nakłada się na sinusoidę o częstotliwości 1100Hz, co daje częstotliwość dudnienia 100Hz. W ten sposób dudnienie powtarza się co 10 milisekund. Zwróćcie uwagę na to, że brak jest jakiejkolwiek energii dźwięku przy częstotliwości 100 Hz. Dodając sygnały o częstotliwości 1000 i 1100 Hz, nie otrzymujemy nowej sinusoidy, lecz po prostu regularne zmiany ciśnienia dźwięku zgodnie z częstotliwością dudnienia. Aby znaleźć odpowiedź na to pytanie, rozważmy prostą sytuację przedstawioną na rysunku 7-15. Dwa czyste tony: 1000 Hz i 1100 Hz dodano w celu uzyskania fali złożonej. Zauważcie, że chociaż przy tym dodają się dwie fale sinusoidalne o częstotliwościach 1000 i 1100 Hz, uzyskana w efekcie fala charakteryzuje się zmiennością w granicach około 100 Hz. 276 Zjawisko przedstawione na rysunku nazywamy dudnieniem. Dwa czyste tony o sinusoidalnym kształcie fal, występując równocześnie dają zjawisko dudnienia: regularne nasilenia i osłabienia energii dźwięku z częstotliwością równą różnicy częstotliwości sumujących się fal. Jednak dudnienie to nie powinno wystąpić na błonie podstawowej. Maksymalna aktywność błony podstawowej odpowiada po prostu rzeczywistym częstotliwościom fal składowych- 1000 i 1100 Hz. W ten sposób, jeżeli spostrzegamy wysokość na podstawie wyodrębnienia punktów maksymalnej amplitudy drgań, powinniśmy spostrzegać składowe o częstotliwości 1000 i 1100 Hz, a nie częstotliwość dudnienia równą 100 Hz. W rzeczywistości słyszymy dudnienie (rys. 7-15). Istnieją dwie możliwe teorie dla wyjaśnienia tego zjawiska. Zgodnie z jedną z nich, spostrzeganie częstotliwości dudnienia jest rezultatem tego, że ucho stanowi niezbyt dokładny przekaźnik dźwięku, charakteryzujący się nieliniowością. Struktura fizyczna ucha (szczególnie ucha środkowego) dodaje do napływającego sygnału akustycznego częstotliwości uzupełniające; zwłaszcza dodawana jest częstotliwość dudnienia i błona podstawowa aktywizuje się w części odpowiadającej tej częstotliwości. To wyjaśnienie jest zgodne z twierdzeniem, że określona wysokość tonu jest spostrzegana tylko dzięki występowaniu odpowiedniego maksimum amplitudy drgań wzdłuż błony, to znaczy odpowiada teorii miejsca w spostrzeganiu wysokości. Druga teoria podkreśla wagę synchronicznych wyładowań neuronów w reakcji na zmieniające się ciśnienie fali dźwiękowej. Wyładowania komórek nerwowych występujące jako reakcja na stan aktywności błony podstawowej zsynchronizowane są z regularnym wznoszeniem się i opadaniem częstotliwości dudnienia. Synchronizacja w reakcjach neuronów 277 jest podstawą spostrzegania wysokości dźwięku; tak twierdzi teoria periodyczności. Są to dwa najważniejsze wyjaśnienia spostrzegania wysokości dźwięku, a badania nad nieobecnością tonu podstawowego stanowią klucz do oceny ich wartości. Argumenty przeciw nieliniowości. Wprowadzenie nieliniowości w toku transmisji dźwięku jest typowe dla wielu systemów mechanicznych i pod tym względem ucho nie stanowi wyjątku. Istnieją jednak dwa źródła informacji nie pozwalające na przyjęcie tego wyjaśnienia w odniesieniu do nieobecności tonu podstawowego. Po pierwsze, ucho nie jest tak zupełnie nieliniowe, szczególnie w wypadku dźwięków o niskim natężeniu. Po drugie, przy wysokich natężeniach - poziom głośności powyżej 80 dB - ucho istotnie pracuje nieliniowo i przedstawione wcześniej wyjaśnienie spostrzegania częstotliwości dudnienia jest wówczas prawidłowe. Przy wysokich poziomach intensywności dźwięku, kosteczki i mięśnie ucha środkowego chronią ucho wewnętrzne, osłabiając napływający sygnał. Ten mechanizm ochronny także wnosi zniekształcenia do przekazywanego sygnału. Liczne badania potwierdziły, że sygnały o wysokiej intensywności istotnie wywołują zjawisko nieliniowości i dodawania właśnie tych tonów, które przewiduje teoria. Ale, co dzieje się z nutą fortepianową o intensywności zaledwie 30 dB? Przy tak niskich intensywnościach zjawisko nieliniowości działa w niewielkim stopniu-na pewno nie na tyle silnie, aby pozwalało wyjaśnić, dlaczego wysokość nuty G1 okazuje się być zgodna z wysokością tonu podstawowego, chociaż on sam leży poniżej progu słyszalności. Maskowanie nieobecnego tonu podstawowego Przeanalizujmy złożony dźwięk utworzony z następujących częstotliwości: 1000 Hz; 1200 Hz; 1400 Hz; 1600 Hz; 1800 Hz; 2000 Hz; 2200 Hz Jeżeli poprosimy osobę badaną o ustawienie oscylatora tak, aby wysokość jego tonu odpowiadała wysokości tego złożonego dźwięku, to ustawi go ona na częstotliwość 200 Hz. To proste zjawisko można wyjaśnić na podstawie obu teorii spostrzegania wysokości. Wyjaśnienie na podstawie teorii miejsca. Ucho jest urządzeniem nieliniowym. Wytwarza ono różne częstotliwości. Siedem przedstawionych powyżej częstotliwości (tonów) daje sześć sposobów uzyskania różnicy częstotliwości równej 200 Hz, dochodzą do tego zniekształcenia w czasie odbioru dźwięku. Różnica częstotliwości okazuje się być istotnym przyczynkiem do spostrzegania wysokości dźwięku. Wyjaśnienie na podstawie teorii periodyczności. Strumień impulsów w nerwie słuchowym jest zgodny z rozkładem dudnień dźwięku; występuje tu pewna nieliniowość. 278 Ale aktywność neuronów wznosi się i opada regularnie, 200 razy na sekundę, i właśnie ta aktywność jest podstawą spostrzeganej wysokości dźwięku. Tak więc główna rozbieżność między tymi teoriami sprowadza się do pytania, czy rzeczywiście błona aktywizuje się w obszarze 200 Hz? Zwolennik teorii miejsca uważa, że błona podstawowa drga w obszarze 200 Hz i osoba badana właśnie to odbiera. Przedstawiciel teorii periodyczności uważa, że błona podstawowa drga tylko na obszarze wysokich częstotliwości pomiędzy 1000 i 2200 Hz, ale wyładowania nerwowe z tych obszarów synchronizują się na częstotliwości 200 Hz. Czy jest możliwe dokonanie rozstrzygającego eksperymentu? W tym celu trzeba zatrzymać drgania błony w części odpowiadającej częstotliwości 200 Hz i sprawdzić, czy osoba badana może mimo wszystko słyszeć odpowiadającą temu wysokość dźwięku. Stosunkowo łatwo można wyłączyć część błony. W tym celu trzeba np. dodać do sygnału szum o niskiej częstotliwości, to znaczy taki dźwięk, który zawiera wszystkie częstotliwości leżące poniżej określonej wielkości. Dla zupełnej pewności, że szum ten zamaskuje dowolną nisko częstotliwą aktywność na błonie, podajmy szum zawierający wszystkie składniki częstotliwości do 500 Hz. Jaka powinna być jego intensywność? Dostatecznie duża, aby stłumić odbiór tonu, kiedy taki wystąpi. W celu określenia tej wielkości, początkowo eksponujemy osobie badanej czysty ton 200 Hz, a następnie prosimy ją, aby wyregulowała intensywność tego tonu tak, żeby dźwięczał dokładnie tak głośno, jak ton 200 Hz, który słyszy ona w dźwięku złożonym. Następnie dołączamy 279 szum o niskiej częstotliwości tak, aby zamaskował on zupełnie czysty ton 200 Hz. Ten poziom szumu będzie wystarczający do zamaskowania jakiejkolwiek aktywności, wywołanej nieliniowymi dodatkami. Teraz ponownie włączamy ton złożony, ale tym razem dodajemy szum maskujący. Czy nadal będzie słyszalny składnik 200 Hz? Zwolennik teorii periodyczności ma rację - nieobecny ton podstawowy ciągle jest słyszalny, nawet po tym, jak cała aktywność na obszarze odpowiadającym jego częstotliwości jest fizycznie maskowana szumem. Więcej, aby udowodnić istotność maskujących właściwości zastosowanego szumu, można wypróbować szum o wysokiej częstotliwości - szum zawierający wszystkie częstotliwości powyżej 500 Hz. Zwolennik teorii miejsca będzie twierdził, że sygnał o częstotliwości 200 Hz będzie właśnie słyszalny, ponieważ odpowiadająca mu część błony nie została zablokowana szumem o wysokiej częstotliwości. Przedstawiciel teorii periodyczności będzie udowadniał, że jest odwrotnie: szum o wysokiej częstotliwości zniekształci reakcje neuronów i nieobecny ton podstawowy nie będzie więcej słyszany (rys. 7-16). A jaki jest rzeczywisty wynik? Przy ekspozycji szumu o wysokiej częstotliwości nieobecny ton podstawowy przestaje być odbierany. ODRÓŻNIANIE WYSOKOŚCI DŹWIĘKU BEZ UDZIAŁU BŁONY PODSTAWOWEJ Jednym ze sposobów sprawdzenia prawdziwości teorii periodyczności są eksperymenty przeprowadzone na zwierzęciu pozbawionym błony podstawowej. Czy jest ono zdolne do odróżniania częstotliwości dźwięku? Zgodnie z twierdzeniem teorii miejsca, przy braku błony podstawowej nie może też zachodzić proces kodowania wysokości tonu; zgodnie z teorią periodyczności, odróżnienie wysokości w takim wypadku powinno być całkiem dobre, przynajmniej do tego punktu, począwszy od którego wyładowania neuronów nie nadążają już za sygnałem. Dogodnym przedmiotem takich badań jest złota rybka (Fay i MacKinon, 1969; Fay 1970). W uchu złotej rybki znajdują się komórki włoskowe, ale brak jest błony. Narządy słuchowe u większości ryb różnią się nieco od ucha ssaków. Ryby pozostają na znacznie niższym poziomie rozwoju, a ponadto żyją w wodzie - środowisku, w którym dźwięk rozprzestrzenia się nieco inaczej niż w powietrzu. Woda jest bardziej gęsta od powietrza i dźwięk rozprzestrzenia się w niej pięć razy szybciej niż w powietrzu. Ponieważ gęstość wody mało różni się od gęstości tkanek i płynów w ciele, ucho zewnętrzne i środkowe nie są rybom potrzebne, a nawet mogłyby okazać się szkodliwe. Dźwięk przechodzi przez ciało ryby nie obniżając swej intensywności. Narządy słuchowe ryby są rozmieszczone w pęcherzykach powietrznych i różnice w narządach słuchu u różnych ryb są najwyraźniej związane z różnicami w rozmieszczeniu ich pęcherzyków powietrznych. Szczególnie ważne jest to, że u ryb, a szczególnie u złotych rybek, znajdują się komórki włoskowe i nerwy słuchowe, natomiast brak jest błony podstawowej. Jak więc w tej sytuacji mogą one odróżniać dźwięki o różnej częstotliwości? Dzięki odpowiedniemu treningowi złota rybka może odróżniać jedną częstotliwość od drugiej. 280 W celu przeprowadzenia doświadczenia należy unieruchomić rybę w uprzęży wypełnianej gazą, a następnie eksponować dźwięk w połączeniu ze wstrząsem elektrycznym (rys. 7-17) [Do pyszczka unieruchomionej ryby przyłączono fonograf, rejestrujący jego ruchy.]. Początkowo podaje się rybie szereg tonów o jednakowej częstotliwości. Następnie zmienia się częstotliwość jednego tonu i tej właśnie zmianie towarzyszy bodziec elektryczny. Ryba szybko uczy się antycypować wstrząs elektryczny w momencie, gdy następuje zmiana częstotliwości - dostrzegalnym objawem tej antycypacji jest krótkotrwałe wstrzymanie oddychania. Uzyskane wyniki zostały przedstawione na rysunku 7-18. [Krzywe zmian wrażliwości wraz ze zmianą częstotliwości dla skóry ludzkiej, słuchu ryby i słuchu człowieka.] Zwróćcie uwagę na to, że minimalna zmiana częstotliwości dostrzegana przez rybę przekracza 10-krotnie tę, którą dostrzega człowiek, 281 i chociaż absolutna wrażliwość ryby jest znacznie niższa, krzywa ilustrująca zmiany wrażliwości wraz ze zmianą częstotliwości jest analogiczna do odpowiedniej krzywej u człowieka. Zdolność złotej rybki do odróżniania częstotliwości znika na obszarze 1000-2000 Hz, to jest dokładnie tam, gdzie możemy tego oczekiwać na podstawie teorii periodyczności. Przy takich częstotliwościach neurony nie są już zdolne do reakcji synchronicznie z sygnałem dźwiękowym. Argumenty przeciw teorii periodyczności spostrzegania wysokości tonu Chociaż wydawałoby się, że eksperymenty z maskowaniem dość wyraźnie potwierdzają teorię periodyczności, istnieją jednak dwa zjawiska utrudniające wyjaśnienie spostrzegania wysokości tonu na podstawie periodyczności. Pierwsze zjawisko polega na tym, że oddzielny neuron nie może reagować częściej niż 300-400 razy na sekundę. Jak więc w takim wypadku jego aktywność może stanowić podstawę spostrzegania wysokości odpowiadającej sygnałom o częstotliwości do 4000 Hz? Drugie zjawisko - to interesująca anomalia słuchu, podwójne słyszenie („diplacusis"), która powoduje, że ten sam ton odbierany jest jako różniący się wysokością przez jedno ucho w porównaniu z drugim uchem. 282 Jak to jest możliwe, skoro neurony normalnie wyładowują się z taką samą częstotliwością, z jaką drga błona? Aby odparować pierwszy zarzut, zwolennicy teorii periodyczności powołują się na zasadę salwy (por. s. 249). Na odpowiednie pobudzenia reagują określone grupy neuronów, przy czym grupa włókien nerwowych może równocześnie reagować na taką częstotliwość, na którą żadne z nich oddzielnie nie mogłoby reagować. Jeżeli pojedynczy neuron wyładowuje się z częstotliwością zaledwie 300 Hz, to grupa złożona z czterech neuronów może wysyłać impulsy z częstotliwością łączną 1200 Hz, pod warunkiem, że aktywność ich jest odpowiednio zsynchronizowana. Jeżeli nawet weźmiemy to pod uwagę, brak jest danych przemawiających za tym, że neurony, pojedynczo lub grupami, mogą reagować na częstotliwości powyżej 2000 lub nawet 3000 Hz, Diplacusis to jeden z najważniejszych argumentów przeciw teorii periodyczności, anomalia ta potwierdza pogląd, że wysokość tonu jest determinowana przez miejsce maksymalnej amplitudy drgań na błonie. Człowiek cierpiący na ostry diplacusis słyszy dwa tony o różnej wysokości, chociaż do obu uszu wpada ten sam ton. Ogólnie biorąc, wszyscy ludzie odbierają nieco inaczej wysokość tonu docierającego do obu uszu, szczególnie w wypadku tonu o wysokich częstotliwościach. Najłatwiej można to wyjaśnić pewnymi różnicami w miejscu maksymalnej amplitudy drgań na błonach podstawowych w jednym i drugim uchu. W gruncie rzeczy, jeśli tylko zastanowimy się nad tym, jaka zgodność impulsów nerwowych byłaby potrzebna do osiągnięcia idealnej zgodności między każdą parą punktów drgań na obu błonach, to możemy tylko dziwić się, że omawiane zjawisko występuje w tak niewielkim stopniu. Trudno również oczekiwać, aby błony w obu uszach miały idealnie zgodne rozmiary, nie mówiąc już o idealnych odpowiednikach na poziomie neuronów. Więcej nawet, jeżeli przeanalizujemy kolejno wszystkie etapy przetwarzania sygnału w systemie nerwowym aż do samego mózgu, to staje się jasne, że istnieje wiele miejsc, w których możliwa jest niewielka dysharmonia między lokalizacją włókien nerwowych a krytycznymi częstotliwościami, na które są one najbardziej wrażliwe (por. van den Brink, 1970). Dwoistość teorii spostrzegania wysokości dźwięku Pełna teoria spostrzegania wysokości tonu, jak widać, powinna stanowić kombinację teorii miejsca i teorii periodyczności. Z pewnością miejsce na błonie podstawowej ma niezwykle ważne znaczenie dla wydobycia informacji o wysokości sygnału-świadczy o tym mnóstwo faktów. Wiadomo również, że rozkład aktywności neuronów dostarcza uzupełniającej informacji dotyczącej wysokości dźwięku, szczególnie dla częstotliwości poniżej 1000-2000 Hz. Inaczej trudno byłoby wyjaśnić przypadek z nieobecnym tonem podstawowym. Brak jakichkolwiek podstaw, aby sądzić, że obie teorie są nieprawdziwe-świetnie uzupełniają się wzajemnie. Za główny czynnik określający wysokość tonu możemy przyjąć miejsce maksymalnej amplitudy drgań na błonie podstawowej, do tego dochodzi informacja przekazywana przez częstotliwość wyładowań we włóknach nerwu słuchowego. 283 Jeżeli włókna rozmieszczone w strefie lokalizacji 1000 Hz reagują z częstotliwością wyładowań równą 1000 Hz, nie pojawiają się żadne komplikacje i odbierana jest wysokość wy wołana tonem 1000 Hz. Jeżeli włókna w strefie lokalizacji 1000 Hz dają częstotliwość wyładowań 100 Hz, to mamy tu do czynienia ze spostrzeganiem dźwięku złożonego, z wysokością tonu podstawowego równą częstotliwości 100 Hz, i ze strukturą tonów harmonicznych w obszarze 1000 Hz. W tym wypadku częstotliwość wyładowań pomaga określić wysokość tonu - miejsce na błonie determinuje jakość dźwięku, czyli jego barwę. Pobudzeniu jakiegokolwiek miejsca wzdłuż błony podstawowej zawsze towarzyszą wyładowania o częstotliwości odpowiadającej temu miejscu. Jednakże wyładowaniom o określonej częstotliwości nie zawsze odpowiadają pobudzenia odpowiednich miejsc błony. Zakłada się, że ta dwoistość operacji występuje tylko w wypadku częstotliwości poniżej 1000 albo 2000 Hz. Jest rzeczą mało prawdopodobną, aby powyżej tego punktu wyładowania neuronów mogły być zsynchronizowane z częstotliwością drgań. (Należy zaznaczyć, że zgodnie z poglądami różnych badaczy, określenie wysokości tonu na podstawie częstotliwości wyładowań jest możliwe aż do częstotliwości 4000 Hz.) Tak więc dla częstotliwości w przedziale od 1000 (lub 4000) do 20000 Hz spostrzeganie wysokości tonu może wyjaśnić tylko mechanizm miejsca. Ale większość dźwięków naturalnych wykorzystywanych przez człowieka do komunikowania się lub dla rozrywki leży w strefie niższych częstotliwości, gdzie oba mechanizmy mogą działać. Najwyższa nuta, jaką może wziąć śpiewaczka sopranowa, ma podstawową częstotliwość około 1400Hz. KRYTYCZNE PASMO CZĘSTOTLIWOŚCI Załóżmy, że eksponujemy osobie badanej dwa czyste tony i prosimy ją o ocenę głośności uzyskanego w efekcie dźwięku. Jeżeli te dwa tony będą coraz bardziej różniły się między sobą częstotliwością (przy stałej średniej częstotliwości), łączny dźwięk nie zmienia swojej głośności; dzieje się tak dopóty, dopóki nie zostanie przekroczona pewna krytyczna wielkość odległości między częstotliwościami. Począwszy od tego momentu głośność pary tonów zaczyna rosnąć wraz ze zwiększeniem tej odległości (rys. 7-19). W podobny sposób dźwięk składający się z komponentów wszystkich częstotliwości zawartych między pewną niską częstotliwością (fL) a wysoką częstotliwością (fH) zachowuje stałą głośność podczas zwiększenia odległości między fL i fH (f ze znaczkiem L i f ze znaczkiem H) do momentu aż zostanie osiągnięta pewna krytyczna wielkość tej odległości. Poczynając od tego momentu, głośność dźwięku wzrasta w miarę dodawania nowych częstotliwości. [Zauważcie, że należy utrzymać stałą energie dźwięku (zwaną pasmem szumu, kiedy pasmo zawiera się w granicach częstotliwości fL i fH)- Rozważmy to na prostym przykładzie, kiedy dźwięk złożony z oddzielnych tonów eksponowany jest osobie badanej. Jeśli dodajemy więcej tonów, dla wykonania tego zadania konieczne jest utrzymanie całościowej energii na stałym poziomie. Tak więc, jeśli liczba tonów zostaje podwojona, energia każdego z nich musi być zredukowana do połowy, aby całą energię utrzymać stałą. Tak samo jest z szumem. Poziom energii dla każdej częstotliwości jest proporcjonalny do odwrotności różnicy fH minus fL). 284 Rozważmy trzeci przykład. Osoba badana próbuje wykryć czysty ton, maskowany szumem w paśmie obejmującym częstotliwości zbliżone do częstotliwości tego tonu. W miarę zwiększenia odległości między fL i fH, wykrycie tonu staje się coraz trudniejsze, dzieje się tak dopóty, dopóki nie zostanie osiągnięta krytyczna odległość; dalsze rozszerzanie pasma szumu nie ma wpływu na wykrycie czystego tonu. 285 Wszystkie trzy przykłady wskazują, że w przedziałach pewnej krytycznej strefy częstotliwości można zaobserwować wzajemne oddziaływanie energii dźwiękowych. Jeżeli wychodzimy poza granicę tej strefy krytycznej, wzajemne oddziaływanie energii dźwiękowych zostaje przerwane, chociaż psychologiczne właściwości nadal współgrają ze sobą. Strefa ta nazywa się pasmem krytycznym. Jej wielkość zależy od wartości częstotliwości środkowej (rys. 7-20). Jeśli popatrzymy na układ pobudzeń na błonie podstawowej, bardzo łatwo znajdziemy odpowiedniki krytycznego pasma częstotliwości, podobne do tych, które odpowiadały wielkościom różnic ledwie dostrzegalnych (rld) i skali melowej dla wysokości tonu. Na rysunku 7-21 przedstawiono wykres aktywności wywołanej dwoma tonami, oddalonymi jeden od drugiego o 300 Hz. Próg różnicy (rld) częstotliwości w tym obszarze stanowi około jednej pięćdziesiątej przedstawionej tu odległości częstotliwości. W ten sposób, mimo znacznego pokrywania się krzywych aktywności, wywołanych dwoma tonami, człowiek może łatwo odróżnić te dźwięki. W gruncie rzeczy tony te są rozdzielone dwoma krytycznymi pasmami częstotliwości, co wyprowadza je daleko poza granicę tej strefy, w której mogłyby oddziaływać na siebie w naszym spostrzeganiu. Porównując przedstawione na rysunku 7-21 krytyczne pasmo częstotliwości z właściwościami błony podstawowej oraz skalą melową i skalą rld, możemy w następujący sposób przedstawić wzajemne powiązania między nimi: 1 mel odpowiada w przybliżeniu 12 neuronom, 0,23 rld i 0,009 pasma krytycznego; 1 rld odpowiada w przybliżeniu 52 neuronom, 4,3 mela i 0,04 pasma krytycznego; 1 pasmo krytyczne odpowiada w przybliżeniu 1300 neuronom, 108 melom i 25 rld. Krytyczne pasmo częstotliwości ma szereg ważnych właściwości. Dudnienie wywołane przez różne tony jest najwyraźniej dostrzegane wtedy, kiedy tony te leżą w przedziałach tego samego pasma krytycznego. W ten sposób zjawisko periodyczności spostrzegania wysokości wymaga, aby komponenty tworzące nieobecny ton podstawowy znajdowały się dostatecznie blisko siebie, to znaczy w granicach krytycznego pasma częstotliwości. 286 Przypuszcza się również, że pasmo krytyczne odpowiada za dysonans związany z kombinacją pewnych dźwięków. Twierdzi się, że dysonans jest wynikiem dudnienia wywołanego dwoma tonami, których częstotliwości leżą w granicach jednego pasma krytycznego. Instrumenty muzyczne wydają złożone dźwięki, zawierające wiele częstotliwości harmonicznych. Dwie nuty mogą być w dysonansie, jeżeli dowolna para ich tonów harmonicznych trafia w granice tego samego pasma częstotliwości. Im bardziej słyszalne są te tony harmoniczne, tym silniejszy będzie dysonans. PRZESTRZENNE SPOSTRZEGANIE DŹWIĘKU Mamy dwoje uszu, ale słyszymy jednolity świat dźwięków. Właśnie dzięki różnicy w informacjach uzyskiwanych przez oboje uszu (słyszenie dwuuszne), a nie przez jedno (słyszenie jednouszne), możemy określić położenie źródła dźwięków. Jest to ważny czynnik wzbogacający nasze spostrzeganie i ułatwiający rozszyfrowanie informacji słuchowej. Trudno docenić znaczenie lokalizacji dźwięku. Jest to tak naturalne i powszechne zjawisko, że traktujemy je jako absolutnie oczywiste. Wagę lokalizacji dźwięku można łatwo zademonstrować za pomocą nowoczesnej aparatury dźwiękowej. Posłuchajcie przez słuchawki dobrego, o wysokim standardzie, stereofonicznego nagrania. Następnie włączajcie na przemian nagranie monofoniczne i stereofoniczne. Wsłuchajcie się w różnicę między nimi. Odtwarzanie stereofoniczne nie tylko zapewnia takie spostrzeganie dźwięku, jakby wychodził on z różnych punktów wyobrażonej otaczającej nas przestrzeni, ale daje również znacznie bogatsze wrażenie dźwięku-różnorodne dźwięki stają się bardziej wyraziste, a więc i łatwiej słyszalne. [Mowa pochodząca od dwóch mówców nie daje tak wyraźnego efektu, chyba że jeden znajduje się bezpośrednio po lewej, a drugi bezpośrednio po prawej stronie słuchającego. Nagranie powinno być zrobione w studium nagrań stereofonicznych - stare płyty lub pochodzące z masowej produkcji nie nadają się do tych celów. Większość współczesnych nagrań symfonicznych czy grup rockowych jest wysokiej jakości.] Lokalizacja Wskazówkami umożliwiającymi zlokalizowanie źródła dźwięku są: dokładny czas oraz intensywność, z jaką dźwięki docierają do obu uszu. Dźwięki dochodzą najpierw i z większą siłą do ucha znajdującego się bliżej ich źródła. Oddalone od źródła dźwięku ucho znajduje się w cieniu akustycznym utworzonym przez głowę (rys. 7-22). [Rysunek przedstawia widok z góry dwóch osób. Osoba słuchająca stoi w lewym górnym rogu strony i głowa jej skierowana jest zgodnie z osią góra-dół, przodem do dołu, natomiast osoba mówiąca (źródło dźwięku) umiejscowiona jest w prawym dolnym rogu rysunku. Osoba mówiąca skierowana jest w stronę osoby słuchającej tak, że oś jej głowy biegnie po przekątnej do głowy słuchającego. Droga dźwięku do lewego ucha (odcinek łączący usta mówiącego z lewym uchem słuchającego) jest krótsza od drogi dźwięku do prawego ucha (odcinek łączący usta mówiącego z prawym uchem słuchającego).Przestrzeń za głową słuchającego to tzw. „cień” akustyczny, który wystąpiłby wówczas, gdyby głowa zatrzymywała wszystkie fale dźwiękowe i gdyby dyfrakcja albo „okrążanie” fal dźwiękowych nie miało miejsca.] Przeprowadzając niezbyt skomplikowane obliczenia, możemy określić w przybliżeniu możliwe opóźnienie w czasie między dotarciem sygnału do obu uszu. Szerokość głowy ludzkiej wynosi około 18 cm. Jeżeli źródło dźwięku położone jest po jednej stronie, dźwięk pada bezpośrednio do ucha z tejże strony, ale żeby dotrzeć do drugiego, musi okrążyć głowę dookoła. Jeżeli przyjmiemy, że głowa przedstawia kulę o promieniu około 8 cm, to droga dodatkowa wynosi 8 razy 3,14, czyli około 27,5 cm. Ponieważ dźwięk rozchodzi się w powietrzu 288 z prędkością (w przybliżeniu) 330 metrów na sekundę, to drogę równą 1 cm przebywa w ciągu 30 mikrosekund. Dźwięk przebywa drogę między jednym a drugim uchem w czasie około 840 mikrosekund. Oczywiście, ta różnica w czasie zależy od tego, gdzie położone jest źródło dźwięku. Jeżeli jest ono położone na wprost głowy, to dźwięk dociera do obu uszu jednocześnie. Jeżeli źródło leży o 3 stopnie w prawo, dźwięk dociera do prawego ucha o 30 mikrosekund wcześniej niż do lewego. Ta maleńka różnica-30 mikrosekund różnicy czasu-jest dla człowieka wykrywalna. Różnica taka wystarczy, aby obserwator mógł wykryć zmianę położenia źródła dźwięku. Jest to zdumiewająca zdolność, zwłaszcza gdy uwzględnimy fakt, że w celu lokalizacji źródła dźwięku niezbędne jest porównanie sygnałów uzyskanych przez ucho prawe i lewe. System nerwowy musi więc przechować informację o czasie nadejścia sygnału z dokładnością do 30 mikrosekund (rys. 7-23). Różnica w czasie dotarcia sygnału do jednego i drugiego ucha jest wynikiem różnicy faz między sygnałami; jeden opóźnia się w stosunku do drugiego. Przy sygnałach o wysokiej częstotliwości opóźnienie to nie jest jednoznaczne i nie może być wykorzystane do lokalizacji źródła dźwięku. Aby to zrozumieć, rozważmy sygnał o częstotliwości 10 000 Hz. W tym wypadku cykl zmian ciśnienia dźwięku dokonuje się co 100 mikrosekund. Jeżeli sygnał 10000 Hz dochodzi od źródła umieszczonego po prawej stronie od obserwatora pod kątem 55 stopni, dźwięk dociera do lewego ucha o około 450 mikrosekund później niż do ucha prawego. W takim wypadku fala odbierana przez prawe ucho wyprzedza o 4,5 cykla falę docierającą do ucha lewego. Czyż można jednak określić różnice między dwoma tonami w wypadku, gdy wynoszą one: 4,5; 3,5; 2,5; 1,5, a nawet 0,5 cykla? Mówiąc inaczej, czy można określić, czy źródło dźwięku leży o 55 stopni na prawo albo 40 stopni, 27 stopni, 17 stopni lub 6 stopni? Jest to niemożliwe. Najdłuższy czas opóźnienia dźwięku między obu uszami wynosi około 840 mikrosekund i jakakolwiek częstotliwość dźwięku, której pełny cykl trwa krócej, zaczyna sprawiać kłopoty w ustaleniu źródła sygnału. Różnice w czasie stanowią dobrą sposobność do lokalizacji tych dźwięków, których częstotliwości składowe są niższe niż 1300 Hz. W gruncie rzeczy przestrzenna lokalizacja dźwięku nie jest zbyt dokładna nawet dla niskich częstotliwości, jeżeli bowiem głowa jest całkowicie nieruchoma, jedyna dostępna informacja, jaką jest różnica w czasie, nie pozwala ustalić, czy dźwięk dociera z góry czy z dołu, a nawet, czy z przodu czy z tyłu. Dźwięk docierający z przodu, ale z przesunięciem w jedną stronę, charakteryzuje się takim samym opóźnieniem jak dźwięk docierający z tyłu z analogicznym przesunięciem w tę samą stronę. W naturalnych warunkach niejasności te mogą być usunięte za pomocą ruchów głowy, sygnałów wzrokowych oraz dzięki różnicom w barwie dźwięku, wynikającym ze sposobu odbicia i załamania przez głowę i ucho zewnętrzne różnych częstotliwości. Drugą wskazówkę dla określenia lokalizacji dźwięku stanowi cień akustyczny utworzony przez głowę. W wypadku niskich częstotliwości fala dźwiękowa załamuje się i „okrąża" głowę, która daje nieznaczny cień lub w ogóle go nie nakłada, jednakże przy wysokich częstotliwościach, gdy fala jest krótka w porównaniu z rozmiarami głowy, brak jest w ogóle znaczącej dyfrakcji. Na przykład, dźwięk o częstotliwości 100 Hz ma długość fali 3,3 metra. Tak więc łatwo „okrąża" głowę. 289 RYSUNEK 7-23. Przybliżone obliczenie różnicy między dwoma uszami w długości drogi od oddalonego źródła dźwięku. d równa się różnica długości dróg r równa się promień głowy 3,5 cala (ok. 8 cm) fi równa się kąt, pod jakim ustawione jest źródło dźwięku (w radianach) d równa się r razy fi plus r razy sin fi 30 stopni równa się 0,52radiany d równa się 3,5 razy 0,5 plus 3,5 razy sin 30 stopni d równa się 1,75 plus 1,75 równa się 3,5 cali Różnica czasu równa się 76 razy d msek. równa się 270 msek. Ale już dźwięk o częstotliwości 10 000 Hz ma długość fali zaledwie 0,033 m (3,3 centymetra). Odbija się więc od głowy, tym samym tworzy się cień akustyczny. Efekty cienia akustycznego w wypadku położenia źródła dźwięku pod kątem 15 stopni wyglądają następująco: Częstotliwość; Stosunek intensywności dźwięku dla obu uszu 300 Hz; 1 dB 1100 Hz; 4 dB 4200 Hz; 5 dB 10000 Hz; 6 dB 15000 Hz; 10 dB 290 Poczynając od 3000-4000 Hz różnica intensywności jest dostatecznie duża, aby zapewnić rzetelne różnicowanie i tym samym dostarczyć miarodajnych wskazówek lokalizacji źródła dźwięku. Przestrzenna lokalizacja dźwięku zachodzi głównie dzięki podwójnemu systemowi: różnic czasowych dla niskich częstotliwości i różnic intensywności dla wysokich częstotliwości. Przełączenie z jednego systemu na drugi zachodzi w przedziale 1000 do 5000 Hz - przedziale częstotliwości dźwiękowych, charakteryzującym się największą liczbą błędów przy lokalizacji źródła dźwięku. Interakcje dwuuszne Aby zapewnić precyzyjną lokalizację dźwięku w przestrzeni, system słuchowy musi mieć zdolność wykrywania różnic czasowych rzędu 10 lub 20 mikrosekund. Jego struktura anatomiczna jest odpowiednio dostosowana do przechowania informacji czasowej, dochodzącej od początkowych neuronów słuchowych. [Na marginesie interesująca uwaga. Skoro ustalenie czasu jest tak ważne dla dokładnej lokalizacji dźwięków, która występuje u wszystkich zwierząt, to jak sobie z tym radzą duże zwierzęta? Słoń ma chyba największą głowę ze wszystkich lądowych ssaków. Nie wszystkie jednak elementy jego systemu słuchowego są proporcjonalne do wielkości głowy. Ma on niezwykle długi przewód słuchowy (prawie 11 cm), co sprawia, że jego uszy wewnętrzne leżą bliżej siebie o 22 do 25 cm niżby to wynikało z samej wielkości głowy. Słoń bez takich długich przewodów słuchowych potrzebowałby znacznie dłuższych połączeń nerwowych między uszami, co zwiększałoby ryzyko uzyskania precyzyjnej informacji czasowej, niezbędnej dla lokalizacji.] Wspominaliśmy już o tym, że sygnały nerwowe opuszczając ucho przechodzą bardzo krótką drogę do miejsca, gdzie następuje łączenie informacji napływających z obu uszu, tj. do oliwki górnej. Tu zachodzą interakcje pobudzeniowe i hamujące między sygnałami napływającymi od prawego i lewego ucha, czyli mechanizm niezbędny dla dwuusznej lokalizacji. Na rysunku 7-24 przedstawiono schematycznie ogólne typy interakcji zachodzących w oliwce górnej (E oznacza interakcje pobudzeniowe, I-hamujące). (Dokładna anatomia nie jest jeszcze w pełni poznana.) Wiele oddzielnych neuronów w oliwce górnej reaguje w różny sposób, zależnie od tego, które ucho pierwsze odbierze sygnał. Jeśli sygnał dociera najpierw do jednego ucha, to tempo reakcji pewnych jednostek jest wyższe aniżeli wówczas, gdy sygnał dociera wpierw do drugiego ucha. Różne neurony najwidoczniej mają różnorodne preferencje dotyczące stron, z których nadchodzi sygnał. U kota różnica w czasie, pozwalająca zaobserwować ten efekt, wynosi około 250 mikrosekund, co jest równe w przybliżeniu czasowi niezbędnemu do przejścia dźwięku z jednej strony głowy kota na drugą. Podobna zależność została wykryta w stosunku różnic intensywności dźwięku. Wyniki równoczesnych badań obu tych zmiennych dostarczają wiele dowodów przemawiających za tym, że oliwka górna jest tym ośrodkiem nerwowym, który jest odpowiedzialny za przetwarzanie informacji istotnych dla lokalizacji dźwięku w otoczeniu. Niektóre wyższe poziomy systemu słuchowego najwidoczniej biorą też udział w porównywaniu sygnałów napływających z obu uszu - na przykład wzgórek czworaczy dolny. Dźwięki dochodzące zarówno z jednego, jak i z drugiego ucha 291 mogą aktywizować różne jednostki we wzgórku czworaczym dolnym. Jedne z nich są hamujące inne pobudzeniowe, a jeszcze inne wytwarzają taki rodzaj interakcji, jaki jest potrzebny przy lokalizacji przestrzennej. Ich reakcje mają charakter podobny do tych, jaki zaobserwowano w oliwce górnej. Ponadto wzgórek czworaczy ma taką strukturę, która pozwala na uporządkowaną reprezentację różnorodnych częstotliwości słuchowych. To oczywiście pomaga zarówno w prawidłowej ocenie tonu, jak i odróżnieniu i lokalizacji różnych częstotliwości dźwięku. Chociaż zaczynamy rozumieć pewne mechanizmy nerwowe biorące udział w porównywaniu i łączeniu sygnałów z obu uszu, to jednak ciągle dalekie jest rozwiązanie problemu przestrzennej lokalizacji dźwięku. Jakie mechanizmy nerwowe informują nas o tym, że określony przedmiot znajduje się o 37 stopni na prawo i jest lekko uniesiony? W jaki sposób są wyodrębniane i lokalizowane złożone sygnały dźwiękowe, na przykład w toku równoczesnej rozmowy kilku osób? Odpowiedzi na te pytania pozostają poza granicami naszej obecnej wiedzy. Znaczenie słyszenia dwuusznego Równoczesne dotarcie dźwięków do obu uszu nie tylko uzupełnia spostrzegany dźwięk o wymiar przestrzenny, ale zwiększa jego jasność. Jest to wynik oddziaływania trzech różnych mechanizmów: lokalizacji, redukcji interferencji oraz sprowadzenia maskowania do minimum. 292 Lokalizacja. Zdolność do lokalizacji pozwala nam umiejscowić w przestrzeni wiele słyszanych dźwięków. Załóżmy, że w trakcie towarzyskiego spotkania musimy podtrzymywać niezbyt interesującą rozmowę, kiwamy głową i zgadzamy się z rozmówcą, a w istocie przysłuchujemy się rozmowie prowadzonej w pobliżu. Lokalizacja dźwięku stwarza takie możliwości. Możemy wybierać częstotliwość, intensywność albo też lokalizację w przestrzeni tego, co chcemy usłyszeć. Czasem nagranie rozmowy na magnetofonie jest mało zrozumiałe. Przeszkadzają szumy i odbicia. Kaszel i ruchy dookoła zagłuszają nagranie głosu, którego chcemy posłuchać. W realnych warunkach człowiek nie jest świadomy tych zakłóceń, nawet jeśli one występują. Zdolność do lokalizacji pozwala mu śledzić wybiórczo jedynie interesujące go sygnały dźwiękowe. Ogromnie wzrasta czystość nagrania w efekcie dodania drugiego mikrofonu - czyli poprzez zapis stereofoniczny. Nagle okazuje się, że możemy usłyszeć skąd dochodzi głos, tłumiąc dźwięki uboczne. Do tego potrzebne są dwa mikrofony o różnej czułości na kierunek dźwięku. Przy prawidłowym ustawieniu jeden z nich będzie odbierał głównie dźwięki napływające z prawej strony, drugi dźwięki nadchodzące z lewej. Kiedy osoba mówiąca znajdzie się między dwoma mikrofonami, umieszczonymi w tej samej odległości od niej, dźwięk jej głosu zostanie jednakowo odebrany przez oba mikrofony. Jeżeli zaś znajdzie się ona bliżej jednego z mikrofonów, to wówczas jej głos będzie oddziaływał silniej właśnie na ten mikrofon. Problemy występujące przy słuchaniu jednokanałowego (monofonicznego) magnetofonu ostro ilustrują trudności, jakie mają ludzie głusi na jedno ucho. Trudności te związane są nie tyle z obniżeniem wrażliwości na dźwięki, ile z obniżeniem zdolności do lokalizowania dźwięku. Jeżeli słuchający posługuje się aparatem słuchowym, to gdzie najlepiej umieścić mikrofon? Jeśli nosi on mikrofon w kieszeni koszuli, to nie będzie możliwe normalne określenie źródła dźwięku. Mikrofon powinien bowiem znajdować się możliwie najbliżej uszkodzonego ucha. W gruncie rzeczy w celu poprawy warunków, umożliwiających lokalizację dźwięku, najlepiej byłoby posługiwać się dwoma aparatami słuchowymi, po jednym dla każdego ucha (nawet wtedy, gdy jedno z nich funkcjonuje normalnie). Różnica poziomów maskowania. Drugi sposób poprawienia czystości odbioru dwuusznego polega na wykorzystaniu zjawiska zwanego różnicą poziomów maskowania. Jeżeli próbujemy usłyszeć cichy głos zmieszany z szumem, przekazywany do jednego ucha, podanie tego samego szumu do ucha drugiego znacznie poprawi wyrazistość odbieranego głosu. Do jednego ucha dociera zarówno sygnał, jak i szum, do drugiego zaś wyłącznie szum. Jedna z możliwych interpretacji polega na tym, że sygnały na wejściu docierające do jednego i drugiego ucha odejmują się od siebie, w rezultacie czego szum zostaje wyeliminowany. Zatem, jeżeli przekażemy sygnał wraz z zakłóceniem do jednego i drugiego ucha, nie uzyskamy dobrych rezultatów, ponieważ różnica powstała po odjęciu sygnałów wejściowych do obu uszu będzie w tym wypadku równa zeru. Możemy rozpatrzeć to zjawisko przyjmując inny punkt widzenia, zwłaszcza gdy zwrócimy uwagę na fakt, że szum przekazywany do obu uszu jest lokalizowany w środku głowy, 293 podczas gdy sygnał jest słyszalny tylko w jednym uchu. Różnica w położeniu przestrzennym prowadzi do poprawy w zakresie identyfikacji sygnału. Maskowanie. Istnieje również trzeci sposób polepszenia wyrazistości sygnału przy odbiorze dwuusznym. Wyobraźcie sobie, że słuchacie orkiestry i w momencie, kiedy klarnet gra w dolnych rejestrach, zaczyna grzmieć wielki bęben basowy. Przy nagraniu monofonicznym bardzo niskie częstotliwości bębna zamaskują niskie częstotliwości klarnetu. Będzie to efekt pokrywania się stref pobudzenia na błonie podstawowej. Jeżeli jednak klarnet i bęben będą odbierane każde innym uchem, nie wystąpi na błonie proces wzajemnej interakcji i nie zajdzie zjawisko maskowania. W warunkach naturalnych, na koncercie, dźwięki klarnetu i bębna będą docierać do obu uszu, ale jeżeli słuchacz obróci głowę, może tak wyregulować swój słuch, że większa część dźwięku pierwszego instrumentu będzie docierała do jednego ucha, a drugiego instrumentu - do drugiego ucha. Wyeliminowanie maskowania czyni dźwięki bardziej wyraźnymi i pozwala na lepsze ich zróżnicowanie przy odbiorze dwoma uszami niż jednym uchem. Zapis dźwięku Aby uzyskać nagranie, które brzmiałoby tak jak przy oryginalnym wykonaniu, należy zastosować dwuuszny zapis dźwięku. W tym celu należy umocować na krześle stojącym na sali koncertowej makietę głowy z mikrofonami umieszczonymi w uszach. Podczas słuchania nagrania „dwuusznego" przez słuchawki dźwięk odtwarzany jest z niezwykłą dokładnością. Zapis dwuuszny różni się wyraźnie od zapisu stereofonicznego, który jest stosowany w większości wypadków do produkcji płyt i taśm magnetofonowych. Celem zapisu stereofonicznego jest zarejestrowanie wycinków czoła fali w momencie jej przechodzenia przez określony punkt skali dźwiękowej, tak aby można było odtworzyć je w warunkach domowych (rys. 7-25). Za pomocą tylko dwu mikrofonów i tyluż głośników nie uzyskamy dokładnego odtworzenia nagranego utworu. Z tych względów prowadzi się obecnie badania w dziedzinie nagrań trój- i czterokanałowych (kwadrofonicznych). Kiedy dysponujemy dwoma głośnikami przy odtwarzaniu, powinniśmy posłużyć się przy nagrywaniu dwoma mikrofonami ustawionymi z takim samym odstępem, jaki później musi być zachowany przy ustawieniu głośników. Metoda ta nie jest zbyt wygodna, wymaga bowiem w trakcie odtwarzania ścisłego przestrzegania warunków, w jakich dokonano nagrania. W rezultacie badań (głównie metodą prób i błędów) specjaliści od zapisu dźwięku opanowali sposób posługiwania się większą liczbą mikrofonów równocześnie. Pozwala to na uzyskanie pożądanych efektów i z tych względów w dzisiejszych czasach właśnie w ten sposób dokonujecie rejestracji dźwięku. Zazwyczaj w celu uzyskania zapisu dźwięku o wysokim standarcie, w sali umieszcza się wiele mikrofonów, w różnych punktach, przy czym specjaliści od zapisu dźwięku określają, jak należy je połączyć w dwa kanały, aby uzyskać właściwy efekt. 295 Psychologiczna akustyka niewiele może się tu przydać. Najlepszy sposób łączenia mikrofonów jest prawdopodobnie różny dla różnorodnych pomieszczeń, liczby słuchaczy, a nawet może zależeć od tego, jak jest ubrana widownia. Efekt pierwszeństwa T teorii lokalizacja odbywa się po prostu dzięki wykorzystaniu różnic między dźwiękami docierającymi do obu uszu. Zazwyczaj jednak sygnałowi początkowemu towarzyszy echo. Ponieważ wszystkie odbicia dźwięku są dostrzegane, nawet prosty trzask może spowodować duże komplikacje. Początkowo trzask dociera do jednego ucha, następnie zaś do drugiego, a potem do uszu zaczynają docierać odbicia od ścian i stropu pokoju (rys. 7-26).[Na rysunku przedstawiono drogę bezpośrednią i pośrednią dźwięku do uszu człowieka znajdującego się w przestrzeni zamkniętej] Do uszu dociera szybkie następstwo dźwięków. Jak można wykorzystać to wszystko w celu lokalizacji dźwięku? 296 Na szczęście wykorzystywany jest tu jedynie pierwszy dźwięk docierający do uszu. Zjawisko to nosi nazwę efektu pierwszeństwa. Nie jest ono jeszcze w pełni wyjaśnione. Echo nie odgrywa prawie żadnej roli w psychologicznej interpretacji dźwięku. Niemniej jednak jest przez nas odbierane. Jeżeli zarejestrujemy różne dźwięki, przy czym jednym będzie towarzyszyło echo, a innym nie, łatwo możemy określić różnicę między nimi. A zatem, chociaż ta informacja dźwiękowa dociera do uszu, jest ona całkowicie ignorowana przez mechanizm odpowiedzialny za lokalizację przestrzenną. 8. Nerwowe podłoże pamięci SYSTEMY PAMIĘCI System przechowywania informacji sensorycznej Pamięć krótkotrwała Pamięć długotrwała PRZECHOWYWANIE INFORMACJI Obwody nerwowe pamięci Przegląd obwodów nerwowych Obwody okrężne (rewerberacyjne) Konsolidacja CHEMIA PAMIĘCI Zmiany w RNA a uczenie się Uczenie się po wprowadzeniu zmian w RNA Badania na płazińcach Badania chemiczne Przekazywanie pamięci ZABURZENIA PAMIĘCI Wstrząsy elektryczne Amnezje Przypadki H. M. i N. A. Mechanizmy pamięci POSZUKIWANIE LOKALIZACJI PAMIĘCI DŁUGOTRWAŁEJ JEDEN MÓZG CZY DWA MÓZGI Rozszczepienie mózgu u zwierząt Rozszczepienie mózgu u człowieka Dwa mózgi: niezmienność czy plastyczność WNIOSKI 299 SYSTEMY PAMIĘCI Błędem byłoby traktowanie pamięci ludzkiej jako jednej całości, zaangażowanych jest w nią bowiem wiele różnych procesów. Można nawet powiedzieć, że istnieją co najmniej trzy całkowicie różne rodzaje pamięci: przechowywanie informacji sensorycznej, pamięć krótkotrwała i pamięć długotrwała (rys. 8-1). Możliwe jest, że istnieją również inne rodzaje pamięci, ale ich właściwości nie są na razie znane psychologom eksperymentalnym. Rozważania dotyczące pamięci zaczniemy od krótkiego przeglądu głównych jej systemów, a następnie mając na uwadze całą strukturę przejdziemy do szczegółowego analizowania każdego z nich. System przechowywania informacji sensorycznej System ten przechowuje dość dokładny i pełny obraz świata odbieranego przez system sensoryczny. Czas przechowywania jest bardzo krótki, mniej więcej około 0,1 do 0,5 sek. • Uderzcie lekko czterema palcami w swoje ramię. Prześledźcie doznane bezpośrednio wrażenie-zwróćcie uwagę, że zanim zniknie pozostaje jeszcze przez chwilę realne odczucie uderzenia palcami, a potem już tylko wspomnienie o zaistniałym fakcie. • Zamknijcie oczy, następnie otwórzcie je na moment i ponownie zamknijcie. Zauważcie, jak odebrany przez was obraz, wyraźny i jasny, utrzymuje się przez pewien czas, a następnie powoli zanika. • Posłuchajcie jakichś dźwięków, na przykład postukiwania własnymi palcami albo pogwizdywania. Prześledźcie zacieranie się wyrazistości obrazu dźwiękowego w waszej świadomości. 300 • Zaciśniętą dłoń wyciągnijcie przed siebie, szybko otwórzcie dłoń, wyprostowując dwa palce. Następnie ponownie zaciśnijcie dłoń. Zwróćcie uwagę na to, że wrażenie śladowe dwóch wyciągniętych palców zachowuje się przez moment po ponownym zaciśnięciu dłoni. • Machajcie ołówkiem (lub palcem) tam i z powrotem przed oczyma, patrząc przy tym prosto przed siebie. Zwróćcie uwagę na coś, jakby cień, ciągnący się za poruszanym przedmiotem. To ostatnie doświadczenie jest szczególnie ważne, ponieważ dzięki niemu można określić w przybliżeniu, jak długo utrzymuje się obraz przedmiotu. Zmieńcie szybkość poruszania się przedmiotu tam i z powrotem. Zwróćcie uwagę, że jeżeli poruszamy nim bardzo wolno, to zatraca się ciągłość obrazu między krańcowymi punktami ruchu. Przy jakiej prędkości niewyraźny obraz zaczyna być ciągły? Powinniście przekonać się, że dla podtrzymania ciągłości obrazu następczego potrzebny jest ruch 10 cykli na każde 5 sek. Oznacza to, że poruszający się przedmiot przemieszcza się przed waszymi oczami 20 razy w ciągu 5 sek., czyli cztery razy na sekundę, to znaczy, że ślad wzrokowy utrzymuje się przez około 0,25 sek. (250 milisek.). Te właściwości przechowywania wzrokowej informacji sensorycznej są ściśle związane z właściwościami czasów reakcji systemu wzrokowego, omawianego w rozdziale 5. Wskazaliśmy tam na możliwość mierzenia czasu reakcji tego systemu poprzez obserwowanie zapalonego światła latarki obracającego się w kole. Szybkość obrotów, przy której można zobaczyć zamknięty krąg świetlny, pozwala określić w przybliżeniu czas reakcji wzrokowej. Czy pokrywa się to z oceną czasu przechowywania „niewyraźnego obrazu poruszającego się ołówka"? Pamięć krótkotrwała System pamięci krótkotrwałej przechowuje innego rodzaju materiał niż bezpośrednia informacja sensoryczna. Wdanym wypadku przechowywana informacja nie jest pełnym obrazem zdarzeń, jakie miały miejsce na poziomie sensorycznym. Jest to raczej zachowanie ich bezpośredniej interpretacji. Jeżeli w waszej obecności wypowiedziano jakieś zdanie, zapamiętacie nie tyle dźwięki, z których ono się składa, co raczej zawarte w nim wyrazy. Miedzy zapamiętywaniem obrazu zdarzeń a zapamiętywaniem ich interpretacji istnieje wyraźna różnica, omówimy ją dokładnie w toku dalszych rozważań. Takie rzeczy, jak ostatnie słowa zdania, które dopiero co usłyszeliście lub przeczytaliście, numer telefonu lub czyjeś nazwisko są przechowywane w pamięci krótkotrwałej, ale pojemność tej pamięci jest ograniczona. Zazwyczaj utrzymuje się w niej pięć lub sześć ostatnich elementów z przedstawianego materiału. Podejmując świadomy wysiłek, powtarzając materiał ciągle od nowa, można go zatrzymać w pamięci krótkotrwałej na czas nieokreślony. Zdolność do przechowywania materiału w pamięci krótkotrwałej w wyniku powtarzania zawartych w nim elementów jest jedną z najważniejszych właściwości systemu pamięci. Informacji sensorycznej nie można utrzymać dłużej przez powtarzanie. 301 Utrzymuje się ona zaledwie przez kilka dziesiątych części sekundy i nie da się tego przedłużyć. W pamięci krótkotrwałej natomiast można przez powtarzanie utrzymać niewielką ilość materiału przez czas bliżej nieokreślony. Pamięć długotrwała Istnieje oczywista różnica między pamięcią dopiero co zaistniałych zdarzeń a pamięcią zdarzeń z odległej przeszłości. Pierwsze są dane bezpośrednio i bliskie w czasie; przypomnienie tych drugich jest trudne i dokonuje się powoli. Zdarzenia zaistniałe dopiero co pozostają w świadomości -jeszcze jej nie opuściły. Wprowadzenie do pamięci długotrwałej nowego materiału wymaga czasu i wysiłku. Również wydobycie z pamięci przeszłych zdarzeń dokonuje się z trudem. Pamięć krótkotrwała jest bezpośrednia i natychmiastowa; pamięć długotrwała jest mozolna, wymagająca wysiłku i czasu. Z pamięci krótkotrwałej: „Jak brzmiały pierwsze słowa tego zdania?" Z pamięci długotrwałej: „Co jedliście na obiad w ubiegłą niedzielę?" Pamięć długotrwała jest najważniejszym oraz najbardziej złożonym systemem pamięci. Pojemność systemów bezpośredniego przechowywania informacji sensorycznej oraz pamięci krótkotrwałej jest bardzo ograniczona: pierwszy obejmuje kilka dziesiątych sekundy, a drugi-kilka jednostek prezentowanego materiału, podczas gdy pojemność pamięci długotrwałej jest praktycznie nieograniczona. [Oczywiście jakieś granice istnieją. Mózg jest urządzeniem skończonym. Znajduje się w nim jednak około dziesięciu miliardów(10 do potęgi dziesiątej) neuronów, z których każdy może przechowywać pewną ilość informacji. Dysponuje on wieloma gigantycznymi cząsteczkami, jak RNA - z których każda może przechowywać dość znaczną ilość informacji (patrz paragraf „Chemia pamięci"). Tak więc praktycznie rzecz biorąc możemy rozważać zdolności pamięciowe mózgu ludzkiego jako nieograniczone.] Niemal wszystko, co utrzymuje się w pamięci przez więcej niż kilka minut, musi znaleźć się w systemie pamięci długotrwałej. Wszystkie wyuczone doświadczenia, nie wyłączając reguł posługiwania się językiem, muszą być częścią pamięci długotrwałej. W rzeczywistości można powiedzieć, że psychologia eksperymentalna zajmuje się w znacznej mierze problemami wprowadzenia materiału do pamięci długotrwałej, przechowywania go tam, wydobywania z niej i właściwej jego interpretacji. Głównym źródłem trudności związanych z pamięcią długotrwałą jest wydobycie z niej informacji. Ilość informacji znajdująca się w pamięci jest tak ogromna, że znalezienie w niej czegokolwiek powinno być niezwykle trudne. Niemniej jednak niektóre rzeczy szybko udaje się w niej odnaleźć. Nawet w tak prozaicznej czynności, jak czytanie, musimy odwoływać się bezpośrednio i szybko do pamięci długotrwałej, która pozwala nam zinterpretować znaczenie symboli tekstu drukowanego. Problemy związane ze zdolnością odnalezienia 302 jedynego właściwego określenia wśród przechowywanych w pamięci milionów lub miliardów jednostek określają w dużym stopniu ogólną strukturę wszystkich poziomów systemu pamięci. Rozdziały 10 i 11 poświęcone są w całości omówieniu badań nad strukturą pamięci długotrwałej. Takie są systemy pamięci. Przedstawimy teraz nerwowe mechanizmy pamięci. Zapoznamy się ze strukturami mózgu odpowiedzialnymi za przechowywanie i wydobywanie informacji oraz z psychicznymi procesami pamięci ludzkiej. PRZECHOWYWANIE INFORMACJI Pomimo wieloletnich badań mózg ciągle pozostaje dla nas zagadką. Badanie anatomiczne mózgu pozwala stwierdzić, że stanowi on pewną liczbę oddzielnych części. Jeżeli spoglądamy na mózg z góry, możemy przekonać się, że składa się on z dwu części pofałdowanej tkanki, 303 przedzielonych głęboką szczeliną. Te dwie części noszą nazwę półkul mózgowych, lewej i prawej. Wierzchnia warstwa półkul jest najwyżej zorganizowaną częścią mózgu, zwaną korą mózgową. Poszczególne partie mózgu otrzymały różnorodne nazwy ze względu na istniejące między nimi różnice anatomiczne (rys. 8-2).[rysunek przedstawia umiejscowienie w mózgu poszczególnych jego części.] W części przedniej znajdują się płaty czołowe, po bokach leżą płaty ciemieniowe i płaty skroniowe, z tyłu znajdują się płaty potyliczne. Mózg zbudowany jest symetrycznie; wszystkie płaty tworzą pary, po jednym w lewej i prawej półkuli. (Symetria ta, podobnie zresztą jak symetria całego ciała, nie jest zbyt dokładna. Lewa połowa mózgu jest zwykle nieco większa od prawej, dokładnie tak jak prawa dłoń bywa nieco większa od lewej dłoni, a prawa stopa nieco większa od stopy lewej). Zdobywaniu nowych wiadomości muszą towarzyszyć pewne strukturalne lub chemiczne zmiany w mózgu. Neurony korowe w pewien specyficzny sposób dopasowują układ swych reakcji do zewnętrznych zdarzeń, które organizm rozpoznaje i przypomina sobie. Wiele znanych teorii próbuje wyjaśnić, jak dokonuje się ten proces, ale wszystkie one mają wysoce spekulatywny charakter. Daleka jest jeszcze chwila, kiedy będziemy mieli pełny i wyczerpujący opis sposobu gromadzenia informacji przez układ nerwowy. Pomimo swej niekompletności teorie te mają jednak duże znaczenie, stanowiąc drogowskazy na drodze do zrozumienia funkcjonowania systemu pamięci. Obwody nerwowe pamięci Istnieje prawie całkowita zgodność co do tego, że trwałe przechowywanie informacji związane jest z chemicznymi lub strukturalnymi zmianami w mózgu. Niemal wszyscy zgodni są co do tego, że bezpośrednia, aktywna działalność umysłowa, procesy świadome i procesy pamięci bezpośredniej - zarówno przechowywanie informacji sensoryczne jak i pamięć krótkotrwała-odbywają się dzięki aktywności elektrycznej. Oznacza to, że zmiany chemiczne lub strukturalne w mózgu muszą jakoś wpływać na aktywność elektryczną. A więc aktywność elektryczna i procesy chemiczne muszą się wiązać ze sobą. A nawet więcej, jeżeli systemy pamięci bezpośredniej są rezultatem aktywności elektrycznej, to jest możliwe zbudowanie obwodów nerwowych mających zdolność funkcjonowania jako pamięć. Zacznijmy od następującego problemu: obmyślmy takie obwody, które mają zdolność zapamiętywania. Podstawowe wymaganie dotyczące pamięciowego obwodu nerwowego polega na tym, aby skutki pobudzenia utrzymywały się dłużej po zaprzestaniu pobudzenia na wejściu; w tym właśnie zawiera się istota pamięci. Ale to jeszcze nie wszystko. Obwód pamięciowy musi działać wybiórczo. Powinien on bowiem silnie reagować na określony rodzaj materiału na wejściu, a słabo albo też nie reagować w ogóle na inny materiał. Zaczniemy od wprowadzenia kilku prostych obwodów, które możemy określić jako pamięć. Najpierw jednak tym Czytelnikom, którzy nie przestudiowali rozdziału 2, przypomnimy krótko to, co już wiadomo o obwodach nerwowych (rys. 8-3). 305 Przegląd obwodów nerwowych. Impuls elektryczny przewodzony przez neuron przechodzi z ciała komórki przez akson do ciała następnej komórki. Miejsce, w którym akson styka się z następną komórką, nosi nazwę połączenia synaptycznego (synapsa). Pojedyncza komórka nerwowa może mieć tysiące synaps. Na rysunkach podstawowy neuron przedstawiony jest jako kółko z odchodzącą od niego linią; kółko to ciało komórki, a linia to akson łączący dany neuron z innymi. Istnieją dwa podstawowe rodzaje połączeń synaptycznych -pobudzeniowe i hamujące. Połączenie pobudzeniowe - to takie połączenie, kiedy impuls nerwowy biegnący wzdłuż aksonu wywołuje reakcję (impuls) neuronu, znajdującego się po drugiej stronie synapsy. Inaczej mówiąc, na poziomie synapsy pobudzeniowej następuje przekazanie pobudzenia następnemu neuronowi. Połączenie hamujące zapobiega przekazaniu pobudzenia drugiemu neuronowi. Do wyładowania neuronu może okazać się niezbędne oddziaływanie dużej liczby impulsów docierających przez synapsy pobudzeniowe, rzadko się zdarza, żeby wystarczył jeden impuls. Aby ułatwić sobie analizę, załóżmy, że pojedynczy impuls nerwowy, docierający do synapsy pobudzeniowej, może wywołać reakcję nowej komórki. Chociaż nie jest to precyzyjne, błąd dotyczy jedynie liczby impulsów. Istota procesu zostanie oddana prawidłowo, a posługując się jednym impulsem nerwowym znacznie uprościmy wykład. Rozważmy problem utrzymania w pamięci sensorycznego wejścia. Załóżmy, że nastąpiła ekspozycja dużej litery A. Przypomnijmy, że przeszła ona różne stadia rozpoznawania obrazów i została zidentyfikowana jako A. Układ nerwowy może reagować w trojaki sposób na wystąpienie litery A. Możliwe, że na każdą literę reaguje oddzielna komórka, a zatem, jeśli system rozpoznawania obrazów wykryje obecność litery A, zareaguje ten odrębny detektor litery „A". Możliwe, że na każdy z elementów reaguje specyficzny zespół komórek, tak że o obecności litery A sygnalizuje specjalna konfiguracja reagujących komórek nerwowych. Możliwe, że dla każdej litery istnieje odrębny kod, tak że litera A jest wyodrębniona dzięki specjalnemu układowi wyładowań nerwowych. Niezależnie od tego, który z tych trzech możliwych kodów będzie działał, musi istnieć jakiś sposób zapamiętywania tego, że litera A występowała już przedtem (rys. 8-5). Przeanalizujmy jeden z prostszych modeli pamięci. 306 Obwody okrężne (rewerberacyjne). Najprostszy obwód określany jako obwód pamięci ma kształt zamkniętej pętli. Załóżmy, że na rysunku 8-6 grupy komórek A i B leżą w korze, a włókna nerwowe X i Y wychodzą z systemu rozpoznawania obrazów. Załóżmy, że jakiś sygnał sensoryczny pojawił się w systemie rozpoznawania obrazów i biegnie przez włókna nerwowe X i Y. Wówczas reakcje tych włókien mogą być zgodne z którymś z omówionych powyżej kodów. Określony typ informacji, pojawiający się na wejściu, nie ma w tym wypadku decydującego znaczenia dla analizy obwodu pamięciowego. W obwodach przedstawionych na rysunku 8-6 sygnał dochodzący przez włókno X daje początek kolejności zdarzeń w grupie komórek A. Komórka A 1 reaguje na aktywność włókna X wywołując reakcje komórki A2. Impulsy zaczynają krążyć po pętli, wywołując wyładowania kolejnych neuronów, pobudzenie obiega cały obwód, po czym powtarza od nowa swój cykl. Obwód rewerberuje (powtarza) cykl: pojawiający się sygnał sensoryczny uruchamia sekwencję impulsów elektrycznych, które działają przez czas nieokreślony długo po tym, jak sygnał przestał działać. Rewerberacja w pętli A stanowi „pamięć elektryczną" tego, że we włóknie X pojawiła się określona aktywność. Analogicznie jakaś aktywność w pętli B stanowi „pamięć elektryczną" sygnału B. 307 Aktywność rewerberacyjna wywołana określonym sygnałem nie może w rzeczywistości trwać w nieskończoność; inny mechanizm musi bowiem działać w wypadku pamięci krótkotrwałej. Co zatrzymuje rewerberację? Istnieje kilka możliwości. Jedna wypływa z faktu, że prawdziwy obwód okrężny musiałby mieć znacznie bardziej skomplikowaną budowę. Grupy komórek (takie jak A i B) w rzeczywistości działałyby jako znaczne skupiska neuronów występujących w skomplikowanych konfiguracjach. Aktywność własna tych neuronów, jak też oddziaływania (zarówno pobudzeniowe, jak i hamujące) licznych zewnętrznych wejść na pętlę mogłyby w konsekwencji doprowadzić do przerwania cyrkulacji impulsów. Druga możliwość-to pojawienie się nowych sygnałów, które mogą czynnie zahamować uprzednią aktywność rewerberacyjna. Trzecia możliwość tkwi w pewnej zawodności samego obwodu nerwowego: impuls dochodzący do jednego ogniwa łańcucha nie zawsze jest w stanie wywołać aktywność w ogniwie następnym, tak że w efekcie końcowym potok impulsów może wygasnąć. I na koniec, rewerberacja może zostać zahamowana w wyniku jakiegoś „zmęczenia" chemicznego neuronów lub synaps. Obok tych możliwości typu strukturalnego mogą wystąpić zjawiska patologiczne, całkowicie przerywające jakąkolwiek aktywność neuronów. Takim przypadkiem patologicznym może być wstrząs mózgu, wywołany uderzeniem w głowę, może on doprowadzić do okresowego wstrzymania aktywności nerwowej i amnezji w odniesieniu do tych zdarzeń, które pozostawały zakodowane w postaci sygnałów elektrycznych. Również zamierzone lub przypadkowe poddanie mózgu silnemu wstrząsowi elektrycznemu (jak na przykład elektrowstrząsy w terapii psychiatrycznej) może oczywiście prowadzić do dezorganizacji aktywności obwodów pamięciowych. Selektywna aktywizacja elektryczna określonej pętli nerwowej zapewnia działanie pamięci krótkotrwałej, utrzymujące się niezbyt długo. 308 Jak możemy przedstawić pamięć długotrwałą posługując się tego typu schematem? Konsolidacja. W układach typu obwodów okrężnych pamięć utrzymuje się dzięki wzajemnym połączeniom między neuronami. Zgodnie z dość powszechnie uznawaną teorią, powtarzająca się aktywność elektryczna w obwodach nerwowych wywołuje zmiany chemiczne lub strukturalne w samych neuronach, co prowadzi do pojawienia się nowych obwodów nerwowych. Ten proces wprowadzania uzupełnień w obwodzie, w toku którego zostaje w nim zakodowany nowy ślad pamięciowy, nazywa się konsolidacją. Konsolidacja pamięci zachodzi przypuszczalnie w ciągu dłuższego czasu. Według tej teorii, dla różnych rodzajów wspomnień budowane są odrębne obwody nerwowe. Aktywność elektryczna tych obwodów odpowiada okresowej ich aktywizacji. Tę właśnie okresową aktywność elektryczną określa się terminem pamięć krótkotrwała. Pamięć długotrwała charakteryzuje się stałą strukturą obwodów nerwowych. Tak więc, zarówno pamięć krótkotrwała, jak i pamięć długotrwała mogą być związane z tymi samymi tkankami nerwowymi, z tą różnicą, że pamięć krótkotrwała to okresowa aktywność elektryczna określonych neuronów, a pamięć długotrwała to stała struktura tych samych neuronów. Jakie mechanizmy uczestniczą w konsolidacji obwodów pamięciowych? Aby znaleźć odpowiedź na to pytanie, trzeba dysponować dodatkowymi danymi dotyczącymi stałej struktury pamięci. Najczęściej brane są pod uwagę dwie hipotezy: kodowanie chemiczne albo przyrost nowych połączeń synaptycznych. Przeanalizujmy obie te hipotezy. Przyjmijmy, że pamięć długotrwała zawarta jest w strukturze molekuł białkowych każdej synapsy. Jakim sposobem mogłaby ta informacja chemiczna oddziaływać na przewodzenie synaptyczne? Jedna z możliwości polega na tym, że białko wywiera wpływ na transmisję informacji przez szczelinę synaptyczną, oddzielającą akson od ciała komórki. Informacja nerwowa przebywa tę szczelinę za pomocą środków chemicznych; nadejście impulsu nerwowego do synapsy uwalnia mediator, substancję, która wydziela się w szczelinie i oddziałuje pobudzająco na ciało komórki. Jeżeli pamięć byłaby przechowywana w postaci chemicznej, czy to w synapsie czy też w strukturach uwalniających mediatory chemiczne, mogłaby wówczas łatwo regulować funkcjonowanie połączeń synaptycznych. Zgodnie z innymi poglądami, pamięć długotrwała może być rezultatem przyrostu nowych synaps. Jeżeli teoria ta jest prawdziwa, oznacza ona, że za każdym razem w trakcie uczenia się nowego materiału mózg zmienia się fizycznie. Teoretycznie przynajmniej tego typu zmiany powinny być widoczne: mogłyby więc zostać wykryte podczas mikroskopowych badań neuronów. W praktyce jednak zmian tych nie udało się zaobserwować, głównie z powodu wyjątkowych trudności, jakie nastręcza obserwacja żywych komórek nerwowych pod mikroskopem w sytuacji, kiedy reagują one na nadchodzące impulsy nerwowe. Niezależnie od tego, jaki system uczestniczyłby w kodowaniu w pamięci długotrwałej - zmiany chemiczne czy też przyrost nowych synaps - efekt jest jeden: właśnie synapsa jest tym miejscem, w którym zachodzi reorganizacja. Tak więc każdy z tych systemów 309 łatwo radzi sobie z problemem kodowania w pamięci za pomocą pojedynczych komórek. Synapsa zmienia się w taki sposób, że komórka reaguje wyłącznie w wypadku pojawienia się tej specyficznej informacji, którą ona reprezentuje. Jeżeli pamięć jest reprezentowana za pomocą specyficznego układu komórek, konieczne jest wtedy pobudzenie szeregu różnych połączeń synaptycznych. Aby nowa informacja została w taki sposób zakodowana, zmiany w synapsach różnych komórek powinny zachodzić w miarę jednocześnie. I wreszcie, jeżeli kodowanie w pamięci związane jest ze specyficznymi kodami wyładowań nerwowych, musi też istnieć jakiś mechanizm dekodowania informacji czasowej. Na przykład, komórka może reagować tylko w takim wypadku, gdy jest pobudzona przez dwa impulsy szybko napływające jeden po drugim, po których następuje przerwa określonej długości, a następnie znów dopływa pojedynczy impuls nerwowy (coś w rodzaju alfabetu Morse'a). Aby pojedyncza komórka albo grupa komórek były wrażliwe tylko na właściwy układ impulsów, w strukturach nerwowych muszą występować albo obwody synchronizujące (timing) impulsy w czasie, albo jakieś nieznane jeszcze substancje synaptyczne. Na przykład, można przyjąć istnienie struktur molekularnych, które w zasadzie pełniłyby funkcję hamującą, ale jeżeli zadziała na nie zestaw impulsów nerwowych, występujących w pewnej określonej sekwencji, to staną się one pobudzeniowymi. Jaka by nie była rzeczywiście natura kodowania, jedno jest pewne: pamięć krótkotrwała ma charakter elektryczny. Pamięć bezpośrednia zdarzenia jest możliwa dzięki reakcjom elektrycznym na to zdarzenie. CHEMIA PAMIĘCI Kiedy odkryto już procesy chemiczne leżące u podstaw dziedziczenia, pojawiła się również myśl, że te same mechanizmy mogą brać udział w procesach pamięci. Informacja genetyczna, specyficzna dla każdego organizmu, zmagazynowana jest w gigantycznych cząsteczkach kwasu dezoksyrybonukleinowego (DNA); przenoszenie tej informacji z DNA do otaczającej protoplazmy następuje dzięki cząsteczkom innego kwasu nukleinowego - kwasu rybonukleinowego (RNA). Ponieważ DNA zawiera pamięć genetyczną dla każdego jednostkowego organizmu, logiczne wydaje się założenie, że właśnie on albo RNA może również przekazywać nabyte doświadczenie. Wiemy, że białko uczestniczy w funkcjonowaniu neuronów, a RNA odgrywa ważną rolę w procesie syntezy nowych białek. Czy synteza ta nie może również wiązać się z procesami pamięci? Zmiany w RNA a uczenie się Instrukcję dla syntezy białka przenoszoną przez cząsteczkę RNA odkrywamy w charakterystycznej kolejności zasad organicznych, które są przyłączone do łańcucha cząsteczki. Zasady te służą za matrycę do budowy białek. Różnorodna kolejność zasad daje w rezultacie różne białka. 310 Można założyć, że kolejność tych zasad, a nawet ich względne stężenia mogą się zmieniać w rezultacie doświadczenia nabywanego przez zwierzęta w sytuacji uczenia się. W jednym z typowych eksperymentów grupę szczurów uczono wspinania się po drucie na platformę, na której umieszczony był pokarm. Aby uwzględnić czystą stymulację występującą w rezultacie wspinania się po drucie, grupę kontrolną szczurów obracano we wszystkich kierunkach w specjalnym aparacie, który odtwarzał ruchy szczurów poddanych pierwszemu eksperymentowi. Kiedy pierwsza grupa szczurów opanowała zadanie, przeprowadzono próby biochemiczne RNA pobranego z systemu mózgowego zawiadującego orientacją przestrzenną (system przedsionkowy) w obu grupach. W obu też grupach występowała wyższa niż normalnie koncentracja RNA. Jednak w grupie poddanej zadaniu eksperymentalnemu zmieniła się również względna koncentracja różnych zasad (Hyden i Egyhazi, 1964). Zarówno powtarzająca się aktywizacja neuronów, jak i wyuczone doświadczenia wywarły dający się mierzyć wpływ na RNA. Wykryte zmiany okazały się raczej mało skomplikowane, co można częściowo wyjaśnić trudnościami technicznymi w przeprowadzaniu niezbędnych eksperymentów oraz analizy biochemicznej. Uczenie się po wprowadzeniu zmian w RNA Czy zmiany w RNA powstałe w wyniku uczenia się nowych doświadczeń zawierają informację o zadaniu? Jeden ze sposobów sprawdzenia tego polega na wyuczeniu zwierzęcia wykonywania określonego zadania, wydobyciu RNA z odpowiednich części jego układu nerwowego, a następnie posłużeniu się tym RNA do częściowego lub pełnego przekazania nabytej wiedzy innym zwierzętom. To duże zamierzenie, a droga najeżona jest trudnościami. Niemniej jednak metoda ta przyniosła pewne rewelacyjne (i bardzo kontrowersyjne) wyniki. Badania na płazińcach. Pierwsze badania zaczęły się dość skromnie. Jako przedmiot badań wybrano dość dziwne stworzenie z typu płazińców (planaria). O wyborze tego płaskiego robaka zadecydowało to, że przecięty na dwie części może z każdej regenerować się w nowy organizm. Dzięki temu płazińce zapewniają eksperymentowi idealne warunki kontrolne: jeżeli trzeba przeprowadzić na tym samym obiekcie dwa różne eksperymenty, wystarczy po prostu przeciąć go na dwie części, aby uzyskać dwa identyczne organizmy. Eksperyment jest więc prosty i bezpośredni. Najpierw wyuczono płazińca wykonywać określone zadania, a następnie przecięto go na pół uzyskując dwa identyczne osobniki. Kiedy obie połówki w pełni się zregenerowały, przystąpiono do eksperymentu kontrolnego. Jeżeli pamięć jest zakodowana chemicznie, to jest możliwe, że obie połowy przechowują zadanie w pamięci. Jeżeli zaś pamięć utrzymuje się w specjalnych połączeniach nerwów w głowie, to osobnik zregenerowany z części ogonowej, będąc identyczny genetycznie ze swym bliźniakiem, nie będzie posiadał nabytej przezeń wiedzy. 311 Zazwyczaj pod wpływem drażnienia prądem płazińce odruchowo się kurczą. W wyniku częstego drażnienia prądem, poprzedzonego silnym światłem, powstaje odruch warunkowy- kurczenie się, gdy eksponowany jest bodziec świetlny, nawet jeżeli światłu nie towarzyszy drażnienie elektryczne. Po wytworzeniu reakcji na kojarzenie światła z szokiem elektrycznym, płazińce są przecinane na pół, a następnie każda połowa regeneruje się. Oba zwierzęta - i to, które wyrosło z części ogonowej, i to, które wyrosło z części głowowej - zdają się pamiętać zadanie (McConnell, Jacobson, Kimble, 1959). Fakt ten jest zadziwiający. Normalnie oczekujemy, że informacja magazynowana jest w mózgu. Dlaczego więc płazińce, które regenerowały się z części ogonowej, pamiętają wiązek między światłem a drażnieniem prądem elektrycznym? Jeżeli nawet informacja o tym przechowywana jest w cząsteczkach RNA, to w jaki sposób dociera ona do części ogonowej? RYSUNEK. 8-7 1. Płaziniec przed eksperymentem. Po przecięciu płazińca na pół, każda z połówek posiada zdolność do regeneracji 2. Pod wpływem drażnienia prądem płaziniec się kurczy Drażnienie prądem poprzedzone jest silnym światłem 3. Po treningu płaziniec kurczy się na pojawienie się bodźca świetlnego 4. Uwarunkowany na światło płaziniec zostaje przecięty na pół 5. Rezultat: dwa kompletne płazińce 6. Oba zwierzęta kurczą się na pojawienie się światła, wykazując, że efekty uczenia utrzymują się. 312 RYSUNEK 8-8 1. Płaziniec wyuczony reakcja na światło, jak w poprzednim eksperymencie 2. Wyuczonego płazińca przecięto na pół i obie połówki umieszczono w roztworze rybonukleazy 3. Rybonukleaza zmienia proces tworzenia się RNA w nowej połowie ciała 4. Płaziniec zregenerowany z części głowowej reaguje na światło, a płaziniec zregenerowany z części ogonowej nie reaguje Oczywiście, płazińce są dość dziwnym organizmem - mają zdolność do regeneracji całego ciała z jednego drobnego fragmentu. Najwidoczniej zwierzęta mające taką zdolność potrafią rozprowadzać pamięć po całym organizmie. Udział RNA w tym zjawisku potwierdza fakt, że kiedy obie części uwarunkowanego na światło płazińca regenerowano w roztworze zawierającym rybonukleazę niszczącą chemicznie RNA, to osobnik zregenerowany z części głowowej, tak jak uprzednio, przechowywał wyuczoną informację, a osobnik zregenerowany z części ogonowej nie pamiętał wyuczonego uprzednio doświadczenia (Corning i John, 1961). Istnieje kilka możliwych interpretacji tego zjawiska; dla nas najbardziej interesujące jest to, że RNA zawierający informację o wyuczonym odruchu nie został przeniesiony do ponownie kształtującej się głowy w toku regeneracji w roztworze rybonukleazy. Skłania to do przypuszczeń, że jeśli nawet RNA zawierający nabytą informację rozprzestrzeniany jest po całym organizmie (przynajmniej u tego robaka), to wykorzystany może być jedynie przez część głowową (rys. 8-8). Badania chemiczne. Przeprowadzono również badania chemiczne innego typu. Wypróbowywano szereg środków farmakologicznych na różnych żywych stworzeniach (nie wyłączając ludzi) w różnorodnych sytuacjach uczenia się. Najczęściej do badań tego typu używano substancji ułatwiających lub utrudniających syntezę białka. Substancje, które ułatwiają syntezę białka, 313 zazwyczaj podwyższają dostępność RNA albo też jego efektywność; te zaś, które hamują lub utrudniają syntezę białka, realizują to zmniejszając ilość dostępnego RNA lub też pobierając te składniki, które są niezbędne do syntezy białka. Inne środki farmakologiczne oddziałują na przekazywanie sygnałów nerwowych przez synapsy. Badania te ujawniły pewne nowe aspekty funkcjonowania pamięci. Okazuje się, że pamięć jest najbardziej podatna na zaburzający wpływ określonych środków aplikowanych zaraz po uczeniu się. Im dłuższy odstęp czasu między uczeniem się a zaaplikowaniem określonych środków, tym większa dawka tych środków jest potrzebna do usunięcia śladów pamięciowych. Czy to oznacza, że wraz z upływem czasu pamięć staje się coraz trwalsza? Oczywiście, przeprowadzenie podobnych eksperymentów wiąże się z licznymi trudnościami. Dyskusja nad interpretacją ich wyników była niezwykle burzliwa. Fakt uszkodzenia lub osłabienia śladów pamięciowych przez wprowadzenie substancji chemicznej nie oznacza jeszcze, że samo zapamiętywanie oparte jest na kodowaniu chemicznym. Normalne funkcjonowanie układu nerwowego niewątpliwie zależy od precyzyjnie wyważonego i ściśle regulowanego środowiska chemicznego. W środowisku tym łatwo mogą pojawić się zaburzenia wynikające z działania bardzo różnorodnych czynników albo substancji (jak np.: trucizna, niedobór tlenu, alkohol, środki halucynogenne), a nie tylko tych, które są specyficznie powiązane z syntezą białka i przekazywaniem synaptycznym. Te trudności między innymi nie pozwalają nam jeszcze na sformułowanie właściwych wniosków. Przekazywanie pamięci Najbardziej frapujące eksperymenty psychologiczne w ostatnich latach dotyczyły przenoszenia pamięci z jednego zwierzęcia na drugie. Płazińce mające silnie rozwinięte zdolności regenerowania są równocześnie kanibalami-oznacza to, że z ochotą pożerają się wzajemnie. Jeżeli wyuczymy płazińca tego, że światło poprzedza zawsze uderzenie prądem, a następnie zabijemy go i rozdrobnionym ciałem nakarmimy innego płazińca, to okazuje się, że doświadczenie nabyte przez pierwszego przekazywane jest drugiemu robakowi (McConnel, 1962, 1964). Jak należało oczekiwać, eksperymenty z przekazywaniem pamięci wywoływały olbrzymie zainteresowanie wśród szerokiej publiczności i równocześnie skrajnie sceptyczny stosunek środowisk naukowych. Ostatnie próby powtórzenia tych eksperymentów zakończyły się fiaskiem. Okazało się, że istnieje wiele różnych prawdopodobnych wyjaśnień pozornego sukcesu pierwszych eksperymentów, ale żadne z nich nie ma nic wspólnego z pamięcią. A jeżeli nawet pamięć odgrywa w tym jakąś rolę, trzeba uwzględnić fakt, że płaziniec to względnie prymitywny organizm. Może on charakteryzować się specyficznymi mechanizmami uczenia się, które nie mają żadnego znaczenia dla zrozumienia pamięci organizmów wyższych. 314 Gdy dyskusje rozgorzały na dobre, pojawiły się nowe dane świadczące o analogicznej formie przekazywania pamięci u szczurów i myszy (Unger, 1966; Unger i Oceguera-Navarro, 1965). Szczury (i ludzie) zazwyczaj podskakują w momencie nagłego, silnego dźwięku. We wstępnej fazie eksperymentów szczurom eksponowano często głośne dźwięki. Trwało to tak długo, aż zwierzęta przywykły do nich i później już nie reagowały na nie drgnięciem. Taka habituacja wymaga około 9 dni treningu. Następnie niewytrenowanej myszy wstrzykiwano dializowany homogenat mózgu, wzięty z wyuczonych dawców, po czym sprawdzano jej reakcję na dźwięk. U myszy po wstrzyknięciu uzyskiwano już średnio po około 1,2 dnia zahamowanie reakcji lękowej - zaskakujący rezultat, zwłaszcza gdy zwrócimy uwagę na to, że na zahamowanie tego typu reakcji lękowej u myszy nie poddanej wstrzyknięciu trzeba jeszcze więcej czasu niż u szczurów. Mysz, której wstrzyknięto dializowany homogenat mózgu niewytrenowanych szczurów, potrzebowała 11 dni, aby przyzwyczaić się do dźwięku, to znaczy mniej więcej tyle czasu, ile zużywały myszy, które nie otrzymały żadnego środka. Wyniki te są frapujące, pozostaje jednak niejasne, czy rzeczywiście przenoszone były od jednego do drugiego zwierzęcia jakieś informacje, czy jedynie ogólny wpływ hamujący? Następny eksperyment pokazał, że wpływ wstrzyknięcia był rzeczywiście specyficzny. Jedną grupę zwierząt przyzwyczajano do silnego dźwięku, a drugą do podmuchu powietrza (co normalnie również wywołuje reakcję lękową). Po wstrzyknięciu homogenatu mózgu niewytrenowanym zwierzętom wystąpiło u nich przeuczenie wyłącznie w odniesieniu do tego specyficznego nawyku, który został nabyty przez dawcę. U biorcy homogenatu mózgu od szczura, którego wyuczono hamowania reakcji lękowej na strumień powietrza, zauważono hamowanie reakcji tylko na działanie strumienia powietrza, natomiast nie występowało osłabienie reakcji na dźwięk, czego nie uczono jego dawcy (rys. 8-9). RYSUNEK 8-9 Szczury normalnie przejawiają reakcje lękową na głośny dźwięk albo inne nieoczekiwane zdarzenie A1. Szczury grupy A wyuczono nie bać się podmuchu powietrza A2. Homogenat mózgu szczurów grupy A wstrzyknięto nie trenowanym zwierzętom A3. Zwierzęta, którym wstrzyknięto homogenat mózgu grupy A, uczą się nie reagować na silny podmuch powietrza po 4,9 dnia A4. Ale nawet po 8 dniach nie mogą przyzwyczaić się do silnego hałasu B1. Szczury grupy B wyuczono nie bać się silnego hałasu C1. Grupa kontrolna C nie jest trenowana w ogóle B2. Homogenat mózgu szczurów grupy B wstrzyknięto nie trenowanym zwierzętom B3. Zwierzęta, którym wstrzyknięto homogenat mózgu grupy B, uczą się nie reagować na silny dźwięk już po 1,6 dnia B4. Ale nawet po 12 dniach me mogą przyzwyczaić się do silnego podmuchu powietrza C2. Homogenat mózgu szczurów grupy C wstrzyknięto nie trenowanym zwierzętom C3. Zwierzęta, którym wstrzyknięto homogenat mózgu grupy C, potrzebują aż 12 dni, aby wyuczyć się niereagowania na silny hałas C4. I aż 15 dni, aby wyuczyć się niereagowania na podmuch powietrza Co można wywnioskować z tego wszystkiego? Ostatecznej odpowiedzi na razie nie mamy. Wielu uczonych odnosi się dość sceptycznie do tych spraw. Jeżeli możliwe jest przekazywanie informacji zmagazynowanej w pamięci, stawia to przed nami wiele interesujących problemów dotyczących natury pamięci. Oznaczałoby to, że specyficzne ślady pamięciowe zakodowane są w substancjach chemicznych, a substancje te mogą dość swobodnie przenosić się w organizmie i mogą być przekazywane od jednego organizmu do drugiego, nawet od szczurów do myszy. Jak w tej sytuacji wyjaśnić kodowanie w neuronach? Brak jakichkolwiek danych o tym, jakie mechanizmy mogą zapewnić działanie podobnego systemu. Zanim będziemy mogli rozstrzygnąć, jakie konsekwencje mają te badania dla procesu gromadzenia i przetwarzania informacji, musimy jeszcze poczekać, aż uzyska się więcej wyników badań eksperymentalnych. ZABURZENIA PAMIĘCI Jest oczywiste, że pamięć krótkotrwała służy do utrzymywania informacji przez okres niezbędny dla dokonania jej konsolidacji. W czasie aktywności elektrycznej, wywołanej jakimś zdarzeniem, 315 jego ślad pamięciowy konsoliduje się w pamięci długotrwałej. Możliwe jest zatem naruszenie stałych śladów zdarzeń przez dezorganizację tej aktywności elektrycznej. Założenie to potwierdza się. Oddziaływanie silnego prądu elektrycznego na żywy mózg powoduje zaburzenia pamięci krótkotrwałej. Wstrząsy elektryczne RYSUNEK 8-10 1. Szczur zostaje umieszczony na wysokiej platformie, pod którą znajduje się krata podłączona do sieci elektrycznej 2. Szczur usiłuje zeskoczyć z platformy i otrzymuje słaby wstrząs elektryczny 3. Szczura zabrano z platformy 4. Szczur zostaje ponownie umieszczony na platformie 5. Szczur nie schodzi z platformy 1. Szczur zostaje umieszczony na wysokiej platformie, pod którą znajduje się krata podłączona do sieci elektrycznej 2. Szczur usiłuje zeskoczyć z platformy i otrzymuje słaby wstrząs elektryczny 3. Szczur zostaje zdjęty z platformy i poddany silnemu wstrząsowi elektrycznemu 4. Szczur zostaje ponownie umieszczony na platformie 5. Szczur zeskakuje z platformy Wstrząs elektryczny (electroconvulsive shock, ECS) polega na stosowaniu prądu elektrycznego o takim napięciu, że wywołuje ono konwulsje. W typowym eksperymencie ze zwierzętami (rys.8-10) szczura umieszcza się na wysokiej platformie o tak małych rozmiarach, aby zwierze nie czuło się zbyt wygodnie. Krata pod platformą jest podłączona do sieci elektrycznej. Kiedy szczur zeskakuje z platformy, co jest jego naturalną reakcją, otrzymuje średnio nieprzyjemne uderzenie prądem elektrycznym. W warunkach normalnych szczur w tej sytuacji uczy się bardzo szybko (zazwyczaj po jednej próbie) pozostawać jak najdłużej na niewygodnej platformie. Ale jeżeli za każdym razem natychmiast po zeskoczeniu z platformy otrzyma on ECS, będzie zachowywał się po tym jak zwierzę niedoświadczone, to znaczy będzie zeskakiwał z platformy otrzymując za każdym razem słabe uderzenia prądem elektrycznym po łapach. Im dłuższa przerwa między reakcją a zastosowaniem ECS, tym mniej prawdopodobne, że zwierzę zeskoczy na dół (rys. 8-10). [Przeprowadzono wiele badań nad związkiem wstrząsu elektrycznego z amnezją wsteczną. Krytyczne omówienie tych eksperymentów i bibliografię Czytelnik może znaleźć w artykule Deutscha (1969).] Eksperyment z platformą pomija wiele ważnych problemów. Załóżmy, że w eksperymencie stawia się inne zadania-uczy się zwierzę przechodzić określonym korytarzem labiryntu w celu uzyskania pożywienia, i przyjmijmy, że po każdej próbie otrzymuje ono ECS. Zwierzę może w efekcie unikać drogi prowadzącej do pożywienia, aby nie poddawać się nieprzyjemnemu działaniu ECS. Mówiąc inaczej, w takich warunkach nie można odróżnić jego niezdolności do zapamiętania, gdzie znajduje się pokarm, od jego prób uniknięcia ECS. W eksperymencie z platformą szczur jednak kontynuuje swoje reakcje, w rezultacie otrzymuje uderzenie prądem po łapach i ECS. Jeżeliby zapamiętał jakiekolwiek przykre wrażenia, będące wynikiem ECS, to przejawiałby narastającą niechęć do opuszczenia platformy. Nic takiego nie następuje, najwidoczniej zwierzę zapomina o nieprzyjemnym uczuciu towarzyszącym uderzeniu prądem po łapach, jak i o przykrym uczuciu wywołanym ECS. Wyraźny jest zatem wpływ ECS na pamięć zwierzęcia. Ponieważ ECS stosuje się również jako technikę terapeutyczną w leczeniu zaburzeń psychicznych u człowieka, podejmowane były próby badania jego wpływu na pamięć chorego. Okazało się jednak, że uzyskane rezultaty były niezupełnie przekonywające. Jeżeli wymagano od pacjentów tuż przed zastosowaniem ECS wyuczenia się listy słów, a po ECS sprawdzono, w jakim stopniu pamiętają oni te słowa, to okazało się, że zapominają więcej niż normalnie. Ale przyczyną tego mogą być różne czynniki motywacyjne: należy pamiętać, że wszyscy chorzy cierpią na takie lub inne 316 zaburzenia psychiczne, zazwyczaj oczekiwana terapia budzi w nich silny lęk i mało ich interesuje wyuczenie się listy nie powiązanych ze sobą słów (patrz też Williams, 1966). Amnezje Wstrząs elektryczny może zaburzyć proces uczenia się u zwierząt i wywołać amnezję u ludzi co najmniej w odniesieniu do bardzo niedawnych zdarzeń. Te skutki amnezji same w sobie są interesujące, a prócz tego wskazują na pewne kierunki badań nad pamięcią. 317 Typowa forma amnezji nosi nazwę amnezji wstecznej (retrograde amnesia). Najczęściej można ją zaobserwować w następstwie silnego wstrząsu mózgu, powstałego wskutek upadku, uderzenia w głowę lub też wskutek wstrząsu elektrycznego. Człowiek dotknięty amnezją wsteczną nie pamięta zdarzeń sprzed wypadku. Ale, co dziwniejsze, nie napomina zdarzeń z odległej przeszłości. Można więc przedstawić pamięć w postaci prostej linii rozciągniętej w czasie. Po doznanym urazie linia zaciera się poczynając od momentu, kiedy nastąpił wypadek, przy czym to zacieranie rozciąga się wstecz proporcjonalnie do tego, jak poważne jest uszkodzenie. W miarę powrotu chorego do zdrowia jako pierwsze pojawiają się wspomnienia dawno minionych zdarzeń (rys. 8-11). 319 SPRAWDZIAN UTRATY PAMIĘCI RYSUNEK 8-11. Hipotetyczne fazy odzyskiwania pamięci po amnezji wstecznej. Źródło: Barbizet (1970). Najwidoczniej ślady pamięciowe w rzeczywistości nie były zatarte, a raczej zakryte. Proces powrotu pamięci wydaje się procesem odkrywania kolejnych zapisów w pamięci, poczynając od bardzo odległej przeszłości aż do teraźniejszości. To, w jakim stopniu pamięć ostatecznie powróci, zależy od wielu czynników, ale powraca ona prawie u wszystkich. (Historie oglądane czasem na ekranie, w których ludzie tracą pamięć na wiele lat, w rzeczywistości występują dość rzadko, a jeżeli już się zdarzają, to według wszelkiego prawdopodobieństwa spowodowane są częściej przez czynniki psychiczne niż przez urazy fizyczne mózgu; innymi słowy bywają często związane z tym, że pacjent sam tłumi nieświadomie określone wspomnienia. Po odpowiednim leczeniu psychiatrycznym może sobie wszystko przypomnieć). Ostatnie kilka minut przed wypadkiem nie wydają się jednak możliwe do odtworzenia. Fakt ten służy do potwierdzenia hipotezy, że zdarzenia zachodzące w momencie wypadku znajdowały się tylko w pamięci krótkotrwałej i nie zdążyły przejść do pamięci długotrwałej. Zjawisko to często wykorzystywane jest jako potwierdzenie faktu, że do konsolidacji pamięci niezbędny jest odpowiedni okres czasu. Przebieg zapominania i odzyskiwania pamięci w sytuacji amnezji wstecznej ma istotne znaczenie dla wyjaśnienia sposobu funkcjonowania pamięci. Przede wszystkim należy zwrócić uwagę na to, że uraz wpływa wyłącznie na pamięć o zdarzeniach z przeszłości. Inne rodzaje przechowywanej informacji, na przykład rozumienie i posługiwanie się językiem, pozostają nienaruszone. W dalszych rozważaniach wykażemy, że pewne rodzaje uszkodzeń mózgu wpływają z kolei tylko na funkcje mowy, nie naruszając przy tym pamięci przeszłych zdarzeń. 320 Ponieważ po urazie pamięć stopniowo powraca, najwidoczniej szok pourazowy nie likwiduje nagromadzonej informacji, a po prostu powoduje, że staje się ona niedostępna. Tak więc samo przechowywanie informacji najwyraźniej jest czymś odrębnym od procesów związanych z wydobywaniem przechowywanych śladów pamięciowych. Wróćmy raz jeszcze do dziwnego przebiegu powrotu pamięci po amnezji. Utrata wspomnień z dalekiej przeszłości jest najmniej prawdopodobna, a ponadto, jeśli nastąpi, wspomnienia te pojawiają się w pierwszej kolejności. Proces odzyskiwania pamięci przebiega od dalekiej przeszłości do teraźniejszości. Sugeruje to nam dwie właściwości natury pamięci. Po pierwsze, informacja dotycząca czasu wystąpienia tego czy innego zdarzenia służy najwidoczniej za ważną wskazówkę w późniejszym przypomnieniu go sobie; inaczej byłoby niezrozumiałe, dlaczego przebieg odzyskiwania pamięci tak silnie zależy od czasu, w jakim zachodziły zdarzenia. Po drugie, taka kolejność odzyskiwania pamięci świadczyłaby o tym, że stare wspomnienia są trwalsze niż nowe. Możliwe, że wraz z upływem czasu pamięć w jakiś sposób wzmacnia się automatycznie, dlaczegóżby inaczej stare wspomnienia miały być najodporniejsze na działanie szoku pourazowego, a wspomnienia z niedawnej przeszłości najbardziej nań podatne? Ale podobne rozumowanie przeczy najwyraźniej zdrowemu rozsądkowi. Zazwyczaj trudno jest nam przypomnieć sobie dawne zdarzenia. A przecież, gdyby były one najtrwalsze, to i przywołać je powinno być najłatwiej? Możliwe, że właśnie trudność w przypominaniu sobie dawnych zdarzeń wiąże się z ich wyraźną odpornością na amnezję. Być może, uraz oddziałuje tylko na silniejsze, a przez to, oczywiście, bardziej dostępne wspomnienia. Możliwe, że uraz rozprzestrzenia się od teraźniejszości - bez wątpienia najbardziej dostępnej dla naszej pamięci - do przeszłości poprzez szlaki strukturalne pamięci długotrwałej. Jeżeli tak jest istotnie, to powinniśmy ponownie przeanalizować niektóre z badań dotyczących chemicznej natury pamięci. Jak już wspominaliśmy, stwierdzono, że im większy jest odstęp między uczeniem się a wprowadzeniem środka farmakologicznego, wywołującego zacieranie się pamięci, tym większą jego dawkę należy zaaplikować, aby uzyskać ten efekt. Czy następuje to w związku z tym, że starsze ślady są trwalsze (jak sugerowano wyżej), czy też po prostu starsze ślady są trudniej dostępne od nowych i dlatego nie łatwo jest je zniszczyć? Na pytanie to trudno odpowiedzieć. Fakt, że zdarzenia zaistniałe w ostatnich kilku minutach przed urazem mózgu nie przypominają się nigdy, jest zgodny z poprzednimi wynikami dotyczącymi skutków działania ECS. [Pewna niepokojąca niezgodność występuje w odniesieniu do czasu trwania pamięci krótkotrwałej u ludzi i zwierząt. Badania na zwierzętach przy użyciu ECS wskazują, że pamięć krótkotrwała trwa co najmniej jedną godzinę. W niektórych z tych badań przyjmuje się, że zdarzenie przechowywane przez pierwsze 24 godziny pochodzi z pamięci krótkotrwałej. W badaniach z ludźmi pamięć krótkotrwałą szacuje się w sekundach. W następnym rozdziale zobaczymy, że pamięć krótkotrwała u człowieka może trwać jedynie przez czas od 20 do 30 sek.] Uszkodzenie pamięci krótkotrwałej najwidoczniej wpływa na przechowywanie informacji w pamięci długotrwałej. Nie oznacza to jednak, że kiedy pamięć krótkotrwała funkcjonuje prawidłowo, informacja będzie automatycznie zarejestrowana w pamięci długotrwałej. Bez trudności zapamiętujemy przez krótki czas dopiero co zaszłe zdarzenia, 321 ale bardziej trwale zapamiętanie tych zdarzeń wymaga aktywnego wysiłku. Wynika z tego, że do przechowania informacji w pamięci długotrwałej potrzeba czegoś więcej, aniżeli krótkotrwałej rewerberacji elektrycznej. Przypadki H.M. i N.A. Zapoznajmy się z zaburzeniami pamięci u chorego, którego nazwiemy N.A. Pełnił on służbę wojskową w jakiejś nudnej bazie wojskowej. Aby jakoś spędzić czas, zajmował się fechtunkiem. Pewnego razu spadł ochraniacz z floretu jego przeciwnika i N.A. został zraniony. Ostrze floretu przeszło przez dość cienką kość nosową i przedostało się do mózgu. Osoba, która spotkałaby przypadkowo N.A. w kilka miesięcy po wypadku, byłaby przekonana, że jest on całkowicie zdrowym człowiekiem. Chodził normalnie, wykonywał szereg czynności i mógł nawet podtrzymać typową rozmowę towarzyską. W zachowaniu jego pojawiła się tylko jedna niezwykła rzecz - najwyraźniej nie potrafił zatrzymać dłużej w pamięci żadnych nowych zdarzeń. Historyjka poniższa dobrze ilustruje jego trudności. Jednym z psychologów badających zaburzenia pamięci u N.A. był profesor Wayne Wickelgren, który pracował w Massachusetts Institute of Technology. On to właśnie opowiedział tę historię: „Przedstawiono mi N.A. w maleńkiej kawiarence Wydziału Psychologicznego M.I.T. Odbyło się to w następujący sposób. N.A. usłyszawszy moje nazwisko zapytał: Wickelgren, to niemieckie nazwisko, nieprawdaż? Nie, odpowiedziałem. Irlandzkie? Nie. Skandynawskie? Tak, skandynawskie. Porozmawiałem z nim około pięciu minut, a następnie udałem się do swojego gabinetu, gdzie przebywałem chyba przez pięć minut. Kiedy wróciłem, N.A. popatrzył na mnie tak jakby widział mnie po raz pierwszy w życiu. Ponownie zostałem mu przedstawiony, po czym zapytał mnie: Wickelgren to niemieckie nazwisko, nieprawdaż? Nie. Irlandzkie? Nie. Skandynawskie? Tak". 322 Dokładnie w tej kolejności co uprzednio (Wickelgren, bezpośrednia informacja). Chociaż sama rozmowa z N.A. wydawała się zupełnie normalna, to kiedy została przerwana, wszystko trzeba było zaczynać od nowa, tak jakby do tego momentu nic nie zostało powiedziane. [Nawiasem mówiąc, bardzo to komplikuje prace eksperymentalne z tego typu chorymi. Jeden z nas pracował z profesorem Wickelgrenem badając pamięć krótkotrwałą studentów Harwardu i M.I.T. Pewnego razu, kiedy N. A. odwiedził M.I.T., pomyśleliśmy, że warto byłoby włączyć go do naszych eksperymentów, ponieważ pozwoliłoby to na porównanie jego pamięci z pamięcią innych badanych. Ale nie wyszliśmy poza podanie instrukcji. N.A. zazwyczaj wysłuchiwał naszych objaśnień, kiwał głową i mówił: „Świetnie, zaczynamy!" Wtedy eksperymentator odwracał się, aby włączyć magnetofon i pozostałą aparaturę. Kiedy wszystko było przygotowane i pozostawało zaprezentować N. A. pierwszy materiał eksperymentalny, pytano go: „Czy jest pan gotów?", na co on niezmiennie odpowiadał: „Gotowy, do czego? Chcecie, żebym coś zrobił?" Z czasem Wickelgren miał więcej szczęścia, ale nasze początkowe trudności ilustrują fakt, że jakkolwiek chorzy tego typu mogą dostarczyć nadzwyczaj pożytecznych informacji dotyczących pamięci, to uzyskanie niezbędnych danych jest rzeczą niezwykle trudną. W dodatku cierpią oni wskutek innych problemów wynikających z defektu neurologicznego, problemów nie związanych z pamięcią, lecz, będących przyczyną trudności motywacyjnych i emocjonalnych podczas prowadzenia tych badań. Bardziej szczegółowy opis testów stosowanych w tego typu przypadkach patrz seria artykułów, które ukazały się w czasopiśmie „Neuropsychologia" 1968, t. 6, s. 211-282. Omówione tam są też przypadki obu pacjentów N. A. i H. M.] Jak żyją ludzie z podobnymi uszkodzeniami mózgu? Inny chory, który poddany był dokładnym badaniom, to H.M., cierpiał on na silne ataki epileptyczne. Kiedy miał lat 27, nie mógł już dłużej pracować i wskutek krańcowo złego samopoczucia zdecydował się na poddanie operacji chirurgicznej (usunięto mu środkowe partie płatów skroniowych). Po zabiegu zniknęły ataki epilepsji, jego I.I. podniósł się do 118 (do operacji wynosił 104), ale nie mógł zapamiętać nowych rzeczy. Oto jak badający H.M. opisuje jego życie: „Przez trzy noce w Clinical Research Center pacjent wzywał nocną pielęgniarkę i przepraszając ją gorąco wypytywał, gdzie się znajduje i jak się tu dostał. Było dla niego oczywiste; że leży w szpitalu, ale jak się okazało, nie mógł sobie nic przypomnieć z wydarzeń ubiegłego dnia. Przy innej okazji zauważył: Każdy dzień jest sam dla siebie, bez względu na to, jaką radość czy smutek mi przynosi. Często starając się przedstawić typowy opis swojego, stanu, stwierdzał, że jest to »podobne do przebudzenia się ze snu«. Jego doświadczenie życiowe to doświadczenie człowieka, który dopiero zaczyna orientować się w otoczeniu, jeszcze nie rozumie w pełni sytuacji, a to dlatego, że nie pamięta tego, co działo się wcześniej". (Milner, Corkin i Teuber, 1968). Typ uszkodzenia mózgu u tych chorych stawia przed nami kilka problemów dotyczących mechanizmów pamięci. Ich systemy pamięciowe działają najwidoczniej prawidłowo pod każdym względem, z wyjątkiem jednego - wejścia do pamięci długotrwałej. Wejście informacji do pamięci krótkotrwałej oraz wydobycie jej są, jak widać, nieuszkodzone. Chorzy mogą prowadzić rozmowę, co oznacza, że potrafią wydobywać znaczenia słów ze swojej pamięci trwałej. 323 Mogą zatem posługiwać się tym systemem, nie mogą jedynie wprowadzić do niego nic nowego. To bardzo istotna różnica. Jak więc chory może wykonywać złożone procesy umysłowe, niezbędne do rozumienia i posługiwania się językiem, jeśli jednocześnie nie potrafi wprowadzić do systemu pamięci nowego materiału? Nawet H.M., pacjent z najbardziej ostro przejawiającymi się zaburzeniami, zachował zdolność normalnego rozumienia mowy: „Może powtarzać i przekształcać zdania ze skomplikowaną składnią, rozumie istotę żartów, nawet opartych na dwuznaczności semantycznej". (Milner i inni, 1968). Ustaliliśmy wcześniej, że bardzo ważne jest rozróżnienie informacji przechowywanej już w pamięci i procesów związanych z jej wydobyciem. Oczywiście, niemniej ważne jest rozróżnienie operacji zapewniających dostęp do informacji przechowywanej w pamięci długotrwałej oraz operacji zapewniających nowej informacji wejście do pamięci długotrwałej. Chory z omawianymi wyżej zaburzeniami jest zdolny do tworzenia wspomnień krótkotrwałych, czyli typowej pamięci krótkotrwałej oraz „pamięci pracującej", niezbędnej do śledzenia informacji w miarę wydobywania jej z pamięci długotrwałej. Ale procesy zapewniające przekształcenie tego materiału krótkotrwałego w materiał trwały są wybiórczo zaburzone. Czego mogą się uczyć pacjenci tego typu? Trudno jest odpowiedzieć na to pytanie. Jasne jest, że pewnych rzeczy mogą się nauczyć. H.M. nie mógł opisać, jakie zajęcie wykonuje w państwowym ośrodku rehabilitacyjnym (przymocowywanie zapałek do kawałków kartonu) nawet po 6 miesiącach codziennego wykonywania tej czynności. Niemniej jednak „mgliście zdawał sobie sprawę" z takich rzeczy, jak śmierć swojego ojca czy zabójstwo prezydenta Kennedy'ego. Czy ta słaba, powierzchowna pamięć mówi nam coś o naturze procesów pamięciowych, czy też po prostu wskazuje, że zaburzenie neurologiczne nie jest całkowite? Na przykład, u pacjenta N.A. w okresie następującym po wypadku pamięć jego stopniowo polepszyła się, tak że, kiedy jeden z nas badał go w Uniwersytecie Kalifornijskim (około 5 lat po opisanym wypadku), okazało się, iż nastąpił pewien wzrost zdolności do uczenia się. Jednakże próby wyuczenia go technik mnemotechnicznych w celu dalszej poprawy jego pamięci zakończyły się całkowitym niepowodzeniem. U pacjenta H.M. zaś zdolność do uczenia się nie poprawiła się w ogóle z biegiem czasu. Zdolność do opanowania nowego materiału może również zależeć od rodzaju informacji. U wielu chorych cierpiących na zaburzenia pamięci można zaobserwować różnicę w zdolności do uczenia się materiału werbalnego i niewerbalnego. Mechanizmy pamięci Pewne ogólne cechy charakterystyczne pamięci wyłaniają się z badań nad rodzajami jej osłabienia powstałymi w wyniku zaburzeń neurologicznych. Zdarzenia przez krótki czas po wystąpieniu utrzymują się w pamięci krótkotrwałej. Zakłócenie tej pamięci zaburza zdolność do tworzenia bardziej trwałych śladów napływających informacji. Ale krótkotrwałe utrzymanie 324 w pamięci nie wystarcza do długotrwałego przechowania informacji. Człowiek może okazać się niezdolny do przyswojenia sobie nowej informacji, jeżeli nawet można sądzić, że pamięć krótkotrwała funkcjonuje u niego normalnie. Tak więc procesy związane z przechowywaniem starej informacji i zdobywaniem nowej wydają się odrębne od siebie i człowiek może zachować jedne z nich mimo braku drugich. Ponadto mechanizmy wydobywania informacji należy traktować oddzielnie od mechanizmów jej przechowywania. Wydobywanie może być zaburzone, chociaż przechowywanie pozostaje w normie, i ponadto zaburzenie procesu wydobycia może dotyczyć jedynie specyficznych rodzajów informacji. W miarę jak zaczyna zarysowywać się ogólna charakterystyka pamięci wyłania się oczywiste pytanie: z jakimi strukturami mózgu związane są te różnorodne funkcje? Czy istnieją specyficzne części mózgu odpowiedzialne za procesy gromadzenia i wydobywania informacji? Jeżeli uda nam się ustalić lokalizację tych funkcji pamięci, będziemy mogli przystąpić do ich dokładnego zbadania. POSZUKIWANIE LOKALIZACJI PAMIĘCI DŁUGOTRWAŁEJ Pierwsze informacje dotyczące lokalizacji różnych funkcji w mózgu pochodzą z bardzo ogólnych obserwacji chorych z uszkodzeniami mózgu. W wyniku tych obserwacji dość szybko ustalono, że uszkodzenia potylicznych części mózgu powodują zaburzenia widzenia, a uszkodzenie części czołowych-zaburzenia procesów emocjonalnych i motywacyjnych. Ponadto ustalono również, że uszkodzenie lewej półkuli mózgu ma wpływ na mowę, szczególnie u osobników praworęcznych. Było to podstawą do sformułowania pierwszych ogólnych stwierdzeń dotyczących lokalizacji funkcji. Wyłania się tu jednak pewna komplikacja. Zadziwiające jest to, że zarówno u ludzi, jak i u zwierząt, pomimo poważnych uszkodzeń znacznych części mózgu, pamięć pozostaje w stanie prawie niezaburzonym. Okazuje się, że utrwalone określone ślady pamięciowe są prawie niezniszczalne. Jedyna prawidłowość, jaka zdaje się wynikać z tych obserwacji, ma bardzo ogólny charakter. Im znaczniejsze są uszkodzenia mózgu, tym poważniejsze są jego skutki dla pacjenta. To ostatnie stwierdzenie, znane jako prawo działania masy (Law ofMass Action), pochodzi z pionierskich prac psychologa Lashleya (1931, 1950). Poszukiwał on engramów, śladów nerwowych określonych wspomnień. Uczył zwierzęta wykonywania różnorodnych zadań, a następnie niszczył operacyjnie różne części ich mózgu, mając nadzieję, że odkryje miejsce przechowywania pamięci o danym zadaniu. Nie udało mu się jednak znaleźć jakichkolwiek dowodów na to, że specyficzny ślad pamięciowy przechowywany jest w jakiejś ściśle określonej części mózgu. Zamiast tego odkrył on, że pamięć o wyuczonym zadaniu uległa zaburzeniu proporcjonalnie do ilości (wagi) uszkodzonej tkanki mózgowej; tak właśnie powstało prawo działania masy. Ten sam rezultat uwidacznia się w badaniu zaburzeń pamięci, 325 typowych dla chorych z uszkodzeniami mózgu, powstałymi zarówno po urazie, jak i po operacji neurochirurgicznej. W żadnym wypadku nie udało się stwierdzić, że uszkodzone zostały specyficzne ślady pamięciowe. Można utracić pamięć dotyczącą pewnego ograniczonego odcinka czasu, jak to się dzieje w wypadku amnezji, ale dobrze utrwalony ślad jakiegoś zdarzenia nie może zostać usunięty w wyniku zabiegu chirurgicznego. Nawet wówczas, kiedy chory nie może przypomnieć sobie określonych zdarzeń, nie potradi odróżnić nowych zdarzeń od starych i ma poważne trudności ze swą pamięcią; nie mamy podstaw, aby przypuszczać, że jest to coś więcej niż wynik zaburzenia pewnych funkcji wydobywania informacji, utrudniającego odtworzenie starych wspomnień. Jaki wypływa stąd ogólny wniosek? Możliwe, że pamięć nie jest zlokalizowana w ściśle określonych częściach, ale rozsiana po całym mózgu. W takim wypadku każdy specyficzny ślad pamięciowy będzie związany z obszernymi częściami mózgu, przy czym żadna z tych części oddzielnie nie jest niezbędna, ale im więcej ich jest włączonych, tym bardziej wyraziste będzie wspomnienie. Dlatego niektórzy uczeni przypuszczają, że informacja napływająca z zewnątrz odciska się na ciągłej aktywności zachodzącej w mózgu, a pamięć polega jedynie na zmianach tego kompleksowego, rozproszonego układu występującej aktywności. [Ci z Was, którzy wiedzą, w jaki sposób obraz wzrokowy jest odwzorowany w formie hologramu, natychmiast uchwycą analogię. Niestety analogia ta jest zbyt uproszczona. Trzeba wyjaśnić znacznie więcej faktów dotyczących pamięci ludzkiej niż tylko prawo działania masy. Jak dotąd modeli hologramowych nie zastosowano do wystarczającej liczby problemów pamięci ludzkiej, aby można było ocenić ich wartość.] JEDEN MÓZG CZY DWA MÓZGI? Ciało ludzkie jest symetryczne. Mamy dwie ręce, dwie nogi, dwoje oczu i dwoje uszu. Mamy również dwa mózgi albo inaczej, dwie półkule będące prawie dokładnymi swoimi kopiami. Każda półkula ma własne ośrodki odbioru informacji słuchowej, wzrokowej i dotykowej oraz ośrodki regulacji aktywności mięśniowej. Dwie półkule mózgu komunikują się między sobą za pośrednictwem masy włókien nerwowych, zwanych ciałem modzelowatym (corpus callosum) (rys. 8-12). [Dwa różne przekroje ludzkiej głowy ukazujące mózg z boku i z tyłu.] W związku z symetrią w anatomii dwóch półkul mózgowych nasuwa się natychmiast pytanie, czy obie półkule mózgowe mogą funkcjonować niezależnie jedna od drugiej. Dane anatomiczne nie wykluczają takiej możliwości. Każdy narząd zmysłu wysyła swoją informację do obu półkul mózgu. Ale czy to oznacza, że istnieją również dwa odrębne systemy pamięci? Czy każda z półkul przechowuje tę samą informację, chroniąc ją w ten sposób na wypadek uszkodzenia drugiej półkuli? A może dzielą się one pracą tak, że jedna z półkul podejmuje jedne operacje, a druga inne? Może dzieje się tak, że kiedy jedna z półkul próżnuje, wykonuje nieznaczną pracę albo też jest całkowicie bezczynna, to wtedy druga funkcjonująca połowa przejmuje wszystkie jej czynności? Odpowiedź na wszystkie te pytania brzmi tak: chociaż będzie to ostrożne, powściągliwe „tak", poprzedzone Jeśli", „ale", „być może", mimo wszystko będzie to „tak". 327 Rozszczepienie mózgu u zwierząt System wzrokowy stanowi doskonały sprawdzian funkcjonowania obu półkul mózgowych. W systemie tym wszystko, co spostrzegane jest lewą połową siatkówki, dociera do lewej półkuli mózgu, a wszystko spostrzegane prawą połową-do prawej. Dotyczy to obydwu oczu. (Pamiętajcie, że soczewka oka daje odwrócony obraz, dlatego, kiedy patrzycie prosto przed siebie, przedmioty znajdujące się na lewo odbijają się w prawej połowie siatkówki, a zatem i w prawej półkuli mózgu). Nie istnieje jednak żadna linia pionowa, która dzieliłaby pole widzenia na dwie równe części w momencie, kiedy patrzymy prosto przed siebie. W jaki więc sposób następuje koordynacja informacji docierającej do obu półkul, tak że pojawia się jedno wyraźne spostrzeżenie i ślad pamięciowy? Podstawowe pytanie, na które musimy znaleźć odpowiedź, brzmi: w jaki sposób informacja docierająca do jednej półkuli mózgu współdziała z informacją, która dociera do jego drugiej półkuli? Aby znaleźć odpowiedź, trzeba nauczyć zwierzę wykonywania zadania, przy którym tylko jedna półkula mózgowa otrzymuje informację sensoryczną. Następnie należy wykonać próby sprawdzające w warunkach, kiedy tylko druga półkula (nie wyuczona półkula) może odbierać bodziec testowy. Czy zwierzę będzie mogło właściwie wykonać zadanie? 328 Na rysunku 8-13 przedstawione zostały włókna wzrokowe, idące od oczu do mózgu, spotykające się i krzyżujące w miejscu zwanym skrzyżowaniem wzrokowym (patrz rozdział 4) [Do oczu osobnika przedstawionego na rysunku docierają sygnały z lewej i prawej strony. Punkt fiksacji znajduje się na środku. Sygnał z lewej strony dociera do prawej półkuli, która powoduje reakcje lewej ręki, natomiast sygnał z prawej strony dociera do lewej półkuli, która wywołuje reakcję ręki prawej.] Jeżeli poprowadzić cięcie przez środek skrzyżowania wzrokowego, to lewa półkula mózgu będzie otrzymywała informację tylko od oka lewego, a prawa od prawego. To pierwsza próba eksperymentu. Następnie zwierzę z przeciętym skrzyżowaniem wzrokowym uczy się wykonywać określone zadanie, mając przy tym zakryte prawe oko. Po wyuczeniu przenosi się opaskę z prawego oka na lewe i daje zwierzęciu do wykonania to samo zadanie, aby stwierdzić, czy prawa półkula jego mózgu wie to, czego nauczyła się lewa. Odpowiedź brzmi twierdząco. Zwierzę w pełni radzi sobie z zadaniem, chociaż prawa półkula jego mózgu nigdy przedtem nie odebrała bezpośrednio niezbędnej informacji. Półkule mózgowe prawa i lewa najwidoczniej są zorientowane nawzajem w tym, co robi każda z nich. Jak to się dzieje? Można przyjąć dwa wyjaśnienia. Pierwsze polega na tym, że każda z półkul przesyła uzyskaną informację do drugiej w miarę jej napływania i rejestracja śladów dubluje się w obu półkulach. Ponieważ informacja zawarta jest w obu półkulach, nie jest istotne, która z nich podlega próbom uczenia się zadania. Drugie wyjaśnienie sprowadza się do tego, że materiał dochodzący do lewej półkuli przechowywany jest wyłącznie w niej, ale w czasie prób sprawdzających z prawą półkulą ma ona po prostu swobodny dostęp do informacji zgromadzonej w lewej półkuli. System taki gwarantowałby również pozytywny rezultat opisanego eksperymentu. Kluczem do rozwiązania tego problemu jest kanał komunikacyjny między obiema półkulami mózgu. Załóżmy, że eksperyment zaczyna się dokładnie tak samo jak poprzedni, to znaczy od przecięcia skrzyżowania wzrokowego, następnie zwierzę uczy się wykonywać określone zadanie, posługując się przy tym wyłącznie lewym okiem. Tym razem tuż po opanowaniu zadania, ale przed próbami sprawdzającymi, przecinamy dodatkowo ciało modzelowate, co powoduje przerwanie linii komunikacyjnych między dwiema półkulami. Dopiero po tym zwierzę poddane zostaje próbie polegającej na zakryciu lewego oka, a odsłonięciu prawego. Teraz jego prawa półkula nie ma połączenia z lewą i nie może posłużyć się informacją, która, być może, przechowywana jest tylko w lewej półkuli. Jeżeli duplikaty śladów pamięciowych nie istnieją w prawej półkuli, zwierzę nie będzie mogło rozwiązać zadania. Jednakże zadanie mimo to zostaje rozwiązane, czasami tak samo dobrze za pomocą prawego oka, jak i lewego. Najwidoczniej obie półkule przechowują informację dotyczącą nabytego doświadczenia. [Wiele jest dyskusji na ten temat. Niektórzy badacze sądzą, że tylko proste zadania są przechowywane w obu półkulach, a zadania „złożone" pozostają w jednej (por. Myers, 1962). Pełniejsze omówienie tego tematu zawiera rozdz. 5 książki Gazzanigi The Bisected Brain (1970).] Jak kształtują się te podwójne ślady pamięciowe? Czy tworzą się one automatycznie w czasie uczenia się przez zwierzę zadania? Czy też początkowo rejestrowane są przez tę półkulę mózgu, która otrzymuje informację sensoryczną, a następnie przekazywane są przez ciało modzelowate do drugiej jego półkuli? Doświadczenie z przecięciem ciała modzelowatego nie daje odpowiedzi na to pytanie, ponieważ przeprowadza się je w jakiś czas po wyuczeniu zadania i przez ten okres ślad pamięciowy może zostać przeniesiony. 329 Potrzebna jest taka metoda, która pozwalałaby okresowo wyłączyć działanie jednej półkuli, a następnie przeprowadzić próbę sprawdzającą, kiedy będzie ona znowu normalnie funkcjonowała; oznacza to, że niezbędne jest przecięcie odwracalne. Można to uzyskać za pomocą środków chemicznych. Dwie substancje chemiczne - puromycyna i chlorek potasu - wywołują okresowe stłumienie aktywności elektrycznej w korze mózgowej. Jeżeli stłumienie obejmuje całą korę, zwierzę nie jest w stanie wyuczyć się nawet prostych zadań wymagających odróżnienia bodźców. Zastosowanie tych substancji chemicznych pozwala na okresową deaktywację jednej z półkul, bez konieczności przecinania skrzyżowania wzrokowego oraz ciała modzelowatego. Powróćmy do naszego doświadczenia: po zahamowaniu aktywności prawej półkuli za pomocą środków chemicznych następuje uczenie zwierzęcia. Kiedy skończy się działanie środków chemicznych, robi się przerwę, aby mogło nastąpić .przekazywanie informacji (jeżeli ono rzeczywiście zachodzi). Następnie przeprowadzona zostaje próba sprawdzająca w sytuacji, gdy zahamowana jest aktywność lewej półkuli. Okazuje się, że zwierzę nie może wykonać zadania - zachowuje się tak jak gdyby nigdy wcześniej nie znalazło się w podobnej sytuacji. Najwidoczniej duplikaty śladów pamięciowych tworzą się właśnie w czasie uczenia się zadania. [W celu zapoznania się z badaniami nad tłumieniem aktywności półkul mózgowych patrz Bures i Buresova, 1960. Krytyczne omówienie tego rodzaju badań (z intencją podważenia całej interpretacji dotyczącej pamięci) zawiera artykuł Deutscha (1969).] Rozszczepienie mózgu u człowieka W odróżnieniu od mózgu zwierzęcia, obie półkule mózgu ludzkiego zdają się być wyspecjalizowane pod względem rodzaju gromadzonych informacji. W lewej półkuli znajdują się zwykle informacje niezbędne w procesie przetwarzania symboli językowych. Stawia to przed nami kilka interesujących pytań: jakie funkcje pamięci może realizować niema półkula mózgu? Czy może rozpoznać cokolwiek? Czy może zapamiętywać? Rozważmy typowe zachowanie pacjenta, u którego dokonano chirurgicznej operacji rozdzielenia półkul mózgowych w celu wstrzymania objawów epileptycznych. Operacja ta jest podobna do tej, której dokonywano na zwierzętach. Przecina się ciało modzelowate, co prowadzi do przecięcia komunikacji korowej między obiema półkulami mózgowymi. Dla postronnego obserwatora człowiek, który był poddany tej operacji, zachowuje się całkiem normalnie. (Faktem jest, że niektórzy ludzie rodzą się z tym defektem i żyją długie lata bez problemu.) Tylko w trakcie dokładnego badania można zauważyć pewne szczególne cechy w jego zachowaniu. Aby móc przeprowadzić takie badania, należy spowodować, żeby informacja sensoryczna docierała tylko do jednej półkuli mózgowej. Mając wpływ na to, która z półkul odbiera informację sensoryczną i stawiając określone problemy, możemy wypróbować możliwości zapamiętywania tych informacji przez każdą z półkul mózgowych (rys. 8-14). 330 RYSUNEK 8-14 Doświadczenie I Zakryte lewe pole widzenia (lewe oko) Nożyczki prezentowane w prawej ręce lub w prawym polu widzenia Sygnał dociera do lewej półkuli mózgu Werbalna reakcja „nożyczki" Doświadczenie II Zakryte prawe pole widzenia Nożyczki prezentowane w lewej ręce lub w lewym polu widzenia Sygnał dociera do prawej półkuli mózgu Werbalna reakcja „nic” Przede wszystkim pacjent reaguje normalnie na dowolny przedmiot włożony do jego prawej ręki albo też znajdujący się w prawej połowie jego pola widzenia, to znaczy, że jeśli pokażemy mu z prawej strony albo też włożymy mu do prawej ręki nożyczki, powie: „to nożyczki". Tego właśnie należało oczekiwać, ponieważ w tym wypadku informacja sensoryczna dociera do lewej półkuli i wchodzi w normalny kontakt z ośrodkiem mowy. 331 Przedmioty pojawiające się w lewym polu widzenia lub włożone do lewej ręki wywołują całkiem inny skutek. Kiedy pytamy pacjenta, co trzyma w lewej ręce, odpowiada, że jego lewa ręka jest jakby zdrętwiała. Jeżeli obraz wzrokowy pojawi się w lewym polu widzenia, oświadczy, że widzi, jakby coś tam mignęło, ale nie może odróżnić żadnych szczegółów. Na czym polega problem? Po pierwsze, widoczne jest, że chory niczego nie może rozpoznać za pomocą prawej półkuli. Ale, jeżeli najpierw włożymy przedmiot do jego lewej ręki, a następnie włożymy go do torby, w której znajdują się również inne przedmioty, i poprosimy chorego, aby go wyjął, łatwo może lewą ręką odnaleźć właściwy przedmiot. Nawet więcej, jeżeli po włożeniu mu przedmiotu do lewej ręki w lewym polu widzenia pojawi się na moment szereg obrazków, może wskazać właściwy obrazek, ale tylko lewą ręką. Ponadto, chociaż nie potrafi opisać tego przedmiotu, może jednak za pomocą gestów określić jego funkcję. Na przykład, jeżeli pacjentowi pokażemy nóż, może wykonać ruch przecinania. Jeżeli pokażemy mu klucz, może włożyć go w wyimaginowany zamek. W końcu może narysować lewą ręką to, co widział w lewym polu widzenia. We wszystkich tych wypadkach jest on całkowicie niezdolny do słownego zapisu przedmiotu. Nawet po tym, kiedy pacjent z powodzeniem odszukał przedmiot w torbie, wskazał go obrazku albo też zademonstrował jego przeznaczenie, nie potrafi poprawnie go nazwać. Jeżeli zapytamy pacjenta, co narysował lewą ręką, nie potrafi odpowiedzieć prawidłowo. Na przykład, jeżeli zaprezentujemy mu obrazek przedstawiający „S" w jego lewym polu widzenia i „?" w prawym polu widzenia, to narysuje nam S lewą ręką, a znak zapytania prawą. Jeżeli w jego lewym polu widzenia pojawi się słowo „klucz", a w prawym „skrzynka", to powie, że nie wie, co zobaczył, niemniej jednak szukając lewą ręką może odnaleźć klucz. Jeżeli zapytamy go, co trzyma w ręku, odpowie, że jest jakaś skrzynka, coś w rodzaju „skrzynki z piwem" (Sperry, 1968). Na co wskazują te zjawiska? Sugerują, że kiedy łączność między obu półkulami mózgu zostanie przerwana, człowiek zaczyna działać jak dwie oddzielne osoby: istotnie, lewa ręka nie wie, co czyni prawa. Ponieważ tylko lewa półkula mózgowa może posługiwać się mową, człowiek nie potrafi powiedzieć ani też napisać o tym, co obserwuje prawa półkula mózgu. Ale prawa półkula mózgu ciągle zachowuje zdolność do rozpoznawania i zapamiętywania przedmiotów, ponieważ może ona szukać i odnajdywać przedmiot, który został pokazany, a następnie schowany. Ponadto jest oczywiste, że klasyfikacja informacji w prawej półkuli związana jest z dość skomplikowanym kształtowaniem się pojęć. Przypuśćmy, że pacjentowi przedstawiono w prawej połowie pola widzenia obraz budzika, a następnie polecono wybrać ten przedmiot lewą ręką ze zbioru różnych rzeczy. Jeżeli nie będzie tam budzika, a tylko zegarek ręczny, to zostanie on wybrany przez pacjenta. Funkcjonalnie zegarek ręczny jest tym samym czym jest budzik. Co więcej, chory wybiera zegarek ręczny nawet wówczas, gdy w zbiorze rzeczy znajdują się przedmioty bardziej podobne z wyglądu do budzika. Innymi słowy, chociaż prawa półkula mózgowa nie może posługiwać się normalnie mową, to może posługiwać się pojęciami. Prawa półkula mózgu, mimo że jest pozbawiona mowy, może rozwiązywać zadania intelektualne. 332 Zaskakujące jest ponadto, że chociaż prawa półkula nie włada mową, może wykonywać ustne polecenia i rozpoznawać słowo pisane. A zatem nie byłoby precyzyjne twierdzenie, że prawa półkula mózgu pracuje bez jakichkolwiek funkcji językowych. Prawa półkula mózgu jest niezdolna do produkowania mowy, ale potrafi ją rozpoznać. Lewa ręka (kontrolowana przez prawą półkulę) nie może napisać nazwy przedmiotu pojawiającego się w lewym polu widzenia (ponieważ to właśnie jest produkcja mowy). Jednak prawa półkula może rozpoznać napisaną nazwę przedmiotu pojawiającego się w lewym polu widzenia (ponieważ to właśnie jest rozpoznawanie mowy). Aby zademonstrować, że istotnie rozpoznanie miało miejsce, pacjenta proszono o naciskanie guzika w momencie pojawienia się określonego słowa albo też wskazywanie prawą ręką określonego przedmiotu spośród wielu innych schowanych w torbie. Prawa półkula mózgu ma ograniczone możliwości rozpoznawania mowy. Doskonale rozpoznaje konkretne rzeczowniki, ale nieco gorzej czasowniki lub rzeczowniki tworzone z czasowników, takie jak: „zasuwa", „spinacz" czy „upadek" (Gazzaniga, 1970, s. 119). Na przykład chory nie może wykonywać odpowiednich ruchów żadną ręką w wypadku, gdy polecenia werbalne „zapukać", „ścisnąć", „wskazać" docierają do prawej półkuli. Prosty test kontrolny wskazuje, że ta niezdolność do reakcji jest następstwem trudności związanych ze zrozumieniem mowy, a nie zaburzeń ruchowych. Pacjent świetnie posługuje się ręką przy wykonywaniu ruchów, które zostały eksponowane jego prawej półkuli za pomocą rysunku, nie zrobi tego natomiast na polecenie werbalne. Mózg wyższych organizmów, jak widać, składa się z dwu odrębnie wyposażonych centralnych systemów przetwarzania informacji, połączonych ze sobą ogromną siecią linii komunikacyjnych. Normalnie każdy z systemów odbiera tylko część informacji sensorycznej płynącej od różnych narządów zmysłów. Lewa półkula mózgu odbiera informację wzrokową z prawej połowy pola widzenia, informację dotykową z receptorów dotykowych prawej polowy ciała i podstawową masę informacji słuchowej z prawego ucha. Prawa półkula mózgu odbiera uzupełniający zestaw danych sensorycznych. Włókna przebiegające w ciele modzelowatym są zapewne wykorzystywane do przekazania brakujących części informacji w każdej półkuli, w wyniku czego każda półkula mózgu uzyskuje pełny obraz otaczającego środowiska. Normalnie w trakcie uczenia się duplikaty śladów pamięciowych tworzą się w obu półkulach nawet wówczas, gdy dopływ informacji sensorycznej ograniczony jest do jednej półkuli mózgu. Jeżeli oba te systemy przetwarzania informacji zostaną rozdzielone, mogą funkcjonować niezależnie od siebie. Obie półkule mogą zdobywać i przechowywać informację niezbędną do wykonania zadania. Fakt, że każda półkula otrzymuje jedynie część informacji o otaczającym środowisku, nie wydaje się stanowić poważnej przeszkody. Wrodzone uszkodzenie ciała modzelowatego nie powoduje poważnych zaburzeń zdolności intelektualnych człowieka. Fakt, że obie półkule mózgu po dokonaniu przecięcia ciała modzelowatego funkcjonują niezależne od siebie, utrudnia znacznie podejmowanie decyzji, jak to ilustruje fragment z książki Gazzanigi. „Przypadek I... czasami stwierdzał on, że jednocześnie opuszcza spodnie jedną ręką, a podciąga drugą. Pewnego razu chwycił lewą ręką swoją żonę i zaczął nią silnie potrząsać, 333 a prawą ręką w tym samym czasie starał się pomóc żonie w uśmierzeniu agresywności lewej ręki. Innym razem, kiedy grałem z pacjentem na dworze w podkowę (horseshoes), przypadkowo schwycił lewą ręką siekierę opartą o ścianę domu. Ponieważ było prawie pewne, że jego zachowanie jest kontrolowane przez bardziej agresywną prawą półkulę, szybko odszedłem nie chcąc stać się ofiarą próby demonstracji, którą półkulą społeczeństwo karze i wykonuje wyroki". (Gazzaniga, 1970, s. 107). Ponieważ dwa mózgi sterują tym samym organizmem, podwójne ślady pamięciowe pozwalają na skoordynowanie działania obu systemów. To wyklucza ewentualne konflikty, do jakich niechybnie musiałoby dojść w sytuacji, gdyby każda półkula mózgu uczyła się różnych rzeczy. Jednakże takie dublowanie pamięci jest luksusem, na który mogą sobie pozwolić jedynie niższe organizmy, którym nie zdarza się wytężać swych możliwości w zakresie uczenia się i zapamiętywania, gdyż otaczające je środowisko nie stawia przed nimi takich wymagań. Jeżeli chodzi o człowieka, to sytuacja nie jest taka prosta. Szczególnie skomplikowane uczenie się percepcyjne i pamięć oraz wymagania stawiane aktywności motorycznej przez system językowy człowieka najwidoczniej sprowadziły do znacznej specjalizacji funkcji pełnionych przez każdą półkulę. Jedna z półkul, zazwyczaj lewa, pełni (jak się wydaje) większość funkcji niezbędnych do wytwarzania mowy. Tylko uszkodzenie tej „dominującej" półkuli może zaburzyć zdolność człowieka do posługiwania się językiem. Dwa mózgi: niezmienność czy plastyczność? To, że człowiek posiada dwa mózgi, które mogą funkcjonować niezależnie od siebie, nie tylko stwarza problemy związane z koordynacją informacji, ale daje też pewne korzyści. Po pierwsze, nadaje to znaczną plastyczność operacjom zachodzącym w mózgu. W efekcie istnienia dwu symetrycznych półkul mózgowych, każda z nich może, w razie konieczności, przejąć całą pracę. U dzieci, które we wczesnym okresie życia uległy poważnym uszkodzeniom mózgu, zdrowa półkula przejmuje całą pracę, kompensując w ten sposób uszkodzenie. Czy jest to pełna kompensacja? Trudno odpowiedzieć na to pytanie. W tym celu trzeba by mieć możliwość sprawdzenia, jak rozwijałby się dany człowiek, gdyby jego mózg nie został uszkodzony. Pełna czy też niepełna, kompensacja ta jest zadziwiająco dobra. Mózg traci jednak plastyczność w miarę starzenia się organizmu. Im młodsze jest dziecko w momencie uszkodzenia mózgu, tym większa szansa, że zdrowa półkula przejmie funkcje uszkodzonej półkuli. Nie wiadomo, czy ta zależność od wieku jest związana z ogólnym dojrzewaniem organizmu czy po prostu z nabywaniem języka, ale można stwierdzić z pewnością, że im wyższy poziom rozwoju języka został osiągnięty, tym trudniej skłonić jedną półkulę do zastąpienia drugiej. Język to niezwykłe i złożone zachowanie, wymagające przechowywania olbrzymich ilości informacji i zdolności do operowania nimi. Człowiek jest zjawiskiem zupełnie wyjątkowym dzięki językowi, w którym porządek symboli określa ich znaczenie, a zdania można przekształcać, 335 nadając im inną formę, nie zmieniając jednak ich znaczenia. Niektóre zwierzęta mają pewną zdolność porozumiewania się, ale, jak dotąd, w żadnym przypadku nie wykryto, aby to był język choćby z grubsza przypominający w swej złożoności język ludzki. Niewątpliwie złożoność języka jest związana ze złożonością struktury mózgu (rys. 8-15). RYSUNEK 8-15. Neurony sześciu warstw kory mózgowej jako funkcja wieku. Na podstawie fotografii Conela (1939-1963), rysunków Schade i van Groeningena (1961) oraz Lenneberga (1967). A zatem, kiedy rozwój języka osiągnął już wysoki poziom - duży zasób słów oraz dobrą znajomość reguł gramatycznych - to wtedy mamy podstawy, aby przypuszczać, że strukturalizacja mózgu zachodzi w związku z językiem, w drodze czy to biologicznych, czy też chemicznych zmian albo po prostu w wyniku nagromadzenia licznych, komplikowanych informacji. Po osiągnięciu tak skomplikowanej organizacji zanika jednocześnie zdolność do przenoszenia wiedzy z uszkodzonej półkuli do zdrowej. Faktycznie, jeśli lewa półkula zostanie uszkodzona po uzyskaniu dojrzałości, jest mało prawdopodobne, aby prawa półkula mogła przejąć jej funkcje. Nie wiadomo, dlaczego lewa półkula reguluje procesy językowe. Obie półkule rozwijają się jednakowo i sądząc z pozoru brak jest podstaw do stwierdzenia, dlaczego jedna z nich miałaby być lepiej przystosowana do operowania językiem niż druga. Niemniej język związany jest z lewą półkulą, a różnorodne umiejętności niewerbalne z prawą. Większość ludzi jest jednak praworęcznych, chociaż nie wynika to z jakichś logicznych przyczyn: dlaczego 50 procent ludzi nie mogłoby być leworęcznych? Przypuszcza że istnieje jakiś związek między dominacją językową lewej półkuli a praworęcznością. I rzeczywiście, wydaje się, że ludzie leworęczni przejawiają tendencję do wykorzystania prawej półkuli w posługiwaniu się językiem. Jednak nie zawsze tak jest. Tendencja jest szczególnie silna w przypadkach, kiedy leworęczność występuje dziedzicznie. Dlatego u syna ojca leworęcznego zazwyczaj dominującą rolę będzie odgrywała prawa półkula, zwłaszcza gdy niektórzy z jego braci i sióstr też są leworęczni. WNIOSKI Kiedy zapoznajemy się z różnymi próbami lokalizacji mechanizmów mózgowych odpowiedzialnych za uczenie się i pamięć, staje się jasne, że zadanie to jest niezmiernie trudne. Natura nie ułatwiła nam sprawy; nie umieściła systemu naszej pamięci w specjalnej skrzynce w mózgu, gdzie można by ją łatwo odnaleźć, a następnie zbadać. Mózg, jak widzimy, stanowi nieprawdopodobnie skomplikowaną strukturę, w której szereg części wymienia się wzajemnie swymi funkcjami. Ta elastyczność mechanizmów uczenia się jest, być może, najbardziej dostrzegalną ich cechą. W odróżnieniu od maszyn, które budujemy jako modele mózgu, mózg ludzki może wytrzymać poważne uszkodzenia, nie czyniąc organizmu całkowicie niezdolnym. Najwidoczniej nie ma regionów krytycznych, od których uzależniony byłby cały system. Mimo że nasze rozważania nie doprowadziły do odkrycia miejsca, w którym znajduje się pamięć, dały nam jednak przekonywający obraz plastyczności nerwowych mechanizmów kodowania i przechowywania informacji. 9. Pamięć przemijająca Przed rozpoczęciem czytania tego rozdziału należy zapoznać się z częścią wstępną do rozdziału 8, zatytułowaną „Systemy pamięci", ponadto pewne pojęcia omówione w rozdziale 3 „Teorie rozpoznawania obrazów" używane są w tym rozdziale. PRZECHOWYWANIE INFORMACJI SENSORYCZNEJ TACHISTOSKOP Pojemność systemu SIS Eksperyment PAMIĘĆ KRÓTKOTRWAŁA Błędy w przypominaniu z pamięci krótkotrwałej Omyłki akustyczne Powtarzanie Zapominanie Zapominanie jako skutek interferencji Zapominanie jako rezultat stopniowego zacierania się śladów w czasie Zapominanie: wpływ czasu czy interferencja? Właściwości pamięci Proces rekonstrukcji w pamięci OD PAMIĘCI KRÓTKOTRWAŁEJ DO PAMIĘCI DŁUGOTRWAŁEJ ZJAWISKA UWAGI Wybór przekazów Równoczesne powtarzanie materiału (Shadowing) Przetwarzanie odrzuconego przekazu Pamięć bez uwagi TEORIE UWAGI Model osłabiacza (The attenuator model) Model procesu aktywnej syntezy 337 W procesie przetwarzania i interpretacji informacji napływającej z systemów sensorycznych uczestniczy kilka rodzajów pamięci przemijającej. Każdy z nich pełni inną funkcję, przechowuje inny rodzaj informacji, ma różne zakresy pojemności, i każdy działa na nieco innych zasadach. Rozważmy, jak funkcjonuje każda z tych przemijających pamięci. PRZECHOWYWANIE INFORMACJI SENSORYCZNEJ Praca nad wyodrębnieniem cech charakterystycznych sygnału sensorycznego oraz ustalenie, co ten przekaz przedstawia, wymaga czasu-więcej czasu niż trwa działanie samego sygnału. Funkcja systemu przechowywania informacji sensorycznej (sensory information storage-SIS) polega więc na zapewnieniu systemom wyodrębniania cech oraz rozpoznawania obrazów czasu niezbędnego do przetworzenia sygnałów napływających z narządów zmysłowych. Po odebraniu sygnału wzrokowego, jego obraz utrzymuje się przez kilka dziesiątych sekundy. Obraz ten jest przechowywaną wzrokową informacją sensoryczną. Pozwala to na obróbkę sygnału sensorycznego przez czas dłuższy, aniżeli czas trwania samego sygnału. Przechowywanie to jest szczególnie potrzebne w sytuacji, kiedy sygnał działa bardzo krótko, jak w filmie i telewizji, zapewnia on równocześnie ciągłość spostrzegania, mimo mrugania czy ruchów gałki ocznej. W gruncie rzeczy dla krótkotrwałych sygnałów czas trwania ich obrazów wzrokowych nie ma większego znaczenia: istotne znaczenie ma jedynie czas, w trakcie którego sygnał pozostaje w systemie SIS. System ten nie tylko przechowuje wyraźny obraz sygnałów napływających w ciągu ostatnich dziesiątych części sekundy, ale obejmuje również więcej informacji, niż da się przetworzyć. Rozbieżność między ilością informacji przechowywanej w systemie sensorycznym a tą jej ilością, która może być wykorzystana w kolejnych stadiach analizy, jest niezwykle ważna. Wynika z niej, że istnieją pewne ograniczenia pojemności pamięci w późniejszych fazach, ograniczenia, które nie dotyczą fazy sensorycznej. Pojawiają się one w czasie próby zapamiętania prezentowanego materiału. Ogromne bogactwo informacji zawartych w obrazie sensorycznym zazwyczaj nie jest ważne dla interpretacji go znaczenia. Nawet więcej, często nadmiar informacji dotyczących szczegółów utrudnia zadanie. Komputery, które próbują czytać tekst drukowany, dekodować fale głosowe mowy, a nawet czytać drukowane nuty, łatwo mylą się w sytuacji, gdy w informacji wejściowej znajduje się szereg prostych szczegółów dodatkowych, na które człowiek, wykonując to samo zadanie, nie zwróciłby najmniejszej uwagi. Najdrobniejsze ślady zanieczyszczeń albo niewyraźnie wydrukowane litery wprowadzają komputery w zakłopotanie, podczas gdy człowiek często nie dostrzega nawet poważnych błędów ortograficznych. System sensoryczny musi zachować dokładny obraz wszystkiego, co oddziałuje na narządy zmysłowe, mimo że większa część tych informacji okazuje się niepotrzebna, ponieważ system sensoryczny nie jest zdolny do ustalenia, które aspekty informacji na wejściu 338 mogą mieć istotne znaczenie. Dokonać tego mogą jedynie te systemy, które rozpoznają i interpretują sygnały. System SIS, jak się wydaje, idealnie odpowiada celom, jakie realizuje. Utrzymuje on, na przeciąg krótkiego czasu, cały materiał, pozostawiając procesom rozpoznawania obrazów dość czasu na wychwycenie i wybór tego, co istotne. TACHISTOSKOP Aparatem najczęściej używanym do badania procesów wzrokowych u człowieka jest tachistoskop. Pozwala on na eksponowanie sygnałów wzrokowych w bardzo krótkich odcinkach czasowych. Wynaleziono go w 1880 r. i, chociaż w naszych czasach aparaty tego typu mają z reguły sterowanie automatyczne (czasem nawet z użyciem komputera), zasady ich działania nie zmieniły się od około 1907 roku. Podstawową część tachistoskopu stanowi skrzynka nie przepuszczająca światła, często jest to po prostu długa zamknięta prostokątna tuba, zbudowana z jakiegokolwiek ciemnego materiału. Osoba badana patrzy w jeden jej koniec, a przedmiot, który powinna zobaczyć, znajduje się na drugim końcu (rys. 9-1). Początkowo w tubie jest ciemno i nic nie widać. Następnie błyska światło i można zobaczyć to, co umieszczone zostało na drugim jej końcu. Zazwyczaj używa się specjalnego światła, jarzeniówek, w których powstaje jonizacja w wyniku przepływu prądu między elektrodami; pozwala to odpowiednio regulować długość błysku w granicach milisekund. Często eksperymentator bada spostrzeganie wzrokowe kilku różnych przedmiotów. W tym celu tachistoskop zaopatrzony zostaje w specjalne lustra, posrebrzone tylko w połowie, tak że połowa światła padającego na zwierciadło przechodzi przez nie, a połowa zostaje odbita. Dzięki przyrządowi przedstawionemu na rysunku 9-2 osoba badana może widzieć przedmioty rozmieszczone w trzech różnych punktach. [Urządzenie różni się od prostego tachstoskopu dołączonymi dwoma dodatkowymi tubami, po jednej z prawej i lewej strony głównego tunelu. Z przodu głównego tunelu znajduje się otwór, przez który patrzy obserwator. Na końcu głównego tunelu znajduje się bodziec B. Na skrzyżowaniach z bocznymi tubami znajdują się zwierciadła srebrzone w połowie ustawione pod kątem, by odbijać bodźce C (z prawej tuby) i A (z lewej tuby)] Jeżeli włączone jest tylko światło A, widzi wyłącznie sygnał A. Podobnie światło B pozwala jej zobaczyć sygnał B, a światło C - sygnał C, tak że informacja może pojawić się w jednym, dwu lub trzech punktach jednocześnie. Konieczna jest jedynie dokładna regulacja czasu włączania każdego z trzech źródeł światła. Właśnie taki tachistoskop, zwany tachistoskopem trójpolowym (three-field tachistoscope), stosowany był w wielu eksperymentach omawianych w tym rozdziale. Wprowadzona została jedynie pewna modyfikacja. Jakość obrazu widzianego przez osobę badaną zależy od liczby luster, w których obraz się odbija i przez które przechodzi. 339 W przyrządzie przedstawionym na rysunku 9-2, ze źródła C może płynąć więcej światła (na jego drodze leży tylko jedno lustro) niż ze źródła B lub A (na ich drodze znajdują się po dwa lustra). Dlatego w nowoczesnych tachistoskopach znajdują się lustra uzupełniające oraz filtry, tak aby w miarę możliwości obraz pojawiający się w każdym polu: 1) przebywał dokładnie taką samą drogę od swego położenia do osoby badanej; 2) przechodził przez tę samą liczbę luster; 3) odbijał się od tej samej liczby luster. 340 Pojemność systemu SIS Łatwo można zademonstrować, że system SIS zawiera na początku więcej informacji niż następne kolejne stadia analizy są w stanie wykorzystać. Przypuśćmy, że na chwilę przedstawiono badanemu złożony obraz wzrokowy. Zdąży on zaledwie wyodrębnić nieznaczną ilość informacji z tego, co zawierał ten obraz, i oświadczy, że miał za mało czasu, aby „zobaczyć" wszystko. Ale, jeżeli poleci się badanemu, aby patrzył jedynie na określoną część obrazu, może na niej skoncentrować całą swą uwagę i podać dość dokładny jej opis. Świadczy to o tym, że ograniczenie naszych możliwości spostrzegania sygnałów sensorycznych pojawia się w procesie analizy. RYSUNEK 9-3 KARTA BODŹCOWA – zawiera 9 liter w trzech rzędach: C F X, P L A, N T S TO, CO WIDZI OSOBA BADANA Biała karta ze znaczkiem w środku (punkt fiksacji) Karta bodźcowa przez 50 milisekund Biała karta w zmiennym przedziale czasowym Karta z oznacznikiem (mały prostokąt wielkości litery) pokazywana przez 50 milisekund Biała karta 341 Eksperyment. Należy starannie przeanalizować ten eksperyment, aby zapoznać się z podstawową techniką, stosowaną w badaniach nad systemem przechowywania informacji sensorycznej. W jednym z podstawowych eksperymentów kartę zawierającą 9 liter umieszczonych w trzech rzędach, po trzy litery w każdym (rys. 9-3), eksponowano w tachistoskopie przez 50 milisekund. Normalnie osobie badanej udaje się przeczytać tylko 4 do 5 liter spośród 9. Jeżeli nawet zwiększy się liczbę liter na karcie albo też uczyni się zmiennym czas ekspozycji, badany stale wymienia 4 do 5 liter (rys. 9-4). Jeżeli chcemy dowiedzieć się, co badany istotnie widzi, nie możemy po prostu domagać się od niego, aby nas o tym poinformował. Możliwe, że widzi on wszystkie litery, a następnie zapomina niektóre z nich. Aby sprawdzić to przypuszczenie, możemy poprosić osobę badaną, aby dała nam sprawozdanie częściowe z prezentowanych jej liter. W tym celu, podobnie jak uprzednio, eksponujemy kartę z dziewięcioma literami, ale jedna z nich zostaje wyróżniona z pozostałych 342 za pomocą specjalnego oznacznika, i prosimy osobę badaną, aby powiedziała nam, która litera została oznakowana. Badany widzi oznacznik dopiero po ekspozycji dziewięciu liter (rys. 9-3). [Eksperymenty te zostały przeprowadzone przez Sperlinga (1959, 1960). Sperling używał jednak innego sygnału oznaczającego te litery, które osoba badana ma sobie przypomnieć, a mianowicie tonu, a nie prostokącika. Prowadziło to do nieco odmiennych wyników niż prezentowane w tym paragrafie, ale różnice te są niewielkie, a przedstawiona tu zasada pozostaje ta sama.] Jeżeli badany zawsze odpowiada prawidłowo, odtwarzając oznakowane w sposób losowy litery, oznacza to, że w rzeczywistości może zobaczyć w mgnieniu oka wszystkie dziewięć liter; skoro nie wie, która litera będzie oznakowana, a dowiaduje się tego po ekspozycji. Oznacza to, że utrzymuje w systemie SIS wszystkie dziewięć liter, aby móc wśród nich odszukać oznakowaną i podać jej nazwę. Rezultaty tego eksperymentu przedstawione zostały na rysunku 9-5. [Rysunek przedstawia trzy wykresy. Na pierwszym, na tle wykonania doskonałego, czyli prostej dla której liczba odczytywanych liter jest zawsze równa liczbie liter prezentowanych, naniesiono krzywą wykonań rzeczywistych, która pokrywa się z tą pierwszą tylko dla wartości 1, 2, 3. Od czterech prezentowanych liczb, krzywa nie przekracza wartości 4. Drugi wykres przedstawia liczbę liter, jaką powinien przypomnieć sobie badany, ekstrapolowaną na podstawie tego, jak zapamiętuje oznakowaną literę w funkcji liczby prezentowanych liter. Tu krzywa rzeczywista nieznacznie różni się od prostej wykonania doskonałego. Trzeci wykres to procent liczby przypomnień oznakowanej litery w zależności od liczby prezentowanych liter. Od 1 do 10 liter krzywa przypomnień utrzymuje się na poziomie 100 procent. Następnie opada.] Badany prawie zawsze podaje prawidłowo oznakowaną literę, a więc widzi więcej niż może przekazać w swej relacji. Wynika z tego, że na początku w systemie SIS znajdowały się wszystkie litery, ale w czasie, który badany zużył na wyodrębnienie trzech lub czterech z nich, reszta już zdążyła ulecieć z jego pamięci. Opisana technika stanowi niezwykle cenną metodę badania procesów spostrzegania. Kolejne jej zastosowanie polega na opóźnianiu czasu podawania oznacznika litery, który może pojawiać się nie zaraz po ekspozycji liter, ale po pewnym czasie. Powinno to pomóc nam w wyjaśnieniu, czym jest system SIS. Można z góry, bez eksperymentu, przewidzieć ogólne wyniki stosowania tej metody. Po pierwsze, zazwyczaj, kiedy brak jest oznacznika, badany może przypomnieć sobie tylko cztery lub pięć z prezentowanych mu liter. Po drugie, może on odtworzyć dowolną z oznakowanych liter, jeżeli oznacznik pojawia się równocześnie z literami. Jeśli natomiast pojawienie się oznacznika opóźnia się na czas dostatecznie długi, tak że obraz wzrokowy całkowicie się zatrze i osoba badana stwierdza 343 że „nie widzi" już więcej liter, to tak, jak przedstawiono na rysunku 9-4, badany zapamięta jedynie około połowy (4-5) z dziewięciu liter. Szansa, że zapamięta on jedną określoną literę z dziewięciu, tę, którą wskazuje oznacznik, wynosi więc w przybliżeniu 50 procent. Dlatego też wraz ze wzrostem opóźnienia w pojawieniu się oznacznika rezultaty będą oscylować w granicach od 100 procent do 50 procent odpowiedzi prawidłowych. Typowe wyniki takiego eksperymentu przedstawia rysunek 9-6. Zdolność do odtwarzania przypadkowo oznakowanej litery stopniowo maleje w miarę opóźnienia w pojawieniu się oznacznika, przy czym po osiągnięciu około 500 msek (0,5 sek.) w opóźnieniu oznacznika krzywa wyrównuje się. Najwidoczniej SIS zatrzymuje przez taki czas obraz sygnału, który zaciera się z upływem czasu, tak że po około 0,5 sek. mało z niego pozostaje. (Inaczej to ujmując, zanikanie obrazu w pamięci wygląda jak proces wykładniczy z czasem stałym równym w przybliżeniu 150 milisekundom.) Dziwne rzeczy dzieją się z pewnymi typami oznaczników. We wcześniejszych badaniach nad systemem przechowywania informacji sensorycznej stosowano oznacznik w kształcie koła i badany miał za zadanie podać literę, która pojawiła się wewnątrz koła. W odróżnieniu od eksperymentów, w których stosowano oznacznik w kształcie prostokącika, użycie koła zaraz po ekspozycji liter najwyraźniej „zaciera" literę będącą w jego środku (rys. 9-7). 344 Zjawisko zacierania jest niezwykle ważne i bardzo interesujące. Stanowi użyteczne narzędzie do badania czasu utrzymywania się obrazu w SIS. Kiedy jeden sygnał pojawia się po drugim, najwidoczniej występują dwa różne zjawiska. Po pierwsze, występuje zsumowanie śladu jednego sygnału z obrazem drugiego. Może to doprowadzić do obniżenia się wyrazistości albo jasności zacierającego się obrazu pierwszej figury, tym samym zmniejszając możliwości jej przetwarzania. Po drugie, proces przetwarzania pierwszego sygnału może ulec zaburzeniu, jeżeli drugi obraz pojawi się zanim w pełni zakończy się analiza pierwszego. Który z dwu procesów dominuje, zależy od rodzaju pojawiających się kolejno obrazów. Oba procesy zachodzą jednocześnie, ale czasami jeden z nich jest wyraźniejszy od drugiego. Niezależnie od tego, jak daje się wyjaśnić zjawisko zacierania, metodę tu opisaną można z powodzeniem wykorzystać, albowiem pojawienie się drugiego (maskującego) sygnału przerywa przetwarzanie pierwszego. Dzięki temu, chociaż SIS przechowuje sygnał przez jakiś czas po jego pojawieniu się, czas potrzebny do przetwarzania tego sygnału można precyzyjnie kontrolować, podając w różnych momentach sygnał maskujący. Jedna z metod pozwalająca ustalić, jak szybko następuje przetwarzanie eksponowanej litery, polega na tym, aby w ślad za ekspozycją liter stosować sygnały maskujące. Liczba liter, które badany może wymienić w czasie przetwarzania, równym odstępowi między sygnałem a bodźcem maskującym, wskazuje na szybkość, z jaką system dokonuje operacji. Czy może on przetwarzać informację figuratywną, na przykład obraz twarzy ludzkiej szybciej niż litery? O ile szybciej? Aby to stwierdzić, należy posłużyć się tą samą techniką badań. Obecnie często stosuje się sygnał maskujący po tachistoskopowej ekspozycji materiału. Bez maskowania SIS utrzymuje obraz, co uniemożliwia precyzyjne określenie czasu, jakiego potrzebuje osoba badana na przetworzenie materiału. Zastosowanie maskowawania pozwala eksperymentatorowi na dokładne ustalenie tego czasu. PAMIĘĆ KRÓTKOTRWAŁA W roku 1954 dwoje psychologów z Uniwersytetu Indiana, Lloyd Peterson i Margaret Peterson, (1959) przeprowadziło bardzo prosty eksperyment, który dostarczył jednak zaskakujących wyników. Prosili oni badanych, aby zapamiętali trzy litery i po 18 sekundach odtworzyli je z pamięci. Wydaje się, że jest to zupełnie proste zadanie. A jednak okazało się, że badani nie mogli zapamiętać tych trzech liter. Dlaczego tak się dzieje? To bardzo proste: w przerwie między ekspozycją tych trzech liter a późniejszym ich przypomnieniem badani musieli wykonać określoną pracę umysłową. Liczyli oni w szybkim tempie wstecz trójkami. „Liczenie wstecz trójkami" polega na tym, że badany rozpoczyna to zadanie od jakiejś losowo wybranej trzycyfrowej liczby, np. 487. Zadanie jego polega na głośnym podawaniu wyniku odejmowania liczby „trzy" od poprzednio uzyskanej wartości, a więc 487,484,481,478,475... Osoba badana ma dokonywać tego liczenia w tempie dość szybkim bądź po prostu mówimy jej, aby „liczyła szybko", bądź też, aby podawała kolejne wyniki w tempie narzuconym przez uderzenia metronomu. Spróbujcie sami. Zadanie jest trudniejsze niż się wydaje. 345 Ten prosty eksperyment ilustruje główną właściwość systemu pamięci krótkotrwałej. A nawet więcej, zmiana rodzaju materiału podlegającego zapamiętaniu w zadziwiająco małym stopniu wpływa na zapamiętanie, pod warunkiem, że liczba jednostek nie ulega zmianie. Spójrzcie na rysunek 9-8. Przedstawia on szybkość zapominania materiału. Krzywa oznaczona na rysunku „Trzy spółgłoski" przedstawia wynik opisanego przed chwilą eksperymentu. Na osi poziomej oznaczono czas między momentem ekspozycji tych trzech liter (były to same spółgłoski) a ich odtworzeniem przez osoby badane. (Pamiętajcie, że przez cały ten czas badani zajęci byli liczeniem wstecz trójkami). Na osi pionowej wskazano, jaki procent osób badanych przypomniało sobie materiał po upływie różnych odcinków czasu. Na przykład, jeżeli między ekspozycją trzech spółgłosek a ich odtworzeniem upłynęło zaledwie 6 sekund, tylko 40 procent badanych mogło przypomnieć sobie wszystkie trzy spółgłoski. Jak myślicie, co się stanie, jeżeli osoba badana zamiast trzech spółgłosek będzie miała do czynienia z trzema wyrazami? Czy pamięć będzie pracowała inaczej mając do czynienia z wyrazami: dom-jabłko-książka niż z trzema spółgłoskami: C-X-P? Porównajmy krzywą oznaczoną „trzy spółgłoski" i krzywą oznaczoną „trzy wyrazy". Są prawie identyczne. Jakie zatem mechanizmy są odpowiedzialne za działanie tego systemu pamięci? Pamięć ta, jak widać, ma bardzo małą pojemność i niezwykle krótki żywot. Jej pojemność jednak nie jest tak bardzo wrażliwa na wielkość przechowywanych w niej jednostek. Najwidoczniej nie jest to system SIS opisany w poprzednim paragrafie, ponieważ system ten przechowywał informacje 346 jedynie przez ułamek sekundy, tu ślad utrzymuje się około 20 sekund. Nie jest to również system pamięci długotrwałej, w którym informacja zachowuje się przez czas nieograniczony. W tej pamięci materiał nie pozostaje długo: wynika z tego, że jest to pamięć krótkotrwała. Błędy w przypominaniu z pamięci krótkotrwałej Zacznijmy od prezentacji pewnej sekwencji sygnałów wzrokowych, na przykład liter alfabetu. Aby sprawdzić zapamiętanie tych liter, poproście osobę badaną, żeby zapisała wszystkie litery, jakie uda jej się przypomnieć. Jeżeli badany popełnia błąd starając się przypomnieć sobie literę F, jest bardzo prawdopodobne, że zamiast niej poda X, a nie E. Chociaż F i E są do siebie bardziej podobne, to litery F i X są sobie bliższe fonetycznie. [Wymowa ang. x i f równa się eks i ef. (Przyp. red. pol.).] Podobnie jak C, które przypominane jest częściej jako T aniżeli jako O. Kiedy osoba badana popełnia błąd, jest bardziej prawdopodobne, że wyrazi się on w napisaniu litery o brzmieniu podobnym do tej, którą stara się sobie przypomnieć, a nie do tej, która podobna jest do niej wizualnie. W rozdziale 3 mówiącym o systemie rozpoznawania obrazów przytaczaliśmy przykłady błędów przeciwnego rodzaju - tam badani mylili C i O, ale nigdy C i T. Różnica ta wynika stąd, że pamięć krótkotrwała stanowi późniejszy etap w całym systemie przetwarzania informacji. Kiedy sygnał wzrokowy znajduje się na pierwszym etapie rozpoznawania obrazów, mogą pojawiać się wówczas błędy wzrokowe. Błędy, które tu omawiamy, wskazują, że w procesie kodowania informacji wzrokowej w pamięci krótkotrwałej informacja ta przybiera formę akustyczną. Jednak w opisanym tu eksperymencie nie proszono osoby badanej, aby ustnie podała zapamiętany materiał - badany widział litery w momencie ich eksponowania i proszono go następnie, aby je napisał. Omyłki akustyczne. Wyniki te zapoczątkowały wiele eksperymentów oraz interpretacji teoretycznych. Początkowo obserwacje tego typu wydawały się oczywiste i zrozumiałe. Wielu ludzi słyszy samych siebie tak jakby wypowiadali to, co czytają. Jeżeli wypowiadamy sami słowa i zdania, to czyż nie jest naturalne, że powinniśmy zapamiętywać właśnie słowa, a nie to, co widzimy? Ale czym jest w istocie to „wypowiadanie"? Chociaż słyszycie siebie, to w rzeczywistości słyszycie własną cichą mowę wewnętrzną. Czy mowa wewnętrzna jest absolutnie niezbędna dla procesów werbalnych? Jeżeli tak jest rzeczywiście, to co powiedzieć o ludziach głuchych od urodzenia? Radzą sobie z czytaniem, wyraźnie nie troszcząc się o to, żeby przekształcać słowa widziane w jednostki słyszalne. A oto kolejne pytanie: Czy rzeczywiście wspomniane błędy wynikają z brzmienia wymawianych wyrazów, czy też, być może, mają one charakter artykulacyjny. 347 Do tej pory sądziliśmy, że słowa przedstawione w postaci wizualnej są kodowane poprzez kojarzenie obrazu liter w trakcie wymawiania z dźwiękami. Prowadziłoby to do pomyłek akustycznych. Ale jest również możliwe, że słowa zamieniają się nie w dźwięki, lecz raczej w sekwencyjne ruchy mięśni, konieczne do ich wymówienia. W tym wypadku mogą pomylić się dźwięki, które wymawia się podobnie, czyli pojawią się błędy artykulacyjne. Istnieje kilka teorii rozpoznawania mowy przez człowieka, które opierają się na jednym lub drugim z wymienionych mechanizmów. Cenne byłoby wyraźne rozdzielenie ich obu, ale-jak na razie-nikt nie wie, jak to zrobić. Trudność polega na tym, że dowolna para brzmiących podobnie dźwięków mowy powinna powstawać również w podobny sposób. Z małymi wyjątkami błędy wynikające z pomylenia podobnych dźwięków zbiegają się z błędami związanymi ze zbliżoną artykulacją. Na domiar złego pojawia się dodatkowe pytanie: Po co w ogóle potrzebne jest kodowanie akustyczne? (W dalszej części tej książki termin „kodowanie akustyczne" stosowany będzie do oznaczenia tego, że obraz wzrokowy w trakcie czytania zmienia się w coś związanego z brzmieniem lub wytwarzaniem słów; nie oznacza to jednak, że dajemy pierwszeństwo teorii akustycznej przed artykulacyjną.) Dlaczego ludzie po prostu nie mogą przeczytać fragmentu wydrukowanego tekstu bez przekształcania wyrazów w ich obrazy akustyczne? To właśnie obiecują nam na kursach szybkiego czytania. A jak odbywa się zapamiętywanie obrazów wzrokowych? Jasne, że nie przekształcamy obrazu wzrokowego pokoju, w którym się znajdujemy, w sekwencję słowną opisującą ten obraz. Jest oczywiste, że nie ma potrzeby zamieniać na słowa tego wszystkiego, co widzimy. Ale w samym założeniu, że materiał wchodzący do danego systemu przekształcany jest w jakąś jednolitą formę, kryje się zdrowy rozsądek. Trzeba uznać konieczność jednolitości materiału wejściowego. Bezwzględnie byłoby nonsensem przechowywać najdrobniejsze detale każdego oddzielnego sygnału. Nie jest ważne, czy zdanie wypowiedziane zostało wolno czy też szybko, jak trzymamy tekst drukowany, czy prosto przed sobą czy też pod pewnym kątem. Są to trywialne zmienne fizyczne: zapamiętaniu podlega sens słów, nie ich wygląd zewnętrzny. Podobnie zresztą sens zdania nie ulegnie zmianie, bez względu na to, czy zostało ono wypowiedziane czy też odczytane, po co zatem zachowywać w pamięci te różnice? Czyż nie byłoby sensowne, żeby te same mechanizmy, które eliminują tak nieistotne zmienne, jak kąt, pod jakim widziane są litery, eliminowały również i inne aspekty? Jak wykazała analiza przedstawiona w rozdziale 3, problem określenia znaczenia sygnałów sensorycznych jest bardzo skomplikowany. Jasne jest jednak, że procesy myślowe powinny oddziaływać na kodowanie wewnętrzne - kodowanie oddające sens materiału, a nie jego postać fizyczną. Aby dotrzeć do informacji przechowywanej w pamięci długotrwałej w sposób jak najbardziej efektywny, korzystne będzie przekształcenie wszelkiej informacji w tę samą wspólną formę. 348 Powtarzanie Znaczenie mowy wewnętrznej ujawnia się też w innych sytuacjach. Załóżmy, że mamy zapamiętać listę nazwisk lub numer telefonu. Zazwyczaj, bez świadomego powtarzania, część informacji, którą chcemy utrzymać przez czas dłuższy niż kilka sekund, zostanie stracona. To powtarzanie materiału podlegającego zapamiętaniu, w myśli „dla siebie", pełni dwie podstawowe funkcje: po pierwsze, pozwala utrzymać materiał przez czas nieokreślony w pamięci krótkotrwałej; po drugie, wyraźnie sprzyja przejściu materiału z pamięci krótkotrwałej do pamięci długotrwałej w celu dłuższego przechowania (rys. 9-9). Utrzymanie materiału w pamięci krótkotrwałej w wyniku powtarzania możliwe jest tylko w takim wypadku, gdy ilość materiału jest odpowiednio mała. Chociaż powtarzanie może dopomóc w utrzymaniu materiału, to nie ma wpływu na zwiększenie pojemności systemu pamięci. Proces powtarzania jak gdyby podtrzymuje słaby, zacierający się ślad sygnału i odświeża go, wprowadzając go w ten sposób ponownie do pamięci krótkotrwałej. Tak przedstawione zostało powtarzanie na rysunku 9-9: przybiera ono kształt pętli wychodzącej z pamięci krótkotrwałej i ponownie do niej wchodzącej. Jeżeli zachodzi potrzeba powtórzenia większej partii materiału, to powtórzenie wszystkiego nie zmieści się w czasie. Ostatnia część zatrze się, zanim nadejdzie jej kolej w procesie powtarzania. Jak szybko można powtarzać? Mowa wewnętrzna charakteryzuje się prawie taką szybkością jak mowa zewnętrzna. Aby określić szybkość przebiegu mowy wewnętrznej, weźcie ołówek i liczcie w myśli (oczywiście bezgłośnie) jak możecie najszybciej od jednego do dziesięciu. Jeżeli dojdziecie do dziesięciu, zaczynajcie liczyć od nowa, równocześnie stawiając po każdej dziesiątce znaczek na papierze. Powtarzajcie to przez równe 10 sekund, a następnie policzcie znaczki. Ile ich macie? Jeżeli doszliście łącznie do 82 cyfr, to oznacza, że powtarzacie 8,2 jednostki na sekundę. Możecie sprawdzić to na innym materiale, na przykład na literach alfabetu. Pouczająca może być próba wzrokowego powtarzania. Prześledźcie wzrokiem alfabet tak szybko jak tylko potraficie, wyobrażając sobie w myśli każdą kolejną literę alfabetu. Zwróćcie uwagę, że powtarzanie wzrokowe jest powolniejsze od akustycznego. Ażeby sprawdzić siebie, czy przypadkiem nie oszukujecie w tym wyobrażaniu sobie liter, mówcie głośno „tak", jeśli dana litera alfabetu zawiera linie poziomą, i „nie", jeśli jej nie zawiera. Tak więc pięć pierwszych liter alfabetu daje następujące odpowiedzi: „Tak", „Tak", „Nie", „Nie", „Tak". 349 Zapominanie W jaki sposób materiał znika z pamięci krótkotrwałej? Możliwe są tu dwie drogi: zapominanie może być skutkiem interferencji innego materiału albo też po prostu skutkiem upływu czasu. Rozpatrzmy obie wymienione możliwości. Zapominanie jako skutek interferencji. Rozpatrując ten proces, musimy przyjąć, że pamięć krótkotrwała może pomieścić ograniczoną liczbę jednostek. Można to sobie różnie wyobrazić. Na przykład, można rozpatrywać pamięć krótkotrwałą po prostu jako szereg pojemników umieszczonych gdzieś w mózgu. Dowolny prezentowany materiał zostaje poddany typowemu przetworzeniu w systemie sensorycznym i podlega interpretacji na kolejnych poziomach mechanizmu rozpoznawania obrazów. Następnie ten rozpoznany obraz odebranego materiału zostaje wprowadzony do jednego z pustych pojemników pamięci krótkotrwałej. Jeżeli liczba pojemników jest ograniczona, powiedzmy do siedmiu, to po wprowadzeniu ósmej jednostki, jedna z poprzednich siedmiu powinna zaniknąć. To wyjściowe przyjęcie ograniczeń pojemności pamięci krótkotrwałej zakłada, że zapominanie wywołane jest interferencją ze strony nowo prezentowanych jednostek, ponieważ każdorazowe pojawienie się nowej jednostki prowadzi do utraty jednej starej. (Oczywiście, ma to miejsce jedynie wówczas, gdy pamięć krótkotrwała jest zapełniona). Model pamięci krótkotrwałej przedstawiony jako automat z pojemnikami jest zbyt uproszczony, na przykład wynika z niego, że zawsze będzie utrzymywał właśnie siedem jednostek ani więcej, ani mniej, i że dana jednostka albo jest dokładnie zapamiętana, albo też całkowicie zapomniana. Łatwo jednak możemy tak zmodyfikować strukturę tego modelu, aby uwzględnić te obiekcje. Przede wszystkim należy założyć, że pamięć nie może funkcjonować na zasadzie „wszystko albo nic", może bowiem istnieć pamięć częściowa. Wyobraźcie sobie taką sytuację, w której staramy się usłyszeć jakiś cichy głos wśród innych głosów - im jest on głośniejszy, tym łatwiej go zrozumieć, im cichszy - tym trudniej; na koniec głos może być tak słaby, że nie możemy nawet stwierdzić, czy w ogóle go słyszymy czy też nie. Jeżeli ten głos to sygnał, a głosy, na których tle dźwięczy, to szumy, to w takim wypadku zdolność zrozumienia głosu zdeterminowana jest stosunkiem poziomu sygnału do poziomu szumów. Przykład ten można odnieść również do pamięci. Przedstawienie danej jednostki w pamięci to jej ślad pamięciowy. Jest to ten sygnał, który próbujemy sobie przypomnieć na tle innych śladów utrwalonych w pamięci, to znaczy szumów. Im wyrazistszy ślad pamięciowy, tym łatwiej go rozszyfrować; wraz z upływem czasu ślad stopniowo zaciera się, aż w końcu jest już tak słaby, że nie sposób go odszyfrować. Możemy przeprowadzić analogię między odszyfrowaniem słabego sygnału z szumów a przypominaniem materiału zacierającego się w pamięci. Nowo wprowadzone jednostki charakteryzują się wyrazistością (siłą), te zaś, które wprowadzone zostały wcześniej, są odpowiednio słabsze. Dokładnie tak, jak nieuniknione są błędy w trakcie interpretacji głosu, przy niskim stosunku sygnału do szumów będą pojawiać się błędy w trakcie przypominania sobie materiału, 351 którego ślad jest już słaby. A w wypadku przypominania materiału przechowywanego w pamięci krótkotrwałej, błędy będą miały głównie charakter akustycznych podobieństw między słowami przechowywanymi w pamięci. W jaki sposób słabną ślady pamięciowe? Zgodnie z tą teorią trwałość pamięci zależy od liczby wprowadzonych do niej jednostek. Wyobraźmy sobie, że w momencie początkowym, kiedy jakaś jednostka jest wprowadzona do pamięci, tworzy się jej ślad o sile, powiedzmy, A. Pojawienie się każdej nowej jednostki powoduje obniżenie siły śladów wszystkich jednostek poprzednich o pewną stałą wartość procentową w stosunku do ich uprzedniej wartości. Jeżeli tę część siły śladu pamięciowego wyrazimy w postaci współczynnika zapominania f (f oczywiście, przedstawia pewną wartość w przedziale od 0 do 1), to możemy prześledzić los określonej jednostki (nazwijmy ją jednostką krytyczną), w miarę jak pojawia się nowy materiał (rys. 9-10). [Eksperyment przedstawiony na rys. 9-10 przedstawia proces zapamiętywania ciągu słów powtarzanych cyklicznie, przy czym po kolejnym powtórzeniu zapamiętanych słów (obrazów) dodawany jest kolejny element do zapamiętania. Pierwszy element: jabłko; dodajemy siekiera, zapamiętujemy jabłko, siekiera dodajemy pies, zapamiętujemy jabłko, siekiera, pies dodajemy królowa, zapamiętujemy jabłko, siekiera, pies, królowa dodajemy słońce, zapamiętujemy jabłko, siekiera, pies, królowa, słońce dodajemy mężczyzna, zapamiętujemy jabłko, siekiera, pies, królowa, słońce, mężczyzna dodajemy opona, zapamiętujemy jabłko, siekiera, pies, królowa, słońce, mężczyzna, opona W miarę przybywania kolejnych wyrazów pojawiają się błędy w zapamiętywaniu] Kiedy jednostka pojawia się po raz pierwszy, siła jej śladu równa jest A. Kiedy pojawia się jednostka dodatkowa, siła śladu jednostki krytycznej obniża się do A razy f Kiedy pojawia się jeszcze druga dodatkowa jednostka, siła śladu jednostki krytycznej obniża się do (A razy f) razy f, czyli A razy f do kwadratu. W rzeczywistości, jeśli pewna liczba jednostek interferujących (i) pojawi się po jednostce krytycznej, siła jednostki krytycznej będzie równa A razy f do potęgi i - siła śladu pamięciowego maleje w postępie geometrycznym, w zależności od liczby pojawiających się jednostek. Zapominanie jako rezultat stopniowego zacierania się śladów w czasie. Drugą hipotetyczną przyczyną ograniczenia pojemności pamięci krótkotrwałej jest proces zależny od czasu: im dłużej jednostka pozostaje w pamięci, tym staje się słabsza, aż w końcu zupełnie zanika. W tym wypadku sam czas odgrywa rolę decydującą w zniknięciu materiału z pamięci, podobnie do tego, co zachodzi w trakcie wyładowywania się kondensatora albo w procesie rozpadu substancji radioaktywnej. Poza tym jednak przypomina to bardzo opisaną wyżej teorię interferencji. Aby zrozumieć, jaką rolę odgrywa czas w zacieraniu śladów pamięciowych, będziemy musieli przyjąć założenie, że każda mijająca chwila zmniejsza siłę śladu uprzednio przyswojonych jednostek; mówiąc inaczej, zgodnie z teorią stopniowego zacierania śladów, każda chwila działa w istocie tak samo jak działa pojawienie się kolejnej nowej jednostki w teorii interferencji. Wystarczy zatem wstawić w miejsce i (liczba jednostek interferujących) t (ilość czasu). Jeżeli od momentu pojawienia się jednostki krytycznej upłynęło t sekund, to siła jej śladu, początkowo równa A, będzie teraz wyrażała się wielkością równą A razy f do potęgi t. [Czytelnicy, którzy wolą mieć to wyrażenie w postaci wykładniczej przy użyciu e, mogą przekształcać je na równoważne wyrażenie: A razy f równa się A razy e do potęgi (minus k razy t), gdzie k równa się minus logarytm naturalny f.] 352 Zapominanie: upływ czasu czy interferencja? Aby przeprowadzić rozstrzygający test dotyczący obu tych konkurencyjnych teorii, należy przede wszystkim przedstawić osobie badanej materiał, a następnie stworzyć takie warunki, żeby nie robiła niczego do momentu sprawdzenia zapamiętanego materiału, Zgodnie z teorią zacierania się śladów, wraz z upływem czasu materiał zostanie zapomniany. Teoria interferencji takiej utraty nie przewiduje. Trudność tego eksperymentu polega na stworzeniu takich warunków, w których badany „nie robiłby nic". Jeżeli nie ma on istotnie nic do roboty, to powtarza wcześniej przedstawiony materiał. Pełne zachowanie materiału w pamięci w tego typu eksperymencie może być zarówno wynikiem powtarzania, jak i braku interferencji, i rezultaty eksperymentu niczego nie udowodnią. Jeśli utrudnimy powtarzanie dając osobie badanej jakieś inne zadanie, to nowe zadanie może wywołać interferencję i słabe przechowanie materiału w pamięci; też nam to niczego nie powie, ponieważ utratę materiału z pamięci można wyjaśnić zarówno zacieraniem śladów wraz z upływem czasu, jak i wpływem interferencji. Jeden ze sposobów przeprowadzenia takiego eksperymentu polega na postawieniu osobie badanej tak trudnego zadania, że w czasie jego wykonywania nie będzie ona mogła powtarzać przedstawionego uprzednio materiału, a równocześnie tak różnego od poprzedniego, że nie wywoła interferencji. Jednym z takich zadań może być wykrywanie słabego sygnału eksponowanego na tle szumów. Tak więc jeśli początkowo eksponujemy osobie badanej szereg liter w celu ich zapamiętania, a następnie otrzymuje ona trudne zadanie wykrywania sygnału przez 30 sek., po czym sprawdzamy zapamiętanie liter, to powstaje możliwość uniknięcia zarówno powtarzania liter, jak i interferencji (Reitman, 1971). Rezultaty tego rodzaju eksperymentów wskazują na konieczność znalezienia jakiegoś kompromisu między dwoma teoretycznymi wyjaśnieniami. W trzydzieści sekund po podaniu materiału do zapamiętania badani odtwarzają go prawie bezbłędnie, brak jakichkolwiek oznak zacierania śladu pamięciowego wraz z upływem czasu. Wydaje się więc, że jest to niewątpliwie wynik potwierdzający prawdziwość teorii interferencji. Ale to jeszcze nie wyszystko. Po upływie 30 sekund pamięć staje się bardzo wrażliwa, tak że nawet niewielka interferencja powoduje jej zniszczenie. Widocznie po upływie 30 sekund następuje jakaś zmiana w pamięci-zmiana, która nie obejmuje zdolności do przypomnienia sobie wprowadzonych uprzednio jednostek, a dotyczy zmiany podatności tych jednostek na interferencję. Jedno z wyjaśnień wiąże to zjawisko z istotnym obniżeniem się siły śladu pamięciowego, który mimo wszystko wyodrębnia się nadal z otaczającego go tła szumów. Wystarczy jednak nawet drobna interferencja, aby doprowadzić bądź do obniżenia siły śladu poniżej poziomu szumów, bądź też do podniesienia się poziomu szumów do tego stopnia, że przesłonią one ślad (Atkinson i Shiffrin, 1971). Jak to często bywa, kiedy do wyjaśnienia określonego zjawiska proponowane są dwie teorie, prawda, być może, leży gdzieś pośrodku. Zapewne zapominanie w procesie pamięci krótkotrwałej jest skutkiem zacierania się śladu w wyniku upływu czasu, jak i interferencji wynikającej z pojawienia się nowego materiału. 353 Właściwości pamięci Wróćmy ponownie do pytania dotyczącego podstawowej jednostki przechowywania. Jaka jest natura śladów w pamięci krótkotrwałej? Jeden z prezentowanych uprzednio faktów dostarcza nam bardzo ważnej informacji. Okazuje się, że w pamięci krótkotrwałej mogą wystąpić błędy akustyczne. Przeanalizujmy wyraz dom. Celem naszym będzie ustalenie, jak wyraz ten jest reprezentowany w pamięci krótkotrwałej? Przyjmijmy, że w pamięci przechowywane są specyficzne cechy, a nie wyrazy. Na przykład, załóżmy na moment, że każdy dźwięk jest pewną cechą. Oczywiście będzie to poważne uproszczenie, ale wystarczająco ilustrujące proponowane pojęcia. Załóżmy, że należy przechować w pamięci jednostkę „dom". Nie utrwala się ona jednak jako całościowa jednostka. Pojedyncza jednostka pamięci przedstawia się nam jako zbiór trzech cech podstawowych: dźwięków d, o, m. A zatem każda z cech wyrazu dom może zostać zapomniana, niezależnie od pozostałych. Kiedy badany próbuje przypomnieć sobie ten wyraz, analizuje jego trzy cechy i stara się odtworzyć wyraz, który one reprezentują. • Jeżeli zapamiętał wszystkie trzy dźwięki d, o i m, to przypomni sobie wyraz dom. • Jeżeli zapamiętał tylko o i m, to możliwe, że przypomni sobie łom, tom, pom, a także dom. • Jeżeli zapamiętał jedynie d i m, to możliwe, że przypomni sobie dym albo dom. • Jeżeli zapamiętał tylko d i o, to możliwe, że przypomni sobie dok, dog albo dom. Jeżeli jedna cecha zostanie zgubiona, to liczba wyrazów, jakie mogą być odtworzone na podstawie pozostałych cech (plus wiedza o tym, że cały wyraz składał się z trzech elementów), jest ograniczona. Akustycznie wszystkie one przypominają oryginał. Zwróćcie uwagę, że prawidłowy wyraz względnie często może zostać odtworzony w wyniku pomyślnej rekonstrukcji z tego, co pozostało. Jeżeli zgubione są dwie cechy, tak że w pamięci pozostał jeden tylko dźwięk (d, o lub m), to z tej reszty informacji można odtworzyć znacznie więcej jednostek, a szanse na przypadkowe trafienie są niewielkie. Jeżeli zaś zatarły się wszystkie trzy cechy, nic już nie kieruje procesem rekonstrukcji. Proces rekonstrukcji w pamięci. Przeanalizujmy teraz właściwości rekonstrukcyjne pamięci krótkotrwałej. Widzieliśmy, jak pojawiają się błędy akustyczne w trakcie rekonstrukcji na podstawie częściowej informacji. Fakt ten potwierdza w pewnym stopniu przypuszczenie, że w pamięci gromadzone są oddzielne cechy. W takim wypadku jest jasne, że im dłuższa jest nazwa prezentowanej jednostki, tym mniejsza jest liczba jednostek, które mogą być przechowywane w pamięci. Zobaczmy, w jaki sposób charakter samych jednostek wyznacza to, co z nich zostanie zapamiętane. Załóżmy, że trzeba zapamiętać następującą listę liter: 354 L B X K F M System pamięci zatrzymuje ich cechy akustyczne, a mianowicie: e,l b,e i,ks k,a e,f e,m Wiemy, że pojemność pamięci krótkotrwałej jest ograniczona. W danym wypadku załóżmy, że pamięć krótkotrwała może pomieścić jedynie sześć cech. Ile nazw liter można zapamiętać? Zależy to od tego, które sześć cech zostało zachowanych. Jeżeli rozdzielone zostały w następujący sposób: dla kolejnych liter po jednej z cech akustycznych np.: -,l b,- -,ks k,- -,f -,m to prawdopodobnie wszystkie sześć liter może zostać przypomnianych prawidłowo po prostu w drodze rekonstrukcji elementów spółgłoskowych w nazwach liter. W końcu jakaż inna litera poza X kończy się na „ks"? Załóżmy, że ułożyło się w pamięci sześć cech, po jednej dla każdej litery w sposób następujący: e.- -,e i,- -,a e,- e,- Nawet w takim wypadku proces rekonstrukcji może przynieść zadowalające rezultaty. Zwróćcie uwagę na to, że w trzech wypadkach jednostki pamięci to „e-". Jak dużo liter (spółgłosek) zaczyna się na „e"? F, L, M, N, R i S. 355 Wszystkiego sześć liter, a proces rekonstrukcji powinien doprowadzić do wyodrębnienia trzech z nich. W ten sposób zupełnie przypadkowo można poprawnie przypomnieć sobie pewną liczbę liter. Podobnie, nawet wówczas, kiedy przypominanie wynika z domyślania się, może okazać się trafne. Średnio z dowolnego ciągu sześciu cech można prawidłowo przypomnieć sobie nazwy 3-4 liter. Istotna wartość tej demonstracji polega na tym, że pozwala ona nie tylko na określenie liczby cech utrzymujących się w pamięci krótkotrwałej, ale wskazuje również na inne ważne jej aspekty. Działa w niej proces rekonstrukcji zestawiający z dostępnej informacji najbardziej zgodną z oryginałem reprezentację tego, co było odebrane. Przy pewnej zręczności i odrobinie szczęścia jest bardzo prawdopodobne, że uda się nam przypomnieć wszystkie sześć liter, mając w pamięci jedynie sześć cech. Jeżeli nie istniałby proces rekonstrukcji prawdopodobnych liter opartej na posiadanej informacji, to do wykonania tego zadania niezbędnych byłoby dwanaście cech. Jednakże proces rekonstrukcji nie zawsze przebiega tak pomyślnie. Możliwe jest stworzenie takiej sekwencji wyrazów, które ten proces skomplikują. Rozważmy możliwość zapamiętania takiej oto sekwencji liter. DO PO NO CO BO TO Są tu następujące cechy: d,o p,o n,o c,o b,o t,o Załóżmy, jak to czyniliśmy uprzednio, że zapamiętanych zostaje tylko sześć cech. Jeśli się poszczęści, to wszystkie sześć jednostek będzie można zrekonstruować: d,- p,- n,- c,- b,- t,- Dźwięki „o" absolutnie nie przyczyniają się do zapamiętania tej listy, tak więc w wypadku zagubienia cech „o" nie wystąpią błędy w przypomnieniu. Ale jeżeli właśnie one pozostały, co jest równie możliwe, w procesie rekonstrukcji pojawią się znaczne trudności: -,o -,o -,o -,o -,o -,o 356 Spróbujcie na podstawie tych sześciu cech określić, jakie były jednostki początkowe? Nie uda się tego zrobić. Faktycznie, z tego ostatniego zapisu można zapamiętać mniej jednostek niż z poprzedniego. Z rejestru liter L, B, X, K, F i M możemy zazwyczaj przypomnieć sobie od trzech do sześciu liter, w zależności od tego, jakie cechy zostały zachowane. Średnio wynosi to cztery i pół litery. Ale gdy pojawią się jednostki DO, PO, NO, CO, BO, TO, to można przypomnieć sobie od zera do sześciu jednostek, w zależności od zachowanych cech. Średnio przypomina się w przybliżeniu trzy. Ponadto, w pierwszym wypadku zapamiętamy również porządek liter, w drugim oczywiście nie wchodzi to w rachubę. Analiza ta zmusza do głębokiego zastanowienia. Liczba cech w pamięci nie określa bezpośrednio liczby jednostek, które mogą być przypomniane. Aby móc to określić, trzeba wiedzieć co nieco o procesie rekonstrukcji. Jeden rodzaj materiału łatwiej da się zrekonstruować z cech, które pozostały w pamięci, niż inny. Mówiąc ogólnie można przypomnieć sobie więcej jednostek różniących się akustycznie, niż jednostek akustycznie podobnych. Zapamiętanie bardzo długich słów, na przykład nazw stanów, nie stanowi specjalnego problemu dla tego systemu. Załóżmy, że polecono zapamiętać następującą listę: CONNECTICUT MASSACHUSETTS PENNSYLVANIA CALIFORNIA ALABAMA MISSISSIPPI Początkowo może się wydawać, że zapamiętanie długich nazw z tak dużą liczbą znaków będzie trudniejsze. Wcale nie musi tak być. Chociaż, żeby zakodować CONNECTICUT - k-uh-n-e-t-i-k-uh-t, rzeczywiście potrzeba dużo cech, to jednak do rekonstrukcji tej jednostki potrzebne będą tylko niektóre spośród nich. Okazuje się, że nawet wówczas, gdy w pamięci pozostały tylko cechy „n", „e", „t", to dźwięki te plus wiedza o tym, że wyraz jest nazwą stanu, w zupełności wystarczają do rekonstrukcji słowa CONNECTICUT. Drugie słowa często przypominają się lepiej niż krótkie, po prostu dlatego, że jest ich mniej: jeśli przypomni się chociaż część słowa, jest duża szansa na to, że domyślimy się reszty. 357 OD PAMIĘCI KRÓTKOTRWAŁEJ DO PAMIĘCI DŁUGOTRWAŁEJ Przypuśćmy, że w trakcie spotkania towarzyskiego podano Wam numer telefonu lub też przedstawiono któregoś z uczestników tego spotkania. Przez kilka sekund znacie nazwisko czy też numer telefonu, a później ginie po nich ślad. Materiał układa się doskonale w pamięci krótkotrwałej, ale nigdy nie osiąga pamięci długotrwałej. Różnicę między wyrazistością materiału znajdującego się jeszcze w pamięci krótkotrwałej a szczupłością i ubóstwem pamięci w odniesieniu do pozostałego materiału można wykazać z łatwością. Tabela 9-1 Uwaga: Listy wyrazów z tabeli 9-1 stanowią przystosowane do właściwości języka polskiego (długość wyrazów) tłumaczenie list oryginalnych (Przyp. red. pol.). Tabela zawierająca 20 wierszy numerowanych od 1 do 20 oraz 6 kolumn nazwanych literami do A do F, została zamieniona na tekst. Kolejne wyrazy w wierszach należą do kolumn: A; B; C; D; E; F 1; STOS; CZAS; KRUK; IDEA; WĘZEŁ; KRÓTKI 2; KLAMKA; PCHAĆ; NUDA; STADO; WIĘC; ŻART 3; ZIMNY; WIĄZAĆ; OPAŚĆ; KLUCZ; BAWIĆ; ROZWÓJ 4; SPODNIE; DOM; TALERZ; ONA; GRUCHAĆ; STOPIEŃ 5; UKŁUĆ; MUFKA; ZGRZYT; PIEŃ; GLON; RZADKI 6; KŁODA; SZKIC; DROGI; BODZIEC; PRZESYT; PRÓBA 7; TŁOK; MOWA; ŚMIGŁO; KARTA; TRWAĆ; TŁUM 8; INNY; DAL; SZARPAĆ; KĄPAĆ; PANNA; CZAPKA 9; PŁACA; WRZEĆ; TYKA; UCZYĆ; TALERZ; SZYBKO 10; SZCZĘKA; DWÓR; ZIELE; ŁÓŻKO; PLOTKA; POKAZ 11; RYSA; RYGIEL; ŚMIECH; OPAR; ŚCIANA; TREL 12; PSTRĄG; RĘKA; ATAK; SKOK; DAĆ; BAWIĆ 13; PLAMA; BRUD; PIEC; TRON; CZYSTY; BUŁKA 14; SMRÓD; SKRZEP; WIR; GRYŹĆ; DRZEWO; MĄDRY 15; TAŚMA; POZA; BRZEG; SIEĆ; RÓJ; BLOND 16; MROK; WITAĆ; UDZIAŁ; ŁABĘDŹ; WIĄZ; MÓWIĆ 17; LISTA; ZASTÓJ; ŚNIEG; CENA; JĘK; SZKAPA 18; PRZEMYT; TŁOK; FAŁDA; SUNĄĆ; SKLEP; GNIEW 19; KACZKA; KAMIEŃ; WĄŻ; PUSTY; PIÓRO; KSIĘŻYC 20; DUŻY; KOŚĆ; ZŁOŚĆ; PYŁ; SKAŁA; SANKI 358 Przypuśćmy, że poproszono Was o wyuczenie się listy nie powiązanych ze sobą wyrazów. Każdy z tych wyrazów prezentowany jest oddzielnie; albo w formie napisu ukazującego się na ekranie, albo też wypowiadany jest jasno i wyraźnie. Macie dokładnie 1 sekundę na odebranie każdego wyrazu, zanim pojawi się następny. W końcu, po ekspozycji 20 wyrazów, jesteście proszeni o przypomnienie sobie tylu z nich, ile tylko zdołaliście zapamiętać. Przeprowadźcie ten eksperyment wykorzystując 20 wyrazów zamieszczonych w tabeli 9-1. Jeśli poddacie się sami tej próbie, to pomoże Wam ona zrozumieć istotę tego typu eksperymentu oraz ułatwi orientację w analizie rezultatów. Większość ludzi, wykonując to zadanie, sądzi, że najkorzystniej będzie, jeżeli uda im się jak najszybciej odtworzyć ostatni z przedstawionych wyrazów, zanim podejmą próbę przypomnienia sobie reszty. Ostatnie wyrazy znajdowały się w czymś w rodzaju rezonatora („echo box"), w pamięci czasowej, z której łatwo je wydobyć pod warunkiem braku przeszkód. Jeśli w tym czasie prowadzona jest rozmowa, albo gdy badany stara się przypomnieć sobie od razu inne wyrazy, to ginie zawartość „rezonatora". „Rezonator" ten to oczywiście nic innego jak pamięć krótkotrwała. Większość badanych szybko uczy się natychmiastowego opróżniania pamięci krótkotrwałej przed przejściem do następnych wyrazów. Jeden ze sposobów analizowania rezultatów tego eksperymentu polega na ponumerowaniu wyrazów w porządku zgodnym z ich występowaniem, a następnie określeniu prawdopodobieństwa ich odtworzenia, w zależności od ich miejsca na liście. W wyniku takiej analizy otrzymamy krzywą kolejnej pozycji przedstawioną na rysunku 9-11. [Krzywa przypomnienia w procentach w zależności od pozycji wyrazu na liście zaczyna się od około 50 procent dla pierwszego wyrazu, po czym spada do 20 procent dla trzeciego i kolejnych kilkunastu wyrazów, a następnie rośnie prawie do 100 procent dla ostatnio zapamiętywanych słów.] W tym wypadku prezentowana była lista składająca się z 30 wyrazów: przedstawiono procent przypadków przypominania każdego z nich, z uwzględnieniem miejsca, jakie dany wyraz zajmował na liście. Przytoczone tu dane pochodzą z eksperymentu przeprowadzonego przez Benneta B. Murdocka Jr, w 1962 r. Dziewiętnastu badanym odczytano listę 30 wyrazów nie powiązanych ze sobą, w tempie jednego wyrazu na sekundę. 359 Po skończeniu każdej listy dano 1,5 minuty na zapisanie-w porządku dowolnym-tych wyrazów, które badani zapamiętali. W 5 do 10 sekund po zapisaniu odczytano im nową listę. Procedura ta powtarzana była 80 razy (w ciągu czterech dni, tak że w czasie jednej sesji eksperymentalnej badani zapamiętywali tylko 20 list). Krzywa kolejnej pozycji stanowi ważne narzędzie w ręku psychologa. Tak na prawdę to nie jest jedna krzywa i należy podzielić ją na dwie części, jak to pokazano na rysunku 9-12. [Na wykresie zilustrowano dwie krzywe przypomnienia obrazujące nieco odmienne eksperymenty. W pierwszym eksponowano 20 wyrazów po 2 sekundy na każdy, w drugim 20 wyrazów po 1 sekundzie na każdy. Pierwsza krzywa przypomnienia wykazuje wyższe wartości dla pozycji od 1 do 16, po czym krzywe są prawie identyczne.] Słowa znajdujące się na końcu listy zapamiętywane są lepiej od pozostałych. Ostatnia jednostka zapamiętywana jest w 97 procent przypadków. Ta ostatnia część krzywej przedstawia przypominanie z pamięci krótkotrwałej. Pozostała część krzywej odzwierciedla inny proces - wydobycie informacji z pamięci długotrwałej. Na rysunku 9-12 procent przypomnień z pamięci długotrwałej nie może być po prostu dodany do procentu przypomnień z pamięci krótkotrwałej, aby uzyskać całościowe przypomnienie. Zakładamy raczej, że dana jednostka (dany wyraz) jest przypominany albo z pamięci długotrwałej, albo z pamięci krótkotrwałej, ale nie z obu jednocześnie. Tak więc całościowy procent przypomnień jest sumą procentu wyrazów przypominanych z nieci krótkotrwałej plus procent tych wyrazów przypominanych z pamięci długotrwałej, które nie zostały już odtworzone (przypomniane) z pamięci krótkotrwałej. Jeśli za R przyjmiemy procent przypomnień, to R RÓWNA SIĘ STM PLUS LTM RAZY (1 minus 0,01 razy STM) Skąd o tym wiemy? Przede wszystkim pewne procedury wpływają tylko na jeden rodzaj pamięci, a na inny nie. Na przykład, jeżeli zwolnić czas ekspozycji, dając na każde słowo 2 sekundy zamiast jednej, to uzyskuje się rezultaty takie jak przedstawione na rysunku 9-13. W części krzywej dotyczącej pamięci krótkotrwałej nie notujemy zmian, natomiast wynikach dotyczących pamięci długotrwałej jest dostrzegalna poprawa (Dane te pochodzą również z badań Murdocka, różnica polegała jedynie na tym, że badanym przedstawiono listy 360 składające się z 20 wyrazów i każdy wyraz eksponowany był przez 2 sekundy). Oczywiście, dodatkowy czas pozwala badanym dłużej pracować nad materiałem i powtarzać go, co ułatwia wprowadzenie większej ilości informacji do pamięci długotrwałej. Na pamięć krótkotrwałą dłuższy czas ekspozycji nie ma wpływu. Zmieniając liczbę eksponowanych jednostek na liście i czas ich ekspozycji, możemy uzyskać rodzinę krzywych (rys. 9-14), która ponownie potwierdza, że komponent pamięci krótkotrwałej jest jednakowy na wszelkich krzywych, podczas gdy części odnoszące się do pamięci długotrwałej są różne. 361 Można przedstawić również sytuację odwrotną: czynniki, które oddziałują na pamięć krótkotrwałą, ale nie mają wpływu na pamięć długotrwałą. Jest oczywiste, że aby to uzyskać, trzeba zapobiec natychmiastowemu przypominaniu przez badanych wyrazów z pamięci krótkotrwałej w końcowej fazie eksperymentu. Z tego względu osobom badanym, po przedstawieniu całej listy, daje się do wykonania zadanie polegające na liczeniu trójkami wstecz, poczynając od wybranej liczby trzycyfrowej. Przypominanie z pamięci krótkotrwałej znika (Postman i Phillips, 1965). Bardzo łatwo możemy sami przekonać się o tym przeprowadzając taki eksperyment. Weźcie 20 wyrazów z tabeli 9-1 i czytajcie je w tempie jeden wyraz na sekundę. Kiedy dojdziecie do końca listy, zacznijcie „liczenie wstecz", poczynając od dowolnej liczby trzycyfrowej, na przykład 978. Liczcie możliwie najszybciej przez około 20 sekund. Przez ten czas wasza pamięć krótkotrwała ulegnie całkowitemu zatarciu. Rezultaty podobnego eksperymentu przedstawione są na rysunku 9-15. Zwróćcie uwagę na to, że ostatnia część krzywej jest całkowicie spłaszczona: brak jest pamięci krótkotrwałej. W takich eksperymentach osobom badanym stawia się trudne zadanie. Zakłada się, że powinny one niezwykle uważnie spostrzegać każde z eksponowanych słów, powtarzać je i świadomie dążyć do wyuczenia się możliwie największej ich liczby. Jeżeli ten świadomy wysiłek nie występuje, to tylko bardzo niewielka część podanej informacji zostanie przekazana do pamięci długotrwałej. Co stanie się wówczas, gdy badani nie będą się starali zapamiętać eksponowanego im materiału, jeżeli poświęcą mu zbyt mało uwagi? Uwzględniając to wszystko, co powiedzieliśmy do tej pory, możemy przypuszczać, że w takiej sytuacji nic się nie znajdzie w pamięci trwałej-po prostu niczego się nie nauczą. Jest rzeczą oczywistą, że procesy uwagi zajmują ważne miejsce w fazie interpretacji przekazu. Ważne jest wiec dokładne prześledzenie tych procesów. 362 Jakie są granice i możliwości uwagi? Aby odpowiedzieć na te pytania, musimy odejść od dotychczasowego toku naszych rozważań i przedstawić główną linię badań nad procesami uwagi zachodzącymi w trakcie przetwarzania napływającej informacji. ZJAWISKA UWAGI Wyobraźcie sobie, że znajdujecie się w licznym towarzystwie na hałaśliwym przyjęciu. Stoicie wraz z grupką ludzi, wokół was znajdują się inne grupy. Którą z rozmów usłyszycie? Mimo hałasu możecie wybrać tę rozmowę, którą zechcecie usłyszeć, możecie podsłuchać rozmowę prowadzoną z tyłu za wami, z prawej czy też lewej strony. Ale, jeśli słuchacie jednej z nich, pozostałe rozmowy będą dla was stracone. Na tym polega zjawisko selekcji uwagi. Można wybrać sobie dowolną rozmowę prowadzoną w pokoju i przysłuchiwać się jej, ale jest niemożliwe uczestniczenie równocześnie w dwu lub w jeszcze większej liczbie rozmów. Oczywiście, można podtrzymywać kilka rozmów, wyłapując trochę słów z każdej z nich, śledząc przy tym ich ogólny sens. Ale jeśli rozmowy te są choć trochę poważne, sens każdej z nich gubi się, kiedy chcemy ogarnąć zbyt dużo. Można selektywnie wyławiać sens z całego hałasu na przyjęciu; zdolność do rozumienia różnych rozmów prowadzonych jednocześnie jest ograniczona. Uwaga to swego rodzaju broń obosieczna. Z jednej strony pozwala nam iść w ślad za określonym ciągiem wydarzeń, które nas interesują, wyodrębnić je z wielu innych zachodzących równocześnie, chociaż każde z nich zagłusza inne. Bez tej selektywnej zdolności życie stałoby się chaotyczne, ponieważ moglibyśmy uchwycić sens zachodzących w świecie zdarzeń tylko wtedy, gdyby każde z nich występowało w izolacji, bez konkurencji lub interferencji ze strony innych zdarzeń. Z drugiej zaś strony, uwaga ogranicza nasze możliwości obserwowania wszystkich zachodzących zdarzeń, choć często byłoby to pożądane. Nawet wówczas, gdy bezpośrednio interesuje nas tylko jeden ciąg wydarzeń, niepożądane jest koncentrowanie na nim całej uwagi, bowiem inne zdarzenia, które w efekcie mogą okazać się ważniejsze, przejdą niedostrzeżone. Pożądana jest zdolność do koncentracji uwagi na jednym zjawisku, z wyłączeniem innych, ale tylko tak długo, 363 aż nie zostanie to przerwane przez pojawienie się czegoś ważniejszego. Dlatego należy znaleźć sposób pozwalający śledzić nawet te zdarzenia, którymi w danej chwili nie zajmujemy się, przełączać naszą uwagę w momencie, kiedy pojawiają się inne istotne aspekty, i wyłączać ją, gdy występują nieważne szczegóły. Wybór przekazów Zacznijmy od eksperymentu. Na rysunku 9-16 i 9-17 przedstawione zostały różne drukowane przekazy. Zadanie wasze polega na prześledzeniu jednego z nich (przekazu właściwego) i ignorowaniu drugiego (przekazu niewłaściwego). Przeczytajcie zakreskowaną część przekazu na głos możliwie najszybciej, nie zwracając uwagi na inne wyrazy. Spróbujcie zrobić to z tekstem przedstawionym na rysunku 9-16. [Wyrazy, które mają być pominięte przy czytaniu zostały ujęte w nawias. Zaleca się ustawić opcję CZYTANIE DOKUMENTÓW na wypowiadanie wszystkich znaków.] Wykonując eksperyment taki jak ten dotyczący uwagi (człowiek) wydaje (samochód) się (dom) rzeczą (chłopiec) szczególnie (kapelusz) ważną (pantofel) aby (cukierek) materiał (stary) który (koń) ma (drzewo) być (pióro) czytany (telefon) przez (krowa) osobę (książka) badaną (gorący) jako (taśma) właściwe (szpilka) zadanie (stoi) był (widok) spójny (niebo) logicznie (czerwony) i (człowiek) gramatycznie (samochód) poprawny (dom) ale (chłopiec) aby (kapelusz) nie (portfel) był (cukierek) ani (stary) zbyt (koń) łatwy (drzewo) gdyż (pióro) wtedy (telefon) nie (krowa) jest (książka) niezbędna (gorący) cała (taśma) uwaga (szpilka) do (stoi) przeczytania (widok) go (niebo) ani (czerwony) też zbyt trudny. Teraz, nie patrząc w tekst, powiedzcie o swoich spostrzeżeniach dotyczących wyrazów niezakreskowanych, (czyli tych w nawiasach)? Czy pamiętacie któryś z nich? Czy zauważyliście, że każdy wyraz powtarzał się dwukrotnie? Prawdopodobnie nie. Mamy oto pierwsze nieprecyzyjne jeszcze wskazówki dotyczące sposobów wyboru informacji. Człowiek może z pewnym powodzeniem koncentrować swą uwagę na jednej istotnej dla niego części tekstu. Aby oddzielić przekaz właściwy od niewłaściwego, można posłużyć się określoną cechą fizyczną tego przekazu, w danym wypadku - zakreskowaniem, tak jakby istniał jakiś wewnętrzny przełącznik, przepuszczający przekaz o odpowiednich cechach fizycznych, a odrzucający całą resztę. Ale do jakiego stopnia byliście w stanie przeanalizować materiał niewłaściwy z rysunku 9-16? Czy rzeczywiście odrzuciliście go wyłącznie z powodu braku zakreskowania? Jeżeli w pamięci nie pozostało nic z tego odrzuconego przekazu, teorię uwagi można by wstępnie sformułować w następujący sposób: materiał niewłaściwy analizowany jest tylko na tyle, na ile konieczne jest określenie jego ogólnych cech fizycznych. Po tym przetwarzanie materiału niewłaściwego zostaje przerwane. 364 Ta hipoteza wstępna jest jednak nazbyt prosta. Zastanówcie się nad zadaniem przedstawionym na rysunku 9-17. Ponownie przeczytajcie możliwie jak najszybciej tekst zakreskowany. Pomińcie całkowicie część niezakreskowaną. [Wyrazy niezakreskowane zostały ujęte w nawias. Zaleca się ustawić opcję CZYTANIE DOKUMENTÓW na wypowiadanie wszystkich znaków.] Jest rzeczą ważną aby osoba badana (człowiek) została (samochód) zmuszona (dom) do (chłopiec) wyjścia (kapelusz) poza (pantofel) wyznaczone (cukierek) jej (koń) granice (drzewo) gdyż (pióro) tylko telefon (w taki) krowa (sposób) książka (można) gorący (się) taśma (upewnić) szpilka (że) stoi (uwaga) migawka (badanego) oraz (jest) jego (skierowana) zęby (na) pod (właściwe) puste (zadanie) powietrze (a) jedynie (kapelusz) jej (pantofel) minimum (cukierek) na ( drzewo) drugie lub uboczne zadanie. Co się teraz wydarzyło? Niespodziewanie zakreskowane zdanie przeszło w ciąg nie powiązanych ze sobą wyrazów, a zdanie właściwe rozwija się w części niezakreskowanej, którą, zgodnie z instrukcją, powinniście pominąć. Jeżeli materiał nieistotny odrzucany zostaje wyłącznie na podstawie jego ogólnych cech fizycznych, to wówczas bez trudności możemy kontynuować czytanie zakreskowanego materiału. Nawet nie powinniście zauważyć, że tekst kontynuowany jest w części niezakreskowanej. Większość ludzi jednak zaczyna czytać wyrazy niezakreskowane, śledząc dzięki temu sens zdania, zamiast po prostu stosować się do instrukcji i przetwarzać wyłącznie informacje o odpowiednich cechach fizycznych. Wskazówki fizyczne przydatne są do wyodrębnienia informacji istotnej od nieistotnej. Jednakże dokonując wyboru słów, które należy przeczytać, kierujemy się czymś więcej niż cechami fizycznymi, w przeciwnym bowiem razie nie występowałaby tendencja do przestawienia się na wyrazy niezakreskowane, kiedy pasują one do kontekstu. Problem polega więc na tym, co właściwie jest przetworzone, a co odrzucone. Jest oczywiste, że do tego potrzebujemy lepszego sposobu śledzenia procesów uwagi. Czy naprawdę koncentrowaliście się wyłącznie na zakreskowanym przekazie, czy też trochę oszukiwaliście (oczywiście nieumyślnie) i patrzyliście również na pozostałą część przekazu, aby zobaczyć, co on zawiera? Jeżeli chcemy określić granicę pojemności uwagi, musimy upewnić się w tym, czy cała uwaga została skoncentrowana na jednym zadaniu. Jeśli to nam się nie uda, powinniśmy przynajmniej mieć możność zmierzenia, jaka część uwagi koncentruje się na informacji istotnej. Dopiero wówczas możemy przystąpić do określenia, jaka część informacji może być wydobyta z materiału niewłaściwego. Równoczesne powtarzanie materiału (Shadowing). Aby określić, jakiego typu informacja będzie wydobyta z nie śledzonego przekazu, musimy zastosować takie zadanie eksperymentalne, żebyśmy mogli stwierdzić, czy rzeczywiście osoba badana zajmuje się wyłącznie jego wykonaniem. Jedno z często stosowanych zadań polega na tym, że osobę badaną prosi się o równoczesne powtarzanie przedstawionego jej materiału. W zadaniu tego typu osobie badanej odczytywana jest na głos seria wyrazów, a jej zadanie polega na powtarzaniu jednocześnie każdego wyrazu na głos. Trudno jest wykonać to zadanie, 365 zwłaszcza gdy materiał podawany jest w dostatecznie szybkim tempie. W takiej sytuacji aby badane muszą poświęcać zadaniu znaczną część uwagi. Eksperymentator może ocenić, ile uwagi poświęcił badany zadaniu, kierując się tym, jak dalece wiernie powtarza on wyrazy, które zostały mu przedstawione. Zazwyczaj zaleca się stosowanie materiału o takim stopniu trudności i odczytywanie go w takim tempie, aby badany nie popełnił zbyt wielu błędów, przykładowo w granicach 10 procent. W ten sposób na podstawie ewentualnego wzrostu liczby popełnionych przez niego błędów będziemy mogli określić, czy zmienia się koncentracja jego uwagi na zadaniu polegającym na powtarzaniu. (Jest rzeczą ważną, aby badany nie mógł powtarzać słów zbyt wiernie, ponieważ, jeśli uda mu się wykonać zadanie bezbłędnie, może to oznaczać, że było ono zbyt łatwe i wobec tego zyskałby czas i to, żeby zająć się czymś innym.) Tak więc w typowym eksperymencie osobę badaną prosi się o powtarzanie określonego wybranego materiału (zazwyczaj odtwarzanego z taśmy magnetofonowej), który przekazywany jest przez słuchawkę do jednego ucha. Następnie podaje się materiał eksperymentalny do drugiego ucha (czasem stosowany jest materiał wzrokowy) (rys. 9-18). Po zakończonym eksperymencie osobie badanej zadaje się pytania dotyczące treści prezentowanego materiału, aby móc określić, jakie szczegóły potrafi sobie przypomnieć. Spróbujcie przeprowadzić podobny eksperyment na sobie. Zaproście jeszcze dwie osoby. Niech jedna z nich siądzie obok Was i czyta na głos w określonym tempie tekst z tej książki lub też z jakiegokolwiek czasopisma. Spróbujcie powtarzać ten tekst. Czytać należy równym jednostajnym głosem. Powtarzajcie każde słowo w miarę jak jest wypowiadane, nie pozostając w tyle, tj. nie czekając na zakończenie zdania. Potem, gdy ,już potrenujecie powtarzanie, niech następna osoba siądzie obok Was z drugiej strony i zacznie czytać drugi urywek, podczas gdy Wy dalej powtarzacie pierwszy (do tego celu można wykorzystać przypadkowy zestaw wyrazów z tabeli 9-1). Spróbujcie, nie przerywając powtarzania pierwszego przekazu, śledzić również drugi. Jeżeli zaczniecie popełniać błędy, osoba odczytująca powtarzany przez was materiał powinna zwrócić wam na to uwagę (np. szturchając was w bok). Spróbujcie użyć w tym eksperymencie zróżnicowanego materiału informacyjnego do obu przekazów, 366 aby zaobserwować, czy ma to wpływ na trudność zadania. Co odbieracie lub zapamiętujecie z drugiego przekazu? Większą część opisywanych tu wyników badań dotyczących równoczesnego powtarzania można z łatwością sprawdzić na sobie samym. Przetwarzanie odrzuconego przekazu Kiedy jesteśmy całkowicie pochłonięci jakimś zajęciem, na przykład równoczesnym powtarzaniem wyrazów, lub gdy znajdujemy się jakby w transie w czasie czytania dobrej powieści, lub będąc w teatrze czy też w kinie, lub nawet pogrążeni w marzeniach, to subiektywnie wydaje się nam, że całkowicie pochłonęło nas to, na czym koncentruje się nasza uwaga. Jak gdyby jakiś wyłącznik odciął naszą świadomość od dopływu wszystkich sygnałów, z wyjątkiem tych, które nas interesują. Wyobraźcie sobie, że zamyśliliście się w trakcie wykładu. Dźwięki głosu wykładowcy docierają do Waszych uszu, ale nie pozostawiają żadnego śladu w świadomości. Wygłaszane kwestie pozostają niezrozumiałe. Świadomym wysiłkiem woli można przerwać stan zamyślenia i zacząć słuchać wykładu. Chociaż w przełączeniu uwagi z marzeń na słowa wykładowcy nie uczestniczą żadne mięśnie czy części ciała, odbiór wykładu będzie całkowicie odmienny. W obu wypadkach „słyszymy" głos wykładowcy, ale w jednym śledzimy wykład, a w drugim nie. W jakim punkcie zachodzi moment przełomowy? Gdzie następuje zastopowanie analizy treści wykładu? Najprostsze wyjaśnienie teoretyczne jest takie: sygnały z otaczającego środowiska przechodzą przez systemy sensoryczne i znajdujące się w nich mechanizmy analizujące. Jest to oczywiście prawda, ponieważ rzeczywiście „słyszymy" nie śledzone z uwagą dźwięki, jeżeli nawet ich nie rozumiemy. Jednakże w pewnym miejscu musi znajdować się przełącznik, 367 przepuszczający sygnały, na które chcemy zwrócić uwagę, i blokujący pozostałe, jak to przedstawiono na rysunku 9-19. Nawet proste badania nad uwagą pozwalają stwierdzić, ze pewne aspekty materiału, na który nie jest zwrócona aktywna uwaga, mogą zostać dostrzeżone. Kiedy badany starannie powtarza przedstawiony mu materiał, ciągle jeszcze możliwe jest, że przypomni sobie co nieco z dodatkowych informacji. Jest zdolny do: • przypomnienia sobie, czy w ogóle słyszał głos, • określenia, czy głos męski został zastąpiony żeńskim, • zauważenia takich sygnałów, jak gwizd. Nie jest zdolny do: • przypomnienia sobie treści przekazu, • rozpoznania języka przekazu, • stwierdzenia, czy język uległ zmianie w trakcie eksperymentu, odróżnienia mowy od bezsensownych dźwięków. Rezultaty te potwierdzają, że osoba badana rejestruje przede wszystkim najprostsze właściwości sygnałów, na które nie zwraca uwagi. Nie dostrzega ona tego, co wymaga interpretacji, na przykład znaczenia słów, nie rozpoznaje języka, a nawet nie wie, czy dźwięki tworzą sensowny przekaz językowy. I chociaż materiał właściwy podlega dość pełnej analizie (z udziałem wszystkich poziomów przetwarzania omówionych w rozdziale 3 o rozpoznawaniu obrazów), analiza wszystkich innych napływających sygnałów najwidoczniej dość wcześnie zostaje przerwana; możliwe, że dzieje się to na poziomie analizy cech. Wydaje się, że mechanizm selekcji dokonuje oceny cech fizycznych napływającej informacji, a następnie na tej podstawie wybiera materiał właściwy, wyodrębniając go z pozostałego, niewłaściwego. Następnie włącza się przełącznik, który przepuszcza do dalszej analizy wyłącznie sygnały właściwe (rys. 9-20). [Na rysunku przedstawiono schemat drogi jaką pokonuje przekaz. Do ucha człowieka wpada przekaz właściwy i przekaz niewłaściwy. W mózgu następuje analiza sensoryczna, następnie analiza cech, po której znajduje się przełącznik na jeden z przeanalizowanych przekazów. Dalszemu przetwarzaniu podlega już tylko jeden z przekazów. Efekt końcowy – przeanalizowany przekaz.] System ten wydaje się ogólnie użyteczny w procesie uwagi. Fakt, że mechanizm analizy cech poddaje wszystkie sygnały choćby pobieżnej ocenie, stwarza badanemu możliwość zauważenia i zapamiętania, jakie sygnały w ogóle występują. Z kolei fakt, że szczegółowa analiza 368 sygnałów nieistotnych zostaje przerwana na poziomie wyodrębniania cech ogólnych, stanowi przeszkodę w zrozumieniu ich sensu. Wystarczą pewne cechy ogólne, aby można było odróżnić głos ludzki od innych dźwięków, ale na tej podstawie nie można określić niczego więcej, nawet rozpoznać języka, w jakim się mówi. Ważne jest, że opisywany tu mechanizm uwagi okazuje się zgodny z systemem rozpoznawania obrazów, który omówiliśmy wcześniej. Jedyne, co dodaliśmy, to przełącznik. Oczywiście, istnieje wiele sposobów, za pomocą których układ nerwowy może stworzyć logiczny ekwiwalent przełącznika. Do tego potrzebny jest jedynie jakiś mechanizm hamujący, blokujący informację dotyczącą jednej rozmowy, a przepuszczający inną. Różnorodne mechanizmy synaptyczne komórek nerwowych stwarzają takie możliwości, ale na razie nie ma potrzeby tworzenia spekulatywnego schematu połączeń, którymi posługuje się układ nerwowy; po prostu przedstawiamy ten proces za pomocą logicznego schematu wchodzących w grę funkcji. Prosty model przełącznika z powodzeniem wyjaśnia omawiane dotąd zjawisk uwagi. Ale zjawisk tych jest więcej. Pamięć bez uwagi Pierwszym zjawiskiem, które poddamy analizie, jest pamięć. Co dzieje się z pamięcią w sytuacji wyłączenia uwagi? Aby to zbadać, dajemy osobom badanym do równoczesnego wykonywania kilka zadań. Cel eksperymentu polega na tym, aby badani musieli skoncentrować całą uwagę na wykonywaniu jednego z zadań. Później następuje sprawdzenie tego, co zapamiętali oni z innych rzeczy, występujących równocześnie, ale związanych z innym zadaniem. W jednym z eksperymentów proszono osoby badane o powtarzanie wyrazów przekazywanych przez słuchawkę do jednego ucha, podczas gdy do drugiego ucha docierały w tym samym czasie powszechnie używane słowa angielskie, przy czym każde słowo było powtarzane 35 razy. Po zakończeniu eksperymentu sprawdzono zapamiętanie słów, które docierały do tego właśnie ucha. Żadne z tych słów nie pozostało w pamięci. Najwidoczniej uwaga potrzebna do powtarzania wyrazów całkowicie pozbawiła badanych zdolności do analizowania informacji docierającej do drugiego ucha. Taki rezultat nie stanowi niespodzianki. Oczywiście badani nie mieli czasu na to, aby powtarzać lub strukturalizować słowa angielskie. Ale czy badani rzeczywiście słyszeli te słowa? Jak daleko przedostała się ta informacja, na której nie była skoncentrowana uwaga? Czy doszła do pamięci krótkotrwałej? Aby ustalić, czy materiał leżący poza strefą uwagi trafia do pamięci krótkotrwałej, należy zaraz po ekspozycji tego materiału przerwać wykonywanie zadania, a następnie sprawdzić, czy badani pamiętają z niego cokolwiek. Kiedy przeprowadzimy eksperyment w taki sposób, okazuje się, że badani mogą wydobyć ze swej pamięci krótkotrwałej kilka ostatnich jednostek. Ale jeżeli odstęp czasu między prezentacją materiału a sprawdzeniem stopnia jego zapamiętania wyniesie 30 sek., badany nie będzie już mógł przypomnieć sobie niczego z tego materiału, na którym jego uwaga nie była skoncentrowana. 369 Jeżeli uwaga skoncentrowana jest na czymś, dodatkowo napływająca informacja rzeczywiście dociera do pamięci krótkotrwałej. Ale tu może zaniknąć bez śladu. Jeżeli od razu sprawdzamy zapamiętanie, to pewna część informacji, która utrzymuje się jeszcze w pamięci krótkotrwałej, może zostać przypomniana. Zwróćcie uwagę na podobieństwo między zadaniami z równoczesnym powtarzaniem tekstu a liczeniem wstecz. W czasie wykonywania zadania polegającego na liczeniu wstecz uwaga zajęta jest liczeniem bezpośrednio po przekazaniu informacji. W trakcie wykonywania zadania polegającego na równoczesnym powtarzaniu tekstu uwaga skoncentrowana jest na napływającej informacji. Istnieje również inny sposób przedstawienia wpływu uwagi na pamięć krótkotrwałą. Przyjmijmy, że osoby badane otrzymują listy wyrazów do zapamiętania, i załóżmy, że sprawdza się stopień zapamiętania natychmiast po prezentacji każdej listy. Przypominanie ich będzie odpowiadało standardowej krzywej kolejnej pozycji, przedstawionej na rysunku 9-21 a. Eksperyment kontynuowany jest dopóty, dopóki nie zostanie przedstawionych 50 różnych list. Następnie, bez żadnego uprzedzenia, prosi się badanych, aby przypomnieli sobie wszystko, co potrafią ze wszystkich wcześniej prezentowanych list. Co się wtedy dzieje? Jedyna logiczna odpowiedź polega na tym, że wyniki powinny nieco przypominać te, które zostały przedstawione na rysunku 9-15. Inaczej mówiąc, powinny być takie jak na rysunku 9-21 a, [wykres zapamiętywania wyrazów (w procentach) w zależności od pozycji wyrazu] ale bez udziału komponentu pamięci krótkotrwałej. Jednak tak się nie dzieje. Okazuje się, że badany zupełnie nie pamięta pozycji, które występowały jako ostatnie na każdej liście, chociaż może sobie przypomnieć wiele pozycji z początku listy (rys. 9-21 b). Z jakiego powodu zapamiętywanie końcowych pozycji nie występuje w eksperymencie 370 przedstawionym na rysunku 9-21 b, podczas gdy w eksperymencie przedstawionym na rysunku 9-15 pewna część tych pozycji była zapamiętana? Jedno z możliwych wyjaśnień polega na tym, że w trakcie przeprowadzania obu eksperymentów badani stosowali różne strategie podziału uwagi. W eksperymencie, którego wyniki ukazane zostały na rysunku 9-15, osoby badane dobrze wiedziały, że później nastąpi sprawdzenie stopnia zapamiętania materiału. Natomiast w eksperymencie przedstawionym na rysunku 9-21 b (przeprowadzonym przez Madigana i McCabe'a, 1971) badani nic nie wiedzieli o tym, że nastąpi sprawdzenie zapamiętania słów ze wszystkich uprzednio prezentowanych list. Możliwe jest, że koncentrowali zatem swoją uwagę głównie na początkowych pozycjach z każdej listy, ponieważ są one rzeczywiście najtrudniejsze do zapamiętania. Nie zwracali uwagi na ostatnie pozycje, licząc na to, że jeżeli zajdzie konieczność natychmiastowego przypomnienia sobie tych informacji, można je będzie wydobyć z pamięci krótkotrwałej bez większego wysiłku. Strategia ta doskonale odpowiada początkowej części eksperymentu, ale okazuje się nieprzydatna, gdy wprowadzimy późniejszą, nieoczekiwaną próbę. Zarówno w eksperymencie z równoczesnym powtarzaniem tekstu, jak i w eksperymencie ze zwykłym przypomnieniem znajdujemy potwierdzenie tego, że całkowity brak uwagi dotyczącej napływającego materiału może spowodować normalne zapamiętanie krótkotrwałe, ale też całkowity brak przechowania go w pamięci długotrwałej. Powinno to przypomnieć Wam opis dwu pacjentów H.M. i N.A. przytoczony w rozdziale 8. Te dwie osoby cierpiały wskutek uszkodzenia mózgu, co nie pozwoliło im uczyć się nowych rzeczy ani też zapamiętywać czegokolwiek nawet na krótko, chociaż pamięć krótkotrwała była sprawna. Możliwe więc, że uszkodzenie mózgu miało wpływ na mechanizmy uwagi, uczestniczące w przekazywaniu materiału z jednej pamięci do drugiej. Wróćmy ponownie do modelu uwagi. Łatwo można zrozumieć, że pamięć chwilowa rzeczywiście istnieje niezależnie od tego, czy uwaga koncentruje się na materiale czy też nie. Wystarczy w tym celu wyobrazić sobie, że system pamięci krótkotrwałej może się wyłączać bezpośrednio po analizie cech (rys. 9-20), ale przed tym, nim zadziała przełącznik. Jeżeli tak jest, to pamięć chwilowa obejmuje każdy materiał podlegający analizie sensorycznej, a pamięć trwała obejmuje jedynie materiał przepuszczony przez urządzenie przełączające. Jest to jedno z możliwych wyjaśnień. Pozostają jednak inne problemy związane z tym modelem: jednym z nich jest bardziej precyzyjne zdefiniowanie, jaki materiał przepływający kanałem będącym poza sferą uwagi przechodzi przez przełącznik. Czy pamiętacie przykład, w którym mieliście za zadanie odczytać zakreskowany tekst nie zwracając uwagi na niezakreskowany? Nagle sensowne zdanie, zbudowane z zakreskowanych słów, przekształciło się w bełkot, a samo zdanie kontynuowane było w postaci słów niezakreskowanych, które należało omijać. Jeżeli w trakcie eksperymentu z równoczesnym powtarzaniem, gdy badany zgodnie z instrukcją powtarzał wyłącznie materiał docierający do lewego ucha (rys. 9-22) [do jednego ucha dociera tekst: zawodnik rzucił ćma szczęśliwy marchewka; do drugiego ucha słowa: pokarm sowa farba książka piłkę na ziemię], nie reagując na nic więcej, nagle sensowny ciąg materiału zostanie przełączony do drugiego ucha, to jest duże prawdopodobieństwo, że przełączy się on z ucha, które odbierało uprzednio tenże materiał, na to drugie ucho. [badany wypowiada zdanie: Zawodnik rzucił piłkę na ziemię.] 371 Kontekst i znaczenie przekazu często wdzierają się do zadania, nierzadko badani dostrzegają swoją omyłkę, zatrzymują się i przepraszają. Można stosować szereg różnorodnych wariantów omawianego eksperymentu, wszystkie jednak prowadzą w zasadzie do tego samego stwierdzenia: badani uświadamiają sobie w pewnym stopniu materiał docierający kanałami, na które uwaga nie była skierowana. Na przykład, osoba badana często zauważa, że wypowiedziane zostało jej imię do ucha, które odbiera informację niewłaściwą. Wyławia z drugiego kanału słowa mające sens zbliżony do zadania, jakie wykonuje. Oczywiście nie spostrzega dokładnie materiału docierającego do tego ucha, ale materiał ten nie jest całkiem stracony, czego należałoby oczekiwać biorąc pod uwagę model przełącznika. Jak zatem połączyć te wszystkie dane w opisie procesu uwagi? Teoria ostateczna powinna połączyć wiele aspektów. Po pierwsze, musi wyodrębnić i wyjaśnić organizację różnych procesów uczestniczących w skierowywaniu uwagi na jeden lub kilka sygnałów. Po drugie, musi być zgodna ze wszystkimi danymi eksperymentalnymi, jakimi dysponujemy. Po trzecie, musi być również zgodna z zasadami organizacji systemów uczestniczących w spostrzeganiu i rozpoznawaniu obrazów. TEORIE UWAGI Model osłabiacza Problem związany z przełącznikiem polega na tym, że urządzenie to działa zgodnie z zasadą „wszystko albo nic": informacja albo przechodzi, albo też nie. Ale mieliśmy już okazję przekonać się, że pewna część informacji przepływającej kanałem nie będącym w centrum uwagi, 372 który-jak się przypuszcza - został wyłączony, dociera jednak do świadomości badanego. Możliwe jest więc przyjęcie następującego rozwiązania. Otóż przełącznik działa w istocie jako osłabiacz (attenuator), czyli urządzenie ograniczające ilość przepływającej informacji, ale nie powodujące jej całkowitego zablokowania. Odpowiednio zatem należy zmodyfikować nasz schemat, tak jak to przedstawia rysunek 9-23. [Na rysunku przedstawiono schemat drogi jaką pokonuje przekaz. Do ucha człowieka wpada przekaz właściwy i przekaz niewłaściwy. W mózgu następuje analiza sensoryczna, następnie analiza cech, teraz w odróżnieniu od schematu 9-20 nie ma przełącznika lecz zarówno przekaz właściwy jak i niewłaściwy, ale ten po uprzednim przejściu przez osłabiacz, idą do dalszego przetwarzania. Efekt końcowy – przeanalizowany przekaz.] Czy model ten może wyjaśnić wszystkie dane eksperymentalne? Jeśli w wyniku osłabienia przepływu informacji w niepożądanym kanale zmniejsza się ładunek energetyczny niezbędny do dalszego jej przetwarzania, pozwala to na skierowanie podstawowego wysiłku na kanał główny, którym przepływa informacja właściwa, tym samym osłabiacz częściowo spełnia swoją rolę. Ponadto powinien on dawać jednak możliwość analizowania pewnych słów- tych, które mają szczególne znaczenie albo które pasują do kontekstu przekazu właściwego, mimo że odbiór ich został osłabiony. Oczywiście, analiza osłabionych sygnałów nie jest tak efektywna, jak analiza sygnałów docierających bezpośrednio, dlatego też w toku analizy sygnałów osłabionych nieuniknione są liczne błędy. I właśnie to obserwujemy. Model z osłabiaczami lepiej zatem wyjaśnia pewne zjawiska uwagi, aniżeli model z przełącznikami, działającymi zgodnie z zasadą „wszystko albo nic". Cóż można powiedzieć o zapamiętywaniu sygnałów niewłaściwych? Nie jest wykluczone, że bezpośrednio przed osłabiaczem znajduje się jakiś system pamięci. Byłoby to zgodne z wynikami badań: przypuszczalnie tylko sygnały poddawane późniejszej analizie przechowywane są w pamięci trwałej, ale w pamięci czasowej przechowywane są wszystkie sygnały. Skąd będziemy wiedzieli, jaki kanał powinien zostać osłabiony? Wspomnieliśmy o tym, że gdy poprosi się osobę badaną o powtarzanie materiału docierającego do jednego ucha: John rzucił swoją przy tej ulicy równocześnie zaś do drugiego ucha przekaże wyrazy: „Dom jest piłkę do Toma", to z dużym prawdopodobieństwem powtórzy ona słowa „John rzucił swoją piłkę do Toma". Aby zapewnić taki wynik, osłabiacz powinien przełączyć kanały w środku zdania. 373 Oznacza to, iż system musi być tak skonstruowany, aby oczekiwania wyłonione w trakcie analizy przetwarzanego materiału mogły wpływać na regulację ustawienia osłabiacza do pracy nad przyszłym materiałem. Rysunek 9-24 przedstawia pełny system wraz z pamięcią krótkotrwałą, poprzedzającą osłabiacze, oraz metodę regulacji względnej siły osłabiaczy. Model ten jest nieco przeładowany, ale wszystkie zawarte w nim elementy wydają się niezbędne i system wydaje się zaspokajać stawiane mu wymagania. Model procesu aktywnej syntezy Przechodzimy teraz do omówienia modelu uwagi mającego wiele wspólnego z systemem rozpoznawania obrazów, zaproponowanym w rozdziale 3. Doszliśmy tam do wniosku, że w analizie sygnałów sensorycznych w znacznej mierze trzeba odwoływać się do mechanizmu aktywnej syntezy, który stwarza możliwość uzupełniania i porównywania nadchodzących sygnałów i tym samym zapewnia dokładne rozpoznawanie nawet w sytuacji zakłóceń i zmienności napływających sygnałów. Bez procesu aktywnej syntezy trudno byłoby analizować sygnały zawierające luki, sprzeczne i wieloznaczne. Wywody te są w pełni zgodne z wymaganiami stawianymi mechanizmowi uwagi. Rozważcie, co jest potrzebne, aby mechanizm aktywnej syntezy mógł zbudować wewnętrzny model środowiska. Przede wszystkim jest niezbędne, żeby cała informacja dotycząca sygnału ułożyła się w zrozumiały obraz. Aby móc przewidzieć na podstawie kontekstu zdania, jaki będzie następny wyraz, należy uwzględnić omawiany temat, styl mówiącego i analizę gramatyczną odebranej już części zdania. Wówczas będzie można określić, jakie wyrazy mogą mieć związek z danym zdaniem (a więc, jakich wyrazów należy szukać), a jakich nie należy oczekiwać. W ten sposób kontekst może z góry uprzedzać mechanizmy spostrzegania, jakich sygnałów należy oczekiwać, i tym samym ułatwić im wybór właściwego sygnału, kiedy ten się pojawi, nawet wówczas, gdy nie będzie on zupełnie wyraźny. Na podstawie danych uzyskanych w badaniach nad uwagą można dojść do wniosku, że proces analizy przez syntezę przebiega w sposób nadzwyczaj ograniczony. To znaczy, w każdej jednostce czasu biegnie wyłącznie jedną drogą, tak że tylko jeden zespół sygnałów korzysta z dobrodziejstw rozszerzonej analizy. 374 [Rysunek 9-25 przedstawia model zapamiętywania. Na wejściu przekaz kanału 1 i przekaz kanału 2, następnie analiza sensoryczna, po czym dwa wejścia do analizy cech. Po analizie cech dwa przekazy wchodzą do pamięci krótkotrwałej, ale tylko jeden przekaz wchodzi do następnego etapu – aktywnej syntezy (oczekiwania i informacja sensoryczna). Ostatni element modelu to pamięć, do którego dochodzi przetworzony przekaz i następuje sprzężenie zwrotne do bloku aktywnej syntezy.] Problem polega na ustaleniu, jakie zmiany należy wprowadzić do modelu omówionego szerzej w rozdziale 3, aby mógł on uwzględnić równoczesny przepływ pewnej liczby sygnałów, ale tak, żeby pełnej analizie podlegał tylko jeden z nich. Zasadniczy rezultat przedstawiony jest na rysunku 9-25. Powstaje pytanie, co począć z wynikiem analizy cech płynących z kanału nie śledzonego. Na rysunku 9-25 kanał ten po prostu wisi w powietrzu. A teraz przypomnijmy sobie, że tylko proces zwany „aktywną syntezą" może mieć ograniczenia co do liczby dokonywanych analiz w danej jednostce czasu. Jest to proces aktywny i tylko on wymaga poznawczej, świadomej uwagi. 375 Wszystkie pozostałe procesy są pasywne, automatyczne i prawdopodobnie mogą dokonywać ciągłej analizy wszystkich napływających sygnałów. Pasywna część analizy nie wystarcza do wykrycia odchyleń i zniekształceń sygnału i do wydobycia zawartego w nim skomplikowanego znaczenia. Do pełnej analizy niezbędna jest informacja pochodząca z aktywnych mechanizmów. Przyjmijmy, że te same założenia odnoszą się do równoczesnej analizy kilku różnych sygnałów. Przyjmijmy, że wszystkie sygnały analizowane są przez system pasywny, ale tylko jeden kanał w określonej jednostce czasu podlega analizie w aktywnej części systemu. Sygnały nie analizowane przez aktywną część systemu są w pewnym sensie osłabione. 376 Zanim jednak zilustrujemy ten system, zastanówmy się ponownie, jaką rolę pełni pamięć w tym procesie. Przypomnijmy sobie, że istnieje pamięć czasowa obejmująca wszystkie nadchodzące sygnały, bez względu na to, czy skierowana jest na nie uwaga czy też nie. Zwróćmy uwagę, że w toku analizy przy rozpoznawaniu obrazów niezbędne było korzystanie z systemu pamięci trwałej, aby móc określić, co reprezentuje konfiguracja cech wyodrębnionych z sygnału. Problem polega na tym, aby pogodzić ze sobą obie formy korzystania z pamięci. W modelu z osłabiaczem problem ten rozwiązany został dzięki wprowadzeniu do schematu specjalnego systemu pamięci krótkotrwałej - pamięci dla każdego kanału informacji. W omawianym wypadku jednak możliwe jest nieco inne rozwiązanie, przede wszystkim dlatego, że system pamięci odgrywa tu szczególnie ważną rolę. Przyjęcie założenia, że pamięć krótkotrwała jest formą rozszerzenia pamięci długotrwałej, pozwala nam zbudować dość interesujący system. Teraz uzyskana została pełna symetria: wszystkie kanały informacji poddawane są procesowi przetwarzania przez pasywną część systemu rozpoznawania obrazów (rys. 9-26). Jednakże kanał, na który skierowana została uwaga, poddawany jest również dodatkowemu procesowi aktywnego przetwarzania, polegającemu na syntezie sygnałów i porównaniu ich z oczekiwaniami wynikłymi z analizy już odebranych cech. A zatem system rozpoznawania obrazów przetwarza wszystkie sygnały, poddaje je różnym możliwym analizom i w ten sposób wydobywa wszystkie posiadane przez nie cechy fizyczne. Ale mechanizm aktywnej syntezy dokonuje w danej jednostce czasu tylko jednej analizy. Informacja uzyskiwana przez kanał, na który skierowana jest uwaga, poddawana jest zarówno jednej, jak i drugiej analizie. Ale w przypadku sygnałów przepływających przez kanały nie śledzone uwagą, tylko te cechy poddane zostają pełnej analizie, które są zgodne z oczekiwaniami procesu aktywnej syntezy. System ten może przełączać kanały, jeżeli sygnały nadchodzące z kanału nie śledzonego mają szczególny sens-na przykład może to być imię osoby badanej. A zatem pasywna analiza informacji nieistotnej -analiza osłabiona - wystarcza, aby przyciągnąć uwagę procesu aktywnej syntezy. 10. Struktura pamięci ODPOWIADANIE NA PYTANIA Kiedy należy poszukiwać informacji? Odszukiwanie obrazu Odszukiwanie informacji jako proces rozwiązywania problemów Poszukiwanie i rozumienie DONIOSŁOŚĆ ROZUMIENIA MODEL PAMIĘCI Zapamiętywanie pojęć Pojęcia pierwotne i wtórne Zapamiętywanie zdarzeń 379 Postarajcie się przypomnieć sobie dom, w którym mieszkaliście przed laty: z której strony znajdowała się klamka u drzwi wejściowych - z prawej czy też z lewej strony? Oto pytanie, które zakłada posiadanie pamięci oraz wydobywanie z niej informacji. Jednak w trakcie odpowiadania na nie odkrywamy, że sama sprawa wymaga nie tyle przypomnienia sobie czegoś, ile rozwiązania określonego problemu. W istocie badania procesów przypominania, rozwiązywania problemów, myślenia i operacji myślowych mają wiele elementów wspólnych, gdyż miedzy samymi czynnościami umysłowymi istnieją niewielkie różnice. Człowiek usiłujący intensywnie sobie coś przypomnieć wygląda tak, jak gdyby rozwiązywał jakiś trudny problem. Przede wszystkim dokonuje on analizy samego pytania, aby zadecydować, czy zostało ono właściwie postawione, czy ma on w pamięci potrzebne informacje, a jeżeli tak, to jaką trudność może mu sprawić ich odszukanie. Jeżeli zdecyduje się na próbę przypomnienia sobie potrzebnego materiału, to przystępuje do wypracowania strategii poszukiwawczej. W miarę odnajdywania rozwiązań częściowych konfrontuje je z informacją tkwiącą w zadanym mu pytaniu i w ten sposób formułuje nowe pytania, umożliwiające prowadzenie dalszych poszukiwań. Jego droga poszukiwań opiera się na wydarzeniach ważnych, wyróżniających się, będących czymś w rodzaju drogowskazów w pamięci, które wznoszą się nad tysiącami zapamiętanych szczegółów. I nawet wówczas, gdy uda się odkryć potrzebną informację, wydaje się, że nastąpiło to głównie w wyniku logiki, rekonstrukcji myślowej tego, co właśnie tam powinno było się znajdować. Badanie pamięci długotrwałej jest zarówno badaniem procesu rozwiązywania tego typu problemów, jak i struktury pamięci, w której ten proces zachodzi. Fakty, które przypominamy sobie, zorganizowane są w złożoną strukturę, w której te czy inne zdarzenia i pojęcia powiązane są ze sobą w wyniku uprzedniego doświadczenia. Akt przypominania polega na systematycznym stosowaniu reguł w analizie tych przechowywanych informacji. ODPOWIADANIE NA PYTANIA Prawdopodobnie siła ludzkiej pamięci nigdzie nie ujawnia się tak wyraziście jak w wypadku odpowiadania na pytania dotyczące nagromadzonej wiedzy. Aby znaleźć odpowiedź na pytanie, nie wystarcza posiadanie w pamięci odpowiedniej informacji. Konieczne jest odszukanie całej przechowywanej informacji dotyczącej zadanego pytania, dokonanie oceny ewentualnych sprzeczności i w efekcie zestawienie wszystkich danych tak, aby dojść do najlepszej w zaistniałych warunkach odpowiedzi. Mózg ludzki nie jest jedynym systemem, przed którym pojawia się problem odpowiadania na pytania na podstawie obszernych zasobów informacji. Wiele systemów, poczynając od tradycyjnych bibliotek, a kończąc na nowoczesnych systemach komputerowych, potrafi gromadzić olbrzymie ilości danych. W toku analizy takich systemów jedną z pierwszych rzeczy, jaką odkryto, było to, 380 że wprowadzenie do nich informacji nie stanowi zazwyczaj głównego problemu. Trudności pojawiają się dopiero wówczas, kiedy chcemy tę informację z nich wydobyć. Niezależnie od tego, który z systemów pamięci wzięlibyśmy pod rozwagę-może to być mózg ludzki, katalog fiszek w księgarni, duże archiwum albo też pamięć dużego komputera-istnieją takie typy pytań, do których organizacyjna struktura pamięci (włączając w to odpowiednie indeksy, katalogi czy streszczenia) okazuje się niedostosowana. Niemniej jednak jakiś wszechwiedzący postronny obserwator mógłby w zasadzie twierdzić, że informacja potrzebna do uzyskania odpowiedzi na dane pytanie znajduje się w systemie i użytkownik może ją uzyskać, jeśli uda mu się prawidłowo sformułować pytania, a następnie umiejętnie zestawić otrzymane wyniki. Jak zaprogramować taki system pamięci, który po przezwyciężeniu wszystkich trudności związanych z gromadzeniem informacji rzeczywiście potrafiłby wyszukiwać pożądane informacje? Jakiego typu strategia poszukiwawcza jest tu potrzebna? Jeżeli rodzaj zadawanych pytań znany jest wcześniej, to problem może się okazać nie taki trudny. Na przykład, względnie łatwo można zbudować system spisu ludności, tak aby można było ustalić liczbę ludzi w wieku do 30 lat, jeżeli tylko wiadomo było wcześniej przed zebraniem danych, że informacja tego typu będzie niezbędna. Ale co zrobić z pytaniami, których wcześniej nie przewidywano? Czy można zbudować system przetwarzania danych, podobny do pamięci ludzkiej, który mógłby odpowiadać na każde dowolne pytanie, jakie tylko przyjdzie nam do głowy. A zatem nie pojemność mechaniczna, pozwalająca na przechowywanie ogromnej liczby informacji, stanowi o wartości dużego systemu pamięci. Raczej stanowi o tym jego zdolność odnajdywania na żądanie określonych porcji danych oraz dawania odpowiedzi na pytania odnoszące się do zgromadzonych w nim informacji. Możemy się wiele nauczyć o istocie procesu przetwarzania informacji, który zachodzi w pamięci, bez uciekania się do skomplikowanych badań. Należy po prostu usiąść i pomyśleć o tym, na jakie pytania ludzie potrafią udzielać odpowiedzi, oraz o mechanizmach i procedurach odpowiadania. Kiedy należy poszukiwać informacji? Pytanie: Jaki był numer telefonu Beethovena? Co odpowiecie na to pytanie? Powiecie, że to nonsens. Beethoven zmarł zanim wynaleziono telefon. Przypuśćmy jednak że spytają Was o kogoś, kto mógł mieć telefon? Pytanie: Jaki był numer telefonu Hemingwaya? Znowu odmawiacie odpowiedzi. Po prostu nie znacie tego numeru. Skąd jednak wiecie, że nie znacie tego numeru? A co z następującymi pytaniami: Pytanie: Jaki jest numer telefonu do Białego Domu? 381 Jaki numer telefonu ma Twój najlepszy przyjaciel? Jaki jest Twój numer telefonu? Przykłady te wyraźnie pokazują, że kiedy poprosi się Was o przypomnienie sobie czegoś, to nie rzucacie się na oślep w poszukiwaniu informacji. Po pierwsze, analizujecie pytanie, aby zdecydować, czy w ogóle można na nie udzielić odpowiedzi. Po tej analizie wstępnej możecie dojść do wniosku, że byłoby w ogóle bezsensowne zawracanie sobie tym głowy. Może się okazać, że wymagana informacja w ogóle nie istnieje. Może też być tak, że informacja istnieje, ale wiecie o tym, że nie znajdziecie jej we własnej pamięci. Jaka jednak informacja jest potrzebna, abyście doszli do przekonania, że nie znacie numeru Hemingwaya, jeżeli nawet miał on telefon? Sądzicie chyba, że możliwe byłoby zdobycie tej informacji, jednakże wymagałoby to zbyt wiele wysiłku i starań. Czy jesteście całkowicie przekonani, że przy odrobinie wysiłku nie udałoby się zdobyć numeru telefonu Białego Domu? [Telefon Białego Domu ma numer (202) 456-1414.] Kiedy zastanowimy się nad pamięcią ludzką, odkrywamy, że występują w niej specjalne procedury analizujące przekaz ze względu na istnienie w ogóle odpowiedniej informacji, na prawdopodobieństwo jej obecności w pamięci, na wysiłek potrzebny do jej znalezienia i na szansę powodzenia całej próby. Ta sekwencja operacji najwidoczniej przebiega w naszym mózgu szybko i nieświadomie. Mamy jedynie niejasne odczucie złożoności związanych z tym reguł. Bezspornie, tego rodzaju system organizacji jest niezmiernie użyteczny dla dużego systemu pamięci. Dzięki temu nie traci on czasu na poszukiwanie tego, czego i tak nie wie. Może on również ocenić koszt poszukiwania informacji, którą trudno jest uzyskać. Zobaczymy dalej, że człowiek w sytuacji ciągłego bombardowania przez informacje sensoryczne musi dokładnie wiedzieć, jaka informacja jest mu nieznana, ponieważ pozwala mu to skoncentrować się na nowych, ważnych, unikalnych aspektach zdarzeń zachodzących w otoczeniu. Procedur poprzedzających proces przetwarzania informacji nie potrafimy jeszcze określić z taką precyzją, aby pozwalało to nam posłużyć się nimi przy konstruowaniu systemu wydobywania informacji. Wiemy, że mechanizmy takie działają w ludzkiej pamięci. Jesteśmy w stanie określić niektóre z nich i w ogólnych zarysach przedstawić ich główne właściwości. Jednak w szczegółach nie potrafimy jeszcze opisać mechanizmu tych procesów. Odszukiwanie obrazu Pytanie: Ile jest okien w Twoim mieszkaniu? Tym razem poszukiwania idą łatwo. Możecie wyobrazić sobie każde pomieszczenie i kolejno policzyć okna: najpierw w jednym, potem w drugim i tak dalej aż do końca. 382 Zadanie to wydaje się łatwe. Jednakże oprócz samego faktu, że ludzie pamiętają obrazy i posługują się nimi, wiemy bardzo mało o naturze tych obrazów wewnętrznych, jak są przechowywane albo jak odszukiwane. Tak czy inaczej nie ulega wątpliwości, że pamięć nasza potrafi przechowywać znaczną liczbę obrazów z naszego przeszłego doświadczenia. Człowiek może wydobywać i poddawać analizie różne obrazy: twarz przyjaciela, sceny z ostatniej wycieczki, doświadczenia związane z nauką jazdy na rowerze. Ten zapis doświadczeń wzrokowych wskazuje na pewne zasady ważne dla analizy strategii odszukiwania. Zachowanie pewnego rodzaju kopii informacji pierwotnej zapewnia w następstwie dużą elastyczność operacji poszukiwania odpowiedzi na pytania dotyczące naszych doświadczeń. Jest rzeczą mało prawdopodobną, abyście myśleli o tym, że pewnego dnia zostaniecie zapytani o ilość okien w swoim mieszkaniu. I oczywiście nie ma potrzeby, byście zajmowali się liczeniem okien za każdym razem, kiedy znajdujecie się w tym czy innym pokoju. Tak długo, jak długo w pamięci zachowane są obrazy wszystkich pomieszczeń, nie trzeba się martwić o odszukanie w przyszłości dowolnej informacji o nich. Nie zawsze jednak wszystko to, co widzimy, zapamiętujemy w całej pełni. Często analizujemy i kondensujemy napływającą informację, odrzucając nieistotne szczegóły, a zapamiętując tylko to, co wydaje się ważne. Spróbujcie odtworzyć wszystko to, co zostało do tej pory powiedziane w niniejszym rozdziale. Nie potraficie wyczarować obrazu poszczególnych stron i odczytać z nich określonych słów. Przypominacie sobie jedynie wysoce abstrakcyjną wersję własnego doświadczenia wzrokowego, przeorganizowanego i przedstawionego własnymi słowami. A zatem adekwatny model ludzkiej pamięci powinien wyjaśniać, w jakich warunkach przeżywane przez nas zdarzenia są zapamiętywane w całości, a w jakich wyodrębniamy i zapamiętujemy jedynie pewne cechy istotne. Zapis kopii wrażeń wzrokowych potrzebuje znacznego miejsca w pamięci, przedłuża i komplikuje poszukiwania i może doprowadzić do zaśmiecenia pamięci nieistotnymi szczegółami. Z drugiej zaś strony, reorganizacja i kondensacja informacji oraz zapamiętywanie wyłącznie ich głównych cech może spowodować zwiększenie ryzyka tego, że informacja, która w konsekwencji może okazać się ważna, nie zostanie zarejestrowana. Ogranicza to zakres i różnorodność sposobów posługiwania się przez nas uprzednim doświadczeniem oraz pytań, na które potrafimy odpowiedzieć. Możliwe, że najlepiej byłoby przechowywać zarówno pełny zapis informacji, jak i jej przekształconą, skondensowaną wersję. Nie jest wykluczone, że istnieją jeszcze bardziej wyrafinowane sposoby posługiwania się danymi wyuczonymi na pamięć. Czy istnieją ogólne reguły zapisu i odtwarzania obrazów, które upraszczając proces zapamiętywania nie powodują równocześnie utraty szczegółów? Poza wszystkim domy mają wiele rzeczy wspólnych, chociażby dachy i ściany. Być może, system ludzkiej pamięci wykorzystuje te podobieństwa. Niezależnie jednak od tego, jak informacja wzrokowa jest rzeczywiście zapamiętywana, ważne jest, abyśmy dysponowali zarówno jakimś obrazem naszych pokoi, jak i procedurą pozwalającą policzyć okna. W procesie wydobywania informacji mechanizmy te współdziałają w określony sposób: jeden wydobywa i tworzy obraz, drugi zaś analizuje i przetwarza uzyskaną informację. Zupełnie tak, jak w czasie rozwiązywania problemów, 383 wydobywanie informacji wymaga aktywnej konstrukcji i analizy informacji na podstawie określonych reguł i procedur. Konstruktywny aspekt ludzkiej pamięci jawi się nam w całej pełni wówczas, gdy system musi odpowiedzieć na jeszcze inny rodzaj pytań. Odszukiwanie informacji jako proces rozwiązywania problemów Pytanie: Gdzie byłeś w poniedziałek po południu w trzecim tygodniu września dwa lata temu? Nie zniechęcajcie się od razu. Zastanówcie się chwilę, może uda wam się znaleźć odpowiedź na to pytanie. Spróbujcie zanotować myśli, które przychodzą wam do głowy w trakcie poszukiwania informacji. A jeszcze lepiej, zadajcie to pytanie przyjacielowi i poproście, aby myślał na głos. Typowe odpowiedzi ludzi mogą wyglądać jak przytoczony poniżej protokół. 1. Coś takiego. Skąd mam to wiedzieć? (Eksperymentator: „Proszę jednak spróbować".) 2. W porządku, Zobaczymy. Dwa lata temu... 3. Mogłem być w szkole średniej w Pittsburgu... 4. Tak, to był mój ostatni rok w szkole. 5. Trzeci tydzień września-zaraz po wakacjach-to było w pierwszym półroczu... 6. Zaraz. Zdaje mi się, że w poniedziałki mieliśmy ćwiczenia z chemii... 7. Nie wiem. Prawdopodobnie byłem w laboratorium chemicznym... 8. Jedną chwilkę, to był drugi tydzień zajęć w szkole, Przypominam sobie, że on zaczął od tablicy atomów-tak duża dziwna tablica. Pomyślałem wtedy- niepoważny facet, chce, abyśmy to zapamiętali. 9. Już wiem, chyba przypomniałem sobie: siedziałem... Chociaż protokół ten został sfabrykowany, to jednak daje on określone wyobrażenie o tym, jak pracuje system pamięci, kiedy stawia mu się problem podobnego typu. Przede wszystkim pojawia się pytanie, czy należy, czy też nie, zabierać się do poszukiwań: analiza wstępna wskazuje na to, że trudno będzie uzyskać potrzebną informację lub też okaże się to niemożliwe i badany zdecydowanie odmawia podjęcia jakichkolwiek prób (krok 1). Kiedy jednak zaczyna poszukiwania, nie stara się odtworzyć informacji od razu. Rozbija ogólne pytanie na pytania cząstkowe. Początkowo stara się ustalić, co robił przed dwoma laty (krok 2). Jak tylko udaje mu się rozwiązać tę kwestię (krok 3), wykorzystuje zdobytą informację do postawienia nowych, bardziej konkretnych pytań (krok 4). Wykorzystawszy już pierwszą wskazówkę „dwa lata temu", zajmuje się podstawowym elementem postawionego pytania „trzeci tydzień września". Teraz przychodzą mu do głowy bardziej konkretne wspomnienia (kroki 5 i 6). Większa część tego, co zachodziło w pamięci między zdaniami 7 i 8, nie została zarejestrowana w protokole. Osoba badana najwyraźniej znalazła się w impasie (krok 7); nie ulega jednak wątpliwości, że badany kontynuował poszukiwania w różnych kierunkach 384 stosując nowe strategie poszukiwawcze. Studiowanie tablicy pierwiastków, jak widać, było ważnym wydarzeniem w jego życiu. Odszukanie tej informacji niewątpliwie pozwoliło mu znaleźć nowe drogi do uzyskania odpowiedzi. W kroku 8 najwyraźniej gotów jest ponownie przystąpić do odtworzenia tego, czym zajmował się dwa lata temu w poniedziałek po południu. W przykładzie tym pamięć jawi się nam jako zbiór zhierarchizowanych pytań i odpowiedzi. Poszukiwania mają aktywny, twórczy charakter. Jeżeli nie można iść bezpośrednio do celu, pamięć rozkłada problem na szereg podproblemow lub podcelów. Dla każdego podproblemu pytanie brzmi następująco: Czy można je rozwinąć, na ile przybliży mnie to do wyznaczonego celu? Jak tylko zostanie rozwiązany podproblem, pojawiają się nowe i poszukiwania trwają nadal. W przypadku osiągnięcia powodzenia, system daje w końcu odpowiedź, jednak odpowiedź tę z trudem tylko można by tu nazwać prostym przypomnieniem. Jest ona mieszaniną logicznej rekonstrukcji tego, co powinno być, z fragmentarycznymi odtworzeniami tego, czego rzeczywiście doświadczono. Przekonanie o tym, że pamięć jest procesem rozwiązywania problemów, nie jest nowe. Podobny pogląd głosili na przestrzeni tysiącleci poeci i filozofowie. Jeśli chodzi o psychologów, to pierwsze przekonywające dowody popierające ten punkt widzenia przedstawili William James (1890) oraz Frederick Bartlett (1932). Nowym elementem jest fakt, że dysponujemy dziś pewnymi narzędziami analitycznymi pozwalającymi na szczegółowe badanie podobnych procesów. Istnieją obecnie metody konstruowania i badania modeli pamięci, które mają tę właściwość, że rozwiązują problem poprzez rozbijanie głównego pytania na pytania szczegółowe i próbują zbliżyć się do rozwiązania przez wielokrotne przeformułowywanie i analizę pytań cząstkowych. Poszukiwanie i rozumienie Pytanie: Czy gołębie mogą prowadzić samoloty? Na to pytanie szybko znajdziecie odpowiedź. Jeżeli, jak sądzimy, odpowiedź będzie przecząca, to następne pytanie - oczywiście - brzmi: dlaczego? Czy gołąb z zasady nie może prowadzić samolotu? W tym wypadku problem nie sprowadza się ani do analizy obrazów wzrokowych, ani też do wstępnego opracowania przekazu czy ustalenia strategii poszukiwawczej w celu uzyskania określonej informacji. Co więcej, odpowiedź na takie pytanie w naszym wypadku nie może być zwykłym przypomnieniem. Jest mało prawdopodobne, abyście kiedykolwiek myśleli o konkretnej możliwości prowadzenia samolotu przez gołębie. Również jest mało prawdopodobne, że w Waszej pamięci jako część informacji skojarzonej z gołębiem znajdziecie zapis informacyjny o tym, że gołębie nie prowadzą samolotów. Tak czy inaczej, odpowiedź, jakiej udzieliliście, jest wynikiem logicznej analizy informacji dotyczącej obu pojęć. Ale macie jedynie mglistą świadomość analizy, jaką przeprowadziliście udzielając pierwszej impulsywnej odpowiedzi. 385 W konsekwencji musicie zdobyć się na pewien wysiłek, aby rozstrzygnąć, dlaczego właśnie gołębie nie mogą prowadzić samolotów. Po zastanowieniu się możecie nawet zmienić swój pierwotny werdykt: być może gołąb (po pewnych modyfikacjach gołębia lub samolotu) mimo wszystko potrafi prowadzić samolot. [Kiedy pytanie to zostało postawione 8-letniej córce jednego z autorów tej książki, jej pierwszą reakcją był śmiech z tej wyraźnie niedorzecznej myśli. Następną reakcją było jednak zastanowienie się, że może to nie jest takie głupie, skoro zarówno gołębie, jak i samoloty latają.] Żaden system gromadzenia danych, z wyjątkiem mózgu ludzkiego, nie jest zdolny do odpowiedzi na pytanie tego typu. Człowiek jednak, nie zastanawiając się analizuje napływającą informację, sprawdzając jej zgodność ze swym dotychczasowym doświadczeniem, aby stwierdzić, czy da się ona wyjaśnić w znanych mu terminach. Zachowanie takie wskazuje na to, że pamięć ludzka nie może być przypadkowym zbiorem faktów. Przeciwnie, informacja w pamięci musi być w wysokim stopniu powiązana i ustrukturalizowana, tak aby można było łatwo porównać ze sobą pojęcia dla wyrobienia sobie sądu o ich podobieństwie lub też różnicach. Nawet więcej, porównywanie takie występuje na różnych poziomach. W pierwszym etapie analizy coś nam sugeruje natychmiastową odpowiedź, że pojęcia „gołąb" i „prowadzenie samolotu" są niespójne logicznie. Drugi etap wymaga znacznie szerszej analizy, wyraźnie podobnej do procedur rozwiązywania problemu, o których wspominaliśmy uprzednio. Pytanie cząstkowe brzmi: Co jest potrzebne, aby gołąb stał się pilotem? - I przechowywana informacja jest oceniana ponownie z perspektywy tego postawionego w nowy sposób pytania. To ostatnie pytanie prowadzi nas do kluczowej kwestii badań nad pamięcią: zdolności rozumienia. Tak czy owak ludzie rozumieją znaczenie napływających informacji i posługują się tym rozumieniem w ocenie aktualnego doświadczenia z punktu widzenia ich uprzedniej wiedzy. Dowolny model pamięci musi uwzględniać ten podstawowy aspekt pamięci długotrwałej u ludzi. DONIOSŁOŚĆ ROZUMIENIA Rozumienie to proces dość iluzoryczny. Cóż w istocie znaczy zrozumieć to czy inne słowo? Jak można zorientować się po objawach zewnętrznych, czy człowiek lub maszyna rozumie to, co się do nich mówi? Jeśli sądzicie, że możecie odpowiedzieć na to pytanie, to radzimy Wam zapoznać się z dwoma kolejnymi dialogami; uzyskano je od dwu różnych modeli pamięci występujących w tym wypadku w postaci programów komputerowych. Pierwszy to dialog między osobą a programem komputera nazwanym DOKTOR, symulującym zachowanie psychiatry. W procesie porozumiewania się z DOKTOREM człowiek może wprowadzić do komputera dowolne teksty dzięki maszynie do pisania z klawiszami oznaczonymi literami. Drugi program steruje robotem, który potrafi manipulować plastykowymi klockami leżącymi na stole. 386 Rysunek 10-1 jest zapisem dialogu człowieka z komputerem. Komputer pełni rolę psychiatry. Pierwsze zdanie to wypowiedź człowieka, następne to pytanie komputera, kolejne to odpowiedź człowieka i tak kolejno. Zdania formułowane przez komputer oznaczono literą K. Wszyscy mężczyźni są podobni. K - W jaki sposób? Ciągle czepiają się czegoś tam. K - Proszę podać przykład. Dobrze, mój przyjaciel przyprowadził mnie tu. K - Przyjaciel przyprowadził panią tutaj? On mówi, że ciągle mam stan depresyjny. K - Przykro mi, że pani ma depresję. To prawda. Taka jestem nieszczęśliwa. K - Sądzi pani, że wizyta ta pozwoli pani nie być nieszczęśliwą? Potrzebuję pomocy, to jest niewątpliwe. K - Czego pani oczekuje w ramach tej pomocy? Być może nauczyłabym się postępować z mamą. K - Proszę mi powiedzieć coś więcej o swojej rodzinie. Mieszkam z mamą. K - A kto jeszcze z wami mieszka? Mój ojciec. K - Pani ojciec? Pan mi w czymś przypomina mojego ojca. K - Jakie podobieństwo pani widzi? Nie jest pan zbyt agresywny, ale myślę, że pan to ukrywa przede mną. K - Dlaczego pani myśli, że jestem mało agresywny? Pan się ze mną nie spiera. K - Jak pani sądzi, dlaczego nie kłócę się z panią? Bo pan się może obawia. K - Czy pani sprawia przyjemność to, że boję się pani? Mój ojciec boi się wszystkiego. K - Co jeszcze przychodzi pani do głowy, gdy myśli pani o ojcu? Tchórze. K - Czy ma to jakiś związek z tym, że przyjaciel przyprowadził panią tutaj? RYSUNEK 10-2. Zapis rozmowy człowieka z komputerem, gdzie komputer steruje robotem który potrafi układać klocki leżące na stole. Dialog zaczyna człowiek, potem „mówi” komputer itd. Zdania formułowane przez komputer oznaczono literą K. Proszę postawić jeden na drugi oba czerwone klocki i jeszcze czerwony sześcian lub piramidkę. K - W porządku. Jaki sześcian leży teraz na stole? K - Duży zielony, a na nim czerwona piramidka. Czy z tyłu za piramidką leży jakiś większy klocek? K - Tak, aż trzy: duży czerwony klocek, duży zielony sześcian i niebieski klocek. Proszę postawić teraz mały klocek na zielony sześcian, na którym stoi piramidka. K - W porządku. Teraz proszę postawić na wierzchu najmniejszą piramidkę. K - W porządku. Czy stoi coś zielonego na najmniejszym z przedmiotów stojących na tym samym przedmiocie co najwyższa piramidka? K - Tak, zielona piramidka. Jaki to ma kolor? K - Przez „to", jak sądzę, rozumie pan najmniejszy z przedmiotów stojący na tym samym przedmiocie, na którym stoi najwyższa piramidka? Jeżeli tak, to jest on czerwony. Ile przedmiotów znajduje się teraz nad zielonymi sześcianami? K - Nie jestem całkiem pewien, co oznacza „nad" w zdaniu „nad zielonymi sześcianami". Czy pan ma na myśli: 1 — Bezpośrednio na powierzchni? 2 — Gdziekolwiek powyżej niej? Gdziekolwiek powyżej niej. K - Trzy. Czy dotykałeś jakiejś piramidki przed położeniem zielonej piramidki na małym sześcianie? K - Tak, zielonej. Kiedy to było? K - Wtedy, kiedy stawiałem jeden na drugim: czerwony sześcian, duży czerwony klocek i zielony sześcian. Po co? K - Aby ją stamtąd zabrać. Po co było ci to potrzebne? K - Aby uwolnić czerwony sześcian. Po co uwalniałeś ten sześcian? K - Aby móc go położyć na dużym zielonym sześcianie. Po co to zrobiłeś? K - Aby postawić jeden na drugim: czerwony sześcian, duży czerwony klocek i duży zielony sześcian. A dlaczego to zrobiłeś? K - Ponieważ o to mnie prosiłeś. Jak to zrobiłeś? K - Położyłem duży czerwony klocek na stole, następnie pozostawiłem go tam, następnie położyłem na nim duży zielony sześcian, następnie pozostawiłem ten sześcian, następnie położyłem na ten sześcian czerwony sześcian, następnie pozostawiłem tam ten sześcian. Ilu przedmiotów dotykałeś w czasie tej pracy? K - Czterech. Co leżało na czerwonym sześcianie, przed tym nim go wyjąłeś? K - Zielona piramidka. A zatem w tym czasie na lewo od pudełka leżało pięć przedmiotów? K - Nie, tylko cztery: czerwony sześcian, dwa duże zielone sześciany i duży czerwony klocek. Dziękuję. K - Bardzo proszę! Zapoznajcie się z tymi dialogami. Jak sądzicie, czy komputer rozumie to, co do niego mówią ludzie? Program symulujący wywiad psychiatryczny najzwyczajniej oszukuje. Nie ma najmniejszego pojęcia ani o przyjaciołach, ani o tym, co to znaczy „być w stanie depresyjnym" czy w stanie agresji. Niemniej jednak może on robić wrażenie na zwykłym obserwatorze. Drugi program posiada pewien zasób wiedzy dotyczącej klocków i języka. Ale czy na pewno rozumie terminy, których używa tak samo, jak rozmawiający z nim człowiek? Jak to można sprawdzić? Podobnie jak w procesach percepcyjnych, procesy związane ze zrozumieniem przekazu przebiegają tak szybko i automatycznie, że uświadamiamy je sobie dopiero w wypadku ich wyraźnego zaburzenia. I właśnie dlatego, podobnie jak w przypadku procesów spostrzegania, istotę procesów pamięci możemy badać na takich przekazach, z którymi odpowiednie mechanizmy nie dają sobie łatwo rady. Na przykład zastanówmy się nad następującym stwierdzeniem: Oranz minsoki tankin rakany. Możecie przeczytać każde słowo. Niemniej jednak natychmiast odrzucicie to stwierdzenie jako bezsensowne. Oczywiście, macie rację: to bezsens. Skąd jednak o tym wiecie? Czy rzeczywiście sprawdziliście wszystkie słowa, jakie napotkaliście w ciągu wielu lat posługiwania się językiem, tak aby być rzeczywiście pewnym, że wyrazu minsoki nigdy nie napotkaliście? Jeśli tak, to dokonaliście tego bardzo szybko - przecież człowiek poznaje w toku swego życia średnio około 50 000 różnych słów. Cóż jednak pozwala nam sądzić, że takie sprawdzenie nawet nie jest konieczne? Rozpoznajecie od razu te wyrazy jako nowe, a całe wyrażenie jako bezsensowne z punktu widzenia waszego dotychczasowego doświadczenia. Ale jak zbudować system pamięci zdolny do tak szybkiego określenia tego, co nie jest mu znane? A co powiecie o tym stwierdzeniu? Te minsoki to rakany. Tym razem prawdopodobnie będziecie skłonni przyjąć, że tekst ten ma jednak jakieś znaczenie. Nadal nie wiecie, co to są minsoki lub rakany, i uświadamiacie to sobie. Niemniej jednak stwierdzenie to traktujecie inaczej niż poprzednie. Możliwe, iż uda się Wam dowiedzieć czegoś o minsokach i dodacie to nowe słowo do waszego słownika. Może minsoki to słowo warte zapamiętania? Odnotujcie, że sam fakt niezrozumienia słowa i niemożności interpretowania go za pomocą nabytego doświadczenia nie przeszkadza we wprowadzeniu tego słowa do pamięci i przechowywania w niej przez dłuższy czas. Jeśli po dwustu stronach tego tekstu zapytamy Was ponownie, co tą są minsoki, to prawdopodbnie będziecie mogli przypomnieć sobie, że są to rakany, chociaż nie znacie znaczenia obu tych słów. 390 Model, jaki mamy zbudować, musi zatem posiadać zdolność decydowania, jakie rzeczy będą potencjalnie użyteczne i wymagają zapamiętania, jeśli nawet nigdy się z nimi nie stykał i nie rozumie ich. Często całkowicie sensowne stwierdzenia wymagają od naszej pamięci złożonego wysiłku: Ci autorzy są faszystami. Chociaż wszystkie wyrazy mają tu sens, to jednak odbiór tego przekazu nie zachodzi czysto automatycznie i biernie. Jeśli traktujecie to sformułowanie serio, to przetworzenie go w umyśle wymaga odszukania i ocenienia ogromnej ilości informacji: o jakich autorach jest mowa, jacy autorzy znani są zarówno nam, jak i Wam, którzy ze znanych Wam autorów są faszystami? Być może, mówimy sami o sobie. W takim razie jest możliwe, że powinniście prześledzić przeczytaną już część książki, aby ustalić, czy są w niej teksty sugerujące, że jesteśmy faszystami. Ale jak rozpoznać, czy jakieś stwierdzenie jest faszystowskie. Tak czy owak, niezależnie od rozwiązania tego problemu w tej chwili, będziecie wyczuleni na tego typu stwierdzenia w trakcie dalszego czytania tego tekstu. Znowu pojawia się tu pytanie, jak zbudować taki system pamięci, który wiedziałby, jakie aspekty z tej ogromnej sumy danych przechowywanych w pamięci ważne są dla danego przekazu napływającego na wejściu? System taki ponadto powinien posiadać zdolność do szybkiego odszukania właśnie tej informacji, która jest niezbędna dla oceny komunikatu, a nawet, kiedy przekaz zostanie odrzucony, system powinien mieć możliwość wykorzystania go w przyszłości podczas interpretowania nowych zdarzeń. I na koniec, jak odniesiecie się do takiej prośby: Powiedz mi wszystko to, co myślisz o autorach. Tu otwierają się przed Wami nieograniczone możliwości. Możecie mówić w nieskończoność pozostając w granicach wiedzy, jaką posiadacie. Możecie zacząć od omówienia autorów ogólnie, potem możecie przejść do autorów, których znacie, następnie do ich prac, omówić ich dzieła w kontekście własnych doświadczeń itd. Całkiem prawdopodobne, iż uda się Wam uniknąć powtórzeń, mimo że, poczynając od pewnego momentu, zapamiętywanie tego, co zostało już powiedziane, wymaga z pewnością ogromnego wysiłku pamięci. Potrzebny jest nam taki system pamięci, w którym wszystkie informacje są jak najrozleglej powiązane z wszystkimi innymi informacjami, gdzie nowe związki wiążące stare pojęcia można łatwo odnaleźć. Teraz zaczynacie dostrzegać całą złożoność wymagań, jakie stawiamy przed rzeczywistym modelem pamięci ludzkiej. Przedstawione przykłady ukazują nam decydującą różnicę między pamięcią, która pasywnie rejestruje to, co do niej dociera, a taką pamięcią, która aktywnie analizuje i interpretuje napływające informacje. Takie właśnie zagadnienia stają przed nami, kiedy próbujemy zarysować wiarygodny model pamięci ludzkiej. Model ten musi być zdolny do posługiwania się strukturą pojęć w celu zinterpretowania odbieranej informacji 391 oraz do porównywania napływających przekazów z tym, co jest mu wiadome, wreszcie do oceny wiarygodności tego czy innego przekazu z punktu widzenia własnego doświadczenia. Po tym wszystkim możemy zabrać się wreszcie do zbudowania modelu, który posiadałby te podstawowe właściwości pamięci ludzkiej. MODEL PAMIĘCI Do tej pory mówiliśmy o generalnych zasadach, a nie o specyficznych modelach. Postaramy się teraz przekształcić te ogólne zasady w konkretny model. Spróbujemy zatem zbudować system pamięci, który będzie miał pewne właściwości pamięci ludzkiej. Budując taki model należy poczynić jedno ważne rozróżnienie. Pamięć składa się w rzeczywistości z dwu części jednakowo ważnych. Pierwsza- bank danych (data base), to ta część systemu pamięci, w której informacje są przechowywane. Bank danych musi być zdolny do zakodowania i przechowywania pojęć i zdarzeń, a także całej złożonej sieci powiązań wzajemnych między nimi, czyli całego materiału pamięci ludzkiej. Pierwsze zadanie, jakie przed nami stoi, to wypracowanie reguł dla banku danych, zajmiemy się tym w następnym paragrafie. Druga część pamięci to proces interpretacji danych, system, który posługuje się informacjami nagromadzonymi w banku danych. Od niego zależy ocena napływającej informacji, zapamiętywanie nowych danych, odpowiedzi na pytania i poszukiwanie informacji potrzebnej do tego, aby rozwiązywać problemy, mówić, myśleć oraz kierować codziennymi czynnościami. Badaniom nad tym procesem interpretacyjnym będzie poświęcony następny rozdział. Zapamiętywanie pojęć Pamięć ludzka zawiera olbrzymią liczbę różnorodnych pojęć, które mogą być wydobywane z niej i wykorzystywane. Ludzie posiadają pojęcia o domach, psach, samochodach, komunistach i zuchach. W większości wypadków, chociaż nie zawsze, do pojęć dołączone są etykietki, czyli nazwy, takie jak w przedstawionych przykładach. W uzupełnieniu do etykietki w razie potrzeby można wydobyć z pamięci znaczną liczbę informacji związanych z danym pojęciem. Tak więc pierwsze nasze zadanie polegać będzie na ustaleniu, jak powinny być reprezentowane pojęcia w systemie pamięci. Pomyślmy sobie jakieś słowo, powiedzmy, że będzie to imbryk. Poproście kogoś z przyjaciół, aby wyjaśnił Wam albo też głośno powiedźcie sami sobie, co znaczy to słowo. Jaki rodzaj informacji zostanie przez Was wykorzystany do opisania tego znaczenia? Typowe wyjaśnienie wygląda na przykład tak: 392 Imbryk (teapot) rz. Pojemnik czasem przypominający czajnik, zrobiony z metalu lub porcelany (The Golden Book Illustrated Dictionary for Children). Albo też: Imbryk (teapot) rz. Pojemnik z uszkiem lub dzióbkiem do przygotowywania herbaty (The Thorndike Bernahardt Comprehensive Desk Dictionary). Podobnie o innych słowach, takich jak: gobelin, ciastko owocowe i tawerna, słownik powie Wam gobelin to tkanina dekoracyjna, jednostronna, naśladująca malowidło, tkana z cienkiej nici wełnianej lub jedwabnej; ciastko owocowe to niewielki kawałek słodkiego upieczonego ciasta, przekładany lub przybrany owocami; tawerna to miejsce, gdzie podają piwo, wino oraz inne trunki. Przykłady te przypominają nam o tym, że definicja wyrazu zawiera inne wyrazy. Zazwyczaj definicja zaczyna się od tego, że mówi nam „Pojęcie A jest w rzeczywistości niczym innym jak pojęciem B"; gobelin to tkanina dekoracyjna, ciastko owocowe to kawałek ciasta. Następnie definicja koncentruje się na ograniczeniach dotyczących pojęcia A. Specyficzną cechą tawerny jest to, że sprzedaje się w niej piwo i wino. Wyróżniająca cecha gobelinu to utkany obraz, który jest na nim przedstawiony. Imbryk ma uszko i dzióbek oraz służy do parzenia herbaty. Innym rodzajem informacji, często wykorzystywanym do wyjaśniania pojęć, jest przykład. Jeżeli chcielibyście wyjaśnić koledze, co to jest tawerna, prawdopodobnie przytoczylibyście właściwe przykłady. Kiedy szukamy w słowniku wyjaśnienia dla wyrazu miejsce, zazwyczaj znajdujemy same przykłady. Miejsce, rz. miasto, miasteczko lub obszar. (Zauważcie, że słownik nie wymienia tawerny jako przykładu dla słowa miejsce). Podobnie, Pojemnik, rz. przedmiot, który zazwyczaj służy do przechowywania cieczy, na przykład puszka, baryłka, bańka czy dzbanek. Okazuje się zatem, że jeśli osoba lub słownik pytane są o znaczenie jakichś słów, zawsze otrzymujemy w odpowiedzi inne słowa. Jak widać, jednak nie niepokoi nas to zbytnio. Ta mistyfikacja wyjdzie na jaw dopiero wówczas, gdy będziemy obstawać przy wyjaśnianiu tych wyrazów, które były używane do definiowania innych wyrazów. Jeżeli weźmiecie Oxford Dictionary, aby znaleźć definicję wyrazu syn, a po odszukaniu jej zechcecie wyjaśnić użyte w niej wyrazy, i tak dalej, to znajdziecie się w skomplikowanym labiryncie, który ostatecznie wprowadzi was w ślepy zaułek. Wpadniecie w błędne koło odkrywając, że dziecko definiowane jest jako potomek, a potomek określany jest jako dziecko. 394 W ten sposób ważna część znaczenia tego czy innego pojęcia zasadza się na jego związkach pamięciowych z innymi pojęciami. Badanie struktury typowych definicji prowadzi do wniosku, że kilka z tych związków pełni dominującą rolę, są to: klasa pojęć, do której należy dane pojęcie, właściwości, wyróżniające je spośród pozostałych pojęć tej samej klasy, i w końcu przykłady danego pojęcia. Standardowa definicja pojęcia przedstawiona została schematycznie na rysunku 10-3. [Schemat wygląda następująco: omawiane jest jakieś pojęcie, dla którego określa się klasę, właściwości i podaje przykład –na schemacie puste miejsca. Jeśli wypełnimy puste klatki tego schematu uwzględniając niektóre z omawianych definicji, to otrzymamy kolejne schematy (z rysunku 10-4). Rysunek 10-4 Przykład 1: Pojęcie – Ciastko; klasa – Wyroby cukiernicze; właściwość - Małe, pieczone, krem, owoce; przykład - Eklerki, markizy Przykład 2: Pojecie – Imbryk; klasa – Pojemnik; właściwość – Metal, porcelana, dzióbek; przykład – Czajniczek Ponieważ słowa wykorzystane do definicji same stanowią określone pojęcia, mają więc i one swoje definicje. W rezultacie wyłania się struktura z różnorodnymi powiązaniami, która nie jest widoczna podczas definiowania, ale staje się wyraźnie oczywista, jeżeli zostanie przedstawiona w postaci graficznej (rys. 10-5). [Na schemacie 10-5 połączono strzałkami opisanymi jako: klasa, właściwość, przykład następujące słowa: Zakład, Tawerna, Miejsce, Interes, Drogeria, Piwo, Wino, Napój, Fermentujące ziarno, Fermentujące owoce, Lager, Cabernet sauvignon, U Luigiego, Hałaśliwy. Wzajemne połączenia wyrazów są liczne i niejednoznaczne. Przykładowo Zakład jest klasą dla Drogerii i przykładem dla Miejsca. Równocześnie Drogeria jest przykładem dla Zakładu. Piwo i Wino jest przykładem dla Napoju, a Napój jest klasą dla Wina. itd.] Aby przedstawić związki pojęć w pamięci, posłużymy się w schematach dwoma rodzajami elementów: prostokątami i strzałkami. [Słowa wpisane w prostokąty, lub nie otoczone ramką, ale znajdujące się bezpośrednio za strzałką, pisane są zawsze z wielkiej litery. Słowa opisujące znaczenie strzałek, umieszczone zazwyczaj nad strzałkami lub obok nich pisane są zawsze z małej litery] Prostokąty przedstawiają pojęcia. Strzałki, co jest istotne, charakteryzują się dwiema ważnymi właściwościami. Po pierwsze, mają kierunek. Ich końcówki wskazują określony kierunek. Możemy poruszać się w kierunku odwrotnym od wskazywanego, ale wówczas znaczenie się zmienia. Po drugie, przypisane są im określone nazwy: do tej pory wymieniliśmy trzy rodzaje nazw: właściwość, przykład i klasa. Oczywiście, jeżeli zechcemy przedstawić coś bardziej złożonego w systemie pamięci niż konkretne rzeczowniki, 395 to przedstawione tu związki nie wystarczą nam. Pierwszym krokiem w rozbudowaniu naszego systemu powinna być taka zmiana nazw ukierunkowanych strzałek, która zapewniałaby możliwość przedstawienia prawie każdej czynności lub związku, jakie mogą się zdarzyć. Nie jest to trudne. Po pierwsze, należy zamienić strzałkę klasa na strzałkę z napisem jesto (isd). Jesto będzie złożonym słowem, zbudowanym z dwu oddzielnych wyrazów jest i to. Strzałka jesto zawsze łączy się z określonym przedmiotem, na przykład John jesto człowiek. Po drugie, zamiast strzałki właściwość wprowadźmy dwa czasowniki: ma i jest. Ma używane jest głównie w takich wypadkach, kiedy właściwości są przedmiotami: zwierzę ma łapy. Jest natomiast stosowane będzie przede wszystkim wtedy, kiedy właściwość ma charakter jakościowy, na przykład John jest głodny lub Rover jest tłusty (Nie można mylić wyrazów jesto i jest, gdyż są one całkowicie różne). I na koniec zauważcie, że przykłady prawie zawsze odnoszą się do nazw klas. Strzałki z nazwami klasa i przykład łączą te same prostokąty, ale idą w przeciwnych kierunkach. Tak więc, jeżeli klasa tawerna odnosi się do klasy zakład, to przykładem zakładów będzie tawerna. Dlatego nie ma potrzeby komplikować schematu przez wprowadzenie oddzielnej strzałki, przykład. Zakładamy po prostu, że przykład przedstawiony jest na naszych schematach strzałkami klasa i jesto, ale biegnących w kierunku odwrotnym. Tak więc: klasa jesto Jak w zdaniu: John jesto człowiek. właściwość ma Jak w zdaniu: Zwierzę ma łapy właściwość jest Jak w zdaniu: John jest wysoki. przykład jesto Jak w zdaniu: John jesto człowiek w kierunku odwrotnym Uwzględniając te zmiany, definicję wyrazu tawerna możemy przedstawić tak jak na rysunku 10-6. [Tawerna jesto Zakład, ma Piwo, ma Wino, Zakład ma Interes, Tawerna jest Hałaśliwa] Jest to bardziej zadowalający opis wzajemnych powiązań. Po pierwsze, wydaje się prostszy od poprzedniego, co już jest zaletą. Po drugie, lepiej odzwierciedla pewne pojęcia. Zamiast mówić, że jedną z właściwości tawerny jest wino, używając wyrazu właściwość w dziwnym sensie, powiemy teraz po prostu, że tawerna ma wino, co jest znacznie odpowiedniejsze dla tego faktu. Rysunek 10-7 Zwierzę domowe jesto pies lub kot, jest oswojone Zwierzę domowe – jesto – Pies – jest Oswojony Zwierzę domowe – jesto – Kot – jest Oswojony Zwierzę domowe jesto pies lub kot, zwierzę domowe jest oswojone Zwierzę domowe – jesto Pies + jesto Kot + jest Oswojony Koty i psy są zwierzętami domowymi; Zwierzę domowe jesto zwierzę oswojone Zwierzę domowe – jesto Zwierzę + jest Oswojony + Kot – jesto Zwierzę domowe + Pies – jesto Zwierzę domowe Zastanawiając się nad opisanym tu sposobem przedstawienia informacji, możecie się zaniepokoić widoczną „kołowością" rzeczy: przedmioty definiowane są przez nie same, a czasem jeden przedmiot należy równocześnie do kilku klas. Pamięć może Wam wskazać, że pies jesto zwierzę domowe, a także, że pies jesto ssak. Co jest prawdziwe? W gruncie rzeczy „kołowość" i widoczne braki precyzji są pożądane w modelach pamięci, bowiem taka jest właśnie pamięć ludzka. Dla jednej osoby zwierzęciem domowym będzie każde zwierzę przebywające w domu, a zatem pies jest typowym przykładem zwierzęcia domowego. 397 Ale inna osoba mogła się wychować w domu, w którym nie było innych zwierząt, jak tylko psy, dlatego będą one dla niej jedynym przykładem zwierząt domowych. Tak więc na pytanie, co to takiego zwierzę domowe, odpowie ona, że „jest to pies przebywający w domu". Z czasem może ona rozszerzyć swoją definicję: „Zwierzę domowe to pies lub kot przebywający w domu". Miną lata, w ciągu których nieraz rozszerzy ona swoją definicję i pewnego pięknego dnia zaświta jej myśl, że w istocie zwierzę domowe to zwierzę przebywające w domu, a w wielu wypadkach można mówić, że pies jest to zwierzę domowe, a nie zwierzę domowe jest to pies. Jednak struktura jej pamięci już się utrwaliła i musi po prostu dodać nowe pojęcie do starego. Najwidoczniej czysta i systematyczna logika nie jest tym, czego należy szukać w naszym doświadczeniu i języku. Opisujemy jednak realne zachowanie, a ono jest często skomplikowane, zagmatwane i występują w nim błędne koła. Pojęcia pierwotne i wtórne Rozpatrując, jak reprezentowane są w pamięci różne rodzaje informacji, napotykamy poważny problem. Przypuśćmy, że staramy się zapamiętać informację: Leo, głodny lew, ma bolący pysk. Trudność pojawia się w momencie, kiedy chcemy dodać fakt, że lew ma bolący pysk (rys. 10-8). [Leo jesto Lew, Leo jest Głodny, Leo ma Pysk, Pysk jest Bolący] Jest to jeden ze sposobów przedstawienia tego stwierdzenia. Zauważcie, że wyraz bolący powinien być określeniem dla wyrazu pysk. Jeżeli przeprowadzilibyśmy strzałkę od wyrazu słowa Leo do wyrazu bolący, znaczyłoby to, że Leo jest cały obolały, a nie tylko jego pysk. Opis ten byłby prawidłowy pod warunkiem, że pojęcie pysk byłoby zatrzymane w pamięci tylko w tym jednym wypadku. Ale załóżmy, że wiemy również, iż John jest osobą, która ma wielki pysk. Proste zsumowanie tej informacji dałoby nam co następuje (rys. 10-9). [Do słowa Pysk zbiegają się dwie strzałki; jedna od Leo, druga od Johna. Leo jesto Lew, Leo jest Głodny, Leo ma Pysk, Pysk jest Bolący; John jesto Osoba John ma Pysk] Jasne jest, że tak być może. Jeśli tak zrobimy, to wydobywając informację o Johnie pamięć przekaże nam, że John ma bolący pysk i że Leo ma wielki pysk i również bolący pysk. 398 Aby rozwiązać ten dylemat, musimy mieć tylko jedną definicję pojęcia pysk, ale potrzebujemy wielu przykładów posługiwania się tym pojęciem, przy czym w każdym wypadku może ono występować w zmodyfikowanej formie. Pierwsza, podstawowa definicja została nazwana definicją pierwotną. Inne konkretne przypadki używania pojęcia noszą nazwę definicji wtórnej. Przedstawiamy pojęcia wtórne w trójkątnych nawiasach, jak na przykład: . Zapis taki należy odczytywać jako „ten pysk". Rozróżnienie pojęć na pierwotne i wtórne jest nieocenione, jak wskazuje rysunek 10-10. [Leo jesto Lew, Leo jest Głodny, Leo ma Ten pysk, Ten pysk jest Bolący Ten pysk jesto Pysk; John jesto Osoba John ma Ten pysk, Ten pysk jest Wielki, Ten pysk jesto Pysk] Teraz nie jest już nawet konieczne zamieszczanie nazwy odpowiadającej pojęciom wtórnym. Można ją łatwo znaleźć śledząc strzałkę jesto (rys. 10-11) [Na schemacie 10-11 słowa Ten pysk Lwa zastąpiono S1, a Ten pysk Osoby S2]. Wtórny węzeł nazwany S1 odpowiada pojęciu pysk, a w tym wypadku bolący pysk. Wtórny węzeł S2 przedstawia także pojęcie pysk, ale w tym momencie wielki pysk. Odszukując informację możemy automatycznie zastąpić bolący pysk przez S1 oraz wielki pysk przez S2 dla uzyskania każdorazowo prawidłowej informacji. Wprowadzając pojęcie banku danych w celu wyjaśnienia sposobów przechowywania informacji i sieci powiązań między nimi, ograniczyliśmy się dotąd do opisu konkretnych rzeczowników i trzech podstawowych rodzajów związków: jesto, jest i ma. Te pojęcia konkretne stanowią istotną, lecz nie jedyną część informacji, z którą zazwyczaj ludzie mają do czynienia. A jak wygląda to w odniesieniu do zdarzeń? Co i w jaki sposób zapamiętujemy z intrygi zawartej w przeczytanej ostatnio książce? Jak w naszym systemie pamięci może być reprezentowane działanie? 399 Zapamiętywanie zdarzeń Posługując się tą samą podstawową strategią, łatwo możemy dodać do banku danych różne typy informacji. Wystarczą tylko dwa uzupełnienia, jedno bardzo proste, i drugie bardziej skomplikowane. Łatwy krok polega na zwiększeniu liczby możliwych typów strzałek, łączących pojęcia. Jednak, zanim dopuścimy do swobodnego rozmnożenia strzałek, konieczne jest ustalenie, jakiego typu strzałki mogą łączyć się ze zdarzeniami. Problem polega na tym, aby zdarzenia mogły być reprezentowane w systemie pamięci. Można go rozwiązać dodając nowy typ węzła do pamięci, zwany węzłem zdarzenia. Tak np. do sytuacji pies gryzie człowieka chcemy dodać opis tego zdarzenia. W tym celu będziemy analizować zdarzenie jako scenariusz, który ma akcję, aktorów oraz dekorację i rekwizyty. Cała informacja związana ze zdarzeniem może być zakodowana w systemie pamięci, jeśli w odpowiedni sposób za pomocą tych terminów przedstawimy każdą scenę i jej rolę w zdarzeniu. Zastanówmy się ponownie nad sytuacją pies gryzie człowieka. Zdanie to, opisujące pewne zdarzenie, możemy rozbić na trzy części: podmiot (pies), czasownik (gryzie) i dopełnienie bliższe (człowiek). Nie ma jednak potrzeby, aby zagłębiać się w analizę pojęć podmiot, czasownik i dopełnienie bliższe, ponieważ mogą one nawet być mylące. Weźmy na przykład zdanie: człowiek jest gryziony przez psa. Które słowa należy uważać tu za podmiot? Człowiek czy też pies? Chcemy, żeby to był pies. Przecież to on, a nie człowiek jest sprawcą zdarzenia. W celu zarejestrowania zdarzeń musimy zdefiniować pewne nowe pojęcia. Zastanówmy się, w jaki sposób opisywane jest zdarzenie. Nasza koncepcja polega na tym, aby wyłonić zespół prostych powiązań charakteryzujących podstawowe pojęcia zdarzenia. Zdarzenia opisywane są często za pomocą zdań, ale zdania te muszą być analizowane z pewną ostrożnością. Lingwiści dają przykład takiej ostrożności starannie odróżniając kilka poziomów języka. Jeden, zwany strukturą powierzchniową, reprezentuje część, która jest widoczna: rzeczywiste zdania, jakie ludzie wypowiadają. Drugi poziom, zwany strukturą głęboką lub przestrzenią semantyczną, reprezentuje sens, jaki kryje się w określonych zdaniach. Jasne, że dla systemu pamięci ważna jest struktura głęboka lub przestrzeń semantyczna. Pewne zdania mogą wydawać się podobne na poziomie struktury powierzchniowej, a równocześnie mogą oznaczać całkiem różne rzeczy na poziomie semantycznym. Rozpatrzmy następujące zdanie: Matka gotuje. Kolacja gotuje się. Oba zdania wydają się podobne, chociaż mają całkowicie różny sens. W jednym wypadku matka stoi przy kuchni i coś gotuje. W drugim trudno nam sobie wyobrazić kolację, która stoi w kuchni i coś gotuje: prawdopodobnie to matka gotuje kolację. 400 Matka gotuje kolację. Aby odkryć podstawową strukturę zdarzenia nie wpadając w pułapkę struktury powierzchniowej zdania, która je wyraża, musimy zacząć od odrzucenia szczegółów zdania i wyłonić z niego samą akcję, czyli czynność. Pierwszy krok w naszej analizie polega na wyjaśnieniu, jaki jest scenariusz"? Jaka jest akcja? Następnie odnajdujemy aktorów i przedmioty biorące udział w czynności. Aktorów biorących udział w czynności będziemy nazywać wykonawcami lub agensami. Rzeczy, na których zachodzi działanie, nazwiemy przedmiotami, a osoby, które będą odbierały skutek czynności, określimy mianem odbiorcy. Oto przykłady podobnej analizy: Matka gotuje. Czynność: Gotowanie; Wykonawca: Matka; Przedmiot: Nie występuje Kolacja gotuje się. Czynność: Gotowanie; Wykonawca: Nie występuje; Przedmiot: Kolacja Matka gotuje kolację dla Huberta. Czynność: Gotowanie; Wykonawca: Matka; Przedmiot: Kolacja; Odbiorca: Hubert Wyodrębnienie rzeczy w taki sposób znacznie upraszcza sprawę. Teraz już wiemy, jak przedstawić zdarzenia w banku danych. Osią zdarzenia okazuje się być czynność i ją też należy uczynić węzłem centralnym: w schemacie węzeł ten jest przedstawiony w postaci koła otaczającego słowo (zazwyczaj czasownik). Aktorzy i przedmioty objęte scenariuszem czynności łączą się z węzłem zdarzenia strzałkami określającymi ich rolę. Ogólny schemat przedstawiony jest na rysunku 10-12. [Rysunek przedstawia koło, w które wpisuje się czynność będącą osią zdarzenia. Od koła odchodzą określające strzałki do słów otaczających węzeł centralny. Mogą to być: przedmiot, wykonawca, miejsce, instrument, czas , odbiorca itp.] 401 Tak więc oba zdania: Matka gotuje kolację dla Huberta. Kolacja Huberta jest gotowana przez matkę. przedstawione są na rysunku 10-13 jako mające ten sam scenariusz. [Węzeł centralny w postaci koła ze słowem GOTOWANIE w środku, od którego odchodzą strzałki do słów: Matka (strzałka opisana jako wykonawca), Kolacja (strzałka przedmiot), Hubert (strzałka odbiorca).] I chociaż oba zdania wyglądają na całkowicie różne (mają różne struktury powierzchniowe), znaczenie ich jest takie same (mają tę samą strukturę głęboką) i dlatego rejestrowane są w pamięci tak samo, jeśli chodzi o zapis informacyjny. Ponadto gotowanie zawsze musi odbywać się w określonym miejscu (miejsce czynności), za pomocą określonych środków (instrument) oraz w pewnym określonym czasie (czas). Te pojęcia uzupełniające są po prostu dodawane do węzła zdarzenia, jeśli są znane. Dlatego też nie ma potrzeby tworzenia dla nich nowej struktury. Oprócz podstawowych przypadków (tak nazywamy pojęcia wykonawcy, przedmiotu i odbiorcy) potrzebne będą również takie, jak: czas: wskazanie, kiedy zachodzi zdarzenie, często nazywa się go po prostu w formie czasownikowej - przeszły, teraźniejszy lub warunkowy (Jack pocałował Luizę: czas przeszły). miejsce: wskazanie, gdzie zachodzi zdarzenie (Bob uderzył Jacka w głowę: miejscem jest głowa). instrument: przedmiot za pomocą którego wywołane jest zdarzenie (Bob uderzył Jacka w głowę kamieniem: instrument to kamień). prawdziwość: czy zdarzenie było prawdziwe, czy też nie. (Nie widziałem Jacka: prawdą jest nie). Pełna lista przypadków użytych do opisu zdarzeń przedstawiona została w tabeli 10-1. 402 Tabela 10-1. Elementy zdarzenia CZYNNOŚĆ (ACTION); Zdarzenie jako takie. Czynność jest zwykle wyrażona za pomocą czasownika: The man was bitten by the dog. (Człowiek został ugryziony przez psa). WYKONAWCA LUB AGENS (AGENT); Aktor, który spowodował wystąpienie czynności: The man was bitten by the dog (pies). UWARUNKOWANIE (CONDITIONAL); Warunek logiczny uzależniający dwa zdarzenia: A shark is dangerous only if it is hungry. (Rekin jest niebezpieczny tylko wówczas, gdy jest głodny). John flunked the test because he alrays sleeps in lectures. (John oblał egzamin testowy, ponieważ zawsze śpi na wykładach). INSTRUMENT (INSTRUMENT); Rzecz lub urządzenie powodujące lub umożliwiające zdarzenie: The wind demolished the house. (Wiatr zdemolował dom). MIEJSCE, LOKALIZACJA (LOKATION); Miejsce, w którym zachodzi zdarzenie. Często w grę wchodzą dwie lokalizacje, jedna na początku, a druga na końcu zdarzenia. Określa się je jako lokalizację od i lokalizację do: They hitchhikied from La Jolla to Del Mar. (Oni podróżowali autostopem od La Jolla do Del Mar. From the University, they hitchhikied to the beach. (Od Uniwersytetu aż na plażę dojechali autostopem). PRZEDMIOT (OBJECT); Rzecz, na którą czynność oddziałuje: The wind demolished the house. (Wiatr zdemolował dom). CEL (PURPOSE); Określa cel zdarzenia: Jack took Henry to the bar to get him drunk. (Jack zabrał Henry'ego do baru, aby go upić). CECHA (QUALITY); Modyfikator pojęcia - opisuje jego właściwości. The surf was heavy. (Fala była wysoka). The were 93 people in class. (W klasie były 93 osoby). ODBIORCA (RECIPIENT); Osoba, na którą oddziałuje skutek czynności: The crazy professor threw the black-board at Peter. (Zwariowany profesor rzucił tablicą w Petera). CZAS (TIME); Kiedy zachodzi zdarzenie: The surf was up yesterday. (Fala podniosła się wczoraj). PRAWDZIWOŚĆ (TRUTH); Stosowane głównie do twierdzeń fałszywych. I do not like you, Hubert. (Nie lubię Cię, Hubercie). 403 Oto zdarzenie: Wczoraj na plaży sfotografowałem swoim nowym aparatem dom na Dziewiątej ulicy. można przeanalizować tak: czynność: fotografowanie wykonawca: ja przedmiot: dom na Dziewiątej ulicy miejsce: plaża instrument: mój nowy aparat czas: wczoraj. Analizę tę można ciągnąć dalej. Przedmiot może być analizowany jako pojęcie (dom) plus miejsce (Dziewiąta ulica). Instrument to konkretny aparat fotograficzny, właśnie mój. W rezultacie otrzymujemy strukturę przedstawioną na rysunku 10-14. [Rysunek przedstawia strukturę przestrzenną dla pojęcia FOTOGRAFOWAĆ. O węzła centralnego odchodzą strzałki: czas – do Wczoraj, miejsce – do Plaża, wykonawca – (nie opisane). Od węzła centralnego odchodzą również strzałki przedmiot i instrument do dwóch węzłów wtórnych. Węzeł za strzałką przedmiot rozwija się w dwóch kierunkach: strzałka jesto + Dom, strzałka miejsce + 9 ulica. Węzeł za strzałką instrument rozchodzi się w trzech kierunkach: jest + Nowy, jesto + Aparat, jest + Mój.] Wszystkie te związki są wprowadzane do banku danych dokładnie tak samo jak pojęcia, z tą jednak różnicą, że jest tu znacznie więcej możliwości niż tylko jesto, jest i ma. Czasem przydatny jest sposób uproszczenia struktury, zwany skróconym zapisem. Często w przypadku prostych zdarzeń, jak np. Matka gotuje kolację, nie ma wątpliwości co do tego, jaką rolę odgrywa w nim każde pojęcie (Matka i Kolacja). 404 W takim przypadku pełny zapis zdarzenia przedstawiony na rysunku 10-15a [GOTOWAĆ – wykonawca – Matka + GOTOWAĆ – przedmiot – Kolacja] nie jest nam potrzebny Wystarczy tu skrócony zapis jak na rysunku 10-15b [Matka – gotuje – Kolację]. Zauważcie, że w tym skróconym zapisie nazwa czynności służy po prostu za określenie relacji (strzałka), która łączy dwa pojęcia. Ten sposób prezentacji nie prowadzi do nieporozumień, ponieważ warianty a i b są rozpoznawane jako równoważne. Ale, kiedy do opisu zdarzenia dołącza się nowy szczegół, to skrócony zapis staje się nieprzydatny. I tak zdarzenie Matka gotuje kolację dla Huberta musi być przedstawione w pełnym zapisie (rys. 10-15c). [GOTOWAĆ – wykonawca Matka + przedmiot Kolacja + odbiorca Hubert] Teraz, kiedy ukazują się nam pełne możliwości banku danych, spróbujemy dodać do danych, przedstawionych wcześniej na rysunku 10-6, następujące zdarzenia: Bob pije piwo. Wczoraj „u Luigiego" Mary mocno uderzyła Luizę. Al właściciel tawerny „u Luigiego". Bob lubi Luizę. Henry, pies Ala, ugryzł Sama, ponieważ ten krzyczał na Mary. Luiza pije wino. Mary lubi Boba. Widzimy, że teraz bank danych stał się znacznie bogatszy, ponieważ nie tylko wzrosła liczba zdefiniowanych pojęć, ale - przede wszystkim - zaistniała możliwość zrozumienia zdarzeń, w których pojęcia te występują. Wzór takiego wzbogaconego banku danych przedstawiony został na rysunku 10-16.[Schemat trudny do dokładnego opisania ze względu na zbyt dużą ilość faktów i powiązań. ] Zwróćcie uwagę na to, że do przedstawienia zdarzeń zastosowano zarówno zapis pełny, jak i zapis skrócony, a mimo to nie ma kłopotów ze zrozumieniem wynikających z tego połączeń (w schemacie zastosowano nowe techniki ilustracyjne, tak że warto zapoznać się z nimi dokładnie). Mamy zatem podstawowy opis banku danych, tej podstawy pamięci człowieka. System pamięci jest pewnym zorganizowanym zbiorem dróg umożliwiających przepływ informacji w banku danych. Wydobywanie informacji z pamięci jest zatem działaniem podobnym do poszukiwania drogi w labiryncie. Poczynając od danego węzła, można poruszać się po najrozmaitszych drogach. Wybór jednej z nich prowadzi do wielu różnych skrzyżowań, a z każdego skrzyżowania można trafić do różnych pojęć. Każde nowe skrzyżowanie to całkiem nowy labirynt z nowym zestawem punktów wyboru i nowymi sieciami dróg. W zasadzie można wystartować z dowolnego punktu banku danych, a następnie wybierając prawidłową kolejność dróg labiryntu dotrzeć w końcu do innego wybranego punktu. 406 Tak więc w systemie pamięci wszystkie informacje są wzajemnie powiązane. Do tej pory rozpatrywaliśmy pamięć jako system bierny. Jako sieć potencjalnych dróg, z których w zasadzie każda może być wykorzystana w procesie wydobywania i interpretacji informacji. Nadszedł czas, aby prześledzić niektóre z procedur wydobywania i manipulowania przechowywanymi w pamięci informacjami, czyli procedury opisujące sposób posługiwania się pamięcią. Jako wprowadzenie do problemu spróbujcie odpowiedzieć na następujące pytania pochodzące z banku danych przedstawionych na rysunku 10-16. Pytanie: Czy ludzie piją napoje alkoholowe? Pytanie: Czy Al lubi Mary? Pytanie: Czy Luiza jest klientką? 11. Procesy pamięci MECHANIZMY WEJŚCIA I WYJŚCIA Przetwarzanie na wejściu Udzielanie odpowiedzi WNIOSKOWANIE O STRUKTURZE PAMIĘCI LUDZKIEJ POSZUKIWANIE INFORMACJI W PAMIĘCI Wieloetapowy proces poszukiwań Relacje podrzędności Relacje zachodzenia na siebie Relacje rozłączne REORGANIZACJA STRUKTUR PAMIĘCI POPRZEZ PROCESY MYŚLOWE Korygowanie błędów Ocenianie na wejściu PENETRACJA BANKU DANYCH ROZUMIENIE A ZAPAMIĘTYWANIE PAMIĘĆ JAKO PROCES PRZETWARZANIA INFORMACJI 409 [W rozdziale tym znajduje się wiele schematów, które nie zostały opisane ze względu na zbyt skomplikowaną strukturę.] Na poprzednich stronach przedstawiliśmy strukturę organizacyjną pamięci, łącznie z metodami kodowania pojęć i zdarzeń. Opis struktury pamięci to tylko jedna strona zagadnienia. Teraz należy zbadać rodzaje procesów poznawczych, które mogą zachodzić w tej strukturze. W rozdziale tym zbadamy drugą grupę procesów pamięci: procesy interpretacji(rys 11-1) [Od słowa Imbryk, przy pomocy procesu interpretacji, korzystając z bazy danych, przechodzimy do słowa Pryszcze.] Wykład nasz ma jedynie na celu zarysowanie ogólnego kierunku poszukiwań, ponieważ jego pełne rozwinięcie byłoby wplątaniem się w złożoności ludzkiego myślenia. Ogólne podejście może mieć prawidłowy kierunek, jednak szczegóły wymagają dokładniejszej analizy, zarówno w odniesieniu do logicznych właściwości omawianych procesów, jak i w sensie eksperymentalnego badania ich implikacji. Badanie procesów poznawczych pamięci to rzecz nowa; a zatem omawiane poniżej zasady to zaledwie pierwszy krok w tym kierunku. MECHANIZMY WEJŚCIA I WYJŚCIA System pamięci musi komunikować się z otaczającym go światem. Musi być zdolny do odbioru przekazów i przekodowywania ich na odpowiednią do przechowywania w pamięci formułę. Powinien być zdolny również do odpowiadania na pytania. Jeżeli przyjąć opisaną wcześniej strukturę pamięci, to podstawowa strategia przekształcania przekazów wejściowych i dawania odpowiedzi staje się w miarę prosta. Rozpatrzmy najpierw dwa typy prostych przykładów takich zadań. Główne zadanie na wejściu to, jak dołączyć nowe przekazy do znajdujących się już w banku danych? Główne zadanie na wyjściu polega na przełożeniu informacji przechowywanej w banku danych na powiązany ciąg przekazów, który opisywałby te przechowywane dane. 410 Przetwarzanie na wejściu Przypuśćmy, że po raz pierwszy w życiu spotkaliśmy Mary. Odbieramy ją jako proste pojęcie: Mary jest tłustą, pryszczatą osobą. Aby wprowadzić to pojęcie do banku danych, trzeba przede wszystkim nadać mu standardową formę, za pomocą której informacja jest tam przedstawiona. Innymi słowy, pojęcie Mary, którą właśnie poznaliśmy, rozpada się na trzy proste twierdzenia: Mary jest osobą. Mary jest tłusta. Mary ma pryszcze. 411 W tym momencie interesuje nas mechanizm, który dołączy te trzy przekazy do banku danych. Zakładamy, że pojęcie Mary, będące rezultatem różnorodnych procesów spostrzeżeniowych i rozpoznawczych możemy ująć jako obraz Mary, na który składają się te trzy przekazy. Zadanie nasze polega na tym, aby przekodować ten obraz do banku danych. Przykłady, jakich używamy, mają charakter wyłącznie językowy - Mary jest opisywana za pomocą prostych zdań - wprowadzamy tę konwencję jedynie dla ułatwienia wykładu. Przypuszczalnie rzeczywista natura pamięci o Mary jako tłustej i pryszczatej nie jest werbalna. Po prostu opis zawartości banku danych najłatwiej jest przedstawić za pomocą słów. Należy jednak pamiętać, że te werbalne opisy są jedynie wybranym przez nas sposobem przedstawienia procesów symbolicznych, które muszą rzeczywiście zachodzić. Udzielanie odpowiedzi Zacznijmy od prostej sytuacji: mamy pewien zbiór pojęć. Bank informacji przedstawiony na rysunku 11-2 zawiera definicje różnego rodzaju garnków i pojemników. Zauważcie, że nie wszystkim pojęciom odpowiadają określone nazwy. W szczególności są to pojęcia pośrednie, oznaczone symbolami C1, C2, C3, C4, które służą do definiowania innych wejść. Pojęcia pośrednie to pojęcia wtórne, o których mówiliśmy wcześniej. Jeżeli prześledzimy ten zbiór przechodząc od jednej definicji do drugiej, bez trudności zrozumiemy zasady używania tych pojęć. W jaki sposób system ten odpowiada na pytania dotyczące tego, co jest mu znane? Przeanalizujmy najpierw proste przykłady. Pytanie: Co wiesz o imbryku? System pamięci może odpowiedzieć na nie w następujący sposób: Imbryk to garnek. Jest on z fajansu, ma ucho, dzióbek, niech się zastanowię, wewnątrz wypełniony bywa gorącym płynem. Garnek to coś w rodzaju okrągłego pojemnika, wykonanego z metalu. Czajnik to też garnek. Pozwólcie mi teraz opowiedzieć o czajniku. Czajnik ma dzióbek, niech się zastanowię, tak, wypełniony jest również wewnątrz gorącym płynem. A teraz powiem wam o.... Ten hipotetyczny przykład ma nam pokazać możliwe strategie przypominania. Najpierw opisywana jest informacja znajdująca się wokół głównego węzła, następnie przechodzi się do któregoś z węzłów odnoszących się doń i tak dalej. Kiedy przechodzi się do kolejnego węzła, jest on starannie badany najpierw zgodnie ze strzałką jesto, „aby dotrzeć do jego nazwy, a następnie śledzi się inne strzałki, aby określić jego właściwości. Wymaga to czasu i wysiłku i dlatego człowiek wypełnia ten czas takimi nieszkodliwymi wyrażeniami, jak „niech się zastanowię", „mhm" i ... „no, wiesz". Taki przekaz wyjściowy jest prosty. Jest on po prostu rezultatem usiłowania przejścia wszystkich dróg, wychodzących z każdego węzła. Tu nie jest jeszcze wymagana interpretacja. 412 Co jednak dzieje się wtedy, gdy konieczne będzie przeprowadzenie choćby najprostszego rozumowania? Posługując się rysunkiem 11-2, spróbujcie odpowiedzieć na następujące pytania dotyczące systemu pamięci. A. Pytanie: Czy dzbanek ma rączkę? [Prawidłową odpowiedzią jest tak.] B. Pytanie: Czy garnek wykonany jest z metalu? C. Pytanie: Czy imbryk jest naczyniem? D. Pytanie: Czy imbryk jest z fajansu? E. Pytanie: Czy odpowiedź dotycząca D jest sprzeczna z wnioskami płynącymi z odpowiedzi na pytania B i C? WNIOSKOWANIE O STRUKTURZE PAMIĘCI LUDZKIEJ Potencjalnie w systemie pamięci wszystko jest ze sobą powiązane. A zatem, jeżeli nie ograniczymy czasu poszukiwań, to mogą one trwać bez końca. Jednak struktura przekazu wyjściowego jest ściśle związana ze strukturą banku danych. Fakt ten można wykorzystać w klinicznych badaniach pacjentów. Można w tym celu posłużyć się szeregiem różnych metod. Jedna to metoda swobodnych skojarzeń. Pacjentowi mówi się określone słowo, a następnie prosi się go, żeby odpowiedział „pierwszym słowem, jakie przyjdzie mu na myśl". Jeden z wariantów tej metody polega na tym, że pacjenta prosi się o wypowiadanie się na jakikolwiek wybrany przezeń temat, niezależnie od tego, czy ma on, czy też nie ma związku z problemami chorego. W wyniku istnienia struktury powiązań w banku danych, dowolny temat może mieć związek z rozważaniami dotyczącymi innego dowolnego tematu. Spójrzmy, co nastąpi, jeżeli posłużymy się bardziej rozbudowaną wersją banku danych (rys. 11-3) dla zilustrowania metody swobodnych skojarzeń w powiązaniu z tematem dotyczącym słowa imbryk. Zacznijmy od imbryka. Droga prowadzi do płynów i napojów. Dalej droga zmierza w dwu różnych kierunkach. Klienci wydają pieniądze w tawernie, aby otrzymać napoje alkoholowe w celach towarzyskich. Alternatywna droga prowadzi do: Wino i piwo to napoje. W tawernie „u Luigiego" mają wino i piwo, jak też klientów. A zatem obie drogi doprowadziły nas do pojęcia Klient. Od klienta przejdziemy łatwo do osoby i stąd prosto do Mary (dziewczyny z pryszczami). Ale dzięki temu znaleźliśmy się bardzo blisko wszystkich powiązanych ze sobą zdarzeń, stanowiących opis incydentu u Luigiego. Typ odpowiedzi, jakiej udziela bank danych, jest zdeterminowany w znacznym stopniu przez system interpretujący. Do kogo należy ten bank danych? Może to bank danych Sama? Jeżeli tak, to incydent, jak wiemy, dotyczy go bezpośrednio. Jeśli zaczniemy od imbryka, będzie to dobry punkt wyjścia do przypomnienia sobie przezeń klienta lub tawerny, a następnie lokalu „u Luigiego". 413 Stąd już łatwa droga do przypomnienia sobie szeregu zdarzeń, kiedy to Henry go ugryzł, najprawdopodobniej dlatego, że krzyczał na Mary. Ale Mary, ta tłusta i pryszczata dziewczyna, uderzyła Luizę (Luiza, jak zobaczymy później, jest wysoka i przystojna). Przypuśćmy, że Sama poproszono o wypowiedzenie swobodnych skojarzeń w związku ze słowem imbryk. Czy jest w tym coś niezwykłego, że odpowiedział słowem pryszcze? Doświadczony klinicysta postara się wykorzystać to dziwaczne skojarzenie do zbadania leżącej u jego podstaw struktury pamięci, mając nadzieję, że odtworzy tym sposobem pełny jej obraz. W tym przykładzie struktura pamięci ma racjonalny charakter. Jest rzeczą oczywistą, że w przypadku zaburzeń psychicznych związki między pojęciami nie są tak racjonalne. Pouczające i zabawne będzie zapoznanie się ze strukturą pamięci Leona Gabora, pacjenta, który uważał siebie za Jezusa Chrystusa (rys. 11-4). [Struktura pamięci Leona-Gabora została odtworzona na podstawie studium tego przypadku zamieszczonego w pracy Rokeacha, The Three Christs of Ypsilanti (1964).[ 414 POSZUKIWANIE INFORMACJI W PAMIĘCI Pytanie: Czy wszystkie turnie są górami? Pytanie: Czy kanarek ma krew? Pamięć można badać analizując odpowiedzi, jakich ludzie udzielają na zadane im pytania. Obecnie jednak interesować nas będzie nie to, co usłyszymy w odpowiedzi, 415 ale z jaką szybkością, zostanie nam udzielona. Aby to zaobserwować, zapoznajmy się z innym fragmentem dotyczącym banku danych, zaczerpniętym z pracy Allana Collinsa i M. Ross Quilliana (1969) i przekształconym przez nas zgodnie z konwencją stosowaną w tej książce. Rozważmy następujące pytania: 1. Czy kanarek jest żółty? 2. Czy kanarek ma skrzydła? 3. Czy kanarek oddycha? Jak odpowiedzielibyście na nie posługując się schematem przedstawionym na rysunku 11-5? Zacznijmy od pytania najtrudniejszego: 3. Czy kanarek oddycha? Pierwszym krokiem jest oczywiście sprawdzenie wszystkich cech specyficznych związanych z kanarkiem i ustalenie, czy oddychanie stanowi część charakterystyki kanarka. Jeżeli na liście tych cech znajdzie się oddychanie, odpowiemy niezwłocznie tak. Ale jeśli oddychania tu nie będzie, nie oznacza to jeszcze, że odpowiedź nasza musi brzmieć nie. Jest bardzo możliwe, że cecha oddychania jest przechowywana w pamięci jedynie przy pojęciu ptaka czy zwierzęcia: Czyż bowiem wspólna cecha nie może określać całej klasy, do której przynależy? Czym jesto kanarek? Kanarek jesto ptak. Następny zatem krok, to sprawdzić definicję dotyczącą ptaków: Czy ptak oddycha? I tu również nie znajdujemy informacji o oddychaniu, musimy zatem kontynuować poszukiwania w tym kierunku. Ptak jesto zwierzę. Co wiemy o zwierzętach? Zgoda, zwierzę może oddychać. A zatem ptak (który jesto zwierzę) także może oddychać: a więc kanarek (który jesto ptak) może oddychać. Jeżeli informacja reprezentowana jest w pamięci właśnie w taki sposób, to odpowiedź na pytanie w rodzaju: Czy kanarek oddycha? wymaga więcej czasu, niż odpowiedź na pytanie w rodzaju: Czy kanarek ma skrzydła? To właśnie chcemy sprawdzić: czas potrzebny na udzielenie odpowiedzi na tego typu pytania. Badani udzielają odpowiedzi na pewną liczbę serii takich pytań, a jednocześnie mierzony jest czas, jakiego potrzebują na udzielenie każdej odpowiedzi. Wyniki tego typu eksperymentu zostały przedstawione na rysunku 11-6. Pokazano tu kilka typów zdań, których prawdziwość ocenia badany. Jedno zdanie Czy kanarek jesto kanarek? zostało włączone do serii dla celów skalowania czasu. Czas oceny jego prawdziwości przez osobę badaną pozwala eksperymentatorowi ustalić czas niezbędny do przeczytania pytania i udzielenia odpowiedzi w warunkach nie wymagających poszukiwania informacji w pamięci. Ponadto wyróżniono dwa rodzaje zdań. Aby odpowiedzieć na jedno z nich-zwane pytaniem jesto- wystarczy iść w kierunku zgodnym ze strzałkami oznaczającymi relację jesto. A zatem, kanarek jesto ptak? Czy kanarek jesto zwierzę? Czy dąb jesto drzewo? Inny typ pytania dotyczący cech wymaga sprawdzenia takich cech, jak: ma skórę, może oddychać, ma żołędzie. Dane przedstawione na rysunku 11 -6 wskazują na to, że im większa jest liczba pojęć, które należy sprawdzić, tym dłuższy czas jest potrzebny na udzielenie odpowiedzi. W rzeczywistości można zauważyć, że każdy dodatkowy poziom poszukiwań w pamięci zabiera dodatkowo około 0,1 sek. Zauważcie, że odpowiedź tak na stwierdzenie kanarek jesto kanarek następuje po upływie około 1 sek. 417 Jest to czas potrzebny na przeczytanie zdania, podjęcie prostej decyzji i naciśnięcie odpowiedniego guzika. Zdanie wymagające poszukiwań na jednym poziomie, zgodnie z kierunkiem strzałki jesto (np. kanarek jesto ptak), zajmuje około 1,18 sek., stąd można wnioskować, że dodatkowe 0,18 sek. potrzebne było na poszukiwania w pamięci. Zdanie wymagające przeszukania dwu poziomów pamięci dotyczących stwierdzeń typu jesto (np. kanarek jesto zwierzę)zajmuje około 1,24 sek. to znaczy o 0,24 sek. więcej niż najprostsze zdanie. Podobnie w wypadku, gdy wymagane jest sprawdzenie listy cech, najprostsze poszukiwanie - kanarek śpiewa - zabiera około 1,3 sek., a wykrycie tego, że kanarek ma skórę - o 0,8 sek. dłużej. Wyniki tych eksperymentów mają wyłącznie charakter wstępny: pozwalają jedynie przypuszczać, jaka jest rzeczywista struktura pamięci i jak przebiegają procesy wydobycia z pamięci. Prowokują niewątpliwie do dalszych poszukiwań dotyczących ogólnej natury systemu pamięci. Ćwiczenie: Zwróćcie uwagę na dodatkowe dane, przedstawione na rysunku 11-6. To czasy reakcji na fałszywe twierdzenia, takie jak: kanarek ma skrzela i kanarek jesto ryba. Spróbujcie teraz, posługując się rysunkiem 11-5, określić możliwe drogi poszukiwania odpowiedzi na te pytania. Jak postąpilibyście z twierdzeniami w rodzaju kanarek jest niebezpieczny lub nawet kanarek jest spokojny, dla których to twierdzeń nie ma w banku danych odpowiedniej, przynajmniej bezpośrednio dostępnej informacji? Na koniec spróbujcie wyobrazić sobie taki bank danych, który pozwoliłby operować zdaniami w rodzaju: Madryt jest meksykański. Orzech laskowy ma zamek. Chicago ma góry. Igloo na pewno roztopi się w Teksasie. Rowery rozpędzają mgłę. Wieloetapowy proces poszukiwań Pytanie: Wszystkie turnie są górami Aby zdecydować się, czy jest to prawda czy też fałsz, niezbędny jest inny rodzaj pamięci niż ten, który był potrzebny przy rozstrzygnięciu kwestii typu: kanarek ma skórę. W kwestii kanarka podstawowy problem polegał na zadecydowaniu, czy struktura definicji kanarków jest zgodna z przedstawionym twierdzeniem. W przypadku turni natomiast konieczne jest sprawdzenie wszystkich konkretnych przykładów turni. Będzie to operacja zupełnie innego rodzaju. 418 D. Meyer (1970) analizował znaczną liczbę pytań tego typu. Rozpatrywał on odpowiedzi osób badanych na pytania czterech następujących typów: Wszystkie P są S. Niektóre P są S. Wszystkie S są P. Niektóre S są P. W zależności od relacji między S i P, pytania te wymagają różnych strategii poszukiwawczych. Rozważmy następujące przypadki: Relacje podrzędności. (Zakres jednego pojęcia wchodzi w zakres drugiego - przyp. tłum.). Niech P będzie jednym z przykładów S; tak więc P może być turnią, a S górą, albo P-rubinem, a S-kamieniem szlachetnym. Stąd: Wszystkie rubiny są kamieniami szlachetnymi. Prawda. Niektóre rubiny są kamieniami szlachetnymi. Prawda. Wszystkie kamienie szlachetne są rubinami. Fałsz. Niektóre kamienie szlachetne są rubinami. , Prawda. Relacje zachodzenia na siebie. (Zakresy obu pojęć w części się pokrywają - przyp. tłum.). P i S zachodzą na siebie znaczeniowo, ale żadne z nich nie jest przykładem drugiego. Niech P oznacza kobiety, a S pisarzy albo też P konserwatystów, a S studentów. Tak więc otrzymamy cztery typy zdań. Wszystkie kobiety są pisarzami. Fałsz. Niektóre kobiety są pisarzami. Prawda Wszyscy pisarze są kobietami. Fałsz. Niektórzy pisarze są kobietami. Prawda. Relacje rozłączne. (Zakresy pojęć nie zachodzą na siebie - przyp. tłum.). W końcu niech P i S oznacza rzeczy nie mające ze sobą nic wspólnego. Niech P oznacza dom, a S próżnię, albo P niech oznacza książki, a S-koty. We wszystkich czterech wersjach zdania będą fałszywe. Wszystkie książki są kotami. Fałsz. Niektóre książki są kotami. Fałsz. Wszystkie koty są książkami. Fałsz. Niektóre koty są książkami. Fałsz. 419 Przyjmując istnienie struktury pamięci, z którą zapoznawaliśmy się dotychczas, potrzebne są jeszcze inne procedury poszukiwawcze, aby móc znaleźć odpowiedź na te pytania. Na przykład, odpowiedź na pytanie: Czy wszystkie krzesła są meblami? można zacząć od pojęcia krzesło, dokonać przeglądu jego zakresu, czyli wszystkich przykładów krzeseł, i upewnić się, że każdy stanowi pewien typ mebla. Jeżeli będziemy postępować w ten sposób to czas niezbędny na udzielenie odpowiedzi na pytanie: Czy wszystkie trony są meblami? będzie znacznie krótszy niż czas potrzebny do udzielenia odpowiedzi na pytanie poprzednie. W końcu w naszym życiu z tronem nie spotykamy się tak często jak z krzesłem, tak więc czas poszukiwania powinien być krótszy. Zgodnie z naszym rozumowaniem możliwe jest sprawdzenie różnych teorii poszukiwania w pamięci poprzez dobranie pytań z różną liczbą przykładów, które trzeba odszukać, aby znaleźć odpowiedź, a następnie zbadanie, jak zmieniają się odpowiednie czasy reakcji u osób badanych. Rezultaty tego typu eksperymentów wskazują, że proces odpowiadania na pytania składa się przynajmniej z dwu etapów. W pierwszym następuje sprawdzenie, czy oba porównywane przedmioty mają coś wspólnego, to znaczy, czy pojęcia te zachodzą na siebie? Na przykład, w kolejnych dwu twierdzeniach: Wszystkie zboża są tajfunami. (Wszystkie S są P.) Niektóre krzesła są ludźmi. (Niektóre S są P.) nie ma żadnych wspólnych relacji między S i P (zboża-tajfuny lub krzesła-ludzie), tak więc od razu rzuca się w oczy, że te twierdzenia są fałszywe. Jeżeli jednak oba pojęcia będą miały cokolwiek wspólnego, jak na przykład: Wszyscy piloci są mężczyznami. (Wszystkie S są P.) to pierwszy etap analizy nie dostarczy nam odpowiedzi. W takim przypadku konieczny jest drugi etap analizy, aby sprawdzić, czy wszyscy piloci na pewno są mężczyznami. Dodatkowe przetworzenie informacji wymaga, oczywiście, dodatkowego czasu i osoby badane odpowiednio wydłużają czas swoich odpowiedzi. Zauważmy, że w wypadku twierdzenia w rodzaju: Niektórzy piloci są mężczyznami. (Niektóre S są P.) wystarczy jeden przykład potwierdzający, aby dać odpowiedź: prawda. Odpowiedź taka następuje szybko, ponieważ uzyskiwana jest od razu w pierwszym etapie analizy. Ogólnie poszukiwanie odpowiedzi na pytania tego typu można przedstawić jako proces dwustopniowy, zachodzący w zorganizowanej strukturze pamięci (rys. 11-7). [Schemat przedstawia algorytm dochodzenia do stwierdzenia PRAWDA lub FAŁSZ. Na wejściu stawiamy tezy typu: Niektóre S są P, Wszystkie S są P. Etap I: Czy S i P zachodzą na siebie? Strzałka „nie” prowadzi do zdań: Niektóre S są P, Wszystkie S są P, wniosek FAŁSZ. Jeśli odpowiedź brzmi „tak” to przechodzimy do ETAPU II, obejmującego tylko zdanie Wszystkie S są P. Zadajemy pytanie Czy wszystkie przykłady S są P? Jeśli nie strzałka „nie” dochodzi do Wszystkie S są P to FAŁSZ. Jeśli odpowiemy „tak” to mamy zdania Wszystkie S są P, Niektóre S są P, oba poprzedzone strzałkami „tak”. Wniosek PRAWDA.] Wspólną cechą wszystkich naszych procedur poszukiwawczych jest to, że do udzielenia odpowiedzi na pytania niezbędne jest zarówno wydobywanie informacji z pamięci, 420 jak i rozumowanie dedukcyjne. W gotowej formie odpowiedź rzadko przechowywana jest w systemie pamięci. Musi ona być wyszukana, wydobyta z cichego kącika, gdzie się skrywała, a następnie trzeba ją pracowicie złożyć z oddzielnych części. Nawet tak proste pytanie, jak: Co to jest quigee? [Gra typu bilard. (Przyp. red. pol.)] wymaga intensywnych poszukiwań i logicznych konstrukcji na podstawie posiadanych informacji (rys. 11-8) [rozbudowany schemat wzajemnych powiązań węzłów centralnych: LUBIĆ, NIE LUBIĆ, JEŚĆ, ODKRYĆ PŁYNĄĆ, prowadzący do odnalezienia w pamięci znaczenia słowa quigee.] W ciągu długiej historii badań psychologicznych wskazano, że pamięć rzadko jest zwykłą przechowalnią zdarzeń, jest raczej zbiorem sądów, które muszą być opracowane w celu zrekonstruowania poszukiwanego obrazu. Jednakże prawdziwa, konstruktywna natura pamięci ludzkiej odkrywa się przed nami jedynie wtedy, kiedy starannie badamy jej budowę i zachodzące w niej procesy wydobywania informacji. 421 REORGANIZACJA STRUKTUR PAMIĘCI POPRZEZ PROCESY MYŚLOWE Dane, które rozpatrywaliśmy przed chwilą, wskazują na to, że informacja zgromadzona w banku danych jest odpowiednio ustrukturalizowana. Wydaje się, że informacja jest przechowywana tam, gdzie może być najbardziej wydajna. A zatem, twierdzenie typu ma skrzydła nie jest przechowywane przy każdej nazwie ptaka, ale zapisane zostało tylko jeden raz, obok bardziej ogólnego pojęcia „ptaki". Nasuwa się przypuszczenie, że system powinien mieć pewną inteligencję, ponieważ od czasu do czasu zdarza się, że informacja przechowywana w pamięci ulega pewnej reorganizacji. Przeanalizujmy zatem niektóre procesy zapewniające reorganizację i generalizację informacji. Przed nami schemat (rys. 11-9) przedstawiający pojęcia, które mogłyby być zakodowane w banku danych czyjejś pamięci. 423 Aby uprościć rozważania, w schemacie nie zostały przedstawione zdarzenia, lecz pojęcia dotyczące Mary, Boba i Sama. Jeżeli dysponujemy informacją w rodzaju: Mary jest niska, tłusta, płci żeńskiej, Bob jest rudowłosy i radykał, a Sam jest bystry, to do jakich wniosków możemy dojść myśląc o istniejących tu związkach? Poza tym, w miarę gromadzenia się coraz większej ilości informacji odnoszących się do tych czy innych pojęć rozsądnie jest zatrzymać się i ustalić, czego naprawdę dowiedzieliśmy się. Pytanie: Powiedz, co wiesz o osobie? W odpowiedzi na takie pytanie system pamięci powinien przejrzeć listę osób i wskazać na właściwości każdej z nich. Jednak w procesie formułowania tej odpowiedzi mogą zajść interesujące rzeczy. Przeanalizujmy na przykład hipotetyczny efekt pracy procesu interpretującego: Mary, Bob i Sam jesto osoba. Mary jest płci żeńskiej, gruba, niska i brzydka. Mary ma rude włosy. Hmm, Bob ma rude włosy. Sam ma rude włosy. Wszystkie osoby mają rude włosy. Bob jest niski. Ale spójrzmy na to: Bob Mary i Sam są niscy. Wszystkie osoby są niskie. Zgodnie z informacją przechowywaną w tym banku danych, wszystkie osoby są niskie, rudowłose i mają ciało. Tak więc pojęcie osoba zostało uogólnione przez zestawienie wspólnych informacji. Taki system uogólniania jest raczej prosty. Wszystkie przykłady danego pojęcia są analizowane kolejno w celu wykrycia cech wspólnych. Jeśli przy każdym pojęciu przechowywana jest ta sama informacja, wiedza o nich zostaje uogólniona. Czy wszystkie osoby mają ciało? W banku danych mamy do czynienia wyłącznie z trzema przypadkami osób i każda z nich rzeczywiście ma ciało. Oczywisty wniosek natury praktycznej - wyłączyć cechę dotyczącą ciała każdego z trzech przypadków i umieścić ją tylko raz jako informację osoba ma ciało. W ten sposób upraszczamy sobie ogólną strukturę banku danych. Takie uogólnienia (rys. 11-10) mogą nam się wydawać nieco osobliwe: Wszyscy ludzie mają rude włosy, są niscy i mają ciało. Chętnie godzimy się na to ostatnie, ale nie na dwa pierwsze. Źródło błędu tkwi w tym, przynajmniej po części, że ilustrowana na schemacie pamięć zna jedynie trzy osoby. Nie godzimy się z tym, że wszystkie osoby są rude, a to dlatego, że mieliśmy okazję spotkać setki i tysiące osób, i wiele z nich wcale nie miało rudych włosów. Jednak w przypadku przedstawionego systemu posiadanie rudych włosów oraz niskiego wzrostu jest tak samo dobre do scharakteryzowania osoby, jak i fakt, że wszystkie osoby maja ciało. Możliwe jest pewne udoskonalenie naszego modelu pamięci. Spójrzcie na rysunek 11-10. Widać, że Bob i Sam są osobami płci męskiej. Uwzględniając tę informację, można utworzyć nowe pojęcie N1, osoba płci męskiej (rys. 11-11). W tym momencie system pamięci wie jedynie tyle, że może odnaleźć w banku danych wspólne pojęcia dla niektórych osób, a mianowicie cechę „być płci męskiej". Później, być może, nauczy się określać to pojecie słowem mężczyzna, 424 ale na razie uogólnienie to wyznacza nie nazwany węzeł wtórny, oznaczony dla wygody symbolem N1. Mamy więc okazję zaobserwować, jak na podstawie analizy informacji nabytej w uprzednim doświadczeniu tworzą się pewne pojęcia ogólne. Jednak prostota tego schematu uogólnienia jest myląca. Stopniowo, w miarę kolejnego przystosowywania się, struktura pamięci podlega ciągłej reorganizacji. Cechy wspólne dla pewnych pojęć mają tendencję do przemieszczania się w górę, łącząc się z jednostkami ogólniejszymi. Wraz z upływem czasu bezpośrednio powiązane z danym pojęciem pozostają tylko cechy, które są dla niego albo specyficzne, albo też szczególnie ważne. Myśląc o Mary system pamięci będzie zwracał uwagę przede wszystkim na to, co jest specyficzne dla Mary, i co wyróżnia ją spośród innych osób. Cechy bardziej ogólne można łatwo odszukać przechodząc w górę zgodnie ze strzałkami jesto. Dzięki takiemu mechanizmowi uogólnienia można uzyskać następującą odpowiedź na pytanie dotyczące pojęcia Mary: Pytanie: Opowiedz mi o Mary. Tak, niech się zastanowię. Mary jest grubą, brzydką osobą płci żeńskiej, ma pryszcze i „quigee". I oczywiście jest osobą, a zatem jest niska, ma rude włosy i ma ciało. Czy mam porównać Mary z innymi znanymi mi osobami? Korygowanie błędów Jest oczywiste, że dokonując uogólnień system pamięci może posługiwać się wyłącznie tą informacją, którą dysponuje w danym momencie. Prowadzi to do nieuniknionych w tej sytuacji błędów, ponieważ jego wiedza może być dość szczupła. 425 Ta cecha systemu jest zbieżna z zachowaniem się rzeczywistych ludzi. Powinna jednak istnieć jakaś przeciwwaga dla tej tendencji do nadmiernych uogólnień; niezbędny jest mechanizm przebudowywania pojęć w miarę napływu dalszych informacji. W danym momencie nasz system pamięci przechowuje następujące informacje, związane z pojęciem osoby: osoba ... jesto istota ludzka. ... jest niska. ... ma ciało. ... ma rude włosy. Mary jesto ... klient jesto ... N1 jesto ... Aby uprościć opis danego węzła, podstawiamy trzy kropki na miejsce tego pojęcia, które chcemy zdefiniować. Tak więc ... jesto istota ludzka, oznacza informację, że osoba jesto istota ludzka, a Mary jesto ... reprezentuje informację, że Mary jesto osoba. Przypuśćmy, że dostępne są następujące fakty: Osoba jest szczęśliwa. Luiza jesto osoba. Harry jesto osoba Jak dotąd, nie ma specjalnych problemów. Dodajmy te trzy fakty do listy rzeczy, które już wiemy o osobie, i utwórzmy też trzy nowe pojęcia: szczęśliwy, Luiza i Harry. (Od tego miejsca byłoby dobrze, żebyście przerysowali schemat, który został przedstawiony na rysunku 11-11 i wprowadzili doń trzy wskazane uzupełnienia, tak abyście mogli go przekształcać w miarę jak będziemy posuwali się naprzód. Ułatwi wam to zapis dalszych wywodów). Przypuśćmy, że dowiedzieliśmy się nowych szczegółów: Sam jest radykałem. Sam jest brzydki. Informacja ta umożliwia dalsze udoskonalenie schematu. Przede wszystkim do definicji pojęcia Sam dodajemy nowe informacje, że Sam jest brzydki i jest radykałem. Podobnie dodajemy Sam do definicji pojęć radykał i brzydki. Zauważmy, że Mary jest również brzydka, ale jest to jedyna, wspólna dla obojga cecha. Jednakże zarówno Sam, jak i Bob są radykałami. I jeszcze do tego obaj są NI. Stąd też wynika nowe uogólnienie - NI jest radykałem. Struktura pamięci przedstawia się teraz w sposób następujący (rys. 11-12): 427 Sam ... jesto N1. ... jest bystry. ... jest brzydki. Bob ... jesto N1. N1 ... jesto osoba. ... jest płci męskiej. ... jest radykałem. ... Sam jesto ... Bob jesto Załóżmy, że wiedza systemu pamięci dotycząca ludzi ciągle rośnie, a szczególnie wiedza dotycząca Luizy. Dotychczas system wiedział o Luizie tylko tyle, że Luiza jesto osoba. Teraz dochodzą następujące nowe informacje: Luiza ... jesto osoba. ... jest stara. ... jest przystojna. ... jest głupia. ... jest wysoka. Co nam teraz wyszło? Luiza jest wysoka, ale Luiza jesto osoba, a osoba jest niska. W tym punkcie system pamięci musi przedsięwziąć określone środki w celu usunięcia konfliktu. Pierwsza rzecz, jaką musi uczynić, to sprawdzić prawdziwość napływającej informacji, zadając informatorowi następujące pytanie: Czy masz pewność mówiąc, że Luiza jest wysoka? Jeżeli informacja została sprawdzona, system musi znaleźć sposób skorygowania wcześniej dokonanego, nadmiernego uogólnienia. Jedna ze strategii polega na tym, aby wycofać sporną informację z pojęć wyższych i przenieść ją do węzłów wszystkich pojęć podrzędnych. Inaczej mówiąc, należy wycofać twierdzenie osoba jest niska z definicji osoby, skoro są dowody przeciw takiemu umiejscowieniu tego twierdzenia, i przypisać je tym osobom, o których pamięć wie, że są niskie, a w szczególności Mary, N1 i Harry'emu (rys. 11-13). Następnie system powinien w stosunku do każdej z tych osób dokonać ponownej analizy zgodności cech. 428 Druga strategia-i ją właśnie przyjmiemy-polega na podzieleniu pojęcia osoby na dwie różne grupy, w zależności od tego, czy są one wysokie czy też niskie. W ten sposób tworzymy pojęcia N2 i N3: N2 ... jesto osoba. ... jest niska. ... Mary jesto ... NI jesto N3 ... jesto osoba. ... jest wysoka. ... Luiza jesto Teraz musimy dokonać odpowiednich zmian w pojęciu osoba. Oto co otrzymaliśmy: osoba ... jesto istota ludzka. ... ma ciało, ... klient jesto ... N2 jesto ... N3 jesto A co z Harrym? Wszystko, co o nim wiemy, to, że na pewno jesto osoba (a zatem, jak wszystkie pozostałe osoby, jest szczęśliwą rudowłosą istotą ludzką). Ale przypuśćmy, iż dowiedzieliśmy się jeszcze o tym, że: Harry jest stary. Harry jest przystojny. Harry jest wysoki. Harry, jak z tego wynika, jest bardzo podobny do Luizy. Harry jesto N3, jest jedną ze starych, wysokich przystojnych osób. Udało nam się zgromadzić raczej pełną listę cech. Wszystkie zostały przedstawione na rysunku 11-14. Jak na razie brak tu jedynie uogólnienia informacji, że Luiza i Harry są oboje przystojni i starzy. Jeżeli byłaby to pamięć ludzka, człowiek mógłby rozważyć, co wie jego bank danych i przeprowadzić następujący wywód (rys. 11-14): Czy Mary jest radykałem? Jeżeli tak, to radykał może być płci męskiej lub żeńskiej i jest bardzo prawdopodobne, że Bob jest brzydki. Jeśli się dobrze nad tym zastanowić, to idę o zakład, że Harry jest głupi. Czy radykałowie płci męskiej mają pryszcze? 429 Rozważam sobie pojęcie osoby. Każda osoba, najwidoczniej, ma ciało, rude włosy i jest szczęśliwa. Jest ona również istotą ludzką. Jak widać, są dwa podstawowe typy osób: jeden typ to osoby wysokie, stare i przystojne, drugi zaś to osoby niskie. Osoby niskie też mogą dzielić się na dwa typy, jeden jest płci żeńskiej, gruby, brzydki, mający pryszcze i „quigee". Drugi to radykałowie płci męskiej. Niektórzy radykałowie są bystrzy ale brzydcy. Niektóre wysokie, przystojne osoby wydają się głupie. Ocenianie na wejściu Posunęliśmy się znacznie naprzód. W gruncie rzeczy nasz model jest już na tyle rozbudowany, że można by rozstrzygnąć pewne kwestie przedstawione na wstępie. Jak się zachowa omawiany system pamięci, kiedy otrzyma jedno z zadań, o których mówiliśmy poprzednio? Czy pamiętacie to stwierdzenie? Ci autorzy są faszystami. Proponowaliśmy wam wówczas, żebyście nie przyjmowali biernie tego twierdzenia, lecz próbowali aktywnie je zinterpretować. Interesowało nas, jakimi regułami posługujecie się przy ocenie tej informacji wejściowej. Teraz mamy już określone podstawy do zbadania tego typu oceny. Rysunek 11-15 przedstawia schemat pamięci, którym będziemy się posługiwać. 430 Zauważcie, że w stosunku do poprzedniego uległ on pewnej reorganizacji. Ponadto, co jest widoczne, zawiera więcej informacji o Mary, Bobie i Samie, ponieważ odpowiadające im pojęcia zostały uogólnione jako N2. Pamięć ta miała już do czynienia ze słowem faszyści, ale wie jedynie to, że faszyści są okrutni. I teraz otrzymuje informację: Osoba jesto faszysta. Tym razem nie wystarczy już akceptacja wartości fasadowej tej informacji. Teraz pamięć musi powiązać napływającą informację z tymi, które już poznała. Informator: Osoba jest faszystą Pamięć: Mało wiem o faszystach, ale nie przypuszczam, żeby osoba miała ogólną cechę tego typu. Być może, mówisz o jakiejś określonej osobie. Czy faszyści są wysocy czy niscy? Informator: W istocie rzeczy faszyści są zazwyczaj niskiego wzrostu tak jak Hitler, Mussolini i Napoleon. Pamięć: Aha. Czy są. brzydcy? Informator: Tak bym ich określił. Pamięć: I są radykałami? Informator: W pewnym sensie. Pamięć: Rozumiem. Znam takich ludzi, którzy są faszystami. Po prostu nigdy ich tak nie nazywałem. Ale, ale, czy są osoby, które już wymieniłeś, Hitler, Mussolini i Napoleon, to mężczyźni czy kobiety? Informator: Mężczyźni. Pamięć: Dziękuję. Zapamiętam to sobie. 431 Ta część pamięci, która uczestniczy w powyższym dialogu, została przedstawiona na rysunku 11-16. Pierwsza sprawa, jaką należy zaznaczyć, to fakt, że N2 otrzymało nową nazwę: N2 oznacza to samo co faszysta. A zatem w drodze implikacji bank danych zakoduje, że faszyści bywają grubi, niscy, brzydcy i okrutni i że wobec tego Mary, Bob i Sam są faszystami. Opracowaliśmy tak dokładnie te przykłady, aby zilustrować kilka możliwych procedur stosowanych do reorganizacji informacji przechowywanej w banku danych. 432 Jedna z procedur polega na uogólnieniu, dedukowaniu wspólnych cech różnych pojęć. Inna wprowadza specjalny podział na klasy, przy założeniu, że takie wyspecjalizowane klasyfikacje okażą się kiedyś przydatne. Jeszcze inna procedura polega na wyszukiwaniu, a następnie eliminowaniu błędów i niezgodności. Ćwiczenie: Z banku danych dotyczących garnków i pojemników (rys. 11-2) należy wyeliminować następującą niezgodność, że garnek powinien być wykonany z metalu, jednak równocześnie imbryk może być wykonany z fajansu, chociaż w schemacie jest określony jako garnek. PENETRACJA BANKU DANYCH Jak wiele danych może być objętych jednocześnie procesem interpretacji? Dotychczas przedstawialiśmy na rysunku taki schemat banku danych, który w całości był obejmowany jednoczesną obserwacją: w takich warunkach nie trudno zrozumieć wzajemne powiązania między przedstawionymi rzeczami. Jest jednak bardzo prawdopodobne, że system interpretujący nie obejmuje całego schematu w jednym akcie obserwacji. Jeden ze sposobów przedstawienia sobie tego może być na przykład taki, że interpretator ogląda sieć banku danych oświetlając go latarką. Wtedy widzi jedynie to, co zostało oświetlone. Powstaje pytanie, jak szeroki jest snop światła rzucanego przez latarkę? Porównując ze sobą rysunki 11-17 i 11-18, dostrzegamy różne możliwe poziomy widoczności. (Zauważcie, że analogia ze snopem światła nie jest zbyt ścisła, ponieważ w rzeczywistości stopień dostępności sieci w banku danych mierzony jest liczbą równocześnie spostrzeganych strzałek i pojęć, a nie fizyczną miarą średnicy plamy świetlnej). [Rysunek 11-18 przedstawia cztery wycinki schematu 11-17 w różnym stopniu obejmujące dane do interpretacji. Najwęższe pasmo – Piwo + dwie strzałki dochodzące i jedna wychodząca nieopisane. Wąskie pasmo – Piwo + dwie strzałki dochodzące: ma i jesto, i dwie strzałki wychodzące: jesto i jest. Średnie pasmo – Piwo jesto Napój; Piwo jest Fermentujące ziarno; Tawerna ma Piwo; Lager jesto piwo; Fermentujące ziarno + strzałka wychodząca nienazwana. Dość szerokie pasmo - Piwo jesto Napój; Piwo jest Fermentujące ziarno; Tawerna ma Piwo; Lager jesto piwo; Tawerna ma; Tawerna jesto; Tawerna jesto; Lager jesto; Lager ma; Lager jest; Fermentujące ziarno jesto; Fermentujące ziarno jest; Napój jest; Napój + strzałka dochodząca jesto; Napój + strzałka wychodząca nienazwana.] 434 Ograniczenia w tym, co człowiek może „widzieć" w jakimś jednym momencie w procesie wydobywania informacji ze swej pamięci, mogą w rzeczywistości polegać na ograniczeniach pamięci krótkotrwałej. Jest bardzo prawdopodobne, że to pamięć krótkotrwała przetrzymuje informację w celu przetworzenia jej w procesie interpretacyjnym. Zakres tej pamięci jest mierzony w jednostkach psychologicznych. Spróbujmy zastanowić się nad tym, jaki charakter mają te jednostki. Możliwe, że jednostką pamięci krótkotrwałej jest węzeł. Można sobie łatwo wyobrazić, że ograniczona liczba węzłów zmieści się w pamięci krótkotrwałej, co z kolei ograniczy zdolności procesu interpretacyjnego do wyszukiwania oceny informacji przechowywanych w banku danych (tzn. w pamięci długotrwałej). Przeprowadźmy następujący eksperyment myślowy. Rozważmy incydent w lokalu „u Luigiego" opisany i przedstawiony na rysunku 11-3 w tym rozdziale i na rysunku 10-16 w poprzednim rozdziale. Wyobraźmy sobie tę scenę: „U Luigiego" - to ciemna, zadymiona tawerna, gdzie konsumenci siedzą w boksach w słabo oświetlonych rogach sali. Właściciel Al, to towarzyski sympatyczny gość. W pobliżu kręci się zawsze jego pies Henry. Nagle w grupie osób siedzących w rogu wybucha kłótnia. Słychać, jak Sam wrzeszczy na Mary. Henry, pies Ala, gryzie Sama; w pewnym momencie w trakcie tego rozgardiaszu Mary uderzyła Luizę. Postarajcie się wywołać w swojej wyobraźni całą tę scenę. Czy wszystko jest jasne? Jeśli tak, to powiedzcie: Jakiej rasy jest pies Henry? Jak długi jest jego ogon? Spójrzcie na jego obrożę. Jaki napis widnieje na blaszce przyczepionej do obroży? Większość osób zgodzi się zapewne z tym, że istnieją pewne granice wyobrażania sobie tej czy innej sceny. I chociaż początkowo wydawało im się, że wyobrażają sobie dokładnie i wyraźnie całą bójkę w tawernie, to wystarczy zadać im kilka pytań dotyczących szczegółów ubioru osób, długości czy koloru ich włosów, czy nawet szczegółów samej tawerny, a muszą przyznać, że obraz nie jest tak dokładny, jak sądzili. Gdyby poproszono Was o przyjrzenie się psu, to jego obraz znajdzie się w centrum Waszej świadomości, pozostałe szczegóły incydentu, chociaż w pewnym sensie nie przestają istnieć, znikają z centralnego miejsca w procesie myślowym. Można tak iść w nieskończoność. Gdyby poproszono Was o przyjrzenie się różnym szczegółom psa, to wówczas okazałoby się, że obraz samego psa nie jest już taki wyraźny. Badając obrożę, gubimy z pola widzenia części ciała psa. W gruncie rzeczy, jeżeli skoncentrujemy uwagę na blaszce wiszącej przy obroży, to stwierdzimy, że sama obroża zeszła na dalszy plan i jakby rozpłynęła się we mgle. Bardzo interesujące wydaje się założenie, że w pamięci krótkotrwałej może mieścić się jednocześnie tylko ograniczona liczba węzłów (to znaczy, mówiąc obrazowo, tyle, ile promień światła latarki zdoła oświetlić). Jest też prawdopodobne, że w banku danych znajduje się wtórny węzeł centralny, odnoszący się do całego incydentu w tawernie „u Luigiego" (nie pokazany na schemacie). Można go analizować, lecz jest to ogólne pojęcie zdarzenia, które nie powinno obejmować żadnych szczegółów. Kiedy śledzimy któryś ze szczegółów, na przykład węzły reprezentujące każdego uczestnika incydentu, inne węzły przedstawiające pozostałe szczegóły zdarzenia przestają być widoczne. Istnieje też, chociaż nie jest pokazany na schemacie, złożony zbiór połączeń dotyczących Henry'ego, określający jego wygląd zewnętrzny i szczegóły jego psiego żywota. Jeżeli zajmiemy się szczegółową analizą odpowiednich węzłów, to węzły sąsiednie stają się słabo widoczne, a te bardzo odległe (na przykład rola Henry'ego w incydencie „u Luigiego") pozostają z dala od centrum rozważań. 435 ROZUMIENIE A ZAPAMIĘTYWANIE Główną implikacją tych rozważań jest to, że system pamięci koduje znaczenie tego, czego doświadczaliśmy, a nie samo doświadczenie. Ludzie starają się raczej zrozumieć, niż zapamiętać. Rozważmy następujący eksperyment (Brandsford i Franks, 1971). Badani zapoznają się z historyjką składającą się z oddzielnych zdań: Głaz stoczył się z góry. Głaz uszkodził chatę. Chata stoi nad rzeką. Chata jest mała. Zdania te nie były prezentowane w takiej kolejności, ale zostały przypadkowo pomieszane z innymi zdaniami, które nie wiążą się z tą historyjką, takimi jak: Wietrzyk jest ciepły. Mrówki zjadły galaretkę. Opowiadanie jest wydrukowane w gazecie. Galaretka jest słodka. Osoby badane mają wybrać ze wszystkich prezentowanych zdań te cztery, które składają na historyjkę, a następnie ułożyć je we właściwym porządku (ze wszystkich prezentowanych zdań można było zbudować cztery historyjki). Po prezentacji każdego oddzielnego zdania badany odpowiadał na proste pytania (Co zrobił? Gdzie?), aby się upewnić, że prawidłowo zrozumiał każde zdanie. Następnie w 5 minut po zakończeniu ekspozycji wszystkich zdań, osobom badanym postawiono pytania testowe; proszono je, aby stwierdziły, czy słyszały wcześniej dane zdania kontrolne, czy też nie. Na przykład takie trzy zdania: A. Głaz uszkodził chatę. B. Głaz uszkodził małą chatę nad rzeką. C. Głaz jest mały. Zdanie A jest to jedno z tych zdań, które było prezentowane pierwotnie. Badany powinien potwierdzić, że przypomina je sobie. Zdanie C nie należy do tej grupy, co więcej, jego znaczenie różni się od tego, co było prezentowane. Zdanie B jest najbardziej interesujące, chociaż bowiem jego znaczenie jest właściwe, to w takiej formie nie było prezentowane. Jak badani przypominają sobie te zdania? Rysunek 11-19 przedstawia cztery zdania i ich struktury. [Schemat zdania: Głaz stoczył się z góry. STOCZYĆ SIĘ strzałka miejsce Z góry, strzałka czas Przeszły, strzałka przedmiot Głaz. Schemat zdania: Głaz uszkodził chatę. USZKODZIĆ strzałka przedmiot Chata, strzałka czas Przeszły, strzałka instrument Głaz. Schemat zdania: Chata stoi nad rzeką. Chata strzałka miejsce Rzeka. Schemat zdania: Chata jest mała. Chata strzałka jest Mała. Schemat zdania: Głaz, który stoczył się z góry, uszkodził małą chatę nad rzeką. W schemacie dwa węzły centralne: STOCZYĆ SIĘ, USZKODZIĆ, z obu wychodzą po trzy strzałki. Po jednej do słowa Głaz, strzałka przedmiot i strzałka instrument; po jednej do pojęcia Czas przeszły, strzałki czas. Trzecia strzałka o nazwie miejsce wychodzi z pierwszego węzła (STOCZYĆ SIĘ) do określenia Z góry. Trzecia strzałka z węzła drugiego (USZKODZIĆ) nazwana przedmiot dochodzi do słowa Chata. Chata łączy się strzałką miejsce ze słowem Rzeka i strzałką jest ze słowem Mała.] 436 Zauważcie, że sposób kodowania informacji przez system pamięci pozwala połączyć wszystkie struktury w jedną (rys. 11-19). Jeśli w pamięci przechowana jest właśnie ta ostatnia, to w jaki sposób można stwierdzić, czy zdanie B było prezentowane, czy też nie? Niewątpliwie jest zgodne ze schematem. Zdanie C jest wyraźnie błędne: przeczy bowiem temu, co zostało przechowane w pamięci. Ale zdania A i B są równie dobre. W omawianym eksperymencie zestaw zbudowany był ze zdań kontrolnych o różnym stopniu złożoności: niektóre zdania zawierały większą liczbę prostych myśli niż pozostałe, na przykład: Test 1. Chata stoi nad rzeką. Test 2. Głaz uszkodził małą chatę. Test 3. Głaz uszkodził małą chatę nad rzeką. Test 4. Głaz, który stoczył się z góry, uszkodził małą chatę nad rzeką. 437 Jedynie pierwsze z tych zdań było prezentowane naprawdę badanym w eksperymencie (Test 1). Kiedy jednak zapytano osoby badane, które z tych zdań słyszały one już wcześniej, uzyskano zaskakujące wyniki: większość wskazała na Test 4, który w ogóle nie był prezentowany. Następny w kolejności uzyskanych głosów okazał się Test 3. Natomiast co do Testów 2 i 1 (a zdanie Test 1 - to jedyne, które rzeczywiście było prezentowane) osoby badane zdecydowanie twierdziły, że ich nie widziały. Nie mogło być inaczej. Pamięć zakodowuje i przechowuje myśli i znaczenie. A zatem, osoby badane powinny rozpoznawać zdania tym łatwiej, im bardziej są one zgodne ze znaczeniem, które zachowało się w ich pamięci. Zdanie Test 4 stanowi najpełniejszy opis zdarzeń, taki, jaki został zapamiętany, a zdanie Test 1 pokrywa się z nim jedynie częściowo. PAMIĘĆ JAKO PROCES PRZETWARZANIA INFORMACJI Opis struktury pamięci dokonany w tym rozdziale przedstawia całkiem inny punkt widzenia na naturę uczenia się, aniżeli ten, który wynika z analizy tworzenia się skojarzeń w klasycznych zadaniach dotyczących uczenia się. Różnica ta polega na położeniu nacisku na dynamiczne i integracyjne procesy pamięci. System uczy się poprzez aktywną interakcję z otoczeniem, a nie w wyniku pasywnego tworzenia związków między bodźcem a reakcją. Taki sposób działania przenika wszystkie nasze doświadczenia i jest podstawowym sposobem, w jaki regulujemy nasze stosunki z otaczającym światem. Prawdopodobnie wielu z Was zapoznało się w dzieciństwie z opowieścią o Hiawacie. Czy pamiętacie pierwsze wrażenie, jakie wywarł na was bohater opowieści? Jak myślicie, czy pod wpływem lat zmieniły się Wasze wyobrażenia o nim? Dlaczego tak się stało? Czy dlatego, że przeczytaliście ponownie tę legendę, czy też w rezultacie tego, że dziś wiecie więcej o świecie, który was otacza, o Indianach, o specyfice literatury dziecięcej i o dawnych amerykańskich tradycjach związanych z folklorem indiańskim? Klasyczne teorie uczenia się zazwyczaj wychodzą z założenia, że wielokrotne oddziaływanie specyficznego bodźca stanowi podstawę zdobywania informacji. Jednak fakt, że stale wzbogaca się nasz zakres pojęć, a ponadto dokonuje się ciągłe ich porządkowanie i wzbogacanie nawet wówczas, gdy nie stykamy się ponownie z danym pojęciem bezpośrednio, komplikuje założenia tych teorii. Natomiast taki rozwój jest naturalną właściwością systemu pamięci tego typu, jaki rozpatrywaliśmy. W miarę gromadzenia coraz większej ilości informacji o świecie, wiedza systemu pamięci nieustannie rośnie, stając się również bardziej precyzyjna. Automatycznie też w wyniku zmian struktury pamięci zmienia się wciąż nasza wiedza, będąc niejako produktem ubocznym tego procesu. Tak więc jest całkowicie zrozumiałe, że wasze obecne wyobrażenia dotyczące historyjki o Hiawacie różnią się znacznie od początkowych. Każda prowadzona teraz dyskusja dotycząca Hiawaty determinowana jest po części tym, czego o nim dowiedzieliście się początkowo, 438 a po części tym, co sobie na ten temat myśleliście od tego czasu. Spróbujcie przypomnieć sobie tę historyjkę: czy wasza rekonstrukcja nie polega na tym, że staracie się przypomnieć sobie przede wszystkim to, co rzeczywiście w niej było? Ciągły rozwój gromadzonej wiedzy, przechowywanej w systemie pamięci, wywiera istotny wpływ na to, w jaki sposób przyswajana jest nowa informacja. On też wyznacza tę ogromną różnicę, jaka istnieje między sposobem zakodowania informacji w pamięci dziecka a sposobem, w jaki ta sama informacja zostaje zakodowana przez dorosłego. U dziecka każde nowe pojęcie powinno tworzyć się na pustym miejscu. Początkowy etap konstrukcji banku danych nieuchronnie związany jest z olbrzymią ilością informacji, zapamiętywanej w sposób mechaniczny. Zrozumienie dokonuje się powoli, w miarę gromadzenia się cech przedmiotów, poznawania przykładów oraz rozwoju pojęć dotyczących rozumienia wzajemnych stosunków między klasami pojęć. Na początku większość pojęć znajdujących się w pamięci jest tylko w części zdefiniowana i słabo powiązana z innymi przechowywanymi informacjami. W późniejszych latach życia, kiedy nagromadzone zostały duże zasoby informacji i zorganizowane w bank danych o rozwiniętym systemie krzyżujących się połączeń, uczenie się nabiera zazwyczaj innego charakteru. Nowe pojęcia mogą już teraz być przyswajane głównie na podstawie analogii z tym, co jest już znane. Główny problem polega teraz na włączeniu nowego pojęcia do istniejącej struktury. Kiedy zostanie ustalony związek między nimi, całe uprzednie doświadczenie jest automatycznie włączone do pełniejszej interpretacji i rozumienia tych nowych zdarzeń. W modelach tego typu występowanie różnic indywidualnych oraz systemów idiosynkratycznych będzie raczej regułą niż wyjątkiem. Rozumienie rozwija się w wyniku połączenia doświadczenia zewnętrznego z mechanizmami wewnętrznymi, które manipulują i reorganizują napływającą informację. Pamięć dwóch różnych osób rozwijałaby się jednakowo jedynie pod warunkiem, że otrzymują one dokładnie taką samą informację w jednakowym porządku i posługują się identycznymi procedurami, pozwalającymi na jej przyswojenie i organizację. A zatem, jest bardzo mało prawdopodobne, żeby u dwu różnych osób ukształtowała się jedna i ta sama struktura pojęciowa, przedstawiająca świat ich doświadczeń. Zauważcie, co leży u podstaw takiego idiosynkratycznego rozwoju. Przyjmujemy, że podstawowa struktura pamięci, jak również procesy przetwarzania informacji powinny być jednakowe u wszystkich ludzi. Jednakże, jeśli nawet podstawowe mechanizmy są Jakie same, nie zawsze prowadzi to do pojawienia się takich samych struktur pamięciowych. To, co człowiek sądzi, zależy zarówno od jego doświadczenia, jak i od kolejnych wnioskowi dedukcji, jakie stosowane były w toku gromadzenia informacji. Nawet bardzo subtelne różnice w otoczeniu mogą pozostawić różne ślady w pamięci, bez względu na to, że podstawowe mechanizmy interpretacji i pamiętania informacji są wspólne dla wszystkich ludzi. Zdolność do radzenia sobie z najróżnorodniejszymi sytuacjami za pomocą niewielkiego zbioru podstawowych mechanizmów stanowi, bez wątpienia, jedną z głównych cech adaptacyjnych systemu pamięci. Należy też się spodziewać, że elastyczność pamięci 439 w obchodzeniu się z nowymi informacjami będzie się ciągle zmieniała w miarę kształtowania jej struktury. Bardzo rzadko człowiek dorosły spotyka się z czymś zupełnie nowym, co jest nie powiązane z jego strukturą pojęciową. Niemal wszystko, z czym się styka, może być w jakiś sposób powiązane z tym, co jest mu znane z uprzednich doświadczeń. Nawet wówczas, gdy odbierana informacja jest wyraźnie sprzeczna z tymi doświadczeniami, jego struktura pojęciowa, która wypracowała tak skomplikowany system wzajemnych powiązań, sprzeciwia się rewizji. W rezultacie człowiek dorosły raczej woli odrzucić sprzeczne informacje lub zmienić ich znaczenie, aniżeli przebudować lub zmodyfikować system swych przekonań. Struktura pojęciowa u dzieci jest znacznie słabiej ukształtowana i powiązana wzajemnie niż u dorosłych. Nowe doświadczenie przyswajane jest w dużych dawkach, ponieważ sprzeczności pojawiają się rzadko. Spośród wielu jeszcze nie zbadanych obszarów dotyczących świadomości ludzkiej najbardziej interesujący jest interakcyjny aspekt umysłu ludzkiego. Człowiek zadaje pytania, analizuje własne doświadczenia, czyta, myśli, marzy i działa. Nawet bardzo pobieżne obserwacje wykazują, że zachowanie dziecka jest związane z aktywnym włączeniem otoczenia w proces systematycznego poszukiwania informacji niezbędnych do budowania jego wewnętrznej reprezentacji świata. Opisany przez nas model dotyczy właśnie tych spraw, lecz nie uwzględnia ich w pełnej mierze. Wskazywaliśmy pewien sposób, w jaki system pamięci może zadawać pytania w celu sprawdzenia tworzonych przez siebie porównań i wysuwanych wniosków, ale w gruncie rzeczy ten ważny problem potraktowaliśmy dość pobieżnie. Podstawowa trudność w danym momencie polega na braku systematycznych narzędzi analizy naturalnego, eksploracyjnego zachowania się człowieka w toku pracy i zabawy. Początek został jednak zrobiony. 12. Język Nabywanie znaczenia poprzez działanie Znaczenie nazw STRUKTURA JĘZYKA Struktura znaczeniowa a struktura powierzchniowa GRAMATYKA ANGIELSKA Przekazywanie struktury Przekazywanie znaczenia UCZENIE SIĘ JĘZYKA Uczenie się reguł Naśladownictwo Jeżyk jako środek komunikowania się Pierwsze kroki w komunikowaniu się Wytwarzanie a rozumienie Nadmierna generalizacja Rozumienie 441 [W rozdziale tym znajduje się wiele schematów, które nie zostały opisane ze względu na zbyt skomplikowaną strukturę.] Rozumienie języka stanowi z pewnością unikalną i najważniejszą właściwość ludzkiego umysłu. Systemy językowe są tak złożone, że do tej pory nikomu jeszcze nie udało się dać pełnego opisu reguł tworzących te systemy. A mimo to każde normalne dziecko może opanować dowolny istniejący język. W miarę rozwoju jego zdolności do porozumiewania się za pomocą symboli, język i myślenie dziecka przeplatają się tak silnie, że niemożliwe już staje się ich rozdzielenie. Opanowanie języka stanowi punkt zwrotny w rozwoju dziecka. Dziecko zaczyna posługiwać się językiem w wieku około dwóch lat i, jak pokażemy w rozdziale 13, zmienia się podłoże jego wiedzy o otaczającym świecie: następuje przejście od doświadczeń czysto sensorycznych i motorycznych do operacji na symbolach. Od tego momentu dziecko nie musi uczyć się wyłącznie poprzez własne doświadczenia. Może ono uczyć się za pomocą języka. Nabywanie znaczenia poprzez działanie Działanie jest podstawą początkowej wiedzy nabywanej przez dziecko. Poprzez działanie niemowlę tworzy ogólne pojęcia o przedmiotach, z którymi się styka. Tak więc jego pojęcie o psie może być oparte na odczuciu dotykowym sierści psa i na zabawnych dźwiękach, jakie wydaje pies, kiedy zostanie uszczypnięty, a pojęcie piłki może opierać się na jej ruchu, kiedy zostanie wyrzucona. Do czasu opanowania języka struktury percepcyjne i poznawcze mogą tworzyć się wyłącznie na podstawie działania wynikającego z doświadczeń. Te wczesne struktury zawierają sekwencje działań wykonywanych przez dziecko w odniesieniu do jego otoczenia. Rozwój odpowiednich schematów działań zostanie dokładnie omówiony w rozdziale 13. Tu wystarczy zaznaczyć, że schematy łączące doznania sensoryczne z działaniami motorycznymi zwane są schematami sensoryczno-motorycznymi. Różnorodne schematy sensoryczno-motoryczne wyuczone przez dziecko w pierwszych dwóch latach, plus wiedza o stałości i niezależności przedmiotów i zdarzeń, tworzą tę podstawę, na której stabilizuje się opanowanie języka. Nawet po opanowaniu języka wczesne mechanizmy inteligencji sensoryczno-motorycznej odgrywają nadal decydującą rolę w organizowaniu doświadczeń dziecka. Jeszcze przez długi czas po opanowaniu języka, działanie pozostanie dla normalnego dziecka centralną częścią jego struktury pojęciowej. Poproście siedmioletnie dziecko o zdefiniowanie dowolnego przedmiotu codziennego użytku, a odpowiedź będzie oparta na jego działaniu: stoły są do jedzenia; krzesła są do siedzenia; ojcowie są do bawienia się. Język rozwija się w ramach inteligencji sensoryczno-motorycznej. Początkowo problem uczenia się języka może sprowadzać się głównie do przyswojenia językowych etykietek - nazw - dla istniejących już schematów sensoryczno-motorycznych. Pierwsze kroki dziecka w posługiwaniu się językiem to nazywanie znanych mu już przedmiotów: zabawek, członków rodziny, prostych przedmiotów z otoczenia. Dziecko nazywa również swoje własne czynności: nie przypadkowo dzieci często rozmawiają same ze sobą. Ale w końcu struktura taka jest niewystarczająca. 442 Znaczenie nazw W miarę jak dziecko zaczyna posługiwać się symbolicznymi nazwami, przekształca się podstawa, na której buduje ono swe pojęcia; z organizacji pojęciowej opartej na działaniu stopniowo przechodzi do organizacji opartej na słowie. Kiedy język zaczyna uczestniczyć w kształtowaniu pojęć, słowa przejmują rolę punktów oparcia dla struktury pojęciowej. Od chwili, gdy słowo staje się nazwą przedmiotu lub zdarzenia, można myśleć manipulując słowami, a to jest często znacznie prostsze niż manipulowanie samymi pojęciami. Czy jednak posługiwanie się nazwami (etykietkami językowymi) wpływa na zmianę naszego sposobu myślenia? Czy wpływa na to, co widzimy, czego oczekujemy, co pamiętamy? Siła słów polega na ich nieograniczonej wręcz elastyczności. Nazwy są nadawane arbitralnie. Każda wspólnota językowa dysponuje w pewnym stopniu swobodą w zakresie sposobu podziału swego percepcyjnego doświadczenia poprzez przypisywanie nazw określonym sferom tego doświadczenia. Dowolny zbiór konkretnych przedmiotów może zostać połączony dzięki nadaniu mu ogólnej nazwy, a tym samym można włączyć do rozwijającej się struktury pojęciowej dziecka określony wzorzec uogólnienia i różnicowania. Dziecko z Filipin musi budować system pojęciowy pozwalający mu rozróżnić 92 rodzaje ryżu; dziecko eskimoskie musi umieć rozróżnić dziesiątki rodzajów śniegu. System symboli, którym posługuje się dana społeczność językowa, odzwierciedla te struktury percepcyjne i symboliczne, które odgrywają w życiu tych społeczności rolę najważniejszą. Jest jednak całkiem oczywiste, że opanowanie języka nie wpływa bezpośrednio na zdolności percepcyjne. Każdy człowiek, bez względu na to, jakim posługuje się językiem, może odróżnić różne rodzaje ryżu, które otrzymały specjalne nazwy u mieszkańców Filipin, nawet wówczas, gdy nie potrafi ich odpowiednio nazwać. A nawet więcej, potrafi bowiem opisać te różnice za pomocą symboli językowych - dany rodzaj ryżu jest drobnoziarnisty, bardziej owalny i ciemniejszy-chociaż musi użyć w tym celu więcej słów. Zapamiętanie prostego percepcyjnego doświadczenia jest bezpośrednio powiązane z tym, jak prosto dany język potrafi oddać to doświadczenie, ponieważ efektywność kodowania doświadczenia w pamięci uzależniona jest od gotowej struktury symbolicznej banku danych. Sposób, w jaki dany język odnosi się do doświadczenia percepcyjnego, może wywierać znaczny wpływ na kodowanie i przechowywanie informacji sensorycznej. Przypomnijmy sobie, że istnieją poważne podstawy, aby sądzić, iż napływająca informacja jest częstokroć kodowana w postaci akustycznych etykietek, zanim dotrze do pamięci długotrwałej. Etykietki te mogą pełnić rolę potencjalnego filtra informacji, która zostanie przechowana o danym zdarzeniu. Wydaje się, że każda wspólnota językowa wypracowuje własne struktury znaków, od których to zależy łatwość kodowania, przechowywania i mówienia na temat określonych doświadczeń percepcyjnych. Zdarzenia i spostrzeżenia ważne dla danej wspólnoty są zwykle nazywane bezpośrednio za pomocą niewielkiej liczby słów. Słowa wydają się podporządkowane pewnej zasadzie (zwanej prawem Zipfa). W większości języków najczęściej używane słowa 443 są zarazem najkrótsze. Zwróćmy na przykład uwagę na długość przyimków: w, do, na. Stanowią one specjalną klasę słów, których używa się bardzo często, ponieważ oddają one ogólne relacje istniejące między pojęciami. Skróty odpowiadają tej samej zasadzie. Nowości technologiczne wprowadzane do naszego życia, takie jak automobil czy telewizja, początkowo otrzymują stosunkowo długie opisowe określenia. Jednak w miarę tego, jak ich użycie w języku staje się coraz częstsze, przeważa tendencja do łatwości i ekonomii w procesie porozumiewania się: automobil zastępuje auto lub wóz, telewizję natomiast TV (W oryg. angielskim: automobil-auto, car, television-TV, telephone-phone). A mimo to tyrania słów nie jest absolutna. Ludzie ze wszystkich wspólnot językowych mogą wymieniać między sobą dowolne informacje percepcyjne, które są komunikowane innych językach, chociaż pewne rzeczy mogą okazać się dla nich trudniejsze niż inne. Każdy język wpływa w szczególny sposób na struktury wewnętrzne, uczestniczące zazwyczaj w nabywaniu doświadczeń i zapamiętywaniu, jednak wpływ ten nie dotyczy mechanizmów poznawczych, które są podstawą powstawania tych struktur. STRUKTURA JĘZYKA Nie ma reguł pozwalających określić znaczenie słowa na podstawie jego brzmienia. Odpowiedniość między dźwiękiem a znaczeniem musi być wyuczona oddzielnie dla każdego słowa w danym języku. Jeżeli zdania byłyby budowane z oddzielnych słów według tych samych zasad, które odnoszą się do konstrukcji wyrazów z oddzielnych dźwięków, to język straciłby swą ogromną giętkość jako narzędzie wyrażania i przekazywania myśli. Ponadto, ponieważ trzeba byłoby uczyć się oddzielnie znaczenia każdego nowego ciągu słów, liczba możliwych połączeń słów przewyższyłaby znacznie zdolność naszego systemu pamięci. Konieczny byłby wówczas słownik do określania znaczeń każdego możliwego zdania. Jest oczywiste, że język zbudowany jest inaczej. Znaczenia pojedynczych wyrazów w zdaniu łączą się zgodnie z zasadami gramatyki, tworząc znaczenie całego zdania. Sposób, w jaki powstaje to znaczenie, nie jest prosty. Nie wystarczy po prostu dodać do siebie znaczenia oddzielnych słów, aby uzyskać znaczenie zdania. Jeżeli byłoby to tak proste, to wyuczenie się języka nie sprawiałoby żadnej trudności: dziecko uczyłoby się znaczeń pojedynczych wyrazów, a następnie uczyłoby się łączyć ze sobą wyrazy, kiedy potrzebowałoby połączyć ich znaczenia. Istnieje jednak ogromna różnica między użyciem języka jako mechanizmu nazywania przedmiotów a językiem jako środkiem wyrażania twierdzeń o świecie. Jeżeli dana wypowiedź obejmuje więcej niż jedno pojęcie, to relacje między tymi pojęciami stają się ważne. Tak więc ze słów: pies, John, gryźć, nie wynika, kto rzeczywiście gryzie: John czy pies? Aby odpowiedzieć na to pytanie, trzeba znać reguły konstruowania znaczących ciągów słów. Język, dzięki swej złożoności, stanowi użyteczne narzędzie komunikowania się, ale równocześnie jest dla dziecka (albo też dorosłego) trudny do przyswojenia. 444 Struktura znaczeniowa a struktura powierzchniowa Przeanalizujmy sieć związków znaczeniowch i działań przedstawioną na rysunku 12-1. Jest to obraz możliwego systemu znaczeń reprezentowanych w strukturze pamięci jakiejś osoby. Zbudowano go zgodnie z oznaczeniami wprowadzonymi w rozdziałach 10 i 11, a ilustruje on sytuację omawianą w rozdziale 13. Przypuśćmy, że zależy nam na tym, aby człowiek dorosły zrozumiał związek między krążkiem a odpowiednim otworem w automacie. Zamiast pozostawić go w pokoju zdanego na przypadek, kiedy to kręcąc się po pomieszczeniu odkryje wreszcie ten związek, lepiej będzie powiedzieć mu: Za każdym razem, kiedy znajdzie się pan w pomieszczeniu, w którym będą te właśnie niebieskie krążki i taki automat z otworem, a będzie pan miał ochotę na winogrona, wystarczy włożyć krążek do automatu, a pojawią się winogrona. Język można rozpatrywać jako metodę przekazywania struktury pamięci mówiącego strukturze pamięci słuchającego. Mówiąc o języku, dokonujemy rozróżnienia między słowami służącymi do przekazywania myśli a samymi myślami. Słowa są jedyną częścią składową zachowania językowego, która da się obieklyw4iie..rejestrować. Z tego właśnie powodu nazywamy "konkretne zdania, zarówno pisane, jak i mówione strukturami powierzchniowymi danego języka. Nie można zobaczyć znaczenia, ponieważ zależy ono od struktury pamięci ludzi włączonych w sytuację komunikowania się. Z tego właśnie powodu znaczenie przekazywane w komunikacie nazywamy strukturą znaczeniową. Ponieważ język składa się ze słów, a nie z jakichś kółek i strzałek, takich jak na rysunku 12-1, użytych przez nas do przedstawienia struktury znaczeń, muszą istnieć w nim pewne konwencje, które pozwalają na odróżnianie słów i relacji między nimi oznaczających pojęcia od słów i relacji oznaczających działania i od słów odnoszących się do stosunków między działaniem a pojęciem. Zaznaczmy, że dla dowolnej struktury znaczeniowej istnieje znaczna liczba możliwych opisujących ją zdań. Ponadto nie istnieje konieczność przekazywania struktury znaczeniowej w całości, zwłaszcza gdy zakładamy, że odbiorca informacji opanował już pewien zasób podstawowych pojęć. A zatem, w zdaniu wyjaśniającym naszemu słuchaczowi, w jaki sposób za pomocą krążków wydostać z automatu winogrona, nie musimy mówić o tym, że winogrona pojawiają się w odpowiednim pojemniku automatu, albo też o tym, że krążki trzeba wrzucać do otworu w aparacie. Co więcej, nie musimy precyzować tego, że krążki należy uprzednio wziąć w rękę, aby móc się nimi posłużyć. Zakładamy, że wszystkie te stosunki są już znane temu człowiekowi albo są tak oczywiste, że nie trzeba o nich wspominać. Różnicę między strukturą powierzchniową a strukturą znaczeniową najlepiej zilustrują przykłady. Zastanówmy się nad takim zdaniem: John przestraszył Mary. Zdanie to przekazuje tę samą informację, co zdanie: 445 Mary została przestraszona przez Johna. Chociaż struktura powierzchniowa obu tych zdań jest różna, to ich struktura znaczeniowa jest taka sama. W rzeczywistości podstawowa struktura zdarzenia, w którym wykonawca (agens) John przestraszył odbiorcę Mary, pozwala na utworzenie ośmiu transformacji zdania, mających to samo znaczenie. Zdanie czynne: John przestraszył Mary. Zdanie bierne: Mary została przestraszona przez Johna. Zdanie przeczące: John nie przestraszył Mary. Pytanie: Czy John przestraszył Mary? Zdanie bierne przeczące: Mary nie została przestraszona przez Johna Pytanie przeczące: Czy John nie przestraszył Mary? Pytanie bierne: Czy Mary została przestraszona przez Johna? Pytanie przeczące bierne: Czy Mary nie została przestraszona przez Johna? 446 W każdym z ośmiu zdań podstawę stanowi jedno zdarzenie: John przestraszający Mary. W wersjach przeczących występuje negacja tego faktu, w pytających poddaje się go w wątpliwość. Zdania te zmieniają wyłącznie formalną strukturę powierzchniową. Rysunek 12-2 pokazuje strukturę znaczeniową dla wszystkich ośmiu zdań. Te osiem transformacji struktury podstawowej stanowi zasadę tworzenia się większości struktur powierzchniowych zdań w języku angielskim. [Schemat zdań: John przestraszył Mary. Mary została przestraszona przez Johna. Węzłem centralnym jest PRZESTRASZYĆ. 2 strzałki wychodzące: wykonawca John, odbiorca Mary. Schemat zdań: John nie przestraszył Mary. Mary nie została przestraszona przez Johna. Węzłem centralnym jest PRZESTRASZYĆ. 3 strzałki wychodzące: wykonawca John, odbiorca Mary, prawdziwość Fałsz. Schemat zdań: Czy John przestraszył Mary? Czy Mary została przestraszona przez Johna? Węzłem centralnym jest PRZESTRASZYĆ. 3 strzałki wychodzące: wykonawca John, odbiorca Mary, sposób Pytanie. Schemat zdań: Czy John nie przestraszył Mary? Czy Mary nie została przestraszona przez Johna? Węzłem centralnym jest PRZESTRASZYĆ. 4 strzałki wychodzące: wykonawca John, odbiorca Mary, sposób Pytanie, prawdziwość Fałsz.] Jest zatem możliwe, że wiele struktur powierzchniowych przedstawia, tę samą strukturę znaczeniową. Bywa i tak, że różne struktury znaczeniowe leżą u podstaw jednej i tej samej struktury powierzchniowej. Oto przykład (w języku angielskim): 447 They are working students. (Oni są pracującymi studentami; drugie znaczenie: Oni sprawiają, że studenci pracują). Zdanie to ma dwa możliwe znaczenia. Każdemu z nich odpowiada odrębna struktura znaczeniowa, jak to zostało przedstawione na rysunku 12-3. [Zdanie: They are working students. Węzeł centralny – WORK (PRACOWAĆ) + dwie strzałki wychodzące: strzałka wykonawca They (Oni), strzałka przedmiot Students (Studenci). Zdanie: Those people make students work. (Tamci ludzie sprawiają, że studenci pracują.) Wprowadzono do schematu dwa pojęcia wtórne; jedno nienazwane, drugie C1. C1’s are students who work (C1 to studenci, którzy pracują.) Z węzła nienazwanego wychodzą trzy strzałki: strzałka jesto – Students (Studenci), strzałka cecha – Work (Pracować), i strzałka jesto do pojęcia wtórnego C1.] Reguły gramatyczne języka określają nam sposób przekształcania struktur znaczeniowych w struktury powierzchniowe. Człowiek mówiąc lub pisząc sięga do własnych struktur znaczeniowych i stosuje odpowiednie reguły gramatyczne, aby zbudować poprawne zdania. W czasie słuchania lub czytania zachodzi odwrotny proces: człowiek stara się zrozumieć wypowiadane doń słowa i odtworzyć strukturę znaczeniową. Warto jednak pamiętać o tym, że chociaż znaczenie i poprawność gramatyczna są ze sobą powiązane, to jednak nie są tym samym. Zdanie: Jeść jabłek jest niegramatyczne, ale w kontekście jest ono całkiem sensowne; zawarta w nim informacja o związkach i pojęciach jest jednoznaczna. Pewne zniekształcenia gramatyczne mogą uczynić przekaz niezrozumiałym. Jeżeli zakłócenia dotyczą informacji o specyficznych rolach osób biorących udział w zdarzeniu, to część znaczenia gubi się: Kopać John Mary. Wreszcie zdanie może być całkowicie poprawne gramatycznie, a mimo to trudne do interpretacji, ponieważ brak jest informacji pozwalającej na rozszyfrowanie dwuznaczności. 448 Żeglarz zabił ością rekina. Odwiedziny profesorów mogą być nudne. [Mogą być dwie struktury znaczeniowe tych zdań: Żeglarz zabił a) przedmiot: kogoś, instrument: ością rekina i b) przedmiot: rekina, instrument: ością. W drugim zdaniu występują dwie różne struktury znaczeniowe w zależności od tego, czy profesorowie są wykonawcami czy też odbiorcami czynności odwiedzanie. (Przyp. red. pol.)] Psychologiczne badania dotyczące gramatyki koncentrują się na procesach poznawczych, które pośredniczą między strukturą powierzchniową a znaczeniem. Jeśli nawet przekaz odpowiada dokładnie regułom poprawnego mówienia, nie stanowi to jednak gwarancji, że mechanizmy poznawcze zdołają odpowiednio wykorzystać jego znaczenie, i odwrotnie: wiele zdań o najwyraźniej niejednoznacznej strukturze powierzchniowej jest w praktyce całkiem zrozumiałych, ponieważ konkretny dobór słów może odnosić się tylko do jednego znaczenia. Tak więc zdanie: Całować John tygrys jest zarówno niepoprawne gramatycznie, jak i niezrozumiałe, natomiast zdanie: Strzelać John tygrys chociaż niepoprawne gramatycznie, to jednak w razie potrzeby może być jednoznacznie zinterpretowane: tylko jeden wyraz John musi z konieczności oznaczać wykonawcę (agensa) będącego istotą ludzką, czynności strzelać, a pozostały wyraz tygrys, jest wystarczającym (a nawet wielce prawdopodobnym) przedmiotem tego działania. Kolejne zdania: I saw the sparrows flying to the trees (Widziałem wróble lecące na drzewa) I saw the Grand Canyon flying to New York (Widziałem Grand Canyon lecąc do Nowego Yorku) mają w języku angielskim podobne struktury powierzchniowe, lecz zupełnie różne struktury znaczeniowe. Niemniej jednak oba zdania można zrozumieć bez większych trudności, ponieważ zbiór relacji znaczeniowych jest całkiem ograniczony (Schank, 1969). Z psychologicznego punktu widzenia język jest środkiem komunikacji. Ludzie dość rzadko mówią zdaniami poprawnymi gramatycznie. W rzeczywistości większość wypowiadanych zdań trudno zrozumieć w oderwaniu od ich kontekstu. Liczne opuszczenia, szeroko stosowane zaimki, dwuznaczne odniesienia znaczeniowe bardzo utrudniają analizę formalną wypowiadanych zdań. Jednak w kontekście, gdy znaczenie takich słów, jak: to, oni czy tamten jest oczywiste, struktury znaczeniowe dają się przekazać nawet wtedy, gdy struktura powierzchniowa formalnie nie jest prawidłowa. Z punktu widzenia języka jako środka komunikowania się sytuacja taka jest zupełnie oczywista. 449 GRAMATYKA ANGIELSKA [Reguły gramatyczne przedstawione w niniejszym paragrafie wywodzą się z gramatyki generatywno-transformacyjnej, której celem jest opis uniwersalnych reguł językowych. Zwłaszcza pierwsze z omawianych reguł, reguły struktur frazowych, które opisują strukturę głęboką języka, mają taki uniwersalny charakter. Kolejne reguły, reguły transformacyjne, których celem jest przekształcenie struktury głębokiej w ciąg wyrazów pojawiających się w konkretnej wypowiedzi, mogą mieć bardziej specyficzny charakter. Jakkolwiek więc opisane poniżej reguły egzemplifikowane są zdaniami języka angielskiego (tłumaczenia podajemy w nawiasach) i niektóre z nich stosują się wyłącznie do tego języka, to zapis formalny, jaki tu jest prezentowany, z istoty swej może być stosowany do każdego języka naturalnego. (Przyp. red. pol.)] Zdania angielskie są złożone z kilku różnych rodzajów składników połączonych ze sobą według formalnych reguł gramatycznych. W tej książce głównie zajmowaliśmy się dotąd raczej znaczeniem zdań niż ich bezpośrednią strukturą powierzchniową, w istocie sprawy te są ze sobą ściśle powiązane. Zgodnie z tradycyjną gramatyką zwykłe proste zdanie angielskie składa się z podmiotu i orzeczenia lub z podmiotu, czasownika i dopełnienia. Jak to już stwierdziliśmy, tego typu rozróżnienia nie są dla nas szczególnie użyteczne; musimy jakoś inaczej rozczłonkować zdanie. Rozważcie zdanie: The very old man eats oysters. (Bardzo stary człowiek je ostrygi.) Możemy rozłożyć to zdanie na różne sposoby. Przyjmijmy, po pierwsze, że fraza the very old man (bardzo stary człowiek) jest frazą rzeczownikową (NP - noun phrase). Po drugie, frazę eats oysters (je ostrygi) nazwiemy frazą czasownikową (VP-verb phrase), a po trzecie zauważmy, że fraza czasownikowa składa się z czasownika (V - verb) i z frazy rzeczownikowej. W ten sposób możemy wyprowadzić prosty zbiór reguł służących do podziału tego typu zdania: 1. S – NP plus VP. 2. VP – V plus N P. (Czytamy je następująco: 1. Zdanie (S-sentence) dzieli się na NP plus VP. 2. dzieli się na V plus NP.). Fraza rzeczownikowa może być poddana dalszej analizie: 3. NP. – Art plus N. 4. N – Ad plus N. Reguła 3 umożliwia zastąpienie frazy rzeczownikowej przez rodzajnik (Art - article) plus rzeczownik (N - noun). Reguła 4 stwierdza, że może wystąpić cały ciąg modyfikatorów we frazie rzeczownikowej w tym sensie, że N (rzeczownik) może być w sposób ciągły zastępowany przez przymiotnik lub przysłówek (Ad-adjective, adverb) plus rzeczownik (N). Reguła 4 pozwala na wytworzenie frazy: The very tired big fat hungry dirty old man (Bardzo zmęczony wielki gruby głodny brudny stary człowiek). Reguły te są fakultatywne, to znaczy jedna z nich lub obie mogą być zastosowane do analizy zdania. Przykładem może tu być zastosowanie Reguły 4, która w ogóle nie została użyta we frazie the man (Art. plus N), zastosowano ją raz we frazie the old man (kiedy to rzeczownik N z Art. N został zastąpiony przez Ad plus N) oraz użyto jej dwukrotnie we frazie the very old man (kiedy to rzeczownik N z Art plus Ad plus N został ponownie zastąpiony przez Ad plus N, dając w efekcie Art plus Ad plus Ad plus N). 450 Jeżeli dodamy do tego jeszcze reguły przekształcające wyniki zastosowania powyższych reguł (V, N, Art, Ad) w wyrazy, to analiza zdania The very old man eats oysters zostanie zakończona. S - NP plus VP NP NP - Art plus N N - Ad plus N NT - Ad plus N Art - The (rodzajnik określony) N - man (człowiek) Ad - very (bardzo) Ad - old (stary) VP VP - V plus NP NP – Art. plus N V - eats (je) Art - (opuszczony) N - oysters (ostrygi) Rysunek 12-4 przedstawia zastosowanie tych reguł w postaci struktury drzewkowej wraz z obrazem struktury znaczeniowej tego samego zdania. [Zaznaczamy na środku kartki punkt S (sentens), nieco poniżej symetrycznie z prawej i lewej strony punkty NP (noun phrase) i VP (verb phrase). Poniżej punktu NP po lewej i prawej stronie punkty Art (article) i N (noun). Poniżej punktu N podobnie jak zrobiliśmy to powyżej zaznaczamy kolejne dwa punkty: z lewej Ad (adjective, adverb), z prawej N (noun). Przechodzimy w dół zaznaczając ponownie pod punktem N z lewej Ad, z prawej N. Przechodzimy teraz na prawą stronę, aby dokonać podziału VP. Postępujemy tak samo jak przy rozkładzie NP. Zaznaczamy dwa punkty poniżej: z lewej strony – punkt V (verb), z prawej – NP. Poniżej NP, z prawej Art, z lewej N. Teraz idąc od lewej strony na jednej linii pod punktami: Art, Ad, Ad, N, V, Art, N, wpisujemy słowa The, very, old, man, eats, x oysters (x oznacza, że rodzajnik został opuszczony). Połączmy teraz zaznaczone punkty i słowa liniami prostymi i otrzymamy strukturę drzewkową zdania. Struktura znaczeniowa tego samego zdania przedstawia się następująco: Węzeł centralny – JEŚĆ plus jedna strzałka wychodząca – przedmiot - do pojęcia wtórnego bez nazwy, z pojęcia wtórnego strzałka wychodząca jesto Ostryga. Druga strzałka wychodząca z węzła centralnego nazywa się wykonawca i poprzez nienazwane pojęcia wtórne przechodzimy do: jesto Człowiek, jest Stary, cecha Bardzo.] 451 Dotychczas opisana gramatyka nie może jednak poradzić sobie z frazami przyimkowymi, jak np. w zdaniu: The very old mam lives in the tree house. (Bardzo stary człowiek mieszka w dziupli). Fraza in the tree house jest frazą przyimkową (PP - prepositional phrase) i składa się z przyimka (Prep -prepositiori) plus zwykła fraza rzeczownikowa. Przyimek (in - w) w tym zdaniu oznacza, że następująca po nim fraza rzeczownikowa określa lokalizację. Aby nasza gramatyka objęła frazy przyimkowe, musimy po prostu rozszerzyć Regułę 2: 2A. VP - V plus NP. 2B. VP - V plus PP. 2C. PP - Prep plus NP. Jest rzeczą oczywistą, że w konkretnej sytuacji stosuje się albo regułę 2A, albo 2B, nigdy obie na raz. RYSUNEK 12-5[struktura drzewkowa i znaczeniowa zdania: Bardzo stary człowiek mieszka w dziupli 452 Obecnie uzupełniwszy słownik możemy zastosować powyższe reguły do nowego zdania, jak to pokazuje wykres na rysunku 12-5. Słownik przedstawia się następująco: V - lives, eats, sings, ... (mieszka, je, śpiewa,...) N - man, tree, house, limerick, oyster,... (człowiek, drzewo, dom, limeryk, ostryga,...) Art - the, a, an,... Ad - old, many, few, very, tree,... (stary, dużo, mało, bardzo, drzewny,...) Prep. - in, on, at, by, to,... (w, na, przy, przez, do,...) Wykresy na rysunkach 12-4 i 12-5 pokazują drzewka derywacyjne obu zdań. Ze względu na to, że omawiane reguły obracają się wokół fraz, określa się je jako reguły struktur frazowych (phrase-structure rules), czasem jako reguły przepisywania (rewrite rules), a pełny zbiór tych reguł określa gramatykę struktur frazowych. (Tych kilka reguł, które tu przytoczyliśmy, daleko nie wyczerpuje pełnego zestawu). Do reguł struktur frazowych należy jeszcze dodać reguły transformacyjne, które wskazują, jak te frazy mogą być przegrupowywane w rzeczywiste struktury powierzchniowe zdań. Rozważcie dla przykładu zdanie bierne: The tree house is lived in by the very old man. (Dziupla jest zamieszkana przez bardzo starego człowieka). Utworzenie zdania biernego wymaga przegrupowania fraz zdania. I tak w tym przypadku zdanie wyjściowe miało następującą strukturę frazową: NP plus V plus PP (The very old man) plus (lives) plus (in the tree house) (Bardzo stary człowiek) plus (mieszka) plus (w dziupli) Skonstruowanie zdania biernego wymaga przegrupowania tych fraz do postaci: PP plus V plus NP (In the tree house) plus (lives) plus (the very old man) Zdanie w powyższym układzie, aczkolwiek jest ono całkowicie zrozumiałe, nie uważa się zwykle za zdanie gramatyczne (w języku angielskim - przyp. red. pol.) poza szczególnymi konwencjami stylistycznymi, przyjmowanymi w poezji: In the tree house lives the very old man who constantly eats oysters as fast as he can. [Limeryk ten w wolnym przekładzie: W dziupli drzewa bardzo stary człowiek mieszka co ostrygi jedną po drugiej łyka od rana do zmierzcha. (Przyp. red. pol.)] 453 Na ogół konstrukcje bierne są oznaczane przez specjalne formy czasownika. Ponadto wykonawca (lub instrument) czasownika jest oznaczony za pomocą przyimka przez. W związku z tym w zdaniu zachodzi więcej zmian: Przyimek z początkowej PP zostaje opuszczony pozostawiając samą NP; do czasownika zostaje dodana forma posiłkowa (auxiliary- Aux); końcową NP poprzedza przyimek przez, przekształcając ją tym samym w PP; opuszczony Prep z początkowej PP zostaje wstawiony po czasowniku. Zmiany te w kolejnych fazach wyglądają następująco: (The very old man) (lives) (in the tree house) (NP1) plus V plus (PP) (PP) plus V plus (NP1) (Prep plus NP2) (Aux plus V) plus Prep plus (by plus NP1) (NP2) plus (Aux plus V) plus (Prep) plus PP (The tree house) (is lived) (in) plus (by the very old man) Reguły te są transformacyjne, ponieważ pozwalają na przetasowanie różnych segmentów zdania, czyli na jego transformację. Zwykle temu przetasowaniu towarzyszą wskazówki syntaktyczne zapewne po to, aby osobie słuchającej czy czytającej przekształcone zdanie umożliwić dotarcie do wersji wyjściowej, chociaż, jak to wskazuje przykład z podanego limeryku, nie zawsze jest to konieczne. Ze zdań prostych można budować zdania złożone. Tak więc zdanie The very old man who lives in the tree house eats oysters. (Bardzo stary człowiek, który mieszka w dziupli, je ostrygi.) jest złożone z dwóch zdań, które dotąd analizowaliśmy. Nieco inny sposób łączenia zdań polega na zastosowaniu spójnika (Conj - conjunction): 1A. S – S plus Conj plus S 1B. S – Np plus VP Conj - and, but, because, or... (i, lecz, ponieważ, lub,...) Tak więc dzięki Regule 1A nasze dwa zdania można połączyć następująco: (The very old man lives in the tree house) and (the very old man eats oysters) wykres tego zdania znajduje się na rysunku 12-6. [Zaznaczmy na środku kartki punkt S i poprowadźmy w dół od tego punktu pionową oś o nazwie Conj (conjunctjon). Poniżej po lewej stronie punktu S zaznaczamy S1 (łączymy oba punkty linią prostą), poniżej po prawej stronie punktu S zaznaczamy punkt S2. Punkty S i S2 również za sobą łączymy. Tworząc dalej strukturę drzewkową przechodzimy w dół od punktów S1 i S2 po liniach prostych skierowanych skośnie na prawo lub na lewo do punktów NP1, VP1 (rozwinięcie S1) oraz do punktów NP2, VP2 (rozwiniecie S2). Punkty NP1, VP1, NP2, VP2, są wierzchołkami czterech trójkątów zastępujących struktury drzewkowe następujących części złożonego zdania S: od lewej 1. The very old man (Bardzo stary człowiek), 2. lives in the tree house (mieszka w dziupli), 3. The very old man (Bardzo stary człowiek), 4. eats oysters (je ostrygi).] [Zauważcie, że wprowadziliśmy nowy symbol do wykresu: duży trójkąt. Stanowi on po prostu skróconą formę zapisu struktury drzewkowej, którą należałoby wykreślić dla przekształcenia fraz rzeczownikowych i czasownikowych w końcowe wyrazy. Konkretne struktury, które zostały zastąpione przez trójkąty, przedstawione są na wykresach 12-4 i 12-5.] Patrząc na samo zdanie, na jego wykres i wykres struktury znaczeniowej tego zdania, widzimy, że w S1 NP1 jest zarówno tożsama, jak też pełni tę samą rolę, co NP2 w S2. Zwykle w takich przypadkach stosujemy regułę opuszczania, która pozwala na wyeliminowanie NP2: The very old man lives in the tree house and eats oysters. 454 W wyniku takich opuszczeń powstają często trudności w analizowaniu zdań, gdyż po zniknięciu jakiegoś elementu zdania może nie być łatwo stwierdzić, co tam było pierwotnie. Dlatego też opuszczenia zwykle oznaczane są przez zaimki, które zastępują opuszczoną frazę: The very old man lives in the tree house and he eats oysters (he równa się on). I saw the girl you saw talking to John yesterday and she waved at me. (Zobaczyłem dziewczynę, którą ty wczoraj widziałeś rozmawiającą z Johnem i ona mi pomachała.) 455 Przekazywanie struktury Aby słuchacz lub czytelnik mógł zrozumieć dany tekst, musi ustalić związki między pojęciami a opisywanymi zdarzeniami. Musi odnaleźć ciąg przyczynowo-skutkowy wykonawców czynności, przedmioty itp. W rozdziałach 10 i 11 omawialiśmy sposób opisu tych relacji. Tabela 12-1 przedstawia te relacje (jest w zasadzie taka sama jak tabela 10-1). Wiele Czynności określa dość dokładnie typy relacji niezbędne do pełnego opisu danego zdarzenia. Na przykład, w wypadku czynności położyć, zdarzenie musi obejmować zarówno przedmiot, jak i miejsce. Henry położył książkę na podłodze, wykonawca przedmiot miejsce Jeżeli opuścimy przedmiot lub miejsce, przekaz będzie niepełny: Henry położył książkę. Henry położył na podłodze. Niektóre relacje są fakultatywne. Tak na przykład, w zdaniu wyjściowym Henry położył książkę na podłodze. brak wskazówki dotyczącej czasu lub celu czynności, chociaż jest całkiem możliwe i takie zdanie, w którym znajdują się i te wskazówki: Wczoraj Henry położył książkę na podłodze, aby mu nie przeszkadzała, czas cel Co więcej, jakkolwiek wszystkie przedstawione zdania określają wykonawcę czynności, samo słowo położyć tego nie wymaga: Wczoraj książka została położona na podłodze. Czy mówca wymienia wykonawcę czy też nie, zależy to od rodzaju informacji, jaką chce on przekazać. W języku angielskim, kiedy informujący pragnie opuścić wskazówkę dotyczącą sprawcy czy wykonawcy działania, może zastosować formę bierną zdania. W wielu wypadkach wykonawca zastępowany jest po prostu przez instrument, ponieważ są ze sobą ściśle związane: wykonawca (agens)-to po prostu ożywiony instrument. Pociąg przywiózł quigee. instrument Mary przywiozła quigee. wykonawca 456 Tabela 12-1. Elementy zdarzenia CZYNNOŚĆ (ACTION); Zdarzenie jako takie. Czynność jest zwykle wyrażona za pomocą czasownika: The man was bitten by the dog. (Człowiek został ugryziony przez psa). WYKONAWCA LUB AGENS (AGENT); Aktor, który spowodował wystąpienie czynności: The man was bitten by the dog (pies). UWARUNKOWANIE (CONDITIONAL); Warunek logiczny uzależniający dwa zdarzenia: A shark is dangerous only if it is hungry. (Rekin jest niebezpieczny tylko wówczas, gdy jest głodny). John flunked the test because he alrays sleeps in lectures. (John oblał egzamin testowy, ponieważ zawsze śpi na wykładach). INSTRUMENT (INSTRUMENT); Rzecz lub urządzenie powodujące lub umożliwiające zdarzenie: The wind demolished the house. (Wiatr zdemolował dom). MIEJSCE, LOKALIZACJA (LOKATION); Miejsce, w którym zachodzi zdarzenie. Często w grę wchodzą dwie lokalizacje, jedna na początku, a druga na końcu zdarzenia. Określa się je jako lokalizację od i lokalizację do: They hitchhikied from La Jolla to Del Mar. (Oni podróżowali autostopem od La Jolla do Del Mar. From the University, they hitchhikied to the beach. (Od Uniwersytetu aż na plażę dojechali autostopem). TRYB (MODE); Oznacza strukturę powierzchniową zdania, jeśli jest to potrzebne. Why isn't mode listed in Chapter 10? (Mode is a query). (Dlaczego tryb nie został umieszczony w tabeli w rozdziale 10? Tryb w tym przypadku to pytanie). Don't ask so many questions. (Mode is imperative). (Nie pytaj tak dużo. Tryb rozkazujący). PRZEDMIOT (OBJECT); Rzecz, na którą czynność oddziałuje: The wind demolished the house. (Wiatr zdemolował dom). CEL (PURPOSE); Określa cel zdarzenia: Jack took Henry to the bar to get him drunk. (Jack zabrał Henry'ego do baru, aby go upić). CECHA (QUALITY); Modyfikator pojęcia - opisuje jego właściwości. The surf was heavy. (Fala była wysoka). The were 93 people in class. (W klasie były 93 osoby). ODBIORCA (RECIPIENT); Osoba, na którą oddziałuje skutek czynności: The crazy professor threw the black-board at Peter. (Zwariowany profesor rzucił tablicą w Petera). CZAS (TIME); Kiedy zachodzi zdarzenie: The surf was up yesterday. (Fala podniosła się wczoraj). PRAWDZIWOŚĆ (TRUTH); Stosowane głównie do twierdzeń fałszywych. I do not like you, Hubert. (Nie lubię Cię, Hubercie). 457 Jeżeli język ma komunikować o zdarzeniach, powinien mieć mechanizmy służące do przekazywania informacji o pojęciach i relacjach, z których tworzy się struktura znaczeniowa przekazu. Chociaż zbiór podstawowych relacji może być wyrażony we wszystkich systemach językowych świata, mechanizmy używane do określenia różnorodnych relacji różnią się w poszczególnych językach. Przekazywanie znaczenia Na podstawie struktury powierzchniowej przekazu nie możemy dokładnie określić, jak dany język przekazuje znaczenie. [Co to są Minsoki?] Aby lepiej zrozumieć, o co nam chodzi, przeprowadźmy kilka prostych eksperymentów. Zobaczmy, co się zdarzy, jeżeli informacja jest niejednoznaczna lub też niezrozumiała. W tym celu powróćmy do rysunku 12-1 i podstawmy dla każdego węzła pojęciowego w strukturze pamięci jakieś nazwy nie mające znaczenia. Uzyskamy w rezultacie coś w rodzaju schematu przedstawionego na rysunku 12-7. Przekładając tę strukturę na przekaz werbalny, otrzymamy: W gliku z rupowymi loksenami i katerem munkniecie loksen w blump i w gracu pojawi się bim. Kiedy w jakimś przekazie pojęcia mające znaczenie zastąpimy wyrazami bezsensownymi, pozostanie w nim jedynie informacja dotycząca relacji. Nośnikami jej są takie wyrazy, jak: w, z, i. Wyrazy te zwane są funktorami, ponieważ służą głównie do wyrażania relacji. Tworzą one podstawowe ramy dla zapisu pojęć w pamięci, charakteryzując w zarysie strukturę zapamiętywanego zdarzenia. Należy również zaznaczyć, że chociaż przekaz, w którym opuszczono informację o pojęciach, jest co najmniej wieloznaczny, to jednak wydaje się, że jest w nim zawarte jakieś znaczenie. Tak na przykład, na podstawie samej tylko informacji strukturalnej całkiem możliwe są sensowne odpowiedzi na następujące pytania: Jak zdobyć bim? Munknąć w blump rupowy loksen. Gdzie znajduje się kater? W gliku. Co jest rupowe? Loksen. Co się znajduje w gliku? Pewna ilość loksenów i kater. 458 Podstawiliśmy nonsensy zamiast pojęć, ale funktory pozostały nie zmienione. Usuńmy zatem te ostatnie. Otrzymamy całkowicie bezsensowny przekaz: Glik rupowe lokseny kater munknięcie loksen blump gracu bim. Kiedy jednak zastąpimy wyrazy bezsensowne wyrazami sensownymi, przekaz będzie w pełni zrozumiały, pomimo braku funktorów: Pomieszczenie niebieskie krążki automat włożyć krążek otwór winogrona. Chociaż przekaz ten jest zrozumiały, ma telegraficzny styl. Wydaje się, że opuszczone zostały w nim wszystkie słowa nieważne, a pozostały jedynie najbardziej znaczące składniki zdania. Skoro jednak funktory są podstawowymi nośnikami informacji o relacjach, jak to się dzieje, że mimo ich braku przekaz jest zrozumiały? Skąd czerpiemy odpowiednią strukturę? Na pytanie to mamy dwie odpowiedzi. Po pierwsze w wielu językach np. w angielskim, informacja o wzajemnych relacjach tkwi również w szyku wyrazów. Pomieszajmy porządek słów, a znaczenie, które przekazywały, zniknie: 459 Automat niebieskie włożyć pomieszczenie krążki otwór winogrona krążek. Porządek, w jakim pojawiają się po sobie kolejne pojęcia, dostarcza informacji o ich funkcji, co pomaga określić w przybliżeniu relacje między pojęciami. Po drugie, znaczenie poszczególnych słów pozwala na częściową interpretację ciągu wyrazów nawet wówczas, gdy brakuje wszystkich pozostałych wskazówek. A zatem: Strzelać John tygrys albo krążek włożyć otwór można interpretować wyłącznie na podstawie semantycznych wyznaczników, nawet w sytuacji braku słów - funktorów. UCZENIE SIĘ JĘZYKA Uczenie się reguł Fakt, że językiem rządzą określone reguły, zmusza dziecko do specjalnego typu uczenia się w procesie rozwoju. Nie wystarczy po prostu nauczyć się znaczenia wszystkich słów, ale trzeba jeszcze opanować reguły ich łączenia. Uczenie się reguł to zupełnie inna rzecz niż uczenie się nazw czy pojęć. Od pierwszych dni życia dziecko bombardowane jest mieszaniną zdań poprawnych gramatycznie, niepoprawnych fragmentów zdań, wypowiedzi dotyczących przewidywań przyszłych zdarzeń, pytań czy wreszcie naśladowań mowy małego dziecka przy próbach porozumiewania się z nim. Ż całej tej plątaniny słów dziecko musi jakoś wyodrębnić reguły dla przekazywania informacji dotyczącej pojęć i relacji. Dziecko mówiące po angielsku powinno nauczyć się, że przymiotnik poprzedza określony rzeczownik. Ale jak to się odbywa w rzeczywistości? W rzeczywistej mowie te same dwa słowa mogą pojawiać się w różnym porządku. Weźmy prosty przykład: dziecko uczy się kolorów. Pyta, jaki kolor ma mleko, i otrzymuje odpowiedź: „Kolor mleka- biały". Występuje tu odwrotna kolejność (najpierw rzeczownik, a po nim przymiotnik), chociaż istnieje nieznaczna przerwa między rzeczownikiem a nazwą koloru. Jak zatem dziecko, ucząc się na podobnych przykładach, dochodzi do wniosku, że należy mówić białe mleko w takim zdaniu, jak na przykład: Nie chcę białego mleka, chcę różowego (truskawkowego) mleka. Potocznie sądzi się, że dziecko uczy się mówić prawidłowo wówczas, gdy rodzice nieustannie poprawiają jego błędy. W rzeczywistości jednak nie wygląda to tak prosto. Czasami mowa dziecka jest korygowana, ale zazwyczaj nie zwraca się na to uwagi i odpowiada na jego pytania. Tabela 12-2 przedstawia wybrane przykłady roli, jaką pełnią wypowiedzi matki komentujące mowę dziecka. Brown i Hanlon (1970, rozdział 1) po przeanalizowaniu znacznej liczby przykładów (niektóre z nich prezentuje tabela 12-2) rozmów matek z dziećmi, doszli do wniosku, że brak jest podstaw do twierdzenia, iż matka poprawia błędy gramatyczne dziecka wystarczająco często, aby mogło ono nauczyć się form gramatycznych. 460 Tabela 12-2. Przykłady akceptowanych i nieakceptowanych przez matki wypowiedzi dzieci Akceptowane Adam Draw a boot paper. Matka Adama That's right. Draw a boot on paper Ewa Mama isn't boy, he girl. Matka Ewy That's right Sara Her curl my hair. Matka Sary Um hmm. Nieakceptowane Adam And Walt Disney comes on Tuesday. Matka Adama No, he does not. Ewa What the guy idea. Matka Ewy No, that's not right. Wise idea. Sara There's the animal farmhouse. Matka Sary No, that's a lighthouse. [Źródło: Brown i Hanton (1970, tabela 1.12,s. 49). Zrezygnowaliśmy z tłumaczenia tekstu tabeli 12-2, gdyż wypowiedzi są nieprzetłumaczalne na język polski, z kolei wypowiedzi matek wiążą się ściśle z wypowiedziami dzieci i w oderwaniu od nich nie są jasne. (Przyp. red. pol.).] Istnieją dwa główne mechanizmy uczenia się. Jednym z -nieb-^est wzmocnienie (omówione w rozdziale 13), drugim naśladownictwo. Ale, jak widać, pierwszy z nich nie daje odpowiedzi na pytanie, jak następuje opanowanie języka, ponieważ natychmiastowe wzmocnienie zdań prawidłowo gramatycznie wymawianych przez dziecko, jak również poprawianie popełnianych przez nie błędów zachodzi nie dość często. A co możemy powiedzieć o naśladownictwie? Czy dziecko może opanować język naśladując po prostu mowę dorosłych? Naśladownictwo Naśladownictwo niewątpliwie ułatwia nabywanie rozwiązań praktycznych problemów, jakie otoczenie stawia przed dzieckiem. Może ono uczyć się po prostu obserwując, w jaki sposób inni manipulują rzeczami i posługują się nimi. Dziecko niewątpliwie potrafi tworzyć na podstawie obserwacji skomplikowane schematy działań. Naśladownictwo może również odgrywać dużą rolę w rozwoju społecznym dziecka. Otaczająca je rodzina, bohaterowie ulubionych programów telewizyjnych, koledzy stanowią model zachowań interpersonalnych. W efekcie takich obserwacji, dziecko uczy się zachowań społecznych, które są właściwe w różnych sytuacjach społecznych. Obserwowane wzorce przenosi ono do swojego własnego zachowania. Czy można jednak uważać naśladownictwo za podstawowy mechanizm uczenia się języka? Wydaje się to raczej nieprawdopodobne. Etapy rozwojowe w procesie przyswajania języka przeczą twierdzeniu, że dziecko uczy się języka przez naśladowanie tego, co usłyszało. 461 Pierwsze słowa, jakie wypowiada dziecko, są tylko prymitywnym przybliżeniem właściwych układów dźwięków. A mimo to dziecko wcale nie próbuje poprawiać i cyzelować pierwszych słów, zanim przejdzie do przyswojenia sobie nowych. Na kolejnych etapach stopniowego przyswajania języka, poczynając od pierwszych pojedynczych słów, a kończąc na mowie podobnej do mowy dorosłych, wzorce mowy dziecka nie są naśladownictwem słyszanej mowy. Przeciwnie, zaskakująca w mowie dziecka jest jej oryginalność. Jeżeli dziecko uczy się przez naśladowanie, to dlaczego mówi goed zamiast went, doed zamiast did, sheeps, albo you naughty are? W istocie trudno byłoby dziecku znaleźć odpowiednie wzorce do naśladowania, nawet gdyby usilnie ich szukało. Szczególną cechą języka jest nieskończona różnorodność wyrażeń. Nie zdarza się, aby dziecko w trakcie uczenia się języka napotkało częściej niż kilka razy identyczną kolejność słów. Ponadto dziecko z wrodzonymi defektami aparatu mowy uczy się dobrze rozumieć język, chociaż nie potrafi mówić, a więc naśladować tego, co słyszy. Wydaje się, że przebieg rozwoju języka dziecka odzwierciedla różne zmagania procesów dziecięcej indukcji próbującej wydobyć system reguł leżących u podstaw języka. Język jako środek komunikowania się Jeśli traktujemy język jako narzędzie komunikowania się, pojawia się pytanie: jak sobie z tym radzi dziecko? Odpowiedź brzmi: dobrze. Rozważmy kilka prostych zdań z repertuaru 2-letniego dziecka: Baby highchair (Dzidziuś krzesełko) Sat wall (Usiadł murek) Pick glove (Zdjąć rękawiczka) Mommy eggnog (Mama eggnog) [Eggnog- alkoholowy napój jajeczny. (Przyp. red. pol.)] Mommy sandwich (Mama kanapka) Throw Daddy (Rzuć tatuś) Czy wypowiedzi te mają sens? Dla Czytelnika chyba nie są zrozumiałe, a to dlatego, że ich zdawkowość nie pozwala na prawidłowe wydobycie istoty stosunków między słowami a czynnościami. Ważna jest tu znajomość warunków, w jakich zostały one wypowiedziane. Dla matki wypowiedzi dziecka są całkowicie zrozumiałe dzięki temu, że kontekst, w jakim je wygłoszono, nie pozostawia cienia wątpliwości co do ich intencji. Brown i Bellugi (1964), którzy sporządzili zapis prezentowanych powyżej przykładów mowy dziecka, zarejestrowali również te same zdania uzupełnione przez matkę: 462 Baby is in the highchair. (Dzidziuś siedzi na krzesełku). Mommy had her eggnog. (Mama piła eggnog). Mommy'll have a sandwich. (Mama będzie jadła kanapkę). He sat on the wall. (On usiadł na murku). Throw it to Daddy. (Rzuć to do tatusia). Pick the glove up. (Zdejmij rękawiczkę). Mowa dziecka sprawia wrażenie, telegraficznego przekazu „pełnych zdań mowy dorosłych. Funktory zostały opuszczone. Złożone związki gramatyczne prawie nie występują. Jednak dorosły, często bez trudu, może uzupełnić wypowiedź dziecka, posługując się informacją kontekstową, pozwalającą na określenie ich znaczenia i dodając funktory czy cokolwiek innego, co wydaje się niezbędne. Dobrą ilustracją tego może być uzupełnienie przez matkę wypowiedzi Ewy: Eve lunch (Ewa obiad). Zgodnie z zapisem Rogera Browna, Ewa wypowiedziała to zdanie dwukrotnie w ciągu pół godziny. Za pierwszym razem matka przygotowywała obiad i dlatego uzupełniła jej wypowiedzi w taki sposób: Yes, Mommy is going to fix Eve's lunch (Tak, mama przygotowuje obiad dla Ewy). Po raz drugi Ewa powiedziała Eve lunch siedząc już przy stole. Odpowiednie uzupełnienie matki było następujące: Yes, Eve is eating lunch (Tak, Ewa je obiad). Pierwsze uzupełnienie stawia Ewę w relacji dzierżawczej wobec obiadu, drugie czyni ją podmiotem czynności jeść, a obiad przedmiotem tej czynności. Fakt, że matka tak łatwo interpretuje tę samą wypowiedź w dwojaki sposób, świadczy o tym, że Ewa posługuje się w pełni zadowalająco językiem jako narzędziem komunikowania się, chociaż jej umiejętności gramatyczne wciąż są bardzo ograniczone. Można zatem wnioskować, że język dziecka oparty jest raczej na znaczeniu aniżeli na gramatyce. Znajduje w nim odbicie zbiór podstawowych pojęć o świecie nabytych przez dziecko. A zatem badania nad rozwojem języka dziecka należy prowadzić równocześnie z badaniami nad jego rozwojem ogólnym. Pierwsze kroki w komunikowaniu się Zanim dziecko zacznie posługiwać się językiem, przyswaja sobie już wcześniej niezbędny zasób podstawowych informacji strukturalnych w wyniku interakcji ze środowiskiem. Musi jednak nauczyć się komunikowania się za pomocą symboli. Pierwsze próby komunikowania się stanowią prawie bezpośredni przekaz wewnętrznej struktury jego pamięci, szczególnie wyraźny jest brak wszystkich funktorów przekazujących informację o relacjach. W efekcie mowa dziecka jest telegraficzna. Istnieje też jeszcze więcej ograniczeń. Zakres pamięci dziecka jest znacznie mniejszy w porównaniu z dorosłym. Dziecko nie zna jeszcze wszystkich reguł frazowych i transformacyjnych (jeśli w ogóle zna jakiekolwiek), 463 nie wie również, jaką informację musi koniecznie przekazać, a jaką może opuścić. Na przykład w wypadku czasownika put (położyć), miejsce i przedmiot działania muszą być określone, podczas gdy inne relacje są fakultatywne. Ale dla dziecka, jak się okazuje, wszystko jest fakultatywne. Kolejność słów wydaje się jedynym rodzajem informacji o relacjach, który pojawia się systematycznie od początku w mowie dziecka. Jeżeli w wypowiedzi dziecka występuje wykonawca czynności, to istnieje tendencja do umieszczania go przed czasownikiem. Jeśli idzie o inne typy relacji, to trudno jest określić, czy dziecko stosuje właściwy porządek słów. W języku angielskim używanym przez dorosłych, jeżeli opuszczony został wykonawca, a w zdaniu znajduje się jedynie instrument i przedmiot działania, to w zdaniu czynnym instrument poprzedza czasownik, a przedmiot znajduje się za czasownikiem: The key opens the door. Klucz otwiera drzwi, instrument przedmiot Gdyby dziecko po prostu „telegrafowało" to zdanie, powinno by powiedzieć Key open (Klucz otworzyć). Zamiast tego mówi ono Open key (Otworzyć klucz). Dlaczego? Najwyraźniej dziecko ma w pamięci inne zdanie, w którym występuje wykonawca, na przykład: Daddy opens the door with his key. (Ojciec otwiera drzwi swoim kluczem). takim wypadku telegraficzne zdanie Open key (Otworzyć klucz) jest prawidłowe. Oczywiście, w żadnym wypadku nie możemy stwierdzić, czy nasza analiza jest poprawna, ale, jak widać, dostarcza nam wiarygodnego wyjaśnienia. Ogólnie biorąc, dziecko buduje swoje zdania dość swobodnie. Nie określa wszystkich pojęć związanych z działaniem i nie posługuje się specyficznymi symbolami językowymi, niezbędnymi do przekazywania istoty relacji między pojęciami, o których mówi. Wytwarzanie a rozumienie. Brak funktorów we wczesnej mowie dziecka jest oczywisty i uderzający, ale niełatwe jest wskazanie przyczyn tego zjawiska. Czy za tym istotnie kryje się nierozumienie użytego pojęcia, czy też nieumiejętność właściwego użycia słów? Częściowo opuszczanie funktorów może być związane z główną trudnością, jaką stanowi dla małego dziecka niezdolność do postawienia siebie w sytuacji innej osoby. Małe dzieci są egocentryczne: widzą świat jedynie z ich własnej perspektywy. Nawet wówczas, gdy opanują już język, jeszcze przez dłuższy czas z trudem uczą się uwzględniania perspektywy innych osób. Brak tej zdolności widoczny jest w wielu dziedzinach: w wykonywaniu różnych zadań percepcyjnych, w uczeniu się pojęć czy wreszcie w próbach wyjaśnienia pojęć innym ludziom. Piaget badał, jak przebiega rozwój zdolności rozumienia przez dziecko perspektywy innych osób (Piaget, 1926, rozdział 3). W pracy tej podany jest przykład typowego zadania postawionego przez Piageta 8-letniemu chłopcu. Chłopcu Gio opowiedziano historię, a następnie poproszono go, aby opowiedział ją innemu dziecku. 464 Oryginalna historia Pewnego razu była sobie pani, którą nazywano Niobe, miała ona 12 synów i 12 córek. Kiedyś napotkała wróżkę, która miała tylko jednego syna i wcale nie miała córek. Wtedy pani zaczęła wyśmiewać się z wróżki, że ma tylko jednego syna. Wróżka bardzo się rozgniewała i przykuła panią do skały. Pani rozpaczała przez 10 lat. Aż w końcu zamieniła się w skałę, a z jej łez utworzył się strumień, który płynie do dziś dnia (Piaget, 1926, s. 82). Historia opowiedziana przez Gio Pewnego razu była sobie pani, która miała dwunastu chłopców i dwanaście dziewczynek, potem wróżka miała chłopca i dziewczynkę. I wtedy Niobe chciała mieć jeszcze więcej synów. Wtedy ona się rozgniewała. Ona przykuła ją do kamienia. On zmienił się w skałę, a potem z jego łez zrobił się strumień, który płynie do dziś dnia (Piaget, 1926, s. 102). Historia ta opowiedziana została przez 8-letnie dziecko, w pełni rozwinięte umysłowo. A mimo to w jej zakończeniu pełno jest zaimków ona, on, jej, jego, których nie można rozszyfrować. Jeśli pominiemy błędy tego przekazu (zresztą nie mają one związku z naszą analizą), to i tak biedny słuchacz nie może zrozumieć, do jakich osób odnoszą się te zaimki, a Gio nie próbuje mu tego ułatwić. Kiedy dziecko 2- lub 3-letnie opuszcza funktory, można to więc choć w części wyjaśnić tym, że nie potrafi zrozumieć trudności, jakie sprawia to słuchaczowi. Kiedy Adam mówi Draw a boot paper (rysować but papier), dorosły mimo woli może sobie wyobrazić specjalny rodzaj papieru, papier do butów; Adam po prostu opuścił funktor określający lokalizację czynności: Draw (apicture of) a boot (on the) paper. [Rysować (obraz) buta (na) papierze]. Ale możliwe, że Adam nie opanował jeszcze funktorów. Poza tym, jak długo może porozumiewać się zupełnie dobrze z dorosłymi (jego matka rozumie to, czego chce), tak długo może się koncentrować na słowach bardziej konkretnych, ważniejszych, takich jak nazwy przedmiotów i czynności. Jeżeli jednak ośmioletnie dziecko używa zaimków, które odnoszą się nie wiadomo do czego, to przyczyna tego może być tylko jedna; nie nauczyło się jeszcze brać pod uwagę punktu widzenia innych ludzi. Bez względu na to, czy dziecko rozumie czy też nie informację o funkcjach, nie ulega wątpliwości, że uporczywie pomija ją w całym swym zachowaniu werbalnym. Nie można skłonić dziecka do wprowadzenia tej informacji, nawet dając mu bezpośrednie wzorce do naśladowania. Jeżeli wypowiemy frazę Daddy's briefcase (taty portfel) i poprosimy ojej powtórzenie, to powtórzy ono Daddy briefcase (tata portfel). Stwierdzenie: He is going out (on wychodzi) powróci do nas jako: He go out (on wyjść), zaś zwrot No, you can't write on Mother's hat (nie, nie wolno ci pisać na kapeluszu mamy) będzie powtórzony jako: Write Mother hat (pisać mama kapelusz). Nadmierna generalizacja. Z upływem czasu do mowy dziecka zaczyna przenikać informacja o funkcjach. W wieku około 3 lat struktury gramatyczne jego mowy w pełni odpowiadają codziennej mowie dorosłych. 465 Zaczynają pojawiać się końcówki czasownikowe, określające czas, końcówki liczby mnogiej rzeczowników i końcówka dopełniacza (chodzi o końcówkę 's w dopełniaczu języka ang. - przyp. red.). Wzorce uczenia się mowy przez dziecko wskazują, że początkowo posługuje się ono prostym sygnałem językowym w celu przekazania pojęcia, a dopiero później wyodrębnia ogólną zasadę występującą w danym języku do wyrażania tego pojęcia. Po opanowaniu tej ogólnej zasady przychodzi zaś na wyjątki od reguły. Jaskrawym tego przykładem jest uczenie się informacji o czasie. Początkowo w mowie dziecka nie występują ani końcówki czasownikowe, ani też słowa posiłkowe. Wydaje się aj wyraźniej mówić wyłącznie o teraźniejszości: o zdarzeniach zachodzących wokół niego, o przedmiotach, które widzi. Pierwsze rozpoznanie czasowych aspektów czynności wydaje się być związane z posługiwaniem się czasownikami mocnymi (strong verbs) (które oznaczają proste czynności konkretne): come (przyjść), go (iść), do (robić), run (biec). W pierwszych wypowiedziach dziecka dotyczących czasu przeszłego z użyciem tych czasowników będą wykorzystane na ogół prawidłowe formy: came (przyszedł), went (szedł), did (zrobił), ran (biegł). Ale tak będzie tylko do czasu aż dziecko opanuje ogólną zasadę tworzenia czasu przeszłego za pomocą końcówki -ed. Poznawszy regułę, dziecko stosuje ją bezwzględnie: run przechodzi w runned, did-w doed. Reguła odrzuciła poprawne formy. A w końcu, gdy ogólna reguła zostanie już dobrze opanowana, wyjątki zostaną ponownie przyswojone. Kiedy dziecko opanowało mechanizm przekazywania informacji o różnego rodzaju relacjach, może też stosować go w nowych kontekstach. Pokazano to błyskotliwie w eksperymentach ze słowami bezsensownymi (Berko, 1958). Na przykład, czteroletniemu dziecku pokazywano obrazek z człowiekiem, który wywijał czymś nad głową. Następnie mówiono: This is a man who knows how to gling (To człowiek, który potrafi glingać). He glings every day. (On glinga codziennie). Today he glings. (Dziś on glinga). Yesterday he ? (A wczoraj on ?). Dziecko natychmiast proponuje najbardziej prawdopodobne słowo: glinged (glingał). Dorośli mają znacznie większy kłopot z podjęciem decyzji co do wyboru właściwego słowa; wahają się między glinged, glang, glung i glought. Rozumienie Co to znaczy rozumieć? Na jakiej podstawie mogą rodzice czy w ogóle dorośli sądzić, że dziecko zrozumiało to, co zostało do niego powiedziane? Postaramy się wyjaśnić istotę problemu posługując się przykładem komputera rozumiejącego język angielski. Obecnie istnieje kilka różnych programów działających tak, że można przyjąć, iż w pewnym stopniu rozumieją one język angielski 466 (2 podobne przykłady przedstawione zostały na rysunkach 10-1 i 10-2 w rozdziale 10). Ale skąd mamy pewność, że program rzeczywiście rozumie język angielski? Spróbujmy to sprawdzić pisząc takie lub inne zdania na klawiaturze pulpitu komputera. Na przykład napiszmy zdanie: • The red block is on top of the big green cylinder. (Czerwony klocek leży na dużym zielonym walcu). Program odpowiada: I see, thank you. (Rozumiem, dziękuje). Zrozumiał czy może nie? Na razie nie wiadomo. Najlepszy sposób ustalenia, czy program rozumie język angielski, polega na zmuszeniu go do działania. Należy wydać mu określone polecenie lub zadać pytanie, wymagające konkretnej odpowiedzi i zobaczyć, co z tego wyniknie. • Is the green cylinder near the red block? (Czy zielony walec leży obok zielonego klocka?) Jeśli pytanie to skierujemy do programu DOKTOR (rys. 10-1), to prawdopodobnie odpowie on: Why is it that you want to know? (Po co chcesz to wiedzieć?) To samo pytanie skierowane do innego programu, tzw. blokowego (rys. 10-2), prawdopodobnie doprowadzi do następujących odpowiedzi: Which green cylinder do you mean? (Który zielony walec masz na myśli?) If you mean the big one, the red blocks is on top of it. (Jeżeli mówisz o dużym, to czerwony klocek leży na nim). If you mean the little one, it is far away. (Jeśli myślisz o małym, to czerwony klocek leży daleko od niego). W przypadku programu DOKTOR odpowiedź nie zawiera wskazówki, pozwalającej przypuszczać, że program zrozumiał pytanie. Jeżeli chodzi o zrozumienie pytania przez drugi program, to nie może być wątpliwości: musiał zrozumieć pytanie. Trudności, jakie napotykamy analizując rozumienie, wynikają z tego, że mamy do czynienia z trzema różnymi zadaniami, które człowiek bądź maszyna musi wykonać, aby wykazać, że rozumie język angielski. • Musi prawidłowo interpretować zdanie; to znaczy rzeczywiście je zrozumieć. • Musi wytwarzać prawidłową wewnętrzną reprezentację lub program otrzymanego przekazu. • Musi być zdolny zaktywizować te wewnętrzne reprezentacje i wytworzyć widoczny, dający się interpretować rezultat. 467 Wróćmy jeszcze do programu DOKTOR. Możliwe, że w ogóle nie zrozumiał zadanego mu pytania. Możliwe jest również, że pytanie jest dla programu zrozumiale (warunek pierwszy), ale nie wie on, jak znaleźć na nie odpowiedź. Albo też rozumie on pytanie, potrafi znaleźć odpowiedź (warunek drugi), ale nie wie, jak postąpić z odnalezioną informacją (trzeci warunek). Problem ten polega na tym, że poziom rozumienia możemy ocenić tylko wówczas, gdy wszystkie warunki zostaną spełnione i uzyskamy odpowiedź zbliżoną do tej, jakiej udzielił nam program blokowy. A jak to wygląda u dzieci: w jakim stopniu rozumieją to, co zostało powiedziane? Podobnie jak i z komputerem, czasami trudno to ustalić. Przypuśćmy, że matka zwraca się do swego 6-miesięcznego dziecka: Give me the ball (Daj mi tę piłkę). W najlepszym razie dziecko zaledwie spojrzy na matkę, dając tym samym do zrozumienia, że słyszy jej słowa. Czy zrozumiało jednak sens zdania? Prawdopodobnie nie. Jeżeli zaś pytanie to zostanie powtórzone dziecku 12-miesięcznemu, możemy uzyskać bardziej zadowalającą odpowiedź: Będzie ono zapewne przenosiło wzrok z matki na piłkę i z powrotem. Działanie to w najlepszym razie wskazuje, że dziecko rozumie znaczenie słowa ball (piłka), ale nie dowiadujemy się niczego więcej. Możliwe, że nie rozumie znaczenia słowa give (daj). Możliwe też, że je rozumie, ale nie wie, iż słowo me (mi) oznacza odbiorcę czynności (You, baby, please give to me the ball). Albo też rozumie całe zdanie, ale nie nauczyło się jeszcze wykonywać określonych czynności: skierować się do przedmiotu, wziąć go do ręki, zanieść do mówiącego oraz wręczyć mu dany przedmiot. Trzeba przyznać, że dla 12-miesięcznego dziecka jest to dość skomplikowany zespół czynności. I znów, dopóki dziecko nie spełni wszystkich trzech przedstawionych wyżej warunków, dopóty nie możemy stwierdzić, w jakim stopniu zrozumiało ono to, co zostało powiedziane. Natomiast dziecko, które ukończyło 18 miesięcy, potrafi wykonać podobne polecenie. W końcu mamy dowód na to, że nas zrozumiało. Ale ciągle jest to dowód niezbyt pewny. Dziecko mogło po prostu wziąć do ręki pierwszy z brzegu przedmiot. I nawet wówczas, gdy wykona poprawnie polecenie kilka razy z rzędu, to jest całkiem możliwe, że ponownie przyniesie piłkę, chociaż zmienimy polecenia na: Give me the horse. (Daj mi konia). Dziecko bowiem z największym trudem zmienia opanowaną niedawno czynność, a zatem po kilkakrotnym wypełnieniu polecenia: Put a ring on the peg. (nałóż kółko na kołek), powtórzy tę czynność, mimo zmiany polecenia na: Take a ring off. (Zdejmij kółko z kołka). Dziecko dwuletnie może wykonać proste polecenia. Nie potrafi jednak postępować prawidłowo w sytuacji, gdy ulegną zmianie warunki związane z czynnością, mimo że miało już okazję do wykazania swych zdolności poznawczych rozwiązując problemy o zbliżonym typie trudności, ale na poziomie niejęzykowym. Jeśli poprosimy dziecko w wieku poniżej dwu i pół lat, aby wydostało monetę spod filiżanki, to okaże się, że nie potrafi ono wydobyć z przekazu słownego odpowiedniej informacji. Tymczasem osiem miesięcy wcześniej, 468 to znaczy w wieku 22 miesięcy, dziecko rozwiązywało bardziej skomplikowane zadania, związane z odszukiwaniem, naśladując po prostu innych. Dziecko dwuipółletnie przejawia skłonność do reagowania na polecenie, jeśli tylko zrozumie, o jaką czynność chodzi. Nie czeka przy tym na precyzyjniejsze ustalenia lub ograniczenia tej czynności. Jeśli otrzyma polecenie: „Kiedy zapali się światło naciśnij gruszkę", to skoro tylko zidentyfikuje czynność, naciska natychmiast gruszkę nie czekając na pojawienie się światła. Dziecko w wieku trzech i pół lat może reagować właściwie, tj. poczeka na światło zanim naciśnie gruszkę. Nawet i wtedy nie potrafi rozszyfrować bardziej złożonej informacji dotyczącej warunków. Polecenie: „Naciśnij gruszkę, gdy pojawi się światło czerwone, ale nie naciskaj na zielone” wywołuje reakcję na oba rodzaje światła. Dopiero w wieku 4 lub 5 lat dziecko opanowuje umiejętność wydobywania informacji o wszystkich warunkach dodatkowych, zakodowanych w informacji werbalnej, i przekształcenia jej we właściwą sekwencję czynności (Łuria, 1961; zobacz również Miller, Shelton i Flavel, 1970). System, który realizuje określoną sekwencję czynności na podstawie otrzymanej instrukcji z zewnątrz, musi dysponować czymś znacznie więcej, niż zwykłą zdolnością do wydobywania znaczenia z przekazu słownego. Polecenie musi zostać zintegrowane z istniejącą strukturą pamięci, tak aby odpowiednie zdarzenie mogło być rozpoznane już w chwili pojawienia się i aby prowadziło do odpowiednich czynności. Ponadto należy starannie przeanalizować informację o następstwach czasowych, tak aby czynności pojawiały się jedna po drugiej we właściwej, prawidłowej kolejności. Dziecko musi umieć zadecydować, czy informacja, jaką posiada, wystarczy do wykonania potrzebnego działania, i albo samodzielnie wywnioskować, jakich danych mu brakuje, albo też poprosić o wyjaśnienie. Niektóre z wymaganych czynności mogą okazać się niejednoznaczne, albo też mogą nie występować w repertuarze reakcji dziecka. W takim wypadku dziecko musi zadecydować, czy nie może zastąpić ich innymi czynnościami, które pozwoliłyby osiągnąć ten sam cel. Jeśli chcemy badać rozwój umiejętności językowych, to, oczywiście, musimy analizować wszelkie zdolności umysłowe dziecka, ponieważ procesy te oddziałują na siebie wzajemnie. 13. Uczenie się i rozwój poznawczy SCHEMATY SENSORYCZNO-MOTORYCZNE Schemat sensoryczno-motoryczny ZJAWISKA UCZENIA SIĘ Zbieżności miedzy czynnościami a wynikami Wzmocnienie zachowania Poziom sprawczy Generalizacja Wygaszanie Różnicowanie Rozkłady wzmacniania Uczenie się ucieczki i unikania Kara Wykrywanie korelacji Wyuczona bezradność Wygaszanie a różnicowanie Efekt częściowego wzmacniania Zbieżności miedzy warunkami zewnętrznymi a wynikami Kontrola bodźcowa Wybór Różnicowanie Tworzenie łańcucha reakcji Modelowanie zachowania Podsumowanie WARUNKOWANIE KLASYCZNE UCZENIE SIĘ POZNAWCZE Wzmocnienie jako sygnał Uczenie się i świadomość Uczenie się przez eksperymentowanie Znaczenie oczekiwań Zachowanie ukierunkowane na osiągnięcie celu ROZWÓJ POZNAWCZY Uczenie się sensoryczno-motoryczne ROZWÓJ OBRAZÓW Myślenie przedoperacyjne Operacje konkretne Operacje formalne MYŚLENIE 471 Zdolność do uczenia się, to znaczy zdolność do zapamiętywania skutków własnych działań, jest podstawą zachowań przystosowawczych wszystkich organizmów. Wiele badań nad rozumnym zachowaniem można scharakteryzować jako badania nad zdolnością uczenia się o związkach zachodzących w otaczającym świecie. Istnieje pewna niewielka formalna różnica między uczeniem się a pamięcią. Badając uczenie się, kładziemy przede wszystkim nacisk na nabywanie wiedzy; badając pamięć interesujemy się natomiast przechowywaniem i wykorzystywaniem tej wiedzy. Jasne jest jednak, że oba te procesy są ze sobą ściśle związane, tak że badając jeden z nich musimy z konieczności badać i drugi. Omawialiśmy już zasady uczenia się w kilku obszernych rozdziałach poświęconych pamięci. Pominięto tam jednak pewien ważny problem, w jaki sposób nabywana jest ta wiedza, która znajduje się w systemie pamięci: Jak podmiot ustala związki zachodzące między różnorodnymi sytuacjami w otaczającym świecie, działaniami człowieka i rezultatami tych działań. Jeżeli pewien wynik występuje wyłącznie przy równoczesnym zaistnieniu szeregu specyficznych warunków środowiskowych albo też po wykonaniu określonego działania, to wówczas mówimy o bezpośrednich zbieżnościach (contingencies) między warunkami środowiskowymi, działaniami i wynikami (Na przykład, określony rezultat - deszcz -jest zależny od pewnych warunków atmosferycznych). W rozdziale tym położono główny nacisk na sposób nabywania wiedzy o zbieżnościach, to znaczy na problemie uczenia się zbieżności. SCHEMATY SENSORYCZNO-MOTORYCZNE Badania eksperymentalne nad uczeniem się wskazują, że podstawą inteligentnego zachowania się jest prosta, a jednocześnie uniwersalna reguła. Organizacja naszej percepcji i zachowania wynika z obserwacji skutków naszych działań. Wyrażając to w języku jednego z czołowych badaczy rozwoju poznawczego, Jeana Piageta, organizm uczy się przez konstruowanie schematów sensoryczno-motorycznych: Wydobywa on związki między informacją odbieraną przez swoje systemy sensoryczne a swoimi działaniami (czynnościami motorycznymi). Schemat sensoryczno-motoryczny jest to plan (schemat) zorganizowanego ciągu czynności prowadzących do wykonania określonego aktu, koordynującego informację wydobytą z systemu sensorycznego wraz z niezbędnym ruchem motorycznym (mięśniowym). Akty typu jedzenia, chodzenia, jazdy na rowerze - charakteryzują się dobrze rozwiniętymi schematami sensoryczno-motorycznymi.] Jest też szczególnie wrażliwy na pewien rodzaj skutków, takich, które wiążą się z jakimś przyjemnym lub też koniecznym wynikiem, jak na przykład otrzymanie pokarmu. Jednakże w przypadku dziecka każda gwałtowana zmiana w świecie zewnętrznym, dowolny „spektakl sensoryczny", może przyciągać jego uwagę i służyć za podstawę do uczenia się zbieżności między działaniami a ich skutkami. Aby uczyć się zbieżności, organizm musi być zdolny do wykrywania pożądanych następstw w miarę ich pojawiania się i następnie starać się ukierunkować swoje zachowania na ich osiągnięcie. 472 Dlatego też musi umieć rozpoznawać, które działania rzeczywiście są związane z uzyskaniem oczekiwanego wyniku, a które nie mają z tym nic wspólnego. Aby bardziej dokładnie zrozumieć, o co tu chodzi, stworzymy sytuację hipotetyczną i na jej przykładzie ustalimy, co istotnie musi zajść, żeby organizm nauczył się zbieżności między jego czynnościami a wynikiem, którego pragnie. Za przykład posłuży nam zachowanie szympansa w pewnej specyficznej sytuacji. Szympans jest odpowiednim zwierzęciem do naszego eksperymentu, jest dostatecznie inteligentny, a co najważniejsze - nie ma żadnych umiejętności językowych, które ułatwiłyby znacznie jego zadanie, a utrudniły nasze. Schemat sensoryczno-motoryczny Umieśćmy szympansa w pokoju, w którym znajduje się szereg różnych przedmiotów: na ścianach wiszą obrazki, na podłodze leżą zabawki i pudełka, wokół porozrzucane są książki, żetony i małe różnokolorowe kwadraciki oraz stoi coś w rodzaju automatu z otworem (Rys. 13-1). W podobnych warunkach szympans nie znajdował się jeszcze nigdy: jest on eksperymentalnie czysty. Jeżeli będzie on przebywał odpowiednio długo w pokoju, to może odkryć zupełnie przypadkowo, że niebieski krążek włożony do otworu automatu spowoduje pojawienie się kiści winogron w pojemniku. 473 Ponieważ szympansy przepadają za winogronami, będzie to więc wynik w pełni pożądany i szympans z chęcią ponowi próby (ucząc się w ten sposób) rozwiązania tego zadania. Problem stanowi dla zwierzęcia przede wszystkim to, że nie posiada ono uprzedniej wiedzy o czynnościach, jakich od niego oczekujemy, ani o wyniku, do którego czynności te prowadzą. Szympans musi odkryć potrzebną sekwencję czynności poprzez próby i błędy oraz szczęśliwe zbiegi okoliczności. W dodatku musi on zapamiętać i umieć spożytkować pożądany rezultat, kiedy ten wystąpi. Końcowym produktem jego uczenia się powinna być struktura pamięci, przedstawiająca schemat sensoryczno-motoryczny wrzucania niebieskiego krążka w otwór automatu w celu uzyskania winogron. Poobserwujmy zatem zachowanie szympansa w pokoju. Początkowo biega on po pokoju, bada sytuację, bawi się zabawkami i wskakuje na pudełka. Napotkawszy na swej drodze automat, bada go, próbując wsunąć różnorodne przedmioty do wszystkich jego otworów: do pojemnika i do otworu szczelinowgo. W trakcie tych działań, zupełnie przypadkowo, udaje mu się włożyć we właściwy otwór niebieski krążek: automat zaczyna pracować, rozlega się głośny dźwięk „klik" i w dolnym pojemniku ukazują się winogrona. Dokonany został pierwszy, przygotowawczy etap uczenia się. [Jest mało prawdopodobne, aby szympans nauczył się tej sekwencji zdarzeń, jeśli rzeczywiście będziemy czekać na „przypadek". Zwykle eksperymentator tak ustala warunki, że „przypadek" jest bardzo prawdopodobny. Na przykład może on sprawić, żeby szympans przed tym eksperymentem miał do czynienia z sytuacjami, w których umieszczanie przedmiotów w automacie było nagradzające, lub może umieścić niebieskie krążki bardzo blisko automatu mając nadzieję, ze naturalna skłonność szympansa do wsuwania przedmiotów w otwory spowoduje, że i tym razem spróbuje to uczynić. W każdym razie chodzi o to, aby proces uczenia się rozpoczął się. Cała opisana przez nas kolejność uczenia się nie zajdzie dopóty, dopóki nie wystąpi pierwszy „przypadkowy" sukces.] Jak odbiera szympans zaistniałą sytuację? Oto skakał sobie po pokoju wykonując różne czynności nie prowadzące do określonych wyników. I nagle po zrobieniu czegoś pojawia się kiść winogron. Szympans pamięta jedynie w ogólnych zarysach swoje czynności, nie licząc pewnych szczegółów przechowywanych ciągle jeszcze w jego pamięci krótkotrwałej. Po swym pierwszym sukcesie zapamiętał przede wszystkim jedno: coś tam gdzieś włożył (zdaje się, gdzieś do automatu), a w pojemniku pojawiły się winogrona. Przedstawmy informację uzyskaną przez szympansa w formie, jaką stosowaliśmy analizując problemy pamięci ludzkiej w rozdziałach 10 i 11. W celu opisania zdarzeń, należy opracować scenariusz określający czynności oraz rolę różnorodnych przedmiotów i uczestników. Będzie to pierwszy próbny schemat sensoryczno-motoryczny; został on przedstawiony na rysunku 13-2. Dla wygody Czytelnika podaliśmy słownik nazw różnych pojęć oznaczonych literami. Jest oczywiste, że szympans nie dysponuje tymi wiadomościami, przynajmniej w fazie początkowej. Nie wykluczamy jednak takiej ewentualności, że może on wypracować sobie jakiś abstrakcyjny (niejęzykowy) ekwiwalent tego słownika. Pojęcie C1 reprezentuje środowiskowe, czyli poprzedzające warunki związane z daną sytuacją. Pojęcie to obejmuje różne elementy, automat (C3) i pewne inne, na razie nie określone przedmioty (C2 i C4). W tym kontekście sytuacyjnym czynność wkładania określonego przedmiotu w otwór prowadzi do następstwa - pojawienia się winogron. Inaczej mówiąc, w warunkach 474 RYSUNEK 13-2 środowiskowych C1 czynność wkładania jakiegoś nieokreślonego przedmiotu prowadzi do następstwa C8 (winogrona). Następstwo zdarzeń określone jest przez relacje jeśli (warunek poprzedzający) i to (następstwo): jeśli C1, wkładanie, to C8. Schemat przedstawiony na rysunku 13-2 wskazuje na znaczny postęp w stanie wiedzy szympansa. Zwierzę zrozumiało rolę tak istotnych czynników, jak automat i czynność wkładania. Pozostaje teraz jedynie odkryć, jakie są warunki konieczne czynności uzyskiwania winogron. Mogą tu pomóc ograniczenia jakie narzuca czynność wkładania. Nawet jeżeli zwierzę nie pamięta żadnych szczegółów, jasne jest, że czynność wkładania wymaga, żeby jeden przedmiot włożyć do drugiego. W terminach struktury znaczeniowej trzeba zatem określić przedmiot i jego miejsce. Zakładamy, że szympans, choć nie posiada wiedzy o języku, gest mimo to zdolny do zdobywania wiedzy o czynnościach i zdarzeniach zachodzących w świecie. Należy zatem przypuszczać, że w jego pamięci istnieje wewnętrzna reprezentacja czynności wkładania, jakkolwiek nie występuje ona w formie językowej, to jest jej jakimś, z grubsza rzecz biorąc, odpowiednikiem. Tak więc szympans ma teraz określony cel: odkryć odpowiedni przedmiot i odpowiednie miejsce, do którego należy go włożyć. Jego zachowanie zostało ukierunkowane na osiągnięcie tego specyficznego celu. W pewnym momencie, po wielu próbach, może trafić na prawidłowe połączenie i dodać je do swego scenariusza zdarzeń w pamięci. Jeden z możliwych schematów sensoryczno-motorycznych dla pełnej akcji zdobywania winogron przedstawiony został szczegółowo na rysunku 13-3a i w postaci uproszczonej na rysunku 13-3b. 476 Szympans nauczył się następującego schematu: jeśli w warunkach C1 włoży C2 w otwór C3, to uzyska C8. Zanim przejdziemy do rozważań dotyczących rozwoju struktur znaczeniowych w procesie uczenia się, omówimy niektóre znane właściwości uczenia się, aby móc następnie określić warunki i sytuacje charakteryzujące tę skomplikowaną formę zdobywania doświadczeń. ZJAWISKA UCZENIA SIĘ Nasz podstawowy problem polega na ustaleniu, w jaki sposób organizm zdobywa wiedzę o otaczającym go świecie. Przedtem jednak musimy dowiedzieć się nieco więcej o podstawowych zjawiskach związanych z uczeniem się. Tak więc w tej części rozdziału prześledzimy te zjawiska w celu określenia warunków wpływających na uczenie się. Potem powrócimy do wyjaśnienia problemu uczenia się poprzez dedukowanie mechanizmów wewnętrznych, które przekodowują sytuację zewnętrzną w strukturę pamięci danego organizmu. Być może, najlepszym dotąd opisem czynnika regulującego zachowanie jest Prawo Efektu: Czynność, która prowadzi do pożądanego wyniku, ma tendencję do powtarzania się w podobnych okolicznościach. Samo prawo jest proste, określa jednak podstawowy warunek, leżący u podłoża większości wyuczonych zachowań. Pierwszy sformułował je w 1898 r. psycholog Thorndike; następnie w wyniku rozległych badań uległo ono różnorodnym modyfikacjom; jednak po dzień dzisiejszy jego pierwotna forma stanowi najbardziej funkcjonalny opis warunków koniecznych do uczenia się. Ta podstawowa zasada nabywania wiedzy o zbieżnościach w otaczającym świecie stanowi istotę zachowania przystosowawczego wszystkich organizmów. Odgrywa ważną rolę w organizacji zachowań ludzkich we wczesnym dzieciństwie i pozostaje czynnikiem dominującym w ciągu całego ludzkiego życia. Zbieżności między czynnościami a wynikami Rozpatrzmy łącznie zachowanie się noworodka i jego rodziców jako pierwsze interakcje między nimi. Rozpoczniemy nasz opis od głodnego niemowlęcia. Dziecko niespokojnie porusza się, najwyraźniej widać, że czegoś mu brak, ale ruchy jego nie mają wyraźnego celu. W końcu zaczyna płakać, co zwraca uwagę jednego z rodziców, który zaspokaja potrzebę dziecka. Tak więc na skutek płaczu dziecko otrzymuje pokarm i zaspokaja głód. Wraz z otrzymaniem pokarmu zaczyna działać prawo efektu. Pokarm jest zdarzeniem wzmacniającym 477 i zachowanie typu płacz „ma tendencję do powtarzania się w podobnych okolicznościach". Jest to ogólny paradygmat uczenia się instrumentalnego, ponieważ reakcje dziecka są instrumentalne w stosunku do zmiany warunków otoczenia [Opis uczenia się zbieżności w niniejszym paragrafie opiera się w znacznej mierze na badaniach eksperymentalnych w dziedzinie zwanej warunkowaniem sprawczym (operant conditioning). Badania w tej dziedzinie pozostawały pod silnym wpływem prac B. F. Skinnera, który rozpoczął je na początku lat trzydziestych. Termin warunkowanie sprawcze pojawił się w wyniku podkreślania faktu, że zachowanie badanych organizmów działa sprawczo na środowisko w celu wywołania jakiegoś wyniku. Badania nad uczeniem się sprawczym stanowią część badań nad uczeniem się instrumentalnym - nabywaniem reakcji, które są instrumentem w osiąganiu jakiejś nagrody.] Wzmocnienie zachowania. Pojawienie się zdarzenia wzmacniającego, pokarmu, wywiera dwojaki wpływ na zachowanie dziecka. Zatrzymuje reakcję instrumentalną-płacz. Jednocześnie zwiększa prawdopodobieństwo pojawienia się tej reakcji w przyszłości, wówczas, kiedy dziecko będzie głodne. Poziom sprawczy. Od początku prawdopodobieństwo tego, że głód doprowadzi do płaczu, było względnie wysokie nawet wówczas, gdy brak było wzmocnienia. Na tym polega ważny aspekt uczenia się instrumentalnego, ponieważ zachowanie, które nie występuje, nie może być wzmacniane. Pierwsze wzmocnienie może nastąpić wówczas, kiedy pojawi się pierwsza reakcja instrumentalna, czyli sprawcza. A zatem do rozpoczęcia całego procesu niezbędny jest pewien dość wysoki wyjściowy poziom reakcji sprawczej. Możliwe jest również wzmacnianie innych reakcji, nie tylko płaczu. Mądra matka może wybrać jako sygnał głodu dowolną z kilku różnych reakcji dziecka-pod warunkiem jednak, że ta klasa reakcji ma odpowiednio wysoki wyjściowy poziom sprawczy. Generalizacja. Dziecko generalizuje udaną reakcję na inne podobne sytuacje. Jest bardzo prawdopodobne, że zacznie płakać nie tylko, gdy odczuje głód, ale również w innych przykrych sytuacjach. Początkowo prawdopodobieństwo tego, że dziecko zapłacze, jest tym wyższe, im jest bliższa głodu odczuwana przez nie dolegliwość. Płacz pojawiający się w innych sytuacjach będzie prawdopodobnie także wzmacniany pojawieniem się rodziców i usunięciem dolegliwości, a to z kolei prowadzi do jeszcze mocniejszego płaczu w miarę pojawiania się innych form dolegliwości. W końcu dziecko nauczy się płakać zawsze wtedy, kiedy zechce zwrócić na siebie uwagę, ponieważ jego płacz jest niezmiennie wzmacniany pojawieniem się czułych i troskliwych rodziców. Nadmierna troskliwość rodziców może w rezultacie doprowadzić do tego, że dziecko będzie płakać nieustannie, aby zwrócić na siebie uwagę. W jednym z najbardziej popularnych poradników dotyczących opiekowania się dzieckiem, napisanym przez znanego doktora Spocka i zatytułowanym Baby and Child Care (1957), problem ten jest wyjaśniony w następujący sposób: 478 „Jeżeli rodzice nie zdołają ukrócić tego przykrego nawyku, to dziecko nauczy się budzić w nocy już nie jeden raz, ale coraz częściej i domagać się nie tylko towarzystwa matki, lecz również noszenia na ręku, i jeśli spróbuje ona położyć je z powrotem do łóżka, zacznie rozpaczliwie płakać. Sam słyszałem o wypadkach, kiedy rodzice musieli nosić dziecko na ręku po trzy, cztery godziny w ciągu nocy" (s. 188). Wygaszanie. Rodzice udręczeni płaczem dziecka mogą spróbować wygasić płacz jako formę zachowania, wstrzymując jego wzmacnianie, w przeciwnym razie dziecko może przepłakać większą część doby. Jak to zrobić? Wróćmy ponownie do doktora Spocka: „W wielu wypadkach łatwo można zaradzić tej sprawie. Dziecko powinno nauczyć się, że krzykiem pośród nocy nic nie wskóra. Niech płacze- nie podchodźcie do niego. Pierwszej nocy może przepłakać 20-30 minut (choć wyda wam się to bardzo długo), następnej nocy przepłacze 10 minut, a trzecią noc może w ogóle prześpi spokojnie (s. 188). Spock uprzedza rodziców, że taki reżim niełatwo wytrzymać, zwłaszcza gdy dziecko zanosi się płaczem i zaczyna wymiotować. Matka jednak powinna okazać „twarde serce", jak mówi Spock, i bezwarunkowo „postawić na swoim": nie podchodzić do dziecka. Wrócimy jeszcze do tego problemu. Różnicowanie. Niemowlę, które otrzymuje wzmocnienie, gdy płacze z jakiegoś ważnego powodu, a którego płacz jest wygaszany w sytuacjach mało istotnych, uczy się różnicować warunki prowadzące do wzmocnienia od tych, które nie prowadzą do niego. Jedyna różnica dotyczy warunków środowiska. Tak więc dziecko powinno uczyć się różnic między swoimi różnymi stanami sensorycznymi, między głodem lub brakiem komfortu fizycznego z jednej strony a osiągnięciem stanu komfortu z drugiej. Kiedy już może ono kontrolować swoje zachowanie zgodnie z tymi bodźcami, mówimy, że jego zachowanie jest kontrolowane przez bodźce. Rozkłady wzmacniania. Niemowlę może wyuczyć się reakcji na rozkład, według którego otrzymuje ono wzmocnienie. Rodzice, nie wiedząc, czy płacz dziecka oznacza głód czy też jakiś inny przykry stan, sami mogą wymyślić prostą regułę. Jeśli niemowlę dopiero co otrzymało wszystko, co mu było potrzebne (nakarmiono je, zmieniono pieluszki, pobawiono się z nim, przykryto), to nie należy zwracać uwagi na jakikolwiek płacz w ciągu 30 min., zaś po upływie tego czasu należy podejść do dziecka jak tylko zapłacze. Przyjmując taką zasadę, ustalamy określony rozkład wzmacniania. W danym wypadku wzmocnienie następuje jedynie wówczas, gdy płacz pojawi się po upływie 30 minut od otrzymania poprzedniego wzmocnienia. Jest to rozkład wzmacniania o stałym 30-minutowym odstępie czasowym (fixed-interval, FI-30). I chociaż matka pragnie poddać dziecko kontroli bodźcowej, aby płakało tylko przy odczuwaniu głodu, to jednak samo dziecko prawdopodobnie po prostu reaguje na dany rozkład i zaczyna płakać za każdym razem w pół godziny po otrzymaniu wzmocnienia, 479 które nastąpiło po uprzednim płaczu. Oczywiście, nie rozwiązuje to problemu rodziców. Możliwe są również inne rozkłady. Zdarza się np., że matka wprowadza do tej reguły różne zmiany, wytrzymując czasem tylko 10 min., a czasem dopiero po 50 min. reaguje na płacz. Jeżeli przy tym średni odstęp wynosi jak dawniej 30 min., to mamy do czynienia z 30-minutowym rozkładem o zmiennym odstępie czasowym (variable-interval, VI-30). Jeżeli matka po prostu liczy ataki płaczu, decydując się podejść do dziecka jedynie po każdym piątym płaczu, mamy do czynienia z rozkładem wzmacniania o stałych proporcjach równych 5 reakcjom (fixed-ratio, FR-5). A jeżeli liczba reakcji, po której podchodzi się do dziecka, zmienia się przy tej samej (5 reakcji) średniej proporcji, to mamy do czynienia z rozkładem wzmacniania o zmiennych proporcjach (variable-ratio, VR-5). W końcu istnieją również połączone rozkłady. Matka może początkowo odczekać ileś razy po 20 min. po ostatnim wzmocnieniu (FI-20), a potem podejść do dziecka po takiej lub innej liczbie ataków płaczu, ale średnio ok. 3 razy (VR-3). Mamy tu do czynienia z sekwencją dwóch rozkładów, FI-20; VR-3. Niestety, dziecko dość szybko reaguje na zbieżności występujące w tych połączonych rozkładach wzmacniania i odpowiednio przystosowuje swoje zachowanie. W sytuacjach normalnej pielęgnacji niemowlęcia przeważają rozkłady umiarkowanie złożone, ustalające się w wyniku pojawiania się przypadkowych frustracji dziecka i czynienia przez rodziców chaotycznych prób opanowania tych sytuacji. Mówiliśmy do tej pory o wzmocnieniu pozytywnym: niemowlę otrzymuje to, czego chce. Analogiczny system reguł rządzi jego reakcjami na wzmocnienie negatywne, tj. na warunki związane ze zdarzeniami nieprzyjemnymi bądź też szkodliwymi dla niemowlęcia. Pozostawmy niemowlę na jakiś czas, aby zastanowić się nad niektórymi głównymi cechami wzmocnienia negatywnego. Uczenie się ucieczki i unikania. Psa umieszczono w skrzynce wahadłowej, urządzeniu, którego dwie części oddzielone są od siebie barierką. Jego zadanie polegało na uczeniu się przeskakiwania przez barierkę z jednej części pomieszczenia do drugiej. Kiedy pies znajduje się w jednym pomieszczeniu, metalowa siatka znajdująca się na podłodze przewodzi elektryczność i jego łapy odbierają uderzenia prądem. Pies szybko uczy się uciekać przed wstrząsem przeskakując do drugiego „bezpiecznego" pomieszczenia. Można też przed włączeniem prądu dawać ostrzeżenie: dziesięć sekund przed uderzeniem prądu pojawia się sygnał świetlny. Wtedy pies uczy się unikać wstrząsu przez przeskakiwanie barierki w czasie tych dziesięciu sekund, które oddzielają sygnał świetlny od uderzenia prądem. Oba sposoby postępowania nazywają się odpowiednio uczeniem się ucieczki i uczeniem się unikania. Oba typy uczenia się są związane ze wzmocnieniem negatywnym. Ucieczka przed uderzeniem prądem pozwala na przerwanie jego oddziaływania na psa, zwiększając tym samym prawdopodobieństwo tej reakcji ucieczki w przyszłości. Pojawienie się pożądanego zdarzenia 480 zwane jest wzmocnieniem pozytywnym: Zakończenie przykrego zdarzenia nazywamy wzmocnieniem negatywnym. Zarówno wzmocnienie pozytywne, jak i wzmocnienie negatywne zwiększają prawdopodobieństwo pojawienia się reakcji, która poprzedziła je bezpośrednio. Spróbujmy zastanowić się, czego nauczyło się zwierzę w rezultacie wytworzenia się reakcji unikania. Skoro już reakcja unikania została wyuczona, skoro zwierzę nauczyło się unikać uderzenia prądem przez przeskakiwanie barierki po pojawieniu się sygnału świetlnego, jego zachowanie jest bardzo trudne do wygaszenia. Nawet wówczas, gdy źródło prądu zostanie odłączone od podłogi skrzynki wahadłowej, pies po dawnemu przeskakuje barierkę zaraz po włączeniu światła, powtarza to setki razy. Tak więc, jeśli chodzi o zwierzę, to zbieżność, która tu funkcjonuje, polega na tym, że jeśli przeskoczy ono przez barierkę, to nie otrzyma uderzenia prądem. Wyłączenie prądu nie ma żadnego wpływu na tę zależność. Zapala się światełko, pies skacze i nie otrzymuje uderzenia prądem. Czynność prowadzi do pożądanego rezultatu; a zatem nie ma powodu zmieniać zachowania. Kara. Jeżeli zakończenie działania przykrego lub pojawienie się przyjemnego zdarzenia zwiększa prawdopodobieństwo wystąpienia poprzedzającej je reakcji, to pojawienie się nieprzyjemnego zdarzenia lub przerwanie zdarzenia przyjemnego powinno to prawdopodobieństwo zmniejszać. Tak też jest w istocie, jednak sytuacja, jaka powstaje w wyniku ukarania przez pojawienie się przykrego zdarzenia, różni się nieco od wygaszenia reakcji, która następuje w wyniku przerwania działania nagrody. Jeżeli zwierzę wyuczyło się reakcji specyficznej w celu otrzymania pokarmu, to jego zachowanie ulegnie szybkiej zmianie, kiedy po tej reakcji zamiast oczekiwanego pokarmu otrzyma uderzenie prądem. Czasem wystarczy jedna próba, aby na stałe przerwać tę reakcję. Kara polegająca na uderzeniu prądem ma tendencję do rozszerzania się na inne formy zachowania. Tłumi znaczną liczbę różnych reakcji, zaledwie pośrednio związanych z reakcją karaną. Większość organizmów jest szczególnie wrażliwa na przykre zdarzenia. Okazują się być bardzo ostrożne w ocenianiu źródła kary, starając się raczej stłumić dużą liczbę zachowań niż ryzykować ponowne ukaranie. Tendencja ta w powiązaniu ze znaną niekonsekwencją rodziców w stosowaniu kary sprawia, że próby oddziaływania na zachowanie dziecka za pomocą kary są przedsięwzięciem dość wątpliwym. Ponadto wzmożona aktywność i stres, które zazwyczaj towarzyszą karaniu przez przykre zdarzenia, mogą utrudniać uczenie się bardziej właściwych form zachowania. W toku naszych rozważań dotyczących motywacji (rozdział 17) wskażemy, że częstą reakcją na przykre lub uciążliwe zdarzenia jest agresja. Wracając do płaczu niemowlęcia należy powiedzieć, że kara jest wyraźnie nieskutecznym sposobem redukowania płaczu. Przy próbach karania powstaje błędne koło akcji i reakcji: matka daje dziecku klapsa dlatego, że płacze; dziecko płacze jeszcze głośniej dlatego, że dostało klapsa. 481 Wykrywanie korelacji Mówiliśmy dotychczas o tym, jak zwierzę uczy się zbieżności między własnymi czynnościami a wzmocnieniem. W wielu sytuacjach zbieżności te mają charakter probabilistyczny. Mówimy wtedy o istnieniu korelacji między czynnością a wynikiem. Korelacje między dwoma zdarzeniami mogą przybierać dowolną wartość od minus 100 procent do plus100 procent. Jeżeli wystąpienie czynności gwarantuje wynik, istnieje korelacja 100 procent (zazwyczaj określana jako 1,00). Jeżeli czynność wyklucza pojawienie się wyniku, korelacja wynosi minus 100 procent (lub minus 1,00). Jeżeli brak jest jakiejkolwiek współzależności między czynnością a wynikiem, korelacja jest równa 0. Możliwe są tu również wartości pośrednie. A zatem możemy powiedzieć, że korelacja między warunkami środowiska ciemne chmury a wynikiem deszcz wynosi 0,75; znaczy to, że w sytuacji dużego zachmurzenia deszcz jest wynikiem w wysokim stopniu prawdopodobnym. Korelację między piękną słoneczną pogodą a deszczem można ocenić na minus 0,95, znaczy to, że jeden warunek wyklucza (choć nie całkowicie) drugi. Zbieżność jest po prostu szczególnym przypadkiem korelacji. Zwierzęta są zdolne nie tylko do uczenia się korelacji; uczą się również tego, że między pewnymi czynnościami a wynikami istnieje korelacja zerowa. Wyuczona bezradność. Powróćmy do sytuacji opisanej jako uczenie się ucieczki i unikania. Pies zostaje umieszczony w skrzynce wahadłowej i otrzymuje uderzenia prądem. Ale tym razem nie ma barierki i nie występuje reakcja, która pozwalałaby uniknąć uderzenia lub też uciec przed nim. Brak jest korelacji między jego czynnościami a wynikami. Kiedy pies doświadcza przez pewien czas tej nowej sytuacji, eksperymentator zmienia sytuację. Ustawiona zostaje barierka i w tej zmienionej sytuacji możliwe jest uniknięcie uderzenia lub też ucieczka przed nim przez przeskoczenie barierki w odpowiednim czasie. I oto okazuje się, że w nowej sytuacji (w odróżnieniu od zachowania się zwierząt w opisanych wcześniej eksperymentach) pies, który miał pierwsze doświadczenia w sytuacji korelacji zerowej, z największą trudnością uczy się, w jaki sposób może uniknąć uderzenia prądem. Niektóre psy nie mogą się tego nauczyć, mimo że eksperymentator pokazuje im prawidłowe rozwiązanie, przenosząc je przez barierkę (Seligman, Maier i Solomn, 1969). Wydaje się, że psy te przyjęły hipotezę dotyczącą bezradności. Jeśli taka hipoteza utrwaliła się, to trudno ją wykorzenić. W czasie, gdy pies otrzymywał uderzenia prądem, których nie mógł uniknąć, najwidoczniej przyswoił sobie przekonanie, że wszystkie reakcje znajdujące się w jego repertuarze powodują uderzenia prądem. Przy kolejnych uderzeniach prądem hipoteza ta się potwierdzała, potwierdzały się oczekiwania psa i prawdopodobieństwo tego, że podejmie on jakieś działanie przy następnym uderzeniu, stawało się coraz mniejsze. Pewien wgląd w istotę tej sytuacji może dać przeprowadzenie podobnych eksperymentów z ludźmi. W tym wypadku korzystne jest to, że możemy ich zapytać, dlaczego nie mogą się wyuczyć reagowania ucieczką na zmianę warunków. W jednym z eksperymentów tego typu 60 procent osób badanych, którym nie udało się wyuczyć ucieczki, stwierdziło że: 482 „...czują się bezsilni, jeśli chodzi o uniknięcie uderzeń, więc po co próbować? Badani twierdzili, że znaczną część czasu spędzają na przygotowaniu się do kolejnego uderzenia prądem. Około 35 procent badanych oświadczyło, że po naciśnięciu jednego czy dwu przycisków (prawidłowa kombinacja pozwalała zapobiec uderzeniu) stracili nadzieję ucieczki". (Thoronton i Jacoba, 1971, s. 371). Badani, którzy nie uczyli się w sytuacji korelacji zerowej, reagowali zupełnie inaczej. Nie tylko nauczyli się unikać uderzeń, ale ponad 70 procent spośród nich „...stwierdziło, że z pewnością istnieje sposób kontrolowania uderzeń, trzeba go tylko znaleźć". Moc niewłaściwej hipotezy ujawniła się najwyraźniej w zachowaniu tych osób, które uważały, że uderzenia są nieuniknione, a którym w warunkach, gdy istniała możliwość uniknięcia uderzenia, „przypadkowo" udawało się ich uniknąć. Czasami osobom tym udawało się „...uciec lub uniknąć uderzeń nawet więcej niż jeden raz, ale przy następnych próbach ponownie otrzymywały pełne uderzenie, trwające trzy sekundy. Stało się jasne, że osoby te nie kojarzyły swoich reakcji ze wzmocnieniem". Jedna z trudności, jakie napotyka zwierzę lub osoba badana w eksperymentach tego typu, polega na tym, że warunki korelacji zerowej tylko nieznacznie różnią się od nowej, zmienionej sytuacji. Jest to zjawisko ogólne: jeżeli różnica między dwoma rozkładami wzmacniania jest trudna do wykrycia, to zmiany w rozkładach nieznacznie wpływają na zachowanie (przynajmniej nie od razu). Wygaszanie a różnicowanie. Jeżeli zwierzę nauczyło się rozwiązywać jakieś zadanie, powiedzmy naciskać dźwignię w celu otrzymania pokarmu, to co zdarzy się podczas wygaszania nawyku, kiedy po naciśnięciu dźwigni nie pojawia się pożywienie? Odpowiedź zależy od tego, jakim rozkładem wzmocnienia posługiwano się podczas uczenia. Jeżeli stosowany był rozkład o stałej proporcji równej 1 (FR-1), tak że zwierzę po każdym naciśnięciu dźwigni otrzymywało pokarm, to wkrótce po rozpoczęciu wygaszania zwierzę przestanie naciskać dźwignię. Zmiana rozkładu jest wyraźna i łatwo ją zauważyć. Załóżmy teraz, że rozkład zmienia się powoli, od FR-1 do FR-10, następnie do FR-100 i nawet do FR-1000. Jeżeli umiejętnie przeprowadzi się stopniowanie, zwierzę prawdopodobnie nauczy się zdobywać pokarm nawet wówczas, gdy będzie musiało naciskać dźwignię po 1000 razy dla jednego wzmocnienia. Zwierzę, które przyzwyczaiło się działać według rozkładu FR-1000, w momencie gdy rozpoczyna się wygaszanie z największym trudem może dostrzec, że pojawiła się jakaś zmiana. Przez dłuższy czas nie zmodyfikuje swoich reakcji, mimo że wzmocnienie zostało wstrzymane. Jeśli zaś ostatni rozkład przed wprowadzeniem wygaszania był zmienny, na przykład VR-1000, to wygaszanie będzie bardzo powolne, jeśli w ogóle doprowadzi do przerwania reakcji. Im rzadziej (lub z większą zmiennością) wzmacniamy zwierzę w czasie ćwiczenia, tym dłużej po rozpoczęciu wygaszania utrzymywać się będą reakcje zwierzęcia. (Oczywiście, samo uczenie się w takich warunkach jest trudniejsze). Efekt częściowego wzmacniania. Przedłużające się występowanie podczas wygaszania reakcji nabytych przy zastosowaniu rozkładu sporadycznego wzmacniania nazywamy efektem częściowego wzmacniania 483 (partial reinforcement effect-PRE). Aby utrzymać na trwałe daną formę zachowania w warunkach jej wygaszania, najlepiej uczyć zwierzę według rozkładu, w którym wzmacniana jest tylko część jego reakcji, najlepiej rzadko i przy tym w zmiennych proporcjach. Rozważmy problem ćwiczenia dziecka do efektywnej pracy w szkole podstawowej. Jeśli nauczyciel nagradza dziecko zawsze za prawidłowe wykonanie, powiedzmy, gdy wykonuje ono zadanie w terminie, to wszystko będzie szło dobrze dopóty, dopóki nauczyciel będzie zawsze obecny. Jeżeli jednak nauczyciel pominie taką okazję do nagrody, dziecko stanie się niepewne. Brak oczekiwanego wzmocnienia nie tylko zahamuje daną czynność, ale również można się spodziewać wystąpienia u dziecka reakcji frustracyjnej. Byłoby idealnie, gdyby nauczyciel zwiększał powoli odstępy między wzmocnieniami, ostrożnie przygotowując dziecko do jeszcze skromniejszego rozkładu nagród. Po takim treningu wydajność dziecka nie ulegnie zmianie nawet wówczas, gdy nauczyciel nie będzie poświęcał mu tyle uwagi (albo będzie nieobecny przez kilka dni), ponieważ przedłużający się brak nagrody za prawidłowe zachowanie nie będzie łatwo odróżniony od normalnych wahań w rozkładzie wzmocnień. Aby wprowadzić nowe zachowanie, konieczne jest zastosowanie ciągłego, czyli 100 procent rozkładu wzmacniania (FR-1); natomiast w celu podtrzymania tego zachowania należy wprowadzić rozkład częściowy. Zastanówmy się ponownie nad problemem płaczącego niemowlęcia. Przypuśćmy, że rodzice zawsze podchodzą do dziecka, jak tylko ono zapłacze. W rezultacie częstość jego płaczu wzrasta, dziecko zaczyna płakać zawsze wtedy, kiedy budząc się nie spostrzega rodziców. Przypuśćmy również, że sfrustrowani rodzice starają się zupełnie nie zwracać uwagi na płacz dziecka i aby wygasić tę formę jego zachowania postanowili podchodzić do niego dopiero wówczas, gdy jest spokojne. Z reguły nie udaje się im wprowadzić w życie tego postanowienia. Jak pisze dobry Dr Spock: „Rodzicom o wrażliwym sercu trudno słuchać ciągłego płaczu dziecka. Wyobrażają sobie zaraz najgorsze rzeczy: główka dziecka utkwiła między prętami łóżka, dostało torsji i leży całe zabrudzone, ogarnął je lęk z powodu osamotnienia" (s. 187). W rezultacie dziecko otrzymuje częściowe wzmocnienie według jakiegoś rozkładu, powiedzmy co godzinę (VI-60). Wynik jest oczywiście zupełnie odwrotny od pożądanego. Płacz staje się jeszcze dłuższy i trudniejszy do wygaszenia. Dziecko nauczyło się, że musi dłużej płakać, aby otrzymać wzmocnienie w takiej sytuacji. Zdaniem Dr Spocka: „Bardzo ważne jest uniknięcie pokusy podejścia do dziecka, aby przekonać się, że nic mu nie jest, albo je uspokoić, że jesteście w pobliżu. To tylko rozzłości je jeszcze bardziej i będzie płakało znacznie dłużej" (s. 187). Zbieżności między warunkami zewnętrznymi a wynikami Wygaszanie reakcji można traktować jako postawienie zwierzęciu problemu polegającego na różnicowaniu. Musi ono wiedzieć, zanim dokona odpowiedniej zmiany swego zachowania, 484 jakiemu rozkładowi wzmocnienia podlega. Jednym ze sposobów dawania wskazówek, jaki rozkład wystąpi, jest wprowadzanie zmiany jednego elementu środowiska zawsze wtedy, gdy zmienia się rozkład wzmacniania. Taką zewnętrzną wskazówkę nazywamy bodźcem sygnałowym. Kontrola bodźcowa. Bodziec sygnalizujący obecność wzmocnienia oznaczamy jako SD (S ze znaczkiem D); bodziec, który sygnalizuje brak wzmocnienia (procedura wygaszania), to SA (S ze znaczkiem delta) Teraz znacznie łatwiej kontrolować sytuację: zwierzę zwykle łatwo uczy się, że może otrzymać wzmocnienie, kiedy wystąpi SD (S ze znaczkiem D), a nie ma czego oczekiwać, gdy pojawia się SA. (Zazwyczaj w eksperymentach ze zwierzętami SD (S ze znaczkiem D)i SA (S ze znaczkiem delta) to-odpowiednio-pojawienie się lub brak sygnału świetlnego. Powszechną formą SA (S ze znaczkiem delta) dla ludzi jest napis „nieczynne"). Wprowadzając pojęcie kontroli bodźcowej, łatwo możemy je rozszerzyć na sygnały innego rodzaju. Po pierwsze, sam bodziec SD (S ze znaczkiem D)może mieć właściwości wzmocnienia wtórnego: zwierzę podejmuje różne działania, aby pojawił się SD (S ze znaczkiem D). Tak więc zwierzę może nauczyć się działać według pewnego rozkładu wzmocnień, aby uzyskać odpowiedni SD (S ze znaczkiem D), oznaczający początek drugiego rozkładu wzmocnień, prowadzącego w efekcie do otrzymania pokarmu. A w dodatku, jak tylko zwierzę nauczyło się kojarzyć określony SD (S ze znaczkiem D) z odpowiadającym mu rozkładem wzmocnień, uzyskujemy możliwość sprawdzenia, który z danych rozkładów ono preferuje. Wybór. Przypuśćmy, że trenujemy zwierzę według rozkładu o stałych proporcjach, wzmacniając co setną reakcję. Sygnałem dla tego rozkładu (FR-100) będą pionowe pasy umieszczone na dźwigni. W tym samym czasie, ale w innych godzinach, można też trenować zwierzę według innego rozkładu, powiedzmy o zmiennych proporcjach (YR-100), do tego celu służy dźwignia z pasami poziomymi. Następnie pozostawia się zwierzęciu możliwość wyboru którejś z dwu dźwigni: jednej z poziomymi pasami i drugiej z pionowymi pasami. Jest to sytuacja wyboru. Obserwując reakcje zwierzęcia możemy ustalić względną preferencję dotyczącą jednego z dwu rozkładów, FR-100 lub VR-100. Oczywiście tę technikę można wykorzystać do porównania dowolnych dwu (lub więcej) rozkładów wzmocnień. Różnicowanie. Ta sama technika z niewielkimi zmianami może być użyta do badania u zwierząt zachowania polegającego na różnicowaniu. Zaczynamy od dwu rozkładów wzmocnień, o których wiemy, że zwierzę wyraźnie preferuje jeden niż drugi. Prostym przykładem może być zastosowanie FR-1 w jednym rozkładzie przy braku wzmocnień w drugim. Niech sygnałem dla pierwszego rozkładu będzie silne światło (to znaczy SD), a dla drugiego - słabe światło (to znaczy SA (S ze znaczkiem delta)). Teraz zwierzę ma do czynienia z dwiema dźwigniami oraz dwoma bodźcami, światłem o dużej intensywności i o małej intensywności. Jeżeli zwierzę może odróżnić różnice intensywności obu świateł, to według wszelkiego prawdopodobieństwa zawsze będzie wybierać dźwignię „oznaczoną" silnym światłem SD (S ze znaczkiem D), po którym zawsze następuje wzmocnienie. Teraz powoli zmieniamy intensywność światła SD (S ze znaczkiem D), tak że staje się coraz bardziej podobne do SA (S ze znaczkiem delta). Zdolność zwierzęcia do różnicowania intensywności światła ustalamy na podstawie jego zdolności 485 wyboru prawidłowej reakcji (jest oczywiste, że dobór rozkładów i bodźców świetlnych do danych dźwigni jest przypadkowy, tak aby ich lokalizacja była bez znaczenia). Technika ta może być stosowana do pomiaru zdolności różnicowania przez zwierzę dowolnych bodźców stosowanych jako SD lub SA. Jest to standardowa metoda mierzenia wrażliwości i czułości zwierząt na światło, dźwięki i inne sygnały. Tworzenie łańcucha reakcji. Jeśli bodziec nabrał wartości wzmocnienia wtórnego, może być użyty do wzmocnienia reakcji. A zatem, jeżeli nauczymy szympansa zdobywać winogrona przez wrzucanie niebieskich krążków do automatu, krążki te prędko nabierają wartości jako wzmacniacze. Teraz możemy wyuczyć szympansa wykonywania innych czynności, w wyniku których uzyskiwać będzie niebieskie krążki. Na przykład, możemy nauczyć go pociągać za sznur, aby otrzymać krążki. Kiedy czynność ta zostanie utrwalona, nabiera mocy wzmacniającej. Można nauczyć szympansa otwierania drzwi, aby mógł dostać się do sznura. Bodźcem (SD) do otwarcia drzwi może być np. światło (drzwi otwierają się tylko wówczas, gdy zapali się światło). A do włączania światła można sporządzić odpowiedni włącznik. Końcowym rezultatem tego skomplikowanego ćwiczenia będzie łańcuch następujących po sobie reakcji. Obserwowanie tego wywiera niezwykłe wrażenie: wygłodniały szympans przebiega przez pomieszczenie i włącza światło; następnie podchodzi do drzwi, otwiera je i pociąga za sznurek; w tym momencie wypada błękitny krążek, szympans wrzuca go do szczeliny automatu i otrzymuje kiść winogron. Tworzenie łańcuchów zachowań wiąże się ze stosowaniem w toku uczenia się wzmocnień utrwalonych już wcześniej. Dlatego zazwyczaj łańcuch taki przyswajany jest w odwrotnej kolejności niż w opisanym przykładzie. Modelowanie zachowania. Podczas tworzenia łańcucha reakcji należy postępować wspak, gromadząc stopniowo sekwencje reakcji. Stanowi to główny element siły technik instrumentalnych, ich zdolności do modelowania zachowania przez wybiórcze wzmacnianie jego pożądanych cech, a nie wzmacnianie innych. Załóżmy, że ktoś chce nauczyć swego psa chodzenia na tylnych łapach. Zgodnie z techniką instrumentalną należy ustalić przede wszystkim zdarzenie wzmacniające, powiedzmy zjadanie przez psa niewielkiej ilości pokarmu. Następnie niezbędne będzie wprowadzenie jakiegoś sygnału różnicującego dla pokarmu. W tym celu można posłużyć się gwizdkiem, dając sygnał zawsze wtedy, gdy podawany jest pokarm. Wcześniej czy później gwizd przekształci się w SD (S ze znaczkiem D) i nabędzie wartości wtórnego wzmocnienia. Teraz gwizd SD może stanowić wzmocnienie dla następnej reakcji. (Oczywiście, aby SD było skuteczne, pies w czasie treningu musi być w miarę głodny.) Kiedy już SD ustabilizowało się, można zaczynać ćwiczenie. Początkowo wzmacniamy każdy ruch psa, choćby w niewielkim stopniu przypominał on próbę stawania na tylnych łapach. Stopniowo kryteria wydawania gwizdu zmieniają się: siedzenie na tylnych łapach; oderwanie jednej przedniej łapy od ziemi w pozycji siedzącej; a w końcu próba podniesienia się bez dotykania do ziemi obu przednimi łapami. Ważne jest, aby formowanie lub modelowanie zachowania zwierzęcia odbywało się bardzo powoli, aż zostanie osiągnięty pożądany rezultat. 486 Zwróćcie uwagę na to, że nie stosujemy żadnych kar, lecz tylko wzmocnienie. Ścisła kolejność zdarzeń wzmacniających może być różna dla różnych psów; najważniejsze jest, żeby wzmacniane były te zachowania, które stopniowo przybliżają się do zachowania pożądanego. Modelowanie zachowania dokonuje się w wyniku wybiórczego wzmacniania kolejnych przybliżeń do pożądanego zachowania. Potrzebne jest do tego niezawodne i szybko pojawiające się wzmocnienie. Pierwszy krok w modelowaniu zachowania to ustalenie jego zbieżności ze wzmocnieniem. Uczenie psa przez pozwolenie mu, żeby jadł, gdy „sprawuje się dobrze" w czasie ćwiczenia, nie przyniesie żadnych rezultatów. Gwizd jest skuteczny dlatego, że można go eksponować w tym czasie, kiedy występuje prawidłowa reakcja. Pies może zrozumieć, czego się od niego wymaga, tylko wtedy, gdy wzmocnienie pojawia się natychmiast po prawidłowej reakcji. Gwizd jest nie tylko czynnikiem wzmacniającym, ale również źródłem informacyjnego sprzężenia zwrotnego. Należy pamiętać o tym, że podtrzymywanie wzmacniającej wartości gwizdu wiąże się z podawaniem jedzenia zwierzęciu bezpośrednio po jego ekspozycji (dozwolony jest częściowy rozkład wzmacniania). Można również posługiwać się wzmocnieniem werbalnym (na przykład słowami „dobry pies"), ale pod warunkiem, że słowa te stosowane są wyłącznie jako SD dla wzmocnienia. Wypowiadane w innych sytuacjach, tracą swą skuteczność jako wzmocnienie. Podsumowanie Takie są podstawowe zjawiska związane z uczeniem się bezpośrednich zbieżności między czynnościami a wynikami. Ogólnie biorąc, pozwalają one na opisanie, jak czynności zwierzęcia lub człowieka są związane ze zdarzeniami zewnętrznymi. Jedną z najbardziej zaskakujących właściwości tego uczenia się jest ogromna wrażliwość zwierząt na bardzo subtelne związki między działaniami a wynikami tych działań. Jest to widoczne szczególnie wyraźnie wówczas, gdy zwierzę ma możność nabywania wiedzy wolno i systematycznie. Zapewne informacja, jaką wydobywa ono w trakcie uczenia się, obejmuje już całość korelacji między kontekstem bodźcowym, reakcjami oraz wynikami działań. Inaczej mówiąc, Prawo Efektu ma, jak się okazuje, zastosowanie nie tylko w sytuacji wzmocnienia jednostkowego, ale dotyczy również całego układu powiązań między zdarzeniami. Zjawiska związane z uczeniem się zbieżności mówią nam o tym, co organizm robi, ale nie wiemy jeszcze, jak on to robi. Wróćmy zatem do rozważań nad pewnymi procesami, leżącymi u podłoża zdolności organizmów do przystosowywania swoich reakcji do wymagań świata zewnętrznego. 457 WARUNKOWANIE KLASYCZNE Dotychczas zajmowaliśmy się uczeniem się instrumentalnym. Większość współczesnych badań nad uczeniem się dotyczy tego typu uczenia się. Jednak pierwszy poważny impuls do badań nad uczeniem się przyszedł z innej strony: były to prace rosyjskiego fizjologa I. P. Pawiowa, prowadzone na początku naszego stulecia. Pawłowowskie (lub klasyczne) warunkowanie różni się nieco od uczenia się, które omawialiśmy. I. P. Pawłow był fizjologiem i swoje badania (za które otrzymał Nagrodę Nobla) zaczął od interesującego go mierzenia reakcji wydzielania się śliny i soków żołądkowych u głodnego zwierzęcia. W rezultacie opracował szereg technik mierzenia ilości śliny wydzielanej przez psa. Odznaczając się przenikliwością, cechującą prawdziwego naukowca, Pawłow odkrył, że wydzielanie śliny wywołane jest nie tylko przez pokarm, ale i przez inne bodźce. Na przykład, za każdym razem, kiedy wchodził do pomieszczenia z psami, zwierzęta zaczynały wydzielać ślinę: Pawłów odkrył siłę bodźca warunkowego. W warunkowaniu klasycznym istnieją dwa rodzaje bodźców i dwa rodzaje reakcji. Pierwszy, kiedy to bodziec (bodziec bezwarunkowy) automatycznie wywołuje specyficzną reakcję (reakcja bezwarunkowa): w skrócie bodźce bezwarunkowe będziemy określać jako Bb, a reakcje bezwarunkowe jako Rb. Rb wywołana przez określony Bb ma charakter wrodzonej odruchowej czynności. Wydzielenie śliny jest Rb na Bb, jakim jest pokarm w jamie ustnej. Mruganie jest Rb na Bb, jakim jest strumień powietrza skierowany na oko. Ale już naciśnięcie dźwigni po pojawieniu się światła nie można uważać za Rb na światło jako Bb: reakcja ta nie ma charakteru wrodzonej czynności odruchowej. W warunkowaniu klasycznym, jeśli nowy nieznany bodziec, taki jak światło, dzwonek lub osoba eksperymentatora, wywołuje reakcje wydzielania śliny, to mówi się, że ślinienie zostało uwarunkowane na ten nowy bodziec: nowy bodziec warunkowy określamy jako Bw. Początkowo wydzielanie śliny było Rb, która pojawiała się tylko na smak pokarmu. Pokarm zatem był Bb. Ale teraz wystarczy sama obecność eksperymentatora, aby wywołać u psa wydzielanie śliny. Staje się on Bw, a reakcja ślinienia na jego obecność to reakcja warunkowa (Rw). A zatem pokarm to Bb, eksperymentator to Bw, a wydzielenie się śliny to albo Rb, albo Rw, w zależności od tego, który z bodźców je wywołał. Przedstawimy teraz techniki warunkowania klasycznego na klasycznym przykładzie, kiedy to pies wydziela ślinę na dźwięk dzwonka. Przed eksperymentem upewniamy się, czy bodziec bezwarunkowy i reakcja bezwarunkowa są rzeczywiście bezwarunkowe. Inaczej mówiąc, sprawdzamy, czy u psa, który nie był jeszcze w sytuacji eksperymentalnej; smak jedzenia w pysku (Bb) wywoła wydzielanie śliny (Rb), a dzwonek (Bw) jej nie wywoła. Pawłów uzyskiwał to umieszczając psa w specjalnym izolowanym pomieszczeniu, w luźnej uprzęży, która ograniczała jego ruchy, a w odpowiednim czasie specjalne urządzenie wdmuchiwało sproszkowany pokarm do pyska zwierzęcia. Teraz, tuż przed wdmuchnięciem sproszkowanego pokarmu, eksponujemy dzwonek. Dzwonek w warunkowaniu klasycznym wyprzedza o około 3 sekundy podawanie pokarmu. Po minucie powtarzamy całą procedurę. W rezultacie szeregu powtórzeń, po pewnym czasie ślina (Rb) zaczyna pojawiać się przed podaniem sproszkowanego pokarmu. W istocie, jeśli przestaniemy podawać psu Bb, a tylko będziemy eksponować dzwonek, okaże się, że już Bw wywołuje tę reakcję: za każdym razem w reakcji na dzwonek zwierzę wydziela ślinę. Na tym polega istota warunkowania klasycznego. Istnieje kilka podstawowych różnic między pawłowowskim lub klasycznym warunkowaniem a 488 warunkowaniem instrumentalnym lub sprawczym. Stosując warunkowanie klasyczne, możemy powiązać daną reakcję z bodźcem (Bw), który zazwyczaj nie wywołuje jej. Ale reakcja ta musi znajdować się uprzednio w repertuarze reakcji zwierzęcia, jest to taka reakcja, która musi być automatycznie wywołana przez Bb. A zatem Rb jest zazwyczaj prostą reakcją fizjologiczną lub odruchową. Stosując zaś warunkowanie instrumentalne, możemy wyuczyć zwierzę nieskończenie wielu nowych reakcji. Badamy warunkowanie klasyczne, aby zrozumieć, w jaki sposób zwierzę uczy się skojarzeń. Natomiast badanie warunkowania instrumentalnego pozwala nam zrozumieć, w jaki sposób zwierzę uczy się interakcji ze swoim środowiskiem. UCZENIE SIĘ POZNAWCZE Dowiedzieliśmy się już co nieco o zjawiskach uczenia się. Teraz zajmiemy się zbadaniem tego, w jaki sposób informacja reprezentowana jest w strukturze pamięci. Oczywiście, celem naszym jest opisanie schematów pojęciowych, które pojawiają się w wyniku uczenia się. Nasz punkt widzenia dotyczący uczenia się jest taki sam jak ten, który dotyczy pamięci: nowa informacja jest dołączona do już istniejących w pamięci struktur znaczeniowych. Problem, jaki staje przed uczącym się, polega na określeniu warunków, które nań wpływają, i na właściwym zarejestrowaniu tej informacji. Wzmocnienie jako sygnał W rozważaniach nad uczeniem się stwierdziliśmy, że wzmocnienie pomaga organizmowi w opanowaniu poprzedzającej je właśnie reakcji. Ale wzmocnienie jest również sygnałem wskazującym organizmowi, które warunki są pożądane, a które nie. Można więc oczekiwać, że wzmocnienie tylko wówczas będzie miało optimum właściwości sygnalizacyjnych, gdy będzie jednoznaczne; to znaczy, gdy nie pojawiają się żadne wątpliwości co do tego, jaka konkretnie czynność jest wzmacniana. Maksymalizacja sygnalizacyjnej właściwości wzmocnienia może się dokonywać przy spełnieniu co najmniej jednego z dwu warunków. Po pierwsze, wzmocnienie powinno nastąpić od razu po wykonaniu właściwej czynności, tak aby nie wiązało się z wykonaniem innych czynności i aby odpowiednia czynność tkwiła ciągle jeszcze w pamięci krótkotrwałej. Po drugie, kiedy wynik jest opóźniony, to związane z nim zdarzenie powinno zdecydowanie odróżniać się od innych, tak aby można je było łatwo odnaleźć w pamięci długotrwałej, przechowującej zdarzenia. Normalnie, chcąc wyuczyć zwierzę jakiejś czynności, musimy wzmacniać ją nie później niż po 5 sekundach od momentu pojawienia się tej czynności. Ta granica opóźnienia wzmocnienia interpretowana była bardzo różnie, ale najprostsza interpretacja jest oczywiście taka, że wynik musi pojawić się tak szybko, aby gwarantować, iż wzmacniana czynność pozostaje jeszcze w pamięci krótkotrwałej. Ta reguła 5 sekund puszcza jeden bardzo ważny wyjątek. 439 Zwierzęta wydają się zdolne do wykrywania (a tym samym unikania) szkodliwego pokarmu, chociaż choroba jako skutek spożycia takiego pokarmu ujawnia się dopiero po kilku godzinach (Garcia i Koelling, 1966). Skojarzenie między specyficznym pokarmem a symptomami chorobowymi pojawia się, jak można przypuszczać, jako skutek działania wrodzonej strategii organizmu i właściwego wykorzystania struktury pamięci długotrwałej. Najwidoczniej zwierzę automatycznie kojarzy każde uczucie mdłości z ostatnim pokarmem, który jadło, aby go w przyszłości unikać. Taka strategia wymaga, żeby pamięć o ostatnich posiłkach była wystarczająco pełna i stosunkowo łatwo dostępna (warunki te są spełnione z pewnością w przypadku człowieka, chociaż nie stara się on zapamiętać menu swoich posiłków. -Czy pamiętacie, co jedliście w czasie ostatnich dwu posiłków?). Zazwyczaj strategia unikania nowego pokarmu jest wystarczająca, aby zapobiec ponownemu wystąpieniu mdłości wywołanych pokarmem. Wrodzony charakter tej strategii potwierdza fakt, że zwierzę, u którego wywołano mdłości w jakiś nie związany z karmieniem sposób (na przykład promieniami Roentgena), odmawia jedzenia ostatniego nowego pokarmu. A nawet więcej, nie można go nauczyć unikania warunków, które są rzeczywiście silnie skorelowane z przyszłymi mdłościami, nawet wtedy, gdy warunki te są wyraźnie oznaczone przez światła, brzęczyki itp. Mdłości najwidoczniej są wskazówką wstrętu do jedzenia i niczego więcej. Wzmocnienie nie jest koniecznym warunkiem zapamiętania. Zapamiętanie pojęcia lub zdarzenia zapewne zależy od typu procesów przetwarzania w mózgu obrazu tego zdarzenia czy pojęcia w chwili, gdy zwierzę ich doświadcza. Jeżeli informacja zostanie włączona do jakiegoś schematu lub czynności, istnieje duże prawdopodobieństwo, że zostanie zapamiętana. W przeciwnym razie nie zostanie. • Czy pamiętacie, kiedy ostatni raz sprawdzaliście, która jest godzina? Pewnie nie, chyba że tę informację w jakiś szczególny sposób wykorzystaliście. • Czy pamiętacie litery, które znajdują się obok cyfry 7 na tarczy telefonicznej? (w niektórych krajach, w tym w USA, na tarczach telefonicznych umieszczone są zarówno cyfry, jak i litery - przyp. red.). Odpowiedzią jest pewnie „nie", jakkolwiek widzieliście je i posługiwaliście się nimi niezliczoną ilość razy. (Odpowiedź jest wtedy „tak", kiedy w przeszłości specjalnie się ich wyuczyliście). • Czy pamiętacie, jak byliście wczoraj ubrani? Raczej chyba tak, chociaż nie staraliście się tego zapamiętać. Akt wyboru odzieży i ubierania automatycznie zachował się w pamięci w formie schematu, ponieważ jest to jedna z pierwszych czynności codziennych, istnieje duże prawdopodobieństwo jej zapamiętania. • Przypomnijcie sobie, jak zachowuje się człowiek czy zwierzę w sytuacji przyjęcia hipotezy bezradności. Dla nich zagrożenie uderzeniem prądem to po prostu przykre informacyjne sprzężenie zwrotne, potwierdzające i podtrzymujące ich przekonanie, że uderzenie prądem jest nieuniknione. Ta forma zachowania utrzymuje się, chociaż powoduje pojawianie się kary. 490 Uczenie się i świadomość Przez wiele lat ważnym teoretycznym problemem było pytanie o to, czy możliwe jest uczenie się bez udziału świadomości. Odpowiedź na to pytanie jest bardzo trudna, o czym świadczą długie i gwałtowne spory. Ludzie, którzy twierdzą, że świadomość nie jest potrzebna, często próbują uzasadniać swe stanowisko wskazując na fakt, że w badaniach nad uczeniem się jego wynik może służyć za wzmocnienie, a nie za sygnał. Ale, jak wykażemy w następnych rozdziałach, myślenie człowieka możliwe jest bez świadomości bezpośredniej i, oczywiście, możliwe jest bez świadomości retrospektywnej. Na przykład, możemy uświadomić sobie wskazówkę zastosowaną do rozwiązania zadania albo też treść marzenia w momencie, kiedy występuje, jednak po upływie kilku minut możemy zapomnieć i jedno, i drugie. W rezultacie eksperymentator, zadając pytanie kontrolne, może wykryć absolutny brak świadomości tych zdarzeń. Przypuszczalny krótki żywot w świadomości określonych zdarzeń utrudnia eksperymentalne badanie tego problemu. Ale gdyby nawet było to możliwe, nie wydaje się słuszne przypuszczenie, że schematy pamięciowe i hipotezy mogą powstawać i być wykorzystywane podświadomie, bez udziału świadomości człowieka. Uczenie się przez eksperymentowanie System uczenia się zbieżności nastawiony wyłącznie na wykrywanie korelacji między środowiskiem, działaniami i ich wynikami ma fatalną wadę. Nie pozwala mianowicie na oddzielenie tych aspektów, które rzeczywiście spowodowały określony wynik, od tych, które korelują z nimi w sposób zupełnie przypadkowy. Gracz może sądzić, że skrzyżowanie palców pomoże mu wygrać. Spadochroniarz może wierzyć, że talizman zapewni mu bezpieczeństwo. Szympans zaś może być przekonany, że stanie na lewej nodze jest ściśle związane z pojawieniem się winogron. Zjawisko to otrzymało nazwę zachowania przesądnego. Można bardzo łatwo zademonstrować je w laboratorium. Zakłada się, że skoro już raz zbieżności danego zdarzenia zostały ustalone, to zwierzę skazane jest na powtarzanie swych czynności za każdym razem, kiedy znajdzie się w podobnych warunkach. Ten aspekt uczenia się zbieżności pozwala wyjaśnić wiele rytualnych przesądów, od tańców wywołujących deszcz do odpukiwania w niemalowane drewno. U człowieka jednak istnieją pewne mechanizmy zapobiegawcze. Nawet niemowlę nie zdaje się ślepo na wskazówki wynikające z kontekstu i nie powtarza mechanicznie reakcji skojarzonych ze schematami sensoryczno-motorycznymi, powstałymi w wyniku minionych doświadczeń. Niemowlę zmienia swoje czynności raczej umyślnie, starając się przy tym zaobserwować podobieństwa i różnice w uzyskiwanych rezultatach. Oto, jak na przykład Piaget (1952) opisuje tego typu eksperymentowanie swego 10-miesięcznego syna Laurenta: 491 „Tym razem Laurent leży na plecach, ale kontynuuje swoje wczorajsze eksperymenty. Chwyta kolejno: celuloidowego łabędzia, pudełko itp., wyciąga rękę i upuszcza przedmiot. Wyraźnie zmienia miejsce upadku przedmiotu. To trzyma rękę pionowo, to ukośnie, z tyłu lub z przodu głowy. Kiedy przedmiot spada na nowe miejsce (na przykład na poduszkę), upuszcza go jeszcze dwa, trzy razy w to samo miejsce, jakby badając stosunki przestrzenne, po czym zmienia sytuację" (s. 269). Niemowlę eksperymentuje z otaczającym je światem. W ten sposób odkrywa ono, jak jego działania wpływają na otaczające je środowisko i dzięki temu chroni się również przed przypadkowymi związkami między reakcjami a ich zewnętrznymi skutkami. Strategia taka oddziela przyczyny od czystych zbieżności (korelacji). (W pewnych wypadkach, oczywiście, zasadę tę trudno jest zastosować. Spadochroniarz nie zdecyduje się na pozostawienie swego talizmanu w domu, aby w ten sposób sprawdzić jego skuteczność. Mimo to eksperymentowanie jest decydującym czynnikiem w rozwoju intelektualnym istoty ludzkiej). Znaczenie oczekiwań Zachowanie ukierunkowane na osiągnięcie celu. Jest oczywiste, że już w najwcześniejszym wieku życia niemowlę antycypuje określone konsekwencje swych działań. Do 6 miesiąca wydaje się reagować wyłącznie na sygnały zewnętrzne: reaguje na zdarzenia, kiedy się pojawiają, ale samo ich nie wywołuje. Jeżeli dziecko widzi przedmiot, może po niego sięgnąć czy też włożyć go do ust, ale gdy ten przedmiot nagle zniknie, to niezbyt się tym przejmuje. Jednak w wieku około 6 miesięcy zaczyna przejawiać oznaki szczególnych oczekiwań w odniesieniu do interakcji ze swoim środowiskiem. Oczekiwania te ujawniają się najpierw w zachowaniu poszukiwawczym. W wieku do 6 miesięcy życia próby odnalezienia przedmiotu, który zniknął z pola widzenia, mogą wydawać się dość prymitywne: ostrożne macanie lub szukanie wzrokiem. Szybko jednak dziecko podejmuje systematyczną eksplorację możliwych kryjówek przedmiotu: pod przykryciem, za przeszkodą, w zaciśniętej dłoni ojca czy matki. W końcu dedukcje dotyczące miejsca danego przedmiotu, pochodzące z obserwacji zdarzeń zewnętrznych, stają się normalną częścią jego zachowania poszukiwawczego. Najbardziej złożone aspekty zachowania ukierunkowanego na osiągnięcie celu ujawniają się wtedy, gdy obserwujemy dziecko posługujące się własną inteligencją sensoryczno-motoryczną do rozwiązywania praktycznych problemów. Przeanalizujemy zachowanie dziecka Piageta-Laurenta: „Laurent ma 16 miesięcy i 5 dni. Siedzi przy stole. Kładę przed nim skórkę od chleba, ale w takiej odległości, aby nie mógł jej dosięgnąć. 492 Jednocześnie kładę w pobliżu jego prawej ręki kijek długości około 25 centymetrów. Początkowo Laurent stara się dosięgnąć chleba nie zwracając uwagi na kijek. Po kilku próbach zaprzestaje działań". Laurent ma problem. Znany mu sposób zdobycia przedmiotu nie prowadzi do osiągnięcia pożądanego celu. Należy próbować jakiegoś nowego sposobu. Ale jak wybrać ten nowy sposób: czy przypadkowo, czy na oślep metodą prób i błędów, czy też wychodząc od tych czynności, które wykonywał do tej pory siedząc przy stole? „Wtedy kładę kijek między nim a chlebem; nie dotyka on celu, ale zawiera się w tym jakaś niezaprzeczalna sugestia wizualna. Laurent patrzy na chleb siedząc nieruchomo, następnie spogląda na kijek i nagle chwyta go i kieruje w stronę skórki. Jednak nie może jej dosięgnąć, ponieważ złapał kijek w połowie, a nie za któryś z końców. Wtedy rzuca kijek i wyciąga rękę w stronę chleba. Po czym, bez dłuższego marudzenia, bierze kijek ponownie, tym razem za koniec (przypadkowo czy świadomie?) i przyciąga chleb do siebie. ...Dwie następne próby prowadzą do tego samego rezultatu. Po upływie godziny umieszczam przed Laurentem zabawkę (poza jego zasięgiem) i nowy kijek tuż przed nim. Nawet nie próbuje sięgnąć ręką po przedmiot, od razu łapie za kijek i przyciąga nim zabawkę" (s. 335). Laurent odkrył w jakiś sposób, że aby osiągnąć określony cel, sekwencja czynność-wynik musi zostać zmodyfikowana. Ale, jak nauczył się nowego schematu? Nigdy wcześniej nie posługiwał się kijkiem w celu uzyskania przedmiotów. Co kierowało jego wyborem czynności i czego konkretnie nauczyło go poprzednie niepowodzenie? Czy domyślił się, że jego ręka jest zbyt krótka i musi znaleźć „przedłużenie ręki"? Jak do tego doszedł? W jaki sposób kontekst zewnętrzny - na przykład obecność kijka-ułatwił mu poszukiwanie rozwiązania problemu? Nauczenie się tego, że można posłużyć się kijkiem, aby dosięgnąć przedmiotu, może wydawać się zadaniem zbyt prostym, tymczasem jest ono zaskakująco trudne. Ten poziom rozwiązywania problemu przewyższa wyjaśniające możliwości każdej z istniejących teorii uczenia się zbieżności, ponieważ występujący tu rodzaj uczenia się jest niezwykle skomplikowany, mimo pozornej prostoty. Faktycznie tu leży granica możliwości intelektualnych istot pozaludzkich: jedynie bardzo rozwinięte gatunki zwierząt - niektóre gatunki naczelnych i człowiek - potrafią rozwiązać „problem kijka". Problem na jeszcze wyższym poziomie - skonstruowanie specjalnego narzędzia służącego do określonego celu (zamiast posługiwania się tym, co jest pod ręką) może rozwiązać wyłącznie człowiek. 493 ROZWÓJ POZNAWCZY Zdolności poznawcze człowieka zmieniają się radykalnie w okresie od narodzin do wieku młodzieńczego. Na początku występuje jedynie zdolność do uczenia się związków w otaczającym świecie, następnie u dziecka zaczyna się powoli pojawiać świadomość pojęć i zdarzeń i rozwijają się proste schematy sensoryczno-motoryczne. W pierwszych latach życia rozwój intelektualny szympansów przebiega szybciej niż u dziecka w tym samym wieku. Jednak w wieku około 2 lat następują wyraźne, zaskakujące zmiany w zdolnościach poznawczych dziecka ludzkiego. Po pierwsze, pojawiają się początki internalizacji myślenia, jego myśli zaczynają w mniejszym stopniu zależeć od zdarzeń zewnętrznych. Po drugie, wtedy zaczyna się też rozwój języka, umiejętności posługiwania się symbolami, która pozwoli dziecku czynić szybkie postępy w opanowaniu wiedzy. W rozwoju zdolności poznawczych człowieka można wyróżnić kilka stadiów. Największy wkład w badania nad intelektualnym rozwojem dziecka ma uczony szwajcarski, Jean Piaget. Omawialiśmy już niektóre jego poglądy (oraz wspominaliśmy trochę o jego synku Laurencie). Przeanalizujemy teraz stadia rozwoju intelektualnego wyróżnione przez Piageta. Piaget wyróżnił poszczególne okresy, podokresy i stadia w rozwoju poznawczym dziecka. Pierwszy to okres rozwoju sensoryczno-motorycznego, trwający od momentu narodzin do 18-24 miesiąca życia. Drugi to okres myślenia przedoperacyjnego, trwający od końca okresu sensoryczno-motorycznego (około 2 lat) do 7 lat. Następnie zaczyna się okres operacji konkretnych, trwający mniej więcej do 11 roku życia. Jako ostatni występuje okres operacji formalnych (zaczyna się około 11 roku i trwa do okresu młodzieńczego), w którym wyłaniają się cechy inteligencji człowieka dorosłego. Uczenie się sensoryczno-motoryczne Omówiliśmy już podstawowe właściwości uczenia się sensoryczno-motorycznego. W ciągu tego okresu dziecko stopniowo opanowuje rozumienie przedmiotów i działań. Uczy się, że można chwytać przedmioty i manipulować nimi, że można przemieszczać się w przestrzeni i wywoływać różne zdarzenia. Dziecko nauczyło się już wyodrębniać siebie z otaczającego je świata oraz tego, że przedmioty mają określoną stałość. Nauczyło się ono co nieco o przestrzeni, czasie i kształtach, jednak brak mu jeszcze dostatecznie dobrej wewnętrznej reprezentacji świata. W końcu tego okresu wyobraźnia dopiero zaczyna się rozwijać, język zaś znajduje się w zarodku. Zasadniczo dziecko nauczyło się już organizować cechy percepcyjne świata, jednak jego procesy myślowe ciągle jeszcze są ściśle związane ze światem zewnętrznym. Jest ono ograniczone do odkrywania świata za pomocą manipulowania przedmiotami. 494 ROZWÓJ OBRAZÓW Centralne miejsce w uczeniu się zbieżności zajmuje organizacja cech percepcyjnych w wiązki, oparte na ich skojarzeniach z ciągami działań. Dziecko zaś musi utworzyć wewnętrzny obraz zdarzeń zewnętrznych. Zdolność do organizowania informacji percepcyjnej na zasadzie jej zbieżności z reakcjami organizmu jest prawdopodobnie wrodzona. Rozwój obrazów wewnętrznych, oparty na tej zdolności, odgrywa decydującą rolę w rozwoju poznawczym dziecka. Przypuszczalnie, pierwsze pojęcia rozwijające się w mózgu niemowlęcia dotyczą przedmiotów z jego doświadczenia. Początkowo jednak pojęcia te mogą mieć znaczenie jedynie w odniesieniu do jego własnych czynności (to znaczy wyłącznie znaczenie motoryczne). W rzeczywistości, początkowo dziecko może nawet nie rozumieć tego, że przedmioty zewnętrzne istnieją niezależnie od jego czynności. Piaget sugerował, że w pierwszych rozwijających się u dziecka schematach sensoryczno-motorycznych nie odróżnia ono cech percepcyjnych od samych czynności. Rysunek 13-4 przedstawia możliwy schemat sensoryczno-motoryczny: zdarzenie - ruch ręki - wywołuje przyjemny dźwięk, 495 ale nie pojawiło się jeszcze oddzielnie pojęcie dotyczące potrzebnego do tego przedmiotu. [Węzeł centralny – RUCH RĘKI + jest Niebieski + jest Długi + jest Błyszczący + rezultat – to Przyjemny dźwięk] Stopniowo, w miarę jak dziecko manipuluje otaczającymi je przedmiotami, komponenty sensoryczne oddzielają się od czynności- i zaczynają osiągać samodzielną egzystencję. Jest to pierwszy decydujący krok w nabywaniu wiedzy przez dziecko. Jak tylko właściwy zbiór cech połączy się w oddzielny niezależny obraz, system pamięci może rozpoznać dany przedmiot, gdy już się pojawi, operując wewnętrzną wiązką informacji-węzłem pamięci-jako jednostką (rys. 13-5). [Schemat przedstawia proces poznawania wzbogacony o świadome chwytanie i ssanie przedmiotu] Ten sam mechanizm działa dalej w miarę rozwoju dziecka, ale problemy związane z organizacją informacji percepcyjnej w sytuacji uczenia się ulegają zmianie. Kiedy powstanie już określony repertuar obrazów, nowe przedmioty muszą zostać włączone w istniejące struktury pojęciowe za pomocą procesów uogólniania i różnicowania, ponieważ wiele rzeczy z otoczenia niemowlęcia wykazuje zarówno podobieństwa, jak i różnice w porównaniu z rzeczami, które ono już zna. Myślenie przedoperacyjne W okresie od około 2 do 7 lat dziecko zaczyna się posługiwać wewnętrzną reprezentacją otaczającego je świata. Jest to pierwszy krok w kierunku myślenia ludzi dorosłych: wykonanie eksperymentu myślowego. Potrafi ono po raz pierwszy przewidzieć bieg zdarzeń, nie wykonując równocześnie rzeczywistych czynności. Uczy się również odpowiadać na pytania: Co będzie, jeśli...? 496 Początkowo jednak dziecko ma ograniczoną zdolność do interioryzacji zdarzeń. Ogranicza się przede wszystkim do konkretnych czynności: nie potrafi tworzyć abstrakcji czy uogólnień. Ponadto wyobrażanie sobie ciągu czynności, kiedy już się pojawiło, przebiega systematycznie, krok po kroku, z niewielką elastycznością lub też zupełnym jej brakiem. Niektóre z widocznych osobliwości dotyczących zachowania dziecka w zakresie tworzenia abstrakcji i uogólnień możemy zauważyć obserwując jego zachowanie klasyfikujące. Przypuśćmy, że pokazujemy dziecku serię obrazków przedstawiających różne przedmioty, różniące się między sobą określonymi cechami, a następnie prosimy je, aby ułożyło podobne obrazki na jedną kupkę. Osoba dorosła, mając do rozwiązania takie zadanie, zazwyczaj wybiera jakąś cechę fizyczną albo też określoną kombinację cech, a następnie sortuje systematycznie przedmioty zgodnie z przyjętymi kryteriami. Dziecko jednak (w stadium myślenia przedoperacyjnego) zachowuje się zupełnie inaczej. Podobieństwa lub różnice cech fizycznych interesują je dopiero wówczas, kiedy nie ma innego wyboru. W postępowaniu ze znanymi mu przedmiotami dziecko przejawia tendencję do grupowania ich zgodnie ze związkiem, w jaki łączy je wspólna sytuacja zewnętrzna. Obrazki: pieca, lodówki, talerza z kaszką i lalki (oznaczającej mamę) znajdą się na jednej kupce; możliwe jest również tworzenie kupki obrazków związanych z podwórkiem czy gospodarstwem wiejskim. Poza tym, w odróżnieniu od dorosłych, dziecko nie martwi się o to, czy między różnymi przedmiotami ułożonymi na jednej kupce istnieją wyraźne podobieństwa. Pod pewnym względem dorosły, który znajdzie się w sytuacji eksperymentalnej dotyczącej kształtowania się pojęć, zachowuje się dokładnie tak jak dziecko. Jeśli poprosimy studenta, aby podzielił i ułożył obrazki na dwie kupki według dowolnie przyjętej reguły, to jego strategia polega na wybraniu jednej cechy i posługiwaniu się nią jako podstawą dokonywanego podziału. Tak więc może on układać obrazki z czerwoną obwódką na jedną kupkę, a z niebieską-na drugą. Jeżeli pojawi się obrazek, który nie odpowiada danemu kryterium, to wybiera i wypróbowuje nową regułę. W sytuacji, kiedy badany ma wykonać zadanie bardziej złożone, może on zapomnieć, jakie reguły zostały już sprawdzone, i zaczyna się powtarzać. Podobnie jak dziecko, dorośli uważają reguły klasyfikowania wymagające uwzględnienia równocześnie kilku cech przy selekcji za znacznie trudniejsze, niż oparte tylko na jednej cesze. Jeżeli cechy muszą występować łącznie, to prosta koniunkcja cech wydaje się najłatwiejsza (aby należeć do danej klasy, przedmiot powinien posiadać wszystkie cechy tej klasy, na przykład musi być równocześnie czerwony i duży). Dysjunkcja jest znacznie trudniejsza (przedmiot powinien posiadać tylko jedną cechę: na przykład musi być albo czerwony, albo duży). Najtrudniej nauczyć się pojęć, które opierają się na zależnościach między cechami (na przykład, jeżeli przedmiot jest czerwony, to musi on być duży, a skoro jest niebieski, to musi być mały). W sumie jednak pewne cechy klasyfikującego zachowania się dziecka różnią się wyraźnie od odpowiednich cech w zachowaniu dorosłych. Najważniejsze w tym, jak się okazuje, jest to, że mechanizmy indukcyjne dziecka operują zazwyczaj tylko ograniczonym zakresem dostępnej informacji. Dziecko stara się skoncentrować uwagę na dominujących cechach danego zdarzenia. 497 A nawet więcej, zadowala się ono istniejącą w danym momencie zgodnością w doborze przykładów, bez konieczności odnoszenia się do pełnego zasobu dostępnej informacji. Dziecko może zgrupować rakietkę i piłeczkę (ponieważ gra nimi), następnie piłeczkę z pomidorem (okrągłe), a w końcu pomidor z różą (czerwone). Dorosły tak nie postępuje. Dorośli starają się raczej odnaleźć jedną regułę, która znajdzie zastosowanie w odniesieniu do wszystkich przedmiotów. Dziecko w stadium przedoperacyjnym jest egocentryczne, jego wewnętrzne przedstawienia myślowe koncentrują się wokół samego siebie. Inaczej mówiąc, najwyraźniej nie potrafi ono przyjąć czy też choćby zrozumieć perspektywy innej osoby. Mówiliśmy już o tym, jaki to może mieć wpływ na zachowanie językowe (rozdział 12), ale wiąże się również ściśle ze zdolnością do uczenia się dziecka przez komunikowanie się z innymi ludźmi albo poprzez myślowe przedstawienie danej sytuacji z innej perspektywy niż własna. Ponadto, oprócz tych wszystkich ograniczeń (albo też jako ich nieunikniony wynik) proces myślenia dziecka jest nieodwracalny. Chociaż dziecko może sobie wyobrazić wynik pewnego ciągu operacji, to nie jest w stanie powrócić do stanu wyjściowego. Wygląda to tak, jakby wyobrażenie sobie zdarzenia miało właściwość realnego zaistnienia konkretnego zdarzenia: co się stało, to się nie odstanie. Najbardziej znanym przykładem nieodwracalności myślenia dziecięcego jest problem szklanki wody przedstawiony przez Piageta. Weźmy dwie szklanki, jedną wysoką i wąską, drugą szeroką i niską. Napełnijmy wodą niską, szeroką szklankę. Następnie na oczach obserwującego nas dziecka przelejemy wodę do wąskiej szklanki. Oczywiście, poziom wody będzie tu znacznie wyższy niż poprzednio. Teraz zapytajmy dziecko, czy w drugiej szklance jest tyle samo wody, ile było w pierwszej. Dziecko w stadium przedoperacyjnym odpowie nam: nie, w wąskiej szklance nie jest tyle samo wody. Niektóre dzieci mówią, że wody jest teraz więcej (jest wyższy poziom), inne zaś, że mniej (mniejsza szerokość), jednak bez względu na to, na jakich operacjach się koncentrują, nie można ich przekonać, że ilość wody nie uległa zmianie. Dziecko nie opanowało jeszcze pojęcia zachowania masy. Operacje konkretne Około 7 roku życia dziecko wchodzi w stadium operacji konkretnych. Teraz już pojęcie zachowania masy nie sprawia mu kłopotu i dziecko szybko rozwiązuje próbę ze szklanką wody. Nauczyło się prawa zachowania masy, jak też i tego, że jeden wymiar (szerokość) może być kompensowany przez inny (wysokość). Myślenie dziecka jest jeszcze ciągle ograniczone konkretnymi sądami o przedmiotach, ale dysponuje ono bogatym arsenałem metod myślenia: opanowuje zasady manipulacji, liczby i przestrzeni oraz prostego uogólnienia i prostej abstrakcji. Mimo to w tym stadium myślenie dziecka pozostaje związane z konkretnymi przedmiotami i zdarzeniami, jego uwaga zaś koncentruje się przede wszystkim na przedmiotach realnych, brak mu prawdziwego pojęcia abstrakcji. Rozwój w stadium operacji konkretnych można obserwować dając dziecku dwie identyczne wielkością i ciężarem kulki plasteliny. 498 Jedną z kulek należy rozwałkować na długi wałeczek. Przed 7 rokiem życia (przed operacjami konkretnymi) dziecko sądzi, że masa, ciężar i objętość wałeczka zmieniły się. W 7-8 roku życia sądzi ono, że masa wałeczka nie uległa zmianie, ale zmieniły się objętość i ciężar. Około 9 roku życia rozpoznaje ono, że masa i ciężar nie uległy zmianie, ale sądzi, że objętość jest inna. I dopiero po upływie 11-12 lat stabilizują się wszystkie trzy pojęcia. Operacje formalne W końcu, poczynając od około 11 roku życia dziecko wkracza w ostatnie stadium na drodze do pełnego opanowania całego bogactwa logicznego myślenia. We wczesnych latach dorastania doskonalą się jego możliwości językowe, pojawiają się operacje logiczne, opanowuje umiejętność posługiwania się rozumowaniem logicznym i wyciągania wniosków i zaczyna przejawiać rozumowanie abstrakcyjne, hipotetyczne. Tabela 13-1. Okresy rozwoju umysłowego dziecka (według J. Piageta) Tabela zawiera wiek dziecka w przybliżeniu (lata) i opis poszczególnych etapów rozwoju w danym wieku. 0-2 - Rozwój sensoryczno-motoryczny Rozwój schematów sensoryczno-motorycznych. Uczy się stałości przedmiotów i czynności. Ogranicza się jedynie do operacji dotyczących świata otaczającego. 2-7 - Myślenie przedoperacyjne Początki rozwoju języka. Uczy się aktywizowania schematów sensoryczno-motorycznych w myśli, bez wykonywania odpowiednich czynności - możliwe są eksperymenty myślowe. Ogranicza się do konkretnych czynności związanych ze zdarzeniami, które wystąpiły w danej chwili. Operacje są egocentryczne, nieodwracalne. 7-11 - Operacje konkretne Pojawia się zdolność do rozumowania logicznego. Może posługiwać się konkretnymi pojęciami. Ciągle jeszcze egocentryczne (choć w mniejszym stopniu), ciągle ograniczone do możliwych realnych zdarzeń. Rozwijają się pojęcia stałości, odwracalności i kompensacji. 11-15 - Operacje formalne Rozwój implikacji, abstrakcji, sądów logicznych, jest zdolne do myślowego sprawdzania hipotez. MYŚLENIE Wstępnym warunkiem zdolności do myślenia jest tworzenie wewnętrznych reprezentacji zdarzeń zewnętrznych. Procesy związane z organizacją i strukturalizacją informacji percepcyjnej w postaci schematów sensoryczno-motorycznych stanowią nieocenioną pomoc 499 dla procesów umysłowych wyższego rzędu. Kiedy pojawiają się wewnętrzne struktury, procesy myślowe uniezależniają się od środowiska. Przy wewnętrznej reprezentacji świata nie jest już konieczne wykonywanie czynności wyłącznie po to, aby określić jej wyniki. Cały ciąg zdarzeń może być antycypowany dzięki symulacji umysłowej: symulacja umysłowa jest istotą myślenia. Rozważmy, jakie korzyści daje możność posługiwania się reprezentacją wewnętrzną. Człowiek myślący może zacząć od jakiegoś pożądanego dlań celu i, posuwając się wstecz w obrębie swoich struktur wewnętrznych, mieć nadzieję, że odkryje w ten sposób możliwe czynności prowadzące do celu oraz warunki wymagane do jego osiągnięcia. Wewnętrzne schematy sensoryczno-motoryczne mogą pełnić rolę selektywnego filtra dla uwagi i spostrzegania: podpowiadają człowiekowi, czego szukać, kierują jego badaniem dostępnych cech środowiska oraz wykrywaniem cech brakujących. Warunki brakujące można rozpatrywać jako podcele prowadzące do poszukiwania metody wykrywania schematów sensoryczno-motorycznych, które byłyby odpowiednie dla ich osiągnięcia. Oczekiwania mogą tu odgrywać główną rolę nawet wtedy, gdy zdarzają się pomyłki. Mogą one pomóc w wyodrębnianiu krytycznej informacji, niezbędnej do inteligentnego wyboru nowych czynności w wypadku, kiedy stare nie doprowadziły do pożądanego wyniku. Czy organizmy niższe mają zdolność planowania? Nie wiemy tego dokładnie. Zapewne są zdolne do tworzenia względnie złożonych łańcuchów czynności, jednak trudno stwierdzić, w jakim stopniu ich aktualne reakcje są uzależnione od antycypacji przyszłych zdarzeń. W ciągu pierwszych dwu lat życia dziecko rozwija inteligencję sensoryczno-motoryczną, przejawiając wówczas jedynie początki rzeczywistej planowej działalności. W znacznej większości zwierzęta i dzieci w wieku poniżej 2 lat wydają się polegać na próbnym działaniu po to, aby zaobserwować, co z tego wyniknie, nie potrafią zaś wypracować określonej strategii osiągania odległego celu, poczynając od samego wyobrażenia celu. Myślenie wymaga zdolności do umysłowego symulowania całego scenariusza danej sytuacji, stawiania hipotez dotyczących nowych możliwości oraz manipulowania nimi za pomocą symboli. Te same podstawowe zdolności niezbędne dla rozwoju i symbolicznego przekształcania schematów sensoryczno-motorycznych są ważne na wszystkich poziomach myślenia. Badając zachowanie dorosłych związane z rozwiązywaniem problemów (rozdział 14) i podejmowaniem decyzji (rozdziały 15 i 16), przekonamy się, że rozwiązywanie sytuacji problemowych obejmuje szeregi realnych i umysłowych działań i ich skutków oraz różne punkty wyboru, pojawiające się w toku rozwiązywania problemu. 14. Rozwiązywanie problemów ANATOMIA PROBLEMU Protokoły Protokół rozwiązywania problemu DONALD plus GERALD Analiza Graf rozwiązywania problemu Stany wiedzy Graf zadania DONALD plus GERALD Cofanie się STRATEGIE ROZWIĄZYWANIA PROBLEMÓW Poszukiwanie rozwiązań Wybór operatorów Heurystyki Gra w szachy Ograniczenia metody analizy protokołów STANY WEWNĘTRZNE A STANY ZANOTOWANE W PROTOKOLE MECHANIZMY MYŚLENIA Reguły a fakty Podprogramy Pamięć krótkotrwała Liczenie w pamięci 501 Co właściwie trzeba zrobić, aby rozwiązać problem? W rozdziale tym zbadamy strategie i procedury stosowane przez ludzi. Problemy mogą należeć do dwu szerokich klas: problemy dobrze określone oraz problemy źle określone. W dobrze określonym problemie mamy jasno sformułowany cel. A zatem: * Jak najlepiej dojechać na drugi koniec miasta, jeżeli wszystkie główne ulice są zamknięte dla ruchu w związku z odbywającym się festynem? * Jakie jest rozwiązanie problemu szachowego, zamieszczonego we wczorajszej gazecie; białe zaczynają i dają mata w pięciu ruchach? * Co robiłeś 16 miesięcy temu? Problemy te mają dobrze określone atrybuty: określony cel, określony sposób pozwalający ocenić, czy proces rozwiązywania problemu zmierza w prawidłowym kierunku. Jednakże częściej mamy do czynienia ze źle określonymi problemami. * Wyreżyserować najbardziej znaczący film stulecia. * Zrobić coś ważnego w życiu. * Stworzyć dzieło sztuki o nieprzemijającej wartości. Mamy pełne podstawy, aby skoncentrować nasze badania na problemach dobrze określonych. Naszym celem jest zrozumienie procesów zachodzących u człowieka, gdy zajmuje się on rozwiązywaniem określonego problemu. Chcielibyśmy zrozumieć, jak tworzy swój wewnętrzny model problemu, jakie wybiera strategie, jakie stosuje reguły. Chcemy dowiedzieć się, jak ocenia swoje postępy, kiedy zbliża się do rozwiązania. Rezultaty tych badań powinny znaleźć zastosowanie w odniesieniu do wszystkich zachowań związanych z rozwiązywaniem problemu źle lub dobrze określonego. Formułowaliśmy już wcześniej niektóre podstawowe zasady zachowania dotyczącego rozwiązywania problemów. W rozważaniach nad inteligencją sensoryczno-motoryczną omawialiśmy takie pojęcia, jak: zachowanie poszukiwawcze oparte na oczekiwaniu celu, prześledzenie całego łańcucha schematów sensoryczno-motorycznych w celu wykrycia końcowego efektu jakiegoś ciągu czynności, rozpoczęcie od tego celu końcowego i posuwanie się w myśli wstecz jako metoda zbudowania planu pozwalającego na osiągnięcie tego celu. Badaliśmy, w jakim stopniu strategie te stosowane są do rozwiązania praktycznych problemów środowiska. Teraz wykażemy, że te same procedury pojawiają się w badaniu tego, jak ludzie rozwiązują abstrakcyjne problemy pojęciowe. ANATOMIA PROBLEMU Być może, najlepszy sposób, od którego należy zacząć, to analiza jakiegoś problemu. Ułatwi bowiem nasz wywód, jeśli będziecie mieli jakiś pogląd na kolejne kroki i operacje, które będziemy omawiać. Spróbujcie rozwiązać problem przedstawiony poniżej. Zajmowanie się tym problemem pozwoli Wam zorientować się, jaką można tu przyjąć taktykę oraz, 502 jakie podjąć decyzje nawet wówczas, gdy nie uda się Wam go rozwiązać. Myślcie na głos w toku Waszej pracy, wypowiadajcie wszystkie myśli, które przyjdą Wam do głowy w trakcie rozwiązywania. Poświęćcie temu problemowi chociaż 5 minut, nawet jeśli wyda się Wam, że nie czynicie postępów. Pamiętajcie, najważniejszą rzeczą w dokonywanej tu analizie jest odkrycie, jakie rodzaje operacji umysłowych wykonują ludzie w trakcie rozwiązywania problemu. W rzeczywistości nie jest istotne, czy rozwiążecie ten problem, czy też nie. DONALD plus GERALD równa się ROBERT D równa się 5 [Każde z tych trzech słów zakładając, że są to sześciocyfrowe liczby można zapisać w następujący sposób: ( x to znak mnożenia) DONALD równa się D plus 10 x L plus 100 x A plus 1000 x N plus 10000 x O plus 100000 x D GERALD równa się D plus 10 x L plus 100 x A plus 1000 x R plus 10000 x E plus 100000 x G ROBERT równa się T plus 10 x R plus 100 x E plus 1000 x B plus 10000 x O plus 100000 x R Inaczej np. słowo GERALD jest zaszyfrowaną liczbą sześciocyfrową, w której na miejscu jedności jest cyfra ukryta pod literą D (wiemy już, że to 5), na miejscu dziesiątek cyfra zastąpiona literą L, na miejscu setek jest cyfra zastąpiona literą A, itd. We wszystkich trzech wyrazach te same litery oznaczają tę samą cyfrę, każda z 10 liter zastępuje tylko jedną z 10 cyfr.] Jest to problem typu szyfru arytmetycznego. W wyrażeniu tym wykorzystano dziesięć liter, z których każda odpowiada określonej cyfrze. Zadanie polega na tym, aby dla każdej litery odnaleźć odpowiadającą jej cyfrę, tak aby po zastąpieniu liter cyframi działanie arytmetyczne dało prawidłowy wynik. Prosimy o mówienie wszystkiego, o czym myślicie próbując rozwiązać ten problem. Jeżeli będziecie mieli ochotę coś zapisać, notujcie to, co uznacie za stosowne. Protokoły Pierwszym krokiem w badaniu jakiegoś zjawiska jest obserwacja związanego z nim zachowania. Oczywistą trudność w badaniu rozwiązywania problemów przez człowieka sprawia fakt, że wiele z tego, co robi, nie da się obserwować bezpośrednio. Ludzie wykonują własne operacje myślowe po cichu, dla siebie. Jeden ze sposobów przezwyciężenia tej trudności polega na skłonieniu człowieka do ujawnienia tych procesów, prosząc go na przykład, aby opisywał na głos to, co robi, kiedy usiłuje rozwiązać problem. W rezultacie otrzymujemy dosłowny zapis jego zwerbalizowanych procesów myślowych, protokół werbalny. Oczywiście, mimo trudności w interpretowaniu tych protokołów, dostarczają one niezmiernie użytecznej informacji wstępnej o procesach myślenia zachodzących w trakcie rozwiązywania problemu. Przeanalizujemy małą część protokołu werbalnego jednej z osób badanych, która próbowała rozwiązać problem DONALD plus GERALD. Badany był studentem Carnegie-Mellon University, otrzymał podobną instrukcję jak Wy, miał on za zadanie głośno myśleć w trakcie poszukiwania rozwiązania. Pełny zapis protokołu werbalnego osoby badanej zawiera około 2200 słów wypowiedzianych w ciągu 20 minut rozwiązywania problemu. Badany ten po raz pierwszy próbował rozwiązać problem tego typu. Problem ten, jego analiza i wszelkie cytaty pochodzą z pracy Newella (1967). 503 Protokół rozwiązywania problemu DONALD plus GERALD Każda litera ma jedną i tylko jedną wartość numeryczną? (Pytanie to skierowano do eksperymentatora, na które on odpowiedział „Jedną wartość numeryczną"). Mamy tu dziesięć różnych liter i każda z nich ma jedną wartość numeryczną. Więc są dwie litery D i każdej z nich odpowiada 5; zatem T wynosi zero. Tak więc myślę, że można to tu wpisać. Wpisuję 5 i 5, to razem zero. Zobaczmy, czy nie ma gdzieś jeszcze T. Nie, nie ma. Za to jest jeszcze jedno D. To znaczy, że mogę wpisać 5 z drugiego końca. Dalej, mam dwa A i dwa L,- każda para w jednej kolumnie - aha - i R- trzy R. Dwa L równe są jednemu R. Oczywiście, przenoszę 1 do drugiej kolumny, wynika stąd, że R powinno być liczbą nieparzystą, ponieważ są dwa L-a suma dwu jednakowych liczb daje zawsze liczbę parzystą, a 1 to liczba nieparzysta. A zatem R może być równe 1 lub 3, nie 5, 7 lub 9. (Tu nastąpiła dłuższa przerwa i eksperymentator zapytał „O czym teraz myślisz?) Teraz G- ponieważ R to liczba nieparzysta, a D równa się 5, to G powinno być liczbą parzystą. Patrzę na lewą stronę zadania, tam, gdzie sumuje się D plus G. Och, nie, możliwe, że trzeba tu jeszcze dodać 1, jeżeli musiałbym przenieść 1 z poprzedniej kolumny, gdzie dodawane są E plus O. Myślę, że zostawię to na chwilę. Możliwe, że najlepszy sposób rozwiązania tego problemu to wypróbowanie różnych możliwych rozwiązań. Nie jestem jednak pewien, czy jest to najłatwiejsza droga, czy nie. Analiza. Tekst ten będzie dla nas materiałem do analizy. Jakie prawidłowości możemy w nim dostrzec? Pierwsze wrażenie z protokołu jest takie, że badany nie podchodzi do problemu prosto i bezpośrednio. Raczej gromadzi on informacje i sprawdza rozliczne hipotezy, ustalając, do czego one prowadzą. Często zapuszcza się w ślepy zaułek i wycofując się próbuje nowej drogi. Spójrzcie na protokół. Badany startuje energicznie, od razu odkrywając, że T jest równe 0. (Zamiast zero wstawiamy znak 0, aby nie było pomyłek z literą O). Więc są dwie litery D i każdej z nich odpowiada 5; zatem T wynosi zero. Tak więc, myślę, że można to tu wpisać. Wpisuję: 5 i 5, to razem zero. 504 Następnie patrzy, gdzie da się zastosować w zadaniu wiedze o tym, że T równa się 0, a D jest równe 5. Stara się znaleźć T. Zobaczymy, czy nie ma gdzieś jeszcze T? Nie, nie ma. To się nie udało, a co z D? Za to jest jeszcze jedno D. To znaczy, że mogę wpisać 5 z drugiego końca. Odnotowawszy już ten fakt, badany odnajduje nowy obiecujący punkt wyjścia ze względu na możliwość rozwiązania problemu. Dalej mam dwa A i dwa L-każda para w jednej kolumnie i R- trzy R. Dwa L równe są jednemu R. Oczywiście, przenoszę 1 do drugiej kolumny, wynika stąd, że R powinno być liczbą nieparzystą... Chociaż doszedł już do wniosku, że R jest liczbą nieparzystą, ponownie wraca do tej sprawy, jakby sprawdzając swój wywód: ... ponieważ są dwa L - a suma dwu jednakowych liczb daje zawsze liczbę parzystą, a 1 to liczba nieparzysta. Ale tym razem posuwa się w analizie nieco dalej i konkretyzuje listę możliwych liczb: A zatem R może być równe 1 lub 3, nie 5, 7 lub 9. Po dłuższej przerwie badany jednak rezygnuje z tej drogi, przyczyna jest oczywista: nie ma sposobu na wybranie spośród wielu kandydatów odpowiedniej wartości dla R. Ponownie powraca do myśli, że R jest liczbą nieparzystą i czy daje to jakieś informacje o G. Teraz G - ponieważ R to liczba nieparzysta, a D równa się 5, to G powinno być liczbą parzystą. Ta krótka analiza pierwszych pięciu minut protokołu wystarcza, aby ukazać pewne ogólne schematy w zachowaniu badanego w czasie rozwiązywania problemu. Zna on ogólny cel, który stara się osiągnąć. Pierwsza rzecz, jaką robi, to rozbicie tego końcowego celu na pewną liczbę małych kroków. Następnie przystępuje do sukcesywnego sprawdzenia różnych prostych strategii, mając nadzieję, że każda z nich dostarczy mu określonej informacji. Jedne strategie przynoszą efekty i liczba danych ciągle wzrasta. Inne strategie wyraźnie nie funkcjonują: w takim wypadku badany rezygnuje z nich i próbuje innych sposobów. Opis ten można również odnieść do szerokiego wachlarza problemów i zadań poznawczych. Podobne ogólne zasady odnajdujemy w sensoryczno-motorycznym rozwiązywaniu problemów praktycznych. Ale w przedstawionym opisie jest na razie wiele niejasności, wiele pytań bez odpowiedzi. Co się kryje za procesem rozbijania na kolejne proste kroki w toku osiągania końcowego celu? Skąd osoba badana wie, 505 jakiego typu strategie mogą być przydatne w rozwiązywaniu danego problemu? Skąd wie, jaką konkretną strategię najlepiej zastosować w danej chwili? Skąd wie, czy zastosowana w danym momencie strategia pozwoli na osiągnięcie celu, czy też zaprowadzi go w ślepą uliczkę? Aby móc odpowiedzieć na te pytania, potrzebna jest procedura doskonalsza od analizy protokołu. Graf rozwiązywania problemu Protokoły werbalne są dosyć niewygodne do analizy. W celu dokładniejszego zbadania procesu rozwiązywania problemu, potrzebna jest metoda pozwalająca na przedstawienie zachodzących tu zdarzeń. Użyteczną techniką jest zastosowanie obrazu wzrokowego sekwencji operacji wykonywanych w czasie rozwiązywania problemu. Jedną z technik przydatną do tego celu jest graf rozwiązywania problemu, metoda rozwinięta przez Allena Newella z Carnegie-Mellon University (patrz Simon i Newell, 1971). Stany wiedzy. Na podstawie analizy protokołu stwierdziliśmy, że badany stopniowo gromadzi informację o problemie, stosując odpowiednie reguły lub strategie. Operuje swą wyjściową wiedzą dodając do niej stwierdzenia dotyczące problemu. Cała informacja o problemie, jaką badany dysponuje w danym momencie, nazywa się stanem jego wiedzy. Za każdym razem, kiedy zastosuje on określoną operację do określonego nowego faktu, zmienia się stan jego wiedzy. Opis jego zachowania w trakcie rozwiązywania problemu powinien uwzględniać to stopniowe przechodzenie od jednego do drugiego stanu wiedzy. Na naszym diagramie stan wiedzy przedstawimy graficznie w postaci kwadratu, a operację związaną z przechodzeniem z jednego stanu wiedzy do drugiego w postaci strzałki (rys. 14-1).[Rysunek przedstawia dwa kwadraty (oznaczone 1 i 2) połączone strzałką operacja] Teraz protokół możemy przedstawić jako zbiór kwadratów, połączonych strzałkami opisującymi drogę, jaką musi przejść osoba badana poprzez kolejne stany wiedzy. Aby to zilustrować, powróćmy znów do protokołu zadania DONALD plus GERALD. Graf zadania DONALD plus GERALD. Początkowe wypowiedzi osoby badanej dotyczą po prostu weryfikacji, czy rozumie reguły zadania. Sama dedukcja zaczyna się dopiero od stwierdzenia: Są dwie litery D i każdej z nich odpowiada 5; zatem T wynosi zero. 506 Badany w sposób oczywisty przetwarza informację zawartą w tej kolumnie, w której występuje D plus D równa się T. Nazwijmy tę operację przetwarzaniem kolumny 1 (Ponumerujcie sześć kolumn zadania, licząc od prawej do lewej. Operacja ta posuwa badanego od początkowego stanu wiedzy (kiedy wie, że D równa się 5) do nowego stanu, stanu 2, kiedy wie również, że T równa się 0. (Zamiast zera wstawiamy znak 0, aby nie było pomyłek z literą O.) Czy osoba badana wie również o tym, że należy dokonać przeniesienia do następnej kolumny 2? Do tego momentu nie ma o tym wzmianki w protokole. Wybiegając jednak nieco w przód, czytamy: Oczywiście, przenoszę 1, a zatem badany wie o tym. Jak do tej chwili, nasz graf ma dwa stany wiedzy, co przedstawia rysunek 14-2. Grafy w wersji elektronicznej zostały opisane następująco: wpisy znajdujące się na rysunkach w kwadratach ujęte są w nawiasy kwadratowe, przed nawiasami widnieje numer opisywanego kwadratu, opisy poza nawiasami to operacje związane z przechodzeniem z jednego stanu wiedzy do drugiego. Rysunek 14-2. 1[DONAL5 plus GERAL5 równa się ROBERT] przetwarzanie pierwszej kolumny 2[DONAL5 plus GERAL5 równa się ROBER0] Kilka następnych twierdzeń z protokołu koncentruje się na zapisie danych, które do tego momentu osoba badana zebrała. Następnie mamy próbę znalezienia innych kolumn, w których znajduje się T lub D. Pierwsza operacja poszukiwania nowej kolumny z (T) nie przynosi sukcesu, druga kończy się powodzeniem, znajduje kolumnę zawierającą D. Graf rozwiązywania problemu posunął się nieco jak na rysunku 14-3 (na rysunku stare stany wiedzy są niezacieniowane, zaś ostatni, dodany diagram został zacieniowany). RYSUNEK 14-3. 1[DONAL5 plus GERAL5 równa się ROBERT] przetwarzanie pierwszej kolumny 2[DONAL5 plus GERAL5 równa się ROBER0] przejście do nowej kolumny 3[5ONAL5 plus GERAL5 równa się ROBER0] Teraz osoba badana decyduje się znów na to, aby sprawdzać nowe kolumny, próbując najpierw z kolumną 3, a potem z 2. Dalej mam dwa A i dwa L- każda para w jednej kolumnie-i R- trzy R. Prowadzi ją to do tego punktu rozważań, gdzie warto zacząć przetwarzać kolumnę 2. W efekcie przechodzi od stanu wiedzy 4 do stanu 5, gdzie konkluduje, że R jest liczbą nieparzystą. Postęp ten został pokazany na rysunku 14-4. RYSUNEK 14-4 1[D równa się 5] przetwarzanie pierwszej kolumny 2[T równa się 0] przejście do nowej kolumny 3[5ONAL5 plus GERAL5 równa się ROBER0] przejście do kolumny R 4[L plus L równa się R] przetwarzanie drugiej kolumny 5[R jest liczbą nieparzystą] 507 Cofanie się. Teraz osoba badana cofa się do stanu uprzednio osiągniętego. Zwróćcie uwagę na ciąg czynności. Początkowo, przy stanie 5, mówi: Dwa L równe są jednemu R. Oczywiście, przenoszę 1 do drugiej kolumny, wynika stąd, że R powinno być liczbą nieparzystą... Ale teraz decyduje się na ustalenie wartości liczbowej litery R, w tym celu wraca do stanu 4 i wypróbowuje nowe podejście. ... ponieważ są dwa L - a suma dwu jednakowych liczb daje zawsze liczbę parzystą, a 1 to liczba nieparzysta. A zatem R może być równe 1 lub 3, nie 5, 7 lub 9. Na grafie (rys. 14-5) ten ruch cofania się przedstawiony jest w ten sposób, że strzałka do następnego stanu 6 przechodzi od stanu 4. Stan 6 - to po prostu ten sam stan co stan 4, tylko w późniejszym czasie. W stanie 7 badany ponownie powraca do faktu, że R jest liczbą nieparzystą, a w stanie 8 metodycznie sprawdza wszystkie liczby nieparzyste. RYSUNEK 14-5. 1[D równa się 5] przetwarzanie pierwszej kolumny 2[T równa się 0] przejście do nowej kolumny 3[5ONAL5 plus GERAL5 równa się ROBER0] przejście do kolumny R 4[L plus L równa się R] przetwarzanie drugiej kolumny 5[R jest liczbą nieparzystą] z kwadratu 4 strzałka do 6[L plus L równa się R] przetwarzanie drugiej kolumny 7[R jest liczbą nieparzystą] znaleźć i sprawdzić 8[R równa się 1,3, nie 5,7,9] Zauważcie, że kiedy już badany generuje liczby kandydujące do R, wykonuje tę pracę metodycznie, nie wykluczając wartości wykorzystanych uprzednio. A więc najpierw po prostu wytwarza, a następnie dopiero odrzuca możliwość, że R równa się 5. Nie pomija jednak zwyczajnie takiej ewentualności. Następna partia zapisu ilustruje trudności, jakie ma eksperymentator sporządzający protokół. Osoba badana milczy, a więc eksperymentator musi się włączyć i poprosić ją, aby mówiła dalej. W rezultacie nie mamy pewności, jakie możliwe wartości dla R zostały wykorzystane. Widzimy raczej, że proces ponownie się cofa; tym razem badany przechodzi do kolumny 6 i wychodząc z założenia, że R jest liczbą nieparzystą, a D jest równe 5, wnioskuje, że G musi być liczbą parzystą. Prowadzi nas to do stanu 10. Teraz G - ponieważ R to liczba nieparzysta, a D równa się 5, to G powinno być liczbą parzystą. Chociaż dedukcja ta nie jest prawidłowa, to jednak w sytuacji przedstawionej w stanie 10 odpowiada aktualnemu stanowi wiedzy osoby badanej (patrz rys. 14-6). 508 RYSUNEK 14-6. 1[D równa się 5] przetwarzanie pierwszej kolumny 2[T równa się 0] przejście do nowej kolumny 3[5ONAL5 plus GERAL5 równa się ROBER0] przejście do kolumny R 4[L plus L równa się R] przetwarzanie drugiej kolumny 5[R jest liczbą nieparzystą] z kwadratu 4 strzałka do 6[L plus L równa się R] przetwarzanie drugiej kolumny 7[R jest liczbą nieparzystą] znaleźć i sprawdzić 8[R równa się 1,3, nie 5,7,9] z kwadratu 7 strzałka do nowego kwadratu 9[R jest liczbą nieparzystą] przetwarzanie szóstej kolumny 10[G jest liczbą parzystą] z kwadratu 9 strzałka do nowego kwadratu 11[R jest liczbą nieparzystą] przetwarzanie szóstej kolumny 12[przenieść?] z kwadratu 11 strzałka do nowego kwadratu 13[R jest liczbą nieparzystą] Jednakże możliwość że G niekoniecznie musi być liczbą parzystą, dość szybko przychodzi mu do głowy. Patrzę na lewą stronę zadania, tam, gdzie sumuje się D plus G. Och, nie, możliwe, że trzeba tu będzie jeszcze dodać 1, jeżeli musiałbym przenieść 1 z poprzedniej kolumny, gdzie dodawane są E plus O. Myślę, że zostawię to na chwilę. To ostatnie stwierdzenie wskazuje, że osoba badana chce ponownie przystąpić do pracy nad kolumną 6, która kończy się na stanie 12, uznając możliwość przeniesienia, następnie decyduje się raz jeszcze na cofnięcie się, nie zajmując się już wartością G. Na tym zakończymy analizę fragmentu protokołu. Odpowiedni fragment grafu rozwiązywania problemu przedstawiony został na rysunku 14-6. Ten krótki fragment analizowanego protokołu ilustruje metodę rozłożenia i graficznego przedstawienia kolejnych kroków prowadzących do rozwiązania problemu. 509 Rysunek 14-7 [zawiera 238 stanów] przedstawia w formie schematycznej graf całego protokołu rozwiązywania problemu, osoba badana zużyła na wykonanie tego zadania 20 minut. [Stosowanie grafu. Czytając grafy zawsze zaczynamy od lewej górnej klatki i posuwamy się poziomo w prawo. Kiedy dojdziemy do końca, wracamy do lewego krańca następnej linii i znów posuwamy się poziomo w prawo. Przechodzimy kolejno przez wszystkie poziomy nie powtarzając żadnego z nich aż przejdziemy przez wszystkie idąc zawsze z lewa na prawo. Reguła brzmi: Przechodź wszystkie punkty grafu idąc na prawo do końca, następnie z powrotem do następnej linii poziomej i tak dalej. Powtórz czy tanie grafu tyle razy, ile jest to potrzebne.] Analizując cały protokół dostrzegamy te same prawidłowości. Osoba badana najwidoczniej dysponuje niewielkim zasobem różnych strategii, które wielokrotnie powtarza. Pełna analiza zawiera nieco ponad 200 przejść między kolejnymi stanami wiedzy, jednak do opisania ich wystarczyły zaledwie cztery różne operacje. Graf rozwiązywania problemu jest jedną z metod podziału etapów rozwiązywania problemu, rozłożenia tego procesu na serię małych kroków. Przedstawia graficznie mieszaninę sukcesów i pomyłek typowych w rozwiązywaniu każdego problemu. Ta ogólna forma analizy i schemat zachowania się wydają się możliwe do zastosowania w Bardzo różnorodnych sytuacjach problemowych. Oczywiste jest, że konkretne reguły stosowane przez badanego zależą przede wszystkim od rodzaju problemu, jednak ogólna struktura jego zachowania w toku rozwiązywania problemów jest zawsze podobna. Badany przekształca problem ogólny na szereg prostych podcelów i podproblemów. W każdym momencie osiągnięty postęp stanowi sumę stanów wiedzy. Przedstawia informację nagromadzoną do tego momentu. Badany przechodzi od jednego stanu wiedzy do drugiego usiłując zastosować jedną z operacji wybranych z niewielkiego zbioru. W wypadku powodzenia zdobywa nową informację, przechodząc tym samym do nowego stanu wiedzy. Posuwa się okrężnie, drogą prób i błędów, sprawdzając skuteczność różnorodnych operatorów, cofając się, kiedy dany ciąg operacji doprowadzi go do martwego punktu, aby zacząć od nowa. Do opisu jego zachowania wprowadzone zostały takie pojęcia, jak: cele, stany wiedzy i operatory. Zobaczymy, na ile te terminy znajdą zastosowanie w odniesieniu do rozwiązywania problemów w ogóle. STRATEGIE ROZWIĄZYWANIA PROBLEMÓW Jeśli łamigłówka, którą rozwiązaliście przedtem nim rozwiązaliście tę, była trudniejsza aniżeli łamigłówka, którą rozwiązaliście potem, jak rozwiązaliście łamigłówkę, którą rozwiązaliście przedtem, nim rozwiązaliście tę, to czy łamigłówka, którą rozwiązaliście przedtem, nim rozwiązaliście tę, była od niej trudniejsza czy też nie? (Restle, 1969) Ostateczny cel tej zagadki jest jasny: podanie odpowiedzi tak lub nie. Jeżeli jednak zaczniemy po prostu analizować zdanie od początku do końca, szybko ugrzęźniemy w jego skomplikowanej strukturze lingwistycznej. Poszukiwanie rozwiązania w kierunku do przodu nie daje efektu. 511 A co będzie, jeśli przyjmiemy odwrotną, tj. od tyłu, drogę poszukiwań? Zacząć od sformułowania celu - odpowiedzieć tak lub nie-a następnie zastanowić się, czego potrzeba, aby osiągnąć cel. Nie ulega wątpliwości, że najlepsza w tym wypadku będzie strategia polegająca na rozbiciu zdania na podcele, z którymi znacznie łatwiej sobie poradzić. Na przykład, można przyjąć taki podcel, po prostu próbować zrozumieć każdą frazę zdania. Jaki operator okaże się dobry do osiągnięcia tego podcelu? Jeden sposób polega na wprowadzeniu w miejsce różnorodnych zagadkowych sformułowań takich oznaczeń, jak np. litery alfabetu. Każdą frazę dotyczącą danej zagadki zastępujemy zatem odpowiednią literą. Fraza ta odpowiada oczywiście frazie ta łamigłówka. Określamy ją konkretnie łamigłówka A. A więc, ta równa się ta łamigłówka równa się łamigłówka A. Podstawiając odpowiednie oznaczenie, przekształcamy tekst zagadki w nowy, bardziej zrozumiały. Jeśli łamigłówka, którą rozwiązaliście przedtem, nim rozwiązaliście łamigłówkę A, była trudniejsza aniżeli łamigłówka, którą rozwiązaliście potem, jak rozwiązaliście łamigłówkę, którą rozwiązaliście przedtem, nim rozwiązaliście łamigłówkę A, to czy łamigłówka, którą rozwiązaliście przedtem nim rozwiązaliście łamigłówkę A, była trudniejsza niż łamigłówka A, czy też nie? Wyszło nieźle: spróbujmy jeszcze raz tej samej metody. Zastępujemy we wszystkich przypadkach frazę „łamigłówka, którą rozwiązaliście przedtem nim rozwiązaliście łamigłówkę A frazą „łamigłówka B". Po tym podstawieniu mamy nową wersję tekstu zadania: Jeśli łamigłówka B była trudniejsza aniżeli łamigłówka, którą rozwiązaliście potem, jak rozwiązaliście łamigłówkę B, to czy łamigłówka B była trudniejsza niż łamigłówka A? Jeszcze jedna fraza w tekście wymaga interpelacji: „łamigłówka," którą rozwiązaliście potem jak rozwiązaliście łamigłówkę B". Zgodnie ze stosowanymi zasadami podstawienia łamigłówka poprzedzająca A to łamigłówka B. A zatem odwracając stosunki otrzymamy wariant, w którym łamigłówka następująca po łamigłówce B, to łamigłówka A. Tak więc frazę „łamigłówka, którą rozwiązaliście potem, jak rozwiązaliście łamigłówkę B", należy zastąpić frazą „łamigłówka A". Teraz już problem jest wręcz banalny: Jeśli łamigłówka B była trudniejsza aniżeli łamigłówka A, to czy łamigłówka B była trudniejsza niż łamigłówka A? 512 Poszukiwanie rozwiązań Omawiany przykład wskazuje na nowe strategie, jakie stosują ludzie próbujący rozwiązać określone problemy. Większość problemów wymaga obrania kierunku poszukiwań „do przodu". Inaczej mówiąc, początkowo wypróbowujemy określoną metodę atakowania problemu, a następnie sprawdzamy, czy przyniosła nam ona jakikolwiek postęp. Jeśli tak, to posuwamy się dalej w tym samym kierunku od osiągniętego już punktu. Proces ten jest podobny do rzeki tworzącej meandry na zboczu góry. Woda po prostu zaczyna płynąć w dół po pochyłości: wyłącznie rzeźba powierzchni ziemi określa dokładną drogę przepływającej wody. Ważnym aspektem tego faktu jest to, że poszukiwanie od początku do końca dokonuje się za pomocą prostych, bezpośrednich kroków. W tej szczególnej łamigłówce o łamigłówkach, takie proste poszukiwanie do przodu nie dało rezultatu. Inne podejście to zaczynać od końca. W takim ujęciu koncentrujemy się na pożądanym rozwiązaniu i zastanawiamy się, jaki poprzedzający krok należy uczynić, aby dotrzeć do tego rozwiązania. Po dokładnym ustaleniu tego kroku, określamy krok bezpośrednio go poprzedzający i tak dalej, a w najlepszym wypadku aż do punktu wyjścia, który został podany w sformułowaniu danego problemu. Poszukiwanie w kierunku odwrotnym jest niezwykle użyteczne w wypadku pewnych problemów wzrokowych, na przykład poszukiwanie na mapie drogi z jednego punktu do drugiego. W poszukiwaniu w kierunku odwrotnym postęp dokonuje się małymi krokami. Określony zostaje podcel i czynione są próby jego rozwiązania. Pojawia się tu jedna z najskuteczniejszych strategii: analiza środków-celów (means-ends analysis). W analizie tej pożądany podcel ( w tym wypadku najbliższy podcel) jest porównywany z aktualnym stanem wiedzy. Problem polega na odnalezieniu odpowiedniego operatora - środka-który zmniejszałby istniejącą rozbieżność. W wypadku problemu z łamigłówkami celem było zrozumienie poszczególnych fraz zdania; stanem wiedzy była złożona struktura lingwistyczna. Środek redukujący różnice między jednym a drugim polegał na uproszczeniu fraz przez wprowadzenie właściwych oznaczeń. Jest to jeden z przykładów zastosowania strategii analizy środków-celów. Strategia ta znajduje częste zastosowanie w wielu różnych sytuacjach problemowych, często z nadzwyczajnym powodzeniem. Wybór operatorów Skąd przyszła nam do głowy myśl, aby skomplikowaną frazę zastąpić literą i tym samym uprościć problem łamigłówki? Bez wątpienia jednym z głównych problemów jest znalezienie właściwych operatorów, zdolnych do działania w danej sytuacji. Podział ogólnego problemu na podcele jest z pewnością użyteczny w momencie pojawienia się problemu. Analiza środków-celów jest użyteczna przy ocenie wartości danego operatora dla rozwiązania zadania. Ale żadna z tych taktyk nie mówi nam, jaki operator należy właśnie wybrać. 513 Heurystyki. Matematyk Polya (1945) uważa, że w celu rozwiązania problemu: Po pierwsze, musimy zrozumieć problem. Musimy jasno rozumieć cel, ustalić niezbędne warunki oraz dane. Po drugie, musimy obmyślić plan, który doprowadzi nas do rozwiązania. Ale sedno sprawy polega na obmyśleniu odpowiedniego planu, właściwych operatorów, które doprowadzą do rozwiązania. W badaniach nad rozwiązywaniem problemów rozróżniane są dwa typy planów lub operatorów: algorytmiczny i heurystyczny. Różnica między nimi jest taka, że jeden z nich gwarantuje uzyskanie prawidłowego wyniku. Algorytm to zbiór reguł, które, jeśli są ściśle przestrzegane, prowadzą automatycznie do generowania prawidłowego rozwiązania. Reguły mnożenia stanowią swoisty algorytm: jeśli będziemy je stosować właściwie, zawsze otrzymamy prawidłową odpowiedź. Heurystyki są bardziej podobne do reguł praktycznych; są to procedury lub wskazówki, którymi można posługiwać się bez większej trudności, a ich wartość opiera się na ich efektywności w rozwiązywaniu poprzednich problemów. Jednak w odróżnieniu od algorytmów metody heurystyczne nie gwarantują pełnego powodzenia. Dla wielu bardziej skomplikowanych i zarazem bardziej interesujących problemów nie znaleziono odpowiednich algorytmów rozwiązania, a może w ogóle one nie istnieją. W tych wypadkach należy posłużyć się metodami heurystycznymi. Niezmiernie ważna metoda heurystyczna polega na odnajdywaniu analogii między danym problemem a innymi problemami ze znanym rozwiązaniem. Często wymaga to umiejętności rozpoznawania ukrytych podobieństw, a jednocześnie pewnego sprytu, aby ignorować oczywiste różnice. Rozwiązanie przez analogię jest niezwykle cenne, jeżeli nawet analogia ta jest dość odległa. Istnieje oczywiście niebezpieczeństwo doszukiwania się analogii tam, gdzie w ogóle jej nie ma, powoduje to znaczną stratę czasu i wysiłku, zanim błąd zostanie odkryty i poszukiwania podjęte zostaną na nowo. Heurystyki wchodzą w grę w każdej skomplikowanej sytuacji rozwiązywania problemu. W gruncie rzeczy wiele z badań poświęconych myśleniu i rozwiązywaniu problemów w znacznej mierze sprowadza się do poszukiwania określonych rodzajów heurystyk stosowanych przez ludzi. Rozpatrzenie przytoczonego niżej przykładu ułatwi zrozumienie roli strategii heurystycznej. Gra w szachy. Podręczniki gry w szachy nie dostarczają przepisów gwarantujących wygraną. Raczej zawierają one pewne reguły heurystyczne: Należy kontrolować cztery pola środkowe. Należy zapewnić bezpieczeństwo królowi. W istocie różnice między szachistami wydają się wynikać głównie z siły i skuteczności schematów heurystycznych zastosowanych w trakcie gry (patrz Simon i Simon, 1962). Działanie tych reguł widoczne jest szczególnie w końcówce partii-to znaczy w trakcie ostatnich kilku ruchów 514 tuż przed daniem mata królowi (atak na króla przeciwnika tak przeprowadzony, że nie ma przed nim obrony). Niektóre końcówki zaczynają się o cale osiem ruchów przedtem nim nastąpi mat. Jeśli rozważymy wszystkie możliwe ruchy i przeciwruchy występujące w każdym stadium gry w szachy, to otrzymamy około tysiąca kombinacji, które teoretycznie mogą wystąpić. Liczba możliwych sekwencji złożonych z ośmiu ruchów może być równa 1000do potęgi ósmej (a jeśli wolicie, milionowi miliardów miliardów). Jeśli chcielibyśmy zbudować algorytm, aby ocenić najlepszą z możliwych kombinacji, musielibyśmy zbadać dosłownie miliardy różnych możliwości. Podobny wysiłek przekracza nawet możliwości niezwykle szybkiego komputera. Szachista, oczywiście, nie sprawdza wszystkich możliwych kombinacji, aby podjąć decyzję. Analizuje jedynie w dość ograniczonym zakresie te ruchy, które, jego zdaniem, mogą doprowadzić do uzyskania oczekiwanych efektów. Skąd on wie o tym, które z milionów możliwych ruchów należy dokładnie przeanalizować? Badania nad mistrzami szachowymi - posiadającymi tytuły Arcymistrzów międzynarodowych - dostarczają informacji o tym, że mistrzowie szachowi posługują się przy ocenie sytuacji i wyborze ruchów licznymi regułami heurystycznymi. Reguły te są uporządkowane według ich ważności i ten porządek wykorzystywany jest przy wyborze najlepszego ruchu. Próbka wybranych heurystyk wykorzystywanych przez arcymistrzów szachowych pozwoli nam lepiej zorientować się, w jaki sposób poszukują oni odpowiednich operatorów: • Należy dać pierwszeństwo podwójnemu szachowi (ruch, który powoduje równoczesne zaatakowanie króla przez dwie figury) oraz odkrytemu szachowi (ruch, który stwarza sytuację do ataku króla przeciwnika w efekcie wycofania własnej figury z linii ataku). • W przypadku dwu możliwości szachowania równocześnie, atakuj silniejszą figurą (siła figury zależy od różnorodności ruchów, jakie może ona wykonywać w trakcie gry). • Daj pierwszeństwo tym ruchom, na które przeciwnik może odpowiedzieć jedynie minimalną liczbą ruchów. • Daj pierwszeństwo szachowania tej figurze, która do tego momentu nie należała do grupy figur aktywnych. • Daj pierwszeństwo takiemu szachowi, który zmusza króla przeciwnika do oddalenia się od własnych pól. Są to proste reguły. Jednakże, gdy zastosuje sieje do pewnej liczby typowych końcówek szachowych (wziętych z dowolnego podręcznika szachowego), w wielu wypadkach zapewniają sukces. Jeszcze ważniejsze jest to, że zapamiętanie ich nie jest dla szachisty zbyt uciążliwe i nie wymaga specjalnej pojemności pamięci: wystarczy, aby rozważył on jedynie od 9 do 77 możliwości w fazie eksploracji dotyczącej osiągania rozwiązania, i od 5 do 19 możliwości w fazie weryfikacji, kiedy utwierdza się w przekonaniu, że jego kombinacja ruchów jest rzeczywiście wartościowa i logiczna. Ponieważ na znalezienie rozwiązania niektórych ze wspomnianych problemów arcymistrzowi potrzeba około 15 minut, 515 wynika z tego, że zadanie takie nie wymaga uruchomienia jakichś nadzwyczajnych zdolności umysłowych. W rzeczywistości zadanie to wydaje się podobne do zadania wymagającego zapamiętania w ciągu 15 minut 75 do 100 słów, ułożonych w poprawnym gramatycznym porządku (na przykład trzech zdań tego tekstu). Obserwowane różnice między szachistami pod względem ich różnych możliwości zależą raczej od skuteczności selektywnych schematów heurystycznych, które stosują, a w mniejszym stopniu od czystych zdolności umysłowych. Ograniczenia metody analizy protokołów Zaczynając od zwerbalizowania przez osobę badaną jej myśli w trakcie rozwiązywania problemu, mogliśmy dowiedzieć się nieco o naturze zaangażowanych tu procesów myślowych. Co więcej, nawet sama analiza protokołów nie ogranicza się wyłącznie do czystej sytuacji rozwiązywania problemów. Kiedy psycholog kliniczny próbuje zbadać swego pacjenta, to procedury, jakie stosuje, są oparte na nieco mniej sformalizowanej analizie protokołu wywiadu ze swoim pacjentem, istota sprawy jest ta sama. Stara się 516 odgadnąć naturę operacji wewnętrznych w strukturze pamięci, śledząc wybrane przez pacjenta drogi, których odbicie znajduje w jego wypowiedziach. Niebezpiecznie byłoby całkowicie zawierzyć metodzie analizy protokołu. Przykładem tego może być jedno z wcześniejszych badań nad rozumowaniem (Maier, 1931). W eksperymencie tym posłużono się dwoma sznurami zwisającymi z sufitu. Zadanie osoby badanej polegało na związaniu obu końców sznura, jednakże były one tak oddalone od siebie, że badany nie mógł ich równocześnie złapać (rys. 14-8). [Na rysunku oprócz dwóch sznurków do zawiązania zwisających z sufitu i oddalonych od siebie na odległość większą niż rozstaw ramion człowieka, któremu powierzono zadanie, znajdują się również: szczypce, gwoździe słoik kartki, albo małe deseczki, piła, młotek] Liczba możliwych rozwiązań wiązała się ze zręcznym wykorzystaniem wielu różnych przedmiotów, niby przypadkowo rozrzuconych na podłodze pokoju, w którym przeprowadzano eksperyment. Maiera interesowało tylko jedno rozwiązanie, stosował więc system wskazówek (sugestii), aby skłonić swoich badanych do wybrania tego właśnie rozwiązania. (Świadomie nie podajemy odpowiedzi, abyście sami spróbowali rozwiązać to zadanie). Eksperymentator (który znajdował się w tym samym pokoju co osoba badana) posługiwał się dwiema różnymi wskazówkami. Wskazówka L Eksperymentator spaceruje po pokoju i przechodząc obok sznura wiszącego bliżej środka pokoju, nieznacznym ruchem powoduje jego rozkołysanie. Odbywa się to w taki sposób, aby osoba badana niczego nie podejrzewała. Eksperymentator, idąc po prostu w stronę okna, po drodze zaczepia o sznur. Wskazówka 2. W wypadku, gdy wskazówka 1 nie przyniosła rezultatu, eksperymentator po upływie kilku minut bierze w ręce szczypce i zwracając się do osoby badanej mówi: „Posługując się wyłącznie tym przedmiotem, można znaleźć inny sposób rozwiązania tego zadania". [Szczegółowy opis wskazówek udzielanych przez Maiera znajduje się w jego artykule (1931).] Maier podzielił osoby badane, które prawidłowo rozwiązały problem po otrzymaniu wskazówek, na dwie grupy-do jednej grupy należały osoby, które rozwiązały problem od razu „całościowo" („Rozwiązanie przyszło samo, nie wiem jak"), a do drugiej te, które najwyraźniej rozwiązywały go etapami („Popatrzmy, jeżeli mógłbym ruszyć sznur... rzucić weń czymś... dmuchnąć na niego... rozkołysać jak wahadło... aha!"). Interesujące nas różnice między obiema grupami polegają na różnym sposobie relacjonowania wartości wskazówek. Osoby badane, które rozwiązały zadanie od razu „całościowo", nie wspomniały o tym, że korzystały ze wskazówek; ci zaś, którzy dochodzili do rozwiązania drogą kolejnych kroków, przyznali (z jednym wyjątkiem), że wskazówka pomogła im w tym. Interesująca jest kwestia, czy istotnie przedstawiciele grupy „całościowej" nie wiedzieli o tym, że korzystali ze wskazówek. Jeżeli tak było, to możemy oczekiwać, że protokoły robione w czasie eksperymentów nad rozwiązywaniem problemów, mogą pomijać szereg kroków ważnych dla rozwiązania tych problemów. Po pierwsze, jest jasne, że osoby badane, które nie wspominały o roli wskazówek, rozwiązały zadanie szybciej niż grupa osób, które nie otrzymały w ogóle żadnej wskazówki w tym względzie. Średnio, większość badanych znalazła rozwiązanie w ciągu jednej minuty od otrzymania wskazówki. W grupie, która nie korzystała w ogóle ze wskazówek, jedynie 20 procent osób znalazło prawidłowe rozwiązanie, chociaż otrzymały pół godziny na rozpracowanie problemu. 517 A może osoby z grupy „całościowej" dostrzegły wskazówkę, ale nie chciały się do tego przyznać. Wydaje się to mało prawdopodobne. Te osoby badane, które rozwiązywały problem etapami, bez wahania przy opisywaniu sposobu rozwiązywania wymieniają rolę wskazówki. Dlaczego zatem dla osób z grupy „całościowej" miałoby to być tajemnicą? Nasuwa się wniosek, że wskazówka w znacznym stopniu ułatwiła im rozwiązanie, chociaż nie uświadamiały sobie jej roli. Jeżeli osoba badana nie dostrzega oczywistego kroku w swym postępowaniu, to jej protokół z całą pewnością jest niepełny. Musimy założyć zatem, że badany rozwiązując problem odzwierciedla w swym opisie słownym różnorodne strategie i operacje myślowe, które przeprowadza w trakcie dochodzenia do rozwiązania. Pomimo to nie wszystkie jego procesy wewnętrzne znajdują dokładne odbicie w jego sprawozdaniach werbalnych. To, co jest w nich dostępne, stanowi jedynie częściowy opis zachodzących procesów wewnętrznych. W konkluzji musimy stwierdzić, że tylko część aktywności poznawczej osoby badanej dostępna jest obserwacji zewnętrznej. Zapis będzie bardziej kompletny, jeśli zachęcimy badanego do szczegółowego werbalizowania swego procesu myślowego i jeśli będziemy sporządzać protokół w trakcie trwania czynności rozwiązywania. Nawet „całościowi" badani Maiera mogliby uświadomić sobie rolę wskazówki, gdyby uprzedzano ich wcześniej, że powinni uważnie śledzić tok swoich myśli i informować na głos o drogach dochodzenia po omacku do rozwiązania. Tak czy inaczej, bez względu na pewne jej słabości analiza protokołów stanowi skuteczną metodę rekonstrukcji zdarzeń zachodzących w świadomości człowieka rozwiązującego problem oraz badania strategii myślenia, którymi posługuje się on w tych złożonych zadaniach. STANY WEWNĘTRZNE A STANY ZANOTOWANE W PROTOKOLE W celu zilustrowania naszego problemu rozpatrzmy różnice między trzema różnymi przestrzeniami problemu: wewnętrzną, zapisaną w protokole, i zewnętrzną. Przyjmujemy, że badany rozwiązuje problem wewnętrznie według pewnych ogólnych strategii i określonych operacji, które, jak mamy nadzieję, są zgodne ze strategiami i operacjami analizowanymi w grafie rozwiązywania problemu. Rozwiązanie to jest przedstawione w przestrzeni wewnętrznej, dlatego nie możemy go obserwować bezpośrednio. Wypowiedzi ustne dokonywane przez osobę badaną w trakcie rozwiązywania problemu - protokół - są zapisem rozwiązywania problemu w przestrzeni protokołu. Ponadto badany, posuwając się w kierunku rozwiązania, robi jakieś notatki, wykonuje pewne czynności, tworząc w ten sposób przestrzeń zewnętrzną swego rozwiązania. Zastanówmy się, jak te trzy „przestrzenie" mają się do siebie wzajemnie. Przestrzeń wewnętrzną można przedstawić schematycznie w postaci grafu rozwiązywania problemów. Na rysunku 14-9 przedstawiony został przykład przestrzeni wewnętrznej, w której występują 22 stany. Ale osoba badana może przedstawić jedynie część z nich, w swym protokole-co zaznaczone zostało w postaci zaciemnionych kwadratów. W tym wypadku, jedynie 13 z 22 stanów pojawia się w jego protokole. Graf rozwiązywania zadania w przestrzeni protokołu może wyglądać na przykład tak, jak to zostało przedstawione na rysunku 14-10. 518 RYSUNEK 14-9. Czytając graf poruszamy się poziomymi liniami od lewej do prawej. Graf przestrzeni wewnętrznej. Pierwsza linia: kwadrat ciemny 1 kwadrat jasny 2 kwadrat jasny 3 Druga linia połączona z kwadratem 2: kwadrat jasny 4, kwadrat ciemny 5, kwadrat ciemny 6 Trzecia linia połączona z kwadratem 1: kwadrat ciemny 7, kwadrat jasny 8, kwadrat jasny 9 kwadrat ciemny 10, kwadrat jasny 11. Czwarta linia połączona z kwadratem 8: kwadrat jasny 14, ta sama linia ale połączenie z kwadratem 9: kwadrat jasny 12, kwadrat ciemny 13. Piąta linia, połączenie z kwadratem 14: kwadrat ciemny 15, kwadrat ciemny 16, kwadrat ciemny 17. Szósta linia, połączona z kwadratem 15: kwadrat ciemny 18, kwadrat jasny 19. Siódma linia połączona z kwadratem 18: kwadrat jasny 20, kwadrat ciemny 21, kwadrat ciemny 22... RYSUNEK 14-10 Graf przestrzeni protokołu Pierwsza linia: kwadrat 1, kwadrat 5, kwadrat 6 Druga linia połączona z kwadratem 1: kwadrat 7, kwadrat C, kwadrat A, kwadrat 10. Trzecia linia połączona z kwadratem A: kwadrat B, kwadrat 13. Czwarta linia połączona z kwadratem C: kwadrat D, kwadrat 15, kwadrat 16, kwadrat 17. Piąta linia połączona z kwadratem 15: kwadraty 18-20, kwadrat 21, kwadrat 22,... Wyraźnie widać co zaszło. W „przestrzeni" protokołu wygląda to tak, jakby osoba badana przeszła bezpośrednio od stanu 1 do stanów 5 i 6. Stany pośrednie 2 i 4, jak też ślepa droga prowadząca do stanu 3, zostały całkowicie pominięte. Na dodatek stany 10 i 13 następują po stanie 7. Często w toku analizy protokołu można dostrzec brak pewnych łączących ogniw. 519 W omawianym wypadku protokół zawiera sprzeczności: stany 10 i 13 nie mają takiego charakteru, aby jeden wynikał z drugiego, a ponadto żaden z nich nie może występować bezpośrednio po stanie 7. W takim wypadku możemy wprowadzić pewne stany hipotetyczne, nazwijmy je A i B. Wiemy, że są one niezbędne, ponieważ jednak nie zostały zapisane w protokole, możemy jedynie domyślać się ich istnienia. Podobnie gubi się stan 18, ponieważ nie można go odróżnić od stanu 20. Ostateczny graf zrekonstruowany na podstawie protokołu ma wiele podobieństwa z grafem stanów wewnętrznych, jednakże nie stanowi on z pewnością odbicia zachodzących tam procesów (rys. 14-11). Stosunki między stanem wewnętrznym a stanem protokołowym można sobie wyobrazić na przykład w ten sposób, że procesy wewnętrzne znajdują swe odzwierciedlenie w protokole jedynie okazjonalnie. 520 Przechodząc przez kolejne stany wewnętrzne, badany tworzy na poziomie zachowania skondensowaną wersję wewnętrznych procesów myślowych. MECHANIZMY MYŚLENIA Strategie rozwiązywania problemów, które omawialiśmy, zależą od ogólnego charakteru procesów zachodzących w mózgu człowieka oraz od ich organizacji. Co więcej, te ogólne zasady organizacji muszą też stosować się do określonych systemów, które przechowują, wydobywają i wykorzystują informacje, niezależnie od tego, czy są to systemy elektroniczne czy biologiczne. Każdy system, będący w interakcji z nieustannie zmieniającym się światem zewnętrznym, musi gromadzić i przetwarzać informacje, z tego właśnie faktu wynika szereg fundamentalnych problemów, wspólnych dla wszystkich systemów tego typu. W związku ze znacznym stopniem ogólności, gdy usiłujemy odnaleźć zasady organizacji mózgu ludzkiego, celowe jest przeanalizowanie zasad organizacji i struktur wszelkich systemów informacyjnych. Nacisk kładziemy tu na słowo zasady. Szczegóły dotyczące różnych sposobów funkcjonowania oraz mechanizmy uruchamiania tych systemów w tym miejscu zupełnie nas nie interesują. Jeśli jesteśmy w stanie stwierdzić, że dany system posługuje się metodą heurystyczną analizy środków-celów, to nie ma znaczenia, czy zbudowany jest on z neuronów, elektronicznych obwodów scalonych, czy też przekładni i dźwigni-heurystyka we wszystkich wypadkach jest taka sama. W badaniu struktur systemów przetwarzających informacje należy skupić uwagę na pewnych podstawowych sprawach, ponieważ nakładają one fundamentalne ograniczenia na pracę tych systemów. Dotyczy to na przykład takich kwestii: czy system zapamiętuje rozwiązania poszczególnych problemów czy też wyłącznie procedury dochodzenia do rozwiązań? Co dzieje się z procedurami, które są stale wykorzystywane do rozwiązywania różnorodnych zadań? Czy ograniczona jest zdolność systemu do sprawdzania na bieżąco, w jakim stanie znajduje się proces rozwiązywania problemu, oraz w razie konieczności podawania odpowiedzi częściowej? Jeśli istnieją ograniczenia tego typu, to jaki mają one wpływ na zdolność systemu do rozwiązywania problemów. Reguły a fakty Obliczcie w pamięci: Ile to będzie 8 razy 4? Ile to będzie 262 razy 127? Aby odpowiedzieć na oba pytania, musimy posłużyć się dwiema różnymi strategiami. W pierwszym wypadku odpowiednia informacja przechowywana jest w naszej pamięci i kiedy zostanie zadane pytanie, przypominamy sobie właściwą odpowiedź. 521 W drugim zaś wypadku najprawdopodobniej nie znamy prawidłowej odpowiedzi, wiemy jednak, jak ją znaleźć. Bierzemy zatem ołówek i papier, aby posługując się regułami mnożenia uzyskać prawidłową odpowiedź. Są to dwie różne strategie posługiwania się informacją. Pierwsza polega na gromadzeniu faktów bezpośrednio w pamięci. Druga strategia polega na gromadzeniu programu, zestawu reguł, które pozwalają na wytworzenie potrzebnej informacji. W wielu wypadkach możliwy jest wybór między obiema strategiami. Każda z nich ma swoje zalety. Dzięki bezpośredniemu gromadzeniu informacji przyspieszamy i ułatwiamy sobie odszukanie ich później, ale dzieje się to kosztem nieekonomicznego wykorzystania przestrzeni pamięci. Kiedy rzecz dotyczy już większej liczby informacji, bardziej efektywne okazuje się zapamiętywanie reguł, dzięki którym można je uzyskać; pozwala to na zaoszczędzenie miejsca w przestrzeni pamięci, ale kosztem obniżenia szybkości odszukania informacji. Jeśli chodzi o mnożenie, musimy na ogół pamiętać iloczyny wszystkich par liczb jednocyfrowych (około 45 iloczynów) i niektóre z iloczynów dwucyfrowych (do 4950 iloczynów). Niektórzy zagorzali entuzjaści sztuczek liczbowych, tzw. błyskawiczni kalkulatorzy, mają w pamięci dość znaczną liczbę iloczynów liczb trzycyfrowych (jednak nie wszystkie 499500 z możliwych). Od tego, jak często wykorzystujemy dany materiał, zależy to, czy damy pierwszeństwo zapamiętywaniu reguł czy też konkretnych wyników. Jeśli całe życie zajmujecie się liczeniem w myśli, uczenie się konkretnych wyników ma swój sens. Dla większości z nas jednak taki balast w pamięci byłby nieuzasadniony. Podprogramy Zdarza się często, że w trakcie rozwiązywania danego problemu wielokrotnie powtarza się określone następstwo operacji. W takich wypadkach dobrze jest mieć w pamięci jeden odpowiedni program i posługiwać się nim zawsze, gdy jest to konieczne. Za przykład posłuży nam program niezbędny do mnożenia dwu liczb dwucyfrowych. W tym celu wystarczy dwukrotnie zastosować regułę mnożenia jednej liczby dwucyfrowej przez jednocyfrową. Taki jednostkowy zestaw reguł będziemy nazywać podprogramami. Posługiwanie się podprogramami wymaga spełnienia pewnych warunków. Po pierwsze, potrzebny jest pewien program nadrzędny, który we właściwym momencie wywoła z pamięci podprogram. Program nadrzędny nazywany jest zazwyczaj programem wykonawczym. Ponadto trzeba mieć możność kontrolowania, skąd wziąć podprogram i gdzie go zwrócić po wykorzystaniu. Jeżeli podczas rozwiązywania określonego problemu podprogram wykorzystywany jest wielokrotnie, ważne jest, aby w danym momencie było wiadome, który to raz jest on wykorzystywany. Specjalne środki powinny być przygotowane na wypadek, kiedy w trakcie działania podprogram musi wykorzystać sam siebie. Taki proces nazywamy rekursją (powróceniem). Ludzie na ogół mają trudności w sytuacji, która wymaga rekursji. Na przykład, aby zrozumieć następujące zdanie, podprogram, który analizuje oddzielne podrzędne frazy (zamknięte w nawiasach), wymaga podprogramu, który analizuje całe frazy; 522 The movie (that the script (that the novel (that the producer (whom she thanked) discovered) became) made) was applauded by the critics. [Miller, 1970]. [Film (którego scenariusz (z której powieści (którą producent (któremu ona dziękowała) odkrył) został) zrobiony) był entuzjastycznie przyjęty przez krytykę.] Z problemem rekursji wiążą się niemałe trudności. Podprogram wykorzystywany do analizy zdania that the novel (z której powieści) przerywa się w trakcie działania i ten sam podprogram musi być użyty do uporządkowania zdania that the producer (którą producent); ale i tu podprogram zostaje przerwany po to, aby przepracować zdanie whom she thanked (któremu ona dziękowała). To samo zdanie można zbudować inaczej, tak aby było zrozumiałe bez stosowania rekursji. Teraz tę samą informację można względnie łatwo zrozumieć. She thanked the producer who discowered the novel that became the script that made the movie that was applauded by the critics. (Miller, 1970). (Ona dziękowała producentowi, który odkrył powieść, z której zrobiono scenariusz, z którego zrobiono film, który był entuzjastycznie przyjęty przez krytykę). Pamięć krótkotrwała W pracy nad jakimś złożonym problemem podstawową trudność sprawia to, że musimy ciągle pamiętać o tym, na jakim etapie obecnie jesteśmy i jakie wyniki osiągnęliśmy do tego momentu. Wraz ze wzrostem stopnia złożoności problemu, rośnie ilość informacji doraźnej, którą musimy śledzić. Czasami opieramy się na pomocach zewnętrznych, odnotowując wypróbowane już drogi dochodzenia do rozwiązania oraz wszystkie uzyskane wyniki częściowe. Zapisy te stanowią coś w rodzaju pamięci zewnętrznej naszej aktywności w toku rozwiązywania problemu. Fakt, że często uciekamy się do tych pomocy zewnętrznych, świadczy o tym, że głównym czynnikiem wpływającym na przebieg wewnętrznych procesów rozwiązywania problemów oraz podejmowania decyzji są ograniczenia w utrzymywaniu informacji w pamięci krótkotrwałej. Zwierzęta, które nie dysponują takimi możliwościami w zakresie pomocy zewnętrznych, mają odpowiednio większe trudności w rozwiązywaniu złożonych zadań poznawczych. Nawet u człowieka mała pojemność pamięci krótkotrwałej (5-10 jednostek informacji) stwarza pewne ograniczenia w strukturze i stopniu złożoności procesów myślenia, posługuje się on nią bowiem do śledzenia przebiegu procesu rozwiązywania zadania i zapisu uzyskanych wyników częściowych. W istocie można przewidzieć, kiedy człowiek nie będzie mógł rozwiązać takiego czy innego problemu po prostu dlatego, że nie będzie w stanie śledzić równocześnie wszystkich zdarzeń zachodzących w danym momencie. Liczenie w pamięci. Zastanówmy się nad prostym zadaniem pamięciowym. Większość ludzi ma kłopoty z przemnożeniem w pamięci dwu liczb dwucyfrowych. 523 Czy wiąże się to z ograniczoną pojemnością pamięci krótkotrwałej? Spróbujmy ustalić, jakie są wymagania dla pamięci, aby rozwiązać zadanie tego typu. Zacznijmy od pomnożenia dwu liczb jednocyfrowych, na przykład 9 razy 4. Zakładamy, że odpowiedź jest już od dawna w pamięci. A więc, nie potrzeba więcej niż trzech rejestrów pamięciowych: jeden dla 9, jeden dla 4 oraz jeden dla odpowiedzi 36. Jak widać zadanie jest łatwe. Zajmijmy się teraz mnożeniem liczby dwucyfrowej przez jednocyfrową, powiedzmy 69 razy 8. Problem ten można rozwiązać za pomocą kroków. Pierwszy krok polega na wprowadzeniu do pamięci krótkotrwałej dwu liczb, które należy pomnożyć, jest to krok samych liczb. W drugim kroku wytwarza się pierwszy wynik częściowy; w pamięci krótkotrwałej znajduje się pięć liczb. Dwie z tych pięciu liczb odpadają (fakt, że 9 pomnożono przez 8), pozostaje jedynie wynik operacji (3 krok). W czwartym kroku oblicza się ostatni wynik częściowy (6 razy 8 równa się 48) i teraz w pamięci krótkotrwałej znajduje się sześć liczb. Dalej następuje piąty krok, w którym wszystkie liczby wymagające pomnożenia zostają zapomniane, a w pamięci pozostają jedynie dwie liczby, które po prawidłowym rozmieszczeniu i dodaniu prowadzą do rozwiązania. Obciążenie pamięci krótkotrwałej waha się zatem w trakcie rozwiązywania w sześciu krokach, między dwiema a sześcioma liczbami równocześnie. W jednym punkcie obciążenie zbliża się do granic możliwości pamięci krótkotrwałej (gdzieś około siedmiu), ale ponieważ nie przekracza się tej granicy, możemy przyjąć, że większość ludzi rzeczywiście jest zdolnych, nie bez pewnego wysiłku, przemnożyć w pamięci liczbę dwucyfrową przez jednocyfrową. Ale opisany system ulegnie zaburzeniu, kiedy zajdzie konieczność przemnożenia dwu liczb dwucyfrowych. Przeanalizujmy zadanie: 95 razy 49. Kolejne kroki w działaniu pamięci zostały przedstawione na rysunku 14-13. Obciążenie pamięci rośnie od 6 jednostek w 4,7 i 10 krokach do siedmiu jednostek w 9 kroku. Oprócz tego w pamięci krótkotrwałej, chociaż nie jest to pokazane na wykresie, musi być przechowywana również inna informacja, na przykład wskazówka o tym, jaka część zadania jest opracowywana w danym momencie albo liczba, którą należy przenieść lub dodać do rozwiązania częściowego w celu podsumowania, dającego ostateczną odpowiedź. Tak więc, siedem jednostek na 9 kroków - to zaniżony poziom obciążenia pamięci. 524 Prawdę mówiąc, większość ludzi przekonana jest o tym, że pomnożenie liczby dwucyfrowej przez inną liczbę dwucyfrową przekracza ich możliwości. Jest oczywiste, że granice te wyznacza pojemność pamięci krótkotrwałej, a nie zdolności intelektualne. Wystarczy wziąć ołówek i kartkę, a zadanie staje się dziecinnie proste, bowiem teraz papier zastępuje nam pamięć krótkotrwałą. Niektórzy ludzie-na przykład magicy estradowi-osiągają niezwykłe efekty w liczeniu w pamięci, mimo, że pojemność ich pamięci krótkotrwałej jest taka, jak u innych ludzi. Po prostu przy mnożeniu posługują się innymi regułami, pozwalającymi na zmniejszenie ilości informacji, które muszą być przechowywane w pamięci krótkotrwałej. Zastanówmy się nad prostym trikiem, który pozwoli nam łatwo rozwiązać w myśli ostatnie zadanie. Zwróćcie uwagę na fakt, że 49 równe jest 7 razy 7. Oznacza to, że możemy sprowadzić zadanie do dwu zadań prostych: najpierw pomnożyć 95 razy 7, a uzyskany wynik pomnożyć znów przez 7. Cały problem został sprowadzony do dwu prostych działań. Po przeprowadzeniu obliczeń, zobaczycie, że maksymalne obciążenie pamięci zostało obniżone do sześciu liczb. Inne triki polegające na zmniejszeniu obciążenia pamięci krótkotrwałej mogą przynieść jeszcze bardziej efektowne wyniki. 15. Podejmowanie decyzji OKREŚLANIE WARTOŚCI Psychologiczna wartość pieniędzy Wartość złożonych alternatyw Jak wybrać małżonka? Strategie decyzyjne Ogólne wrażenie Porównywanie wymiarów Ocena strategii Przeciążenie poznawcze Co jest przedmiotem optymalizacji? LOGIKA WYBORU PODEJMOWANIE DECYZJI RYZYKOWNYCH Użyteczność w sytuacji ryzykownego wyboru Prawdopodobieństwo Wartość oczekiwana Prawdopodobieństwo subiektywne Reprezentatywność i dostępność Subiektywnie oczekiwana użyteczność GROMADZENIE DOWODÓW Szanse Testowanie raka Dowody EFEKTY NASTĘPCZE PODEJMOWANIA DECYZJI Racjonalizacja O konikach polnych i innych rzeczach Racjonalizacja podecyzyjna WNIOSKI 527 Tak rozmyślając całe tygodnie, skąd wziąć kapelusz, chatkę i spodnie, łódź ratunkową, kozę i kury, leżał na piasku brzuchem do góry. Pić mu się chciało, męczył go głód, bo wciąż nie wiedział co zrobić wprzód. I tak nic zgoła nie robiąc w końcu, w szal owinięty leżał na słońcu. Ja wniosek prosty wyciągam stąd, że tak postępując czynił niemądrze... Aż dwaj koledzy przyżeglowali i marynarza wyratowali. [„Stary marynarz" („The Old Sailor"). Ze zbiorku: A. A. Milne Now we are six 1927, w przekładzie Ireny Tuwim, 1957] Decyzje przenikają całe nasze życie, ciągle stoimy wobec problemu wyboru jednej z alternatywnych form zachowania, z których każda musi być oceniona ze względu na jej wartość. Czasami decyzja zależy od reakcji innych ludzi; czasami odgrywa rolę przypadek, często podjęciu decyzji towarzyszy kłopotliwa mieszanina osiągnięć i porażek. Porównanie kilku sposobów działania i wybór jednego z nich - to bardzo trudne zadanie psychologiczne. Po pierwsze, jeśli każdy sposób działania jest chociaż trochę skomplikowany, pamięć krótkotrwała może być przeciążona nawet wówczas, gdy będzie miała zobrazować tylko jedną z alternatyw i wszystko to co się z nią wiąże, nie mówiąc już o sytuacji, kiedy musi przedstawić wszystkie warianty równocześnie dla porównania ich ze sobą. Po drugie, w przypadku występowania złożonych alternatywnie nie ma dobrych sposobów ich porównywania, nawet jeśli istnieje możliwość rozważania poszczególnych wyborów w konfrontacji z niektórymi innymi. A w końcu trzeba powiedzieć, że zawsze może wystąpić pewna liczba nieznanych czynników, komplikujących sytuację: pewne efekty działania są jedynie problematyczne - kto wie, co się zdarzy naprawdę? Pewne następstwa decyzji zależą od tego, jak zareaguje na nią inna osoba, która sama często z góry nie wie, jaka będzie jej reakcja. Nie budzi też zdziwienia takt, kiedy sama tylko złożoność sytuacji podejmowania decyzji prowadzi często do tego, że człowiek zdesperowany opuszcza ręce i stara się jak najdłużej odwlec moment decyzji, w końcu pod naciskiem podejmuje decyzję, nie starając się nawet przeanalizować jej wszystkich możliwych następstw. Później, po wszystkim, kiedy już za późno na zmianę, nadchodzi czas dręczenia się i żałowania tego, co się zrobiło, a co mogłoby być, gdyby zostało wybrane inne, lepsze rozwiązanie. Teoria podejmowania decyzji daje receptę na to, jak wybrać określoną linię działania w sytuacji niepewnej. Uczy nas, jakie informacje są konieczne i jak należy je złożyć, aby dojść do optymalnej decyzji. Badając zachowanie człowieka w trakcie podejmowania decyzji, 528 odkryjemy, że teoria podejmowania decyzji napotyka szereg problemów podobnych do tych, które wyłoniły się w toku analizy uczenia się zbieżności (rozdział 1 3). Istota tego ostatniego sprowadzała się do określenia poprzez doświadczenie warunków zewnętrznych i działań, które prowadzą do pożądanych wyników. Badania nad podejmowaniem decyzji dotyczą sytuacji, w których zmuszeni jesteśmy do podjęcia decyzji oraz działania, mimo ograniczonej wiedzy odnoszącej się do warunków. Wybór możliwych działań i przewidywanie oczekiwanych wyników musi wynikać z logicznej analizy sytuacji. Często w tym samym stopniu może on zależeć od zachowania innych ludzi, jak też od naszych własnych działań. W uczeniu się zbieżności zachowanie regulowane jest przez wyniki, do których prowadzi; pozytywny (nagroda) bądź negatywny (kara). Przy podejmowaniu decyzji przez człowieka możliwe wyniki są często znacznie bardziej skomplikowane i nie tak łatwo ocenić je właściwie. Istnieje ścisły związek między działaniami ludzkimi a ograniczonymi możliwościami ludzkiego poznania. A zatem, badając proces podejmowania decyzji, musimy stale pamiętać o różnicy między tymi regułami, którymi człowiek powinien się posługiwać, a tymi, którymi w rzeczywistości się posługuje. Różnica ta jest dość subtelna, ponieważ ludzie często opisują swoje zachowanie jako jasne i logiczne nawet wówczas, gdy w rzeczywistości tak nie jest. Jeśli ktoś podejmuje decyzję nielogiczną z punktu widzenia osoby postronnej, zazwyczaj okazuje się, że decyzja ta miała sens z jego własnego punktu widzenia, przynajmniej w świetle tej informacji, jaką właśnie analizował. Jeśli jego oczywisty błąd zostanie mu wytknięty („Dlaczego poszedłeś tym pionkiem? Przecież teraz zabiorę ci królową"), najczęściej odpowie nam, że po prostu „zapomniał" o tej ważnej informacji („O do diabła, przecież wiedziałem to wcześniej, a później zupełnie o tym zapomniałem"). W znacznym stopniu utrudnia to badanie procesu podejmowania decyzji. Jakie zachowanie mamy badać, pełne błędów, ale rzeczywiste, czy też przemyślane i celowe? Odpowiedź brzmi: oczywiście jedno i drugie. OKREŚLANIE WARTOŚCI Funkcja racjonalnej teorii podejmowania decyzji polega na wyodrębnieniu informacji istotnych dla decyzji oraz ustaleniu, w jaki sposób połączyć je, aby dojść do właściwej konkluzji. Najważniejszą zasadą racjonalnej decyzji jest zasada optymalizacji: przy pozostałych równych warunkach, wybrany wariant powinien mieć największą wartość. Jest to podstawowa zasada uczenia się zbieżności. Jest ona również podstawową regułą teorii decyzji. Na pierwszy rzut oka, ta prosta maksyma działania w celu maksymalizacji zysku i minimalizacji straty wygląda całkiem rozsądnie. Ale w tak prostej postaci ma ona względnie niewielką wartość dla teorii podejmowania decyzji przez człowieka. Rzecz w i tym, żejóżni ludzijjwjgżjr^jpo^ób^cjeniają wartości zysków j strat. Główna trudność związana z pojęciem optymalizacji polega na ustaleniu, jakjudzie szacują wartości i koszty w sytuacji podejmowania decyzji. Wartość psychologiczną, 529 jaką dana osoba wiąże z określonym sposobem działania lub określonym przedmiotem, nazywamy ich użytecznością dla tej osoby. Zadanie teorii decyzji polega na określeniu, w jaki sposób ludzie przypisują danej rzeczy określoną wartość i jak te oceny użyteczności są wykorzystywane w trakcie podejmowania decyzji. Psychologiczna wartość pieniędzy Naturalną koleją rzeczy rozważania nad użytecznością rozpoczniemy od psychologicznej wartości pieniędzy. Jasne jest, że użyteczność pieniądza nie stanowi prostego odpowiednika jego wartości nominalnej: w oczywisty sposób musi ona zależeć między innymi od stopnia zamożności danej osoby. Jeden dolar dany biedakowi ma dla niego wyższą użyteczność niż dla bogatego, który mu go ofiarowuje. Zastanówmy się nad takim prostym eksperymentem. Wyobraźcie sobie, że dostaliście w prezencie 20 dolarów bez żadnych zobowiązań. Nie spodziewaliście się tych pieniędzy i nie macie pojęcia, kto je przysłał. Zastanówcie się teraz, jak dużą przyjemność sprawił Wam taki prezent. A teraz spróbujcie na serio określić wielkość tego zadowolenia z 20 dolarów w jakichś jednostkach. Powiedzmy, ile trzeba pieniędzy, aby zadowolenie wasze było dwukrotnie większe? A czterokrotnie? Ośmiokrotnie? (Jest to technika skalowania oceny wielkości w jej zastosowaniu do pieniędzy1, omawiana w Dodatku A. Zróbcie ten eksperyment, zanim przejdziecie do dalszego czytania.) [Eksperyment ten był przeprowadzony po raz pierwszy przez Galantera (1962b).] Różni ludzie różnie odpowiadają na te pytania-i to jest naturalne. Dla niektórych względnie biednych ludzi prezent 20 dolarów będzie powodem do radości; na tych zaś, których dochody miesięczne wynoszą 1000 dolarów, nie wywoła większego wrażenia. Innymi słowy, ich ocena sytuacji znacznie się różni. Niemniej jednak wszyscy zgodni są co do tego, że aby podwoić zadowolenie, suma pieniędzy musi zwiększyć się więcej niż dwukrotnie. W rzeczywistości typowa odpowiedź brzmi: suma powinna wzrosnąć czterokrotnie, aby zadowolenie (użyteczność) mogło wzrosnąć dwukrotnie. Oznacza to, że użyteczność pieniądza wydaje się rosnąć z pierwiastkiem kwadratowym ich wartości nominalnej. Nie należy traktować tej zależności zbyt poważnie. Ważne jest, że z tego przykładu wypływa stwierdzenie, iż wartość psychologiczna określonych jednostek, nawet tak dobrze znanych, jak pieniądze, nie rośnie proporcjonalnie do ich nominalnej wielkości. Na ogół biorąc, rośnie znacznie wolniej. Wartość złożonych alternatyw A co się stanie, kiedy będziemy mieli do czynienia z czymś innym, aniżeli z prostą ilościową oceną wartości pieniądza? Jak określić wartość złożonych celów bądź sytuacji? Abstrakcyjna natura problemów czasem lepiej daje się przedstawić za pomocą takiej sytuacji, 530 która nie całkiem ściśle wynika z rzeczywistości; w ten sposób możecie uniknąć wpływu przeszłego doświadczenia w trakcie poszukiwania rozwiązań. Oderwijmy się zatem na moment od rzeczywistości i zajmijmy się opowiastką. Jak wybrać małżonka? W odległym kraju, gdzie kobiety, zgodnie z obyczajem, są władczyniami i sułtanami po dziś dzień, Maga z Kantabary zapragnęła małżonka, którego mogłaby dołączyć do swojej kolekcji. Ponieważ słyszała, jak mówiono o dwu swatach, że są najlepsi w całym kraju, zażądała, aby właśnie oni udali się na poszukiwania nowego małżonka. Opierając się na długiej, naukowo ustalonej tradycji, Maga określiła najważniejsze cechy, jakie powinien posiadać kandydat na męża. Następnie, zgodnie z jej wymaganiami, każdy potencjalny kandydat miał zostać poddany surowej próbie testowej w kilku najważniejszych wymiarach. Każdy miał być poddany ocenie liczbowej w rangach od -5 do plus 5, zależnie od umiejętności i uzdolnień; zero punktów oznaczało średnią, plus 5 nadzwyczajny, -5 całkiem do niczego. Obaj swaci powrócili ze swymi kandydatami, jeden przyprowadził Shara, a drugi Malika. Cena obu była taka sama. Ich indywidualne oceny przedstawione zostały w tabeli 15-1. 531 Tabela 15-1. Ocena przyszłego małżonka Tabelę zamieniono na tekst. W kolejnych wierszach podano, oddzielając średnikami: Cechę podlegającą ocenie; ocenę Shara; ocenę Malika W celu właściwego odczytu liczb przez program Screen Reader, należy ustawić opcję CZYTANIE DOKUMENTÓW na wypowiadanie wszystkich znaków. Umiejętności militarne 2;1 Umiejętności seksualne 5;-1 Umiejętność konwersacji; –2;4 Inteligencja; -4; 3 Osobowość; 4; 3 Atrakcyjność fizyczna; 2; 2 Prestiż rodowy; 3; 1 Opis kandydatów przedstawiony przez swata: SHAR: Mężczyzna z rodu cieszącego się dużym prestiżem. Przyczyni się do reputacji dworu. Przyjemny, o atrakcyjnej powierzchowności, świetny w walce. Posiada bogatą wiedzę i umiejętności w sztuce miłosnej. MALIK: O wybijającej się inteligencji, bardzo przystojny. Atrakcyjny materiał na męża, zwłaszcza ze względu na wysoki poziom umiejętności prowadzenia konwersacji. Pochodzi z dobrego rodu i posiada znaczną wiedzę z zakresu umiejętności wojennych. Strategie decyzyjne. Prześledzenie sytuacji wyboru, w jakiej znalazła się Maga, wykazuje, iż zasadniczy problem polega tu na porównaniu różnych wymiarów. Ale jak ma ona zestawić ze sobą umiejętności seksualne z inteligencją, w końcu są to różne rzeczy. Pierwszy krok do osiągnięcia rozwiązania to upewnienie się, czy wszystkie te wartości mają wspólną skalę. Ważne jest, aby stwierdzić, czy plus3 przyznane Sharowi za prestiż rodowy ma dokładnie tę samą psychologiczną wartość dla Magi, co plus3 przyznane Malikowi za inteligencję. Przyjmijmy jednak, że ten pierwszy problem został rozwiązany i każda z przypisanych na poszczególnych wymiarach ocen jest tak starannie wyważona, że mogą one być porównywane bezpośrednio ze sobą. [Jeden ze sposobów takiego porównania polega na przekształceniu każdej wartości rangowej na jedną skalę, np. skalę monetarną. Przypuśćmy, że jest dwóch kandydatów A i B, którzy są identyczni na wszystkich wymiarach, z wyjątkiem jednego, na którym A oceniony jest wyżej od B. Jak duża różnica w cenie kupna mogłaby wyrównać tę różnicę w ocenach? Załóżmy, że przyszłemu nabywcy zaoferowano kandydata A za określoną cenę, a kandydata B za obniżoną cenę. Jeśli obniżka ta, wynosząca powiedzmy 1.000 $, jest wystarczająca, aby zrównoważyć niższą rangę B na tym jednym wymiarze, to wtedy różnica w tej jednej ocenie ma tę samą psychologiczną wartość, co 1000 $. Poprzez oferowanie kilku takich wyborów dla różnych ocen na różnych wymiarach staje się możliwe wyrażenie ocen na każdym z wymiarów za pomocą powszechnie znanej skali monetarnej.] Pozostaje wciąż problem łączenia różnych wymiarów. Spróbujmy podjąć decyzję: Którego z nich powinna Maga wybrać? Jak Wy poradzilibyście sobie z różnymi ocenami na różnych wymiarach? Podejmując próbę rozwiązania tego problemu, musimy rozpatrzyć dwie całkowicie różne strategie tworzenia kombinacji wartości wielowymiarowych dla obu kandydatów w celu wyboru jednego z nich. Jedną ze strategii określimy mianem ogólnego wrażenia, drugą zaś porównywaniem wymiarów. 532 Ogólne wrażenie. Strategia ta przewiduje oddzielne zbadanie każdego z kandydatów, a pojedyncza wartość cyfrowa stanowi całościową ocenę kandydata. Ta sama procedura stosowana jest w odniesieniu do każdego kandydata, a jeden z nich, ten z najwyższą ogólną użytecznością, zostaje wybrany. Tak więc wartość Shara łącznie wynosi 10. Dla kandydata Malika ta sama procedura daje wynik ogólny 13. Zgodnie z tą strategią decyzyjną Maga powinna zakupić Malika na małżonka. Porównywanie wymiarów. W tej strategii alternatywy są porównywane bezpośrednio, wymiar po wymiarze. Najpierw różnice między alternatywami są oszacowane dla każdego wymiaru. Następnie końcowy sąd opiera się na analizie różnic tych wymiarów. W tym przypadku Shar wygrywa w umiejętnościach wojskowych i seksualnych, przewyższa też Malika w ocenie osobowości i prestiżu rodowego. Wynik tej analizy wymiarów stawia Shara jako zwycięzcę w czterech wymiarach, Malika zaś w dwu, przy jednym wymiarze identycznym dla obu. Prosta reguła decyzyjna polega na wyborze kandydata mającego preferencje w większej liczbie wymiarów: tu Shar będzie zwycięzcą z wynikiem 4 do 2. Ocena strategii. Mamy tu do czynienia z dwiema strategiami, z których każda prowadzi do innego rozwiązania. Co powinna zrobić Maga? To już jej sprawa. Ale co robi większość ludzi, jaką strategię wybiera? Odpowiedź brzmi: obie, raz jedną, raz drugą. Obie strategie, jak się wydaje, są stosowane przez ludzi w różnych sytuacjach. Każda ma zalety i wady. W metodzie ogólnego wrażenia, każda alternatywa jest oceniona odrębnie i następnie suma tych ocen tworzy jedną wartość. Procedura ta jest prawdopodobnie najbardziej dokładna, ale jest ona również trudna do stosowania: oszacowanie danej alternatywy jest względnie trudne. W metodzie porównywania wymiarów, samo porównanie między sobą alternatyw na prostych wymiarach jest względnie łatwe, mimo że wynik jest mniej efektywny. Istnieje skomplikowany związek między złożonością reguły decyzyjnej, jej dokładnością i zdolnością człowieka do dokonania niezbędnej oceny. Tak więc przedstawiliśmy problem podejmowania decyzji w sytuacji, gdy wszystko odbywa się ,,na spokojnie". W normalnych sytuacjach nie jest jednak możliwe takie pełne ocenianie wartości. W istocie, nawet wtedy, gdy efektywnemu biznesmenowi lub pracownikowi administracji państwowej wyższego szczebla uda się przekonać decydentów, żeby poczynili tego typu oceny alternatyw, to zazwyczaj osoba, która musi podjąć decyzję, nie jest z tego w pełni zadowolona. Tak więc, mimo posiadania naukowo uzasadnionej skali ocen dla przyszłego małżonka, Maga najprawdopodobniej odpowie: „Dobrze, wszystko to jest dobre dla dokonania wstępnej selekcji kandydatów, lecz może raczej zostawcie mi każdego z nich po kolei na jeden wieczór, a wtedy zobaczę, jacy są naprawdę". Maga ma całkowitą rację nie wykazując zadowolenia z takiej ściśle określonej listy wartości kandydatów: oczywiście w każdej z tych alternatyw jest coś więcej ponad to, co da się ująć liczbowo. Główną zaletą oceny liczbowej jest to, że pozwala ona na podjęcie racjonalnej decyzji. Nie ulega również wątpliwości, że wiele ważnych subtelności zostaje tu pominiętych. Jednakże, niestety, osobisty kontakt może przynieść marne rezultaty. 533 Trudności związane z porównywaniem dwu złożonych alternatyw nakładają się w tej sytuacji na ograniczenia wynikające z osobistych kontaktów. W osobistym kontakcie nawet najbardziej trywialne wydarzenie może często nabrać znaczenia. Przypuśćmy, że jeden z kandydatów potknie się o dywan lub też ubrany jest w krzykliwe kolory, albo też robi coś innego równie przypadkowego a irytującego: „Ten Malik jest zanadto niezdarny, żeby zostać mężem Magi. Niewątpliwie Shar okazałby się bardziej zręczny". Przeciążenie poznawcze Głównym czynnikiem stanowiącym o zdolności człowieka do podejmowania decyzji albo do wykonania dowolnej pracy umysłowej, takiej jak rozwiązywanie problemów, uczenie się czy myślenie, jest stopień przeciążenia poznawczego w toku tych operacji. Najpoważniejszym czynnikiem ograniczającym jest tu pojemność pamięci krótkotrwałej. W poprzednim rozdziale zwróciliśmy uwagę na związek między stopniem skomplikowania różnych zadań obliczanych w pamięci a liczbą cyfr, które należy przechowywać równocześnie w pamięci krótkotrwałej; i w ten sposób wyjaśniliśmy, że ograniczone możliwości człowieka w zakresie liczenia w pamięci wynikają z ograniczonej pojemności jego pamięci krótkotrwałej. Poważne ograniczenia w zdolności do liczenia nałożone przez pamięć krótkotrwałą u człowieka podejmującego decyzje wpływają na jego sposób podejścia do różnych zadań. Wiele osób sądzi, że mistrzowie szachowi (arcymistrzowie międzynarodowi) posiadają jakiś specjalny, wyższy poziom zdolności umysłowych. W istocie jednak jest inaczej. Po prostu mistrz szachowy zdobył tak szerokie doświadczenie w grze w szachy, że potrafi rozpoznać znaczenie różnorodnych kombinacji figur na szachownicy równie łatwo, jak my rozpoznajemy i określamy znaczenie konfiguracji liter tworzących wyrazy. Łatwo zapamiętujemy wyrazy, a to dlatego, że dany wyraz stanowi jednostkę psychologiczną, niezależnie od długości (liczby liter). W wypadku nonsensownej konfiguracji liter, pamięć nasza zaraz ulega przeciążeniu, ponieważ każda litera przekształca się w samodzielną jednostkę psychologiczną (spróbujcie zapamiętać XPCWPIMSQXKR). Utalentowany szachista posługuje się znanymi mu układami figur, dokładnie tak samo jak my posługujemy się dobrze znanymi wyrazami. Umiejętność wyboru najlepszego z możliwych ruchów, która wydaje się nam niezwykła, można wyjaśnić tym, że szczególna wiedza szachowa pozwala mistrzowi szachowemu na operowanie całymi układami figur jako oddzielnymi jednostkami psychologicznymi. Jeśli przedstawicie szachiście do zanalizowania przypadkowy i bezsensowny z punktu widzenia gry w szachy układ figur na szachownicy, to znika zarówno jego znakomita pamięć, jak i umiejętności analityczne, podobnie jak to się dzieje w przypadku zapamiętywania przez Was liter, które nie tworzą sensownych wyrazów. Analogiczne problemy pojawiają się przed człowiekiem, kiedy ma podjąć decyzję. Chociaż jest w stanie zrozumieć racjonalnie reguły, których trzeba się trzymać przy podejmowaniu decyzji, to śledzenie tych reguł stanowi takie obciążenie jego pamięci, że napotykając realną sytuację najczęściej bardzo je upraszcza. Mówiąc o swym zachowaniu, 534 człowiek opisuje je z zasady jako racjonalne, to znaczy takie, jakie powinno być w danej sytuacji, a nie takie, jakim było w rzeczywistości. Zazwyczaj można jednak zrozumieć, dlaczego właśnie ten czy inny człowiek podjął taką, a nie inną decyzję, i wskazać na to, że u jej podłoża tkwiły logiczne przesłanki nawet wówczas, gdy decyzja, jaką podjął, okazała się nielogiczna. Tak więc, jeśli Maga wybiera jako partnera Shara, ponieważ wydaje się jej bardziej zręczny niż Malik, to musimy uznać, że jest to całkiem logiczna reguła decyzyjna, mimo że możemy zarzucić jej brak konsekwencji. Zostawmy Madze ocenę faktu, że przecież jedno potknięcie nie czyni jeszcze nikogo niezdarą lub, że wysoka inteligencja Malika może rekompensować popełniane przezeń od czasu do czasu niezręczności, bowiem cały problem pojawi się od początku w całej swej złożoności. Poza tym, jeśli ma się oceniać ponownie inteligencję Malika, to dlaczego nie powrócić do oceny osobowości Shara? Co jest przedmiotem optymalizacji? Czy zawsze po ustaleniu wartości decydent wybiera tę alternatywę, która ma dlań największą wartość? Przypuśćmy, że student Bob długo zbierał pieniądze, aby kupić sobie aparat fotograficzny z lustrzanym obiektywem. Pracował studiując równocześnie, a więc nie łatwo przyszło mu zarobić potrzebną sumę. Ma 140 dolarów i za wszystkie pozostałe po zakupieniu aparatu pieniądze zamierza kupić podręczniki potrzebne w następnym semestrze. Pod koniec tygodnia Bob wraz z przyjacielem zrobili wypad do Los Angeles (około 160 km). Bob spodziewał się, że kupi tam odpowiedni aparat w granicach swoich możliwości finansowych. Biegał cały dzień po mieście od jednego do drugiego sklepu z aparatami fotograficznymi. Rano znalazł sklep A, gdzie aparat kosztował 135 dolarów. W południe trafił na sklep B, w którym ten sam aparat kosztował 115 dolarów, a w końcu o 16.00 znalazł się w sklepie C, w którym cena aparatu wynosiła 120 dolarów. Oczywiste, wydawałoby się, że Bob powinien wrócić do sklepu B. Ale jest już głodny i zmęczony. Nic nie jadł przez cały dzień. Niedługo też musi spotkać się z przyjacielem, aby razem wrócić do domu. A zatem pozostaje mu do wyboru albo wrócić do sklepu B i zaoszczędzić 5 dolarów, ale wówczas nie będzie miał czasu na to, żeby coś zjeść, albo też zrobić zakupy w sklepie C, stracić 5 dolarów, spokojnie zjeść i chwilę odpocząć przed podróżą powrotną. Bob najprawdopodobniej wybierze drugi wariant, w ten sposób głód i zmęczenie wezmą górę nad ewentualną stratą 5 dolarów. W danym momencie jest to logiczna decyzja. Nazajutrz jednak bardzo możliwe, że Bob pożałuje swojej decyzji, kiedy już zapomniał o zmęczeniu i głodzie, a uzmysłowił sobie, że te 5 dolarów trzeba będzie zarobić pracując dodatkowo 2 godziny w kafeterii. Kiedy usiłujemy zrozumieć konkretne decyzje podejmowane przez kogoś innego i napotykamy wielkie trudności, ponieważ nie znamy i nie możemy znać wszystkich zmiennych wpływających na daną sytuację decyzyjną. („Tak, wiem, że popełniłem błąd wychodząc tak wcześnie, ale musiałem pójść do łazienki"). Zasada maksymalizacji jak się sądzi, jest podstawą każdej decyzji. Jednakże, kiedy nadchodzi czas dokonywania realnego wyboru, 535 może się okazać, że w danej sytuacji pojawiły się nowe zmienne, a niektóre ze starych nie zostały uwzględnione. A zatem nawet decyzja prowadząca do zupełnie zwariowanego wyboru może być traktowana jako logiczna i rozsądna, jeśli uwzględnione zostaną wszystkie informacje związane z analizą alternatyw. Jawnie nielogiczny wybór decyzyjny może być po prostu wynikiem tego, że w pewnej chwili okazało się, iż psychologiczna wartość wypoczynku lub minimalizacji wysiłku intelektualnego jest warta więcej niż wynik, który można by osiągnąć, gdyby prowadzić dalszą i pełniejszą analizę alternatyw. Właściwości pamięci krótkotrwałej, ograniczające liczbę porównań, jakie mogą być dokonane w określonej jednostce czasu, okazują się często jednym z najważniejszych czynników determinujących aktualny wybór. Nasze podstawowe założenie jest takie, że każda decyzja optymalizuje użyteczność psychologiczną, nawet jeśli ktoś z zewnątrz (a czasem i sam decydent) będzie później "zdziwiony dokonanym wyborem. LOGIKA WYBORU Mało kto zaprzeczy, że procesy decyzyjne powinny być logiczne. Więcej, formalne teorie podejmowania decyzji wywodzą się z tej samej zasady logicznej spójności, jaka powinna obowiązywać przy porównywaniu ze sobą różnych przedmiotów. Jeśli A ma wyższą wartość niż B, a B wyższą wartość niż C, to logicznie rzecz biorąc A powinno mieć wyższą wartość niż C. Przechodniość tego rodzaju jest podstawową cechą myślenia logicznego i możemy ją zaobserwować zawsze, kiedy porównujemy ze sobą jakiekolwiek przedmioty. Niech symbol > (ostry nawias zamykający, albo w matematyce znak większości, zostanie zastąpiony słowem większe) oznacza preferowanie jednego przedmiotu nad inny, a symbol równa się kompletny brak różnicy między dwoma przedmiotami. Wówczas podstawowe reguły logicznego wyboru mogą być przedstawione w następujący sposób: 1. Jeśli A większe B i B większe C, to A większe C. 2. Jeśli A równa się B i B równa się C, to A równa się C. 3. Jeśli A równa się B i C większe 0, to A plus C większe B. Te trzy reguły stanowią racjonalny zespół postulatów dotyczących zachowania decyzyjnego. Jeśli usuniemy oznaczenia matematyczne, to postulaty te będą wyglądały jak wskazówki podszeptywane przez zdrowy rozsądek. Jednakże uczeni badający procesy decyzyjne przekonali się, że istnieje pewna różnica między Tymi regułami, o których ludzie sądzą, że się nimi posługują, a tymi regułami, którymi rzeczywiście się posługują. I chociaż te trzy założenia stanowią jądro większości teorii podejmowania decyzji, to jednak wiadomo, że nie zawsze są one stosowane. Można znaleźć dostatecznie dużo przykładów wskazujących na naruszenie każdej z tych reguł. Specjalista w zakresie teorii decyzji może przyjąć dwojaką postawę wobec tych trudności. Albo ignorować je, zakładając, że naruszenie reguł zachodzi jedynie w niezwykłych okolicznościach, wykraczających poza sytuacje analizowane przez teorię, albo też może włączyć fakty związane z naruszaniem reguł do samej teorii, ukazując równocześnie, w jaki sposób wynikają one z takich czy innych niedostatków człowieka traktowanego jako system przetwarzania informacji. Poniżej przedstawiamy kilka anegdotycznych przykładów naruszenia każdej z trzech podstawowych reguł podejmowania decyzji. 536 Błędne koło: reguła 1 Jeżeli A większe B i B większe C, to A większe C. Przeanalizujmy problem decyzyjny stojący przed studentem, który studiując nauki społeczne ma do wyboru wysłuchanie i zaliczenie jednego z trzech przedmiotów: psychologię, socjologię i antropologię. Przyjmijmy, że system preferencji studenta koncentruje się na trzech cechach: jakości wykładu, oczekiwanej oceny (z uwzględnieniem trudności materiału i wymagań egzaminatora) i osobistym zainteresowaniu przedmiotem. Aby podjąć racjonalną decyzję, ocenia wszystkie przedmioty według tych trzech wymiarów. Przedmiot Psychologia; Jakość wykładu Wysoka; Oczekiwana ocena Niska; Zainteresowanie materiałem Średnie Przedmiot Socjologia; Jakość wykładu Niska; Oczekiwana ocena Średnia; Zainteresowanie materiałem Wysokie Przedmiot Antropologia; Jakość wykładu Średnia; Oczekiwana ocena Wysoka; Zainteresowanie materiałem Niskie Socjologia czy psychologia? Kiedy student przyszedł zapisać się na kursy przedmiotowe, zobaczył długie kolejki chętnych do zapisu. Zmuszony jest szybko podjąć decyzję, aby zdążyć przed zamknięciem list. Przypuśćmy, że zaczął od kolejki na psychologię. Stojąc zaczyna myśleć o swym wyborze między socjologią a psychologią. Jakość wykładu z psychologii jest bardzo wysoka, ale nie oczekuje tu wysokiego stopnia, a i sam przedmiot nie jest dla niego tak bardzo interesujący jak socjologia. A zatem socjologia na dwu z trzech wymiarów oceniana jest wyżej niż psychologia. Tak więc socjologia jest dla niego lepsza od psychologii, ponieważ logiczne reguły podejmowania decyzji prowadzą do wyboru przedmiotu mającego wyższe oceny na większej liczbie wymiarów. Student powinien więc przejść do kolejki zapisujących się na socjologię. Przypuśćmy, że tak właśnie zrobił. Antropologia czy socjologia? Student stoi w kolejce na socjologię. Ale teraz rozmyśla o trzecim przedmiocie, antropologii. Wykłady z tej dziedziny przewyższają socjologię zarówno pod względem jakości, jak i spodziewanej oceny, chociaż są mniej interesujące. Zgodnie z tą samą regułą podejmowania decyzji, student utwierdza się w przekonaniu, że antropologia jest wyraźnie lepsza od socjologii i słusznie będzie przenieść się do trzeciej kolejki. Przypuśćmy, że tak postąpił. Psychologia czy antropologia? Stojąc w kolejce na antropologię nie przestaje jednak myśleć o psychologii. Poza wszystkim, wykładana jest lepiej niż antropologia, a i sam przedmiot też jest bardziej interesujący. A może powinien powrócić do kolejki na psychologię? Przyczyna tego „błędnego koła" w zachowaniu naszego studenta tkwi w braku przechodniości w jego wyborze pomiędzy przedmiotami. Jeżeli oznaczymy antropologię A, socjologię B, a psychologię C, to wyraźnie widać, że preferuje raczej A niż B i B niż C, ale również C niż A: A większe B większe C większe A większe B... Ponadto wszystkie te wahania związane z jego wyborem pojawiają się, mimo że posługuje się on prostą i logiczną regułą w celu dokonywania swoich wyborów. Kiedy musimy uczynić wybór między złożonymi przedmiotami, to podobna sytuacja nie jest rzadka. Problem podjęcia decyzji często wiąże się z analizą większej liczby wymiarów, wyważaniem ich wartości 537 oraz na koniec obraniem odpowiedniej strategii dla porównania różnych ocen. Kiedy przedmioty są złożone, istnieje dość duże prawdopodobieństwo pojawienia się błędnego koła. Znaczenie małych różnic: reguła 2 Jeżeli A równa się B i B równa się C, to A równa się C. Tym razem historyjka dotyczy zakupu nowego samochodu. Kupujący zdecydował się na sportowy wóz, którego cena podstawowa wynosi 3500 dolarów. Sprzedawca ze swej strony proponuje mu wybór wariantu z takim czy innym wyposażeniem dodatkowym - oczywiście za odpowiednią dopłatą. RYSUNEK 15-2 [Rysunek przedstawia dodatkowe elementy wyposażenia samochodu i ich cenę w dolarach. 1 - tylko 72,50 $; 2 - tylko 37,95 $; 3 - tylko 27,00 $; 4 - tylko 50,00 $; 5 - tylko 49,50 $; 6 - tylko 20,00 $; 7 - tylko 92,95 $; 8 - tylko 42,00 $; 9 - tylko 75,00 $.] Klient wybrał czerwony solidny wóz. Oczywiście, pokryte aluminium obręcze kół znacznie poprawiają wygląd samochodu. Sprzedawca skromnie zauważa, że za te obręcze trzeba będzie dopłacić zaledwie 49 dolarów; samochód kosztuje 3500 dolarów, więc ta dodatkowa dopłata jest nieznaczna. Tak jest chyba naprawdę. Kupujący stwierdza, że nie sprawia mu różnicy, czy zapłaci 3500 czy 3549 dolarów za samochód. Tak więc, jeżeli A będzie ceną samochodu, a B ceną samochodu z chromowanymi obręczami kół, to dla kupującego A równa się B. Kontynuujmy rozważania w tym duchu: pokrowiec na tablicę rozdzielczą z pięknej czarnej skóry kosztuje tylko 37 dolarów 95 centów. To konieczne, zwłaszcza gdy dach jest często odsłonięty. Poza tym realnie nie ma różnicy między ceną 3549 dolarów a 3586 dolarów. 538 A zatem, jeżeli B to cena samochodu z chromowanymi osłonami kół, a C równa się B plus cena czarnego pokrowca, to dla kupującego B równa się C. A co z białym pokrowcem na tylne siedzenie? Zanim kupujący zorientuje się, że wszystkie te drobne dopłaty stanowią odczuwalną sumę, łączny koszt samochodu przekroczy już 4000 dolarów. Nie ulega wątpliwości, że różnica między 3500 a 4000 dolarów nie jest już dlań bez znaczenia. Jednakże mając takie doświadczenie, kupujący zaczyna orientować się, że trudno mu się zatrzymać. Klient wie, że całkowicie może się obejść bez obicia wewnątrz bagażnika z imitacji krokodylej skóry, ale byłaby to oszczędność 19 dolarów 95 centów- zupełna błahostka biorąc pod uwagę, że wydał już 4000. Możliwe, że psychologicznie rzecz biorąc jest mu łatwiej zapłacić dodatkowe pieniądze niż precyzować wykaz tych uzupełniających dodatków, bez których mógłby się obyć, i tym samym obniżyć cenę wozu. Zręczny sprzedawca unika oczywiście wymienienia całej skumulowanej ceny z dodatkami. Podkreśla jedynie znikomość ceny każdego dodatku w porównaniu z całą sumą. Jeżeli sprzedawca jest dostatecznie sprytny, to zatrzyma się w porę zanim kupujący zastanowi się poważnie nad tym, czy zawsze z A równa się B, i B równa się C wynika, że A równa się C. 539 Problem Paryż-Tokio: reguła 3 Jeśli A równa się B i C większe 0, to A plus C większe B. Istnieje bardzo popularny przykład ilustrujący sytuację będącą w opozycji do tej reguły, jest on znany zarówno ekonomistom, jak i specjalistom w zakresie teorii podejmowania decyzji. Wygląda to tak. Wygraliście na loterii główną nagrodę - wycieczkę zagraniczną. Możecie sami wybrać trasę podróży: całkowicie bezpłatną wycieczkę do Paryża czy też podobną do Tokio? Przyjmijmy, że jest Wam całkowicie obojętne, gdzie pojedziecie, i możecie rozstrzygnąć problem grając w „orła i reszkę". Oznaczmy psychologiczną wartość podróży do Paryża przez P, a wycieczki do Tokio przez T. Ponieważ jest Wam obojętne, dokąd pojedziecie, ustalamy, że P równa się T. Przypuśćmy, że teraz ktoś zaoferuje wam w prezencie butelkę wina. [W tradycyjnym przykładzie podawanym przez teoretyków decyzji mowa jest o martini, nie o winie. Wy zaś możecie wstawić tu dowolny przedmiot wedle Waszego życzenia, ale musi to być niewielka ilość tego, co jest przez Was pożądane.] Jak odniesiecie się do tej propozycji? Zakładamy, że raczej przyjmiecie prezent, niż z niego zrezygnujecie. Oznacza to, że psychologiczna wartość prezentu (oznaczmy go W) stanowi dla Was wielkość pozytywną: W większe 0. Teraz wyobraźcie sobie, że otrzymacie butelkę wina tylko wówczas, gdy wybierzecie podróż do Paryża. A zatem wycieczka do Paryża powinna mieć wyraźną preferencję w porównaniu z wycieczką do Tokio: przecież P równa się T, a W większe 0, zatem P plus W większe T. Nie godzicie się z tym? Słusznie, logika nie znajduje tu zastosowania. Jakoś butelka wina naprawdę tu „nie pasuje". Nie jest to problem, że wino nie ma wartości. W oderwaniu od tej sprawy większość ludzi woli otrzymać bezpłatnie wino niż go nie dostać. Sprawa polega na tym, że wartość przedmiotu zależy również od kontekstu, w jakim on występuje. W tej sytuacji wino wyraźnie nie ma związku z problemem wyboru. W innej ta sama butelka może okazać się czynnikiem decydującym. PODEJMOWANIE DECYZJI RYZYKOWNYCH W życiu codziennym często się zdarza, że podejmujemy decyzje w sytuacjach niepewnych. Nieraz, aby móc dokonać wyboru, nie wystarczy ocena użyteczności różnych możliwych wyników, ale trzeba starać się przewidzieć rozwój wydarzeń. Wartość decyzji dotyczącej wzięcia na spacer parasola zależy od prawdopodobieństwa deszczu. Pytanie, czy ubezpieczyć się na wypadek śmierci czy też nie, jest ściśle związane z szansą przeżycia jeszcze pewnego określonego odcinka czasu. Wybór strategii politycznej zależy od prawdopodobieństwa zastosowania przez przeciwników pewnych kontrdziałań. To dołączenie czynnika szansy do sytuacji nie zmienia podstawowej zasady optymalizacji, po prostu analizując zachowanie decyzyjne człowieka należy brać pod uwagę zarówno użyteczność, jak i szansę. Użyteczność w sytuacji ryzykownego wyboru 540 Rozważcie zespół następujących alternatyw. Powiedzcie, co wolicie: 1. Całkowicie pewne 0,10 dolara czy jedną na dziesięć szansę uzyskania 1 dolara? 2. Całkowicie pewnego 1 dolara czy jedną na dziesięć szansę uzyskania 10 dolarów? 3. Całkowicie pewnych 10 dolarów czy jedną na dziesięć szansę uzyskania 100 dolarów? 4. Całkowicie pewnych 100 dolarów czy jedną na dziesięć szansę uzyskania 1000 dolarów? 5. Całkowicie pewnych 1000 dolarów czy jedną na dziesięć szansę uzyskania 10000 dolarów? 6. Całkowicie pewny milion dolarów czy też jedną na dziesięć szansę uzyskania 10 milionów dolarów? (według Markowita, 1952, s. 150). Pozwolimy sobie wysunąć dwa przypuszczenia dotyczące Waszych preferencji tej sytuacji. Po pierwsze, nie jest Wam wszystko jedno, który z wariantów wybrać. W wypadku na przykład wyboru 1 preferujecie prawdopodobnie raczej szansę wygrania 1 dolara niż pewne 10 centów. Podobnie uczynicie w wypadku propozycji wygrania 10 dolarów, które wolicie od 1 pewnego dolara, być może, jeszcze będziecie preferować szansę wygrania 100 dolarów nad pewne 10. Ale od jakiegoś momentu sytuacja ulegnie zmianie i zaczniecie preferować pewne pieniądze niż nadzieję na szczęśliwy przypadek. Prawdopodobnie jedynie zwolennik silnych wrażeń związanych z ryzykiem nie przyjmie 1000000 dolarów, mając nadzieję na 10 procent prawdopodobieństwa wygrania 10000000 dolarów. Drugie przypuszczenie wiąże się z tym, że moment, w którym człowiek przestaje „iść na ryzyko" i woli otrzymać pewne pieniądze, zależy od jego sytuacji materialnej. Im jest "bogatszy, tym chętniej będzie ryzykował dla wygrania odpowiednio wysokiej stawki. W sytuacjach ekstremalnych można nawet preferować monetę 10-centową nad szansę wygrania 1 dolara. Podobny eksperyment można łatwo przeprowadzić z przyjaciółmi. Wybierzcie kilku znajomych, w miarę możliwości o zróżnicowanych dochodach; zacznijcie od pierwszego wyboru i posuwajcie się w dół listy; następnie zaznaczcie, w jakim momencie każdy z nich wybierze pewne pieniądze, a nie podejmie ryzyka. Przekonacie się, że im bardziej zasobny jest człowiek, tym później następuje przestawienie się. Przejście od ryzyka do pewności następuje wówczas, gdy użyteczność pieniędzy zaczyna rosnąć wolniej niż ich wartość nominalna. Jeśli pewnych 100 dolarów przedkłada się nad 10 procent prawdopodobieństwa zdobycia 1000 dolarów, oznacza to, że użyteczność 1000 dolarów jest mniejsza niż dziesięć razy 100 dolarów. Jest to typowy przykład podejmowania decyzji w sytuacji ryzykownej. Kiedy wyniki są niepewne, należy brać pod uwagę zarówno prawdopodobieństwo, jak i użyteczność. Aby wprowadzić porządek, musimy dodać dwa nowe pojęcia do naszych rozważań: prawdopodobieństwo oraz oczekiwana wartość. Prawdopodobieństwo Prawdopodobieństwo jakiegoś zdarzenia to po prostu jego względna częstość pojawienia się w długim ciągu oczekiwań. Wartości prawdopodobieństwa układają się liczbowo między zerem a jednością. 541 Jeżeli prawdopodobieństwo jakiegoś zdarzenia jest równe zeru, to można z pewnością stwierdzić, że nigdy ono nie nastąpi. Prawdopodobieństwo tego, że przy jednym rzuceniu monetą wypadnie i orzeł, i reszka, jest równe zeru. W odniesieniu do zdarzeń, których prawdopodobieństwo wynosi jeden, wiemy z całą pewnością, co nastąpi: jeśli wszyscy ludzie są śmiertelni, to prawdopodobieństwo śmierci dowolnego człowieka równe jest jedności. Jest do pomyślenia, że w przyszłości prawdopodobieństwo to ulegnie zmianie. Podobnie jest możliwe, że nastąpi zdarzenie o prawdopodobieństwie zerowym. Po prostu nie jest ono oczekiwane. Kiedy przypisujemy pośrednie wartości prawdopodobieństwu, oznacza to, że wystąpienie określonego zdarzenia przewidywane jest w określonym procencie (w przedziale między 0 a 1) przypadków przy długiej serii prób. Zdarzenie, którego prawdopodobieństwo wynosi 0,28, wystąpi w 28 procentach przypadków podczas długotrwałej serii obserwacji. Orzeł powinien pojawić się w przybliżeniu w 50 procentach rzutów monetą przy odpowiednio dużej liczbie prób. Nie oznacza to jednak, że dokładnie wiemy, ile razy wystąpi dane zjawisko. Znaczy to wyłącznie tyle że, mówiąc językiem statystyki, oczekuje się, iż zdarzenie zajdzie z określoną częstością. Teoria prawdopodobieństwa stanowi aparat matematyczny pozwalający na określenie stopnia prawdopodobieństwa, z jakim można oczekiwać wystąpienia takich czy innych zdarzeń albo też całej kombinacji zdarzeń. Często można obliczyć prawdopodobieństwo zdarzeń, analizując cechy fizyczne urządzeń, które są ich źródłem. Fakt, że kostka do gry ma sześć boków symetrycznych w stosunku do jej środka ciężkości, powoduje, iż prawdopodobieństwo pokazania się jednego z boków wynosi średnio jedna szósta. Czasami istota mechanizmów fizycznych powodujących dane zdarzenie nie jest nam znana; w takich wypadkach prawdopodobieństwo pojawienia się danego zjawiska określone jest dzięki długotrwałej obserwacji jego względnej częstości występowania w przeszłości. Jeśli mówi się ó tym, że prawdopodobieństwo opadu deszczu w Kalifornii wynosi na dany dzień 0,01, to liczba ta stanowi ocenę wynikającą z wieloletnich obserwacji meteorologicznych. Wszystko to dotyczy pojęcia prawdopodobieństwa obiektywnego, wynikającego z właściwości fizycznych danej sytuacji. Jak zobaczycie za chwilę, nie zawsze musi ono pokrywać się z konkretną subiektywną oceną przez daną jednostkę prawdopodobieństwa wystąpienia takiego czy innego zdarzenia. Oczekiwana wartość W przypadkach, kiedy wyniki mają charakter probabilistyczny, teoria podejmowania decyzji przewiduje, że racjonalny decydent maksymalizuje na dłuższą metę oczekiwane zyski. Zarówno prawdopodobieństwo samego zdarzenia, jak i jego wartość muszą być brane pod uwagę w wyborze optymalnego sposobu działania. Prosta gra hazardowa ilustruje podstawowe zasady łączenia obu tych aspektów w sytuacji decyzyjnej. Przypuśćmy, że nadarzyła się Wam okazja do wzięcia udziału w następującej grze. Zostaje rzucona moneta. Jeżeli wypadnie orzeł, otrzymujecie 10 dolarów. Jeżeli wypadnie reszka, płacicie 5 dolarów. Czy warto zagrać? 542 Oczekiwana wartość wygranej w tej grze to po prostu suma algebraiczna wygranych i przegranych po dłuższym okresie gry. Obliczenia są bardzo proste. Oba zdarzenia możliwe w danej sytuacji mają równe prawdopodobieństwo. Szansa pojawienia się orła czy też reszki jest jednakowa. Prawdopodobieństwo pojawienia się orła jest równe 0,5 [p (orzeł) równa się 0,5], a wartość tego zdarzenia wynosi 10 dolarów [V (orzeł) równa się 10 dolarów]. Kiedy wypada reszka, wartość przegranej jest równa 5 dolarów [V(reszka) równa się minus 5 dolarów]. Z prostego połączenia tych wartości i prawdopodobieństw możemy uzyskać całą oczekiwaną wartość (EV) dla tej gry. EV równa się [V(orzeł) razy p(orzeł)] plus [V(reszka) razy p(reszka)]. EV równa się 10 dolarów razy 0,5 plus (minus 5 dolarów) razy 0,5 EV równa się 2,5 dolara. Tak oto w trakcie dłużej trwającej gry powinniście wygrać średnio 2,5 dolara w każdym rzucie. Po wykonaniu 1000 rzutów będziecie mieli zatem około 2500 dolarów. Oczekiwaną wartość można obliczyć dla każdej dowolnej sytuacji w wypadku, gdy możemy przypisać prawdopodobieństwo każdemu z możliwych wyników. Aby podjąć decyzję optymalną, należy wybrać taką strategię działania, która doprowadzi do uzyskania najwyższej oczekiwanej wartości. Nie znaczy to oczywiście, że w każdej próbie zawsze będziecie wygrywać. Znaczy to tylko, że przy wielokrotnym powtarzaniu strategii optymalnej, prowadzącej do uzyskania najwyższej oczekiwanej wartości, możecie uzyskać po pewnym, dłuższym czasie łączną wygraną maksymalną. Chociaż obliczenie oczekiwanej wartości zapewnia wybór optymalnej decyzji, mało kto rozumie tę procedurę albo też rozumiejąc ją zadaje sobie trud przeprowadzenia niezbędnych obliczeń przed podjęciem decyzji. (Ale możecie być pewni, że właściciele kasyn gry, towarzystwa ubezpieczeniowe oraz inni zajmujący się zbliżoną branżą odnoszą się do niej z pełnym szacunkiem i uznaniem.) Zastanówmy się teraz nad tym, jak zachowuje się w podobnej sytuacji przeciętny człowiek. Prawdopodobieństwo subiektywne Jeśli rzucacie jednocześnie dwie kości to, jak sądzicie, na ile prawdopodobne jest wyrzucenie 7 punktów? Urządzenia takie jak dwie kości nie mają pamięci, a każda kość jest całkowicie niezależna od drugiej (mamy na myśli czystą grę i nie sfałszowane kości). Jest możliwe, że uprzednio 7 punktów wyrzucane było 100 razy pod rząd, a może nie zdarzyło się ani razu; nie ma to najmniejszego znaczenia, same kości nie mogą przecież o tym wiedzieć. Jednakże gracz często gotów jest założyć się, że w następnym rzucie wyjdzie 7 punktów: „Dlatego, że w ostatnich 100 rzutach 7 punktów nie było, to teraz, zgodnie z regułą prawdopodobieństwa, muszą się pojawić". Reaguje on na swe subiektywne poczucie prawdopodobieństwa, a nie na realną sytuację. Kości, monety i inne podobne rzeczy nie mogą pamiętać tego, co zdarzyło się wcześniej, a zatem rozkład prawdopodobieństwa różnych możliwych zdarzeń 543 jest zawsze ten sam w każdym rzucie, niezależnie od wyników uzyskanych wcześniej. Ocenę aktualnego obiektywnego prawdopodobieństwa poprzez subiektywną percepcje szans wystąpienia takiego lub innego zdarzenia nazywamy prawdopodobieństwem subiektywnym. Reprezentatywność i dostępność Często bywa tak, że dla człowieka subiektywne prawdopodobieństwo wystąpienia danego zdarzenia jest następstwem własnej oceny tego, na ile jest ono typowe dla procesu będącego podstawą jego pojawienia się. [Pomysł, aby opisywać reprezentatywność zdarzeń w podejmowaniu decyzji w postaci tworzonych w umyśle scenariuszy możliwych wyników, pojawił się w pracach Daniela Kahnemana i Amosa Tversky'ego z Hebrajskiego Uniwersytetu w Jerozolimie.] Przypuśćmy, że sporządziliśmy spis wszystkich rodzin w Kalifornii, które mają po sześcioro dzieci. Zauważyliśmy, że około jedna trzecia tych rodzin ma trzech synów i trzy córki. Przypuśćmy następnie, że interesuje nas kolejność pojawienia się chłopców i dziewcząt w takich rodzinach. Jaka kolejność według Was jest bardziej prawdopodobna: a: D Ch Ch D Ch D b: Ch Ch Ch D D D Kiedy myślimy o przypadkowej kolejności, to zazwyczaj wyobrażamy ją sobie jako „coś pomieszanego". Najwyraźniej pierwszy przykład (a) bardziej odpowiada wyobrażeniu o przypadkowej kolejności pojawiania się dzieci i większości ludzi wydaje się on bardziej prawdopodobny. Inaczej mówiąc, prawdopodobieństwo subiektywne sekwencji a jest znacznie wyższe od prawdopodobieństwa subiektywnego sekwencji b. W rzeczywistości natomiast obie sekwencje są równie prawdopodobne. W wypadku rodziny mającej 3 synów i 3 córki istnieje 20 możliwych kolejności narodzin synów i córek, przy czym wszystkie te warianty są równie prawdopodobne. A jednak sekwencja a wydaje się bardziej odpowiadać wyobrażeniom przez ludzi czystego przypadku niż sekwencja b. Ludzie rozumują następująco: skąd by się wziął taki uporządkowany układ, skoro proces jest przypadkowy? Problem w istocie jest bardzo prosty. Ludzie najwyraźniej traktują jako podobne tak różne sekwencje, jak: a: D Ch Ch D Ch D c: D Ch D Ch Ch D d: Ch D Ch D D Ch e: Ch D D Ch D Ch 544 Mogą więc wyobrazić sobie wiele różnych sposobów dojścia do sekwencji „w rodzaju" a, c, d lub e (dokładnie 18), ale tylko dwa sposoby uzyskania sekwencji „w rodzaju" b (Ch Ch Ch D D D, i D D D Ch Ch Ch). Oczywiście pytanie postawione było inaczej: porównywane były tylko dwie ściśle określone sekwencje a i b, nie zaś inne podobne. Niemniej jednak jest to pouczająca lekcja: ludzie oczekują tego, że w życiu urzeczywistniają się typowe (reprezentatywne) wzorce. Drugi, pokrewny sposób określania subiektywnego prawdopodobieństwa wystąpienia zdarzenia polega na rozważeniu wszystkich przykładów, jakie tylko możemy sobie przypomnieć. Im zdarzenie jest „dostępniejsze" w pamięci, tym bardziej uważamy je za prawdopodobne. Zastanówmy się na przykład nad tym, jakich wyrazów jest więcej w języku angielskim: a: wyrazów zaczynających się na literę k; b: wyrazów, w których k jest trzecią literą. Jeśli podacie wszystkie wyrazy, które Wam przyjdą na myśl, a które by odpowiadały warunkom a lub b, to okaże się, że te pierwsze można znaleźć znacznie łatwiej niż drugie. A zatem większość ludzi będzie oceniała możliwość a jako znacznie bardziej prawdopodobną niż możliwość b. W rzeczywistości wyrazów z ,,k" jako trzecią literą jest w języku angielskim trzy razy więcej niż wyrazów zaczynających się od tej litery. Problem polega na tym, że organizacja ludzkiej pamięci sprzyja poszukiwaniu słów według pierwszej litery (lub początkowego dźwięku), ale nie ułatwia poszukiwań środkowych liter. Ocena oparta na „dostępności" zniekształca szacunek subiektywnego prawdopodobieństwa. Jeśli zostaniecie zapytani o to, czy wykładowcy matematyki są dobrzy czy źli, będziecie opierać się w swej odpowiedzi na własnych wspomnieniach, chociaż mogliście znać jedynie znikomą część z tych tysięcy wykładowców matematyki działających w całym kraju. To wyjaśnienie zależności między ocenami subiektywnego prawdopodobieństwa z jednej strony a reprezentatywnością próbki i dostępnością zdarzeń w pamięci z drugiej strony prowadzi często do sformułowania trzech ogólnych postulatów dotyczących subiektywnego prawdopodobieństwa. 1. Ludzie zdradzają skłonność do przeceniania występowania zdarzeń mających niskie prawdopodobieństwo i niedoceniania pojawienia się zdarzeń mających duże prawdopodobieństwo. 2. Ludzie skłonni są podzielić błędny punkt widzenia graczy przewidujących, że zdarzenie, które nie wystąpiło przez dłuższy czas, ma większe prawdopodobieństwo wystąpienia w najbliższej przyszłości. 3. Ludzie zdradzają skłonność do przeceniania rzeczywistego prawdopodobieństwa tych zdarzeń, które są dla nich pomyślne, i niedoceniania tych, które są niepomyślne. 545 Subiektywnie oczekiwana użyteczność Mimo niepewności realnych zdarzeń życiowych, należy jednak działać tak, aby uwzględniając prawdopodobieństwo subiektywne oraz użyteczność można było w efekcie końcowym maksymalizować oczekiwany zysk. W tym celu należy połączyć subiektywne prawdopodobieństwo zdarzenia z oceną jego użyteczności i posługując się tą oceną dokonać wyboru, który maksymalizuje oczekiwany na dłuższą metę zysk. Połączenie subiektywnego prawdopodobieństwa z użytecznością nazywane jest subiektywnie oczekiwaną użytecznością (subjective expected utility-SEU) danego zdarzenia. Wzór na obliczenie SEU jest analogiczny do wzoru obliczania oczekiwanej wartości, z tym że w miejscu obiektywnego prawdopodobieństwa (p) pojawia się subiektywne prawdopodobieństwo (sp), a zamiast wartości (V) pojawia się użyteczność (U). Jeśli więc zdarzenie E może doprowadzić do wyniku A z subiektywnym prawdopodobieństwem równym sp (A) lub do wyniku B, mającego prawdopodobieństwo subiektywne sp (B), to SEU (E) równa się [U(A) razy sp(A)] plus [U(B) razy sp(B)] Tak jak przy obliczeniach oczekiwanej wartości, tak również i tu mało kto zajmuje się tymi rachunkami przed podjęciem decyzji. Co zaś dzieje się w istocie? Jedna z możliwości polega na wytwarzaniu przez ludzi wyimaginowanych scenariuszy zdarzeń z możliwymi konsekwencjami każdej alternatywnej decyzji, a następnie na wyborze scenariusza najbardziej atrakcyjnego. Jednak w rzeczywistości konstrukcja scenariusza ściśle wiąże się z ogólną oceną subiektywnie oczekiwanej użyteczności. Pomimo to, wyobrażając sobie możliwe konsekwencje każdego zdarzenia, trzeba tak czy inaczej połączyć jego użyteczność z subiektywnym prawdopodobieństwem jego pojawienia się, chociaż taka ocena SEU nie będzie ściśle odpowiadała wyżej zaprezentowanym obliczeniom dokonywanym wedle wzoru. Weźmy dla przykładu lekarza, który zamierza przepisać choremu lekarstwo. Może wybrać jedno z dwu lekarstw A lub B, każde z nich ma swoje plusy, każde też ma pewne działania uboczne. Zasadniczo lekarz powinien porównać SEU lekarstwa A z SEU lekarstwa B i wybrać to, dla którego uzyska większą wartość SEU. Jednakże odwoła się on w swej analizie przede wszystkim do własnego doświadczenia w zakresie stosowania tych medykamentów. Może przypomnieć sobie, że lekarstwo A wywołało u jednej pacjentki silne bóle głowy, jednak „w wielu przypadkach" nie było żadnych skarg. Jeśli chodzi o lekarstwo B, to wywołało ono wysypkę u jednego z pacjentów, który skarżył się na nią przez dwa tygodnie. Może jednak okazać się, że w istocie .„wiele przypadków", które lekarz sobie przypomina dla leku A, to raptem 15, z tego trzej chorzy odeszli nie kontaktując się z nim ponownie, a u czterech wystąpił ból głowy, lecz pacjenci nie skarżyli się, uważając, że jest to „normalne". W przypadku leku B jest całkiem możliwe, że pojawienie się wysypki u nieprzyjemnego pacjenta było jedynym na 50 pacjentów przypadkiem wystąpienia skutków ubocznych. Niemniej jednak ten właśnie przypadek utrwalił się najsilniej w pamięci lekarza. 546 Tak więc ten scenariusz przeważa i lekarz wybiera lek A. Prawidłowy wybór należy obliczyć w następujący sposób. SEU(lek A) równa się [U(wyleczenie) razy sp(wyleczenie] plus [U(ból głowy) razy sp(ból głowy)]; SEU(lek B) równa się [U(wyleczenie) razy sp(wyleczenie)] plus [U(wysypka) razy sp(wysypka)]. Załóżmy, że oba lekarstwa prowadzą do wyleczenia pacjenta. Dla leku A prawdopodobieństwo działania ubocznego przejawiającego się bólem głowy wynosi pięć piętnastych lub jedna trzecia. Dla leku B prawdopodobieństwo wysypki wynosi jedna pięćdziesiąta. Jednak na myśl o tym, że trzeba zapisać lek B, lekarz przypomina sobie uciążliwe rozmowy z nieprzyjemnym pacjentem z wysypką. W efekcie dla tego lekarza, SEU (B) mniejsze SEU (A). GROMADZENIE DOWODÓW W większości wypadków zaczynamy od wysunięcia pewnych hipotez wyjściowych dotyczących tego, co ma się zdarzyć. Mamy jakieś przeczucia lub też intuicje dotyczące tego, jakie jest prawdopodobieństwo, że przyjaciel zgodzi się na proponowany przez nas interes, akcje pójdą w górę albo też uda się nam sprzedać używaną rzecz za całkiem godziwe pieniądze. Jednakże przed podjęciem ostatecznej decyzji możemy zgromadzić dodatkowe informacje które pozwoliłyby zwiększyć szansę dokonania prawidłowego wyboru. W tym paragrafie zastanowimy się nad tym, jak najlepiej wykorzystać zgromadzone dowody, żeby dokładnie ocenić prawdopodobieństwo tego czy innego wyniku. Jak zawsze rozpoczniemy od omówienia idealnej procedury gromadzenia dowodów. Procedura ta jest całkiem sensowna i chyba oddaje ducha tego, co człowiek czyni w podobnej sytuacji. Wątpliwe jest, żeby ludzie zawsze dokonywali obliczeń, które tu prezentujemy, ale wydaje się oczywiste, że obliczenia te oddają istotę rzeczywistego zachowania. Szanse U podłoża wszystkich teorii dynamicznego wyboru leży jedno twierdzenie teorii prawdopodobieństwa wyrażone po raz pierwszy w 1736 r. przez ks. Thomasa Bayesa. Twierdzenie Bayesa służące do określenia prawdopodobieństwa prawdziwości danej hipotezy można łatwiej zrozumieć po zapoznaniu się z jego modyfikacją, czyli tzw. formułą stosunku szans a priori do prawdopodobieństwa a posteriori, albo też prościej, formułą obliczania szans. Przez słowo szanse rozumiemy prawdopodobieństwo tego, że nastąpi raczej to a nie inne zdarzenie. Przede wszystkim należy określić, jakie będą dwie możliwe alternatywne hipotezy. 547 Przypuśćmy, że kolega, znany oszust, starannie spreparował monetę, tak że w 70 procentach rzutów wypada orzeł. Kiedyś zajrzawszy do jego pokoju zobaczyłeś, że gra z kimś w orła i reszkę. Jesteś ciekaw, jaką monetą posługuje się kolega, spreparowaną (prawdopodobieństwo wypadnięcia orła równe 0,7) czy też normalną (prawdopodobieństwo, że wypadnie orzeł równa się 0,5). Zwracasz się do drugiego gracza szepcząc: „Stawiam trzy do jednego, że moneta nie jest w porządku", a następnie uważnie śledzisz wyniki rzutów. Stwierdzenie „trzy do jednego" - to wyjściowa ocena szans dokonana przed uzyskaniem danych rzeczywistych. Ta wyjściowa ocena szans nazywana jest szansami a priori. W tym wypadku zakładasz, że kolega w 3 przypadkach na 4 posługuje się spreparowaną monetą. Przejście od szans do prawdopodobieństwa jest całkiem proste, ponieważ po prostu wyrażają one w różny sposób ten sam fakt. Jeżeli szanse zdarzenia A i szanse zdarzenia M mają się tak jak a do m, oznacza to, że na każde m przypadków pojawienia się zdarzenia M wypada a przypadków pojawienia się interesującego nas zdarzenia A. Wynika stąd, że prawdopodobieństwo zdarzenia A równe jest ilorazowi a i (a plus m). Szanse trzy do jednego na korzyść jakiegoś zdarzenia oznaczają, że prawdopodobieństwo jego pojawienia się jest równe 0,75. Reasumując: jeśli zdarzenia A i M mają szanse jak a do m: to prawdopodobieństwo dla A P (A) równa się a podzielić przez (a plus m) prawdopodobieństwo dla M: p(M) równa się m podzielić przez (a plus m) Z kolei szanse zdarzenia A do zdarzenia M, czyli szanse (A, M) przedstawia następujący wzór: szanse (A, M) równa się iloraz p(A) i p(M) Testowanie raka Aby zobaczyć, jak opisane powyżej szanse są wykorzystane i modyfikowane w miarę gromadzenia rzeczywistych danych, przeanalizujmy los dwu osób, pana A, który był chorowity, i pana Z, który cieszył się dobrym zdrowiem. Obaj rozważają możliwość zachorowania na raka. Pan A to hipochondryk; zawsze zaniepokojony o stan swego zdrowia. A w dodatku przeczytał właśnie gazetę „Sunday", gdzie w części naukowej dowiedział się o przypadkach niewykrytego raka i jest poważnie zatroskany o swoje zdrowie. Przypuszcza, że istnieje co najmniej 1 szansa na 5, że ma raka. Tak więc dla pana A p(rak) równa się 0,2. 548 Pan Z cieszy się dobrym zdrowiem, nigdy w życiu nie chorował. Jest krzepki, nie myśli o chorobach, a prawdopodobieństwo zachorowania na raka ocenia dla siebie jak 1 do 10 tysięcy. Dla pana Z, p(rak) równa się 0,0001. Pan A: szanse równa się 0,25 Pan Z: szanse równa się 0,0001 Dowody. A teraz przypuśćmy, że A i Z zostali poddani normalnym badaniom medycznym, włącznie z testem raka. Rezultat byt niewesoły, u obu test dał wyniki pozytywne. Następny krok polega na tym, jak potraktują oni uzyskane dane z testu raka. Problemem jest to, jak posłużyć się tymi nowymi informacjami, aby zmodyfikować oceniane a priori szanse posiadania tej choroby. Główna sprawa polega na sprawdzeniu wartości nowych informacji. Zgodnie z teorią Bayesa, wartość faktów zależy od prawdopodobieństwa ich wystąpienia, przy założeniu, że każda z przyjętych hipotez jest prawdziwa, a ściślej: jakie jest prawdopodobieństwo uzyskania pozytywnego wyniku testu raka, kiedy jesteśmy rzeczywiście chorzy na raka, jakie jest prawdopodobieństwo uzyskania wyniku pozytywnego, kiedy jesteśmy zdrowi. Warunkowe prawdopodobieństwo tych obu sytuacji wyraża stosunek prawdopodobieństw.[ Należy czytać pionową kreskę jako „przy danym". Tak więc p (test pozytywny kreska pionowa rak) należy czytać: ..prawdopodobieństwo pozytywnego wyniku testu, przy danym fakcie, że rzeczywiście jest rak".] p(test pozytywny | rak) dzielimy przez p(test pozytywny | nie ma raka) Test raka, jak i szereg innych testów medycznych, nie jest narzędziem doskonałym. Nie zawsze udaje się wykryć raka, i odwrotnie - wynik pozytywny można uzyskać nie będąc chorym na raka. Załóżmy, że w badaniu raka mogą wystąpić następujące prawdopodobieństwa: jeżeli badany jest chory na raka, prawdopodobieństwo pozytywnego wyniku testu wynosi 0,9, a w wypadku, gdy jest zdrów 0,05 p(test pozytywny | rak) równa się 0,9; p(test pozytywny | nie rak) równa się 0,05. A zatem będziemy mieli następujące stosunki prawdopodobieństw: 549 stosunek prawdopodobieństw (rak) równa się 0,9 podzielić przez 0,005 równa się 180. Względne szanse uzyskania pozytywnego wyniku testu przy chorobie na raka wynoszą 180 do 1. Ostatnim krokiem jest połączenie wcześniejszych oczekiwań z faktami rzeczywistymi, aby odpowiedzieć na pytanie: jakie jest prawdopodobieństwo raka, jeśli mamy i początkowe oczekiwania i wyniki testu? Zgodnie z twierdzeniem Bayesa, jest to sprawa prosta: nowe szanse równa się stosunek prawdopodobieństw razy początkowe szanse. Podstawiając dane otrzymujemy: Dla Pana A (chorowitego): nowe szanse równa się 180 razy 0,25 równa się 45 (45 do 1). Dla Pana Z (zdrowego): nowe szanse równa się 180 razy 0,0001 równa się 0,018 (około 1 do 50). Mamy zatem ciekawą sytuację. Na podstawie wyników testu A jest całkowicie przekonany o tym, że ma raka. Szanse za rakiem są 45 do 1 (odpowiednio subiektywne prawdopodobieństwo raka wynosi czterdzieści pięć czterdziestych szóstych równa się 0,98). Ale Z jest nadal nastawiony sceptycznie. Według jego nowej oceny szanse na to, że nie ma raka, wynoszą 50 do l, a subiektywne prawdopodobieństwo tego, że jest chory równa się jednej pięćdziesiątej pierwszej, to znaczy 0,02. Obaj uzyskali te same dane. Jedyna różnica między nimi polega na ich różnych początkowych ocenach swoich szans zachorowania na raka. Zgodnie z tą strategią postępowania z uzyskanymi danymi, zebrana informacja wykorzystywana jest do zmiany wyjściowych oczekiwań warunkowego prawdopodobieństwa wystąpienia zdarzeń, na nowy szacunek tych prawdopodobieństw. Stopień zmiany w ocenie zależy od jakości danych, czyli stosunku prawdopodobieństw. Wniosek końcowy jest wynikiem połączenia wyjściowych oczekiwań i uzyskanych danych. Nietrudno zrozumieć praktyczny sens tych obliczeń. Mówią nam one o tym, że nasze oczekiwania są dość powoli modyfikowane przez doświadczenie. Każda porcja rzeczywistych danych może nieco zmodyfikować nasze poglądy w takim czy innym kierunku. Jeśli przejawiamy lekką skłonność do hipochondrii, to może się zdarzyć, że najdrobniejsze dowody utwierdzą nas w przekonaniu, że jesteśmy rzeczywiście chorzy na raka, ponieważ nasza ocena wyjściowa prawdopodobieństwa zachorowania na raka była wysoka. Czy wierzycie w ESP? (spostrzeganie pozazmysłowe - przyp. tłum.). Dla ludzi chociaż trochę wierzących w ESP wystarczą bardzo słabe dowody, aby ich utwierdzić we własnym przekonaniu. Natomiast, aby przekonać tych, którzy odnoszą się do tych spraw sceptycznie, potrzebna jest cała góra niezbitych dowodów zanim ich ocena wyjściowa 550 ulegnie zmianom na tyle, aby chcieli poważnie podejść do tych zjawisk. Analogicznie tych, którzy od początku wierzą w coś takiego, trudno jest przekonać, że jest inaczej. Zdarza się, że obserwacje empiryczne (inaczej mówiąc, prawda) zdołają przełamać nawet najsilniejsze uprzedzenie (wyjściowe szanse). Jednak w wypadku silnych uprzedzeń potrzeba na to, niestety, bardzo dużo czasu. EFEKTY NASTĘPCZE PODEJMOWANIA DECYZJI Co następuje po tym, kiedy już decyzja została podjęta i właściwa czynność wykonana? Czy decydent odczuwa pewien niepokój w związku z dokonanym wyborem? Czy żałuje swojej decyzji? Czy też jest całkowicie przekonany o tym, że wybrał właściwą alternatywę? Pytania te są stałym przedmiotem badań wielu psychologów społecznych, którzy próbują określić efekty następcze procesu podejmowania decyzji. Największa grupa psychologicznych teorii zachowania człowieka występuje pod wspólną nazwą - teorii zgodności (Consistency Theory). Termin ten łączy w rzeczywistości dość różnorodne punkty widzenia, ale wszystkie je łączy wspólny pogląd dotyczący procesów poznawczych człowieka: mianowicie sprowadza się on do tego, że człowiek dąży do zgodności w swoich myślach i działaniach. Jeżeli pewne aspekty jego myślenia lub działania są sprzeczne z jakimiś innymi aspektami, to wówczas pojawiają się: stan napięcia, konflikt, brak równowagi czy też dysonans, które to stany muszą ulec redukcji. Różne rodzaje teorii zgodności obejmują różnorodne aspekty tego zagadnienia albo też przedstawiają odmienne sposoby rozwiązywania konfliktu; wszystkie jednak wychodzą ze wspólnej zasady: jednostka normalna dąży do minimalizacji lub eliminacji konfliktów poznawczych. Racjonalizacja Dla ilustracji tej zasady spróbujcie prześledzić sposób myślenia jakiegoś fikcyjnego decydenta, powiedzmy MDM. Poszukuje on używanego samochodu, a w końcu odrzucając mniej atrakcyjne warianty wybrał dwa: Samochód A: model sportowy, dość starej marki, ogólnie w dobrym stanie, ale z bardzo złymi oponami; Samochód B: nowszy model typu sedan ze znakomitym silnikiem i dość dobrymi oponami, ale z wgnieceniami i zadrapaniami na karoserii. Nasz kupujący wypisał na kartce wszystkie pozytywy i negatywy obu aut, starając się podjąć decyzję, które z nich bardziej mu odpowiada. Okazało się jednak, że wszystkie za i przeciw w obu wypadkach równoważą się. W takich warunkach wybór między dwoma samochodami jest rzeczywiście trudny, niezależnie od tego, jaką zastosuje się strategię. 551 Przypuśćmy, że kupujący podjął w końcu decyzję: kupuje samochód B. Ale w następstwie jego decyzji natychmiast powstaje sytuacja konfliktowa czy też dysonans. Problem polega na tym, że chociaż kupujący wybrał wóz B, bezpośrednio przed tym zakończył jednak dokładną analizę i doszedł do wniosku, że oba samochody są w sumie mniej więcej tyle samo warte. Dlatego wybór był trudny-kupujący zaczyna żałować podjętej decyzji: „Być może, lepiej byłoby wybrać samochód A-wyglądał znacznie lepiej...".Nastąpił okres żalu podecyzyjnego, który towarzyszy trudnym decyzjom. Lekarstwem na tę chorobę w wypadku MDM będzie-zgodnie z teorią dysonansu poznawczego - zwiększenie kontrastu między analizowanymi alternatywami. Tak więc MDM powinien przeanalizować obie alternatywy i sam się przekonać, że różnią się one w sposób wyraźny między sobą, i to na korzyść samochodu B. Jak ma to zrobić? Bardzo prosto. Cały proces przypisywania wartości takim czy inny cechom samochodu jest najoczywiściej subiektywny. Nasz kupujący musi więc po prostu ponownie oszacować wszystkie właściwości, oceniając je tym razem bardziej stanowczo. I oto MDM, wielki racjonalizator, przystępuje do pracy. • „Chodźcie" - mówi do przyjaciół - „przejedziemy się moim nowym samochodem". • Nie ulega wątpliwości, że auto B uzyska w takim wypadku wyższą ocenę przydatności, albowiem prowadząc zatłoczony samochód, nowy właściciel może sobie powiedzieć: „Czy nie zrobiłem dobrze? Czy wszyscy oni zmieściliby się do tamtego wozu? Posiadanie pojemnego samochodu ma dla mnie większe znaczenie, niż początkowo sądziłem". • MDM widzi samochód z przebitą dętką lub czyta prospekt reklamujący ogumienie: „Hm, z moim samochodem mam niewiele kłopotu. To bardzo ważne mieć samochód z dobrymi oponami". (Wóz A oczywiście miał słabe opony). • Lakier samochodu B jest jednak w znacznie gorszym stanie niż samochodu A. I dlatego, kiedy jeden z przyjaciół MDM przymocowując na bagażniku narty wodne zadrapał lakier, MDM powiedział: „Drobiazg, i tak zadrapań nie brak, a na jazdę to nie ma wpływu. Na szczęście nie kupiłem tego sportowego wozu, tam nawet nie byłoby gdzie umieścić nart". (Jeżeli MDM wybrałby mały wóz, to łatwo możemy sobie wyobrazić, jak racjonalizowałby swój wybór: „Chodź, Mary, siadaj, ruszamy. Przykro mi chłopcy, ale więcej miejsca w tym wozie już nie ma"). O konikach polnych i innych rzeczach Czy lubicie pieczone koniki polne? Przypuśćmy, że wasz ulubiony profesor, kulturalny i sympatyczny pan, przyniósł do sali kilka sztuk upieczonych koników i proponuje chętnym, aby popróbowali. Jak sądzicie, czy dużo studentów, którzy skorzystali z zaproszenia i zjedli po jednym koniku polnym, zmieni na lepsze opinię o ich smaku? Przypuśćmy teraz, że to samo powtórzyło się w innej sali z innym profesorem, agresywnym, apodyktycznym i niepopularnym. 552 On również przyniósł pieczone koniki polne, ale częstuje zupełnie inaczej: kładzie po jednym przed każdym z 15 studentów i mówi: „Jedzcie". Jest oczywiste, że nikt nie musi go posłuchać, jeśli nie ma ochoty, ale czy wielu z tych, którzy jednak spróbowali pieczonego konika, zmieni w efekcie na lepsze swą opinię o jego smaku? Większość ludzi ceni sobie łagodny, ujmujący sposób bycia i rzeczywiście takie podejście jest zazwyczaj bardziej efektywne - łatwiej jest w taki sposób nakłonić człowieka do zjedzenia konika polnego niż stosując metody apodyktycznego i nieprzyjemnego profesora. A co sądzą o smaku koników polnych ci, którzy je zjedli? Dlaczego to zrobili? Sympatyczny profesor jest powszechnie lubiany przez studentów, jeżeli już poprosi, aby zrobili coś, co nie jest miłe, to dlaczego nie sprawić przyjemności sympatycznemu facetowi? Ale sama czynność nie staje się przez to przyjemniejsza. Studenci niesympatycznego profesora odczuwają to inaczej. Czy przyszłoby im do głowy robić cokolwiek, aby sprawić mu przyjemność? Z jakiej racji mają troszczyć się o jego odczucia, skoro on nie interesuje się ich odczuciami. Co zatem może ich skłonić do zjedzenia konika polnego? A chociażby to, że, prawdę mówiąc, pieczony konik nie jest taki niesmaczny. Zmiany zachodzące po podjęciu decyzji dadzą się przewidzieć zgodnie z teorią dysonansu. Wynika z niej fakt, że jeżeli ktoś wykonuje niezbyt przyjemną czynność bez widocznych racjonalnych przyczyn, to czynność ta może w końcu nie jest taka zła. Zatem wynika stąd niezupełnie zgodne z intuicją przewidywanie, że „dobrowolne" wykonanie określonej czynności na polecenie niesympatycznego człowieka może zmienić w większym stopniu opinię o tej czynności na bardziej pozytywną, niż ta sama dobrowolna czynność wykonana dla sympatycznego człowieka, który w taki sam sposób pragnie zmienić Waszą opinię. Racjonalizacja podecyzyjna Teraz chyba uchwyciliście już podstawową ideę: pozytywne aspekty wybranej alternatywy są uwypuklane, a aspekty negatywne minimalizowane lub też ignorowane. Alternatywa odrzucona jest poddawana zabiegom odwrotnym: jej słabe punkty są uwypuklane, a punkty mocne pomijane lub minimalizowane. Obserwując rzeczywiste zachowanie ludzi (nie wyłączając własnego zachowania), którzy właśnie podjęli trudną decyzję, łatwo można dostrzec przejawy takiej racjonalizacji. Mamy również podstawy, aby przypuszczać, że druki reklamowe i dokumentację techniczną ludzie zaczynają studiować starannie dopiero po dokonaniu wyboru danego produktu. Decydent odczuwa jakby specjalną potrzebę przekonania samego siebie o tym, że wybór dokonany był wyborem słusznym. Studiowanie danych dotyczących odrzuconego wariantu, najwyraźniej służy jednemu celowi - upewnieniu się o jego słabych stronach. 553 WNIOSKI W rozdziale tym opisaliśmy niektóre zasady, jakimi kieruje się decydent podczas Dorównywania alternatyw, zbierania informacji, a następnie oceny dokonanego wyboru. Wybór dokonany przez racjonalnie działającego decydenta jest zdeterminowany przede wszystkim przez oczekiwane wartości powiązane z możliwymi decyzjami, prawdopodobieństwem zdarzeń, zyskami i stratami przy różnych wynikach. Należy wybierać sposób działania maksymalizujący zysk. Chociaż zdarza się, że ludzie działają zgodnie z zasadą optymalizacji, to nie zawsze można przewidzieć, w jaki sposób postąpią. Takie zmienne wewnętrzne, jak nuda czy zmęczenie, często mają wpływ na podjęcie decyzji. Poza tym ograniczona pojemność pamięci krótkotrwałej często zmusza ludzi do stosowania strategii minimalizującej napięcia poznawcze. Zdarza się wówczas, że nie dostrzegają oni pewnych zmiennych istotnych albo też posługują się strategią, która będąc logiczną nie jest jednak optymalną, a nawet jest niekonsekwentna. Aby połączyć nakazy racjonalnego podejmowania decyzji z rzeczywistym zachowaniem człowieka, należy każdą obiektywnie określoną wielkość przekształcić w jej subiektywny ekwiwalent. Ogólnie, model oparty na pojęciu subiektywnie oczekiwanej użyteczności pozwala na zadowalający opis różnorodnych zachowań ludzkich w sytuacji decyzyjnej. Ale oceny dotyczące prawdopodobieństwa i użyteczności takich czy innych zdarzeń nie zawsze pozostają stałe. W większości wypadków jest to całkiem oczywiste. Użyteczność zdarzeń ulega zmianie w miarę jak człowiek zyskuje lub traci, ponieważ użyteczność jest przede wszystkim funkcją jego ogólnego samopoczucia. Różni ludzie powinni mieć i mają różne sądy o wartości tego samego zdarzenia. Ocena prawdopodobieństwa subiektywnego także się różni. Jakieś rzadkie zdarzenie może utrwalić się w pamięci jednego człowieka, a nie pozostawić śladu w pamięci innych ludzi, prowadzi to do ukształtowania się u tego pierwszego sądu o tym, że prawdopodobieństwo tego zdarzenia jest znacznie większe niż jest ono w rzeczywistości. Teorie podejmowania decyzji stanowią swego rodzaju receptę na optymalne zachowanie. W sytuacji decyzyjnej pomocna może się okazać analiza sytuacji w myśl wyłożonych tu zasad i dokonanie oceny wartości i kosztów związanych z przyjęciem każdej z możliwych strategii. Jeśli jednak będziecie tak postępować, to nie zawierzajcie swojej pamięci; róbcie notatki. 16. Społeczny kontekst decyzji WPŁYW CZYNNIKÓW SPOŁECZNYCH NA PODEJMOWANIE DECYZJI ZACHOWANIE SIĘ OSÓB POSTRONNYCH Rzucanie krążkami (frisbee) Pokój wypełniający się dymem Cierpiąca dama Apatia osób postronnych Podporządkowanie się autorytetowi DECYZJE INTERAKCYJNE Targowanie się Procedura targowania się Proces negocjacji Poziom aspiracji Strategia uczciwa Strategia bezlitosna Negocjacje strategiczne Taktyka konfliktu Racjonalność Dobra komunikacja Władza Manipulowanie macierzą wypłat Eskalacja gróźb i przeciwgróźb GRY I DECYZJE 555 * Sprzedawca używanych samochodów przypadkowo znalazł książeczkę czekową swojego klienta. Jednak nie chciał zaglądać do niej, obawiając się, że jeśli będzie wiedział zbyt dużo, to nie będzie dobrze prowadził transakcji. * Prezes dużej korporacji stoi przed perspektywą prowadzenia pewnych bardzo delikatnych negocjacji ze związkiem zawodowym. Interesy idą kiepsko i bardzo mu zależy na tym, aby te przetargi okazały się korzystne dla przedsiębiorstwa. Decyduje, że najlepiej będzie, jeśli na negocjacje wyśle niższego rangą urzędnika. * Pewna 18-letnia telefonistka, będąc sama w biurze w Bronx, zostaje zgwałcona i pobita. Wyrwawszy się nagle, obnażona i pokrwawiona, ucieka na ulicę wołając o pomoc. Tłum liczący około 40 przechodniów zbiera się i gapi na to, jak w biały dzień gwałciciel próbuje wciągnąć ją z powrotem do budynku; nikt nie interweniuje" (Latane i Darley, 1970). Przedstawione wyżej sytuacje decyzyjne zachodzą w określonym kontekście społecznym. Wynik końcowy zależny jest nie tylko od działań jednej osoby, ale też od innych ludzi, zaangażowanych w tę sytuację. Czasami ci inni są przeciwnikami, zainteresowanymi w optymalizacji ich własnego zysku- często zresztą czyimś kosztem. Czasami inni ludzie są skłonni do współpracy, tak więc każdy może zyskać, jeżeli uda im się porozumieć co do wzajemnie korzystnej decyzji. Czasami ci inni są po prostu ludźmi obcymi, stanowiącymi widownię, która może wywierać pewną delikatną presję społeczną na proces decyzyjny. Proces podejmowania decyzji przy wprowadzeniu czynników społecznych wykracza poza sytuacje opisywane w poprzednim rozdziale, w których optymalna, racjonalna strategia może być ustalona z matematyczną precyzją i w których decyzja podejmowana jest w izolacji, niezależnie od nacisków ze strony innych ludzi. Aby zrozumieć podejmowanie decyzji społecznych, musimy poznać zagadnienia dotyczące negocjacji, gróźb, konfliktów i zmiany postaw. WPŁYW CZYNNIKÓW SPOŁECZNYCH NA PODEJMOWANIE DECYZJI Kilka nowych interesujących zmiennych wchodzi w grę, kiedy decyzja jest podejmowana w kontekście społecznym. Różnorodne typy sytuacji mogą tu występować, wspólne jest to, że opinie i działania innych ludzi stają się równie ważne, jak koszty i zyski sytuacji decyzyjnej. Możemy rozpocząć naszą analizę czynników społecznych w sposób dość prosty, rozpatrując sytuacje bardzo zbliżone do tych, które występowały w poprzednim rozdziale, tylko obecnie dodajemy jeszcze wartość opinii innych osób. To, czy dana rodzina zdecyduje się nabyć nowy samochód lub też kolorowy telewizor, czy też nie, może zależeć znacznie bardziej od ich percepcji reakcji kolegów i przyjaciół, niż od ich aktualnych warunków materialnych czy potrzeby posiadania danego przedmiotu. ( W pewnych środowiskach - takich jak wykładowcy uniwersyteccy - presja społeczna działa odwrotnie, sprawiając, 556 że unikają oni zakupu fantastycznego auta lub kolorowego telewizora, jeśli nawet mogą sobie na to pozwolić). Do tego typu sytuacji analiza z poprzedniego rozdziału nadaje się z powodzeniem, z wyjątkiem tego, że musimy dodać jeszcze wartość presji czynnika społecznego. Część trudności wiąże się z niepewnością, jaka towarzyszy każdej indywidualnie podejmowanej decyzji. Wiele konkretnych decyzji okazuje się trudnymi, jeżeli towarzyszy im rzeczywisty konflikt i dysonans związany z dokonaniem wyboru. Czy wezwalibyście straż ogniową, gdyby dym wypełniał pokój? Oczywiście, chyba że dym można wyjaśnić prosto i naturalnie albo też, gdyby inni zdążyli już to uczynić. Każdy musi samodzielnie decydować o tym, co zrobić w nieprzewidzianych okolicznościach. Ale wie również, że życie jest skomplikowane i wypełnione niezwykłymi sytuacjami, które często stają się kłopotliwe dla działających w nich osób. Do prostego oszacowania sytuacji decyzyjnej trzeba dodać rozważanie skutków ubocznych każdego działania. Zacznijmy naszą analizę wpływów czynników społecznych na podejmowanie decyzji od przyjrzenia się, co zdarzyło się we względnie naturalnych sytuacjach: przeanalizujmy działania ludzi znajdujących się w wypełniającym się dymem pokoju lub mających do czynienia z dziwnie zachowującymi się graczami we frisbee albo będących świadkami zbrodni. ZACHOWANIE SIĘ OSÓB POSTRONNYCH Sprawa Kitty Genovese, którą bito prawie przez 30 minut aż do utraty życia na oczach sąsiadów, a mimo to nikt nie wezwał policji; zabójstwo Andrew Mormile, pchniętego nożem i wykrwawiającego się na śmierć w kolejce podziemnej w obecności jedenastu pasażerów, a nikt nie próbował mu pomóc; gwałt dokonany na telefonistce, opisany na początku tego rozdziału - takie oto rodzaje wydarzeń skłoniły Latane i Darley (1970) do zbadania, dlaczego osoby postronne nie podejmują odpowiednich działań. Mamy tu do czynienia ze sposobem postępowania w takich sytuacjach decyzyjnych, które mają określone, specyficzne składniki: występuje tu niepewność, jakie działanie należy podjąć; inne osoby są w takiej samej sytuacji, okazje do porozumienia się są ograniczone lub nie wykorzystane. Każdy sam musi zadecydować, czy jest to sytuacja krytyczna, aby móc podjąć właściwe działanie. Latane i Darley przeprowadzili serię pomysłowych badań nad zachowaniem decyzyjnym w podobnych sytuacjach. Zarówno stosowane przez nich techniki badawcze, jak i uzyskane wyniki badań są pouczające. Rzucanie krążkami (frisbee). Miejscem inscenizacji była Grand Central Station w Nowym Jorku. Eksperymentatorki, dwie dziewczyny, siedzą naprzeciw na ławkach w poczekalni, rzucając do siebie nowo kupionymi krążkami (frisbee). Po kilku minutach zabawy krążek jakby przypadkowo trafia w osobę postronną (którą w rzeczywistości jest podstawiony pomocnik eksperymentatorek). Zadaniem osoby podstawionej było stworzenie modelu czy wzorca zachowań dla osób postronnych, znajdujących się w takich okolicznościach. 557 Osoba podstawiona bądź ochoczo dołącza się do zabawy krążkiem, bądź agresywnie kopie krążek wyrażając przy tym opinię, że zabawa jest dziecinna i niebezpieczna dla otoczenia. W niektórych warunkach eksperymentalnych osoba podstawiona wyłącza się z działania po wyrażenu swej opinii; w innych zaś pozostaje przez jakiś czas, gdy dziewczyny badają reakcję rzeczywistych osób postronnych. Badanie to polega na rzucaniu krążka do każdej z osób siedzących na ławce w poczekalni: osobę postronną traktowano jako kooperującą, jeśli co najmniej dwukrotnie odrzuciła dziewczętom krążek. Na ogół osoba postronna wypowiada się, a następnie działa w zaistniałej sytuacji zgodnie z modelem dostarczonym jej przez osobę podstawioną. Jeżeli osoba podstawiona nie przejawiała tendencji do współpracy, to osoba postronna postępowała podobnie, odchodząc na bok, wypowiadając uwagi podobne do tych, jakie usłyszała od osoby podstawionej. Natomiast wówczas, gdy osoba podstawiona była chętna do współdziałania, odnotowywano 90 procent wypadków współpracy ze strony osób postronnych; właściwie problemem okazuje się wtedy raczej zakończenie zabawy niż pobudzenie do uczestnictwa w niej. Wszystko zależy od zachowania werbalnego osoby podstawionej oraz jej dalszej obecności. Jeżeli osoba podstawiona po prostu pozostawi na ziemi krążek tam, gdzie został rzucony, i nie powie ani słowa, to nie zahamuje tym zainteresowania u innych. Jeżeli zaś wyrazi się o całej zabawie z lekceważeniem i odejdzie, osoby postronne dołączą do zabawy po jej odejściu: cała Grand Central Station zamienia się w plac zabaw. Pokój wypełniający się dymem. Osoby badane siedzą w pokoju i wypełniają „kwestionariusz handlowy", gdy nagle przez otwór wentylatora zaczyna wydobywać się dym. Podczas gdy kontynuują one pracę, dym ciągle napływa, „pod koniec czwartej minuty tak dużo dymu przedostaje się do pokoju, że pogarsza się widoczność, wydziela się drażniący zapach, co utrudnia oddychanie" (Latane i Darley, 1970). Sposób reakcji danej osoby uzależniony jest od tego, czy pracuje ona sama czy też w towarzystwie innych osób. Kiedy osoby badane pracują pojedynczo 75procent z nich reaguje racjonalnie na możliwe zagrożenie pożarem. Badają one dymiący otwór wentylacyjny i wychodzą na zewnątrz, aby zameldować o tym wypadku. Jednak, gdy tylko w sali znajdą się jeszcze dwie inne osoby, większość badanych jak dotąd nie miała odwagi zameldować o wydobywaniu się dymu. Próbują odpędzić fale dymu, nie ustając w wypełnianiu kwestionariusza aż litościwi eksperymentatorzy zakończą eksperyment. Cierpiąca dama. I w tym przypadku osoby badane siedzą w pokoju wypełniając „kwestionariusz handlowy". Pracując tak mogą słyszeć, jak „przedstawicielka marketingu" krząta się w sąsiednim pokoju. Po upływie czterech minut od chwili rozpoczęcia pracy nad kwestionariuszem, z sąsiedniego pomieszczenia dobiega głuchy, silny łoskot, któremu towarzyszy krzyk kobiety i jęki (odgrywane z taśmy magnetofonowej) „och, mój Boże, moja noga... Ja... nie mogę się ruszyć. Och, moja kostka..., nie mogę... nie mogę... się wydostać... spod tego". Kiedy badani pracują samotnie, 70 procent z nich spieszy z pomocą reagując na zaistniałą sytuację. Ale kiedy każdy z badanych pracuje w towarzystwie dwu innych osób 558 (w danym przypadku osób podstawionych, które zostały poinstruowane, aby nie ruszały się z miejsc), jedynie 7 procent zareagowało na cierpienia kobiety. Apatia osób postronnych Badania te wykazały, że obecność innych osób wywiera znaczny wpływ na działania jednostki. Na ogół przejawia ona tendencję do działań po najmniejszej linii oporu, dostosowując swoje zachowanie do zachowań sąsiadów.. Działania te nie zawsze jednak muszą mieć charakter aspołeczny ani też nie muszą być przejawem zwykłej obojętności na los innych ludzi. Raczej ukazują one, jak bardzo skomplikowany może być rzeczywisty proces podejmowania decyzji. Zastanówmy się nad przypadkiem kobiety opisanej w paragrafie otwierającym ten rozdział. Czy przyszedłbyś jej z pomocą? Prawdopodobnie nie, ponieważ dla podejmującego decyzję świadka takiego zdarzenia problem nie jest bynajmniej tak prosty, jak wynikałoby to z krótkiego opisu. Tłum lub hałas przyciągnęłyby zapewne Twoją uwagę. Zbliżywszy się, aby zobaczyć, co się zdarzyło, ujrzałbyś nagą dziewczynę wzywającą pomocy i jakiegoś mężczyznę próbującego wciągnąć ją do budynku. „Co tu się dzieje"? pytasz znajdującej się obok osoby i słyszysz w odpowiedzi „Nie wiem". Być może, ktoś kręci film, być może, jest to kłótnia rodzinna, a może ten mężczyzna usiłuje jej pomóc. Chociaż sprawa może wyglądać poważnie, jednak wydaje się, że nikt się tym nie interesuje. Wzruszasz więc ramionami i odchodzisz mrucząc, że Nowy Jork to rzeczywiście bardzo dziwne miasto. Sytuacja może być całkiem inna, jeżeli będąc sam zobaczysz dziewczynę i jej prześladowcę. W takim przypadku niektóre z przytoczonych wyjaśnień nie wydają się możliwe i jest wysoce prawdopodobne, że będziesz chciał zainteresować się tą sprawą i podjąć odpowiednie działania. Tłum ludzi, rzecz jasna, nie zawsze powoduje apatię lub bezczynność, czego dowodzą poczynania tłumu dokonującego linczu lub samosądy Ku Klux Klanu. Często obecność w tłumie prowadzi też do dobrego, jak wówczas, gdy ludzie z tłumu łączą się w grupę, aby wspólnie usunąć materialne skutki katastrofy żywiołowej. Sedno sprawy tkwi w tym, że indywidualne podejmowanie decyzji jest zadaniem trudnym i niepewnym, a konformizm społeczny zwykle przyczynia się do uproszczenia problemu decyzyjnego danej jednostki. Osoba podejmująca decyzję ma wątpliwości co do poprawności swego wyboru. Reakcje innych osób stanowią dla niej źródło informacji. Zmniejszają one niepewność co do możliwych interpretacji sytuacji - „Musi to być właściwe. Skoro tak wiele innych osób postępuje tak samo". Fakt, że większość osób z tłumu postępuje zgodnie po prostu dlatego, że inni zdają się zgadzać z nimi, jest tu bez znaczenia, gdyż fakt ten nie jest znany. Reakcje innych ukazują także niektóre konsekwencje możliwych działań. W obecności biernego tłumu indywidualne działanie może nie spotkać się z poparciem i w rezultacie dana osoba może narazić siebie na poważne ryzyko. 559 Wpływ nacisku grupy może być wręcz zaskakujący. Preferowanym sposobem demonstrowania w laboratorium konformizmu jest polecenie osobie badanej (nazwijmy ją badanym H), aby oceniła, która z dwóch kresek jest dłuższa. Zadanie to można uczynić dość trudnym wtedy, gdy porównywane linie różnią się bardzo nieznacznie. Eksperyment ten przeprowadza się w grupie, tak że kilka różnych osób badanych podejmuje decyzje w tym samym czasie. Każdy może być świadkiem udzielania odpowiedzi przez innych. Zwykle odpowiedzi badanych są dość zgodne, z wyjątkiem, być może, bardzo trudnych wyborów. Gdy eksperyment trwa już przez pewien czas, zaleca się badanym dokonanie dość prostego wyboru, takiego, w którym zawsze występuje 100 procent poprawnych reakcji. Zanim przyjdzie kolej na odpowiedź badanego H, stwierdza on, że wszyscy inni badani wybrali odpowiedź, którą on uważa za niewłaściwą. Co powinien zrobić? Osoba badana znajduje się w trudnej sytuacji, gdy zetknie się z rozbieżnością między swym własnym procesem decyzyjnym a postępowaniem innych. Oczywiście różne osoby znajdą różne wyjaśnienia dla rozbieżności, której doświadczają, lecz ostatecznym rezultatem jest zawsze dominująca tendencja do liczenia się w dużym stopniu z działaniami lub bezczynnością innych przy podejmowaniu własnej decyzji. Być może, najważniejszym wynikiem takich obserwacji nie jest jednak to, że ludzie są skłonni dostosowywać się do działań innych, lecz to, że takie postępowanie jest dla nich traumatyzujące i trudne. Gdy silne naciski społeczne zmuszają daną osobę do podporządkowania się w swych działaniach, mimo istnienia silnych dowodów przemawiających przeciw takiemu postępowaniu, czyni to ponosząc wielkie koszty natury psychicznej. Pewien badacz, który studiował ten aspekt uległości, stwierdził, że badani, którzy podporządkowali się, wykazywali silny lęk: niektórzy czuli się psychicznie „całkiem odosobnieni" od innych osób biorących udział w tym eksperymencie, inni czuli się „dziwnie" lub jakoś „odmiennie" (Crutchfield, 1955). Powrócimy jeszcze do tego aspektu zachowania konformistycznego. Podporządkowanie się autorytetowi Ścisły związek z mechanizmami konformizmu ma posługiwanie się autorytetem jako środkiem do nakłaniania innej osoby, aby robiła to, czego sobie życzysz. Niekiedy autorytet wiąże się z ukrytą groźbą kary za niepodporządkowanie się. Czasami autorytet jest spostrzegany jako dobroczynny, tak ze podporządkowanie się jego wymaganiom zapewnia uzyskanie pozytywnych wartości, które mogą zrekompensować wszelkie związane z tym koszty. Niekiedy autorytet w sposób ukryty lub jawny kieruje procesami podejmowania decyzji: zadanie zostaje wykonane, ponieważ jego uczestnicy nie muszą rozstrzygać w ogóle o niczym, po prostu robią to, co się im każe. Szereg kontrowersyjnych badań daje dobrą okazję do poznania niektórych czynników działających w przypadku podporządkowania się autorytetowi. Poniższy scenariusz daje Ci szanse odegrania roli osoby badanej. Spróbuj wyobrazić sobie tę sytuację i przewidzieć, jak zachowałbyś się w niej. 560 Wyobraź sobie, że przeczytałeś ogłoszenie i zgłaszasz się, aby uczestniczyć w badaniu psychologicznym nad uczeniem się, przeprowadzanym w Yale University. Wchodzisz do nowego imponującego budynku Pracowni Interakcji i idziesz do określonego w ogłoszeniu pomieszczenia, gdzie wita Cię naukowiec w białym fartuchu. Wkrótce nadchodzi drugi badany. Naukowiec wyjaśnia Wam, że bada związki między karą a uczeniem się. Szczególnie interesuje go to, jaka wielkość kary jest najlepsza dla uczenia się i czy różnice pod względem wieku i płci między nauczycielami a uczniami wpływają na tempo uczenia się. Ciągniecie losy, aby ustalić, który z Was ma być „nauczycielem", a który „uczniem" (okazuje się, że wyciągnąłeś żeton oznaczający „nauczyciela"), a następnie zostajecie wprowadzeni do przyległego pomieszczenia. „Uczeń" zostaje przymocowany do aparatury („w celu zapobieżenia nadmiernym ruchom"), zaś elektroda zostaje przymocowana do jego nadgarstka za pomocą specjalnej, galaretowatej substancji („w celu uniknięcia pęcherzy i oparzeń"). W Twojej obecności eksperymentator zapewnia ucznia, że chociaż wstrząsy elektryczne, jakie będzie otrzymywał, mogą być niezwykle bolesne, to jednak nie spowodują one żadnego trwałego uszkodzenia tkanek. Następnie zabiera Cię z powrotem do pomieszczenia eksperymentalnego i wyjaśnia Twoją rolę w badaniu. Masz za zadanie nauczyć „ucznia" listy słów. Musisz przeczytać całą listę par słów, następnie wrócić do początku i zacząć czytać słowa pojedynczo. Czytasz pierwsze słowo z danej pary, a następnie cztery słowa testowe. „Uczeń" ma nacisnąć guzik wskazujący, które z czterech słów testowych należało do pierwszej pary. Za każdym razem, gdy popełni on błąd, aplikujesz mu wstrząs elektryczny. Przy każdym kolejnym błędzie siłę wstrząsu zwiększa się o jeden stopień. Aparatura do aplikowania wstrząsów ma szereg przełączników służących do nastawiania różnych poziomów siły wstrząsów. Zakres wynosi od 15 do 450 woltów, co 15 woltów. Najniższe napięcie jest oznaczone napisem „Słaby Wstrząs", a najwyższe napięcie - napisem „Niebezpieczeństwo: Silny Wstrząs", a następnie XXX. Po praktycznym zapoznaniu się z procedurą rozpoczynają się próby eksperymentalne. Gdy czytasz kolejne słowa z listy, okazuje się, że „uczeń" przeciętnie podaje zaledwie jedną poprawną odpowiedź na trzy błędne. Zgodnie z planem eksperymentu, po każdym błędzie zwiększasz siłę wstrząsu. Po kilku powtórzeniach listy napięcie prądu wynosi 300 woltów. W tym momencie badany zaczyna walić w ścianę swego pomieszczenia. Eksperymentator mówi Ci, abyś dawał mu 5 do 10 sek. na odpowiedź, a następnie traktował brak odpowiedzi jako błąd i postępował zgodnie z procedurą. Po następnym słowie testowym znowu słyszysz walenie w ścianę, ponieważ jednak brak jest odpowiedzi, aplikujesz wstrząs o napięciu 315 wolt. Gdy zwracasz się do eksperymentatora o radę, wydaje się on całkowicie bierny i po prostu wymaga od Ciebie dalszego stosowania tej samej procedury mówiąc „Proszę kontynuować". Jeśli nadal okazujesz opór, może on poinformować Cię, że „Eksperyment tego wymaga, abyś kontynuował" lub „Nie masz innego wyboru; musisz iść dalej". Jak dalece zgodziłbyś się posunąć? Opisaliśmy tę sytuację dość szczegółowo, abyś mógł wyobrazić sobie, jak prawdopodobnie zachowałbyś się w takich okolicznościach. Gdy opis tego rodzaju podano studentom psychologii Uniwersytetu Yale i poproszono ich o podanie swych przewidywań, 561 byli na ogół zgodni co do tego, że ludzie w tej sytuacji odmówiliby kontynuowania eksperymentu, przewidywali oni na ogół, że jedynie nieznaczna mniejszość osób badanych (1-3 procent) chciałaby kontynuować eksperyment do najwyższego poziomu napięcia wstrząsów (450 woltów). Nieformalna ankieta przeprowadzona wśród psychiatrów i kolegów eksperymentatora dała w wyniku podobne przewidywania. W rzeczywistym eksperymencie wszyscy badani aplikowali wstrząsy o napięciu 300 woltów lub wyższym. 26 spośród badanych, tj. 65 procent, zgodziło się aplikować wstrząs o maksymalnym napięciu 450 woltów. Wyniki te były całkowicie nieoczekiwane. Wzbudziły one wiele sporów i kontrowersji, dotyczących zarówno ich społecznych implikacji, jak i etyki psychologów eksperymentatorów. Eksperyment ten był bowiem pewnego rodzaju mistyfikacją. Nie stosowano żadnych wstrząsów elektrycznych: człowiek udający „ucznia" był w rzeczywistości jednym z eksperymentatorów odgrywającym tę rolę i reagującym na rzekome wstrząsy zgodnie z dobrze wyuczonym scenariuszem. Rzeczywistą osobą badaną w tym eksperymencie był osobnik występujący w roli „nauczyciela". Badanym zagadnieniem było to, jak dalece stosunkowo niewielkie zachęty ze strony psychologa skłonią osobę badaną do stosowania coraz silniejszych wstrząsów. Rezultaty te tym bardziej zaskakują w świetle faktu, że decyzja każdego z badanych, aby kontynuować aplikowanie wstrząsów, była najwyraźniej trudna i sprawiająca ból. Obserwowano, że osoby badane „pociły się, drżały, jąkały się, zagryzały wargi, pojękiwały i wbijały paznokcie w swoje ciało. Były to charakterystyczne, nie zaś wyjątkowe reakcje na ten eksperyment". U badanych, którzy odmówili kontynuowania eksperymentu, typowe wyjaśnienie ukazuje głębię przeżywanego konfliktu: „On się tam tłucze. Mam już tego dosyć. Chciałbym kontynuować, lecz nie mogę tego zrobić temu człowiekowi... Przepraszam, nie mogę tego zrobić temu człowiekowi. Uszkodzę mu serce. Weź swój czek... Nie, naprawdę ja nie mogę tego zrobić". Osoby badane wydawały się przeżywać wewnętrzny konflikt emocjonalny, gdy walczyły one z lękiem wywołanym chęcią podporządkowania się autorytetowi. Pewien obserwator oglądający ten eksperyment przez przesłonę jednokierunkową stwierdził: „Obserwowałem dojrzałego i początkowo zrównoważonego biznesmena, który wchodził do laboratorium roześmiany i pewny siebie. W ciągu 20 minut został z niego skurczony i jąkający się wrak, który szybko zbliżał się do punktu załamania nerwowego. Nieustannie pociągał się za ucho i załamywał ręce. W pewnym momencie przycisnął pięść do swego czoła i wymamrotał: «O Boże, niech się to skończy». A jednak nadal reagował na każde słowo eksperymentatora i był posłuszny do końca" (Milgram, 1963). Te skutki emocjonalne występują nie tylko w sytuacjach tak dramatycznych jak eksperyment, w którym stosuje się wstrząsy elektryczne. Nawet w pozornie niewinnym eksperymencie z ocenianiem długości kresek, o którym wspomnieliśmy poprzednio, 562 osoby badane doznawały dość silnego urazu psychicznego, gdy stawały wobec problemu polegającego na tym, że oceny innych badanych były niezgodne z ich własnymi spostrzeżeniami. Czego właściwie dowodzi ten eksperyment? Praca ta oraz badania, które nastąpiły po niej, są powszechnie przytaczane jako dowód świadczący o powszechnej u ludzi skłonności do podporządkowania się autorytetom. Trzeba być jednak niezwykle ostrożnym przy formułowaniu tak daleko idącego wniosku. Najwyraźniej ludzie starają się ocenić cały układ zdarzeń, gdy mają podjąć decyzje dotyczącą wyboru najwłaściwszego kierunku działania. W omówionym eksperymencie za spokojnym, łagodnym głosem eksperymentatora stała cała nienaganna reputacja nauki. Badany musiał zestawić swe własne psychiczne cierpienie (i pozorne cierpienia ucznia) z możliwą użytecznością wyników eksperymentu. Mógł odmówić kontynuowania eksperymentu tylko wtedy, gdyby jego osobiste cierpienie przekraczało spostrzeganą wartość badania. W rzeczywistości można argumentować, że badani mieli całkowitą słuszność w swej ocenie sytuacji, gdy kontynuowali aplikowanie wstrząsów nawet na najwyższych poziomach napięcia. Ostatecznie eksperymentator polecał im kontynuować eksperyment, dając przez to do zrozumienia, że nie spowoduje to żadnego trwałego uszkodzenia. I w rzeczywistości oni (i on) mieli słuszność: okazało się, że jest to eksperyment, w którym w ogóle nikt nie był rażony prądem. Wyniki te zatem nie muszą mieć nic wspólnego z jakąś naturalną czy trwałą cechą uległości, lecz raczej ujawniają one racjonalną ocenę określonego układu okoliczności. Zadziwiające nie jest zatem to, że ludzie podporządkowują się, lecz ich ocena\V7^dn^i użyteczności w tej sytuacji-najwyraźniej wysoka, pozytywna wartość przypisywana Instytucji naukowej w stosunku do osobistych kosztów zadawania bólu innemu człowiekowi. Krytykujący ten eksperyment wskazali, że sami eksperymentatorzy demonstrowali wzorzec zachowania całkiem podobny do tego, jaki występował u osób badanych. Fakt, że zechcieli przeprowadzić podobny eksperyment i narazić swych badanych na takie napięcie i przykrości wskazuje, iż oni także przypisywali wyższą wartość nauce w porównaniu z cierpieniem badanych. Aczkolwiek eksperyment tego typu wzbudził głośny sprzeciw, osoby badane, które wzięły w nim udział, zdają się nie podzielać takiego punktu widzenia. Po zakończeniu badań każdej osobie badanej wyjaśniono i starannie tłumaczono intencje badania i wypływające z niego wnioski. Badani byli zdania, że eksperyment ten był pożyteczny i że ich osobiste doświadczenia związane z nim były pouczające. [W tym badaniu, podobnie jak we wszystkich tego typu eksperymentach, w których wprowadza się w błąd osoby badane, po sesji eksperymentalnej następuje tzw. sesja wyjaśniająca. W tym przypadku osobom badanym opisywano dokładnie charakter eksperymentu, informowano, jakie właściwie czynniki w nim badano, oraz zapoznawano je z „ofiarą", która w rzeczywistości była jednym z eksperymentatorów. Ponadto osoby badane otrzymały później opis tego badania, a także odwiedzano je, aby stwierdzić, czy nie wystąpiły jakieś późniejsze skutki. (Pełny opis można znaleźć w pracy Milgrama, 1964.) Niepożądane jest to, że niekiedy w początkowych stadiach eksperymentów tego rodzaju, badanych trzeba oszukiwać, lecz, jak dotąd, nie wynaleziono żadnego innego sposobu zbierania informacji naukowych, potrzebnych do oceny zachowania się ludzi. Ustalone zasady etyki zawodowej wymagają jednak, aby po takich eksperymentach ze wszystkimi badanymi przeprowadzać posiedzenia wyjaśniające. Często osoby badane dochodzą do wniosku, że eksperyment byt dla nich wartościowym doświadczeniem i że nauczyły się czegoś pożytecznego o sobie. W większości eksperymentów psychologicznych nie ma żadnych oszustw. W wielu przypadkach eksperymentator naprawdę bada to, co podaje jako przedmiot swych zainteresowań. Nieraz, kiedy eksperymentator usiłuje badać coś tak niewinnego, jak np. słyszenie, doznaje niepowodzeń, ponieważ osoby badane spodziewają się jakiegoś podstępu, podczas gdy w rzeczywistości żadnego podstępu nie ma. Wielu czytelników tej książki może pełnić rolę osób badanych w eksperymentach psychologicznych. Jeśli weźmiesz udział w badaniach i jeśli po eksperymencie nie powiedzą Ci, że byłeś wprowadzony w błąd, to o ile nie miałeś do czynienia z mało prawdopodobnym przypadkiem eksperymentatora, który jest niemoralny i narusza mocno ustalone zasady etyczne tej dziedziny nauki, możesz być pewny, że nie było żadnego oszustwa; naprawdę, pomogłeś eksperymentatorowi ustalić to, co wedle jego stów było przedmiotem zainteresowania.] 563 Zdawali się być przekonani, że nauczyli się czegoś wartościowego -że trzeba postępować zgodnie ze swymi własnymi zasadami, a nie ulegać zbyt łatwo poleceniom autorytetu (zobacz Miligram, 1964). Eksperymenty te ukazują zagadnienia ważne dla nas wszystkich, zarówno jako jednostek, jak i członków społeczeństwa. Miligram podsumował te zagadnienia w taki oto sposób: „Z wprawiającą w osłupienie regularnością obserwowaliśmy, jak porządni ludzie ulegali żądaniom autorytetu i postępowali w sposób okrutny i nieczuły. U ludzi, którzy w codziennym życiu są odpowiedzialni i uczciwi, dostojeństwo autorytetu powoduje osłabienie krytycyzmu w percepcji sytuacji i w przyjmowaniu tego, co im eksperymentator podsuwa, skłaniając ich do wykonywania brutalnych działań. Jakie są granice takiej uległości? Próbowaliśmy ustalić jakąś granicę. Wprowadzaliśmy krzyki ofiary: to nie wystarczyło. Ofiara skarżyła się na kłopoty z sercem: osoby badane nadal aplikowały jej wstrząsy na żądanie. Ofiara błagała, aby ją wypuścić, a aparatura przestawała rejestrować jej odpowiedzi-badań i nadal aplikowali wstrząsy. Początkowo nie wyobrażaliśmy sobie, aby takie drastyczne procedury były potrzebne dla wywołania braku posłuszeństwa i każde nowe posunięcie wprowadzaliśmy dopiero wtedy, gdy nieskuteczność stosowanych wcześniej technik stała się oczywista. Ostatnim usiłowaniem zmierzającym do określenia granicy było umieszczenie ofiary tak blisko, że można ją było dotknąć. Lecz już pierwszy badany w tych warunkach dręczył ofiarę na żądanie i doszedł do najwyższego poziomu napięcia prądu. Jedna czwarta osób badanych postępowała w tych warunkach podobnie. Wyniki, jakie obserwuje się w laboratorium, są dla autora niepokojące. Podważają one wiarę w to, że demokratyczne społeczeństwo amerykańskie produkuje charaktery, które są w stanie przeciwstawiać się brutalności i nieludzkiemu traktowaniu na polecenie autorytetu przejawiającego złą wolę. Znaczna część ludzi zrobi to, co im się nakazuje, aby robili, bez względu na treść tych poleceń i bez ograniczeń spowodowanych sumieniem dopóty, dopóki uważają, że nakaz ten pochodzi od uprawnionego autorytetu. Jeśli w badaniu tym anonimowy eksperymentator mógł z powodzeniem nakazywać ludziom dorosłym, aby dręczyli 50-letniego człowieka i aplikowali mu przymusowo bolesne wstrząsy elektryczne mimo jego protestów, to można tylko zastanowić się nad tym, co rząd z jego znacznie większym autorytetem i prestiżem mógłby rozkazać swym «poddanym». Nasuwa się, oczywiście, niezmiernie ważne pytanie, 564 czy wykazujące złą wolę instytucje polityczne powstaną bądź mogłyby powstać w społeczeństwie amerykańskim. Niniejsze badanie nie daje żadnej odpowiedzi na to pytanie" (Miligram, 1965). DECYZJE INTERAKCYJNE We wszystkich omawianych poprzednio sytuacjach występowały naciski działające na jednostkę. Decyzja jednak bywa wciąż stosunkowo prosta wówczas, gdy jednostka podejmuje ją sama. Wtórny podstawowy wpływ kontekstu społecznego występuje tam, gdzie kilku uczestników wchodzi ze sobą w interakcje, aby targować się lub spierać, tak że ostateczny przebieg działania zdeterminowany jest przez decyzje podejmowane wzajemnie przez wszystkich uczestników. Na proces ten oddziałują różne czynniki. Po pierwsze, interesy różnych stron mogą się różnić, tak że decyzja optymalna dla jednej ze stron nie jest optymalna dla drugiej. W takiej sytuacji trzeba osiągnąć jakiś kompromis. Po drugie, może zachodzić brak komunikacji między uczestnikami, tak że nie zawsze jest możliwe przedyskutowanie ewentualnych decyzji i ich następstw. Na przykład, w negocjacjach handlowych żadna ze stron nie zna na ogół dokładnie problemów drugiej strony. W negocjacjach między narodami często występuje wzajemna nieufność, wskutek czego komunikowanie się jest utrudnione. Targowanie się Niektóre z czynników działających w przypadku interakcyjnego podejmowania decyzji można zilustrować na przykładzie pewnej prototypowej sytuacji, a mianowicie targowania się. Sytuacja targowania się ma charakter zarówno rywalizacyjny, jak i kooperacyjny. Jest ona realizacyjna, ponieważ dwaj przeciwnicy - kupujący i sprzedający - starają się zmaksymalizować swoje własne zyski za pomocą negocjacji: zazwyczaj wynik optymalny dla jednego nie jest wynikiem optymalnym dla drugiego. Jednak targowanie się może także być kooperacyjne: uczestnicy muszą uzgodnić jakąś cenę, jeśli każdy z nich ma coś zyskać i transakcja ma dojść do skutku. Komunikowanie się jest dozwolone, lecz ograniczone. W najprostszym przypadku targowanie się przeprowadzone jest w sposób bezosobowy i niemożliwe jest wywieranie żadnych nacisków społecznych. Komunikowanie się jest ograniczone do negocjacji na temat ceny i ilości towaru. Targowanie się jest zwykle sytuacją podejmowania decyzji, w której każdy z uczestników dysponuje niekompletną wiedzą: nie zna on macierzy wypłat swego przeciwnika. Naszą analizę targowania się zaczniemy od przykładu z targowiska. Chcemy przeciwstawić sobie kupującego i sprzedawcę w społecznej sytuacji podejmowania decyzji, aby przekonać się, jakiego rodzaju interakcje będą miały miejsce. Postaraj się wykonać to zadanie: jest ono pouczające, jak również zabawne. Przykład ten najlepiej spełni swe zadanie, jeśli odegrasz tę grę wspólnie z kolegą. 565 (Niezbędne macierze decyzyjne umieszczono w tej książce w taki sposób, aby dwie osoby mogły grać w tę grę). W idealnym przypadku powinieneś grać rolę jednej ze stron i polecić koledze, aby grał rolę drugiej strony. (Jeśli nie możesz znaleźć partnera do tego przedsięwzięcia, uzyskasz także wiele satysfakcji z odgrywania obu ról samemu, występując na zmianę jako kupujący i sprzedający). To pomoże ci wczuć się w rolę tej strony, którą masz grać. Zdecydujcie się, jaką rolę każdy z uczestników chce grać, kupującego czy sprzedającego. Następnie odnajdźcie te stronice w książce, na których podano w ramkach opisy odpowiednich ról, i niech każdy z uczestników przeczyta ten opis, który odnosi się do niego (tekst na rys. 16-1 albo na rys. 16-2, zależnie od tego, jaką rolę wybrał). Nie czytajcie obu opisów, ponieważ przeszkodziłoby to Wam w odgrywaniu Waszych ról. Procedura targowania się [Zarówno kupujący, jak i sprzedający powinni przeczytać ten paragraf.] Każdy uczestnik zna strukturę swych interesów; zależność zysku lub straty od ceny i ilości towaru, który kupuje lub sprzedaje. Stosunek między ceną, ilością towaru i zyskiem jest jednak złożony, przy czym wiele różnych czynników powoduje, że struktura ta jest nieco inna niż sugeruje to intuicja. Tak więc zarówno kupujący, jak i sprzedający przygotowali dla własnego użytku tabele zysku; zawierają one liczby dostarczające im informacji niezbędnych w sytuacji targowania się. Oczywiście, tabele te trzeba utrzymać w głębokiej tajemnicy. Ani sprzedający, ani kupujący nie mogą pozwolić na to, aby druga strona obejrzała ich tabelę. Krótko mówiąc, w tej sytuacji żaden z graczy nie zna macierzy wypłat swego przeciwnika. Przykładowe tabele tego rodzaju pokazano na rysunku 16-3, (zarówno kupujący jak i sprzedający mogą przeanalizować ten rysunek). U góry każdej tabeli podano ilości danego towaru. Wzdłuż lewej strony tabeli podano ceny na jednostkową ilość towaru. Liczby w tabeli przedstawiają zysk, jaki się osiągnie, jeśli targ zakończy się przyjęciem określonej ceny i ilości towaru. RYSUNEK 16-3 Jest to uproszczony przykład służący jedynie za ilustrację danej sytuacji. Nie nadaje się do wykorzystania w toku rzeczywistych negocjacji. PORADNIK KUPCA (Przykład) W kolejności podane są cena, ilość, zysk poprzedzony literą z. W celu właściwego odczytu liczb przez program Screen Reader, należy ustawić opcję CZYTANIE DOKUMENTÓW na wypowiadanie wszystkich znaków. 100, 5, z 6; 100, 6, z 7; 100, 7, z 8; 90, 5, z 6; 90, 6, z 8; 90, 7, z 9; 80, 5, z 7; 80, 6, z 8; 80, 7, z 10; PORADNIK SPRZEDAWCY (Przykład) W kolejności podane są cena, ilość, zysk poprzedzony literą z: 100, 5, z 3; 100, 6, z 2; 100, 7, z 2; 90, 5, z 3; 90, 6, z 2; 90, 7, z 1; 80, 5, z 3; 80, 6, z 1; 80, 7, z 0; W przedstawionych, uproszczonych fragmentach tabeli zysku ukazany jest zachodzący tu konflikt; kupujący wyjdzie najlepiej wtedy, kiedy zakupi dużą ilość towaru po niskiej cenie, sprzedający osiągnie największy zysk, jeśli sprzeda małą ilość po wysokiej cenie. (Rzeczywiste tabele, które będziecie stosować w negocjacjach, są bardziej złożone, jak wykaże dalsza analiza, lecz nie oglądajcie i nie porównujcie swych tabel, dopóki Wasze negocjacje nie zostaną zakończone). W Waszych negocjacjach każdy z uczestników będzie dysponował pełną tabelą. Każdy uczestnik zaczyna targowanie się w punkcie, który jest korzystny dla niego samego, lecz obaj będą musieli w końcu poczynić ustępstwa. Należy stosować się do następujących zasad uczciwej gry: • Powinieneś albo zaakceptować daną ofertę, albo wysunąć kontrofertę. • Targowanie odbywa się w dobrej wierze. Oznacza to, że każda oferta jest zawsze rzetelna. Jeśli nawet jakaś oferta zostanie początkowo odrzucona, każda ze stron może później zdecydować się ją przyjąć. Jednocześnie strona, która początkowo wysunęła tę ofertę, musi jej dotrzymać 566 • Nie mogą być zaakceptowane żadne umowy, które wiążą się ze stratami jednej ze stron. • Wszystkie oferty zgłasza się na piśmie, przy czym w każdej ofercie określa się zarówno cenę, jak i ilość towaru. • Nie wolno rozmawiać. RYSUNEK 16-1 Czyta tylko KUPUJĄCY Zamierzasz zakupić kukurydzę. Jesteś właścicielem sklepu spożywczego, zaś Stowarzyszenie Niezależnych Właścicieli Sklepów Spożywczych wybrało cię, abyś reprezentował ich w negocjacjach z farmerami. Małe miejscowe sklepy spożywcze znajdują się w poważnych kłopotach ekonomicznych ze względu na konkurencję ze strony wielkich domów towarowych. W ubiegłym roku czasy były ciężkie i wielu właścicieli małych sklepów było zmuszonych ogłosić bankructwo lub odsprzedać swe sklepy za bardzo niską cenę przedstawicielom supermarketów. Tego roku wielu właścicieli małych niezależnych sklepów ma długi z poprzednich lat. Co najmniej jedna z rodzin ma do uregulowania duże rachunki lekarskie, nie zapłacone we właściwym czasie. W tym roku właściciele sklepów porozumieli się, aby działać wspólnie przy nabywaniu produktów rolnych, mając nadzieję, że ich połączona siła nabywcza pozwoli im kupować dostatecznie duże ilości produktów spożywczych, tak aby płacone przez nich ceny nie były zbyt wysokie w porównaniu z cenami płaconymi przez domy towarowe. Ponadto jesteście gotowi zakupić kukurydzę wcześnie, spodziewając się uzyskać przewagę w czasie nad domami towarowymi, które nie są jeszcze gotowe do rozpoczęcia negocjacji. (Działy zaopatrzenia wielkich supermarketów są dotknięte strajkiem ich personelu). W tej sytuacji jesteś jedynym kupcem na dużą, handlową skalę. Tak więc reprezentujesz jedyny rynek zbytu dla kukurydzy i chcesz uzyskać możliwie najwyższe zyski dla swych kolegów - kupców. (Teraz przeczytaj paragraf zatytułowany Procedura targowania się na s. 565). RYSUNEK 16-2 Czyta tylko SPRZEDAJĄCY Wyobraź sobie, że zamierzasz sprzedać kukurydzę. Jesteś farmerem i Spółdzielnia Farmerów wybrała cię, abyś reprezentował ją w negocjacjach. Ubiegłego roku w wielu farmach wystąpiły poważne trudności, gdyż susza i choroby przyczyniły się łącznie do powstania takich trudności w różnych indywidualnych, małych farmach, które reprezentuje Spółdzielnia. W tym roku sytuacja była znacznie lepsza, lecz wielu farmerów i ich rodziny mają duże długi z poprzedniego roku. Co najmniej jedna z rodzin ma do tej pory nie zapłacone duże rachunki lekarskie. Jest ważne, abyś wynegocjował dobrą cenę za tegoroczne zbiory kukurydzy. W tym roku zebraliście kukurydzę wcześnie, tak że stanowicie jedyne źródło zaopatrzenia w kukurydzę w ilościach handlowych. Tak więc reprezentujecie jedyne źródło podaży. Chcesz uzyskać możliwie największy zysk, ponieważ twoi farmerzy potrzebują go. (Teraz przeczytaj paragraf zatytułowany Procedura targowania się na s. 565). A teraz spróbujcie rozegrać tę grę. W książce zamieściliśmy zarówno tabele zysków kupującego, jak i tabelę zysków sprzedającego. Jeśli prowadzicie negocjacje we dwóch (i posługujecie się tylko jedną książką), usiądźcie po obu stronach stołu. Tabele w książce umieściliśmy w ten sposób, że każdy z Was będzie mógł widzieć tylko tę tabelę, którą się posługuje. Tabela dla kupującego znajduje się na s. 568, a dla sprzedającego na s. 571. Przewodnik kupca jest po lewej stronie kartki, przewodnik sprzedawcy po prawej, rozdzielone są one jedną kartką tekstu. Trzymajcie kartkę oddzielającą obie tabele w położeniu pionowym, tak aby stanowiła przegrodę między wami. [Jeśli grasz rolę obu stron, czyń to uczciwie. Wczuj się w rolę kupującego i zapisz ofertę na kawałku papieru. Następnie znajdź tabelę sprzedającego, wczuj się w rolę sprzedającego i przeanalizuj tę ofertę. Posługując się tabelą zysku i pamiętając poprzednie oferty albo zaakceptuj ofertę, albo wysuń kontrofertę. Następnie wróć do roli sprzedającego. Tabele te są dostatecznie skomplikowane, abyś miał pewne trudności w uzyskaniu nieuczciwej przewagi, jeśli grasz w tę grę uczciwie. Pamiętaj jednak, że zakłada się tutaj, iż ani kupujący, ani sprzedający nie znają tabeli zysków drugiej strony. 567 Proces negocjacji Gdy zakończycie grę negocjacyjną, przeanalizujcie procesy, dzięki którym doszło do porozumienia. Zwróćcie uwagę, w jaki sposób zachowanie każdej z osób wpływało na zachowanie drugiej osoby. Przy ustalaniu swej pozycji przetargowej każdy z uczestników musiał brać pod uwagę ograniczenia nałożone na drugiego uczestnika, nawet jeśli nie wiedział dokładnie, jakie one mogą być. Poziom aspiracji. Jednym z czynników, który w istotny sposób wpływa na zachowanie się osób targujących się, jest poziom ich aspiracji. Przypomnij sobie swoje własne zachowanie. Prawdopodobnie początkowo zacząłeś od zbadania zakresu możliwych zysków, odpowiadających różnym kombinacjom cen i ilości towarów w tabeli, wybierając jako swój cel taki zakres zysków, jaki miałeś zamiar osiągnąć. Następnie wysuwałeś swoje oferty w taki sposób, aby w końcu znaleźć się blisko swego celu. Zapewne zostałeś brutalnie sprowadzony na ziemię przez początkowe oferty swego przeciwnika, ponieważ oferty te najprawdopodobniej oznaczały dla ciebie niewielki zysk lub żaden. Poczynając od tego punktu targowanie zwykle przebiega nieco podobnie jak mecz szermierczy, przy czym każdy z uczestników stara się utrzymać swe zyski na możliwym do zaakceptowania poziomie, jednocześnie usiłując wykryć, jaki zakres cen i ilości towaru wydaje się możliwy do zaakceptowania przez jego przeciwnika. Ostateczny cel, jaki starasz się osiągnąć, nazywany jest poziomem aspiracji 568 RYSUNEK 16-4. Źródło: Siegal i Fouraker (1960. s. 114-115).(Tylko dla kupującego.) Przewodnik kupca. W tabeli przedstawiono zyski kupującego w centach w zależności od ceny i ilości zakupionego towaru. Cena zmienia się od 10 co 10 do 230 centów; ilość od 1 do 18. Zapis 10, 1, z 227 oznacza, że przy kupnie towaru w cenie 10 centów w ilości 1, zysk wynosi 227 centów. Aby odczytać z tabeli poszukiwaną wartość należy posłużyć się funkcją wyszukiwania (ctrl F) wpisując: cenę przecinek spacja ilość przecinek spacja z (np.10, 1, z). Liczba (np. 227) stojąca za literą z jest poszukiwanym zyskiem. Brak pozycji w tabeli oznacza stratę. W celu właściwego odczytu liczb przez program Screen Reader, należy ustawić opcję CZYTANIE DOKUMENTÓW na wypowiadanie wszystkich znaków. Aby mieć pewność, że korzysta się z właściwej tabeli zaleca się w trakcie negocjacji skopiowanie jej do oddzielnego dokumentu. 10, 1, z 227; 10, 2, z 446; 10, 3, z 660; 10, 4, z 968; 10, 5, z 1065; 10, 6, z 1260; 10, 7, z 1450; 10, 8, z 1624; 10, 9, z 1800; 10, 10, z 1970; 10, 11, z 2123; 10, 12, z 2280; 10, 13, z 2431; 10, 14, z 2562; 10, 15, z 2700; 10, 16, z 2832; 10, 17, z 2941; 10, 18, z 3060 20, 1, z 217; 20, 2, z 426; 20, 3, z 639; 20, 4, z 928; 20, 5, z 1015; 20, 6, z 1200; 20, 7, z 1380; 20, 8, z 1544; 20, 9, z 1710; 20, 10, z 1870; 20, 11, z 2013; 20, 12, z 2160; 20, 13, z 2301; 20, 14, z 2422; 20, 15, z 2550; 20, 16, z 2672; 20, 17, z 2771; 20, 18, z 2880; 30, 1, z 207; 30, 2, z 406; 30, 3, z 600; 30, 4, z 888; 30, 5, z 965; 30, 6, z 1140; 30, 7, z 1310; 30, 8, z 1446; 30, 9, z 1620; 30, 10, z 1770; 30, 11, z 1903; 30, 12, z 2040; 30, 13, z 2171; 30, 14, z 2282; 30, 15, z 2400; 30, 16, z 2512; 30, 17, z 2601; 30, 18, z 2700; 40, 1, z 197; 40, 2, z 386; 40, 3, z 570; 40, 4, z 848; 40, 5, z 915; 40, 6, z 1080; 40, 7, z 1240; 40, 8, z 1384; 40, 9, z 1530; 40, 10, z 1670; 40, 11, z 1793; 40, 12, z 1920; 40, 13, z 2041; 40, 14, z 2142; 40, 15, z 2250; 40, 16, z 2352; 40, 17, z 2431; 40, 18, z 2520; 50, 1, z 187; 50, 2, z 366; 50, 3, z 540; 50, 4, z 808; 50, 5, z 865; 50, 6, z 1020; 50, 7, z 1170; 50, 8, z 1304; 50, 9, z 1440; 50, 10, z 1570; 50, 11, z 1683; 50, 12, z 1800; 50, 13, z 1911; 50, 14, z 2002; 50, 15, z 2100; 50, 16, z 2192; 50, 17, z 2261; 50, 18, z 2340; 60, 1, z 177; 60, 2, z 346; 60, 3, z 510; 60, 4, z 768; 60, 5, z 815; 60, 6, z 960; 60, 7, z 1100; 60, 8, z 1224; 60, 9, z 1350; 60, 10, z 1470; 60, 11, z 1573; 60, 12, z 1680; 60, 13, z 1781; 60, 14, z 1862; 60, 15, z 1950; 60, 16, z 2032; 60, 17, z 2091; 60, 18, z 2160; 70, 1, z 167; 70, 2, z 326; 70, 3, z 480; 70, 4, z 728; 70, 5, z 765; 70, 6, z 900; 70, 7, z 1030; 70, 8, z 1144; 70, 9, z 1260; 70, 10, z 1370; 70, 11, z 1463; 70, 12, z 1560; 70, 13, z 1651; 70, 14, z 1722; 70, 15, z 1800; 70, 16, z 1872; 70, 17, z 1921; 70, 18, z 1980; 80, 1, z 157; 80, 2, z 306; 80, 3, z 450; 80, 4, z 688; 80, 5, z 715; 80, 6, z 840; 80, 7, z 960; 80, 8, z 1064; 80, 9, z 1170; 80, 10, z 1270; 80, 11, z 1353; 80, 12, z 1440; 80, 13, z 1521; 80, 14, z 1582; 80, 15, z 1650; 80, 16, z 1712; 80, 17, z 1751; 80, 18, z 1800; 90, 1, z 147; 90, 2, z 286; 90, 3, z 420; 90, 4, z 648; 90, 5, z 665; 90, 6, z 780; 90, 7, z 890; 90, 8, z 984; 90, 9, z 1080; 90, 10, z1170; 90, 11, z 1243; 90, 12, z 1320; 90, 13, z 1391; 90, 14, z 1442; 90, 15, z 1500; 90, 16, z 1552; 90, 17, z 1581; 90, 18, z 1620; 100, 1, z 137; 100, 2, z 266; 100, 3, z 390; 100, 4, z 608; 100, 5, z 615; 100, 6, z 720; 100, 7, z 820; 100, 8, z 904; 100, 9, z 990; 100, 10, z 1070; 100, 11, z 1133; 100, 12, z 1200; 100, 13, z 1261; 100, 14, z 1302; 100, 15, z 1350; 100, 16, z 1392; 100, 1, z 1411; 100, 18, z 1440; 110, 1, z 127; 110, 2, z 246; 110, 3, z 360; 110, 4, z 568; 110, 5, z 565; 110, 6, z 660; 110, 7, z 750; 110, 8, z 824; 110, 9, z 900; 110, 10, z 970; 110, 11, z 1023; 110, 12, z 1080; 110, 13, z 1131; 110, 14, z 1162; 110, 15, z 1200; 110, 16, z1232; 110, 17, z 1241; 110, 18, z 1260; 120, 1, z 117; 120, 2, z 226; 120, 3, z 330; 120, 4, z 528; 120, 5, z 515; 120, 6, z 600; 120, 7, z 680; 120, 8, z 744; 120, 9, z 810; 120, 10, z 870; 120, 11, z 913; 120, 12, z 960; 120, 13, z 1001; 120, 14, z 1022; 120, 15, z 1050; 120, 16, z 1072; 120, 17, z 1071; 120, 18, z 1080; 130, 1, z 107; 130, 2, z 206; 130, 3, z 300; 130, 4, z 388; 130, 5, z 465; 130, 6, z 540; 130, 7, z 610; 130, 8, z 664; 130, 9, z 720; 130, 10, z 770; 130, 11, z 803; 130, 12, z 840; 130, 13, z 871; 130, 14, z 882; 130, 15, z 900; 130, 16, z 912; 130, 17, z 901; 130, 18, z 900; 140, 1, z 97; 140, 2, z 186;140, 3, z 270; 140, 4, z 348; 140, 5, z 415; 140, 6, z 480; 140, 7, z 540; 140, 8, z 584; 140, 9, z 630; 140, 10, z 670; 140, 11, z 693; 140, 12, z 720; 140, 13, z 741; 140, 14, z 742; 140, 15, z 750; 140, 16, z 752; 140, 17, z 731; 140, 18, z 720; 150, 1, z 87; 150, 2, z 166; 150, 3, z 240; 150, 4, z 308; 150, 5, z 365; 150, 6, z 420; 150, 7, z 470; 150, 8, z 504; 150, 9, z 540; 150, 10, z 570; 150, 11, z 583; 150, 12, z 600; 150, 13, z 611; 150, 14, z 602; 150, 15, z 600; 150, 16, z 592; 150, 17, z 561; 150, 18, z 540; 160, 1, z 77; 160, 2, z 146; 160, 3, z 210; 160, 4, z 268; 160, 5, z 315; 160, 6, z 360; 160, 7, z 400; 160, 8, z 424; 160, 9, z 450; 160, 10, z 470; 160, 11, z 473; 160, 12, z 480; 160, 13, z 481; 160, 14, z 462; 160, 15, z 450; 160, 16, z 432; 160, 17, z 391; 160, 18, z 360; 170, 1, z 67; 170, 2, z 126; 1170, 3, z 180; 170, 4, z 228; 170, 5, z 265; 170, 6, z 300; 170, 7, z 330; 170, 8, z 344; 170, 9, z 360; 170, 10, z 370; 170, 11, z 363; 170, 12, z 360; 170, 13, z 351; 170, 14, z 322; 170, 15, z 300; 170, 16, z 272; 170, 17, z 221; 170, 18, z 180; 180, 1, z 57; 180, 2, z 106; 180, 3, z 150; 180, 4, z 188; 180, 5, z 215; 180, 6, z 240; 180, 7, z 260; 180, 8, z 264; 180, 9, z 270; 180, 10, z 270; 180, 11, z 253; 180, 12, z 240; 180, 13, z 221; 180, 14, z 182; 180, 15, z 150; 180, 16, z 112; 180, 17, z 51; 180, 18, z 0; 190, 1, z 47; 190, 2, z 86; 190, 3, z 120; 190, 4, z 148; 190, 5, z 165; 190, 6, z 180; 190, 7, z 190; 190, 8, z 184; 190, 9, z 180; 190, 10, z 170; 190, 11, z 143; 190, 12, z 120; 190, 13, z 91; 190, 14, z 42; 190, 15, z 0; 200, 1, z 37; 200, 2, z 66; 200, 3, z 90; 200, 4, z 108; 200, 5, z 115; 200, 6, z 120; 200, 7, z 120; 200, 8, z 104; 200, 9, z 90; 200, 10, z 70; 200, 11, z 33; 200, 12, z 0; 210, 1, z 27; 210, 2, z 46; 210, 3, z 60; 210, 4, z 68; 210, 5, z 65; 210, 6, z 60; 210, 7, z 50; 210, 8, z 24; 210, 9, z 0; 220, 1, z 17; 220, 2, z 26; 220, 3, z 30; 220, 4, z 28; 220, 5, z 15; 220, 6, z 0; 230, 1, z 7; 230, 2, z 6; 230, 3, z 0 569 Poziom aspiracji odgrywa ważną rolę w wielu zachowaniach człowieka, ponieważ zwykle określa on sposób, w jaki ludzie będą zachowywać się w najrozmaitszych sytuacjach. Osoba, która z reguły ustala sobie wysoki poziom aspiracji, postępuje w sposób zupełnie odmienny niż osoba, która ustanawia sobie niski poziom aspiracji. Często poziom aspiracji decyduje o sukcesie, przy czym osoba o wysokim poziomie aspiracji ma większe osiągnięcia niż osoba o bardziej skromnych ambicjach. Osiągnięcia te mogą, oczywiście, wynikać z dwu przyczyn. Człowiek, który ustala sobie wysoki poziom aspiracji, może być bardziej kompetentny czy mieć wyższe kwalifikacje niż człowiek, który ustanawia sobie niski poziom aspiracji. Z drugiej strony, człowiek, który ma wysoki poziom aspiracji może być przez to pobudzony do efektywnego działania, zarówno odmawiając zgody na rezultaty zbyt odległe od celu, jaki sobie postawił, jak i dzięki dużej pewności siebie, która często towarzyszy wytyczaniu ambitnych celów. Na przykład w przedstawionej tu sytuacji targowania się końcowy rezultat zależy od ugody osiągniętej wspólnie przez obie targujące się osoby. Poziom aspiracji każdego z targujących się ma duży wpływ na ten końcowy rezultat. 570 Uczestnik, który ustala sobie wysoki poziom aspiracji i trzyma się go, może z powodzeniem uzyskać w końcu większy zysk niż ten, który ustanowił sobie niski poziom aspiracji. Dzieje się tak nie dlatego, że zwycięzca posiada jakąś jedyną w swoim rodzaju umiejętność czy też ma jakąś przewagę w tabeli zysków. Po prostu odmawia on czynienia ustępstw na rzecz swego przeciwnika, które spowodowałyby osiągnięcie zysku niższego od jego poziomu aspiracji. Oprócz tego ogólnego wpływu poziomu aspiracji, w serii eksperymentów przeprowadzonych przez Siegala i Fourakera wykryto także kilka innych aspektów sytuacji targowania się. [Podana tu gra targowania się, łącznie z tabelami, pochodzi z książki, w której Siegal i Fouraker opisali swe eksperymenty (1960)]. Jedno z głównych zagadnień dotyczy różnych typów strategii przyjmowanych przez targujących się. Istnieje wiele różnych, możliwych odmian procedury targowania się i strategie targujących się różnią się zależnie od sytuacji. W sytuacji ilustrowanej tu za pomocą tabel żaden z targujących się nie zna tabeli zysków swego przeciwnika, taka sytuacja eksperymentalna zwana jest niekompletna-niekompletna: Każda z osób dysponuje niekompletną wiedzą co do tabeli zysków swego partnera. Co jednak się dzieje, gdy jedna ze stron zna obie tabele zysków, lecz druga strona zna tylko swoją własną -sytuacja zwana kompletna-niekompletna Wynik zależy od strategii negocjacyjnej przyjętej przez stronę, która dysponuje wiedzą. Szczególnie interesujące są dwie strategie, jedną można nazwać uczciwą (fair); drugą można określić jako bezlitosną (ruthless). Strategia uczciwa. Jeśli obaj przeciwnicy są uczciwymi, rozsądnymi ludźmi, to posiadanie zbyt wielu informacji o drugim może w konsekwencji okazać się niekorzystne. Oto, co się dzieje. Gdy jeden z targujących się zna obie tabele zysków, może on po prostu wiedzieć, jakie wartości zysków byłyby do przyjęcia dla obu uczestników. Stwierdza on, że większość cen i ilości towarów, które dałyby mu duże zyski, są nie do przyjęcia dla drugiej strony, toteż unika ich. Może on postawić sobie za cel osiągnięcie takiej ceny i ilości towaru, które przyniosą równe zyski dla obu uczestników - „uczciwe" rozwiązanie. Innymi słowy, ustala on sobie niski poziom aspiracji. Jego przeciwnik nie zna obu tabel zysków. Zazwyczaj ustala on sobie początkowo wysoki poziom aspiracji. Ponadto zachowanie jego jest wzmacniane przez szybkość, z jaką jego przeciwnik zaczyna oferować mu możliwe do przyjęcia zyski. Oferty dające mu takie rozsądne zyski, wysuwane przez poinformowanego uczestnika, potwierdzają jego oceny dotyczące tego, jak daleko może się posunąć. Uczestnik nie poinformowany często wygrywa, ponieważ targującego się, który dysponuje kompletną informacją, spotykają liczne niepowodzenia, gdy stara się trzymać swych rozsądnych wymagań. Sytuacja targowania się wytwarza silne naciski, wynikające z usiłowań uratowania pewnych zysków, a zarazem uczynienia ustępstw na rzecz przeciwnika (jeśli nie osiągnie się porozumienia, nie można uzyskać żadnych zysków). Jest oczywiste, że człowiek uczciwy znajduje się w najgorszym położeniu, jeśli posiada, zbyt wiele informacji. 571 RYSUNEK 16-5. Źródło: Siegal i Fouraker (1960, s. 114-115).( Tylko dla sprzedającego.) Przewodnik sprzedawcy. W tabeli przedstawiono zyski sprzedającego w centach w zależności od ceny i ilości sprzedanego towaru. Cena zmienia się od 10 co 10 do 240 centów; ilość od 1 do 18. Zapis 10, 1, z 0 oznacza, że przy kupnie towaru w cenie 10 centów w ilości 1, zysk wynosi 0 centów. Aby odczytać z tabeli poszukiwaną wartość należy posłużyć się funkcją wyszukiwania (ctrl F) wpisując: cenę przecinek spacja ilość przecinek spacja z (np.10, 1, z). Liczba stojąca za literą z jest poszukiwanym zyskiem. Brak pozycji w tabeli oznacza stratę. W celu właściwego odczytu liczb przez program Screen Reader, należy ustawić opcję CZYTANIE DOKUMENTÓW na wypowiadanie wszystkich znaków. Aby mieć pewność, że korzysta się z właściwej tabeli zaleca się w trakcie negocjacji skopiowanie jej do oddzielnego dokumentu. 10, 1, z 0; 20, 1, z 10; 20, 2, z 0; 30, 1, z 20; 30, 2, z 20; 30, 3, z 0; 40, 1, z 30; 40, 2, z 40; 40, 3, z 30; 40, 4, z 0; 50, 1, z 40; 50, 2, z 60; 50, 3, z 60; 50, 4, z 40; 50, 5, z 0; 60, 1, z 50; 60, 2, z 80; 60, 3, z 90; 60, 4, z 80; 60, 5, z 50; 60, 6, z 0; 70, 1, z 60; 70, 2, z 100; 70, 3, z 120; 70, 4, z 120; 70, 5, z 100; 70, 6, z 60; 70, 7, z 0; 80, 1, z 70; 80, 2, z 120; 80, 3, z 150; 80, 4, z 160; 80, 5, z 150; 80, 6, z 120; 80, 7, z 70; 80, 8, z 0; 90, 1, z 80; 90, 2, z 140; 90, 3, z 180; 90, 4, z 200; 90, 5, z 200; 90, 6, z 180; 90, 7, z 140; 90, 8, z 80; 90, 9, z 0; 100, 1, z 90; 100, 2, z 160; 100, 3, z 210; 100, 4, z 240; 100, 5, z 250; 100, 6, z 240; 100, 7, z 210; 100, 8, z 160; 100, 9, z 90; 100, 10, z 0; 110, 1, z 100; 110, 2, z 180; 110, 3, z 240; 110, 4, z 280; 110, 5, z 300; 110, 6, z 300; 110, 7, z 280; 110, 8, z 240; 110, 9, z 180; 110, 10, z 100; 110, 11, z 0; 120, 1, z 110; 120, 2, z 200; 120, 3, z 270; 120, 4, z 320; 120, 5, z 350; 120, 6, z 360; 120, 7, z 350; 120, 8, z 320; 120, 9, z 270; 120, 10, z 200; 120, 11, z 110; 120, 12, z 0; 130, 1, z 120; 130, 2, z 220; 130, 3, z 300; 130, 4, z 360; 130, 5, z 400; 130, 6, z 420; 130, 7, z 420; 130, 8, z 400; 130, 9, z 360; 130, 10, z 300; 130, 11, z 220; 130, 12, z 120; 130, 13, z 0; 140, 1, z 130; 140, 2, z 240;140, 3, z 330; 140, 4, z 400; 140, 5, z 450; 140, 6, z 480; 140, 7, z 490; 140, 8, z 480; 140, 9, z 450; 140, 10, z 400; 140, 11, z 330; 140, 12, z 240; 140, 13, z 130; 140, 14, z 0; 150, 1, z 140; 150, 2, z 260; 150, 3, z 360; 150, 4, z 440; 150, 5, z 500; 150, 6, z 540; 150, 7, z 560; 150, 8, z 560; 150, 9, z 540; 150, 10, z 500; 150, 11, z 440; 150, 12, z 360; 150, 13, z 260; 150, 14, z 140; 150, 15, z 0; 160, 1, z 150; 160, 2, z 280; 160, 3, z 390; 160, 4, z 480; 160, 5, z 550; 160, 6, z 600; 160, 7, z 630; 160, 8, z 640; 160, 9, z 630; 160, 10, z 600; 160, 11, z 550; 160, 12, z 480; 160, 13, z 390; 160, 14, z 280; 160, 15, z 150; 160, 16, z 0; 170, 1, z 160; 170, 2, z 300; 1170, 3, z 420; 170, 4, z 520; 170, 5, z 60; 170, 6, z 660; 170, 7, z 700; 170, 8, z 720; 170, 9, z 720; 170, 10, z 700; 170, 11, z 660; 170, 12, z 600; 170, 13, z 520; 170, 14, z 420; 170, 15, z 300; 170, 16, z 160; 170, 17, z 0; 180, 1, z 170; 180, 2, z 320; 180, 3, z 450; 180, 4, z 560; 180, 5, z 650; 180, 6, z 720; 180, 7, z 770; 180, 8, z 800; 180, 9, z 810; 180, 10, z 800; 180, 11, z 770; 180, 12, z 720; 180, 13, z 650; 180, 14, z 560; 180, 15, z 450; 180, 16, z 320; 180, 17, z 170; 180, 18, z 0; 190, 1, z 180; 190, 2, z 340; 190, 3, z 480; 190, 4, z 600; 190, 5, z 700; 190, 6, z 780; 190, 7, z 840; 190, 8, z 880; 190, 9, z 900; 190, 10, z 900; 190, 11, z 880; 190, 12, z 840; 190, 13, z 780; 190, 14, z 700; 190, 15, z 600; 190, 16, z 480; 190, 17, z 340; 190, 18, z 180; 200, 1, z 190; 200, 2, z 360; 200, 3, z 510; 200, 4, z 640; 200, 5, z 750; 200, 6, z 840; 200, 7, z 910; 200, 8, z 960; 200, 9, z 990; 200, 10, z 1000; 200, 11, z 990; 200, 12, z 960; 200, 13, z 910; 200, 14, z 840; 20, 15, z 750; 200, 16, z 640; 200, 17, z 510; 120, 18, z 360; 210, 1, z 200; 210, 2, z 380; 210, 3, z 540; 210, 4, z 680; 210, 5, z 800; 210, 6, z 900; 210, 7, z 980; 210, 8, z 1040; 210, 9, z 1080; 210, 10, z 1100; 210, 11, z 1100; 210, 12, z 1080; 210, 13, z 1040; 210, 14, z 980; 210, 15, z 900; 210, 16, z 800; 210, 17, z 680; 210, 18, z 540; 220, 1, z 210; 220, 2, z 400; 220, 3, z 570; 220, 4, z 720; 220, 5, z 850; 220, 6, z 960; 220, 7, z 1050; 220, 8, z 1120; 220, 9, z 1170; 220, 10, z 1200; 220, 11, z 1210; 220, 12, z 1200; 220, 13, z 1170; 220, 14, z 1120; 220, 15, z 1050; 220, 16, z 960; 220, 17, z 850; 220, 18, z 720; 230, 1, z 220; 230, 2, z 420; 230, 3, z 600 230, 4, z 760; 230, 5, z 900; 230, 6, z 1020; 230, 7, z 1120; 230, 8, z 1200; 230, 9, z 1260; 230, 10, z 1300; 230, 11, z 1320; 230, 12, z 1320; 230, 13, z 1300; 230, 14, z 1260; 230, 15, z 1200; 230, 16, z 1120; 230, 17, z 1020; 230, 18, z 900; 240, 1, z 230; 240, 2, z 440; 240, 3, z 630 240, 4, z 800; 240, 5, z 950; 240, 6, z 1080; 240, 7, z 1190; 240, 8, z 1280; 240, 9, z 1350; 240, 10, z 1400; 240, 11, z 1430; 240, 12, z 1440; 240, 13, z 1430; 240, 14, z 1400; 240, 15, z 1350; 240, 16, z 1280; 240, 17, z 1190; 240, 18, z 1080; 572 Strategia bezlitosna. Jeśli osoba targująca się posiada kompletną, informację, a jest przy tym bezlitosna w swym postanowieniu, żeby uzyskać jak największe zyski, to może ona wykorzystać ją do systematycznego manipulowania poziomem aspiracji swego przeciwnika. W zasadzie człowiek bezlitosny potrzebuje tylko dwóch rzeczy. Po pierwsze, musi on znać główne zasady teorii uczenia się, a mianowicie, że rodzaj wzmocnień za pozytywne zachowanie, jak też brak wzmocnień za negatywne zachowania może mieć potężny wpływ na postępowanie. Wzmocnienia za negatywne zachowania mogą być bardzo słabe, jeżeli są stosowane i wstrzymywane w sposób konsekwentny. I tak pewna bezlitosna, w pełni poinformowana osoba targująca się rozpoczęła od oferty, która nie dawała jej przeciwnikowi żadnej szansy na jakikolwiek zysk. Następnie małe przyrosty zysku oferowała jedynie za duże ustępstwa. Gdy tylko przeciwnik stawiał opór nie chcąc czynić ustępstw, poinformowana osoba targująca się zmieniała swoje oferty w taki sposób, że nie dawały przeciwnikowi żadnego zysku. Ostateczny rezultat był taki, że w pełni poinformowana osoba targująca się uzyskała znaczny zysk, podczas gdy osoba o niepełnej informacji była bardzo zadowolona z małej sumy, którą udało jej się uratować. Zaletą teorii uczenia się, odpowiednio stosowanej, jest to, że nie tylko może ona prowadzić do uzyskiwania korzystnych rezultatów przez bezlitosnego gracza- otrzymywanie wielu kolejnych wzmocnień jest tak przyjemne, że niepoinformowana osoba targująca się jest nie tylko zadowolona ze swych osiągnięć, lecz ponadto chce grać (i tracić) znowu. We wszystkich tych przykładach społecznego podejmowania decyzji nie działały żadne czynniki osobowościowe. Wszystko było (lub powinno być) przeprowadzone w zimny, bezosobowy sposób. Co się jednak stanie, jeśli włączą się w to czynniki osobowościowe? Zgodnie z podstawowymi zasadami teorii decyzji powinno się maksymalizować zyski, a zatem czynniki osobowościowe nie powinny naprawdę czynić żadnej różnicy. Oczywiście tak nie jest. Zastanów się, co mogłoby się zdarzyć, gdybyś znał położenie swego przeciwnika. Czy cała struktura targu nie uległaby zmianie, gdyby było wiadome, że jeden z uczestników jest złośliwy, nastawiony na zysk i bezlitosny, w pełni świadomy problemów swego przeciwnika, lecz całkowicie nieczuły na nie, dbający jedynie o swoje zyski bez względu na koszty innych? Negocjacje strategiczne Wiemy już coś nie coś o naturze negocjacji interpersonalnych w czasie targowania się. Główną cechą normalnej sytuacji targowania się jest to, że żaden z przeciwników nie zna macierzy wypłat swego partnera, a jednak obaj muszą dojść do pewnego kompromisu, jeśli każdy z nich ma coś zyskać. W sytuacjach tych komunikowanie się jest zarówno bezosobowe, jak i ograniczone. Posunięcia i kontrposunięcia podczas negocjacji rzadko ograniczają się do prostej, nieodwołalnej oferty określonego wyniku. W większości sytuacji, w których dwie strony muszą negocjować ze sobą, możliwych taktyk negocjowania jest znacznie więcej i są bardziej wyrafinowane. Ponadto macierz wypłat każdego z przeciwników jest zwykle znana obu stronom. Ogólny cel jest nadal ten sam: zmaksymalizować własną wygraną, usiłując zmusić przeciwnika do podjęcia korzystnej dla Ciebie decyzji. Gdy kanały komunikacji otwierają się, taktyka zmienia się: 573 można teraz stosować broń w postaci groźby, obietnicy i zobowiązania. Zbadajmy, w jaki sposób działają te środki? Przeanalizujmy sytuację konfliktową. Obie strony nie wierzą sobie nawzajem, tak że nie jest możliwe osiągnięcie zadowalającego rozwiązania po prostu dzięki wzajemnemu zrozumieniu i dobrej woli, mimo że taka ugoda prawdopodobnie byłaby dla obu stron lepsza niż niezadowalający kompromis, na jaki się zgodzą w wyniku groźby i przeciwgroźby. Taktyka konfliktu Konflikt można uważać za walkę, w której każda strona stara się polepszyć swoje położenie. Zwykle obie strony mogą równocześnie poprawić swoją sytuację, tak że nie muszą one nieodmiennie przeciwstawiać się sobie nawzajem. W konflikcie groźby są lepsze niż działania, ponieważ te ostatnie często niszczą tyle samo, ile przynoszą zysków. Konflikt jest zatem w zasadzie sytuacją targowania się. [Następujące dalej omówienie oparte jest na książce Schellinga The strategy of Conflict (1963). Wszystkie cytaty w tym paragrafie pochodzą z pracy Schellinga.] W jaki sposób pozbawiona skrupułów osoba targująca się zmusza przeciwnika do podporządkowania się swym wymaganiom? Racjonalność nie jest zaletą. Pełna informacja, dobra komunikacja i zdolność skutecznego podejmowania decyzji-wszystko to może stać się ciężarem. Często człowiek (lub naród) dysponujący mocniejszymi atutami w sytuacji konfliktowej jest stroną słabszą. Racjonalność. Racjonalność jest często słabym punktem. Jeśli druga strona wie, że jesteś racjonalny, możesz być wskutek tego w gorszym położeniu. „Jeśli jakiś człowiek zapuka do Twoich drzwi i powie, że pchnie Cię nożem, jeśli nie dostanie 10 dolarów, to jest dosyć prawdopodobne, że otrzyma te 10 dolarów, zwłaszcza gdy jego oczy są nabiegłe krwią". Człowiek, który porywa samolot i zmusza pilota do lądowania w jakimś odległym kraju, wzbudza większy strach, gdy jest irracjonalny (cierpiał niegdyś na zaburzenia psychiczne), niż wtedy, gdy zdaje się być konsekwentny i sprawny. Jeśli jakiś maleńki kraik starannie rozpowszechnia wieści, że jego przywódca jest szaleńcem o dyktatorskiej władzy, to przywódca ten może zagrozić, że zrzuci śmiertelną truciznę do źródeł wód zaopatrujących Paryż, jeżeli Stany Zjednoczone nie przeproszą go za posadzenie jego ambasadora na zbyt mało zaszczytnym miejscu przy stole w czasie bankietu. Normalne reguły targowania się oparte są na założeniu, że każdy z uczestników ocenia koszty i kary w sposób racjonalny i że każdy stara się maksymalnie polepszyć własną sytuację. Jeśli jednak jedna ze stron jest irracjonalna, to wówczas strategie negocjacyjne zostają całkowicie zaburzone. Jeśli jest się przekonanym, że przeciwnik jest zdolny do właściwej oceny kosztów i kar lub jeśli nie dba on o nie, strategiczne manipulacje stają się wówczas nieefektywne. 574 Dobra komunikacja. Strona dysponująca najbardziej sprawną komunikacją często jest w gorszym położeniu. Jeżeli sprzeczasz się przez telefon ze swym przyjacielem, gdzie macie zjeść kolację, przy czym on ma ochotę na morskie ryby i skorupiaki w jednym końcu miasta, a Ty wolisz chińskie potrawy podawane w drugim jego końcu, to najlepsza strategia, jaką możesz wybrać, polega na tym, że oświadczasz, iż będziesz w chińskiej restauracji o godzinie 6.00 wieczorem i natychmiast wieszasz słuchawkę. Jeśli zechce on zjeść z Tobą kolację, to nie ma innego wyboru niż tam się z Tobą spotkać. Manipulacja kanałami komunikacyjnymi jest skuteczna zarówno jako groźba, jak i obrona przeciw groźbie. Jeśli groźba nie jest słyszana ani rozumiana, to zobowiązanie do wykonania jej staje się pozbawione sensu. Ojciec, który podejrzewa, że jego córka została porwana, może wyjechać z miasta przed rozpoczęciem jakichkolwiek negocjacji i pozostawać nieosiągalnym. Zastosowanie obcych wojsk przy tłumieniu rozruchów i demonstracji obywatelskich jest skuteczne także dlatego, że bariera językowa czyni je odpornymi na groźby, obietnice i zobowiązania. Ponadto może to nawet dodać pewnego elementu irracjonalności sytuacji decyzyjnej. Władza. Człowiek wyposażony we władzę podejmowania decyzji znajduje się w gorszym położeniu. Na negocjacje zawsze najlepiej jest wysłać osobę na niskim stanowisku, kogoś, kto po prostu wypełnia rozkazy. Wówczas, bez względu na to, jak przekonywające są argumenty drugiej strony, nawet jeśli w końcu zgodzi się on z nimi, nie może zmienić swej decyzji przetargowej. Jeśli jedna ze stron reprezentowana jest przez szefa, to każdy wie, że gdy tylko zostanie on przekonany - bez względu na to, jak dalece - to ma on dość władzy, aby ustąpić. Mądry rektor uniwersytetu zdecydowanie zaprzeczy, jakoby miał jakąś władzę nad policją. Tak więc, gdy na terenie uniwersytetu dojdzie do zaburzeń, może on powiedzieć studentom, że rozumie ich problemy i sympatyzuje z nimi, lecz naczelnik policji w mieście poinformował go, że jeśli zaburzenia nie skończą się w ciągu 1 godziny, zostanie wysłany oddział operacyjny. Dzięki brakowi władzy nad policją rektor może w radykalny sposób zwiększyć swą władzę. Manipulowanie macierzą wypłat. Jeśli groźba nie ma żadnego wpływu na proces decyzyjny, to traci ona skuteczność. Taktyka ta wydaje się słuszna, ponieważ z oceną czyichś kosztów i wartości wiąże się zwykle wysoki stopień niepewności. Jeżeli grupa porywaczy ma zakładnika ze sfer rządowych, to kontrreakcją rządu może być postępowanie w taki sposób, jak gdyby życie tego zakładnika nie miało żadnego znaczenia. Jeśli ktoś porwie syna wybitnego przedsiębiorcy, to mógłby on zareagować na to stwierdzeniem Jak to dobrze, że się go pozbyłem". Eskalacja gróźb i przeciwgróźb. Przypuśćmy, że ruch „Keep New York Small" („Utrzymajmy Nowy Jork Małym") sprzeciwia się budowie nowego 125-piętrowego wieżowca przy wjeździe na most Jerzego Waszyngtona. Nikt ich nie słucha, wobec czego decydują się udramatyzować swe stanowisko grożąc, że zatrzymają ruch kolejowy, jeżeli ich żądania nie zostaną spełnione. Zamierzają zrobić to wszystko w sposób pokojowy: 575 Nikt nie chce żadnych gwałtów. Koleje ignorują to oświadczenie. Teraz ruch realizuje swą groźbę w ten sposób, że jego uczestnicy siadają na jednym z torów kolejowych, zmuszając pociąg podmiejski do zatrzymania się. Maszynista pociągu jest rozsądnym człowiekiem, nie ma żadnego innego wyboru i musi się zatrzymać. Punkt dla ruchu. Towarzystwo kolejowe decyduje się zastosować przeciwgroźbę: polecając maszyniście, aby nastawił mechanizm sterowniczy pociągu w taki sposób, żeby posuwał się on bardzo powoli po szynach, a następnie wyskoczył z pociągu i szedł obok niego. Teraz nie ma on już możności zatrzymania pociągu, nawet gdyby chciał to uczynić: druga strona zrobi lepiej, jeśli zejdzie z torów. Punkt dla taktyki brak władzy. Jednakże ruch „Keep New York Smali" dysponuje oczywistą przeciwgroźbą. Tak więc następnym razem, gdy usiądą oni na torach, pozbawią się swej władzy poruszania się: przykują się kajdankami do torów. Następny punkt dla taktyki brak władzy. Maszynista nie odważy się opuścić pociągu. Ta ostatnia taktyka ma jednak słabe punkty, ponieważ w tym wypadku komunikacja odgrywa bardzo dużą rolę. Członkowie ruchu nie odważą się przykuć naprawdę, jeżeli nie będą pewni, że maszynista wie, iż oni są przykuci. Oczywiście, najlepszą kontrakcją kolei jest wyznaczyć na służbę w tym pociągu głuchego maszynistę. Punkt dla taktyki brak komunikacji. Przykład ten dobrze ilustruje trudności, jakie nasuwa stosowanie wszystkich tych taktyk opartych na groźbie. Przede wszystkim są to chwilowe, niestabilne rozwiązania określonych sytuacji. Wymuszają one jedynie zgodę zaocznie, gdyż partnerzy nie dochodzą do żadnego prawdziwego zrozumienia występujących tu problemów. Przekształcają one proces negocjacji w grę, zaś główna trudność związana z ujmowaniem sprawy w ten sposób polega na tym, że zawsze zdaje się istnieć jakieś kontrposunięcie. Niestety, gdy negocjacje trzeba prowadzić w sytuacji braku wzajemnego zaufania, często nie ma innego wyjścia niż postępować zgodnie z tym scenariuszem, cios za cios. Nie istnieje żadne sensowne rozwiązanie tych problemów. Psychologowie starają się analizować je formalnie, zwykle za pomocą zbioru technik matematycznych, znanych pod nazwą „teorii gier". Ostrzegamy, że chociaż teoria gier może być interesująca, to jednak jest ona wysoce kontrowersyjna jako metoda analizowania zachowania ludzi. W swej analizie jest ona również wysoce specjalistyczna i często wymaga dobrej znajomości wyższej matematyki. GRY I DECYZJE Jednym ze sposobów podejścia umożliwiającego analizę podejmowania decyzji w kontekście społecznym jest teoria gier. Teoria gier jest w swym duchu podobna do badań nad racjonalnym podejmowaniem decyzji, które omawialiśmy w poprzednim rozdziale. Dąży ona do ustalenia formalnej definicji sytuacji decyzyjnej i wyprowadzenia racjonalnych rozwiązań. Aczkolwiek do tej pory teoria gier nie zdołała uwzględnić w wystarczający sposób niektórych bardziej złożonych czynników działających w sytuacji społecznego podejmowania decyzji, stanowi ona doskonały punkt wyjścia dla badań nad podejmowaniem decyzji w kontekście społecznym. 576 Gra ściśle rywalizacyjna Podstawowym elementem społecznego podejmowania decyzji jest fakt, że wynik zależy od łącznych działań wielu osób. Zaczniemy od najprostszego przypadku-sytuacji, w której dwaj gracze są swymi przeciwnikami w pewnej grze. Każdy z graczy wybiera pewien sposób działania spośród różnych dostępnych mu działań. Swego wyboru dokonuje sam, bez komunikowania się z drugim graczem. Obaj gracze, gdy już podejmą swe decyzje, równocześnie ujawniają je (właściwym sposobem dokonania tego jest zapisywanie wybranych działań i wręczenie ich bezstronnemu rozjemcy). Najistotniejszym elementem gry jest macierz wypłat: zbiór wyników, jakie przynoszą różne kombinacje działań wybranych przez graczy. Jedna z możliwych form macierzy wypłat została przedstawiona w trzech częściach na rysunku 16-6. Górna macierz pokazuje, ile otrzyma gracz A za każdą kombinację działań, jakie może wybrać on i jego przeciwnik. Druga macierz przedstawia te same informacje dla gracza B. Dolna macierz jest macierzą łączną, która jest kombinacją obu powyższych macierzy-w taki właśnie sposób przedstawia się zwykle te informacje. RYSUNEK 16-6 A. Gra czysto konkurencyjna Wypłata jaką otrzyma gracz A Jeśli A wybierze 1 i B wybierze 1, wypłata A wynosi 3 Jeśli A wybierze 1 i B wybierze 2, wypłata A wynosi 0 Jeśli A wybierze 2 i B wybierze 1, wypłata A wynosi 5 Jeśli A wybierze 2 i B wybierze 2, wypłata A wynosi minus 5 Wypłata jaką otrzyma gracz B Jeśli A wybierze 1 i B wybierze 1, wypłata B wynosi minus 3 Jeśli A wybierze 1 i B wybierze 2, wypłata B wynosi 0 Jeśli A wybierze 2 i B wybierze 1, wypłata B wynosi minus 5 Jeśli A wybierze 2 i B wybierze 2, wypłata B wynosi 5 Wspólna matryca Jeśli A wybierze 1 i B wybierze 1, rezultat gry 3 do -3 Jeśli A wybierze 1 i B wybierze 2, rezultat gry 0 do 0 Jeśli A wybierze 2 i B wybierze 1, rezultat gry 5 do minus 5 Jeśli A wybierze 2 i B wybierze 2, rezultat gry minus 5 do 5 577 W macierzy łącznej liczba po lewej stronie reprezentuje zawsze wypłaty gracza wymienionego po lewej stronie macierzy (gracza A); liczba po prawej stronie oznacza wypłaty gracza wymienionego u góry (gracza B). Zgodnie z tymi macierzami wypłat, jeśli zarówno gracz A, jak i gracz B wybiorą działanie1, A otrzyma 3 dolary, a B straci 3 dolary. Jeśli obaj wybiorą 2, A straci 5 dolarów, a B zyska 5 dolarów. Problem zatem jest następujący: jeśli obaj gracze wiedzą, jak wygląda macierz wypłat, to jak powinni oni postąpić? Strategia decyzji w przypadku tej sytuacji jest dość prosta. Gracz A powinien rozumować mniej więcej tak: „Oczywiście ja chcę wygrać jak najwięcej - to znaczy, że powinienem grać 2, zaś B powinien grać 1, lecz B nie jest głupi. Straci on najwięcej, jeśli tak się stanie, a więc zagra on najprawdopodobniej 2. Jeśli B zagra 2, ja muszę grać 1, bo inaczej stracę 5 dolarów. A nawet jeśli B zagra 1, to i tak zyskam na tym". Sytuacja gracza B jest nieco inna: ma możność wyboru. Jeśli B gra 1, to zawsze traci. Jeśli gra 2, to w najgorszym wypadku może zremisować. A zatem w tej szczególnej grze oczekiwalibyśmy, że A wybierze 1, a B wybierze 2. Gra wtedy zawsze skończy się remisem. Jest to jedna z najprostszych sytuacji decyzyjnych, w których wyniki zależą od łącznych działań obu przeciwników. Określa się ją jako ściśle rywalizacyjną (lub ściśle konkurencyjną), ponieważ cokolwiek jeden z przeciwników wygra, drugi musi stracić. W języku teorii gier jest to gra o sumie zerowej. Nie istnieje taka kombinacja decyzji, przy której obaj mogliby zyskać lub obaj stracić. Grę tę "określa się także jako grę zdeterminowaną, ponieważ jej wynik dla racjonalnych graczy jest zawsze ten sam. Nie ma tu miejsca dla negocjacji, perswazji czy podstępów. Gracz B może zawczasu ogłosić swój sposób gry i stwierdzić, że zawsze będzie grał 2. Ta otwarta deklaracja nie skłoni A do zmiany swego wyboru z 1 na 2, ponieważ wtedy straciłby on 5 dolarów. Podobne oświadczenie gracza A, że zagra 2, nie wpłynęłoby na zachowanie B. To, czy istnieje komunikowanie się, czy zachowana jest dyskrecja, nie ma znaczenia i nie wpływa na wynik. Aby zapoznać się z bardziej interesującą i bardziej typową sytuacją, trzeba przede wszystkim usunąć podstawowe ograniczenie występujące w tej prostej, zdeterminowanej grze: a mianowicie tę jej właściwość, że istnieje taka łączna decyzja, która jest optymalna dla obu graczy. Gdy wiele zależy od podstępu Inne rozmieszczenie wypłat dla różnych kombinacji decyzji przekształca tę podstawową grę w znacznie ciekawszą i bardziej realistyczną sytuację decyzyjną. Przykład z historii zilustruje nam, co zdarza się wtedy, gdy nie istnieje określona kombinacja decyzji, która byłaby optymalna dla obu stron. Przed lądowaniem aliantów we Francji podczas II wojny światowej Niemcy musieli przewidzieć, gdzie zostanie skierowane główne uderzenie inwazji. Wzdłuż zachodniego wybrzeża Francji było wiele możliwych miejsc do wyboru, a do najbardziej prawdopodobnych należał port w Calais. Urządzenia portowe były niezbędne do szybkiego zorganizowania zaopatrzenia dla sił inwazyjnych. Mniej prawdopodobne, lecz też możliwe było lądowanie na plażach wzdłuż brzegów Normandii. Niemcy musieli wybrać, gdzie zlokalizować swe główne fortyfikacje i siły obronne; alianci musieli wybrać, czy atakować port czy plażę. Jest to łączna sytuacja decyzyjna i wyniki można przedstawić za pomocą macierzy wypłat (rys. 16-7). 578 RYSUNEK 16-7 Alianci atakują port, Niemcy bronią port, rezultat 0 do 0 (1) Alianci atakują port, Niemcy bronią wybrzeże, rezultat plus5 do -5 (2) Alianci atakują wybrzeże, Niemcy bronią port, rezultat plus3 do -3 (3) Alianci atakują wybrzeże, Niemcy bronią wybrzeże, rezultat -5 do plus5 (4) W macierzy tej zakłada się, że jeżeli alianci zaatakują silnie ufortyfikowany port broniony przez duże siły przeciwnika, to wynik będzie nierozstrzygnięty (0). Atak na otwarte plaże Normandii przeciw skoncentrowanej obronie byłby zapewne nieskuteczny: strata 5 dla aliantów, zysk 5 dla Niemców. Przyjmiemy także, że alianci zyskają więcej, jeśli zaatakują niebroniony port, niż jeśli zaatakują niebronioną plażę. Na pozór można by oczekiwać, że strategie decyzyjne obu przeciwników będą kształtować się tak, jak w poprzednim przykładzie. Obie strony mają przybliżone wypłaty dla różnych kombinacji decyzji. Gdy alianci przeanalizują tę sytuację decyzyjną, to powinni dojść do wniosku, że mogą zminimalizować swe maksymalne straty atakując port. Podobnie Niemcy mogliby uważać, że ich optymalna strategia polega na skoncentrowaniu swych możliwości obronnych w porcie (co w rzeczywistości uczynili). Można by oczekiwać, że wybór strategii (1) przez obie strony byłby niejako wynikiem automatycznym; wynik ten oznaczono (1) Jednakże dalsza analiza sugeruje, że w przeciwieństwie do poprzednio rozpatrywanej sytuacji wynik ten nie jest oczywisty. Przyjmijmy, że alianci śledzą przypuszczalne rozumowanie Niemców. Wówczas zorientują się oni, że Niemcy mogą oczekiwać, iż zaatakują port; Jeśli jednak Niemcy rzeczywiście przyjmą strategię (1), to alianci mogliby zyskać atakując plażę. Wynikiem tego byłaby klatka oznaczona (3) w macierzy decyzyjnej. Lecz Niemcy powinni przewidzieć tę linię rozumowania aliantów i mogliby odgadnąć, że alianci w rzeczywistości zaatakują plażę. W tym przypadku ich optymalny wybór uległby zmianie i powinni oni także skoncentrować swoje operacje obronne na plażach. Wynikiem byłaby klatka oznaczona (4). Jeśli jednak alianci przewidzą, co Niemcy pomyślą, że alianci pomyślą, to powinni oni zwrócić swój atak na niebroniony (obecnie) port, spodziewając się wyniku oznaczonego (2) jako wyniku ostatecznego. Oznacza to, że Niemcy powinni powrócić do swej początkowej strategii, aby uzyskać wynik (1). Krótko mówiąc, w tej sytuacji decyzyjnej nie ma żadnej stabilnej kombinacji wyborów: najlepsza strategia zależy od tego, co jeden gracz sądzi, że jego przeciwnik będzie sądził, że on sądzi, i tak dalej. Ta zmiana macierzy wypłat otwiera możliwość uwzględnienia działania czynników społecznych w sytuacji podejmowania decyzji. Nadaje ona znaczenie kombinacji, perswazji i podstępom. 579 Nie można już prawdziwej decyzji ogłaszać z góry, nie dając w ten sposób przewagi przeciwnikowi. Im więcej masz informacji o prawdopodobnej decyzji innych, tym większa twoja przewaga pod względem możliwości wpływania na ostateczny wynik. Dylemat więźnia Często mamy do czynienia z taką sytuacją decyzyjną, w której obaj uczestnicy stają wobec problemu polegającego na usiłowaniu określenia możliwych działań przeciwnika, mimo braku możliwości porozumienia się z nim. Sytuacja jest tego rodzaju, że istnieje rozwiązanie kooperacyjne, to znaczy, jeśli obaj przeciwnicy wybiorą właściwe postępowanie, obaj zyskają na tym. Istnieje także rozwiązanie rywalizacyjne, w którym pewna kombinacja działań przynosi stratę obu uczestnikom. W dwóch pozostałych możliwych wynikach, jeden korzysta kosztem drugiego. W jaki sposób uczestnicy dochodzą do podjęcia decyzji, jeśli negocjacje są niedozwolone? Sytuacja decyzyjna. Zasadniczy wzorzec sytuacji pochodzi jakoby od typowych propozycji wysuwanych pod adresem więźniów przez prokuratora prowadzącego śledztwo. Więźniowie A i B zostali aresztowani wskutek podejrzenia, że wspólnie popełnili poważne przestępstwo, lecz nie ma przeciw nim dowodów. Toteż prokurator okręgowy usiłuje skłonić więźniów do przyznania się. W tym celu oferuje „nagrodę". Każdego więźnia informuje się, że jeśli się przyzna, to uzyska przebaczenie i zostanie wypuszczony na wolność. W przeciwnym razie prokurator zrobi wszystko, co tylko jest możliwe, aby dostał najwyższy możliwy wyrok. Jeśli nie przyzna się, a jego wspólnik się przyzna, otrzyma maksymalną karę za to przestępstwo - 25 lat więzienia. Jeśli żaden z nich nie przyzna się, dowody umożliwiające skazanie nie będą zbyt silne. W najgorszym przypadku mogą zostać skazani za jakieś pomniejsze wykroczenie (takie jak zakłócenie porządku publicznego) i dostaną po 1 roku więzienia. Jeśli obaj przyznają się, to wówczas prokurator nie może zwolnić ich obu, lecz zaleci łagodny wymiar kary: przewiduje, że każdy otrzyma 10 lat więzienia. Sytuację tę przedstawia rysunek 16-8. RYSUNEK 16-8 Jeżeli A przyznaje się i B przyznaje się, wyrok A 10 lat, B 10 lat (1) Jeżeli A przyznaje się i B nie przyznaje się, wyrok A zwolniony, B 25 lat (2) Jeżeli A nie przyznaje się i B przyznaje się, wyrok A 25 lat, B zwolniony (3) Jeżeli A nie przyznaje się i B nie przyznaje się, wyrok A 1 rok, B 1 rok (4) 580 RYSUNEK 16-9 Uwaga wynik z lewej strony dotyczy więźnia B, z prawej więźnia A Sytuacja (1) rezultat minus 10 do minus 10 Sytuacja (2) rezultat minus 25 do 0 Sytuacja (3) rezultat 0 do minus 25 Sytuacja (4) rezultat minus 1 do minus 1 Dylemat jest oczywisty: najlepsza ogólna strategia polega na nieprzyznaniu się obu więźniów A i B. Lecz taki wspólny wybór zachowania wymaga, aby każdy z nich ufał drugiemu, a wobec niemożności komunikowania się utrzymanie wzajemnego zaufania może być trudne. Ponadto policja prawdopodobnie zrobi wszystko co w jej mocy, aby zmniejszyć do minimum możliwość, że jeden więzień będzie wierzył drugiemu, dając do zrozumienia, że wspólnik już się przyznał. Problem, przed którym stoją obaj więźniowe, jest w rzeczywistości problemem decyzyjnym o dość ogólnym charakterze: macierz wypłat jest przedstawiona na rysunku 16-9. Jeśli ktoś wierzy drugiemu, powinien wybrać strategię 2 (nie przyznawać się). Jeśli jednak istnieją jakieś wątpliwości, to wówczas strategia 1 pozostaje do przyjęcia. 17. Motywacja MÓZGOWE MECHANIZMY MOTYWACJI Elektryczna regulacja głodu i pragnienia Zaburzenia systemu regulacji motywacyjnej SYSTEMY REGULACJI MOTYWACYJNEJ Sprawdzian liczbowy Niesmaczny pokarm Kraina mlekiem i miodem płynąca Zakończenie jedzenia Karmienie z przetoką przełykową Napełniony żołądek Czynniki pozabiologiczne REAGOWANIE NA NIEPEWNOŚĆ Reakcje na stres BIOCHEMICZNE REAKCJE NA STRES Jak wytworzyć stres? Strach Reakcje na konflikt Konflikt dążenie-unikanie Frustracja Reakcje na nic Deprywacja sensoryczna Nerwowe mechanizmy wzbudzenia Wzbudzający układ siatkowaty SEN INTERPRETACJA WZBUDZENIA EMOCJONALNEGO Emocje: jedna czy wiele? Pomiary fizjologiczne Biofeedback (Biologiczne sprzężenie zwrotne) Jak wywołać gniew lub euforię? Wzbudzenie emocjonalne Warunki sytuacyjne Euforia Gniew Wyniki MOTYWACJA A POZNANIE 583 Różnorodne źródła informacji współdziałają ze sobą i wpływają na to, co zwierzę lub człowiek czyni - od jego myśli do poziomu hormonalnego, do potrzeb pokarmowych, do tego, co widzi w świecie zewnętrznym. Dotychczas koncentrowaliśmy się na badaniu czystych systemów odbioru i przetwarzania informacji: systemów, które pobierały informację z otoczenia lub z pamięci i poddawały ją niezbędnym kolejnym operacjom. W badaniach nad motywami biologicznymi będziemy po raz pierwszy mieli do czynienia z systemami, które bezpośrednio opierają się w swych operacjach na czynniku biochemicznym - systemami, dla których stan chemiczny organizmu jest jednym z najważniejszych wejść. MÓZGOWE MECHANIZMY MOTYWACJI Elektryczna regulacja głodu i pragnienia Weźmy dobrze nakarmione zwierzę, które wygląda na zupełnie zadowolone i któremu nic nie brakuje. Umieśćmy je w pomieszczeniu, gdzie będzie miało łatwy dostęp do ulubionego pokarmu. Jeśli jest ono naprawdę najedzone, nie będzie nic jadło. A teraz włączmy aparat stymulujący, połączony z elektrodą inplantowaną w struktury śródmózgowia zwierzęcia. Jeżeli elektroda została umieszczona w odpowiednim miejscu, zwierzę zacznie jeść i będzie jadło dopóty, dopóki utrzymywać się będzie stymulacja elektryczna. Przestanie jeść wkrótce po tym, jak przekręcimy wyłącznik prądu. Elektrody umieszczone we właściwych rejonach mózgu mogą w praktyce regulować reakcje pokarmowe zwierzęcia (Hoebel, 1969). Kiedy oglądamy taką demonstrację regulacji elektrycznej reakcji pokarmowych, nasuwa się nam podstawowe pytanie, czy w ten sposób rzeczywiście wzbudzamy normalny motyw głodu? Sceptycy dowodzą, że takie reakcje zwierzęcia nie mają nic wspólnego z motywacją. Jest całkiem możliwe, mówią oni, że elektroda po prostu wzbudza program regulacji mięśniowej związany z jedzeniem. Możliwość aktywizowania reakcji mięśniowych przez bodźce elektryczne ani nie jest czymś nowym, ani też nic nam nie mówi o motywacji. Jak można by przekonać sceptyków o tym, że stymulacja poprzez elektrody oddziałuje rzeczywiście na motywacyjny system regulacji zachowania? Przede wszystkim reakcja zwierzęcia musi charakteryzować się pewną liczbą cech istotnych. Po pierwsze, jego reakcja na prąd elektryczny nie powinna być po prostu automatyczną reakcją jedzenia jakiegokolwiek dostępnego pokarmu. Powinna ona zależeć raczej od tego, czego zwierzę nauczyło się w normalnych warunkach w swej przeszłości. Ponadto, zwierzę powinno przyswajać sobie nowe wzorce reakcji, jeżeli stare nie przynoszą pożądanych rezultatów. Wreszcie jego zachowanie powinno wyraźnie odnosić się do określonego typu motywacji, np. albo dla wody, albo dla pokarmu. Ten ostatni dowód rzeczowy jest potrzebny do wykluczenia możliwości, że elektroda po prostu wpływa na ogólny system aktywacji, 584 czyniąc zwierzę ogólnie bardziej gotowe do reakcji na wszystko to, co znajduje się w jego otoczeniu, łącznie z jedzeniem. Dopóki nie rozpatrzymy tych wszystkich problemów, dopóty sprawa regulacji elektrycznej systemów motywacyjnych pozostaje w zawieszeniu. Reakcje zwierzęcia na drgania elektryczne, które aktywizują obwody nerwowe w śródmózgowiu, są identyczne z reakcjami będącymi rezultatem biologicznego popędu głodu. Nie je ono po prostu pierwszego lepszego pokarmu, na który się natknie, a który nadaje się do jedzenia. Zwierzę konsekwentnie wykonuje te reakcje, które w jego uprzednim doświadczeniu prowadziły do uzyskania pokarmu. Będzie też zmieniać tę reakcję, która przestaje być efektywna w osiąganiu jedzenia. Krótko mówiąc, jego zachowanie jest takie samo, jak zachowanie się głodnego zwierzęcia, mimo że głód ten jest raczej elektrycznego niż biochemicznego pochodzenia (Hoebel, 1969). Podobne wyniki uzyskano ostatnio dla wielu różnych systemów motywacyjnych. Kozy, szczury, koty i małpy uczą się różnorodnych reakcji pod wpływem elektrycznej stymulacji mózgu w celu uzyskania takich rzeczy, jak: pokarm, woda czy partnerzy seksualni. Aktywizacja określonego systemu motywacyjnego zależy od dokładnego umieszczenia elektrody w odpowiednich strukturach śródmózgowia. Obecnie precyzyjna lokalizacja tych obszarów jest już dobrze poznana. W ten sposób zachowanie motywacyjne można dowolnie aktywizować całkiem niezależnie od jakichkolwiek deficytów biochemicznych w organizmie. Istnieją z kolei miejsca lokalizacji elektrod, które dają efekt wręcz przeciwny: zablokowanie motywacji. I tak głodne lub spragnione zwierzę może przestać jeść lub pić i powrócić do swego posiłku dopiero wówczas, gdy przestaje działać elektryczna stymulacja. Pierwszą wskazówką dotyczącą natury systemów motywacyjnych jest to, że ma w nich zastosowanie ogólna zasada pracy układu nerwowego, odbierającego i przetwarzającego informacje: że występują w nim zawsze dwa przeciwstawne sobie systemy-niezależnie od tego, czy odnosi się to do regulacji mięśniowej, analizy percepcyjnej, czy do motywacji-system pobudzeniowy będący w opozycji do systemu hamującego. Zaburzenia systemu regulacji motywacyjnej Jeżeli pobudzenie określonych obszarów mózgu zmusza nasycone zwierzę do jedzenia, to zniszczenie tych samych części mózgu poprzez przecięcie powoduje efekt odwrotny -sprawia, iż zwierzę, nawet gdy jest głodne, nie przejawia zainteresowania pokarmem. Podobnie, jeżeli stymulacja elektryczna pewnych obszarów mózgu powstrzymuje jedzenie u głodnego zwierzęcia, to chirurgiczne zniszczenie tego obszaru powoduje, że zwierzę je przez cały czas, nawet wtedy, kiedy nie jest głodne. Wnioski te opierają się na założeniu, że system regulacyjny przeciwstawia sobie mechanizmy pobudzenia i hamowania. Uszkodzenia mogą objąć zarówno pola pobudzeniowe, jak i hamulcowe. Uszkodzenie w określonym polu pobudzeniowym ośrodka głodu powoduje, że zwierzę odmawia spożycia pokarmu nawet wówczas, kiedy dosłownie umiera z głodu. Uszkodzenie w określonym polu hamowania powoduje, że zwierzę objada się i w końcu osiąga wagę ciała kilkakrotnie wyższą niż normalna 585 (ten stan nazywany jest hiperfagią). Uszkodzenie hamulcowego ośrodka głodu powoduje, że zwierzę wygląda tak, jakby bezustannie było głodne. Pomimo wilczego apetytu jest wybredne w tym, co dostaje do jedzenia. Tak długo, jak jedzenie jest łatwo dostępne, zjada niezwykłe jego ilości i nadmiernie zwiększa swą wagę. Niemniej jednak nie przejada się tymi pokarmami, które normalnie są dlań neutralne lub odpychające (Teitelbaum i Epstein, 1962). Występują pewne typy uszkodzeń, które mogą poważnie zmienić dotychczasowe preferencje zwierzęcia dotyczące pokarmu lub napoju. Je i pije ono to, co normalnie odrzuca ze wstrętem. Uszkodzenia te wywołują również niezróżnicowane zachowania seksualne oraz brak ukierunkowania na cel. Wskazywałoby to na całkowite zaburzenie wszelkich mechanizmów oceniających w normalnych warunkach trafność informacji płynącej z otoczenia dla określonego motywu. Ten rozprzestrzeniający się wpływ uszkodzenia na różnorodne formy zachowania nasuwa nam wniosek, iż może istnieć wspólny proces oceny służący wielu różnym systemom motywacyjnym. Techniki elektryczne i chirurgiczne stopniowo odsłaniają nam ogólny zarys mechanizmów uwikłanych w motywację. Brak jeszcze wielu szczegółów do pełnego obrazu. Powszechne stało się obecnie implantowanie elektrod do mózgu, aby za naciśnięciem guzika włączać i wyłączać reakcje motywacyjne zwierzęcia. Gdyby dążeniem psychologii była kontrola zachowania, a nie zrozumienie mechanizmów leżących u jego podstaw, to możliwości kontrolowania reakcji motywacyjnych mogłyby świadczyć o sukcesie psychologów. SYSTEMY REGULACJI MOTYWACYJNEJ Aby zrozumieć podstawy systemu regulacji motywacyjnej, zbadajmy prototypowy system - regulację głodu. Celem naszym jest przedstawienie w ogólnym zarysie struktur oddziaływających na siebie w ten czy inny sposób w toku regulacji zachowania motywacyjnego organizmu. Pierwszy etap polega na rozstrzygnięciu, co system ma robić? Ogólnie funkcja systemu regulacji motywacyjnej jest jasna. Organizm nieprzerwanie pobiera substancje odżywcze: proteiny, tłuszcze, witaminy, cukry, wodę. System regulacji biologicznej musi zapewnić dostateczne rezerwy tych substancji dla normalnego procesu przemiany materii. Co pewien czas system ten musi podjąć działanie w celu uzupełnienia tych rezerw. Musi także upewnić się, że nie zgromadził się ich nadmiar. A ponadto, utrzymując taką zrównoważoną dietę, ów system powinien jeszcze ochronić organizm przed potencjalnie szkodliwymi substancjami. Wszystko to należy czynić dyskretnie, jakby w tle, aby nie przeszkadzać innym czynnościom, które zaprzątają organizm w jego codziennej egzystencji. W tym miejscu możemy już zestawić kilka pierwszych elementów modelu systemu, regulacji głodu. Podstawową funkcją systemów regulacji motywacyjnej jest kontrolowanie dopływu ogromnej ilości substancji chemicznych, które wspólnie tworzą stan biochemiczny organizmu. 586 Oczywiście wymaga to istnienia pewnych mechanizmów fizjologicznych, wykrywających stan rezerw tych substancji biochemicznych. Dla potrzeb modelu nazwiemy takie urządzenie-urządzeniem kontrolnym stanu rezerw (w skrócie kontroler stanu). Jego praca polega na śledzeniu ilości danej substancji w organizmie, a jego reakcję można przedstawić liczbowo: jest to aktualny poziom rezerwy substancji, o którą w danym wypadku chodzi. (Jest rzeczą oczywistą, że musi być wiele różnorodnych rodzajów takich urządzeń kontrolnych związanych z różnorodnymi substancjami metabolicznymi, dajemy im jednak wspólną nazwę, ponieważ wszystkie one pełnią tę samą funkcję logiczną w systemie regulacji.) W miarę jak substancje są zużywane w toku normalnego procesu przemiany materii występują ciągłe zmiany na wyjściu kontrolera stanu. W pewnym punkcie rezerwy mogą osiągnąć poziom krytyczny i to jest ten punkt, w którym organizm staje się motywowany. Ten aspekt systemu regulacji może być przedstawiony logicznie jako porównanie między wyjściem z kontrolera stanu a pewnym poziomem krytycznym, zwanym stanem docelowym. Rysunek 17-1 reasumuje wzajemne związki między stanem biochemicznym, kontrolerem stanu i stanem docelowym, przedstawionymi jako układ bloków. Koło oznacza proces porównywania; prostokąty przedstawiają procesy zachodzące w systemie. 587 Strzałki i kropki zbiegające się w kole przedstawiają wejścia, które są porównywane, a strzałka wychodząca z koła wskazuje wyniki tego porównania. Podobnie jak to stosowaliśmy na rysunku połączeń nerwowych strzałka oznacza wejście pobudzeniowe (dodawane), a kropka oznacza wejście hamujące (odejmowane). Te strzałki i koła oczywiście przedstawiają raczej całe struktury nerwowe, a nie pojedyncze neurony. Rysunek 17-1 [Z bloku symbolizującego stan biochemiczny wychodzą strzałki do prostokąta kontrolera stanu. Z kontrolera stanu wejście hamujące do koła porównywacza stanów (PS). Z porównywacza stanów wyjście pobudzające do prostokąta stanu docelowego.] W modelu urządzenie, które porównuje dane z kontrolera stanu ze stanem docelowym, czyli porównywacz stanów (PS), odejmuje wartość stanu biochemicznego od wartości stanu docelowego. Tak więc wynik ujemny wskazuje, że istnieją wystarczające rezerwy biochemiczne. Kiedy stan biochemiczny spada poniżej poziomu wartości stanu docelowego, wyjście z PS staje się dodatnie i dostarcza wskazówki, że coś jest źle: organizm powinien powziąć kroki korygujące ten stan. Kiedy PS osiąga wyjścia dodatnie, wówczas zwierzę powinno zacząć przejawiać rodzaj zachowań typu poszukiwania jedzenia. Dokładne rodzaje powstających reakcji mogą zależeć od repertuaru reakcji zwierzęcia oraz środowiska, w którym ono się znajduje. Jest to ten punkt, w którym czynniki motywacyjne zaczynają wchodzić w interakcję z wyuczonym doświadczeniem, i na rysunku 17-2 przedstawiliśmy to po prostu łącząc porównywanie stanów z selektorem zachowania, 588 czyli systemem odpowiedzialnym za zapoczątkowanie zachowania poszukującego pokarmu. RYSUNEK 17-2 [Różnica w stosunku do poprzedniego schematu (z rysunku 17-1), polega na tym, że połączenie koła porównywacza stanów i prostokąta stanu docelowego jest odwrócone, to znaczy wychodzi z prostokąta stanu docelowego i dochodzi do koła porównywacza stanów (PS). Z porównywacza stanów wychodzi teraz strzałka do prostokąta selektora zachowania.] Pojawienie się selektora zachowania ma służyć do uzmysłowienia sobie warunków, w których system motywacyjny przejmuje pełną władze nad zachowaniem organizmu i zaczyna kierować jego reakcjami. Co się dzieje dalej? Następne pytanie dotyczy tego, jak informacja z otoczenia jest wykorzystywana przez organizm podczas zachowania poszukującego pokarmu. Zakładamy, że w zależności od rodzaju deficytu motywacyjnego organizm może poszukiwać określonych zdarzeń w swym otoczeniu. Nie będzie poszukiwać jedzenia, kiedy jest spragniony. Zatem od momentu, kiedy porównywacz stanów daje wynik dodatni, informacje płynące z otoczenia zaczynają być analizowane ze względu na ich związek z aktualnym deficytem. Informacja nadchodząca za pośrednictwem systemów sensorycznych jest porównywana z tym, co zwierzęciu jest wiadome o celu, a wyniki tego porównywania zależą od tego, na ile przedmioty z otoczenia pasują do jego wewnętrznego obrazu celu, jakim jest pokarm. Podsumowując ten aspekt zachowania motywacyjnego, musimy uzupełnić nasz system (rysunek 17-3). RYSUNEK 17-3 [Do schematu 17-2 dodajemy nie łączące się z nim ale połączone ze sobą: prostokąt obrazu celu z wyjściem zwalniającym do koła porównywacza celów (PC), oraz prostokąt analizy sensorycznej z wyjściem pobudzajacym również do PC.] 589 Po pierwsze, należy przedstawić, jak przedmioty są analizowane przez system sensoryczny i porównywane z obrazem wewnętrznym celu, czyli włączyć do systemu analizę sensoryczną i obraz celu. Po drugie, aby pokazać, jak te dwa źródła informacji są porównywane ze sobą, należy dodać jeszcze porównywacz celów (PC). Rysunek 17-4 [Do rysunku 17-3 dodano koło porównywacza stanu z celem (PSC) posiadającym wejście pobudzające od koła PC, wejście pobudzające od koła PS. PSC wysyła impuls zwalniający do prostokąta selektora zachowania i impuls pobudzający do prostokąta konsumpcji. Z prostokąta konsumpcji wychodzi strzałka do bloku stanu biochemicznego.] Jak dotąd uzyskaliśmy mechanizmy służące do pomiaru biochemicznego stanu organizmu, jeden do inicjowania działań poszukiwania pokarmu, kiedy poziom spada zbyt nisko, i drugi do analizy nadchodzących danych sensorycznych w celu ustalenia ich związku z deficytem motywacyjnym. Pozostaje tylko regulacja upływu czasu, kiedy to organizm przestaje szukać, a zaczyna jeść. Uzyskujemy to podłączając jeszcze jedno urządzenie porównujące stan z celem (porównywacz stanu z celem-PSC) (rys. 17-4). PSC po prostu dodaje wejścia porównywacza stanu i porównywacza celów. Dodatnie wyjście z PSC aktywizuje blok konsumpcji i jednocześnie wygasza selektor zachowania. Jak się przekonamy później, system ten pozwala bardzo głodnemu zwierzęciu jeść niemal wszystko, nawet jeżeli porównywacz celów mówi, że pokarm ten ma wartość ujemną. Pozwala on również zwierzęciu, które wcale nie jest głodne, jeść, jeżeli pokarm jest dostatecznie atrakcyjny. 590 Tabela 17-1. Lista składników i ich właściwości Selektor zachowania - Inicjuje zachowanie poszukiwania pokarmu. Działa wyłącznie wtedy, kiedy PS i PSC zezwalają na to. Dodatnia wartość PS pobudza działanie selektora zachowania, a dodatnia wartość PSC zatrzymuje je. Stan biochemiczny - Magazyn rezerw substancji biochemicznych potrzebnych organizmowi. Konsumpcja - Konsumpcję inicjuje przedmiot analizowany przez Analizę Sensoryczna, ale tylko wówczas, kiedy wyjście z PSC ma wartość dodatnią. Trawienie - Proces transformacji zjedzonych przedmiotów na podstawowe wartości biochemiczne. Środowisko - Świat, w jakim zwierzę żyje. Na naszych rysunkach będą to zawsze warunki istniejące na zewnątrz ciała zwierzęcia. Porównywacz celów (PC)- Porównuje analizę sensoryczna z obrazem wewnętrznym. Wartość pojawiająca się na wyjściu określa wynik tego porównania. Analiza sensoryczna - Analizuje informację o przedmiocie płynącą ze środowiska, w jakim znajduje się zwierzę, a która jest informacją dostarczoną przez system sensoryczny. Obejmuje stadia rozpoznawania obrazu. Daje dodatnie reakcje wyłącznie w odniesieniu do przedmiotów należących do kategorii pokarmu. Porównywacz stanów (PS) - Odejmuje wartość kontrolera stanu od wartości stanu docelowego. Wartość na wyjściu odzwierciedla wielkość głodu. Porównywacz stanu z celem (PSC) - Dodaje wartości PS i PC. Wartość na wyjściu określa, jak bardzo pokarm jest pożądany, łącząc rodzaj pokarmu z potrzebą pożywienia. Wartość ujemna oznacza, iż konsumpcja nie powinna nastąpić. Kontroler stanu - Mierzy stan aktualnej koncentracji substancji biochemicznych. Obraz celu - Wewnętrzna reprezentacja przedmiotu, którego poszukuje analiza sensoryczna. Zazwyczaj ma charakter ogólny. Stan docelowy - Reprezentuje pożądaną wartość substancji biochemicznej. System ten przedstawia następstwo zdarzeń prowadzących do zapoczątkowania spożywania pokarmu. Jak następuje przerwanie raz zaczętej konsumpcji? Najbardziej oczywiste rozwiązanie mamy wówczas, gdy pokarm trafi już do wewnątrz ciała, układ trawienny zaczyna pracować odbudowując deficyt występujący w stanie biochemicznym. Zmiana ta jest stale nadzorowana przez kontrolera stanu, tak że kiedy deficyt zostanie odbudowany, poziom porównywacza stanu obniża się do wartości ujemnej, co może spowodować ewentualnie wyłączenie zachowania konsumpcyjnego i pozwala zwierzęciu na powrót do jego normalnego zajęcia. Później przekonamy się, że nie jest to rzeczywisty sposób zahamowania zachowania konsumpcyjnego. Na razie jednak zamyka pętlę i pozwala kontynuować sprawdzanie modelu. (Tymczasem spróbujcie określić, dlaczego potrzebny jest inny sposób zahamowania spożycia pokarmu.) Model ten zatem jest opisem wydedukowanych mechanizmów wchodzących w system regulacji motywacyjnej. Jest on wystarczająco pełny, aby można zacząć go sprawdzać. Pierwsze pytanie brzmi: jaki byłby wzorzec reakcji organizmu, gdyby system taki regulował jego zachowanie? Pytanie drugie brzmi: jakie systemy zarysowane w modelu sprawdzają się w badaniach eksperymentalnych nad motywacją? 591 Sprawdzian liczbowy Wyobraźmy sobie hipotetyczne zwierzę, którego zachowanie regulowane jest przez system przedstawiony na rysunku 17-4. Jak wyglądałoby zachowanie zwierzęcia? Czy taki system regulacji potrafiłby utrzymać na optymalnym poziomie wewnętrzne rezerwy kontrolowanej przezeń substancji? Jakiego rodzaju preferencje pokarmowe mogłoby mieć zwierzę oraz jakie zmienne mogłyby wpływać na wzorzec jego reakcji jedzenia? Czy potrafiłoby ono dostatecznie dobrze odróżniać substancje jadalne od niejadalnych i jeść odpowiednią ilość substancji odżywczych? Posłużymy się kilkoma przykładami, aby uzmysłowić sobie, jak nasz system działa. Weźcie kartkę papieru i wykreślcie kolejno osiem kolumn: Czas, Kontroler stanu, PS, Analiza Sensoryczna, PC, PSC, Selektor Zachowania, Konsumpcja (patrz tabela 17-2). Tabela może być wykorzystana do śledzenia reakcji każdego ze składników w toku badania, jak działa system. [Najbardziej ambitni z Was mogą opracować program dla komputera. Stwierdziliśmy, że jest to zadanie łatwe, zwłaszcza gdy ma się do dyspozycji komputer z drukarką. BASIC jest najodpowiedniejszym językiem dla tego zadania.] Zakładając, że okoliczności są typowe, zaczynamy od czasu 1 (przyjmujemy, że czas ten mierzymy w godzinach). Przyjmijmy, że w tym czasie zwierzę ma częściowo wypełniony żołądek. Jest tam 100 jednostek stanu biochemicznego i kontroler stanu informuje o tej liczbie. Wartość stanu docelowego wynosi 90, tak więc wyjście z porównywacza stanów wynosi -10. Jest rzeczą jasną, że zwierzę nie jest jeszcze głodne, a zatem inne kolumny można pominąć. Nie zaczęło się jeszcze zachowanie typu poszukiwania pokarmu. W miarę upływu czasu, w toku normalnej aktywności zwierzęcia następuje zużycie jego wewnętrznych rezerw. Załóżmy, że zwierzę zużywa 3 jednostki substancji odżywczej na godzinę. W ten sposób, godzina po godzinie, kontroler stanu donosi o ubytku wartości substancji biochemicznej. W końcu, w piątej godzinie wartość oznaczona przez kontrolera stanu spada do 88, czyli poniżej stanu docelowego. Teraz PS staje się dodatnie i uruchamia zachowanie poszukiwania pokarmu (następuje włączenie selektora zachowania). Fakt, że zwierzę jest teraz motywowane głodem, niekoniecznie musi oznaczać, że będzie ono jadło natychmiast wszystko, na co natrafi wokół siebie. Przyjmijmy, że przedmioty, które znajdują się w otoczeniu zwierzęcia, mają dla analizy sensorycznej wartość równą 0, to znaczy, że normalnie nie są oceniane jako rzeczy jadalne. Załóżmy jeszcze, że zwierzę jest zazwyczaj dość wybredne w doborze swego pokarmu, to znaczy, że nie chce zaakceptować niczego jako przedmiotu jadalnego, co by dawało wewnętrzny obraz celu o wartości niższej niż 25. Stąd w tym wypadku wyjście z porównywacza celów wynosi -25, a wyjście z porównywacza stanu z celem -23. Zwierzę nie je. Tak więc po 5 godzinach, kiedy stan biochemiczny osiągnie wartość 88, stan docelowy wynosi 90, analiza sensoryczna wykazuje 0, a wewnętrzny obraz celu dla pokarmu wynosi 25. Upewnij się, czy potrafisz wypełnić wszystkie pozostałe kolumny. 592 Tabela 17-2 Szybkość przemiany materii: 3 jednostki na godzinę Stan docelowy: 90 Obraz celu: 25 [Tabelę zmieniono na tekst w następujący sposób; Liczba stojąca na początku wiersza oznacza kolejną godzinę eksperymentu, druga liczba poprzedzona literami KS to wartość kontrolera stanu, następna oznaczona PS jest wartością wyjściową porównywacza stanów, ASW pojawi się przy włączonej analizie sensorycznej, PC i liczba za nią stojąca to wartość porównywacza celów, PSC oznacza porównywacza stanu z celem, SZW pojawi się przy włączonym selektorze zachowania, ostatnią pozycję stanowi konsumpcja, oznaczenie KT pojawi się tylko wtedy, gdy w rubryce jest słowo TAK] W celu właściwego odczytu liczb i znaków przez program Screen Reader, należy ustawić opcję CZYTANIE DOKUMENTÓW na wypowiadanie wszystkich znaków. 1; KS 100; PS –10; 2; KS 97; PS –7; 3; KS 94; PS –4; 4; KS 91; PS –1; 5; KS 88; PS +2; ASW; PC –25; PSC –23; SZW; 6; KS 85; PS +5; ASW; PC –25; PSC –20; SZW; 7; KS 82; PS +8; ASW; PC –25; PSC –17; SZW; 8; KS 79; PS +11; ASW; PC –25; PSC –14; SZW; 9; KS 76; PS +14; ASW; PC –25; PSC –11; SZW; 10; KS 73; PS +17; ASW; PC –25; PSC –8; SZW; 11; KS 70; PS +20; ASW; PC –25; PSC –5; SZW; 12; KS 67; PS +23; ASW; PC –25; PSC –2; SZW; 13; KS 64; PS +26; ASW; PC –25; PSC +1; KT; 14; KS 74; PS +16; ASW; PC –25; PSC –9; SZW; 15; KS 71; PS +19; ASW; PC –25; PSC –6; SZW; 16; KS 68; PS +22; ASW; PC –25; PSC –3; SZW; 17; KS 65; PS +25; ASW; PC –25; PSC 0; SZW; 18; KS 62; PS +18; ASW; PC –25; PSC +3; KT; 19; KS 72; PS +18; ASW; PC –25; PSC –7; SZW; 20; KS 69; PS +21; ASW; PC –25; PSC –4; SZW; Kiedy zwierzę zacznie jeść? Aby to nastąpiło, muszą być spełnione dwa warunki. Jeżeli analiza sensoryczna doniesie o wystarczająco atrakcyjnym przedmiocie-pokarmie, to zje go natychmiast. (Pokarm musi koniecznie osiągnąć w analizie sensorycznej wartość co najmniej 24.) Alternatywnie, jeżeli czas płynie i zwierzę będzie stawało się coraz głodniejsze (kontroler stanu osiągnie wystarczająco wysokie wartości), będzie ono w końcu jadło rzeczy o wartości pokarmowej 0 (PS musi wzrosnąć do plus 26). Wreszcie oba te warunki - stopień atrakcyjności pokarmu i stan głodu u zwierzęcia - mogą się zrównoważyć i ów pokarm jest spożyty. Niesmaczny pokarm. Przypuśćmy najpierw, że zwierzę nie potrafi znaleźć czegokolwiek do zjedzenia, co miałoby wartość pokarmową powyżej 0. Jak przedstawia to nasza tabela, powstrzymuje się ono od jedzenia godzinę po godzinie, podczas gdy jego stan biochemiczny stale spada. W końcu po 13 godzinach wartość wskazywana przez kontrolera stanu obniża się do 64, a PSC uzyskuje wartość dodatnią +1. Zwierzę zacznie jeść, choćby nawet substancja jadalna znajdująca się przed nim miała 0 atrakcyjności. Jeżeli ów pokarm będzie miał wartość odżywczą około 10 jednostek, to w 14 godzinie dostarczy on 10 jednostek stanowi biochemicznemu. 593 Kontroler stanu będzie wskazywał wartość 74. (Jeżeli zwierzę np. zgubiło się w lesie, to prawdopodobnie pokarmem, jaki w końcu zacznie jeść, będą korzenie roślin). Choć zwierzę jest dalej głodne, odzyskało ono wystarczającą ilość substancji pokarmowej, aby nie zmuszać się dalej do jedzenia czegokolwiek, co analiza sensoryczna ocenia jako 0. W miarę jak ponownie obniża się wartość stanu biochemicznego o 3 jednostki na godzinę, po 18 godzinach powinien on wynosić 62 jednostki, a porównanie stanów da wynik plus 28, zwierzę znowu pokona wstręt do pokarmu o atrakcyjności 0 (korzenie roślin) i zacznie jeść. Zwierzę znajduje się teraz w sytuacji bez widoku na zmianę. Pozostaje stale głodne ze stanem biochemicznym gdzieś między 60 i 70. Co 4 lub 5 godzin zmusza się ono do przezwyciężenia swego wstrętu do pokarmu znajdującego się w jego otoczeniu (korzenie) i je taką ilość, aby wytrzymać następne 4 lub 5 godzin. Ale przez cały ten czas rozgląda się dokoła szukając, czy nie pojawi się w pobliżu coś lepszego niż korzenie. Kraina mlekiem i miodem płynąca. Przeanalizujmy teraz sytuację, w której pokarm o względnie wysokiej wartości jest stale dostępny (patrz tabela 17-3). Zaczyna się tak samo jak poprzednio. Po upływie 5 godzin zwierzę jest głodne, ale od razu znajduje jedzenie, które jest całkiem smaczne - analiza sensoryczna tego ulubionego pokarmu wynosi 30. Zaczyna natychmiast jeść. Jeżeli pokarm ma taką samą wartość odżywczą jak korzenie -10 jednostek - będzie ono nasycone przez kilka godzin, ściśle biorąc do 9 godzin, kiedy to znowu jest głodne, ale i tym razem głód swój natychmiast zaspokaja. Odnotujmy te drastyczne różnice w zachowaniu zwierzęcia spowodowane po prostu przez zmianę wartości preferencji dostępnego pokarmu. Działa dokładnie ten sam system motywacyjny, ale kiedy dostępny pokarm ma niską atrakcyjność, zwierzę jest ciągle głodne. Wszytko obraca się wokół poszukiwania czegoś do jedzenia. Ponadto traci ono prawdopodobnie na wadze, gdyż jego stan biochemiczny waha się gdzieś w granicach 60 jednostek. Tabela 17-3 Szybkość przemiany materii: 3 jednostki na godzinę Stan docelowy: 90 Obraz celu: 25 [Tabelę zmieniono na tekst w następujący sposób; Liczba stojąca na początku wiersza oznacza kolejną godzinę eksperymentu, druga liczba poprzedzona literami KS to wartość kontrolera stanu, następna oznaczona PS jest wartością wyjściową porównywacza stanów, liczba oznaczona AS to wartość analizy sensorycznej, PC i liczba za nią stojąca to wartość porównywacza celów, PSC oznacza porównywacza stanu z celem, SZW pojawi się przy włączonym selektorze zachowania, ostatnią pozycję stanowi konsumpcja, oznaczenie KT pojawi się tylko wtedy, gdy w rubryce jest słowo TAK. W celu właściwego odczytu liczb i znaków przez program Screen Reader, należy ustawić opcję CZYTANIE DOKUMENTÓW na wypowiadanie wszystkich znaków] 1; KS 100; PS –10; 2; KS 97; PS –7; 3; KS 94; PS –4; 4; KS 91; PS –1; 5; KS 88; PS +2; AS 30; PC 5; PSC 7; KT; 6; KS 98; PS -8; 7; KS 95; PS -5; 8; KS 92; PS -2; 9; KS 89; PS +1; AS 30; PC 5; PSC 6; KT; 10; KS 99; PS -9; 594 Kiedy zmieniamy rodzaj pokarmu, zwierzę przestaje się w ogóle zajmować swoim głodem. Co 4 lub 5 godzin je, ale nie jest głodne między posiłkami. Nie musi myśleć godzinami o jedzeniu. Ponadto waga jego ciała jest zapewne stosunkowo wysoka, gdyż jego stan biochemiczny waha się między 87 a 99. Jest rzeczą ważną, aby zwrócić uwagę, że w obu tych wypadkach odżywcza wartość pokarmu pozostaje taka sama. Zmieniła się jedynie jego atrakcyjność. Jest pewna różnica między wartością 800 kalorii korzeni roślin a wartością 800 kalorii befsztyka. W pierwszym z analizowanych tu wypadków zwierzę będzie ciągle głodne i chude, stale poszukujące lepszego pokarmu. W drugim będzie szczęśliwe i zadowolone, dobrze odżywione, mające pod dostatkiem wolnego czasu. Jaki wpływ na przebieg jego reakcji jedzenia będą miały pokarmy o jednakowej atrakcyjności, lecz różnych wartościach odżywczych? Rozpatrz to na przykładzie i zobacz, co z tego wyniknie. Oczywiście model nasz jest krańcowym uproszczeniem rzeczywistych procesów motywacyjnych. Jest on dobry dla wstępnego rozumienia tego, jak może działać proces regulacji motywacyjnej, a w istocie ilustruje niektóre z podstawowych zasad wchodzących tu w grę. Kiedy jednak przyjrzymy mu się bardziej szczegółowo, to wyłoni się wiele problemów. Wystąpią one wyraźnie wówczas, kiedy model przeniesiemy do laboratorium i poddamy eksperymetalnemu sprawdzeniu. Zakończenie jedzenia Jedną z największych rozbieżności między modelem, którym posługiwaliśmy się dotąd, a rzeczywistymi systemami biologicznymi, jest sposób, w jaki kończy się sekwencja stanów motywacyjnych. W modelu przyjmuje się założenie, że jedzenie zostanie przerwane, jak tylko stan biochemiczny powróci do odpowiedniego poziomu, dzieje się tak albo w wyniku ustania głodu (wyjście kontrolera stanu spada do wartości ujemnej), albo dlatego, że atrakcyjność pokarmu przestaje być wystarczająco wysoka, aby podtrzymywać reakcję jedzenia (wartość PSC spada do wartości ujemnej). Należałoby zatem przyjąć założenie, że proces trawienia przebiega bardzo szybko. Założenie takie nie odpowiada prawdzie. Systemy trawienne u większości organizmów są dość powolne. Mogą one często zużywać około 2 godzin lub więcej na całkowite przetworzenie posiłku na składniki biochemiczne, niezbędne dla procesów przemiany materii. Jest oczywiste, że musi być jakiś sposób zatrzymania spożywania na długo przed tym, zanim deficyt w stanie biologicznym organizmu zostanie przywrócony. Organizmy żywe mają pewne możliwości kontrolowania ilości spożywanego pokarmu. Większość zwierząt jest wyposażona w mechanizmy wrażliwe na ilość i jakość pokarmu, który podlega procesowi trawienia. Te urządzenia kontrolne przekazują sygnały, że spożycie jest wystarczające, zanim nastąpi rzeczywista zmiana poziomu biochemicznego. Jednym ze sposobów poznania lokalizacji i właściwości takiego systemu kontrolnego jest zbadanie, czy i jak można go oszukać. Może jest to prosty aparat kontroli ilości pokarmu w żołądku, 595 wyłączający się, kiedy żołądek jest pełny? Jeśliby tak było, to można by ominąć zupełnie czynność jedzenia i połykania (przez proste napełnienie pokarmem żołądka głodnego zwierzęcia za pomocą rurki) i następnie zbadać, czy tak napełniony żołądek zaspokoi głód zwierzęcia? Z drugiej strony zwierzę mogłoby jeść normalnie, ale dzięki rurce wyprowadzającej pokarm z jego przełyku nie dociera on w ogóle do żołądka. Czy zwierzę przestanie jeść po skonsumowaniu normalnej ilości posiłku? Karmienie z przetoką przełykową. Możliwe do przyjęcia rozwiązanie dotyczące lokalizacji receptorów, które sygnalizują ilość pokarmu, zakłada, że mieszczą się one w jamie ustnej lub w okolicach gardła. Oczywistym kandydatem jest tu język, ponieważ jest on dobrze wyposażony w receptory smakowe. Receptory te dostarczałyby różnorodnych informacji o właściwościach substancji podlegających trawieniu. Informacje te mogłyby być wykorzystywane przez system motywacyjny do podjęcia decyzji o przerwaniu jedzenia. Jeżeli ta informacja receptoryczna miałaby regulować ilość spożywanego przez zwierzę pokarmu, to będzie ono jeść w normalnych ilościach nawet wówczas, kiedy pokarm nie dociera w ogóle do jego żołądka. Można to zbadać przeprowadzając prostą operację. Plastykowa rurka zostaje tak wprowadzona do ciała zwierzęcia, że pokarm wchodzi do pyska, ale wychodzi przez gardło nie dostając się do żołądka. Kiedy zwierzę je lub pije, połykane produkty pobudzają pysk i gardło w normalny sposób, nigdy jednak nie docierają do żołądka. Technika ta nosi nazwę karmienia z przetoką przełykową (esophagus bypass). Jeżeli receptory w języku zwierzęcia oraz w gardle sygnalizują ilość pokarmu, to wówczas zwierzę z przetoką przełykową powinno jeść i pić normalnie, połykając odpowiednią ilość pokarmu i we właściwym momencie przerywać jedzenie, chociaż w rzeczywistości nic nie dociera do jego żołądka. Później, kiedy system regulacyjny stwierdzi, iż został oszukany i przerwie konsumpcję nie osiągając zmiany warunków deficytowych, zwierzę powinno znowu zacząć jeść. Jeżeli te obwodowe receptory nie są jedynym źródłem informacji lub też nie są w ogóle wykorzystywane w celu regulacji ilości spożywanego pokarmu, to wtedy zwierzę powinno kontynuować spożywanie w nieskończoność, skoro już raz zacznie jeść. Przeprowadźmy eksperyment: zwierzę podlega ścisłemu rozkładowi karmienia i otrzymuje jedzenie i picie wyłącznie raz na 24 godziny. Kiedy już przyzwyczai się do tego rozkładu, dokonuje się starannych pomiarów ilości pokarmu i wody, jakie normalnie spożywa podczas dziennego posiłku. Ustala się w ten sposób jego typowe zachowania w warunkach trwania eksperymentu. 596 Następnie odbywa się operacja i wprowadzenie przetoki przełykowej. Po tym zabiegu zwierzę ponownie poddane jest 24-godzinnemu rozkładowi karmienia. W końcu, kiedy wróci ono całkowicie do siebie po operacji, jest już gotowe do przeprowadzenia tekstu krytycznego. W 24 godziny po normalnym posiłku uzyskuje ono wolny dostęp do jedzenia i picia. Czy będzie ono jadło i piło tyle, ile wynosi jego stała porcja, a po tym przestanie, czy też będzie jadło i piło dopóty, dopóki pokarm i woda są dostępne? Odpowiedź brzmi zarówno tak, jak i nie, zależy ona bowiem od tego, czy pytamy o jedzenie czy o picie. Spragnione zwierzę z przetoką przełykową będzie piło swoją normalną porcję wody, po czym przerwie picie wyraźnie zaspokojone, chociaż płyn nie dostał się wcale do jego żołądka. W pięć minut później zaczyna ono znowu pić swą dzienną porcję wody. Cykl ciągnie się dalej wraz ze stopniowo rosnącą ilością wypitej wody, w miarę jak deficyt wody wzrasta (Adolph, 1941). Nieuchronnie nasuwa się tu następujący wniosek. Receptory obwodowe w pysku i gardle sygnalizowały, gdy właściwa ilość wody została wypita, i ta informacja wystarczała do zaprzestania czynności picia. Występuje przerwa od 5 do 10 minut, zanim system regulacji motywacyjnej wykryje raczej dziwną sytuację, kiedy to dostateczna ilość wody przechodzi przez pysk i gardło, ale jakoś wcale nie dociera do żołądka. Głodne zwierzę zaopatrzone w przetokę przełykową bez przerwy je. Pies, na przykład, może skonsumować ilość pokarmu dochodzącą do 80 procent swojej wagi ciała; odpowiednia ilość pokarmu dla człowieka wynosiłaby około 60 kg (Hull, 1951). W przeciwieństwie do badań nad pragnieniem, wnioski, jakie można wyciągnąć z eksperymentu z przetoką przełykową w odniesieniu do głodu, są raczej skromne, jeżeli istnieje mechanizm przerywający spożywanie pokarmu, to z pewnością nie znajduje się on w jamie ustnej ani też w gardle ssaków. RYSUNEK 17-5 1) Zwierzę eksperymentalne wyposażone w przetokę przełykową 2) Spragnione zwierzę pije, ale woda nie dociera w ogóle do jego żołądka 3) Niemniej jednak wyraźnie nasycone przestaje pić po wypiciu swej normalnej porcji 4) Ale w 5 czy 10 minut później pije znowu, i to więcej niż poprzednio Napełniony żołądek. Druga technika badania natury kontroli głodu i pragnienia polega na umieszczeniu rurki (przetoki) w żołądku zwierzęcia tak, aby pokarm lub woda mogły być wprowadzone bezpośrednio do żołądka i nie przechodziły przez pysk. Przetoka jest wszczepiona w taki sposób, aby nie przeszkadzała w przyjmowaniu i trawieniu pokarmu wtedy, kiedy zwierzę ma doń dostęp. Jaka jest prognoza zachowania spragnionego zwierzęcia, któremu najpierw napełniono wodą żołądek, a potem dano okazję do napicia się? Ponieważ informacja zwrotna, jaką otrzymuje zwierzę o swym poborze wody, powstaje w receptorach obwodowych w pysku i gardle, to w tym przypadku nie została ona przekazana, gdyż wodę wprowadzono bezpośrednio do żołądka. Mówiąc prościej, napełnienie żołądka zwierzęcia wodą nie powinno wpłynąć od razu na jego pragnienie, powinno ono wypić normalną ilość wody, jeśli istnieje taka możliwość. Przeprowadźmy eksperyment: znowu ważne jest wstępne ustalenie, jaką ilość wody średnio zwierzę może wypić w warunkach kontrolowanych. Jak w poprzednim badaniu zrobiono to przez zastosowanie ścisłego rozkładu pojenia i zezwolono na dostęp do wody jedynie co 24 godziny. Kiedy pobieranie wody w tych warunkach ulega stabilizacji, 598 dzienna średnia porcja wypijanej wody zostaje zmierzona. Skoro znana jest ilość wody, jaką zwierzę normalnie wypija, można przeprowadzić z nim eksperyment. W czasie bezpośrednio poprzedzającym czas pojenia, żołądek zwierzęcia zostaje napełniony jego całodzienną porcją wody. Następnie daje mu się dostęp do naczynia z wodą, a ilość wypitego przez nie płynu jest mierzona. Użyteczne jest przeprowadzenie badania ze zmiennym czasem opóźnienia między napełnieniem żołądka a dostępem zwierzęcia do wody po to, aby zobaczyć, jak zmienia się jego zachowanie związane z piciem wraz ze wzrostem upływu czasu. Ogólnie rzecz biorąc, wyniki uzyskane w eksperymencie tego typu są dokładnie takie, jakich można się było spodziewać. Po napełnieniu żołądka wodą zwierzę wydaje się w dalszym ciągu spragnione i wypija swoją normalną porcję wody, gdy tylko nadarzy się stosowna po temu okazja. Jeżeli czas między napełnieniem żołądka a uzyskaniem dostępu do wody zostaje wydłużony powiedzmy o 5, 10 lub 15 minut, to wtedy ilość wypitej wody będzie odpowiednio malała. Po przerwie trwającej około 20 minut, strawienie wody wydaje się dokonane i zwierzę nie zdradza zainteresowania piciem (Adolph, 1941). Napełnienie żołądka zwierzęcia wodą z wolna zaspokaja jego pragnienie. Na początku zwierzę zachowuje się tak, jak gdyby wcale nie otrzymało wody (rys. 17-6). RYSUNEK 17-6 PRZYGOTOWANIA 1) Zwierzę zostaje przyuczone do 24 godzinnego rozkładu pojenia, a następnie mierzymy średnią konsumpcję wody. 2) Wprowadzamy rurkę przetokową do żołądka. 3) Napełniamy żołądek dzienną porcją wody. EKSPERYMENT i WYNIKI 3a) Dajemy pić natychmiast; 4a) Pije normalną ilość 3b) Dajemy pić po 15 minutach; 4b) Pije mniej niż normalnie 3c) Dajemy pić po 20 minutach; 4c) Nie chce pić Jak wygląda eksperyment z napełnianiem żołądka w wypadku głodu? Czy zwierzę po otrzymaniu pokarmu będzie nadal głodne, czy też bezpośrednie wprowadzenie pokarmu do jego żołądka będzie dostatecznym powodem do zahamowania jego zachowania konsumpcyjnego? Zachowanie głodnego zwierzęcia jest różne od zachowania zwierzęcia spragnionego. Kiedy następuje napełnienie żołądka pokarmem, głód zostaje zredukowany (Smith, Duffy, 1955). Możemy wyprowadzić stąd wniosek, że musi istnieć sprzężenie zwrotne receptorów w wyższej części układu trawiennego czy też w okolicach żołądka, które powiadamiają system regulacji motywacyjnej w momencie, kiedy odpowiednia ilość pokarmu została wprowadzona do żołądka. Wydaje się niewątpliwe, że system głodu jest zdolny zahamować konsumpcję na długo przed tym, zanim proces trawienia będzie miał możność przywrócić biochemiczne warunki w organizmie. Dalsze eksperymenty wykazały, że dotyczy to zarówno pokarmu stałego, jak i płynnego. Ponadto może on różnicować między substancją jadalną i niejadalną i wydaje się zdolny do „obliczania" wartości kalorycznej pobieranego pokarmu. Nie ma wątpliwości, że taki szybki mechanizm sprzężenia zwrotnego działa i że pewne ogólne jego cechy charakterystyczne zostały poznane. Zaskakujące jest jednak, że nikt nie potrafi dotąd precyzyjnie określić, gdzie on się mieści ani też, w jaki sposób w szczegółach rzeczywiście spełnia on swoje zadanie. Mamy jedynie dane fragmentaryczne, a pełny obraz wciąż nie jest zbyt jasny. Wydaje się jednak, że osiągnęliśmy wyraźny postęp. Większość organizmów, które poznaliśmy, włączając w to ludzi, okazuje się być wyposażonych w bardzo wyszukany mechanizm sprzężenia zwrotnego dla kontroli i analizy substancji, które są pobierane. System ten dostarcza informacji dotyczącej ilości materiału pokarmowego oraz pewnych cech ogólnych pobieranej substancji, takich jak stopień stężenia soli oraz jej względna wartość odżywcza. Takie urządzenie uwalnia zwierzę z zależności od powoli funkcjonującego układu trawiennego, 599 a wyposaża je w szybką i dość dokładną informację zwrotną o względnej wartości otrzymywanego pokarmu. Następny krok, jaki powinniśmy uczynić, to zdecydować, jak włączyć tę nową informację do naszego modelu systemu regulacji motywacyjnej. Jest oczywiste, że musimy dołączyć nowy blok zwany kontrolerem sprzężenia zwrotnego (feedback monitor). Ale, z czym należy połączyć wyjście tego systemu sprzężenia zwrotnego? Jedną z możliwości jest bezpośrednie połączenie z kontrolerem stanu. Porównywacz stanu osiąga wtedy wartość ujemną, kiedy tylko mechanizm sprzężenia zwrotnego wskaże, że odpowiednia ilość pokarmu lub wody została spożyta. Na pierwszy rzut oka wydaje się to najprostszy i najbardziej logiczny sposób wykorzystania informacji zwrotnych. Pozostawiamy Wam zadanie polegające na uzupełnieniu obrazu przez dodanie do niego mechanizmu sprzężenia zwrotnego. Bądźcie cierpliwi, gdyż nie jest to wcale takie łatwe. Czynniki pozabiologiczne Chociaż istnieje znacznie bogatsza wiedza na temat podstawowych biologicznych systemów regulacji - więcej faktów płynących z eksperymentów, więcej obwodów nerwowych i chemicznych - to dla naszych aktualnych celów poprzestaniemy na tym, co przedstawiliśmy dotychczas. System regulacji motywacyjnej działa poprzez mechanizmy nerwowe i chemiczne, które kontrolują całość czynności zwierzęcia i regulują jego rezerwy wewnętrzne. Istnieją jednak jeszcze inne rodzaje regulatorów w systemie motywacyjnym. Uczymy się być głodni o określonej porze dnia. Uczymy się określonego wzorca spożywania pokarmu zgodnie z wymaganiami kultury, w której żyjemy, coś co trudno jest wyjaśnić, jeżeli chcemy po prostu wytłumaczyć zachowanie pokarmowe działaniem rezerw biochemicznych. Pod wpływem poważnych napięć psychicznych lub emocjonalnych cały system regulacyjny może ulec rozstrojeniu. Wiele tych różnych czynników pozabiologicznych, które włączają się do systemu motywacyjnego, wskazuje, że muszą istnieć inne części tego systemu, o których nic nie mówiliśmy. Tak więc model nasz nie jest pełny i to nie tylko dlatego, że pewne jego części nie zostały omówione, ale również dlatego, że inne zasady muszą tu być wprowadzone. Niemniej jednak główne zasady wydają się dostatecznie określone. Gdybyśmy się teraz zajęli badaniem innych motywów leżących u podstaw zachowania się organizmów, to stwierdzilibyśmy, że badanie podstawowych biologicznych systemów regulacji stanowi właściwy start dla zrozumienia bardziej złożonych mechanizmów motywacyjnych, działających u człowieka i u zwierząt. Mówiliśmy o ogólnej strukturze systemu motywacyjnego leżącego u podłoża biologicznego przetrwania organizmu. A co wiemy o innych rodzajach motywacji, które działają u ludzi? Co wiemy o takich sprawach, jak miłość i pożądanie, gniew i nienawiść? Czy u podstaw każdego z tych motywów leżą odrębne mechanizmy psychologiczne i biologiczne, czy też mamy do czynienia z pewnym procesem ogólnym, warunkującym całe doświadczenie motywacyjne? Kiedy zaczynamy zastanawiać się nad motywacją ludzką, jeden temat wyłania się wciąż na nowo. 600 Niepewność, niewystąpienie oczekiwanego zdarzenia, przerwanie gładko przebiegającej sekwencji reakcji, przewidywanie niemożności poradzenia sobie z zachodzącym zdarzeniem - wszystko to wydaje się podstawowymi siłami napędowymi zachowania się ludzi. Nicią przewodnią wydaje się tu rzeczywista lub przewidywana niezgodność między tym, co ma miejsce w rzeczywistości, i tym, co jest oczekiwane. Organizm ludzki lub zwierzęcy działa tak, jakby miał jakiś swój wewnętrzny model, z którym porównuje zdarzenia świata zewnętrznego. Emocje i wzbudzenie wypływają z nieadekwatności tego modelu, w którym szwankuje aparat przewidywania. To wszystko oczywiście jest Wam już znane. Odkrywamy wciąż na nowo, że możemy przedstawić obraz psychiki jako urządzenie, które aktywnie angażuje swoje środowisko, interpretując zachodzące zdarzenia w kontekście nabytego doświadczenia i oczekiwań. Uprzednio badaliśmy tego typu procesy działające w percepcji, pamięci, rozwiązywaniu problemów i podejmowaniu decyzji. Obecnie znów odkryjemy wiele takich samych zasad działających w odniesieniu do emocji i motywacji. Można tego oczekiwać, ponieważ dla złożonych motywów ludzkich istota warunków zewnętrznych nie wydaje się tak ważna, jak ich interpretacja. Pamięć i czynniki poznawcze są ściśle powiązane z motywami, które określają zachowanie się ludzi. REAGOWANIE NA NIEPEWNOŚĆ Takie słowa, jak oczekiwanie, niepewność, przerwanie, rozbieżność, dysonans i konflikt, są kluczowymi określeniami w eksperymentalnej analizie emocji i motywacji ludzkich. W rozważaniu dotyczącym tych badań pożyteczne jest pojęcie porównywacz stanów, które omówiliśmy uprzednio. W wielu rodzajach sytuacji motywacyjnych organizm działa tak, jak gdyby coś kontrolowało w nim przebieg procesów poznawczych, wypatrywało potencjalnego zaburzenia w postępowaniu z otoczeniem i sygnalizowało trudności, kiedy się pojawiają. Podobne jest to coś do porównywacza stanów dla głodu, z tym że koncentruje się przede wszystkim na wynikach procesu poznawczego, a nie na biochemicznych warunkach organizmu. Dopóki sprawy zachodzą w rozsądnych granicach, pozostaje on w spokoju. Ale gdy tylko natknie się na coś nowego lub odmiennego od tego, co było oczekiwane, lub zagrażającego, działa podobnie do mechanizmu przerywającego, alarmując organizm w związku z potencjalnym zadaniem i mobilizując do tego odpowiednie zasoby. Rezultatem jest zmiana w ogólnym poziomie wzbudzenia, czyli aktywacji. Może ona sięgać od wysokiego poziomu pod wpływem stresu i strachu do niskiego poziomu, kiedy środowisko nie stawia organizmowi żadnych wymagań. Reakcje na stres Dwie małpy zostały umieszczone w przylegających do siebie klatkach, w każdej z nich znajdowała się dźwignia. Jedna z małp nazwana małpą odpowiedzialną (z powodów, które staną się oczywiste za chwilę) 601 musi nauczyć się naciskać swoją dźwignię co najmniej raz na 5 sekund. Jeżeli nie zdąży nacisnąć w przewidzianym czasie, to zarówno ona, jak i jej sąsiadka w przyległej klatce otrzymują uderzenie prądem. Dźwignia drugiej małpy nie ma żadnego wpływu na pojawienie się uderzenia. Tak więc obie małpy mają tyle samo doświadczeń z wstrząsem elektrycznym, ale tylko małpa odpowiedzialna ma nad nim kontrolę. Tylko ona musi pozostawać w częstym pogotowiu i działać odpowiednio, aby uniknąć wstrząsu. Małpy znajdują się w sytuacji eksperymentalnej przez 6 godzin, po czym następuje 6-godzinny okres wypoczynku między sesjami, codzienne testy fizjologiczne nie wykazują żadnych nieprawidłowości u obu małp. Obie one otrzymują odpowiednie wyżywienie i utrzymują swą wagę. Po około 20 dniach małpa odpowiedzialna zdycha. Przyczyną śmierci jest owrzodzenie żołądka (Brady, 1958). Wrzody u małpy odpowiedzialnej są tylko jedną z wielu zmian biochemicznych, będących wynikiem procesów psychicznych. RYSUNEK 17-7. Małpa „odpowiedzialna" (z lewej) została wyuczona naciskania lewą łapą na dźwignię, co powoduje ochronę obu zwierząt przed uderzeniem prądem. Druga małpa (z prawej) straciła zainteresowanie swoją dźwignią i zachowuje się jak manekin. Źródło: Brady (1958). U. S. Army Photograph. Medical Audio Visual Department, Walter Reed Army Institute of Research. Washington, D. C. 602 Chociaż obie małpy w tym eksperymencie otrzymały identyczne uderzenia prądem, druga małpa pozostaje całkiem zdrowa. Małpa odpowiedzialna różni się od swojej partnerki tym, że to właśnie ona podejmuje decyzje. Możliwość kontrolowania sytuacji wydaje się krytycznym czynnikiem dla wywołania stresu. Tak więc, to nie sam kontakt z przykrym zdarzeniem powoduje stres, pojawia się on wyłącznie wtedy, gdy organizm musi wypracować pewien sposób radzenia sobie z sytuacją zagrożenia. Ogromna rozpiętość warunków, które mogą powodować stres, powiązana ze zmiennością międzyosobniczą w reakcjach na sytuacje stresowe, zdumiewa badaczy i znacznie utrudnia badania nad tym zjawiskiem. W odpowiednich okolicznościach prawie wszystko może wywołać stres. Może to być tak dramatyczna sytuacja, jak na przykład skok spadochronowy, lub też tak nieszkodliwa, jak na przykład cieknący kran. Zagrożenie istnieje bowiem w umyśle. Zdolność sytuacji do wzbudzenia stresu zależy od odbioru tej sytuacji i jej kontekstu, od ubiegłego doświadczenia i od możliwości zastosowania reakcji przystosowawczych. Stres pojawia się jako rezultat indywidualnej, aktywnej interpretacji otoczenia oraz interakcji z tym otoczeniem. Zmienia się dynamicznie, kiedy jednostka próbuje uporać się z sytuacją stresową. BIOCHEMICZNE REAKCJE NA STRES Owrzodzenie i inne dolegliwości gastryczne są tylko jedną z wielu możliwych zmian biochemicznych, które występują w wyniku przedłużającego się stresu. Reakcje fizjologiczne przechodzą poszczególne dające się wyodrębnić fazy. Początkowo kontakt z sytuacją stresową wywołuje reakcję alarmową. Charakteryzuje ją wzrost wydzielania adrenaliny, przyspieszenie bicia serca, obniżenie temperatury ciała i napięcia mięśniowego, anemia, krótkotrwały wzrost poziomu cukru we krwi oraz nadkwasota żołądka. Symptomy te, kiedy występują równocześnie, określane są jako stan klinicznego szoku. Jeżeli stres nie ustępuje, faza alarmowa uruchamia wzorzec reakcji obronnej ciała, podczas której system kontroli fizjologicznej mobilizuje organizm do obrony przeciw czynnikowi stresującemu. Zmiany te są związane przede wszystkim ze zmianą aktywności w systemie przysadkowo-nadnerczowym, który skierowuje różnorodne hormony, a szczególnie hormony wykorzystywane w procesie trawienia, do przyspieszenia rozwoju przeciwciał i utrzymania podwyższonego poziomu przemiany materii. Przyczynia się on również do wzrostu stopnia uwolnienia substancji chemicznych z magazynu rezerw, a szczególnie cukru zmagazynowanego w wątrobie, ułatwia to tworzenie się „powszechnego oporu". Te dwa czynniki odpowiedzialne są za powstanie warunków patologicznych, takich jak owrzodzenie żołądka i przewodu trawiennego, oraz za hipoglikemię, kiedy normalne zasoby cukru zostaną wyczerpane. Ta wzmożona aktywność w systemie przysadkowo-nadnerczowym może prowadzić do powiększenia się odpowiednich narządów (por. rys. 17-8). Jeżeli faza oporu przeciw czynnikowi stresującemu zakończy się niepowodzeniem, system biologiczny w końcu wejdzie w fazę wyczerpania, zapaści i śmierci. RYSUNEK 17-8. Charakterystyczne symptomy stresu: powiększone i odbarwione gruczoły nadnercza, zanikająca grasica i węzły limfatyczne oraz owrzodzone ścianki żołądka. Źródło: Selye (1952). 604 Odnotujmy zatem szereg spraw dotyczących biochemicznej reakcji na stres. Po pierwsze, reakcje te są podobne bez względu na to, jakiego rodzaju jest czynnik stresowy. Występują zatem przy zmianach temperatury, infekcji, zatruciach, obrażeniach ciała, urazach pooperacyjnych równie dobrze, jak przy uszkodzeniach fizycznych lub bodźcach bólowych. Występują także przy stresie, będącym przede wszystkim pochodzenia psychicznego, takim jak psychologicznie zagrażająca sytuacja, lub przy konieczności walki z nieustającym zagrożeniem płynącym z otoczenia. Ogólny syndrom adaptacji w różnym stopniu obecny jest we wszystkich tych okolicznościach. Po drugie, niektóre fazy reakcji na stres mogą nie wystąpić. Przy szczególnie nagłym i silnym stresie zwierzę może przejść bezpośrednio od początkowego alarmu do krańcowego wyczerpania. Faza alarmowa, jakkolwiek by było, zawsze wydaje się konieczna. Oprócz tych ogólnych reakcji biochemicznych, wspólnych dla wszystkich sytuacji stresotwórczych, występują specyficzne reakcje na specyficzne zdarzenia. Wzrost temperatury powoduje rozszerzenie się naczyń krwionośnych; obniżenie temperatury powoduje ich skurcz. Rodzaj tworzących się przeciwciał zależy od rodzaju infekcji, jaką należy zwalczyć. Siła reakcji na stres zależy od typu czynnika stresującego, jego siły i nagłości jego wystąpienia. Odporność na stres może się rozwijać, 1-idzie różnią się bardzo znacznie podatnością na sytuacje stresotwórcze. Poszczególne jednostki wydają się „immunizowane", kiedy powtórnie zetkną się z warunkami stresotwórczymi. Jak wywołać stres. Mieliśmy już wcześniej możność zapoznania się z eksperymentami, w trakcie których wywołano wysoki poziom stresu: - małpa odpowiedzialna w tym rozdziale oraz testy na konformizm i uległość wobec autorytetu opisane w rozdziale 16. Ścisła zależność stresu od czynników poznawczych powoduje jednak, że stres jest wyjątkowo trudny do badania w laboratorium. Na przykład, w jednym z eksperymentów psychologowie próbowali badać reakcję na stres u żołnierzy odbywających ćwiczenia bojowe z użyciem ostrej amunicji (Berkun, Bialek, Kearn i Yagi, 1962). Zostali oni zaskoczeni wyraźnie niskim poziomem stresu towarzyszącego tym ćwiczeniom. Ćwiczący żołnierze po prostu nie chcieli uwierzyć, że wojsko zechciałoby postawić ich w takiej sytuacji, w której mogłoby dojść do zranienia. Przyjmują założenie (fałszywe), że sytuacja, kiedy tkwią oni na drzewie, a wokół nich świszczą kule (ćwiczenia w strzelaniu), musi być znacznie bezpieczniejsza niż się wydaje, bo inaczej wojsko na to by nie zezwoliło. Podobne trudności stwierdza się w innych badaniach eksperymentalnych nad stresem. Najwięcej osób przypuszcza, że złe traktowanie w danym eksperymencie musi stanowić część działań wynikających z danego testu. Ta niechęć do odrzucenia obrazu eksperymentatora jako zawsze życzliwego, jako kogoś, kto nie narazi ich na żadne ryzyko czy przykrość bez realnego powodu, sprawia, że badani sami przeciwdziałają skutkom, jakich spodziewa się eksperymentator. I chociaż problemy te utrudniają badanie stresu w warunkach kontrolnych, uwypuklają one znaczenie czynników poznawczych w wywoływaniu reakcji emocjonalnych. Jeżeli jednak rzeczy będą zainscenizowane prawidłowo, stres może być wywołany. W lunaparku jazdę karkołomną kolejką (roller coaster) można uczynić bardziej stresującą (nie wpływając na samą jazdę jako taką) przez ustawienie pewnej liczby znaków dotyczących jakości pokonywanej trasy: Ostrzeżenie. Trasa obluzowana. Odcinek trasy w naprawie. Nie można korzystać w przypadku wywieszenia czerwonej flagi (i duża czerwona flaga wisi na znaku). 605 Operatorzy z lunaparku nie mają śmiałości do stosowania podobnych trików nawet dla żartu, gdyż uzyskanie prawdziwego sukcesu zależy od stopnia konfliktu między poczuciem bezpieczeństwa samej jazdy a zewnętrznymi pozorami niebezpieczeństwa. Jeśli klienci uwierzyliby w niebezpieczeństwo, to cały interes mógłby splajtować. Różnorodne, dobrze rozreklamowane próby typu „stacje kosmiczne", gdzie pewna liczba ochotników zostaje umieszczona na pokładzie statku kosmicznego-symulatora i zamknięta na kilka miesięcy, także przegrywały jako próby naśladowania warunków stresotwórczych. Wiedza o tym, że jest się w rzeczywistości na ziemi, obserwowanym cały czas przez telewizję oraz za pomocą różnorodnych fizjologicznych przyrządów pomiarowych, odbiera cechy realizmu temu eksperymentowi. Taka symulacja pomaga w udzieleniu odpowiedzi na wiele pytań dotyczących np. niezawodności urządzeń sanitarnych i innych części ekwipażu, ale na reakcje człowieka poważnie wpływa wiedza, że to tylko próba. Ogólnie można powiedzieć, że dobre symulowanie warunków, mające na celu spowodowanie normalnych reakcji u ludzi, zależy w dużej mierze od tego, jak skutecznie symulacja naśladuje rzeczywistość. Te różnice między reakcją psychiczną na symulację i na realne doświadczenie stały się w każdym razie podstawą jednego z rozwiązań problemu w opowiadaniu typu „sciene fiction", problemu, jak uczynić astronautów opanowanymi i kompetentnymi podczas trwania rzeczywistej misji kosmicznej, nawet w wypadku zetknięcia się z poważnym defektem urządzeń pokładowych. Trick w opowiadaniu „sciene fiction"był prosty-astronauci byli przekonani, że działają w bardzo realistycznych warunkach symulacji podróży kosmicznej. Stres wywołuje ściśle określone reakcje fizjologiczne zarówno u człowieka, jak i u zwierząt. Pojawia się on, ilekroć człowiek ma do czynienia z zagrożeniem lub niepewnymi okolicznościami przez dłuższy czas. To, czy wystąpi pełna reakcja na stres i zostanie wywołana ostateczna nań reakcja, zależy od poznawczej oceny sytuacji przez daną jednostkę, w miarę jak usiłuje ona znaleźć odpowiednie reakcje, przystosowane do radzenia sobie z okolicznościami stresowymi. Strach. Stres i strach są to bliskie, ale zarazem różnorodne zjawiska. Sytuacje, które wywołują stres, są raczej nieokreślone i niepewne i mogą one oddziaływać w długim okresie czasu. Nagłe, wyraźnie określone niebezpieczeństwo płynące z otoczenia prowadzi do bardziej skoncentrowanej reakcji, strachu. Podstawowa różnica między stresem a strachem jest ta, że w strachu pewne reakcje specyficzne stają się widoczne, szczególnie zaś takie, jak ucieczka i atak. Chociaż dokładnie przeciwstawne w swych skutkach, reakcje ucieczki i ataku są wysoko zbieżne. Ta sama sytuacja może sprowokować zarówno atak, jak i ucieczkę, lub wahanie się między nimi. U organizmów niższych, a prawdopodobnie także i u ludzi, strach i związane z nim reakcje ataku wydają się dobrze zorganizowanym wzorcem zachowania, regulowanym przez określone ośrodki nerwowe w mózgu. Elektryczne drażnienie tych ośrodków nerwowych może spowodować dobrze skoordynowaną reakcję ataku. Nawet małe, białe szczury laboratoryjne, które normalnie są względnie spokojne i nastawione pokojowo (całkowicie niepodobne do swych przodków, dużych szarych szczurów, które są dzikie i drapieżne), 606 mogą zaatakować mysz pod wpływem drażnienia prądem elektrycznym. Przy pewnej lokalizacji elektrody, atakowi towarzyszą wszystkie zewnętrzne objawy wściekłości, jak zjeżenie sierści, szczerzenie zębów itp. Przy innych lokalizacjach elektrody, atak może przebiegać chłodno i spokojnie bez zewnętrznych objawów emocjonalnego wzbudzenia. Typowy wzorzec ucieczki jako rezultat strachu może również być wywołany przez drażnienie elektryczne. Pod wpływem impulsów elektrycznych zwierzę może okazać strach i próbować ucieczki przed tym, co napotkawszy w normalnej sytuacji zaatakowałoby; np. kot, który kuli się z wielkiego przerażenia na widok swego tradycyjnego wroga - myszy. Reakcje na konflikt Organizm napotyka problem, jeżeli ta sama sytuacja zawiera równocześnie komponenty pożądane i niepożądane. Czy zechce dążyć do tej sytuacji w celu uzyskania nagrody? Na ile uda mu się uniknąć w tym samym czasie jej aspektów negatywnych? Sytuacja taka została sformalizowana i badana nieco staranniej ze względu na jej potencjalnie szerokie zastosowanie w różnorodnych kontekstach motywacyjnych. Konflikt dążenie-unikanie. Ogólna strategia badania konfliktu dążenie-unikanie została po raz pierwszy jasno pokazana przez Neala Millera (1951). Główne jej myśli będą łatwiejsze do uchwycenia, kiedy przedstawimy je w formie graficznej. Rozważmy sytuację, w której cel jest równocześnie odrażający i atrakcyjny. Przedstawiamy ją na rysunkach 17-9 i 17-10. Linia przedstawia siłę tendencji dążenia, która rośnie w miarę jak zwierzę zbliża się bezpośrednio do celu. RYSUNEK 17-9 [Wykres siły częstotliwości zbliżania się w zależności od odległości od celu. Krzywa maleje od wysokich wartości blisko celu, do niskiej wartości przy odległości wzrastającej.] 607 RYSUNEK 17-10 [Dwie krzywe siły częstotliwości zbliżania się i siły częstotliwości unikania w funkcji odległości od celu na jednym wykresie. W początkowej fazie, blisko celu, krzywa dążenia osiąga wysoką wartość wcześniej niż krzywa unikania. Istnieje punkt (miejsce przecięcia krzywych) w którym przy tej samej odległości od celu siły tendencji unikania i dążenia są sobie równe. W miarę wzrostu odległości od celu, siła tendencji dążenia jest wyższa od siły tendencji unikania.] Podobnie siła tendencji unikania także wzrasta, gdy zwierzę zbliża się do celu. Względną wyższość siły jednego z motywów wyraża fakt, że krzywa unikania wznosi się szybciej niż krzywa dążenia. Kierunki, w jakich te dwie tendencje działają w organizmie, przedstawione zostały na rysunku 17-11 za pomocą strzałek (wektorów); organizm (koło) jest przyciągany w lewo przez tendencję dążenia i odpychany w prawo przez tendencję unikania. Kierunek jego ruchu zależy od względnej siły przeciwstawnych tendencji. Przypuśćmy, że zwierzę jest daleko od celu-daleko na prawo na rysunku. Tu tendencje dążenia do celu są silniejsze od tendencji do unikania, toteż kieruje się ono w stronę celu. Jeżeli jednak znajdzie się zbyt blisko (z lewej strony na rysunku), 608 to wtedy tendencje unikania przeważą i zaczyna się cofać. Wytwarza się zatem sytuacja, która ma stały punkt równowagi, punkt, w którym obie te siły znoszą się wzajemnie. Ten typ konfliktu dążenie-unikanie jest łatwy do obserwowania. Widocznym jego przykładem może być pływak, którego pociąga przyjemność pływania, lecz odstręcza temperatura wody. W sytuacji idealnej możemy czasem zaobserwować osobę wahającą się przez jakieś 15 minut, stojącą nad wodą, posuwającą się w jej stronę i cofającą się nieznacznie, ale zasadniczo stojącą w punkcie równowagi. W końcu coś się zdarza i powoduje zmianę sytuacji-w jedną lub drugą stronę. Osoba cofa się i odchodzi lub też zamyka oczy, zaciska zęby i wchodzi do wody. Można taki konflikt zaobserwować koło budki telefonicznej, kiedy studenci zamierzają telefonicznie umówić się na randkę. Konflikt dążenie-unikanie, jaki zachodzi w przewidywaniu kłopotliwej rozmowy telefonicznej, może przebiegać bardzo wyraziście. Pewien obserwator opowiadał, że miał okazję przez 30 min. oglądać kogoś, kto siedział w budce telefonicznej ciągle szykując się do wykręcenia numeru, ale nie mógł się zdecydować na ten ostateczny ruch. Kształty obu linii nie są, oczywiście, raz na zawsze ustalone. Cele mogą zmienić się na bardziej atrakcyjne, powodując, że krzywa dążenia wznosi się wyżej, a punkt równowagi przesuwa się bliżej celu. Z drugiej strony, gradient unikania może wzrastać, jeżeli wzrośnie strach związany z wynikiem, powodując przesunięcie się punktu równowagi dalej od celu. Tak więc, redukcja strachu u człowieka w danej sytuacji powoduje albo przyrost aspektów dodatnich (wzrost linii dążenia), albo spadek aspektów ujemnych (obniżenie linii unikania). Inaczej mówiąc, cała ta sytuacja może być zinterpretowana na nowo, zmieniając względną wartość obu tendencji - dążenia i unikania. Taki sam rodzaj analizy może być zastosowany do innych typów konfliktów: • dążenie-dążenie. Zwierzę jest w rozterce z powodu konieczności wyboru między jedną z dwu pożądanych sytuacji. Może wybrać tylko jedną z nich. • unikanie-unikanie. Zwierzę zmuszone jest wybrać jedną z dwu sytuacji, lecz każda z nich jest niepożądana. Pozostawiamy wam jako dalsze ćwiczenie konstruowanie odpowiednich wykresów dla tych dwu sytuacji. Powinniście zauważyć, że konflikt dążenie-dążenie ma pewien chwiejny punkt równowagi. Skoro tylko organizm oddali się od tego punktu, to będzie miał przez całą drogę skłonność do powrotu do tej pierwszej sytuacji. Przy sporządzaniu wykresu reprezentującego siły działające w sytuacji unikanie-unikanie rzuca się Wam w oczy pewna bezpośrednia analogia z podobnym wykresem sił fizycznych, gdzie najlepsze rozwiązanie to opuszczenie sytuacji, pionowo w górę lub w dół. Rozwiązanie takie jest też często stosowane. Student, stojąc przed wyborem: napisać kolokwium lub spotkać się i porozmawiać ze swym profesorem (czynność, która ma wyraźnie wysoką wartość unikania), czasami znajduje wyjście z trudności, wywołanych konfliktem unikanie-unikanie, opuszczając szkołę, cały wybór staje się problemem czysto akademickim. Frustracja. Konflikt może pojawić się, ponieważ ta sama rzecz ma zarówno wartość dodatnią, jak i ujemną. Może pojawić się również, kiedy coś przeszkadza w osiągnięciu określonego celu. 609 Wówczas, gdy pojawia się przeszkoda na drodze do pożądanego działania, rezultatem jest frustracja, a najbardziej typową reakcją na frustrację jest agresja. W klasycznych badaniach nad tym rodzajem konfliktu poddano frustracji dzieci w wieku przedszkolnym (Barker, Dembo i Lewin, 1941)..W pierwszej części eksperymentu dziecko wprowadzono do pokoju zabaw, który zawierał dziwną mieszaninę zabawek. Wszystkie zabawki pozbawione były jakichś części, na przykład deski do prasowania bez żelazek, zabawki wodne bez wody. Te różnorodne braki w zabawkach nie zaniepokoiły zbytnio dzieci. Bawiły się one nimi tworząc wyimaginowane, często skomplikowane sytuacje, w których zastępowały nie istniejące przedmioty, używając tego, co było pod ręką. Zachowanie ich jednak uległo zmianie, kiedy na krótko umożliwiono im obejrzenie lepszego świata. Pozwolono im popatrzeć na zabawki kompletne i znacznie bardziej atrakcyjne od tych, którymi bawiły się uprzednio. Efekt tego doświadczenia ujawnił się następnego dnia, kiedy dzieci dostały znów „stare" zabawki. Nie zadowalała je już więcej mieszanina zabawek. Bawiły się krótko, następnie zaczęły się sprzeczać między sobą, stawały się wojownicze wobec eksperymentatora, a w dodatku zaczęły niszczyć zabawki. Intuicja podpowiada nam, że te zachowania agresywne są typowe jako reakcja na frustrację. Jeżeli utrudnione jest osiągniecie celu, to agresja kieruje się często bezpośrednio na przeszkodę. Jeżeli jest to niemożliwe, mamy do czynienia z przeniesieniem na otoczenie zachowań agresywnych. Agresja stanowi część naszej potencjalnej reakcji na konflikt frustracyjny. Agresja jednak nie zawsze musi być wynikiem frustracji. Jest to poziom uogólnienia, który rzadko można stosować do tak skomplikowanego organizmu, jakim jest człowiek. Reakcja na nic W sytuacjach, które omawialiśmy do tej pory, niepewność pojawia się wtedy, kiedy organizm ma trudności w uporaniu się z pewnymi aspektami jego otoczenia. Próbuje on zastosować reakcję przystosowaną do określonej, szkodliwej sytuacji lub jakiś sposób rozwiązania konfliktu między swymi reakcjami, albo też za pomocą odpowiednich środków przezwyciężyć przeszkodę blokującą pożądane działanie. Co się jednak zdarzy, kiedy otoczenie nie stawia żadnych wymagań? Sądzicie, być może, że wywoła to kompletny spokój organizmu; nie ma nic, co wywołałoby jego reakcje, i nic, co obciążałoby jego zdolności poznawcze. Deprywacja sensoryczna. W roku 1959 na Uniwersytecie McGill w Montrealu stworzono studentom okazję do uczestniczenia w pewnym eksperymencie, który wydawał się „studenckim rajem" (Heron, 1961). Mieli być wysoko opłacani za to, że nie będą robić absolutnie nic. Praca ich polegała na przebywaniu w małym, pustym pokoju, bez umeblowania, tylko z kozetką. Pokój był bez przerwy oświetlony, a badani mieli założone okulary ochronne, rozpraszające światło, które uniemożliwiały widzenie. 610 RYSUNEK 17-12. Źródło: Heron (1961). [Rysunek przedstawia eksperyment „studenckiego raju”; pomieszczenie z kozetką na której leży biorący udział w eksperymencie student.] Nałożono im nauszniki tłumiące dźwięki, a ręce i nogi mieli owinięte, aby ograniczyć wrażenia dotykowe. Mogli oni opuszczać pomieszczenie wyłącznie wtedy, gdy musieli pójść do toalety. Jak taka sytuacja wpływała na badanych? (rys. 17-12). Studenci stwierdzili, że nic nie robić, to nie przelewki. W rzeczywistości ten poziom deprywacji sensorycznej był bardzo przykry. Pierwszą reakcją większości badanych był sen. Ale nie mógł on trwać bez przerwy, a więc zaczęli szybko uczyć się poszukiwania pewnej formy stymulacji. Wielu badanych miało halucynacje. Wszyscy uznali sytuację za bardzo przykrą. Najlepiej świadczy o tym fakt, że tylko niewielu badanych wytrzymało w tej sytuacji dłużej niż 24 godziny, pomimo że dobrowolnie zgodzili się na badanie przez czas dłuższy. Woleli oni nie mieć zatrudnienia, niż dostawać wysoką opłatę za udział w tych niezwykłych badaniach. Od czasu tych początkowych eksperymentów opublikowano bardzo dużo badań dotyczących deprywacji sensorycznej i zubożonego bodźcowe środowiska. Opracowano bardziej doskonałą aparaturę. Teraz osoba badana znajduje się zazwyczaj zawieszona nago w basenie z wodą o temperaturze ciała, co redukuje do minimum jej wrażenia skórne, działanie zmian temperatury oraz siły przyciągania. Brak stymulacji sensorycznej jest niezwykle przykry. Osoby badane stwierdzają, że próbują skoncentrować się w pełni na jakiejkolwiek ilości istniejącej stymulacji, aby jakoś urozmaicić ten nudny eksperyment. Powtarzająca się lub nie zmieniająca się stymulacja wydaje się działać mniej więcej tak samo, jak deprywacja bodźcowa. 611 Ciągły szum dźwiękowy (biały dźwięk) wydaje się równie szkodliwy jak całkowita cisza. Nie ulega wątpliwości, że ludzie odbierają otoczenie jako odstręczające, kiedy jest ono w pełni przewidywalne lub kiedy normalny poziom zewnętrznej stymulacji zostanie drastycznie ograniczony. Jest to wiadome już od dłuższego czasu w zakładach penitencjarnych. Próby ustalenia bardziej specyficznych efektów ubocznych deprywacji sensorycznej nie pozwalają na podanie jasnej odpowiedzi. Jeden pogląd, będący wynikiem znacznej liczby badań, jest taki, że ludzie poddają się znacznie łatwiej sugestii po przebyciu długotrwałego okresu deprywacji sensorycznej. Może to posłużyć do wyjaśnienia efektów „prania mózgu". Nie ma wątpliwości, że strach może dawać skuteczne efekty sugestywności przy perswazji. Ale laboratoryjne badania nad wpływem strachu na sugestywność nie są w pełni przekonujące - być może dlatego, że okresy deprywacji, zazwyczaj stosowane, były względnie krótkie. Ponadto jest oczywiste, że w sytuacji laboratoryjnej trudno jest naśladować warunki podobne do stresu i strachu wzbudzanego realnymi sytuacjami życiowymi. Nerwowe mechanizmy wzbudzenia Niepewność pojawia się w licznych sytuacjach, na przykład: kiedy zachodzą nowe zdarzenia, kiedy nie można przewidzieć biegu zdarzeń, kiedy natrafiamy na okoliczności potencjalnie zagrażające, kiedy występuje konflikt związany z wyborem odpowiedniego działania lub kiedy pożądane działanie zostanie zablokowane. Subsystem nerwowy mający do czynienia z problemami niepewności musi spełniać określone wymagania. • System taki musi ściśle współdziałać z procesami poznawczymi zachodzącymi w wyższych ośrodkach korowych. • System powinien zarówno kontrolować, jak i regulować efektywność procesów korowych. • System powinien być wrażliwy na napływające informacje sensoryczne, aby mógł on ostrzec organizm, zwłaszcza wtedy, gdy pewne nadchodzące sygnały wymagają pierwszeństwa uwagi i przetwarzania. Jest taki system nerwowy, który ma większość z tych właściwości. Przechodząc przez część mózgu zwaną śródmózgowiem stanowi luźną siatkę neuronów, połączoną z pozostałą częścią mózgu. Normalna aktywacja mózgu zależy od tego obszaru - nazywa się on wzbudzający układ siatkowaty (WUS), patrz rysunek 17-13. Wzbudzający układ siatkowaty. Logika funkcji układu siatkowatego polega na wykorzystaniu obfitości i złożoności jego powiązań wzajemnych z resztą ośrodkowego układu nerwowego. Przekazy sensoryczne przechodzą przez WUS w drodze do kory. 612 RYSUNEK 17-13. Na górze: Wstępujący siatkowaty układ wzbudzający. Na dole: Wzajemna interakcja przekazów z kory w dół i z siatkowatego układu wzbudzającego w górę. Źródło Lindsley (1957). 613 Oprócz tych powiązań sensorycznych, układ siatkowaty łączy się bezpośrednio z ośrodkami mózgu leżącymi ponad nim i wysyła też niezliczoną liczbę włókien, które łączą go w sposób rozsiany z całą korą. Komunikacja działa w obu kierunkach. Kora otrzymuje znaczną liczbę danych z włókien układu siatkowatego i, odwrotnie, przekazuje mu bezpośrednio informacje zwrotne. Z anatomicznego punktu widzenia układ siatkowaty znajduje się w idealnym miejscu do pełnienia głównej roli w koordynacji i integracji przebiegu impulsów nerwowych w ośrodkowym układzie nerwowym. Badania nad układem siatkowatym zaczęły od niedawna odsłaniać tę jego główną rolę. Ogólnie wygląda na to, że WUS moduluje ogólny poziom aktywności kory, wpływając na skuteczność przetwarzania napływających danych sensorycznych. Przypuśćmy, że zwierzęciu zaprezentowano błysk światła lub trzask. Wiązka impulsów nerwowych wytworzonych w systemie sensorycznym wędruje do sensorycznych pól odbiorczych kory, gdzie impulsy te wywołują odpowiednie reakcje w znacznej liczbie komórek kory mózgowej. Zsynchronizowana aktywność tych jednostek korowych może być mierzona za pomocą zwykłej elektrody-nazywa się ją potencjałem wywołanym. U znieczulonego zwierzęcia reakcja korowa na napływające sygnały wydaje się szybko wygasać i utrzymuje się jedynie w tych obszarach kory, które jako pierwsze odebrały sygnały sensoryczne. U czuwającego zwierzęcia reakcje nerwowe rozchodzą się po korze i mogą być łatwo wykryte w wielu różnych punktach rejestrujących. Brak u znieczulonego zwierzęcia wrażliwości na sygnały może być wynikiem niemożności przetwarzania przez korę przekazów sensorycznych poza bezpośrednimi polami odbiorczymi. Ponieważ środki znieczulające mają przede wszystkim wpływ na obniżenie wrażliwości układu siatkowatego, wyniki te sugerują, że efektywność procesów korowych zależy od właściwego funkcjonowania układu siatkowatego. Jest wiele poważnych dowodów potwierdzających tę ogólną tezę. Jeżeli WUS jest pobudzony przez elektrodę jednocześnie z pojawieniem się sygnału zewnętrznego, to zarówno wielkość reakcji nerwowej w części sensorycznej kory, jak i zakres jej rozszerzenia się na różne obszary korowe znacznie się wzmaga. Podobne wpływy mogą dotyczyć pojedynczych komórek dróg sensorycznych. Na przykład neurony znajdujące się na szlaku wzrokowym, które nie zareagowały na jakiś nadchodzący sygnał, mogą nagle stać się bardzo aktywne, kiedy elektroda osadzona w układzie siatkowatym zostanie włączona. Aktywacja układu siatkowatego nie zawsze jednak wywołuje wzrost wrażliwości dróg transmisji sensorycznej. Aktywacja pewnych obszarów układu siatkowatego wydaje się wywoływać efekt przeciwny - redukuje raczej niż wzmaga poziom aktywności nerwowej na sygnały sensoryczne. Zmiany w poziomie aktywacji układu siatkowatego wydają się zatem wytwarzać rozległe zmiany w przewodnictwie zarówno dróg korowych, jak i sensorycznych. I na odwrót, aktywność tych połączeń wpływa na układ siatkowaty. Pewne komórki w WUS zdają się być wrażliwe na aktywność każdego z systemów sensorycznych i mogą one reagować z równą siłą na pojawienie się bodźców wzrokowych, słuchowych, dotykowych, a nawet węchowych. Ten typ komórek okazuje się być przede wszystkim wrażliwy na ogólny poziom przewodnictwa sensorycznego, a nie na charakterystyczne cechy danego przekazu. Najczęściej znajdują się one w dolnej połowie WUS. Inne komórki siatkowate są bardziej selektywne w swych reakcjach. 614 Niektóre z nich wydają się służyć przede wszystkim do kontroli informacji o określonej modalności zmysłowej i są wrażliwe wyłącznie na zmiany charakterystycznych cech odpowiedniego sygnału. Te dwa różne wzorce reakcji mogą być podstawą do podziału WUS na dwa oddzielne obszary. Niższa połowa nastawia się przede wszystkim na „grubsze" poziomy aktywności sensorycznej i wydaje się powolna i względnie mało selektywna w swych reakcjach. Podstawową jej funkcją może być utrzymywanie dolnej granicy lub ogólnego poziomu tła dla czuwania lub aktywności. Wyższa część układu siatkowatego (niekiedy zwana układem rozlanej projekcji wzgórza) jest bardziej wrażliwa na przemijające zmiany w poziomie stymulacji i może odgrywać podstawową rolę w ostrzeganiu organizmu przed zmianami warunków zewnętrznych oraz modulować przepływ przekazów sensorycznych w reakcji na wymagania stawiane przez zmieniające się otoczenie. Tu też znajduje się struktura nerwowa zdolna do znacznej kontroli natężenia przepływu przekazów w systemie sensorycznym, do wykrywania krótkotrwałych zmian w stymulacji płynącej z otoczenia, do zmiany właściwości i sprawności procesów korowych, do wzmagania lub redukowania przekazów w ich drodze do kory i do odbierania przekazów z wyższych ośrodków nerwowych, regulujących aktywność własną mózgu. Ma ona ważny wpływ na aktywność organizmu, sprawując wszelkie sposoby kontroli, od naprzemiennych cykli snu i czuwania do specyficznych zmian w uwadze i sprawności procesów korowych. Z punktu widzenia inżyniera,' byłby to system o uprawnieniach kontrolera komunikacji, czyli system odpowiedzialny za koordynację przepływu informacji w układzie nerwowym oraz za kontrolę umiejscowienia obliczeń i analiz ułatwiających działanie wyższych ośrodków nerwowych. Nie możemy jednak przyjąć takiego ostatecznego wniosku, mimo że intuicyjnie wydaje się bardzo prawdopodobny. Chociaż bowiem zebrane dotychczas informacje stanowią dobry punkt wyjścia do zrozumienia WUS, jesteśmy jeszcze dalecy od zrozumienia wszystkiego. SEN Wydaje się, że WUS zawiera w sobie zegar biologiczny, który budzi zwierzę oraz każe mu zasnąć zgodnie ze stałym porządkiem. Śpiące organizmy znajdują się, oczywiście, na niskim poziomie na kontinuum wzbudzenia. Wskaźniki metabolizmu są obniżone, organizm nie porusza się (z wyjątkiem ruchów gałek ocznych i ciągłej pracy żołądka) i jest niewrażliwy na normalny poziom stymulacji. Przez wiele lat dyskusje nad mechanizmami nerwowymi snu polegały przede wszystkim na rozważaniu typowych wzorców aktywności elektrycznej wytwarzanej w mózgu śpiącego w porównaniu z całkowicie obudzonym, przytomnym organizmem. Ogólna reakcja elektryczna znacznej części obszarów korowych mózgu ssaków nabiera wyraźnie różnego charakteru w miarę jak zwierzę przechodzi od stanu całkowitego obudzenia, poprzez stan odprężenia, i w końcu do stanu snu. Kiedy jest ono obudzone i aktywne, elektryczna reakcja w mózgu mierzona na zewnętrznej powierzchni czaszki układa się w szybki, nieregularny wzorzec. Nieregularność wzorca jest prawdopodobnie wynikiem tego, że różnorodne komórki korowe w różnych obszarach mózgu działają niezależnie jedne od drugich. Ale kiedy organizm jest w stanie odprężenia, pojawiają się w elektroencefalogramie mózgu regularne oscylacje o częstotliwości od 8 do 12 Hz. 615 RYSUNEK 17-14. Źródło: Kleitman (1963). Fazy snu: 1. Przebudzenie; fale alfa 2. Lekki sen; fale alfa i delta 3. Pierwszy głęboki sen; fale delta 4. Późniejszy głęboki sen; fale „zerowe” 5. Przebudzenie; fale alfa Wzorzec ten sugeruje, że znaczny procent komórek mózgu funkcjonuje wówczas w sposób zsynchronizowany. Te powtarzające się wzorce wyładowań elektrycznych noszą nazwę fal alfa, a termin blokowanie alfa opisuje zmiany zachodzące od regularnej cyklicznej aktywności mózgu w stanie odprężenia do nieregularnej, niezsynchronizowanej reakcji mózgu, typowej dla czuwającego aktywnego organizmu. Kiedy organizm zasypia, reakcje jego mózgu przechodzą pewną liczbę charakterystycznych faz związanych z różnymi poziomami snu, od drzemki (bardzo lekkiej) do głębokiego snu (rys. 17-14). Dawne teorie dotyczące snu skłaniały się ku zrównaniu go z reakcją na brak stymulacji. To znaczy przyjmowano, że istnieje pewien system aktywacji, który trzyma zwierzę w stanie czuwania i pobudzenia. Przy braku wzbudzenia pojawia się sen. Tak więc czuwanie jest wynikiem działania wzbudzenia, a senność jest wynikiem niskiego poziomu wzbudzenia. Teoria ta jest błędna. Okazało się bowiem, że sen znajduje się pod kontrolą specjalnych „ośrodków snu" w mózgu. Zwierzęta, nawet gdy zostaną pozbawione wszelkiej informacji sensorycznej, utrzymują 24-godzinny cykl snu i czuwania. Uszkodzenia pewnych części układu nerwowego, pewnych okolic we wstępujących drogach rdzenia mózgu, mają ściśle określone skutki dla snu i pełnego przebudzenia. Jeżeli uszkodzenia obejmą wyższe części mózgu, to ich wynikiem będzie sen zwierzęcia przez cały czas, bez przerwy. Jeżeli uszkodzenie dotyczy niższej części mózgu, to wówczas nie ma ono wpływu na wzorce snu i czuwania. Wzbudzający układ siatkowaty leży pomiędzy tymi dwoma poziomami. 616 INTERPRETACJA WZBUDZENIA EMOCJONALNEGO Niezgodność między oczekiwaniami a rzeczywistością jest przyczyną ogólnej aktywności procesów fizjologicznych i poznawczych. Centralnym problemem dla teoretyków jest stwierdzenie, czy istnieje jeden mechanizm wzbudzający, który po prostu alarmuje organizm i pozwala na pojawienie się jakiejkolwiek możliwej reakcji, czy też może wzorzec aktywacji jest różny zależnie od różnych przyczyn? Koncepcję, która głosi, że wzbudzenie emocjonalne jest niespecyficzne i u jego podstaw leży jeden mechanizm, będziemy nazywać Teorią Grającej Szafy w odniesieniu do emocji (Mandler, 1962). Emocje: jedna czy wiele? Zgodnie z Teorią Grającej Szafy wzbudzenie emocjonalne jest w pewnym stopniu podobne do wrzucania monety do grającej szafy - włączona maszyna jest przygotowana do ruszenia, gotowa grać w równym stopniu każdy utwór ze swojego repertuaru. Aktualne zachowanie jest określone tylko przez to, jaki guzik zostanie naciśnięty. Aktywacja emocjonalna zaczyna działać z chwilą, kiedy moneta dostanie się do wnętrza maszyny. Czynniki zewnętrzne dokonują wyboru zachowania, działają więc tak jak naciśnięcie na guzik wybierający określoną płytę. Tak jak ze wszystkimi analogiami, podobieństwa nie należy brać dosłownie. Jeden ważny czynnik w reakcjach emocjonalnych nie poddaje się tej analogii, a mianowicie to, że zdarzenia, które prowadzą do reakcji emocjonalnej, wpływają następnie na dalsze zachowanie, kiedy system został już wzbudzony. Nakłada to poważne ograniczenia na to, jakie zachowanie wyniknie ze stanu emocjonalnego. Teoretycznie jest możliwe, że mechanizmy aktywacji są różne dla różnych emocji. W gruncie rzeczy, czyż nie jesteście świadomi różnic w tym, w jaki sposób Wasze ciało jest pobudzane przez głód, przez zimno, strach lub seksualnie? Odpowiedź brzmi: tak, albo nie. Z jednej strony jest oczywiście możliwe podzielenie typów aktywacji nerwowej na dwie ogólne kategorie: czynniki pobudzające i czynniki uspokajające. Jeden zespół emocji wydaje się wynikiem aktywacji sympatycznego układu nerwowego i prowadzi do ogólnego stanu napięcia, szczególnie mięśni podtrzymujących ciało (nazywanych też mięśniami antygrawitacyjnymi). U człowieka typowe objawy to: napięcie w kolanach, wyprostowane ciało, zaciśnięte ręce i szczęki... Wzrasta rytm pracy serca, naczynia krwionośne kurczą się i tym samym rośnie ciśnienie krwi. W terminach dotyczących emocji będą to często symptomy wściekłości, nienawiści lub gniewu. Inny zespół emocji wydaje się charakteryzować symptomami, które są prawie całkiem przeciwstawne. Jest on wynikiem aktywacji parasympatycznego układu nerwowego. Będzie to zwolnienie pracy serca, rozszerzenie naczyń krwionośnych oraz obniżenie ciśnienia krwi. Kończyny są rozluźnione. W terminach dotyczących emocji będą to często symptomy stanów przyjemnych, np. nasycenia po przejedzeniu się. 617 Nie powinno być wątpliwości w odróżnianiu stanów napięcia od stanów odprężenia, przynajmniej w krańcowych przypadkach. Ale czy subtelniejsze różnicowanie może być dokonywane w obrębie tych dwu grup? W tej sprawie dowody są niezbyt jasne. Jeden teoretyk w każdym razie dowodził, że te dwie podstawowe emocje są po prostu wynikiem normalnej obrony ciała przed zimnem i gorącem (Stanley-Jones, 1970). Kurczenie się naczyń krwionośnych oraz wszystkie związane z tym efekty są częścią reakcji obronnej na zimno. Rozszerzanie się naczyń krwionośnych i towarzyszące temu efekty są częścią reakcji obronnej na gorąco. Zgodnie z tą teorią, cały zespół stanów emocjonalnych wiąże się z tymi dwiema podstawowymi reakcjami fizjologicznymi. Różnice jakie odczuwamy pomiędzy stanami - przyczyna tego, że na ogół nie mieszamy odczucia ciepła ze stanem podniecenia seksualnego lub odczucia zimna z gniewem-tkwią w tym, że czynniki poznawcze przejmują nad tym kontrolę. Tak więc ten sam czynnik poznawczy, który powoduje rozluźnienie naczyń krwionośnych, przyczyni się również do tego, że stan naszego ciała zinterpretujemy jako miłość, a nie po prostu przegrzanie się. Problem w rozwiązaniu tego zagadnienia tkwi w ograniczoności naszej świadomości. W zasadzie wszyscy psychologowie chcieliby wiedzieć, czy napięcie wywołane przez strach da się odróżnić od napięcia wywołanego gniewem lub nawet zimnem. W praktyce stwierdzają oni, że nie tak łatwo przekonać się o tym. Pomiary fizjologiczne. Wspomnieliśmy już o tym, że podczas wzbudzenia emocjonalnego wiele wskaźników fizjologicznych ulega zmianie. Oczywiste jest pytanie, czy istnieją różne wzorce reakcji fizjologicznych w zależności od rodzaju emocji. Czy stan fizjologiczny danego organizmu, kiedy jest on zły, różni się od stanu przestraszonego organizmu? W jednym z eksperymentów (Ax, 1953) osoby badane były podłączone do różnorodnych urządzeń mierzących procesy fizjologiczne, a następnie asystent współdziałający w badaniach denerwował je lub straszył. Strach był wywołany nieumiejętnym posługiwaniem się aparaturą przez asystenta; złość była spowodowana przez odpowiednio sformułowane złośliwe uwagi. Wystąpiły pewne różnice w ogólnym wzorcu reakcji fizjologicznych na obie emocje. Dokładny wzorzec aktywności zależy jednak nie tylko od siły wzbudzenia emocjonalnego, lecz również od całego kontekstu. Ponadto trudno jest powiedzieć, czy te różnice fizjologiczne odzwierciedlają rzeczywiste, leżące u ich podłoża przyczyny fizjologiczne, czy też po prostu odzwierciedlają skutki reakcji emocjonalnej. Ax stwierdził, że osoba rozzłoszczona ma obniżony rytm serca i wzrost napięcia mięśniowego oraz rozkurczowego ciśnienia krwi, podczas gdy osoba przestraszona szybciej oddycha. Ale może to też być wynikiem usiłowań danej jednostki, żeby poradzić sobie z własną percepcją strachu i złości. Na reakcje fizjologiczne wpływa to, czy dana jednostka otwarcie wyraża swą złość. Ponadto, jeżeli nawet wewnętrzny wzorzec wzbudzenia jest nieco różny dla różnych emocji, pozostaje ciągle pytanie, czy te wzorce wzbudzeniowe są wystarczająco różne, aby dostarczyć jednostce niezawodnych wskazówek co do emocji, jakiej ona doświadcza. 618 Biofeedback (Biologiczne sprzężenie zwrotne). Dlaczego nie można po prostu polegać na słowach ludzi i nie zapytać ich wprost, co odczuwają, kiedy mówią, że coś „czują"? Jeżeli nawet na takie pytanie otrzymamy odpowiedź, nie będzie to właściwa droga do poznania, na ile odpowiedź ta jest zdeterminowana przez czynniki poznawcze, które wytwarzają stany ciała, a na ile przez rzeczywiste oszacowanie tych stanów. Ponadto u ludzi występują dające się w pełni kontrolować stany ciała, których sam człowiek nie potrafi opisać. Poruszcie drugim palcem u ręki, a teraz poruszcie trzecim palcem tej samej ręki. Opiszcie, co różni te dwie czynności. Po prostu nie jest to możliwe. Mimo to fakt, że posiadacie tak precyzyjną kontrolę dotyczącą ruchów własnych palców, świadczy, iż Wasz mózg może świadomie posługiwać się własnymi rozkazami motorycznymi, aby poruszyć tymi palcami. Przypuśćmy, że macie nauczyć kogoś, jak ma poruszać swoimi palcami lub uszami? Od czego byście zaczęli? Nie ma możliwości dokonania tego przez opis, musicie posłużyć się bardziej wyszukanymi technikami. Tak samo może być z emocjonalnymi stanami ciała. Możecie jednak stwierdzić –„ja zawsze wiem, kiedy jestem głodny, ponieważ wtedy mój żołądek burczy i ściska". Jest to niesłuszne. Ludzie z usuniętym żołądkiem ciągle mają „skurcze żołądka". Dlaczego czasem odczuwasz te skurcze dopiero po spojrzeniu na zegarek? Przyczyna tego nie jest dotąd dokładnie znana. Jedna z metod próbujących ocenić wiedzę ludzi o stanach własnego ciała to poddanie kontroli tych stanów i sprawdzenie, czy ludzie mogą reagować stosownie do tego, co się wydarzy. Większość z wcześniejszych eksperymentów kończyła się niepowodzeniem. W jednej z takich pionierskich prób zadaniem osoby badanej było przewidywanie, które z dwu świateł zapali się. Włączenie światła było zdeterminowane przez rytm pracy serca osoby badanej; jedno ze świateł zapalało się, ilekroć rytm serca wzrastał, drugie natomiast zapalało się, gdy obniżał się. Po 5000 prób nie zauważono najmniejszego śladu nabycia umiejętności przewidywania właściwego światła. Dzisiaj jednak powszechnie praktykuje się poddawanie kontroli przez badanego wszystkich rodzajów stanów ciała, które są nieuświadamiane, ale wymaga to zastosowania odpowiednich form pomocy z zewnątrz. Jeżeli poprosimy Was, abyście zaczęli medytować nad tym, jak zmienić obraz elektrycznej aktywności Waszego mózgu, nie wiedzielibyście zapewne, jak się do tego zabrać. Ale nie przejmujcie się, można się tego nauczyć, a mimo to być kompletnie niezdolnym do opisania tego, co się robi (tak jak nie potrafiliście opisać, w jaki sposób poruszacie własnym palcem). Tymczasem rozwiązanie polega na posłużeniu się aparaturą elektryczną do wykrywania sygnału elektrycznego płynącego z mózgu (lub inne procesy ciała), który ma być poddany kontroli przez badanego. Do kontrolowania fal mózgowych aparat taki jest dość wygodny. Przewody elektryczne podłączone są do skóry głowy, a powstający potencjał elektryczny zostaje wzmocniony i może być kontrolowany. Potencjał ten z kolei używany jest do regulowania wysokości tonu wytarzanego przez audiooscylator. Osoby badane słyszą ten ton w swoich słuchawkach. Normalnie, aktywność mózgu osoby badanej zawiera bardzo powolny (około 10Hz) komponent o dość wysokiej amplitudzie, dzieje się tak wówczas, 619 gdy nie myśli ona o niczym lub niczego nie ogląda - występuje tu wspomniany uprzednio rytm typu alfa. Zadanie osoby badanej polega na wytwarzaniu aktywności typu alfa w stanie czujności przy całkowitym obudzeniu. W naszym laboratorium stosujemy tę procedurę w sposób następujący: wtedy, kiedy nie ma komponentu typu alfa w zapisie z mózgu osoby badanej, słyszy ona równomierny stały ton w słuchawkach. Im więcej jest wytwarzanych fal typu alfa, tym niższy ton jest prezentowany. Zadaniem osoby badanej jest postępować tak, aby ton ten stawał się na tyle niski, na ile to jest możliwe. Po treningu wiele osób może włączać lub wyłączać swój rytm alfa wtedy, kiedy tego chcą. Kontrolowanie własnych procesów wewnętrznych, takich jak rytm serca i fale mózgowe, jest również możliwe, chociaż nie łatwe. Wymaga to znalezienia sposobu na uczynienie tych wewnętrznych stanów łatwo obserwowalnymi przez osoby badane. Tak więc najnowsze dane prowadzą do obalenia poglądu, że ludzie nie mają żadnego wpływu na to, co dzieje się w ich ciele. Wiele danych świeżej daty odnosi się do zdolności człowieka do kontrolowania funkcji własnego ciała, ale z kontroli takiej nie musi on w pełni zdawać sobie sprawy. Jak wywołać gniew lub euforie? Słynny eksperyment przeprowadzony przez Schachtera i Singera (1962) dotyczył następującego problemu: czy możliwe jest wzbudzenie systemu emocjonalnego różnych osób w ten sam sposób, ale dający różne efekty w ich zachowaniu, zależnie od sytuacji zewnętrznej, w jakiej osoby te się znalazły? Wzbudzenie emocjonalne. Wiele sytuacji emocjonalnych wywołuje hormon adrenalina (bardziej właściwa nazwa epinefryna) wydzielany wewnątrz ciała. Schachter i Singer robili osobom badanym zastrzyki z adrenaliny, ale udzielali im fałszywej informacji co do istoty tych preparatów. W ten sposób wzbudzenie emocjonalne było wywołane przez substancję pobudzającą, podczas kiedy stan poznawczy był regulowany przez sytuację, w jakiej znalazła się każda z osób badanych. Były dwie grupy osób badanych: jedna, która po otrzymaniu zastrzyków została poinformowana jakich objawów może się spodziewać-grupę tę określimy jako poinformowaną; druga, która otrzymała zastrzyki, ale została wprowadzona w błąd przez zapowiedź, że nie wystąpią żadne uboczne efekty, określimy ją jako niepoinformowaną. Wszystkie osoby badane dobrowolnie uczestniczyły w eksperymencie dotyczącym badania efektów działania różnych środków farmakologicznych na widzenie. Każdego z badanych, w momencie gdy przybył na badania, pytano o to, czy zgodzi się na zastrzyk „z zestawu witamin typu Suproxin". Jeżeli wyrażał zgodę, obecny tam lekarz dawał mu ten zastrzyk. Ponadto osoby badane wybrane do grupy niepoinformowanej powiadamiano, że zastrzyk nie spowoduje żadnych skutków ubocznych. Osobom badanym z grupy poinformowanej powiedziano, że niektórzy z badanych „...odczuwają uboczne działanie Suproxinu. 620 Te efekty uboczne trwają tylko 15 do 20 minut. Ręce zaczynają się trząść, serce łomoce, a gorąco uderza do twarzy i występują wypieki". Opis ten jest w rzeczywistości dokładnym określeniem skutków działania zastrzyku z adrenaliny. Warunki sytuacyjne. Po otrzymaniu zastrzyków osoby badane zostały wprowadzone do poczekalni, „aby dać czas na zadziałanie zastrzyku". Po wejściu do poczekalni osoba badana zastawała tam już inną osobę. Dla nas szczególne znaczenie mają dwa z różnych typów warunków eksperymentalnych, zastosowanych w tym badaniu w celu zaobserwowania wpływu sytuacji na osobę badaną: jeden zwany euforycznym, drugi zwany gniewnym. Mamy zatem cztery grupy eksperymentalne: poinformowaną-euforyczną, niepoinformowaną - euforyczną, poinformowaną-gniewną i niepoinformowaną-gniewną. Oprócz grup eksperymentalnych było jeszcze kilka grup kontrolnych, którym w tych samych warunkach sytuacyjnych nie wstrzykiwano adrenaliny. Euforia. W warunkach euforycznych osoba badana wchodząc do poczekalni zastawała już tam wesołego osobnika. Ta druga osoba w doskonałym humorze puszczała papierowe samolociki, bawiła się wszystkim, co wpadało jej w rękę, i ćwiczyła sobie grę w koszykówkę posługując się zgniecionym papierem i koszem na śmiecie. Zaczynała też namawiać swego towarzysza, aby przyłączył się do zabawy. Gniew. W tych warunkach osobę badaną zaprowadzono do poczekalni i poproszono o wypełnienie w całości doprowadzającego do wściekłości kwestionariusza. Jedno z typowych pytań zawartych w nim miało następującą formę: Z jak wieloma mężczyznami (poza twoim ojcem) miała twoja matka seksualne stosunki pozamałżeńskie? 4 lub mniej 5 do 9 10 lub więcej Odpowiedź na to pytanie miała na celu zirytowanie respondentów. Druga osoba znajdująca się w tym samym czasie w poczekalni przejawiała wzrastające zdenerwowanie, aby wreszcie podrzeć z wściekłością kwestionariusz i na koniec wyjść z pokoju rzucając go na podłogę. Wyniki. Zastanówmy się teraz nad tym, do czego doprowadziły te różne warunki. Mamy osoby badane, których biologiczne systemy są w stanie wzbudzenia i które pozostawiono w pokoju sam na sam z dziwnie zachowującą się osobą. Jeżeli emocja jest po prostu wynikiem reakcji na kombinację stanu wzbudzenia wewnętrznego i sytuacji zewnętrznej, to nie powinno być różnicy między zachowaniem osób z grupy poinformowanej o tym, co będą odczuwały po zastrzyku, a zachowaniem osób z grupy niepoinformowanej. RYSUNEK 17-15 Wszyscy osobnicy otrzymali zastrzyki z adrenaliny, ale powiedziano im, że jest to mieszanina witamin GRUPA POINFORMOWANA Osoby badane zostały poinformowane o tym, że wszyscy będą odczuwać uboczne skutki, takie jak wypieki na twarzy, drżenie rąk oraz przyspieszenie bicia serca GRUPA NIEPOINFORMOWANA Osoby badane zostały powiadomione, że nie będą odczuwać żadnych ubocznych skutków POINFORMOWANY-EUFORYCZNY Badany wchodzi do pokoju, w którym znajduje się inna osoba. Osoba ta śmieje się, tańczy dookoła i bawi się Badany interpretuje swoje sensacje fizyczne jako efekt uboczny i nie włącza się do tego, co czyni druga osoba POINFORMOWANY- GNIEWNY Badany otrzymuje do wypełnienia kwestionariusz z obraźliwymi pytaniami, druga osoba wypełniająca także kwestionariusz przejawia głośno swój gniew Badany interpretuje swoje sensacje fizyczne jako efekt uboczny i nie włącza się do tego, co czyni druga osoba NIEPOINFORMOWANY-EUFORYCZNY Badany wchodzi do pokoju, w którym znajduje się inna osoba. Osoba ta śmieje się, tańczy i bawi się Badany interpretuje swoje sensacje jako wzbudzenie emocjonalne i włącza się w euforyczne zachowanie drugiej osoby NIEPOINFORMOWANY- GNIEWNY Badany otrzymuje do wypełnienia kwestionariusz z obraźliwymi pytaniami, druga osoba wypełniająca także kwestionariusz przejawia głośno swój gniew Badany interpretuje swoje zachowanie fizyczne jako wzbudzenie emocjonalne i włącza się w agresywne zachowanie drugiej osoby 622 Jeżeli stan wzbudzenia jest specyficzny dla określonego typu emocji i niezależny od otoczenia, to wówczas obie te grupy zachowają się podobnie do siebie w warunkach euforycznych i podobnie w warunkach gniewnych. Jeżeli zaś czynniki otoczenia zewnętrznego mają silny wpływ, to wtedy osoby z każdej z grup będą reagować odpowiednio do zachowania partnera w poczekalni. To, co stwierdzono, było bardzo proste. Osoby poinformowane spokojnie podchodziły do swoich zadań, grzecznie czekając lub też wypełniając kwestionariusz i ignorując błazeństwa współtowarzysza. Osoby niepoinformowane przejawiały jednak tendencję do naśladowania zachowania swoich współtowarzyszy, stając się euforyczne lub zagniewane, odpowiednio do nastroju tych partnerów. Mamy zatem dwie grupy osób badanych, poinformowanych i niepoinformowanych, z identycznymi stanami wzbudzenia wewnętrznego i identycznymi doświadczeniami wynikającymi z sytuacji. A jednak postępują oni w różny sposób. Dlaczego? Jedni spodziewają się wewnętrznych doznań, które odczuwają i (prawidłowo) przypisują je działaniu zastrzyku, są więc zdolni zająć się swymi sprawami, ignorując błazeństwa współtowarzysza w pokoju. Drudzy natomiast czują bicie serca i rumieńce na twarzy. Nie znajdują wyjaśnienia dla tych odczuć, ale nabierają one sensu, jeżeli potraktuje się je jako euforię lub gniew. W ten sposób bez próby szukania wyjaśnienia łatwo poddają się manipulacji. [Na posiedzeniu wyjaśniającym po eksperymencie przedstawiono osobom badanym istotny cel tego badania. Poinformowano je, jakiego typu substancja została im wstrzyknięta i jakie było jej działanie uboczne i że druga osoba towarzysząca im w pokoju była w rzeczywistości jednym z eksperymentatorów. Jak już objaśnialiśmy w przypisie 2 do rozdz. 16 (s. 562), oszukiwanie osób badanych w eksperymentach psychologicznych, jakkolwiek czasem konieczne, po przeprowadzonym badaniu musi być zawsze sprostowane podczas sesji wyjaśniającej cel i istotę konkretnego eksperymentu.] MOTYWACJE A POZNANIE Istnieje wiele eksperymentów, których wyniki stanowią na ogół poparcie dla tych głównych punktów: stany emocjonalne są wypadkową działania trzech różnych czynników -procesów poznawczych (oczekiwania), stanów fizjologicznych i wpływów środowiska. Mówiąc że czynniki poznawcze odgrywają ważną rolę w regulowaniu zachowania emocjonalnego, nie mamy na myśli tego, że ludzie muszą mieć świadomość swych procesów poznawczych. Nieraz, kiedy nas złości lub przeraża czyjaś uwaga lub postępek, rozum mówi nam, że nie ma się czym tak przejmować, ale nasze reakcje wewnętrzne mówią coś całkiem przeciwnego. W takich przypadkach może wystąpić znaczna rozbieżność między racjonalizacją naszego zachowania a samym zachowaniem. Przełożenie aktywnej interpretacji teorii emocji na nasz model działającego systemu motywacyjnego oznacza, że musi być zapewnionych kilka istotnych interakcji pomiędzy procesami regulującymi zachowanie. Przede wszystkim system taki musi tworzyć model wewnętrzny świata, który to model dostarczałby oczekiwań tak ważnych dla emocji. Oznacza to, że główną cechą systemu musi być poznanie; aktywne powstawanie obrazu świata, 623 obejmującego przeszłość, teraźniejszość i oczekiwania dotyczące przyszłości. Ponadto potrzebna jest również możliwość oceny, czy wszystko przebiega prawidłowo. Czy nasze oczekiwania się spełniają? Jakie przewidywania możemy poczynić na przyszłość, jeśli sprawy będą biegły nadal w ten sam sposób? Następnie potrzebny nam jest jakiś sposób korygowania zaburzeń w zachowaniu. Załóżmy, że pojawia się niezgodność między oczekiwaniem a zdarzeniem. Przyjmijmy, że musimy dostarczyć w określonym terminie, np. w piątek, pracę seminaryjną, bo inaczej możemy zawalić rok. Po zbadaniu, jak dalece jesteśmy zaawansowani, dochodzimy do wniosku, że możemy nie zdążyć. Panika. Napięcie. W jaki sposób nasz system powoduje panikę? Oczywiste jest, iż musi on zacząć od operacji poznawczych, które doprowadzą do przewidywań, że nieprzekraczalny termin nie zostanie dotrzymany. Ale na ile świadomość tego faktu zmienia rytm serca, napięcie mięśniowe, wydzielanie potu, ciśnienie krwi albo nawet system głodu? RYSUNEK 17-16 [Punktem wyjścia na schemacie jest środowisko, które oddziałuje na człowieka, następuje analiza sensoryczna i impuls pobudzający do porównywacza poznawczego. Do tegoż porównywacza poznawczego dobiega z drugiej strony impuls zwalniający pochodzący z bloku procesy poznawcze, zasilanego przez pamięć. Porównywacz poznawczy ma wyjścia do aktywacji chemicznej i do aktywacji nerwowej.] Przeanalizujmy działanie tego systemu. W procesie aktywnej syntezy tworzą się przewidywania dotyczące świata; system pamięci wspomaga ten proces, a działania, jakie zachodzą, są nieustannie porównywane z tymi, jakie były oczekiwane. Jeżeli te mechanizmy syntetyzujące i przewidujące nazwiemy procesami poznawczymi, to system ten będzie wyglądał tak, jak przedstawia to rysunek 17-16. Wykres ten, oczywiście, stanowi duże uproszczenie, ale podkreślono na nim fakt, jak ważnym wyjściem jest porównanie między poznaniem a działaniem. Jak działa to wyjście? Zadaniem jego jest regulacja chemicznych i nerwowych czynności systemu. To znaczy, że odpowiedni poziom niezgodności w porównywaczu poznawczym (PP) wyzwala odpowiednie substancje chemiczne (w większości hormony) w biochemicznych strukturach ciała i zmienia aktywację nerwową struktur mózgowych. Sygnały te są odbierane w toku normalnej analizy dokonywanej przez różne systemy ciała. Powróćmy do systemu głodu. System głodu zbiera informacje w różny sposób. Przede wszystkim dokonuje analizy biochemicznej, poza tym posiada on stan docelowy dla poziomu odżywienia, który stara się utrzymać. 624 [RYSUNEK 17-14 Przypomnienie] Z bloku symbolizującego stan biochemiczny wychodzą strzałki do prostokąta kontrolera stanu. Z kontrolera stanu wejście hamujące do koła porównywacza stanów (PS). Z PS wyjście do prostokąta selektora zachowania i do porównywacza stanu z celem PSC, oraz wejście od prostokąta stanu docelowego. Do PSC dochodzi również sygnał z porównywacza celów PC, który dostaje sygnały zwalniające od obrazu celu i pobudzajace od analizy sensorycznej. PSC wysyła sygnał pobudzający do bloku konsumpcji i zwalniający do selektora zachowania. Z prostokąta konsumpcji wychodzi strzałka do bloku stanu biochemicznego.] RYSUNEK 17-17 [Schemat z rysunku 17-16 połączono ze znanym już schematem (z rysunku 17-14) obrazującym wzajemne zależności między porównywaczem stanów PS, porównywaczem celów PC i porównywaczem stan z celem PSC. Porównywacz poznawczy PP łączy się strzałką aktywacji nerwowej z obrazem celu, strzałką aktywacji chemicznej ze stanem biochemicznym.] Ma on również wytworzony wewnętrzny obraz poszukiwanego celu. Na koniec dokonuje analizy informacji sensorycznej. Procesy poznawcze mogą tu współdziałać w różny sposób. Aktywacja chemiczna wywołana przez PP może wpływać na analizę biochemiczną w stanie głodu. Aktywacja nerwowa może wpływać na różne procesy, ale głównie na te, które określają wewnętrzny obraz celu. Jeżeli zechcemy pokazać te interakcje, to otrzymamy obraz podobny do tego, który przedstawia rysunek 17-17. Wszystkie systemy motywacyjne mają jednak podobne punkty. Oczywiście wszystkie one kontrolują stany biochemiczne, jak również nerwowe. Przeto cały obraz może wyglądać tak, jak przedstawia to rysunek 17-18. Zwróćcie uwagę na to, co zostało pokazane. System poznawczy może regulować biologiczne procesy emocjonalne. Podobnie system biochemiczny może regulować działanie. Cały obraz przedstawia się jako kołowy regulacyjny system sprzężenia zwrotnego. Jeżeli działania nie idą dobrze, to system poznawczy prawdopodobnie wysyła przekazy o błędzie za pomocą stymulacji chemicznej - może to być wprowadzenie adrenaliny do systemu. Ale stymulacja ta może mieć dokładnie przeciwny skutek niż ten, który jest potrzebny. 625 RYSUNEK 17-18 [Na schemacie systemy motywacyjne mające wpływ na zachowanie dostają impulsy od analizy sensorycznej, porównywacza poznawczego, stanu biochemicznego. Porównywacz poznawczy dostaje impulsy pobudzające z analizy sensorycznej i zwalniające od procesów poznawczych zasilanych przez pamięć.] Współczesny człowiek nie musi przecież polować na tygrysy, raczej powinien rozwiązywać problemy intelektualne. Wzrost napięcia i stany ciała związane z polowaniem będą prawdopodobnie szkodliwe dla pracy intelektualnej. Ponadto nie jest wykluczone, że ów biedny człowiek, którego system został po prostu wzbudzony, może zauważyć wszystkie występujące zmiany fizjologiczne: przyśpieszenie rytmu serca, głęboki oddech, napięcie, pocenie się, i dojść do wniosku, że się boi. Wtedy rzeczy lecą mu z rąk, skoro bowiem jest przestraszony, to może powinien uciekać. A wszystko to z powodu terminu pracy seminaryjnej. System, który zarysowaliśmy, pracuje równocześnie we wszystkich kierunkach. Aspekt poznawczy strachu może stać się przyczyną biochemicznej (hormonalnej) stymulacji ciała. Również na odwrót, wydzielanie hormonów może wywołać uczucie strachu. Czy kiedykolwiek będziemy umieli powiedzieć, co było czego przyczyną? Dlaczego martwimy się o to? Bardzo istotną sprawą w tym systemie jest to, w jaki sposób różne jego części współdziałają ze sobą. Poznanie i emocje ściśle przeplatają się ze sobą. 626 WKŁADKA KOLOROWA RYSUNEK 1-46. [Rysunek przedstawia białe współśrodkowe kręgi o niewyraźnych konturach na żółtym tle.] Jeśli będziecie wpatrywać się w środek rysunku z odległości ok. 15 cm nie poruszając nimi, to po pewnym czasie koła zaczną się jakby zamazywać. Wyjaśnienie te go faktu, patrz rysunek 1-47 (Peter Sedgley, Looking Glass Suite, Nr 9, Kolekcja litografii D. A. Normana). RYSUNEK 1-49. [ Rysunek przedstawia dwa białe trapezy na czarnym tle z zaznaczonym punktem fiksacji. Lewy trapez pokryty jest zielonymi serduszkami, prawy jest cały biały.] Wpatrujcie się w czarną kropkę na lewym rysunku nie poruszając głową ani oczami tak długo, aż cała figura zacznie migotać, drgać. Wtedy przenieście szybko wzrok na czarną kropkę prawego białego rysunku. Zobaczycie różowe serca na zielonkawym tle (kilkakrotne mrugnięcie okiem przyśpiesza pojawienie się efektu następczego). Różowa barwa to obraz następczy, zielona jest indukowana" (zmodyfikowane na podstawie The Color Tree, Interchemical Corp., New York 1965). RYSUNEK 4-1. [Schematycznie opisano tu widmo elektromagnetyczne, zaznaczając, fale radiowe (do około 100 m), telewizyjne (około 10 m), następnie fale ultrakrótkie (do 0.001 m), potem mamy widmo widzialne od około 700 nanometrów do 400 nanometrów).Widmo widzialne przechodzi w ultrafiolet, następnie promienie X (kilka nanometrów), promienie gamma (rzędu 0.001 nm) i w końcu promienie kosmiczne (długość fali około 0,00001 nm)] RYSUNEK 5-19. [Na czarnym prostokątnym tle widnieją dwa kwiatki; z lewej strony u dołu mniejszy, niebieski kwiatek, z prawej strony w środku większy czerwony kwiatek.] Zjawisko Parkinjego. Różnice między wrażliwością wzrokową w dzień i w nocy. Przedstawione na ilustracji dwa „kwiatki” czerwony i niebieski normalnie widziane są jednakowo dobrze, przy czym czerwony wydaje się jaśniejszy od niebieskiego. Oba spostrzegane są dzięki widzeniu czopkowemu. Jeśli będziemy patrzyli na oba kwiatki przy bardzo słabym świetle, to przykładowo po pięciu minutach czerwony kwiatek przestanie być widoczny, a widzieć będziemy tylko niebieski. Jeżeli światło jest dostatecznie słabe, działa jedynie widzenie pręcikowe. Możemy przyspieszyć pojawienie się tego efektu, jeżeli przez cały czas będziemy koncentrować wzrok na środku czerwonego kwiatka. W tym wypadku obraz pada na plamkę żółtą, praktycznie pozbawioną pręcików, a obraz kwiatka niebieskiego na obszar bogato usiany pręcikami (zmodyfikowane na podstawie The Color Tree, Interchemical Corp., New York, 1965). RYSUNEK 5-31. [Rysunek przedstawia dwa prostokąty o tych samych wymiarach. Górny jest cały biały z zaznaczonym punktem fiksacji wzroku, dolny przedstawia spłaszczone niebieskie okręgi na czerwonym tle.] Wpatrujcie się w punkt fiksacji w środku dolnego rysunku. Następnie spójrzcie w punkt fiksacji górnego prostokąta. Zobaczycie pierścienie i tło w barwach dopełniających (zmodyfikowane na podstawie The Color Tree, Interchemical Corp., New York, 1965). Mierzenie zmiennych psychologicznych DODATEK A DOZNANIA ZMYSŁOWE SKALOWANIE Rodzaje skal Skala nominalna Skala porządkowa Skala przedziałowa Skala stosunkowa Skala absolutna Techniki skalowania Skalowanie oparte na pomyłkach Skalowanie bezpośrednie Ocenianie wielkości Prawo potęgowe ,,Ile" wobec „jakiego rodzaju"? Interpretacja funkcji potęgowej Zakres zastosowania Porównywanie między modalnościami Jak skalować? Metoda Analiza wyników Porównywanie między modalnościami Analiza 627 DOZNANIA ZMYSŁOWE Zajmując się doznaniami zmysłowymi, takimi jak widzenie i słyszenie, musimy pamiętać o rozróżnieniu między światłem i falami dźwiękowymi występującymi w środowisku fizycznym a doznaniami psychicznymi występującymi w umyśle. Fizyczne aspekty światła i dźwięku są stosunkowo łatwe do badania, określenia i mierzenia. Możemy dokładnie ustalić rodzaj fali fizycznej - poprzez określenie jej energii lub zmienności ciśnienia w czasie-jak też jej widmo - poprzez określenie ilości energii występującej w poszczególnych częstotliwościach. Aspekty psychiczne nie dają się tak łatwo określić. Dla dźwięku najbardziej oczywistymi wymiarami psychologicznymi są głośność i wysokość, ale występują tu również inne doznania związane z jakością dźwięku, jak jego barwa, dysonans, konsonans, harmoniczność. Podobnie dla światła najbardziej oczywistymi wymiarami psychologicznymi są jasność i barwa, ale inne wyróżnienia, z innych punktów widzenia, są tu również możliwe. Najprostsze fizyczne rodzaje fal, np. zwykła sinusoidalna fala świetlna produkowana w laserze lub fala dźwiękowa z prostego gwizdka czy też elektronicznego oscylatora, mogą być, jeśli idzie o ich aspekty fizyczne, opisane za pomocą pojęć częstotliwości i intensywności. Zdawałoby się więc, że można by pokusić się o próby łączenia tych prostych zmiennych fizycznych z psychicznymi doznaniami jasności i barwy czy też wysokości i głośności. Nie jest to jednak prawidłowe podejście. Po pierwsze dlatego, iż relacje między nimi nie są całkowicie liniowe: podwojenie intensywności fali fizycznej nie prowadzi do podwojenia spostrzeganej jasności lub głośności. Po drugie, nie są to rzeczy niezależne: zmiany częstotliwości wpływają jednocześnie na odbiór zarówno jasności, jak i głośności czy też barwy i wysokości. Wreszcie nie są one stałe: spostrzeganie barwy i jasności światła czy też wysokości i głośności dźwięku zależy nie tylko od ich częstotliwości czy intensywności, lecz także od kontekstu, w jakim występują - to znaczy od właściwości innych świateł lub dźwięków, które mogą występować w tym samym czasie. Nawet najprostszy wymiar fizyczny podlega skomplikowanej analizie w układzie nerwowym. Nie należy popełniać błędu polegającego na mieszaniu psychicznych doznań głośności, jasności, wysokości i barwy z fizycznymi właściwościami intensywności i częstotliwości (rys. A-1 i tabela A-1). Są to różne rzeczy. [Rysunek A –1 to zabawna konfrontacja snu i rzeczywistości. Dzwoni budzik stojący obok łóżka. Jeszcze przed chwilą śpiący i śniący człowiek wyskakuje z posłania jakby wystrzelony z katapulty. Włosy stoją mu dęba, a oczy szeroko otwarte zajmują pół twarzy. W obłoczku na łóżkiem zilustrowano sen obudzonej postaci. Z ogromną siłą członek orkiestry uderza talerzami.] Badając relacje między właściwościami fizycznymi i psychicznymi, możemy dokładnie mierzyć te pierwsze, lecz dla określenia tych drugich dysponujemy jedynie naszymi jednostkowymi doznaniami. Chcąc badać doznania psychiczne ludzi musimy ich prosić aby powiedzieli nam coś o swoich wrażeniach. Pytanie po prostu o to, co ktoś spostrzega, jest jednak zbyt niepewnym sposobem. To, co usłyszymy w odpowiedzi od danej osoby, będzie bowiem wynikiem nie tylko rzeczywistej reakcji jej systemów sensorycznych, lecz także jej znajomości języka i jej oczekiwań dotyczących tego, co powinna powiedzieć. Prowadzone od wielu lat badania nad danymi introspekcyjnymi pozwoliły zrozumieć niektóre trudności wynikające z takiego bezpośredniego podejścia. Przy zachowaniu odpowiedniej ostrożności możliwe jest jednak zdobycie wiedzy o spostrzeżeniach, z 629 Tabela A-1 [Tabela została zamieniona na tekst w następujący sposób: W każdym kolejnym wierszu podano zmienne psychologiczne, po czym odpowiadające im zmienne fizyczne najpierw pierwszego rzędu, potem drugiego rzędu oddzielone średnikami. Słowo – brak - po zmiennej pierwszego rzędu, oznacza, że nie wymieniono zmiennej rzędu drugiego. Zestawienie wykonano dla dwóch zjawisk: najpierw opisano słyszenie potem widzenie. Zaleca się ustawić opcję CZYTANIE DOKUMENTÓW na wypowiadanie wszystkich znaków] Słyszenie Głośność; Intensywność dźwięku; Częstotliwość fal dźwiękowych (Hz); Wysokość; Częstotliwość fal dźwiękowych (Hz); Intensywność dźwięku; Barwa (jasność); Skład złożonej fali dźwiękowej; brak; Donośność (wielkość); Częstotliwość i intensywność; brak; Gęstość; Częstotliwość i intensywność; brak; Konsonans (zgodność); Struktura harmoniczna; Muzyczne współbrzmienie; Dysonans (szorstkość) Hałaśliwość; Intensywność; Układ częstotliwości, parametry czasowe; Przykrość; Intensywność; Układ częstotliwości, znaczenie; Widzenie Jasność; Intensywność światła; Długość fali świetlnej, adaptacja oka; Odcień (barwa); Długość fali; Struktura widma, intensywność i odcień światła otaczającego; Nasycenie (soczystość barwy); Struktura widma ; Światło otaczające; Kontrast; Intensywność, długość fali, światło otaczające; brak; małym ryzykiem niewłaściwej interpretacji. Ważną rzeczą jest przy tym umiejętność stawiania właściwych pytań. Dobrą techniką badania wrażeń zmysłowych jest ograniczanie zadania osoby badanej do decyzji elementarnych - czy wystąpił bodziec; czy dwa bodźce są takie same czy też różne-czyli do operacji wykrywania i porównywania. Zamiast więc pytania: „Co usłyszałeś?", należy zapytać: „Czy słyszałeś cokolwiek?" Zamiast prośby o opisanie doznania, należy zapytać: „Czy te dwie rzeczy były takie same czy nie?" Stosując takie proste i bezpośrednie pytania w odpowiednio starannie przygotowanych eksperymentach, możemy dowiedzieć się bardzo wiele o podstawowych mechanizmach procesów przetwarzania informacji sensorycznych. SKALOWANIE Posłuchajmy jakiejś muzyki. Jak głośno ona brzmi? Rzecz jasna, narzucającą się odpowiedzią jest stwierdzenie w rodzaju: niezbyt głośno lub niezwykle głośno. Ale stwierdzenie to nic nam nie daje. Potrzebujemy jakiegoś precyzyjnego sposobu określania, co właściwie słyszymy: powinien to być przy tym sposób pozwalający na uogólnienia dotyczące wielu ludzi, a także pozwalający na przewidywania dotyczące odczuwania odbioru nowych dźwięków. 630 Co więcej, chcąc zrozumieć działanie układu nerwowego, musimy umieć powiązać subiektywne wrażenia dotyczące głośności ze znanymi właściwościami fizycznymi dźwięków i właściwościami systemu sensorycznego. Krótko mówiąc, potrzebujemy precyzyjnych określeń o charakterze ilościowym, a nie słów w rodzaju: „ależ to jest bardzo głośne". Jeśli idzie o zagadnienia omawiane w tej książce, potrzebujemy jakiegoś sposobu skalowania lub pomiaru naszego odbioru głośności i wysokości dźwięku, jasności światła, barwy i jego odcieni. Rodzaje skal Spróbujmy podstawić liczby pod zmienne psychologiczne. Nasze zadanie polega na dokładnym określeniu stosunków liczbowych istniejących między właściwościami fizycznymi a przeżyciami psychicznymi. Aby spełnić to wymaganie, musimy rozporządzać jakąś metodą psychologicznego pomiaru wrażeń: techniką skalowania. Nie wystarczy jednak przypisać liczby doznaniom psychicznym; musimy też wiedzieć, jakiego rodzaju operacje matematyczne możemy wykonywać na tak przypisanych liczbach. Skala nominalna. Na przykład, jeśli liczby przypisywane są dowolnie różnym przedmiotom - podobnie jak numeruje się koszulki graczy w koszykówkę lub piłkę nożną- dokonujemy czynności pozwalającej na identyfikowanie różnych przedmiotów. Takie przypisywanie liczb jest równoważne z możliwością nazywania tych przedmiotów, lecz jest oczywiste, że przypisywanie z kolei tym liczbom jakiejkolwiek wartości nie ma żadnego sensu. Stąd ten rodzaj przypisywania liczb jakimś przedmiotom jest najmniej znaczącym sposobem wykorzystywania liczb przy skalowaniu czegokolwiek. Tak utworzoną skalę liczbową nazywamy skalą nominalną (nominowanie w celu nazwania obiektu). Skala porządkowa. Następny stopień skalowania osiągamy wtedy, kiedy liczby przypisane przedmiotom korespondują w jakiś sposób ze swoimi matematycznymi wartościami. W tym przypadku najczęściej stosowanym krokiem jest takie uporządkowanie skalowanych przedmiotów, aby przypisywane liczby odzwierciedlały owo uporządkowanie. Ten typ skali nazywany jest skalą porządkową (uporządkowaną ze względu na pewien układ odniesienia). Skalą porządkową jest np. skala twardości skał albo jakości pociętych kloców drewna, pod warunkiem że, im twardsza skała lub lepsza jakość drewna, tym większa liczba na skali. Podobnie, jeśli ludzi znajdujących się w jakimś pomieszczeniu ustawimy w porządku alfabetycznym i pierwszej osobie w szeregu damy numer l, a następnym kolejne numery, to utworzymy w ten sposób skalę porządkową. Ktoś, kto ma numer osiem, nie jest jednak dwa razy większy od kogoś, kto ma numer cztery: oznacza to tylko, że występuje on dalej w alfabecie. Skala przedziałowa. Lepszą niż skala porządkowa jest skala, w której różnice w liczbach odpowiadają różnicom w wartości psychologicznej. Skale, w których odstępy między liczbami mają charakter znaczący, 631 nazywane są skalami przedziałowymi. Używane zwykle skale temperatury są skalami przedziałowymi (Celsjusza lub Fahrenheita). Temperatura, którą określamy jako 0 stopni, jest całkowicie arbitralna, lecz różnica w temperaturze między przedmiotem, który ma 80 stopni, a przedmiotem, który ma 70 stopni, jest dokładnie taka sama, jak różnica miedzy przedmiotem, który ma 40 stopni, a przedmiotem, który ma 30 stopni. Stosunki między nimi nie mają tu znaczenia. Przedmiot, który ma temperaturę 80 stopni, nie jest dwa razy cieplejszy od przedmiotu, który ma 40 stopni. W skali przedziałowej jedynie różnice między wartościami skali mają znaczenie. Wartość, która jest przypisywana zeru, jest zupełnie dowolna i może być zmieniona bez wpływu na trafność skali. Skala stosunkowa. Wreszcie na koniec spośród metod skalowania najbardziej pożądanych wymieńmy taką technikę, która prowadzi do uzyskania znaczących odstępów i znaczących stosunków między liczbami, czyli skalę stosunkową. W ten sposób, kiedy znamy czyjś wzrost w centymetrach i ma on wartość 180, oznacza to, że ten ktoś jest dwa razy wyższy od kogoś, kto ma 90 cm wzrostu. W tej skali znaczenie mają zarówno odstępy, jak i punkt zerowy. Pomiar temperatury w skali Kelvina, czyli temperatury absolutnej, pokazuje nam istotę skali stosunkowej. Długość, wzrost, waga, system monetarny są przykładami pomiarów w skali stosunkowej. Skale stosunkowe nie są jednak szczytowym osiągnięciem wśród rodzajów skal, ponieważ przypisywanie liczb poszczególnym przedmiotom jest wciąż cokolwiek arbitralne. Możemy przecież powiedzieć, że czyjś wzrost wynosi 80 cali, 6,67 stopy, 203 centymetrów lub 2,22 jarda. Pomnożenie wszystkich wartości skali przez jakąkolwiek liczbę stałą nie zmienia ani właściwości odstępów na skali, ani właściwości stosunków. Skala absolutna. Czasem możemy napotkać przykłady absolutnego przypisywania liczb przedmiotom. Dzieje się tak wtedy, kiedy przypisywanie liczb jest tak ściśle określone, że w żaden sposób nie możemy zmieniać liczb ani nawet ich mnożyć, gdyż wpływa to na stosunki istniejące między nimi (punktami skali). Skala taka nazywana jest skalą absolutną. Liczba elementów w stosie jest obliczana w skali absolutnej. Techniki skalowania W psychologii podczas przypisywania liczb właściwościom psychicznym posługujemy się wieloma różnorodnymi sposobami. Dwie procedury są współcześnie najczęściej używane i traktowane jako podstawowe. Pierwsza z nich nazywana jest skalowaniem opartym na pomyłkach, druga skalowaniem bezpośrednim. Skalowanie oparte na pomyłkach. W tej procedurze psychologiczny dystans między dwoma obiektami określany jest przez to, ile razy są one mylone ze sobą. Wyobraźmy sobie, że chcielibyśmy określić względne odstępy słodkości psychologicznej dla różnych ilości stężenia cukru (sacharozy). Weźmy filiżankę destylowanej wody o dokładnie zmierzonej pojemności, 632 wrzućmy do niej dokładnie odmierzoną 1 łyżeczkę cukru. Daje to nam roztwór o określonym stopniu słodkości. Nazwijmy ją słodkością wzorcową. Teraz weźmy 10 filiżanek i przygotujmy inne roztwory, pięć stopniowo coraz mniej słodkich w stosunku do wzorca, pięć zaś stopniowo coraz bardziej słodkich. Uzyskamy więc 11 roztworów wody z cukrem różniących się od sąsiednich w bardzo niewielkim stopniu. Ilość cukru rozpuszczonego w 1 filiżance wody destylowanej 0,5 łyżeczki 0,6 łyżeczki 0,7 łyżeczki 0,8 łyżeczki 0,9 łyżeczki 1,0 łyżeczka (wzorzec) 1,1 łyżeczki 1,2 łyżeczki 1,3 łyżeczki 1,4 łyżeczki 1,5 łyżeczki Prosimy osoby badane o spróbowanie pary takich roztworów, przy czym każda para zawiera zawsze roztwór wzorcowy oraz drugi o innym stężeniu cukru (porównywany z wzorcem) i wskazanie, który z nich wydawał się im słodszy. W ten sposób możemy określić względną wrażliwość smakową. [Oczywiście w rzeczywistym eksperymencie moglibyśmy zapewne pozwolić sobie na określanie słodkości w terminach uwzględniających molarne stężenie sacharozy, a nie w tak prosty sposób, jak ilość łyżeczek cukru w filiżance destylowanej wody. Do porównywania słodkości wykorzystywalibyśmy osoby o dużym doświadczeniu w tego typu zadaniach. Prosilibyśmy ich o porównywanie roztworów w identycznych pojemnikach, zawierających dokładnie wymierzoną ilość płynu. Byliby też proszeni o wypluwanie płynu za każdym razem, aby nic nie zostało połknięte. Po każdej próbie musieliby płukać usta jakimś neutralnym płynem, zapewne wodą destylowaną. Kolejność substancji podawanej do porównania i wzorca zmieniałaby się losowo, tak aby osoba badana nie wiedziała, który roztwór jest wzorcem. Byłaby ona pytana tylko o to, który płyn był słodszy, pierwszy czy drugi.] Gdy stężenia będą względnie podobne (np. przy porównywaniu roztworów z 1,0 łyżeczką i 1,1), będą one często mylone. Jeśli natomiast stężenia będą bardzo różne (np. przy porównywaniu roztworów z 1,0 łyżeczką i 1,5), dokładność porównań zbliżać się będzie do 100 procent. Względnie typowy zbiór wyników takich porównań przedstawiono na rysunku A-2. Zbiór tych wyników pokazuje, na ile dokładnie osoba badana umie odróżnić dwa poziomy słodkości-jeden o wartości wzorcowej 1,0 i drugi o wartościach porównywanych, które podano na osi poziomej. Funkcja ta jest nazywanafunkcjąpsychometryczną. Odgrywa ona bardzo ważną rolę. Widzimy, że kiedy porównujemy na przykład roztwór o stężeniu 1,4, jest on oceniany jako słodszy od wzorca w 88 procent przypadków. Innymi słowy, błąd w ocenie występuje tylko w 12 procentach przypadków. Jeśli popatrzymy na rysunek A-2, zauważymy, że 12 procent błędów w ocenie słodkości roztworu występuje również wtedy, gdy stężenie nieco słabsze od 0,7 jest porównywane z wzorcem 1,0. Jeśli stężenia 1 ,4 oraz 0,7 są równie często mylone z wzorcem, czy nie oznacza to, iż pozostają one w równej odległości od wzorca na psychologicznej skali wartości? Podstawą metody skalowania opartego na pomyłkach jest następujące założenie: 633 Dwie różnice fizyczne, które bywają równie często mylone, są psychologicznie sobie równe. Jest to podstawa skalowania opartego na pomyłkach. Pozwala ona na obliczanie różnic miedzy wartościami skali psychologicznej. To zaś pozwala stwierdzić, że przedmioty mierzone są na skali przedziałowej. RYSUNEK A-2 [Wykres funkcji psychometrycznej dla różnicowania cukru. Na osi pionowej procent przypadków, kiedy roztwór porównywany jest oceniany jest jako słodszy od wzorca. Na osi poziomej stężenie roztworu porównywanego. ] Skalowanie oparte na pomyłkach odegrało niezmiernie ważną role w historii psychologii. Było ono podstawą szerokiego i bardzo ważnego zastosowania metody skalowania w psychologii, mianowicie w skali inteligencji (I.I.). Dalsze omówienie założeń i implikacji tej metody skalowania przedstawiamy w Dodatku B. Skalowanie bezpośrednie. Alternatywna metoda przypisywania liczbowych wartości skali zjawiskom psychicznym jest znacznie prostsza niż metoda skalowania opartego na pomyłkach: prosimy po prostu ludzi, aby przypisali liczby cechom fizycznym w sposób proporcjonalnie odpowiadający ich subiektywnym doznaniom. Podstawowa procedura w tej dziedzinie została zapoczątkowana przez pro f. S. S. Stevensa w czasie jego pracy na Uniwersytecie Harvardzkim. Dalszą część tego rozdziału poświęcimy opisowi tej metody i kilku sposobów jej zastosowania. Ocenianie wielkości Podstawowa technika jest bardzo prosta. Osobie badanej eksponuje się bodziec i prosi się ją, aby oceniła go względem wzorca. Stevens (1956) opisuje powstanie tej techniki w następujący sposób: „Wszystko zaczęło się od przyjaznej sprzeczki z kolegą, który powiedział: „Zdajesz się utrzymywać, że każda głośność ma swoją liczbę i że, jeśli ktoś wyda jakiś ton, 634 będę mógł mu powiedzieć jaka to liczba”. Odpowiedziałem mu: „To interesująca idea. Wypróbujmy ją". Zgodziliśmy się, że tak jak przy każdym zagadnieniu pomiaru musimy najpierw ustalić jakiś moduł - wielkość naszej jednostki - wydałem więc głośny ton i zgodziliśmy się jego głośność uznać za 100. Potem wydawałem serie dźwięków o różnym natężeniu w przypadkowym porządku, on zaś, ku zdziwieniu nas obojga, przyporządkowywał liczby tym dźwiękom w idealnie zgodny sposób. Takie więc było pierwsze praktyczne zastosowanie tej metody. Dopiero po kilku miesiącach pracy nad jej techniką odkryłem - a raczej skojarzyłem sobie - że jest ona bardzo podobna do metody stosowanej przez Richardsona i Rossa (1930), którą opisałem w 1938 r. (Stevens i Davis, 1938). Jak łatwo człowiek zapomina! W każdym razie dowody zgromadzone w ostatnich dwu latach wskazują, że metoda oceniania wielkości, jeśli jest właściwie stosowana, może dostarczyć prostych i bezpośrednich sposobów określania skali subiektywnej wielkości. Metoda ta ma szerokie możliwości zastosowań, lecz podobnie jak wszystkie metody psychofizyczne ma swoje pułapki i źródła potencjalnych błędów. W każdej określonej sytuacji większość czynników zakłócających może być zapewne wykryta i usunięta albo zrównoważona poprzez odpowiedni schemat eksperymentu" (s. 21). Po latach doświadczeń z ocenianiem wielkości jako narzędziem pomiaru subiektywnych doznań wydaje się, że jest to metoda rzetelna i nie budząca większych zastrzeżeń. Jest prosta i efektywna. Daje wyniki pewne. Tak pewne, że można ją wykorzystać podczas wykładów do demonstracji skalowania nie obawiając się przy tym, że otrzyma się wyniki fałszywe. Największe trudności w tej metodzie mogą wystąpić wtedy, gdy eksperymentator próbuje jej pomagać sugerując na przykład, że osoba badana może wyznaczyć sobie granicę wchodzących w grę liczb: albo też eksponując wzorzec wielokrotnie, ażeby osoba badana go nie zapomniała: albo też przedłużając próby, aby zebrać jak najwięcej wyników dla uzyskania wysokiej statystycznej wiarygodności. Wszystkie tego rodzaju ulepszenia w rzeczywistości pogarszają wyniki. Jak stwierdza Stevens, eksperymentator „powinien trzymać swoje nerwy na wodzy i pozwolić osobom badanym formułować ich własne sądy". W rzeczywistości nie jest nawet potrzebna prezentacja wzorca. Osobom badanym należy pozwalać na przypisywanie liczb, jakie im wydają się najbardziej odpowiednie, do każdego prezentowanego bodźca. Jest to dla osób badanych znacznie bardziej naturalne niż arbitralne poinformowanie ich, jaka liczba powinna być użyta w stosunku do pierwszego bodźca. Obecnie wielu eksperymentatorów nie używa liczb. Zamiast tego stosują oni procedurę zwaną porównywaniem między modalnościami (opisaną nieco dalej). Prawo potęgowe W odniesieniu do wielu funkcji sensorycznych wrażenia psychiczne odzwierciedlające fizyczną intensywność bodźca dadzą się przedstawić za pomocą funkcji matematycznej -funkcji potęgowej. 635 Dla przykładu głośność i jasność wzrastają, jeśli chodzi o ich subiektywną wielkość, proporcjonalnie do potęgi jednej trzeciej (pierwiastka sześciennego) fizycznej intensywności światła lub dźwięku. Ciężkość wzrasta z potęgą 1,5 rzeczywistej wagi (ciężaru) danego przedmiotu; psychologiczna ocena czasu trwania dźwięku rośnie niemal liniowo (z potęgą 1) wraz z rzeczywistym przekazem czasu mierzonego w sekundach. Ogólnie dla wielu zjawisk sensorycznych: J równa się k razy (I do potęgi p), Gdzie J to ocena wielkości psychologicznej, I to intensywność fizyczna, zaś p to wykładnik potęgowy określający zależność między wielkością fizyczną a psychologiczną, k to pewna arbitralnie ustalona stała, służąca po prostu do otrzymania wielkości psychologicznej w liczbach używanych przez osoby badane. Jeśli głośność wzrasta z pierwiastkiem sześciennym intensywności dźwięku, to p równa się jedna trzecia lub około 0,3. Jeśli dźwiękowi o intensywności 1 osoba badana przypisała liczbę 100, to wtedy k równa się 100. Możemy więc przewidywać, że dźwięk o intensywności 8 wywoła u osoby badanej odpowiedź 200. Tego typu zależność nazywana jest prawem potęgowym, ponieważ podnosimy intensywność fizyczną do potęgi (I do potęgi p), aby uzyskać wielkość psychologiczną. (Zauważmy, że nie jest to funkcja wykładnicza - wyrażenie p do potęgi I byłoby wykładnicze. W funkcji potęgowej interesująca nas zmienna I jest podnoszona do potęgi. W funkcji wykładniczej zmienna ta byłaby w wykładniku potęgi). Zależność ta nazywana jest również prawem Stevensa od nazwiska psychologa, który opracował tę technikę, opisał ją jako pewną standardową procedurę i udowodnił jej użyteczność w wielu zakresach badań. „Ile" wobec „jakiego rodzaju" Wyróżniamy dwa rodzaje wrażeń: jeden, który łączy się z pytaniem ile, oraz drugi, który łączy się z pytaniem, jakiego rodzaju lub gdzie? Wydaje się, że prawo Stevensa dotyczące funkcji potęgowej ma zastosowanie do wszystkich zależności między zmiennymi fizycznymi a psychologicznymi, które łączą się z pytaniem ile? Wyodrębnienie tych dwu rodzajów wrażeń jest proste, ale ważne. Kontinuum psychologiczne łączące się z pytaniem ile ma charakter addytywny. zmienia się przechodząc z jednego poziomu na drugi poprzez dodawanie lub odejmowanie od czegoś, co już istnieje. Ciężar jest takim addytywnym wymiarem, ponieważ zwiększamy go lub zmniejszamy przez dodanie lub odjęcie pewnej masy. Co więcej, zakładamy, że psychologiczny odpowiednik ciężkości zależy od liczby i tempa reakcji neuronów. Większy ciężar odpowiada większej liczbie reakcji. Głośność, natężenie zapachu lub smaku, siła ścisku ręki, intensywność doznawanego wstrząsu elektrycznego wydają się wymiarami addytywnymi. Wszystkie więc podlegają funkcji potęgowej. Pasuje do nich intuicyjnie pojęcie czegoś wzrastającego. Takie addytywne kontinuum nazywane jest kontinuum protetycznym. Kontinuum psychologiczne łączące się z pytaniem jakiego rodzaju lub gdzie ma charakter substytutywny, zmienia się od jednej wartości do drugiej poprzez zastąpienie starej nową. 636 Tabela A-2 OCENIANIE Głośności (jedno ucho); WYKŁADNIK 0,3 OCENIANIE Jasności, oko zaadaptowane do ciemności, kąt 5 stopni; WYKŁADNIK 0,3 OCENIANIE Zapachu kawy; WYKŁADNIK 0,55 OCENIANIE Smaku sacharyny; WYKŁADNIK 0,8 OCENIANIE Smaku soli; WYKŁADNIK 1,3 OCENIANIE Smaku sacharozy; WYKŁADNIK 1,3 OCENIANIE Chłodu (na ramieniu); WYKŁADNIK 1,0 OCENIANIE Ciepła (na ramieniu); WYKŁADNIK 1,6 OCENIANIE Grubości drewnianych klocków wyczuwanej palcami; WYKŁADNIK 1,3 OCENIANIE Ciężkości podnoszonych ciężarów; WYKŁADNIK 1,5 OCENIANIE Siły ścisku ręki; WYKŁADNIK 1,7 OCENIANIE Głośności własnego głosu; WYKŁADNIK 1,1 OCENIANIE Wstrząsu elektrycznego aplikowanego na palce (60 Hz); WYKŁADNIK 3,5 OCENIANIE Długości linii; WYKŁADNIK 1,0 Jeśli będziemy naciskali na skórę, zmiany nacisku będą miały charakter addytywny, nacisk ma bowiem wymiar protetyczny. Lecz jeśli zmienimy miejsce nacisku na skórę, czynność nasza będzie miała charakter substytutywny. Usuwamy bowiem poprzedni nacisk i zastępujemy nowym w innym miejscu. Psychologiczny odpowiednik wymiaru substytutywnego wyraża się w tym, że pewna grupa neuronów przestaje działać, a inna grupa neuronów zaczyna pracować. Wysokość dźwięku, odczuwane nachylenie ciała, odczuwanie położenia przedmiotu, lokalizacja dźwięku mają charakter substytutywny. Wymiary te niekoniecznie podlegają funkcji potęgowej. Pasuje do nich intuicyjnie pojęcie, że coś jest czymś zastępowane. Takie kontinuum substytutywne nazywane jest kontinuum metatetycznym. Interpretacja funkcji potęgowej Funkcję potęgową zapisujemy po prostu jako: J równa się k razy I podniesione do potęgi p. Logarytmując obie strony tego równania, otrzymamy log J równa się p razy log I plus log k. Jest to proste. Oznacza to, że jeśli w układzie współrzędnych odłożymy na osi pionowej logarytm natężenia wrażenia psychicznego, a na osi poziomej logarytm intensywności fizycznej, to otrzymamy w efekcie linię prostą, której nachylenie wyraża p, zaś logarytm k przesunięcie. Punkty te możemy też nanieść na specjalny papier do wykresów, na którym obydwie osi podane są w skali logarytmicznej - papier taki nazywamy logarytmicznym. Zabieg ten pozwala nam na bardzo łatwe testowanie funkcji potęgowej; mianowicie, gdy wyniki są umieszczone na papierze logarytmicznym, powinny one leżeć na linii prostej. Jak to przedstawiono na rysunku A-3, wykresy na papierze logarytmicznym są bardzo proste i łatwe do wykonania. Zauważmy przy okazji, że oceny spostrzeganej długości zmieniają się prawie dokładnie wraz z długością rzeczywistą. 637 RYSUNEK A-3. Źródło: Stevens (1961a). [Wykresy spostrzegania długości, wstrząsu elektrycznego i jasności przedstawione w dwóch skalach: logarytmicznej i liniowej. W pierwszym przypadku są to trzy proste rosnące. Najszybszy wzrost wykazuje prosta wstrząsu elektrycznego, najwolniejszy prosta jasności. Na papierze milimetrowym krzywa spostrzegania długości jest linią prostą, jak powyżej, natomiast pozostałe dwie to krzywe wykładnicze. Krzywa wstrząsu elektrycznego o wykładniku większym od jedności, krzywa jasności o wykładniku potęgowym mniejszym od jedności, większym od zera.] Wykładnik funkcji potęgowej wynosi 1,0, co oznacza, że J równa się k razy J. Ponieważ p równa się 1, prawo potęgowe sprowadza się w tym przypadku do zwykłej proporcjonalności. Zakres zastosowania Techniki oceny wielkości można wykorzystywać niemal do wszystkich wymiarów psychologicznych o charakterze addytywnym (lub protetycznym). 638 Sellin i Wolfgang (1964) używali tej techniki jako narzędzia do mierzenia, jaką wagę społeczeństwo przywiązuje do poszczególnych przestępstw i kar. Dla przykładu osoby badane (sędziowie sądów dla nieletnich, oficerowie policji, studenci college'u) oceniały wagę przestępstw. Sądziły one, przykładowo, że kradzież samochodu i porzucenie go jest o 0,1 raza mniej poważne niż zrabowanie 5 dolarów i zranienie ofiary. Waga przestępstwa wzrastała 2,5 raza, jeśli było ono połączone z zabiciem ofiary. Natomiast ocenę wagi rabunku w zależności od ilości zrabowanych pieniędzy określa funkcja potęgowa o wykładniku 0,17. Tak więc, aby jedno przestępstwo było dwakroć poważniejsze niż drugie, ilość ukradzionych pieniędzy musi być 70 razy większa (70 do potęgi 0,17 wynosi 2). Porównywanie między modalnościami Jednym z problemów oceniania wielkości jest problem zaufania do liczb. Jaką właściwie liczbę powinniśmy przypisać danemu wrażeniu? Popatrzmy na jasność tej stronicy książki. Jaką liczbę możemy jej przypisać? 10? 1000? 45,239? Co do techniki oceniania wielkości podnoszone są często poważne zastrzeżenia, ponieważ wydaje się, iż zasady rządzące matematycznymi właściwościami liczb mogą tak wpływać na wyniki, że te układają się w funkcję potęgową, a leżące u ich podstaw wrażenia psychiczne wcale jej nie podlegają. Jedną z odpowiedzi na tę krytykę jest pytanie, skąd brałaby się tak duża zgodność wyników, kiedy to samo zadanie wykonują różni ludzie. Przecież z całą pewnością doświadczenia ludzkie różnią się, toteż możemy oczekiwać, że znajdzie to swoje odzwierciedlenie w ocenianiu. Ale, jeśli nawet w samej procedurze tkwiłby jakiś artefakt prowadzący zawsze do funkcji potęgowej, to dlaczego wysokość dźwięków i lokalizacja nie podlegałyby temu? 639 RYSUNEK A-5. Źródło: Stevens f!966a). Wykres wagi przestępstwa szacowanej na podstawie kary (w jednostkach 30 dniowych) w skali logarytmicznej. Wzdłuż linii wzorcowej naniesiono ocenę studentów oraz oficerów policji.] RYSUNEK A-4. Źródto: Stevens (1966a). [Wykres wagi kradzieży w skali logarytmicznej. Na osi pionowej ocena wielkości, na osi poziomej dolary. Przykładowe wartości odczytane z wykresu: kradzież 5 dolarów – ocena nieco powyżej 20; kradzież 50 dolarów – ocena 30; kradzież 1000 dolarów – ocena 50] 640 Tabela A-3. Wykładniki funkcji równych wrażeń (nachylenia prostej) przewidywane na podstawie skal stosunkowych wielkości subiektywnej oraz otrzymane na podstawie procedury porównywania z siłą ścisku dłoni Skala stosunkowa Podano kontinuum oraz wykładnik funkcji potęgowej Wstrząs elektryczny (prąd 60 cykli) 3,5 Temperatura (ciepło) 1,6 Ciężkość podnoszonych ciężarów 1,45 Nacisk na dłoń 1,1 Temperatura (zimno) 1,0 Wibracja o częstotliwości 60 Hz 0,95 Głośność białego szumu 0,6 Głośność dla tonów o częstotliwości 1000 Hz 0,6 Jasność (luminacja) białego światła 0,33 Skalowanie za pomocą ścisku dłoni. Do własciwego odczytu liczb przez program Screen Reader, należy ustawić opcję CZYTANIE DOKUMENTÓW na wypowiadanie wszystkich znaków. Podano kontinuum, zakres bodźca, wykładnik przewidywany i wykładnik uzyskany, oddzielone średnikami. Wstrząs elektryczny (prąd 60 cykli); 0,29-0,72 mA; 2,06; 2,13 Temperatura (ciepło); 2,0-14,5 stopni C powyżej temperatury neutralnej; 0,94; 0,96 Ciężkość podnoszonych ciężarów; 28 – 480 g; 0,85; 0,79 Nacisk na dłoń; 227-2.268 g; 0,65; 0,67 Temperatura (zimno) 3,3-30,6stopniaC poniżej temperatury neutralnej; 0,59; 0,60 Wibracja o częstotliwości 60 Hz; 17-48 dB odnosząca się w przybliżeniu do progu; 0,56; 0,56 Głośność białego szumu; 59-95 dB w odniesieniu do 0,0002 dyny na cm kwadratowy; 0,35; 0,41 Głośność dla tonów o częstotliwości 1000 Hz; 47-87 dB w odniesieniu do 0,0002 dyny na cm kwadratowy; 0,35; 0,35 Jasność (luminacja) białego światła; 59-96 dB w odniesieniu do 10 do potęgi minus 10 lambertów; 0,20; 0,21 [Należy tu wspomnieć o pewnym zagadnieniu technicznym, które często jest powodem zamieszania. W tekście stwierdziliśmy, że wykładnik dla oceny głośności jako funkcji intensywności dźwięku ma wartość 0,3. Natomiast w niniejszej tabeli wielkość tego wykładnika wynosi 0,6. Skąd ta rozbieżność? Chodzi po prostu o to, że dźwięk można mierzyć zarówno w jednostkach energii, jak i amplitudy. Intensywność dźwięku odnosi się do pomiarów energii: poziom ciśnienia dźwiękowego (PCD) odnosi się do pomiarów amplitudy. Energia dźwięku jest wprost proporcjonalna do kwadratu amplitudy dźwięku (I równa się A do potęgi drugiej). Stąd, jeśli wykreślimy funkcję potęgową, uzyskamy: J równa się I do potęgi 0,3 równa się A kwadrat do potęgi 0,3 równa się A do potęgi 0,6. Obydwa wykładniki są poprawne: 0,6 stosuje się w pomiarach ciśnienia dźwiękowego, a 0,3 w pomiarach intensywności dźwięku.] Prostym sposobem uniknięcia tego rodzaju krytyki jest po prostu nieużywanie liczb. Łatwo to zrobić prosząc oceniających, aby subiektywną wielkość bodźca wyrażali za pomocą jakiegoś wyniku, który byłby równy tej subiektywnie odczuwanej wielkości. Taką prostą metodą jest np. polecenie badanym, żeby słuchając dźwięków o różnej intensywności informowali o ich głośności poprzez zaciskanie swojej ręki tak silnie, jak bardzo głośny wydaje im się dźwięk. My zaś możemy mierzyć siłę ścisku za pomocą dynamometru. Możemy też poprosić osobę badaną, aby oceniała głośność tonu za pomocą odpowiedniej jasności światła, albo też rysowała linię tak długą jak bardzo szorstki wydawał jej się papier ścierny, albo wreszcie, żeby aplikowała odpowiednio silny wstrząs elektryczny odpowiadający wielkością psychicznemu odczuciu siły zapachu kawy. Czy metoda taka nie wydaje się nazbyt dziwna? Wypróbuj ją (porównaj eksperyment opisany nieco dalej). W opisie wydaje się ona może nieco niezwykła, lecz w praktyce jest całkiem prosta i bezpośrednia. 641 RYSUNEK. A-7. Górny: Funkcje równych wrażeń uzyskane przez porównywanie siły ścisku ręki z różnymi bodźcami kryterialnymi. Względne położenie funkcji wzdłuż osi poziomej jest dowolne. Linia przerywana przedstawia nachylenie równe 1,0 w tych współrzędnych. Dolny: Funkcje równych wrażeń uzyskane przez porównywanie głośności z różnymi bodźcami kryterialnymi. Względne położenia funkcji są dowolne, natomiast nachylenia linii wyznaczone są przez uzyskane dane. Źródło: Stevens (1966d). 642 Możemy też przewidywać, jakie powinny być wyniki takiego porównania między różnymi modalnościami. Porównajmy dla przykładu dwa kontinua A i B. Określiwszy wielkość wzorcową dla każdego wymiaru stwierdzamy, że wartości intensywności wynoszą IA (I ze znaczkiem A) oraz IB (I ze znaczkiem B), zaś oceny wielkości psychologicznych JA(J ze znaczkiem A) oraz JB(J ze znaczkiem B), możemy przedstawić następująco: Dla oceny A: JA równa się kA razy IA do potęgi a Zaś dla oceny B: JB równa się kB razy IB do potęgi b kA (k ze znaczkiem A), kB (k ze znaczkiem B) Kiedy następnie poprosimy nasze osoby badane, aby w odpowiedzi na spostrzegany bodziec A o intensywności IA zareagowały taką intensywnością IB na wymiarze B, która pod względem psychologicznym byłaby równa IA, to wtedy wiemy, że JA równa się JB oraz że: kA razy IA do potęgi a równa się kB razy IB do potęgi b Jeśli więc będziemy chcieli określić wartość IB dla oceny B odpowiadającej ocenie A, to otrzymamy IB do potęgi b równa się (kA razy IA do potęgi a) podzielić przez kB i wyciągając b-ty pierwiastek po obydwu stronach: IB równa się k razy IA do potęgi c, gdzie k to iloraz kA przez kB, c to wykładnik potęgi będący ilorazem a przez b. Kiedy na wykresie zestawimy intensywność bodźca B, którą osoba badana przypisuje subiektywnemu odczuciu intensywności bodźca A, nadal otrzymujemy funkcję potęgową. Wykładnik tej funkcji potęgowej otrzymany w wyniku porównywania między modalnościami wyraża się stosunkiem wykładników, które uzyskujemy w eksperymencie nad ocenianiem wielkości. Jak skalować? Metoda. Weź poliniowany arkusz papieru i oznacz linie od A do H (8 linii). Swoje odpowiedzi będziesz zapisywać na tych liniach. Przedstawimy ci serię nieuporządkowanych bodźców. Zadanie twoje polegać będzie na natychmiastowym określeniu wrażenia psychicznego, jakiego będziesz doznawać przy każdym bodźcu. Będziesz to robić za pomocą liczb. Nie próbuj wykonywać żadnych obliczeń: zapisuj po prostu to, co ci przyjdzie do głowy. 643 RYSUNEK A-8 EKSPERYMENT - POWIERZCHNIE Weź kartkę poliniowanego papieru i oznacz linie od A do H. Następnie oceń wielkość każdego koła w stosunku do powierzchni wzorcowej. Nie dokonuj żadnych obliczeń, zapisz po prostu swoje subiektywne wrażenie. Koło wzorcowe ma wartość 1. Zakryj pozostałe koła, a następnie kolejno je odkrywaj. Jeśli będzie Ci się wydawać, że dane koło jest 5 razy większe od koła wzorcowego, zapisz dlań cyfrę 5. Jeśli myślisz, że inne koło stanowi 1/10 powierzchni koła wzorcowego, zapisz jedna dziesiąta. Na raz oglądaj tylko jedno koło. Nie wracaj do swoich poprzednich odpowiedzi, nie patrz na pozostałe koła ani też na koło wzorcowe. Pierwszy z przedstawionych Ci bodźców jest wzorcem. Przypisz mu wartość 1. Następnie, kiedy będziesz przyglądać się kolejnym bodźcom, przypisuj im również liczby - tak aby odzwierciedlały one Twoje subiektywne wrażenia. Jeśli np. jakiś bodziec będzie Ci się wydawać 20-krotnie intensywniejszy, przypisz mu wielkość 20. Jeśli zaś wydawać Ci się będzie, że ma jedną piątą intensywności wzorca, przypisz mu liczbę 0,2 (lub jedna piąta) itd. Możesz posługiwać się ułamkami, liczbami bardzo dużymi lub bardzo małymi. Musisz po prostu pamiętać, żeby każdy zapis liczbowy był proporcjonalny do Twoich subiektywnych wrażeń. Zapisuj swe odpowiedzi na arkuszu kolejno od góry do dołu. Nie patrz przy tym na swoje poprzednie odpowiedzi. Najlepiej po napisaniu odpowiedzi zakryj ją, zanim przystąpisz do następnej. Nie przejmuj się też, jeśli w którymś momencie zacznie Ci się wydawać, że nie pamiętasz, jaka była wartość wzorcowa. Wszystko będzie dobrze. 644 RYSUNEK A-9 EKSPERYMENT - LICZBA KROPEK Weź czystą kartkę papieru i oznacz na niej linie od A do H Następnie oceń liczbę kropek znajdujących się w poszczególnych kwadratach w porównaniu z liczbą kropek znajdujących się w kwadracie wzorcowym. Nie wykonuj żadnych obliczeń. Zapisz po prostu swoje subiektywne wrażenie. Liczbie kropek w kwadracie wzorcowym przypisano wartość 1. Pamiętaj, że liczby należy przypisywać bodźcom zgodnie z bezpośrednimi wrażeniami, jakie wywarły one na Tobie. Wartość wzorcowa wynosi 1. Jeśli bodziec przewyższa 5-krotnie wartość wzorcową, przypisz mu wartość 5. Wykonaj teraz obydwa zadania - na ocenę powierzchni i ocenę liczebności. Analiza wyników. Nanieś na rysunek A-10 liczby przypisane poszczególnym bodźcom w ocenie powierzchni i liczebności (zastosuj różne symbole posługując się ołówkiem, aby można było zetrzeć zapis). Być może, okaże się przydatna zamiana ułamków zwykłych na dziesiętne (posłuż się tabelą A-4). Tabela A-4. Zamiana niektórych ułamków na liczby dziesiętne [tabela została usunięta] 645 RYSUNEK A-10 [Siatka logarytmiczna, na którą należy nanieść wyniki EKSPERYMENTU POWIERZCHNIE.] 646 Zwróć uwagę, że na osi poziomej każdego wykresu w odpowiadających im miejscach zostały naniesione bodźce. Skale na osi poziomej i pionowej wykresu są skalami logarytmicznymi. Znaczy to, że wykres przedstawiliśmy na papierze logarytmicznym. Zastosowanie papieru tego rodzaju powinno sprawić, że punkty przedstawiające Twoje wyniki powinny układać się wzdłuż linii prostych. W rzeczywistości wiele punktów ułoży się losowo, co wynika ze zmienności statystycznej („szumów"), tak że faktycznie nie będą one leżeć na linii prostej. Jeśli jednak przez te punkty poprowadzisz dwie najbardziej zbliżone do prostych linie -jedną przez punkty odnoszące się do danych o powierzchni, drugą przez punkty odnoszące się do danych o liczebności - to odchylenia nie powinny być zbyt znaczne. Porównywanie między modalnościami. Pamiętamy, że jeden z zarzutów, jakie stawia się procedurom oceny wielkości, polega na tym, iż w tego typu badaniach wymaga się od osób badanych, aby dawały odpowiedzi w postaci liczb, co jest raczej dosyć arbitralnym sposobem postępowania. Nie musimy jednak posługiwać się liczbami. Wykonajmy więc raz jeszcze eksperyment z oceną liczebności posługując się przy odpowiedziach rysowaniem odpowiednich kół zamiast liczbami. Rysuj więc koła, które swoją wielkością będą odpowiadać liczebności kropek. Nie jest to tak trudne, jak się wydaje. Jeśli masz wrażenie, że kropek jest 5 razy więcej niż w przypadku wzorcowym, narysuj koło, którego powierzchnia będzie 5-krotnie większa od koła wzorcowego. Właściwie nie powinno się w ogóle myśleć o liczbach: należy po prostu dokładnie się przyjrzeć i rysować na wyczucie. RYSUNEK A-11 [siatka logarytmiczna, na którą należy nanieść wyniki EKSPERYMENTU KROPKI] Analiza. Zestaw wielkości kół odpowiadające liczebności kropek. Aby to zadanie ułatwić, przedstawimy wykres na rysunku A-ll, na którym bodźce oznaczające liczebności są już naniesione na oś poziomą. Na osi pionowej nanieś wielkości Twoich kół. Wielkość koła przedstawiana na wykresie powinna odpowiadać średnicy koła mierzonej w calach (używaj znów ołówka). 647 (Przydatna okaże się także tabela A-4 przestawiająca zamianę ułamków na liczby dziesiętne.) Sprawdź, czy możesz przewidzieć swoje wyniki. Wróć do funkcji oceny wielkości dla tych dwóch bodźców. Odszukaj liczbę, którą przypisałeś liczebności bodźca C. Następnie spójrz na funkcję oceny wielkości powierzchni, która powinna dać wynik identyczny. (Przez naniesione punkty należy przeprowadzić możliwie prostą linię interpolując wynik, gdyż jest mało prawdopodobne, aby jakakolwiek wielkość spośród kół, które podaliśmy, odpowiadała dokładnie szukanej liczbie). Teraz już wiadomo, w jaki sposób liczby pozwalają przewidywać zgodność powierzchni kół z liczebnością. W zasadzie po sprawdzeniu kilku wartości liczebności i powierzchni kół można wykreślić całą przewidywaną funkcję. Na ile one pasują do siebie? Charakterystyki funkcjonowania DODATEK B PROBLEM DECYZJI GRA W KOŚCI Reguła określania kryterium Trafienia i chybienia Fałszywe alarmy Zmiana kryterium Charakterystyka funkcjonowania Oceny pewności Rozkład normalny PROBLEMY Problem tryskaczy przeciwpożarowych Pamięć Gra w kości po raz drugi GRA W KOŚCI 649 PROBLEM DECYZJI W większości rzeczywistych decyzji, jakie musimy podejmować, nie ma rozwiązania, którego poprawność byłaby zagwarantowana. W wielu sytuacjach trzeba wybierać między działaniami, które mogą mieć zarówno dobre, jak i złe następstwa, w nadziei zminimalizowania szans niepowodzenia i zmaksymalizowania szansy uzyskania dobrego rezultatu. RYSUNEK B-1 [Łańcuch zdarzeń: poziom 0 – Obserwacja – Prowadzi do decyzji A lub B – A może być poprawna lub niepoprawna – B może być poprawna lub niepoprawna] W niniejszym Dodatku przeanalizujemy pewną często spotykaną, prostą formę podejmowania decyzji. Sytuację tę można opisać następująco. Po pierwsze, istnieje pewna informacja, którą dana osoba wykorzystuje przy podejmowaniu decyzji. Informacja ta pochodzi z obserwacji dokonywanych przez osobę podejmującą decyzję. Wyniki tych obserwacji oznaczamy literą O. Po drugie, jedyny wybór, przed jakim stoi osoba podejmująca decyzję, polega na wyborze, które z dwóch działań, A czy B, zamierza wykonać. I wreszcie, wybór ten może być poprawny lub niepoprawny. Tak więc mamy prosty łańcuch zdarzeń z czterema możliwymi wynikami, który przedstawiono na rysunku B-1. Typowym przykładem takiej sytuacji jest opisana poniżej gra w kości. GRA W KOŚCI Grasz w grę polegającą na odgadywaniu. Twój partner rzuca trzy kostki. Dwie z tych kostek są normalne, a jedna jest bardzo szczególna pod tym względem, 650 że trzy jej boki są oznaczone cyfrą „3", zaś pozostałe trzy boki-cyfrą „0". Twoje zadanie polega na odgadywaniu, którym bokiem do góry upadła specjalna kostka; partner podaje ci tylko sumę punktów ze wszystkich trzech kostek. (Oczywiście, jeśli ogólna suma punktów wynosi 2, 3, lub 4, to specjalna kostka musiała wypaść na „0"; jeśli ogólna suma wynosi 14,13, lub 15, to specjalna kostka musiała paść na „3".) Powiedziano Ci, że ogólna suma wynosi 8. Co powinieneś powiedzieć? Twoja obserwacja O wynosi 8. Alternatywa A: Zadecydować, że wypadła 3. Możliwe wyniki: 1. Była 3. Wygrywasz zakład. 2. Wypadło 0. Tracisz postawione pieniądze. Alternatywa B: Zadecydować, że 3 nie wypadła. Możliwe wyniki: 1. Wypadła 3. Tracisz postawione pieniądze. 2. Wypadło 0. Wygrywasz. Ważną cechą tej sytuacji jest to, że na ogół nie możesz uniknąć popełniania błędów. Nie ma żadnego sposobu, który by gwarantował podejmowanie bezbłędnych decyzji. W celu przeanalizowania tej gry w kości, rozpatrzmy wszystkie jej możliwe wyniki. Po pierwsze, ile może być różnych wyników? No cóż, najniższy możliwy wynik otrzyma się wtedy, gdy na dwóch normalnych kostkach wypadnie „1", a na specjalnej kostce wypadnie „0": daje to w sumie 2. Najwyższy wynik otrzymamy wtedy, gdy na dwóch normalnych kostkach wypadnie po „6", a na specjalnej kostce wypadnie „3": w sumie daje to 15. Tak więc jest 14 możliwych wyników, od 2 do 15. Teraz spróbujmy określić, jakie są szanse, że uzyskamy każdy z 14 wyników w przypadku, gdy na specjalnej kostce wypadnie „3" lub „0". Aby to zrobić, musimy obliczyć, w ile różnych sposobów mogą ułożyć się kostki, tak aby w sumie dać określony wynik. Poniżej pokażemy, w jaki sposób się to oblicza. Przypuśćmy, że w sumie wypadło 8: może to się zdarzyć w różne sposoby, zależnie od tego, czy na specjalnej kostce wypadła 3 czy 0. Jeśli na specjalnej kostce wypadła 3: Na dwóch normalnych kostkach musiało w sumie wypaść 5. Może się to zdarzyć czterema różnymi sposobami: na dwóch normalnych kostkach mogło wypaść 1 i 4, 2 i 3, 3 i 2, lub 4 i 1. Jeśli na specjalnej kostce wypadło 0: Na dwóch normalnych kostkach musiało w sumie wypaść 8. Mogło się to zdarzyć pięcioma sposobami: na dwóch normalnych kostkach mogło wypaść 2 i 6, 3 i 5, 4 i 4, 5 i 3 lub 6 i 2. 651 W tabeli B-1 podano liczbę możliwych układów kostek dla wszystkich wyników. A teraz przypuśćmy, że otrzymaliśmy wynik 10. Na ile sposobów mogło to się zdarzyć? Spojrzawszy na tabelę B-1 widzimy, że może to się zdarzyć na trzy sposoby, jeśli na specjalnej kostce wypadło 0, i na sześć sposobów, jeśli wypadło na niej 3: jest więc ogółem dziewięć sposobów, kiedy te trzy kostki mogą dawać w sumie wynik 10. Tak więc, ponieważ wiemy, że uzyskaliśmy wynik 10, to wiemy także, że przeciętnie w 6 na 9 przypadków zdarzy się to wtedy, gdy na specjalnej kostce wypadnie 3, zaś w 3 na 9 przypadków wtedy, gdy na specjalnej kostce wypadnie 0. Jeśli więc przewidujemy, że wynik 10 oznacza, iż na specjalnej kostce wypadło 3, to będziemy mieli słuszność przeciętnie w 6 próbach na 9, zaś pomylimy się w 3 próbach na 9. Gdybyś był zawodowym graczem, to powiedziałbyś: wynik 10 oznacza, że są szanse 2 do 1 lub 6 do 3, że na specjalnej kostce wypadnie 3. Reguła określania kryterium Wydawałoby się, że gdy ogólny wynik wynosi 10, to zawsze warto powiedzieć, iż na specjalnej kostce wypadło 3 - bo przecież ma się wówczas większe szanse wygrania. Istotnie, spójrzmy na poniższą tabelkę: Z lewej strony ogólny wynik, z prawej procent przypadków, w których na specjalnej kostce jest 3 7 – 33 8 – 44 9 – 56 10 – 67 11 – 71 12 – 80 13 – 100 Ogólnie biorąc, procent przypadków, w których poprawne będzie stwierdzenie, iż na specjalnej kostce wypadło 3, wzrasta stale w miarę jak rośnie ogólny wynik, przy czym szanse wygrania są większe niż przegrania dopiero wtedy, gdy ogólny wynik wynosi 9 lub więcej. Tak więc wydawałoby się, że dobra reguła decyzyjna będzie brzmieć następująco: „powiedz, że na specjalnej kostce wypadło 3 zawsze wtedy, gdy wynik ogólny wynosi 9 lub więcej". Spójrzmy, jakie byłyby tego skutki. Trafienia i chybienia. Przypuśćmy, że rzucaliśmy kostkę 100 razy i za każdym razem musieliśmy zdecydować, czy na specjalnej kostce wypadło 3. Stosujemy regułę decyzyjną, nakazującą odpowiadać „tak" za każdym razem, gdy ogólny wynik wynosi 9 lub więcej. Teraz spójrzmy na tabelę B-1. Będziemy odpowiadać tak (tzn., że na specjalnej kostce wypadło 3), gdy ogólny wynik wyniesie 9, 10, 11, 12, 13, 14, 15. W innych przypadkach będziemy mówić nie. Lecz jest 36 możliwych kombinacji dwóch normalnych kostek, a jeśli na specjalnej kostce wypada 3, to tylko 26 spośród tych kombinacji daje ogólny wynik 9 lub więcej. 652 (Wyniki mniejsze od 9-to jest 8, 7, 6 i 5-możemy otrzymać w 10 sposobów). A więc mówiąc tak odpowiemy trafnie w 26 spośród 36 prób, w których na specjalnej kostce istotnie wypadła 3. Chybimy w 10 spośród 36 prób, w których na specjalnej kostce w rzeczywistości wypadła 3. Procent przypadków, w których uzyskujemy trafienie poprawnie decydując się powiedzieć „tak, wyszła 3", przedstawia się jako p (tak|3). Znak | (pionowa kreska pomiedzy tak i 3) znaczy „pod warunkiem, że" lub „przy danym". Tak więc określenie to brzmi: „proporcja trafień jest równa p (tak przy danym 3), co oznacza proporcję tak, pod warunkiem, że na specjalnej kostce rzeczywiście wypadła 3". W tym przypadku wskaźnik trafień, czyli p (tak przy danym 3) równa się dwadzieścia sześć trzydziestych szóstych równa się 72 procent. Podobnie wskaźnik chybień p (nie przy danym 3) wynosi dziesięć trzydziestych szóstych, czyli 28 procent. Tabela B-1 [Tabela zamieniona na tekst; pierwsza liczba to wynik ogólny, druga to liczba sposobów, jakimi może się to zdarzyć, jeśli na specjalnej kostce wypadło 0, trzecia to liczba sposobów, jakimi może się to zdarzyć, jeśli na specjalnej kostce wypadło 3] 0; 0; 0 1; 0; 0 2; 1; 0 3; 2; 0 4; 3; 0 5; 4; 1 6; 5; 2 7; 6; 3 8; 5; 4 9; 4; 5 10; 3; 6 11; 2; 5 12; 1; 4 13; 0; 3 14; 0; 2 15; 0; 1 16; 0; 0 Fałszywe alarmy. A co wtedy, gdy na specjalnej kostce naprawdę wypadło 0? Zaczynamy reagować słowem tak za każdym razem, gdy ogólny wynik wynosi 9,10,11 lub 12. Tak więc spośród 36 kombinacji dwóch normalnych kostek, jakie występują, gdy na specjalnej kostce wypadło O, dokładnie 10 z nich prowadzi do ogólnego wyniku 9 lub więcej, podczas gdy 26 pozostałych kombinacji prowadzi do ogólnego wyniku równego 8 lub mniej. Powiedzenie tak, gdy dane zdarzenie nie zachodzi, zwane jest fałszywym alarmem. W tym przypadku wskaźnik fałszywych alarmów wynosi dziesięć trzydziestych szóstych: p (tak przy danym 0) równa się 28 procent 653 Zmiana kryterium. Możemy mieć wpływ na częstość poprawnych odgadnięć, że na specjalnej kostce wypadło „3", zmieniając wynik krytyczny, przy którym zaczynamy odpowiadać „nie" zamiast „tak". Gdy jednak wynik krytyczny zmienia się, zmienia się także liczba trafień i fałszywych alarmów. Wskaźniki trafień i fałszywych alarmów są ze sobą powiązane; zwiększając jeden z nich, zawsze zwiększamy i drugi. Ten ścisły związek między wskaźnikiem trafień i wskaźnikiem fałszywych alarmów odgrywa bardzo ważną rolę w teorii. Wynik krytyczny, na którym opieramy nasze decyzje, nazwijmy kryterium. Zawsze, gdy ogólny wynik równa się kryterium lub przekracza je, mówimy, że na specjalnej kostce najprawdopodobniej wypadło „3"; w przeciwnym razie mówimy, że prawdopodobnie wypadło „0". Tabela zmiennych kryteriów. Pierwsza liczba to kryterium, druga to procentowy wskaźnik fałszywych alarmów, trzecia to procentowy wskaźnik trafień 1; 100; 100; 2; 100; 100; 3; 97; 100; 4; 92; 100; 5; 83; 100 6; 72; 97; 7; 58; 92; 8; 42; 83; 9; 28; 72; 10; 17; 58; 11; 8; 42; 12; 3; 28; 13; 0; 17; 14; 0; 8; 15; 0; 3; Charakterystyka funkcjonowania. Łatwiej jest spostrzec związek między fałszywymi alarmami i trafieniami, jeśli umieścimy je na wspólnym wykresie, jak pokazano na rysunku B-2. RYSUNEK B-2 [Wykres wskaźnika trafień w zależności od wskaźnika fałszywych alarmów.] Związek ten zwany jest charakterystyką funkcjonowania. [Początkowo związek ten otrzymano w badaniach nad odbiornikami radarowymi, których zadaniem było określić, czy obserwowany sygnał jest prawdziwym sygnałem, czy po prostu szumem. Stąd też krzywe te nazwano charakterystyką funkcjonowania odbiornika (Receiver Operating Characteristic), czyli krzywą ROC. Termin krzywa ROC jest nadal szeroko stosowany w literaturze psychologicznej.] Krzywa ta pokazuje wyraźnie, że zmiana kryterium (liczby umieszczone pod poszczególnymi punktami) zmienia zarówno procent trafień, jak i procent fałszywych alarmów. O tym, że reguła decyzyjna zawsze musi być związana ze stosunkiem między trafieniami a fałszywymi alarmami, można przekonać się też w inny sposób - spójrzmy znów na rozkład wyników przedstawionych w tabeli B-l. Następnie narysujmy wykres tych rozkładów (rys. B-3). RYSUNEK B-3 [Charakterystyka funkcjonowania] Są to te same informacje, które pierwotnie były przedstawione w tabeli, lecz teraz jest oczywiste, dlaczego zawsze muszą być błędy. Rozkład ogólnych wyników (na wszystkich kostkach), otrzymywanych wtedy, gdy na specjalnej kostce wypadło 0 (rozkład po lewej), 654 pokrywa się w znacznym stopniu z rozkładem wyników, otrzymywanych wtedy, gdy na specjalnej kostce wypadło 3 (rozkład po prawej). Na to pokrywanie się rozkładów nie można nic poradzić: jeśli ogólny wynik wynosi 8, to mogliśmy go otrzymać niezależnie od tego, co wypadło na specjalnej kostce. Na rysunku zaznaczono kryterium równe 11. Przy tej wartości kryterium decydujemy się powiedzieć, że na specjalnej kostce wypadło 3, jeśli otrzymaliśmy ogólny wynik 11 lub więcej; wówczas szansa, że odgadliśmy prawidłowo, jest równa szansie, że uzyskaliśmy obserwację 11 lub więcej z rozkładu narysowanego po prawej stronie. 655 Szansa fałszywego alarmu jest równa szansie, że obserwacja 11 lub więcej pochodzi z rozkładu narysowanego po lewej stronie. Tak więc po prostu sprawdzając, jaka część każdego rozkładu leży na prawo od kryterium, możemy przekonać się, w jaki sposób wskaźniki trafień i fałszywych alarmów zmieniają się w miarę obniżania lub podwyższania kryterium. Oczywiście jest to dokładnie to samo, co robiliśmy przy rysowaniu charakterystyki funkcjonowania. Charakterystyka funkcjonowania pokazuje, w jaki sposób osiągane rezultaty zmieniają się, gdy zmieniamy regułę decyzyjną. A teraz zastanówmy się, co się stanie, jeśli uczynimy zadanie łatwiejszym? Przypuśćmy, że zmieniliśmy naszą grę w kości w ten sposób, iż specjalna kostka ma 6 na trzech ściankach i 0 na pozostałych trzech ściankach. Co wtedy? Pozostawiamy rozwiązanie tego problemu Czytelnikowi. Narysuj nowy rozkład obserwowanych wyników dla przypadku, gdy na specjalnej kostce wypadła 6. (Masz już rozkład, gdy na specjalnej kostce jest 0). Narysuj teraz charakterystykę funkcjonowania. Powinien na niej być punkt, w którym wskaźnik trafień wynosi 83 procent, a wskaźnik fałszywych alarmów 8 procent. Jeśli takiego punktu nie ma, to musisz zapoznać się lepiej z treścią paragrafu o charakterystyce funkcjonowania. Oceny pewności Wykres przedstawiający rozkłady mówi nam coś jeszcze o regule decyzyjnej: jeśli po prostu przyjmiemy strategię polegającą na mówieniu „3", gdy ogólny wynik przekroczy kryterium, to tracimy informację. Są przypadki, gdy nie mamy absolutnie żadnych wątpliwości co do ścisłości naszej odpowiedzi, lecz są też przypadki gdy wiemy, że po prostu zgadujemy: w jaki sposób reguła decyzyjna określa to? Odpowiedź jest prosta. Zawsze, gdy otrzymujemy niski ogólny wynik, powiedzmy między 2 a 4, jesteśmy pewni, że na specjalnej kostce wypadło 0; zawsze, gdy otrzymujemy wysoki wynik, powiedzmy między 13 i 15, jesteśmy pewni, że na specjalnej kostce wypadła 3. Gdy ogólny wynik wynosi 8 lub 9, wówczas zgadujemy. Tak więc możemy odpowiedzieć czymś więcej niż samym tak lub nie na pytanie, czy na specjalnej kostce wypadło 0 czy 3: możemy także dodać stwierdzenie, jak pewni jesteśmy swej odpowiedzi. Możemy łatwo zmodyfikować nasze odpowiedzi dodając stwierdzenia typu „Jestem bardzo pewien", „Jestem dosyć pewien" lub „Po prostu zgaduję" do naszego stwierdzenia tak lub nie. Gdy to uczynimy, wówczas w rzeczywistości jest sześć reakcji: Tak, na specjalnej kostce wypadła 3 i jestem bardzo pewny pewny niepewny Nie, na specjalnej kostce wypadło 0 i jestem niepewny pewny bardzo pewny 656 RYSUNEK B-4 [Charakterystyka funkcjonowania wraz z oceną pewności i reakcją TAK-NIE] Te sześć reakcji można uporządkować według sumy punktów na wszystkich kostkach, przy czym reakcja „bardzo pewny, że wypadła 3", zawsze wiąże się z najwyższym wynikiem, a „bardzo pewny, że wypadło 0", zawsze wiąże się z wynikiem najniższym. Gdybyśmy narysowali, w jaki sposób reakcje wynikają z rozkładów wyników na wszystkich kostkach, to moglibyśmy uzyskać coś podobnego do wykresu przedstawionego na rysunku B-4. Te oceny pewności są niezwykle użyteczne. Zwróćmy uwagę, że możemy traktować te sześć różnych reakcji niemal tak, jak gdybyśmy mieli sześć różnych kryteriów reagowania. Tak więc charakterystykę funkcjonowania można narysować tak, aby odzwierciedlała oceny pewności, a nie kryteria ilustrowane przez nią uprzednio. Aby tego dokonać, po prostu należy zwrócić uwagę, że szansa odpowiedzenia tak ze stopniem pewności pewny lub większym jest wyznaczona przez szanse, że ogólny wynik na wszystkich kostkach jest 11 lub więcej. Tak więc w przykładzie pokazanym na rysunku B-4 związek między kryteriami a ocenami pewności wygląda następująco: Kryterium 13, Połącz reakcje Tak - bardzo pewny Kryterium 11 Połącz reakcje Tak - bardzo pewny i pewny Kryterium 9 Każda z reakcji tak Kryterium 7 Połącz reakcje Nie - niepewny i każda z reakcji tak Kryterium 5 Połącz reakcje Nie - niepewny, pewny i każda z reakcji tak Kryterium 2 Wszystkie reakcje w ogóle Zwróćmy uwagę, że dla wyznaczenia charakterystyki funkcjonowania nie musimy wiedzieć naprawdę, jakie są kryteria. Musimy wiedzieć jedynie, jakie są wskaźniki trafień i fałszywych alarmów dla różnych reakcji. Przypuśćmy, że rozegraliśmy tę grę w kości 200 razy. Przypuśćmy ponadto, że w 100 próbach na specjalnej kostce wypadło 0, 657 zaś w 100 próbach wypadło na niej 3. Po tym eksperymencie klasyfikujemy reakcje według tego, czy wynikły one z 3 czy z 0 na specjalnej kostce. Przypuśćmy, że stwierdziliśmy, co następuje. Z lewej strony wiersza zapisano reakcje, z prawej dwie liczby, z których pierwsza to liczba przypadków gdy na specjalnej kostce było 0, druga to liczba przypadków gdy na specjalnej kostce było 3 A. Tak - bardzo pewny; 0; 17 B. Tak – pewny; 17; 41 C. Tak-niepewny; 11; 14 D. Nie-niepewny; 30; 20 E. Nie-pewny; 25; 8 F. Nie-bardzo pewny; 17; 0 Ogółem; 100; 100 Nie troszcząc się o wyliczenie, jakie kryterium reprezentuje każda reakcja, przyjmijmy po prostu, że możemy traktować te reakcje tak, jak gdyby każda wynikła z przyjęcia pewnego kryterium i teraz-jeśli reakcje odznaczające się określonym stopniem pewności połączymy z reakcjami o większej pewności: Z lewej strony wiersza zapisano reakcje, z prawej dwie liczby, z których pierwsza to wskaźnik fałszywych alarmów gdy na specjalnej kostce było 0, druga to wskaźnik trafień gdy na specjalnej kostce było 3 A; 0; 17 B lub A; 17; 58 C, B lub A; 28; 72 D, C, B lub A; 58; 92 E, D, C, B lub A; 83; 100 F, E, D, C, B lub A; 100; 100 Jeśli wyznaczymy na wykresie wskaźniki trafień i fałszywych alarmów, to otrzymamy charakterystykę funkcjonowania (rysunek B-5) - tę samą krzywą, którą przedstawiono na rysunku B-2. Dokładnie w ten sam sposób analizujemy prawdziwe dane, z tą tylko różnicą, że w prawdziwym eksperymencie nie uzyskalibyśmy tak „czystych" wyników. Ludzie nie trzymają się tak konsekwentnie ustanawianych przez siebie kryteriów. Jednakże niekonsekwencje te są stosunkowo niewielkie. Rozkład normalny Osoby badane prosimy, aby słuchały bardzo słabego sygnału, który podaje się co pewien czas za pośrednictwem pary słuchawek. Chcemy ustalić, czy mogą usłyszeć ten sygnał, czy też nie. W rzeczywistości sprawa jest jednak znacznie bardziej złożona, ponieważ badani zawsze coś słyszą: 658 muszą oni zadecydować, czy to, co usłyszeli, było podanym sygnałem, czy też po prostu wynikiem występujących normalnie fluktuacji wrażeń słuchowych. Fluktuacje te wynikają z różnych powodów. W wielu eksperymentach po prostu podajemy przez słuchawki także szum, aby przekonać się, jak dobrze osoby badane potrafią wyodrębnić sygnał z tego szumu. Dla badanego sytuacja ta jest bardzo podobna do sytuacji opisanej jako gra w kości. Słucha on przez pewien czas, kiedy to może być podany sygnał, co daje mu w rezultacie jakąś obserwację - przypomina to nasze rzucanie kostek i otrzymanie jakiegoś ogólnego wyniku. Pytanie brzmi: „Czy obserwacja ta jest wynikiem sygnału czy tylko szumu?", analogiczne pytanie dla gry w kości oczywiście brzmiało: „Czy ten ogólny wynik uzyskaliśmy w rezultacie tego, że na specjalnej kostce wypadło 0 czy, że wypadło 3. RYSUNEK B-6 [ Krzywa rozkładu normalnego. Krzywa rośnie łagodnie do pewnego maksimum, które osiąga dla wartości średniej, po czym opada do wartości zerowej. (kształt pagórka)] 659 Zakładamy, że osoba badana, która stara się wykryć sygnał, wybiera jakieś kryterium: jeśli jej obserwacja przekracza to kryterium, to mówi Dygnął". W przeciwnym razie mówi „brak sygnału". Na podstawie wskaźnika trafień i wskaźnika fałszywych alarmów staramy się ustalić różnicę (separation) między rozkładami, którymi muszą się posługiwać badani przy podejmowaniu swych decyzji. Następnie, na podstawie określonych przez nas rozkładów, staramy się dojść do wniosku, w jaki sposób system słuchowy musi przetwarzać sygnały. Rozpatrzmy teraz parę przykładów. Przedtem jednak musimy przedstawić pewien specjalny typ rozkładu obserwacji, zwany rozkładem normalnym. Przy okazji gry w kości opracowaliśmy rozkład ogólnych wyników, to jest sumy punktów na wszystkich kostkach (rysunek B-3). Na ogół jednak często spotyka się odmienny typ rozkładu. 660 Rozkład ten nosi nazwę rozkładu normalnego i jego znajomość jest niezmiernie użyteczna. Ma on szerokie zastosowanie w wielu dziedzinach badań, z psychologią włącznie, i zwykle okazuje się, że jeśli nawet badane rozkłady rzeczywiste nie są normalne, to rozkład normalny jest doskonałym przybliżeniem rozkładu rzeczywistego. Na rysunku B-6 przedstawiono rozkład normalny. Zwróćmy uwagę, że wygląda on bardzo podobnie do rozkładu gry w kości, z tą różnicą, że jest narysowany linią ciągłą, a nie łamaną. Wynika to stąd, że ogólny wynik gry w kości może być tylko liczbą całkowitą, taką jak 6 czy 7, nie może zaś przybierać wartości pośrednich. Natomiast rozkład normalny może przybierać wartości odpowiadające każdej liczbie rzeczywistej dodatniej lub ujemnej. Rozkład normalny pokazany powyżej charakteryzuje jedna liczba - wartość średnia, czyli przeciętna. Został on narysowany w taki sposób, że ma wartość średnią równą zeru. Gdybyśmy chcieli, aby miał on wartość średnią równą np. 1 ,5, to rozkład ten trzeba by po prostu przesunąć w prawo, tak aby jeden szczyt znajdował się nad punktem o wartości 1,5; rozkład taki przedstawiono na rysunku B-7. RYSUNEK B-7 [ Krzywe rozkładu normalnego, dla różnych wartości średniej: minus 2, 0, 1,5, 2,5] W tabeli B-2 podano wartości rozkładu normalnego. Znajdujemy tu wysokość krzywej dla różnych wartości na osi poziomej. Oprócz tego podano, jaki procent powierzchni pod krzywą znajduje się na prawo od każdego z kryteriów. Tymi ostatnimi wartościami posługujemy się przy obliczaniu charakterystyk funkcjonowania. Tabela B-2. Wysokość (Y) rozkładu normalnego oraz procent powierzchni pod krzywą rozkładu na prawo od danego kryterium [Tabela zamieniona na tekst. W każdej kolejnej linijce podano trzy liczby oddzielone średnikami; pierwsza to kryterium, druga to wartość Y, trzecia to procenty. W celu właściwego odczytu liczb przez program Screen Reader, należy ustawić opcję CZYTANIE DOKUMENTÓW na wypowiadanie wszystkich znaków.] -3,0; 0,004; 99,9 -2,9; 0,006; 99,8 -2,8; 0,008; 99,7 -2,7; 0,110; 99,7 -2,6; 0,014; 99,5 -2,5; 0,018; 99,4 -2,4; 0,022; 99,2 -2,3; 0,028; 98,9 -2,2; 0,035; 98,6 -2,1; 0,044; 98,2 -2,0; 0,054; 97,7 -1,9; 0,066; 97,1 -1,8; 0,079; 96,4 -1,7; 0,094; 95,5 -1,6; 0,111; 94,5 -1,5; 0,130; 93,3 -1,4; 0,150; 91,9 -1,3; 0,171; 90,3 -1,2; 0,194; 88,5 -1,1; 0,218; 86,4 -1,0; 0,242; 84,1 -0,9; 0,266; 81,6 -0,8; 0,290; 78,8 -0,7; 0,312; 75,8 -0,6; 0,333; 72,6 -0,5; 0,352; 69,2 -0,4; 0,368; 65,5 -0,3; 0,381; 61,8 -0,2; 0,391; 57,9 -0,1; 0,397; 54,0 0,0; 0,399; 50,0 0,1; 0,397; 46,0 0,2; 0,391; 42,1 0,3; 0,381; 38,2 0,4; 0,368; 34,5 0,5; 0,352; 30,1 0,6; 0,333; 27,4 0,7; 0,312; 24,2 0,8; 0,290; 21,2 0,9; 0,266; 18,4 1,0; 0,242; 15,9 1,1; 0,218; 13,6 1,2; 0,194; 11,5 1,3; 0,171; 9,7 1,4; 0,150; 8,1 1,5; 0,130; 6,7 1,6; 0,111; 5,5 1,7; 0,094; 4,5 1,8; 0,079; 3,6 1,9; 0,066; 2,9 2,0; 0,054; 2,3 2,1; 0,044; 1,8 2,2; 0,035; 1,4 2,3; 0,028; 1,1 2,4; 0,022; 0,8 2,5; 0,018; 0,6 2,6; 0,014; 0,5 2,7; 0,010; 0,4 2,8; 0,008; 0,3 2,9; 0,006; 0,2 Zwykle interesuje nas, jak daleko od siebie znajdują się średnie wartości dwóch rozkładów. Przypuśćmy, że przeprowadzamy wspomniany przez nas eksperyment, w którym prosimy osoby badane, aby starały się wykryć podawany im sygnał. Chcemy ustalić, w jakiej odległości rozkład obserwacji wynikających z sygnału znajduje się od rozkładu obserwacji wynikających z szumu. Sądzimy, że sytuację tę charakteryzuje wystarczająco rysunek B-8. Chcemy wykryć zarówno dokładne umiejscowienie rozkładu sygnału w stosunku do rozkładu szumu, jak i miejsce kryterium. Na początek określmy średnią wartość rozkładu szumu jako 0. Jest to uzasadnione, ponieważ przy braku sygnału przeciętna obserwacja powinna być zbliżona do 0. Ponadto, ponieważ chodzi nam tylko o względne rozdzielenie obu tych rozkładów, w rzeczywistości nie ma więc znaczenia, jaką liczbę przyjmiemy dla średniej wartości szumu (nasz pomiar będzie na skali przedziałowej zobacz Dodatek A). Odległość od średniej wartości rozkładu szumu do kryterium nazwiemy A, odległość od średniej rozkładu sygnału do kryterium B, zaś odległość od średniej rozkładu szumu 661 do średniej rozkładu sygnału określimy jako d'(d prim). Symbolu d'(d prim) używa się ze względów historycznych; w ten sposób jest to przyjęte w literaturze psychologicznej. Zarówno A, jak i B są to odległości od średniej wartości rozkładu. Jeśli kryterium znajduje się na prawo od średniej, A i B są dodatnie. Jeśli kryterium odpowiada dokładnie średniej, to wówczas wartość odległości jest równa 0. Jeśli kryterium znajduje się na lewo od średniej, odległość ta jest ujemna. Tak więc d' równa się A minus B.(d prim równa się A minus B) 662 Przypuśćmy, że pewna osoba badana uzyskała wskaźnik fałszywych alarmów równy 14 procent, zaś wskaźnik trafień równy 95 procent. Możemy niezwłocznie określić A: jeśli znajdziemy 14 procent w tabeli B-2, to przekonamy się, że kryterium musi być umieszczone w odległości 1,1 jednostek na prawo od średniej rozkładu szumu. Tak więc A równa się 1,1. Podobnie widzimy, że wskaźnik trafień równy 95 procent wymaga, aby kryterium znajdowało się w odległości 1,6 jednostek na lewo od średniej rozkładu sygnału (wartość kryterium wynosi minus 1,6). Tak więc B równa się minus 1,6. Wiemy teraz, że d'(d prim) równa się 2,7. I to wszystko. RYSUNEK. B-8 [Wykresy rozkładu szumu i rozkładu sygnału dla różnych wartości d’ (d prim) PROBLEMY Teraz prawdopodobnie możemy nauczyć się najwięcej o stosowaniu charakterystyk funkcjonowania i o rozkładzie normalnym rozwiązując parę problemów. Problem tryskaczy przeciwpożarowych Instalujemy system tryskaczy jako część systemu przeciwpożarowego w pewnym budynku. Chcemy teraz zainstalować czujnik temperatury, który włączyłby wszystkie tryskacze, gdy tylko wybuchnie pożar. Czujnik ten jest umieszczony w pobliżu sufitu wielkiego pomieszczenia magazynowego. Dach jest zrobiony z blachy cynkowej, a w pomieszczeniu tym nie ma okien. Pytanie: na jaką temperaturę powinniśmy nastawić ten czujnik? Jeśli nastawimy na zbyt niską temperaturę (np. 55 stopni), to wówczas w bardzo upalne dni, kiedy temperatura na zewnątrz dochodzi do 42 stopni, jest całkiem prawdopodobne, że gorące powietrze gromadzące się pod pułapem magazynu ogrzeje się jeszcze bardziej przez zetknięcie z blaszanym dachem rozpalonym promieniami słońca. Tak więc wkrótce temperatura powietrza osiągnęłaby 55 stopni i włączyłaby system przeciwpożarowy: fałszywy alarm. Gdybyśmy jednak nastawili czujnik na temperaturę wyższą, np. 80 stopni, to jest całkiem prawdopodobne, że pożar mógłby się rozwinąć i zniszczyć mnóstwo materiałów w magazynie, zanim płomienie sięgnęłyby tak wysoko, by ogrzać powietrze przy pułapie do temperatury 80 stopni. Tak więc nie udałoby się nam wykryć wielu pożarów dostatecznie wcześnie, aby nasz system tryskaczy mógł je ugasić. Byłoby to chybienie. Jak więc mamy nastawić temperaturę?. Aby rozwiązać ten problem, potrzebujemy informacji o trafieniach i fałszywych alarmach. Musimy znać prawdopodobieństwa, z jakimi one występują. W idealnym przypadku przeprowadzilibyśmy eksperyment, obserwując, co zdarzy się powiedzmy w ciągu 3 miesięcy, starannie zliczając trafienia (poprawne uruchomienie systemu w przypadku pożaru), chybienia (niezareagowanie systemu w ciągu np. 5 minut od wybuchu pożaru), fałszywe alarmy (uruchomienie systemu, gdy nie ma pożaru), oraz poprawne odrzucenia (niereagowanie systemu w warunkach normalnych). Następnie moglibyśmy wyznaczyć charakterystykę funkcjonowania. 663 Sposób, który umożliwiłby nam wyznaczenie charakterystyki funkcjonowania, polega na nastawianiu czujnika na różne temperatury i zbieraniu informacji o wskaźniku trafień i fałszywych alarmów przy każdej nastawionej na nim temperaturze. Jeśli więc nastawilibyśmy czujnik na temperaturę 60 stopni, moglibyśmy zaobserwować, że rzeczywista temperatura pomieszczenia osiąga tę wartość średnio co piąty dzień - dając wskaźnik fałszywych alarmów równy 20 procent-i moglibyśmy także stwierdzić, że 88 procent wznieconych przez nas pożarów powoduje, iż temperatura pomieszczenia osiąga tę wartość w ciągu wymaganych przez nas 5 minut - wskaźnik trafień równy 88 procent. Tak więc mamy pierwszy punkt na naszej krzywej: p (alarm | pożar) (alarm pod warunkiem, że pożar) równa się 88 procent; p (alarm | brak pożaru) (alarm pod warunkiem, że brak pożaru) równa się 20 procent. Ten jeden punkt w rzeczywistości wystarczy, jeśli jesteśmy przekonani, że wszystkie rozkłady są normalne. Możemy teraz obliczyć wartość d', a następnie obliczyć, jak powinna wyglądać reszta krzywej. Przyglądając się tabeli rozkładu normalnego (tabela B-2), przekonamy się, że jeśli mamy wskaźnik fałszywych alarmów równy 20 procent, to kryterium musi znajdować się na prawo od najwyższego punktu rozkładu, mniej więcej w punkcie 0,8. Tak więc wartość A wynosi 0,8. Wskaźnik trafień równy 88 procent oznacza, że kryterium musi znajdować się na lewo od najwyższego punktu rozkładu, w punkcie o wartości około minus 1,2. Tak więc B równa się minus 1,2. Teraz możemy obliczyć d', które jest po prostu odległością między tymi dwoma rozkładami, i wynosi 0,8 plus 1,2 równa się 2,0. Nasz system przeciwpożarowy ma d'(d prim) równa się 2,0. Cała krzywa zatem jest podobna do krzywej przedstawionej na rysunku B-9. RYSUNEK B-9 [Charakterystyka funkcjonowania systemu alarmowania zagrożenia pożarowego. Na osi pionowej procent trafień p (alarm pod warunkiem, że pożar), na osi poziomej procent fałszywych alarmów p (alarm pod warunkiem, że nie ma pożaru). ] Aby teraz uzupełnić informację o wpływie nastawiania czujnika na różne temperatury, procedurę naszą możemy uprościć: musimy tylko określić, jaki byłby wskaźnik fałszywych alarmów przy różnych temperaturach. Aby uzyskać tę informację, możemy zainstalować w budynku na parę miesięcy urządzenie rejestrujące automatycznie temperaturę. 664 Następnie przeanalizujemy rozkład temperatur, jakie wystąpiły w tym okresie. Możemy na przykład stwierdzić, że przy czujniku nastawionym na temperaturę 65 stopni fałszywe alarmy wystąpiłyby w 10 procent przypadków, przy temperaturze 70 stopni tylko w 1 procentach przypadków, zaś przy temperaturze 55 stopni w 60 procentach przypadków. Wartości te wyznaczają punkty na charakterystyce funkcjonowania, jak widzimy na rysunku B-9. W tym momencie jest już oczywiste, że nigdy nie poradzimy sobie z d' (d prim) tak niskim, jak 2,0. Jeśli ustalimy wartość fałszywych alarmów na poziomie do przyjęcia dla straży pożarnej, powiedzmy 1 procentowy-czujnik temperatury nastawiony na 70 stopni-to wówczas nasze towarzystwo ubezpieczeniowe będzie skarżyć się, że nasze szanse wykrycia pożaru wynoszą jedynie trzydzieści siedem setnych. Jeśli zaś spróbujemy podnieść szanse wykrycia pożaru do dziewięćdziesięciu pięciu, to otrzymamy wskaźnik fałszywych alarmów zbliżony do 40 procent - oczywiście nie do przyjęcia dla straży pożarnej. Nie ulega wątpliwości, że nigdy nie uda się nam rozwiązać tego problemu zmieniając temperaturę, na którą nastawiony jest czujnik uruchamiający tryskacze. Musimy podnieść wartość d'(d prim). Przypuśćmy, że zarówno straż pożarna, jak i towarzystwo ubezpieczeniowe zgodziło się, iż możliwy do zaakceptowania wskaźnik trafień jest równy 99 procent, zaś wskaźnik fałszywych alarmów równa się 1 procent. Jaką wartość d' musielibyśmy przyjąć? Pamięć Z eksperymentów nad pamięcią wiemy, że jeśli przedstawi Ci się jeden raz listę zawierającą 30 imion (licząc około 2 sekundy na imię), to po godzinie będziesz pamiętać bardzo niewiele z tej listy. W istocie dla każdego poszczególnego imienia d' (d prim) równa się 0,8. Załóżmy, że jesteś jednym z gospodarzy oficjalnego przyjęcia i że w ciągu 60 sek. zostało ci przedstawionych 30 osób. Godzinę później starasz się przypomnieć sobie ich nazwiska. Przyjmując, że twój wskaźnik fałszywych alarmów będzie równy 8 procent, jaki procent nazwisk przypomnisz sobie poprawnie? 665 Gra w kości po raz drugi RYSUNEK B-10 Wykres do uzupełnienia. Na osi pionowej d prim od 0 do 3; na osi poziomej wartość S (liczba punktów na pozostałych ściankach kostki, która na trzech ściankach ma „0”) od 0 do 8. Na wykresie naniesiono dwa punkty o współrzędnych (3;1,2). (6,2;2,5) Tabela B-3 Tabela do uzupełnienia. Uzupełnić należy miejsca w których znajduje się znak X. Założenie: kryterium jest stałe i wynosi 11. Kolejne liczby w wierszu poprzedzone są objaśniającymi skrótami S (wartość S), WFA (wskaźnik fałszywych alarmów), WT (wskaźnik trafień), A, B, d’(d prim równe A-B). W celu właściwego odczytu liczb przez program Screen Reader, należy ustawić opcję CZYTANIE DOKUMENTÓW na wypowiadanie wszystkich znaków. S 0;WFA 8 procent; WS 8 procent; A 1,4; B 1,4; d’ 0 S 1;WFA 8 procent; WS X procent; A 1,4; B X; d’ X S 2;WFA 8 procent; WS X procent; A 1,4; B X; d’ X S 3;WFA 8 procent; WS 42 procent; A 1,4; B 0,2; d’ 1,2 S 4;WFA 8 procent; WS X procent; A 1,4; B X; d’ X S 5;WFA 8 procent; WS X procent; A 1,4; B X; d’ X S 6;WFA 8 procent; WS 83 procent; A 1,4; B –1,0; d’ 2,4 S 7;WFA 8 procent; WS X procent; A 1,4; B X; d’ X S 8;WFA 8 procent; WS X procent; A 1,4; B X; d’ X Rozpatrzmy teraz pewną wersję gry w trzy kości, w której specjalna kostka ma 0 na trzech ściankach i S na pozostałych trzech ściankach. Jeśli przyjmiemy rozkład normalny jako dobre przybliżenie rozkładu wyników rzutów kostką, jaki jest związek między d' (prim) a wartością S? Przyjmijmy stałe kryterium równe 11. Oznacza to, że wskaźnik fałszywych alarmów będzie równy 8 procent. Jeśli więc S jest równe 3, to z naszej tabeli gry w kości wynika, że wskaźnik trafień wynosi piętnaście trzydziestych szóstych, czyli 42 procent. W tabeli rozkładu normalnego znajdujemy A równa się 1,4, B równa się 0,2, a więc d'(d prim) równa się A-B równa się 1,2. Tabela B-3 pokazuje związek między d', wskaźnikiem trafień i wskaźnikiem fałszywych alarmów (przy założeniu stałego kryterium, które jest równe 11). Związek między d' a S jest też przedstawiony graficznie na rysunku B-10. A teraz spróbuj uzupełnić zarówno tabelę, jak i wykres. Bibliografia WSKAZÓWKI BIBLIOGRAFICZNE Roczne Przeglądy (Annual Reviews) Abstrakty Psychologiczne (Psychological Abstracts) Indeks Cytowań (The Science Citation Index) Czasopisma PODRĘCZNIKI Zbiory artykułów 667 WSKAZÓWKI BIBLIOGRAFICZNE Czytelnik, który chciałby się dowiedzieć czegoś więcej o różnorodnych problemach omawianych w tej książce, może poszukiwać dalszych informacji w różnych miejscach. Najważniejszymi źródłami takich informacji są Roczne Przeglądy (Annual Reviews), Abstrakty Psychologiczne (Psychological Abstracts), Indeks Cytowań (Science Citation Index) i różne specjalistyczne czasopisma. Roczne Przeglądy (Annual Reviem) Annual Reviews stanowią serie tomów z różnorodnych dziedzin nauki publikowanych corocznie. Wydawane są przez Annual Reviews, Inc., Pało Alto, Kalifornia. Jakkolwiek co roku publikowane są takie przeglądy, to specjalistyczne działy danej nauki omawiane są w dłuższych niż roczne odstępach - zwykle co trzy lub cztery lata. Korzystanie z Rocznych Przeglądów jest chyba najszybszym sposobem zorientowania się w aktualnym stanie wiedzy w określonej dziedzinie. Nie są one jednak łatwe w czytaniu, gdyż napisane zostały dla specjalistów, a niektóre z przeglądów bywają nawet i dla nich niezrozumiałe. Nie zrażając się tymi trudnościami, powinniście przestudiować starannie te rozdziały Przeglądów, które dotyczą interesującej Was problematyki, i wyszperać w nich odnośniki do najnowszych artykułów, które następnie należy samemu przeczytać w bibliotece. Zwykle artykuły są łatwiejsze do zrozumienia niż ich omówienia w Przeglądach. Roczne Przeglądy publikowane są z różnych dziedzin, dwa z nich pokrywają prawie cały materiał w tej książce. Są to Roczne Przeglądy z psychologii i fizjologii (Annual Reviews of Psychology i Annual Reviews of Physiology). [Annual Reviews są dostępne w Polsce tylko w Bibliotece Głównej Uniwersytetu Warszawskiego i w PAN.]1 Abstrakty Psychologiczne (Psychological Abstracts) Psychological Abstracts jest czasopismem wydawanym przez Amerykańskie Towarzystwo Psychologiczne (American Psychological Association) i zawiera abstrakty, czyli streszczenia artykułów specjalistycznych, publikowanych w wielu różnych czasopismach. Przeglądając indeks abstraktów, uporządkowany tematycznie, można natrafić na artykuły dotyczące przedmiotu zainteresowań. Same abstrakty dają tylko ogólne streszczenie treści artykułu, pozwalając jedynie zorientować się, czy należy dany artykuł studiować dokładniej. Główną trudność w posługiwaniu się abstraktami stanowi to, że mówią one zbyt dużo. Zaprowadzą do znacznie większej liczby prac niż ta, którą moglibyście przeczytać. Zwykle przyczyną tego jest to, że nie potraficie znaleźć właściwej dziedziny przy przeglądaniu indeksu. Jeśli np. będziecie szukać w indeksie pod hasłem „pamięć", to zapewne znajdziecie około 500 artykułów. Ten konkretny artykuł, który Was rzeczywiście interesuje, znajdzie się zapewne na tej liście, ale go nigdy nie odszukacie. Zadanie Wasze polega więc na bardziej przemyślanym wykorzystaniu indeksu, tak aby zredukować wyjściową liczbę artykułów do dającej się prześledzić. Dalej w tekście w nawiasach kwadratowych będziemy umieszczać uwagi redakcji przekładu polskiego. 668 Trzeba to zrobić z pewnym zastanowieniem: głównie chodzi tu o wybór bardziej szczegółowych haseł w indeksie. Ma to tę zaletę, że może Wam pozwolić na odkrycie artykułu lub nawet całej dziedziny badań, która okaże się jeszcze bardziej interesująca niż ta, której poszukiwaliście. Wiele już osób odkryło swe prawdziwe zainteresowania przypadkowo, trafiając na jakiś artykuł przy przeglądaniu abstraktów. Abstrakty są oprawione jako roczniki. Trzeba przejrzeć kilka roczników pod interesującym Was hasłem. Najlepiej jest zacząć od ostatniego rocznika i cofać się kolejno do lat poprzednich. [Psychological Abstracts znajdują się w większości uniwersyteckich bibliotek w Polsce.] Indeks Cytowań (The Science Citation Index) Często się zdarza, że trafia się na jakiś świetny artykuł, ale raczej już nie najnowszy. Problem polega na znalezieniu, co nowego opublikowano na ten sam temat. Można wtedy skorzystać z Science Citation Index (wydawany kwartalnie przez Institute for Scientific Information, Inc.). Szukacie w nim artykułu, który Was właśnie zainteresował. Indeks Cytowań wskaże Wam, jakie z później publikowanych prac powoływały się na ten artykuł. Jest to doskonały sposób na śledzenie od dawniej publikowanego artykułu do najnowszych prac na dany temat. Czasem metoda ta zawodzi i to zarówno dlatego, że prace cytujące interesujący Was artykuł mogą dotyczyć zupełnie innego tematu, jak i dlatego, że nie wszystkie artykuły, które powinniście przeczytać, powołują się na ten artykuł, który zdarzyło się Wam przeczytać. Indeks Cytowań także oprawiany jest w roczniki, musicie więc śledzić wybrany artykuł przez kolejne roczniki aż do ostatniego, aby zobaczyć, co nowego ukazało się na ten temat. [The Science Citation Index jest dostępny w Polsce tylko w Ośrodku Informacji Naukowej Biblioteki Głównej UW.] Czasopisma Kiedy powyższe metody zawiodą, trzeba szukać bezpośrednio w czasopismach naukowych. Sposób pisania artykułów naukowych jest często bardzo specjalistyczny, lecz czasem zadziwiająco łatwy do czytania. Najlepiej jest znać nazwy kilku czasopism, które obejmują dziedziny Waszych zainteresowań (nazwy czasopism można znaleźć przeglądając nasz spis bibliografii), i starać się możliwie często wertować je w czytelni, zwłaszcza najnowsze, nieoprawione jeszcze numery. Natkniecie się wtedy zapewne na jakieś interesujące artykuły, jak też znajdziecie odniesienia do wcześniejszych prac. Czasem, gdy natraficie na czasopismo dotyczące bezpośrednio dziedziny, która Was interesuje, warto jest przekartkować je dokładnie, zaczynając od najnowszego rocznika i cofając się wstecz jak najdalej. Metoda ta nie jest tak pracowita, jakby się to z pozoru wydawało, i prawie każdy poważny naukowiec nieraz ją stosował. (Nie pomijajcie najstarszych numerów. Dziwna jest historia psychologii, najbardziej fascynujące artykuły zostały ogłoszone w latach między 1890 a 1910). Najbardziej interesujące czasopisma z omawianej przez nas dziedziny to następujące tytuły: * American Journal of Psychology (ogólna psychologia eksperymentalna). * British Journal of Psychology (ogólna psychologia eksperymentalna). * Canadian Journal of Psychology (ogólna psychologia eksperymentalna). * Cognitive Psychology (teoretyczne i eksperymentalne artykuły na temat pamięci, spostrzegania i procesów poznawczych). * Journal of the Acoustical Society of America (JASA) (teoretyczne i eksperymentalne artykuły na temat słyszenia i rozumienia mowy). * Journal of Experimental Psychology (artykuły eksperymentalne z prawie wszystkich dziedzin psychologii). * Journal of Mathematical Psychology (problemy psychologiczne przedstawiane głównie w kategoriach teorii i modeli matematycznych). * Journal of the Optical Society of America (JOSA) (teoretyczne i eksperymentalne artykuły na temat percepcji wzrokowych). * Journal of Verbal Learing and Verbal Behavior (artykuły eksperymentalne głównie dotyczące badań nad pamięcią ludzką). * Perception and Psychophysics (głównie artykuły eksperymentalne). * Psychological Bulletin (zawiera artykuły przeglądowe z poszczególnych dziedzin psychologii. Dobre artykuły podsumowujące i oceniające badania na dany temat). * Psychological Review (zawiera artykuły teoretyczne na różne tematy). * Quarterly Journal of Experimental Psychology (ogólne artykuły z psychologii eksperymentalnej). * Science (od czasu do czasu dłuższe artykuły przeglądowe, zwykle krótkie specjalistyczne artykuły). * Scientific American (dobre artykuły wprowadzające w różne dziedziny). Vision Research (badania z dziedziny wzroku). [Nazwy czasopism oznaczone gwiazdką są w Polsce dostępne w niektórych bibliotekach uniwersyteckich lub PAN-owskich. Podajemy też listę polskich czasopism psychologicznych: Przegląd Psychologiczny, kwartalnik, organ PTP. Studia Psychologiczne, rocznik. Psychologia Wychowawcza, kwartalnik, organ ZNP. Polish Psychological Bulletin, kwartalnik ukazujący się w języku angielskim.] PODRĘCZNIKI Oprócz podanych w bibliografii książek, w których ważne dla nas mogą być pojedyncze rozdziały, istnieją bardziej ogólne źródła. Są to książki, które niewątpliwie warto przewertować, aby uzyskać bardziej pogłębioną wiedzę z psychologii. Oto lista podręczników, jakie-naszym zdaniem-należy polecić Czytelnikowi, który przestudiował tę książkę i pragnie dalej poszerzać swą wiedzę. Jest to oczywiście lista niekompletna: R. S. Woodworth i H. Schlosberg Experimental Psychology, New York, Holt, 1938,1954,1971. [Psychologia eksperymentalna, I i II, tłum. pol. A. Lewicki, E. Vielrose i J. Ekel, Warszawa, 1963, PWN.] Jest to doskonały traktat o całej psychologii eksperymentalnej. Przez wiele lat stosowany jako obowiązujący tekst dla kończących psychologię. Istnieją trzy wersje tego podręcznika: oryginalna wersja Woodwortha z 1938 roku, druga Woodwortha i Schlosberga (1958), i nowa, poprawiona Klinga i Riggsa z 1971 roku. Wersja z 1938 roku jest niezwykłym dokumentem ówczesnego stanu wiedzy psychologicznej. Zawiera omówienie i rozważania dotyczące wielu ważnych problemów, 670 które zostały częściowo pominięte w wersji z 1958 roku. Musicie sami zdecydować, którą wersję wybierzecie do przestudiowania, po przejrzeniu obu. W najnowszym wydaniu autorzy chcieli uaktualnić problematykę omawianą w poprzednich wydaniach, ale-w naszym przekonaniu - nie udało im się wywiązać w pełni z tego zadania. G. A. Miller, E. Galanter i K. H. Pribram Plans and the structure ofbehavior, New York, Holt, 1960. [Plany i struktura zachowania, tłum. na jęz. pol. A. Grzybowska i A. Szewczyk, Warszawa 1980, PWN.] Krótkie przedstawienie wielu zagadnień, które poruszamy w niniejszej książce, w sposób do naszego podobny. Była to jedna z pierwszych książek, które wprowadziły problematykę przetwarzania informacji do psychologii-dobrze napisana książka, łatwa w czytaniu. D. E. Wooldridge The machinery of the brain. New York, McGraw-Hill, 1963. [Brak przekładu polskiego.] Doskonałe wprowadzenie w problematykę czynności mózgu i ich wpływu na zachowanie się. Często zalecaliśmy tę książkę jako uzupełniającą lekturę do naszych wykładów. Wooldridge jest autorem jeszcze kilku innych książek, które mogą Was zainteresować, choć nie dotyczą bezpośrednio problematyki psychologicznej. [Polskiemu Czytelnikowi możemy polecić następujące pozycje w języku polskim: J. Konorski Integracyjna działalność mózgu. Warszawa 1969, PWN, i B. Sadowski Fizjologiczne mechanizmy zachowania. Warszawa 1977, PWN.] C. H. Coombs, R. M. Dawes i A. Tversky Mathematical psychology. An introduction. Englewood Clifis, New Jersey: Prentice Hall, 1970. [Wydanie polskie: Wprowadzenie do psychologii matematycznej. Tłumaczyli J. Grzelak, T. B. Iwiński, J. Radzicki i T. Tyszka, Warszawa 1977, PWN.] Wiele współczesnych teorii psychologicznych posługuje się modelami matematycznymi. Książka stanowi doskonałe wprowadzenie do tego typu prac. G. A. Miller Psychology. The science of mental life. New York: Harper and Row, 1962. Doskonałe wprowadzenie do psychologii zawierające przegląd historyczny. [Brak przekładu polskiego. W zamian polecamy inne wprowadzenia tłumaczone z języka angielskiego: E. R. Hi-gard Wprowadzenie do psychologii. Tłumaczył J. Radzicki, Warszawa 1967, PWN, i znacznie nowsze P. G. Zimbardo, F. L. Rush Psychologia i życie. Tłumaczył J. Radzicki 1988, jak też doskonały Wstęp do psychologii T. Tomaszewskiego, Warszawa 1963, PWN. Zbiory artykułów Istnieje wiele zbiorów wybranych artykułów z różnych czasopism. Zbiory poświęcone określonemu tematowi okazują się bardzo przydatne w pracy dydaktycznej i naukowej. Dwa takie zbiory wydają się nam szczególnie użyteczne w związku z tematyką poruszaną w tej książce dlatego, że dotyczą ogólniejszej problematyki, jak też dlatego, że dostarczają bezpośredniego materiału źródłowego: R. C. Atkinson (red.) Contemporary psychology. Readings from Scientific American, San Francisco, W. H. Freeman, 1971. [Brak przekładu polskiego.] I. M. Foley, R. A. Lockhart i D. M. Messick (red.) Contemporary readings in psychology. New York, Harper, 1970. [Brak przekładu polskiego.] BIBLIOGRAFIA 671 BIBLIOGRAFIA Bibliografię podajemy in extenso. Adolph, E. F. The internal evironment and behavior. III. Water content. American Journal of Psychiatry, 1941,97, 1372. Adrian, E. D. The mechanism of nervous actiun: Electrical studies of the neuwns. Philadelphia: University of Pennsylvania Press, 1959. Albers, J. Interaction of color. New Haven: Yale University Press, 1963. [Also see Bucher (1961).] Allen, V. L. Situational factors in conformity. In L. Berkowitz (Ed.), Advances in experimental social psychology. Vol. 2. New York: Academic Press, 1965. Alpern, M., Lawrence, M., & Wolsk, D. Sensory processes. Belmont, Calif.: Brooks/Cole, 1967. Arnheim, R. An wisual perception. Berkeley: Univ. of California Press, 1969. (a) Arnheim, R. Visual thinking. Berkeley: Univ. of California Press, 1969. (b) Arnold, M. B. (Ed.) Feelings and emotions: The Loyola symposium. New York: Academic Press, 1970. Asch, S. E. Social psychology. Englewood Cliffs, N. J.: Prentice-Hall, 1952. Asch, S. E. Opinions and social pressure. Scientific American, 1955, 193, 31-35. Atkinson, R. C. (Ed.) Contemporary psychology. Readings from Scientific American. San Francisco: Freeman, 1971. Atkinson, R. C., and Shiffrin, R. M. The control of short-term memory. Scientific American, 1 97 1 , 225 (2), 82-90. Averbach, E., &Coriell A. S. Short-term memory in vision. Bell System TechnicalJournal, 1961, 40, 309-328. Ax, A. F. The physiological differentation between fear and anger in humans. Psychosomatic Medicine, 1953, 15, 433-422. Bach, E., & Harms, R. G. (Eds.) Universals in linguistic theory. New York: Holt, 1968. Backus, J. A plea for conformity. Journal of the Acoustical Society of America, 1968, 44, 285. Barbizet, J. Human memury and its pathology. San Francisco: Freeman, 1970. Barker, R. G., Dembo, T., & Lewin, K. Frustration and regression: An experiment with young children. University uflowa Studies in Child Welfare, 1941, 18, No. 386. Barlow, H. B., Hill, R. M., & Levick, W. R. Retinal ganglion cells responding selectively to direction and speed of image motion in the rabbit. Journal of Physiology, 1964, 173, Barron, F., Dement, W. C., Edwards, W., Lindman, H., Philips, L. D., Olds, J., & Olds, M. New directions in psychology. Vol. 2. New York: Holt, 1965. Bartlett, F. C. Remembering. Cambridge, England: Cambridge University Press, 1932. Bartlett, N. B. Dark adaptations and light adaptation. In C. H. Graham (Ed.), Vision and visual perceptions. New York: Wiley, 1965. Bartley, S. The psychophysiology of vision. In S. S. Stevens (Ed.), Handbuuk of experimental psychology. New York: Wiley, 1951. Beach, F. A., Hebb, D. O., Morgan, C. T., & Nissen, H. W. (Eds.) The neuropsychologyof Lashley. New York: McGraw-Hill, 1960. Bekesy, G. von. On the resonance curve and decay period at various points on the cochlear partition. Journal of the Acoustical Society of America, 1949, 21, 245-254. Bekesy, G. von. Experiments in hearing. New York: McGraw-Hill, 1960. Bekesy, G. von Sensory inhibition. Princeton, N. J.: Princeton University Press, 1967. Bem, D. J. Beliefś, attitudes, and human affairs. Belmont, Calif.: Wadsworth, 1970. Berko, J. The child's learning of English morphology. Word, 1958, 14, 150-177. Berkowitz, L. Advances in experimental social psychology. Vol. 2, New York: Academic Press, 1965. Berkun, M. M., Białek, H. M., Kearn, R. P., & Yagi, K. Experimental studies of psychological stress in man. Psychological Monographs, 1962, 76 (15, Whole No. 534). Berlyne, D. E. Children's reasoning and thinking. In P. Mussen (Ed.), Handbook of child psychology. New York: Wiley, 1970. Bever, T. G. The cognitive basis for linguistic structures. In. J. R. Hayes (Ed.), Cognition and the development of language. New York: Wiley, 1970. Bishop, P. O. Central nervous system: Afferent mechanisms and perception. Annual Review of Physiology, 1967, 29, 472-484. Bishop, P. O. & Henry, G. H. Spatial vision. Annual Review of Psychology, 1971, 22, 119-160. Bjork, R. A. Repetition and rehearsal mechanisms in models for short-term memory. In D. A. Norman (Ed.), Models of human memory. New York: Academic Press, 1970. Black, A. H. The direct control of neural processes by reward and punishment. American Scientist, 1971,59,236-245. Bolt, R. H., Cooper, F S., David, E. E., Jr., Denes, P. B., Pickett, J. M., & Stevens, K. N. Identification of a speaker by speech spectrograms. Science, 1969,166, 398-342. Bouman, M. A. History and present status of quantum theory in vision. In W. A. Rosenblith (Ed.), Sensory communication. Cambridge, Mass.: M. I. T. Press, 1961. Boume, L. E., Jr., Ekstrand, B. R., & Dominowski, R. L. The psychology of thinking. Englewood Cliffs, N. J.: Prentice-Hall, 1971. Brady, J. V. Ulcers in „executive monkeys". Scientific American, 1958, 199 (4), 95-100. Bransford, J., & Franks, J. Abstraction of linguistic ideas. Cognitive Psychology, in press. Brazier, M. A. B. (Ed.) Brain function. Vol. II. Berkeley, Calif.: University of California Press, 1964. Bredberg, G., Lindeman, H. H., Ades, H. W., West, R., & Engstróm, H. Scanning electron microscopy of the organ of corti. Science, 1970,170, 861-863. Breland. K., & Breland, M. Animal behavior. New York: Macmillan, 1966. Brooks, L. Spatial and verbal components of the act of recall. Canadian Journal of Psychology, 1968,22,349-368. Brown, R. Social psychology. New York: Free Press, 1965. Brown, R. A first language, the early stages. Cambridge, Mass.: Harvard University Press, 1973. Brown, R., & Bellugi, U. Three processes in the child's acquisition of syntax. In E. Lenneberg(Ed-), New directions in the study of language. Cambridge, Mass.: M. I. T. Press, 1964. Brown, R., & Hanlon, C. Derivational complexity and order of acquisition in child specach. In J. R. Hayes (Ed.), Cognition and the development of language. New York: Wiley, 1970. Brown, R., Galanter, E., Hess, E. H., & Mandler, G. New directions in psychology I. New York: Holt, 1962. Bruner, J. S. The course of cognitive growth. American Psychologist, 1964, 19, 1-15. Bruner, J. S., Goodnow, J. J., & Austin, G. A. A study of thinking. New York: Wiley, 1956. Bryden, M. P. Attentional strategies and short-term memory in dichotic listening. Cognitive Psychology, 1971, 2, 99-116. Bucher, F. Joseph Albers. Despite straight lines. New Haven: Yale University Press, 1961. Burdick, E. The 480. New York: Dell, 1965. Orginally published by McGraw-Hill, New York, 1954. Bures, J., & Buresova, O. The use of Lead's spreading cortical depression in research on conditioned reflex. EEG. Clinical Neurophysiology, 1960, 359-376. (Suppl. 13.) Bures, J., Petrań, M., & Zacharj, J. Electrophysiological methods in biological research. (3rd ed.) New York: Academic Press, 1967. Byrne, W. L., Samnel, D., Bennett, E. L., Rosenzweig, M. R., Wasserman, E., Wagner, A. R., Gardner, F., Galambos, R., Berger, B. D., Margules, D. L., Fenichel, R. L., Stein, L., Corson, J. A.,Enesco,H. E.,Chorover,S. L., Holt,C. E.,III, Schiller,P. H.,Chiappetta,L., Jarvik,M. E., Leaf, R. C., Dutcher, J. D., Horovitz, Z. P., & Carlson, P. L. Memory transfer. Science, 1966, 153, 658-659. Carraher, R. G., & Thurston, J. B. Optical illustions and the visual arts. Princeton, N. J.: Van Nostrand-Reinhold, 1968. Chapanis. A. The dark adaptation of the color anomalous measured with lights of different hues. Journal of General Physiology, 1947, 30, 423-437. Chomsky, N. The formal nature of language. In E. H. Lenneberg (Ed.), Biological foundations of language. New York: Wiley, 1967. Chomsky, N., & Halle, M. The sound pattern of English. New York: Harper, 1968. Cofer, C. N., & Appley, M. H. Motivation: Theory and research. New York: Wiley, 1964. Cogan, D. B. Neurology of the visual system. Springfield, 111.: Thomas, 1966. Cohen, J. Behavior in uncertainty. New York: Basic Books, 1964. Collins, A., & Quillian, M. R. Retrieval time from semantic memory. Journal of Verbal Learning - Verbal Behavior, 1969, 8, 240-247. The Color Tree. (2nd ed.) New York: Interchemical Corp., 1965. Conel, J. L. Thepostnataldevelopment of the human cerebralcortex. Vols. I-VI. Cambridge, Mass.: Harvard University Press, 1939-1963. Conrad, R. Errors of immediate memory. British Journal of Psychology, 1959, 50, 349-359. Coombs, C. H., Dawes, R. M., & Tversky, A. Mathematical psychology: An introduction. Englewood Cliffs. N. J.: Prentice Hali, 1970. Corballis, M. C., & Beale, J. L. Bilateral symmetry and behavior. PsychologicalReview, 1970,77, 451-464. Coren, S. Brightness contrast as a function of figure-ground relations. Journal of Experimental Psychology, 1969, 80, 517-524. Corkin, S. Acquisition of motor skill after bila terał medial temporal-lobe excision. Neuropsychologia, 1968, 6, 255-265. Corning, W. C., & John, E. R. Effect of ribonuclease on retention of response in regenerated planarians. Science, 1961,134, 1363-1365. Cornsweet, T. N. Information processing in human visual systems. Stanford Research Institute Journal, 1969, Feature issue No. 5. Cornsweet, T. N. Visual perception. New York: Academic Press, 1970. Creutzfeldt, O., & Sakmann, B. Neurophysiology of vision. Annual Review of Physiology, 1969,31, 499-544. Crutchfield, R. S. Conformity and character. American Psychulogist, 1955,10, 191-198. Davidson, D., Suppes. P., & Siegal, S. Decision making: An experimental approach. Stanford, Calif.: Stanford University Press, 1967. Reprinted in W. Edwards and A. Tversky (Eds.), Decision making. Harmondsworth, Middlesex, England: Penguin Books, 1967. Davson, H. (Ed.) The eye. New York: Academic Press, 1962. DeGroot, A. D. Thought and choice in chess. The Hague: Mouton, 1965. DeGroot, A. D. Perception and memory versus thought: Some old ideas and recent findings. In B. Kleinmuntz (Ed.), Problem sohing: Research, method, and theory. New York: Wiley, 1966. DeGroot, M. H. Optima! statistical decision. New York: McGraw-Hill, 1969. Delafresnaye, J. F. (Ed.) Brain mechanisms and consciousness. Oxford, England: Blackwell, 1954. Dement, W. C. An essay on dreams: The role of physiology in understanding their nature. In F. Barron et al. (Eds.), New directions in psychology II. New York: Holt, 1965. Denes, P. B., & Pinson, E. N. The speech chain. Murray Hill, N. J.: Bell Telephone Laboratories, Inc., 1963. (Available from the business office of the local Bell System Telephone Company.) de Sausmarez, M. Bridget Riley. Greenwich, Conn.: New York Graphic Society Ltd., 1970. Deutsch, J. A. The physiological basis of memory. Annual Review of Psychology, 1969, 20, 85-104. Deutsch, J. A. (Ed.) Physiological basis of memory. New York: Academic Press, 1973. Deutsch, J. A., & Deutsch, D. Physiological psychology. Homewood, 111.: Dorsey Press, 1966. Deutsch, S. Models of the nervous system. New York: Wiley, 1967. De Valois, R. L., Abromov, L, & Jacobs, G. H. Analysis of response patterns of LGN cells. Journal of the Optical Society of America, 1966, 56, 966-977. De Valois, R. L., & Jacobs, G. H. Primate color vision. Science, 1968,162, 533-540. Dodwell, P. C. Visual pattern recognition. New York: Holt, 1970. Eccles, J. C. The neurophysiological basis of mind. London and New York: Oxford University Press, 1953. Eccles, J. C. The physiology of synapses. Berlin and New York: Springer-Verlag, 1964. Eccles, J. C. Possible ways in which synaptic mechanisms participate in learning, remembering and forgetting. In D. P. Kimble (Ed.), The anatomy of memory. Vol. I. Palo Alto, Calif: Science and Behavior Books, 1965. Edwards, W. Controller decisions in space flight. In R. Patton et al. (Eds.), Applications of research on human decision making, NASA SP-209. Washington, D. C.: National Aeronauticsand Space Administration, Office of Technology Utilization, 1970. Edwards, W., & Tversky, A. (Eds.) Decision making. Harmondsworth, Middlesex, England: Penguin Books, 1967. Edwards, W., Lindman, H., & Philips, L. Emerging technologies for making decisions. In New directions in psychology. Yol. 2. New York: Holt, 1965. Egan, J. P., & Clarke, F. R. Psychophysics and signal detection. In J. B. Sidowski (Ed.), Experimental methods and instrumentation in psychology. New York: McGraw-Hill, 1966. Enright, J. T. Stereopsis, visual latency and three-dimensional moving pictures. American Scientist, 1970, 58 (5), 536-545. Epstein, R. A. The theory of gambling and statistical logie. New York: Academic Press, 1967. Ernst, G. W., & Newell, A. GPS: A case study in generality and problem sohing. New York: Academic Press, 1969. Escher, M. C. The graphic work of M. C. Escher. New York: Meredith Press, 1967, (Ist ed. 1961). Fay, R. R. Auditory frequency stimulation in the goldfish (carassius auratus). Journal of Comparative 6- Physiological Psychology, 1970,73(2), 175-180. Fay, R. R. & MacKinnon, J. R.A simplified technique for conditioning respiratory mouth movements in fish. Behavioral Research Methods and Instrumentation, 1969, 1, 3. Festinger, L. A theory of cognitive dissonance. New York, Harper, 1957. Festinger, L. Conflict, decision, and dissonance. Stanford, Calif.: Stanford University Press, 1964. Festinger, L., Coren, S., & Rivers, G. The effect of attention on brightness contrast and assimilation. American Journal of Psychology, 1970,83, 189-207. Festinger, L., Riecken, H. W., & Schachter, S. When prophecy fails. Minneapolis: University of Minnesota Press, 1956. Fillmore, C. J. The case for case. In E. Bach & R. G. Harms (Eds.), Universal in linguistic theory. New York: Holt, 1968. Fillmore, C. J. Toward a modern theory of case. In D. A. Reibel & S. A. Schane (Eds.), Modern studies in English. Englewood Cliffs, N. J.: Prentice-Hall, 1969. Finger, F. W., & Mook, D. C. Basic drives. Annual Review of Psychology, 1971, 22, 1-38. Fisher, A. E. Chemical stimulation of the brain. Scientific American, 1964, 210 (6), 60-68. Flavell, J. H. The developmental psychology of Jean Piaget. Princeton, N. J.: Van Nostrand Reinhold, 1963. Flavell, J. H. Role-taking and communication skills in children. Young Children, 1966, 21. Flavell, J. H.,Botkin, P. T.,Fry,C. L.,Wright,J. W.,&Jarvis,P. E. The development of role-taking and communication skills in children. New York: Wiley, 1968. Flexner, L. B., Flexner, J. B., & Roberts, R. Memory in mice analyzed with antibiotics. Science, 1967, 155, 1377-1383. Flock, H. R., & Freedberg, E. Perceived angle of incidence and achromatic surfece color. Perception Psychophysics, 1970, 8, 251-256. Foley, J. M., Lockhart, R. A., & Messick, D. M. (Eds.) Contemporary readings in psychology. New York: Harper, 1970. Frijda, N. H. The simulation of human memory. Psychological Bulletin, in press. Gaito, J. (Ed.) Macromolecules and behavior. (2nd ed.) New York: Appleton, in press. Ist ed., 1966. Galanter, E. Contemporary psychophysics. In R. Brown, E. Galanter, E. H. Hess, & G. Mandler, New directions in psychology. Vol. 1. New York: Holt, 1962. (a) Galanter, E. The direct measurement of utility and subjective probability. American Journal of Psychology, 1962, 75, 208-220. (b) Garcia, J., & Koelling, R. Relation of cue to cbnsequence in avoidance learning. Psychonomic Science, 1966,4, 123-124. Gardner, R. A., & Gardner, B. T. Teachnig sign language to a chimpanzee. Science, 1969, 165, 664-672. Gazzaniga, M. S. The bisected brain, New York: Appleton, 1970. Geldard, F. A. The human senses. New York: Wiley, 1953. Geschwind, N. The organization od language and the brain, Science, 1970, 170, 940-944. Gibson, A. R., & Harris, C. S. The McCollough effect: Color adaptation of edge-detectors or negative afterimages? Paper presented at the annual meeting of the Eastern Psychological Association, Washington, D. C., April 1968. Gibson, J. J. The perception of the visual world. Boston: Houghton, 1950. Gibson, J. J. The senses considered as perceptual systems. Boston: Houghton, 1966. Glass, D. C. (Ed.) Studies of obesity and eating in neurophysiology and emotion. New York: Rockefeller University Press, 1967. Glassman, E. The biochemistry of learning: An evalution of the role of RNA and protein. Annual Review of Biochemistry, 1969, 38, 605-646. Glassman, G., & Wilson, J. E. The incorporation of uridine into brain RNA during short experiences. Brain Research, 1970, 21, 157-168. Glucksberg, S., & Cowen, G. N., Jr. Memory for nonattended auditory materiał. Cognitive Psychology, 1970, l, 149-156. Gombrich, E. H. Art and illusion. New York: Pantheon, 1960. Graham, C. H. (Ed.) Vision and visual perception. New York: Wiley, 1965 Grasselli, A. (Ed.) Automatic interpretation and classification of images. New York: Academic Press, 1969. Greeff, Z. Graefe-Seamisch Hb. ges. augenheilk, II, Kap. 5, 1900, 1. Green, B. F., Jr. Current trends in problem solving. In B. Kleinmuntz (Ed.), Problem sobing. New York: Wiley, 1966. Green, D. M., & Swets, J. A. Signal detection theory and psychophysics. New York: Wiley, 1966. Greenwood, D. D. Auditory masking and the critical band. Jorunal of the Acoustical Society of America, 1961, 33, 484-502. Gregory, R. L. Eye and brain: The psychology of seeing. New York: McGraw-Hill, 1966. Gregory, R. L. The intelligent eye. New York: McGraw-Hill, 1970. Gross, C. G. A comparison of the effects of partial and total lateral frontal lesions on test performance by monkeys. Journal of Comparainc 6 Physiological Psychology, 1963, 56, 41-47. Guirao, M., & Stevens, S. S. Measurement of auditory density. Journal of the Acoustical Society of America, 1964, 36, 1176-1182. Gulick, W. L. Hearing: Physiology and psychophysics. London and New York: Oxford University Press, 1971. Gurowitz, E. M. The molecular basis of memory. Englewood Cliffs, N. J.: Prentice-Hall, 1969. Guzman. A. Decomposition of a visual scene into three-dimensional bodies. In A. Grasselli (Ed.), Automatic interpretation and classification of images. New York: Academic Press, 1969. Haber, R. N. (Ed.) Current research in motivation. New York: Holt, 1967. Haber, R. N. (Ed.) Contemporary theory and research in visual perception. New York: Holt, 1968. Haber, R. N. Eidetic images. Scientific American, 1969, 220, 35-44. (a) Haber, R. N. (Ed.) Information-processing approaches to visualperception. New York: Holt, 1969. (b) Haber, R. N. How we remember what we see. Scientific American, 1970, 222, (5), 104-112. Hamlyn L. H. An electron microscope study of pyramidal neurons in the Ammon's Horn of the rabbit. Journal of Anatomy, 1963, 97, 189-201. Harlow, H. F., & Woolsey, C. N. (Eds.) Biological and biochemical bases of behavior. Madison, Wis.; University of Wisconsin Press, 1958. Harris, C. S. Perceptual adaptation to inverted, reversed, and displaced vision. Psychological Review, 1965,72,419-444. Harris, C. S., & Gibson, A. R. Is orientation-specific color adaptation in human vision due to edge detectors, afterimages or "dipoles?" Science, 1968, 162, 1506-1507. (a) Harris, C. S., & Gibson, A. R. A minimal model for McCollough's orientation-specific color aftereffect. Paper presented at the annual meeting of the Psychonomic Society, St. Louis, November 1968. (b) Hartline, H. K. Milne, L. L, & Wagman, I. H. Fluctuations of response of single visual cells. Federation Proceedings (Fedemtion of American Societes for Experimental Biology) 1947, 6, 124. (Abstract) Hartline, H. K., & Ratliff, F. Inhibitory interaction of receptor units in the eye of limulus. Journal of General Physiology, 1957, 40, 357-376. Hartline, H. K., Wagner, H. G. & Ratliff, F. Inhibition in the eye of limulus Journal of General Physiology, 1956,39,651-673. Hawkins, J. E., Jr., & Stevens, S. S. The masking of pure tones and of speech by white noise. Journal of the Acoustical Society of America, 1950, 22, 6-13. Hayes, J. R. Cognition and the development of language. New York: Wiley, 1970. Hebb, D. O. The organization of behavior. New York: Wiley, 1949. Reprinted in paperback by Science Editions, 1961. Hecht, S., & Hsia, Y. Dark adaptation following light adaptation to red and white lights. Journal of the Optical Society of America, 1945, 35, 261-267. Held, K. Two modes of processing spatially distributed visual stimulations. In F. O. Schmidt (Ed.), The neurosciences: Second study program. New York: Rockefeller University Press, in press. Held, R. Dissociation of visual functions by deprivation and rearrangement. Psychologische Forschung, 1968, 31, 338-348. Henney, K. Principles of radio. (3rd ed.) New York: Wiley, 1938. Heron, W. Cognitive and physiological effects of perceptual isolation. In P. Solomon et al. (Eds.), Sensory deprivation. Cambridge, Mass.: Harvard University Press, 1961. Hilgrad, E. R., & Bower, G. H. Theories of learning. New York: Appleton, 1966. Hochberg, J. Perception. Englewood Cliffs, N. J.: Prentice-Hall, 1964. Hochberg, J. In the mind's eye. In R. N. Haber (Ed.), Contemporary theory and research in visual perception. New York: Holt, 1968. Hochberg, J., & Beck, J. Apparent spatial arrangement and preceived brightness. Journal of Experimental Psychology, 1954, 47, 263-266. Hoebel, B. G. Feeding and self stimulation. Annals of the New York Academy of Sciences, 1969, 157, Art. 2, 758-777. Hoebel, B. G. Feeding: Neural control of intake. Annual Review of Physiology, 1971, 33, 533-568. Hoffman, L. R. Group problem solving. In L. Berkowitz (Ed.), Advances in experimental social psychology. Vol. 2. New York: Academic Press, 1965. Hubel, D. H., & Wiesel, T. N. Receptive fields, binocular interaction and functional architecture in the cat's visual cortex. Journal of Physiology (London) 1962,160, 106-154. Hubel, D. G., & Wiesel, T. N. Shape and arrangement of columns in cafs striate cortex. Journal of Physiology (London) 1963,165, 559-568. Hubel, D. H., & Wiesel, T. N. Receptive fields and functional architecture in two nonstriate visual areas (18 and 19) of the cat. Journal of Neurophysiology, 1965, 28, 229-289. Hubel, D. H., & Wiesel, T. N. Receptive fields and functional architecture of monkey striate cortex. Journal of Physiology (London), 1968,195, 215-243. Huey, E. B. The psychology and pedagogy of reading. Cambridge, Mass.: M.I.T. Press, 1968. Originally published 1908. Hull, C. L. Essentials of behavior. New Haven: Yale University Press, 1951. Humphrey, N. K., & Weiskrantz, L. Vision in monkeys after removal of the striate cortex. Nature (London), 1967, 215, 595-597. Hunt, E. What kind of computer is man? Cognitive Psychology, 1971, 2, 57-98. Hurvich, L. M., & Jameson, D. The perception of brightness and darkness. Rockleigh, New Jersey: Allyn & Bacon, 1966. Hurvich, L. M., Jameson, D., & Krantz, D. Theoretical treatments of selected visual problems. In R. Luce, R. Bush, & E. Galanter (Eds.), Handbook of mathematicalpsychology. Vol. III. New York: Wiley, 1965. Hurwicz, L. Game theory and decisions. Sdentific American, 1955, 192 (2), 78-83. Hyden, H., & Egyhazi, E. Glial RNA changes during a learning experiment with rats. Proceedings of the National Academy of Sciences of the United States of America, 1964, 49, 618-624. Ingle, D. Two visual mechanisms underlying the behavior of fish. Psychologische Forschung, 1967, 31,44-51. Jacobson, E. Biology of emotions. Springfield, 111.: Thomas, 1967. Jakobson, R., Fant, G. M., &Halle, M. Preliminaries tospeech analysis. Cambridge, Mas.: M. I. T. Press, 1951. James, W. The principles of psychology. New York: Holt, 1890. Reprinted by Dover, New York, 1950. Jameson, D., & Huryich, L. M. Opponent chromatic induction: Experimental evaluation and theoretical account. Journal of the Optical Society of America, 1962, 51, 46-57. Jarrard, L. E. (Ed.) Cognitive processes of nonhuman primates. New York: Academic Press, 1971. Jensen, D. D. Paramecia, planaria, and pseudo-learning: Learning and associated phenomena in invertebrates. Animal Behavior Supplement, 1965, 1, 9-20. John, E. R. Studies on learning and retention in planaria. In M. A. B. Brazier (Ed.), Brainfunction. Vol. II. Berkeley, Calif.: University of California Press, 1964. John, E. R. Mechanisms of memory. New York: Academic Press, 1967. Jones, M. R. (Ed.) Nebraska symposium on motivation. Lincoln, Neb.: University of Nebraska Press, 1957. Judd, D. B. Basic correlates of the visual stimulus. In S. S. Stevens (Ed.), Handbook of experimental psychology. New York: Wiley, 1951. Julesz, B. Binocular depth perception of computer-generated patterns. Bell System Technical Journal, 1960, 39, 1125-1162. Julesz, B. Binocular depth perception without familiary cues. Science, 1964, 145, 356-362. Julesz, B. Foundations of cyclopean perception. Chicago: Uniwersity of Chicago Press, 1971. Jung, R. Allgemaine Neurophysiologie. In Handbuch der Inneren Medizen. Bd. V/l. Berlin and New York: Springer-Verlag, 1953. Kahneman, D. Methods, findings, and theory in studies of visual masking. PsychologicalBulletin, 1968,69,408-425. Karlins, M., & Abelson, H. J. Persuasion: How opin ions and attitudes are changed. (2nd ed.) Berlin and New York: Springer-Verlag, 1970. Kavanagh, J. F., & Mattingly, I. G. (Eds.) Language by ear and by eye. The relationship between speech and reading. Cambridge, Mass.: M.I.T. Press, 1972. Kepes, G. (Ed.) Vision and value series: 1. Education of vision; 2. Structure in art and in science; 3. The nature and art on motion; 4. Module, proportion, symmetry, rhythm: 5. The man-made object; 6. Sign, image, symbol. New York: Braziller, 1965, 1966. Khrushchev, N. Khrushchev remembers with a introduction, commentary and notes by Edward Crankshaw. Translated and edited by Strobe Talbott. Boston: Little, Brown, 1970. Kiang, N. Dischargepatterns of singlefibers in the cafs auditory nerve. Cambridge, Mass.: M.I.T. Press, 1965. (Res. Monogr. No 35.) Kimble, D. P. (Ed.), The anatomy of memory. Vol. I. Pało Alto, Califomia. Kimble, G. A. Hilgard and Marauis conditioning and learning. New York: Appleton, 1961. Kinney, G. C., Marsetta, M., & Showman, D. J. Studies in display symbol legibility, part XII. The legibility of alphanumeric symbols for digitalized television. Bedford, Mass.: The Mitre Corporation, November 1966, ESD-TR-66-117. Kintsch. W. Learning, memory, and conceptual processes. New York: Wiley, 1970. Kleinmuntz, B. (Ed.) Problem sohing. New York: Wiley, 1966. Kleinmuntz, B. (Ed.) Concepts and the structure of memory. New York: Wiley, 1967. Kleinmuntz, B.(Ed.) Formal representation of human judgement New York: Wiley, 1968. Kleitman, N. Patterns of dreaming. Scientific America, 1960, 203 (5), 82-88. Kleitman, N. Sleep and wakefulness. (Rev. ed.) Chicago: University of Chicago Press, 1963. Kling, J. W., & Riggs, L. A. (Eds.) Woodworth/Schlosberg's experimentalpsychology (3rd ed.) New York: Holt, 1971. Koch, S. Psychology: A study of a science. Vol. IV. New York: McGraw-Hill, 1962. Koehler, W. The mentality of apes. London: Routledge and Kegan Paul, 1925. (2nd ed., 1927). Available in papreback from Vintage Books, New York, 1959. Kolers, P. A., & Eden, M. (Eds.), Recognizingpatterns: Studies in living and automatic systems. Cambridge, Mas.: M.I.T. Press, 1968. Krantz, D. H., Luce, R. D., Suppes, P., & Tversky, A. Fundations of measurement. Vol. 1. Additive and polynomial representations. New York: Academic Press, 1971. Kryter, K. D. The effect of noise on man. New York: Academic Press, 1970. Kuffler, S. W. Discharge patterns and functional organization of mammalian retina. Journal of Neurophysiology, 1953, 16, 37-68. Lashely, K. S. Mass action in cerebral function. Science, 1931, 73, 245-254. Lashley, K. S. In search of the engram. Symposium of the Society of Experimental Biology, 1950,4, 454-482 Lashley, K. S. The problem of serial order in behavior. In L. A. Jeffress (Ed.), Cerebral mechanisms in behavior: The Hixon symposium. New York: Wiley, 1951. Latane, B., & Darley, J. M. Bystander "apathy" American Scientist, 1969, 57, 244-268. Latane B., & Darley, J. M. The unresponsive bystander. New York: Appleton, 1970. Leask, J., Haber, R. N., & Haber, R. B. Eidetic imagery in children: II. Longitudinal and experimental results. Psychonomic Monograph Supplements, 1969, 3 (3, Whole No. 35). LeGrand, Y. Light, colour, and vision. London: Chapman & Hali, 1957. Leibowitz, H., Myers, N. A., & Chinetti, P. The role of simultaneous contrast in brightness constancy. Journal of Experimental Psychology, 1955,50, 15. Lenneberg, E. H. (Ed.) New directions in the study of language. Cambridge, Mass.: M. I. T. Press, 1964. Lenneberg, E. H. Biological foundations of language. New York: Wiley, 1967. Lettvin, J. Y., Maturana, H. R., McCulloch, W. S., & Pitts, W. H. What the frog'seye tells the frog's brain. Proceedings of the IRE, 1959, 47 (11), 1940-1951. Lettvin, J. Y., Maturana, H. R., Pitts, W. H., & McCulloch, W. S. Two remarks on the visual system of the frog. In W. A. Rosenblith (Ed.), Sensory communication. Cambridge, Mass.: M.I.T. Press, 1961. Levelt, W. J. M. On binocular rivalry. Soesterberg, The Netherlands: Institute for Perception RYO-TNO, 1965. Levine, M. Hypothesis theory and nonlearning despite ideał S-R reinforcement contingencies. Psychological Review, 1971,78, 130-140. Liberman, A. M. The grammars of speech and language. Cognitive Psychology, 1970, 1 (4), 301-323. Lindgren, N. Machine recognition of human language. Institute of Electrical and Electronics Engineers Spectrum. Part 1. Automatic speech recognition, March 1965, 2, 114-136. Part 2. Theoretical models of speech perception in language, April 1965, 2, 45-59. Part 3. Cursive script recognition, May 1965, 2, 104-116. Lindsley, D. B. Emotion. In S. S. Stevens (Ed.), Handbook of experimentalpsychology. New York: Wiley, 1951. Lindsley, D. B. Psychophysiology and motivation. In M. F. Jones (Ed.), Nebraska Symposium on Motivation. Lincoln, Nebraska: University of Nebraska Press, 1967. Loehlin, J. C. Computer models of personality. New York: Random House, 1968. Lorenz, K. Z. On Aggression. New York: Bantam Books, 1969, First published 1966 by Harcourt, New York. Luce, G. G., & Segal, J. Sleep. New York: Coward-McCann, 1966. Luce, R. D., Bush, R. R., & Galanter, E. (Eds.) Handbook of mathematicalpsychology. 3 vols. New York: Wiley, 1962-1965. Luce, R. D., & Suppes. P. Preference, Utility, and subjective probability. In R. D. Luce, R. R. Bush, and E. Galanter (Eds.),HandbookvfMathematical Psychology. Vol. III. New York: Wiley, 1965. Luckiesh, M. Visual illusions. Princeton, N. J.: Van Nostrand-Reinhold, 1922. Also available in paperback from Dover Publications, 1965. Luria, A. R. The role of speech in the regulation of normal and abnormal behavior. New York: Liverright, 1961. Luria, A. R. The mind of a mnemonist. New York: Basic Books, 1968. Madigan, S. A., & McCabe, L. Perfect recall and total forgetting: A problem for models of short-term memory. Journal of Verbal Learning 6 Verbal Behavior, 1971, 10, 101-106. Magoun, H. W. The ascending reticular system and wakefulness. In J. F. Delafresnaye (Ed.), Brain mechanisms and consiousness. Oxford, England: Blackwell, 1954. Magritte. See Sylvester (1969). Maier, N. R. F. Reasoning in humans. II. The solution of a problem and its appearance in consciousness. Journal of Comparative Psychology, 1931, 12, 181-194. Maier, S. F., Seligman, M. E. P., & Solomon, R. L. Pavlovian fear conditioning and learned helplessness. In. B. A. Campbell and R. M. Church (Eds.), Punishment and aversive behavior. New York: Appleton, 1969. Mandler, G. Emotion. In R. Brown et al. (Eds.). New Direction in psychology. New York: Holt, 1962. Markowitz, H. The utility of wealth. Journal of Political Economics, 1952, 60, 152-158. McCollough, C. Coloradaptation of edge detectors in the human Visual system. Science, 1965,149, 1115-1116. McConnel, J. V. Memory transfer through cannibalism in planarians. Journal of Neuwpsychiatry Supplement 1, 1962, 3, 542-548. McConnell, J. V. Cannibalism and memory in flatworms. New Scientist, 1964, 21, 465-468. McConnell, J. V., Jacobson, A. L., & Kimble, D. P. The effects of regeneration upon retention of a conditioned response in the planarian. Journal of Comparative 6 Physiological Psychology, 1959,52, 1. McGinniss, J. The Selling of the President 1968. New York: Trident Press, 1969. Melton, A. W. Implications of short-term memory for a generał theory of memory. Journal of Verbal Learning 6 Verbal Behavior, 1963,2, 1-21. Mershon, D. H., & Gogel, W. C. Effect of stereoscopic cues on perceived whiteness. American Journal of Psychology, 1970, 83, 55-67. Messick, D. M. (Ed.) Mathematical thinking in behavioral sciences. Readings from Scientific American. San Francisco: Freeman, 1968. Meyer, D. On the representation and retrieval of stored semantic Information. Cognitive Psychology, 1970, 1, 242-300. Milgram, S. Behavioral study of obedience. Journal of Abnormal Psychology, 1963,67,371-378. Milgram, S. Issues in the study of authority: A reply to Baumrind. A merican Psychologist, 1964,19, 848-852. Milgram, S. Some conditions of obedience and disobedience to authority. Human Relations, 1965, 18, 57-75. Miller, G. A. Decision units in the perception of speech. IRE Transactions on Information Theory, 1962,8, 81-83. (a) Miller, G. A. Psychology: The science of mental life. New York: Harper, 1962. (b). Miller, G. A. The cybernetic approach. In G. A. Miller, The psychology of communication. New York: Basic Books, 1967. Reprinted in J. M. Foley, R. A. Lockhart, & D. M. Messick (Eds.), Contemporary readings in psychology. New York: Harper, 1970. (also Penguin). Miller, G. A., & McNeill, D. Psycholinguistics. In G. Lindzey and E. Aronson (Eds.), The handbook of social psychology. Vol. III. (2nd ed.) Reading, Mass.: Addison-Wesley, 1969. Miller, G. A., Galanter, E., & Pribram, K. H. Plans and the structure of behavior. New York: Holt, 1960. Miller, N. E. Comments on theoretical models illustrated by the development of a theory of conflict behavior. Journal of Personality, 1951, 20, 82-100. Miller, S. A., Shelton, J., & Flavell, J. H. A test of Luria's hypotheses concerning the development of verbal self-regulation. Child Development, 1970, 41, 651-665. Milne, A. A. Nów we are six. New York: Dutton, 1927. Milner, B., Corkin, S., & Teuber, H. L. Futher analysis of the hippocampal amnesia syndrome: 14-year followup study of H. M. Neuropsychologia, 1968, 6, 215-234. Minsky, M. (Ed.), Semantic information processing. Cambridge, Mass.: M.I.T. Press, 1968. Moray, N. Attention in dichotic listening: AfFective cues and the influence of instructions. Quarterly Journal of Experimental Psychology, 1959, 11, 56-60. Morgan, C. T. Physiological psychology. (3rd ed.) New York: McGraw-Hill, 1965. Morgenstern, O. The theory of games. Scientific American, 1949, 180 (5), 22-25. Mountcastle, V. B. (Ed.) Interhemispheric relations and cerebral dominance. Baltimore, Md.: Johns Hopkins Press. 1962. Mueller, C. G. Sensory psychology. Englewood Cliffs, N. J.: Prentice-Hall, 1965. Mueller, C. G., Rudolph, M., & the Editors of Time-Life Books. Lightand vision. New York: Time, Inc., 1969. Murdock, B. B., Jr. The retention of individual items. Journal of Experimental Psychology, 1961, 62,618-625. Murdock, B. B., Jr. The serial effect of free recal. Journal of Experimental Psychology, 1962,64, 482-488. Mussen, P. (Ed.) Handbook of child psychology. 2 vols. (Rev. ed.) New York: Wiley, 1970. Myers, R. E. Transmission of visual information within and between the hemispheres: A behavioral study. In V. B. Mountcastle (Ed.). Interhemispheric relations and cerebral dominance. Baltimore, Md: Johns Hopkins Press, 1962. Neisser, U. Visual search. Scientific American, 1964, 210 (6), 94-102. Neisser, U. Cognitive Psychology. New York: Appleton, 1967. Newell, A. Studies in problem solving: Subject 3 on the crypt-arithmetic task, DONALD plus GERALD equals ROBERT. Pittsburgh: Carnegie-Mellon Institute, 1967. Norman, D. A. Memory and attention: An introduction to human information processing. New York: Wiley, 1969. (a) Norman, D. A. Memory while shadowing. Quarterly Journal of Experimental Psychology, 1969, 21, 85-93. (b) Norman, D. A. (Ed.) Models of human memory. New York: Academic Press, 1970. Norman, D. A., & Rumelhart, D. E. In D. A. Norman (Ed.), A system for perception and memory. Models of human memory. New York: Academic Press, 1970. Norman, D. A., & Wickelgren, W. A. Short-term recognition memory for single digits and pairs of digits. Journal of Experimental Psychology, 1965, 70, 479-489. Olds, J. Pleasure centers in the brain. Scientific American, 1956,195 (4), 105-116. Olds, J., & Olds, M. Drives, rewards, and the brain. In F. Barron et al. (Eds.), New directions in psychology. Vol. 2. New York: Holt, 1965. Pantle, A. J., & Sekuler, R. W. Velocity-sensitive elements in human vision: Initial psychophysical evidence. Vision Research, 1968, 8, 445-450. Patterson, R. D. Noise masking of a change in residue pitch. Journal of the Acoustical Society of America, 1969,45, 1520-1524. Patton, R. M., Tanner, T. A., Jr., Markowitz, J., & Swets, J. A. (Eds.) Applications of research on human decision making. NASA-SP-209. Washington, D. C.: National Aeronautics and Space Administration, Office of Technology Utilization, 1970. Penrose, L. S., & Penrose, R. Impossible objects: A special type of illusion. British Journal of Psychology, 1958,49,31. Peterson, L. R. Short-term memory. Scientific American, 1966, 215 (7), 90-95. Peterson, L. R., & Peterson, M. Short-term retention of indiyidual items. Journal of Experimental Psychology. 1959, 58, 193-198. Philips, J. L., Jr. The origins of intellect: Piaget's theory. San Francisco: Freeman, 1969. Piaget, J. The language and thought of the child. New York: Harcourt, 1926. Piaget, J. Play, dreams, and imitation in childhood. New York: Norton, 1951 (Ist ed., 1945). Piaget, J. The origins of intelligence in children. New York: International Uniyersity Press, 1952. (Isted., 1936). Piaget, J. The construction of reality in the child. New York: Basic Books, 1954, (Ist ed., 1937) Piaget, J. Six psychological studies. In D. Elkind (Ed.), (translated by A. Tenzer.) New York: Random House, 1967, Published in paperback by Vintage Books, 1968. Piaget, J., & Inhelder B. The child's conception of spoce. London: Routledge and Kegan Paul, 1956. Pirenne, M. H. Visw and the eye. (2nd ed.) London: Associated Book Publishers, 1967. Pirenne, M. H. Optics, lainting, andphotography. London and New York: Cambridge Uniyersity Press, 1970. Polya, G. How to sohe it. Princeton, N. J.: Princeton Uniyersity Press, 1945. Polyak, S. The vertebrate visual system. Chicago: University of Chicago Press, 1957. Pomeranz, B., & Chung, S. H. Dendritic-tree anatomy codes from-vision physiology in tadpole retina. Science, 1970, 170, 983-984. Postman, L., & Philips, L. W. Short-term temporal changes in free recall. Quarterly Journal of Experimental Psychology, 1965, 17, 132-138. Premack, D. Language in chimpanzee? Science, 1971, 172, 808-822. Pritchard, R. M. Stabalized images on the retina. Scientific American, 1961, 204, 72-78. Rachlin, H. Introduction to modern behaviorism. San Francisco: Freemen, 1970. Raiffa, E. Decision analysis: Inroductory lectures on choices under uncertainty. Reading, Mass.: Addison-Wesley, 1968. Rapoport, A. Fights, games, and debates. Ann Arbon University of Michigan Press, 1960. Rapoport, A. The use and misuse of game theory. Scientific American, 1962, 207 (6), 108-118. Rasmussen, G. L., & Windle, W. F. (Eds.) Neural mechanisms of the auditory and vestibular systems. Springfield, 111.: Thomas, 1960. Ratliff, F. Inhibitory interaction and the detection and enhancement of contours. In W. A. Rosenblith (Ed.), Sensory communication. Cambridge, Mass.: M.I.T. Press, 1961. Ratliff, F. Mach bands: Quantitative studies on neural networks in the retina. San Francisco: Holden-Day, 1965. Ratliff, F., & Hartline, H. K. The response of limulus optic nerve fibers to pattems of illumination on the receptor mosaic. Journal of General Physiology, 1959, 42, 1241-1255. Reddy, D. R. Phoneme grouping for speech recognition. Journal of the Acoustical Society of America, 1967, 41, 1295-1300. (a) Reddy, D. R. Computer recognition of connected speech. Journal of the Acoustical Society of America, 1967, 42, 329-347. (b) Reitman, J. S. Mechanisms of forgetting in short-term memory. Cognitive Psychology, 1971, 2, 185-195. Restle, F. Mathematical models and thought: A search for stages. In J. F. Voss (Ed.), Approaches to thought. Columbus, Ohio: Charles E. Merrill, 1969, Reynolds, G. S. A primer of operant conditioning. Glenyiew, 111.: Scott, Foresman, 1968. Richardson, L. F., & Ross, J. S. Loudness and telephone current. Journal of General Psychology, 1930,3,288-306. Riggs, L. A., Ratliff, F., Cornsweet, J. C., & Cornsweet, T. N. The disappearance of steadily-fixated objects. Journal of the Optical Society of America, 1953, 43, 495-501. Riley, B. See de Sausmarez, M. (1970). Ripps, H., & Weale, R. A. Color vision. Annual Review of Psychology, 1969, 20, 193-216. Robinson, D. A. Eye movement control in primates. Science, 1968, 161, 1219-1224. Robinson, D. W., & Dadson, R. S. A redetermination of the equal-loudness relation for pure tones. British Journal of Applied Physics, 1956,7, 166-181. Rokeach, M. The three Christs of Ypsilanti. New York: Alfred A. Knopf, 1964. Rosenblith, W. A. (Ed) Sensory communication. Cambridge, Mass.: M.I.T. Press, 1961. Rosner, B. S. Brain functions. Annual Review of Psychology, 1970, 21, 555-594. Rumelhart, D. E. A multicomponent theory of the perception of briefly exposed visual displays. Journal of Mathematical Psychology, 1970,7, 191-218. Rumelhart, D. E., Lindsay, P. H., & Norman, D. A. A process model of long-term memory. In E. Tulving and W. Donaldson (Eds.), Organization of memory. New York: Academic Press, 1972. Saltz, E. The cognitive bases of human learning. Homewood, 111,: Dorsey Press, 1971. Schachter, S. Cognitive effects on bodily functioning. In D. C. Glass (Ed.), Studies of obesity and eating in neurophysiology and emotion. New York: Rockefeller Uniyersity Press, 1967. Schachter, S. Emotion, obesity, and crime. New York: Academic Press, 1971. Schachter, S., & Singer, J. E. Cognitive, social and physiological determinants of emotional state. Psychological Review, 1962, 69, 379-399. Schachter, S., & Wheeler, L. Epinephrine chlorpromazine and amusement. Journal of Abnormal Psychology, 1962,65, 121-128. Schade, J. P., & van Groenigen, W. B. Structural organization of the human cerebral cortex: Maturation of the middle frontal gyrus. Acta Anatomica, 47, 74-111. Schank, R. A. Conceptual dependency representation for a computer oriented semantics. AI Memo-83. Stanford, Calif.: Computer Science Department, Stanford University, 1969. (Also, Cognitive Psychology, 1972.) Scharf, B. Critical bands. In J. V. Tobias (Ed.), Foundations of modern auditory theory. Vol. I. New York: Academic Press, 1970. Scheerer, M. Problem solving. Scientific American, 1963, 204(4), 118-128. Schelling, T. C. The strategy of conflict. Cambridge, Mass.: Harvard University Press, 1963. Schlesinger, A. M., Jr. A thousand days: John F. Kennedy in the White House. Boston: Houghton, 1965. Schmitt, F. O. (Ed.) The neurosciences: Second study program. New York: Rockefeller University Press, in press. Schneider, A. M. Retention under spreading depression: A generalization-decrement phenomenon. Journal of Comparative O- Physiological Psychology, 1966, 62, 317-319. Schneider, A. M. A control of memory by spreading cortical depression: A case for stimulus control. Psychological Review, 1967, 74, 201-215. Schneider, A. M., & Ebbesen, E. Interhemispheric transfer of lever pressing as stimulus generalization of the effects of spreading depression. Journal of the Experimental Analysis of Behavior, 1964, 7, 350. Schneider, A. M., & Hamburg, M. Interhemispheric transfer with spreading depression: A memory transfer or stimulus generalization phenomenon? Journal of Comparative Physiological Psychology, 1966,62, 133-136. Schneider, A. M., & Kay, H. Spreading depression as a discriminative stimulus for lever pressing. Journal of Comparative 6 Physiological Psychology, 1968,65, 149-151. Schneider, A. M., & Sherman, W. Amnesia: A function of the temporal relation of foot shock to electroconvulsive shock. Science, 1968. 159, 219-221. Schneider, G. E. Contrasting visuomotor functions of tectum and cortex in the golden hamster. Psychologische Forschung, 1967, 1968, 31, 52-62. Schneider, G. E. Two visual system. Science, 1969,163, 895-902. Schurnecht, H. F. Neuroanatomical correlates of auditory sensitivity and pitch discrimination in the cat. In G. L. Rasmussen and W. F. Windle (Eds.), Neural mechanisms of the auditory and vestibular systems. Springfield, 111.: Thomas, 1960. Scoville, W. B. Amnesia after bilateral mesial temporal-lobe excision: Introduction to case H. M. Neuropsychologia, 1968, 6, 211-213. Seitz, W. C. The responsive eye. New York: Museum of Modern Art, 1965. Sekuler, R. W., & Ganz, L. Aftereffect of seen motion with a stabilized retinal image. Science, 1963, 139, 419-420. Selfridge, O. Pandemonium: A paradigm for learning. In Symposium on the mechanization of thought processes. London: HM Stationery Office, 1959. Selfridge, O., & Neisser, U. Pattern recognition by machine. Scientific American, 1960, 203 (2), 60-68. Seligman, M. E. P. Can we immunize the weak? Psychology Today, June 1969, 42-44. Seligman, M. E. P. On the generality of the laws of learning. Psychological Review, 1970, 77, 406-118. Seligman, M. E. P., Maier, S. F., & Solomon, R. L. Unpredictable and uncontrollable events. In F. R. Brush (Ed.), Aversive conditioning and learning. New York: Academic Press, 1969. Sellin, T., & Wolfgang, M. E. The measurement of delinquency. New York, Wiley, 1964. Selye, H. The story of the adaptation syndrome. Montreal: Acta, 1952. Sidman, M., Stoddard, L. T., & Mohr, J. P. Some additional quantitative observations of immediate memory in a patient with bilateral hippocampal lesions. Neuropsycholugia, 1968,6, 245-254. Sidowski, J. B. Experimental methods and instrumentation in psychology. New York: McGraw-Hill, 1966. Siegel, S., & Fouraker, L. E. Bargaining and group decision making: Experiments in bilateral monopoly. New York: McGraw-Hill, 1960. Simon, H. A, & Newell, A. Human problem sohing. Englewood Cliffs, N. J.: Prentice Hali, 1971. Simon, H. A., & Simon, P. A. Trial and error search involving difficult problems: Evidence from the game of chess. Behavioral Science, 1962, 7, 425-429. Singer, H., & Ruddell, R. B. (Eds.) Theoretical models and processes of reading. Newark, Del.: International Reading Association, 1970. Skinner, B. F. Science and human behavior. New York: Macmillan, 1953. Skinner, B. F. Cumulative record. (Rev. ed.) New York: Appleton, 1961. Slobin, D. I. (Ed.) The ontogenesis of grammar New York: Academic Press, 1971. Smedslund, J. The acquisition of substance and weight in children. I. Introduction. Scandinavian Journal of Psychology, 1961, 2, 11-20 (a) II. II. External reinforcement of conservation of weight and of the operations of addition and subtraction. Scandinavian Journal of Psychology, 1961, 2, 71-84. (b) III. Extinction of conservation of weight acquired "normally" and by means of empirical controls on a balance scale. Scandinavian Journal of Psychology, 1961, 2, 85-87. (c) IV. An attempt at extinction of the usual components of the weight concept. Scandinavian Journal of Psychology, 1961,2, 153-155. (d) V. Practice on conflict situations without external reinforcement. Scandinavian Journal of Psychology, 1961, 2, 156-160. (e) VI. Practice on continuous versus discontinuous materiał in conflict situations without external reinforcement. Scandinavian Journal of Psychology, 1961, 2, 203-210. (f) Smith, M. P., & DufTy, M. The effects of intragastric injection of various substances on subsequent bar pressing. Journal of Comparative 6- Physiological Psychology, 1955, 48, 387-391. Soby, J. T. Rene Magńtte. New York: Museum of Modern Art, 1965. Sperling, G. Information in a brief visual presentations. Unpublished doctoral dissertation, Harvard University, 1959. Sperling, G. The information available in brief visual presentations. Psychological Monographs, 1960, 74, (Whole No. 11). Sperling, G., & Speelman, R. G. Acoustic similarity and auditory short-term memory experiments and a model. In D. A. Norman (Ed.), Models ufhuman memury. New York: Academic Press, 1970. Sperling, H. G., & Harwerth, R, S. Red-green cone interactions in the increment-threshold spectral sensitivity of primates, Science, 1971, 172, 180-184. Sperry, R. W. Cerebral organization and behavior. Science, 1961, 133, 1749. Sperry, R. W. Hemisphere disconnection and unity in conscious awareness. American Psychologist, 1968,23,723-733. Spielberger, C. D. (Ed.) Anxiety and behavior. New York: Academic Press, 1966. Spinelli, D. N. Receptive field organization of ganglion cells in the cat's retina. Experimental Neurology, 1967, 19, 291-315. Spock, B. Baby and child care. New York: Pocket Books, 1957. Squire, L. R., & Barondes, S. H. Inhibitions of cerebral protein on RNA synthesis and memory. In J. Gaito (Ed.), Macromolecules and behavior. (2nd ed.) New York: Appleton, in press. Staddon, J. E. R., & Simmelhag, V. L. The "superstition" experiment: A reexamination of its implications for the principles of adaptive behavior. Psychological Review, 1971, 78, 3-43. Stanley-Jones, D. The biological origin of love and hate. In M. Arnold (Ed.), Feelings and emotions. New York, Academic Press, 1970. Sterling, P., & Wickelgren, B. G. Visual receptive fields in the superior colliculus of the cat. Journal of Neurophysiulogy, 1969,32, 1-15. Stevens, C. F. Neuruphysiology: A primer. New York: Wiley, 1966. Stevens, S. S. The attributes of tones. Proceedings of the National Academy of Science of the United States of America, 1934, 20, 457-459. Stevens, S. S. The relation of pitch to intensity. Journal of the Acoustical Sudety of America, 1937, 8, 191-195. Stevens, S. S. (Ed.) Handbook of experimental psychology. New York: Wiley, 1951. Stevens, S. S. The direct estimation of sensory magnitude-loudness. American Journal of Psychology, 1956, 69, 1-25. Stevens, S. S. The psychophysics of sensory function. In W. A. Rosenblith (Ed.), Sensory communication. Cambridge, Mass.: M.l.T. Press, 1961. (a) Stevens, S. S. To honor Fechner and repeal his law. Science, 1961,133, 80-86. (b) Stevens, S. S. A metric for the social consensus. Science, 1966, 151, 530-541. (a) Stevens, S. S. On the operation known as judgment. American Scientist, 1966, 54, 385-401. (b) Stevens, S. S. Power-group transformations under glare, masking and recruitment. Journal of the Acoustical Society of America, 1966, 39, 725-735. (c) Stevens, S. S. Matching functions between loudness and ten other continua. Perception Psychophysics, 1966, 1 (1), 5-8. (d) Stevens, S. S. Ratio scales of opinion. In D. K. Whitla (Ed.), Handbook of measurement and assessment in behavioral sciences. Reading, Mass.: Addison-Wesley, 1968. Stevens, S. S., & Davis, H. Hearing: Its psychology and physiology. New York: Wiley, 1938. Stevens, S. S., Warshofśky, F., & the Editors of Life. Sound and hearing. New York: Time, Inc., 1965. Stromeyer, C. F. Further studies of the McCollough effect. Perception and Psychophysics, 1969,6, 105-110. Stromeyer, C. F., & Mansfield, R. J. Colored aftereffects produced with moving images. Perception 6 Psychophysics, 1970,7, 108-114. Suppes, P., & Zinnes, J. L. Basic measurement theory. In R. D. Luce, R. R. Bush, & E. Galanter (Eds.), Handbook of Mathematical Psychology. Vol. I. New York: Wiley, 1963. Swets, J. A. Information retrieval systems. Science, 1963, 141, 242-250. Swets, J. A. (Ed.) Signal detection and recognition by human ubservers. New York: Wiley, 1964. Sylvester, D. Magritte. Catalogue of an exhibition of paintings by Rene Magritte, 1898-1967. London: The Arts Council of Great Britain, 1969. Talland, G. A. Deranged memory. New York: Academic Press, 1965. Talland, G. A. Disorders of memory and learning. Harmondsworth, Middlesex, England: Penguin Books, 1968. Talland, G. A., & Waugh, N. (Eds.) The pathology of memory. New York: Academic Press, 1969. Teitelbaum, P. The biology of drive. In G. C. Quartorn, T. Melnechuk, & F. O. Schmidt (Eds.), The neurosciences. New York: Rockefeller University Press, 1967. Teitelbaum, P., & Epstein, A. N. The lateral hypothalmic syndrome: Recovery of feeding and drinking after lateral hypothalmic lesions. Psychological Review, 1962, 69, 74-90. Terrace, H. S., & Stevens, S. S. The quantification of tonal volume. American Journal of Psychology, 1962, 75, 596-604. Teuber, H. L. Perception. In J. Field, H. W. Magoun, & V. E. Hali (Eds.), Handbook of physiology, Section 1: Neural physiology. Vol. 3. Baltimore: Wiliams & Wilkins, 1960. Teuber, H. L., Milner, B., & Vaughan, H. G., Jr. Persistent anterograde amnesia after stab wound of the basal brain. Neuropsychologia, 1968, 6, 267-282. Thornton, J. W., & Jacobs, P. D. Learned helplessness in human subjects. Journal of Expeńmental Psychology, 1971, 87, 367-372. Thorp, E. O. Beat the dealer: A winning strategyfor the game of twenty-one. New York: Random House, 1966. Tobias, J. V. (Ed.) Foundations of modern auditory theory. Vol. I New York: Academic Press, 1970. Treisman, A. M. Strategies and models of selective attention. Psychological Review, 1969, 76, 282-299. Trevarthen, C. B. Two mechanisms of vision in primates. Psychologische Forschung, 1968, 31, 299-337. Tulving. E., & Donaldson, W. (Eds.) Organization of memory. New York: Academic Press, 1972. Tversky, A. Intransitivity of preferences. Psychological Review, 1969, 76, 31-48. Tversky, A., & Kahneman, D. The belief in the law of smali numbers. Psychological Bulletin, in press. Uhr, L. (Ed.) Pattern recognition. Theory, experiment, computer simulations, and dynamie models of form perception and discovery. New York: Wiley, 1966. Ungar, G. Chemical transfer of learning; its stimulus specificity. Federation Proceedings, Federation of American Societies for Experimental Biology, 1966, 35, 109. Ungar, G., & Oceguera-Navarro, C. Transfer of habituation by materiał extracted from brain. Nature (London), 1965, 207, 301. van Bergeijk, W. A. Variation on a theme of Bekesy: a model of binaural interaction. Journal of the Acoustical Society of America, 1962,34, 1431-1437. van den Brink, G. Two experiments on pitch perception: Displacusis of harmonie AM signals and pitch of inharmonic AM signals. Journal of the Acoustical Society of America, 1970, 48, 1355-1365. van der Velden, H. A. Over het aantal lichtquanta dat nodig is voor een lichtprikkel bij het meselijk oog. Physica (Utrecht), 1944, 11, 179. van der Velden, H. A. The number of quanta necessary for the perception of light of the human eye. Ophthalmologica, 1946, 111, 321. Varela, J. A. Psychological Solutions to Sucial Problems. New York: Academic Press, 1971. Vasarely, V. Vasarely. Translated by H. Chevalier. Neuchatel, Switzerland: Editions du Griffon Neuchatel, 1965. Verheijen, F. J. A simple after image method demonstrating the involuntary multi-directional eye movements during fixation. Optica Acta, 1961, 8, 309-311. Vernon, M. D. (Ed.) Experiments in visual perception. Harmondsworth, Middlesex, England: Penguin Books, 1966. Voss, J. F. (Ed.) Approaches to thought. Columbus; Ohio: Charles F. Merrill, 1969. Wagner, H. G., MacNichol, E. F., Jr., & Wolbarsht, M. L. The response properties of single ganglion cells in the goldfish retina. Journal of General Physiology, 1960, 43, 45-62. Wald, G. The receptors for human color vision. Science, 1964, 145, 1007-1017. Warren R. M., & Warren, R. P. Helmholtz on perception: Its physiology and development. New York: Wiley, 1968. Warren, R. M.,&, Warren R. P. Auditory illusionsandconfusions. Scientific American, 1970,223, 30-36. Warrington, E. K., & Weiskrantz, L. An analysis of short-term and long-term memory defects in man. In J. A. Deutsch (Ed.), Physiological basis of memory. New York: Academic Press, to be published. Wason, P. C., & Johnson-Laird, P. N. (Eds.) Thinking and reasoning. Harmondsworth, Middlesex, England: Penguin Books, 1969. Wathen-Dunn, W. (Ed.) Modelsfor the perception of speech and visualform. Cambridge, Mass.: M.I.T. Press, 1967. Webb, W. B. Sleep: An experimental approach. New York: Macmillan 1968. Weber, R. J., & Castleman J. The time it takes to imagine. Perception 6- Psychophysics, 1970, 8, 165-168. Weiskrantz, L. Contour discrimination in a young monkey with striate cortex ablation Neuropsychologia, 1963, l, 145-164. Weisstein, N. What the frog's eye te lis the human brain: Single celi analyzers in the human visual system. Psychological Review, 1969, 72, 157-176. Weizenbaum, J. Contextual understanding by computers. In P. A. Kolers and M. Eden (Eds.), Recognizingpatterns: Studies in livingand automatic systems. Cambridge, Mass.: M.I.T. Press, 1968. Wertheimer, M. Productive thinking. New York: Harper, 1945. Wever, E. G. Theory of hearning. New York: Dover Publications, 1970. White, B. W., Saunders, F. A., Scadden, L., Bach-y-Rita, P., & Collins, C. C. Seeing with the skin. Perception Psychophysics, 1970,7,23-27. Whitfield, I. C. The auditory pathway. London: Arnold, 1967. Whitfield, I. C., & Evans E. F. Responses of auditory cortical neurons to stimuli of changing frequency. Journal of Neurophysiology, 1965, 28, 655-672. Whitty, C. W. M, & Zangwill, O. L. (Eds.) Amnesia. London: Butterworth, 1966. Wickelgren, B. G., & Sterling, P. Influence of visual cortex on receptive fields in the superior colliculus of the cat. Journal of Neurophysiology, 1969, 32, 16-23. Wickelgren, W. A. Sparing of short-term memory in an amnesic patient: Implications for strength theory of memory. Neurupsychologia, 1968, 6, 235-244. Wickelgren, W. A. Multitrace strength theory. In D. A. Norman (Ed.), Models of human memory. New York: Academic Press, 1970. Wickelgren, W. A., & Norman, D. A. Strength models and serial position in short-term recognition memory. Journal of Mathematical Psychology, 1966, 3, 316-347. Williams, J. The complete strategist. New York: McGraw-Hill, 1954. Williams, M. Memory disorders associated with electroconvulsive therapy. In C. W. M. Whitty & O. L. Zangwill (Eds.), Amnesia. London: Butterworth, 1966. Winograd, T. Procedures as a representation for data in a computer program for understanding natural language. Unpublished doctoral dissertation, Department of Mathematics, Massachusetts Institute of Technology, 1970. Winograd, T. A program for understanding natural language. Cognitive Psychulogy, 1972, 3. Woodworth, R. S. Experimental psychology. New York: Holt, 1938. Woodworth, R. S., & Schlosberg, H. Experimental psychology. New York: Holt, 1954. Wooldridge, D. E. The machinery of the brain. New York: McGraw-Hill, 1963. Wyszecki, G. W., & Stiles, W. S. Color science, concepts and methods, quantitative data and formulas. New York: Wiley, 1967. Young, P. T. Motivation and emotion. New York: Wiley, 1961. Zelman, A., Kabat, L., Jacobson, R., & McConnell, J. V. Transfer of training through injection of "conditioned" RNA into untrained planarians. Worm Runner's Digest, 1963, 5, 14-19. Zimbardo, P., & Ebbesen, E. Influencing attitudes and changing behavior. Reading, Mass.: Addison-Wesley, 1969. Zwicker, E., & Scharf, B. Model of loundness summation. Psychological Review, 1965, 72, 3-26. Zwislocki, J. Analysis of some auditory charactenstics. In R. D. Luce, R. R. Bush, and E. Galanter (Eds.), Handbook of mathematical psychology, Vol. III. New York: Wiley, 1965.