12126
Szczegóły |
Tytuł |
12126 |
Rozszerzenie: |
PDF |
Jesteś autorem/wydawcą tego dokumentu/książki i zauważyłeś że ktoś wgrał ją bez Twojej zgody? Nie życzysz sobie, aby podgląd był dostępny w naszym serwisie? Napisz na adres
[email protected] a my odpowiemy na skargę i usuniemy zabroniony dokument w ciągu 24 godzin.
12126 PDF - Pobierz:
Pobierz PDF
Zobacz podgląd pliku o nazwie 12126 PDF poniżej lub pobierz go na swoje urządzenie za darmo bez rejestracji. Możesz również pozostać na naszej stronie i czytać dokument online bez limitów.
12126 - podejrzyj 20 pierwszych stron:
PROBLEMY WSPÓŁCZESNEJ NAUKI TEORIA I ZASTOSOWANIA
INFORMATYKA
Ryszard S. Choraś
KOMPUTEROWA WIZJA
Metody interpretacji i identyfikacji obiektów
MÓZG'
NERW
OPTYCZNY
KOMPUTER
KAMERA
Akademicka Oficyna Wydawnicza EXIT
Warszawa 2005
KOMPUTEROWA WIZJA
METODY INTERPRETACJI I IDENTYFIKACJI OBIEKTÓW
Przetwarzanie obrazów i rozpoznawanie obrazów są względnie zamkniętymi obszarami zastosowania komputerów, które wspólnie definiują pole komputerowej wizji. Jest pewna analogia pomiędzy systemem komputerowej wizji i systemem wzrokowym człowieka. Komputerowe przetwarzanie obrazu jest analogiem procesu, który ma miejsce w ludzkim oku i nerwie optycznym. Rozpoznawanie obrazu reprezentuje w większym stopniu percepcję wizualną, która ma miejsce w ludzkim mózgu.
Zadania komputerowej wizji przekraczają zadania rozpoznawania obrazów. Tylko niewielka ich część może być opisana przez klasyczny układ rozpoznawania, kiedy zadany jest skończony alfabet klasyfikacji, wystarczająco prosty model opisu klasyfikowanego obiektu (obrazu) i znaleziono regułę decyzyjną, odnoszącą obraz do jednej z wcześniej zadanych klas.
Tworzone przez człowieka modele systemów analizy i interpretacji informacji obrazowej oparte sana tym co wiadomo o systemie wzrokowym ludzi (HVS). W książce przedstawiono następujące zagadnienia:
• Otrzymywanie (akwizycję) obrazu,
• Przetwarzanie wstępne obrazu cyfrowego,
• Analizę obrazu,
• Rozpoznawanie obrazu.
KOMPUTEROWA WIZJA
Metody interpretacji i identyfikacji obiektów
PROBLEMY WSPÓŁCZESNEJ NAUKI TEORIA I ZASTOSOWANIA
INFORMATYKA
Edytor serii: Leonard Bole
Pamięci Ojca Poświęcam
II
Przedmowa
..Lecz wy się uczcie patrzeć, a nie
gapić..
Bertold Brecht Kariera Artura Ui
Vere scire est per causas scire - Prawdziwa wiedza jest wiedzą przyczynową
Zainteresowanie zagadnieniami komputerowej wizji wynika z rozwoju szeroko pojętych zagadnień obejmujących informatykę i teorię sterowania i ich wymagań dotyczących dokładności przetwarzanych informacji.
Komputerowa wizja (lub jak sugerowało to kilka osób komputerowe widzenie albo komputerowe postrzeganie rozwija się bardzo intensywnie przez ostatnie dziesięciolecia. Jednak wiele fundamentalnych pytań ciągle wymaga odpowiedzi i opracowania sposobów reprezentacji informacji przestrzennej.
Książka jest wynikiem lat pracy w dziedzinie przetwarzania obrazów. Nie jest przeglądem prac opublikowanych przez innych Autorów, ale raczej wyborem metod i zagadnień rozwijanych przez Autora.
Każdy kto podejmuje trud przedstawienia i dotarcia do Czytelników za pośrednictwem książki zdaje sobie sprawę jak ważną rolę
III
odgrywa wsparcie ze strony Rodziny. Dziękuję Żonie za wyrozumiałość i cierpliwość, Córce która mobilizowała mnie do zakończenia prac nad książką oraz Synowi który był pierwszym czytelnikiem i krytykiem książki.
Podziękowania należą się życzliwym krytykom książki spośród moich kolegów oraz Recenzentowi którego uwagi przyczyniły się usunięcia wielu usterek maszynopisu.
Bydgoszcz, maj, 2005 Ryszard S. Choraś
Spis treści
1 Wprowadzenie w problematykę komputerowej wizji 1
1.1 Cyfrowe przetwarzanie obrazów 1
1.2 Ogólna charakterystyka systemów komputerowej wizji 1
1.3 Systemy komputerowej wizji w robotyce 5
2 System wzrokowy człowieka 11
2.1 Wprowadzenie 11
2.2 Model systemu wzrokowego 20
3 Akwizycja obrazu 25
3.1 Wprowadzenie 25
3.2 Przetworniki obrazowe optyczno-elektryczne .... 25
3.3 Geometria systemu przetwornika obrazu 31
3.4 Cyfrowa reprezentacja obrazów 34
3.4.1 Próbkowanie obrazu 35
3.4.2 Kwantowanie obrazu 39
3.4.3 Matematyczna reprezentacja obrazu cyfrowego 42
4 Przetwarzanie wstępne obrazu cyfrowego 47
4.1 Histogram obrazu i jego modyfikacje 47
4.2 Transformacja skali jaskrawości obrazu 54
4.2.1 Metoda liniowego dopasowania jaskrawości 57
4.2.2 Metoda transformacji logarytmicznej . 58
4.2.3 Metoda transformacji wykładniczej . . 59
4.2.4 Metoda modyfikacji histogramu .... 59
4.2.5 Zmodyfikowane transformacje: logarytmiczna i wykładnicza 60
4.3 Filtracja obrazu 61
VI
Spis treści
4.3.1 Filtry adaptacyjne 65
4.3.2 Filtry wygładzające 68
4.4 Wykrywanie zmian jaskrawości 73
4.5 Segmentacja obrazu 85
4.5.1 Matematyczne sformułowanie zadania segmentacji 86
4.5.2 Segmentacja metodą wydzielania granic obszarów 88
4.5.3 Segmentacja metodą rozmieszczenia punktów obrazu 89
5 Analiza obrazu 95
5.1 Reprezentacja obrazu na podstawie jaskrawości -cechy histogramu 95
5.2 Właściwości topologiczne obrazów 98
5.3 Reprezentacja linii konturowych i granic obiektów 104
5.3.1 Lokalne elementy krzywej 104
5.3.2 Krzywa a - s 110
5.3.3 Reprezentacja konturu obiektu za pomocą współczynników Fouriera .... 112
5.3.4 Interpolacja i aproksymacja krzywej konturu 113
5.3.5 Transformacja Hougłra • • • 117
5.4 Detekcja punktów charakterystycznych obiektu . . 124
5.5 Reprezentacja obszarów obiektów 128
5.5.1 Reprezentacja obszaru za pomocą długości serii elementów 128
5.5.2 Projekcje 129
5.5.3 Reprezentacja hierarchiczna za pomocą drzew czwórkowych i piramidy obrazów 130
5.6 Tekstury i parametry opisu tekstur 133
5.7 Momenty geometryczne 140
5.8 Morfologiczne operacje przetwarzania obrazów . . 147
5.8.1 Morfologiczne operacje przetwarzania obrazów binarnych 147
5.8.2 Morfologiczne operacje przetwarzania obrazów o wielu poziomach jaskrawości 159
5.8.1
6 Rozpoznawanie obrazów163
Spis treści
VII
• • 163
6.1 Wprowadzenie g
6.2 Klasyfikatory odległościowe ? •
6.2.1 Klasyfikator najmniejszej odległości . . HU
6.2.2 K-najbliższych sąsiadów
6.3 Klasyfikatory statystyczne
6.3.1 Klasteryzacja
6.4 Selekcja cech ' n
197
6.4.1 Wybór nx cech z n początkowych cech i"u
6.4.2 Wybór nx cech poprzez liniową kombinację n cech oryginalnych
6.4.3 Metoda PCA j°J
6.4.4 LDA
6.4.1
Rozdział 1
Wprowadzenie w problematykę komputerowej wizji
1.1 Cyfrowe przetwarzanie obrazów
Cyfrowe przetwarzanie obrazów charakteryzuje się obecnie intensywnym rozwojem różnych metod i zastosowań, co ma bezpośredni związek ze zwiększeniem szybkości i efektywności maszyn cyfrowych i ulepszeniem technologii przetwarzania sygnałów. Przetwarzanie obrazów odgrywa istotną rolę w wielu dziedzinach nauki i techniki (10], [80], [41], [42]. Jest stosowane przy cyfrowej transmisji obrazów satelitarnych i wideotelefonii, przy uzyskiwaniu obrazów o wysokiej rozdzielczości oraz jakości za pomocą mikroskopów elektronowych, przy automatycznej klasyfikacji i teledetekcji, przy automatycznym wykreślaniu map na podstawie zdjęć lotniczych, przy wykrywaniu wad i uszkodzeń części maszynowych na podstawie rentgenogramów przemysłowych itd.. Tworzone są systemy przetwarzania obrazów realizujące analizę scen widzianych przez "oko" robota przemysłowego i umożliwiające kontrolę jego operacji. Przedstawiona lista zastosowań jest oczywiście niepełna i daje tylko pewne wyobrażenie o możliwościach wykorzystania cyfrowego przetwarzania obrazów. Przetwarzanie obrazów występuje w każdym z przedstawionych w Tablicy 1.1 zagadnień.
1.2 Ogólna charakterystyka systemów komputerowej
wizji
Przetwarzanie obrazów i rozpoznawanie obrazów są względnie zamkniętymi obszarami zastosowania komputerów, które wspólnie definiują pole komputerowej wizji. Jest pewna analogia pomiędzy systemem
2
Rozdział 1. Wprowadzenie w problematykę komputerowej wizji
Tablica 1.1: Przetwarzanie obrazów i zagadnienia pokrewne
Obraz
Opis
Obraz
Przetwarzanie obrazów Komputerowa wizja
Rozpoznawanie obrazów Komputerowa wizja
Opis
Grafika komputerowa
Transformacja opisu
komputerowej wizji i systemem wzrokowym człowieka. Komputerowe przetwarzanie obrazu jest analogiem procesu, który ma miejsce w ludzkim oku i nerwie optycznym. Rozpoznawanie obrazu reprezentuje w większym stopniu percepcję wizualną, która ma miejsce w ludzkim mózgu. Proces ten można przedstawić:
Oko -? Nerw optyczny -? Mózg
Kamera -? Przetwornik A/C -> Komputer
Otrzymywanie -? Transmisja -? Interpretacja
obrazu
Komputerowa wizja obejmuje zagadnienia i metody rozwiązania całego szeregu problemów naukowych takich jak np. psychologiczne problemy percepcji wzrokowej, cyfrowe przetwarzanie i analiza obrazu, architektura systemów ekspertowych i technologia ich opracowania, inżynieria wiedzy. Każdy z wymienionych problemów przedstawia samodzielny obszar badań, wykorzystujący swoją metodologię rozwiązywania zadań a także swoje klasy metod i algorytmów.
Jakie są zadania komputerowej wizji?
Praktycznie wszystkie zadania komputerowej wizji sprowadzają się do rozwiązania następujących problemów:
- określenia jakie obiekty znajdują się w polu widzenia użytkownika,
1,2. Ogólna charakterystyka systemów komputerowej wizji 3
gdzie te obiekty są położone,
dlaczego dane obiekty znajdują się w polu widzenia tj. jaka jest oglądana sytuacja w całości.
Zadania komputerowej wizji przekraczają zadania rozpoznawania
obrazów. Tylko niewielka ich część może być opisana przez klasyczny
układ rozpoznawania, kiedy zadany jest skończony alfabet klasyfikacji,
wystarczająco prosty model opisu klasyfikowanego obiektu (obrazu) i
eziono regułę decyzyjną, odnoszącą obraz do jednej z wcześniej
Hlanych klas. Częściej spotykamy sytuację, kiedy wyznaczenie skończonego alfabetu klasyfikacji jest trudne a ustalenie zadanego modelu
opisu obrazu co najmniej problematyczne czyli, że dokonanie syntezy
reguły decyzyjnej w przytoczonym wyżej rozumieniu jest niemożliwe.
Część autorów, poprzestaje na przekonaniu, że rozpoznawanie obiektu
sprowadza się do identyfikacji jego obrazu z zakodowanym wzorcem.
Jednak rozpoznawanie (z funkcjonalnego punktu widzenia) to proces
bardziej złożony. Aby rozpoznać obiekt (w pełni), czyli zrozumieć jego
znaczenie dla swojego działania należy:
- spostrzec go i zidentyfikować,
- uświadomić sobie relacje funkcjonalne i znaczeniowe między obiektem a innymi elementami koła spostrzeżeniowego,
- uświadomić sobie relacje między obiektem a niektórymi treściami
swego doświadczenia,
- wzbudzić dodatkowe formy aktywności poznawczej ułatwiające rozpoznanie np. eliminujące czynniki zakłócające proces,
- ustalić przedział tolerancji stopnia niezgodności obrazu psychicznego z wzorcem,
- skojarzyć obraz psychiczny z nazwą obiektu.
Rozwiązanie kompleksowych i złożonych zadań pojmowania obrazu nie jest możliwe, jeżeli w każdym konkretnym momencie czasu mamy do czynienia tylko z cyfrowym zbiorem N x N elementów obrazu. Rozwiązanie tych zadań wymaga zgromadzenia w pamięci systemu różnorodnej informacji, a mianowicie:
- o warunkach uzyskiwania obrazów o charakterze otoczenia i ośrodka
rozprzestrzeniania wideosygnału (np. kanału),
4 Rozdział 1. Wprowadzenie w problematykę komputerowej wizji
- o przedmiotach w obrazie (np. możliwe typy obiektów i ich jaskrawości, geometryczne właściwości itp.),
- o doświadczeniach z zakresu przetwarzania obrazu danej klasy (wiedza o najbardziej efektywnych algorytmach i ich parametrach).
Pełne, bogate w szczegóły odwzorowanie obrazu przechowywane jest w pamięci ultrakrótkotrwałej, nazywanej też pamięcią ikoniczną. Odwzorowanie takie przechowywane jest w pamięci ikonicznej w celu jego wstępnego przetwarzania umożliwiającego identyfikację. Identyfikacja wzrokowa ma charakter symultaniczny. W ramach wstępnego przetwarzania zostają wyodrębnione poszczególne elementy odwzorowania ze względu na ich lokalizację przestrzenną, a także kształt, wielkości i barwę. W celu identyfikacji wyodrębnione elementy odwzorowania zostają poddane porównaniu z zawartym w pamięci wzorcem. Aby było to możliwe muszą przybrać formę wzorca, z którym mają być porównane, czyli muszą być przetransformowane w odpowiedni kod - na tym etapie następuje pewna strata informacji. Istnieją dwa sposoby stwierdzenia identyczności - tożsamość, czyli stwierdzenie braku różnic, oraz ocena stopnia podobieństwa.
Człowiek oglądający obraz nie tylko zapamiętuje odbieraną informację o obrazie, ale wykorzystując odpowiednie obszary mózgu dokonuje jego interpretacji. Interpretacja dokonywana jest nie tylko na odbieranym sygnale obrazu, ale też na wcześniej znanych wiadomościach o tym co obraz powinien sobą przedstawiać. Wiadomości te uzyskuje się z wcześniej odbieranych i przechowywanych w pamięci informacji o obrazie. Porównanie informacji o obrazie z informacją już znajdującą się w pamięci umożliwia interpretację obrazu. Porównanie nie powinno być połączone z pełnym przeglądem informacji znajdującej się w pamięci, gdyż powodowałoby to wydłużenie procesu interpretacji. Unikalność procedury interpretacji - tzw. procedury: analizy przez syntezę - polega na tym, że możliwe jest analizowanie tylko tego fragmentu obrazu, który jest niezbędny do jednoznacznej interpretacji obrazu.
Potwierdzeniem prawidłowości modelu analizy przez syntezę są eksperymentalne fakty uzyskane w procesie interpretacji danych przez człowieka. Człowiek przyjmuje do analizy tylko tyle danych, ile jest niezbędnych do potwierdzenia hipotezy odnośnie obrazu i uzupełnia brakującą informację o obrazie danymi ze swojej wewnętrznej pamięci,
I Systemy komputerowej wizji w robotyce 5
W której zawarty jest model obrazu.
Procedura interpretacji umożliwia:
nowej informacji,
PI zapamiętywanie w formie pewnych pojęć i ich związków,
poszukiwanie w bazie danych informacji pozwalającej na określenie co przedstawia obraz,
analizę wybranej informacji,
smianę struktury informacji w bazie danych zgodnie z nową informacją,
ustalenie nowych związków pomiędzy pewnymi pojęciami o obrazie.
Człowiek wykorzystuje tzw. myślenie obrazowe (transformacja obrazu + wyobrażenia wizualne). Na selekcję i identyfikację obrazów w pływają w przypadku człowieka emocje i motywy. Funkcja interpretacji vjna sprowadza się do nadawania znaczeń poszczególnym elemeniniii obrazu. Znaczenia te konkurują ze sobą w fazie identyfikacji ze względu na różne kryteria formalne. W przypadku człowieka na identyfikację i interpretację obrazu ma również wpływ proces myślenia. Wyodrębnienie i rozpoznawanie poszczególnych elementów obrazu może na drodze asocjacji być powiązane z odpowiednimi nazwami, które wydobyte z pamięci pojawiają się w świadomości. Intelekt człowieka pozwala na dalsze przetwarzanie części informacji zawartej w obrazie, na jej wzbogacenie. Dzieje się tak przez interpretację myślową. System komputerowej wizji przedstawiono na Rysunku 1.1.
1.3 Systemy komputerowej wizji w robotyce
Spektakularnym przykładem wykorzystania komputerowej wizji są systemy wizyjne robotów inteligentnych lub inaczej nazywanych robotów myślących. Określenia te są skrajnie niejednoznaczne (również w stosunku do człowieka) jako, że dotychczas nie znaleziono dokładnego określenia i miary stopnia inteligencji i myślenia.
Wg. Marvina Minsky'ego [62], "o systemie można powiedzieć, ,
że jest inteligentny, wtedy, gdy może adaptować się do nowych
6 Rozdział 1. Wprowadzenie w problematykę komputerowej wizji
Baza danych
k*
Procedury identyfikacji obiektu
*
ł
^
Mechanizm
interpretacji
danych
Przetwarzanie wstępne obraza
/tL_
-?
Pamięć
-?
Procedury
interpretacji
obraza
Wynik
4_
*-
^
Rysunek 1.1: Schemat blokowy komputerowej wizji
sytuacji, gdy ma zdolność rozumowania, rozumienia relacji pomiędzy faktami, odkrywania znaczeń, rozpoznawania prawdy. Często oczekuje się też od niego zdolności do uczenia się, to znaczy udoskonalania swojego działania w oparciu o przeszłe doświadczenia". Natomiast inni Autorzy skłaniają się do poglądu, że sztuczna inteligencja to "nauka komputerowa polegająca na projektowaniu systemów inteligentnych tzn. posługujących się rozumowaniem niealgorytmicznym, twórczym, czyli heurystycznym "[37].
Do podstawowych problemów sztucznej inteligencji (zgodnie z ACM - Association for Computing Machinery) należy z pewnością zaliczyć:
- symulację zdolności zmysłowych człowieka (w tym rozpoznawanie
obrazów i mowy, interpretacja obrazów),
- automatyczne rozwiązywanie problemów,
- reprezentację wiedzy,
- automatyczne wnioskowanie w sytuacji problemowej,
- twórczość maszynową,
- teorię gier itp..
Syttcmy komputerowej wizji w robotyce
7
i ię pytanie czy można terminem "inteligentny-myśłący"
i bota, wykorzystującego na poziomie sterowania metody
MM1 '? się w ramach przytoczonych wyżej obszarów sztucznej
? IM ji. Odpowiedź nie jest jednoznaczna, jako, że pojęcie
in',<'iitny-myślący" związane jest nie ze stosowanymi metodami,
końcowymi wynikami. Zwykle mówiąc o robotach inteligentnych
na myśli roboty, które po zakończeniu procesu uczenia,
njłj swoje zadania przy warunku otrzymywania informacji o
cniu, w którym funkcjonują. Program działania takiego robota
formowany na podstawie zadanego celu, informacji a'priori o
!<• i bieżącej informacji otrzymywanej z systemu komputerowej
W sformułowaniu ideologii pierwszych systemów komputerowej
dla robotyki, ważną rolę odegrały prace Roberts'a [81], Guzmana
Falka [24].
Układ blokowy systemu wizji robota przedstawiono na Rysunku ' ()l)iaz poprzez układ optyczny doprowadzany jest do przetwornika i światło-sygnał elektryczny, który jest następnie wzmacniany i zapamiętywany. Układ analizy obrazu służy do wydzielania, określania i">łrzędnych i położenia obiektu oraz rozpoznawania obiektu. Na lawie otrzymanej informacji wypracowywane są sygnały umoż-i jące odpowiedni ruch ramienia manipulatora w kierunku obiektu.
W pracach [94], [2] określono wymagania odnośnie systemu wizyj-
I robota:
szybkość przetwarzania informacji dotyczącej jednego obiektu powinna wynosić ok. 200ms,
- system powinien uwzględniać możliwość ruchu obiektu z szybkością
do ok. Im/min,
- algorytmy przetwarzania obrazów powinny mieć charakter uniwer-
salny,
- jakość obrazu powinna być wystarczająco wysoka,
- mała czułość na zakłócenia.
Metody komputerowej wizji rozwinęły się silniej dopiero w ostatnich latach i nabrały znaczenia szczególnie po wprowadzeniu III i kolejnych generacji komputerów. Podstawy teoretyczne i praktyczne
8 Rozdział 1. Wprowadzenie w problematykę komputerowej wizji
Przetwornik światło -sygnał
^ Układ przetwarzania wstępnego obrazu
n
?/,>???
zr
Pamięć obraza
Układ analizy obrazu
Przestrzeń Robota
Mikroprocesor
Mechanizm wykonawczy
Sterownik
Układ sterownika wizji
Rysunek 1.2: Schemat blokowy systemu wizji robota
zadań komputerowej wizji zawarte są zarówno w książkach jak i pracach oryginalnych. Określiło to jeden z celów tej książki. Autor chciał przedstawić istotne zagadnienia z dziedziny komputerowej wizji. Z jednej strony umożliwiają one łatwe wniknięcie w nowoczesny rozwój tej dziedziny, a z drugiej dają możliwie pełny obraz metod komputerowej wizji - co nie oznacza w żadnym razie dążenia do wyczerpującego przeglądu literatury.
Tworzone przez człowieka modele systemów analizy i interpretacji informacji obrazowej oparte są na tym co wiadomo o systemie wzrokowym ludzi (HVS - Humań Visual System). Powtarza się ten sam schemat analizy:
- wydzielanie lokalnych charakterystyk analizowanego obrazu czyli
cech,
- tworzenie opisu lokalnych fragmentów obrazu,
- dopasowanie opisu do wzorców.
Rozwój i postęp w tworzeniu systemów analizy i interpretacji obrazów jest bardzo duży. Możliwości systemów wydają się być imponu-
I t Systemy komputerowej wizji w robotyce 9
jednak w porównaniu z systemem wzrokowym człowieka (HVS)
j( określić jako znikome. Na wstępie bardzo skrótowo omówiono
m wzrokowy człowieka. Następnie w pracy są rozpatrywane me-
Łodj i algorytmy przetwarzania informacji w systemie komputerowej
I 'roces komputerowego widzenia podzielony został na następu-
i dnienia:
i ( Hrzymywanie (akwizycję) obrazu,
2. Przetwarzanie wstępne obrazu cyfrowego,
3, Analizę obrazu,
I Rozpoznawanie obrazu,
W dalszej części pracy są one szczegółowo omawiane i zilustrowane kładami (przetwarzanymi obrazami).
Rozdział 2
System wzrokowy człowieka
2.1 Wprowadzenie
Zadaniem tego rozdziału jest zwięzłe i przystępne przedstawienie me-
< linnizmu powstawania obrazów świata zewnętrznego postrzeganych
przez człowieka. Nie ma żadnego znaczenia, czy światło pochodzi bez-
• ilnio od źródła promieniowania, czy też jest częścią odbitą lub
? puszczoną przez oświetloną materię (Rysunek 2.1).
riomieniowanie < Promieniowanie
4włetlne \ \ \ / odbite
Promieniowanie " \ \ Promieniowanie
pochłaniane f \ załamywane
Promieniowanie rozproszone
Promieniowanie przechodzące
Rysunek 2.1: Przechodzenie promieniowania przez ośrodek fizyczny
I 'rzedstawimy krótką charakterystykę systemu wzrokowego (wizu-llnego) i niektóre parametry wizualne rozpatrywane w różnych zasto-owaniach technik przetwarzania obrazów. Kompleksowe aspekty per-11 pcji wizualnej najlepiej wyjaśnić podając krótki opis systemu wzro-bowego (wizualnego) człowieka (HVS). Pod względem anatomicznym, //1 'S można podzielić na cztery elementy: gałkę oczną, nerw optyczny,
12
Rozdział 2^y?ęmwz1^^
ciała kolankowate boczne i część wzrokową kory mózgowej (Rysunek 2.2). Funkcja gałki ocznej jako układu optycznego jest analogiczna do funkcji aparatu fotograficznego, rejestrującego załamane promienie świetlne na światłoczułej powierzchni. Gałka oczna jest narządem, który przekazuje wrażenia wzrokowe do mózgu, gdzie są one analizowane i przetwarzane w jeden obraz. Oko ma za zadanie oglądanie, mózg natomiast decyduje o tym, co jest spostrzegane i jak rejestrowane.
Warstwa połączeń synapsyc"iy<*
Warstwa kowóre" flMalMafJBM>W**
i ? v I FfVSY a) salka oczna, b) siatkówka,
ł 1 Wprowadzenie
13
W powstawaniu wrażenia obrazu w mózgu mają udział: fizyczne
? i w ości promieniowania (Rysunek 2.3), zjawiska fizjologiczne za-
• IHHI/^CC pod wpływem tego promieniowania w oku i układzie ner-
iii oraz zjawiska natury psychologicznej zachodzące w mózgu.
odbiera tylko część promieniowania nań padającego. Związane
to z własnościami fizyko-chemicznymi rogówki, czopków i pręci-
< )<lbieramy, zatem tylko światło, które mieści się w zakresie tzw.
i optycznego. Okno optyczne to przedział długości fali elektroma-
rznej (światła) od ok. Ą00 nm, (co odpowiada światłu o barwie
d"l. iowcj) do ok. 100 nm, (co odpowiada światłu o barwie czerwo-
Kysunek 2.4). Powyżej długości 100 nm znajduje się niewidoczna
lowieka podczerwień, a poniżej Ą00 nm, również niewidoczny,
<liolet. Do fal elektromagnetycznych zaliczamy także niewidoczne
złowieka promienie gamma, promienie X i inne. Promieniowanie
u długości fali spoza okna optycznego nie jest przepuszczane przez ro-
i'/ oka. Promieniowanie, które wniknie do oka w różnym stopniu
• luje reakcje elektrochemiczne w czopkach i pręcikach stając się
rodłem bodźców. Ze względu na różną budowę czopków i pręcików
? 'pują różne właściwości widzenia ciemnego (przy małym oświe-
? i• r 1111) i jasnego (przy dużym oświetleniu). Przyjmuje się maksimum
i ilości czopków jako 550 nm, a pręcików jako 510 nm. ulżenia techniczne mogą tylko w większym lub mniejszym przy-tiiu naśladować oko ludzkie i złożony proces percepcji bodźców 11 Łych przez narząd wzroku człowieka. Najbardziej wewnętrzną warstwę oka stanowi siatkówka, zbu-ma z wielu warstw komórek nerwowych. Jedną z tych warstw iowią komórki światłoczułych receptorów - pręciki i czopki. Pełnią ?•nr zasadniczo odrębne funkcje w procesach postrzegania światła, niskich poziomach oświetlenia poniżej 0,0llx czynne są jedynie i ki i wtedy zachodzi widzenie skotopowe. Intkówka jako odbiornik promieniowania elektromagnetycznego I uulowana jest z dwóch rodzajów komórek światłoczułych: czopków
I pręcików połączonych za pomocą nerwów z mózgiem. Czopki
II względnie niskiej czułości przeznaczone są do obserwacji przy
i le dziennym. Ich maksymalne zagęszczenie występuje w dołku
lalkowym. Jeśli zatem obraz obserwowanego przedmiotu znajdzie
• dokładnie w tym obszarze uzyskujemy wtedy najlepsza zdolność
dzielczą. Wraz ze spadkiem natężenia światła wpadającego do
rośnie średnica źrenicy. W momencie, gdy czułość czopków jest
niewystarczająca do prowadzenia obserwacji, mimo dużych wymiarów
%
14
Rozdział 2-System
wzrokowy człowieka
W|.t..wadzenie
15
fotonu (eleWronowoKy)
r" t<r*
Energi* jednego
ltr, t(r* v* wr* ""* w
W* 10*
CzetotfiwoieCHz) 0 rf "V if łf
l0- * "r rj2U?J? 10"
Długość fali (metry) rf 10J
Fale radiowe
"., ,"-, ,." "- -• "- ** T" '• "
podczerwień
ES^lJ?- |?"-Ł^"-"
Ultrafiolet
Rysunek 2.3: Widmo elektromagnetyczne
światło wtoa^ 400-700nm
100
Czułość względna
1000
400
(Z** "*•* M*"-U-"* ""
600
500
d^(tm) t^- podczerwień Promieniowania c,amma /widmo widzia.ne
400
Odpowfedż fticfckfego oka (fc/m/r-ancja)
bodziec świetlny ludzkiego oka i
Rysunek 2-4: Widmo wHrf-1-^^owego
• ,;" pręciki Pręciki znajdują się
źrenicy, funkcje receptorów g*(tm)" " zagęszczenie znajduje sie
poza dołkiem środkowym J"^ od jego środka, (dlatego wdzeme
. odleglośei ^to"V\Xry?^ym). Przy dużym nat,zenm
nocne nazywamy wmzenem P(tm)^". światla przy uzycm
świat.a pręciki ^^ mo4emy zaobserwować prze-
specjalnego barwnika. Jego
ciemnego pomieszczenia do jasnego lub odwrotnie (efekt lin) Proces przystosowania wzroku do warunków oświetlenia 'in\ adaptacją.
Iowiek postrzega jedynie różnice jasności (nie ma wrażeń
li). Kiedy poziom oświetlenia przekracza ok. 30lx mamy
liienia z widzeniem fotopowym czyli widzeniem barwnym.
nu nem procesu tego widzenia jest tzw. zjawisko metameryzmu
11 u'rozróżniania składu spektralnego promieniowania świetl-
Bodziec świetlny zostaje w warstwie komórek światłoczułych
ilorów przetworzony na impulsy elektryczne, które są następnie
wane wypustkami nerwowymi do komórek dwubiegunowych,
ii/pnie do komórek zwojowych. Długie wypustki komórek zwo-
li l/w. aksony, tworzą nerw wzrokowy kończący się w ośrodku
? iłowym drogi wzrokowej. Sygnał stamtąd jest przekazywany do
i potylicznej kory mózgowej. Jak już wspomniano wcześniej, w
iwce oka ludzkiego istnieją dwa rodzaje fotoreceptorów, pręciki i
i| 'li w przybliżeniu Ibrnln 4- I50mln pręcików i ok. 5mln -J- 7mln
ków. Czopki są rozmieszczone najgęściej w środkowej części
• wki - w plamce i są czynne tylko w świetle. W tej okolicy każda
komórka receptora łączy się z osobnym włóknem nerwu wzrokowego
daje możliwość dokładnego przenoszenia bodźców do mózgu.
i akiej budowie plamki, uzyskiwana jest wysoce precyzyjna
i oglądanego obrazu. Przy widzeniu dziennym ostrość wzroku jest
nialna w centrum siatkówki w wycinku objętym kątem 1° -=-2°.
W i nz ?/, przesuwaniem się obrazów ku obwodowi ostrość wzroku szybko
je osiągając | wartości w odległości odpowiadającej kątowi 5° i
odległości odpowiadającej kątowi 20° . Dzieje się tak, gdyż na
•dzie siatkówki tylko ok. 100 -f- 200 receptorów łączy się z jednym
nem nerwowym, przez co nie ma dostatecznego odbierania
i'wodzenia bodźców świetlnych. Proces widzenia zachodzi w
sposób, ponieważ w fotoreceptorach znajdują się substancje
itłoczułe. Światłoczułe elementy siatkówki zostają odtwarzane
? u'inności, a ulegają rozpadowi w świetle. Ciągłe odtworzenia w
mości i rozpad w świetle ustalają stan zależności siatkówki, a tym
mi viii i wrażeń wzrokowych, od stanu oświetlenia.
I 'rzekształcenia i redukcja informacji w siatkówce nie ogranicza się
I ko do przekształceń i przenoszenia potencjałów w jednym kanale
nloiinacyjnym, jaki tworzy ciąg kolejnych komórek nerwowych.
Proces redukcji informacji odbywa się też w strukturach poziomych powierzchni siatkówki. Receptor oświetlony silniej wywiera hamujący wpływ na znajdujący się obok słabiej oświetlony receptor, co w konsekwencji powoduje zwiększenie kontrastu, ale zmniejsza ilość informacji. Proces widzenia nie jest jeszcze poznany w całości, w każdym razie jego faza początkowa ma charakter zmian fotochemicznych.
Jeden z produktów rozpadu światłoczułej substancji zmienia potencjał elektryczny przewodzących neuronów siatkówki i energia świetlna zostaje przetworzona w energię elektryczną. Komórki receptorów stają się wówczas jakby mikroogniwem. Wskutek tego następuje wyładowanie impulsów elektrycznych z obu gałek ocznych w postaci bioprądów do włókien nerwu wzrokowego, a następnie impulsy zostają przekazane do dróg wzrokowych w mózgu i do potylicznej części kory mózgowej. W mózgu impulsy elektryczne są analizowane i przetwarzane w jeden obraz. Siatkówka odbiera bodźce barwne fal świetlnych, ale to od funkcji mózgu zależy, jakie barwy spostrzegamy. Widzenie barwne wg. teorii Younga-Helmholtza, przedstawiono schematycznie na Rysunku 2.5. Mózg analizuje sygnały r, g, b i od ich wzajemnego stosunku zależy wrażenie barwy. Od wartości sumy tych sygnałów zależy odczucie jasności (luminancji) bodźca świetlnego. Im większa jest suma (r + g + b) tym wrażenie jasności bodźca świetlnego jest większe. Dla stosunku r : g: b = 1:1:1 mamy wrażenie bieli lub szarości.
Narząd wzroku charakteryzuje się właściwością dostosowywania do poziomu oświetlenia, czyli adaptacją do jasności oraz właściwością dostosowywania się do składu widmowego oświetlenia, czyli adaptacją do barwy. Oprócz tego występują takie zjawiska jak zjawisko powidokowe (kontrast barwny następny) i tzw. kontrast barwny równoczesny polegający na tym, że odbieramy różnicę barwności dwóch pól barwnych o identycznych właściwościach spektralnych oświetlonych jednym źródłem światła, o ile każde z tych pól znajduje się w otoczeniu o innej barwie. Analogicznie występuje też kontrast równoczesny luminancji polegający na tym, że z dwóch rozważanych pól to jest odbierane jako jaśniejsze, które znajduje się na ciemniejszym tle (Rysunek 2.6). Możemy więc scharakteryzować bodziec świetlny jak na Rys. 2.7.
W|>n iw.nl/rmr
17
Uktad zobrazowania
E{A)
Jk Współczynnik
ttgljr uwzględniający
R( X ) zjawiska
absorpcji i odbicia
Układ zobrazowania
* r
9
* b
SM)
1
I
*
Fi V\R( l")
S2(A)
*
.S3U)
1
Rysunek 2.5: Model widzenia barwnego
Impulsy elektryczne są silnie zależne od chwilowych zmian pa-
iimetrów bodźców. Zmiana luminancji z 10^ do 11^ wydaje się
iza jeżeli następuje w krótkim czasie, niż w przypadku, gdy czas
j zmiany jest długi. Odpowiedzi na zmiany luminancji również
ą natychmiastowe. Nawet jeżeli oglądana scena jest stacjonarna,
ępuje ruch mięśni gałki ocznej. Ruch ten to małe oscylacje z
'otliwością około lO3^ i z amplitudą ok. 0.1° (Umiliradianów)
i widzenia. Dla obiektów stacjonarnych ruch mięśni wprowadza
podobnego do procedury przeplatania w telewizji. Plamka żółta
obejmuje efektywny kąt widzenia wynoszący ok.l0°. Fotografia
!) x \2cm widziana z odległości 40cm lub 26" ekran TV widziany z
odległości 3m obejmują ok. 20° kąta widzenia.
18
Rozdział 2. System wzrokowy człowieka
Rysunek 2.6: Zjawisko kontrastu równoczesnego luminancji
W przetwarzaniu obrazów do opisu właściwości systemu wizyjnego, informacji w obrazie i charakterystyk urządzeń zobrazowania, stosujemy m.in. takie pojęcia bezpośrednio związane z fizjologią HVS jak luminancja, jaskrawość i kontrast. Luminancja określa energię emitowaną w kierunku obserwatora przez niekoherentne źródło światła na jednostkę czasu i powierzchni. Zmiana luminancji np. z 1^ do 2-^, w czasie lub przestrzeni, daje obserwatorowi iluzję, że wystąpiła większa zmiana niż w przypadku zmiany luminancji z 50^ do 51^. Obserwacja ta pozwoliła na sprecyzowanie definicji jaskrawości B nieliniowo zależnej od luminancji. Zależność ta określana jest przez prawo Webera-Fechnera
B = lnL (2.1)
W|n < wadzenie
19
BODZIEC ŚWIETLNY
ILOSC
( CHROMATYCZNOŚĆ )
( JASNOŚĆ )
IEŃ ) ( NASYCENIE )
Rysunek 2.7: Charakterystyka bodźca świetlnego
/ oznacza luminancję. Prawo Webera-Fechnera nie odzwierciedla efektu nasycenia przy
(2.2)
? li luininancjach. Określając jaskrawość B jako / >' = arc sin hkL
amy liniową zależność jaskrawości od luminancji w przy-ii gdy luminancja jest bliska zeru i zgodną z prawem Webera-inera dla dużych wartości luminancji.
Kontrast jest stosowany przy określaniu różnicy w luminancji któw.Istnieje szereg definicji kontrastu np. (Rysunek 2.8)
L+ A L
l_+ AL
i.bi
AL
Rysunek 2.8: Kontrast C = ^r
c =
L
(L0b - Lt\a) _ AL
tla
Hla
(2.3)
20
Rozdział 2. System wzrokowy człowieka
Kontrast może być dodatni lub ujemny. Kontrast ujemny jest wtedy kiedy obiekt jest mniej oświetlony niż tło. Bardziej adekwatną definicją jest (Rysunek 2.9) tzw. kontrast Michelsona
c =
'-'max '-'min
'-'mai. ' '-'min
lub
C =
{Lob - Ltla)
(Lot + Lt\a)
(2.4)
(2.5)
Ł
u
m
i
n
a
n
c
i
a
'-""?'-",>
Lmax+ '-min
IAAAAAL:-
Położenie
Rysunek 2.9: Definicja kontrastu Michelsona
Znak C określa przypadki: jasny obiekt - ciemne tło i czarny obiekt - jasne tło. Współczynnik czułości kontrastowej wskazuje na lokalne, przestrzenne i czasowe względne zmiany luminancji (Rysunek 2.10 i Rysunek 2.11).
2.2 Model systemu wzrokowego
Kompletny model systemu wzrokowego (wizualnego) człowieka musi zawierać model oka, model traktu optycznego i model tzw. wizualnej części kory mózgowej. W chwili obecnej modele HVS znajdują się we wstępnej fazie rozwoju [14]. Model HVS można określić m.in. metodą
Model systemu wzrokowego
21
I.+Al.
..?:,&
L
i ~m-
*V*T?
tog l
iifk 2.10: Czułość kontrastowa. Ilustracja prawa Webera - Fechnera
l. + Al.
unek 2.11: Czułość kontrastowa dla oka które adaptuje się do LQ
oinetryczną. Metoda ta polega na rejestracji reakcji typu "wy-
111 zmianę bodźca świetlnego", "bodziec na lewej połowie pola
• nią" itp., grupy odpowiednio przygotowanych ludzi na sekwencję
? ów obrazowych. Zwykle bodźce obrazowe (Rysunek 2.12) opisy-
wyrażeniem
/(./:, y) = I0 + k cos[27r/0(:r cos q - y sin q)]
i zęstotliwość przestrzenna, jaskrawość tła, kąt nachylenia linii luminancji bodźca świetlnego.
(2.6)
Wyniki tego typu doświadczeń pozwalają stwierdzić, że wykry-
ilność bodźca dla dowolnych, ale ustalonych /o i q, zależy tylko od
inku j- określonego mianem kontrastu, a nie oddzielnie od k i
zułość systemu HVS zależy zarówno od /o jak i od q. Wartość
określająca próg wykrywalności bodźca nazywana jest czułością
iintrastową. Jest ona funkcją częstotliwości przestrzennych /o i
Rysunek 2.12: Bodźce obrazowe wykorzystywane w metodach psychometrycznych (dla różnych kątów q)
rośnie początkowo liniowo ze wzrostem /o, a następnie stosunkowo szybko maleje w zakresie dużych częstotliwości przestrzennych (Rysunek 2.13). Częstotliwości przestrzenne odpowiadające maksymalnej czułości obejmują zakres 3 s^ffi*ń "*" 4.5^^. Czułość zależy od q i jest maksymalna dla poziomych i pionowych linii luminancji bodźca świetlnego. HVS najbardziej czuły jest na zmiany bodźców w świetle zielonym, mniej w czerwonym, a najmniej w niebieskim. Receptory siatkówki oka, pręciki i czopki, reagują na pobudzenie nieliniowo. Charakterystykę przejścia HVS aproksymuje się wagowymi funkcjami logarytmicznymi lub funkcjami schodkowymi.
W wyniku przeprowadzonych badań stwierdzono, że oko człowieka pracuje jak nieliniowy filtr (Rysunek 2.14a), który jest modelowany przez znane układy elektroniczne (Rysunek 2.14b). Inne doświadczenia m.in. przy wykorzystaniu bodźców obrazowych w postaci dwóch sygnałów sinusoidalnych o różnych częstotliwościach, pozwoliły na sformułowanie następującego wniosku: "HVS ma pewną liczbę równoległych mechanizmów wykrywania bodźców. Są to tzw. kanały przestrzenne nastrojone na różne częstotliwości przestrzenne i wykrywające bodźce o różnych kątach orientacji" (Rysunek 2.14c). Wyniki badań nad systemami HVS zostały dokładnie udokumentowane, można więc przyjąć, że prezentowany model HVS odpowiada rzeczywistemu systemowi (jest prawdziwy). Na tej podstawie przyjęto założenie, że system komputerowej wizji powinien posiadać strukturę analogiczna
Model systemu wzrokowego
23
l 11 iikt my systemu wzrokowego człowieka.
Czułość kontrastowa
i
Cykle na stopień
Rysunek 2.13: Charakterystyka czułości HVS
OTYCZWy
SYSTEM
OKA
CHARAKTERYSTYKA
KOMÓRKI LATERALNE
•..u.*.
SIATKÓWKI
' ' ' *WY
FILTR m.cz.
TRANSFORMACJA LOGARYTMICZNA
FILTR
Vi.CZ.
***M
k-ty
IKZeSTRZENNY
KANAŁ
T
PROGOWANtE
EXCLUSNE OR
-J
SZUM
linek 2.14: Model systemu wizyjnego człowieka. Model analizatora widzenia model techniczny HVS (b) i mechanizm wykrywania bodźców (c)
i
Ku/dział 3
Akwizycja obrazu
i I Wprowadzenie
I i;ile tym przedstawimy przetworniki obrazowe optyczno - elek-nr wykorzystywane do uzyskania przebiegu elektrycznego odpo-i I.Kego rozkładowi świateł analizowanej sceny. Zostanie pokazany '•iiii/in rzutowania 3D obiektów na 2D obraz. Przedstawione zo-i metody uzyskiwania obrazu cyfrowego, a więc metody próbko-i i dyskretyzacji obrazu.
Przetworniki obrazowe optyczno-elektryczne
ne systemy receptorów czyli przetworniki obrazowe optyczno-l.ryczne oraz ich podstawowe charakterystyki przedstawiono w
I .UH v 3.1.
Przy wykorzystaniu przetworników obrazowych obraz obiektu
'\ ) można otrzymać metodami bezpośrednim tj. takimi w których
i nie znajduje się pomiędzy przetwornikiem a źródłem światła
lub też metodami tzw. cieniowymi, w których obiekt położony jest
i':dzy źródłem światła i przetwornikiem obrazowym (Rysunek
Przy metodzie cieniowej obszar obrazu o dobrej jakości jest
izy, niż przy metodzie bezpośredniej i znacznie słabiej zależny od
etlenia obiektu. Przy metodzie bezpośredniej na jakość obrazu
zny wpływ ma pojawienie się na powierzchni obiektu tzw. blików.
I'izetwarzanie optoelektroniczne zachodzi w specyficznym dla każ-? rozwiązania przetwornika obrazowego elemencie, wykonanym z
R0zdział3_J^Ś?li^^
26
Tablica 3
/orników obrazowych elektro
.1: Charakterystyki pewnych przetw optycznych
1'f/etworniki obrazowe optyczno-elektryczne
27
mej i światłoczułej. Na element światłoczuły rzutowany jest stru-iwietlny pochodzący od analizowanej sceny. Fotony tworzące ten I rumień po wniknięciu w głąb struktury materiału światłoczułego ;.ilują na elektrony jego atomów, oddając im energię. W wyniku •ddziaływań wystąpi zjawisko uwalniania nośników prądu z orbit ??.ii r/atomowych. Liczba nośników zależy od natężenia oświetle-Zjawisko to nosi nazwę efektu fotoelektrycznego, przy czym jeżeli uione nośniki prądu elektrycznego pozostają wewnątrz struktury MI I u światłoczułego to mamy do czynienia z efektem fotoelek-nytn wewnętrznym, lub w przypadku przeciwnym, z efektem fo-cznym zewnętrznym. Oba wymienione efekty znalazły zastoinę w przetwornikach obrazowych.
TT
TtmtttTTT
a) cieniowe
\m\
b) bezpośrednie
Rysunek 3.1: Metody oświetlenia obiektów
l"J hardziej znanym i rozpowszechnionym przetwornikiem ob-
in jost telewizyjna lampa analizująca, najczęściej widikon, o
uym odchylaniu i skupianiu wiązki elektronowej (Rysunek
W |ej budowie można wyróżnić dwie zasadnicze części: sekcję
ii sekcję wybierania. Pierwsza z nich zawiera element
u lv, w którym zachodzi przetwarzanie optoelektroniczne
ulacja fotoładunków. Sekcja wybierania formuje, skupia i
>/.kę elektronową adresującą element światłoczuły. Wiązka
mi :i się w próżni wewnątrz szklanej bańki. Budowa sekcji
i u. i w zasadniczy sposób zależy od przyjętego sposobu
4P
#*
Rozdział^^Ś^-^^
rdworniki obrazowe optyczno-elektryczne
29
28
+ 5oav
-100V
skupiania i odchylania wiązki wybierającej. Możemy więc spotkać lampy analizujące realizujące proces wybierania wyłącznie na drodze magnetycznej, wyłącznie na drodze elektrostatycznej lub też w sposób
Bańka
"•"'? \- i magnetyczny
7* -\ r~
CewW odchylające CewW skupiające C*wW korekcyjne
Rysunek 3.2: Telewizyjna lampa analizująca (widikon) Wykorzystanie lamp analizujących pozwala na uzyskanie dużej ilości informacji obrazowej. Jednak ta zaleta lamp analizujących nie równoważy ich niedostatków, a w szczególności:
- względnie dużych rozmiarów i masy lampy,
- małej wytrzymałości mechanicznej,
- znacznego poboru mocy,
- konieczności stosowania wysokich napięć,
- występowania zniekształceń geometrycznych obrazu,
- bezwładności przetwarzania,
- konieczności ekranowania magnetycznego i elektrycznego.
Przedstawione wyżej uwarunkowania doprowadziły do powsta
nia bezpróżniowych, monolitycznych przetworników obrazowych typi
CID (ze wstrzykiwaniem ładunku) lub typu CTD (z przesuwem ła
dunku). Wykorzystują one, w procesie przetwarzania, efekt fotoelel
tryczny wewnętrzny. Uwolnione do struktury przetwornika foton*
śniki są akumulowane w ściśle określonych obszarach, ograniczony
raizanymi barierami potencjałowymi. Każdy taki obszar pojedynczy element przetwarzaj ąco-akumulujący pola świa-ii i może być traktowany jako kondensator o elementarnej W zależności od sposobu wytwarzania bariery potencjalna się kondensatory akumulująco-przetwarzjące złączowe Pi •??iworniki obrazu typu CID wyróżnia zastosowanie do ad-i powierzchni światłoczułej ortogonalnej macierzy X-Y. Ma-uoizy siatka przewodzących elektrod, krzyżujących się pod I prostym. Każdy węzeł macierzy odpowiada elementowi po-il światłoczułej i współpracuje dokładnie z jednym konden-o tu przetwarzająco-akumulującym (Rysunek 3.3). Adresowanie odbywa się przez jednoczesny zanik napięcia (do zera) na lodach aktualnie wybranego węzła. Powoduje to całkowitą i; ..studni" potencjałowej w tym węźle. W przypadku zaniku tylko na jednej elektrodzie węzła, nośniki przemieszczają się mi" pod drugą elektrodą. Uwolnione podczas adresowania wę-fntołudunki są wstrzykiwane do podłoża, a stamtąd dostają się do . /biorczej.
"k yk f
b)
mmĄ
ółprzewodnik samoistny typu n (n-Si)
Studnia potencjałowa
Półprzewodnik silnie domieszkowany
(elektroda zbiorcza)
+ u.
Rysunek 3.3: Węzeł macierzy adresującej przetwornika CID
I '?" I stawowym problemem technicznym tego typu przetwornika ob-|est jego naświetlanie, ponieważ krzyżujące się wielopoziomowo rody węzła skutecznie przesłaniają fotoczułe złącza kondensato-MOS. Dlatego też w chwili obecnej stosowane jest rozwiązanie
• -I i.iwione na Rysunku 3.4. Wielodiodowa struktura jest adreso-
Rozdział 3.
Akwizycja obrazu m GtOfTWtria systemu przetwornika obrazu
31
30
Kondensatory złączowe
Ogniwo rejestru
O
Fazy
przebiegu
zegarowego
af*1f*
jKriJ
Rysunek 3.6: Przetworniki obrazu typu CTD
< i Geometria systemu przetwornika obrazu
111 ująć zagadnienie geometrii przetwornika obrazu nie musimy le-
ii IWRĆ się znajomością szczegółów optyki i fotoelektroniki kamery.
na jest tylko znajomość faktu, że soczewka kamery wyłapuje
c światła przechodzące przez środek soczewki. Na Rysunku
? dstawiono schematycznie idealną kamerę gdzie l jest odległo-
ibicktu od środka soczewki, natomiast / odległością pomiędzy
? ni soczewki i powierzchnią warstwy światłoczułej. Odległości
? powiązać za pomocą równania soczewki:
"Ą-r
wana przez macierz ortogonalną X-Y za pośrednictwem kluczy w postaci cienkowarstwowych tranzystorów MOS. Przetwornik tego typu ma większą czułość i lepsze właściwości spektralne od opisanego poprzednio.
twomik obrazu typu MOS-XY
Rysunek 3.4: Prze
Przetworniki obrazu z przesuwem ładunku (CTD), wyróżnia sposób adresowania zakumulowanych fotoładunków, w którym zasadniczą rolę odgrywa pamięć analogowa. Stanowi ona najbardziej charak terystyczny podzespół przetwornika CTD. Każdej komórce pamięci przetwornika CTD jest przypisany jeden element przetwarzająco akumulującej struktury. Zgromadzony ładunek przemieszczany jest do odpowiadającej mu komórki pamięci. Wyjściowy prąd sygnału ob razu otrzymuje się odczytując sekwencyjnie całą pamięć przetworniki Przyjęty sposób odczytu umożliwia wykonanie pamięci w postaci re jestru przesuwającego. Jako element pamięci wykorzystuje się kon densator złączowy, sterowany tranzystorami FET. Pojedyncze ogniw rejestru tworzą dwa sąsiadujące ze sobą kondensatory i dwa sprzęga jące je tranzystory (jest to tzw. rejestr BBD, Rysunek 3.5). Elemen pamięci można wykonać całkowicie techniką MOS - w tym wypadki elementami pamięci są kondensatory MOS sterowane tranzystoram MOS - jest to rejestr typu CCD.
Scalone przetworniki obrazu typu CTD są tworzone przez umies/ czenie obok siebie i na jednym podłożu określonej liczby analizatorów linii (Rysunek 3.6). Analiza obrazu najczęściej odbywa się wzdłuż lin pionowych.
<P1°-
Rysunek 3.5: Schemat rejestru przesuwającego BBD
b
U.
LV
?łi
tiMiM
tr1
L l l ii
ił
? *-
li i
* i * i * i
m*m
-"1T|T|T|T| | iTiTiTiTl
1 ił ł liii
WI
J\
Rejestr wyjściowy
,8r<r
(3-1)
I 1 1 / ' ]~F
F jest ogniskową soczewki.
obrazem tworzonym jak na Rysunku 3.7 związany jest układ ? lnyeh przedstawiony na Rysunku 3.8.
Rysunek 3.7: Idealna kamera i jej geometria
Rysunek 3.8: Układ współrzędnych z punktem widzenia w O
Układ współrzędnych XY Z powiązany jest z rozpatrywaną sceną, płaszczyzna Z - j traktowana jest jak płaszczyzna obrazu. Punkt i' sceny rzutowany jest na płaszczyznę obrazu tworząc, w miejscu przecięcia płaszczyzny obrazu z promieniem łączącym punkt P z początkiem układu współrzędnych O, obraz punktu P. Jest to rzutowani* (projekcja) perspektywiczne (centralna).
(3.1
Niech będzie dany układ współrzędnych kartezjańskich xy w płasz czyźnie obrazu, w taki sposób, że osie x i y są odpowiednio równolegli do osi X i Y. Punktem początkowym płaszczyzny obrazu jest punki (0,0, /) wyznaczony przez przecięcie osi Z z płaszczyzną obrazu. Zgod nie z Rysunkiem 3.8, punkt sceny o współrzędnych (X, Y, Z) jest rzn towany na płaszczyznę obrazu tworząc punkt o współrzędnych obraz' (x, y) określonych przez:
y =
fY
x z
deometria systemu przetwornika obrazu
33
I '"i< >\viiując Rysunek 3.7 i Rysunek 3.8, zauważymy, że punkt wi-
i • i u. i (> odpowiada środkowi soczewki, oś Z odpowiada optycznej osi
płaszczyzna Z = f odpowiada powierzchni warstwy światło-
i I Ma prostoty założymy, że / ma pewną ustaloną wartość. Jeżeli
I ość / jest bardzo duża i znacznie większa niż ogniskowa soczewki
l. jest zwykle w licznych zastosowaniach systemów komputero-
Ai/ji), to równanie soczewki implikuje / ss F, i dla takiego przy-
'I odległość / jest często traktowana jak długość ogniskowej (jest
t ała kamery). Innym układem współrzędnych, alternatywnym
tadu przedstawionego na Rysunku 3.8, jest układ pokazany na
liku 3.9.
(X,Y,Z)
Rysunek 3.9: Układ współrzędnych - płaszczyzna obrazu XY
Punkt widzenia (0,0,-/) znajduje się w odległości / od płasz-ibrazu po ujemnej stronie osi Z. Równanie projekcji w tym i MI I ku ma postać
f + z
y =
JOL.
f + z
(3.3)
I-II układ współrzędnych jest bardzo przydatny gdy analizujemy
3D. W naturalny sposób można uzyskać ortograficzną ( lub
l< .tą) projekcję przy założeniu / -> oo (Rysunek 3.10). Or-
iliczna projekcja jest projekcją przez równoległe osi