Objektwahrnehmung Eine Reihe von Ansätzen Gestaltschule Merkmalsextraktion Ortfrequenzkanäle Marr s computational theory Geone versus bildbasierte Erkennung Eine Reihe von Problemen Mehrdeutige und unmögliche Figuren Geschwindigkeit der Verarbeitung
Kippfiguren Kippfiguren, wie hier der Neckerwürfel oder das Bild der jungen/alten Frau, lassen unterschiedliche Interpretationen zu, die in der Wahrnehmung miteinander konkurrieren
Unmögliche Figuren
Thorpe, Fize & Marlot (1996) Versuchspersonen wurden für kurze Zeit (50 msec) Bilder dargeboten, in denen in 50% der Fälle ein Tier enthalten war. Sie mussten auf Tiere durch Loslassen einer Taste so schnell wie möglich reagieren.
EEG-Daten Difference Targets Distractors Schon nach 150 msec zeigt sich im EEG ein Unterschied zwischen Tier- und Nicht-Tier- Durchgängen
Verarbeitungsgeschwindigkeit Das Experiment von Thorpe, Fize & Marlot (Nature, 1996) zeigt, dass Wahrnehmungsprozesse mit rasend hoher Geschwindigkeit ablaufen In V1 werden Kanten extrahiert, ca. 50-80 msec nachdem das Licht ins Auge gelangt ist Schon ca. 80 msec später hat das Gehirn entschieden, ob ein Tier auf dem Bild sichtbar ist Das entspricht ungefähr 5-8 Synapsen (Verarbeitungsschritten)
Zeitlicher Ablauf
Die Gestaltpsychologie Begründet von Wertheimer und Koffka in Frankfurt. Koffka lehrte später in Gießen (1911 1927) Das Ganze ist mehr als die Summe seiner Teile Organisationsprinzipien der Wahrnehmung die Gestaltgesetze
Wahrnehmungsorganisation
Gesetz der Prägnanz Jede Figur wird so wahrgenommen, dass sie in einer möglichst einfachen Struktur resultiert ( gute Gestalt )
Gesetz der Ähnlichkeit Ähnliche Objekte werden zusammengefasst. Die Abb. Links ist bistabil: manchmal sehen wir die Punkte als Reihen und manchmal als Spalten. Rechts daneben sieht man die Muster fast immer als Spalten, da die Objekte innerhalb einer Spalte identisch sind, nicht aber in den Reihen.
Gesetz der guten Fortführung
Gesetz der Nähe Nahe Objekte werden gruppiert. In (b) gewinnt die Nähe über die Ähnlichkeit der Form.
Gemeinsames Schicksal Gemeinsame Bewegungen führen zu Gruppierung
Gesetz der Bedeutsamkeit
Gesetze des Sehens? Die Gestaltgesetze sind keine Naturgesetze im engeren Sinne, da sie keine Vorhersage des Verhaltens erlauben Viele Aspekte der Gestaltpsychologie haben aber nachfolgende Forscher sehr beeinflusst Oftmals haben sich dadurch mechanistische Erklärungen der Gestaltgesetze ergeben
Physiologie der Linienfortführung Wenn Reize als Bestandteil eines Ganzen wahrgenommen werden, dann führt dies in der Regel auch zu höheren Antworten in kortikalen Neuronen.
Merkmalsdetektoren Hubel und Wiesel entdeckten eine Hierarchie von einfachen, komplexen, und hyperkomplexen Zellen im primären visuellen Kortex Wird diese Hierarchie in den extrastriären Arealen fortgeführt? Forscher entdeckten im inferotemporalen Kortex Zellen, die nur auf sehr komplexe Muster antworten
Formzellen in IT Tanaka fand, dass Zellen in IT sehr spezifische antworten zeigen (links). Die Zellen waren in IT je nach Präferenz in Kolumnen angeordnet.
Gesichterzellen Charles Gross und Kollegen fanden auch Zellen, die nur auf Gesichter reagieren
Gesichterneurone Die Antworten der Zelle sind am höchsten bei Bildern, in denen Gesichter gezeigt werden
Folgerung Aus dieser zunehmenden Spezialisierung könnte man folgern, dass man für jeden visuellen Reiz eine eigene Zelle hat, die nur diesen Reiz erkennt Auch für die eigene Großmutter? Dieses Schema der Kodierung ist ineffizient und anfällig für Fehler Gesichter sind speziell
Die Thatcher-Täuschung Pete Thompson stellte Margaret Thatcher auf den Kopf
Iiiiihhhhh Verzerrungen in Gesichtern, die auf den Kopf gestellt sind, sind nur schwer erkennbar Das Gesicht wird aus den Einzelteilen zusammengesetzt wahrgenommen
Clinton und Gore? Kontexteffekte
Ortsfrequenzkanäle Jedes Bild kann mathematisch in einfachere Muster zerlegt werden (Sinusgitter) Wir können die Antwort des visuellen Systems auf Sinusgitter messen Falls das System linear ist, können wir aus dieser Antwort die Antwort auf beliebige Reize vorhersagen
Rechteck und Sinus Komponenten Summe Eine Rechteckschwingung kann aus vielen Sinusgittern zusammengesetzt werden
Kontrastempfindlichkeit Kontrast Frequenz
Ortsfrequenzkanäle Wir nehmen Sinusgitter am besten wahr, wenn sie eine Ortsfrequenz von 4 Perioden pro Sehgrad haben. Niedrigere Frequenzen werden schlechter gesehen. Gitter mit über 60 Perioden pro Sehgrad sehen wir überhaupt nicht mehr. Die Kontrastempfindlichkeitskurve kann sich vorstellen als die Hüllkurve der Empfindlichkeitskurven einzelner Neurone.
Neurone und Sinusgitter
Helmholtz zerlegt Tiefpass Bandpass Hochpass Orientierte Kanäle
Ortsfrequenzmodell Neurone im Kortex haben unterschiedliche Größen ihrer rezeptiven Felder. Dies macht sie für unterschiedliche Ortsfrequenzen empfindlich.
Adaptation Ortsfrequenzkanäle lassen sich selektiv adaptieren.
Adaptation
Test
Probleme Die Theorie der Ortsfrequenzkanäle kann sehr gut vorhersagen, wie gut wir bestimmte Muster entdecken können Sie bietet keine Möglichkeit der Vorhersage, wie wir Objekte erkennen können Das Amplitudenspektrum ist in natürlichen Szenen nahezu immer gleich (1/f)
Marr s Ansatz (1980) Alles, was wir wahrnehmen, wird irgendwo im Gehirn berechnet. Marr unterscheidet drei Ebenen: Was ist das Ziel der Berechnung? Wie kann diese Berechnung implementiert werden (Algorithmus, Input, Output)? Wir lässt sich dies physikalisch implementieren (mit der gegebenen Gehirn-Hardware)?
Marr s Ansatz Im Bild wird die Intensität an jedem Punkt repräsentiert Im Primal Sketch werden wichtige Merkmale extrahiert, wie Ecken und Kanten Im 2 ½ D Sketch wird Tiefeninformation miteinbezogen und Primitiva gruppiert Im 3-D Modell werden ganze Formen in einer hierarchischen Weise organisiert
Wer ist das?
Bedeutung der Kanten Marr hebt die Bedeutung der Kanten hervor Fehlt diese Information, dann ist das Bild nicht mehr zu erkennen In diesem Beispiel bleibt die Kanteninformation für die niedrigen Ortsfrequenzen erhalten Original Nur hohe Ortsfrequenzen Nur niedrige Ortsfrequenzen
Auflösungsraum Laut Marr geht die Analyse von Szenen hierarchisch vonstatten Zuerst werden die niederen Ortsfrequenzen analysiert, da man dort mit weniger Information auskommt Dann werden die Details miteinbezogen Das kann auch manchmal schiefgehen
Konflikt zwischen grobem und feinem Muster
Konflikt zwischen grobem und feinem Muster
Berechnung illusionärer Konturen
Illusionäre Konturen Illusionäre Konturen verhalten sich wie wahre Konturen und können auch optische Täuschungen induzieren
Neurone in V2 Von der Heydt und Peterhans fanden Neurone im Areal V2, die auf illusionäre Konturen reagieren
Merkmalsintegrationstheorie Treisman s Theorie geht davon aus, dass in einer ersten Stufe elementare Merkmale extrahiert werden. Dazu wird keine Aufmerksamkeit benötigt. In einem zweiten Schritt werden diese Merkmale kombiniert. Dazu ist der Fokus der Aufmerksamkeit notwendig.
Texturen Falls sich eine Textur vom Hintergrund in einem der elementaren Merkmale unterscheidet, dann können wir diese ohne Mühe (sprich Aufmerksamkeit) vom Hintergrund trennen
Parallele Suche Das O wird unter den V immer gleich schnell gefunden, ganz egal wie viele Distraktoren (V) vorhanden sind. Die Suche erfolgt parallel gleichzeitig an allen Orten.
Serielle Suche Das R wird unter den P und Q nur sehr schwer gefunden, vor allem wenn viele Distraktoren (P und Q) vorhanden sind. Die Suche erfolgt seriell immer nur an einem Ort.
Serielle und parallele Suche seriell parallel Wenn ein Merkmal parallel gesucht werden kann, dann gehört es zu den elementaren Bildmerkmalen Andere Merkmale, oder Merkmalskombinationen, müssen seriell gesucht werden.
Probleme Parallele Suche wurde für viele Merkmale gefunden (z.b. Krümmung), für die im visuellen Kortex sicherlich keine spezialisierten Detektoren vorhanden sind Es wurden dazwischen liegende Steigungen gefunden. Ab wann ist eine Suche seriell? Die Sucheffizienz hängt in erster Linie von der Salienz des Suchreizes ab
Erkennung durch Komponenten Objekte sind aus elementaren drei-dimensionalen Formen (Geonen) zusammengesetzt Geone sind leicht unterscheidbar aus fast allen Ansichten; Erkennung ist blickwinkelunabhängig Aus 36 Geonen können Tausende von Objekten zusammengebaut werden
Ansichtsinvarianz Aus der Ansicht von oben sind die meisten Geone des Teekessels verdeckt. Die Erkennung fällt schwer.
Bildbasierte Erkennung Die Recognition-by-Components (RBC) Theorie ist intuitiv verständlich, aber Erkennung hängt oftmals vom Blickwinkel ab
Bildbasierte Erkennung Objekte werden im Gedächtnis anhand von Schnappschüssen repräsentiert Diese Schnappschüsse sind aus bestimmten Blickwinkeln aufgenommen (gelernte Ansichten) Diese gelernten Ansichten werden am besten wieder erkannt Für andere Ansichten müssen die vorhandenen Schnappschüsse erst interpoliert werden Erkennung ist deswegen blickwinkelabhängig
Erlernen der Repräsentation Nach einer intensiven Lernphase steigt die neuronale Aktivität in Arealen, die für Erkennung wichtig sind (dort befinden sich auch die Gesichterzellen).
Probleme Was macht die Wahrnehmung so schwierig zu erklären? Wir wissen ziemlich gut wie Kanten entdeckt werden (in V1) Wir wissen nahezu nichts über die Berechnungen, die durchgeführt werden müssen, um Objekte zu erkennen. Wir wissen nur, dass diese Berechnungen sehr schnell ablaufen
Schematische Vorstellung
Objektwahrnehmung Es gibt viele Theorien der Objektwahrnehmung, die aber alle unzureichend sind Objektwahrnehmung ist natürlich von den visuellen Reizen abhängig, aber auch von kognitiven Faktoren Das visuelle System konstruiert die Umwelt so, wie sie am wahrscheinlichsten ist Das war s für heute!