Perzeptive Phonetik Uwe Reichel IPS, LMU München reichelu@phonetik.uni-muenchen.de 11. November 2009
Inhalt I Anatomie und Physiologie des Gehörs II Psychoakustik III Lautwahrnehmung Inhalt 1
I Anatomie und Physiologie des Gehörs Abbildung 1: Frontalschnitt durch das Gehörorgan (nach Zwicker, 1982). I Anatomie und Physiologie des Gehörs 2
Außenohr Ohrmuschel (Aurikel) Schalllokalisierung vorne hinten: hohe spektrale Anteile des von hinten kommenden Schalls werden reflektiert und gelangen daher nicht ins Ohr spektrale Unterschiede des Schalls in Abhängigkeit der relativen Position der Schallquelle Ohrtrichter (Concha): Resonator Äußerer Gehörgang (Meatus Auditivus) Schutz des Mittel- und Innenohrs Resonator (einseitig geschlossenes Rohr): Verstärkung des für Lautsprache relevanten Frequenzbands zwischen (2 5 khz) I Anatomie und Physiologie des Gehörs 3
Mittelohr Trommelfell: schwingungsfähige Membran Gehörknöchelchen (Ossikel): Hammer (Malleus), Amboss (Incus) und Steigbügel (Stapes) Schallverstärkung u.a. durch Hebelwirkung Abbildung 2: Längen- und Flächenverhältnisse bewirken eine Schalldruckverstärkung im Mittelohr. I Anatomie und Physiologie des Gehörs 4
Innenohr Abbildung 3: Teilweise (a) und komplett (b) aufgerollte Schnecke (Cochlea). Scala vestibuli führt vom ovalen Fenster zur Schneckenspitze (Apex, Helicotrema), scala tympani von der Spitze zum runden Fenster. (aus Goldstein, 1997) I Anatomie und Physiologie des Gehörs 5
Abbildung 4: Schnitt durch eine Etage der Cochlea. (aus Wikipedia) Scala vestibuli und Scala tympani sind getrennt durch die Scala Media, deren Unterseite die Basilarmembran bildet. Auf der Basilarmembran sitzt das Cortische Organ (Ort der Sinneszellen), das mit dem Hörnerv verbunden ist. Über ihr befindet sich die Tektorialmembran. I Anatomie und Physiologie des Gehörs 6
Frequenz-Orts-Transformation (nach Békésy, 1960) Die Basilarmembran besitzt ortvariante resonatorische Eigenschaften, d.h. konkret, weiter vorne lenken höhere Frequenzen die Membran maximal aus, weiter hinten tiefere. Die in Schwingung gebrachte Lymphflüssigkeit in der Scala Media löst eine Wanderwelle auf der Basilarmembran aus, die ihre Maximalamplitude in Abhängigkeit der Frequenz entsprechend der ortvarianten resonatorischen Eigenschaften der Membran erreicht. Tonotoper Aufbau der Membran: benachbarte Frequenzen lenken die Membran an benachbarten Stellen maximal aus. An der stärksten Auslenkung der Basilarmembran durch die Wanderwelle, werden Basilarmembran und darüberliegende Tektorialmembran horizontal gegeneinander verschoben. Durch diesen Schereffekt knicken die Stereozilien (Härchen) der dort befindlichen Sinneszellen (innere Haarzellen, Abb. 4), was diese über den Hörnerv ans Gehirn weitermelden. I Anatomie und Physiologie des Gehörs 7
Abbildung 5: Tonotopie der Basilarmembran von Basalwindung (außen) bis Apex (innen). Abbildung 6: Frequenzabhängige Länge der Laufstrecke der Wanderwelle. (aus Pompino-Marschall, 2003) I Anatomie und Physiologie des Gehörs 8
Energietransformationen Außenohr... Mittelohr... Innenohr... aerodynamische Energie T rommelfell mechanische Energie ovalesf enster hydraulische Energie Basilarmembran mechanische Energie Haarzellen biolektr. Energie ZNS Abbildung 7: Das Ohr als Energietransformator. I Anatomie und Physiologie des Gehörs 9
II Psychoakustik Teil der Psychophysik (Fechner, 1860) Anhand physikalischer Größen lässt sich nicht unmittelbar auf die Reizempfindung schließen. Ermittlung des funktionalen Zusammenhangs zwischen physikalischen Größen und Empfindungsgrößen. physikalische Größe Maßeinheit Empfindungsgröße Maßeinheit Schalldruck Pasacal (Pa) oder db Lautheit sone Lautstärke phon Lautheit sone Tonhöhe Hertz (Hz) Tonheit mel,bark Dauer Sekunden (s) subjektive Dauer dura Tabelle 1: Beispiele für physikalische Reizgrößen und entsprechende Empfindungsgrößen allgemeine Methode: systematische Variation von Reizen verbunden mit Befragung von Versuchspersonen zu ihrer Wahrnehmung II Psychoakustik 10
Lautheit Hörfläche Abbildung 8: Hörfläche mit Hörschwelle und Schmerzschwelle. Gutes Hörvermögen v.a. in den für die Wahrnehmung gesprochener Sprache wichtigen Frequenzbereichen. (aus Hess, 2006, Zwicker, 1982) II Psychoakustik 11
Schalldruckpegel in db repräsentiert nicht die wahrgenommene Lautheit, da diese frequenzabhängig ist phon bezogen auf db-werte eines 1-kHz-Sinustons (hier: Phonwerte = db-werte) Kurven gleicher Lautstärke aber: nur für Sinustöne aussagekräftig, keine Aussagen über empfundene Lautstärkeverhältnisse möglich sone auch für komplexen Schall gültig Bezugspunkt: 1 Sone := Lautheit eines 1-kHz-Sinuston mit Schalldruckpegel von 40 db und Dauer von 1 s. Verhältnisskala Verhältnisaussagen möglich (ein Geräusch mit 10 sone wird als doppelt so laut empfunden wie ein Geräusch mit 5 sone). II Psychoakustik 12
Abbildung 9: Kurven gleicher Lautstärke/ Lautheit für Sinustöne. Im Gegensatz zu den Phon- Werten links erlauben die Sone-Werte rechts Rückschlüsse auf Lautheitsverhältnisse (16 sone bedeutet 4x so laut wie 4 sone). Gestrichelte Linie: Hörschwelle. (aus Zwicker, 1982) II Psychoakustik 13
Tonheit Verhältnistonhöhe, Einheit: Mel, 100 Mel = 1 Bark Verhältnis meint: 2 mel wird doppelt so hoch empfunden wie 1 mel Bezugspunkt: 1000 mel = 1-kHz-Sinuston mit 40 db mel-skala bei tiefen Frequenzen eher linear, bei hohen eher logarithmisch Abbildung 10: durchgezogene Linie: Tonheit (in mel) als Funktion der Frequenz (in khz). Zusammenhang bis ca. 500 Hz linear, darüber logarithmisch. (aus Zwicker, 1982) II Psychoakustik 14
III Lautwahrnehmung Vokale Akustische Cues: Abstand von Grundfrequenz und Formantgipfeln in Bark intrinisische Dauer Identifikation isolierter Vokale i.d.r. schwieriger als die Identfikation im Lautkontext, obwohl dort die akustische Variabilität größer ist III Lautwahrnehmung 15
Encodiertheit Koartikulation Laute über weite Bereiche im Signal codiert da dies für alle Segmente gilt, ist jedes Segment akustisch durch die Eigenschaften benachbarte Segmente überlagert lautkontextabhängige Variabilität Streit darüber, ob: perzeptiv nutzbare Invarianzen im Signal zu finden sind (z.b. Motor Theory) anstelle von Invarianzen Redundanzen im Signal sowie die Variabilität selbst bei der Lautwahrnehmung nützlich sind (z.b. H&H-Theorie) III Lautwahrnehmung 16
Konsonanten Kategoriale Wahrnehmung 1. Vollständige perzeptive Zuordnung von Stimuli zu einer bestimmten Anzahl von scharf gegeneinander abgegrenzten Kategorien. 2. Innerhalb einer Kategorie sehr geringe Diskriminationsfähigkeit. 3. Über Kategoriegrenzen hinweg große Diskriminationsfähigkeit. 4. Diskriminationsfähigkeit lässt sich aus Identifikationsfähigkeit vorhersagen. III Lautwahrnehmung 17
Experiment hierzu: Präsentation eines Kontinuums von Plosiv-Vokal-Stimuli Die Transitionen (=zeitliche Änderung der Formantlage an den Plosiv-Vokal-Übergängen) werden in kleinen äquidistanten Schritten so manipuliert, dass der Bereich /bv/ /dv/ /gv/ abgedeckt wird (V=Vokal) Abbildung 11: Zwei-Formant-Stimuli jeweils bestehend aus Plosivtransitionen und einer vokalischen Phase. Der Ausgangspunkt (Locus) der F2-Transition wurde in 13 äquidistanten 120 Hz-Schritten zwischen 1320 Hz und 2880 Hz variiert, wodurch die Plosive /b/, /d/ und /g/ überstrichen werden. III Lautwahrnehmung 18
Identifikationstest: Zuordnung der Stimuli zu den Symbolen (Kategorien) /b/, /d/ und /g/ Ergebnis: innerhalb von Kategorien nahezu vollständige Übereinstimmung, an Kategoriengrenzen scharfe Übergänge Diskriminationstest: Überprüfung der Unterscheidbarkeit der Stimuli Ergebnis: Diskriminationsfähigkeit an Kategoriengrenzen maximal, innerhalb von Kategorien auf Zufallsniveau. III Lautwahrnehmung 19
Abbildung 12: Idealisierte Beziehungen zwischen Identifikations- und Diskriminationsfähigkeit im Fall von kategorialer Wahrnehmung (durchgezogen) und im Fall von kontinuierlicher Wahrnehmung (gestrichelt). Im Falle kategorialer Wahrnehmung lässt sich aus den Identifikationsfunktionen die Diskriminationsfunktion vorhersagen. III Lautwahrnehmung 20
Kategoriale Wahrnehmung: allgemein auditiver vs. speziell phonetischer Prozess? speziell phonetisch psychoakustische Schwellen i.allg. sowohl kategorieintern als auch an Kategoriegrenzen vorhanden Sprachabhängigkeit kategorialer Grenzen (z.b. bei der Voice Onset Time) allgemein auditiv KW nichtsprachlicher Stimuli (z.b. gestrichene vs. gezupfte Saite) KW bei Kleinkindern, Tieren tendentiell KW, wenn Stimulusdetails im sensorischen auditiven Gedächtnis überschrieben werden (z.b. durch Maskierung; kategorialere Wahrnehmung von Vokalen in VC-Silben) III Lautwahrnehmung 21