Universität Ulm Fakultät für Informatik Abteilung Neuroinformatik

Größe: px
Ab Seite anzeigen:

Download "Universität Ulm Fakultät für Informatik Abteilung Neuroinformatik"

Transkript

1 Hauptseminar Sehen und Hören SS 04 Vokalerkennung I Universität Ulm Fakultät für Informatik Abteilung Neuroinformatik Hauptseminar Sehen und Hören SS 2004 Vokalerkennung I Melanie Mayer mm12@informatik.uni-ulm.de Betreuer: Prof. Dr. Günther Palm, Marcus Borst Abstract Die Erkennung von Sprache und im speziellen die Vokalerkennung sind auf Grund der enormen Komplexität der Sprache ein nichttriviales Problem der Phonetik. In dieser Arbeit werden zunächst die Grundlagen der Stimmbildung, insbesondere von Vokalen erläutert, bevor dann eingehender auf die charakteristischen Merkmale der Vokale, die Formanten eingegangen wird. Auf der Basis dieser Grundlage werden Untersuchungen von M.-G. Di Benedetto beschrieben, die sich mit der Erkennung der Vokale im konsonantischen Kontext befassen.

2 1. Sprache Die natürlichste Art der Kommunikation ist es wohl Informationen mittels Sprache auszutauschen. Wie aber lässt sich das gesprochene Signal eindeutig einer Information zuordnen? Um diese Frage zu beantworten ist es zuerst nötig sich mit den elementaren Bestandteilen von Sprache und deren Entsehung zu befassen. Die Frage nach den Bestandteilen formulierte Simpson (1966) wie folgt. Die menschliche Sprache funktioniert einzig und allein über die Erzeugung einer willkürlichen hörbarer Signal, die nicht Zwingenderweise durch den menschlichen Sprechapparat erzeugt werden müssen. Für das Morsealphabet mag diese Intension von Simson durchaus seine Richtigkeit haben. Mit den zwei Signalen Punkt (für ein kurzes Signal) und Strich (für ein langes Signal) konnten geschulte Personen über lange Distanzen hinweg kommunizieren. Im Gegensatz zur menschlichen Sprache ist es allerdings eher schwer zu verstehen und erfordert eine erhöhte Konzentration. Die Dekodierung der einzelnen Signale fordert unter Umständen soviel Aufmerksamkeit, dass der letztendliche Inhalt der Nachricht nicht mehr verfolgt werden kann. Für eine menschliche Kommunikation ist das völlig ungeeignet. Untersuchungen verschiedener Sprachen zeigten zudem, dass verschiedene Laute in so ziemlich allen Sprachen vorkommen. Zu diesen Lauten zählen zum Beispiel die Vokale [a], [i] und [u]. Es scheint also eine Universalmenge an Lauten zu geben, aus der sich die einzelnen Sprachen bilden. Dies wiederlegt damit die Annahme, dass eine willkürliche Signalmenge als Grundlage für Sprache dient. Damit Laute für die Sprachkommunikation geeignet sind müssen sie zunächst einmal zwei grundlegenden Regeln folgen. Einerseits müssen sie vom Sender immer wieder eindeutig produziert werden können und zum anderen vom Empfänger wahrgenommen und unterschieden werden können. Um die Funktionsweise der Sprachkommunikation zu verstehen müssen also zunächst die anatomischen Merkmale und Einschränkungen des menschlichen Sprach- und Hörtrakt betrachtet werden. 2 Im folgenden wird auf Grund ihrer Relevanz für die unterschiedlichen Ausprägungen der Sprachsignale, hauptsächlich auf die zur Stimmbildung nötigen Organe eingegangen. Abb. 1: menschliche Sprachtrakt [1] 2. Stimmbildung Für die Stimmbildung ist zunächst einmal die Art der Rohschallerzeugung von Bedeutung. Darunter versteht man in welcher Weise ein von der Lunge ausgehender Luftstrom ein Sprachsignal anregt. Eine anschließende Filterung des Signals im Vokaltrakt bestimmt dann die letztendliche Aussprache des Lauts. Zur allgemeinen Begriffsbildung wird sowohl auf die Bildung von Vokalen als auch von Konsonanten eingegangen. Die für Vokale relevante Anregung wir als stimmhafte Anregung bezeichnet. Der vom Kehlkopf (Larynx) kommende Luftstrom bildet unterhalb der geschlossenen Stimmritze (Glottis) einen Überdruck und sprengt schließlich diesen Verschluss auf. Der Luftstrom wird dann durch die geöffnete Glottis gepresst und erzeugt dabei einen Unterdruck der die Stimmlippen wieder zusammenpresst. Danach beginnt der Zyklus erneut. (Abb. 2) Abb. 2: phonetischer Anregungszyklus [2] Durch die periodische Unterbrechung des Luftstroms an der Glottis werden die Stimmbänder zu einer periodischen Schwingung angeregt. Das entstehende Signal wird als Grundfrequenz F 0 des Sprachsignals bezeich-

3 net. Sie liegt bei Männern bei einer Frequenz zwischen Hz, bei Frauen und Kinder zwischen Hz und bei Säuglingen bei 400Hz [1]. Die variablen Werte begründen sich auf den unterschiedlichen Längen der Stimmbänder und der individuellen Stärke des Atemdrucks. Die Merkmale können folgendermaßen formal angegeben werden: [+ stimmhaft] für das Vorhandensein von stimmhaften Merkmalen, sowie [- stimmhaft] für die Abwesenheit eben dieses Merkmals. Bei den Vokalen handelt es sich um durchweg stimmhafte Laute. Darum gilt zum Beispiel [a] [+ stimmhaft]. Bei der stimmlosen Anregung durchströmt die Luft die weit geöffnete Glottis ohne dass dabei die Stimmbänder zum Schwingen angeregt werden. Auf Grund irgendeiner Verengung im Mund oder Rachenraum gerät die Luftströmung dann in turbulente Verwirbelungen und erzeugt an der Verengungsstelle ein aperiodisches Schallsignal, einen Frikativlaut. Dabei handelt es sich um ein Rauschen. Die dritte Anregungsart ist eigentlich durch das Fehlen einer Anregung charakterisiert. Der Vokaltrakt wird für eine kurze Zeit von ms Luftdicht verschlossen. Das Öffnen führt dann zu einem plötzlichen Entweichen der Luft und einem damit verbundenen Geräusch. Die daraus resultierenden Laute werden als Plosive bezeichnet. geformt werden. Dadurch wird die für den entsprechenden Laut eindeutige Zielstellung des Vokaltrakts gekennzeichnet. In der Abbildung 4 beispielhaft für die englischen Vokale dargestellt. Abb. 4: Artikulationszentren des Vokaltrakts [4] Für die Signalformung sind vor allem die Stellungen der Zunge und der Lippen von Bedeutung Abb.(5). Im Fall von Nasalen wie zum Beispiel [m] und [n] ist zudem die Stellung des Gaumensegels (Velum) wichtig, da hierdurch der Nasenraum zum Resonanztrakt des Mundraums angeschlossen wird. Bsp.: Im englischen: [map][+ nasal], Das Velum ist während der Produktion des vorstehenden Konsonanten m offen. Abb. 5: Artikulationszentren des Vokaltrakts [4] Abb.3: a) Stimmhaft angeregtes Sprachsignal, (Vokal mit Übergang zu Konsonant), b) stimmloser Frikativ, c) Übergang Vokal-Plosivlaut-Vokal Das nun vorliegende Anregungssignal ist aber noch nicht zur Übermittlung von Sprache geeignet. Das Signal muss im Vokaltrakt zuerst durch entsprechende Artikulationsgesten 3 3. Formanten Unter den Formanten versteht man die charakteristischen Frequenzbereiche eines Sprachsignals, in denen eine besondere Verstärkung durch Resonanz stattfindet [3]. Mit Hilfe der Formanten lassen sich Stimmen und insbesondere auch die Vokale voneinander unterscheiden.

4 Zur Erklärung kann der Vokaltrakt als Ansatzrohr mit schallharten Wänden und einer konstanten Querschnittsfläche modelliert werden. An der geschlossenen Seite befindet sich die Glottis, an der offenen Seite die Lippen. Dieses Modell repräsentiert in dieser Form den neutralen Vokal [ə] (schwa). Wenn an der Glottis nun eine Stimmbandschwingung erzeugt wird breitet sich der Schall in Richtung offene Seite des Rohrs aus. Besonders die Schwingungen, deren Wellenlänge sich den physikalischen Gegebenheiten des Rohrs gut anpassen werden unterstützt und versetzen das Ansatzrohr bei den entsprechenden Frequenzen in Resonanz. Das heißt es findet dann eine Resonanz statt, wenn am geschlossenen Ende ein maximaler Schalldruck und am geschlossenen Ende des Rohrs ein minimaler Schalldruck vorliegt. Bei der Schallerzeugung an der Glottis werden Luftteilchen in Schwingung versetzt. Indem weitere Teilchen angeregt werden breitet sich der Schall in Wellenform aus. Der Luftdruck ist an dieser Stelle maximal. Am offenen Ende des Rohrs strömen die Luftteilchen in die atmosphärische Umgebung und kollidieren kaum noch. Der Luftdruck an dieser Stelle ist dann also minimal. Vergleichbar ist dieser Sachverhalt mit der einem engen Gang in dem sich viele Personen hindurchquetschen. Innerhalb des Gangs rempeln sie oft gegeneinander. Sobald der Gang in eine Halle mündet verteilen sich die Personen und es entstehen keine Kollisionen mehr. Auf der Suche nach einer Wellenform die diesen Randbedingungen entspricht stößt man auf die Sinuswelle. Abbildung 6 zeigt zum Beispiel die niederste Frequenz einer Sinuswelle, die sich den Gegebenheiten des Ansatzrohrs anpasst. Die Distanz zwischen dem Punkt mit dem höchsten und dem mit dem niedrigsten Druck entspricht dem viertel einer Wellenlänge des Sinus. Alle weiteren ungeradzahligen Vielfachen dieser Viertelwelle führen zu Resonanzen (zum Beispiel bei Distanzen von ¾, 5/4 der Wellenlänge). Abb. 6: ¼ Resonanzwelle Zur Berechnung der Resonanzfrequenzen gehen wir von einer Länge des Ansatzrohrs von l=17cm aus, was der durchschnittlichen Länge des männlichen Vokaltrakts entspricht. Die Schallausbreitungsgeschwindigkeit beträgt c=340m/s. Durch die Anregung an der Glottis kann also eine Schallwelle mit der Wellenlänge λ =4*l / (2k-1); k=1,2... erzeugt werden. Für die Berechnung der Resonanzfrequenzen gilt: ƒ k = c/λ für k =1,... Durch Einsetzen ergibt sich dann für die erste Formantenfrequenz mit λ = 4*17 = 68 cm ƒ k =34000/68=500Hz. Diese Frequenz wird auch als der erste Formant F 1 bezeichnet und ist die kleinste Frequenz bei der eine Verstärkung des Signals auftritt. Die Wellenlänge für den zweiten Formanten beträgt mit λ = 4*17/3 = 22,6 cm ƒ k =34000/22,6=1500Hz. Die Resonanzfrequenz des zweiten Formanten beträgt also 1,5kHz. Daraus ergeben sich für das 17 cm lange Ansatzrohr die folgenden Formantenfrequenzen: F 1 =500Hz, F 2 =1,5kHz, F 3 =2,5kHz. Die Formantenfrequenzen werden durch den Querschnitt und die Länge des Vokaltrakts beeinflusst. Da die Schallausbreitungsgeschwindigkeit immer konstant bleibt ist die Frequenz umgekehrt proportional zur Wellenlänge. Bei verkürztem Ansatzrohr verringert sich also die Wellenlänge und die Frequenz steigt an. Eine Verlängerung des Vokaltrakts ist zum Beispiel durch Anspitzen der Lippen oder Senken des Kehlkopfs zu erreichen. Daraus resultieren niedrigere Formantenfrequenzen. Bei Verkürzung des Vokaltrakts steigen die Formanten hingegen an. Für den neutralen Vokal [ə] traf die Modellvorstellung des Ansatzrohrs mit konstantem Querschnitt zu. Da für die anderen Vokale der Querschnitt des Vokaltrakts von der neutralen Stellung abweicht treten Verschiebungen der Formantenfrequenzen ein. Diese Abweichung aus der Normalstellung des Vokaltrakts wird für den englischen Vokal [a] in Abbildung 7 schematisch dargestellt. Die Unterteilung in zwei sich im Querschnitt unterscheidenden Röhren zeigen den verengten Rachenraum und den, geöffneten Mundraum bei der Artikulation des Vokals [a]. 4

5 Abb. 7: schematische Darstellung des Vokaltrakts für den englischen Vokal [a] [5] Als erste Approximation können die beiden ersten Formanten jeweils als ¼ Wellenlängen der Sinuswelle betrachtet werden. Eine Verschiebung des Übergangspunktes X in eine beliebige Richtung und die dadurch entstehende Veränderung der Formanten ist in Abbildung 8 dargestellt. Der Punkt X befindet sich zum Beginn der Betrachtung der beiden Röhren bei 8,5cm. Es ist abzulesen, dass sich bei nur minimaler Verschiebung des Übergangspunkts nach rechts oder links kaum etwas an den Formanten ändert. Kleine artikulatorische Ungenauigkeiten beeinträchtigen also die Qualität des Vokals nicht. Abb. 8: Verschiebung der Formanten [6] Eine etwas genauere Darstellung der Vokaltraktquerschnitte für die Vokale [i], [a] und [u] zeigt Abbildung 9. Akustische und artikulatorische Analysen dieser drei Vokale haben ergeben dass sie die Eckpunkte des Vokaldreiecks bilden. Sie weisen die maximalen Ausdehnungen und Verengungen der Rachen und Mundraums auf. Wenn noch extremer Verengungen auftreten würden käme es zu turbulenten Luftströmungen und einem damit verbundenen Verlust an Vokalqualität. Wenn einer Sprache nur drei Vokale zur Verfügung stehen würden, wären es die Vokale [a], [i] und [u]. Abb. 9: Artikulation der Vokale [i], [a], [u] und die resultierenden Formantenfrequenzen [6] 4. Probleme bei der Vokalerkennung Beim Sprechen werden ca. 20 bis 30 Laute pro Sekunde übermittelt. Da aber die Erkennung der einzelnen Laute nur bei einer Übertragungsrate von 7 bis 9 Stück pro Sekunde erfolgen kann werden die Laute in Artikulationseinheiten, den Silben, zusammengefasst. Wenn eine Silbe aufgenommen wird und dann in die einzelnen Laute zerlegt werden soll ist das nicht möglich. Im englischen Wort bat mit den Konsonanten [b], [t] und dem Vokal [æ] wird beim zerschneiden des Signals sowohl bei [b] als auch bei [t] der Vokal mit herausgehört. Die einleitenden und finalen Konsonanten fließen deshalb in die Formantenfrequenzen mit ein. Bei der Artikulation der Silbe [bat] wird zuerst die charakteristische Stellung des Vokaltrakts für den Konsonant [b] eingenommen. In dieser Stellung wird aber nicht verweilt sondern gleich in die Bildung des Vokals [æ] übergegangen. Bevor aber die Artikulationsgesten wie beim reinen [æ] erreicht werden können wird schon zur Artikulation des Konsonanten [t] gewechselt. Abbildung 10 zeigt die Übergänge von Konsonant zu Vokal am Beispiel der Silben [di] und [du]. Die Schwarzen Bänder stellen die Formanten dar. Es ist deutlich zu erkennen dass sich die beiden Silben nur in den zweiten Formanten unterscheiden. Dies erklärt sich 5

6 daraus, dass beide Silben den selben Startpunkt haben, aber in unterschiedlichen Artikulationen enden. Ein weiteres Problem dass sich bei der Vokalerkennung einstellt sind die sich überschneidenden Formantenbereiche. Wie mit dieser Einschränkung im Zuge der Vokalerkennung umgegangen werden kann und welche Formantenfrequenzen eigentlich für die eindeutige Erkennung der Vokale nötig sind, wird in der folgenden Versuchsbeschreibung näher erläutert. Abb. 10: Übergange von konsonantischeschem Kontext zum Vokal am Beispiel von [di] und [du] [6] 5. Untersuchung der zeitlichen und spektralen Eigenschaften der ersten Formantenfrequenz[5] 5.1 Versuchsbedingungen Die den folgenden Analysen zugrundeliegenden Sprachdaten stammen von zwei männlichen und einem weiblichen Sprecher. Berücksichtigt werden die 5 amerikanischen Vokale [І] hid, [ε] head, [æ] bad, [a] are, [Λ] but sowie die Vokalpaaren [a,λ], [æ, ε]. Die Vokale wurden alle in Konsonant-Vokal- Konsonant (CVC) Silben unter der Verwendung der Konsonanten [b, d, g, p, t, k] betrachtet. Zum Vergleich wurden auch noch Silben der Form hvd (hid, head, had, hud,...) und #Vd (ohne einleitenden Konsonanten) betrachtet, da dabei der Vokal nur minimal von seinem konsonantischen Umfeld beeinflusst wird. 6 Jeder Sprecher musste jede der möglichen CVC Silben im Kontext des Satzes The _ again sprechen. Die Reihenfolge der Silben wurde für jeden Sprecher per Zufall erzeugt. Zur weiteren Verarbeitung wurde das aufgenommene Sprachmaterial zuerst tiefpassgefiltert und abgetastet und auf der MIT-Speech VAX-750 gespeichert. Zur Analyse wurde die Software KLSPEC von Dennis Klatt verwendet. Mit ihr war es möglich Signalteile am Bildschirm darzustellen. Zur Gewinnung der Signalausschnitte wurde ein Hamming- Fenster 1 der Breite 30ms verwendet. Durch die weich an- und abklingenden Anfangs- und Endbereiche des Fensters werden die Signale dort abgeschwächt und im mittleren Bereich verstärkt. Für den Erhalt der für jeden Sprecher unterschiedlichen Grundfrequenzen F 0 wurden die unter 3000Hz auftauchenden lokalen Maxima betrachtet und die am harmonischsten auftretende Frequenz als F 0 angenommen. Mit KLSPEC lässt sich zudem ein Pseudo-Breitbandspektrum und ein LPC 2 - Spektrum (linear-prediction coding spectrum) des Sprachsignals erzeugen. Für die Bestimmung der Formantenfrequenzen wurde vor allem das geglättete Breitbandspektrum in der folgenden Abbildung betrachtet. Zur Kontrolle wurden die Formanten im Zweifelsfall manuell extrahiert und mit den Werten des LPC verglichen 1 Fensterfunktion Hamming-Fenster w[n]= 0,54 0,46 cos(2pn/(n-1)), 0<=n<=N-1 2 LPC Beim LPC werden die Signalveränderungen statt des Sprachsignals selber betrachtet.

7 Die Datenanalyse soll vor allem das Problem der Mehrdeutigkeiten des ersten Formanten näher beleuchten, inwieweit also der Vokal mittels F 1 klassifiziert werden kann. Die Ergebnisse der Analysen werde dann mit den früheren Erkenntnissen über Vokale aus der F 1 -F 2 -Dimension verglichen. In dieser Studie wurden die Formanten zu dem Zeitpunkt abgetastet, an dem F 1 sein Maximum im Formantenverlauf einnimmt. Der Formantenverlauf geht von relativ niedrigen Werten am Anfang über ein Maximum und fällt zum Ende hin wieder ab. 5.2 Messergebnisse Die Analyse der Sprachsignale ergab, für die drei Sprecher, die in den Abbildungen 12 angezeigten Formantenfrequenzen im F 1 -F 2 - Raum. Jeder der Punkte repräsentiert eine Vokalrepräsentation in einer der gesprochenen Silben. Auf den ersten Blick kann man erkennen, dass bei jedem der Sprecher Überlappungen in der F1 Dimension auftreten. Keinerlei Überlappungen treten in der F2 Dimension auf. Die vorne artikulierten Vokale [І], [ε], [æ] sind also klar von den hinten artikulierten Vokalen [a], [Λ] separiert. Die Überlappungen der Vokalbereiche der einzelnen Sprecher sind hier tabellarisch zusammengefasst. Der erste männliche Sprecher wird im folgenden durch KS abgekürzt, der zweite männliche Sprecher durch JP und die weibliche Sprecherin durch CR. Sprecher [І] [ε] [æ] [a] [Λ] KS x x x x x x JP x x x x x x CR x x Tabelle 1: Überlappungsbereiche der Vokale für alle Sprecher In Abbildung 13 werden die Resultate der einzelnen Sprecher verglichen. Die F1- Bereiche des Vokals [I] sind für alle Sprecher annähernd gleich. Die F 2 -Werte der weiblichen Sprecherin sind für vorne im Vokaltrakt artikulierten Werte durchweg höher als die ihrer männlichen Kollegen. Abb. 12: Vokalbereiche der 3 Sprecher (KS), (JP) und (CR ) [5] Dies resultiert aus der Tatsache, dass in diesem Fall der hintere Vokaltrakt für den zweiten Formanten verantwortlich ist. Wegen der anatomische Größenunterschiede erzeugt der kleinere Resonanzraum bei weiblichen Sprechern eine höhere Resonanzfrequenz. Um die Überlappungsflächen jedes Sprechers für jedes Vokalpaar quantitativ beurteilen zu können, wurde für jedes dieser Paare ein Abstand berechnet der die Streuung der Messwerte berücksichtigt. Bei dieser Art der Distanzberechnung haben Punkte die innerhalb einer betrachteten Menge liegen einen geringeren Abstand als eigentlich gleich weit entfernte Punkte, die aber außerhalb der Menge liegen. Je kleiner also die errechneten Distanzen werden, desto größer sind die Überlappungen der betrachteten Mengen. Die Ergebnisse der Distanzberechnungen bestätigen die 7

8 schon in den Abbildungen 12 beobachteten Kollisionen der Vokalbereiche. Abb. 13: Kombinierte Vokalbereiche der 3 Sprecher (KS), (JP) und (CR ) [5] In einem nächsten Analyseschritt sollten die Positionsveränderungen der Formanten im konsonantischen Kontext mit den Formantenmustern der Silben #Vd und hvd verglichen werden. Die Formantenlagen der Silben #Vd und hvd ebenso wie die eines isolierten Vokals werden als das zu erstrebende Artikulationsziel dieses Vokals angesehen. Wie bereits im Abschnitt 4 angedeutet wurde, können die Vokale im zusammenwirken mit Konsonanten dieses Ziel meist nicht erreichen. Da sich die F 1 Positionen der betrachteten Konsonanten alle bei niedrigeren Frequenzen als die F 1 -Frequenzen der analysierten Vokale befinden, hat dies für die Vokale eine Anpassung ihrer Formantenwerte an die Zielstellungen der Konsonanten zu Folge. Es muss noch ergänzt werden, dass sich bei der weiblichen Sprecherin für den Vokal [ε] eine den Zielwert überschreitende erste Formantenfrequenz beobachten lässt. Solche Ausnahmen können dann auftreten wenn die Zunge einen niedrigeren Stand als erwartet einnimmt. 5.3 Zeitliche und spektrale Eigenschaften von F In den bisherigen Studien wurde der Effekt der Veränderten ersten Formantenfrequenz bei der Artikulation eines Vokals im Zusammenspiel mit Konsonanten eher als ein limitierender Störungsfaktor betrachtet. In den weiteren Betrachtungen wird aber eben dieser Effekt als eine zusätzliche Informationsquelle für F1 zur eindeutigeren Vokalerkennung vorgeschlagen. Um diese Hypothese zu verifizieren wurden die Verläufe des ersten Formanten eingehender studiert. Zwei Aspekten wurde besondere Aufmerksamkeit geschenkt. Zum einen wird der zeitliche Formantenverlauf und die Zusammenhänge zwischen dem F1-Maximum und der Onglide-Dauer in Relation zu der Gesamtvokallänge genauer betrachtet. Und zum anderen werden die Spektralen Eigenschaften des F1- Maximums in Bezug auf den Startwert des Formantenverlaufs beleuchtet. Bei den hierfür betrachteten Vokalpaaren [ε, æ], [a, Λ] handelt es sich um [+tense, +lax] Paare. Diese Klassifikation zeigt sich in der wahrgenommenen Vokalhöhe und Vokaldauer. Die gespannten (tense) Vokale sind höher und dauern länger als die schlaffen (lax) Vokale. Als drittes Vokalpaar wurde [I, ε] hinzugenommen. Da sich das [+tense, +tense] Paar nur in der wahrgenommenen Tonhöhe unterscheidet und im Zeitbereich identische Eigenschaften aufweist, kann dadurch herausgefunden werden welchem Merkmal welches zeitliche Verhalten zuzuschreiben ist. Die gemischten Paare allein ermöglichen keine eindeutige Zuordnung. Abbildung 14 zeigt für beide Vokale jeweils die Formantenverläufe in zwei unterschiedlichen Kontexten. Es ist erkennbar, dass die Silben, die den Vokal [I] beinhalten deutlich kürzer sind und ihr Maximum eher im Endbereich des Vokals erreichen. Für die Silbe [ε] im konsonantischen Kontext stellt sich eine andere Situation dar. Bereits ca ms nach der Einleitung des Vokals tritt das F 1 Maximum auf. Um eine Verbindung zwischen den Werten des F 1 Abb. 14: F 1 Verlauf für die Silben bib und kip [5] 8

9 voneinander unterschieden werden können, und somit zusätzlich an den Vokalgrenzen unterschiedliche F 1 Timing Werte vorliegen müssen. Diese Hypothese konnte durch Analysen bestätigt werden und ergab für die Vokale [I] und [ε] im F 1 Maximum - F 1 Timing Raum eine größere Unterscheidungsmächtigkeit als im zu Anfang betrachteten F 1 -F 2 Raum. Abb. 15: F 1 Verlauf für die Silben bεg und dεg [5] Maximums und seines zeitlichen Auftretens zu erhalten, wurde zunächst für alle Sprecher und Vokale das F1 Timing errechnet. Hiermit wird das Verhältnis der Dauer des einleitenden Konsonanten im Verhältnis zur gesamten Vokaldauer berechnet. Die sich ergebenen Korrelationskoeffizienten sind in der Tabelle 2 dargestellt. Ein Korrelationskoeffizient mit einem Wert nahe bei 1 bedeutet, dass mit steigendem F1 Maximum auch das F1 Timing ansteigt, also das Maximum erst später im Formantenverlauf erreicht wird. Sprecher [І] [ε] [æ] [a] [Λ] KS 0,62 0,53 0,11 0,03 0,27 JP 0,71 0,7 0,2 0,1 0,22 CR 0,56 0,53 0,22 0,11 0,15 Tabelle 2: Korrelationskoeffizienten aller Sprecher Für Koeffizienten im Bereich der 0 lassen sich kaum Beziehungen zwischen dem Maximum und seinem zeitlichen auftreten feststellen. Abbildung 16 veranschaulicht die Korrelation des Maximums mit der F 1 Zeitkomponente für die Vokalpaare [I, ε] sowie [ε, æ]. Für [I] und [ε] lässt sich erkennen, dass für ein Maximum mit einer höheren Frequenz systematisch auch das F1 Timing ansteigt. Bei einem minimalen Maximum wird der Timing Wert dagegen kleiner. Für die anderen Paare können solche Aussagen nicht getroffen werden. Neben den Beziehungen zwischen F 1 Timing und Maximum der Vokale [I] und [ε], lässt sich noch feststellen, dass im F 1 Maximum und F 1 Timing Raum die beiden Vokale gut 9 Abb. 16: F 1 Maximum versus F 1 Timing[5] Um den Spektralen Eigenschaften von F1 auf die Spur zu gelangen mussten zunächst die F1 Maxima mit den Anfangswert der Vokale in Verbindung gebracht werden. Wie zuvor im Zeitbereich wurde für jeden Sprecher und jeden Vokal ein Korrelationskoeffizient berechnet In der Abbildung 16 ist zu erkennen dass für alle drei betrachteten Vokalpaare mit einem höheren Maximalwert auch ein ansteigender Anfangswert verbunden ist. Auch hier können im F 1 Maximum-F 1 Startwert Raum die Vokalbereiche von [I] und [ε] aller Sprecher eindeutig unterschieden werden, was zuvor im F 1 -F 2 Raum nicht möglich war. Für die beiden anderen Paare sind aber auch hier Überlappungen festzustellen.

10 Die zuvor einzeln Betrachteten Eigenschaften werden nun versucht in Beziehung zu setzen. Dazu wurden die bisherigen Ergebnisse Korreliert. Bereits bekannt war, dass für die Vokale [I] und [ε] bei ansteigendem F 1 Maximum sowohl ein Ansteigen des Verhältnisses von der Onglide-Dauer zur gesamten Vokaldauer als auch ein ansteigen des Startwerts zu erkennen ist. Die im nächsten Schritt berechnete Zusammenhangskomponente dieser drei Merkmale wird als die Geschwindigkeit von F 1 bezeichnet. Das Ziel war es herauszufinden ob die Sprechgeschwindigkeit des Vokals mit dem F1 Maximum in Verbindung gesetzt werden kann. Um Ergebnisse zu erhalten wurde die Onglide-Dauer der Vokale in Relation zu der Differenz zwischen Start- und Maximalwert von F 1 gesetzt. Die errechneten Korrelationswerte zwischen F1 Maximum und der F1 Geschwindigkeit waren für alle drei Sprecher nur minimal (im Bereich von 0,02 bis 0,28). Bei einer Veränderung der Sprechgeschwindigkeit sind also keine Signifikanten Veränderungen (durch sie zeitlichen und spektralen Eigenschaften) für die F1 Maxima feststellbar. 5.4 Zusammenfassung Die Betrachtungen von Vokalen in konsonantischen Umgebungen weisen im Vergleich zu isoliert gesprochenen Vokalen Veränderungen im Bereich der Formantenfrequenzen auf. Um Vokale trotzdem klassifizieren zu können, mussten die Attribute der Formantenverläufe in zeitlicher und spektraler Hinsicht untersucht werden, um eindeutige Repräsentationsmerkmale zu finden. Die Untersuchungen des zeitlichen Verlaufs des ersten Formanten haben ergeben, dass die Art und Weise wie das Maximum erreicht wird für die Erkennung von Bedeutung ist. Bei den Vokalen [I] und [ε], wurde eine Beziehung zwischen der Onglide-Dauer relativ zur gesamten Vokaldauer und dem F 1 Maximum festgestellt. Da die Angleitdauer vom Initialen Konsonanten abhängt, bestimmt der Konsonant die Vokalausprägung. Zudem gab es bei der Darstellung der Vokale im F 1, F 2 Raum für fast alle Sprecher Überschneidungen der Vokalbereiche in F 1 Richtung. Im neu betrachteten Raum F1 Maximum versus F1 Timing treten zumindest für die Vokale [I] und [ε] keine Mehrdeutigkeiten 10 mehr auf. Der gleiche Effekt ist bei der Untersuchung der Formantenverläufe im Bezug auf ihre Anfangswerte zu beobachten. Die F1 Maxima und die Anfangswerte stehen in enger Beziehung und ergeben für [I] und [ε] auch in diesem Fall eine gute Unterscheidungsbasis. Abschließend konnte aber keine systematische Beziehung zwischen den zeitlichen und spektralen Eigenschaften des ersten Formanten und der Sprechgeschwindigkeit erkannt werden. Die Ergebnisse der Studie sollten zu dem Schluss führen, dass die kontextuellen Umgebungen der Vokale nicht unbedingt als Störfaktor für die Vokalerkennung gesehen werden müssen, sondern deren Eigenschaften als Informationsquelle für die Erkennung der Vokale dienen kann. 6. Literaturverzeichnis [1] Akustische Phonetik ganz kurz [2] Akustische Phonetik Kapitel II Was ist Sprachschall? [3] Formant [4] Grundlagen der Phonetik (1 und 2) Rheinische Friedrich Wilhelms-Univeristät Bonn [5] M.-G. Di Benedetto, Vowel representation: Some observations on temporal and spectral properties of the first formant frequecy Acoustical Society of America (1), July 1989 [6] P. Lieberman, On the origin of language, Macmillan Publishing Co. Inc, New York, 1975 ISBN

Was passiert beim Sprechen?

Was passiert beim Sprechen? Was passiert beim Sprechen? supra-laryngales System (Vokaltrakt) Artikulation Kehlkopf (Larynx) sub-glottales System Stimmgebung (Phonation) Atmung (Respiration) Laute, die mit den Lippen gebildet werden:

Mehr

2 Perioden in 0.02 s 1 Periode in 0.01 s 100 Perioden in 1 s, Grundfrequenz = 100 Hz

2 Perioden in 0.02 s 1 Periode in 0.01 s 100 Perioden in 1 s, Grundfrequenz = 100 Hz 1. Die Abbildung in (a) zeigt einen synthetischen [i] Vokal. Was ist die Grundfrequenz davon? (Die Zeitachse ist in Sekunden). 2 Perioden in 0.02 s 1 Periode in 0.01 s 100 Perioden in 1 s, Grundfrequenz

Mehr

Spektra von periodischen Signalen. Resonanz. Jonathan Harrington

Spektra von periodischen Signalen. Resonanz. Jonathan Harrington Spektra von periodischen Signalen. Resonanz. Jonathan Harrington Spektrum von einem Zeitsignal Zeitsignal 1. Das Zeitsignal wird durch eine Fourier- Analyse in Sinusoiden zerlegt 2. Spektrum: die Abbildung

Mehr

Spracherkennung. 4. Sitzung 23. Oktober 2008

Spracherkennung. 4. Sitzung 23. Oktober 2008 Spracherkennung 4. Sitzung 23. Oktober 2008 Überblick Wiederholung 3 Akustik 3 Artikulation Studie zu Veränderung der Artikulation bei Lärm 4 Sprachwahrnehmung Kategoriale Sprachwahrnehmung beim Menschen

Mehr

Sitzung 5. Spektrogramm

Sitzung 5. Spektrogramm Spektrogramm Das Spektrogramm stellt 3 Dimensionen dar: x-achse: Zeit (ms) - vgl. Dauer in der Perzeption y-achse: Frequenz (Hz) - vgl. Tonhöhe und Klangqualität in der Perzeption Schwärzungsgrad: Energie

Mehr

Die akustische Analyse von Sprachlauten.

Die akustische Analyse von Sprachlauten. Die akustische Analyse von Sprachlauten. Die Interpretation von Spektrogrammen. Jonathan Harrington IPDS, Kiel. Vom Zeitsignal zum Spektrum s t a m 1. Ein Teil vom Sprachsignal aussuchen: die Zeitauflösung

Mehr

Seminar Akustik. Aufgaben zu Teil 2 des Skripts Uwe Reichel, Phil Hoole

Seminar Akustik. Aufgaben zu Teil 2 des Skripts Uwe Reichel, Phil Hoole Seminar Akustik. Augaben zu Teil des Skripts Uwe Reichel, Phil Hoole Wie kommt nach der Quelle-Filter-Theorie der Sprachschall zustande?! Rohschallgenerierung an der Quelle! Verormung durch nachgeschaltetes

Mehr

Lesen von Sonagrammen I: Grundlagen. Uwe Reichel IPS, LMU München 16. November 2007

Lesen von Sonagrammen I: Grundlagen. Uwe Reichel IPS, LMU München 16. November 2007 Lesen von Sonagrammen I: Grundlagen Uwe Reichel IPS, LMU München reichelu@phonetik.uni-muenchen.de 16. November 2007 Inhalt Das Sonagramm: Allgemeines Gewinnung des Sonagramms Zeitsignal Spektrum Spektrogramm

Mehr

Rohrmodelle für Vokale

Rohrmodelle für Vokale Rohrmodelle für Vokale Jonathan Harrington, IPDS, Kiel Mai 2003 Herunterladen: http://www.ipds.uni-kiel.de/jmh/ss03/ac/rohr.pdf Die Stelle der geringsten Verengung Wie Konsonanten haben Vokale eine gewisse

Mehr

Beabsichtigte und automatische Aspekte der Sprachproduktion und Sprachperzeption. am

Beabsichtigte und automatische Aspekte der Sprachproduktion und Sprachperzeption. am Beabsichtigte und automatische Aspekte der Sprachproduktion und Sprachperzeption am 13.11.2016 1 Vortragsgliederung 1.Grundlagen 2.Hauptfaktoren 2.1.Vokalnasalisierung 2.2.Voice Onset Time 2.3.Vokaldauer

Mehr

2. Schallentstehung. Erstellt: 03/2005 Hannes Raffaseder / FH St. Pölten / Telekommunikation und Medien 1/25

2. Schallentstehung. Erstellt: 03/2005 Hannes Raffaseder / FH St. Pölten / Telekommunikation und Medien 1/25 2. Schallentstehung Erstellt: 03/2005 Hannes Raffaseder / FH St. Pölten / Telekommunikation und Medien 1/25 1 Schallentstehung Schallquellen können im Allgemeinen in bis zu drei Teilkomponenten zerlegt

Mehr

Spracherkennung. 8. Sitzung 3. November 2008

Spracherkennung. 8. Sitzung 3. November 2008 Spracherkennung 8. Sitzung 3. November 2008 Überblick 5. Diskretisierung 6. Merkmalsberechnung 7. DTW 8. HMMs 9. Sprachmodellierung w X Textproduktion Artikulation Merkmalsextraktion Dekodierung 2. Sprachproduktion

Mehr

Programme (hier können Sie selber üben) Einführung in die Linguistik (Ling 101) WS 2009/10. Wiederholung. Thema heute: Sprachsignale

Programme (hier können Sie selber üben) Einführung in die Linguistik (Ling 101) WS 2009/10. Wiederholung. Thema heute: Sprachsignale Fachbereich Sprachwissenschaft Einführung in die Linguistik (Ling 101) WS 2009/10 Programme (hier können Sie selber üben) Für die Demo in der heutigen Vorlesung wird Praat benutzt Link: http://www.fon.hum.uva.nl/praat/

Mehr

Akustische Phonetik Teil 3. Uwe Reichel, Phil Hoole IPS, LMU München

Akustische Phonetik Teil 3. Uwe Reichel, Phil Hoole IPS, LMU München Akustische Phonetik Teil 3 Uwe Reichel, Phil Hoole IPS, LMU München Inhalt! Vokalformanten: Weitere Anmerkungen! Nasale Konsonanten! Frikative Vokalformanten: Weitere Anmerkungen Ergebnisse typischer Formantmessungen

Mehr

Formanten im Detail. Jochen Trommer Phonetikanalyse SS Universität Leipzig Institut für Linguistik

Formanten im Detail. Jochen Trommer Phonetikanalyse SS Universität Leipzig Institut für Linguistik Formanten schematisch im Spektrogramm Formanten Hören Jochen Trommer jtrommer@uni-leipzig.de Universität Leipzig Institut für Linguistik Phonetikanalyse SS 2007 Artikulation von Vokalen Vokale unterscheiden

Mehr

ARTIKULATORISCHE PHONETIK! Einleitung"

ARTIKULATORISCHE PHONETIK! Einleitung Beat Siebenhaar! Einleitung" Initiation" Bildung des zur Lauterzeugung notwendigen Luftstroms!! Suprasegmentalia! Phonation" Stimmgebung!! Suprasegmentalia! Artikulation" Modifikation des Luftstroms zur

Mehr

4. Sitzung Akustik III

4. Sitzung Akustik III K3.1 Phonetik und Phonologie II 4. Sitzung Akustik III http://menzerath.phonetik.uni-frankfurt.de/teaching/k3_1.html Akustische Eigenschaften von Heliumsprache Audiobeispiele Heliumsprache Wolfe, Joe,

Mehr

Kapitel 1, Teil 2: Basiswissen Phonetik

Kapitel 1, Teil 2: Basiswissen Phonetik Kapitel 1, Teil 2: Basiswissen Phonetik Prof. Dr. Bernd J. Kröger Inhalt Kommunikationskette: Gesprochene Sprache und Sprachsystem Initiation, Phonation und Artikulation Akustogenese und akustische Lautmerkmale

Mehr

Störgeräuschreduktion bei stimmhaften Sprachsignalen

Störgeräuschreduktion bei stimmhaften Sprachsignalen Störgeräuschreduktion bei stimmhaften Sprachsignalen Einkanaliges Mikrofon Nutzsignal Störgeräusche Allgemein: einkanalige Störgeräuschreduktion Folie 1 Gliederung Störgeräuschreduktion: Arten und Einsatzgebiete

Mehr

Akustische Phonetik. Uwe Reichel, Phil Hoole IPS, LMU München

Akustische Phonetik. Uwe Reichel, Phil Hoole IPS, LMU München Akustische Phonetik Uwe Reichel, Phil Hoole IPS, LMU München Phonetische Vorgänge Die Bereiche des signalphonetischen Bandes Aus Pompino-Marschall (1995), Abb. 2, S. 14 Inhalt Teil I: Allgemeine Akustik

Mehr

Lesen von Sonagrammen II: Bestimmung des Artikulationsmodus

Lesen von Sonagrammen II: Bestimmung des Artikulationsmodus Lesen von Sonagrammen II: Bestimmung des Artikulationsmodus Uwe Reichel IPS, LMU München reichelu@phonetik.uni-muenchen.de basierend auf Kirsten Macheletts Online-Script http://www.phonetik.uni-muenchen.de/lehre/skripten/

Mehr

Vokale und die Quantaltheorie. Jonathan Harrington

Vokale und die Quantaltheorie. Jonathan Harrington Vokale und die Quantaltheorie Jonathan Harrington Vokale und die Quantaltheorie. 1. die Berechnung von Formanten in einem ein 3- Rohr System. 1(a) Hinterrohr, 1 (b)helmholzresonator, Vorderrohr. 2. Daraus

Mehr

Name: Matrikelnr.: Johann Wolfgang Goethe-Universität Frankfurt am Main

Name: Matrikelnr.: Johann Wolfgang Goethe-Universität Frankfurt am Main Name: Matrikelnr.: Johann Wolfgang Goethe-Universität Frankfurt am Main Empirische Sprachwissenschaft Pflichtmodul K3 Phonetik und Phonologie II SoSe 2017 PROBEKLAUSUR Bitte leserlich und kurz antworten.

Mehr

Einführung in die Phonetik und Phonologie

Einführung in die Phonetik und Phonologie Einführung in die Phonetik und Phonologie Oro-nasaler Prozess Oro-nasaler Prozess Artikulationsprozess Oro-nasaler Prozess Luftstromprozess Phonationsprozess Fragen zur Konsonantenbeschreibung Man kann

Mehr

Akustische Phonetik Lautklassifikation Übungen. Phonetik II. Gerrit Kentner. 13. Juni / 36

Akustische Phonetik Lautklassifikation Übungen. Phonetik II. Gerrit Kentner. 13. Juni / 36 Phonetik II Gerrit Kentner 13. Juni 2010 1 / 36 Was bisher geschah Die Phonetik untersucht Sprachlaute in ihren messbaren physiologischen und physikalischen Eigenschaften Teilbereiche Artikulatorische

Mehr

Was bisher geschah. Phonetik II. Heute: Nachtrag artikulatorische Phonetik

Was bisher geschah. Phonetik II. Heute: Nachtrag artikulatorische Phonetik Was bisher geschah Phonetik II Gerrit Kentner Die Phonetik untersucht Sprachlaute in ihren messbaren physiologischen und physikalischen Eigenschaften Teilbereiche Artikulatorische Phonetik Prozesse der

Mehr

Wiederholung. Konsonantenchart des Deutschen nach Hall 2000

Wiederholung. Konsonantenchart des Deutschen nach Hall 2000 Wiederholung Konsonantenchart des Deutschen nach Hall 2000 Die Anordnung der IPA-Tabelle spiegelt die verschiedenen Kriterien der Lautklassifizierung wider. Wiederholung Konsonanten Werden in der Regel

Mehr

Konsonanten: Artikulationsart

Konsonanten: Artikulationsart Jochen Trommer jtrommer@uni-leipzig.de Universität Leipzig Institut für Linguistik Phonetikanalyse SS 2007 Artikulationsarten Approximanten Plosive Frikative Affrikaten Laterale Nasale geschlagene Laute

Mehr

FRIKATIVE Wie sehen stimmhafte und stimmlose Frikative im Spektrogramm aus? Was unterscheidet die stimmlosen von den stimmhaften Frikativen? Worin unt

FRIKATIVE Wie sehen stimmhafte und stimmlose Frikative im Spektrogramm aus? Was unterscheidet die stimmlosen von den stimmhaften Frikativen? Worin unt FRIKATIVE /Tondateien/Frikative/bach-traegt-wenig-wasser.wav: Der Bach trägt dieses Jahr wenig Wasser. /Tondateien/Frikative/schickt-er-blumengruesse.wav: Weil er etwas mundfaul ist, schickt er ihr lieber

Mehr

Die Phonetik von Tonhöhe

Die Phonetik von Tonhöhe Jochen Trommer jtrommer@uni-leipzig.de Universität Leipzig Institut für Linguistik Phonetikanalyse SS 2007 Überblick Die Akustik von Tonhöhe Tonhöhe & Musik Der Phonationszyklus Die Tonhöhe von Sinussschwingungen

Mehr

Gunnar Fant (1960): Acoustic theory of speech production. Gerold Ungeheuer (1962): Elemente einer akustischen Theorie der Vokalartikulation

Gunnar Fant (1960): Acoustic theory of speech production. Gerold Ungeheuer (1962): Elemente einer akustischen Theorie der Vokalartikulation Formanten Gipfel im Spektrum, Energiemaxima: Formanten Formanten entstehen infolge selektiver Verstärkung bestimmter Frequenzbereiche, entsprechend der Resonanzcharakteristika des menschlichen Sprechapparates.

Mehr

MUSTERLÖSUNGEN. 1. Übung 1

MUSTERLÖSUNGEN. 1. Übung 1 MUSTERLÖSUNGEN 1.1. Aufgabe. Transkribieren Sie ins IPA: 1. Übung 1 Bett - [bet] Decke - [dek@] Beet - [be:t] Apfel - [apf@l] oder [apfl " ] Madrid - [madrit] (mit alveolarem Trill, d.h. gerolltem Zungen-R

Mehr

K3.1 Phonetik und Phonologie II. 4. Sitzung.

K3.1 Phonetik und Phonologie II. 4. Sitzung. K3.1 Phonetik und Phonologie II 4. Sitzung http://menzerath.phonetik.uni-frankfurt.de/teaching/k3_1.html Grundfrequenz - Periodendauer f = 1 / T Frequenz (Hz) ist der Kehrwert der Periodenlänge (s) T =

Mehr

Sprechen als aerodynamischer Prozess = Grundeigenschaft C

Sprechen als aerodynamischer Prozess = Grundeigenschaft C Sprechen als aerodynamischer Prozess = Grundeigenschaft C Die Aufgabe der Sprechorgane: Luftstrom erzeugen und gestalten Was setzt ein (Luft)strom voraus? Sprechen als aerodynamischer Prozess = Grundeigenschaft

Mehr

Mikro und Makroprosodie. Jonathan Harrington Felicitas Kleber

Mikro und Makroprosodie. Jonathan Harrington Felicitas Kleber Mikro und Makroprosodie Jonathan Harrington Felicitas Kleber Eine akustische Analyse der Makroprosodie setzt ebenfalls eine Entfernung mikroprosodischer Eigenschaften voraus. Mikroprosodie Mikro- und Makroprosodie

Mehr

Das Quelle-Filter-Modell der Vokalproduktion

Das Quelle-Filter-Modell der Vokalproduktion Jochen Trommer jtrommer@uni-leipzig.de Universität Leipzig Institut für Linguistik Phonetikanalyse SS 2007 Beispiel 1: Federpendel Beispiel 2: Weingläser Schwingung beim Federpendel Beispiel 1: Federpendel

Mehr

Spielarten der Phonetik

Spielarten der Phonetik Jochen Trommer jtrommer@uni-leipzig.de Universität Leipzig Institut für Linguistik Phonologie/Morphologie SS 2007 Was ist ein Laut? Antwort 1: Antwort 2: Antwort 3: eine charakteristische Luftdruckschwankung

Mehr

Ergebnisse und Interpretation 54

Ergebnisse und Interpretation 54 Ergebnisse und Interpretation 54 4 Ergebnisse In den Abbildungen 24/4.1 bis 29/4.1 werden die Laktat-Geschwindigkeits-Kurve und die Herzfrequenzwerte der beiden Schwimmgruppen (Männer: n=6, Frauen: n=8)

Mehr

PHONETIK UND PHONOLOGIE DES DEUTSCHEN - DIFFERENZEN UND INTERFERENZEN AUS DEM

PHONETIK UND PHONOLOGIE DES DEUTSCHEN - DIFFERENZEN UND INTERFERENZEN AUS DEM PHONETIK UND PHONOLOGIE DES DEUTSCHEN - DIFFERENZEN UND INTERFERENZEN AUS DEM PORTUGIESISCHEN Dra. Katja Reinecke, DAAD-USP, 2.10. 2014 Ziele der Sitzung Wiederholung der Merkmale der deutschen Konsonanten

Mehr

Sprachwahrnehmung beim Säugling

Sprachwahrnehmung beim Säugling Sprachwahrnehmung beim Säugling Referent: Markus Desoi Eimas, P. D. (1990): Sprachwahrnehmung beim Säugling. Gehirn und Kognition, Spektrum der Wissenschaft, 120-127. Grundlegende Voraussetzungen Kinder

Mehr

8 Akustische Phonetik

8 Akustische Phonetik 8 Akustische Phonetik Die Quelle eines Lautes ist ein Klangkörper, z.b. die Holzstäbe eines Xylofons, das Fell einer Trommel, die Lippen beim Spielen einer Trompete, das Rohrblatt einer Klarinette, das

Mehr

7. Sitzung. Kategoriale Wahrnehmung, McGurk-Effekt

7. Sitzung. Kategoriale Wahrnehmung, McGurk-Effekt K3.1 Phonetik und Phonologie II 7. Sitzung Kategoriale Wahrnehmung, McGurk-Effekt Hörfläche 2 Der stillste Raum der Welt Orfield Laboratories, USA 3 Wahrnehmung von Lautstärke Lautstärke wird in db (DeziBel)

Mehr

Einführung in die Phonetik und Phonologie. Grundbegriffe

Einführung in die Phonetik und Phonologie. Grundbegriffe Einführung in die Phonetik und Phonologie Grundbegriffe Phonetik und Phonologie Lautlehre Phonologie Sprechakt- lautlehre Phonetik Sprachgebilde- lautlehre Phonologie Phonematik Phonemik Phonetik und Phonologie

Mehr

Akustische basierte Kommunikation

Akustische basierte Kommunikation Akustische basierte Kommunikation Voraussetzungen für akustische basierte sprachliche Kommunikation: Schallerzeugung Schallwahrnehmung Schallleitendes Medium Akustische Basiseigenschaften von Sprachlauten:

Mehr

Schall ist: durch die Lu0 (oder ein anderes Medium) übertragene Schwingungsenergie.

Schall ist: durch die Lu0 (oder ein anderes Medium) übertragene Schwingungsenergie. Schall ist: durch die Lu0 (oder ein anderes Medium) übertragene Schwingungsenergie. Wenn ein Körper schwingt, versetzt er die Lu6, die ihn umgibt, in gleichar;ge Schwingung. Er wird damit zur Schallquelle.

Mehr

Die akustische Analyse von Sprachlauten 1. Zeitsignal, Periodizität, Spektrum. Jonathan Harrington

Die akustische Analyse von Sprachlauten 1. Zeitsignal, Periodizität, Spektrum. Jonathan Harrington Die akustische Analyse von Sprachlauten 1. Zeitsignal, Periodizität, Spektrum Jonathan Harrington Wie entsteht der Schall? 1. Ein Gegenstand bewegt sich und verursacht Luftdruckveränderungen. Luftmoleküle

Mehr

bonn.de bonn.de

bonn.de  bonn.de wgh@ikp.uni bonn.de http://www.ikp.uni bonn.de 023 Vorlesungsskripten deutsch bilingual deutsch/englisch Allgemein zur Sprachsignalverarbeitung Speziell zu Kapitel 1 gsv_1.1 t 250 ms/zeile gsv_1.2 t

Mehr

Technische Beschreibung der akustischen Signalkette

Technische Beschreibung der akustischen Signalkette Technische Beschreibung der akustischen Signalkette Wichtige Aufgabe: Vielfältige Medien Gestaltung akustischer Kommunikationsketten (Sprache, Geräusche, Musik, CD, Radio, mp3,...) Unterschiedlichste Information

Mehr

Frikative - Artikulatorische und Akustische Merkmale -

Frikative - Artikulatorische und Akustische Merkmale - Frikative - Artikulatorische und Akustische Merkmale - Ein Vortrag von: Michaela Geierhos & Christian Schömmer LMU München 16.06.2005 Frikative - Artikulatorische und Akustische Merkmale 1 Gliederung Klassische

Mehr

Lesen von Sonagrammen III Vokale, Plosive

Lesen von Sonagrammen III Vokale, Plosive Lesen von Sonagrammen III Vokale, Plosive Uwe Reichel IPS, LMU München reichelu@phonetik.uni-muenchen.de basierend auf Kirsten Macheletts Online-Script http://www.phonetik.uni-muenchen.de/lehre/skripten/

Mehr

Name: Matrikelnr.: Johann Wolfgang Goethe-Universität Frankfurt am Main

Name: Matrikelnr.: Johann Wolfgang Goethe-Universität Frankfurt am Main Name: Matrikelnr.: Johann Wolfgang Goethe-Universität Frankfurt am Main Empirische Sprachwissenschaft Pflichtmodul K3 Phonetik und Phonologie II SoSe 2016 PROBEKLAUSUR Bitte leserlich und kurz antworten.

Mehr

Spracherkennung. 3. Sitzung 20. Oktober 2008

Spracherkennung. 3. Sitzung 20. Oktober 2008 Spracherkennung 3. Sitzung 20. Oktober 2008 Überblick 5. Diskretisierung 6. Merkmalsberechnung 7. DTW 8. HMMs 9. Sprachmodellierung w X Textproduktion Artikulation Merkmalsextraktion Dekodierung 2. Sprachproduktion

Mehr

SA Saitenschwingungen

SA Saitenschwingungen SA Saitenschwingungen Blockpraktikum Frühjahr 2007 (Gruppe 2) Freitag, 13. April 2007 Inhaltsverzeichnis 1 Einführung 2 2 Theoretische Grundlagen 2 2.1 Allgemeine Wellengleichung............... 2 2.2 Transversalwelle

Mehr

Pappröhre, die an einem Ende offen und am anderen mit einem Plastikdeckel verschlossen ist. Vernier Mikrofon-Sonde, CBL oder LabPro und TI-83.

Pappröhre, die an einem Ende offen und am anderen mit einem Plastikdeckel verschlossen ist. Vernier Mikrofon-Sonde, CBL oder LabPro und TI-83. Stehende Wellen Zielsetzung: In diesem Experiment ist es unser Ziel, die Schallwellen zu untersuchen, die entstehen, wenn der Deckel einer Pappröhre mit dem Finger angeschlagen wird. Das Geräusch wird

Mehr

Universität Bielefeld Wintersemester 2007/2008. Aktive Teilnahme Unbenotete Einzelleistung Benotete Einzelleistung. Übungsklausur. vom

Universität Bielefeld Wintersemester 2007/2008. Aktive Teilnahme Unbenotete Einzelleistung Benotete Einzelleistung. Übungsklausur. vom Universität Bielefeld Wintersemester 2007/2008 Phonetik & Phonologie Name: Matrikelnummer: Aktive Teilnahme Unbenotete Einzelleistung Benotete Einzelleistung Übungsklausur vom 25.01.08 Aufgabe 1. (a) Transkribieren

Mehr

Nichtlineare Quantisierung

Nichtlineare Quantisierung Nichtlineare Quantisierung Die einfachste Form der Codierung besteht in einer nichtlinearen Quantisierung der Abtastwerte, um die wesentlich häufiger auftretenden kleinen Amplitudenwerte mit einer höheren

Mehr

Bernd J. Kröger: Neuronale Sprachverarbeitung (Fragen und Antworten) Seite 1

Bernd J. Kröger: Neuronale Sprachverarbeitung (Fragen und Antworten) Seite 1 Bernd J. Kröger: Neuronale Sprachverarbeitung (Fragen und Antworten) Seite 1 2 Sprachproduktion 2.1 Wörter, Silben und Sprachlaute 2.1.1 Konzepte und semantische Netzwerke FRAGEN/AUFGABEN zu Kap. 2.1.1:

Mehr

Klausur III ½ Stunden 50% der Gesamtnote Klausur II 25% Klausur I 25%

Klausur III ½ Stunden 50% der Gesamtnote Klausur II 25% Klausur I 25% Klausur III 6.2.06 1 ½ Stunden 50% der Gesamtnote Klausur II 25% Klausur I 25% Die Klausur am 6.2.06 findet im Raum 164 Geb. II (eine Etage höher) statt Die Klausur beginnt um 10.15 h. Sie sollten ein

Mehr

Transkription für Fortgeschrittene (IPA) Hauptpraktikum Julia Abresch

Transkription für Fortgeschrittene (IPA) Hauptpraktikum Julia Abresch Transkription für Fortgeschrittene (IPA) Hauptpraktikum Julia Abresch Überblick Wiederholung der bekannten Zeichen des IPA. Vorstellung einiger bisher nicht eingeführter Laute und Lautklassen sowie Diakritika.

Mehr

Die Sonoritätsskala schematisch dargestellt

Die Sonoritätsskala schematisch dargestellt Die Sonoritätsskala schematisch dargestellt + OBSTRUENZ SONORANZ Plosive Sonanten Konsonanten Vokale OBSTRUENZ + SONORANZ Silbengipfelfähigkeit Vereinfachte Merksätze: Obstruenz: Sonoranz: Der Luftstrom

Mehr

Inhalt. 1. Einleitung Phonetik und Phonologie Übungen Lektüre zur Vertiefung... 72

Inhalt. 1. Einleitung Phonetik und Phonologie Übungen Lektüre zur Vertiefung... 72 Inhalt 1. Einleitung......... 7 2. Phonetik und Phonologie......................... 12 Übungen......... 16 Lektüre zur Vertiefung........................... 17 3. Das Lautinventar des Deutschen.....................

Mehr

Der Zusammenhang zwischen Spracherwerb und Lautwandel

Der Zusammenhang zwischen Spracherwerb und Lautwandel Der Zusammenhang zwischen Spracherwerb und Lautwandel Hauptseminar: Dozent: Referentin: Die phonetischen Grundlagen des Lautwandels Prof. Dr. Jonathan Harrington Julia Anders Datum: 23. Juli 2009 Gliederung

Mehr

Warum haben es Schnellsprecher schwerer?

Warum haben es Schnellsprecher schwerer? Warum haben es Schnellsprecher schwerer? Untersuchungen zur automatischen Spracherkennung und zum aphasischen Sprachverständnis Vivian Raithel und Britta Wrede Stellen Sie sich vor, Sie wollen schnell

Mehr

Übungen zu Physik I für Physiker Serie 12 Musterlösungen

Übungen zu Physik I für Physiker Serie 12 Musterlösungen Übungen zu Physik I für Physiker Serie 1 Musterlösungen Allgemeine Fragen 1. Warum hängt der Klang einer Saite davon ab, in welcher Entfernung von der Mitte man sie anspielt? Welche Oberschwingungen fehlen

Mehr

Elemente einer Akustischen Phonetik

Elemente einer Akustischen Phonetik Joachim M.H. Neppert Elemente einer Akustischen Phonetik Mit 86 Abbildungen und 18 Tabellen HELMUT BUSKE VERLAG HAMBURG Inhalt Einleitung 13 Die Kommunikationskette der gesprochenen Sprache 13 Zum Verhältnis

Mehr

RelAtive SpecTrAl (RASTA) Processing of Speech

RelAtive SpecTrAl (RASTA) Processing of Speech RelAtive SpecTrAl (RASTA) Processing of Speech Paul Glad Mihai 23.11.06 Gliederung Einleitung Wieso RASTA? RASTA erläutert Probleme Modulationsspektrum von Sprache Methode RASTA erweitert Lin-Log Rasta

Mehr

Dokumentation gesprochener Sprache

Dokumentation gesprochener Sprache Dokumentation gesprochener Sprache Klicks und Töne Transkription Glottisschlag vs. Plosiv Sose 2015 2 Hausaufgabe (NACHNAME_VORNAME_HA06.pdf) Erweitere deine kleine wissenschaftliche Abhandlung mit Abbildungen

Mehr

Konsonanten: Laryngale Kontraste

Konsonanten: Laryngale Kontraste Jochen Trommer jtrommer@uni-leipzig.de Universität Leipzig Institut für Linguistik Phonetikanalyse SS 2007 Stimmhafte Frikative: Artikulation bei stimmhaften Frikativen wird gleichzeitig im Ansatzrohr

Mehr

Universität Bielefeld Wintersemester 2008/2009. Aktive Teilnahme Unbenotete Einzelleistung Benotete Einzelleistung. Übungsklausur

Universität Bielefeld Wintersemester 2008/2009. Aktive Teilnahme Unbenotete Einzelleistung Benotete Einzelleistung. Übungsklausur Universität Bielefeld Wintersemester 2008/2009 Phonetik & Phonologie PD Dr. Ralf Vogel Aufgabe 1 Name: Matrikelnummer: Aktive Teilnahme Unbenotete Einzelleistung Benotete Einzelleistung Übungsklausur vom

Mehr

1. Klausur in K2 am

1. Klausur in K2 am Name: Punkte: Note: Ø: Kernfach Physik Abzüge für Darstellung: Rundung:. Klausur in K am 0.0. Achte auf die Darstellung und vergiss nicht Geg., Ges., Formeln, Einheiten, Rundung...! Angaben: Schallgeschwindigkeit

Mehr

Z-Transformation, Cepstrum, LPC, Autokorrelation Sebastian Stüker

Z-Transformation, Cepstrum, LPC, Autokorrelation Sebastian Stüker Institut für Anthropomatik Z-Transformation, Cepstrum, LPC, Autokorrelation Sebastian Stüker 04.11.2009 Interactive Systems Labs Verallgemeinerung der Fourier- Transformation: F(s) = L{ f }(s) = 0 e st

Mehr

8. Akustik, Schallwellen

8. Akustik, Schallwellen Beispiel 2: Stimmgabel, ein Ende offen 8. Akustik, Schallwellen λ l = n, n = 1,3,5,.. 4 f n = n f1, n = 1,3,5,.. 8.Akustik, Schallwellen Wie gross ist die Geschwindigkeit der (transversalen) Welle in der

Mehr

Physiologische Phonetik Rachenraum und Gaumensegel

Physiologische Phonetik Rachenraum und Gaumensegel Physiologische Phonetik Rachenraum und Gaumensegel Anmerkungen zur Gesamtform des Vokaltrakts Eine kleine aber wichtige Struktur: Das Zungenbein Anmerkungen zur pharyngealen Muskulatur Gaumensegel (1).

Mehr

Allgemeines Artikulatorische Phonetik Transkription Konsonanten Vokale. Phonetik I. Gerrit Kentner

Allgemeines Artikulatorische Phonetik Transkription Konsonanten Vokale. Phonetik I. Gerrit Kentner Phonetik I Gerrit Kentner 8. Juni 2010 1 / 27 Was bisher geschah Einführendes Was ist/ was macht die Sprachwissenschaft Zeichentheoretische Grundlagen Morphologie Allgemeines zur Morphologie, Morphembegriff,

Mehr

Morphem und Allomorph. Jonathan Harrington

Morphem und Allomorph. Jonathan Harrington Morphem und Allomorph Jonathan Harrington Phonologie und Phonetik Kies kühn Kuh Skandal Lexikon /ki:s/ /ky:n/ /ku:/ /skandal/ Phonetische Regeln [c h i:s] [c h y)n] w [k= h u:] w [skandal] Die Eingaben

Mehr

Dämmkurven von Gehörschutz- Otoplastiken

Dämmkurven von Gehörschutz- Otoplastiken Dämmkurven von Gehörschutz- Otoplastiken Gwenolé NEXER g. n e x e r @ h e a r i n g p r o t e c h. c o m Mai 2011 Ins Deutsche übersetzt. Wir haben es als interessant erachtet, die unterschiedlichen Dämmkurven

Mehr

Bibliografie (hier können Sie Inhalte der Sitzung nachlesen)

Bibliografie (hier können Sie Inhalte der Sitzung nachlesen) Bibliografie (hier können Sie Inhalte der Sitzung nachlesen) Phonetik Ladefoged, Peter. A Course in Phonetics. Thomson Wadsworth, Boston 2006. Kapitel 1, 2, 3, 4. Hall, T. Alan. Phonologie. Eine Einführung.

Mehr

Grundlagen der Elektrotechnik: Wechselstromwiderstand Xc Seite 1 R =

Grundlagen der Elektrotechnik: Wechselstromwiderstand Xc Seite 1 R = Grundlagen der Elektrotechnik: Wechselstromwiderstand Xc Seite 1 Versuch zur Ermittlung der Formel für X C In der Erklärung des Ohmschen Gesetzes ergab sich die Formel: R = Durch die Versuche mit einem

Mehr

HARMONISCHE SCHWINGUNGEN

HARMONISCHE SCHWINGUNGEN HARMONISCHE SCHWINGUNGEN Begriffe für Schwingungen: Die Elongation γ ist die momentane Auslenkung. Die Amplitude r ist die maximale Auslenkung aus der Gleichgewichtslage (r >0). Die Schwingungsdauer T

Mehr

Phonetische Merkmale von Oralplosiven in den Sprachen der Welt. Jonathan Harrington IPDS Kiel

Phonetische Merkmale von Oralplosiven in den Sprachen der Welt. Jonathan Harrington IPDS Kiel Phonetische Merkmale von Oralplosiven in den Sprachen der Welt Jonathan Harrington IPDS Kiel 1. Stimmhaftigkeit in Plosiven: VOT Voice Onset Time (VOT) = Die Dauer zwischen der Lösung vom Plosiv und dem

Mehr

Mittelwert, Standardabweichung, Median und Bereich für alle durchgeführten Messungen (in Prozent)

Mittelwert, Standardabweichung, Median und Bereich für alle durchgeführten Messungen (in Prozent) 3. Ergebnisse 3.1 Kennwerte, Boxplot Die Kennwerte der deskriptiven Statistik sind in der Tabelle 1 für alle Messungen, in der Tabelle 2 für die Messungen, bei denen mit der Referenzmethode eine festgestellt

Mehr

9. Tantal SIMS-Ergebnisse RTP-GETEMPERTE SBT-PROBEN OFENGETEMPERTE SBT-PROBEN

9. Tantal SIMS-Ergebnisse RTP-GETEMPERTE SBT-PROBEN OFENGETEMPERTE SBT-PROBEN 9. Tantal 9.1. SIMS-Ergebnisse 9.1.1. RTP-GETEMPERTE SBT-PROBEN In Abbildung 32 sind die Tantal-Tiefenprofile nach Tempern der SBT-Proben im RTP dargestellt, in Abbildung 32 a) mit und in Abbildung 32

Mehr

Seminar Akustik. Aufgaben zu Teil 1 des Skripts Uwe Reichel, Phil Hoole

Seminar Akustik. Aufgaben zu Teil 1 des Skripts Uwe Reichel, Phil Hoole Seminar Akustik. Aufgaben zu Teil des Skripts Uwe Reichel, Phil Hoole Welche Kräfte wirken auf ein schwingendes Teilchen?! von außen angelegte Kraft (z.b. Glottisimpulse)! Rückstellkräfte (Elastizität,

Mehr

v= f x λ 344= f x 4 f= 86 Hz (Großes F) P= 1/f 1/ , s = 0,00001ms W= F x s W= 30 x 400 W= 12000Nm 12000J

v= f x λ 344= f x 4 f= 86 Hz (Großes F) P= 1/f 1/ , s = 0,00001ms W= F x s W= 30 x 400 W= 12000Nm 12000J Auflösung Wellen & Schwingungen Wenn eine Orgelpfeife für eine Wellenlänge von 4m konstruiert wird, welche Frequenz wird dann ihr Klang haben? (T = 20 ) v= f x λ 344= f x 4 f= 86 Hz (Großes F) Wenn die

Mehr

Akzentuierung, Assimilation, Locus-Theorie. Jonathan Harrington & Tina John

Akzentuierung, Assimilation, Locus-Theorie. Jonathan Harrington & Tina John 1 Akzentuierung, Assimilation, Locus-Theorie Jonathan Harrington & Tina John 1. Allgemeines In der zum Beginn des Semesters erzeugten Sprachdatenbank sind akzentuierte und unakzentuierte Wörter in vier

Mehr

Phonetik. Phonologie

Phonetik. Phonologie Universität Bielefeld Fakultät für Linguistik und Literaturwissenschaft Phonetik k Phonologie christian.ebert@uni-bielefeld.de Organisatorisches Vorlesung mittwochs, 18-20 Uhr, Hörsaal 15 christian.ebert@uni-bielefeld.de

Mehr

Messung & Darstellung von Schallwellen

Messung & Darstellung von Schallwellen Messung Digitalisierung Darstellung Jochen Trommer jtrommer@uni-leipzig.de Universität Leipzig Institut für Linguistik Phonologie/Morphologie SS 2007 Messung Digitalisierung Darstellung Überblick Messung

Mehr

Dokumentation gesprochener Sprache

Dokumentation gesprochener Sprache Dokumentation gesprochener Sprache Laryngale Konfiguration bei Plosiven Einfügen einer Ebene in Praat Akustische Eigenschaften von Sonoranten Oszillogramm hohe Amplituden regelmäßiges Signal Sonagramm

Mehr

Computerlinguistische Grundlagen

Computerlinguistische Grundlagen Computerlinguistische Grundlagen Jürgen Hermes Wintersemester 18/19 Sprachliche Informationsverarbeitung Institut für Digital Humanities Universität zu Köln Phonetik und Phonologie Abgrenzung Phonetik

Mehr

Zentralabitur 2011 Physik Schülermaterial Aufgabe I ga Bearbeitungszeit: 220 min

Zentralabitur 2011 Physik Schülermaterial Aufgabe I ga Bearbeitungszeit: 220 min Thema: Eigenschaften von Licht Gegenstand der Aufgabe 1 ist die Untersuchung von Licht nach Durchlaufen von Luft bzw. Wasser mit Hilfe eines optischen Gitters. Während in der Aufgabe 2 der äußere lichtelektrische

Mehr

5 Elektronengas-Modell und Polyene

5 Elektronengas-Modell und Polyene 5.1 Übersicht und Lernziele Übersicht Im vorherigen Kapitel haben Sie gelernt, das Elektronengas-Modell am Beispiel der Cyanin-Farbstoffe anzuwenden. Sie konnten überprüfen, dass die Berechnungen für die

Mehr

Nicht-Eindeutigkeit der Orthographie: [f]: <f> Farbe <v> Vogel <ph> Pharao <w> Löwchen <pf> Pfahl (Standard-, Umgangslautung)

Nicht-Eindeutigkeit der Orthographie: [f]: <f> Farbe <v> Vogel <ph> Pharao <w> Löwchen <pf> Pfahl (Standard-, Umgangslautung) Phonetik - beschäftigt sich mit der Produktion und Perzeption von Sprachlauten. - untersucht die materiellen (physiologischen und physikalischen) Eigenschaften mündlicher Äußerungen. Die Phonetik teilt

Mehr

Spektrale Analysen in EMU-R: eine Einführung. Jonathan Harrington

Spektrale Analysen in EMU-R: eine Einführung. Jonathan Harrington Spektrale Analysen in EMU-R: eine Einführung Jonathan Harrington 1. Ein digitales Sinusoid 2. Fourier-Analyse 3. Ein Spektrum 4. Frequenz- und Zeitauflösung 5. Berechnung von Spektra mit Emu 1. Ein digitales

Mehr

Einführung in die Computerlinguistik. Phonetik

Einführung in die Computerlinguistik. Phonetik Einführung in die Computerlinguistik Phonetik Hinrich Schütze & Robert Zangenfeind Centrum für Informations- und Sprachverarbeitung, LMU München 25.1.2016 1 1. Teildomänen artikulatorische Phonetik: Physiologie

Mehr

Puls-Code-Modulation. Thema: PCM. Ziele

Puls-Code-Modulation. Thema: PCM. Ziele Puls-Code-Modulation Ziele Mit diesen rechnerischen und experimentellen Übungen wird die Vorgehensweise zur Abtastung und linearen Quantisierung eines analogen Signals erarbeitet. Bei der Abtastung werden

Mehr

Schwebung, Eigenschwingungen, Fourier-Analyse/Synthese

Schwebung, Eigenschwingungen, Fourier-Analyse/Synthese Aufgaben 7 Interferenz Schwebung, Eigenschwingungen, Fourier-Analyse/Synthese Lernziele - sich aus dem Studium eines schriftlichen Dokumentes neue Kenntnisse und Fähigkeiten erarbeiten können. - einen

Mehr

Artikulations-, Hör- und Transkriptionsübung I

Artikulations-, Hör- und Transkriptionsübung I Institut für Phonetik, Universität des Saarlandes Artikulations-, Hör- und Transkriptionsübung I Einführung, Teil 2 Konsonanten Einführung: IPA-Tabelle Struktur der IPA-Tabelle (1) Wie werden die pulmonalen

Mehr

Generator (Wellenform) Resonator (Klangformung / Filter) Schallabstrahlung. Generator Resonator 1 Resonator 2 Resonator n Schallabstrahlung

Generator (Wellenform) Resonator (Klangformung / Filter) Schallabstrahlung. Generator Resonator 1 Resonator 2 Resonator n Schallabstrahlung Musikinstrument als lineares System (LTI) Generator (Wellenform) Resonator (Klangformung / Filter) Schallabstrahlung Aufteilung in 2 Klassen a) Rückkopplungsfrei Generator Resonator 1 Resonator 2 Resonator

Mehr

3 Elektronengas-Modell und Polyene

3 Elektronengas-Modell und Polyene 3.1 Lernziele 1. Sie können die Anregungsenergie ΔE für den Ügang vom höchsten besetzten (HOMO) zum niedrigsten unbesetzten (LUMO) Niveau von Polyenen mit dem Elektronengas-Modell echnen. 2. Sie sind in

Mehr