Computational Prosody: Symbolische Beschreibung von Intonationskonturen Uwe D. Reichel IPSK, LMU München reichelu@phonetik.uni-muenchen.de
Inhalt Tonsequenzansatz Pierrehumbert (1980) Generierung der Intonationskontur Diskursfunktion der Töne Übertragung aufs Deutsche (Féry, 1993) Labeling-Praxis Kieler Intonationsmodell KIM (Kohler, 1991) 1
Tonsequenzansatz Pierrehumbert (1980) Intonationskontur als Abfolge von Tönen, die den akzentuierten Silben zugeordnet werden Hintergrund: autosegmentale Phonologie (Goldsmith, 1976): Repräsentation der Phone und suprasegementaler Phänomene auf getrennten Ebenen (tiers, angenommene Unabhängigkeit), Verbindung über Assoziationslinien Intonationsphrasen bestehen aus einer oder mehreren intermediären Phrasen jede dieser Phrasen besteht aus mindestens einem Pitchakzent und einem Phrasenakzent, der dem letzten Pitchakzent der Phrase folgt; Intonationsphrasen erhalten zusätzlich einen Grenzton nuklearer Akzent: letzter Pitchakzent einer Phrase TSA 2
Toninventar: 2 elementare Töne (H=hoch, L=tief, jeweils zum vorangehenden Ton), die sich zu komplexen Tönen kombinieren lassen Intonationsgrammatik aus Ladd (1996) TSA 3
+ (bei Akzenten): Verknüpfung elementarer Töne zu komplexen (Tonbewegung); % : am Ende von Intonationsphrasen; : am Ende von intermediären Phrasen; * : Assoziationslinie zu akzentuierter Silbe H+L*: Tonhöhe fällt von einem hohen Punkt vor der akzenttragenden Silbe aus in tiefen Stimmbereich ab (early peak); H+ wird als leading tone bezeichnet, in H*+L wäre +L der trailing tone formale Entsprechung: endlicher Automat, der bei jeder Transition einen Ton generiert die Realisierung jedes Tones ist nur von den vorangehenden Tönen abhängig, nicht von den folgenden (keine Vorausplanung, erleichtert die Implementierung) Globale Phänomene werden als Zusammenwirken lokaler Ereignisse beschrieben; Deklination downsteps (!H), final lowering TSA 4
Generierung der Intonationskontur regelbasiert (Pierrehumbert, 1981; Jilka, 1996) F0-Targets der Töne basieren auf Tonlabel, den vorangehende Targets, dem Register (Baseline: 0%, Topline: 100%) und der metrischen Prominenz der assoziierten Silbe Downstep: Target(zuletzt vorangehender H*) 0.x Interpolation zwischen den Targets statistisch (Black et al., 1996) Vorhersage von 3 Targets pro Silbe (Onset, Nukleus, Offset) anhand prosodischer Features mittels linerarer Regression target = I + i w i f i Features f i : Pitchakzent-Label, Break-Index, Wortbetonung, Position innerhalb der Phrase, usw. Regression zur Ermittlung von I und der w i s TSA 5
Diskursfunktion der Töne (Pierrehumbert et al., 1990) Pitch Accent: (given L vs. new H) Grenzton: Information über die Orientierung der aktuellen Intonationsphrase im Diskurs: (a) My car manual is quite unreadable/ll% LH% (b) It s quite annoying/lh% LL% (c) I spent two hours figuring out how to use the jack/ll% (a) LL%, (b) LH%: (a) abgeschlossen, (b) vorwärtsgerichtet, It referiert auf (c) (a) LH%, (b) LL%: (b) gehört zu (a), (b) rückwärtsgerichtet, It referiert auf My car manual TSA 6
Féry (1993) Übertragung des Pierrehumbertschen Ansatzes aufs Deutsche variationsärmere postnukleare Intonationskontur Verzicht auf Phrasenakzent mögliche Verschmelzung intermediärer Phrasen durch linking, d.h. Trailing-Ton eines pränuklearen Akzents wird abgespalten und mit nuklearem Akzent verbunden (partielles linking) oder ganz entfernt (komplettes linking); Beispiel aus Mayer (1997): TSA 7
Labelingsysteme auf Grundlage des Pierrehumbertschen Ansatzes ToBI (tonal and break indices; Silverman et al., 1992) fürs Englische und GTobI (German ToBI; Reyelt et al., 1994) break indices: Markiertheit der Grenzen zwischen Wörtern/Phrasen 0: klitische Verbindungen 1: Wortgrenze 2: irreguläre Grenzen 3: zwischen intermediären Phrasen 4: zwischen Intonationsphrasen Beispiele unter http://www.uni-koeln.de/phil-fak/phonetik/gtobi/index.html TSA 8
Labeling-Konsistenz Inter Labeler Agreement kritisch: z.b. 51 % (Grice et al. 1996: 13 Labeler) Intra Labeler Agreement? Brauchbares Trainingsmaterial? Automatisches Labeling Vorverarbeitung: Interpolation (Überbrückung von Verschlußphasen), Smoothing (Glättung der Intonationskontur); mehr dazu in der Matlab-Übung Klassifikation anhand von F0- und Intensitätsverlauf, Pausen zu jedem Zeitpunkt t ein Feature-Vektor, der hinsichtlich Akzent und Phrasengrenze klassifiziert wird TSA 9
Kieler Intonationsmodell KIM (Kohler, 1991) prosodische Kategorien als Bündel distinktiver binärer Merkmale repräsentiert Wortbetonung <DSTRESS> Satzakzent <FSTRESS>, <DEACC>, <EMPH> Intonation als Abfolge von Gipfeln und Tälern <VALLEY>, <TERMIN>, <QUEST> KIM 10
Synchronisation von F0-Peaks <EARLY>, <LATE> früh <+ EARLY>, < LATE>: als gegeben erachtete nicht mehr zu diskutierende Tatsache mittel < EARLY>, < LATE>: neuer Fakt zur Diskussion gestellt spät < EARLY>, <+ LATE>: Hervorhebung eines neuen Fakts, der den Wünschen des Sprechers widerspricht (Tadel) aus Kohler, 2004 (Poster) früh/nicht früh annähernd kategorial wahrgenommen KIM 11
symbolische und parametrische Regeln (kontextsensitive Ersetzungsregeln der generativen Phonologie: A B X Y) symbolische Regeln: Annotation prosodische Kategorie prosodische Kategorie z.b. <VOK, FSTRESS> < TERMIN,QUEST> <-FSTRESS>* <?> parametrische Regeln: prosodische Kategorie numerischer Wert (F0, Dauer) z.b.<vok, FSTRESS> <F0=110> <,> <SEG, -FSTRESS>* semiautomatische linguistische Vorverarbeitung, manuelle Annotationen nötig KIM 12