Abfragen aus einer Sprachdatenbank. Tina John (Jonathan Harrington)
Modul F - Sprachanalyse (2) Erstellung Abfrage Analyse Digitale Zeitsignale akustisch, artikulatorisch Die Signale davon Graphik Signalverarbeitung Signale Abfrage Statistik abgeleitete Signale (z.b. spektrale Daten) Etikettieren Verknüpfung mit Symbolen Etikettierung Eine Liste ausgewählter Symbole mit Zeiten Abfrage p << 0.001 Weitere Signalverarbeitung
Sprachdatenbank Etikettierungen Signale Abfrage Abfrage Segment- oder Eventliste Trackdatei zb die Signale (zb. Formanten, ZCR, F0) dieser Segmente oder Events Analyse
andosl.tpl (Australian National Database of Spoken Language) (-) (-) (-) = = (-) = (-) (S) Eine Ebene Phoneme besteht aus einer oder mehreren Einheiten ei N Z usw.
1. Einfache Abfrage (Einheiten aus derselben Ebene) Ebene = Einheit i. Eine Einheit /m/ Phoneme Phoneme = m ii. Mehrere Einheiten /m n N/ Phoneme Phoneme = m n N iii. Alle Einheiten außer einer/mehreren Einheiten Woerter außer the Phoneme außer /b d g/ - als legal label class iv. Alle Einheiten Alle Silben Text!= the Phoneme!= bdg Syllable!= etwas Syllable!= Kiel (angenommen, etwas oder Kiel als Einheiten der Silbenebene nicht vorkommen)
2. Reihenfolge a ist eine der vier Sorten von einfachen Abfragen a -> a a -> a -> a -> a /m E/ Phoneme Phoneme = m -> Phoneme = E /E/ Phoneme nach allen Kons. außer /m n N/- als legal label class Phoneme!= mnn -> Phoneme = E Alle Phoneme zwischen /b d g / und /s/ (zb giessen ) [[Phoneme = bdg -> Phoneme!= etwas] -> Phoneme = s]
3. Lineare Abfragen Abfragen aus zwei Ebenen in linearer Beziehung. a & a a & a & a & a I-Einheiten, die akzentuiert sind Func = I & Accent = A Alle Funtionswörter Word!= etwas & Func = F Phoneme außer /b d g/ - ohne als legal label class Kanonic!= b & Kanonic!= d & Kanonic!= g Alle nicht-akzentuierten Inhaltswörter Word!=etwas & Accent = U & Func = I
4. Nicht-lineare Abfragen Abfragen aus zwei Ebenen in autosegmenteller oder hierarchischer Beziehung. a ^ a a ^ a ^ a ^ a /y:/ Phoneme in S-Silben = S-Silben, die einen /y:/ Phonem enthalten Kanonic = y: ^ Syllable = S
4. Nicht-lineare Abfragen (fortgesetzt) a ^ a a ^ a ^ a ^ a Alle Wörter, in denen kein /y:/ Phonem vorkommen Wort!= xxxxx ^ Kanonic!= y:
4. Nicht-lineare Abfragen (fortgesetzt) Alle Phoneme in S-Silben in Funktionswörtern in einer L-Phrase [[[Kanonic!=etwas ^ Syllable = S] ^ Func = F ]^ Phrase = L]
5. Positionsabfragen E1 und E2 sind unterschiedliche Ebenen; E1 dominiert direkt oder indirekt E2. Start(E1, E2) Medial(E1, E2) End(E1, E2) Wortinitiale Phoneme Nicht-wort-initiale Phoneme Phoneme, die nicht silbenmedial sind Phrasenfinale Silben Start(Word, Kanonic)=1 Start(Word, Kanonic)=0 Medial(Syllable, Kanonic)=0 End(Phrase, Syllable)=1
6. Anzahlabfragen E1 und E2 sind unterschiedliche Ebenen; E1 dominiert direkt oder indirekt E2. Num(E1, E2) Wörter aus 4 Phonemen Num(Word,Kanonic)=4!=3 < 3 <=3 > 3 >=3
7. Kombinationsabfragen /s/ Phoneme, die in S-Silben und vor einem /v/ vorkommen. [[Kanonic=s ^ Syllable=S] -> Kanonic=v] Alle Wörter, in denen kein /6 @/ Phonem vorkommen Wort!= xxxxx ^ Kanonic!= 6 & Kanonic!= @
7. Kombinationsabfragen Wörter in einer L-Phrase, die aus 4 Silben bestehen, die einen wortinitialen /f/ beinhalten, und die nach einem Inhaltswort vorkommen. [ Word!= etwas & Func = I -> [ [ Word!= etwas & Num ( Word,Syllable ) = 4 ^ Phrase = L ] ^ Kanonic = f & Start ( Word,Kanonic ) = 1 ] ]
Das Ergebnis einer Abfrage Eine Segmentliste: Wenn die Einheiten der abgefragten Ebene eine Dauer haben (die Ebene ist eine Segmentebene, oder erbt die Zeiten aus einer Segmentebene) Etikettierung Startzeit Endzeit Äußerung Abfrage: Kanonic = v Eine Eventliste: wenn die Einheiten der abgefragten Ebene dauerlos sind (die Ebene ist eine Eventebene, oder erbt die Zeiten aus einer Eventebene) Etikettierung Eventzeit Äußerung Target = T (Target ist eine Eventebene)
Abfragen aus mehreren Ebenen Das Ergebnis einer Abfrage ist eine Einheit, oder Einheiten, aus nur einer Ebene. Die Default-Ergebnis-Ebene ist immer die erste Abfrage Abfrage Kanonic=E ^ Syllable=S Syllable=S ^ Kanonic = E Wir bekommen: Eine Segmentliste von /E/ Einheiten der Kanonic-Ebene = /E/ Phoneme in S-Silben Eine Segmentliste von S Einheiten der Syllable-Ebene = S-Silben, die ein /E/ Phonem enthalten
Sonst kann die Ergebnis-Ebene durch ein # Zeichen bestimmt werden. Kanonic=E ^ #Syllable=S entspricht: Syllable=S ^ Kanonic = E Eine Segmentliste von S Einheiten der Syllable-Ebene = S-Silben, die ein /E/ Phonem enthalten /s/ Phoneme, die in S-Silben und vor einem /v/ vorkommen. [[Kanonic=s ^ Syllable=S] -> Kanonic=v] /v/ Phoneme, vor denen /s/ Phoneme in S-Silben vorkommen [[Kanonic=s ^ Syllable=S] -> #Kanonic=v]