OntoSpace Project Report University of Bremen Germany SFB/TR 8: I1-[OntoSpace] I1-Transkriptionskonventionen Deliverable D5 I1-[OntoSpace]; Workpackages 4-6 Kerstin Fischer 2 March 2004 Version: 1.0 http://www.sfbtr8.uni-bremen.de/project.html?project=i1 e-mail: {kerstinf,tenbrink}@uni-bremen.de
Contents 1 Definitionen 1 2 Informationsarten 1 2.1 Wörter...................................... 1 2.2 Interjektionen.................................. 1 2.3 Pausen...................................... 2 2.4 Nicht-sprachliche Ereignisse.......................... 2 2.5 Attribute.................................... 3 2.6 Unverständliche Teile.............................. 4 2.7 Intonationskontur................................ 4 Acknowledgements The Cooperative Research Center for Spatial Cognition (Sonderforschungsbereich/Transregio SFB/TR8) of the Universities of Bremen and Freiburg is funded by the Deutsche Forschungsgemeinschaft (DFG), whose support we gratefully acknowledge. i
I1-[OntoSpace]:D5 1 1 Definitionen Ein Transkript ist eine Repräsentation dessen, was gesagt wurde. Es gilt also, nachvollziehbar zu machen, was wie geäuert wurde. Dabei kann man unterschiedlich viele Informationen in diese Repräsentation mit hineinnehmen. 2 Informationsarten Für uns wichtig sind folgende Informationen. 2.1 Wörter Die geäusserten Worte in ihrer orthographischen Repräsentation. D.h. Verschleifungen, Dialektvarianten und Kontraktionen (z.b. hamma, wollma für haben wir, wollen wir) werden getrennt dargestellt. (alt)(orig) kannste (/orig) (norm) kannst Du (/norm) (/alt) Bereits akzeptierte Ausnahmen sind D: im, in s, zum, vom; E: it s, that s, what s, usw., I ll, I d, you d usw., let s, wanna, gotta. (Im Zweifelsfall bitte fragen) 2.2 Interjektionen Deutsch Englisch hm hm divergierendes Feedbacksignal mhm uhuh zustimmendes Feedbacksignal m-m uh-uh verneinendes Feedbacksignal äh uh Hesitationssignal ohne Nasal ähm um Hesitationssignal mit Konsonant und Vokal m m Hesitationssignal nur mit nasalem Konsonant oh oh ah ah ach nee verneinendes Feedbacksignal ne Bestätigung einforderndes Signal
I1-[OntoSpace]:D5 2 Da es uns auf die Worte ankommt, werden Worte am Satzanfang nicht gross geschrieben, und Satzzeichen werden nicht grammatikalisch gesetzt, sondern nur intonationsbedingt, siehe unten. und jetzt geh halt was machst du da bloss? spinnst du? 2.3 Pausen Die Pausen zwischen diesen geäuerten Worten - kurze Pause (300-600 msek) längere Pause (600-1000 msek) (3) Pause von einer oder mehr Sekunden, hier 3 sek. 2.4 Nicht-sprachliche Ereignisse Nicht-sprachliche Ereignisse (Lachen, Seufzen, Atmen), die einzeln oder sprachbegleitend vorkommen können, im einzelnen: Lachen: als Ereignis: (laughter) als Attribut von Worten, die unter Lachen geäuert wurden, fahr bitte (at=laughter) los (/a) daraus wird dann automatisch gemacht werden: fahr bitte <attrib type="laughter"> los </attrib> Seuzen: als Ereignis: (sigh) als Attribut von Worten, die unter Seufzen geäuert wurden, Atmen: fahr bitte (at=sigh) los (/a) als Ereignis: (breathing) als Attribut von Worten, die unter Ausatmen geäuert wurden,
I1-[OntoSpace]:D5 3 Noise: fahr bitte (at=breathing) los (/a) als Ereignis: (noise) als Attribut von Worten, die unter Nebengeräuschen (Türschlagen, Mikroknacken usw.) geäuert wurden, fahr bitte (at=noise) los (/a) Human Noise: als Ereignis: (hnoise) als Attribut von Worten, die unter Nebengeräuschen menschlicher Quelle (Räuspern, Husten, Gähnen usw.) geäuert wurden, fahr bitte (at=hnoise) los (/a) 2.5 Attribute Merkmale von Sprache (Attribs): <attrib type= quiet > das, was zwischen den Klammern (at=quiet) und (/a) steht, wurde im Vergleich zu den anderen Worten leiser ausgesprochen stop (at=quiet) ja super (/a) <attrib type= loud > das, was zwischen den Klammern (at=loud) und (/a) steht, wurde im Vergleich zu den anderen Worten lauter ausgesprochen stop (1) (at=loud) stop (/a) <attrib type= lengthening > das, was zwischen den Klammern (at=lengthening) und (/a) steht (meist eine Silbe), wurde im Vergleich zur normalen Aussprache deutlich länger ausgesprochen zum (at=lengthening)recht(/a)ten Karton
I1-[OntoSpace]:D5 4 <attrib type= prominent > das, was zwischen den Klammern (at=prominent) und (/a) steht (meist eine Silbe), wurde im Vergleich zu den anderen Worten deutlich hervorgehoben zum (at=prominent)recht(/a)en Block <attrib type= slow > das, was zwischen den Klammern (at=slow) und (/a) steht, wurde im Vergleich zu den anderen Worten langsamer ausgesprochen (at=slow) zum rechten Block (/a) 2.6 Unverständliche Teile Unverständliche Teile eines Turns: Stellen, an denen man nicht verstehen kann, was gesagt wurde, werden mit (...) im Turn dargestellt. geh doch mal zur (...) Kiste Stellen an denen man, meint etwas verstanden zu haben, sich aber nicht ganz sicher ist, ob das, was man verstanden hat, auch wirklich gesagt wurde, werden von Klammern und Blanks eingeschlossen. geh (at=unclear) doch mal (/a) zur vorderen linken Kiste Abbrüche: An einigen Stellen spricht der User ein Wort nicht vollständig aus, sondern bricht das Wort ab. Dieses wird folgendermaen gekennzeichnet: geh zum Kart+ 2.7 Intonationskontur Intonationskontur:
I1-[OntoSpace]:D5 5. fallende Intonationskontur? steigende Intonationskontur, sanft abfallende, aber Unvollständigkeit signalisierende Intonationskontur (so wie am Ende eines Nebensatzes, der von einem Hauptsatz gefolgt wird) los jetzt, nach vorne. (5) hallo? -- hörst Du mich?