Wortfinales Schwa in BeMaTaC: L1 vs. L2. Simon Sauer Korpuslinguistisches Kolloquium Humboldt-Universität zu Berlin

Größe: px

Ab Seite anzeigen:

Download "Wortfinales Schwa in BeMaTaC: L1 vs. L2. Simon Sauer Korpuslinguistisches Kolloquium Humboldt-Universität zu Berlin"

Alexandra Feld
vor 5 Jahren
Abrufe

1 Wortfinales Schwa in BeMaTaC: L1 vs. L2 Simon Sauer Korpuslinguistisches Kolloquium Humboldt-Universität zu Berlin

2 Phänomen In gesprochenem Deutsch wird wortfinales Schwa oft weggelassen ich habe: /ɪç haːbə/ /ɪç ha(ː)p/ ich laufe: /ɪç laʊfə/ /ɪç laʊf/ Wortfinales Schwa in BeMaTaC: L1 vs. L2 Simon Sauer 2

3 Häufigkeit Studie von Kohler & Rodgers (2001) Daten: Kiel Corpus (muttersprachlich) Zwei aufeinanderfolgende Schwas: keine Weglassung Weglassung nach betonter Silbe: 2,6 % für Lesesprache 23 % für spontane Sprache (Terminvereinbarungsaufgabe) 68 % davon in Funktionswörtern 55 % davon habe, würde, wäre 32 % davon in Inhaltswörtern, davon wiederum 88 % Verben in 1. Person Singular Wortfinales Schwa in BeMaTaC: L1 vs. L2 Simon Sauer 3

4 Forschungsfrage In welchen Kontexten über- oder untergebrauchen fortgeschrittene LernerInnen des Deutschen verbfinales Schwa? Wortfinales Schwa in BeMaTaC: L1 vs. L2 Simon Sauer 4

5 Forschungsfrage(n) In welchen Kontexten über- oder untergebrauchen fortgeschrittene LernerInnen des Deutschen verbfinales Schwa? In welchen Kontexten lassen MuttersprachlerInnen des Deutschen wie häufig verbfinales Schwa weg? In welchen Kontexten lassen fortgeschrittene LernerInnen des Deutschen wie häufig verbfinales Schwa weg? Wortfinales Schwa in BeMaTaC: L1 vs. L2 Simon Sauer 5

6 Korpus Berlin Map Task Corpus (BeMaTaC) Enthält keine phonetische Transkription Frei verfügbar, enthält Audiodaten Spontansprachlich (map tasks) Identisch aufgebaut für L1 und L2 Wortweise Tokenisierung, zeitaligniert, normalisiert, lemmatisiert, POS-getaggt Wortfinales Schwa in BeMaTaC: L1 vs. L2 Simon Sauer 6

7 Korpus Berlin Map Task Corpus (BeMaTaC) Enthält keine phonetische Transkription Frei verfügbar, enthält Audiodaten Spontansprachlich (map tasks) Identisch aufgebaut für L1 und L2 Wortweise Tokenisierung, zeitaligniert, normalisiert, lemmatisiert, POS-getaggt Wortfinales Schwa in BeMaTaC: L1 vs. L2 Simon Sauer 7

8 Daten Aktuelle Version 2.1: L1: 12 Dialoge, 66 min, 8900 normalisierte Token, 108 auf -e endende Verben L2: 5 Dialoge, 77 min, 9228 normalisierte Token, 107 auf -e endende Verben Zusätzlich in Version 3.0: L1: 5 Dialoge, 42 Minuten L2: 2 Dialoge, 30 Minuten Wortfinales Schwa in BeMaTaC: L1 vs. L2 Simon Sauer 8

9 Vorstudie in BeMaTaC (mit Malte Belz und Anke Lüdeling) Vergleich zwischen diplomatischer und normalisierter Transkription Wortfinales Schwa in Verben Diplomatische Transkription das hab ich nicht gesagt Normalisierte Transkription das habe ich nicht gesagt Wortart (STTS, automatisch) PDS VAFIN PPER PTKNEG VVPP Wortfinales Schwa in BeMaTaC: L1 vs. L2 Simon Sauer 9

10 Ergebnisse (Vorstudie) -Formen (dipl) -e-formen (norm) % -e-weglassung L % L % Schriftsprache kann (hier) nicht Grundlage zielsprachiger gesprochensprachlicher Verwendung sein MuttersprachlerInnen weichen stärker vom Standard ab als (fortgeschrittene) LernerInnen Wortfinales Schwa in BeMaTaC: L1 vs. L2 Simon Sauer 10

11 Probleme Diplomatische Transkription ist nicht konsistent, für finales Schwa gibt es keine expliziten Richtlinien Diplomatische Transkription ist nicht phonetisch (Ambiguität von -e) Vorkommen ist nicht kategorial, Schwa wird in unterschiedlicher Länge realisiert Wortfinales Schwa in BeMaTaC: L1 vs. L2 Simon Sauer 11

12 Geplantes Vorgehen Annotation der Länge aller verbfinalen Schwas in BeMaTaC Identifizierung der interagierenden Kontexte (siehe nächste Folie) Ggf. Auswahl der näher zu betrachtenden Kontexte Auswertung jeweils für L1 und L2 Systematischer Vergleich zwischen L1 und L2 Wortfinales Schwa in BeMaTaC: L1 vs. L2 Simon Sauer 12

13 Schwa-Kontexte Phonetisch-phonologischer Kontext Betonung und Länge der vorangehenden Silbe Vokal am Anfang des nächsten Wortes (67,63 % der ausgelassenen Schwas*) Nachfolgende Phrasengrenzen (weniger Auslassungen*) Lexikalischer Kontext (Wortart) Inhalts- vs. Funktionswort Wortfrequenz Morphosyntaktischer Kontext Flexionsform (1. Person Singular, Ausnahme: wäre) Wortstellung * Kohler & Rodgers (2001) Wortfinales Schwa in BeMaTaC: L1 vs. L2 Simon Sauer 13

14 Trigrammauswertung (Vorstudie) Wortfinales Schwa in BeMaTaC: L1 vs. L2 Simon Sauer 14

15 Abgrenzung Wortinternes Schwa verhält sich anders, insbesondere im phonetisch-phonologischen Kontext ohne phonetische Transkription schwer zu finden Wortfinales Schwa in Nomina verhält sich anders marginal dialektale Variation Wortfinales Schwa in Imperativen kanonisch, auch in Schriftsprache normativ korrekt Einschluss wegen Tagging-/Normalisierungsfehlern, Ausschluss genuiner Imperative Wortfinales Schwa in BeMaTaC: L1 vs. L2 Simon Sauer 15

16 Motivation Schwa ist sowohl der häufigste Vokal im Deutschen (17 %)*, als auch der am häufigsten ausgelassene Vokal (64 % vs. 2,7 % andere Vokale)* Nichtkategorialität des Vorkommens, keine Zielhypothese möglich Nichtkategorialität der Ausprägung (Schwa-Länge) Kontextabhängigkeit des Phänomens von verschiedenen linguistischen Ebenen Produktivität des Phänomens vs. lexical teddy bears, DaF-Vermittlung Perzeption: Natürlichkeit vs. foreign-soundingness * Kohler & Rodgers (2001) Wortfinales Schwa in BeMaTaC: L1 vs. L2 Simon Sauer 16

17 Diskussion Wortfinales Schwa in BeMaTaC: L1 vs. L2 Simon Sauer 17

18 Literatur Klaus J. Kohler & Jonathan Rodgers Schwa Deletion in German Read and Spontaneous Speech. Arbeitsberichte des Instituts für Phonetik und digitale Sprachverarbeitung der Universität Kiel (AIPUK) 35, Wortfinales Schwa in BeMaTaC: L1 vs. L2 Simon Sauer 18

Ähnliche Dokumente

Swantje Westpfahl & Thomas Schmidt POS für(s) FOLK

Swantje Westpfahl & Thomas Schmidt POS für(s) FOLK Problemanalyse des POS- Taggings für spontansprachliche Daten anhand des Forschungsund Lehrkorpus Gesprochenes Deutsch 2 FOLK Forschungs- und Lehrkorpus