Wortfinales Schwa in BeMaTaC: L1 vs. L2. Simon Sauer Korpuslinguistisches Kolloquium Humboldt-Universität zu Berlin

Größe: px
Ab Seite anzeigen:

Download "Wortfinales Schwa in BeMaTaC: L1 vs. L2. Simon Sauer Korpuslinguistisches Kolloquium Humboldt-Universität zu Berlin"

Transkript

1 Wortfinales Schwa in BeMaTaC: L1 vs. L2 Simon Sauer Korpuslinguistisches Kolloquium Humboldt-Universität zu Berlin

2 Phänomen In gesprochenem Deutsch wird wortfinales Schwa oft weggelassen ich habe: /ɪç haːbə/ /ɪç ha(ː)p/ ich laufe: /ɪç laʊfə/ /ɪç laʊf/ Wortfinales Schwa in BeMaTaC: L1 vs. L2 Simon Sauer 2

3 Häufigkeit Studie von Kohler & Rodgers (2001) Daten: Kiel Corpus (muttersprachlich) Zwei aufeinanderfolgende Schwas: keine Weglassung Weglassung nach betonter Silbe: 2,6 % für Lesesprache 23 % für spontane Sprache (Terminvereinbarungsaufgabe) 68 % davon in Funktionswörtern 55 % davon habe, würde, wäre 32 % davon in Inhaltswörtern, davon wiederum 88 % Verben in 1. Person Singular Wortfinales Schwa in BeMaTaC: L1 vs. L2 Simon Sauer 3

4 Forschungsfrage In welchen Kontexten über- oder untergebrauchen fortgeschrittene LernerInnen des Deutschen verbfinales Schwa? Wortfinales Schwa in BeMaTaC: L1 vs. L2 Simon Sauer 4

5 Forschungsfrage(n) In welchen Kontexten über- oder untergebrauchen fortgeschrittene LernerInnen des Deutschen verbfinales Schwa? In welchen Kontexten lassen MuttersprachlerInnen des Deutschen wie häufig verbfinales Schwa weg? In welchen Kontexten lassen fortgeschrittene LernerInnen des Deutschen wie häufig verbfinales Schwa weg? Wortfinales Schwa in BeMaTaC: L1 vs. L2 Simon Sauer 5

6 Korpus Berlin Map Task Corpus (BeMaTaC) Enthält keine phonetische Transkription Frei verfügbar, enthält Audiodaten Spontansprachlich (map tasks) Identisch aufgebaut für L1 und L2 Wortweise Tokenisierung, zeitaligniert, normalisiert, lemmatisiert, POS-getaggt Wortfinales Schwa in BeMaTaC: L1 vs. L2 Simon Sauer 6

7 Korpus Berlin Map Task Corpus (BeMaTaC) Enthält keine phonetische Transkription Frei verfügbar, enthält Audiodaten Spontansprachlich (map tasks) Identisch aufgebaut für L1 und L2 Wortweise Tokenisierung, zeitaligniert, normalisiert, lemmatisiert, POS-getaggt Wortfinales Schwa in BeMaTaC: L1 vs. L2 Simon Sauer 7

8 Daten Aktuelle Version 2.1: L1: 12 Dialoge, 66 min, 8900 normalisierte Token, 108 auf -e endende Verben L2: 5 Dialoge, 77 min, 9228 normalisierte Token, 107 auf -e endende Verben Zusätzlich in Version 3.0: L1: 5 Dialoge, 42 Minuten L2: 2 Dialoge, 30 Minuten Wortfinales Schwa in BeMaTaC: L1 vs. L2 Simon Sauer 8

9 Vorstudie in BeMaTaC (mit Malte Belz und Anke Lüdeling) Vergleich zwischen diplomatischer und normalisierter Transkription Wortfinales Schwa in Verben Diplomatische Transkription das hab ich nicht gesagt Normalisierte Transkription das habe ich nicht gesagt Wortart (STTS, automatisch) PDS VAFIN PPER PTKNEG VVPP Wortfinales Schwa in BeMaTaC: L1 vs. L2 Simon Sauer 9

10 Ergebnisse (Vorstudie) -Formen (dipl) -e-formen (norm) % -e-weglassung L % L % Schriftsprache kann (hier) nicht Grundlage zielsprachiger gesprochensprachlicher Verwendung sein MuttersprachlerInnen weichen stärker vom Standard ab als (fortgeschrittene) LernerInnen Wortfinales Schwa in BeMaTaC: L1 vs. L2 Simon Sauer 10

11 Probleme Diplomatische Transkription ist nicht konsistent, für finales Schwa gibt es keine expliziten Richtlinien Diplomatische Transkription ist nicht phonetisch (Ambiguität von -e) Vorkommen ist nicht kategorial, Schwa wird in unterschiedlicher Länge realisiert Wortfinales Schwa in BeMaTaC: L1 vs. L2 Simon Sauer 11

12 Geplantes Vorgehen Annotation der Länge aller verbfinalen Schwas in BeMaTaC Identifizierung der interagierenden Kontexte (siehe nächste Folie) Ggf. Auswahl der näher zu betrachtenden Kontexte Auswertung jeweils für L1 und L2 Systematischer Vergleich zwischen L1 und L2 Wortfinales Schwa in BeMaTaC: L1 vs. L2 Simon Sauer 12

13 Schwa-Kontexte Phonetisch-phonologischer Kontext Betonung und Länge der vorangehenden Silbe Vokal am Anfang des nächsten Wortes (67,63 % der ausgelassenen Schwas*) Nachfolgende Phrasengrenzen (weniger Auslassungen*) Lexikalischer Kontext (Wortart) Inhalts- vs. Funktionswort Wortfrequenz Morphosyntaktischer Kontext Flexionsform (1. Person Singular, Ausnahme: wäre) Wortstellung * Kohler & Rodgers (2001) Wortfinales Schwa in BeMaTaC: L1 vs. L2 Simon Sauer 13

14 Trigrammauswertung (Vorstudie) Wortfinales Schwa in BeMaTaC: L1 vs. L2 Simon Sauer 14

15 Abgrenzung Wortinternes Schwa verhält sich anders, insbesondere im phonetisch-phonologischen Kontext ohne phonetische Transkription schwer zu finden Wortfinales Schwa in Nomina verhält sich anders marginal dialektale Variation Wortfinales Schwa in Imperativen kanonisch, auch in Schriftsprache normativ korrekt Einschluss wegen Tagging-/Normalisierungsfehlern, Ausschluss genuiner Imperative Wortfinales Schwa in BeMaTaC: L1 vs. L2 Simon Sauer 15

16 Motivation Schwa ist sowohl der häufigste Vokal im Deutschen (17 %)*, als auch der am häufigsten ausgelassene Vokal (64 % vs. 2,7 % andere Vokale)* Nichtkategorialität des Vorkommens, keine Zielhypothese möglich Nichtkategorialität der Ausprägung (Schwa-Länge) Kontextabhängigkeit des Phänomens von verschiedenen linguistischen Ebenen Produktivität des Phänomens vs. lexical teddy bears, DaF-Vermittlung Perzeption: Natürlichkeit vs. foreign-soundingness * Kohler & Rodgers (2001) Wortfinales Schwa in BeMaTaC: L1 vs. L2 Simon Sauer 16

17 Diskussion Wortfinales Schwa in BeMaTaC: L1 vs. L2 Simon Sauer 17

18 Literatur Klaus J. Kohler & Jonathan Rodgers Schwa Deletion in German Read and Spontaneous Speech. Arbeitsberichte des Instituts für Phonetik und digitale Sprachverarbeitung der Universität Kiel (AIPUK) 35, Wortfinales Schwa in BeMaTaC: L1 vs. L2 Simon Sauer 18

Swantje Westpfahl & Thomas Schmidt POS für(s) FOLK

Swantje Westpfahl & Thomas Schmidt POS für(s) FOLK Swantje Westpfahl & Thomas Schmidt POS für(s) FOLK Problemanalyse des POS- Taggings für spontansprachliche Daten anhand des Forschungsund Lehrkorpus Gesprochenes Deutsch 2 FOLK Forschungs- und Lehrkorpus

Mehr

ANNIS Quickstart

ANNIS Quickstart Suche in ANNIS Bevor man suchen kann, muss das gewünschte Korpus in der Korpusliste ausgewählt werden (z.b. das Teilkorpus mo (monoethnisches Ergänzungskorpus) oder KiDKo mu (multiethnisches Korpus). Danach

Mehr

HS: Korpuslinguistische Behandlung von Phänomenen des Deutschen

HS: Korpuslinguistische Behandlung von Phänomenen des Deutschen HS: Korpuslinguistische Behandlung von Phänomenen des Deutschen WS 2005/2006 Anke Lüdeling with a lot of help from Stefan Evert & Marco Baroni Kontrastive Analyse (CIA) (quantitativer) Vergleich von zwei

Mehr

Korpuslinguistik Annis 3 -Korpussuchtool Suchen in tief annotierten Korpora

Korpuslinguistik Annis 3 -Korpussuchtool Suchen in tief annotierten Korpora Korpuslinguistik Annis 3 -Korpussuchtool Suchen in tief annotierten Korpora Anke Lüdeling, Marc Reznicek, Amir Zeldes, Hagen Hirschmann... und anderen Mitarbeitern der HU-Korpuslinguistik Ziele Wie/Was

Mehr

Variation in natürlicher Sprache

Variation in natürlicher Sprache Priming Kurs Sommersemester 2007 JWG Frankfurt, 12.06.2007 Themenbereiche der Sitzung Variation in natürlicher Sprache 1. Kurzer Überblick 2. Rückblick Assimilation 3. Reduktion - Einführung 4. Papers

Mehr

Annotation des Wittgenstein-Korpus mit Wortart-Information

Annotation des Wittgenstein-Korpus mit Wortart-Information Annotation des Wittgenstein-Korpus mit Wortart-Information Institut für Informations- und Sprachverarbeitung Ludwig-Maximilian-Universität München schmid@cis.uni-muenchen.de Überblick Was ist Wortart-Tagging?

Mehr

Korpuslinguistik Annis 3 -Korpussuchtool Linguistische Suchen im Ridges-Korpus LAUDATIO-Workshop Hagen Hirschmann

Korpuslinguistik Annis 3 -Korpussuchtool Linguistische Suchen im Ridges-Korpus LAUDATIO-Workshop Hagen Hirschmann Korpuslinguistik Annis 3 -Korpussuchtool Linguistische Suchen im Ridges-Korpus 07.10.2014 LAUDATIO-Workshop Hagen Hirschmann Was ist ANNIS? ANNIS steht für ANNotation of Information Structure http://www.sfb632.uni-potsdam.de/d1/annis/

Mehr

Kontextfreie Grammatiken

Kontextfreie Grammatiken Kontextfreie Grammatiken Vorlesung Computerlinguistische Techniken Alexander Koller 16. Oktober 2015 Übersicht Worum geht es in dieser Vorlesung? Übungen und Abschlussprojekt Kontextfreie Grammatiken Computerlinguistische

Mehr

Übung: Phonetische Transkription

Übung: Phonetische Transkription Übung: Phonetische Transkription 08.02.2017 Transkription des Deutschen Normative (breit phonetische) Transkriptionen des Deutschen Normativ phonetische Transkription Hausaufgabe von letzter Woche: "Ich

Mehr

Grundlagen der Analyse von Sprachdatenbanken. Jonathan Harrington

Grundlagen der Analyse von Sprachdatenbanken. Jonathan Harrington Grundlagen der nalyse von Sprachdatenbanken Jonathan Harrington Die Laborsprache Fast alle ntersuchungen in der Experimentalphonetik im 20 Jahrhundert befassen sich mit der Laborsprache. Warum? Competence/performance

Mehr

Nutzungshinweise zu den Lemmalisten für das Teilkorpus DEU_L1_EV. September 2015 David Stoppel, Franziska Wallner

Nutzungshinweise zu den Lemmalisten für das Teilkorpus DEU_L1_EV. September 2015 David Stoppel, Franziska Wallner Nutzungshinweise zu den Lemmalisten für das Teilkorpus DEU_L1_EV September 2015 David Stoppel, Franziska Wallner Einleitung Die Lemmalisten liefern Häufigkeitsangaben für Wörter der deutschen gesprochenen

Mehr

Realisierung von Wortakzent

Realisierung von Wortakzent Jochen Trommer jtrommer@uni-leipzig.de Universität Leipzig Institut für Linguistik Phonetikanalyse SS 2007 Phonologische Korrelate Phonetische Korrelate Phonologische Korrelate von Wortakzent Vollvokale

Mehr

Wortarten-Tagging (auch Part-of-Speech(PoS)-Tagging) Ein erster Schritt zur syntaktischen Annotation

Wortarten-Tagging (auch Part-of-Speech(PoS)-Tagging) Ein erster Schritt zur syntaktischen Annotation Wortarten-Tagging (auch Part-of-Speech(PoS)-Tagging) Ein erster Schritt zur syntaktischen Annotation Übersicht Allgemeines zur Ambiguität Einführung Wortarten-Tagging Tagsets Automatisches Taggen eines

Mehr

Übung: Phonetische Transkription

Übung: Phonetische Transkription Institut für Phonetik, Universität des Saarlandes Übung: Phonetische Transkription 04.02.2015 Transkription des Deutschen Frage vorweg Wie wollen wir die letzte Stunde gestalten? 2 1 Hausaufgabe zur verminderten

Mehr

Tagger for German. Online BRILL-Tagger für das Deutsche

Tagger for German. Online BRILL-Tagger für das Deutsche Tagger for German Online BRILL-Tagger für das Deutsche Morphologie V/Ü, Anke Holler Uni Heidelberg, SS2007 Nataliya Mytyay Éva Mújdricza 19.07.2007 Designed by: Dóra Dobos Tagger for German Eric Brill

Mehr

Deutsche Lernerwortarten im Falko Lernerkorpus Was Mehrebenen-POS-tags leisten können

Deutsche Lernerwortarten im Falko Lernerkorpus Was Mehrebenen-POS-tags leisten können Deutsche Lernerwortarten im Falko Lernerkorpus Was Mehrebenen-POS-tags leisten können Marc Reznicek Humboldt-Universität zu Berlin STTS- Workshop 24.9.2012 Überblick STTS in Lernerkorpora Lernerfehler

Mehr

Sprachsynthese: Part-of-Speech-Tagging

Sprachsynthese: Part-of-Speech-Tagging Sprachsynthese: Part-of-Speech-Tagging (Änderungen von F. Schiel 2016) Institut für Phonetik und Sprachverarbeitung Ludwig-Maximilians-Universität München reichelu schiel@phonetik.uni-muenchen.de 2. November

Mehr

KL WS 03/04 - Anke Lüdeling. Gliederung. Polysemie. Systematische Polysemie

KL WS 03/04 - Anke Lüdeling. Gliederung. Polysemie. Systematische Polysemie KL WS 03/04 - Anke Lüdeling Arbeitsgruppe Miniprojekt 1: Lexikalische Semantik Kann man systematische Polysemie kontextuell (automatisch) bestimmen? Anne Urbschat Ruprecht v.waldenfels Jana Drescher Emil

Mehr

Was ist ein Korpus. Zitat aus: Carstensen et al. Computerlinguistik und Sprachtechnologie: Eine Einführung. Kap. 4.2, Textkorpora

Was ist ein Korpus. Zitat aus: Carstensen et al. Computerlinguistik und Sprachtechnologie: Eine Einführung. Kap. 4.2, Textkorpora Was ist ein Korpus Korpora sind Sammlungen linguistisch aufbereitete(r) Texte in geschriebener oder gesprochener Sprache, die elektronisch gespeichert vorliegen. Zitat aus: Carstensen et al. Computerlinguistik

Mehr

Linguistische Grundlagen. Warum Tagging? Klassische Wortartenlehre Tagsets Annotation höherer Ebenen Design von Tagsets

Linguistische Grundlagen. Warum Tagging? Klassische Wortartenlehre Tagsets Annotation höherer Ebenen Design von Tagsets Linguistische Grundlagen Warum Tagging? Klassische Wortartenlehre Tagsets Annotation höherer Ebenen Design von Tagsets Warum Tagging? Abfragbarkeit linguistischer Information Generalisierbarkeit von Abfragen

Mehr

Korpus. Was ist ein Korpus?

Korpus. Was ist ein Korpus? Was ist ein Korpus? Korpus Endliche Menge von konkreten sprachlichen Äußerungen, die als empirische Grundlage für sprachwiss. Untersuchungen dienen. Stellenwert und Beschaffenheit des Korpus hängen weitgehend

Mehr

Ton, Wortbetonung, Intona/on. Jonathan Harrington

Ton, Wortbetonung, Intona/on. Jonathan Harrington Ton, Wortbetonung, Intona/on Jonathan Harrington Tonsprachen Ton- und Betonungssprachen Betonungssprachen Ergänzung des Wortschatzes durch lexikalische Töne. Einsilbige Minimalpaare (Lexeme, die nur durch

Mehr

Korpuslinguistik Annis 3 -Korpussuchtool Suchen in tief annotierten Korpora

Korpuslinguistik Annis 3 -Korpussuchtool Suchen in tief annotierten Korpora Korpuslinguistik Annis 3 -Korpussuchtool Suchen in tief annotierten Korpora Anke Lüdeling, Marc Reznicek, Amir Zeldes, Hagen Hirschmann hirschhx@hu-berlin.de... und vielen anderen Mitarbeitern der HU-Korpuslinguistik

Mehr

Neue Funktionen in der KorpusSuchmaschine ANNIS 3.1

Neue Funktionen in der KorpusSuchmaschine ANNIS 3.1 Neue Funktionen in der KorpusSuchmaschine ANNIS 3.1 Thomas Krause 1 Vorkenntnisse??? 2 Hands On Im Browser (möglichst Firefox oder Chrome) https://korpling.german.hu-berlin.de/annis3/ aufrufen Nachfragen!

Mehr

Automatisiertes Annotieren in CATMA

Automatisiertes Annotieren in CATMA Automatisiertes Annotieren in CATMA Thomas Bögel 1, Evelyn Gius 2, Marco Petris 2, Jannik Strötgen 3 1 Universität Heidelberg 2 Universität Hamburg 3 Max-Planck-Institut für Informatik jannik.stroetgen@mpi-inf.mpg.de

Mehr

Part-of-Speech-Tagging mit Transduktoren

Part-of-Speech-Tagging mit Transduktoren Ruprecht-Karls Universität Heidelberg Hauptseminar Computerlinguistik Endliche Automaten für die Sprachverarbeitung PD Dr Karin Haenelt Sommersemester 2005 Part-of-Speech-Tagging mit Transduktoren Maria

Mehr

Part-of-Speech-Tagging mit Transduktoren

Part-of-Speech-Tagging mit Transduktoren Ruprecht-Karls Universität Heidelberg Hauptseminar Computerlinguistik Endliche Automaten für die Sprachverarbeitung PD Dr. Karin Haenelt Sommersemester 2005 Part-of-Speech-Tagging mit Transduktoren Maria

Mehr

Erweiterung des STTS für gesprochene Sprache

Erweiterung des STTS für gesprochene Sprache Erweiterung des STTS für gesprochene Sprache Ines Rehbein, Sören Schalowski und Heike Wiese Institut für Deutsche Sprache SFB 632 Informationsstruktur Universität Potsdam STTS Workshop am IMS Stuttgart

Mehr

Blockseminar Einführung in die Korpuslinguistik Seminarleitung: Yvonne Krämer, M.A. Das Korpus. und seine Aufbereitung

Blockseminar Einführung in die Korpuslinguistik Seminarleitung: Yvonne Krämer, M.A. Das Korpus. und seine Aufbereitung Blockseminar Einführung in die Korpuslinguistik Seminarleitung: Yvonne Krämer, M.A. Das Korpus und seine Aufbereitung Bestandteile eines Korpus sind i.d.r.: Primärdaten Metadaten Annotationen Annotationen

Mehr

Zur korpusbasierten Analyse von Pronomina in DaF- Lernertexten: Eine Pilotstudie

Zur korpusbasierten Analyse von Pronomina in DaF- Lernertexten: Eine Pilotstudie Lamminpää, S. & C. Rink (toim.) 2014. Demokratia, Demokrati, Democracy, Demokratie. VAKKI-symposiumi XXXIV 13. 14.2.2014. VAKKI Publications 3. Vaasa, (73 85). Zur korpusbasierten Analyse von Pronomina

Mehr

Computerlinguistische Grundlagen. Jürgen Hermes Sommersemester 17 Sprachliche Informationsverarbeitung Institut für Linguistik Universität zu Köln

Computerlinguistische Grundlagen. Jürgen Hermes Sommersemester 17 Sprachliche Informationsverarbeitung Institut für Linguistik Universität zu Köln Computerlinguistische Grundlagen Jürgen Hermes Sommersemester 17 Sprachliche Informationsverarbeitung Institut für Linguistik Universität zu Köln Computerlinguistik: Schnittstellen Computerlinguistik aus

Mehr

Überblick. GK C: Einführung in die Korpuslinguistik. Fragen. Sprachwandel/Sprachvariation. Fragen. NB: Register

Überblick. GK C: Einführung in die Korpuslinguistik. Fragen. Sprachwandel/Sprachvariation. Fragen. NB: Register GK C: Einführung in die Korpuslinguistik Anke Lüdeling anke.luedeling@rz.hu-berlin.de Sommersemester 2003 Überblick Registervariation multidimensionale Analyse Register quantitative Analyse Dimensionen:

Mehr

Überblick. Hauptseminar: Einführung in die Korpuslinguistik. Wiederholung Produktivität. Wiederholung Produktivität. Fragen

Überblick. Hauptseminar: Einführung in die Korpuslinguistik. Wiederholung Produktivität. Wiederholung Produktivität. Fragen Hauptseminar: Einführung in die Korpuslinguistik Anke Lüdeling anke.luedeling@rz.hu-berlin.de Wintersemester 2002/2003 Überblick Wiederholung Produktivität Registervariation multidimensionale Analyse Register

Mehr

Annotationsrichtlinien DIMA Konsenstranskription

Annotationsrichtlinien DIMA Konsenstranskription Annotationsrichtlinien DIMA Konsenstranskription 1. Ziel Das Ziel einer Konsenstranskription ist ein weitgehend theorieneutrales Basistranskript für die Annotation von gesprochenem Deutsch. Dieses System

Mehr

Mikro und Makroprosodie. Jonathan Harrington Felicitas Kleber

Mikro und Makroprosodie. Jonathan Harrington Felicitas Kleber Mikro und Makroprosodie Jonathan Harrington Felicitas Kleber Eine akustische Analyse der Makroprosodie setzt ebenfalls eine Entfernung mikroprosodischer Eigenschaften voraus. Mikroprosodie Mikro- und Makroprosodie

Mehr

Phonologische Störungen. Referentin: Anna Roth Seminar: Störungen der kindlichen Sprachentwicklung (SoSe12) Dozentin: Prof. Dr.

Phonologische Störungen. Referentin: Anna Roth Seminar: Störungen der kindlichen Sprachentwicklung (SoSe12) Dozentin: Prof. Dr. Phonologische Störungen Referentin: Anna Roth Seminar: Störungen der kindlichen Sprachentwicklung (SoSe12) Dozentin: Prof. Dr. Petra Schulz Überblick 1) Abgrenzung: phonetische vs. phonologische Störungen

Mehr

Hidden Markov Models in Anwendungen

Hidden Markov Models in Anwendungen Hidden Markov Models in Anwendungen Dr. Vera Demberg Universität des Saarlandes 31. Mai 2012 Vera Demberg (UdS) HMM Anwendungen 31. Mai 2012 1 / 26 Hidden Markov Modelle in der Computerlinguistik Table

Mehr

Einführung. Stefanie Dipper Stefan Evert Heike Zinsmeister

Einführung. Stefanie Dipper Stefan Evert Heike Zinsmeister Einführung Stefanie Dipper Stefan Evert Heike Zinsmeister München, 28.1.2011 Korpus eine Sammlung gesprochener oder geschriebener Äußerungen typischerweise digitalisiert und maschinenlesbar Ebenen eines

Mehr

Übung: Phonetische Transkription

Übung: Phonetische Transkription Institut für Phonetik, Universität des Saarlandes Übung: Phonetische Transkription 29.10.2014 IPA-Tabelle, Transkription; Einführung in die Konsonanten Institut für Phonetik, Universität des Saarlandes

Mehr

Echos of Echos? An Episodic Theory of Lexical Access. in: Exemplarbasierte Theorien der Sprachverarbeitung. Vortragende: Roland Mühlenbernd Uwe Matull

Echos of Echos? An Episodic Theory of Lexical Access. in: Exemplarbasierte Theorien der Sprachverarbeitung. Vortragende: Roland Mühlenbernd Uwe Matull Echos of Echos? An Episodic Theory of Lexical Access in: Exemplarbasierte Theorien der Sprachverarbeitung Vortragende: Roland Mühlenbernd Uwe Matull 17.6.2008 Übersicht Historische Entwicklung Sprecher-Normalisierung

Mehr

Hidden Markov Models in Anwendungen

Hidden Markov Models in Anwendungen Hidden Markov Models in Anwendungen Prof Dr. Matthew Crocker Universität des Saarlandes 18. Juni 2015 Matthew Crocker (UdS) HMM Anwendungen 18. Juni 2015 1 / 26 Hidden Markov Modelle in der Computerlinguistik

Mehr

KORPUSGESTEUERTE SYNTAXANALYSEN

KORPUSGESTEUERTE SYNTAXANALYSEN Hagen Hirschmann hirschhx@hu-berlin.de KORPUSGESTEUERTE SYNTAXANALYSEN VON LERNERSPRACHE PRÄPOSITIONALOBJEKTE IM DAF ERWERB DGfS Jahrestagung 2013 Universität Potsdam Plan Präpositionalobjekte im DaF Daten

Mehr

Modul 4: Automatische Korpusannotation mit computerlinguistischen Werkzeugen: Bestimmung von Wortarten und Grundformen

Modul 4: Automatische Korpusannotation mit computerlinguistischen Werkzeugen: Bestimmung von Wortarten und Grundformen Institut für Computerlinguistik Sprachtechnologie in den Digital Humanities Modul 4: Automatische Korpusannotation mit computerlinguistischen Werkzeugen: Bestimmung von Wortarten und Grundformen Simon

Mehr

Übung: Phonetische Transkription

Übung: Phonetische Transkription Übung: Phonetische Transkription IPA-Tabelle, Transkription; Einführung in die Konsonanten Stephanie Köser (M.A.), Sprachwissenschaft & Sprachtechnologie, Universität des Saarlandes Hausaufgabe von letzter

Mehr

Das Zusammenspiel interpretativer und automatisierbarer Verfahren bei der Aufbereitung und Auswertung mündlicher Daten

Das Zusammenspiel interpretativer und automatisierbarer Verfahren bei der Aufbereitung und Auswertung mündlicher Daten Das Zusammenspiel interpretativer und automatisierbarer Verfahren bei der Aufbereitung und Auswertung mündlicher Daten Ein Fallbeispiel aus der angewandten Wissenschaftssprachforschung Cordula Meißner

Mehr

LAUDATIO - Eine Infrastruktur zur linguistischen Analyse historischer Korpora

LAUDATIO - Eine Infrastruktur zur linguistischen Analyse historischer Korpora LAUDATIO - Eine Infrastruktur zur linguistischen Analyse historischer Korpora Carolin Odebrecht, Humboldt-Universität zu Berlin Florian Zipser, Humboldt-Universität zu Berlin, INRIA Historische Textkorpora

Mehr

P1.1 Experimentalphonetik Ebrar Cuhadar. First language acquisition of sociophonetic information

P1.1 Experimentalphonetik Ebrar Cuhadar. First language acquisition of sociophonetic information P1.1 Experimentalphonetik 08.02.2017 Ebrar Cuhadar First language acquisition of sociophonetic information Was ist Soziophonetik? Keine genaue Definition bei deskriptive Ursachen der Sprachproduktion bei

Mehr

Geburtsschrei. Mit ca. 6 Wochen soziales Lächeln. 2 Gurrlaute, Quietschen, Brummen, Gurren

Geburtsschrei. Mit ca. 6 Wochen soziales Lächeln. 2 Gurrlaute, Quietschen, Brummen, Gurren Tabellarische Darstellung zum Spracherwerb Um die Komplexität des physiologischen Spracherwerbs darzustellen und um den Bereich des Wortschatzes in den Gesamtkontext der Sprachentwicklung einordnen zu

Mehr

Einführung in die Computerlinguistik. Morphologie I

Einführung in die Computerlinguistik. Morphologie I Einführung in die Computerlinguistik Morphologie I Hinrich Schütze & Robert Zangenfeind Centrum für Informations- und Sprachverarbeitung, LMU München 26.10.2015 Schütze & Zangenfeind: Morphologie I 1 /

Mehr

'Schärfung' in Köln-Deutsch

'Schärfung' in Köln-Deutsch 'Schärfung' in Köln-Deutsch Jonathan Harrington Theorie und Beispiele aus: Gussenhoven, C. & Peters, J. (2004) A tonal analysis of Cologne Schärfung. Phonology, 21, 251-285. Peters, J. The Cologne word

Mehr

Artikulation, Hör- und Transkriptionsübung

Artikulation, Hör- und Transkriptionsübung Artikulation, Hör- und Transkriptionsübung Stephanie Köser (M.A.) E-Mail: skoeser@coli.uni-saarland.de http://www.coli.uni-saarland.de/~skoeser/ Kursvoraussetzungen, Link-Tipps und Materialien Kurze Einführung

Mehr

Wiederholung: Korpuszusammensetzung VL: Einführung in die Korpuslinguistik

Wiederholung: Korpuszusammensetzung VL: Einführung in die Korpuslinguistik Wiederholung: Korpuszusammensetzung VL: Einführung in die Korpuslinguistik Referenzkorpora vs. Monitorkorpora Homogenität vs. Heterogenität (Parameter) Ausgewogenheit Anke Lüdeling anke.luedeling@rz.hu-berlin.de

Mehr

Einführung in die Phonologie und Graphematik

Einführung in die Phonologie und Graphematik Einführung in die Phonologie und Graphematik Bearbeitet von Nanna Fuhrhop, Jörg Peters 1. Auflage 2013. Buch inkl. Online-Nutzung. XV, 301 S. Softcover ISBN 978 3 476 02373 5 Format (B x L): 15,5 x 23,5

Mehr

Phonetische Transkription I

Phonetische Transkription I Phonetische Transkription I Transkription des Deutschen Stephanie Köser (M.A.), Sprachwissenschaft & Sprachtechnologie, Universität des Saarlandes Inhalt Ebenen der Transkription Normativ phonetische Transkription

Mehr

Disfluencies bei Muttersprachlern und Lernern des Deutschen

Disfluencies bei Muttersprachlern und Lernern des Deutschen Dispflu... ähm nee Disfluencies bei Muttersprachlern und Lernern des Deutschen Malte Belz Institut für deutsche Sprache und Linguistik malte.belz@hu-berlin.de Gliederung 1. Definition, Kontexte und Funktionen

Mehr

Einführung in die Computerlinguistik

Einführung in die Computerlinguistik Einführung in die Computerlinguistik Statistische Verfahren in der lexikalischen Semantik WS 2/22 Manfred Pinkal Beispiel: Adjektive im Wahrig-Korpus Frequenzen in einem kleinen Teilkorpus: n groß - -

Mehr

Artikulations-, Hör- und Transkriptionsübung I

Artikulations-, Hör- und Transkriptionsübung I Institut für Phonetik, Universität des Saarlandes Artikulations-, Hör- und Transkriptionsübung I Einführung, Teil 2 Konsonanten Einführung: IPA-Tabelle Struktur der IPA-Tabelle (1) Wie werden die pulmonalen

Mehr

Dokumentation gesprochener Sprache. Ein erster Anfang. Dr. Tina John

Dokumentation gesprochener Sprache. Ein erster Anfang. Dr. Tina John Dokumentation gesprochener Sprache Ein erster Anfang Organisatorisches Dozent: Büro: LS 10 R.408 @ Tel.: 880-3323 E-Mail: tjohn@isfas.uni-kiel.de Ort: Exp.-phonetischer Übungsraum (LS-8 R.20/21) 2 Organisatorisches

Mehr

Strukturelle und linguistische Annotation in historischen Textkorpora am Beispiel des Deutschen Textarchivs

Strukturelle und linguistische Annotation in historischen Textkorpora am Beispiel des Deutschen Textarchivs Strukturelle und linguistische Annotation in historischen Textkorpora am Beispiel des Deutschen Textarchivs Susanne Haaf, Alexander Geyken, Bryan Jurish, Matthias Schulz, Christian Thomas, Frank Wiegand

Mehr

Wort- und Satzbetonung. Jonathan Harrington

Wort- und Satzbetonung. Jonathan Harrington Wort- und Satzbetonung Jonathan Harrington Wortbetonung die relative Deutlichkeit der Silben eines Wortes. Die Wortbetonung desselben Wortes bleibt meistens konstant (in zb 'Kapelle' fällt in fast allen

Mehr

Dokumentation gesprochener Sprache

Dokumentation gesprochener Sprache Dokumentation gesprochener Sprache Klicks und Töne Transkription Glottisschlag vs. Plosiv Sose 2015 2 Hausaufgabe (NACHNAME_VORNAME_HA06.pdf) Erweitere deine kleine wissenschaftliche Abhandlung mit Abbildungen

Mehr

Mehrsprachigkeit im Deutschunterricht

Mehrsprachigkeit im Deutschunterricht Mehrsprachigkeit im Deutschunterricht Sprachspiele, Spracherwerb und Sprachvermittlung 2., korrigierte Auflage Von Gerlind Belke Schneider Verlag Hohengehren GmbH Inhaltsverzeichnis Vorbemerkung zur zweiten

Mehr

Sprachtechnologie als Grundlage für die maschinelle Auswertung von Texten

Sprachtechnologie als Grundlage für die maschinelle Auswertung von Texten Sprachtechnologie als Grundlage für die maschinelle Auswertung von Texten Dr-Ing Michael Piotrowski Leibniz-Institut für Europäische Geschichte @true_mxp Bamberg, 20 November 2015

Mehr

Administratives. Beat Siebenhaar

Administratives. Beat Siebenhaar Beat Siebenhaar Administratives http://www.uni-leipzig.de/~siebenh/kurse/ v_phonetik_phonologie/ Lektüre: Grassegger; Duden 6; Hall; Skript weiterführende Lektüre auf der Webseite http://www.uni-leipzig.de/~siebenh/

Mehr

Sprechgeschwindigkeit und Regionalität

Sprechgeschwindigkeit und Regionalität Sprechgeschwindigkeit und Regionalität Seminar Regionalität und Sprechgeschwindigkeit Beat Siebenhaar Mit vielem Dank an Christina Otto und Matthias Hahn und dem IDS für die Zur-Verfügung-Stellung der

Mehr

// Maximilian Arend, Florian Watterott

// Maximilian Arend, Florian Watterott 01.06.2016 // Maximilian Arend, Florian Watterott Wohin ist der Genitiv verschwunden? AUSGANGSPUNKT verbabhängige Genitive (sich eines Vorfalls erinnern) sowie nomenabhängige Genitive (das Auto meines

Mehr

Aufgabe. Erstellen eines kleinen Lernerkorpus exemplarisches Aufzeigen, wie Fehler sinnvoll klassifiziert und annotiert werden könnten

Aufgabe. Erstellen eines kleinen Lernerkorpus exemplarisches Aufzeigen, wie Fehler sinnvoll klassifiziert und annotiert werden könnten Aufgabe Erstellen eines kleinen Lernerkorpus exemplarisches Aufzeigen, wie Fehler sinnvoll klassifiziert und annotiert werden könnten Mitstreiterinnen: Elena Briskina, Julia Hantschel, Jenny Krüger, Stéphanie

Mehr

Mehrdeutigkeiten und Kategorisierung: Probleme bei der Annotation von Lernerkorpora

Mehrdeutigkeiten und Kategorisierung: Probleme bei der Annotation von Lernerkorpora Mehrdeutigkeiten und Kategorisierung: Probleme bei der Annotation von Lernerkorpora Anke Lüdeling Humboldt-Universität zu Berlin anke.luedeling@rz.hu-berlin.de Ziele Überlegungen zur Architektur von Lernerkorpora

Mehr

GI-Fachgruppentreffen RE Weak-Words und ihre Auswirkung auf die Qualität von Anforderungsdokumenten. Jennifer Krisch Daimler AG

GI-Fachgruppentreffen RE Weak-Words und ihre Auswirkung auf die Qualität von Anforderungsdokumenten. Jennifer Krisch Daimler AG GI-Fachgruppentreffen RE Weak-Words und ihre Auswirkung auf die Qualität von Anforderungsdokumenten Jennifer Krisch Daimler AG Inhalte 1 Motivation 2 Was sind Weak-Words? 3 Vorgehen bei der Analyse 4 Evaluation

Mehr

Twitter als interaktive Erweiterung des Mediums Fernsehen: Inhaltliche Analyse von Tatort- Tweets

Twitter als interaktive Erweiterung des Mediums Fernsehen: Inhaltliche Analyse von Tatort- Tweets Twitter als interaktive Erweiterung des Mediums Fernsehen: Inhaltliche Analyse von Tatort- Tweets Manuel Burghardt 1, Heike Karsten 2, Melanie Pflamminger 2 und Christian Wolff 1 Lehrstuhl für Medieninformatik

Mehr

Übung: Phonetische Transkription

Übung: Phonetische Transkription Institut für Phonetik, Universität des Saarlandes Übung: Phonetische Transkription 03.12.2014 IPA am PC, Teil 2; Vokale, Einführung Probleme? Hausaufgabe von letzter Woche Konnte jeder einen passenden

Mehr

Hintergrund: Morphologische Produktivität

Hintergrund: Morphologische Produktivität Hintergrund: Morphologische Produktivität Anke Lüdeling anke.luedeling@rz.hu-berlin.de einige Folien sind in Zusammenarbeit mit Stefan Evert (Osnabrück) entstanden Exkurs: Korpus & Korpuszählungen viele

Mehr

Proseminar Linguistische Annotation

Proseminar Linguistische Annotation Proseminar Linguistische Annotation Ines Rehbein und Josef Ruppenhofer SS 2010 Ines Rehbein und Josef Ruppenhofer (SS10) Linguistische Annotation April 2010 1 / 22 Seminarplan I. Linguistische Annotation

Mehr

Vorlesung Morphologie Flexion

Vorlesung Morphologie Flexion Vorlesung Morphologie 13.6. - Flexion Anke Lüdeling anke.luedeling@rz.hu-berlin.de Sommersemester 2008 Vertretung: Hagen Hirschmann Flexion Inhalte heute Flexionskategorien & Paradigmata Nomen Adjektive

Mehr

Psycholinguistik. p. 1/28

Psycholinguistik. p. 1/28 Psycholinguistik p. 1/28 Psycholinguistik: Allgemeine Fragen Wie und wo wird die Sprache im Gehirn verarbeitet? Sprachentwicklung 1: Wie erwerben Kinder ihre Muttersprache (Erstpracherwerb)? Sprachentwicklung

Mehr

Korpuslinguistik Annis 2 -Korpussuchtool Suchen in Falko

Korpuslinguistik Annis 2 -Korpussuchtool Suchen in Falko Korpuslinguistik Annis 2 -Korpussuchtool Suchen in Falko Marc Reznicek, Anke Lüdeling, Amir Zeldes, Hagen Hirschmann hirschhx@hu-berlin.de... und vielen anderen Mitarbeitern der HU-Korpuslinguistik Ziele

Mehr

Soziophonologie/Soziophonetik am Institut für Schallforschung

Soziophonologie/Soziophonetik am Institut für Schallforschung Soziophonologie/Soziophonetik am Institut für Schallforschung Sylvia Moosmüller, Austrian Academy of Sciences Wohllebengasse 12-14, A-1040 Wien, Austria www.kfs.oeaw.ac.at Acoustic Phonetics Group General

Mehr

Untersuchungsablauf Hypothesenbildung

Untersuchungsablauf Hypothesenbildung Mögliche Hypothesen zur englischen Verbpartikel-Stellungsvariabilität (a) Wenn das direkte Objekt eines transitiven phrasalen Verbs syntaktisch komplex ist, dann verwenden Muttersprachler öfter VPO, als

Mehr

Dokumentation gesprochener Sprache. Wortsegmentierung. Dr. Tina John

Dokumentation gesprochener Sprache. Wortsegmentierung. Dr. Tina John Dokumentation gesprochener Sprache Wortsegmentierung Inhalt rechnergestützte Transkription Umgang mit dem Programm praat Segmentieren und Etikettieren Erkennen von Lautklassen anhand der Akustik der Laute

Mehr

Versprecher: kategorial und kontinuierlich

Versprecher: kategorial und kontinuierlich Versprecher: kategorial und kontinuierlich Welche neuen Informationen entstehen aus artikulatorischen und akustischen Analysen von 'slips of the tongue'? Gliederung 1) Goldrick/Blumstein: Akustische Analyse

Mehr

Analyse fortlaufender Rede: Untersuchung von Hörersignalen in freien Gesprächen

Analyse fortlaufender Rede: Untersuchung von Hörersignalen in freien Gesprächen Institut für Phonetik, Universität des Saarlandes Analyse fortlaufender Rede: Untersuchung von Hörersignalen in freien Gesprächen 05.05.2010 Organisatorisches Nachholtermin: gegen Ende des Semesters in

Mehr

Übung: Phonetische Transkription

Übung: Phonetische Transkription Institut für Phonetik, Universität des Saarlandes Übung: Phonetische Transkription 21.01.2015 Phonemische vs. phonetische Transkription; Transkription des Deutschen Prüfungen Klausur: 02.02.2015, 12:00

Mehr

Themen. GK C: Einführung in die Korpuslinguistik. Vorverarbeitung. Tokenisierung. Tokenisierung. Aber. Vorverarbeitung

Themen. GK C: Einführung in die Korpuslinguistik. Vorverarbeitung. Tokenisierung. Tokenisierung. Aber. Vorverarbeitung GK C: Einführung in die Korpuslinguistik Anke Lüdeling anke.luedeling@rz.hu-berlin.de Sommersemester 2003 Themen Vorverarbeitung Tokenisieren Taggen Lemmatisieren Vorverarbeitung auf allen Vorverarbeitungsebenen

Mehr

Äußerungen + Segmentierung

Äußerungen + Segmentierung Äußerungen + Segmentierung Seminar: Dialoge auf Twitter Universität Potsdam Tatjana Scheffler tatjana.scheffler@uni-potsdam.de 21.10.2015 Organisatorisches Referatsvergabe Referate: - Termin zur Vorbesprechung

Mehr

Extraktion von prädikativen Präpositionalphrasen aus deutschen Korpora

Extraktion von prädikativen Präpositionalphrasen aus deutschen Korpora Extraktion von prädikativen Präpositionalphrasen aus deutschen Korpora Anita Gojun Universität Stuttgart Institut für maschinelle Sprachverarbeitung Computerlinguistik Azenbergstr. 12 D 70174 Stuttgart

Mehr

Thomas Schmidt, Dolores Batinić DAS FORSCHUNGS- UND LEHRKORPUS GESPROCHENES DEUTSCH (FOLK) ALS QUELLE FÜR LEXIKOGRAPHISCHE ARBEIT

Thomas Schmidt, Dolores Batinić DAS FORSCHUNGS- UND LEHRKORPUS GESPROCHENES DEUTSCH (FOLK) ALS QUELLE FÜR LEXIKOGRAPHISCHE ARBEIT Thomas Schmidt, Dolores Batinić DAS FORSCHUNGS- UND LEHRKORPUS GESPROCHENES DEUTSCH (FOLK) ALS QUELLE FÜR LEXIKOGRAPHISCHE ARBEIT GLIEDERUNG (1) FOLK ein Gesprächskorpus Daten, Annotationen, Design / Stratifikation

Mehr

Einführung in die Computerlinguistik. Morphologie III

Einführung in die Computerlinguistik. Morphologie III Einführung in die Computerlinguistik Morphologie III Hinrich Schütze & Robert Zangenfeind Centrum für Informations- und Sprachverarbeitung, LMU München 7.12.2015 Schütze & Zangenfeind: Morphologie III

Mehr

Von Sankt Anselm zu Ente Apfelmus: Normalisierung und Tagging frühneuhochdt. Texte

Von Sankt Anselm zu Ente Apfelmus: Normalisierung und Tagging frühneuhochdt. Texte Von Sankt Anselm zu Ente Apfelmus: Normalisierung und Tagging frühneuhochdt. Texte Stefanie Dipper Sprachwissenschaftliches Institut Ruhr-Universität Bochum Historische Textkorpora für die Geistes- und

Mehr

PHRASENERKENNUNG IM ENGLISCHEN

PHRASENERKENNUNG IM ENGLISCHEN Centrum für Informations- und Sprachverarbeitung (CIS) Michaela Geierhos PHRASENERKENNUNG IM ENGLISCHEN mit kaskadierten lokalen Grammatiken, linguistischen Filtern und diversen statistischen Methoden

Mehr

Relationen zwischen Nomen und ihren Assoziationen. Michael Roth

Relationen zwischen Nomen und ihren Assoziationen. Michael Roth Relationen zwischen Nomen und ihren Assoziationen Michael Roth 2 Assoziationen sind psychologisch interessant. Wie erfolgt der Zugriff auf sie? Welche Bedeutung haben sie? erfüllen einen linguistischen

Mehr

THE ROLE OF PROSODIC SENSITIVITY IN CHILDREN S READING DEVELOPMENT

THE ROLE OF PROSODIC SENSITIVITY IN CHILDREN S READING DEVELOPMENT Universität des Saarlandes Fakultät 4.7 HS: Kinderintonation Dozentin: Bistra Andreeva Referentin: Juliane Schmidt THE ROLE OF PROSODIC SENSITIVITY IN CHILDREN S READING DEVELOPMENT Karen Whalley und Julie

Mehr

Part of Speech Tagging. Linguistische Sicht. Carolin Deck

Part of Speech Tagging. Linguistische Sicht. Carolin Deck Part of Speech Tagging Linguistische Sicht Carolin Deck Gliederung 1. Begriffsklärung 2. Vorstellung zwei wichtiger Tagsets (STTS & PTTS) 3. Bedeutung des POS-Tagging für die Sprachwissenschaft 4. Tagzuweisung

Mehr

HMM-Synthese (Grundzüge)

HMM-Synthese (Grundzüge) (Grundzüge) Institut für Phonetik und Sprachverarbeitung Ludwig-Maximilians-Universität München reichelu@phonetik.uni-muenchen.de 6. Dezember 2010 Inhalt HMM-Grundlagen HMM und Phonemerkennung HMM-Grundlagen

Mehr

Gliederung Stil. Gliederung. Einführung: Stil und Stilometrie. Einführung: Stil und Stilometrie II. Vergleichbarkeit

Gliederung Stil. Gliederung. Einführung: Stil und Stilometrie. Einführung: Stil und Stilometrie II. Vergleichbarkeit Gliederung Stil Felix Lange, Peter Palaga, Marah Pfennigsdorf, Inese Sture-Goldmann, Francesca Schmidt, Petya Silvestrova Seminar: Korpuslinguistische Bearbeitung von Phänomenen des Deutschen Dozentin:

Mehr

Übung: Phonetische Transkription

Übung: Phonetische Transkription Institut für Phonetik, Universität des Saarlandes Übung: Phonetische Transkription 10.12.2014 Vokale, Forts. Vokale Wiederholung: Kardinalvokale rot: primäre Kardinalvokale 1 9 16 8 blau: sekundäre Kardinalvokale

Mehr