Wortfinales Schwa in BeMaTaC: L1 vs. L2. Simon Sauer Korpuslinguistisches Kolloquium Humboldt-Universität zu Berlin
|
|
- Alexandra Feld
- vor 5 Jahren
- Abrufe
Transkript
1 Wortfinales Schwa in BeMaTaC: L1 vs. L2 Simon Sauer Korpuslinguistisches Kolloquium Humboldt-Universität zu Berlin
2 Phänomen In gesprochenem Deutsch wird wortfinales Schwa oft weggelassen ich habe: /ɪç haːbə/ /ɪç ha(ː)p/ ich laufe: /ɪç laʊfə/ /ɪç laʊf/ Wortfinales Schwa in BeMaTaC: L1 vs. L2 Simon Sauer 2
3 Häufigkeit Studie von Kohler & Rodgers (2001) Daten: Kiel Corpus (muttersprachlich) Zwei aufeinanderfolgende Schwas: keine Weglassung Weglassung nach betonter Silbe: 2,6 % für Lesesprache 23 % für spontane Sprache (Terminvereinbarungsaufgabe) 68 % davon in Funktionswörtern 55 % davon habe, würde, wäre 32 % davon in Inhaltswörtern, davon wiederum 88 % Verben in 1. Person Singular Wortfinales Schwa in BeMaTaC: L1 vs. L2 Simon Sauer 3
4 Forschungsfrage In welchen Kontexten über- oder untergebrauchen fortgeschrittene LernerInnen des Deutschen verbfinales Schwa? Wortfinales Schwa in BeMaTaC: L1 vs. L2 Simon Sauer 4
5 Forschungsfrage(n) In welchen Kontexten über- oder untergebrauchen fortgeschrittene LernerInnen des Deutschen verbfinales Schwa? In welchen Kontexten lassen MuttersprachlerInnen des Deutschen wie häufig verbfinales Schwa weg? In welchen Kontexten lassen fortgeschrittene LernerInnen des Deutschen wie häufig verbfinales Schwa weg? Wortfinales Schwa in BeMaTaC: L1 vs. L2 Simon Sauer 5
6 Korpus Berlin Map Task Corpus (BeMaTaC) Enthält keine phonetische Transkription Frei verfügbar, enthält Audiodaten Spontansprachlich (map tasks) Identisch aufgebaut für L1 und L2 Wortweise Tokenisierung, zeitaligniert, normalisiert, lemmatisiert, POS-getaggt Wortfinales Schwa in BeMaTaC: L1 vs. L2 Simon Sauer 6
7 Korpus Berlin Map Task Corpus (BeMaTaC) Enthält keine phonetische Transkription Frei verfügbar, enthält Audiodaten Spontansprachlich (map tasks) Identisch aufgebaut für L1 und L2 Wortweise Tokenisierung, zeitaligniert, normalisiert, lemmatisiert, POS-getaggt Wortfinales Schwa in BeMaTaC: L1 vs. L2 Simon Sauer 7
8 Daten Aktuelle Version 2.1: L1: 12 Dialoge, 66 min, 8900 normalisierte Token, 108 auf -e endende Verben L2: 5 Dialoge, 77 min, 9228 normalisierte Token, 107 auf -e endende Verben Zusätzlich in Version 3.0: L1: 5 Dialoge, 42 Minuten L2: 2 Dialoge, 30 Minuten Wortfinales Schwa in BeMaTaC: L1 vs. L2 Simon Sauer 8
9 Vorstudie in BeMaTaC (mit Malte Belz und Anke Lüdeling) Vergleich zwischen diplomatischer und normalisierter Transkription Wortfinales Schwa in Verben Diplomatische Transkription das hab ich nicht gesagt Normalisierte Transkription das habe ich nicht gesagt Wortart (STTS, automatisch) PDS VAFIN PPER PTKNEG VVPP Wortfinales Schwa in BeMaTaC: L1 vs. L2 Simon Sauer 9
10 Ergebnisse (Vorstudie) -Formen (dipl) -e-formen (norm) % -e-weglassung L % L % Schriftsprache kann (hier) nicht Grundlage zielsprachiger gesprochensprachlicher Verwendung sein MuttersprachlerInnen weichen stärker vom Standard ab als (fortgeschrittene) LernerInnen Wortfinales Schwa in BeMaTaC: L1 vs. L2 Simon Sauer 10
11 Probleme Diplomatische Transkription ist nicht konsistent, für finales Schwa gibt es keine expliziten Richtlinien Diplomatische Transkription ist nicht phonetisch (Ambiguität von -e) Vorkommen ist nicht kategorial, Schwa wird in unterschiedlicher Länge realisiert Wortfinales Schwa in BeMaTaC: L1 vs. L2 Simon Sauer 11
12 Geplantes Vorgehen Annotation der Länge aller verbfinalen Schwas in BeMaTaC Identifizierung der interagierenden Kontexte (siehe nächste Folie) Ggf. Auswahl der näher zu betrachtenden Kontexte Auswertung jeweils für L1 und L2 Systematischer Vergleich zwischen L1 und L2 Wortfinales Schwa in BeMaTaC: L1 vs. L2 Simon Sauer 12
13 Schwa-Kontexte Phonetisch-phonologischer Kontext Betonung und Länge der vorangehenden Silbe Vokal am Anfang des nächsten Wortes (67,63 % der ausgelassenen Schwas*) Nachfolgende Phrasengrenzen (weniger Auslassungen*) Lexikalischer Kontext (Wortart) Inhalts- vs. Funktionswort Wortfrequenz Morphosyntaktischer Kontext Flexionsform (1. Person Singular, Ausnahme: wäre) Wortstellung * Kohler & Rodgers (2001) Wortfinales Schwa in BeMaTaC: L1 vs. L2 Simon Sauer 13
14 Trigrammauswertung (Vorstudie) Wortfinales Schwa in BeMaTaC: L1 vs. L2 Simon Sauer 14
15 Abgrenzung Wortinternes Schwa verhält sich anders, insbesondere im phonetisch-phonologischen Kontext ohne phonetische Transkription schwer zu finden Wortfinales Schwa in Nomina verhält sich anders marginal dialektale Variation Wortfinales Schwa in Imperativen kanonisch, auch in Schriftsprache normativ korrekt Einschluss wegen Tagging-/Normalisierungsfehlern, Ausschluss genuiner Imperative Wortfinales Schwa in BeMaTaC: L1 vs. L2 Simon Sauer 15
16 Motivation Schwa ist sowohl der häufigste Vokal im Deutschen (17 %)*, als auch der am häufigsten ausgelassene Vokal (64 % vs. 2,7 % andere Vokale)* Nichtkategorialität des Vorkommens, keine Zielhypothese möglich Nichtkategorialität der Ausprägung (Schwa-Länge) Kontextabhängigkeit des Phänomens von verschiedenen linguistischen Ebenen Produktivität des Phänomens vs. lexical teddy bears, DaF-Vermittlung Perzeption: Natürlichkeit vs. foreign-soundingness * Kohler & Rodgers (2001) Wortfinales Schwa in BeMaTaC: L1 vs. L2 Simon Sauer 16
17 Diskussion Wortfinales Schwa in BeMaTaC: L1 vs. L2 Simon Sauer 17
18 Literatur Klaus J. Kohler & Jonathan Rodgers Schwa Deletion in German Read and Spontaneous Speech. Arbeitsberichte des Instituts für Phonetik und digitale Sprachverarbeitung der Universität Kiel (AIPUK) 35, Wortfinales Schwa in BeMaTaC: L1 vs. L2 Simon Sauer 18
Swantje Westpfahl & Thomas Schmidt POS für(s) FOLK
Swantje Westpfahl & Thomas Schmidt POS für(s) FOLK Problemanalyse des POS- Taggings für spontansprachliche Daten anhand des Forschungsund Lehrkorpus Gesprochenes Deutsch 2 FOLK Forschungs- und Lehrkorpus
MehrANNIS Quickstart
Suche in ANNIS Bevor man suchen kann, muss das gewünschte Korpus in der Korpusliste ausgewählt werden (z.b. das Teilkorpus mo (monoethnisches Ergänzungskorpus) oder KiDKo mu (multiethnisches Korpus). Danach
MehrHS: Korpuslinguistische Behandlung von Phänomenen des Deutschen
HS: Korpuslinguistische Behandlung von Phänomenen des Deutschen WS 2005/2006 Anke Lüdeling with a lot of help from Stefan Evert & Marco Baroni Kontrastive Analyse (CIA) (quantitativer) Vergleich von zwei
MehrKorpuslinguistik Annis 3 -Korpussuchtool Suchen in tief annotierten Korpora
Korpuslinguistik Annis 3 -Korpussuchtool Suchen in tief annotierten Korpora Anke Lüdeling, Marc Reznicek, Amir Zeldes, Hagen Hirschmann... und anderen Mitarbeitern der HU-Korpuslinguistik Ziele Wie/Was
MehrVariation in natürlicher Sprache
Priming Kurs Sommersemester 2007 JWG Frankfurt, 12.06.2007 Themenbereiche der Sitzung Variation in natürlicher Sprache 1. Kurzer Überblick 2. Rückblick Assimilation 3. Reduktion - Einführung 4. Papers
MehrAnnotation des Wittgenstein-Korpus mit Wortart-Information
Annotation des Wittgenstein-Korpus mit Wortart-Information Institut für Informations- und Sprachverarbeitung Ludwig-Maximilian-Universität München schmid@cis.uni-muenchen.de Überblick Was ist Wortart-Tagging?
MehrKorpuslinguistik Annis 3 -Korpussuchtool Linguistische Suchen im Ridges-Korpus LAUDATIO-Workshop Hagen Hirschmann
Korpuslinguistik Annis 3 -Korpussuchtool Linguistische Suchen im Ridges-Korpus 07.10.2014 LAUDATIO-Workshop Hagen Hirschmann Was ist ANNIS? ANNIS steht für ANNotation of Information Structure http://www.sfb632.uni-potsdam.de/d1/annis/
MehrKontextfreie Grammatiken
Kontextfreie Grammatiken Vorlesung Computerlinguistische Techniken Alexander Koller 16. Oktober 2015 Übersicht Worum geht es in dieser Vorlesung? Übungen und Abschlussprojekt Kontextfreie Grammatiken Computerlinguistische
MehrÜbung: Phonetische Transkription
Übung: Phonetische Transkription 08.02.2017 Transkription des Deutschen Normative (breit phonetische) Transkriptionen des Deutschen Normativ phonetische Transkription Hausaufgabe von letzter Woche: "Ich
MehrGrundlagen der Analyse von Sprachdatenbanken. Jonathan Harrington
Grundlagen der nalyse von Sprachdatenbanken Jonathan Harrington Die Laborsprache Fast alle ntersuchungen in der Experimentalphonetik im 20 Jahrhundert befassen sich mit der Laborsprache. Warum? Competence/performance
MehrNutzungshinweise zu den Lemmalisten für das Teilkorpus DEU_L1_EV. September 2015 David Stoppel, Franziska Wallner
Nutzungshinweise zu den Lemmalisten für das Teilkorpus DEU_L1_EV September 2015 David Stoppel, Franziska Wallner Einleitung Die Lemmalisten liefern Häufigkeitsangaben für Wörter der deutschen gesprochenen
MehrRealisierung von Wortakzent
Jochen Trommer jtrommer@uni-leipzig.de Universität Leipzig Institut für Linguistik Phonetikanalyse SS 2007 Phonologische Korrelate Phonetische Korrelate Phonologische Korrelate von Wortakzent Vollvokale
MehrWortarten-Tagging (auch Part-of-Speech(PoS)-Tagging) Ein erster Schritt zur syntaktischen Annotation
Wortarten-Tagging (auch Part-of-Speech(PoS)-Tagging) Ein erster Schritt zur syntaktischen Annotation Übersicht Allgemeines zur Ambiguität Einführung Wortarten-Tagging Tagsets Automatisches Taggen eines
MehrÜbung: Phonetische Transkription
Institut für Phonetik, Universität des Saarlandes Übung: Phonetische Transkription 04.02.2015 Transkription des Deutschen Frage vorweg Wie wollen wir die letzte Stunde gestalten? 2 1 Hausaufgabe zur verminderten
MehrTagger for German. Online BRILL-Tagger für das Deutsche
Tagger for German Online BRILL-Tagger für das Deutsche Morphologie V/Ü, Anke Holler Uni Heidelberg, SS2007 Nataliya Mytyay Éva Mújdricza 19.07.2007 Designed by: Dóra Dobos Tagger for German Eric Brill
MehrDeutsche Lernerwortarten im Falko Lernerkorpus Was Mehrebenen-POS-tags leisten können
Deutsche Lernerwortarten im Falko Lernerkorpus Was Mehrebenen-POS-tags leisten können Marc Reznicek Humboldt-Universität zu Berlin STTS- Workshop 24.9.2012 Überblick STTS in Lernerkorpora Lernerfehler
MehrSprachsynthese: Part-of-Speech-Tagging
Sprachsynthese: Part-of-Speech-Tagging (Änderungen von F. Schiel 2016) Institut für Phonetik und Sprachverarbeitung Ludwig-Maximilians-Universität München reichelu schiel@phonetik.uni-muenchen.de 2. November
MehrKL WS 03/04 - Anke Lüdeling. Gliederung. Polysemie. Systematische Polysemie
KL WS 03/04 - Anke Lüdeling Arbeitsgruppe Miniprojekt 1: Lexikalische Semantik Kann man systematische Polysemie kontextuell (automatisch) bestimmen? Anne Urbschat Ruprecht v.waldenfels Jana Drescher Emil
MehrWas ist ein Korpus. Zitat aus: Carstensen et al. Computerlinguistik und Sprachtechnologie: Eine Einführung. Kap. 4.2, Textkorpora
Was ist ein Korpus Korpora sind Sammlungen linguistisch aufbereitete(r) Texte in geschriebener oder gesprochener Sprache, die elektronisch gespeichert vorliegen. Zitat aus: Carstensen et al. Computerlinguistik
MehrLinguistische Grundlagen. Warum Tagging? Klassische Wortartenlehre Tagsets Annotation höherer Ebenen Design von Tagsets
Linguistische Grundlagen Warum Tagging? Klassische Wortartenlehre Tagsets Annotation höherer Ebenen Design von Tagsets Warum Tagging? Abfragbarkeit linguistischer Information Generalisierbarkeit von Abfragen
MehrKorpus. Was ist ein Korpus?
Was ist ein Korpus? Korpus Endliche Menge von konkreten sprachlichen Äußerungen, die als empirische Grundlage für sprachwiss. Untersuchungen dienen. Stellenwert und Beschaffenheit des Korpus hängen weitgehend
MehrTon, Wortbetonung, Intona/on. Jonathan Harrington
Ton, Wortbetonung, Intona/on Jonathan Harrington Tonsprachen Ton- und Betonungssprachen Betonungssprachen Ergänzung des Wortschatzes durch lexikalische Töne. Einsilbige Minimalpaare (Lexeme, die nur durch
MehrKorpuslinguistik Annis 3 -Korpussuchtool Suchen in tief annotierten Korpora
Korpuslinguistik Annis 3 -Korpussuchtool Suchen in tief annotierten Korpora Anke Lüdeling, Marc Reznicek, Amir Zeldes, Hagen Hirschmann hirschhx@hu-berlin.de... und vielen anderen Mitarbeitern der HU-Korpuslinguistik
MehrNeue Funktionen in der KorpusSuchmaschine ANNIS 3.1
Neue Funktionen in der KorpusSuchmaschine ANNIS 3.1 Thomas Krause 1 Vorkenntnisse??? 2 Hands On Im Browser (möglichst Firefox oder Chrome) https://korpling.german.hu-berlin.de/annis3/ aufrufen Nachfragen!
MehrAutomatisiertes Annotieren in CATMA
Automatisiertes Annotieren in CATMA Thomas Bögel 1, Evelyn Gius 2, Marco Petris 2, Jannik Strötgen 3 1 Universität Heidelberg 2 Universität Hamburg 3 Max-Planck-Institut für Informatik jannik.stroetgen@mpi-inf.mpg.de
MehrPart-of-Speech-Tagging mit Transduktoren
Ruprecht-Karls Universität Heidelberg Hauptseminar Computerlinguistik Endliche Automaten für die Sprachverarbeitung PD Dr Karin Haenelt Sommersemester 2005 Part-of-Speech-Tagging mit Transduktoren Maria
MehrPart-of-Speech-Tagging mit Transduktoren
Ruprecht-Karls Universität Heidelberg Hauptseminar Computerlinguistik Endliche Automaten für die Sprachverarbeitung PD Dr. Karin Haenelt Sommersemester 2005 Part-of-Speech-Tagging mit Transduktoren Maria
MehrErweiterung des STTS für gesprochene Sprache
Erweiterung des STTS für gesprochene Sprache Ines Rehbein, Sören Schalowski und Heike Wiese Institut für Deutsche Sprache SFB 632 Informationsstruktur Universität Potsdam STTS Workshop am IMS Stuttgart
MehrBlockseminar Einführung in die Korpuslinguistik Seminarleitung: Yvonne Krämer, M.A. Das Korpus. und seine Aufbereitung
Blockseminar Einführung in die Korpuslinguistik Seminarleitung: Yvonne Krämer, M.A. Das Korpus und seine Aufbereitung Bestandteile eines Korpus sind i.d.r.: Primärdaten Metadaten Annotationen Annotationen
MehrZur korpusbasierten Analyse von Pronomina in DaF- Lernertexten: Eine Pilotstudie
Lamminpää, S. & C. Rink (toim.) 2014. Demokratia, Demokrati, Democracy, Demokratie. VAKKI-symposiumi XXXIV 13. 14.2.2014. VAKKI Publications 3. Vaasa, (73 85). Zur korpusbasierten Analyse von Pronomina
MehrComputerlinguistische Grundlagen. Jürgen Hermes Sommersemester 17 Sprachliche Informationsverarbeitung Institut für Linguistik Universität zu Köln
Computerlinguistische Grundlagen Jürgen Hermes Sommersemester 17 Sprachliche Informationsverarbeitung Institut für Linguistik Universität zu Köln Computerlinguistik: Schnittstellen Computerlinguistik aus
MehrÜberblick. GK C: Einführung in die Korpuslinguistik. Fragen. Sprachwandel/Sprachvariation. Fragen. NB: Register
GK C: Einführung in die Korpuslinguistik Anke Lüdeling anke.luedeling@rz.hu-berlin.de Sommersemester 2003 Überblick Registervariation multidimensionale Analyse Register quantitative Analyse Dimensionen:
MehrÜberblick. Hauptseminar: Einführung in die Korpuslinguistik. Wiederholung Produktivität. Wiederholung Produktivität. Fragen
Hauptseminar: Einführung in die Korpuslinguistik Anke Lüdeling anke.luedeling@rz.hu-berlin.de Wintersemester 2002/2003 Überblick Wiederholung Produktivität Registervariation multidimensionale Analyse Register
MehrAnnotationsrichtlinien DIMA Konsenstranskription
Annotationsrichtlinien DIMA Konsenstranskription 1. Ziel Das Ziel einer Konsenstranskription ist ein weitgehend theorieneutrales Basistranskript für die Annotation von gesprochenem Deutsch. Dieses System
MehrMikro und Makroprosodie. Jonathan Harrington Felicitas Kleber
Mikro und Makroprosodie Jonathan Harrington Felicitas Kleber Eine akustische Analyse der Makroprosodie setzt ebenfalls eine Entfernung mikroprosodischer Eigenschaften voraus. Mikroprosodie Mikro- und Makroprosodie
MehrPhonologische Störungen. Referentin: Anna Roth Seminar: Störungen der kindlichen Sprachentwicklung (SoSe12) Dozentin: Prof. Dr.
Phonologische Störungen Referentin: Anna Roth Seminar: Störungen der kindlichen Sprachentwicklung (SoSe12) Dozentin: Prof. Dr. Petra Schulz Überblick 1) Abgrenzung: phonetische vs. phonologische Störungen
MehrHidden Markov Models in Anwendungen
Hidden Markov Models in Anwendungen Dr. Vera Demberg Universität des Saarlandes 31. Mai 2012 Vera Demberg (UdS) HMM Anwendungen 31. Mai 2012 1 / 26 Hidden Markov Modelle in der Computerlinguistik Table
MehrEinführung. Stefanie Dipper Stefan Evert Heike Zinsmeister
Einführung Stefanie Dipper Stefan Evert Heike Zinsmeister München, 28.1.2011 Korpus eine Sammlung gesprochener oder geschriebener Äußerungen typischerweise digitalisiert und maschinenlesbar Ebenen eines
MehrÜbung: Phonetische Transkription
Institut für Phonetik, Universität des Saarlandes Übung: Phonetische Transkription 29.10.2014 IPA-Tabelle, Transkription; Einführung in die Konsonanten Institut für Phonetik, Universität des Saarlandes
MehrEchos of Echos? An Episodic Theory of Lexical Access. in: Exemplarbasierte Theorien der Sprachverarbeitung. Vortragende: Roland Mühlenbernd Uwe Matull
Echos of Echos? An Episodic Theory of Lexical Access in: Exemplarbasierte Theorien der Sprachverarbeitung Vortragende: Roland Mühlenbernd Uwe Matull 17.6.2008 Übersicht Historische Entwicklung Sprecher-Normalisierung
MehrHidden Markov Models in Anwendungen
Hidden Markov Models in Anwendungen Prof Dr. Matthew Crocker Universität des Saarlandes 18. Juni 2015 Matthew Crocker (UdS) HMM Anwendungen 18. Juni 2015 1 / 26 Hidden Markov Modelle in der Computerlinguistik
MehrKORPUSGESTEUERTE SYNTAXANALYSEN
Hagen Hirschmann hirschhx@hu-berlin.de KORPUSGESTEUERTE SYNTAXANALYSEN VON LERNERSPRACHE PRÄPOSITIONALOBJEKTE IM DAF ERWERB DGfS Jahrestagung 2013 Universität Potsdam Plan Präpositionalobjekte im DaF Daten
MehrModul 4: Automatische Korpusannotation mit computerlinguistischen Werkzeugen: Bestimmung von Wortarten und Grundformen
Institut für Computerlinguistik Sprachtechnologie in den Digital Humanities Modul 4: Automatische Korpusannotation mit computerlinguistischen Werkzeugen: Bestimmung von Wortarten und Grundformen Simon
MehrÜbung: Phonetische Transkription
Übung: Phonetische Transkription IPA-Tabelle, Transkription; Einführung in die Konsonanten Stephanie Köser (M.A.), Sprachwissenschaft & Sprachtechnologie, Universität des Saarlandes Hausaufgabe von letzter
MehrDas Zusammenspiel interpretativer und automatisierbarer Verfahren bei der Aufbereitung und Auswertung mündlicher Daten
Das Zusammenspiel interpretativer und automatisierbarer Verfahren bei der Aufbereitung und Auswertung mündlicher Daten Ein Fallbeispiel aus der angewandten Wissenschaftssprachforschung Cordula Meißner
MehrLAUDATIO - Eine Infrastruktur zur linguistischen Analyse historischer Korpora
LAUDATIO - Eine Infrastruktur zur linguistischen Analyse historischer Korpora Carolin Odebrecht, Humboldt-Universität zu Berlin Florian Zipser, Humboldt-Universität zu Berlin, INRIA Historische Textkorpora
MehrP1.1 Experimentalphonetik Ebrar Cuhadar. First language acquisition of sociophonetic information
P1.1 Experimentalphonetik 08.02.2017 Ebrar Cuhadar First language acquisition of sociophonetic information Was ist Soziophonetik? Keine genaue Definition bei deskriptive Ursachen der Sprachproduktion bei
MehrGeburtsschrei. Mit ca. 6 Wochen soziales Lächeln. 2 Gurrlaute, Quietschen, Brummen, Gurren
Tabellarische Darstellung zum Spracherwerb Um die Komplexität des physiologischen Spracherwerbs darzustellen und um den Bereich des Wortschatzes in den Gesamtkontext der Sprachentwicklung einordnen zu
MehrEinführung in die Computerlinguistik. Morphologie I
Einführung in die Computerlinguistik Morphologie I Hinrich Schütze & Robert Zangenfeind Centrum für Informations- und Sprachverarbeitung, LMU München 26.10.2015 Schütze & Zangenfeind: Morphologie I 1 /
Mehr'Schärfung' in Köln-Deutsch
'Schärfung' in Köln-Deutsch Jonathan Harrington Theorie und Beispiele aus: Gussenhoven, C. & Peters, J. (2004) A tonal analysis of Cologne Schärfung. Phonology, 21, 251-285. Peters, J. The Cologne word
MehrArtikulation, Hör- und Transkriptionsübung
Artikulation, Hör- und Transkriptionsübung Stephanie Köser (M.A.) E-Mail: skoeser@coli.uni-saarland.de http://www.coli.uni-saarland.de/~skoeser/ Kursvoraussetzungen, Link-Tipps und Materialien Kurze Einführung
MehrWiederholung: Korpuszusammensetzung VL: Einführung in die Korpuslinguistik
Wiederholung: Korpuszusammensetzung VL: Einführung in die Korpuslinguistik Referenzkorpora vs. Monitorkorpora Homogenität vs. Heterogenität (Parameter) Ausgewogenheit Anke Lüdeling anke.luedeling@rz.hu-berlin.de
MehrEinführung in die Phonologie und Graphematik
Einführung in die Phonologie und Graphematik Bearbeitet von Nanna Fuhrhop, Jörg Peters 1. Auflage 2013. Buch inkl. Online-Nutzung. XV, 301 S. Softcover ISBN 978 3 476 02373 5 Format (B x L): 15,5 x 23,5
MehrPhonetische Transkription I
Phonetische Transkription I Transkription des Deutschen Stephanie Köser (M.A.), Sprachwissenschaft & Sprachtechnologie, Universität des Saarlandes Inhalt Ebenen der Transkription Normativ phonetische Transkription
MehrDisfluencies bei Muttersprachlern und Lernern des Deutschen
Dispflu... ähm nee Disfluencies bei Muttersprachlern und Lernern des Deutschen Malte Belz Institut für deutsche Sprache und Linguistik malte.belz@hu-berlin.de Gliederung 1. Definition, Kontexte und Funktionen
MehrEinführung in die Computerlinguistik
Einführung in die Computerlinguistik Statistische Verfahren in der lexikalischen Semantik WS 2/22 Manfred Pinkal Beispiel: Adjektive im Wahrig-Korpus Frequenzen in einem kleinen Teilkorpus: n groß - -
MehrArtikulations-, Hör- und Transkriptionsübung I
Institut für Phonetik, Universität des Saarlandes Artikulations-, Hör- und Transkriptionsübung I Einführung, Teil 2 Konsonanten Einführung: IPA-Tabelle Struktur der IPA-Tabelle (1) Wie werden die pulmonalen
MehrDokumentation gesprochener Sprache. Ein erster Anfang. Dr. Tina John
Dokumentation gesprochener Sprache Ein erster Anfang Organisatorisches Dozent: Büro: LS 10 R.408 @ Tel.: 880-3323 E-Mail: tjohn@isfas.uni-kiel.de Ort: Exp.-phonetischer Übungsraum (LS-8 R.20/21) 2 Organisatorisches
MehrStrukturelle und linguistische Annotation in historischen Textkorpora am Beispiel des Deutschen Textarchivs
Strukturelle und linguistische Annotation in historischen Textkorpora am Beispiel des Deutschen Textarchivs Susanne Haaf, Alexander Geyken, Bryan Jurish, Matthias Schulz, Christian Thomas, Frank Wiegand
MehrWort- und Satzbetonung. Jonathan Harrington
Wort- und Satzbetonung Jonathan Harrington Wortbetonung die relative Deutlichkeit der Silben eines Wortes. Die Wortbetonung desselben Wortes bleibt meistens konstant (in zb 'Kapelle' fällt in fast allen
MehrDokumentation gesprochener Sprache
Dokumentation gesprochener Sprache Klicks und Töne Transkription Glottisschlag vs. Plosiv Sose 2015 2 Hausaufgabe (NACHNAME_VORNAME_HA06.pdf) Erweitere deine kleine wissenschaftliche Abhandlung mit Abbildungen
MehrMehrsprachigkeit im Deutschunterricht
Mehrsprachigkeit im Deutschunterricht Sprachspiele, Spracherwerb und Sprachvermittlung 2., korrigierte Auflage Von Gerlind Belke Schneider Verlag Hohengehren GmbH Inhaltsverzeichnis Vorbemerkung zur zweiten
MehrSprachtechnologie als Grundlage für die maschinelle Auswertung von Texten
Sprachtechnologie als Grundlage für die maschinelle Auswertung von Texten Dr-Ing Michael Piotrowski Leibniz-Institut für Europäische Geschichte @true_mxp Bamberg, 20 November 2015
MehrAdministratives. Beat Siebenhaar
Beat Siebenhaar Administratives http://www.uni-leipzig.de/~siebenh/kurse/ v_phonetik_phonologie/ Lektüre: Grassegger; Duden 6; Hall; Skript weiterführende Lektüre auf der Webseite http://www.uni-leipzig.de/~siebenh/
MehrSprechgeschwindigkeit und Regionalität
Sprechgeschwindigkeit und Regionalität Seminar Regionalität und Sprechgeschwindigkeit Beat Siebenhaar Mit vielem Dank an Christina Otto und Matthias Hahn und dem IDS für die Zur-Verfügung-Stellung der
Mehr// Maximilian Arend, Florian Watterott
01.06.2016 // Maximilian Arend, Florian Watterott Wohin ist der Genitiv verschwunden? AUSGANGSPUNKT verbabhängige Genitive (sich eines Vorfalls erinnern) sowie nomenabhängige Genitive (das Auto meines
MehrAufgabe. Erstellen eines kleinen Lernerkorpus exemplarisches Aufzeigen, wie Fehler sinnvoll klassifiziert und annotiert werden könnten
Aufgabe Erstellen eines kleinen Lernerkorpus exemplarisches Aufzeigen, wie Fehler sinnvoll klassifiziert und annotiert werden könnten Mitstreiterinnen: Elena Briskina, Julia Hantschel, Jenny Krüger, Stéphanie
MehrMehrdeutigkeiten und Kategorisierung: Probleme bei der Annotation von Lernerkorpora
Mehrdeutigkeiten und Kategorisierung: Probleme bei der Annotation von Lernerkorpora Anke Lüdeling Humboldt-Universität zu Berlin anke.luedeling@rz.hu-berlin.de Ziele Überlegungen zur Architektur von Lernerkorpora
MehrGI-Fachgruppentreffen RE Weak-Words und ihre Auswirkung auf die Qualität von Anforderungsdokumenten. Jennifer Krisch Daimler AG
GI-Fachgruppentreffen RE Weak-Words und ihre Auswirkung auf die Qualität von Anforderungsdokumenten Jennifer Krisch Daimler AG Inhalte 1 Motivation 2 Was sind Weak-Words? 3 Vorgehen bei der Analyse 4 Evaluation
MehrTwitter als interaktive Erweiterung des Mediums Fernsehen: Inhaltliche Analyse von Tatort- Tweets
Twitter als interaktive Erweiterung des Mediums Fernsehen: Inhaltliche Analyse von Tatort- Tweets Manuel Burghardt 1, Heike Karsten 2, Melanie Pflamminger 2 und Christian Wolff 1 Lehrstuhl für Medieninformatik
MehrÜbung: Phonetische Transkription
Institut für Phonetik, Universität des Saarlandes Übung: Phonetische Transkription 03.12.2014 IPA am PC, Teil 2; Vokale, Einführung Probleme? Hausaufgabe von letzter Woche Konnte jeder einen passenden
MehrHintergrund: Morphologische Produktivität
Hintergrund: Morphologische Produktivität Anke Lüdeling anke.luedeling@rz.hu-berlin.de einige Folien sind in Zusammenarbeit mit Stefan Evert (Osnabrück) entstanden Exkurs: Korpus & Korpuszählungen viele
MehrProseminar Linguistische Annotation
Proseminar Linguistische Annotation Ines Rehbein und Josef Ruppenhofer SS 2010 Ines Rehbein und Josef Ruppenhofer (SS10) Linguistische Annotation April 2010 1 / 22 Seminarplan I. Linguistische Annotation
MehrVorlesung Morphologie Flexion
Vorlesung Morphologie 13.6. - Flexion Anke Lüdeling anke.luedeling@rz.hu-berlin.de Sommersemester 2008 Vertretung: Hagen Hirschmann Flexion Inhalte heute Flexionskategorien & Paradigmata Nomen Adjektive
MehrPsycholinguistik. p. 1/28
Psycholinguistik p. 1/28 Psycholinguistik: Allgemeine Fragen Wie und wo wird die Sprache im Gehirn verarbeitet? Sprachentwicklung 1: Wie erwerben Kinder ihre Muttersprache (Erstpracherwerb)? Sprachentwicklung
MehrKorpuslinguistik Annis 2 -Korpussuchtool Suchen in Falko
Korpuslinguistik Annis 2 -Korpussuchtool Suchen in Falko Marc Reznicek, Anke Lüdeling, Amir Zeldes, Hagen Hirschmann hirschhx@hu-berlin.de... und vielen anderen Mitarbeitern der HU-Korpuslinguistik Ziele
MehrSoziophonologie/Soziophonetik am Institut für Schallforschung
Soziophonologie/Soziophonetik am Institut für Schallforschung Sylvia Moosmüller, Austrian Academy of Sciences Wohllebengasse 12-14, A-1040 Wien, Austria www.kfs.oeaw.ac.at Acoustic Phonetics Group General
MehrUntersuchungsablauf Hypothesenbildung
Mögliche Hypothesen zur englischen Verbpartikel-Stellungsvariabilität (a) Wenn das direkte Objekt eines transitiven phrasalen Verbs syntaktisch komplex ist, dann verwenden Muttersprachler öfter VPO, als
MehrDokumentation gesprochener Sprache. Wortsegmentierung. Dr. Tina John
Dokumentation gesprochener Sprache Wortsegmentierung Inhalt rechnergestützte Transkription Umgang mit dem Programm praat Segmentieren und Etikettieren Erkennen von Lautklassen anhand der Akustik der Laute
MehrVersprecher: kategorial und kontinuierlich
Versprecher: kategorial und kontinuierlich Welche neuen Informationen entstehen aus artikulatorischen und akustischen Analysen von 'slips of the tongue'? Gliederung 1) Goldrick/Blumstein: Akustische Analyse
MehrAnalyse fortlaufender Rede: Untersuchung von Hörersignalen in freien Gesprächen
Institut für Phonetik, Universität des Saarlandes Analyse fortlaufender Rede: Untersuchung von Hörersignalen in freien Gesprächen 05.05.2010 Organisatorisches Nachholtermin: gegen Ende des Semesters in
MehrÜbung: Phonetische Transkription
Institut für Phonetik, Universität des Saarlandes Übung: Phonetische Transkription 21.01.2015 Phonemische vs. phonetische Transkription; Transkription des Deutschen Prüfungen Klausur: 02.02.2015, 12:00
MehrThemen. GK C: Einführung in die Korpuslinguistik. Vorverarbeitung. Tokenisierung. Tokenisierung. Aber. Vorverarbeitung
GK C: Einführung in die Korpuslinguistik Anke Lüdeling anke.luedeling@rz.hu-berlin.de Sommersemester 2003 Themen Vorverarbeitung Tokenisieren Taggen Lemmatisieren Vorverarbeitung auf allen Vorverarbeitungsebenen
MehrÄußerungen + Segmentierung
Äußerungen + Segmentierung Seminar: Dialoge auf Twitter Universität Potsdam Tatjana Scheffler tatjana.scheffler@uni-potsdam.de 21.10.2015 Organisatorisches Referatsvergabe Referate: - Termin zur Vorbesprechung
MehrExtraktion von prädikativen Präpositionalphrasen aus deutschen Korpora
Extraktion von prädikativen Präpositionalphrasen aus deutschen Korpora Anita Gojun Universität Stuttgart Institut für maschinelle Sprachverarbeitung Computerlinguistik Azenbergstr. 12 D 70174 Stuttgart
MehrThomas Schmidt, Dolores Batinić DAS FORSCHUNGS- UND LEHRKORPUS GESPROCHENES DEUTSCH (FOLK) ALS QUELLE FÜR LEXIKOGRAPHISCHE ARBEIT
Thomas Schmidt, Dolores Batinić DAS FORSCHUNGS- UND LEHRKORPUS GESPROCHENES DEUTSCH (FOLK) ALS QUELLE FÜR LEXIKOGRAPHISCHE ARBEIT GLIEDERUNG (1) FOLK ein Gesprächskorpus Daten, Annotationen, Design / Stratifikation
MehrEinführung in die Computerlinguistik. Morphologie III
Einführung in die Computerlinguistik Morphologie III Hinrich Schütze & Robert Zangenfeind Centrum für Informations- und Sprachverarbeitung, LMU München 7.12.2015 Schütze & Zangenfeind: Morphologie III
MehrVon Sankt Anselm zu Ente Apfelmus: Normalisierung und Tagging frühneuhochdt. Texte
Von Sankt Anselm zu Ente Apfelmus: Normalisierung und Tagging frühneuhochdt. Texte Stefanie Dipper Sprachwissenschaftliches Institut Ruhr-Universität Bochum Historische Textkorpora für die Geistes- und
MehrPHRASENERKENNUNG IM ENGLISCHEN
Centrum für Informations- und Sprachverarbeitung (CIS) Michaela Geierhos PHRASENERKENNUNG IM ENGLISCHEN mit kaskadierten lokalen Grammatiken, linguistischen Filtern und diversen statistischen Methoden
MehrRelationen zwischen Nomen und ihren Assoziationen. Michael Roth
Relationen zwischen Nomen und ihren Assoziationen Michael Roth 2 Assoziationen sind psychologisch interessant. Wie erfolgt der Zugriff auf sie? Welche Bedeutung haben sie? erfüllen einen linguistischen
MehrTHE ROLE OF PROSODIC SENSITIVITY IN CHILDREN S READING DEVELOPMENT
Universität des Saarlandes Fakultät 4.7 HS: Kinderintonation Dozentin: Bistra Andreeva Referentin: Juliane Schmidt THE ROLE OF PROSODIC SENSITIVITY IN CHILDREN S READING DEVELOPMENT Karen Whalley und Julie
MehrPart of Speech Tagging. Linguistische Sicht. Carolin Deck
Part of Speech Tagging Linguistische Sicht Carolin Deck Gliederung 1. Begriffsklärung 2. Vorstellung zwei wichtiger Tagsets (STTS & PTTS) 3. Bedeutung des POS-Tagging für die Sprachwissenschaft 4. Tagzuweisung
MehrHMM-Synthese (Grundzüge)
(Grundzüge) Institut für Phonetik und Sprachverarbeitung Ludwig-Maximilians-Universität München reichelu@phonetik.uni-muenchen.de 6. Dezember 2010 Inhalt HMM-Grundlagen HMM und Phonemerkennung HMM-Grundlagen
MehrGliederung Stil. Gliederung. Einführung: Stil und Stilometrie. Einführung: Stil und Stilometrie II. Vergleichbarkeit
Gliederung Stil Felix Lange, Peter Palaga, Marah Pfennigsdorf, Inese Sture-Goldmann, Francesca Schmidt, Petya Silvestrova Seminar: Korpuslinguistische Bearbeitung von Phänomenen des Deutschen Dozentin:
MehrÜbung: Phonetische Transkription
Institut für Phonetik, Universität des Saarlandes Übung: Phonetische Transkription 10.12.2014 Vokale, Forts. Vokale Wiederholung: Kardinalvokale rot: primäre Kardinalvokale 1 9 16 8 blau: sekundäre Kardinalvokale
Mehr