Conference Presentation
|
|
- Astrid Voss
- vor 7 Jahren
- Abrufe
Transkript
1 Conference Presentation Maschinelle Übersetzung für Dialekte SCHERRER, Yves Reference SCHERRER, Yves. Maschinelle Übersetzung für Dialekte. In: 5. Tage der Schweizer Linguistik / 5èmes Journées Suisses de la Linguistique, Winterthur, Nov 2008, 2008 Available at: Disclaimer: layout of this document may differ from the published version. [ Downloaded 12/01/2017 at 12:03:36 ]
2 Maschinelle Übersetzung für Dialekte Yves Scherrer Université de Genève 5. Tage der Schweizer Linguistik Winterthur Yves Scherrer (Université de Genève) Maschinelle Übersetzung für Dialekte 5. TdL, Winterthur 1 / 18
3 Dialektologie und Computerlinguistik Neuliche Konvergenzerscheinungen Computerlinguistik Probabilistische Modelle ( Variation) Verwandte Sprachen Wirtschaftlich und militärisch interessante Sprachen mit ausgeprägter Dialektpräsenz Maschinelle Übersetzung von Dialekten Dialektologie Datenbanken Geografische Informationssysteme (Karten) Dialektometrie (Ähnlichkeitsmessungen) Yves Scherrer (Université de Genève) Maschinelle Übersetzung für Dialekte 5. TdL, Winterthur 2 / 18
4 Dialektologie und Computerlinguistik Ein Projekt Fragestellungen: Wie können klassische Methoden der Computerlinguistik angepasst werden, um Dialektdaten zu verarbeiten? Wie können Resultate der Dialektforschung interaktiver und dynamischer dargestellt werden? Projekt: Maschinelle Übersetzung von standarddeutschem Text in einen beliebigen schweizerdeutschen Dialekt Eine standardisierte Quellsprache Relativ homogene Daten Mögliche Verwendung von existierenden Sprachanalyseprogrammen Ein Kontinuum von nicht standardisierten Zielvarietäten Diatopische Variation als Parameter des Übersetzungsprozesses Yves Scherrer (Université de Genève) Maschinelle Übersetzung für Dialekte 5. TdL, Winterthur 3 / 18
5 Übersicht Einführung Computerlinguistik und Dialektologie Maschinelle Übersetzung Regelbasierte und statistische Systeme 1. Etappe Übersetzung in einen einzigen Zieldialekt Systemarchitektur Analyse des Quelltextes Transformationsregeln 2. Etappe Übersetzung in ein Zieldialekt-Kontinuum Systemarchitektur Georeferenzierung der Regeln Zusammenfassung Arbeitshypothesen, Erweiterungen und Anwendungen Yves Scherrer (Université de Genève) Maschinelle Übersetzung für Dialekte 5. TdL, Winterthur 4 / 18
6 Maschinelle Übersetzung (MÜ) Zwei Ansätze Regelbasierte MÜ Sprachexperten erarbeiten Transformationsregeln und Wörterbücher Grosser Arbeitsaufwand Theoretisch: genaue Beschreibung, hohe Qualität möglich Praktisch: extrem komplex, daher fehleranfällig Statistische MÜ Grosse mehrsprachige Textkorpora (Parallelkorpora) als Hauptdatenquelle Linguistische Regelmässigkeiten werden gelernt Kleiner Arbeitsaufwand, Toolkits und Korpora frei verfügbar Erfolgreich für geringe Qualitätsansprüche Robust Yves Scherrer (Université de Genève) Maschinelle Übersetzung für Dialekte 5. TdL, Winterthur 5 / 18
7 Maschinelle Übersetzung Spezifische Eigenschaften des gewählten Sprachpaars Verfügbare Daten: Wenig Dialektkorpora Sehr heterogen (schriftlich/transkribiert, nicht normiert) Kaum Parallelkorpora (Diglossie) Ziel: Linguistische Genauigkeit ist höher zu gewichten als Entwicklungsdauer oder Robustheit Ein statistisches System ist nicht unbedingt geeignet. Nah verwandte Sprachvarietäten Überschaubare Komplexität der Regeln Linguistisch aufbereitete Daten sind vorhanden Dialektologische Studien, Sprachatlanten Der traditionelle, regelbasierte Ansatz ist in der vorliegenden Situation sinnvoller. Yves Scherrer (Université de Genève) Maschinelle Übersetzung für Dialekte 5. TdL, Winterthur 6 / 18
8 Übersicht Einführung Computerlinguistik und Dialektologie Maschinelle Übersetzung Regelbasierte und statistische Systeme 1. Etappe Übersetzung in einen einzigen Zieldialekt Systemarchitektur Analyse des Quelltextes Transformationsregeln 2. Etappe Übersetzung in ein Zieldialekt-Kontinuum Systemarchitektur Georeferenzierung der Regeln Zusammenfassung Arbeitshypothesen, Erweiterungen und Anwendungen Yves Scherrer (Université de Genève) Maschinelle Übersetzung für Dialekte 5. TdL, Winterthur 7 / 18
9 Systemarchitektur 1. Etappe Text deutsch Parser deutsch Syntaxregeln Lexikon Satzbaum deutsch Transfer Transformationsregeln (Syntax, Lexikon,... ) Satzbaum Dialekt Text Dialekt Yves Scherrer (Université de Genève) Maschinelle Übersetzung für Dialekte 5. TdL, Winterthur 8 / 18
10 Analyse des Quelltexts (Parsing) Um die Transformationen korrekt anwenden zu können, benötigen wir eine möglichst präzise Analyse des Eingangstextes: Morphologische Merkmale (Flexion) Grammatikalische Kategorien Phrasenstruktur Wir benutzen existierende Programme, um diese Informationen zu gewinnen. Fips (Unige) Das Resultat dieser Analyse ist ein Satzbaum mit detaillierter Annotation. Format: XML Yves Scherrer (Université de Genève) Maschinelle Übersetzung für Dialekte 5. TdL, Winterthur 9 / 18
11 Analyse des Quelltexts (Parsing) Ein Beispiel das grosse Haus <?xml version= " 1.0 "?> <!DOCTYPE LATLPARSE SYSTEM h t t p : / /www. l a t l. unige. ch / xml / l a t l p a r s e. dtd > <LATLPARSE xml:lang= " de "> <ANALYSIS complete= " yes " score= " 275"> <PROJ case= "nom" cat="dp" > <HEAD case= " Akk " cat="art" cathead= "D" gender= " Neut " lexeme= " der " number= "Sg"> das < /HEAD> <PROJ case= "nom" cat="np" > <PROJ case= "nom" cat="ap" > <PUNC key= " space " / > <HEAD case= " Akk " cat="adja" cathead= "A" degree= " Pos " gender= " Neut " lexeme= " gross " number= grosse < /HEAD> < /PROJ> <BAR cat="n" > <PUNC key= " space " / > <HEAD case= " Akk " cat="nn" cathead= "N" gender= " Neut " lexeme= " haus " number= "Sg"> haus < /HEAD> < /BAR> < /PROJ> < /PROJ> < / ANALYSIS> < /LATLPARSE> Yves Scherrer (Université de Genève) Maschinelle Übersetzung für Dialekte 5. TdL, Winterthur 10 / 18
12 Systemarchitektur 1. Etappe Text deutsch Parser deutsch Syntaxregeln Lexikon Satzbaum deutsch Transfer Transformationsregeln (Syntax, Lexikon,... ) Satzbaum Dialekt Text Dialekt Yves Scherrer (Université de Genève) Maschinelle Übersetzung für Dialekte 5. TdL, Winterthur 11 / 18
13 Transfer Gezielte Veränderung des annotierten Satzbaums 1 Anpassung der syntaktischen Struktur Diese Regeln ändern die Struktur des Satzbaums. 10 Regeln versuchsweise implementiert Änderung der Wortreihenfolge der Verb-Cluster in Nebensätzen Verwandlung des Präteritums in Perfekt Verwandlung von Genitivattributen in PPs oder Possessivkonstruktionen 2 Lexikalischer Transfer: Ersetzung der Wortstämme Diese Regeln ändern den Inhalt der Knoten des Satzbaums. Traditioneller Ansatz: gespeicherte Wortpaare Marienkäfer Himugüegeli Verwandte Sprachen: phonetische Regeln fliegen flüüge, biegen büüge, giessen güüsse,... 3 Generierung der Wortendungen Verbalflexion Präsens versuchsweise implementiert Yves Scherrer (Université de Genève) Maschinelle Übersetzung für Dialekte 5. TdL, Winterthur 12 / 18
14 Übersicht Einführung Computerlinguistik und Dialektologie Maschinelle Übersetzung Regelbasierte und statistische Systeme 1. Etappe Übersetzung in einen einzigen Zieldialekt Systemarchitektur Analyse des Quelltextes Transformationsregeln 2. Etappe Übersetzung in ein Zieldialekt-Kontinuum Systemarchitektur Georeferenzierung der Regeln Zusammenfassung Arbeitshypothesen, Erweiterungen und Anwendungen Yves Scherrer (Université de Genève) Maschinelle Übersetzung für Dialekte 5. TdL, Winterthur 13 / 18
15 Systemarchitektur 2. Etappe Wahl des Zieldialekts Text deutsch Parser deutsch Syntaxregeln Lexikon Satzbaum deutsch Transfer Transformationsregeln (Syntax, Lexikon,... ) + Georeferenzierung Satzbaum Dialekt Text Dialekt Yves Scherrer (Université de Genève) Maschinelle Übersetzung für Dialekte 5. TdL, Winterthur 14 / 18
16 Georeferenzierung der Regeln Daten SDS (Sprachatlas der Deutschen Schweiz): Flexionsmorphologie, Phonetik, Wortschatz Nicht digitalisiert Veraltend (Aufnahmen zwischen 1939 und 1958) SADS (Syntaktischer Atlas der Deutschen Schweiz): Im Aufbau, digitalisiert Georeferenzierte Wörterbücher könnten eine zusätzliche Quelle darstellen (z. B. WBÖ, Wörterbuch der bairischen Mundarten Österreichs), existieren aber m. W. nicht für die Deutschschweiz. Yves Scherrer (Université de Genève) Maschinelle Übersetzung für Dialekte 5. TdL, Winterthur 15 / 18
17 Georeferenzierung der Regeln Ein Beispiel aus dem SADS (F9, natürlichste Variante) Grabs Wildhaus Ebnat-Kappel..., ob er ämal hürate wett 50% 25% 0%..., ob er ämal wett hürate 20% 62% 100% Aktionen: nichts tun Modalverb verschieben Regeln (siehe PCFGs): P(Modalverb verschieben Grabs) = = 0.28 P(Modalverb verschieben Wildhaus) = = 0.71 P(Modalverb verschieben Ebnat-Kappel) = = 1 Was für Werte gelten in den nicht erfassten Ortschaften? Yves Scherrer (Université de Genève) Maschinelle Übersetzung für Dialekte 5. TdL, Winterthur 16 / 18
18 Georeferenzierung der Regeln Interpolation Eine Inspiration Das Chochichästli-Orakel Daten aus dem SDS Daten der Fragepunkte werden auf die umliegenden Flächen ausgedehnt Wahrscheinlichkeiten können durch Farbabstufungen dargestellt werden Methode: Rein mathematische Interpolation? Sollen politische, konfessionelle und topografische Faktoren berücksichtigt werden? Yves Scherrer (Université de Genève) Maschinelle Übersetzung für Dialekte 5. TdL, Winterthur 17 / 18
19 Zusammenfassung Arbeitshypothesen: Mangel und Heterogeneität von Dialektrohdaten: Regelbasiertes System am sinnvollsten Übersetzungsrichtung Standarddeutsch Dialekte Phonetische Transformationen ersetzen einen Teil des Lexikons Transformationsregeln werden georeferenziert: Eine kleine Auswahl von Daten aus dem SDS und dem SADS Interpolation Mögliche Erweiterungen und Anwendungen: Sprachsynthese ( Diglossie) Andere Übersetzungsrichtungen: Dialekt Standarddeutsch, Dialekt Dialekt Sprachdidaktik: Schweizerdeutsch als Zweitsprache Yves Scherrer (Université de Genève) Maschinelle Übersetzung für Dialekte 5. TdL, Winterthur 18 / 18
Conference Presentation
Conference Presentation Neue dialektometrische Versuche mit schweizerdeutschem Dialektmaterial SCHERRER, Yves Reference SCHERRER, Yves. Neue dialektometrische Versuche mit schweizerdeutschem Dialektmaterial.
MehrConference Presentation
Conference Presentation Ein Parser-Prototyp für Surselva-Rätoromanisch SCHERRER, Yves Abstract Das LATL entwickelt seit mehreren Jahren Werkzeuge der automatischen Sprachverarbeitung. Die Schwerpunkte
MehrComputerlinguistische Grundlagen. Jürgen Hermes Sommersemester 17 Sprachliche Informationsverarbeitung Institut für Linguistik Universität zu Köln
Computerlinguistische Grundlagen Jürgen Hermes Sommersemester 17 Sprachliche Informationsverarbeitung Institut für Linguistik Universität zu Köln Computerlinguistik: Schnittstellen Computerlinguistik aus
MehrSyntax und Parsing. OS Einblicke in die Computerlinguistik. Philipp Rabe, 13IN-M
OS Einblicke in die Computerlinguistik basierend auf Computerlinguistik und Sprachtechnologie, 3. Auflage, Spektrum, Heidelberg 2010 22. Mai 2014 Ausgangssituation Tokenisierung und Wortarten-Tagging vollendet
MehrMaschinelle Übersetzung
Maschinelle Übersetzung Wissensmanagement VO 340088 Bartholomäus Wloka https://www.adaptemy.com MÜ Ansätze Zwei Dimensionen: Verarbeitungstiefe Art der verwendeten Technik Seite 2 Verarbeitunstiefe Seite
MehrMaschinelle Übersetzung
Maschinelle Übersetzung Kluge Andreas, 13IN-M basierend auf Computerlinguistik und Sprachtechnologie, 3. Auflage, Spektrum, Heidelberg 2010 19. Juni 2014 Übersicht Gewünschte Funktionalität Schwierigkeiten
MehrComputerlinguistische Grundlagen. Jürgen Hermes Wintersemester 17/18 Sprachliche Informationsverarbeitung Institut für Linguistik Universität zu Köln
Computerlinguistische Grundlagen Jürgen Hermes Wintersemester 17/18 Sprachliche Informationsverarbeitung Institut für Linguistik Universität zu Köln Was ist Computerlinguistik? Definition Anwendungen Fragestellung
MehrMaschinelle Übersetzung
Maschinelle Übersetzung Termin: 24. Januar 2005 Dozentin: Petersen, Wiebke Referenten: Höhfeld, Stefanie Kwiatkowski, Melanie Nather, Juliane 1 Maschinelle und computergestütze Übersetzungen Fortschreitende
MehrStratego/XT und ASF+SDF Meta-Environment. Paul Weder Seminar Transformationen Datum:
Stratego/XT und ASF+SDF Meta-Environment Paul Weder Seminar Transformationen Datum: 20.01.2006 Gliederung Allgemeines ASF+SDF Meta-Environment Stratego/XT Zusammenfassung/Vergleich SDF (Syntax Definition
MehrKontrastive Linguistik und Lexikographie XII
Computer und zweisprachiges Wörterbuch moderne Lexikographie - intensive Verwendung der Elektronischen Datenverarbeitung (EDV) elektronische Wörterbücher (ewb) Bestimmung: z.t. wie bei Printwörterbüchern,
MehrInhaltsverzeichnis. Bibliografische Informationen digitalisiert durch
Inhaltsverzeichnis 1 Computerlinguistik - Was ist das? 1 1.1 Aspekte der Computerlinguistik 1 1.1.1 Computer linguistik: Die Wissenschaft 2 1.1.2 Computerlinguistik und ihre Nachbardisziplinen 3 1.1.3
Mehrxii Inhaltsverzeichnis Generalisierung Typisierte Merkmalsstrukturen Literaturhinweis
Inhaltsverzeichnis 1 Computerlinguistik Was ist das? 1 1.1 Aspekte der Computerlinguistik.................. 1 1.1.1 Computerlinguistik: Die Wissenschaft........... 2 1.1.2 Computerlinguistik und ihre Nachbardisziplinen.....
MehrEinführung in unifikationsbasierte Grammatikformalismen
Universität Potsdam Institut für Linguistik Computerlinguistik Einführung in unifikationsbasierte Grammatikformalismen Thomas Hanneforth head: VP form: finite subj: pers: 3 num: pl Merkmalsstrukturen:
MehrSprachtechnologien und maschinelle Übersetzung heute und morgen eine Einführung Martin Kappus (ZHAW)
Martin Kappus (ZHAW) Ablauf: Warum sprechen wir heute über maschinelle Übersetzung? Geschichte und Ansätze Eingabe-/Ausgabemodi und Anwendungen 2 WARUM SPRECHEN WIR HEUTE ÜBER MASCHINELLE ÜBERSETZUNG?
MehrIvana Daskalovska. Willkommen zur Übung Einführung in die Computerlinguistik. Sarah Bosch,
Ivana Daskalovska Willkommen zur Übung Einführung in die Computerlinguistik Kontakt: ivana.bt.mk@gmail.com Betreff: EICL Wiederholung Aufgabe 1 Was ist Computerlinguistik? 4 Was ist Computerlinguistik?
MehrProjektseminar "Texttechnologische Informationsmodellierung"
Projektseminar "Texttechnologische Informationsmodellierung" Ziel dieser Sitzung Nach dieser Sitzung sollten Sie: Einige standards und projekte vom Namen her kennen Einen Überblick über und einen Eindruck
MehrLinguistik mit Schwerpunkt Computerlinguistik / Sprachtechnologie
Nebenfach/Anwendungsfach Linguistik mit Schwerpunkt Computerlinguistik / Sprachtechnologie Prof. Dr. Udo Hahn Lehrstuhl für Computerlinguistik Institut für Germanistische Sprachwissenschaft Friedrich-Schiller-Universität
MehrParsing von unifikationsbasierten Grammatikformalismen
Parsing von unifikationsbasierten Grammatikformalismen Vorlesung Grammatikformalismen Alexander Koller. Juli 016 Parsing Warum kann man kfgen in polynomieller Zeit parsen, wenn doch jeder Substring exponentiell
MehrWas ist ein Korpus. Zitat aus: Carstensen et al. Computerlinguistik und Sprachtechnologie: Eine Einführung. Kap. 4.2, Textkorpora
Was ist ein Korpus Korpora sind Sammlungen linguistisch aufbereitete(r) Texte in geschriebener oder gesprochener Sprache, die elektronisch gespeichert vorliegen. Zitat aus: Carstensen et al. Computerlinguistik
MehrEinführung Computerlinguistik. Konstituentensyntax II
Einführung Computerlinguistik Konstituentensyntax II Hinrich Schütze & Robert Zangenfeind Centrum für Informations- und Sprachverarbeitung, LMU München 2013-11-18 1 / 31 Take-away Phrasenstrukturgrammatik:
MehrInhaltsverzeichnis. Vorwort...
Inhaltsverzeichnis Vorwort.......................................................... V 1. Einleitung (Jörg Meibauer/Markus Steinbach)........................ 1 1.1 Was sind»schnittstellen«?..................................
MehrINHALTSVERZEICHNIS VORWORT... 5 INHALTSVERZEICHNIS... 7 ABBILDUNGSVERZEICHNIS TABELLENVERZEICHNIS... 15
Inhaltsverzeichnis Inhaltsverzeichnis INHALTSVERZEICHNIS VORWORT... 5 INHALTSVERZEICHNIS... 7 ABBILDUNGSVERZEICHNIS... 13 TABELLENVERZEICHNIS... 15 ABKÜRZUNGSVERZEICHNIS... 17 Fachspezifische Abkürzungen...
MehrVariation im Deutschen
Stephen Barbour/Patrick Stevenson Variation im Deutschen Soziolinguistische Perspektiven Übersetzt aus dem Englischen von Konstanze Gebel w DE G Walter de Gruyter Berlin New York 1998 Inhalt Vorwort Abkürzungsverzeichnis
MehrLösungsvorschlag für das Übungsblatt 8. Aufgabe1.
Lösungsvorschlag für das Übungsblatt 8. Aufgabe1. 3 Det A N VP R6 4 Any A N VP L3 5 Any intelligent N VP L4 6 Any intelligent cat VP L2 Nach den Regeln kann der Satz weiter nicht erzeugt warden, deswegen
MehrEine Erweiterung der kontextfreien Grammatiken: PATR-II
Eine Erweiterung der kontextfreien Grammatiken: PATR-II Das ursprüngliche Problem war: Wie kann man strukturelle Information (Phrasenstruktur) von anderen grammatischen Informationen (wie Kongruenz, Rektion
MehrPROBABILISTIC PARSING FOR GERMAN USING SISTER-HEAD DEPENDENCIES
Ausgangsfrage PROBABILISTIC PARSING FOR GERMAN USING SISTER-HEAD DEPENDENCIES Irina Gossmann Carine Dombou 9. Juli 2007 INHALT Ausgangsfrage 1 AUSGANGSFRAGE 2 SYNTAX DES DEUTSCHEN + NEGRA 3 PROBABILISTISCHE
MehrElektronische Korpora in der Lehre Anwendungsbeispiele aus der theoretischen 2 und / 27der. und der Computerlinguistik
Elektronische Korpora in der Lehre Anwendungsbeispiele aus der theoretischen und der Linguistics Department Ruhr-University Bochum 18.1.2011 DSPIN-Workshop Sprachressourcen in der Lehre Erfahrungen, Einsatzszenarien,
MehrVertiefung der Grundlagen der Computerlinguistik. Semesterüberblick und Einführung zur Dependenz. Robert Zangenfeind
Vertiefung der Grundlagen der Computerlinguistik Semesterüberblick und Einführung zur Dependenz Robert Zangenfeind Centrum für Informations- und Sprachverarbeitung, LMU München 17.10.2017 Zangenfeind:
MehrRessourcen in den GSHS... am Beispiel LEXUS
> Digitale Ressourcen in den GSHS... am Beispiel LEXUS GSHS LIBRARY CONFERENCE Florenz 10.11.2006 < Marc Kemps-Snijders, Jaqcuelijn Ringersma, Peter Wittenburg MPI for Psycholinguistics, Netherlands
MehrINFORMATIONSEXTRAKTION Computerlinguistik Referenten: Alice Holka, Sandra Pyka
INFORMATIONSEXTRAKTION 1 22.12.09 Computerlinguistik Referenten: Alice Holka, Sandra Pyka INFORMATIONSEXTRAKTION(IE) 1. Einleitung 2. Ziel der IE 3. Funktionalität eines IE-Systems 4. Beispiel 5. Übung
MehrAuswahlbibliographie zum Studium der anglistischen Sprachwissenschaft
Helga Höhlein, Peter H. Marsden, Clausdirk Poliner Auswahlbibliographie zum Studium der anglistischen Sprachwissenschaft Mit Kommentaren Max Niemeyer Verlag Tübingen 1987 INHALT Seite Allgemeine Hilfsmittel.
MehrSatz Umstrukturierung für statistisch. Anna Schiffarth Dozentin: Miriam Kaeshammer Fortgeschrittene Methoden der statistisch maschinellen Übersetzung
Satz Umstrukturierung für statistisch maschinelle Übersetzung Anna Schiffarth Dozentin: Miriam Kaeshammer Fortgeschrittene Methoden der statistisch maschinellen Übersetzung Einführung Beschreibung einer
MehrAVS - M 01. Nr. Veranstaltungen SWS LP A Pflichtbereich 1 Einführung in die Phonetik & Phonologie Einführung in die Morphologie und Syntax 2 5
AVS - M 01 1. Name des Moduls: Basismodul I: Grundlagen und Methoden der AVS 2. Fachgebiet / Verantwortlich: Allgemeine und Vergleichende Sprachwissenschaft/ 3. Inhalte / Lehrziele Die Studierenden werden
MehrComputerlinguistik und Sprachtechnologie
Computerlinguistik und Sprachtechnologie Eine Einführung Herausgegeben von: Kai-Uwe Carstensen, Christian Ebert, Cornelia Endriss, Susanne Jekat, Ralf Klabunde und Hagen Langer Spektrum Akademischer Verlag
MehrDiskriminatives syntaktisches Reranking für SMT
Diskriminatives syntaktisches Reranking für SMT Fortgeschrittene Themen der statistischen maschinellen Übersetzung Janina Nikolic 2 Agenda Problem: Ranking des SMT Systems Lösung: Reranking-Modell Nutzung
MehrEinführung in die Computerlinguistik
Einführung in die Computerlinguistik Merkmalstrukturen und Unifikation Dozentin: Wiebke Petersen WS 2004/2005 Wiebke Petersen Formale Komplexität natürlicher Sprachen WS 03/04 Universität Potsdam Institut
MehrSprachliche Variation Variation im Standard
Sprachliche Variation Variation im Standard Beat Siebenhaar 1 Variation von Substandardvarietäten Diglossie Kontinuum 2 Nach Löffler (2004): Abschiedsvorlesung und ergänzt Dialektale Variation Wiesinger
MehrLemmatisierung und Stemming in Suchmaschinen
Lemmatisierung und Stemming in Suchmaschinen Hauptseminar Suchmaschinen Computerlinguistik Sommersemester 2016 Stefan Langer stefan.langer@cis.uni-muenchen.de Trefferquote (Recall) und Genauigkeit (Precision)
MehrLemmatisierung und Stemming in Suchmaschinen
Lemmatisierung und Stemming in Suchmaschinen Hauptseminar Suchmaschinen Computerlinguistik Sommersemester 2014 Stefan Langer stefan.langer@cis.uni-muenchen.de Trefferquote (Recall) und Genauigkeit (Precision)
MehrAVS - M 01. Allgemeine und Vergleichende Sprachwissenschaft/ Verantwortlich:
AVS - M 01 1. Name des Moduls: Basismodul I: Grundlagen und Methoden der AVS Allgemeine und Vergleichende Sprachwissenschaft/ 3. Inhalte / Lehrziele Die Studierenden werden in diesem Basismodul vertraut
MehrEinführung in die Computerlinguistik
Einführung in die Computerlinguistik Einführung Laura Kallmeyer Heinrich-Heine-Universität Düsseldorf Summer 2018 1 / 14 Anwendungen der Computerlinguistik Carstensen et al. (2010); Jurafsky and Martin
Mehr8 Fakultät für Philologie
8 Fakultät für Philologie 8.1 Linguistik 8.1.1 Linguistik, PO 2004 Fach Linguistik (101) Abschluss 2-Fach Bachelor (81) PO-Version 2004 Folgendes ist zurzeit in HISPOS eingerichtet: Modul-Typen: o Nachgewiesene
MehrComputerlinguistik und Sprachtechnologie
Computerlinguistik und Sprachtechnologie Eine Einführung 2., überarbeitete und erweiterte Auflage Herausgegeben von: Kai-Uwe Carstensen, Christian Ebert, Cornelia Endriss, Susanne Jekat, Ralf Klabunde
MehrComputerlinguistische Experimente für die schweizerdeutsche Dialektlandschaft: Maschinelle Übersetzung und Dialektometrie.
Proceedings Chapter Computerlinguistische Experimente für die schweizerdeutsche Dialektlandschaft: Maschinelle Übersetzung und Dialektometrie SCHERRER, Yves Reference SCHERRER, Yves. Computerlinguistische
MehrProgrammierkurs Python II
Programmierkurs Python II Michaela Regneri & tefan Thater FR 4.7 Allgemeine Linguistik (Computerlinguistik) Universität des aarlandes ommersemester 2010 (Charniak, 1997) the dog biscuits N V N V the dog
MehrComputerlinguistik I
Computerlinguistik I Vorlesung im WS 2007/08 Prof. Dr. Udo Hahn Lehrstuhl für Computerlinguistik Institut für Germanistische Sprachwissenschaft Friedrich-Schiller-Universität Jena Morphologie A writer
Mehrscremos Andrea Haid Screening Morphologie-Syntax SAL Verlag
Andrea Haid scremos Screening Morphologie-Syntax Informelles Screening zur Erfassung der grammatischen Fähigkeiten von Kindern unter Berücksichtigung dialektaler Eigenheiten Schweizerische Arbeitsgemeinschaft
MehrEinführung in die Computerlinguistik. Syntax II
Einführung in die Computerlinguistik yntax II Hinrich chütze & Robert Zangenfeind Centrum für Informations- und prachverarbeitung, LMU München 18.12.2015 chütze & Zangenfeind: yntax II 1 / 17 Take-away
MehrSharon Goldwater & David McClosky. Sarah Hartmann Advanced Topics in Statistical Machine Translation
Sharon Goldwater & David McClosky Sarah Hartmann 13.01.2015 Advanced Topics in Statistical Machine Translation Einführung Modelle Experimente Diskussion 2 Einführung Das Problem Der Lösungsvorschlag Modelle
MehrVorlesung: Einführung in die Computerlinguistik. VL: Einführung in die Computerlinguistik
Wintersemester 98/99 Vorlesung: Einführung in die Computerlinguistik Teil 1: Forschungsgegenstand und Nachbarwissenschaften Hans Uszkoreit Übersicht des ersten Teils Aufgaben und Einordnung des Faches
MehrDer deutsch-polnische Sprachkontakt in Oberschlesien am Beispiel der Gegend von Oberglogau
Daniela Pelka Der deutsch-polnische Sprachkontakt in Oberschlesien am Beispiel der Gegend von Oberglogau tra/o Inhalt EINFUHRUNG 11 I THEORETISCHER TEIL 15 1 Geschichte des deutsch-polnischen Sprachkontaktes
MehrIvana Daskalovska. Willkommen zur Übung Einführung in die Computerlinguistik. Semantik. Sarah Bosch,
Ivana Daskalovska Willkommen zur Übung Einführung in die Computerlinguistik Semantik Wiederholung Was ist die Semantik und womit beschäftigt sie sich? 3 Was ist die Semantik und womit beschäftigt sie sich?
MehrSprachtechnologie als Grundlage für die maschinelle Auswertung von Texten
Sprachtechnologie als Grundlage für die maschinelle Auswertung von Texten Dr-Ing Michael Piotrowski Leibniz-Institut für Europäische Geschichte @true_mxp Bamberg, 20 November 2015
MehrErstellung von Reports mit Anwender-Dokumentation und anderen Textbausteinen
11/17 Erstellung von und anderen Textbausteinen In der ArtemiS SUITE 1 steht eine sehr flexible Report-Funktion zur Verfügung, die Ihnen die übersichtliche Darstellung Ihrer Analyse-Ergebnisse in Reports
MehrMorphologische Merkmale. Merkmale Merkmale in der Linguistik Merkmale in der Morpholgie Morphologische Typologie Morphologische Modelle
Morphologische Merkmale Merkmale Merkmale in der Linguistik Merkmale in der Morpholgie Morphologische Typologie Morphologische Modelle Merkmale Das Wort 'Merkmal' ' bedeutet im Prinzip soviel wie 'Eigenschaft'
Mehr! Die Idee Kombination von Informatik und einem anderen Fach
Computerlinguistik Integriertes Anwendungsfach im B.Sc.Studiengang Department Informatik / Universität Hamburg! Wie funktioniert das integrierte Anwendungsfach Computerlinguistik (organisatorisch)?! Beziehungen
MehrKorpuslinguistik. Vorlesungsreihe»Methoden der Linguistik«(WS 2004/05) Universität Zürich, Korpuslinguistik. Jürgen Spitzmüller.
Vorlesungsreihe»Methoden der Linguistik«(WS 2004/05) Universität Zürich, 7.12.2004 1. Teil: Theorie Grundlegende theoretische Fragestellungen: Was sind überhaupt Korpora? Wozu Korpora? Was sollen Korpora
MehrKollexem-Analyse. SE: Quantitative Analyse linguistischer Variation WS 2012/13. Germanistik
Kollexem-Analyse SE: Quantitative Analyse linguistischer Variation Germanistik WS 2012/13 WS 2012/13 1 / 14 Heutige Sitzung 1 Einführung: Quantitative syntaktische Analyse am Beispiel der Kollexem-Analyse
MehrEinführung in die Computerlinguistik. Morphologie II
Einführung in die Computerlinguistik Morphologie II Hinrich Schütze & Robert Zangenfeind Centrum für Informations- und Sprachverarbeitung, LMU München 30.11.2015 Schütze & Zangenfeind: Morphologie II 1
MehrLogik und modelltheoretische Semantik. Grundlagen zum Bedeutung-Text-Modell (BTM)
Logik und modelltheoretische Semantik Grundlagen zum Bedeutung-Text-Modell (BTM) Robert Zangenfeind Centrum für Informations- und Sprachverarbeitung, LMU München 13.6.2017 Zangenfeind: BTM 1 / 26 Moskauer
MehrIvana Daskalovska. Willkommen zur Übung Einführung in die Computerlinguistik. Morphologie. Sarah Bosch,
Ivana Daskalovska Willkommen zur Übung Einführung in die Computerlinguistik Morphologie Wiederholung Aufgabe 1 Was ist Morphologie, Morphem? 3 Aufgabe 1 Was ist Morphologie, Morphem? Teildisziplin der
MehrNr. Kategorie Übung Lernziel/Inhalt Typ Bezug zu. 01 Verb Zeitformen erkennen Zeitformen erkennen Multiple Choice AH S. 92
Die Sprachstarken 5 Übersicht «Interaktives Rechtschreib- und Grammatiktraining online» Die Sprachstarken 5, Interaktives Rechtschreib- und Grammatiktraining online Nr. Kategorie Übung Lernziel/Inhalt
MehrEinführung in die Computerlinguistik
Mehrdeutigkeit der Wortart Einführung in die Computerlinguistik Statistische Modellierung und Evaluation WS 2008/2009 Manfred Pinkal Sie haben in Moskau liebe genossen Sie haben in Moskau liebe Genossen
MehrENTWICKLUNGSTENDENZEN IN DER DEUTSCHEN GEGENWARTSSPRACHE
ENTWICKLUNGSTENDENZEN IN DER DEUTSCHEN GEGENWARTSSPRACHE LEXIK SYNTAX SPRACHGEBRAUCH 04s Prof. Dr. Wächter JanaMarie Reichert 16.06.2010 LEXIK Anglizismen Neologismen Modewörter/ Plastikwörter ANGLIZISMEN
Mehr3.1.2 Der Beitrag von Wortarten für die Sprachbeschreibung Bisherige Forschungsarbeiten und ihre Anwendung auf das Kreolische...
Inhaltsverzeichnis 1. Mauritius und das Kreolische auf Mauritius... 13 1.1 Landeskundlicher Teil ein Vorwort... 13 1.2 Zu Geographie, Bevölkerungsgruppen und Sprachen auf Mauritius... 14 1.3 Definition:
MehrDocument Type Definition (DTD)
Document Type Definition (DTD) 1. Einführung 2. DTD 3. XML Schema 4. XPath 5. XSLT 6. XSL-FO 7. XQuery 8. Web Services 9. XML und Datenbanken Inhalt des Moduls: Grundlagen Elemente, Attribute Komplexe
MehrVerbreitungsgebiet der dt. Sprache 1910
Sprachliche Variation Sprachgeographie Beat Siebenhaar Verbreitungsgebiet der dt. Sprache 1910 http://de.wikipedia.org/wiki/bild:historisches_deutsches_sprachgebiet.png Verbreitungsgebiet der dt. Sprache
MehrGeleitwort Danksagung Abbildungsverzeichnis Tabellenverzeichnis Abkürzungsverzeichnis Zusammenfassung...
Inhaltsverzeichnis Geleitwort... 7 Danksagung... 9 Abbildungsverzeichnis... 17 Tabellenverzeichnis... 19 Abkürzungsverzeichnis... 21 Zusammenfassung... 23 1 Problemstellung und Ziel der Arbeit... 25 2
MehrEine formale Beschreibung der Gebärdensprache mit HPSG
Eine formale Beschreibung der Gebärdensprache mit HPSG Jan Bungeroth Lehrstuhl für Informatik VI RWTH Aachen J. Bungeroth Eine formale Beschreibung der Gebärdensprache mit HPSG 31.10.2003 1 Überblick Einleitung
MehrProseminar Linguistische Annotation
Proseminar Linguistische Annotation Ines Rehbein und Josef Ruppenhofer SS 2010 Ines Rehbein und Josef Ruppenhofer (SS10) Linguistische Annotation April 2010 1 / 22 Seminarplan I. Linguistische Annotation
MehrKontextfreie Grammatiken
Kontextfreie Grammatiken Vorlesung Computerlinguistische Techniken Alexander Koller 16. Oktober 2015 Übersicht Worum geht es in dieser Vorlesung? Übungen und Abschlussprojekt Kontextfreie Grammatiken Computerlinguistische
MehrAVS-M Name des Moduls: Sprachtypologie und Universalienforschung
AVS-M 10 1. Name des Moduls: Sprachtypologie und Universalienforschung 2. Fachgebiet / Verantwortlich: Allgemeine und Vergleichende Sprachwissenschaft/ Prof. Dr. Johannes Helmbrecht 3. Inhalte des Moduls:
MehrEinführung in die germanistische Linguistik
Jörg Meibauer / Ulrike Demske / Jochen Geilfuß-Wolfgang / Jürgen Pafel/Karl Heinz Ramers/Monika Rothweiler/ Markus Steinbach Einführung in die germanistische Linguistik 2., aktualisierte Auflage Verlag
MehrMaschinelle Übersetzung
Maschinelle Übersetzung Wissensmanagement VO 340088 Bartholomäus Wloka https://www.adaptemy.com Abkürzungen MÜS Maschinelles Übersetzungssystem MÜ Maschinelle Übersetzung MT Machine Translation SMT Statistical
MehrMinimalistische Morphologie
Minimalistische Morphologie minimalistisch: basiert auf wenigen Prinzipien befasst sich mit flektierten Wortformen und deren Rolle in der Syntax Basis-Annahmen 1. keine abstrakten Morpheme 2. maximale
MehrErweiterbare Schemata
Erweiterbare Schemata Überlegungen zur Syntax Abhängigkeiten zwischen Schema und Instanz Abhängigkeitstypen Indirekt sind diese Beziehungen für sämtliche Dokumente mit Quelltext in XML-Dialekten oder Programmiersprachen,
MehrVorwort Vorwort zur 3. Auflage
Vorwort Vorwort zur 2. Auflage Vorwort zur 3. Auflage V VI VI 1 Einleitung (Jörg Meibauer/Markus Steinbach) 1 1.1 Sprache in Literatur und Alltag 1 1.2 Sprache als soziales Phänomen 3 1.3 Sprache als historisches
MehrDie Sammlung unikaler Wörter des Deutschen Aufbauprinzipien und erste Auswertungsergebnisse
Die Sammlung unikaler Wörter des Deutschen Aufbauprinzipien und erste Auswertungsergebnisse Manfred Sailer und Beata Trawiński SFB 441 Universität Tübingen {mf,trawinsk}@sfs.uni-tuebingen.de. EUROPHRAS
MehrReporting Lösungen für APEX wähle Deine Waffen weise
Reporting Lösungen für APEX wähle Deine Waffen weise Dietmar Aust Opal-Consulting Köln Schlüsselworte: Oracle APEX, Reporting, JasperReports, PL/PDF, BI Publisher, OPAL:XP, Doxxy, Oracle Rest Data Services
MehrSemistrukturierte Daten
Semistrukturierte Daten JSON Stefan Woltran Emanuel Sallinger Institut für Informationssysteme Technische Universität Wien Sommersemester 2014 Stefan Woltran, Emanuel Sallinger Seite 1 JSON JSON steht
MehrAVS-M 01. b) verpflichtende Nachweise: Keine
AVS-M 01 1. Name des Moduls: Basismodul I: Grundlagen und Methoden der AVS 2. Fachgebiet / Verantwortlich: Allgemeine und Vergleichende Sprachwissenschaft/ Prof. Dr. Johannes Helmbrecht 3. Inhalte des
MehrCentrum für Informations- und Sprachverarbeitung. Dr. M. Hadersbeck, Digitale Editionen, BAdW München
# 1 Digitale Editionen und Auszeichnungssprachen Computerlinguistische FinderApps mit Facsimile-Reader Wittgenstein s Nachlass: WiTTFind Goethe s Faust: GoetheFind Hadersbeck M. et. al. Centrum für Informations-
MehrEinführung in das REDE SprachGIS. REDE-SprachGIS-Workshop 16./17. Februar 2016
Einführung in das REDE SprachGIS REDE-SprachGIS-Workshop 16./17. Februar 2016 Regionalsprache.de Akademie der Wissenschaften und der Literatur (Mainz) Langzeitprojekt: 2008-2027 Forschungszentrum Deutscher
MehrWissensrepräsentation
Wissensrepräsentation Vorlesung Sommersemester 2008 12. Sitzung Dozent Nino Simunic M.A. Computerlinguistik, Campus DU Übersicht Rückblick, Zusammenhänge Mysterien 2 Inhalte im abstrakten Überblick Künstliche
MehrNLP Eigenschaften von Text
NLP Eigenschaften von Text Dr. Andreas Hotho Dominik Benz Beate Krause Sommersemester 2008 Folie: 1 Übersicht Einführung Eigenschaften von Text Words I: Satzgrenzenerkennung, Tokenization, Kollokationen
MehrSprachkontaktforschung
Claudia Maria Riehl Sprachkontaktforschung Eine Einführung Vorwort 9 1 Einleitung 11 1.1 Was ist Sprachkontakt? 11 1.2 Aspekte des Sprachkontakts: Aufbau des Buchs 13 2 Wirkungen des Sprachkontakts 15
MehrWas ist Statistik? Wozu dienen statistische Methoden?
25. APRIL 2002: BLATT 1 Übersicht Was ist Statistik? Wozu dienen statistische Methoden? Was ist maschinelle Sprachverarbeitung? Welche Rolle spielen statistische Methoden in verschiedenen Teilbereichen
MehrAngewandte Linguistik IUED Institut für Übersetzen und Dolmetschen Sprachtechnologie für die mehrsprachige Kommunikation
Zürcher Hochschule für Angewandte Wissenschaften Angewandte Linguistik IUED Institut für Übersetzen und Dolmetschen Sprachtechnologie für die mehrsprachige Kommunikation Certificate of Advanced Studies
MehrMÜ an der FH Flensburg
MÜ an der FH Flensburg Marion Wittkowsky, Dipl.-Technikübersetzerin (FH) Lehrkraft f. besondere Aufgaben http:// Überblick Studiengang Internationale Fachkommunikation IFK BA-Studium IFK MA-Studium Fachkommunikation
MehrGrundkurs Linguistik - Morphologie
Grundkurs Linguistik - Jens Fleischhauer fleischhauer@phil.uni-duesseldorf.de Heinrich-Heine Universität Düsseldorf; Abteilung für Allgemeine Sprachwissenschaft 10.11.2016; WS 2016/2017 1 / 21 Jens Fleischhauer
MehrLexikalische, morphologische und syntaktische Symptome der SSES - Übergreifende oder selektive Störung? Christina Kauschke. Universität Potsdam
Lexikalische, morphologische und syntaktische Symptome der SSES - Übergreifende oder selektive Störung? Christina Kauschke Universität Potsdam Überblick Charakterisierung SSES Matchingverfahren Studie
MehrMathematische Grundlagen der Computerlinguistik III: Statistische Methoden Probeklausur
Mathematische Grundlagen der Computerlinguistik III: Statistische Methoden Probeklausur Crocker/Demberg/Staudte Sommersemester 2014 17.07.2014 1. Sie haben 90 Minuten Zeit zur Bearbeitung der Aufgaben.
MehrKorpus. Was ist ein Korpus?
Was ist ein Korpus? Korpus Endliche Menge von konkreten sprachlichen Äußerungen, die als empirische Grundlage für sprachwiss. Untersuchungen dienen. Stellenwert und Beschaffenheit des Korpus hängen weitgehend
MehrFinite-State-Morphologie in XLE. Grammatikentwicklung, SS 2010
Finite-State-Morphologie in XLE Grammatikentwicklung, SS 2010 1 / 20 Worum es heute geht: Nutzen von Finite-State-Morphologien... und wie man sie in XLE einbaut 2 / 20 Lexikon in XLE Bis jetzt: so genanntes
MehrLEHRPLAN FÜR DAS FREIFACH RUSSISCH
LEHRPLAN FÜR DAS FREIFACH RUSSISCH A. STUNDENDOTATION Klasse 2M 3M 4M Gymnasium Wochenstunden 2 2 2 B. LEHRPLAN 2. Maturitätsklasse: Kurzzeitgymnasium Niveau A1 (nach RKI: Russkij kak inostrannyj) Lerninhalte
MehrPROGRAMM. Mittwoch 26. Oktober. 8h30: Registrierungen Gebühren Abendessen (45 ) Sonstiges
PROGRAMM Mittwoch 26. Oktober 8h30: Registrierungen Gebühren Abendessen (45 ) Sonstiges 10h 10h45 : Begrüßung Prof. Dr. Michel Deneken Stellvertretender Präsident der Universität Straßburg Prof. Dr. Bernard
MehrMaschinelle Übersetzung (Einführung Ausgewählte Techniken der Maschinellen Übersetzung) Susanne J. Jekat Zürcher Hochschule Winterthur
Maschinelle Übersetzung (Einführung Ausgewählte Techniken der Maschinellen Übersetzung) Susanne J. Jekat Zürcher Hochschule Winterthur jes@zhwin.ch Maschinelle Übersetzung Terminologie Historische Entwicklung
Mehr