Linguistik für Kognitionswissenschaften

Größe: px
Ab Seite anzeigen:

Download "Linguistik für Kognitionswissenschaften"

Transkript

1 Linguistik für Kognitionswissenschaften Computerlinguistik: Maschinelle Übersetzung

2 Computerlinguistik Fehlübersetzung von engl. computational linguistics - computationelle Linguistik beinhaltet im weiteren Sinne alle algorithmischen Aspekte von natürlicher Sprache im engeren Sinne: computationelle Modelle der menschlichen Sprachverarbeitung technische Verarbeitung natürlicher Sprache

3 Computerlinguistik: Geschichte in späten 1950er Jahren Förderung der maschinellen Übersetzung in den USA (v.a. Russisch->Englisch, politischer Hintergrund) Resultate waren extrem schlecht, Förderung wurde eingestellt ab späte 1960er Jahre zweite Generation von CL-Systemen: Dialogsysteme, z.b. Eliza (1966, Joseph Weizenbaum) und SHRDLU (1970, Terry Winograd)

4 Was steckt hinter Eliza?

5 Computerlinguistik: Geschichte symbolische Methoden: seit ca starkes Interesse an computationell realistischen Grammatikformalismen (GPSG, LFG, HPSG) Unifikation als Modell der grammatischen Komposition hohe Programmiersprachen, die gut mit formaler Linguistik kombinierbar sind (Prolog, Lisp, PATR) neues Interesse an Anwendung regulärer Grammatiken (ausreichend für Morphologie und Phonologie)

6 Computerlinguistik: Geschichte statistische Methoden: seit Mitte der 1970er Jahre Hidden Markov Models für Spracherkennung und Wortart-Tagging seit Mitte der 1980er Jahre statistisches Parsen seit 1990er Jahre Dominanz der statistischen Methoden dank WWW Verfügbarkeit von extrem großen Datenmengen starker Einfluss von Methoden des maschinellen Lernens

7 Maschinelle Übersetzung historisch gesehen älteste computerlinguistische Anwendung verlange vollständige Analyse des Input-Satzes und Generierung des Output-Satzes daher nach wie vor die größte Herausforderung für Computerlinguistik

8 Warum MÜ schwer ist Ambiguitäten lexikalische Lücken syntaktische Divergenz zwischen Quellsprache und Zielsprache

9 Ambiguität Früher stellten die Frauen der Inseln am Wochenende Kopftücher mit Blumenmotiven her, die ihre Männer an den folgenden Montagen auf dem Markt im Zentrum der Hauptinsel verkauften. (Bsp. von Hans Uszkoreit)

10 Ambiguität Früher stellten die Frauen der Inseln am Wochenende Kopftücher mit Blumenmotiven her, die ihre Männer an den folgenden Montagen auf dem Markt im Zentrum der Hauptinsel verkauften. (Bsp. von Hans Uszkoreit) Der Satz weist lexikalische (L), syntaktische (S) und anaphorische (A) Ambiguitäten auf, die uns nicht auffallen. Wieviele Lesarten hat der Satz?

11 Ambiguität Das berechnet sich so: L Früher kann sowohl eigenständiges Adverb als auch Komparativ von früh sein (2); L die Verbform stellten is ambig zwischen Präteritum und Konjunktiv (2); S die Nominalphrase die Frauen kann sowohl Subjekt als auch Objekt des Satzes sein (2); S am Wochenende kann die Insel, die Frauen oder das Verb modifizieren (3); S mit Blumenmotiven kann sich auf die Kopftücher beziehen, ein Instrument der Herstellung sein oder ein Adjunkt im Sinne von gemeinsam mit Blumenmotiven (3); L her hat auch eine direktionale Bedeutung (2);

12 Ambiguität Und weiter: S der Relativsatz könnte jede der vier Nominalphrasen im Plural modifizieren (4); S sowohl die als auch ihre Männer kann Subjekt des Relativsatzes sein (2); A das Possessivpronomen ihre e kann auf jede der Nominalphrasen referieren (4); L S Montagen hat eine zweite Lesart als Nominalisierung von montieren (2); der Hauptinsel kann im Genitiv zu der vorangegangenen NP gehören oder im Dativ die Käuferin bezeichnen (2); S die drei Präpositionalphrasen des Relativsatzes können sich in insgesamt sieben Kombinationen mit den jeweils vorhergehenden NPs oder mit dem Verb verbinden (7); L verkauften zeigt wieder die Ambiguität zwischen Präteritum und Konjunktiv auf (2). Durch Multiplikation ergibt sich die Gesamtambiguität: 2 x 2 x 2 x 3 x 3 x 2 x 4 x 2 x 4 x 2 x 2 x 7 x 2 =

13 Probleme bei Wort-zu-Wort- Übersetzung Englisch-Deutsch

14 Lexikalische Ambiguität

15 Lexikalische Ambiguität

16 Strukturelle Divergenz

17 Strukturelle Divergenz

18 Unterschiede in Wortstellung

19 Übersetzung und Kontext Wenn einem die Wörter eines Buches einzeln gezeigt werden, eines nach dem anderen, ist es offensichtlich nicht möglich, die Bedeutung jedes Wortes - ohne Informationen über den Kontext - festzustellen. Wenn man außerdem jeweils die N vorangehenden und nachfolgenden Wörter sieht, kann man die Bedeutung meistens bestimmen, wenn N groß genug ist.

20 Übersetzung und Kontext Die praktische Frage für MÜ ist: Was ist der Mindestwert für N, die in hinreichend vielen Fällen zur Disambiguierung ausreicht?

21 Strategien für MÜ Wort-für-Wort-Übersetzung Syntaktischer Transfer Semantischer Transfer Interlingua-Ansatz

22 Wort-für-Wort-Übersetzung einfachster Ansatz benötigt im einfachsten Fall nur ein elektronisches bilinguales Wörterbuch abängig von Quell- und Zielsprache evt. minimale morphologische Analyse und Generierung kein Einsatz von syntaktischem oder semantischem Wissen

23 Syntaktischer Transfer verlangt syntaktische Analyse der Quellsprache benötigt syntaktischen Parser

24 Syntaktischer Transfer Bsp. engl. like -> frz. plaire

25 Syntaktischer Transfer Bsp. engl. like to -> dt. gern

26 Semantischer Transfer erfordert syntaktische und semantische Analyse der Quellsprache erfordert sprach-spezifische semantische Repräsentationssprache sprach-spezifische Regen, die Bedeutungen der Quellsprache mit Bedeutungen der Zielsprache in Beziehung setzen erfordert Sprach-Generierungs-Komponente, die zielsprachliche Bedeutungen in Output-Sätze überführt

27 Semantischer Transfer Synthese üblicherweise in zwei Schritten: semantische Synthese (führt zu syntaktischen Bäumen) morphologische Synthese (produziert flektierte Wörter)

28 Interlingua-Ansatz Quellsprache wird auf sprach-unabhängige (quasi universale) semantische Repräsentationssprache abgebildet erfordert syntaktische und semantische Analyse der Quellsprache erfordert Sprachgenerierung, die Interlingua- Repräsentation in Zielsprache überführt Synthese ebenfalls in zwei schritten (semantisch-syntaktisch, morphologisch)

29 Interlingua-Repräsentation für Bewegungsverben

30 Interlingua-Repräsentation für Bewegungsverben

31 Allgemeines Schema Interllingua Analyse Transfer Generierung Quelltext Direkte Übersetzung Zieltext

Computerlinguistik. Einführung und Überblick. Introduction to Computational Linguistics, Anette Frank, WS 2008/09

Computerlinguistik. Einführung und Überblick. Introduction to Computational Linguistics, Anette Frank, WS 2008/09 Computerlinguistik Einführung und Überblick Was ist Computerlinguistik? Computerlinguistik beschäftigt sich mit der maschinellen Verarbeitung natürlicher Sprache. Sie beschäftigt sich mit den strukturellen

Mehr

Vorschau. Hans erschießt den Mann mit dem Gewehr. Und wer hat das Gewehr?

Vorschau. Hans erschießt den Mann mit dem Gewehr. Und wer hat das Gewehr? Hans erschießt den Mann mit dem Gewehr. Und wer hat das Gewehr? Über die Computerlinguistik in Saarbrücken Svenja Meyer, Universität des Saarlandes email: svemey@coli.uni-sb.de Vorschau Allgemeines Probleme

Mehr

Ziele und Herausforderungen

Ziele und Herausforderungen Ziele und Herausforderungen Text soll automatisch aus einer Quellsprache in eine Zielsprache übertragen werden Dabei soll die Funktion des Textes erhalten bleiben Es werden sowohl computerlinguistische

Mehr

Einführung in die Computerlinguistik Einführung

Einführung in die Computerlinguistik Einführung Einführung in die Computerlinguistik Einführung Dozentin: Wiebke Petersen Wiebke Petersen Einführung CL (1. Sitzung) 1 Computerlinguistik: Die Wissenschaft Carstensen et. al. (2004) Computerlinguistik

Mehr

Gliederung. Einführung in die Computerlinguistik: Maschinelle Übersetzung. Können Computer übersetzen? Goethe Babel Fish Google

Gliederung. Einführung in die Computerlinguistik: Maschinelle Übersetzung. Können Computer übersetzen? Goethe Babel Fish Google Gliederung Einführung in die Computerlinguistik: Maschinelle Übersetzung WS 2008/2009 Manfred Pinkal! " Können Computer übersetzen?! " Was sind die Probleme?! " Was sind die möglichen Lösungen?! " Mensch-Computer-Interaktion

Mehr

Goethe. Einführung in die Computerlinguistik: Maschinelle Übersetzung. Können Computer übersetzen? Babel Fish Google

Goethe. Einführung in die Computerlinguistik: Maschinelle Übersetzung. Können Computer übersetzen? Babel Fish Google Goethe Einführung in die Computerlinguistik: Maschinelle Übersetzung WS 2012/2013 Manfred Pinkal! Über allen Gipfeln ist Ruh. In allen Wipfeln spürest du kaum einen Hauch! Over all summits is rest. In

Mehr

Einführung in die Computerlinguistik

Einführung in die Computerlinguistik Einführung in die Computerlinguistik Syntax WS 2006/2007 Manfred Pinkal Einführung in die Computerlinguistik 2006/2007 M. Pinkal UdS 1 Morphologie und Syntax Gegenstand der Morphologie ist die Struktur

Mehr

Einführung in die Computerlinguistik Überblick

Einführung in die Computerlinguistik Überblick Einführung in die Computerlinguistik Überblick Hinrich Schütze & Robert Zangenfeind Centrum für Informations- und Sprachverarbeitung, LMU München 2015-10-12 1 / 19 Was ist Computerlinguistik? Definition

Mehr

Einführung in die Computerlinguistik Statistische Grundlagen

Einführung in die Computerlinguistik Statistische Grundlagen Statistik 1 Sommer 2015 Einführung in die Computerlinguistik Statistische Grundlagen Laura Heinrich-Heine-Universität Düsseldorf Sommersemester 2015 Statistik 2 Sommer 2015 Überblick 1. Diskrete Wahrscheinlichkeitsräume

Mehr

Einführung in die Computerlinguistik Einführung

Einführung in die Computerlinguistik Einführung Die Disziplin Anwendungen Sprache & Ambiguität Hausaufgaben Einführung in die Computerlinguistik Einführung Dozentin: Wiebke Petersen Wiebke Petersen Einführung CL (1. Sitzung) 1 Die Disziplin Anwendungen

Mehr

Einführung Computerlinguistik. Konstituentensyntax II

Einführung Computerlinguistik. Konstituentensyntax II Einführung Computerlinguistik Konstituentensyntax II Hinrich Schütze & Robert Zangenfeind Centrum für Informations- und Sprachverarbeitung, LMU München 2013-11-18 Schütze & Zangenfeind: Konstituentensyntax

Mehr

Einführung in die Computerlinguistik

Einführung in die Computerlinguistik Vorläufiges Programm Einführung in die Computerlinguistik WS 2011/12 Manfred Pinkal 25.10.11 Einführung 8.11.11 Morphologie und Automaten 15.11.11 Morphologie und Automaten 22.11.11 Syntax 29.11.11 Parsing

Mehr

Einführung Computerlinguistik. Überblick

Einführung Computerlinguistik. Überblick Einführung Computerlinguistik Überblick Hinrich Schütze & Robert Zangenfeind Centrum für Informations- und Sprachverarbeitung, LMU München 2013-10-14 Schütze & Zangenfeind: Überblick 1 / 30 Take-away Schütze

Mehr

4. 4. Algorithmen und Datenstrukturen in deskriptiven Programmiersprachen

4. 4. Algorithmen und Datenstrukturen in deskriptiven Programmiersprachen Kapitel Kapitel 4 Deskriptive Programmierung SS 2008 4. 4. Algorithmen und Datenstrukturen in in deskriptiven Programmiersprachen Deskriptive Programmierung 1 Sprachverarbeitung in in Prolog Prolog Prolog

Mehr

Anlage 1: Modularisierung des Bachelor-Studiengangs Theoretische und Angewandte Computerlinguistik

Anlage 1: Modularisierung des Bachelor-Studiengangs Theoretische und Angewandte Computerlinguistik Anlage : Modularisierung des Bachelor-Studiengangs Theoretische und Angewandte Legende: PM = Pflichtmodul; WPM = Wahlpflichtmodul; WM = Wahlmodul VL = Vorlesung; PS = Proseminar; HS = Hauptseminar; Ü =

Mehr

Aufgabentypen die in der Klausur vorkommen

Aufgabentypen die in der Klausur vorkommen Aufgabentypen die in der Klausur vorkommen können 1. Nennen Sie fünf wichtige Anwendungsgebiete der Computerlinguistik. 2. Für welches der drei Anwendungsgebiete Maschinelle Übersetzung, Rechtschreibkorrektur

Mehr

Morphologie & Syntax

Morphologie & Syntax Morphologie & Syntax SS 2010 Wiederholungsklausur ame, Vorname Matrikelnummer 1. Morphologische Struktur (3 P.) Geben Sie die morphologische Struktur des Stamms Bundesausbildungsförderungsgesetz durch

Mehr

Spezielle Themen der KI. NLP Natural Language Processing. Sprachverstehen

Spezielle Themen der KI. NLP Natural Language Processing. Sprachverstehen Spezielle Themen der KI NLP Natural Language Processing Sprachverstehen NLP - Verarbeitungsstufen des Sprachverstehen 47 Phonologie und Phonetik Phonologie Lautlehre oder Sprachgebilde-Lautlehre untersucht

Mehr

Wie funktioniert automatisierte Übersetzung? Prof. Josef van Genabith (Deutsches Forschungszentrum für Künstliche Intelligenz)

Wie funktioniert automatisierte Übersetzung? Prof. Josef van Genabith (Deutsches Forschungszentrum für Künstliche Intelligenz) Wie funktioniert automatisierte Übersetzung? Prof. Josef van Genabith (Deutsches Forschungszentrum für Künstliche Intelligenz) 1 Maschinelle Übersetzung (MÜ) Überblick: Warum MÜ: Datenmenge, Qualität und

Mehr

Konzept und Entwicklung eines Werkzeugs zur automatisierten Übersetzung natürlichsprachlicher Anforderungen

Konzept und Entwicklung eines Werkzeugs zur automatisierten Übersetzung natürlichsprachlicher Anforderungen Institut für maschinelle Sprachverarbeitung Universität Stuttgart Pfaffenwaldring 5b D 70569 Stuttgart Diplomarbeit Nr. 3301 Konzept und Entwicklung eines Werkzeugs zur automatisierten Übersetzung natürlichsprachlicher

Mehr

Text-Mining und Metadaten-Anreicherung Eine Einführung. Die Automatisierung in der semantischen Anreicherung von Text-Dokumenten

Text-Mining und Metadaten-Anreicherung Eine Einführung. Die Automatisierung in der semantischen Anreicherung von Text-Dokumenten Text-Mining und Metadaten-Anreicherung Eine Einführung Die Automatisierung in der semantischen Anreicherung von Text-Dokumenten 26.05.2015 Inhalt Zeit ist Geld. Das gilt auch für die Recherche....3 Kann

Mehr

Gliederung. Das TIGER-Korpus: Annotation und Exploration. TIGER-Korpus. 1. TIGER-Korpus. entstanden im Projekt TIGER (1999 heute) beteiligte Institute

Gliederung. Das TIGER-Korpus: Annotation und Exploration. TIGER-Korpus. 1. TIGER-Korpus. entstanden im Projekt TIGER (1999 heute) beteiligte Institute Das TIGER-Korpus: Annotation und Exploration Stefanie Dipper Forschungskolloquium Korpuslinguistik, 11.11.03 Gliederung 1. TIGER-Korpus 2. Annotation 3. Visualisierung 4. Suche, Retrieval 5. Demo 6. Repräsentation

Mehr

Einführung in die Computerlinguistik

Einführung in die Computerlinguistik Einführung in die Computerlinguistik Syntax II WS 2012/2013 Manfred Pinkal Eigenschaften der syntaktischen Struktur [1] Er hat die Übungen gemacht. Der Student hat die Übungen gemacht. Der interessierte

Mehr

Maturandentag 2005 Computerlinguistik

Maturandentag 2005 Computerlinguistik Maturandentag 2005 Computerlinguistik http://www.ifi.unizh.ch/cl/ 13./14. September 2005 Maturandentag 2005 Computerlinguistik 13./14. September 2005 http://www.ifi.unizh.ch/cl/ 1 / 11 Computerlinguistik

Mehr

Parsing-EinfŸhrung Ð 1

Parsing-EinfŸhrung Ð 1 Parsing-EinfŸhrung bersicht Falsifizierbarkeit, oder: Sind Grammatiken wissenschaftlich? Grammatik, Formalismus Kontextfreie Grammatiken Ableitungen Ziel Verstehen der linguistischen Motivation Intuitives

Mehr

Herausforderungen bei der Übersetzung und Adaption eines englischen SLI-Screenings ins Deutsche

Herausforderungen bei der Übersetzung und Adaption eines englischen SLI-Screenings ins Deutsche Herausforderungen bei der Übersetzung und Adaption eines englischen SLI-Screenings ins Deutsche Bettina Fürst ULG Klinische Linguistik, MSc Präsentation der Abschluss- Arbeit 20. März 2010, Salzburg Forschungsfragen

Mehr

Formale Sprachen und Grammatiken

Formale Sprachen und Grammatiken Formale Sprachen und Grammatiken Jede Sprache besitzt die Aspekte Semantik (Bedeutung) und Syntax (formaler Aufbau). Die zulässige und korrekte Form der Wörter und Sätze einer Sprache wird durch die Syntax

Mehr

5. Maschinelle Verarbeitung natürlicher Sprache (Computerlinguistik) (1)

5. Maschinelle Verarbeitung natürlicher Sprache (Computerlinguistik) (1) 5. Maschinelle Verarbeitung natürlicher Sprache (Computerlinguistik) (1) 5.1 Vorbemerkungen Wissen, das als Ergebnis menschlichen Denkens vorliegt, wird durch Sprache mitgeteilt. Unterscheidung von Sprachen:

Mehr

Einführung in die Computerlinguistik

Einführung in die Computerlinguistik Einführung in die Computerlinguistik Syntax II WS 2008/2009 Manfred Pinkal Morphologie und Syntax Gegenstand der Morphologie ist die Struktur des Wortes: der Aufbau von Wörtern aus Morphemen, den kleinsten

Mehr

Fachseminar WS 2008/09

Fachseminar WS 2008/09 Fachseminar WS 2008/09 Fachgebiet: Compilerbau Thema: Lexikalische Analyse (Scanner) Referent: Ali Sediq Betreuer: Prof. Dr. Helmut Weber 1 Inhaltsverzeichnis Lexikalische Analyse 1.0 Grundprobleme der

Mehr

Morphologie (5) Wortarten (2) Part-of-Speech Tagging Stemming

Morphologie (5) Wortarten (2) Part-of-Speech Tagging Stemming Morphologie (5) Wortarten (2) Part-of-Speech Tagging Stemming Robert Zangenfeind Centrum für Informations- und Sprachverarbeitung, LMU München 24.11.2014, 9 c.t. Zangenfeind: Morphologie 1 / 18 Wdh.: Klassifizierung

Mehr

Maschinelle Übersetzung und der menschliche Übersetzer

Maschinelle Übersetzung und der menschliche Übersetzer Maschinelle Übersetzung und der menschliche Übersetzer Integration von elektronischen Übersetzungswerkzeugen in den Übersetzungs-Workflow 06.11.2013 PD Dr. Kurt Eberle 1 Elektronische Hilfen bei der Übersetzung

Mehr

XDOC Extraktion, Repräsentation und Auswertung von Informationen

XDOC Extraktion, Repräsentation und Auswertung von Informationen XDOC Extraktion, Repräsentation und Auswertung von Informationen Manuela Kunze Otto-von-Guericke Universität Magdeburg Fakultät für Informatik Institut für Wissens- und Sprachverarbeitung Gliederung Ausgangspunkt

Mehr

Einführung in die englische Sprachgeschichte

Einführung in die englische Sprachgeschichte MANFRED GORLACH Einführung in die englische Sprachgeschichte 5., völlig überarbeitete Auflage Universitätsverlag C.WINTER Heidelberg Inhaltsverzeichnis Abbildungsverzeichnis Vorwort Abkürzungen xi xiii

Mehr

Maschinelle Übersetzung

Maschinelle Übersetzung Universität Hamburg Germanisches Seminar Maschinelle Übersetzung Prof. Dr. Walther v.hahn Dr. Cristina Vertan Seminar II im Wintersemester 2006/07 einige der Folien stammen von Cristina Vertan, Uni HH

Mehr

Einführung in die Maschinelle Übersetzung

Einführung in die Maschinelle Übersetzung Einführung in die Maschinelle Übersetzung - Grundlagen, Probleme und Lösungswege - Walther v.hahn Universität Hamburg Fachbereich Informatik Arbeitsbereich Natürlichsprachliche Systeme WWW: http://nats-www.informatik.unihamburg.de/view/user/walthervhahn

Mehr

Practical Grammar Engineering Using HPSG. Frederik Fouvry, Petter Haugereid, Valia Kordoni, Melanie Siegel

Practical Grammar Engineering Using HPSG. Frederik Fouvry, Petter Haugereid, Valia Kordoni, Melanie Siegel Practical Grammar Engineering Using HPSG Frederik Fouvry, Petter Haugereid, Valia Kordoni, Melanie Siegel Inhalt Organisatorisches HPSG Grammatiken Werkzeuge Kodierungen TDL Syntax Über dieses Seminar

Mehr

Einführung in die Linguistik Butt & Co. Do. 12:15-13:45 Fr. 12:15-13:45

Einführung in die Linguistik Butt & Co. Do. 12:15-13:45 Fr. 12:15-13:45 Einführung in die Linguistik Butt & Co. Do. 12:15-13:45 Fr. 12:15-13:45 Infos etc. http://ling.uni-konstanz.de => Studium => Lehrveranstaltungen Einführung in die Linguistik Frage/Antwort: Klausur Wird

Mehr

Korpusvorverarbeitung. Hauptseminar: Einführung in die Korpuslinguistik. Kodierung/Annotationsmaximen. Vorverarbeitung: erste Schritte.

Korpusvorverarbeitung. Hauptseminar: Einführung in die Korpuslinguistik. Kodierung/Annotationsmaximen. Vorverarbeitung: erste Schritte. Hauptseminar: Einführung in die Korpuslinguistik Anke Lüdeling anke.luedeling@rz.hu-berlin.de Wintersemester 2002/2003 Korpusvorverarbeitung Beispiel: DIE ZEIT aufbereitet für journalistische Zwecke, mitgeliefertes

Mehr

VO 340088 Sprachtechnologien. Informations- und Wissensmanagement. Bartholomäus Wloka. Zentrum für Translationswissenschaft

VO 340088 Sprachtechnologien. Informations- und Wissensmanagement. Bartholomäus Wloka. Zentrum für Translationswissenschaft , Informations- und Wissensmanagement Zentrum für Translationswissenschaft Grundlagen und Definitionen Maschinelle Sprachverarbeitung Breites Spektrum an Methoden der Computerverarbeitung von Sprache.

Mehr

Interaktive Wörterbücher. Kurt Eberle Lingenio GmbH Hebelstr. 14 D-69115 Heidelberg k.eberle@lingenio.de 11.Juli 2007

Interaktive Wörterbücher. Kurt Eberle Lingenio GmbH Hebelstr. 14 D-69115 Heidelberg k.eberle@lingenio.de 11.Juli 2007 Interaktive Wörterbücher Lingenio GmbH Hebelstr. 14 D-69115 Heidelberg k.eberle@lingenio.de 11.Juli 2007 Es geht...... nicht um das Habilitationsthema nicht um (computer-)linguistische Theorie um ein praktisches

Mehr

Spezielle Themen der KI NLP Natural Language Processing

Spezielle Themen der KI NLP Natural Language Processing Spezielle Themen der KI NLP Natural Language Processing Marc Erich Latoschik AI & VR Lab, Faculty of Technology marcl@techfak.uni-bielefeld.de Was ist Sprache? Menschliche Sprache universelles Kommunikations-

Mehr

Was ist ein Compiler?

Was ist ein Compiler? Was ist ein Compiler? Was ist ein Compiler und worum geht es? Wie ist ein Compiler aufgebaut? Warum beschäftigen wir uns mit Compilerbau? Wie ist die Veranstaltung organisiert? Was interessiert Sie besonders?

Mehr

Multilinguales Information Retrieval, AG Datenbanken und Informationssysteme. Multilinguales Information Retrieval

Multilinguales Information Retrieval, AG Datenbanken und Informationssysteme. Multilinguales Information Retrieval Multilinguales Information Retrieval 1 Definition IR in einer anderen Sprache als Englisch IR auf einer einsprachigen Dokumentensammlung, die in mehreren Sprachen befragt werden kann. Information Retrieval

Mehr

Die Idee... Analyse geschriebener Texte. Gliederung. Analyse-Ebenen von Sprache. Lexikalische Ebene. Morphologische Ebene

Die Idee... Analyse geschriebener Texte. Gliederung. Analyse-Ebenen von Sprache. Lexikalische Ebene. Morphologische Ebene Die Idee... Analyse geschriebener Texte Joachim Pfister Hans Kenn! Eine Sprache hat unendliche viele Möglichkeiten, Sätze zu bilden und Wörter anzuordnen.! Nur: Welche davon werden als grammatikalisch

Mehr

Wortarten Merkblatt. Veränderbare Wortarten Unveränderbare Wortarten

Wortarten Merkblatt. Veränderbare Wortarten Unveränderbare Wortarten Wortarten Merkblatt Veränderbare Wortarten Deklinierbar (4 Fälle) Konjugierbar (Zeiten) Unveränderbare Wortarten Nomen Konjunktionen (und, weil,...) Artikel Verben Adverbien (heute, dort,...) Adjektive

Mehr

Einführung in die Sprachwissenschaft des Deutschen. Syntax IV. PD Dr. Alexandra Zepter

Einführung in die Sprachwissenschaft des Deutschen. Syntax IV. PD Dr. Alexandra Zepter Einführung in die Sprachwissenschaft des Deutschen Syntax IV PD Dr. Alexandra Zepter Überblick Syntax Fokus auf linearer Ordnung: Sprachtypen, Topologisches Feldermodell Fokus auf hierarchischer Ordnung:

Mehr

Satz Umstrukturierung für statistisch. Anna Schiffarth Dozentin: Miriam Kaeshammer Fortgeschrittene Methoden der statistisch maschinellen Übersetzung

Satz Umstrukturierung für statistisch. Anna Schiffarth Dozentin: Miriam Kaeshammer Fortgeschrittene Methoden der statistisch maschinellen Übersetzung Satz Umstrukturierung für statistisch maschinelle Übersetzung Anna Schiffarth Dozentin: Miriam Kaeshammer Fortgeschrittene Methoden der statistisch maschinellen Übersetzung Einführung Beschreibung einer

Mehr

Geschichte der Maschinellen Übersetzung. Einleitung Entwicklungsgeschichte der MÜ

Geschichte der Maschinellen Übersetzung. Einleitung Entwicklungsgeschichte der MÜ Geschichte der Maschinellen Übersetzung Einleitung Entwicklungsgeschichte der MÜ Einleitung MÜ als Modellierung des Übersetzungsprozesse MÜ als Mechanisierung menschlicher TätigkeitT Hochqualitative vollautomatische

Mehr

Wie der Computer übersetzt

Wie der Computer übersetzt Wie der Computer übersetzt Die maschinelle Übersetzung ist ein Spezialgebiet der Computeranwendung, auf dem fast jeder glaubt, dass er/sie ein Fachmann ist. Erstens: Es ist für jeden nachvollziehbar, dass

Mehr

den Einsatz von generierenden Werkzeugen und Theorien und von Software-Engineering-Methoden

den Einsatz von generierenden Werkzeugen und Theorien und von Software-Engineering-Methoden U- Übersetzer Vorlesung WS /8 Uwe Kastens Ziele: grundlegende Verfahren der Sprachimplementierung erlernen den Einsatz von generierenden Werkzeugen und von Standardverfahren kennen und schätzen lernen

Mehr

Verlaufsform. Verlaufsform. Aufbau (Zusammensetzung) Gliederung. Verlaufsform. Ähnliche Phänomene. Einleitung Geschichte der Verlaufsform :

Verlaufsform. Verlaufsform. Aufbau (Zusammensetzung) Gliederung. Verlaufsform. Ähnliche Phänomene. Einleitung Geschichte der Verlaufsform : Ruhr-Universität Bochum Germanistisches Institut Hauptseminar WS `04/`05 Dozentin: Dr. Pittner Referentinnen: Victoria Gilmuddinova, Nadine Herbst & Julia Kunze Verlaufsform Gliederung Einleitung Geschichte

Mehr

xii Inhaltsverzeichnis Generalisierung Typisierte Merkmalsstrukturen Literaturhinweis

xii Inhaltsverzeichnis Generalisierung Typisierte Merkmalsstrukturen Literaturhinweis Inhaltsverzeichnis 1 Computerlinguistik Was ist das? 1 1.1 Aspekte der Computerlinguistik.................. 1 1.1.1 Computerlinguistik: Die Wissenschaft........... 2 1.1.2 Computerlinguistik und ihre Nachbardisziplinen.....

Mehr

Ausgewählte Techniken der Maschinellen Übersetzung. Susanne J. Jekat ZHW E-mail: jes@zhwin.ch, Subject: MTZH

Ausgewählte Techniken der Maschinellen Übersetzung. Susanne J. Jekat ZHW E-mail: jes@zhwin.ch, Subject: MTZH Ausgewählte Techniken der Maschinellen Übersetzung Susanne J. Jekat ZHW E-mail: jes@zhwin.ch, Subject: MTZH Übersicht Themenbereiche: 1. Erstellung und Standardisierung von Ressourcen für die Maschinelle

Mehr

Überblick. VL: Einführung in die Korpuslinguistik. Historische Linguistik: Sprachwandel. Historische Linguistik: Sprachwandel. lexikalischer Wandel

Überblick. VL: Einführung in die Korpuslinguistik. Historische Linguistik: Sprachwandel. Historische Linguistik: Sprachwandel. lexikalischer Wandel Überblick VL: Einführung in die Korpuslinguistik Anke Lüdeling anke.luedeling@rz.hu-berlin.de Sommersemester 2004 Phänomene generell: Korpora & 'recent change' morphologischer Wandel -itis Arbeit mit Stefan

Mehr

1 ÜBERSETZER. Compilerbau 1

1 ÜBERSETZER. Compilerbau 1 1 ÜBERSETZER 1 A.V.Aho, J.D.Ullmann: Principles of Compiler Design, Addison Wesley (1977) J.Amsterdam: Building a computer in Software, BYTE (Okt. 1985) Programming Project: A SIMPL Compiler, BYTE (Dez.

Mehr

Prüfungsordnung der Universität Heidelberg für den Bachelor-Studiengang Besonderer Teil Theoretische und Angewandte Computerlinguistik

Prüfungsordnung der Universität Heidelberg für den Bachelor-Studiengang Besonderer Teil Theoretische und Angewandte Computerlinguistik Universität Heidelberg Seite 4 8.0.009 Prüfungsordnung der Universität Heidelberg für den Bachelor-Studiengang Besonderer Teil Theoretische und Angewandte vom 8. Januar 009 Aufgrund von 4 des Landeshochschulgesetzes,

Mehr

Die deutschen und lettischen Konstruktionsglossare und deren Verwendung bei der Textproduktion. Agnese Dubova Hochschule Ventspils

Die deutschen und lettischen Konstruktionsglossare und deren Verwendung bei der Textproduktion. Agnese Dubova Hochschule Ventspils Die deutschen und lettischen Konstruktionsglossare und deren Verwendung bei der Textproduktion Agnese Dubova Hochschule Ventspils Plan 1. Terminus Konstruktion 2. Deutsche und lettische Konstruktionsglossare

Mehr

Kontrastive Linguistik und Übersetzung ein Vergleich

Kontrastive Linguistik und Übersetzung ein Vergleich Kontrastive Linguistik und Übersetzung ein Vergleich Wintersemester 2014/15 Institut für Romanistik Aufbauseminar Kontrastive Linguistik Seminarleiterin: Frau Nora Wirtz M.A. Referentin: Ksenia Lopuga

Mehr

18.05.11. letzte Änderung. Prüfungsordnung der Universität Heidelberg für den Bachelor-Studiengang Besonderer Teil Computerlinguistik

18.05.11. letzte Änderung. Prüfungsordnung der Universität Heidelberg für den Bachelor-Studiengang Besonderer Teil Computerlinguistik A 07-0- 8.05. 05 - Prüfungsordnung der Universität Heidelberg für den Bachelor-Studiengang Besonderer Teil Computerlinguistik vom 4. Juni 00 Geltung des Allgemeinen Teils Die Prüfungsordnung der Universität

Mehr

Informationsextraktion

Informationsextraktion Informationsextraktion Bestimmte Anwendungen bei der semantischen Verarbeitung erfordern keine tiefe linguistische Analyse mit exakter Disambiguierung (= eine einzige und korrekte Lesart). Hierzu gehört

Mehr

Inhalt. Einfache Sätze. 1 Ja/Nein-Fragen und Aussagen A1 Kochst du heute? Ja, klar! W-Fragen A1 Was machst du? Wie heißen Sie?

Inhalt. Einfache Sätze. 1 Ja/Nein-Fragen und Aussagen A1 Kochst du heute? Ja, klar! W-Fragen A1 Was machst du? Wie heißen Sie? Einfache Sätze 1 Ja/Nein-Fragen und Aussagen A1 Kochst du heute? Ja, klar! 10 2 W-Fragen A1 Was machst du? Wie heißen Sie? 12 3 Personalpronomen, Verben im Präsens A1 Er wartet ich komme! 14 4 Unregelmäßige

Mehr

STEOP Modulprüfung Mehrsprachigkeit. Sprachkompetenz B-/C-Sprache Deutsch Modelltest - Lösung

STEOP Modulprüfung Mehrsprachigkeit. Sprachkompetenz B-/C-Sprache Deutsch Modelltest - Lösung STEOP Modulprüfung Mehrsprachigkeit Sprachkompetenz B-/C-Sprache Deutsch Modelltest - Lösung Zentrum für Translationswissenschaft STEOP-Modulprüfung Mehrsprachigkeit B-/C-Sprache Deutsch Modelltest B-/C-Sprache

Mehr

Inhaltsverzeichnis. Abkürzungen... 9 Niveaustufentests Tipps & Tricks Auf einen Blick Auf einen Blick Inhaltsverzeichnis

Inhaltsverzeichnis. Abkürzungen... 9 Niveaustufentests Tipps & Tricks Auf einen Blick Auf einen Blick Inhaltsverzeichnis Inhaltsverzeichnis Inhaltsverzeichnis Abkürzungen... 9 Niveaustufentests... 10 Tipps & Tricks... 18 1 Der Artikel... 25 1.1 Der bestimmte Artikel... 25 1.2 Der unbestimmte Artikel... 27 2 Das Substantiv...

Mehr

Aktuelle Architekturfragen in der Maschinellen Übersetzung semantischer Transfer und Integration statistischer Information in translate

Aktuelle Architekturfragen in der Maschinellen Übersetzung semantischer Transfer und Integration statistischer Information in translate Aktuelle Architekturfragen in der Maschinellen Übersetzung semantischer Transfer und Integration statistischer Information in translate Kurt Eberle Lingenio GmbH, Heidelberg 28.Mai 2009 Überblick Unternehmen/Hintergrund

Mehr

Einführung in die Linguistische Datenverarbeitung I Prof. Dr. Reinhard Köhler

Einführung in die Linguistische Datenverarbeitung I Prof. Dr. Reinhard Köhler Einführung in die Linguistische Datenverarbeitung I Prof. Dr. Reinhard Köhler Vorlesungsskript Teil 1 Unter Mitarbeit von Stefanie Okolowski und Sabine Patzschke 1 1. Das Fach Computerlinguistik Die Bezeichnung

Mehr

Deutsche Syntax deklarativ

Deutsche Syntax deklarativ Deutsche Syntax deklarativ Head-Driven Phrase Structure Grammar für das Deutsche Stefan Müller 1999 c Stefan Müller überarbeitete Ausgabe vom 2. Februar 1999 DFKI GmbH Fachbereich Sprachtechnologie Stuhlsatzenhausweg

Mehr

1 Der Fachübersetzungsmarkt

1 Der Fachübersetzungsmarkt LDV-Forum Bd.13, Nr. 1/2, Jg. 1996 19 MASCHINELLE WERKZEUGE FÜR DIE FACHTEXTÜBERSETZUNG Konzepte, Produkte und ihr wirtschaftlicher Nutzen Uta Seewald Universität Hannover seewald@mbox.rose.unihannover.de

Mehr

Theorien und Modelle I WS 2006/07 Prinzipien- und Parametermodell 1

Theorien und Modelle I WS 2006/07 Prinzipien- und Parametermodell 1 Theorien und Modelle I WS 2006/07 Prinzipien- und Parametermodell 1 Prinzipien- und Parametermodell Für die Generative Grammatik findet sich oft die Bezeichnung Prinzipien- und Parametermodell. Die Bezeichnung

Mehr

Syntax: Satzstruktur und Repräsentation. PD Dr. Ralf Vogel

Syntax: Satzstruktur und Repräsentation. PD Dr. Ralf Vogel Morphologie und Syntax (BA) Syntax: und Repräsentation PD Dr. Ralf Vogel Fakultät für Linguistik und Literaturwissenschaft Universität Bielefeld, SoSe 2007 Ralf.Vogel@Uni-Bielefeld.de 5.5.2008 1 / 54 Gliederung

Mehr

Mit der Entwicklung des Internets sind endliche Automaten noch weiter in den Fokus gerückt. Dafür sind mehrere Gründe ausschlaggebend:

Mit der Entwicklung des Internets sind endliche Automaten noch weiter in den Fokus gerückt. Dafür sind mehrere Gründe ausschlaggebend: Einleitung Endliche Automaten sind das Ergebnis der Entwicklung mathematischer Modelle für verschiedene mathematische, technische und naturwissenschaftliche Anwendungsbereiche. Als Pionierarbeiten gelten

Mehr

Part-of-Speech- Tagging

Part-of-Speech- Tagging Part-of-Speech- Tagging In: Einführung in die Computerlinguistik Institut für Computerlinguistik Heinrich-Heine-Universität Düsseldorf WS 2004/05 Dozentin: Wiebke Petersen Tagging Was ist das? Tag (engl.):

Mehr

Computerlinguistische Verfahren und Theorien für die Textproduktion in der Technischen Redaktion. Melanie Siegel

Computerlinguistische Verfahren und Theorien für die Textproduktion in der Technischen Redaktion. Melanie Siegel Computerlinguistische Verfahren und Theorien für die Textproduktion in der Technischen Redaktion Melanie Siegel Produktion technischer Dokumente Verständlichkeit Lesbarkeit Übersetzbarkeit Konsistenz Rechtschreibung

Mehr

Einführung in die Informatik Grammars & Parsers

Einführung in die Informatik Grammars & Parsers Einführung in die Informatik Grammars & Parsers Grammatiken, Parsen von Texten Wolfram Burgard Cyrill Stachniss 12.1 Einleitung Wir haben in den vorangehenden Kapiteln meistens vollständige Java- Programme

Mehr

Einführung in die Computerlinguistik (I)

Einführung in die Computerlinguistik (I) Einführung in die Computerlinguistik (I) Universität Zürich Prof. Dr. Michael Hess Wintersemester 1999/2000 0.1 Begriffsklärung: Was ist Computerlinguistik? Eine erste Antwort auf die Frage lautet folgendermassen:

Mehr

Ein bisschen Werbung. Einführung in die Morphologie Einleitung, Grundbegriffe I. Morphologie. 'Morphologie' Was ist ein Wort? Was ist ein Wort?

Ein bisschen Werbung. Einführung in die Morphologie Einleitung, Grundbegriffe I. Morphologie. 'Morphologie' Was ist ein Wort? Was ist ein Wort? Ein bisschen Werbung Einführung in die Morphologie Einleitung, Grundbegriffe I Anke Lüdeling anke.luedeling@rz.hu-berlin.de Sommersemester 2005 "Morphology is the conceptual centre of linguistics. This

Mehr

Lösungen zum Aufgabenblatt 9 Symbolisches Programmieren

Lösungen zum Aufgabenblatt 9 Symbolisches Programmieren Lösungen zum Aufgabenblatt 9 Symbolisches Programmieren WS 2012/13 H.Leiß, CIS, Universität München Aufgabe 9.1 Wir beginnen mit der einfachen DCG-Grammatik: % --------------- Grammatik-1 ---------------------

Mehr

LOKALE UND DIREKTIONALE PPS

LOKALE UND DIREKTIONALE PPS DGA Themen der Deutschen Syntax Universität Athen, WS 2014-15 Winfried Lechner Handout #4 LOKALE UND DIREKTIONALE PPS Elena Vlachou (Cand. phil, Universität Athen) 1. DIE KATEGORIE P Präpositionen bilden

Mehr

Sprachverarbeitung. Aufbau, Erwerb und Mitteilung von Wissen wird erst möglich durch das einzigartige Medium der Sprache, das durch die kulturelle

Sprachverarbeitung. Aufbau, Erwerb und Mitteilung von Wissen wird erst möglich durch das einzigartige Medium der Sprache, das durch die kulturelle Sprachverarbeitung. Aufbau, Erwerb und Mitteilung von Wissen wird erst möglich durch das einzigartige Medium der Sprache, das durch die kulturelle Evolution der menschlichen Gesellschaft hervorgebracht

Mehr

LANGSOFT, Sprachlernmittel, Schweiz. DOKUMENTATION und Präsentation

LANGSOFT, Sprachlernmittel, Schweiz. DOKUMENTATION und Präsentation LANGSOFT, Sprachlernmittel, Schweiz DOKUMENTATION und Präsentation 1. Eintragung. Zuerst registriert am 27.05.1994 in Graubünden, Schweiz, Reg. No 1.350.000.133. Erneut registriert am 09.12.1996 in Graubünden,

Mehr

Einführung in die Computerlinguistik. Semantik

Einführung in die Computerlinguistik. Semantik Einführung in die Computerlinguistik Semantik WS 2006/2007 Manfred Pinkal Einführung in die Computerlinguistik 2006/2007 M. Pinkal UdS 1 Semantik für Dialogverarbeitung U: Ist der Flug um 2 nach London

Mehr

1. Der Begriff Informatik 2. Syntax und Semantik von Programmiersprachen. I.2. I.2. Grundlagen von von Programmiersprachen.

1. Der Begriff Informatik 2. Syntax und Semantik von Programmiersprachen. I.2. I.2. Grundlagen von von Programmiersprachen. 1. Der Begriff Informatik 2. Syntax und Semantik von Programmiersprachen I.2. I.2. Grundlagen von von Programmiersprachen. - 1 - 1. Der Begriff Informatik "Informatik" = Kunstwort aus Information und Mathematik

Mehr

Computerlinguistik. Lehreinheit 3-4: Multilinguale Mensch-Maschine Kommunikation: Linguistische Aspekte und Anwendungen-2

Computerlinguistik. Lehreinheit 3-4: Multilinguale Mensch-Maschine Kommunikation: Linguistische Aspekte und Anwendungen-2 Computerlinguistik Lehreinheit 3-4: Multilinguale Mensch-Maschine Kommunikation: Linguistische Aspekte und Anwendungen-2 Dr. Christina Alexandris Nationale Universität Athen Deutsche Sprache und Literatur

Mehr

Praktikum Compilerbau

Praktikum Compilerbau Implementation eines s 20. April 2005 Vorlesungen Vorlesungen, die nützliche für das Praktikum liefern: Automaten, Formale Sprachen und Berechenbarkeit bau Abstrakte Maschinen Programm-Optimierung Fertigkeiten

Mehr

Grammatik des Standarddeutschen. Michael Schecker

Grammatik des Standarddeutschen. Michael Schecker Grammatik des Standarddeutschen Michael Schecker Einführung und Grundlagen Nominalgruppen Nomina Artikel Attribute Pronomina Kasus (Subjekte und Objekte, Diathese) Verbalgruppen Valenz und Argumente Tempora

Mehr

Lösungsvorschlag für das Übungsblatt 1. Aufgabe 1.

Lösungsvorschlag für das Übungsblatt 1. Aufgabe 1. Lösungsvorschlag für das Übungsblatt 1. Aufgabe 1. Zusammengefasst aus Ihren Beiträgen Wie bewerten sie das System ingesamt? Das Watson System verdeutlicht den Fortschritt der Künstlichen Intelligenz Forschung/Computerlinguistik/Informatik

Mehr

Syntax Verb-Zweit. Modul 04-006-1003 Syntax und Semantik. Universität Leipzig www.uni-leipzig.de/ heck. Institut für Linguistik

Syntax Verb-Zweit. Modul 04-006-1003 Syntax und Semantik. Universität Leipzig www.uni-leipzig.de/ heck. Institut für Linguistik Syntax Verb-Zweit Modul 04-006-1003 Syntax und Semantik Institut für Linguistik Universität Leipzig www.uni-leipzig.de/ heck Modell der topologischen Felder Plan: Im folgenden soll die Verb-Zweit-Eigenschaft

Mehr

Progressionsplan für Pingpong Neu-Kurse

Progressionsplan für Pingpong Neu-Kurse Progressionsplan für Pingpong Neu-Kurse NEU 1 Band 1 und Band 2 Lektion 1 Lektion 2 Lektion 3 mein, -e / dein, -e S. 115-116, S. 124: 7.1.6. Band 1 Lektion 4 möchte (Singular) S. 47 Lektion 5 Konjugation

Mehr

Elementare statistische Methoden

Elementare statistische Methoden Elementare statistische Methoden Vorlesung Computerlinguistische Techniken Alexander Koller 28. November 2014 CL-Techniken: Ziele Ziel 1: Wie kann man die Struktur sprachlicher Ausdrücke berechnen? Ziel

Mehr

Modulhandbuch 10.07.2013. Bachelor Computerlinguistik (zur PO vom 14.06.2010) Universität Heidelberg Neuphilologische Fakultät

Modulhandbuch 10.07.2013. Bachelor Computerlinguistik (zur PO vom 14.06.2010) Universität Heidelberg Neuphilologische Fakultät Modulhandbuch 10.07.2013 Universität Heidelberg Neuphilologische Fakultät Bachelor Computerlinguistik (zur PO vom 14.06.2010) Konsekutiver Vollzeit-Studiengang Regelstudienzeit: 6 Semester 1 Legende: PM

Mehr

Basismethoden Sprachverarbeitung: Part-of-Speech Tagging

Basismethoden Sprachverarbeitung: Part-of-Speech Tagging Basismethoden der Sprachver- und -bearbeitung Vorverarbeitung PoS Tagging, Namenserkennung, Shallow Parsing Informationsgewinnung Kategorisierung, Informationsextraktion Analyse gesprochener Sprache Spracherkennung,

Mehr

Castensen KU, Ebert Ch, Ebert C, Jekat S, Klabunde R, Langer H (Hrsg.). Computerlinguistik und Sprachtechnologie. 3. Auflage. Heidelberg: Spektrum

Castensen KU, Ebert Ch, Ebert C, Jekat S, Klabunde R, Langer H (Hrsg.). Computerlinguistik und Sprachtechnologie. 3. Auflage. Heidelberg: Spektrum Präsentation Natural Language and Text Processing in Biomedicine Matthias Baldauf WS 2010/11 Seminar Biomedizinische Informatik 09.12.2010 Einleitung Natural Language Processing (NLP) Computerlinguistik

Mehr

Anfrage Erweiterung 03.11.2011 Jan Schrader

Anfrage Erweiterung 03.11.2011 Jan Schrader Anfrage Erweiterung 03.11.2011 Jan Schrader Vocabulary Mismatch Problem Anfrage und Dokument passen nicht zusammen obwohl Dokument zur Anfrage relevant Grund: Synonymproblem verschiedene Menschen benennen

Mehr

Architekturen. Aufbau von Systemen Direkte Systeme Transfersysteme Interlinguasysteme

Architekturen. Aufbau von Systemen Direkte Systeme Transfersysteme Interlinguasysteme Architekturen Aufbau von Systemen Direkte Systeme Transfersysteme Interlinguasysteme Architekturen von Übersetzungssystemen: automatisch Eingabe Übersetzung Ausgabe Architekturen von Übersetzungssystemen:

Mehr

Datenstrukturen DCG Grammatiken. Tutorial I Operationen auf Datenstrukturen II Bäume DCGs und Semantik II

Datenstrukturen DCG Grammatiken. Tutorial I Operationen auf Datenstrukturen II Bäume DCGs und Semantik II Datenstrukturen DCG Grammatiken Tutorial I Operationen auf Datenstrukturen II Bäume DCGs und Semantik II Bäume Repräsentation von Mengen durch binäre Bäume: Eine häufige Anwendung von Listen ist es Mengen

Mehr

Überblick. VL: Einführung in die Korpuslinguistik. Annotation. Tokenbasierte Annotation

Überblick. VL: Einführung in die Korpuslinguistik. Annotation. Tokenbasierte Annotation Überblick VL: Einführung in die Korpuslinguistik Anke Lüdeling anke.luedeling@rz.hu-berlin.de Sommersemester 2004 kurze Wiederholung syntaktische phonetische/phonologische Tokenbasierte pos-tagging & Lemmatisierung

Mehr

Generierung & Übersetzung mit XLE

Generierung & Übersetzung mit XLE Generierung & Übersetzung mit XLE Grammatikentwicklung, SS 2010 1 /25 Worum es heute geht: Generierung mit XLE Übersetzung mit XLE 2 /25 Allgemein: Generierung Generierung ist: der Gegenbegriff zum Parsing

Mehr

Zusammenfassung 1. Motivation

Zusammenfassung 1. Motivation Zusammenfassung 1. Motivation Das Verb hat eine zentrale Position im Satz, da es die Struktur und die Bedeutung eines Satzes maßgeblich beeinflusst. Lexikalische Informationen zu Verben sind daher von

Mehr

Syntax und Morphologie

Syntax und Morphologie Syntax und Morphologie Einführungskurs 7. Vorlesung Redeteile (lat( lat. partes orationis, engl. parts of speech) Die Lexeme einer Sprache können im Hinblick auf bestimmte semantische und formale Eigenschaften

Mehr