Syntax und Parsing. OS Einblicke in die Computerlinguistik. Philipp Rabe, 13IN-M

Größe: px
Ab Seite anzeigen:

Download "Syntax und Parsing. OS Einblicke in die Computerlinguistik. Philipp Rabe, 13IN-M"

Transkript

1 OS Einblicke in die Computerlinguistik basierend auf Computerlinguistik und Sprachtechnologie, 3. Auflage, Spektrum, Heidelberg Mai 2014

2 Ausgangssituation Tokenisierung und Wortarten-Tagging vollendet (siehe Vortrag Herr Hinerasky) Beginn und Ende von Sätzen festgestellt einzelne Satzbestandteile erkannt Worte mit grammatischer Information versehen Satz als Liste von annotierten Wörtern Zielsetzung Strukturbeschreibung des Satzes Baum zur Ermittlung der Funktionalität der Worte im Satz Zuordnung ist eindeutig

3 1 Syntax Syntaktische Strukturen Kontextfreie Grammatiken Unifikations-Grammatik PATR-II 2 Parsing Grundlagen Probleme Vom Backtracking- zum Earley-Algorithmus 3 Zusammenfassung

4 Syntaktische Strukturen Dependenzsyntax Relation zwischen einzelnen Wörtern Konstituentenstruktursyntax Relation zwischen Konstituenten S halte Vortrag NP VP PP V NP ich den ich halte DET N den Vortrag

5 Kontextfreie Grammatiken Kontextfreie Grammatiken für natürliche Sprachen Grammatik G = Φ, Σ, R, S Φ - Menge von Nichtterminalsymbolen S, NP, VP, N, DET (N, DET: präterminale Kategorien) Σ - Menge von Terminalsymbolen der, Hund, bellt, sieht, die, Katze R - Menge von Regeln α β lexikalische Regeln: β Σ S - Startsymbol (S Φ) S = S, Satz α Φ, β (Φ Σ)

6 Kontextfreie Grammatiken Kontextfreie Grammatiken für natürliche Sprachen (2) Einige ableitbare Sätze: Regelmenge R: der Hund bellt S NP VP (1) NP DET N (2) VP V (3) VP V NP (4) DET der (5) DET die (6) N Hund (7) N Katze (8) V bellt (9) V sieht (10) der Hund sieht die Katze der Katze bellt die Hund S NP VP DET N V NP der Hund sieht DET die N Katze

7 Kontextfreie Grammatiken Erweiterung der Grammatik um Kongruenzbedingungen Differenzierung um Genus (m/f ) und Kasus (n/a): NP DET N NP mn DET mn N mn NP ma DET ma N ma NP fn DET fn N fn NP fa DET fa N fa Probleme Exponentiell viele Nichtterminalsymbole und Regeln Keine Relation zwischen NP mn und NP ma keine Generalisierung, keine Unifikation (Vortrag Herr Petersen)

8 Unifikations-Grammatik PATR-II Parsing And TRanslation II Zwei Komponenten: Menge von Grammatikregeln Lexikon Lexikoneinträge verlangen Merkmalsstrukturen Zuordnung Wort Merkmalsstruktur Pfadgleichungen KAT KGR KAT KGR Hund N KAS NOM NUM SG GEN MASK der DET KAS NOM NUM SG GEN MASK (NP DET N) X 0 X 1 X 2 X 0 KAT = NP X 1 KAT = DET X 2 KAT = N X 1 KGR = X 2 KGR

9 1 Syntax Syntaktische Strukturen Kontextfreie Grammatiken Unifikations-Grammatik PATR-II 2 Parsing Grundlagen Probleme Vom Backtracking- zum Earley-Algorithmus 3 Zusammenfassung

10 Grundlagen Parsing als Suchprozess Zustand Z i α, KAT, Struktur Startzustand Z 0 [der, Hund, bellt], S, Übergänge: Grammatikregeln (kontextfrei oder PATR-II) Endzustände E j [], S, S [ NP [ DET [der] N [Hund]] VP [ V [bellt]]] S NP VP DET N V der Hund bellt

11 Grundlagen Verarbeitungsrichtung Links-Rechts-Verarbeitung oder Head-Corner-Parsing Analyserichtung Top-Down Bottom-Up S S NP VP NP VP DET N V DET N V der Hund bellt der Hund bellt Suchstrategie Tiefensuche (nicht vollständig), Breitensuche, Best-first,...

12 Probleme Übersicht Ambiguität Abdeckung Effizienz Ambiguität Zeitfliegen mögen einen Pfeil. Time flies like an arrow. Bestimme die Geschwindigkeit von Fliegen so, wie es ein Pfeil tut! Es klappte gut weil Maria die Freundin von Anna aus Osnabrück mit dem Auto von Petra aus Bielefeld abgeholt hat. Lösung: integrative Architekturen, probabilistisches Parsing

13 Probleme Abdeckung Komplexität von Grammatiken (und Lexika) sehr groß immer auf Anwendungsbereich (Domäne) spezialisiert Prüfung auf korrekte Verarbeitung von Realdaten schwierig Effizienz Korrektheit nicht von Nutzen, wenn Analysedauer zu groß Finden aller Strukturbeschreibungen für beliebigen Satz mit beliebiger kontextfreier Grammatik: mathematisch unlösbar Lösung des Problems nicht immer definiert Vergleich von Effizienz schwierig, da domänen- und satzabhängig

14 Vom Backtracking- zum Earley-Algorithmus Ein Backtracking-Recognizer Prüfung, ob Grammatik Satz akzeptiert oder nicht Tiefensuche (keine linksrekursiven Regeln erlaubt) Beispiel Die Katze miaut DET NP N S VP V Regelmenge R S NP VP NP DET N VP V VP V NP DET der DET die N Hund N Katze V bellt V miaut V sieht die Katze miaut

15 Vom Backtracking- zum Earley-Algorithmus Chart-Parsing Dynamisches Programmieren Chart: Tabelle, Liste von Items beschreibt Syntaxstrukturen von Satzabschnitten: 0 Der 1 Hund 2 sieht 3 die 4 Katze 5 [ 3 5 NP DET N ] (inaktiv aktiv) [ 0 2 S NP VP ] (inaktiv aktiv) Start: [ 0 0 S NP VP ] Ende: [ 0 5 S NP VP ] Enthaltene Prozeduren Expand - Erweitert nicht abgeschlossene Regeln Scan - Wendet lexikalische Regeln an Complete - Fasst abgeschlossene Items zusammen

16 Vom Backtracking- zum Earley-Algorithmus Expand [ i j A α B β ] C B γ R neu: [ j j B γ ] C Scan Eingabekette w = w 1 w 2... w n [ i j-1 A α w j β ] C neu: [ i j A α w j β ] C Complete [ i j A α Bβ ] C [ j k B γ ] C neu: [ i k A α B β ] C

17 1 Syntax Syntaktische Strukturen Kontextfreie Grammatiken Unifikations-Grammatik PATR-II 2 Parsing Grundlagen Probleme Vom Backtracking- zum Earley-Algorithmus 3 Zusammenfassung

18 Syntax Erzeugung von syntaktischen Strukturen mit kontextfreien Grammatiken möglich Besser aber: Arbeit mit Merkmalsstrukturen (PATR-II) Generalisierung und Unifikation möglich Parser Parsing verständlich als Suchprozess Probleme: Ambiguität, Abdeckung, Effizienz Backtracking vollzieht teilweise korrekte Schritte mehrmals Chart-Parsing nutzt gewonnene Informationen erneut

19 Beispiel Earley-Algorithmus Satzabschitte 0 Der 1 Hund 2 sieht 3 die 4 Katze 5 Regelmenge R S NP VP (1) NP DET N (2) VP V (3) VP V NP (4) DET der (5) DET die (6) N Hund (7) N Katze (8) V bellt (9) V miaut (10) V sieht (11) Expand Scan [ i j A α B β ] C B γ R neu: [ j j B γ ] C Eingabekette w = w 1 w 2... w n [ i j-1 A α wj β ] C neu: Complete [ i j A α wj β ] C [ i j A α Bβ ] C [ j k B γ ] C neu: [ i k A α B β ] C

Übersicht. (A) Kontextfreie Sprachen (B) Syntaxanalyse (Parsing) (C) Grenzen der Kontextfreiheit

Übersicht. (A) Kontextfreie Sprachen (B) Syntaxanalyse (Parsing) (C) Grenzen der Kontextfreiheit Übersicht (A) Kontextfreie Sprachen (B) Syntaxanalyse (Parsing) (C) Grenzen der Kontextfreiheit (B) Syntaxanalyse 1. Definition Parsing 2. Einfache Parsestrategien: Top-down Bottom-Up Probleme beim Parsen

Mehr

Earley Parsing. Parsing - WS 2012 / 2013 Lisa Orszullok & Anika Stallmann

Earley Parsing. Parsing - WS 2012 / 2013 Lisa Orszullok & Anika Stallmann Earley Parsing Parsing - WS 2012 / 2013 Lisa Orszullok & Anika Stallmann 12.12.2012 Agenda Basics Komponenten Earley Parsing - Recognizer Earley Parsing - Parser Vor- und Nachteile Parsing WS 2012/2013

Mehr

Eine Erweiterung der kontextfreien Grammatiken: PATR-II

Eine Erweiterung der kontextfreien Grammatiken: PATR-II Eine Erweiterung der kontextfreien Grammatiken: PATR-II Das ursprüngliche Problem war: Wie kann man strukturelle Information (Phrasenstruktur) von anderen grammatischen Informationen (wie Kongruenz, Rektion

Mehr

Inhalt. Einführung Formale Sprachen und Grammatiken Übergangsnetze Merkmalsstrukturen Unifikationsgrammatiken

Inhalt. Einführung Formale Sprachen und Grammatiken Übergangsnetze Merkmalsstrukturen Unifikationsgrammatiken 4 Syntax Inhalt Einführung Formale Sprachen und Grammatiken Übergangsnetze Merkmalsstrukturen Unifikationsgrammatiken 4.1 Einführung Einführung Oberflächenstruktur (OF) äußere Erscheinungsform eines Satzes

Mehr

Earley Parser. Flutura Mestani

Earley Parser. Flutura Mestani Earley Parser Flutura Mestani Informatik Seminar Algorithmen zu kontextfreien Grammatiken Wintersemester 2015/2016 Prof. Martin Hofmann, Dr. Hans Leiß Flutura Mestani 25.11.2015 Seminar Algorithmen zu

Mehr

Einführung in unifikationsbasierte Grammatikformalismen

Einführung in unifikationsbasierte Grammatikformalismen Universität Potsdam Institut für Linguistik Computerlinguistik Einführung in unifikationsbasierte Grammatikformalismen Thomas Hanneforth head: VP form: finite subj: pers: 3 num: pl Merkmalsstrukturen:

Mehr

Automatisches Verstehen gesprochener Sprache

Automatisches Verstehen gesprochener Sprache Automatisches Verstehen gesprochener Sprache 6. Syntaxanalyse Martin Hacker Bernd Ludwig Günther Görz Professur für Künstliche Intelligenz Department Informatik Friedrich-Alexander-Universität Erlangen-Nürnberg

Mehr

Chart-Parsing. bersicht. Ziel. Motivation: Bisher vorgestellte Verfahren sind nicht effizient Grundidee des Chart-Parsing Datenstruktur

Chart-Parsing. bersicht. Ziel. Motivation: Bisher vorgestellte Verfahren sind nicht effizient Grundidee des Chart-Parsing Datenstruktur Chart-Parsing bersicht Ziel Motivation: Bisher vorgestellte Verfahren sind nicht effizient Grundidee des Chart-Parsing Datenstruktur Knoten passive und aktive Kanten gepunktete Regeln (dotted rules) Fundamentalregel

Mehr

Kontextfreie Grammatiken

Kontextfreie Grammatiken Kontextfreie Grammatiken Vorlesung Computerlinguistische Techniken Alexander Koller 16. Oktober 2015 Übersicht Worum geht es in dieser Vorlesung? Übungen und Abschlussprojekt Kontextfreie Grammatiken Computerlinguistische

Mehr

Charts. Motivation. Grundfrage. Chart als Graph

Charts. Motivation. Grundfrage. Chart als Graph Charts Motivation Übersicht Chart bzw. Well-Formed Substring Table (WFST) Als azyklischer Graph, Tabelle und Relation Kantenbeschriftungen Kategorien: WFST Regeln: Passive Charts Regelhyposen: Aktive Charts

Mehr

Der Earley-Algorithmus

Der Earley-Algorithmus Der Earley-Algorithmus Kursfolien Karin Haenelt 25.03.02 1 25.03.02 2 Inhalt Funktion des Earley-Algorithmus Begriffe Erkenner/Parser Kontextfreie Grammatik Ein Beispiel Funktionen des Algorithmus Funktionsweise

Mehr

Der Earley-Algorithmus

Der Earley-Algorithmus Der Earley-Algorithmus Kursfolien Karin Haenelt 25.03.02 1 25.03.02 2 Inhalt Funktion des Earley-Algorithmus Begriffe Erkenner/Parser Kontextfreie Grammatik Ein Beispiel Funktionen des Algorithmus Funktionsweise

Mehr

Algorithmen und Datenstrukturen

Algorithmen und Datenstrukturen Algorithmen und Datenstrukturen Datenstrukturen: Anordnung von Daten, z.b. als Liste (d.h. in bestimmter Reihenfolge) Beispiel: alphabetisch sortiertes Wörterbuch... Ei - Eibe - Eidotter... als Baum (d.h.

Mehr

Teil 111. Chart-Parsing

Teil 111. Chart-Parsing Teil 111 Chart-Parsing 102 Die im ersten Teil des Buches behandelten einfachen Parsingalgorithmen sind, anders als die meisten vor allem im Compilerbau verwendeten Algorithmen (z.b. die LLoder LR-Parsingalgorithmen),

Mehr

Einführung in die Computerlinguistik Formale Grammatiken rechtslineare und kontextfreie Grammatiken Kellerautomaten

Einführung in die Computerlinguistik Formale Grammatiken rechtslineare und kontextfreie Grammatiken Kellerautomaten Einführung in die Computerlinguistik Formale Grammatiken rechtslineare und kontextfreie Grammatiken Kellerautomaten Dozentin: Wiebke Petersen 13. Foliensatz Wiebke Petersen Einführung CL 1 Formale Grammatik

Mehr

Einführung in die Computerlinguistik

Einführung in die Computerlinguistik Einführung in Computerlinguistik Parsing Dozentin: Wiebke Petersen W 2004/2005 1 Nachtrag zu den Abschlußeigenschaften kontextfreier prachen Kontextfreie prachen sind abgeschlossen bezüglich der Vereinigung

Mehr

Einführung in die Computerlinguistik

Einführung in die Computerlinguistik Einführung in die Computerlinguistik Kontextfreie Sprachen und Pushdown-Automaten Dozentin: Wiebke Petersen WS 2004/2005 Wiebke Petersen Formale Komplexität natürlicher Sprachen WS 03/04 Wiederholung c

Mehr

Übungsaufgaben. Eine kontextfreie Grammatik lässt sich formal als Quadrupel darstellen: D : der, das N : Hund, Kaninchen V : sieht, beißt

Übungsaufgaben. Eine kontextfreie Grammatik lässt sich formal als Quadrupel darstellen: D : der, das N : Hund, Kaninchen V : sieht, beißt Universität Bielefeld 25. Juni 2006 Fakultät für Linguistik und Literaturwissenschaft Formale Methoden der Linguistik III Veranstalter: Dieter Metzing Sommersemester 2006 Übungsaufgaben 1. (a) Welche Bestandteile

Mehr

Einführung Computerlinguistik. Konstituentensyntax II

Einführung Computerlinguistik. Konstituentensyntax II Einführung Computerlinguistik Konstituentensyntax II Hinrich Schütze & Robert Zangenfeind Centrum für Informations- und Sprachverarbeitung, LMU München 2013-11-18 1 / 31 Take-away Phrasenstrukturgrammatik:

Mehr

Einführung in die Computerlinguistik

Einführung in die Computerlinguistik Einführung in die Computerlinguistik Syntax: Merkmalsstrukturen WS 2014/2015 Vera Demberg Eigenschaften der syntaktischen Struktur [1] Er hat die Übungen gemacht. Der Student hat die Übungen gemacht. Der

Mehr

Grammatiktheorie: Merkmale, Merkmalstrukturen, Unifikation, Unifikationsgrammatiken

Grammatiktheorie: Merkmale, Merkmalstrukturen, Unifikation, Unifikationsgrammatiken Grammatiktheorie: Merkmale, Merkmalstrukturen, Unifikation, Unifikationsgrammatiken Einführungskurs Syntax und Morphologie 11. Vorlesung Merkmale Das Wort 'Merkmal' bedeutet im Prinzip soviel wie 'Eigenschaft'

Mehr

Einführung in die Computerlinguistik. Syntax II

Einführung in die Computerlinguistik. Syntax II Einführung in die Computerlinguistik yntax II Hinrich chütze & Robert Zangenfeind Centrum für Informations- und prachverarbeitung, LMU München 18.12.2015 chütze & Zangenfeind: yntax II 1 / 17 Take-away

Mehr

Kontextsensitive Sprachen

Kontextsensitive Sprachen Kontextsensitive Sprachen Standardbeispiel: {anbncn} S a b c S a A b B c c B A B b c B b b A A b a A a a Im Bereich der natürlichen Sprachen gibt es zahlreiche kontextsensitive Phänomene in der Semantik

Mehr

Einführung in die Computerlinguistik Chart-Parsing

Einführung in die Computerlinguistik Chart-Parsing Einführung in die Computerlinguistik Chart-Parsing Dozentin: Wiebke sen 21.12.2009 Wiebke sen Einführung CL (Wie 09/10) 1 P = calls calls Wiebke sen Einführung CL (Wie 09/10) 2 P = calls calls Wiebke sen

Mehr

Formale Sprachen und Automaten: Tutorium Nr. 8

Formale Sprachen und Automaten: Tutorium Nr. 8 Formale Sprachen und Automaten: Tutorium Nr. 8 15. Juni 2013 Übersicht 1 Nachtrag 2 Besprechung von Übungsblatt 7 Aufgabe 1 Aufgabe 2 Aufgabe 3 3 CFG PDA Definitionen Ein Beispiel! Aufgabe 4 Der PDA als

Mehr

Einführung in die Computerlinguistik Kontextfreie Grammatiken und. Kellerautomaten. Dozentin: Wiebke Petersen

Einführung in die Computerlinguistik Kontextfreie Grammatiken und. Kellerautomaten. Dozentin: Wiebke Petersen Einführung in die Computerlinguistik en und Dozentin: Wiebke Petersen 7.1.2010 Wiebke Petersen Einführung CL (WiSe 09/10) 1 kontextfreie Grammatik Denition Eine Grammatik (N, T, S, P) heiÿt kontextfrei,

Mehr

Programmierkurs Python II

Programmierkurs Python II Programmierkurs Python II Michaela Regneri & tefan Thater FR 4.7 Allgemeine Linguistik (Computerlinguistik) Universität des aarlandes ommersemester 2010 (Charniak, 1997) the dog biscuits N V N V the dog

Mehr

LR-Parsing. Präsentation vom 19. Dez Adriana Kosior, Sandra Pyka & Michael Weidauer. Automatische Syntaxanalyse (Parsing) Wintersemester 12/13

LR-Parsing. Präsentation vom 19. Dez Adriana Kosior, Sandra Pyka & Michael Weidauer. Automatische Syntaxanalyse (Parsing) Wintersemester 12/13 LR-Parsing Präsentation vom 19. Dez. 2012 Adriana Kosior, Sandra Pyka & Michael Weidauer Automatische Syntaxanalyse (Parsing) Wintersemester 12/13 Inhalte Einleitung LR(0) Parser LR(1) Parser Fazit Literatur

Mehr

Ausgewählte Techniken der Maschinellen Übersetzung. Susanne J. Jekat ZHW Subject: MTZH

Ausgewählte Techniken der Maschinellen Übersetzung. Susanne J. Jekat ZHW   Subject: MTZH Ausgewählte Techniken der Maschinellen Übersetzung Susanne J. Jekat ZHW E-mail: jes@zhwin.ch, Subject: MTZH Übersicht Themenbereiche: 1. Erstellung und Standardisierung von Ressourcen für die Maschinelle

Mehr

Von der Grammatik zum AST

Von der Grammatik zum AST Von der Grammatik zum AST Welche Eigenschaften soll ein Parser haben? Wann ist eine Grammatik eindeutig? Wie sollte eine Grammatik aussehen? Theoretischer Hin tergrund: FIRST, FOLLOW Einschränkungen von

Mehr

Einführung in die Computerlinguistik

Einführung in die Computerlinguistik Einführung in die Computerlinguistik Merkmalstrukturen und Unifikation Dozentin: Wiebke Petersen WS 2004/2005 Wiebke Petersen Formale Komplexität natürlicher Sprachen WS 03/04 Universität Potsdam Institut

Mehr

Karl Heinz Wagner

Karl Heinz Wagner PATR II Funktionale Beschreibungen Der PATR II Formalismus Auch für PATR II gilt Sprachliche Ausdrücke werden durch funktionale Beschreibungen oder Deskriptionen (engl. functional descriptions,, FD beschrieben

Mehr

Kontextfreie Sprachen

Kontextfreie Sprachen Kontextfreie Sprachen Bei regulären (=Typ 3-) Grammatikregeln stehen maximal ein Terminal- und ein Nichtterminalsymbol auf der rechten Seite. Dadurch läßt sich lediglich die Abfolge der Terminalzeichen

Mehr

Der CKY-Parser. Vorlesung Computerlinguistische Techniken Alexander Koller. 27. Oktober 2015

Der CKY-Parser. Vorlesung Computerlinguistische Techniken Alexander Koller. 27. Oktober 2015 Vorlesung omputerlinguistische Techniken Alexander Koller 27. Oktober 2015 Übersicht Komplexität des KY-Algorithmus Implementierung in Python hift-reduce-parsing hift-regel: (a w, s) (w, s a) Reduce-Regel:

Mehr

Spezielle Themen der KI NLP. Parsing

Spezielle Themen der KI NLP. Parsing Spezielle Themen der KI NLP Parsing Syntaktisches Parsing 2 Bottom-up-Parsing s > np vp vp > verb np np > det noun np > det np np > proper-noun np > pronoun np > adj noun det > the det > a adj > red noun

Mehr

Probabilistic Context Free Grammars, Part II

Probabilistic Context Free Grammars, Part II Probabilistic Context Free Grammars, Part II Prof Dr. Matthew Crocker Universität des Saarlandes 16. Juli 2015 Matthew Crocker (UdS) PCFG II 16. Juli 2015 1 / 25 Themen heute: 1 Wiederholung: PCFG 2 Formeln

Mehr

Sie gab das Buch ihrer Schwester.

Sie gab das Buch ihrer Schwester. Linguistische Kriterien für kontextfreie Grammatiken Zerlegung eines Satzes in Konstituenten gemäß Austausch-, Verschiebe- und Weglaßprobe Dies ist ein Beispiel. Beschreibungsmöglichkeiten: 1. S Pron V

Mehr

Der Earley-Algorithmus.

Der Earley-Algorithmus. 1 Der Earley-Algorithmus. Eine Erläuterung der formalen Spezifikation mit linguistischen Beispielen Kursskript Karin Haenelt, 25.07.2001 1 Einleitung In diesem Skript wird die formale Spezifikation des

Mehr

Spezielle Themen der KI. NLP Natural Language Processing Parsing

Spezielle Themen der KI. NLP Natural Language Processing Parsing Spezielle Themen der KI NLP Natural Language Processing Parsing Parsing Strategien top-down: Ausgehend von S Hypothesenbildung und Verifikation anhand der Grammatikregeln Ersetzung nicht-terminaler Symbole

Mehr

MODIFIKATIONEN DES TOMITA-PARSERS FÜR ID/LP UND FEATURE GRAMMARS Jens Woch

MODIFIKATIONEN DES TOMITA-PARSERS FÜR ID/LP UND FEATURE GRAMMARS Jens Woch Fachbeiträge MODIFIKATIONEN DES TOMITA-PARSERS FÜR ID/LP UND FEATURE GRAMMARS Jens Woch Abstract: Die Verwendung von ID/LP-Grammatiken und komplexen Symbolen ist bei Flektionsreichen und in der Wortstellung

Mehr

Fachseminar Compilerbau

Fachseminar Compilerbau Fachseminar Compilerbau WS 08/09 Matthias Schiller Syntaktische Analyse 1. Prinzip der Top-Down-Analyse 2. LL(1)-Grammatiken Modell-Vorstellung Der Scanner liefert als Ergebnis der lexikalischen Analyse,

Mehr

Funktionale-Grammatik

Funktionale-Grammatik Lexikalisch-Funktionale Funktionale-Grammatik Formaler Aufbau der F-Strukturen Funktionale Beschreibungen Funktionale Annotationen Von der K-Struktur zur F-Struktur Architektur der LFG Grammatik Erweiterte

Mehr

Lösungsvorschlag für das Übungsblatt 9. Aufgabe 1.

Lösungsvorschlag für das Übungsblatt 9. Aufgabe 1. Lösungsvorschlag für das Übungsblatt 9. Aufgabe 1. Jack greets Mary really quickly. Nr. Linkssatzform Eingabe Schritt 1 S Jack greets Mary really quickly 2 NP VP Jack greets Mary really quickly EXPAND

Mehr

Probabilistische kontextfreie Grammatiken

Probabilistische kontextfreie Grammatiken Mathematische Grundlagen III Probabilistische kontextfreie Grammatiken 14 Juni 2011 1/26 Ambiguität beim Parsing Wörter können verschiedene Bedeutungen haben und mehr als einer Wortkategorien angehören

Mehr

Kapitel 5: Syntax-Analyse

Kapitel 5: Syntax-Analyse Kapitel 5: Syntax-Analyse Aufgabe Die Token-Folge wird strukturiert in Anweisungen, Ausdrücke etc., um die Semantische Analyse und Code-Erzeugung zu ermöglichen Themen Kontextfreie Grammatik Äquivalente

Mehr

Lösungen zum Aufgabenblatt 4 Computerlinguistische Anwendungen

Lösungen zum Aufgabenblatt 4 Computerlinguistische Anwendungen Lösungen zum Aufgabenblatt 4 Computerlinguistische Anwendungen Universität München, CIS, SS 2013 Hans Leiß Abgabetermin: Do, 31.5.2013 Aufgabe 4.1 Die Grammatik in Beispiele/programmierer.pl berücksichtigt

Mehr

Einführung in die Computerlinguistik Syntax & Parsing

Einführung in die Computerlinguistik Syntax & Parsing yntax Einführung in die Computerlinguistik yntax & Dozentin: Wiebke Petersen 19.12.2009 Wiebke Petersen Einführung CL (Wie 09/10) 1 yntax yntax συντ αξιζ (syntaxis) Zusammenordnung, Zusammenstellung yntax

Mehr

Einführung in die Computerlinguistik Syntax & Parsing

Einführung in die Computerlinguistik Syntax & Parsing yntax Einführung in die Computerlinguistik yntax & ozentin: Wiebke Petersen 19.12.2009 Wiebke Petersen Einführung CL (Wie 09/10) 1 yntax yntax συντ αξιζ (syntaxis) Zusammenordnung, Zusammenstellung yntax

Mehr

Sprachanalyse. Fachseminar WS 08/09 Dozent: Prof. Dr. Helmut Weber Referentin: Nadia Douiri

Sprachanalyse. Fachseminar WS 08/09 Dozent: Prof. Dr. Helmut Weber Referentin: Nadia Douiri Sprachanalyse WS 08/09 Dozent: Prof. Dr. Helmut Weber Referentin: Inhalt 1. Formale Sprachen 2. Chomsky-Hierarchie 2 FORMALE SPRACHE 1. WAS IST EINE SPRACHE? 2. WIE BESCHREIBT MAN EINE SPRACHE? 3. WAS

Mehr

Grundlagen Theoretischer Informatik 2 WiSe 2011/12 in Trier. Henning Fernau Universität Trier

Grundlagen Theoretischer Informatik 2 WiSe 2011/12 in Trier. Henning Fernau Universität Trier Grundlagen Theoretischer Informatik 2 WiSe 2011/12 in Trier Henning Fernau Universität Trier fernau@uni-trier.de 1 Grundlagen Theoretischer Informatik 2 Gesamtübersicht Organisatorisches; Einführung Ersetzungsverfahren:

Mehr

Idee: Wir definieren: 2.4 Topdown Parsing. uaβ mit

Idee: Wir definieren: 2.4 Topdown Parsing. uaβ mit 2.4 Topdown Parsing Idee: Benutze den Item-Kellerautomaten. Benutze die nächsten k Zeichen, um die Regeln für die Expansionen zu bestimmen ;-) Eine Grammatik heißt LL(k), falls dies immer eindeutig möglich

Mehr

Automaten und Formale Sprachen SoSe 2007 in Trier. Henning Fernau Universität Trier

Automaten und Formale Sprachen SoSe 2007 in Trier. Henning Fernau Universität Trier Automaten und Formale Sprachen SoSe 2007 in Trier Henning Fernau Universität Trier fernau@informatik.uni-trier.de 1 Automaten und Formale Sprachen Gesamtübersicht Organisatorisches Einführung Endliche

Mehr

Formale Methoden III - Tutorium

Formale Methoden III - Tutorium Formale Methoden III - Tutorium Daniel Jettka 08.05.06 Anmeldung im ekvv Inhaltsverzeichnis 1. Aufgaben vom 27.04.06 1.1 Aufgabe 1 1.2 Aufgabe 2 1.3 Aufgabe 3 1.4 Aufgabe 4 1.5 Aufgabe 5 1.6 Aufgabe 6

Mehr

xii Inhaltsverzeichnis Generalisierung Typisierte Merkmalsstrukturen Literaturhinweis

xii Inhaltsverzeichnis Generalisierung Typisierte Merkmalsstrukturen Literaturhinweis Inhaltsverzeichnis 1 Computerlinguistik Was ist das? 1 1.1 Aspekte der Computerlinguistik.................. 1 1.1.1 Computerlinguistik: Die Wissenschaft........... 2 1.1.2 Computerlinguistik und ihre Nachbardisziplinen.....

Mehr

Künstliche Intelligenz

Künstliche Intelligenz Künstliche Intelligenz Prolog - Definite Clause Grammar Claes Neuefeind Sprachliche Informationsverarbeitung Universität zu Köln 25. Januar 2012 Wiederholung: DCGs Parser, Kongruenz, Semantik Praxis Hausaufgaben

Mehr

Einführung in die Computerlinguistik Chomskyhierarchie

Einführung in die Computerlinguistik Chomskyhierarchie Einführung in die Computerlinguistik Chomskyhierarchie Dozentin: Wiebke Petersen 14. Foliensatz Wiebke Petersen Einführung CL 1 Wiederholung: Formale Grammatik Denition Eine formale Grammatik ist ein 4-Tupel

Mehr

Chartparsing & CKY Algorithmus

Chartparsing & CKY Algorithmus Ludwigs Maximiliansuniversität München Centrum für Informations und Sprachverarbeitung Hauptseminar: Parsing Leitung: Prof. Dr. Klaus U. Schulz Sommersemester 2009 Chartparsing & CKY Algorithmus Daniel

Mehr

Syntaktische Analyse. Beschreibungsformalismus

Syntaktische Analyse. Beschreibungsformalismus Syntaktische Analyse Satzbildung durch Wortkomposition Ausgangspunkt für Bedeutungsanalyse (1) Der Hund fraß den Knochen (2) Der Knochen wurde vom Hund gefressen Struktur aus Syntaxregeln hilft der Bedeutungsfindung

Mehr

Einführung in die Computerlinguistik Chomskyhierarchie

Einführung in die Computerlinguistik Chomskyhierarchie Einführung in die Computerlinguistik Chomskyhierarchie Dozentin: Wiebke Petersen 14. Foliensatz Wiebke Petersen Einführung CL 1 Wiederholung: Formale Grammatik Denition Eine formale Grammatik ist ein 4-Tupel

Mehr

Inhaltsverzeichnis. Bibliografische Informationen digitalisiert durch

Inhaltsverzeichnis. Bibliografische Informationen  digitalisiert durch Inhaltsverzeichnis 1 Computerlinguistik - Was ist das? 1 1.1 Aspekte der Computerlinguistik 1 1.1.1 Computer linguistik: Die Wissenschaft 2 1.1.2 Computerlinguistik und ihre Nachbardisziplinen 3 1.1.3

Mehr

Syntax von Programmiersprachen

Syntax von Programmiersprachen Syntax von Programmiersprachen SEP 209 Programmiersprachen Sprache = Menge von Wörtern, typischerweise unendlich Programmiersprache: Wörter repräsentieren Programme Programm kann auf einem Computer evtl.

Mehr

Grundlagen der Theoretischen Informatik

Grundlagen der Theoretischen Informatik Grundlagen der Theoretischen Informatik Sommersemester 2015 22.04.2015 Viorica Sofronie-Stokkermans e-mail: sofronie@uni-koblenz.de 1 Bis jetzt 1. Terminologie 2. Endliche Automaten und reguläre Sprachen

Mehr

Einführung. Vorlesung Grammatikformalismen Alexander Koller. 15. April 2016

Einführung. Vorlesung Grammatikformalismen Alexander Koller. 15. April 2016 Einführung Vorlesung Grammatikformalismen Alexander Koller 15. April 2016 Übersicht Was sind Grammatikformalismen, und warum reichen uns kfgs nicht? Was machen wir in dieser Vorlesung? Prüfungsmodalitäten

Mehr

ADS: Algorithmen und Datenstrukturen 2

ADS: Algorithmen und Datenstrukturen 2 ADS: Algorithmen und Datenstrukturen 2 Teil 10 Prof. Dr. Gerhard Heyer Institut für Informatik Abteilung Automatische Sprachverarbeitung Universität Leipzig 13. Juni 2018 [Letzte Aktualisierung: 12/06/2018,

Mehr

Deterministischer Kellerautomat (DPDA)

Deterministischer Kellerautomat (DPDA) Deterministische Kellerautomaten Deterministischer Kellerautomat (DPDA) Definition Ein Septupel M = (Σ,Γ, Z,δ, z 0,#, F) heißt deterministischer Kellerautomat (kurz DPDA), falls gilt: 1 M = (Σ,Γ, Z,δ,

Mehr

S NP VP. VP.VT NP NP DET.N S NP.VP .NP VP VP.VI NP.DET N .DET N. Aktive Chartanalyse: Übersicht. Syntaxanalyse: Chart-Parsing

S NP VP. VP.VT NP NP DET.N S NP.VP .NP VP VP.VI NP.DET N .DET N. Aktive Chartanalyse: Übersicht. Syntaxanalyse: Chart-Parsing Aktive Chartanalyse: Übersicht Syntaxanalyse: Chart-Parsing Aktive Chart-Analyse Chartanalyse mit Unifikationsgrammatiken Anmerkungen zu weiteren Parsing-Algorithmen Logische Rekonstruktion der aktiven

Mehr

Hallo Welt für Fortgeschrittene

Hallo Welt für Fortgeschrittene Hallo Welt für Fortgeschrittene Parsen Thomas Wehr Informatik 2 Programmiersysteme Martensstraße 3 91058 Erlangen Inhalt Theoretische Grundlagen Grammatiken im Allgemeinen Die Chomsky-Hierarchie Die Chomsky-Normalform

Mehr

Baumadjunktionsgrammatiken

Baumadjunktionsgrammatiken Baumadjunktionsgrammatiken Vorlesung Grammatikformalismen Alexander Koller 22. April 2016 Grammatikformalismen Grammatik- formalismus Grammatik- theorie abstrakt Grammatik prache konkret formal linguistisch

Mehr

Automaten und Formale Sprachen alias Theoretische Informatik. Sommersemester 2011

Automaten und Formale Sprachen alias Theoretische Informatik. Sommersemester 2011 Automaten und Formale Sprachen alias Theoretische Informatik Sommersemester 2011 Dr. Sander Bruggink Übungsleitung: Jan Stückrath Sander Bruggink Automaten und Formale Sprachen 1 Wir beschäftigen uns ab

Mehr

5. Die syntaktische Analyse

5. Die syntaktische Analyse mittels sog. Parser Input: Folge von Token (Symbolen), geliefert vom Scanner/Sieber Aufgabe: Teilfolgen zusammenfassen zu größeren syntaktischen Einheiten Ausdrücke, Anweisungen(-folgen), Deklarationen,

Mehr

Maschinelle Sprachverarbeitung: Probabilistische, kontextfreie Grammatiken

Maschinelle Sprachverarbeitung: Probabilistische, kontextfreie Grammatiken HUMBOLDT-UNIVERSITÄT ZU BERLIN Institut für Informatik Lehrstuhl Wissensmanagement Maschinelle Sprachverarbeitung: Probabilistische, kontextfreie Grammatiken Tobias Scheffer Ulf Brefeld Sprachmodelle N-Gramm-Modell:

Mehr

Merkmalsstrukturen. Merkmalsstrukturen. Merkmalsstrukturen (MS):

Merkmalsstrukturen. Merkmalsstrukturen. Merkmalsstrukturen (MS): (MS): Verbreiteter Formalismus in der Computerlinguistik. Ausführlich untersucht und beschrieben, (zumindest im Kern) auf MS basierende Ansätze: Categorical Unification Grammar [Uszkoreit, 1986] Functional

Mehr

Automaten und Formale Sprachen alias Theoretische Informatik. Sommersemester 2012

Automaten und Formale Sprachen alias Theoretische Informatik. Sommersemester 2012 Automaten und Formale Sprachen alias Theoretische Informatik Sommersemester 2012 Dr. Sander Bruggink Übungsleitung: Jan Stückrath Sander Bruggink Automaten und Formale Sprachen 1 Einschub: Kellerautomaten

Mehr

Künstliche Intelligenz Sprachverarbeitung mit Prolog

Künstliche Intelligenz Sprachverarbeitung mit Prolog Künstliche Intelligenz Sprachverarbeitung mit Prolog Stephan Schwiebert WS 2009/2010 Sprachliche Informationsverarbeitung Institut für Linguistik Universität zu Köln Parsing mit Prolog Grammatik Wortartenklassifikation,

Mehr

Interdisziplinäre fachdidaktische Übung: Modelle für Sprachen in der Informatik. SS 2016: Grossmann, Jenko

Interdisziplinäre fachdidaktische Übung: Modelle für Sprachen in der Informatik. SS 2016: Grossmann, Jenko Interdisziplinäre fachdidaktische Übung: Modelle für Sprachen in der SS 2016: Grossmann, Jenko Die Beschreibung orientiert sich am Begriffssystem der Beschreibung natürlicher Sprachen Sprache in der steht

Mehr

Diplomprüfung Kurs 1699 Automatische Sprachverarbeitung Datum: Prüfer: Prof. Dr. Helbig

Diplomprüfung Kurs 1699 Automatische Sprachverarbeitung Datum: Prüfer: Prof. Dr. Helbig Diplomprüfung Kurs 1699 Automatische Sprachverarbeitung Datum: 16.1.2007 Prüfer: Prof. Dr. Helbig Der Kurs ist wohl aus einem umfassenderen Kurs über Künstliche Intelligenz und automatische Sprachverarbeitung

Mehr

Formale Methoden III - Tutorium

Formale Methoden III - Tutorium Formale Methoden III - Tutorium Daniel Jettka 19.06.06 Inhaltsverzeichnis 1. Logische Eigenschaften von Merkmalsstrukturen 1. Logische Eigenschaften von MS Ausgangspunkt: Unterscheidung von: Linguistische

Mehr

Die Rolle der Grammatik, Ersetzungsregelgrammatiken, und Parsing

Die Rolle der Grammatik, Ersetzungsregelgrammatiken, und Parsing Vorlesung Einführung in die Computerlinguistik Die Rolle der Grammatik, Ersetzungsregelgrammatiken, und Parsing Hans Uszkoreit WHAT HAPPES I BETWEE? WHAT HAPPES I BETWEE? sound waves activation of concepts

Mehr

Neben allgemeinen Programmiertechniken gibt es eine Anzahl von Mšglichkeiten, um Parser zu beschleunigen.

Neben allgemeinen Programmiertechniken gibt es eine Anzahl von Mšglichkeiten, um Parser zu beschleunigen. Schneller Parsen Neben allgemeinen Programmiertechniken gibt es eine Anzahl von Mšglichkeiten, um Parser zu beschleunigen. Theorie und Praxis KomplexitŠtseigenschaften von Parsing-Verfahren Relevanz fÿr

Mehr

Shift-Reduce-Parsing: Ein einfaches Bottom-Up-Verfahren Keller Shift- und Reduce-Schritte Vorgehen des Parsers Implementation in Prolog Probleme

Shift-Reduce-Parsing: Ein einfaches Bottom-Up-Verfahren Keller Shift- und Reduce-Schritte Vorgehen des Parsers Implementation in Prolog Probleme Shift-Reduce-Parsing bersicht Shift-Reduce-Parsing: Ein einfaches Bottom-Up-Verfahren Keller Shift- und Reduce-Schritte Vorgehen des Parsers Implementation in Prolog Probleme Tilgungsregeln Zyklische Regeln

Mehr

Einführung Computerlinguistik. Konstituentensyntax II

Einführung Computerlinguistik. Konstituentensyntax II Einführung Computerlinguistik Konstituentensyntax II Hinrich Schütze & Robert Zangenfeind Centrum für Informations- und Sprachverarbeitung, LMU München 2013-11-18 Schütze & Zangenfeind: Konstituentensyntax

Mehr

Alphabet, formale Sprache

Alphabet, formale Sprache n Alphabet Alphabet, formale Sprache l nichtleere endliche Menge von Zeichen ( Buchstaben, Symbole) n Wort über einem Alphabet l endliche Folge von Buchstaben, die auch leer sein kann ( ε leere Wort) l

Mehr

Grundlagen der Theoretischen Informatik / Einführung in die Theoretische Informatik I

Grundlagen der Theoretischen Informatik / Einführung in die Theoretische Informatik I Vorlesung Grundlagen der Theoretischen Informatik / Einführung in die Theoretische Informatik I Bernhard Beckert Institut für Informatik Sommersemester 2007 B. Beckert Grundlagen d. Theoretischen Informatik:

Mehr

Die vorgestellten Chart-Parser haben bei bestimmten Grammatiken Probleme die Symbole der Grammatik dÿrfen nicht unterspezifiziert sein

Die vorgestellten Chart-Parser haben bei bestimmten Grammatiken Probleme die Symbole der Grammatik dÿrfen nicht unterspezifiziert sein bersicht Die vorgestellten Chart-Parser haben bei bestimmten Grammatiken Probleme die Symbole der Grammatik dÿrfen nicht unterspezifiziert sein OK: Prolog-Atome OK: komplexe Terme, deren Argumente jederzeit

Mehr

Eigenschaften I. Earley-Parsing. Earley-Algorithmus. Eigenschaften II

Eigenschaften I. Earley-Parsing. Earley-Algorithmus. Eigenschaften II Earley-Parsing Eigenschaften I Übersicht Atives Chart-Parsing für ontextfreie Grammatien Eigenschaften von Earleys Verfahren Einzelne Komponenten Initialisierung Predictor Scanner Completer Implementation

Mehr

Automatentheorie und formale Sprachen

Automatentheorie und formale Sprachen Automatentheorie und formale Sprachen Wiebke Petersen Wiebke Petersen Automatentheorie und formale Sprachen - WiSe12/13 1 Seminarplan Lektüre: Theoretische Grundlagen der Informatik, Rolf Socher, 2008

Mehr

Featuregrammatiken. Vorlesung Computerlinguistische Techniken Alexander Koller. 21. November 2014

Featuregrammatiken. Vorlesung Computerlinguistische Techniken Alexander Koller. 21. November 2014 Featuregrammatiken Vorlesung Computerlinguistische Techniken Alexander Koller 21. November 2014 Musterlösung Ü2 A4 Erste 100 Wörter des Brown-Korpus aueben: import nltk words = nltk.corpus.brown.words()

Mehr

Parsing von unifikationsbasierten Grammatikformalismen

Parsing von unifikationsbasierten Grammatikformalismen Parsing von unifikationsbasierten Grammatikformalismen Vorlesung Grammatikformalismen Alexander Koller. Juli 016 Parsing Warum kann man kfgen in polynomieller Zeit parsen, wenn doch jeder Substring exponentiell

Mehr

Formale Sprachen. Inhaltsverzeichnis. M. Jakob. 10. Dezember Allgemeine Einführung. Aufbau formaler Sprachen

Formale Sprachen. Inhaltsverzeichnis. M. Jakob. 10. Dezember Allgemeine Einführung. Aufbau formaler Sprachen M. Jakob Gymnasium Pegnitz 10. Dezember 2014 Inhaltsverzeichnis Allgemeine Einführung Aufbau formaler Sprachen Notationsformen formaler Sprachen Backus-Naur-Formen Erkennen formaler Sprachen Implementierung

Mehr

Karl Heinz Wagner

Karl Heinz Wagner Architektur der LFG Lexikalisch-Funktionale Funktionale-Grammatik Grammatik Erweiterte PG Grammatik Lexikon Lexikonregeln Formaler Aufbau der F Funktionale Beschreibungen Funktionale zur F-trukturF K-trukturen

Mehr

1. Stellen Sie die Konstituentenstruktur der folgenden Sätze als Baumdiagramme dar:

1. Stellen Sie die Konstituentenstruktur der folgenden Sätze als Baumdiagramme dar: 1. Stellen Sie die Konstituentenstruktur der folgenden Sätze als Baumdiagramme dar: 1. Die Überschwemmungen hinterließen ernorme Schäden. 2. Der amtierende Bundeskanzler verzichtet auf eine erneute Kandidatur.

Mehr

Einführung in die Computerlinguistik

Einführung in die Computerlinguistik Einführung in die Computerlinguistik Pumping-Lemma für kontextfreie Sprachen, Abschlußeigenschaften kontextfreier Sprachen und die Komplexität natürlicher Sprachen Dozentin: Wiebke Petersen WS 2004/2005

Mehr

Centrum für Informations- und Sprachverarbeitung Uni München Repetitorium ZP Sommersemester 09. Syntax. Alla Shashkina

Centrum für Informations- und Sprachverarbeitung Uni München Repetitorium ZP Sommersemester 09. Syntax. Alla Shashkina Syntax Alla Shashkina Was ist Syntax? Satzlehre System von Regeln, die beschreiben, wie aus einem Inventar von Grundelementen (Morphemen, Wörtern, Satzgliedern) durch spezifische syntaktische Mittel (Morphologische

Mehr

Inkrementelle Syntax

Inkrementelle Syntax Inkrementelle Syntax CFG und inkrementelles Parsing Timm Lichte HHU Düsseldorf, Germany 30.10.2013 SFB 991 1 / 24 Aus der letzten Sitzung inkrementelle Syntax Mechanismen bzw. Komponenten eines Grammatikformalismus,

Mehr

Lösungen zum Aufgabenblatt 9 Symbolisches Programmieren

Lösungen zum Aufgabenblatt 9 Symbolisches Programmieren Lösungen zum Aufgabenblatt 9 Symbolisches Programmieren WS 2012/13 H.Leiß, CIS, Universität München Aufgabe 9.1 Wir beginnen mit der einfachen DCG-Grammatik: % --------------- Grammatik-1 ---------------------

Mehr

Syntax natürlicher Sprachen

Syntax natürlicher Sprachen Syntax natürlicher Sprachen 02: Grammatik und Bäume Martin Schmitt Ludwig-Maximilians-Universität München 25.10.2017 Martin Schmitt (LMU) Syntax natürlicher Sprachen 25.10.2017 1 1 Syntax im NLTK 2 Grammatik

Mehr