Parsing von unifikationsbasierten Grammatikformalismen

Größe: px
Ab Seite anzeigen:

Download "Parsing von unifikationsbasierten Grammatikformalismen"

Transkript

1 Parsing von unifikationsbasierten Grammatikformalismen Vorlesung Grammatikformalismen Alexander Koller. Juli 016

2 Parsing Warum kann man kfgen in polynomieller Zeit parsen, wenn doch jeder Substring exponentiell viele Parsebäume haben kann? A A A A A A A A A A a a a a a a

3 Parsing Zwei Analysen für den gleichen Substring heißen äquivalent, wenn man die gleichen Parse-Regeln darauf anwenden kann. Es reicht grundsätzlich, von mehreren äquivalenten Analysen nur die erste in die Chart einzutragen. Kontextfreies Parsing: Teilbäume sind äquivalent, wenn gleiches Wurzelsymbol. Deshalb reicht es, in Chart nur Wurzelsymbol einzutragen; repräsentiert ganze Äquivalenzklasse von Teilbäumen. Daher Parsing in Polynomzeit (vgl. aber CCG).

4 isst ein Käsebrot Chartparsing in HPSG isst ein Käsebrot

5 Chartparsing in HPSG isst ein Käsebrot word phon isst 6synsem loc cat cat head 6 subcat verb h i num sg h i h i NP nom,npacc 7 7 isst ein Käsebrot

6 Chartparsing in HPSG isst ein Käsebrot phon isst 6synsem loc cat head 6 subcat verb h i num sg h i h i NP nom,npacc 7 7 phon 6synsem loc cat head-arg-phr cat ein Käsebrot " gend head 6 num noun subcat hi # neut sg 7 7 word cat isst ein Käsebrot

7 Chartparsing in HPSG isst ein Käsebrot head-arg-phr phon synsem loc cat head-dtr 6 non-head-dtrs cat word phon isst 6synsem loc cat isst ein Käsebrot 6 head 1 h i 7 subcat NP nom phon 6synsem loc cat D... E head 6 subcat cat verb isst h head 1 num verb 6 h subcat NP nom i sg i h,np i acc h i num sg h i h i NP nom,npacc phon 6synsem loc cat head-arg-phr cat ein Käsebrot " gend head 6 num noun subcat hi # neut sg 7 7 word cat isst ein Käsebrot

8 Äquivalenz in HPSG Eintrag in Chart = FS + Span. Schema-Anwendung: muss Schema mit Töchtern unifizieren Was für FSen zählen in HPSG als äquivalent? Je mehr FSen als äquivalent gelten, desto schneller das Parsing. Wenn Unterscheidung zwischen zwei FSen wichtig für Weiterverarbeitung ist, dürfen sie nicht äquivalent sein. Grundsätzlich erlaubt jede FS andere Kombinationen als jede andere. Zunächst also keine FS mit einer anderen äquivalent. weil Schemata in beliebig tiefe Pfade schauen können.

9 Ansatz 1: Effizientere Unifikation HPSG-Parser verbringt allergrößten Teil der Zeit mit Unifizieren von FSen. Schneller Unif.algorithmus = schneller Parser. Bestimmte Unifikationen vorkompilieren. insbesondere Konjunktion von Typen: z.b. Kopfmerkmalsprinzip mit Head-Arg-Schema. Nicht-Unifizierbarkeit früh erkennen; Kopieren vermeiden. (Karttunen & Kay 8; Pereira 8; Wroblewski 87; Tomabechi 9; etc. etc)

10 Evaluation copying Unifier tcpu space over early redundant (s) (s) (kb) (nodes) (nodes) (nodes) (nodes) quick check on off on on/off on off on/off unify , unify , unify , tomabechi ,1 8.6 tom-smart ,17 (Callmeier 000; englisches Verbmobil-Testset mit LinGO-Grammatik; gemessen auf 00 MHz Pentium III)

11 Ansatz : Ambiguitäten packen Unter bestimmten Umständen kann man zwei FSen als äquivalent gelten lassen. wenn Parser (i,k,σ) kannte und (i,k,τ) findet und τ σ (d.h. ist allgemeiner), dann darf er (i,k,σ) löschen. Neuer Äquivalenzbegriff Chart bleibt kleiner Parsing wird schneller. Löschen von Einträgen, die aus (i,k,σ) abgeleitet wurden, ist nicht trivial. (Oepen & Carroll 00 etc.)

12 Chartgröße Evaluation Satzlänge Satzlänge (Oepen & Carroll 000; englisches Verbmobil-Testset mit LinGO-Grammatik)

13 Ansatz : Approximation HPSG-Schemata definieren Phrasenstruktur. Kann man mit kfg approximieren. [cat=v, subcat=<npnom>] [cat=v, subcat=<npnom, NPacc>] [cat=n, subcat=<>] Mit (statistischer) kfg parsen; dann versuchen, beste Parsebäume in HPSG-Parses zu expandieren. (Kann fehlschlagen!) Unifikationen nur für Strukturen ausführen, die überhaupt eine Chance haben. (Kiefer & Krieger 00; Zhang & Krieger 11; etc.)

14 Polynomial Time (Practical) Parsing (s) 6 gready best-first selective unpacking exhaustive unpacking forest creation 1 0 (generated by [incr tsdb()] at -mar-007 (1: h)) 1 String Length (Number of Input Tokens) Average Time for 0-Word Sentences around One Second potsdam 8-jan-1 (oe@ifi.uio.no) Packing and Unpacking in HPSG-Based Parsing (0)

15 Stand der Kunst LKB: Grammatikentwicklungssystem. verwendet Type Description Language (TDL), um Grammatiken aufzuschreiben TDL-Grammatiken kann man effizient mit dem PET-Parser verarbeiten. LKB + PET + andere = DELPH-IN DELPH-IN ist internationales Konsortium, das zueinander kompatible Parser, Grammatiken etc. entwickelt:

16 Zusammenfassung Expressivität: turing-vollständig. Parsing: wird durch FS schwerer. verschiedene Ansätze zur Verbesserung aktuelle Software funktioniert sehr gut

Kontextfreie Grammatiken

Kontextfreie Grammatiken Kontextfreie Grammatiken Vorlesung Computerlinguistische Techniken Alexander Koller 16. Oktober 2015 Übersicht Worum geht es in dieser Vorlesung? Übungen und Abschlussprojekt Kontextfreie Grammatiken Computerlinguistische

Mehr

Einführung. Vorlesung Grammatikformalismen Alexander Koller. 15. April 2016

Einführung. Vorlesung Grammatikformalismen Alexander Koller. 15. April 2016 Einführung Vorlesung Grammatikformalismen Alexander Koller 15. April 2016 Übersicht Was sind Grammatikformalismen, und warum reichen uns kfgs nicht? Was machen wir in dieser Vorlesung? Prüfungsmodalitäten

Mehr

Schwach kontextsensitive Grammatikformalismen

Schwach kontextsensitive Grammatikformalismen chwach kontextsensitive Grammatikformalismen! Vorlesung Grammatikformalismen Alexander Koller! 2. Juni 2015 Grammatikformalismen Parsingkomplexität O(n) O(n 3 ) polynomiell exponentiell PPACE-vollst. unentscheidbar

Mehr

Baumadjunktionsgrammatiken

Baumadjunktionsgrammatiken Baumadjunktionsgrammatiken Vorlesung Grammatikformalismen Alexander Koller 22. April 2016 Grammatikformalismen Grammatik- formalismus Grammatik- theorie abstrakt Grammatik prache konkret formal linguistisch

Mehr

Einführung in unifikationsbasierte Grammatikformalismen

Einführung in unifikationsbasierte Grammatikformalismen Universität Potsdam Institut für Linguistik Computerlinguistik Einführung in unifikationsbasierte Grammatikformalismen Thomas Hanneforth head: VP form: finite subj: pers: 3 num: pl Merkmalsstrukturen:

Mehr

Practical Grammar Engineering Using HPSG. Frederik Fouvry, Petter Haugereid, Valia Kordoni, Melanie Siegel

Practical Grammar Engineering Using HPSG. Frederik Fouvry, Petter Haugereid, Valia Kordoni, Melanie Siegel Practical Grammar Engineering Using HPSG Frederik Fouvry, Petter Haugereid, Valia Kordoni, Melanie Siegel Inhalt Organisatorisches HPSG Grammatiken Werkzeuge Kodierungen TDL Syntax Über dieses Seminar

Mehr

Einführung in die Computerlinguistik

Einführung in die Computerlinguistik Einführung in die Computerlinguistik Merkmalstrukturen und Unifikation Dozentin: Wiebke Petersen WS 2004/2005 Wiebke Petersen Formale Komplexität natürlicher Sprachen WS 03/04 Universität Potsdam Institut

Mehr

Merkmalsstrukturen. Merkmalsstrukturen. Merkmalsstrukturen (MS):

Merkmalsstrukturen. Merkmalsstrukturen. Merkmalsstrukturen (MS): (MS): Verbreiteter Formalismus in der Computerlinguistik. Ausführlich untersucht und beschrieben, (zumindest im Kern) auf MS basierende Ansätze: Categorical Unification Grammar [Uszkoreit, 1986] Functional

Mehr

Practical Grammar Engineering Using HPSG 2.Tag. Frederik Fouvry, Petter Haugereid, Valia Kordoni, Melanie Siegel

Practical Grammar Engineering Using HPSG 2.Tag. Frederik Fouvry, Petter Haugereid, Valia Kordoni, Melanie Siegel Practical Grammar Engineering Using HPSG 2.Tag Frederik Fouvry, Petter Haugereid, Valia Kordoni, Melanie Siegel Inhalt Matrix Differenzlisten Debugging (Demo, Frederik) Die LinGO Grammar Matrix Ein Nachteil

Mehr

Was machen wir in diesem Kurs? Einführung in die Grammatikentwicklung. Head-Driven Phrase Structure Grammar (Hintergrund)

Was machen wir in diesem Kurs? Einführung in die Grammatikentwicklung. Head-Driven Phrase Structure Grammar (Hintergrund) Einführung in die Grammatikentwicklung Stefan Müller Was machen wir in diesem Kurs? Kennelernen eines Grammatikentwicklungssystems Lernen, wie man Grammatiken mit getypten Merkmalsbeschreibungen formalisiert

Mehr

Programmierkurs Python II

Programmierkurs Python II Programmierkurs Python II Michaela Regneri & Stefan Thater FR 4.7 Allgemeine Linguistik (Computerlinguistik) Universität des Saarlandes Sommersemester 2011 Prüfungsleistungen Klausur am Semesterende -

Mehr

Stefan Müllers HPSG-Grammatik für das Deutsche:

Stefan Müllers HPSG-Grammatik für das Deutsche: Seminararbeit Stefan Müllers HPSG-Grammatik für das Deutsche: Grundbegriffe, Dominanzstrukturen, Konstituentenreihenfolge Thema und Zeitpunkt des Seminars: Syntaxtheorien und computerlinguistische Praxis

Mehr

Mathematische Grundlagen der Computerlinguistik III: Statistische Methoden Probeklausur

Mathematische Grundlagen der Computerlinguistik III: Statistische Methoden Probeklausur Mathematische Grundlagen der Computerlinguistik III: Statistische Methoden Probeklausur Crocker/Demberg/Staudte Sommersemester 2014 17.07.2014 1. Sie haben 90 Minuten Zeit zur Bearbeitung der Aufgaben.

Mehr

1 Einführung. 2 Typ-0- und Typ-1-Sprachen. 3 Berechnungsmodelle. 4 Unentscheidbarkeit. 5 Unentscheidbare Probleme. 6 Komplexitätstheorie

1 Einführung. 2 Typ-0- und Typ-1-Sprachen. 3 Berechnungsmodelle. 4 Unentscheidbarkeit. 5 Unentscheidbare Probleme. 6 Komplexitätstheorie 1 Einführung 2 Typ-0- und Typ-1-Sprachen 3 Berechnungsmodelle 4 Unentscheidbarkeit 5 Unentscheidbare Probleme 6 Komplexitätstheorie 139 Unentscheidbarkeit Überblick Zunächst einmal definieren wir formal

Mehr

Ausgewählte Techniken der Maschinellen Übersetzung. Susanne J. Jekat ZHW Subject: MTZH

Ausgewählte Techniken der Maschinellen Übersetzung. Susanne J. Jekat ZHW   Subject: MTZH Ausgewählte Techniken der Maschinellen Übersetzung Susanne J. Jekat ZHW E-mail: jes@zhwin.ch, Subject: MTZH Übersicht Themenbereiche: 1. Erstellung und Standardisierung von Ressourcen für die Maschinelle

Mehr

Die Idee... Analyse geschriebener Texte. Gliederung. Analyse-Ebenen von Sprache. Lexikalische Ebene. Morphologische Ebene

Die Idee... Analyse geschriebener Texte. Gliederung. Analyse-Ebenen von Sprache. Lexikalische Ebene. Morphologische Ebene Die Idee... Analyse geschriebener Texte Joachim Pfister Hans Kenn! Eine Sprache hat unendliche viele Möglichkeiten, Sätze zu bilden und Wörter anzuordnen.! Nur: Welche davon werden als grammatikalisch

Mehr

vowel Ausschluss unbeabsichtigter Unifikationsresultate gen neutr Effektivierung

vowel Ausschluss unbeabsichtigter Unifikationsresultate gen neutr Effektivierung Sprachorientierte KI: Syntax und Parsing Syntax als Untersuchungsgegenstand Wortartendisambiguierung Phrasenstrukturgrammatiken Parsing mit Phrasenstrukturgrammatiken Restringierte Phrasenstrukturgrammatiken

Mehr

Lexikalisch-Funktionale Grammatik (LFG)

Lexikalisch-Funktionale Grammatik (LFG) Lexkalsch-Funktonale Grammatk (LFG) Vorlesung Grammatkformalsmen Alexander Koller. Jun 01 Zweck ener Grammatk Verbndung von Wortstellung und Valenz. Wortstellung: lneare Abfolge der Wörter m Satz; (je

Mehr

Karl Heinz Wagner

Karl Heinz Wagner PATR II Funktionale Beschreibungen Der PATR II Formalismus Auch für PATR II gilt Sprachliche Ausdrücke werden durch funktionale Beschreibungen oder Deskriptionen (engl. functional descriptions,, FD beschrieben

Mehr

Übersicht. (A) Kontextfreie Sprachen (B) Syntaxanalyse (Parsing) (C) Grenzen der Kontextfreiheit

Übersicht. (A) Kontextfreie Sprachen (B) Syntaxanalyse (Parsing) (C) Grenzen der Kontextfreiheit Übersicht (A) Kontextfreie Sprachen (B) Syntaxanalyse (Parsing) (C) Grenzen der Kontextfreiheit (B) Syntaxanalyse 1. Definition Parsing 2. Einfache Parsestrategien: Top-down Bottom-Up Probleme beim Parsen

Mehr

Einführung in die Computerlinguistik Chart-Parsing

Einführung in die Computerlinguistik Chart-Parsing Einführung in die Computerlinguistik Chart-Parsing Dozentin: Wiebke sen 21.12.2009 Wiebke sen Einführung CL (Wie 09/10) 1 P = calls calls Wiebke sen Einführung CL (Wie 09/10) 2 P = calls calls Wiebke sen

Mehr

Übungsaufgaben. Eine kontextfreie Grammatik lässt sich formal als Quadrupel darstellen: D : der, das N : Hund, Kaninchen V : sieht, beißt

Übungsaufgaben. Eine kontextfreie Grammatik lässt sich formal als Quadrupel darstellen: D : der, das N : Hund, Kaninchen V : sieht, beißt Universität Bielefeld 25. Juni 2006 Fakultät für Linguistik und Literaturwissenschaft Formale Methoden der Linguistik III Veranstalter: Dieter Metzing Sommersemester 2006 Übungsaufgaben 1. (a) Welche Bestandteile

Mehr

1 Einführung. 2 Typ-0- und Typ-1-Sprachen. 3 Berechnungsmodelle. 4 Unentscheidbarkeit. 5 Unentscheidbare Probleme. 6 Komplexitätstheorie

1 Einführung. 2 Typ-0- und Typ-1-Sprachen. 3 Berechnungsmodelle. 4 Unentscheidbarkeit. 5 Unentscheidbare Probleme. 6 Komplexitätstheorie 1 Einführung 2 Typ-0- und Typ-1-Sprachen 3 Berechnungsmodelle 4 Unentscheidbarkeit 5 Unentscheidbare Probleme 6 Komplexitätstheorie WS 11/12 155 Überblick Zunächst einmal definieren wir formal den Begriff

Mehr

LFG-basierter Transfer

LFG-basierter Transfer Inhaltsverzeichnis 1 2 2 Ein Beispiel 4 3 Strukturaufbau 7 4 Alternative Übersetzungen 8 5 Adjunkte 9 6 Kodeskription 10 http://www.ims.uni-stuttgart.de/ gojunaa/mue_tut.html 1 1 Um einen quellsprachlichen

Mehr

VU Software Paradigmen / SS 2014

VU Software Paradigmen / SS 2014 VU Software Paradigmen 716.060 / SS 2014 Thorsten Ruprechter ruprechter@tugraz.at Institute for Software Technology 1 Organisatorisches Ausgabe: 25.03. (heute) Fragestunde: 22.04. Abgabe: 29.04 (ausgedruckt)

Mehr

Informatik III. Christian Schindelhauer Wintersemester 2006/07 5. Vorlesung

Informatik III. Christian Schindelhauer Wintersemester 2006/07 5. Vorlesung Informatik III Christian Schindelhauer Wintersemester 2006/07 5. Vorlesung 09.11.2006 schindel@informatik.uni-freiburg.de 1 Äquivalenzklassen Definition und Beispiel Definition Für eine Sprache L Σ* bezeichnen

Mehr

Automaten und formale Sprachen. Lösungen zu den Übungsblättern

Automaten und formale Sprachen. Lösungen zu den Übungsblättern Automaten und formale Sprachen zu den Übungsblättern Übungsblatt Aufgabe. (Sipser, exercise.3) M = ({q, q2, q3, q4, q5}, {u, d}, δ, q3, {q3}) δ: u d q q q 2 q 2 q q 3 q 3 q 2 q 4 q 4 q 3 q 5 q 5 q 4 q

Mehr

Einführung Computerlinguistik. Konstituentensyntax II

Einführung Computerlinguistik. Konstituentensyntax II Einführung Computerlinguistik Konstituentensyntax II Hinrich Schütze & Robert Zangenfeind Centrum für Informations- und Sprachverarbeitung, LMU München 2013-11-18 Schütze & Zangenfeind: Konstituentensyntax

Mehr

Chart-Parsing. bersicht. Ziel. Motivation: Bisher vorgestellte Verfahren sind nicht effizient Grundidee des Chart-Parsing Datenstruktur

Chart-Parsing. bersicht. Ziel. Motivation: Bisher vorgestellte Verfahren sind nicht effizient Grundidee des Chart-Parsing Datenstruktur Chart-Parsing bersicht Ziel Motivation: Bisher vorgestellte Verfahren sind nicht effizient Grundidee des Chart-Parsing Datenstruktur Knoten passive und aktive Kanten gepunktete Regeln (dotted rules) Fundamentalregel

Mehr

Einführung in Berechenbarkeit, Formale Sprachen und Komplexitätstheorie

Einführung in Berechenbarkeit, Formale Sprachen und Komplexitätstheorie Einführung in Berechenbarkeit, Formale Sprachen und Komplexitätstheorie Wintersemester 2005/2006 07.11.2005 5. Vorlesung 1 Überblick: Kontextfreie Sprachen Formale Grammatik Einführung, Beispiele Formale

Mehr

Spezielle Themen der KI. NLP Natural Language Processing Parsing

Spezielle Themen der KI. NLP Natural Language Processing Parsing Spezielle Themen der KI NLP Natural Language Processing Parsing Parsing Strategien top-down: Ausgehend von S Hypothesenbildung und Verifikation anhand der Grammatikregeln Ersetzung nicht-terminaler Symbole

Mehr

Informatik III. Christian Schindelhauer Wintersemester 2006/07 6. Vorlesung

Informatik III. Christian Schindelhauer Wintersemester 2006/07 6. Vorlesung Informatik III Christian Schindelhauer Wintersemester 2006/07 6. Vorlesung 10.11.2006 schindel@informatik.uni-freiburg.de 1 Kapitel IV Kontextfreie Sprachen Kontextfreie Grammatik Informatik III 6. Vorlesung

Mehr

Grundlagen der LFG. (1) I danced a dance, I sneezed a sneeze, I laughed a laugh I stumbled a stumble, *I drowned a drown, *I floated a float

Grundlagen der LFG. (1) I danced a dance, I sneezed a sneeze, I laughed a laugh I stumbled a stumble, *I drowned a drown, *I floated a float Lösung 2 Grundlagen der LFG Einführung in die LFG Sommersemester 2010 Universität Konstanz Miriam Butt 1 Linking 1.1 Intransitive Verben Englisch Agentive Verbs: sneeze, swim, laugh, sleep Non-agentive

Mehr

Softwareprojektpraktikum Maschinelle Übersetzung

Softwareprojektpraktikum Maschinelle Übersetzung Softwareprojektpraktikum Maschinelle Übersetzung Jan-Thorsten Peter, Andreas Guta, Jan Rosendahl max.bleu@i6.informatik.rwth-aachen.de 5. Mai 2017 Human Language Technology and Pattern Recognition Lehrstuhl

Mehr

Lexikalisch-Funktionale Grammatik (LFG), Teil 2

Lexikalisch-Funktionale Grammatik (LFG), Teil 2 exiklisch-funktionle Grmmtik (FG), Teil 2 Vorlesung Grmmtikformlismen lexnder Koller 23. Juni 2016 Beispiel VP NP NP V Det N Hns isst ein Käsebrot. c-truktur 2 pred essen " pred subj 1 num 2 pred 6 obj

Mehr

Automatentheorie und formale Sprachen reguläre Ausdrücke

Automatentheorie und formale Sprachen reguläre Ausdrücke Automatentheorie und formale Sprachen reguläre Ausdrücke Dozentin: Wiebke Petersen 6.5.2009 Wiebke Petersen Automatentheorie und formale Sprachen - SoSe09 1 Formal language Denition A formal language L

Mehr

Teil 111. Chart-Parsing

Teil 111. Chart-Parsing Teil 111 Chart-Parsing 102 Die im ersten Teil des Buches behandelten einfachen Parsingalgorithmen sind, anders als die meisten vor allem im Compilerbau verwendeten Algorithmen (z.b. die LLoder LR-Parsingalgorithmen),

Mehr

Complexity in grammar

Complexity in grammar Complexity in grammar Formale Komplexitätsbegriffe Timm Lichte HHU Düsseldorf WS 2015/2016, 28.10.2015 SFB 991 Komplexität? Vielschichtigkeit, Schwierigkeit Effizienz, Ökonomie, Sparsamkeit Komplexitäten!

Mehr

Hidden Markov Models. Vorlesung Computerlinguistische Techniken Alexander Koller. 8. Dezember 2014

Hidden Markov Models. Vorlesung Computerlinguistische Techniken Alexander Koller. 8. Dezember 2014 idden Markov Models Vorlesung omputerlinguistische Techniken Alexander Koller 8. Dezember 04 n-gramm-modelle Ein n-gramm ist ein n-tupel von Wörtern. -Gramme heißen auch Unigramme; -Gramme Bigramme; -Gramme

Mehr

Einführung in die Theoretische Informatik

Einführung in die Theoretische Informatik Einführung in die Theoretische Informatik Woche 7 Harald Zankl Institut für Informatik @ UIBK Wintersemester 2014/2015 Zusammenfassung Zusammenfassung der letzten LV 1 Wir betrachten die folgende Signatur

Mehr

12. LA- und PS-Hierarchien im Vergleich

12. LA- und PS-Hierarchien im Vergleich Kapitel 12: LA- und PS-Hierarchien im Vergleich 210 12 LA- und PS-Hierarchien im Vergleich 121 Sprachklassen der LA- und PS-Grammatik 1211 Komplexitätsklassen der LA- und PS-Hierarchie LA-Grammatik PS-Grammatik

Mehr

Linux I II III Res WN/TT NLTK BNC/XML XLE I XLE. Nicolas Bellm. 3. April 2008

Linux I II III Res WN/TT NLTK BNC/XML XLE I XLE. Nicolas Bellm. 3. April 2008 Linux I II III Res WN/TT NLTK BNC/XML I 3. April 2008 Inhalt Linux I II III Res WN/TT NLTK BNC/XML I 8 I Vorbereitung Grammatik I Grammatik II Parsen Dateien Linux I II III Res WN/TT NLTK BNC/XML I Vorbereitung

Mehr

Von der Grammatik zum AST

Von der Grammatik zum AST Von der Grammatik zum AST Welche Eigenschaften soll ein Parser haben? Wann ist eine Grammatik eindeutig? Wie sollte eine Grammatik aussehen? Theoretischer Hin tergrund: FIRST, FOLLOW Einschränkungen von

Mehr

Slot Grammar Eine Einführung

Slot Grammar Eine Einführung Slot Grammar Eine Einführung München, 4. Dez. 2002 Gerhard Rolletschek gerhard@cis.uni-muenchen.de 1 ! Entstehungskontext Übersicht! Elemente der Slot Grammar (Was ist ein Slot?)! Complement Slots vs.

Mehr

2. Überlegen Sie, ob folgende Sprache vom gleichen Typ sind (m, n 1): Ordnen Sie die Sprachen jeweils auf der Chomsky-Hierarchie ein.

2. Überlegen Sie, ob folgende Sprache vom gleichen Typ sind (m, n 1): Ordnen Sie die Sprachen jeweils auf der Chomsky-Hierarchie ein. Musterlösung Übung 1 Formale Grammatiken 1. Schreiben Sie eine Grammatik für die Sprache a m b c n d m (m, n 1). Ordnen Sie die Sprache auf der Chomsky-Hierarchie ein und begründen Sie, warum (a) eine

Mehr

Finite-State-Morphologie in XLE. Grammatikentwicklung, SS 2010

Finite-State-Morphologie in XLE. Grammatikentwicklung, SS 2010 Finite-State-Morphologie in XLE Grammatikentwicklung, SS 2010 1 / 20 Worum es heute geht: Nutzen von Finite-State-Morphologien... und wie man sie in XLE einbaut 2 / 20 Lexikon in XLE Bis jetzt: so genanntes

Mehr

NLP Eigenschaften von Text

NLP Eigenschaften von Text NLP Eigenschaften von Text Dr. Andreas Hotho Dominik Benz Beate Krause Sommersemester 2008 Folie: 1 Übersicht Einführung Eigenschaften von Text Words I: Satzgrenzenerkennung, Tokenization, Kollokationen

Mehr

Einführung Computerlinguistik. Konstituentensyntax II

Einführung Computerlinguistik. Konstituentensyntax II Einführung Computerlinguistik Konstituentensyntax II Hinrich Schütze & Robert Zangenfeind Centrum für Informations- und Sprachverarbeitung, LMU München 2013-11-18 1 / 31 Take-away Phrasenstrukturgrammatik:

Mehr

Die vorgestellten Chart-Parser haben bei bestimmten Grammatiken Probleme die Symbole der Grammatik dÿrfen nicht unterspezifiziert sein

Die vorgestellten Chart-Parser haben bei bestimmten Grammatiken Probleme die Symbole der Grammatik dÿrfen nicht unterspezifiziert sein bersicht Die vorgestellten Chart-Parser haben bei bestimmten Grammatiken Probleme die Symbole der Grammatik dÿrfen nicht unterspezifiziert sein OK: Prolog-Atome OK: komplexe Terme, deren Argumente jederzeit

Mehr

Formale Sprachen. Grammatiken und die Chomsky-Hierarchie. Rudolf FREUND, Marian KOGLER

Formale Sprachen. Grammatiken und die Chomsky-Hierarchie. Rudolf FREUND, Marian KOGLER Formale Sprachen Grammatiken und die Chomsky-Hierarchie Rudolf FREUND, Marian KOGLER Grammatiken Das fundamentale Modell zur Beschreibung von formalen Sprachen durch Erzeugungsmechanismen sind Grammatiken.

Mehr

Probabilistische kontextfreie Grammatiken

Probabilistische kontextfreie Grammatiken Mathematische Grundlagen III Probabilistische kontextfreie Grammatiken 14 Juni 2011 1/26 Ambiguität beim Parsing Wörter können verschiedene Bedeutungen haben und mehr als einer Wortkategorien angehören

Mehr

3 Syntax von Programmiersprachen

3 Syntax von Programmiersprachen 3 Syntax von Programmiersprachen Syntax ( Lehre vom Satzbau ) formale Beschreibung des Aufbaus der Worte und Sätze, die zu einer Sprache gehören; im Falle einer Programmiersprache Festlegung, wie Programme

Mehr

FORMALE SYSTEME. 10. Vorlesung: Grenzen regulärer Sprachen / Probleme für Automaten. TU Dresden, 14. November 2016.

FORMALE SYSTEME. 10. Vorlesung: Grenzen regulärer Sprachen / Probleme für Automaten. TU Dresden, 14. November 2016. FORMALE SYSTEME 10. Vorlesung: Grenzen regulärer Sprachen / Probleme für Automaten Markus Krötzsch TU Dresden, 14. November 2016 Rückblick Markus Krötzsch, 14. November 2016 Formale Systeme Folie 2 von

Mehr

Grundlagen der Theoretischen Informatik

Grundlagen der Theoretischen Informatik Grundlagen der Theoretischen Informatik Sommersemester 2015 29.04.2015 Viorica Sofronie-Stokkermans e-mail: sofronie@uni-koblenz.de 1 Bis jetzt 1. Motivation 2. Terminologie 3. Endliche Automaten und reguläre

Mehr

Automatische Deduktion

Automatische Deduktion Automatische Deduktion Prof. Dr Manfred Schmidt-Schauß titleslide Kompression und Algorithmen auf komprimierten Termen Sommersemester 2017 Kompression: Algorithmen Grammatik-basierte Kompression von Strings

Mehr

Theoretische Grundlagen der Informatik

Theoretische Grundlagen der Informatik Theoretische Grundlagen der Informatik Vorlesung am 15.01.2015 INSTITUT FÜR THEORETISCHE 0 KIT 15.01.2015 Universität des Dorothea Landes Baden-Württemberg Wagner - Theoretische und Grundlagen der Informatik

Mehr

Probeklausur: Einführung in die formale Grammatiktheorie

Probeklausur: Einführung in die formale Grammatiktheorie Probeklausur: Einführung in die formale Grammatiktheorie Prof. Dr. Stefan Müller Deutsche Grammatik Freie Universität Berlin Stefan.Mueller@fu-berlin.de 16. Juli 2016 Name und Vorname: Matrikelnummer:

Mehr

Theorie der Informatik. Theorie der Informatik. 6.1 Einführung. 6.2 Alphabete und formale Sprachen. 6.3 Grammatiken. 6.4 Chomsky-Hierarchie

Theorie der Informatik. Theorie der Informatik. 6.1 Einführung. 6.2 Alphabete und formale Sprachen. 6.3 Grammatiken. 6.4 Chomsky-Hierarchie Theorie der Informatik 17. März 2014 6. Formale Sprachen und Grammatiken Theorie der Informatik 6. Formale Sprachen und Grammatiken Malte Helmert Gabriele Röger Universität Basel 17. März 2014 6.1 Einführung

Mehr

Theoretische Informatik 1

Theoretische Informatik 1 Theoretische Informatik 1 Die Komplexitätsklasse P David Kappel Institut für Grundlagen der Informationsverarbeitung TU Graz SS 2012 Übersicht Äquivalenz von RM und TM Äquivalenz, Sätze Simulation DTM

Mehr

Kontextsensitive Sprachen

Kontextsensitive Sprachen Kontextsensitive Sprachen Standardbeispiel: {anbncn} S a b c S a A b B c c B A B b c B b b A A b a A a a Im Bereich der natürlichen Sprachen gibt es zahlreiche kontextsensitive Phänomene in der Semantik

Mehr

Syntax von Programmiersprachen

Syntax von Programmiersprachen Syntax von Programmiersprachen SEP 209 Programmiersprachen Sprache = Menge von Wörtern, typischerweise unendlich Programmiersprache: Wörter repräsentieren Programme Programm kann auf einem Computer evtl.

Mehr

Einführung in die Computerlinguistik

Einführung in die Computerlinguistik Einführung in die Computerlinguistik Syntax: Merkmalsstrukturen WS 2014/2015 Vera Demberg Eigenschaften der syntaktischen Struktur [1] Er hat die Übungen gemacht. Der Student hat die Übungen gemacht. Der

Mehr

Syntax von Programmiersprachen

Syntax von Programmiersprachen "Grammatik, die sogar Könige zu kontrollieren weiß... aus Molière, Les Femmes Savantes (1672), 2. Akt Syntax von Programmiersprachen Prof. Dr. Christian Böhm in Zusammenarbeit mit Gefei Zhang WS 07/08

Mehr

Aufgabe Mögliche Punkte Erreichte Punkte a b c d Σ a b c d Σ x1 13

Aufgabe Mögliche Punkte Erreichte Punkte a b c d Σ a b c d Σ x1 13 Universität Karlsruhe Theoretische Informatik Fakultät für Informatik WS 2003/04 ILKD Prof. Dr. D. Wagner 14. April 2004 2. Klausur zur Vorlesung Informatik III Wintersemester 2003/2004 Hier Aufkleber

Mehr

Zusammenfassung. Beispiel. 1 Wir betrachten die folgende Signatur F = {,, +, 0, 1} sodass. 3 Wir betrachten die Identitäten E. 4 Dann gilt E 1 + x = 1

Zusammenfassung. Beispiel. 1 Wir betrachten die folgende Signatur F = {,, +, 0, 1} sodass. 3 Wir betrachten die Identitäten E. 4 Dann gilt E 1 + x = 1 Zusammenfassung Zusammenfassung der letzten LVA Einführung in die Theoretische Informatik Christina Kohl Alexander Maringele eorg Moser Michael Schaper Institut für Informatik @ UIBK Wintersemester 2016

Mehr

Kapitel 5: Syntax-Analyse

Kapitel 5: Syntax-Analyse Kapitel 5: Syntax-Analyse Aufgabe Die Token-Folge wird strukturiert in Anweisungen, Ausdrücke etc., um die Semantische Analyse und Code-Erzeugung zu ermöglichen Themen Kontextfreie Grammatik Äquivalente

Mehr

VU Software Paradigmen / SS 2012

VU Software Paradigmen / SS 2012 VU Software Paradigmen 716.060 / SS 2012 Sandra Fruhmann sandra.fruhmann@student.tugraz.at Inhalt Grammatiken Chomsky Sprachhierarchie Parse Trees Recursive Descent Parser First-, Follow-Mengen 2 Compiler

Mehr

Compiler. Kapitel. Syntaktische Analyse. Kapitel 4. Folie: 1. Syntaktische Analyse. Autor: Aho et al.

Compiler. Kapitel. Syntaktische Analyse. Kapitel 4. Folie: 1. Syntaktische Analyse. Autor: Aho et al. Folie: 1 Kapitel 4 Übersicht Übersicht Syntax: Definition 4 syn-tax: the way in which words are put together to form phrases, clauses, or sentences. Webster's Dictionary Die Syntax (griechisch σύνταξις

Mehr

Kapitel: Die Chomsky Hierarchie. Die Chomsky Hierarchie 1 / 14

Kapitel: Die Chomsky Hierarchie. Die Chomsky Hierarchie 1 / 14 Kapitel: Die Chomsky Hierarchie Die Chomsky Hierarchie 1 / 14 Allgemeine Grammatiken Definition Eine Grammatik G = (Σ, V, S, P) besteht aus: einem endlichen Alphabet Σ, einer endlichen Menge V von Variablen

Mehr

Konstruieren der SLR Parsing Tabelle

Konstruieren der SLR Parsing Tabelle Konstruieren der SLR Parsing Tabelle Kontextfreie Grammatik (CFG) Notation 1. Diese Symbole sind Terminals: (a) Kleinbuchstaben vom Anfang des Alphabets wie a, b, c. (b) Operator Symbole wie +,, usw. (c)

Mehr

Speech Recognition Grammar Compilation in Grammatikal Framework. von Michael Heber

Speech Recognition Grammar Compilation in Grammatikal Framework. von Michael Heber Speech Recognition Grammar Compilation in Grammatikal Framework von Michael Heber Agenda 1. Einführung 2. Grammatical Framework (GF) 3. Kontextfreie Grammatiken und Finite-State Modelle 4. Quellen 2 1.

Mehr

Einführung in die Linguistik

Einführung in die Linguistik Lösung 4 Einführung in die Linguistik Phonologie Aufgabe 1, Latein Letzte Silbe etrametrikalisch. Parsing: Rechts nach Links Fuß: moraischer Trochäus End-Regel: rechter Fuß wird betont a) lau-'da:-tus

Mehr

Übung zur Vorlesung Theoretische Information. Minimierungsalgorithmus

Übung zur Vorlesung Theoretische Information. Minimierungsalgorithmus Übung zur Vorlesung Theoretische Information Minimierungsalgorithmus Folie Warum Automaten minimieren? Zwei endliche Automaten Automat q q Automat 2 q q Beide akzeptieren die selbe Sprache Welche? q 2

Mehr

Theoretische Grundlagen der Informatik

Theoretische Grundlagen der Informatik Theoretische Grundlagen der Informatik Vorlesung am 17. Januar 2012 INSTITUT FÜR THEORETISCHE 0 KIT 18.01.2012 Universität des Dorothea Landes Baden-Württemberg Wagner - Theoretische und Grundlagen der

Mehr

Interaktive Programme mit Scanner

Interaktive Programme mit Scanner 2.X Input 191 Interaktive Programme mit Scanner 193 Input und System.in Interaktives Programm: Liest Input von der Konsole ( console ). Während das Programm ausgeführt wird fragt das Programm den Benutzer

Mehr

Koordination in LFG und XLE

Koordination in LFG und XLE Koordination in LFG und XLE Grammatikentwicklung, SS 010 1 /1 Worum es heute geht: Koordinierte Strukturen Koordinierte NPs (sind speziell) /1 Einstieg: Vorschlag C-Struktur Beispiel: in the room and under

Mehr

Informatik IV Theoretische Informatik: Formale Sprachen und Automaten, Berechenbarkeit und NP-Vollständigkeit. Zugangsnummer: 9201

Informatik IV Theoretische Informatik: Formale Sprachen und Automaten, Berechenbarkeit und NP-Vollständigkeit.  Zugangsnummer: 9201 Informatik IV Theoretische Informatik: Formale Sprachen und Automaten, Berechenbarkeit und NP-Vollständigkeit Wiederholung Kapitel 3 und 4 http://pingo.upb.de Zugangsnummer: 9201 Dozent: Jun.-Prof. Dr.

Mehr

1 Inhalt der Vorlesung B-PS1

1 Inhalt der Vorlesung B-PS1 1 Inhalt der Vorlesung B-PS1 1.1 Tag 1 1.1.1 Vormittag Geschichte der Programmiersprachen Wie viele Programmiersprachen gibt es? https://en.wikipedia.org/wiki/list_of_programming_languages Esoterische

Mehr

Wortdekodierung. Vorlesungsunterlagen Speech Communication 2, SS Franz Pernkopf/Erhard Rank

Wortdekodierung. Vorlesungsunterlagen Speech Communication 2, SS Franz Pernkopf/Erhard Rank Wortdekodierung Vorlesungsunterlagen Speech Communication 2, SS 2004 Franz Pernkopf/Erhard Rank Institute of Signal Processing and Speech Communication University of Technology Graz Inffeldgasse 16c, 8010

Mehr

Automatentheorie und formale Sprachen rechtslineare Grammatiken

Automatentheorie und formale Sprachen rechtslineare Grammatiken Automatentheorie und formale Sprachen rechtslineare Grammatiken Dozentin: Wiebke Petersen 17.6.2009 Wiebke Petersen Automatentheorie und formale Sprachen - SoSe09 1 Pumping lemma for regular languages

Mehr

Kapitel 4: Das Überdeckungsproblem

Kapitel 4: Das Überdeckungsproblem Kapitel : Das Überdeckungsproblem Kapitel Das Überdeckungsproblem Kapitel : Das Überdeckungsproblem Seite / 25 Kapitel : Das Überdeckungsproblem Inhaltsverzeichnis. Überdeckungsmatrizen.2 Minimalüberdeckungen.

Mehr

Programmierkurs Python II

Programmierkurs Python II Programmierkurs Python II Michaela Regneri & tefan Thater FR 4.7 Allgemeine Linguistik (Computerlinguistik) Universität des aarlandes ommersemester 2010 (Charniak, 1997) the dog biscuits N V N V the dog

Mehr

Linguistik für Kognitionswissenschaften

Linguistik für Kognitionswissenschaften Linguistik für Kognitionswissenschaften Computerlinguistik: Maschinelle Übersetzung Computerlinguistik Fehlübersetzung von engl. computational linguistics - computationelle Linguistik beinhaltet im weiteren

Mehr

Sei Σ ein endliches Alphabet. Eine Sprache L Σ ist genau dann regulär, wenn sie von einem regulären Ausdruck beschrieben werden kann.

Sei Σ ein endliches Alphabet. Eine Sprache L Σ ist genau dann regulär, wenn sie von einem regulären Ausdruck beschrieben werden kann. Der Satz von Kleene Wir haben somit Folgendes bewiesen: Der Satz von Kleene Sei Σ ein endliches Alphabet. Eine Sprache L Σ ist genau dann regulär, wenn sie von einem regulären Ausdruck beschrieben werden

Mehr

Vorname Name Matrikelnummer 1. a) Benennen Sie die übrigen 6 Komponenten einer nicht-deterministischen Turingmaschine (TM): (3 Punkte)

Vorname Name Matrikelnummer 1. a) Benennen Sie die übrigen 6 Komponenten einer nicht-deterministischen Turingmaschine (TM): (3 Punkte) 1 Aufgabe 1 (19 Punkte) a) Benennen Sie die übrigen 6 Komponenten einer nicht-deterministischen Turingmaschine (TM): (3 Punkte) Q, die endliche Zustandsmenge b) Was besagt die Church-Turing-These? (1 Punkt)

Mehr

Willkommen zur Vorlesung Komplexitätstheorie

Willkommen zur Vorlesung Komplexitätstheorie Willkommen zur Vorlesung Komplexitätstheorie WS 2011/2012 Friedhelm Meyer auf der Heide V12, 23.1.2012 1 Organisatorisches CHE-Studierendenbefragung ist bis zum 31.1. verlängert. Falls sie angefragt wurden:

Mehr

Grundlagen der Programmierung 3 A

Grundlagen der Programmierung 3 A Grundlagen der Programmierung 3 A Typen, Typberechnung und Typcheck Prof. Dr. Manfred Schmidt-Schauß Sommersemester 2017 Haskell, Typen, und Typberechnung Ziele: Haskells Typisierung Typisierungs-Regeln

Mehr

Verarbeitung unendlicher Datenstrukturen Jetzt können wir z.b. die unendliche Liste aller geraden Zahlen oder aller Quadratzahlen berechnen:

Verarbeitung unendlicher Datenstrukturen Jetzt können wir z.b. die unendliche Liste aller geraden Zahlen oder aller Quadratzahlen berechnen: Verarbeitung unendlicher Datenstrukturen Jetzt können wir z.b. die unendliche Liste aller geraden Zahlen oder aller Quadratzahlen berechnen: take 1 0 ( f i l t e r ( fn x => x mod 2=0) nat ) ; val it =

Mehr

Einführung in die Computerlinguistik reguläre Sprachen und endliche Automaten

Einführung in die Computerlinguistik reguläre Sprachen und endliche Automaten Einführung in die Computerlinguistik reguläre Sprachen und endliche Automaten Dozentin: Wiebke Petersen Foliensatz 3 Wiebke Petersen Einführung CL 1 Describing formal languages by enumerating all words

Mehr

Decision Tree Learning

Decision Tree Learning Decision Tree Learning Computational Linguistics Universität des Saarlandes Sommersemester 2011 28.04.2011 Entscheidungsbäume Repräsentation von Regeln als Entscheidungsbaum (1) Wann spielt Max Tennis?

Mehr

Teil III. Komplexitätstheorie

Teil III. Komplexitätstheorie Teil III Komplexitätstheorie 125 / 160 Übersicht Die Klassen P und NP Die Klasse P Die Klassen NP NP-Vollständigkeit NP-Vollständige Probleme Weitere NP-vollständige Probleme 127 / 160 Die Klasse P Ein

Mehr

Logik Vorlesung 3: Äquivalenz und Normalformen

Logik Vorlesung 3: Äquivalenz und Normalformen Logik Vorlesung 3: Äquivalenz und Normalformen Andreas Maletti 7. November 2014 Überblick Inhalt 1 Motivation und mathematische Grundlagen 2 Aussagenlogik Syntax und Semantik Äquivalenz und Normalformen

Mehr

B / B* - Bäume. Guido Hildebrandt Seminar Datenbanksysteme

B / B* - Bäume. Guido Hildebrandt Seminar Datenbanksysteme B / B* - Bäume Guido Hildebrandt Seminar Datenbanksysteme 25.11.2010 Gliederung Einleitung Binärbaum B - Baum B* - Baum Varianten Zusammenfassung Quellen Gliederung Einleitung Binärbaum B - Baum B* - Baum

Mehr

1/26. Integration. Numerische Mathematik 1 WS 2011/12

1/26. Integration. Numerische Mathematik 1 WS 2011/12 1/26 Integration Numerische Mathematik 1 WS 2011/12 Notation 2/26 Die Abbildung I b a : C([a, b]) R gegeben durch Ia b (f ) := beschreibt die Integration. b a f (x)dx, Um das Integral I(f ) zu approximieren

Mehr

Grundlagen der Theoretischen Informatik

Grundlagen der Theoretischen Informatik Grundlagen der Theoretischen Informatik Sommersemester 2015 23.04.2015 Viorica Sofronie-Stokkermans e-mail: sofronie@uni-koblenz.de 1 Bis jetzt 1. Terminologie 2. Endliche Automaten und reguläre Sprachen

Mehr

Grundlagen der Theoretischen Informatik

Grundlagen der Theoretischen Informatik Grundlagen der Theoretischen Informatik 4. Kellerautomaten und kontextfreie Sprachen (III) 17.06.2015 Viorica Sofronie-Stokkermans e-mail: sofronie@uni-koblenz.de 1 Übersicht 1. Motivation 2. Terminologie

Mehr

Sie gab das Buch ihrer Schwester.

Sie gab das Buch ihrer Schwester. Linguistische Kriterien für kontextfreie Grammatiken Zerlegung eines Satzes in Konstituenten gemäß Austausch-, Verschiebe- und Weglaßprobe Dies ist ein Beispiel. Beschreibungsmöglichkeiten: 1. S Pron V

Mehr

Klausur Algorithmen und Datenstrukturen II 29. Juli 2013

Klausur Algorithmen und Datenstrukturen II 29. Juli 2013 Technische Universität Braunschweig Sommersemester 2013 Institut für Betriebssysteme und Rechnerverbund Abteilung Algorithmik Prof. Dr. Sándor P. Fekete Stephan Friedrichs Klausur Algorithmen und Datenstrukturen

Mehr

Deutsch 1 Kapitel 6: Meine Sachen items in a house, pronouns, adjectives, prepositions. Name: Seite

Deutsch 1 Kapitel 6: Meine Sachen items in a house, pronouns, adjectives, prepositions. Name: Seite 1. Label 10 things in the room with the correct gender (die, der, das) 2. Find the nine words related to household furnishing in the puzzle below. 3. Find the missing pieces of furniture. 4. The movers

Mehr

Grundlagen der Informatik Kapitel 20. Harald Krottmaier Sven Havemann

Grundlagen der Informatik Kapitel 20. Harald Krottmaier Sven Havemann Grundlagen der Informatik Kapitel 20 Harald Krottmaier Sven Havemann Agenda Klassen von Problemen Einige Probleme... Approximationsalgorithmen WS2007 2 Klassen P NP NP-vollständig WS2007 3 Klasse P praktisch

Mehr