Featuregrammatiken. Vorlesung Computerlinguistische Techniken Alexander Koller. 21. November 2014

Größe: px
Ab Seite anzeigen:

Download "Featuregrammatiken. Vorlesung Computerlinguistische Techniken Alexander Koller. 21. November 2014"

Transkript

1 Featuregrammatiken Vorlesung Computerlinguistische Techniken Alexander Koller 21. November 2014

2 Musterlösung Ü2 A4 Erste 100 Wörter des Brown-Korpus aueben: import nltk words = nltk.corpus.brown.words() for i in range(100): print(words[i]) Wie viele Tokens im Brown-Korpus? len(words) Wie viele Types im Brown-Korpus? len(set(words)) 505

3 Musterlösung Ü2 A4 100 häufigste Wörter, absteigend nach Häufigkeit: def add(dictionary, word): if word in dictionary: dictionary[word] = dictionary[word] + 1 else: dictionary[word] = 1 dictionary = {} for word in words: add(dictionary,word.lower()) print sorted(dictionary.items(), key=itemgetter(1), reverse=true)[:100]

4 Übersicht Features Featurestrukturen und Unifikation Featuregrammatiken Parsing Expressivität

5 Agreement Wir haben in unseren Mini-kfGs bisher Kongruenz völlig ignoriert: The boy sleeps. The boys sleep. * The boy sleep. * The boys sleeps. Wie modelliert man Kongruenz am effektivsten in einer Grammatik?

6 ubkategorisierung Verschiedene Verben haben verschiedene ubkategorisierungsrahmen, die angeben, welche Komplemente das Verb braucht. The boy sleeps. The boy eats a sandwich. The boy gives the girl a book. * The boy sleeps a sandwich. Wie modelliert man das effektiv?

7 1. Versuch: mit kfgs NP VP VP IV VP TV NP VP DV NP NP IV sleeps TV eats DV gives

8 1. Versuch: mit kfgs NP VP VP IV VP TV NP VP DV NP NP IV sleeps TV eats DV gives NPpl VPpl VPpl IVpl VPpl TVpl NP VPpl DVpl NP NP IVpl sleep TVpl eat DVpl give

9 Das Problem KfGs: Kongruenzartige Information muss in Nichtterminalen codiert werden. Kongruenz und ubkategorisierung nur zwei von vielen Constraints, die interagieren können.

10 Das Problem Für große Grammatiken bedeutet das: Brauchen extrem viele NTs und Regeln, die (für uns) alle fast das gleiche aussagen. Aufwendig in Entwicklung und Wartung. Grundsatz: In Programmen und Grammatiken Redundanz vermeiden!

11 Features Alternative: An Nichtterminale Merkmale (engl. Features) anhängen, deren Werte separat verarbeitet werden können. In Grammatik enthalten Features Variablen, die durch Unifikation ihre Werte bekommen. Wir werden dann Featuregrammatiken daraus bauen.

12 2. Versuch: mit Features NP[:] VP[:] VP[:] IV[:] VP[:] TV[:] NP VP[:] DV[:] NP NP IV[:] sleeps TV[:] eats DV[:] gives NP[:pl] VP[:pl] VP[:pl] IV[:pl] VP[:pl] TV[:pl] NP VP[:pl] DV[:pl] NP NP IV[:pl] sleep TV[:pl] eat DV[:pl] give

13 2. Versuch: mit Features NP[:X] VP[:X] VP[:X] IV[:X] VP[:X] TV[:X] NP VP[:X] DV[:X] NP NP IV[:] sleeps TV[:] eats DV[:] gives NP[:X] VP[:X] VP[:X] IV[:X] VP[:X] TV[:X] NP VP[:X] DV[:X] NP NP IV[:pl] sleep TV[:pl] eat DV[:pl] give

14 2. Versuch: mit Features NP[:X] VP[:X] VP[:X] IV[:X] VP[:X] TV[:X] NP VP[:X] DV[:X] NP NP IV[:] sleeps TV[:] eats DV[:] gives IV[:pl] sleep TV[:pl] eat DV[:pl] give

15 Feature-trukturen Eine Featurestruktur (F) gruppiert mehrere Zuweisungen von Werten an Features. Verschiedene Featurestrukturen können verschiedene Features enthalten. Werte von Features können sein: atomare Werte Featurestrukturen

16 Feature-trukturen sind DAGs 2 4 " # son 2 " 4 son 3 #3 5 5 Attribut-Wert-Matrix (AVM) Feature-truktur (= gerichteter azyklischer Graph, DAG) Beschreibung Modell Oft nimmt man AVM und Feature-truktur als alternative chreibweisen; ist aber nicht ganz präzise.

17 Reentrancy 2 " 1 son 4 h i 1 3 # 5 Attribut-Wert-Matrix (AVM) Feature-truktur (= gerichteter azyklischer Graph) Beschreibung Modell Verschiedene Pfade im Graphen können zum gleichen Knoten führen. Identität wird in der AVM durch Koindizierung erzwungen.

18 Knotengleichheit vs Wertgleichheit 2 4 " son # 2 4 " son # " son # h 1 i 3 5

19 Unterspezifizierte AVMs pl 2 4 " son # apple h son i 3 5 Beschreibung Modelle

20 Unifikation In Unifikationrammatik trägt jede Grammatikregel nur ein bisschen Information über die F bei. Unifikation: Informationen aus zwei Fen zusammenführen. kann fehlschlagen! Zentrale Oation im Parsingalgorithmus.

21 Unifikation pl 2 4 " son # apple h son i 3 5 pl f

22 Unifikation pl 2 4 " son # apple h son i 3 5 pl f g h 1 i 3 5

23 Unifikation pl 2 4 " son # apple h son i 3 5 pl f g f t g = " son # apple 1 h son i h 1 i 3 5

24 Unifikation Unifikation kann fehlschlagen: [ pl] [ ] fail Unifikation sensibel für Reentrancy: [s ] [ [s ]] [ ] [ [ pl]] = s s pl 1 [s ] [ 1 [s ]] [ ] [ [ pl]] fail

25 Featuregrammatiken Eine Featuregrammatik (FCFG) ist eine kfg, in der jedes Auftreten eines Nichtterminals in einer Produktionsregel mit einer Featurestruktur versehen sein kann. NP[ ] VP[ ] 1 1 VP[ ] IV[ ] 1 1 IV[: ] sleeps

26 Ableitungen in FCFGs Regel A[F0] B[F1] C[F2] kann man als größere Featurestruktur sehen: F = A B C F0 F1 F2 Denke Ableitungen bottom-up: um B[G1] und C[G2] zu kombinieren, berechne G = F [B G1] [C G2] (darf nicht fehlschlagen) und leite daraus A[G.A] ab. prache, Wort-, Parsingproblem wie für kfgs.

27 Ein Beispiel NP[ 1 ] VP[ 1 ] VP[ 1 ] IV[ 1 ] IV[: ] sleeps NP[: ] John NP[: ] VP[: ] NP[: ] IV[: ] John IV[: ] John sleeps NP VP 1 1 [NP [ ]] [VP [ ]] = NP VP 1 1 VP IV 1 1 [IV [ ]] = VP IV 1 1

28 Ein Beispiel NP[ 1 ] VP[ 1 ] VP[ 1 ] IV[ 1 ] IV[: ] sleeps NP[: ] John / NP[: ] VP[: pl] (also * John sleep) / NP VP 1 1 [NP [ ]] [VP [ pl]] fail

29 Listen als Featurestrukturen Man kann in Fen ganze Listen von Werten codieren: atomarer Wert Nil = leere Liste F für Liste a R: " first rest a R # Ich kürze Listen mit chreibweise der Form (a, b, c) ab.

30 ubkategorisierung In Featuregrammatiken können wir jetzt ubkategorisierung von Verben aufräumen: V[sub: ] V[sub: NP 1 1 NP V[sub: (NP)] V[sub: (NP)] sleeps V[sub: (NP, NP)] eats etc. ]] NP

31 ub mit Kongruenz V[sub:, : ] V[sub: NP, : ] NP NP[: 1 ] V[sub: (NP), : 1 ] V[sub: (NP), : [: ]] sleeps V[sub: (NP, NP), : [: pl]] eat etc. NP[:] V[sub: (NP), :] * John sleeps NP[:] V[sub: (NP), :] NP[:] V[sub: (NP, NP), :] NP * John likes donuts

32 CKY-Parser für FCFGs Items um F erweitern [B, G1, i, j] [C, G2, j, k] A[F0] B[F1] C[F2] ist Regel A F0 G = B F1 [B G1] [C G2] G0 = F in G unter A C F2 [A, G0, i, k] teuerste Oation: Unifikation berechnen

33 Expressivität Im allgemeinen sind FCFGs expressiver als kfgs: A[X] B[X] C[X] A[s: X] a A[X] A[s: end] a B[s: X] b B[X] B[s: end] b C[s: X] c C[X] C[s: end] c Akzeptiert nicht-kf prache a n b n c n. Im allgemeinen gibt es keinen Parsingalgorithmus für FCFGs, der garantiert terminiert.

34 Eingeschränkte FCFGs Problem sind Regeln, die mittels Reentrancy immer tiefere trukturen bauen: A[s: X] a A[X] Lösungsidee: Wertebereiche von Features auf endliche Mengen einschränken (also nicht Listen!). Dann kann man Kombinationen von Nichtterminal + F in endlich viele Nichtterminale übersetzen. Folge: Expressivität & Komplexität kontextfrei.

35 Zusammenfassung Featuregrammatiken: Erlaubt kompakte Repräsentation von grammatischen Informationen. Unifikation: Fasst Information aus verschiedenen Featurestrukturen zusammen. KfG-Parsingalgorithmen können zu Parsingalgorithmen für FCFGs erweitert werden.

Einführung in unifikationsbasierte Grammatikformalismen

Einführung in unifikationsbasierte Grammatikformalismen Universität Potsdam Institut für Linguistik Computerlinguistik Einführung in unifikationsbasierte Grammatikformalismen Thomas Hanneforth head: VP form: finite subj: pers: 3 num: pl Merkmalsstrukturen:

Mehr

Der CKY-Parser. Vorlesung Computerlinguistische Techniken Alexander Koller. 27. Oktober 2015

Der CKY-Parser. Vorlesung Computerlinguistische Techniken Alexander Koller. 27. Oktober 2015 Vorlesung omputerlinguistische Techniken Alexander Koller 27. Oktober 2015 Übersicht Komplexität des KY-Algorithmus Implementierung in Python hift-reduce-parsing hift-regel: (a w, s) (w, s a) Reduce-Regel:

Mehr

Eine Erweiterung der kontextfreien Grammatiken: PATR-II

Eine Erweiterung der kontextfreien Grammatiken: PATR-II Eine Erweiterung der kontextfreien Grammatiken: PATR-II Das ursprüngliche Problem war: Wie kann man strukturelle Information (Phrasenstruktur) von anderen grammatischen Informationen (wie Kongruenz, Rektion

Mehr

Kontextfreie Grammatiken

Kontextfreie Grammatiken Kontextfreie Grammatiken Vorlesung Computerlinguistische Techniken Alexander Koller 16. Oktober 2015 Übersicht Worum geht es in dieser Vorlesung? Übungen und Abschlussprojekt Kontextfreie Grammatiken Computerlinguistische

Mehr

Baumadjunktionsgrammatiken

Baumadjunktionsgrammatiken Baumadjunktionsgrammatiken Vorlesung Grammatikformalismen Alexander Koller 22. April 2016 Grammatikformalismen Grammatik- formalismus Grammatik- theorie abstrakt Grammatik prache konkret formal linguistisch

Mehr

Einführung in die Computerlinguistik

Einführung in die Computerlinguistik Einführung in die Computerlinguistik Merkmalstrukturen und Unifikation Dozentin: Wiebke Petersen WS 2004/2005 Wiebke Petersen Formale Komplexität natürlicher Sprachen WS 03/04 Universität Potsdam Institut

Mehr

Formale Methoden III - Tutorium

Formale Methoden III - Tutorium Formale Methoden III - Tutorium Daniel Jettka 08.05.06 Anmeldung im ekvv Inhaltsverzeichnis 1. Aufgaben vom 27.04.06 1.1 Aufgabe 1 1.2 Aufgabe 2 1.3 Aufgabe 3 1.4 Aufgabe 4 1.5 Aufgabe 5 1.6 Aufgabe 6

Mehr

Teil 111. Chart-Parsing

Teil 111. Chart-Parsing Teil 111 Chart-Parsing 102 Die im ersten Teil des Buches behandelten einfachen Parsingalgorithmen sind, anders als die meisten vor allem im Compilerbau verwendeten Algorithmen (z.b. die LLoder LR-Parsingalgorithmen),

Mehr

Einführung. Vorlesung Grammatikformalismen Alexander Koller. 15. April 2016

Einführung. Vorlesung Grammatikformalismen Alexander Koller. 15. April 2016 Einführung Vorlesung Grammatikformalismen Alexander Koller 15. April 2016 Übersicht Was sind Grammatikformalismen, und warum reichen uns kfgs nicht? Was machen wir in dieser Vorlesung? Prüfungsmodalitäten

Mehr

Übungsaufgaben. Eine kontextfreie Grammatik lässt sich formal als Quadrupel darstellen: D : der, das N : Hund, Kaninchen V : sieht, beißt

Übungsaufgaben. Eine kontextfreie Grammatik lässt sich formal als Quadrupel darstellen: D : der, das N : Hund, Kaninchen V : sieht, beißt Universität Bielefeld 25. Juni 2006 Fakultät für Linguistik und Literaturwissenschaft Formale Methoden der Linguistik III Veranstalter: Dieter Metzing Sommersemester 2006 Übungsaufgaben 1. (a) Welche Bestandteile

Mehr

Schwach kontextsensitive Grammatikformalismen

Schwach kontextsensitive Grammatikformalismen chwach kontextsensitive Grammatikformalismen! Vorlesung Grammatikformalismen Alexander Koller! 2. Juni 2015 Grammatikformalismen Parsingkomplexität O(n) O(n 3 ) polynomiell exponentiell PPACE-vollst. unentscheidbar

Mehr

Einführung in die Computerlinguistik

Einführung in die Computerlinguistik Einführung in die Computerlinguistik Syntax: Merkmalsstrukturen WS 2014/2015 Vera Demberg Eigenschaften der syntaktischen Struktur [1] Er hat die Übungen gemacht. Der Student hat die Übungen gemacht. Der

Mehr

Syntax und Parsing. OS Einblicke in die Computerlinguistik. Philipp Rabe, 13IN-M

Syntax und Parsing. OS Einblicke in die Computerlinguistik. Philipp Rabe, 13IN-M OS Einblicke in die Computerlinguistik basierend auf Computerlinguistik und Sprachtechnologie, 3. Auflage, Spektrum, Heidelberg 2010 22. Mai 2014 Ausgangssituation Tokenisierung und Wortarten-Tagging vollendet

Mehr

Karl Heinz Wagner

Karl Heinz Wagner PATR II Funktionale Beschreibungen Der PATR II Formalismus Auch für PATR II gilt Sprachliche Ausdrücke werden durch funktionale Beschreibungen oder Deskriptionen (engl. functional descriptions,, FD beschrieben

Mehr

10. Linksassoziative Grammatik (LAG)

10. Linksassoziative Grammatik (LAG) Kapitel 10: Linksassoziative Grammatik (LAG) 168 10 Linksassoziative Grammatik (LAG) 101 Regeltypen und Ableitungsordnung 1011 Der Begriff linksassoziativ When we combine operators to form expressions,

Mehr

Parsing von unifikationsbasierten Grammatikformalismen

Parsing von unifikationsbasierten Grammatikformalismen Parsing von unifikationsbasierten Grammatikformalismen Vorlesung Grammatikformalismen Alexander Koller. Juli 016 Parsing Warum kann man kfgen in polynomieller Zeit parsen, wenn doch jeder Substring exponentiell

Mehr

Die vorgestellten Chart-Parser haben bei bestimmten Grammatiken Probleme die Symbole der Grammatik dÿrfen nicht unterspezifiziert sein

Die vorgestellten Chart-Parser haben bei bestimmten Grammatiken Probleme die Symbole der Grammatik dÿrfen nicht unterspezifiziert sein bersicht Die vorgestellten Chart-Parser haben bei bestimmten Grammatiken Probleme die Symbole der Grammatik dÿrfen nicht unterspezifiziert sein OK: Prolog-Atome OK: komplexe Terme, deren Argumente jederzeit

Mehr

Elementare Wahrscheinlichkeitslehre

Elementare Wahrscheinlichkeitslehre Elementare Wahrscheinlichkeitslehre Vorlesung Computerlinguistische Techniken Alexander Koller 13. November 2015 CL-Techniken: Ziele Ziel 1: Wie kann man die Struktur sprachlicher Ausdrücke berechnen?

Mehr

Probabilistische kontextfreie Grammatiken

Probabilistische kontextfreie Grammatiken Probabilistische kontextfreie Grammatiken Vorlesung Computerlinguistische Techniken Alexander Koller 08. Dezember 2015 Let s play a game Ich gebe Ihnen ein Nichtterminalsymbol. S, NP, VP, PP, oder POS-Tag

Mehr

Informatik IV Theoretische Informatik: Formale Sprachen und Automaten, Berechenbarkeit und NP-Vollständigkeit. Zugangsnummer: 9201

Informatik IV Theoretische Informatik: Formale Sprachen und Automaten, Berechenbarkeit und NP-Vollständigkeit.  Zugangsnummer: 9201 Informatik IV Theoretische Informatik: Formale Sprachen und Automaten, Berechenbarkeit und NP-Vollständigkeit Wiederholung Kapitel 3 und 4 http://pingo.upb.de Zugangsnummer: 9201 Dozent: Jun.-Prof. Dr.

Mehr

Syntax natürlicher Sprachen

Syntax natürlicher Sprachen Syntax natürlicher Sprachen Vorlesung 9: Unifikation und merkmalsbasiertes Parsing Martin Schmitt Ludwig-Maximilians-Universität München 19.12.2017 Martin Schmitt (LMU) Syntax natürlicher Sprachen 19.12.2017

Mehr

Deterministischer Kellerautomat (DPDA)

Deterministischer Kellerautomat (DPDA) Deterministische Kellerautomaten Deterministischer Kellerautomat (DPDA) Definition Ein Septupel M = (Σ,Γ, Z,δ, z 0,#, F) heißt deterministischer Kellerautomat (kurz DPDA), falls gilt: 1 M = (Σ,Γ, Z,δ,

Mehr

Semantikkonstruktion

Semantikkonstruktion Semantikkonstruktion Vorlesung Computerlinguistische Techniken Alexander Koller 16. Januar 2015 Semantische Verarbeitung Uraltes Problem: Inferenz. Woher wissen wir, dass ein Satz aus einem anderen folgt?

Mehr

Einführung in die Computerlinguistik Merkmalsstrukturen (Feature Structures)

Einführung in die Computerlinguistik Merkmalsstrukturen (Feature Structures) Eiführug i die Computerliguistik Merkmalsstrukture (Feature Structures) Laura Heirich-Heie-Uiversität Düsseldorf Sommersemester 2013 Eileitug (1) Die i CFGs verwedete Nichttermiale sid i der Regel icht

Mehr

Gliederung. Natürlichsprachliche Systeme I. Merkmalsbasierte Grammatiken. Merkmalsbasierte Grammatiken. Merkmalsbasierte Grammatiken mit NLTK

Gliederung. Natürlichsprachliche Systeme I. Merkmalsbasierte Grammatiken. Merkmalsbasierte Grammatiken. Merkmalsbasierte Grammatiken mit NLTK Merkmalsbasierte Merkmalsbasierte Gliederung Natürlichsprachliche Systeme I Merkmalsbasierte mit NLTK D. Rösner Institut für Wissens- und Sprachverarbeitung Fakultät für Informatik Otto-von-Guericke Universität

Mehr

Chart-Parsing. bersicht. Ziel. Motivation: Bisher vorgestellte Verfahren sind nicht effizient Grundidee des Chart-Parsing Datenstruktur

Chart-Parsing. bersicht. Ziel. Motivation: Bisher vorgestellte Verfahren sind nicht effizient Grundidee des Chart-Parsing Datenstruktur Chart-Parsing bersicht Ziel Motivation: Bisher vorgestellte Verfahren sind nicht effizient Grundidee des Chart-Parsing Datenstruktur Knoten passive und aktive Kanten gepunktete Regeln (dotted rules) Fundamentalregel

Mehr

Grundlagen Theoretischer Informatik 2 WiSe 2011/12 in Trier. Henning Fernau Universität Trier

Grundlagen Theoretischer Informatik 2 WiSe 2011/12 in Trier. Henning Fernau Universität Trier Grundlagen Theoretischer Informatik 2 WiSe 2011/12 in Trier Henning Fernau Universität Trier fernau@uni-trier.de 1 Grundlagen Theoretischer Informatik 2 Gesamtübersicht Organisatorisches; Einführung Ersetzungsverfahren:

Mehr

Automatentheorie und formale Sprachen

Automatentheorie und formale Sprachen Automatentheorie und formale Sprachen VL 8 Chomsky-Grammatiken Kathrin Hoffmann 23. Mai 2012 Hoffmann (HAW Hamburg) Automatentheorie und formale Sprachen 23.5. 2012 250 Wortproblem Wortproblem ist das

Mehr

Sie gab das Buch ihrer Schwester.

Sie gab das Buch ihrer Schwester. Linguistische Kriterien für kontextfreie Grammatiken Zerlegung eines Satzes in Konstituenten gemäß Austausch-, Verschiebe- und Weglaßprobe Dies ist ein Beispiel. Beschreibungsmöglichkeiten: 1. S Pron V

Mehr

Earley Parsing. Parsing - WS 2012 / 2013 Lisa Orszullok & Anika Stallmann

Earley Parsing. Parsing - WS 2012 / 2013 Lisa Orszullok & Anika Stallmann Earley Parsing Parsing - WS 2012 / 2013 Lisa Orszullok & Anika Stallmann 12.12.2012 Agenda Basics Komponenten Earley Parsing - Recognizer Earley Parsing - Parser Vor- und Nachteile Parsing WS 2012/2013

Mehr

Programmierkurs Python II

Programmierkurs Python II Programmierkurs Python II Michaela Regneri & Stefan Thater FR 4.7 Allgemeine Linguistik (Computerlinguistik) Universität des Saarlandes Sommersemester 2011 Prüfungsleistungen Klausur am Semesterende -

Mehr

Semantik und Pragmatik

Semantik und Pragmatik Semantik und Pragmatik SS 2005 Universität Bielefeld Teil 4, 6. Mai 2005 Gerhard Jäger Semantik und Pragmatik p.1/35 Prädikatenlogik: atomare Formeln Syntax JO, BERTIE, ETHEL, THE-CAKE... sind Individuenkonstanten

Mehr

Grammatik Prüfung möglich, ob eine Zeichenfolge zur Sprache gehört oder nicht

Grammatik Prüfung möglich, ob eine Zeichenfolge zur Sprache gehört oder nicht Zusammenhang: Formale Sprache Grammatik Formale Sprache kann durch Grammatik beschrieben werden. Zur Sprache L = L(G) gehören nur diejenigen Kombinationen der Zeichen des Eingabealphabets, die durch die

Mehr

Grammatiktheorie: Merkmale, Merkmalstrukturen, Unifikation, Unifikationsgrammatiken

Grammatiktheorie: Merkmale, Merkmalstrukturen, Unifikation, Unifikationsgrammatiken Grammatiktheorie: Merkmale, Merkmalstrukturen, Unifikation, Unifikationsgrammatiken Einführungskurs Syntax und Morphologie 11. Vorlesung Merkmale Das Wort 'Merkmal' bedeutet im Prinzip soviel wie 'Eigenschaft'

Mehr

5. Die syntaktische Analyse

5. Die syntaktische Analyse mittels sog. Parser Input: Folge von Token (Symbolen), geliefert vom Scanner/Sieber Aufgabe: Teilfolgen zusammenfassen zu größeren syntaktischen Einheiten Ausdrücke, Anweisungen(-folgen), Deklarationen,

Mehr

Der Earley-Algorithmus

Der Earley-Algorithmus Der Earley-Algorithmus Kursfolien Karin Haenelt 25.03.02 1 25.03.02 2 Inhalt Funktion des Earley-Algorithmus Begriffe Erkenner/Parser Kontextfreie Grammatik Ein Beispiel Funktionen des Algorithmus Funktionsweise

Mehr

Charts. Motivation. Grundfrage. Chart als Graph

Charts. Motivation. Grundfrage. Chart als Graph Charts Motivation Übersicht Chart bzw. Well-Formed Substring Table (WFST) Als azyklischer Graph, Tabelle und Relation Kantenbeschriftungen Kategorien: WFST Regeln: Passive Charts Regelhyposen: Aktive Charts

Mehr

Klausur zur Vorlesung Grundbegriffe der Informatik 31. August 2009

Klausur zur Vorlesung Grundbegriffe der Informatik 31. August 2009 Klausur zur Vorlesung Grundbegriffe der Informatik 31. August 2009 Klausurnummer Vorname: Aufgabe 1 2 3 4 5 6 7 max. Punkte 4 4 8 8 6 8 8 tats. Punkte Gesamtpunktzahl: Note: Aufgabe 1 (1+1+2 = 4 Punkte)

Mehr

Der Earley-Algorithmus

Der Earley-Algorithmus Der Earley-Algorithmus Kursfolien Karin Haenelt 25.03.02 1 25.03.02 2 Inhalt Funktion des Earley-Algorithmus Begriffe Erkenner/Parser Kontextfreie Grammatik Ein Beispiel Funktionen des Algorithmus Funktionsweise

Mehr

Grundlagen der Theoretischen Informatik

Grundlagen der Theoretischen Informatik Grundlagen der Theoretischen Informatik 4. Kellerautomaten und kontextfreie prachen (VI) 25.06.2015 Viorica ofronie-tokkermans e-mail: sofronie@uni-koblenz.de 1 Übersicht 1. Motivation 2. Terminologie

Mehr

Chartparsing & CKY Algorithmus

Chartparsing & CKY Algorithmus Ludwigs Maximiliansuniversität München Centrum für Informations und Sprachverarbeitung Hauptseminar: Parsing Leitung: Prof. Dr. Klaus U. Schulz Sommersemester 2009 Chartparsing & CKY Algorithmus Daniel

Mehr

Übersicht. (A) Kontextfreie Sprachen (B) Syntaxanalyse (Parsing) (C) Grenzen der Kontextfreiheit

Übersicht. (A) Kontextfreie Sprachen (B) Syntaxanalyse (Parsing) (C) Grenzen der Kontextfreiheit Übersicht (A) Kontextfreie Sprachen (B) Syntaxanalyse (Parsing) (C) Grenzen der Kontextfreiheit (B) Syntaxanalyse 1. Definition Parsing 2. Einfache Parsestrategien: Top-down Bottom-Up Probleme beim Parsen

Mehr

...imbeispiel: Die Konkatenation der Blätter des Ableitungsbaums t bezeichnen wir auch mit yield(t). liefert die Konkatenation: name int + int.

...imbeispiel: Die Konkatenation der Blätter des Ableitungsbaums t bezeichnen wir auch mit yield(t). liefert die Konkatenation: name int + int. Die Konkatenation der Blätter des Ableitungsbaums t bezeichnen wir auch mit yield(t)....imbeispiel: E 0 E 1 + T 1 T 0 F 2 T 1 F 2 int F 1 int name liefert die Konkatenation: name int + int. 273 Die Grammatik

Mehr

Earley Parser. Flutura Mestani

Earley Parser. Flutura Mestani Earley Parser Flutura Mestani Informatik Seminar Algorithmen zu kontextfreien Grammatiken Wintersemester 2015/2016 Prof. Martin Hofmann, Dr. Hans Leiß Flutura Mestani 25.11.2015 Seminar Algorithmen zu

Mehr

Grundlagen der Theoretischen Informatik Musterlösungen zu ausgewählten Übungsaufgaben

Grundlagen der Theoretischen Informatik Musterlösungen zu ausgewählten Übungsaufgaben Dieses Dokument soll mehr dazu dienen, Beispiele für die formal korrekt mathematische Bearbeitung von Aufgaben zu liefern, als konkrete Hinweise auf typische Klausuraufgaben zu liefern. Die hier gezeigten

Mehr

Beschreibungskomplexität von Grammatiken Definitionen

Beschreibungskomplexität von Grammatiken Definitionen Beschreibungskomplexität von Grammatiken Definitionen Für eine Grammatik G = (N, T, P, S) führen wir die folgenden drei Komplexitätsmaße ein: Var(G) = #(N), Prod(G) = #(P ), Symb(G) = ( α + β + 1). α β

Mehr

Theoretische Grundlagen der Informatik. Vorlesung am 17. Januar INSTITUT FÜR THEORETISCHE INFORMATIK

Theoretische Grundlagen der Informatik. Vorlesung am 17. Januar INSTITUT FÜR THEORETISCHE INFORMATIK Theoretische Grundlagen der Informatik 0 17.01.2019 Torsten Ueckerdt - Theoretische Grundlagen der Informatik KIT Die Forschungsuniversität in der Helmholtz-Gemeinschaft www.kit.edu Evaluation Ergebnisse

Mehr

Klausur zur Vorlesung Grundbegriffe der Informatik 31. August 2009 mit Lösunsgsvorschlägen

Klausur zur Vorlesung Grundbegriffe der Informatik 31. August 2009 mit Lösunsgsvorschlägen Klausur zur Vorlesung Grundbegriffe der Informatik 31. August 2009 mit Lösunsgsvorschlägen Klausurnummer Vorname: Aufgabe 1 2 3 4 5 6 7 max. Punkte 4 4 6 8 6 8 8 tats. Punkte Gesamtpunktzahl: Note: Aufgabe

Mehr

Semantik: Semantik von Merkmalsstrukturen

Semantik: Semantik von Merkmalsstrukturen Spezielle Themen der KI : von Subsumption Notation: t 1 t 2 Definition: Eine Merkmalsstruktur t 1 subsumiert eine Merkmalsstruktur t 2 gdw. die Menge der von t 2 beschriebenen Elemente eine Teilmenge der

Mehr

Formale Sprachen und Automaten: Tutorium Nr. 8

Formale Sprachen und Automaten: Tutorium Nr. 8 Formale Sprachen und Automaten: Tutorium Nr. 8 15. Juni 2013 Übersicht 1 Nachtrag 2 Besprechung von Übungsblatt 7 Aufgabe 1 Aufgabe 2 Aufgabe 3 3 CFG PDA Definitionen Ein Beispiel! Aufgabe 4 Der PDA als

Mehr

Grammatikformalismen SS 2007 Ausgewählte Musterlösungen Schreiben Sie eine LFG-Grammatik, die Sätze der folgenden Form erkennt:

Grammatikformalismen SS 2007 Ausgewählte Musterlösungen Schreiben Sie eine LFG-Grammatik, die Sätze der folgenden Form erkennt: Grammatikformalismen SS 2007 Ausgewählte usterlösungen 1 LFG Übungsblatt LFG 1 1. Schreiben Sie eine LFG-Grammatik, die Sätze der folgenden Form erkennt: (1) Der Lehrer schläft. (2) Sie schenkt dem Lehrer

Mehr

Alphabet, formale Sprache

Alphabet, formale Sprache n Alphabet Alphabet, formale Sprache l nichtleere endliche Menge von Zeichen ( Buchstaben, Symbole) n Wort über einem Alphabet l endliche Folge von Buchstaben, die auch leer sein kann ( ε leere Wort) l

Mehr

2.1 Grundlagen: Kontextfreie Grammatiken

2.1 Grundlagen: Kontextfreie Grammatiken 2.1 Grundlagen: Kontextfreie Grammatiken Programme einer Programmiersprache können unbeschränkt viele Tokens enthalten, aber nur endlich viele Token-Klassen :-) Als endliches Terminal-Alphabet T wählen

Mehr

Übungszettel XI *gelöst*

Übungszettel XI *gelöst* Übungszettel XI *gelöst* 1. Aufgabe Sei folgende Grammatik G = < A, N, S, R > gegeben, wobei: A = { der, die, das, Auto, Banane, fährt, schnell, schmeckt, gut } N = {, , , , , } S

Mehr

Theoretische Grundlagen der Informatik

Theoretische Grundlagen der Informatik Theoretische Grundlagen der Informatik Vorlesung am 17. Januar 2012 INSTITUT FÜR THEORETISCHE 0 KIT 18.01.2012 Universität des Dorothea Landes Baden-Württemberg Wagner - Theoretische und Grundlagen der

Mehr

Berechenbarkeitstheorie 7. Vorlesung

Berechenbarkeitstheorie 7. Vorlesung 1 Berechenbarkeitstheorie Dr. Institut für Mathematische Logik und Grundlagenforschung WWU Münster W 15/16 Alle Folien unter Creative Commons Attribution-NonCommercial 3.0 Unported Lizenz. Das Pumpinglemma

Mehr

Formale Methoden 1. Gerhard Jäger 12. Dezember Uni Bielefeld, WS 2007/2008 1/22

Formale Methoden 1. Gerhard Jäger 12. Dezember Uni Bielefeld, WS 2007/2008 1/22 1/22 Formale Methoden 1 Gerhard Jäger Gerhard.Jaeger@uni-bielefeld.de Uni Bielefeld, WS 2007/2008 12. Dezember 2007 2/22 Bäume Baumdiagramme Ein Baumdiagramm eines Satzes stellt drei Arten von Information

Mehr

LR Parsing. Prinzip: Entwicklung des Parsebaums bottom up, von links nach rechts (Abb. 2.52)

LR Parsing. Prinzip: Entwicklung des Parsebaums bottom up, von links nach rechts (Abb. 2.52) LR Parsing Prinzip: Entwicklung des Parsebaums bottom up, von links nach rechts (Abb. 2.52) Parserkonfiguration: s 0 X 1 s 1... X m s m, t i t i 1... t n 1.Stack: enthält abwechselnd Zustand sk und Grammatiksymbol

Mehr

Python 2. Vorlesung Computerlinguistische Techniken Alexander Koller. 28. Oktober 2014

Python 2. Vorlesung Computerlinguistische Techniken Alexander Koller. 28. Oktober 2014 Python 2! Vorlesung Computerlinguistische Techniken Alexander Koller! 28. Oktober 2014 Listen Sequenz von beliebigen Werten. Literale: [], [1,2,3], [ hallo, True, -5.0] Hinten an Liste anhängen: L.append(27)

Mehr

Einführung in die Computerlinguistik Formale Grammatiken rechtslineare und kontextfreie Grammatiken Kellerautomaten

Einführung in die Computerlinguistik Formale Grammatiken rechtslineare und kontextfreie Grammatiken Kellerautomaten Einführung in die Computerlinguistik Formale Grammatiken rechtslineare und kontextfreie Grammatiken Kellerautomaten Dozentin: Wiebke Petersen 13. Foliensatz Wiebke Petersen Einführung CL 1 Formale Grammatik

Mehr

Syntax natürlicher Sprachen

Syntax natürlicher Sprachen Syntax natürlicher Sprachen 05: Dependenz und Valenz Martin Schmitt Ludwig-Maximilians-Universität München 22.11.2017 Martin Schmitt (LMU) Syntax natürlicher Sprachen 22.11.2017 1 Themen der heutigen Übung

Mehr

Shift-Reduce-Parsing: Ein einfaches Bottom-Up-Verfahren Keller Shift- und Reduce-Schritte Vorgehen des Parsers Implementation in Prolog Probleme

Shift-Reduce-Parsing: Ein einfaches Bottom-Up-Verfahren Keller Shift- und Reduce-Schritte Vorgehen des Parsers Implementation in Prolog Probleme Shift-Reduce-Parsing bersicht Shift-Reduce-Parsing: Ein einfaches Bottom-Up-Verfahren Keller Shift- und Reduce-Schritte Vorgehen des Parsers Implementation in Prolog Probleme Tilgungsregeln Zyklische Regeln

Mehr

Theoretische Grundlagen der Informatik

Theoretische Grundlagen der Informatik Theoretische Grundlagen der Informatik Vorlesung am 18.01.2011 INSTITUT FÜR THEORETISCHE INFORMATIK 0 KIT Universität des Landes Baden-Württemberg und nationales Forschungszentrum in der Helmholtz-Gemeinschaft

Mehr

Einführung in die Computerlinguistik Chart-Parsing

Einführung in die Computerlinguistik Chart-Parsing Einführung in die Computerlinguistik Chart-Parsing Dozentin: Wiebke sen 21.12.2009 Wiebke sen Einführung CL (Wie 09/10) 1 P = calls calls Wiebke sen Einführung CL (Wie 09/10) 2 P = calls calls Wiebke sen

Mehr

1. Der Begriff Informatik 2. Syntax und Semantik von Programmiersprachen - 1 -

1. Der Begriff Informatik 2. Syntax und Semantik von Programmiersprachen - 1 - 1. Der Begriff Informatik 2. Syntax und Semantik von Programmiersprachen I.2. I.2. Grundlagen von von Programmiersprachen. - 1 - 1. Der Begriff Informatik "Informatik" = Kunstwort aus Information und Mathematik

Mehr

1. Der Begriff Informatik 2. Syntax und Semantik von Programmiersprachen - 1 -

1. Der Begriff Informatik 2. Syntax und Semantik von Programmiersprachen - 1 - 1. Der Begriff Informatik 2. Syntax und Semantik von Programmiersprachen I.2. I.2. Grundlagen von von Programmiersprachen. - 1 - 1. Der Begriff Informatik "Informatik" = Kunstwort aus Information und Mathematik

Mehr

Algorithmen und Datenstrukturen I - Exkurs Formale Sprachen -

Algorithmen und Datenstrukturen I - Exkurs Formale Sprachen - Algorithmen und Datenstrukturen I - Exkurs Formale Sprachen - Thies Pfeiffer Technische Fakultät tpfeiffe@techfak.uni-bielefeld.de Vorlesung, Universität Bielefeld, Winter 2012/2013 1 / 1 Exkurs: Formale

Mehr

Wortähnlichkeit: Praktische Implementierung

Wortähnlichkeit: Praktische Implementierung Wortähnlichkeit: Praktische Implementierung Benjamin Roth Centrum für Informations- und Sprachverarbeitung Ludwig-Maximilian-Universität München beroth@cisuni-muenchende Benjamin Roth (CIS) Wortähnlichkeit:

Mehr

Sprachanalyse. Fachseminar WS 08/09 Dozent: Prof. Dr. Helmut Weber Referentin: Nadia Douiri

Sprachanalyse. Fachseminar WS 08/09 Dozent: Prof. Dr. Helmut Weber Referentin: Nadia Douiri Sprachanalyse WS 08/09 Dozent: Prof. Dr. Helmut Weber Referentin: Inhalt 1. Formale Sprachen 2. Chomsky-Hierarchie 2 FORMALE SPRACHE 1. WAS IST EINE SPRACHE? 2. WIE BESCHREIBT MAN EINE SPRACHE? 3. WAS

Mehr

Einführung in die theoretische Informatik Sommersemester 2017 Übungsblatt Lösungsskizze 7

Einführung in die theoretische Informatik Sommersemester 2017 Übungsblatt Lösungsskizze 7 Prof. J. Esparza Technische Universität München S. Sickert, J. Krämer KEINE ABGABE Einführung in die theoretische Informatik Sommersemester 2017 Übungsblatt 7 Übungsblatt Wir unterscheiden zwischen Übungs-

Mehr

Binärbäume und Pfade

Binärbäume und Pfade Binärbäume und Pfade Bevor wir uns dem Pumping Lemma für Typ-2 Sprachen widmen, wollen wir einen einfachen Satz über Binärbäume beweisen. Als Binärbaum bezeichnen wir hier einen Baum, bei dem jeder Knoten,

Mehr

Spezielle Themen der KI. NLP Natural Language Processing Parsing

Spezielle Themen der KI. NLP Natural Language Processing Parsing Spezielle Themen der KI NLP Natural Language Processing Parsing Parsing Strategien top-down: Ausgehend von S Hypothesenbildung und Verifikation anhand der Grammatikregeln Ersetzung nicht-terminaler Symbole

Mehr

Hauptklausur zur Vorlesung Theoretische Grundlagen der Informatik Wintersemester 2011/2012

Hauptklausur zur Vorlesung Theoretische Grundlagen der Informatik Wintersemester 2011/2012 Institut für Theoretische Informatik Lehrstuhl Prof. Dr. D. Wagner Hauptklausur zur Vorlesung Theoretische Grundlagen der Informatik Wintersemester 2011/2012 Hier Aufkleber mit Name und Matrikelnr. anbringen

Mehr

MODIFIKATIONEN DES TOMITA-PARSERS FÜR ID/LP UND FEATURE GRAMMARS Jens Woch

MODIFIKATIONEN DES TOMITA-PARSERS FÜR ID/LP UND FEATURE GRAMMARS Jens Woch Fachbeiträge MODIFIKATIONEN DES TOMITA-PARSERS FÜR ID/LP UND FEATURE GRAMMARS Jens Woch Abstract: Die Verwendung von ID/LP-Grammatiken und komplexen Symbolen ist bei Flektionsreichen und in der Wortstellung

Mehr

3 Syntax von Programmiersprachen

3 Syntax von Programmiersprachen 3 Syntax von Programmiersprachen Syntax ( Lehre vom Satzbau ) formale Beschreibung des Aufbaus der Worte und Sätze, die zu einer Sprache gehören; im Falle einer Programmiersprache Festlegung, wie Programme

Mehr

Verarbeitung (Unifikation)

Verarbeitung (Unifikation) Suche nach einem effizienten Verarbeitungsalgorithmus für im besten Fall unter Berücksichtigung aller angegebenen Operationen, mindestens aber der Unifikation. Unifikation bildet aus zwei MS eine neue

Mehr

Einführung in die Computerlinguistik

Einführung in die Computerlinguistik Einführung in die Computerlinguistik Kontextfreie Sprachen und Pushdown-Automaten Dozentin: Wiebke Petersen WS 2004/2005 Wiebke Petersen Formale Komplexität natürlicher Sprachen WS 03/04 Wiederholung c

Mehr

VU Software Paradigmen / SS 2014

VU Software Paradigmen / SS 2014 VU Software Paradigmen 716.060 / SS 2014 Ralph Ankele ralph.ankele@tugraz.at Termine Ausgabe: 19. März (heute) Fragestunde: 24. März Abgabe: 09. April(bis 16:00 Uhr) Einsichtsnahme: xx. April (16:00 Uhr)

Mehr

Lexikalische Programmanalyse der Scanner

Lexikalische Programmanalyse der Scanner Der Scanner führt die lexikalische Analyse des Programms durch Er sammelt (scanned) Zeichen für Zeichen und baut logisch zusammengehörige Zeichenketten (Tokens) aus diesen Zeichen Zur formalen Beschreibung

Mehr

F2 Zusammenfassung Letzte Tips zur Klausur

F2 Zusammenfassung Letzte Tips zur Klausur F2 Zusammenfassung Letzte Tips zur Klausur Berndt Farwer FB Informatik, Uni HH F2-ommersemester 2001-(10.6.) p.1/15 Funktionen vs. Relationen Funktionen sind eindeutig, Relationen brauchen nicht eindeutig

Mehr

Vorlesung Theoretische Informatik (Info III)

Vorlesung Theoretische Informatik (Info III) 1 Vorlesung Theoretische Informatik (Info III) Prof. Dr. Dorothea Wagner Dipl.-Math. Martin Holzer 22. Januar 2008 Einleitung Motivation 2 Thema heute Kontextfreie Grammatiken: Lemma von Ogden Eigenschaften

Mehr

Einführung in die Programmiertechnik

Einführung in die Programmiertechnik Einführung in die Programmiertechnik Formale Beschreibung von Programmiersprachen Lexikalische Regeln Definition von Wörtern (Lexem, Token) Gruppierung von Zeichen Lexikalische Kategorien: Klassen ähnlicher

Mehr

Merkmale und Vererbung in unifikationsbasierten Lexika

Merkmale und Vererbung in unifikationsbasierten Lexika Gerold Schneider: Lexikonaufbau und Morphologieanalyseverfahren Seite 1 Merkmale und Vererbung in unifikationsbasierten Lexika Morphologieanalyse und Lexikonaufbau (14. Vorlesung) Dozent: Gerold Schneider

Mehr

Probabilistic Context Free Grammars, Part II

Probabilistic Context Free Grammars, Part II Probabilistic Context Free Grammars, Part II Prof Dr. Matthew Crocker Universität des Saarlandes 16. Juli 2015 Matthew Crocker (UdS) PCFG II 16. Juli 2015 1 / 25 Themen heute: 1 Wiederholung: PCFG 2 Formeln

Mehr

Grammatiken in Prolog

Grammatiken in Prolog 12. Grammatiken in Prolog 12-1 Grammatiken in Prolog Allgemeines: Gedacht zur Verarbeitung natürlicher Sprache. Dort braucht man kompliziertere Grammatiken als etwa im Compilerbau, andererseits sind die

Mehr

Idee: Wir definieren: 2.4 Topdown Parsing. uaβ mit

Idee: Wir definieren: 2.4 Topdown Parsing. uaβ mit 2.4 Topdown Parsing Idee: Benutze den Item-Kellerautomaten. Benutze die nächsten k Zeichen, um die Regeln für die Expansionen zu bestimmen ;-) Eine Grammatik heißt LL(k), falls dies immer eindeutig möglich

Mehr

Automatisches Verstehen gesprochener Sprache

Automatisches Verstehen gesprochener Sprache Automatisches Verstehen gesprochener Sprache 6. Syntaxanalyse Martin Hacker Bernd Ludwig Günther Görz Professur für Künstliche Intelligenz Department Informatik Friedrich-Alexander-Universität Erlangen-Nürnberg

Mehr

Automaten und Formale Sprachen alias Theoretische Informatik. Sommersemester 2012

Automaten und Formale Sprachen alias Theoretische Informatik. Sommersemester 2012 Automaten und Formale Sprachen alias Theoretische Informatik Sommersemester 2012 Dr. Sander Bruggink Übungsleitung: Jan Stückrath Sander Bruggink Automaten und Formale Sprachen 1 Einschub: Kellerautomaten

Mehr

Universität Karlsruhe (TH)

Universität Karlsruhe (TH) Universität Karlsruhe (TH) Lehrstuhl für Programmierparadigmen prachtechnologie und Compiler W 2008/2009 http://pp.info.uni-karlsruhe.de/ Dozent: Prof. Dr.-Ing. G. nelting snelting@ipd.info.uni-karlsruhe.de

Mehr

6 Kontextfreie Grammatiken

6 Kontextfreie Grammatiken 6 Kontextfreie Grammatiken Reguläre Grammatiken und damit auch reguläre Ausdrücke bzw. endliche Automaten haben bezüglich ihres Sprachumfangs Grenzen. Diese Grenzen resultieren aus den inschränkungen,

Mehr

Theoretische Grundlagen der Informatik

Theoretische Grundlagen der Informatik Theoretische Grundlagen der Informatik Vorlesung am 13.01.2011 INSTITUT FÜR THEORETISCHE INFORMATIK 0 KIT Universität des Landes Baden-Württemberg und nationales Forschungszentrum in der Helmholtz-Gemeinschaft

Mehr

I.5. Kontextfreie Sprachen

I.5. Kontextfreie Sprachen I.5. Kontextfreie prachen Zieht man in Betracht, dass BNF-yteme gerade so beschaffen sind, dass auf der linken eite immer genau ein Nichtterminal steht, so sind das also gerade die Ableitungsregeln einer

Mehr

Klausur SoSe 2013 / PROBEKLAUSUR

Klausur SoSe 2013 / PROBEKLAUSUR Die Anzahl der Aufgaben, das Punkteschema, die Themenschwerpunkte, etc. können in der echten Klausur unterschiedlich sein! Uni Osnabrück / Theoretische Informatik Prof. Dr. M. Chimani Informatik D: Einführung

Mehr

Aufgabe Mögliche Punkte Erreichte Punkte a b c d Σ a b c d Σ x1 13

Aufgabe Mögliche Punkte Erreichte Punkte a b c d Σ a b c d Σ x1 13 Universität Karlsruhe Theoretische Informatik Fakultät für Informatik WS 2003/04 ILKD Prof. Dr. D. Wagner 14. April 2004 2. Klausur zur Vorlesung Informatik III Wintersemester 2003/2004 Hier Aufkleber

Mehr

Grundlagen der theoretischen Informatik

Grundlagen der theoretischen Informatik Grundlagen der theoretischen Informatik Kurt Sieber Fakultät IV, Department ETI Universität Siegen SS 2013 Vorlesung vom 04.06.2013 An den Transitionen sieht man zunächst, dass nur die folgenden Zustandsübergänge

Mehr

Theoretische Grundlagen der Informatik

Theoretische Grundlagen der Informatik Theoretische Grundlagen der Informatik Vorlesung am 15.01.2015 INSTITUT FÜR THEORETISCHE 0 KIT 15.01.2015 Universität des Dorothea Landes Baden-Württemberg Wagner - Theoretische und Grundlagen der Informatik

Mehr