Syntax natürlicher Sprachen

Ähnliche Dokumente
Syntax natürlicher Sprachen

Kontextfreie Grammatiken

Grammatik Prüfung möglich, ob eine Zeichenfolge zur Sprache gehört oder nicht

Parsing mit NLTK. Parsing mit NLTK. Parsing mit NLTK. Parsing mit NLTK. Beispiel: eine kleine kontextfreie Grammatik (cf. [BKL09], Ch. 8.

Sprachen sind durch folgenden Aufbau gekennzeichnet:

Übungsblatt 1 - Lösung

Interdisziplinäre fachdidaktische Übung: Modelle für Sprachen in der Informatik. SS 2016: Grossmann, Jenko

Formale Sprachen und Automaten: Tutorium Nr. 8

Übersicht. Syntax - Linguistische und formale Grundlagen. 2 Einführung

Kapitel IV Formale Sprachen und Grammatiken

Automatisches Verstehen gesprochener Sprache

Charts. Motivation. Grundfrage. Chart als Graph

Lösungen zum Aufgabenblatt 3 Syntax natürlicher Sprachen

Chartparsing & CKY Algorithmus

Einführung in die Computerlinguistik

Kontextsensitive Sprachen

Einführung in die Computerlinguistik Formale Grammatiken rechtslineare und kontextfreie Grammatiken Kellerautomaten

Automatentheorie und formale Sprachen reguläre Ausdrücke

Kontextfreie Grammatiken. Kontextfreie Grammatiken 1 / 48

12. LA- und PS-Hierarchien im Vergleich

Theorie der Informatik. Theorie der Informatik. 6.1 Einführung. 6.2 Alphabete und formale Sprachen. 6.3 Grammatiken. 6.4 Chomsky-Hierarchie

Algorithmen und Datenstrukturen I - Exkurs Formale Sprachen -

Algorithmen und Datenstrukturen I - Exkurs Formale Sprachen -

Einführung Computerlinguistik. Konstituentensyntax II

Grundlagen der Theoretischen Informatik

7. Syntax: Grammatiken, EBNF

Mathematische Grundlagen der Computerlinguistik formale Sprachen

Einführung in die Computerlinguistik reguläre Sprachen und endliche Automaten

Einführung in die Computerlinguistik reguläre Sprachen und endliche Automaten

TU Kaiserslautern. Übungsblatt 2: Software-Entwicklung 1 (WS 2017/18) Hinweise zu Einreichaufgaben. Hinweise zu den Übungen

Syntax von Programmiersprachen

Einführung in die Sprachwissenschaft -Tutorium-

Inkrementelle Syntax

Ist eine algorithmische Problemstellung lösbar und wenn ja, mit welchen Mitteln? was ist eine algorithmische Problemstellung?

Alphabet, formale Sprache

Grammatiken. Grammatiken sind regelbasierte Kalküle zur Konstruktion von Systemen und Sprachen Überprüfung von Systemen und Sprachen

Kontextfreie Grammatiken. Kontextfreie Grammatiken 1 / 45

Chart-Parsing. bersicht. Ziel. Motivation: Bisher vorgestellte Verfahren sind nicht effizient Grundidee des Chart-Parsing Datenstruktur

Grammatiken und ANTLR

Linguistische Informatik

Künstliche Intelligenz

Syntax von Programmiersprachen

1. Stellen Sie die Konstituentenstruktur der folgenden Sätze als Baumdiagramme dar:

Einführung in die Linguistik, Teil 4

Sprachen/Grammatiken eine Wiederholung

Probabilistische kontextfreie Grammatiken

Kapitel 2. Methoden zur Beschreibung von Syntax

3 Syntax von Programmiersprachen

Grammatiken. Eine Grammatik G mit Alphabet Σ besteht aus: Variablen V. Startsymbol S V. Kurzschreibweise G = (V, Σ, P, S)

Automaten und formale Sprachen Klausurvorbereitung

1 Formale Sprachen, reguläre und kontextfreie Grammatiken

Formale Sprachen, reguläre und kontextfreie Grammatiken

Einführung in die Computerlinguistik

Dativobjekt! Akkusativobjekt! Genitivobjekt! Präpositionalobjekt! = Ziel der Handlung, Patiens!

Einführung in die Linguistik. Syntax: Lösung

Einführung in die Computerlinguistik reguläre Sprachen und endliche Automaten

Einführung in PROLOG 7 Kontextfreie Grammatiken

Programmierkurs Python II

Einführung in die Semantik, 10. Sitzung Generalisierte Quanto

Ergänzende Betrachtungen zur syntaktischen Dependenz

Mathematik-Vorkurs für Informatiker Formale Sprachen 1

Formale Sprachen. Inhaltsverzeichnis. M. Jakob. 10. Dezember Allgemeine Einführung. Aufbau formaler Sprachen

LR-Parser, Shift-Reduce-Verfahren

Spezielle Themen der KI. NLP Natural Language Processing Parsing

Übersicht. SD Einführung in die CL,

FORMALE SYSTEME. Sprachen beschreiben. Wiederholung. Wie kann man Sprachen beschreiben? 2. Vorlesung: Grammatiken und die Chomsky-Hierarchie

3 Syntax von Programmiersprachen

Inhalt Kapitel 11: Formale Syntax und Semantik

6 Modellierung von Strukturen 6.1 Kontextfreie Grammatiken

1 Der Baum. Informatik I: Einführung in die Programmierung 11. Bäume. Bäume in der Informatik. Bäume in der Informatik - Definition.

Theoretische Informatik 2 bzw. Formale Sprachen und Berechenbarkeit. Sommersemester Herzlich willkommen!

Der Earley-Algorithmus.

Syntax und Morphologie

Parsing-EinfŸhrung Ð 1

Daten und Algorithmen

1 Der Baum. Informatik I: Einführung in die Programmierung 11. Bäume. Bäume in der Informatik. Bäume in der Informatik - Definition.

Automatentheorie und formale Sprachen rechtslineare Grammatiken

Einführung in die Programmiertechnik

a) Erklären Sie, was eine SOV Sprache ist und was eine V2 Sprache ist. b) Welche Wortstellungsmuster sind eher selten in Sprachen der Welt?

Automatentheorie und formale Sprachen

Formale Sprachen, Automaten, Compiler

Schulinterner Lehrplan zum Kernlehrplan für die gymnasiale Oberstufe. Informatik Q2. Stand: 02/2016 Status: Gültig

Grundlagen der Theoretischen Informatik

Prof. Dr. Wolfgang Schramm. Vorname:... Matrikel-Nr.:... Unterschrift:...

Gliederung. Natürlichsprachliche Systeme I. Merkmalsbasierte Grammatiken. Merkmalsbasierte Grammatiken. Merkmalsbasierte Grammatiken mit NLTK

Einführung in die Computerlinguistik reguläre Sprachen und endliche Automaten

Fragenkatalog 2. Abgabegespräch Formale Modellierung 3 Reguläre Sprachen

Formale Methoden 1. Gerhard Jäger 28. November Uni Bielefeld, WS 2007/2008 1/15

Syntax. Valenz Aktanten Rektionsmodell

DisMod-Repetitorium Tag 4

Grundbegriffe der Informatik

Formale Sprachen. Inhalte. Lehrplan. Hinweis

Kontextfreie Sprachen

Aufgabentypen die in der Klausur vorkommen

Transkript:

Syntax natürlicher Sprachen 02: Grammatik und Bäume Martin Schmitt Ludwig-Maximilians-Universität München 25.10.2017 Martin Schmitt (LMU) Syntax natürlicher Sprachen 25.10.2017 1

1 Syntax im NLTK 2 Grammatik 3 Bäume 4 Hausaufgaben Martin Schmitt (LMU) Syntax natürlicher Sprachen 25.10.2017 2

Nächstes Thema 1 Syntax im NLTK 2 Grammatik 3 Bäume 4 Hausaufgaben Martin Schmitt (LMU) Syntax natürlicher Sprachen 25.10.2017 3

Eine erste syntaktische Analyse I Aufgabe 1 Kreieren Sie Ihre ersten Syntaxbäume, indem Sie das folgende Python-Skript ausführen! Warum gibt die parse-funktion in Zeile 16 des Skripts vermutlich eine Sequenz zurück? Warum ist die Alternative tree = parser.parse(sent) weniger wünschenswert? Worin liegen die Unterschiede zwischen den ausgegebenen Bäumen? Warum ist der gegebene Satz I shot an elephant in my pajamassyntaktisch ambig? Martin Schmitt (LMU) Syntax natürlicher Sprachen 25.10.2017 4

Eine erste syntaktische Analyse II 1 import nltk 2 3 grammar = nltk. CFG. fromstring ( """ 4 S -> NP VP 5 PP -> P NP 6 NP - > Det N Det N PP ' I ' 7 VP - > V NP VP PP 8 Det -> 'an ' 'my ' 9 N -> ' elephant ' ' pajamas ' 10 V -> ' shot ' 11 P -> 'in ' 12 """ ) 13 parser = nltk. ChartParser ( grammar ) 14 15 sent = "I shot an elephant in my pajamas ". split () Martin Schmitt (LMU) Syntax natürlicher Sprachen 25.10.2017 5

Eine erste syntaktische Analyse III 16 for tree in parser. parse ( sent ): 17 print ( tree ) 18 tree. draw () Martin Schmitt (LMU) Syntax natürlicher Sprachen 25.10.2017 6

Martin Schmitt (LMU) Syntax natürlicher Sprachen 25.10.2017 7

Martin Schmitt (LMU) Syntax natürlicher Sprachen 25.10.2017 8

Nächstes Thema 1 Syntax im NLTK 2 Grammatik 3 Bäume 4 Hausaufgaben Martin Schmitt (LMU) Syntax natürlicher Sprachen 25.10.2017 9

Was ist Grammatik? Aufgabe 2 Erläutern Sie die drei Grammatikbegrie, die den folgenden Sätzen zugrunde liegen. Zeigen Sie am Beispiel von Satz (1) den Unterschied zwischen Grammatik und Syntax auf. (1) Die Grammatik des Lateinischen ist schwer. Vor allem die Syntax bereitet Schwierigkeiten. (2) Der Duden ist eine Grammatik. (3) Der Begründer der Dependenzgrammatik ist Lucien Tesnière. Martin Schmitt (LMU) Syntax natürlicher Sprachen 25.10.2017 10

Ebenen linguistischer Strukturbeschreibung Aufgabe 3 Welche Hierachie-Ebenen lassen sich in der Beschreibung des Aufbaus sprachlicher Strukturen unterscheiden? Erklären Sie den Unterschied zwischen dem Wortbegri einer natürlichen Sprache und dem Wortbegri einer formalen Sprache (was sind die Blätter des Syntaxbaums einer Ableitung eines natürlichsprachlichen Satzes in einer die Sprache modellierenden formalen Grammatik?) Martin Schmitt (LMU) Syntax natürlicher Sprachen 25.10.2017 11

Wiederholung: Mathematischer Hintergrund Formale Grammatik Eine formale Grammatik G = (N, Σ, P, S) besteht aus einer Menge von nicht-terminalen Symbolen N einer Menge von terminalen Symbolen Σ (Alphabet) einer Menge von Produktionsregeln P bei CFGs: N (Σ N) einem speziellen Startsymbol S N mit N Σ = Martin Schmitt (LMU) Syntax natürlicher Sprachen 25.10.2017 12

Natürliche vs. formale Sprachen Alphabete Bei formalen Sprachen z. B. Σ = {a, b, c} Bei natürlichen Sprachen z. B. Σ = {cat, dog, chased} Typische "Wörter" Bei formalen Sprachen z. B. ab, aabb, aaabbb,... Bei natürlichen Sprachen z. B. the dog chased the cat, the cat chased the dog,... Martin Schmitt (LMU) Syntax natürlicher Sprachen 25.10.2017 13

Nächstes Thema 1 Syntax im NLTK 2 Grammatik 3 Bäume 4 Hausaufgaben Martin Schmitt (LMU) Syntax natürlicher Sprachen 25.10.2017 14

Darstellung syntaktischer Strukturen Aufgabe 4 In welcher Form ist die syntaktische Struktur eines natürlichsprachlichen Satzes in einer formalen Analyse repräsentiert? (Drei mögliche Benennungen.) Wie kann eine solche Struktur dargestellt werden? (vgl. print(tree) vs tree.draw() im NLTK) Martin Schmitt (LMU) Syntax natürlicher Sprachen 25.10.2017 15

Aufgabe 4 (Forts.) Geben Sie zu folgendem Syntaxbaum den Klammerausdruck an: I shot an elephant in my pajamas I shot an elephant in my pajamas shot an elephant in my pajamas an elephant in my pajamas Geben Sie für zu folgendem Klammerausdruck den Syntaxbaum an: (4) [ [I] [ [ [shot] [an elephant] ] [in my pajamas] ] ] Martin Schmitt (LMU) Syntax natürlicher Sprachen 25.10.2017 16

Nächstes Thema 1 Syntax im NLTK 2 Grammatik 3 Bäume 4 Hausaufgaben Martin Schmitt (LMU) Syntax natürlicher Sprachen 25.10.2017 17

Ambiguität Aufgabe 5 Sehen Sie sich die folgenden englischen Sätze an. Können Sie sich jeweils zwei unterschiedliche Interpretationen vorstellen? (5) Fighting animals could be dangerous. (6) Visiting relatives can be tiresome. Beantworten Sie insbesondere folgende Fragen: Sind die einzelnen Wörter ambig? Falls nicht, woher kommt die Ambiguität? Martin Schmitt (LMU) Syntax natürlicher Sprachen 25.10.2017 18

Fragen zu NLTK-Kapitel 8.1 Aufgabe 6 Lesen Sie das Vorwort von NLTK-Kapitel 8 sowie das Kapitel 8.1 ('Some Grammatical Dilemmas'): http://www.nltk.org/book/ch08.html. Beantworten Sie insbesondere folgende Fragen: Hinsichtlich welcher beiden syntaktischen Grundprinzipien werden natürliche Sprachen mit formalen Methoden analysiert? Welche beiden Mittel werden für eine solche Analyse verwendet? (Hinweis: s. Aufgabe 1 dieses Übungsblattes) Welche Entscheidung bzgl. eines Satzes wird in dieser Analyse getroen? Welchen Vorteil hat die Modellierung der Satzstruktur mit Hilfe einer formalen Grammatik? Martin Schmitt (LMU) Syntax natürlicher Sprachen 25.10.2017 19