Syntax natürlicher Sprachen 02: Grammatik und Bäume Martin Schmitt Ludwig-Maximilians-Universität München 25.10.2017 Martin Schmitt (LMU) Syntax natürlicher Sprachen 25.10.2017 1
1 Syntax im NLTK 2 Grammatik 3 Bäume 4 Hausaufgaben Martin Schmitt (LMU) Syntax natürlicher Sprachen 25.10.2017 2
Nächstes Thema 1 Syntax im NLTK 2 Grammatik 3 Bäume 4 Hausaufgaben Martin Schmitt (LMU) Syntax natürlicher Sprachen 25.10.2017 3
Eine erste syntaktische Analyse I Aufgabe 1 Kreieren Sie Ihre ersten Syntaxbäume, indem Sie das folgende Python-Skript ausführen! Warum gibt die parse-funktion in Zeile 16 des Skripts vermutlich eine Sequenz zurück? Warum ist die Alternative tree = parser.parse(sent) weniger wünschenswert? Worin liegen die Unterschiede zwischen den ausgegebenen Bäumen? Warum ist der gegebene Satz I shot an elephant in my pajamassyntaktisch ambig? Martin Schmitt (LMU) Syntax natürlicher Sprachen 25.10.2017 4
Eine erste syntaktische Analyse II 1 import nltk 2 3 grammar = nltk. CFG. fromstring ( """ 4 S -> NP VP 5 PP -> P NP 6 NP - > Det N Det N PP ' I ' 7 VP - > V NP VP PP 8 Det -> 'an ' 'my ' 9 N -> ' elephant ' ' pajamas ' 10 V -> ' shot ' 11 P -> 'in ' 12 """ ) 13 parser = nltk. ChartParser ( grammar ) 14 15 sent = "I shot an elephant in my pajamas ". split () Martin Schmitt (LMU) Syntax natürlicher Sprachen 25.10.2017 5
Eine erste syntaktische Analyse III 16 for tree in parser. parse ( sent ): 17 print ( tree ) 18 tree. draw () Martin Schmitt (LMU) Syntax natürlicher Sprachen 25.10.2017 6
Martin Schmitt (LMU) Syntax natürlicher Sprachen 25.10.2017 7
Martin Schmitt (LMU) Syntax natürlicher Sprachen 25.10.2017 8
Nächstes Thema 1 Syntax im NLTK 2 Grammatik 3 Bäume 4 Hausaufgaben Martin Schmitt (LMU) Syntax natürlicher Sprachen 25.10.2017 9
Was ist Grammatik? Aufgabe 2 Erläutern Sie die drei Grammatikbegrie, die den folgenden Sätzen zugrunde liegen. Zeigen Sie am Beispiel von Satz (1) den Unterschied zwischen Grammatik und Syntax auf. (1) Die Grammatik des Lateinischen ist schwer. Vor allem die Syntax bereitet Schwierigkeiten. (2) Der Duden ist eine Grammatik. (3) Der Begründer der Dependenzgrammatik ist Lucien Tesnière. Martin Schmitt (LMU) Syntax natürlicher Sprachen 25.10.2017 10
Ebenen linguistischer Strukturbeschreibung Aufgabe 3 Welche Hierachie-Ebenen lassen sich in der Beschreibung des Aufbaus sprachlicher Strukturen unterscheiden? Erklären Sie den Unterschied zwischen dem Wortbegri einer natürlichen Sprache und dem Wortbegri einer formalen Sprache (was sind die Blätter des Syntaxbaums einer Ableitung eines natürlichsprachlichen Satzes in einer die Sprache modellierenden formalen Grammatik?) Martin Schmitt (LMU) Syntax natürlicher Sprachen 25.10.2017 11
Wiederholung: Mathematischer Hintergrund Formale Grammatik Eine formale Grammatik G = (N, Σ, P, S) besteht aus einer Menge von nicht-terminalen Symbolen N einer Menge von terminalen Symbolen Σ (Alphabet) einer Menge von Produktionsregeln P bei CFGs: N (Σ N) einem speziellen Startsymbol S N mit N Σ = Martin Schmitt (LMU) Syntax natürlicher Sprachen 25.10.2017 12
Natürliche vs. formale Sprachen Alphabete Bei formalen Sprachen z. B. Σ = {a, b, c} Bei natürlichen Sprachen z. B. Σ = {cat, dog, chased} Typische "Wörter" Bei formalen Sprachen z. B. ab, aabb, aaabbb,... Bei natürlichen Sprachen z. B. the dog chased the cat, the cat chased the dog,... Martin Schmitt (LMU) Syntax natürlicher Sprachen 25.10.2017 13
Nächstes Thema 1 Syntax im NLTK 2 Grammatik 3 Bäume 4 Hausaufgaben Martin Schmitt (LMU) Syntax natürlicher Sprachen 25.10.2017 14
Darstellung syntaktischer Strukturen Aufgabe 4 In welcher Form ist die syntaktische Struktur eines natürlichsprachlichen Satzes in einer formalen Analyse repräsentiert? (Drei mögliche Benennungen.) Wie kann eine solche Struktur dargestellt werden? (vgl. print(tree) vs tree.draw() im NLTK) Martin Schmitt (LMU) Syntax natürlicher Sprachen 25.10.2017 15
Aufgabe 4 (Forts.) Geben Sie zu folgendem Syntaxbaum den Klammerausdruck an: I shot an elephant in my pajamas I shot an elephant in my pajamas shot an elephant in my pajamas an elephant in my pajamas Geben Sie für zu folgendem Klammerausdruck den Syntaxbaum an: (4) [ [I] [ [ [shot] [an elephant] ] [in my pajamas] ] ] Martin Schmitt (LMU) Syntax natürlicher Sprachen 25.10.2017 16
Nächstes Thema 1 Syntax im NLTK 2 Grammatik 3 Bäume 4 Hausaufgaben Martin Schmitt (LMU) Syntax natürlicher Sprachen 25.10.2017 17
Ambiguität Aufgabe 5 Sehen Sie sich die folgenden englischen Sätze an. Können Sie sich jeweils zwei unterschiedliche Interpretationen vorstellen? (5) Fighting animals could be dangerous. (6) Visiting relatives can be tiresome. Beantworten Sie insbesondere folgende Fragen: Sind die einzelnen Wörter ambig? Falls nicht, woher kommt die Ambiguität? Martin Schmitt (LMU) Syntax natürlicher Sprachen 25.10.2017 18
Fragen zu NLTK-Kapitel 8.1 Aufgabe 6 Lesen Sie das Vorwort von NLTK-Kapitel 8 sowie das Kapitel 8.1 ('Some Grammatical Dilemmas'): http://www.nltk.org/book/ch08.html. Beantworten Sie insbesondere folgende Fragen: Hinsichtlich welcher beiden syntaktischen Grundprinzipien werden natürliche Sprachen mit formalen Methoden analysiert? Welche beiden Mittel werden für eine solche Analyse verwendet? (Hinweis: s. Aufgabe 1 dieses Übungsblattes) Welche Entscheidung bzgl. eines Satzes wird in dieser Analyse getroen? Welchen Vorteil hat die Modellierung der Satzstruktur mit Hilfe einer formalen Grammatik? Martin Schmitt (LMU) Syntax natürlicher Sprachen 25.10.2017 19