Syntax natürlicher Sprachen 03: Phrasen und Konstituenten Martin Schmitt Ludwig-Maximilians-Universität München 08.11.2017 Martin Schmitt (LMU) Syntax natürlicher Sprachen 08.11.2017 1
Themen der heutigen Übung 1 Part of Speech 2 Phrasen und Konstituenten 3 Hausaufgaben Martin Schmitt (LMU) Syntax natürlicher Sprachen 08.11.2017 2
Nächstes Thema 1 Part of Speech 2 Phrasen und Konstituenten 3 Hausaufgaben Martin Schmitt (LMU) Syntax natürlicher Sprachen 08.11.2017 3
Lexikalische Kategorien Wortarten Mengen mit gleichen Eigenschaften Bsp.: Substantiv, Adjektiv, Personalpronomen, Indenitpronomen etc. Tagset Menge von konkreten Tags/Labels/Etiketten Bsp.: Universal Dependencies, Penn Treebank, Brown Corpus Tagset Martin Schmitt (LMU) Syntax natürlicher Sprachen 08.11.2017 4
Universal Dependencies POS-Tagset Universal POS Tags Open class words Closed class words Other ADJ ADP PUNCT ADV AUX SYM INTJ CCONJ X NOUN DET PROPN NUM VERB PART PRON SCONJ Martin Schmitt (LMU) Syntax natürlicher Sprachen 08.11.2017 5
Wortarten Aufgabe 1 Bestimmen Sie die Wortarten des folgenden Satzes. Geben Sie jeweils das entsprechende Tag aus dem Universal Dependency a Tagset an. (1) Sie gab ihm das neue Buch von Chomsky, aber er zeigte kein Interesse daran. a http://universaldependencies.org/u/pos/ Martin Schmitt (LMU) Syntax natürlicher Sprachen 08.11.2017 6
Wortarten im Kontext Aufgabe 2 Diskutieren Sie, ob es sich bei dem Wort gerne in (2) um ein Adverb oder ein Adjektiv handelt. (2) Er spielt gerne Schach. Um welche Wortart handelt es sich bei dem Lexem gut in Satz (3)? Diskutieren Sie die Probleme, die hier bei der Wortartenbestimmung auftreten. (3) Er spielt gut Schach. Martin Schmitt (LMU) Syntax natürlicher Sprachen 08.11.2017 7
Lösung zu Aufgabe 2 Wortarten im Kontext gerne ist ein Adverb nicht ektierbar fungiert als Satzglied (Adverbial) bezeichnet die näheren Umstände des im Verb ausgedrückten Geschehens gut ist ein Adjektiv (in adverbialer Funktion) potentiell ektierbar Adjektiv modiziert das Verbalgeschehen Adverb Martin Schmitt (LMU) Syntax natürlicher Sprachen 08.11.2017 8
Nächstes Thema 1 Part of Speech 2 Phrasen und Konstituenten 3 Hausaufgaben Martin Schmitt (LMU) Syntax natürlicher Sprachen 08.11.2017 9
Konstituenten syntagmatische Einheiten (Wörter, Phrasen, Teilsätze) Konstituententests dienen der Identikation von Konstituenten. Substitutionstest / Ersatzprobe Pronominalisierung Permutationstest / Verschiebeprobe Eliminierungstest / Weglassprobe Koordinationstest Martin Schmitt (LMU) Syntax natürlicher Sprachen 08.11.2017 10
Phrasen sind Konstituenten haben einen Kopf Dependenz, Übertragung syntaktischer Eigenschaften Phrasenkategorie = Konstituentenklasse = im gleichen Kontext austauschbare Konstituenten Kategorien im Deutschen Nominalphrase, Verbalphrase, Präpositionalphrase, Adjektivphrase, Adverbphrase Martin Schmitt (LMU) Syntax natürlicher Sprachen 08.11.2017 11
Phrasenstruktur Aufgabe 3 Geben Sie für den folgenden Satz einen Phrasenstrukturbaum an. (4) Die Studierenden schenkten ihnen ein Buch von Chomsky. Martin Schmitt (LMU) Syntax natürlicher Sprachen 08.11.2017 12
Konstituententests Aufgabe 4 Füllen Sie folgende Tabelle aus, indem Sie den jeweils angegebenen Konstituententest an Satz (5) ausführen. (5) Die Studierenden schenkten ihnen ein Buch über Fuÿball. Wortgruppe Substitutionstest Eliminierungstest Permutationstest Konstituente? Die Studierenden ihnen ein Buch über Fuÿball über Fuÿball Martin Schmitt (LMU) Syntax natürlicher Sprachen 08.11.2017 13
Phrasen und Konstituenten *Aufgabe 5 Erläutern Sie am Beispiel des Wortes Verloren im folgenden Satz den Unterschied zwischen Konstituente und Phrase. (6) Verloren hat er seinen Schlüsselbund zwar noch nie, aber oft genug verlegt. Martin Schmitt (LMU) Syntax natürlicher Sprachen 08.11.2017 14
Nächstes Thema 1 Part of Speech 2 Phrasen und Konstituenten 3 Hausaufgaben Martin Schmitt (LMU) Syntax natürlicher Sprachen 08.11.2017 15
Phrasenstruktur Aufgabe 6 Zerlegen Sie den folgenden Satz in seine Konstituenten. Stellen Sie die Konstituentenstruktur mit einem Kastendiagramm dar: (7) Die Kunst des Ausruhens ist ein Teil der Kunst des Arbeitens. Martin Schmitt (LMU) Syntax natürlicher Sprachen 08.11.2017 16
Konstituententests Aufgabe 7 Zeigen Sie mit dem Permutations- und dem Substitutionstest, dass es sich in Satz (8) bei der Wortverbindung nur mit einem Schritt um eine Konstituente handelt. (8) Eine Reise von tausend Meilen beginnt auch nur mit einem Schritt. Martin Schmitt (LMU) Syntax natürlicher Sprachen 08.11.2017 17
Besprechung Blatt 2 (I) Aufgabe 6 Fragen zu NLTK-Kapitel 8.1 Lesen Sie das Vorwort von NLTK-Kapitel 8 sowie das Kapitel 8.1 ('Some Grammatical Dilemmas'): http://www.nltk.org/book/ch08.html. Beantworten Sie insbesondere folgende Fragen: Hinsichtlich welcher beiden syntaktischen Grundprinzipien werden natürliche Sprachen mit formalen Methoden analysiert? Welche beiden Mittel werden für eine solche Analyse verwendet? (Hinweis: s. Aufgabe 1 dieses Übungsblattes) Martin Schmitt (LMU) Syntax natürlicher Sprachen 08.11.2017 18
Besprechung Blatt 2 (I) Aufgabe 6 Fragen zu NLTK-Kapitel 8.1 Lesen Sie das Vorwort von NLTK-Kapitel 8 sowie das Kapitel 8.1 ('Some Grammatical Dilemmas'): http://www.nltk.org/book/ch08.html. Beantworten Sie insbesondere folgende Fragen: Hinsichtlich welcher beiden syntaktischen Grundprinzipien werden natürliche Sprachen mit formalen Methoden analysiert? Konstituenz/Phrasenstruktur und Dependenz/Abhängigkeitsstruktur Welche beiden Mittel werden für eine solche Analyse verwendet? (Hinweis: s. Aufgabe 1 dieses Übungsblattes) Martin Schmitt (LMU) Syntax natürlicher Sprachen 08.11.2017 18
Besprechung Blatt 2 (I) Aufgabe 6 Fragen zu NLTK-Kapitel 8.1 Lesen Sie das Vorwort von NLTK-Kapitel 8 sowie das Kapitel 8.1 ('Some Grammatical Dilemmas'): http://www.nltk.org/book/ch08.html. Beantworten Sie insbesondere folgende Fragen: Hinsichtlich welcher beiden syntaktischen Grundprinzipien werden natürliche Sprachen mit formalen Methoden analysiert? Konstituenz/Phrasenstruktur und Dependenz/Abhängigkeitsstruktur Welche beiden Mittel werden für eine solche Analyse verwendet? (Hinweis: s. Aufgabe 1 dieses Übungsblattes) formale Grammatik, Parser Martin Schmitt (LMU) Syntax natürlicher Sprachen 08.11.2017 18
Besprechung Blatt 2 (II) Aufgabe 6 Fragen zu NLTK-Kapitel 8.1 Welche Entscheidung bzgl. eines Satzes wird in dieser Analyse getroen? Welchen Vorteil hat die Modellierung der Satzstruktur mit Hilfe einer formalen Grammatik? Martin Schmitt (LMU) Syntax natürlicher Sprachen 08.11.2017 19
Besprechung Blatt 2 (II) Aufgabe 6 Fragen zu NLTK-Kapitel 8.1 Welche Entscheidung bzgl. eines Satzes wird in dieser Analyse getroen? Erkennung von Grammatikalität/Wohlgeformtheit bzgl. der Grammatik Welchen Vorteil hat die Modellierung der Satzstruktur mit Hilfe einer formalen Grammatik? Martin Schmitt (LMU) Syntax natürlicher Sprachen 08.11.2017 19
Besprechung Blatt 2 (II) Aufgabe 6 Fragen zu NLTK-Kapitel 8.1 Welche Entscheidung bzgl. eines Satzes wird in dieser Analyse getroen? Erkennung von Grammatikalität/Wohlgeformtheit bzgl. der Grammatik Welchen Vorteil hat die Modellierung der Satzstruktur mit Hilfe einer formalen Grammatik? unendliche Menge an Sätzen mit endlichen Mittel beschreibbar automatische Strukturanalyse möglich (mathematisches Modell) Martin Schmitt (LMU) Syntax natürlicher Sprachen 08.11.2017 19
Themenübersicht 1 Part of Speech 2 Phrasen und Konstituenten 3 Hausaufgaben Martin Schmitt (LMU) Syntax natürlicher Sprachen 08.11.2017 20