Baumadjunktionsgrammatiken Vorlesung Grammatikformalismen Alexander Koller 22. April 2016
Grammatikformalismen Grammatik- formalismus Grammatik- theorie abstrakt Grammatik prache konkret formal linguistisch
atürliche prachen in der Chomsky-Hierarchie Parsingkomplexität polynomiell exponentiell O(n) O(n 3 ) O(n k ) PPACE-vollst. unentscheidbar reguläre Ausdrücke kontextfreie Grammatiken schwach kontextsensitive Grammatiken kontextsensitive Grammatiken Turing- maschinen Expressivität
Letztes Mal IV TV a DV d a IV schläft TV isst DV gibt a den masc d dem masc a die fem d der fem a das neut d dem neut Die Katze jagt den Vogel. nom 1 TV acc 2 Der Vogel wird gejagt. nom 2 wird TVpart
Letztes Mal n a d V n d a V a n d V d n a V a d n V d a n V
Lexikalisierung Lexikalisierte Grammatikformalismen: jedes tück grammatische Information ist mit einem konkreten Wort verknüpft für jedes Wort gibt es endlich viele Lexikoneinträge, die grammatische Informationen vollständig darstellen Vorteile: Grammatikentwicklung: grammatischer Beitrag jedes Wortes an einer telle gesammelt Parsing: Parser muss für gegebenen Eingabestring nur endliche Menge von Objekten manipulieren Problem von kfg: i.a. nicht lexikalisiert
Lexikalisierung Greibach-F: ist lexikalisiert (genau ein Terminalsymbol pro Regel) ist schwach äquivalent (gleiche tringsprache) ist nicht stark äquivalent (Parsebäume evtl. verschieden) Det A der Hund rennt der Hund rennt Kann man kfgen stark lexikalisieren?
Ein Versuch Det der Hund rennt
Ein Versuch Det der Hund rennt
Ein Versuch Det der Hund rennt
Ein Versuch Det der Hund rennt
Ein Versuch Det der Hund rennt Baum kann man wie folgt zusammenbauen:
Ein Versuch Det der Hund rennt Baum kann man wie folgt zusammenbauen: rennt
Ein Versuch Det der Hund rennt Baum kann man wie folgt zusammenbauen: Det Hund rennt
Ein Versuch Det der Hund rennt Baum kann man wie folgt zusammenbauen: Det Hund rennt
Ein Versuch Det der Hund rennt Baum kann man wie folgt zusammenbauen: Det der Det Hund rennt
Baumsubstitutionsgrammatiken Baumsubstitutionsgrammatik (tree substitution grammar, TG): endliche Menge von Elementarbäumen. Knoten von Elementarbäumen: innere Knoten, mit T-ymbolen markiert lexikalische Anker, mit Terminalsymbolen markierte Blätter (manchmal mit Raute markiert: A ) ubstitutionsknoten, mit T-ymbolen markierte Blätter (normalerweise mit Pfeil markiert: A )
Lexikalisierte Elementarbäume unlexikalisiert lexikalisiert V V liebt V hasst α 1 α 1 (liebt) α 1 (hasst) Hans Maria α 2 α 2 (Hans) α 2 (Maria)
TGs: Ableitungen Ableitungsschritt, t t : t ein Baum, der einen ubst.knoten u mit Label A hat e ein Elementarbaum in TG mit Wurzel-Label A t entsteht aus t durch Ersetzen von u durch e Baum t heißt ein abgeleiteter Baum der TG G, wenn t keine ubstitutionsknoten enthält und * t. Baumsprache T(G) von G: Menge aller abgeleiteten Bäume.
TGs: Ein Beispiel V Hans Maria liebt TG G
TGs: Ein Beispiel V Hans Maria liebt TG G
TGs: Ein Beispiel V Hans Maria liebt TG G V liebt
TGs: Ein Beispiel V Hans Maria liebt TG G V Hans V liebt liebt
TGs: Ein Beispiel V Hans Maria liebt TG G V Hans V Hans V liebt liebt liebt Maria
TGs: Ein Beispiel V Hans Maria liebt TG G V Hans V Hans V liebt liebt liebt Maria keine ubst.knoten mehr, daher fertiger abgeleiteter Baum
TGs: tringsprachen Zu jedem Baum kann man den Ertrag als den tring definieren, den man von links nach rechts von den Blättern abliest. Hans V Hans liebt Maria liebt Maria tringsprache: L(G) ={ertrag(t) t 2 T (G)}
Ableitungsbaum Ableitungsbaum: Darstellung der truktur einer TG-Ableitung. Knoten: Elementarbäume Kanten: ubstitution V Hans V Hans V liebt liebt liebt Maria α 1 (liebt) α 2 (Hans) α 2 (Maria)
Lexikalisierte TG Elementarbaum heißt lexikalisiert, wenn er einen lexikalischen Anker enthält. TG heißt lexikalisiert, wenn alle Elementarbäume lexikalisiert sind. Genügt TG, um kfgs stark zu lexikalisieren? d.h.: Gibt es zu jeder kfg eine lexikalisierte TG, so dass abgeleitete Bäume der TG = Parsebäume der kfg?
ein! Gegenbeispiel (chabes):!! a Pfad zum minimal tiefen Blatt wird beliebig lang, aber ist in lexikalisierter TG beschränkt lang. a a a a a a a etc.
Adjunktion Man kann Beispiel-kfG lexikalisieren, wenn man eine zweite Operation zulässt: Adjunktion.
Adjunktion Man kann Beispiel-kfG lexikalisieren, wenn man eine zweite Operation zulässt: Adjunktion. A
Adjunktion Man kann Beispiel-kfG lexikalisieren, wenn man eine zweite Operation zulässt: Adjunktion. A A A* Fußknoten
Adjunktion Man kann Beispiel-kfG lexikalisieren, wenn man eine zweite Operation zulässt: Adjunktion. A A A* Fußknoten
Adjunktion Man kann Beispiel-kfG lexikalisieren, wenn man eine zweite Operation zulässt: Adjunktion. A A A A* A Fußknoten
Adjunktion Man kann Beispiel-kfG lexikalisieren, wenn man eine zweite Operation zulässt: Adjunktion. A A A A* A Det der Hund rennt Fußknoten * Adv schnell Det Adv der Hund rennt schnell
Lexikalisierung mit Adjunktion ehmen wir folgende Bäume: a * * a a Jetzt beliebige Parsebäume der kfg bauen: a
Lexikalisierung mit Adjunktion ehmen wir folgende Bäume: a * * a a Jetzt beliebige Parsebäume der kfg bauen: a
Lexikalisierung mit Adjunktion ehmen wir folgende Bäume: a * * a a Jetzt beliebige Parsebäume der kfg bauen: a a a
Lexikalisierung mit Adjunktion ehmen wir folgende Bäume: a * * a a Jetzt beliebige Parsebäume der kfg bauen: a a a
Lexikalisierung mit Adjunktion ehmen wir folgende Bäume: a * * a a Jetzt beliebige Parsebäume der kfg bauen: a a a a a a
Lexikalisierung mit Adjunktion ehmen wir folgende Bäume: a * * a a Jetzt beliebige Parsebäume der kfg bauen: a a a a a a
Lexikalisierung mit Adjunktion ehmen wir folgende Bäume: Jetzt beliebige Parsebäume der kfg bauen: * a a * a a a a a a a a a a a
Baumadjunktionsgrammatiken Baumadjunktionsgrammatik (tree adjoining grammar, TAG): endliche Menge von Elementarbäumen, und zwar Initialbäumen: Elementarbäume wie in TG Auxiliarbäume: Elementarbäume, in denen genau ein Blatt ein Fußknoten ist TAG-Ableitungen: in jedem chritt ubstitution eines Initialbaums, oder Adjunktion eines Auxiliarbaums
Ein Beispiel V schläft Hase Adj * weiße Det * der TAG G * Adv manchmal
Ein Beispiel V schläft Hase Adj * weiße Det * der TAG G * Adv manchmal V schläft
Ein Beispiel V schläft Hase Adj * weiße Det * der TAG G * Adv manchmal V schläft Hase
Ein Beispiel V schläft Hase Adj * weiße Det * der TAG G * Adv manchmal Det der * V schläft Hase
Ein Beispiel V schläft Hase Adj * weiße Det * der TAG G * Adv manchmal Det * der Adj * Hase V schläft weiße
Ein Beispiel V schläft Hase Adj * weiße Det * der TAG G * Adv manchmal Det * der Adj * Hase V schläft * Adv manchmal weiße
Ein Beispiel V schläft Hase Adj * weiße Det * der TAG G * Adv manchmal Det * der Adj * weiße Hase V schläft * Adv manchmal Det Adv der V manchmal Adj schläft weiße Hase abgeleiteter Baum
Det * der Adj * weiße V schläft Hase Hase V schläft Ein Beispiel TAG G Adj * Det * weiße der * Adv manchmal α 1 (schläft) α 2 (Hase) β 3 (manchmal) * Adv manchmal Det Adv der V manchmal Adj schläft weiße Hase abgeleiteter Baum β 1 (der) β 2 (weiße) Ableitungsbaum
Einige Punkte Ableitungsbaum: wie in TG aber jetzt Adjunktions- und ubstitutionskanten unterscheiden Adjunktionsconstraints: kann Knoten in Elementarbaum mit no adjunction (A) markieren: hier darf man nicht adjungieren Markierung obligatory adjunction (OA): hier muss man etwas adjungieren An Fußknoten darf man nie adjungieren.
TAG: Linguistische Prinzipien ubstitution verbindet ein Prädikat mit den Komplementen, für die es subkategorisiert. Adjunktion verbindet einen Ausdruck mit seinen Adjunkten (Modifikation). ubstantive mit Adjektiven, Artikeln, Relativsätzen usw. Verben und ätze mit Adverbien Ein Großteil von Rekursion kann durch Adjunktion erfasst werden.
Fernabhängigkeiten Fernabhängigkeiten (z.b. wh-bewegung): Bewegung innerhalb eines Elementarbaums bewegtes wh-wort wird durch Adjunktion immer weiter vom Verb weggedrückt B: Bewegung ist nur Motivation für konkreten Elementarbaum; in TAG-Ableitungen wird nichts bewegt! Who does Peter say Mary thinks John likes
Fernabhängigkeiten Fernabhängigkeiten (z.b. wh-bewegung): A Bewegung innerhalb eines Elementarbaums bewegtes wh-wort wird durch Adjunktion immer weiter vom Verb weggedrückt B: Bewegung ist nur Motivation für konkreten Elementarbaum; in TAG-Ableitungen wird nichts bewegt! A does likes ε A Who does Peter say Mary thinks John likes
Fernabhängigkeiten Fernabhängigkeiten (z.b. wh-bewegung): A Bewegung innerhalb eines Elementarbaums bewegtes wh-wort wird durch Adjunktion immer weiter vom Verb weggedrückt B: Bewegung ist nur Motivation für konkreten Elementarbaum; in TAG-Ableitungen wird nichts bewegt! A who does likes ε A Who does Peter say Mary thinks John likes
Fernabhängigkeiten Fernabhängigkeiten (z.b. wh-bewegung): A Bewegung innerhalb eines Elementarbaums bewegtes wh-wort wird durch Adjunktion immer weiter vom Verb weggedrückt B: Bewegung ist nur Motivation für konkreten Elementarbaum; in TAG-Ableitungen wird nichts bewegt! A who does likes John ε A Who does Peter say Mary thinks John likes
Fernabhängigkeiten who Fernabhängigkeiten (z.b. wh-bewegung): does John A Bewegung innerhalb eines Elementarbaums bewegtes wh-wort wird durch Adjunktion immer weiter vom Verb weggedrückt B: Bewegung ist nur Motivation für konkreten Elementarbaum; in TAG-Ableitungen wird nichts bewegt! A likes ε A thinks * Who does Peter say Mary thinks John likes
Fernabhängigkeiten who Fernabhängigkeiten (z.b. wh-bewegung): does John A Bewegung innerhalb eines Elementarbaums bewegtes wh-wort wird durch Adjunktion immer weiter vom Verb weggedrückt B: Bewegung ist nur Motivation für konkreten Elementarbaum; in TAG-Ableitungen wird nichts bewegt! A likes ε A Mary thinks * Who does Peter say Mary thinks John likes
Fernabhängigkeiten who Fernabhängigkeiten (z.b. wh-bewegung): does John A Bewegung innerhalb eines Elementarbaums bewegtes wh-wort wird durch Adjunktion immer weiter vom Verb weggedrückt B: Bewegung ist nur Motivation für konkreten Elementarbaum; in TAG-Ableitungen wird nichts bewegt! A likes ε A Mary thinks * say Who does Peter say Mary thinks John likes *
Fernabhängigkeiten who Fernabhängigkeiten (z.b. wh-bewegung): does John A Bewegung innerhalb eines Elementarbaums bewegtes wh-wort wird durch Adjunktion immer weiter vom Verb weggedrückt B: Bewegung ist nur Motivation für konkreten Elementarbaum; in TAG-Ableitungen wird nichts bewegt! A likes ε A Mary thinks * Peter say Who does Peter say Mary thinks John likes *
Extended domain of locality Lokalität: Informationen, die in einem einzigen Grammatikeintrag vorliegen. vom Grammatikentwickler als Einheit gedacht vom Parser als Einheit verarbeitet KfG: einzelne Produktionsregel. TAG: Elementarbaum, d.h. viel größere Einheit.
Extended domain of locality Einheit Elementarbaum: enthält ubstitutionsknoten für alle Komplemente des lexikalischen Ankers d.h. alles, was für semantische Interpretation des Wortes nötig ist Bewegungen innerhalb des Elementarbaums können vorausberechnet und lexikalisiert werden; Parser muss deshalb nicht mehr drüber nachdenken. Das erleichtert Grammatikentwicklung und Parsing.
Grammatik-Organisation Elementarbäume können zu Baumfamilien zusammengefasst werden. Zweck: verschiedene syntaktische Konfigurationen fürs gleiche Wort kommen immer wieder vor. Ein Wort kann allem Bäumen der gleichen Familie zugleich zugeordnet werden. A A Transitive Verben (z.b. V = like/likes/liked): is does A V V ε A by PP V ε A
Features Merkmale (Features): zusätzliche Werte an ichtterminale anheften und per Unifikation abgleichen. ermöglicht kompakte Darstellung von Kongruenz usw. Letzte Woche: kfgen mit Features. geht es auch mit TAG?
Erster Ansatz Erste Idee: Knoten von Elementarbäumen mit Feature-trukturen dekorieren. case: nom case: nom Det case: nom der Hase V frisst case: acc case: acc case: acc Det den alat case: nom V argcase: X case: X Im Lexikon spezifizieren: frisst: V, argcase=acc hilft: V, argcase=dat usw.
Ein Problem Was passiert mit der Featurestruktur an einem Knoten, wenn man dort adjungiert? X mit F bei Wurzel unifizieren? Oder mit F bei Fußknoten? oder mit beiden? (Konsequenz: F(Wurzel) = F(Fußknoten)) A f: X A A f: X A* A f: X Bessere Intuition: Adjunktion bricht einen Knoten in zwei Hälften auf.
Zweiter Ansatz (FTAG) In Feature-TAG trägt jeder Knoten zwei Featurestrukturen: für obere und untere Hälfte des Knotens. Wurzeln haben nur eine untere F Blätter haben nur eine obere F innere Knoten haben obere & untere F Am Ende der Ableitung werden obere und untere F jedes Knotens unifiziert. wen das nicht geht, schlägt Ableitung fehl zwischendurch dürfen Fen nicht-unifizierbar sein
Operationen von FTAG ubstitution von t in u: kombiniere obere F von u mit F der Wurzel von t Adjunktion von t in u: kombiniere obere F von u mit F der Wurzel von t kombiniere untere F von u mit F des Fußknotens von t t: F 1 A A t: F 1 A b: F 2 b: F2 A t: F 1 A b: F 2 A* t: F 3 b: F 4 A t: F 1 b: F 4 A t: F 3 b: F 2
Beispiel Det der b: [case: nom] * t: [case: nom] t: [case: nom] V b: [case: nom] Hase schläft
Kontrolle von Fernabhängigkeiten Problem in unserer Analyse vorhin: who does John likes wird als grammatisch akzeptiert. who does John A Wie erzwingen wir, dass ein einbettendes Verb adjungiert werden muss? A likes ε A
Kontrolle von Fernabhängigkeiten Lösung: inkompatible Features werden durch Adjunktion aufgelöst. A does A t: inv:+ b: inv: b: inv:+ think * t: inv: likes ε A
Zusammenfassung TAG: Elementarbäume durch ubstitution und Adjunktion kombinieren. Motivation 1: starke Lexikalisierung von kfgen Motivation 2: Elementarbaum = linguistisch angenehme Lokalitätsdomäne Features in TAG: an obere und untere Hälften von Knoten anhängen Koindizierung innerhalb des gleichen Elementarbaums elegante Kontrolle von Fernabhängigkeiten