Eiführug i die Computerliguistik Merkmalsstrukture (Feature Structures) Laura Heirich-Heie-Uiversität Düsseldorf Sommersemester 2013 Eileitug (1) Die i CFGs verwedete Nichttermiale sid i der Regel icht ausreiched, um liguistische Geeralisieruge auszudrücke. Bsp. Kogruez S NPSg VPSg S NPPl VPPl Besser: S NP VP Bedigug: gleicher Numerus i NP ud VP Merkmalsstrukture 1 Sommersemester 2013 Merkmalsstrukture 3 Sommersemester 2013 Überblick 1. Eileitug 2. Merkmalsstrukture als Graphe 3. Subsumptio ud Uifikatio 4. Getypte Merkmalsstrukture 5. Erweiteruge Merkmalsstrukture 2 Sommersemester 2013 Eileitug (2) Um diese Geeralisierug auszudrücke, faktorisiere wir die Nichttermiale: Ei Nichttermiales ist icht mehr atomar, soder hat eie Struktur. Der Ihalt des Nichttermiale wird durch Attribute beschriebe, die bestimmte Werte habe köe. NP um Pl Ma ka sich a verschiedee Stelle auf deselbe Attributwert beziehe (Structure Sharig) S NP VP um 1 um 1 Die Variable 1 deotiert immer de gleiche Wert. Merkmalsstrukture 4 Sommersemester 2013
Eileitug (3) Uterspezifikatio: Es sid icht immer alle Merkmale bekat. Astatt die verschiedee Möglichkeite explizit aufzuliste, gibt ma ur die Merkmale a, die feststehe. N ma N fish um Sg ge ge m Det a Det the um Sg NP Det N um 1 um 1 um 1 ge 2 ge 2 Merkmalsstrukture als Graphe (1) Merkmalsstrukture werde i der Regel als gerichtete Graphe formalisiert. Es gibt zwei Möglichkeite: Ma ka eie Attribut-Wert-Matrix wie N als ge 1. eie gerichtete Graphe auffasse N ge 2. oder als eie Beschreibug derartiger Graphe, die im Prizip vo eier uedliche Mege vo Graphe erfüllt wird. Merkmalsstrukture 5 Sommersemester 2013 Merkmalsstrukture 7 Sommersemester 2013 Eileitug (4) Attribute müsse icht otwedig atomare Werte habe. Der Wert eies Attributs ka wiederum eie Merkmalsstruktur sei: N fish ge Det a um Sg NP Det N 1 1 1 Merkmalsstrukture als Graphe (2) Merkmalsstrukture als Graphe sid icht otwedig Bäume: S subj NP 1 um sg VP pred 1 structure sharig Strukturteilug subj pred S NP VP um sg Merkmalsstrukture 6 Sommersemester 2013 Merkmalsstrukture 8 Sommersemester 2013
Merkmalsstrukture als Graphe (3) Wichtig: Die Attribute sid fuktioal, d.h., sie müsse, we vorhade, eideutige Werte habe. Bedigug auf die Graphe: für jede Kote v ud jedes Attribut a gibt es ur höchstes eie vo v ausgehede Kate, die das Label a hat. Mit adere Worte: Jedes Attribut a ka aufgefasst werde als eie partielle Fuktio auf der Mege der Kote des Graphe eier Merkmalsstruktur. Subsumptio ud Uifikatio (2) S 1 als Graph ud sei homomorphes Bild i S 2 : N ge N 3 pers pho ge laughs Merkmalsstrukture 9 Sommersemester 2013 Merkmalsstrukture 11 Sommersemester 2013 Subsumptio ud Uifikatio (1) Subsumptio: Relatio auf Merkmalsstrukture: S 1 subsumiert S 2 (S 1 S 2 ), we i S 2 midestes die Iformatio aus S 1 ethalte ist. Bsp. S 1 : V S 2 : orth laughs um Sg V um Sg S 1 S 2 Subsumptio ud Uifikatio (3) Subsumptio ist eie partielle Ordug, d.h. sie ist 1. reflexiv: Jede Struktur subsumiert sich selbst S S für alle S; 2. trasitiv: aus S 1 S 2 ud S 2 S 3 folgt S 1 S 3 für alle S 1,S 2,S 3 ; 3. atisymmetrisch: aus S 1 S 2 ud S 2 S 1 folgt S 1 = S 2. Die leere Merkmalsstruktur subsumiert alle adere Merkmalsstrukture. Mit adere Worte: Es gibt eie ijektive Abbildug der Kote aus S 1 i die Kote aus S 2, die kate- ud labelerhalted ist, also eie Homomorphismus. Merkmalsstrukture 10 Sommersemester 2013 Merkmalsstrukture 12 Sommersemester 2013
Subsumptio ud Uifikatio (4) Eie Merkmalsstruktur S heißt Uifikatio vo S 1 ud S 2 (S 1 S 2 ), we S sowohl vo S 1 als auch vo S 2 subsumiert wird ud we außerdem S alle adere Merkmalsstrukture subsumiert, die ebefalls vo S 1 ud vo S 2 subsumiert werde. V V = V um Sg um Sg Damit immer defiiert ist, führe wir ei Symbol für die ikosistete Merkmalsstruktur ei, die vo alle Merkmalsstrukture subsumiert wird. NP V = um Sg um Sg Getypte Merkmalsstrukture (1) Die obige Beispiele sid implizit davo ausgegage, dass die sytaktitsche Kategorie agibt ud für Kogruez zustädig ist. D.h., folgede Merkmalsstrukture solte icht möglich sei: Sg um 3 pers V Bisher habe wir diese Merkmalsstrukture aber icht ausgeschlosse, da wir die etsprechede Geeralisierug icht defiiere köe. Ziel: Eischräkuge formuliere vo der Art eie Agreemet Merkmalsstruktur ka höchstes die Attribute um, pers ud ge habe. Merkmalsstrukture 13 Sommersemester 2013 Merkmalsstrukture 15 Sommersemester 2013 Subsumptio ud Uifikatio (5) Die Mege der Merkmalsstrukture, versehe mit der Relatio bildet da eie Verbad (lattice): ist eie partielle Ordug ud zusätzlich gilt für alle Merkmalsstrukture S 1, S 2 : (sup) Es gibt eie Merkmalsstruktur S, so dass S 1 S ud S 2 S ud so dass S alle adere Merkmalsstrukture subsumiert, die ebefalls vo S 1 ud S 2 subsumiert werde. S heißt da das Supremum vo {S 1,S 2 }. (if) Es gibt eie Merkmalsstruktur S, so dass S S 1 ud S S 2 ud so dass S vo alle adere Merkmalsstrukture subsumiert wird, die ebefalls S 1 ud S 2 subsumiere. S heißt da das Ifimum vo {S 1,S 2 }. Getypte Merkmalsstrukture (2) Daher führe wir Type für Merkmalsstrukture ei: Jede Merkmalsstruktur hat eie Typ τ. Für jede Typ τ ist festgelegt, welche Attribute für ih zugelasse sid ud vo welchem Typ wiederum die Werte dieser Attribute sid. Type sid i eier Typehierarchie orgaisiert, i der spezifischere Type vo allgemeiere erbe köe. Uifikatio wird erweitert, so dass Type berücksichtigt werde. Das bezüglich kleiste Elemet ist, das größte Elemet ist. Merkmalsstrukture 14 Sommersemester 2013 Merkmalsstrukture 16 Sommersemester 2013
Getypte Merkmalsstrukture (3) Die Festlegug vo Type ud ihre mögliche Attribute setzt sich aus eier Typehierarchie ud Attributagabe für eizele Type zusamme. -structure um um ge ge determier pers pers case case sy Erweiteruge (1) Eiige liguistische Theorie verwede auch mege- oder listewertige Attribute. Bsp.: Head-Drive Phrase Structure Grammar (HPSG) kodiert Sytaxbäume i Form vo Merkmalsstrukture, wobei die Töchter eies Kotes i Form eier Liste als Wert des Attributs dtrs ( daughters ) formalisiert werde. phrase VP PRO dtrs, V NP orth I dtrs, orth love orth New York Typ : {every, most, some, oe}, Typ um: {Sg, Pl}, Typ ge: {m,f,}, Typ pers: {1,2,3}, Typ case: {om, acc, dat}, Type : {N, V, NP, VP, S,...} Merkmalsstrukture 17 Sommersemester 2013 Merkmalsstrukture 19 Sommersemester 2013 Getypte Merkmalsstrukture (4) -structure sy determier Typehierarchie: case case -structure sy determier D.h., die Attribute vo werde bestimmt durch die Klasse structure, sy ud. um um ge ge pers pers N case acc um Sg ge m Erweiteruge (2) Mache Systeme arbeite direkt mit Merkmalsstrukture, also mit Graphe. Adere verwede Beschreibuge vo Merkmalsstrukture. Vorteil vo Beschreibuge: Je ach verwedeter Logik große Expressivität (die ma sich allerdigs i der Regel auch mit eier etsprechede Komplexität erkauft). Dige, die ützlich sei köte: 1. Disjuktio: case = acc case = dat 2. Negatio: (case = om) 3. Pfadugleichheite: subj case obj case Merkmalsstrukture 18 Sommersemester 2013 Merkmalsstrukture 20 Sommersemester 2013