Kpitel 8: Sprchhierrchien und Komplexität 129 8 Sprchhierrchien und Komplexität 81 Formlismus der PS-grmmr 811 Ursprüngliche Definition Von dem meriknischen Logiker E Post 1936 ls rewrite oder Post production system publiziert, ist dieser Formlismus in der Rekursionstheorie entstnden und steht in enger Beziehung zur Automtentheorie 812 Erste Anwendung uf ntürliche Sprche Posts rewrite systems wurden von N homsky 1957 erstmls uf die ntürlichen Sprchen ngewendet, und zwr ls sogennnte phrse structure grmmrs 813 Algebrische Definition der PS-Grmmtik Eine PS-Grmmtik ist ein Qudrupel < V, V T, S, P > 1 V ist eine Menge von Zeichen 2 V T ist eine echte Untermenge von V, gennnt terminle Zeichen 3 S ist ein Zeichen in V ohne V T, gennnt Strtsymbol 4 P ist eine Menge von Ersetzungsregeln der Form α β, wobei α ein Element von V + und β ein Element von V ist c 2000 2004 Rolnd Husser
Kpitel 8: Sprchhierrchien und Komplexität 130 814 Restriktionstypen des PS-Regelschems 0 Unbeschränkte PS-Regel: Bei einer Typ-0 Regel stehen uf der linken und rechten Regelseite beliebige Folgen von Terminlen und Vriblen 1 Kontextsensitive PS-Regel: Bei einer Typ-1 Regel stehen uf der linken und rechten Regelseite beliebige Folgen von Terminlen und Vriblen, wobei die rechte Regelseite mindestens so lng sein muß wie die linke Beispiel: A B A D E 2 Kontextfreie PS-Regel: Bei einer Typ-2 Regel steht uf der linken Regelseite genu eine Vrible Auf der rechten Regelseite steht eine Zeichenkette us V + Beispiele: A B, A bbc, etc 3 Reguläre PS-Regel: Bei einer Typ-3 Regel steht uf der linken Regelseite genu eine Vrible Auf der rechten Regelseite steht genu ein Terminl, gefolgt von höchstens einer Vriblen Beispiele: A b, A b c 2000 2004 Rolnd Husser
Kpitel 8: Sprchhierrchien und Komplexität 131 82 Sprchklssen und ihre Komplexität 821 Verschiedene Beschränkungen der genertive Regelschemt führen zu 1 unterschiedlichen Arten von Grmmtiken, die über 2 unterschiedliche Grde genertiver Kpzität 3 unterschiedliche Sprchklssen erzeugen, die wiederum 4 unterschiedliche Komplexitätsgrde ufweisen 822 Grde der Komplexität 1 Linere Komplexität n, 2n, 3n etc 2 Polynomile Komplexität n 2, n 3, n 4 etc 3 Exponentielle Komplexität 2 n, 3 n, 4 n etc 4 Unentscheidbr n c 2000 2004 Rolnd Husser
Kpitel 8: Sprchhierrchien und Komplexität 132 823 Komplexität polynomiler und exponentieller Algorithmen Problemgröße n Zeitkomplexität 10 50 100 n 3 2 n 001 125 10 Sekunden Sekunden Sekunden 001 357 10 15 Sekunden Jhre Jhrhunderte 824 Anwendung uf ntürliche Sprche Ds Limskorpus enthält insgesmt 71 148 Sätze Von diesen bestehen genu 50 us 100 Wortformen oder mehr, wobei der längste Stz im Korpus us 165 Wörtern besteht c 2000 2004 Rolnd Husser
Kpitel 8: Sprchhierrchien und Komplexität 133 825 PS-grmmtische Hierrchie der formlen Sprchen (homsky-hierrchie) Regel Beschränkung Unterklssen der PS-Grmmtik Sprchklssen Komplexitätsgrd Typ-3 reguläre PSG reguläre Spr liner Typ-2 kontextfreie PSG kontextfreie Spr polynominl Typ-1 kontextsensitive PSG kontextsensitive Spr exponentiell Typ-0 unbeschränkte PSG rek enumerble Spr unentscheidbr c 2000 2004 Rolnd Husser
Kpitel 8: Sprchhierrchien und Komplexität 134 83 Genertive Kpzität und formle Sprchklssen 831 Linguistische Huptfrge n die PS-grmmtik Gibt es einen Typ der PS-Grmmtik der genu die Strukturen erzeugt, die für die ntürlichen SPrchen chrkteristisch sind? 832 Struktureigenschften der regulären PS-Grmmtik Die genertive Kpzität der regulären PS-Grmmtik erlubt die rekursive Wiederholung einzelner Wörter, ber ohne irgendwelche rekursive Korrespondenzen 833 Reguläre PS-Grmmtik für b k (k 1) V = def {S, B,, b} V T = def {, b} P = def {S B, B b B, B b} c 2000 2004 Rolnd Husser
Kpitel 8: Sprchhierrchien und Komplexität 135 834 Reguläre PS-Grmmtik für {, b} + V = def {S,, b} V T = def {, b} P = def {S S, S b S, S, S b} 835 Reguläre PS-Grmmtik für m b k (k,m 1) Regulr PS-grmmr for m b k (k,m 1) V = def {S, S 1, S 2,, b} V T = def {, b} P = def {S S 1, S 1 S 1, S 1 b S 2, S 2 b} c 2000 2004 Rolnd Husser
Kpitel 8: Sprchhierrchien und Komplexität 136 836 Struktureigenschften der kontextfreien PS-Grmmtik Die genertive Kpzität der kontextfreien PS-Grmmtik erlubt die rekursive Erzeugung von inversprweisen Korrespondenzen, z B b c c b 837 Kontextfreie PS-Grmmtik für k b 3k V = def {S,, b} V T = def {, b} P = def { S S b b b, S b b b} 838 Kontextfreie PS-Grmmtik für WW R V = def {S,, b, c, d}, V T = def {, b, c, d}, P = def { S S, S b S b, S c S c, S d S d, S, S b b, S c c, S d d} c 2000 2004 Rolnd Husser
Kpitel 8: Sprchhierrchien und Komplexität 137 839 Wrum WW die genertive Kpzität der kontextfreien PS-Grmmtik übersteigt bb bcbc bcdbcd hben keine inverse Struktur Deshlb ist es trotz der Ähnlichkeit zwischen WW R und WW unmöglich, eine kontextfreie PS-Grmmtik wie 838 für WW zu schreiben 8310 Wrum k b k c k die genertive Kpzität der kontextfreien PS-Grmmtik übersteigt b c b b c c b b b c c c knn nicht von einer kontextfreien PS-Grmmtik generiert werden, weil Korrespondenzen zwischen drei verschiedenen Bereichen ufrecht erhlten werden müssen ws die prweis inverse Struktur der kontextfreien Sprchen, wie sie z B von den Sprchen k b k und WW R illustriert wird, übersteigt c 2000 2004 Rolnd Husser
Kpitel 8: Sprchhierrchien und Komplexität 138 8311 Struktureigenschften der kontextsensitiven PS-Grmmtik Almost ny lnguge one cn think of is context-sensitive; the only known proofs tht certin lnguges re not SL s re ultimtely bsed on digonliztion [Fst jede erdenkliche Sprche ist kontextsensitiv; die einzigen beknnten Beweise, dß bestimmte Sprchen nicht kontextsensitiv sind, beruhen letztlich uf Digonlisierung] JE Hopcroft nd JD Ullmn 1979, p 224 8312 PS-Grmmtik für kontextsensitives k b k c k V = def {S, B,, D 1, D 2,, b, c} V T = def {, b, c} P = def { S S B, rule 1 S b, rule 2 B D 1 B, rule 3 D 1 B D 1 D 2, rule 3b D 1 D 2 B D 2, rule 3c B D 2 B, rule 3d b B b b, rule 4 b b c, rule 5 c c c} rule 6 c 2000 2004 Rolnd Husser
Kpitel 8: Sprchhierrchien und Komplexität 139 Die Regeln 3 bis 3d hben zusmmen denselben Effekt wie die Regel 3 B B 8313 Ableitung von b b b c c c Zwischenketten Regeln 1 2 3 4 5 6 7 8 9 10 11 12 S S S B B b b b b b b b b b b b b b b B B B B B B B b b b b B c c c B B c c c (1) (1) (2) (3) (3) (3) (4) (4) (5) (6) (6) c 2000 2004 Rolnd Husser
Kpitel 8: Sprchhierrchien und Komplexität 140 8314 Struktureigenschften der rekursiven Sprchen Die kontextsensitiven Sprchen sind eine echte Untermenge der rekursiven Sprchen Die Klsse der rekursiven Sprchen knn in der PS-grmmtischen Hierrchie nicht drgestellt werden Der Grund dfür ist, dß ds PS-grmmtische Regelschem keinen Restriktionstyp (vgl 814) bereithält, dessen zuhörige PS-Grmmtiken genu die rekursiven Sprchen generieren würden Eine Sprche ist genu dnn rekursiv, wenn sie entscheidbr ist, d h, wenn es einen Algorithmus gibt, der für jede beliebige Eingbe in endlich vielen Schritten entscheiden knn, ob die Eingbe zur Sprche gehört oder nicht Eine rekursive Sprche, die nicht kontextsensitiv ist (weil sie die genertive Kpzität der kontextsensitiven Grmmtiken überfordert), ist die sogennnte Ackermnn-Funktion 8315 Struktureigenschften der unbeschränkten PS-Grmmtik In unbeschränkten PS-Grmmtiken knn die rechte Regelseite kürzer ls die linke sein, wodurch die Möglichkeit besteht, bereits erzeugte Sequenzen wieder zu tilgen Deshlb ist die Klsse der rekursiv ufzählbren Sprchen unentscheidbr c 2000 2004 Rolnd Husser
Kpitel 8: Sprchhierrchien und Komplexität 141 84 PS-Grmmtik für ntürliche Sprchen 841 Eine PS-Grmmtik für Beispiel 754 V = def {S, NP, VP, V, N, DET, ADJ, die, Hunde, kleinen, schlfen, schwrzen} V T = def {die, Hunde, kleinen, schlfen, schwrzen} P = def { S NP VP, VP V, NP DET N, N ADJ N, N Hunde, ADJ kleinen, ADJ schwrzen, DET die, V schlfen} c 2000 2004 Rolnd Husser
Kpitel 8: Sprchhierrchien und Komplexität 142 842 PS-grmmtische Anlyse von Beispiel 754 S NP N N VP DET ADJ ADJ N V die kleinen schwrzen Hunde schlfen 843 Definition der Konstituentenstruktur 1 Wörter oder Konstituenten, die semntisch zusmmengehören, müssen direkt und exhustiv von einem Knoten dominiert werden 2 Die Linien einer Konstituentenstruktur dürfen sich nicht überkreuzen (nontngling condition) c 2000 2004 Rolnd Husser
Kpitel 8: Sprchhierrchien und Komplexität 143 844 Akzeptble Konstituentenstrukturnlyse S VP NP NP DET N V DET N der Mnn ls ein Buch 845 Nichtkzeptble Konstituentenstrukturnlyse S SP NP NP DET N V DET N der Mnn ls ein Buch c 2000 2004 Rolnd Husser
Kpitel 8: Sprchhierrchien und Komplexität 144 846 Ursprung der Konstituentenstruktur Historisch ht sich der Begriff der Konstituentenstruktur us der immedite constituent nlysis des meriknischen Strukturlisten L BLOOMFIELD (1887 1949) und den Distributionstests seines Schülers Z Hrris entwickelt 847 Immedite constituents in PS-grmmr: Korrekt: ADJ Flsch: ADJ N ADJ gentle mn ly gentle mn ly c 2000 2004 Rolnd Husser
Kpitel 8: Sprchhierrchien und Komplexität 145 848 Substitutionsprobe Akzeptble Substitution: Susnne liest [ein gutes Buch] [eine dicke Zeitung] Nicht-kzeptble Substitution: Susnne liest ein [gutes Buch] *Susnne liest ein [dicke Zeitung] 849 Bewegungsprobe Akzeptble Bewegung: [der kleine Hund] sieht Juli = sieht [der kleine Hund] Juli (?) Nicht-kzeptble Bewegung: der [kleine Hund] sieht Juli = *der sieht [kleine Hund] Juli c 2000 2004 Rolnd Husser
Kpitel 8: Sprchhierrchien und Komplexität 146 8410 Bebsichtigter Zweck der Konstituentenstruktur Distributionstests erschienen den meriknischen Strukturlisten methodisch wichtig zu sein, um ihre Intuitionen über die korrekte Zerlegung (Segmentierung) von Sätzen zu objektivieren Die Unterscheidung zwischen linguistisch wohlmotivierten und unkzeptblen immedite-constituent-anlysen schien wiederum notwendig, weil jeder endlichen terminlen Kette (lso jeder Sequenz von Wortformen) unendlich viele verschiedene Bumstrukturen zugrunde gelegt werden können 8411 Unendliche Anzhl von Bäumen über einem einzigen Wort Kontextfreie Regeln: S S, S A Indizierte Klmmerung: (A) S, ((A) S ) S, (((A) S ) S ) S, ((((A) S ) S ) S ) S, etc Entsprechende Bäume: S S S S A S S S A S S A S A c 2000 2004 Rolnd Husser
Kpitel 8: Sprchhierrchien und Komplexität 147 85 Konstituentenstrukturprdox 851 Konstituentenstrukturen us der Sicht der SLIM-Sprchtheorie Konstituentenstrukturen und die Distributionstests, die ihnen zugrundegelegt werden, widersprechen der zeitlineren Struktur der ntürlichen Sprchen Die us der Konstituentenstrukturnlyse resultierenden Phrsenstrukturbäume hben keinerlei kommuniktive Funktion Die Prinzipien der Konstituentenstruktur können bei der empirischen Anlyse ntürlicher Sprchen nicht immer erfüllt werden c 2000 2004 Rolnd Husser
Kpitel 8: Sprchhierrchien und Komplexität 148 852 Verletzung der zweiten Bedingung S VP VP NP NP V DET N DE Peter schlug ds Wort nch c 2000 2004 Rolnd Husser
Kpitel 8: Sprchhierrchien und Komplexität 149 853 Verletzung der ersten Bedingung S VP NP V NP DET N DE Peter schlug ds Wort nch c 2000 2004 Rolnd Husser
Kpitel 8: Sprchhierrchien und Komplexität 150 854 Annhmen der Trnsformtionsgrmmtik Um die Konstituentenstruktur ls ngeboren zu erhlten, unterscheidet die Trnsformtionsgrmmtik zwischen hypothetischen Tiefenstrukturen, die ngeblich universl sind, und den konkreten sprchbhängigen Oberflächenstrukturen Dbei wird ngenommen, dß die beiden Ebenen semntisch äquivlent sind, dß die Tiefenstrukturen nicht grmmtisch wohlgeformt sein müssen, ber die Bedingungen der Konstituentenstruktur erfüllen müssen, und dß die Oberflächenstrukturen grmmtisch sein müssen, ber nicht die Bedingungen der Konstituentenstruktur erfüllen müssen c 2000 2004 Rolnd Husser
Kpitel 8: Sprchhierrchien und Komplexität 151 855 Beispiel einer formlen Trnsformtion [[V DE] V [DET N] NP ] VP [V [DET N] NP DE] VP 856 Anwendung der Trnsformtion 855 Tiefenstruktur: S Trnsformtion Oberflächenstruktur: S VP NP V DE VP V DET NP N NP V NP DET N DE Peter schlug nch ds Wort = Peter schlug ds Wort nch c 2000 2004 Rolnd Husser
Kpitel 8: Sprchhierrchien und Komplexität 152 857 Mthemtische Folgen us dem Einbu von Trnsformtionen in die PS-Grmmtik Während die kontextfreie Tiefenstruktur von niedriger polynomiler Komplexität ist (n 3 ), hebt der Einbu von Trnsformtionen die Komplexität zu rekursiv ufzählbr MW, die Trnsformtionsgrmmtik ist unentscheidbr 858 Beispiel eines Bch-Peters-Stzes Der Mnn, der ihn verdient, bekommt den Preis, den er will 859 Tiefenstruktur eines Bch-Peters-Stzes [Der Mnn] bekommt [den Preis] [der Mnn verdient [den Preis]] [den Preis will [der Mnn]] [der Mnn v [den Preis]] [den Preis will [der Mnn]] [den Preis will [der [der Mnn v [den Preis]] c 2000 2004 Rolnd Husser