Informatik III - WS07/08

Ähnliche Dokumente
Theoretische Grundlagen der Informatik

Theoretische Grundlagen der Informatik

Ogden s Lemma: Der Beweis (1/5)

Kontextfreie Sprachen

Kontextfreie Sprachen

Theoretische Grundlagen der Informatik

Musterlösung Informatik-III-Klausur

Automaten und formale Sprachen Klausurvorbereitung

Rekursiv aufzählbare Sprachen

Musterlösung Informatik-III-Nachklausur

Übungsblatt 6. Vorlesung Theoretische Grundlagen der Informatik im WS 18/19

Das Halteproblem für Turingmaschinen

Übungsblatt 6. Vorlesung Theoretische Grundlagen der Informatik im WS 17/18

Kapitel: Die Chomsky Hierarchie. Die Chomsky Hierarchie 1 / 14

Grundlagen der Theoretischen Informatik

Theoretische Grundlagen der Informatik

2. Klausur zur Vorlesung Theoretische Grundlagen der Informatik Wintersemester 2014/2015

Umformung NTM DTM. Charakterisierung rek. aufz. Spr. Chomsky-3-Grammatiken (T5.3) Chomsky-0-Grammatik Rek. Aufz.

Übungsblatt 7. Vorlesung Theoretische Grundlagen der Informatik im WS 16/17

Lösung zur Klausur. Grundlagen der Theoretischen Informatik im WiSe 2003/2004

Kontextfreie Sprachen werden von PDAs akzeptiert

Grundlagen der Theoretischen Informatik

Theoretische Grundlagen der Informatik

Definition 78 Ein NPDA = PDA (= Nichtdeterministischer Pushdown-Automat) besteht aus:

2. Klausur zur Vorlesung Informatik III Wintersemester 2004/2005

Übungsblatt 7. Vorlesung Theoretische Grundlagen der Informatik im WS 16/17

1. Klausur zur Vorlesung Informatik III Wintersemester 2003/2004. Mit Lösung!

Zusammenfassung. Endliche Sprachen. Fazit zu endlichen Automaten. Teil 4: Grammatiken und Syntaxanalyse

Übungsblatt 7. Vorlesung Theoretische Grundlagen der Informatik im WS 18/19

Aufgabe Mögliche Punkte Erreichte Punkte a b c d Σ a b c d Σ x1 13

Hauptklausur zur Vorlesung Theoretische Grundlagen der Informatik Wintersemester 2011/2012

WS06/07 Referentin: Katharina Blinova. Formale Sprachen. Hauptseminar Intelligente Systeme Dozent: Prof. Dr. J. Rolshoven

Übersicht. 3 3 Kontextfreie Sprachen

Abschluss gegen Substitution. Wiederholung. Beispiel. Abschluss gegen Substitution

Informatik IV Theoretische Informatik: Formale Sprachen und Automaten, Berechenbarkeit und NP-Vollständigkeit. Zugangsnummer: 9201

10 Kellerautomaten. Kellerautomaten

2. Teilklausur zur Vorlesung Grundlagen der Theoretischen Informatik

Theoretische Grundlagen der Informatik

Konkatenation. Abschlusseigenschaften. Kleenescher Abschluss. Durchschnitt und Komplement

A : z z A : z z : ( z, x, z ) δ

Kellerautomaten u. kontextfr. Spr.

Deterministischer Kellerautomat (DPDA)

Theoretische Informatik II

Aufgabe Mögliche Punkte Erreichte Punkte a b c d Σ a b c d Σ x1 12

Grundlagen der Theoretischen Informatik

Grundlagen der Theoretischen Informatik

1. Klausur zur Vorlesung Informatik III Wintersemester 2004/2005

F2 Zusammenfassung Letzte Tips zur Klausur

Übung zur Vorlesung Grundlagen der theoretischen Informatik. Aufgabenblatt 7 Lösungen. Wiederholung: Pumping-Lemma für kontextfreie Sprachen

Formale Sprachen. Script, Kapitel 4. Grammatiken

Ein Satz der deutschen Sprache besitzt ein Subjekt, ein Prädikat und ein Objekt (SPO).

Einführung in die Theoretische Informatik I/ Grundlagen der Theoretischen Informatik. SS 2007 Jun.-Prof. Dr. Bernhard Beckert Ulrich Koch

2. Übungsblatt 6.0 VU Theoretische Informatik und Logik

Formale Grundlagen der Wirtschaftsinformatik

Aufgabentypen: Spickerblatt: kontextfrei (Typ 2): zusätzlich: u ist eine!"# v 1

Klausur zur Vorlesung Informatik III Wintersemester 2007/2008

Sprachen und Grammatiken

Turing: prinzipielle Berechenbarkeit Abschnitt 4.2. Turingmaschinen: DTM Abschnitt 4.2. DTM: Akzeptieren und Entscheiden Abschnitt 4.

Grundlagen der Theoretischen Informatik

1. Klausur zur Vorlesung Theoretische Grundlagen der Informatik Wintersemester 2017/2018

Ein Fragment von Pascal

Theorie der Informatik

Theoretische Grundlagen der Informatik. Vorlesung am 8. Januar INSTITUT FÜR THEORETISCHE INFORMATIK

Übungsblatt 7. Vorlesung Theoretische Grundlagen der Informatik im WS 17/18

Klammersprache Definiere

Ogden s Lemma (T6.4.2)

Die oben aufgelisteten Sprachfamilien werden von oben nach unten echt mächtiger, d.h. die Familie der regulären Sprachen ist eine echte Teilfamilie

Einführung in die Computerlinguistik. Chomskyhierarchie. Dozentin: Wiebke Petersen Wiebke Petersen Einführung CL (SoSe 2010) 1

Informatik 3 Theoretische Informatik WS 2015/16

Theoretische Informatik I

11.1 Kontextsensitive und allgemeine Grammatiken

1 Einführung. 2 Typ-0- und Typ-1-Sprachen. 3 Berechnungsmodelle. 4 Unentscheidbarkeit. 5 Unentscheidbare Probleme. 6 Komplexitätstheorie

Kapitel 3: Kontextfreie Sprachen. Kontextfreie Sprachen 1 / 99

Einführung in Berechenbarkeit, Formale Sprachen und Komplexitätstheorie

Deterministische und nichtdeterministische Turing-Maschinen, Typ1- und Typ0-Sprachen

2. Klausur zur Vorlesung Theoretische Grundlagen der Informatik Wintersemester 2017/2018

Unentscheidbare Probleme bei formalen Sprachen

Kapitel 3: Grundlegende Ergebnisse aus der Komplexitätstheorie Gliederung

Informatik III. Christian Schindelhauer Wintersemester 2006/ Vorlesung

Grundlagen der Theoretischen Informatik

Endliche Sprachen. Folgerung: Alle endlichen Sprachen sind regulär. Beweis: Sei L={w 1,,w n } Σ*. Dann ist w 1 +L+w n ein regulärer Ausdruck für

(Prüfungs-)Aufgaben zu formale Sprachen

Typ-0-Sprachen und Turingmaschinen

1. Klausur zur Vorlesung Theoretische Grundlagen der Informatik Wintersemester 2017/2018

Transkript:

Informatik III - WS07/08 Kapitel 5 1 Informatik III - WS07/08 Prof. Dr. Dorothea Wagner dwagner@ira.uka.de Kapitel 5 : Grammatiken und die Chomsky-Hierarchie

Informatik III - WS07/08 Kapitel 5 2 Definition 5.1 Eine Grammatik G besteht aus vier Komponenten: dem endlichen Alphabet Σ; einer endlichen Menge V mit V Σ = von Variablen; dem Startsymbol S V ; einer endlichen Menge von Ableitungsregeln R. Dabei ist eine Ableitungsregel ein Paar (l, r), wobei l (V Σ) + und r (V Σ) ist. Wir schreiben oft auch l r.

Informatik III - WS07/08 Kapitel 5 3 Bedeutung: Wenn in einem Wort z das Wort l Teilwort von z ist, so darf l durch r in z ersetzt werden. Notation: Wir schreiben w z, wenn w durch Anwendung einer Ableitungsregel in z verwandelt wird, und w z, wenn w durch eine Anwendung von mehreren Ableitungsregeln in z verwandelt wird. Die von einer Grammatik G erzeugte Sprache L(G) ist die Menge aller Wörter z Σ, für die S z gilt.

Informatik III - WS07/08 Kapitel 5 4 Definition 5.2 (Chomsky-Hierarchie) 1. Grammatiken ohne weitere Einschränkungen heißen Grammatiken vom Typ 0. 2. Grammatiken, bei denen alle Ableitungsregeln die Form u v mit u V +, v ((V Σ) \{S}) + und u v, oder S ε haben, heißen kontextsensitiv oder Grammatiken vom Typ 1.

Informatik III - WS07/08 Kapitel 5 5 3. Grammatiken, bei denen alle Ableitungsregeln die Form A v mit A V und v (V Σ) haben, heißen kontextfrei oder Grammatiken vom Typ 2. 4. Grammatiken, bei denen alle Ableitungsregeln die Form A v mit A V und v = ε oder v = ab mit a Σ, B V haben, heißen rechtslinear oder Grammatiken vom Typ 3.

Informatik III - WS07/08 Kapitel 5 6 Bemerkung: Bei kontextsensitiven Grammatiken kann die Ableitung ABC AXYC erlaubt, aber DBC DXYC verboten sein.

Informatik III - WS07/08 Kapitel 5 7 Chomsky-0-Grammatiken u. rek. aufzählbare Sprachen Satz 5.3 Falls L rekursiv aufzählbar (semi-entscheidbar) ist, so gibt es eine Chomsky 0 Grammatik mit L(G) = L.

Informatik III - WS07/08 Kapitel 5 8 Chomsky-0-Grammatiken u. rek. aufzählbare Sprachen Satz 5.4 Die von Typ 0 Grammatiken G erzeugten Sprachen sind rekursiv aufzählbar.

Informatik III - WS07/08 Kapitel 5 9 Chomsky-3-Grammatiken u. reguläre Sprachen Satz 5.5 Die Klasse der von endlichen Automaten akzeptierten Sprachen ist genau die Klasse der von Chomsky 3 Grammatiken erzeugten Sprachen.

Informatik III - WS07/08 Kapitel 5 10 Chomsky-1-Grammatiken bzw. kontextsensitive Sprachen Definition 5.6 DT APE(s(n)) und N T APE(s(n)) sind die Klassen der Sprachen, die von einer deterministischen beziehungsweise einer nichtdeterministischen Turing-Maschine mit Platzbedarf s(n) (bei Eingabelänge n) akzeptiert werden können.

Informatik III - WS07/08 Kapitel 5 11 Chomsky-1-Grammatiken bzw. kontextsensitive Sprachen Satz 5.7 Die Klasse der von Chomsky 1 Grammatiken erzeugten Sprachen stimmt mit der Klasse N T APE(n) überein.

Informatik III - WS07/08 Kapitel 5 12 Chomsky-1-Grammatiken bzw. kontextsensitive Sprachen Satz 5.8 Das Cliquen-Problem gehört zu DT APE(n).

Informatik III - WS07/08 Kapitel 5 13 Chomsky-2-Grammatiken bzw. kontextfreie Sprachen Definition 5.9 Eine kontextfreie Grammatik G heißt eindeutig, wenn es für jedes Wort w L(G) genau einen Syntaxbaum gibt. Eine kontextfreie Sprache L heißt eindeutig, wenn es eine eindeutige Grammatik G mit L(G) = L gibt. Ansonsten heißt L inhärent mehrdeutig.

Informatik III - WS07/08 Kapitel 5 14 Chomsky-2-Grammatiken bzw. kontextfreie Sprachen Definition 5.10 Eine kontextfreie Grammatik ist in Chomsky Normalform, wenn alle Regeln von der Form: A BC oder A a sind, mit A, B, C V und a Σ. Grammatiken in Chomsky Normalform können also nicht das Wort ε erzeugen.

Informatik III - WS07/08 Kapitel 5 15 Chomsky-2-Grammatiken bzw. kontextfreie Sprachen Für kontextfreie Sprachen, die ε enthalten, läßt sich eine Grammatik leicht ergänzen durch die Regeln S ε und S S wobei S ein neues Startsymbol zur Erzeugung von ε ist.

Informatik III - WS07/08 Kapitel 5 16 Chomsky-2-Grammatiken bzw. kontextfreie Sprachen Satz 5.11 Jede kontextfreie Grammatik, die nicht das leere Wort erzeugt, kann in eine Grammatik in Chomsky Normalform überführt werden.

Informatik III - WS07/08 Kapitel 5 17 Chomsky-2-Grammatiken bzw. kontextfreie Sprachen Satz 5.12 Es gibt einen Algorithmus (den Cocke Younger Kasami Algorithmus), der für eine kontextfreie Grammatik G in Chomsky Normalform und ein Wort w Σ in Zeit O( R n 3 ) entscheidet, ob w L(G), wobei n = w und R die Anzahl der Regeln von G ist.

Informatik III - WS07/08 Kapitel 5 18 Chomsky-2-Grammatiken bzw. kontextfreie Sprachen Satz 5.13 (Pumping Lemma) Für jede kontextfreie Sprache L gibt es eine Konstante n N, so dass sich jedes Wort z L mit z n so als z = uvwxy schreiben lässt, dass vx 1, vwx n und für alle i 0 das Wort uv i wx i y L ist.

Informatik III - WS07/08 Kapitel 5 19 Chomsky-2-Grammatiken bzw. kontextfreie Sprachen Satz 5.14 (Ogden s Lemma) Für jede kontextfreie Sprache L gibt es eine Konstante n N, so dass für jedes Wort z L mit z n gilt: Wenn wir in z mindestens n Buchstaben markieren, so lässt sich z so als z = uvwxy schreiben, dass von den mindestens n markierten Buchstaben mindestens einer zu vx gehört und höchstens n zu vwx gehören und für alle i 0 das Wort uv i wx i y L ist.

Informatik III - WS07/08 Kapitel 5 20 Chomsky-2-Grammatiken bzw. kontextfreie Sprachen Satz 5.15 Die Chomsky-Hierarchie ist echt, d.h. L 3 L 2 L 1 L 0, wobei L i, 0 i 3, Klasse der durch Typ-i-Grammatiken erzeugten Sprachen.

Informatik III - WS07/08 Kapitel 5 21 Chomsky-2-Grammatiken bzw. kontextfreie Sprachen Definition 5.16 Sei G eine kontextfreie Grammatik. Eine Variable A heißt nutzlos, falls es keine Ableitung S w gibt, w Σ, in der A vorkommt.

Informatik III - WS07/08 Kapitel 5 22 Chomsky-2-Grammatiken bzw. kontextfreie Sprachen Satz 5.17 Für eine kontextfreie Grammatik kann die Menge der nutzlosen Variablen (in polynomialer Zeit) berechnet werden.

Informatik III - WS07/08 Kapitel 5 23 Chomsky-2-Grammatiken bzw. kontextfreie Sprachen Korollar 5.18 Für eine kontextfreie Grammatik G kann (in polynomialer Zeit) entschieden werden, ob L(G) = ist.

Informatik III - WS07/08 Kapitel 5 24 Chomsky-2-Grammatiken bzw. kontextfreie Sprachen Satz 5.19 Für eine kontextfreie Grammatik G kann (in polynomialer Zeit) entschieden werden, ob L(G) endlich ist.

Informatik III - WS07/08 Kapitel 5 25 Chomsky-2-Grammatiken bzw. kontextfreie Sprachen Satz 5.20 Die Klasse der kontextfreien Sprachen ist abgeschlossen bzgl. Vereinigung, Konkatenation und Kleenschem Abschluss.

Informatik III - WS07/08 Kapitel 5 26 Chomsky-2-Grammatiken bzw. kontextfreie Sprachen Satz 5.21 Die Klasse der kontextfreien Sprachen ist nicht abgeschlossen bzgl. Komplementbildung und Durchschnitt.

Informatik III - WS07/08 Kapitel 5 27 Kontextfreie Sprachen und Kellerautomaten Definition 5.22 Eine kontextfreie Grammatik ist in Greibach-Normalform, wenn alle Ableitungsregeln von der Form sind. A aα mit A V, a Σ und α V

Informatik III - WS07/08 Kapitel 5 28 Kontextfreie Sprachen und Kellerautomaten Satz 5.23 Für jede kontextfreie Grammatik G, für die L(G) das leere Wort nicht enthält, kann eine äquivalente kontextfreie Grammatik G ( d.h. L(G) = L(G )) in Greibach-Normalform konstruiert werden.

Informatik III - WS07/08 Kapitel 5 29 Kontextfreie Sprachen und Kellerautomaten Definition 5.24 Ein (nichtdeterministischer) Kellerautomat (NPDA bzw. PDA) besteht aus (Q, Σ, Γ, q 0, Z 0, δ, F ), wobei Q endliche Zustandsmenge Σ endliches Eingabealphabet Γ endliches STACK-Alphabet q 0 Q Anfangszustand Z 0 Γ Initialisierung des STACK

Informatik III - WS07/08 Kapitel 5 30 Kontextfreie Sprachen und Kellerautomaten δ : Q (Σ {ε}) Γ 2 Q Γ, d.h. δ(q, a, z) {(q, γ) : q Q, γ Γ } und δ(q, ε, z) {(q, γ) : q Q, γ Γ } F Q Menge der akzeptierenden Endzustände, F = ist möglich.

Informatik III - WS07/08 Kapitel 5 31 Kontextfreie Sprachen und Kellerautomaten Eine Konfiguration eines PDA ist ein Tripel (q, w, α) mit q Q und α Γ STACK-Inhalt und w Σ Teil der Eingabe, der noch nicht gelesen wurde. Zu (q, w 1... w k, Z 1... Z m ) gibt es folgende Nachfolgekonfigurationen: (q, w 2... w k, Z 1... Z r Z 2... Z m ) für alle (q, Z 1... Z r ) δ(q, w 1, Z 1 ) und (q, w 1... w k, Z 1... Z r Z 2... Z m ) für alle (q, Z 1... Z r ) δ(q, ε, Z 1 ).

Informatik III - WS07/08 Kapitel 5 32 Kontextfreie Sprachen und Kellerautomaten Ein PDA akzeptiert ein w Σ durch leeren Stack, wenn es eine zulässige Folge von Konfigurationen aus der Anfangskonfiguration (q 0, w, Z 0 ) in eine Konfiguration (q, ε, ε), q Q, gibt.

Informatik III - WS07/08 Kapitel 5 33 Kontextfreie Sprachen und Kellerautomaten Ein PDA akzeptiert ein w Σ durch einen akzeptierenden Endzustand, wenn es eine zulässige Folge von Konfigurationen aus der Anfangskonfiguration (q 0, w, Z 0 ) in eine Konfiguration (q, ε, γ) mit q F und γ Γ gibt.

Informatik III - WS07/08 Kapitel 5 34 Kontextfreie Sprachen und Kellerautomaten Ein PDA ist deterministisch, falls für alle q Q, a Σ, Z Γ. δ(q, a, Z) + δ(q, ε, Z) 1

Informatik III - WS07/08 Kapitel 5 35 Kontextfreie Sprachen und Kellerautomaten Satz 5.25 Zu einem PDA, der eine Sprache L durch einen akzeptierenden Endzustand akzeptiert, kann ein PDA konstruiert werden, der L mit leerem STACK akzeptiert.

Informatik III - WS07/08 Kapitel 5 36 Kontextfreie Sprachen und Kellerautomaten Satz 5.26 Zu einem PDA, der eine Sprache L mit leerem STACK akzeptiert, kann ein PDA konstruiert werden, der L durch akzeptierende Endzustände akzeptiert.

Informatik III - WS07/08 Kapitel 5 37 Kontextfreie Sprachen und Kellerautomaten Satz 5.27 Für eine Grammatik G in Greibach-Normalform kann ein PDA konstruiert werden, der L(G) mit leerem STACK akzeptiert.

Informatik III - WS07/08 Kapitel 5 38 Kontextfreie Sprachen und Kellerautomaten Satz 5.28 Jede durch einen PDA (mit leerem STACK oder durch akzeptierende Endzustände) akzeptierte Sprache ist kontextfrei.

Informatik III - WS07/08 Kapitel 5 39 Kontextfreie Sprachen und Kellerautomaten Korollar 5.29 Die Klasse der von nichtdeterministischen Kellerautomaten akzeptierten Sprachen ist gleich der Klasse der kontextfreien Sprachen.

Informatik III - WS07/08 Kapitel 5 40 Kontextfreie Sprachen und Kellerautomaten Satz 5.30 Sei L eine kontextfreie Sprache, h : Σ ein Homomorphismus. Dann ist auch die Sprache h 1 (L) = {w Σ h(w) L} kontextfrei.

Informatik III - WS07/08 Kapitel 5 41 Unentscheidbare Probleme für kontextfreie Grammatiken Satz 5.31 Es ist nicht entscheidbar, ob L(G 1 ) L(G 2 ) = für kontextfreie Grammatiken G 1 und G 2.

Informatik III - WS07/08 Kapitel 5 42 Unentscheidbare Probleme für kontextfreie Grammatiken Satz 5.32 Es ist nicht entscheidbar, ob für eine kontextfreie Grammatik G die Sprache L(G) eindeutig ist.

Informatik III - WS07/08 Kapitel 5 43 Unentscheidbare Probleme für kontextfreie Grammatiken Definition 5.33 Die Sprache B M der korrekten Rechenwege einer TM M besteht aus allen Worten w 1 #w R 2 #w 3 #w R 4... w R n #, falls n gerade und w 1 #w R 2 #w 3 #w R 4... w n #, falls n ungerade, wobei w i Konfigurationen für alle 1 i n, w 1 eine Anfangskonfiguration, w n eine akzeptierende Konfiguration und w i+1 direkte Nachfolgekonfiguration zu w i für alle 1 i n 1 ist.

Informatik III - WS07/08 Kapitel 5 44 Unentscheidbare Probleme für kontextfreie Grammatiken Lemma 5.34 Für alle Turingmaschinen M ist B M der Durchschnitt zweier Sprachen L(G 1 ) und L(G 2 ), für die G 1 und G 2 kontextfrei sind.

Informatik III - WS07/08 Kapitel 5 45 Unentscheidbare Probleme für kontextfreie Grammatiken Lemma 5.35 Sei M ein TM, die auf jeder Eingabe mindestens zwei Rechenschritte ausführt. Die Sprache B M ist genau dann kontextfrei, wenn L(M) endlich ist.

Informatik III - WS07/08 Kapitel 5 46 Unentscheidbare Probleme für kontextfreie Grammatiken Lemma 5.36 Für jede TM M ist das Komplement B c M von B M kontextfrei.

Informatik III - WS07/08 Kapitel 5 47 Unentscheidbare Probleme für kontextfreie Grammatiken Satz 5.37 Seien G, G 1, G 2 kontextfreie Grammatiken über Σ. Es ist nicht entscheidbar, ob L(G) c kontextfrei ist L(G 1 ) L(G 2 ) kontextfrei ist L(G) = Σ L(G 1 ) = L(G 2 ) L(G 1 ) L(G 2 ).

Informatik III - WS07/08 Kapitel 5 48 Unentscheidbare Probleme für kontextfreie Grammatiken Satz 5.38 Die Sprache L = {a i b j c k i = j oder j = k} ist inhärent mehrdeutig.