Schnitt- und Äquivalenzproblem

Ähnliche Dokumente
Abschlusseigenschaften

Entscheidbarkeitsfragen

Reguläre Sprachen. R. Stiebe: Theoretische Informatik für ING-IF und Lehrer,

Was bisher geschah Chomsky-Hierarchie für Sprachen: L 0 Menge aller durch (beliebige) Grammatiken beschriebenen Sprachen L 1 Menge aller monotonen

I.5. Kontextfreie Sprachen

Definition der Greibach-Normalform

Theoretische Grundlagen der Informatik. Vorlesung am 8. Januar INSTITUT FÜR THEORETISCHE INFORMATIK

F2 Zusammenfassung Letzte Tips zur Klausur

Mehrdeutige Grammatiken

Automatentheorie und formale Sprachen

Theoretische Grundlagen der Informatik

Theorie der Informatik

Automaten und Formale Sprachen SoSe 2013 in Trier

Definition (Reguläre Ausdrücke) Sei Σ ein Alphabet, dann gilt: (ii) ε ist ein regulärer Ausdruck über Σ.

3.1 Kontextfreie Sprachen und Grammatiken 3.2 Ableitungsbäume 3.3 Die pre -Operation

Kontextfreie Sprachen. Automaten und Formale Sprachen alias Theoretische Informatik. Sommersemester Kontextfreie Sprachen

Kontextfreie Sprachen

Kontextfreie Sprachen

Grammatiken. Grammatiken sind regelbasierte Kalküle zur Konstruktion von Systemen und Sprachen Überprüfung von Systemen und Sprachen

(Prüfungs-)Aufgaben zu formale Sprachen

Klammersprache Definiere

Umformung NTM DTM. Charakterisierung rek. aufz. Spr. Chomsky-3-Grammatiken (T5.3) Chomsky-0-Grammatik Rek. Aufz.

Grundlagen der Theoretischen Informatik

q 0 q gdw. nicht (q A) (q A) q i+1 q gdw. q i q oder ( a Σ) δ(q, a) i δ(q, a) L = {a n b n : n N} für a, b Σ, a b

Carlos Camino Einführung in die Theoretische Informatik SS 2015

Grammatiken. Eine Grammatik G mit Alphabet Σ besteht aus: Variablen V. Startsymbol S V. Kurzschreibweise G = (V, Σ, P, S)

Automaten und formale Sprachen Klausurvorbereitung

Einführung in die Computerlinguistik

Grundlagen der theoretischen Informatik

Kapitel 2: Formale Sprachen Gliederung. 0. Grundbegriffe 1. Endliche Automaten 2. Formale Sprachen 3. Berechnungstheorie 4. Komplexitätstheorie

Adventure-Problem. Vorlesung Automaten und Formale Sprachen Sommersemester Adventure-Problem

Beweis des Pumping Lemmas

Was bisher geschah: Formale Sprachen

Formale Sprachen. Script, Kapitel 4. Grammatiken

Ein Fragment von Pascal

Einführung in die Computerlinguistik. Chomskyhierarchie. Dozentin: Wiebke Petersen Wiebke Petersen Einführung CL (SoSe 2010) 1

Grundlagen der Theoretischen Informatik / Einführung in die Theoretische Informatik I

2.2 Reguläre Sprachen Endliche Automaten

Ogden s Lemma: Der Beweis (1/5)

Automaten und Formale Sprachen SoSe 2007 in Trier. Henning Fernau Universität Trier

Chomsky-Grammatiken 16. Chomsky-Grammatiken

Endliche Automaten, reguläre Ausdrücke, rechtslineare Grammatiken

Theorie der Informatik. Theorie der Informatik. 6.1 Einführung. 6.2 Alphabete und formale Sprachen. 6.3 Grammatiken. 6.4 Chomsky-Hierarchie

Theoretische Informatik I

Sprachanalyse. Fachseminar WS 08/09 Dozent: Prof. Dr. Helmut Weber Referentin: Nadia Douiri

Berechenbarkeit und Komplexität

Sei Σ ein endliches Alphabet. Eine Sprache L Σ ist genau dann regulär, wenn sie von einem regulären Ausdruck beschrieben werden kann.

Theoretische Grundlagen der Informatik

Theoretische Informatik I (Winter 2018/19) Prof. Dr. Ulrich Hertrampf. 1.5 Tabellen

16. Die Chomsky-Hierarchie

2. Übungsblatt 6.0 VU Theoretische Informatik und Logik

Einführung in die theoretische Informatik Sommersemester 2017 Übungsblatt Lösungsskizze 7

Grundlagen der Theoretischen Informatik

Normalformen für kontextfreie Grammatiken. Noam CHOMSKY, Sheila GREIBACH. Bäume. Ableitungen in kontextfreien Grammatiken. Grammatik G = (N,T,P,S)

Grundlagen der Informatik II

Unentscheidbare Grammatik-Probleme

Informatik III - WS07/08

11. Übung Formale Grundlagen der Informatik

Theoretische Informatik und Logik Übungsblatt 2 (2017S) Lösung

Theoretische Informatik

Lösung zur Klausur. Grundlagen der Theoretischen Informatik im WiSe 2003/2004

Kontextfreie Sprachen werden von PDAs akzeptiert

Theoretische Grundlagen der Informatik

Grundlagen der Theoretischen Informatik Musterlösungen zu ausgewählten Übungsaufgaben

6 Kontextfreie Grammatiken

Automaten und Formale Sprachen alias Theoretische Informatik. Sommersemester 2011

Automaten und Formale Sprachen SoSe 2013 in Trier

1 Einführung. 2 Typ-0- und Typ-1-Sprachen. 3 Berechnungsmodelle. 4 Unentscheidbarkeit. 5 Unentscheidbare Probleme. 6 Komplexitätstheorie

1. Teilklausur zur Vorlesung Grundlagen der Theoretischen Informatik

Vorlesung Automaten und Formale Sprachen Sommersemester Beispielsprachen. Sprachen

Informatik 3 Theoretische Informatik WS 2015/16

Nachklausur zur Vorlesung Informatik 3 mit einigen Anmerkungen zu Lösungen

Theorie der Informatik

Abschluss unter Operationen

Typ-3-Sprachen. Das Pumping-Lemma

10 Kellerautomaten. Kellerautomaten

Einführung in die Logik

Lemma Für jede monotone Grammatik G gibt es eine kontextsensitive

Grundlagen der Theoretischen Informatik

Aufgabe Mögliche Punkte Erreichte Punkte a b c d Σ a b c d Σ x1 13

Transkript:

Schnitt- und Äquivalenzproblem Das Schnittproblem besteht in der Frage, ob der Schnitt zweier gegebener regulärer Sprachen L 1 und L 2 leer ist. Dabei können die Sprachen durch DEAs oder Typ-3 Grammatiken, oder auch durch reguläre Ausdrücke gegeben sein. In jedem Fall können wir auf Grund der Abschlusseigenschaften eine entsprechende Beschreibung von L 1 \ L 2 berechnen, sodass für diese Sprache nur noch die Leerheit zu testen ist. Also ist das Schnittproblem für Typ-3 Sprachen entscheidbar. Das Äquivalenzproblem besteht in der Frage, ob zwei gegebene reguläre Sprachen L 1 und L 2 gleich sind. Auch hier helfen uns die Abschlusseigenschaften und das Leerheitsproblem, denn es gilt L 1 = L 2 () (L 1 \ L 2 ) [ (L 2 \ L 1 )=;. Alternativlösung: Man könnte auch Minimalautomaten auf Isomorphie testen... Einheit 18 Folie 18.1

Abschließende Bemerkungen Im Normalfall geht es bei der Entscheidbarkeitsfrage nur um die prinzipielle Machbarkeit. Manchmal kann es aber auch entscheidend sein, wie effizient eine Berechnung (oder Entscheidung) durchgeführt werden kann. Beim Wortproblem haben wir schon gesehen, dass man unter Ausnutzung der speziellen Typ-3 Eigenschaft mit einem DEA wesentlich effizienter arbeitet als es uns im allgemeineren Fall der Typ-1 Sprachen gelungen ist. Zwar können wir jede der eingeführten Darstellungsarten (DEA, NEA, Typ-3 Grammatik, regulärer Ausdruck) in jede andere umrechnen, aber der Aufwand hierfür ist mitunter ganz erheblich. Daher ist die Komplexität z.b. des Äquivalenzproblems unter Umständen sehr stark von der verwendeten Darstellung der behandelten Sprache abhängig. Einheit 18 Folie 18.2

1.3 Kontextfreie Sprachen Wir haben uns im letzten Abschnitt sehr ausführlich mit den Typ-3 Sprachen beschäftigt, und das hatte einen guten Grund: Die regulären Sprachen sind sehr einfach und übersichtlich, haben aber dennoch eine große Bedeutung. In der Informatik begegnet man oft Strukturen, die durch endliche Automaten oder reguläre Ausdrücke adäquat beschrieben werden können. Aber die Typ-3 Welt hat auch enge Grenzen! Schon die eigentlich sehr einfache Sprache L = {a n b n n 1} ist keine Typ-3 Sprache, wie wir durch Anwendung des Pumping Lemmas sogar nachweisen konnten. Aber diese Sprache ist bekanntlich eine Typ-2 Sprache! Einheit 18 Folie 18.3

Klammerungen Intuitiv ist klar, wie ein korrekt angeordneter Klammerausdruck auszusehen hat. Wir können daher eine formale Definition der korrekt angeordneten Klammerausdrücke leicht angeben: Eine Folge von a s (entsprechen öffnenden Klammern) und b s (entsprechen schließenden Klammern) ist korrekt angeordnet, wenn der gesamte Ausdruck gleich viele a s und b s enthält, und zudem in jedem Präfix mindestens so viele a s wie b s enthalten sind. Korrekte Klammerausdrücke nennt man auch Dyck-Wörter. Für die Menge aller Dyck-Wörter der Länge mindestens 2 kann man eine Typ-2 Grammatik G =({S}, {a, b}, P, S) angeben: P: S! asb, S! ab, S! SS Einheit 18 Folie 18.4

Wir haben bereits früher gesehen, dass eine Ableitung S ) G w bzgl. einer Typ-2 Grammatik G immer durch einen Syntaxbaum visualisiert werden kann. Dabei wird von der speziellen Reihenfolge der Weiterverarbeitung vorhandener Variablen abstrahiert; d.h. mehrere Ableitungen können den selben Syntaxbaum haben. Legt man sich allerdings auf Linksableitungen fest, ist die Zuordnung Syntaxbaum $ Linksableitung eine 1:1 Entsprechung. Beispiele: a S S b Ableitungsbäume Zeichnen Sie sich selbst den Syntaxbaum für die folgende Ableitung: a Ṣ. S b S ) G SS ) G asbs ) G aabbs ) G aabbss ) G aabbabs ) G aabbabasb ) G aabbabaabb a S b a b Einheit 18 Folie 18.5

Die Form der Syntaxbäume Die Syntaxbäume können bei entsprechenden Typ-2 Grammatiken praktisch beliebige Formen annehmen. Einzige Einschränkung: Es gibt offensichtlich einen maximalen Verzweigungsgrad, weil in jedem inneren Knoten die Verzweigung durch eine der Regeln aus P gegeben ist und das sind nur endlich viele. Zudem muss man bei beliebigen Typ-2 Grammatiken damit rechnen, dass zu P Regeln (u, v) gehören, bei denen v viele Terminale und viele Variablen in beliebigem Wechsel enthält. Da das zu sehr unübersichtlichen Ableitungsbäumen führen kann, entstehen folgende Wünsche für eine Normalform der Typ-2 Grammatiken: 1) Innere Knoten sollen normalerweise zwei Nachfolger haben. 2) Entweder zwei Variablen oder ein Terminal als Nachfolger. Einheit 18 Folie 18.6

Definition der Chomsky-Normalform Was wir soeben formuliert haben, ist genau die nach Noam Chomsky benannte Chomsky-Normalform (CNF), die wir nun auch formal definieren wollen: Definition: Eine Typ-2 Grammatik G mit Regelmenge P ist in Chomsky-Normalform, wenn für alle (u, v) 2 P gilt: v 2 V 2 [ In der nächsten Einheit werden wir zeigen, dass es zu jeder Typ-2 Grammatik G eine Grammatik G 0 in CNF gibt, für die gilt: L(G) =L(G 0 ). Das rechtfertigt den Ausdruck Normalform. Einheit 18 Folie 18.7