Einführung in die Computerlinguistik Satz von Kleene

Ähnliche Dokumente
Sprachen/Grammatiken eine Wiederholung

Aufgabentypen die in der Klausur vorkommen

Grundlagen der Theoretischen Informatik

Einführung in die Computerlinguistik

4.2.4 Reguläre Grammatiken

Einführung in die Computerlinguistik

Grundbegriffe der Informatik

Automaten und Formale Sprachen alias Theoretische Informatik. Sommersemester 2013

Zusammenfassung Grundzüge der Informatik 4

Formale Sprachen. Script, Kapitel 4. Grammatiken

CABLE TESTER. Manual DN-14003

Fachschaft Englisch Unterrichtsinhalte Klasse Lehrwerk/Zusatzmaterialien: Lehrbuch Green Line 1 Voraussetzungen: Inhaltliche Schwerpunkte

Vorlesung Theoretische Informatik

Grundbegriffe der Informatik

Grundbegriffe der Informatik

Compiler. Kapitel. Syntaktische Analyse. Kapitel 4. Folie: 1. Syntaktische Analyse. Autor: Aho et al.

Theoretische Informatik 2 (WS 2006/07) Automatentheorie und Formale Sprachen / Kontextfreie Sprachen und Kellerautomaten

Mathematische Grundlagen der Informatik 2

There are 10 weeks this summer vacation the weeks beginning: June 23, June 30, July 7, July 14, July 21, Jul 28, Aug 4, Aug 11, Aug 18, Aug 25

Formale Sprachen und deren Grammatiken. Zusammenhang mit der Automatentheorie.

B I N G O DIE SCHULE. Bingo card: Classroom Items abcteach.com

Prediction Market, 28th July 2012 Information and Instructions. Prognosemärkte Lehrstuhl für Betriebswirtschaftslehre insbes.

Neues Aufgabenformat Say it in English

Der Wetterbericht für Deutschland. Read the weather reports and draw the correct weather symbols for each town.

Mitglied der Leibniz-Gemeinschaft

"What's in the news? - or: why Angela Merkel is not significant

DOWNLOAD. Englisch in Bewegung. Spiele für den Englischunterricht. Britta Buschmann. Downloadauszug aus dem Originaltitel:

Einkommensaufbau mit FFI:

Zusammenfassung. 1 Wir betrachten die folgende Signatur F = {+,,, 0, 1} sodass. 3 Wir betrachten die Gleichungen E. 4 Dann gilt E 1 + x 1

Grundlagen Theoretischer Informatik I SoSe 2011 in Trier. Henning Fernau Universität Trier fernau@uni-trier.de

Therefore the respective option of the password-protected menu ("UPDATE TUBE DATA BASE") has to be selected:

Einführung in die Theoretische Informatik

TVHD800x0. Port-Weiterleitung. Version 1.1

Formale Grundlagen der Informatik 1 Kapitel 12 Zusammenfassung

Context-adaptation based on Ontologies and Spreading Activation

1. General information Login Home Current applications... 3

Vorlesung Algorithmische Geometrie. Streckenschnitte. Martin Nöllenburg

~n - f =- (R' - r/)2,

WAS IST DER KOMPARATIV: = The comparative

THEORETISCHE INFORMATIK

August Macke Abschied, 1914 Museum Ludwig, Köln

Grammatiken. Einführung

Aufgabenstellung Wie verwende ich den in Windows XP und Windows 2000 enthaltenen SNTP- Client w32time an SICLOCK TM/TS?

Lehrstuhl für Allgemeine BWL Strategisches und Internationales Management Prof. Dr. Mike Geppert Carl-Zeiß-Str Jena

Grundlagen der Künstlichen Intelligenz

Frequently asked Questions for Kaercher Citrix (apps.kaercher.com)

USB-Stick (USB-Stick größer 4G. Es ist eine größere Partition notwendig als die eines 4GB Rohlings, der mit NTFS formatiert wurde)

Wortproblem für kontextfreie Grammatiken

Getting started with MillPlus IT V530 Winshape

Der Adapter Z250I / Z270I lässt sich auf folgenden Betriebssystemen installieren:

Zugangsvoraussetzungen für Airworthiness Review Staff gem. Part-M.A.707

Duplikation einer Aktie. Plusposition in Aktie. Long Call Short Put Risikofreie Geldanlage. Duplikation einer Aktie S T - X. (S 0 C+P)(1+r) t =X S T

Formale Sprachen, reguläre und kontextfreie Grammatiken

RULES FOR THE FIS YOUTH CUP SKI JUMPING REGLEMENT FÜR DEN FIS JUGEND CUP SKISPRINGEN

Praktikum Entwicklung Mediensysteme (für Master)

Lehrstuhl für Allgemeine BWL Strategisches und Internationales Management Prof. Dr. Mike Geppert Carl-Zeiß-Str Jena

Reguläre Sprachen Endliche Automaten

Wozu dient ein Logikanalysator?

Informatik IC2. Balazs Simon

Wie bekommt man zusätzliche TOEFL-Zertifikate? Wie kann man weitere Empfänger von TOEFL- Zertifikaten angeben?

KURZANLEITUNG. Firmware-Upgrade: Wie geht das eigentlich?

Die Datenmanipulationssprache SQL

Lufttüchtigkeitsanweisung LTA-Nr.: DULV Datum der Bekanntgabe:

Group and Session Management for Collaborative Applications

Release Notes BRICKware Copyright 23. March 2010 Funkwerk Enterprise Communications GmbH Version 1.0

Informatik I. Lutz Donnerhacke PGP:db c1c 6311 ef09 d819 e029 65be bfb6 c9cb

Qualitätssicherung in der Softwareentwicklung

NEWSLETTER. FileDirector Version 2.5 Novelties. Filing system designer. Filing system in WinClient

Exercise (Part XI) Anastasia Mochalova, Lehrstuhl für ABWL und Wirtschaftsinformatik, Kath. Universität Eichstätt-Ingolstadt 1

Einführung in die Robotik Regelung in der Robotik. Mohamed Oubbati Institut für Neuroinformatik. Tel.: (+49) 731 / mohamed.oubbati@uni-ulm.

UNIVERSITY OF CAMBRIDGE INTERNATIONAL EXAMINATIONS International General Certificate of Secondary Education

6KRSSLQJDW&DPGHQ/RFN 1LYHDX$

Analogtechnik 2, Semestertest Technique analogique 2, Test de semestre

Theoretische Informatik

Zusammenfassung. Satz. 1 Seien F, G Boolesche Ausdrücke (in den Variablen x 1,..., x n ) 2 Seien f : B n B, g : B n B ihre Booleschen Funktionen

Gewöhnliche Differentialgleichungen (ODEs) I

Qualität aus dem Vogtland.

Distributed testing. Demo Video

SELF-STUDY DIARY (or Lerntagebuch) GER102

. Sage-Einsatz in der Lehre. Open Source Mathematik-Software. Jochen Schulz. Georg-August Universität Göttingen 1/15

Universität Paderborn Die Universität der Informationsgesellschaft. Validierung und Verifikation (inkl. Testen, Model-Checking, Theorem Proving)

Deterministische Turing-Maschinen (DTM) F3 03/04 p.46/395

p^db=`oj===pìééçêíáåñçêã~íáçå=

MATLAB driver for Spectrum boards

Version/Datum: Dezember-2006

Automaten und formale Sprachen: Vorlesungsskript G. Brewka, A. Nittka

Notice: All mentioned inventors have to sign the Report of Invention (see page 3)!!!

please return within 24 hrs to avoid delay in production

Fluid-Particle Multiphase Flow Simulations for the Study of Sand Infiltration into Immobile Gravel-Beds

Schreiben auf Englisch

Grundlagen der Künstlichen Intelligenz

Organizer Co Organizer Sponsor Host

(` Download Fraud Detection. Data- Mining-Verfahren Zur Aufdeckung Von Abrechnungsbetrug Im Gesundheitswesen (German Edition) books free read online

Algorithmentheorie Maximale Flüsse

Inequality Utilitarian and Capabilities Perspectives (and what they may imply for public health)

Automaten, Formale Sprachen und Berechenbarkeit I. Skript zur Vorlesung im WS 2001/02 an der TU München

Msc. Courses at the IST

3.17 Zugriffskontrolle

Geometrie und Bedeutung: Kap 5

Transkript:

Einführung in die Computerlinguistik Satz von Kleene Dozentin: Wiebke Petersen 17.11.2009 Wiebke Petersen Einführung CL (WiSe 09/10) 1

Satz von Kleene (Stephen C. Kleene, 1909-1994) Jede Sprache, die von einem deterministischen endlichen Automaten akzeptiert wird ist regulär und jede reguläre Sprache wird von einem deterministischen endlichen Automaten akzeptiert. Wiebke Petersen Einführung CL (WiSe 09/10) 2

Wiederholung: reguläre Sprachen RE: syntax The set of regular expressions RE Σ over an alphabet Σ = {a 1,..., a n } is dened by: is a regular expression. ɛ is a regular expression. a 1,..., a n are regular expressions If a and b are regular expressions over Σ then (a + b) (a b) (a ) are regular expressions too. Wiebke Petersen Einführung CL (WiSe 09/10) 3

Wiederholung: reguläre Sprachen RE: semantics Each regular expression r over an alphabet Σ describes a formal language L(r) Σ. Regular languages are those formal languages which can be described by a regular expression. The function L is dened inductively: L( ) =, L(ɛ) = {ɛ}, L(a i ) = {a i } L(a + b) = L(a) L(b) L(a b) = L(a) L(b) L(a ) = L(a) Wiebke Petersen Einführung CL (WiSe 09/10) 4

Finite-state automatons accept regular languages Theorem (Kleene) Every language accepted by a DFSA is regular and every regular language is accepted by some DFSA. Wiebke Petersen Einführung CL (WiSe 09/10) 5

Finite-state automatons accept regular languages Theorem (Kleene) Every language accepted by a DFSA is regular and every regular language is accepted by some DFSA. proof idea (one direction): Each regular language is accepted by a NDFSA (and therefore by a DFSA): L( ) L(ɛ) L(a i ) Wiebke Petersen Einführung CL (WiSe 09/10) 5

Proof of Kleene's theorem (cont.) If R 1 and R 2 are two regular expressions such that the languages L(R 1 ) and L(R 2 ) are accepted by the automatons A 1 and A 2 respectively, then L(R 1 + R 2 ) is accepted by: Wiebke Petersen Einführung CL (WiSe 09/10) 6

Proof of Kleene's theorem (cont.) If R 1 and R 2 are two regular expressions such that the languages L(R 1 ) and L(R 2 ) are accepted by the automatons A 1 and A 2 respectively, then L(R 1 + R 2 ) is accepted by: Wiebke Petersen Einführung CL (WiSe 09/10) 6

Proof of Kleene's theorem (cont.) L(R 1 R 2 ) is accepted by: Wiebke Petersen Einführung CL (WiSe 09/10) 7

Proof of Kleene's theorem (cont.) L(R 1 R 2 ) is accepted by: Wiebke Petersen Einführung CL (WiSe 09/10) 7

Proof of Kleene's theorem (cont.) L(R1 ) is accepted by: Wiebke Petersen Einführung CL (WiSe 09/10) 8

Proof of Kleene's theorem (cont.) L(R1 ) is accepted by: Wiebke Petersen Einführung CL (WiSe 09/10) 8

Abschluÿeigenschaften regulärer Sprachen Theorem 1 If L 1 and L 2 are two regular languages, then the union of L1 and L2 (L1 L2) is a regular language too. the intersection of L1 and L2 (L1 L2) is a regular language too. the concatenation of L1 and L2 (L1 L2) is a regular language too. 2 The complement of every regular language is a regular language too. 3 If L is a regular language, then L is a regular language too. Beweisidee a b c Die Aussage für die Vereinigung, die Konkatenation und den Kleeneschen Stern folgt unmittelbar aus dem Satz von Kleene. Das Komplement einer regulären Sprache L wird wie folgt konstruiert: (1) konstruiere einen deterministischen, endlichen Automaten mit vollständiger Übergangsfunktion, der L akzeptiert. (2) Wechsle alle Nichtend- zu Endzuständen und umgekehrt. Der resultierende Automat akzeptiert L. Die Aussage über den Schnitt zweier regulärer Sprachen folgt aus der Aussage über die Vereinigung, das Komplement und das Gesetz von De Morgan. Wiebke Petersen Einführung CL (WiSe 09/10) 9

Pumping-lemma für reguläre Sprachen Lemma (Pumping-Lemma) Sei L eine unendliche reguläre Sprache, dann gilt für jedes genügend lange Wort z L, daÿ es so in Teilworte z = uvw (u, w Σ, u, w Σ + ) zerlegt werden kann, dass jedes der Worte uv i w L (i 0) ein Wort der Sprache L ist. Beweisidee: Wenn ein Wort länger ist, als der Automat Zustände hat, dann muÿ bei der Verarbeitung des Wortes ein Zustand zweimal besucht werden. Es gibt somit eine Schleife, die beliebig oft durchlaufen werden kann; das Wort kann in dem Schleifenbereich aufgepumpt werden. Wiebke Petersen Einführung CL (WiSe 09/10) 10

L = {a n b n : n 0} ist nicht regulär L = {a n b n : n 0}: L ist unendlich. Wäre L regulär, dann müÿte es für genügend lange Worte die geforderte pumpbare Zerlegung geben: aber Wiebke Petersen Einführung CL (WiSe 09/10) 11

L = {a n b n : n 0} ist nicht regulär L = {a n b n : n 0}: L ist unendlich. Wäre L regulär, dann müÿte es für genügend lange Worte die geforderte pumpbare Zerlegung geben: aber 1 das pumpbare Teilwort kann nicht nur aus a's bestehen, sonst würden beim Pumpen zuviele a's entstehen (aa(aa) 2 bbbb = aaaaaabbbb). 2 das pumpbare Teilwort kann nicht nur aus b's bestehen, sonst würden beim Pumpen zuviele b's entstehen. (aaaab(bb) 2 b = aaaabbbbbb) 3 das pumpbare Teilwort kann nicht aus a's und b's bestehen, da beim Pumpen die Sortierung der a's und b's verloren ginge. (aaa(ab) 2 bbb = aaaababbbb) Wiebke Petersen Einführung CL (WiSe 09/10) 11

Hausaufgabe (Abgabe bis zum 24.11.2009; BN: entweder Aufgabe 1 oder Aufgabe 2 und 3) 1 Beschreiben sie mit ihren eigenen Worten, wie die Automaten für die Sprachen 1 L(R1 + R2), 2 L(R1 R2) und 3 L(R 1 ) systematisch aus den Automaten für die Sprachen L(R 1) und L(R 2) konstruiert werden können. (Wenn Ihnen die allgemeine Beschreibung schwerfällt, dann wählen Sie bitte als Beispiel zwei reguläre Ausdrücke R 1 und R 2 und bilden für dieses Beispiel systematisch L(R 1 + R 2), L(R 1 R 2) und L(R 1 )). 2 Bilden Sie mithilfe des auf den Folien angedeuteten Verfahrens das Komplement im Universum L((a b) ) von 1 L(ab), 2 L(ba ) 3 Bilden Sie einen Automaten, der die Schnittmenge der beiden Sprachen L(b a ) und L(ba + b ) akzeptiert. Wiebke Petersen Einführung CL (WiSe 09/10) 12