Endliche Automaten. Grundlagen: Alphabet, Zeichenreihe, Sprache. Karin Haenelt

Ähnliche Dokumente
Reguläre Ausdrücke. Karin Haenelt

Operationen auf endlichen Automaten und Transduktoren

Überführung regulärer Ausdrücke in endliche Automaten

Parsing regulärer Ausdrücke. Karin Haenelt

Informatik-Grundlagen

Endliche Automaten. Deterministische Akzeptoren, nichtdeterministische Akzeptoren, nichtdeterministische Akzeptoren mit Epsilon-Übergängen

Automaten und Formale Sprachen

Operationen auf endlichen Akzeptoren und Transduktoren

Überführung regulärer Ausdrücke in endliche Automaten

Übungsaufgaben zu Formalen Sprachen und Automaten

Einführung in Berechenbarkeit, Formale Sprachen und Komplexitätstheorie

Beispiel für die Minimierung von DEAs

Theoretische Informatik 2 bzw. Formale Sprachen und Berechenbarkeit. Sommersemester Herzlich willkommen!

Operationen auf endlichen Automaten und Transduktoren

Theoretische Informatik für Medieninformatiker

Vorlesung Automaten und Formale Sprachen alias Theoretische Informatik Sommersemester 2015

Informatik III. 1. Motivation und Organisation. Christian Schindelhauer

Eva Lugstein Michaela Peterhansl Sophie Wirnsberger Cornelia Zenz

Einführung in die theoretische Informatik

Formale Systeme, Automaten, Prozesse

Endliche Automaten, reguläre Ausdrücke, rechtslineare Grammatiken

Herzlich willkommen!!!

Einführung in die Theoretische Informatik

Theoretische Informatik

Kapitel 0: Grundbegriffe Gliederung

Es gibt drei unterschiedliche Automaten:

Die Unentscheidbarkeit extensionaler Eigenschaften von Turingmaschinen: der Satz von Rice

Hidden Markov Models

Grundlagen der theoretischen Informatik

Transduktoren für die Sprachverarbeitung. Karin Haenelt

Algorithmen und Datenstrukturen I - Exkurs Formale Sprachen -

Formale Sprachen und Automaten

Überführung regulärer Ausdrücke in endliche Automaten. Der Algorithmus von Glushkov und McNaughton/Yamada

Anwenundg regulärer Sprachen und endlicher Automaten

Formale Sprachen. Reguläre Sprachen. Rudolf FREUND, Marian KOGLER

Automaten und formale Sprachen: Vorlesungsskript G. Brewka, A. Nittka

Modellierung menschlicher Sprachen mit Regulären Ausdrücken

Vorlesung Berechenbarkeit und Komplexität Wintersemester 2016/17. Wer sind wir? Willkommen zu

Theoretische Informatik

Informatik IV Theoretische Informatik: Formale Sprachen und Automaten, Berechenbarkeit und NP-Vollständigkeit

Automaten und Formale Sprachen

2.6 Verdeutlichung verwendeter Begriffe

Theoretische Informatik

Formale Methoden 2. Gaetano Geck Lehrstuhl I Logik in der Informatik WS 2015/2016

5.4 Endliche Automaten

Informatik III Grundlagen der theoretischen Informatik

Theorie der Informatik. Theorie der Informatik. 6.1 Einführung. 6.2 Alphabete und formale Sprachen. 6.3 Grammatiken. 6.4 Chomsky-Hierarchie

Theoretische Grundlagen der Informatik

Automatentheorie und ihre Anwendungen Teil 1: endliche Automaten auf endlichen Wörtern

Herzlich willkommen!!!

Automatentheorie und ihre Anwendungen Teil 1: endliche Automaten auf endlichen Wörtern

Automatentheorie und ihre Anwendungen Teil 1: endliche Automaten auf endlichen Wörtern

Komplexität menschlicher Sprachen. Karin Haenelt

Theoretische Informatik

Sprachen/Grammatiken eine Wiederholung

Beweistechnik: Beweise in Bezug auf Mengen. Formale Methoden 2 LVA , Beweistechnik: Widerspruchsbeweise. Satz R (S T ) = (R S) (R T )

Formale Sprachen und endliche Automaten

Formale Methoden 1. Gerhard Jäger 28. November Uni Bielefeld, WS 2007/2008 1/15

Hidden Markov Models Erläuterung der Bestimmung der Wahrscheinlichkeit einer Beobachtung

Reguläre Sprachen. R. Stiebe: Theoretische Informatik für ING-IF und Lehrer,

Reguläre Ausdrücke. Michael Jäger. 4. April 2017

Automatentheorie und formale Sprachen rechtslineare Grammatiken

Lexikalische Programmanalyse der Scanner

Inhalt. Teil I: Formale Grundlagen der Informatik I Endliche Automaten und formale Sprachen. Teil II: Formale Grundlagen der Informatik II

Deterministische endliche Automaten - Wiederholung

Dreifach logarithmischen Platzbedarf gibt es nicht

Der Earley-Algorithmus.

Einführung in die Computerlinguistik Satz von Kleene

Informatik I: Einführung in die Programmierung

Herzlich willkommen!!!

Theoretische Informatik und Logik

Theoretische Informatik

Schatzsuche - Endliche Automaten

WS06/07 Referentin: Katharina Blinova. Formale Sprachen. Hauptseminar Intelligente Systeme Dozent: Prof. Dr. J. Rolshoven

Seminar Automatentheorie der Presburger Arithmetik. Vorgetragen von Viktor Rach

Einführung in die Informatik

Theoretische Informatik II

Grundlagen der Theoretischen Informatik / Einführung in die Theoretische Informatik I

1 Endliche deterministische Automaten. Informatik I: Einführung in die Programmierung 7. Automaten: Akzeptoren & Transduktoren. Vorweg...

Theoretische Informatik 2 bzw. Formale Sprachen und Berechenbarkeit. Sommersemester Herzlich willkommen!

Theoretische Informatik: Berechenbarkeit und Formale Sprachen

Finite-State Technology

Part-Of-Speech-Tagging mit Viterbi Algorithmus

Einführung in die Computerlinguistik Satz von Kleene

1.5 Turing-Berechenbarkeit

Dank. Grundlagen der Theoretischen Informatik / Einführung in die Theoretische Informatik I. Kontakt. Teil I. Einführung.

Reduktionen. Algorithmen und Datenstrukturen Kapitel 6.2 Komplexitätstheorie. Exkurs: Reduktionen allgemein. Reduktionen: Erläuterungen

Mathematische Grundlagen

1.5 Turing-Berechenbarkeit

Endliche Automaten. Endliche Automaten J. Blömer 1/23

Algorithmen mit konstantem Platzbedarf: Die Klasse REG

FORMALE SYSTEME. 1. Vorlesung: Willkommen/Einleitung formale Sprachen. TU Dresden, 10. Oktober Markus Krötzsch

Programmiersprachen und Übersetzer

Automatentheorie Berechnungsmodell für logische Sprachen

Kapitel 7: Kellerautomaten und kontextfreie Sprachen

Theoretische Informatik I (Grundzüge der Informatik I)

1 Σ endliches Terminalalphabet, 2 V endliche Menge von Variablen (mit V Σ = ), 3 P (V (Σ ΣV )) {(S, ε)} endliche Menge von Regeln,

Theoretische Informatik

Grundlagen der Informatik II. Teil I: Formale Modelle der Informatik

Definition (Reguläre Ausdrücke) Sei Σ ein Alphabet, dann gilt: (ii) ε ist ein regulärer Ausdruck über Σ.

Transkript:

Endliche Automaten Grundlagen: Alphabet, Zeichenreihe, Sprache Karin Haenelt 1

Alphabet, Zeichenreihe und Sprache Alphabet unzerlegbare Einzelzeichen Verwendung: als Eingabe- und Ausgabezeichen eines endlichen Automaten Zeichenreihe Reihe aus Alphabetzeichen Verwendung: als Eingabe- und Ausgabesequenz eines Automaten Sprache Menge von Zeichenreihen aus Eingabezeichen interessante Mengen: Menge der von einem Automaten akzeptierten Zeichenreihen Menge der von einem Automaten nicht akzeptierten Zeichenreihen Menge der Zeichenreihen einer Menschensprache 2

Alphabet Alphabet Symbol endliche Menge von Symbolen unzerlegbares Grundzeichen unzerlegbar bezüglich der Art der Betrachtung, um die es gerade geht Beispiele - Σ = {0,1} das binäre Alphabet - Σ = { Ä, A, B,... Z. ä, a, b,..., z} das Alphabet der deutschen Sprache - Σ = { adje, dete, nomn} ein Alphabet der morphosyntaktischen Kategorien 3

Zeichenreihe auch: Zeichenkette oder Wort Zeichenreihe endliche Folge von Symbolen eines bestimmten Alphabets (Zeichenreihe über Σ ) - Formale Schreibweise: mit runden Klammern und Kommata zwischen den einzelnen Zeichen. (n-tupel Schreibweise einer Folge) - Übliche Schreibweise: Zeichenreihe als Zeichenkette ohne Klammern und Kommata Beispiele - Σ = {0,1} ( 1,1,0,0,1 ) bzw. 11001 - Σ = { Ä, A, B,... Z. ä, a, b,..., z} ( B, e, i, s, p, i, e, l) bzw. Beispiel - Σ = { adje, dete, nomn} ( dete, adje, nomn) 4

Sprache Sprache eine Menge von Zeichenreihen aus Σ es gilt -, die leere Sprache ist eine Sprache - {ε }, die Menge, die nur die leere Zeichenreihe enthält, ist eine Sprache - Σ, die Universalsprache, die aus der Menge aller Zeichenreihen über einem Alphabet besteht, ist eine Sprache Beispiele - Σ = {0,1} dann ist z.b. die Menge der Binärzahlen, deren Wert eine Primzahl ist, eine Teilmenge aus Σ 5

Deutsche Sprache Σ Sei unser Alphabet, das aus allen Wörtern eines deutschen Wörterbuches besteht. Jedes einzelne Wort stellt also ein Symbol unseres Beispielalphabets dar. Die Menge Σ besteht dann aus allen endlichen Sequenzen von Worten (einschließlich der leeren Sequenz). Eine interessante Teilmenge L von Σ besteht aus den Wortsequenzen, die Sätze der deutschen Sprache sind. Wir können diese Menge L auch die deutsche Sprache nennen. Eine linguistische Aufgabe ist es, regelhaft zu beschreiben, welche Teilmengen aus L zur deutschen Sprache gehören und welche nicht. (Beispiel nach Lawson, 2005: 6) 6

Literatur Hopcroft, John E. und Jeffrey D. Ullman (1988). Einführung in die Automatentheorie, formale Sprachen und Komplexitätstheorie. Bonn u. a.: Addison-Wesley, 1988 (engl. Original Introduction to automata theory, languages and computation). Hopcroft, John E., Rajeev Motwani und Jeffrey D. Ullman (2002). Einführung in die Automatentheorie, Formale Sprachen und Komplexität. Pearson Studium engl. Original: Introduction to Automata Theory, Languages and Computation. Kunze, Jürgen (2001). Computerlinguistik. Voraussetzungen, Grundlagen, Werkzeuge. Vorlesungsskript. Humboldt Universität zu Berlin. http://www2.rz.huberlin.de/compling/lehrstuhl/skripte/computerlinguistik_1/index.html Lawson, Mark V. (2005). Finite automata. In: Hritsu-Varsakelis, D. und W.S.Levine (Hg).: Handbook of networked and embedded Control Systems. Lawson, Mark V. (2004). Finite Automata. Boca Raton, London, New York, Washington D.C.: Chapman&Hall/CRC. Roche, Emmanuel & Schabes, Yves (1997). Introduction. In: Roche, Emmanuel & Schabes, Yves (Eds.): Finite-State Language Processing.Cambridge, Mass.: MIT Press. 7