Einführung - Parser. Was ist ein Parser?

Gliederung 1. Einleitung 1.1 Was ist ein Parser? 1.2 Was ist ein tabellengesteuerter TD-Parser? 1. Tabellengesteuerter TD-Parser 2.1 Funktionsweise 2.2 Darstellung als Pseudocode 2.3 Konstruktion von prädiktiven Parse-Tabellen 1. Bottom-Up-Syntaxanalyse 3.1 Definition 3.2 Handles 3.3 Allgemeine Informationen 4. Fragen

Einführung - Parser Was ist ein Parser?

Einführung - Parser Was ist ein Parser? Ein Parser ist ein Computerprogramm, das in der Computertechnik für die Zerlegung und Umwandlung einer beliebigen Eingabe in ein für die Weiterverarbeitung brauchbares Format zuständig ist.

Tabellengesteuerter TD-Parser Was ist ein tabellengesteuerter Top-Down Parser?

Tabellengesteuerter TD-Parser Was ist ein tabellengesteuerter Top-Down Parser? Im vorherigen Vortrag wurde erklärt, wie rekursiv prädiktive Parser funktionieren. Es besteht auch die Möglichkeit, nicht-rekursiv zu implementieren.

Tabellengesteuerter TD-Parser Was ist ein tabellengesteuerter Top-Down Parser? Im vorherigen Vortrag wurde erklärt, wie rekursiv prädiktive Parser funktionieren. Es besteht auch die Möglichkeit, nicht-rekursiv zu implementieren. Dabei wird ein Stack ( Stapel ) explizit verwaltet, anstatt die implizite Stapelverwaltung im Zuge rekursiver Aufrufe zu benutzen.

Ein tabellengesteuerter TD-Parser besteht aus einem Funktionsweise

Funktionsweise Ein tabellengesteuerter TD-Parser besteht aus einem - Eingabepuffer

Funktionsweise Ein tabellengesteuerter TD-Parser besteht aus einem - Eingabepuffer - Ausgabestrom

Funktionsweise Ein tabellengesteuerter TD-Parser besteht aus einem - Eingabepuffer - Ausgabestrom - Stack

Funktionsweise Ein tabellengesteuerter TD-Parser besteht aus einem - Eingabepuffer - Ausgabestrom - Stack - Deterministischen Automat ( Parse-Tabelle )

Funktionsweise Der Eingabestring wird mit der Endmarkierung $ abgeschlossen Der Stack enthält eine Folge von Grammatiksymbolen, welches ebenfalls mit einem $ abgeschlossen wird

Funktionsweise Die Parse-Tabelle besteht aus einem zwei dimensionalen Array, die folgendermaßen aufgebaut ist M [ A, a ] Das A steht für ein Nichtterminal Das a steht für ein Terminal oder $

Terminal und Nichtterminal Was bedeutet noch mal Terminal und Nichtterminal?

Terminal und Nichtterminal Was bedeutet noch mal Terminal und Nichtterminal? Terminale sind diejenigen Symbole, aus denen sich die Worte der zu erzeugenden formalen Sprache zusammensetzen. Sie werden in der Regel durch Kleinbuchstaben repräsentiert. Ein einzelnes Terminalsymbol kann bei der Erzeugung der durch die Grammatik beschriebenen Sprache nicht durch eine Produktionsregel ersetzt werden.

Terminal und Nichtterminal Was bedeutet noch mal Terminal und Nichtterminal? Terminale sind diejenigen Symbole, aus denen sich die Worte der zu erzeugenden formalen Sprache zusammensetzen. Sie werden in der Regel durch Kleinbuchstaben repräsentiert. Ein einzelnes Terminalsymbol kann bei der Erzeugung der durch die Grammatik beschriebenen Sprache nicht durch eine Produktionsregel ersetzt werden. Nichtterminal ist ein Symbol, welches zur Erzeugung der formalen Sprache, die durch die Grammatik beschrieben werden soll, verwendet wird, aber im Gegensatz zu Terminalsymbolen kein Symbol ist, welches in den Wörtern der erzeugten Sprache vorkommt. Nichtterminale werden gewöhnlich durch Großbuchstaben repräsentiert oder durch spitze Klammern gekennzeichnet (<Nichtterminal>).

Funktionsweise Wie verhält sich nun die Steuerung des Parsers für ein Programm?

Funktionsweise Der Parser schaut sich das oberste Stackelement X und das aktuelle Eingabesymbol a an Es gibt fünf Möglichkeiten:

1. Wenn X = a = $ ist, stoppt der Parser, da das zu analysierende Programm akzeptiert wurde Funktionsweise

2. Wenn X = a $ ist, entfernt der Parser X als oberstes Element vom Stapel und setzt den Eingabezeiger auf das nächste Eingabesymbol Funktionsweise

Funktionsweise 3. Wenn X T und X a ist, so liegt ein Syntaxfehler vor

4. Wenn X N und M[X,a] leer ist, so liegt ein Syntaxfehler vor Funktionsweise

Funktionsweise 5. Wenn X N und M[X,a] = X Y 1 Y k mit Y 1,., Y k V, dann ersetzt das Programm den obersten Stackeintrag X durch Y k,, Y 1, so dass Y 1 das oberste Stackelement ist.

Darstellung als Pseudocode Die Variable ip zeige auf das erste Symbol von w$; repeat sei X oberstes Stapelsymbol und a das Symbol, auf das ip zeigt; if X ist Terminal oder $ then if X = a then entferne X vom Stapel und rücke ip vor; else error() else /* X ist Nichtterminal */ if M[X,a] = X Y 1 Y 2. Y k then begin entferne X vom Stapel; lege Y k, Y k-1,, Y 1 auf den Stapel, so dass Y 1 oberstes Element ist; gib die Produktion X Y 1 Y 2 Yk aus end else error() until X = $ /* Stapel ist leer * /

Darstellung als Pseudocode Abschnitt 1 repeat sei X oberstes Stapelsymbol und a das Symbol, auf das ip zeigt; if X ist Terminal oder $ then if X = a then entferne X vom Stapel und rücke ip vor; else error() else Wir erinnern uns: Wenn X = a $ ist, entfernt der Parser X als oberstes Element vom Stapel und setzt den Eingabezeiger auf das nächste Eingabesymbol

Darstellung als Pseudocode Abschnitt 2 else /* X ist Nichtterminal */ if M[X,a] = X Y 1 Y 2. Y k then begin entferne X vom Stapel; lege Y k, Y k-1,, Y 1 auf den Stapel, so dass Y 1 oberstes Element ist; gib die Produktion X Y 1 Y 2 Y k aus end else error() until X = $ /* Stapel ist leer * /

Konstruktion von prädiktiven Parse-Tabellen Mit folgendem Algorithmus kann eine prädiktive Parse-Tabelle für eine Grammatik G erstellt werden Sei A α eine Produktion der Grammatik G und a ist in FIRST(α). Dann expandiert der Parser A zu α, wenn a aktuelles Eingabesymbol ist.

Konstruktion von prädiktiven Parse-Tabellen Mögliche Komplikationen? Zu Komplikationen kann es kommen, wenn α = ε oder α * ε gilt. In diesem Fall muss a erneut zu α expandiert werden, wenn das aktuelle Eingabesymbol in Follow(A) ist oder wenn in der Eingabe die Endmarkierung $ erreicht wurde und $ in Follow(A) enthalten ist.

Konstruktion von prädiktiven Parse-Tabellen Der Algorithmus Eingabe: Grammatik G. Ausgabe: Parse-Tabelle M. Methode:

Konstruktion von prädiktiven Parse-Tabellen Der Algorithmus Eingabe: Grammatik G. Ausgabe: Parse-Tabelle M. Methode: 1. Führe für jede Produktion A α der Grammatik die Schritte 2 und 3 durch.

Konstruktion von prädiktiven Parse-Tabellen Der Algorithmus Eingabe: Grammatik G. Ausgabe: Parse-Tabelle M. Methode: 1. Führe für jede Produktion A α der Grammatik die Schritte 2 und 3 durch. 2. Trage für jedes Terminal α aus FIRST(α) die Produktion A α in M[A,a] ein.

Konstruktion von prädiktiven Parse-Tabellen Der Algorithmus Eingabe: Grammatik G. Ausgabe: Parse-Tabelle M. Methode: 1. Führe für jede Produktion A α der Grammatik die Schritte 2 und 3 durch. 2. Trage für jedes Terminal α aus FIRST(α) die Produktion A α in M[A,a] ein. 3. Wenn ε in FIRST(α) enthalten ist, trage A α für jedes Terminal b aus FOLLOW(A) an der Stelle M[A,b] ein. Ist ε in FIRST(α) und $ in FOLLOW(A) enthalten, so trage A α in M[A,$] ein.

Konstruktion von prädiktiven Parse-Tabellen Der Algorithmus Eingabe: Grammatik G. Ausgabe: Parse-Tabelle M. Methode: 1. Führe für jede Produktion A α der Grammatik die Schritte 2 und 3 durch. 2. Trage für jedes Terminal α aus FIRST(α) die Produktion A α in M[A,a] ein. 3. Wenn ε in FIRST(α) enthalten ist, trage A α für jedes Terminal b aus FOLLOW(A) an der Stelle M[A,b] ein. Ist ε in FIRST(α) und $ in FOLLOW(A) enthalten, so trage A α in M[A,$] ein. 4. Trage in jedem undefinierten Eintrag error ein.

Bottom-Up-Syntaxanalyse Was ist eine Bottom-Up-Syntaxanalyse?

Bottom-Up-Syntaxanalyse Was ist eine Bottom-Up-Syntaxanalyse? Die Bottom-Up-Syntaxanalyse auch Shift-Reduce-Syntaxanalyse genannt versucht einen Parse-Baum eines Eingabestrings zu konstruieren. Der Beginn findet von den Blättern ( bottom ) aus statt und arbeitet sich bis zum Wurzel ( top )hoch. Bei jedem Reduktionsschritt wird ein einzelner Substring, der mit der rechten Seite einer Produktion übereinstimmt, durch das Symbol auf der linken Seite dieser Produktion ersetzt. Wenn der Substring bei jedem Schritt richtig gewählt wird, gibt man eine Rechtsableitung in umgekehrter Reihenfolge wieder.

Bottom-Up-Syntaxanalyse Beispiel Folgende Grammatik ist gegeben: S aabe A Abc b B d

Bottom-Up-Syntaxanalyse Beispiel Folgende Grammatik ist gegeben: S aabe A Abc b B d Folgenden Satz möchten wir durch bestimmte Schritte auf S reduzieren: abbcde

Bottom-Up-Syntaxanalyse Beispiel Folgende Grammatik ist gegeben: S aabe A Abc b B d Folgenden Satz möchten wir durch bestimmte Schritte auf S reduzieren: abbcde Schritte Schritt 1 aabcde

Bottom-Up-Syntaxanalyse Beispiel Folgende Grammatik ist gegeben: S aabe A Abc b B d Folgenden Satz möchten wir durch bestimmte Schritte auf S reduzieren: abbcde Schritte Schritt 1 Schritt 2 aabcde aade

Bottom-Up-Syntaxanalyse Beispiel Folgende Grammatik ist gegeben: S aabe A Abc b B d Folgenden Satz möchten wir durch bestimmte Schritte auf S reduzieren: abbcde Schritte Schritt 1 Schritt 2 Schritt 3 aabcde aade aabe

Bottom-Up-Syntaxanalyse Beispiel Folgende Grammatik ist gegeben: S aabe A Abc b B d Folgenden Satz möchten wir durch bestimmte Schritte auf S reduzieren: abbcde Schritte Schritt 1 Schritt 2 Schritt 3 Schritt 4 aabcde aade aabe S

Bottom-Up-Syntaxanalyse Ein Teilstring β (auch Substring genannt) einer Satzform αβ heißt Handle falls,

Bottom-Up-Syntaxanalyse Ein Teilstring β (auch Substring genannt) einer Satzform αβ heißt Handle falls, - β die rechte Seite einer Produktion N β ist,

Bottom-Up-Syntaxanalyse Ein Teilstring β (auch Substring genannt) einer Satzform αβ heißt Handle falls, - β die rechte Seite einer Produktion N β ist, - Der Reduktionsschritt αβ αn sich zu einer linkskanonischen Produktion fortsetzen lässt.

Bottom-Up-Syntaxanalyse Bottom-Up-Parser sind immer tabellen-gesteuert.

Bottom-Up-Syntaxanalyse Bottom-Up-Parser sind immer tabellen-gesteuert. Mögliche Probleme?

Bottom-Up-Syntaxanalyse Bottom-Up-Parser sind immer tabellen-gesteuert. Mögliche Probleme? Für das Aufstellen der Parse-Tabelle, werden in der Regel spezielle Programme benötigt, da der Aufwand sehr groß ist.

Bottom-Up-Syntaxanalyse Eine Parse-Tabelle T ist eine rechteckige Matrix, die von zwei Variablen Indiziert wird: dem Zustand des Parsers ( erreichte Position innerhalb der Produktion ) und dem Eingabe-Symbol ( Terminal oder Nichtterminal ).

Bottom-Up-Syntaxanalyse Eine Parse-Tabelle T ist eine rechteckige Matrix, die von zwei Variablen Indiziert wird: dem Zustand des Parsers ( erreichte Position innerhalb der Produktion ) und dem Eingabe-Symbol ( Terminal oder Nichtterminal ). Die Tabelleneinträge spezifizieren, ob der Parser

Bottom-Up-Syntaxanalyse Eine Parse-Tabelle T ist eine rechteckige Matrix, die von zwei Variablen Indiziert wird: dem Zustand des Parsers ( erreichte Position innerhalb der Produktion ) und dem Eingabe-Symbol ( Terminal oder Nichtterminal ). Die Tabelleneinträge spezifizieren, ob der Parser - Die Eingabe korrekt akzeptiert ( Accept )

Bottom-Up-Syntaxanalyse Eine Parse-Tabelle T ist eine rechteckige Matrix, die von zwei Variablen Indiziert wird: dem Zustand des Parsers ( erreichte Position innerhalb der Produktion ) und dem Eingabe-Symbol ( Terminal oder Nichtterminal ). Die Tabelleneinträge spezifizieren, ob der Parser - Die Eingabe korrekt akzeptiert ( Accept ) - Als inkorrekt zurückweist ( Reject )

Bottom-Up-Syntaxanalyse Eine Parse-Tabelle T ist eine rechteckige Matrix, die von zwei Variablen Indiziert wird: dem Zustand des Parsers ( erreichte Position innerhalb der Produktion ) und dem Eingabe-Symbol ( Terminal oder Nichtterminal ). Die Tabelleneinträge spezifizieren, ob der Parser - Die Eingabe korrekt akzeptiert ( Accept ) - Als inkorrekt zurückweist ( Reject ) - In einen anderen Zustand übergeht ( Shift )

Bottom-Up-Syntaxanalyse Eine Parse-Tabelle T ist eine rechteckige Matrix, die von zwei Variablen Indiziert wird: dem Zustand des Parsers ( erreichte Position innerhalb der Produktion ) und dem Eingabe-Symbol ( Terminal oder Nichtterminal ). Die Tabelleneinträge spezifizieren, ob der Parser - Die Eingabe korrekt akzeptiert ( Accept ) - Als inkorrekt zurückweist ( Reject ) - In einen anderen Zustand übergeht ( Shift ) - Eine bestimme Produktion reduziert ( Reduce )

Fragen???