RNA Strukturvorhersage

Größe: px
Ab Seite anzeigen:

Download "RNA Strukturvorhersage"

Transkript

1 RNA Strukturvorhersage Christian Pölitz Hauptseminar AFS Institut für Theoretische Informatik Fakultät für Informatik und Automatisierung Technische Universität Ilmenau 17. Juli 2007 Christian Pölitz (TU Ilmenau) RNA Strukturvorhersage 17. Juli / 72

2 RNA Definition Ribonukleinsäure ist eine Nukleinsäure, das heißt eine Kette aus vielen Nukleotiden (Molekülen). Eine wesentliche Funktion der RNA in der Zelle ist die Umsetzung von genetischer Information in Proteine. Christian Pölitz (TU Ilmenau) RNA Strukturvorhersage 17. Juli / 72

3 Aufbau der RNA /1 Hierarchie Primärstruktur : Abfolge von Nukleotiden / String über {a,c,g,u} Sekundärstruktur : Basenpaarung komplementärer Nukleotide des gleichen Stranges Tertiärstruktur : rämliche Struktur Christian Pölitz (TU Ilmenau) RNA Strukturvorhersage 17. Juli / 72

4 Aufbau der RNA /2 Basen Die Primärstruktur der RNA besteht aus einer Folge der Basen Adenin, Cytosin, Guanin und Uracil. Adenin und Uracil, sowie Cytosin und Guanin können über Wasserstoffbrückenbindungen eine chemische Verbindung eingehen. Man spricht von Basenpaarung. Christian Pölitz (TU Ilmenau) RNA Strukturvorhersage 17. Juli / 72

5 Sekundärstruktur /1 Allgemein Ungleich der DNA, die als Doppelhelix vorliegt, besteht die RNA aus einem einzelnen Strang. Basen dieses Stranges können mit anderen Basen desselben Stranges eine Verbingung eingehen. So entsteht die Sekundärstruktur Christian Pölitz (TU Ilmenau) RNA Strukturvorhersage 17. Juli / 72

6 Sekundärstruktur /2 Definition Sei w = r 1 r 2... r n mit r i Σ = {a, c, g, u}, i = 1... n die Primärstruktur. Eine Sekundärstruktur ist Menge von Paaren: SecStruc {(i, j) 1 i j n} mit wenn (i, j), dann ist Base r i mit Base r j gepaart. 1 k {1,..., n} : r k ist höchstens mit einer anderen Base gepaart 2 (i, j) : (r i, r j ) {(a, u), (u, a), (c, g)(g, c)} Watson-Crick-Paare oder (r i, r j ) {(g, u), (u, g)}. Man spricht von gültigen Basenpaaren. 3 (i, j) : j i 4 Christian Pölitz (TU Ilmenau) RNA Strukturvorhersage 17. Juli / 72

7 Sekundädstruktur Christian Pölitz (TU Ilmenau) RNA Strukturvorhersage 17. Juli / 72

8 Sekundärstruktur /3 Substrukturen Stems, es gilt nach (i, j) auch (i + 1, j 1) Hairpin loops, nach (i, j) kommt kein Basenpaar mehr Bulges, nach (i, j) kommt (i + k + 1, j 1), bzw. (i + 1, j k 1). D.h. Auf einer Seite entsteht einen Blase mit k Basen. Interior loop, nach (i, j) folgt (i + k 1 + 1, j k 2 1). D.h. es entsteht eine Blase auf beiden Seiten. Multiple loop Christian Pölitz (TU Ilmenau) RNA Strukturvorhersage 17. Juli / 72

9 Substrukturen Christian Pölitz (TU Ilmenau) RNA Strukturvorhersage 17. Juli / 72

10 Bestimmen der Sekundärstruktur Die Bestimmung von RNA Sekundärstrukturen (sowie Primärstrukturen) mittels chemischer und physikalischer Verfahren ist sehr zeitaufwendig und teuer. Man strebt deswegen Verfahren an, die die Struktur mit hoher Wahrscheinlichkeit Vorhersagen. Christian Pölitz (TU Ilmenau) RNA Strukturvorhersage 17. Juli / 72

11 Welche Verfahren lernen wir kennen? Vorhersage mittels Verfahren zur Energieminimierung und (stochastisch) kontextfreie Grammatiken Christian Pölitz (TU Ilmenau) RNA Strukturvorhersage 17. Juli / 72

12 Algorithmus von Nussinov (1978) Erklärung Basierend auf der Primärstruktur wird eine Struktur mit maximaler Basenpaarung angestrebt, da dies einem energetisch günstigen Zustand entspricht. Substrukturen werden nicht gesondert behandelt. Verfahren /1 Dynamisches Programmieren, d.h. bestimme die optimale Struktur von Teilstrings der Primärstruktur und bestimme danach sukzessive die optimale Struktur längeres Teilstrings bis zum kompletten. Christian Pölitz (TU Ilmenau) RNA Strukturvorhersage 17. Juli / 72

13 Algorithmus von Nussinov (1978) Verfahren /2 Sei S i,j die optimale Sekundärstruktur für den Teilstring r i... r j einer Primärstruktur r = r 1... r n. Weiterhin sei BP(S i,j ) = S i,j, die Anzahl der Basenpaar in der Struktur S i,j. Fülle eine (nxn) Matrix mit BP(S i,j ) als Wert an der Stelle (i, j). Ergebnis BP(S 1,n ) enthält maximale Anzahl an Basenpaarung in der Sekundärstruktur. Von dieser Position aus kann mittels eines Backtracing Verfahrens eine Sekundärstruktur abgeleitet werden. Christian Pölitz (TU Ilmenau) RNA Strukturvorhersage 17. Juli / 72

14 Algorithmus von Nussinov (1978) Algorithmus Input : r = r 1... r n 1 Initialisierung 1 for i=2 to n do BP(S i,i 1 ) = 0 2 for i=1 to n do BP(S i,i ) = 0 2 Rekurrenz 1 for l=1 to n-1 do 1 for i=1 to n-l do j=i+l BP(S i,j ) = max {BP(S i+1,j ), BP(S i,j 1 ), BP(S i+1,j 1 ) + δ(r i, r j ), max i<k<j {BP(S i,k ) + BP(S k+1,j )}} Wobei für (r i, r j ) gültiges Basenpaar gilt: δ(r i, r j )=1, sonst δ(r i, r j ) = 0. Christian Pölitz (TU Ilmenau) RNA Strukturvorhersage 17. Juli / 72

15 Rekurrenzfälle /1 1. BP(S i,j ) = BP(S i+1,j ) Die Anzahl der Basenpaare bleibt. D.h. keine Base geht eine Verbingung ein. Christian Pölitz (TU Ilmenau) RNA Strukturvorhersage 17. Juli / 72

16 Rekurrenzfälle /2 2. BP(S i,j ) = BP(S i,j 1 ) Die Anzahl der Basenpaare bleibt. D.h. keine Base geht eine Verbingung ein. Christian Pölitz (TU Ilmenau) RNA Strukturvorhersage 17. Juli / 72

17 Rekurrenzfälle /3 3. BP(S i,j ) = BP(S i+1,j 1 ) + δ(r i, r j ) Die Basen r i und r j gehen eine Verbindung ein, oder beide nicht. Christian Pölitz (TU Ilmenau) RNA Strukturvorhersage 17. Juli / 72

18 Rekurrenzfälle /4 4. BP(S i,j ) = max i<k<j {BP(S i,k ) + BP(S k+1,j )} Die optimale Sekundärstruktur S i,j ergibt sich aus zwei Teilstrukturen S i,k unds k,j Christian Pölitz (TU Ilmenau) RNA Strukturvorhersage 17. Juli / 72

19 Beispiel Wir betrachten die Sequence S 1,9 = GGGAAAUCC Christian Pölitz (TU Ilmenau) RNA Strukturvorhersage 17. Juli / 72

20 Initialisierung Christian Pölitz (TU Ilmenau) RNA Strukturvorhersage 17. Juli / 72

21 BP(S i,j ) = max{bp(s i+1,j ); BP(S i, j ), BP(S i+1,j i ) + δ, max i<k<j {BP(S i,k ) + BP(S k+1,j )}} Christian Pölitz (TU Ilmenau) RNA Strukturvorhersage 17. Juli / 72

22 BP(S i,j ) = max{bp(s i+1,j ) = 0, BP(S i,j 1 ) = 0, BP(S i+1,j i ) + δ = 1, max i<k<j {BP(S i,k ) + BP(S k+1,j )} = 0} = 0 Christian Pölitz (TU Ilmenau) RNA Strukturvorhersage 17. Juli / 72

23 Möglichkeiten für optimale Sturktur S 5,7 = AAU: 1. AU sind gepaart, dann kann erstes A nur ungepaart eingehen; 2. es kommen keine Paarungen vor und erstes A wird mit U gepaart; 3. es finden keine Paarungen statt; Christian Pölitz (TU Ilmenau) RNA Strukturvorhersage 17. Juli / 72

24 Substruktur S 1,6 = GGGAAA kann sich aus Teilsubstrukturen ergeben: Betrachte: S 1,2 = GG und S 3,6 = GAAA oder S 1,3 = GGG und S 4,6 = AAA oder S 1,4 = GGGA und S 5,6 = AA oder S 1,5 = GGGAA und S 6,6 = A Christian Pölitz (TU Ilmenau) RNA Strukturvorhersage 17. Juli / 72

25 Christian Pölitz (TU Ilmenau) RNA Strukturvorhersage 17. Juli / 72

26 Christian Pölitz (TU Ilmenau) RNA Strukturvorhersage 17. Juli / 72

27 Christian Pölitz (TU Ilmenau) RNA Strukturvorhersage 17. Juli / 72

28 Am Ende steht oben links die Anzahl der Basenpaarungen Christian Pölitz (TU Ilmenau) RNA Strukturvorhersage 17. Juli / 72

29 Traceback Auslesen der Sekundärstruktur Von BP(S 1,n ) sukzessive den Algorithmus rückwärds durchlaufen Christian Pölitz (TU Ilmenau) RNA Strukturvorhersage 17. Juli / 72

30 GGGAAAUCC ((.(..))) Christian Pölitz (TU Ilmenau) RNA Strukturvorhersage 17. Juli / 72

31 Verbesserung Energieminimierung Betrachte jeweils die Energie der Bindungen. Sei f e (r i, r j ) die freie Energie des Basenpaares (r i, r j ). Wenn das Basenpaar gültig ist, dann ist die freie Energie negativ. Wir suchen also die Struktur mit der minimalen Energie. Christian Pölitz (TU Ilmenau) RNA Strukturvorhersage 17. Juli / 72

32 Nussinov Algorithmus Rekurrenz E(S i,j ) = min {E(S i+1,j ), E(S i,j 1 ), E(S i+1,j 1 ) + f e (r i, r j ), min i<k<j {E(S i,k ) + E(S k+1,j )}} Christian Pölitz (TU Ilmenau) RNA Strukturvorhersage 17. Juli / 72

33 Nussinov Algorithmus Laufzeit Der Algorithmus hat eine Laufzeit von O(n 3 ) Beweis 1. Initialisierung läuft in O(n) 2. Rekurrenz beinhaltet zweifach verschachtelte Schleife. In innere Schleife benönigt das Finden des Maximums der Teilstrukturen O(n). Somit ergibt sich eine Laufzeit von O(n 3 ). Christian Pölitz (TU Ilmenau) RNA Strukturvorhersage 17. Juli / 72

34 Nussinov Algorithmus Nachteile Der Algorithmus berücksichtig nicht den Einfluss von Substrukuren auf die Sekundärstruktur. So haben Stems stabilisierenden Einfluss, Loops jedoch haben destabilisierenden Einfluss. Christian Pölitz (TU Ilmenau) RNA Strukturvorhersage 17. Juli / 72

35 Algorithmus von Zuker (1981) Verfahren Erweiterung des Nussinov Algorithmus. Berücksichtigt die freie Energie der Substrukturen, die durch eine Basenpaarung (r i, r j ) induziert werden. Wir führen zusätzlich ein: L i,j, die Substruktur mit minimaler freien Energie, die aus einer Basenpaarung (r i, r j ) resultiert. Christian Pölitz (TU Ilmenau) RNA Strukturvorhersage 17. Juli / 72

36 Algorithmus von Zuker (1981) Algorithmus Analog zu Nussinov in der Energieminimierungsvariante. Nur in der Rekurrenz verschieden: E(S i,j ) = min {E(S i+1,j ), E(S i,j 1 ), E(L i,j ), min i<k<j {E(S i,k ) + E(S k+1,j )}} Laufzeit, ohne Beweis Der Algorithmus hat Laufzeit von O(n 4 ) Christian Pölitz (TU Ilmenau) RNA Strukturvorhersage 17. Juli / 72

37 Überlegung /1 Die Primärstruktur als Sequence aus Basen kann auch als Wort über dem Alphabet Σ = {a, c, g, u} betrachtet werden. Christian Pölitz (TU Ilmenau) RNA Strukturvorhersage 17. Juli / 72

38 Überlegung /2 Weiterhin kann man diese Sequencen als biologische Palindrome auffassen. Bei solchen sind die Zeichen auf beiden Seiten der Sequence nicht gleich sondern komplementär. Es ist auch keine korrektes Palindrom, da es auch Stellen geben kann bei denen das nicht zutrifft (ungepaarten Basen). Außdem ist eine Sequence nicht unbedingt eine komplettes (bio.) Palindorm, sondern kann aus mehreren bestehen. Christian Pölitz (TU Ilmenau) RNA Strukturvorhersage 17. Juli / 72

39 Beispiel Beispielsequence: a u a a g g g c g g a u Als Klammerausdruck: ( (.. (.. ).. ) ) Christian Pölitz (TU Ilmenau) RNA Strukturvorhersage 17. Juli / 72

40 Palindrome und Klammerausdrücke Solche Sprachen können mit kontextfreien Grammatiken beschrieben werden. Christian Pölitz (TU Ilmenau) RNA Strukturvorhersage 17. Juli / 72

41 Kontextfreie Grammatiken Definition Ein Tupel G = (V, Σ, S, P) mit: V - Nichtterminale Σ - Terminale S - Startsysmbol, S V P - Menge von Produktionen Christian Pölitz (TU Ilmenau) RNA Strukturvorhersage 17. Juli / 72

42 Kontextfreie Grammatiken /2 Produktionen Formal : P V x (V Σ) Wir schreiben u v für : (u, v) P. Ableitungsschritt u G v, mit u = w 1 Aw 2, (A v ) P, dann v = w 1 v w 2 Christian Pölitz (TU Ilmenau) RNA Strukturvorhersage 17. Juli / 72

43 Kontextfreie Grammatiken /3 Ableitung w 0 G w 1 G w 2 G... G w n Weiterhin ist G die reflexive und transitive Hülle von G. Wörter und Sprachen w Σ wird von G erzeugt, wenn gilt: S G w L(G) = {w Σ S G w} ist die von G erzeugte Sprache. Christian Pölitz (TU Ilmenau) RNA Strukturvorhersage 17. Juli / 72

44 Kontextfreie Grammatiken /4 Ableitungsbaum Darstellung einer Ableitung einer kfg als gerichteter Wurzelbaum, dessen Knoten mit je einem Buchstaben aus V Σ oder ɛ beschriftet sind, wobei gilt: Die Wurzel ist mit S beschriftet Die Blätter sind mit a Σ oder ɛ beschriftet Jeder innere Knoten v ist mit A V beschriftet und es gilt die Nachfolgerknoten v 1, v 2,..., v r von v sind mit X 1, X 2,..., X r V Σ beschriftet und A X 1 X 2... X r ist eine Produktion von P. Christian Pölitz (TU Ilmenau) RNA Strukturvorhersage 17. Juli / 72

45 Kontextfreie Grammatiken /5 Chomsky Normalform Eine kfg G = (V, Σ, S, P) ist in Chomsky Normalform, wenn entweder alle Produktionen diese Form haben: A BC (A, B, C V ) oder A a (A V, a Σ) oder alle Produktionen die Form haben: A BC oder A a oder S ɛ und S nie auf der rechten Seite einer Produktion auftaucht. Christian Pölitz (TU Ilmenau) RNA Strukturvorhersage 17. Juli / 72

46 Beispiel Kontextfreie Grammatik für RNA: G = ({S}, {a, c, g, u}, S, P} mit P = { S SS S Sa Sc Sg Su S as cs gs us S asu usa csg gsc S a c g u } S gsc ggscc gggscc gggasucc gggaasucc gggaaaucc Christian Pölitz (TU Ilmenau) RNA Strukturvorhersage 17. Juli / 72

47 Zusammenhang Sekundärstruktur und Ableitungsbaum Vom Ableitungsbaum kann eine Sekundärstruktur ablesen werden! Dabei enstpricht S gsa asu einer Basenpaarung g-u, bzw a-u S gs as a ungepaarte Basen und S SS Teilstrukturen (im Beispiel nicht enthalten) Christian Pölitz (TU Ilmenau) RNA Strukturvorhersage 17. Juli / 72

48 Frage Welcher Ableitungsbaum entpricht der optimalen Sekundärstruktur? Bzw. welcher Ableitungsbaum hat die höchste Wahrscheinlichkeit die optimale Sekundärstruktur zu sein? Christian Pölitz (TU Ilmenau) RNA Strukturvorhersage 17. Juli / 72

49 stochstisch kontextfreie Grammatiken Definition Eine PCFG (probabilistic context free grammar) ist ein Tupel G = (V, Σ, S, P, p G ), wobei V, Σ, S und P wie bei kontextfreien Grammatiken definiert sind. Zusätzlich ist noch eine Wahrscheinlichkeitsfunktion p G : P [0, 1] R, die jeder Produktion eine Wahrscheinlichkeit zuordnet, gegeben. Christian Pölitz (TU Ilmenau) RNA Strukturvorhersage 17. Juli / 72

50 stochstisch kontextfreie Grammatiken /2 Wahrscheinlichkeiten p G (α β) ist allgemein Wahrscheinlichkeit einer Produktion. Es gilt: A V : Σ x:(a x) P p G (A x) = 1. p G (α) = Π n i=1 p G (p i ) ist die Wahrscheinlichkeit einer Ableitung α P mit p i Wahrscheinlichkeiten der Produktionen, die in der Ableitung auftauchen. p G (w) = Σ α A(w) p G (α), mit A(w) = {α w wird in G mittels Ableitung α erzeugt}, ist die Wahrscheinlichkeit, dass w Σ von G erzeugt wird. Christian Pölitz (TU Ilmenau) RNA Strukturvorhersage 17. Juli / 72

51 Wahrscheinlichkeiten Inside - Wahrscheinlichkeit Gegeben sei eine Sequenz w = w 1 w 2... w n α(i, j, v) = p G (w i... w j N v w i... w j ) ist die Wahrscheinlichkeit aller Ableitungsbäume mit Wurzel v für den Infix w i... w j Christian Pölitz (TU Ilmenau) RNA Strukturvorhersage 17. Juli / 72

52 Inside - Wahrscheinlichkeit Berechnung α(i, j, v) = Σ x,y:av A x A y Σ j 1 k=i α(i, k, x)α(k + 1, j, y)p G (A v A x A y ) Christian Pölitz (TU Ilmenau) RNA Strukturvorhersage 17. Juli / 72

53 Inside - Wahrscheinlichkeit Algorithmus Gegeben : w = w 1 w 2... w n Initialisierung: α(i, i, v) = P(A v w i ) Rekurrenz: α(i, j, v) = Σ x,y:av A x A y Σ j 1 k=i α(i, k, x)α(k + 1, j, y)p G (A v A x A y ) Ausgabe: p G (w) = p G (A 1 G w) = α(1, n, 1). Christian Pölitz (TU Ilmenau) RNA Strukturvorhersage 17. Juli / 72

54 Beispiel: S NP VP 1,0 PP P NP 1,0 VP V NP 0,7 VP VP PP 0,3 P with 1,0 V saw 1,0 NP NP PP 0,4 NP astronomers 0,1 NP ears 0,18 NP saw 0,4 NP stars 0,18 NP telescopes 0,1 Christian Pölitz (TU Ilmenau) RNA Strukturvorhersage 17. Juli / 72

55 Christian Pölitz (TU Ilmenau) RNA Strukturvorhersage 17. Juli / 72

56 Berechnung für die mit Stern hervorgehobenden Wahrscheinlichkeiten VP 0,7 V NP 1,0 saw NP 0,18 saw stars PP 1,0 P NP 1,0 with NP 0,18 with stars S 1,0 NP VP 0,1 astronomers VP 0,7 astronomers V NP 1,0 astronomers saw NP 0,18 astronomers saw stars NP 0,4 NP PP 0,18 stars PP 1,0 stars P NP 1,0 stars with NP 0,18 stars with ears Christian Pölitz (TU Ilmenau) RNA Strukturvorhersage 17. Juli / 72

57 Der stochastische Cocke-Younger-Kasami-Algorithmus Definition Die stochastische Version des CYK Algorithmus berechnet die Wahrscheinlichkeit des wahrscheinlichsten Ableitungsbaumes für eine gegebene Sequence w = w 1... w n. Er stellt eine abgeänderte Version des Inside Algorithmus dar. Christian Pölitz (TU Ilmenau) RNA Strukturvorhersage 17. Juli / 72

58 Der stochastische Cocke-Younger-Kasami-Algorithmus Algorithmus Gegeben : w = w 1 w 2... w n Initialisierung: γ(i, i, v) = P(A v w i ) Rekurrenz: γ(i, j, v) = max Av A x A y max k=i..j 1 γ(i, k, x)γ(k + 1, j, y)p G (A v A x A y ) Ausgabe: p G (w) = p G (A 1 G w) = γ(1, n, 1). Christian Pölitz (TU Ilmenau) RNA Strukturvorhersage 17. Juli / 72

59 Beispiel analog zum Inside-Algorithmus: S NP VP 1,0 PP P NP 1,0 VP V NP 0,7 VP VP PP 0,3 P with 1,0 V saw 1,0 NP NP PP 0,4 NP astronomers 0,1 NP ears 0,18 NP saw 0,4 NP stars 0,18 NP telescopes 0,1 Christian Pölitz (TU Ilmenau) RNA Strukturvorhersage 17. Juli / 72

60 Christian Pölitz (TU Ilmenau) RNA Strukturvorhersage 17. Juli / 72

61 Wahrscheinlichste Ableitung S 1,0 NP VP 0,7 NP V NP 0,4 NP V NP PP 1,0 NP V NP P NP 0,1 astronomers V NP P NP 1,0 astronomers saw NP P NP 0,18 astronomers saw stars P NP 1,0 astronomers saw stars with NP 0,18 astronomers saw stars with ears. Christian Pölitz (TU Ilmenau) RNA Strukturvorhersage 17. Juli / 72

62 Weitere Betrachtungen Bis jetzt können wir nur Wahrscheinlichkeiten von Wörtern über Σ ausrechnen. Ein weitere Aufgabe im Zusammenhang mit stochatisch kontextfreien Grammatiken ist die Bestimmung der Parameter. Bezüglich der Struktur können wir die Grammatik in Chomsky Normalform annehmen. Wir benötigen jedoch noch ein Verfahren, um die Wahrscheinlichkeiten der Produktionen zu bestimmen. Christian Pölitz (TU Ilmenau) RNA Strukturvorhersage 17. Juli / 72

63 Möglichkeiten experimentell mittels chemischer und physikalischer Untersuchungen mittels Schätzungen über die erwartete Anzahl wie oft Produktionen verwendet werden Christian Pölitz (TU Ilmenau) RNA Strukturvorhersage 17. Juli / 72

64 Wahrscheinlichkeiten Outside - Wahrscheinlichkeit Gegeben sei eine Sequenz w = w 1 w 2... w n β(i, j, v) = p G (w 1... w i 1 N v w j+1... w n A 1 G w) ist die Wahrscheinlichkeit aller Ableitungsbäume mit Wurzel A 1 für w, ausschließlich der Wahrscheinlichkeit aller Ableitungsbäume für den Infix w i... w j Christian Pölitz (TU Ilmenau) RNA Strukturvorhersage 17. Juli / 72

65 Outside - Wahrscheinlichkeit Berechnung /1 β(i, j, v) = Σ f,g:af A v A g Σ i 1 k=1 α(k, i 1, g)β(k, j, f )p G (A f A v A g ) + Σ f,g:af A g A v Σ n k=j+1 α(j + 1, k, g)β(i, k, f )p G (A f A g A v ) Christian Pölitz (TU Ilmenau) RNA Strukturvorhersage 17. Juli / 72

66 Outside - Wahrscheinlichkeit Berechnung /2 β(i, j, v) = Σ f,g:af A v A g Σ i 1 k=1 α(k, i 1, g)β(k, j, f )p G (A f A v A g ) + Σ f,g:af A g A v Σ n k=j+1 α(j + 1, k, g)β(i, k, f )p G (A f A g A v ) Christian Pölitz (TU Ilmenau) RNA Strukturvorhersage 17. Juli / 72

67 Outside - Wahrscheinlichkeit Verwendung p G (w = w 1... w m ) = Σ m v=1 β(i, i, v)p G (N v w i ) für 1 i n oder p G (N 1 G w) = Σm v=1α(i, j, v)β(i, j, v) für 1 i j n Christian Pölitz (TU Ilmenau) RNA Strukturvorhersage 17. Juli / 72

68 Inside - Outside Erwartungswerte c(n v ) erwartete Anzahl wie oft der Nichtterminal N v beim Erzeugen von w verwendet wurde c(n v a) erwartete Anzahl wie oft die Produktion N v a beim Erzeugen von w verwendet wurde c(n v N x N y ) erwartete Anzahl wie oft die Produktion N v N x N y beim Erzeugen von w verwendet wurde Christian Pölitz (TU Ilmenau) RNA Strukturvorhersage 17. Juli / 72

69 Erwartungswerte Berechnung Gegeben sei die Sequence w = w 1... w n 1 c(n v ) = p G (N 1 G w)σn i=1 Σn j=1α(i, j, v)β(i, j, v) c(n v a) = 1 p G (N 1 G w)σn i=1 β(i, i, v)p g (N v w i ) c(n v N x N y ) auf analoge Weise Christian Pölitz (TU Ilmenau) RNA Strukturvorhersage 17. Juli / 72

70 Inside - Outside Updateschritt und Normalisierung p G (N v a) = p G (N v N x N y ) = c(nv a) c(n v ) c(nv a) c(n v ) Christian Pölitz (TU Ilmenau) RNA Strukturvorhersage 17. Juli / 72

71 Fazit Die Vorhersage einer optimalen RNA Sekundärstruktur ist mit einer hohen Wahrscheinlichkeit möglich. Die vorgestellten Verfahren sind alle nicht perfekt, aber dennoch gut genug, um praxisrelevant zu sein. Christian Pölitz (TU Ilmenau) RNA Strukturvorhersage 17. Juli / 72

72 Vielen Dank für die Aufmerksamkeit Christian Pölitz (TU Ilmenau) RNA Strukturvorhersage 17. Juli / 72

Theoretische Grundlagen der Informatik. Vorlesung am 8. Januar INSTITUT FÜR THEORETISCHE INFORMATIK

Theoretische Grundlagen der Informatik. Vorlesung am 8. Januar INSTITUT FÜR THEORETISCHE INFORMATIK Theoretische Grundlagen der Informatik 0 08.01.2019 Torsten Ueckerdt - Theoretische Grundlagen der Informatik KIT Die Forschungsuniversität in der Helmholtz-Gemeinschaft www.kit.edu Letzte Vorlesung Eine

Mehr

Theoretische Grundlagen der Informatik

Theoretische Grundlagen der Informatik Theoretische Grundlagen der Informatik Vorlesung am 15.01.2015 INSTITUT FÜR THEORETISCHE 0 KIT 15.01.2015 Universität des Dorothea Landes Baden-Württemberg Wagner - Theoretische und Grundlagen der Informatik

Mehr

RNA folding. W1-High-throughput Genomics, FU Berlin OWL RNA Bioinformatics, MPI Molgen Berlin

RNA folding. W1-High-throughput Genomics, FU Berlin OWL RNA Bioinformatics, MPI Molgen Berlin RNA folding W-High-throughput Genomics, FU Berlin OWL RNA Bioinformatics, MPI Molgen Berlin 3..6 Lernziele Einführung von RNA-Molekülen Konzept der RNA-Sekundärstruktur Lernen wie eine RNA-Sekundärstruktur

Mehr

a b b a a b b a Dank Grundlagen der Theoretischen Informatik / Einführung in die Theoretische Informatik I Chart-Parsing Chart-Parsing Vorlesung

a b b a a b b a Dank Grundlagen der Theoretischen Informatik / Einführung in die Theoretische Informatik I Chart-Parsing Chart-Parsing Vorlesung Dank Vorlesung Grundlagen der Theoretischen Informatik / Einführung in die Theoretische Informatik I Bernhard Beckert Diese Vorlesungsmaterialien basieren ganz wesentlich auf den Folien zu den Vorlesungen

Mehr

Klammersprache Definiere

Klammersprache Definiere Klammersprache w=w 1...w n {(,)}* heißt korrekt geklammert, falls die Anzahl ( ist gleich der Anzahl ). in jedem Anfangsstück w 1,...,w i (i n) ist die Anzahl ( nicht kleiner als die Anzahl ). Definiere

Mehr

Grundlagen der Theoretischen Informatik / Einführung in die Theoretische Informatik I

Grundlagen der Theoretischen Informatik / Einführung in die Theoretische Informatik I Vorlesung Grundlagen der Theoretischen Informatik / Einführung in die Theoretische Informatik I Bernhard Beckert Institut für Informatik ommersemester 2007 B. Beckert Grundlagen d. Theoretischen Informatik:

Mehr

Grundlagen der Theoretischen Informatik / Einführung in die Theoretische Informatik I

Grundlagen der Theoretischen Informatik / Einführung in die Theoretische Informatik I Vorlesung Grundlagen der Theoretischen Informatik / Einführung in die Theoretische Informatik I Bernhard Beckert Institut für Informatik ommersemester 2007 B. Beckert Grundlagen d. Theoretischen Informatik:

Mehr

Theoretische Grundlagen der Informatik

Theoretische Grundlagen der Informatik Theoretische Grundlagen der Informatik Vorlesung am 13.01.2011 INSTITUT FÜR THEORETISCHE INFORMATIK 0 KIT Universität des Landes Baden-Württemberg und nationales Forschungszentrum in der Helmholtz-Gemeinschaft

Mehr

Thema 12: RNA Structure Prediction

Thema 12: RNA Structure Prediction Thema 12: RNA Structure Prediction Vortrag gehalten von Tobias Sander am 01.02.2010 1 Einleitung 1.1 Vorwort Seit der Strukturaufklärung der DNA im Jahre 1953 durch Watson und Crick sind fast 60 Jahre

Mehr

Kontextfreie Sprachen. Automaten und Formale Sprachen alias Theoretische Informatik. Sommersemester Kontextfreie Sprachen

Kontextfreie Sprachen. Automaten und Formale Sprachen alias Theoretische Informatik. Sommersemester Kontextfreie Sprachen Automaten und Formale Sprachen alias Theoretische Informatik Sommersemester 2012 Dr. Sander Bruggink Übungsleitung: Jan Stückrath Wortproblem: der CYK-Algorithmus Pumping Lemma für kontextfreie Sprachen

Mehr

Informatik III. Christian Schindelhauer Wintersemester 2006/07 8. Vorlesung

Informatik III. Christian Schindelhauer Wintersemester 2006/07 8. Vorlesung Informatik III Christian Schindelhauer Wintersemester 2006/07 8. Vorlesung 17.11.2006 schindel@informatik.uni-freiburg.de 1 Prinzip des Kellerautomats Push-Down-Automaton (PDA) Ein Kellerautomat vereinigt

Mehr

Vorhersage der RNA-Sekundärstruktur

Vorhersage der RNA-Sekundärstruktur Vorhersage der RNA-Sekundärstruktur Andreas Spillner Bioinformatik, SS 2018 Primärstruktur vs. Sekundärstruktur Primärstruktur Sequenz der Buchstaben (bei RNA entspricht ein Buchstabe jeweils einer Nukleinsäure

Mehr

kontextfreie Grammatiken Theoretische Informatik kontextfreie Grammatiken kontextfreie Grammatiken Rainer Schrader 14. Juli 2009 Gliederung

kontextfreie Grammatiken Theoretische Informatik kontextfreie Grammatiken kontextfreie Grammatiken Rainer Schrader 14. Juli 2009 Gliederung Theoretische Informatik Rainer Schrader Zentrum für Angewandte Informatik Köln 14. Juli 2009 1 / 40 2 / 40 Beispiele: Aus den bisher gemachten Überlegungen ergibt sich: aus der Chomsky-Hierarchie bleiben

Mehr

Grammatiken. Eine Grammatik G mit Alphabet Σ besteht aus: Variablen V. Startsymbol S V. Kurzschreibweise G = (V, Σ, P, S)

Grammatiken. Eine Grammatik G mit Alphabet Σ besteht aus: Variablen V. Startsymbol S V. Kurzschreibweise G = (V, Σ, P, S) Grammatiken Eine Grammatik G mit Alphabet Σ besteht aus: Variablen V Startsymbol S V Produktionen P ( (V Σ) \ Σ ) (V Σ) Kurzschreibweise G = (V, Σ, P, S) Schreibweise für Produktion (α, β) P: α β 67 /

Mehr

Automatentheorie und formale Sprachen

Automatentheorie und formale Sprachen Automatentheorie und formale Sprachen VL 8 Chomsky-Grammatiken Kathrin Hoffmann 23. Mai 2012 Hoffmann (HAW Hamburg) Automatentheorie und formale Sprachen 23.5. 2012 250 Wortproblem Wortproblem ist das

Mehr

Übersicht. 3 3 Kontextfreie Sprachen

Übersicht. 3 3 Kontextfreie Sprachen Formale Systeme, Automaten, Prozesse Übersicht 3 3.1 Kontextfreie Sprachen und Grammatiken 3.2 Ableitungsbäume 3.3 Die pre -Operation 3.4 Entscheidungsprobleme für CFGs 3.5 Normalformen für CFGs 3.6 Chomsky-Normalform

Mehr

Informatik III. Christian Schindelhauer Wintersemester 2006/07 5. Vorlesung

Informatik III. Christian Schindelhauer Wintersemester 2006/07 5. Vorlesung Informatik III Christian Schindelhauer Wintersemester 2006/07 5. Vorlesung 09.11.2006 schindel@informatik.uni-freiburg.de 1 Äquivalenzklassen Definition und Beispiel Definition Für eine Sprache L Σ* bezeichnen

Mehr

Kontextfreie Sprachen Kontextfreie Sprachen und Grammatiken. Satzformen sind die Wörter aus (N T ). Notation: Wir verwenden oft

Kontextfreie Sprachen Kontextfreie Sprachen und Grammatiken. Satzformen sind die Wörter aus (N T ). Notation: Wir verwenden oft und Grammatiken (Folie 119, eite 202 im kript) atzformen sind die Wörter aus (N T ). Notation: Wir verwenden oft a, b, c,... für Terminalsymbole A, B, C,... für Nonterminale u, v, w,... für Terminalwörter

Mehr

Informatik III. Christian Schindelhauer Wintersemester 2006/07 6. Vorlesung

Informatik III. Christian Schindelhauer Wintersemester 2006/07 6. Vorlesung Informatik III Christian Schindelhauer Wintersemester 2006/07 6. Vorlesung 10.11.2006 schindel@informatik.uni-freiburg.de 1 Kapitel IV Kontextfreie Sprachen Kontextfreie Grammatik Informatik III 6. Vorlesung

Mehr

Theoretische Grundlagen der Informatik. Vorlesung am 17. Januar INSTITUT FÜR THEORETISCHE INFORMATIK

Theoretische Grundlagen der Informatik. Vorlesung am 17. Januar INSTITUT FÜR THEORETISCHE INFORMATIK Theoretische Grundlagen der Informatik 0 17.01.2019 Torsten Ueckerdt - Theoretische Grundlagen der Informatik KIT Die Forschungsuniversität in der Helmholtz-Gemeinschaft www.kit.edu Evaluation Ergebnisse

Mehr

Probabilistische kontextfreie Grammatiken

Probabilistische kontextfreie Grammatiken Mathematische Grundlagen III Probabilistische kontextfreie Grammatiken 14 Juni 2011 1/26 Ambiguität beim Parsing Wörter können verschiedene Bedeutungen haben und mehr als einer Wortkategorien angehören

Mehr

Grammatiken. Grammatiken sind regelbasierte Kalküle zur Konstruktion von Systemen und Sprachen Überprüfung von Systemen und Sprachen

Grammatiken. Grammatiken sind regelbasierte Kalküle zur Konstruktion von Systemen und Sprachen Überprüfung von Systemen und Sprachen Grammatiken Grammatiken sind regelbasierte Kalküle zur Konstruktion von Systemen und Sprachen Überprüfung von Systemen und Sprachen Grammatiken eignen sich besonders zur Modellierung beliebig tief geschachtelter,

Mehr

Einführung in Berechenbarkeit, Formale Sprachen und Komplexitätstheorie

Einführung in Berechenbarkeit, Formale Sprachen und Komplexitätstheorie Einführung in Berechenbarkeit, Formale Sprachen und Komplexitätstheorie Wintersemester 2005/2006 07.11.2005 5. Vorlesung 1 Überblick: Kontextfreie Sprachen Formale Grammatik Einführung, Beispiele Formale

Mehr

Anwendungen dynamischer Programmierung in der Biologie

Anwendungen dynamischer Programmierung in der Biologie Anwendungen dynamischer Programmierung in der Biologie Überblick Algorithmus zum Finden der wahrscheinlichsten Sekundärstruktur eines RNS Moleküls Sequence Alignment Verbesserung von Sequence Alignment

Mehr

Kontextfreie Sprachen werden von PDAs akzeptiert

Kontextfreie Sprachen werden von PDAs akzeptiert Kontextfreie Sprachen werden von PDAs akzeptiert Sei G = (Σ, V, S, P) eine kontextfreie Grammatik. Dann gibt es einen PDA A mit L(A) = L(G). Der PDA A arbeitet mit nur einem Zustand q 0, besitzt das Kelleralphabet

Mehr

Theoretische Grundlagen der Informatik

Theoretische Grundlagen der Informatik Theoretische Grundlagen der Informatik Vorlesung am 17. Januar 2012 INSTITUT FÜR THEORETISCHE 0 KIT 18.01.2012 Universität des Dorothea Landes Baden-Württemberg Wagner - Theoretische und Grundlagen der

Mehr

Probabilistic Context Free Grammars, Part II

Probabilistic Context Free Grammars, Part II Probabilistic Context Free Grammars, Part II Prof Dr. Matthew Crocker Universität des Saarlandes 16. Juli 2015 Matthew Crocker (UdS) PCFG II 16. Juli 2015 1 / 25 Themen heute: 1 Wiederholung: PCFG 2 Formeln

Mehr

Theoretische Grundlagen der Informatik

Theoretische Grundlagen der Informatik Theoretische Grundlagen der Informatik Übung am 4.2.2011 INSTITUT FÜR THEORETISCHE INFORMATIK 0 KIT Universität des Landes Baden-Württemberg und nationales Forschungszentrum in der Helmholtz-Gemeinschaft

Mehr

Definition 4 (Operationen auf Sprachen) Beispiel 5. Seien A, B Σ zwei (formale) Sprachen. Konkatenation: AB = {uv ; u A, v B} A + = n 1 An

Definition 4 (Operationen auf Sprachen) Beispiel 5. Seien A, B Σ zwei (formale) Sprachen. Konkatenation: AB = {uv ; u A, v B} A + = n 1 An Definition 4 (Operationen auf Sprachen) Seien A, B Σ zwei (formale) Sprachen. Konkatenation: AB = {uv ; u A, v B} A 0 = {ɛ}, A n+1 = AA n A = n 0 An A + = n 1 An Beispiel 5 {ab, b}{a, bb} = {aba, abbb,

Mehr

Grammatik der Genome

Grammatik der Genome Grammatik der Genome Andreas de Vries Fachhochschule Südwestfalen, Campus Hagen SS 2011 1 / 14 Inhalt 1 Formale Sprachen 2 Genomgrammatik 2 / 14 Formale Sprachen Übersicht 1 Formale Sprachen 2 Genomgrammatik

Mehr

RNA Faltung - II. W1-High-throughput Genomics, FU Berlin OWL RNA Bioinformatics, MPI Molgen Berlin

RNA Faltung - II. W1-High-throughput Genomics, FU Berlin OWL RNA Bioinformatics, MPI Molgen Berlin RNA Faltung - II W1-High-throughput Genomics, FU Berlin OWL RNA Bioinformatics, MPI Molgen Berlin 05.12.16 Nussinov Nachteilen Die Maximierung der Anzahl von Bp führt unter Umständen nicht zu biologisch

Mehr

Kapitel 2: Formale Sprachen Gliederung

Kapitel 2: Formale Sprachen Gliederung Gliederung 0. Motivation und Einordnung 1. Endliche Automaten 2. Formale Sprachen 3. Berechnungstheorie 4. Komplexitätstheorie 2.1. Chomsky-Grammatiken 2.2. Reguläre Sprachen 2.3. 2/5, Folie 1 2017 Prof.

Mehr

Übungsblatt 7. Vorlesung Theoretische Grundlagen der Informatik im WS 16/17

Übungsblatt 7. Vorlesung Theoretische Grundlagen der Informatik im WS 16/17 Institut für Theoretische Informatik Lehrstuhl Prof. Dr. D. Wagner Übungsblatt 7 Vorlesung Theoretische Grundlagen der Informatik im W 16/17 Ausgabe 17. Januar 2017 Abgabe 31. Januar 2017, 11:00 Uhr (im

Mehr

Einführung in die Computerlinguistik Chart-Parsing

Einführung in die Computerlinguistik Chart-Parsing Einführung in die Computerlinguistik Chart-Parsing Dozentin: Wiebke sen 21.12.2009 Wiebke sen Einführung CL (Wie 09/10) 1 P = calls calls Wiebke sen Einführung CL (Wie 09/10) 2 P = calls calls Wiebke sen

Mehr

Vorlesung im Sommersemester Informatik IV. Probeklausurtermin: 21. Juni 2016

Vorlesung im Sommersemester Informatik IV. Probeklausurtermin: 21. Juni 2016 Heinrich-Heine-Universität Düsseldorf Institut für Informatik Prof. Dr. J. Rothe Universitätsstr. 1, D-40225 Düsseldorf Gebäude: 25.12, Ebene: O2, Raum: 26 Tel.: +49 211 8112188, Fax: +49 211 8111667 E-Mail:

Mehr

2. Klausur zur Vorlesung Theoretische Grundlagen der Informatik Wintersemester 2017/2018

2. Klausur zur Vorlesung Theoretische Grundlagen der Informatik Wintersemester 2017/2018 2. Klausur zur Vorlesung Theoretische Grundlagen der Informatik Wintersemester 2017/2018 Hier Aufkleber mit Name und Matrikelnummer anbringen Vorname: Nachname: Matrikelnummer: Beachten Sie: Bringen Sie

Mehr

2. Klausur zur Vorlesung Theoretische Grundlagen der Informatik Wintersemester 2014/2015

2. Klausur zur Vorlesung Theoretische Grundlagen der Informatik Wintersemester 2014/2015 2. Klausur zur Vorlesung Theoretische Grundlagen der Informatik Wintersemester 2014/2015 Hier Aufkleber mit Name und Matrikelnummer anbringen Vorname: Nachname: Matrikelnummer: Beachten Sie: Bringen Sie

Mehr

Grundlagen der Theoretischen Informatik

Grundlagen der Theoretischen Informatik Grundlagen der Theoretischen Informatik 4. Kellerautomaten und kontextfreie prachen (VI) 25.06.2015 Viorica ofronie-tokkermans e-mail: sofronie@uni-koblenz.de 1 Übersicht 1. Motivation 2. Terminologie

Mehr

Informatik III - WS07/08

Informatik III - WS07/08 Informatik III - WS07/08 Kapitel 5 1 Informatik III - WS07/08 Prof. Dr. Dorothea Wagner dwagner@ira.uka.de Kapitel 5 : Grammatiken und die Chomsky-Hierarchie Informatik III - WS07/08 Kapitel 5 2 Definition

Mehr

I.5. Kontextfreie Sprachen

I.5. Kontextfreie Sprachen I.5. Kontextfreie prachen Zieht man in Betracht, dass BNF-yteme gerade so beschaffen sind, dass auf der linken eite immer genau ein Nichtterminal steht, so sind das also gerade die Ableitungsregeln einer

Mehr

FOLDALIGN und sein Algorithmus. Nadine Boley Silke Szymczak

FOLDALIGN und sein Algorithmus. Nadine Boley Silke Szymczak FOLDALIGN und sein Algorithmus Nadine Boley Silke Szymczak Gliederung 2 Einleitung Motivation des Ansatzes zu FOLDALIGN Sankoff-Algorithmus Globales Alignment Zuker-Algorithmus Kombination FOLDALIGN Algorithmus,

Mehr

Beschreibungskomplexität von Grammatiken Definitionen

Beschreibungskomplexität von Grammatiken Definitionen Beschreibungskomplexität von Grammatiken Definitionen Für eine Grammatik G = (N, T, P, S) führen wir die folgenden drei Komplexitätsmaße ein: Var(G) = #(N), Prod(G) = #(P ), Symb(G) = ( α + β + 1). α β

Mehr

Kontextfreie (Typ-2) Sprachen

Kontextfreie (Typ-2) Sprachen Kontextfreie (Typ-2) prachen Bsp.: L 1 = { n 1 n n>} с {,1}* 1 1 L 2 = {w wє{,1}* und w=w rev } с {,1}* 11 1 ε L 3 = {w w hat genausoviele Nullen wie Einsen} с {,1}* B 1 ε 1 B 1 1 BB 1 11 11 11 11B 111

Mehr

Vorlesung Theoretische Informatik (Info III)

Vorlesung Theoretische Informatik (Info III) 1 Vorlesung Theoretische Informatik (Info III) Prof. Dr. Dorothea Wagner Dipl.-Math. Martin Holzer 22. Januar 2008 Einleitung Motivation 2 Thema heute Kontextfreie Grammatiken: Lemma von Ogden Eigenschaften

Mehr

Grundlagen Theoretischer Informatik 2 WiSe 2011/12 in Trier. Henning Fernau Universität Trier

Grundlagen Theoretischer Informatik 2 WiSe 2011/12 in Trier. Henning Fernau Universität Trier Grundlagen Theoretischer Informatik 2 WiSe 2011/12 in Trier Henning Fernau Universität Trier fernau@uni-trier.de 1 Grundlagen Theoretischer Informatik 2 Gesamtübersicht Organisatorisches; Einführung Ersetzungsverfahren:

Mehr

Ein Satz der deutschen Sprache besitzt ein Subjekt, ein Prädikat und ein Objekt (SPO).

Ein Satz der deutschen Sprache besitzt ein Subjekt, ein Prädikat und ein Objekt (SPO). 1 Grammatiken Autor: Tilman Blumenbach Letzte Änderung: 28. Juni 2012 18:15 Ziel von Grammatiken Wollen die Struktur von Sprachen modellieren und charakterisieren. Beispiel Ein Satz der deutschen Sprache

Mehr

2. Gegeben sei folgender nichtdeterministischer endlicher Automat mit ɛ-übergängen:

2. Gegeben sei folgender nichtdeterministischer endlicher Automat mit ɛ-übergängen: Probeklausur Automatentheorie & Formale Sprachen WiSe 2012/13, Wiebke Petersen Name: Matrikelnummer: Aufgabe A: Typ3-Sprachen 1. Konstruieren Sie einen endlichen Automaten, der die Sprache aller Wörter

Mehr

Übungsblatt 7. Vorlesung Theoretische Grundlagen der Informatik im WS 16/17

Übungsblatt 7. Vorlesung Theoretische Grundlagen der Informatik im WS 16/17 Institut für Theoretische Informatik Lehrstuhl Prof. Dr. D. Wagner Übungsblatt 7 Vorlesung Theoretische Grundlagen der Informatik im W 16/17 Ausgabe 17. Januar 2017 Abgabe 31. Januar 2017, 11:00 Uhr (im

Mehr

Theoretische Informatik I

Theoretische Informatik I Theoretische nformatik inheit 3 Kontextfreie Sprachen 1. Kontextfreie Grammatiken 2. Pushdown Automaten 3. igenschaften kontextfreier Sprachen Verarbeitung von Programmiersprachen Was ist das einfachste

Mehr

Musterlösung Informatik-III-Nachklausur

Musterlösung Informatik-III-Nachklausur Musterlösung Informatik-III-Nachklausur Aufgabe 1 (2+2+4+4 Punkte) (a) L = (0 1) 0(0 1) 11(0 1) 0(0 1) (b) Der Automat ist durch folgendes Übergangsdiagramm gegeben: 0, 1 0, 1 0, 1 0, 1 0 s q 1 1 0 0 q

Mehr

Einführung in die Computerlinguistik

Einführung in die Computerlinguistik Einführung in die Computerlinguistik Kontextfreie Sprachen und Pushdown-Automaten Dozentin: Wiebke Petersen WS 2004/2005 Wiebke Petersen Formale Komplexität natürlicher Sprachen WS 03/04 Wiederholung c

Mehr

Informatik 3 Theoretische Informatik WS 2016/17

Informatik 3 Theoretische Informatik WS 2016/17 Zwischenklausur 2 20. Januar 2017 Informatik 3 Theoretische Informatik WS 2016/17 Prof. Dr. Peter Thiemann Albert-Ludwigs-Universität Freiburg Institut für Informatik Name: Übungsgruppe: Schreiben Sie

Mehr

Kapitel: Die Chomsky Hierarchie. Die Chomsky Hierarchie 1 / 14

Kapitel: Die Chomsky Hierarchie. Die Chomsky Hierarchie 1 / 14 Kapitel: Die Chomsky Hierarchie Die Chomsky Hierarchie 1 / 14 Allgemeine Grammatiken Definition Eine Grammatik G = (Σ, V, S, P) besteht aus: einem endlichen Alphabet Σ, einer endlichen Menge V von Variablen

Mehr

Earley Parser. Flutura Mestani

Earley Parser. Flutura Mestani Earley Parser Flutura Mestani Informatik Seminar Algorithmen zu kontextfreien Grammatiken Wintersemester 2015/2016 Prof. Martin Hofmann, Dr. Hans Leiß Flutura Mestani 25.11.2015 Seminar Algorithmen zu

Mehr

Grundlagen der Theoretischen Informatik / Einführung in die Theoretische Informatik I

Grundlagen der Theoretischen Informatik / Einführung in die Theoretische Informatik I Vorlesung Grundlagen der Theoretischen Informatik / Einführung in die Theoretische Informatik I Bernhard Beckert Institut für Informatik Sommersemester 2007 B. Beckert Grundlagen d. Theoretischen Informatik:

Mehr

Umformung NTM DTM. Charakterisierung rek. aufz. Spr. Chomsky-3-Grammatiken (T5.3) Chomsky-0-Grammatik Rek. Aufz.

Umformung NTM DTM. Charakterisierung rek. aufz. Spr. Chomsky-3-Grammatiken (T5.3) Chomsky-0-Grammatik Rek. Aufz. Chomsky-0-Grammatik Rek. Aufz. Satz T5.2.2: Wenn L durch eine Chomsky-0- Grammatik G beschrieben wird, gibt es eine NTM M, die L akzeptiert. Beweis: Algo von M: Schreibe S auf freie Spur. Iteriere: Führe

Mehr

Theoretische Grundlagen der Informatik

Theoretische Grundlagen der Informatik Theoretische Grundlagen der Informatik Vorlesung am 18. Januar 2018 INSTITUT FÜR THEORETISCHE 0 18.01.2018 Dorothea Wagner - Theoretische Grundlagen der Informatik INSTITUT FÜR THEORETISCHE KIT Die Forschungsuniversität

Mehr

Chomsky-Grammatiken 16. Chomsky-Grammatiken

Chomsky-Grammatiken 16. Chomsky-Grammatiken Chomsky-Grammatiken 16 Chomsky-Grammatiken Ursprünglich von Chomsky in den 1950er Jahren eingeführt zur Beschreibung natürlicher Sprachen. Enge Verwandschaft zu Automaten Grundlage wichtiger Softwarekomponenten

Mehr

Das Postsche Korrespondenzproblem

Das Postsche Korrespondenzproblem Das Postsche Korrespondenzproblem Eine Instanz des PKP ist eine Liste von Paaren aus Σ Σ : (v 1, w 1 ),..., (v n, w n ) Eine Lösung ist eine Folge i 1,..., i k von Indizes 1 i j n mit v i1... v ik = w

Mehr

Tutoraufgabe 1 (ɛ-produktionen):

Tutoraufgabe 1 (ɛ-produktionen): Prof aa Dr J Giesl Formale Systeme, Automaten, Prozesse SS 2010 M Brockschmidt, F Emmes, C Fuhs, C Otto, T Ströder Hinweise: Die Hausaufgaben sollen in Gruppen von je 2 Studierenden aus dem gleichen Tutorium

Mehr

Grundlagen der Theoretischen Informatik

Grundlagen der Theoretischen Informatik Grundlagen der Theoretischen Informatik Sommersemester 2015 23.04.2015 Viorica Sofronie-Stokkermans e-mail: sofronie@uni-koblenz.de 1 Bis jetzt 1. Terminologie 2. Endliche Automaten und reguläre Sprachen

Mehr

Grundlagen der Theoretischen Informatik

Grundlagen der Theoretischen Informatik 1 Grundlagen der Theoretischen Informatik Till Mossakowski Fakultät für Informatik Otto-von-Guericke Universität Magdeburg Wintersemester 2014/15 2 Kontextfreie Grammatiken Definition: Eine Grammatik G

Mehr

Grammatik Prüfung möglich, ob eine Zeichenfolge zur Sprache gehört oder nicht

Grammatik Prüfung möglich, ob eine Zeichenfolge zur Sprache gehört oder nicht Zusammenhang: Formale Sprache Grammatik Formale Sprache kann durch Grammatik beschrieben werden. Zur Sprache L = L(G) gehören nur diejenigen Kombinationen der Zeichen des Eingabealphabets, die durch die

Mehr

Zentralübung zur Vorlesung Theoretische Informatik

Zentralübung zur Vorlesung Theoretische Informatik SS 2015 Zentralübung zur Vorlesung Theoretische Informatik Dr. Werner Meixner Fakultät für Informatik TU München http://www14.in.tum.de/lehre/2015ss/theo/uebung/ 7. Mai 2015 ZÜ THEO ZÜ IV Übersicht: 1.

Mehr

Algorithmische Bioinformatik

Algorithmische Bioinformatik FREIE UNIVERSITÄT BERLIN Fachbereich Mathematik und Informatik Institut für Informatik (WE 3) FU BERLIN Freie Universität Berlin FB Mathematik und Informatik, Institut für Informatik, Takustr. 9, D-14195

Mehr

Kontextfreie Sprachen

Kontextfreie Sprachen Kontextfreie Sprachen Bedeutung: Programmiersprachen (Compilerbau) Syntaxbäume Chomsky-Normalform effiziente Lösung des Wortproblems (CYK-Algorithmus) Grenzen kontextfreier Sprachen (Pumping Lemma) Charakterisierung

Mehr

Kontextfreie Sprachen

Kontextfreie Sprachen Kontextfreie Sprachen besitzen große Bedeutung im Compilerbau Chomsky-Normalform effiziente Lösung des Wortproblems (CYK-Algorithmus) Grenzen kontextfreier Sprachen (Pumping Lemma) Charakterisierung durch

Mehr

4.9.7 Konstruktion der Suffixbäume

4.9.7 Konstruktion der Suffixbäume .9.7 Konstruktion der Suffixbäume Beipiel: xabxa (siehe Abbildung.27) Man beginnt mit der Konstruktion eines Suffixbaumes für gesamten String und schreibt eine 1 am Blatt, weil der Suffix xabxa an der

Mehr

Theoretische Grundlagen der Informatik

Theoretische Grundlagen der Informatik Theoretische Grundlagen der Informatik Vorlesung am 12.01.2012 INSTITUT FÜR THEORETISCHE 0 KIT 12.01.2012 Universität des Dorothea Landes Baden-Württemberg Wagner - Theoretische und Grundlagen der Informatik

Mehr

DisMod-Repetitorium Tag 4

DisMod-Repetitorium Tag 4 DisMod-Repetitorium Tag 4 Endliche Automaten, Reguläre Sprachen und Kontextfreie Grammatiken 22. März 2018 1 Endliche Automaten Definition DFA Auswertungen Äquivalenzrelationen Verschmelzungsrelation und

Mehr

2.1 Grundlagen: Kontextfreie Grammatiken

2.1 Grundlagen: Kontextfreie Grammatiken 2.1 Grundlagen: Kontextfreie Grammatiken Programme einer Programmiersprache können unbeschränkt viele Tokens enthalten, aber nur endlich viele Token-Klassen :-) Als endliches Terminal-Alphabet T wählen

Mehr

Ein Fragment von Pascal

Ein Fragment von Pascal Ein Fragment von Pascal Wir beschreiben einen (allerdings sehr kleinen) Ausschnitt von Pascal durch eine kontextfreie Grammatik. Wir benutzen das Alphabet Σ = {a,..., z, ;, :=, begin, end, while, do} und

Mehr

Algorithmen und Datenstrukturen SS09. Foliensatz 15. Michael Brinkmeier. Technische Universität Ilmenau Institut für Theoretische Informatik

Algorithmen und Datenstrukturen SS09. Foliensatz 15. Michael Brinkmeier. Technische Universität Ilmenau Institut für Theoretische Informatik Foliensatz 15 Michael Brinkmeier Technische Universität Ilmenau Institut für Theoretische Informatik Sommersemester 2009 TU Ilmenau Seite 1 / 16 Untere Schranken für das Vergleichsbasierte Sortieren TU

Mehr

Grundbegriffe. Grammatiken

Grundbegriffe. Grammatiken Grammatiken Grammatiken in der Informatik sind ähnlich wie Grammatiken für natürliche Sprachen ein Mittel, um alle syntaktisch korrekten Sätze (hier: Wörter) einer Sprache zu erzeugen. Beispiel: Eine vereinfachte

Mehr

Übungsblatt 6. Vorlesung Theoretische Grundlagen der Informatik im WS 18/19

Übungsblatt 6. Vorlesung Theoretische Grundlagen der Informatik im WS 18/19 Institut für Theoretische Informatik Lehrstuhl Prof. Dr. D. Wagner Übungsblatt 6 Vorlesung Theoretische Grundlagen der Informatik im WS 18/19 Ausgabe 8. Januar 2019 Abgabe 22. Januar 2019, 11:00 Uhr (im

Mehr

Formale Sprachen und Automaten

Formale Sprachen und Automaten Formale Sprachen und Automaten Lischke SS 2004 Vorwort Dieses Dokument wurde als Skript für die auf der Titelseite genannte Vorlesung erstellt und wird jetzt im Rahmen des Projekts Vorlesungsskripte der

Mehr

Grundlagen der Theoretischen Informatik

Grundlagen der Theoretischen Informatik Grundlagen der Theoretischen Informatik 4. Kellerautomaten und kontextfreie Sprachen (III) 17.06.2015 Viorica Sofronie-Stokkermans e-mail: sofronie@uni-koblenz.de 1 Übersicht 1. Motivation 2. Terminologie

Mehr

Erkennung der kontextfreien Grammatiken mittels Boolescher Matrixmultiplikation

Erkennung der kontextfreien Grammatiken mittels Boolescher Matrixmultiplikation Erkennung der kontextfreien Grammatiken mittels Boolescher Matrixmultiplikation Valiant-Erkenner Referent: Fedor Uvarov eminar Algorithmen zu kontextfreien Grammatiken Dozenten: Prof Dr. Hofmann, Dr. Leiß

Mehr

Automaten und formale Sprachen Notizen zu den Folien

Automaten und formale Sprachen Notizen zu den Folien Automaten und formale prachen Notizen zu den Folien 10 Kontextfreie Grammatiken Beispiele für kontextfreien Grammatiken ei Σ = {a, b}. Beispiel 1 (Folie 211, oben) Geben ie eine kontextfreie Grammatik

Mehr

Formale Grundlagen der Wirtschaftsinformatik

Formale Grundlagen der Wirtschaftsinformatik Formale Grundlagen der Wirtschaftsinformatik Nikolaj Popov Research Institute for Symbolic Computation popov@risc.uni-linz.ac.at Sprachen und Grammatiken Teil II Sprache Definition: Ein Alphabet Σ ist

Mehr

Automaten und formale Sprachen Notizen zu den Folien

Automaten und formale Sprachen Notizen zu den Folien Automaten und formale prachen Notizen zu den Folien 10 Kontextfreie Grammatiken Beispiele für kontextfreien Grammatiken ei Σ = {a, b}. Beispiel 1 (Folie 233, oben) Geben ie eine kontextfreie Grammatik

Mehr

Theoretische Grundlagen der Informatik

Theoretische Grundlagen der Informatik Theoretische Grundlagen der Informatik Übung am 02.02.2012 INSTITUT FÜR THEORETISCHE 0 KIT 06.02.2012 Universität des Andrea Landes Schumm Baden-Württemberg - Theoretische und Grundlagen der Informatik

Mehr

1. Übungsblatt 6.0 VU Theoretische Informatik und Logik

1. Übungsblatt 6.0 VU Theoretische Informatik und Logik . Übungsblatt 6. VU Theoretische Informatik und Logik 25. September 23 Aufgabe Sind folgende Aussagen korrekt? Begründen Sie jeweils Ihre Antwort. a) Für jede Sprache L gilt: L < L (wobei A die Anzahl

Mehr

A : z z A : z z : ( z, x, z ) δ

A : z z A : z z : ( z, x, z ) δ Informatik IV, SoS2003 1 Definition 1.1 Ein Quintupel A =(X,Z,z 0,δ,Z f )heißt nichtdeterministischer endlicher Automat (NEA): 1. X, Z sind endliche nichtleere Mengen. 2. z 0 Z 4. δ Z X Z Informatik IV,

Mehr

Nachklausur zur Vorlesung Theoretische Grundlagen der Informatik Wintersemester 2011/2012

Nachklausur zur Vorlesung Theoretische Grundlagen der Informatik Wintersemester 2011/2012 Institut für Theoretische Informatik Lehrstuhl Prof. Dr. D. Wagner Nachklausur zur Vorlesung Theoretische Grundlagen der Informatik Wintersemester 2011/2012 Hier Aufkleber mit Name und Matrikelnr. anbringen

Mehr

Vorhersagealgorithmen Strukturelle Bioinformatik WS15/16

Vorhersagealgorithmen Strukturelle Bioinformatik WS15/16 Vorhersagealgorithmen Strukturelle Bioinformatik WS15/16 Dr. Stefan Simm, 02.12.2015 simm@bio.uni-frankfurt.de RNA-Sekundärstrukturen werden durch Interaktionen zwischen komplementären Nucleotid-Paaren

Mehr

Der Earley-Algorithmus

Der Earley-Algorithmus Der Earley-Algorithmus Kursfolien Karin Haenelt 25.03.02 1 25.03.02 2 Inhalt Funktion des Earley-Algorithmus Begriffe Erkenner/Parser Kontextfreie Grammatik Ein Beispiel Funktionen des Algorithmus Funktionsweise

Mehr

Kapitel 3. Kontextfreie Sprachen. Induktive Charakterisierung der Sprache L der korrekten Klammerausdrücke: (w) L, falls w L vw L, falls v, w L

Kapitel 3. Kontextfreie Sprachen. Induktive Charakterisierung der Sprache L der korrekten Klammerausdrücke: (w) L, falls w L vw L, falls v, w L Kapitel 3 Kontextfreie Sprachen Induktive Charakterisierung der Sprache L der korrekten Klammerausdrücke: s. Übung ε L (w) L, falls w L vw L, falls v, w L (R0) (R1) (R2) Für beliebige w {(, )} kann w L

Mehr

Formale Sprachen. Grammatiken und die Chomsky-Hierarchie. Rudolf FREUND, Marian KOGLER

Formale Sprachen. Grammatiken und die Chomsky-Hierarchie. Rudolf FREUND, Marian KOGLER Formale Sprachen Grammatiken und die Chomsky-Hierarchie Rudolf FREUND, Marian KOGLER Grammatiken Das fundamentale Modell zur Beschreibung von formalen Sprachen durch Erzeugungsmechanismen sind Grammatiken.

Mehr

Der Earley-Algorithmus

Der Earley-Algorithmus Der Earley-Algorithmus Kursfolien Karin Haenelt 25.03.02 1 25.03.02 2 Inhalt Funktion des Earley-Algorithmus Begriffe Erkenner/Parser Kontextfreie Grammatik Ein Beispiel Funktionen des Algorithmus Funktionsweise

Mehr

Ogden s Lemma: Der Beweis (1/5)

Ogden s Lemma: Der Beweis (1/5) Ogden s Lemma: Der Beweis (1/5) Wir betrachten zuerst die Rahmenbedingungen : Laut dem auf der vorhergehenden Folie zitierten Satz gibt es zur kontextfreien Sprache L eine Grammatik G = (Σ, V, S, P) in

Mehr

Kontextfreie Grammatiken. Kontextfreie Grammatiken 1 / 45

Kontextfreie Grammatiken. Kontextfreie Grammatiken 1 / 45 Kontextfreie Grammatiken Kontextfreie Grammatiken 1 / 45 Was kann man mit kontextfreien Grammatiken anfangen? Kontextfreie Grammatiken, kurz: werden zur Modellierung von KFGs beliebig tief geschachtelten

Mehr

Lösungen zur 1. Klausur. Einführung in Berechenbarkeit, formale Sprachen und Komplexitätstheorie

Lösungen zur 1. Klausur. Einführung in Berechenbarkeit, formale Sprachen und Komplexitätstheorie Hochschuldozent Dr. Christian Schindelhauer Paderborn, den 21. 2. 2006 Lösungen zur 1. Klausur in Einführung in Berechenbarkeit, formale Sprachen und Komplexitätstheorie Name :................................

Mehr

Automaten und Formale Sprachen SoSe 2013 in Trier

Automaten und Formale Sprachen SoSe 2013 in Trier Automaten und Formale Sprachen SoSe 2013 in Trier Henning Fernau Universität Trier fernau@uni-trier.de 2. Juni 2013 1 Automaten und Formale Sprachen Gesamtübersicht Organisatorisches Einführung Endliche

Mehr

5.7 Kontextfreie Grammatiken und Kellerautomaten

5.7 Kontextfreie Grammatiken und Kellerautomaten 130 5.7 Kontextfreie Grammatiken und Kellerautomaten Im letzten Abschnitt haben wir gesehen, dass wir reguläre Sprachen auch mit Hilfe von endlichen Automaten charakterisieren können. Jetzt wollen wir

Mehr

Kapitel IV Formale Sprachen und Grammatiken

Kapitel IV Formale Sprachen und Grammatiken Kapitel IV Formale Sprachen und Grammatiken 1. Begriffe und Notationen Sei Σ ein (endliches) Alphabet. Dann Definition 42 1 ist Σ das Monoid über Σ, d.h. die Menge aller endlichen Wörter über Σ; 2 ist

Mehr

2. Gegeben sei folgender nichtdeterministischer endlicher Automat mit ɛ-übergängen:

2. Gegeben sei folgender nichtdeterministischer endlicher Automat mit ɛ-übergängen: Probeklausur Automatentheorie & Formale Sprachen WiSe 2012/13, Wiebke Petersen Name: Matrikelnummer: Aufgabe A: Typ3-Sprachen 1. Konstruieren Sie einen endlichen Automaten, der die Sprache aller Wörter

Mehr

Aufgabe Mögliche Punkte Erreichte Punkte a b c d Σ a b c d Σ x1 13

Aufgabe Mögliche Punkte Erreichte Punkte a b c d Σ a b c d Σ x1 13 Universität Karlsruhe Theoretische Informatik Fakultät für Informatik WS 2003/04 ILKD Prof. Dr. D. Wagner 14. April 2004 2. Klausur zur Vorlesung Informatik III Wintersemester 2003/2004 Hier Aufkleber

Mehr