RNA Strukturvorhersage
|
|
- Karola Bieber
- vor 7 Jahren
- Abrufe
Transkript
1 RNA Strukturvorhersage Christian Pölitz Hauptseminar AFS Institut für Theoretische Informatik Fakultät für Informatik und Automatisierung Technische Universität Ilmenau 17. Juli 2007 Christian Pölitz (TU Ilmenau) RNA Strukturvorhersage 17. Juli / 72
2 RNA Definition Ribonukleinsäure ist eine Nukleinsäure, das heißt eine Kette aus vielen Nukleotiden (Molekülen). Eine wesentliche Funktion der RNA in der Zelle ist die Umsetzung von genetischer Information in Proteine. Christian Pölitz (TU Ilmenau) RNA Strukturvorhersage 17. Juli / 72
3 Aufbau der RNA /1 Hierarchie Primärstruktur : Abfolge von Nukleotiden / String über {a,c,g,u} Sekundärstruktur : Basenpaarung komplementärer Nukleotide des gleichen Stranges Tertiärstruktur : rämliche Struktur Christian Pölitz (TU Ilmenau) RNA Strukturvorhersage 17. Juli / 72
4 Aufbau der RNA /2 Basen Die Primärstruktur der RNA besteht aus einer Folge der Basen Adenin, Cytosin, Guanin und Uracil. Adenin und Uracil, sowie Cytosin und Guanin können über Wasserstoffbrückenbindungen eine chemische Verbindung eingehen. Man spricht von Basenpaarung. Christian Pölitz (TU Ilmenau) RNA Strukturvorhersage 17. Juli / 72
5 Sekundärstruktur /1 Allgemein Ungleich der DNA, die als Doppelhelix vorliegt, besteht die RNA aus einem einzelnen Strang. Basen dieses Stranges können mit anderen Basen desselben Stranges eine Verbingung eingehen. So entsteht die Sekundärstruktur Christian Pölitz (TU Ilmenau) RNA Strukturvorhersage 17. Juli / 72
6 Sekundärstruktur /2 Definition Sei w = r 1 r 2... r n mit r i Σ = {a, c, g, u}, i = 1... n die Primärstruktur. Eine Sekundärstruktur ist Menge von Paaren: SecStruc {(i, j) 1 i j n} mit wenn (i, j), dann ist Base r i mit Base r j gepaart. 1 k {1,..., n} : r k ist höchstens mit einer anderen Base gepaart 2 (i, j) : (r i, r j ) {(a, u), (u, a), (c, g)(g, c)} Watson-Crick-Paare oder (r i, r j ) {(g, u), (u, g)}. Man spricht von gültigen Basenpaaren. 3 (i, j) : j i 4 Christian Pölitz (TU Ilmenau) RNA Strukturvorhersage 17. Juli / 72
7 Sekundädstruktur Christian Pölitz (TU Ilmenau) RNA Strukturvorhersage 17. Juli / 72
8 Sekundärstruktur /3 Substrukturen Stems, es gilt nach (i, j) auch (i + 1, j 1) Hairpin loops, nach (i, j) kommt kein Basenpaar mehr Bulges, nach (i, j) kommt (i + k + 1, j 1), bzw. (i + 1, j k 1). D.h. Auf einer Seite entsteht einen Blase mit k Basen. Interior loop, nach (i, j) folgt (i + k 1 + 1, j k 2 1). D.h. es entsteht eine Blase auf beiden Seiten. Multiple loop Christian Pölitz (TU Ilmenau) RNA Strukturvorhersage 17. Juli / 72
9 Substrukturen Christian Pölitz (TU Ilmenau) RNA Strukturvorhersage 17. Juli / 72
10 Bestimmen der Sekundärstruktur Die Bestimmung von RNA Sekundärstrukturen (sowie Primärstrukturen) mittels chemischer und physikalischer Verfahren ist sehr zeitaufwendig und teuer. Man strebt deswegen Verfahren an, die die Struktur mit hoher Wahrscheinlichkeit Vorhersagen. Christian Pölitz (TU Ilmenau) RNA Strukturvorhersage 17. Juli / 72
11 Welche Verfahren lernen wir kennen? Vorhersage mittels Verfahren zur Energieminimierung und (stochastisch) kontextfreie Grammatiken Christian Pölitz (TU Ilmenau) RNA Strukturvorhersage 17. Juli / 72
12 Algorithmus von Nussinov (1978) Erklärung Basierend auf der Primärstruktur wird eine Struktur mit maximaler Basenpaarung angestrebt, da dies einem energetisch günstigen Zustand entspricht. Substrukturen werden nicht gesondert behandelt. Verfahren /1 Dynamisches Programmieren, d.h. bestimme die optimale Struktur von Teilstrings der Primärstruktur und bestimme danach sukzessive die optimale Struktur längeres Teilstrings bis zum kompletten. Christian Pölitz (TU Ilmenau) RNA Strukturvorhersage 17. Juli / 72
13 Algorithmus von Nussinov (1978) Verfahren /2 Sei S i,j die optimale Sekundärstruktur für den Teilstring r i... r j einer Primärstruktur r = r 1... r n. Weiterhin sei BP(S i,j ) = S i,j, die Anzahl der Basenpaar in der Struktur S i,j. Fülle eine (nxn) Matrix mit BP(S i,j ) als Wert an der Stelle (i, j). Ergebnis BP(S 1,n ) enthält maximale Anzahl an Basenpaarung in der Sekundärstruktur. Von dieser Position aus kann mittels eines Backtracing Verfahrens eine Sekundärstruktur abgeleitet werden. Christian Pölitz (TU Ilmenau) RNA Strukturvorhersage 17. Juli / 72
14 Algorithmus von Nussinov (1978) Algorithmus Input : r = r 1... r n 1 Initialisierung 1 for i=2 to n do BP(S i,i 1 ) = 0 2 for i=1 to n do BP(S i,i ) = 0 2 Rekurrenz 1 for l=1 to n-1 do 1 for i=1 to n-l do j=i+l BP(S i,j ) = max {BP(S i+1,j ), BP(S i,j 1 ), BP(S i+1,j 1 ) + δ(r i, r j ), max i<k<j {BP(S i,k ) + BP(S k+1,j )}} Wobei für (r i, r j ) gültiges Basenpaar gilt: δ(r i, r j )=1, sonst δ(r i, r j ) = 0. Christian Pölitz (TU Ilmenau) RNA Strukturvorhersage 17. Juli / 72
15 Rekurrenzfälle /1 1. BP(S i,j ) = BP(S i+1,j ) Die Anzahl der Basenpaare bleibt. D.h. keine Base geht eine Verbingung ein. Christian Pölitz (TU Ilmenau) RNA Strukturvorhersage 17. Juli / 72
16 Rekurrenzfälle /2 2. BP(S i,j ) = BP(S i,j 1 ) Die Anzahl der Basenpaare bleibt. D.h. keine Base geht eine Verbingung ein. Christian Pölitz (TU Ilmenau) RNA Strukturvorhersage 17. Juli / 72
17 Rekurrenzfälle /3 3. BP(S i,j ) = BP(S i+1,j 1 ) + δ(r i, r j ) Die Basen r i und r j gehen eine Verbindung ein, oder beide nicht. Christian Pölitz (TU Ilmenau) RNA Strukturvorhersage 17. Juli / 72
18 Rekurrenzfälle /4 4. BP(S i,j ) = max i<k<j {BP(S i,k ) + BP(S k+1,j )} Die optimale Sekundärstruktur S i,j ergibt sich aus zwei Teilstrukturen S i,k unds k,j Christian Pölitz (TU Ilmenau) RNA Strukturvorhersage 17. Juli / 72
19 Beispiel Wir betrachten die Sequence S 1,9 = GGGAAAUCC Christian Pölitz (TU Ilmenau) RNA Strukturvorhersage 17. Juli / 72
20 Initialisierung Christian Pölitz (TU Ilmenau) RNA Strukturvorhersage 17. Juli / 72
21 BP(S i,j ) = max{bp(s i+1,j ); BP(S i, j ), BP(S i+1,j i ) + δ, max i<k<j {BP(S i,k ) + BP(S k+1,j )}} Christian Pölitz (TU Ilmenau) RNA Strukturvorhersage 17. Juli / 72
22 BP(S i,j ) = max{bp(s i+1,j ) = 0, BP(S i,j 1 ) = 0, BP(S i+1,j i ) + δ = 1, max i<k<j {BP(S i,k ) + BP(S k+1,j )} = 0} = 0 Christian Pölitz (TU Ilmenau) RNA Strukturvorhersage 17. Juli / 72
23 Möglichkeiten für optimale Sturktur S 5,7 = AAU: 1. AU sind gepaart, dann kann erstes A nur ungepaart eingehen; 2. es kommen keine Paarungen vor und erstes A wird mit U gepaart; 3. es finden keine Paarungen statt; Christian Pölitz (TU Ilmenau) RNA Strukturvorhersage 17. Juli / 72
24 Substruktur S 1,6 = GGGAAA kann sich aus Teilsubstrukturen ergeben: Betrachte: S 1,2 = GG und S 3,6 = GAAA oder S 1,3 = GGG und S 4,6 = AAA oder S 1,4 = GGGA und S 5,6 = AA oder S 1,5 = GGGAA und S 6,6 = A Christian Pölitz (TU Ilmenau) RNA Strukturvorhersage 17. Juli / 72
25 Christian Pölitz (TU Ilmenau) RNA Strukturvorhersage 17. Juli / 72
26 Christian Pölitz (TU Ilmenau) RNA Strukturvorhersage 17. Juli / 72
27 Christian Pölitz (TU Ilmenau) RNA Strukturvorhersage 17. Juli / 72
28 Am Ende steht oben links die Anzahl der Basenpaarungen Christian Pölitz (TU Ilmenau) RNA Strukturvorhersage 17. Juli / 72
29 Traceback Auslesen der Sekundärstruktur Von BP(S 1,n ) sukzessive den Algorithmus rückwärds durchlaufen Christian Pölitz (TU Ilmenau) RNA Strukturvorhersage 17. Juli / 72
30 GGGAAAUCC ((.(..))) Christian Pölitz (TU Ilmenau) RNA Strukturvorhersage 17. Juli / 72
31 Verbesserung Energieminimierung Betrachte jeweils die Energie der Bindungen. Sei f e (r i, r j ) die freie Energie des Basenpaares (r i, r j ). Wenn das Basenpaar gültig ist, dann ist die freie Energie negativ. Wir suchen also die Struktur mit der minimalen Energie. Christian Pölitz (TU Ilmenau) RNA Strukturvorhersage 17. Juli / 72
32 Nussinov Algorithmus Rekurrenz E(S i,j ) = min {E(S i+1,j ), E(S i,j 1 ), E(S i+1,j 1 ) + f e (r i, r j ), min i<k<j {E(S i,k ) + E(S k+1,j )}} Christian Pölitz (TU Ilmenau) RNA Strukturvorhersage 17. Juli / 72
33 Nussinov Algorithmus Laufzeit Der Algorithmus hat eine Laufzeit von O(n 3 ) Beweis 1. Initialisierung läuft in O(n) 2. Rekurrenz beinhaltet zweifach verschachtelte Schleife. In innere Schleife benönigt das Finden des Maximums der Teilstrukturen O(n). Somit ergibt sich eine Laufzeit von O(n 3 ). Christian Pölitz (TU Ilmenau) RNA Strukturvorhersage 17. Juli / 72
34 Nussinov Algorithmus Nachteile Der Algorithmus berücksichtig nicht den Einfluss von Substrukuren auf die Sekundärstruktur. So haben Stems stabilisierenden Einfluss, Loops jedoch haben destabilisierenden Einfluss. Christian Pölitz (TU Ilmenau) RNA Strukturvorhersage 17. Juli / 72
35 Algorithmus von Zuker (1981) Verfahren Erweiterung des Nussinov Algorithmus. Berücksichtigt die freie Energie der Substrukturen, die durch eine Basenpaarung (r i, r j ) induziert werden. Wir führen zusätzlich ein: L i,j, die Substruktur mit minimaler freien Energie, die aus einer Basenpaarung (r i, r j ) resultiert. Christian Pölitz (TU Ilmenau) RNA Strukturvorhersage 17. Juli / 72
36 Algorithmus von Zuker (1981) Algorithmus Analog zu Nussinov in der Energieminimierungsvariante. Nur in der Rekurrenz verschieden: E(S i,j ) = min {E(S i+1,j ), E(S i,j 1 ), E(L i,j ), min i<k<j {E(S i,k ) + E(S k+1,j )}} Laufzeit, ohne Beweis Der Algorithmus hat Laufzeit von O(n 4 ) Christian Pölitz (TU Ilmenau) RNA Strukturvorhersage 17. Juli / 72
37 Überlegung /1 Die Primärstruktur als Sequence aus Basen kann auch als Wort über dem Alphabet Σ = {a, c, g, u} betrachtet werden. Christian Pölitz (TU Ilmenau) RNA Strukturvorhersage 17. Juli / 72
38 Überlegung /2 Weiterhin kann man diese Sequencen als biologische Palindrome auffassen. Bei solchen sind die Zeichen auf beiden Seiten der Sequence nicht gleich sondern komplementär. Es ist auch keine korrektes Palindrom, da es auch Stellen geben kann bei denen das nicht zutrifft (ungepaarten Basen). Außdem ist eine Sequence nicht unbedingt eine komplettes (bio.) Palindorm, sondern kann aus mehreren bestehen. Christian Pölitz (TU Ilmenau) RNA Strukturvorhersage 17. Juli / 72
39 Beispiel Beispielsequence: a u a a g g g c g g a u Als Klammerausdruck: ( (.. (.. ).. ) ) Christian Pölitz (TU Ilmenau) RNA Strukturvorhersage 17. Juli / 72
40 Palindrome und Klammerausdrücke Solche Sprachen können mit kontextfreien Grammatiken beschrieben werden. Christian Pölitz (TU Ilmenau) RNA Strukturvorhersage 17. Juli / 72
41 Kontextfreie Grammatiken Definition Ein Tupel G = (V, Σ, S, P) mit: V - Nichtterminale Σ - Terminale S - Startsysmbol, S V P - Menge von Produktionen Christian Pölitz (TU Ilmenau) RNA Strukturvorhersage 17. Juli / 72
42 Kontextfreie Grammatiken /2 Produktionen Formal : P V x (V Σ) Wir schreiben u v für : (u, v) P. Ableitungsschritt u G v, mit u = w 1 Aw 2, (A v ) P, dann v = w 1 v w 2 Christian Pölitz (TU Ilmenau) RNA Strukturvorhersage 17. Juli / 72
43 Kontextfreie Grammatiken /3 Ableitung w 0 G w 1 G w 2 G... G w n Weiterhin ist G die reflexive und transitive Hülle von G. Wörter und Sprachen w Σ wird von G erzeugt, wenn gilt: S G w L(G) = {w Σ S G w} ist die von G erzeugte Sprache. Christian Pölitz (TU Ilmenau) RNA Strukturvorhersage 17. Juli / 72
44 Kontextfreie Grammatiken /4 Ableitungsbaum Darstellung einer Ableitung einer kfg als gerichteter Wurzelbaum, dessen Knoten mit je einem Buchstaben aus V Σ oder ɛ beschriftet sind, wobei gilt: Die Wurzel ist mit S beschriftet Die Blätter sind mit a Σ oder ɛ beschriftet Jeder innere Knoten v ist mit A V beschriftet und es gilt die Nachfolgerknoten v 1, v 2,..., v r von v sind mit X 1, X 2,..., X r V Σ beschriftet und A X 1 X 2... X r ist eine Produktion von P. Christian Pölitz (TU Ilmenau) RNA Strukturvorhersage 17. Juli / 72
45 Kontextfreie Grammatiken /5 Chomsky Normalform Eine kfg G = (V, Σ, S, P) ist in Chomsky Normalform, wenn entweder alle Produktionen diese Form haben: A BC (A, B, C V ) oder A a (A V, a Σ) oder alle Produktionen die Form haben: A BC oder A a oder S ɛ und S nie auf der rechten Seite einer Produktion auftaucht. Christian Pölitz (TU Ilmenau) RNA Strukturvorhersage 17. Juli / 72
46 Beispiel Kontextfreie Grammatik für RNA: G = ({S}, {a, c, g, u}, S, P} mit P = { S SS S Sa Sc Sg Su S as cs gs us S asu usa csg gsc S a c g u } S gsc ggscc gggscc gggasucc gggaasucc gggaaaucc Christian Pölitz (TU Ilmenau) RNA Strukturvorhersage 17. Juli / 72
47 Zusammenhang Sekundärstruktur und Ableitungsbaum Vom Ableitungsbaum kann eine Sekundärstruktur ablesen werden! Dabei enstpricht S gsa asu einer Basenpaarung g-u, bzw a-u S gs as a ungepaarte Basen und S SS Teilstrukturen (im Beispiel nicht enthalten) Christian Pölitz (TU Ilmenau) RNA Strukturvorhersage 17. Juli / 72
48 Frage Welcher Ableitungsbaum entpricht der optimalen Sekundärstruktur? Bzw. welcher Ableitungsbaum hat die höchste Wahrscheinlichkeit die optimale Sekundärstruktur zu sein? Christian Pölitz (TU Ilmenau) RNA Strukturvorhersage 17. Juli / 72
49 stochstisch kontextfreie Grammatiken Definition Eine PCFG (probabilistic context free grammar) ist ein Tupel G = (V, Σ, S, P, p G ), wobei V, Σ, S und P wie bei kontextfreien Grammatiken definiert sind. Zusätzlich ist noch eine Wahrscheinlichkeitsfunktion p G : P [0, 1] R, die jeder Produktion eine Wahrscheinlichkeit zuordnet, gegeben. Christian Pölitz (TU Ilmenau) RNA Strukturvorhersage 17. Juli / 72
50 stochstisch kontextfreie Grammatiken /2 Wahrscheinlichkeiten p G (α β) ist allgemein Wahrscheinlichkeit einer Produktion. Es gilt: A V : Σ x:(a x) P p G (A x) = 1. p G (α) = Π n i=1 p G (p i ) ist die Wahrscheinlichkeit einer Ableitung α P mit p i Wahrscheinlichkeiten der Produktionen, die in der Ableitung auftauchen. p G (w) = Σ α A(w) p G (α), mit A(w) = {α w wird in G mittels Ableitung α erzeugt}, ist die Wahrscheinlichkeit, dass w Σ von G erzeugt wird. Christian Pölitz (TU Ilmenau) RNA Strukturvorhersage 17. Juli / 72
51 Wahrscheinlichkeiten Inside - Wahrscheinlichkeit Gegeben sei eine Sequenz w = w 1 w 2... w n α(i, j, v) = p G (w i... w j N v w i... w j ) ist die Wahrscheinlichkeit aller Ableitungsbäume mit Wurzel v für den Infix w i... w j Christian Pölitz (TU Ilmenau) RNA Strukturvorhersage 17. Juli / 72
52 Inside - Wahrscheinlichkeit Berechnung α(i, j, v) = Σ x,y:av A x A y Σ j 1 k=i α(i, k, x)α(k + 1, j, y)p G (A v A x A y ) Christian Pölitz (TU Ilmenau) RNA Strukturvorhersage 17. Juli / 72
53 Inside - Wahrscheinlichkeit Algorithmus Gegeben : w = w 1 w 2... w n Initialisierung: α(i, i, v) = P(A v w i ) Rekurrenz: α(i, j, v) = Σ x,y:av A x A y Σ j 1 k=i α(i, k, x)α(k + 1, j, y)p G (A v A x A y ) Ausgabe: p G (w) = p G (A 1 G w) = α(1, n, 1). Christian Pölitz (TU Ilmenau) RNA Strukturvorhersage 17. Juli / 72
54 Beispiel: S NP VP 1,0 PP P NP 1,0 VP V NP 0,7 VP VP PP 0,3 P with 1,0 V saw 1,0 NP NP PP 0,4 NP astronomers 0,1 NP ears 0,18 NP saw 0,4 NP stars 0,18 NP telescopes 0,1 Christian Pölitz (TU Ilmenau) RNA Strukturvorhersage 17. Juli / 72
55 Christian Pölitz (TU Ilmenau) RNA Strukturvorhersage 17. Juli / 72
56 Berechnung für die mit Stern hervorgehobenden Wahrscheinlichkeiten VP 0,7 V NP 1,0 saw NP 0,18 saw stars PP 1,0 P NP 1,0 with NP 0,18 with stars S 1,0 NP VP 0,1 astronomers VP 0,7 astronomers V NP 1,0 astronomers saw NP 0,18 astronomers saw stars NP 0,4 NP PP 0,18 stars PP 1,0 stars P NP 1,0 stars with NP 0,18 stars with ears Christian Pölitz (TU Ilmenau) RNA Strukturvorhersage 17. Juli / 72
57 Der stochastische Cocke-Younger-Kasami-Algorithmus Definition Die stochastische Version des CYK Algorithmus berechnet die Wahrscheinlichkeit des wahrscheinlichsten Ableitungsbaumes für eine gegebene Sequence w = w 1... w n. Er stellt eine abgeänderte Version des Inside Algorithmus dar. Christian Pölitz (TU Ilmenau) RNA Strukturvorhersage 17. Juli / 72
58 Der stochastische Cocke-Younger-Kasami-Algorithmus Algorithmus Gegeben : w = w 1 w 2... w n Initialisierung: γ(i, i, v) = P(A v w i ) Rekurrenz: γ(i, j, v) = max Av A x A y max k=i..j 1 γ(i, k, x)γ(k + 1, j, y)p G (A v A x A y ) Ausgabe: p G (w) = p G (A 1 G w) = γ(1, n, 1). Christian Pölitz (TU Ilmenau) RNA Strukturvorhersage 17. Juli / 72
59 Beispiel analog zum Inside-Algorithmus: S NP VP 1,0 PP P NP 1,0 VP V NP 0,7 VP VP PP 0,3 P with 1,0 V saw 1,0 NP NP PP 0,4 NP astronomers 0,1 NP ears 0,18 NP saw 0,4 NP stars 0,18 NP telescopes 0,1 Christian Pölitz (TU Ilmenau) RNA Strukturvorhersage 17. Juli / 72
60 Christian Pölitz (TU Ilmenau) RNA Strukturvorhersage 17. Juli / 72
61 Wahrscheinlichste Ableitung S 1,0 NP VP 0,7 NP V NP 0,4 NP V NP PP 1,0 NP V NP P NP 0,1 astronomers V NP P NP 1,0 astronomers saw NP P NP 0,18 astronomers saw stars P NP 1,0 astronomers saw stars with NP 0,18 astronomers saw stars with ears. Christian Pölitz (TU Ilmenau) RNA Strukturvorhersage 17. Juli / 72
62 Weitere Betrachtungen Bis jetzt können wir nur Wahrscheinlichkeiten von Wörtern über Σ ausrechnen. Ein weitere Aufgabe im Zusammenhang mit stochatisch kontextfreien Grammatiken ist die Bestimmung der Parameter. Bezüglich der Struktur können wir die Grammatik in Chomsky Normalform annehmen. Wir benötigen jedoch noch ein Verfahren, um die Wahrscheinlichkeiten der Produktionen zu bestimmen. Christian Pölitz (TU Ilmenau) RNA Strukturvorhersage 17. Juli / 72
63 Möglichkeiten experimentell mittels chemischer und physikalischer Untersuchungen mittels Schätzungen über die erwartete Anzahl wie oft Produktionen verwendet werden Christian Pölitz (TU Ilmenau) RNA Strukturvorhersage 17. Juli / 72
64 Wahrscheinlichkeiten Outside - Wahrscheinlichkeit Gegeben sei eine Sequenz w = w 1 w 2... w n β(i, j, v) = p G (w 1... w i 1 N v w j+1... w n A 1 G w) ist die Wahrscheinlichkeit aller Ableitungsbäume mit Wurzel A 1 für w, ausschließlich der Wahrscheinlichkeit aller Ableitungsbäume für den Infix w i... w j Christian Pölitz (TU Ilmenau) RNA Strukturvorhersage 17. Juli / 72
65 Outside - Wahrscheinlichkeit Berechnung /1 β(i, j, v) = Σ f,g:af A v A g Σ i 1 k=1 α(k, i 1, g)β(k, j, f )p G (A f A v A g ) + Σ f,g:af A g A v Σ n k=j+1 α(j + 1, k, g)β(i, k, f )p G (A f A g A v ) Christian Pölitz (TU Ilmenau) RNA Strukturvorhersage 17. Juli / 72
66 Outside - Wahrscheinlichkeit Berechnung /2 β(i, j, v) = Σ f,g:af A v A g Σ i 1 k=1 α(k, i 1, g)β(k, j, f )p G (A f A v A g ) + Σ f,g:af A g A v Σ n k=j+1 α(j + 1, k, g)β(i, k, f )p G (A f A g A v ) Christian Pölitz (TU Ilmenau) RNA Strukturvorhersage 17. Juli / 72
67 Outside - Wahrscheinlichkeit Verwendung p G (w = w 1... w m ) = Σ m v=1 β(i, i, v)p G (N v w i ) für 1 i n oder p G (N 1 G w) = Σm v=1α(i, j, v)β(i, j, v) für 1 i j n Christian Pölitz (TU Ilmenau) RNA Strukturvorhersage 17. Juli / 72
68 Inside - Outside Erwartungswerte c(n v ) erwartete Anzahl wie oft der Nichtterminal N v beim Erzeugen von w verwendet wurde c(n v a) erwartete Anzahl wie oft die Produktion N v a beim Erzeugen von w verwendet wurde c(n v N x N y ) erwartete Anzahl wie oft die Produktion N v N x N y beim Erzeugen von w verwendet wurde Christian Pölitz (TU Ilmenau) RNA Strukturvorhersage 17. Juli / 72
69 Erwartungswerte Berechnung Gegeben sei die Sequence w = w 1... w n 1 c(n v ) = p G (N 1 G w)σn i=1 Σn j=1α(i, j, v)β(i, j, v) c(n v a) = 1 p G (N 1 G w)σn i=1 β(i, i, v)p g (N v w i ) c(n v N x N y ) auf analoge Weise Christian Pölitz (TU Ilmenau) RNA Strukturvorhersage 17. Juli / 72
70 Inside - Outside Updateschritt und Normalisierung p G (N v a) = p G (N v N x N y ) = c(nv a) c(n v ) c(nv a) c(n v ) Christian Pölitz (TU Ilmenau) RNA Strukturvorhersage 17. Juli / 72
71 Fazit Die Vorhersage einer optimalen RNA Sekundärstruktur ist mit einer hohen Wahrscheinlichkeit möglich. Die vorgestellten Verfahren sind alle nicht perfekt, aber dennoch gut genug, um praxisrelevant zu sein. Christian Pölitz (TU Ilmenau) RNA Strukturvorhersage 17. Juli / 72
72 Vielen Dank für die Aufmerksamkeit Christian Pölitz (TU Ilmenau) RNA Strukturvorhersage 17. Juli / 72
Theoretische Grundlagen der Informatik. Vorlesung am 8. Januar INSTITUT FÜR THEORETISCHE INFORMATIK
Theoretische Grundlagen der Informatik 0 08.01.2019 Torsten Ueckerdt - Theoretische Grundlagen der Informatik KIT Die Forschungsuniversität in der Helmholtz-Gemeinschaft www.kit.edu Letzte Vorlesung Eine
MehrTheoretische Grundlagen der Informatik
Theoretische Grundlagen der Informatik Vorlesung am 15.01.2015 INSTITUT FÜR THEORETISCHE 0 KIT 15.01.2015 Universität des Dorothea Landes Baden-Württemberg Wagner - Theoretische und Grundlagen der Informatik
MehrRNA folding. W1-High-throughput Genomics, FU Berlin OWL RNA Bioinformatics, MPI Molgen Berlin
RNA folding W-High-throughput Genomics, FU Berlin OWL RNA Bioinformatics, MPI Molgen Berlin 3..6 Lernziele Einführung von RNA-Molekülen Konzept der RNA-Sekundärstruktur Lernen wie eine RNA-Sekundärstruktur
Mehra b b a a b b a Dank Grundlagen der Theoretischen Informatik / Einführung in die Theoretische Informatik I Chart-Parsing Chart-Parsing Vorlesung
Dank Vorlesung Grundlagen der Theoretischen Informatik / Einführung in die Theoretische Informatik I Bernhard Beckert Diese Vorlesungsmaterialien basieren ganz wesentlich auf den Folien zu den Vorlesungen
MehrKlammersprache Definiere
Klammersprache w=w 1...w n {(,)}* heißt korrekt geklammert, falls die Anzahl ( ist gleich der Anzahl ). in jedem Anfangsstück w 1,...,w i (i n) ist die Anzahl ( nicht kleiner als die Anzahl ). Definiere
MehrGrundlagen der Theoretischen Informatik / Einführung in die Theoretische Informatik I
Vorlesung Grundlagen der Theoretischen Informatik / Einführung in die Theoretische Informatik I Bernhard Beckert Institut für Informatik ommersemester 2007 B. Beckert Grundlagen d. Theoretischen Informatik:
MehrGrundlagen der Theoretischen Informatik / Einführung in die Theoretische Informatik I
Vorlesung Grundlagen der Theoretischen Informatik / Einführung in die Theoretische Informatik I Bernhard Beckert Institut für Informatik ommersemester 2007 B. Beckert Grundlagen d. Theoretischen Informatik:
MehrTheoretische Grundlagen der Informatik
Theoretische Grundlagen der Informatik Vorlesung am 13.01.2011 INSTITUT FÜR THEORETISCHE INFORMATIK 0 KIT Universität des Landes Baden-Württemberg und nationales Forschungszentrum in der Helmholtz-Gemeinschaft
MehrThema 12: RNA Structure Prediction
Thema 12: RNA Structure Prediction Vortrag gehalten von Tobias Sander am 01.02.2010 1 Einleitung 1.1 Vorwort Seit der Strukturaufklärung der DNA im Jahre 1953 durch Watson und Crick sind fast 60 Jahre
MehrKontextfreie Sprachen. Automaten und Formale Sprachen alias Theoretische Informatik. Sommersemester Kontextfreie Sprachen
Automaten und Formale Sprachen alias Theoretische Informatik Sommersemester 2012 Dr. Sander Bruggink Übungsleitung: Jan Stückrath Wortproblem: der CYK-Algorithmus Pumping Lemma für kontextfreie Sprachen
MehrInformatik III. Christian Schindelhauer Wintersemester 2006/07 8. Vorlesung
Informatik III Christian Schindelhauer Wintersemester 2006/07 8. Vorlesung 17.11.2006 schindel@informatik.uni-freiburg.de 1 Prinzip des Kellerautomats Push-Down-Automaton (PDA) Ein Kellerautomat vereinigt
MehrVorhersage der RNA-Sekundärstruktur
Vorhersage der RNA-Sekundärstruktur Andreas Spillner Bioinformatik, SS 2018 Primärstruktur vs. Sekundärstruktur Primärstruktur Sequenz der Buchstaben (bei RNA entspricht ein Buchstabe jeweils einer Nukleinsäure
Mehrkontextfreie Grammatiken Theoretische Informatik kontextfreie Grammatiken kontextfreie Grammatiken Rainer Schrader 14. Juli 2009 Gliederung
Theoretische Informatik Rainer Schrader Zentrum für Angewandte Informatik Köln 14. Juli 2009 1 / 40 2 / 40 Beispiele: Aus den bisher gemachten Überlegungen ergibt sich: aus der Chomsky-Hierarchie bleiben
MehrGrammatiken. Eine Grammatik G mit Alphabet Σ besteht aus: Variablen V. Startsymbol S V. Kurzschreibweise G = (V, Σ, P, S)
Grammatiken Eine Grammatik G mit Alphabet Σ besteht aus: Variablen V Startsymbol S V Produktionen P ( (V Σ) \ Σ ) (V Σ) Kurzschreibweise G = (V, Σ, P, S) Schreibweise für Produktion (α, β) P: α β 67 /
MehrAutomatentheorie und formale Sprachen
Automatentheorie und formale Sprachen VL 8 Chomsky-Grammatiken Kathrin Hoffmann 23. Mai 2012 Hoffmann (HAW Hamburg) Automatentheorie und formale Sprachen 23.5. 2012 250 Wortproblem Wortproblem ist das
MehrÜbersicht. 3 3 Kontextfreie Sprachen
Formale Systeme, Automaten, Prozesse Übersicht 3 3.1 Kontextfreie Sprachen und Grammatiken 3.2 Ableitungsbäume 3.3 Die pre -Operation 3.4 Entscheidungsprobleme für CFGs 3.5 Normalformen für CFGs 3.6 Chomsky-Normalform
MehrInformatik III. Christian Schindelhauer Wintersemester 2006/07 5. Vorlesung
Informatik III Christian Schindelhauer Wintersemester 2006/07 5. Vorlesung 09.11.2006 schindel@informatik.uni-freiburg.de 1 Äquivalenzklassen Definition und Beispiel Definition Für eine Sprache L Σ* bezeichnen
MehrKontextfreie Sprachen Kontextfreie Sprachen und Grammatiken. Satzformen sind die Wörter aus (N T ). Notation: Wir verwenden oft
und Grammatiken (Folie 119, eite 202 im kript) atzformen sind die Wörter aus (N T ). Notation: Wir verwenden oft a, b, c,... für Terminalsymbole A, B, C,... für Nonterminale u, v, w,... für Terminalwörter
MehrInformatik III. Christian Schindelhauer Wintersemester 2006/07 6. Vorlesung
Informatik III Christian Schindelhauer Wintersemester 2006/07 6. Vorlesung 10.11.2006 schindel@informatik.uni-freiburg.de 1 Kapitel IV Kontextfreie Sprachen Kontextfreie Grammatik Informatik III 6. Vorlesung
MehrTheoretische Grundlagen der Informatik. Vorlesung am 17. Januar INSTITUT FÜR THEORETISCHE INFORMATIK
Theoretische Grundlagen der Informatik 0 17.01.2019 Torsten Ueckerdt - Theoretische Grundlagen der Informatik KIT Die Forschungsuniversität in der Helmholtz-Gemeinschaft www.kit.edu Evaluation Ergebnisse
MehrProbabilistische kontextfreie Grammatiken
Mathematische Grundlagen III Probabilistische kontextfreie Grammatiken 14 Juni 2011 1/26 Ambiguität beim Parsing Wörter können verschiedene Bedeutungen haben und mehr als einer Wortkategorien angehören
MehrGrammatiken. Grammatiken sind regelbasierte Kalküle zur Konstruktion von Systemen und Sprachen Überprüfung von Systemen und Sprachen
Grammatiken Grammatiken sind regelbasierte Kalküle zur Konstruktion von Systemen und Sprachen Überprüfung von Systemen und Sprachen Grammatiken eignen sich besonders zur Modellierung beliebig tief geschachtelter,
MehrEinführung in Berechenbarkeit, Formale Sprachen und Komplexitätstheorie
Einführung in Berechenbarkeit, Formale Sprachen und Komplexitätstheorie Wintersemester 2005/2006 07.11.2005 5. Vorlesung 1 Überblick: Kontextfreie Sprachen Formale Grammatik Einführung, Beispiele Formale
MehrAnwendungen dynamischer Programmierung in der Biologie
Anwendungen dynamischer Programmierung in der Biologie Überblick Algorithmus zum Finden der wahrscheinlichsten Sekundärstruktur eines RNS Moleküls Sequence Alignment Verbesserung von Sequence Alignment
MehrKontextfreie Sprachen werden von PDAs akzeptiert
Kontextfreie Sprachen werden von PDAs akzeptiert Sei G = (Σ, V, S, P) eine kontextfreie Grammatik. Dann gibt es einen PDA A mit L(A) = L(G). Der PDA A arbeitet mit nur einem Zustand q 0, besitzt das Kelleralphabet
MehrTheoretische Grundlagen der Informatik
Theoretische Grundlagen der Informatik Vorlesung am 17. Januar 2012 INSTITUT FÜR THEORETISCHE 0 KIT 18.01.2012 Universität des Dorothea Landes Baden-Württemberg Wagner - Theoretische und Grundlagen der
MehrProbabilistic Context Free Grammars, Part II
Probabilistic Context Free Grammars, Part II Prof Dr. Matthew Crocker Universität des Saarlandes 16. Juli 2015 Matthew Crocker (UdS) PCFG II 16. Juli 2015 1 / 25 Themen heute: 1 Wiederholung: PCFG 2 Formeln
MehrTheoretische Grundlagen der Informatik
Theoretische Grundlagen der Informatik Übung am 4.2.2011 INSTITUT FÜR THEORETISCHE INFORMATIK 0 KIT Universität des Landes Baden-Württemberg und nationales Forschungszentrum in der Helmholtz-Gemeinschaft
MehrDefinition 4 (Operationen auf Sprachen) Beispiel 5. Seien A, B Σ zwei (formale) Sprachen. Konkatenation: AB = {uv ; u A, v B} A + = n 1 An
Definition 4 (Operationen auf Sprachen) Seien A, B Σ zwei (formale) Sprachen. Konkatenation: AB = {uv ; u A, v B} A 0 = {ɛ}, A n+1 = AA n A = n 0 An A + = n 1 An Beispiel 5 {ab, b}{a, bb} = {aba, abbb,
MehrGrammatik der Genome
Grammatik der Genome Andreas de Vries Fachhochschule Südwestfalen, Campus Hagen SS 2011 1 / 14 Inhalt 1 Formale Sprachen 2 Genomgrammatik 2 / 14 Formale Sprachen Übersicht 1 Formale Sprachen 2 Genomgrammatik
MehrRNA Faltung - II. W1-High-throughput Genomics, FU Berlin OWL RNA Bioinformatics, MPI Molgen Berlin
RNA Faltung - II W1-High-throughput Genomics, FU Berlin OWL RNA Bioinformatics, MPI Molgen Berlin 05.12.16 Nussinov Nachteilen Die Maximierung der Anzahl von Bp führt unter Umständen nicht zu biologisch
MehrKapitel 2: Formale Sprachen Gliederung
Gliederung 0. Motivation und Einordnung 1. Endliche Automaten 2. Formale Sprachen 3. Berechnungstheorie 4. Komplexitätstheorie 2.1. Chomsky-Grammatiken 2.2. Reguläre Sprachen 2.3. 2/5, Folie 1 2017 Prof.
MehrÜbungsblatt 7. Vorlesung Theoretische Grundlagen der Informatik im WS 16/17
Institut für Theoretische Informatik Lehrstuhl Prof. Dr. D. Wagner Übungsblatt 7 Vorlesung Theoretische Grundlagen der Informatik im W 16/17 Ausgabe 17. Januar 2017 Abgabe 31. Januar 2017, 11:00 Uhr (im
MehrEinführung in die Computerlinguistik Chart-Parsing
Einführung in die Computerlinguistik Chart-Parsing Dozentin: Wiebke sen 21.12.2009 Wiebke sen Einführung CL (Wie 09/10) 1 P = calls calls Wiebke sen Einführung CL (Wie 09/10) 2 P = calls calls Wiebke sen
MehrVorlesung im Sommersemester Informatik IV. Probeklausurtermin: 21. Juni 2016
Heinrich-Heine-Universität Düsseldorf Institut für Informatik Prof. Dr. J. Rothe Universitätsstr. 1, D-40225 Düsseldorf Gebäude: 25.12, Ebene: O2, Raum: 26 Tel.: +49 211 8112188, Fax: +49 211 8111667 E-Mail:
Mehr2. Klausur zur Vorlesung Theoretische Grundlagen der Informatik Wintersemester 2017/2018
2. Klausur zur Vorlesung Theoretische Grundlagen der Informatik Wintersemester 2017/2018 Hier Aufkleber mit Name und Matrikelnummer anbringen Vorname: Nachname: Matrikelnummer: Beachten Sie: Bringen Sie
Mehr2. Klausur zur Vorlesung Theoretische Grundlagen der Informatik Wintersemester 2014/2015
2. Klausur zur Vorlesung Theoretische Grundlagen der Informatik Wintersemester 2014/2015 Hier Aufkleber mit Name und Matrikelnummer anbringen Vorname: Nachname: Matrikelnummer: Beachten Sie: Bringen Sie
MehrGrundlagen der Theoretischen Informatik
Grundlagen der Theoretischen Informatik 4. Kellerautomaten und kontextfreie prachen (VI) 25.06.2015 Viorica ofronie-tokkermans e-mail: sofronie@uni-koblenz.de 1 Übersicht 1. Motivation 2. Terminologie
MehrInformatik III - WS07/08
Informatik III - WS07/08 Kapitel 5 1 Informatik III - WS07/08 Prof. Dr. Dorothea Wagner dwagner@ira.uka.de Kapitel 5 : Grammatiken und die Chomsky-Hierarchie Informatik III - WS07/08 Kapitel 5 2 Definition
MehrI.5. Kontextfreie Sprachen
I.5. Kontextfreie prachen Zieht man in Betracht, dass BNF-yteme gerade so beschaffen sind, dass auf der linken eite immer genau ein Nichtterminal steht, so sind das also gerade die Ableitungsregeln einer
MehrFOLDALIGN und sein Algorithmus. Nadine Boley Silke Szymczak
FOLDALIGN und sein Algorithmus Nadine Boley Silke Szymczak Gliederung 2 Einleitung Motivation des Ansatzes zu FOLDALIGN Sankoff-Algorithmus Globales Alignment Zuker-Algorithmus Kombination FOLDALIGN Algorithmus,
MehrBeschreibungskomplexität von Grammatiken Definitionen
Beschreibungskomplexität von Grammatiken Definitionen Für eine Grammatik G = (N, T, P, S) führen wir die folgenden drei Komplexitätsmaße ein: Var(G) = #(N), Prod(G) = #(P ), Symb(G) = ( α + β + 1). α β
MehrKontextfreie (Typ-2) Sprachen
Kontextfreie (Typ-2) prachen Bsp.: L 1 = { n 1 n n>} с {,1}* 1 1 L 2 = {w wє{,1}* und w=w rev } с {,1}* 11 1 ε L 3 = {w w hat genausoviele Nullen wie Einsen} с {,1}* B 1 ε 1 B 1 1 BB 1 11 11 11 11B 111
MehrVorlesung Theoretische Informatik (Info III)
1 Vorlesung Theoretische Informatik (Info III) Prof. Dr. Dorothea Wagner Dipl.-Math. Martin Holzer 22. Januar 2008 Einleitung Motivation 2 Thema heute Kontextfreie Grammatiken: Lemma von Ogden Eigenschaften
MehrGrundlagen Theoretischer Informatik 2 WiSe 2011/12 in Trier. Henning Fernau Universität Trier
Grundlagen Theoretischer Informatik 2 WiSe 2011/12 in Trier Henning Fernau Universität Trier fernau@uni-trier.de 1 Grundlagen Theoretischer Informatik 2 Gesamtübersicht Organisatorisches; Einführung Ersetzungsverfahren:
MehrEin Satz der deutschen Sprache besitzt ein Subjekt, ein Prädikat und ein Objekt (SPO).
1 Grammatiken Autor: Tilman Blumenbach Letzte Änderung: 28. Juni 2012 18:15 Ziel von Grammatiken Wollen die Struktur von Sprachen modellieren und charakterisieren. Beispiel Ein Satz der deutschen Sprache
Mehr2. Gegeben sei folgender nichtdeterministischer endlicher Automat mit ɛ-übergängen:
Probeklausur Automatentheorie & Formale Sprachen WiSe 2012/13, Wiebke Petersen Name: Matrikelnummer: Aufgabe A: Typ3-Sprachen 1. Konstruieren Sie einen endlichen Automaten, der die Sprache aller Wörter
MehrÜbungsblatt 7. Vorlesung Theoretische Grundlagen der Informatik im WS 16/17
Institut für Theoretische Informatik Lehrstuhl Prof. Dr. D. Wagner Übungsblatt 7 Vorlesung Theoretische Grundlagen der Informatik im W 16/17 Ausgabe 17. Januar 2017 Abgabe 31. Januar 2017, 11:00 Uhr (im
MehrTheoretische Informatik I
Theoretische nformatik inheit 3 Kontextfreie Sprachen 1. Kontextfreie Grammatiken 2. Pushdown Automaten 3. igenschaften kontextfreier Sprachen Verarbeitung von Programmiersprachen Was ist das einfachste
MehrMusterlösung Informatik-III-Nachklausur
Musterlösung Informatik-III-Nachklausur Aufgabe 1 (2+2+4+4 Punkte) (a) L = (0 1) 0(0 1) 11(0 1) 0(0 1) (b) Der Automat ist durch folgendes Übergangsdiagramm gegeben: 0, 1 0, 1 0, 1 0, 1 0 s q 1 1 0 0 q
MehrEinführung in die Computerlinguistik
Einführung in die Computerlinguistik Kontextfreie Sprachen und Pushdown-Automaten Dozentin: Wiebke Petersen WS 2004/2005 Wiebke Petersen Formale Komplexität natürlicher Sprachen WS 03/04 Wiederholung c
MehrInformatik 3 Theoretische Informatik WS 2016/17
Zwischenklausur 2 20. Januar 2017 Informatik 3 Theoretische Informatik WS 2016/17 Prof. Dr. Peter Thiemann Albert-Ludwigs-Universität Freiburg Institut für Informatik Name: Übungsgruppe: Schreiben Sie
MehrKapitel: Die Chomsky Hierarchie. Die Chomsky Hierarchie 1 / 14
Kapitel: Die Chomsky Hierarchie Die Chomsky Hierarchie 1 / 14 Allgemeine Grammatiken Definition Eine Grammatik G = (Σ, V, S, P) besteht aus: einem endlichen Alphabet Σ, einer endlichen Menge V von Variablen
MehrEarley Parser. Flutura Mestani
Earley Parser Flutura Mestani Informatik Seminar Algorithmen zu kontextfreien Grammatiken Wintersemester 2015/2016 Prof. Martin Hofmann, Dr. Hans Leiß Flutura Mestani 25.11.2015 Seminar Algorithmen zu
MehrGrundlagen der Theoretischen Informatik / Einführung in die Theoretische Informatik I
Vorlesung Grundlagen der Theoretischen Informatik / Einführung in die Theoretische Informatik I Bernhard Beckert Institut für Informatik Sommersemester 2007 B. Beckert Grundlagen d. Theoretischen Informatik:
MehrUmformung NTM DTM. Charakterisierung rek. aufz. Spr. Chomsky-3-Grammatiken (T5.3) Chomsky-0-Grammatik Rek. Aufz.
Chomsky-0-Grammatik Rek. Aufz. Satz T5.2.2: Wenn L durch eine Chomsky-0- Grammatik G beschrieben wird, gibt es eine NTM M, die L akzeptiert. Beweis: Algo von M: Schreibe S auf freie Spur. Iteriere: Führe
MehrTheoretische Grundlagen der Informatik
Theoretische Grundlagen der Informatik Vorlesung am 18. Januar 2018 INSTITUT FÜR THEORETISCHE 0 18.01.2018 Dorothea Wagner - Theoretische Grundlagen der Informatik INSTITUT FÜR THEORETISCHE KIT Die Forschungsuniversität
MehrChomsky-Grammatiken 16. Chomsky-Grammatiken
Chomsky-Grammatiken 16 Chomsky-Grammatiken Ursprünglich von Chomsky in den 1950er Jahren eingeführt zur Beschreibung natürlicher Sprachen. Enge Verwandschaft zu Automaten Grundlage wichtiger Softwarekomponenten
MehrDas Postsche Korrespondenzproblem
Das Postsche Korrespondenzproblem Eine Instanz des PKP ist eine Liste von Paaren aus Σ Σ : (v 1, w 1 ),..., (v n, w n ) Eine Lösung ist eine Folge i 1,..., i k von Indizes 1 i j n mit v i1... v ik = w
MehrTutoraufgabe 1 (ɛ-produktionen):
Prof aa Dr J Giesl Formale Systeme, Automaten, Prozesse SS 2010 M Brockschmidt, F Emmes, C Fuhs, C Otto, T Ströder Hinweise: Die Hausaufgaben sollen in Gruppen von je 2 Studierenden aus dem gleichen Tutorium
MehrGrundlagen der Theoretischen Informatik
Grundlagen der Theoretischen Informatik Sommersemester 2015 23.04.2015 Viorica Sofronie-Stokkermans e-mail: sofronie@uni-koblenz.de 1 Bis jetzt 1. Terminologie 2. Endliche Automaten und reguläre Sprachen
MehrGrundlagen der Theoretischen Informatik
1 Grundlagen der Theoretischen Informatik Till Mossakowski Fakultät für Informatik Otto-von-Guericke Universität Magdeburg Wintersemester 2014/15 2 Kontextfreie Grammatiken Definition: Eine Grammatik G
MehrGrammatik Prüfung möglich, ob eine Zeichenfolge zur Sprache gehört oder nicht
Zusammenhang: Formale Sprache Grammatik Formale Sprache kann durch Grammatik beschrieben werden. Zur Sprache L = L(G) gehören nur diejenigen Kombinationen der Zeichen des Eingabealphabets, die durch die
MehrZentralübung zur Vorlesung Theoretische Informatik
SS 2015 Zentralübung zur Vorlesung Theoretische Informatik Dr. Werner Meixner Fakultät für Informatik TU München http://www14.in.tum.de/lehre/2015ss/theo/uebung/ 7. Mai 2015 ZÜ THEO ZÜ IV Übersicht: 1.
MehrAlgorithmische Bioinformatik
FREIE UNIVERSITÄT BERLIN Fachbereich Mathematik und Informatik Institut für Informatik (WE 3) FU BERLIN Freie Universität Berlin FB Mathematik und Informatik, Institut für Informatik, Takustr. 9, D-14195
MehrKontextfreie Sprachen
Kontextfreie Sprachen Bedeutung: Programmiersprachen (Compilerbau) Syntaxbäume Chomsky-Normalform effiziente Lösung des Wortproblems (CYK-Algorithmus) Grenzen kontextfreier Sprachen (Pumping Lemma) Charakterisierung
MehrKontextfreie Sprachen
Kontextfreie Sprachen besitzen große Bedeutung im Compilerbau Chomsky-Normalform effiziente Lösung des Wortproblems (CYK-Algorithmus) Grenzen kontextfreier Sprachen (Pumping Lemma) Charakterisierung durch
Mehr4.9.7 Konstruktion der Suffixbäume
.9.7 Konstruktion der Suffixbäume Beipiel: xabxa (siehe Abbildung.27) Man beginnt mit der Konstruktion eines Suffixbaumes für gesamten String und schreibt eine 1 am Blatt, weil der Suffix xabxa an der
MehrTheoretische Grundlagen der Informatik
Theoretische Grundlagen der Informatik Vorlesung am 12.01.2012 INSTITUT FÜR THEORETISCHE 0 KIT 12.01.2012 Universität des Dorothea Landes Baden-Württemberg Wagner - Theoretische und Grundlagen der Informatik
MehrDisMod-Repetitorium Tag 4
DisMod-Repetitorium Tag 4 Endliche Automaten, Reguläre Sprachen und Kontextfreie Grammatiken 22. März 2018 1 Endliche Automaten Definition DFA Auswertungen Äquivalenzrelationen Verschmelzungsrelation und
Mehr2.1 Grundlagen: Kontextfreie Grammatiken
2.1 Grundlagen: Kontextfreie Grammatiken Programme einer Programmiersprache können unbeschränkt viele Tokens enthalten, aber nur endlich viele Token-Klassen :-) Als endliches Terminal-Alphabet T wählen
MehrEin Fragment von Pascal
Ein Fragment von Pascal Wir beschreiben einen (allerdings sehr kleinen) Ausschnitt von Pascal durch eine kontextfreie Grammatik. Wir benutzen das Alphabet Σ = {a,..., z, ;, :=, begin, end, while, do} und
MehrAlgorithmen und Datenstrukturen SS09. Foliensatz 15. Michael Brinkmeier. Technische Universität Ilmenau Institut für Theoretische Informatik
Foliensatz 15 Michael Brinkmeier Technische Universität Ilmenau Institut für Theoretische Informatik Sommersemester 2009 TU Ilmenau Seite 1 / 16 Untere Schranken für das Vergleichsbasierte Sortieren TU
MehrGrundbegriffe. Grammatiken
Grammatiken Grammatiken in der Informatik sind ähnlich wie Grammatiken für natürliche Sprachen ein Mittel, um alle syntaktisch korrekten Sätze (hier: Wörter) einer Sprache zu erzeugen. Beispiel: Eine vereinfachte
MehrÜbungsblatt 6. Vorlesung Theoretische Grundlagen der Informatik im WS 18/19
Institut für Theoretische Informatik Lehrstuhl Prof. Dr. D. Wagner Übungsblatt 6 Vorlesung Theoretische Grundlagen der Informatik im WS 18/19 Ausgabe 8. Januar 2019 Abgabe 22. Januar 2019, 11:00 Uhr (im
MehrFormale Sprachen und Automaten
Formale Sprachen und Automaten Lischke SS 2004 Vorwort Dieses Dokument wurde als Skript für die auf der Titelseite genannte Vorlesung erstellt und wird jetzt im Rahmen des Projekts Vorlesungsskripte der
MehrGrundlagen der Theoretischen Informatik
Grundlagen der Theoretischen Informatik 4. Kellerautomaten und kontextfreie Sprachen (III) 17.06.2015 Viorica Sofronie-Stokkermans e-mail: sofronie@uni-koblenz.de 1 Übersicht 1. Motivation 2. Terminologie
MehrErkennung der kontextfreien Grammatiken mittels Boolescher Matrixmultiplikation
Erkennung der kontextfreien Grammatiken mittels Boolescher Matrixmultiplikation Valiant-Erkenner Referent: Fedor Uvarov eminar Algorithmen zu kontextfreien Grammatiken Dozenten: Prof Dr. Hofmann, Dr. Leiß
MehrAutomaten und formale Sprachen Notizen zu den Folien
Automaten und formale prachen Notizen zu den Folien 10 Kontextfreie Grammatiken Beispiele für kontextfreien Grammatiken ei Σ = {a, b}. Beispiel 1 (Folie 211, oben) Geben ie eine kontextfreie Grammatik
MehrFormale Grundlagen der Wirtschaftsinformatik
Formale Grundlagen der Wirtschaftsinformatik Nikolaj Popov Research Institute for Symbolic Computation popov@risc.uni-linz.ac.at Sprachen und Grammatiken Teil II Sprache Definition: Ein Alphabet Σ ist
MehrAutomaten und formale Sprachen Notizen zu den Folien
Automaten und formale prachen Notizen zu den Folien 10 Kontextfreie Grammatiken Beispiele für kontextfreien Grammatiken ei Σ = {a, b}. Beispiel 1 (Folie 233, oben) Geben ie eine kontextfreie Grammatik
MehrTheoretische Grundlagen der Informatik
Theoretische Grundlagen der Informatik Übung am 02.02.2012 INSTITUT FÜR THEORETISCHE 0 KIT 06.02.2012 Universität des Andrea Landes Schumm Baden-Württemberg - Theoretische und Grundlagen der Informatik
Mehr1. Übungsblatt 6.0 VU Theoretische Informatik und Logik
. Übungsblatt 6. VU Theoretische Informatik und Logik 25. September 23 Aufgabe Sind folgende Aussagen korrekt? Begründen Sie jeweils Ihre Antwort. a) Für jede Sprache L gilt: L < L (wobei A die Anzahl
MehrA : z z A : z z : ( z, x, z ) δ
Informatik IV, SoS2003 1 Definition 1.1 Ein Quintupel A =(X,Z,z 0,δ,Z f )heißt nichtdeterministischer endlicher Automat (NEA): 1. X, Z sind endliche nichtleere Mengen. 2. z 0 Z 4. δ Z X Z Informatik IV,
MehrNachklausur zur Vorlesung Theoretische Grundlagen der Informatik Wintersemester 2011/2012
Institut für Theoretische Informatik Lehrstuhl Prof. Dr. D. Wagner Nachklausur zur Vorlesung Theoretische Grundlagen der Informatik Wintersemester 2011/2012 Hier Aufkleber mit Name und Matrikelnr. anbringen
MehrVorhersagealgorithmen Strukturelle Bioinformatik WS15/16
Vorhersagealgorithmen Strukturelle Bioinformatik WS15/16 Dr. Stefan Simm, 02.12.2015 simm@bio.uni-frankfurt.de RNA-Sekundärstrukturen werden durch Interaktionen zwischen komplementären Nucleotid-Paaren
MehrDer Earley-Algorithmus
Der Earley-Algorithmus Kursfolien Karin Haenelt 25.03.02 1 25.03.02 2 Inhalt Funktion des Earley-Algorithmus Begriffe Erkenner/Parser Kontextfreie Grammatik Ein Beispiel Funktionen des Algorithmus Funktionsweise
MehrKapitel 3. Kontextfreie Sprachen. Induktive Charakterisierung der Sprache L der korrekten Klammerausdrücke: (w) L, falls w L vw L, falls v, w L
Kapitel 3 Kontextfreie Sprachen Induktive Charakterisierung der Sprache L der korrekten Klammerausdrücke: s. Übung ε L (w) L, falls w L vw L, falls v, w L (R0) (R1) (R2) Für beliebige w {(, )} kann w L
MehrFormale Sprachen. Grammatiken und die Chomsky-Hierarchie. Rudolf FREUND, Marian KOGLER
Formale Sprachen Grammatiken und die Chomsky-Hierarchie Rudolf FREUND, Marian KOGLER Grammatiken Das fundamentale Modell zur Beschreibung von formalen Sprachen durch Erzeugungsmechanismen sind Grammatiken.
MehrDer Earley-Algorithmus
Der Earley-Algorithmus Kursfolien Karin Haenelt 25.03.02 1 25.03.02 2 Inhalt Funktion des Earley-Algorithmus Begriffe Erkenner/Parser Kontextfreie Grammatik Ein Beispiel Funktionen des Algorithmus Funktionsweise
MehrOgden s Lemma: Der Beweis (1/5)
Ogden s Lemma: Der Beweis (1/5) Wir betrachten zuerst die Rahmenbedingungen : Laut dem auf der vorhergehenden Folie zitierten Satz gibt es zur kontextfreien Sprache L eine Grammatik G = (Σ, V, S, P) in
MehrKontextfreie Grammatiken. Kontextfreie Grammatiken 1 / 45
Kontextfreie Grammatiken Kontextfreie Grammatiken 1 / 45 Was kann man mit kontextfreien Grammatiken anfangen? Kontextfreie Grammatiken, kurz: werden zur Modellierung von KFGs beliebig tief geschachtelten
MehrLösungen zur 1. Klausur. Einführung in Berechenbarkeit, formale Sprachen und Komplexitätstheorie
Hochschuldozent Dr. Christian Schindelhauer Paderborn, den 21. 2. 2006 Lösungen zur 1. Klausur in Einführung in Berechenbarkeit, formale Sprachen und Komplexitätstheorie Name :................................
MehrAutomaten und Formale Sprachen SoSe 2013 in Trier
Automaten und Formale Sprachen SoSe 2013 in Trier Henning Fernau Universität Trier fernau@uni-trier.de 2. Juni 2013 1 Automaten und Formale Sprachen Gesamtübersicht Organisatorisches Einführung Endliche
Mehr5.7 Kontextfreie Grammatiken und Kellerautomaten
130 5.7 Kontextfreie Grammatiken und Kellerautomaten Im letzten Abschnitt haben wir gesehen, dass wir reguläre Sprachen auch mit Hilfe von endlichen Automaten charakterisieren können. Jetzt wollen wir
MehrKapitel IV Formale Sprachen und Grammatiken
Kapitel IV Formale Sprachen und Grammatiken 1. Begriffe und Notationen Sei Σ ein (endliches) Alphabet. Dann Definition 42 1 ist Σ das Monoid über Σ, d.h. die Menge aller endlichen Wörter über Σ; 2 ist
Mehr2. Gegeben sei folgender nichtdeterministischer endlicher Automat mit ɛ-übergängen:
Probeklausur Automatentheorie & Formale Sprachen WiSe 2012/13, Wiebke Petersen Name: Matrikelnummer: Aufgabe A: Typ3-Sprachen 1. Konstruieren Sie einen endlichen Automaten, der die Sprache aller Wörter
MehrAufgabe Mögliche Punkte Erreichte Punkte a b c d Σ a b c d Σ x1 13
Universität Karlsruhe Theoretische Informatik Fakultät für Informatik WS 2003/04 ILKD Prof. Dr. D. Wagner 14. April 2004 2. Klausur zur Vorlesung Informatik III Wintersemester 2003/2004 Hier Aufkleber
Mehr