Vorhersage der RNA-Sekundärstruktur
|
|
- Jürgen Kohl
- vor 5 Jahren
- Abrufe
Transkript
1 Vorhersage der RNA-Sekundärstruktur Andreas Spillner Bioinformatik, SS 2018
2 Primärstruktur vs. Sekundärstruktur Primärstruktur Sequenz der Buchstaben (bei RNA entspricht ein Buchstabe jeweils einer Nukleinsäure in einem kettenförmigen Molekül). Sekundärstruktur Sich durch Wasserstoffbrücken innerhalb eines kettenförmigen Moleküls bildende Strukturen.
3 Beispiel für eine RNA-Sekundärstruktur [Quelle: An efficient two-level swarm intelligence approach for RNA secondary structure prediction with bi-objective minimum free energy scores. Soniya Lalwani, Rajesh Kumar, Nilama Gupta. Swarm and Evolutionary Computation, Volume 27, April 2016, Pages ]
4 RNA und Genregulation Die Kenntnis der von einem RNA-Molekül eingenommenen Sekundärstruktur hilft verstehen, welche Funktion dieses Molekül übernehmen kann. Beispiele für mögliche Funktionen: Regulation der Transkription Stummschaltung von Genen...
5 Ansatz zur Vorhersage Minimierung der freien Energie Berechnung des energetisch niedrigsten Zustands für ein RNA-Molekül Wegen der großen Anzahl möglicher Zustände können nicht einfach alle durchgegangen und der mit der niedrigsten Energie herausgesucht werden.
6 Basenpaarungen Eine RNA-Sequenz ist für uns hier eine Folge r 1, r 2,..., r n von Buchstaben A, C, G und U. Die Teilsequenz r i, r i+1,..., r j für 1 i j n wird mit R i,j bezeichnet. Sogenannte kanonische Paarungen von Buchstaben sind: C == G, A == U, G == U Alle anderen Paarungen von Buchstaben heißen nicht kanonisch.
7 Beschreibung der Sekundärstruktur Gegeben sei die RNA-Sequenz z = r 1, r 2,..., r n. Eine Sekundärstruktur von z ist eine Menge S von Paaren (r i, r j ) mit (i) 1 i < j n und (ii) j i > 4. Bedingung (ii) schließt starke Verbiegungen des RNA-Moleküls aus.
8 Typische Teilstrukturen einer RNA-Sekundärstruktur [Quelle: RNA as a Permutation. Nilay Chheda, Manish Gupta. arxiv: , 2014]
9 Pseudoknoten Zwei Paare (r i, r j ) und (r k, r l ) in einer Sekundärstruktur S bilden einen Pseudoknoten, wenn gilt. i < k < j < l Wir betrachten zunächst Sekundärstrukturen ohne Pseudoknoten. Vorkommen können also nur: helikale Strukturen (stem) Haarnadelstrukturen (hairpin) Ausbuchtungen (bulge) interne Schleifen (loop)
10 Rechenregeln Basierend auf Messungen der Energie von RNA-Molekülen kann man recht komplexe Rechenregeln aufstellen, gemäß denen sich die freie Energie einer Sekundärstruktur ergibt. Wir schauen uns hier nur die grundsätzliche Herangehensweise an.
11 Verwendete Scoringfunktion (1) Für jede Basenpaarung (r, r ) ist ein Wert gegeben. α(r, r ) 0 Für kanonische Basenpaarungen gelte α(r, r ) < 0. Für alle anderen Basenpaarungen sei α(r, r ) = 0. Mit Messungen vereinbar sind die folgenden Werte: α(c, G) = α(g, C) = 3 kcal mol α(a, U) = α(u, A) = 2 kcal mol α(u, G) = α(g, U) = 1 kcal mol
12 Verwendete Scoringfunktion (2) Eine Sekundärstruktur S der RNA-Sequenz r 1, r 2,..., r n wird dann bewertet mit der Scoring-Funktion E(S) = α(r, r ). (r,r ) S E(S) heißt die freie Energie von S. Ziel: Berechnung einer Sekundärstruktur S für die gegebene RNA-Sequenz mit E(S) minimal.
13 Berechnung einer optimalen Sekundärstruktur Die Berechnung einer Sekundärstruktur S mit minimaler freier Energie für die RNA-Sequenz r 1, r 2,..., r n erfolgt mit dynamischem Programmieren. Dazu verwenden wir eine Tabelle E mit n Zeilen und n Spalten. Der Eintrag E[i, j] für 1 i j n liefert die minimale freie Energie einer Sekundärstruktur für die Teilsequenz R i,j = r i, r i+1,..., r j.
14 Ausfüllen der Tabelle E Initialisierung: E[i, j] = 0 für alle 1 i j n mit j i 4. Der Eintrag E[i, j] für 1 i j n mit j i > 4 ergibt sich als das Minimum über: (1) E[i, j 1] (2) α(r i, r j ) + E[i + 1, j 1] (3) min i<k<j 4 (E[i, k 1] + α(r k, r j ) + E[k + 1, j 1])
15 Betrachtung aller möglichen Fälle Die Formel zur Berechnung von E[i, j] für j i > 4 kommt durch die Betrachtung aller möglichen Fälle zustande, wie r i und/oder r j Paarungen eingehen können. (1) r j geht mit keiner Base aus R i,j eine Paarung ein. (2) r j geht mit Base r i eine Paarung ein. (3) r j geht mit einer Base r k für i < k < j 4 eine Paarung ein.
16 Traceback und Laufzeit In E[1, n] steht nach Abschluss der Berechnung der minimale Wert der freien Energie einer Sekundärstruktur der gegebenen RNA-Sequenz. Um eine entsprechende Sekundärstruktur zu erhalten, führt man einen Traceback auf der Tabelle E aus. Die Laufzeit des gesamten Verfahrens ist in O(n 3 ), da wir O(n 2 ) Tabelleneinträge berechnen und ein Eintrag in O(n) Zeit berechnet werden kann.
17 Noch nicht berücksichtigte Aspekte Wir können noch keine Sekundärstrukturen mit Pseudoknoten erhalten. Mehrere aufeinanderfolgende Basenpaarungen in helikalen Strukturen interagieren und wirken stabilisierend auf die Sekundärstruktur. Man nennt dies Stacking-Interaktionen. Wir wollen auch den Beitrag dieser Stacking-Interaktionen zur freien Energie der Sekundärstruktur berücksichtigen.
18 Bestimmung aller möglichen helikalen Strukturen Zunächst bestimmt man die Menge Hel, die alle helikalen Strukturen enthält, die sich auf der RNA-Sequenz r 1, r 2,..., r n bilden können. Hel kann effizient bestimmt werden und enthält O(n 3 ) Elemente.
19 Kompatibilität helikaler Strukturen Zwei helikale Strukturen h 1, h 2 Hel sind kompatibel, wenn sie gleichzeitig in einer Sekundärstruktur der RNA-Sequenz auftreten können. Man erkennt zwei helikale Strukturen h 1 und h 2, die nicht kompatibel sind, daran, dass es ein r i in r 1, r 2,..., r n gibt, welches in h 1 und in h 2 vorkommt. Außerdem darf es wieder keine zu starken Verbiegungen des RNA-Moleküls geben. Ggf. kann man noch weitere Bedingungen für die Kompatibilität aufstellen.
20 Ziel: Optimale Menge paarweise kompatibler helikaler Strukturen bestimmen Jede Menge K von paarweise kompatiblen helikalen Strukturen definiert eine Sekundärstruktur S K. Die Bewertung einer solchen Menge K erfolgt über die Berechnung der freien Energie von S K. Dabei werden die Stacking-Interaktionen berücksichtigt. Im Folgenden wird diese Bewertung mit sc(k ) bezeichnet.
21 Kodierung von Mengen helikaler Strukturen Die Kodierung von Teilmengen K i von Hel erfolgt über Bitvektoren: Hel h 1 h 2 h 3 h 4 h 5 K K K K Im folgenden Algorithmus können als Zwischenergebnis auch Teilmengen auftreten, die nicht paarweise kompatibel sind. Die Kodierung setzt auch nicht voraus, dass die K i paarweise kompatibel sein müssen.
22 Grundidee eines genetischen Algorithmus In einem genetischen Algorithmus verwaltet man eine Population P möglicher Lösungen für das gegebene Problem. Bei uns ist P = K 1, K 2,..., K t eine Liste von Teilmengen von Hel kodiert als Bitvektoren. In jeder Iteration des Algorithmus geschehen zwei Dinge: (1) Aus dem aktuell vorhandenen P wird eine neue Population P zusammengestellt. Dabei kommen bevorzugt diejenigen Elemente von P zum Zuge, die bzgl. der verwendeten Bewertung gut abschneiden. (2) Durch Mutationen und Kreuzungen werden die Elemente von P mit einer gewissen Wahrscheinlichkeit modifiziert. Der Algorithmus hält an, wenn sich die Bewertung der jeweils besten Elemente der Population über mehrere Iterationen hinweg nicht mehr wesentlich ändert.
23 (1) Erzeugung einer neuen Population P Bei uns besteht P aus Teilmengen von Hel. K 1, K 2,..., K t P kann dieselbe Teilmenge mehrmals enthalten. Aus sc(k i ) wird eine Wahrscheinlichkeit berechnet, mit der K i in P übernommen wird. Diese Wahrscheinlichkeit ist umso größer, je besser die Bewertung sc(k i ) im Verhältnis zu den Bewertungen der anderen Elemente von P ist. Die Größe der Population bleibt von Iteration zu Iteration konstant.
24 (2) Mutationen und Kreuzungen in P Mutationen: Man greift sich jeweils zufällig ein Element K P heraus und ändert ein zufällig gewähltes Bit im Bitvektor, der K codiert. Kreuzungen: Man greift sich jeweils zufällig zwei verschiedene Elemente K und K P heraus und tauscht einen Präfix zufälliger Länge von K und K aus.
25 Einhaltung der Kompatibilität Wir sind nur an Teilmengen von Hel interessiert, die paarweise kompatible helikale Strukturen enthalten. Daher wählen wir als Startpopulation auch eine, die nur solche Teilmengen von Hel enthält. Durch Mutationen und Kreuzungen kann es aber dazu kommen, dass die Population P am Ende einer Iteration des genetischen Algorithmus zunächst auch Teilmengen K Hel enthält, die nicht mehr nur paarweise kompatible helikale Strukturen enthalten. Dann müssen wir diese Elemente K von P entsprechend bereinigen.
26 Bereinigung inkompatibler helikaler Strukturen Wenn wir feststellen, dass ein K P inkompatible helikale Strukturen enthält, dann müssen wir Elemente aus K entfernen. Auch dabei brauchen wir ein Kriterium, nach dem wir die zu entfernenden Elemente auswählen. Wenn wir entscheiden müssen, ob wir h 1 oder h 2 aus K entfernen, dann gehen wir danach, wie weit die in den helikalen Strukturen gepaarten Stränge in der RNA-Sequenz voneinander entfernt liegen. Wir entfernen dann immer diejenige helikalen Struktur zuerst, deren Stränge am weitesten voneinander entfernt liegen.
27 Typische Probleme beim Einsatz genetischer Algorithmen Wenn man einen genetischen Algorithmus einsetzt, wird man mit einer Basisversion experimentieren und schauen, wie er sich schlägt. Typische Probleme, die auftreten können, sind: Die Population wandert ziellos im Raum der möglichen Lösungen für das Problem umher. Dann muss man ggf. untersuchen, ob die Bewertung der Lösungen geeigneter gestaltet werden kann. Die Population gerät oft in ein lokales Minimum, aus dem sie nicht wieder herausfindet. Dann kann eine Modifikation der Zusammenstellung der Elemente für P hilfreich sein. Schon gefundene gute Lösungen werden zu schnell wieder aus der Population entfernt. Auch hier kann eine Modifikation der Zusammenstellung der Elemente für P hilfreich sein.
28 Fine-Tuning des genetischen Algorithmus zur Bestimmung optimaler RNA-Sekundärstrukturen Man passt die Bewertung so an, dass längere helikale Strukturen eine bessere Bewertung bekommen. Man übernimmt immer die beste und die schlechteste Lösung der aktuellen Population unverändert in die nächste Population. [Weitere Details zum originalen Algorithmus und den Experimenten damit: The computer simulation of RNA folding pathways using a genetic algorithm. Gultyaev et al., J. Mol. Biol. 250, 37-51, 1995.]
Datenstrukturen & Algorithmen
Datenstrukturen & Algorithmen Matthias Zwicker Universität Bern Frühling 2010 Übersicht Dynamische Programmierung Einführung Ablaufkoordination von Montagebändern Längste gemeinsame Teilsequenz Optimale
MehrRNA folding. W1-High-throughput Genomics, FU Berlin OWL RNA Bioinformatics, MPI Molgen Berlin
RNA folding W-High-throughput Genomics, FU Berlin OWL RNA Bioinformatics, MPI Molgen Berlin 3..6 Lernziele Einführung von RNA-Molekülen Konzept der RNA-Sekundärstruktur Lernen wie eine RNA-Sekundärstruktur
MehrFOLDALIGN und sein Algorithmus. Nadine Boley Silke Szymczak
FOLDALIGN und sein Algorithmus Nadine Boley Silke Szymczak Gliederung 2 Einleitung Motivation des Ansatzes zu FOLDALIGN Sankoff-Algorithmus Globales Alignment Zuker-Algorithmus Kombination FOLDALIGN Algorithmus,
MehrRNA Faltung - II. W1-High-throughput Genomics, FU Berlin OWL RNA Bioinformatics, MPI Molgen Berlin
RNA Faltung - II W1-High-throughput Genomics, FU Berlin OWL RNA Bioinformatics, MPI Molgen Berlin 05.12.16 Nussinov Nachteilen Die Maximierung der Anzahl von Bp führt unter Umständen nicht zu biologisch
MehrThema 12: RNA Structure Prediction
Thema 12: RNA Structure Prediction Vortrag gehalten von Tobias Sander am 01.02.2010 1 Einleitung 1.1 Vorwort Seit der Strukturaufklärung der DNA im Jahre 1953 durch Watson und Crick sind fast 60 Jahre
MehrAlgorithmen für paarweise Sequenz-Alignments. Katharina Hembach
Proseminar Bioinformatik WS 2010/11 Algorithmen für paarweise Sequenz-Alignments Katharina Hembach 06.12.2010 1 Einleitung Paarweise Sequenz-Alignments spielen in der Bioinformatik eine wichtige Rolle.
MehrRNA Strukturvorhersage
RNA Strukturvorhersage Christian Pölitz Hauptseminar AFS Institut für Theoretische Informatik Fakultät für Informatik und Automatisierung Technische Universität Ilmenau 17. Juli 2007 Christian Pölitz (TU
MehrÜbersicht. Aktivitäten-Auswahl-Problem. Greedy Algorithmen. Aktivitäten-Auswahl-Problem. Aktivitäten-Auswahl-Problem. Datenstrukturen & Algorithmen
Datenstrukturen & Algorithmen Übersicht Greedy Algorithmen Einführung Aktivitäten-Auswahl-Problem Huffman Codierung Matthias Zwicker Universität Bern Frühling 2009 2 Greedy Algorithmen Entwurfsstrategie
MehrVorhersagealgorithmen Strukturelle Bioinformatik WS15/16
Vorhersagealgorithmen Strukturelle Bioinformatik WS15/16 Dr. Stefan Simm, 02.12.2015 simm@bio.uni-frankfurt.de RNA-Sekundärstrukturen werden durch Interaktionen zwischen komplementären Nucleotid-Paaren
MehrAlgorithmen und Komplexität Lösungsvorschlag zu Übungsblatt 8
ETH Zürich Institut für Theoretische Informatik Prof. Dr. Angelika Steger Florian Meier, Ralph Keusch HS 2017 Algorithmen und Komplexität Lösungsvorschlag zu Übungsblatt 8 Lösungsvorschlag zu Aufgabe 1
MehrBioinformatik. Lokale Alignierung Gapkosten. Silke Trißl / Ulf Leser Wissensmanagement in der. Bioinformatik
Bioinformatik Lokale Alignierung Gapkosten Silke Trißl / Ulf Leser Wissensmanagement in der Bioinformatik Inhalt dieser Vorlesung Ähnlichkeit Lokales und globales Alignment Gapped Alignment Silke Trißl:
MehrTheoretische Informatik III (Winter 2018/19) Prof. Dr. Ulrich Hertrampf. Noch einmal TSP
Noch einmal TSP Wir hatten das TSP-Problem (Problem der Handlungsreisenden) schon als Beispiel für die Branch-and-Bound Methode kennengelernt. Nun wollen wir noch einen zweiten Algorithmus angeben, der
Mehrcomparative structure prediction of ncrna molecules
comparative structure prediction of ncrna molecules using a non Sankoff approach 01. Februar 2008 Inhalt 1 ncrna s - ein Überblick 2 RNAcast - RNA consensus structure prediction Outline und Vorbereitung
MehrAlgorithmen auf Sequenzen Paarweiser Sequenzvergleich: Alignments
Algorithmen auf Sequenzen Paarweiser Sequenzvergleich: Alignments Sven Rahmann Genominformatik Universitätsklinikum Essen Universität Duisburg-Essen Universitätsallianz Ruhr Einführung Bisher: Berechnung
MehrEntwicklung integrierter HW/SW-Systeme Integrierte Hard- und Softwaresysteme 2 Seminar
Entwicklung integrierter HW/SW-Systeme Integrierte Hard- und Softwaresysteme 2 Seminar Jorge Meza jorge.meza@tu-ilmenau.de Zusebau R2082, Tel: -4128 Prof. Dr.-Ing. habil. Andreas Mitschele-Thiel Integrated
MehrAnwendungen dynamischer Programmierung in der Biologie
Anwendungen dynamischer Programmierung in der Biologie Überblick Algorithmus zum Finden der wahrscheinlichsten Sekundärstruktur eines RNS Moleküls Sequence Alignment Verbesserung von Sequence Alignment
MehrSequenzanalyse mit Markov-Ketten
Sequenzanalyse mit Markov-Ketten Andreas Spillner Bioinformatik, SS 208 Ausgangspunkt Die Abfolge von Buchstaben in einer Sequenz ist zufällig, aber es gibt in der Regel Abhängigkeiten zwischen benachbarten
MehrAlgorithmische Bioinformatik 1
Algorithmische Bioinformatik 1 Dr. Hanjo Täubig Lehrstuhl für Effiziente Algorithmen (Prof. Dr. Ernst W. Mayr) Institut für Informatik Technische Universität München Sommersemester 2009 Übersicht Algorithmen
MehrGenetische Algorithmen. Uwe Reichel IPS, LMU München 8. Juli 2008
Genetische Algorithmen Uwe Reichel IPS, LMU München reichelu@phonetik.uni-muenchen.de 8. Juli 2008 Inhalt Einführung Algorithmus Erweiterungen alternative Evolutions- und Lernmodelle Inhalt 1 Einführung
MehrInformatik II, SS 2018
Informatik II - SS 2018 (Algorithmen & Datenstrukturen) Vorlesung 21 (11.7.2018) String Matching (Textsuche) II Greedy Algorithmen I Algorithmen und Komplexität Textsuche / String Matching Gegeben: Zwei
MehrKapitel 5: Dynamisches Programmieren Gliederung
Gliederung 1. Grundlagen 2. Zahlentheoretische Algorithmen 3. Sortierverfahren 4. Ausgewählte Datenstrukturen 5. Dynamisches Programmieren 6. Graphalgorithmen 7. String-Matching 8. Kombinatorische Algorithmen
MehrAlgorithmische Bioinformatik
FREIE UNIVERSITÄT BERLIN Fachbereich Mathematik und Informatik Institut für Informatik (WE 3) FU BERLIN Freie Universität Berlin FB Mathematik und Informatik, Institut für Informatik, Takustr. 9, D-14195
MehrDynamische Programmierung
Dynamische Programmierung Claudia Gerhold 9.5.6 Claudia Gerhold Dynamische Programmierung 9.5.6 / 4 Agenda Einführung Dynamische Programmierung Top-Down Ansatz mit Memoization Bottom-Up Ansatz 3 Anwendungsbeispiele
MehrAlgorithmen und Datenstrukturen 2
Algorithmen und Datenstrukturen 2 Lerneinheit 3: Greedy Algorithmen Prof. Dr. Christoph Karg Studiengang Informatik Hochschule Aalen Sommersemester 2016 10.5.2016 Einleitung Einleitung Diese Lerneinheit
MehrDas Problem des Handlungsreisenden
Seite 1 Das Problem des Handlungsreisenden Abbildung 1: Alle möglichen Rundreisen für 4 Städte Das TSP-Problem tritt in der Praxis in vielen Anwendungen als Teilproblem auf. Hierzu gehören z.b. Optimierungsprobleme
MehrStichpunktezettel fürs Tutorium
Stichpunktezettel fürs Tutorium Moritz und Dorian 18. November 2009 1 Chomskys Erstschlag 1.1 Reguläre Sprachen und Grammatiken Aufgabe 1. Wie sieht die Sprache zu den folgenden Grammatiken aus? 1. G =
MehrAnhang: Ungarische Methode
Ungarische Methode 107 Anhang: Ungarische Methode Zum Schluss des Kurses soll noch der Algorithmus der Ungarischen Methode beschrieben werden. Wir lehnen uns hierbei eng an der Darstellung von DOMSCHKE
MehrPrimzahlen und Programmieren
Primzahlen Wir wollen heute gemeinsam einen (sehr grundlegenden) Zusammenhang zwischen Programmieren und Mathematik herstellen. Die Zeiten in denen Mathematiker nur mit Zettel und Stift (oder Tafel und
MehrDigitale Signaturen. Andreas Spillner. Kryptografie, SS 2018
Digitale Signaturen Andreas Spillner Kryptografie, SS 2018 Ausgangspunkt Digitale Signaturen bieten unter anderem das, was man auch mit einer eigenhändigen Unterschrift auf einem Dokument bezweckt. Beispiel:
MehrBetriebliche Optimierung
Betriebliche Optimierung Joachim Schauer Joachim Schauer Betriebliche Optimierung 1 / 31 1 Metaheuristische Verfahren 2 Joachim Schauer Betriebliche Optimierung 2 / 31 Einleitendes Metaheuristische Verfahren
MehrInformatik II, SS 2014
Informatik II SS 2014 (Algorithmen & Datenstrukturen) Vorlesung 20 (23.7.2014) All Pairs Shortest Paths, String Matching (Textsuche) Algorithmen und Komplexität Vorlesungsevaluation Sie sollten alle eine
MehrBetriebliche Optimierung
Betriebliche Optimierung Joachim Schauer Institut für Statistik und OR Uni Graz Joachim Schauer ( Institut für Statistik und OR Uni Graz Betriebliche ) Optimierung 1 / 19 1 Joachim Schauer ( Institut für
MehrAlgorithmen und Datenstrukturen in der Bioinformatik Zweites Übungsblatt WS 05/06 Musterlösung
Johanna Ploog, Konstantin Clemens Freie Universität Berlin Institut für Mathematik II Arbeitsgruppe für Mathematik in den Lebenswissenschaften Algorithmen und Datenstrukturen in der Bioinformatik Zweites
MehrInformatik II, SS 2016
Informatik II - SS 2016 (Algorithmen & Datenstrukturen) Vorlesung 21 (15.7.2016) String Matching (Textsuche) Approximate String Matching Algorithmen und Komplexität Textsuche / String Matching Gegeben:
MehrInformatik II, SS 2014
Informatik II SS 2014 (Algorithmen & Datenstrukturen) Vorlesung 21 (29.7.2014) String Matching (Textsuche) II Algorithmen und Komplexität Textsuche / String Matching Gegeben: Zwei Zeichenketten (Strings)
MehrInformatik II: Algorithmen und Datenstrukturen SS 2013
Informatik II: Algorithmen und Datenstrukturen SS 2013 Vorlesung 11b, Mittwoch, 3. Juli 2013 (Editierdistanz, dynamische Programmierung) Prof. Dr. Hannah Bast Lehrstuhl für Algorithmen und Datenstrukturen
MehrSynthese Eingebetteter Systeme. Übung 6
12 Synthese Eingebetteter Systeme Sommersemester 2011 Übung 6 Michael Engel Informatik 12 TU Dortmund 2011/07/15 Übung 6 Evolutionäre Algorithmen Simulated Annealing - 2 - Erklären Sie folgende Begriffe
Mehr6. Algorithmen auf Zeichenketten
6. Algorithmen auf Zeichenketten Motivation Wir lernen nun Algorithmen zur Lösung verschiedener elementarer Probleme auf Zeichenketten zu lösen Zeichenketten spielen eine wichtige Rolle in diversen Gebieten
MehrBayesianische Netzwerke - Lernen und Inferenz
Bayesianische Netzwerke - Lernen und Inferenz Manuela Hummel 9. Mai 2003 Gliederung 1. Allgemeines 2. Bayesianische Netzwerke zur Auswertung von Genexpressionsdaten 3. Automatische Modellselektion 4. Beispiel
MehrAlgorithmen und Datenstrukturen
Algorithmen und Datenstrukturen Wintersemester 2012/13 26. Vorlesung Greedy- und Approximationsalgorithmen Prof. Dr. Alexander Wolff Lehrstuhl für Informatik I Operations Research Optimierung für Wirtschaftsabläufe:
MehrWS 2016/17 Diskrete Strukturen Kapitel 3: Kombinatorik (1)
WS 2016/17 Diskrete Strukturen Kapitel 3: Kombinatorik (1) Hans-Joachim Bungartz Lehrstuhl für wissenschaftliches Rechnen Fakultät für Informatik Technische Universität München http://www5.in.tum.de/wiki/index.php/diskrete_strukturen_-_winter_16
Mehr8.1 Einleitung. Grundlagen der Künstlichen Intelligenz. 8.1 Einleitung. 8.2 Lokale Suchverfahren. 8.3 Zusammenfassung. Suchprobleme: Überblick
Grundlagen der Künstlichen Intelligenz 5. April 0 8. Suchalgorithmen: Lokale Suche Grundlagen der Künstlichen Intelligenz 8. Suchalgorithmen: Lokale Suche 8.1 Einleitung Malte Helmert Universität Basel
MehrGP-Music: An Interactive Genetic Programming System for Music Generation with Automated Fitness
GP-Music: An Interactive Genetic Programming System for Music Generation with Automated Fitness Raters Brad Johanson, Riccardo Poli Seminarvortrag von Thomas Arnold G ˇ ˇ ˇ ˇ WS 2012/13 TU Darmstadt Seminar
MehrADS: Algorithmen und Datenstrukturen 2
ADS: Algorithmen und Datenstrukturen 2 Teil 8 Gerhard Heyer, Florian Holz unter Verwendung der Materialien der letzten Jahre Abteilung Automatische Sprachverarbeitung Institut für Informatik Universität
MehrAlgorithmische Bioinformatik
FREIE UNIVERSITÄT BERLIN Fachbereich Mathematik und Informatik Institut für Informatik (WE 3) FU BERLIN Freie Universität Berlin FB Mathematik und Informatik, Institut für Informatik, Takustr. 9, D-14195
Mehr9 Minimum Spanning Trees
Im Folgenden wollen wir uns genauer mit dem Minimum Spanning Tree -Problem auseinandersetzen. 9.1 MST-Problem Gegeben ein ungerichteter Graph G = (V,E) und eine Gewichtsfunktion w w : E R Man berechne
MehrKünstliche Intelligenz - Optimierungsprobleme - Suche in Spielbäumen
Künstliche Intelligenz - Optimierungsprobleme - Suche in Spielbäumen Stephan Schwiebert WS 2009/2010 Sprachliche Informationsverarbeitung Institut für Linguistik Universität zu Köln Optimierungsprobleme
MehrInformationsvisualisierung
Informationsvisualisierung Thema: 7. Visualisierung Biologischer Daten Dozent: Dr. Dirk Zeckzer zeckzer@informatik.uni-leipzig.de Sprechstunde: nach Vereinbarung Umfang: 2 Prüfungsfach: Modul Fortgeschrittene
MehrAlgorithmen für schwierige Probleme
Algorithmen für schwierige Probleme Britta Dorn Wintersemester 2011/12 24. November 2011 Farbkodierung Beispiel Longest Path Longest Path gegeben: G = (V, E) und k N. Frage: Gibt es einen einfachen Pfad
MehrDiskrete Populationsmodelle für Einzelspezies
Diskrete Populationsmodelle für Einzelspezies Lisa Zang 30.10.2012 Quelle: J. D. Murray: Mathematical Biology: I. An Introduction, Third Edition, Springer Inhaltsverzeichnis 1. Einführung Einfache Modelle
MehrAlgorithmen und Komplexität
Algorithmen und Komplexität Dynamische Programmierung Markus Ullrich Norbert Baum Fachbereich Informatik - IIb07 Hochschule Zittau/Görlitz 28. Mai 2009 1 / 29 Wie sieht es mit langen Ketten aus? A 1 A
MehrWS 2009/10. Diskrete Strukturen
WS 2009/10 Diskrete Strukturen Prof. Dr. J. Esparza Lehrstuhl für Grundlagen der Softwarezuverlässigkeit und theoretische Informatik Fakultät für Informatik Technische Universität München http://www7.in.tum.de/um/courses/ds/ws0910
Mehr19. Dynamic Programming I
495 19. Dynamic Programming I Fibonacci, Längste aufsteigende Teilfolge, längste gemeinsame Teilfolge, Editierdistanz, Matrixkettenmultiplikation, Matrixmultiplikation nach Strassen [Ottman/Widmayer, Kap.
MehrAlgorithmen auf Sequenzen
Algorithmen auf Sequenzen Vorlesung von Prof. Dr. Sven Rahmann im Sommersemester 2008 Kapitel 6 Alignments Webseite zur Vorlesung http://ls11-www.cs.tu-dortmund.de/people/rahmann/teaching/ss2008/algorithmenaufsequenzen
MehrBerechnung von Abständen
3. Kreis- und Wegeprobleme Abstände in Graphen Abstände in Graphen Definition 3.4. Es sei G = (V, E) ein Graph. Der Abstand d(v, w) zweier Knoten v, w V ist die minimale Länge eines Weges von v nach w.
Mehr5. Bäume und Minimalgerüste
5. Bäume und Minimalgerüste Charakterisierung von Minimalgerüsten 5. Bäume und Minimalgerüste Definition 5.1. Es ein G = (V, E) ein zusammenhängender Graph. H = (V,E ) heißt Gerüst von G gdw. wenn H ein
MehrInformatik II, SS 2018
Informatik II - SS 2018 (Algorithmen & Datenstrukturen) Vorlesung 20 (9.7.2018) String Matching (Textsuche) Algorithmen und Komplexität Textsuche / String Matching Gegeben: Zwei Zeichenketten (Strings)
MehrVorlesung Bioinformatik Protein Threading
Vorlesung Bioinformatik Protein Threading Dr. Axel Mosig 18. Mai 2004 Vorhersage der Tertiärstruktur von Proteinen Ab Initio-Methoden (z.b. via Molecular Dynamics) sind rechenintensiv; nur in Einzelfällen
MehrIdeen und Konzepte der Informatik. Programme und Algorithmen Kurt Mehlhorn
Ideen und Konzepte der Informatik Programme und Algorithmen Kurt Mehlhorn Algorithmen und Programme Algorithmus Schritt-für-Schritt Vorschrift zur Lösung eines Problems. Formuliert man umgangssprachlich,
Mehr2. Klausur Datenstrukturen und Algorithmen SS 2014
Prof. aa Dr. E. Ábrahám F. Corzilius, S. Schupp, T. Ströder 2. Klausur Datenstrukturen und Algorithmen SS 2014 Vorname: Nachname: Studiengang (bitte genau einen markieren): Informatik Bachelor Informatik
Mehr19. Dynamic Programming I
495 19. Dynamic Programming I Fibonacci, Längste aufsteigende Teilfolge, längste gemeinsame Teilfolge, Editierdistanz, Matrixkettenmultiplikation, Matrixmultiplikation nach Strassen [Ottman/Widmayer, Kap.
MehrAlgorithmen und Datenstrukturen 2 VU 3.0 Nachtragstest SS Oktober 2016
Technische Universität Wien Institut für Computergraphik und Algorithmen Algorithms and Complexity Group 186.815 Algorithmen und Datenstrukturen 2 VU 3.0 Nachtragstest SS 2016 5. Oktober 2016 Machen Sie
MehrAufgabenblatt 4. Silke Trißl Wissensmanagement in der Bioinformatik
Aufgabenblatt 4 Silke Trißl Wissensmanagement in der Bioinformatik Zuerst! FRAGEN? Silke Trißl: Bioinformatik für Biophysiker 2 Exercise 1 Global alignment using dynamic programming Write a program to
MehrSuboptimal Foldings of RNA Structures
Suboptimal Foldings of RNA Structures Ausarbeitung zum Vortrag von Christin Zander und Rebecca Gau Seminar: Computational RNomics Einleitung Diese Ausarbeitung beschäftigt sich mit zwei Algorithmen, die
MehrADS: Algorithmen und Datenstrukturen 2
.. ADS: Algorithmen und Datenstrukturen 2 8. Vorlesung Uwe Quasthoff Abteilung Automatische Sprachverarbeitung Institut für Informatik Universität Leipzig 6. Juni 2012 1 / 25 Editier-Distanz Beobachtungen:
Mehr2.1. Konvexe Hülle in 2D
Wir wollen die konvexe Hülle einer Menge von Punkten P = {p 1,..., p n } in der Ebene R 2 bestimmen. y y x x Def. 21: Eine Teilmenge S der Ebene ist konvex gdw für jedes Paar das Liniensegment pq in S
MehrBioinformatik für Biochemiker
Bioinformatik für Biochemiker Oliver Kohlbacher WS 2009/2010 13. Ab-initio-Vorhersage Abt. Simulation biologischer Systeme WSI/ZBIT, Eberhard Karls Universität Tübingen Gliederung Ab-Initio-Vorhersage
MehrAlgorithmische Anwendungen WS 2005/2006
Algorithmische Anwendungen WS 2005/2006 Sequenzalignment Gruppe F_lila_Ala0506 Allal Kharaz Yassine ELassad Inhaltsverzeichnis 1 Problemstellungen...................................... 3 1.1 Rechtschreibkorrektur...............................
Mehr3.3 Optimale binäre Suchbäume
3.3 Optimale binäre Suchbäume Problem 3.3.1. Sei S eine Menge von Schlüsseln aus einem endlichen, linear geordneten Universum U, S = {a 1,,...,a n } U und S = n N. Wir wollen S in einem binären Suchbaum
MehrAlgorithmen & Datenstrukturen Midterm Test 2
Algorithmen & Datenstrukturen Midterm Test 2 Martin Avanzini Thomas Bauereiß Herbert Jordan René Thiemann
MehrStud.-Nummer: Datenstrukturen & Algorithmen Seite 1
Stud.-Nummer: Datenstrukturen & Algorithmen Seite 1 Aufgabe 1. / 16 P Instruktionen: 1) In dieser Aufgabe sollen Sie nur die Ergebnisse angeben. Diese können Sie direkt bei den Aufgaben notieren. 2) Sofern
MehrEvolution und Algorithmen
Kapitel 6 Spezialvorlesung Modul 10-202-2206 (Fortgeschrittene Methoden in der Bioinformatik) Jana Hertel Professur für Bioinformatik Institut für Informatik Universität Leipzig Machine learning in bioinformatics
MehrDatenstrukturen und Algorithmen (SS 2013)
Datenstrukturen und Algorithmen (SS 2013) Übungsblatt 10 Abgabe: Montag, 08.07.2013, 14:00 Uhr Die Übungen sollen in Gruppen von zwei bis drei Personen bearbeitet werden. Schreiben Sie die Namen jedes
MehrKapitel 5. Textalgorithmen. 5.1 Grundbegriffe
Kapitel 5 Textalgorithmen 5.1 Grundbegriffe Wir beschäftigen uns hauptsächlich mit Textsuche (und Varianten). Gegeben: Alphabet Σ (mindestens zwei Buchstaben). Text S = s 1... s n Σ in Array S[1..n]. Muster
MehrIT-Security. Teil 15: Zufall
IT-Security Teil 15: Zufall 09.05.17 1 Literatur [15-1] http://de.wikipedia.org/wiki/kryptographisch_sicherer_zufallszahlen generator [15-2] https://gnupg.org/documentation/manuals/gcrypt/fips-prng- Description.html
Mehr15. Algorithmus der Woche Das Rucksackproblem Die Qual der Wahl bei zu vielen Möglichkeiten
15. Algorithmus der Woche Das Rucksackproblem Die Qual der Wahl bei zu vielen Möglichkeiten Autoren Rene Beier, MPI Saarbrücken Berthold Vöcking, RWTH Aachen In zwei Monaten startet die nächste Rakete
MehrIdeen und Konzepte der Informatik
Ideen und Konzepte der Informatik Programme und Algorithmen Antonios Antoniadis 23. Oktober 2017 Algorithmen und Programme Algorithmus Schritt-für-Schritt Vorschrift zur Lösung eines Problems. Formuliert
MehrInformatik II, SS 2016
Informatik II - SS 2016 (Algorithmen & Datenstrukturen) Vorlesung 22 (20.7.2016) Greedy Algorithmen - Datenkompression Algorithmen und Komplexität Greedy Algorithmen Greedy Algorithmen sind eine Algorithmenmethode,
MehrÜbungsklausur Algorithmen I
Jun.-Prof. Hofheinz, Jun.-Prof. Meyerhenke (ITI, KIT) 08.06.2015 Übungsklausur Algorithmen I Aufgabe 1. (Algorithm Engineering) Nennen Sie zwei Konzepte, die Algorithm Engineering im Gegensatz zu theoretischer
MehrGen Protein Aufgaben: Edel LK-Bio BI-3
Proteinbiosynthese Von der DNA zum Protein Dieses Lernprogramm zeigt Ihnen in einem vereinfachten Modell den im Zellinneren ablaufenden Prozess vom Gen auf der DNA zum Protein. Aufgaben: 1 Betrachten Sie
MehrKodierung Genetische Algorithmen und Simulated Annealing
Kodierung Genetische Algorithmen und Simulated Annealing Referenten Dipl.-Ing. (FH) Dipl.-Ing. (FH) 1 Agenda Erklärung des Genetischen Algorithmus f(x)=x² (2-dimensional) Verschiedene Codierungen Binärcode,
MehrLernmodul 7 Algorithmus von Dijkstra
Folie 1 von 30 Lernmodul 7 Algorithmus von Dijkstra Quelle: http://www.map24.de Folie 2 von 30 Algorithmus von Dijkstra Übersicht Kürzester Weg von A nach B in einem Graphen Problemstellung: Suche einer
MehrInformatik II, SS 2016
Informatik II - SS 2016 (Algorithmen & Datenstrukturen) Vorlesung 20 (13.7.2016) String Matching (Textsuche) Algorithmen und Komplexität Textsuche / String Matching Gegeben: Zwei Zeichenketten (Strings)
MehrGenetische und Evolutionäre Algorithmen (Vol. 1)
Vortrag über Genetische und Evolutionäre Algorithmen (Vol. ) von Adam El Sayed Auf und Kai Lienemann Gliederung: ) Einführung 2) Grundkonzept 3) Genaue Beschreibung des Genetischen Algorithmus Lösungsrepräsentation
MehrWann sind Codes eindeutig entschlüsselbar?
Wann sind Codes eindeutig entschlüsselbar? Definition Suffix Sei C ein Code. Ein Folge s {0, 1} heißt Suffix in C falls 1 c i, c j C : c i = c j s oder 2 c C und einen Suffix s in C: s = cs oder 3 c C
MehrÜbungsblatt 5 - Musterlösung
Universität Mannheim Lehrstuhl für Praktische Informatik IV Prof. Dr. W. Effelsberg Christoph Kuhmünch, Gerald Kühne Praktische Informatik II SS 2000 Übungsblatt 5 - Musterlösung Aufgabe 1: Huffman-Codierung
MehrAlgorithmen und Datenstrukturen 2
Algorithmen und Datenstrukturen 2 Sommersemester 2007 11. Vorlesung Peter F. Stadler Universität Leipzig Institut für Informatik studla@bioinf.uni-leipzig.de Das Rucksack-Problem Ein Dieb, der einen Safe
MehrAlgorithmen und Komplexität Teil 1: Grundlegende Algorithmen
Algorithmen und Komplexität Teil 1: Grundlegende Algorithmen WS 08/09 Friedhelm Meyer auf der Heide Vorlesung 11, 18.11.08 Friedhelm Meyer auf der Heide 1 Randomisierte Algorithmen Friedhelm Meyer auf
MehrAlgorithmen und Datenstrukturen
Algorithmen und Datenstrukturen Wintersemester 2013/14 1. Vorlesung Kapitel 1: Sortieren Prof. Dr. Alexander Wolff Lehrstuhl für Informatik I Das Problem Eingabe Gegeben: eine Folge A = a 1, a 2,..., a
MehrAlgorithmen für schwierige Probleme
Algorithmen für schwierige Probleme Britta Dorn Wintersemester 2011/12 30. November 2011 Wiederholung Baumzerlegung G = (V, E) Eine Baumzerlegung von G ist ein Paar {X i i V T }, T, wobei T Baum mit Knotenmenge
MehrStud.-Nummer: Datenstrukturen & Algorithmen Seite 1
Stud.-Nummer: Datenstrukturen & Algorithmen Seite 1 Aufgabe 1. / 15 P Hinweise: 1) In dieser Aufgabe sollen Sie nur die Ergebnisse angeben. Diese können Sie direkt bei den Aufgaben notieren. 2) Sofern
Mehr1 Kürzeste Pfade in Graphen
Praktikum Algorithmen-Entwurf (Teil 3) 03.11.2011 1 1 Kürzeste Pfade in Graphen Es sei ein gerichteter Graph G = (V, E) mit V = n Knoten, E = m Kanten und Kantengewichten c : E R gegeben. Ein Pfad in G
Mehr6.5 Konstruktion und Zufallserzeugung von Repräsentanten
274 6.5 Konstruktion und Zufallserzeugung von Repräsentanten Hat man mit Hilfe einer Bahnenabzählung eine Übersicht über die Anzahl unnumerierter Strukturen, wie z.b. unnumerierter Graphen mit n Punkten,
MehrDot-Matrix Methode. (Java) (Javascript) 80
Dot-Matrix Methode Vergleich zweier Sequenzen (DNA oder Aminosäuren) Idee: gleiche Basen (Aminosäuren) in x-y Diagramm markieren Sequenz 1: ADRWLVKQN Sequenz 2: ADKFIVRDE http://myhits.vital-it.ch/cgi-bin/dotlet
MehrKryptografische Hashfunktionen
Kryptografische Hashfunktionen Andreas Spillner Kryptografie, SS 2018 Wo verwenden wir kryptografische Hashfunktionen? Der Hashwert H(x) einer Nachricht x wird oft wie ein Fingerabdruck von x vewendet.
Mehr1 Grundprinzipien statistischer Schlußweisen
Grundprinzipien statistischer Schlußweisen - - Grundprinzipien statistischer Schlußweisen Für die Analyse zufallsbehafteter Eingabegrößen und Leistungsparameter in diskreten Systemen durch Computersimulation
Mehr3 Klassifikation wichtiger Optimierungsprobleme
3 Klassifikation wichtiger Optimierungsprobleme 3.1 Das MIN- -TSP Wir kehren nochmal zurück zum Handlungsreisendenproblem für Inputs (w {i,j} ) 1 i
MehrRanking by Reordering Tobias Joppen
Ranking by Reordering Tobias Joppen 09.07.2014 Fachbereich Informatik Knowledge Engineering Prof. Johannes Fürnkranz 1 Überblick Einleitung Rank-differential Methode Idee Problemdefinition Beispiel Vereinfachung
MehrSequenzvergleiche ohne Alignments durch lokales Dekodieren von Sequenzen
durch lokales Dekodieren von Sequenzen (16. Juli 2007) Inhalt 1 Grundidee 2 Naiver Algorithmus Definitionen Lokales N-Dekodieren Ermittlung der Distanzmatrix Aussagefähigkeit der Distanzen 3 Verbesserungen
MehrAlgorithmen und Datenstrukturen in der Bioinformatik Drittes Übungsblatt WS 05/06 Musterlösung
Konstantin Clemens Johanna Ploog Freie Universität Berlin Institut für Mathematik II Arbeitsgruppe für Mathematik in den Lebenswissenschaften Algorithmen und Datenstrukturen in der Bioinformatik Drittes
Mehr