Bioinformatik: Neue Paradigmen in der Forschung
|
|
- August Lange
- vor 7 Jahren
- Abrufe
Transkript
1 Bioinformatik: Neue Paradigmen in der Forschung Sommerakademie der Studienstiftung St. Johann, Leitung: Proff. Ernst W. Mayr & Rolf Backofen Thema 4: Paarweises und multiples (heuristisches) Alignment Tobias Thierer Universität Tübingen Paarweises & multiples Alignment - Folie 1 / 33
2 Überblick Aufgabenstellung und Motivation Paarweises Alignment Bewertungsfunktion, statistisches Modell Lösung mit dynamischem Programmieren Multiple Alignments Progressiver vs. globaler Ansatz Bewertungsfunktionen Maximum Weight Trace Progessive Verfahren: CLUSTALW, T-Coffee sonstige Verfahren: dyn. Progr., Branch&Bound Universität Tübingen Paarweises & multiples Alignment - Folie 2 / 33
3 Alignment: informelle Definition Gegeben: k Sequenzen & eine Bewertungsfunktion. Gesucht: optimales Alignment der Sequenzen, so dass ähnliche bzw. identische Bereiche übereinanderstehen und möglichst wenige Lücken (gaps, ) eingefügt werden müssen. Teilfragen: Wie bewertet man die Qualität von Alignments? Wie bestimmt man ein optimales Alignment? ALIGNMENT ALIMENTE ALIGNMENT- ALI--MENTE Universität Tübingen Paarweises & multiples Alignment - Folie 3 / 33
4 Motivation: Wozu Alignment? Identifikation homologer DNA-/Proteinbereiche Bewertung des Alignments als Maß für den evolutionären Abstand der Sequenzen. Sequenzähnlichkeit impliziert oft strukturelle und funktionelle Ähnlichkeit Rückschlüsse auf Funktion bestimmter Gene oder Proteine. Hochkonservierte Sequenzbereiche kennzeichnen funktionell kritische Stellen. Universität Tübingen Paarweises & multiples Alignment - Folie 4 / 33
5 Überblick Aufgabenstellung und Motivation Paarweises Alignment Bewertungsfunktion, statistisches Modell Lösung mit dynamischem Programmieren Multiple Alignments Progressiver vs. globaler Ansatz Bewertungsfunktionen Maximum Weight Trace Progessive Verfahren: CLUSTALW, T-Coffee sonstige Verfahren: dyn. Progr., Branch&Bound Universität Tübingen Paarweises & multiples Alignment - Folie 5 / 33
6 Bewertung paarweiser Alignments Modell: einzelne Positionen der Sequenzen evolvieren unabhängig Gesamtbewertung als Summe der Bewertung einzelner alignierter Zeichen. = S ( x, y) s( xi, yi) i x,y: zu alignierende Sequenzen i: Positionen (Indizes) x i, y i : Zeichen an Pos. i in alignierten Sequenzen Wähle z.b. s(a,a) > 0; s(a,-) und s(a,b) < 0 Universität Tübingen Paarweises & multiples Alignment - Folie 6 / 33
7 Gute Bewertungsfunktion: woher? Betrachte relative Wahrsch. für Zeichenpaarung bei Homologie bzw. zufälligem Modell. P(a,b homolog) s *( a, b) = = P(a,b zufällig) pab pap Gesamtbewertung müsste Produkt der Einzelverhältnisse (odd ratios sein). Statt dessen: Logarithmieren und Aufsummieren (vermeidet Unterlauf durch sehr kleine Zahlen). S( x, y) = log i p pxip xiy i y i = i b pxiyi log pxip = : s( xi, yi) y i Universität Tübingen Paarweises & multiples Alignment - Folie 7 / 33
8 Bewertungsfunktion s( a, b) = log pab pap b P( a, b Homologie) = log P( a, b Zufall) Woher bekommen wir die Parameter p ab, p a, p b? Wähle 0 p a 1 als Auftretenshäufigkeit des Zeichens a im Gesamtpool (z.b. relative Häufigkeit einer bestimmten Base in einer Gendatenbank), p b analog. Definiere p ab über manuell erzeugte Alignments: In welchem Anteil der Fälle ist a mit b gepaart? Beachte: p ab hängt vom evolutionären Abstand ab; darum aus 1 Zeiteinheit evolvierten Sequenzen bestimmen. Universität Tübingen Paarweises & multiples Alignment - Folie 8 / 33 p ab = num( ab) num( ac) c
9 Beispiel: PAM-Matrizen Definiere eine Zeiteinheit als die Zeit, in der 1% erwartete Substitutionen auftreten. Tabelle enthalte die Wahrscheinlichkeiten p ab /p a = P(b a, t=1), dass a b in Zeit 1. Zeilensumme 1 Mit diesen p ab erstellte score-tabelle: PAM1 P( b a, t = 2) = P( b c, t = 1) P( c a, t = 1) c Matrixprodukt; Potenzierung für größere Zeiträume PAM250 enthält s(a,b t=250) = log (P(b a,t=250) / p b ) Universität Tübingen Paarweises & multiples Alignment - Folie 9 / 33
10 Lösung mit dynam. Programmieren Wir betrachten optimale Alignments A opt (i,j) für Präfixe x 1,..,i und y 1,..,j von x und y. Ist in A opt (i,j) x i mit y j aligniert, so ist auch das Teilalignment von x 1,..,i-1 mit y 1,..,j-1 optimal. Ist ina opt (i,j) x i mit gap aligniert, so ist auch das Teilalignment von x 1,..,i-1 mit y 1,..,j optimal. Entsprechend mit vertauschtem x,y. Beobachtung: ein optimales Alignment ist auf eine von drei Möglichkeiten aus einem optimalen Teilalignment abgeleitet. Wert neu = Wert alt + Wert der neuen Zeichen TEST -AST TSET TSA- TSA- TSET Universität Tübingen Paarweises & multiples Alignment - Folie 10 / 33
11 Lösung mit dynam. Programmieren Sei F(i,j) := S(A opt (i,j)) der maximale Wert eines Alignments von x 1,..,i mit y 1,..,j. Nach Überlegung gilt: F( i, F( i 1, j 1) + s( xi, yj) j) = max F( i 1, j) d F( i, j 1) d wobei d die Gapkosten sind und F(0,j)=F(i,0)=0 TEST -AST TSET TSA- TSA- TSET F(i,j) kann ausgehend von F(i,0) und F(0,j) sukzessive für alle i,j in jeweils konstanter Zeit berechnet werden. Universität Tübingen Paarweises & multiples Alignment - Folie 11 / 33
12 Needleman-Wunsch: Beispiel Matchscore s(a,a) = 1 Mismatch-/Gap-Kosten s(a, ) = s(a,b) = -1 Sequenzen x = AATGC, y = AGGC A A T G C A G -2 G -3 C -4 A A T G C A G G C opt. Alignments: AATGC AATGC AATGC AG-GC A-GGC -AGGC Universität Tübingen Paarweises & multiples Alignment - Folie 12 / 33
13 Alignment-Rekonstruktion A A T G C A G G C AATGC -AGGC A A T G C A G G C AATGC AG-GC Pfeilrichtung spezifiziert Alignment oder gap: A A A - - A Universität Tübingen Paarweises & multiples Alignment - Folie 13 / 33
14 Needleman-Wunsch: Fazit Der Wert des optimalen Alignments zweier Sequenzen x und y der Längen n und m kann in Zeit O(n*m) und Platz O(n*m) berechnet werden. Platzbedarf kann auf O(n+m) reduziert werden. Merken wir uns, aus welchem Teilalignment jeweils ein optimaler Wert erzielt wurde (Rückwärtspfeile), so können wir das Alignment in Zeit O(n+m) rekonstruieren. Universität Tübingen Paarweises & multiples Alignment - Folie 14 / 33
15 Lokale Alignments AGGCTATAATGAGA TAT-ATCTTAG Ein lokales Alignment ist das Alignment von Teilsequenzen (Bewertung des Optimums stets 0). Der bisherige Algorithmus kann leicht zur Berechnung lokaler Alignments modifiziert werden. Anfang des Alignments wählbar: Bewertung kann nie < 0 werden (sonst Alignment neu beginnen). Ende wählbar: max. Bewertung in der ganzen Tabelle suchen, nicht nur rechts unten. Universität Tübingen Paarweises & multiples Alignment - Folie 15 / 33
16 lokale Alignments: Beispiel F( i, 0 F( i 1, j 1) + s( xi, yj) j) = max F( i 1, j) d F( i, j 1) d A A T G C T A G G C (neu beginnen) (alignieren) (gap in y) (gap in x) AATGCT AGGC Vom max. Wert den Pfeilen bis zur 0 folgen. Universität Tübingen Paarweises & multiples Alignment - Folie 16 / 33
17 Dynamische Programmierung Der Ansatz kann auf vielfältige Art erweitert werden: affine Lückenkosten (verschiedene Kosten für Eröffnung und Erweiterung einer Lücke). Nichtbestrafen von Lücken am Anfang oder Ende des Alignments. Finden aller lokalen Alignments mit einem bestimmten Mindestwert.... Universität Tübingen Paarweises & multiples Alignment - Folie 17 / 33
18 Überblick Aufgabenstellung und Motivation Paarweises Alignment Bewertungsfunktion, statistisches Modell Lösung mit dynamischem Programmieren Multiple Alignments Progressiver vs. globaler Ansatz Bewertungsfunktionen Maximum Weight Trace Progessive Verfahren: CLUSTALW, T-Coffee sonstige Verfahren: dyn. Progr., Branch&Bound Universität Tübingen Paarweises & multiples Alignment - Folie 18 / 33
19 Multiple Alignments (MAs) Progressiver Ansatz MA aus Folge paarweiser Alignments. Einfach, schnell. greedy; neigen zu frühen Fehlern. Übernahme der Bewertungsfunktion Qualitätsaussagen bzgl. statistischer Modelle schwierig. Paralleler Ansatz Alle Sequenzen gleichzeitig alignieren. Komplizierter, großer Suchraum! Vorausschauend. Neue Bewertungsfunktionen nötig. Deckt sich besser mit stat. Modellen. Universität Tübingen Paarweises & multiples Alignment - Folie 19 / 33
20 Bewertungsfunktionen für MAs Idee 1: in Analogie zum paarweisen A. Summe über Bewertung von Spalten (k-tupeln): schwer parametrisierbar für jedes k eigene Tabelle nötig Idee 2: Spaltenbewertung als Summe aller Paarbewertungen s(a,b) (sum-of-pairs, SP- Score); wird verwendet, aber: optimale Lösung: NP-hart statistisch nicht gut abgesichert Universität Tübingen Paarweises & multiples Alignment - Folie 20 / 33
21 Coffee Bewertungsfunktion für multiple Alignments. Parametrisiert über eine Bibliothek von paarweisen Alignments der Sequenzen. Hohe Bewertung für Alignments, die besonders stark von den paarweisen Alignments unterstützt werden (Anteil der der auch im paarw. Alignment alignierten Positionspaare). Paarweises Alignment wird gewichtet mit dem Anteil perfekter Matches darin. Universität Tübingen Paarweises & multiples Alignment - Folie 21 / 33
22 Coffee CoffeeScore( Sˆ) = 1 i< j k w( i,j) support( i,j) 1 i< j k w( i,j) len( i,j) support(i,j): Anteil alignierter Positionspaare im MA, die vom paarweisen Alignment unterstützt werden. w(i,j): Gewicht des Paaralignments (% Identität) len(i,j): Länge der Sequenzen i und j im MA. Hochkonservierte Positionen erhalten höheres Gewicht Mismatch dort wird stärker bestraft. Lückenkosten schon im paarw. Alignment enthalten. Universität Tübingen Paarweises & multiples Alignment - Folie 22 / 33
23 Maximum Weight Trace Problem des optimalen multiplen Alignments kann als Graphenproblem aufgefasst werden. k-partiter Graph; jede Position in einer Sequenz entspricht einem Knoten. Kanten zwischen Positionen unterschiedlicher Sequenzen beschriftet mit Alignierungsscore. Dieser hängt von den Positionen (Coffee) oder nur von den Zeichen (SP-Score) ab. Diese sind also Spezialfälle des Max. Weight Trace. T A G... T T A T A Universität Tübingen Paarweises & multiples Alignment - Folie 23 / 33
24 Maximum Weight Trace Ein Alignment entspricht einer Teilmenge der Kanten des Graphen. Aber: nicht jede Menge von Kanten entspricht einem Alignment (Alignierung mit zwei verschiedenen Positionen einer Sequenz unmöglich). Kantenmenge, die gültiges Alignment ist: Trace. Gesucht: Trace mit maximalem Kantengewicht. Lösungsansätze: später Universität Tübingen Paarweises & multiples Alignment - Folie 24 / 33
25 Progressiver Ansatz: CLUSTALW Berechne alle n(n-1)/2 Paardistanzen. Schätze die Anzahl der (unsichtbaren) Mehrfachmutationen und somit den tatsächlichen evolutionären Abstand aller Sequenzpaare. Fasse jeweils das Paar mit der geringsten Distanz zusammen. Es entsteht ein Leitbaum (guide tree). Führe die Alignments von den Blättern zur Wurzel des Baums durch. Universität Tübingen Paarweises & multiples Alignment - Folie 25 / 33
26 Progressiver Ansatz: CLUSTALW Verschmelzung von (i,j) zu k: k neue Distanzen sind d km := 1/2 (d im + d jm -d ij ) i j m Paarungen von Sequenz-Sequenz, Alignment- Sequenz und Alignment-Alignment. Alignment von Sequenz-Sequenz wie gehabt. Für Sequenz-Alignment und Alignment- Alignment: das Paaralignment mit der höchsten Wertung bestimmt das Alignment. Universität Tübingen Paarweises & multiples Alignment - Folie 26 / 33
27 zu gierig und kurzsichtig? Universität Tübingen Paarweises & multiples Alignment - Folie 27 / 33
28 Progressiver Ansatz: T-Coffee Ähnlich zu CLUSTALW, aber Parametrisiert über Bibliothek von globalen und lokalen paarweisen Alignments. Alignierungskosten positions-, nicht zeichenspezifisch (also wie bei Coffee). Alignierungskosten von Positionspaar hängen ab von der Unterstützung dieser Alignierung in der gesamten Bibliothek:» Unterstützung durch paarweises Alignment (a,b)» Unterstützung durch indirekte paarweise Alignments (a,c) (c,b) Universität Tübingen Paarweises & multiples Alignment - Folie 28 / 33
29 T-Coffee: Bibliothekserweiterung Universität Tübingen Paarweises & multiples Alignment - Folie 29 / 33
30 Dynamische Programmierung Ansatz mit dyn. Programmierung kann auf multiples Alignment verallgemeinert werden. Für jede Zahl k von Sequenzen eigene Bewertungsmatrix (Größe k²) nötig. k² Parameter müssen statistisch abgesichert geschätzt werden. Für k Sequenzen der Länge n: Laufzeit O(2 k n k ) Speicherbedarf O(n k ) Alles in allem nicht praktikabel. Universität Tübingen Paarweises & multiples Alignment - Folie 30 / 33
31 Branch&Bound für Max. Weight Trace Graph: Knoten entspricht Position, Kante Alignierung, Kantengewicht Alignierungsscore. Ziel: Alignment (Kantenmenge) mit maximalem Gesamtgewicht auswählen. Beschreibung als integer linear program: Für jede Kante eine Variable (Wert 0 oder 1). Ungleichungen, die ungültige Kantenmengen ausschließen. T A G... T T A T A Universität Tübingen Paarweises & multiples Alignment - Folie 31 / 33
32 Branch&Bound für Max. Weight Trace Menge der gültigen Kantenmengen ist konvexer Körper (trace polytope) im [0,1] k Jede Ungleichung ist Ebene; einige davon schränken den Lösungsraum ein möglichst wenige Ungleichungen auswählen, die noch reichen Test: verletzt unvollständige Lösung Ungleichungen? rekursive Lösung mit Branch&Bound nacheinander Variablenbelegungen probieren, jeweils Gleichungssystem zu lösen versuchen. Suchbaum beschneiden, soweit möglich Universität Tübingen Paarweises & multiples Alignment - Folie 32 / 33
33 Ende Danke fürs Zuhören! Universität Tübingen Paarweises & multiples Alignment - Folie 33 / 33
Bioinformatik: Neue Paradigmen in der Forschung Sommerakademie der Studienstiftung
Bioinformatik: Neue Paradigmen in der Forschung Sommerakademie der Studienstiftung Thema 4: Paarweises und multiples (heuristisches) Alignment Tobias Thierer (mail@tobias-thierer.de) St. Johann, 1.-14.9.2002
MehrMultiple Alignments. Vorlesung Einführung in die Angewandte Bioinformatik Prof. Dr. Sven Rahmann. Webseite zur Vorlesung
Multiple Alignments Vorlesung Einführung in die Angewandte Bioinformatik Prof. Dr. Sven Rahmann Webseite zur Vorlesung http://bioinfo.wikidot.com/ Sprechstunde Mo 16-17 in OH14, R214 Sven.Rahmann -at-
MehrBioinformatik. Lokale Alignierung Gapkosten. Silke Trißl / Ulf Leser Wissensmanagement in der. Bioinformatik
Bioinformatik Lokale Alignierung Gapkosten Silke Trißl / Ulf Leser Wissensmanagement in der Bioinformatik Inhalt dieser Vorlesung Ähnlichkeit Lokales und globales Alignment Gapped Alignment Silke Trißl:
MehrAlgorithmen auf Sequenzen
Algorithmen auf Sequenzen Vorlesung von Prof. Dr. Sven Rahmann im Sommersemester 2008 Kapitel 6 Alignments Webseite zur Vorlesung http://ls11-www.cs.tu-dortmund.de/people/rahmann/teaching/ss2008/algorithmenaufsequenzen
MehrAlgorithmen und Datenstrukturen in der Bioinformatik Zweites Übungsblatt WS 05/06 Musterlösung
Johanna Ploog, Konstantin Clemens Freie Universität Berlin Institut für Mathematik II Arbeitsgruppe für Mathematik in den Lebenswissenschaften Algorithmen und Datenstrukturen in der Bioinformatik Zweites
MehrAlgorithmen für paarweise Sequenz-Alignments. Katharina Hembach
Proseminar Bioinformatik WS 2010/11 Algorithmen für paarweise Sequenz-Alignments Katharina Hembach 06.12.2010 1 Einleitung Paarweise Sequenz-Alignments spielen in der Bioinformatik eine wichtige Rolle.
MehrAnwendungen dynamischer Programmierung in der Biologie
Anwendungen dynamischer Programmierung in der Biologie Überblick Algorithmus zum Finden der wahrscheinlichsten Sekundärstruktur eines RNS Moleküls Sequence Alignment Verbesserung von Sequence Alignment
MehrAufgabenblatt 5. Silke Trißl Wissensmanagement in der Bioinformatik
Aufgabenblatt 5 Silke Trißl Wissensmanagement in der Bioinformatik Zuerst! FRAGEN? Silke Trißl: Bioinformatik für Biophysiker 2 Exercise 1 + 2 Modify program to compare protein sequence read substitution
MehrAlgorithmische Anwendungen WS 2005/2006
Algorithmische Anwendungen WS 2005/2006 Sequenzalignment Gruppe F_lila_Ala0506 Allal Kharaz Yassine ELassad Inhaltsverzeichnis 1 Problemstellungen...................................... 3 1.1 Rechtschreibkorrektur...............................
MehrSequenzen-Alignierung in der Bioinformatik. VO Algorithm Engineering Professor Dr. Petra Mutzel Lehrstuhl für Algorithm Engineering, LS11
Sequenzen-Alignierung in der Bioinformatik VO Algorithm Engineering Professor Dr. Petra Mutzel Lehrstuhl für Algorithm Engineering, LS11 23. VO 24.01.2006 1 1 Literatur für diese VO Volker Heun: Skriptum
MehrKapitel 7: Sequenzen- Alignierung in der Bioinformatik
Kapitel 7: Sequenzen- Alignierung in der Bioinformatik 7.3: Paarweise Sequenzen-Alignierung 7.4: Multiple Sequenzen Alignierung VO Algorithm Engineering Professor Dr. Petra Mutzel Lehrstuhl für Algorithm
MehrPairwise Alignment. Steffen Forkmann. Proseminar: BioInformatik
Pairwise Alignment Steffen Forkmann Proseminar: BioInformatik Wintersemester 2004/2005 Inhaltsverzeichnis 1 Problemstellungen 3 1.1 Rechtschreibkorrektur............................... 3 1.2 DNA- und Aminosäure-Sequenzen........................
MehrAlgorithmische Bioinformatik
Algorithmische Bioinformatik Effiziente Berechnung des Editabstands Dynamische Programmierung Ulf Leser Wissensmanagement in der Bioinformatik Inhalt dieser Vorlesung Rekursive Definition des Editabstands
MehrZentrum für Bioinformatik. Übung 4: Revision. Beispielfragen zur Klausur im Modul Angewandte Bioinformatik (erste Semesterhälfte)
Andrew Torda Björn Hansen Iryna Bondarenko Zentrum für Bioinformatik Übung zur Vorlesung Angewandte Bioinformatik Sommersemester 2014 20./23.06.2014 Übung 4: Revision Beispielfragen zur Klausur im Modul
MehrEinführung in die Bioinformatik
Einführung in die Bioinformatik Ringvorlesung Biologie Sommer 07 Burkhard Morgenstern Institut für Mikrobiologie und Genetik Abteilung für Bioinformatik Goldschmidtstr. 1 Online Materialien zur Ringvorlesung:
MehrDatenstrukturen und Algorithmen (SS 2013)
Datenstrukturen und Algorithmen (SS 2013) Übungsblatt 10 Abgabe: Montag, 08.07.2013, 14:00 Uhr Die Übungen sollen in Gruppen von zwei bis drei Personen bearbeitet werden. Schreiben Sie die Namen jedes
MehrStudiengang Informatik der FH Gießen-Friedberg. Sequenz-Alignment. Jan Schäfer. WS 2006/07 Betreuer: Prof. Dr. Klaus Quibeldey-Cirkel
Studiengang Informatik der FH Gießen-Friedberg Sequenz-Alignment Jan Schäfer WS 2006/07 Betreuer: Prof. Dr. Klaus Quibeldey-Cirkel Überblick Einführung Grundlagen Wann ist das Merkmal der Ähnlichkeit erfüllt?
MehrDynamische Programmierung
Dynamische Programmierung Claudia Gerhold 9.5.6 Claudia Gerhold Dynamische Programmierung 9.5.6 / 4 Agenda Einführung Dynamische Programmierung Top-Down Ansatz mit Memoization Bottom-Up Ansatz 3 Anwendungsbeispiele
MehrEffiziente Algorithmen und Komplexitätstheorie
Fakultät für Informatik Lehrstuhl 2 Vorlesung Effiziente Algorithmen und Komplexitätstheorie Sommersemester 2008 Ingo Wegener Ingo Wegener 03. Juli 2008 1 Sequenzanalyse Hauptproblem der Bioinformatik
MehrAlgorithmen und Datenstrukturen in der Bioinformatik Drittes Übungsblatt WS 05/06 Musterlösung
Konstantin Clemens Johanna Ploog Freie Universität Berlin Institut für Mathematik II Arbeitsgruppe für Mathematik in den Lebenswissenschaften Algorithmen und Datenstrukturen in der Bioinformatik Drittes
MehrAlgorithmen auf Sequenzen Paarweiser Sequenzvergleich: Alignments
Algorithmen auf Sequenzen Paarweiser Sequenzvergleich: Alignments Sven Rahmann Genominformatik Universitätsklinikum Essen Universität Duisburg-Essen Universitätsallianz Ruhr Einführung Bisher: Berechnung
MehrSequenzen-Alignierung in der Bioinformatik
Sequenzen-Alignierung in der Bioinformatik VO Algorithm Engineering Professor Dr. Petra Mutzel Lehrstuhl für Algorithm Engineering, LS 2. VO 2.0.2006 Literatur für diese VO Volker Heun: Skriptum zur Vorlesung
MehrAlgorithmische Bioinformatik 1
Algorithmische Bioinformatik 1 Dr. Hanjo Täubig Lehrstuhl für Effiziente Algorithmen (Prof. Dr. Ernst W. Mayr) Institut für Informatik Technische Universität München Sommersemester 2009 Übersicht Paarweises
MehrBioinformatik. Substitutionsmatrizen BLAST. Ulf Leser Wissensmanagement in der. Bioinformatik
Bioinformatik Substitutionsmatrizen BLAST Ulf Leser Wissensmanagement in der Bioinformatik Inhalt dieser Vorlesung Substitutionsmatrizen: PAM und BLOSSUM Suche in Datenbanken: Basic Local Alignment Search
MehrBayesianische Netzwerke - Lernen und Inferenz
Bayesianische Netzwerke - Lernen und Inferenz Manuela Hummel 9. Mai 2003 Gliederung 1. Allgemeines 2. Bayesianische Netzwerke zur Auswertung von Genexpressionsdaten 3. Automatische Modellselektion 4. Beispiel
Mehr23. November Betweenness Centrality Closeness Centrality. H. Meyerhenke: Algorithmische Methoden zur Netzwerkanalyse 108
23. November 2011 Betweenness Centrality Closeness Centrality H. Meyerhenke: Algorithmische Methoden zur Netzwerkanalyse 108 Betweenness Centrality Grundlegende Idee: Ein Knoten ist wichtig, wenn er auf
MehrAlgorithmen und Komplexität Lösungsvorschlag zu Übungsblatt 8
ETH Zürich Institut für Theoretische Informatik Prof. Dr. Angelika Steger Florian Meier, Ralph Keusch HS 2017 Algorithmen und Komplexität Lösungsvorschlag zu Übungsblatt 8 Lösungsvorschlag zu Aufgabe 1
MehrGleichheit, Ähnlichkeit, Homologie
Gleichheit, Ähnlichkeit, Homologie Identität (identity) Verhältnis der Anzahl identischer Aminosäuren zur Gesamtzahl der Aminosäuren; objektiv Ähnlichkeit (similarity) Verhältnis ähnlicher Aminosäuren
MehrBioinformatik für Lebenswissenschaftler
Bioinformatik für Lebenswissenschaftler Oliver Kohlbacher, Steffen Schmidt SS 2010 10. Multiples Alignment II & PSI-BLAST Abt. Simulation biologischer Systeme WSI/ZBIT, Eberhard Karls Universität Tübingen
MehrBioinformatik für Biochemiker
Bioinformatik für Biochemiker Oliver Kohlbacher WS 2009/2010 9. Multiples Alignment II Abt. Simulation biologischer Systeme WSI/ZBIT, Eberhard Karls Universität Tübingen Übersicht T-COFFEE Probleme bei
MehrÜbungsaufgaben zur Einführung in die Bioinformatik - Lösungen
18.01.2013 Prof. P. Güntert 1 Vorlesung BPC I: Aspekte der Thermodynamik in der Strukturbiologie Übungsaufgaben zur Einführung in die Bioinformatik - Lösungen 1. Hamming und Levenshtein Distanzen a) Was
MehrPraktikum Algorithmischen Anwendungen WS 2006/07 Bioinformatik Sequence-Aligment Team C rot Ala0607
Praktikum Algorithmischen Anwendungen WS 2006/07 Bioinformatik Sequence-Aligment Team C rot Ala0607 Blöink, Frank 11038619 ai600@gm.fh-koeln.de Wolters, Benjamin 11037092 ai651@gm.fh-koeln.de 26. Januar
MehrFOLDALIGN und sein Algorithmus. Nadine Boley Silke Szymczak
FOLDALIGN und sein Algorithmus Nadine Boley Silke Szymczak Gliederung 2 Einleitung Motivation des Ansatzes zu FOLDALIGN Sankoff-Algorithmus Globales Alignment Zuker-Algorithmus Kombination FOLDALIGN Algorithmus,
MehrProblemseminar. Multiple alignment by sequence annealing. Ariel S. Schwartz and Lior Pachter
Problemseminar Multiple alignment by sequence annealing Ariel S. Schwartz and Lior Pachter 0.Gliederung 1.Alignment posets Gliederung 1. Einführung 2. Alignment Posets 1. Einführung Progressives Alignment
Mehr5. Bäume und Minimalgerüste
5. Bäume und Minimalgerüste Charakterisierung von Minimalgerüsten 5. Bäume und Minimalgerüste Definition 5.1. Es ein G = (V, E) ein zusammenhängender Graph. H = (V,E ) heißt Gerüst von G gdw. wenn H ein
MehrADS: Algorithmen und Datenstrukturen 2
ADS: Algorithmen und Datenstrukturen 2 Teil 4 Prof. Dr. Gerhard Heyer Institut für Informatik Abteilung Automatische Sprachverarbeitung Universität Leipzig 24. April 2019 [Letzte Aktualisierung: 24/04/2019,
MehrInformatik II, SS 2016
Informatik II - SS 2016 (Algorithmen & Datenstrukturen) Vorlesung 22 (20.7.2016) Greedy Algorithmen - Datenkompression Algorithmen und Komplexität Greedy Algorithmen Greedy Algorithmen sind eine Algorithmenmethode,
MehrBioinformatik. Alignment mit linearem Platzbedarf K-Band Alignment. Ulf Leser Wissensmanagement in der. Bioinformatik
Bioinformatik Alignment mit linearem Platzbedarf K-Band Alignment Ulf Leser Wissensmanagement in der Bioinformatik Ankündigungen Gastvortrag: Morgen Dr. Klein, Metanomics GmbH Bioinformatik in der Pflanzengenomik
MehrNash-Gleichgewichte in 2-Spieler Systemen. Katharina Klost Freie Universität Berlin
Nash-Gleichgewichte in 2-Spieler Systemen Katharina Klost Freie Universität Berlin Seminar über Algorithmen, 29.10.2013 Grundlegende Definitionen A Gewinnmatrix für Spieler 1, B Gewinnmatrix für Spieler
MehrDatenstrukturen & Algorithmen
Datenstrukturen & Algorithmen Matthias Zwicker Universität Bern Frühling 2010 Übersicht Dynamische Programmierung Einführung Ablaufkoordination von Montagebändern Längste gemeinsame Teilsequenz Optimale
MehrBioinformatik Für Biophysiker
Bioinformatik Für Biophysiker Sommersemester 2009 Silke Trißl / Ulf Leser Wissensmanagement in der Bioinformatik Wissensmanagement in der Bioinformatik Schwerpunkte Algorithmen der Bioinformatik Management
MehrADS: Algorithmen und Datenstrukturen 2
ADS: Algorithmen und Datenstrukturen 2 Teil 6 Prof. Dr. Gerhard Heyer Institut für Informatik Abteilung Automatische Sprachverarbeitung Universität Leipzig 16. Mai 2018 [Letzte Aktualisierung: 18/05/2018,
MehrEffiziente Algorithmen I
9. Präsenzaufgabenblatt, WiSe 2013/14 Übungstunden am 13.01. & 15.01.2014 Aufgabe Q Gegeben sei ein Fluss-Netzwerk mit Digraph D = (V, A), Knotenkapazitäten c(u, v) 0, Quelle s und Senke t. Kann sich der
Mehr3.3 Optimale binäre Suchbäume
3.3 Optimale binäre Suchbäume Problem 3.3.1. Sei S eine Menge von Schlüsseln aus einem endlichen, linear geordneten Universum U, S = {a 1,,...,a n } U und S = n N. Wir wollen S in einem binären Suchbaum
MehrMBI: Sequenz-Vergleich mit Alignment
MBI: Sequenz-Vergleich mit Alignment Bernhard Haubold 28. Oktober 2014 Wiederholung: Was ist Bioinformatik? Historische Übersicht; CABIOS Bioinformatics Gemeinsames Thema: Information in vivo DNA Epigenetik
MehrWiederholung. Divide & Conquer Strategie
Wiederholung Divide & Conquer Strategie Binäre Suche O(log n) Rekursives Suchen im linken oder rechten Teilintervall Insertion-Sort O(n 2 ) Rekursives Sortieren von a[1..n-1], a[n] Einfügen von a[n] in
MehrSequenz Alignment Teil 2
Sequenz Alignment Teil 2 14.11.03 Vorlesung Bioinformatik 1 Molekulare Biotechnologie Dr. Rainer König Besonderen Dank an Mark van der Linden, Mechthilde Falkenhahn und der Husar Biocomputing Service Gruppe
MehrAlgorithmen und Datenstrukturen 2
Algorithmen und Datenstrukturen 2 Sommersemester 2007 11. Vorlesung Peter F. Stadler Universität Leipzig Institut für Informatik studla@bioinf.uni-leipzig.de Das Rucksack-Problem Ein Dieb, der einen Safe
MehrProjektgruppe. Text Labeling mit Sequenzmodellen
Projektgruppe Enes Yigitbas Text Labeling mit Sequenzmodellen 4. Juni 2010 Motivation Möglichkeit der effizienten Verarbeitung von riesigen Datenmengen In vielen Bereichen erwünschte automatisierte Aufgabe:
MehrTheoretische Informatik. Exkurs: Komplexität von Optimierungsproblemen. Optimierungsprobleme. Optimierungsprobleme. Exkurs Optimierungsprobleme
Theoretische Informatik Exkurs Rainer Schrader Exkurs: Komplexität von n Institut für Informatik 13. Mai 2009 1 / 34 2 / 34 Gliederung Entscheidungs- und Approximationen und Gütegarantien zwei Greedy-Strategien
MehrEinführung in die Angewandte Bioinformatik: Algorithmen und Komplexität; Multiples Alignment und
Einführung in die Angewandte Bioinformatik: Algorithmen und Komplexität; Multiples Alignment 04.06.2009 und 18.06.2009 Prof. Dr. Sven Rahmann 1 Zwischenspiel: Algorithmik Bisher nebenbei : Vorstellung
MehrAlgorithmen und Datenstrukturen 2
Algorithmen und Datenstrukturen 2 Lerneinheit 3: Greedy Algorithmen Prof. Dr. Christoph Karg Studiengang Informatik Hochschule Aalen Sommersemester 2016 10.5.2016 Einleitung Einleitung Diese Lerneinheit
MehrAlgorithmen und Datenstrukturen 2
Algorithmen und Datenstrukturen 2 Sommersemester 2009 11. Vorlesung Uwe Quasthoff Universität Leipzig Institut für Informatik quasthoff@informatik.uni-leipzig.de Das Rucksack-Problem Ein Dieb, der einen
MehrBioinformatik für Biochemiker
Bioinformatik für Biochemiker Oliver Kohlbacher WS 2009/2010 9. Multiples Alignment II Abt. Simulation biologischer Systeme WSI/ZBIT, Eberhard Karls Universität Tübingen Übersicht T-OFFEE Probleme bei
MehrAufgabenblatt 4. Silke Trißl Wissensmanagement in der Bioinformatik
Aufgabenblatt 4 Silke Trißl Wissensmanagement in der Bioinformatik Zuerst! FRAGEN? Silke Trißl: Bioinformatik für Biophysiker 2 Exercise 1 Global alignment using dynamic programming Write a program to
MehrKapitel 9: Lineare Programmierung Gliederung
Gliederung 1. Grundlagen 2. Zahlentheoretische Algorithmen 3. Sortierverfahren 4. Ausgewählte Datenstrukturen 5. Dynamisches Programmieren 6. Graphalgorithmen 7. String-Matching 8. Kombinatorische Algorithmen
MehrVorlesung 4 BETWEENNESS CENTRALITY
Vorlesung 4 BETWEENNESS CENTRALITY 101 Aufgabe! Szenario: Sie arbeiten bei einem sozialen Online-Netzwerk. Aus der Netzwerk-Struktur Ihrer Benutzer sollen Sie wichtige Eigenschaften extrahieren. [http://www.fahrschule-vatterodt.de/
MehrInformatik II, SS 2018
Informatik II - SS 2018 (Algorithmen & Datenstrukturen) Vorlesung 21 (11.7.2018) String Matching (Textsuche) II Greedy Algorithmen I Algorithmen und Komplexität Textsuche / String Matching Gegeben: Zwei
MehrAlgorithmische Bioinformatik 1
Algorithmische Bioinformatik 1 Dr. Hanjo Täubig Lehrstuhl für Effiziente Algorithmen (Prof. Dr. Ernst W. Mayr) Institut für Informatik Technische Universität München Sommersemester 2009 Übersicht Algorithmen
MehrAnwendungsbeispiel: MTO
Anwendungsbeispiel MAXIMUM TREE ORIENTATION Universität Ulm 16. November 211 Inhaltsverzeichnis 1 Problemvorstellungen 2 Motivation 3 Integer Linear Programming 4 Tiefenbeschränkter Suchbaum 5 Konfliktgraph
MehrFortgeschrittene Netzwerk- und Graph-Algorithmen
Fortgeschrittene Netzwerk- und Graph-Algorithmen Prof. Dr. Hanjo Täubig Lehrstuhl für Effiziente Algorithmen (Prof. Dr. Ernst W. Mayr) Institut für Informatik Technische Universität München Wintersemester
MehrÜbersicht. Aktivitäten-Auswahl-Problem. Greedy Algorithmen. Aktivitäten-Auswahl-Problem. Aktivitäten-Auswahl-Problem. Datenstrukturen & Algorithmen
Datenstrukturen & Algorithmen Übersicht Greedy Algorithmen Einführung Aktivitäten-Auswahl-Problem Huffman Codierung Matthias Zwicker Universität Bern Frühling 2009 2 Greedy Algorithmen Entwurfsstrategie
MehrPrimärstruktur. Wintersemester 2011/12. Peter Güntert
Primärstruktur Wintersemester 2011/12 Peter Güntert Primärstruktur Beziehung Sequenz Struktur Proteinsequenzen, Sequenzdatenbanken Sequenzvergleich (sequence alignment) Sequenzidentität, Sequenzhomologie
MehrSatz 324 Sei M wie oben. Dann gibt es für ein geeignetes k Konstanten c i > 0 und Permutationsmatrizen P i, i = 1,...
Satz 324 Sei M wie oben. Dann gibt es für ein geeignetes k Konstanten c i > 0 und Permutationsmatrizen P i, i = 1,..., k, so dass gilt M = k c i P i i=1 k c i = r. i=1 Diskrete Strukturen 7.1 Matchings
MehrProgrammierpraktikum Algorithm Engineering (FPT-Algorithmen) Einführung
Programmierpraktikum Algorithm Engineering (FPT-Algorithmen) Einführung Martin Holzer Ignaz Rutter 31. Oktober 2008 Ansätze für NP-schwere Probleme 2/28 Approximative Lösungen Average-Case- statt Worst-Case-Analyse
MehrÜbung 2 Algorithmen II
Yaroslav Akhremtsev, Demian Hespe yaroslav.akhremtsev@kit.edu, hespe@kit.edu Mit Folien von Michael Axtmann (teilweise) http://algo2.iti.kit.edu/algorithmenii_ws17.php - 0 Akhremtsev, Hespe: KIT Universität
MehrEinführung in die Bioinformatik Algorithmen zur Sequenzanalyse
Einführung in die Bioinformatik Algorithmen zur Sequenzanalyse!! Vorläufige Fassung, nur einzelne Abschnitte!!!! Enthält wahrscheinlich noch viele Fehler!!!! Wird regelmäßig erweitert und verbessert!!
MehrHidden-Markov-Modelle
Universität Potsdam Institut für Informatik Lehrstuhl Maschinelles Lernen Hidden-Markov-Modelle Tobias Scheffer Thomas Vanck Hidden-Markov-Modelle: Wozu? Spracherkennung: Akustisches Modell. Geschriebene
Mehr2. Woche Eindeutige Entschlüsselbarleit, Sätze von Kraft und McMillan, Huffmancodierung
2 Woche Eindeutige Entschlüsselbarleit, Sätze von Kraft und McMillan, Huffmancodierung 2 Woche: Eindeutige Entschlüsselbarleit, Sätze von Kraft und McMillan, Huffmancodierung 24/ 44 Zwei Beispiele a 0
MehrMethoden für den Entwurf von Algorithmen
Methoden für den Entwurf von Algorithmen Greedy Algorithmen: - Löse ein einfaches Optimierungsproblem durch eine Folge vernünftiger Entscheidungen. - Eine getroffene Entscheidung wird nie zurückgenommen.
MehrInformatik II, SS 2014
Informatik II SS 2014 (Algorithmen & Datenstrukturen) Vorlesung 20 (23.7.2014) All Pairs Shortest Paths, String Matching (Textsuche) Algorithmen und Komplexität Vorlesungsevaluation Sie sollten alle eine
MehrAlgorithmen und Datenstrukturen 2
Algorithmen und Datenstrukturen 2 Sommersemester 2006 9. Vorlesung Peter Stadler Universität Leipzig Institut für Informatik studla@bioinf.uni-leipzig.de Invertierte Listen Nutzung vor allem zur Textsuche
MehrSCHNITTERHALTUNG (SPEKTRALE APPROXIMATION)
Vorlesung 12 AUSDÜNNUNG VON GRAPHEN SCHNITTERHALTUNG (SPEKTRALE APPROXIMATION) 387 Wiederholung: Approximative Schnitterhaltung Ziel: Approximationsalgorithmus: A(S(G)) Ziele bei Eingabe eines dichten
MehrRelationen und DAGs, starker Zusammenhang
Relationen und DAGs, starker Zusammenhang Anmerkung: Sei D = (V, E). Dann ist A V V eine Relation auf V. Sei andererseits R S S eine Relation auf S. Dann definiert D = (S, R) einen DAG. D.h. DAGs sind
MehrVerbesserung der dotplot Methode
erbesserung der dotplot Methode binäre Information: "x" oder " " besser: "mehr" oder "weniger" ähnlich Gruppen von Aminosäuren mit ähnlichen Eigenschaften bilden bestes Alignment: optimiere Häufigkeit
Mehr9 Minimum Spanning Trees
Im Folgenden wollen wir uns genauer mit dem Minimum Spanning Tree -Problem auseinandersetzen. 9.1 MST-Problem Gegeben ein ungerichteter Graph G = (V,E) und eine Gewichtsfunktion w w : E R Man berechne
MehrNP-vollständige Probleme
Effiziente Algorithmen Lösen NP-vollständiger Probleme 256 NP-vollständige Probleme Keine polynomiellen Algorithmen, falls P NP. Viele wichtige Probleme sind NP-vollständig. Irgendwie müssen sie gelöst
MehrVorhersage der RNA-Sekundärstruktur
Vorhersage der RNA-Sekundärstruktur Andreas Spillner Bioinformatik, SS 2018 Primärstruktur vs. Sekundärstruktur Primärstruktur Sequenz der Buchstaben (bei RNA entspricht ein Buchstabe jeweils einer Nukleinsäure
MehrAlgorithmische Bioinformatik
FREIE UNIVERSITÄT BERLIN Fachbereich Mathematik und Informatik Institut für Informatik (WE 3) FU BERLIN Freie Universität Berlin FB Mathematik und Informatik, Institut für Informatik, Takustr. 9, D-14195
MehrRückblick: divide and conquer
Rückblick: divide and conquer pi = (xi,yi) } p å } ' }d(p,p) p ''=min(, ') F 0/0 p./95 weitere Algorithmentechniken Greedy-Algorithmen dynamische Programmierung Backtracking branch and bound Heuristiken
MehrAlgorithmische Methoden zur Netzwerkanalyse
Algorithmische Methoden zur Netzwerkanalyse Prof. Dr. Henning Meyerhenke Institut für Theoretische Informatik 1 KIT Henning Universität desmeyerhenke, Landes Baden-Württemberg Institutund für Theoretische
MehrOptimierung. Optimierung. Vorlesung 9 Lineare Programmierung & Kombinatorische Optimierung Fabian Kuhn
Optimierung Vorlesung 9 Lineare Programmierung & Kombinatorische Optimierung 1 Assignment Problem (Zuordnungsproblem) Gewichtetes Perfektes Bipartites Matching agents Costs tasks Weise jedem Agenten genau
MehrAufgaben und Lösungen für die Zweite Klausur zur Spieltheorie im HWS 2011, Universität Mannheim, Prof. Dr. C. Hertling
Aufgaben und Lösungen für die Zweite Klausur zur Spieltheorie im HWS 2011, 06.02.2012 Universität Mannheim, Prof. Dr. C. Hertling Name: Sitzplatznummer: Die Bearbeitungszeit für diese Klausur beträgt 90
MehrHeuristische Verfahren
Heuristische Verfahren Bei heuristischen Verfahren geht es darum in polynomieller Zeit eine Näherungslösung zu bekommen. Diese kann sehr gut oder sogar optimal sein, jedoch gibt es keine Garantie dafür.
MehrPolynomial Time Approximation Schemes for Euclidean Traveling Salesman Problems. Benjamin Thome
Polynomial Time Approximation Schemes for Euclidean Traveling Salesman Problems Benjamin Thome Gliederung Einleitung Definitionen ETSP in R 2 Der Algorithmus in R 2 ETSP in R d Idee Algorithmus für f R
MehrDas Problem des Handlungsreisenden
Seite 1 Das Problem des Handlungsreisenden Abbildung 1: Alle möglichen Rundreisen für 4 Städte Das TSP-Problem tritt in der Praxis in vielen Anwendungen als Teilproblem auf. Hierzu gehören z.b. Optimierungsprobleme
MehrAlgorithmen und Datenstrukturen (für ET/IT)
Algorithmen und Datenstrukturen (für ET/IT) Sommersemester 05 Dr. Tobias Lasser Computer Aided Medical Procedures Technische Universität München Programm heute Einführung Grundlagen von Algorithmen Grundlagen
MehrBioinformatik für Lebenswissenschaftler
Bioinformatik für Lebenswissenschaftler Oliver Kohlbacher, Steffen Schmidt SS 2010 06. Paarweises Alignment Teil II Abt. Simulation biologischer Systeme WSI/ZBIT, Eberhard Karls Universität Tübingen Übersicht
MehrAlgorithmische Bioinformatik
Algorithmische Bioinformatik Multiple Sequence Alignment Sum-of-pairs Score Center-Star Score Ulf Leser Wissensmanagement in der Bioinformatik Inhalt dieser Vorlesung Multiples Sequenzalignment Sum-Of-Pair
MehrAlgorithmen und Komplexität
Algorithmen und Komplexität Dynamische Programmierung Markus Ullrich Norbert Baum Fachbereich Informatik - IIb07 Hochschule Zittau/Görlitz 28. Mai 2009 1 / 29 Wie sieht es mit langen Ketten aus? A 1 A
MehrAlgorithmen auf Sequenzen
Algorithmen auf Sequenzen Fehlertolerante Mustersuche: Distanz- und Ähnlichkeitsmaße Sven Rahmann Genominformatik Universitätsklinikum Essen Universität Duisburg-Essen Universitätsallianz Ruhr Einführung
MehrApproximatives (2D-)Pattern-Matching
Approximatives (2D-)Pattern-Matching Hauptseminar AFS Florian Schüttler Fakultät für Informatik und Automatisierung TU Ilmenau 09.07.2010 Inhalt 1 2 3 4 Florian Schüttler Approximatives (2D-)Pattern-Matching
MehrRotation. y T 3. Abbildung 3.10: Rotation nach rechts (analog links) Doppelrotation y
Die AVL-Eigenschaft soll bei Einfügungen und Streichungen erhalten bleiben. Dafür gibt es zwei mögliche Operationen: -1-2 Rotation Abbildung 3.1: Rotation nach rechts (analog links) -2 +1 z ±1 T 4 Doppelrotation
MehrVorkurs Informatik WiSe 16/17
Institut für Programmierung Konzepte der Informatik Dr. Werner Struckmann / Stephan Mielke, Jakob Garbe, 12.10.2016 Technische Universität Braunschweig, IPS Inhaltsverzeichnis Schilda-Rallye Was steckt
Mehr2. Klausur Datenstrukturen und Algorithmen SS 2014
Prof. aa Dr. E. Ábrahám F. Corzilius, S. Schupp, T. Ströder 2. Klausur Datenstrukturen und Algorithmen SS 2014 Vorname: Nachname: Studiengang (bitte genau einen markieren): Informatik Bachelor Informatik
MehrAlgorithmische Geometrie: Delaunay Triangulierung (Teil 2)
Algorithmische Geometrie: Delaunay Triangulierung (Teil 2) Nico Düvelmeyer WS 2009/2010, 2.2.2010 Überblick 1 Delaunay Triangulierungen 2 Berechnung der Delaunay Triangulierung Randomisiert inkrementeller
MehrPerlen der Informatik I Wintersemester 2012 Aufgabenblatt 7
Technische Universität München WS 2012 Institut für Informatik Prof. Dr. H.-J. Bungartz Prof. Dr. T. Huckle Prof. Dr. M. Bader Kristof Unterweger Perlen der Informatik I Wintersemester 2012 Aufgabenblatt
MehrAlgorithmen I. Tutorium Sitzung. Dennis Felsing
Algorithmen I Tutorium 1-12. Sitzung Dennis Felsing dennis.felsing@student.kit.edu www.stud.uni-karlsruhe.de/~ubcqr/algo 2011-07-04 Überblick 1 Dynamische Programmierung Idee Längste gemeinsame Teilfolge
Mehr