Multiple Alignments. Vorlesung Einführung in die Angewandte Bioinformatik Prof. Dr. Sven Rahmann. Webseite zur Vorlesung
|
|
- Kathrin Müller
- vor 6 Jahren
- Abrufe
Transkript
1 Multiple Alignments Vorlesung Einführung in die Angewandte Bioinformatik Prof. Dr. Sven Rahmann Webseite zur Vorlesung Sprechstunde Mo in OH14, R214 Sven.Rahmann -at- tu-dortmund.de 1 Bioinformatik für Hochdurchsatztechnologien
2 Multiple Alignments Bisher: Betrachtung von paarweisen Alignments, Vergleich von 2 Sequenzen Definition Ein multiples Alignment ist ein Alignment von mindestens 2, in der Regel aber mindestens 3 Sequenzen. Jede Zeile eines multiplen Alignments entspricht (durch Weglassen der Gaps) einer der Sequenzen. In einem Alignment aus k Sequenzen kann jede Spalte 0 bis k-1 Gap-Zeichen enthalten. Motivation Möchte alle Mitglieder einer Proteinfamilie auf einmal betrachten, ihre Gemeinsamkeiten und Unterschiede auf einen Blick sehen Homologe Positionen (evolutionär aus derselben Position hervorgegangene) werden in einem multiplen Alignment besser sichtbar. Drei paarweise Alignments von drei Sequenzen können inkonsistent sein: a mit b aligniert, b mit c, aber a nicht mit c. In einem multiplen Alignment kann das nicht passieren. 2 Bioinformatik für Hochdurchsatztechnologien
3 Beispiel: Proteindomänen Proteine bestehen häufig aus mehreren funktionalen Abschnitten, sog. Domänen. Domänen sind wiederkehrende modulare Bausteine von Proteinen. Durch verschiedene Kombinationen von Domänen entstehen Proteine mit unterschiedlichen Eigenschaften. Ein Ziel der Bioinformatik ist es, in der Natur auftretende Domänen zu charakterisieren. Beschreibung von Domänen Eine Domäne kann durch ihre Aminosäuresequenz-Zusammensetzung beschrieben werden (Konsensus + Variationsmöglichkeiten), oder durch ein multiples Alignment aus bekannten Beispiel-Sequenzen, oder durch ein statistisches Modell (Hidden-Markov Model, HMM). Datenbanken zu Domänen Die pfam Datenbank: Die SMART Datenbank: (pfam = protein families, SMART = simple modular architecture research tool) Proteinfamilien Eine Domäne oder eine bestimmte Kombination von Domänen kann eine bestimmte Familie von Proteinen charakterisieren. 3 Bioinformatik für Hochdurchsatztechnologien
4 Serpine in pfam Beispiel: Serpin (Serin-Protease Inhibitor) Domäne wird durch das folgende multiple Alignment charakterisiert (pfam PF00079) 4 Bioinformatik für Hochdurchsatztechnologien
5 Visualisierung als HMM-Logo Die folgende Darstellung arbeitet die stark konservierten Positionen besser heraus. Höhe der Türme: Grad der Konserviertheit Breite der Türme: Wahrscheinlichkeit, nicht ausgelassen zu werden Breite der roten Balken: Insertionswahrscheinlichkeit zwischen zwei Positionen 5 Bioinformatik für Hochdurchsatztechnologien
6 Evolutionäre Verwandtschaft zwischen Sequenzen Ein multiples Alignment ist nur zwischen Sequenzen sinnvoll, die global ähnlich sind, d.h. zwischen denen eine evolutionäre Verwandtschaft besteht. Diese wird durch einen phylogenetischen Baum ausgedrückt. Beispiel: Serpine in pfam Später mehr zum Thema Phylogenetische Bäume. 6 Bioinformatik für Hochdurchsatztechnologien
7 Berechnung multipler Alignments aus Sequenzen Ziel: Berechnung des biologisch / evolutionär korrekten multiplen Alignments (d.h. evolutionär voneinander Abstammende Aminosäuren oder solche mit gemeinsamem Vorfahren stehen untereinander) aus k gegebenen Sequenzen Formulierung als Optimierungsproblem: Definiere (wie schon auf paarweisen Alignments) eine Scorefunktion Finde das multiple Alignment, das den Score maximiert Problematisch! Es gibt vermutlich kein Scoring-Verfahren, das stets das biologisch korrekte Alignment zu dem mit der höchsten Score macht. 7 Bioinformatik für Hochdurchsatztechnologien
8 Bewertung (Scoring) multipler Alignments Problematisch! Es gibt vermutlich kein Scoring-Verfahren, das stets das biologisch korrekte Alignment zu dem mit der höchsten Score macht. Die zwei gängigsten Verfahren: Sum-of-pairs score: Ein multiples Alignment aus k Sequenzen enthält ~ k 2 /2 paarweise Alignments. Die Summe aller paarweisen Scores ergibt den Score des multiplen Alignments. Tree score: Man geht davon aus, dass zwischen den Sequenzen evolutionäre Verwandtschaften bestehen, die durch einen phylogenetischen Baum gegeben sind. (Dazu später mehr!) Man summiert nur die paarweisen Scores von im Baum benachbarten Sequenzen. Eine Zwischenlösung ist ein gewichteter Sum-of-pairs score, der verschiedenen Sequenzpaaren verschiedene Gewichte bei der Summierung der paarweisen Scores zuweist. - Sum-of-pairs: Alle Gewichte sind 1. - Tree score: Gewichte von im Baum benachbarten Sequenzen sind 1, sonst 0. 8 Bioinformatik für Hochdurchsatztechnologien
9 Optimierungsprobleme Variante 1: Sum-of-pairs Problem Gegeben k Sequenzen, Scorematrix, Gapkosten, finde das multiple Alignment, das den (gewichteten) sum-of-pairs Score maximiert Variante 2: Tree Alignment Problem Gegeben zusätzlich ein Baum mit den k Sequenzen an den Blättern, finde eine Belegung der inneren Knoten mit Sequenzen (gemeinsame Vorfahren) und das multiple Alignment, das den Tree-Score maximiert Variante 3: Verallgemeinertes Tree Alignment Problem: Gegeben k Sequenzen, Scorematrix, Gapkosten (kein Baum!), finde eine Baumtopologie, eine Belegung der inneren Knoten mit Sequenzen und das multiple Alignment, das den Tree-Score über alle Möglichkeiten maximiert Alle drei Varianten des multiplen Alignments sind NP-schwere Probleme! Es gibt exakte Algorithmen, aber deren Zeitbedarf ist exponentiell in der Anzahl der Sequenzen k. Diese sind nur praktikabel für 3 4 Sequenzen. 9 Bioinformatik für Hochdurchsatztechnologien
10 Heuristiken für multiples Alignment Da multiples Alignment NP-schwer ist, verwendet man Heuristiken. Seit den 70er Jahren wurden viele Ideen für Heuristiken entwickelt, und es gibt eine Vielzahl an Programmen für multiples Alignment. Beispiele Center-star-Methode: Man wählt eine Sequenz aus (die mit der geringsten evolutionären Abstandssumme zu den anderen) und aligniert jede andere Sequenz paarweise daran. Die k-1 paarweisen Alignments setzt man zu einem multiplen Alignment zusammen. Nachteil: Es werden nur k-1 der möglichen paarweisen Alignments betrachtet. Divide-and-conquer Alignment: Man sucht etwa in der Mitte jeder Sequenz eine Stelle, an der man relativ sicher ist, dass alle diese Stellen eine Alignmentspalte bilden. Man teilt das Problem dann in ein linkes und ein rechtes Problem auf, und verfährt dort genauso. Nachteil: funktioniert nicht gut, wenn es keine solchen Stellen gibt Progressives Alignment: Man beginnt mit 2 Sequenzen und aligniert in jedem Schritt eine weitere Sequenz optimal an das schon bestehende multiple Alignment. Die Reihenfolge wird durch die evolutionären Distanzen der Sequenzen bestimmt. Wichtigstes Beispiel hierzu: Clustal 10 Bioinformatik für Hochdurchsatztechnologien
11 Clustal Clustal ist eine schnelle Heuristik (und ein Software-Paket) zum Berechnen von multiplen Alignments. Idee - Berechne eine Folge von paarweisen Alignments - Nimm dazu einen Baum zur Hilfe ( guide tree ) (eine Art phylogenetischer Baum, aber eher einfach ein Hilfsmittel zur Berechnung): 1. Berechne Distanzen zwischen allen Sequenzpaaren 2. Berechne aus den Distanzwerten einen Baum (mehr dazu später) 3. Aligniere Sequenzen und existierende Alignments zueinander in der Reihenfolge, die der Baum vorgibt. - Bereits existierende Teil-Alignments werden dabei nicht mehr verändert. Clustal im WWW Informationen auf Webserver zum Berechnen von Alignments: - am EBI: - am Swiss Institute of Bioinformatics: 11 Bioinformatik für Hochdurchsatztechnologien
12 Abhängigkeit zwischen Baum und Alignment Ein Baum, der die Verwandtschaftsverhältnisse der Sequenzen abbildet, ist ein wichtiges Hilfsmittel beim Berechnen eines multiplen Alignments. Wie bekommt man aber einen solchen Baum? Man schätzt die evolutionären Distanzen (z.b. in PAM-Einheiten) zwischen den Sequenzen. Dazu braucht man aber das Alignment. Dies ist ein klassischer Fall des Henne-Ei-Problems. Lösung: Man startet mit groben Schätzungen für die Distanzen, z.b. aus paarweisen Alignments; diese unterschätzen die wahren Distanzen. Man erstellt ein erstes multiples Alignment. Daraus schätzt man neue Distanzen und ein neues Alignment. Dies iteriert man so lange, bis sich nichts mehr ändert, oder eine vorgegebene Maximalzahl an Iterations-Schritten gemacht wurde. 12 Bioinformatik für Hochdurchsatztechnologien
Einführung in die Angewandte Bioinformatik: Algorithmen und Komplexität; Multiples Alignment und
Einführung in die Angewandte Bioinformatik: Algorithmen und Komplexität; Multiples Alignment 04.06.2009 und 18.06.2009 Prof. Dr. Sven Rahmann 1 Zwischenspiel: Algorithmik Bisher nebenbei : Vorstellung
MehrEinführung in die Angewandte Bioinformatik: Proteinsequenz-Datenbanken
Einführung in die Angewandte Bioinformatik: Proteinsequenz-Datenbanken 14.05.2009 Prof. Dr. Sven Rahmann 1 3 Proteinsequenz-Datenbanksysteme NCBI Entrez Proteins EBI SRS Proteins UniProt (empfohlen) 2
MehrEinführung in die Angewandte Bioinformatik: BLAST E-Werte, Algorithmen, Multiple Alignments, R
Einführung in die Angewandte Bioinformatik: BLAST E-Werte, Algorithmen, Multiple Alignments, R 17.06.2010 Prof. Dr. Sven Rahmann 1 Protein BLAST (blastp) Hier wird die Sequenz eingegeben oder hochgeladen,
MehrAlgorithmen auf Sequenzen Paarweiser Sequenzvergleich: Alignments
Algorithmen auf Sequenzen Paarweiser Sequenzvergleich: Alignments Sven Rahmann Genominformatik Universitätsklinikum Essen Universität Duisburg-Essen Universitätsallianz Ruhr Einführung Bisher: Berechnung
MehrBioinformatik. Lokale Alignierung Gapkosten. Silke Trißl / Ulf Leser Wissensmanagement in der. Bioinformatik
Bioinformatik Lokale Alignierung Gapkosten Silke Trißl / Ulf Leser Wissensmanagement in der Bioinformatik Inhalt dieser Vorlesung Ähnlichkeit Lokales und globales Alignment Gapped Alignment Silke Trißl:
MehrSequenz Alignment Teil 2
Sequenz Alignment Teil 2 14.11.03 Vorlesung Bioinformatik 1 Molekulare Biotechnologie Dr. Rainer König Besonderen Dank an Mark van der Linden, Mechthilde Falkenhahn und der Husar Biocomputing Service Gruppe
MehrZentrum für Bioinformatik. Übung 4: Revision. Beispielfragen zur Klausur im Modul Angewandte Bioinformatik (erste Semesterhälfte)
Andrew Torda Björn Hansen Iryna Bondarenko Zentrum für Bioinformatik Übung zur Vorlesung Angewandte Bioinformatik Sommersemester 2014 20./23.06.2014 Übung 4: Revision Beispielfragen zur Klausur im Modul
MehrAlgorithmische Bioinformatik
Algorithmische Bioinformatik Multiple Sequence Alignment Sum-of-pairs Score Center-Star Score Ulf Leser Wissensmanagement in der Bioinformatik Inhalt dieser Vorlesung Multiples Sequenzalignment Sum-Of-Pair
MehrEinführung in die Bioinformatik
Einführung in die Bioinformatik Ringvorlesung Biologie Sommer 07 Burkhard Morgenstern Institut für Mikrobiologie und Genetik Abteilung für Bioinformatik Goldschmidtstr. 1 Online Materialien zur Ringvorlesung:
MehrAlgorithmen für paarweise Sequenz-Alignments. Katharina Hembach
Proseminar Bioinformatik WS 2010/11 Algorithmen für paarweise Sequenz-Alignments Katharina Hembach 06.12.2010 1 Einleitung Paarweise Sequenz-Alignments spielen in der Bioinformatik eine wichtige Rolle.
MehrAlgorithmische Anwendungen WS 2005/2006
Algorithmische Anwendungen WS 2005/2006 Sequenzalignment Gruppe F_lila_Ala0506 Allal Kharaz Yassine ELassad Inhaltsverzeichnis 1 Problemstellungen...................................... 3 1.1 Rechtschreibkorrektur...............................
MehrBioinformatik für Lebenswissenschaftler
Bioinformatik für Lebenswissenschaftler Oliver Kohlbacher, Steffen Schmidt SS 2010 11. Hiden Markov Models & Phylogenien Abt. Simulation biologischer Systeme WSI/ZBIT, Eberhard Karls Universität Tübingen
MehrBioinformatik. Substitutionsmatrizen BLAST. Ulf Leser Wissensmanagement in der. Bioinformatik
Bioinformatik Substitutionsmatrizen BLAST Ulf Leser Wissensmanagement in der Bioinformatik Inhalt dieser Vorlesung Substitutionsmatrizen: PAM und BLOSSUM Suche in Datenbanken: Basic Local Alignment Search
MehrBioinformatik Für Biophysiker
Bioinformatik Für Biophysiker Sommersemester 2009 Silke Trißl / Ulf Leser Wissensmanagement in der Bioinformatik Wissensmanagement in der Bioinformatik Schwerpunkte Algorithmen der Bioinformatik Management
MehrThreading - Algorithmen
Threading - Algorithmen Florian Lindemann 22.11.2007 Florian Lindemann () Threading - Algorithmen 22.11.2007 1 / 25 Gliederung 1 Prospect Scoring Function Algorithmus Weitere Eigenschaften Komplexität
MehrBioinformatik für Lebenswissenschaftler
Bioinformatik für Lebenswissenschaftler Oliver Kohlbacher, Steffen Schmidt SS 2010 06. Paarweises Alignment Teil II Abt. Simulation biologischer Systeme WSI/ZBIT, Eberhard Karls Universität Tübingen Übersicht
MehrMethoden für den Entwurf von Algorithmen
Methoden für den Entwurf von Algorithmen Greedy Algorithmen: - Löse ein einfaches Optimierungsproblem durch eine Folge vernünftiger Entscheidungen. - Eine getroffene Entscheidung wird nie zurückgenommen.
MehrEntscheidungsbäume. Definition Entscheidungsbaum. Frage: Gibt es einen Sortieralgorithmus mit o(n log n) Vergleichen?
Entscheidungsbäume Frage: Gibt es einen Sortieralgorithmus mit o(n log n) Vergleichen? Definition Entscheidungsbaum Sei T ein Binärbaum und A = {a 1,..., a n } eine zu sortierenden Menge. T ist ein Entscheidungsbaum
MehrMBI: Sequenz-Vergleich mit Alignment
MBI: Sequenz-Vergleich mit Alignment Bernhard Haubold 28. Oktober 2014 Wiederholung: Was ist Bioinformatik? Historische Übersicht; CABIOS Bioinformatics Gemeinsames Thema: Information in vivo DNA Epigenetik
MehrSequenzvergleich und Datenbanksuche
Sequenzvergleich und Datenbanksuche Vorlesung Einführung in die Angewandte Bioinformatik Prof. Dr. Sven Rahmann Webseite zur Vorlesung http://bioinfo.wikidot.com/ Sprechstunde Mo 16-17 in OH14, R214 Sven.Rahmann
MehrFOLDALIGN und sein Algorithmus. Nadine Boley Silke Szymczak
FOLDALIGN und sein Algorithmus Nadine Boley Silke Szymczak Gliederung 2 Einleitung Motivation des Ansatzes zu FOLDALIGN Sankoff-Algorithmus Globales Alignment Zuker-Algorithmus Kombination FOLDALIGN Algorithmus,
MehrAlgorithmische Bioinformatik 1
Algorithmische Bioinformatik 1 Dr. Hanjo Täubig Lehrstuhl für Effiziente Algorithmen (Prof. Dr. Ernst W. Mayr) Institut für Informatik Technische Universität München Sommersemester 2009 Übersicht Paarweises
MehrAttached! Proseminar Netzwerkanalyse SS 2004 Thema: Biologie
Rheinisch-Westfälischen Technischen Hochschule Aachen Lehr- und Forschungsgebiet Theoretische Informatik Prof. Rossmanith Attached! Proseminar Netzwerkanalyse SS 2004 Thema: Biologie Deniz Özmen Emmanuel
MehrStudiengang Informatik der FH Gießen-Friedberg. Sequenz-Alignment. Jan Schäfer. WS 2006/07 Betreuer: Prof. Dr. Klaus Quibeldey-Cirkel
Studiengang Informatik der FH Gießen-Friedberg Sequenz-Alignment Jan Schäfer WS 2006/07 Betreuer: Prof. Dr. Klaus Quibeldey-Cirkel Überblick Einführung Grundlagen Wann ist das Merkmal der Ähnlichkeit erfüllt?
MehrSequenzen-Alignierung in der Bioinformatik
Sequenzen-Alignierung in der Bioinformatik VO Algorithm Engineering Professor Dr. Petra Mutzel Lehrstuhl für Algorithm Engineering, LS 2. VO 2.0.2006 Literatur für diese VO Volker Heun: Skriptum zur Vorlesung
MehrWelche Alignmentmethoden haben Sie bisher kennengelernt?
Welche Alignmentmethoden haben Sie bisher kennengelernt? Was heißt optimal? Optimal = die wenigsten Mutationen. Sequenzen bestehen aus Elementen (z.b. Aminosäuren oder Nukleotide). Edit Distanzen sind
MehrAufgabenblatt 5. Silke Trißl Wissensmanagement in der Bioinformatik
Aufgabenblatt 5 Silke Trißl Wissensmanagement in der Bioinformatik Zuerst! FRAGEN? Silke Trißl: Bioinformatik für Biophysiker 2 Exercise 1 + 2 Modify program to compare protein sequence read substitution
MehrBioinformatik für Lebenswissenschaftler
Bioinformatik für Lebenswissenschaftler Oliver Kohlbacher, Steffen Schmidt SS 2010 09. Multiples Alignment I Abt. Simulation biologischer Systeme WSI/ZBIT, Eberhard Karls Universität Tübingen Übersicht
MehrBCDS Seminar. Protein Tools
BCDS Seminar Protein Tools Gliederung Nützliche Tools Three-/one-letter Amino Acids' Сodes RandSeq Random Protein Sequence Generator Protein Colourer ProtParam PeptideCutter ProtScale TMHMM Server 2.0
MehrBioinformatik Für Biophysiker
Bioinformatik Für Biophysiker Wintersemester 2005 / 2006 Ulf Leser Wissensmanagement in der Bioinformatik Wissensmanagement in der Bioinformatik Lehrstuhl seit 10/2002 Schwerpunkte Algorithmen der Bioinformatik
MehrEinführung in die Angewandte Bioinformatik: Phylogenetik und Taxonomie
Einführung in die Angewandte Bioinformatik: Phylogenetik und Taxonomie 24.06.2010 Prof. Dr. Sven Rahmann 1 Phylogenetik: Berechnung phylogenetischer Bäume Phylogenetik (phylum = Stamm): Rekonstruktion
MehrHomologie und Sequenzähnlichkeit. Prof. Dr. Antje Krause FH Bingen 06721 / 409 253 akrause@fh-bingen.de
Homologie und Sequenzähnlichkeit Prof. Dr. Antje Krause FH Bingen 06721 / 409 253 akrause@fh-bingen.de Homologie Verwandtschaft aufgrund gleicher Abstammung basiert auf Speziation (Artbildung): aus einer
MehrV3 - Multiples Sequenz Alignment und Phylogenie
V3 - Multiples Sequenz Alignment und Phylogenie Literatur: Kapitel 4 in Buch von David Mount Thioredoxin-Beispiel heute aus Buch von Arthur Lesk 3. Vorlesung SS 2011 Softwarewerkzeuge der Bioinformatik
MehrBioinformatik. Profilalignment und PSI Blast Center-Star Verfahren Progressives MSA CLUSTAL W. Ulf Leser Wissensmanagement in der.
Bioinformatik Profilalignment und PSI Blast Center-Star Verfahren Progressives MS CLUSTL W Ulf Leser Wissensmanagement in der Bioinformatik Definition Bisher Immer Vergleich zweier Strings Jetzt Multipler
MehrGleichheit, Ähnlichkeit, Homologie
Gleichheit, Ähnlichkeit, Homologie Identität (identity) Verhältnis der Anzahl identischer Aminosäuren zur Gesamtzahl der Aminosäuren; objektiv Ähnlichkeit (similarity) Verhältnis ähnlicher Aminosäuren
MehrPhylogenetik. Vorlesung Einführung in die Angewandte Bioinformatik Prof. Dr. Sven Rahmann. Webseite zur Vorlesung
Phylogenetik Vorlesung Einführung in die Angewandte Bioinformatik Prof. Dr. Sven Rahmann Webseite zur Vorlesung http://bioinfo.wikidot.com/ Sprechstunde Mo 16-17 in OH14, R214 Sven.Rahmann -at- tu-dortmund.de
MehrBioinformatik: Neue Paradigmen in der Forschung
Bioinformatik: Neue Paradigmen in der Forschung Sommerakademie der Studienstiftung St. Johann, 1.-14.9.2002 Leitung: Proff. Ernst W. Mayr & Rolf Backofen Thema 4: Paarweises und multiples (heuristisches)
MehrV3 - Multiples Sequenz Alignment und Phylogenie
V3 - Multiples Sequenz Alignment und Phylogenie Literatur: Kapitel 4 in Buch von David Mount Thioredoxin-Beispiel heute aus Buch von Arthur Lesk 1 Leitfragen für V3 Frage1: Können wir aus dem Vergleich
MehrProbleme aus NP und die polynomielle Reduktion
Probleme aus NP und die polynomielle Reduktion Prof. Dr. Berthold Vöcking Lehrstuhl Informatik 1 Algorithmen und Komplexität RWTH Aachen 15. Dezember 2009 Berthold Vöcking, Informatik 1 () Vorlesung Berechenbarkeit
MehrMasterarbeit. Variantentolerantes Readmapping durch Locality Sensitive Hashing. Jens Quedenfeld November Gutachter: Sven Rahmann Dominik Köppl
Masterarbeit Variantentolerantes Readmapping durch Locality Sensitive Hashing Jens Quedenfeld November 2015 Gutachter: Sven Rahmann Dominik Köppl Technische Universität Dortmund Fakultät für Informatik
MehrHidden Markov Model (HMM)
Hidden Markov Model (HMM) Kapitel 1 Spezialvorlesung Modul 10-202-2206 (Fortgeschrittene Methoden in der Bioinformatik) Jana Hertel Professur für Bioinformatik Institut für Informatik Universität Leipzig
MehrDas Problem des Handlungsreisenden
Seite 1 Das Problem des Handlungsreisenden Abbildung 1: Alle möglichen Rundreisen für 4 Städte Das TSP-Problem tritt in der Praxis in vielen Anwendungen als Teilproblem auf. Hierzu gehören z.b. Optimierungsprobleme
MehrPrimärstruktur. Wintersemester 2011/12. Peter Güntert
Primärstruktur Wintersemester 2011/12 Peter Güntert Primärstruktur Beziehung Sequenz Struktur Proteinsequenzen, Sequenzdatenbanken Sequenzvergleich (sequence alignment) Sequenzidentität, Sequenzhomologie
MehrEffiziente Methoden Für Die Berechnung Von Aminosäure Ersetzungsraten
Seminar - Aktuelle Themen der Bioinformatik Tobias Gontermann Johann Wolfgang Goethe-Universität Frankfurt a. M. 12 Juli 2007 1/46 Worum geht es? Berechung von Ratenmatritzen Q Wofür ist das gut? Modellierung
MehrBioinformatik. Multiple String Alignment I. Ulf Leser Wissensmanagement in der. Bioinformatik
Bioinformatik Multiple String Alignment I Ulf Leser Wissensmanagement in der Bioinformatik BLAST2: Zwei-Hit-Strategie Original: Alle Hits mit Score > t werden zu MSPs verlängert Extensionen fressen >90%
MehrVery simple methods for all pairs network flow analysis
Very simple methods for all pairs network flow analysis Tobias Ludes 02.07.07 Inhalt Einführung Algorithmen Modifikation der Gomory-Hu Methode Einführung Nach Gomory-Hu nur n-1 Netzwerk-Fluss- Berechnungen
Mehr9 Minimum Spanning Trees
Im Folgenden wollen wir uns genauer mit dem Minimum Spanning Tree -Problem auseinandersetzen. 9.1 MST-Problem Gegeben ein ungerichteter Graph G = (V,E) und eine Gewichtsfunktion w w : E R Man berechne
MehrMolekulare Bioinformatik
Molekulare Bioinformatik Wintersemester 203/204 Prof. Thomas Martinetz Institut für Neuro- und Bioinformatik Universität zu Luebeck 07.0.204 Molekulare Bioinformatik - Vorlesung 0 Wiederhohlung Die Entropie
MehrTechnische Universität Wien Institut für Computergraphik und Algorithmen Arbeitsbereich für Algorithmen und Datenstrukturen
Technische Universität Wien Institut für Computergraphik und Algorithmen Arbeitsbereich für Algorithmen und Datenstrukturen 186.172 Algorithmen und Datenstrukturen 1 VL 4.0 Übungsblatt 4 für die Übung
MehrBioinformatik für Lebenswissenschaftler
Bioinformatik für Lebenswissenschaftler Oliver Kohlbacher, Steffen Schmidt SS 2010 09. Multiples Alignment I Abt. Simulation biologischer Systeme WSI/ZBIT, Eberhard Karls Universität Tübingen Übersicht
MehrInterPro & SP-ML. Syntax und Verwendung der Beschreibungssprache XML Ausarbeitung im Seminar XML in der Bioinformatik.
InterPro & SP-ML Syntax und Verwendung der Beschreibungssprache XML Ausarbeitung im Seminar XML in der Bioinformatik Stefan Albaum 18. Dezember 2002 Inhaltsverzeichnis 1 SPTr-XML 2 1.1 SWISS-PROT...........................
MehrBioinformatik. BLAST Basic Local Alignment Search Tool. Ulf Leser Wissensmanagement in der. Bioinformatik
Bioinformatik BLAST Basic Local Alignment Search Tool Ulf Leser Wissensmanagement in der Bioinformatik Heuristische Alignierung Annotation neuer Sequenzen basiert auf Suche nach homologen Sequenzen in
MehrAlgorithmische Bioinformatik
Algorithmische Bioinformatik Effiziente Berechnung des Editabstands Dynamische Programmierung Ulf Leser Wissensmanagement in der Bioinformatik Inhalt dieser Vorlesung Rekursive Definition des Editabstands
MehrComperative Protein Structure Modelling of Genes and Genomes
Comperative Protein Structure Modelling of Genes and Genomes Satisfaction of Spatial Restraints / Loop Modelling Nikolas Gross und Maximilian Miller Ludwig-Maximilians-Universität 29.11.2007 1 von 31 Table
MehrOptimierung. Optimierung. Vorlesung 9 Lineare Programmierung & Kombinatorische Optimierung Fabian Kuhn
Optimierung Vorlesung 9 Lineare Programmierung & Kombinatorische Optimierung 1 Assignment Problem (Zuordnungsproblem) Gewichtetes Perfektes Bipartites Matching agents Costs tasks Weise jedem Agenten genau
MehrBayesianische Netzwerke - Lernen und Inferenz
Bayesianische Netzwerke - Lernen und Inferenz Manuela Hummel 9. Mai 2003 Gliederung 1. Allgemeines 2. Bayesianische Netzwerke zur Auswertung von Genexpressionsdaten 3. Automatische Modellselektion 4. Beispiel
MehrDot-Matrix Methode. (Java) (Javascript) 80
Dot-Matrix Methode Vergleich zweier Sequenzen (DNA oder Aminosäuren) Idee: gleiche Basen (Aminosäuren) in x-y Diagramm markieren Sequenz 1: ADRWLVKQN Sequenz 2: ADKFIVRDE http://myhits.vital-it.ch/cgi-bin/dotlet
MehrHidden Markov Models
Hidden Markov Models Kursfolien Karin Haenelt 09.05002 1 Letzte Änderung 18.07002 Hidden Markov Models Besondere Form eines probabilistischen endlichen Automaten Weit verbreitet in der statistischen Sprachverarbeitung
MehrMaschinelles Lernen in der Bioinformatik
Maschinelles Lernen in der Bioinformatik Spezialvorlesung Modul 10-202-2206 (Fortgeschrittene Methoden in der Bioinformatik) VL 2 HMM und (S)CFG Jana Hertel Professur für Bioinformatik Institut für Informatik
MehrMOL.504 Analyse von DNA- und Proteinsequenzen. Modul 2 BLAST-Sequenzsuche und Sequenzvergleiche
MOL.504 Analyse von DNA- und Proteinsequenzen Modul 2 BLAST-Sequenzsuche und Sequenzvergleiche Summary Modul 1 - Datenbanken Wo finde ich die DNA Sequenz meines Zielgens? Wie erhalte ich Info aus der DNA-Datenbank
MehrSoftwarewerkzeuge der Bioinformatik
Bioinformatik Wintersemester 2006/2007 Tutorial 2: paarweise Sequenzaligments BLAST Tutorial 2: BLAST 1/22 Alignment Ausrichten zweier oder mehrerer Sequenzen, um: ihre Ähnlichkeit quantitativ zu erfassen
MehrDistributed Algorithms. Image and Video Processing
Chapter 6 Optical Character Recognition Distributed Algorithms for Übersicht Motivation Texterkennung in Bildern und Videos 1. Erkennung von Textregionen/Textzeilen 2. Segmentierung einzelner Buchstaben
MehrAlgorithmische Methoden zur Netzwerkanalyse
Algorithmische Methoden zur Netzwerkanalyse Juniorprof. Dr. Henning Meyerhenke Institut für Theoretische Informatik 1 KIT Henning Universität desmeyerhenke, Landes Baden-Württemberg Institutund für Theoretische
MehrGrundlagen der Informatik
Jörn Fischer j.fischer@hs-mannheim.de Willkommen zur Vorlesung Grundlagen der Informatik ADS-Teil Page 2 Überblick Inhalt 1 Eigenschaften von Algorithmen Algorithmenbegriff O-Notation Entwurfstechniken
MehrProbeklausur Optimierung
Universität Hamburg Fakultät für Mathematik, Informatik und Naturwissenschaften Dr. Nico Düvelmeyer Hamburg, 4. Juli 2011 Probeklausur Optimierung Bitte selber ausfüllen: Name: (darf anonymisiert werden)
MehrVortrag 2: Proteinsequenzen und Substitutionsmatrizen
Vortrag 2: Proteinsequenzen und Substitutionsmatrizen Was sind Proteinsequenzen? Die DNA-Forschung hat sich auf spezielle Abschnitte auf den Strängen der DNA-Moleküle konzentriert, den sog. Protein-codierenden
MehrAutomatische Rekonstruktion und Spezifizierung von Attributnamen in Webtabellen
Automatische Rekonstruktion und Spezifizierung von Attributnamen in Webtabellen Mark Reinke Bachelorarbeit TU Dresden 17. Februar 2014 Webtabellen Warum sind Webtabellen von Bedeutung? Sie können relationale
MehrWichtige Themen aus der Vorlesung Bioinformatik I WS 2013/2014
Universität des Saarlandes FR 6.2 Informatik Prof. Dr. Hans-Peter Lenhof Daniel Stöckel, M. Sc. Patrick Trampert, M. Sc. Lara Schneider, M. Sc. I Wichtige Themen aus der Vorlesung Bioinformatik I WS 2013/2014
MehrAlgorithmen und Datenstrukturen in der Bioinformatik Viertes Übungsblatt WS 05/06 Musterlösung
Konstantin Clemens Johanna Ploog Freie Universität Berlin Institut für Mathematik II Arbeitsgruppe für Mathematik in den Lebenswissenschaften Algorithmen und Datenstrukturen in der Bioinformatik Viertes
MehrAlgorithmische Methoden für schwere Optimierungsprobleme
Algorithmische Methoden für schwere Optimierungsprobleme Prof. Dr. Henning Meyerhenke Institut für Theoretische Informatik 1 KIT Henning Universität desmeyerhenke, Landes Baden-Württemberg Institutund
MehrPhylogenetische Analyse
Bioinformatik I - Uebung Phylogenetische Analyse Wenn nicht anders angegeben verwende die Standard-Einstellungen der Programme Hintergrund: Die Schwämme (Phylum Porifera) gehören zu den den ältesten lebenden
MehrADS: Algorithmen und Datenstrukturen 2
ADS: Algorithmen und Datenstrukturen 2 Teil 5 Prof. Peter F. Stadler & Dr. Christian Höner zu Siederdissen Bioinformatik/IZBI Institut für Informatik & Interdisziplinäres Zentrum für Bioinformatik Universität
MehrVorlesung. Prof. Janis Voigtländer Übungsleitung: Dennis Nolte. Mathematische Strukturen Sommersemester 2017
Vorlesung Mathematische Strukturen Sommersemester 017 Prof. Janis Voigtländer Übungsleitung: Dennis Nolte Kombinatorik: Einführung Es folgt eine Einführung in die abzählende Kombinatorik. Dabei geht es
MehrGrundlagen der Mathematik
Universität Hamburg Winter 2016/17 Fachbereich Mathematik Janko Latschev Grundlagen der Mathematik Lösungsskizzen 2 Präsenzaufgaben (P2) Wir betrachten drei Teilmengen der natürlichen Zahlen: - A = {n
MehrGrundlagen: Algorithmen und Datenstrukturen
Grundlagen: Algorithmen und Datenstrukturen Prof. Dr. Hanjo Täubig Lehrstuhl für Effiziente Algorithmen (Prof. Dr. Ernst W. Mayr) Institut für Informatik Technische Universität München Sommersemester 2010
MehrDatenstrukturen und Algorithmen. Christian Sohler FG Algorithmen & Komplexität
Datenstrukturen und Algorithmen Christian Sohler FG Algorithmen & Komplexität 1 Clustering: Partitioniere Objektmenge in Gruppen(Cluster), so dass sich Objekte in einer Gruppe ähnlich sind und Objekte
MehrDie Klasse NP und die polynomielle Reduktion
Die Klasse NP und die polynomielle Reduktion Prof. Dr. Berthold Vöcking Lehrstuhl Informatik 1 Algorithmen und Komplexität RWTH Aachen Dezember 2011 Berthold Vöcking, Informatik 1 () Vorlesung Berechenbarkeit
MehrEffiziente Algorithmen und Komplexitätstheorie
Fakultät für Informatik Lehrstuhl 2 Vorlesung Effiziente Algorithmen und Komplexitätstheorie Sommersemester 2008 Ingo Wegener Ingo Wegener 03. Juli 2008 1 Sequenzanalyse Hauptproblem der Bioinformatik
MehrMBI: Sequenzvergleich ohne Alignment
MBI: Sequenzvergleich ohne Alignment Bernhard Haubold 12. November 2013 Wiederholung Exaktes & inexaktes Matching Das exakte Matching Problem Naive Lösung Präprozessierung Muster(Pattern): Z-Algorithmus,
MehrAlgorithmen für schwierige Probleme
Algorithmen für schwierige Probleme Britta Dorn Wintersemester 2011/12 30. November 2011 Wiederholung Baumzerlegung G = (V, E) Eine Baumzerlegung von G ist ein Paar {X i i V T }, T, wobei T Baum mit Knotenmenge
MehrBioinformatik I (Einführung)
Kay Diederichs, Sommersemester 2015 Bioinformatik I (Einführung) Algorithmen Sequenzen Strukturen PDFs unter http://strucbio.biologie.unikonstanz.de/~dikay/bioinformatik/ Klausur: Fr 17.7. 10:00-11:00
MehrBLAST. Ausarbeitung zum Proseminar Vortag von Nicolás Fusseder am 24.10.02
BLAST Ausarbeitung zum Proseminar Vortag von Nicolás Fusseder am 24.10.02 BLAST (Basic Local Alignment Search Tool) hat seit seiner Veröffentlichung, von Altschul et al. im Jahre 1990, an großer Relevanz
MehrMM Proteinmodelling. Michael Meyer. Vorlesung XVII
Proteinmodelling Vorlesung XVII Proteinstrukturen Es besteht ein sehr großer Bedarf an Proteinstrukturen: Die Kenntnis der 3D-Struktur hat große Vorteile für das Design neuer Wirkstoffe. Experimentelle
MehrGrundlagen der Mathematik
Universität Hamburg Winter 2016/17 Fachbereich Mathematik Janko Latschev Lösungsskizzen 8 Grundlagen der Mathematik Präsenzaufgaben (P13) Primfaktorzerlegungen Die Primfaktorzerlegungen lauten: a) 66 =
MehrRelationen und DAGs, starker Zusammenhang
Relationen und DAGs, starker Zusammenhang Anmerkung: Sei D = (V, E). Dann ist A V V eine Relation auf V. Sei andererseits R S S eine Relation auf S. Dann definiert D = (S, R) einen DAG. D.h. DAGs sind
MehrBayes sche und probabilistische Netze
Bayes sche und probabilistische Netze Gliederung Wahrscheinlichkeiten Bedingte Unabhängigkeit, Deduktion und Induktion Satz von Bayes Bayes sche Netze D-Separierung Probabilistische Inferenz Beispielanwendung
MehrSachrechnen/Größen WS 14/15-
Kapitel Daten & Wahrscheinlichkeit 3.1 Kombinatorische Grundlagen 3.2 Kombinatorik & Wahrscheinlichkeit in der Grundschule 3.3 Daten Darstellen 3.1 Kombinatorische Grundlagen Verschiedene Bereiche der
Mehr8. Statistik Beispiel Noten. Informationsbestände analysieren Statistik
Informationsbestände analysieren Statistik 8. Statistik Nebst der Darstellung von Datenreihen bildet die Statistik eine weitere Domäne für die Auswertung von Datenbestände. Sie ist ein Fachgebiet der Mathematik
MehrAlgorithmen und Datenstrukturen Klausur WS 2006/07 Software-Engineering und Technische Informatik Bachelor
Klausur WS 2006/07 Software-Engineering und Technische Informatik Bachelor Die Klausur besteht aus 6 Aufgaben und umfasst 60 Punkte. Bitte schreiben Sie die Lösungen auf die Aufgabenblätter. Vergessen
MehrDie Theorie der Toleranzen und deren Anwendung auf das Traveling Salesman Problem
Die Theorie der Toleranzen und deren Anwendung auf das Traveling Salesman Problem Gerold Jäger 4. Februar 2010 Gerold Jäger Theorie der Toleranzen 4. Februar 2010 1 / 35 Überblick 1 Theorie der Toleranzen
Mehr1. XOR: Mit folgender Architektur geht es. x 1. x n-dimensionale Lernprobleme mit einer n-2-1-architektur lösen ...
1. XOR: Mit folgender Architektur geht es x 1 x 2 2. n-dimensionale Lernprobleme mit einer n-2-1-architektur lösen x 1 x 2... x 2 Loading-Problem: Für eine endliche Liste binärer Trainingspaare (x(1),d(1)),l,(x(k)d(k))
MehrEinführung in die Computerlinguistik
Einführung in die Computerlinguistik Spracherkennung und Hidden Markov Modelle Dozentin: Wiebke Petersen WS 2004/2005 Wiebke Petersen Einführung in die Computerlinguistik WS 04/05 Spracherkennung Merkmalsextraktion
MehrHM I Tutorium 1. Lucas Kunz. 27. Oktober 2016
HM I Tutorium 1 Lucas Kunz 27. Oktober 2016 Inhaltsverzeichnis 1 Theorie 2 1.1 Logische Verknüpfungen............................ 2 1.2 Quantoren.................................... 3 1.3 Mengen und ihre
MehrEinführung in die Angewandte Bioinformatik: Sequenzähnlichkeit, Sequenzalignment, BLAST
Einführung in die Angewandte Bioinformatik: Sequenzähnlichkeit, Sequenzalignment, BLAST 10.06.2010 Prof. Dr. Sven Rahmann 1 Sequenzvergleich: Motivation Hat man die DNA-Sequenz eines Gens, die Aminosäuresequenz
MehrSandro Pirkwieser, (Bin Hu, Jakob Puchinger) SS 2010
Lösungsverfahren für Ganzzahlige Optimierung Sandro Pirkwieser, (Bin Hu, Jakob Puchinger) Fortgeschrittene Algorithmen und Datenstrukturen Arbeitsbereich für Algorithmen und Datenstrukturen Institut für
MehrP, NP und NP -Vollständigkeit
P, NP und NP -Vollständigkeit Mit der Turing-Maschine haben wir einen Formalismus kennengelernt, um über das Berechenbare nachdenken und argumentieren zu können. Wie unsere bisherigen Automatenmodelle
MehrStatistik I für Betriebswirte Vorlesung 2
Statistik I für Betriebswirte Vorlesung 2 Prof. Dr. Hans-Jörg Starkloff TU Bergakademie Freiberg Institut für Stochastik 11. April 2016 Prof. Dr. Hans-Jörg Starkloff Statistik I für Betriebswirte Vorlesung
MehrAlgorithmen auf Sequenzen
Algorithmen auf Sequenzen Vorlesung von Prof. Dr. Sven Rahmann im Sommersemester 2008 Kapitel 4 Reguläre Ausdrücke Webseite zur Vorlesung http://ls11-www.cs.tu-dortmund.de/people/rahmann/teaching/ss2008/algorithmenaufsequenzen
MehrEin progressiver Algorithmus für Multiple Sequence Alignment auf Basis von A*-Suche. Christine Zarges
Ein progressiver Algorithmus für Multiple Sequence Alignment auf Basis von A*-Suche Christine Zarges Algorithm Engineering Report TR07-1-009 November 2007 ISSN 1864-4503 Fakultät für Informatik Algorithm
MehrRekonstruktion biologischer Netzwerke (mit probabilistischen Methoden) Einführung 11.10.2010
Rekonstruktion biologischer Netzwerke (mit probabilistischen Methoden) Einführung 11.10.2010 Prof. Dr. Sven Rahmann 1 Team Prof. Dr. Sven Rahmann Zeit Mo 10-12; Do 8:30-10 Ort OH14, R104 Alle Informationen
Mehr