Threading - Algorithmen

Ähnliche Dokumente
Comperative Protein Structure Modelling of Genes and Genomes

FOLDALIGN und sein Algorithmus. Nadine Boley Silke Szymczak

Multiple Alignments. Vorlesung Einführung in die Angewandte Bioinformatik Prof. Dr. Sven Rahmann. Webseite zur Vorlesung

Bioinformatik. Lokale Alignierung Gapkosten. Silke Trißl / Ulf Leser Wissensmanagement in der. Bioinformatik

Bioinformatik für Biochemiker

Bioinformatik I (Einführung)

Algorithmen für paarweise Sequenz-Alignments. Katharina Hembach

Bioinformatik I (Einführung)

MM Proteinmodelling. Michael Meyer. Vorlesung XVII

Verbesserung der dotplot Methode

Algorithmische Anwendungen WS 2005/2006

VL Algorithmische BioInformatik (19710) WS2013/2014 Woche 16 - Mittwoch. Annkatrin Bressin Freie Universität Berlin

Studiengang Informatik der FH Gießen-Friedberg. Sequenz-Alignment. Jan Schäfer. WS 2006/07 Betreuer: Prof. Dr. Klaus Quibeldey-Cirkel

Zentrum für Bioinformatik. Übung 4: Revision. Beispielfragen zur Klausur im Modul Angewandte Bioinformatik (erste Semesterhälfte)

Homologie und Sequenzähnlichkeit. Prof. Dr. Antje Krause FH Bingen / akrause@fh-bingen.de

Abbildung (mapping) bekannter Strukturen auf 3 Dimensionen. Hou J, Jun SR, Zhang C, Kim SH. Proc Natl Acad Sci U S A. (2005) 102:

Algorithmen und Datenstrukturen in der Bioinformatik Drittes Übungsblatt WS 05/06 Musterlösung

Algorithmen auf Sequenzen Paarweiser Sequenzvergleich: Alignments

Algorithmen zum Strukturvergleich Strukturelle Bioinformatik WS16/17

Algorithmen auf Sequenzen

Bioinformatik I (Einführung)

MBI: Sequenz-Vergleich mit Alignment

Übungsaufgaben zur Einführung in die Bioinformatik - Lösungen

Bioinformatik. Methoden zur Vorhersage vo n RNA- und Proteinstrukture n. Gerhard Steger

Algorithmische Bioinformatik

Algorithmische Bioinformatik

Einführung in die Bioinformatik: Lernen mit Kernen

Bayesianische Netzwerke - Lernen und Inferenz

Bioinformatik für Lebenswissenschaftler

Dot-Matrix Methode. (Java) (Javascript) 80

Bioinformatik für Biochemiker

MikroRNA-Bioinformatik. Annalisa Marsico High-throughput Genomics, FU Berlin

Primärstruktur. Wintersemester 2011/12. Peter Güntert

comparative structure prediction of ncrna molecules

Aufgabenblatt 5. Silke Trißl Wissensmanagement in der Bioinformatik

Proseminar Bioinformatik

Pairwise Alignment. Steffen Forkmann. Proseminar: BioInformatik

Gleichheit, Ähnlichkeit, Homologie

Algorithmen und Datenstrukturen in der Bioinformatik Zweites Übungsblatt WS 05/06 Musterlösung

Klausur Bioinformatik für Biotechnologen

Proteine V: Flexibilität. Funktion und Struktur Dynamik marginale Stabilität Abbau

Anwendungen dynamischer Programmierung in der Biologie

3.2. Divide-and-Conquer-Methoden

Algorithmische Bioinformatik

Übungsaufgaben. Aufbau und Konformation von Polypeptiden. Einführung in die räumliche Struktur von Proteinen

Luke Alphey. DNA-Sequenzierung. Aus dem Englischen übersetzt von Kurt Beginnen. Spektrum Akademischer Verlag

Protein-Protein Bindungsstellen. Lennart Heinzerling

Wichtige Themen aus der Vorlesung Bioinformatik II SS 2016

Wichtige Themen aus der Vorlesung Bioinformatik II SS 2017

Vorlesung Einführung in die Bioinformatik

Sequenzen-Alignierung in der Bioinformatik. VO Algorithm Engineering Professor Dr. Petra Mutzel Lehrstuhl für Algorithm Engineering, LS11

Algorithmen für die Speicherhierarchie

Bioinformatik. BLAST Basic Local Alignment Search Tool. Ulf Leser Wissensmanagement in der. Bioinformatik

Sequenz Alignment Teil 2

Kapitel 7: Sequenzen- Alignierung in der Bioinformatik

Bioinformatik für Lebenswissenschaftler

Thema 12: RNA Structure Prediction

Algorithmische Bioinformatik 1

Vorlesung Bioinformatik Protein Threading

6 Proteinstrukturen und die dritte Dimension

Algebraische Statistik ein junges Forschungsgebiet. Dipl.-Math. Marcus Weber

Aufgabenblatt 4. Silke Trißl Wissensmanagement in der Bioinformatik

Anwendungen des Fréchet-Abstandes Das Constrained Free Space Diagram zur Analyse von Körperbewegungen

MOL.504 Analyse von DNA- und Proteinsequenzen. Modul 2 BLAST-Sequenzsuche und Sequenzvergleiche

Informatik I. Grundlagen der systematischen Programmierung. Peter Thiemann WS 2007/08. Universität Freiburg, Germany

3 Proteinstrukturen. Modul Bioinformatik von RNA- und Proteinstrukturen. Stephan Bernhart. 5. Mai Professur Bioinformatik

Algorithmen und Datenstrukturen in der Bioinformatik

Kap. 6.6: Kürzeste Wege

Least Absolute Shrinkage And Seletion Operator (LASSO)

Kap. 6.6: Kürzeste Wege

Statistische Methoden in der Bioinformatik

Bioinformatik. Substitutionsmatrizen BLAST. Ulf Leser Wissensmanagement in der. Bioinformatik

Wichtige Themen aus der Vorlesung Bioinformatik II SS 2014

1. Absolventenfeier Bioinformatik. 8. Juli 2005

Aufbau und Konformation von Polypeptiden

Softwareprojektpraktikum Maschinelle Übersetzung

Dynamische Programmierung. Problemlösungsstrategie der Informatik

Efficient Learning of Label Ranking by Soft Projections onto Polyhedra

Die wichtigsten Bioinformatikdatenbanken. SwissProt, PDB, Scop, CATH, FSSP, PROSITE, Pfam

Algorithmen auf Sequenzen

Kapitel 3: Sortierverfahren Gliederung

RNA Faltung - II. W1-High-throughput Genomics, FU Berlin OWL RNA Bioinformatics, MPI Molgen Berlin

Support Vector Machines, Kernels

Informationsvisualisierung

Kapitel 2: Zahlentheoretische Algorithmen Gliederung

Sequenzvergleiche ohne Alignments durch lokales Dekodieren von Sequenzen

Bildsegmentierung mit Level Sets

Der LLL - Algorithmus. Seminar ganzzahlige Optimierung Wintersemester 2006/2007

3 Proteinstrukturen. Modul Bioinformatik von RNA- und Proteinstrukturen. Stephan Bernhart. 29. Mai Professur Bioinformatik

Algorithmische Geometrie 1. Einführung

Algorithmische Bioinformatik

Bioinformatik Für Biophysiker

Algorithm Theory 3 Fast Fourier Transformation Christian Schindelhauer

Übung Algorithmen und Datenstrukturen

Einführung Molekulare Bioinformatik

Learning Phrase Representations using RNN Encoder Decoder for Statistical Machine Translation. Yupeng Guo

Bioinformatik für Lebenswissenschaftler

Sequenzanalyse-Praktikum

mit Ungleichungen als Restriktionen Quadratische Programmierung Gliederung Geodätische Woche 2009 Lutz Roese-Koerner und Wolf-Dieter Schuh

Transkript:

Threading - Algorithmen Florian Lindemann 22.11.2007 Florian Lindemann () Threading - Algorithmen 22.11.2007 1 / 25

Gliederung 1 Prospect Scoring Function Algorithmus Weitere Eigenschaften Komplexität Ergebnisse 2 Prospect II 3 Raptor 4 Fazit Florian Lindemann () Threading - Algorithmen 22.11.2007 2 / 25

PROtein Structure Prediction and Evaluation Computer Toolkit Threading System/Algorithmus, vorgestellt 2000 Findet globales Threading-Alignment zwischen Target-Sequenz und Template Kombiniert Sequenz, Struktur und evolutionäre Informationen Divide & Conquer als Grundlage für Algorithmus Florian Lindemann () Threading - Algorithmen 22.11.2007 3 / 25

Florian Lindemann () Threading - Algorithmen 22.11.2007 4 / 25

Scoring Function E total = ω mutate E mutate + ω single E single + ω pair E pair + ω gap E gap Berechnet Maß zur Alignment-Bewertung Basiert auf statistischen Daten aus Datenbanken Florian Lindemann () Threading - Algorithmen 22.11.2007 5 / 25

Scoring Function E mutate = e mutate (a 1 ; a 2 ) a 1 = Template-Aminosäure a 2 = Target-Aminosäure Werte aus PAM250-Matrix. Florian Lindemann () Threading - Algorithmen 22.11.2007 6 / 25

Scoring Function E single = e single (a; s; t) a = Target-Aminosäure s = Sekundärstruktur im Template t = solvent accessibility Präferenz einer Aminosäure a in einer Sekundärstruktur s vorzukommen. Florian Lindemann () Threading - Algorithmen 22.11.2007 7 / 25

Scoring Function E pair = e pair (a 1 ; a 2 ) a 1 = Template-Aminosäure a 2 = Target-Aminosäure Kontaktpotential zwischen zwei Aminosäuren (max. 7Å Abstand der C β -Atome) Florian Lindemann () Threading - Algorithmen 22.11.2007 8 / 25

Scoring Function E gap = e gap (g) e gap = 10.8 + 0.6 (g 1) Bestrafung für ein Gap der Länge g. Florian Lindemann () Threading - Algorithmen 22.11.2007 9 / 25

Scoring Function E total = ω mutate E mutate + ω single E single + ω pair E pair + ω gap E gap ω xxx Variable Gewichtungen, durch Trainingsets bestimmt Ziel = Alignment mit kleinstem Score wird gesucht Florian Lindemann () Threading - Algorithmen 22.11.2007 10 / 25

Algorithmus Divide&Conquer: Template aufteilen Sekundärstrukturkerne als kleinste Sub-Templates Baumstruktur Florian Lindemann () Threading - Algorithmen 22.11.2007 11 / 25

Algorithmus Florian Lindemann () Threading - Algorithmen 22.11.2007 12 / 25

Algorithmus Florian Lindemann () Threading - Algorithmen 22.11.2007 13 / 25

Algorithmus Für jede Substruktur wird Alignment berechnet Problem: Kontaktpotentiale können nicht berechnet werden Lösung: Alle möglichen Alignments werden in betracht gezogen Substruktur-Baum wird von unten nach oben abgearbeitet Florian Lindemann () Threading - Algorithmen 22.11.2007 14 / 25

Algorithmus Florian Lindemann () Threading - Algorithmen 22.11.2007 15 / 25

Weitere Eigenschaften Prospect lässt weitere Eigenschaften des Targets zu: Disulfid-Brücken Active Sites NOE distance restraints Geometrische Einschränkungen Reste mit zusätzlichen Eigenschaften werden nur an Positionen aligniert, die diese Eigenschaften auch erfüllen. Florian Lindemann () Threading - Algorithmen 22.11.2007 16 / 25

Komplexität mn + M n T C N T C/2 m = Länge der Templatesequenz n = Länge der Targetsequenz M = Anzahl der Sekundärstrukturkerne N = Maximaler Längenunterschied zweier Loops TC = Topologische Komplexität Florian Lindemann () Threading - Algorithmen 22.11.2007 17 / 25

Ergebnisse Florian Lindemann () Threading - Algorithmen 22.11.2007 18 / 25

Ergebnisse Findet optimales Alignment Super-Family-Set: Gute Ergebnisse Fold-Family-Set: Signifikant schlechter bei gleicher Identität Nicht flexibel genug Alignment-Ergebnis beschreibt nicht Signifikanz Florian Lindemann () Threading - Algorithmen 22.11.2007 19 / 25

II Änderungen Evolutionäre Daten neu berechnet Algorithmus zweigeteilt: a) Dynamic Programming ohne Kontaktpotentiale b) Einbeziehen der Kontaktpotentiale Aussage zur Verlässlichkeit der Vorhersage verbessert durch Einbeziehen von z-scores Florian Lindemann () Threading - Algorithmen 22.11.2007 20 / 25

II CASP3 Ergebnisse Florian Lindemann () Threading - Algorithmen 22.11.2007 21 / 25

RAPTOR Evolutionäre Daten wie in Prospect II Linearer Programmieransatz Berechnungszeit wächst langsamer Speicherverbrauch überschaubarer Florian Lindemann () Threading - Algorithmen 22.11.2007 22 / 25

Fazit http://compbio.ornl.gov/structure/prospect/ Als Vergleichsmöglichkeit Implementierung möglich Ausgangspunkt für eigene Ideen Benutzen bei niedriger Sequenzidentität Florian Lindemann () Threading - Algorithmen 22.11.2007 23 / 25

Florian Lindemann () Threading - Algorithmen 22.11.2007 24 / 25

Literatur I Guo J. Ellrott K. Kim D., Xu D. and Xu Y. Prospect ii: protein structure prediction program for genome-scale applications. Protein Engineering, 16:641 650, 2003. J. Xu and M. Li. Raptor: Optimal protein threading by linear programming. Journal of Bioinformatics and Computational Biology, 1:95 117, 2003. Xu Y. and Xu D. Protein threading using prospect: Design and evaluation. PROTEINS: Structure, Function, and genetics, 40:343 354, 2000. Florian Lindemann () Threading - Algorithmen 22.11.2007 25 / 25