Threading - Algorithmen Florian Lindemann 22.11.2007 Florian Lindemann () Threading - Algorithmen 22.11.2007 1 / 25
Gliederung 1 Prospect Scoring Function Algorithmus Weitere Eigenschaften Komplexität Ergebnisse 2 Prospect II 3 Raptor 4 Fazit Florian Lindemann () Threading - Algorithmen 22.11.2007 2 / 25
PROtein Structure Prediction and Evaluation Computer Toolkit Threading System/Algorithmus, vorgestellt 2000 Findet globales Threading-Alignment zwischen Target-Sequenz und Template Kombiniert Sequenz, Struktur und evolutionäre Informationen Divide & Conquer als Grundlage für Algorithmus Florian Lindemann () Threading - Algorithmen 22.11.2007 3 / 25
Florian Lindemann () Threading - Algorithmen 22.11.2007 4 / 25
Scoring Function E total = ω mutate E mutate + ω single E single + ω pair E pair + ω gap E gap Berechnet Maß zur Alignment-Bewertung Basiert auf statistischen Daten aus Datenbanken Florian Lindemann () Threading - Algorithmen 22.11.2007 5 / 25
Scoring Function E mutate = e mutate (a 1 ; a 2 ) a 1 = Template-Aminosäure a 2 = Target-Aminosäure Werte aus PAM250-Matrix. Florian Lindemann () Threading - Algorithmen 22.11.2007 6 / 25
Scoring Function E single = e single (a; s; t) a = Target-Aminosäure s = Sekundärstruktur im Template t = solvent accessibility Präferenz einer Aminosäure a in einer Sekundärstruktur s vorzukommen. Florian Lindemann () Threading - Algorithmen 22.11.2007 7 / 25
Scoring Function E pair = e pair (a 1 ; a 2 ) a 1 = Template-Aminosäure a 2 = Target-Aminosäure Kontaktpotential zwischen zwei Aminosäuren (max. 7Å Abstand der C β -Atome) Florian Lindemann () Threading - Algorithmen 22.11.2007 8 / 25
Scoring Function E gap = e gap (g) e gap = 10.8 + 0.6 (g 1) Bestrafung für ein Gap der Länge g. Florian Lindemann () Threading - Algorithmen 22.11.2007 9 / 25
Scoring Function E total = ω mutate E mutate + ω single E single + ω pair E pair + ω gap E gap ω xxx Variable Gewichtungen, durch Trainingsets bestimmt Ziel = Alignment mit kleinstem Score wird gesucht Florian Lindemann () Threading - Algorithmen 22.11.2007 10 / 25
Algorithmus Divide&Conquer: Template aufteilen Sekundärstrukturkerne als kleinste Sub-Templates Baumstruktur Florian Lindemann () Threading - Algorithmen 22.11.2007 11 / 25
Algorithmus Florian Lindemann () Threading - Algorithmen 22.11.2007 12 / 25
Algorithmus Florian Lindemann () Threading - Algorithmen 22.11.2007 13 / 25
Algorithmus Für jede Substruktur wird Alignment berechnet Problem: Kontaktpotentiale können nicht berechnet werden Lösung: Alle möglichen Alignments werden in betracht gezogen Substruktur-Baum wird von unten nach oben abgearbeitet Florian Lindemann () Threading - Algorithmen 22.11.2007 14 / 25
Algorithmus Florian Lindemann () Threading - Algorithmen 22.11.2007 15 / 25
Weitere Eigenschaften Prospect lässt weitere Eigenschaften des Targets zu: Disulfid-Brücken Active Sites NOE distance restraints Geometrische Einschränkungen Reste mit zusätzlichen Eigenschaften werden nur an Positionen aligniert, die diese Eigenschaften auch erfüllen. Florian Lindemann () Threading - Algorithmen 22.11.2007 16 / 25
Komplexität mn + M n T C N T C/2 m = Länge der Templatesequenz n = Länge der Targetsequenz M = Anzahl der Sekundärstrukturkerne N = Maximaler Längenunterschied zweier Loops TC = Topologische Komplexität Florian Lindemann () Threading - Algorithmen 22.11.2007 17 / 25
Ergebnisse Florian Lindemann () Threading - Algorithmen 22.11.2007 18 / 25
Ergebnisse Findet optimales Alignment Super-Family-Set: Gute Ergebnisse Fold-Family-Set: Signifikant schlechter bei gleicher Identität Nicht flexibel genug Alignment-Ergebnis beschreibt nicht Signifikanz Florian Lindemann () Threading - Algorithmen 22.11.2007 19 / 25
II Änderungen Evolutionäre Daten neu berechnet Algorithmus zweigeteilt: a) Dynamic Programming ohne Kontaktpotentiale b) Einbeziehen der Kontaktpotentiale Aussage zur Verlässlichkeit der Vorhersage verbessert durch Einbeziehen von z-scores Florian Lindemann () Threading - Algorithmen 22.11.2007 20 / 25
II CASP3 Ergebnisse Florian Lindemann () Threading - Algorithmen 22.11.2007 21 / 25
RAPTOR Evolutionäre Daten wie in Prospect II Linearer Programmieransatz Berechnungszeit wächst langsamer Speicherverbrauch überschaubarer Florian Lindemann () Threading - Algorithmen 22.11.2007 22 / 25
Fazit http://compbio.ornl.gov/structure/prospect/ Als Vergleichsmöglichkeit Implementierung möglich Ausgangspunkt für eigene Ideen Benutzen bei niedriger Sequenzidentität Florian Lindemann () Threading - Algorithmen 22.11.2007 23 / 25
Florian Lindemann () Threading - Algorithmen 22.11.2007 24 / 25
Literatur I Guo J. Ellrott K. Kim D., Xu D. and Xu Y. Prospect ii: protein structure prediction program for genome-scale applications. Protein Engineering, 16:641 650, 2003. J. Xu and M. Li. Raptor: Optimal protein threading by linear programming. Journal of Bioinformatics and Computational Biology, 1:95 117, 2003. Xu Y. and Xu D. Protein threading using prospect: Design and evaluation. PROTEINS: Structure, Function, and genetics, 40:343 354, 2000. Florian Lindemann () Threading - Algorithmen 22.11.2007 25 / 25