Seminar Bioinformatik, Theoretical Analysis of Protein-Protein Interactions Docking von starren und flexiblen Proteinen Präsentation von Andreas Schlicker (andreasschlicker@web.de)
Übersicht Molecular surface recognition: Docking von starren Proteinen und Liganden mit Hilfe von Korrelation geometrischer Eigenschaften Dead-End Elimination theorem (DEE): Reduktion des Konformations-Suchraums bei flexiblem Docking Protein Docking mit flexiblen Seitenketten 2
Molecular surface recognition Docking von Molekülen anhand geometrischer Eigenschaften Form von Interfaces im gebundenen und freien Zustand häufig sehr ähnlich Suche im 6-dimensionalen6 Rotations- und Translationsraum 3
Repräsentation der Moleküle Projektion der 3D- Koordinaten auf ein Gitter Gitterpunkt innerhalb des Moleküls, wenn Atomkern innerhalb Radius r vorhanden [1] [1] 4
Matching von Oberflächen (I) Korrelation der geometrischen Form [1] (:, ;, <) ) gibt die Verschiebung von Molekül b in Bezug auf Molekül a an KeinKein Kontakt Korrelation = 0 KontaktKontakt Korrelation > 0 jee besser der Kontakt, desto größer die Korrelation 5
Matching von Oberflächen (II) Problem: auch Überlappung liefert positive Korrelation Lösung: E in Gleichung [2a] << 0 H in Gleichung [2b] > 0 Überlappung wird mit negativer Korrelation bestraft [1] 6
Berechnung (I) Direkte Berechnung der Korrelation benötigt Zeit O(N 6 ) Verwende Fourier Transformation [1] Korrelation wird durch Inverse Fourier- Transformation erhalten Benötigte Zeit liegt in O(N³ln(N ln(n³)) 7
Berechnung (II) Molekül a wird fixiert, Molekül b wird in allen Orientierungen getestet [1] 8
Resultate Test mit 5 Komplexen, zwei Durchgänge mit unterschiedlichen Gitter-Größen Größen [1] [1] [1] 9
Vor- und Nachteile Vorteile: Schnelle Berechnung Meistens korrekte Vorhersage Parameter sind universell einsetzbar Nachteile: Starre Moleküle Keine Berücksichtigung physiko-chemischer Eigenschaften 10
Dead-End Elimination Theorem Konformationsraum von Proteinen sehr groß, selbst bei Verwendung von Rotamer- Bibliotheken Systematische Suche nach der global minimum energy conformation (GMEC) praktisch unmöglich 11
Energie einer Konformation Potentielle Energie eines Proteins: [2] 12
Dead-Ending Rotamere Rotamere,, die in der GMEC nicht vorkommen können Rotamer i r kann nicht vorkommen, wenn für ein Paar (i( r, i t ) gilt: [2] 13
Erweiterung auf Rotamerpaare Energie eines Rotamerpaares [i r j s ] Interaktionsenergie mit anderen Rotameren Rotamerpaar [i r j s ] ist dead-ending,, wenn gilt: [2] [2] [2] 14
Algorithmus Eliminiere alle Rotamere,, die offensichtlich inkompatibel sind Eliminiere dead dead-ending Rotamere mit dem DEE Theorem Wende DEE Theorem auf alle Rotamerpaare an und markiere dead dead-ending Paare Iteriere,, bis keine weiteren Rotamere mehr entfallen 15
Resultate (I) Test mit dem Insulin-Dimer anfängliche Kombinationsmöglichkeiten: 2,7*10 76 Nach 9 Iterationen: 7200 Modellierung des Proteins liefert 55 richtig vorhergesagte Residuen Verborgene Residuen werden mit 93% Genauigkeit vorhergesagt [2] 16
Resultate (II) Blind-Test an Limulus polyphemus 194 Aminosäuren, wovon 71 % richtig vorhergesagt wurden Viele Fehler durch falsche Salz- und Wasserstoffbrücken an exponierten Gruppen 17
Vor- und Nachteile Vorteile: Schnelle Berechnung (Aufwand steigt nur quadratisch mit Anzahl der Aminosäuren) Starke Reduzierung des Suchraums Nachteile: Ungenauigkeiten durch verwendete Energiefunktion Benötigt relativ genaues Template Abhängig von der verwendeten Rotamer-Bibliothek 18
Protein Docking mit flexiblen Seitenketten Docking von rigiden Strukturen keine gute Lösung Problem des exponentiellen Wachstums des Konformationsraums bei flexiblen Seitenketten 19
Flexibilität Alle Residuen flexibel behandeln sehr aufwändig selbst bei Verwendung von Rotamer- Bibliotheken Nur Interface-Residuen flexibel Interface benötigt Rigides Docking zur Erzeugung von Anfangsstrukturen 20
Rigides Docking Verwendet geometrische und einfache chemische Fitness Funktionen Von den erzeugten Komplexstrukturen wurden die 60 besten weiter verfolgt Oft große Überlappung der Proteine und inkorrekt platzierte Seitenketten 21
Bestimmung der Bindungsstelle Residuen, die innerhalb 6 Å eines Atoms des anderen Proteins liegen Seitenketten ohne Rotamere (CYS in Disulfidbrücken,, ALA, GLY) werden nicht berücksichtigt 22
GMEC GMEC = Kombination der Rotamere,, die die niedrigste Energie liefern [3] Anwendung des DEE-Theorems möglichm 23
Suche nach der GMEC Zwei Strategien: Multi-Greedy Methode Branch-and and-cut basierend auf einem ILP 24
Multi-Greedy Methode (I) Aufbau eines Enumerations-Baumes mit möglichen Kombinationen 25 [3]
Integer Linear Program (ILP) Formulierung als Minimierungs-Problem auf einem ungerichteten Graphen Knoten v für alle Rotamere, E(v) ) = E tpl Kanten uv für Rotamer-Paare tpl ir ir - E max Paare verschiedener Residuen, E(uv) ) = E pw ir,js - E max k-partiter Graph mit negativen Kanten- und Knoten- Gewichten GMEC entspricht Rotamer-Graph mit minimalem Gewicht 26
ILP (II) [3] [3] 27
Branch-and and-cut Lösen der Relaxation des ILPs Falls LösungL Y nicht optimal, suche nach fa <= f 0, die Y als mögliche LösungL ausschließt Falls keine Ungleichung gefunden wird, aufsplitten in zwei Unterprobleme 28
Energieberechnung Optimierung der GMEC mit AMBER Freie Bindungsenergie: ZG ES : elektrostatischer Beitrag ZG cav : freie Cavitäts-Energie in Wasser ZG conf : Änderung der Entropie ZG vdw : Änderung der freien van-der der-waals Energie [3] 29
Algorithmus (I) Generierung von Ausgangsstrukturen mit Hilfe von rigidem Docking Bestimmung der Aminosäuren am Interface Variation dieser Aminosäuren durch Rotamere Iterative Anwendung des DEE Theorems zur Reduktion des Konformationsraumes 30
Algorithmus (II) Finden der GMEC mit Hilfe der schnellen Heuristic bzw. des exakten branch-and and-cut Algorithmus Optimierung der Molekülgeometrien mit Hilfe eines Molekülmechanik Kraftfeldes Berechnung der freien Bindungsenergie 31
Resultate (I) Test mit drei Protein Komplexen Anwendung des DEE ergibt große Vereinfachung [3] 32
Resultate (II) [3] 33
Resultate (III) [3] 34
Resultate (IV) [3] 35
Vor- und Nachteile Vorteile: Heuristik liefert schnell gute Annäherung an optimale Lösung Branch-and and-cut liefert optimale Rotamere Nachteile: Keine perfekte Trennung von guten und schlechten Ergebnissen Ergebnisse stark von der Wahl des Kraftfeldes abhängig 36
Zusammenfassung Rigides Docking nur erfolgreich, wenn native und Komplexstruktur sehr ähnlich sind Rigides Docking aber guter Startpunkt für flexibles Docking Dead-End elimination starke Vereinfachung bei flexiblem Docking 37
Referenzen [1] Katchalski-Katzir, E., Shariv, I., et al., (1992) PNAS, 89, 2195-2199. Molecular Surface Recognition: Determination of Geometric Fit between Proteins and their Ligands by Correlation Techniques [2] Desmet, J., De Maeyer, M., Hazes, B., and Lasters, I., (1992) Nature, 356, 539-542. DEE Theorem and its Use in Protein Side Chain Positioning [3] Althaus, E., Kohlbacher,, O., Lenhof,, H.-P., and Muller, P., (2002) J. Comput.. Biol., 9, 597-612. A Combinatorial Approach to Protein Docking with Flexible Side Chains 38