Docking von starren und flexiblen Proteinen

Ähnliche Dokumente
Einführung in das Molecular Modelling

Simulation von Brownscher Dynamik und Assoziationsraten von PP-Komplexen. Alexander Baldauf Montag

Construction of Protein Binding Sites in Scaffold Structures

Protein-Protein Bindungsstellen. Lennart Heinzerling

Wichtige Themen aus der Vorlesung Bioinformatik II SS 2017

Wichtige Themen aus der Vorlesung Bioinformatik II SS 2016

MM Proteinmodelling. Michael Meyer. Vorlesung XVII

10. Innere Koordinaten/Kraftfelder

9 Minimum Spanning Trees

Verfahren zu Strukturvorhersagen in vereinfachten Modellen. Tobias Voigt Sommerakademie 2002 St. Johann

1.Aufgabe: Minimal aufspannender Baum

Sokoban. Knowledge Engineering und Lernen in Spielen. Mark Sollweck Fachbereich 20 Seminar Knowledge Engineering Mark Sollweck 1

Bioinformatik für Biochemiker

FLÜSSE, SCHNITTE UND - TEIL 2 - BIPARTITE GRAPHEN. Vortrag im Seminar Hallo Welt Für Fortgeschrittene Dozenten: Werth, T. & Brinkers, D.

Inhaltsverzeichnis. 4 Statistik Einleitung Wahrscheinlichkeit Verteilungen Grundbegriffe 98

Computational Detection of the Binding-Site Hot Spot at the Remodeled Human Growth Hormone-Receptor Interface

Überblick. Kap. 1.4: Minimum Weight Perfect Matching. 1.3 Blüten-Schrumpf Algorithmus für Maximum Matching

Theoretical Analysis of Protein-Protein Interactions. Proseminar SS 2004

Zustandsraumsuche: Blinde und Heuristische Suche. Blinde und Heuristische Suche

Geometrische Algorithmen Segmentschnitt

Überblick. TSP Vergleich der Lösungen. Das Travelling Salesman Problem. Nearest-Neighbor Heuristik für TSP

Kap. 7.1 Heuristiken Kap. 7.2 Approximative Algorithmen und Gütegarantien

Strukturbildende Kräfte in Proteinen

Theoretische Informatik 1

Minimal spannende Bäume

GPU-friendly multi-view stereo reconstruction using surfel representation and graph cuts

Datenbankanwendung. Prof. Dr.-Ing. Sebastian Michel TU Kaiserslautern. Wintersemester 2014/15.

Vorwärtskinematik und inverse Kinematik. Andreas Schmidtke

Materialmodelle für Verbunde Textilverstärkte Duromere, Beton, Gefüllte Elastomere

11. Übung zu Algorithmen I 6. Juli 2016

Wichtige Themen aus der Vorlesung Bioinformatik II SS 2014

Iterative Methods for Improving Mesh Parameterizations

Der Branching-Operator B

Seminar Algorithmentechnik

Übersicht über Informatik und Softwaresystemtechnik WS 99/00, Prof. Dr. Andreas Schwill

Optimierung. Optimierung. Vorlesung 9 Lineare Programmierung & Kombinatorische Optimierung Fabian Kuhn

Einführung in die medizinische Bildverarbeitung WS 12/13

11. GRAPHEN 3 FLÜSSE UND SPANNBÄUME

Einführung in Operations Research

Konvexe Hülle. Konvexe Hülle. Mathematik. Konvexe Hülle: Definition. Mathematik. Konvexe Hülle: Eigenschaften. AK der Algorithmik 5, SS 2005 Hu Bin

Dynamische Programmierung. Problemlösungsstrategie der Informatik

Wissensbasierte Systeme. Kombinatorische Explosion und die Notwendigkeit Heuristischer Suche. Heuristiken und ihre Eigenschaften

Kapitel 7: Flüsse in Netzwerken und Anwendungen Gliederung der Vorlesung

Einführung in die Robotik. Jianwei Zhang

Kollisionserkennung

Sandro Pirkwieser, (Bin Hu, Jakob Puchinger) SS 2010

Entscheidungsverfahren mit Anwendungen in der Softwareverifikation

Neuronalen Netzen. Jens Lehmann. 1. März Institut für Künstliche Intelligenz Fakultät Informatik Technische Universität Dresden

Data Cubes PG Wissensmangement Seminarphase

Algorithmen für schwierige Probleme

Distributed Algorithms. Image and Video Processing

Parallelisierung durch Gebietszerlegung

ADS: Algorithmen und Datenstrukturen 2

Übungsaufgaben. Aufbau und Konformation von Polypeptiden. Einführung in die räumliche Struktur von Proteinen

11. Quantenchemische Methoden

Übungsblatt 6 Lösungsvorschläge

Vorlesung Wissensentdeckung in Datenbanken

Informatik-Sommercamp Mastermind mit dem Android SDK

Identifikation von Intervallmodellen zur Prädiktion

Thema 8 Ein Schätzverfahren für das Wachstum von Gefäßnetzwerken auf der Grundlage von Zufallsgraphen. 2.Definitionen aus Graphentheorie

Graphische Spiele. M i (p) M i (p[i : p i]) M i (p) + ε M i (p[i : p i])

Visualisierung von Graphen

Näherungsverfahren zur Bestimmung der Nullstelle α sind iterativ, d.h. sie liefern eine Folge {x (k) } k=0 mit α = lim x (k). (3.0.

Inverse Kinematik am Robotersimulationsprogramm

Grundlagen der Bildverarbeitung

NP-vollständige Probleme

Darstellungsarten für 3D-Körper. Boundary Representation (BRep):

Berechnung von Abständen

Datenstrukturen & Algorithmen

Branch-and-Bound und Varianten. Kapitel 3. Branch-and-Bound und Varianten. Peter Becker (H-BRS) Operations Research II Wintersemester 2014/15 98 / 159

Lineares Gleichungssystem - Vertiefung

Überblick Kap. 5: Graph Coloring

9. Heuristische Suche

KAPITEL 3 MATCHINGS IN BIPARTITEN GRAPHEN

Programme und Skript-Sprache für die Modellierung von Molekülen und die Behandlung ihrer Konformationen

Ferienkurs zur algorithmischen diskreten Mathematik Kapitel 3: Minimal aufspannende Bäume und Matroide

Kreis - Tangente. 2. Vorbemerkung: Satz des Thales Eine Möglichkeit zur Bestimmung der Tangente benutzt den Satz des Thales.

Threading - Algorithmen

Die Theorie der Toleranzen und deren Anwendung auf das Traveling Salesman Problem

12.4 Traveling Salesman Problem

Das Linear Ordering Problem Exakte Lösungsverfahren. für NP-schwierige. VO Algorithm Engineering

Datenstrukturen und Algorithmen. Christian Sohler FG Algorithmen & Komplexität

3.4 Exakte Verfahren für (Gemischt-) Ganzzahlige Optimierung

Flüsse, Schnitte, bipartite Graphen

Wie komme ich von hier zum Hauptbahnhof?

12. Potentialflächen und Optimierung

Flüsse, Schnitte, bipartite Graphen

Leseprobe. Michael Knorrenschild. Vorkurs Mathematik. Ein Übungsbuch für Fachhochschulen. ISBN (Buch):

Algorithmische Graphentheorie

Ortsbestimmung und Ortsmodelle

ADS: Algorithmen und Datenstrukturen 2

MM Kraftfelder. Michael Meyer. Vorlesung III. Kraftfelder

2.2. Peptide. Peptide entstehen durch Kondensation der a-carboxylgruppe einer Aminosäure mit der a-aminogruppe einer anderen Aminosäure

Berechnung minimaler Spannbäume. Beispiel

Synthese von Teroxazolen als Peptidmimetika

Dynamisches Routing in der Logistik

Vorkurs Mathematik. Ein Übungsbuch für Fachhochschulen. Bearbeitet von Michael Knorrenschild

Very simple methods for all pairs network flow analysis

Euklidische Distanzmatrizen. Andrei Grecu

4.9.7 Konstruktion der Suffixbäume

Transkript:

Seminar Bioinformatik, Theoretical Analysis of Protein-Protein Interactions Docking von starren und flexiblen Proteinen Präsentation von Andreas Schlicker (andreasschlicker@web.de)

Übersicht Molecular surface recognition: Docking von starren Proteinen und Liganden mit Hilfe von Korrelation geometrischer Eigenschaften Dead-End Elimination theorem (DEE): Reduktion des Konformations-Suchraums bei flexiblem Docking Protein Docking mit flexiblen Seitenketten 2

Molecular surface recognition Docking von Molekülen anhand geometrischer Eigenschaften Form von Interfaces im gebundenen und freien Zustand häufig sehr ähnlich Suche im 6-dimensionalen6 Rotations- und Translationsraum 3

Repräsentation der Moleküle Projektion der 3D- Koordinaten auf ein Gitter Gitterpunkt innerhalb des Moleküls, wenn Atomkern innerhalb Radius r vorhanden [1] [1] 4

Matching von Oberflächen (I) Korrelation der geometrischen Form [1] (:, ;, <) ) gibt die Verschiebung von Molekül b in Bezug auf Molekül a an KeinKein Kontakt Korrelation = 0 KontaktKontakt Korrelation > 0 jee besser der Kontakt, desto größer die Korrelation 5

Matching von Oberflächen (II) Problem: auch Überlappung liefert positive Korrelation Lösung: E in Gleichung [2a] << 0 H in Gleichung [2b] > 0 Überlappung wird mit negativer Korrelation bestraft [1] 6

Berechnung (I) Direkte Berechnung der Korrelation benötigt Zeit O(N 6 ) Verwende Fourier Transformation [1] Korrelation wird durch Inverse Fourier- Transformation erhalten Benötigte Zeit liegt in O(N³ln(N ln(n³)) 7

Berechnung (II) Molekül a wird fixiert, Molekül b wird in allen Orientierungen getestet [1] 8

Resultate Test mit 5 Komplexen, zwei Durchgänge mit unterschiedlichen Gitter-Größen Größen [1] [1] [1] 9

Vor- und Nachteile Vorteile: Schnelle Berechnung Meistens korrekte Vorhersage Parameter sind universell einsetzbar Nachteile: Starre Moleküle Keine Berücksichtigung physiko-chemischer Eigenschaften 10

Dead-End Elimination Theorem Konformationsraum von Proteinen sehr groß, selbst bei Verwendung von Rotamer- Bibliotheken Systematische Suche nach der global minimum energy conformation (GMEC) praktisch unmöglich 11

Energie einer Konformation Potentielle Energie eines Proteins: [2] 12

Dead-Ending Rotamere Rotamere,, die in der GMEC nicht vorkommen können Rotamer i r kann nicht vorkommen, wenn für ein Paar (i( r, i t ) gilt: [2] 13

Erweiterung auf Rotamerpaare Energie eines Rotamerpaares [i r j s ] Interaktionsenergie mit anderen Rotameren Rotamerpaar [i r j s ] ist dead-ending,, wenn gilt: [2] [2] [2] 14

Algorithmus Eliminiere alle Rotamere,, die offensichtlich inkompatibel sind Eliminiere dead dead-ending Rotamere mit dem DEE Theorem Wende DEE Theorem auf alle Rotamerpaare an und markiere dead dead-ending Paare Iteriere,, bis keine weiteren Rotamere mehr entfallen 15

Resultate (I) Test mit dem Insulin-Dimer anfängliche Kombinationsmöglichkeiten: 2,7*10 76 Nach 9 Iterationen: 7200 Modellierung des Proteins liefert 55 richtig vorhergesagte Residuen Verborgene Residuen werden mit 93% Genauigkeit vorhergesagt [2] 16

Resultate (II) Blind-Test an Limulus polyphemus 194 Aminosäuren, wovon 71 % richtig vorhergesagt wurden Viele Fehler durch falsche Salz- und Wasserstoffbrücken an exponierten Gruppen 17

Vor- und Nachteile Vorteile: Schnelle Berechnung (Aufwand steigt nur quadratisch mit Anzahl der Aminosäuren) Starke Reduzierung des Suchraums Nachteile: Ungenauigkeiten durch verwendete Energiefunktion Benötigt relativ genaues Template Abhängig von der verwendeten Rotamer-Bibliothek 18

Protein Docking mit flexiblen Seitenketten Docking von rigiden Strukturen keine gute Lösung Problem des exponentiellen Wachstums des Konformationsraums bei flexiblen Seitenketten 19

Flexibilität Alle Residuen flexibel behandeln sehr aufwändig selbst bei Verwendung von Rotamer- Bibliotheken Nur Interface-Residuen flexibel Interface benötigt Rigides Docking zur Erzeugung von Anfangsstrukturen 20

Rigides Docking Verwendet geometrische und einfache chemische Fitness Funktionen Von den erzeugten Komplexstrukturen wurden die 60 besten weiter verfolgt Oft große Überlappung der Proteine und inkorrekt platzierte Seitenketten 21

Bestimmung der Bindungsstelle Residuen, die innerhalb 6 Å eines Atoms des anderen Proteins liegen Seitenketten ohne Rotamere (CYS in Disulfidbrücken,, ALA, GLY) werden nicht berücksichtigt 22

GMEC GMEC = Kombination der Rotamere,, die die niedrigste Energie liefern [3] Anwendung des DEE-Theorems möglichm 23

Suche nach der GMEC Zwei Strategien: Multi-Greedy Methode Branch-and and-cut basierend auf einem ILP 24

Multi-Greedy Methode (I) Aufbau eines Enumerations-Baumes mit möglichen Kombinationen 25 [3]

Integer Linear Program (ILP) Formulierung als Minimierungs-Problem auf einem ungerichteten Graphen Knoten v für alle Rotamere, E(v) ) = E tpl Kanten uv für Rotamer-Paare tpl ir ir - E max Paare verschiedener Residuen, E(uv) ) = E pw ir,js - E max k-partiter Graph mit negativen Kanten- und Knoten- Gewichten GMEC entspricht Rotamer-Graph mit minimalem Gewicht 26

ILP (II) [3] [3] 27

Branch-and and-cut Lösen der Relaxation des ILPs Falls LösungL Y nicht optimal, suche nach fa <= f 0, die Y als mögliche LösungL ausschließt Falls keine Ungleichung gefunden wird, aufsplitten in zwei Unterprobleme 28

Energieberechnung Optimierung der GMEC mit AMBER Freie Bindungsenergie: ZG ES : elektrostatischer Beitrag ZG cav : freie Cavitäts-Energie in Wasser ZG conf : Änderung der Entropie ZG vdw : Änderung der freien van-der der-waals Energie [3] 29

Algorithmus (I) Generierung von Ausgangsstrukturen mit Hilfe von rigidem Docking Bestimmung der Aminosäuren am Interface Variation dieser Aminosäuren durch Rotamere Iterative Anwendung des DEE Theorems zur Reduktion des Konformationsraumes 30

Algorithmus (II) Finden der GMEC mit Hilfe der schnellen Heuristic bzw. des exakten branch-and and-cut Algorithmus Optimierung der Molekülgeometrien mit Hilfe eines Molekülmechanik Kraftfeldes Berechnung der freien Bindungsenergie 31

Resultate (I) Test mit drei Protein Komplexen Anwendung des DEE ergibt große Vereinfachung [3] 32

Resultate (II) [3] 33

Resultate (III) [3] 34

Resultate (IV) [3] 35

Vor- und Nachteile Vorteile: Heuristik liefert schnell gute Annäherung an optimale Lösung Branch-and and-cut liefert optimale Rotamere Nachteile: Keine perfekte Trennung von guten und schlechten Ergebnissen Ergebnisse stark von der Wahl des Kraftfeldes abhängig 36

Zusammenfassung Rigides Docking nur erfolgreich, wenn native und Komplexstruktur sehr ähnlich sind Rigides Docking aber guter Startpunkt für flexibles Docking Dead-End elimination starke Vereinfachung bei flexiblem Docking 37

Referenzen [1] Katchalski-Katzir, E., Shariv, I., et al., (1992) PNAS, 89, 2195-2199. Molecular Surface Recognition: Determination of Geometric Fit between Proteins and their Ligands by Correlation Techniques [2] Desmet, J., De Maeyer, M., Hazes, B., and Lasters, I., (1992) Nature, 356, 539-542. DEE Theorem and its Use in Protein Side Chain Positioning [3] Althaus, E., Kohlbacher,, O., Lenhof,, H.-P., and Muller, P., (2002) J. Comput.. Biol., 9, 597-612. A Combinatorial Approach to Protein Docking with Flexible Side Chains 38