Proteinstrukturvorhersage Strukturelle Bioinformatik WS15/16

Proteinstrukturvorhersage Strukturelle Bioinformatik WS15/16 Dr. Stefan Simm, 02.12.2015 simm@bio.uni-frankfurt.de

Proteinstrukturvorhersage EINLEITUNG

Strukturparameter Lokale inter Rest Interaktionen (H-Brücken) Alpha Helix & Beta Faltblatt (regulär) Random coil (irregulär) im Falle des Fehlens einer regulären Struktur M; A; L; E; K für Helices G; P für (Turns) T; F; Y; I; V; W für Faltblätter

alpha-helix and beta-sheet alpha-helix Alpha-Helices: Distanz: 0.54 nm Drehung:3.6 AA Versetzung:0.15 nm Beta-Faltblätter: beta-faltblatt Parallel oder antiparallel Versetzung zum Nachbarn: 0.35 nm

Topologie Topologie deer Proteine Homology modeling Vorhersage von secondary structures Vorhersage von Modifikationsstellen Methylation Phosphorylation Ubiquitination Sortierung von Proteinen Vorhersage von Signal Sequenzen

Proteinstrukturvorhersage SEKUNDÄRSTRUKTURVORHERSAGE

Sequenzanalyse Vorhersage von TPR-like helical repeats http://toolkit.tuebingen.mpg.de/tprpred Sekundärstrukturvorhersage http://bioinf.cs.ucl.ac.uk/psipred/ http://www.compbio.dundee.ac.uk/www-jpred/ Disorder Vorhersage http://bioinf.cs.ucl.ac.uk/disopred/ Domänenvorhersage http://pfam.sanger.ac.uk/search

Programme zur Strukturvorhersage PsiPred http://www.psipred.net/psiform.html Jnet (Jpred 3) http://www.compbio.dundee.ac.uk/www-jpred/ Sspro (Sspro 4.0) http://download.igb.uci.edu/sspro4.html GeneSilico (Registrierung erforderlich) https://genesilico.pl/meta2/

PsiPred Höhe des Balkens korreliert mit Wahrscheinlichkeit gelber Pfeil Beta Faltblatt pinker Zylinder Alpha Helix schwarze Linie unstrukturiert (Coil)

Jpred/Jnet Symbol Pale blue meaning hydrophobic Pale green conserved polar gelber Pfeil Beta Faltblatt Small letters small residues pinker Zylinder Alpha Helix Red fully conserved Blue text Proline B verdeckte AA in flüssiger Umgebung Red text Histidine Höhe der Nummer korreliert Boxed mit Wahrscheinlichkeit Aliphatic (L, I or V) Yellow Cystine

SSpro Short cut H G I E B T S C Secondary structure Alpha-helix 3-10-helix Pi-helix Extended strand Beta-bridge Turn Bend Rest Genauigkeit von ~76% Vorhersage beruht auf Zusammenschluss von 100 1D-RNN (recurrent neural networks) pi-helix teilweise üblich in Membranproteinen und besitzt 4.4 reste pro Drehung 3-10-helix besitzt 3 Reste pro Drehung und ist häufig in globulären Proteinen sowie am Ende von Helices

Proteinstrukturvorhersage GENESILICO

GeneSilico Proteinstrukturvorhersage Meta-Server Input (query sequence) Verwendet werden: Fold recognition methods Comparative Modeling Novel Fold Secondary Structure Prediction Konsensus Modell verringert die Wahrscheinlichkeit von Falsch-Positiven

hmmpfam Geeignet für multiple Sequenzalignments oder Einzelsequenzen Suche nach annotierten Domänen in der Pfam Datenbank (Protein Familien sind dargestellt durch multiple Alignments/HMM s) Der Score ist ähnlich dem E-Wert

hhsearch_cdd Tool zum Vergleich von Profilen gegeneinander Query Sequenzprofil gegen Multiple Alignment Profile Erstellung des Sequenzprofils erfolgt mittels hhsearch auf der CDD (Conserved Domains Database)

Protein Domänen scooby & globplot identifizieren globulare Regionen durch Hydrophobizität domac, dompro, domssea nutzen evolutionäre Informationen, vorhergesagte Sekundärstrukturen & flüssige Zugänglichkeit

Transmembrane Helices memsat identifiziert transmembrane Helices durch eine Mutationsfrequenz-Matrix einer Proteinklasse scampi etc. nutzen Positions-spezifische Aminosäure Einflüsse auf die freie Energie von Membran Proteinen

Protein Ordnung Gute Vorhersageergebnisse disopred spritz sagt ungeordnete Regionen voraus und verwendet hierzu Support Vektor Maschinen (SVM) trainiert durch experimental nachgewiesene lange ungeordnete Fragmente (>=30 AA)

Coiled Coils coils vergleicht die Sequenz mit bekannten parallelen doppelsträngigen coiled-coils marcoil benutzt ein HMM für die Vorhersage von coiled-coils (Hohe Genauigkeit für kurze coiled-coils)

Sekundärstruktur Die Vorhersageprogramme verwenden teils Eigenschaften der letzten Slides für die Vorhersage E beta-sheet; H alpha-helix Der Konsensus übernimmt die Struktur pro Spalte bei einem Überlapp von 6 der 10 Programme

Proteinstrukturvorhersage TERTIÄRSTRUKTURVORHERSAGE

Tertiärstrukturvorhersage HHpred fold recognition http://toolkit.tuebingen.mpg.de/hhpred Phyre 2 homology recognition http://www.sbg.bio.ic.ac.uk/phyre2/html/page.cgi?id=index Structure databases PDB (crystal & NMR structures) http://www.pdb.org

HHpred Identifizierung von homologen Sequenzen Bekannte Strukturen als Templat nutzen

Phyre 2

Phyre 2 Output I Registrierung auf Phyre 2 ermöglicht: Submission von bis zu 50 Sequenzen auf einmal

Phyre Output II

3D Strukturen von: PDB Übersicht Proteinen, Nukleinsäure, Komplex Assemblierung

PDB Detail Ansicht

Proteinstrukturvorhersage TRANSMEMBRANE REGIONEN VORHERSAGEN

α-helicale Transmembranregionen TMHMM http://www.cbs.dtu.dk/services/tmhmm/ TOPCONS http://topcons.cbr.su.se/ TMPRED http://www.ch.embnet.org/software/tmpred_fo rm.html

TOPCONS

TMPRED

β-barrel Transmembranregionen BOMP http://services.cbu.uib.no/tools/bomp PRED-TMBB http://biophysics.biol.uoa.gr/pred- TMBB/input.jsp TBBpred http://www.imtech.res.in/raghava/tbbpred/

PRED-TMBB

TBBpred

Proteinstrukturvorhersage DOCKING

Definition von Docking Gegeben: Zwei biologische Moleküle Interaktionspartner aus einer Datenbank mit bekannter Struktur Ziel: Entscheidung ob die Moleküle interagieren Orientierung der Interaktion um die Energie des Komplexes zu minimieren

Warum ist Docking interessant? Starke Relevanz in der zellulären Biologie da die Funktion beeinflusst wird durch: die Interaktion mit sich selbst Die Interaktion mit anderen molekularen Komponenten Docking als Schlüssel für Drug Design: Inhibitoren finden für Zielproteine Entwicklen von neuen Stoffen

Worin besteht die Schwierigkeit? Beide Moleküle besitzen eine gewisse Flexibilität Interaktion miteinander kann die Struktur verändern: Hunderte / Tausende von Freiheitsgraden Summe aller möglichen Konfirmationen ist gigantisch

Typen von Docking Studien Protein-Protein Docking Beide Moleküle werden als starr behandelt Nur 6 Freiheitsgrade vorhanden Sterische Einschränkungen limitieren den Suchraum und mögliche Bindekonformationen Protein-Ligand Docking Ligand flexibel; Rezeptor starr Suchraum und Freiheitsgrade um einiges größer Reduzierung der Flexibilität durch starre Fragmente Konformationsraum absuchen durch Molekulardynamische Studien oder Monte-Carlo Methoden

Oberflächen Darstellung Jede atomische Sphere wird aus dem van der Waals Radius des Atoms gebildet Würde man eine Tastkugel über die van der Waals Oberfläche rollen, ergibt sich das Connolly surface

Protein-protein docking Docking Problem: Vorhersage der Docking Konfiguration auf Grundlage der Struktur Gebundenes versus ungebundenes Docking Konformationsänderungen

Bound vs. unbound Receptor Detailansicht Ligand Grobe Detailansicht Trypsin/APPI

Proteins: Basics CASP CAPRI ADEFFGKLSTKK. Sequence Monomers +... O O N O O N Building Blocks: backbone & side chains O N N O N... Rigid body degrees of freedom 3 translation 3 rotation Structure Complex

Protein-Ligand Docking

DOCK DOCK funktioniert in 5 Schritten: Schritt 1: Starte mit Kristallstruktur Koordinaten des Ziel Rezeptors Schritt 2: Generiere die molekulare Oberfläche des Rezeptors Schritt 3: Generiere Sphären in der aktiven Bindestelle für putative Liganden Atome Schritt 4: Sphären Zentren dienen als Ausgangspunkt für Liganden Orientierung des Liganden testen Schritt 5: Bestes Scoring für Ligand und Orientierung

DOCK: Beispiel - HIV-1 protease ist der Rezeptor - Aspartyl Gruppen bilden die aktive Seite

DOCK: Beispiel 3 Scoring Schemata: Shape scoring, Electrostatic scoring & Force-field scoring Top Scoring Orientierung von Ligand thioketal

SwissDock

Submission Form

SwissDock Output