Proteinstrukturvorhersage Strukturelle Bioinformatik WS15/16

Ähnliche Dokumente
Threading - Algorithmen

Theoretical Analysis of Protein-Protein Interactions. Proseminar SS 2004

VL Algorithmische BioInformatik (19710) WS2013/2014 Woche 16 - Mittwoch. Annkatrin Bressin Freie Universität Berlin

Ihre Namen: Gruppe: Öffnen Sie die Fasta-Dateien nur mit einem Texteditor, z.b. Wordpad oder Notepad, nicht mit Microsoft Word oder Libre Office.

Bioinformatik. Methoden zur Vorhersage vo n RNA- und Proteinstrukture n. Gerhard Steger

Wichtige Themen aus der Vorlesung Bioinformatik II SS 2014

Bioinformatik I (Einführung)

Die wichtigsten Bioinformatikdatenbanken. SwissProt, PDB, Scop, CATH, FSSP, PROSITE, Pfam

1/10. Ihre Namen: Gruppe: Evolutionsbiologie 2, WS2015/2016: Bioinformatik - Übung 1

Wichtige Themen aus der Vorlesung Bioinformatik II SS 2016

Nicht-regelmäßige Sekundärstruktur Sekundärstrukturvorhersage Strukturmotive

MM Proteinmodelling. Michael Meyer. Vorlesung XVII

From gene to 3D model

Molecular Modeling: Computergestützte Verfahren in der modernen Arzneistoffentwicklung. Structure-Based Design

Molecular Modeling: Computergestützte Verfahren in der modernen Arzneistoffentwicklung. Struktur-basiertes Design (Structure-Based Design)

Motiv und Domänensuche

T-Zellrezeptor/Peptid/Haupthistokompatibilitätskomplex Interaktionsvisualisierung

From Synthetic Coiled Coils to Functional Proteins: Automated Design of a Receptor for the Calmodulin-binding Domain of Calcineurin

Statistische Verfahren:

Proteinstrukturklassen α-helikale Proteine

Vertiefendes Seminar zur Vorlesung Biochemie

Moleküldynamik und Docking

Strukturbildende Kräfte in Proteinen

Proteinsequenzen. Raumstruktur GPCR. G-Protein gekoppelte Rezeptoren

Was ist Bioinformatik?

Vorlesung Biophysik I - Molekulare Biophysik Kalbitzer/Kremer/Ziegler

Modulation of protein-protein interaction by structure-based ligand design

Enzyme (Teil 1) Aminosäuren, Aufbau, Eigenschaften & Funktion. Mag. Gerald Trutschl

Membran-Aufbau. Michael Hertrich Bielefeld University Version 2.1.3

Construction of Protein Binding Sites in Scaffold Structures

Biowissenschaftlich recherchieren

Maschinelles Lernen in der Bioinformatik

MOL.504 Analyse von DNA- und Proteinsequenzen

Development and Application of new Methods for the Virtual Screening of Chemical Databases

Evolution & Genetik (Beispiel Hämoglobin) Prof. Dr. Antje Krause FH Bingen / akrause@fh-bingen.de

W i e P r o t e i n e f e r t i g g e m a c h t w e r d e n

MODELING STRUCTURE- FUNCTION RELATIONSHIPS OF MACROMOLECULAR LIGAND BINDING SITES BY FUZZY GRAPHS

Solution structure of the potential splicing factor RBMY in complex with an RNA stem-ioop

Screening nach neuen Wirkstoffen was kann man von computer- basierten Methoden erwarten?

Weitere Übungsfragen

Circulardichroismus (CD) und Fluoreszenz - Anwendungen in der Proteinchemie -

Referat : Aufbau v. Proteinen u. ihre Raumstruktur

MOL.504 Analyse von DNA- und Proteinsequenzen. Modul 2 BLAST-Sequenzsuche und Sequenzvergleiche

Kleiner Führerschein für Datenbanken und ein Programm zur 3D-Visualisierung

Bioinformatik: Schnittstelle zwischen Informatik und Life-Science

Ausbreitung von elektromagnetischer Strahlung

V5: Proteinstruktur: Sekundärstruktur

ORDNUNG UND UNORDNUNG

Bioinformatik. Substitutionsmatrizen BLAST. Ulf Leser Wissensmanagement in der. Bioinformatik

Kapitel 1 Einleitung

Literatur. Supramolecular Chemistry, 2nd edition Jonathan W. Steed, Jerry L. Atwood Wiley

IDENTIFICATION OF ALLOSTERIC BINDING SITES IN SILICO

Luke Alphey. DNA-Sequenzierung. Aus dem Englischen übersetzt von Kurt Beginnen. Spektrum Akademischer Verlag

Kraftfeldmethoden von der Energieminimierung zur Moleküldynamik. Frank Cordes

Übungen zu den Vorlesungen Aminosäuren und Peptide Proteine

MM Biopolymere. Michael Meyer. Vorlesung XV

Molekularer Mechanismus der Signalübertragung durch Membranen

Softwarewerkzeuge der Bioinformatik

Lernmaterialblatt Mathematik. Vektorrechnung eine Einführung. Anwendung Mathematik I. Einleitung:

T-Zellrezeptor/Peptid/Haupthistokompatibilitätskomplex Interaktionsvisualisierung mittels JMol

Nanotechnologie der Biomoleküle. Aminosäuren und Proteine: Bausteine der Biologie und der Bionanotechnologie. Aufbau Struktur Funktion

Comparing Software Factories and Software Product Lines

Bioinformatik. Lokale Alignierung Gapkosten. Silke Trißl / Ulf Leser Wissensmanagement in der. Bioinformatik

Vektoren. Jörn Loviscach. Versionsstand: 11. April 2009, 23:42

Aminosäuren. Seitenkette. -Kohlenstoffatom. Karboxilgruppe. Aminogruppe

Wiederholungsklausur zur Vorlesung Biochemie I im WS 2004/05

Sequenz Alignment Teil 2

8. Translation. Konzepte: Translation benötigt trnas und Ribosomen. Genetischer Code. Initiation - Elongation - Termination

Proteinstrukturen: Faltung, Vergleich und Vorhersage

Biologie für Mediziner

Einführung in die räumliche Struktur von Proteinen

BLAST. Ausarbeitung zum Proseminar Vortag von Nicolás Fusseder am

Genexpressionsregulation

3 METHODEN. 3.1 Modellierung von Proteinstrukturen Sequenzanalyse

Einführung in das Molecular Modelling

Proteine: Dreidimensionale Struktur

Übung Zellkommunikation. Vorlesung Bio-Engineering Sommersemester Kapitel 4. 4

Predictive Modeling Markup Language. Thomas Morandell

InterPro & SP-ML. Syntax und Verwendung der Beschreibungssprache XML Ausarbeitung im Seminar XML in der Bioinformatik.

Faltung, Dynamik und strukturelle Evolution der Proteine (Voet Kapitel 8)

Gene, Proteine, Leben: Wie Cloud Computing unser Leben verändern wird

Ferrofluide. Physikalische Grundlagen.

Bioinformatik für Biochemiker

Genregulation bei Eukaryoten II

Reguläre Ausdrücke. Silke Trißl, Prof. Ulf Leser Wissensmanagement in der Bioinformatik

Data Mining-Modelle und -Algorithmen

Proteinstrukturen Strukturelle Bioinformatik WS15/16

Vorhersage von mirna targets in Säugetieren mirna target prediction am Beispiel von TargetScan

Einführung in die Biophysik

Station 4 Crossword puzzle

Was ist Biophysik? Mögliche Definition: Biophysik ist die Lehre von den physikalischen Gesetzmäßigkeiten, die den lebenden Systemen zu Grunde liegen.

G-Protein gekoppelte Rezeptoren. Genomische Datenanalyse 3. Kapitel

Erfahrungsbreicht... Von der Auswahl bis zur Verwendung von Contour im Grossunternehmen.

Zellulärer Abbau von Proteinen in Aminosäuren:! Proteine werden in Zellen durch Proteasom-Komplexe in! einzelne Aminosäuren abgebaut.!

Modul 8: Bioinformatik A. Von der DNA zum Protein Proteinsynthese in silicio

Protein-NMR. Vertiefungsfach Analytische Chemie (WS2015/16) Dr. Peter Bellstedt NMR Plattform IAAC & IOMC

ANalysis Of VAriance (ANOVA) 2/2

1. Sekundärstruktur 2. Faserproteine 3. Globuläre Proteine 4. Protein Stabilisierung 5. Quartärstruktur

Programme und Skript-Sprache für die Modellierung von Molekülen und die Behandlung ihrer Konformationen

Antibiotika sind oft Inhibitoren der Genexpression

Transkript:

Proteinstrukturvorhersage Strukturelle Bioinformatik WS15/16 Dr. Stefan Simm, 02.12.2015 simm@bio.uni-frankfurt.de

Proteinstrukturvorhersage EINLEITUNG

Strukturparameter Lokale inter Rest Interaktionen (H-Brücken) Alpha Helix & Beta Faltblatt (regulär) Random coil (irregulär) im Falle des Fehlens einer regulären Struktur M; A; L; E; K für Helices G; P für (Turns) T; F; Y; I; V; W für Faltblätter

alpha-helix and beta-sheet alpha-helix Alpha-Helices: Distanz: 0.54 nm Drehung:3.6 AA Versetzung:0.15 nm Beta-Faltblätter: beta-faltblatt Parallel oder antiparallel Versetzung zum Nachbarn: 0.35 nm

Topologie Topologie deer Proteine Homology modeling Vorhersage von secondary structures Vorhersage von Modifikationsstellen Methylation Phosphorylation Ubiquitination Sortierung von Proteinen Vorhersage von Signal Sequenzen

Proteinstrukturvorhersage SEKUNDÄRSTRUKTURVORHERSAGE

Sequenzanalyse Vorhersage von TPR-like helical repeats http://toolkit.tuebingen.mpg.de/tprpred Sekundärstrukturvorhersage http://bioinf.cs.ucl.ac.uk/psipred/ http://www.compbio.dundee.ac.uk/www-jpred/ Disorder Vorhersage http://bioinf.cs.ucl.ac.uk/disopred/ Domänenvorhersage http://pfam.sanger.ac.uk/search

Programme zur Strukturvorhersage PsiPred http://www.psipred.net/psiform.html Jnet (Jpred 3) http://www.compbio.dundee.ac.uk/www-jpred/ Sspro (Sspro 4.0) http://download.igb.uci.edu/sspro4.html GeneSilico (Registrierung erforderlich) https://genesilico.pl/meta2/

PsiPred Höhe des Balkens korreliert mit Wahrscheinlichkeit gelber Pfeil Beta Faltblatt pinker Zylinder Alpha Helix schwarze Linie unstrukturiert (Coil)

Jpred/Jnet Symbol Pale blue meaning hydrophobic Pale green conserved polar gelber Pfeil Beta Faltblatt Small letters small residues pinker Zylinder Alpha Helix Red fully conserved Blue text Proline B verdeckte AA in flüssiger Umgebung Red text Histidine Höhe der Nummer korreliert Boxed mit Wahrscheinlichkeit Aliphatic (L, I or V) Yellow Cystine

SSpro Short cut H G I E B T S C Secondary structure Alpha-helix 3-10-helix Pi-helix Extended strand Beta-bridge Turn Bend Rest Genauigkeit von ~76% Vorhersage beruht auf Zusammenschluss von 100 1D-RNN (recurrent neural networks) pi-helix teilweise üblich in Membranproteinen und besitzt 4.4 reste pro Drehung 3-10-helix besitzt 3 Reste pro Drehung und ist häufig in globulären Proteinen sowie am Ende von Helices

Proteinstrukturvorhersage GENESILICO

GeneSilico Proteinstrukturvorhersage Meta-Server Input (query sequence) Verwendet werden: Fold recognition methods Comparative Modeling Novel Fold Secondary Structure Prediction Konsensus Modell verringert die Wahrscheinlichkeit von Falsch-Positiven

hmmpfam Geeignet für multiple Sequenzalignments oder Einzelsequenzen Suche nach annotierten Domänen in der Pfam Datenbank (Protein Familien sind dargestellt durch multiple Alignments/HMM s) Der Score ist ähnlich dem E-Wert

hhsearch_cdd Tool zum Vergleich von Profilen gegeneinander Query Sequenzprofil gegen Multiple Alignment Profile Erstellung des Sequenzprofils erfolgt mittels hhsearch auf der CDD (Conserved Domains Database)

Protein Domänen scooby & globplot identifizieren globulare Regionen durch Hydrophobizität domac, dompro, domssea nutzen evolutionäre Informationen, vorhergesagte Sekundärstrukturen & flüssige Zugänglichkeit

Transmembrane Helices memsat identifiziert transmembrane Helices durch eine Mutationsfrequenz-Matrix einer Proteinklasse scampi etc. nutzen Positions-spezifische Aminosäure Einflüsse auf die freie Energie von Membran Proteinen

Protein Ordnung Gute Vorhersageergebnisse disopred spritz sagt ungeordnete Regionen voraus und verwendet hierzu Support Vektor Maschinen (SVM) trainiert durch experimental nachgewiesene lange ungeordnete Fragmente (>=30 AA)

Coiled Coils coils vergleicht die Sequenz mit bekannten parallelen doppelsträngigen coiled-coils marcoil benutzt ein HMM für die Vorhersage von coiled-coils (Hohe Genauigkeit für kurze coiled-coils)

Sekundärstruktur Die Vorhersageprogramme verwenden teils Eigenschaften der letzten Slides für die Vorhersage E beta-sheet; H alpha-helix Der Konsensus übernimmt die Struktur pro Spalte bei einem Überlapp von 6 der 10 Programme

Proteinstrukturvorhersage TERTIÄRSTRUKTURVORHERSAGE

Tertiärstrukturvorhersage HHpred fold recognition http://toolkit.tuebingen.mpg.de/hhpred Phyre 2 homology recognition http://www.sbg.bio.ic.ac.uk/phyre2/html/page.cgi?id=index Structure databases PDB (crystal & NMR structures) http://www.pdb.org

HHpred Identifizierung von homologen Sequenzen Bekannte Strukturen als Templat nutzen

Phyre 2

Phyre 2 Output I Registrierung auf Phyre 2 ermöglicht: Submission von bis zu 50 Sequenzen auf einmal

Phyre Output II

3D Strukturen von: PDB Übersicht Proteinen, Nukleinsäure, Komplex Assemblierung

PDB Detail Ansicht

Proteinstrukturvorhersage TRANSMEMBRANE REGIONEN VORHERSAGEN

α-helicale Transmembranregionen TMHMM http://www.cbs.dtu.dk/services/tmhmm/ TOPCONS http://topcons.cbr.su.se/ TMPRED http://www.ch.embnet.org/software/tmpred_fo rm.html

TMHMM

TOPCONS

TMPRED

β-barrel Transmembranregionen BOMP http://services.cbu.uib.no/tools/bomp PRED-TMBB http://biophysics.biol.uoa.gr/pred- TMBB/input.jsp TBBpred http://www.imtech.res.in/raghava/tbbpred/

BOMP

PRED-TMBB

TBBpred

Proteinstrukturvorhersage DOCKING

Definition von Docking Gegeben: Zwei biologische Moleküle Interaktionspartner aus einer Datenbank mit bekannter Struktur Ziel: Entscheidung ob die Moleküle interagieren Orientierung der Interaktion um die Energie des Komplexes zu minimieren

Warum ist Docking interessant? Starke Relevanz in der zellulären Biologie da die Funktion beeinflusst wird durch: die Interaktion mit sich selbst Die Interaktion mit anderen molekularen Komponenten Docking als Schlüssel für Drug Design: Inhibitoren finden für Zielproteine Entwicklen von neuen Stoffen

Worin besteht die Schwierigkeit? Beide Moleküle besitzen eine gewisse Flexibilität Interaktion miteinander kann die Struktur verändern: Hunderte / Tausende von Freiheitsgraden Summe aller möglichen Konfirmationen ist gigantisch

Typen von Docking Studien Protein-Protein Docking Beide Moleküle werden als starr behandelt Nur 6 Freiheitsgrade vorhanden Sterische Einschränkungen limitieren den Suchraum und mögliche Bindekonformationen Protein-Ligand Docking Ligand flexibel; Rezeptor starr Suchraum und Freiheitsgrade um einiges größer Reduzierung der Flexibilität durch starre Fragmente Konformationsraum absuchen durch Molekulardynamische Studien oder Monte-Carlo Methoden

Oberflächen Darstellung Jede atomische Sphere wird aus dem van der Waals Radius des Atoms gebildet Würde man eine Tastkugel über die van der Waals Oberfläche rollen, ergibt sich das Connolly surface

Protein-protein docking Docking Problem: Vorhersage der Docking Konfiguration auf Grundlage der Struktur Gebundenes versus ungebundenes Docking Konformationsänderungen

Bound vs. unbound Receptor Detailansicht Ligand Grobe Detailansicht Trypsin/APPI

Proteins: Basics CASP CAPRI ADEFFGKLSTKK. Sequence Monomers +... O O N O O N Building Blocks: backbone & side chains O N N O N... Rigid body degrees of freedom 3 translation 3 rotation Structure Complex

Protein-Ligand Docking

DOCK DOCK funktioniert in 5 Schritten: Schritt 1: Starte mit Kristallstruktur Koordinaten des Ziel Rezeptors Schritt 2: Generiere die molekulare Oberfläche des Rezeptors Schritt 3: Generiere Sphären in der aktiven Bindestelle für putative Liganden Atome Schritt 4: Sphären Zentren dienen als Ausgangspunkt für Liganden Orientierung des Liganden testen Schritt 5: Bestes Scoring für Ligand und Orientierung

DOCK: Beispiel - HIV-1 protease ist der Rezeptor - Aspartyl Gruppen bilden die aktive Seite

DOCK DOCK funktioniert in 5 Schritten: Schritt 1: Starte mit Kristallstruktur Koordinaten des Ziel Rezeptors Schritt 2: Generiere die molekulare Oberfläche des Rezeptors Schritt 3: Generiere Sphären in der aktiven Bindestelle für putative Liganden Atome Schritt 4: Sphären Zentren dienen als Ausgangspunkt für Liganden Orientierung des Liganden testen Schritt 5: Bestes Scoring für Ligand und Orientierung

DOCK: Beispiel - HIV-1 protease ist der Rezeptor - Aspartyl Gruppen bilden die aktive Seite

DOCK DOCK funktioniert in 5 Schritten: Schritt 1: Starte mit Kristallstruktur Koordinaten des Ziel Rezeptors Schritt 2: Generiere die molekulare Oberfläche des Rezeptors Schritt 3: Generiere Sphären in der aktiven Bindestelle für putative Liganden Atome Schritt 4: Sphären Zentren dienen als Ausgangspunkt für Liganden Orientierung des Liganden testen Schritt 5: Bestes Scoring für Ligand und Orientierung

DOCK: Beispiel - HIV-1 protease ist der Rezeptor - Aspartyl Gruppen bilden die aktive Seite

DOCK DOCK funktioniert in 5 Schritten: Schritt 1: Starte mit Kristallstruktur Koordinaten des Ziel Rezeptors Schritt 2: Generiere die molekulare Oberfläche des Rezeptors Schritt 3: Generiere Sphären in der aktiven Bindestelle für putative Liganden Atome Schritt 4: Sphären Zentren dienen als Ausgangspunkt für Liganden Orientierung des Liganden testen Schritt 5: Bestes Scoring für Ligand und Orientierung

DOCK: Beispiel - HIV-1 protease ist der Rezeptor - Aspartyl Gruppen bilden die aktive Seite

DOCK DOCK funktioniert in 5 Schritten: Schritt 1: Starte mit Kristallstruktur Koordinaten des Ziel Rezeptors Schritt 2: Generiere die molekulare Oberfläche des Rezeptors Schritt 3: Generiere Sphären in der aktiven Bindestelle für putative Liganden Atome Schritt 4: Sphären Zentren dienen als Ausgangspunkt für Liganden Orientierung des Liganden testen Schritt 5: Bestes Scoring für Ligand und Orientierung

DOCK: Beispiel 3 Scoring Schemata: Shape scoring, Electrostatic scoring & Force-field scoring Top Scoring Orientierung von Ligand thioketal

SwissDock

Submission Form

SwissDock Output