MM Proteinmodelling. Michael Meyer. Vorlesung XVII

Proteinmodelling Vorlesung XVII Proteinstrukturen Es besteht ein sehr großer Bedarf an Proteinstrukturen: Die Kenntnis der 3D-Struktur hat große Vorteile für das Design neuer Wirkstoffe. Experimentelle Daten Einträge in Sequenzdatenbanken 2012 2011 2010 2008 UniProt/Swiss-Prot 538010 530 264 519 348 400 771 UniProtKB/TrEMBL 26 079 526 16 014 672 11 636 205 6 697 103 Einträge in Strukturdatenbanken PDB 85 085 74 140 67 794 54 194 für viele Proteine ist die Sequenz aber nicht die Struktur bekannt! Die experimentelle Strukturbestimmung ist wesentlich aufwendiger als die Sequenzierung. Proteinstrukturen 1

Protein Data Bank J. Kirchmair et al., J. Med. Chem. 51, 7021 (2008). Experimentelle Biopolymerstrukturen und Modelling experimentelle Probleme hohe Kosten Kristallisation schwierig Proteine für NMR-Messungen zu groß Röntgenstrukturen und NMR-Untersuchungen sind die Grundlage für Strukturmodelle von Proteinen. Methoden zur Berechnung von Proteinstrukturen Faltungssimulationen Fold recognition (Threading) Homologiemodeling (Comparative Modelling) Proteinstrukturen 2

Faltungssimulationen Methode systematische oder zufallsgesteuerte Konformationssuche Moleküldynamik Probleme Genauigkeit der Kraftfelder und Lösungsmittelmodelle Vielzahl der Atome Vielzahl der Freiheitsgrade Einsatzbereich anwendbar für Oligopeptide größere Proteine erfordern massiv parallele Rechner Fold Recognition (Threading) Idee Proteine bilden nur eine begrenzte Anzahl von Faltungen aus (ca. 1000 1500), d.h. Proteine mit völlig unterschiedlichen Sequenzen auf die gleiche Weise falten. Welche Faltung ist die beste für eine gegenbene Sequenz? Methode Datenbank mit bekannten Proteinfaltungen scoring-funktionen aus Abständen von Aminosäurepaaren in bekannten Proteinstrukturen aufgestellt Suche die Faltung mit dem besten Score für eine gegebene Sequenz Limitierung Keine Strukturen von Proteinen mit hoher Sequenzidentität erforderlich, aber die Ergebnisse sind für das Wirkstoffdesign zu ungenau. Proteinstrukturen 3

Homologiemodelling (Comparative Modelling) Idee Proteine mit einer ähnlichen Sequenz haben im Allgemeinen auch eine ähnliche Struktur. Methode Die 3D-Struktur eines Proteins wird mit Hilfe bekannter Strukturen von Proteinen mit einer relativ hohen Sequenzidentität extrapoliert. Einsatzbereich Strukturen von Proteinen mit hoher Sequenzidentität erforderlich. Strukturen mehr oder weniger gut zum Wirkstoffdesign geeignet. Typischer Ablauf des Homologiemodelings Proteinstrukturen 4

Konservierte Bereiche in Proteinfamilien Mitglieder einer Proteinfamilie besitzen Bereiche ähnlicher 3D- Struktur. Starke Konservierung im Kern, der die Tertiärstruktur bestimmt. Hier beschränken sich Substitutionen oft auf Aminosäuren mit ähnlichen physikochemischen Eigenschaften und vergleichbarem Volumen (z.b. Ile vs. Leu). Das aktive Zentrum funktionell vergleichbarer Proteine (Ligand/ Substrat-Bindungsstellen) ist ebenfalls häufig stark konserviert. Sekundärstrukturelemente (α-helices und β-faltblätter) verwandter Proteine nehmen oftmals dieselbe relative Orientierung zueinander ein. Variable Bereiche in Proteinfamilien Variation meist an der Oberfläche und in Schleifenregionen, die für die Faltung der Proteine unkritisch sind. Struktur abhängig von Kristallkontakten Insertionen bzw. Deletionen in der Sequenz Substitution mit Prolin Modellierung von Schleifen variabler Länge Suche in Datenbanken nach geeigneten Fragmenten mit gleicher Anzahl von möglichst ähnlichen Aminosäuren und vergleichbarer Anker-Geometrie (Cα -Cα -Abstand) De novo Schleifendesign für kurze Schleifen Proteinstrukturen 5

Struktur der Seitenketten Aminosäuren in konservierten Bereichen Struktur von Seitenketten von unsubstituierten Aminosäuren in konservierten Bereichen werden unverändert übernommen Aminosäuren mit großer Ähnlichkeit(z.B. Ile-Val oder Gln-Glu) bevorzugen im Protein ähnliche Orientierungen sonstige Aminosäuren Suche in Rotamerbibliotheken einfache Rotamerbibliotheken Seitenketten individueller Aminosäuren ohne Berücksichtigung der Umgebung verbesserte Rotamerbibliotheken Seitenkettengeometrie in Abhängigkeit des Rückgrates gegenseitige Beeinflussung benachbarter Seitenketten Häufigkeit von Konformationen Homologiemodelling via Internet SWISS-Model http://www.expasy.ch/swissmod/swiss-model.html T. Schwede et al., Nucleic Acid Res. 31, 3381 (2003). Vergleich berechneter Strukturen mit dem Experiment Sequenz Anzahl Wahrscheinlichkeit (%) für RMS-Abweichung von Identität(%) Modelle exp. Struktur (Å) 1 2 3 4 5 >5 25-29 125 0 10 30 46 67 33 40-49 156 9 44 63 78 91 9 60-69 145 38 72 85 91 92 8 90-95 88 59 78 83 86 91 9 Proteinstrukturen 6

Überprüfung modellierter Proteinstrukturen Energie und dynamischen Stabilität freie Energie der Entfaltung (schwierig) Überlappung von Atomen statistische Analysen von Bindungen, Winkeln, Torsionswinkeln, Wasserstoffbrücken Ramachandran-Plots Planarität von Aromaten und Peptidbindungen Proteinstrukturen 7