Bioinformatik Methoden zur Vorhersage vo n RNA- und Proteinstrukture n Gerhard Steger
Vorwort ix Strukturvorhersage von Nukleinsäuren 1 Struktur und Funktion von RNA 3 1.1 RNA-Struktur fl 1.2 Thermodynamik der RNA-Faltung 1 5 1.3 Kinetik der RNA-Faltung 2 1 1.4 RNA-Struktur-Bestimmung 2 2 1.5 RNA-Funktionen 3 5 2. Kooperative Gleichgewichte in doppelsträngigen Nukleinsäuren 3 9 2.1 Einfaches chemisches Gleichgewicht zwischen Isomeren 40 2.2 Protonierungsgleichgewicht 42 2.3 Modell für Denaturierung von doppelsträngiger Nukleinsäure 44 3. Graphen und Alignments 5 7 3.1 Globales paarweises Alignment 57 3.2 Varianten des paarweisen Alignments 63 3.3 Kosten für Lücken 65 3.4 Multiple Alignments 66
4. RNA-Sekundärstruktur-Vorhersage per Graphentheorie 73 4.1 Definition von Sekundär- und Tertiärstruktur 74 4.2 Tinoco-Plot :. :, A), : +.,. : A... A.A., : A 75 4.3 Zahl möglicher Strukturen :x W..... 76 4.4 Struktur mit maximaler Zahl Basenpaare 7 8 4.5 Strukturen mit submaximaler Zahl Basenpaare 7 9 4.6 Energie-Werte für RNA-Sekundärstrukturen 8 4 4.7 Thermodynamisch optimale Sekundärstrukturen 8 6 4.8 Bestimmung von Strukturverteilungen 8 6 4.9 Qualität der Vorhersage von Strukturen un d Strukturverteilungen 9 2 4.10 Tertiärstrukturvorhersage 94 4.11 Simultane Optimierung von Struktur und Alignment 9 4 5. RNA-Sekundärstruktur-Vorhersage per Informationstheorie 9 5 5.1 Kommunikationstheorie : 9 6 5.2 "Sequence Logos" : Darstellung der Information in Alignments 10 0 5.3 "Expected mutual information rate" oder "rate of informatio n transmission" 10 3 5.4 Maximal gewichtete Zuordnungen 10 5 5.5 Optimierung der Konsensus-Struktur 10 8 5.6 ConStruct..... 11 1 6. RNA-Sekundärstruktur-Vorhersage mit Genetischen Algorithmen 11 5 6.1 Prinzip eines Genetischen Algorithmus 1.16 6.2 Beispiel für Genetischen Algorithmus 117 6.3 Vorhersage von RNA-Sekundärstruktur 11 9 6.4 Vorhersage des Faltungswegs von RNA-Sekundärstruktur 12 0 6.5 Programmierter Zelltod durch hok/sok des Plasmids R1 12 2 7. RNA-Sekundärstrukturfaltung 12 7 7.1 Toleranzschwellen-Algorithmus 12 8 7.2 Sintflut-Algorithmus 13 0 7.3 Kinetische Parameter für Strukturbildung 13 0 7.4 RNA-Faltung durch Lösung der "master equation" :..,,. 13 2 7.5 Vorhersage von RNA-Faltung 135
Strukturvorhersage von Proteinen 14 7 8. Protein-Struktur 144 8.1 Aminosäuren als Bausteine 15( 8.2 Die Polypeptidkette 154 8.3 Die Peptidbindung 154 8.4 Ramachandran-Plot 15 ( 8.5 Sekundärstrukturen 15 ( 8.6 Supersekundärstrukturen 16 8.7 Tertiärstrukturen 16 4 8.8 Folds und Superfolds, Familien und Superfamilien 1T 8.9 Quartärstrukturen 17L 9. Energetik von Protein-Strukturen 1 7 9.1 Nicht-kovalente Wechselwirkungen, die die Proteinstruktur bestimmen 9.2 Salzbrücken... 18 : 9.3 Molekulare Packung 18 ; 10. Protein-Sekundärstruktur-Vorhersage 18 ; 10.1 Sekundärstruktur nach Chou & Fasman (1978) 18 4 10.2 Sekundärstruktur nach Garnier et al. (1978) 19 : 10.3 Hydropathie und Amphiphilie von a-helices.... 19, 10.4 Antigenitätsindex nach Jameson & Wolf (1988) 19 ' 11. Qualität von Vorhersagen 19 1 11.1 Eine binäre Aussage oder eine Aussage mit Wertebereich 20 1 11.2 Aussagen mit mehr als zwei Klassen 20 : 11.3 Objektive Prüfung von Vorhersagen 2 0 12. Vorhersage von Transmembran-Helices per Hidden-Markov-Modell 20 ' 12.1 Markov-Ketten 20 1 12.2 Hidden-Markov-Modell 20! 12.3 Hidden-Markov-Modelle zur Sequenz-Analyse 21 1 12.4 Transmembran-Helices per Hidden-Markov-Modell (TMHMM) 21, 12.5 Qualität von Programmen zur Vorhersage vo n Transmembranregionen 21' 1 T
13. Protein-Sekundärstruktur-Vorhersage per Neuronalem Netz 21 9 13.1 Neuronale Netze 220 13.2 PHD - Strukturvorhersage unter Verwendung evolutionärer Information 232 13.3 Ausgabebeispiel von PHD 23 8 13.4 Vorhersage von Signalpeptiden und Signalankern 24 1 14. Proteinfaltung mit ab-initio-methoden,.,,;.,.; ; ; 247 14.1 Elemente der ab-initio-methoden 248 14.2 Stand der Forschung in MD-Simulationen 25 1 15. Inverse Proteinfaltung - Threading" 25 3 15.1 3D-1D-Profile für Threading 25 7 15.2 Verbesserungen des Algorithmus 26 1 15.3 Strukturvorhersage mit GenThreader 26 5 16. Proteinfaltung per Homologie-Modellierung 269 16.1 Identifizierung von verwandten Proteinen mit bekannte r 3D-Struktur 272 16.2 Alignment der Target-Sequenz mit dem Template 272 16.3 Loop-Modellierung 273 16.4 Modellierung der Seitenketten 274 16.5 Fehler bei der Homologie-Modellierung 275 16.6 Modell-Bewertung 278 Literaturverzeichnis 279 Index zu Programmen 295 Index 297