Molekularbiologische Datenbanken Übungen Sommersemester 2004 Silke Trißl Prof. Ulf Leser Wissensmanagement in der Bioinformatik Organisatorisches Mittwoch 11 13 Uhr, RUD26 0'313 Mi, 05. Mai 2004 entfällt Ende: 14. Juli 2004 Anmeldung für die Übung über Goya Übungsschein Halbkursprüfung eine bestandene Übung Prüfung über Molekulabiologische Datenbanken + Datawarehouse Web-page zur Übung: http://www.informatik.hu-berlin.de/wbi/teaching/ sose04/mdb/uebung/index.html Silke Trißl, Prof. Ulf Leser Molekularbiologische Datenbanken, Übung, SoSe 2004 2
Organisatorisches 2 Sprechstunden: Silke TrißlMo +Di10 12Uhr RUD25, IV.104 oder nach Vereinbarung Prof. Ulf Leser RUD25, IV.105 nach Vereinbarung Silke Trißl, Prof. Ulf Leser Molekularbiologische Datenbanken, Übung, SoSe 2004 3 Ablauf 6 Aufgaben Aufgabe 1: jeder für sich Aufgaben 2 6: in Gruppen von 2 3 Personen Abgabe Abgabe über Goya oder in RUD25 IV.104 Vorstellung der Ergebnisse jeder Gruppe in den Übungen Lösungen nach Abgabetermin im Web Einsehen der Ergebnisse 1 Woche nach Abgabe Silke Trißl, Prof. Ulf Leser Molekularbiologische Datenbanken, Übung, SoSe 2004 4
Aufgaben 1. Datenbanksuche 1 Woche 2. Microarray-DB-Modellierung 3 Wochen 3. Laden von Rohdaten 2 Wochen 4. Integrieren von SWISS-PROT-Daten 2 Wochen 5. Motive in Sequenzen 2 Wochen 6. Integrieren von GO und GOA 3 Wochen Gesamt 13 Wochen Silke Trißl, Prof. Ulf Leser Molekularbiologische Datenbanken, Übung, SoSe 2004 5 Aufgabe 1 - Datenbanksuche Aufgabe Durchsuchen von Molekularbiologischen Datenbanken nach spezifischen Informationen Ziel Gefühl für die Fülle der Informationen, die öffentlich zugänglich sind zu bekommen Auseinandersetzung mit biologischen Fragestellungen Silke Trißl, Prof. Ulf Leser Molekularbiologische Datenbanken, Übung, SoSe 2004 6
Central Dogma in Molecular Biology Die einfache Sicht Quelle: http://cellbio.utmb.edu/cellbio/ribosome.htm Silke Trißl, Prof. Ulf Leser Molekularbiologische Datenbanken, Übung, SoSe 2004 7 Etwas komplizierter - DNA und Chromosomen Zellkern besitzen nur höhere Organismen (Eukaryoten <=> Prokaryoten) Chromosom Mensch hat 46 Goldfisch hat 94 DNA (Genom) doppelsträngig Abfolge der Basen A, T, C und G kann für funktionelles Produkt codieren (Gen) Quelle: http://www.geneinformation.org/menu.htm Silke Trißl, Prof. Ulf Leser Molekularbiologische Datenbanken, Übung, SoSe 2004 8
Von der DNA zur mrna bei Eukaryoten genomische DNA Introns Exons mrna Alternatives Splicing Gen Startsequenz (Promotor) Endsignal (TAA, TAG, TGA) mrna abgeschrieben im Zellkern wandert dann ins Cytoplasma Silke Trißl, Prof. Ulf Leser Molekularbiologische Datenbanken, Übung, SoSe 2004 9 Von der mrna zum Protein Ribosom baut Proteinketten mrna trna dient als Vorlage trägt eine Aminosäure besitzt ein Anticodon erkennt je 3 Basen (Triplet) auf mrna http://www.dnaftb.org/dnaftb/ Silke Trißl, Prof. Ulf Leser Molekularbiologische Datenbanken, Übung, SoSe 2004 10
Der genetische Code http://www.dnaftb.org/dnaftb/ Silke Trißl, Prof. Ulf Leser Molekularbiologische Datenbanken, Übung, SoSe 2004 11 Datenbanken Eine kurze History Sequenzen in Fachzeitschriften publiziert unstrukturiert Datensammlungen in Buchform systematisch ab 1981 durch EMBL Formatiert durch Line-Identifier manuelles durchblättern Auf CD-ROM erste Bioinformatik-Anwendungen über das Internet Beibehaltung des ursprünglichen Formats Silke Trißl, Prof. Ulf Leser Molekularbiologische Datenbanken, Übung, SoSe 2004 12
NCBI National center for biotechnology information Gründung und Sitz Ziel 1988 als nationale Resource für biologische Daten Bethesda, Maryland, USA Sie verwalten öffentliche Datenbanken forschen auf dem Gebiet der Bioinformatik entwickeln Software für die Genomanalyse stellen biomedizinische Informationen zur Verfügung Silke Trißl, Prof. Ulf Leser Molekularbiologische Datenbanken, Übung, SoSe 2004 13 Datenbanken am NCBI Entrez PubMed Literaturdatenbank Abstracts vieler biologischer Journals können dort durchsucht werden OMIM Online mendelian inheritance in man Datenbank über Erbkrankheiten des Menschen erarbeitet von der Johns Hopkins University Genbank DNA Sequenzen werden dort gespeichert täglicher Austausch mit EMBL und DDBJ Silke Trißl, Prof. Ulf Leser Molekularbiologische Datenbanken, Übung, SoSe 2004 14
EMBL und EBI EMBL European Molecular Biology Lab Heidelberg 1981 begonnen, DNA Sequenzen zu sammeln EBI European Bioinformatics Institute Hinxton, nähe Cambridge, UK 1992 als Tochterinstitut von EMBL gegründet Aktivitäten SRS Sequence retrieval system Suchsystem, mit dem verschiedene Datenbanken durchsucht werden können verschiedene Datenbanken und Tools Silke Trißl, Prof. Ulf Leser Molekularbiologische Datenbanken, Übung, SoSe 2004 15 Sonstige Institutionen DDBJ DNA databank of Japan SIB Swiss Institute of Bioinformatics SwissProt manuell annotierte Protein Datenbank ENZYME Sammlung von Enzymdaten Genome Net - Kyoto University KEGG Biochemische Stoffwechselwege RCSB Research collaboratory for structural bioinformatics PDB Daten über Proteinstrukturen Silke Trißl, Prof. Ulf Leser Molekularbiologische Datenbanken, Übung, SoSe 2004 16
Datenbankwachstum GenBank bis 2002 Stand von 2002 Heute 32.549.400 Sequenzen 37.893.844.733 bp Erwartet exponentielles Wachstum Silke Trißl, Prof. Ulf Leser Molekularbiologische Datenbanken, Übung, SoSe 2004 17 Datenbankwachstum PDB bis 04/2004 Silke Trißl, Prof. Ulf Leser Molekularbiologische Datenbanken, Übung, SoSe 2004 18
Aufgabe 1: Datenbanksuche Gegeben Medizinisches Problem Krankheitsbild Annahme handelt sich um eine Erbkrankheit Gesucht spezifische Informationen zu dieser Krankheit Silke Trißl, Prof. Ulf Leser Molekularbiologische Datenbanken, Übung, SoSe 2004 19 Chromosome Mensch (Homo sapiens) 22 Chromosomenpaare (autosom) 2 Geschlechtschromosomen ( X und Y ) Quelle: http://www.mun.ca/biology/scarr/directory.htm Silke Trißl, Prof. Ulf Leser Molekularbiologische Datenbanken, Übung, SoSe 2004 20
Vererbung dominant rezessiv Quelle: http://www.m-ww.de/krankheiten/erbkrankheiten/ Silke Trißl, Prof. Ulf Leser Molekularbiologische Datenbanken, Übung, SoSe 2004 21 Vererbung dominant rezessiv - X Chromosom Quelle: http://www.m-ww.de/krankheiten/erbkrankheiten/ Silke Trißl, Prof. Ulf Leser Molekularbiologische Datenbanken, Übung, SoSe 2004 22
Bekannte Erbkrankheiten Chorea Huntington Chromosom 4, dominant Mukoviszidose Chromosom 7, rezessiv Sichelzellanämie Chromosom 16, rezessiv Muskeldystrophie X Chromosom, rezessiv Bluterkrankheit X Chromosom, rezessiv OMIM Online Mendelian Inheritance in Man Beispiel: Sichelzellenanämie OMIM, PubMed Silke Trißl, Prof. Ulf Leser Molekularbiologische Datenbanken, Übung, SoSe 2004 23 DNA- und Proteinsequenzen suchen SRS Sequence retrieval system am EBI Eintrag HBB_HUMAN in SwissProt Bild der Struktur von Hämoglobin Normaler Erythrozyt Sichelförmiger Erythrozyt Quelle: http://www.webmic.de/sichelzellanaemie.htm Silke Trißl, Prof. Ulf Leser Molekularbiologische Datenbanken, Übung, SoSe 2004 24
Gene Ontology (GO) Unterteilt in cellular component biological process molecular function Kontrolliertes Vokabular Silke Trißl, Prof. Ulf Leser Molekularbiologische Datenbanken, Übung, SoSe 2004 25 Vom Protein zur Funktion Aufgaben der Proteine im Organismus Enzyme beschleunigen chemische Reaktionen Hormone steuern Vorgänge im Körper Hämoglobin sorgt für den Sauerstofftransport... Jede Proteinklasse ist spezialisiert für eine Aufgabe Silke Trißl, Prof. Ulf Leser Molekularbiologische Datenbanken, Übung, SoSe 2004 26
Datenbanken für Enzyme ENZYME chemische Reaktionen, die Proteine katalysieren, werden in dieser Datenbank gespeichert KEGG einzelne Stoffwechselwege, die aus Enzymen bestehen, werden hier verwaltet Silke Trißl, Prof. Ulf Leser Molekularbiologische Datenbanken, Übung, SoSe 2004 27 Stoffwechselweg 'Biotin metabolism' aus KEGG Stoffwechselweg besteht aus Enzymen Störung eines Enzyms Anreicherung des Ausgangsprodukts keine/unzureichende Produktion des Endprodukts Silke Trißl, Prof. Ulf Leser Molekularbiologische Datenbanken, Übung, SoSe 2004 28
Enzym 2.8.1.6 in ENZYME Silke Trißl, Prof. Ulf Leser Molekularbiologische Datenbanken, Übung, SoSe 2004 29 Fragen? Aufgabe 1 bei Goya oder auf der Web-page Datenbank-Katalog auf der Web-page Lösung bis Dienstag, 20.04., 17 Uhr Silke Trißl, Prof. Ulf Leser Molekularbiologische Datenbanken, Übung, SoSe 2004 30