Algorithmen und Anwendungen zur Kartierung von Genomen Dr. Dominik Grimm Probelehrveranstaltung Wissenschaftszentrum Straubing Hochschule Weihenstephan-Triesdorf Straubing, 14. Juli 2017 14. Juli 2017 Kartierung von Genomen 1
Inhalte & Lernziele dieser Vorlesung Was versteht man unter einer Kartierung des Genoms? Welche Arten von Kartierungen gibt es? Methoden zur Erstellung von physikalischen Karten Anwendung zur Kartierung von Genomen Zusammenfassung des Vorlesungsinhalts und Ausblick 14. Juli 2017 Kartierung von Genomen 2
Was versteht man unter einer Kartierung des Genoms? Motivation Finde den Weg von Haus A zu Haus B 14. Juli 2017 Kartierung von Genomen 3
Was versteht man unter einer Kartierung des Genoms? Motivation Füge Orientierungspunkte zur Karte hinzu 14. Juli 2017 Kartierung von Genomen 4
Was versteht man unter einer Kartierung des Genoms? Motivation Füge Orientierungspunkte zur Karte hinzu 14. Juli 2017 Kartierung von Genomen 5
Was versteht man unter einer Kartierung des Genoms? Motivation Hm ca. 50min ca. 20min ca. 40min 2 km 3 km 1.5 km Karten werden mit der Zeit und neueren Kartierungsmethoden immer detaillierter 14. Juli 2017 Kartierung von Genomen 6
Was versteht man unter einer Kartierung des Genoms? Arten der Genomkartierung Genetische Karte 10 15 40 40 15 25 cm 14. Juli 2017 Kartierung von Genomen 7
Was versteht man unter einer Kartierung des Genoms? Arten der Genomkartierung Genetische Karte 10 15 40 40 15 25 cm Zytogentische Karte 14. Juli 2017 Kartierung von Genomen 8
Was versteht man unter einer Kartierung des Genoms? Arten der Genomkartierung Genetische Karte 10 15 40 40 15 25 cm Zytogentische Karte Physikalische Karte 200 190 180 400 350 50 kb 14. Juli 2017 Kartierung von Genomen 9
Was versteht man unter einer Kartierung des Genoms? Arten der Genomkartierung Genetische Karte 10 15 40 40 15 25 cm Zytogentische Karte Physikalische Karte 200 190 180 400 350 50 kb DNA-Sequenz...ATGCCCCAGTAAGAGAGCATATATACAA... Basen 14. Juli 2017 Kartierung von Genomen 10
Was versteht man unter einer Kartierung des Genoms? Arten der Genomkartierung Genetische Karte 10 15 40 40 15 25 cm Zytogentische Karte Physikalische Karte 200 190 180 400 350 50 kb DNA-Sequenz...ATGCCCCAGTAAGAGAGCATATATACAA... Basen 14. Juli 2017 Kartierung von Genomen 11
Erstellung physikalischer Karten Restriktionsstellen-Kartierung Verfahren beruht auf Restriktionsenzymen à Sind in der Lage DNA-Motive zu erkennen und die DNA an diesen Stellen zu schneiden. EcoRI 5' 3' G A A T T C C T T A A G EcoRI 3' 5' 5' G A A T T C 3' 3' C T T A A G 5' 14. Juli 2017 Kartierung von Genomen 12
Erstellung physikalischer Karten Restriktionsstellen-Kartierung Restriktionsenzym schneidet DNA in Stücke unterschiedlicher Länge EcoRI Schnittstelle EcoRI Schnittstelle EcoRI 5Mb 0.5 Mb 3 Mb 1.5 Mb 14. Juli 2017 Kartierung von Genomen 13
Erstellung physikalischer Karten Restriktionsstellen-Kartierung Restriktionsenzym schneidet DNA in Stücke unterschiedlicher Länge EcoRI Schnittstelle EcoRI Schnittstelle 5Mb Marker EcoRI Marker 0.5 Mb 3 Mb 1.5 Mb Restriktionsschnittstellen sind spezifisch für jedes Restriktionsenzym 14. Juli 2017 Kartierung von Genomen 14
Erstellung physikalischer Karten Restriktionsstellen-Kartierung EcoRI Fragmente 20, 100, 200, 400 20 100 200 400 14. Juli 2017 Kartierung von Genomen 15
Erstellung physikalischer Karten Restriktionsstellen-Kartierung EcoRI Fragmente 20, 100, 200, 400 20 100 200 400 20 120 320 720 14. Juli 2017 Kartierung von Genomen 16
Erstellung physikalischer Karten Restriktionsstellen-Kartierung EcoRI Fragmente 20, 100, 200, 400 20 100 200 400 20 120 320 720 20 200 100 400 20 220 320 720 14. Juli 2017 Kartierung von Genomen 17
Erstellung physikalischer Karten Restriktionsstellen-Kartierung Es gibt 4! = 24 mögliche Anordnungen (Permutationen) 14. Juli 2017 Kartierung von Genomen 18
Erstellung physikalischer Karten Restriktionsstellen-Kartierung Es gibt 4! = 24 mögliche Anordnungen (Permutationen) Wie kann man anhand der Fragmente die Reihenfolge der Marker (Restriktionsschnittstellen) rekonstruieren? 14. Juli 2017 Kartierung von Genomen 19
Erstellung physikalischer Karten Restriktionsstellen-Kartierung durch Double Digest DNA Restriktionsenzym A Restriktionsenzym B Restriktionsenzym A+B Längenmessung Fragmente A Längenmessung Fragmente B Längenmessung Fragmente A+B 14. Juli 2017 Kartierung von Genomen 20
Erstellung physikalischer Karten Restriktionsstellen-Kartierung durch Double Digest Längenmessung Fragmente A 20, 100, 200, 400 Längenmessung Fragmente B 50, 150, 220, 250 Längenmessung Fragmente A + B 20, 30, 50, 50, 80, 150, 170, 170 14. Juli 2017 Kartierung von Genomen 21
Erstellung physikalischer Karten Restriktionsstellen-Kartierung durch Double Digest Enzym A 20 100 200 400 20 120 320 720 Enzym B 50 150 220 250 50 200 420 670 14. Juli 2017 Kartierung von Genomen 22
Erstellung physikalischer Karten Restriktionsstellen-Kartierung durch Double Digest Enzym A 20 100 200 400 20 120 320 720 Enzym B 50 150 220 250 50 200 420 670 Schnittmenge A+B 20 50 120 200 320 420 670 720 14. Juli 2017 Kartierung von Genomen 23
Erstellung physikalischer Karten Restriktionsstellen-Kartierung durch Double Digest Enzym A 20 100 200 400 20 120 320 720 Enzym B 50 150 220 250 50 200 420 670 Schnittmenge A+B 20 30 70 80 120 100 250 50 20 50 120 200 320 420 670 720 14. Juli 2017 Kartierung von Genomen 24
Erstellung physikalischer Karten Restriktionsstellen-Kartierung durch Double Digest Schnittmenge A+B 20 30 70 80 120 100 250 50 20 50 120 200 320 420 670 720 Vergleiche Distanzen der Schnittmenge mit Längen der Fragmente A +B Längenmessung Fragmente A + B 20, 30, 50, 50, 80, 150, 170, 170 14. Juli 2017 Kartierung von Genomen 25
Erstellung physikalischer Karten Restriktionsstellen-Kartierung durch Double Digest Schnittmenge A+B 20 30 70 80 120 100 250 50 20 50 120 200 320 420 670 720 Vergleiche Distanzen der Schnittmenge mit Längen der Fragmente A +B Längenmessung Fragmente A + B 20, 30, 50, 50, 80, 150, 170, 170 20, 30, 50, 70, 80, 100, 120, 250 20, 30, 50, 50, 80, 150, 170, 170 14. Juli 2017 Kartierung von Genomen 26
Erstellung physikalischer Karten Restriktionsstellen-Kartierung durch Double Digest Teste alle möglichen Kombinationen der Permutationen von A und B bis die Schnittmenge gleich der Fragmentlängenmessung von A + B ist. (in unserem Beispiel: 4!*4! = 576 Tests) 14. Juli 2017 Kartierung von Genomen 27
Erstellung physikalischer Karten Zusammenfassung Restriktionsstellen-Kartierung Double Digest ist experimentell leicht durchführbar Laufzeit ist exponentiell Es gibt nicht nur eine eindeutige Lösung (mehrere Lösungen möglich) 14. Juli 2017 Kartierung von Genomen 28
Erstellung physikalischer Karten Zusammenfassung Restriktionsstellen-Kartierung Double Digest ist experimentell leicht durchführbar Laufzeit ist exponentiell Es gibt nicht nur eine eindeutige Lösung (mehrere Lösungen möglich) à Effizientere Lösung mittels Partial Digest (nicht Teil dieser Vorlesung) jedoch auf Kosten des experimentellen Designs à Beide Methoden funktionieren nicht für große DNA-Strings à Fehler in der Verdauung oder Längenmessung werden nicht betrachtet 14. Juli 2017 Kartierung von Genomen 29
Für was werden physikalische Karten benötigt? Rekonstruktion von DNA-Sequenzen Wetterstrand KA. DNA Sequencing Costs: Data from the NHGRI Genome Sequencing Program (GSP) Available at: www.genome.gov/sequencingcosts. Accessed July 2017. 14. Juli 2017 Kartierung von Genomen 30
Für was werden physikalische Karten benötigt? Rekonstruktion von DNA-Sequenzen DNA Kopien Fragmentierung ATGCATGCACGACAAGT AAGTAGGTTCCAAATTTTAAATGCC Sequenzierung AAATGCCCAGATAGAGAGAGAGA AGAGAGGGTTTTTACAGATAAGAGAGAG 14. Juli 2017 Kartierung von Genomen 31
Für was werden physikalische Karten benötigt? Rekonstruktion von DNA-Sequenzen Finden überlappender Sequenzen ATGCATGCACGACAAGT AAGTAGGTTCCAAATTTTAAATGCC AAAAGGGAGATAGAGAGAGAGA AGAGAGGGTTTTTACAGATAAGAGAGAG 14. Juli 2017 Kartierung von Genomen 32
Für was werden physikalische Karten benötigt? Rekonstruktion von DNA-Sequenzen Contig 1 Contig 2 14. Juli 2017 Kartierung von Genomen 33
Für was werden physikalische Karten benötigt? Rekonstruktion von DNA-Sequenzen Contig 1 Contig 2 Physikalische Karten können dabei helfen die Contigs richtig anzuordnen 14. Juli 2017 Kartierung von Genomen 34
Anwendungen zur Kartierung des Genoms Anwendungen zur Kartierung des Genoms Genetische Karte 10 15 40 40 15 25 cm Zytogentische Karte Physikalische Karte 200 190 180 400 350 50 kb DNA-Sequenz...ATGCCCCAGTAAGAGAGCATATATACAA... Basen 14. Juli 2017 Kartierung von Genomen 35
Anwendungen zur Kartierung des Genoms Genomweite Assoziationsstudien (GWAS) Biomasse von Pflanzen Komplexe Krankheiten Metabolom eines Organismus Eigenschaften von Bakterien 14. Juli 2017 Kartierung von Genomen 36
Anwendungen zur Kartierung des Genoms Genomweite Assoziationsstudien (GWAS) Plant 1 Plant 2 Plant 3 Plant 4 Plant 5 Finde Assoziation zwischen Markern und Phänotyp 14. Juli 2017 Kartierung von Genomen 37
Anwendungen zur Kartierung des Genoms Human GWAS Catalog (Juni, 2017) Brustkrebs 37401 SNP-Trait Assoziationen Schizophrenie 6 7 8 9 10 11 12 Alkoholabhängigkeit Typ-2 Diabetes Parkinson 14. Juli 2017 Kartierung von Genomen 38
Ausblick auf die nächste Vorlesung Was kommt als Nächstes? Restriktionsstellen-Kartierung durch Partial Digest Erläuterung der Partial Digest Methode Implementierung des Algorithmus in Python Kartierung durch Hybridisierung Unterschiedliche Algorithmen zur Erstellung physikalischer Karten durch Hybridisierungsexperimente Implementierung der Algorithmen in Python 14. Juli 2017 Kartierung von Genomen 39
Danksagung Berufungsausschuss Folien und Code zur Vorlesung http://grimmdominik.eu/teaching/ Icons made by Freepik from www.flaticon.com is licensed under CC BY 3.0 Allen Zuhörern und Zuhörerinnen https://github.com/dominikgrimm/digest/ Zusätzliche Referenzen Brown, Terence A. "Mapping genomes." (2002). Böckenhauer, H. J., & Bongartz, D. (2003). Algorithmische Grundlagen der Bioinformatik: Modelle, Methoden und Komplexität. Springer-Verlag. Welter, D., MacArthur, J., Morales, J., Burdett, T., Hall, P., Junkins, H.,... & Parkinson, H. (2013). The NHGRI GWAS Catalog, a curated resource of SNP-trait associations. Nucleic acids research, 42(D1), D1001-D1006. 14. Juli 2017 Kartierung von Genomen 40