Algorithmen und Anwendungen zur Kartierung von Genomen

Ähnliche Dokumente
Ridge Regression und Kernalized Support Vector Machines : Einführung und Vergleich an einem Anwendungsbeispiel

Bioinformatik Für Biophysiker

Von Mendel bis -Omics Geschichte und Grundlagen der Humangenetik , Walther Vogel, Institut für Humangenetik

Bioinformatik Für Biophysiker

Übungen zu Algorithmische Bioinformatik

Personalisierte Medizin

Masterarbeit. Variantentolerantes Readmapping durch Locality Sensitive Hashing. Jens Quedenfeld November Gutachter: Sven Rahmann Dominik Köppl

QTL-Mapping und Genomweite Assoziationsstudien

Verbundvorhaben Fastwood

Einführung Molekulare Bioinformatik

Bioinformatik Für Biophysiker

Grundideen der Gentechnik

Schreibe ein Programm, das den AT Gehalt diese DNA Sequenz berechnet. Hinweis: A-Gehalt plus T-Gehalt bezogen auf die gesamte Sequenz.

Zusammenfassung des 4. Abends

Trio-Analyse (Exome-Seq)

Übungsblatt Molekularbiologie und Genetik für Studierende der Bioinformatik II 1. Übung

Hitze- und Trockentoleranz bei Gerste

Wann sind Codes eindeutig entschlüsselbar?

Humane Genotyp-Phänotyp-Datenbanken: Ein Statusbericht

DATENSTRUKTUREN UND ALGORITHMEN

Informatik II, SS 2018

MODULE für den SCHULKOFFER GENTECHNIK

Übung 2 Algorithmische Bioinformatik WS 15/16. Yvonne Mayer


4.9.7 Konstruktion der Suffixbäume

Vertiefendes Seminar zur Vorlesung Biochemie I

Pharmazeutische Biologie WS2011/2012. Das neue Paradigma: Personalisierte Medizin

Restriktion und Gentechnik

Python im Bioinformatiker-Alltag

Pharmazeutische Biologie WS2011/2012. Das neue Paradigma: Personalisierte Medizin

C SB. Genomics Herausforderungen und Chancen. Genomics. Genomic data. Prinzipien dominieren über Detail-Fluten. in 10 Minuten!

Quelle Gen: GK-120F

Übung 1 Algorithmische Bioinformatik WS 15/16. Yvonne Mayer

Das internationale Human-Genom Projekt. Stand Ergebnisse Perspektiven

Algorithmus Sortieren von Zahlen (aufsteigend)

Aufgabe 7: Distanzbasierte Phylogenie: Neighbor Joining. Stefan Kröger, Philippe Thomas Wissensmanagement in der Bioinformatik

Einführung Molekulare Bioinformatik

Algorithmen und Datenstrukturen SS Übungsblatt 9: Suchen

Informatik II, SS 2018

Sequenziertechnologien

Übung 9. a) In welchem Teil eines Operons führen Mutationen zur Veränderungen der produzierten Menge eines Enzyms?

Genkartierung durch Rekombination in Drosophila. Chapter 4 Opener

Bioinformatik I: Grundlagen der Gentechnik

Wie halten neue Technologien Einzug in unser Leben und welche Auswirkungen kann dies haben?

Genomprojekte und die Kartierung des menschlichen Genoms

Aufgabe 6: Distanzbasierte Phylogenie: Hierarchisches Clustering. Ulf Leser Wissensmanagement in der Bioinformatik

Informatik II, SS 2016

Informatik II, SS 2014

Molekularbiologische Datenbanken

Algorithmische Bioinformatik I (IN5000)

Thema Gentechnologie. Erwin R. Schmidt Institut für Molekulargenetik Vorlesung #

Effizienter Planaritätstest Vorlesung am

Algorithmische Geometrie: Einstimmung

Algorithmen auf Sequenzen

Informatik II, SS 2014

Beispiel Gröbnerbasen-Berechnung

Alignment-Verfahren zum Vergleich biologischer Sequenzen

Informatik II, SS 2018

Kapitel 3: Untere Schranken für algorithmische Probleme Gliederung

Quiz zum Praktikum Tierartendifferenzierung

Algorithms for analyzing signals in DNA Applications to transcription and translation

Liste MI / Liste I Programmieren in C++

Thema Gentechnologie. Erwin R. Schmidt Institut für Molekulargenetik Vorlesung #

Algorithmen und Datenstrukturen

Von der DNA zur Datenbank: Sequenzierung & Assemblierung

Erster Baum genetisch sequenziert Genetische Veränderung geplant - Ökologen warnen vor Gentech- Pflanzen

Polygone - Bausteine der Computergrafik

A T C G G C T A A T A T

molekularen Rinderzucht

Inhaltsübersicht. Vorwort 15. Vorwort zur deutschen Ausgabe 22. Kapitel 1 Elemente der Programmierung 25. Kapitel 2 Funktionen und Module 203

Genomanalyse Vorlesung Masterstudiengang 2011 Jena FLI. Klaus Huse Leibniz-Institut für Altersforschung Fritz-Lipmann-Institut Jena

Vorbesprechung Seminar Biomedical Informatics

2. Woche Eindeutige Entschlüsselbarleit, Sätze von Kraft und McMillan, Huffmancodierung

B I O T E C H N O L O G I E. Molekulare Biotechnologie Engineering von Biosystemen. Bioprozesstechnik Engineering von Produktionsverfahren

ATTGACTTTGGACTAGAATCGATAAAATCCGCATCATCATACCCATTGGCCGGGTAACCCTG TCATGTCATTTAGGGATTTTTATTTTTAAAACGTATTATGGACCACAGGATCATGATCATGAC

Themenübersicht Verwendung im Studium Voraussetzungen Ziele Website zum Buch Danksagungen... 21

Gentechnische Methoden

Aufgaben zur Klausurvorbereitung

3.5 Moderne Genetik - Vorgänge

Qualitatives räumliches Schließen zur Objektverfolgung in Bildfolgen

Molekulare Klonierung Praktikum

KEINE ANGST VOR OPEN ACCESS

Informatik II, SS 2014

Informatik II, SS 2016

GroupSeq++/GWAS. Ein R-Programmpaket zur Optimierung und flexiblen Anpassung von Mehrstufen-Designs für genomweite Assoziationsstudien

Praktische Informatik I

AlgoBio WS 16/17 Protein-DNA Interaktionen ChiP-Seq Datenanalyse. Annalisa Marsico

Grundlagen der Programmierung (Vorlesung 24)

Algorithmen und Datenstrukturen (ESE) Entwurf, Analyse und Umsetzung von Algorithmen (IEMS) WS 2014 / 2015 Vorlesung 14, Donnerstag, 5.

Genomische Selektion in der Pflanzenzüchtung

Zukunftsperspektiven in der Zuchtwertschätzung

A3.1 Sortieralgorithmen

Lehrstuhlvorstellung Molekularbiologie und Biochemie Botanisches Institut

Programmierung 2 Studiengang MI / WI

Einführung in die Informatik I Kapitel II.3: Sortieren

Kapitel 3: Sortierverfahren Gliederung

Biologie I/B: Klassische und molekulare Genetik, molekulare Grundlagen der Entwicklung Theoretische Übungen SS 2016

B / B* - Bäume. Guido Hildebrandt Seminar Datenbanksysteme

Transkript:

Algorithmen und Anwendungen zur Kartierung von Genomen Dr. Dominik Grimm Probelehrveranstaltung Wissenschaftszentrum Straubing Hochschule Weihenstephan-Triesdorf Straubing, 14. Juli 2017 14. Juli 2017 Kartierung von Genomen 1

Inhalte & Lernziele dieser Vorlesung Was versteht man unter einer Kartierung des Genoms? Welche Arten von Kartierungen gibt es? Methoden zur Erstellung von physikalischen Karten Anwendung zur Kartierung von Genomen Zusammenfassung des Vorlesungsinhalts und Ausblick 14. Juli 2017 Kartierung von Genomen 2

Was versteht man unter einer Kartierung des Genoms? Motivation Finde den Weg von Haus A zu Haus B 14. Juli 2017 Kartierung von Genomen 3

Was versteht man unter einer Kartierung des Genoms? Motivation Füge Orientierungspunkte zur Karte hinzu 14. Juli 2017 Kartierung von Genomen 4

Was versteht man unter einer Kartierung des Genoms? Motivation Füge Orientierungspunkte zur Karte hinzu 14. Juli 2017 Kartierung von Genomen 5

Was versteht man unter einer Kartierung des Genoms? Motivation Hm ca. 50min ca. 20min ca. 40min 2 km 3 km 1.5 km Karten werden mit der Zeit und neueren Kartierungsmethoden immer detaillierter 14. Juli 2017 Kartierung von Genomen 6

Was versteht man unter einer Kartierung des Genoms? Arten der Genomkartierung Genetische Karte 10 15 40 40 15 25 cm 14. Juli 2017 Kartierung von Genomen 7

Was versteht man unter einer Kartierung des Genoms? Arten der Genomkartierung Genetische Karte 10 15 40 40 15 25 cm Zytogentische Karte 14. Juli 2017 Kartierung von Genomen 8

Was versteht man unter einer Kartierung des Genoms? Arten der Genomkartierung Genetische Karte 10 15 40 40 15 25 cm Zytogentische Karte Physikalische Karte 200 190 180 400 350 50 kb 14. Juli 2017 Kartierung von Genomen 9

Was versteht man unter einer Kartierung des Genoms? Arten der Genomkartierung Genetische Karte 10 15 40 40 15 25 cm Zytogentische Karte Physikalische Karte 200 190 180 400 350 50 kb DNA-Sequenz...ATGCCCCAGTAAGAGAGCATATATACAA... Basen 14. Juli 2017 Kartierung von Genomen 10

Was versteht man unter einer Kartierung des Genoms? Arten der Genomkartierung Genetische Karte 10 15 40 40 15 25 cm Zytogentische Karte Physikalische Karte 200 190 180 400 350 50 kb DNA-Sequenz...ATGCCCCAGTAAGAGAGCATATATACAA... Basen 14. Juli 2017 Kartierung von Genomen 11

Erstellung physikalischer Karten Restriktionsstellen-Kartierung Verfahren beruht auf Restriktionsenzymen à Sind in der Lage DNA-Motive zu erkennen und die DNA an diesen Stellen zu schneiden. EcoRI 5' 3' G A A T T C C T T A A G EcoRI 3' 5' 5' G A A T T C 3' 3' C T T A A G 5' 14. Juli 2017 Kartierung von Genomen 12

Erstellung physikalischer Karten Restriktionsstellen-Kartierung Restriktionsenzym schneidet DNA in Stücke unterschiedlicher Länge EcoRI Schnittstelle EcoRI Schnittstelle EcoRI 5Mb 0.5 Mb 3 Mb 1.5 Mb 14. Juli 2017 Kartierung von Genomen 13

Erstellung physikalischer Karten Restriktionsstellen-Kartierung Restriktionsenzym schneidet DNA in Stücke unterschiedlicher Länge EcoRI Schnittstelle EcoRI Schnittstelle 5Mb Marker EcoRI Marker 0.5 Mb 3 Mb 1.5 Mb Restriktionsschnittstellen sind spezifisch für jedes Restriktionsenzym 14. Juli 2017 Kartierung von Genomen 14

Erstellung physikalischer Karten Restriktionsstellen-Kartierung EcoRI Fragmente 20, 100, 200, 400 20 100 200 400 14. Juli 2017 Kartierung von Genomen 15

Erstellung physikalischer Karten Restriktionsstellen-Kartierung EcoRI Fragmente 20, 100, 200, 400 20 100 200 400 20 120 320 720 14. Juli 2017 Kartierung von Genomen 16

Erstellung physikalischer Karten Restriktionsstellen-Kartierung EcoRI Fragmente 20, 100, 200, 400 20 100 200 400 20 120 320 720 20 200 100 400 20 220 320 720 14. Juli 2017 Kartierung von Genomen 17

Erstellung physikalischer Karten Restriktionsstellen-Kartierung Es gibt 4! = 24 mögliche Anordnungen (Permutationen) 14. Juli 2017 Kartierung von Genomen 18

Erstellung physikalischer Karten Restriktionsstellen-Kartierung Es gibt 4! = 24 mögliche Anordnungen (Permutationen) Wie kann man anhand der Fragmente die Reihenfolge der Marker (Restriktionsschnittstellen) rekonstruieren? 14. Juli 2017 Kartierung von Genomen 19

Erstellung physikalischer Karten Restriktionsstellen-Kartierung durch Double Digest DNA Restriktionsenzym A Restriktionsenzym B Restriktionsenzym A+B Längenmessung Fragmente A Längenmessung Fragmente B Längenmessung Fragmente A+B 14. Juli 2017 Kartierung von Genomen 20

Erstellung physikalischer Karten Restriktionsstellen-Kartierung durch Double Digest Längenmessung Fragmente A 20, 100, 200, 400 Längenmessung Fragmente B 50, 150, 220, 250 Längenmessung Fragmente A + B 20, 30, 50, 50, 80, 150, 170, 170 14. Juli 2017 Kartierung von Genomen 21

Erstellung physikalischer Karten Restriktionsstellen-Kartierung durch Double Digest Enzym A 20 100 200 400 20 120 320 720 Enzym B 50 150 220 250 50 200 420 670 14. Juli 2017 Kartierung von Genomen 22

Erstellung physikalischer Karten Restriktionsstellen-Kartierung durch Double Digest Enzym A 20 100 200 400 20 120 320 720 Enzym B 50 150 220 250 50 200 420 670 Schnittmenge A+B 20 50 120 200 320 420 670 720 14. Juli 2017 Kartierung von Genomen 23

Erstellung physikalischer Karten Restriktionsstellen-Kartierung durch Double Digest Enzym A 20 100 200 400 20 120 320 720 Enzym B 50 150 220 250 50 200 420 670 Schnittmenge A+B 20 30 70 80 120 100 250 50 20 50 120 200 320 420 670 720 14. Juli 2017 Kartierung von Genomen 24

Erstellung physikalischer Karten Restriktionsstellen-Kartierung durch Double Digest Schnittmenge A+B 20 30 70 80 120 100 250 50 20 50 120 200 320 420 670 720 Vergleiche Distanzen der Schnittmenge mit Längen der Fragmente A +B Längenmessung Fragmente A + B 20, 30, 50, 50, 80, 150, 170, 170 14. Juli 2017 Kartierung von Genomen 25

Erstellung physikalischer Karten Restriktionsstellen-Kartierung durch Double Digest Schnittmenge A+B 20 30 70 80 120 100 250 50 20 50 120 200 320 420 670 720 Vergleiche Distanzen der Schnittmenge mit Längen der Fragmente A +B Längenmessung Fragmente A + B 20, 30, 50, 50, 80, 150, 170, 170 20, 30, 50, 70, 80, 100, 120, 250 20, 30, 50, 50, 80, 150, 170, 170 14. Juli 2017 Kartierung von Genomen 26

Erstellung physikalischer Karten Restriktionsstellen-Kartierung durch Double Digest Teste alle möglichen Kombinationen der Permutationen von A und B bis die Schnittmenge gleich der Fragmentlängenmessung von A + B ist. (in unserem Beispiel: 4!*4! = 576 Tests) 14. Juli 2017 Kartierung von Genomen 27

Erstellung physikalischer Karten Zusammenfassung Restriktionsstellen-Kartierung Double Digest ist experimentell leicht durchführbar Laufzeit ist exponentiell Es gibt nicht nur eine eindeutige Lösung (mehrere Lösungen möglich) 14. Juli 2017 Kartierung von Genomen 28

Erstellung physikalischer Karten Zusammenfassung Restriktionsstellen-Kartierung Double Digest ist experimentell leicht durchführbar Laufzeit ist exponentiell Es gibt nicht nur eine eindeutige Lösung (mehrere Lösungen möglich) à Effizientere Lösung mittels Partial Digest (nicht Teil dieser Vorlesung) jedoch auf Kosten des experimentellen Designs à Beide Methoden funktionieren nicht für große DNA-Strings à Fehler in der Verdauung oder Längenmessung werden nicht betrachtet 14. Juli 2017 Kartierung von Genomen 29

Für was werden physikalische Karten benötigt? Rekonstruktion von DNA-Sequenzen Wetterstrand KA. DNA Sequencing Costs: Data from the NHGRI Genome Sequencing Program (GSP) Available at: www.genome.gov/sequencingcosts. Accessed July 2017. 14. Juli 2017 Kartierung von Genomen 30

Für was werden physikalische Karten benötigt? Rekonstruktion von DNA-Sequenzen DNA Kopien Fragmentierung ATGCATGCACGACAAGT AAGTAGGTTCCAAATTTTAAATGCC Sequenzierung AAATGCCCAGATAGAGAGAGAGA AGAGAGGGTTTTTACAGATAAGAGAGAG 14. Juli 2017 Kartierung von Genomen 31

Für was werden physikalische Karten benötigt? Rekonstruktion von DNA-Sequenzen Finden überlappender Sequenzen ATGCATGCACGACAAGT AAGTAGGTTCCAAATTTTAAATGCC AAAAGGGAGATAGAGAGAGAGA AGAGAGGGTTTTTACAGATAAGAGAGAG 14. Juli 2017 Kartierung von Genomen 32

Für was werden physikalische Karten benötigt? Rekonstruktion von DNA-Sequenzen Contig 1 Contig 2 14. Juli 2017 Kartierung von Genomen 33

Für was werden physikalische Karten benötigt? Rekonstruktion von DNA-Sequenzen Contig 1 Contig 2 Physikalische Karten können dabei helfen die Contigs richtig anzuordnen 14. Juli 2017 Kartierung von Genomen 34

Anwendungen zur Kartierung des Genoms Anwendungen zur Kartierung des Genoms Genetische Karte 10 15 40 40 15 25 cm Zytogentische Karte Physikalische Karte 200 190 180 400 350 50 kb DNA-Sequenz...ATGCCCCAGTAAGAGAGCATATATACAA... Basen 14. Juli 2017 Kartierung von Genomen 35

Anwendungen zur Kartierung des Genoms Genomweite Assoziationsstudien (GWAS) Biomasse von Pflanzen Komplexe Krankheiten Metabolom eines Organismus Eigenschaften von Bakterien 14. Juli 2017 Kartierung von Genomen 36

Anwendungen zur Kartierung des Genoms Genomweite Assoziationsstudien (GWAS) Plant 1 Plant 2 Plant 3 Plant 4 Plant 5 Finde Assoziation zwischen Markern und Phänotyp 14. Juli 2017 Kartierung von Genomen 37

Anwendungen zur Kartierung des Genoms Human GWAS Catalog (Juni, 2017) Brustkrebs 37401 SNP-Trait Assoziationen Schizophrenie 6 7 8 9 10 11 12 Alkoholabhängigkeit Typ-2 Diabetes Parkinson 14. Juli 2017 Kartierung von Genomen 38

Ausblick auf die nächste Vorlesung Was kommt als Nächstes? Restriktionsstellen-Kartierung durch Partial Digest Erläuterung der Partial Digest Methode Implementierung des Algorithmus in Python Kartierung durch Hybridisierung Unterschiedliche Algorithmen zur Erstellung physikalischer Karten durch Hybridisierungsexperimente Implementierung der Algorithmen in Python 14. Juli 2017 Kartierung von Genomen 39

Danksagung Berufungsausschuss Folien und Code zur Vorlesung http://grimmdominik.eu/teaching/ Icons made by Freepik from www.flaticon.com is licensed under CC BY 3.0 Allen Zuhörern und Zuhörerinnen https://github.com/dominikgrimm/digest/ Zusätzliche Referenzen Brown, Terence A. "Mapping genomes." (2002). Böckenhauer, H. J., & Bongartz, D. (2003). Algorithmische Grundlagen der Bioinformatik: Modelle, Methoden und Komplexität. Springer-Verlag. Welter, D., MacArthur, J., Morales, J., Burdett, T., Hall, P., Junkins, H.,... & Parkinson, H. (2013). The NHGRI GWAS Catalog, a curated resource of SNP-trait associations. Nucleic acids research, 42(D1), D1001-D1006. 14. Juli 2017 Kartierung von Genomen 40