Von der DNA zur Datenbank: Sequenzierung & Assemblierung



Ähnliche Dokumente
A T C G G C T A A T A T

Inhalt. Was ist Bioinformatik? Was ist Genomik? Was ist Metagenomik? Metagenomische Analyse. Was ist Bioinformatik? Warum Bioinformatik?

Sequenziertechnologien

1. Die Gene befinden sich im Zellkern. Zellleib. 2. Chromosomen bestehen aus DNA. 4. Ein Gen ist ein DNA-Abschnitt 7. Protein-Herstellung nach Bedarf

Neue DNA Sequenzierungstechnologien im Überblick

Wissenschaftlich-technische Entwicklungen im Bereich der Multiplex- und High-Throughput-Diagnostik. Karl J. Lackner

Algorithmen und Anwendungen zur Kartierung von Genomen

Übersicht Sequenziermethoden

Molekularbiologische Methoden

1. Beschreiben Sie die Rolle der folgenden Proteine bei der DNA- Replikation in E. coli:


Applied Bioinformatics.

Von Mendel bis -Omics Geschichte und Grundlagen der Humangenetik , Walther Vogel, Institut für Humangenetik

Einführung in die Umweltwissenschaften

Prüfung Molekulare Genetik

Testmethoden der Molekularpathologie. im Vergleich

Bioinformatik I: Grundlagen der Gentechnik

Vertiefendes Seminar zur Vorlesung Biochemie I

Ausprägungsfach Bioinformatik im Rahmen des Bachelor-Studiengangs Informatik. CIBIV Center for Integrative Bioinformatics Vienna

Abbildungs- und Tabellenverzeichnis Abkürzungsverzeichnis Genbezeichnung. 1. Einleitung 1

Antibiotika sind oft Inhibitoren der Genexpression

Genomsequenzierung für Anfänger

Einblicke in das menschliche Erbgut (Genom) am Computer

Das Prinzip der DNA-Sequenzierung Best.- Nr

DNA: Aufbau, Struktur und Replikation

Humane Genotyp-Phänotyp-Datenbanken: Ein Statusbericht

Vererbung. Die durch Fortpflanzung entstandene Nachkommenschaft gleicht den Elternorganismen weitgehend

Was ist der Promotor? Antwort: Eine spezielle Nucleotidsequenz auf der DNA, an der die RNA-Polymerase bindet um die Transkription zu starten.

Bioinformatik: The Next Generation

2.1 Die Entstehung des Gehirns aus neuralen Stammzellen Transkriptionsfaktoren in der Gehirnentwicklung...16

Genetik Praktikumsklausur SS2005

Bioinformatik: The Next Generation

V4 Analyse von Genomsequenzen

Aufgabe 1. Bakterien als Untersuchungsgegenstand!

Center for Biotechnology, Bielefeld

Individuelle Genomsequenzen Aussichten für die Tierzucht

Gentechnologie fur Einsteiger

Synthetische Biologie

V4 Analyse von Genomsequenzen

oqtans: Oqtans: Reproduzierbare, quantitative Transkriptom- Auswertung, auch in der Cloud Sebastian J. Schultheiss

Glossar. Agarose Das weiße Pulver, das aus Meeresalgen gewonnen wird. Nach der Zugabe

Evolution. Genetik für Bioformatiker # 1. Peter N. Robinson. Institut für Medizinische Genetik und Humangenetik Charité Universitätsmedizin Berlin

Übung 9. a) In welchem Teil eines Operons führen Mutationen zur Veränderungen der produzierten Menge eines Enzyms?

Biochemisches Grundpraktikum

In den Proteinen der Lebewesen treten in der Regel 20 verschiedene Aminosäuren auf. Deren Reihenfolge muss in der Nucleotidsequenz der mrna und damit

Tanja Zeller. Universitäres Herzzentrum Hamburg. Universitätsklinikum Hamburg-Eppendorf

Grundlagen der Zellulären Biochemie

Identifikation einer neuen WRKY-Transkriptionsfaktorbindungsstelle. in bioinformatisch identifizierten,

Gentechnologie für Einsteiger

Masterarbeit. Variantentolerantes Readmapping durch Locality Sensitive Hashing. Jens Quedenfeld November Gutachter: Sven Rahmann Dominik Köppl

Inhalt Genexpression Microarrays E-Northern

Hochdurchsatz Generierung und Analyse von Arabidopsis thaliana-proteinen

Bioinformatik an der FH Bingen

VORTRÄGE N447. Nordrhein-Westfälische Akademie der Wissenschaften WALTER SCHAFFNER OTTO SPANIOL. Wie werden unsere Gene ein- und ausgeschaltet?

UNIVERSITÄTSKLINIKUM Schleswig-Holstein. Sequenzierung. Norbert Arnold. Dept. Gynecology and Obstetrics Oncology Laboratory

Solid-State Nanopores. Vortrag von Ann-Kathrin Wagner am 15. Juli 2013

Entwicklungs /gewebespezifische Genexpression. Coexpression funktional überlappender Gene

Kapitel 5: Protein-Datendanken

Exercises to Introduction to Bioinformatics Assignment 5: Protein interaction networks. Samira Jaeger

Biologie I/B: Klassische und molekulare Genetik, molekulare Grundlagen der Entwicklung Theoretische Übungen SS 2016

Inhaltsverzeichnis. 1 Was bitte ist denn»molekularbiologie«? Einige grundlegende Methoden... 13

V4 Analyse von Genomsequenzen

Restriktion und Gentechnik

9.) Wie heißen die kurzen RNA-Moleküle, mit deren Hilfe die Polymerase die Replikation der DNA starten kann? a) Starter b) Primer c) Beginner

Personalisierte Medizin

2.2. Peptide. Peptide entstehen durch Kondensation der a-carboxylgruppe einer Aminosäure mit der a-aminogruppe einer anderen Aminosäure

Gentechnische Methoden


Bioinformatik. Zeichenketten und Stringalgorithmen. Ulf Leser Wissensmanagement in der. Bioinformatik

Algorithmische Bioinformatik

Das internationale Human-Genom Projekt. Stand Ergebnisse Perspektiven

Seminar Biomedical Informatics

Bioinformatik. Zeichenketten und Stringalgorithmen. Ulf Leser Wissensmanagement in der. Bioinformatik

Darwins Erben - Phylogenie und Bäume

1. Nennt Informationen, die ein Wissenschaftler für die Durchführung des farbig markierten Schrittes benötigt. 2. Nennt zusätzliche Probleme die bei

Genetik - The Human Genome Project. Überblick über die Genetik. Die gesamte Erbinformation eines Menschen befindet sich in jedem Zellkern

Datenhaltung und verwaltung am IPK. Steffen Flemming

Inhaltsverzeichnis. Polymerase Chain Reaction Theoretischer Hintergrund - 2 -

Modell für rezessive Epistasie

Erbgutanalyse mit wachsendem Automatisierungsgrad

Vom Gen zum Naturstoff!

Die doppelsträngige Helix wird zunächst aufgetrennt. Enzym: Helicase (ATP-abhängig)

Entwicklungs /gewebespezifische Genexpression

Während der Synthese synthetisiert die Polymerase den neuen Strang in 5 3 Richtung und bewegt sich in 3 5 -Richtung am Matrizenstrang entlang:

Übung 11 Genregulation bei Prokaryoten

Python im Bioinformatiker-Alltag

kam zum Prozess vor einem Gericht in Los Angeles, Kalifornien. Chaplin erwirkte einen Bluttest, um anhand der Blutgruppen zu zeigen, dass er nicht

AF. Bioinformatik im Bachelor-Studiengang Informatik. CIBIV Center for Integrative Bioinformatics Vienna. Bioinformatik eine Definition

Gentechnik/Gentechnologie

Nennen Sie die unterschiedlichen rrnas der A.) prokaryotischen und B.) eukaryotischen Ribosomen.

Das Mikrobiom in Gynäkologie, Geburtshilfe und Reproduktionsmedizin. Wilfried Feichtinger

Maike van Ohlen (Autor) Pieris rapae und das Glucosinolat-Myrosinase-System Cyanidentgiftung in Lepidoptera

AGES-Webribo. Systematik in Clostridium difficile PCR-Ribotyping. Alexander Indra

Rekombinante Antikorper. fur,,lab-on-chip"

Softwarewerkzeuge der. Bioinformatik

Abbildungsverzeichnis. Tabellenverzeichnis. Abkürzungsverzeichnis. 1 Einleitung 1

DNA-Replikation. Konrad Beyreuther. Stefan Kins

Regulation der Expression, Funktion und Internalisierung von muscarinischen Acetylcholinrezeptoren

Transkript:

Vorlesung Einführung in die Bioinforma4k SoSe 2012 Von der DN zur Datenbank: Sequenzierung & ssemblierung Prof. Daniel Huson ZBI enter for Bioinformatics Entdeckung der DN Friedrich Miescher (1844-1895) 1869 Miescher entdeckte DN in der Küche des Schlosses Hohentübingen 2 Biomolekulare rundlage des Lebens Wiki.org...... 1953 Watson und rick - Struktur der DN ist eine Doppelhelix - Die Reihenfolge der Basen enthält InformaNonen, die in der Zelle verarbeitet werden 3 1

DN und Proteine 4 Protein Sequenzierung 1955 Biochemiker Frederick Sanger besnmmt die erste vollständige minosäurensequenz eines Proteins, Insulin. 1 malwmrllpl lallalwgpd paaafvnqhl cgshlvealy lvcgergffy tpktrreaed 61 lqvgqvelgg gpgagslqpl alegslqkrg iveqcctsic slyqlenycn 5 DN Sequenzierung 1975 Frederick Sanger entwickelt die Kettenabbruchmethode zur Sequenzierung von DN Wikipedia.org 6 2

enomics " enomics ist das Studium der enomsequenzen einzelner Organismen " Sequenzierung und ssemblierung " nnotation und nalyse " enomvergleich 7 enomics " enomgrößen: " Virus 5-10 Kilobasen (kb) " Bakterien: 1-10 Millionen Basen (Mb) " rabidopsis thaliana: 120 Mb " Fruchtfliege: 140 Mb " Mensch: 3 Millarden Basen (b) enetics is a way of thinking. enomics is a set of tools. Mary-laire King (Science, Feb 2011) 8 Sequenzierung 10 000 Basen DN (x150000) Probe elesene DN Sequenz DN Molekül Datenbank heißt Read 9 3

Sanger Sequenzierung DN Polymerase XXXXXX Deoxynukleotide 10 Sanger Sequenzierung DN Polymerase XXXXXX Deoxynukleotide efärbte di-deoxynukleotide 11 Kapillar- echnologie 12 4

Sequenzfabriken 13 enomik 2001 Die Sequenzierung des enoms des Menschen Mondlandung 14 Sequenzierung & ssemblierung Schrotschuss Zerteilung der DN Klonierung und Sequenzierung ssemblierung und nnotation 15 5

ssemblierung 16 Sequenzierungsprojekte OLD: enomes online database www.genomesonline.org 17 Second- enera4on Sequenzierungstechnologien " Seit 2005 neue Hochdurchsatzmethoden 18 6

Second- enera4on Sequenzierung www.454.com Source: Stephan. Schuster, Penn State Nature, 2005 19 Emulsion mplifika4on a) Wasser-in-Öl Mikroreaktoren c) uflösung der Mikroreaktoren b) Klonierung des Fragments und Befestigung an der Kugel Source: 454 20 Kugeln verteilen auf einer PicoiterPlateM Enzyme hinzugefügt Kugeln werden in Mikrowells verteilt Zentrifugation 44 μm Source: 454 21 7

Pyrosequenzierung " Parallele Sequenzierung der Fragmente: Fluss Fluss 22 Pyrosequenzierung " Parallele Sequenzierung der Fragmente: Fluss Fluss Fluss usw... 23 Pyrosequenzierung " BasenbesNmmung durch nalyse einer Serie von Bildern Source: 454 24 8

egenüberstellung Sanger Next en " Erste eneration (Sanger Sequenzierung): " 100kb/Lauf, mittlere Read Länge 1000bp, Preis: 500$/Mb " Zweite eneration: " Roche(454): 600 Mb/Lauf, 600bp, 20$/Mb " Illumina: 400 b/lauf, 100bp, 0.50$/Mb " SOLiD: 500 b/lauf, 50bp, 0.50$/Mb " Dritte eneration: " PacBio SMR: 25b/Lauf, >1000bp,?$/Mb " anz neu: " Ion orrent: 100bp/Lauf, 10x billiger als Roche(454) 25 ssemblierung enom Shotgun Sequenzierung ssemblierung Mapping auf das enom 26 ssemblierung " Sequenzierung produziert Millionen von kurzen DN Reads " BioinformaNk: Suche überlappende Sequenzen und füge sie zusammen 27 9

NBI Datenbank " Die Hauptresource für Sequenzdaten ist NBI: 28 NBI Datenbank 29 NBI Datenbank Hund-enom? 30 10

NBI Datenbank Hund-enom 31 Zusammenfassung " DN enthält Bauanleitungen für die Zelle " Sequenzierungsmethoden produzieren kurze Reads von DN Sequenz " Längere Sequenzabschni]e werden aus Reads assembliert " Es gibt > 5000 Sequenzierungsprojekte " Sequenzdaten (DN, Proteine, RN) werden in der NBI Datenbank abgelegt und sind dort frei zugänglich 32 11