Sequenziertechnologien Folien teilweise von G. Thallinger übernommen 11
Entwicklung der Sequenziertechnologie First Generation 1977 Sanger Sequenzierung (GOLD Standard) Second Generation 2005 454 Sequencing (von Roche aufgekauft) 2005 Solexa Sequencing (von Illumina aufgekauft) 2006 ABI SOLiD Sequencing (von Life Technologies aufgekauft) Third Generation. 2007 Helicos 2008 Pacific Biosciences 2011 Ion Torrent (von Life Technologies aufgekauft) Nanopore Sequencing (Oxford Nanopore, Roche & IBM) Next generation sequencing 12
Sequenzierung eines humanen Genoms 2001: Human Genome Project 2.7G$, 11 Jahre 10 Log 10 (Kosten) 8 6 4 2 2001: Celera 100M$, 3 Jahre 2007: 454 1M$, 3 Monate 2008: SOLiD / Life 60K$, 2 Wochen 2009: Illumina, Helicos 40-50k$ 2010: Complete Genomics. 5k$, 1 W. 2012: 1000$, <24 h? 2000 2005 2010 Jahr 13
Jährliches Sequenziervolumen 2012: 80 Milliarden bp mit einer Illumina Maschine in 11 Tagen 14
Sanger (di-deoxy) Methode 15
Sanger (di-deoxy) Methode 16
Next generation sequencing (NGS) - Begriffe Library Pool von DNA Fragmenten, der aus einer Probe nach einem bestimmten Protokoll generiert wurde Run Sequenzierlauf mit einer oder mehreren Libraries Read Eine DNA-Sequenz, die in einem Run generiert wird (eine von sehr vielen, siehe Ausbeute) Read Länge Länge eines Reads (in basepairs [bp] angegeben) Ausbeute Gesamtanzahl der bp, die in einem Run generiert wird (in Gbp); errechnet sich aus Anzahl der Reads * der durchschnittlichen Read Länge 17
Next generation sequencing - Ablauf 18
Roche (454) Workflow Library Generierung mit emulsion PCR Erzeugung der Reads über pyrosequencing Read Länge ~750bp Ausbeute ~1 Gbp An sich geringe Fehlerrate, aber Probleme bei Homopolymer Abschnitten: z.b.: AAAAAAAAAA eff. Fehlerrate 1% 19
Illumina (Solexa) Workflow Library Generierung mit bridge PCR Erzeugung der Reads mit Polymerase und reversible terminators Read Länge: bis zu 150bp (Aug. 2012 250bp) Ausbeute max. 600 Gbp Etwas höhere Fehlerrate als 454, aber kein Problem mit Homopolymere 20
Solid (Life Technologies) Library Generierung wie bei 454 Read Länge ~100 bp Ausbeute ~100 Gbp Geringe Fehlerrate Complementary strand elongation mit Ligase und speziellen 8-mer probes Jede Position wird doppelt gelesen Ausgabe der Sequenz im Colorspace, daher sehr empfindlich auf Fehler einer einzelnen Base die gesamte nachfolgende Sequenz ändert sich 21
Solid (Life Technologies) 22 22
Solid (Life Technologies) 23 23
Ion Torrent (Life Technologies) 24
ph sensing Library Generierung wie bei Roche 454 Read Länge: ~100bp, Ausbeute: 1 Gbp, Laufzeit: ~2h ( 318 chip) Fehlerrate: ~1% (Homopolymers) Ablauf wie bei 454 in Zyklen: Nukleotide werden in definierter Abfolge eingebracht und die ph Wert Änderung pro Well gemessen Welldichte (Anzahl Wells pro Chip) definiert die Ausbeute 25
Nanopore sequencing (Oxford nanopores) Veröffentlichung: Ende 2012 Keine Aufbereitung und Amplifizierung notwendig Direktes Sequenzieren unmodifizierter DNA Angekündigte Read Länge: >100kbp Ausbeute: Humanes Genom mit einem Gerät in 5 Stunden Sequenzierer sind Netzwerkknoten skalierbar Fehlerrate:4% (Ziel 2013: 1-0.1%) 26
NGS Plattformen - Vergleich 27
Diagnostische Anwendungen Genome (Bakterien, Viren, Menschen) Re sequencing humaner Exons (Microarray capture/amplification = Exome sequencing) DNA Methylierung Klassifizierung bakterieller Stämme (rrna) SNP Analyse Copy Number/Structural Variation in DNA The $1000 genome Flaschenhals: Daten-Management!!! DNA Sequencing Caught in Deluge of Data (Published: November 30, 2011) Humanes Genome: Sangersequenzierung 2001: 3 Jahre, 100M$ Nanoporesequenzierung 2013: 15 min, 1000$ 28