Andreas Albersmeier CeBiTec Bielefeld 3. Life Science Conference Analytik Jena Jena 14.05.2014
Center for Biotechnology, Bielefeld sketchup.google.com Genomik Transkriptomik Proteomics Metabolomics Genom (re-)sequenzierung Microarrays & qrt-pcr RNASeq Gel-based und LCbasierte protein Identifizierung & Analyse GC- und LC-basiertes Metabolit profiling Und Flux Analysen
Hochdurchsatzsequenzierung Transkriptomsequenzierung (RNASeq) Illumina HiSeq1500 2013 De novo Sequenzierung Resequenzierung Illumina MiSeq 2012 Metagenomsequenzierung Roche GS FLX+ 2008 Amplikonsequenzierung Ion Torrent PGM 2011
Hochdurchsatzsequenzierung Transkriptomsequenzierung (RNASeq) Tiefer Einblick in die Genexpression Auflösung auf einzelne Base genau Hoher dynamischer Bereich Hohe Zahl kurzer Sequenzen (Reads) erforderlich -> Illumina-Technologie Illumina MiSeq 2012 Illumina HiSeq1500 2013
Hochdurchsatzsequenzierung Transkriptomsequenzierung (RNASeq) Tiefer Einblick in die Genexpression Auflösung auf einzelne Base genau Hoher dynamischer Bereich Hohe Zahl kurzer Sequenzen (Reads) erforderlich -> Illumina-Technologie Corynebacterium glutamicum ATCC13032 Industriell relevanter Aminosäureproduzent Genom bekannt seit 2003 Modellorganismus auch für pathogene Corynebakterien RNASeq in C. glutamicum ermöglicht Analysen zu(r) Promotoren Ribosomenbindestellen Annotation Differentielle Genexpression Operons Terminatoren Antisense Transkripten Transkriptionsstarts small RNAs Riboswitches
Abreicherung ribosomaler RNA Mehr als 95% der gesamten RNA in Bakterien ist ribosomale RNA Schlechte Abdeckung des Transkriptoms Ohne Abreicherung: 95% rrna Mit Abreicherung: <50% rrna rrna mrna Gemappte Reads Abreicherung der rrna erlaubt deutlich bessere Ergebnisse In Eukaryonten werden mrnas über poly-a-schwanz angereichert In Prokaryonten sind Kits erhältlich, die zu einer Reduktion der rrna führen
Herstellung einer sequenzierfähigen Library Protokoll TruSeq mrna stranded von Illumina RNA-Fragmentierung Synthese des Erststrangs unter Verwendung von random priming U U U Synthese des Zweitstrangs; Einbau von Uracil statt Thymin U U U Ligation spezifischer Adapter Gezielte Amplifikation des Erststrangs; Zweitstrang mit Uracil kann nicht kopiert werden
Sequenzierung und Mapping Erstellung von kurzen Reads (25-50nt) Erstellung von paired reads (Illumina-Technologie) Mappen der Reads auf das Referenzgenom Mappen der paired reads auf das Referenzgenom Verbindung der paired reads Transkript Genom Paired reads können die Abdeckung des Transkriptoms deutlich erweitern Einzelne Reads sind für manche Fragestellungen ausreichend
Visualisierung der Daten Software: ReadXplorer (www.readxplorer.org) Strangspezifische Visualisierung der Reads Tools zur Analyse der Daten Höhe der gelben/grünen Peaks zeigt die Anzahl der gemappten Reads Hinstrang Genom Rückstrang Hinstrang Transkriptom Rückstrang Hilker et al. 2014: ReadXplorer - Visualization and Analysis of Mapped Sequences. In: Bioinformatics. DOI: 10.1093/bioinformatics/btu205.
Operons in C. glutamicum Operon (polycistronisch) Transkript 2 (moncistronisch) Transkript 3 (monocistronisch) Transkript 4 (monocistronisch) Lückenlose Mappings zwischen Genen zeigen Operons 2/3 der ca. 3000 Gene in C. glutamicum sind in Operons organisiert Ca. 50% der Operons bestehen nur aus 2 Genen Das längste Operon besteht aus 16 Genen
Grenzen der Auflösung? Keine genaue Auflösung an den Transkriptenden mit Standardprotokoll Modifikationen für die Herstellung der Library erforderlich Libraries sollen z.b. Identifizierung des Transkriptionsstarts ermöglichen Promotor Pfeifer-Sancar et al. (2013) Comprehensive analysis of the Corynebacterium glutamicum transcriptome using an improved RNAseq technique. BMC Genomics. 14:888.
Optimierung der Library P RNA-Adapter DNA-Loop- Adapter N(7) Adapter werden auf RNA- Ebene zugefügt Ligation RNA-Adapter am 5 Ende Hybridisierung DNA-Loop- Adapter am 3 Ende
Optimierung der Library P Start der Transkription P P P P Prozessierte RNA Primäres Transkript Primäre Transkripte in Bakterien mit 5 Triphosphat-Ende Abbau von prozessierten RNAs mit 5 Monophosphat durch Terminator Exonuclease Anreicherung des nativen 5 Endes P P P RNA-Adapter DNA-Loop- Adapter N(7) Adapter werden auf RNA- Ebene zugefügt Ligation RNA-Adapter am 5 Ende Hybridisierung DNA-Loop- Adapter am 3 Ende
Identifizierung von Transkriptionsstarts (TSS) Anhäufungen von gemappten read starts zeigen TSS 3084 TSS konnten identifiziert werden 1792 TSS liegen bis zu 500 Basen upstream eines Genstarts Ca. 1/3 dieser TSS gehören zu leaderless transcripts TSS Anzahl der TSS 700 600 500 400 300 200 100 0 0 40 80 120 160 200 240 280 320 360 400 440 480 Länge der nicht translatierten Region (UTR)
Leaderless transcripts in C. glutamicum Annotierter Start Gemappter Start Leaderless transcripts identifiziert in Prokaryonten, Eukaryonten und Archaeen Keine gemeinsame Funktion erkennbar in C. glutamicum TSS downstream des Genstarts können falsch annotierte Gene anzeigen 205 Gene wurden neu annotiert, davon 185 als leaderless transcript
Identifizierung neuer Transkripte Annotatierte trna Unbekannte small RNA 262 small RNAs konnten in C. glutamicum identifiziert werden 77 davon mit konservierter Sequenz in anderen Corynebakterien Andere bestätigt über Northern Blots Mentz et al. 2013. Comprehensive discovery and characterization of small RNAs in Corynebacterium glutamicum ATCC 13032. BMC Genomics 14(1), 714
Zusammenfassung Analysen in C. glutamicum mit RNASeq Ribosomenbindestellen Promotoren Annotation Differentielle Genexpression Operons Terminatoren Antisense Transkripten Transkriptionsstarts small RNAs Riboswitches RNASeq Experimente in C. glutamicum Funktionelle Charakterisierung neuer Transkripte Detallierte Analyse der leaderless transcripts Detaillierte Analyse der Promotoren Erleichterung genetischer Manipulation in C. glutamicum
Zusammenfassung Analysen in C. glutamicum mit RNASeq Ribosomenbindestellen Promotoren Annotation Differentielle Genexpression Operons Terminatoren Antisense Transkripten Transkriptionsstarts small RNAs Riboswitches RNASeq Experimente in C. glutamicum Funktionelle Charakterisierung neuer Transkripte Detallierte Analyse der leaderless transcripts Detaillierte Analyse der Promotoren Erleichterung genetischer Manipulation in C. glutamicum
Zusammenfassung Analysen in C. glutamicum mit RNASeq Ribosomenbindestellen Promotoren Annotation Differentielle Genexpression Operons Terminatoren Antisense Transkripten Transkriptionsstarts small RNAs Riboswitches RNASeq Experimente in C. glutamicum Funktionelle Charakterisierung neuer Transkripte Detallierte Analyse der leaderless transcripts Detaillierte Analyse der Promotoren Erleichterung genetischer Manipulation in C. glutamicum RNASeq in C. glutamicum mit dem Ziel möglichst alle Transkripte zu erfassen Verwendung von RNA-Pools Vergleich verschiedener Transkriptome ebenfalls möglich
Differentielle Genexpression Messung technischer und biologischer Varianz RNASeq mit dem Archaeon Sulfolobus solfataricus Vergleich biologischer Replikate Normalisierung der Genaktivität über den RPKM-Wert (Reads-Per-Kilobase-of-gene-per Million-reads) Sulfolobus solfataricus (www.sulfosys.com) 100000 10000 1000 R² = 0,9746 RNAseq von zwei S. solfataricus Proben Proben unterscheiden sich durch verwendete 100 C-Quelle Gene 10 mit starken Abweichungen meist in direkter Verbindung zur C-Quellen Nutzung 1 1 10 100 1000 10000 100000 RPKM Biol. Replikat 2Vergleich verschiedener Proben RPKM Biol. Replikat 1 100000 10000 RPKM C-Quelle B 1000 100 10 1 R² = 0,9165 1 10 100 1000 10000 100000 RPKM C-Quelle A
Danksagungen Leiter der Technologieplattform Prof. Dr. Jörn Kalinowski Libraries und Datenanalyse Katharina Pfeifer-Sancar Armin Neshat small RNAs Dr. Almut Mentz Sequenzierung Anika Winkler ReadXplorer Rolf Hilker Mappings und Auswertung Dr. Christian Rückert
Vielen Dank für ihre Aufmerksamkeit Any Questions?