oqtans: Oqtans: Reproduzierbare, quantitative Transkriptom- Auswertung, auch in der Cloud Sebastian J. Schultheiss sjs@computomics.



Ähnliche Dokumente
Neue DNA Sequenzierungstechnologien im Überblick

Center for Biotechnology, Bielefeld

NEXT-GENERATION SEQUENCING. Von der Probenvorbereitung bis zur bioinformatischen Auswertung

IBM Software Demos Tivoli Provisioning Manager for OS Deployment

Prozessoptimierung in der Markt- und Medienforschung bei der Deutschen Welle (DW) mit Big Data Technologien. Berlin, Mai 2013

Sequenziertechnologien

UNIVERSITÄTSKLINIKUM Schleswig-Holstein. Sequenzierung. Norbert Arnold. Dept. Gynecology and Obstetrics Oncology Laboratory

Was ist die Cloud? CCW interner Vortrag für Themenabend Erstellt: Mai 2012, Heiko Ehmsen Dauer: ca. 30 Minuten. Inhalt

BI in der Cloud eine valide Alternative Überblick zum Leistungsspektrum und erste Erfahrungen

Diplomarbeit: GOMMA: Eine Plattform zur flexiblen Verwaltung und Analyse von Ontologie Mappings in der Bio-/Medizininformatik

Projekt. Java-Anwendung für die Sequenzanalyse (Metagenomik und Transkriptomik)

Ein starker Partner an Ihrer Seite.

8 Juli Transparenz durch Governance Data Governance als kritischer Erfolgsfaktor für Predictive Analytics

Das Archivportal Europa Neuer Blick auf die eigenen Daten

Vorhersagemodell für die Verfügbarkeit von IT-Services

Wir befinden uns inmitten einer Zeit des Wandels.

CREATIVE CLOUD FÜR TEAMS

Installationsanleitung für. SugarCRM Open Source. Windows Einzelplatz

Klausur zum Modul Molekularbiologie ILS, SS 2010 Freitag 6. August 10:00 Uhr

Predictive Modeling Markup Language. Thomas Morandell

Cloud.Service.Toolmanagement. Toolmanagement Services konfigurieren was gebraucht wird. Seminarbeitrag Stuttgart, 19.

E EDP. Elektronische Dokumentationsplattform immer und überall aktuell

AlgoBio WS 16/17 Differenzielle Genexpression. Annalisa Marsico

Moderne Methoden zur Rekonstruktion von Transkriptomen

Testen Sie die Lohngleichheit in Ihrem Unternehmen. FACHBEREICH ARBEIT

MetaQuotes Empfehlungen zum Gebrauch von

ISO 9001 Qualität & Service. Marktvorteile mit individuellem Qualitätssystem sichern

INQA-Bauen Professioneller Einsatz von Baumaschinen. Analyse und Grundlagenermittlung

my.green.ch... 2 Domänenübersicht... 4

MATCHING VON PRODUKTDATEN IN DER CLOUD

Ergebnisse der Kundenbefragung zur Zufriedenheit mit der Arbeit der Nationalen Agentur für EU-Hochschulzusammenarbeit im DAAD für das Jahr 2014

Preise und Leistungen Dynamic Computing Services

Manage The Cloud! Installation, Administration, Migration und Automation über eine einzige Konsole: Azure Citrix Hyper-V RDS VMware...

FE.N Depot System Konzept Übersicht DEUTSCHLAND. Home Depot. Premium Depot. Fashion Outlet. plus. FASHION europe.net

Entwicklung des Dentalmarktes in 2010 und Papier versus Plastik.

Newsletter November 2012

SolarWinds Engineer s Toolset

Bioinformatik: Hype oder Hoffnung?

INFOBLATT FÜR DAS NEU AUFSETZEN IHRES COMPUTERS

Vorstellung des Kompetenzzentrums Trusted Cloud

Semantische Datenintegration: von der Theorie zur Anwendung

Office 2010 ist die beliebteste Office- Version aller Zeiten. 1 Mrd. Office-Anwender. Eines der am schnellsten wachsenden Produkte von Microsoft

HTBVIEWER INBETRIEBNAHME

Universität Zürich Informatikdienste. SpamAssassin. Spam Assassin Go Koordinatorenmeeting 27. April

p-cost Benutzerhandbuch Alfred Pabinger

Das Versicherungskernsystem OPUS Machen Sie Ihr Business vom Back-End bis zum Front-End erfolgreich

Paul Petzold Firmengründer, Verwaltungsratspräsident und Delegierter der Mirus Software AG

SITA Applikations-Service Leistungsprogramm

AGFA ORBIS eportal / Orbis Web

Magento goes into the cloud Cloud Computing für Magento. Referent: Boris Lokschin, CEO

Digitale Qualitätsmanagement-Systeme im Rettungsdienst -Aktueller Stand-

Einführung von DMS in 5 Schritten

Facilitate Open Science Training for European Research. OpenAIRE und die Services des National Open Access Desks (NOAD)


Konfigurationsanleitung zu Siedl Networks Zarafa Demo Server

SMART Newsletter Education Solutions April 2015

Die Cloud Computing-Aktivitäten des BMWi

Entwicklungen bei der Linux Clustersoftware

Neues von GeoView BL, Expertenfunktionalitäten

tfacet: Hierarchisch-facettierte Exploration semantischer Daten mit Hilfe bekannter Interaktionskonzepte

Get ready for the Cloud. Ein limitiertes Angebot für bestehende und zukünftige IAMCP-Mitglieder.

Internet-Dienste unter OpenVMS

Wahlmodul MI-IT-Workshop

Master-Kolloquium Kombinierte Analyse von DNA-Methylierung und Transkriptions-Profilen in verschiedenen Immunzellen

LimeSurvey. Fragebögen online erstellt und verwalten. von und mit CVC. cvc it-services

CarMedia. Bedienungsanleitung Instruction manual. AC-Services Albert-Schweitzer-Str Hockenheim

Modellierung von Korrelationen zwischen Kreditausfallraten für Kreditportfolios. Bernd Rosenow, 3. Kölner Workshop Quantitative Finanzmarktforschung

White-Label-Apps für Werbe- und Mediaagenturen Nutzen Sie Ihren Namen und unser Know-How.

Publizieren von Webs mit SmartFTP

Vertrags- und Lizenzfragen im Rahmen des Cloud Computing LES Arbeitsgruppenmeeting 13. Mai 2011

Feedback in Echtzeit. Social Media Monitoring Services von Infopaq. SOCIAL MEDIA

LIVE/11 - WEBSPECIAL. Andreas Förthner - Clemens Kalb

Albert HAYR Linux, IT and Open Source Expert and Solution Architect. Open Source professionell einsetzen

Lizenzierung von Windows Server 2012

Das Social Semantic Web

SemTalk Services Stand: Februar 2015

Paket 1 (Reportage - Standesamt) Paket 2 (Reportage - Kirche) Paket 3 (Reportage - Trauung + Sektempfang)

KURZANLEITUNG CYBERDUCK MIT CLOUD OBJECT STORAGE

Einsatz vom deegree WPS in einer WebService Anwendung - am Beispiel vom Flex-I-Geo-Web Projekt - einem interaktiven Software-Baukasten für Geodaten

AK-Automatisierungs und Kommunikationstechnik TI Technische Informatik. NWT Netzwerktechnik

1 Dedicated Firewall und Dedicated Content Security

Herausforderungen des Enterprise Endpoint Managements

Intelligent Traveller Early Situation Awareness itesa

Die EBCONT Unternehmensgruppe.

Kommunikation, Information und mobile verteilte Systeme (KIS)

Software zur Visualisierung von Proteinen

IT-Trend-Befragung Xing Community IT Connection

Bioinformatische Suche nach pre-mirnas

Free Software Strategy In the Public Administration of South Tyrol. 12. November 2010

Bes 10 Für ios und Android

F U T U R E O F I T S M 13. itsmf Jahreskongress Kassel itsmf Projektaward 2013

Virtualisierung im Rechenzentrum

Anwendungshinweis Nr. 12. Wie konfiguriere ich redundante Serververbindungen

Elektronische Archivierung ist Ihre Verwaltung auch schon schlank?

Sicht eines Technikbegeisterten

LRU 2000 SLX RFID Gate. Long Range UHF RFID Reader. Aktuelle Konfiguration des Reader

Business-Lösungen von HCM. HCM Personalverwaltung. Mehr als nur Personalverwaltung

Webinar: Sales Productivity in Microsoft Dynamics CRM

Verde. Gudula Holzheid Senior Consultant Ex Libris (Deutschland) GmbH

Transkript:

oqtans: Oqtans: Reproduzierbare, quantitative Transkriptom- Auswertung, auch in der Cloud Sebastian J. Schultheiss sjs@computomics.com Computomics GmbH & Co. KG und Friedrich Miescher Laboratory of the Max Planck Society, Tübingen, Germany! Präsentiert bei der Sommertagung 2014 computomics molecular data analysis c oqtans online quantitative transcript analysis

DNA-Sequenzierung Kosten pro Genom- sequenzierung (Mensch) in US-Dollar $ $ 3 Mrd. 1.000 2000 2014

DNA-Sequenzierung Kosten pro Genom- sequenzierung (Mensch) in US-Dollar Genomgröße in DNA-Basen $ $ 3 Mrd. 1.000 2000 2014 3 Mrd. 17 Mrd. Mensch Weizen

DNA-Sequenzierung Kosten pro Genom- sequenzierung (Mensch) in US-Dollar Genomgröße in DNA-Basen Genom-Kopien pro Zelle $ $ 3 Mrd. 1.000 2000 2014 3 Mrd. 17 Mrd. Mensch Weizen 2 6 Mensch Weizen

Galaxy Werkbank Entwickelt von Penn State and Emory Offene, web-basierte Plattform Datenintensive Biotechnologie-Forschung Verfügbar als öffentlicher Webserver; Download; Cloud J. Goecks et al. 2010 D. Blankenberg et al. 2010 E. Afgan et al. 2010 S. Koskovsky Pond et al. 2009 W. Miller et al. 2007 J. Taylor et al. 2007 D. Blankenberg et al. 2007 M. Giardine et al. 2005

Galaxy Arbeitsweise Persistent (Histories, Parameter, Versionen) Reproduzierbar (Workflows, Pages) Transparent Glaubwürdige Bioinformatik-Analysen J. Goecks et al. 2010 D. Blankenberg et al. 2010 E. Afgan et al. 2010 S. Koskovsky Pond et al. 2009 W. Miller et al. 2007 J. Taylor et al. 2007 D. Blankenberg et al. 2007 M. Giardine et al. 2005

RNAseq für Pflanzentranskriptome

RNAseq Analyse Sequenzieren Mapping Transkripte Quantifizieren Häufige Analyseaufgaben Vergleich zweier Proben (Wildtyp, Mutante) Identifikation neuer Transkripte Lee et al. 2011 Nucleic Acids Res Yamashita et al. 2011 Genome Res Daines et al. 2011 Genome Res Ramani et al. 2010 Genome Res Tang et al. 2011 Nature Methods Grabherr et al. 2011 Nature Biotech Li et al. 2011 Science Gerstein et al. 2010 Science

RNAseq Analyse Sequenzieren Mapping Transkripte Quantifizieren Häufige Probleme Reproduzierbarkeit Verfügbarkeit von Softwareprogrammen Skalierbarkeit

oqtans Open-Source Werkbank für die quantitative Transkriptom- Analyse c oqtans online quantitative transcript analysis Sequenzieren Mapping Transkripte Quantifizieren Basierend auf Galaxy Viele zusätzliche Auswertungsprogramme Techniken basierend auf maschinellen Lernverfahren Alternative Programme

oqtans Galaxy Tools c oqtans online quantitative transcript analysis Sequenzieren Mapping Transkripte Quantifizieren PALMapper* BWA TopHat!! * Entwickelt durch die MLB Rätsch Research Group, FML, Tübingen mtim* SplAdder* ASP* Plus EasySVM, KIRMES and more Trinity Cufflinks GFF Toolkit* rquant* rdiff* Cufflinks/ Cuffdiff DESeq Genesetter* topgo SAFT*

oqtans Transkriptom-Analyseprogramme Sequenzieren PALMapper Read Mapping Transkripte Quantifizieren PALMapper: sehr genauer Read Mapper, der Basenqualität und Spleißstellenvorhersagen verwendet G. Jean et al. 2010 Curr Protoc Bioinformatics

oqtans Transkriptom-Analyseprogramme Sequenzieren Mapping mtim Transcript Prediction Segmentation Quantifizieren mtim: rekonstruiert Exon-Intron Struktur aus Alignments und Spleißstellenvorhersagen SplAdder: fügt Isoformen zu existierender Annotation hinzu, basiert auf Spleißgraph G. Zeller et al. 2013 i.p.

oqtans Transkriptom-Analyseprogramme Sequenzieren Mapping Transkripte Quantification rquant rquant: entfernt systematische Fehler der Sequenzbankherstellung, Sequenziermaschine, des Readmappings Genaue Bestimmung der Transkript- Häufigkeit R. Bohnert & G. Rätsch 2010 Nucleic Acids Res

oqtans Transkriptom-Analyseprogramme Sequenzieren Mapping Transkripte rdiff/deseq Quantification rdiff/deseq: Bestimmt signifikante Unterschiede bei der Transkript/ Genexpression zwischen Proben durch statistische Tests O. Stegle et al. 2010 Nature Preceedings S. Anders and W. Huber 2010 Genome Biology

oqtans Transkriptom-Analyseprogramme Sequenzieren Mapping Transkripte SAFT, Quantification topgo,... SAFT: Das Simple Alignment Filter Tool bestimmt die Alignmentgenauigkeit A. Kahles et al. 2013 i.p.! topgo: Gen-Ontologie Anreicherungsanalyse und Visualisierung!! A. Alexa et al. 2006 Bioinformatics

oqtans Genomannotation Sequenzieren Mapping Transkripte Quantification mgene mgene: Proteincodierende Gene und exprimierte, nichtcodierende Bereiche Spleißstellen, Exons, Introns, Transkripte RGASP-Wettbewerb!! G. Schweikert et al. 2011

oqtans Funktionelle Annotation Sequenzieren Mapping Transkripte Transkriptfunktion Quantification SWISSPROT: Proteinfunktion Pfam: Protein-Domänenfunktion PROVEAN: Schwerwiegende Mutationen ncrna-pipeline

oqtans Ergebnisse c oqtans online quantitative transcript analysis Sequenzieren PALMapper DESeq genesetter A. thaliana Illumina, 78 nt RNA-seq reads Nordamerika (Col-0) (1,2 Millionen) Kanarische Inseln (Can-0) (4,9 Millionen) Gan et al. 2011 Nature

oqtans Genesetter

Cloud Computing Kosten c oqtans online quantitative transcript analysis Sequenzieren! PALMapper DESeq genesetter Verwendeter Computer: 1 XXL Zeit: Quantitative Analyse: < 1 h Kosten bei der Amazon Cloud: ca. $0.82 USD

Intron Positionsgenauigkeit durch Read Alignments 0.90 Sequencing PALMapper TopHat 0.75 0.60 0.68 0.77 544 min 0.45 O. sativa 75 nt RNA-seq reads (24 million) 0.30 0.15 186 min 0.00 F-score Laufzeit

Intron Positionsgenauigkeit durch Read Alignments 0.90 PALMapper mtim 0.75 0.81 Sequencing O. sativa TopHat Cufflinks F-Score 0.60 0.45 0.30 0.58 0.37 75 nt RNA-seq reads (24 million) 0.15 0.00 0.11 Introns Transkripte

Cloud Computing Kosten c oqtans online quantitative transcript analysis Sequenzieren! PALMapper mtim Transkriptfunktion Verwendeter Computer: 20x large-memory Zeit: Quantitative Analyse: 1 h Kosten bei der Amazon Cloud: ca. $7.38 USD

oqtans Verfügbarkeit Open-source Pakete Galaxy Tool Wrapper http://oqtans.org Installation in bestehende Galaxy-Instanz Community Tool Shed http://toolshed.g2.bx.psu.edu/

computomics molecular data analysis Mission Wir erbringen Dienstleistungen für die Analyse von Sequenzdaten und begleiten unsere Kunden vom Experimentdesign bis hin zu komplexen Interpretationen.! Zielkunden Forscher aus Pflanzenbiotechnologie-, Züchtungs- und Saatgutfirmen.! Alleinstellung Validierte Methoden und Qualitätskontrolle Transparent und Reproduzierbar Unabhängig Kundenspezifische Dienstleistung Datensicherheit

oqtans Verfügbarkeit: Cloud Computing Demo Cloudinstanz mit allen oqtans tools http://cloud.oqtans.org AMI bei Amazon Web Services für EC2 Cloudman um beliebig viele Instanzen als Compute Cluster zu starten

oqtans Verfügbarkeit: Cloud Computing

http://oqtans.org Géraldine Jean, Jonas Behr, Regina Bohnert, Philipp Drewe, Nico Görnitz André Kahles, Pramod Mudrakarta,Vipin T. Sreedharan, Georg Zeller, Gunnar Rätsch

oqtans: Oqtans: Reproduzierbare, quantitative Transkriptom- Auswertung, auch in der Cloud Sebastian J. Schultheiss sjs@computomics.com Computomics GmbH & Co. KG und Friedrich Miescher Laboratory of the Max Planck Society, Tübingen, Germany! Präsentiert bei der Sommertagung 2014 computomics molecular data analysis c oqtans online quantitative transcript analysis