Masterarbeit. Variantentolerantes Readmapping durch Locality Sensitive Hashing. Jens Quedenfeld November Gutachter: Sven Rahmann Dominik Köppl
|
|
- Christina Schenck
- vor 7 Jahren
- Abrufe
Transkript
1 Masterarbeit Variantentolerantes Readmapping durch Locality Sensitive Hashing Jens Quedenfeld November 2015 Gutachter: Sven Rahmann Dominik Köppl Technische Universität Dortmund Fakultät für Informatik Lehrstuhl für Algorithm Engineering (LS 11)
2
3 Inhaltsverzeichnis 1 Einleitung Motivation und Hintergrund Aufbau der Arbeit Theoretische Analyse 5 i
4 ii INHALTSVERZEICHNIS
5 Kapitel 1 Einleitung 1.1 Motivation und Hintergrund Ein zentraler Baustein des Lebens ist die Desoxyribonukleinsäure oder kurz DNA. Sie ist der Träger der Erbinformation und bestimmt damit das Aussehen und die Eigenschaften von Lebewesen. DNA besteht im Wesentlichen aus vier verschieden Basen, deren Reihenfolge der Erbinformation entspricht. Von daher ist es von groÿem wissenschaftlichen Interesse die DNA eines Lebenwesens zu sequenzieren, also die Abfolge der Basenpaare zu bestimmen. Die Kosten und der Aufwand für das Sequenzieren eines Genoms, also der gesamten DNA eines Lebewesens bzw. einer Zelle, sind in den letzten Jahren stark gesunken. Dadurch wird es immer einfacher und schneller möglich, die DNA eines Lebewesens, speziell die des Menschen, zu analysieren. Allerdings liefern diese Verfahren nur kurze Fragmente, sogenannte Reads mit einer Länge von (je nach Verfahren) 50 bis Basenpaaren. Diese Reads müssen durch ein rechenintensives Verfahren wieder zu dem Genom zusammengesetzt werden. Da sich die DNA verschiedener Menschen stark ähnelt (bis zu 99,5% sind gleich[?]), ist es deutlich leichter, ein bereits sequenziertes Referenzgenom zu betrachten und die Reads in diesem wiederzunden. Ein Programm, das dieses Problem löst, wird als Readmapper bezeichnet. Bei Menschen beträgt die Länge des Genoms etwa drei Milliarden Basenpaare. Da nach der Sequenzierung viele Millionen Reads vorliegen, wäre es viel zu rechenaufwändig, für jeden Read das gesamte Referenzgenom zu durchsuchen. Von daher sind spezielle Verfahren nötig, um einen Read ezient an die richtige Position im Referenzgenom zuzuordnen. Eine weitere Schwierigkeit ist die notwendige Fehlertoleranz: Referenzgenom und Reads passen nicht exakt überein, da es zum einen Varianten gibt (nicht alle Menschen sind gleich, dies sind die verbleibenden 0,5%) und zum anderen beim Sequenzieren verfahrensbedingt Fehler auftreten. Dadurch dass bereits die Genome von über 1000 Menschen sequenziert wurden, sind zahlreiche Varianten bekannt. Herkömmliche Readmapper wie BWA [?] nutzen diese Zusatzinformation jedoch nicht aus. Ein variantentoleranter Readmapper (wie beispielsweise mrsfast-ultra [?]) benutzt dagegen als zusätzliche Eingabe eine sogenannte VCF-Datei, die häug vorkommende Varianten enthält. Kommen in den Reads bekannte Varianten vor, werden diese Unterschiede nicht als Fehler gewertet. Variantentolerante Readmapper können dadurch solche Reads deutlich besser im Referenzgenom wiedernden als herkömmliche Readmapper. Die Projektgruppe 583 der TU Dortmund [?] hat einen solchen variantentoleranten Readmapper namens VATRAM entwickelt, der auf einem Verfahren namens Locality Sen- 1
6 2 KAPITEL 1. EINLEITUNG sitive Hashing (kurz LSH) basiert [?,?]. Die Ergebnisse der Projektgruppe haben gezeigt, dass das Locality Sensitive Hashing ein vielversprechender Ansatz ist. Teilweise mappt VATRAM sogar schneller und besser als State-of-the-art Readmapper wie BWA. Allerdings blieben bei den Forschungsergebnissen der Projektgruppe noch einige Fragestellungen oen, die in meiner Masterarbeit weiter untersucht werden sollen. Im wesentlichen besteht VATRAM aus zwei Teilen: Der Mapper bestimmt für jeden Read mit Hilfe von sogenannten q-grammen und dem LSH-Index ein ungefähres Intervall auf Referenzgenom. Der Aligner berechnet anschlieÿend ein konkretes Alignment zwischen Read und Referenz, das anzeigt, welche Basen zueinander gehören, welche durch andere Basen ersetzt wurden und wo Basen eingefügt oder gelöscht wurden. In dieser Masterarbeit wird ausschlieÿlich auf das Mapping durch LSH eingegangen. Eine Weiterentwicklung des Aligners von VATRAM soll nicht stattnden, da dies zu weit führen würde. 1.2 Aufbau der Arbeit Die Arbeit besteht im wesentlichen aus vier Teilen. Zunächst werden in Kapitel?? die zum Verständnis dieser Arbeit notwendigen biologischen und technischen Grundlagen erläutert. Zu den biologischen Grundlagen gehört der Aufbau von DNA, Chromosomen, Mutationen und Varianten sowie die gängigsten Sequenzierverfahren. Darüber hinaus wird Readmapping formal deniert und die bezüglich Readmapping gängigen Dateiformate aus der Bioinformatik erläutert. Das darauf folgende Kapitel?? behandelt den von der Projektgruppe entwickelten Readmapper VATRAM. Die Funktionsweise von VATRAM wird detailliert erklärt. Darüber hinaus wird Locality Sensitive Hashing formal deniert und grundlegende theoretische Eigenschaften erörtert und bewiesen. Auÿerdem werden die im Rahmen der Masterarbeit entwickelten Erweiterungen beschrieben. Dazu gehört insbesondere die Unterstützung sogenannter Paired-End-Reads, die Verarbeitung von Reads mit variabler (also nicht konstanter) Länge sowie die Berücksichtigung der Auftretetswahrscheinlichkeit von Varianten. Kapitel 2 beinhaltet eine theoretische Analyse des Readmappers VATRAM. Insbesondere wird die Frage geklärt, in welchen Fällen sich das Hinzufügen einer SNP-Variante zum Suchindex lohnt, wenn die Variante mit einer bestimmten Häugkeit auftritt. Die aktuelle Version von VATRAM verwendet sogenanntes Min-Hashing als LSH-Funktion. Es existieren noch weitere LSH-Funktionen, wie beispielsweise Sim-Hashing. Bevor eine solche alternative Hashfunktion implementiert wird, soll zunächst theoretisch untersucht werden, ob bessere Ergebnisse zu erwarten sind. Die Projektgruppe hat VATRAM bisher nur mit Reads der Länge 100 getestet. In der experimentellen Analyse (Kapitel??) wird untersucht, wie VATRAM mit längeren Reads skaliert und wie die verschiedenen Parameter von VATRAM bei solchen Reads gewählt werden sollten (siehe Abschnitt??). Häug liefern Sequenziermaschinen (wie die der Firma Illumina) sogeannte Paired- End-Reads. Paired-End-Reads bestehen aus zwei sequenzierten DNA-Sequenzen mit einer unsequenzierten, dazwischen liegenden Lücke, dessen Länge nur ungefähr bekannt ist. Eine Unterstützung von Paired-End-Reads wurde von der Projektgruppe noch nicht implementiert. Dies soll im Rahmen Masterarbeit nachgeholt werden. Die experimentelle Evaluation von Paired-End-Reads ndet sich in Abschnitt??. Die Verarbeitung von Reads unterschiedlicher Länge ist bei VATRAM problematisch, da der erzeugte LSH-Index nur für eine bestimmte Readlänge optimal funktioniert. Das
7 1.2. AUFBAU DER ARBEIT 3 neu entwickelte Verfahren, mit dem auch Reads variabler Länge verarbeitet werden können (siehe Abschnitt??), wird in Abschnitt?? getestet und evaluiert. Am Ende des experimentellen Teils (Abschnitt??) wird VATRAM mit anderen Readmappern verglichen. Dazu werden sowohl synthetische als auch echte Reads genutzt. Die Vergleichskriterien sind primär die Anzahl der korrekt und falsch gemappten Reads, aber auch die Laufzeit sowie der Speicherbedarf der einzelnen Readmapper. Die Masterarbeit endet mit einem Ausblick über oen gebliebene Fragestellungen (Abschnitt??) sowie einer Zusammenfassung der wichtigsten Ergebnisse (Abschnitt??).
8 4 KAPITEL 1. EINLEITUNG
9 Kapitel 2 Theoretische Analyse 5
10 6 KAPITEL 2. THEORETISCHE ANALYSE Wahrscheinlichkeit n = 100, e = 0,5m = 42 2,5% 2,0% 1,5% 1,0% 0,5% 0,0% o = 1n o = 1,1n o = 1,2n o = 1,3n o = 1,4n o = 1,5n o = 1,6n o = 1,8n o = 2n o = 2,2n o = 2,4n o = 2,6n o = 2,8n o = 3n o = 3,5n o = 4n o = 4,5n o = 5n Abbildung 2.1: Wahrscheinlichkeiten, einen Read nicht zu nden für unterschiedliche Kongurationen. Die Überschrift der Diagramm gibt die Readlänge n und die Anzahl e der fehlerhaften q-gramme an. Der Fensterabstand o hängt von der Farbe der jeweiligen Kurve ab, die genauen Werte sind in der Legende gezeigt. Auf der x-achse wurde jeweils die Überlappungsbereite υ variiert. Die Fensterlänge w ist gleich o + υ.
Neue DNA Sequenzierungstechnologien im Überblick
Neue DNA Sequenzierungstechnologien im Überblick Dr. Bernd Timmermann Next Generation Sequencing Core Facility Max Planck Institute for Molecular Genetics Berlin, Germany Max-Planck-Gesellschaft 80 Institute
MehrAquaZIS. Zeitreihenkorrektur
AquaZIS Zeitreihenkorrektur Aachen, Juli 2013 aqua_plan Ingenieurgesellschaft für Problemlösungen in Hydrologie und Umweltschutz mbh Amyastr. 126, 52066 Aachen Tel.: 0241 40070-0, Fax: 0241 40070-99 Geschäftsführer:
MehrSequenziertechnologien
Sequenziertechnologien Folien teilweise von G. Thallinger übernommen 11 Entwicklung der Sequenziertechnologie First Generation 1977 Sanger Sequenzierung (GOLD Standard) Second Generation 2005 454 Sequencing
MehrDie Suche nach Genen in Bakteriengenomen. BWInf-Workshop 22.-23. März 2011. Prof. Dr. Sven Rahmann AG Bioinformatik Informatik XI, TU Dortmund
Die Suche nach Genen in Bakteriengenomen BWInf-Workshop 22.-23. März 2011 Prof. Dr. Sven Rahmann AG Bioinformatik Informatik XI, TU Dortmund 1 Bioinformatik was ist das? Aufgabe: Analyse (molekular)biologischer
MehrGenomsequenzierung für Anfänger
Genomsequenzierung für Anfänger Philipp Pagel 8. November 2005 1 DNA Sequenzierung Heute wird DNA üblicherweise mit der sogenannten Sanger (oder chain-terminationoder Didesoxy-) Methode sequenziert dessen
MehrGenetik - The Human Genome Project. Überblick über die Genetik. Die gesamte Erbinformation eines Menschen befindet sich in jedem Zellkern
Genetik - The Human Genome Project Überblick über die Genetik Die gesamte Erbinformation eines Menschen befindet sich in jedem Zellkern seines Körpers. 1 2 Im Organismus müsssen nun ständig Enzyme u. a.
MehrUmsetzung von DEA in Excel
Umsetzung von DEA in Excel Thorsten Poddig Armin Varmaz 30. November 2005 1 Vorbemerkungen In diesem Dokument, das als Begleitmaterial zum in der Zeitschrift,,Controlling, Heft 10, 2005 veröffentlichten
MehrFoto: Kate Whitley, www.biotechnologie.de
Foto: Kate Whitley, www.biotechnologie.de Inhalt o Was kann die genomische ZWS nicht? o QTL: Erfahrungen aus genomweiten Studien o Begriffklärung [Re-]Sequenzierung o Hochdurchsatzsequenzierung technische
MehrKlausur zum Modul Molekularbiologie ILS, SS 2010 Freitag 6. August 10:00 Uhr
Klausur zum Modul Molekularbiologie ILS, SS 2010 Freitag 6. August 10:00 Uhr Name: Matrikel-Nr.: Code Nummer: Bitte geben Sie Ihre Matrikel-Nr. und Ihren Namen an. Die Code-Nummer erhalten Sie zu Beginn
Mehrsyntax.tex Eine Übersicht
syntax.tex Eine Übersicht Bernd Worsch 7. Juli 1997 Inhaltsverzeichnis 1 Einleitung 1 2 Bevor es funktioniert... 1 3 Grundelemente von syntax.tex 1 4 Strukturelemente von syntax.tex 3 5 Setzen von Syntaxdiagrammen
Mehretutor Benutzerhandbuch XQuery Benutzerhandbuch Georg Nitsche
etutor Benutzerhandbuch Benutzerhandbuch XQuery Georg Nitsche Version 1.0 Stand März 2006 Versionsverlauf: Version Autor Datum Änderungen 1.0 gn 06.03.2006 Fertigstellung der ersten Version Inhaltsverzeichnis:
MehrProgrammierung eines Besucherzählers mit Flash
Die Idee...2 Die Entwicklung...2 Die Funktionen...2 Die Website...3 Die Registrierung...3 Counter einrichten...4 Der Besucherzähler...5 Wie der Benutzer ihn einbindet...5 Was dabei wirklich passiert...5
MehrEntwicklung eines Scheduling-Verfahrens zur Optimierung der Reihenfolge von Prototypentests. Masterarbeit
Entwicklung eines Scheduling-Verfahrens zur Optimierung der Reihenfolge von Prototypentests Masterarbeit zur Erlangung des akademischen Grades Master of Science (M.Sc.) im Masterstudiengang Wirtschaftswissenschaft
MehrWas ist ein genetischer Fingerabdruck?
Was ist ein genetischer Fingerabdruck? Genetischer Fingerabdruck od. DNA-Fingerprint ist ein molekularbiologisches Verfahren zur individuellen Identifizierung von Lebewesen Der genetische Fingerabdruck
MehrGrundideen der Gentechnik
Grundideen der Gentechnik Die Gentechnik kombiniert Biotechnik und Züchtung. Wie in der Züchtung wird die Erbinformation eines Lebewesen verändert. Dabei nutzte man in den Anfängen der Gentechnik vor allem
MehrExcel 2013. Fortgeschrittene Techniken. Peter Wies. 1. Ausgabe, März 2013 EX2013F
Excel 2013 Peter Wies 1. Ausgabe, März 2013 Fortgeschrittene Techniken EX2013F 15 Excel 2013 - Fortgeschrittene Techniken 15 Spezielle Diagrammbearbeitung In diesem Kapitel erfahren Sie wie Sie die Wert-
MehrOtto-von-Guericke-Universität Magdeburg. Fakultät für Informatik. Masterarbeit
Otto-von-Guericke-Universität Magdeburg Fakultät für Informatik D B S E Databases and Software Engineering Masterarbeit Untersuchung von Datenbankschemata für die Speicherung und Auswertung von alignierten
MehrPageRank-Algorithmus
Proseminar Algorithms and Data Structures Gliederung Gliederung 1 Einführung 2 PageRank 3 Eziente Berechnung 4 Zusammenfassung Motivation Motivation Wir wollen eine Suchmaschine bauen, die das Web durchsucht.
MehrHinweise zum Schreiben einer Ausarbeitung
Seite 1 Hinweise zum Schreiben einer (Physikalisches Praktikum für Physiker) Autor: M. Saß Fakultät für Physik Technische Universität München 24.11.14 Inhaltsverzeichnis 1 Struktur einer 2 1.1 Die Einleitung..............................
MehrAlignment-Verfahren zum Vergleich biologischer Sequenzen
zum Vergleich biologischer Sequenzen Hans-Joachim Böckenhauer Dennis Komm Volkshochschule Zürich. April Ein biologisches Problem Fragestellung Finde eine Methode zum Vergleich von DNA-Molekülen oder Proteinen
MehrApproximationsalgorithmen
Ausarbeitung zum Thema Approximationsalgorithmen im Rahmen des Fachseminars 24. Juli 2009 Robert Bahmann robert.bahmann@gmail.com FH Wiesbaden Erstellt von: Robert Bahmann Zuletzt berarbeitet von: Robert
MehrEinblicke in das menschliche Erbgut (Genom) am Computer
Einblicke in das menschliche Erbgut (Genom) am Computer Prof. Dr. Antje Krause FH Bingen 06721 / 409 253 akrause@fh-bingen.de Binger Nacht der Wissenschaft - 16.04.2010 Das menschliche Genom ist entschlüsselt
MehrPerzentile mit Hadoop ermitteln
Perzentile mit Hadoop ermitteln Ausgangspunkt Ziel dieses Projektes war, einen Hadoop Job zu entwickeln, der mit Hilfe gegebener Parameter Simulationen durchführt und aus den Ergebnissen die Perzentile
Mehr12 Den Inhalt eines Ordners im fileadmin zum download anbieten (Filelist-Element)
12 Den Inhalt eines Ordners im fileadmin zum download anbieten (Filelist-Element) Inhaltsverzeichnis 12 Den Inhalt eines Ordners im fileadmin zum download anbieten (Filelist-Element) 1 12.1 Vorbereitungen......................................
MehrDATENQUALITÄT IN GENOMDATENBANKEN
DATENQUALITÄT IN GENOMDATENBANKEN Alexander Fehr 28. Januar 2004 Gliederung Motivation Biologische Grundkonzepte Genomdaten Datenproduktion und Fehler Data Cleansing 2 Motivation (1) Genomdatenbanken enthalten
MehrZeichnen von Graphen. graph drawing
Zeichnen von Graphen graph drawing WS 2006 / 2007 Gruppe: D_rot_Ala0607 Christian Becker 11042315 Eugen Plischke 11042351 Vadim Filippov 11042026 Gegeben sei ein Graph G = (V; E) Problemstellung V E =
MehrA1.7: Entropie natürlicher Texte
A1.7: Entropie natürlicher Texte Anfang der 1950er Jahre hat Claude E. Shannon die Entropie H der englischen Sprache mit einem bit pro Zeichen abgeschätzt. Kurz darauf kam Karl Küpfmüller bei einer empirischen
MehrAlgorithmische Bioinformatik
Algorithmische Bioinformatik Biologische Daten als Strings Ulf Leser Wissensmanagement in der Bioinformatik Ziele für heute Wert von Reduktionismus: Genome als Strings Reinschmecken in Stringmatching Erster
MehrAufbau von Hichert-Graphik Schritt für Schritt
Aufbau von Hichert-Graphik Schritt für Schritt Ausgangsdaten anlegen: o Sollte dann so aussehen: Umsatz Plan Ist Abweich. 60 40-20 o Details dazu: 4 Spaltenüberschriften eintragen: Plan, Ist, leer, Abweichung
MehrLabortechniken (2) Amplifikationskurve (linear linear) Realtime-PCR
Realtime PCR Quantitative PCR Prinzip: Nachweis der PCR-Produkte in Echtzeit und Quantifizierung anhand eines fluoreszenten Reporters R Q Taq-Polymerase Synthese- und Nuklease-Einheit R=Reporter, Q=Quencher
MehrVersuchsauswertung mit Polynom-Regression in Excel
Versuchsauswertung mit Polynom-Regression in Excel Aufgabenstellung: Gegeben sei die in Bild 1 gezeigte Excel-Tabelle mit Messwertepaaren y i und x i. Aufgrund bekannter physikalischer Zusammenhänge wird
MehrInhalt des Vortrags. o genetische Grundlagen. o Wie findet man Erbfehler? o Zusammenfassung. Was ist ein Haplotyp?
Inhalt des Vortrags o genetische Grundlagen Was ist ein Haplotyp? o Wie findet man Erbfehler? basierend auf Phänotypen: Zwergwuchs basierend auf Genotypen: Braunvieh Haplotyp II o Zusammenfassung einige
MehrGrundlagen und Basisalgorithmus
Grundlagen und Basisalgorithmus Proseminar -Genetische Programmierung- Dezember 2001 David König Quelle: Kinnebrock W.: Optimierung mit genetischen und selektiven Algorithmen. München, Wien: Oldenbourg
MehrBioinformatik. Zeichenketten und Stringalgorithmen. Ulf Leser Wissensmanagement in der. Bioinformatik
Bioinformatik Zeichenketten und Stringalgorithmen Ulf Leser Wissensmanagement in der Bioinformatik Inhalt dieser Vorlesung Warum Stringmatching? Strings und Matching Naiver Algorithmus Ulf Leser: Bioinformatik
MehrProjekt. Java-Anwendung für die Sequenzanalyse (Metagenomik und Transkriptomik)
Projekt Java-Anwendung für die Sequenzanalyse (Metagenomik und Transkriptomik) MHH Prof. Tümmler, Dr. Davenport FH Prof. Sprengel, Prof. Ahlers C. Davenport colindavengmail.com Version 27.09.2010 Spezifikation
MehrKompakte Graphmodelle handgezeichneter Bilder. Einbeziehung in Autentizierung und Bilderkennung
Kompakte Graphmodelle handgezeichneter Bilder Einbeziehung in Autentizierung und Bilderkennung Inhaltsverzeichnis 1 Einleitung Das graphische Model.1 Image Thinning................................. 3.
MehrEinführung in QtiPlot
HUWagner und Julia Bek Einführung in QtiPlot 1/11 Einführung in QtiPlot Mit Bezug auf das Liebig-Lab Praktikum an der Ludwig-Maximilians-Universität München Bei Fragen und Fehlern: jubech@cup.lmu.de Inhaltsverzeichnis
MehrDeutsches Krebsforschungszentrum in der Helmholtz-Gemeinschaft. Ausgabe 2/2011. Hightech gegen Krebs
Deutsches Krebsforschungszentrum in der Helmholtz-Gemeinschaft Ausgabe 2/2011 Hightech gegen Krebs Wie entsteht Krebs? Forscher arbeiten weltweit zusammen, um Proben von den häufigsten Tumoren zu nehmen
MehrAutor: Tobias Riedner
Bewertung des Funktionsumfangs für die semantischen Layer des HICHERT IBCS-zertifizierten Software-Produkts SAP BusinessObjects Design Studio mit graphomate charts Autor: Tobias Riedner Im Folgenden wird
MehrDas Prinzip der DNA-Sequenzierung Best.- Nr. 201.3055
Das Prinzip der DNA-Sequenzierung Best.- Nr. 201.3055 Allgemeine Informationen Prinzip der DNA-Sequenzierung Ziel dieses Versuchs ist einen genauen Überblick über die Verfahrensweise der DNA- Sequenzierung
MehrBegleittext zum Foliensatz Erbgänge beim Menschen
Für ein besseres Verständnis der Folien werden vorab einige Begriffe definiert: Gen Genom Allel Ein Gen ist die physikalische und funktionelle Einheit der Vererbung. Biochemisch ist es eine geordnete Abfolge
MehrReaktive Sicherheit. II. Passwörter. Dr. Michael Meier. technische universität dortmund
Reaktive Sicherheit II. Passwörter Dr. Michael Meier technische universität dortmund Fakultät für Informatik Lehrstuhl VI, Informationssysteme und Sicherheit 20. Oktober 2009 Grundlegendes Grundlegendes
MehrAutoSPARQL. Let Users Query Your Knowledge Base
AutoSPARQL Let Users Query Your Knowledge Base Christian Olczak Seminar aus maschinellem Lernen WS 11/12 Fachgebiet Knowledge Engineering Dr. Heiko Paulheim / Frederik Janssen 07.02.2012 Fachbereich Informatik
MehrBestandsabgleich mit einem Onlineshop einrichten
Bestandsabgleich mit einem Onlineshop einrichten Mit unserem Tool rlonlineshopabgleich können die Warenbestände zwischen unserem Programm raum level und einem Onlineshop abgeglichen werden. Einleitend
MehrAlgorithms for Regression and Classification
Fakultät für Informatik Effiziente Algorithmen und Komplexitätstheorie Algorithms for Regression and Classification Robust Regression and Genetic Association Studies Robin Nunkesser Fakultät für Informatik
MehrNeuerungen Oktober 2011
Neuerungen Oktober 2011 Ergänzungen oder Änderungen Tippfehlerkorrekturen oder kleine Beispielkorrekturen werden hier nicht erwähnt. 1. Format AUT Autoritätsdatensätze Sonderzeichen S. 5: _ = Leerschlag
MehrPersonalisierte Medizin
Personalisierte Medizin Einblicke in das menschliche Genom aus Sicht der Bioinformatik Prof. Dr. Antje Krause FH Bingen a.krause@fh-bingen.de Kurzer Ausflug in die Genetik DNA (Desoxyribonukleinsäure)
MehrTag 9: Datenstrukturen
Tag 9: Datenstrukturen A) Datenstrukturen B) Cell Arrays C) Anwendungsbeispiel: Stimulation in einem psychophysikalischen Experiment A) Datenstrukturen Wenn man komplizierte Datenmengen verwalten möchte,
MehrASSEMBLY ALGORITHMS FOR NEXT-GENERATION SEQUENCING DATA
ASSEMBLY ALGORITHMS FOR NEXT-GENERATION SEQUENCING DATA Jason R. Miller*, Sergey Koren, Granger Sutton Ein Vortrag von Sergej Tschernyschkow Friedrich-Schiller-Universität Jena 03. Mai 2010 SERGEJ TSCHERNYSCHKOW
MehrFaktorisierung ganzer Zahlen mittels Pollards ρ-methode (1975)
Dass das Problem, die Primzahlen von den zusammengesetzten zu unterscheiden und letztere in ihre Primfaktoren zu zerlegen zu den wichtigsten und nützlichsten der ganzen Arithmetik gehört und den Fleiss
MehrInstallationsanleitung des luftgestützten Überwachungssystems
Telematik-Projekt Installationsanleitung des luftgestützten Überwachungssystems des Studienganges Telematik (Master TM12) an der Technischen Hochschule Wildau [FH] von Nora Duch, Christopher Guhl, Christoph
MehrArbeiten mit Excel. 1. Allgemeine Hinweise
1. Allgemeine Hinweise Man sollte eine Excel Tabelle immer so übersichtlich wie möglich halten. Dazu empfiehlt es sich, alle benötigten Daten, Konstanten und Messwerte inklusive aller dazugehörigen Einheiten
MehrGeschäftsführer Bauingenieurwesen
Geschäftsführer Bauingenieurwesen An: Betreff: Anlagen: bi-stud@rhrk.uni-kl.de Information zum Modul "Höhere Mathematik - Differentialgleichungen" (für Studierende 3. Semester Bachelor Bauingenieurwesen)
Mehr8 Bilder in TYPO3 (RichTextEditor & Elemente Text mit Bild, Bilder
8 Bilder in TYPO3 (RichTextEditor & Elemente Text mit Bild, Bilder Inhaltsverzeichnis 8 Bilder in TYPO3 (RichTextEditor & Elemente Text mit Bild, Bilder 1 8.1 Vorbemerkung.......................................
MehrAUF LETZTER SEITE DIESER ANLEITUNG!!!
BELEG DATENABGLEICH: Der Beleg-Datenabgleich wird innerhalb des geöffneten Steuerfalls über ELSTER-Belegdaten abgleichen gestartet. Es werden Ihnen alle verfügbaren Belege zum Steuerfall im ersten Bildschirm
MehrHow-To : Nachtragen von Tagesdiagrammen auf der Solarlog Homepage
How-To : Nachtragen von Tagesdiagrammen auf der Solarlog Homepage Von Zeit zu Zeit erweitern neue Funktionen die Ausstattungsmerkmale des SolarLog. Wenn ein neues Firmewareupdate heraus kommt, werden plötzlich
MehrRekonstruktion biologischer Netzwerke (mit probabilistischen Methoden) Einführung 11.10.2010
Rekonstruktion biologischer Netzwerke (mit probabilistischen Methoden) Einführung 11.10.2010 Prof. Dr. Sven Rahmann 1 Team Prof. Dr. Sven Rahmann Zeit Mo 10-12; Do 8:30-10 Ort OH14, R104 Alle Informationen
MehrKompakte Graphmodelle handgezeichneter Bilder
Kompakte Graphmodelle handgezeichneter Bilder Einbeziehung in Authentizierung und Bilderkennung Inhaltsverzeichnis Seminar Mustererkennung WS 006/07 Autor: Stefan Lohs 1 Einleitung 1 Das graphische Modell.1
MehrBedienungsanleitung Einsatzplanung. Bedienungsanleitung Einsatzplanung. Inhalt. Bedienung einer Plan-Tabelle
Bedienungsanleitung Einsatzplanung Dieses Programm ist lizenzfrei verwendbar und gratis. Das Programm ist mit Excel 2010 erstellt worden und enthält VBA Programmierungen, also Typ.xlm, deshalb werden Sie
MehrMusterlösung zur Vorlesung Modellbasierte Softwareentwicklung Wintersemester 2014/2015 Übungsblatt 9
Prof. Dr. Wilhelm Schäfer Paderborn, 15. Dezember 2014 Christian Brenner Tristan Wittgen Musterlösung zur Vorlesung Modellbasierte Softwareentwicklung Wintersemester 2014/2015 Übungsblatt 9 Aufgabe 1 Codegenerierung
MehrProgrammieren. Wie entsteht ein Programm
Wie entsteht ein Programm 1/9 1. Schritt: Programmentwurf Der wichtigste Teil beim Erstellen eines Programms ist der Programmentwurf. Dabei wird das vorgegebene Problem analysiert, es wird ermittelt, welche
MehrSoftware-Test: Funktionstest
Software-Test: Funktionstest Andreas Zeller Lehrstuhl für Softwaretechnik Universität des Saarlandes, Saarbrücken 2006-02-06 Funktionale Testverfahren Funktionale Testverfahren testen gegen die Spezifikation
Mehr(zusätzliche Option «Wochenbeginn»: siehe Abbildung) zeigt die vergangenen Stunden des gewählten Datums seit 0:00 an
5.6.2 Zeit- und Datumsfunktionen Mit Zahlenformaten können Sie bestimmen, was Excel von einem Datum anzeigen soll. Beispiel: 15.10.12 15:30 mit dem Zahlenformat JAHR formatiert, zeigt von diesem Beispiel
MehrWintersemester 2008/2009
Fakultät für Informatik LS VI Information Engineering Prof. Dr. G. Kern-Isberner Patrick Krümpelmann, Jan-Hendrik Lochner, Max Vorderstemann Probeklausur zur Vorlesung Darstellung, Verarbeitung und Erwerb
MehrExcel Diagramme. Dateneingabe zur späteren Verarbeitung als Diagramm
Excel Diagramme Dateneingabe zur späteren Verarbeitung als Diagramm Gib zunächst in Excel einige Zahlen ein, die du später in einem Diagramm darstellen möchtest. In diesem Beispiel verwende ich die Umsatzzahlen
MehrMicrosoft Excel 2013. Herausgeber BerCom Training GmbH Stationsstrasse 26 8713 Uerikon. Kontakte: 079 633 65 75 www.computer-training.
Herausgeber BerCom Training GmbH Stationsstrasse 26 8713 Uerikon Kontakte: 079 633 65 75 Autoren: Gabriela Bergantini 1. Auflage von Dezember 2014 by BerCom Training GmbH Microsoft Excel 2013 Komplexe
MehrM. Graefenhan 2000-12-07. Übungen zu C. Blatt 3. Musterlösung
M. Graefenhan 2000-12-07 Aufgabe Lösungsweg Übungen zu C Blatt 3 Musterlösung Schreiben Sie ein Programm, das die Häufigkeit von Zeichen in einem eingelesenen String feststellt. Benutzen Sie dazu ein zweidimensionales
MehrVgl. Kapitel 5 aus Systematisches Requirements Engineering, Christoph Ebert https://www.sws.bfh.ch/studium/cas/swe-fs13/protected/re/re_buch.
Vgl. Kapitel 5 aus Systematisches Requirements Engineering, Christoph Ebert https://www.sws.bfh.ch/studium/cas/swe-fs13/protected/re/re_buch.pdf 2 Nach derbefragung aller Stakeholder und der Dokumentation
MehrWas sagen mir meine Gene? Individuelle Gendiagnostik Pro und Contra
Was sagen mir meine Gene? Individuelle Gendiagnostik Pro und Contra Theo Dingermann und Ilse Zündorf, Frankfurt/Main Wie sehr wir im Gen-Zeitalter angekommen sind, haben wahrscheinlich viele noch gar nicht
MehrNon-Invasive Prenatal Testing (NIPT)
Non-Invasive Prenatal Testing (NIPT) Methode & klinische Anwendung Information für Fachkreise Qualität aus Deutschland Non-Invasive Prenatal Testing (NIPT) Die Untersuchungsmethode des PraenaTest basiert
MehrPraktikum Information Retrieval Wochen 12: Suchmaschine
Praktikum Information Retrieval Wochen 12: Suchmaschine Melikka Khosh-Niat Matthias Jordan 23. Mai 3. Juni 2011 Lösungen: Upload bis 3. Juni 2011 Aktuelle Informationen, Ansprechpartner, Material und Upload
MehrSeminar Komplexe Objekte in Datenbanken
Seminar Komplexe Objekte in Datenbanken OPTICS: Ordering Points To Identify the Clustering Structure Lehrstuhl für Informatik IX - Univ.-Prof. Dr. Thomas Seidl, RWTH-Aachen http://www-i9.informatik.rwth-aachen.de
MehrExcel-Anleitung zur Übung 1. Formeln in Excel (Auszug aus der MS Excel Hilfe)
Excel-Anleitung zur Übung 1 Diese Unterlage bezieht sich auf Excel 2003 (auf Deutsch), die Version, die auch im PC-Labor des WWZ zur Verfügung steht. Die Benutzeroberfläche kann in anderen Versionen der
MehrAntwortzeitverhalten von Online Storage Services im Vergleich
EPOD Encrypted Private Online Disc Antwortzeitverhalten von Online Storage Services im Vergleich Fördergeber Förderprogramm Fördernehmer Projektleitung Projekt Metadaten Internet Foundation Austria netidee
MehrGüte von Tests. die Wahrscheinlichkeit für den Fehler 2. Art bei der Testentscheidung, nämlich. falsch ist. Darauf haben wir bereits im Kapitel über
Güte von s Grundlegendes zum Konzept der Güte Ableitung der Gütefunktion des Gauss im Einstichprobenproblem Grafische Darstellung der Gütefunktionen des Gauss im Einstichprobenproblem Ableitung der Gütefunktion
MehrProgrammiertechnik II
Analyse von Algorithmen Algorithmenentwurf Algorithmen sind oft Teil einer größeren Anwendung operieren auf Daten der Anwendung, sollen aber unabhängig von konkreten Typen sein Darstellung der Algorithmen
MehrInhaltsverzeichnis ! 1! Technische Daten 1.1 Einführung... 2 1.2 Systemvoraussetzungen... 2 1.3 Installation... 2 1.4 Zugangsdaten...
Inhaltsverzeichnis Technische Daten 1.1 Einführung... 2 1.2 Systemvoraussetzungen... 2 1.3 Installation... 2 1.4 Zugangsdaten... 2 Bedienungshinweise 2.1 Einführung... 3 2.2 Hauptbildschirm... 3 2.3 Einstellungen...
Mehrdpa-infocom - Datenlieferung
dpa-infocom - Datenlieferung Copyright 2006 von dpa-infocom GmbH Status des Dokuments: FINAL Inhaltsverzeichnis Inhaltsverzeichnis...1 1. Verzeichnisstrukturen...2 2. Nachrichtenmanagement...2 3. Datenübertragung...3
MehrSANDBOXIE konfigurieren
SANDBOXIE konfigurieren für Webbrowser und E-Mail-Programme Dies ist eine kurze Anleitung für die grundlegenden folgender Programme: Webbrowser: Internet Explorer, Mozilla Firefox und Opera E-Mail-Programme:
MehrTutoren Jan Ebbe Pat Mächler Valentino Rugolo Sascha Scherrer. Grundlagen der Programmierung (CS101) - Blatt 8 Theorie [4 Punkte] - Praxis [12 Punkte]
UNIVERSITÄT BASEL Dozent Prof. Dr. Thomas Vetter Departement Informatik Bernoullistrasse 16 CH 4056 Basel Assistenten Bernhard Egger Andreas Forster Tutoren Jan Ebbe Pat Mächler Valentino Rugolo Sascha
MehrProjektgruppe 558. Eclipse4Bio Endbericht. März 2012. Youssef Zaki. Veranstalter: Anna-Lena Lamprecht Stefan Naujokat
Projektgruppe 558 Eclipse4Bio Endbericht März 2012 Baris Ayaz Christopher Schröder Lidiya Kaltchev Manuel Allhoff Mehmet Ali Yaman Youssef Zaki Benjamin Nagel Dawid Kopetzki Lukas Lerche Martin Kozianka
MehrEvolution & Genetik (Beispiel Hämoglobin) Prof. Dr. Antje Krause FH Bingen 06721 / 409 253 akrause@fh-bingen.de
Evolution & Genetik (Beispiel Hämoglobin) Prof. Dr. Antje Krause FH Bingen 06721 / 409 253 akrause@fh-bingen.de DNA (Desoxyribonukleinsäure) 5 3 CGATGTACATCG GCTACATGTAGC 3 5 Doppelhelix Basen: Adenin,
MehrÜ bergabe der lexoffice-daten an einen Steuerberater oder ein Buchhaltungsbu ro
Ü bergabe der lexoffice-daten an einen Steuerberater oder ein Buchhaltungsbu ro Dieses Dokument erklärt Ihnen, wie lexoffice-daten in ein Buchführungsprogramm importiert werden können. Geben Sie die Anleitung
MehrIn diesem Kurs lernen Sie, wie in EXCEL Diagramme erzeugt werden und was Sie dabei beachten sollten.
OSZ Wirtschaft und Sozialversicherung Berlin Fach: Rechnungswesen/Datenverarbeitung /Wn EXCEL-Kurs ABSCHREIBUNGEN Lektion: Erstellen von Diagrammen Ziele dieses Kurses: In diesem Kurs lernen Sie, wie in
MehrStudie über Umfassendes Qualitätsmanagement ( TQM ) und Verbindung zum EFQM Excellence Modell
Studie über Umfassendes Qualitätsmanagement ( TQM ) und Verbindung zum EFQM Excellence Modell (Auszug) Im Rahmen des EU-Projekts AnaFact wurde diese Umfrage von Frauenhofer IAO im Frühjahr 1999 ausgewählten
MehrProjektgruppe 2011/2012. Exposé. Zur Anwendung PlagTag. Version 2.0. Betreuer: Prof. Dr. Andreas Winter M.Sc. Jan Jelschen.
Fakultät II: Department für Informatik Projektgruppe 2011/2012 Exposé Zur Anwendung PlagTag Version 2.0 Betreuer: Prof. Dr. Andreas Winter M.Sc. Jan Jelschen Tore Bierwirth Christoph Gerken Marion Gottschalk
MehrErstellung von Bibliotheken in CoDeSys V3
Dokument Version 2.0 3S - Smart Software Solutions GmbH Seite 1 von 10 INHALT 1 EINFÜHRUNG 3 2 BIBLIOTHEKSKONZEPT IM DETAIL 4 2.1 Kategorien von Bibliotheken 4 2.1.1 System 4 2.1.2 Internal 4 2.1.3 Application
MehrRasterkraftmikroskopie
Technische Universität München Physik Department Fortgeschrittenenpraktikum Versuch 42 Rasterkraftmikroskopie vorgelegt am: 20. August 2011 Namen: Dincer Bekmezci, Daniel Biedermann, Patrick Christ Matrikelnummern:
Mehr4 ALTE THEMEN IN NEUEM GEWAND
Umstieg auf MS Office 2010 4 ALTE THEMEN IN NEUEM GEWAND Viele Arbeiten sind den Anwendern und Anwenderinnen seit langem bekannt, aber die Umsetzung in der Excel 2010-Version birgt vielleicht doch die
MehrAnleitung zur Erstellung von Diagrammen in Excel
Anleitung zur Erstellung von Diagrammen in Excel In den verschiedenen Praktika an der FH Aschaffenburg werden Sie in den unterschiedlichsten Versuchen mit teilweise recht großen Datenmengen konfrontiert,
MehrWillkommen zur Vorlesung Statistik
Willkommen zur Vorlesung Statistik Thema dieser Vorlesung: Varianzanalyse Prof. Dr. Wolfgang Ludwig-Mayerhofer Universität Siegen Philosophische Fakultät, Seminar für Sozialwissenschaften Prof. Dr. Wolfgang
MehrEin wissenschaftliches und kulturelles Pionierprojekt unter dem Ehrenschutz von Margit Fischer. www.genomaustria.at
Ein wissenschaftliches und kulturelles Pionierprojekt unter dem Ehrenschutz von Margit Fischer www.genomaustria.at Warum sind wir heute hier? Wir sind heute hier, um über das Thema Erbgut Sequenzierung
MehrErstellen einer Reklamation
Erstellen einer Reklamation Anleitung zum Online-Reklamationsformular Höchstes ergobag-ziel ist es, einwandfreie Produkte zu liefern, mit denen unsere Kunden rundum zufrieden sind. Falls dies einmal nicht
MehrNCDiff Testmanagement leicht gemacht
Testmanagement leicht gemacht Nagler & Company Thomas Gebhard & Anton Garra Complexity Die stetige Anpassung an neue Anforderungen der IT und das Bestreben Marktgegebenheiten zu folgen oder voraus zu sein,
MehrPrimzahlzertifikat von Pratt
Primzahlzertifikat von Pratt Daniela Steidl TU München 17. 04. 2008 Primzahltests in der Informatik "Dass das Problem, die Primzahlen von den Zusammengesetzten zu unterscheiden und letztere in ihre Primfaktoren
Mehr1 Einleitung. 1.1 Motivation und Zielsetzung der Untersuchung
1 Einleitung 1.1 Motivation und Zielsetzung der Untersuchung Obgleich Tourenplanungsprobleme zu den am häufigsten untersuchten Problemstellungen des Operations Research zählen, konzentriert sich der Großteil
Mehr2.12 Potenzreihen. 1. Definitionen. 2. Berechnung 2.12. POTENZREIHEN 207. Der wichtigste Spezialfall von Funktionenreihen sind Potenzreihen.
2.2. POTENZREIHEN 207 2.2 Potenzreihen. Definitionen Der wichtigste Spezialfall von Funktionenreihen sind Potenzreihen. Eine Potenzreihe mit Entwicklungspunkt x 0 ist eine Reihe a n x x 0 n. Es gilt: es
Mehr6 Simultane Signal- und Energieübertragung
88 6 Simultane Signal- und Energieübertragung 6 Simultane Signal- und Energieübertragung In diesem Kapitel wird der Einbau der optischen Übertragungsstrecke in eine Sehprothese, sowie die hiermit erzielten
Mehr