MBI: Sequenzvergleich ohne Alignment

Größe: px
Ab Seite anzeigen:

Download "MBI: Sequenzvergleich ohne Alignment"

Transkript

1 MBI: Sequenzvergleich ohne Alignment Bernhard Haubold 12. November 2013

2 Wiederholung Exaktes & inexaktes Matching Das exakte Matching Problem Naive Lösung Präprozessierung Muster(Pattern): Z-Algorithmus, Keyword Tree Text: Suffix Baum, Suffix Array, Borrows-Wheeler Transformation

3 Nachlese zur Übung Unix-Kenntnisse: ws/info-a/wiki/Vorlesung, Kapitel Shells Aufgaben 2.8 und 2.9

4 Übersicht: Sequenzvergleich ohne Alignment Nochmal: Was ist ein Alignment? Vor- & Nachteile von Alignments Sequenzverlgeich ohne Alignment Wörter zählen Matchlängen bestimmen

5 Wozu Alignment? Häufige Anwendungen: Annotation (änhliche Sequenzen haben ähnliche Funktion) Rekonstruktion von Stammbäumen

6 Vom Alignment zu Distanzen Alignment S1 CGCAATGTGTCACTCGGCACTGGGTGGGATTTGGGGCAAGCTTGGAGACTGGCCGCAACG 60 S2...g..t...a..aa.c...a...c...c...c.t S3...gt...a..a..cc...c...c...g...c.t S4...g...a..a..cc...c...c...g...c.t S1 TGCTTCCTTTGAAAAGATAGCTCCAGCCCTAGCACAGTAT 100 S2...a...cc...t...g S3...a...cc...a S4...a...cc Distanzen S1 S2 S3 S4 S S S S

7 Bäume Bauen Distanzen S1 S2 S3 S4 S S S S Parsimonie S Distanzen S Likelihbood S3 S2 S1 S S3 S3 S2 S2 S1 S1

8 Phylogenie-Berechnung Phylogenie Mit Alignment Ohne Alignment Distance MP ML Partitionieren Distanzen Gene Residuen Worfrequenzen Matchlängen Exact Inexact LZ-factoren Gemeinsame Substrings dktup dffp dcv dco dgram dacs dkr

9 Noch einmal: Was ist ein Alignment? Betrachte AACGT und AAGGT Ziel beim Alignment: Schreibe homologe Merkmale übereinander. AACGT AAGGT Fasst zwei Stammbäume zusammen: AACGT AAGGT C G G C AACGT AAGGT AACGT AAGGT

10 Ohne Alignment Arbeite ohne evolutionäre Hypothese für einzelne Nukleotide. Alternativen Zusammensetzung der Sequenzen: ähnliche Zusammensetzung = ähnliche Sequenzen Matchlängen: Lange Matches = ähnliche Sequenzen

11 Zusammensetzung Beispiel: Zusammensetzung von da_adh.fasta dm_adh.fasta mggenome.fasta

12 Zusammensetzungs-Distanz cchar../data/dm_adh.fasta # Total number of input characters: 2365 # Char Count Fraction A C G T cchar../data/da_adh.fasta # Total number of input characters: 912 # Char Count Fraction A C G T cchar../data/mggenome.fasta # Total number of input characters: # Char Count Fraction a c g t bc ( )^2+( )^2+( )^2+( )^ ( )^2+( )^2+( )^2+( )^ ( )^2+( )^2+( )^2+( )^

13 Distanz-Baum Mycoplasma genitalium Drosophila adiastola Drosophila melanogaster

14 Verallgemeinerte Zusammensetzung: Wortfrequenzen q i : Frequenz des i-ten Worts in Sequenz Q q s : Frequenz des i-ten Worts in Sequenz S k: Wortlänge 4 k : Anzahl möglicher Wörter der Länge k d ktup (Q, S) = (q i s i ) 2, 4 k i=1

15 Beispiel Wortdistanz Mitochondriale Genome, k = 5 Alignment 0.01 P. Chimp C. Chimp Human Gorilla d ktup P. Chimp C. Chimp Human Gorilla 10 5 Orangutan Gibbon Baboon Orangutan Gibbon Baboon

16 Vor- und Nachteile von Wortdistanzen Vorteile Leicht zu verstehen Einfach zu berechnen Nachteile Welche Wortlänge? Verhältnis zu Mutationsdistanzen unklar

17 Genetischer Abstand mit Alignment AACGACGATCGC TACGATGATCGG π = 3/12

18 π Interpretieren π: Wahrscheinlichkeit einer Mutation/Nukleotid 1/π: Abstand zur nächsten Mutation π 1/avg(abstandZurNaechstenMutation) AACGACGATCGC TACGATGATCGG

19 Alignment notwendig? Mit Alignment: Abstand zur nächsten Mutation AACGACGATCGC TACGATGATCGG Ohne Alignment: SHortest Unique SubSTRINGs shustrings Query AACGACGATCGC Subject TACGATGATCGG

20 EINLEITUNG STAMMBÄUME WÖRTER ZÄHLEN MATCHLÄNGEN ÜBUNG Shustrings finden: Suffixbäume G A A C 1 ACCG 1 ACCG CCG 2 1 ACCG CG C G 1 ACCG CG C G G 4 Tatsächliche Implementation: Enhanced Suffix Array

21 Enhanced Suffix Array G A A C Rank SA Suffix LCP Length(LCP) 1 2 AAC AC A C GAAC - 0 SA: suffix array; LCP: longest common prefix

22 Suffix Array Suffix Baum G A A C Rank SA Suffix LCP Length(LCP) 1 2 AAC AC A C GAAC - 0 AAC A A C A C GAAC 2 AC C AC C 4 AC C

23 Alignment-freier Mutationsabstand Query AACGACGATCGC Subject TACGATGATCGG π m = π m = Q xi

24 Mehr Details X i : Shustring Länge an Position i Für Zufallssequenzen gilt: P(X i x) = (1 14 ) S x Für verwandte Sequenzen, die sich an d Positionen unterscheiden, gilt: Folglich P(X i > x) = ( 1 d ) x e xd/ S := e xπ. S P(X i x) = (1 e xπ ) (1 14 ) S x

25 Für multiple Treffer korrigieren Zahl der Mismatches Zahl der Mutationsereignisse Jukes-Cantor Korrektur: Software Demo d kr = 3 4 ln ( π ).

26 Jukes-Cantor Modell A C G T Mutationsrate zwischen allen Paaren von Nukleotiden ist µ/3 pro Zeiteinheit.

27 Jukes-Cantor Argument 1 Mutationsrate zwischen allen Paaren von Nukleotiden ist µ/3 pro Zeiteinheit. Wahrscheinlichkeit, dass an einer bestimmten Position eine Mutation stattgefunden hat: 4µ/3 Wahrscheinlichkeit in t Zeitabschnitten keine Mutation zu beobachten ( P 0 = 1 4 ) t 3 µ e 4/3µt Wahrscheinlichkeit, dass mindestens eine Mutation stattgefunden hat P = 1 e 4/3µt Wahrscheinlichkeit ein A zu beobachten, wo vorher ein C war P(A C) = 1 4 (1 e 4/3µt )

28 Jukes-Cantor Argument 2 Wahrscheinlichkeit ein A zu beobachten, wo vorher ein C war P(A C) = 1 4 (1 e 4/3µt ) Wahrscheinlichkeit, eine Mutation zu beobachten π = 3 4 (1 e 4/3µt ) Zahl der Mutationsereignisse (nicht beobachtbar) Jukes-Cantor Formel K := µt K = 3 4 ln ( π )

29 Beispiel K r Mitochondriale Genome Alignment d kr 0.01 P. Chimp C. Chimp Human Gorilla Orangutan Gibbon Baboon 0.01 P. Chimp C. Chimp Human Gorilla Gibbon Orangutan Baboon

30 Vorteil: Mutationsabstand Leicht zu berechnen Vor- und Nachteile d kr Query AACGACGATCGC Subject TACGATGATCGG Nachteil: Abhängige Daten Probleme bei lokalen Schwankungen in Mutationsrate Konservierung funktionaler Bereiche Rekombination Probleme bei kurzen Sequenzen bzw. wenigen Mutationen

31 Verbesserung von d kr Verwende nur Shustrings, die nicht überlappen: Supershustrings

32 Beispiel susi Mitochondriale Genome Alignment d kr 0.01 P. Chimp C. Chimp Human Gorilla Orangutan Gibbon Baboon 0.01 P. Chimp C. Chimp Human Gorilla Orangutan Gibbon Baboon

33 Heutige Übung Die Befehlszeile: TAB für Vervollständigung von Befehlen Pfaden CTR-a: Springe an Zeilenanfang CTR-e: Springe an Zeilenende ALT-f: Springe ein Wort vorwärts ALT-b: Springe ein Wort rückwärts Zusatzpaket Pfade

34 Literatur Haubold, B. (2014). Alignment-free phylogenetics and population genetics. Briefings in Bioinformatics, in press. Felsenstein, J. (2004). Inferring Phylogenies. Sinauer.

35 Zusammenfassung Nochmal: Was ist ein Alignment? Vor- & Nachteile von Alignments Sequenzverlgeich ohne Alignment Wörter zählen Matchlängen bestimmen

MOL.504 Analyse von DNA- und Proteinsequenzen

MOL.504 Analyse von DNA- und Proteinsequenzen MOL.504 Analyse von DNA- und Proteinsequenzen Kurs 1 Monika Oberer, Karl Gruber MOL.504 Modul-Übersicht Einführung, Datenbanken BLAST-Suche, Sequenzalignment Proteinstrukturen Virtuelles Klonieren Abschlusstest

Mehr

4. Kopplung. Konzepte: Gekoppelte Vererbung. Genkarten. Doppel-Crossover. Interferenz. Statistik

4. Kopplung. Konzepte: Gekoppelte Vererbung. Genkarten. Doppel-Crossover. Interferenz. Statistik 4. Kopplung Konzepte: Gekoppelte Vererbung Genkarten Doppel-Crossover Interferenz Statistik 1. Sie analysieren die Kopplungsverhältnisse von 3 Mutationen in Drosophila melanogaster (scute [sc; keine Thoraxborsten],

Mehr

Übungen zur Vorlesung Algorithmische Bioinformatik

Übungen zur Vorlesung Algorithmische Bioinformatik Übungen zur Vorlesung Algorithmische Bioinformatik Freie Universität Berlin, WS 2006/07 Utz J. Pape Johanna Ploog Hannes Luz Martin Vingron Blatt 6 Ausgabe am 27.11.2006 Abgabe am 4.12.2006 vor Beginn

Mehr

Informationsvisualisierung

Informationsvisualisierung Informationsvisualisierung Thema: 7. Visualisierung Biologischer Daten Dozent: Dr. Dirk Zeckzer [email protected] Sprechstunde: nach Vereinbarung Umfang: 2 Prüfungsfach: Modul Fortgeschrittene

Mehr

Bioinformatik. Lokale Alignierung Gapkosten. Silke Trißl / Ulf Leser Wissensmanagement in der. Bioinformatik

Bioinformatik. Lokale Alignierung Gapkosten. Silke Trißl / Ulf Leser Wissensmanagement in der. Bioinformatik Bioinformatik Lokale Alignierung Gapkosten Silke Trißl / Ulf Leser Wissensmanagement in der Bioinformatik Inhalt dieser Vorlesung Ähnlichkeit Lokales und globales Alignment Gapped Alignment Silke Trißl:

Mehr

Vorlesung Einführung in die Bioinformatik

Vorlesung Einführung in die Bioinformatik Vorlesung Einführung in die Bioinformatik Dr. Stephan Weise 04.04.2016 Einführung Gegeben: zwei Sequenzen Gesucht: Ähnlichkeit quantitativ erfassen Entsprechungen zwischen einzelnen Bausteinen beider Sequenzen

Mehr

Sequenz Alignment Teil 2

Sequenz Alignment Teil 2 Sequenz Alignment Teil 2 14.11.03 Vorlesung Bioinformatik 1 Molekulare Biotechnologie Dr. Rainer König Besonderen Dank an Mark van der Linden, Mechthilde Falkenhahn und der Husar Biocomputing Service Gruppe

Mehr

Darwins Erben - Phylogenie und Bäume

Darwins Erben - Phylogenie und Bäume Vorlesung Einführung in die Bioinforma4k SoSe2011 Darwins Erben - Phylogenie und Bäume Prof. Daniel Huson ZBIT Center for Bioinformatics Center for Bioinformatics Charles Darwin und Bäume Darwin's Notizbuch

Mehr

Optimale Produktliniengestaltung mit Genetischen Algorithmen

Optimale Produktliniengestaltung mit Genetischen Algorithmen Optimale Produktliniengestaltung mit Genetischen Algorithmen 1 Einleitung 2 Produktlinienoptimierung 3 Genetische Algorithmen 4 Anwendung 5 Fazit Seite 1 Optimale Produktliniengestaltung mit Genetischen

Mehr

2. Strahlensätze Die Strahlensatzfiguren

2. Strahlensätze Die Strahlensatzfiguren 2. Strahlensätze 2.1. Die Strahlensatzfiguren 1) Beispiel Die nebenstehende Figur zeigt eine zentrische Streckung mit Zentrum Z. Man kennt einige Streckenlängen. a) Wie gross ist der Streckungsfaktor k?

Mehr

Mathematik in der Evolutionsbiologie

Mathematik in der Evolutionsbiologie Mathematik in der Evolutionsbiologie Vom Konflikt zwischen Mendelianern und Biometrikern zur modernen Populationsgenetik Wolfgang Stephan Abt. Evolutionsbiologie LMU München Reaktionen auf Darwins Evolutionstheorie

Mehr

Bioinformatik. Zeichenketten und Stringalgorithmen. Ulf Leser Wissensmanagement in der. Bioinformatik

Bioinformatik. Zeichenketten und Stringalgorithmen. Ulf Leser Wissensmanagement in der. Bioinformatik Bioinformatik Zeichenketten und Stringalgorithmen Ulf Leser Wissensmanagement in der Bioinformatik Inhalt dieser Vorlesung Warum Stringmatching? Strings und Matching Naiver Algorithmus Ulf Leser: Bioinformatik

Mehr

Evolution II. Molekulare Variabilität. Bachelorkurs Evolutionsbiolgie II WS 2013/14

Evolution II. Molekulare Variabilität. Bachelorkurs Evolutionsbiolgie II WS 2013/14 Evolution II Molekulare Variabilität Bachelorkurs Evolutionsbiolgie II WS 2013/14 Molekulare Variabilität 1) rten der molekularen Variabilität und ihre Entstehung (rten der Mutation) 2) Wie kann man molekulare

Mehr

Algorithmische Bioinformatik

Algorithmische Bioinformatik Algorithmische Bioinformatik Suffixbäume Ulf Leser Wissensmanagement in der Bioinformatik Failure Links P={banane, nabe, abnahme, na, abgabe} banane banan 1 bana ban b ba ab abn abna abnah a n na abg 4

Mehr

Biowissenschaftlich recherchieren

Biowissenschaftlich recherchieren Biowissenschaftlich recherchieren Uber den Einsatz von Datenbanken und anderen Ressourcen der Bioinformatik Nicola Gaedeke Birkhauser Basel Boston Berlin Inhaltsverzeichnis Vorwort xi 1 Die Informationssucheim

Mehr

PR Statistische Genetik und Bioinformatik

PR Statistische Genetik und Bioinformatik PR Statistische Genetik und Bioinformatik Johanna Bertl Institut für Statistik und OR, Universität Wien Oskar-Morgenstern-Platz 1/6.344, 1090 Wien, Tel.: 01-4277-38617 [email protected], homepage.univie.ac.at/johanna.bertl

Mehr

Datenstrukturen & Algorithmen

Datenstrukturen & Algorithmen Datenstrukturen & Algorithmen Matthias Zwicker Universität Bern Frühling 2010 Übersicht Dynamische Programmierung Einführung Ablaufkoordination von Montagebändern Längste gemeinsame Teilsequenz Optimale

Mehr

Unabhängigkeit KAPITEL 4

Unabhängigkeit KAPITEL 4 KAPITEL 4 Unabhängigkeit 4.1. Unabhängigkeit von Ereignissen Wir stellen uns vor, dass zwei Personen jeweils eine Münze werfen. In vielen Fällen kann man annehmen, dass die eine Münze die andere nicht

Mehr

Aufgabenblock 3. Durch zählen erhält man P(A) = 10 / 36 P(B) = 3 / 36 P(C) = 18 / 36 und P(A B) = 3 /

Aufgabenblock 3. Durch zählen erhält man P(A) = 10 / 36 P(B) = 3 / 36 P(C) = 18 / 36 und P(A B) = 3 / Aufgabenblock 3 Aufgabe ) A sei das Ereignis: schwerer Verkehrsunfall B sei das Ereignis: Alkohol ist im Spiel Herr Walker betrachtet die Wahrscheinlichkeit P(B A) = 0.3 und errechnet daraus P(-B A) =

Mehr

MOL.504 Analyse von DNA- und Proteinsequenzen. Modul 2 BLAST-Sequenzsuche und Sequenzvergleiche

MOL.504 Analyse von DNA- und Proteinsequenzen. Modul 2 BLAST-Sequenzsuche und Sequenzvergleiche MOL.504 Analyse von DNA- und Proteinsequenzen Modul 2 BLAST-Sequenzsuche und Sequenzvergleiche Summary Modul 1 - Datenbanken Wo finde ich die DNA Sequenz meines Zielgens? Wie erhalte ich Info aus der DNA-Datenbank

Mehr

Homologie und Sequenzähnlichkeit. Prof. Dr. Antje Krause FH Bingen 06721 / 409 253 [email protected]

Homologie und Sequenzähnlichkeit. Prof. Dr. Antje Krause FH Bingen 06721 / 409 253 akrause@fh-bingen.de Homologie und Sequenzähnlichkeit Prof. Dr. Antje Krause FH Bingen 06721 / 409 253 [email protected] Homologie Verwandtschaft aufgrund gleicher Abstammung basiert auf Speziation (Artbildung): aus einer

Mehr

1/10. Ihre Namen: Gruppe: Evolutionsbiologie 2, WS2015/2016: Bioinformatik - Übung 1

1/10. Ihre Namen: Gruppe: Evolutionsbiologie 2, WS2015/2016: Bioinformatik - Übung 1 Ihre Namen: Gruppe: Evolutionsbiologie 2, WS2015/2016: Bioinformatik - Übung 1 Erstellen Sie bitte vor Beginn der Übung einen Ordner auf dem Desktop, in dem Sie alle benötigten Dateien speichern können

Mehr

Wo waren wir stehen geblieben? Evolutions modelle

Wo waren wir stehen geblieben? Evolutions modelle Wo waren wir stehen geblieben? Evolutions modelle 1 Stammbaumerstellung 1. Distanz-orientierte Methoden UPGMA (Unweighted Pair-Group Method with Arithmetric Means) Neighbor-joining Minimal Evolution =>

Mehr

Horizontaler Gentransfer. Referentin: Michaela Baune Seminar: Gentechnik in der Landwirtschaft

Horizontaler Gentransfer. Referentin: Michaela Baune Seminar: Gentechnik in der Landwirtschaft Horizontaler Gentransfer Referentin: Michaela Baune Seminar: Gentechnik in der Landwirtschaft 28.06.2016 2 Einleitung Abb. 1 3 Einleitung Befürchtung: Übertragung von Antibiotikaresistenzen von transgenen

Mehr

27 Funktionelle Genomanalysen Sachverzeichnis

27 Funktionelle Genomanalysen Sachverzeichnis Inhaltsverzeichnis 27 Funktionelle Genomanalysen... 543 27.1 Einleitung... 543 27.2 RNA-Interferenz: sirna/shrna-screens 543 Gunter Meister 27.3 Knock-out-Technologie: homologe Rekombination im Genom der

Mehr

Algorithmische Bioinformatik

Algorithmische Bioinformatik Algorithmische Bioinformatik Biologische Daten als Strings Ulf Leser Wissensmanagement in der Bioinformatik Ziele für heute Wert von Reduktionismus: Genome als Strings Reinschmecken in Stringmatching Erster

Mehr

BLAST. Datenbanksuche mit BLAST. Genomische Datenanalyse 10. Kapitel

BLAST. Datenbanksuche mit BLAST.  Genomische Datenanalyse 10. Kapitel Datenbanksuche mit BLAST BLAST Genomische Datenanalyse 10. Kapitel http://www.ncbi.nlm.nih.gov/blast/ Statistische Fragen Datenbanksuche Query Kann die globale Sequenzähnlichkeit eine Zufallsfluktuation

Mehr

Vorlesung 4 BETWEENNESS CENTRALITY

Vorlesung 4 BETWEENNESS CENTRALITY Vorlesung 4 BETWEENNESS CENTRALITY 101 Aufgabe! Szenario: Sie arbeiten bei einem sozialen Online-Netzwerk. Aus der Netzwerk-Struktur Ihrer Benutzer sollen Sie wichtige Eigenschaften extrahieren. [http://www.fahrschule-vatterodt.de/

Mehr

Bioinformatik. Suffixbäume auf Sekundärspeicher. Ulf Leser Wissensmanagement in der. Bioinformatik

Bioinformatik. Suffixbäume auf Sekundärspeicher. Ulf Leser Wissensmanagement in der. Bioinformatik Bioinformatik Suffixbäume auf Sekundärspeicher Ulf Leser Wissensmanagement in der Bioinformatik Ukkonen Überblick High-Level: Phasen und Extensionen Führt leider zu O(m 3 ) Verbesserungen Suffix-Links

Mehr

Fakultät für Informatik Übung zu Kognitive Systeme Sommersemester 2016

Fakultät für Informatik Übung zu Kognitive Systeme Sommersemester 2016 Fakultät für Informatik Übung zu Kognitive Systeme Sommersemester 1 M. Sperber ([email protected]) S. Nguyen ([email protected]) Übungsblatt 3 Maschinelles Lernen und Klassifikation Abgabe online

Mehr

VL Algorithmische BioInformatik (19710) WS2013/2014 Woche 3 - Montag

VL Algorithmische BioInformatik (19710) WS2013/2014 Woche 3 - Montag VL Algorithmische BioInformatik (19710) WS2013/2014 Woche 3 - Montag Tim Conrad AG Medical Bioinformatics Institut für Mathematik & Informatik, Freie Universität Berlin Vorlesungsthemen Part 1: Background

Mehr

ASSEMBLY ALGORITHMS FOR NEXT-GENERATION SEQUENCING DATA

ASSEMBLY ALGORITHMS FOR NEXT-GENERATION SEQUENCING DATA ASSEMBLY ALGORITHMS FOR NEXT-GENERATION SEQUENCING DATA Jason R. Miller*, Sergey Koren, Granger Sutton Ein Vortrag von Sergej Tschernyschkow Friedrich-Schiller-Universität Jena 03. Mai 2010 SERGEJ TSCHERNYSCHKOW

Mehr

Einführung in die Bioinformatik Algorithmen zur Sequenzanalyse

Einführung in die Bioinformatik Algorithmen zur Sequenzanalyse Einführung in die Bioinformatik Algorithmen zur Sequenzanalyse!! Vorläufige Fassung, nur einzelne Abschnitte!!!! Enthält wahrscheinlich noch viele Fehler!!!! Wird regelmäßig erweitert und verbessert!!

Mehr

Bio Data Management. Kapitel 5a Sequenzierung und Alignments

Bio Data Management. Kapitel 5a Sequenzierung und Alignments Bio Data Management Kapitel 5a Sequenzierung und Alignments Wintersemester 2014/15 Dr. Anika Groß Universität Leipzig, Institut für Informatik, Abteilung Datenbanken http://dbs.uni-leipzig.de Vorläufiges

Mehr

MOL.504 Analyse von DNA- und Proteinsequenzen. Übungsaufgaben BLAST-Sequenzsuche und -vergleiche

MOL.504 Analyse von DNA- und Proteinsequenzen. Übungsaufgaben BLAST-Sequenzsuche und -vergleiche MOL.504 Analyse von DNA- und Proteinsequenzen Übungsaufgaben BLAST-Sequenzsuche und -vergleiche Ü6a blastn und blastx Verwenden Sie die in Übung 3 (Datenbanken) gefundene yqjm-sequenz aus Bacillus subtilis

Mehr

Ihre Namen: Gruppe: Öffnen Sie die Fasta-Dateien nur mit einem Texteditor, z.b. Wordpad oder Notepad, nicht mit Microsoft Word oder Libre Office.

Ihre Namen: Gruppe: Öffnen Sie die Fasta-Dateien nur mit einem Texteditor, z.b. Wordpad oder Notepad, nicht mit Microsoft Word oder Libre Office. Ihre Namen: Gruppe: Evolutionsbiologie 2, WS2016/2017: Bioinformatik - Übung 1 Erstellen Sie vor Beginn der Übung einen Ordner auf dem Desktop, in dem Sie alle benötigten Dateien speichern kö nnen (z.b.

Mehr

Algorithmen für Routenplanung 11. Vorlesung, Sommersemester 2012 Daniel Delling 6. Juni 2012

Algorithmen für Routenplanung 11. Vorlesung, Sommersemester 2012 Daniel Delling 6. Juni 2012 Algorithmen für Routenplanung 11. Vorlesung, Sommersemester 2012 Daniel Delling 6. Juni 2012 MICROSOFT RESEARCH SILICON VALLEY KIT Universität des Landes Baden-Württemberg und nationales Großforschungszentrum

Mehr

Die Kopplung von Markovketten und die Irrfahrt auf dem Torus

Die Kopplung von Markovketten und die Irrfahrt auf dem Torus Die Kopplung von Markovketten und die Irrfahrt auf dem Torus Verena Monschang Vortrag 20.05.20 Dieser Seminarvortrag thematisiert in erster Linie die Kopplung von Markovketten. Zu deren besseren Verständnis

Mehr

Prüfungsvorbereitungskurs Höhere Mathematik 3

Prüfungsvorbereitungskurs Höhere Mathematik 3 Prüfungsvorbereitungskurs Höhere Mathematik 3 Wahrscheinlichkeitstheorie (Klausuraufgaben) Marcel Bliem Marco Boßle Jörg Hörner Mathematik Online Herbst 2010 Bliem/Boßle/Hörner (MO) PV-Kurs HM 3 1 / 7

Mehr

Blatt 10. Hamilton-Formalismus- Lösungsvorschlag

Blatt 10. Hamilton-Formalismus- Lösungsvorschlag Fakultät für Physik der LMU München Lehrstuhl für Kosmologie, Prof. Dr. V. Mukhanov Übungen zu Klassischer Mechanik T) im SoSe 20 Blatt 0. Hamilton-Formalismus- Lösungsvorschlag Aufgabe 0.. Hamilton-Formalismus

Mehr

Übungsblatt: Protein interaction networks. Ulf Leser and Samira Jaeger

Übungsblatt: Protein interaction networks. Ulf Leser and Samira Jaeger Übungsblatt: Protein interaction networks Ulf Leser and Samira Jaeger Aufgabe 1 Netzwerkzentralität (6P) In der Vorlesung haben Degree Centrality besprochen. Finde drei weitere etablierte Zentralitätsmaße

Mehr

Wahrscheinlichkeitstheorie und Statistik vom

Wahrscheinlichkeitstheorie und Statistik vom INSTITUT FÜR STOCHASTIK SS 2007 UNIVERSITÄT KARLSRUHE Priv.-Doz. Dr. D. Kadelka Dipl.-Math. oec. W. Lao Klausur (Maschineningenieure) Wahrscheinlichkeitstheorie und Statistik vom 2.9.2007 Musterlösungen

Mehr

Konfidenzintervalle Grundlegendes Prinzip Erwartungswert Bekannte Varianz Unbekannte Varianz Anteilswert Differenzen von Erwartungswert Anteilswert

Konfidenzintervalle Grundlegendes Prinzip Erwartungswert Bekannte Varianz Unbekannte Varianz Anteilswert Differenzen von Erwartungswert Anteilswert Konfidenzintervalle Grundlegendes Prinzip Erwartungswert Bekannte Varianz Unbekannte Varianz Anteilswert Differenzen von Erwartungswert Anteilswert Beispiel für Konfidenzintervall Im Prinzip haben wir

Mehr

Was ist Bioinformatik?

Was ist Bioinformatik? 9. Kurstag: Bioinformatik Der Begriff "Bioinformatik" wurde 1989 erstmals von D.R. Masys im JOURNAL OF RESEARCH OF THE NATIONAL INSTITUTE OF STANDARDS AND TECHNOLOGY erwähnt. Was ist Bioinformatik? Die

Mehr

1 Schulinterner Kernlehrplan Biologie Q2 Evolution

1 Schulinterner Kernlehrplan Biologie Q2 Evolution 1 Schulinterner Kernlehrplan Biologie Q2 Evolution 1 Inhaltsfelder Schwerpunkt Basiskonzept Konkretisierte Kompetenzen Evolution Evolutionstheorien LK Evolutionstheorie Biodiversität und Systematik Entwicklung

Mehr

4. Kombinatorik *) In der Kombinatorik werden drei wichtige Symbole benötigt: o n! o (n) k o

4. Kombinatorik *) In der Kombinatorik werden drei wichtige Symbole benötigt: o n! o (n) k o *) Die Berechnung der Wahrscheinlichkeit im Laplace-Experiment wirkt zunächst einfach. Man muss einfach die Anzahl der günstigen Fälle durch die Anzahl der möglichen Fälle teilen. Das Feststellen dieser

Mehr

Höhere Mathematik für Naturwissenschaftler Studienjahr 2016/17

Höhere Mathematik für Naturwissenschaftler Studienjahr 2016/17 1/37 0. Organisatorisches 2/37 Übung Höhere Mathematik für Naturwissenschaftler Studienjahr 2016/17 Dr. Udo Lorz TU Bergakademie Freiberg Fakultät für Mathematik und Informatik Links zur Vorlesung Website

Mehr

Bioinformatik. Zeichenketten und Stringalgorithmen. Ulf Leser Wissensmanagement in der. Bioinformatik

Bioinformatik. Zeichenketten und Stringalgorithmen. Ulf Leser Wissensmanagement in der. Bioinformatik Bioinformatik Zeichenketten und Stringalgorithmen Ulf Leser Wissensmanagement in der Bioinformatik Inhalt dieser Vorlesung Warum Stringmatching? Strings und Matching Naiver Algorithmus Ulf Leser: Algorithmische

Mehr

Informationstechnologie in der Pflanzenzüchtung. Biocomputing in einem Züchtungsunternehmen. Andreas Menze KWS SAAT AG, Einbeck

Informationstechnologie in der Pflanzenzüchtung. Biocomputing in einem Züchtungsunternehmen. Andreas Menze KWS SAAT AG, Einbeck Informationstechnologie in der Pflanzenzüchtung Biocomputing in einem Züchtungsunternehmen Andreas Menze KWS SAAT AG, Einbeck Biocomputing in einem Züchtungsunternehmen Biocomputing Was ist das? Wozu wird

Mehr

Einführung in die Induktive Statistik: Testen von Hypothesen

Einführung in die Induktive Statistik: Testen von Hypothesen Einführung in die Induktive Statistik: Testen von Hypothesen Jan Gertheiss LMU München Sommersemester 2011 Vielen Dank an Christian Heumann für das Überlassen von TEX-Code! Testen: Einführung und Konzepte

Mehr

Bio Data Management. Kapitel 5a Sequenzierung und Alignments

Bio Data Management. Kapitel 5a Sequenzierung und Alignments Bio Data Management Kapitel 5a Sequenzierung und Alignments Sommersemester 2013 Anika Groß Universität Leipzig, Institut für Informatik, Abteilung Datenbanken http://dbs.uni-leipzig.de Vorläufiges Inhaltsverzeichnis

Mehr

Künstliche Intelligenz Maschinelles Lernen

Künstliche Intelligenz Maschinelles Lernen Künstliche Intelligenz Maschinelles Lernen Stephan Schwiebert Sommersemester 2009 Sprachliche Informationsverarbeitung Institut für Linguistik Universität zu Köln Maschinelles Lernen Überwachtes Lernen

Mehr

1 Mengen. 1.1 Definition

1 Mengen. 1.1 Definition 1 Mengen 1.1 Definition Eine Menge M ist nach dem Begründer der Mengenlehre Georg Cantor eine Zusammenfassung von wohlunterschiedenen(verschiedenen) Elementen. Eine Menge lässt sich durch verschiedene

Mehr

Pollards Rho-Methode zur Faktorisierung

Pollards Rho-Methode zur Faktorisierung C A R L V O N O S S I E T Z K Y Pollards Rho-Methode zur Faktorisierung Abschlusspräsentation Bachelorarbeit Janosch Döcker Carl von Ossietzky Universität Oldenburg Department für Informatik Abteilung

Mehr

Bioinformatik. Substitutionsmatrizen BLAST. Ulf Leser Wissensmanagement in der. Bioinformatik

Bioinformatik. Substitutionsmatrizen BLAST. Ulf Leser Wissensmanagement in der. Bioinformatik Bioinformatik Substitutionsmatrizen BLAST Ulf Leser Wissensmanagement in der Bioinformatik Inhalt dieser Vorlesung Substitutionsmatrizen: PAM und BLOSSUM Suche in Datenbanken: Basic Local Alignment Search

Mehr

(x a) 3 + f (a) 4! x 4 4! Wir werden im Folgenden vor allem Maclaurin-Reihen betrachten, dies alles funktioniert aber auch. f (x) = sin x f (0) = 0

(x a) 3 + f (a) 4! x 4 4! Wir werden im Folgenden vor allem Maclaurin-Reihen betrachten, dies alles funktioniert aber auch. f (x) = sin x f (0) = 0 Taylor-Reihen Einführung Mathematik GLF / 6 Christian Neukirchen Oft können wir bestimmte mathematische Funktionen nicht genau ausrechnen, besonders die trigonometrischen Funktionen wie, cos x, oder die

Mehr

Evolution & Genetik (Beispiel Hämoglobin) Prof. Dr. Antje Krause FH Bingen 06721 / 409 253 [email protected]

Evolution & Genetik (Beispiel Hämoglobin) Prof. Dr. Antje Krause FH Bingen 06721 / 409 253 akrause@fh-bingen.de Evolution & Genetik (Beispiel Hämoglobin) Prof. Dr. Antje Krause FH Bingen 06721 / 409 253 [email protected] DNA (Desoxyribonukleinsäure) 5 3 CGATGTACATCG GCTACATGTAGC 3 5 Doppelhelix Basen: Adenin,

Mehr

Zusammenfassung Mathe II. Themenschwerpunkt 2: Stochastik (ean) 1. Ein- und mehrstufige Zufallsexperimente; Ergebnismengen

Zusammenfassung Mathe II. Themenschwerpunkt 2: Stochastik (ean) 1. Ein- und mehrstufige Zufallsexperimente; Ergebnismengen Zusammenfassung Mathe II Themenschwerpunkt 2: Stochastik (ean) 1. Ein- und mehrstufige Zufallsexperimente; Ergebnismengen Zufallsexperiment: Ein Vorgang, bei dem mindestens zwei Ereignisse möglich sind

Mehr

Algorithmische Bioinformatik 1

Algorithmische Bioinformatik 1 Algorithmische Bioinformatik 1 Dr. Hanjo Täubig Lehrstuhl für Effiziente Algorithmen (Prof. Dr. Ernst W. Mayr) Institut für Informatik Technische Universität München Sommersemester 2009 Übersicht Paarweises

Mehr

Kapitel 13. Evolutionäre Spieltheorie. Einleitung. Evolutionäre Biologie. Übersicht 2. Alternative: Biologische Evolutionstheorie

Kapitel 13. Evolutionäre Spieltheorie. Einleitung. Evolutionäre Biologie. Übersicht 2. Alternative: Biologische Evolutionstheorie Übersicht : Evolutionäre Spieltheorie Einleitung Evolutionäre Biologie Evolutionäre Spieltheorie: Idee Gefangenendilemma (Beispiel) Evolutionäre Stabilität Beispiele Wiederholtes Gefangenendilemma Chicken-Spiel

Mehr

Problemreduktion durch Transformation am Beispiel des. Erweiterten Euklidschen Algorithmus

Problemreduktion durch Transformation am Beispiel des. Erweiterten Euklidschen Algorithmus Problemreduktion durch Transformation am Beispiel des Erweiterten Euklidschen Algorithmus Wolfgang Windsteiger JKU Linz, A 4040 Linz, Austria Kurzfassung Transformation beschreibt im Wesentlichen die algorithmische

Mehr

Alignment von DNA- und Proteinsequenzen

Alignment von DNA- und Proteinsequenzen WS2012/2013 Genomforschung und Sequenzanalyse - Einführung in Methoden der Bioinformatik- Thomas Hankeln Alignment von DNA- und Proteinsequenzen das vielleicht wichtigste Werkzeug der Bioinformatik! 1

Mehr

Studiengang Informatik der FH Gießen-Friedberg. Sequenz-Alignment. Jan Schäfer. WS 2006/07 Betreuer: Prof. Dr. Klaus Quibeldey-Cirkel

Studiengang Informatik der FH Gießen-Friedberg. Sequenz-Alignment. Jan Schäfer. WS 2006/07 Betreuer: Prof. Dr. Klaus Quibeldey-Cirkel Studiengang Informatik der FH Gießen-Friedberg Sequenz-Alignment Jan Schäfer WS 2006/07 Betreuer: Prof. Dr. Klaus Quibeldey-Cirkel Überblick Einführung Grundlagen Wann ist das Merkmal der Ähnlichkeit erfüllt?

Mehr

TreeTOPS. Ein Phylogenetik-Icebreaker Spiel. Lehrer- Handbuch. ELLS Europäisches Lernlabor für die Lebenswissenschaften

TreeTOPS. Ein Phylogenetik-Icebreaker Spiel. Lehrer- Handbuch. ELLS Europäisches Lernlabor für die Lebenswissenschaften TreeTOPS Ein Phylogenetik-Icebreaker Spiel Lehrer- Handbuch ELLS Europäisches Lernlabor für die Lebenswissenschaften 1 Übergeordnetes Ziel Das übergeordnete Ziel des Spieles ist es, die Spieler in das

Mehr

2. Lernen von Entscheidungsbäumen

2. Lernen von Entscheidungsbäumen 2. Lernen von Entscheidungsbäumen Entscheidungsbäume 2. Lernen von Entscheidungsbäumen Gegeben sei eine Menge von Objekten, die durch Attribut/Wert- Paare beschrieben sind. Jedes Objekt kann einer Klasse

Mehr

Abiturprüfung Biologie, Grundkurs

Abiturprüfung Biologie, Grundkurs Seite 1 von 5 Abiturprüfung 2009 Biologie, Grundkurs Aufgabenstellung: Thema: Parasiten als Indikatoren der Primaten-Evolution I.1 Begründen Sie, warum der Vergleich von Aminosäure-Sequenzen und Basen-Sequenzen

Mehr

1. Genetische Vielfalt innerhalb einer Population

1. Genetische Vielfalt innerhalb einer Population Biologie für Nebenfächler Prof. Dr. W. Stephan 1. Genetische Vielfalt innerhalb einer Population Zentraler Begriff der Populationsgenetik und Evolutionsbiologie Ohne genet. Variation gäbe es keine Evolution

Mehr

Diskrete Mathematik Kongruenzen

Diskrete Mathematik Kongruenzen Diskrete Mathematik Kongruenzen 31. Mai 2006 1 Inhaltsverzeichnis 1. Einleitung 2. Prime Restklassen 3. Die Sätze von Euler und Fermat 4. Lineare Kongruenzen 5. Systeme 2 Einleitung 3 Fragestellung Wie

Mehr

Algorithmen und Datenstrukturen Kapitel 10

Algorithmen und Datenstrukturen Kapitel 10 Algorithmen und Datenstrukturen Kapitel 10 Flüsse Frank Heitmann [email protected] 6. Januar 2016 Frank Heitmann [email protected] 1/8 Flüsse Graphen Grundlagen Definition

Mehr

3 Evaluation als Beschreibung von Zuständen

3 Evaluation als Beschreibung von Zuständen Evaluation als Beschreibung von Zuständen 1 Sind die folgenden Aussagen richtig oder falsch? 1.1 In einer Klumpenstichprobe werden systematisch anfallende Cluster von Personen vollständig untersucht. Die

Mehr

Demo für

Demo für Aufgabensammlung Mit ausführlichen Lösungen Geradengleichungen und lineare Funktionen Zeichnen von Geraden in vorgefertigte Koordinatensysteme Aufstellen von Geradengleichungen Schnitt von Geraden Die

Mehr

Übungsblatt Molekularbiologie und Genetik für Studierende der Bioinformatik II 1. Übung

Übungsblatt Molekularbiologie und Genetik für Studierende der Bioinformatik II 1. Übung Übungsblatt Molekularbiologie und Genetik für Studierende der Bioinformatik II 1 Name des Studierenden: Datum: Einführung Übung Bitte bereiten Sie folgende Probleme vor der Übung am Mittwoch. Die Klausur

Mehr

31 Polynomringe Motivation Definition: Polynomringe

31 Polynomringe Motivation Definition: Polynomringe 31 Polynomringe 31.1 Motivation Polynome spielen eine wichtige Rolle in vielen Berechnungen, einerseits weil oftmals funktionale Zusammenhänge durch Polynome beschrieben werden, andererseits weil Polynome

Mehr

Berechnung von Pi und verwandte Probleme

Berechnung von Pi und verwandte Probleme Berechnung von Pi und verwandte Probleme 1. Gitterpunkte im Kreis 1.1. Näherungsformel. Wir wollen eine möglichst einfache näherungsweise Formel finden für die Anzahl der Gitterpunkte in einem Kreis um

Mehr

In situ Hybridisierung

In situ Hybridisierung In situ Hybridisierung eine Methode zum direkten und spezifischen Nachweis von Nukleinsäuren (DNA und RNA) in Gewebe, Zellen, Zellkompartimenten und Chromosomen Was kann damit erreicht werden? direkte

Mehr

K4 Bedingte Wahrscheinlichkeiten. 4.1 Definition Die bedingte Wahrscheinlichkeit von A bei gegebenem B:

K4 Bedingte Wahrscheinlichkeiten. 4.1 Definition Die bedingte Wahrscheinlichkeit von A bei gegebenem B: K4 Bedingte Wahrscheinlichkeiten 4.1 Definition Die bedingte Wahrscheinlichkeit von A bei gegebenem B: P(A B) = P(A B)/P(B) (4.1.1) Meistens benutzen wir diese Form: P(A B) = P(A B)*P(B) weil P(A B) schwer

Mehr

Survival of the Fittest Optimierung mittels Genetischer Algorithmen

Survival of the Fittest Optimierung mittels Genetischer Algorithmen Übung zu Organic Computing Survival of the Fittest Optimierung mittels Genetischer Algorithmen Sabine Helwig Lehrstuhl für Informatik 12 (Hardware-Software-Co-Design) Universität Erlangen-Nürnberg [email protected]

Mehr

Textkompression: Burrows-Wheeler-Transformation

Textkompression: Burrows-Wheeler-Transformation Proseminar Algorithmen der Bioinformatik WS 2010/11 Textkompression: Burrows-Wheeler-Transformation Johann Hawe Johann Hawe, WS 2010/11 1 Gliederung 1. Einleitung 2. BWT Kompressionstransformation 2.1

Mehr

Quadratische Funktionen und Gleichungen Mathematik Jahrgangsstufe 9 (G8) Bergstadt-Gymnasium Lüdenscheid. Friedrich Hattendorf

Quadratische Funktionen und Gleichungen Mathematik Jahrgangsstufe 9 (G8) Bergstadt-Gymnasium Lüdenscheid. Friedrich Hattendorf Mathematik Jahrgangsstufe 9 (G8) Lüdenscheid Friedrich Hattendorf 4. September 2014 Vorbemerkung Die Datei entsteht noch; noch nicht alles ist optimal Hinweis zum Ausdruck: (Fast) Alles sollte noch gut

Mehr

Vorlesungsthemen Mikrobiologie

Vorlesungsthemen Mikrobiologie Vorlesungsthemen Mikrobiologie 1. Einführung in die Mikrobiologie B. Bukau 2. Zellaufbau von Prokaryoten B. Bukau 3. Bakterielles Wachstum und Differenzierung B. Bukau 4. Bakterielle Genetik und Evolution

Mehr

Alignment-Verfahren zum Vergleich biologischer Sequenzen

Alignment-Verfahren zum Vergleich biologischer Sequenzen zum Vergleich biologischer Sequenzen Hans-Joachim Böckenhauer Dennis Komm Volkshochschule Zürich. April Ein biologisches Problem Fragestellung Finde eine Methode zum Vergleich von DNA-Molekülen oder Proteinen

Mehr

Anzahl der Möglichkeiten in der Werkstatthalle, 3 ohne eingebaute Alarmanlage: N N 2

Anzahl der Möglichkeiten in der Werkstatthalle, 3 ohne eingebaute Alarmanlage: N N 2 Abiturprüfung Berufliche Oberschule 003 Mathematik 13 Technik - B I - Lösung Teilaufgabe 1.0 Eine Kfz-Werkstatt für Autoelektronik baut in Fahrzeuge Alarmanlagen ein. Die Werkstatt verfügt über 11 Stellplätze,

Mehr

Testen von Hypothesen

Testen von Hypothesen Elke Warmuth Humboldt-Universität zu Berlin Sommersemster 2010 1 / 46 2 / 46 1 Testen von Hypothesen 3 / 46 Signifikant, signifikant, signifikant,... 4 / 46 Signifikant, signifikant, signifikant,... 5

Mehr

Algorithmische Bioinformatik

Algorithmische Bioinformatik Algorithmische Bioinformatik Effiziente Berechnung des Editabstands Dynamische Programmierung Ulf Leser Wissensmanagement in der Bioinformatik Inhalt dieser Vorlesung Rekursive Definition des Editabstands

Mehr

4. Lernen von Entscheidungsbäumen. Klassifikation mit Entscheidungsbäumen. Entscheidungsbaum

4. Lernen von Entscheidungsbäumen. Klassifikation mit Entscheidungsbäumen. Entscheidungsbaum 4. Lernen von Entscheidungsbäumen Klassifikation mit Entscheidungsbäumen Gegeben sei eine Menge von Objekten, die durch /Wert- Paare beschrieben sind. Jedes Objekt kann einer Klasse zugeordnet werden.

Mehr

AFu-Kurs nach DJ4UF. Technik Klasse E 05: Der Kondensator und seine Schaltungsarten. Amateurfunkgruppe der TU Berlin.

AFu-Kurs nach DJ4UF. Technik Klasse E 05: Der Kondensator und seine Schaltungsarten. Amateurfunkgruppe der TU Berlin. Technik Klasse E 05: Der Kondensator und seine Amateurfunkgruppe der TU Berlin http://www.dk0tu.de Stand 26.10.2015 This work is licensed under the Creative Commons Attribution-ShareAlike 3.0 License.

Mehr

Varianz und Kovarianz

Varianz und Kovarianz KAPITEL 9 Varianz und Kovarianz 9.1. Varianz Definition 9.1.1. Sei (Ω, F, P) ein Wahrscheinlichkeitsraum und X : Ω eine Zufallsvariable. Wir benutzen die Notation (1) X L 1, falls E[ X ]

Mehr

Bioinformatik an der FH Bingen

Bioinformatik an der FH Bingen Bioinformatik an der FH Bingen Prof. Dr. Antje Krause 05.11.2010 Wie alles begann... 1955 erste Proteinsequenz (nach 12 Jahren Arbeit) veröffentlicht (Insulin vom Rind) Frederick Sanger MALWTRLRPLLALLALWPPPPA

Mehr