Algorithmische Bioinformatik

Ähnliche Dokumente
Bioinformatik. Distanzbasierte phylogenetische Algorithmen. Ulf Leser Wissensmanagement in der. Bioinformatik

AUFGABENSAMMLUNG Lösungen. Homologie, Analogie. Lösungen

1 Schulinterner Kernlehrplan Biologie Q2 Evolution

Stammesgeschichte des Menschen

Carl von Linné ( )

Aufgabe 7: Distanzbasierte Phylogenie: Neighbor Joining. Stefan Kröger, Philippe Thomas Wissensmanagement in der Bioinformatik

Darwins Erben - Phylogenie und Bäume

Evolution & Genetik (Beispiel Hämoglobin) Prof. Dr. Antje Krause FH Bingen / akrause@fh-bingen.de

Wie teilt man Lebewesen ein? 1. Versuch Aristoteles ( v.chr.)

3 empfindet Ausbildung als langweilig, bricht Studium mit. Universität Edinburgh. 3 schreibt sich in Cambridge ein, studiert Botanik, schliesst

Box. Biologie. Evolution. Neurobiologie. Brinkmann Meyhöfer. Schülerarbeitsbuch. 2. Halbjahr der Qualifikationsphase.

Box. Biologie. Das Nervensystem Zellbiologische Grundlagen, Erregungsbildung und Erregungsweiterleitung

TreeTOPS. Ein Phylogenetik-Icebreaker Spiel. Lehrer- Handbuch. ELLS Europäisches Lernlabor für die Lebenswissenschaften

Das Evolutionsgeschehen im Überblick

Stammbaum der Photorezeptoren

Die Bildung unseres Sonnensystems. Die Entstehung des Universums. Die Entstehung des Lebens. Erste Sterne und Dunkle Materie. Die Bildung der Galaxien

Wege zum Menschen und zu früher Kultur

Vergleich von Gliedmaßen mit gleicher Funktion

Phylogenetik. Vorlesung Einführung in die Angewandte Bioinformatik Prof. Dr. Sven Rahmann. Webseite zur Vorlesung

Informatik II Bäume. Beispiele. G. Zachmann Clausthal University, Germany Stammbaum. Stammbaum. Stammbaum

biotischen Umweltfaktoren im Ökosystem Wald (Auswahl) Gewässer als Ökosysteme Projekt: Der See als Ökosystem gewusst gekonnt...

Variation und Selektion

Teil: Cytologie, Anatomie und Phylogenie der Wirbeltiere

2 Belege für die Evolutionstheorie

Biologie Zusammenfassung 13.2 Frau Trittler

Mikrobielle Arten und Taxonomie

Phylogenetische Analyse

Module der AG Molekulare Zoologie für Biologie

Christoph Wulf - Anthropologie (2004)

Ministerium für Schule und Weiterbildung NRW BI GK HT 1 Seite 1 von 8. Unterlagen für die Lehrkraft. Abiturprüfung Biologie, Grundkurs

Numerus Clausus. The Origin of Species by Means of Natural Selection

Evolution & Religion. Evolution und Religion

MICHELANGELO di Lodovico Buonarroti Simoni (b. 1475, Caprese, d. 1564, Roma)

Dynamik von Genen in Populationen

27 Funktionelle Genomanalysen Sachverzeichnis

Was sind Arten und wie entstehen Sie?

Datenstrukturen & Algorithmen

2.3.1 Belege für die Aussage: Zwischen Arten bestehen abgestufte Ähnlichkeiten

Schulinternes Fachcurriculum Biologie Elsensee-Gymnasium Quickborn

Abiturprüfung Biologie, Grundkurs

Mathematik in der Evolutionsbiologie

Inhaltsverzeichnis. Haustiere und Nutztiere

-Generation sehen alle gleich aus (Uniformitätsregel). In der F 2. -Generation treten unterschiedliche Phänotypen auf (Spaltungsregel).

Beschreiben Sie in eigenen Worten die Unterschiede bzw. Gemeinsamkeiten zwischen Gendrift, Isolation und Separation.

Grundkurs Q 2: Inhaltsfeld: IF 6 (Evolution) Inhaltliche Schwerpunkte: Basiskonzepte: Zeitbedarf: ca. 24 Std. à 60 Minuten

Systematik. und Klassifikationssystem

Die Ähnlichkeit von Lebewesen kann im Grunde zwei verschiedene Ursachen haben:

Zusatzstation: Neigung des Gesichtsschädels

Grundlagen der biologischen Evolution

Geochemische Evolution des Planeten Erde

Vorlesungsthemen Mikrobiologie

Eine einzige Art und mehrere Milliarden verschiedene Männer und Frauen! 1. Wie viele Menschen gibt es heute auf der Erde?...

Biologie. Carl-von-Ossietzky-Gymnasium Bonn schulinternes Curriculum. Unterrichtsvorhaben: Materialhinweise:

Welche Belege gibt es für die Evolution der Lebewesen auf der Erde? (Teil 1)

Evolutionslehre. Wissenschaft oder Glaube?!

Grundwissen 5. Jahrgangsstufe 1. Teil

Ausprägungen der Sexualität in der Natur

Das Museum der Tiere

Domestikation. Haustierwerdung. Haustiere:

Isomorphie von Bäumen

[Grundlagen der] Physiologie der [Mikro-]organismen

Bioinformatik. Substitutionsmatrizen BLAST. Ulf Leser Wissensmanagement in der. Bioinformatik

Bäume und Wälder. Seminar: Graphentheorie Sommersemester 2015 Dozent: Dr. Thomas Timmermann

Logik für Biologen. Logisch denken zu können ist für alle Wissenschaftler wesentlich. Biologisch=Bio+logisch!

Welche drei Faktoren bestimmen nach Auffassung der modernen biopsychologischen. Verhalten?

Unterrichtsvorhaben I: Evolution in Aktion Welche Faktoren beeinflussen den evolutiven Wandel?

Evolutionäre Psychologie

System Art, Population, Paarungssystem, Genpool, Gen, Allel, ncdna, mtdna

Vorschlag einer Jahresplanung zu BioTOP 3

In der Jahrgangsstufe 8 erwerben die Schüler folgendes Grundwissen:


Von Jägern, Sammlern und echten Ernährungsproblemen

Die kosmische Evolution - Lösung

Proseminarvortrag. Markov-Ketten in der Biologie (Anwendungen)

Binäre Suchbäume. Mengen, Funktionalität, Binäre Suchbäume, Heaps, Treaps

Bei Einbeziehung von neun Allelen in den Vergleich ergibt sich eine Mutation in 38 Generationen (350:9); das entspricht ca. 770 Jahren.

Grundwissen 8. Klasse gemäß Lehrplan Gymnasium Bayern G8

Chromosomen & Populationsgenetik (1)

Genetische Programmierung

Primärstruktur. Wintersemester 2011/12. Peter Güntert

Optimale Produktliniengestaltung mit Genetischen Algorithmen

Homologie Analogie Rudimentäre Organe Lösung

Graphen und Bäume. A.1 Graphen

Material 1: Arbeitsprinzipien der Verwandtschaftsforschung

Buch: Natur Plus Biologie 7-10; Schroedel (Test: Natur und Technik Biologie 7-10 ; Cornelsen ISBN: )

Gekoppelte Vererbung. Genkarten. Doppel Crossover. Interferenz

3, 2, 1 los! Säugetiere starten durch!

Die Erbinformation ist in Form von Chromosomen = Kopplungsgruppen organisiert

URSPRUNG UND EVOLUTION VON ARCHAEEN - EINE ABHANDLUNG AUF STAND VON 2006

ÖKOSYSTEME UND IHRE VERÄNDERUNG. 1 Ökosystem Wald

Unterrichtsmaterialien in digitaler und in gedruckter Form. Auszug aus: Die Wirbeltierklassen im Vergleich - Material für den Vertretungsunterricht

Bioinformatik. Lokale Alignierung Gapkosten. Silke Trißl / Ulf Leser Wissensmanagement in der. Bioinformatik

Eukaryoten und Prokaryoten

2. Übung: Chromosomentheorie

Es geht auch ohne Beziehungsstress. In der Tierwelt haben einige Arten gelernt, den Nachwuchs

23. November Betweenness Centrality Closeness Centrality. H. Meyerhenke: Algorithmische Methoden zur Netzwerkanalyse 108

4. Kopplung. Konzepte: Gekoppelte Vererbung. Genkarten. Doppel-Crossover. Interferenz. Statistik

Transkript:

Algorithmische Bioinformatik Einführung in die Phylogenie (lat.: phylum = Stamm) Ulf Leser Wissensmanagement in der Bioinformatik

Inhalt dieser Vorlesung Stammbäume Phylogenetische Bäume Evolutionsmodell Ulf Leser: Algorithmische Bioinformatik 2

Tree of Life Ulf Leser: Algorithmische Bioinformatik 3

Stammbäume versus Klassifikation Zuerst war die Klassifikation Carl Linnaeus, ca. 1740: Systema Naturae Annahme: Arten verändern sich nicht Wir sind Prä-Darwin Einteilung der Lebewesen in Kingdoms - classes orders families generaspecies SKOFGA (Stamm, Klasse, Ordnung, Familie, Gattung, Art) Innere Knoten einer Klassifikation sind abstrakte Klassen, die i.d.r. keine eigenen Vertreter haben können Auch: Taxonomie Ulf Leser: Algorithmische Bioinformatik 4

Klassifikation Eukaryoten Tiere diverse Zwischenstufen Chraniata (Schädelknochen) Vertebraten (Wirbeltier) Viele Zwischenstufen Mammals (Säugetiere) Eutheria (Placenta) Primaten (Affen) Catarrhini Hominidae (Mensch, Schimpanse, Orang-Utan, Gorilla) Homo (erectus, sapiens...) Homo Sapiens Ulf Leser: Algorithmische Bioinformatik 5

Stammbäume C. Darwin: The origin of species 1859 Arten unterliegen im Laufe der Zeit einem Wandel Survival of the fittest Lange war unklar, was sich da wie wandelt Stammbäume (Abstammungsbäume) Ergeben sich aus Annahme der Evolution Wurden lange aus morphologischen Eigenschaften abgeleitet Jeder innere Knoten in einem Stammbaum hat einmal als Art existiert Knoten im Baum heißen taxa Was definiert eine Spezies? Ulf Leser: Algorithmische Bioinformatik 6

Homo floresiensis (Hobbit?) H. sapiens H. habilis Homo (humans) H. ergaster H. rudolfensis H. erectus Entdeckung 2003 Lebte ~95 000-12 000 v.c. auf Flores (Indonesien) Körperhöhe ca. 100 cm, Gehirnvolumen 380 cm 3 Homo erectus: 600-1200, h. sapiens: 1400 Rückentwicklung? Vorläufer? H. Floresiensis? Quelle: Brown, P. et al. Nature 431, 1055-1061 (2004). Ulf Leser: Algorithmische Bioinformatik 7

Evolutionsgeschichte neu geschrieben Stammbaum welche Art geht aus welcher hervor? Ulf Leser: Algorithmische Bioinformatik 8

Theorie I: Lamarck Jean Baptiste de Lamarck (1744-1829) Häufiger Gebrauch von Organen führt zu ihrer Veränderung, die dann weitervererbt wird (nur wie?) Z.B.: Hals der Giraffe Nicht gebrauchte Organe verkümmern Z.B.: Augen des Maulwurf Ulf Leser: Algorithmische Bioinformatik 9

Theorie II: Darwin Charles Robert Darwin (1809-1882) Die merkwürdigste Tatsache ist die vollkommene Abstufung in der Größe des Schnabels, von einem Schnabel, der so groß ist wie der eines Kernbeißers bis zu dem eines Buchfinken Erklärung: Zufällige Veränderungen und natürliche Auslese Quelle: Praxis der Naturwissenschaften, 1985 Ulf Leser: Algorithmische Bioinformatik 10

The Computer Tree Ulf Leser: Algorithmische Bioinformatik 11

Moderne Stammbaumberechnung Mendel + Darwin: Das Erbgut unterliegt dem Wandel Berechnung von Stammbäumen aufgrund von DNA oder Proteinähnlichkeiten Molecular phylogeny Zuckerkandl und Pauling, 1965 Annahme: Evolution verläuft in kleinen Schritten Wenn sich Sequenzen ähnlich sind, sind die Spezies evolutionär eng verwandt Denn zufällige Ähnlichkeit ist unwahrscheinlich Ulf Leser: Algorithmische Bioinformatik 12

Arten von Stammbäumen Individuelle Abstammung Stammbäume, Ahnentafeln Kein Baum: Zwei Eltern Rekombination Speziesstammbäume Das ist ein Baum, wenn Spezies nicht verschmelzen können Gene Trees Geschichte eines Sequenzabschnitts Nicht leicht zu definieren Baumförmig, wenn Gene nicht verschmelzen Quelle: http://www.mailund.dk Aber: 2 Allele jedes Gens vorhanden (Besser: Haplotyp Tree) Ulf Leser: Algorithmische Bioinformatik 13

Wozu? Aufklärung der evolutionären Verhältnisse Verständnis Ausbreitung/Verkleinerung der Artenvielfalt Aufklärung von Infektionswegen Bei schnell mutierenden Viren (z.b. HIV) Varianten werden in verschiedenen Personen gefunden Berechnung des Verbreitungsweges anhand der Abstammungsverhältnisse Phylogenetic Inference Wenn alle nahe verwandten Spezies ein bestimmtes Gen haben, dann sollte ich das auch haben Ulf Leser: Algorithmische Bioinformatik 14

Evolutionsmodell Lebewesen vermehren sich durch Kopieren mit Fehlern Fehler: Mutationen Führen (manchmal) zu veränderter Funktion Selektion Survival of the fittest Eingeschränkte Überlebensfähigkeit führen zur Ausrottung Positive Mutationen: mehr und lebensfähigere Nachkommen Positive Mutationen setzen sich in einer Population durch Speziation Unterschiedliche Mutationen sind in unterschiedlichen Lebensräumen unterschiedlich vorteilhaft (ökologische Nischen) Führt zur umgebungsspezifischen Akkumulation von Änderungen Schließlich geht gemeinsame Fortpflanzungsfähigkeit verloren Ulf Leser: Algorithmische Bioinformatik 15

Artenbildung Unser Modell: Arten entstehen durch Veränderungen aus einer anderen Art Es gibt massenhaft Ausnahmen: Phylogenetische Netzwerke Vorfahr Gorilla Humanoide Fische Reptilien H erectus H sapiens Amphibien Ulf Leser: Algorithmische Bioinformatik 16

Bäume Knoten = Arten Blätter = Lebende Arten Kanten Länge kann (aber muss nicht) mit zeitlicher Entfernung korrelieren Jeder Knoten hat exakt einen Vater Wurzel oder nicht Binäre Bäume Reihenfolge der Kinder ist egal Viele Visualisierungsvarianten Ulf Leser: Algorithmische Bioinformatik 17

Daten Messen kann man nur die DNA existierender Arten Zwei mögliche Ziele Rekonstruktion des Stammbaums der Arten Rekonstruktion der Ur-DNA und aller Zwischenstufen Den tatsächlichen Stammbaum kann man nur annähern Man kann ausgestorbene Mutationen nicht erkennen Man kann Doppelmutationen nicht erkennen AGGTAGCT AGGTAGCT AGGTTGCT Erkennbar AGGTTGCT AGGTTTCT AGGTTGCT Identisch Unerkennbar Ulf Leser: Algorithmische Bioinformatik 18

Binäre versus Multifurcation Trees Erscheinen als A B C D E Eines der Paare (A, B), (B,C), (A,C) wird minimal ähnlicher sein A B C D E Ulf Leser: Algorithmische Bioinformatik 19

Weitere Probleme Gene Fusion Hybridisierung / Kreuzungen (bei Pflanzen) Rekombination Horizontal gene transfer Insb. bei Viren / Bakterien bekannt Genetree und Speziesstammbaum stimmen nicht mehr überein Speziesbegriff problematisch bei Lebewesen ohne sexuelle Reproduktion Homoplasy Ähnliche Sequenzen, die nicht homolog sind Convergent evolution Arten entwickeln Fähigkeiten oft unabhängig voneinander Ulf Leser: Algorithmische Bioinformatik 20

Bäume ohne Wurzeln Kanten symbolisieren Veränderungen Viele Methoden berechnen nur innere Knoten, aber können keine Entwicklungsrichtung ableiten AGT 1 AGA 1 GGA 1 GTA ATA 1 1 CGA AGA AGA GGA GGA ATA AGT CGA GTA ATA AGT CGA GTA Ulf Leser: Algorithmische Bioinformatik 21

Wie schwierig wird das? Wie viele binäre, ungeordnete Bäume für n Spezies gibt es? A B A B C A C B A B C A B C A B C D A D B C A B C D A D B C A B D C Ulf Leser: Algorithmische Bioinformatik 22

Induktion über Zahl der Blätter Aus einem binären Baum mit n Blättern und m Kanten können m+1 binäre Bäume mit n+1 Blättern hervorgehen Wie viele Kanten hat ein binärer Baum? Jeder Knoten außer der Wurzel hat genau eine eingehende Kante Also sind es Anz. Blätter + Anz. innere Knoten -1 (Wurzel) Wie viele innere Knoten k hat ein binärer Baum mit n Blättern? Ulf Leser: Algorithmische Bioinformatik 23

Von Blättern zu inneren Knoten Umgedreht: Wie viele Blätter (n) hat ein binärer Baum mit k inneren Knoten? Induktionsanfang: Für k=1 ist n=2; n(1)=2=k+1 Sei n(k) bekannt. Wo können wir neue innere Knoten hinzufügen? An jeder Kante. Der neue Knoten teilt die Kante und muss als Kind den alten Teilbaum und ein neues Blatt haben. Also gilt: n( k + 1) = n( k) + 1 = n( k 1) + 1+ 1 =... = k i= 1 1+ 1 = k + 1 Ulf Leser: Algorithmische Bioinformatik 24

Von Knoten zu Bäumen Für die Anzahl innerer Knoten k (inkl. Wurzel) eines binären Baums mit n Blättern gilt: n=k+1; also k=n-1 Ein binärer Baum mit n Blättern (und n-1 inneren Knoten) hat damit n+(n-1)-1 = 2n-2 Kanten Also Aus einem Baum mit 2 Blättern können (2*2-1)=3 Bäume mit 3 Blättern hervorgehen Aus einem Baum mit 3 Blättern können (2*3-1)=5 Bäume mit 4 Blättern hervorgehen... Aus einem Baum mit n Blättern können (2*n-1) Bäume mit n+1 Blättern hervorgehen Ulf Leser: Algorithmische Bioinformatik 25

Ergebnis Sei t(n) die Zahl ungeordneter binärer Bäume mit n Blättern t( n) = t(2)* t(3)* t(4)*...* t( n 1) = = 1*3*5*...*(2( n 1) 1) = (2n 3)! = = 2*4*6*...*(2n 4) (2n 3)! = = 2 4 6 2n 4 2 *2 *2 *...*2 2 2 2 2 (2n 3)! = = 2*(1)*2*(2)*2*(3)*...*2( n 2) (2n 3)! = n 2 2 *( n 2)! 1 1 2 1 3 3 4 15 5 105 6 945 7 10.395 8 135.135 9 2.027.025 10 34.459.425 11 654.729.075 12 13.749.310.575 13 316.234.143.225 14 7.905.853.580.625 15 213.458.046.676.875 16 6.190.283.353.629.370 17 191.898.783.962.511.000 18 6.332.659.870.762.850.000 19 221.643.095.476.700.000.000 20 8.200.794.532.637.890.000.000 Ulf Leser: Algorithmische Bioinformatik 26