Verwirrung? Erleuchtung. Molekulare. Phylogenie II. Genomforschung und Sequenzanalyse Einführung in Methoden der Bioinformatik

Größe: px
Ab Seite anzeigen:

Download "Verwirrung? Erleuchtung. Molekulare. Phylogenie II. Genomforschung und Sequenzanalyse Einführung in Methoden der Bioinformatik"

Transkript

1 Genomforschung und Sequenzanalyse inführung in Methoden der ioinformatik Molekulare Phylogenie II ernhard Lieb & Tom Hankeln WS 26/27 1 Verwirrung? rleuchtung 2 1

2 Was bisher geschah... aten lignment istanzmatrix lustalx, ialign volutionsmodell JTT, PM, LOSUM... Stammbaum 3 Korrektur der istanzen % tatsächlicher bstand = nzahl der Mutationen Korrektur beobachteter bstand t 4 2

3 volutions modelle 5 volutionsmodelle Globuläre Proteine Transmembran-Proteine 6 3

4 Variationen der Substitutionsraten shape-parameter α Häufigkeit α=,5 α=2 α=5 α=1 α=5 Kategorien Substitutionsrate 7 ModelTest, ProtTest, FindModel 8 4

5 istanzmatrix erechnen des paarweisen bstands Sequenz 1,,236,621,72 1,51 Sequenz 2,,599,672 1,482 Sequenz 3,,112 1,561 Sequenz 4, 1,425 Sequenz 5, usgedrückt i.d.r. als Mutationen pro Position bstand kann > 1 werden! sp. Jukes-antor: 3 4 K = ln 1 p p =.6 => K = Stammbaumerstellung Wie kommen wir von einer istanzmatrix zu einem Stammbaum? => lgorithmus berechnet aus den istanzen den besten Stammbaum Sequenzen selbst werden nicht mehr berücksichtigt 1 5

6 UPGM Unweighted Pair-Group Method with rithmetric Means =3 3 3 d + d 2 d + d 2 / / / / =5, / 11 UPGM Unweighted Pair-Group Method with rithmetric Means // Sequenz // Sequenz nimmt konstante volutionsraten an ußengruppe wird automatisch bestimmt

7 UPGM Unweighted Pair-Group Method with rithmetric Means dditive oder "lustering" lustering"-methode: s werden durch sequenzielles lustern nach absteigender Ähnlichkeit gruppiert. 13 UPGM Unweighted Pair-Group Method with rithmetric Means usgangsmatrix rekonstruierte Matrix UPGM setzt absolute molekulare Uhr voraus, aber in Realität müssen volutionsraten berücksichtigt werden 14 7

8 Fitch-Margoliash lgorithmus Ähnlicher lgorithmus wie UPGM Sukzessives Gruppieren der Taxa ohne Verlust eines stlängenunterschiedes Keine molekulare Uhr zur estimmung der stlängen: 15 Fitch-Margoliash lgorithmus 3 Taxa (1) b a (3) c c (2) istanzen bekannt, aber stlängen nicht klar => 2 Unbekannte (a, b); 1 Konstante (c) => z.. aus der ifferenz von (3) und (2) => Unterschied der Äste errechenbar => uflösen nach b => insetzen in (1) inzelabstände (1) = a+b = 22 (2) = a+c = 39 (3) - (2) (3) = b+c = a-b = 39 = -2 -b = -2-a b= 2+a a+a+2 = 22 2a = 22-2 a=

9 Fitch-Margoliash lgorithmus 3 Taxa (a): 1 (b): 12 (c): 29 b=12 c=29 a=1 17 Fitch-Margoliash lgorithmus 5 Taxa b c f a g 1 1 d und geringste istanz urschnittswert aus bilden 3.Taxon erechung der stlängen und Neue Matrix e :2 / / / / usw 18 9

10 Fitch-Margoliash lgorithmus wenn die einzelnen volutionsraten (stärker) variieren, dann doch lieber Neighbor-joining 19 Neighbor-joining (NJ) Saitou und Nai, 1987 Ähnlicher lgorithmus wie UPGM bzw. FM Sukzessives Gruppieren der Taxa ohne Verlust eines stlängenunterschiedes unrooted tree oder ungewurzelter aum (radial) Keine molekulare Uhr esonders sinnvoll, wenn volutionsraten der verschiedenen Linien unterschiedlich sind Minimierung der Gesamt-stlängen des aums => Stammbaum wird aufgelöst 2 1

11 a b e Neighbor-joining (NJ) Star-tree S = ( d ji )/N-1 i j d c S = Summe aller stlängen d = istanzen zwischen allen s S =78,5 S =a+b+c+d+e a Paare werden kombiniert ber: Welche Paare werden kombiniert? Ziel N=nzahl NJ der => s Minimierung der Summe aller stlängen modified Star-tree S mn = [( d im +d in )/2(N-2)]+d mn /2+ d ij /N-2 i und j alle Sequenzen ausser m und n, wobei i<j S =67,7 S =81 S =76 S =7 b f e d c 21 Neighbor-joining (NJ) Star tree -> aumlänge modified Star-tree Grouping -> aumlängen stlängen -> FM b c f Neues taxon () -> neue Matrix a d e Grouping -> aumlängen stlängen -> FM Neues taxon -> neue Matrix Neues taxon (XY) -> neue Matrix Grouping stlängen Neues taxon -> aumlängen -> FM -> neue Matrix 22 11

12 Neighbor-joining (NJ) rrechnen der Summe aller istanzen, durchschnittlicher istanzen einer Gruppe und z.. (S +S )/N-2 Summe Summe errechnen der istanzunterschiede ( rate corrected distance ) z.. =d (S +S )/N-2 Summe Summe ,3-47, ,3-57, ,3-57,3-6,6-6, Grouping 23 Neighbor-joining (NJ) rrechnen der stlängen durch FM b=12 X a=

13 usgangsmatrix Neighbor-joining (NJ) Summe Summe rstellen einer reduzierten atenmatrix liminierung der istanzen d X = (d d X + d d X )/2 <=> ( )/2 = 29 Summe Summe erechnen der stlängen nach FM Und so weiter.. 12 X 1 25 Neighbor-joining (NJ) final tree b=12 c=9 c f=2 a=1 g= e=6 d=

14 Neighbor-joining (NJ) Sequenzen Neighbor-joining Multiples lignment volutionsmodell istanzberechnung Stammbaumberechnung UPGM rgebnisüberprüfung 27 Neighbor-joining (NJ) UPGM setzt absolute molekulare Uhr voraus, aber in Realität müssen volutionsraten berücksichtigt werden Salamander Zebrafisch Lachs Zebrafisch Salamander Lachs nte UPGM vs NJ nte Gans Gans Huhn!bootstrap Taube? Taube Huhn Krokodil Krokodil lligator lligator Schildkröte Schildkröte Wal Wal Mensch Mensch.5 -> long branch attraction

15 Weitere istanzmethoden Least-squares-Methode Fehler (bweichung) mit der n Sequenzen auf einen aum gepasst werden K ij korrigierte Wert der istanz e (istanzmatrixwert) zwischen i und j P ij Länge des stes, der i und j verbindet = 1 i, j i < j < n ( Kij Pij ) 2 Minimum volution aum aus n Sequenzen besitzt 2n-3 Zweige Jeder Zweig z hat Länge l Summe dieser Zweiglängen ist die Länge des aumes = minimal Nach der LS-Formel wird dann die bweichung der stlängen von den istanzen minimiert L = 2n 3 lz z = 1 29 Was bisher geschah... aten lignment istanzmatrix Stammbaum lustalx, ialign volutionsmodell JTT, PM, LOSUM... lgorithmus z. UPGM; NJ NJ FM LS M UPGM 3 15

16 Stammbaumerstellung 1. Matrix-orientierte Methoden 2. harakter-orientierte Methoden Maximum Parsimony Maximum Likelihood 31 harakter-orientierte Methoden 1. Maximum Parsimony (MP) 2. Maximum Likelihood (ML) rbeiten direkt mit dem lignment xtrahieren mehr Information als Matrix-orientierte Methoden 32 16

17 Was sind haraktere? kontinuierliche oder diskontinuierliche igenschaften. 1,2,3,4... = kontinuierliche haraktere,t,g, = diskontinuierliche haraktere Nukleotide und minosäuren können als diskrete, diskontinuierliche haraktere behandelt werden. er phylogenetische Stammbaum wird anhand des Musters der Änderungen der haraktere berechnet 33 Maximum Parsimony (MP) Methode des "maximalen Geizes" bzw. der "maximalen Sparsamkeit" ntwickelt für morphologische haraktere 195 Grundzüge einer Theorie der phylogenetischen Systematik Willi Hennig

18 Maximum Parsimony William of Ockham ( ) nnahme: volution ging den kürzesten Weg Ockham's razor : "Pluralitas non est ponenda sine neccesitate" ("Ohne Notwendigkeit soll keine Vielfältigkeit hinzugefügt werden") =>minimalistische Ökonomieprinzipien kürzester Stammbaum wird berechnet, d.h. der die wenigsten evolutiven Schritten benötigt Schritte = Änderungen von harakteren 35 Maximum Parsimony rklärung mit morphologischen harakteren Gleiche Prinzipien sind für Sequenzen (asenpaare, minosäuren) gültig 36 18

19 Maximum Parsimony pomorphie: bgeleiteter harakter. Synapomorpie: bgeleiteter harakter, welcher mehreren Taxa gemeinsam ist. Plesiomorphie: Primitiver harakter. Symplesiomorphie:Primitiver harakter, welcher mehreren Taxa gemeinsam ist. Synapomorphie Symplesiomorphie Nur Synapomorphien sind in MP zu verwerten! 37 Synapomorphie eispiel Haare: Haare sind in der volution nur einmal entstanden..h., der esitz von Haaren ist ein synapomorphes Merkmal der Säugetiere. idechse Mensch Haare Frosch Änderung Hund fehlt vorhanden Synapomorphie = "richtige" Information 38 19

20 Homoplasie Unabhängige volution Homoplasie ist Übereinstimmung ohne Homologie (d.h., keine gemeinsame bstammung) Homoplasie resultiert aus unabhängiger volution (Konvergenz, Reversion) Homoplasie ist falsche Information, die zu falschen Stammbäumen führen kann MP ist anfällig für Homoplasie 39 Homoplasie-Konvergenz eispiel Schwanz: Schwanz ging unabhängig in den Fröschen und beim Menschen verloren. idechse Frosch Mensch Hund Schwanz fehlt vorhanden 4 2

21 Homoplasie Konvergenz eispiel Schwanz: Wenn Homoplasie unberücksichtigt bleibt, wird ein falscher Stammbaum abgeleitet. idechse Mensch Schwanz Hund Frosch fehlt vorhanden Maß für Homoplasie:.I. = onsistancy Index; I=m/s m: kleinste mögliche theoretische Schrittzahl s: tatsächliche Schrittzahl homoplastisch I<1 nwendung auf Sequenzen Nukleotide und minosäuren sind diskrete, diskontinuierliche haraktere 4 (Nukleotide) bzw. 2 (minosäuren) haraktere Lücken ("gaps") können als 5. bzw. 21. harakter behandelt werden 42 21

22 Maximum Parsimony eispiel: Position Sequenz G G T G G G T G G G T T G G T G 3 mögliche Stammbäume ((,),(,)) ((,),(,)) ((,),(,)) 43 Maximum Parsimony Welche Positionen sind informativ, bevorzugen also eine bestimmte Topologie? Position Sequenz G G T G G G T G G G T T G G T G 3 Positionen invariabel => nicht informativ 44 22

23 Maximum Parsimony Position Sequenz G G T G G G T G G G T T G G T G 6 Positionen sind variabel => aber auch informativ? 45 Maximum Parsimony Position Sequenz G G T G G G T G G G T T G G T G 3 Positionen sind zwar variabel, aber nicht informativ 46 23

24 Maximum Parsimony Welche Positionen sind aber nun informativ? Position Sequenz G G T G - G G T G G - G G T T G G G T G G * * * * => nur 3 von 9 Positionen sind informativ, d.h., favorisieren eine best. Topologie. => Indels sind haraktere! 47 Maximum Parsimony Position Sequenz G G T G G G T G G G T T G G T G ((,),(,)) ((,),(,)) ((,),(,)) Position 3: G G G? Position 5: Position 9: G G G G G G G G G G G G G G 48 24

25 Maximum Parsimony Position Sequenz G G T G G G T G G G T T G G T G * * * 3 mögliche Stammbäume 1 Mutationen 15 Mutationen 14 Mutationen 49 Maximum Parsimony ber: Ort der Mutation nicht immer eindeutig definiert => Parsimony kann keine stlängen berechnen. 1 Mutationen Position Sequenz G G T G G G T G G G T T G G T G = = =... 1 Mutationen 1 Mutationen 5 25

26 Maximum Parsimony Proteinparsimony: 1. Modell (z.. PUP): lle Substitutionen sind gleich wahrscheinlich (1 Schritt). eispiel Ile -> Trp Ile -> Met Ile -> la Modell: liegt genetischen ode zugrunde, wobei "silent site mutations" ignoriert werden (PROTPRS-Modell in PHYLIP). eispiel: Ile -> Met: T//T -> TG: ein Schritt Ile -> la: T//T -> GN: zwei Schritte Ile -> Trp: T//T -> TGG: drei Schritte 51 Maximum Parsimony xhaustive = lle Stammbäume werden untersucht, der beste Stammbaum wird erhalten (garantiert). ranch-and-ound = inige Stammbäume werden berechnet, bester Stammbaum garantiert. Heuristic = inige Stammbäume werden berechnet, bester Stammbaum nicht garantiert

27 Maximum Parsimony xhaustive = lle Stammbäume werden untersucht, der beste Stammbaum wird erhalten (garantiert). xhaustive search: rschöpfung garantiert 53 Maximum Parsimony: xhaustive Search "ranch addition (1) Start: 3 beliebige Taxa + 4. Taxon () in jeder möglichen Position -> 3 äume (2a) (2b) (2c) + 5. Taxon () in jeder der fünf möglichen Positionen => 15 Stammbäume etc

28 Maximum Parsimony: xhaustive Search Problem: nzahl der möglichen Stammbäume Number of s Number of rooted trees Number of unrooted trees => bei > ~1 Sequenzen ausführliche Suche aller Stammbäume de facto unmöglich 55 Maximum Parsimony 1. Lösung "ranch and bound": Stammbaum wird mit schneller Methode (z.. NJ) berechnet, die nzahl der notwendigen Schritte (L) wird berechnet. => verwirft Gruppen von äumen, die nicht kürzer werden können als L. Kann für Problemlösungen mit < ~ 2 Taxa verwendet werden

29 Maximum Parsimony abzweigen und beenden branch and bound 57 Maximum Parsimony 2. Lösung: Heuristische Verfahren: stepwise addition drei Taxa aum schrittweise ddition auf allen nächsten benen (großes Problem: lokale Maxima) star decomposition : star tree schrittweiser bbau von Taxa bzw. Zusammenführung und valuation (großes Problem: lokale Maxima) Kombination mit anderen lgorithmen branch swapping (Zweige vertauschen): Nearest neighbor interchange (NNI) Subtree pruning and regrafting (SPR) Tree bisection and reconnection (TR) 58 29

30 Maximum Parsimony Nearest neighbor interchange (NNI) Nachbarschaftstausch F G F G F G 59 Maximum Parsimony Subtree pruning and regrafting (SPR) stverpflanzung F G F G 6 3

31 Maximum Parsimony Tree bisection and reconnection (TR) aumschnittwiederverknüpfung (effektiv) F G G F F G Gutes urchmischen, aber PU aufwendig 61 Maximum Parsimony Problem: Lokale Maxima?! stepwise addition" star decomposition auminsel 62 31

32 Parsimony Ratchet urch zwischenzeitliche inführung einer veränderten Matrix wird man aus einem lokalen Maximum herauskatapultiert Programme wie: NON, TNT, PRP Weitere Parsimony -Verfahren: Wagner (binäre haraktere), ollo (gewichtet) und Fitch (unordered multistate characters, N) 63 Maximum Parsimony Vorteile: einfach ohne konkretes volutionsmodell rrechnung ancestraler Positionen funktioniert gut mit konsistenten atensätzen Nachteile: empfindlich gegen Homoplasien (Konvergenz) empfindlich gegen "Long ranch ttraction" stlängen werden unterschätzt kein volutionsmodell möglich! 64 32

33 harakter-orientierte Methoden 1. Maximum Parsimony (MP) 2. Maximum Likelihood (ML) 65 Maximum Likelihood The explanation that makes the observed outcome the most likely L = P( H) Wahrscheinlichkeit der aten, gegeben eine Hypothese iehypotheeisteineaumtopologie,dessen stlängen und ein volutionsmodell unter dessen Präsenz die aten evolvierten Zum ersten mal von avalli-sforza and dwards (1967) für gene frequency data benutzt, später (1981) von Felsenstein für N Sequenzen 66 33

34 Probability and likelihood ie Wahrscheinlichkeit liegt immer zwischen NI () und SIHR (1). ie bedingte Wahrscheinlichkeit ist die Wahrscheinlichkeit eines reignisses, gegeben das reignis : P( )....if probability allows us to predict unknown outcomes based on known parameters P(H ), then likelihood allows us to determine unknown parameters based on known outcomes P( H). 67 Likelihood Hypothese reignisse sind unabhängig lle Kopfwürfe besitzen gleiche UNKNNT Kopfwahrscheinlichkeit p aten: KKZKZKKZZZ L = P(aten Hypothese ) => Likelihood L( H) = pp(1-p)(1-p)p(1-p)pp(1-p)(1-p)(1-p) Keine Verteilung, Plot der selben aten (KKZKZKKZZZ) gegen verschiedene Werte von p (Hypothese) => Mit welcher Kopfwahrscheinlichkeit p bekomme ich am ehesten diese aten? Likelihood,,2,4,6,8 1, [p] 68 34

35 Maximum Likelihood L = P(data hypothesis) Wahrscheinlichkeit der beobachteten aten (Sequenzen!) im Lichte der Hypothese (Stammbaum). d.h, es wird der Stammbaum errechnet, der die beobachteten aten (also die alignierten Sequenzen) am besten (unter der nnahme des Modells) erklärt. volutionsmodell in aum wird generiert und man prüft dann ob die gegebenen aten den aum generieren könnenk 69 Maximum Likelihood benötigt ein explizites volutionsmodell Parameter werden aus aten + Modell errechnet. xplizite Verbindung aten + Modell + Stammbaum. aber: schlechtes Modell => schlechter Stammbaum lternative Stammbäume lassen sich testen => keine Methode extrahiert mehr Information aus den aten; aber: sehr rechenintensiv 7 35

36 Maximum Likelihood volutionsmodelle Für N-Sequenzen: => J, K2P, F81, HKY, RV Für Protein-Sequenzen: => PM, LOSUM, JTT, WG Maximum Likelihood Seq1 GG Seq2 GG Seq3 GTT Seq4 GGTG Frage: Wie hoch ist die Wahrscheinlichkeit, dass der Stammbaum für die aten (Sequenzen) unter dem gegebenen Modell verantwortlich ist? 72 36

37 Maximum Likelihood 1 GG 2 GG 3 GTT 4 GGT j GT?? GT 4 x 4 Möglichkeiten ie Wahrscheinlichkeit für eine best. Position j ist die Summe der inzelwahrscheinlichkeiten aller möglichen ancestralen Nukleotide unter dem gegebenen Modell. 73 ML eispiel (vereinfacht): aten: Modell (nicht realistisch): T G 1,1,1,1 T 1,1,1 1,1 G

38 ML - eispiel: Stammbaum : X,Y =, T, G, oder X Y ML: Summe der 4 x 4 inzelwahrscheinlichkeiten 75 ML - eispiel: 1. Topologie, immer gleich für unterschiedliche Knoten! Stammbaum 1: Stammbaum 2: T 1 x 1 x,1 x 1 x 1 =,1 1 x 1 x,1 x,1 x,1 =,1 usw... Summe aus 16 möglichen Stammbäumen! 76 38

39 ML - eispiel: 2. Topologie (andere Topologie)! ber immer gleich für unterschiedliche Knoten! Stammbaum 1: Stammbaum 2: T,1 x,1 x 1 x,1 x 1 =,1 1 x,1 x,1 x,1 x,1 =,1 usw... usw..usw Summe aus 16 möglichen Stammbäumen! 77 ML - eispiel: Summe der Wahrscheinlichkeiten der inzelbäume => Likelihood Stammbaum : Stammbaum : Wahrscheinlichkeit": =,12427 => logl = -,9563 Wahrscheinlichkeit": =,232 => logl = -1,

40 Maximum Likelihood 1 GG 2 GG 3 GTT 4 GGTG i....z Wahrscheinlichkeit des Stammbaums ist das Produkt aller Wahrscheinlichkeiten für jede Position: ML- Stammbaum = Stammbaum mit größter "Likelihood" Maximum Likelihood Sequence 1 Sequence 2 Sequence 3 Sequence 4 GG GG GTTT GGTT X,Y =, T, G, oder T G 1,,1,2,4 T 1,,3,6 1,,1 G 1, erechnen Likelihood einer aller Möglichkeiten vorgegebenen Topologie für eine ist das Produkt aller 1x1x1x,1x,1=,1 Topologie und eine Wahrscheinlichkeiten Position jeder Position 8 4

41 Maximum Likelihood Likelihood für alle anderen Topologien und Vergleich der Likelihoods L = P(data hypothesis) Sequence 1 Sequence 2 Sequence 3 Sequence 4 GG GG GTTT GGTT T G 1,,1,2,4 T 1,,3,6 1,,1 G 1, Für r n=5 Sequenzen gibt es 2,84x1 76 mögliche äume <-> < > tome im Universum: ~ Maximum Likelihood - Vorteile Mathematisch gut definiert Funktioniert gut in Simulationsexperimenten rlaubt explizite Verbindung von volutionsmodell und aten (Sequenzen) "Realistische" nnahmen zur volution Verschiedene Modelle und Stammbäume lassen sich testen 82

42 Maximum Likelihood - Nachteile Maximum likelihood ist nur konsistent (ergibt einen "wahren" Stammbaum) wenn die volution nach den gegebenen Modell ablief: Wie gut stimmt mein Modell mit den aten überein? omputertechnisch nicht zu lösen wenn zu viele Taxa oder Parameter berücksichtigt werden müssen. 83 Maximum Likelihood ei vielen Taxa sind computertechnisch nicht alle möglichen Stammbäume berechenbar für r n=5 Sequenzen gibt es 2,84x1 76 mögliche äume Lösung: "Intelligente lgorithmen" - Quartet puzzling - ayessche Methode + MMM 84 42

43 85 43

Grundlagen und Begriffe der molekularen Phylogenie

Grundlagen und Begriffe der molekularen Phylogenie Genomforschung und Sequenzanalyse inführung in Methoden der ioinformatik Molekulare Phylogenie II ernhard Lieb & Tom Hankeln WS 26/27 1 Themen Grundlagen und egriffe der molekularen Phylogenie volutionsmodelle

Mehr

Molekulare Phylogenie II

Molekulare Phylogenie II WS 2016/2017 Genomforschung und Sequenzanalyse - Einführung in Methoden der Bioinformatik- Thomas Hankeln Molekulare Phylogenie II 1 Stammbaumerstellung 1. Matrix-orientierte Methoden UPGM (Unweighted

Mehr

Genomforschung und Sequenzanalyse Einführung in Methoden der Bioinformatik. Bernhard Lieb & Tom Hankeln WS 2007/2008. Verwirrung?

Genomforschung und Sequenzanalyse Einführung in Methoden der Bioinformatik. Bernhard Lieb & Tom Hankeln WS 2007/2008. Verwirrung? Genomforschung und Sequenzanalyse Einführung in Methoden der ioinformatik Molekulare Phylogenie II ernhard Lieb & Tom Hankeln WS 2007/2008 1 Verwirrung? Erleuchtung 2 1 Korrekturmodelle Jukes & antor-modell

Mehr

Fernstudium "Molekulare Evolution" Bernhard Lieb Michael Schaffeld. Institut für Zoologie Universität Mainz

Fernstudium Molekulare Evolution Bernhard Lieb Michael Schaffeld. Institut für Zoologie Universität Mainz Fernstudium "Molekulare Evolution" ernhard Lieb Michael Schaffeld Institut für Zoologie Universität Mainz 1 Ziel des Kurses Wie erhalte ich aus meinen (Sequenz-) aten einen Stammbaum, und was sagt mir

Mehr

Einführung in die Bioinformatik

Einführung in die Bioinformatik Einführung in die Bioinformatik Ringvorlesung Biologie Sommer 07 Burkhard Morgenstern Institut für Mikrobiologie und Genetik Abteilung für Bioinformatik Goldschmidtstr. 1 Online Materialien zur Ringvorlesung:

Mehr

Zusammenfassung des 2. Abends

Zusammenfassung des 2. Abends lgorithmen in der iologie r. Hans-Joachim öckenhauer r. ennis Komm Zusammenfassung des. bends Zürich, 0. pril 0 lignment-verfahren Für einen Überblick über die lignment-lgorithmen zur estimmung der Ähnlichkeit

Mehr

Fernstudium "Molekulare Phylogenie" Bernhard Lieb Michael Schaffeld. Institut für Zoologie Universität Mainz

Fernstudium Molekulare Phylogenie Bernhard Lieb Michael Schaffeld. Institut für Zoologie Universität Mainz Fernstudium "Molekulare Phylogenie" Bernhard Lieb Michael Schaffeld Institut für Zoologie Universität Mainz 1 Ziel des Kurses Wie erhalte ich aus meinen (Sequenz-) Daten einen Stammbaum, und was sagt mir

Mehr

Einführung in die Angewandte Bioinformatik: Phylogenetik und Taxonomie

Einführung in die Angewandte Bioinformatik: Phylogenetik und Taxonomie Einführung in die Angewandte Bioinformatik: Phylogenetik und Taxonomie 24.06.2010 Prof. Dr. Sven Rahmann 1 Phylogenetik: Berechnung phylogenetischer Bäume Phylogenetik (phylum = Stamm): Rekonstruktion

Mehr

Evolutionary Trees: Distance Based

Evolutionary Trees: Distance Based Evolutionary Trees: Distance Based 1 Buftea Alexandru Laut der Evolutionstheorie findet in allen Organismen eine langsame Änderung statt (Evolution). Ein evolutionärer Baum, auch phylogenetischer Baum

Mehr

Algorithmische Bioinformatik

Algorithmische Bioinformatik lgorithmische ioinformatik istanzbasierte phylogenetische lgorithmen Ulf Leser Wissensmanagement in der ioinformatik Ziele dieser Vorlesung Verständnis von baum-artigen bstandsmaßen Grenzen reduktionistischer

Mehr

Welche Alignmentmethoden haben Sie bisher kennengelernt?

Welche Alignmentmethoden haben Sie bisher kennengelernt? Welche Alignmentmethoden haben Sie bisher kennengelernt? Was heißt optimal? Optimal = die wenigsten Mutationen. Sequenzen bestehen aus Elementen (z.b. Aminosäuren oder Nukleotide). Edit Distanzen sind

Mehr

Molekulare Phylogenie III

Molekulare Phylogenie III WS 2017/2018 Genomforschung und Sequenzanalyse - Einführung in Methoden der Bioinformatik- Thomas Hankeln Molekulare Phylogenie III 1 Charakter-orientierte Methoden 1. Maximum Parsimony (MP)! 2. Maximum

Mehr

Einführung in die evolutionäre Bioinformatik Alignmentalgorithmen, Profile, Phylogenetische Analysen

Einführung in die evolutionäre Bioinformatik Alignmentalgorithmen, Profile, Phylogenetische Analysen www.bachelor-and-more.de Einführung in die evolutionäre ioinformatik lignmentalgorithmen, Profile, Phylogenetische nalysen Evolutionsbiologie II für achelor-/lehramtsstudierende 16. Februar 216 Sonja Grath

Mehr

Molekulare Phylogenie III

Molekulare Phylogenie III WS 2018/2019 Genomforschung und Sequenzanalyse - Einführung in Methoden der Bioinformatik- Thomas Hankeln Molekulare Phylogenie III 1 Charakter-orientierte Methoden 1. Maximum Parsimony (MP)! 2. Maximum

Mehr

Rekonstruktion von Evolutionärer Geschichte

Rekonstruktion von Evolutionärer Geschichte Rekonstruktion von Evolutionärer Geschichte Populations- und Evolutionsbiologie 21.1.04 Florian Schiestl Phylogenetische Systematik Phylogenie: (gr. Phylum=Stamm) die Verwandtschaftsbeziehungen der Organismen,

Mehr

Bioinformatik. Character-basierte Verfahren Maximum Parsimony. Ulf Leser Wissensmanagement in der. Bioinformatik

Bioinformatik. Character-basierte Verfahren Maximum Parsimony. Ulf Leser Wissensmanagement in der. Bioinformatik ioinformatik Character-basierte Verfahren Maximum Parsimony Ulf Leser Wissensmanagement in der ioinformatik Ultrametriken 80 Millionen Jahre D C 00 Millionen Jahre 30 Millionen Jahre Wenn man den aum und

Mehr

Charakter-orientierte Methoden. 1. Maximum Parsimony (MP) 2. Maximum Likelihood (ML)

Charakter-orientierte Methoden. 1. Maximum Parsimony (MP) 2. Maximum Likelihood (ML) Genomforschung und Sequenzanalyse Einführung in Methoden der Bioinformatik Molekulare Phylogenie III Bernhard Lieb & Tom Hankeln WS 2007/2008 1 Charakter-orientierte Methoden 1. Maximum Parsimony (MP)

Mehr

Phylogenetik. Vorlesung Einführung in die Angewandte Bioinformatik Prof. Dr. Sven Rahmann. Webseite zur Vorlesung

Phylogenetik. Vorlesung Einführung in die Angewandte Bioinformatik Prof. Dr. Sven Rahmann. Webseite zur Vorlesung Phylogenetik Vorlesung Einführung in die Angewandte Bioinformatik Prof. Dr. Sven Rahmann Webseite zur Vorlesung http://bioinfo.wikidot.com/ Sprechstunde Mo 16-17 in OH14, R214 Sven.Rahmann -at- tu-dortmund.de

Mehr

Zentrum für Bioinformatik. Übung 4: Revision. Beispielfragen zur Klausur im Modul Angewandte Bioinformatik (erste Semesterhälfte)

Zentrum für Bioinformatik. Übung 4: Revision. Beispielfragen zur Klausur im Modul Angewandte Bioinformatik (erste Semesterhälfte) Andrew Torda Björn Hansen Iryna Bondarenko Zentrum für Bioinformatik Übung zur Vorlesung Angewandte Bioinformatik Sommersemester 2014 20./23.06.2014 Übung 4: Revision Beispielfragen zur Klausur im Modul

Mehr

MBI: Sequenzvergleich ohne Alignment

MBI: Sequenzvergleich ohne Alignment MBI: Sequenzvergleich ohne Alignment Bernhard Haubold 12. November 2013 Wiederholung Exaktes & inexaktes Matching Das exakte Matching Problem Naive Lösung Präprozessierung Muster(Pattern): Z-Algorithmus,

Mehr

Molekulare Phylogenie

Molekulare Phylogenie Molekulare Phylogenie Grundbegriffe Methoden der Stammbaum-Rekonstruktion Thomas Hankeln, Institut für Molekulargenetik SS 2010 Grundlagen der molekularen Phylogenie Evolution äußert sich durch Veränderungen

Mehr

Evolutionäre Bäume. Madox Sesen. 30. Juni 2014

Evolutionäre Bäume. Madox Sesen. 30. Juni 2014 Evolutionäre Bäume Madox Sesen 30. Juni 2014 1 Einleitung Phylogenetische Bäume sind ein wichtiges Darstellungsmittel der Evolutionsforschung. Durch sie werden Verwandtschaftsbeziehungen zwischen Spezies

Mehr

Evolutionsbiologie 1 Phylogenetik Sebastian Höhna

Evolutionsbiologie 1 Phylogenetik Sebastian Höhna Evolutionsbiologie 1 Phylogenetik Sebastian Höhna Division of Evolutionary Biology Ludwig-Maximilians Universität, München Phylogenese, Phylogenie, Phylogenetik Definition (Wikipedia): Phylogenese (altgriechisch

Mehr

Einführung in die Angewandte Bioinformatik: Multiples Alignment und Phylogenetik

Einführung in die Angewandte Bioinformatik: Multiples Alignment und Phylogenetik Einführung in die Angewandte Bioinformatik: Multiples Alignment und Phylogenetik 04.06.2009 Prof. Dr. Sven Rahmann 1 Bisher: Paarweise Alignments Optimales Alignment: Alignment mit höchstem Score unter

Mehr

Phylogenien und Methoden zu ihrer Rekonstruktion. Seminar Bioinformatik: Algorithmische und statistische Verfahren der strukturellen Genomanalyse

Phylogenien und Methoden zu ihrer Rekonstruktion. Seminar Bioinformatik: Algorithmische und statistische Verfahren der strukturellen Genomanalyse 1 Phylogenien und Methoden zu ihrer Rekonstruktion Seminar Bioinformatik: Algorithmische und statistische Verfahren der strukturellen Genomanalyse Übersicht 2 Geschichte und Beispiele Darwin und Kreationismus

Mehr

Wo waren wir stehen geblieben? Evolutions modelle

Wo waren wir stehen geblieben? Evolutions modelle Wo waren wir stehen geblieben? Evolutions modelle 1 Stammbaumerstellung 1. Distanz-orientierte Methoden UPGMA (Unweighted Pair-Group Method with Arithmetric Means) Neighbor-joining Minimal Evolution =>

Mehr

Part A: Eine Hypothese der Verwandtschaft von Primaten anhand von morphologischen Merkmalen

Part A: Eine Hypothese der Verwandtschaft von Primaten anhand von morphologischen Merkmalen Ihre Namen: Übung 3: Phylogenetik II: Übungsaufgaben This exercise will help youin dieser Übung werden Sie lernen: dass phylogenetische Bäume testbare Hyptohesen sind wie evolutionäry Abstammung anhand

Mehr

Bioinformatik. Einführung in die Phylogenie. Distanzbasierte phylogenetische Algorithmen. (lat.: phylum = Stamm) Ulf Leser Wissensmanagement in der

Bioinformatik. Einführung in die Phylogenie. Distanzbasierte phylogenetische Algorithmen. (lat.: phylum = Stamm) Ulf Leser Wissensmanagement in der ioinformatik Einführung in die Phylogenie (lat.: phylum = Stamm) istanzbasierte phylogenetische lgorithmen Ulf Leser Wissensmanagement in der ioinformatik LUSTL W: Grundaufbau Gegeben k Sequenzen rei Schritte

Mehr

Allgemeine Aufgabenstellung. Ziele

Allgemeine Aufgabenstellung. Ziele Allgemeine Aufgabenstellung Sie (s)wollen die Phylogenie der Vertebraten mit Hilfe molekulare Daten ergründen. Insbesondere interessiert Sie die Verwandtschaft der Primaten; aber auch tiefere Verzweigungen

Mehr

Phylogenetische Analyse

Phylogenetische Analyse Bioinformatik I - Uebung Phylogenetische Analyse Wenn nicht anders angegeben verwende die Standard-Einstellungen der Programme Hintergrund: Die Schwämme (Phylum Porifera) gehören zu den den ältesten lebenden

Mehr

Bioinformatik für Biochemiker

Bioinformatik für Biochemiker Bioinformatik für Biochemiker Oliver Kohlbacher WS 2009/2010 9. Multiples Alignment II Abt. Simulation biologischer Systeme WSI/ZBIT, Eberhard Karls Universität Tübingen Übersicht T-OFFEE Probleme bei

Mehr

Bioinformatik. Profilalignment und PSI Blast Center-Star Verfahren Progressives MSA CLUSTAL W. Ulf Leser Wissensmanagement in der.

Bioinformatik. Profilalignment und PSI Blast Center-Star Verfahren Progressives MSA CLUSTAL W. Ulf Leser Wissensmanagement in der. Bioinformatik Profilalignment und PSI Blast Center-Star Verfahren Progressives MS CLUSTL W Ulf Leser Wissensmanagement in der Bioinformatik Definition Bisher Immer Vergleich zweier Strings Jetzt Multipler

Mehr

Theorie-Teil: Aufgaben 1-3: 30 Punkte Programmier-Teil: Aufgaben 4-9: 60 Punkte

Theorie-Teil: Aufgaben 1-3: 30 Punkte Programmier-Teil: Aufgaben 4-9: 60 Punkte Hochschule RheinMain WS 2018/19 Prof. Dr. D. Lehmann Probe-Klausur zur Vorlesung Ökonometrie Theorie-Teil: Aufgaben 1-3: 30 Punkte Programmier-Teil: Aufgaben 4-9: 60 Punkte (die eigentliche Klausur wird

Mehr

Varianzkomponentenschätzung

Varianzkomponentenschätzung Qualitas AG Varianzkomponentenschätzung Peter von Rohr Qualitas AG Peter von Rohr Folien ZL I+II LFW C11 October 29, 2015 2 / 23 Multiple Lineare Regression Annahmen Modell y = Xb + e Varianz der Fehler

Mehr

Ihre Namen: Übung C: Phylogenetik I: Übungsaufgaben

Ihre Namen: Übung C: Phylogenetik I: Übungsaufgaben Ihre Namen: Übung C: Phylogenetik I: Übungsaufgaben Die heutige Übung dient dazu, phylogenetische Bäume für Sie verständlicher zu machen und Sie mit der Logik von phylogenetischen Analysen vertraut zu

Mehr

Gibbs sampling. Sebastian Pado. October 30, Seien X die Trainingdaten, y ein Testdatenpunkt, π die Parameter des Modells

Gibbs sampling. Sebastian Pado. October 30, Seien X die Trainingdaten, y ein Testdatenpunkt, π die Parameter des Modells Gibbs sampling Sebastian Pado October 30, 2012 1 Bayessche Vorhersage Seien X die Trainingdaten, y ein Testdatenpunkt, π die Parameter des Modells Uns interessiert P (y X), wobei wir über das Modell marginalisieren

Mehr

Discovering Frequent Substructures in Large Unordered Trees Unot

Discovering Frequent Substructures in Large Unordered Trees Unot Discovering Frequent Substructures in Large Unordered Trees Unot WS08/09 Prof. J. Fürnkranz 1 Inhalt Motivation asic Definitions Canonical Representation lgorithm Unot Overview Enumerating Pattern Compute

Mehr

R EKONSTRUKTION DER PHYLOGENESE

R EKONSTRUKTION DER PHYLOGENESE R EKONSTRUKTION DER PHYLOGENESE 19 tizieren sind (z. B. Eihüllen, Kiefer oder vier Extremitäten), denn sie teilen diese Merkmale mit den anderen Gruppen der Wirbeltiere. Bei jedem Taxon interessieren uns

Mehr

Quantifizierung evolutionärer Veränderungen

Quantifizierung evolutionärer Veränderungen Quantifizierung evolutionärer Veränderungen Begriff der Homologie/Homoplasie Methoden des Sequenzvergleichs/Alignments Verfahren und Modelle zur Berechnung von Austauschraten in DNA und Proteinen Thomas

Mehr

Standardbasierter, kompetenzorientierter Unterricht ZPG Biologie 2011 Bildungsplan 2004 Baden-Württemberg Sekundarstufe II - Evolution

Standardbasierter, kompetenzorientierter Unterricht ZPG Biologie 2011 Bildungsplan 2004 Baden-Württemberg Sekundarstufe II - Evolution Wie sich die Systematik unter dem lickwinkel der eszendenztheorie verändert ie Systematik ist ein Fachgebiet der iologie. In der Systematik werden Organismen klassifiziert, indem sie in ihrer Vielfalt

Mehr

Überblick. Überblick. Bayessche Entscheidungsregel. A-posteriori-Wahrscheinlichkeit (Beispiel) Wiederholung: Bayes-Klassifikator

Überblick. Überblick. Bayessche Entscheidungsregel. A-posteriori-Wahrscheinlichkeit (Beispiel) Wiederholung: Bayes-Klassifikator Überblick Grundlagen Einführung in die automatische Mustererkennung Grundlagen der Wahrscheinlichkeitsrechnung Klassifikation bei bekannter Wahrscheinlichkeitsverteilung Entscheidungstheorie Bayes-Klassifikator

Mehr

40. Algorithmus der Woche Das Travelling Salesman Problem oder die optimale Tour für den Nikolaus

40. Algorithmus der Woche Das Travelling Salesman Problem oder die optimale Tour für den Nikolaus 40. lgorithmus der Woche as Travelling Salesman Problem oder die optimale Tour für den Nikolaus utor Stefan Näher, Universität Trier as Problem des Handlungsreisenden as Travelling Salesman Problem (TSP)

Mehr

Forschungsstatistik II

Forschungsstatistik II Psychologie Prof. r. G. Meinhardt 6. Stock, Taubertsberg R. 06-06 (Persike) R. 06-3 (Meinhardt) Sprechstunde jederzeit nach Vereinbarung orschungsstatistik II r. Malte Persike persike@uni-mainz.de http://psymet03.sowi.uni-mainz.de/

Mehr

Statistik I für Betriebswirte Vorlesung 13

Statistik I für Betriebswirte Vorlesung 13 Statistik I für Betriebswirte Vorlesung 13 Prof. Dr. Hans-Jörg Starkloff TU Bergakademie Freiberg Institut für Stochastik 4. Juli 2016 Prof. Dr. Hans-Jörg Starkloff Statistik I für Betriebswirte Vorlesung

Mehr

Darwins Erben - Phylogenie und Bäume

Darwins Erben - Phylogenie und Bäume Vorlesung Einführung in die Bioinforma4k SoSe2011 Darwins Erben - Phylogenie und Bäume Prof. Daniel Huson ZBIT Center for Bioinformatics Center for Bioinformatics Charles Darwin und Bäume Darwin's Notizbuch

Mehr

BSc Bioinformatik Wintersemester 2013/2014 Nachklausur zur Statistik I Freie Universität Berlin

BSc Bioinformatik Wintersemester 2013/2014 Nachklausur zur Statistik I Freie Universität Berlin Sc ioinformatik Wintersemester 013/014 Nachklausur zur Statistik I Freie Universität erlin 4. pril 014 Matrikelnummer Nachname Vorname Unterschrift ufgabe 1 (4 Punkte): Zu einem Wahrscheinlichkeitsraum

Mehr

8.1 Einleitung. Grundlagen der Künstlichen Intelligenz. 8.1 Einleitung. 8.2 Lokale Suchverfahren. 8.3 Zusammenfassung. Suchprobleme: Überblick

8.1 Einleitung. Grundlagen der Künstlichen Intelligenz. 8.1 Einleitung. 8.2 Lokale Suchverfahren. 8.3 Zusammenfassung. Suchprobleme: Überblick Grundlagen der Künstlichen Intelligenz 5. April 0 8. Suchalgorithmen: Lokale Suche Grundlagen der Künstlichen Intelligenz 8. Suchalgorithmen: Lokale Suche 8.1 Einleitung Malte Helmert Universität Basel

Mehr

Wichtige Definitionen und Aussagen

Wichtige Definitionen und Aussagen Wichtige Definitionen und Aussagen Zufallsexperiment, Ergebnis, Ereignis: Unter einem Zufallsexperiment verstehen wir einen Vorgang, dessen Ausgänge sich nicht vorhersagen lassen Die möglichen Ausgänge

Mehr

Übersicht Datenstrukturen und Algorithmen. Übersicht. Probleme auf kantengewichteten Graphen. Vorlesung 14: Minimale Spannbäume

Übersicht Datenstrukturen und Algorithmen. Übersicht. Probleme auf kantengewichteten Graphen. Vorlesung 14: Minimale Spannbäume Übersicht atenstrukturen und lgorithmen Vorlesung : Prof. r. rika Ábrahám Theorie ybrider Systeme Informatik http://ths.rwth-aachen.de/teaching/ss-/ datenstrukturen-und-algorithmen/ 1 reedy lgorithmen

Mehr

HEUTE. Datenstrukturen im Computer. Datenstrukturen. Rekursion. Feedback Evaluation. abstrakte Datenstrukturen

HEUTE. Datenstrukturen im Computer. Datenstrukturen. Rekursion. Feedback Evaluation. abstrakte Datenstrukturen 9.2.5 HUT 9.2.5 3 atenstrukturen im omputer atenstrukturen ie beiden fundamentalen atenstrukturen in der Praxis sind rray und Liste Rekursion Feedback valuation rray Zugriff: schnell Umordnung: langsam

Mehr

Comperative Protein Structure Modelling of Genes and Genomes

Comperative Protein Structure Modelling of Genes and Genomes Comperative Protein Structure Modelling of Genes and Genomes Satisfaction of Spatial Restraints / Loop Modelling Nikolas Gross und Maximilian Miller Ludwig-Maximilians-Universität 29.11.2007 1 von 31 Table

Mehr

Bioinformatik für Biochemiker

Bioinformatik für Biochemiker Bioinformatik für Biochemiker Oliver Kohlbacher WS 2009/2010 9. Multiples Alignment II Abt. Simulation biologischer Systeme WSI/ZBIT, Eberhard Karls Universität Tübingen Übersicht T-COFFEE Probleme bei

Mehr

Map Matching. Problem: GPS-Punkte der Trajektorie weisen einen relativ großen Abstand zueinander auf.

Map Matching. Problem: GPS-Punkte der Trajektorie weisen einen relativ großen Abstand zueinander auf. Map Matching Problem: GPS-Punkte der Trajektorie weisen einen relativ großen Abstand zueinander auf. Ergebnis mit minimaler Fréchet-Distanz Annahme: Fahrer wählen bevorzugt kürzeste Wege im Straßennetz.

Mehr

Grundlagen der Statistik

Grundlagen der Statistik Grundlagen der Statistik Übung 6 2009 FernUniversität in Hagen Alle Rechte vorbehalten Fakultät für Wirtschaftswissenschaft Übersicht über die mit den insendeaufgaben geprüften Lehrzielgruppen Lehrzielgruppe:

Mehr

Konfidenzintervalle. Gesucht: U = U(X 1,..., X n ), O = O(X 1,..., X n ), sodass für das wahre θ gilt

Konfidenzintervalle. Gesucht: U = U(X 1,..., X n ), O = O(X 1,..., X n ), sodass für das wahre θ gilt Konfidenzintervalle Annahme: X 1,..., X n iid F θ. Gesucht: U = U(X 1,..., X n ), O = O(X 1,..., X n ), sodass für das wahre θ gilt P θ (U θ O) = 1 α, α (0, 1). Das Intervall [U, O] ist ein Konfidenzintervall

Mehr

Dynamische Systeme und Zeitreihenanalyse // Multivariate Normalverteilung und ML Schätzung 11 p.2/38

Dynamische Systeme und Zeitreihenanalyse // Multivariate Normalverteilung und ML Schätzung 11 p.2/38 Dynamische Systeme und Zeitreihenanalyse Multivariate Normalverteilung und ML Schätzung Kapitel 11 Statistik und Mathematik WU Wien Michael Hauser Dynamische Systeme und Zeitreihenanalyse // Multivariate

Mehr

Abiturvorbereitung Mathematik Stochastik. Copyright 2013 Ralph Werner

Abiturvorbereitung Mathematik Stochastik. Copyright 2013 Ralph Werner biturvorbereitung Mathematik Stochastik Copyright 2013 Ralph Werner Zufallsexperiment in Zufallsexperiment ist ein Vorgang, dessen usgang ungewiss ist das beliebig oft wiederholt werden kann dessen Wiederholungen

Mehr

Bivariater Zusammenhang bei metrischen Variablen: Regression und Korrelation

Bivariater Zusammenhang bei metrischen Variablen: Regression und Korrelation Bivariater Zusammenhang bei metrischen Variablen: Regression und Korrelation PEΣO 12. November 2001 Von der Tabellenanalyse zur Regression Die bivariate Verteilung zweier metrischer Variablen kann konzeptionell

Mehr

Struktur in der Bioinformatik

Struktur in der Bioinformatik Struktur in der Bioinformatik Rolf Backofen Lehrstuhl für Bioinformatik Institut für Informatik FS Jena Überblick Einführung nwendungsbeispiel: Selenoproteine Proteinfaltung Protein Docking c R. Backofen

Mehr

Frequentisten und Bayesianer. Volker Tresp

Frequentisten und Bayesianer. Volker Tresp Frequentisten und Bayesianer Volker Tresp 1 Frequentisten 2 Die W-Verteilung eines Datenmusters Nehmen wir an, dass die wahre Abhängigkeit linear ist, wir jedoch nur verrauschte Daten zur Verfügung haben

Mehr

Statistisches Testen

Statistisches Testen Statistisches Testen Universität Duisburg-Essen, Fak. 4, FG Instrumentelle Analytik 7. Juni 2007 Statistisches Testen Inhaltsverzeichnis Schätzverfahren und Testverfahren sind Anwendungen der Stichprobentheorie.

Mehr

Physik der sozio-ökonomischen Systeme mit dem Computer. 7. Vorlesung

Physik der sozio-ökonomischen Systeme mit dem Computer. 7. Vorlesung Physik der sozio-ökonomischen Systeme mit dem Computer PC-POOL RAUM 01.120 JOHANN WOLFGANG GOETHE UNIVERSITÄT 01.12.2017 7. Vorlesung MATTHIAS HANAUSKE FRANKFURT INSTITUTE FOR ADVANCED STUDIES JOHANN WOLFGANG

Mehr

Anpassungsrechnungen mit kleinsten Quadraten und Maximum Likelihood

Anpassungsrechnungen mit kleinsten Quadraten und Maximum Likelihood Anpassungsrechnungen mit kleinsten Quadraten und Maximum Likelihood Hauptseminar - Methoden der experimentellen Teilchenphysik WS 2011/2012 Fabian Hoffmann 2. Dezember 2011 Inhaltsverzeichnis 1 Einleitung

Mehr

Globalübungsaufgabe1 (All Pair Shortest Path):

Globalübungsaufgabe1 (All Pair Shortest Path): Prof. aa r. Ir. G. Woeginger atenstrukturen und lgorithmen SS7 Tutoriumslösung - Übung 0 (bgabe 2.07.207) T. Hartmann,. Korzeniewski,. Tauer Globalübungsaufgabe (ll Pair Shortest Path): etrachten Sie den

Mehr

Dr. Maike M. Burda. Welchen Einfluss hat die Körperhöhe auf das Körpergewicht? Eine Regressionsanalyse. HU Berlin, Econ Bootcamp

Dr. Maike M. Burda. Welchen Einfluss hat die Körperhöhe auf das Körpergewicht? Eine Regressionsanalyse. HU Berlin, Econ Bootcamp Dr. Maike M. Burda Welchen Einfluss hat die Körperhöhe auf das Körpergewicht? Eine Regressionsanalyse. HU Berlin, Econ Bootcamp 8.-10. Januar 2010 BOOTDATA.GDT: 250 Beobachtungen für die Variablen... cm:

Mehr

1 Einführung. 2 Grundlagen von Algorithmen. 3 Grundlagen von Datenstrukturen. 4 Grundlagen der Korrektheit von Algorithmen

1 Einführung. 2 Grundlagen von Algorithmen. 3 Grundlagen von Datenstrukturen. 4 Grundlagen der Korrektheit von Algorithmen Programm heute lgorithmen und atenstrukturen (für T/IT) Sommersemester 0 r. Tobias Lasser omputer ided Medical Procedures Technische Universität München inführung rundlagen von lgorithmen rundlagen von

Mehr

Prof. Dr. Margarita Esponda

Prof. Dr. Margarita Esponda Funktionale rogrammierung uffman-kodierung ildquelle: http://www.fim.uni-linz.ac.at/lva/echtlichespekte//tegano/bilder/huffman.gif Funktionale rogrammierung otivation ir möchten achrichten komprimieren:

Mehr

5. Bäume und Minimalgerüste

5. Bäume und Minimalgerüste 5. Bäume und Minimalgerüste Charakterisierung von Minimalgerüsten 5. Bäume und Minimalgerüste Definition 5.1. Es ein G = (V, E) ein zusammenhängender Graph. H = (V,E ) heißt Gerüst von G gdw. wenn H ein

Mehr

"Korrelation" bei Nominaldaten: Kontingenz

Korrelation bei Nominaldaten: Kontingenz "Korrelation" bei Nominaldaten: Kontingenz j 1 2 3 beobachtete Häufigkeiten (KSV Tabelle 6.3): i Augenfar be Haarfarb e blau braun grün 1 blond 42 1 6 2 braun 12 5 22 3 schwarz 0 26 2 4 rot 8 4 0 175 i

Mehr

Johann Wolfgang Goethe-Universität Frankfurt am Main

Johann Wolfgang Goethe-Universität Frankfurt am Main Johann Wolfgang Goethe-Universität Frankfurt am Main Fachbereich Biologie und Informatik (15) SS05 Seminar: Aktuelle Themen der Bioinformatik Phylogenie: Splits in the Neighborhood of a Tree A Classification

Mehr

Übungen zur Vorlesung Algorithmische Bioinformatik

Übungen zur Vorlesung Algorithmische Bioinformatik Übungen zur Vorlesung Algorithmische Bioinformatik Freie Universität Berlin, WS 2006/07 Utz J. Pape Johanna Ploog Hannes Luz Martin Vingron Blatt 6 Ausgabe am 27.11.2006 Abgabe am 4.12.2006 vor Beginn

Mehr

10. Übungsblatt zu Algorithmen I im SoSe 2016

10. Übungsblatt zu Algorithmen I im SoSe 2016 Karlsruher Institut für Technologie Institut für Theoretische Informatik Prof. r. ennis ofheinz Lukas arth, Lisa Kohl 0. Übungsblatt zu lgorithmen I im SoSe 0 https://crypto.iti.kit.edu/index.php?id=algo-sose

Mehr

Least Absolute Shrinkage And Seletion Operator (LASSO)

Least Absolute Shrinkage And Seletion Operator (LASSO) Least Absolute Shrinkage And Seletion Operator (LASSO) Peter von Rohr 20 März 2017 Lineare Modell und Least Squares Als Ausgangspunkt haben wir das Lineare Modell und Least Squares y = Xβ + ɛ (1) ˆβ =

Mehr

V3 - Multiples Sequenz Alignment und Phylogenie

V3 - Multiples Sequenz Alignment und Phylogenie V3 - Multiples Sequenz Alignment und Phylogenie Literatur: Kapitel 4 in Buch von David Mount Thioredoxin-Beispiel heute aus Buch von Arthur Lesk Softwarewerkzeuge der Bioinformatik 1 Definition von Homologie

Mehr

Übungsaufgaben zur Einführung in die Bioinformatik - Lösungen

Übungsaufgaben zur Einführung in die Bioinformatik - Lösungen 18.01.2013 Prof. P. Güntert 1 Vorlesung BPC I: Aspekte der Thermodynamik in der Strukturbiologie Übungsaufgaben zur Einführung in die Bioinformatik - Lösungen 1. Hamming und Levenshtein Distanzen a) Was

Mehr

WS2016/17 F1-Praktikum- Modul 7A Genomforschung und Sequenzanalyse: Einführung in Methoden der Bioinformatik AG Hankeln.

WS2016/17 F1-Praktikum- Modul 7A Genomforschung und Sequenzanalyse: Einführung in Methoden der Bioinformatik AG Hankeln. WS2016/17 F1-Praktikum- Modul 7A Genomforschung und Sequenzanalyse: Einführung in Methoden der Bioinformatik AG Hankeln Phylogenie Biologische Systematik umfasst... 1. Taxonomie! Bestimmung und Benennung

Mehr

Maximum Likelihood Modellierung von Zähldaten

Maximum Likelihood Modellierung von Zähldaten Student's Jour Fixe Lst. WI2, Uni Passau Student's Jour Fixe, 23. Juni 2008 Gliederung Maximum Likelihood Schätzung 1 Maximum Likelihood Schätzung Einfache diskrete Wahrscheinlichkeitsverteilung Herleitung

Mehr

Multiple Vergleiche. Werner Brannath. VO Biostatistik im WS 2006/2007

Multiple Vergleiche. Werner Brannath. VO Biostatistik im WS 2006/2007 Multiple Vergleiche Werner Brannath VO Biostatistik im WS 2006/2007 Inhalt Multiple Fehlerwahrscheinlichkeiten bei unabhängigen Tests bei Gruppenvergleichen mit einer One Way ANOVA Multiple Vergleichsverfahren

Mehr

Statistische Methoden

Statistische Methoden Modeling of Data / Maximum Likelyhood methods Institut für Experimentelle und Angewandte Physik Christian-Albrechts-Universität zu Kiel 22.05.2006 Datenmodellierung Messung vs Modell Optimierungsproblem:

Mehr

Entscheidungsbäume aus großen Datenbanken: SLIQ

Entscheidungsbäume aus großen Datenbanken: SLIQ Entscheidungsbäume aus großen Datenbanken: SLIQ C4.5 iteriert häufig über die Trainingsmenge Wie häufig? Wenn die Trainingsmenge nicht in den Hauptspeicher passt, wird das Swapping unpraktikabel! SLIQ:

Mehr

Bayesianische Netzwerke - Lernen und Inferenz

Bayesianische Netzwerke - Lernen und Inferenz Bayesianische Netzwerke - Lernen und Inferenz Manuela Hummel 9. Mai 2003 Gliederung 1. Allgemeines 2. Bayesianische Netzwerke zur Auswertung von Genexpressionsdaten 3. Automatische Modellselektion 4. Beispiel

Mehr

Lineare Algebra - Übungen 1 WS 2017/18

Lineare Algebra - Übungen 1 WS 2017/18 Prof. Dr. A. Maas Institut für Physik N A W I G R A Z Lineare Algebra - Übungen 1 WS 017/18 Aufgabe P1: Vektoren Präsenzaufgaben 19. Oktober 017 a) Zeichnen Sie die folgenden Vektoren: (0,0) T, (1,0) T,

Mehr

Wahrscheinlichkeitsrechnung und Statistik. 11. Vorlesung /2019

Wahrscheinlichkeitsrechnung und Statistik. 11. Vorlesung /2019 Wahrscheinlichkeitsrechnung und Statistik 11. Vorlesung - 2018/2019 Quantil der Ordnung α für die Verteilung des beobachteten Merkmals X ist der Wert z α R für welchen gilt z 1 2 heißt Median. P(X < z

Mehr

Verbesserung der dotplot Methode

Verbesserung der dotplot Methode erbesserung der dotplot Methode binäre Information: "x" oder " " besser: "mehr" oder "weniger" ähnlich Gruppen von Aminosäuren mit ähnlichen Eigenschaften bilden bestes Alignment: optimiere Häufigkeit

Mehr

Statistik II. Version A. 1. Klausur Sommersemester 2011 Hamburg, BITTE LESERLICH IN DRUCKBUCHSTABEN AUSFÜLLEN!

Statistik II. Version A. 1. Klausur Sommersemester 2011 Hamburg, BITTE LESERLICH IN DRUCKBUCHSTABEN AUSFÜLLEN! Statistik II Version A 1. Klausur Sommersemester 2011 Hamburg, 27.07.2011 BITTE LESERLICH IN DRUCKBUCHSTABEN AUSFÜLLEN! Nachname:............................................................................

Mehr

Sequenzen-Alignierung in der Bioinformatik. VO Algorithm Engineering Professor Dr. Petra Mutzel Lehrstuhl für Algorithm Engineering, LS11

Sequenzen-Alignierung in der Bioinformatik. VO Algorithm Engineering Professor Dr. Petra Mutzel Lehrstuhl für Algorithm Engineering, LS11 Sequenzen-Alignierung in der Bioinformatik VO Algorithm Engineering Professor Dr. Petra Mutzel Lehrstuhl für Algorithm Engineering, LS11 23. VO 24.01.2006 1 1 Literatur für diese VO Volker Heun: Skriptum

Mehr

Bioinformatik für Lebenswissenschaftler

Bioinformatik für Lebenswissenschaftler Bioinformatik für Lebenswissenschaftler Oliver Kohlbacher, Steffen Schmidt SS 2010 11. Hiden Markov Models & Phylogenien Abt. Simulation biologischer Systeme WSI/ZBIT, Eberhard Karls Universität Tübingen

Mehr

Stochastik (BSc D-MAVT / BSc D-MATH / BSc D-MATL)

Stochastik (BSc D-MAVT / BSc D-MATH / BSc D-MATL) Prof. Dr. M. Maathuis ETH Zürich Winter 2010 Stochastik (BSc D-MAVT / BSc D-MATH / BSc D-MATL) Schreiben Sie für Aufgabe 2-4 stets alle Zwischenschritte und -rechnungen sowie Begründungen auf. Aufgabe

Mehr

IQPNNI Moving fast through tree space and stopping in time. Unicyclic Networks: Compatibility and Enumeration

IQPNNI Moving fast through tree space and stopping in time. Unicyclic Networks: Compatibility and Enumeration IQPNNI Moving fast through tree space and stopping in time. : and Enumeration Aktuelle Themen der Bioinformatik SoSe 2006 Bärbel Lasitschka Motivation phylogenetic tree reconstruction basierend auf Sequenzdaten

Mehr

Bioinformatik für Lebenswissenschaftler

Bioinformatik für Lebenswissenschaftler Bioinformatik für Lebenswissenschaftler Oliver Kohlbacher, Steffen Schmidt SS 2010 11. Hiden Markov Models & Phylogenien Abt. Simulation biologischer Systeme WSI/ZBIT, Eberhard Karls Universität Tübingen

Mehr

Bayes-Netze (1) Lehrstuhl für Künstliche Intelligenz Institut für Informatik Friedrich-Alexander-Universität Erlangen-Nürnberg

Bayes-Netze (1) Lehrstuhl für Künstliche Intelligenz Institut für Informatik Friedrich-Alexander-Universität Erlangen-Nürnberg Bayes-Netze (1) Lehrstuhl für Künstliche Intelligenz Institut für Informatik Friedrich-Alexander-Universität Erlangen-Nürnberg (Lehrstuhl KI) Bayes-Netze (1) 1 / 22 Gliederung 1 Unsicheres Wissen 2 Schließen

Mehr

Statistik I. 1. Klausur Wintersemester 2010/2011 Hamburg, Art der Anmeldung: STiNE FlexNow Zulassung unter Vorbehalt

Statistik I. 1. Klausur Wintersemester 2010/2011 Hamburg, Art der Anmeldung: STiNE FlexNow Zulassung unter Vorbehalt Statistik I 1. Klausur Wintersemester 2010/2011 Hamburg, 11.02.2011 BITTE LESERLICH IN DRUCKBUCHSTABEN AUSFÜLLEN! Nachname:............................................................................ Vorname:.............................................................................

Mehr

5.4 Hierarchische Verfahren

5.4 Hierarchische Verfahren Ziel Grundlagen Konstruktion einer Hierarchie von lustern (meist repräsentiert durch ein sog. Dendrogramm), ) so dass immer die luster mit minimaler i Distanz verschmolzen werden Dendrogramm ein Baum,

Mehr

Bayesianische Modellwahl. Helga Wagner Bayes Statistik WS 2010/11 161

Bayesianische Modellwahl. Helga Wagner Bayes Statistik WS 2010/11 161 Bayesianische Modellwahl Helga Wagner Bayes Statistik WS 2010/11 161 Modellwahl Problem der Modellwahl: Welches von K möglichen Modellen M 1,...,M K ist für die Daten y am besten geeignet? Klassisch: LQ-Test

Mehr

Huffman-Kodierung. Prof. Dr. Margarita Esponda

Huffman-Kodierung. Prof. Dr. Margarita Esponda uffman-kodierung rof. r. argarita sponda otivation ir möchten achrichten komprimieren: - peicherplatzreduzierung => nergie und Zeit bei Übertragung sparen - ohne nformationsverlust - mit einer effizienten

Mehr

Matrizen. Stefan Keppeler. 28. November Mathematik I für Biologen, Geowissenschaftler und Geoökologen

Matrizen. Stefan Keppeler. 28. November Mathematik I für Biologen, Geowissenschaftler und Geoökologen Mathematik I für Biologen, Geowissenschaftler und Geoökologen Matrizen 28. November 2007 Summe & Produkt Beispiel: Einwohnerzahlen Beispiel Addition Multiplikation Inverse Addition & Multiplikation Anwendung

Mehr