Verwirrung? Erleuchtung. Molekulare. Phylogenie II. Genomforschung und Sequenzanalyse Einführung in Methoden der Bioinformatik
|
|
- Erna Zimmermann
- vor 5 Jahren
- Abrufe
Transkript
1 Genomforschung und Sequenzanalyse inführung in Methoden der ioinformatik Molekulare Phylogenie II ernhard Lieb & Tom Hankeln WS 26/27 1 Verwirrung? rleuchtung 2 1
2 Was bisher geschah... aten lignment istanzmatrix lustalx, ialign volutionsmodell JTT, PM, LOSUM... Stammbaum 3 Korrektur der istanzen % tatsächlicher bstand = nzahl der Mutationen Korrektur beobachteter bstand t 4 2
3 volutions modelle 5 volutionsmodelle Globuläre Proteine Transmembran-Proteine 6 3
4 Variationen der Substitutionsraten shape-parameter α Häufigkeit α=,5 α=2 α=5 α=1 α=5 Kategorien Substitutionsrate 7 ModelTest, ProtTest, FindModel 8 4
5 istanzmatrix erechnen des paarweisen bstands Sequenz 1,,236,621,72 1,51 Sequenz 2,,599,672 1,482 Sequenz 3,,112 1,561 Sequenz 4, 1,425 Sequenz 5, usgedrückt i.d.r. als Mutationen pro Position bstand kann > 1 werden! sp. Jukes-antor: 3 4 K = ln 1 p p =.6 => K = Stammbaumerstellung Wie kommen wir von einer istanzmatrix zu einem Stammbaum? => lgorithmus berechnet aus den istanzen den besten Stammbaum Sequenzen selbst werden nicht mehr berücksichtigt 1 5
6 UPGM Unweighted Pair-Group Method with rithmetric Means =3 3 3 d + d 2 d + d 2 / / / / =5, / 11 UPGM Unweighted Pair-Group Method with rithmetric Means // Sequenz // Sequenz nimmt konstante volutionsraten an ußengruppe wird automatisch bestimmt
7 UPGM Unweighted Pair-Group Method with rithmetric Means dditive oder "lustering" lustering"-methode: s werden durch sequenzielles lustern nach absteigender Ähnlichkeit gruppiert. 13 UPGM Unweighted Pair-Group Method with rithmetric Means usgangsmatrix rekonstruierte Matrix UPGM setzt absolute molekulare Uhr voraus, aber in Realität müssen volutionsraten berücksichtigt werden 14 7
8 Fitch-Margoliash lgorithmus Ähnlicher lgorithmus wie UPGM Sukzessives Gruppieren der Taxa ohne Verlust eines stlängenunterschiedes Keine molekulare Uhr zur estimmung der stlängen: 15 Fitch-Margoliash lgorithmus 3 Taxa (1) b a (3) c c (2) istanzen bekannt, aber stlängen nicht klar => 2 Unbekannte (a, b); 1 Konstante (c) => z.. aus der ifferenz von (3) und (2) => Unterschied der Äste errechenbar => uflösen nach b => insetzen in (1) inzelabstände (1) = a+b = 22 (2) = a+c = 39 (3) - (2) (3) = b+c = a-b = 39 = -2 -b = -2-a b= 2+a a+a+2 = 22 2a = 22-2 a=
9 Fitch-Margoliash lgorithmus 3 Taxa (a): 1 (b): 12 (c): 29 b=12 c=29 a=1 17 Fitch-Margoliash lgorithmus 5 Taxa b c f a g 1 1 d und geringste istanz urschnittswert aus bilden 3.Taxon erechung der stlängen und Neue Matrix e :2 / / / / usw 18 9
10 Fitch-Margoliash lgorithmus wenn die einzelnen volutionsraten (stärker) variieren, dann doch lieber Neighbor-joining 19 Neighbor-joining (NJ) Saitou und Nai, 1987 Ähnlicher lgorithmus wie UPGM bzw. FM Sukzessives Gruppieren der Taxa ohne Verlust eines stlängenunterschiedes unrooted tree oder ungewurzelter aum (radial) Keine molekulare Uhr esonders sinnvoll, wenn volutionsraten der verschiedenen Linien unterschiedlich sind Minimierung der Gesamt-stlängen des aums => Stammbaum wird aufgelöst 2 1
11 a b e Neighbor-joining (NJ) Star-tree S = ( d ji )/N-1 i j d c S = Summe aller stlängen d = istanzen zwischen allen s S =78,5 S =a+b+c+d+e a Paare werden kombiniert ber: Welche Paare werden kombiniert? Ziel N=nzahl NJ der => s Minimierung der Summe aller stlängen modified Star-tree S mn = [( d im +d in )/2(N-2)]+d mn /2+ d ij /N-2 i und j alle Sequenzen ausser m und n, wobei i<j S =67,7 S =81 S =76 S =7 b f e d c 21 Neighbor-joining (NJ) Star tree -> aumlänge modified Star-tree Grouping -> aumlängen stlängen -> FM b c f Neues taxon () -> neue Matrix a d e Grouping -> aumlängen stlängen -> FM Neues taxon -> neue Matrix Neues taxon (XY) -> neue Matrix Grouping stlängen Neues taxon -> aumlängen -> FM -> neue Matrix 22 11
12 Neighbor-joining (NJ) rrechnen der Summe aller istanzen, durchschnittlicher istanzen einer Gruppe und z.. (S +S )/N-2 Summe Summe errechnen der istanzunterschiede ( rate corrected distance ) z.. =d (S +S )/N-2 Summe Summe ,3-47, ,3-57, ,3-57,3-6,6-6, Grouping 23 Neighbor-joining (NJ) rrechnen der stlängen durch FM b=12 X a=
13 usgangsmatrix Neighbor-joining (NJ) Summe Summe rstellen einer reduzierten atenmatrix liminierung der istanzen d X = (d d X + d d X )/2 <=> ( )/2 = 29 Summe Summe erechnen der stlängen nach FM Und so weiter.. 12 X 1 25 Neighbor-joining (NJ) final tree b=12 c=9 c f=2 a=1 g= e=6 d=
14 Neighbor-joining (NJ) Sequenzen Neighbor-joining Multiples lignment volutionsmodell istanzberechnung Stammbaumberechnung UPGM rgebnisüberprüfung 27 Neighbor-joining (NJ) UPGM setzt absolute molekulare Uhr voraus, aber in Realität müssen volutionsraten berücksichtigt werden Salamander Zebrafisch Lachs Zebrafisch Salamander Lachs nte UPGM vs NJ nte Gans Gans Huhn!bootstrap Taube? Taube Huhn Krokodil Krokodil lligator lligator Schildkröte Schildkröte Wal Wal Mensch Mensch.5 -> long branch attraction
15 Weitere istanzmethoden Least-squares-Methode Fehler (bweichung) mit der n Sequenzen auf einen aum gepasst werden K ij korrigierte Wert der istanz e (istanzmatrixwert) zwischen i und j P ij Länge des stes, der i und j verbindet = 1 i, j i < j < n ( Kij Pij ) 2 Minimum volution aum aus n Sequenzen besitzt 2n-3 Zweige Jeder Zweig z hat Länge l Summe dieser Zweiglängen ist die Länge des aumes = minimal Nach der LS-Formel wird dann die bweichung der stlängen von den istanzen minimiert L = 2n 3 lz z = 1 29 Was bisher geschah... aten lignment istanzmatrix Stammbaum lustalx, ialign volutionsmodell JTT, PM, LOSUM... lgorithmus z. UPGM; NJ NJ FM LS M UPGM 3 15
16 Stammbaumerstellung 1. Matrix-orientierte Methoden 2. harakter-orientierte Methoden Maximum Parsimony Maximum Likelihood 31 harakter-orientierte Methoden 1. Maximum Parsimony (MP) 2. Maximum Likelihood (ML) rbeiten direkt mit dem lignment xtrahieren mehr Information als Matrix-orientierte Methoden 32 16
17 Was sind haraktere? kontinuierliche oder diskontinuierliche igenschaften. 1,2,3,4... = kontinuierliche haraktere,t,g, = diskontinuierliche haraktere Nukleotide und minosäuren können als diskrete, diskontinuierliche haraktere behandelt werden. er phylogenetische Stammbaum wird anhand des Musters der Änderungen der haraktere berechnet 33 Maximum Parsimony (MP) Methode des "maximalen Geizes" bzw. der "maximalen Sparsamkeit" ntwickelt für morphologische haraktere 195 Grundzüge einer Theorie der phylogenetischen Systematik Willi Hennig
18 Maximum Parsimony William of Ockham ( ) nnahme: volution ging den kürzesten Weg Ockham's razor : "Pluralitas non est ponenda sine neccesitate" ("Ohne Notwendigkeit soll keine Vielfältigkeit hinzugefügt werden") =>minimalistische Ökonomieprinzipien kürzester Stammbaum wird berechnet, d.h. der die wenigsten evolutiven Schritten benötigt Schritte = Änderungen von harakteren 35 Maximum Parsimony rklärung mit morphologischen harakteren Gleiche Prinzipien sind für Sequenzen (asenpaare, minosäuren) gültig 36 18
19 Maximum Parsimony pomorphie: bgeleiteter harakter. Synapomorpie: bgeleiteter harakter, welcher mehreren Taxa gemeinsam ist. Plesiomorphie: Primitiver harakter. Symplesiomorphie:Primitiver harakter, welcher mehreren Taxa gemeinsam ist. Synapomorphie Symplesiomorphie Nur Synapomorphien sind in MP zu verwerten! 37 Synapomorphie eispiel Haare: Haare sind in der volution nur einmal entstanden..h., der esitz von Haaren ist ein synapomorphes Merkmal der Säugetiere. idechse Mensch Haare Frosch Änderung Hund fehlt vorhanden Synapomorphie = "richtige" Information 38 19
20 Homoplasie Unabhängige volution Homoplasie ist Übereinstimmung ohne Homologie (d.h., keine gemeinsame bstammung) Homoplasie resultiert aus unabhängiger volution (Konvergenz, Reversion) Homoplasie ist falsche Information, die zu falschen Stammbäumen führen kann MP ist anfällig für Homoplasie 39 Homoplasie-Konvergenz eispiel Schwanz: Schwanz ging unabhängig in den Fröschen und beim Menschen verloren. idechse Frosch Mensch Hund Schwanz fehlt vorhanden 4 2
21 Homoplasie Konvergenz eispiel Schwanz: Wenn Homoplasie unberücksichtigt bleibt, wird ein falscher Stammbaum abgeleitet. idechse Mensch Schwanz Hund Frosch fehlt vorhanden Maß für Homoplasie:.I. = onsistancy Index; I=m/s m: kleinste mögliche theoretische Schrittzahl s: tatsächliche Schrittzahl homoplastisch I<1 nwendung auf Sequenzen Nukleotide und minosäuren sind diskrete, diskontinuierliche haraktere 4 (Nukleotide) bzw. 2 (minosäuren) haraktere Lücken ("gaps") können als 5. bzw. 21. harakter behandelt werden 42 21
22 Maximum Parsimony eispiel: Position Sequenz G G T G G G T G G G T T G G T G 3 mögliche Stammbäume ((,),(,)) ((,),(,)) ((,),(,)) 43 Maximum Parsimony Welche Positionen sind informativ, bevorzugen also eine bestimmte Topologie? Position Sequenz G G T G G G T G G G T T G G T G 3 Positionen invariabel => nicht informativ 44 22
23 Maximum Parsimony Position Sequenz G G T G G G T G G G T T G G T G 6 Positionen sind variabel => aber auch informativ? 45 Maximum Parsimony Position Sequenz G G T G G G T G G G T T G G T G 3 Positionen sind zwar variabel, aber nicht informativ 46 23
24 Maximum Parsimony Welche Positionen sind aber nun informativ? Position Sequenz G G T G - G G T G G - G G T T G G G T G G * * * * => nur 3 von 9 Positionen sind informativ, d.h., favorisieren eine best. Topologie. => Indels sind haraktere! 47 Maximum Parsimony Position Sequenz G G T G G G T G G G T T G G T G ((,),(,)) ((,),(,)) ((,),(,)) Position 3: G G G? Position 5: Position 9: G G G G G G G G G G G G G G 48 24
25 Maximum Parsimony Position Sequenz G G T G G G T G G G T T G G T G * * * 3 mögliche Stammbäume 1 Mutationen 15 Mutationen 14 Mutationen 49 Maximum Parsimony ber: Ort der Mutation nicht immer eindeutig definiert => Parsimony kann keine stlängen berechnen. 1 Mutationen Position Sequenz G G T G G G T G G G T T G G T G = = =... 1 Mutationen 1 Mutationen 5 25
26 Maximum Parsimony Proteinparsimony: 1. Modell (z.. PUP): lle Substitutionen sind gleich wahrscheinlich (1 Schritt). eispiel Ile -> Trp Ile -> Met Ile -> la Modell: liegt genetischen ode zugrunde, wobei "silent site mutations" ignoriert werden (PROTPRS-Modell in PHYLIP). eispiel: Ile -> Met: T//T -> TG: ein Schritt Ile -> la: T//T -> GN: zwei Schritte Ile -> Trp: T//T -> TGG: drei Schritte 51 Maximum Parsimony xhaustive = lle Stammbäume werden untersucht, der beste Stammbaum wird erhalten (garantiert). ranch-and-ound = inige Stammbäume werden berechnet, bester Stammbaum garantiert. Heuristic = inige Stammbäume werden berechnet, bester Stammbaum nicht garantiert
27 Maximum Parsimony xhaustive = lle Stammbäume werden untersucht, der beste Stammbaum wird erhalten (garantiert). xhaustive search: rschöpfung garantiert 53 Maximum Parsimony: xhaustive Search "ranch addition (1) Start: 3 beliebige Taxa + 4. Taxon () in jeder möglichen Position -> 3 äume (2a) (2b) (2c) + 5. Taxon () in jeder der fünf möglichen Positionen => 15 Stammbäume etc
28 Maximum Parsimony: xhaustive Search Problem: nzahl der möglichen Stammbäume Number of s Number of rooted trees Number of unrooted trees => bei > ~1 Sequenzen ausführliche Suche aller Stammbäume de facto unmöglich 55 Maximum Parsimony 1. Lösung "ranch and bound": Stammbaum wird mit schneller Methode (z.. NJ) berechnet, die nzahl der notwendigen Schritte (L) wird berechnet. => verwirft Gruppen von äumen, die nicht kürzer werden können als L. Kann für Problemlösungen mit < ~ 2 Taxa verwendet werden
29 Maximum Parsimony abzweigen und beenden branch and bound 57 Maximum Parsimony 2. Lösung: Heuristische Verfahren: stepwise addition drei Taxa aum schrittweise ddition auf allen nächsten benen (großes Problem: lokale Maxima) star decomposition : star tree schrittweiser bbau von Taxa bzw. Zusammenführung und valuation (großes Problem: lokale Maxima) Kombination mit anderen lgorithmen branch swapping (Zweige vertauschen): Nearest neighbor interchange (NNI) Subtree pruning and regrafting (SPR) Tree bisection and reconnection (TR) 58 29
30 Maximum Parsimony Nearest neighbor interchange (NNI) Nachbarschaftstausch F G F G F G 59 Maximum Parsimony Subtree pruning and regrafting (SPR) stverpflanzung F G F G 6 3
31 Maximum Parsimony Tree bisection and reconnection (TR) aumschnittwiederverknüpfung (effektiv) F G G F F G Gutes urchmischen, aber PU aufwendig 61 Maximum Parsimony Problem: Lokale Maxima?! stepwise addition" star decomposition auminsel 62 31
32 Parsimony Ratchet urch zwischenzeitliche inführung einer veränderten Matrix wird man aus einem lokalen Maximum herauskatapultiert Programme wie: NON, TNT, PRP Weitere Parsimony -Verfahren: Wagner (binäre haraktere), ollo (gewichtet) und Fitch (unordered multistate characters, N) 63 Maximum Parsimony Vorteile: einfach ohne konkretes volutionsmodell rrechnung ancestraler Positionen funktioniert gut mit konsistenten atensätzen Nachteile: empfindlich gegen Homoplasien (Konvergenz) empfindlich gegen "Long ranch ttraction" stlängen werden unterschätzt kein volutionsmodell möglich! 64 32
33 harakter-orientierte Methoden 1. Maximum Parsimony (MP) 2. Maximum Likelihood (ML) 65 Maximum Likelihood The explanation that makes the observed outcome the most likely L = P( H) Wahrscheinlichkeit der aten, gegeben eine Hypothese iehypotheeisteineaumtopologie,dessen stlängen und ein volutionsmodell unter dessen Präsenz die aten evolvierten Zum ersten mal von avalli-sforza and dwards (1967) für gene frequency data benutzt, später (1981) von Felsenstein für N Sequenzen 66 33
34 Probability and likelihood ie Wahrscheinlichkeit liegt immer zwischen NI () und SIHR (1). ie bedingte Wahrscheinlichkeit ist die Wahrscheinlichkeit eines reignisses, gegeben das reignis : P( )....if probability allows us to predict unknown outcomes based on known parameters P(H ), then likelihood allows us to determine unknown parameters based on known outcomes P( H). 67 Likelihood Hypothese reignisse sind unabhängig lle Kopfwürfe besitzen gleiche UNKNNT Kopfwahrscheinlichkeit p aten: KKZKZKKZZZ L = P(aten Hypothese ) => Likelihood L( H) = pp(1-p)(1-p)p(1-p)pp(1-p)(1-p)(1-p) Keine Verteilung, Plot der selben aten (KKZKZKKZZZ) gegen verschiedene Werte von p (Hypothese) => Mit welcher Kopfwahrscheinlichkeit p bekomme ich am ehesten diese aten? Likelihood,,2,4,6,8 1, [p] 68 34
35 Maximum Likelihood L = P(data hypothesis) Wahrscheinlichkeit der beobachteten aten (Sequenzen!) im Lichte der Hypothese (Stammbaum). d.h, es wird der Stammbaum errechnet, der die beobachteten aten (also die alignierten Sequenzen) am besten (unter der nnahme des Modells) erklärt. volutionsmodell in aum wird generiert und man prüft dann ob die gegebenen aten den aum generieren könnenk 69 Maximum Likelihood benötigt ein explizites volutionsmodell Parameter werden aus aten + Modell errechnet. xplizite Verbindung aten + Modell + Stammbaum. aber: schlechtes Modell => schlechter Stammbaum lternative Stammbäume lassen sich testen => keine Methode extrahiert mehr Information aus den aten; aber: sehr rechenintensiv 7 35
36 Maximum Likelihood volutionsmodelle Für N-Sequenzen: => J, K2P, F81, HKY, RV Für Protein-Sequenzen: => PM, LOSUM, JTT, WG Maximum Likelihood Seq1 GG Seq2 GG Seq3 GTT Seq4 GGTG Frage: Wie hoch ist die Wahrscheinlichkeit, dass der Stammbaum für die aten (Sequenzen) unter dem gegebenen Modell verantwortlich ist? 72 36
37 Maximum Likelihood 1 GG 2 GG 3 GTT 4 GGT j GT?? GT 4 x 4 Möglichkeiten ie Wahrscheinlichkeit für eine best. Position j ist die Summe der inzelwahrscheinlichkeiten aller möglichen ancestralen Nukleotide unter dem gegebenen Modell. 73 ML eispiel (vereinfacht): aten: Modell (nicht realistisch): T G 1,1,1,1 T 1,1,1 1,1 G
38 ML - eispiel: Stammbaum : X,Y =, T, G, oder X Y ML: Summe der 4 x 4 inzelwahrscheinlichkeiten 75 ML - eispiel: 1. Topologie, immer gleich für unterschiedliche Knoten! Stammbaum 1: Stammbaum 2: T 1 x 1 x,1 x 1 x 1 =,1 1 x 1 x,1 x,1 x,1 =,1 usw... Summe aus 16 möglichen Stammbäumen! 76 38
39 ML - eispiel: 2. Topologie (andere Topologie)! ber immer gleich für unterschiedliche Knoten! Stammbaum 1: Stammbaum 2: T,1 x,1 x 1 x,1 x 1 =,1 1 x,1 x,1 x,1 x,1 =,1 usw... usw..usw Summe aus 16 möglichen Stammbäumen! 77 ML - eispiel: Summe der Wahrscheinlichkeiten der inzelbäume => Likelihood Stammbaum : Stammbaum : Wahrscheinlichkeit": =,12427 => logl = -,9563 Wahrscheinlichkeit": =,232 => logl = -1,
40 Maximum Likelihood 1 GG 2 GG 3 GTT 4 GGTG i....z Wahrscheinlichkeit des Stammbaums ist das Produkt aller Wahrscheinlichkeiten für jede Position: ML- Stammbaum = Stammbaum mit größter "Likelihood" Maximum Likelihood Sequence 1 Sequence 2 Sequence 3 Sequence 4 GG GG GTTT GGTT X,Y =, T, G, oder T G 1,,1,2,4 T 1,,3,6 1,,1 G 1, erechnen Likelihood einer aller Möglichkeiten vorgegebenen Topologie für eine ist das Produkt aller 1x1x1x,1x,1=,1 Topologie und eine Wahrscheinlichkeiten Position jeder Position 8 4
41 Maximum Likelihood Likelihood für alle anderen Topologien und Vergleich der Likelihoods L = P(data hypothesis) Sequence 1 Sequence 2 Sequence 3 Sequence 4 GG GG GTTT GGTT T G 1,,1,2,4 T 1,,3,6 1,,1 G 1, Für r n=5 Sequenzen gibt es 2,84x1 76 mögliche äume <-> < > tome im Universum: ~ Maximum Likelihood - Vorteile Mathematisch gut definiert Funktioniert gut in Simulationsexperimenten rlaubt explizite Verbindung von volutionsmodell und aten (Sequenzen) "Realistische" nnahmen zur volution Verschiedene Modelle und Stammbäume lassen sich testen 82
42 Maximum Likelihood - Nachteile Maximum likelihood ist nur konsistent (ergibt einen "wahren" Stammbaum) wenn die volution nach den gegebenen Modell ablief: Wie gut stimmt mein Modell mit den aten überein? omputertechnisch nicht zu lösen wenn zu viele Taxa oder Parameter berücksichtigt werden müssen. 83 Maximum Likelihood ei vielen Taxa sind computertechnisch nicht alle möglichen Stammbäume berechenbar für r n=5 Sequenzen gibt es 2,84x1 76 mögliche äume Lösung: "Intelligente lgorithmen" - Quartet puzzling - ayessche Methode + MMM 84 42
43 85 43
Grundlagen und Begriffe der molekularen Phylogenie
Genomforschung und Sequenzanalyse inführung in Methoden der ioinformatik Molekulare Phylogenie II ernhard Lieb & Tom Hankeln WS 26/27 1 Themen Grundlagen und egriffe der molekularen Phylogenie volutionsmodelle
MehrMolekulare Phylogenie II
WS 2016/2017 Genomforschung und Sequenzanalyse - Einführung in Methoden der Bioinformatik- Thomas Hankeln Molekulare Phylogenie II 1 Stammbaumerstellung 1. Matrix-orientierte Methoden UPGM (Unweighted
MehrGenomforschung und Sequenzanalyse Einführung in Methoden der Bioinformatik. Bernhard Lieb & Tom Hankeln WS 2007/2008. Verwirrung?
Genomforschung und Sequenzanalyse Einführung in Methoden der ioinformatik Molekulare Phylogenie II ernhard Lieb & Tom Hankeln WS 2007/2008 1 Verwirrung? Erleuchtung 2 1 Korrekturmodelle Jukes & antor-modell
MehrFernstudium "Molekulare Evolution" Bernhard Lieb Michael Schaffeld. Institut für Zoologie Universität Mainz
Fernstudium "Molekulare Evolution" ernhard Lieb Michael Schaffeld Institut für Zoologie Universität Mainz 1 Ziel des Kurses Wie erhalte ich aus meinen (Sequenz-) aten einen Stammbaum, und was sagt mir
MehrEinführung in die Bioinformatik
Einführung in die Bioinformatik Ringvorlesung Biologie Sommer 07 Burkhard Morgenstern Institut für Mikrobiologie und Genetik Abteilung für Bioinformatik Goldschmidtstr. 1 Online Materialien zur Ringvorlesung:
MehrZusammenfassung des 2. Abends
lgorithmen in der iologie r. Hans-Joachim öckenhauer r. ennis Komm Zusammenfassung des. bends Zürich, 0. pril 0 lignment-verfahren Für einen Überblick über die lignment-lgorithmen zur estimmung der Ähnlichkeit
MehrFernstudium "Molekulare Phylogenie" Bernhard Lieb Michael Schaffeld. Institut für Zoologie Universität Mainz
Fernstudium "Molekulare Phylogenie" Bernhard Lieb Michael Schaffeld Institut für Zoologie Universität Mainz 1 Ziel des Kurses Wie erhalte ich aus meinen (Sequenz-) Daten einen Stammbaum, und was sagt mir
MehrEinführung in die Angewandte Bioinformatik: Phylogenetik und Taxonomie
Einführung in die Angewandte Bioinformatik: Phylogenetik und Taxonomie 24.06.2010 Prof. Dr. Sven Rahmann 1 Phylogenetik: Berechnung phylogenetischer Bäume Phylogenetik (phylum = Stamm): Rekonstruktion
MehrEvolutionary Trees: Distance Based
Evolutionary Trees: Distance Based 1 Buftea Alexandru Laut der Evolutionstheorie findet in allen Organismen eine langsame Änderung statt (Evolution). Ein evolutionärer Baum, auch phylogenetischer Baum
MehrAlgorithmische Bioinformatik
lgorithmische ioinformatik istanzbasierte phylogenetische lgorithmen Ulf Leser Wissensmanagement in der ioinformatik Ziele dieser Vorlesung Verständnis von baum-artigen bstandsmaßen Grenzen reduktionistischer
MehrWelche Alignmentmethoden haben Sie bisher kennengelernt?
Welche Alignmentmethoden haben Sie bisher kennengelernt? Was heißt optimal? Optimal = die wenigsten Mutationen. Sequenzen bestehen aus Elementen (z.b. Aminosäuren oder Nukleotide). Edit Distanzen sind
MehrMolekulare Phylogenie III
WS 2017/2018 Genomforschung und Sequenzanalyse - Einführung in Methoden der Bioinformatik- Thomas Hankeln Molekulare Phylogenie III 1 Charakter-orientierte Methoden 1. Maximum Parsimony (MP)! 2. Maximum
MehrEinführung in die evolutionäre Bioinformatik Alignmentalgorithmen, Profile, Phylogenetische Analysen
www.bachelor-and-more.de Einführung in die evolutionäre ioinformatik lignmentalgorithmen, Profile, Phylogenetische nalysen Evolutionsbiologie II für achelor-/lehramtsstudierende 16. Februar 216 Sonja Grath
MehrMolekulare Phylogenie III
WS 2018/2019 Genomforschung und Sequenzanalyse - Einführung in Methoden der Bioinformatik- Thomas Hankeln Molekulare Phylogenie III 1 Charakter-orientierte Methoden 1. Maximum Parsimony (MP)! 2. Maximum
MehrRekonstruktion von Evolutionärer Geschichte
Rekonstruktion von Evolutionärer Geschichte Populations- und Evolutionsbiologie 21.1.04 Florian Schiestl Phylogenetische Systematik Phylogenie: (gr. Phylum=Stamm) die Verwandtschaftsbeziehungen der Organismen,
MehrBioinformatik. Character-basierte Verfahren Maximum Parsimony. Ulf Leser Wissensmanagement in der. Bioinformatik
ioinformatik Character-basierte Verfahren Maximum Parsimony Ulf Leser Wissensmanagement in der ioinformatik Ultrametriken 80 Millionen Jahre D C 00 Millionen Jahre 30 Millionen Jahre Wenn man den aum und
MehrCharakter-orientierte Methoden. 1. Maximum Parsimony (MP) 2. Maximum Likelihood (ML)
Genomforschung und Sequenzanalyse Einführung in Methoden der Bioinformatik Molekulare Phylogenie III Bernhard Lieb & Tom Hankeln WS 2007/2008 1 Charakter-orientierte Methoden 1. Maximum Parsimony (MP)
MehrPhylogenetik. Vorlesung Einführung in die Angewandte Bioinformatik Prof. Dr. Sven Rahmann. Webseite zur Vorlesung
Phylogenetik Vorlesung Einführung in die Angewandte Bioinformatik Prof. Dr. Sven Rahmann Webseite zur Vorlesung http://bioinfo.wikidot.com/ Sprechstunde Mo 16-17 in OH14, R214 Sven.Rahmann -at- tu-dortmund.de
MehrZentrum für Bioinformatik. Übung 4: Revision. Beispielfragen zur Klausur im Modul Angewandte Bioinformatik (erste Semesterhälfte)
Andrew Torda Björn Hansen Iryna Bondarenko Zentrum für Bioinformatik Übung zur Vorlesung Angewandte Bioinformatik Sommersemester 2014 20./23.06.2014 Übung 4: Revision Beispielfragen zur Klausur im Modul
MehrMBI: Sequenzvergleich ohne Alignment
MBI: Sequenzvergleich ohne Alignment Bernhard Haubold 12. November 2013 Wiederholung Exaktes & inexaktes Matching Das exakte Matching Problem Naive Lösung Präprozessierung Muster(Pattern): Z-Algorithmus,
MehrMolekulare Phylogenie
Molekulare Phylogenie Grundbegriffe Methoden der Stammbaum-Rekonstruktion Thomas Hankeln, Institut für Molekulargenetik SS 2010 Grundlagen der molekularen Phylogenie Evolution äußert sich durch Veränderungen
MehrEvolutionäre Bäume. Madox Sesen. 30. Juni 2014
Evolutionäre Bäume Madox Sesen 30. Juni 2014 1 Einleitung Phylogenetische Bäume sind ein wichtiges Darstellungsmittel der Evolutionsforschung. Durch sie werden Verwandtschaftsbeziehungen zwischen Spezies
MehrEvolutionsbiologie 1 Phylogenetik Sebastian Höhna
Evolutionsbiologie 1 Phylogenetik Sebastian Höhna Division of Evolutionary Biology Ludwig-Maximilians Universität, München Phylogenese, Phylogenie, Phylogenetik Definition (Wikipedia): Phylogenese (altgriechisch
MehrEinführung in die Angewandte Bioinformatik: Multiples Alignment und Phylogenetik
Einführung in die Angewandte Bioinformatik: Multiples Alignment und Phylogenetik 04.06.2009 Prof. Dr. Sven Rahmann 1 Bisher: Paarweise Alignments Optimales Alignment: Alignment mit höchstem Score unter
MehrPhylogenien und Methoden zu ihrer Rekonstruktion. Seminar Bioinformatik: Algorithmische und statistische Verfahren der strukturellen Genomanalyse
1 Phylogenien und Methoden zu ihrer Rekonstruktion Seminar Bioinformatik: Algorithmische und statistische Verfahren der strukturellen Genomanalyse Übersicht 2 Geschichte und Beispiele Darwin und Kreationismus
MehrWo waren wir stehen geblieben? Evolutions modelle
Wo waren wir stehen geblieben? Evolutions modelle 1 Stammbaumerstellung 1. Distanz-orientierte Methoden UPGMA (Unweighted Pair-Group Method with Arithmetric Means) Neighbor-joining Minimal Evolution =>
MehrPart A: Eine Hypothese der Verwandtschaft von Primaten anhand von morphologischen Merkmalen
Ihre Namen: Übung 3: Phylogenetik II: Übungsaufgaben This exercise will help youin dieser Übung werden Sie lernen: dass phylogenetische Bäume testbare Hyptohesen sind wie evolutionäry Abstammung anhand
MehrBioinformatik. Einführung in die Phylogenie. Distanzbasierte phylogenetische Algorithmen. (lat.: phylum = Stamm) Ulf Leser Wissensmanagement in der
ioinformatik Einführung in die Phylogenie (lat.: phylum = Stamm) istanzbasierte phylogenetische lgorithmen Ulf Leser Wissensmanagement in der ioinformatik LUSTL W: Grundaufbau Gegeben k Sequenzen rei Schritte
MehrAllgemeine Aufgabenstellung. Ziele
Allgemeine Aufgabenstellung Sie (s)wollen die Phylogenie der Vertebraten mit Hilfe molekulare Daten ergründen. Insbesondere interessiert Sie die Verwandtschaft der Primaten; aber auch tiefere Verzweigungen
MehrPhylogenetische Analyse
Bioinformatik I - Uebung Phylogenetische Analyse Wenn nicht anders angegeben verwende die Standard-Einstellungen der Programme Hintergrund: Die Schwämme (Phylum Porifera) gehören zu den den ältesten lebenden
MehrBioinformatik für Biochemiker
Bioinformatik für Biochemiker Oliver Kohlbacher WS 2009/2010 9. Multiples Alignment II Abt. Simulation biologischer Systeme WSI/ZBIT, Eberhard Karls Universität Tübingen Übersicht T-OFFEE Probleme bei
MehrBioinformatik. Profilalignment und PSI Blast Center-Star Verfahren Progressives MSA CLUSTAL W. Ulf Leser Wissensmanagement in der.
Bioinformatik Profilalignment und PSI Blast Center-Star Verfahren Progressives MS CLUSTL W Ulf Leser Wissensmanagement in der Bioinformatik Definition Bisher Immer Vergleich zweier Strings Jetzt Multipler
MehrTheorie-Teil: Aufgaben 1-3: 30 Punkte Programmier-Teil: Aufgaben 4-9: 60 Punkte
Hochschule RheinMain WS 2018/19 Prof. Dr. D. Lehmann Probe-Klausur zur Vorlesung Ökonometrie Theorie-Teil: Aufgaben 1-3: 30 Punkte Programmier-Teil: Aufgaben 4-9: 60 Punkte (die eigentliche Klausur wird
MehrVarianzkomponentenschätzung
Qualitas AG Varianzkomponentenschätzung Peter von Rohr Qualitas AG Peter von Rohr Folien ZL I+II LFW C11 October 29, 2015 2 / 23 Multiple Lineare Regression Annahmen Modell y = Xb + e Varianz der Fehler
MehrIhre Namen: Übung C: Phylogenetik I: Übungsaufgaben
Ihre Namen: Übung C: Phylogenetik I: Übungsaufgaben Die heutige Übung dient dazu, phylogenetische Bäume für Sie verständlicher zu machen und Sie mit der Logik von phylogenetischen Analysen vertraut zu
MehrGibbs sampling. Sebastian Pado. October 30, Seien X die Trainingdaten, y ein Testdatenpunkt, π die Parameter des Modells
Gibbs sampling Sebastian Pado October 30, 2012 1 Bayessche Vorhersage Seien X die Trainingdaten, y ein Testdatenpunkt, π die Parameter des Modells Uns interessiert P (y X), wobei wir über das Modell marginalisieren
MehrDiscovering Frequent Substructures in Large Unordered Trees Unot
Discovering Frequent Substructures in Large Unordered Trees Unot WS08/09 Prof. J. Fürnkranz 1 Inhalt Motivation asic Definitions Canonical Representation lgorithm Unot Overview Enumerating Pattern Compute
MehrR EKONSTRUKTION DER PHYLOGENESE
R EKONSTRUKTION DER PHYLOGENESE 19 tizieren sind (z. B. Eihüllen, Kiefer oder vier Extremitäten), denn sie teilen diese Merkmale mit den anderen Gruppen der Wirbeltiere. Bei jedem Taxon interessieren uns
MehrQuantifizierung evolutionärer Veränderungen
Quantifizierung evolutionärer Veränderungen Begriff der Homologie/Homoplasie Methoden des Sequenzvergleichs/Alignments Verfahren und Modelle zur Berechnung von Austauschraten in DNA und Proteinen Thomas
MehrStandardbasierter, kompetenzorientierter Unterricht ZPG Biologie 2011 Bildungsplan 2004 Baden-Württemberg Sekundarstufe II - Evolution
Wie sich die Systematik unter dem lickwinkel der eszendenztheorie verändert ie Systematik ist ein Fachgebiet der iologie. In der Systematik werden Organismen klassifiziert, indem sie in ihrer Vielfalt
MehrÜberblick. Überblick. Bayessche Entscheidungsregel. A-posteriori-Wahrscheinlichkeit (Beispiel) Wiederholung: Bayes-Klassifikator
Überblick Grundlagen Einführung in die automatische Mustererkennung Grundlagen der Wahrscheinlichkeitsrechnung Klassifikation bei bekannter Wahrscheinlichkeitsverteilung Entscheidungstheorie Bayes-Klassifikator
Mehr40. Algorithmus der Woche Das Travelling Salesman Problem oder die optimale Tour für den Nikolaus
40. lgorithmus der Woche as Travelling Salesman Problem oder die optimale Tour für den Nikolaus utor Stefan Näher, Universität Trier as Problem des Handlungsreisenden as Travelling Salesman Problem (TSP)
MehrForschungsstatistik II
Psychologie Prof. r. G. Meinhardt 6. Stock, Taubertsberg R. 06-06 (Persike) R. 06-3 (Meinhardt) Sprechstunde jederzeit nach Vereinbarung orschungsstatistik II r. Malte Persike persike@uni-mainz.de http://psymet03.sowi.uni-mainz.de/
MehrStatistik I für Betriebswirte Vorlesung 13
Statistik I für Betriebswirte Vorlesung 13 Prof. Dr. Hans-Jörg Starkloff TU Bergakademie Freiberg Institut für Stochastik 4. Juli 2016 Prof. Dr. Hans-Jörg Starkloff Statistik I für Betriebswirte Vorlesung
MehrDarwins Erben - Phylogenie und Bäume
Vorlesung Einführung in die Bioinforma4k SoSe2011 Darwins Erben - Phylogenie und Bäume Prof. Daniel Huson ZBIT Center for Bioinformatics Center for Bioinformatics Charles Darwin und Bäume Darwin's Notizbuch
MehrBSc Bioinformatik Wintersemester 2013/2014 Nachklausur zur Statistik I Freie Universität Berlin
Sc ioinformatik Wintersemester 013/014 Nachklausur zur Statistik I Freie Universität erlin 4. pril 014 Matrikelnummer Nachname Vorname Unterschrift ufgabe 1 (4 Punkte): Zu einem Wahrscheinlichkeitsraum
Mehr8.1 Einleitung. Grundlagen der Künstlichen Intelligenz. 8.1 Einleitung. 8.2 Lokale Suchverfahren. 8.3 Zusammenfassung. Suchprobleme: Überblick
Grundlagen der Künstlichen Intelligenz 5. April 0 8. Suchalgorithmen: Lokale Suche Grundlagen der Künstlichen Intelligenz 8. Suchalgorithmen: Lokale Suche 8.1 Einleitung Malte Helmert Universität Basel
MehrWichtige Definitionen und Aussagen
Wichtige Definitionen und Aussagen Zufallsexperiment, Ergebnis, Ereignis: Unter einem Zufallsexperiment verstehen wir einen Vorgang, dessen Ausgänge sich nicht vorhersagen lassen Die möglichen Ausgänge
MehrÜbersicht Datenstrukturen und Algorithmen. Übersicht. Probleme auf kantengewichteten Graphen. Vorlesung 14: Minimale Spannbäume
Übersicht atenstrukturen und lgorithmen Vorlesung : Prof. r. rika Ábrahám Theorie ybrider Systeme Informatik http://ths.rwth-aachen.de/teaching/ss-/ datenstrukturen-und-algorithmen/ 1 reedy lgorithmen
MehrHEUTE. Datenstrukturen im Computer. Datenstrukturen. Rekursion. Feedback Evaluation. abstrakte Datenstrukturen
9.2.5 HUT 9.2.5 3 atenstrukturen im omputer atenstrukturen ie beiden fundamentalen atenstrukturen in der Praxis sind rray und Liste Rekursion Feedback valuation rray Zugriff: schnell Umordnung: langsam
MehrComperative Protein Structure Modelling of Genes and Genomes
Comperative Protein Structure Modelling of Genes and Genomes Satisfaction of Spatial Restraints / Loop Modelling Nikolas Gross und Maximilian Miller Ludwig-Maximilians-Universität 29.11.2007 1 von 31 Table
MehrBioinformatik für Biochemiker
Bioinformatik für Biochemiker Oliver Kohlbacher WS 2009/2010 9. Multiples Alignment II Abt. Simulation biologischer Systeme WSI/ZBIT, Eberhard Karls Universität Tübingen Übersicht T-COFFEE Probleme bei
MehrMap Matching. Problem: GPS-Punkte der Trajektorie weisen einen relativ großen Abstand zueinander auf.
Map Matching Problem: GPS-Punkte der Trajektorie weisen einen relativ großen Abstand zueinander auf. Ergebnis mit minimaler Fréchet-Distanz Annahme: Fahrer wählen bevorzugt kürzeste Wege im Straßennetz.
MehrGrundlagen der Statistik
Grundlagen der Statistik Übung 6 2009 FernUniversität in Hagen Alle Rechte vorbehalten Fakultät für Wirtschaftswissenschaft Übersicht über die mit den insendeaufgaben geprüften Lehrzielgruppen Lehrzielgruppe:
MehrKonfidenzintervalle. Gesucht: U = U(X 1,..., X n ), O = O(X 1,..., X n ), sodass für das wahre θ gilt
Konfidenzintervalle Annahme: X 1,..., X n iid F θ. Gesucht: U = U(X 1,..., X n ), O = O(X 1,..., X n ), sodass für das wahre θ gilt P θ (U θ O) = 1 α, α (0, 1). Das Intervall [U, O] ist ein Konfidenzintervall
MehrDynamische Systeme und Zeitreihenanalyse // Multivariate Normalverteilung und ML Schätzung 11 p.2/38
Dynamische Systeme und Zeitreihenanalyse Multivariate Normalverteilung und ML Schätzung Kapitel 11 Statistik und Mathematik WU Wien Michael Hauser Dynamische Systeme und Zeitreihenanalyse // Multivariate
MehrAbiturvorbereitung Mathematik Stochastik. Copyright 2013 Ralph Werner
biturvorbereitung Mathematik Stochastik Copyright 2013 Ralph Werner Zufallsexperiment in Zufallsexperiment ist ein Vorgang, dessen usgang ungewiss ist das beliebig oft wiederholt werden kann dessen Wiederholungen
MehrBivariater Zusammenhang bei metrischen Variablen: Regression und Korrelation
Bivariater Zusammenhang bei metrischen Variablen: Regression und Korrelation PEΣO 12. November 2001 Von der Tabellenanalyse zur Regression Die bivariate Verteilung zweier metrischer Variablen kann konzeptionell
MehrStruktur in der Bioinformatik
Struktur in der Bioinformatik Rolf Backofen Lehrstuhl für Bioinformatik Institut für Informatik FS Jena Überblick Einführung nwendungsbeispiel: Selenoproteine Proteinfaltung Protein Docking c R. Backofen
MehrFrequentisten und Bayesianer. Volker Tresp
Frequentisten und Bayesianer Volker Tresp 1 Frequentisten 2 Die W-Verteilung eines Datenmusters Nehmen wir an, dass die wahre Abhängigkeit linear ist, wir jedoch nur verrauschte Daten zur Verfügung haben
MehrStatistisches Testen
Statistisches Testen Universität Duisburg-Essen, Fak. 4, FG Instrumentelle Analytik 7. Juni 2007 Statistisches Testen Inhaltsverzeichnis Schätzverfahren und Testverfahren sind Anwendungen der Stichprobentheorie.
MehrPhysik der sozio-ökonomischen Systeme mit dem Computer. 7. Vorlesung
Physik der sozio-ökonomischen Systeme mit dem Computer PC-POOL RAUM 01.120 JOHANN WOLFGANG GOETHE UNIVERSITÄT 01.12.2017 7. Vorlesung MATTHIAS HANAUSKE FRANKFURT INSTITUTE FOR ADVANCED STUDIES JOHANN WOLFGANG
MehrAnpassungsrechnungen mit kleinsten Quadraten und Maximum Likelihood
Anpassungsrechnungen mit kleinsten Quadraten und Maximum Likelihood Hauptseminar - Methoden der experimentellen Teilchenphysik WS 2011/2012 Fabian Hoffmann 2. Dezember 2011 Inhaltsverzeichnis 1 Einleitung
MehrGlobalübungsaufgabe1 (All Pair Shortest Path):
Prof. aa r. Ir. G. Woeginger atenstrukturen und lgorithmen SS7 Tutoriumslösung - Übung 0 (bgabe 2.07.207) T. Hartmann,. Korzeniewski,. Tauer Globalübungsaufgabe (ll Pair Shortest Path): etrachten Sie den
MehrDr. Maike M. Burda. Welchen Einfluss hat die Körperhöhe auf das Körpergewicht? Eine Regressionsanalyse. HU Berlin, Econ Bootcamp
Dr. Maike M. Burda Welchen Einfluss hat die Körperhöhe auf das Körpergewicht? Eine Regressionsanalyse. HU Berlin, Econ Bootcamp 8.-10. Januar 2010 BOOTDATA.GDT: 250 Beobachtungen für die Variablen... cm:
Mehr1 Einführung. 2 Grundlagen von Algorithmen. 3 Grundlagen von Datenstrukturen. 4 Grundlagen der Korrektheit von Algorithmen
Programm heute lgorithmen und atenstrukturen (für T/IT) Sommersemester 0 r. Tobias Lasser omputer ided Medical Procedures Technische Universität München inführung rundlagen von lgorithmen rundlagen von
MehrProf. Dr. Margarita Esponda
Funktionale rogrammierung uffman-kodierung ildquelle: http://www.fim.uni-linz.ac.at/lva/echtlichespekte//tegano/bilder/huffman.gif Funktionale rogrammierung otivation ir möchten achrichten komprimieren:
Mehr5. Bäume und Minimalgerüste
5. Bäume und Minimalgerüste Charakterisierung von Minimalgerüsten 5. Bäume und Minimalgerüste Definition 5.1. Es ein G = (V, E) ein zusammenhängender Graph. H = (V,E ) heißt Gerüst von G gdw. wenn H ein
Mehr"Korrelation" bei Nominaldaten: Kontingenz
"Korrelation" bei Nominaldaten: Kontingenz j 1 2 3 beobachtete Häufigkeiten (KSV Tabelle 6.3): i Augenfar be Haarfarb e blau braun grün 1 blond 42 1 6 2 braun 12 5 22 3 schwarz 0 26 2 4 rot 8 4 0 175 i
MehrJohann Wolfgang Goethe-Universität Frankfurt am Main
Johann Wolfgang Goethe-Universität Frankfurt am Main Fachbereich Biologie und Informatik (15) SS05 Seminar: Aktuelle Themen der Bioinformatik Phylogenie: Splits in the Neighborhood of a Tree A Classification
MehrÜbungen zur Vorlesung Algorithmische Bioinformatik
Übungen zur Vorlesung Algorithmische Bioinformatik Freie Universität Berlin, WS 2006/07 Utz J. Pape Johanna Ploog Hannes Luz Martin Vingron Blatt 6 Ausgabe am 27.11.2006 Abgabe am 4.12.2006 vor Beginn
Mehr10. Übungsblatt zu Algorithmen I im SoSe 2016
Karlsruher Institut für Technologie Institut für Theoretische Informatik Prof. r. ennis ofheinz Lukas arth, Lisa Kohl 0. Übungsblatt zu lgorithmen I im SoSe 0 https://crypto.iti.kit.edu/index.php?id=algo-sose
MehrLeast Absolute Shrinkage And Seletion Operator (LASSO)
Least Absolute Shrinkage And Seletion Operator (LASSO) Peter von Rohr 20 März 2017 Lineare Modell und Least Squares Als Ausgangspunkt haben wir das Lineare Modell und Least Squares y = Xβ + ɛ (1) ˆβ =
MehrV3 - Multiples Sequenz Alignment und Phylogenie
V3 - Multiples Sequenz Alignment und Phylogenie Literatur: Kapitel 4 in Buch von David Mount Thioredoxin-Beispiel heute aus Buch von Arthur Lesk Softwarewerkzeuge der Bioinformatik 1 Definition von Homologie
MehrÜbungsaufgaben zur Einführung in die Bioinformatik - Lösungen
18.01.2013 Prof. P. Güntert 1 Vorlesung BPC I: Aspekte der Thermodynamik in der Strukturbiologie Übungsaufgaben zur Einführung in die Bioinformatik - Lösungen 1. Hamming und Levenshtein Distanzen a) Was
MehrWS2016/17 F1-Praktikum- Modul 7A Genomforschung und Sequenzanalyse: Einführung in Methoden der Bioinformatik AG Hankeln.
WS2016/17 F1-Praktikum- Modul 7A Genomforschung und Sequenzanalyse: Einführung in Methoden der Bioinformatik AG Hankeln Phylogenie Biologische Systematik umfasst... 1. Taxonomie! Bestimmung und Benennung
MehrMaximum Likelihood Modellierung von Zähldaten
Student's Jour Fixe Lst. WI2, Uni Passau Student's Jour Fixe, 23. Juni 2008 Gliederung Maximum Likelihood Schätzung 1 Maximum Likelihood Schätzung Einfache diskrete Wahrscheinlichkeitsverteilung Herleitung
MehrMultiple Vergleiche. Werner Brannath. VO Biostatistik im WS 2006/2007
Multiple Vergleiche Werner Brannath VO Biostatistik im WS 2006/2007 Inhalt Multiple Fehlerwahrscheinlichkeiten bei unabhängigen Tests bei Gruppenvergleichen mit einer One Way ANOVA Multiple Vergleichsverfahren
MehrStatistische Methoden
Modeling of Data / Maximum Likelyhood methods Institut für Experimentelle und Angewandte Physik Christian-Albrechts-Universität zu Kiel 22.05.2006 Datenmodellierung Messung vs Modell Optimierungsproblem:
MehrEntscheidungsbäume aus großen Datenbanken: SLIQ
Entscheidungsbäume aus großen Datenbanken: SLIQ C4.5 iteriert häufig über die Trainingsmenge Wie häufig? Wenn die Trainingsmenge nicht in den Hauptspeicher passt, wird das Swapping unpraktikabel! SLIQ:
MehrBayesianische Netzwerke - Lernen und Inferenz
Bayesianische Netzwerke - Lernen und Inferenz Manuela Hummel 9. Mai 2003 Gliederung 1. Allgemeines 2. Bayesianische Netzwerke zur Auswertung von Genexpressionsdaten 3. Automatische Modellselektion 4. Beispiel
MehrLineare Algebra - Übungen 1 WS 2017/18
Prof. Dr. A. Maas Institut für Physik N A W I G R A Z Lineare Algebra - Übungen 1 WS 017/18 Aufgabe P1: Vektoren Präsenzaufgaben 19. Oktober 017 a) Zeichnen Sie die folgenden Vektoren: (0,0) T, (1,0) T,
MehrWahrscheinlichkeitsrechnung und Statistik. 11. Vorlesung /2019
Wahrscheinlichkeitsrechnung und Statistik 11. Vorlesung - 2018/2019 Quantil der Ordnung α für die Verteilung des beobachteten Merkmals X ist der Wert z α R für welchen gilt z 1 2 heißt Median. P(X < z
MehrVerbesserung der dotplot Methode
erbesserung der dotplot Methode binäre Information: "x" oder " " besser: "mehr" oder "weniger" ähnlich Gruppen von Aminosäuren mit ähnlichen Eigenschaften bilden bestes Alignment: optimiere Häufigkeit
MehrStatistik II. Version A. 1. Klausur Sommersemester 2011 Hamburg, BITTE LESERLICH IN DRUCKBUCHSTABEN AUSFÜLLEN!
Statistik II Version A 1. Klausur Sommersemester 2011 Hamburg, 27.07.2011 BITTE LESERLICH IN DRUCKBUCHSTABEN AUSFÜLLEN! Nachname:............................................................................
MehrSequenzen-Alignierung in der Bioinformatik. VO Algorithm Engineering Professor Dr. Petra Mutzel Lehrstuhl für Algorithm Engineering, LS11
Sequenzen-Alignierung in der Bioinformatik VO Algorithm Engineering Professor Dr. Petra Mutzel Lehrstuhl für Algorithm Engineering, LS11 23. VO 24.01.2006 1 1 Literatur für diese VO Volker Heun: Skriptum
MehrBioinformatik für Lebenswissenschaftler
Bioinformatik für Lebenswissenschaftler Oliver Kohlbacher, Steffen Schmidt SS 2010 11. Hiden Markov Models & Phylogenien Abt. Simulation biologischer Systeme WSI/ZBIT, Eberhard Karls Universität Tübingen
MehrStochastik (BSc D-MAVT / BSc D-MATH / BSc D-MATL)
Prof. Dr. M. Maathuis ETH Zürich Winter 2010 Stochastik (BSc D-MAVT / BSc D-MATH / BSc D-MATL) Schreiben Sie für Aufgabe 2-4 stets alle Zwischenschritte und -rechnungen sowie Begründungen auf. Aufgabe
MehrIQPNNI Moving fast through tree space and stopping in time. Unicyclic Networks: Compatibility and Enumeration
IQPNNI Moving fast through tree space and stopping in time. : and Enumeration Aktuelle Themen der Bioinformatik SoSe 2006 Bärbel Lasitschka Motivation phylogenetic tree reconstruction basierend auf Sequenzdaten
MehrBioinformatik für Lebenswissenschaftler
Bioinformatik für Lebenswissenschaftler Oliver Kohlbacher, Steffen Schmidt SS 2010 11. Hiden Markov Models & Phylogenien Abt. Simulation biologischer Systeme WSI/ZBIT, Eberhard Karls Universität Tübingen
MehrBayes-Netze (1) Lehrstuhl für Künstliche Intelligenz Institut für Informatik Friedrich-Alexander-Universität Erlangen-Nürnberg
Bayes-Netze (1) Lehrstuhl für Künstliche Intelligenz Institut für Informatik Friedrich-Alexander-Universität Erlangen-Nürnberg (Lehrstuhl KI) Bayes-Netze (1) 1 / 22 Gliederung 1 Unsicheres Wissen 2 Schließen
MehrStatistik I. 1. Klausur Wintersemester 2010/2011 Hamburg, Art der Anmeldung: STiNE FlexNow Zulassung unter Vorbehalt
Statistik I 1. Klausur Wintersemester 2010/2011 Hamburg, 11.02.2011 BITTE LESERLICH IN DRUCKBUCHSTABEN AUSFÜLLEN! Nachname:............................................................................ Vorname:.............................................................................
Mehr5.4 Hierarchische Verfahren
Ziel Grundlagen Konstruktion einer Hierarchie von lustern (meist repräsentiert durch ein sog. Dendrogramm), ) so dass immer die luster mit minimaler i Distanz verschmolzen werden Dendrogramm ein Baum,
MehrBayesianische Modellwahl. Helga Wagner Bayes Statistik WS 2010/11 161
Bayesianische Modellwahl Helga Wagner Bayes Statistik WS 2010/11 161 Modellwahl Problem der Modellwahl: Welches von K möglichen Modellen M 1,...,M K ist für die Daten y am besten geeignet? Klassisch: LQ-Test
MehrHuffman-Kodierung. Prof. Dr. Margarita Esponda
uffman-kodierung rof. r. argarita sponda otivation ir möchten achrichten komprimieren: - peicherplatzreduzierung => nergie und Zeit bei Übertragung sparen - ohne nformationsverlust - mit einer effizienten
MehrMatrizen. Stefan Keppeler. 28. November Mathematik I für Biologen, Geowissenschaftler und Geoökologen
Mathematik I für Biologen, Geowissenschaftler und Geoökologen Matrizen 28. November 2007 Summe & Produkt Beispiel: Einwohnerzahlen Beispiel Addition Multiplikation Inverse Addition & Multiplikation Anwendung
Mehr