Fernstudium "Molekulare Phylogenie" Bernhard Lieb Michael Schaffeld. Institut für Zoologie Universität Mainz

Größe: px
Ab Seite anzeigen:

Download "Fernstudium "Molekulare Phylogenie" Bernhard Lieb Michael Schaffeld. Institut für Zoologie Universität Mainz"

Transkript

1 Fernstudium "Molekulare Phylogenie" Bernhard Lieb Michael Schaffeld Institut für Zoologie Universität Mainz 1

2 Ziel des Kurses Wie erhalte ich aus meinen (Sequenz-) Daten einen Stammbaum, und was sagt mir dieser? Sequenz 1 Sequenz 1: KIADKNFTYRHHNQLV Sequenz 4 Sequenz 2: KVAEKNMTFRRFNDII Sequenz 3: KIADKDFTYRHW-QLV Sequenz 2 Sequenz 4: KVADKNFSYRHHNNVV Sequenz 3 Sequenz 5: KLADKQFTFRHH-QLV Sequenz 5 2

3 Programm Datenbanken Sequenzalignment Stammbaumerstellung Statistische Auswertung 3

4 Warum Phylogenie? Weshalb ist das Verständnis von phylogenetischen Zusammenhängen wichtig? Organismische Evolution (Systematik) Evolution von Proteinfamilien (Funktion) Medizin (Epidemiologie) Forensik (CSI Miami) => Stammbäume 4

5 Voraussetzungen der Phylogenie Wieso können Phylogenien aus den heute existierenden Daten abgeleitet werden? 5

6 Evolution vollzieht sich durch Veränderungen AAGACTT AAGGCCT AGGACTT AGGGCAT TAGCCCT AGCACTT AGGGCAT TAGCCCA TAGACTT AGCACAA AGCGCTT heute OTU A B C D E 6

7 Gemeinsame Vorfahren Vorfahre Verwandte Spezies stammen von einem gemeinsamen Vorfahren ab. Nachkomme 1 Nachkomme 2 7 Dan Graur

8 Vorfahre (~5 MYA) Einige Organismen haben einen Vorfahren, der erst vor kurzem gelebt hat. Dan Graur 8

9 Vorfahre (~100 MYA) Andere gemeinsame Vorfahren haben früher gelebt. 9 Dan Graur

10 Vorfahre (1.500 MYA) Aber: Alle Organismen haben einen gemeinsamen Vorfahren! Dan Graur 10

11 Hierarchie und Stammbaum AAGACTT AAGGCCT TGGACTT AGGGCAT TAGCCCT AGCACTT AGGGCAT TAGCCCA TAGACTT AGCACAA AGCGCTT A B C D E heute Die Entstehung der Spezies erfolgte durch hierarchische Auftrennung, die durch einen Stammbaum darstellbar ist. 11

12 (1.500 MYA) (100 MYA) (5 MYA) Dan Graur 12

13 Ein korrekter Stammbaum AGGGCAT TAGCCCA TAGACTT AGCACAA AGCGCTT heute A B C D E 13

14 Rekonstruktion Rekonstruktion AGGGCAT TAGCCCA TAGACTT AGCACAA AGCGCTT Daten A B C D E In Merkmalen (Morphologie, Sequenzen) sind die Informationen über die Vergangenheit gespeichert 14

15 Das große Ziel Aus den Daten (Sequenzen u.a.) einen Stammbaum erstellen, der die tatsächlichen historischen Verwandtschaftsverhältnisse widerspiegelt. 15

16 Warum molekulare Phylogenie? Rekonstruktion von Verwandtschaftsverhältnissen A. morphologische Daten (Fossilien, Merkmale, Ontogenie ) B. molekulare Daten (DNA- u. AS-Sequenzen, Gene ) Die Methoden der molekularen Evolution erlauben die Extraktion der in der DNA bzw. den Proteinen gespeicherten Informationen. Vorteil der Sequenzdaten: - leichte Zugänglichkeit - grosse Datenmenge - können aber dennoch zu falschen Ergebnissen führen! 16

17 Molekulare Phylogenie Vorgehensweise zur Stammbaumerstellung: A. Evolution der Proteine Wo liegt der Ursprung eines Proteins oder einer Proteinfamilie? Auswahl ähnlicher Sequenzen aus Datenbanken Sequenzalignment Molekularphylogenetische Analyse Statistische Überprüfung B. Evolution der Organsimen (Tree of Life) Verwandschaft bestimmter Taxa? Auswahl geeigneter Sequenzen Sequenzierung (Datenbanken, Klonierung, PCR) Sequenzalignment usw. (wie oben) 17

18 Datenbanken NCBI GenBank DDBJ - DNA EMBL-EBI SWISS-PROT PIR UniProt pdb 18

19 Datenbanksuche z.b. Ausgangspunkt: eigene ermittelte Sequenz (Query) BLAST (Basic Local Alignment Search Tool) => vergleicht zwei Sequenzen miteinander BLASTN: Vergleicht eine Nukleinsäuresequenz mit Nukleinsäuredatenbank => nahe verwandte Sequenzen BLASTP: Vergleicht eine Aminosäuresequenz mit Proteindatenbank. => entfernt verwandte Sequenzen 19

20 Datenbanksuche. BLASTX: Vergleicht eine Nukleinsäuresequenz translatiert in allen 6 Leserastern mit Proteindatenbank. => Für welches Protein kodiert meine Sequenz? TBLASTN: Vergleicht eine Aminosäuresequenz mit Nukleinsäuredatenbank, die in allen 6 Leserastern translatiert wird. => findet z.b. nicht annotierte Proteine in DNA-Daten TBLASTX: Vergleicht die Translationsprodukte aller 6 Leseraster einer Nukleinsäuresequenz mit den Translationsprodukten aller 6 Leseraster einer Nukleinsäuredatenbank. => z.b. entfernte Verwandtschaft unbekannte DNA-Sequenzen 20

21 BLAST (Basic Local Alignment Search Tool) PRAXIS 1 21

22 Multiples Sequenz- Alignments Gegeben: Gesucht: SeqA N A F L S SeqB N A F S SeqC N A K Y L S SeqD N A Y L S SeqA N A - F L S SeqB N A - F - S SeqC N A K Y L S SeqD N A - Y L S Indel: Insertion/Deletion 22

23 CLUSTALX A B C D Alle Sequenzen werden paarweise miteinander verglichen Berechnung der Distanzen guide tree A B C A - B C D A D B C D - 23

24 CLUSTALX Ähnliche Sequenzen werden zu einem Cluster gruppiert Alignment innerhalb der Cluster A D B C Lücken = "gaps" A D B C 24

25 CLUSTALX Sukzessives globales Alignment A D B C alte Lücken = "gaps" neue Lücken = "gaps" A D B C A D B C 25

26 Alignment Parameter PRAXIS 2 26

27 Was ist ein Stammbaum? Darstellung der Verwandtschaftsverhältnisse A B C D E F Schwestergruppen E A C D F B t t A F auch "operational taxonomic units" (OTUs) Taxon/Taxa 27

28 Phylogenetische Grundbegriffe Innengruppe (ingroup) A B C D E Ast (branch) Dichotomie Polytomie A B C D E Wurzel (root) Knotenpunkt (node) 28

29 Mono-, Para- und Polyphylie A B C D E F Monophyletische Taxa: Alle Nachkommen einer gemeinsamen Stammform Paraphyletische Taxa: Nicht alle Nachkommen einer gemeinsamen Stammform Polyphyletische Taxa: Keine gemeinsame Stammform (unterschiedliche Vorfahren) 29

30 Phylogenetische Grundbegriffe Paraphylum aufgrund von homologen (ursprünglichen) Merkmalen Schildkröten "Reptilien" Eidechsen + Schlangen Krokodile Vögel aber nicht alle Nachkommen werden erfasst 30

31 Phylogenetische Grundbegriffe Polyphylie => verschiedenen Ursprungs Neuwelt- Geier "Geier" Altwelt- Geier Raubvögel Storchenvögel aufgrund von Homoplasien (Konvergenzen) 31

32 Cladogramm und Phylogramm A A A B C D C D B B C D E E E F F F Änderungen metrisch Änderungen & Zeit ultrametrisch Cladogramm Phylogramm 32

33 Stammbaum Ohne Außengruppe: Mit Außengruppe: Neunauge Hai Hai Maus Neunauge Flösselhecht Goldfisch Zebrafisch Stahlenflosser Mensch Flösselhecht Forelle Lungenfisch Molch Forelle Molch Ochsenfrosch Landwirbeltiere Ochsenfrosch Krallenfrosch Zebrafisch Goldfisch Krallenfrosch Maus Lungenfisch Mensch Evolutionsrichtung? Evolutionsrichtung 33

34 Vorgehensweise Sequenzen (Input) Multiples Sequenz Alignment Auswahl der Methode Evolutionsmodell/Algorithmus Stammbaumberechnung Ergebnisüberprüfung (output) 34

35 Stammbaumerstellung 1. Distanz-orientierte Methoden UPGMA (Unweighted Pair-Group Method with Arithmetric Means) Neighbor-joining Minimal Evolution => Sequenzen werden in Distanzmatrix konvertiert Sequenzen Multiples Alignment Auswahl der Methode Evolutionsmodell/Algorithmus 2. Charakter-orientierte Methoden Parsimony Maximum Likelihood => jede Position wird als informative Einheit betrachtet Stammbaumberechnung Ergebnisüberprüfung 35

36 Distanz-orientierte Methoden Aus jedem Datensatz kann eine Distanzmatrix erstellt werden Zwei Schritte: 1.Berechnen der paarweisen Abstände zwischen den Sequenzen 2. Erstellen eines Stammbaums anhand dieser Abstandsdaten Sequenzen Multiples Alignment Auswahl der Methode Evolutionsmodell/Algorithmus Stammbaumberechnung Ergebnisüberprüfung 36

37 Berechnung einer Distanzmatrix Sequenz 1 TATAAGCATGACTAGTAAGC Sequenz 2 TATTAGCATGACTGGTAACC Sequenz 3 TATTGGCATGACTAGCAGGC Sequenz 4 TGTTGCCACGATTAGCTACC Sequenz 5 CGTAGCTATGACCAACGGGC Distanz = durchschnittliche Änderung pro Position hier: 3 von 20 Positionen verändert Sequenz Sequenz Sequenz Sequenz Sequenz

38 Korrektur der Distanzen % tatsächlicher Abstand = Anzahl der Mutationen Korrektur beobachteter Abstand t 38

39 Korrektur der Distanzen Frage: Wie korrigieren wir? Wir wollen die tatsächliche Anzahl der evolutiven Ereignisse rekonstruieren. Wir brauchen also ein Evolutionsmodell, welches Rückmutationen und die Austauschwahrscheinlichkeiten etc. berücksichtigt. 39

40 Korrekturmodelle (Evolutionsmodell) Modelle für Proteinevolution sind meist empirisch 40

41 Evolutionsmodelle Globuläre Proteine Transmembran-Proteine K K R N 41

42 Stammbaumberechnung ClustalX Daten Alignment Protdist neighbor Distanzmatrix Stammbaum Evolutionsmodell z.b. JTT; PAM; BLOSUM... Algorithmus z.b UPGMA; NJ NJ- Tree UPGMA-Tree 42

43 Stammbaumberechnung output PRAXIS 3 43

44 Distanzmatrix und Newick 12 Ente Gans Huhn Taube Krokodil Alligator Schildkrot Wal Mensch Zebrafisch Lachs Salamander (Gans: ,(Taube: ,(Huhn: ,((Krokodil: ,Alligator: ): ,(Schildkrot: ,((Wal: ,Mensch: ): ,((Zebrafi sch: ,lachs: ): ,sala mander: ): ): ): ): ): ): ,Ente: ); 44

45 Der Baum 95 Ente 36 Gans 95 Taube 79 Huhn Krokodil Alligator Schildkrot? 100 Mensch Wal Long branch attraction? Salamander 100 Zebrafisch Lachs 45

46 UPGMA - NJ A B C D A C D B UPGMA Unweighted Pair-Group Method with Arithmetric Means E F Aussengruppe festgelegt konstante Evolutionsrate E F NJ Neighbor Joining Aussengruppe wählbar unterschiedliche Evolutionsraten 46

47 UPGMA Unweighted Pair-Group Method with Arithmetric Means A B C D OTU A OTU B OTU C 0 19 OTU D 0 =3 3 3 A B d AC + d BC 2 d AD + d BD 2 A/B C D OTU A/B OTU C 0 19 OTU D 0 =5, A/B C 47

48 UPGMA Unweighted Pair-Group Method with Arithmetric Means A/B/C D Sequenz A/B/C 0 19 Sequenz D A B 5.5 C 9.5 D nimmt konstante Evolutionsraten an Außengruppe wird automatisch bestimmt 48

49 UPGMA Unweighted Pair-Group Method with Arithmetric Means Ausgangsmatrix A B C D OTU A OTU B OTU C 0 19 OTU D 0 rekonstruierte Matrix A B C D OTU A OTU B OTU C 0 19 OTU D A B 5.5 C D UPGMA setzt absolute molekulare Uhr voraus, aber in Realität müssen Evolutionsraten berücksichtigt werden 49

50 Problem UPGMA A C D B A C D B A B C D OTU A 0 18(21,7) OTU B 0 22(21,7) 25(21,7) OTU C 0 13 OTU D 0 50

51 Neighbor-joining NJ A B Star-tree a b e E d c S 0 = ( d ji )/N-1 i j C D S 0 =78,5 S 0 =a+b+c+d+e A B C S 0 =Summe aller Astlängen d = Distanzen zwischen allen OTUs N =Anzahl der OTUs Ziel NJ => Minimierung der Summe aller Astlängen D E OTU A OTU B OTU C OTU D 10 OTU E 0 Paare werden kombiniert Aber: Welche Paare werden kombiniert? A B modified Star-tree a b S AB =67,7 S BC =81 S CD =76 S DE =70 f e E d c C D 51

52 Neighbor-joining NJ B modified Star-tree C Star tree Grouping Astlängen -> Baumlänge -> Baumlängen -> FM A a b f e E d c D Neues taxon (AB) -> neue Matrix Grouping -> Baumlängen Astlängen -> FM Neues taxon -> neue Matrix C Neues taxon (XY) -> neue Matrix f e d c D Grouping Astlängen Neues taxon -> Baumlängen -> FM -> neue Matrix E 52

53 Neighbor-joining NJ B final tree C b=12 c=9 c A a=10 f=20 g=5 e=6 d=4 D E A B C D E OTU A OTU B OTU C OTU D 0 10 OTU E 0 53

54 Neighbor-joining NJ Ähnlicher Algorithmus wie UPGMA Sukzessives Gruppieren der Taxa ohne Verlust eines Astlängenunterschiedes Minimierung der Gesamt-Astlängen des Baums => Stammbaum wird aufgelöst => berücksichtigt unterschiedliche Evolutionsraten (Rekonstruierte Distanzmatrix=Ausgangsmatrix) 54

55 Was bisher geschah... Daten Alignment ClustalX, Dialign Evolutionsmodell JTT, PAM, BLOSUM... Distanzmatrix Algorithmus Stammbaum z.b UPGMA; NJ NJ FM LS ME UPGMA 55

56 Statistische Auswertung.oder. Wie gut passt mein Stammbaum zu den Daten? häufigste Methode ist Bootstrapping 56

57 Bootstrapping Ziehen MIT Zurücklegen 57

58 Bootstrapping Orginalsequenzen Position Sequence A A A A A G T G C A B A G C C G T G C G C A G A T A T C C A D A G A G A T C C G Pseudosample 1 Position Sequence A A A A A G G G C C B A G G C G G C C C C A G G T A A C C C D A G G G A A C C C Pseudosample 2 Position Sequence A A A A A A T G G G B A A A C C T G G G C A A A T T T C C C D A A A G G T C C C z.b. 100 Wiederholungen A B C D A C D B 100 Stammbäume 58

59 Bootstrapping Majority-rule consensus tree Taxon 1 Taxon 2 Taxon 3 Taxon 8 Taxon 9 Taxon 4 Taxon 5 Taxon 6 Taxon Freq ** ** ** **** ****** ** ****.* ***** ******* **...* **...*

60 Stammbaumberechnung Seqboot Protdist ClustalX Daten Alignment Evolutionsmodell x Distanzmatrix neighbor 100 NJ UPGMA consense 1 NJ UPGMA Bootstrapping 60

61 I II III ATAA AAAA AAAA I II III I II III ATAA AAAA AAAA I II III 1x I II III AAAA AAAA AAAA I II III 99x 61

62 Bootstrapping 62

63 Stammbaumerstellung 1. Matrix-orientierte Methoden 2. Charakter-orientierte Methoden 63

64 Charakter-orientierte Methoden Arbeiten direkt mit dem Alignment indem Nukleotide bzw. Aminosäuren als diskrete Charaktere behandelt werden Der phylogenetische Stammbaum wird anhand des Musters der Änderungen der Charaktere berechnet Extrahieren mehr Information als Matrix-orientierte Methoden 1. Maximum Parsimony (MP) 2. Maximum Likelihood (ML) 64

65 Maximum Parsimony Maximaler Geiz" Annahme: Evolution ging stets den kürzesten Weg und somit wird der Stammbaum berechnet, der die wenigsten evolutiven Schritte benötigt. Methode: Alle Möglichkeiten analysieren 65

66 Maximum Parsimony Position Sequenz A A A G A G T G C A B A G C C G T G C G C A G A T A T C C A D A G A G A T C C G 3 mögliche Stammbäume A B C D A C B D A D B C 10 Mutationen 15 Mutationen 14 Mutationen 66

67 Maximum Parsimony Position Sequenz A A A G A G T G C A B A G C C G T G C G C A G A T A T C C A D A G A G A T C C G Sequenz B C Sequenz D A Sequenz B C Sequenz D A G A = C A G Sequenz A A 2 Mutationen Sequenz C G Sequenz A 2 Mutationen A Sequenz C Ort der Mutation nicht immer eindeutig definiert => Parsimony kann keine Astlängen berechnen. 67

68 Maximum Parsimony Gesamt-Alignment: Position Sequenz A A A G A G T G C A B A G C C G T G C G C A G A T A T C C A D A G A G A T C C G A C A C A C = = =... B D 10 Mutationen B D 10 Mutationen B D 10 Mutationen 68

69 Maximum Parsimony Proteinparsimony: 1. Modell (z.b. PAUP): Alle Substitutionen sind gleich wahrscheinlich (1 Schritt). Beispiel Ile -> Trp Ile -> Met Ile -> Ala Modell: liegt genetischen Code zugrunde, wobei "silent site mutations" ignoriert werden (PROTPARS-Modell in PHYLIP). Beispiel: Ile -> Met: ATA/C/T -> ATG: ein Schritt Ile -> Ala: ATA/C/T -> GCN: zwei Schritte Ile -> Trp: ATA/C/T -> TGG: drei Schritte 69

70 Maximum Parsimony Vorteile: Nachteile: gesamter Datensatz empfindlich gegenüber stark unterschiedlichen Evolutionsraten Evolutionsmodelle eingeschränkt möglich hoher Rechenaufwand bei >20 Taxa 70

71 Stammbaumberechnung ClustalX Daten Alignment Protpars Evolutionsmodell kürzester Weg Maximum Parsimony Stammbaum 71

72 Stammbaumberechnung PRAXIS 5 72

73 Maximum Likelihood L = P(data hypothesis) Wahrscheinlichkeit der beobachteten Daten im Lichte der Hypothese 73

74 Likelihood Hypothese Ereignisse sind unabhängig Alle Kopfwürfe besitzen gleiche UNBEKANNTE Kopfwahrscheinlichkeit p Daten: KKZKZKKZZZ L = P(Daten Hypothese ) => Likelihood L(D H) = pp(1-p)p(1-p)pp(1-p)(1-p)(1-p) Für jede vorgegebene Kopfwahrscheinlichkeit p ergibt sich eine bestimmte Likelihood => Plot der selben Daten (KKZKZKKZZZ) gegen verschiedene Werte von p (Hypothese) => Mit welcher Kopfwahrscheinlichkeit p bekomme ich am ehesten diese Daten? Likelihood 0,0 0,2 0,4 0,6 0,8 1,0 [p] 74

75 Maximum Likelihood L = P(data hypothesis) Wahrscheinlichkeit die beobachteten Daten (Sequenzen!) unter der angenommenen Hypothese (Stammbaum/Evolutionsmodell) zu erhalten. d.h, es wird der Stammbaum errechnet, der die beobachteten Daten (also die alignierten Sequenzen) am besten (unter der Annahme des Modells) erklärt. Evolutionsmodell Ein Baum wird generiert und man prüft dann ob die gegebenen Daten den Baum generieren können 75

76 ML - Prinzip Sequence 1 Sequence 2 Sequence 3 Sequence 4 CGAGAA AGCGAA AGATTT GGATAT X,Y = A, T, G, oder C A T C G A 1,0 0,1 0,2 0,4 T 1,0 0,3 0,6 C 1,0 0,1 G 1,0 Berechnen Likelihood einer aller Möglichkeiten vorgegebenen für Topologie eine 1x1x1x0,1x0,1=0,01 Topologie ist das und Produkt eine Position aller Wahrscheinlichkeiten jeder Position 76

77 ML - Beispiel: Stammbaum A: Stammbaum B: Gesamt"wahrscheinlichkeit": = 0,12427 => logl = -0,90563 Gesamt"wahrscheinlichkeit": = 0,02302 => logl = -1,

78 Maximum Likelihood Der Wert für die eingesetzten Wahrscheinlichkeiten p entspricht den vorgegebenen Stammbäumen. Die Hypothese alle Kopfwürfe besitzen die gleiche Wahrscheinlickeit entspricht dem Evolutionsmodell 78

79 Maximum Likelihood Vorteile Mathematisch gut definiert Funktioniert gut in Simulationsexperimenten Erlaubt explizite Verbindung von Evolutionsmodell und Daten (Sequenzen) "Realistische" Annahmen zur Evolution Verschiedene Modelle und Stammbäume lassen sich testen 79

80 Maximum Likelihood Nachteile Maximum likelihood ist nur konsistent (ergibt einen "wahren" Stammbaum) wenn die Evolution nach den gegebenen Modell ablief: Wie gut stimmt mein Modell mit den Daten überein? Computertechnisch nicht zu lösen wenn zu viele Taxa oder Parameter berücksichtigt werden müssen. 80

81 Maximum Likelihood Bei vielen Taxa sind computertechnisch nicht alle möglichen Stammbäume berechenbar Lösung: "Intelligente Algorithmen" - Quartet puzzling - Bayessche Methode + MCMCMC 81

82 Maximum Parsimony Exhaustive = Alle Stammbäume werden untersucht, der beste Stammbaum wird erhalten (garantiert). Exhaustive search: Erschöpfung garantiert 82

83 Maximum Parsimony: Exhaustive Search (1) Start: 3 beliebige Taxa + 4. Taxon (D) in jeder möglichen Position -> 3 Bäume (2a) B D C A B (2b) B D C A A "Branch addition C E B (2c) E C D E E A E + 5. Taxon (E) in jeder der fünf möglichen Positionen => 15 Stammbäume etc. 83

84 Maximum Parsimony: Exhaustive Search Problem: Anzahl der möglichen Stammbäume Number Number of Number of of OTUs rooted trees unrooted trees => bei > ~10 Sequenzen ausführliche Suche aller Stammbäume de facto unmöglich 84

85 Maximum Parsimony 1. Lösung "Branch and bound": Stammbaum wird mit schneller Methode (z.b. NJ) berechnet, die Anzahl der notwendigen Schritte (L) wird berechnet. => verwirft Gruppen von Bäumen, die nicht kürzer werden können als L. Kann für Problemlösungen mit < ~ 20 Taxa verwendet werden. 85

86 Maximum Parsimony abzweigen und beenden branch and bound 86

87 Maximum Parsimony 2. Lösung: Heuristische Verfahren: stepwise addition drei Taxa Baum schrittweise Addition auf allen nächsten Ebenen (großes Problem: lokale Maxima) star decomposition : star tree schrittweiser Abbau von Taxa bzw. Zusammenführung und Evaluation (großes Problem: lokale Maxima) Kombination mit anderen Algorithmen branch swapping (Zweige vertauschen): Nearest neighbor interchange (NNI) Subtree pruning and regrafting (SPR) Tree bisection and reconnection (TBR) 87

88 Maximum Parsimony Problem: Lokale Maxima stepwise addition" star decomposition?! Bauminsel 88

89 No go!!! Back up!!! Lokales Maximum Down? Don t go! go go go!!!

90

91 Parsimony Ratchet Durch zwischenzeitliche Einführung einer veränderten Matrix Wird man aus einem lokalen maximum herauskatapultiert Programme wie: NONA, TNT, PRAP Weitere Parsimony -Verfahren: Wagner (binäre Charaktere), Dollo (gewichtet) und Fitch (unordered multistate characters, DNA) 91

92 ML, MP versus NJ und UPGMA ML, MP Stammbaum vorgegeben Analyse aller Möglichkeiten diesen Stammbaum zu erhalten MP: kürzester ML: zutreffenster NJ, UPGMA Sukkzessive Rekonstruktion des Stammbaumes NJ: echte Evolutionsraten UPGMA: gemittelte Evolutionsraten 92

93 Vorgehensweise UPGMA und NJ A B A B C A B Sukzessives Hinzufügen neuer OTUs zum Stammbaum C D 93

94 Vorgehensweise MP und ML Alle möglichen Stammbäume A C D B B A C D Maximum Parsimony Welcher Stammbaum erfordert die wenigsten Mutationen, um den Datensatz zu erhalten? Maximum Likelihood Welcher Stammbaum liefert die höchste Wahrscheinlichkeit den Datensatz zu erhalten? 94

95 Stammbaumberechnung Protdist ClustalX Daten Alignment Evolutionsmodelle neighbor Distanzmatrix proml protpars NJ UPGMA ML MP 95

96 Stammbaumberechnung ClustalX Seqboot Protdist Alignment Evolutionsmodelle x neighbor Distanzmatrix proml protpars 100 NJ UPGMA consense ML MP NJ UPGMA ML MP 1 96

97 Was können oder kennen wir!? Charakter Alignment Matrix Max.Parsimony Max. Likelihood Evolutionsmodelle Distanz matrix Neigbor Joining UPGMA Stammbaum 97

98 Kritik, Anregungen Vorschläge Verbesserungen. oder was auch immer, bitte an Bernd oder Michael 98

99 Merke Alles außer UPGMA ist radial rooting Nur UPGMA gibt Außengruppe vor Alles außer MP zeigt Abstände MP Cladogramm-Darstellung UPGMA, NJ, ML Phylogramm-Darstellung Bootstrapping zeigt Info des Datensatzes 99

100 Matrix orientierte Methoden: UPGMA / NJ HbA.seq DATEN ClustalX Charakter orientierte Methoden: MP HbA.phy alignment HbA_JTT.dst Matrix protdist Evolutionsmodell: JTT HbA_seqboot_ protdist.txt 100 Matrizen 100 aln seqboot HbA_seqboot.txt protpars Evolutionsmodell: parsimony (Geiz) Datenform Programm File name Neighbor (UPGMA / NJ) HbA_UPGMA.tre (.out) HbA_NJ.tre (.out) Tree HbA_seqboot_ protdist_upgma.tre HbA_seqboot_ protdist_nj.tre 100 Trees consense sbmp.tre (.out) 100 Trees HbA_MP.tre (.out) Tree Bootstrap- Werte HbA_seqboot_ protdist_upgma_con.tre HbA_seqboot_ protdist_nj_con.tre bootstrap Tree HbA_seqboot_ MP_con.tre bootstrap Tree Bootstrap- Werte

Fernstudium "Molekulare Evolution" Bernhard Lieb Michael Schaffeld. Institut für Zoologie Universität Mainz

Fernstudium Molekulare Evolution Bernhard Lieb Michael Schaffeld. Institut für Zoologie Universität Mainz Fernstudium "Molekulare Evolution" ernhard Lieb Michael Schaffeld Institut für Zoologie Universität Mainz 1 Ziel des Kurses Wie erhalte ich aus meinen (Sequenz-) aten einen Stammbaum, und was sagt mir

Mehr

Genomforschung und Sequenzanalyse Einführung in Methoden der Bioinformatik. Phylogenie I. Bernhard Lieb & Tom Hankeln

Genomforschung und Sequenzanalyse Einführung in Methoden der Bioinformatik. Phylogenie I. Bernhard Lieb & Tom Hankeln Genomforschung und Sequenzanalyse Einführung in Methoden der Bioinformatik Molekulare Phylogenie I Bernhard Lieb & Tom Hankeln WS 2006/2007 1 Themen Grundlagen und Begriffe der molekularen Phylogenie Evolutionsmodelle

Mehr

MOL.504 Analyse von DNA- und Proteinsequenzen

MOL.504 Analyse von DNA- und Proteinsequenzen MOL.504 Analyse von DNA- und Proteinsequenzen Kurs 1 Monika Oberer, Karl Gruber MOL.504 Modul-Übersicht Einführung, Datenbanken BLAST-Suche, Sequenzalignment Proteinstrukturen Virtuelles Klonieren Abschlusstest

Mehr

Bioinformatik I (Einführung)

Bioinformatik I (Einführung) Kay Diederichs, Sommersemester 2015 Bioinformatik I (Einführung) Algorithmen Sequenzen Strukturen PDFs unter http://strucbio.biologie.unikonstanz.de/~dikay/bioinformatik/ Klausur: Fr 17.7. 10:00-11:00

Mehr

Der Huffman Algorithmus

Der Huffman Algorithmus Der Huffman Algorithmus Für das Folgende setzen wir voraus, dass die Quellensymbole q ν einem Alphabet {q μ } = {A, B, C,...} mit dem Symbolumfang M entstammen und statistisch voneinander unabhängig seien.

Mehr

3. Einführung in die Theorie der Methoden

3. Einführung in die Theorie der Methoden 3. Einführung in die Theorie der Methoden 3.1. Morphologische Daten Die Analyse morphologischer Merkmale bildet auch heute die Grundlage phylogenetischer Untersuchungen. Morphologische Merkmale sind der

Mehr

Molekulare Phylogenie und freie Software

Molekulare Phylogenie und freie Software Molekulare Phylogenie und freie Software Kerstin Hoef-Emden kerstin.hoef-emden@uni-koeln.de Linux-Workshop 16.11.2010 Was ist Phylogenie? phylon (altgriech.) = Stamm genesis (altgriech.) = Ursprung Phylogenie

Mehr

Binäre Bäume. 1. Allgemeines. 2. Funktionsweise. 2.1 Eintragen

Binäre Bäume. 1. Allgemeines. 2. Funktionsweise. 2.1 Eintragen Binäre Bäume 1. Allgemeines Binäre Bäume werden grundsätzlich verwendet, um Zahlen der Größe nach, oder Wörter dem Alphabet nach zu sortieren. Dem einfacheren Verständnis zu Liebe werde ich mich hier besonders

Mehr

VL Algorithmische BioInformatik (19710) WS2013/2014 Woche 16 - Mittwoch. Annkatrin Bressin Freie Universität Berlin

VL Algorithmische BioInformatik (19710) WS2013/2014 Woche 16 - Mittwoch. Annkatrin Bressin Freie Universität Berlin VL Algorithmische BioInformatik (19710) WS2013/2014 Woche 16 - Mittwoch Annkatrin Bressin Freie Universität Berlin Vorlesungsthemen Part 1: Background Basics (4) 1. The Nucleic Acid World 2. Protein Structure

Mehr

DATENQUALITÄT IN GENOMDATENBANKEN

DATENQUALITÄT IN GENOMDATENBANKEN DATENQUALITÄT IN GENOMDATENBANKEN Alexander Fehr 28. Januar 2004 Gliederung Motivation Biologische Grundkonzepte Genomdaten Datenproduktion und Fehler Data Cleansing 2 Motivation (1) Genomdatenbanken enthalten

Mehr

Manche im Kurs verwendete Programme lassen sich über Menüs steuern. Die entsprechenden Befehle werden folgendermaßen dargestellt:

Manche im Kurs verwendete Programme lassen sich über Menüs steuern. Die entsprechenden Befehle werden folgendermaßen dargestellt: Konventionen in diesem Text Manche im Kurs verwendete Programme lassen sich über Menüs steuern. Die entsprechenden Befehle werden folgendermaßen dargestellt: >File>Load Sequences bedeutet Wähle im Menüpunkt

Mehr

ASSEMBLY ALGORITHMS FOR NEXT-GENERATION SEQUENCING DATA

ASSEMBLY ALGORITHMS FOR NEXT-GENERATION SEQUENCING DATA ASSEMBLY ALGORITHMS FOR NEXT-GENERATION SEQUENCING DATA Jason R. Miller*, Sergey Koren, Granger Sutton Ein Vortrag von Sergej Tschernyschkow Friedrich-Schiller-Universität Jena 03. Mai 2010 SERGEJ TSCHERNYSCHKOW

Mehr

PCR basierte- Detektionstechniken

PCR basierte- Detektionstechniken PCR basierte- Detektionstechniken Warum überhaupt? Forensische Analysen: Vaterschaftstests, Kriminalistik Mikrobielle Gemeinschaften: Biofilme, medizinische Mikrobiologie 2 Warum überhaupt? minimale Mengen

Mehr

Data Mining-Modelle und -Algorithmen

Data Mining-Modelle und -Algorithmen Data Mining-Modelle und -Algorithmen Data Mining-Modelle und -Algorithmen Data Mining ist ein Prozess, bei dem mehrere Komponenten i n- teragieren. Sie greifen auf Datenquellen, um diese zum Training,

Mehr

Programmiersprachen in der Bioinformatik

Programmiersprachen in der Bioinformatik Programmiersprachen in der Bioinformatik Bioinformatik In der Biologie immer größere Datenmengen (z.b. Genome, Proteinsequenzen) Sequenzanalyse, Strukturvorhersage Informationen in Datenbanken abrufbar

Mehr

Codierungstheorie Rudolf Scharlau, SoSe 2006 9

Codierungstheorie Rudolf Scharlau, SoSe 2006 9 Codierungstheorie Rudolf Scharlau, SoSe 2006 9 2 Optimale Codes Optimalität bezieht sich auf eine gegebene Quelle, d.h. eine Wahrscheinlichkeitsverteilung auf den Symbolen s 1,..., s q des Quellalphabets

Mehr

Theoretische Grundlagen der Informatik WS 09/10

Theoretische Grundlagen der Informatik WS 09/10 Theoretische Grundlagen der Informatik WS 09/10 - Tutorium 6 - Michael Kirsten und Kai Wallisch Sitzung 13 02.02.2010 Inhaltsverzeichnis 1 Formeln zur Berechnung Aufgabe 1 2 Hamming-Distanz Aufgabe 2 3

Mehr

Aufabe 7: Baum-Welch Algorithmus

Aufabe 7: Baum-Welch Algorithmus Effiziente Algorithmen VU Ausarbeitung Aufabe 7: Baum-Welch Algorithmus Florian Fest, Matr. Nr.0125496 baskit@generationfun.at Claudia Hermann, Matr. Nr.0125532 e0125532@stud4.tuwien.ac.at Matteo Savio,

Mehr

Exploration und Klassifikation von BigData

Exploration und Klassifikation von BigData Exploration und Klassifikation von BigData Inhalt Einführung Daten Data Mining: Vorbereitungen Clustering Konvexe Hülle Fragen Google: Riesige Datenmengen (2009: Prozessieren von 24 Petabytes pro Tag)

Mehr

Künstliche Intelligenz Dirk Krechel SS 2009

Künstliche Intelligenz Dirk Krechel SS 2009 Künstliche Intelligenz Dirk Krechel SS 2009 Überblick über das Modul 1. Einführung 2. Symbolische Verfahren Logik Aussagenlogik Prädikatenlogik Horn Logik Prolog 3. Suchen und Bewerten Problemlösen durch

Mehr

Kodierungsalgorithmen

Kodierungsalgorithmen Kodierungsalgorithmen Komprimierung Verschlüsselung Komprimierung Zielsetzung: Reduktion der Speicherkapazität Schnellere Übertragung Prinzipien: Wiederholungen in den Eingabedaten kompakter speichern

Mehr

Integration geometrischer und fotogrammetrischer Information zum Wiederfinden von Bildern

Integration geometrischer und fotogrammetrischer Information zum Wiederfinden von Bildern Integration geometrischer und fotogrammetrischer Information zum Wiederfinden von Bildern Björn Burow SE Mustererkennung in Bildern und 3D-Daten Lehrstuhl Graphische Systeme BTU Cottbus Inhaltsübersicht

Mehr

Informatik-Sommercamp 2012. Mastermind mit dem Android SDK

Informatik-Sommercamp 2012. Mastermind mit dem Android SDK Mastermind mit dem Android SDK Übersicht Einführungen Mastermind und Strategien (Stefan) Eclipse und das ADT Plugin (Jan) GUI-Programmierung (Dominik) Mastermind und Strategien - Übersicht Mastermind Spielregeln

Mehr

Towards Automated Analysis of Business Processes for Financial Audits

Towards Automated Analysis of Business Processes for Financial Audits Towards Automated Analysis of Business Processes for Financial Audits Michael Werner Universität Hamburg michael.werner@wiso.uni hamburg.de Max Brauer Allee 60 22765 Hamburg StB Prof. Dr. Nick Gehrke Nordakademie

Mehr

Approximationsalgorithmen

Approximationsalgorithmen Ausarbeitung zum Thema Approximationsalgorithmen im Rahmen des Fachseminars 24. Juli 2009 Robert Bahmann robert.bahmann@gmail.com FH Wiesbaden Erstellt von: Robert Bahmann Zuletzt berarbeitet von: Robert

Mehr

Genomsequenzierung für Anfänger

Genomsequenzierung für Anfänger Genomsequenzierung für Anfänger Philipp Pagel 8. November 2005 1 DNA Sequenzierung Heute wird DNA üblicherweise mit der sogenannten Sanger (oder chain-terminationoder Didesoxy-) Methode sequenziert dessen

Mehr

Wie schreibt man eine Literaturübersicht?

Wie schreibt man eine Literaturübersicht? Wie schreibt man eine Literaturübersicht? Hinweis: Eine Literaturübersicht kann sowohl ein eigenständiger Text oder Teil einer wissenschaftlichen Arbeit sein. Im zweiten Fall findet sich in der Arbeit

Mehr

K2 MATHEMATIK KLAUSUR. Aufgabe PT WTA WTGS Darst. Gesamtpunktzahl Punkte (max) 28 15 15 2 60 Punkte Notenpunkte

K2 MATHEMATIK KLAUSUR. Aufgabe PT WTA WTGS Darst. Gesamtpunktzahl Punkte (max) 28 15 15 2 60 Punkte Notenpunkte K2 MATHEMATIK KLAUSUR 26.2.24 Aufgabe PT WTA WTGS Darst. Gesamtpunktzahl Punkte (max 28 5 5 2 6 Punkte Notenpunkte PT 2 3 4 5 6 7 8 9 P. (max 2 2 2 4 5 3 3 4 3 Punkte WT Ana A.a b A.c Summe P. (max 7 5

Mehr

Data Mining - Wiederholung

Data Mining - Wiederholung Data Mining - Wiederholung Norbert Fuhr 9. Juni 2008 Problemstellungen Problemstellungen Daten vs. Information Def. Data Mining Arten von strukturellen Beschreibungen Regeln (Klassifikation, Assoziations-)

Mehr

Applied Bioinformatics. maria.fischer@i-med.ac.at http://icbi.at/courses/bioinformatics_ex

Applied Bioinformatics. maria.fischer@i-med.ac.at http://icbi.at/courses/bioinformatics_ex Applied Bioinformatics SS 2013 maria.fischer@i-med.ac.at http://icbi.at/courses/bioinformatics_ex Organisatorisches Termine Mo 18.03.2013 RR19 9:00 Di 19.03.2013 RR19 9:00 Mi 20.03.2013 RR19 9:00 Übungsziele

Mehr

Messsystemanalyse (MSA)

Messsystemanalyse (MSA) Messsystemanalyse (MSA) Inhaltsverzeichnis Ursachen & Auswirkungen von Messabweichungen Qualifikations- und Fähigkeitsnachweise Vorteile einer Fähigkeitsuntersuchung Anforderungen an das Messsystem Genauigkeit

Mehr

Seminar Business Intelligence Teil II. Data Mining & Knowledge Discovery

Seminar Business Intelligence Teil II. Data Mining & Knowledge Discovery Seminar Business Intelligence Teil II Data Mining & Knowledge Discovery Was ist Data Mining? Sabine Queckbörner Was ist Data Mining? Data Mining Was ist Data Mining? Nach welchen Mustern wird gesucht?

Mehr

2 Informationstheorie

2 Informationstheorie 2 Informationstheorie Formale Grundlagen der Informatik I Herbstsemester 2012 Robert Marti Vorlesung teilweise basierend auf Unterlagen von Prof. emer. Helmut Schauer Grundbegriffe Informatik (IT: Information

Mehr

13. Binäre Suchbäume

13. Binäre Suchbäume 1. Binäre Suchbäume Binäre Suchbäume realiesieren Wörterbücher. Sie unterstützen die Operationen 1. Einfügen (Insert) 2. Entfernen (Delete). Suchen (Search) 4. Maximum/Minimum-Suche 5. Vorgänger (Predecessor),

Mehr

Idee: Wenn wir beim Kopfknoten zwei Referenzen verfolgen können, sind die Teillisten kürzer. kopf Eine Datenstruktur mit Schlüsselwerten 1 bis 10

Idee: Wenn wir beim Kopfknoten zwei Referenzen verfolgen können, sind die Teillisten kürzer. kopf Eine Datenstruktur mit Schlüsselwerten 1 bis 10 Binäre Bäume Bäume gehören zu den wichtigsten Datenstrukturen in der Informatik. Sie repräsentieren z.b. die Struktur eines arithmetischen Terms oder die Struktur eines Buchs. Bäume beschreiben Organisationshierarchien

Mehr

6. Bayes-Klassifikation. (Schukat-Talamazzini 2002)

6. Bayes-Klassifikation. (Schukat-Talamazzini 2002) 6. Bayes-Klassifikation (Schukat-Talamazzini 2002) (Böhm 2003) (Klawonn 2004) Der Satz von Bayes: Beweis: Klassifikation mittels des Satzes von Bayes (Klawonn 2004) Allgemeine Definition: Davon zu unterscheiden

Mehr

Kompakte Graphmodelle handgezeichneter Bilder. Einbeziehung in Autentizierung und Bilderkennung

Kompakte Graphmodelle handgezeichneter Bilder. Einbeziehung in Autentizierung und Bilderkennung Kompakte Graphmodelle handgezeichneter Bilder Einbeziehung in Autentizierung und Bilderkennung Inhaltsverzeichnis 1 Einleitung Das graphische Model.1 Image Thinning................................. 3.

Mehr

16. All Pairs Shortest Path (ASPS)

16. All Pairs Shortest Path (ASPS) . All Pairs Shortest Path (ASPS) All Pairs Shortest Path (APSP): Eingabe: Gewichteter Graph G=(V,E) Ausgabe: Für jedes Paar von Knoten u,v V die Distanz von u nach v sowie einen kürzesten Weg a b c d e

Mehr

Kompakte Graphmodelle handgezeichneter Bilder

Kompakte Graphmodelle handgezeichneter Bilder Kompakte Graphmodelle handgezeichneter Bilder Einbeziehung in Authentizierung und Bilderkennung Inhaltsverzeichnis Seminar Mustererkennung WS 006/07 Autor: Stefan Lohs 1 Einleitung 1 Das graphische Modell.1

Mehr

Eine Baumstruktur sei folgendermaßen definiert. Eine Baumstruktur mit Grundtyp Element ist entweder

Eine Baumstruktur sei folgendermaßen definiert. Eine Baumstruktur mit Grundtyp Element ist entweder Programmieren in PASCAL Bäume 1 1. Baumstrukturen Eine Baumstruktur sei folgendermaßen definiert. Eine Baumstruktur mit Grundtyp Element ist entweder 1. die leere Struktur oder 2. ein Knoten vom Typ Element

Mehr

Evolution II. Molekulare Variabilität. Bachelorkurs Evolutionsbiolgie II WS 2013/14

Evolution II. Molekulare Variabilität. Bachelorkurs Evolutionsbiolgie II WS 2013/14 Evolution II Molekulare Variabilität Bachelorkurs Evolutionsbiolgie II WS 2013/14 Molekulare Variabilität 1) rten der molekularen Variabilität und ihre Entstehung (rten der Mutation) 2) Wie kann man molekulare

Mehr

Die geheimnisvollen blauflankigen Smaragdeidechsen der Peloponnes (Griechenland)

Die geheimnisvollen blauflankigen Smaragdeidechsen der Peloponnes (Griechenland) Die Eidechse, Jg. 26, H. 1, S. 11-17, Magdeburg / Hamburg, Mai 2015 Die geheimnisvollen blauflankigen Smaragdeidechsen der Peloponnes (Griechenland) Ron Peek & William Leenders Zusammenfassung Smaragdeidechsen

Mehr

Morphologie auf Binärbildern

Morphologie auf Binärbildern Morphologie auf Binärbildern WS07 5.1 Konen, Zielke WS07 5.2 Konen, Zielke Motivation Aufgabe: Objekte zählen Probleme: "Salt-&-Pepper"-Rauschen erzeugt falsche Objekte Verschmelzen richtiger Objekte durch

Mehr

Data Mining und Knowledge Discovery in Databases

Data Mining und Knowledge Discovery in Databases Data Mining und Knowledge Discovery in Databases Begriffsabgrenzungen... Phasen der KDD...3 3 Datenvorverarbeitung...4 3. Datenproblematik...4 3. Möglichkeiten der Datenvorverarbeitung...4 4 Data Mining

Mehr

Regionen in Binärbildern

Regionen in Binärbildern Regionen in Binärbildern Industrielle Bildverarbeitung, Vorlesung No. 9 1 M. O. Franz 05.12.2007 1 falls nicht anders vermerkt, sind die Abbildungen entnommen aus Burger & Burge, 2005. Übersicht 1 Auffinden

Mehr

Künstliches binäres Neuron

Künstliches binäres Neuron Künstliches binäres Neuron G.Döben-Henisch Fachbereich Informatik und Ingenieurwissenschaften FH Frankfurt am Main University of Applied Sciences D-60318 Frankfurt am Main Germany Email: doeben at fb2.fh-frankfurt.de

Mehr

Perzentile mit Hadoop ermitteln

Perzentile mit Hadoop ermitteln Perzentile mit Hadoop ermitteln Ausgangspunkt Ziel dieses Projektes war, einen Hadoop Job zu entwickeln, der mit Hilfe gegebener Parameter Simulationen durchführt und aus den Ergebnissen die Perzentile

Mehr

13 Java 4 - Entwurfsmuster am Beispiel des Rucksackproblems

13 Java 4 - Entwurfsmuster am Beispiel des Rucksackproblems 13 Java 4 - Entwurfsmuster am Beispiel des Rucksackproblems 13.1 Modellierung des Rucksackproblems 13.2 Lösung mit Greedy-Algorithmus 13.3 Lösung mit Backtracking 13.4 Lösung mit Dynamischer Programmierung

Mehr

Zielgerichtete Therapie mit Olaparib bei BRCA1/2- Mutationsträgerinnen

Zielgerichtete Therapie mit Olaparib bei BRCA1/2- Mutationsträgerinnen Zielgerichtete Therapie mit Olaparib bei BRCA1/2- Mutationsträgerinnen Prof. Dr. med. Brigitte Schlegelberger 670513011/15 Olaparib Zulassung in Europa: Rezidiv eines Platin-sensitiven Ovarialkarzinoms

Mehr

15 Optimales Kodieren

15 Optimales Kodieren 15 Optimales Kodieren Es soll ein optimaler Kodierer C(T ) entworfen werden, welcher eine Information (z.b. Text T ) mit möglichst geringer Bitanzahl eindeutig überträgt. Die Anforderungen an den optimalen

Mehr

Neue DNA Sequenzierungstechnologien im Überblick

Neue DNA Sequenzierungstechnologien im Überblick Neue DNA Sequenzierungstechnologien im Überblick Dr. Bernd Timmermann Next Generation Sequencing Core Facility Max Planck Institute for Molecular Genetics Berlin, Germany Max-Planck-Gesellschaft 80 Institute

Mehr

Übungsblatt Molekularbiologie und Genetik für Studierende der Bioinformatik II 1. Übung

Übungsblatt Molekularbiologie und Genetik für Studierende der Bioinformatik II 1. Übung Übungsblatt Molekularbiologie und Genetik für Studierende der Bioinformatik II 1 Name des Studierenden: Datum: Einführung Übung Bitte bereiten Sie folgende Probleme vor der Übung am Mittwoch. Die Klausur

Mehr

WS 2009/10. Diskrete Strukturen

WS 2009/10. Diskrete Strukturen WS 2009/10 Diskrete Strukturen Prof. Dr. J. Esparza Lehrstuhl für Grundlagen der Softwarezuverlässigkeit und theoretische Informatik Fakultät für Informatik Technische Universität München http://www7.in.tum.de/um/courses/ds/ws0910

Mehr

Kap. 2: Fail-Stop Unterschriften

Kap. 2: Fail-Stop Unterschriften Stefan Lucks 2: Fail-Stop Unterschriften 17 Digital Unterschreiben und Bezahlen Kap. 2: Fail-Stop Unterschriften Digitale Unterschriften (Synomym: Digitale Signaturen ): Fälschen mutmaßlich hart (RSA-Wurzeln,

Mehr

Seminararbeit für das SE Reine Mathematik- Graphentheorie

Seminararbeit für das SE Reine Mathematik- Graphentheorie Seminararbeit für das SE Reine Mathematik- Graphentheorie Der binäre Rang, der symplektische Graph, die Spektralzerlegung und rationale Funktionen Vortrag am 24.01.2012 Heike Farkas 0410052 Inhaltsverzeichnis

Mehr

Kryptographie und Fehlertoleranz für Digitale Magazine

Kryptographie und Fehlertoleranz für Digitale Magazine Stefan Lucks Kryptographie und Fehlertoleranz für digitale Magazine 1 Kryptographie und Fehlertoleranz für Digitale Magazine Stefan Lucks Professur für Mediensicherheit 13. März 2013 Stefan Lucks Kryptographie

Mehr

Universität Potsdam Institut für Informatik Lehrstuhl Maschinelles Lernen. Entscheidungsbäume

Universität Potsdam Institut für Informatik Lehrstuhl Maschinelles Lernen. Entscheidungsbäume Universität Potsdam Institut für Informatik Lehrstuhl Maschinelles Lernen Entscheidungsbäume Christoph Sawade/Niels Landwehr Jules Rasetaharison, Tobias Scheffer Entscheidungsbäume Eine von vielen Anwendungen:

Mehr

9 Resümee. Resümee 216

9 Resümee. Resümee 216 Resümee 216 9 Resümee In der vorliegenden Arbeit werden verschiedene Methoden der Datenreduktion auf ihre Leistungsfähigkeit im sozialwissenschaftlichstatistischen Umfeld anhand eines konkreten Anwendungsfalls

Mehr

ChangePoint-Analysen - ein Überblick

ChangePoint-Analysen - ein Überblick ChangePoint-Analysen - ein Überblick Gliederung Motivation Anwendungsgebiete Chow Test Quandt-Andrews Test Fluktuations-Tests Binary Segmentation Recursive circular and binary segmentation algorithm Bayesscher

Mehr

Multinomiale logistische Regression

Multinomiale logistische Regression Multinomiale logistische Regression Die multinomiale logistische Regression dient zur Schätzung von Gruppenzugehörigkeiten bzw. einer entsprechenden Wahrscheinlichkeit hierfür, wobei als abhänginge Variable

Mehr

Grundlagen und Basisalgorithmus

Grundlagen und Basisalgorithmus Grundlagen und Basisalgorithmus Proseminar -Genetische Programmierung- Dezember 2001 David König Quelle: Kinnebrock W.: Optimierung mit genetischen und selektiven Algorithmen. München, Wien: Oldenbourg

Mehr

Anlage zur Akkreditierungsurkunde D PL 13372 01 00

Anlage zur Akkreditierungsurkunde D PL 13372 01 00 Deutsche Akkreditierungsstelle GmbH Anlage zur Akkreditierungsurkunde D PL 13372 01 00 nach DIN EN ISO/IEC 17025:2005 Gültigkeitsdauer: 22.05.2014 bis 25.03.2017 Ausstellungsdatum: 22.05.2014 Urkundeninhaber:

Mehr

Software Strategien zur weiteren Optimierung der Kommissionierung

Software Strategien zur weiteren Optimierung der Kommissionierung Software Strategien zur weiteren Optimierung der Kommissionierung als Ergänzung zu der angeboten Hardware dem elektronischen Kommissionierboard und der Multiple-Order-Picking Abwicklung Genial einfach..

Mehr

Teil II. Nichtlineare Optimierung

Teil II. Nichtlineare Optimierung Teil II Nichtlineare Optimierung 60 Kapitel 1 Einleitung In diesem Abschnitt wird die Optimierung von Funktionen min {f(x)} x Ω betrachtet, wobei Ω R n eine abgeschlossene Menge und f : Ω R eine gegebene

Mehr

2.) Wie lautet in der Genomforschung das Fachwort für Vielgestaltigkeit? a) Polytheismus b) Polymerisation c) Polymorphismus d) Polygamismus

2.) Wie lautet in der Genomforschung das Fachwort für Vielgestaltigkeit? a) Polytheismus b) Polymerisation c) Polymorphismus d) Polygamismus Lernkontrolle M o d u l 2 A w i e... A n k r e u z e n! 1.) Welche gentechnischen Verfahren bildeten die Grundlage für das Humangenomprojekt (Mehrfachnennungen möglich)? a) Polymerase-Kettenreaktion b)

Mehr

Multivariate Statistik

Multivariate Statistik Hermann Singer Multivariate Statistik 1 Auflage 15 Oktober 2012 Seite: 12 KAPITEL 1 FALLSTUDIEN Abbildung 12: Logistische Regression: Geschätzte Wahrscheinlichkeit für schlechte und gute Kredite (rot/blau)

Mehr

Grundlagen der Informatik. Prof. Dr. Stefan Enderle NTA Isny

Grundlagen der Informatik. Prof. Dr. Stefan Enderle NTA Isny Grundlagen der Informatik Prof. Dr. Stefan Enderle NTA Isny 2 Datenstrukturen 2.1 Einführung Syntax: Definition einer formalen Grammatik, um Regeln einer formalen Sprache (Programmiersprache) festzulegen.

Mehr

Next Generation Sequencing für die Primärdiagnostik. Focus: Resistenztestung

Next Generation Sequencing für die Primärdiagnostik. Focus: Resistenztestung Next Generation Sequencing für die Primärdiagnostik Focus: Resistenztestung Stefan Niemann Molekulare Mykobakteriologie Forschungszentrum Borstel TTU-TB Deutsches Zentrum für Infektionsforschung Outline

Mehr

Active Directory. Agenda. Michael Flachsel. TU-Windows Konzept Vorhandene Umgebung. Allgemeiner Aufbau & Struktur an der TUB

Active Directory. Agenda. Michael Flachsel. TU-Windows Konzept Vorhandene Umgebung. Allgemeiner Aufbau & Struktur an der TUB Michael Flachsel Active Directory Allgemeiner Aufbau & Struktur an der TUB 6. Juni 2007 Agenda TU-Windows Vorhandene 2 (c) 2007 Michael Flachsel Active Directory" 1 Warum Active Directory Ca. 2000 Ca.

Mehr

Stefan Lucks Krypto und Mediensicherheit (2009) 4: Stromchiffren

Stefan Lucks Krypto und Mediensicherheit (2009) 4: Stromchiffren 4: Stromchiffren Zwei Grundbausteine der symmetrischen Kryptographie: Stromchiffren Verschlüsseln beliebig langer Klartexte, interner Zustand Blockchiffren Verschlüsseln von Blocks einer festen Größe,

Mehr

Computer Vision: 3D-Geometrie. D. Schlesinger () Computer Vision: 3D-Geometrie 1 / 17

Computer Vision: 3D-Geometrie. D. Schlesinger () Computer Vision: 3D-Geometrie 1 / 17 Computer Vision: 3D-Geometrie D. Schlesinger () Computer Vision: 3D-Geometrie 1 / 17 Lochkamera Modell C Projektionszentrum, Optische Achse, Bildebene, P Hauptpunkt (optische Achse kreuzt die Bildebene),

Mehr

Übung 1. Fabian Wannenmacher 24C9 F9C5 3180 EE15 197D 7DD5 F85A 19E2 B51F 75B7. Übung 1. f.wanne@googlemail.com. UNI Tübingen.

Übung 1. Fabian Wannenmacher 24C9 F9C5 3180 EE15 197D 7DD5 F85A 19E2 B51F 75B7. Übung 1. f.wanne@googlemail.com. UNI Tübingen. UNI Tübingen October 26, 23 Umrechnen echo "obase=8; ibase=6; CAFEBABE" bc C A F E B A B E Umrechnen echo "obase=8; ibase=6; CAFEBABE" bc C A F E B A B E Umrechnen echo "obase=8; ibase=6; CAFEBABE" bc

Mehr

Zeichnen von Graphen. graph drawing

Zeichnen von Graphen. graph drawing Zeichnen von Graphen graph drawing WS 2006 / 2007 Gruppe: D_rot_Ala0607 Christian Becker 11042315 Eugen Plischke 11042351 Vadim Filippov 11042026 Gegeben sei ein Graph G = (V; E) Problemstellung V E =

Mehr

Genetik - The Human Genome Project. Überblick über die Genetik. Die gesamte Erbinformation eines Menschen befindet sich in jedem Zellkern

Genetik - The Human Genome Project. Überblick über die Genetik. Die gesamte Erbinformation eines Menschen befindet sich in jedem Zellkern Genetik - The Human Genome Project Überblick über die Genetik Die gesamte Erbinformation eines Menschen befindet sich in jedem Zellkern seines Körpers. 1 2 Im Organismus müsssen nun ständig Enzyme u. a.

Mehr

9. Schätzen und Testen bei unbekannter Varianz

9. Schätzen und Testen bei unbekannter Varianz 9. Schätzen und Testen bei unbekannter Varianz Dr. Antje Kiesel Institut für Angewandte Mathematik WS 2011/2012 Schätzen und Testen bei unbekannter Varianz Wenn wir die Standardabweichung σ nicht kennen,

Mehr

Text Mining und CRM. Hans Hermann Weber Univ. Erlangen IMMD 8, den 12.09.03

Text Mining und CRM. Hans Hermann Weber Univ. Erlangen IMMD 8, den 12.09.03 Text Mining und CRM Hans Hermann Weber Univ. Erlangen IMMD 8, den 12.09.03 Was ist Textmining Unstrukturierte Daten (Text) anreichern mit Strukturinformation: Metadaten hinzufügen Struktur (Segmentinformation)

Mehr

UI-Testing mit Microsoft Test Manager (MTM) Philip Gossweiler / 2013-04-18

UI-Testing mit Microsoft Test Manager (MTM) Philip Gossweiler / 2013-04-18 UI-Testing mit Microsoft Test Manager (MTM) Philip Gossweiler / 2013-04-18 Software Testing Automatisiert Manuell 100% 70% 1 Überwiegender Teil der Testing Tools fokusiert auf automatisiertes Testen Microsoft

Mehr

2. Die Darstellung von Algorithmen

2. Die Darstellung von Algorithmen 2. Die Darstellung von Algorithmen Aus den Einführungsbeispielen und Übungsaufgaben ist erkennbar, dass zur Darstellung von Algorithmen Grundelemente notwendig sind. Neben der Notation einzelner elementarer

Mehr

Algorithmen und Datenstrukturen

Algorithmen und Datenstrukturen Algorithmen und Datenstrukturen Dipl. Inform. Andreas Wilkens 1 Organisatorisches Freitag, 05. Mai 2006: keine Vorlesung! aber Praktikum von 08.00 11.30 Uhr (Gruppen E, F, G, H; Vortestat für Prototyp)

Mehr

Erfolg und Vermögensrückgänge angefertigt im Rahmen der Lehrveranstaltung Nachrichtentechnik von: Eric Hansen, eric-hansen@gmx.de am: 07.09.

Erfolg und Vermögensrückgänge angefertigt im Rahmen der Lehrveranstaltung Nachrichtentechnik von: Eric Hansen, eric-hansen@gmx.de am: 07.09. Abstract zum Thema Handelssysteme Erfolg und Vermögensrückgänge angefertigt im Rahmen der Lehrveranstaltung Nachrichtentechnik von: Eric Hansen, eric-hansen@gmx.de am: 07.09.01 Einleitung: Handelssysteme

Mehr

Kinect Nils Röder, Björn Frömmer

Kinect Nils Röder, Björn Frömmer Kinect Nils Röder, Björn Frömmer Agenda Einleitung Hardware Funktionsweise der Kamera Algorithmus (Pose Recognition, Tracking) Einleitung Was ist Kinect? Eingabegerät (Human Computer Interface) Optisches

Mehr

Medizinische Statistik Epidemiologie und χ 2 Vierfeldertest

Medizinische Statistik Epidemiologie und χ 2 Vierfeldertest Universität Wien Institut für Mathematik Wintersemester 2009/2010 Medizinische Statistik Epidemiologie und χ 2 Vierfeldertest Seminar Angewandte Mathematik Ao. Univ. Prof. Dr. Peter Schmitt von Nadja Reiterer

Mehr

Mediendidaktische Methoden der Prozessanalyse zur Darstellung individueller Lernprozesse in hypertextuellen Lernumgebungen

Mediendidaktische Methoden der Prozessanalyse zur Darstellung individueller Lernprozesse in hypertextuellen Lernumgebungen Mediendidaktische Methoden der Prozessanalyse zur Darstellung individueller Lernprozesse in hypertextuellen Lernumgebungen Stefan Iske, Universität zu Köln Allgemeine Didaktik und Schulforschung Humanwissenschaftliche

Mehr

Grundriss 1 EINIGE GRUNDLAGEN DER VERERBUNG. DNA ein Bote aus der Vergangenheit. Vertiefungen. Anhang

Grundriss 1 EINIGE GRUNDLAGEN DER VERERBUNG. DNA ein Bote aus der Vergangenheit. Vertiefungen. Anhang Grundriss 6. Gen-Bäume in Populationen.............................. 66 Rekonstruktion der Populationsgeschichte anhand von DNA-Sequenzen.................................. 68 Die Genealogie einer Stichprobe..............................

Mehr

29. Mai 2006. 5. Bei Unterschleif gilt die Klausur als nicht bestanden und es erfolgt eine Meldung an das Prüfungsamt.

29. Mai 2006. 5. Bei Unterschleif gilt die Klausur als nicht bestanden und es erfolgt eine Meldung an das Prüfungsamt. L. Fahrmeir, C. Belitz Department für Statistik Bitte für die Korrektur freilassen! Aufgabe 1 2 3 4 Punkte Klausur zur Vorlesung Statistik III für Studenten mit Wahlfach Statistik 29. Mai 2006 Hinweise:

Mehr

KONSTRUKTION VON ROT-SCHWARZ-BÄUMEN

KONSTRUKTION VON ROT-SCHWARZ-BÄUMEN KONSTRUKTION VON ROT-SCHWARZ-BÄUMEN RALF HINZE Institut für Informatik III Universität Bonn Email: ralf@informatik.uni-bonn.de Homepage: http://www.informatik.uni-bonn.de/~ralf Februar, 2001 Binäre Suchbäume

Mehr

What you should have learned so far

What you should have learned so far Finding the right scale...mittels Regressionsanalysen (siehe Übung)...mittels theoretischer Überlegungen...mittels Modellen, die an empirischen Daten getestet werden...mittels räumlichen Autokorrelationsanalysen

Mehr

Algorithmische Modelle als neues Paradigma

Algorithmische Modelle als neues Paradigma Algorithmische Modelle als neues Paradigma Axel Schwer Seminar über Philosophische Grundlagen der Statistik, WS 2010/11 Betreuer: Prof. Dr. Thomas Augustin München, den 28. Januar 2011 1 / 29 LEO BREIMAN

Mehr

1,11 1,12 1,13 1,14 1,15 1,16 1,17 1,17 1,17 1,18

1,11 1,12 1,13 1,14 1,15 1,16 1,17 1,17 1,17 1,18 3. Deskriptive Statistik Ziel der deskriptiven (beschreibenden) Statistik (explorativen Datenanalyse) ist die übersichtliche Darstellung der wesentlichen in den erhobenen Daten enthaltene Informationen

Mehr

JMangler. Frithjof Kurtz. Universität Bonn, Seminar Softw aretechnologie WS 03/04, Jmangler Frithjof Kurtz 1

JMangler. Frithjof Kurtz. Universität Bonn, Seminar Softw aretechnologie WS 03/04, Jmangler Frithjof Kurtz 1 JMangler Frithjof Kurtz Universität Bonn, Seminar Softw aretechnologie WS 03/04, Jmangler Frithjof Kurtz 1 JMangler Vortragsgliederung Motivation Java Grundlagen JMangler Grundlagen Transformationen Algorithmen

Mehr

RFID Media Access. Roland Schneider. Betreuer: Christian Flörkemeier. SS 2003 RFID Media Access 1

RFID Media Access. Roland Schneider. Betreuer: Christian Flörkemeier. SS 2003 RFID Media Access 1 RFID Media Access Roland Schneider Betreuer: Christian Flörkemeier SS 2003 RFID Media Access 1 Überblick! RFID-Technologie! Mehrfachzugriffsverfahren (Media Access)! Bekannte Ansätze! Verfahren für RFID-Systeme!

Mehr

Data Mining - Marketing-Schlagwort oder ernstzunehmende Innovation?

Data Mining - Marketing-Schlagwort oder ernstzunehmende Innovation? 1. Konferenz der A Benutzer KFE in Forschung und Entwicklung Data Mining - Marketing-chlagwort oder ernstzunehmende Innovation? Hans-Peter Höschel,, Heidelberg 1. Konferenz der A Benutzer KFE in Forschung

Mehr

Codierung, Codes (variabler Länge)

Codierung, Codes (variabler Länge) Codierung, Codes (variabler Länge) A = {a, b, c,...} eine endliche Menge von Nachrichten (Quellalphabet) B = {0, 1} das Kanalalphabet Eine (binäre) Codierung ist eine injektive Abbildung Φ : A B +, falls

Mehr

Technische Informatik - Eine Einführung

Technische Informatik - Eine Einführung Martin-Luther-Universität Halle-Wittenberg Fachbereich Mathematik und Informatik Lehrstuhl für Technische Informatik Prof. P. Molitor Ausgabe: 2005-02-21 Abgabe: 2005-02-21 Technische Informatik - Eine

Mehr

Bioinformatik für Biochemiker

Bioinformatik für Biochemiker Bioinformatik für Biochemiker Oliver Kohlbacher WS 2009/2010 6. Sequenzdatenbanken Abt. Simulation biologischer Systeme WSI/ZBIT, Eberhard Karls Universität Tübingen Übersicht Was sind Datenbanken? Sequenzdatenbanken

Mehr

Vorlesung 3 MINIMALE SPANNBÄUME

Vorlesung 3 MINIMALE SPANNBÄUME Vorlesung 3 MINIMALE SPANNBÄUME 72 Aufgabe! Szenario: Sie arbeiten für eine Firma, die ein Neubaugebiet ans Netz (Wasser, Strom oder Kabel oder...) anschließt! Ziel: Alle Haushalte ans Netz bringen, dabei

Mehr

Kapitel 3. Zufallsvariable. Wahrscheinlichkeitsfunktion, Dichte und Verteilungsfunktion. Erwartungswert, Varianz und Standardabweichung

Kapitel 3. Zufallsvariable. Wahrscheinlichkeitsfunktion, Dichte und Verteilungsfunktion. Erwartungswert, Varianz und Standardabweichung Kapitel 3 Zufallsvariable Josef Leydold c 2006 Mathematische Methoden III Zufallsvariable 1 / 43 Lernziele Diskrete und stetige Zufallsvariable Wahrscheinlichkeitsfunktion, Dichte und Verteilungsfunktion

Mehr

3. Entscheidungsbäume. Verfahren zum Begriffslernen (Klassifikation) Beispiel: weiteres Beispiel: (aus Böhm 2003) (aus Morik 2002)

3. Entscheidungsbäume. Verfahren zum Begriffslernen (Klassifikation) Beispiel: weiteres Beispiel: (aus Böhm 2003) (aus Morik 2002) 3. Entscheidungsbäume Verfahren zum Begriffslernen (Klassifikation) Beispiel: weiteres Beispiel: (aus Böhm 2003) (aus Morik 2002) (aus Wilhelm 2001) Beispiel: (aus Böhm 2003) Wann sind Entscheidungsbäume

Mehr