Wahrscheinlichkeitsrechnung und Statistik für Biologen Diskriminanzanalyse

Größe: px
Ab Seite anzeigen:

Download "Wahrscheinlichkeitsrechnung und Statistik für Biologen Diskriminanzanalyse"

Transkript

1 Wahrscheinlichkeitsrechnung und Statistik für Biologen Diskriminanzanalyse Martin Hutzenthaler & Dirk Metzler 6. Juli 2010

2 Übersicht 1 Ruf des Kleinspechts 2 Modell Vorgehen der Diskriminanzanalyse (Mehrdimensionale) Normalverteilung 3 Zurück zu den Rufen eine Variable zwei Variable zehn Dimensionen 4 Principal component analysis (PCA)

3 Übersicht Ruf des Kleinspechts 1 Ruf des Kleinspechts 2 Modell Vorgehen der Diskriminanzanalyse (Mehrdimensionale) Normalverteilung 3 Zurück zu den Rufen eine Variable zwei Variable zehn Dimensionen 4 Principal component analysis (PCA)

4 Ruf des Kleinspechts photo (c) Thermos (Bild zeigt einen Kleinspecht (Picoides minor))

5 Ruf des Kleinspechts Man kann die Geschlechter optisch unterscheiden.

6 Ruf des Kleinspechts Man kann die Geschlechter optisch unterscheiden. Frage: Geht es auch akustisch?

7 Ruf des Kleinspechts Ruf des Kleinspechts: ki ki ki ki ki ki ki

8 Ruf des Kleinspechts Ruf des Kleinspechts: Längen der letzten fünf Pausen p1 p2 p3 p4 p5 ki ki ki ki ki ki ki

9 Ruf des Kleinspechts Ruf des Kleinspechts: Längen der letzten fünf Pausen und Laute p1 p2 p3 p4 p5 ki ki ki ki ki ki ki l1 l2 l3 l4 l5

10 Ruf des Kleinspechts Frage:

11 Ruf des Kleinspechts Frage: Kann man aus den Längen der Pausen und der Laute

12 Ruf des Kleinspechts Frage: Kann man aus den Längen der Pausen und der Laute (p1, p2, p3, p4, p5, l1, l2, l3, l4, l5)

13 Ruf des Kleinspechts Frage: Kann man aus den Längen der Pausen und der Laute (p1, p2, p3, p4, p5, l1, l2, l3, l4, l5) das Geschlecht bestimmen?

14 Ruf des Kleinspechts Daten: 62 Rufe von Kleinspechten

15 Ruf des Kleinspechts Daten: 62 Rufe von Kleinspechten 18 Rufe von Männchen 44 Rufe von Weibchen

16 Ruf des Kleinspechts Daten: 62 Rufe von Kleinspechten 18 Rufe von Männchen 44 Rufe von Weibchen Daten von Dr. Kerstin Höntsch, Frankfurt (siehe aufbereitet von Dr. Brooks Ferebee, Frankfurt

17 Ruf des Kleinspechts Die Daten in computergerechter Form: G p1 p2 p3 p4 p5 l1 l2 l3 l4 l

18 Ruf des Kleinspechts Gesucht:

19 Ruf des Kleinspechts Gesucht: eine dem menschlichen Gehirn gerechte Darstellung des Vektors (p1, p2,p3, p4,p5, l1, l2, l3, l4, l5)

20 Ruf des Kleinspechts Alle 62 Rufe: rot=männchen, schwarz=weibchen

21 Ruf des Kleinspechts Mit dem Auge kann man Unterschiede erkennen:

22 Ruf des Kleinspechts Männchen oder Weibchen?

23 Ruf des Kleinspechts Männchen oder Weibchen? Typisch Männchen

24 Ruf des Kleinspechts Männchen oder Weibchen?

25 Ruf des Kleinspechts Männchen oder Weibchen? Typisch Weibchen

26 Ruf des Kleinspechts Männchen oder Weibchen?

27 Ruf des Kleinspechts Männchen oder Weibchen? Männchen

28 Ruf des Kleinspechts Manchmal ist es schwierig: Männchen oder Weibchen?

29 Ruf des Kleinspechts Manchmal ist es schwierig: Männchen oder Weibchen? Weibchen (untypisch)

30 Ruf des Kleinspechts Das Auge

31 Ruf des Kleinspechts Das Auge (das Gehirn)

32 Ruf des Kleinspechts Das Auge (das Gehirn) sieht Unterschiede.

33 Ruf des Kleinspechts Das Auge (das Gehirn) sieht Unterschiede. Schafft es der Computer

34 Ruf des Kleinspechts Das Auge (das Gehirn) sieht Unterschiede. Schafft es der Computer (mit Hilfe der Mathematik) auch?

35 Übersicht Modell 1 Ruf des Kleinspechts 2 Modell Vorgehen der Diskriminanzanalyse (Mehrdimensionale) Normalverteilung 3 Zurück zu den Rufen eine Variable zwei Variable zehn Dimensionen 4 Principal component analysis (PCA)

36 Modell Die 10 Zahlen (p1, p2,p3, p4,p5, l1, l2, l3, l4, l5) fassen wir als die Koordinaten eines Punktes im 10-dimensionalen Raum R 10 auf.

37 Modell Die 10 Zahlen (p1, p2,p3, p4,p5, l1, l2, l3, l4, l5) fassen wir als die Koordinaten eines Punktes im 10-dimensionalen Raum R 10 auf. Jeder Ruf entspricht einem Zufallspunkt im R 10 :

38 Modell Die 10 Zahlen (p1, p2,p3, p4,p5, l1, l2, l3, l4, l5) fassen wir als die Koordinaten eines Punktes im 10-dimensionalen Raum R 10 auf. Jeder Ruf entspricht einem Zufallspunkt im R 10 : Männchenrufe aus einer Population mit Dichte f m

39 Modell Die 10 Zahlen (p1, p2,p3, p4,p5, l1, l2, l3, l4, l5) fassen wir als die Koordinaten eines Punktes im 10-dimensionalen Raum R 10 auf. Jeder Ruf entspricht einem Zufallspunkt im R 10 : Männchenrufe aus einer Population mit Dichte f m Weibchenrufe aus einer Population mit Dichte f w

40 Modell Die 10 Zahlen (p1, p2,p3, p4,p5, l1, l2, l3, l4, l5) fassen wir als die Koordinaten eines Punktes im 10-dimensionalen Raum R 10 auf. Jeder Ruf entspricht einem Zufallspunkt im R 10 : Männchenrufe aus einer Population mit Dichte f m Weibchenrufe aus einer Population mit Dichte f w Gesucht: Eine Regel, die jeden neuen Punkt x = (p1, p2,p3, p4,p5, l1, l2, l3, l4, l5) einer der beiden Populationen zuweist.

41 Übersicht Modell Vorgehen der Diskriminanzanalyse 1 Ruf des Kleinspechts 2 Modell Vorgehen der Diskriminanzanalyse (Mehrdimensionale) Normalverteilung 3 Zurück zu den Rufen eine Variable zwei Variable zehn Dimensionen 4 Principal component analysis (PCA)

42 Verfahren Modell Vorgehen der Diskriminanzanalyse 1 Schätze f m und f w

43 Verfahren Modell Vorgehen der Diskriminanzanalyse 1 Schätze f m und f w 2 Ordne x der Population mit dem größeren f -Wert zu.

44 Verfahren Modell Vorgehen der Diskriminanzanalyse 1 Schätze f m und f w 2 Ordne x der Population mit dem größeren f -Wert zu. Wir benutzen für f m und f w mehrdimensionale Normalverteilungen.

45 Verfahren Modell Vorgehen der Diskriminanzanalyse 1 Schätze f m und f w 2 Ordne x der Population mit dem größeren f -Wert zu. Wir benutzen für f m und f w mehrdimensionale Normalverteilungen. Vorteil: Leicht anzupassen.

46 Verfahren Modell Vorgehen der Diskriminanzanalyse 1 Schätze f m und f w 2 Ordne x der Population mit dem größeren f -Wert zu. Wir benutzen für f m und f w mehrdimensionale Normalverteilungen. Vorteil: Leicht anzupassen. Wir müssen nur Mittelwert(svektor) und Varianz (mehrdimensional: die Kovarianzmatrix) schätzen.

47 Übersicht Modell (Mehrdimensionale) Normalverteilung 1 Ruf des Kleinspechts 2 Modell Vorgehen der Diskriminanzanalyse (Mehrdimensionale) Normalverteilung 3 Zurück zu den Rufen eine Variable zwei Variable zehn Dimensionen 4 Principal component analysis (PCA)

48 Modell (Mehrdimensionale) Normalverteilung Erinnerung: Eindimensionale Normalverteilung Dichte

49 Modell (Mehrdimensionale) Normalverteilung Erinnerung: Eindimensionale Normalverteilung Dichte Mittelwert

50 Modell (Mehrdimensionale) Normalverteilung Erinnerung: Eindimensionale Normalverteilung Dichte Mittelwert Standardabweichung

51 Modell (Mehrdimensionale) Normalverteilung Zur Beschreibung einer mehrdimensionalen Normalverteilung benötigt man Einen Mittelwertvektor µ Ein Achsenkreuz (die Hauptachsen ) Standardabweichungen in den Achsenrichtungen

52 Übersicht Zurück zu den Rufen 1 Ruf des Kleinspechts 2 Modell Vorgehen der Diskriminanzanalyse (Mehrdimensionale) Normalverteilung 3 Zurück zu den Rufen eine Variable zwei Variable zehn Dimensionen 4 Principal component analysis (PCA)

53 Zurück zu den Rufen In unserem Problem gibt es 10 Dimensionen.

54 Zurück zu den Rufen In unserem Problem gibt es 10 Dimensionen. Wir beginnen eindimensional.

55 Zurück zu den Rufen In unserem Problem gibt es 10 Dimensionen. Wir beginnen eindimensional. Frage: Welche eine der 10 Variablen sollen wir wählen?

56 Zurück zu den Rufen Länge der Laute bei Männchen (rot) und Weibchen (schwarz) Länge (Sek) l1 l2 l3 l4 l5 Laut

57 Zurück zu den Rufen Länge der Laute bei Männchen (rot) und Weibchen (schwarz) Länge (Sek) l1 l2 l3 l4 l5 Laut Keine gute Trennung der Geschlechter

58 Zurück zu den Rufen Länge der Pausen bei Männchen (rot) und Weibchen (schwarz) Länge (Sek) p1 p2 p3 p4 p5 Pause

59 Zurück zu den Rufen Bei den Männchen sind die Pausen typischerweise länger Länge der Pausen bei Männchen (rot) und Weibchen (schwarz) Länge (Sek) p1 p2 p3 p4 p5 Pause

60 Übersicht Zurück zu den Rufen eine Variable 1 Ruf des Kleinspechts 2 Modell Vorgehen der Diskriminanzanalyse (Mehrdimensionale) Normalverteilung 3 Zurück zu den Rufen eine Variable zwei Variable zehn Dimensionen 4 Principal component analysis (PCA)

61 Zurück zu den Rufen eine Variable Wie gut läßt sich das Geschlecht anhand von p2, der Länge der zweiten Pause, bestimmen?

62 Zurück zu den Rufen eine Variable Die p2-werte (mit Jitter) p2

63 Zurück zu den Rufen eine Variable p2-werte (nur Männchen) p2

64 Zurück zu den Rufen eine Variable p2-werte (nur Männchen) Mittelwert µ m = 0, p2

65 Zurück zu den Rufen eine Variable p2-werte (nur Männchen) Mittelwert µ m = 0,1316, Standardabweichung σ m = 0,0150 p2

66 Zurück zu den Rufen eine Variable Wir approximieren f m durch die Normalverteilung mit Mittelwert µ m und Standardabweichung σ m

67 Zurück zu den Rufen eine Variable Wir approximieren f m durch die Normalverteilung mit Mittelwert µ m und Standardabweichung σ m p2-werte (Männchen) und (geschätztes) f m p2

68 Zurück zu den Rufen eine Variable p2-werte (nur Weibchen) p2

69 Zurück zu den Rufen eine Variable p2-werte (nur Weibchen) Mittelwert µ w = 0, p2

70 Zurück zu den Rufen eine Variable p2-werte (nur Weibchen) Mittelwert µ w = 0,0938, Standardabweichung σ m = 0,0201 p2

71 Zurück zu den Rufen eine Variable Wir approximieren f w durch die Normalverteilung mit Mittelwert µ w und Standardabweichung σ w

72 Zurück zu den Rufen eine Variable Wir approximieren f w durch die Normalverteilung mit Mittelwert µ w und Standardabweichung σ w p2-werte (Weibchen) und (geschätztes) f w p2

73 Zurück zu den Rufen eine Variable Klassifikationsregel:

74 Zurück zu den Rufen eine Variable Klassifikationsregel: f m größer Männchen

75 Zurück zu den Rufen eine Variable Klassifikationsregel: f m größer Männchen f w größer Weibchen

76 Zurück zu den Rufen eine Variable p2-werte p2

77 Zurück zu den Rufen eine Variable p2-werte p2

78 Zurück zu den Rufen eine Variable p2-werte 'Weibchen' 'Männchen' p2

79 Zurück zu den Rufen eine Variable Falsch klassifiziert:

80 Zurück zu den Rufen eine Variable Falsch klassifiziert: 1 Männchen p2

81 Zurück zu den Rufen eine Variable Falsch klassifiziert: 1 Männchen 6 Weibchen p2

82 Übersicht Zurück zu den Rufen zwei Variable 1 Ruf des Kleinspechts 2 Modell Vorgehen der Diskriminanzanalyse (Mehrdimensionale) Normalverteilung 3 Zurück zu den Rufen eine Variable zwei Variable zehn Dimensionen 4 Principal component analysis (PCA)

83 Zurück zu den Rufen zwei Variable Zur Verbesserung der Klassifikation nehmen wir mehr Information hinzu, z.b. eine weitere Variable.

84 Zurück zu den Rufen zwei Variable Zur Verbesserung der Klassifikation nehmen wir mehr Information hinzu, z.b. eine weitere Variable. Wir betrachten: Erste Variable = p2 Zweite Variable = l2

85 Zurück zu den Rufen zwei Variable l2

86 Zurück zu den Rufen zwei Variable l2 Beobachtung: l2 allein trennt die Geschlechter sehr schlecht.

87 Zurück zu den Rufen zwei Variable Aber: l2 zusammen mit p2 gibt zusätzliche Information: p2 l2

88 Zurück zu den Rufen zwei Variable Aber: l2 zusammen mit p2 gibt zusätzliche Information: p2 l2 Beispielsweise zeigt die Hinzunahme von l2, dass die 5 Punkte oben rechts besser zu den Weibchen passen.

89 Zurück zu den Rufen zwei Variable Wir approximieren die Verteilungen von (p2, l2) bei Männchen und bei Weibchen durch zweidimensionale Normalverteilungen.

90 Zurück zu den Rufen zwei Variable (p2, l2), Männchen l p2

91 Zurück zu den Rufen zwei Variable Wie im eindimensionalen Fall schätzen wir den (zweidimensionalen) Mittelwert

92 Zurück zu den Rufen zwei Variable Wie im eindimensionalen Fall schätzen wir den (zweidimensionalen) Mittelwert und die (zweidimensionale) Varianz (d.h. die sog. Kovarianzmatrix)

93 Zurück zu den Rufen zwei Variable Wie im eindimensionalen Fall schätzen wir den (zweidimensionalen) Mittelwert und die (zweidimensionale) Varianz (d.h. die sog. Kovarianzmatrix) und approximieren f m durch eine zweidimensionale Normalverteilung mit dem geschätzten Mittelwert und der geschätzten Varianz.

94 Zurück zu den Rufen zwei Variable (p2, l2) für Männchen und f m l p2

95 Zurück zu den Rufen zwei Variable Viele der Weibchen passen schlecht zu f m : p2 l2

96 Zurück zu den Rufen zwei Variable Analog für die Weibchen: (p2, l2) für Weibchen p2 l2

97 Zurück zu den Rufen zwei Variable Analog für die Weibchen: (p2, l2) für Weibchen und f w p2 l2

98 Zurück zu den Rufen zwei Variable Viele der Männchen passen schlecht zu f w : p2 l2

99 Zurück zu den Rufen zwei Variable Klassifikation: Für jeden Punkt berechnen wir f m (x) und f w (x). f m (x) größer Männchen f w (x) größer Weibchen

100 Zurück zu den Rufen zwei Variable Klassifikation: Für jeden Punkt berechnen wir f m (x) und f w (x). f m (x) größer Männchen f w (x) größer Weibchen

101 Zurück zu den Rufen zwei Variable log(f w ) gegen log(f m ) und Diagonale: log(fw) log(fm)

102 Zurück zu den Rufen zwei Variable log(f w ) gegen log(f m ) und Diagonale: log(fw) 'Weibchen' 'Männchen' log(fm)

103 Zurück zu den Rufen zwei Variable log(f w ) gegen log(f m ) und Diagonale: log(fw) 'Weibchen' 'Männchen' log(fm)

104 Zurück zu den Rufen zwei Variable log(f w ) gegen log(f m ) und Diagonale, Ausschnittvergrößerung: log(fw) 'Weibchen' 'Männchen' log(fm)

105 Zurück zu den Rufen zwei Variable Falsch klassifiziert: log(fw) 'Weibchen' 'Männchen' log(fm)

106 Zurück zu den Rufen zwei Variable Falsch klassifiziert: 1 Männchen log(fw) 'Weibchen' 'Männchen' log(fm)

107 Zurück zu den Rufen zwei Variable Falsch klassifiziert: 1 Männchen, 1 Weibchen log(fw) 'Weibchen' 'Männchen' log(fm)

108 Zurück zu den Rufen zwei Variable Falsch klassifiziert: 1 Männchen, 1 Weibchen (und eigentlich 2 unentschieden ) log(fw) 'Weibchen' 'Männchen' log(fm)

109 Zurück zu den Rufen zwei Variable Welche Fälle wurden falsch zugeordnet? p2 l2

110 Zurück zu den Rufen zwei Variable Welche Fälle wurden falsch zugeordnet? p2 l2 Wenn man nur p2 und l2 kennt, ist es sehr verständlich, dass diese Fälle falsch klassifiziert werden.

111 Übersicht Zurück zu den Rufen zehn Dimensionen 1 Ruf des Kleinspechts 2 Modell Vorgehen der Diskriminanzanalyse (Mehrdimensionale) Normalverteilung 3 Zurück zu den Rufen eine Variable zwei Variable zehn Dimensionen 4 Principal component analysis (PCA)

112 Zurück zu den Rufen zehn Dimensionen Wir verfahren genause mit allen Variablen (p1, p2, p3, p4, p5, l1, l2, l3, l4, l5) gemeinsam

113 Zurück zu den Rufen zehn Dimensionen Wir verfahren genause mit allen Variablen (p1, p2, p3, p4, p5, l1, l2, l3, l4, l5) gemeinsam mathematisch analog, allerdings geometrisch sehr schwierig darzustellen.

114 Zurück zu den Rufen zehn Dimensionen Ergebnis: log(f w ) gegen log(f m ) und Diagonale (basierend auf allen 10 Variablen): log(fm) log(fw)

115 Zurück zu den Rufen zehn Dimensionen Ergebnis: log(f w ) gegen log(f m ) und Diagonale (basierend auf allen 10 Variablen): log(fm) log(fw)

116 Zurück zu den Rufen zehn Dimensionen log(f w ) gegen log(f m ) und Diagonale (basierend auf allen 10 Variablen, Ausschnittvergrößerung): log(fw) log(fm)

117 Zurück zu den Rufen zehn Dimensionen log(f w ) gegen log(f m ) und Diagonale (basierend auf allen 10 Variablen, Ausschnittvergrößerung): Die zwei mit (p2,l2) falsch klassifizierten Fälle wurden nun richtig klassifiziert.

118 Zurück zu den Rufen zehn Dimensionen log(f w ) gegen log(f m ) und Diagonale (basierend auf allen 10 Variablen, Ausschnittvergrößerung): Die zwei mit (p2,l2) falsch klassifizierten Fälle wurden nun richtig klassifiziert. Allerdings wurden zwei Weibchen (knapp) falsch klassifiziert.

119 Zurück zu den Rufen zehn Dimensionen Falsch klassifiziert Die beiden falsch klassifierten Rufe: sie sehen ziemlich männlich aus.

120 Übersicht Principal component analysis (PCA) 1 Ruf des Kleinspechts 2 Modell Vorgehen der Diskriminanzanalyse (Mehrdimensionale) Normalverteilung 3 Zurück zu den Rufen eine Variable zwei Variable zehn Dimensionen 4 Principal component analysis (PCA)

121 Principal component analysis (PCA) Wir wollen multi-dimensionale Daten visualisieren, um gewisse Muster zu finden.

122 Principal component analysis (PCA) Wir wollen multi-dimensionale Daten visualisieren, um gewisse Muster zu finden. Wie visualisieren wir multi-dimensionale Daten???

123 Principal component analysis (PCA) Beispiel: 2-dimensionale Daten in 3 Dimensionen (Vorstellung: Wolke rotiert in 3 Dimensionen)

124 Principal component analysis (PCA) Beispiel: 2-dimensionale Daten in 3 Dimensionen (Vorstellung: Wolke rotiert in 3 Dimensionen)

125 Principal component analysis (PCA) Beispiel: 2-dimensionale Daten in 3 Dimensionen (Vorstellung: Wolke rotiert in 3 Dimensionen)

126 Principal component analysis (PCA) Beispiel: 2-dimensionale Daten in 3 Dimensionen (Vorstellung: Wolke rotiert in 3 Dimensionen)

127 Principal component analysis (PCA) Beispiel: 2-dimensionale Daten in 3 Dimensionen (Vorstellung: Wolke rotiert in 3 Dimensionen)

128 Principal component analysis (PCA) Beispiel: 2-dimensionale Daten in 3 Dimensionen (Vorstellung: Wolke rotiert in 3 Dimensionen)

129 Principal component analysis (PCA) Um einen guten Blick auf die Daten zu haben wollen wir die Komponenten darstellen, die die meiste Variation beitragen.

130 Principal component analysis (PCA) Um einen guten Blick auf die Daten zu haben wollen wir die Komponenten darstellen, die die meiste Variation beitragen. Die Achse mit der größten Variation wird in die x-achse rotiert,

131 Principal component analysis (PCA) Um einen guten Blick auf die Daten zu haben wollen wir die Komponenten darstellen, die die meiste Variation beitragen. Die Achse mit der größten Variation wird in die x-achse rotiert, die Achse mit der zweit größten Variation wird in die y-achse rotiert.

132 Principal component analysis (PCA) Beispiel: 2-dimensionale Daten

133 Principal component analysis (PCA) Beispiel: 2-dimensionale Daten

134 Principal component analysis (PCA) Die Hauptkomponentenanalyse (engl. principal component analysis) findet die Achse mit dem größten Beitrag zur gesamten Variation.

135 Principal component analysis (PCA) Die Hauptkomponentenanalyse (engl. principal component analysis) findet die Achse mit dem größten Beitrag zur gesamten Variation. Alles weitere hierzu in der Vorlesung Multivariate Statistics in Ecology and Quantitative Genetics (Master Studium)

Biostatistik, WS 2015/2016 Exkurs: Ein Beispiel zur Diskriminanzanalyse

Biostatistik, WS 2015/2016 Exkurs: Ein Beispiel zur Diskriminanzanalyse 1/55 Biostatistik, WS 2015/2016 Exkurs: Ein Beispiel zur Diskriminanzanalyse Matthias Birkner http://www.staff.uni-mainz.de/birkner/biostatistik1516/ 29.1.2016 3/55 photo (c) Thermos ein Kleinspecht (Picoides

Mehr

Wahrscheinlichkeitsrechnung und Statistik für Biologen Diskriminanzanalyse

Wahrscheinlichkeitsrechnung und Statistik für Biologen Diskriminanzanalyse Wahrscheinlichkeitsrechnung und Statistik für Biologen Diskriminanzanalyse Noémie Becker & Dirk Metzler http://evol.bio.lmu.de/_statgen 3. Juli 2013 Übersicht 1 Ruf des Kleinspechts 2 Modell Vorgehen der

Mehr

Biostatistik, WS 2013/2014 Exkurs: Faktorielle Varianzanalyse und F -Test, Diskriminanzanalyse

Biostatistik, WS 2013/2014 Exkurs: Faktorielle Varianzanalyse und F -Test, Diskriminanzanalyse 1/76 Biostatistik, WS 2013/2014 Exkurs: Faktorielle Varianzanalyse und F -Test, Diskriminanzanalyse Matthias Birkner http://www.mathematik.uni-mainz.de/~birkner/biostatistik1314/ 31.1.2014 Einfaktorielle

Mehr

Wahrscheinlichkeitsrechnung und Statistik für Biologen Spezielle Verteilungen

Wahrscheinlichkeitsrechnung und Statistik für Biologen Spezielle Verteilungen Wahrscheinlichkeitsrechnung und Statistik für Biologen Spezielle Verteilungen Noémie Becker & Dirk Metzler http://evol.bio.lmu.de/_statgen 7. Juni 2013 1 Binomialverteilung 2 Normalverteilung 3 T-Verteilung

Mehr

Wahrscheinlichkeitsrechnung und Statistik für Biologen 2. Der Standardfehler

Wahrscheinlichkeitsrechnung und Statistik für Biologen 2. Der Standardfehler Wahrscheinlichkeitsrechnung und Statistik für Biologen 2. Der Standardfehler Noémie Becker & Dirk Metzler 15. April 2016 Inhaltsverzeichnis 1 Der Standardfehler 1 1.1 Ein Versuch............................................

Mehr

Wahrscheinlichkeitsrechnung und Statistik für Biologen 2. Der Standardfehler

Wahrscheinlichkeitsrechnung und Statistik für Biologen 2. Der Standardfehler Wahrscheinlichkeitsrechnung und Statistik für Biologen 2. Der Standardfehler Martin Hutzenthaler & Dirk Metzler http://www.zi.biologie.uni-muenchen.de/evol/statgen.html 27. April 2010 1 Eine kurze Wiederholung

Mehr

2.3 Intervallschätzung

2.3 Intervallschätzung 2.3.1 Motivation und Hinführung Bsp. 2.11. [Wahlumfrage] Der wahre Anteil der rot-grün Wähler 2009 war genau 33.7%. Wie groß ist die Wahrscheinlichkeit, in einer Zufallsstichprobe von 1000 Personen genau

Mehr

Wahrscheinlichkeitsrechnung und Statistik für Biologen 2. Der Standardfehler

Wahrscheinlichkeitsrechnung und Statistik für Biologen 2. Der Standardfehler Wahrscheinlichkeitsrechnung und Statistik für Biologen 2. Der Standardfehler Martin Hutzenthaler & Dirk Metzler 27. April 2010 Inhaltsverzeichnis 1 Eine kurze Wiederholung zur deskriptiven Statistik 2

Mehr

Wahrscheinlichkeitsrechnung und Statistik für Biologen Wiederholung: Verteilungen

Wahrscheinlichkeitsrechnung und Statistik für Biologen Wiederholung: Verteilungen Wahrscheinlichkeitsrechnung und Statistik für Biologen Wiederholung: Verteilungen Noémie Becker & Dirk Metzler 31. Mai 2016 Inhaltsverzeichnis 1 Binomialverteilung 1 2 Normalverteilung 2 3 T-Verteilung

Mehr

2.3 Intervallschätzung

2.3 Intervallschätzung 2.3.1 Motivation und Hinführung Bsp. 2.15. [Wahlumfrage] Der wahre Anteil der rot-grün Wähler unter allen Wählern war 2009 auf eine Nachkommastelle gerundet genau 33.7%. Wie groß ist die Wahrscheinlichkeit,

Mehr

Biostatistik, WS 2017/18 Der Standardfehler

Biostatistik, WS 2017/18 Der Standardfehler 1/70 Biostatistik, WS 2017/18 Matthias Birkner http://www.staff.uni-mainz.de/birkner/biostatistik1718/ 24.11.2017 3/70 Ein Versuch Hirse Bild: Panicum miliaceum 4/70 Ein Versuch Ein Versuch Versuchsaufbau:

Mehr

Konfidenzintervalle Grundlegendes Prinzip Erwartungswert Bekannte Varianz Unbekannte Varianz Anteilswert Differenzen von Erwartungswert Anteilswert

Konfidenzintervalle Grundlegendes Prinzip Erwartungswert Bekannte Varianz Unbekannte Varianz Anteilswert Differenzen von Erwartungswert Anteilswert Konfidenzintervalle Grundlegendes Prinzip Erwartungswert Bekannte Varianz Unbekannte Varianz Anteilswert Differenzen von Erwartungswert Anteilswert Beispiel für Konfidenzintervall Im Prinzip haben wir

Mehr

Statistik, Datenanalyse und Simulation

Statistik, Datenanalyse und Simulation Dr. Michael O. Distler distler@kph.uni-mainz.de Mainz, 5. Juli 2011 Zunächst: PCA (Hauptkomponentenanalyse) ist eine mathematische Prozedur, die eine Anzahl von (möglicherweise korrelierten) Variablen

Mehr

Mathematik für Naturwissenschaftler II

Mathematik für Naturwissenschaftler II Mathematik für Naturwissenschaftler II Dr Peter J Bauer Institut für Mathematik Universität Frankfurt am Main Sommersemester 27 Lineare Algebra Der mehrdimensionale Raum Vektoren Im Teil I dieser Vorlesung

Mehr

2.Tutorium Multivariate Verfahren

2.Tutorium Multivariate Verfahren 2.Tutorium Multivariate Verfahren - Multivariate Verteilungen - Hannah Busen: 27.04.2015 und 04.05.2015 Nicole Schüller: 28.04.2015 und 05.05.2015 Institut für Statistik, LMU München 1 / 21 Gliederung

Mehr

13 Mehrdimensionale Zufallsvariablen Zufallsvektoren

13 Mehrdimensionale Zufallsvariablen Zufallsvektoren 3 Mehrdimensionale Zufallsvariablen Zufallsvektoren Bisher haben wir uns ausschließlich mit Zufallsexperimenten beschäftigt, bei denen die Beobachtung eines einzigen Merkmals im Vordergrund stand. In diesem

Mehr

Wahrscheinlichkeitsrechnung und Statistik für Biologen 7. Konfidenzintervalle

Wahrscheinlichkeitsrechnung und Statistik für Biologen 7. Konfidenzintervalle Wahrscheinlichkeitsrechnung und Statistik für Biologen 7. Konfidenzintervalle Matthias Birkner & Dirk Metzler http://www.zi.biologie.uni-muenchen.de/evol/statgen.html 9. Juni 2009 1 Wiederholung: Bedingte

Mehr

Klassifikation von Daten Einleitung

Klassifikation von Daten Einleitung Klassifikation von Daten Einleitung Lehrstuhl für Künstliche Intelligenz Institut für Informatik Friedrich-Alexander-Universität Erlangen-Nürnberg (Lehrstuhl Informatik 8) Klassifikation von Daten Einleitung

Mehr

Kapitel IX - Mehrdimensionale Zufallsvariablen

Kapitel IX - Mehrdimensionale Zufallsvariablen Institut für Volkswirtschaftslehre (ECON) Lehrstuhl für Ökonometrie und Statistik Kapitel IX - Mehrdimensionale Zufallsvariablen Wahrscheinlichkeitstheorie Prof. Dr. W.-D. Heller Hartwig Senska Carlo Siebenschuh

Mehr

10.5 Maximum-Likelihood Klassifikation (I)

10.5 Maximum-Likelihood Klassifikation (I) Klassifikation (I) Idee Für die Klassifikation sind wir interessiert an den bedingten Wahrscheinlichkeiten p(c i (x,y) D(x,y)). y Wenn man diese bedingten Wahrscheinlichkeiten kennt, dann ordnet man einem

Mehr

Übungsblatt 11 zur Vorlesung Statistische Methoden - freiwilliger Teil

Übungsblatt 11 zur Vorlesung Statistische Methoden - freiwilliger Teil Dr. Christof Luchsinger Übungsblatt zur Vorlesung Statistische Methoden - freiwilliger Teil Rechnen mit Matrizen, Multivariate Normalverteilung Herausgabe des Übungsblattes: Woche 0, Abgabe der Lösungen:

Mehr

Eine Zufallsvariable X sei stetig gleichverteilt im Intervall [0,5]. Die Wahrscheinlichkeit P(2< x <4) ist dann

Eine Zufallsvariable X sei stetig gleichverteilt im Intervall [0,5]. Die Wahrscheinlichkeit P(2< x <4) ist dann 4. Übung Themenkomplex: Zufallsvariablen und ihre Verteilung Aufgabe 1 Für eine stetige Zufallsvariable gilt: a) P (x = t) > 0 b) P (x 1) = F (1) c) P (x = 1) = 0 d) P (x 1) = 1 F(1) e) P (x 1) = 1 F(1)

Mehr

Multivariate Verteilungen. Gerhard Tutz LMU München

Multivariate Verteilungen. Gerhard Tutz LMU München Multivariate Verteilungen Gerhard Tutz LMU München INHALTSVERZEICHNIS 1 Inhaltsverzeichnis 1 Multivariate Normalverteilung 3 Wishart Verteilung 7 3 Hotellings T Verteilung 11 4 Wilks Λ 14 INHALTSVERZEICHNIS

Mehr

5.Tutorium Multivariate Verfahren

5.Tutorium Multivariate Verfahren 5.Tutorium Multivariate Verfahren - Hauptkomponentenanalyse - Nicole Schüller: 27.06.2016 und 04.07.2016 Hannah Busen: 28.06.2016 und 05.07.2016 Institut für Statistik, LMU München 1 / 18 Gliederung 1

Mehr

Multivariate Verfahren

Multivariate Verfahren Selbstkontrollarbeit 1 Multivariate Verfahren Musterlösung Aufgabe 1 (40 Punkte) Auf der dem Kurs beigelegten CD finden Sie im Unterverzeichnis Daten/Excel/ die Datei zahlen.xlsx. Alternativ können Sie

Mehr

Klassifikation und Ähnlichkeitssuche

Klassifikation und Ähnlichkeitssuche Klassifikation und Ähnlichkeitssuche Vorlesung XIII Allgemeines Ziel Rationale Zusammenfassung von Molekülen in Gruppen auf der Basis bestimmter Eigenschaften Auswahl von repräsentativen Molekülen Strukturell

Mehr

Überblick. Einführung in die automatische Mustererkennung Grundlagen der Wahrscheinlichkeitsrechnung

Überblick. Einführung in die automatische Mustererkennung Grundlagen der Wahrscheinlichkeitsrechnung Grundlagen Überblick Einführung in die automatische Mustererkennung Grundlagen der Wahrscheinlichkeitsrechnung Klassifikation bei bekannter Wahrscheinlichkeitsverteilung Entscheidungstheorie Bayes-Klassifikator

Mehr

Statistisches Testen

Statistisches Testen Statistisches Testen Grundlegendes Prinzip Erwartungswert Bekannte Varianz Unbekannte Varianz Differenzen Anteilswert Chi-Quadrat Tests Gleichheit von Varianzen Prinzip des Statistischen Tests Konfidenzintervall

Mehr

Mathematische Werkzeuge R. Neubecker, WS 2016 / 2017

Mathematische Werkzeuge R. Neubecker, WS 2016 / 2017 Mustererkennung Mathematische Werkzeuge R. Neubecker, WS 2016 / 2017 Optimierung: Lagrange-Funktionen, Karush-Kuhn-Tucker-Bedingungen Optimierungsprobleme Optimierung Suche nach dem Maximum oder Minimum

Mehr

Statistik II. IV. Hypothesentests. Martin Huber

Statistik II. IV. Hypothesentests. Martin Huber Statistik II IV. Hypothesentests Martin Huber 1 / 22 Übersicht Weitere Hypothesentests in der Statistik 1-Stichproben-Mittelwert-Tests 1-Stichproben-Varianz-Tests 2-Stichproben-Tests Kolmogorov-Smirnov-Test

Mehr

Zufallsvariablen. Diskret. Stetig. Verteilung der Stichprobenkennzahlen. Binomial Hypergeometrisch Poisson. Normal Lognormal Exponential

Zufallsvariablen. Diskret. Stetig. Verteilung der Stichprobenkennzahlen. Binomial Hypergeometrisch Poisson. Normal Lognormal Exponential Zufallsvariablen Diskret Binomial Hypergeometrisch Poisson Stetig Normal Lognormal Exponential Verteilung der Stichprobenkennzahlen Stetige Zufallsvariable Verteilungsfunktion: Dichtefunktion: Integralrechnung:

Mehr

Mathematische Werkzeuge R. Neubecker, WS 2018 / 2019 Optimierung Lagrange-Funktionen, Karush-Kuhn-Tucker-Bedingungen

Mathematische Werkzeuge R. Neubecker, WS 2018 / 2019 Optimierung Lagrange-Funktionen, Karush-Kuhn-Tucker-Bedingungen Mustererkennung Mathematische Werkzeuge R. Neubecker, WS 018 / 019 Optimierung Lagrange-Funktionen, Karush-Kuhn-Tucker-Bedingungen 1 Optimierung Optimierungsprobleme Suche nach dem Maximum oder Minimum

Mehr

IDEE DER STATISTIK: Variabilität (Erscheinung der Natur) durch. Zufall (mathematische Abstraktion) modellieren.

IDEE DER STATISTIK: Variabilität (Erscheinung der Natur) durch. Zufall (mathematische Abstraktion) modellieren. IDEE DER STATISTIK: Variabilität (Erscheinung der Natur) durch Zufall (mathematische Abstraktion) modellieren. Statistik = Datenanalyse mit Hilfe stochastischer Modelle Theoretische Statistik ist ein Teil

Mehr

Mehrdimensionale Verteilungen und Korrelation

Mehrdimensionale Verteilungen und Korrelation Vorlesung: Computergestützte Datenauswertung Mehrdimensionale Verteilungen und Korrelation Günter Quast Fakultät für Physik Institut für Experimentelle Kernphysik SS '17 KIT Die Forschungsuniversität in

Mehr

Multivariate Verfahren

Multivariate Verfahren Selbstkontrollarbeit 1 Multivariate Verfahren Diese Selbstkontrollarbeit bezieht sich auf die Kapitel 1 bis 4 der Kurseinheit 1 (Multivariate Statistik) des Kurses Multivariate Verfahren (883). Hinweise:

Mehr

4 MEHRDIMENSIONALE VERTEILUNGEN

4 MEHRDIMENSIONALE VERTEILUNGEN 4 MEHRDIMENSIONALE VERTEILUNGEN 4.14 Stochastische Vektoren 1. Der Merkmalraum des stochastischen Vektors (X, Y ) sei M = R 2. Betrachten Sie die folgenden Ereignisse und ihre Wahrscheinlichkeiten: A 1

Mehr

Die n-dimensionale Normalverteilung

Die n-dimensionale Normalverteilung U. Mortensen Die n-dimensionale Normalverteilung Es wird zunächst die -dimensionale Normalverteilung betrachtet. Die zufälligen Veränderlichen X und Y seien normalverteilt. Gesucht ist die gemeinsame Verteilung

Mehr

Kalmanfiter (1) Typische Situation für den Einsatz von Kalman-Filtern

Kalmanfiter (1) Typische Situation für den Einsatz von Kalman-Filtern Kalmanfiter (1) Typische Situation für den Einsatz von Kalman-Filtern Vorlesung Robotik SS 016 Kalmanfiter () Kalman-Filter: optimaler rekursiver Datenverarbeitungsalgorithmus optimal hängt vom gewählten

Mehr

Mathematik für Biologen

Mathematik für Biologen Mathematik für Biologen Prof. Dr. Rüdiger W. Braun Heinrich-Heine-Universität Düsseldorf 12. Januar 2011 1 Vergleich zweier Erwartungswerte Was heißt verbunden bzw. unverbunden? t-test für verbundene Stichproben

Mehr

Hauptkomponenten-basierte Klassifikationsverfahren (PCA)

Hauptkomponenten-basierte Klassifikationsverfahren (PCA) Hauptkomponenten-basierte Klassifikationsverfahren (PCA) Projektseminar: Wetterlagen und Feinstaub - Übung Dozent: Claudia Weitnauer Referent: Esther Oßwald, Julian Dare Datum: 30.05.2011 Übersicht 1 Einleitung

Mehr

Statistische Methoden in der Wirtschaftsund Sozialgeographie

Statistische Methoden in der Wirtschaftsund Sozialgeographie Statistische Methoden in der Wirtschaftsund Sozialgeographie Ort: Zeit: Multimediapool Rechenzentrum Mittwoch 0.5--45 Uhr Material: http://www.geomodellierung.de Thema: Beschreibung und Analyse Wirtschafts-

Mehr

Algorithmen für geographische Informationssysteme. 6. Vorlesung: 14. Mai 2014

Algorithmen für geographische Informationssysteme. 6. Vorlesung: 14. Mai 2014 Algorithmen für geographische Informationssysteme 6. Vorlesung: 14. Mai 2014 Ausgleichung bei linearem funktionalen Modell Beispiel 2: Ausgleichung von Höhendifferenzen P 2 Δh 2,3 = 7.0 m P 3 Δh 1,2 =

Mehr

Mathematik für Naturwissenschaften, Teil 2

Mathematik für Naturwissenschaften, Teil 2 Lösungsvorschläge für die Aufgaben zur Vorlesung Mathematik für Naturwissenschaften, Teil Zusatzblatt SS 09 Dr. J. Schürmann keine Abgabe Aufgabe : Eine Familie habe fünf Kinder. Wir nehmen an, dass die

Mehr

Vektoren und Matrizen

Vektoren und Matrizen Vektoren und Matrizen Die multivariate Statistik behandelt statistische Eigenschaften und Zusammenhänge mehrerer Variablen, im Gegensatz zu univariaten Statistik, die in der Regel nur eine Variable untersucht.

Mehr

Dynamische Systeme und Zeitreihenanalyse // Multivariate Normalverteilung und ML Schätzung 11 p.2/38

Dynamische Systeme und Zeitreihenanalyse // Multivariate Normalverteilung und ML Schätzung 11 p.2/38 Dynamische Systeme und Zeitreihenanalyse Multivariate Normalverteilung und ML Schätzung Kapitel 11 Statistik und Mathematik WU Wien Michael Hauser Dynamische Systeme und Zeitreihenanalyse // Multivariate

Mehr

Wahrscheinlichkeitsrechnung und Statistik für Biologen 5. Der zwei-stichproben-t-test. und der Wilcoxon-Test

Wahrscheinlichkeitsrechnung und Statistik für Biologen 5. Der zwei-stichproben-t-test. und der Wilcoxon-Test Wahrscheinlichkeitsrechnung und Statistik für Biologen 5. Der zwei-stichproben-t-test (t-test für ungepaarte Stichproben) und der Wilcoxon-Test Martin Hutzenthaler & Dirk Metzler 20. Mai 2010 Inhaltsverzeichnis

Mehr

Stochastik-Praktikum

Stochastik-Praktikum Stochastik-Praktikum Deskriptive Statistik Peter Frentrup Humboldt-Universität zu Berlin 7. November 2017 (Humboldt-Universität zu Berlin) Zufallszahlen und Monte Carlo 7. November 2017 1 / 27 Übersicht

Mehr

Korrespondenzanalyse

Korrespondenzanalyse Seite 1 von 5 Korrespondenzanalyse Ziel der Korrespondenzanalyse... 1 Anforderungen an die Daten (Stärke des Verfahrens)... 1 Einordnung in die multivariaten Verfahren... 1 Normierung der Daten... 1 Festlegung

Mehr

Principal Component Analysis (PCA) (aka Hauptkomponentenanalyse)

Principal Component Analysis (PCA) (aka Hauptkomponentenanalyse) Principal Component Analysis (PCA) (aka Hauptkomponentenanalyse) Seminar für Statistik Markus Kalisch 25.11.2014 1 Unsupervised Learning Supervised Learning: Erkläre Zielgrösse durch erklärende Variablen

Mehr

Beispiel 4 (Einige weitere Aufgaben)

Beispiel 4 (Einige weitere Aufgaben) 1 Beispiel 4 (Einige weitere Aufgaben) Aufgabe 1 Bestimmen Sie für die folgenden Zweierstichproben, d. h. Stichproben, die jeweils aus zwei Beobachtungen bestehen, a) den Durchschnitt x b) die mittlere

Mehr

Prof. Dr. Fred Böker

Prof. Dr. Fred Böker Statistik III WS 2004/2005; 8. Übungsblatt: Lösungen 1 Prof. Dr. Fred Böker 07.12.2004 Lösungen zum 8. Übungsblatt Aufgabe 1 Die Zufallsvariablen X 1 X 2 besitzen eine gemeinsame bivariate Normalverteilung

Mehr

Vorlesung 7b. Unabhängigkeit bei Dichten. und die mehrdimensionale Standardnormalverteilung

Vorlesung 7b. Unabhängigkeit bei Dichten. und die mehrdimensionale Standardnormalverteilung Vorlesung 7b Unabhängigkeit bei Dichten und die mehrdimensionale Standardnormalverteilung 0. Wiederholung: Die Normalverteilung Dichtefunktion ϕ der Standardnormalverteilung ϕ(x) 0.0 0.1 0.2 0.3 0.4 4

Mehr

Auswertung und Lösung

Auswertung und Lösung Dieses Quiz soll Ihnen helfen, Kapitel 4.6 und 4.7 besser zu verstehen. Auswertung und Lösung Abgaben: 59 / 265 Maximal erreichte Punktzahl: 8 Minimal erreichte Punktzahl: 0 Durchschnitt: 4.78 1 Frage

Mehr

Einfaktorielle Varianzanalyse

Einfaktorielle Varianzanalyse Kapitel 16 Einfaktorielle Varianzanalyse Im Zweistichprobenproblem vergleichen wir zwei Verfahren miteinander. Nun wollen wir mehr als zwei Verfahren betrachten, wobei wir unverbunden vorgehen. Beispiel

Mehr

Lineare Algebra. Mathematik II für Chemiker. Daniel Gerth

Lineare Algebra. Mathematik II für Chemiker. Daniel Gerth Lineare Algebra Mathematik II für Chemiker Daniel Gerth Überblick Lineare Algebra Dieses Kapitel erklärt: Was man unter Vektoren versteht Wie man einfache geometrische Sachverhalte beschreibt Was man unter

Mehr

Einführung in die Hauptkomponentenanalyse

Einführung in die Hauptkomponentenanalyse Einführung in die Hauptkomponentenanalyse Florian Steinke 6. Juni 009 Vorbereitung: Einige Aspekte der multivariaten Gaußverteilung Definition.. Die -D Gaußverteilung für x R ist ( p(x exp (x µ σ. ( Notation:

Mehr

Mathematik für Biologen

Mathematik für Biologen Mathematik für Biologen Prof. Dr. Rüdiger W. Braun Heinrich-Heine Universität Düsseldorf 13. Januar 2010 Termine Letzte Vorlesung am 28.01.2010 Letzte Übung am 27.01.2010, und zwar für alle Anfangsbuchstaben

Mehr

Angewandte Statistik 1

Angewandte Statistik 1 Angewandte Statistik 1 Beschreibende und Explorative Statistik - Wahrscheinlichkeitsrechnung - Zufallsvariablen und Statistische Maßzahlen -Wichtige Verteilungen - Beurteilende Statistik -Vertrauensintervalle

Mehr

MATHEMATIK 3 STUNDEN

MATHEMATIK 3 STUNDEN EUROPÄISCHES ABITUR 2013 MATHEMATIK 3 STUNDEN DATUM : 10. Juni 2013, Vormittag DAUER DER PRÜFUNG: 2 Stunden (120 Minuten) ERLAUBTES HILFSMITTEL Prüfung mit technologischem Hilfsmittel 1/6 DE AUFGABE B1

Mehr

Klausur zur Vorlesung Analyse mehrdimensionaler Daten, Lösungen WS 2010/2011; 6 Kreditpunkte, 90 min

Klausur zur Vorlesung Analyse mehrdimensionaler Daten, Lösungen WS 2010/2011; 6 Kreditpunkte, 90 min Klausur, Analyse mehrdimensionaler Daten, WS 2010/2011, 6 Kreditpunkte, 90 min 1 Prof. Dr. Fred Böker 21.02.2011 Klausur zur Vorlesung Analyse mehrdimensionaler Daten, Lösungen WS 2010/2011; 6 Kreditpunkte,

Mehr

Tests für Erwartungswert & Median

Tests für Erwartungswert & Median Mathematik II für Biologen 26. Juni 2015 Prolog Varianz des Mittelwerts Beispiel: Waage z-test t-test Vorzeichentest Wilcoxon-Rangsummentest Varianz des Mittelwerts Beispiel: Waage Zufallsvariable X 1,...,X

Mehr

Varianzkomponentenschätzung

Varianzkomponentenschätzung Qualitas AG Varianzkomponentenschätzung Peter von Rohr Qualitas AG Peter von Rohr Folien ZL I+II LFW C11 October 29, 2015 2 / 23 Multiple Lineare Regression Annahmen Modell y = Xb + e Varianz der Fehler

Mehr

Auswahl von Schätzfunktionen

Auswahl von Schätzfunktionen Auswahl von Schätzfunktionen Worum geht es in diesem Modul? Überblick zur Punktschätzung Vorüberlegung zur Effizienz Vergleich unserer Schätzer für My unter Normalverteilung Relative Effizienz Einführung

Mehr

3. Gemeinsame und bedingte Verteilung, stochastische Unabhängigkeit

3. Gemeinsame und bedingte Verteilung, stochastische Unabhängigkeit 3. Gemeinsame und bedingte Verteilung, stochastische Unabhängigkeit Lernziele dieses Kapitels: Mehrdimensionale Zufallsvariablen (Zufallsvektoren) (Verteilung, Kenngrößen) Abhängigkeitsstrukturen Multivariate

Mehr

Statistiken deuten und erstellen

Statistiken deuten und erstellen Statistiken deuten und erstellen Dipl. Ök. Jens K. Perret, M.Sc. Evgenija Yushkova, M.A. Schumpeter School of Business and Economics Bergische Universität Wuppertal Gaußstraße 20 42097 Wuppertal Inhalt

Mehr

Wahrscheinlichkeit und Statistik: Zusammenfassung

Wahrscheinlichkeit und Statistik: Zusammenfassung HSR Hochschule für Technik Rapperswil Wahrscheinlichkeit und Statistik: Zusammenfassung beinhaltet Teile des Skripts von Herrn Hardy von Lukas Wilhelm lwilhelm.net 12. Januar 2007 Inhaltsverzeichnis 1

Mehr

Übungen mit dem Applet Vergleich von zwei Mittelwerten

Übungen mit dem Applet Vergleich von zwei Mittelwerten Vergleich von zwei Mittelwerten 1 Übungen mit dem Applet Vergleich von zwei Mittelwerten 1 Statistischer Hintergrund... 2 1.1 Typische Fragestellungen...2 1.2 Fehler 1. und 2. Art...2 1.3 Kurzbeschreibung

Mehr

Einfache Diskriminanzanalyse

Einfache Diskriminanzanalyse SEITE 1 Einfache Diskriminanzanalyse Einführendes Beispiel Gegeben sind zwei Gruppen von Personen, für die jeweils mehrere Merkmale erhoben wurden, z.b. Alter, Einkommen, Zahl der Kinder und Autobesitz

Mehr

Least Absolute Shrinkage And Seletion Operator (LASSO)

Least Absolute Shrinkage And Seletion Operator (LASSO) Least Absolute Shrinkage And Seletion Operator (LASSO) Peter von Rohr 20 März 2017 Lineare Modell und Least Squares Als Ausgangspunkt haben wir das Lineare Modell und Least Squares y = Xβ + ɛ (1) ˆβ =

Mehr

3 Diskriminationsanalyse 3.1 Diskriminationsanalyse mit zwei Gruppen

3 Diskriminationsanalyse 3.1 Diskriminationsanalyse mit zwei Gruppen Lineare Diskrimination mit zwei Gruppen 6.5.3 - - 3 Diskriminationsanalyse 3. Diskriminationsanalyse mit zwei Gruppen Schreibweise: p unabhängige Merkmale: X, X,..., X p (metrisch; auch ordinal möglich,

Mehr

Signalentdeckungstheorie, Dichteschätzung

Signalentdeckungstheorie, Dichteschätzung Signalentdeckungstheorie, Dichteschätzung Mustererkennung und Klassifikation, Vorlesung No. 6 1 M. O. Franz 15.11.2007 1 falls nicht anders vermerkt, sind die Abbildungen entnommen aus Duda et al., 2001.

Mehr

Wahrscheinlichkeitsrechnung und Statistik

Wahrscheinlichkeitsrechnung und Statistik 9. Vorlesung - 2017 Monte Carlo Methode für numerische Integration Sei g : [0, 1] R stetige Funktion; man möchte 1 0 g(t)dt numerisch approximieren mit Hilfe von Zufallszahlen: Sei (U n ) n eine Folge

Mehr

Lösung zur Monte-Carlo Integration

Lösung zur Monte-Carlo Integration Lösung zur Monte-Carlo Integration Berechnen Sie 1 0 1 1 0 0 exp(x+y +z)dxdydz mittels einer geeigneten Monte-Carlo Simulation! Erste Beobachtung: e 0 e x+y+z e 3 für (x,y,z) [0,1] 3. Hier zwei Lösungen,

Mehr

Statistik Testverfahren. Heinz Holling Günther Gediga. Bachelorstudium Psychologie. hogrefe.de

Statistik Testverfahren. Heinz Holling Günther Gediga. Bachelorstudium Psychologie. hogrefe.de rbu leh ch s plu psych Heinz Holling Günther Gediga hogrefe.de Bachelorstudium Psychologie Statistik Testverfahren 18 Kapitel 2 i.i.d.-annahme dem unabhängig. Es gilt also die i.i.d.-annahme (i.i.d = independent

Mehr

How To Find Out If A Ball Is In An Urn

How To Find Out If A Ball Is In An Urn Prof. Dr. P. Embrechts ETH Zürich Sommer 2012 Stochastik (BSc D-MAVT / BSc D-MATH / BSc D-MATL) Schreiben Sie für Aufgabe 2-4 stets alle Zwischenschritte und -rechnungen sowie Begründungen auf. Aufgabe

Mehr

1 Diskriminanzanalyse

1 Diskriminanzanalyse Multivariate Lineare Modelle SS 2008 1 Diskriminanzanalyse 1. Entscheidungstheorie 2. DA für normalverteilte Merkmale 3. DA nach Fisher 1 Problemstellungen Jedes Subjekt kann einer von g Gruppen angehören

Mehr

Brückenkurs Statistik für Wirtschaftswissenschaften

Brückenkurs Statistik für Wirtschaftswissenschaften Peter von der Lippe Brückenkurs Statistik für Wirtschaftswissenschaften Weitere Übungsfragen UVK Verlagsgesellschaft mbh Konstanz Mit UVK/Lucius München UVK Verlagsgesellschaft mbh Konstanz und München

Mehr

Methodenlehre. Vorlesung 10. Prof. Dr. Björn Rasch, Cognitive Biopsychology and Methods University of Fribourg

Methodenlehre. Vorlesung 10. Prof. Dr. Björn Rasch, Cognitive Biopsychology and Methods University of Fribourg Methodenlehre Vorlesung 10 Prof. Dr., Cognitive Biopsychology and Methods University of Fribourg 1 Methodenlehre II Woche Datum Thema 1 FQ Einführung, Verteilung der Termine 1 18.2.15 Psychologie als Wissenschaft

Mehr

Erwartungswert, Umgebungswahrscheinlichkeiten und die Normalverteilung

Erwartungswert, Umgebungswahrscheinlichkeiten und die Normalverteilung R. Brinkmann http://brinkmann-du.de Seite 5.05.0 Erwartungswert, Umgebungswahrscheinlichkeiten und die Normalverteilung Erwartungswert binomialverteilter Zufallsgrößen Wird ein Bernoulli- Versuch, bei

Mehr

Bio- Statistik 1. mit 87 Abbildungen, 40 Tabellen und 102 Beispielen

Bio- Statistik 1. mit 87 Abbildungen, 40 Tabellen und 102 Beispielen Bio- Statistik 1 Beschreibende und explorative Statistik - Wahrscheinlichkeitsrechnung und Zufallsvariablen - Statistische Maßzahlen - Wichtige Verteilungen - Beurteilende Statistik - Vertrauensintervalle

Mehr

Charakterisierung von 1D Daten

Charakterisierung von 1D Daten Charakterisierung von D Daten Mittelwert: µ, Schätzung m x = x i / n Varianz σ2, Schätzung: s2 = (s: Standardabweichung) Höhere Momente s 2 = ( x i m x ) 2 n ( ) Eine Normalverteilung ist mit Mittelwert

Mehr

Mathematische und statistische Methoden II

Mathematische und statistische Methoden II Statistik & Methodenlehre e e Prof. Dr. G. Meinhardt 6. Stock, Wallstr. 3 (Raum 06-206) Sprechstunde jederzeit nach Vereinbarung und nach der Vorlesung. Mathematische und statistische Methoden II Dr. Malte

Mehr

Lineare Klassifikationsmethoden

Lineare Klassifikationsmethoden Verena Krieg Fakultät für Mathematik und Wirtschaftswissenschaften 08. Mai 2007 Inhaltsverzeichnis 1. Einführung 2. Lineare Regression 3. Lineare Diskriminanzanalyse 4. Logistische Regression 4.1 Berechnung

Mehr

4 Statistik normalverteilter Daten

4 Statistik normalverteilter Daten 4 Statistik normalverteilter Daten 4.1 Eine Stichprobe a Die drei Grundfragen. Die schliessende Statistik bildet die Brücke zwischen den Wahrscheinlichkeitsmodellen, die unser Denken strukturieren, und

Mehr

Einige Konzepte aus der Wahrscheinlichkeitstheorie (Wiederh.)

Einige Konzepte aus der Wahrscheinlichkeitstheorie (Wiederh.) Einige Konzepte aus der Wahrscheinlichkeitstheorie (Wiederh.) 1 Zusammenfassung Bedingte Verteilung: P (y x) = P (x, y) P (x) mit P (x) > 0 Produktsatz P (x, y) = P (x y)p (y) = P (y x)p (x) Kettenregel

Mehr

Fallzahlplanung bei unabhängigen Stichproben

Fallzahlplanung bei unabhängigen Stichproben Fallzahlplanung bei unabhängigen Stichproben Seminar Aktuelle biometrische Probleme Benjamin Hofner benjamin.hofner@stat.uni-muenchen.de 12. Januar 2005 Übersicht 1. Einführung und Grundlagen der Fallzahlplanung

Mehr

Statistics, Data Analysis, and Simulation SS 2017

Statistics, Data Analysis, and Simulation SS 2017 Statistics, Data Analysis, and Simulation SS 2017 08.128.730 Statistik, Datenanalyse und Simulation Dr. Michael O. Distler Mainz, May 29, 2017 Dr. Michael O. Distler

Mehr

Inhalt. I Einführung. Kapitel 1 Konzept des Buches Kapitel 2 Messen in der Psychologie... 27

Inhalt. I Einführung. Kapitel 1 Konzept des Buches Kapitel 2 Messen in der Psychologie... 27 Inhalt I Einführung Kapitel 1 Konzept des Buches........................................ 15 Kapitel 2 Messen in der Psychologie.................................. 27 2.1 Arten von psychologischen Messungen....................

Mehr

Übungsrunde 10, Gruppe 2 LVA , Übungsrunde 10, Gruppe 2, Markus Nemetz, TU Wien,

Übungsrunde 10, Gruppe 2 LVA , Übungsrunde 10, Gruppe 2, Markus Nemetz, TU Wien, Übungsrunde, Gruppe 2 LVA 7.369, Übungsrunde, Gruppe 2, 9..27 Markus Nemetz, markus.nemetz@tuwien.ac.at, TU Wien, 9..27 Anmerkung: Viele dieser Lösungsvorschläge stammen aus dem Informatik-Forum, Subforum

Mehr

Deskriptive Statistik. (basierend auf Slides von Lukas Meier)

Deskriptive Statistik. (basierend auf Slides von Lukas Meier) Deskriptive Statistik (basierend auf Slides von Lukas Meier) Deskriptive Statistik: Ziele Daten zusammenfassen durch numerische Kennzahlen. Grafische Darstellung der Daten. Quelle: Ursus Wehrli, Kunst

Mehr

5 Assoziationsmessung in Kontingenztafeln

5 Assoziationsmessung in Kontingenztafeln 5 Assoziationsmessung in Kontingenztafeln 51 Multivariate Merkmale 51 Multivariate Merkmale Gerade in der Soziologie ist die Analyse eindimensionaler Merkmale nur der allererste Schritt zur Beschreibung

Mehr

1 Wahrscheinlichkeitsrechnung. 2 Zufallsvariablen und ihre Verteilung. 3 Statistische Inferenz. 4 Intervallschätzung

1 Wahrscheinlichkeitsrechnung. 2 Zufallsvariablen und ihre Verteilung. 3 Statistische Inferenz. 4 Intervallschätzung 0 Einführung 1 Wahrscheinlichkeitsrechnung Zufallsvariablen und ihre Verteilung 3 Statistische Inferenz 4 Intervallschätzung Motivation und Hinführung Der wahre Anteil der rot-grün Wähler 009 war genau

Mehr

Statistische Analyseverfahren Abschnitt 2: Zufallsvektoren und mehrdimensionale Verteilungen

Statistische Analyseverfahren Abschnitt 2: Zufallsvektoren und mehrdimensionale Verteilungen Statistische Analyseverfahren Abschnitt 2: Zufallsvektoren und mehrdimensionale Verteilungen Prof. Dr. Hans-Jörg Starkloff TU Bergakademie Freiberg Institut für Stochastik Oktober 2018 Prof. Dr. Hans-Jörg

Mehr

Wahrscheinlichkeitsrechnung

Wahrscheinlichkeitsrechnung Statistik und Wahrscheinlichkeitsrechnung Prof. Dr. Michael Havbro Faber 8.04.009 Inhalt der heutigen Vorlesung Auswahl einer Verteilungsfunktion: Wahrscheinlichkeitspapier pp Schätzung und Modellentwicklung:

Mehr

K. Eppler, Inst. f. Num. Mathematik Übungsaufgaben. 12. Übung SS 18: Woche vom

K. Eppler, Inst. f. Num. Mathematik Übungsaufgaben. 12. Übung SS 18: Woche vom Übungsaufgaben 12. Übung SS 18: Woche vom 2. 7. 6. 7. 2018 Stochastik VI: Zufallsvektoren; Funktionen von ZG Aufgaben: s. pdf auf der homepage von Dr. Vanselow http://www.math.tu-dresden.de/ vanselow/...

Mehr

1.4 Stichproben aus einer Normalverteilung

1.4 Stichproben aus einer Normalverteilung 1.4 Stichproben aus einer Normalverteilung Die Normalverteilung ist wohl das am stärksten verbreitete Modell. Stichproben daraus führen zu nützlichen Eigenschaften der Statistiken und ergeben bekannte

Mehr