Wahrscheinlichkeitsrechnung und mathematische Statistik für Informatiker. Dr. Nils Raabe Technische Universität Dortmund

Größe: px
Ab Seite anzeigen:

Download "Wahrscheinlichkeitsrechnung und mathematische Statistik für Informatiker. Dr. Nils Raabe Technische Universität Dortmund"

Transkript

1 Wahrscheinlichkeitsrechnung und mathematische Statistik für Informatiker Dr. Nils Raabe Technische Universität Dortmund

2 Statistische Methoden spielen in der Informatik eine große Rolle. Beispiele: Laufzeiten von Algorithmen mit stochastischem Input Stochastische Algorithmen Spieltheorie Ausfälle von Datenverbindungen oder Hardwarekomponenten Automatische Übersetzung Assoziationsregeln, Bilderkennung, Signalanalyse, 2

3 Laufzeiten von Algorithmen mit stochastischem Input: Beispiel Sortieralgorithmen: Bubblesort und Quicksort bubblesort(field A, int l, int r) { for i:=r downto l+1 do pipelined { for j:=l to i-1 do { if (A[j] > A[j+1]) then { exchange(a[j], A[j+1]); } } } } 3

4 Laufzeiten von Algorithmen mit stochastischem Input: Beispiel Sortieralgorithmen: Bubblesort und Quicksort quicksort(field A, int l, int r) { if (l < r) then { q:= partition(a, l, r); do parallel { quicksort(a, l, q); quicksort(a, q+1, r); } } } int partition(field A, int l, int r) { x:= A[(l+r) div 2]; i:= l-1; j:= r+1; for ever do { do { j--; } while (A[j] > x); do { i++; } while (A[i] < x); if (i < j) then { exchange(a[i], A[j]); } else { return j; } } } 4

5 Laufzeiten von Algorithmen mit stochastischem Input: Beispiel Sortieralgorithmen: Bubblesort und Quicksort 5

6 Laufzeiten von Algorithmen mit stochastischem Input: Beispiel Sortieralgorithmen: Bubblesort und Quicksort 6

7 Laufzeiten von Algorithmen mit stochastischem Input: Beispiel Sortieralgorithmen: Bubblesort und Quicksort 7

8 Laufzeiten von Algorithmen mit stochastischem Input: Beispiel Sortieralgorithmen: Bubblesort und Quicksort Summen Vertauschungen und Vergleiche (n=20) Gleichverteilte Permutationen Permutationen mit geordneter Liste korreliert 8

9 Stochastische Algorithmen Beispiele: Quicksortkann bei vorsortierten Listen durch zufällige Pivot-Wahl verbessert werden. Evolutionäre Algorithmen Initiale Generation durch Zufallsauswahl und Bewertung der Individuen Aktuelle Generation Bewertung Zufällige Elternselektion, Rekombination, Mutation nein Abbruch? ja Ausgabe bester gefundener Lösung 9

10 Stochastische Algorithmen Beispiel Evolutionäre Algorithmen: Map-Labeling Initiale Generation durch Zufallsauswahl und Bewertung der Individuen: Aktuelle Generation Bewertung Dortmund Berlin Hannover Frankfurt Dortmund HannoverBerlin Frankfurt Dortmund HannoverBerlin Frankfurt Dortmund HannoverBerlin Frankfurt Beste Lösung Dortmund HannoverBerlin Frankfurt 10

11 Stochastische Algorithmen Beispiel Evolutionäre Algorithmen: Map-Labeling Zufällige Elternselektion, Rekombination, Mutation Dortmund Berlin Hannover Frankfurt Papa Dortmund HannoverBerlin Frankfurt Mama Kind Dortmund Berlin Hannover Frankfurt Beste Lösung Dortmund HannoverBerlin Frankfurt 11

12 Stochastische Algorithmen Beispiel Evolutionäre Algorithmen: Map-Labeling Aktuelle Generation Bewertung Dortmund Berlin Hannover Frankfurt Dortmund HannoverBerlin Frankfurt Dortmund Berlin Hannover Frankfurt Dortmund Berlin Hannover Frankfurt Beste Lösung Dortmund Berlin Hannover Frankfurt 12

13 Spieltheorie Beispiel Zwei-Spieler-Nullsummenspiel Strategien p 1 und p 2 für Züge d 1 und d 2 Verlustfunktion für Spieler 1: L(d 1, d 2 ) Risikofunktion für Spieler 1 bei Verwendung der Strategie p 1 : R(p 1, d 2 ) = E d2 L(p 1, d 2 ) Minimax-Strategie p * 1für Spieler 1: * sup R(p 1, d2) inf p sup d R(p 1, d2 d = ) 13

14 Spieltheorie Beispiel Schere, Stein, Papier Strategien=Wahrscheinlichkeiten p 1 =(p 1S, p 1T, p 1P ) und p 2 =(p 2S, p 2T, p 2P ) für Züge d 1 aus {S, T, P} und d 2 aus {S, T, P}. Verlustfunktion für Spieler 1: L(d 1, d 2 )= d 2 =S d 2 =T d 2 =P d 1 =S d 1 =T d 1 =P Risikofunktion für Spieler 1: R(p 1, d 2 ) = +p 1S I d2=t -p 1S I d2=p -p 1T I d2=s + p 1T I d2=p + p 1P I d2=s -p 1P I d2=t 14

15 Spieltheorie Beispiel Schere, Stein, Papier Risikofunktion für Spieler 1: R(p 1, d 2 ) = +p 1S I d2=t -p 1S I d2=p -p 1T I d2=s + p 1T I d2=p + p 1P I d2=s -p 1P I d2=t d 2 R(p 1,d 2 ) p 1S <p 1T <p 1P p 1S <p 1P <p 1T p 1T <p 1S <p 1P p 1T <p 1P <p 1S p 1P <p 1S <p 1T p 1P <p 1T <p 1S S -p 1T +p 1P >0 <0 >0 >0 <0 <0 T +p 1S -p 1P <0 <0 <0 >0 >0 >0 P -p 1S +p 1T >0 >0 <0 <0 >0 <0 Minimax-Strategie p * 1= (1/3, 1/3, 1/3) für Spieler 1, da R(p * 1, d 2 ) = 0 unabhängig von d 2. 15

16 Spieltheorie Beispiel Schere, Stein, Papier Minimax-Strategie p * 1= (1/3, 1/3, 1/3) für Spieler 1, da R(p * 1, d 2 ) = 0 unabhängig von d 2. Falls Spieler 2 ebenfalls die Minimax-Strategie wählt, gilt p * 2= p * 1. Falls Spieler 1 Strategie p 2 kennt und Spieler 2 diese unter keinen Umständen ändert, kann Spieler seine verlustminimierende Strategie anpassen, indem er deterministisch denjenigen Zug wählt, der den von Spieler 2 am wahrscheinlichsten ausgewählten Zug schlägt. Dies gilt auch, falls Spieler 2 die Minimax-Strategie spielt! 16

17 Spieltheorie Beispiel Schere, Stein, Papier Erweiterung um Brunnen Verlustfunktion für Spieler 1: L(d 1, d 2 )= d 2 =S d 2 =T d 2 =P d 2 =B d 1 =S d 1 =T d 1 =P d 1 =B Brunnen dominiert Stein, daher ist Minimax-Strategie p * 1= (1/3, 0, 1/3, 1/3) 17

18 Spieltheorie Knobelspiel mit 5 Zeichen Verlustfunktion für Spieler 1: L(d 1, d 2 )= d 2 =A d 2 =B d 2 =C d 2 =D d 2 =E d 1 =A d 1 =B d 1 =C d 1 =D d 1 =E Minimax-Strategie p * 1= (1/3, 1/9, 1/9, 1/9, 1/3) 18

19 Spieltheorie Memory n = Verbleibende Kartenpaare k = Bereits aufgedeckte Karten Optimale Strategie unter Annahme perfekter Gedächtnisse nach Zwick und Paterson: A A L G C K E C F I B H F J L D H I E K B J G D, falls 3k 2(n+1) und n+k gerade, falls k 1 und n+k gerade oder (n, k) = (6, 1), sonst 19

20 Ausfälle von Hardwarekomponenten Lebensdauerverteilungen von Elektrolytkondensatoren Survivalfunktion: Hazardfunktion: S(t) = P(T > t) = 1-F(t) P(t T < t + δt) h(t) = limδt = δt f(t) S(t) 20

21 Ausfälle von Hardwarekomponenten Lebensdauerverteilungen von Elektrolytkondensatoren Konstante Hazardrate h(t) = λ Exponentialverteilte Lebensdauern: -λt f(t) =λe 21

22 Ausfälle von Hardwarekomponenten Lebensdauerverteilungen von Elektrolytkondensatoren Fallende Hazardrate der Form log(h(t)) = ν+ρ log(t) Weibullverteilte Lebensdauern: f(t) = k λ t λ k 1 e k (t/λ) mit und k = ρ + 1 λ = e (log(k)-ν)/k 22

23 Ausfälle von Hardwarekomponenten Lebensdauerverteilungen von Elektrolytkondensatoren Steigende Hazardrate der Form log(h(t)) = ν+ρ log(t) Weibullverteilte Lebensdauern: f(t) = k λ t λ k 1 e k (t/λ) mit und k = ρ + 1 λ = e (log(k)-ν)/k 23

24 Ausfälle von Hardwarekomponenten Lebensdauerverteilungen von Elektrolytkondensatoren Alternierende Hazardrate durch Kombination. Unterscheidung der Ausfälle in Früh-, Zufalls- und Verschleißausfälle 24

25 Ausfälle von Hardwarekomponenten Lebensdauerverteilungen von Elektrolytkondensatoren Einfluss der Temperatur auf die Lebensdauer: Proportional Hazards Modell log(h (t)) = log(h (t)) + i 0 βx i 25

26 Ausfälle von Hardwarekomponenten Lebensdauerverteilungen von Elektrolytkondensatoren Einfluss der Temperatur auf die Lebensdauer: Proportional Hazards Modell log(h (t)) = log(h (t)) + i 0 βx i β = β = 0 26

27 Ausfälle von Hardwarekomponenten Lebensdauerverteilungen von Elektrolytkondensatoren Einfluss der Temperatur auf die Lebensdauer: Proportional Hazards Modell log(h (t)) = log(h (t)) + i 0 βx i x = 20 x = 25 x =30 27

28 Ausfälle von Hardwarekomponenten Lebensdauerverteilungen von Elektrolytkondensatoren Einfluss der Temperatur auf die Lebensdauer: Proportional Hazards Modell log(h (t)) = log(h (t)) + i 0 βx i 28

29 Automatische Übersetzung Statistische Übersetzung auf Basis von Paralleltext Satz von Bayes: P(D) P(E D) P(D E) = P(E) Wahrscheinlichste Übersetzung von e: dˆ = argmax P(d e) d d: Wie fühlen Sie sich? e: How do you feel? 29

30 Automatische Übersetzung Statistische Übersetzung auf Basis von Paralleltext Direkte Schätzung der Wahrscheinlichkeiten schwer bei seltenen und unmöglich bei unbekannten Sätzen. Darum: Word Alignments d: Wie fühlen Sie sich? m = 4 e: How do you feel? l = 4 a: 1 (2,4)

31 Automatische Übersetzung Statistische Übersetzung auf Basis von Paralleltext Direkte Schätzung der Wahrscheinlichkeiten schwer bei seltenen und unmöglich bei unbekannten Sätzen. Darum: Word Alignments d: Wie fühlen fühlen Sie sich? m = 5 e: How do you feel? l = 4 a:

32 Automatische Übersetzung Statistische Übersetzung auf Basis von Paralleltext IBM Modell 1 P(d, a e) ε = (l+ 1) m t(dj ea ) m j j= 1 Schätzung von Alignments und Übersetzungen durch EM-Algorithmus: 0. Initialisierung von Alignment-Verteilungen 1. Bestimmung von Wortübersetzungsverteilungen auf Basis der (a priori) Alignment-Verteilungen. 2. Bestimmung von (a posteriori) Alignment-Verteilungen und Wortübersetzungsverteilungen 3. -> 1. mit aktualisierten Verteilungen 32

33 Automatische Übersetzung Statistische Übersetzung auf Basis von Paralleltext e 1 d 1 e 2 d 2 He Er She Sie feels fühlt feels fühlt 0. Alignments gleichwahrscheinlich 1. Wortübersetzungsverteilungen P(Er He) = P(Sie She) = 1/2 P(fühlt He) = P(fühlt She) = 1/2 P(Er feels) = P(Sie feels) = 1/4 P(fühlt feels) = 1/2 Alignments: a 1 a 2 a 3 a 4 33

34 Automatische Übersetzung Statistische Übersetzung auf Basis von Paralleltext e 1 d 1 e 2 d 2 He Er She Sie Alignments: a 1 feels fühlt feels fühlt 2. A posteriori Alignmentverteilungen P(d 1,a 1 e 1 ) = P(Er He) P(fühlt feels) = 1/4 P(d 1,a 2 e 1 ) = P(Er He) P(fühlt He) = 1/4 P(d 1,a 3 e 1 ) = P(Er feels) P(fühlt feels) = 1/8 P(d 1,a 4 e 1 ) = P(Er feels) P(fühlt He) = 1/8 P(a i e 1 ) = P(d 1,a i e 1 )/[P(d 1,a 1 e 1 )+P(d 1,a 2 e 1 )+P(d 1,a 3 e 1 )+P(d 1,a 4 e 1 )] a 2 a 3 a 4 34

35 Automatische Übersetzung Statistische Übersetzung auf Basis von Paralleltext 2. A posteriori Alignmentverteilungen P(a 1 e 1 ) = 1/3 P(a 2 e 1 ) = 1/3 P(a 3 e 1 ) = 1/6 P(a 4 e 1 ) = 1/6 e 1 d 1 e 2 d 2 He Er She Sie feels fühlt feels fühlt Alignments: a 1 a 2 a 3 a 4 35

36 Automatische Übersetzung Statistische Übersetzung auf Basis von Paralleltext e 1 d 1 e 2 d 2 He Er She Sie feels fühlt feels fühlt 1. A posteriori Wortübersetzungsverteilungen P(Er He) = P(Sie She) = 4/7 P(fühlt He) = P(fühlt She) = 3/7 P(Er feels) = P(Sie feels) = 1/5 P(fühlt feels) = 3/5 Alignments: a 1 a 2 a 3 a 4 36

37 Automatische Übersetzung Statistische Übersetzung auf Basis von Paralleltext 2. A posteriori Alignmentverteilungen P(d 1,a 1 e 1 ) = P(Er He) P(fühlt feels) = 12/35 P(d 1,a 2 e 1 ) = P(Er He) P(fühlt He) = 12/49 P(d 1,a 3 e 1 ) = P(Er feels) P(fühlt feels) = 3/25 P(d 1,a 4 e 1 ) = P(Er feels) P(fühlt He) = 3/35 usw. e 1 d 1 e 2 d 2 He Er She Sie feels fühlt feels fühlt Alignments: a 1 a 2 a 3 a 4 37

38 Merkmale und Datentypen Einzelobjekte (Untersuchungseinheiten, Merkmalsträger) Statistische Gesamtheit (Kollektiv, Population) Merkmal Form Farbe Linienart Merkmalsausprägungen Ellipse, Ellipse, Ellipse, Rechteck, Rechteck, Ellipse Rot,Blau, Grün, Rot, Gelb, Blau Durchgängig, Gepunktet, Gepunktet, Durchgängig, Gestrichelt, Gestrichelt Wertebereich {Ellipse, Rechteck} {Blau, Gelb, Grün, Rot} {Gepunktet, Gestrichelt, Durchgängig} Breite in cm 2, 1, 1, 2, 1, 3 (0, ) Höhe in cm 1, 1, 2, 2, 3, 1 (0, ) 38

39 Merkmale und Datentypen Datentypen Skalentyp mögliche Aussagen Im Beispiel qualitativ Nominal Gleich / Verschieden Farbe, Form(binär, dichotom) Ordinal Größer / Kleiner Linienart Intervall Differenzen Breite, Höhe, gleich / verschieden Form quantitativ / metrisch Verhältnis Verhältnisse Breite, Höhe gleich / verschieden 39

40 Merkmale und Datentypen Datentypen Merkmalstyp Anzahl der Ausprägungen Im Beispiel Diskret Endlich oder abzählbar Form unendlich viele Breite, Höhe (wenn grob gemessen) Stetig Überabzählbar viele Breite, Höhe (wenn fein gemessen) 40

41 Merkmale und Datentypen Datentypen Merkmalstyp Qualitativ Quantitativ binär Nominal Ordinal Diskret Stetig 41

42 Tabellarische und grafische Darstellung von univariaten Daten Qualitative Daten M N = {e 1,, e N } X x, x W X W X = {x(j) j = 1,..., J} = {x(1),...,x(j)} Populationbestehend aus Objekten e 1,, e N Nominales bzw. ordinales Merkmal Merkmalsausprägungen von X Wertebereich von X mit Merkmalsausprägungen x(j), j = 1,..., J D N = {x n n= 1,, N} = {x 1,, x N } Urlisteaus der Messung von X in der Population M N, d.h. x n = X(e n ), n=1,, N x(1)< x(2) < < x(j) falls X ordinal 42

43 Tabellarische und grafische Darstellung von univariaten Daten Qualitative Daten: Beispiel Bearbeitungen von Softwareaufgaben Bearbeitung Bearbeiter(in) Aufgabe Version Anzahl Clicks Bearbeitungszeit e 1 Kai Export e 2 Kai Verknüpfung e 3 Miriam Export e 4 Tina Verknüpfung e 5 Oliver Export e 6 Tina Export e 7 Tina Verknüpfung e 8 Miriam Export e 9 Miriam Export e 10 Oliver Abfrage e 11 Oliver Verknüpfung e 12 Oliver Abfrage

44 Tabellarische und grafische Darstellung von univariaten Daten Qualitative Daten: Beispiel Bearbeitungen von Softwareaufgaben Bearbeitung Bearbeiter(in) Aufgabe Version Anzahl Clicks Bearbeitungszeit e 1 Kai Export e 2 Kai Verknüpfung e 3 Miriam Export e 4 Tina Verknüpfung e 5 Oliver Export e 6 Tina Export e 7 Tina Verknüpfung e 8 Miriam Export e 9 Miriam Export e 10 Oliver Abfrage e 11 Oliver Verknüpfung e 12 Oliver Abfrage Objekte 44

45 Tabellarische und grafische Darstellung von univariaten Daten Qualitative Daten: Beispiel Bearbeitungen von Softwareaufgaben Bearbeitung Bearbeiter(in) Aufgabe Version Anzahl Clicks Bearbeitungszeit e 1 Kai Export e 2 Kai Verknüpfung e 3 Miriam Export e 4 Tina Verknüpfung e 5 Oliver Export e 6 Tina Export e 7 Tina Verknüpfung e 8 Miriam Export e 9 Miriam Export e 10 Oliver Abfrage e 11 Oliver Verknüpfung e 12 Oliver Abfrage Variablen 45

46 Tabellarische und grafische Darstellung von univariaten Daten Qualitative Daten: Beispiel Bearbeitungen von Softwareaufgaben Bearbeitung Bearbeiter(in) Aufgabe Version Anzahl Clicks Bearbeitungszeit e 1 Kai Export e 2 Kai Verknüpfung e 3 Miriam Export e 4 Tina Verknüpfung e 5 Oliver Export e 6 Tina Export e 7 Tina Verknüpfung e 8 Miriam Export e 9 Miriam Export e 10 Oliver Abfrage e 11 Oliver Verknüpfung e 12 Oliver Abfrage Qualitative Daten 46

47 Tabellarische und grafische Darstellung von univariaten Daten Qualitative Daten: Beispiel Bearbeitungen von Softwareaufgaben Bearbeitung Bearbeiter(in) Aufgabe Version Anzahl Clicks Bearbeitungszeit e 1 Kai Export e 2 Kai Verknüpfung e 3 Miriam Export e 4 Tina Verknüpfung e 5 Oliver Export e 6 Tina Export e 7 Tina Verknüpfung e 8 Miriam Export e 9 Miriam Export e 10 Oliver Abfrage e 11 Oliver Verknüpfung e 12 Oliver Abfrage D N;1, N=12 X 1 = Bearbeiter(in) W X1 = {Kai, Miriam, Oliver, Tina} J 1 = 4 47

48 Tabellarische und grafische Darstellung von univariaten Daten Qualitative Daten: Beispiel Bearbeitungen von Softwareaufgaben Bearbeitung Bearbeiter(in) Aufgabe Version Anzahl Clicks Bearbeitungszeit e 1 Kai Export e 2 Kai Verknüpfung e 3 Miriam Export e 4 Tina Verknüpfung e 5 Oliver Export e 6 Tina Export e 7 Tina Verknüpfung e 8 Miriam Export e 9 Miriam Export e 10 Oliver Abfrage e 11 Oliver Verknüpfung e 12 Oliver Abfrage D N;2, N=12 X 2 = Aufgabe W X2 = {Abfrage, Export, Verknüpfung} J 2 = 3 48

49 Tabellarische und grafische Darstellung von univariaten Daten Qualitative Daten: Beispiel Bearbeitungen von Softwareaufgaben Bearbeitung Bearbeiter(in) Aufgabe Version Anzahl Clicks Bearbeitungszeit e 1 Kai Export e 2 Kai Verknüpfung e 3 Miriam Export e 4 Tina Verknüpfung e 5 Oliver Export e 6 Tina Export e 7 Tina Verknüpfung e 8 Miriam Export e 9 Miriam Export e 10 Oliver Abfrage e 11 Oliver Verknüpfung e 12 Oliver Abfrage D N;3, N=12 X 3 = Version W X3 = {1.1,1.2, 2.0}, 1.1 < 1.2 < 2.0 J 3 = 3 49

50 Tabellarische und grafische Darstellung von univariaten Daten Qualitative Daten: Deskriptive Auswertung Absolute HäufigkeitN j von x(j): Damit gilt x 1 (1) Kai J j= 1 x 1 (2) Miriam N j = N x 1 (3) Oliver x 1 (4) Tina N j = N[x(j)] = Σ N i= 1 d(j), i d(j) = I i x(e ) = x(j) i X 1 (e i ) d 1i (1) d 1i (2) d 1i (3) d 1i (4) 1 Kai Kai Miriam Tina Oliver Tina Tina Miriam Miriam Oliver Oliver Oliver Σ i 50

51 Tabellarische und grafische Darstellung von univariaten Daten Qualitative Daten: Deskriptive Auswertung Relative Häufigkeitf j von x(j): Damit gilt x 1 (1) Kai 2/ J fj = 1 j= 1 x 1 (2) Miriam 3/12 = 0.25 x 1 (3) Oliver 4/ x 1 (4) Tina 3/12 = 0.25 f j = N j N Σ 12/12 = 1 i X 1 (e i ) d 1i (1) d 1i (2) d 1i (3) d 1i (4) 1 Kai Kai Miriam Tina Oliver Tina Tina Miriam Miriam Oliver Oliver Oliver Σ/

52 Tabellarische und grafische Darstellung von univariaten Daten Qualitative Daten: Deskriptive Auswertung Tabellarische Darstellung absoluter und relativer Häufigkeiten Ausprägung Absolute Häufigkeit Relative Häufigkeit x(1) N 1 f 1 = N 1 /N x(j) N J f J = N J /N J j= 1 N j = N J j= 1 f j = 1 52

53 Tabellarische und grafische Darstellung von univariaten Daten Qualitative Daten: Deskriptive Auswertung Tabellarische Darstellung absoluter und relativer Häufigkeiten Ausprägung Bearbeiter(in) Absolute Häufigkeit Relative Häufigkeit Kai Miriam Oliver Tina Ausprägung Aufgabe Absolute Häufigkeit Relative Häufigkeit Abfrage Export Verknüpfung Ausprägung Version Absolute Häufigkeit Relative Häufigkeit

54 Tabellarische und grafische Darstellung von univariaten Daten Quantitativ diskrete Daten M N = {e 1,, e N } X x, x W X W X = {x(j) j = 1,..., J} = {x(1),...,x(j)} Populationbestehend aus Objekten e 1,, e N Quantitatives Merkmal Merkmalsausprägungen von X Wertebereich von X mit Merkmalsausprägungen x(j), j = 1,..., J D N = {x n n= 1,, N} = {x 1,, x N } Urlisteaus der Messung von X in der Population M N, d.h. x n = X(e n ), n=1,, N 54

55 Tabellarische und grafische Darstellung von univariaten Daten Quantitativ diskrete Daten: Beispiel Bearbeitungen von Softwareaufgaben Bearbeitung Bearbeiter(in) Aufgabe Version Anzahl Clicks Bearbeitungszeit e 1 Kai Export e 2 Kai Verknüpfung e 3 Miriam Export e 4 Tina Verknüpfung e 5 Oliver Export e 6 Tina Export e 7 Tina Verknüpfung e 8 Miriam Export e 9 Miriam Export e 10 Oliver Abfrage e 11 Oliver Verknüpfung e 12 Oliver Abfrage D N;4, N=12 X 4 = Anzahl Clicks W X4 = {0, 1,, 10, 11, 12, 13, 14, 15, 16, 17, 18,, } J 4 = 55

56 Tabellarische und grafische Darstellung von univariaten Daten Quantitativ diskrete Daten: Deskriptive Auswertung Absolute HäufigkeitN j und relative Häufigkeit f j analog zu qualitativen Daten j #{xn xn x(j)} Relative Summenhäufigkeit sj = fk = N k= 1 Ausprägung Absolute Häufigkeit Relative Häufigkeit Relative Summenhäufigkeit x(1) N 1 f 1 = N 1 /N f 1 x(2) N 2 f 2 = N 2 /N f 1 + f 2 x(j-1) N J-1 f J-1 = N J-1 /N f f J-1 x(j) N J f J = N J /N f f J = 1 J j= 1 N j = N J j= 1 f j = 1 56

57 Tabellarische und grafische Darstellung von univariaten Daten Quantitativ diskrete Daten: Deskriptive Auswertung Anzahl Clicks Ausprägung Absolute Häufigkeit Relative Häufigkeit Relative Summenhäufigkeit

58 Tabellarische und grafische Darstellung von univariaten Daten Quantitativ diskrete Daten: Deskriptive Auswertung Grafische Darstellung: Empirische Verteilungsfunktion F (x) = sj 0 ~,mitj = max{ j x( j) N j = fk ~ k= 1 x} falls falls x < x(1) x(1) x f 1 + f 2 + f 3 + f 4 + f 5 = 1 = s 5 f 1 + f 2 + f 3 + f 4 = s 4 f 1 + f 2 + f 3 = s 3 f 4 f 5 f 1 + f 2 = s 2 f 1 = s 1 0 f 1 f 2 f 3 x 58

59 Tabellarische und grafische Darstellung von univariaten Daten Quantitativ stetige Daten M N = {e 1,, e N } X x, x W W X U J X = (-, ) = K j j= 1 K j = ( v j-1, v j ], j = 1,, J-1 K J = ( v J-1, v J ) D N = {x n n= 1,, N} = {x 1,, x N } Populationbestehend aus Objekten e 1,, e N Quantitatives Merkmal Merkmalsausprägungen von X Klassierter(kategorisierter) Wertebereich von X Merkmalsklassen mit Klassengrenzen - = v 0 < v 1 < < v J-1 < v J = Urlisteaus der Messung von X in der Population M N, d.h. x n = X(e n ), n=1,, N 59

60 Tabellarische und grafische Darstellung von univariaten Daten Quantitativ stetige Daten: Beispiel Bearbeitungen von Softwareaufgaben Bearbeitung Bearbeiter(in) Aufgabe Version Anzahl Clicks Bearbeitungszeit e 1 Kai Export e 2 Kai Verknüpfung e 3 Miriam Export e 4 Tina Verknüpfung e 5 Oliver Export e 6 Tina Export e 7 Tina Verknüpfung e 8 Miriam Export e 9 Miriam Export e 10 Oliver Abfrage e 11 Oliver Verknüpfung e 12 Oliver Abfrage D N;5, N=12 X 5 = Bearbeitungszeit W X5 = (-, ) = (-, 4] U (4, 5] U U (7, 8] U (8, ) = J 5 = 6 (,4] U 4 U j= 1 (j+ 3, j+ 4] U (8, ) 60

61 Tabellarische und grafische Darstellung von univariaten Daten Quantitativ stetige Daten: Deskriptive Auswertung Klassierte Häufigkeitsverteilung Klasse K j Absolute Häufigkeit Relative Häufigkeit Relative Summenhäufigkeit K 1 = (v 0, v 1 ] N(K 1 ) f(k 1 ) = N(K 1 )/N f(k 1 ) K 2 = (v 1, v 2 ] N(K 2 ) f(k 2 ) = N(K 2 )/N f(k 1 ) + f(k 2 ) K J-1 = (v J-2, v J-1 ] N(K J-1 ) f(k J-1 )= N(K J-1 )/N f(k 1 ) + + f(k J-1 ) K J-1 = (v J-1, v J ) N(K J ) f(k J )= N(K J )/N f(k 1 ) + + f(k J )= 1 J j= 1 N(K ) = N j J j= 1 f(kj) = 1 N(K j ) = #{x x Kj} = #{x vj 1 < x v J } 61

62 Tabellarische und grafische Darstellung von univariaten Daten Quantitativ stetige Daten: Deskriptive Auswertung Bearbeitungszeit Klasse Absolute Häufigkeit Relative Häufigkeit Relative Summenhäufigkeit K 1 = (-, 4] K 2 = (4, 5] K 3 = (5, 6] K 4 = (6, 7] K 5 = (7, 8] K 6 = (8, )

63 Tabellarische und grafische Darstellung von univariaten Daten Quantitativ stetige Daten: Deskriptive Auswertung Grafische Darstellung: Histogramm Aufbauend auf klassierter Häufigkeitsverteilung, allerdings v 0 - und v J b 2 =2 b 3 =1 h 2 =0.2 f(k 2 ) f(k 3 ) h 3 =0.2 = 0.4 =0.2 b 5 =1 Flächen der Rechtecke zu K j entsprechen f(k j ). Rechteckbreiten sind gegeben durch b j = v j -v j-1. Damit ergeben sich als Rechteckhöhen h j = f(k j )/b j 0.05 h 1 =0.05 b 1 =4 f(k 1 ) = 0.2 b 4 =2 f(k 4 ) =0.1 f(k 5 ) =0.1 h 5 = = h 4 63

64 Tabellarische und grafische Darstellung von univariaten Daten Quantitativ stetige Daten: Deskriptive Auswertung Grafische Darstellung: Histogramm Üblicherweise gleiche Klassenbreiten h 3 =0.2 b=2 f(k 3 )=0.4 f(k 4 )=0.25 h 4 =0.125 Flächen der Rechtecke zu K j entsprechen f(k j ). Rechteckbreiten sind gegeben durch b= v j -v j-1. Damit ergeben sich als Rechteckhöhen h j = f(k j )/b 0.05 h 2 =0.075 f(k 2 )=0.15 f(k 5 )=0.15 h 5 =0.075 h 1 =0.025 f(k 1 )=

Deskriptive Statistik 1 behaftet.

Deskriptive Statistik 1 behaftet. Die Statistik beschäftigt sich mit Massenerscheinungen, bei denen die dahinterstehenden Einzelereignisse meist zufällig sind. Statistik benutzt die Methoden der Wahrscheinlichkeitsrechnung. Fundamentalregeln:

Mehr

Wahrscheinlichkeits - rechnung und Statistik

Wahrscheinlichkeits - rechnung und Statistik Michael Sachs Mathematik-Studienhilfen Wahrscheinlichkeits - rechnung und Statistik für Ingenieurstudenten an Fachhochschulen 4., aktualisierte Auflage 2.2 Eindimensionale Häufigkeitsverteilungen 19 absolute

Mehr

1. Einführung und statistische Grundbegriffe. Grundsätzlich unterscheidet man zwei Bedeutungen des Begriffs Statistik:

1. Einführung und statistische Grundbegriffe. Grundsätzlich unterscheidet man zwei Bedeutungen des Begriffs Statistik: . Einführung und statistische Grundbegriffe Beispiele aus dem täglichen Leben Grundsätzlich unterscheidet man zwei Bedeutungen des Begriffs Statistik: Quantitative Information Graphische oder tabellarische

Mehr

Statistische Kennzahlen für die Lage

Statistische Kennzahlen für die Lage Statistische Kennzahlen für die Lage technische universität ach der passenden grafischen Darstellung der Werte eines Merkmals auf der Gesamtheit der Beobachtungen interessieren jetzt geschickte algebraische

Mehr

Tabellarische und graphie Darstellung von univariaten Daten

Tabellarische und graphie Darstellung von univariaten Daten Part I Wrums 1 Motivation und Einleitung Motivation Satz von Bayes Übersetzten mit Paralleltext Merkmale und Datentypen Skalentypen Norminal Ordinal Intervall Verältnis Merkmalstyp Diskret Stetig Tabellarische

Mehr

0 Einführung: Was ist Statistik

0 Einführung: Was ist Statistik 0 Einführung: Was ist Statistik 1 Datenerhebung und Messung 2 Univariate deskriptive Statistik Häufigkeitsverteilungen Statistische Kennwerte 3 Multivariate Statistik 4 Regression 5 Ergänzungen Deskriptive

Mehr

Modul 04: Messbarkeit von Merkmalen, Skalen und Klassierung. Prof. Dr. W. Laufner Beschreibende Statistik

Modul 04: Messbarkeit von Merkmalen, Skalen und Klassierung. Prof. Dr. W. Laufner Beschreibende Statistik Modul 04: Messbarkeit von Merkmalen, Skalen und 1 Modul 04: Informationsbedarf empirische (statistische) Untersuchung Bei einer empirischen Untersuchung messen wir Merkmale bei ausgewählten Untersuchungseinheiten

Mehr

Mathematik für Biologen

Mathematik für Biologen Mathematik für Biologen Prof. Dr. Rüdiger W. Braun Heinrich-Heine Universität Düsseldorf 14. Oktober 2010 Übungen Aufgabenblatt 1 wird heute Nachmittag auf das Weblog gestellt. Geben Sie die Lösungen dieser

Mehr

htw saar 1 EINFÜHRUNG IN DIE STATISTIK: BESCHREIBENDE STATISTIK

htw saar 1 EINFÜHRUNG IN DIE STATISTIK: BESCHREIBENDE STATISTIK htw saar 1 EINFÜHRUNG IN DIE STATISTIK: BESCHREIBENDE STATISTIK htw saar 2 Grundbegriffe htw saar 3 Grundgesamtheit und Stichprobe Ziel: Über eine Grundgesamtheit (Population) soll eine Aussage über ein

Mehr

Standardisierte Vorgehensweisen und Regeln zur Gewährleistung von: Eindeutigkeit Schlussfolgerungen aus empirischen Befunden sind nur dann zwingend

Standardisierte Vorgehensweisen und Regeln zur Gewährleistung von: Eindeutigkeit Schlussfolgerungen aus empirischen Befunden sind nur dann zwingend Standardisierte Vorgehensweisen und Regeln zur Gewährleistung von: Eindeutigkeit Schlussfolgerungen aus empirischen Befunden sind nur dann zwingend oder eindeutig, wenn keine alternativen Interpretationsmöglichkeiten

Mehr

Forschungsstatistik I

Forschungsstatistik I Prof. Dr. G. Meinhardt 6. Stock, Taubertsberg 2 R. 06-206 (Persike) R. 06-214 (Meinhardt) Sprechstunde jederzeit nach Vereinbarung Forschungsstatistik I Dr. Malte Persike persike@uni-mainz.de http://psymet03.sowi.uni-mainz.de/

Mehr

Zufallsvariablen. Diskret. Stetig. Verteilung der Stichprobenkennzahlen. Binomial Hypergeometrisch Poisson. Normal Lognormal Exponential

Zufallsvariablen. Diskret. Stetig. Verteilung der Stichprobenkennzahlen. Binomial Hypergeometrisch Poisson. Normal Lognormal Exponential Zufallsvariablen Diskret Binomial Hypergeometrisch Poisson Stetig Normal Lognormal Exponential Verteilung der Stichprobenkennzahlen Zufallsvariable Erinnerung: Merkmal, Merkmalsausprägung Deskriptive Statistik:

Mehr

Deskription, Statistische Testverfahren und Regression. Seminar: Planung und Auswertung klinischer und experimenteller Studien

Deskription, Statistische Testverfahren und Regression. Seminar: Planung und Auswertung klinischer und experimenteller Studien Deskription, Statistische Testverfahren und Regression Seminar: Planung und Auswertung klinischer und experimenteller Studien Deskriptive Statistik Deskriptive Statistik: beschreibende Statistik, empirische

Mehr

WISTA WIRTSCHAFTSSTATISTIK

WISTA WIRTSCHAFTSSTATISTIK WISTA WIRTSCHAFTSSTATISTIK PROF DR ROLF HÜPEN FAKULTÄT FÜR WIRTSCHAFTSWISSENSCHAFT Seminar für Theoretische Wirtschaftslehre Vorlesungsprogramm 23042013 Datenlagen und Darstellung eindimensionaler Häufigkeitsverteilungen

Mehr

Grafische Darstellung von Häufigkeitsverteilungen (1)

Grafische Darstellung von Häufigkeitsverteilungen (1) Grafische Darstellung von Häufigkeitsverteilungen () Grafische Darstellungen dienen... - Einführung - der Unterstützung des Lesens und Interpretierens von Daten. der Veranschaulichung mathematischer Begriffe

Mehr

Institut für Biometrie und klinische Forschung. WiSe 2012/2013

Institut für Biometrie und klinische Forschung. WiSe 2012/2013 Klinische Forschung WWU Münster Pflichtvorlesung zum Querschnittsfach Epidemiologie, Biometrie und Med. Informatik Praktikum der Medizinischen Biometrie (3) Überblick. Deskriptive Statistik I 2. Deskriptive

Mehr

Einführung in die Statistik

Einführung in die Statistik Einführung in die Statistik 1. Deskriptive Statistik 2. Induktive Statistik 1. Deskriptive Statistik 1.0 Grundbegriffe 1.1 Skalenniveaus 1.2 Empirische Verteilungen 1.3 Mittelwerte 1.4 Streuungsmaße 1.0

Mehr

Inhaltsverzeichnis: Aufgaben zur Vorlesung Statistik Seite 1 von 10 Prof. Dr. Karin Melzer, Prof. Dr. Gabriele Gühring, Fakultät Grundlagen

Inhaltsverzeichnis: Aufgaben zur Vorlesung Statistik Seite 1 von 10 Prof. Dr. Karin Melzer, Prof. Dr. Gabriele Gühring, Fakultät Grundlagen Inhaltsverzeichnis: 1. Aufgabenlösungen... Lösung zu Aufgabe 1:... Lösung zu Aufgabe... Lösung zu Aufgabe 3... Lösung zu Aufgabe 4... Lösung zu Aufgabe 5... 3 Lösung zu Aufgabe... 3 Lösung zu Aufgabe 7...

Mehr

Lösungen zu Übung 1 (Kap. 1.5) Prof. Dr.B.Grabowski

Lösungen zu Übung 1 (Kap. 1.5) Prof. Dr.B.Grabowski Lösungen zur Übung1: Skript I (Beschreibende Statistik), Kap. 1.5 Aufgabe 1 1. Sind folgende Merkmale diskret oder stetig? a) Die durch eine wahlberechtigte Person der BRD gewählte Partei bei der Bundestagswahl.

Mehr

Deskriptive Statistik

Deskriptive Statistik Helge Toutenburg Christian Heumann Deskriptive Statistik Eine Einführung in Methoden und Anwendungen mit R und SPSS Siebte, aktualisierte und erweiterte Auflage Mit Beiträgen von Michael Schomaker 4ü Springer

Mehr

1 x 1 y 1 2 x 2 y 2 3 x 3 y 3... n x n y n

1 x 1 y 1 2 x 2 y 2 3 x 3 y 3... n x n y n 3.2. Bivariate Verteilungen zwei Variablen X, Y werden gemeinsam betrachtet (an jedem Objekt werden gleichzeitig zwei Merkmale beobachtet) Beobachtungswerte sind Paare von Merkmalsausprägungen (x, y) Beispiele:

Mehr

Dr. Maike M. Burda. Welchen Einfluss hat die Körperhöhe auf das Körpergewicht? Eine Regressionsanalyse. HU Berlin, Econ Bootcamp 7.-9.

Dr. Maike M. Burda. Welchen Einfluss hat die Körperhöhe auf das Körpergewicht? Eine Regressionsanalyse. HU Berlin, Econ Bootcamp 7.-9. Dr. Maike M. Burda Welchen Einfluss hat die Körperhöhe auf das Körpergewicht? Eine Regressionsanalyse. HU Berlin, Econ Bootcamp 7.-9. Januar 2011 BOOTDATA11.GDT: 250 Beobachtungen für die Variablen...

Mehr

Kapitel III - Merkmalsarten

Kapitel III - Merkmalsarten Universität Karlsruhe (TH) Institut für Statistik und Mathematische Wirtschaftstheorie Statistik 1 - Deskriptive Statistik Kapitel III - Merkmalsarten Markus Höchstötter Lehrstuhl für Statistik, Ökonometrie

Mehr

SozialwissenschaftlerInnen II

SozialwissenschaftlerInnen II Statistik für SozialwissenschaftlerInnen II Henning Best best@wiso.uni-koeln.de Universität zu Köln Forschungsinstitut für Soziologie Statistik für SozialwissenschaftlerInnen II p.1 Wahrscheinlichkeitsfunktionen

Mehr

Inhaltsverzeichnis Grundlagen aufigkeitsverteilungen Maßzahlen und Grafiken f ur eindimensionale Merkmale

Inhaltsverzeichnis Grundlagen aufigkeitsverteilungen Maßzahlen und Grafiken f ur eindimensionale Merkmale 1. Grundlagen... 1 1.1 Grundgesamtheit und Untersuchungseinheit................ 1 1.2 Merkmal oder statistische Variable........................ 2 1.3 Datenerhebung.........................................

Mehr

Kreisdiagramm, Tortendiagramm

Kreisdiagramm, Tortendiagramm Kreisdiagramm, Tortendiagramm Darstellung der relativen (absoluten) Häufigkeiten als Fläche eines Kreises Anwendung: Nominale Merkmale Ordinale Merkmale (Problem: Ordnung nicht korrekt wiedergegeben) Gruppierte

Mehr

Mathematik für Biologen

Mathematik für Biologen Mathematik für Biologen Prof. Dr. Rüdiger W. Braun Ruediger.Braun@uni-duesseldorf.de Heinrich-Heine Universität Düsseldorf Mathematik für Biologen p. 1 Hinweise Internetseite zur Vorlesung: http://blog.ruediger-braun.net

Mehr

Einführung in die Statistik für Wirtschaftswissenschaftler für Betriebswirtschaft und Internationales Management

Einführung in die Statistik für Wirtschaftswissenschaftler für Betriebswirtschaft und Internationales Management Einführung in die Statistik für Wirtschaftswissenschaftler für Betriebswirtschaft und Internationales Management Sommersemester 2013 Hochschule Augsburg Lageparameter: Erwartungswert d) Erwartungswert

Mehr

Abschnitt: Algorithmendesign und Laufzeitanalyse

Abschnitt: Algorithmendesign und Laufzeitanalyse Abschnitt: Algorithmendesign und Laufzeitanalyse Definition Divide-and-Conquer Paradigma Divide-and-Conquer Algorithmen verwenden die Strategien 1 Divide: Teile das Problem rekursiv in Subproblem gleicher

Mehr

Wichtige Definitionen und Aussagen

Wichtige Definitionen und Aussagen Wichtige Definitionen und Aussagen Zufallsexperiment, Ergebnis, Ereignis: Unter einem Zufallsexperiment verstehen wir einen Vorgang, dessen Ausgänge sich nicht vorhersagen lassen Die möglichen Ausgänge

Mehr

Zusammenfassung Mathe II. Themenschwerpunkt 2: Stochastik (ean) 1. Ein- und mehrstufige Zufallsexperimente; Ergebnismengen

Zusammenfassung Mathe II. Themenschwerpunkt 2: Stochastik (ean) 1. Ein- und mehrstufige Zufallsexperimente; Ergebnismengen Zusammenfassung Mathe II Themenschwerpunkt 2: Stochastik (ean) 1. Ein- und mehrstufige Zufallsexperimente; Ergebnismengen Zufallsexperiment: Ein Vorgang, bei dem mindestens zwei Ereignisse möglich sind

Mehr

TEIL 7: EINFÜHRUNG UNIVARIATE ANALYSE TABELLARISCHE DARSTELLUNG / AUSWERTUNG

TEIL 7: EINFÜHRUNG UNIVARIATE ANALYSE TABELLARISCHE DARSTELLUNG / AUSWERTUNG TEIL 7: EINFÜHRUNG UNIVARIATE ANALYSE TABELLARISCHE DARSTELLUNG / AUSWERTUNG GLIEDERUNG Statistik eine Umschreibung Gliederung der Statistik in zwei zentrale Teilbereiche Deskriptive Statistik Inferenzstatistik

Mehr

Dr. Maike M. Burda. Welchen Einfluss hat die Körperhöhe auf das Körpergewicht? Eine Regressionsanalyse. HU Berlin, Econ Bootcamp

Dr. Maike M. Burda. Welchen Einfluss hat die Körperhöhe auf das Körpergewicht? Eine Regressionsanalyse. HU Berlin, Econ Bootcamp Dr. Maike M. Burda Welchen Einfluss hat die Körperhöhe auf das Körpergewicht? Eine Regressionsanalyse. HU Berlin, Econ Bootcamp 8.-10. Januar 2010 BOOTDATA.GDT: 250 Beobachtungen für die Variablen... cm:

Mehr

Univ.-Prof. Dr. Georg Wydra

Univ.-Prof. Dr. Georg Wydra Univ.-Prof. Dr. Georg Wydra Methoden zur Auswertung von Untersuchungen 1 SKALENTYPEN UND VARIABLEN 2 ZUR BEDEUTUNG DER STATISTIK IN DER FORSCHUNG 3 STATISTIK ALS VERFAHREN ZUR PRÜFUNG VON HYPOTHESEN 4

Mehr

Arbeitsbuch zur deskriptiven und induktiven Statistik

Arbeitsbuch zur deskriptiven und induktiven Statistik Helge Toutenburg Michael Schomaker Malte Wißmann Christian Heumann Arbeitsbuch zur deskriptiven und induktiven Statistik Zweite, aktualisierte und erweiterte Auflage 4ü Springer Inhaltsverzeichnis 1. Grundlagen

Mehr

Kapitel V - Graphische Darstellung von Häufigkeitsverteilungen

Kapitel V - Graphische Darstellung von Häufigkeitsverteilungen Institut für Volkswirtschaftslehre (ECON) Lehrstuhl für Ökonometrie und Statistik Kapitel V - Graphische Darstellung von Häufigkeitsverteilungen Deskriptive Statistik Prof. Dr. W.-D. Heller Hartwig Senska

Mehr

3. Merkmale und Daten

3. Merkmale und Daten 3. Merkmale und Daten Ziel dieses Kapitels: Vermittlung des statistischen Grundvokabulars Zu klärende Begriffe: Grundgesamtheit Merkmale (Skalenniveau etc.) Stichprobe 46 3.1 Grundgesamtheiten Definition

Mehr

Forschungsstatistik I

Forschungsstatistik I Prof. Dr. G. Meinhardt 2. Stock, Nordflügel R. 02-429 (Persike) R. 02-431 (Meinhardt) Sprechstunde jederzeit nach Vereinbarung Forschungsstatistik I Dr. Malte Persike persike@uni-mainz.de WS 2008/2009

Mehr

Wahrscheinlichkeitstheorie Kapitel I - Einführende Beispiele

Wahrscheinlichkeitstheorie Kapitel I - Einführende Beispiele Wahrscheinlichkeitstheorie Kapitel I - Einführende Beispiele Georg Bol georg.bol@statistik.uni-karlsruhe.de Markus Höchstötter hoechstoetter@statistik.uni-karlsruhe.de Wahrscheinlichkeitstheorie Agenda:

Mehr

9. Kapitel: Grafische Darstellung quantitativer Informationen

9. Kapitel: Grafische Darstellung quantitativer Informationen 9. Kapitel: Grafische Darstellung quantitativer Informationen 9.1: Fallstricke bei der Übersetzung von Zahlen in Bilder a) optische Täuschungen b) absichtliche Manipulationen 9.2: Typologie von Datengrafiken

Mehr

Biomathematik für Mediziner, Klausur SS 2000 Seite 1

Biomathematik für Mediziner, Klausur SS 2000 Seite 1 Biomathematik für Mediziner, Klausur SS 2000 Seite 1 Aufgabe 1: Bei der Diagnose einer bestimmten Krankheit mit einem speziellen Diagnoseverfahren werden Patienten, die tatsächlich an der Krankheit leiden,

Mehr

Kapitel 2. Häufigkeitsverteilungen

Kapitel 2. Häufigkeitsverteilungen 6 Kapitel 2 Häufigkeitsverteilungen Ziel: Darstellung bzw Beschreibung (Exploration) einer Variablen Ausgangssituation: An n Einheiten ω,, ω n sei das Merkmal X beobachtet worden x = X(ω ),, x n = X(ω

Mehr

Wahrscheinlichkeitsrechnung und Statistik

Wahrscheinlichkeitsrechnung und Statistik 3. Vorlesung - 21.10.2016 Bedingte Wahrscheinlichkeit In einer Urne sind 2 grüne und 3 blaue Kugeln. 2 Kugeln werden ohne Zürücklegen gezogen. Welches ist die Wahrscheinlichkeit, dass : a) man eine grüne

Mehr

Wirtschaftswissenschaftliches Prüfungsamt Bachelor-Prüfung Deskriptive Statistik und Wahrscheinlichkeitsrechnung Wintersemester 2010/11.

Wirtschaftswissenschaftliches Prüfungsamt Bachelor-Prüfung Deskriptive Statistik und Wahrscheinlichkeitsrechnung Wintersemester 2010/11. Wirtschaftswissenschaftliches Prüfungsamt Bachelor-Prüfung Deskriptive Statistik und Wahrscheinlichkeitsrechnung Wintersemester 2010/11 Namensschild Dr. Martin Becker Hinweise für die Klausurteilnehmer

Mehr

Zufallsvariablen [random variable]

Zufallsvariablen [random variable] Zufallsvariablen [random variable] Eine Zufallsvariable (Zufallsgröße) X beschreibt (kodiert) die Versuchsausgänge ω Ω mit Hilfe von Zahlen, d.h. X ist eine Funktion X : Ω R ω X(ω) Zufallsvariablen werden

Mehr

P (A B) P (B) = P ({3}) P ({1, 3, 5}) = 1 3.

P (A B) P (B) = P ({3}) P ({1, 3, 5}) = 1 3. 2 Wahrscheinlichkeitstheorie Beispiel. Wie wahrscheinlich ist es, eine Zwei oder eine Drei gewürfelt zu haben, wenn wir schon wissen, dass wir eine ungerade Zahl gewürfelt haben? Dann ist Ereignis A das

Mehr

Punktschätzer Optimalitätskonzepte

Punktschätzer Optimalitätskonzepte Kapitel 1 Punktschätzer Optimalitätskonzepte Sei ein statistisches Modell gegeben: M, A, P ϑ Sei eine Funktion des Parameters ϑ gegeben, γ : Θ G, mit irgendeiner Menge G, und sei noch eine Sigma-Algebra

Mehr

Deskriptive Statistik Auswertung durch Informationsreduktion

Deskriptive Statistik Auswertung durch Informationsreduktion Deskriptive Statistik Auswertung durch Informationsreduktion Gliederung Ø Grundbegriffe der Datenerhebung Total-/Stichprobenerhebung, qualitatives/quantitatives Merkmal Einteilung der Daten (Skalierung,

Mehr

Adaptive Systeme. Prof. Dr.-Ing. Heinz-Georg Fehn Prof. Dr. rer. nat. Nikolaus Wulff

Adaptive Systeme. Prof. Dr.-Ing. Heinz-Georg Fehn Prof. Dr. rer. nat. Nikolaus Wulff Adaptive Systeme Evolutionäre Algorithmen: Überlebenskampf und Evolutionäre Strategien Prof. Dr.-Ing. Heinz-Georg Fehn Prof. Dr. rer. nat. Nikolaus Wulff Überblick Einleitung Adaptive Filter Künstliche

Mehr

Referenten: Gina Spieler, Beatrice Bressau, Laura Uhlmann Veranstaltung: Statistik für das Lehramt Dozent: Martin Tautenhahn

Referenten: Gina Spieler, Beatrice Bressau, Laura Uhlmann Veranstaltung: Statistik für das Lehramt Dozent: Martin Tautenhahn 8.5 Eindimensionale stetige Zufallsvariablen Eine Zufallsvariable X heißt stetig, wenn es eine Funktion f(x) gibt, sodass die Verteilungsfunktion von X folgende Gestalt hat: x F(x) = f(t)dt f(x) heißt

Mehr

Daten, Datentypen, Skalen

Daten, Datentypen, Skalen Bildung kommt von Bildschirm und nicht von Buch, sonst hieße es ja Buchung. Daten, Datentypen, Skalen [main types of data; levels of measurement] Die Umsetzung sozialwissenschaftlicher Forschungsvorhaben

Mehr

ETWR Teil B. Spezielle Wahrscheinlichkeitsverteilungen (stetig)

ETWR Teil B. Spezielle Wahrscheinlichkeitsverteilungen (stetig) ETWR Teil B 2 Ziele Bisher (eindimensionale, mehrdimensionale) Zufallsvariablen besprochen Lageparameter von Zufallsvariablen besprochen Übertragung des gelernten auf diskrete Verteilungen Ziel des Kapitels

Mehr

3. Suchen. Das Suchproblem. Suche in Array. Lineare Suche. 1 n. i = n Gegeben Menge von Datensätzen.

3. Suchen. Das Suchproblem. Suche in Array. Lineare Suche. 1 n. i = n Gegeben Menge von Datensätzen. Das Suchproblem Gegeben Menge von Datensätzen. 3. Suchen Beispiele Telefonverzeichnis, Wörterbuch, Symboltabelle Jeder Datensatz hat einen Schlüssel k. Schlüssel sind vergleichbar: eindeutige Antwort auf

Mehr

1 Stochastik deskriptive Statistik und Wahrscheinlichkeitsrechnung. Statistik und Wahrscheinlichkeitsrechnung

1 Stochastik deskriptive Statistik und Wahrscheinlichkeitsrechnung. Statistik und Wahrscheinlichkeitsrechnung 1 Stochastik deskriptive Statistik und Wahrscheinlichkeitsrechnung Statistik und Wahrscheinlichkeitsrechnung 2 Stochastik deskriptive Statistik und Wahrscheinlichkeitsrechnung Stochastik Wahrscheinlichkeitsrechnung

Mehr

Statistik II: Grundlagen und Definitionen der Statistik

Statistik II: Grundlagen und Definitionen der Statistik Medien Institut : Grundlagen und Definitionen der Statistik Dr. Andreas Vlašić Medien Institut (0621) 52 67 44 vlasic@medien-institut.de Gliederung 1. Hintergrund: Entstehung der Statistik 2. Grundlagen

Mehr

Mathematische und statistische Methoden II

Mathematische und statistische Methoden II Prof. Dr. G. Meinhardt 6. Stock, Wallstr. 3 (Raum 06-206) Sprechstunde jederzeit nach Vereinbarung und nach der Vorlesung. Mathematische und statistische Methoden II Dr. Malte Persike persike@uni-mainz.de

Mehr

Mathematische Statistik. Zur Notation

Mathematische Statistik. Zur Notation Mathematische Statistik dient dazu, anhand von Stichproben Informationen zu gewinnen. Während die Wahrscheinlichkeitsrechnung Prognosen über das Eintreten zufälliger (zukünftiger) Ereignisse macht, werden

Mehr

Algorithmen und Datenstrukturen

Algorithmen und Datenstrukturen Algorithmen und Datenstrukturen Große Übung #6 Phillip Keldenich, Arne Schmidt 26.02.2017 Heute: Master-Theorem Phillip Keldenich, Arne Schmidt Große Übung 2 Vorbetrachtungen Wir betrachten rekursive Gleichungen

Mehr

Universität Basel Wirtschaftswissenschaftliches Zentrum. Zufallsvariablen. Dr. Thomas Zehrt

Universität Basel Wirtschaftswissenschaftliches Zentrum. Zufallsvariablen. Dr. Thomas Zehrt Universität Basel Wirtschaftswissenschaftliches Zentrum Zufallsvariablen Dr. Thomas Zehrt Inhalt: 1. Einführung 2. Zufallsvariablen 3. Diskrete Zufallsvariablen 4. Stetige Zufallsvariablen 5. Erwartungswert

Mehr

Inhaltsverzeichnis. 1 Über dieses Buch Zum Inhalt dieses Buches Danksagung Zur Relevanz der Statistik...

Inhaltsverzeichnis. 1 Über dieses Buch Zum Inhalt dieses Buches Danksagung Zur Relevanz der Statistik... Inhaltsverzeichnis 1 Über dieses Buch... 11 1.1 Zum Inhalt dieses Buches... 13 1.2 Danksagung... 15 2 Zur Relevanz der Statistik... 17 2.1 Beispiel 1: Die Wahrscheinlichkeit, krank zu sein, bei einer positiven

Mehr

Forschungsmethoden in der Sozialen Arbeit

Forschungsmethoden in der Sozialen Arbeit Forschungsmethoden in der Sozialen Arbeit Fachhochschule für Sozialarbeit und Sozialpädagogik Alice- Salomon Hochschule für Soziale arbeit, Gesundheit, Erziehung und Bildung University of Applied Sciences

Mehr

7. Grenzwertsätze. Dr. Antje Kiesel Institut für Angewandte Mathematik WS 2011/2012

7. Grenzwertsätze. Dr. Antje Kiesel Institut für Angewandte Mathematik WS 2011/2012 7. Grenzwertsätze Dr. Antje Kiesel Institut für Angewandte Mathematik WS 2011/2012 Mittelwerte von Zufallsvariablen Wir betrachten die arithmetischen Mittelwerte X n = 1 n (X 1 + X 2 + + X n ) von unabhängigen

Mehr

Übung Algorithmen und Datenstrukturen

Übung Algorithmen und Datenstrukturen Übung Algorithmen und Datenstrukturen Sommersemester 2017 Patrick Schäfer, Humboldt-Universität zu Berlin Agenda: Sortierverfahren 1. Schreibtischtest 2. Stabilität 3. Sortierung spezieller Arrays 4. Untere

Mehr

Adaptive Systeme. Prof. Dr.-Ing. Heinz-Georg Fehn Prof. Dr. rer. nat. Nikolaus Wulff

Adaptive Systeme. Prof. Dr.-Ing. Heinz-Georg Fehn Prof. Dr. rer. nat. Nikolaus Wulff Adaptive Systeme Evolutionäre Algorithmen Teil II Evolutionsfenster durch Mutation und sexuelle Rekombination Prof. Dr.-Ing. Heinz-Georg Fehn Prof. Dr. rer. nat. Nikolaus Wulff Evolutionäre Algorithmen

Mehr

Voraussetzung für statistische Auswertung: jeder Fall besitzt in bezug auf jedes Merkmal genau eine Ausprägung

Voraussetzung für statistische Auswertung: jeder Fall besitzt in bezug auf jedes Merkmal genau eine Ausprägung Rohdaten Urliste oder Rohdaten sind die auszuwertenden Daten in der Form, wie sie nach der Datenerhebung vorliegen. Dimensionen der Urliste sind die Fälle, Merkmale und ihre Ausprägungen. Voraussetzung

Mehr

Willkommen zur Vorlesung Statistik

Willkommen zur Vorlesung Statistik Willkommen zur Vorlesung Statistik Thema dieser Vorlesung: Häufigkeiten und ihre Verteilung, oder: Zusammenfassende Darstellungen einzelner Variablen Prof. Dr. Wolfgang Ludwig-Mayerhofer Universität Siegen

Mehr

I. Zahlen, Rechenregeln & Kombinatorik

I. Zahlen, Rechenregeln & Kombinatorik XIV. Wiederholung Seite 1 I. Zahlen, Rechenregeln & Kombinatorik 1 Zahlentypen 2 Rechenregeln Brüche, Wurzeln & Potenzen, Logarithmen 3 Prozentrechnung 4 Kombinatorik Möglichkeiten, k Elemente anzuordnen

Mehr

Einführung in die Statistik für Wirtschaftswissenschaftler für Betriebswirtschaft und Internationales Management

Einführung in die Statistik für Wirtschaftswissenschaftler für Betriebswirtschaft und Internationales Management Einführung in die Statistik für Wirtschaftswissenschaftler für Betriebswirtschaft und Internationales Management Sommersemester 03 Hochschule Augsburg : Gliederung Einführung Deskriptive Statistik 3 Wahrscheinlichkeitstheorie

Mehr

Stetige Verteilungen Rechteckverteilung

Stetige Verteilungen Rechteckverteilung Stetige Verteilungen Rechteckverteilung Die Längenabweichungen X produzierter Werkstücke von der Norm seien gleichmäßig verteilt zwischen a = mm und b = 4mm. Die Dichtefunktion lautet also f(x) = für a

Mehr

Mathematische und statistische Methoden II

Mathematische und statistische Methoden II Sprechstunde jederzeit nach Vereinbarung und nach der Vorlesung Wallstr. 3, 6. Stock, Raum 06-206 Mathematische und statistische Methoden II Dr. Malte Persike persike@uni-mainz.de lordsofthebortz.de lordsofthebortz.de/g+

Mehr

Zufallsvariable: Verteilungen & Kennzahlen

Zufallsvariable: Verteilungen & Kennzahlen Mathematik II für Biologen 12. Juni 2015 Zufallsvariable Kennzahlen: Erwartungswert Kennzahlen: Varianz Kennzahlen: Erwartungstreue Verteilungsfunktion Beispiel: Exponentialverteilung Kennzahlen: Erwartungswert

Mehr

Statistik I für Betriebswirte Vorlesung 9

Statistik I für Betriebswirte Vorlesung 9 Statistik I für Betriebswirte Vorlesung 9 Dr. Andreas Wünsche TU Bergakademie Freiberg Institut für Stochastik Vorlesung am 8. Juni 2017 im Audi-Max (AUD-1001) Dr. Andreas Wünsche Statistik I für Betriebswirte

Mehr

Deskriptive Statistik Lösungen zu Blatt 1 Christian Heumann, Susanne Konrath SS Lösung Aufgabe 1

Deskriptive Statistik Lösungen zu Blatt 1 Christian Heumann, Susanne Konrath SS Lösung Aufgabe 1 1 Deskriptive Statistik Lösungen zu Blatt 1 Christian Heumann, Susanne Konrath SS 2011 Lösung Aufgabe 1 (a) Es sollen die mathematischen Vorkenntnisse der Studenten, die die Vorlesung Statistik I für Statistiker,

Mehr

Stochastik I. Vorlesungsmitschrift

Stochastik I. Vorlesungsmitschrift Stochastik I Vorlesungsmitschrift Ulrich Horst Institut für Mathematik Humboldt-Universität zu Berlin Inhaltsverzeichnis 1 Grundbegriffe 1 1.1 Wahrscheinlichkeitsräume..................................

Mehr

Aufgabenstellung und Ergebnisse zur. Bachelor-Prüfung Deskriptive Statistik und Wahrscheinlichkeitsrechnung Wintersemester 2015/16. Dr.

Aufgabenstellung und Ergebnisse zur. Bachelor-Prüfung Deskriptive Statistik und Wahrscheinlichkeitsrechnung Wintersemester 2015/16. Dr. Aufgabenstellung und Ergebnisse zur Bachelor-Prüfung Deskriptive Statistik und Wahrscheinlichkeitsrechnung Wintersemester 205/6 Dr. Martin Becker Hinweise für die Klausurteilnehmer ˆ Die Klausur besteht

Mehr

Kapitel 5. Univariate Zufallsvariablen. 5.1 Diskrete Zufallsvariablen

Kapitel 5. Univariate Zufallsvariablen. 5.1 Diskrete Zufallsvariablen Kapitel 5 Univariate Zufallsvariablen Im ersten Teil dieses Skriptes haben wir uns mit Daten beschäftigt und gezeigt, wie man die Verteilung eines Merkmals beschreiben kann. Ist man nur an der Population

Mehr

Kapitel VIII - Mehrdimensionale Merkmale

Kapitel VIII - Mehrdimensionale Merkmale Institut für Volkswirtschaftslehre (ECON) Lehrstuhl für Ökonometrie und Statistik Kapitel VIII - Mehrdimensionale Merkmale Deskriptive Statistik Prof. Dr. W.-D. Heller Hartwig Senska Carlo Siebenschuh

Mehr

Scheinklausur zur Vorlesung Stochastik II

Scheinklausur zur Vorlesung Stochastik II Institut für Mathematische Stochastik WS 2007/2008 Universität Karlsruhe 25. 02. 2008 Dr. B. Klar Scheinklausur zur Vorlesung Stochastik II Muster-Lösung Dauer: 90 Minuten Name: Vorname: Matrikelnummer:

Mehr

4. Schließende Statistik (Inferenzstatistik, konfirmatorische Verfahren)

4. Schließende Statistik (Inferenzstatistik, konfirmatorische Verfahren) 4. Schließende Statistik (Inferenzstatistik, konfirmatorische Verfahren) 4.1. Einführung Schätzen unbekannter Parameter im Modell, z.b. Wahrscheinlichkeiten p i (Anteile in der Gesamtmenge), Erwartungswerte

Mehr

Exponentialverteilung

Exponentialverteilung Exponentialverteilung Dauer von kontinuierlichen Vorgängen (Wartezeiten; Funktionszeiten technischer Geräte) Grenzübergang von der geometrischen Verteilung Pro Zeiteinheit sei die Eintrittswahrscheinlichkeit

Mehr

Mathematische und statistische Methoden II

Mathematische und statistische Methoden II Methodenlehre e e Prof. Dr. G. Meinhardt 6. Stock, Wallstr. 3 (Raum 06-206) Sprechstunde jederzeit nach Vereinbarung und nach der Vorlesung. Mathematische und statistische Methoden II Dr. Malte Persike

Mehr

Wirtschaftsmathematik

Wirtschaftsmathematik Einführung in einige Teilbereiche der Wintersemester 206 Prof. Dr. Stefan Etschberger HSA Unabhängigkeit von Ereignissen A, B unabhängig: Eintreten von A liefert keine Information über P(B). Formal: P(A

Mehr

Sortieralgorithmen. Jan Pöschko. 18. Januar Problemstellung Definition Warum Sortieren?... 2

Sortieralgorithmen. Jan Pöschko. 18. Januar Problemstellung Definition Warum Sortieren?... 2 Jan Pöschko 18. Januar 2007 Inhaltsverzeichnis 1 Problemstellung 2 1.1 Definition................................... 2 1.2 Warum Sortieren?.............................. 2 2 Einfache Sortieralgorithmen

Mehr

1.5 Erwartungswert und Varianz

1.5 Erwartungswert und Varianz Ziel: Charakterisiere Verteilungen von Zufallsvariablen durch Kenngrößen (in Analogie zu Lage- und Streuungsmaßen der deskriptiven Statistik). Insbesondere: a) durchschnittlicher Wert Erwartungswert, z.b.

Mehr

2 Häufigkeitsverteilungen

2 Häufigkeitsverteilungen 2 Häufigkeitsverteilungen Ziel: Darstellung bzw Beschreibung (Exploration) einer Variablen Ausgangssituation An n Einheiten ω 1,,ω n sei das Merkmal X beobachtet worden x 1 = X(ω 1 ),,x n = X(ω n ) Also

Mehr

Lagemaße Übung. Zentrale Methodenlehre, Europa Universität - Flensburg

Lagemaße Übung. Zentrale Methodenlehre, Europa Universität - Flensburg Lagemaße Übung M O D U S, M E D I A N, M I T T E L W E R T, M O D A L K L A S S E, M E D I A N, K L A S S E, I N T E R P O L A T I O N D E R M E D I A N, K L A S S E M I T T E Zentrale Methodenlehre, Europa

Mehr

Wahrscheinlichkeitstheorie 2

Wahrscheinlichkeitstheorie 2 Wahrscheinlichkeitstheorie 2 Caroline Sporleder Computational Linguistics Universität des Saarlandes Sommersemester 2011 19.05.2011 Caroline Sporleder Wahrscheinlichkeitstheorie 2 (1) Wiederholung (1):

Mehr

3 Häufigkeitsverteilungen

3 Häufigkeitsverteilungen 3 Häufigkeitsverteilungen 3.1 Absolute und relative Häufigkeiten 3.2 Klassierung von Daten 3.3 Verteilungsverläufe 3.1 Absolute und relative Häufigkeiten Datenaggregation: Bildung von Häufigkeiten X nominal

Mehr

Stochastik. 1. Wahrscheinlichkeitsräume

Stochastik. 1. Wahrscheinlichkeitsräume Stochastik 1. Wahrscheinlichkeitsräume Ein Zufallsexperiment ist ein beliebig oft und gleichartig wiederholbarer Vorgang mit mindestens zwei verschiedenen Ergebnissen, bei dem der Ausgang ungewiß ist.

Mehr

3 Häufigkeitsverteilungen

3 Häufigkeitsverteilungen 3 Häufigkeitsverteilungen 3.1 Absolute und relative Häufigkeiten 3.2 Klassierung von Daten 3.3 Verteilungsverläufe 3.1 Absolute und relative Häufigkeiten Datenaggregation: Bildung von Häufigkeiten X nominal

Mehr

Eindimensionale Zufallsvariablen

Eindimensionale Zufallsvariablen Eindimensionale Grundbegriffe Verteilungstypen Diskrete Stetige Spezielle Maßzahlen für eindimensionale Erwartungswert Varianz Standardabweichung Schwankungsintervalle Bibliografie Bleymüller / Gehlert

Mehr

4. Kumulierte Häufigkeiten und Quantile

4. Kumulierte Häufigkeiten und Quantile 4. Kumulierte Häufigkeiten und Quantile Statistik für SoziologInnen 1 4. Kumulierte Häufigkeiten und Quantile Kumulierte Häufigkeiten Oft ist man nicht an der Häufigkeit einzelner Merkmalsausprägungen

Mehr

Statistikpraktikum. Carsten Rezny. Sommersemester Institut für angewandte Mathematik Universität Bonn

Statistikpraktikum. Carsten Rezny. Sommersemester Institut für angewandte Mathematik Universität Bonn Statistikpraktikum Carsten Rezny Institut für angewandte Mathematik Universität Bonn Sommersemester 2016 Anmeldung in Basis: 06. 10.06.2016 Organisatorisches Einführung Statistik Analyse empirischer Daten

Mehr

Einführung in die Wahrscheinlichkeitsrechnung

Einführung in die Wahrscheinlichkeitsrechnung Einführung in die Wahrscheinlichkeitsrechnung Sven Garbade Fakultät für Angewandte Psychologie SRH Hochschule Heidelberg sven.garbade@hochschule-heidelberg.de Statistik 1 S. Garbade (SRH Heidelberg) Wahrscheinlichkeitsrechnung

Mehr

Softwareprojektpraktikum Maschinelle Übersetzung

Softwareprojektpraktikum Maschinelle Übersetzung Softwareprojektpraktikum Maschinelle Übersetzung Jan-Thorsten Peter, Andreas Guta, Jan Rosendahl max.bleu@i6.informatik.rwth-aachen.de Vorbesprechung 5. Aufgabe 22. Juni 2017 Human Language Technology

Mehr

Statistik für Ingenieure Vorlesung 2

Statistik für Ingenieure Vorlesung 2 Statistik für Ingenieure Vorlesung 2 Prof. Dr. Hans-Jörg Starkloff TU Bergakademie Freiberg Institut für Stochastik 24. Oktober 2016 2.4 Bedingte Wahrscheinlichkeiten Häufig ist es nützlich, Bedingungen

Mehr

Mathematische Statistik Aufgaben zum Üben. Schätzer

Mathematische Statistik Aufgaben zum Üben. Schätzer Prof. Dr. Z. Kabluchko Wintersemester 2016/17 Philipp Godland 14. November 2016 Mathematische Statistik Aufgaben zum Üben Keine Abgabe Aufgabe 1 Schätzer Es seien X 1,..., X n unabhängige und identisch

Mehr

Philipp Sibbertsen Hartmut Lehne. Statistik. Einführung für Wirtschafts- und. Sozialwissenschaftler. 2., überarbeitete Auflage. 4^ Springer Gabler

Philipp Sibbertsen Hartmut Lehne. Statistik. Einführung für Wirtschafts- und. Sozialwissenschaftler. 2., überarbeitete Auflage. 4^ Springer Gabler Philipp Sibbertsen Hartmut Lehne Statistik Einführung für Wirtschafts- und Sozialwissenschaftler 2., überarbeitete Auflage 4^ Springer Gabler Inhaltsverzeichnis Teil I Deskriptive Statistik 1 Einführung

Mehr

Verteilungen und ihre Darstellungen

Verteilungen und ihre Darstellungen Verteilungen und ihre Darstellungen Übung: Stamm-Blatt-Diagramme Wie sind die gekennzeichneten Beobachtungswerte eweils zu lesen? Tragen Sie in beiden Diagrammen den Wert 0.452 an der richtigen Stelle

Mehr

4. Kumulierte Häufigkeiten und Quantile

4. Kumulierte Häufigkeiten und Quantile 4. Kumulierte Häufigkeiten und Quantile Kumulierte Häufigkeiten Oft ist man nicht an der Häufigkeit einzelner Merkmalsausprägungen interessiert, sondern an der Häufigkeit von Intervallen. Typische Fragestellung:

Mehr