Wahrscheinlichkeitsrechnung und mathematische Statistik für Informatiker. Dr. Nils Raabe Technische Universität Dortmund
|
|
- Gregor Schmitt
- vor 7 Jahren
- Abrufe
Transkript
1 Wahrscheinlichkeitsrechnung und mathematische Statistik für Informatiker Dr. Nils Raabe Technische Universität Dortmund
2 Statistische Methoden spielen in der Informatik eine große Rolle. Beispiele: Laufzeiten von Algorithmen mit stochastischem Input Stochastische Algorithmen Spieltheorie Ausfälle von Datenverbindungen oder Hardwarekomponenten Automatische Übersetzung Assoziationsregeln, Bilderkennung, Signalanalyse, 2
3 Laufzeiten von Algorithmen mit stochastischem Input: Beispiel Sortieralgorithmen: Bubblesort und Quicksort bubblesort(field A, int l, int r) { for i:=r downto l+1 do pipelined { for j:=l to i-1 do { if (A[j] > A[j+1]) then { exchange(a[j], A[j+1]); } } } } 3
4 Laufzeiten von Algorithmen mit stochastischem Input: Beispiel Sortieralgorithmen: Bubblesort und Quicksort quicksort(field A, int l, int r) { if (l < r) then { q:= partition(a, l, r); do parallel { quicksort(a, l, q); quicksort(a, q+1, r); } } } int partition(field A, int l, int r) { x:= A[(l+r) div 2]; i:= l-1; j:= r+1; for ever do { do { j--; } while (A[j] > x); do { i++; } while (A[i] < x); if (i < j) then { exchange(a[i], A[j]); } else { return j; } } } 4
5 Laufzeiten von Algorithmen mit stochastischem Input: Beispiel Sortieralgorithmen: Bubblesort und Quicksort 5
6 Laufzeiten von Algorithmen mit stochastischem Input: Beispiel Sortieralgorithmen: Bubblesort und Quicksort 6
7 Laufzeiten von Algorithmen mit stochastischem Input: Beispiel Sortieralgorithmen: Bubblesort und Quicksort 7
8 Laufzeiten von Algorithmen mit stochastischem Input: Beispiel Sortieralgorithmen: Bubblesort und Quicksort Summen Vertauschungen und Vergleiche (n=20) Gleichverteilte Permutationen Permutationen mit geordneter Liste korreliert 8
9 Stochastische Algorithmen Beispiele: Quicksortkann bei vorsortierten Listen durch zufällige Pivot-Wahl verbessert werden. Evolutionäre Algorithmen Initiale Generation durch Zufallsauswahl und Bewertung der Individuen Aktuelle Generation Bewertung Zufällige Elternselektion, Rekombination, Mutation nein Abbruch? ja Ausgabe bester gefundener Lösung 9
10 Stochastische Algorithmen Beispiel Evolutionäre Algorithmen: Map-Labeling Initiale Generation durch Zufallsauswahl und Bewertung der Individuen: Aktuelle Generation Bewertung Dortmund Berlin Hannover Frankfurt Dortmund HannoverBerlin Frankfurt Dortmund HannoverBerlin Frankfurt Dortmund HannoverBerlin Frankfurt Beste Lösung Dortmund HannoverBerlin Frankfurt 10
11 Stochastische Algorithmen Beispiel Evolutionäre Algorithmen: Map-Labeling Zufällige Elternselektion, Rekombination, Mutation Dortmund Berlin Hannover Frankfurt Papa Dortmund HannoverBerlin Frankfurt Mama Kind Dortmund Berlin Hannover Frankfurt Beste Lösung Dortmund HannoverBerlin Frankfurt 11
12 Stochastische Algorithmen Beispiel Evolutionäre Algorithmen: Map-Labeling Aktuelle Generation Bewertung Dortmund Berlin Hannover Frankfurt Dortmund HannoverBerlin Frankfurt Dortmund Berlin Hannover Frankfurt Dortmund Berlin Hannover Frankfurt Beste Lösung Dortmund Berlin Hannover Frankfurt 12
13 Spieltheorie Beispiel Zwei-Spieler-Nullsummenspiel Strategien p 1 und p 2 für Züge d 1 und d 2 Verlustfunktion für Spieler 1: L(d 1, d 2 ) Risikofunktion für Spieler 1 bei Verwendung der Strategie p 1 : R(p 1, d 2 ) = E d2 L(p 1, d 2 ) Minimax-Strategie p * 1für Spieler 1: * sup R(p 1, d2) inf p sup d R(p 1, d2 d = ) 13
14 Spieltheorie Beispiel Schere, Stein, Papier Strategien=Wahrscheinlichkeiten p 1 =(p 1S, p 1T, p 1P ) und p 2 =(p 2S, p 2T, p 2P ) für Züge d 1 aus {S, T, P} und d 2 aus {S, T, P}. Verlustfunktion für Spieler 1: L(d 1, d 2 )= d 2 =S d 2 =T d 2 =P d 1 =S d 1 =T d 1 =P Risikofunktion für Spieler 1: R(p 1, d 2 ) = +p 1S I d2=t -p 1S I d2=p -p 1T I d2=s + p 1T I d2=p + p 1P I d2=s -p 1P I d2=t 14
15 Spieltheorie Beispiel Schere, Stein, Papier Risikofunktion für Spieler 1: R(p 1, d 2 ) = +p 1S I d2=t -p 1S I d2=p -p 1T I d2=s + p 1T I d2=p + p 1P I d2=s -p 1P I d2=t d 2 R(p 1,d 2 ) p 1S <p 1T <p 1P p 1S <p 1P <p 1T p 1T <p 1S <p 1P p 1T <p 1P <p 1S p 1P <p 1S <p 1T p 1P <p 1T <p 1S S -p 1T +p 1P >0 <0 >0 >0 <0 <0 T +p 1S -p 1P <0 <0 <0 >0 >0 >0 P -p 1S +p 1T >0 >0 <0 <0 >0 <0 Minimax-Strategie p * 1= (1/3, 1/3, 1/3) für Spieler 1, da R(p * 1, d 2 ) = 0 unabhängig von d 2. 15
16 Spieltheorie Beispiel Schere, Stein, Papier Minimax-Strategie p * 1= (1/3, 1/3, 1/3) für Spieler 1, da R(p * 1, d 2 ) = 0 unabhängig von d 2. Falls Spieler 2 ebenfalls die Minimax-Strategie wählt, gilt p * 2= p * 1. Falls Spieler 1 Strategie p 2 kennt und Spieler 2 diese unter keinen Umständen ändert, kann Spieler seine verlustminimierende Strategie anpassen, indem er deterministisch denjenigen Zug wählt, der den von Spieler 2 am wahrscheinlichsten ausgewählten Zug schlägt. Dies gilt auch, falls Spieler 2 die Minimax-Strategie spielt! 16
17 Spieltheorie Beispiel Schere, Stein, Papier Erweiterung um Brunnen Verlustfunktion für Spieler 1: L(d 1, d 2 )= d 2 =S d 2 =T d 2 =P d 2 =B d 1 =S d 1 =T d 1 =P d 1 =B Brunnen dominiert Stein, daher ist Minimax-Strategie p * 1= (1/3, 0, 1/3, 1/3) 17
18 Spieltheorie Knobelspiel mit 5 Zeichen Verlustfunktion für Spieler 1: L(d 1, d 2 )= d 2 =A d 2 =B d 2 =C d 2 =D d 2 =E d 1 =A d 1 =B d 1 =C d 1 =D d 1 =E Minimax-Strategie p * 1= (1/3, 1/9, 1/9, 1/9, 1/3) 18
19 Spieltheorie Memory n = Verbleibende Kartenpaare k = Bereits aufgedeckte Karten Optimale Strategie unter Annahme perfekter Gedächtnisse nach Zwick und Paterson: A A L G C K E C F I B H F J L D H I E K B J G D, falls 3k 2(n+1) und n+k gerade, falls k 1 und n+k gerade oder (n, k) = (6, 1), sonst 19
20 Ausfälle von Hardwarekomponenten Lebensdauerverteilungen von Elektrolytkondensatoren Survivalfunktion: Hazardfunktion: S(t) = P(T > t) = 1-F(t) P(t T < t + δt) h(t) = limδt = δt f(t) S(t) 20
21 Ausfälle von Hardwarekomponenten Lebensdauerverteilungen von Elektrolytkondensatoren Konstante Hazardrate h(t) = λ Exponentialverteilte Lebensdauern: -λt f(t) =λe 21
22 Ausfälle von Hardwarekomponenten Lebensdauerverteilungen von Elektrolytkondensatoren Fallende Hazardrate der Form log(h(t)) = ν+ρ log(t) Weibullverteilte Lebensdauern: f(t) = k λ t λ k 1 e k (t/λ) mit und k = ρ + 1 λ = e (log(k)-ν)/k 22
23 Ausfälle von Hardwarekomponenten Lebensdauerverteilungen von Elektrolytkondensatoren Steigende Hazardrate der Form log(h(t)) = ν+ρ log(t) Weibullverteilte Lebensdauern: f(t) = k λ t λ k 1 e k (t/λ) mit und k = ρ + 1 λ = e (log(k)-ν)/k 23
24 Ausfälle von Hardwarekomponenten Lebensdauerverteilungen von Elektrolytkondensatoren Alternierende Hazardrate durch Kombination. Unterscheidung der Ausfälle in Früh-, Zufalls- und Verschleißausfälle 24
25 Ausfälle von Hardwarekomponenten Lebensdauerverteilungen von Elektrolytkondensatoren Einfluss der Temperatur auf die Lebensdauer: Proportional Hazards Modell log(h (t)) = log(h (t)) + i 0 βx i 25
26 Ausfälle von Hardwarekomponenten Lebensdauerverteilungen von Elektrolytkondensatoren Einfluss der Temperatur auf die Lebensdauer: Proportional Hazards Modell log(h (t)) = log(h (t)) + i 0 βx i β = β = 0 26
27 Ausfälle von Hardwarekomponenten Lebensdauerverteilungen von Elektrolytkondensatoren Einfluss der Temperatur auf die Lebensdauer: Proportional Hazards Modell log(h (t)) = log(h (t)) + i 0 βx i x = 20 x = 25 x =30 27
28 Ausfälle von Hardwarekomponenten Lebensdauerverteilungen von Elektrolytkondensatoren Einfluss der Temperatur auf die Lebensdauer: Proportional Hazards Modell log(h (t)) = log(h (t)) + i 0 βx i 28
29 Automatische Übersetzung Statistische Übersetzung auf Basis von Paralleltext Satz von Bayes: P(D) P(E D) P(D E) = P(E) Wahrscheinlichste Übersetzung von e: dˆ = argmax P(d e) d d: Wie fühlen Sie sich? e: How do you feel? 29
30 Automatische Übersetzung Statistische Übersetzung auf Basis von Paralleltext Direkte Schätzung der Wahrscheinlichkeiten schwer bei seltenen und unmöglich bei unbekannten Sätzen. Darum: Word Alignments d: Wie fühlen Sie sich? m = 4 e: How do you feel? l = 4 a: 1 (2,4)
31 Automatische Übersetzung Statistische Übersetzung auf Basis von Paralleltext Direkte Schätzung der Wahrscheinlichkeiten schwer bei seltenen und unmöglich bei unbekannten Sätzen. Darum: Word Alignments d: Wie fühlen fühlen Sie sich? m = 5 e: How do you feel? l = 4 a:
32 Automatische Übersetzung Statistische Übersetzung auf Basis von Paralleltext IBM Modell 1 P(d, a e) ε = (l+ 1) m t(dj ea ) m j j= 1 Schätzung von Alignments und Übersetzungen durch EM-Algorithmus: 0. Initialisierung von Alignment-Verteilungen 1. Bestimmung von Wortübersetzungsverteilungen auf Basis der (a priori) Alignment-Verteilungen. 2. Bestimmung von (a posteriori) Alignment-Verteilungen und Wortübersetzungsverteilungen 3. -> 1. mit aktualisierten Verteilungen 32
33 Automatische Übersetzung Statistische Übersetzung auf Basis von Paralleltext e 1 d 1 e 2 d 2 He Er She Sie feels fühlt feels fühlt 0. Alignments gleichwahrscheinlich 1. Wortübersetzungsverteilungen P(Er He) = P(Sie She) = 1/2 P(fühlt He) = P(fühlt She) = 1/2 P(Er feels) = P(Sie feels) = 1/4 P(fühlt feels) = 1/2 Alignments: a 1 a 2 a 3 a 4 33
34 Automatische Übersetzung Statistische Übersetzung auf Basis von Paralleltext e 1 d 1 e 2 d 2 He Er She Sie Alignments: a 1 feels fühlt feels fühlt 2. A posteriori Alignmentverteilungen P(d 1,a 1 e 1 ) = P(Er He) P(fühlt feels) = 1/4 P(d 1,a 2 e 1 ) = P(Er He) P(fühlt He) = 1/4 P(d 1,a 3 e 1 ) = P(Er feels) P(fühlt feels) = 1/8 P(d 1,a 4 e 1 ) = P(Er feels) P(fühlt He) = 1/8 P(a i e 1 ) = P(d 1,a i e 1 )/[P(d 1,a 1 e 1 )+P(d 1,a 2 e 1 )+P(d 1,a 3 e 1 )+P(d 1,a 4 e 1 )] a 2 a 3 a 4 34
35 Automatische Übersetzung Statistische Übersetzung auf Basis von Paralleltext 2. A posteriori Alignmentverteilungen P(a 1 e 1 ) = 1/3 P(a 2 e 1 ) = 1/3 P(a 3 e 1 ) = 1/6 P(a 4 e 1 ) = 1/6 e 1 d 1 e 2 d 2 He Er She Sie feels fühlt feels fühlt Alignments: a 1 a 2 a 3 a 4 35
36 Automatische Übersetzung Statistische Übersetzung auf Basis von Paralleltext e 1 d 1 e 2 d 2 He Er She Sie feels fühlt feels fühlt 1. A posteriori Wortübersetzungsverteilungen P(Er He) = P(Sie She) = 4/7 P(fühlt He) = P(fühlt She) = 3/7 P(Er feels) = P(Sie feels) = 1/5 P(fühlt feels) = 3/5 Alignments: a 1 a 2 a 3 a 4 36
37 Automatische Übersetzung Statistische Übersetzung auf Basis von Paralleltext 2. A posteriori Alignmentverteilungen P(d 1,a 1 e 1 ) = P(Er He) P(fühlt feels) = 12/35 P(d 1,a 2 e 1 ) = P(Er He) P(fühlt He) = 12/49 P(d 1,a 3 e 1 ) = P(Er feels) P(fühlt feels) = 3/25 P(d 1,a 4 e 1 ) = P(Er feels) P(fühlt He) = 3/35 usw. e 1 d 1 e 2 d 2 He Er She Sie feels fühlt feels fühlt Alignments: a 1 a 2 a 3 a 4 37
38 Merkmale und Datentypen Einzelobjekte (Untersuchungseinheiten, Merkmalsträger) Statistische Gesamtheit (Kollektiv, Population) Merkmal Form Farbe Linienart Merkmalsausprägungen Ellipse, Ellipse, Ellipse, Rechteck, Rechteck, Ellipse Rot,Blau, Grün, Rot, Gelb, Blau Durchgängig, Gepunktet, Gepunktet, Durchgängig, Gestrichelt, Gestrichelt Wertebereich {Ellipse, Rechteck} {Blau, Gelb, Grün, Rot} {Gepunktet, Gestrichelt, Durchgängig} Breite in cm 2, 1, 1, 2, 1, 3 (0, ) Höhe in cm 1, 1, 2, 2, 3, 1 (0, ) 38
39 Merkmale und Datentypen Datentypen Skalentyp mögliche Aussagen Im Beispiel qualitativ Nominal Gleich / Verschieden Farbe, Form(binär, dichotom) Ordinal Größer / Kleiner Linienart Intervall Differenzen Breite, Höhe, gleich / verschieden Form quantitativ / metrisch Verhältnis Verhältnisse Breite, Höhe gleich / verschieden 39
40 Merkmale und Datentypen Datentypen Merkmalstyp Anzahl der Ausprägungen Im Beispiel Diskret Endlich oder abzählbar Form unendlich viele Breite, Höhe (wenn grob gemessen) Stetig Überabzählbar viele Breite, Höhe (wenn fein gemessen) 40
41 Merkmale und Datentypen Datentypen Merkmalstyp Qualitativ Quantitativ binär Nominal Ordinal Diskret Stetig 41
42 Tabellarische und grafische Darstellung von univariaten Daten Qualitative Daten M N = {e 1,, e N } X x, x W X W X = {x(j) j = 1,..., J} = {x(1),...,x(j)} Populationbestehend aus Objekten e 1,, e N Nominales bzw. ordinales Merkmal Merkmalsausprägungen von X Wertebereich von X mit Merkmalsausprägungen x(j), j = 1,..., J D N = {x n n= 1,, N} = {x 1,, x N } Urlisteaus der Messung von X in der Population M N, d.h. x n = X(e n ), n=1,, N x(1)< x(2) < < x(j) falls X ordinal 42
43 Tabellarische und grafische Darstellung von univariaten Daten Qualitative Daten: Beispiel Bearbeitungen von Softwareaufgaben Bearbeitung Bearbeiter(in) Aufgabe Version Anzahl Clicks Bearbeitungszeit e 1 Kai Export e 2 Kai Verknüpfung e 3 Miriam Export e 4 Tina Verknüpfung e 5 Oliver Export e 6 Tina Export e 7 Tina Verknüpfung e 8 Miriam Export e 9 Miriam Export e 10 Oliver Abfrage e 11 Oliver Verknüpfung e 12 Oliver Abfrage
44 Tabellarische und grafische Darstellung von univariaten Daten Qualitative Daten: Beispiel Bearbeitungen von Softwareaufgaben Bearbeitung Bearbeiter(in) Aufgabe Version Anzahl Clicks Bearbeitungszeit e 1 Kai Export e 2 Kai Verknüpfung e 3 Miriam Export e 4 Tina Verknüpfung e 5 Oliver Export e 6 Tina Export e 7 Tina Verknüpfung e 8 Miriam Export e 9 Miriam Export e 10 Oliver Abfrage e 11 Oliver Verknüpfung e 12 Oliver Abfrage Objekte 44
45 Tabellarische und grafische Darstellung von univariaten Daten Qualitative Daten: Beispiel Bearbeitungen von Softwareaufgaben Bearbeitung Bearbeiter(in) Aufgabe Version Anzahl Clicks Bearbeitungszeit e 1 Kai Export e 2 Kai Verknüpfung e 3 Miriam Export e 4 Tina Verknüpfung e 5 Oliver Export e 6 Tina Export e 7 Tina Verknüpfung e 8 Miriam Export e 9 Miriam Export e 10 Oliver Abfrage e 11 Oliver Verknüpfung e 12 Oliver Abfrage Variablen 45
46 Tabellarische und grafische Darstellung von univariaten Daten Qualitative Daten: Beispiel Bearbeitungen von Softwareaufgaben Bearbeitung Bearbeiter(in) Aufgabe Version Anzahl Clicks Bearbeitungszeit e 1 Kai Export e 2 Kai Verknüpfung e 3 Miriam Export e 4 Tina Verknüpfung e 5 Oliver Export e 6 Tina Export e 7 Tina Verknüpfung e 8 Miriam Export e 9 Miriam Export e 10 Oliver Abfrage e 11 Oliver Verknüpfung e 12 Oliver Abfrage Qualitative Daten 46
47 Tabellarische und grafische Darstellung von univariaten Daten Qualitative Daten: Beispiel Bearbeitungen von Softwareaufgaben Bearbeitung Bearbeiter(in) Aufgabe Version Anzahl Clicks Bearbeitungszeit e 1 Kai Export e 2 Kai Verknüpfung e 3 Miriam Export e 4 Tina Verknüpfung e 5 Oliver Export e 6 Tina Export e 7 Tina Verknüpfung e 8 Miriam Export e 9 Miriam Export e 10 Oliver Abfrage e 11 Oliver Verknüpfung e 12 Oliver Abfrage D N;1, N=12 X 1 = Bearbeiter(in) W X1 = {Kai, Miriam, Oliver, Tina} J 1 = 4 47
48 Tabellarische und grafische Darstellung von univariaten Daten Qualitative Daten: Beispiel Bearbeitungen von Softwareaufgaben Bearbeitung Bearbeiter(in) Aufgabe Version Anzahl Clicks Bearbeitungszeit e 1 Kai Export e 2 Kai Verknüpfung e 3 Miriam Export e 4 Tina Verknüpfung e 5 Oliver Export e 6 Tina Export e 7 Tina Verknüpfung e 8 Miriam Export e 9 Miriam Export e 10 Oliver Abfrage e 11 Oliver Verknüpfung e 12 Oliver Abfrage D N;2, N=12 X 2 = Aufgabe W X2 = {Abfrage, Export, Verknüpfung} J 2 = 3 48
49 Tabellarische und grafische Darstellung von univariaten Daten Qualitative Daten: Beispiel Bearbeitungen von Softwareaufgaben Bearbeitung Bearbeiter(in) Aufgabe Version Anzahl Clicks Bearbeitungszeit e 1 Kai Export e 2 Kai Verknüpfung e 3 Miriam Export e 4 Tina Verknüpfung e 5 Oliver Export e 6 Tina Export e 7 Tina Verknüpfung e 8 Miriam Export e 9 Miriam Export e 10 Oliver Abfrage e 11 Oliver Verknüpfung e 12 Oliver Abfrage D N;3, N=12 X 3 = Version W X3 = {1.1,1.2, 2.0}, 1.1 < 1.2 < 2.0 J 3 = 3 49
50 Tabellarische und grafische Darstellung von univariaten Daten Qualitative Daten: Deskriptive Auswertung Absolute HäufigkeitN j von x(j): Damit gilt x 1 (1) Kai J j= 1 x 1 (2) Miriam N j = N x 1 (3) Oliver x 1 (4) Tina N j = N[x(j)] = Σ N i= 1 d(j), i d(j) = I i x(e ) = x(j) i X 1 (e i ) d 1i (1) d 1i (2) d 1i (3) d 1i (4) 1 Kai Kai Miriam Tina Oliver Tina Tina Miriam Miriam Oliver Oliver Oliver Σ i 50
51 Tabellarische und grafische Darstellung von univariaten Daten Qualitative Daten: Deskriptive Auswertung Relative Häufigkeitf j von x(j): Damit gilt x 1 (1) Kai 2/ J fj = 1 j= 1 x 1 (2) Miriam 3/12 = 0.25 x 1 (3) Oliver 4/ x 1 (4) Tina 3/12 = 0.25 f j = N j N Σ 12/12 = 1 i X 1 (e i ) d 1i (1) d 1i (2) d 1i (3) d 1i (4) 1 Kai Kai Miriam Tina Oliver Tina Tina Miriam Miriam Oliver Oliver Oliver Σ/
52 Tabellarische und grafische Darstellung von univariaten Daten Qualitative Daten: Deskriptive Auswertung Tabellarische Darstellung absoluter und relativer Häufigkeiten Ausprägung Absolute Häufigkeit Relative Häufigkeit x(1) N 1 f 1 = N 1 /N x(j) N J f J = N J /N J j= 1 N j = N J j= 1 f j = 1 52
53 Tabellarische und grafische Darstellung von univariaten Daten Qualitative Daten: Deskriptive Auswertung Tabellarische Darstellung absoluter und relativer Häufigkeiten Ausprägung Bearbeiter(in) Absolute Häufigkeit Relative Häufigkeit Kai Miriam Oliver Tina Ausprägung Aufgabe Absolute Häufigkeit Relative Häufigkeit Abfrage Export Verknüpfung Ausprägung Version Absolute Häufigkeit Relative Häufigkeit
54 Tabellarische und grafische Darstellung von univariaten Daten Quantitativ diskrete Daten M N = {e 1,, e N } X x, x W X W X = {x(j) j = 1,..., J} = {x(1),...,x(j)} Populationbestehend aus Objekten e 1,, e N Quantitatives Merkmal Merkmalsausprägungen von X Wertebereich von X mit Merkmalsausprägungen x(j), j = 1,..., J D N = {x n n= 1,, N} = {x 1,, x N } Urlisteaus der Messung von X in der Population M N, d.h. x n = X(e n ), n=1,, N 54
55 Tabellarische und grafische Darstellung von univariaten Daten Quantitativ diskrete Daten: Beispiel Bearbeitungen von Softwareaufgaben Bearbeitung Bearbeiter(in) Aufgabe Version Anzahl Clicks Bearbeitungszeit e 1 Kai Export e 2 Kai Verknüpfung e 3 Miriam Export e 4 Tina Verknüpfung e 5 Oliver Export e 6 Tina Export e 7 Tina Verknüpfung e 8 Miriam Export e 9 Miriam Export e 10 Oliver Abfrage e 11 Oliver Verknüpfung e 12 Oliver Abfrage D N;4, N=12 X 4 = Anzahl Clicks W X4 = {0, 1,, 10, 11, 12, 13, 14, 15, 16, 17, 18,, } J 4 = 55
56 Tabellarische und grafische Darstellung von univariaten Daten Quantitativ diskrete Daten: Deskriptive Auswertung Absolute HäufigkeitN j und relative Häufigkeit f j analog zu qualitativen Daten j #{xn xn x(j)} Relative Summenhäufigkeit sj = fk = N k= 1 Ausprägung Absolute Häufigkeit Relative Häufigkeit Relative Summenhäufigkeit x(1) N 1 f 1 = N 1 /N f 1 x(2) N 2 f 2 = N 2 /N f 1 + f 2 x(j-1) N J-1 f J-1 = N J-1 /N f f J-1 x(j) N J f J = N J /N f f J = 1 J j= 1 N j = N J j= 1 f j = 1 56
57 Tabellarische und grafische Darstellung von univariaten Daten Quantitativ diskrete Daten: Deskriptive Auswertung Anzahl Clicks Ausprägung Absolute Häufigkeit Relative Häufigkeit Relative Summenhäufigkeit
58 Tabellarische und grafische Darstellung von univariaten Daten Quantitativ diskrete Daten: Deskriptive Auswertung Grafische Darstellung: Empirische Verteilungsfunktion F (x) = sj 0 ~,mitj = max{ j x( j) N j = fk ~ k= 1 x} falls falls x < x(1) x(1) x f 1 + f 2 + f 3 + f 4 + f 5 = 1 = s 5 f 1 + f 2 + f 3 + f 4 = s 4 f 1 + f 2 + f 3 = s 3 f 4 f 5 f 1 + f 2 = s 2 f 1 = s 1 0 f 1 f 2 f 3 x 58
59 Tabellarische und grafische Darstellung von univariaten Daten Quantitativ stetige Daten M N = {e 1,, e N } X x, x W W X U J X = (-, ) = K j j= 1 K j = ( v j-1, v j ], j = 1,, J-1 K J = ( v J-1, v J ) D N = {x n n= 1,, N} = {x 1,, x N } Populationbestehend aus Objekten e 1,, e N Quantitatives Merkmal Merkmalsausprägungen von X Klassierter(kategorisierter) Wertebereich von X Merkmalsklassen mit Klassengrenzen - = v 0 < v 1 < < v J-1 < v J = Urlisteaus der Messung von X in der Population M N, d.h. x n = X(e n ), n=1,, N 59
60 Tabellarische und grafische Darstellung von univariaten Daten Quantitativ stetige Daten: Beispiel Bearbeitungen von Softwareaufgaben Bearbeitung Bearbeiter(in) Aufgabe Version Anzahl Clicks Bearbeitungszeit e 1 Kai Export e 2 Kai Verknüpfung e 3 Miriam Export e 4 Tina Verknüpfung e 5 Oliver Export e 6 Tina Export e 7 Tina Verknüpfung e 8 Miriam Export e 9 Miriam Export e 10 Oliver Abfrage e 11 Oliver Verknüpfung e 12 Oliver Abfrage D N;5, N=12 X 5 = Bearbeitungszeit W X5 = (-, ) = (-, 4] U (4, 5] U U (7, 8] U (8, ) = J 5 = 6 (,4] U 4 U j= 1 (j+ 3, j+ 4] U (8, ) 60
61 Tabellarische und grafische Darstellung von univariaten Daten Quantitativ stetige Daten: Deskriptive Auswertung Klassierte Häufigkeitsverteilung Klasse K j Absolute Häufigkeit Relative Häufigkeit Relative Summenhäufigkeit K 1 = (v 0, v 1 ] N(K 1 ) f(k 1 ) = N(K 1 )/N f(k 1 ) K 2 = (v 1, v 2 ] N(K 2 ) f(k 2 ) = N(K 2 )/N f(k 1 ) + f(k 2 ) K J-1 = (v J-2, v J-1 ] N(K J-1 ) f(k J-1 )= N(K J-1 )/N f(k 1 ) + + f(k J-1 ) K J-1 = (v J-1, v J ) N(K J ) f(k J )= N(K J )/N f(k 1 ) + + f(k J )= 1 J j= 1 N(K ) = N j J j= 1 f(kj) = 1 N(K j ) = #{x x Kj} = #{x vj 1 < x v J } 61
62 Tabellarische und grafische Darstellung von univariaten Daten Quantitativ stetige Daten: Deskriptive Auswertung Bearbeitungszeit Klasse Absolute Häufigkeit Relative Häufigkeit Relative Summenhäufigkeit K 1 = (-, 4] K 2 = (4, 5] K 3 = (5, 6] K 4 = (6, 7] K 5 = (7, 8] K 6 = (8, )
63 Tabellarische und grafische Darstellung von univariaten Daten Quantitativ stetige Daten: Deskriptive Auswertung Grafische Darstellung: Histogramm Aufbauend auf klassierter Häufigkeitsverteilung, allerdings v 0 - und v J b 2 =2 b 3 =1 h 2 =0.2 f(k 2 ) f(k 3 ) h 3 =0.2 = 0.4 =0.2 b 5 =1 Flächen der Rechtecke zu K j entsprechen f(k j ). Rechteckbreiten sind gegeben durch b j = v j -v j-1. Damit ergeben sich als Rechteckhöhen h j = f(k j )/b j 0.05 h 1 =0.05 b 1 =4 f(k 1 ) = 0.2 b 4 =2 f(k 4 ) =0.1 f(k 5 ) =0.1 h 5 = = h 4 63
64 Tabellarische und grafische Darstellung von univariaten Daten Quantitativ stetige Daten: Deskriptive Auswertung Grafische Darstellung: Histogramm Üblicherweise gleiche Klassenbreiten h 3 =0.2 b=2 f(k 3 )=0.4 f(k 4 )=0.25 h 4 =0.125 Flächen der Rechtecke zu K j entsprechen f(k j ). Rechteckbreiten sind gegeben durch b= v j -v j-1. Damit ergeben sich als Rechteckhöhen h j = f(k j )/b 0.05 h 2 =0.075 f(k 2 )=0.15 f(k 5 )=0.15 h 5 =0.075 h 1 =0.025 f(k 1 )=
Deskriptive Statistik 1 behaftet.
Die Statistik beschäftigt sich mit Massenerscheinungen, bei denen die dahinterstehenden Einzelereignisse meist zufällig sind. Statistik benutzt die Methoden der Wahrscheinlichkeitsrechnung. Fundamentalregeln:
MehrWahrscheinlichkeits - rechnung und Statistik
Michael Sachs Mathematik-Studienhilfen Wahrscheinlichkeits - rechnung und Statistik für Ingenieurstudenten an Fachhochschulen 4., aktualisierte Auflage 2.2 Eindimensionale Häufigkeitsverteilungen 19 absolute
Mehr1. Einführung und statistische Grundbegriffe. Grundsätzlich unterscheidet man zwei Bedeutungen des Begriffs Statistik:
. Einführung und statistische Grundbegriffe Beispiele aus dem täglichen Leben Grundsätzlich unterscheidet man zwei Bedeutungen des Begriffs Statistik: Quantitative Information Graphische oder tabellarische
MehrStatistische Kennzahlen für die Lage
Statistische Kennzahlen für die Lage technische universität ach der passenden grafischen Darstellung der Werte eines Merkmals auf der Gesamtheit der Beobachtungen interessieren jetzt geschickte algebraische
MehrTabellarische und graphie Darstellung von univariaten Daten
Part I Wrums 1 Motivation und Einleitung Motivation Satz von Bayes Übersetzten mit Paralleltext Merkmale und Datentypen Skalentypen Norminal Ordinal Intervall Verältnis Merkmalstyp Diskret Stetig Tabellarische
Mehr0 Einführung: Was ist Statistik
0 Einführung: Was ist Statistik 1 Datenerhebung und Messung 2 Univariate deskriptive Statistik Häufigkeitsverteilungen Statistische Kennwerte 3 Multivariate Statistik 4 Regression 5 Ergänzungen Deskriptive
MehrModul 04: Messbarkeit von Merkmalen, Skalen und Klassierung. Prof. Dr. W. Laufner Beschreibende Statistik
Modul 04: Messbarkeit von Merkmalen, Skalen und 1 Modul 04: Informationsbedarf empirische (statistische) Untersuchung Bei einer empirischen Untersuchung messen wir Merkmale bei ausgewählten Untersuchungseinheiten
MehrMathematik für Biologen
Mathematik für Biologen Prof. Dr. Rüdiger W. Braun Heinrich-Heine Universität Düsseldorf 14. Oktober 2010 Übungen Aufgabenblatt 1 wird heute Nachmittag auf das Weblog gestellt. Geben Sie die Lösungen dieser
Mehrhtw saar 1 EINFÜHRUNG IN DIE STATISTIK: BESCHREIBENDE STATISTIK
htw saar 1 EINFÜHRUNG IN DIE STATISTIK: BESCHREIBENDE STATISTIK htw saar 2 Grundbegriffe htw saar 3 Grundgesamtheit und Stichprobe Ziel: Über eine Grundgesamtheit (Population) soll eine Aussage über ein
MehrStandardisierte Vorgehensweisen und Regeln zur Gewährleistung von: Eindeutigkeit Schlussfolgerungen aus empirischen Befunden sind nur dann zwingend
Standardisierte Vorgehensweisen und Regeln zur Gewährleistung von: Eindeutigkeit Schlussfolgerungen aus empirischen Befunden sind nur dann zwingend oder eindeutig, wenn keine alternativen Interpretationsmöglichkeiten
MehrForschungsstatistik I
Prof. Dr. G. Meinhardt 6. Stock, Taubertsberg 2 R. 06-206 (Persike) R. 06-214 (Meinhardt) Sprechstunde jederzeit nach Vereinbarung Forschungsstatistik I Dr. Malte Persike persike@uni-mainz.de http://psymet03.sowi.uni-mainz.de/
MehrZufallsvariablen. Diskret. Stetig. Verteilung der Stichprobenkennzahlen. Binomial Hypergeometrisch Poisson. Normal Lognormal Exponential
Zufallsvariablen Diskret Binomial Hypergeometrisch Poisson Stetig Normal Lognormal Exponential Verteilung der Stichprobenkennzahlen Zufallsvariable Erinnerung: Merkmal, Merkmalsausprägung Deskriptive Statistik:
MehrDeskription, Statistische Testverfahren und Regression. Seminar: Planung und Auswertung klinischer und experimenteller Studien
Deskription, Statistische Testverfahren und Regression Seminar: Planung und Auswertung klinischer und experimenteller Studien Deskriptive Statistik Deskriptive Statistik: beschreibende Statistik, empirische
MehrWISTA WIRTSCHAFTSSTATISTIK
WISTA WIRTSCHAFTSSTATISTIK PROF DR ROLF HÜPEN FAKULTÄT FÜR WIRTSCHAFTSWISSENSCHAFT Seminar für Theoretische Wirtschaftslehre Vorlesungsprogramm 23042013 Datenlagen und Darstellung eindimensionaler Häufigkeitsverteilungen
MehrGrafische Darstellung von Häufigkeitsverteilungen (1)
Grafische Darstellung von Häufigkeitsverteilungen () Grafische Darstellungen dienen... - Einführung - der Unterstützung des Lesens und Interpretierens von Daten. der Veranschaulichung mathematischer Begriffe
MehrInstitut für Biometrie und klinische Forschung. WiSe 2012/2013
Klinische Forschung WWU Münster Pflichtvorlesung zum Querschnittsfach Epidemiologie, Biometrie und Med. Informatik Praktikum der Medizinischen Biometrie (3) Überblick. Deskriptive Statistik I 2. Deskriptive
MehrEinführung in die Statistik
Einführung in die Statistik 1. Deskriptive Statistik 2. Induktive Statistik 1. Deskriptive Statistik 1.0 Grundbegriffe 1.1 Skalenniveaus 1.2 Empirische Verteilungen 1.3 Mittelwerte 1.4 Streuungsmaße 1.0
MehrInhaltsverzeichnis: Aufgaben zur Vorlesung Statistik Seite 1 von 10 Prof. Dr. Karin Melzer, Prof. Dr. Gabriele Gühring, Fakultät Grundlagen
Inhaltsverzeichnis: 1. Aufgabenlösungen... Lösung zu Aufgabe 1:... Lösung zu Aufgabe... Lösung zu Aufgabe 3... Lösung zu Aufgabe 4... Lösung zu Aufgabe 5... 3 Lösung zu Aufgabe... 3 Lösung zu Aufgabe 7...
MehrLösungen zu Übung 1 (Kap. 1.5) Prof. Dr.B.Grabowski
Lösungen zur Übung1: Skript I (Beschreibende Statistik), Kap. 1.5 Aufgabe 1 1. Sind folgende Merkmale diskret oder stetig? a) Die durch eine wahlberechtigte Person der BRD gewählte Partei bei der Bundestagswahl.
MehrDeskriptive Statistik
Helge Toutenburg Christian Heumann Deskriptive Statistik Eine Einführung in Methoden und Anwendungen mit R und SPSS Siebte, aktualisierte und erweiterte Auflage Mit Beiträgen von Michael Schomaker 4ü Springer
Mehr1 x 1 y 1 2 x 2 y 2 3 x 3 y 3... n x n y n
3.2. Bivariate Verteilungen zwei Variablen X, Y werden gemeinsam betrachtet (an jedem Objekt werden gleichzeitig zwei Merkmale beobachtet) Beobachtungswerte sind Paare von Merkmalsausprägungen (x, y) Beispiele:
MehrDr. Maike M. Burda. Welchen Einfluss hat die Körperhöhe auf das Körpergewicht? Eine Regressionsanalyse. HU Berlin, Econ Bootcamp 7.-9.
Dr. Maike M. Burda Welchen Einfluss hat die Körperhöhe auf das Körpergewicht? Eine Regressionsanalyse. HU Berlin, Econ Bootcamp 7.-9. Januar 2011 BOOTDATA11.GDT: 250 Beobachtungen für die Variablen...
MehrKapitel III - Merkmalsarten
Universität Karlsruhe (TH) Institut für Statistik und Mathematische Wirtschaftstheorie Statistik 1 - Deskriptive Statistik Kapitel III - Merkmalsarten Markus Höchstötter Lehrstuhl für Statistik, Ökonometrie
MehrSozialwissenschaftlerInnen II
Statistik für SozialwissenschaftlerInnen II Henning Best best@wiso.uni-koeln.de Universität zu Köln Forschungsinstitut für Soziologie Statistik für SozialwissenschaftlerInnen II p.1 Wahrscheinlichkeitsfunktionen
MehrInhaltsverzeichnis Grundlagen aufigkeitsverteilungen Maßzahlen und Grafiken f ur eindimensionale Merkmale
1. Grundlagen... 1 1.1 Grundgesamtheit und Untersuchungseinheit................ 1 1.2 Merkmal oder statistische Variable........................ 2 1.3 Datenerhebung.........................................
MehrKreisdiagramm, Tortendiagramm
Kreisdiagramm, Tortendiagramm Darstellung der relativen (absoluten) Häufigkeiten als Fläche eines Kreises Anwendung: Nominale Merkmale Ordinale Merkmale (Problem: Ordnung nicht korrekt wiedergegeben) Gruppierte
MehrMathematik für Biologen
Mathematik für Biologen Prof. Dr. Rüdiger W. Braun Ruediger.Braun@uni-duesseldorf.de Heinrich-Heine Universität Düsseldorf Mathematik für Biologen p. 1 Hinweise Internetseite zur Vorlesung: http://blog.ruediger-braun.net
MehrEinführung in die Statistik für Wirtschaftswissenschaftler für Betriebswirtschaft und Internationales Management
Einführung in die Statistik für Wirtschaftswissenschaftler für Betriebswirtschaft und Internationales Management Sommersemester 2013 Hochschule Augsburg Lageparameter: Erwartungswert d) Erwartungswert
MehrAbschnitt: Algorithmendesign und Laufzeitanalyse
Abschnitt: Algorithmendesign und Laufzeitanalyse Definition Divide-and-Conquer Paradigma Divide-and-Conquer Algorithmen verwenden die Strategien 1 Divide: Teile das Problem rekursiv in Subproblem gleicher
MehrWichtige Definitionen und Aussagen
Wichtige Definitionen und Aussagen Zufallsexperiment, Ergebnis, Ereignis: Unter einem Zufallsexperiment verstehen wir einen Vorgang, dessen Ausgänge sich nicht vorhersagen lassen Die möglichen Ausgänge
MehrZusammenfassung Mathe II. Themenschwerpunkt 2: Stochastik (ean) 1. Ein- und mehrstufige Zufallsexperimente; Ergebnismengen
Zusammenfassung Mathe II Themenschwerpunkt 2: Stochastik (ean) 1. Ein- und mehrstufige Zufallsexperimente; Ergebnismengen Zufallsexperiment: Ein Vorgang, bei dem mindestens zwei Ereignisse möglich sind
MehrTEIL 7: EINFÜHRUNG UNIVARIATE ANALYSE TABELLARISCHE DARSTELLUNG / AUSWERTUNG
TEIL 7: EINFÜHRUNG UNIVARIATE ANALYSE TABELLARISCHE DARSTELLUNG / AUSWERTUNG GLIEDERUNG Statistik eine Umschreibung Gliederung der Statistik in zwei zentrale Teilbereiche Deskriptive Statistik Inferenzstatistik
MehrDr. Maike M. Burda. Welchen Einfluss hat die Körperhöhe auf das Körpergewicht? Eine Regressionsanalyse. HU Berlin, Econ Bootcamp
Dr. Maike M. Burda Welchen Einfluss hat die Körperhöhe auf das Körpergewicht? Eine Regressionsanalyse. HU Berlin, Econ Bootcamp 8.-10. Januar 2010 BOOTDATA.GDT: 250 Beobachtungen für die Variablen... cm:
MehrUniv.-Prof. Dr. Georg Wydra
Univ.-Prof. Dr. Georg Wydra Methoden zur Auswertung von Untersuchungen 1 SKALENTYPEN UND VARIABLEN 2 ZUR BEDEUTUNG DER STATISTIK IN DER FORSCHUNG 3 STATISTIK ALS VERFAHREN ZUR PRÜFUNG VON HYPOTHESEN 4
MehrArbeitsbuch zur deskriptiven und induktiven Statistik
Helge Toutenburg Michael Schomaker Malte Wißmann Christian Heumann Arbeitsbuch zur deskriptiven und induktiven Statistik Zweite, aktualisierte und erweiterte Auflage 4ü Springer Inhaltsverzeichnis 1. Grundlagen
MehrKapitel V - Graphische Darstellung von Häufigkeitsverteilungen
Institut für Volkswirtschaftslehre (ECON) Lehrstuhl für Ökonometrie und Statistik Kapitel V - Graphische Darstellung von Häufigkeitsverteilungen Deskriptive Statistik Prof. Dr. W.-D. Heller Hartwig Senska
Mehr3. Merkmale und Daten
3. Merkmale und Daten Ziel dieses Kapitels: Vermittlung des statistischen Grundvokabulars Zu klärende Begriffe: Grundgesamtheit Merkmale (Skalenniveau etc.) Stichprobe 46 3.1 Grundgesamtheiten Definition
MehrForschungsstatistik I
Prof. Dr. G. Meinhardt 2. Stock, Nordflügel R. 02-429 (Persike) R. 02-431 (Meinhardt) Sprechstunde jederzeit nach Vereinbarung Forschungsstatistik I Dr. Malte Persike persike@uni-mainz.de WS 2008/2009
MehrWahrscheinlichkeitstheorie Kapitel I - Einführende Beispiele
Wahrscheinlichkeitstheorie Kapitel I - Einführende Beispiele Georg Bol georg.bol@statistik.uni-karlsruhe.de Markus Höchstötter hoechstoetter@statistik.uni-karlsruhe.de Wahrscheinlichkeitstheorie Agenda:
Mehr9. Kapitel: Grafische Darstellung quantitativer Informationen
9. Kapitel: Grafische Darstellung quantitativer Informationen 9.1: Fallstricke bei der Übersetzung von Zahlen in Bilder a) optische Täuschungen b) absichtliche Manipulationen 9.2: Typologie von Datengrafiken
MehrBiomathematik für Mediziner, Klausur SS 2000 Seite 1
Biomathematik für Mediziner, Klausur SS 2000 Seite 1 Aufgabe 1: Bei der Diagnose einer bestimmten Krankheit mit einem speziellen Diagnoseverfahren werden Patienten, die tatsächlich an der Krankheit leiden,
MehrKapitel 2. Häufigkeitsverteilungen
6 Kapitel 2 Häufigkeitsverteilungen Ziel: Darstellung bzw Beschreibung (Exploration) einer Variablen Ausgangssituation: An n Einheiten ω,, ω n sei das Merkmal X beobachtet worden x = X(ω ),, x n = X(ω
MehrWahrscheinlichkeitsrechnung und Statistik
3. Vorlesung - 21.10.2016 Bedingte Wahrscheinlichkeit In einer Urne sind 2 grüne und 3 blaue Kugeln. 2 Kugeln werden ohne Zürücklegen gezogen. Welches ist die Wahrscheinlichkeit, dass : a) man eine grüne
MehrWirtschaftswissenschaftliches Prüfungsamt Bachelor-Prüfung Deskriptive Statistik und Wahrscheinlichkeitsrechnung Wintersemester 2010/11.
Wirtschaftswissenschaftliches Prüfungsamt Bachelor-Prüfung Deskriptive Statistik und Wahrscheinlichkeitsrechnung Wintersemester 2010/11 Namensschild Dr. Martin Becker Hinweise für die Klausurteilnehmer
MehrZufallsvariablen [random variable]
Zufallsvariablen [random variable] Eine Zufallsvariable (Zufallsgröße) X beschreibt (kodiert) die Versuchsausgänge ω Ω mit Hilfe von Zahlen, d.h. X ist eine Funktion X : Ω R ω X(ω) Zufallsvariablen werden
MehrP (A B) P (B) = P ({3}) P ({1, 3, 5}) = 1 3.
2 Wahrscheinlichkeitstheorie Beispiel. Wie wahrscheinlich ist es, eine Zwei oder eine Drei gewürfelt zu haben, wenn wir schon wissen, dass wir eine ungerade Zahl gewürfelt haben? Dann ist Ereignis A das
MehrPunktschätzer Optimalitätskonzepte
Kapitel 1 Punktschätzer Optimalitätskonzepte Sei ein statistisches Modell gegeben: M, A, P ϑ Sei eine Funktion des Parameters ϑ gegeben, γ : Θ G, mit irgendeiner Menge G, und sei noch eine Sigma-Algebra
MehrDeskriptive Statistik Auswertung durch Informationsreduktion
Deskriptive Statistik Auswertung durch Informationsreduktion Gliederung Ø Grundbegriffe der Datenerhebung Total-/Stichprobenerhebung, qualitatives/quantitatives Merkmal Einteilung der Daten (Skalierung,
MehrAdaptive Systeme. Prof. Dr.-Ing. Heinz-Georg Fehn Prof. Dr. rer. nat. Nikolaus Wulff
Adaptive Systeme Evolutionäre Algorithmen: Überlebenskampf und Evolutionäre Strategien Prof. Dr.-Ing. Heinz-Georg Fehn Prof. Dr. rer. nat. Nikolaus Wulff Überblick Einleitung Adaptive Filter Künstliche
MehrReferenten: Gina Spieler, Beatrice Bressau, Laura Uhlmann Veranstaltung: Statistik für das Lehramt Dozent: Martin Tautenhahn
8.5 Eindimensionale stetige Zufallsvariablen Eine Zufallsvariable X heißt stetig, wenn es eine Funktion f(x) gibt, sodass die Verteilungsfunktion von X folgende Gestalt hat: x F(x) = f(t)dt f(x) heißt
MehrDaten, Datentypen, Skalen
Bildung kommt von Bildschirm und nicht von Buch, sonst hieße es ja Buchung. Daten, Datentypen, Skalen [main types of data; levels of measurement] Die Umsetzung sozialwissenschaftlicher Forschungsvorhaben
MehrETWR Teil B. Spezielle Wahrscheinlichkeitsverteilungen (stetig)
ETWR Teil B 2 Ziele Bisher (eindimensionale, mehrdimensionale) Zufallsvariablen besprochen Lageparameter von Zufallsvariablen besprochen Übertragung des gelernten auf diskrete Verteilungen Ziel des Kapitels
Mehr3. Suchen. Das Suchproblem. Suche in Array. Lineare Suche. 1 n. i = n Gegeben Menge von Datensätzen.
Das Suchproblem Gegeben Menge von Datensätzen. 3. Suchen Beispiele Telefonverzeichnis, Wörterbuch, Symboltabelle Jeder Datensatz hat einen Schlüssel k. Schlüssel sind vergleichbar: eindeutige Antwort auf
Mehr1 Stochastik deskriptive Statistik und Wahrscheinlichkeitsrechnung. Statistik und Wahrscheinlichkeitsrechnung
1 Stochastik deskriptive Statistik und Wahrscheinlichkeitsrechnung Statistik und Wahrscheinlichkeitsrechnung 2 Stochastik deskriptive Statistik und Wahrscheinlichkeitsrechnung Stochastik Wahrscheinlichkeitsrechnung
MehrStatistik II: Grundlagen und Definitionen der Statistik
Medien Institut : Grundlagen und Definitionen der Statistik Dr. Andreas Vlašić Medien Institut (0621) 52 67 44 vlasic@medien-institut.de Gliederung 1. Hintergrund: Entstehung der Statistik 2. Grundlagen
MehrMathematische und statistische Methoden II
Prof. Dr. G. Meinhardt 6. Stock, Wallstr. 3 (Raum 06-206) Sprechstunde jederzeit nach Vereinbarung und nach der Vorlesung. Mathematische und statistische Methoden II Dr. Malte Persike persike@uni-mainz.de
MehrMathematische Statistik. Zur Notation
Mathematische Statistik dient dazu, anhand von Stichproben Informationen zu gewinnen. Während die Wahrscheinlichkeitsrechnung Prognosen über das Eintreten zufälliger (zukünftiger) Ereignisse macht, werden
MehrAlgorithmen und Datenstrukturen
Algorithmen und Datenstrukturen Große Übung #6 Phillip Keldenich, Arne Schmidt 26.02.2017 Heute: Master-Theorem Phillip Keldenich, Arne Schmidt Große Übung 2 Vorbetrachtungen Wir betrachten rekursive Gleichungen
MehrUniversität Basel Wirtschaftswissenschaftliches Zentrum. Zufallsvariablen. Dr. Thomas Zehrt
Universität Basel Wirtschaftswissenschaftliches Zentrum Zufallsvariablen Dr. Thomas Zehrt Inhalt: 1. Einführung 2. Zufallsvariablen 3. Diskrete Zufallsvariablen 4. Stetige Zufallsvariablen 5. Erwartungswert
MehrInhaltsverzeichnis. 1 Über dieses Buch Zum Inhalt dieses Buches Danksagung Zur Relevanz der Statistik...
Inhaltsverzeichnis 1 Über dieses Buch... 11 1.1 Zum Inhalt dieses Buches... 13 1.2 Danksagung... 15 2 Zur Relevanz der Statistik... 17 2.1 Beispiel 1: Die Wahrscheinlichkeit, krank zu sein, bei einer positiven
MehrForschungsmethoden in der Sozialen Arbeit
Forschungsmethoden in der Sozialen Arbeit Fachhochschule für Sozialarbeit und Sozialpädagogik Alice- Salomon Hochschule für Soziale arbeit, Gesundheit, Erziehung und Bildung University of Applied Sciences
Mehr7. Grenzwertsätze. Dr. Antje Kiesel Institut für Angewandte Mathematik WS 2011/2012
7. Grenzwertsätze Dr. Antje Kiesel Institut für Angewandte Mathematik WS 2011/2012 Mittelwerte von Zufallsvariablen Wir betrachten die arithmetischen Mittelwerte X n = 1 n (X 1 + X 2 + + X n ) von unabhängigen
MehrÜbung Algorithmen und Datenstrukturen
Übung Algorithmen und Datenstrukturen Sommersemester 2017 Patrick Schäfer, Humboldt-Universität zu Berlin Agenda: Sortierverfahren 1. Schreibtischtest 2. Stabilität 3. Sortierung spezieller Arrays 4. Untere
MehrAdaptive Systeme. Prof. Dr.-Ing. Heinz-Georg Fehn Prof. Dr. rer. nat. Nikolaus Wulff
Adaptive Systeme Evolutionäre Algorithmen Teil II Evolutionsfenster durch Mutation und sexuelle Rekombination Prof. Dr.-Ing. Heinz-Georg Fehn Prof. Dr. rer. nat. Nikolaus Wulff Evolutionäre Algorithmen
MehrVoraussetzung für statistische Auswertung: jeder Fall besitzt in bezug auf jedes Merkmal genau eine Ausprägung
Rohdaten Urliste oder Rohdaten sind die auszuwertenden Daten in der Form, wie sie nach der Datenerhebung vorliegen. Dimensionen der Urliste sind die Fälle, Merkmale und ihre Ausprägungen. Voraussetzung
MehrWillkommen zur Vorlesung Statistik
Willkommen zur Vorlesung Statistik Thema dieser Vorlesung: Häufigkeiten und ihre Verteilung, oder: Zusammenfassende Darstellungen einzelner Variablen Prof. Dr. Wolfgang Ludwig-Mayerhofer Universität Siegen
MehrI. Zahlen, Rechenregeln & Kombinatorik
XIV. Wiederholung Seite 1 I. Zahlen, Rechenregeln & Kombinatorik 1 Zahlentypen 2 Rechenregeln Brüche, Wurzeln & Potenzen, Logarithmen 3 Prozentrechnung 4 Kombinatorik Möglichkeiten, k Elemente anzuordnen
MehrEinführung in die Statistik für Wirtschaftswissenschaftler für Betriebswirtschaft und Internationales Management
Einführung in die Statistik für Wirtschaftswissenschaftler für Betriebswirtschaft und Internationales Management Sommersemester 03 Hochschule Augsburg : Gliederung Einführung Deskriptive Statistik 3 Wahrscheinlichkeitstheorie
MehrStetige Verteilungen Rechteckverteilung
Stetige Verteilungen Rechteckverteilung Die Längenabweichungen X produzierter Werkstücke von der Norm seien gleichmäßig verteilt zwischen a = mm und b = 4mm. Die Dichtefunktion lautet also f(x) = für a
MehrMathematische und statistische Methoden II
Sprechstunde jederzeit nach Vereinbarung und nach der Vorlesung Wallstr. 3, 6. Stock, Raum 06-206 Mathematische und statistische Methoden II Dr. Malte Persike persike@uni-mainz.de lordsofthebortz.de lordsofthebortz.de/g+
MehrZufallsvariable: Verteilungen & Kennzahlen
Mathematik II für Biologen 12. Juni 2015 Zufallsvariable Kennzahlen: Erwartungswert Kennzahlen: Varianz Kennzahlen: Erwartungstreue Verteilungsfunktion Beispiel: Exponentialverteilung Kennzahlen: Erwartungswert
MehrStatistik I für Betriebswirte Vorlesung 9
Statistik I für Betriebswirte Vorlesung 9 Dr. Andreas Wünsche TU Bergakademie Freiberg Institut für Stochastik Vorlesung am 8. Juni 2017 im Audi-Max (AUD-1001) Dr. Andreas Wünsche Statistik I für Betriebswirte
MehrDeskriptive Statistik Lösungen zu Blatt 1 Christian Heumann, Susanne Konrath SS Lösung Aufgabe 1
1 Deskriptive Statistik Lösungen zu Blatt 1 Christian Heumann, Susanne Konrath SS 2011 Lösung Aufgabe 1 (a) Es sollen die mathematischen Vorkenntnisse der Studenten, die die Vorlesung Statistik I für Statistiker,
MehrStochastik I. Vorlesungsmitschrift
Stochastik I Vorlesungsmitschrift Ulrich Horst Institut für Mathematik Humboldt-Universität zu Berlin Inhaltsverzeichnis 1 Grundbegriffe 1 1.1 Wahrscheinlichkeitsräume..................................
MehrAufgabenstellung und Ergebnisse zur. Bachelor-Prüfung Deskriptive Statistik und Wahrscheinlichkeitsrechnung Wintersemester 2015/16. Dr.
Aufgabenstellung und Ergebnisse zur Bachelor-Prüfung Deskriptive Statistik und Wahrscheinlichkeitsrechnung Wintersemester 205/6 Dr. Martin Becker Hinweise für die Klausurteilnehmer ˆ Die Klausur besteht
MehrKapitel 5. Univariate Zufallsvariablen. 5.1 Diskrete Zufallsvariablen
Kapitel 5 Univariate Zufallsvariablen Im ersten Teil dieses Skriptes haben wir uns mit Daten beschäftigt und gezeigt, wie man die Verteilung eines Merkmals beschreiben kann. Ist man nur an der Population
MehrKapitel VIII - Mehrdimensionale Merkmale
Institut für Volkswirtschaftslehre (ECON) Lehrstuhl für Ökonometrie und Statistik Kapitel VIII - Mehrdimensionale Merkmale Deskriptive Statistik Prof. Dr. W.-D. Heller Hartwig Senska Carlo Siebenschuh
MehrScheinklausur zur Vorlesung Stochastik II
Institut für Mathematische Stochastik WS 2007/2008 Universität Karlsruhe 25. 02. 2008 Dr. B. Klar Scheinklausur zur Vorlesung Stochastik II Muster-Lösung Dauer: 90 Minuten Name: Vorname: Matrikelnummer:
Mehr4. Schließende Statistik (Inferenzstatistik, konfirmatorische Verfahren)
4. Schließende Statistik (Inferenzstatistik, konfirmatorische Verfahren) 4.1. Einführung Schätzen unbekannter Parameter im Modell, z.b. Wahrscheinlichkeiten p i (Anteile in der Gesamtmenge), Erwartungswerte
MehrExponentialverteilung
Exponentialverteilung Dauer von kontinuierlichen Vorgängen (Wartezeiten; Funktionszeiten technischer Geräte) Grenzübergang von der geometrischen Verteilung Pro Zeiteinheit sei die Eintrittswahrscheinlichkeit
MehrMathematische und statistische Methoden II
Methodenlehre e e Prof. Dr. G. Meinhardt 6. Stock, Wallstr. 3 (Raum 06-206) Sprechstunde jederzeit nach Vereinbarung und nach der Vorlesung. Mathematische und statistische Methoden II Dr. Malte Persike
MehrWirtschaftsmathematik
Einführung in einige Teilbereiche der Wintersemester 206 Prof. Dr. Stefan Etschberger HSA Unabhängigkeit von Ereignissen A, B unabhängig: Eintreten von A liefert keine Information über P(B). Formal: P(A
MehrSortieralgorithmen. Jan Pöschko. 18. Januar Problemstellung Definition Warum Sortieren?... 2
Jan Pöschko 18. Januar 2007 Inhaltsverzeichnis 1 Problemstellung 2 1.1 Definition................................... 2 1.2 Warum Sortieren?.............................. 2 2 Einfache Sortieralgorithmen
Mehr1.5 Erwartungswert und Varianz
Ziel: Charakterisiere Verteilungen von Zufallsvariablen durch Kenngrößen (in Analogie zu Lage- und Streuungsmaßen der deskriptiven Statistik). Insbesondere: a) durchschnittlicher Wert Erwartungswert, z.b.
Mehr2 Häufigkeitsverteilungen
2 Häufigkeitsverteilungen Ziel: Darstellung bzw Beschreibung (Exploration) einer Variablen Ausgangssituation An n Einheiten ω 1,,ω n sei das Merkmal X beobachtet worden x 1 = X(ω 1 ),,x n = X(ω n ) Also
MehrLagemaße Übung. Zentrale Methodenlehre, Europa Universität - Flensburg
Lagemaße Übung M O D U S, M E D I A N, M I T T E L W E R T, M O D A L K L A S S E, M E D I A N, K L A S S E, I N T E R P O L A T I O N D E R M E D I A N, K L A S S E M I T T E Zentrale Methodenlehre, Europa
MehrWahrscheinlichkeitstheorie 2
Wahrscheinlichkeitstheorie 2 Caroline Sporleder Computational Linguistics Universität des Saarlandes Sommersemester 2011 19.05.2011 Caroline Sporleder Wahrscheinlichkeitstheorie 2 (1) Wiederholung (1):
Mehr3 Häufigkeitsverteilungen
3 Häufigkeitsverteilungen 3.1 Absolute und relative Häufigkeiten 3.2 Klassierung von Daten 3.3 Verteilungsverläufe 3.1 Absolute und relative Häufigkeiten Datenaggregation: Bildung von Häufigkeiten X nominal
MehrStochastik. 1. Wahrscheinlichkeitsräume
Stochastik 1. Wahrscheinlichkeitsräume Ein Zufallsexperiment ist ein beliebig oft und gleichartig wiederholbarer Vorgang mit mindestens zwei verschiedenen Ergebnissen, bei dem der Ausgang ungewiß ist.
Mehr3 Häufigkeitsverteilungen
3 Häufigkeitsverteilungen 3.1 Absolute und relative Häufigkeiten 3.2 Klassierung von Daten 3.3 Verteilungsverläufe 3.1 Absolute und relative Häufigkeiten Datenaggregation: Bildung von Häufigkeiten X nominal
MehrEindimensionale Zufallsvariablen
Eindimensionale Grundbegriffe Verteilungstypen Diskrete Stetige Spezielle Maßzahlen für eindimensionale Erwartungswert Varianz Standardabweichung Schwankungsintervalle Bibliografie Bleymüller / Gehlert
Mehr4. Kumulierte Häufigkeiten und Quantile
4. Kumulierte Häufigkeiten und Quantile Statistik für SoziologInnen 1 4. Kumulierte Häufigkeiten und Quantile Kumulierte Häufigkeiten Oft ist man nicht an der Häufigkeit einzelner Merkmalsausprägungen
MehrStatistikpraktikum. Carsten Rezny. Sommersemester Institut für angewandte Mathematik Universität Bonn
Statistikpraktikum Carsten Rezny Institut für angewandte Mathematik Universität Bonn Sommersemester 2016 Anmeldung in Basis: 06. 10.06.2016 Organisatorisches Einführung Statistik Analyse empirischer Daten
MehrEinführung in die Wahrscheinlichkeitsrechnung
Einführung in die Wahrscheinlichkeitsrechnung Sven Garbade Fakultät für Angewandte Psychologie SRH Hochschule Heidelberg sven.garbade@hochschule-heidelberg.de Statistik 1 S. Garbade (SRH Heidelberg) Wahrscheinlichkeitsrechnung
MehrSoftwareprojektpraktikum Maschinelle Übersetzung
Softwareprojektpraktikum Maschinelle Übersetzung Jan-Thorsten Peter, Andreas Guta, Jan Rosendahl max.bleu@i6.informatik.rwth-aachen.de Vorbesprechung 5. Aufgabe 22. Juni 2017 Human Language Technology
MehrStatistik für Ingenieure Vorlesung 2
Statistik für Ingenieure Vorlesung 2 Prof. Dr. Hans-Jörg Starkloff TU Bergakademie Freiberg Institut für Stochastik 24. Oktober 2016 2.4 Bedingte Wahrscheinlichkeiten Häufig ist es nützlich, Bedingungen
MehrMathematische Statistik Aufgaben zum Üben. Schätzer
Prof. Dr. Z. Kabluchko Wintersemester 2016/17 Philipp Godland 14. November 2016 Mathematische Statistik Aufgaben zum Üben Keine Abgabe Aufgabe 1 Schätzer Es seien X 1,..., X n unabhängige und identisch
MehrPhilipp Sibbertsen Hartmut Lehne. Statistik. Einführung für Wirtschafts- und. Sozialwissenschaftler. 2., überarbeitete Auflage. 4^ Springer Gabler
Philipp Sibbertsen Hartmut Lehne Statistik Einführung für Wirtschafts- und Sozialwissenschaftler 2., überarbeitete Auflage 4^ Springer Gabler Inhaltsverzeichnis Teil I Deskriptive Statistik 1 Einführung
MehrVerteilungen und ihre Darstellungen
Verteilungen und ihre Darstellungen Übung: Stamm-Blatt-Diagramme Wie sind die gekennzeichneten Beobachtungswerte eweils zu lesen? Tragen Sie in beiden Diagrammen den Wert 0.452 an der richtigen Stelle
Mehr4. Kumulierte Häufigkeiten und Quantile
4. Kumulierte Häufigkeiten und Quantile Kumulierte Häufigkeiten Oft ist man nicht an der Häufigkeit einzelner Merkmalsausprägungen interessiert, sondern an der Häufigkeit von Intervallen. Typische Fragestellung:
Mehr