Statistische Kennzahlen für die Lage

Größe: px
Ab Seite anzeigen:

Download "Statistische Kennzahlen für die Lage"

Transkript

1 Statistische Kennzahlen für die Lage technische universität ach der passenden grafischen Darstellung der Werte eines Merkmals auf der Gesamtheit der Beobachtungen interessieren jetzt geschickte algebraische Charakterisierungen der Verteilung solcher Werte. Ziel ist es, die Verteilung durch möglichst wenige Maßzahlen zu beschreiben.. Wo liegt die Mitte der Werte? Repräsentative Charakterisierung einer Verteilung durch eine Zahl: Lagemaß. Wie streuen die Werte um die Mitte? Charakterisierung der Größe der Unsicherheit (= Streuung) der Merkmalswerte: Streuungsmaß Später: Vergleich verschiedener Gesamtheiten miteinander mit Hilfe der Maßzahlen. Jörg Rahnenführer, WRUMS, WS34, TU Dortmund Kapitel - -

2 Statistische Kennzahlen für die Lage technische universität Beispiel: Welcher Schütze schießt besser? Schütze : Lage gut, Streuung schlecht Schütze : Lage schlecht, Streuung gut Jörg Rahnenführer, WRUMS, WS34, TU Dortmund Kapitel - -

3 Statistische Kennzahlen für die Lage technische universität Bisher: geringe Informationsverdichtung durch Verteilungsbeschreibung Jörg Rahnenführer, WRUMS, WS34, TU Dortmund Kapitel - 3 -

4 Statistische Kennzahlen für die Lage technische universität Bisher: geringe Informationsverdichtung durch Verteilungsbeschreibung Jetzt: stärkere Zusammenfassung der Daten auf ihr Zentrum Jörg Rahnenführer, WRUMS, WS34, TU Dortmund Kapitel - 4 -

5 Statistische Kennzahlen für die Lage technische universität Bisher: geringe Informationsverdichtung durch Verteilungsbeschreibung Jetzt: stärkere Zusammenfassung der Daten auf ihr Zentrum Unterschiedliche Definitionen von Zentrum. Allgemein: repräsentative Merkmalsausprägung, von der alle beobachteten Werte möglichst wenig abweichen Jörg Rahnenführer, WRUMS, WS34, TU Dortmund Kapitel - 5 -

6 Statistische Kennzahlen für die Lage technische universität Bisher: geringe Informationsverdichtung durch Verteilungsbeschreibung Jetzt: stärkere Zusammenfassung der Daten auf ihr Zentrum Unterschiedliche Definitionen von Zentrum. Allgemein: repräsentative Merkmalsausprägung, von der alle beobachteten Werte möglichst wenig abweichen Jörg Rahnenführer, WRUMS, WS34, TU Dortmund Kapitel - 6 -

7 Statistische Kennzahlen für die Lage technische universität Bisher: geringe Informationsverdichtung durch Verteilungsbeschreibung Jetzt: stärkere Zusammenfassung der Daten auf ihr Zentrum Unterschiedliche Definitionen von Zentrum. Allgemein: repräsentative Merkmalsausprägung, von der alle beobachteten Werte möglichst wenig abweichen Jörg Rahnenführer, WRUMS, WS34, TU Dortmund Kapitel - 7 -

8 Statistische Kennzahlen für die Lage technische universität Bisher: geringe Informationsverdichtung durch Verteilungsbeschreibung Jetzt: stärkere Zusammenfassung der Daten auf ihr Zentrum Unterschiedliche Definitionen von Zentrum. Allgemein: repräsentative Merkmalsausprägung, von der alle beobachteten Werte möglichst wenig abweichen Jörg Rahnenführer, WRUMS, WS34, TU Dortmund Kapitel - 8 -

9 Statistische Kennzahlen für die Lage technische universität Bisher: geringe Informationsverdichtung durch Verteilungsbeschreibung Jetzt: stärkere Zusammenfassung der Daten auf ihr Zentrum Unterschiedliche Definitionen von Zentrum. Allgemein: repräsentative Merkmalsausprägung, von der alle beobachteten Werte möglichst wenig abweichen Jörg Rahnenführer, WRUMS, WS34, TU Dortmund Kapitel - 9 -

10 Statistische Kennzahlen für die Lage technische universität Charakterisierung der Merkmalswerte auf einer Gesamtheit durch eine einzige Zahl: Lagemaße Lagemaß = Mitte der Merkmalswerte Auswahl des geeigneten Lagemaßes hängt vom Skalenniveau ab Wichtigste Beispiele: Arithmetisches Mittel: Klassischer Mittelwert Regiert am empfindlichsten auf Ausreißer, d.h. für die Verteilung ungewöhnlich große oder kleine Werte Median: Zentralwert, mittlerer Wert in der geordneten Stichprobe Liegt nicht unbedingt in der Mitte der Merkmalswerte, ist aber dennoch oft ein guter Repräsentant Ist nicht unbedingt eindeutig Modalwert: Häufigster Wert in der Stichprobe Ist nicht unbedingt eindeutig Bei stetigen Merkmalen meist erst nach Klassierung geeignet Jörg Rahnenführer, WRUMS, WS34, TU Dortmund Kapitel - 0 -

11 Statistische Kennzahlen für die Lage technische universität Jörg Rahnenführer, WRUMS, WS34, TU Dortmund Kapitel - -

12 Statistische Kennzahlen für die Lage technische universität ~ p-quantil Q p = x p Verallgemeinerung des Medians (50%-Wert) auf beliebige Prozentzahlen (00p%-Werte) ützliches Mittel zur Beschreibung einer Rangliste x () x () x (n) Jörg Rahnenführer, WRUMS, WS34, TU Dortmund Kapitel - -

13 Statistische Kennzahlen für die Lage technische universität Jörg Rahnenführer, WRUMS, WS34, TU Dortmund Kapitel - 3 -

14 Statistische Kennzahlen für die Lage technische universität ominale Daten Gesucht: x *, für das Abweichung zwischen x * und x,,x minimal ist Mit nominellen Ausprägungen kann keine sinnvolle Abweichung berechnet werden Dummykodierung führt auf den Modalwert x(j * ) i x i i x i d i () d i () d i (3) A C A 0 0 C 0 0 B B 0 0 Σ 3 Jörg Rahnenführer, WRUMS, WS34, TU Dortmund Kapitel - 4 -

15 Statistische Kennzahlen für die Lage technische universität ominale Daten Modalwert Beispiel Bearbeitungen von Softwareaufgaben Die Modalwerte lauten x (j * ) = Oliver x (j * ) = Export x 3 (j * ) =. Ausprägung Aufgabe Absolute Häufigkeit Relative Häufigkeit Abfrage 0.7 Export Verknüpfung Ausprägung Bearbeiter(in) Absolute Häufigkeit Relative Häufigkeit Kai 0.7 Miriam Oliver Tina Ausprägung Version Absolute Häufigkeit Relative Häufigkeit Jörg Rahnenführer, WRUMS, WS34, TU Dortmund Kapitel - 5 -

16 Statistische Kennzahlen für die Lage technische universität Ordinale Daten x,...,x xi W X,i,..., WX {x(j) j,..., J} {x(),..., x(j)} x() x() x(j) i x i x(3) x() k X (k) Urliste x,...,x Geordnete Liste x x... x mit () () () (k) * ik min[argmin *(x * i {,...,}\{i i i,...,i k-})], k,..., x x i k x() 3 x() Geordnete Liste x() 3 x() x (k) wird k-ter Rangwert genannt, erster und letzter Rangwert x () und x () heißen Minimum und Maximum. 4 x() 4 x(3) 5 x(3) 5 x(3) Jörg Rahnenführer, WRUMS, WS34, TU Dortmund Kapitel - 6 -

17 Statistische Kennzahlen für die Lage technische universität Ordinale Daten x,...,x xi W X,i,..., WX {x(j) j,..., J} {x(),..., x(j)} x() x() x(j) i x i R(x i ) x(3) 4.5 k X (k) x() x (k) wird k-ter Rangwert genannt, erster und letzter Rangwert x () und x () heißen Minimum und Maximum. R(x ) #K k * mit K {k x i * * * * k K * * (k ) x i } x() 3 3 x().5 4 x().5 Ränge x() 3 x() 4 x(3) R(x i ) ist der Rang von x i. Gesucht: x (k*), für das Abweichung zwischen x (k*) und x,,x minimal ist. 5 x(3) x(3) Jörg Rahnenführer, WRUMS, WS34, TU Dortmund Kapitel - 7 -

18 Statistische Kennzahlen für die Lage technische universität Ordinale Daten Beispiel Bearbeitungen von Softwareaufgaben i Version i.. 3. Geordnete Liste k Version (k).. 3. Ränge i Version i R(Version i ) 3 3 s s s4 s s0 s Jörg Rahnenführer, WRUMS, WS34, TU Dortmund Kapitel - 8 -

19 Statistische Kennzahlen für die Lage technische universität Quantitative Daten x,...,x xi W X,i,..., WX {x(j) j,..., J} {x(),..., x(j)} bzw. W (-, ) X Der Median minimiert die Summe der absoluten Abweichungen Δ a (x) i x i x Der Mittelwert minimiert die Summe der quadratischen Abweichungen. Δ(x) x i x i Jörg Rahnenführer, WRUMS, WS34, TU Dortmund Kapitel - 9 -

20 Statistische Kennzahlen für die Lage technische universität Quantitative Daten Δ(x) Generell gilt: x i x istminimalfürx x Beweis x: i i i i i Δ(x) (x x) [(x x) (x x)] (xi x) (x x) (xi x) (x x) i i i Δ(x) (x x) Δ(x) 0 0 (x x) i x i * (x x) x x x x x x i i l i l i l i i l i i l i l Jörg Rahnenführer, WRUMS, WS34, TU Dortmund Kapitel - 0 -

21 Statistische Kennzahlen für die Lage technische universität Zusammenfassung: Welche Maßzahlen sind bei welchem Skalenniveau geeignet? Skalennivau Lagemaß ominal Ordinal Quantitativ Modus Informationsverlust ur für klassierte Daten Median Arithmetisches Mittel ur für J = Geringe Aussagekraft für kleine J + Robust Informationsverlust Hohe Streubreite Ausreißeranfällig + Informationsnutzung + Geringe Streubreite Jörg Rahnenführer, WRUMS, WS34, TU Dortmund Kapitel - -

22 Bisher: Beschreibung von Häufigkeitsverteilung und Lage Jörg Rahnenführer, WRUMS, WS34, TU Dortmund Kapitel - -

23 Bisher: Beschreibung von Häufigkeitsverteilung und Lage Jetzt: Beschreibung der mittleren Variation um die Lage Allgemein: Streuung desto höher, je schlechter konkrete Werte sich vorhersagen lassen. Jörg Rahnenführer, WRUMS, WS34, TU Dortmund Kapitel - 3 -

24 Bisher: Beschreibung von Häufigkeitsverteilung und Lage Jetzt: Beschreibung der mittleren Variation um die Lage Jörg Rahnenführer, WRUMS, WS34, TU Dortmund Kapitel - 4 -

25 Jörg Rahnenführer, WRUMS, WS34, TU Dortmund Kapitel - 5 -

26 Jörg Rahnenführer, WRUMS, WS34, TU Dortmund Kapitel - 6 -

27 Jörg Rahnenführer, WRUMS, WS34, TU Dortmund Kapitel - 7 -

28 ominale Daten x,...,x xi W X,i,..., W {x(j) j,..., J} {x(),..., x(j)} X i x i i x i d i () d i () d i (3) A C Rechnen nur sinnvoll mit Dummyvariablen bzw. Häufigkeiten. A 0 0 C 0 0 B B 0 0 Σ 3 Jörg Rahnenführer, WRUMS, WS34, TU Dortmund Kapitel - 8 -

29 ominale Daten Allgemein: Streuung desto höher, je schlechter konkrete Werte sich vorhersagen lassen. ominale Merkmalsausprägungen lassen sich um so besser vorhersagen, desto häufiger eine bestimmte Kategorie vorkommt. Geringste Streuung, falls es ein j gibt mit f j =. Höchste Streuung, falls f j = /J, j=,,j. Jörg Rahnenführer, WRUMS, WS34, TU Dortmund Kapitel - 9 -

30 ominale Daten Geringste Streuung, falls es ein j gibt mit f j =. Höchste Streuung, falls f j = /J, j=,,j. Simpson s D D Beispiel i J x i A B 3 A 4 C j f j 4 D 6 6 D 5 8 D entspricht dem Anteil von Paaren mit unterschiedlichen Merkmalsausprägungen an allen aus der Urliste bildbaren Beobachtungspaaren: 4 #{(i,k) {,...,} {,...,} #{(,), (,4), (,), (,3), (,4), (3,), (3,4), (4,), (4,), (4,3)} x i x k } Jörg Rahnenführer, WRUMS, WS34, TU Dortmund Kapitel

31 ominale Daten Geringste Streuung, falls es ein j gibt mit f j =. Höchste Streuung, falls f j = /J, j=,,j. Beispiel J= Simpson s D D D f J j j 0 D - D 0 für max[(f,...,f J)] J D - für f... fj J J f = f Jörg Rahnenführer, WRUMS, WS34, TU Dortmund Kapitel - 3 -

32 ominale Daten Geringste Streuung, falls es ein j gibt mit f j =. Höchste Streuung, falls f j = /J, j=,,j. Beispiel J= Simpson s D z (ormierte Version)) D z J( f ) J j J j D z f = f 0 D D 0 für max[(f,...,f )] z z J D für f... f z J J Jörg Rahnenführer, WRUMS, WS34, TU Dortmund Kapitel - 3 -

33 ominale Daten Informationstheorie: Ein Ereignis liefert desto mehr Information, je geringer seine Eintrittswahrscheinlichkeit ist. Kodierung der Elementarereignisse in Bits, Beispiel Kaffeebestellung:. Bit: 0 = Tasse = Kännchen. Bit: 0 = Schwarz = mit Milch 3. Bit: 0 = Süßstoff = Zucker 8 Mögliche Bestellungen: 000, 00, 00, 0, 00, 0, 0, Beträgt die Wahrscheinlichkeit einer Teilmenge dieser Bestellungen p = /8, wird genau eine Bestellung ausgewählt und man erhält Information über alle 3 = log (/8) Bits, falls die Teilmenge ausgewählt wird. Wird dagegen die Menge möglicher Bestellungen auf 50%, z.b. alle Bestellungen mit Kännchen eingegrenzt, also p = /, so erhält man nur Information über = log (/) Bit. Jörg Rahnenführer, WRUMS, WS34, TU Dortmund Kapitel

34 ominale Daten Die Information einer Merkmalsausprägung x(j) in Bits kann also allgemein definiert werden durch log (f j ). Der Informationsgehalt des gesamten Merkmals x ergibt sich durch die Entropie genannte erwartete Information H(x) von x: H(x) f j log f Beispiel Kaffeebestellung: Sei x F die Antwort auf eine bestimmte Frage F J j j F = Möchten Sie Ihren Kaffee mit Milch und Zucker? x F (0) = ein, x F () = Ja, f = 6/8, f = /8, H(x F ) = (6/8) log (6/8) (/8) log (/8) = 0.83 Jörg Rahnenführer, WRUMS, WS34, TU Dortmund Kapitel

35 ominale Daten Entropie von x: H(x) J f j log f j j Beispiel Kaffeebestellung F = Möchten Sie Ihren Kaffee mit Milch und Zucker? x F (0) = ein, x F () = Ja, f = 6/8, f = /8, H(x F ) = F = Möchten Sie Ihren Kaffee in der Tasse? x F (0) = ein, x F () = Ja, f = 4/8, f = 4/8, H(x F ) = (4/8) log (4/8) (4/8) log (4/8) = Jörg Rahnenführer, WRUMS, WS34, TU Dortmund Kapitel

36 Entropie gibt also die Information an, die man im Mittel durch Kenntnis der tatsächlichen Ausprägung erhält, wenn man vorher nur die Verteilung kannte. Ist diese hoch, konnte man den Wert vorher schlecht vorhersagen => hohe Streuung. Ist der Informationszugewinn gering, konnte man vorher schon gut prognostizieren. Beispiel Wer wird Millionär Kandidat ist sicher = geringe Streuung, keine weitere Information durch Joker Kandidat ist unsicher = hohe Streuung, erhofft Informationsgewinn durch Publikumsjoker Ist hier die Streuung hoch, weiterer Informationsgewinn durch Einzelbefragungsjoker Jörg Rahnenführer, WRUMS, WS34, TU Dortmund Kapitel

37 ominale Daten Entropie von x: H(x) f j log f Die Entropie ist ein sinnvolles Maß für die Streuung, denn sie erfüllt die Forderungen: Geringste Streuung, falls es ein j gibt mit f j =. Höchste Streuung, falls f j = /J, j=,,j. J j j Beispiel J= 0 H(x) log (J) lim[h(x)] 0 für max[(f,...,f )] J H(x) log (J) für f... fj J H(x) f = f Jörg Rahnenführer, WRUMS, WS34, TU Dortmund Kapitel

38 ominale Daten ormierte Entropie von x: H n(x) log f J j fj j log J Die Entropie ist ein sinnvolles Maß für die Streuung, denn sie erfüllt die Forderungen: Geringste Streuung, falls es ein j gibt mit f j =. Höchste Streuung, falls f j = /J, j=,,j. Beispiel J= 0 H (x) lim[h(x)] 0 für max[(f,...,f )] n J H(x) für f... fj J H n (x) D z f = f Jörg Rahnenführer, WRUMS, WS34, TU Dortmund Kapitel

39 ominale Daten: Beispiel Bearbeitungen von Softwareaufgaben Merkmal D z H n (x) Bearbeiter(in) 4/3 ( ) = Aufgabe 3/ ( ) = Version 3/ ( ) = [ 0.7 log (0.7) 0.5 log (0.5) 0.33 log (0.33) 0.5 log (0.5)] /log (4) = [ 0.7 log (0.7) 0.5 log (0.5) 0.33 log (0.33) ]/log (3) = [ 0.5 log (0.5) 0.5 log (0.5) 0.5 log (0.5) ]/log (3) = Bearbeiter(in) Absolute Häufigkeit Relative Häufigkeit Kai 0.7 Miriam Oliver Tina Ausprägung Aufgabe Absolute Häufigkeit Relative Häufigkeit Abfrage 0.7 Export Verknüpfung Ausprägung Ausprägung Version Absolute Häufigkeit Relative Häufigkeit Jörg Rahnenführer, WRUMS, WS34, TU Dortmund Kapitel

40 Ordinale Daten x,...,x xi W X,i,..., WX {x(j) j,..., J} {x(),..., x(j)} x() x() x(j) i x i x(3) x() 3 x() Geordnete Liste k X (k) x() x() 3 x() Simpson s D und H(x) sind anwendbar, allerdings wird Information der Kategorienordnung nicht genutzt. 4 x() 5 x(3) 4 x(3) 5 x(3) Jörg Rahnenführer, WRUMS, WS34, TU Dortmund Kapitel

41 Ordinale Daten Allgemein: Streuung desto höher, je schlechter konkrete Werte sich vorhersagen lassen. Werte lassen sich umso besser vorhersagen, je stärker sie sich um den Median verdichten. Geringste Streuung für (x~ 0.5 ) = Höchste Streuung für (x~ 0 ) = (x ~ ) = / icht mehr höchste Streuung bei ausgeglichener Belegung, da die Kategorien unterschiedlich weit von der Mitte entfernt sind. Höchste Streuung bei maximaler Entfernung zur Mitte, also bei gleichmäßiger Konzentration an Minimum und Maximum. Jörg Rahnenführer, WRUMS, WS34, TU Dortmund Kapitel - 4 -

42 Ordinale Daten Geringste Streuung für (x 0.5 ) = Höchste Streuung für (x 0 ) = (x ) = / ~ ~ ~ Dispersionsindex nach Leti D L J j F [x(j)] F [x(j)] F (x) 0 x() x() x(3) x(4) x(5) Jörg Rahnenführer, WRUMS, WS34, TU Dortmund Kapitel - 4 -

43 Ordinale Daten Geringste Streuung für (x 0.5 ) = Höchste Streuung für (x 0 ) = (x ) = / ~ ~ ~ D L Beispiel J= Dispersionsindex nach Leti D L J j F [x(j)] F [x(j)] f = f 0 DL J- 4 F (x) 0 x() x() x(3) x(4) x(5) Jörg Rahnenführer, WRUMS, WS34, TU Dortmund Kapitel

44 Ordinale Daten Geringste Streuung für (x 0.5 ) = Höchste Streuung für (x 0 ) = (x ) = / ormierter Dispersionsindex nach Leti D Lz 4 J J j F [x(j)] ~ ~ ~ F [x(j)] Für J= gilt D z = D Lz Bewei s 4 DLz j (- f 4 (f (- f )) F [x(j)]( F [x(j)]) (f - f ) 0 D Lz (- f (-[f - f (- ) - f ]) ) j - f j ) D z Jörg Rahnenführer, WRUMS, WS34, TU Dortmund Kapitel

45 Quantitative Daten x,...,x xi W X,i,..., WX {x(j) j,..., J} {x(),..., x(j)} bzw. W (-, ) X Allgemein: Streuung desto höher, je schlechter konkrete Werte sich vorhersagen lassen. Werte lassen sich umso besser vorhersagen, je stärker sie sich um das jeweilige Lagemaß verdichten. Jörg Rahnenführer, WRUMS, WS34, TU Dortmund Kapitel

46 Quantitative Daten Werte lassen sich umso besser vorhersagen, je stärker sie sich um das jeweilige Lagemaß verdichten. Lagemaß: Arithmetisches Mittel Streuungsmaß: Varianz (mittlere quadratische Abweichung) s x (xn x) n bzw.d x (xn x) n Standardabweichung s s x (xn x) n Jörg Rahnenführer, WRUMS, WS34, TU Dortmund Kapitel

47 Quantitative Daten Von Streuungsparametern abgeleitete Größen für verhältnisskalierte Merkmale Quartilskoeffizient Variationskoeffizient Q ~ x (x ~ ~ x ~ x ~ x ) (x ~ ~ x ~ x )/ ~ x Qkoeff ~ x V x sx x Jörg Rahnenführer, WRUMS, WS34, TU Dortmund Kapitel

48 Quantitative Daten: Berechnung der Varianz aus Häufigkeitsverteilung s f [x(j)- f x(k)] f [x(j)-x] J K J x j k j - j k - j i (i) i i () () () (x x) (x x) (x x) Beweis: (x x) (x x) (x() x) (x() x) (x() x) (x() x) (x(j) x) (x(j) x) f mal f mal J f mal f (x() x) f (x() x)... f (x(j) x) f (x(j) x) J J j j c Jörg Rahnenführer, WRUMS, WS34, TU Dortmund Kapitel

49 Jörg Rahnenführer, WRUMS, WS34, TU Dortmund Kapitel technische universität n n n n n n y b ax b x a b) (ax b ax y y) (y s Beweis Quantitative Daten: Varianz von Lineartransformationen x y s a s b ax y x n n n n n n n n y s a x) (x - a ax) (ax - b) (ax b ax - y) (y s Bewei s

50 Quantitative Daten: Verschiebungssatz von Steiner Beweis: d (x x) [(x b) (b x)] x n n n n [(xn b) (xn b)(b x) (b x) ] n dx (xn b) (x b) n (xn b) (b x) (xn b) (b x) n n n (xn b) (x b) (x b) (xn b) n n speziell für b=0: (x-b) d x x x Jörg Rahnenführer, WRUMS, WS34, TU Dortmund Kapitel

51 Quantitative Daten: Beispiel Bearbeitungen von Softwareaufgaben s x 4 (0-3.5) (-3.5) (-3.5) (3-3.5) (4-3.5) (5-3.5) (6-3.5) (7-3.5) (8-3.5) 7 V k Anzahl Clicks (k) Q koeff;4 ~ x 4;0.5.5 x Q 4 4 R 4 8 ~ x 4; Jörg Rahnenführer, WRUMS, WS34, TU Dortmund Kapitel - 5 -

52 Quantitative Daten: Beispiel Bearbeitungen von Softwareaufgaben s x 5 ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) 3.4 V x k Bearbeitungszeit (k) Q koeff;5 ~ x 5; ~ x 5; Q 5.65 R Jörg Rahnenführer, WRUMS, WS34, TU Dortmund Kapitel - 5 -

53 Zusammenfassung: Welche Maßzahlen sind bei welchem Skalenniveau geeignet? Skalennivau ominal Ordinal Quantitativ Streuungsmaß Simpson s D/ Entropie Informationsverlust ur für klassierte Daten Leti s D ur für J = ur für klassierte Daten MAD/ Spannweite/ Quartilsdifferenz Varianz/ Standardabweichung Variationskoeffizient ur für J = Geringe Aussagekraft für kleine J + Robust Informationsverlust Hohe Streubreite Ausreißeranfällig + Informationsnutzung + Geringe Streubreite Jörg Rahnenführer, WRUMS, WS34, TU Dortmund Kapitel

Statistik I für Betriebswirte Vorlesung 2

Statistik I für Betriebswirte Vorlesung 2 Statistik I für Betriebswirte Vorlesung 2 PD Dr. Frank Heyde TU Bergakademie Freiberg Institut für Stochastik 16. April 2015 PD Dr. Frank Heyde Statistik I für Betriebswirte Vorlesung 2 1 ii) empirische

Mehr

4. Auswertung eindimensionaler Daten

4. Auswertung eindimensionaler Daten 4. Auswertung eindimensionaler Daten Ziel dieses Kapitels: Präsentation von Methoden zur statistischen Auswertung eines einzelnen Merkmals 64 Bezeichnungen (Wiederholung): Merkmalsträger: e 1,..., e n

Mehr

1,11 1,12 1,13 1,14 1,15 1,16 1,17 1,17 1,17 1,18

1,11 1,12 1,13 1,14 1,15 1,16 1,17 1,17 1,17 1,18 3. Deskriptive Statistik Ziel der deskriptiven (beschreibenden) Statistik (explorativen Datenanalyse) ist die übersichtliche Darstellung der wesentlichen in den erhobenen Daten enthaltene Informationen

Mehr

2. Deskriptive Statistik 2.1. Häufigkeitstabellen, Histogramme, empirische Verteilungsfunktionen

2. Deskriptive Statistik 2.1. Häufigkeitstabellen, Histogramme, empirische Verteilungsfunktionen 4. Datenanalyse und Modellbildung Deskriptive Statistik 2-1 2. Deskriptive Statistik 2.1. Häufigkeitstabellen, Histogramme, empirische Verteilungsfunktionen Für die Auswertung einer Messreihe, die in Form

Mehr

Deskriptive Statistik

Deskriptive Statistik Deskriptive Statistik In der beschreibenden Statistik werden Methoden behandelt, mit deren Hilfe man Daten übersichtlich darstellen und kennzeichnen kann. Die Urliste (=Daten in der Reihenfolge ihrer Erhebung)

Mehr

Willkommen zur Vorlesung Statistik

Willkommen zur Vorlesung Statistik Willkommen zur Vorlesung Statistik Thema dieser Vorlesung: Maßzahlen für zentrale Tendenz, Streuung und andere Eigenschaften von Verteilungen Prof. Dr. Wolfgang Ludwig-Mayerhofer Universität Siegen Philosophische

Mehr

Auswertung und Darstellung wissenschaftlicher Daten (1)

Auswertung und Darstellung wissenschaftlicher Daten (1) Auswertung und Darstellung wissenschaftlicher Daten () Mag. Dr. Andrea Payrhuber Zwei Schritte der Auswertung. Deskriptive Darstellung aller Daten 2. analytische Darstellung (Gruppenvergleiche) SPSS-Andrea

Mehr

Expertenrunde Gruppe 1: Wiederholungsgruppe EXCEL (Datenerfassung, Darstellungsformen, Verwertung)

Expertenrunde Gruppe 1: Wiederholungsgruppe EXCEL (Datenerfassung, Darstellungsformen, Verwertung) Epertenrunde Gruppe 1: Wiederholungsgruppe EXCEL (Datenerfassung, Darstellungsformen, Verwertung) Im Folgenden wird mit Hilfe des Programms EXEL, Version 007, der Firma Microsoft gearbeitet. Die meisten

Mehr

90-minütige Klausur Statistik für Studierende der Kommunikationswissenschaft

90-minütige Klausur Statistik für Studierende der Kommunikationswissenschaft Prof. Dr. Helmut Küchenhoff SS08 90-minütige Klausur Statistik für Studierende der Kommunikationswissenschaft am 22.7.2008 Anmerkungen Überprüfen Sie bitte sofort, ob Ihre Angabe vollständig ist. Sie sollte

Mehr

2. Eindimensionale (univariate) Datenanalyse

2. Eindimensionale (univariate) Datenanalyse 2. Eindimensionale (univariate) Datenanalyse Dr. Antje Kiesel Institut für Angewandte Mathematik WS 2011/2012 Kennzahlen, Statistiken In der Regel interessieren uns nicht so sehr die beobachteten Einzeldaten

Mehr

Statistik und Wahrscheinlichkeitsrechnung

Statistik und Wahrscheinlichkeitsrechnung Statistik und Wahrscheinlichkeitsrechnung Übung 2 28.02.2008 1 Inhalt der heutigen Übung Beschreibende Statistik Gemeinsames Lösen der Übungsaufgaben 2.1: Häufigkeitsverteilung 2.2: Tukey Boxplot 25:Korrelation

Mehr

Medizinische Biometrie (L5)

Medizinische Biometrie (L5) Medizinische Biometrie (L5) Vorlesung II Daten Deskription Prof. Dr. Ulrich Mansmann Institut für Medizinische Informationsverarbeitung, Biometrie und Epidemiologie mansmann@ibe.med.uni-muenchen.de IBE,

Mehr

1 Verteilungen und ihre Darstellung

1 Verteilungen und ihre Darstellung GKC Statistische Grundlagen für die Korpuslinguistik Kapitel 2: Univariate Deskription von Daten 8.11.2004 Univariate (= eindimensionale) Daten bestehen aus Beobachtungen eines einzelnen Merkmals. 1 Verteilungen

Mehr

Methoden der empirischen Sozialforschung I

Methoden der empirischen Sozialforschung I Methoden der empirischen Sozialforschung I Annelies Blom, PhD TU Kaiserslautern Wintersemester 2011/12 Übersicht Quantitative Datenauswertung: deskriptive und induktive Statistik Wiederholung: Die wichtigsten

Mehr

Veranstaltung Statistik (BWL) an der FH Frankfurt/Main im WS 2004/05 (Dr. Faik) Klausur 09.02.2005 - GRUPPE A - BEARBEITER/IN (NAME, VORNAME):

Veranstaltung Statistik (BWL) an der FH Frankfurt/Main im WS 2004/05 (Dr. Faik) Klausur 09.02.2005 - GRUPPE A - BEARBEITER/IN (NAME, VORNAME): Veranstaltung Statistik (BWL) an der FH Frankfurt/Main im WS 2004/05 (Dr. Faik) Klausur 09.02.2005 - GRUPPE A - BEARBEITER/IN (NAME, VORNAME): MATRIKELNUMMER: Alte Prüfungsordnung/Neue Prüfungsordnung

Mehr

Zusammenhänge zwischen metrischen Merkmalen

Zusammenhänge zwischen metrischen Merkmalen Zusammenhänge zwischen metrischen Merkmalen Darstellung des Zusammenhangs, Korrelation und Regression Daten liegen zu zwei metrischen Merkmalen vor: Datenpaare (x i, y i ), i = 1,..., n Beispiel: x: Anzahl

Mehr

Einführung in die Statistik mir R

Einführung in die Statistik mir R Einführung in die Statistik mir R ww w. syn t egris.de Überblick GESCHÄFTSFÜHRUNG Andreas Baumgart, Business Processes and Service Gunar Hofmann, IT Solutions Sven-Uwe Weller, Design und Development Jens

Mehr

Kapitel 13 Häufigkeitstabellen

Kapitel 13 Häufigkeitstabellen Kapitel 13 Häufigkeitstabellen Die gesammelten und erfaßten Daten erscheinen in der Datendatei zunächst als unübersichtliche Liste von Werten. In dieser Form sind die Daten jedoch wenig aussagekräftig

Mehr

Teil II: Einführung in die Statistik

Teil II: Einführung in die Statistik Teil II: Einführung in die Statistik (50 Punkte) Bitte beantworten Sie ALLE Fragen. Es handelt sich um multiple choice Fragen. Sie müssen die exakte Antwortmöglichkeit angeben, um die volle Punktzahl zu

Mehr

Fachhochschule Düsseldorf Wintersemester 2008/09

Fachhochschule Düsseldorf Wintersemester 2008/09 Fachhochschule Düsseldorf Wintersemester 2008/09 Teilfachprüfung Statistik im Studiengang Wirtschaft Prüfungsdatum: 26.01.2009 Prüfer: Prof. Dr. H. Peters, Diplom-Vw. Lothar Schmeink Prüfungsform: 2-stündige

Mehr

Einführung in die statistische Datenanalyse I

Einführung in die statistische Datenanalyse I Einführung in die statistische Datenanalyse I Inhaltsverzeichnis 1. EINFÜHRUNG IN THEORIEGELEITETES WISSENSCHAFTLICHES ARBEITEN 2 2. KRITIERIEN ZUR AUSWAHL STATISTISCH METHODISCHER VERFAHREN 2 3. UNIVARIATE

Mehr

Eine computergestützte Einführung mit

Eine computergestützte Einführung mit Thomas Cleff Deskriptive Statistik und Explorative Datenanalyse Eine computergestützte Einführung mit Excel, SPSS und STATA 3., überarbeitete und erweiterte Auflage ^ Springer Inhaltsverzeichnis 1 Statistik

Mehr

Analyse klassierter Daten: Vor der Analyse fasst man jeweils mehrere Merkmalsausprägungen in (Merkmalswerte-)Klassen zusammen.

Analyse klassierter Daten: Vor der Analyse fasst man jeweils mehrere Merkmalsausprägungen in (Merkmalswerte-)Klassen zusammen. 4. Analyse univariater Daten: Übersicht Mathematik ist die Wissenschaft der reinen Zahl, Statistik die der empirischen Zahl Von univariaten Daten spricht man, wenn bei der Datenerhebung nur ein Merkmal

Mehr

Lage- und Streuungsmaße

Lage- und Streuungsmaße Sommersemester 2009 Modus Median Arithmetisches Mittel Symmetrie/Schiefe Wölbung/Exzess 4 6 8 10 ALQ Tutorien Begleitend zur Vorlesung, inhaltlich identisch mit der Übung Mögliche Zeiten: Do 10-12, Do

Mehr

Statistik I für Betriebswirte Vorlesung 5

Statistik I für Betriebswirte Vorlesung 5 Statistik I für Betriebswirte Vorlesung 5 PD Dr. Frank Heyde TU Bergakademie Freiberg Institut für Stochastik 07. Mai 2015 PD Dr. Frank Heyde Statistik I für Betriebswirte Vorlesung 5 1 Klassische Wahrscheinlichkeitsdefinition

Mehr

Vorlesung Gesamtbanksteuerung Mathematische Grundlagen I Dr. Klaus Lukas Carsten Neundorf

Vorlesung Gesamtbanksteuerung Mathematische Grundlagen I Dr. Klaus Lukas Carsten Neundorf Vorlesung Gesamtbanksteuerung Mathematische Grundlagen I Dr. Klaus Lukas Carsten Neundorf 1 Agenda Zinsrechnung Zinseszins Zinskurve Forward-Rates Zeitwert des Geldes Zinsgeschäfte und der zugehörige Cashflow

Mehr

a) Zeichnen Sie in das nebenstehende Streudiagramm mit Lineal eine Regressionsgerade ein, die Sie für passend halten.

a) Zeichnen Sie in das nebenstehende Streudiagramm mit Lineal eine Regressionsgerade ein, die Sie für passend halten. Statistik für Kommunikationswissenschaftler Wintersemester 2009/200 Vorlesung Prof. Dr. Helmut Küchenhoff Übung Cornelia Oberhauser, Monia Mahling, Juliane Manitz Thema 4 Homepage zur Veranstaltung: http://www.statistik.lmu.de/~helmut/kw09.html

Mehr

4. Erstellen von Klassen

4. Erstellen von Klassen Statistik mit Tabellenkalkulation 4. Erstellen von Klassen Mit einem einfachen Befehl lässt sich eine Liste von Zahlen auf die Häufigkeit der einzelnen Werte untersuchen. Verwenden Sie dazu den Befehl

Mehr

Absolute Stetigkeit von Maßen

Absolute Stetigkeit von Maßen Absolute Stetigkeit von Maßen Definition. Seien µ und ν Maße auf (X, Ω). Dann heißt ν absolut stetig bezüglich µ (kurz ν µ ), wenn für alle A Ω mit µ(a) = 0 auch gilt dass ν(a) = 0. Lemma. Sei ν ein endliches

Mehr

Deskriptive Statistik

Deskriptive Statistik Deskriptive Statistik [descriptive statistics] Ziel der deskriptiven (beschreibenden) Statistik einschließlich der explorativen Datenanalyse [exploratory data analysis] ist zunächst die übersichtliche

Mehr

5 Statistik in der Psychologie

5 Statistik in der Psychologie 5 Statistik in der Psychologie Für Anfänger in der Psychologie ist es nicht unbedingt einsichtig, warum man sich überhaupt statistische Kompetenzen in einer Sozialwissenschaft aneignen muss, wo es doch

Mehr

Einfache Statistiken in Excel

Einfache Statistiken in Excel Einfache Statistiken in Excel Dipl.-Volkswirtin Anna Miller Bergische Universität Wuppertal Schumpeter School of Business and Economics Lehrstuhl für Internationale Wirtschaft und Regionalökonomik Raum

Mehr

n 1,n 2,n 3,...,n k in der Stichprobe auftreten. Für die absolute Häufigkeit können wir auch die relative Häufigkeit einsetzen:

n 1,n 2,n 3,...,n k in der Stichprobe auftreten. Für die absolute Häufigkeit können wir auch die relative Häufigkeit einsetzen: 61 6.2 Grudlage der mathematische Statistik 6.2.1 Eiführug i die mathematische Statistik I der mathematische Statistik behadel wir Masseerscheiuge. Wir habe es deshalb im Regelfall mit eier große Zahl

Mehr

Regressionsanalysen. Zusammenhänge von Variablen. Ziel der Regression. ( Idealfall )

Regressionsanalysen. Zusammenhänge von Variablen. Ziel der Regression. ( Idealfall ) Zusammenhänge von Variablen Regressionsanalysen linearer Zusammenhang ( Idealfall ) kein Zusammenhang nichtlinearer monotoner Zusammenhang (i.d.regel berechenbar über Variablentransformationen mittels

Mehr

Prüfung zu Modul 26 (BA Bw) bzw. 10 (BA IB) (Wirtschaftsstatistik)

Prüfung zu Modul 26 (BA Bw) bzw. 10 (BA IB) (Wirtschaftsstatistik) 2 Klausur-Nr = Sitzplatz-Nr Prüfung zu Modul 26 (BA Bw) bzw. 10 (BA IB) (Wirtschaftsstatistik) Klausurteil 1: Beschreibende Statistik Name, Vorname:... verteilung Teil 1: Beschreibende Statistik Aufgaben

Mehr

Grundlagen der Inferenzstatistik: Was Ihnen nicht erspart bleibt!

Grundlagen der Inferenzstatistik: Was Ihnen nicht erspart bleibt! Grundlagen der Inferenzstatistik: Was Ihnen nicht erspart bleibt! 1 Einführung 2 Wahrscheinlichkeiten kurz gefasst 3 Zufallsvariablen und Verteilungen 4 Theoretische Verteilungen (Wahrscheinlichkeitsfunktion)

Mehr

Einführung in die Statistik mit EXCEL und SPSS

Einführung in die Statistik mit EXCEL und SPSS Christine Duller Einführung in die Statistik mit EXCEL und SPSS Ein anwendungsorientiertes Lehr- und Arbeitsbuch Zweite, überarbeitete Auflage Mit 71 Abbildungen und 26 Tabellen Physica-Verlag Ein Unternehmen

Mehr

, dt. $+ f(x) = , - + < x < +, " > 0. " 2# Für die zugehörige Verteilungsfunktion F(x) ergibt sich dann: F(x) =

, dt. $+ f(x) = , - + < x < +,  > 0.  2# Für die zugehörige Verteilungsfunktion F(x) ergibt sich dann: F(x) = 38 6..7.4 Normalverteilung Die Gauß-Verteilung oder Normal-Verteilung ist eine stetige Verteilung, d.h. ihre Zufallsvariablen können beliebige reelle Zahlenwerte annehmen. Wir definieren sie durch die

Mehr

Statistische Verfahren für das Data Mining in einem Industrieprojekt

Statistische Verfahren für das Data Mining in einem Industrieprojekt Statistische Verfahren für das Data Mining in einem Industrieprojekt Thorsten Dickhaus Forschungszentrum Jülich GmbH Zentralinstitut für Angewandte Mathematik Telefon: 02461/61-4193 E-Mail: th.dickhaus@fz-juelich.de

Mehr

Daten und Zufall in der Jahrgangstufe 7

Daten und Zufall in der Jahrgangstufe 7 Daten und Zufall in der Jahrgangstufe 7 1 Erfassen, Auswerten und Interpretieren von Daten unter Verwendung von zusätzlichen Kenngrößen (Stichprobe, Gesamtheit) Aufbauend auf den Erfahrungen aus den vorhergehenden

Mehr

Physica-Lehrbuch. Ein anwendungsorientiertes Lehr- und Arbeitsbuch. von Christine Duller

Physica-Lehrbuch. Ein anwendungsorientiertes Lehr- und Arbeitsbuch. von Christine Duller Physica-Lehrbuch Einführung in die Statistik mit EXCEL und SPSS Ein anwendungsorientiertes Lehr- und Arbeitsbuch von Christine Duller Neuausgabe Einführung in die Statistik mit EXCEL und SPSS Duller schnell

Mehr

Beschreibende Statistik Daten darstellen und charakterisieren

Beschreibende Statistik Daten darstellen und charakterisieren Beschreibende Statistik Daten darstellen und charakterisieren Roland Heynkes 1. April 2006, Aachen Die beschreibende (descriptive) Statistik versucht, große und unübersichtliche, experimentell sowie durch

Mehr

Proteinsequenzen. Raumstruktur GPCR. G-Protein gekoppelte Rezeptoren

Proteinsequenzen. Raumstruktur GPCR. G-Protein gekoppelte Rezeptoren G-Protein gekoppelte Rezeptoren Proteinsequenzen MEEPGAQCAPPPPAGSETWVPQANL SSAPSQNCSAKDYIYQDSISLPWKV LLVMLLALITLATTLSNAFVIATVY RTRKLHTPANYLIASLAVTDLLVSI LVMPISTMYTVTGRWTLGQVVCDFW LSSDITCCTASILHLCVIALDRYWA

Mehr

3.1 Annuitätsfunktionen (Rentenfunktionen)

3.1 Annuitätsfunktionen (Rentenfunktionen) Funktionen 3 Excel verfügt über eine unglaubliche Menge von Funktionen. Sie haben bereits einige Funktionen in diesem Buch kennen gelernt, und es werden noch viele dieser Funktionen angesprochen und deren

Mehr

2 Analyse statistischer Daten zu einem Merkmal Lösungshinweise

2 Analyse statistischer Daten zu einem Merkmal Lösungshinweise 6 2 Analyse statistischer Daten zu einem Merkmal Lösungshinweise 2 Analyse statistischer Daten zu einem Merkmal Lösungshinweise : In der folgenden Tabelle ist eine Teilstichprobe zu den Studierenden in

Mehr

Einseitig gerichtete Relation: Mit zunehmender Höhe über dem Meeresspiegel sinkt im allgemeinen die Lufttemperatur.

Einseitig gerichtete Relation: Mit zunehmender Höhe über dem Meeresspiegel sinkt im allgemeinen die Lufttemperatur. Statistik Grundlagen Charakterisierung von Verteilungen Einführung Wahrscheinlichkeitsrechnung Wahrscheinlichkeitsverteilungen Schätzen und Testen Korrelation Regression Einführung Die Analyse und modellhafte

Mehr

1. Einführung und statistische Grundbegriffe. Grundsätzlich unterscheidet man zwei Bedeutungen des Begriffs Statistik:

1. Einführung und statistische Grundbegriffe. Grundsätzlich unterscheidet man zwei Bedeutungen des Begriffs Statistik: . Einführung und statistische Grundbegriffe Grundsätzlich unterscheidet man zwei Bedeutungen des Begriffs Statistik: Quantitative Information Graphische oder tabellarische Darstellung von Datenmaterial

Mehr

Kontingenzkoeffizient (nach Pearson)

Kontingenzkoeffizient (nach Pearson) Assoziationsmaß für zwei nominale Merkmale misst die Unabhängigkeit zweier Merkmale gibt keine Richtung eines Zusammenhanges an 46 o jl beobachtete Häufigkeiten der Kombination von Merkmalsausprägungen

Mehr

Füllmenge. Füllmenge. Füllmenge. Füllmenge. Mean = 500,0029 Std. Dev. = 3,96016 N = 10.000. 485,00 490,00 495,00 500,00 505,00 510,00 515,00 Füllmenge

Füllmenge. Füllmenge. Füllmenge. Füllmenge. Mean = 500,0029 Std. Dev. = 3,96016 N = 10.000. 485,00 490,00 495,00 500,00 505,00 510,00 515,00 Füllmenge 2.4 Stetige Zufallsvariable Beispiel. Abfüllung von 500 Gramm Packungen einer bestimmten Ware auf einer automatischen Abfüllanlage. Die Zufallsvariable X beschreibe die Füllmenge einer zufällig ausgewählten

Mehr

Korrelation - Regression. Berghold, IMI

Korrelation - Regression. Berghold, IMI Korrelation - Regression Zusammenhang zwischen Variablen Bivariate Datenanalyse - Zusammenhang zwischen 2 stetigen Variablen Korrelation Einfaches lineares Regressionsmodell 1. Schritt: Erstellung eines

Mehr

(VU) Übungen zur Einführung in die statistische Datenanalyse II. Inhalte Statistik I. Inhalte Statistik I Deskriptive Statistik

(VU) Übungen zur Einführung in die statistische Datenanalyse II. Inhalte Statistik I. Inhalte Statistik I Deskriptive Statistik II Übungen zur II Organisatorische Hinweise Keine Anwesenheitspflicht (aber empfehlenswert) Einführung in die statistische Datenanalyse II (VU) Lehrinhalte (.ppt Folien): elearning.univie.ac.at 3 Prüfungstermine:

Mehr

Statistik im Bachelor-Studium der BWL und VWL

Statistik im Bachelor-Studium der BWL und VWL Max C. Wewel Statistik im Bachelor-Studium der BWL und VWL Methoden, Anwendung, Interpretation Mit herausnehmbarer Formelsammlung ein Imprint von Pearson Education München Boston San Francisco Harlow,

Mehr

FAKTORIELLE VERSUCHSPLÄNE. Andreas Handl

FAKTORIELLE VERSUCHSPLÄNE. Andreas Handl FAKTORIELLE VERSUCHSPLÄNE Andreas Handl 1 Inhaltsverzeichnis 1 Versuchsplanung 4 2 Einfaktorielle Varianzanalyse 6 2.1 DieAnnahmen... 6 2.2 Die ANOVA-Tabelle und der F -Test... 6 2.3 Versuche mit zwei

Mehr

9. Schätzen und Testen bei unbekannter Varianz

9. Schätzen und Testen bei unbekannter Varianz 9. Schätzen und Testen bei unbekannter Varianz Dr. Antje Kiesel Institut für Angewandte Mathematik WS 2011/2012 Schätzen und Testen bei unbekannter Varianz Wenn wir die Standardabweichung σ nicht kennen,

Mehr

Ein bisschen Statistik

Ein bisschen Statistik Prof. Dr. Beat Siebenhaar ein bisschen Statistik 1 Ein bisschen Statistik (orientiert an Hüsler/Zimmermann (006) mit Umsetzung auf die linguistische Fragen) 1. Datentypen und Grafik Grafische Darstellungen

Mehr

Box-and-Whisker Plot -0,2 0,8 1,8 2,8 3,8 4,8

Box-and-Whisker Plot -0,2 0,8 1,8 2,8 3,8 4,8 . Aufgabe: Für zwei verschiedene Aktien wurde der relative Kurszuwachs (in % beobachtet. Aus den jeweils 20 Quartaldaten ergaben sich die folgenden Box-Plots. Box-and-Whisker Plot Aktie Aktie 2-0,2 0,8,8

Mehr

2. Lernen von Entscheidungsbäumen

2. Lernen von Entscheidungsbäumen 2. Lernen von Entscheidungsbäumen Entscheidungsbäume 2. Lernen von Entscheidungsbäumen Gegeben sei eine Menge von Objekten, die durch Attribut/Wert- Paare beschrieben sind. Jedes Objekt kann einer Klasse

Mehr

Übung Statistik I Statistik mit Stata SS07-14.05.2007 5. Dokumentation der Datenanalyse, Datentransformationen II und Univariate Statistiken II

Übung Statistik I Statistik mit Stata SS07-14.05.2007 5. Dokumentation der Datenanalyse, Datentransformationen II und Univariate Statistiken II Übung Statistik I Statistik mit Stata SS07-14.05.2007 5. Dokumentation der Datenanalyse, Datentransformationen II und Univariate Statistiken II Andrea Kummerer (M.A.) Oec R. I-53 Sprechstunde: Di. 15-16

Mehr

Vertiefungsrichtung Marktforschung

Vertiefungsrichtung Marktforschung Vertiefungsrichtung Marktforschung Sommersemester 2006 Dipl.-WiInf.(FH) Christian Reinboth Darstellen Explorative Datenanalyse Beschreiben Erkennen Testen Inhalte: Explorative Datenanalyse Wir unterscheiden

Mehr

Optimierung für Wirtschaftsinformatiker: Analytische Optimierung ohne Nebenbedingungen

Optimierung für Wirtschaftsinformatiker: Analytische Optimierung ohne Nebenbedingungen Optimierung für Wirtschaftsinformatiker: Analytische Optimierung ohne Nebenbedingungen Dr. Nico Düvelmeyer Freitag, 1. Juli 2011 1: 1 [1,1] Inhaltsübersicht für heute 1 Einführung und Wiederholung Beispiel

Mehr

Organisation. Was kommt zum Test? Buch Informatik Grundlagen bis inkl. Kapitel 7.4 Wissensfragen und Rechenbeispiele

Organisation. Was kommt zum Test? Buch Informatik Grundlagen bis inkl. Kapitel 7.4 Wissensfragen und Rechenbeispiele Organisation Was kommt zum Test? Buch Informatik Grundlagen bis inkl Kapitel 74 Wissensfragen und Rechenbeispiele 3 Vorträge zur Übung Informationstheorie, Huffman-Codierung und trennzeichenfreie Codierung

Mehr

Datenanalyse und Statistik

Datenanalyse und Statistik Datenanalyse und Statistik p. 1/44 Datenanalyse und Statistik Vorlesung 2 (Graphik I) K.Gerald van den Boogaart http://www.stat.boogaart.de Datenanalyse und Statistik p. 2/44 Daten Schätzung Test Mathe

Mehr

Prüfung zu Modul 26 (BA Bw) bzw. 10 (BA IB) (Wirtschaftsstatistik)

Prüfung zu Modul 26 (BA Bw) bzw. 10 (BA IB) (Wirtschaftsstatistik) 2 3 Klausur-Nr = Sitzplatz-Nr Prüfung zu Modul 26 (BA Bw) bzw. 10 (BA IB) (Wirtschaftsstatistik) Klausurteil 1: Beschreibende Statistik BeStat-1 (7 ) n = 400 Personen wurden gefragt, wie viele Stück eines

Mehr

Übungen zur Ingenieur-Mathematik III WS 2009/10 Blatt 10 21.12.2009

Übungen zur Ingenieur-Mathematik III WS 2009/10 Blatt 10 21.12.2009 Übungen zur Ingenieur-Mathematik III WS 2009/10 Blatt 10 21.12.2009 Aufgabe 35: Thema: Singulärwertzerlegung und assoziierte Unterräume Sei A eine m n Matrix mit Rang r und A = UDV T ihre Singulärwertzerlegung.

Mehr

Elisabeth Raab-Steiner/Michael Benesch. Der Fragebogen. Von der Forschungsidee zur SPSS/PASW-Auswertung. 2., aktualisierte Auflage. facultas.

Elisabeth Raab-Steiner/Michael Benesch. Der Fragebogen. Von der Forschungsidee zur SPSS/PASW-Auswertung. 2., aktualisierte Auflage. facultas. Elisabeth Raab-Steiner/Michael Benesch Der Fragebogen Von der Forschungsidee zur SPSS/PASW-Auswertung 2., aktualisierte Auflage facultas.wuv Inhaltsverzeichnis 1 Elementare Definitionen 11 1.1 Deskriptive

Mehr

Statistik I für Wirtschaftswissenschaftler Klausur am 06.07.2007, 14.00 16.00.

Statistik I für Wirtschaftswissenschaftler Klausur am 06.07.2007, 14.00 16.00. 1 Statistik I für Wirtschaftswissenschaftler Klausur am 06.07.2007, 14.00 16.00. Bitte unbedingt beachten: a) Gewertet werden alle 9 gestellten Aufgaben. b) Lösungswege sind anzugeben. Die Angabe des Endergebnisses

Mehr

Vorlesung: Statistik für Kommunikationswissenschaftler

Vorlesung: Statistik für Kommunikationswissenschaftler Vorlesung: Statistik für Kommunikationswissenschaftler Prof. Dr. Helmut Küchenhoff Institut für Statistik, LMU München WiSe 2009/2010 Übungen zur Veranstaltung Mittwoch: 14.15-15.45 HG DZ007 Cornelia Oberhauser

Mehr

Assoziation & Korrelation

Assoziation & Korrelation Statistik 1 für SoziologInnen Assoziation & Korrelation Univ.Prof. Dr. Marcus Hudec Einleitung Bei Beobachtung von 2 Merkmalen für jeden Merkmalsträger stellt sich die Frage, ob es systematische Zusammenhänge

Mehr

Kapitel 3. Zufallsvariable. Wahrscheinlichkeitsfunktion, Dichte und Verteilungsfunktion. Erwartungswert, Varianz und Standardabweichung

Kapitel 3. Zufallsvariable. Wahrscheinlichkeitsfunktion, Dichte und Verteilungsfunktion. Erwartungswert, Varianz und Standardabweichung Kapitel 3 Zufallsvariable Josef Leydold c 2006 Mathematische Methoden III Zufallsvariable 1 / 43 Lernziele Diskrete und stetige Zufallsvariable Wahrscheinlichkeitsfunktion, Dichte und Verteilungsfunktion

Mehr

Statistik I für Wirtschaftswissenschaftler Klausur am 01.07.2005, 14.00 16.00.

Statistik I für Wirtschaftswissenschaftler Klausur am 01.07.2005, 14.00 16.00. 1 Statistik I für Wirtschaftswissenschaftler Klausur am 01.07.2005, 14.00 16.00. Bitte unbedingt beachten: a) Gewertet werden alle 9 gestellten Aufgaben. b) Lösungswege sind anzugeben. Die Angabe des Endergebnisses

Mehr

Prof. Dr. P. von der Lippe Statistik I NK SS 2002 Seite 1

Prof. Dr. P. von der Lippe Statistik I NK SS 2002 Seite 1 Prof. Dr. P. von der Lippe Statistik I NK SS 2002 Seite 1 Aufgabe 1 a) BWL-Student S hat von seinem Lieblingsonkel 10.000 geschenkt bekommen mit der Auflage damit etwas Vernünftiges zu machen. Nachdem

Mehr

Entscheidungsbaumverfahren

Entscheidungsbaumverfahren Entscheidungsbaumverfahren Allgemeine Beschreibung Der Entscheidungsbaum ist die Darstellung einer Entscheidungsregel, anhand derer Objekte in Klassen eingeteilt werden. Die Klassifizierung erfolgt durch

Mehr

Vorlesung Maschinelles Lernen

Vorlesung Maschinelles Lernen Vorlesung Maschinelles Lernen Additive Modelle Katharina Morik Informatik LS 8 Technische Universität Dortmund 7.1.2014 1 von 34 Gliederung 1 Merkmalsauswahl Gütemaße und Fehlerabschätzung 2 von 34 Ausgangspunkt:

Mehr

Schätzung des Lifetime Values von Spendern mit Hilfe der Überlebensanalyse

Schätzung des Lifetime Values von Spendern mit Hilfe der Überlebensanalyse Schätzung Lifetime Values von Spenn mit Hilfe Überlebensanalyse Einführung in das Verfahren am Beispiel Einzugsgenehmigung Überlebensanalysen o Ereignisdatenanalysen behandeln das Problem, mit welcher

Mehr

Modul 14 (BA Bw) bzw. Modul 3 (BA IB) bzw. Modul 4 (BA IBM): Wirtschaftsstatistik Teil 1: Beschreibende Statistik

Modul 14 (BA Bw) bzw. Modul 3 (BA IB) bzw. Modul 4 (BA IBM): Wirtschaftsstatistik Teil 1: Beschreibende Statistik Fachhochschule Dortmund Wintersemester 12/13 Fachbereich Wirtschaft Prof. Dr. Laufner Studiengänge BA Betriebswirtschaft und BA International Business (Management) Übungsaufgaben zur Woche 7. + 8. 1. 13

Mehr

Der Internetdienst für Ihre Online-Umfragen. Leitfaden statistische Auswertung

Der Internetdienst für Ihre Online-Umfragen. Leitfaden statistische Auswertung Der Internetdienst für Ihre Online-Umfragen Leitfaden statistische Auswertung Weitere in dieser Reihe bei 2ask erschienene Leitfäden Allgemeiner Leitfaden zur Fragebogenerstellung Sie möchten einen Fragebogen

Mehr

Franz Kronthaler. Statistik angewandt. Datenanalyse ist (k)eine Kunst. Excel Edition. ^ Springer Spektrum

Franz Kronthaler. Statistik angewandt. Datenanalyse ist (k)eine Kunst. Excel Edition. ^ Springer Spektrum Franz Kronthaler Statistik angewandt Datenanalyse ist (k)eine Kunst Excel Edition ^ Springer Spektrum Inhaltsverzeichnis Teil I Basiswissen und Werkzeuge, um Statistik anzuwenden 1 Statistik ist Spaß 3

Mehr

Rekursionen. Georg Anegg 25. November 2009. Methoden und Techniken an Beispielen erklärt

Rekursionen. Georg Anegg 25. November 2009. Methoden und Techniken an Beispielen erklärt Methoden und Techniken an Beispielen erklärt Georg Anegg 5. November 009 Beispiel. Die Folge {a n } sei wie folgt definiert (a, d, q R, q ): a 0 a, a n+ a n q + d (n 0) Man bestimme eine explizite Darstellung

Mehr

h i Deskriptive Statistik 1-dimensionale Daten Daten und Häufigkeiten Seite 1 Nominal Ordinal Metrisch (Kardinal) Metrisch - klassiert

h i Deskriptive Statistik 1-dimensionale Daten Daten und Häufigkeiten Seite 1 Nominal Ordinal Metrisch (Kardinal) Metrisch - klassiert Deskriptive Statistik dimesioale Date Date ud Häufigkeite Seite Nomial Ordial Metrisch (Kardial Metrisch klassiert Beschreibug: Date habe keie atürliche Reihefolge. Bsp: Farbe, Religio, Geschlecht, Natioalität...

Mehr

Kapitel 3: Etwas Informationstheorie

Kapitel 3: Etwas Informationstheorie Stefan Lucks 3: Informationstheorie 28 orlesung Kryptographie (SS06) Kapitel 3: Etwas Informationstheorie Komplexitätstheoretische Sicherheit: Der schnellste Algorithmus, K zu knacken erfordert mindestens

Mehr

Stichprobenauslegung. für stetige und binäre Datentypen

Stichprobenauslegung. für stetige und binäre Datentypen Stichprobenauslegung für stetige und binäre Datentypen Roadmap zu Stichproben Hypothese über das interessierende Merkmal aufstellen Stichprobe entnehmen Beobachtete Messwerte abbilden Schluss von der Beobachtung

Mehr

3 Sicherheit von Kryptosystemen

3 Sicherheit von Kryptosystemen 3 Sicherheit von Kryptosystemen 43 3 Sicherheit von Kryptosystemen 3.1 Informationstheoretische Sicherheit Claude E. Shannon untersuchte die Sicherheit kryptographischer Systeme auf informationstheoretischer

Mehr

Übung 13: Quellencodierung

Übung 13: Quellencodierung ZHAW, NTM, FS2008, Rumc, /5 Übung 3: Quellencodierung Aufgabe : Huffmann-Algorithmus. Betrachten Sie die folgende ternäre, gedächtnislose Quelle mit dem Symbolalphabet A = {A,B,C} und den Symbol-Wahrscheinlichkeiten

Mehr

Willkommen zur Vorlesung Statistik

Willkommen zur Vorlesung Statistik Willkommen zur Vorlesung Statistik Thema dieser Vorlesung: Varianzanalyse Prof. Dr. Wolfgang Ludwig-Mayerhofer Universität Siegen Philosophische Fakultät, Seminar für Sozialwissenschaften Prof. Dr. Wolfgang

Mehr

1.4 Installation eines Qualitätsmanagementsystems

1.4 Installation eines Qualitätsmanagementsystems Ko n t r o l l f r a g e n : 1 Geben Sie vier Argumente an, die für die Installation eines Qualitätsmanagementsystems sprechen. 2 Erläutern Sie den Zusammenhang zwischen einem funktionierenden Qualitätsmanagementsystem

Mehr

Standardab er des. Testwert = 145.5 95% Konfidenzintervall. T df Sig. (2-seitig) Differenz Untere Obere -2.011 698.045-5.82-11.50 -.14.

Standardab er des. Testwert = 145.5 95% Konfidenzintervall. T df Sig. (2-seitig) Differenz Untere Obere -2.011 698.045-5.82-11.50 -.14. Aufgabe : einfacher T-Test Statistik bei einer Stichprobe Standardfehl Standardab er des Mittelwert weichung Mittelwertes 699 39.68 76.59 2.894 Test bei einer Sichprobe Testwert = 45.5 95% Konfidenzintervall

Mehr

Statistik II für Betriebswirte Vorlesung 2

Statistik II für Betriebswirte Vorlesung 2 PD Dr. Frank Heyde TU Bergakademie Freiberg Institut für Stochastik Statistik II für Betriebswirte Vorlesung 2 21. Oktober 2014 Verbundene Stichproben Liegen zwei Stichproben vor, deren Werte einander

Mehr

ZIV-Schulung. Statistik mit Excel 2010

ZIV-Schulung. Statistik mit Excel 2010 ZIV-Schulung Statistik mit Excel 2010 Statistische Möglichkeiten mit Excel 2010 2 Zur Unterstützung quantitativer Datenanalysen dienen in Excel 2010 vor allem: > die Basisfunktionen für Berechnungen in

Mehr

Einige Statistische Tests für den Ein- Zwei- und k-stichprobenfall (Nach Sachs, Stat. Meth.)

Einige Statistische Tests für den Ein- Zwei- und k-stichprobenfall (Nach Sachs, Stat. Meth.) ue biostatistik: nichtparametrische testverfahren / ergänzung 1/6 h. Lettner / physik Statistische Testverfahren Einige Statistische Tests für den Ein- Zwei- und k-stichprobenfall (Nach Sachs, Stat. Meth.)

Mehr

Entscheidungsbäume. Definition Entscheidungsbaum. Frage: Gibt es einen Sortieralgorithmus mit o(n log n) Vergleichen?

Entscheidungsbäume. Definition Entscheidungsbaum. Frage: Gibt es einen Sortieralgorithmus mit o(n log n) Vergleichen? Entscheidungsbäume Frage: Gibt es einen Sortieralgorithmus mit o(n log n) Vergleichen? Definition Entscheidungsbaum Sei T ein Binärbaum und A = {a 1,..., a n } eine zu sortierenden Menge. T ist ein Entscheidungsbaum

Mehr

15 Optimales Kodieren

15 Optimales Kodieren 15 Optimales Kodieren Es soll ein optimaler Kodierer C(T ) entworfen werden, welcher eine Information (z.b. Text T ) mit möglichst geringer Bitanzahl eindeutig überträgt. Die Anforderungen an den optimalen

Mehr

12. Bivariate Datenanalyse. In den Kapiteln 4-11 wurden univariate Daten betrachtet:

12. Bivariate Datenanalyse. In den Kapiteln 4-11 wurden univariate Daten betrachtet: 12. Bivariate Datenanalyse Während einer nur Zahlen im Kopf hat, kann er nicht auf den Kausalzusammenhang kommen Anonymus In den Kapiteln 4-11 wurden univariate Daten betrachtet: Von univariaten Daten

Mehr

Codierung. Auszug aus dem Skript von Maciej Liśkiewicz und Henning Fernau

Codierung. Auszug aus dem Skript von Maciej Liśkiewicz und Henning Fernau Codierung Auszug aus dem Skript von Maciej Liśkiewicz und Henning Fernau Ein bisschen Informationstheorie Betrachten wir das folgende Problem: Wie lautet eine sinnvolle Definition für das quantitative

Mehr

Einführung in die Geostatistik (2) Fred Hattermann (Vorlesung), hattermann@pik-potsdam.de Michael Roers (Übung), roers@pik-potsdam.

Einführung in die Geostatistik (2) Fred Hattermann (Vorlesung), hattermann@pik-potsdam.de Michael Roers (Übung), roers@pik-potsdam. Einführung in die Geostatistik () Fred Hattermann (Vorlesung), hattermann@pik-potsdam.de Michael Roers (Übung), roers@pik-potsdam.de Gliederung Allgemeine Statistik. Deskriptive Statistik. Wahrscheinlichkeitstheorie.3

Mehr

Datenanalyse mit Excel. Wintersemester 2013/14

Datenanalyse mit Excel. Wintersemester 2013/14 Datenanalyse mit Excel 1 KORRELATIONRECHNUNG 2 Korrelationsrechnung Ziel der Korrelationsrechnung besteht im bivariaten Fall darin, die Stärke des Zusammenhangs zwischen zwei interessierenden statistischen

Mehr