4 Statistische Maßzahlen

Save this PDF as:
 WORD  PNG  TXT  JPG

Größe: px
Ab Seite anzeigen:

Download "4 Statistische Maßzahlen"

Transkript

1 4 Statistische Maßzahlen 4.1 Maßzahlen der mittleren Lage 4.2 Weitere Maßzahlen der Lage 4.3 Maßzahlen der Streuung 4.4 Lineare Transformationen, Schiefemaße 4.5 Der Box Plot Ziel: Charakterisierung einer Stichprobe bzw. einer empirischen Verteilung (Häufigkeitsverteilung) durch Kennzahlen. StatSoz 78

2 Statistische Maßzahlen dienen der Beurteilung einzelner Beobachtungswerte innerhalb der Gesamtheit aller Beobachtungswerte, repräsentieren eine empirische Verteilung durch wenige Zahlenwerte, ermöglichen einen einfachen und schnellen Vergleich von Stichproben bzw. empirischen Verteilungen. StatSoz 79

3 Statistische Maßzahlen beschreiben drei Aspekte: Lage Wo liegen die Daten auf der verwendeten Skala? Wo liegt das Zentrum, die,,mitte? Auskunft geben Maßzahlen der Lage (Abschnitt 4.1 und 4.2). Streuung Wie weit streuen die Daten auf der verwendeten Skala? Wie weit sind die Daten vom Zentrum entfernt? Auskunft geben Maßzahlen der Streuung (Abschnitt 4.3). Form Wie verhalten sich die Daten links und rechts vom Zentrum? Wie weit weicht eine Häufigkeitsverteilung von der Symmetrie ab? Auskunft geben Maßzahlen der Schiefe (Abschnitt 4.4). StatSoz 80

4 4.1 Maßzahlen der mittleren Lage Maße der zentralen Tendenz, Mittelwerte Ziel: Ein Mittelwert soll die Gesamtheit der Beobachtungen (Daten) möglichst gut repräsentieren. Modus (Modalwert) Definition: Der Modus ist die Merkmalsausprägung, die in der Stichprobe am häufigsten vorkommt. Als Lagemaß ist der Modus sinnvoll für ordinale Merkmale diskrete metrische Merkmale (Zähldaten) wenn er eindeutig ist! StatSoz 81

5 Bemerkung: Da der Modus allein von der Häufigkeit abhängt, muss er nicht in der,,mitte einer Verteilung liegen. Beispiel: Eine Stichprobe von 200 Haushalten ergab die folgende Häufigkeitstabelle über die Haushaltsgröße: Der Modus ist 4. Anzahl der absolute Haushaltsmitglieder Häufigkeit StatSoz 82

6 Bemerkung: 1. Bei stetigen (und somit metrisch skalierten) Merkmalen macht der Modus im Allgemeinen keinen Sinn (alle Daten sind i.d.r. verschieden). 2. Im klassierten Fall ist der Modus definiert als die Klassenmitte der am häufigsten besetzten Klasse. Aber Vorsicht! Der Modus hängt von der Klassenwahl ab! (vgl. Aufgabe 2, Blatt 2) Fortsetzung von Bsp. 3.1: (Pendler Daten) Der Modus im nichtklassierten Fall ist 21, da dieser Wert am häufigsten auftritt (nämlich 5 mal), im klassierten Fall der Tab. 3 4 ist die Klasse [20, 30) am dichtesten besetzt (nämlich 11 mal) und der Modus ist = 25 StatSoz 83

7 Median (Zentralwert) Empirischer Median, Stichproben Median (sample median) Voraussetzung: Merkmale müssen mindestens ordinalskaliert sein. Bezeichnung: med, med x Median: Beobachtungswert, der sich in der,,mittleren Position der geordneten Stichprobe befindet (bei geradem Stichprobenumfang gibt es zwei Beobachtungen in einer mittleren Position und es wird gemittelt). Zahlenbeispiel: med = 4 med = = 4.5 StatSoz 84

8 Fortsetzung von Bsp. 3.1: (Pendler Daten) Die geordnete Stichprobe der 30 Daten lautet: In der mittleren Position sind die 15 te und die 16 te Ordnungsgröße, beide haben den Wert 21. Der Median ist dann das arithmetische Mittel dieser beiden Ordnungsgrößen: med = x (15) + x (16) 2 = = 21 Um allgemein den Median von Daten x 1,..., x n zu bestimmen, sind zunächst die Werte der Größe nach zu sortieren. Bezeichne x (1) x (2)... x (n) wieder die geordneten Daten. StatSoz 85

9 Definition: Der empirische Median ist definiert durch med = { x( n+1 ( x( n 2 ), n ungerade ) 2 ) + x ( n 2 +1) /2, n gerade Hinweis: Der Median teilt die Stichprobe so, dass mindestens 50% der Daten kleiner oder gleich diesem Wert und mindestens 50% der Daten größer oder gleich diesem Wert sind. Beispiel Pendler Daten: Von den 30 Beobachtungen sind 18 Beobachtungen kleiner oder gleich dem Median, also 60%, 17 Beobachtungen sind größer oder gleich dem Median, gerundet 57%. StatSoz 86

10 Arithmetisches Mittel Mittelwert, Stichprobenmittel (sample mean) Voraussetzung: metrisch skaliertes Merkmal oder Merkmal ist binär und 0/1 kodiert. Bezeichnung: x, x n Definition: Das arithmetische Mittel einer Stichprobe x 1,..., x n ist definiert durch n x = 1 n (x x n ) = 1 n i=1 x i Bemerkung: Selbstverständlich kommt es bei der Aufsummierung nicht auf die Reihenfolge an. So ändert sich der Wert des arithmetischen StatSoz 87

11 Mittels nicht, wenn man z. B. die geordneten Daten aufsummiert: x = 1 n (x (1) x (n) ) Fortsetzung von Bsp. 3.1 (Pendler Daten): x 30 = 1 30 ( ) = aufgerundet 22 (Minuten). Bei einem binären Merkmal, dessen Ausprägungen mit 0 und 1 kodiert sind, ist das arithmetische Mittel identisch mit der relativen Häufigkeit der Ausprägung 1: x = Anzahl der Daten x i mit x i = 1 n 100 x gibt den prozentualen Anteil der Ausprägung 1 wieder. StatSoz 88

12 Median oder arithmetisches Mittel? Median und arithmetisches Mittel haben unterschiedliche Eigenschaften: Der Median wird von Ausreißern kaum oder gar nicht beeinflusst (Ausreißer sind Beobachtungen die (augenfällig) weit entfernt von den übrigen Daten liegen.) Man sagt: Der Median ist robust. Das arithmetische Mittel reagiert hingegen äußerst sensibel auf Ausreißer (und kann daher zu sachlich verzerrten Aussagen führen). Aber Achtung! Robustheit ist eine Eigenschaft, kein Gütekriterium! Für schiefe Verteilungen ist der Median besser interpretierbar als das arithmetische Mittel. Bei (annähernd) symmetrischen Verteilungen ist das arithmetische Mittel dem Median vorzuziehen. StatSoz 89

13 Der Median setzt lediglich ein ordinales Skalenniveau voraus, während das arithmetische Mittel metrisch skalierte Merkmale voraussetzt (Ausnahme: binäre, 0/1 kodierte Merkmale). Das arithmetische Mittel gibt einen rechnerischen Bezug zur Summe aller Beobachtungswerte, der Median gibt eher einen typischen Wert im Zentrum der Verteilung wieder. Fortsetzung von Bsp. 3.1 (Pendler Daten): Lässt man die größte Beobachtung 77 weg, so erhält man x 29 = med = x (15) = 21 Der Mittelwert hat um 1.9 abgenommen, der Median hingegen bleibt in diesem Beispiel sogar unverändert. StatSoz 90

14 Robustifizierung des arithmetischen Mittels: Weglassen der k kleinsten und größten Beobachtungen (k n/2). Das Ergebnis x n,k = 1 n 2 k n k j=k+1 x (j) (4.1) ist das sogenannte gestutzte oder getrimmte Mittel (trimmed mean). Beispiel: 5% getrimmtes Mittel (Weglassen der 5% kleinsten und 5% größten Beobachtungen) Bemerkung: In der Darstellung (4.1) werden alle Daten gleich gewichtet. Das Gewicht ist 1 n 2 k Es gibt aber auch andere Festlegungen. StatSoz 91

15 4.2 Weitere Maßzahlen der Lage In diesem Abschnitt werden Maßzahlen vorgestellt, die häufig zur Beschreibung der nicht zentralen Lage der Daten verwendet werden. min Q 1 Q 2 = med Q 3 max Minimum: Kleinster Beobachtungswert x (1) = min(x 1,,..., x n ) Maximum: Größter Beobachtungswert x (n) = max(x 1,,..., x n ) Fortsetzung von Bsp. 3.1: (Pendler Daten) x (1) = 5, x (30) = 77 StatSoz 92

16 Quartile Die Interpretation von Quartilen ist die Folgende: Das 1. Quartil (1st quartile) Q 1 teilt die Stichprobe so, dass ungefähr 25% der Daten darunter liegen. Das 2. Quartil (2nd quartile) Q 2 teilt die Stichprobe so, dass ungefähr 50% der Daten darunter liegen (entspricht dem Median) und das 3. Quartil (3rd quartile) Q 3 teilt die Stichprobe so, dass etwa 75% der Daten darunter liegen. Die Bestimmung von Quartilen geschieht wie folgt: 1. Quartil: Division von 1 (n+1) durch 4 ergibt n = k 1 + Rest Der Rest kann nur die Werte 0, 0.25, 0.5 und 0.75 annehmen (den Wert 0, wenn n + 1 durch 4 teilbar ist). StatSoz 93

17 Definition: 1. Quartil Q 1 = x (k1 ) + Rest (x ) (k1 +1) x (k1 ) Im Fall Rest = 0 ist Q 1 = x (k1 ). Fortsetzung von Bsp. 3.1: (Pendler Daten) Hier ist n = 30 und n = = 7.75 = Also ist k 1 = 7, Rest = 0.75 und Q 1 = x (7) (x (8) x (7) ) = (12 11) = Von den 30 Daten liegen 7 Daten unterhalb des 1. Quartils, also etwa 23%. StatSoz 94

18 2. Quartil: Division von 2 (n+1) durch 4 ergibt 2 (n + 1) 4 = n = k 2 + Rest Der Rest kann den Wert 0 annehmen, wenn n + 1 durch 2 teilbar ist. In diesem Fall ist k 2 = n Der Rest kann den Wert 0.5 annehmen, wenn n + 1 ungerade, also n gerade ist. In diesem Fall ist k 2 = n 2 StatSoz 95

19 Definition: 2. Quartil Q 2 = x (k2 ) + Rest (x ) (k2 +1) x (k2 ) = { x( n+1 2 ), n ungerade 0.5 x ( n 2 ) x ( n 2 +1),n gerade = med 3. Quartil: Division von 3 (n+1) durch 4 ergibt 3 (n + 1) 4 = k 3 + Rest Der Rest kann nur die Werte 0, 0.25, 0.5 und 0.75 annehmen (den Wert 0, wenn 3 (n + 1) durch 4 teilbar ist). StatSoz 96

20 Definition: 3. Quartil Q 3 = x (k3 ) + Rest (x ) (k3 +1) x (k3 ) Im Fall Rest = 0 ist Q 3 = x (k3 ). Fortsetzung von Bsp. 3.1: (Pendler Daten) Wegen = ist k 3 = 23, Rest = 0.25 und Q 3 = x (23) (x (24) x (23) ) = (26 26) = 26 Von den 30 Daten sind 22 Daten kleiner als das 3. Quartil, also etwa 73%, 24 Daten sind kleiner oder gleich dem 3. Quartil, also 80%. Hinweis: Es gibt auch geringfügig andere Festlegungen von Quartilen. StatSoz 97

21 4.3 Maßzahlen der Streuung Variabilitätsmaße, Dispersionsmaße (measures of dispersion) Lagemaße geben i. A. wenig Auskunft darüber, wie weit die Daten vom Zentrum entfernt liegen, wie stark also die Daten um das Zentrum variieren (,,streuen ). Zahlenbeispiel 4.1 (wird fortgesetzt): Für die beiden Stichproben 0, 0, 10, 10 und 0, 0, 2, 8, 10, 10 gilt (nachrechnen!): x = 5 Minimum = 0 Maximum = 10 Q 1 = 0 Q 2 (med) = 5 Q 3 = 10 StatSoz 98

22 Spannweite (range) Voraussetzung: ordinal skalierte Merkmale Definition: Die Spannweite einer Stichprobe x 1,..., x n ist die Differenz zwischen größtem und kleinstem Beobachtungswert: Spannweite = x (n) x (1) Fortsetzung von Bsp. 3.1: (Pendler Daten) Spannweite = 77 5 = 72 Nachteile: Die Spannweite ist extrem ausreißerempfindlich berücksichtigt nicht die (Lage der) Daten, die StatSoz 99

23 zwischen Minimum und Maximum liegen wird mit wachsendem Stichprobenumfang nie kleiner. Quartilsabstand (interquartile range, IQR) Dieses Streuungsmaß, auch Quartilsdifferenz (quartile deviation) genannt, ist eine Robustifizierung der Spannweite. Definition: Der Quartilsabstand einer Stichprobe x 1,..., x n ist die Differenz zwischen dem dritten und ersten Quartil: IQR = Q 3 Q 1 StatSoz 100

24 Bemerkung: Der Quartilsabstand hat eine sehr anschauliche Interpretation: Er misst die Länge des Intervalls, das etwa die Hälfte der,,mittleren Beobachtungen enthält. Das Intervall [Q 1, Q 3 ] umfasst die Beobachtungen zwischen Q 1 Q 3. und Fortsetzung von Bsp. 3.1: (Pendler Daten) IQR = Q 3 Q 1 = = Im Intervall [11.75, 26] liegen die (mittleren) Beobachtungenwerte Dies sind rund 57% aller Beobachtungwerte. StatSoz 101

25 Standardabweichung (standard deviation) Genauer: empirische Standardabweichung, Stichproben Standardabweichung Bezeichnungsweisen: s, s n Voraussetzung: metrisch skalierte Merkmale Definition: Die Standardabweichung von x 1,..., x n ist definiert durch s = s n = 1 n (x i x) n 1 2 i=1 Die Standardabweichung betrachtet die Summe der quadratischen Abweichungen vom arithmetischen Mittel StatSoz 102

26 nimmt Bezug zum Stichprobenumfang n zieht die Wurzel aus der Summe der quadratischen Abweichungen, damit das Streuungsmaß die gleiche Maßeinheit besitzt wie die Stichprobenwerte. Beachte: Nur die Abweichungen (also ohne Quadrat) zu nehmen, ist sinnlos. Es gilt stets n (x i x n ) = 0 i=1 (Aufgabe 3 (ii), Blatt 2). Fortsetzung von Zahlenbeispiel 4.1: Die Stichprobe 0, 0, 10, 10 ( x = 5) besitzt die Standardabweichung s 4 = = 5.77 StatSoz 103

27 die Stichprobe 0, 0, 2, 8, 10, 10 ( x = 5) besitzt die Standardabweichung s 6 = = 4.86 Das Quadrat der (Stichproben )Standardabweichung s 2 = s 2 n = 1 n 1 n (x i x) 2 i=1 heißt (Stichproben )Varianz. Fortsetzung von Bsp. 3.1: (Pendler Daten) Varianz (in Minuten 2 ) s 2 = 1 (( ) ( ) 2) 29 = StatSoz 104

28 Standardabweichung (in Minuten) s = = Bemerkungen: (i) Die Maßeinheit der Varianz ist das Quadrat der Maßeinheit der Stichprobenwerte. Die Varianz ist daher nur schwer interpretierbar. (ii) Standardabweichung bzw. Varianz werden von Ausreißern stark beeinflusst, sind also nicht robust. Beispiel: (Pendler Daten) Würde man die extreme Beobachtung 77 weglassen, so ergäbe sich eine Standardabweichung von eine deutliche Verringerung gegenüber StatSoz 105

29 (iii) Im Gegensatz zum Quartilsabstand hat die Standardabweichung s keine anschauliche Interpretation (vgl. Bemerkung im Anschluss an Definition des Quartilsabstandes). Als Faustregel sollte man sich aber merken, dass für annähernd normalverteilte Stichproben das Intervall [ x s, x + s] ungefähr 2/3 aller Beobachtungen enthält; ungefähr die Hälfte liegt im Intervall [ x 0.67 s, x s] Was normalverteilt bedeutet, wird in der Wahrscheinlichkeitsrechnung erklärt. (iv) Möchte man Standardabweichungen von verschiedenen Stichproben vergleichen, so ist es häufig sinnvoll, diese in Bezug zu den arithmetischen Mitteln zu setzen (vgl. Aufgabe 8, Blatt 2). StatSoz 106

30 4.4 Lineare Transformationen, Schiefemaße Wie wirkt sich eine Änderung der Maßeinheit auf Lage und Streuungsmaße aus? Beispiele: Währung: USD ($) und Euro [e] Zeitmessung: 1e = 1.320$ 1 Stunde = 60 Minuten Allgemein lässt sich der Übergang zu einer anderen Maßeinheit durch eine lineare Funktion (man sagt auch lineare Transformation) beschreiben: y = a + b x, b > 0 Die x Werte werden erst mit einem Faktor b > 0 gewichtet und dann um den Wert a verschoben. StatSoz 107

31 Im Fall der Währung ist b = und a = 0: y = x (x Euro sind x USD) Im Fall der Zeitmessung ist b = 60 und a = 0: y = 60 x (x Stunden sind 60 x Minuten) Wendet man eine lineare Transformation y = a + b x, b > 0 auf eine Stichprobe x 1,..., x n an, so erhält man die linear transformierten Daten y 1 = a + b x 1,..., y n = a + b x n Alle Lage und Streuungsmaße (außer die Varianz) sind dadurch charakterisiert, dass sie sich bei linearen Transformationen in einer bestimmten Weise mitverändern: StatSoz 108

32 Lage y = a + b Lage x Streuung y = b Streuung x Für die vorgestellten Lagemaße gilt also ȳ = a + b x Q 1,y = a + b Q 1,x med y = a + b med x Q 3,y = a + b Q 3,x und für die vorgestellten Streuungmaße gilt s y = b s x IQR y = b IQR x StatSoz 109

33 Selbst wenn Stichproben in Lage und Streuung übereinstimmen sollten, bleiben im Allgemeinen Unterschiede, die man unter dem Begriff Form zusammenfasst. Die Form der Verteilung ist das, was sich unter linearen Transformationen nicht ändert. Ein anschaulicher Aspekt der Form ist die Schiefe (skewness). Schiefe ist die Abweichung von der Symmetrie. Ausreißer bewirken, dass Mittelwert und Median voneinander abweichen. In diesen Fällen ist die Verteilung schief. StatSoz 110

34 Rechtsschiefe (Linkssteilheit) in den Daten liegt vor, wenn mehr Beobachtungen unterhalb des Mittelwertes liegen als oberhalb, also der Median kleiner als der Mittelwert ist med x < x Die Pendler Daten von Bsp. 3.1 sind rechtsschief (siehe Abb. 3 4). Linksschiefe (Rechtssteilheit) in den Daten liegt vor, wenn mehr Beobachtungen oberhalb des Mittelwertes liegen als unterhalb, also der Median größer als der Mittelwert ist med x > x Im Fall x = med x spricht man von Symmetrie. StatSoz 111

35 Beachte: Unter linearen Transformationen bleibt a + b x, b > 0 (i) eine rechtsschiefe Verteilung (med x < x) rechtsschief: a + b med x < a + b x (ii) eine linksschiefe Verteilung (med x linksschief: > x) a + b med x > a + b x (iii) eine symmetrische Verteilung (med x = x) symmetrisch: a + b med x = a + b x StatSoz 112

36 Schiefemaße Ein Schiefemaß ist ein Maß für die Ausgeprägtheit der Schiefe einer Verteilung, für den Grad der Asymmetrie. Konvention: Bei rechtsschiefer Verteilung wird die Maßzahl positiv bei linksschiefer Verteilung wird die Maßzahl negativ bei symmetrischer Verteilung wird die Maßzahl Null. Schiefemaß nach Yule Pearson: Schiefe YP = 3 ( x med) s StatSoz 113

37 Schiefemaß 3. Moment: Schiefe M = 1 n n i=1 ( ) 3 xi x (4.2) s Fortsetzung von Bsp. 3.1 (Pendler Daten) Mit x = 21.93, med = 21 und s = erhält man Schiefe YP = 3 ( ) = 0.19 Schiefe M = 1 30 ( ) ( ) = Dies deutet auf eine Rechtsschiefe hin. StatSoz 114

38 Da die Form einer Verteilung sich unter linearen Transformationen a + b x, b > 0, nicht ändert, ist es vernünftig, von einem Schiefemaß zu fordern, dass es sich ebenfalls unter linearen Transformationen nicht ändert (Aufgabe 2, Blatt 3). Bemerkung: Rechtsschiefe Verteilungen sind weit verbreitet. Logarithmus und Wurzeltransformation x 1,,..., x n x 1,..., x n x 1,,..., x n ln(x 1 ),..., ln(x n ) führen zu einer Abnahme der Rechtsschiefe. Dies ist oft ein Grund für ihre Anwendung: Man möchte nicht schiefe Häufigkeitsverteilungen erhalten. Dies ist vor allem im Hinblick auf viele Methoden der schließenden Statistik von Vorteil. StatSoz 115

39 Standardisierte Stichproben Jede Stichprobe lässt sich mittels einer linearen Transformation a + b x, b > 0, in eine Stichprobe überführen, deren (mittlere) Lage 0 und Streuung 1 ist. Sei x 1,..., x n eine Stichprobe. Standardisierung A: Als Lagemaß sei das arithmetische Mittel x und als zugehöriges Streuungsmaß die Standardabweichung s x gewählt. Für die transformierten Beobachtungswerte z i = x i x s x = x + 1 x i }{{} s x }{{} s x =a =b i = 1,..., n, gilt dann z = 0, s z = 1 (Aufgabe 3, Blatt 3). Der standardisierte Wert z i wird als StatSoz 116

40 z score (z Wert) des ursprünglichen Wertes x i bezeichnet. Er besitzt keine Maßeinheit und kennzeichnet, um das,,wievielfache der Streuung der Ursprungswert vom Zentrum ( x) entfernt ist. z 1,..., z n heißt standardisierte Stichprobe. Standardisierung B: (Robuste Variante) Als Lagemaß sei der Median med x und als zugehöriges Streuungsmaß der Quartilsabstand IQR x gewählt. Für die transformierten Beobachtungswerte z i = x i med x IQR x i = 1,..., n, gilt dann (Aufgabe 3, Blatt 3). = med x IQR x }{{} =a med z = 0, IQR z = x i } IQR {{ x} =b StatSoz 117

41 4.5 Der Box Plot Genauer: Box and Whiskers Plot Er benutzt Quartile zur graphischen Darstellung von Lage und Streuung, gibt Hinweise auf Symmetrie oder Schiefe, und hebt potenzielle Ausreißer hervor. Ziel: Schneller visueller Vergleich verschiedener Stichproben. Ausgangspunkt dieser Darstellung (bei vertikaler Orientierung) bildet eine Box, deren untere und obere Begrenzungslinien durch das untere und obere Quartil festgelegt sind. Die Länge der Box ist also der Quartilsabstand. Innerhalb der Box wird der Median durch eine horizontale Linie markiert. Die Whiskers (vertikale Linienstücke) werden unterhalb und oberhalb der Box abgetragen. Die StatSoz 118

42 Linienendpunkte sind durch die größte und kleinste Beobachtung definiert. Wenn allerdings die Beobachtungen vom oberen bzw. unteren Rand der Box zu weit entfernt liegen, nämlich mehr als 1.5 (Q 3 Q 1 ), endet die Linie bei dem höchsten bzw. niedrigsten Beobachtungswert, der gerade noch innerhalb dieses Bereiches liegt (man spricht von der größten,,normalen und kleinsten,,normalen Beobachtung). Alle Messwerte, die extremer sind, werden einzeln, meistens durch Sterne, gekennzeichnet. Dies sind dann potenzielle Ausreißer. Die Zahl 1.5 ist so gewählt, dass für,,normale Stichproben Folgendes gilt: Etwa 99% der Daten liegen im Intervall [Q IQR, Q IQR] Ist der Boxplot unsymmetrisch, so zeigt dieser eine Schiefe in den Daten. StatSoz 119

43 * Q 3 größte,,normale Beobachtung ( Q IQR) Q 2 Q 1 kleinste,,normale Beobachtung ( Q IQR) * * extreme Beobachtung Abbildung 4 1 Aufbau eines Box Plots Man beachte, dass alle im Box Plot verwendeten Kennzahlen relativ robust gegenüber Ausreißern sind, denen damit praktisch die Möglichkeit genommen wird, sich hinter bereits beeinflussten Kennzahlen zu verstecken (,,masking ). StatSoz 120

44 Abbildung 4 2 Box Plot der Pendler Daten StatSoz 121

45 Für die Pendler Daten ergibt sich wegen 1.5 IQR = = das Intervall [Q IQR, Q IQR] = [ , ] = [ 9.625, ] Die kleinste Beobachtung 5 liegt in diesem Intervall. Der untere Whisker endet somit bei 5. Die größte Beobachtung (Beobachtung Nummer 9) beträgt 77 und liegt nicht in diesem Intervall. Diese Beobachtung wird daher als potenzieller Ausreißer gekennzeichnet. Die größte,,normale Beobachtung ist dann 44, wo auch der obere Whisker endet. Der Median von 21 liegt näher an 5 (kleinste normale Beobachtung) als an 44. Dies deutet auf eine Rechtsschiefe hin. StatSoz 122

3. Deskriptive Statistik

3. Deskriptive Statistik 3. Deskriptive Statistik Eindimensionale (univariate) Daten: Pro Objekt wird ein Merkmal durch Messung / Befragung/ Beobachtung erhoben. Resultat ist jeweils ein Wert (Merkmalsausprägung) x i : - Gewicht

Mehr

Kapitel 1 Beschreibende Statistik

Kapitel 1 Beschreibende Statistik Beispiel 1.25: fiktive Aktienkurse Zeitpunkt i 0 1 2 Aktienkurs x i 100 160 100 Frage: Wie hoch ist die durchschnittliche Wachstumsrate? Dr. Karsten Webel 53 Beispiel 1.25: fiktive Aktienkurse (Fortsetzung)

Mehr

Univariate Häufigkeitsverteilungen Kühnel, Krebs 2001: Statistik für die Sozialwissenschaften, S.41-66

Univariate Häufigkeitsverteilungen Kühnel, Krebs 2001: Statistik für die Sozialwissenschaften, S.41-66 Univariate Häufigkeitsverteilungen Kühnel, Krebs 2001: Statistik für die Sozialwissenschaften, S.41-66 Gabriele Doblhammer: Empirische Sozialforschung Teil II, SS 2004 1/19 Skalenniveaus Skalenniveau Relation

Mehr

1. Maße der zentralen Tendenz Beispiel: Variable Anzahl der Geschwister aus Jugend '92. Valid Cum Value Frequency Percent Percent Percent

1. Maße der zentralen Tendenz Beispiel: Variable Anzahl der Geschwister aus Jugend '92. Valid Cum Value Frequency Percent Percent Percent Deskriptive Statistik 1. Verteilungsformen symmetrisch/asymmetrisch unimodal(eingipflig) / bimodal (zweigipflig schmalgipflig / breitgipflig linkssteil / rechtssteil U-förmig / abfallend Statistische Kennwerte

Mehr

Kapitel 5 Kenngrößen empirischer Verteilungen 5.1. Lagemaße. x mod (lies: x-mod) Wofür? Lageparameter. Modus/ Modalwert Zentrum. Median Zentralwert

Kapitel 5 Kenngrößen empirischer Verteilungen 5.1. Lagemaße. x mod (lies: x-mod) Wofür? Lageparameter. Modus/ Modalwert Zentrum. Median Zentralwert Kapitel 5 Kenngrößen empirischer Verteilungen 5.1. Lagemaße Wofür? Lageparameter Modus/ Modalwert Zentrum Median Zentralwert Im Datensatz stehende Informationen auf wenige Kenngrößen verdichten ermöglicht

Mehr

Deskription, Statistische Testverfahren und Regression. Seminar: Planung und Auswertung klinischer und experimenteller Studien

Deskription, Statistische Testverfahren und Regression. Seminar: Planung und Auswertung klinischer und experimenteller Studien Deskription, Statistische Testverfahren und Regression Seminar: Planung und Auswertung klinischer und experimenteller Studien Deskriptive Statistik Deskriptive Statistik: beschreibende Statistik, empirische

Mehr

Lage- und Streuungsparameter

Lage- und Streuungsparameter Lage- und Streuungsparameter Beziehen sich auf die Verteilung der Ausprägungen von intervall- und ratio-skalierten Variablen Versuchen, diese Verteilung durch Zahlen zu beschreiben, statt sie graphisch

Mehr

Empirische Verteilungsfunktion

Empirische Verteilungsfunktion Empirische Verteilungsfunktion H(x) := Anzahl der Werte x ist. Deskriptive

Mehr

Wiederholung Statistik I. Statistik für SozialwissenschaftlerInnen II p.8

Wiederholung Statistik I. Statistik für SozialwissenschaftlerInnen II p.8 Wiederholung Statistik I Statistik für SozialwissenschaftlerInnen II p.8 Konstanten und Variablen Konstante: Merkmal hat nur eine Ausprägung Variable: Merkmal kann mehrere Ausprägungen annehmen Statistik

Mehr

2. Beschreibung von eindimensionalen (univariaten) Stichproben

2. Beschreibung von eindimensionalen (univariaten) Stichproben 1 2. Beschreibung von eindimensionalen (univariaten) Stichproben Bei eindimensionalen (univariaten) Daten wird nur ein Merkmal untersucht. Der Fall von zwei- oder mehrdimensionalen Daten wird im nächsten

Mehr

Statistik eindimensionaler Größen

Statistik eindimensionaler Größen Statistik eindimensionaler Größen Michael Spielmann Inhaltsverzeichnis 1 Aufgabe der eindimensionalen Statistik 2 2 Grundbegriffe 2 3 Aufbereiten der Stichprobe 3 4 Die Kennzahlen Mittelwert und Streuung,

Mehr

Fachrechnen für Tierpfleger

Fachrechnen für Tierpfleger Z.B.: Fachrechnen für Tierpfleger A10. Statistik 10.1 Allgemeines Was ist Statistik? 1. Daten sammeln: Durch Umfragen, Zählung, Messung,... 2. Daten präsentieren: Tabellen, Grafiken 3. Daten beschreiben/charakterisieren:

Mehr

Anteile Häufigkeiten Verteilungen Lagemaße Streuungsmaße Merkmale von Verteilungen. Anteile Häufigkeiten Verteilungen

Anteile Häufigkeiten Verteilungen Lagemaße Streuungsmaße Merkmale von Verteilungen. Anteile Häufigkeiten Verteilungen DAS THEMA: VERTEILUNGEN LAGEMAßE - STREUUUNGSMAßE Anteile Häufigkeiten Verteilungen Lagemaße Streuungsmaße Merkmale von Verteilungen Anteile Häufigkeiten Verteilungen Anteile und Häufigkeiten Darstellung

Mehr

1 45, 39, 44, 48, 42, 39, 40, , 31, 46, 35, 31, 42, 51, , 42, 33, 46, 33, 44, 43

1 45, 39, 44, 48, 42, 39, 40, , 31, 46, 35, 31, 42, 51, , 42, 33, 46, 33, 44, 43 1) Ermittle jeweils das arithmetische Mittel. Ordne die Datenerhebungen nach der Größe der arithmetischen Mittel. Beginne mit dem Größten. 1 45, 39, 44, 48, 42, 39, 40, 31 2 35, 31, 46, 35, 31, 42, 51,

Mehr

benötigen. Die Zeit wird dabei in Minuten angegeben und in einem Boxplot-Diagramm veranschaulicht.

benötigen. Die Zeit wird dabei in Minuten angegeben und in einem Boxplot-Diagramm veranschaulicht. , D 1 Kreuze die richtige Aussage an und stelle die anderen Aussagen richtig. A Das arithmetische Mittel kennzeichnet den mittleren Wert einer geordneten Datenliste. B Die Varianz erhält man, wenn man

Mehr

Häufigkeitsverteilungen und Statistische Maßzahlen. Häufigkeitsverteilungen und Statistische Maßzahlen. Variablentypen. Stichprobe und Grundgesamtheit

Häufigkeitsverteilungen und Statistische Maßzahlen. Häufigkeitsverteilungen und Statistische Maßzahlen. Variablentypen. Stichprobe und Grundgesamtheit TECHNISCHE UNIVERSITÄT MÜNCHEN-WEIHENSTEPHAN MATHEMATIK UND STATISTIK INFORMATIONS- UND DOKUMENTATIONSZENTRUM R. Häufigkeitsverteilungen und Statistische Maßzahlen Statistik SS Variablentypen Qualitative

Mehr

PROC MEANS. zum Berechnen statistischer Maßzahlen (für quantitative Merkmale)

PROC MEANS. zum Berechnen statistischer Maßzahlen (für quantitative Merkmale) PROC MEAS zum Berechnen statistischer Maßzahlen (für quantitative Merkmale) Allgemeine Form: PROC MEAS DATA=name Optionen ; VAR variablenliste ; CLASS vergleichsvariable ; Beispiel und Beschreibung der

Mehr

3 Häufigkeitsverteilungen

3 Häufigkeitsverteilungen 3 Häufigkeitsverteilungen 3.1 Absolute und relative Häufigkeiten 3.2 Klassierung von Daten 3.3 Verteilungsverläufe 3.1 Absolute und relative Häufigkeiten Datenaggregation: Bildung von Häufigkeiten X nominal

Mehr

3 Lage- und Streuungsmaße

3 Lage- und Streuungsmaße 3 Lage- und Streuungsmaße Grafische Darstellungen geben einen allgemeinen Eindruck der Verteilung eines Merkmals, u.a. von Lage und Zentrum der Daten, Streuung der Daten um dieses Zentrum, Schiefe / Symmetrie

Mehr

Deskriptive Statistik Kapitel VI - Lage- und Streuungsparameter

Deskriptive Statistik Kapitel VI - Lage- und Streuungsparameter Deskriptive Statistik Kapitel VI - Lage- und Streuungsparameter Georg Bol bol@statistik.uni-karlsruhe.de Markus Höchstötter, hoechstoetter@statistik.uni-karlsruhe.de Agenda 1. Ziele 2. Lageparameter 3.

Mehr

3.2 Streuungsmaße. 3 Lage- und Streuungsmaße 133. mittlere Variabilität. geringe Variabilität. große Variabilität 0.0 0.1 0.2 0.3 0.4 0.

3.2 Streuungsmaße. 3 Lage- und Streuungsmaße 133. mittlere Variabilität. geringe Variabilität. große Variabilität 0.0 0.1 0.2 0.3 0.4 0. Eine Verteilung ist durch die Angabe von einem oder mehreren Mittelwerten nur unzureichend beschrieben. Beispiel: Häufigkeitsverteilungen mit gleicher zentraler Tendenz: geringe Variabilität mittlere Variabilität

Mehr

Graphische Darstellung einer univariaten Verteilung:

Graphische Darstellung einer univariaten Verteilung: Graphische Darstellung einer univariaten Verteilung: Die graphische Darstellung einer univariaten Verteilung hängt von dem Messniveau der Variablen ab. Bei einer graphischen Darstellung wird die Häufigkeit

Mehr

absolute Häufigkeit h: Anzahl einer bestimmten Note relative Häufigkeit r: Anzahl einer bestimmten Note, gemessen an der Gesamtzahl der Noten

absolute Häufigkeit h: Anzahl einer bestimmten Note relative Häufigkeit r: Anzahl einer bestimmten Note, gemessen an der Gesamtzahl der Noten Statistik Eine Aufgabe der Statistik ist es, Datenmengen zusammenzufassen und darzustellen. Man verwendet dazu bestimmte Kennzahlen und wertet Stichproben aus, um zu Aussagen bzw. Prognosen über die Gesamtheit

Mehr

Herzlich willkommen zur Vorlesung Statistik. Streuungsmaße oder die Unterschiedlichkeit der Daten nebst kurzen Ausführungen zu Schiefe und Wölbung

Herzlich willkommen zur Vorlesung Statistik. Streuungsmaße oder die Unterschiedlichkeit der Daten nebst kurzen Ausführungen zu Schiefe und Wölbung FB 1 W. Ludwig-Mayerhofer Statistik 1 Herzlich willkommen zur Vorlesung Statistik smaße oder die Unterschiedlichkeit der Daten nebst kurzen Ausführungen zu Schiefe und Wölbung FB 1 W. Ludwig-Mayerhofer

Mehr

Statistik und Wahrscheinlichkeitsrechnung

Statistik und Wahrscheinlichkeitsrechnung Statistik und Wahrscheinlichkeitsrechnung Dr. Jochen Köhler 26.02.2008 1 Warum Statistik und Wahrscheinlichkeits rechnung im Ingenieurwesen? Zusammenfassung der letzten Vorlesung Statistik und Wahrscheinlichkeitsrechnung

Mehr

Willkommen zur Vorlesung Statistik

Willkommen zur Vorlesung Statistik Willkommen zur Vorlesung Statistik Thema dieser Vorlesung: Maßzahlen für zentrale Tendenz, Streuung und andere Eigenschaften von Verteilungen Prof. Dr. Wolfgang Ludwig-Mayerhofer Universität Siegen Philosophische

Mehr

1,11 1,12 1,13 1,14 1,15 1,16 1,17 1,17 1,17 1,18

1,11 1,12 1,13 1,14 1,15 1,16 1,17 1,17 1,17 1,18 3. Deskriptive Statistik Ziel der deskriptiven (beschreibenden) Statistik (explorativen Datenanalyse) ist die übersichtliche Darstellung der wesentlichen in den erhobenen Daten enthaltene Informationen

Mehr

Statistik II: Grundlagen und Definitionen der Statistik

Statistik II: Grundlagen und Definitionen der Statistik Medien Institut : Grundlagen und Definitionen der Statistik Dr. Andreas Vlašić Medien Institut (0621) 52 67 44 vlasic@medien-institut.de Gliederung 1. Hintergrund: Entstehung der Statistik 2. Grundlagen

Mehr

Beide Verteilungen der Zeiten sind leicht schief. Der Quartilsabstand für Zeiten zum Surfen ist kleiner als der zum Fernsehen.

Beide Verteilungen der Zeiten sind leicht schief. Der Quartilsabstand für Zeiten zum Surfen ist kleiner als der zum Fernsehen. Welche der folgenden Maßzahlen sind resistent gegenüber Ausreißer? Der Mittelwert und die Standardabweichung. Der und die Standardabweichung. Der und die Spannweite. Der und der Quartilsabstand. Die Spannweite

Mehr

Deskriptive Statistik II. Statistische Methoden in der Korpuslinguistik Heike Zinsmeister WS 2008/09

Deskriptive Statistik II. Statistische Methoden in der Korpuslinguistik Heike Zinsmeister WS 2008/09 Deskriptive Statistik II Statistische Methoden in der Korpuslinguistik Heike Zinsmeister WS 2008/09 Übersicht Wiederholung Maße der zentralen Tendenz Streuungsmaße Zusammenfassung einer Verteilung tabellarisch

Mehr

Lagemaße Übung. Zentrale Methodenlehre, Europa Universität - Flensburg

Lagemaße Übung. Zentrale Methodenlehre, Europa Universität - Flensburg Lagemaße Übung M O D U S, M E D I A N, M I T T E L W E R T, M O D A L K L A S S E, M E D I A N, K L A S S E, I N T E R P O L A T I O N D E R M E D I A N, K L A S S E M I T T E Zentrale Methodenlehre, Europa

Mehr

8. Statistik Beispiel Noten. Informationsbestände analysieren Statistik

8. Statistik Beispiel Noten. Informationsbestände analysieren Statistik Informationsbestände analysieren Statistik 8. Statistik Nebst der Darstellung von Datenreihen bildet die Statistik eine weitere Domäne für die Auswertung von Datenbestände. Sie ist ein Fachgebiet der Mathematik

Mehr

Mathematische Statistik. Zur Notation

Mathematische Statistik. Zur Notation Mathematische Statistik dient dazu, anhand von Stichproben Informationen zu gewinnen. Während die Wahrscheinlichkeitsrechnung Prognosen über das Eintreten zufälliger (zukünftiger) Ereignisse macht, werden

Mehr

Thema: Mittelwert einer Häufigkeitsverteilung. Welche Informationen kann der Mittelwert geben?

Thema: Mittelwert einer Häufigkeitsverteilung. Welche Informationen kann der Mittelwert geben? Thema: Mittelwert einer Häufigkeitsverteilung Beispiel: Im Mittel werden deutsche Männer 75,1 Jahre alt; sie essen im Mittel pro Jahr 71 kg Kartoffel(-produkte) und trinken im Mittel pro Tag 0.35 l Bier.

Mehr

Maße der zentralen Tendenz

Maße der zentralen Tendenz UStatistische Kennwerte Sagen uns tabellarische und graphische Darstellungen etwas über die Verteilung der einzelnen Werte einer Stichprobe, so handelt es sich bei statistischen Kennwerten um eine Kennzahl,

Mehr

Beispiel 2 (Einige Aufgaben zu Lageparametern) Aufgabe 1 (Lageparameter)

Beispiel 2 (Einige Aufgaben zu Lageparametern) Aufgabe 1 (Lageparameter) Beispiel (Einige Aufgaben zu Lageparametern) Aufgabe 1 (Lageparameter) 1 Ein Statistiker ist zu früh zu einer Verabredung gekommen und vertreibt sich nun die Zeit damit, daß er die Anzahl X der Stockwerke

Mehr

Verteilungsfunktion und Quantile

Verteilungsfunktion und Quantile Statistik 1 für SoziologInnen Verteilungsfunktion und Quantile Univ.Prof. Dr. Marcus Hudec Kumulierte Häufigkeiten Hinweis: Damit das Kumulieren inhaltlich sinnvoll ist, muss das Merkmal zumindest ordinal

Mehr

Bitte am PC mit Windows anmelden!

Bitte am PC mit Windows anmelden! Einführung in SPSS Plan für heute: Grundlagen/ Vorwissen für SPSS Vergleich der Übungsaufgaben Einführung in SPSS http://weknowmemes.com/generator/uploads/generated/g1374774654830726655.jpg Standardnormalverteilung

Mehr

Dr. Reinhard Vonthein, Dipl. Statistiker (Univ.)

Dr. Reinhard Vonthein, Dipl. Statistiker (Univ.) Dr. Reinhard Vonthein, Dipl. Statistiker (Univ.) Reinhard.Vonthein@imbs.uni-luebeck.de Institut für Medizinische Biometrie und Statistik Universität zu Lübeck / Universitätsklinikums Schleswig-Holstein

Mehr

Verteilungen und ihre Darstellungen

Verteilungen und ihre Darstellungen Verteilungen und ihre Darstellungen Übung: Stamm-Blatt-Diagramme Wie sind die gekennzeichneten Beobachtungswerte eweils zu lesen? Tragen Sie in beiden Diagrammen den Wert 0.452 an der richtigen Stelle

Mehr

WISTA WIRTSCHAFTSSTATISTIK

WISTA WIRTSCHAFTSSTATISTIK WISTA WIRTSCHAFTSSTATISTIK PROF DR ROLF HÜPEN FAKULTÄT FÜR WIRTSCHAFTSWISSENSCHAFT Seminar für Theoretische Wirtschaftslehre Vorlesungsprogramm 07052013 Mittelwerte und Lagemaße II 1 Anwendung und Berechnung

Mehr

Mittelwert und Standardabweichung

Mittelwert und Standardabweichung Professur E-Learning und Neue Medien Institut für Medienforschung Philosophische Fakultät Einführung in die Statistik Mittelwert und Standardabweichung Überblick Mittelwert Standardabweichung Weitere Maße

Mehr

Statistische Grundlagen I

Statistische Grundlagen I Statistische Grundlagen I Arten der Statistik Zusammenfassung und Darstellung von Daten Beschäftigt sich mit der Untersuchung u. Beschreibung von Gesamtheiten oder Teilmengen von Gesamtheiten durch z.b.

Mehr

Grundlagen der Statistik I

Grundlagen der Statistik I NWB-Studienbücher Wirtschaftswissenschaften Grundlagen der Statistik I Beschreibende Verfahren Von Professor Dr. Jochen Schwarze 10. Auflage Verlag Neue Wirtschafts-Briefe Herne/Berlin Inhaltsverzeichnis

Mehr

Einführung in die Statistik für Politikwissenschaftler Sommersemester 2011

Einführung in die Statistik für Politikwissenschaftler Sommersemester 2011 Einführung in die Statistik für Politikwissenschaftler Sommersemester 2011 Es können von den Antworten alle, mehrere oder keine Antwort(en) richtig sein. Nur bei einer korrekten Antwort (ohne Auslassungen

Mehr

1) Warum ist die Lage einer Verteilung für das Ergebnis einer statistischen Analyse von Bedeutung?

1) Warum ist die Lage einer Verteilung für das Ergebnis einer statistischen Analyse von Bedeutung? 86 8. Lageparameter Leitfragen 1) Warum ist die Lage einer Verteilung für das Ergebnis einer statistischen Analyse von Bedeutung? 2) Was ist der Unterschied zwischen Parametern der Lage und der Streuung?

Mehr

Streuungsmaße Worum geht es in diesem Modul? Allgemeines zu Streuungsmaßzahlen Spannweite und Interquartilsabstand

Streuungsmaße Worum geht es in diesem Modul? Allgemeines zu Streuungsmaßzahlen Spannweite und Interquartilsabstand Streuungsmaße Worum geht es in diesem Modul? Allgemeines zu Streuungsmaßzahlen Spannweite und Interquartilsabstand Berechnung der mittleren quadratischen Abweichung und der Varianz aus einer Urliste Standardabweichung

Mehr

Mathematik für Biologen

Mathematik für Biologen Mathematik für Biologen Prof. Dr. Rüdiger W. Braun Heinrich-Heine Universität Düsseldorf 19. Oktober 2009 Hinweise Internetseite zur Vorlesung: http://blog.ruediger-braun.net Dort können Sie Materialien

Mehr

Deskriptive Statistik

Deskriptive Statistik Deskriptive Statistik In der beschreibenden Statistik werden Methoden behandelt, mit deren Hilfe man Daten übersichtlich darstellen und kennzeichnen kann. Die Urliste (=Daten in der Reihenfolge ihrer Erhebung)

Mehr

Inhaltsverzeichnis. Inhalt Teil I: Beschreibende (Deskriptive) Statistik Seite. 1.0 Erste Begriffsbildungen Merkmale und Skalen 5

Inhaltsverzeichnis. Inhalt Teil I: Beschreibende (Deskriptive) Statistik Seite. 1.0 Erste Begriffsbildungen Merkmale und Skalen 5 Inhaltsverzeichnis Inhalt Teil I: Beschreibende (Deskriptive) Statistik Seite 1.0 Erste Begriffsbildungen 1 1.1 Merkmale und Skalen 5 1.2 Von der Urliste zu Häufigkeitsverteilungen 9 1.2.0 Erste Ordnung

Mehr

4. Kumulierte Häufigkeiten und Quantile

4. Kumulierte Häufigkeiten und Quantile 4. Kumulierte Häufigkeiten und Quantile Kumulierte Häufigkeiten Oft ist man nicht an der Häufigkeit einzelner Merkmalsausprägungen interessiert, sondern an der Häufigkeit von Intervallen. Typische Fragestellung:

Mehr

Beschreibende Statistik Eindimensionale Daten

Beschreibende Statistik Eindimensionale Daten Mathematik II für Biologen 16. April 2015 Prolog Geordnete Stichprobe Rang Maße für die mittlere Lage der Daten Robustheit Quantile Maße für die Streuung der Daten Erkennung potentieller Eindimensionales

Mehr

Beschreibung univariater Verteilungen

Beschreibung univariater Verteilungen Inhaltsverzeichnis Beschreibung univariater Verteilungen... 2 Lernhinweise... 2 Einführung... 2 Theorie (1-4)... 4 1. Verteilungsformen... 4 2. Masse der zentralen Tendenz (Mittelwerte)... 5 Einleitung...

Mehr

Mathematische und statistische Methoden I

Mathematische und statistische Methoden I Prof. Dr. G. Meinhardt Methodenlehre Mathematische und statistische Methoden I Sprechstunde jederzeit nach Vereinbarung und nach der Vorlesung Wallstr. 3, 6. Stock, Raum 06-206 Dr. Malte Persike persike@uni-mainz.de

Mehr

Verteilungsfunktion und dquantile

Verteilungsfunktion und dquantile Statistik 1 für SoziologInnen Verteilungsfunktion und dquantile Univ.Prof. Dr. Marcus Hudec Kumulierte Häufigkeiten Hinweis: Damit die Kumulation inhaltlich sinnvoll ist, muss das Merkmal zumindest ordinal

Mehr

Häufigkeitsauszählungen, zentrale statistische Kennwerte und Mittelwertvergleiche

Häufigkeitsauszählungen, zentrale statistische Kennwerte und Mittelwertvergleiche Lehrveranstaltung Empirische Forschung und Politikberatung der Universität Bonn, WS 2007/2008 Häufigkeitsauszählungen, zentrale statistische Kennwerte und Mittelwertvergleiche 30. November 2007 Michael

Mehr

Statistik I für Betriebswirte Vorlesung 2

Statistik I für Betriebswirte Vorlesung 2 Statistik I für Betriebswirte Vorlesung 2 PD Dr. Frank Heyde TU Bergakademie Freiberg Institut für Stochastik 16. April 2015 PD Dr. Frank Heyde Statistik I für Betriebswirte Vorlesung 2 1 ii) empirische

Mehr

STATISTIK FÜR STATISTIK-AGNOSTIKER Teil 1 (wie mich)

STATISTIK FÜR STATISTIK-AGNOSTIKER Teil 1 (wie mich) WS 07/08-1 STATISTIK FÜR STATISTIK-AGNOSTIKER Teil 1 (wie mich) Nur die erlernbaren Fakten, keine Hintergrundinfos über empirische Forschung etc. (und ich übernehme keine Garantie) Bei der Auswertung von

Mehr

1.1 Graphische Darstellung von Messdaten und unterschiedliche Mittelwerte. D. Horstmann: Oktober

1.1 Graphische Darstellung von Messdaten und unterschiedliche Mittelwerte. D. Horstmann: Oktober 1.1 Graphische Darstellung von Messdaten und unterschiedliche Mittelwerte D. Horstmann: Oktober 2014 4 Graphische Darstellung von Daten und unterschiedliche Mittelwerte Eine Umfrage nach der Körpergröße

Mehr

4. Auswertung eindimensionaler Daten

4. Auswertung eindimensionaler Daten 4. Auswertung eindimensionaler Daten Ziel dieses Kapitels: Präsentation von Methoden zur statistischen Auswertung eines einzelnen Merkmals 64 Bezeichnungen (Wiederholung): Merkmalsträger: e 1,..., e n

Mehr

Statistik. Jan Müller

Statistik. Jan Müller Statistik Jan Müller Skalenniveau Nominalskala: Diese Skala basiert auf einem Satz von qualitativen Attributen. Es existiert kein Kriterium, nach dem die Punkte einer nominal skalierten Variablen anzuordnen

Mehr

STATISTIK I Übung 07 Box-Plots und Stem-and-Leaf-Diagramme. 1 Kurze Wiederholung. Warum nur zwei grafische Darstellungsformen?

STATISTIK I Übung 07 Box-Plots und Stem-and-Leaf-Diagramme. 1 Kurze Wiederholung. Warum nur zwei grafische Darstellungsformen? STATISTIK I Übung 07 Box-Plots und Stem-and-Leaf-Diagramme 1 Kurze Wiederholung Warum nur zwei grafische Darstellungsformen? Im Rahmen der Vorlesungen haben wir kurz eine ganze Reihe grafischer Darstellungsformen

Mehr

a) Zeichnen Sie in das nebenstehende Streudiagramm mit Lineal eine Regressionsgerade ein, die Sie für passend halten.

a) Zeichnen Sie in das nebenstehende Streudiagramm mit Lineal eine Regressionsgerade ein, die Sie für passend halten. Statistik für Kommunikationswissenschaftler Wintersemester 2009/200 Vorlesung Prof. Dr. Helmut Küchenhoff Übung Cornelia Oberhauser, Monia Mahling, Juliane Manitz Thema 4 Homepage zur Veranstaltung: http://www.statistik.lmu.de/~helmut/kw09.html

Mehr

Gundlagen empirischer Forschung & deskriptive Statistik. Statistische Methoden in der Korpuslinguistik Heike Zinsmeister WS 2008/09

Gundlagen empirischer Forschung & deskriptive Statistik. Statistische Methoden in der Korpuslinguistik Heike Zinsmeister WS 2008/09 Gundlagen empirischer Forschung & deskriptive Statistik Statistische Methoden in der Korpuslinguistik Heike Zinsmeister WS 2008/09 Grundlagen Vorbereitung einer empirischen Studie Allgemeine Beschreibung

Mehr

13,86. Schritt 4: Berechnung des Quartilsabstandes. Unteres Quartil! #5,5.

13,86. Schritt 4: Berechnung des Quartilsabstandes. Unteres Quartil! #5,5. Lösung Aufgabe A1 Detaillierter Lösungsweg: Schritt 1: Prüfung, ob die gegebene Messreihe sortiert ist, In diesem Beispiel ist dies der Fall und wir haben insgesamt 22 Messungen. Schritt 2: Berechnen des

Mehr

1 Verteilungen und ihre Darstellung

1 Verteilungen und ihre Darstellung GKC Statistische Grundlagen für die Korpuslinguistik Kapitel 2: Univariate Deskription von Daten 8.11.2004 Univariate (= eindimensionale) Daten bestehen aus Beobachtungen eines einzelnen Merkmals. 1 Verteilungen

Mehr

Deskriptive Statistik & grafische Darstellung

Deskriptive Statistik & grafische Darstellung Deskriptive Statistik & grafische Darstellung Sven Garbade Fakultät für Angewandte Psychologie SRH Hochschule Heidelberg sven.garbade@hochschule-heidelberg.de Statistik 1 S. Garbade (SRH Heidelberg) Deskriptive

Mehr

Lagemaße Worum geht es in diesem Modul? Allgemeines zu Lagemaßzahlen Arithmetisches Mittel aus einer Urliste

Lagemaße Worum geht es in diesem Modul? Allgemeines zu Lagemaßzahlen Arithmetisches Mittel aus einer Urliste Lagemaße Worum geht es in diesem Modul? Allgemeines zu Lagemaßzahlen Arithmetisches Mittel aus einer Urliste Berechnung des arithmetischen Mittels aus Häufigkeitstabellen Weitere Lagemaße Worum geht es

Mehr

2. Eindimensionale (univariate) Datenanalyse

2. Eindimensionale (univariate) Datenanalyse 2. Eindimensionale (univariate) Datenanalyse Dr. Antje Kiesel Institut für Angewandte Mathematik WS 2011/2012 Kennzahlen, Statistiken In der Regel interessieren uns nicht so sehr die beobachteten Einzeldaten

Mehr

Verteilungsfunktion und Quantile

Verteilungsfunktion und Quantile Statistik 1 für SoziologInnen Verteilungsfunktion und Quantile Univ.Prof. Dr. Marcus Hudec Kumulierte Häufigkeiten Hinweis: Damit das Kumulieren inhaltlich sinnvoll ist, muss das Merkmal zumindest ordinal

Mehr

Demokurs. Modul Grundlagen der Wirtschaftsmathematik Grundlagen der Statistik

Demokurs. Modul Grundlagen der Wirtschaftsmathematik Grundlagen der Statistik Demokurs Modul 31101 Grundlagen der Wirtschaftsmathematik und Statistik Kurs 40601 Grundlagen der Statistik 13. Juli 2010 KE 1 2.4 Schiefe und Wölbung einer Verteilung Seite: 53 2.4 Schiefe und Wölbung

Mehr

Übungsblatt 3 zur Vorlesung Wahrscheinlichkeitsrechnung und mathematische Statistik für Informatiker

Übungsblatt 3 zur Vorlesung Wahrscheinlichkeitsrechnung und mathematische Statistik für Informatiker Übungsblatt 3 zur Vorlesung Wahrscheinlichkeitsrechnung und mathematische Statistik für Informatiker 08.11.01 Modell Temperatur unter Last Anschluss in Grad Celsius in Grad Fahrenheit Corsair Force 10

Mehr

Statistische Methoden in der MMST: Deskriptive Statistik

Statistische Methoden in der MMST: Deskriptive Statistik Statistische Methoden in der MMST: Deskriptive Statistik VL MMS Wintersemester 2013/14 Professur für Prozessleittechnik L. Urbas; J. Pfeffer Ziele und Inhalt Statistik in der MMST Anwendungsgebiete Evaluationen

Mehr

Lösungsvorschläge zur Klausur Beschreibende Statistik und Wirtschaftsstatistik (Sommersemester 2013)

Lösungsvorschläge zur Klausur Beschreibende Statistik und Wirtschaftsstatistik (Sommersemester 2013) Lösungsvorschläge zur Klausur Beschreibende Statistik und Wirtschaftsstatistik (Sommersemester 203) Aufgabe (9 Punkte) Ein metrisches Merkmal X sei in einer Grundgesamtheit vom Umfang n = 200 diskret klassiert.

Mehr

Kapitel 2. Häufigkeitsverteilungen

Kapitel 2. Häufigkeitsverteilungen 6 Kapitel 2 Häufigkeitsverteilungen Ziel: Darstellung bzw Beschreibung (Exploration) einer Variablen Ausgangssituation: An n Einheiten ω,, ω n sei das Merkmal X beobachtet worden x = X(ω ),, x n = X(ω

Mehr

Univariate Kennwerte mit SPSS

Univariate Kennwerte mit SPSS Univariate Kennwerte mit SPSS In diesem Paper wird beschrieben, wie eindimensionale Tabellen und Kennwerte mit SPSS erzeugt werden. Eine Herleitung der Kennwerte und eine inhaltliche Interpretation der

Mehr

Einführung in die Statistik

Einführung in die Statistik Einführung in die Statistik Analyse und Modellierung von Daten Von Prof. Dr. Rainer Schlittgen 4., überarbeitete und erweiterte Auflage Fachbereich Materialwissenschaft! der Techn. Hochschule Darmstadt

Mehr

MATHEMATIK MTA 12 SCHULJAHR 07/08 STATISTIK

MATHEMATIK MTA 12 SCHULJAHR 07/08 STATISTIK MATHEMATIK MTA 12 SCHULJAHR 07/08 STATISTIK PROF. DR. CHRISTINA BIRKENHAKE Inhaltsverzeichnis 1. Merkmale 2 2. Urliste und Häufigkeitstabellen 9. Graphische Darstellung von Daten 10 4. Lageparameter 1

Mehr

PROC UNIVARIATE. Starten Sie die Programmzeilen aus dem Beispiel, zeigt SAS im Output-Fenster die Informationen auf der Rückseite:

PROC UNIVARIATE. Starten Sie die Programmzeilen aus dem Beispiel, zeigt SAS im Output-Fenster die Informationen auf der Rückseite: PROC UNIVARIATE zum Berechnen statistischer Maßzahlen, Prüfung auf Normalverteilung, Häufigkeitslisten für stetige Merkmale (für quantitative Merkmale) Allgemeine Form: PROC UNIVARIATE DATA=name Optionen

Mehr

Statistik. Datenanalyse mit EXCEL und SPSS. R.01denbourg Verlag München Wien. Von Prof. Dr. Karlheinz Zwerenz. 3., überarbeitete Auflage

Statistik. Datenanalyse mit EXCEL und SPSS. R.01denbourg Verlag München Wien. Von Prof. Dr. Karlheinz Zwerenz. 3., überarbeitete Auflage Statistik Datenanalyse mit EXCEL und SPSS Von Prof. Dr. Karlheinz Zwerenz 3., überarbeitete Auflage R.01denbourg Verlag München Wien Inhalt Vorwort Hinweise zu EXCEL und SPSS Hinweise zum Master-Projekt

Mehr

Übung 1: Wiederholung Wahrscheinlichkeitstheorie

Übung 1: Wiederholung Wahrscheinlichkeitstheorie Übung 1: Wiederholung Wahrscheinlichkeitstheorie Ü1.1 Zufallsvariablen Eine Zufallsvariable ist eine Variable, deren numerischer Wert solange unbekannt ist, bis er beobachtet wird. Der Wert einer Zufallsvariable

Mehr

Wirtschaftswissenschaftliches Prüfungsamt Bachelor-Prüfung Deskriptive Statistik und Wahrscheinlichkeitsrechnung Wintersemester 2010/11.

Wirtschaftswissenschaftliches Prüfungsamt Bachelor-Prüfung Deskriptive Statistik und Wahrscheinlichkeitsrechnung Wintersemester 2010/11. Wirtschaftswissenschaftliches Prüfungsamt Bachelor-Prüfung Deskriptive Statistik und Wahrscheinlichkeitsrechnung Wintersemester 2010/11 Namensschild Dr. Martin Becker Hinweise für die Klausurteilnehmer

Mehr

Kapitel 1: Univariate Statistik

Kapitel 1: Univariate Statistik Kapitel 1: Univariate Statistik 1.1 Begriffsdefinitionen 1.1.1 Beobachtungseinheit, Merkmal Die kleinste Einheit einer statistischen Auswertung, an der Beobachtungen durchgeführt werden, ist die Beobachtungseinheit

Mehr

Lösung Aufgabe 19. ( ) = [Mio Euro]. Empirische Varianz s 2 = 1 n

Lösung Aufgabe 19. ( ) = [Mio Euro]. Empirische Varianz s 2 = 1 n Statistik I für Statistiker, Mathematiker und Informatiker Lösungen zu Blatt 4 Gerhard Tutz, Jan Ulbricht, Jan Gertheiss WS 07/08 Lösung Aufgabe 9 (a) Lage und Streuung: Arithmetisches Mittel x = n i=

Mehr

Deskriptive Statistik. Korpuslinguistik Heike Zinsmeister WS 2009/10

Deskriptive Statistik. Korpuslinguistik Heike Zinsmeister WS 2009/10 Deskriptive Statistik Korpuslinguistik Heike Zinsmeister WS 2009/10 Abgrenzung: deskriptive vs. analytische Statistik (1) Deskriptive Statistik = beschreibende Statistik Aufgabe Zustände und Vorgänge beschreiben

Mehr

Grundlagen der Probabilistik

Grundlagen der Probabilistik Grundlagen der Probabilistik Gliederung Einleitung Theoretische Grundlagen der Stochastik Probabilistische Methoden Mögliche Ergebnisse von probabilistischen Untersuchungen Mögliche Fehlerquellen bei probabilistischen

Mehr

Statistische Methoden in der MMST: Deskriptive Statistik

Statistische Methoden in der MMST: Deskriptive Statistik Statistische Methoden in der MMST: Deskriptive Statistik VL MMS Wintersemester 2014/15 Professur für Prozessleittechnik L. Urbas; J. Pfeffer Ziele und Inhalt Statistik in der MMST Anwendungsgebiete Evaluationen

Mehr

Grafische Darstellungen. Box-and-Whiskers-Plot (Boxplot) Grafische Darstellungen. Grafische Darstellungen

Grafische Darstellungen. Box-and-Whiskers-Plot (Boxplot) Grafische Darstellungen. Grafische Darstellungen Box-and-Whiskers-Plot (Boxplot) der Boxplot vereinigt bekannte deskriptive Kenngrößen zu einer grafischen Darstellung Box x 0.5, Median, x 0.75 vertikale Linien x 0.5 -.5 IQR x 0.75 +.5 IQR Extremwerte

Mehr

Statistik. Ludwig Fahrmeir Rita Künstler Iris Pigeot Gerhard Tutz. Der Weg zur Datenanalyse. Springer. Zweite, verbesserte Auflage

Statistik. Ludwig Fahrmeir Rita Künstler Iris Pigeot Gerhard Tutz. Der Weg zur Datenanalyse. Springer. Zweite, verbesserte Auflage Ludwig Fahrmeir Rita Künstler Iris Pigeot Gerhard Tutz Statistik Der Weg zur Datenanalyse Zweite, verbesserte Auflage Mit 165 Abbildungen und 34 Tabellen Springer Inhaltsverzeichnis Vorwort v 1 Einführung

Mehr

Deskriptive Statistik Auswertung durch Informationsreduktion

Deskriptive Statistik Auswertung durch Informationsreduktion Deskriptive Statistik Auswertung durch Informationsreduktion Gliederung Ø Grundbegriffe der Datenerhebung Total-/Stichprobenerhebung, qualitatives/quantitatives Merkmal Einteilung der Daten (Skalierung,

Mehr

Begriffe zur Statistik-Vorlesung

Begriffe zur Statistik-Vorlesung Begriffe zur Statistik-Vorlesung 1. Vorlesung Grundgesamtheit gesamte zu beobachtende Menge, über die man eine Aussage machen möchte; z.b. alle Studenten der FH BRS Stichprobe Teil der GGH; nutze ich,

Mehr

2 Statistische Maßzahlen

2 Statistische Maßzahlen 2 Statistische Maßzahlen Übersicht 2.1 Quantile, speziellmedian, QuartileundPerzentile... 25 2.2 Modus, Median, arithmetischesmittel... 28 2.3 Arithmetisches,geometrisches,harmonischesMittel... 31 2.4

Mehr

Einführung in die computergestützte Datenanalyse

Einführung in die computergestützte Datenanalyse Karlheinz Zwerenz Statistik Einführung in die computergestützte Datenanalyse 6., überarbeitete Auflage DE GRUYTER OLDENBOURG Vorwort Hinweise zu EXCEL und SPSS Hinweise zum Master-Projekt XI XII XII TEIL

Mehr

Beschreibung von Daten

Beschreibung von Daten Kapitel 1 Beschreibung von Daten 1.1 Beispiele zum Üben 1.1.1 Aufgaben Achtung: die Nummerierung ist nicht ident mit der im Buch; Bsp. 1-1 enspricht Bsp 2-20 im Buch, 1-2 2-21 im Buch usw. 1 1 In einem

Mehr

2. Deskriptive Statistik 2.1. Häufigkeitstabellen, Histogramme, empirische Verteilungsfunktionen

2. Deskriptive Statistik 2.1. Häufigkeitstabellen, Histogramme, empirische Verteilungsfunktionen 4. Datenanalyse und Modellbildung Deskriptive Statistik 2-1 2. Deskriptive Statistik 2.1. Häufigkeitstabellen, Histogramme, empirische Verteilungsfunktionen Für die Auswertung einer Messreihe, die in Form

Mehr

ÜBUNGSAUFGABEN ZUR DESKRIPTIVEN UND EXPLORATIVEN DATENANALYSE

ÜBUNGSAUFGABEN ZUR DESKRIPTIVEN UND EXPLORATIVEN DATENANALYSE ÜBUNGSAUFGABEN ZUR DESKRIPTIVEN UND EXPLORATIVEN DATENANALYSE 1.1 Füllen Sie bitte folgenden Lückentext aus. Daten, die in Untersuchungen erhoben werden, muss man grundsätzlich nach ihrem unterscheiden.

Mehr

P (X = 2) = 1/36, P (X = 3) = 2/36,...

P (X = 2) = 1/36, P (X = 3) = 2/36,... 2.3 Zufallsvariablen 2.3 Zufallsvariablen Meist sind die Ereignisse eines Zufallseperiments bereits reelle Zahlen. Ist dies nicht der Fall, kann man Ereignissen eine reelle Zahl zuordnen. Zum Beispiel

Mehr

Lage- und Streuungsmaße

Lage- und Streuungsmaße Sommersemester 2009 Wiederholung/Einführung Modus Median Arithmetisches Mittel Symmetrie/Schiefe Wölbung/Exzess 4 6 8 10 ALQ Tutorien Begleitend zur Vorlesung, inhaltlich identisch mit der Übung Mögliche

Mehr

Bachelor BEE Statistik Übung: Blatt 1 Ostfalia - Hochschule für angewandte Wissenschaften Fakultät Versorgungstechnik Aufgabe (1.1): Gegeben sei die folgende Messreihe: Nr. ph-werte 1-10 6.4 6.3 6.7 6.5

Mehr

Universitätslehrgang Sports Physiotherapy Einführung in die Statistik. Deskriptive Statistik. Deskriptive Statistik. 1.Tabellen.

Universitätslehrgang Sports Physiotherapy Einführung in die Statistik. Deskriptive Statistik. Deskriptive Statistik. 1.Tabellen. Department of Sport Science and Kinesiology Block 1 Universitätslehrgang Sports Physiotherapy Einführung in die Statistik Gerda Strutzenberger Block I Mittwoch 15.2.2012 13:00 bis 14:50 Grundlagen, Skalenniveau

Mehr