4 Statistische Maßzahlen
|
|
|
- Britta Böhmer
- vor 9 Jahren
- Abrufe
Transkript
1 4 Statistische Maßzahlen 4.1 Maßzahlen der mittleren Lage 4.2 Weitere Maßzahlen der Lage 4.3 Maßzahlen der Streuung 4.4 Lineare Transformationen, Schiefemaße 4.5 Der Box Plot Ziel: Charakterisierung einer Stichprobe bzw. einer empirischen Verteilung (Häufigkeitsverteilung) durch Kennzahlen. StatSoz 78
2 Statistische Maßzahlen dienen der Beurteilung einzelner Beobachtungswerte innerhalb der Gesamtheit aller Beobachtungswerte, repräsentieren eine empirische Verteilung durch wenige Zahlenwerte, ermöglichen einen einfachen und schnellen Vergleich von Stichproben bzw. empirischen Verteilungen. StatSoz 79
3 Statistische Maßzahlen beschreiben drei Aspekte: Lage Wo liegen die Daten auf der verwendeten Skala? Wo liegt das Zentrum, die,,mitte? Auskunft geben Maßzahlen der Lage (Abschnitt 4.1 und 4.2). Streuung Wie weit streuen die Daten auf der verwendeten Skala? Wie weit sind die Daten vom Zentrum entfernt? Auskunft geben Maßzahlen der Streuung (Abschnitt 4.3). Form Wie verhalten sich die Daten links und rechts vom Zentrum? Wie weit weicht eine Häufigkeitsverteilung von der Symmetrie ab? Auskunft geben Maßzahlen der Schiefe (Abschnitt 4.4). StatSoz 80
4 4.1 Maßzahlen der mittleren Lage Maße der zentralen Tendenz, Mittelwerte Ziel: Ein Mittelwert soll die Gesamtheit der Beobachtungen (Daten) möglichst gut repräsentieren. Modus (Modalwert) Definition: Der Modus ist die Merkmalsausprägung, die in der Stichprobe am häufigsten vorkommt. Als Lagemaß ist der Modus sinnvoll für ordinale Merkmale diskrete metrische Merkmale (Zähldaten) wenn er eindeutig ist! StatSoz 81
5 Bemerkung: Da der Modus allein von der Häufigkeit abhängt, muss er nicht in der,,mitte einer Verteilung liegen. Beispiel: Eine Stichprobe von 200 Haushalten ergab die folgende Häufigkeitstabelle über die Haushaltsgröße: Der Modus ist 4. Anzahl der absolute Haushaltsmitglieder Häufigkeit StatSoz 82
6 Bemerkung: 1. Bei stetigen (und somit metrisch skalierten) Merkmalen macht der Modus im Allgemeinen keinen Sinn (alle Daten sind i.d.r. verschieden). 2. Im klassierten Fall ist der Modus definiert als die Klassenmitte der am häufigsten besetzten Klasse. Aber Vorsicht! Der Modus hängt von der Klassenwahl ab! (vgl. Aufgabe 2, Blatt 2) Fortsetzung von Bsp. 3.1: (Pendler Daten) Der Modus im nichtklassierten Fall ist 21, da dieser Wert am häufigsten auftritt (nämlich 5 mal), im klassierten Fall der Tab. 3 4 ist die Klasse [20, 30) am dichtesten besetzt (nämlich 11 mal) und der Modus ist = 25 StatSoz 83
7 Median (Zentralwert) Empirischer Median, Stichproben Median (sample median) Voraussetzung: Merkmale müssen mindestens ordinalskaliert sein. Bezeichnung: med, med x Median: Beobachtungswert, der sich in der,,mittleren Position der geordneten Stichprobe befindet (bei geradem Stichprobenumfang gibt es zwei Beobachtungen in einer mittleren Position und es wird gemittelt). Zahlenbeispiel: med = 4 med = = 4.5 StatSoz 84
8 Fortsetzung von Bsp. 3.1: (Pendler Daten) Die geordnete Stichprobe der 30 Daten lautet: In der mittleren Position sind die 15 te und die 16 te Ordnungsgröße, beide haben den Wert 21. Der Median ist dann das arithmetische Mittel dieser beiden Ordnungsgrößen: med = x (15) + x (16) 2 = = 21 Um allgemein den Median von Daten x 1,..., x n zu bestimmen, sind zunächst die Werte der Größe nach zu sortieren. Bezeichne x (1) x (2)... x (n) wieder die geordneten Daten. StatSoz 85
9 Definition: Der empirische Median ist definiert durch med = { x( n+1 ( x( n 2 ), n ungerade ) 2 ) + x ( n 2 +1) /2, n gerade Hinweis: Der Median teilt die Stichprobe so, dass mindestens 50% der Daten kleiner oder gleich diesem Wert und mindestens 50% der Daten größer oder gleich diesem Wert sind. Beispiel Pendler Daten: Von den 30 Beobachtungen sind 18 Beobachtungen kleiner oder gleich dem Median, also 60%, 17 Beobachtungen sind größer oder gleich dem Median, gerundet 57%. StatSoz 86
10 Arithmetisches Mittel Mittelwert, Stichprobenmittel (sample mean) Voraussetzung: metrisch skaliertes Merkmal oder Merkmal ist binär und 0/1 kodiert. Bezeichnung: x, x n Definition: Das arithmetische Mittel einer Stichprobe x 1,..., x n ist definiert durch n x = 1 n (x x n ) = 1 n i=1 x i Bemerkung: Selbstverständlich kommt es bei der Aufsummierung nicht auf die Reihenfolge an. So ändert sich der Wert des arithmetischen StatSoz 87
11 Mittels nicht, wenn man z. B. die geordneten Daten aufsummiert: x = 1 n (x (1) x (n) ) Fortsetzung von Bsp. 3.1 (Pendler Daten): x 30 = 1 30 ( ) = aufgerundet 22 (Minuten). Bei einem binären Merkmal, dessen Ausprägungen mit 0 und 1 kodiert sind, ist das arithmetische Mittel identisch mit der relativen Häufigkeit der Ausprägung 1: x = Anzahl der Daten x i mit x i = 1 n 100 x gibt den prozentualen Anteil der Ausprägung 1 wieder. StatSoz 88
12 Median oder arithmetisches Mittel? Median und arithmetisches Mittel haben unterschiedliche Eigenschaften: Der Median wird von Ausreißern kaum oder gar nicht beeinflusst (Ausreißer sind Beobachtungen die (augenfällig) weit entfernt von den übrigen Daten liegen.) Man sagt: Der Median ist robust. Das arithmetische Mittel reagiert hingegen äußerst sensibel auf Ausreißer (und kann daher zu sachlich verzerrten Aussagen führen). Aber Achtung! Robustheit ist eine Eigenschaft, kein Gütekriterium! Für schiefe Verteilungen ist der Median besser interpretierbar als das arithmetische Mittel. Bei (annähernd) symmetrischen Verteilungen ist das arithmetische Mittel dem Median vorzuziehen. StatSoz 89
13 Der Median setzt lediglich ein ordinales Skalenniveau voraus, während das arithmetische Mittel metrisch skalierte Merkmale voraussetzt (Ausnahme: binäre, 0/1 kodierte Merkmale). Das arithmetische Mittel gibt einen rechnerischen Bezug zur Summe aller Beobachtungswerte, der Median gibt eher einen typischen Wert im Zentrum der Verteilung wieder. Fortsetzung von Bsp. 3.1 (Pendler Daten): Lässt man die größte Beobachtung 77 weg, so erhält man x 29 = med = x (15) = 21 Der Mittelwert hat um 1.9 abgenommen, der Median hingegen bleibt in diesem Beispiel sogar unverändert. StatSoz 90
14 Robustifizierung des arithmetischen Mittels: Weglassen der k kleinsten und größten Beobachtungen (k n/2). Das Ergebnis x n,k = 1 n 2 k n k j=k+1 x (j) (4.1) ist das sogenannte gestutzte oder getrimmte Mittel (trimmed mean). Beispiel: 5% getrimmtes Mittel (Weglassen der 5% kleinsten und 5% größten Beobachtungen) Bemerkung: In der Darstellung (4.1) werden alle Daten gleich gewichtet. Das Gewicht ist 1 n 2 k Es gibt aber auch andere Festlegungen. StatSoz 91
15 4.2 Weitere Maßzahlen der Lage In diesem Abschnitt werden Maßzahlen vorgestellt, die häufig zur Beschreibung der nicht zentralen Lage der Daten verwendet werden. min Q 1 Q 2 = med Q 3 max Minimum: Kleinster Beobachtungswert x (1) = min(x 1,,..., x n ) Maximum: Größter Beobachtungswert x (n) = max(x 1,,..., x n ) Fortsetzung von Bsp. 3.1: (Pendler Daten) x (1) = 5, x (30) = 77 StatSoz 92
16 Quartile Die Interpretation von Quartilen ist die Folgende: Das 1. Quartil (1st quartile) Q 1 teilt die Stichprobe so, dass ungefähr 25% der Daten darunter liegen. Das 2. Quartil (2nd quartile) Q 2 teilt die Stichprobe so, dass ungefähr 50% der Daten darunter liegen (entspricht dem Median) und das 3. Quartil (3rd quartile) Q 3 teilt die Stichprobe so, dass etwa 75% der Daten darunter liegen. Die Bestimmung von Quartilen geschieht wie folgt: 1. Quartil: Division von 1 (n+1) durch 4 ergibt n = k 1 + Rest Der Rest kann nur die Werte 0, 0.25, 0.5 und 0.75 annehmen (den Wert 0, wenn n + 1 durch 4 teilbar ist). StatSoz 93
17 Definition: 1. Quartil Q 1 = x (k1 ) + Rest (x ) (k1 +1) x (k1 ) Im Fall Rest = 0 ist Q 1 = x (k1 ). Fortsetzung von Bsp. 3.1: (Pendler Daten) Hier ist n = 30 und n = = 7.75 = Also ist k 1 = 7, Rest = 0.75 und Q 1 = x (7) (x (8) x (7) ) = (12 11) = Von den 30 Daten liegen 7 Daten unterhalb des 1. Quartils, also etwa 23%. StatSoz 94
18 2. Quartil: Division von 2 (n+1) durch 4 ergibt 2 (n + 1) 4 = n = k 2 + Rest Der Rest kann den Wert 0 annehmen, wenn n + 1 durch 2 teilbar ist. In diesem Fall ist k 2 = n Der Rest kann den Wert 0.5 annehmen, wenn n + 1 ungerade, also n gerade ist. In diesem Fall ist k 2 = n 2 StatSoz 95
19 Definition: 2. Quartil Q 2 = x (k2 ) + Rest (x ) (k2 +1) x (k2 ) = { x( n+1 2 ), n ungerade 0.5 x ( n 2 ) x ( n 2 +1),n gerade = med 3. Quartil: Division von 3 (n+1) durch 4 ergibt 3 (n + 1) 4 = k 3 + Rest Der Rest kann nur die Werte 0, 0.25, 0.5 und 0.75 annehmen (den Wert 0, wenn 3 (n + 1) durch 4 teilbar ist). StatSoz 96
20 Definition: 3. Quartil Q 3 = x (k3 ) + Rest (x ) (k3 +1) x (k3 ) Im Fall Rest = 0 ist Q 3 = x (k3 ). Fortsetzung von Bsp. 3.1: (Pendler Daten) Wegen = ist k 3 = 23, Rest = 0.25 und Q 3 = x (23) (x (24) x (23) ) = (26 26) = 26 Von den 30 Daten sind 22 Daten kleiner als das 3. Quartil, also etwa 73%, 24 Daten sind kleiner oder gleich dem 3. Quartil, also 80%. Hinweis: Es gibt auch geringfügig andere Festlegungen von Quartilen. StatSoz 97
21 4.3 Maßzahlen der Streuung Variabilitätsmaße, Dispersionsmaße (measures of dispersion) Lagemaße geben i. A. wenig Auskunft darüber, wie weit die Daten vom Zentrum entfernt liegen, wie stark also die Daten um das Zentrum variieren (,,streuen ). Zahlenbeispiel 4.1 (wird fortgesetzt): Für die beiden Stichproben 0, 0, 10, 10 und 0, 0, 2, 8, 10, 10 gilt (nachrechnen!): x = 5 Minimum = 0 Maximum = 10 Q 1 = 0 Q 2 (med) = 5 Q 3 = 10 StatSoz 98
22 Spannweite (range) Voraussetzung: ordinal skalierte Merkmale Definition: Die Spannweite einer Stichprobe x 1,..., x n ist die Differenz zwischen größtem und kleinstem Beobachtungswert: Spannweite = x (n) x (1) Fortsetzung von Bsp. 3.1: (Pendler Daten) Spannweite = 77 5 = 72 Nachteile: Die Spannweite ist extrem ausreißerempfindlich berücksichtigt nicht die (Lage der) Daten, die StatSoz 99
23 zwischen Minimum und Maximum liegen wird mit wachsendem Stichprobenumfang nie kleiner. Quartilsabstand (interquartile range, IQR) Dieses Streuungsmaß, auch Quartilsdifferenz (quartile deviation) genannt, ist eine Robustifizierung der Spannweite. Definition: Der Quartilsabstand einer Stichprobe x 1,..., x n ist die Differenz zwischen dem dritten und ersten Quartil: IQR = Q 3 Q 1 StatSoz 100
24 Bemerkung: Der Quartilsabstand hat eine sehr anschauliche Interpretation: Er misst die Länge des Intervalls, das etwa die Hälfte der,,mittleren Beobachtungen enthält. Das Intervall [Q 1, Q 3 ] umfasst die Beobachtungen zwischen Q 1 Q 3. und Fortsetzung von Bsp. 3.1: (Pendler Daten) IQR = Q 3 Q 1 = = Im Intervall [11.75, 26] liegen die (mittleren) Beobachtungenwerte Dies sind rund 57% aller Beobachtungwerte. StatSoz 101
25 Standardabweichung (standard deviation) Genauer: empirische Standardabweichung, Stichproben Standardabweichung Bezeichnungsweisen: s, s n Voraussetzung: metrisch skalierte Merkmale Definition: Die Standardabweichung von x 1,..., x n ist definiert durch s = s n = 1 n (x i x) n 1 2 i=1 Die Standardabweichung betrachtet die Summe der quadratischen Abweichungen vom arithmetischen Mittel StatSoz 102
26 nimmt Bezug zum Stichprobenumfang n zieht die Wurzel aus der Summe der quadratischen Abweichungen, damit das Streuungsmaß die gleiche Maßeinheit besitzt wie die Stichprobenwerte. Beachte: Nur die Abweichungen (also ohne Quadrat) zu nehmen, ist sinnlos. Es gilt stets n (x i x n ) = 0 i=1 (Aufgabe 3 (ii), Blatt 2). Fortsetzung von Zahlenbeispiel 4.1: Die Stichprobe 0, 0, 10, 10 ( x = 5) besitzt die Standardabweichung s 4 = = 5.77 StatSoz 103
27 die Stichprobe 0, 0, 2, 8, 10, 10 ( x = 5) besitzt die Standardabweichung s 6 = = 4.86 Das Quadrat der (Stichproben )Standardabweichung s 2 = s 2 n = 1 n 1 n (x i x) 2 i=1 heißt (Stichproben )Varianz. Fortsetzung von Bsp. 3.1: (Pendler Daten) Varianz (in Minuten 2 ) s 2 = 1 (( ) ( ) 2) 29 = StatSoz 104
28 Standardabweichung (in Minuten) s = = Bemerkungen: (i) Die Maßeinheit der Varianz ist das Quadrat der Maßeinheit der Stichprobenwerte. Die Varianz ist daher nur schwer interpretierbar. (ii) Standardabweichung bzw. Varianz werden von Ausreißern stark beeinflusst, sind also nicht robust. Beispiel: (Pendler Daten) Würde man die extreme Beobachtung 77 weglassen, so ergäbe sich eine Standardabweichung von eine deutliche Verringerung gegenüber StatSoz 105
29 (iii) Im Gegensatz zum Quartilsabstand hat die Standardabweichung s keine anschauliche Interpretation (vgl. Bemerkung im Anschluss an Definition des Quartilsabstandes). Als Faustregel sollte man sich aber merken, dass für annähernd normalverteilte Stichproben das Intervall [ x s, x + s] ungefähr 2/3 aller Beobachtungen enthält; ungefähr die Hälfte liegt im Intervall [ x 0.67 s, x s] Was normalverteilt bedeutet, wird in der Wahrscheinlichkeitsrechnung erklärt. (iv) Möchte man Standardabweichungen von verschiedenen Stichproben vergleichen, so ist es häufig sinnvoll, diese in Bezug zu den arithmetischen Mitteln zu setzen (vgl. Aufgabe 8, Blatt 2). StatSoz 106
30 4.4 Lineare Transformationen, Schiefemaße Wie wirkt sich eine Änderung der Maßeinheit auf Lage und Streuungsmaße aus? Beispiele: Währung: USD ($) und Euro [e] Zeitmessung: 1e = 1.320$ 1 Stunde = 60 Minuten Allgemein lässt sich der Übergang zu einer anderen Maßeinheit durch eine lineare Funktion (man sagt auch lineare Transformation) beschreiben: y = a + b x, b > 0 Die x Werte werden erst mit einem Faktor b > 0 gewichtet und dann um den Wert a verschoben. StatSoz 107
31 Im Fall der Währung ist b = und a = 0: y = x (x Euro sind x USD) Im Fall der Zeitmessung ist b = 60 und a = 0: y = 60 x (x Stunden sind 60 x Minuten) Wendet man eine lineare Transformation y = a + b x, b > 0 auf eine Stichprobe x 1,..., x n an, so erhält man die linear transformierten Daten y 1 = a + b x 1,..., y n = a + b x n Alle Lage und Streuungsmaße (außer die Varianz) sind dadurch charakterisiert, dass sie sich bei linearen Transformationen in einer bestimmten Weise mitverändern: StatSoz 108
32 Lage y = a + b Lage x Streuung y = b Streuung x Für die vorgestellten Lagemaße gilt also ȳ = a + b x Q 1,y = a + b Q 1,x med y = a + b med x Q 3,y = a + b Q 3,x und für die vorgestellten Streuungmaße gilt s y = b s x IQR y = b IQR x StatSoz 109
33 Selbst wenn Stichproben in Lage und Streuung übereinstimmen sollten, bleiben im Allgemeinen Unterschiede, die man unter dem Begriff Form zusammenfasst. Die Form der Verteilung ist das, was sich unter linearen Transformationen nicht ändert. Ein anschaulicher Aspekt der Form ist die Schiefe (skewness). Schiefe ist die Abweichung von der Symmetrie. Ausreißer bewirken, dass Mittelwert und Median voneinander abweichen. In diesen Fällen ist die Verteilung schief. StatSoz 110
34 Rechtsschiefe (Linkssteilheit) in den Daten liegt vor, wenn mehr Beobachtungen unterhalb des Mittelwertes liegen als oberhalb, also der Median kleiner als der Mittelwert ist med x < x Die Pendler Daten von Bsp. 3.1 sind rechtsschief (siehe Abb. 3 4). Linksschiefe (Rechtssteilheit) in den Daten liegt vor, wenn mehr Beobachtungen oberhalb des Mittelwertes liegen als unterhalb, also der Median größer als der Mittelwert ist med x > x Im Fall x = med x spricht man von Symmetrie. StatSoz 111
35 Beachte: Unter linearen Transformationen bleibt a + b x, b > 0 (i) eine rechtsschiefe Verteilung (med x < x) rechtsschief: a + b med x < a + b x (ii) eine linksschiefe Verteilung (med x linksschief: > x) a + b med x > a + b x (iii) eine symmetrische Verteilung (med x = x) symmetrisch: a + b med x = a + b x StatSoz 112
36 Schiefemaße Ein Schiefemaß ist ein Maß für die Ausgeprägtheit der Schiefe einer Verteilung, für den Grad der Asymmetrie. Konvention: Bei rechtsschiefer Verteilung wird die Maßzahl positiv bei linksschiefer Verteilung wird die Maßzahl negativ bei symmetrischer Verteilung wird die Maßzahl Null. Schiefemaß nach Yule Pearson: Schiefe YP = 3 ( x med) s StatSoz 113
37 Schiefemaß 3. Moment: Schiefe M = 1 n n i=1 ( ) 3 xi x (4.2) s Fortsetzung von Bsp. 3.1 (Pendler Daten) Mit x = 21.93, med = 21 und s = erhält man Schiefe YP = 3 ( ) = 0.19 Schiefe M = 1 30 ( ) ( ) = Dies deutet auf eine Rechtsschiefe hin. StatSoz 114
38 Da die Form einer Verteilung sich unter linearen Transformationen a + b x, b > 0, nicht ändert, ist es vernünftig, von einem Schiefemaß zu fordern, dass es sich ebenfalls unter linearen Transformationen nicht ändert (Aufgabe 2, Blatt 3). Bemerkung: Rechtsschiefe Verteilungen sind weit verbreitet. Logarithmus und Wurzeltransformation x 1,,..., x n x 1,..., x n x 1,,..., x n ln(x 1 ),..., ln(x n ) führen zu einer Abnahme der Rechtsschiefe. Dies ist oft ein Grund für ihre Anwendung: Man möchte nicht schiefe Häufigkeitsverteilungen erhalten. Dies ist vor allem im Hinblick auf viele Methoden der schließenden Statistik von Vorteil. StatSoz 115
39 Standardisierte Stichproben Jede Stichprobe lässt sich mittels einer linearen Transformation a + b x, b > 0, in eine Stichprobe überführen, deren (mittlere) Lage 0 und Streuung 1 ist. Sei x 1,..., x n eine Stichprobe. Standardisierung A: Als Lagemaß sei das arithmetische Mittel x und als zugehöriges Streuungsmaß die Standardabweichung s x gewählt. Für die transformierten Beobachtungswerte z i = x i x s x = x + 1 x i }{{} s x }{{} s x =a =b i = 1,..., n, gilt dann z = 0, s z = 1 (Aufgabe 3, Blatt 3). Der standardisierte Wert z i wird als StatSoz 116
40 z score (z Wert) des ursprünglichen Wertes x i bezeichnet. Er besitzt keine Maßeinheit und kennzeichnet, um das,,wievielfache der Streuung der Ursprungswert vom Zentrum ( x) entfernt ist. z 1,..., z n heißt standardisierte Stichprobe. Standardisierung B: (Robuste Variante) Als Lagemaß sei der Median med x und als zugehöriges Streuungsmaß der Quartilsabstand IQR x gewählt. Für die transformierten Beobachtungswerte z i = x i med x IQR x i = 1,..., n, gilt dann (Aufgabe 3, Blatt 3). = med x IQR x }{{} =a med z = 0, IQR z = x i } IQR {{ x} =b StatSoz 117
41 4.5 Der Box Plot Genauer: Box and Whiskers Plot Er benutzt Quartile zur graphischen Darstellung von Lage und Streuung, gibt Hinweise auf Symmetrie oder Schiefe, und hebt potenzielle Ausreißer hervor. Ziel: Schneller visueller Vergleich verschiedener Stichproben. Ausgangspunkt dieser Darstellung (bei vertikaler Orientierung) bildet eine Box, deren untere und obere Begrenzungslinien durch das untere und obere Quartil festgelegt sind. Die Länge der Box ist also der Quartilsabstand. Innerhalb der Box wird der Median durch eine horizontale Linie markiert. Die Whiskers (vertikale Linienstücke) werden unterhalb und oberhalb der Box abgetragen. Die StatSoz 118
42 Linienendpunkte sind durch die größte und kleinste Beobachtung definiert. Wenn allerdings die Beobachtungen vom oberen bzw. unteren Rand der Box zu weit entfernt liegen, nämlich mehr als 1.5 (Q 3 Q 1 ), endet die Linie bei dem höchsten bzw. niedrigsten Beobachtungswert, der gerade noch innerhalb dieses Bereiches liegt (man spricht von der größten,,normalen und kleinsten,,normalen Beobachtung). Alle Messwerte, die extremer sind, werden einzeln, meistens durch Sterne, gekennzeichnet. Dies sind dann potenzielle Ausreißer. Die Zahl 1.5 ist so gewählt, dass für,,normale Stichproben Folgendes gilt: Etwa 99% der Daten liegen im Intervall [Q IQR, Q IQR] Ist der Boxplot unsymmetrisch, so zeigt dieser eine Schiefe in den Daten. StatSoz 119
43 * Q 3 größte,,normale Beobachtung ( Q IQR) Q 2 Q 1 kleinste,,normale Beobachtung ( Q IQR) * * extreme Beobachtung Abbildung 4 1 Aufbau eines Box Plots Man beachte, dass alle im Box Plot verwendeten Kennzahlen relativ robust gegenüber Ausreißern sind, denen damit praktisch die Möglichkeit genommen wird, sich hinter bereits beeinflussten Kennzahlen zu verstecken (,,masking ). StatSoz 120
44 Abbildung 4 2 Box Plot der Pendler Daten StatSoz 121
45 Für die Pendler Daten ergibt sich wegen 1.5 IQR = = das Intervall [Q IQR, Q IQR] = [ , ] = [ 9.625, ] Die kleinste Beobachtung 5 liegt in diesem Intervall. Der untere Whisker endet somit bei 5. Die größte Beobachtung (Beobachtung Nummer 9) beträgt 77 und liegt nicht in diesem Intervall. Diese Beobachtung wird daher als potenzieller Ausreißer gekennzeichnet. Die größte,,normale Beobachtung ist dann 44, wo auch der obere Whisker endet. Der Median von 21 liegt näher an 5 (kleinste normale Beobachtung) als an 44. Dies deutet auf eine Rechtsschiefe hin. StatSoz 122
4 Statistische Maßzahlen
4 Statistische Maßzahlen 4.1 Maßzahlen der mittleren Lage 4.2 Weitere Maßzahlen der Lage 4.3 Maßzahlen der Streuung 4.4 Lineare Transformationen, Schiefemaße 4.5 Der Box Plot Ziel: Charakterisierung einer
Weitere Lagemaße: Quantile/Perzentile I
3 Auswertung von eindimensionalen Daten Lagemaße 3.3 Weitere Lagemaße: Quantile/Perzentile I Für jeden Median x med gilt: Mindestens 50% der Merkmalswerte sind kleiner gleich x med und ebenso mindestens
Verfahren für metrische Variable
Verfahren für metrische Variable Grafische Methoden Histogramm Mittelwertsplot Boxplot Lagemaße Mittelwert, Median, Quantile Streuungsmaße Standardabweichung, Interquartilsabstand Lagemaße und Streumaße
Statistik K urs SS 2004
Statistik K urs SS 2004 3.Tag Grundlegende statistische Maße Mittelwert (mean) Durchschnitt aller Werte Varianz (variance) s 2 Durchschnittliche quadrierte Abweichung aller Werte vom Mittelwert >> Die
3. Deskriptive Statistik
3. Deskriptive Statistik Eindimensionale (univariate) Daten: Pro Objekt wird ein Merkmal durch Messung / Befragung/ Beobachtung erhoben. Resultat ist jeweils ein Wert (Merkmalsausprägung) x i : - Gewicht
Kapitel 3: Lagemaße. Ziel. Komprimierung der Daten zu einer Kenngröße, welche die Lage, das Zentrum der Daten beschreibt
Kapitel 3: Lagemaße Ziel Komprimierung der Daten zu einer Kenngröße, welche die Lage, das Zentrum der Daten beschreibt Dr. Matthias Arnold 52 Definition 3.1 Seien x 1,...,x n Ausprägungen eines kardinal
Deskriptive Statistik
Deskriptive Statistik 1 Ziele In der deskriptiven (=beschreibenden) Statistik werden Untersuchungsergebnisse übersichtlich dargestellt, durch Kennzahlen charakterisiert und grafisch veranschaulicht. 2
Einführung in Quantitative Methoden
Einführung in Quantitative Methoden Mag. Dipl.Ing. Dr. Pantelis Christodoulides & Mag. Dr. Karin Waldherr SS 2014 Christodoulides / Waldherr Einführung in Quantitative Methoden- 2.VO 1/57 Die Deskriptivstatistik
Statistik I für Betriebswirte Vorlesung 9
Statistik I für Betriebswirte Vorlesung 9 Dr. Andreas Wünsche TU Bergakademie Freiberg Institut für Stochastik Vorlesung am 8. Juni 2017 im Audi-Max (AUD-1001) Dr. Andreas Wünsche Statistik I für Betriebswirte
Kapitel 1 Beschreibende Statistik
Beispiel 1.25: fiktive Aktienkurse Zeitpunkt i 0 1 2 Aktienkurs x i 100 160 100 Frage: Wie hoch ist die durchschnittliche Wachstumsrate? Dr. Karsten Webel 53 Beispiel 1.25: fiktive Aktienkurse (Fortsetzung)
Deskriptive Statistik
Deskriptive Statistik Deskriptive Statistik: Ziele Daten zusammenfassen durch numerische Kennzahlen. Grafische Darstellung der Daten. Quelle: Ursus Wehrli, Kunst aufräumen 1 Modell vs. Daten Bis jetzt
htw saar 1 EINFÜHRUNG IN DIE STATISTIK: BESCHREIBENDE STATISTIK
htw saar 1 EINFÜHRUNG IN DIE STATISTIK: BESCHREIBENDE STATISTIK htw saar 2 Grundbegriffe htw saar 3 Grundgesamtheit und Stichprobe Ziel: Über eine Grundgesamtheit (Population) soll eine Aussage über ein
Univariate Häufigkeitsverteilungen Kühnel, Krebs 2001: Statistik für die Sozialwissenschaften, S.41-66
Univariate Häufigkeitsverteilungen Kühnel, Krebs 2001: Statistik für die Sozialwissenschaften, S.41-66 Gabriele Doblhammer: Empirische Sozialforschung Teil II, SS 2004 1/19 Skalenniveaus Skalenniveau Relation
Deskription, Statistische Testverfahren und Regression. Seminar: Planung und Auswertung klinischer und experimenteller Studien
Deskription, Statistische Testverfahren und Regression Seminar: Planung und Auswertung klinischer und experimenteller Studien Deskriptive Statistik Deskriptive Statistik: beschreibende Statistik, empirische
Statistik und Wahrscheinlichkeitsrechnung
Statistik und Wahrscheinlichkeitsrechnung 3. Vorlesung Dr. Jochen Köhler 1 Inhalte der heutigen Vorlesung Ziel: Daten Modellbildung Probabilistisches Modell Wahrscheinlichkeit von Ereignissen Im ersten
Kapitel 5 Kenngrößen empirischer Verteilungen 5.1. Lagemaße. x mod (lies: x-mod) Wofür? Lageparameter. Modus/ Modalwert Zentrum. Median Zentralwert
Kapitel 5 Kenngrößen empirischer Verteilungen 5.1. Lagemaße Wofür? Lageparameter Modus/ Modalwert Zentrum Median Zentralwert Im Datensatz stehende Informationen auf wenige Kenngrößen verdichten ermöglicht
Empirische Verteilungsfunktion
Empirische Verteilungsfunktion H(x) := Anzahl der Werte x ist. Deskriptive
Grundlagen der empirischen Sozialforschung
Grundlagen der empirischen Sozialforschung Sitzung 10 - Datenanalyseverfahren Jan Finsel Lehrstuhl für empirische Sozialforschung Prof. Dr. Petra Stein 22. Dezember 2008 1 / 21 Online-Materialien Die Materialien
1. Maße der zentralen Tendenz Beispiel: Variable Anzahl der Geschwister aus Jugend '92. Valid Cum Value Frequency Percent Percent Percent
Deskriptive Statistik 1. Verteilungsformen symmetrisch/asymmetrisch unimodal(eingipflig) / bimodal (zweigipflig schmalgipflig / breitgipflig linkssteil / rechtssteil U-förmig / abfallend Statistische Kennwerte
Lage- und Streuungsparameter
Lage- und Streuungsparameter Beziehen sich auf die Verteilung der Ausprägungen von intervall- und ratio-skalierten Variablen Versuchen, diese Verteilung durch Zahlen zu beschreiben, statt sie graphisch
Einführung in Quantitative Methoden
Einführung in Quantitative Methoden Mag. Dipl.Ing. Dr. Pantelis Christodoulides & Mag. Dr. Karin Waldherr SS 2011 Christodoulides / Waldherr Einführung in Quantitative Methoden- 2.VO 1/62 Summenzeichen
2. Deskriptive Statistik
Philipps-Universitat Marburg 2.1 Stichproben und Datentypen Untersuchungseinheiten: mogliche, statistisch zu erfassende Einheiten je Untersuchungseinheit: ein oder mehrere Merkmale oder Variablen beobachten
Deskriptive Statistik. (basierend auf Slides von Lukas Meier)
Deskriptive Statistik (basierend auf Slides von Lukas Meier) Deskriptive Statistik: Ziele Daten zusammenfassen durch numerische Kennzahlen. Grafische Darstellung der Daten. Quelle: Ursus Wehrli, Kunst
Wiederholung Statistik I. Statistik für SozialwissenschaftlerInnen II p.8
Wiederholung Statistik I Statistik für SozialwissenschaftlerInnen II p.8 Konstanten und Variablen Konstante: Merkmal hat nur eine Ausprägung Variable: Merkmal kann mehrere Ausprägungen annehmen Statistik
2. Beschreibung von eindimensionalen (univariaten) Stichproben
1 2. Beschreibung von eindimensionalen (univariaten) Stichproben Bei eindimensionalen (univariaten) Daten wird nur ein Merkmal untersucht. Der Fall von zwei- oder mehrdimensionalen Daten wird im nächsten
Der Mittelwert (arithmetisches Mittel)
Der Mittelwert (arithmetisches Mittel) x = 1 n n x i bekanntestes Lagemaß instabil gegen extreme Werte geeignet für intervallskalierte Daten Deskriptive Statistik WiSe 2015/2016 Helmut Küchenhoff (Institut
Fachrechnen für Tierpfleger
Z.B.: Fachrechnen für Tierpfleger A10. Statistik 10.1 Allgemeines Was ist Statistik? 1. Daten sammeln: Durch Umfragen, Zählung, Messung,... 2. Daten präsentieren: Tabellen, Grafiken 3. Daten beschreiben/charakterisieren:
Statistik eindimensionaler Größen
Statistik eindimensionaler Größen Michael Spielmann Inhaltsverzeichnis 1 Aufgabe der eindimensionalen Statistik 2 2 Grundbegriffe 2 3 Aufbereiten der Stichprobe 3 4 Die Kennzahlen Mittelwert und Streuung,
STATISTIK I Übung 04 Spannweite und IQR. 1 Kurze Wiederholung. Was sind Dispersionsparameter?
STATISTIK I Übung 04 Spannweite und IQR 1 Kurze Wiederholung Was sind Dispersionsparameter? Die sogenannten Dispersionsparameter oder statistischen Streuungsmaße geben Auskunft darüber, wie die Werte einer
3 Häufigkeitsverteilungen
3 Häufigkeitsverteilungen 3.1 Absolute und relative Häufigkeiten 3.2 Klassierung von Daten 3.3 Verteilungsverläufe 3.1 Absolute und relative Häufigkeiten Datenaggregation: Bildung von Häufigkeiten X nominal
Kreisdiagramm, Tortendiagramm
Kreisdiagramm, Tortendiagramm Darstellung der relativen (absoluten) Häufigkeiten als Fläche eines Kreises Anwendung: Nominale Merkmale Ordinale Merkmale (Problem: Ordnung nicht korrekt wiedergegeben) Gruppierte
Merkmalstypen Univ.-Prof. Dr. rer. nat. et med. habil. Andreas Faldum
1 Merkmalstypen Quantitativ: Geordnete Werte, Vielfache einer Einheit Stetig: Prinzipiell sind alle Zwischenwerte beobachtbar Beispiele: Gewicht, Größe, Blutdruck Diskret: Nicht alle Zwischenwerte sind
3 Lage- und Streuungsmaße
3 Lage- und Streuungsmaße Grafische Darstellungen geben einen allgemeinen Eindruck der Verteilung eines Merkmals, u.a. von Lage und Zentrum der Daten, Streuung der Daten um dieses Zentrum, Schiefe / Symmetrie
Lösungen. w58r4p Lösungen. w58r4p. Name: Klasse: Datum:
Testen und Fördern Name: Klasse: Datum: 1) Ermittle jeweils das arithmetische Mittel. Ordne die Datenerhebungen nach der Größe der arithmetischen Mittel. Beginne mit dem Größten. 45, 39, 44, 48, 42, 39,
Mathematik für Biologen
Mathematik für Biologen Prof. Dr. Rüdiger W. Braun Heinrich-Heine-Universität Düsseldorf 20. Oktober 2010 1 empirische Verteilung 2 Lageparameter Modalwert Arithmetisches Mittel Median 3 Streuungsparameter
Anteile Häufigkeiten Verteilungen Lagemaße Streuungsmaße Merkmale von Verteilungen. Anteile Häufigkeiten Verteilungen
DAS THEMA: VERTEILUNGEN LAGEMAßE - STREUUUNGSMAßE Anteile Häufigkeiten Verteilungen Lagemaße Streuungsmaße Merkmale von Verteilungen Anteile Häufigkeiten Verteilungen Anteile und Häufigkeiten Darstellung
W-Seminar: Versuche mit und am Menschen 2017/2019 Skript
3. Deskriptive Statistik Die deskriptive (auch: beschreibende) Statistik hat zum Ziel, [ ] Daten durch Tabellen, Kennzahlen [ ] und Grafiken übersichtlich darzustellen und zu ordnen. Dies ist vor allem
Das arithmetische Mittel. x i = = 8. x = 1 4. und. y i = = 8
.2 Einige statistische Maßzahlen.2. Die Schusser in zwei Familien Die vier Kinder der Familie Huber haben x = 5, x 2 = 7, x 3 = 9, x 4 = Schusser. Die vier Kinder der Familie Maier haben y = 7, y 2 = 7,
Streuungsmaße von Stichproben
Streuungsmaße von Stichproben S P A N N W E I T E, V A R I A N Z, S T A N D A R D A B W E I C H U N G, Q U A R T I L E, K O V A R I A N Z, K O R R E L A T I O N S K O E F F I Z I E N T Zentrale Methodenlehre,
Diese Lücken sollten nicht auch bei Ihnen vorhanden sein: Aufgrund einer statistischen Untersuchung entsteht eine geordnete bzw. ungeordnete, die durc
SS 2017 Torsten Schreiber 222 Diese Lücken sollten nicht auch bei Ihnen vorhanden sein: Aufgrund einer statistischen Untersuchung entsteht eine geordnete bzw. ungeordnete, die durch Summierung je Ausprägung
Häufigkeitsverteilungen und Statistische Maßzahlen. Häufigkeitsverteilungen und Statistische Maßzahlen. Variablentypen. Stichprobe und Grundgesamtheit
TECHNISCHE UNIVERSITÄT MÜNCHEN-WEIHENSTEPHAN MATHEMATIK UND STATISTIK INFORMATIONS- UND DOKUMENTATIONSZENTRUM R. Häufigkeitsverteilungen und Statistische Maßzahlen Statistik SS Variablentypen Qualitative
Kapitel 1 Beschreibende Statistik
Beispiel 1.5: Histogramm (klassierte erreichte Punkte, Fortsetzung Bsp. 1.1) 0.25 0.2 Höhe 0.15 0.1 0.05 0 0 6 7 8,5 10 11 erreichte Punkte Dr. Karsten Webel 24 Beispiel 1.5: Histogramm (Fortsetzung) Klasse
1 45, 39, 44, 48, 42, 39, 40, , 31, 46, 35, 31, 42, 51, , 42, 33, 46, 33, 44, 43
1) Ermittle jeweils das arithmetische Mittel. Ordne die Datenerhebungen nach der Größe der arithmetischen Mittel. Beginne mit dem Größten. 1 45, 39, 44, 48, 42, 39, 40, 31 2 35, 31, 46, 35, 31, 42, 51,
Mathematische und statistische Methoden II
Methodenlehre e e Prof. Dr. G. Meinhardt 6. Stock, Wallstr. 3 (Raum 06-206) Sprechstunde jederzeit nach Vereinbarung und nach der Vorlesung. Mathematische und statistische Methoden II Dr. Malte Persike
PROC MEANS. zum Berechnen statistischer Maßzahlen (für quantitative Merkmale)
PROC MEAS zum Berechnen statistischer Maßzahlen (für quantitative Merkmale) Allgemeine Form: PROC MEAS DATA=name Optionen ; VAR variablenliste ; CLASS vergleichsvariable ; Beispiel und Beschreibung der
a) x = 1150 ; x = 950 ; x = 800 b) Die Lagemaße unterscheiden sich voneinander. c) Der Median charakterisiert die Stichprobe am besten.
R. Brinkmann http://brinkmann-du.de Seite 6.0.2009 Lösungen Mittelwert, Median II se: E E2 E3 E4 E5 E6 a) Notendurchschnitt 2,6 b) Säulendiagramm siehe ausführliche Lösung. c) Kreisdiagramm siehe ausführliche
benötigen. Die Zeit wird dabei in Minuten angegeben und in einem Boxplot-Diagramm veranschaulicht.
, D 1 Kreuze die richtige Aussage an und stelle die anderen Aussagen richtig. A Das arithmetische Mittel kennzeichnet den mittleren Wert einer geordneten Datenliste. B Die Varianz erhält man, wenn man
3 Häufigkeitsverteilungen
3 Häufigkeitsverteilungen 3.1 Absolute und relative Häufigkeiten 3.2 Klassierung von Daten 3.3 Verteilungsverläufe 3.1 Absolute und relative Häufigkeiten Datenaggregation: Bildung von Häufigkeiten X nominal
3.2 Streuungsmaße. 3 Lage- und Streuungsmaße 133. mittlere Variabilität. geringe Variabilität. große Variabilität 0.0 0.1 0.2 0.3 0.4 0.
Eine Verteilung ist durch die Angabe von einem oder mehreren Mittelwerten nur unzureichend beschrieben. Beispiel: Häufigkeitsverteilungen mit gleicher zentraler Tendenz: geringe Variabilität mittlere Variabilität
3) Lagemaße: Mittelwert, Median, Modus
Thema: Beschreibende Statistik LE.1: 40 min Seite 9 3) Lagemaße: Mittelwert, Median, Modus Lagemaße In der beschreibenden Statistik werden Daten erhoben. Diese Daten weisen eine bestimmte Verteilung auf.
Deskriptive Statistik Erläuterungen
Grundlagen der Wirtschaftsmathematik und Statistik Erläuterungen Lernmaterial zum Modul - 40601 - der Fernuniversität Hagen 7 2.1 Einfache Lageparameter aus einer gegebenen Messreihe ablesen Erklärung
Median 2. Modus < Median < Mittelwert. Mittelwert < Median < Modus. 2 Modalwerte oder Modus viel größer bzw. viel kleiner als Mittelwert
Universität Flensburg Zentrum für Methodenlehre Tutorium Statistik I Modus oder Modalwert (D) : - Geeignet für nominalskalierte Daten - Wert der häufigsten Merkmalsausprägung - Es kann mehrere Modalwerte
absolute Häufigkeit h: Anzahl einer bestimmten Note relative Häufigkeit r: Anzahl einer bestimmten Note, gemessen an der Gesamtzahl der Noten
Statistik Eine Aufgabe der Statistik ist es, Datenmengen zusammenzufassen und darzustellen. Man verwendet dazu bestimmte Kennzahlen und wertet Stichproben aus, um zu Aussagen bzw. Prognosen über die Gesamtheit
Welche der folgenden Aussagen sind richtig? (x aus 5) A Ein metrisches Merkmal, das überabzählbar viele Ausprägungen besitzt heißt diskret.
Grundlagen der Statistik 25.9.2014 7 Aufgabe 7 Welche der folgenden Aussagen sind richtig? (x aus 5) A Ein metrisches Merkmal, das überabzählbar viele Ausprägungen besitzt heißt diskret. B Ein Merkmal
Graphische Darstellung einer univariaten Verteilung:
Graphische Darstellung einer univariaten Verteilung: Die graphische Darstellung einer univariaten Verteilung hängt von dem Messniveau der Variablen ab. Bei einer graphischen Darstellung wird die Häufigkeit
Sommersemester Marktforschung
Dipl.-Kfm. Sascha Steinmann Universität Siegen Lehrstuhl für Marketing [email protected] Sommersemester 2010 Marktforschung Übungsaufgaben zu den Themen 3-6 mit Lösungsskizzen Aufgabe 1:
Statistik und Wahrscheinlichkeitsrechnung
Statistik und Wahrscheinlichkeitsrechnung Dr. Jochen Köhler 26.02.2008 1 Warum Statistik und Wahrscheinlichkeits rechnung im Ingenieurwesen? Zusammenfassung der letzten Vorlesung Statistik und Wahrscheinlichkeitsrechnung
Der Modus ist. Der Median ist. 3. Übung. Aufgabe 1. a) der häufigste Wert. b) der Wert unter dem 50 % aller anderen Werte liegen.
3. Übung Aufgabe 1 Der Modus ist a) der häufigste Wert. b) der Wert unter dem 50 % aller anderen Werte liegen. c) der Durchschnitt aller Werte. d) der Wert mit der größten Häufigkeitsdichte. e) der Schwerpunkt
Ü B U N G S S K R I P T S T A T I S T I K
Ü B U N G S S K R I P T S T A T I S T I K A. Ploner H. Strelec C. Yassouridis Universität für Bodenkultur Department für Raum, Landschaft und Infrastruktur Institut für Angewandte Statistik & EDV Peter-Jordan-Strasse
5 Exkurs: Deskriptive Statistik
5 EXKURS: DESKRIPTIVE STATISTIK 6 5 Ekurs: Deskriptive Statistik Wir wollen zuletzt noch kurz auf die deskriptive Statistik eingehen. In der Statistik betrachtet man für eine natürliche Zahl n N eine Stichprobe
Deskriptive Statistik Kapitel VI - Lage- und Streuungsparameter
Deskriptive Statistik Kapitel VI - Lage- und Streuungsparameter Georg Bol [email protected] Markus Höchstötter, [email protected] Agenda 1. Ziele 2. Lageparameter 3.
3 Lage- und Streuungsmaße
3 Lage- und Streuungsmaße 3.0 Kumulierte Häufigkeiten und empirische Verteilungsfunktion Grafische Darstellungen geben einen allgemeinen Eindruck der Verteilung eines Merkmals: Lage und Zentrum der Daten,
Herzlich willkommen zur Vorlesung Statistik. Streuungsmaße oder die Unterschiedlichkeit der Daten nebst kurzen Ausführungen zu Schiefe und Wölbung
FB 1 W. Ludwig-Mayerhofer Statistik 1 Herzlich willkommen zur Vorlesung Statistik smaße oder die Unterschiedlichkeit der Daten nebst kurzen Ausführungen zu Schiefe und Wölbung FB 1 W. Ludwig-Mayerhofer
Ermitteln Sie auf 2 Dezimalstellen genau die folgenden Kenngrößen der bivariaten Verteilung der Merkmale Weite und Zeit:
1. Welche der folgenden Kenngrößen, Statistiken bzw. Grafiken sind zur Beschreibung der Werteverteilung des Merkmals Konfessionszugehörigkeit sinnvoll einsetzbar? A. Der Modalwert. B. Der Median. C. Das
Lagemasse und Streuung
Lagemasse und Streuung Benjamin Schlegel 07. März 2016 Lagemasse sagen etwas über die Lage und das Zentrum der Daten aus, Streuungsmasse, wie die Daten um dieses Zentrum gestreut sind. Lagemasse Lagemasse
Statistische Kennzahlen für die Lage
Statistische Kennzahlen für die Lage technische universität ach der passenden grafischen Darstellung der Werte eines Merkmals auf der Gesamtheit der Beobachtungen interessieren jetzt geschickte algebraische
Statistik II: Grundlagen und Definitionen der Statistik
Medien Institut : Grundlagen und Definitionen der Statistik Dr. Andreas Vlašić Medien Institut (0621) 52 67 44 [email protected] Gliederung 1. Hintergrund: Entstehung der Statistik 2. Grundlagen
Deskriptivstatistik a) Univariate Statistik Weiters zum Thema der statistischen Informationsverdichtung
20 Weiters zum Thema der statistischen Informationsverdichtung M a ß z a h l e n Statistiken bei Stichproben Parameter bei Grundgesamtheiten Maßzahlen zur Beschreibung univariater Verteilungen Maßzahlen
Die erhobenen Daten werden zunächst in einer Urliste angeschrieben. Daraus ermittelt man:
Die erhobenen Daten werden zunächst in einer Urliste angeschrieben. Daraus ermittelt man: a) Die absoluten Häufigkeit: Sie gibt an, wie oft ein Variablenwert vorkommt b) Die relative Häufigkeit: Sie erhält
Beide Verteilungen der Zeiten sind leicht schief. Der Quartilsabstand für Zeiten zum Surfen ist kleiner als der zum Fernsehen.
Welche der folgenden Maßzahlen sind resistent gegenüber Ausreißer? Der Mittelwert und die Standardabweichung. Der und die Standardabweichung. Der und die Spannweite. Der und der Quartilsabstand. Die Spannweite
Lagemaße Übung. Zentrale Methodenlehre, Europa Universität - Flensburg
Lagemaße Übung M O D U S, M E D I A N, M I T T E L W E R T, M O D A L K L A S S E, M E D I A N, K L A S S E, I N T E R P O L A T I O N D E R M E D I A N, K L A S S E M I T T E Zentrale Methodenlehre, Europa
Lage- und Streuungsmaße
Statistik 1 für SoziologInnen Lage- und Streuungsmaße Univ.Prof. Dr. Marcus Hudec Streuungsmaße Statistische Maßzahlen, welche die Variabilität oder die Streubreite in den Daten messen. Sie beschreiben
Deskriptive Statistik II. Statistische Methoden in der Korpuslinguistik Heike Zinsmeister WS 2008/09
Deskriptive Statistik II Statistische Methoden in der Korpuslinguistik Heike Zinsmeister WS 2008/09 Übersicht Wiederholung Maße der zentralen Tendenz Streuungsmaße Zusammenfassung einer Verteilung tabellarisch
Kapitel 2. Mittelwerte
Kapitel 2. Mittelwerte Im Zusammenhang mit dem Begriff der Verteilung, der im ersten Kapitel eingeführt wurde, taucht häufig die Frage auf, wie man die vorliegenden Daten durch eine geeignete Größe repräsentieren
Karl Entacher. FH-Salzburg
Ahorn Versteinert [email protected] Statistik @ HTK Karl Entacher FH-Salzburg [email protected] Beispiel 3 Gegeben sind 241 NIR Spektren (Vektoren der Länge 223) zu Holzproben
4. Kumulierte Häufigkeiten und Quantile
4. Kumulierte Häufigkeiten und Quantile Statistik für SoziologInnen 1 4. Kumulierte Häufigkeiten und Quantile Kumulierte Häufigkeiten Oft ist man nicht an der Häufigkeit einzelner Merkmalsausprägungen
Mathematische Statistik. Zur Notation
Mathematische Statistik dient dazu, anhand von Stichproben Informationen zu gewinnen. Während die Wahrscheinlichkeitsrechnung Prognosen über das Eintreten zufälliger (zukünftiger) Ereignisse macht, werden
Beispiel 2 (Einige Aufgaben zu Lageparametern) Aufgabe 1 (Lageparameter)
Beispiel (Einige Aufgaben zu Lageparametern) Aufgabe 1 (Lageparameter) 1 Ein Statistiker ist zu früh zu einer Verabredung gekommen und vertreibt sich nun die Zeit damit, daß er die Anzahl X der Stockwerke
I.V. Methoden 2: Deskriptive Statistik WiSe 02/03
I.V. Methoden 2: Deskriptive Statistik WiSe 02/03 Vorlesung am 04.11.2002 Figures won t lie, but liars will figure. General Charles H.Grosvenor Dr. Wolfgang Langer Institut für Soziologie Martin-Luther-Universität
Thema: Mittelwert einer Häufigkeitsverteilung. Welche Informationen kann der Mittelwert geben?
Thema: Mittelwert einer Häufigkeitsverteilung Beispiel: Im Mittel werden deutsche Männer 75,1 Jahre alt; sie essen im Mittel pro Jahr 71 kg Kartoffel(-produkte) und trinken im Mittel pro Tag 0.35 l Bier.
Dr. Reinhard Vonthein, Dipl. Statistiker (Univ.)
Dr. Reinhard Vonthein, Dipl. Statistiker (Univ.) [email protected] Institut für Medizinische Biometrie und Statistik Universität zu Lübeck / Universitätsklinikums Schleswig-Holstein
Kapitel VI - Lage- und Streuungsparameter
Institut für Volkswirtschaftslehre (ECON) Lehrstuhl für Ökonometrie und Statistik Kapitel VI - Lage- und Streuungsparameter Deskriptive Statistik Prof. Dr. W.-D. Heller Hartwig Senska Carlo Siebenschuh
Statistische Methoden in den Umweltwissenschaften
Statistische Methoden in den Umweltwissenschaften Stetige und diskrete Wahrscheinlichkeitsverteilungen Lageparameter Streuungsparameter Diskrete und stetige Zufallsvariablen Eine Variable (oder Merkmal
Streuungsmaße Worum geht es in diesem Modul? Allgemeines zu Streuungsmaßzahlen Spannweite und Interquartilsabstand
Streuungsmaße Worum geht es in diesem Modul? Allgemeines zu Streuungsmaßzahlen Spannweite und Interquartilsabstand Berechnung der mittleren quadratischen Abweichung und der Varianz aus einer Urliste Standardabweichung
Maße der zentralen Tendenz
UStatistische Kennwerte Sagen uns tabellarische und graphische Darstellungen etwas über die Verteilung der einzelnen Werte einer Stichprobe, so handelt es sich bei statistischen Kennwerten um eine Kennzahl,
Inhaltsverzeichnis Grundlagen aufigkeitsverteilungen Maßzahlen und Grafiken f ur eindimensionale Merkmale
1. Grundlagen... 1 1.1 Grundgesamtheit und Untersuchungseinheit................ 1 1.2 Merkmal oder statistische Variable........................ 2 1.3 Datenerhebung.........................................
Die erhobenen Daten werden zunächst in einer Urliste angeschrieben. Daraus ermittelt man:
Die erhobenen Daten werden zunächst in einer Urliste angeschrieben. Daraus ermittelt man: a) Die absoluten Häufigkeit: Sie gibt an, wie oft ein Variablenwert vorkommt b) Die relative Häufigkeit: Sie erhält
