3 Lage- und Streuungsmaße

Größe: px
Ab Seite anzeigen:

Download "3 Lage- und Streuungsmaße"

Transkript

1 3 Lage- und Streuungsmaße

2 3.0 Kumulierte Häufigkeiten und empirische Verteilungsfunktion Grafische Darstellungen geben einen allgemeinen Eindruck der Verteilung eines Merkmals, u.a. von Lage und Zentrum der Daten, Streuung der Daten um dieses Zentrum, Schiefe / Symmetrie und Unimodalität / Multimodalität der Daten. Oft ist (zur weiteren Informationsverdichtung) die Beschreibung einer Verteilung durch eine bzw. wenige Maßzahlen gewünscht: Lagemaße sollen die zentrale Tendenz (das Zentrum) eines Merkmals beschreiben. Streuungsmaße beschreiben die Variabilität eines Merkmals. 3 Lage- und Streuungsmaße 89

3 Lagemaße beantworten Fragen über die Häufigkeitsverteilung wie: Wo liegen die meisten Beobachtungen? Wo liegt der Schwerpunkt einer Verteilung? Wo liegt die Mitte der Beobachtungen? Was ist eine typische Beobachtung? Bemerkungen: Es gibt nicht das Lagemaß schlechthin. Die unterschiedlichen Lagemaße sind je nach Situation unterschiedlich geeignet. Die Eignung ist insbesondere abhängig von der Datensituation und dem Skalenniveau. 3 Lage- und Streuungsmaße 90

4 3.1.1 Arithmetisches Mittel Definition 3.1. Sei x 1,...,x n die Urliste eines (mindestens) intervallskalierten Merkmals X. Dann heißt n x := 1 n i=1 x i das arithmetische Mittel der Beobachtungen x 1,...,x n. Bemerkungen: Das arithmetische Mittel ist also das Lagemaß, das typischerweise als Mittelwert oder Durchschnitt bezeichnet wird. Das arithmetische Mittel muss nicht mit einer der beobachteten Ausprägungen zusammenfallen. 3 Lage- und Streuungsmaße 91

5 Beispiel: Anzahl von Statistikbüchern, die ein Student besitzt (fiktiv). Person Anzahl der Bücher i x i x = 3 Lage- und Streuungsmaße 92

6 Alternative Berechnung basierend auf Häufigkeiten: Hat das MerkmalX die Ausprägungen a 1,...,a k und die (relative) Häufigkeitsverteilung h 1,...,h k bzw. f 1,...,f k, so gilt x = 1 n k a j h j = j=1 k a j f j. j=1 Im Beispiel: Häufigkeitstabelle: bzw Lage- und Streuungsmaße 93

7 Berechnung aus den Merkmalsausprägungen: x = 1 10 ( ) = Berechnung aus der Häufigkeitsverteilung: x = 1 n = k a j h j j=1 3 Lage- und Streuungsmaße 94

8 Beispiel: Einfacher Tabellenmietspiegel Nettomiete in Euro/qm (Fallzahlen) Wohnfläche Baujahr bis 50qm 51 bis 80qm 81qm und mehr bis (45) 7.88(164) 7.52(200) 7.83(409) 1919 bis (42) 6.87(94) 6.50(52) 6.78(188) 1949 bis (129) 7.84(237) 7.95(70) 8.21(436) 1966 bis (173) 7.97(313) 7.80(156) 8.49(642) 1981 bis (45) 9.53(162) 9.72(63) 9.75(270) 1996 bis (15) 10.28(58) 9.69(35) 10.14(108) 9.43(449) 8.20(1028) 7.93(576) 8.39(2053) 3 Lage- und Streuungsmaße 95

9 Beispiel: Augenfarbe h j 0: grün 2 1: grau 2 2: rot 0 3: blau 6 x = 3 Lage- und Streuungsmaße 96

10 Bemerkungen: Das arithmetische Mittel setzt zwingend ein intervallskaliertes Merkmal voraus. Auf einem niedrigerem Skalenniveau ist die Addition nicht erlaubt, und daher sind die entsprechenden Mittelwertsbildungen sinnlos und nicht interpretierbar (auch wenn sie das Software-Paket berechnet!). Einzige Ausnahme: Binäre Merkmale (mit nur zwei Ausprägungen), deren Ausprägungen als 0/1 kodiert werden. In diesem Fall kann das arithmetische Mittel als Anteil von Beobachtungen mit Ausprägung 1 interpretiert werden. 3 Lage- und Streuungsmaße 97

11 Transformationen Die Intervallskala erlaubt lineare Transformationen der Form a + bx, die Ratioskala Transformationen der Form b X, wobei a und b feste Konstanten sind. Aus der Urliste x 1,x 2,...,x n kann man eine Urliste, nämlich der transformierten Werte y 1,y 2,...,y n mit y i = ax i +b, i = 1,...,n bestimmen. Wie verändert sich das arithmetische Mittel bei diesen oder allgemeineren Transformationen? X Y = g(x)?? x ȳ 3 Lage- und Streuungsmaße 98

12 Beispiele Lineare Transformation Y = a X +b X jährliche Ausgaben von Studenten 2009 in Euro Y jährliche Ausgaben von Studierenden 2009 in DM ohne Studiengebühren Nichtlineare Transformation Beispiel: 3 quadratische Zimmer mit den Seitenlängen 7, 4 und 10m. Sei X die Seitenlänge, dann ist und es gilt Y = g(x) = X 2 die Zimmerfläche, x = ȳ = 3 Lage- und Streuungsmaße 99

13 Satz 3.2. Arithmetisches Mittel und lineare Transformationen. Gegeben sei die Urliste x 1,...,x n eines (mindestens) intervallskalierten Merkmals X. Betrachtet wird das (linear transformierte) Merkmal Y = a X +b und die zugehörigen Ausprägungen y 1,...,y n. Dann gilt: ȳ = a x+b. Beweis: Von der Urliste x 1...x n von X zur Urliste y 1...y n von Y übergehen. Dabei gilt für jedes i: y i = a x i +b. ȳ = 1 n y i = 1 n (a x i +b) = n n = i=1 i=1 3 Lage- und Streuungsmaße 100

14 Bemerkungen: Ist X verhältnisskaliert, so geht für b 0 der natürliche Nullpunkt für Y verloren. Der Satz gilt im Allgemeinen nur, falls die Transformation von X auf Y linear ist. Z.B. ist bei Y = X 2 im Allgemeinen ȳ ( x) 2 (wie im Beispiel gezeigt). 3 Lage- und Streuungsmaße 101

15 Weitere Eigenschaften des arithmetischen Mittels: x ist derjenige Wert, den jede Beobachtungseinheit erhielte, würde man die Gesamtsumme der Merkmalsausprägungen gleichmäßig auf alle Einheiten verteilen. x ist der Schwerpunkt der x 1,...,x n, d.h. es gilt: n (x i x) = 0 i=1 Vorstellung: Für jede Beobachtung i im Punkt x i Gewicht mit 1kg hinlegen Schwerpunkt 3 Lage- und Streuungsmaße 102

16 Die Schwerpunktseigenschaft macht auch deutlich, dass extrem große und kleine Werte außerordentliche Hebelwirkung haben: lässt man die Beobachtung 12 im Beispiel weg, dann gilt: x = 13 9 = Das arithmetische Mittel ist sehr ausreißeranfällig, d.h. ein falsch gemessener Wert kann den ganzen Mittelwert zerstören. Befürchtet man Ausreißer, so weicht man gelegentlich auf das sogenannte α- getrimmte Mittel aus, bei dem man die α% größten und kleinsten Werte (z.b. α=5) weglässt, meist verwendet man den sog. Median (s.u.). 3 Lage- und Streuungsmaße 103

17 Gruppierte Daten: Häufig hat man die Daten nur in gruppierter Form vorliegen. Wie lässt sich in diesem Fall ein sinnvoller Mittelwert definieren? Typisches Beispiel: Einkommensverteilung Anzahl h l 0 x < x < x < x < x < Lage- und Streuungsmaße 104

18 Definition 3.3. Sei X ein intervallskaliertes Merkmal, das in gruppierter Form mit k Klassen [c 0,c 1 ),[c 1,c 2 ),...,[c k 1,c k ] erhoben wurde. Mit h l, l = 1,...k, als absoluter Häufigkeit der l ten Klasse, f l als zugehöriger relativer Häufigkeit und m l := c l+c l 1 2 als der jeweiligen Klassenmitte definiert man als arithmetisches Mittel für gruppierte Daten x grupp := 1 n k h lm l = l=1 k f lm l. l=1 Im Beispiel: 3 Lage- und Streuungsmaße 105

19 Bemerkungen: Bei nach oben offener letzter Kategorie (Einkommen größer als 2250), wäre die Klassenmitte nicht definiert. Im Allgemeinen gilt x x grupp ; nur in Extremfällen, z.b. wenn das Merkmal in jeder Gruppe gleichmäßig verteilt ist, erhält man die Gleichheit. x grupp hängt von der Gruppenmitte und damit von der gewählten Gruppierung ab: Fasst man z.b. die ersten drei Gruppen und die letzten beiden jeweils zusammen, so erhält man h l 0 x < x < m l und x grupp = 1 n k h lm l l=1 3 Lage- und Streuungsmaße 106

20 Im Allgemeinen ist x grupp natürlich nur eine grobe Approximation an den echten, d.h. auf ungruppierten Daten beruhenden, Mittelwert. Eigentlich kann man nur mit Sicherheit folgende Abschätzung geben: Jeder in der l-ten Gruppe verdient mindestens c l 1 und höchstens c l. Damit ergibt sich als Abschätzung für das arithmetische Mittel 1 n k h l c l 1 x 1 n l=1 k h l c l l=1 Diese Abschätzung ist oft relativ grob. Andererseits ist sie aber oft das Beste, was man ohne unüberprüfbare Zusatzannahmen aus den Daten herausholen kann. Sind die ungruppierten Daten erhältlich, so ist x vorzuziehen, da jede Gruppierung Informationsverlust mit sich bringt. Andererseits sind gruppierte Daten leichter (und oft wahrheitsgetreuer) erhebbar. 3 Lage- und Streuungsmaße 107

21 Geschichtete Daten Insbesondere bei Tertiäranalysen hat man häufig nicht die Urliste zur Verfügung, sondern nur Mittelwerte x l in einzelnenschichtenl = 1,...,z, in diedie Grundgesamtheitzerlegt ist. X: Ω R x Ω 1 Ω 2. Ω z x 1 x 2 x z }? Beachte: hier wird nicht das Merkmal sondern die Grundgesamtheit in Gruppen eingeteilt. 3 Lage- und Streuungsmaße 108

22 Beispiel: x l Durchschnittseinkommen in den einzelnen Bundesländern (l = 1,...,16) x Durchschnittseinkommen in der BRD Mittelwert der Mittelwerte 1 z z l=1 x l???? 3 Lage- und Streuungsmaße 109

23 3.1.2 Median & Quantile Wie lässt sich ein Mittelwert bei ordinalskalierten Merkmalen definieren? Das arithmetische Mittel besitzt die Schwerpunkteigenschaft n (x i x) = 0. i=1 Eine andere mögliche Schwerpunkteigenschaft: Rechts und links des Mittelwerts liegen jeweils (mindestens) 50% der Daten. Dies ergibt den Median. 3 Lage- und Streuungsmaße 110

24 Definition 3.4. Gegeben sei die Urliste x 1,...,x n eines (mindestens) ordinalskalierten Merkmals X. Jede Zahl x med mit {i x i x med } n 0.5 und {i x i x med } n 0.5 heißt Median. Beispiel: Klausurnoten 1,1,1,..., 1 2,2,2,..., 2 3,3,3,..., 3 4,4,4,..., 4 5,5,5,..., 5 } {{ } } {{ } } {{ } } {{ } } {{ } 65 mal 96 mal 91 mal 78 mal 53 mal 17% 25,1% 23,8% 20,4% 13,8% 3 Lage- und Streuungsmaße 111

25 Verallgemeinerung: Quantile Gegeben sei die Urliste x 1,...,x n eines (mindestens) ordinalskalierten Merkmals X und eine Zahl 0 < α < 1. Jede Zahl x α mit {i x i x α } n α und {i x i x α } n 1 α heißt α 100%-Quantil. Spezielle Quantile: Median: x 0.5 = x med. Quartile: x 0.25, x Dezile: x 0.1, x 0.2,..., x 0.8, x 0.9. Beispiel Klausurnoten: x 0.25 = x 0.1 = 3 Lage- und Streuungsmaße 112

26 Bemerkungen: Alternative Definition des Medians über die geordnete Urliste x (1) x (2)... x (n) : ( ) 1 2 x x med := ( n 2 ) +x ( n 2 +1 ) für n gerade x ( n+1 für n ungerade 2 ) Ähnliche Definitionen sind für andere Quantile möglich. Diese Definition ist insofern inkonsequent, als sie auf die bei ordinalen Daten (streng genommen) nicht zulässige Additionen rekurriert. Bei intervallskalierten Daten hingegen spricht vieles für diese Definition: In Grenzfällen können Quantile im Sinne der ursprünglichen Definition nicht eindeutig sein. In vielen praktisch relevanten Fällen sind beide Definitionen miteinander verträglich. Für n ungerade fallen sie stets zusammen, für n gerade stimmen sie überein, falls x ( n 2 ) = x ( n 2 +1 ). 3 Lage- und Streuungsmaße 113

27 Quantile kann man einfach an der empirischen Verteilungsfunktion ablesen: α 1 α α xα 3 Lage- und Streuungsmaße 114

28 Bei linearer Interpolation für gruppierte intervallskalierte Merkmalen definiert man die Quartile analog über den Schnittpunkt mit der Verteilungsfunktion: α x α 3 Lage- und Streuungsmaße 115

29 Transformationen: Wie ändert sich der Median bei Transformation der Daten? Satz 3.5. Sei x 1,x 2,...,x n die Urliste eines (mindestens) ordinalskalierten Merkmals X, g eine streng monoton steigende Funktion und y 1 = g(x 1 ),...,y n = g(x n ) die Urliste des Merkmals Y = g(x). Dann gilt: y med = g(x med ). Merkmal X g streng monoton Merkmal Y x med g y med 3 Lage- und Streuungsmaße 116

30 Beispiel: Drei quadratische Zimmer Für die Merkmale X (Seitenlänge) und Y = f(x) = X 2 (Fläche) galt ja mit den Daten x 1 = 7, x 2 = 4, x 3 = 10 und y 1 = x 2 1 = 49 y 2 = x 2 2 = 16 y 3 = x 2 3 = Lage- und Streuungsmaße 117

31 Der Median ist wegen seiner Invarianz gegenüber beliebigen streng monotonen Transformationen ein geeignetes Lagemaß auch in allen Situationen, in denen es trotz Intervallskala keine natürliche Maßeinheit gibt Bei vielen Einstellungsmessungen nicht klar, ob man auf einer linearen oder auf einer logarithmischen Skala messen soll. Bei Geldbeträgen ist typischerweise der Nutzen eine nichtlineare Funktion des Geldbetrags: Unterschied zwischen 1000e und 2000e ist größer als zwischen e und e. Ist X das Bruttoeinkommen und Y = lnx Geldnutzen des Bruttoeinkommens, dann gilt y med = ln(x med ). Betrachtung von sogenannten Rangstatistiken, d.h. von Verfahren, die nicht den genauen Wert einer Beobachtung an sich verwenden, sondern nur den Rangplatz. ( Verteilungsfreie Verfahren ) 3 Lage- und Streuungsmaße 118

32 3.1.3 Modus Gesucht: geeignetes Lagemaß bei auf Nominalskala gemessenen Daten Der exakte Wert der als Merkmalsausprägungen vergebenen Zahlen ist inhaltlich völlig bedeutungslos, d.h, etwas formaler: beliebige eineindeutige Transformationen verändern die inhaltliche Aussage nicht (z.b. Parteienpräferenz: ob man die Partei alphabetisch durchnummeriert oder anhand ihrer Stimmenanteile bei der letzten Wahl ändert nichts). Als Lagemaß dient der häufigste Wert: genauer die Ausprägung a j mit der größten Häufigkeit h j. Definition 3.6. Sei x 1,...,x n die Urliste eines nominalskalierten Merkmals mit den Ausprägungen a 1,...,a k und der Häufigkeitsverteilung h 1,...,h k, so heißt a j Modus x mod genau dann, wenn h j h j, für alle j = 1,...,k. 3 Lage- und Streuungsmaße 119

33 Bemerkungen: Der Modus wird auch als Modalwert bezeichnet. Existieren mehrere Ausprägungen mit der gleichen größten Häufigkeit, so ist der Modus nicht eindeutig. Der Modus unter beliebigen eineindeutigen Transformationen erhalten: Betrachtet man das Merkmal X, eine eineindeutige Transformation g und das Merkmal Y = g(x), so gilt y mod = g(x mod ). Merkmal X g eineindeutig Merkmal Y Modus x mod g Modus y mod 3 Lage- und Streuungsmaße 120

34 3.1.4 Vergleich der Lagemaße Bei intervallskalierten Daten darf man auch den Modus oder den Median anwenden, man verschenkt (bei alleiniger Verwendung) aber eventuell Information. Der Median geht nur auf die Ordnung der Beobachtungen und nicht auf die Abstände ein, der Modus gibt nur die am stärksten vertretende Ausprägung an. Anschaulich gesprochen ist der Median der mittlere Wert, was oft umgangssprachlich auch als Mittelwert bezeichnet wird. Vorsicht bei nicht statistischen Veröffentlichungen! Median und Modus sind unempfindlich gegenüber Ausreißern. 3 Lage- und Streuungsmaße 121

35 Beispiel: Einkommensverteilung Wird die größte Beobachtung verhundertfacht, so ändern sich Median und Modus nicht, das arithmetische Mittel reagiert dagegen stark. Generell ist bei der Betrachtung von Einkommen das arithmetische Mittel meist deutlich größer als der Median: Laut dem dritten Armuts- und Reichtumsbericht der Bundesregierung (2008) ist für das reale Bruttojahreseinkommen aus unselbstständiger Arbeit unter den Vollbeschäftigten für 2005 das arithmetisches Mittel der Median Lage- und Streuungsmaße 122

36 Beispiel: Statistikbücher. Häufigkeitsverteilung und zur graphischen Veranschaulichung ein maßstabtreues Pseudostabdiagramm : Häufigkeiten a 1 = 0 h 1 = 2 a 2 = 1 h 2 = 2 a 3 = 2 h 3 = 4 a 4 = 3 h 4 = 1 a 5 = 12 h 5 = Mittelwert x=2.5 x 0.25 =1 Median x med =2 x 0.75 =2 3 Lage- und Streuungsmaße 123

37 Allgemeiner gilt: Die relative Lage von x,x med,x mod zueinander kann zur Charakterisierung von Verteilungen herangezogen werden: symmetrisch: x x med x mod linkssteil: x > x med > x mod rechtssteil: x < x med < x mod x = 3.57 x med = 3 x mod = 2 3 Lage- und Streuungsmaße 124

38 x = 5 x med = 5 x mod = 5 x = 6.43 x med = 7 x mod = 8 3 Lage- und Streuungsmaße 125

39 Exkurs: Lagemaße als Lösung eines Optimierungsproblems Gegeben sei die Urliste x 1,...,x n eines intervallskalierten Merkmals X, die zu einer Zahl a zusammengefasst werden soll. Man könnte sagen, der beste Wert a ist derjenige, der den Gesamtabstand zwischen a und den Daten minimiert. Misst man den Abstand quadratisch (x a ) 2 so ergibt sich a = x linear durch den Absolutbetrag x a so ergibt sich a = x med Für alle anderen Werte a R gilt: n (x i x) 2 i=1 n (x i a) 2, i=1 n i=1 x i x med n x i a. i=1 3 Lage- und Streuungsmaße 126

40 3.1.5 Geometrisches Mittel Sei Ω = {0,...,n} eine Menge von Zeitpunkten und B(i) =: b i ein zum Zeitpunkt i erhobenes Merkmal, z.b. das Bruttosozialprodukt. Für i = 1,...,n heißt der i-te Wachstumsfaktor und x i = b i b i 1 die i-te Wachstumsrate. r i = b i b i 1 b i 1 = x i 1 Man nennt x geom := ( n i=1 x i )1 n = (x 1 x 2... x n ) 1 n das geometrische Mittel der Wachstumsfaktoren x 1,...,x n. 3 Lage- und Streuungsmaße 127

41 Beispiel : Wirtschaftwachstum gemessen zu drei Zeitpunkten. i b i x i r i Geometrisches Mittel der Wachstumsfaktoren: x geom = ( n i=1 x i )1 n = (x 1 x 2 ) 1 2 = = Lage- und Streuungsmaße 128

42 Bemerkungen: Es gilt b n = b 0 ( x geom ) n d.h. x geom ist tatsächlich ein durchschnittlicher Wachstumsfaktor, nämlich derjenige Wert, der sich aus b n und b 0 ergäbe, wenn zu allen Zeitpunkten konstantes Wachstum geherrscht hätte. Das geometrische Mittel kann auch zur Prognose (unter der Stabilitätsannahme, dass das durchschnittliches Wachstum gleich bleibt) verwendet werden: b n+q = b n ( x geom ) q, q N. 3 Lage- und Streuungsmaße 129

43 Logarithmieren liefert: ln x geom = 1 n n lnx i. i=1 Das geometrische Mittel ist also ein arithmetisches Mittel auf der logarithmierten Skala. Man kann zeigen: x geom x i.a. würde also die Angabe von x zu hohe Wachstumsraten vortäuschen. 3 Lage- und Streuungsmaße 130

44 3.1.6 Harmonisches Mittel Beispiel: Die Entfernung von A nach B sei 99 km. Herr K. humpelt von A nach B mit konstant 1 km/h und fährt zurück mit konstant 99 km/h. Wie groß ist seine Durchschnittsgeschwindigkeit? Die naive Lösung: 50 km/h ist falsch! Durchschnittsgeschwindigkeit = zurückgelegter Weg Zeit = 198 km 100 h = 1.98 km/h Allgemein: Sei x 1,...,x n mit x i 0 für alle i die Urliste eines verhältnisskalierten Merkmals X. Dann heißt 1 x har := 1 n n i=1 1 x i das harmonische Mittel der Werte x 1,...,x n. 3 Lage- und Streuungsmaße 131

45 3.2 Streuungsmaße 3.2 Streuungsmaße Eine Verteilung ist durch die Angabe von einem oder mehreren Lagemaßen nur unzureichend beschrieben. Beispiel: Häufigkeitsverteilungen mit gleicher zentraler Tendenz: geringe Variabilität mittlere Variabilität große Variabilität Lage- und Streuungsmaße 132

46 Streuungsmaße beantworten Fragen wie 3.2 Streuungsmaße Wie groß ist die durchschnittliche Abweichung vom Mittelwert? Über welchen Bereich erstrecken sich die Beobachtungen? Wie stark schwanken die Beobachtungen? Bemerkung: Von Streuung im eigentlichen Sinne kann man nur bei mindestens intervallskalierten Daten sprechen, da nur dort Abstände interpretierbar sind. (Es gibt verschiedene Versuche, ein analoges Konzept für ordinal skalierte Daten zu definieren, aber bisher hat sich keine dieser Definitionen durchgesetzt.) 3 Lage- und Streuungsmaße 133

47 3.2.1 Varianz und Standardabweichung 3.2 Streuungsmaße Sei x 1,...,x n die Urliste eines intervallskalierten Merkmals X. Dann heißt s 2 X := 1 n n (x i x) 2 i=1 die (empirische) Varianz oder Stichprobenvarianz und s X := s 2 X die empirische Streuung, Stichprobenstreuung oder Standardabweichung von X. 3 Lage- und Streuungsmaße 134

48 Bemerkungen: 3.2 Streuungsmaße Die Varianz misst die durchschnittliche quadrierte Abweichung vom Mittelwert. Vorsicht: Der Begriff Streuung wird in einem doppelten Sinne gebraucht: Allgemein als Phänomen generell ( wir suchen nach Maßzahlen zur Beschreibung der Streuung der Daten ), andererseits als eine bestimmte Maßzahl für das Problem. Durch das Quadrieren tragen negative und positive Abweichungen vom Mittelwert gleichermaßen zur Varianz bei. Die Varianz besitzt im Vergleich zum Merkmal X die quadrierte Einheit. Sie ist daher unanschaulicher zu interpretieren, besitzt aber andererseits viele mathematische Vorzüge. Die Standardabweichung wird in der gleichen Einheit gemessen wie X. 3 Lage- und Streuungsmaße 135

49 3.2 Streuungsmaße Sind die Ausprägungen a 1,...,a k mit (relativer) Häufigkeitsverteilung h 1,...,h k bzw. f 1,...,f k gegeben, so gilt s 2 X = 1 n k h j (a j x) 2 = j=1 = k f j (a j x) 2. j=1 Ist aus dem Kontext klar ersichtlich welches Merkmal betrachtet wird, so lässt man das X in der Notation auch häufig weg, schreibt also einfach s 2 und s. 3 Lage- und Streuungsmaße 136

50 Beispiel: Statistikbücher. 3.2 Streuungsmaße Häufigkeiten a 1 = 0 h 1 = 2 a 2 = 1 h 2 = 2 a 3 = 2 h 3 = 4 a 4 = 3 h 4 = 1 a 5 = 12 h 5 = Mittelwert x=2.5 x 0.25 =1 Median x med =2 x 0.75 =2 3 Lage- und Streuungsmaße 137

51 Berechnung der Varianz über die ursprüngliche Formel: 3.2 Streuungsmaße s 2 = 1 n n (x i x) 2 = i=1 = 1 10 ((0 2.5)2 +(0 2.5) 2 +(1 2.5) 2 +(1 2.5) 2 +(2 2.5) 2 +(2 2.5) 2 +(2 2.5) 2 +(2 2.5) 2 +(3 2.5) 2 +(12 2.5) 2 ) = = Lage- und Streuungsmaße 138

52 Berechnung über die Häufigkeitsverteilung: 3.2 Streuungsmaße j a j h j (a j x) (a j x) 2 (a j x) 2 h j = Summe 10 n s 2 = = s 2 = Standardabweichung: s = (Einheit: Bücher) 3 Lage- und Streuungsmaße 139

53 3.2 Streuungsmaße Transformationen: Wie ändert sich die Varianz bei (linearer) Transformation eines Merkmals? Satz 3.7. Sei x 1,...,x n die Urliste eines mindestens intervallskalierten Merkmals X mit s X > 0 und y 1,...,y n die zugehörige Urliste des Merkmals Y = a X +b. Dann gilt s 2 Y = a 2 s 2 X und s Y = a s X. 3 Lage- und Streuungsmaße 140

54 Bemerkungen: 3.2 Streuungsmaße Eine spezielle Transformation, die sogenannte Standardisierung, ist der Übergang zum Merkmal Z mit z i := x i x s X. Z besitzt arithmetisches Mittel 0 und (empirische) Varianz 1. Man erzeugt damit in gewisser Weise eine natürlich Skala. Begründung: z i lässt sich darstellen als z i = x i x s X = 1 s X x i + Anwendung der Transformationsregeln ( x ) s X 3 Lage- und Streuungsmaße 141

55 Verschiebungssatz: Es gilt 3.2 Streuungsmaße s 2 X = 1 n n x 2 i i=1 ( 1 n ) 2 n x i = x 2 ( x) 2. i=1 Achtung (sehr häufige Fehlerquelle): Der Verschiebungssatz ist sehr bequem zum Berechnen der Varianz. Allerdings können bei sehr großen Ausprägungen beim Verwenden von Taschenrechnern starke Rundungsfehler auftreten, die das Ergebnis eventuell verfälschen. Für Aufgaben von Klausurlänge aber den Verschiebungssatz verwenden! 3 Lage- und Streuungsmaße 142

56 Beispiel: Statistikbücher. Berechne die empirische Varianz mit Hilfe des Verschiebungssatzes. Anzahl Bücher: X Person i x i x 2 i Summe 25 Mittelwert 3.2 Streuungsmaße s 2 X = x 2 ( x) 2 = 17.1 (2.5) 2 = 10.85, s X = Lage- und Streuungsmaße 143

57 3.2 Streuungsmaße Varianzzerlegung / Streuungszerlegung: Varianz bei geschichteten Daten. Zur Erinnerung: Daten liegen oft in Schichten vor (v.a. bei Sekundär- und Tertiärerhebungen). Beispiel: Daten über Einkommensverteilung geschichtet nach Bundesland. Bei der Berechnung von x waren die einzelnen Besetzungszahlen sehr wichtig. Schicht 1,...,l,...,z Besetzungszahlen n 1,...,n l,...,n z ; Mittelwerte x 1,..., x l,..., x z z n l = n l=1 Varianzen s 2 1,..., s 2 l,..., s2 z Für das arithmetische Mittel gilt x = 1 n z n l x l. l=1 3 Lage- und Streuungsmaße 144

58 Seien nun sowie s 2 innerhalb := 1 z n l s 2 l n l=1 s 2 zwischen := 1 z n l ( x l x) 2 n l=1 3.2 Streuungsmaße s 2 innerhalb : durchschnittliche Varianz innerhalb der Schichten s 2 zwischen : Varianz der Durchschnittswerte zwischen den Schichten an. Wann ist s 2 zwischen = 0? s 2 innerhalb = 0? Wie setzt sich die Gesamtvarianz aus den beiden Bestandteilen zusammen? 3 Lage- und Streuungsmaße 145

59 Varianzzerlegung Es gilt 3.2 Streuungsmaße Gesamtvarianz = Varianz in. d. Schichten + Varianz zw. d. Schichten s 2 = Bemerkungen: Im Detail gilt also mit den Urlisten {x 1l,x 2l,...,x nl l} in Schicht l,l = 1,...,z, 1 n n z l ( (x il x) 2 ) = 1 n l=1 i=1 n z l (x il x l ) n l=1 i=1 z n l ( x l x) 2. l=1 Diese Zerlegungsmöglichkeit gilt nur für Varianzen, nicht aber für andere Streuungsmaße. Letztendlich ist sie der Grund für die Beliebtheit der Varianz trotz anderer Unannehmlichkeiten. Deshalb sollte man eher von der Varianzzerlegung als von der Streuungszerlegung sprechen. Bei vielen Verfahren werden Streuungszerlegungen betrachtet; dies ist ein ganz grundlegendes Prinzip in der Statistik. 3 Lage- und Streuungsmaße 146

60 Interpretation der Varianzzerlegung 3.2 Streuungsmaße Beispiel: Einkommen der einzelnen Bundesländer: Die Wichtigkeit (Erklärungskraft) der schichtbildenden Variable kann bewertet werden: je größer s 2 zwischen im Vergleich zu s2 bzw. s 2 innerhalb ist, desto mehr Variation wird durch die Schichtungsvariable erklärt. Was bedeutet: s 2 zwischen groß im Vergleich zu s2 innerhalb? 3 Lage- und Streuungsmaße 147

61 Korrigierte empirische Varianz: 3.2 Streuungsmaße Neben der empirischen Varianz existiert noch eine alternative Definition der Varianz, die korrigierte empirische Varianz. Sei x 1,...,x n die Urliste eines intervallskalierten Merkmals X. Dann heißt s 2 X := 1 n 1 n (x i x) 2 i=1 die korrigierte empirische Varianz oder korrigierte Stichprobenvarianz von X. 3 Lage- und Streuungsmaße 148

62 Bemerkungen: 3.2 Streuungsmaße 1 Der Sinn des Vorfaktors n 1 wird erst in Statistik II deutlich: s2 X schönere Eigenschaften als s 2 X. hat theoretisch Für großen Stichprobenumfang n nähern sich s 2 X und s2 X an, weil dann n 1 n. Auch für die korrigierte Varianz gilt die Aussage zu linearen Transformationen, d.h. ist x 1,...,x n die Urliste eines mindestens intervallskalierten Merkmals X mit s X > 0 und y 1,...,y n die zugehörige Urliste des Merkmals Y = a X +b. Dann gilt s 2 Y = a 2 s 2 X. 3 Lage- und Streuungsmaße 149

63 3.2.2 Weitere Streuungsmaße 3.2 Streuungsmaße Variationskoeffizient: Definition 3.8. Ist x > 0, so heißt die Größe v X := s X x Variationskoeffizient des Merkmals X. Bemerkungen: Gemessen wird hier die Streuung relativ zum Mittelwert. Insbesondere ist v X dimensionslos. Der Variationskoeffizient erlaubt beispielsweise auch den Vergleich der Streuung von Preisen, die in verschiedenen Währungen gemessen wurden. 3 Lage- und Streuungsmaße 150

64 Inter-Quartils-Abstand: Sind x 0.25 und x 0.75 das obere und das untere Quartil eines Merkmals, so heißt 3.2 Streuungsmaße d QX := x 0.75 x 0.25 der Interquartilsabstand. Median-Absolute-Deviation: Der Median der Werte x i x med, i = 1,...,n heißt Median-Absolute-Deviation von X (MAD X ). Spannweite: Die Größe heißt Spannweite von X. R X := x (n) x (1) 3 Lage- und Streuungsmaße 151

65 Bemerkungen 3.2 Streuungsmaße Alle betrachteten Streuungsmaße sind nur für (mindestens) intervallskalierte Merkmalse sinnvoll definiert, da sie auf Abständen (typischerweise dem Abstand der Beobachtungen zu einem Lagemaß) beruhen. s 2, s, s 2, s sind die gebräuchlichsten Streuungsmaße. s 2, s, s 2, s sind sehr empfindlich gegenüber Ausreißern! Das Gleiche gilt für die Spannweite R. MAD und d Q hingegen entstammen der sogenannten robusten Statistik, die sich um ausreißerresistente Methoden bemüht. Gilt x 1 = x 2 =... = x n, so weisen alle Streungsmaße den Wert 0 auf. Mit Ausnahme von d Q gilt auch die Umkehrung: Sind die Steuungsmaße (außer eben d Q ) = 0, so sind alle Werte der Urliste gleich. Eine häufige Ursache für Verwirrung und Missverständnisse liegt darin, dass der Begriff Streuung in der Statistik in einem doppelten Sinn gebraucht wird: in einem allgemeinen Sinn: Streuung als Phänomen ( Die Daten streuen stark ). in einem speziellen Sinn: als eine Maßzahl für dieses Phänomen. 3 Lage- und Streuungsmaße 152

66 Beispiel: Statistikbücher Ausprägungen h j Streuungsmaße v X = s X / x = 3.29/2.5 = Dimensionslos, normiert x 0.25 = 1 x 0.75 = 2 d QX = 1. R X = Lage- und Streuungsmaße 153

67 Ziele: 3.3 Box-Plot 3.3 Box-Plot einfache Darstellung von Verteilungen und ihrer Kennzahlen Identifikation von potentiellen Ausreißern nicht ausreißeranfällige Meßzahlen verwenden. Idee: i) markiere den Median ii) symbolisiere Lage der mittleren Werte durch eine Box iii) wie weit reichen weitere nicht atypische Werte iv) identifiziere potentielle Ausreißer: atypische (ungewöhnlich große, ungewöhnlich kleine) Werte, die genauerer Untersuchung bedürfen 3 Lage- und Streuungsmaße 154

68 3.3 Box-Plot zu ii) wähle mittlere 50%: Box hat Länge dq = x 0.75 x 0.25 zu iii) als nicht atypisch gelten alle Werte, die nicht weiter als 1.5dQ von der Box entfernt sind Also bestimme: x 0.25, x 0.50, x Interquartilsabstand: d QX = x 0.75 x 0.25 Zäune z u,z o, die am kleinsten bzw. größten Datenpunkt im Bereich x d QX ; x d QX liegen. Ausserhalb der Zäune werden alle Punkte eingezeichnet; sie sind ausreißerverdächtig. 3 Lage- und Streuungsmaße 155

69 Bemerkungen : 3.3 Box-Plot Der Box-Plot gibt einen kompakten Überblick über die Form der Verteilung (Zentrale Tendenz, Variabilität, Schiefe, extreme Werte). Vorsicht bei der Anwendung von Software! Vor allem außerhalb der Box sind auch andere Darstellungen üblich (z.b. Zäune immer bis x (1) und x (n) ). Toutenburg (2002) beispielsweise unterscheidet zwischen Ausreißern (1.5 d QX bis 3 d QX von Rändern der Box entfernt) und Extremwerten (mehr als 3 d QX vom Rand entfernt). Oft wird der Median durch einen dicken Punkt ausgedrückt. 3 Lage- und Streuungsmaße 156

70 3.3 Box-Plot Box-Plots können auch zum graphischen Vergleich von Verteilungen verwendet werden: 3 Lage- und Streuungsmaße 157

3.2 Streuungsmaße. 3 Lage- und Streuungsmaße 133. mittlere Variabilität. geringe Variabilität. große Variabilität 0.0 0.1 0.2 0.3 0.4 0.

3.2 Streuungsmaße. 3 Lage- und Streuungsmaße 133. mittlere Variabilität. geringe Variabilität. große Variabilität 0.0 0.1 0.2 0.3 0.4 0. Eine Verteilung ist durch die Angabe von einem oder mehreren Mittelwerten nur unzureichend beschrieben. Beispiel: Häufigkeitsverteilungen mit gleicher zentraler Tendenz: geringe Variabilität mittlere Variabilität

Mehr

(x i x) 2. (x i a) 2, x i x med. x i a. i=1. 3 Lage- und Streuungsmaße 134

(x i x) 2. (x i a) 2, x i x med. x i a. i=1. 3 Lage- und Streuungsmaße 134 Lagemaße als Lösung eines Optimierungsproblems 3.1 Lagemaße Gegeben sei die Urliste x 1,...,x n eines intervallskalierten Merkmals X, die zu einer Zahl a zusammengefasst werden soll. Man könnte sagen,

Mehr

3 Lage- und Streuungsmaße

3 Lage- und Streuungsmaße 3 Lage- und Streuungsmaße Grafische Darstellungen geben einen allgemeinen Eindruck der Verteilung eines Merkmals, u.a. von Lage und Zentrum der Daten, Streuung der Daten um dieses Zentrum, Schiefe / Symmetrie

Mehr

3 Lage- und Streuungsmaße

3 Lage- und Streuungsmaße 3 Lage- und Streuungsmaße 3.0 Kumulierte Häufigkeiten und empirische Verteilungsfunktion Grafische Darstellungen geben einen allgemeinen Eindruck der Verteilung eines Merkmals: Lage und Zentrum der Daten,

Mehr

Kapitel 5 Kenngrößen empirischer Verteilungen 5.1. Lagemaße. x mod (lies: x-mod) Wofür? Lageparameter. Modus/ Modalwert Zentrum. Median Zentralwert

Kapitel 5 Kenngrößen empirischer Verteilungen 5.1. Lagemaße. x mod (lies: x-mod) Wofür? Lageparameter. Modus/ Modalwert Zentrum. Median Zentralwert Kapitel 5 Kenngrößen empirischer Verteilungen 5.1. Lagemaße Wofür? Lageparameter Modus/ Modalwert Zentrum Median Zentralwert Im Datensatz stehende Informationen auf wenige Kenngrößen verdichten ermöglicht

Mehr

a 1 < a 2 <... < a k. 2 Häufigkeitsverteilungen 52

a 1 < a 2 <... < a k. 2 Häufigkeitsverteilungen 52 2 Häufigkeitsverteilungen 2.0 Grundbegriffe Ziel: Darstellung bzw. Beschreibung (Exploration) einer Variablen. Ausgangssituation: An n Einheiten ω 1,..., ω n sei das Merkmal X beobachtet worden. x 1 =

Mehr

Das harmonische Mittel

Das harmonische Mittel Das harmonische Mittel x H := 1 1 n n 1 x i Das harmonische Mittel entspricht dem Mittel durch Transformation t 1 t Beispiel: x 1,..., x n Geschwindigkeiten, mit denen konstante Wegstrecken l zurückgelegt

Mehr

Der Mittelwert (arithmetisches Mittel)

Der Mittelwert (arithmetisches Mittel) Der Mittelwert (arithmetisches Mittel) x = 1 n n x i bekanntestes Lagemaß instabil gegen extreme Werte geeignet für intervallskalierte Daten Deskriptive Statistik WiSe 2015/2016 Helmut Küchenhoff (Institut

Mehr

Weitere Lagemaße: Quantile/Perzentile I

Weitere Lagemaße: Quantile/Perzentile I 3 Auswertung von eindimensionalen Daten Lagemaße 3.3 Weitere Lagemaße: Quantile/Perzentile I Für jeden Median x med gilt: Mindestens 50% der Merkmalswerte sind kleiner gleich x med und ebenso mindestens

Mehr

Statistik K urs SS 2004

Statistik K urs SS 2004 Statistik K urs SS 2004 3.Tag Grundlegende statistische Maße Mittelwert (mean) Durchschnitt aller Werte Varianz (variance) s 2 Durchschnittliche quadrierte Abweichung aller Werte vom Mittelwert >> Die

Mehr

Kapitel 2. Häufigkeitsverteilungen

Kapitel 2. Häufigkeitsverteilungen 6 Kapitel 2 Häufigkeitsverteilungen Ziel: Darstellung bzw Beschreibung (Exploration) einer Variablen Ausgangssituation: An n Einheiten ω,, ω n sei das Merkmal X beobachtet worden x = X(ω ),, x n = X(ω

Mehr

Mathematische Statistik. Zur Notation

Mathematische Statistik. Zur Notation Mathematische Statistik dient dazu, anhand von Stichproben Informationen zu gewinnen. Während die Wahrscheinlichkeitsrechnung Prognosen über das Eintreten zufälliger (zukünftiger) Ereignisse macht, werden

Mehr

Verfahren für metrische Variable

Verfahren für metrische Variable Verfahren für metrische Variable Grafische Methoden Histogramm Mittelwertsplot Boxplot Lagemaße Mittelwert, Median, Quantile Streuungsmaße Standardabweichung, Interquartilsabstand Lagemaße und Streumaße

Mehr

Kapitel 3: Lagemaße. Ziel. Komprimierung der Daten zu einer Kenngröße, welche die Lage, das Zentrum der Daten beschreibt

Kapitel 3: Lagemaße. Ziel. Komprimierung der Daten zu einer Kenngröße, welche die Lage, das Zentrum der Daten beschreibt Kapitel 3: Lagemaße Ziel Komprimierung der Daten zu einer Kenngröße, welche die Lage, das Zentrum der Daten beschreibt Dr. Matthias Arnold 52 Definition 3.1 Seien x 1,...,x n Ausprägungen eines kardinal

Mehr

Statistische Grundlagen I

Statistische Grundlagen I Statistische Grundlagen I Arten der Statistik Zusammenfassung und Darstellung von Daten Beschäftigt sich mit der Untersuchung u. Beschreibung von Gesamtheiten oder Teilmengen von Gesamtheiten durch z.b.

Mehr

Kapitel 1 Beschreibende Statistik

Kapitel 1 Beschreibende Statistik Beispiel 1.25: fiktive Aktienkurse Zeitpunkt i 0 1 2 Aktienkurs x i 100 160 100 Frage: Wie hoch ist die durchschnittliche Wachstumsrate? Dr. Karsten Webel 53 Beispiel 1.25: fiktive Aktienkurse (Fortsetzung)

Mehr

Einführung in Quantitative Methoden

Einführung in Quantitative Methoden Einführung in Quantitative Methoden Mag. Dipl.Ing. Dr. Pantelis Christodoulides & Mag. Dr. Karin Waldherr SS 2014 Christodoulides / Waldherr Einführung in Quantitative Methoden- 2.VO 1/57 Die Deskriptivstatistik

Mehr

Die erhobenen Daten werden zunächst in einer Urliste angeschrieben. Daraus ermittelt man:

Die erhobenen Daten werden zunächst in einer Urliste angeschrieben. Daraus ermittelt man: Die erhobenen Daten werden zunächst in einer Urliste angeschrieben. Daraus ermittelt man: a) Die absoluten Häufigkeit: Sie gibt an, wie oft ein Variablenwert vorkommt b) Die relative Häufigkeit: Sie erhält

Mehr

Die erhobenen Daten werden zunächst in einer Urliste angeschrieben. Daraus ermittelt man:

Die erhobenen Daten werden zunächst in einer Urliste angeschrieben. Daraus ermittelt man: Die erhobenen Daten werden zunächst in einer Urliste angeschrieben. Daraus ermittelt man: a) Die absoluten Häufigkeit: Sie gibt an, wie oft ein Variablenwert vorkommt b) Die relative Häufigkeit: Sie erhält

Mehr

Lösung Aufgabe 19. ( ) = [Mio Euro]. Empirische Varianz s 2 = 1 n

Lösung Aufgabe 19. ( ) = [Mio Euro]. Empirische Varianz s 2 = 1 n Statistik I für Statistiker, Mathematiker und Informatiker Lösungen zu Blatt 4 Gerhard Tutz, Jan Ulbricht, Jan Gertheiss WS 07/08 Lösung Aufgabe 9 (a) Lage und Streuung: Arithmetisches Mittel x = n i=

Mehr

4 Konzentrationsmessung

4 Konzentrationsmessung 4 Konzentrationsmessung 4.0 Vorbemerkungen 4.0 Vorbemerkungen Konzentration: Ausmaß der Ballung von großen Anteilen an der gesamten Merkmalssumme auf wenige Einheiten. welchen Anteil am Gesamtvermögen

Mehr

Deskriptive Statistik

Deskriptive Statistik Deskriptive Statistik Deskriptive Statistik: Ziele Daten zusammenfassen durch numerische Kennzahlen. Grafische Darstellung der Daten. Quelle: Ursus Wehrli, Kunst aufräumen 1 Modell vs. Daten Bis jetzt

Mehr

Eine zweidimensionale Stichprobe

Eine zweidimensionale Stichprobe Eine zweidimensionale Stichprobe liegt vor, wenn zwei qualitative Merkmale gleichzeitig betrachtet werden. Eine Urliste besteht dann aus Wertepaaren (x i, y i ) R 2 und hat die Form (x 1, y 1 ), (x 2,

Mehr

3) Lagemaße: Mittelwert, Median, Modus

3) Lagemaße: Mittelwert, Median, Modus Thema: Beschreibende Statistik LE.1: 40 min Seite 9 3) Lagemaße: Mittelwert, Median, Modus Lagemaße In der beschreibenden Statistik werden Daten erhoben. Diese Daten weisen eine bestimmte Verteilung auf.

Mehr

6 Korrelations- und Regressionsanalyse: Zusammenhangsanalyse stetiger Merkmale

6 Korrelations- und Regressionsanalyse: Zusammenhangsanalyse stetiger Merkmale 6 Korrelations- und Regressionsanalyse: Zusammenhangsanalyse stetiger Merkmale 397 6.1 Korrelationsanalyse Jetzt betrachten wir bivariate Merkmale (X, Y ), wobei sowohl X als auch Y stetig bzw. quasi-stetig

Mehr

Deskriptive Statistik Kapitel IX - Kontingenzkoeffizient

Deskriptive Statistik Kapitel IX - Kontingenzkoeffizient Deskriptive Statistik Kapitel IX - Kontingenzkoeffizient Georg Bol bol@statistik.uni-karlsruhe.de Markus Höchstötter hoechstoetter@statistik.uni-karlsruhe.de Agenda 1. Untersuchung der Abhängigkeit 2.

Mehr

W-Seminar: Versuche mit und am Menschen 2017/2019 Skript

W-Seminar: Versuche mit und am Menschen 2017/2019 Skript 3. Deskriptive Statistik Die deskriptive (auch: beschreibende) Statistik hat zum Ziel, [ ] Daten durch Tabellen, Kennzahlen [ ] und Grafiken übersichtlich darzustellen und zu ordnen. Dies ist vor allem

Mehr

Einführung in Quantitative Methoden

Einführung in Quantitative Methoden Einführung in Quantitative Methoden Mag. Dipl.Ing. Dr. Pantelis Christodoulides & Mag. Dr. Karin Waldherr SS 2011 Christodoulides / Waldherr Einführung in Quantitative Methoden- 2.VO 1/62 Summenzeichen

Mehr

Deskriptive Statistik. (basierend auf Slides von Lukas Meier)

Deskriptive Statistik. (basierend auf Slides von Lukas Meier) Deskriptive Statistik (basierend auf Slides von Lukas Meier) Deskriptive Statistik: Ziele Daten zusammenfassen durch numerische Kennzahlen. Grafische Darstellung der Daten. Quelle: Ursus Wehrli, Kunst

Mehr

Mathematische und statistische Methoden II

Mathematische und statistische Methoden II Methodenlehre e e Prof. Dr. G. Meinhardt 6. Stock, Wallstr. 3 (Raum 06-206) Sprechstunde jederzeit nach Vereinbarung und nach der Vorlesung. Mathematische und statistische Methoden II Dr. Malte Persike

Mehr

3. Deskriptive Statistik

3. Deskriptive Statistik 3. Deskriptive Statistik Eindimensionale (univariate) Daten: Pro Objekt wird ein Merkmal durch Messung / Befragung/ Beobachtung erhoben. Resultat ist jeweils ein Wert (Merkmalsausprägung) x i : - Gewicht

Mehr

Herzlich willkommen zur Vorlesung Statistik. Streuungsmaße oder die Unterschiedlichkeit der Daten nebst kurzen Ausführungen zu Schiefe und Wölbung

Herzlich willkommen zur Vorlesung Statistik. Streuungsmaße oder die Unterschiedlichkeit der Daten nebst kurzen Ausführungen zu Schiefe und Wölbung FB 1 W. Ludwig-Mayerhofer Statistik 1 Herzlich willkommen zur Vorlesung Statistik smaße oder die Unterschiedlichkeit der Daten nebst kurzen Ausführungen zu Schiefe und Wölbung FB 1 W. Ludwig-Mayerhofer

Mehr

Das arithmetische Mittel. x i = = 8. x = 1 4. und. y i = = 8

Das arithmetische Mittel. x i = = 8. x = 1 4. und. y i = = 8 .2 Einige statistische Maßzahlen.2. Die Schusser in zwei Familien Die vier Kinder der Familie Huber haben x = 5, x 2 = 7, x 3 = 9, x 4 = Schusser. Die vier Kinder der Familie Maier haben y = 7, y 2 = 7,

Mehr

1. Maße der zentralen Tendenz Beispiel: Variable Anzahl der Geschwister aus Jugend '92. Valid Cum Value Frequency Percent Percent Percent

1. Maße der zentralen Tendenz Beispiel: Variable Anzahl der Geschwister aus Jugend '92. Valid Cum Value Frequency Percent Percent Percent Deskriptive Statistik 1. Verteilungsformen symmetrisch/asymmetrisch unimodal(eingipflig) / bimodal (zweigipflig schmalgipflig / breitgipflig linkssteil / rechtssteil U-förmig / abfallend Statistische Kennwerte

Mehr

Univariate Häufigkeitsverteilungen Kühnel, Krebs 2001: Statistik für die Sozialwissenschaften, S.41-66

Univariate Häufigkeitsverteilungen Kühnel, Krebs 2001: Statistik für die Sozialwissenschaften, S.41-66 Univariate Häufigkeitsverteilungen Kühnel, Krebs 2001: Statistik für die Sozialwissenschaften, S.41-66 Gabriele Doblhammer: Empirische Sozialforschung Teil II, SS 2004 1/19 Skalenniveaus Skalenniveau Relation

Mehr

Lage- und Streuungsparameter

Lage- und Streuungsparameter Lage- und Streuungsparameter Beziehen sich auf die Verteilung der Ausprägungen von intervall- und ratio-skalierten Variablen Versuchen, diese Verteilung durch Zahlen zu beschreiben, statt sie graphisch

Mehr

Deskriptive Statistik Kapitel VII - Konzentration von Merkmalswerten

Deskriptive Statistik Kapitel VII - Konzentration von Merkmalswerten Deskriptive Statistik Kapitel VII - Konzentration von Merkmalswerten Georg Bol bol@statistik.uni-karlsruhe.de Markus Höchstötter hoechstoetter@statistik.uni-karlsruhe.de Agenda 1. Einleitung 2. Lorenzkurve

Mehr

TEIL 13: DIE EINFACHE LINEARE REGRESSION

TEIL 13: DIE EINFACHE LINEARE REGRESSION TEIL 13: DIE EINFACHE LINEARE REGRESSION Die einfache lineare Regression Grundlagen Die einfache lineare Regression ist ebenfalls den bivariaten Verfahren für metrische Daten zuzuordnen 1 Sie hat einen

Mehr

6Korrelationsanalyse:Zusammengangsanalysestetiger Merkmale

6Korrelationsanalyse:Zusammengangsanalysestetiger Merkmale 6Korrelationsanalyse:Zusammengangsanalysestetiger Merkmale Jetzt betrachten wir bivariate Merkmale (X, Y ), wobei sowohl X als auch Y stetig bzw. quasi-stetig und mindestens ordinalskaliert, typischerweise

Mehr

Deskriptive Statistik

Deskriptive Statistik Modul G.1 WS 07/08: Statistik 8.11.2006 1 Deskriptive Statistik Unter deskriptiver Statistik versteht man eine Gruppe statistischer Methoden zur Beschreibung von Daten anhand statistischer Kennwerte, Graphiken,

Mehr

Deskriptive Statistik Erläuterungen

Deskriptive Statistik Erläuterungen Grundlagen der Wirtschaftsmathematik und Statistik Erläuterungen Lernmaterial zum Modul - 40601 - der Fernuniversität Hagen 7 2.1 Einfache Lageparameter aus einer gegebenen Messreihe ablesen Erklärung

Mehr

Kapitel VI - Lage- und Streuungsparameter

Kapitel VI - Lage- und Streuungsparameter Universität Karlsruhe (TH) Institut für Statistik und Mathematische Wirtschaftstheorie Wahrscheinlichkeitstheorie Kapitel VI - Lage- und Streuungsparameter Markus Höchstötter Lehrstuhl für Statistik, Ökonometrie

Mehr

Teil I: Deskriptive Statistik

Teil I: Deskriptive Statistik Teil I: Deskriptive Statistik 2 Grundbegriffe 2.1 Merkmal und Stichprobe 2.2 Skalenniveau von Merkmalen 2.3 Geordnete Stichproben und Ränge 2.1 Merkmal und Stichprobe An (geeignet ausgewählten) Untersuchungseinheiten

Mehr

Kenngrößen von Zufallsvariablen

Kenngrößen von Zufallsvariablen Kenngrößen von Zufallsvariablen Die Wahrscheinlichkeitsverteilung kann durch die sogenannten Kenngrößen beschrieben werden, sie charakterisieren sozusagen die Verteilung. Der Erwartungswert Der Erwartungswert

Mehr

4 Spezifizierende Beschreibung empirischer Verteilungen

4 Spezifizierende Beschreibung empirischer Verteilungen 4 Spezifizierende Beschreibung empirischer Verteilungen 55 4 Spezifizierende Beschreibung empirischer Verteilungen 4.1 Spezifika empirischer Verteilungen 59 4.2 Lagekennwerte 63 4.2.1 Arithmetisches Mittel

Mehr

Beispiel 2 (Einige Aufgaben zu Lageparametern) Aufgabe 1 (Lageparameter)

Beispiel 2 (Einige Aufgaben zu Lageparametern) Aufgabe 1 (Lageparameter) Beispiel (Einige Aufgaben zu Lageparametern) Aufgabe 1 (Lageparameter) 1 Ein Statistiker ist zu früh zu einer Verabredung gekommen und vertreibt sich nun die Zeit damit, daß er die Anzahl X der Stockwerke

Mehr

Statistik I für Betriebswirte Vorlesung 9

Statistik I für Betriebswirte Vorlesung 9 Statistik I für Betriebswirte Vorlesung 9 Dr. Andreas Wünsche TU Bergakademie Freiberg Institut für Stochastik Vorlesung am 8. Juni 2017 im Audi-Max (AUD-1001) Dr. Andreas Wünsche Statistik I für Betriebswirte

Mehr

N 1 0 50 0.5 50 0.5 2 1 20 0.2 70 0.7 3 2 15 0.15 85 0.85 4 3 10 0.1 95 0.95 5 4+ 5 0.05 100 1-100 1.00 - -

N 1 0 50 0.5 50 0.5 2 1 20 0.2 70 0.7 3 2 15 0.15 85 0.85 4 3 10 0.1 95 0.95 5 4+ 5 0.05 100 1-100 1.00 - - 2 Deskriptive Statistik 1 Kapitel 2: Deskriptive Statistik A: Beispiele Beispiel 1: Im Rahmen einer Totalerhebung der Familien eines Dorfes (N = 100) wurde u.a. das diskrete Merkmal Kinderanzahl (X) registriert.

Mehr

Mathematische und statistische Methoden I

Mathematische und statistische Methoden I Prof. Dr. G. Meinhardt Methodenlehre Mathematische und statistische Methoden I Sprechstunde jederzeit nach Vereinbarung und nach der Vorlesung Wallstr. 3, 6. Stock, Raum 06-206 Dr. Malte Persike persike@uni-mainz.de

Mehr

STATISTIK I Übung 04 Spannweite und IQR. 1 Kurze Wiederholung. Was sind Dispersionsparameter?

STATISTIK I Übung 04 Spannweite und IQR. 1 Kurze Wiederholung. Was sind Dispersionsparameter? STATISTIK I Übung 04 Spannweite und IQR 1 Kurze Wiederholung Was sind Dispersionsparameter? Die sogenannten Dispersionsparameter oder statistischen Streuungsmaße geben Auskunft darüber, wie die Werte einer

Mehr

Empirische Verteilungsfunktion

Empirische Verteilungsfunktion Empirische Verteilungsfunktion H(x) := Anzahl der Werte x ist. Deskriptive

Mehr

Deskription, Statistische Testverfahren und Regression. Seminar: Planung und Auswertung klinischer und experimenteller Studien

Deskription, Statistische Testverfahren und Regression. Seminar: Planung und Auswertung klinischer und experimenteller Studien Deskription, Statistische Testverfahren und Regression Seminar: Planung und Auswertung klinischer und experimenteller Studien Deskriptive Statistik Deskriptive Statistik: beschreibende Statistik, empirische

Mehr

Beschreibende Statistik Eindimensionale Daten

Beschreibende Statistik Eindimensionale Daten Mathematik II für Biologen 16. April 2008 Stichproben Geordnete Stichprobe Rang Maße für die mittlere Lage der Daten Robustheit Quantile Maße für die Streuung der Daten Erkennung potentieller Eindimensionales

Mehr

htw saar 1 EINFÜHRUNG IN DIE STATISTIK: BESCHREIBENDE STATISTIK

htw saar 1 EINFÜHRUNG IN DIE STATISTIK: BESCHREIBENDE STATISTIK htw saar 1 EINFÜHRUNG IN DIE STATISTIK: BESCHREIBENDE STATISTIK htw saar 2 Grundbegriffe htw saar 3 Grundgesamtheit und Stichprobe Ziel: Über eine Grundgesamtheit (Population) soll eine Aussage über ein

Mehr

4 Spezifizierende Beschreibung empirischer Verteilungen

4 Spezifizierende Beschreibung empirischer Verteilungen 4 Spezifizierende Beschreibung empirischer Verteilungen 62 4 Spezifizierende Beschreibung empirischer Verteilungen 4.1 Spezifika empirischer Verteilungen 66 4.2 Lagekennwerte 70 4.2.1 Arithmetisches Mittel

Mehr

Diese Lücken sollten nicht auch bei Ihnen vorhanden sein: Aufgrund einer statistischen Untersuchung entsteht eine geordnete bzw. ungeordnete, die durc

Diese Lücken sollten nicht auch bei Ihnen vorhanden sein: Aufgrund einer statistischen Untersuchung entsteht eine geordnete bzw. ungeordnete, die durc SS 2017 Torsten Schreiber 222 Diese Lücken sollten nicht auch bei Ihnen vorhanden sein: Aufgrund einer statistischen Untersuchung entsteht eine geordnete bzw. ungeordnete, die durch Summierung je Ausprägung

Mehr

Kapitel 2. Mittelwerte

Kapitel 2. Mittelwerte Kapitel 2. Mittelwerte Im Zusammenhang mit dem Begriff der Verteilung, der im ersten Kapitel eingeführt wurde, taucht häufig die Frage auf, wie man die vorliegenden Daten durch eine geeignete Größe repräsentieren

Mehr

Statistik eindimensionaler Größen

Statistik eindimensionaler Größen Statistik eindimensionaler Größen Michael Spielmann Inhaltsverzeichnis 1 Aufgabe der eindimensionalen Statistik 2 2 Grundbegriffe 2 3 Aufbereiten der Stichprobe 3 4 Die Kennzahlen Mittelwert und Streuung,

Mehr

Fachrechnen für Tierpfleger

Fachrechnen für Tierpfleger Z.B.: Fachrechnen für Tierpfleger A10. Statistik 10.1 Allgemeines Was ist Statistik? 1. Daten sammeln: Durch Umfragen, Zählung, Messung,... 2. Daten präsentieren: Tabellen, Grafiken 3. Daten beschreiben/charakterisieren:

Mehr

Bitte am PC mit Windows anmelden!

Bitte am PC mit Windows anmelden! Einführung in SPSS Plan für heute: Grundlagen/ Vorwissen für SPSS Vergleich der Übungsaufgaben Einführung in SPSS http://weknowmemes.com/generator/uploads/generated/g1374774654830726655.jpg Standardnormalverteilung

Mehr

Es können keine oder mehrere Antworten richtig sein. Eine Frage ist NUR dann richtig beantwortet, wenn ALLE richtigen Antworten angekreuzt wurden.

Es können keine oder mehrere Antworten richtig sein. Eine Frage ist NUR dann richtig beantwortet, wenn ALLE richtigen Antworten angekreuzt wurden. Teil III: Statistik Alle Fragen sind zu beantworten. Es können keine oder mehrere Antworten richtig sein. Eine Frage ist NUR dann richtig beantwortet, wenn ALLE richtigen Antworten angekreuzt wurden. Wird

Mehr

Lagemasse und Streuung

Lagemasse und Streuung Lagemasse und Streuung Benjamin Schlegel 07. März 2016 Lagemasse sagen etwas über die Lage und das Zentrum der Daten aus, Streuungsmasse, wie die Daten um dieses Zentrum gestreut sind. Lagemasse Lagemasse

Mehr

1. Tutorial. Online-Tutorium-Statistik von T.B.

1. Tutorial. Online-Tutorium-Statistik von T.B. Online-Tutorium-Statistik von T.B. 1 Grundbegriffe I Gegenstand einer statistischen Untersuchung sind bestimmte Objekte (z.b. Personen, Unternehmen) bei denen man sich für gewisse Eigenschaften (z.b. Geschlecht,

Mehr

825 e 290 e 542 e 945 e 528 e 486 e 675 e 618 e 170 e 500 e 443 e 608 e. Zeichnen Sie das Box-Plot. Sind in dieser Stichprobe Ausreißer vorhanden?

825 e 290 e 542 e 945 e 528 e 486 e 675 e 618 e 170 e 500 e 443 e 608 e. Zeichnen Sie das Box-Plot. Sind in dieser Stichprobe Ausreißer vorhanden? 1. Aufgabe: Eine Bank will die jährliche Sparleistung eines bestimmten Kundenkreises untersuchen. Eine Stichprobe von 12 Kunden ergab folgende Werte: 825 e 290 e 542 e 945 e 528 e 486 e 675 e 618 e 170

Mehr

Graphische Darstellung einer univariaten Verteilung:

Graphische Darstellung einer univariaten Verteilung: Graphische Darstellung einer univariaten Verteilung: Die graphische Darstellung einer univariaten Verteilung hängt von dem Messniveau der Variablen ab. Bei einer graphischen Darstellung wird die Häufigkeit

Mehr

Mathematische und statistische Methoden I

Mathematische und statistische Methoden I Prof. Dr. G. Meinhardt 6. Stock, Wallstr. 3 (Raum 06-206) Sprechstunde jederzeit nach Vereinbarung und nach der Vorlesung. Mathematische und statistische Methoden I Dr. Malte Persike persike@uni-mainz.de

Mehr

Statistik und Wahrscheinlichkeitsrechnung

Statistik und Wahrscheinlichkeitsrechnung Statistik und Wahrscheinlichkeitsrechnung 3. Vorlesung Dr. Jochen Köhler 1 Inhalte der heutigen Vorlesung Ziel: Daten Modellbildung Probabilistisches Modell Wahrscheinlichkeit von Ereignissen Im ersten

Mehr

Gegeben: Eine Menge von Objekten mit Merkmalen (beobachtet oder gemessen) Die gegebene Menge heißt auch Grundgesamtheit.

Gegeben: Eine Menge von Objekten mit Merkmalen (beobachtet oder gemessen) Die gegebene Menge heißt auch Grundgesamtheit. Kapitel 1 Beschreibende Statistik Gegeben: Eine Menge von Objekten mit Merkmalen (beobachtet oder gemessen) Gesucht: Übersichtliche Beschreibung Die gegebene Menge heißt auch Grundgesamtheit. Beispiele

Mehr

Deskriptive Statistik

Deskriptive Statistik Fakultät für Humanwissenschaften Sozialwissenschaftliche Methodenlehre Prof. Dr. Daniel Lois Deskriptive Statistik Stand: April 2015 (V2) Inhaltsverzeichnis 1. Notation 2 2. Messniveau 3 3. Häufigkeitsverteilungen

Mehr

Statistische Kennzahlen für die Lage

Statistische Kennzahlen für die Lage Statistische Kennzahlen für die Lage technische universität ach der passenden grafischen Darstellung der Werte eines Merkmals auf der Gesamtheit der Beobachtungen interessieren jetzt geschickte algebraische

Mehr

4 Statistische Maßzahlen

4 Statistische Maßzahlen 4 Statistische Maßzahlen 4.1 Maßzahlen der mittleren Lage 4.2 Weitere Maßzahlen der Lage 4.3 Maßzahlen der Streuung 4.4 Lineare Transformationen, Schiefemaße 4.5 Der Box Plot Ziel: Charakterisierung einer

Mehr

Statistik II: Grundlagen und Definitionen der Statistik

Statistik II: Grundlagen und Definitionen der Statistik Medien Institut : Grundlagen und Definitionen der Statistik Dr. Andreas Vlašić Medien Institut (0621) 52 67 44 vlasic@medien-institut.de Gliederung 1. Hintergrund: Entstehung der Statistik 2. Grundlagen

Mehr

Ü b u n g s b l a t t 15

Ü b u n g s b l a t t 15 Einführung in die Stochastik Sommersemester 07 Dr. Walter Oevel 2. 7. 2007 Ü b u n g s b l a t t 15 Hier ist zusätzliches Übungsmaterial zur Klausurvorbereitung quer durch die Inhalte der Vorlesung. Eine

Mehr

Statistik I für Betriebswirte Vorlesung 9

Statistik I für Betriebswirte Vorlesung 9 Statistik I für Betriebswirte Vorlesung 9 Prof. Dr. Hans-Jörg Starkloff TU Bergakademie Freiberg Institut für Stochastik 06. Juni 2016 Prof. Dr. Hans-Jörg Starkloff Statistik I für Betriebswirte Vorlesung

Mehr

Maße der zentralen Tendenz

Maße der zentralen Tendenz UStatistische Kennwerte Sagen uns tabellarische und graphische Darstellungen etwas über die Verteilung der einzelnen Werte einer Stichprobe, so handelt es sich bei statistischen Kennwerten um eine Kennzahl,

Mehr

6 Korrelationsanalyse: Zusammenhangsanalyse stetiger. Merkmale

6 Korrelationsanalyse: Zusammenhangsanalyse stetiger. Merkmale 6 Korrelationsanalyse: Zusammenhangsanalyse stetiger Merkmale 6.1 Korrelationsanalyse Jetzt betrachten wir bivariate Merkmale (X, Y ), wobei sowohl X als auch Y stetig bzw. quasi-stetig und mindestens

Mehr

Deskriptivstatistik a) Univariate Statistik Weiters zum Thema der statistischen Informationsverdichtung

Deskriptivstatistik a) Univariate Statistik Weiters zum Thema der statistischen Informationsverdichtung 20 Weiters zum Thema der statistischen Informationsverdichtung M a ß z a h l e n Statistiken bei Stichproben Parameter bei Grundgesamtheiten Maßzahlen zur Beschreibung univariater Verteilungen Maßzahlen

Mehr

Der Modus ist. Der Median ist. 3. Übung. Aufgabe 1. a) der häufigste Wert. b) der Wert unter dem 50 % aller anderen Werte liegen.

Der Modus ist. Der Median ist. 3. Übung. Aufgabe 1. a) der häufigste Wert. b) der Wert unter dem 50 % aller anderen Werte liegen. 3. Übung Aufgabe 1 Der Modus ist a) der häufigste Wert. b) der Wert unter dem 50 % aller anderen Werte liegen. c) der Durchschnitt aller Werte. d) der Wert mit der größten Häufigkeitsdichte. e) der Schwerpunkt

Mehr

TEIL 13: DIE LINEARE REGRESSION

TEIL 13: DIE LINEARE REGRESSION TEIL 13: DIE LINEARE REGRESSION Dozent: Dawid Bekalarczyk GLIEDERUNG Dozent: Dawid Bekalarczyk Lineare Regression Grundlagen Prognosen / Schätzungen Verbindung zwischen Prognose und Zusammenhang zwischen

Mehr

Anteile Häufigkeiten Verteilungen Lagemaße Streuungsmaße Merkmale von Verteilungen. Anteile Häufigkeiten Verteilungen

Anteile Häufigkeiten Verteilungen Lagemaße Streuungsmaße Merkmale von Verteilungen. Anteile Häufigkeiten Verteilungen DAS THEMA: VERTEILUNGEN LAGEMAßE - STREUUUNGSMAßE Anteile Häufigkeiten Verteilungen Lagemaße Streuungsmaße Merkmale von Verteilungen Anteile Häufigkeiten Verteilungen Anteile und Häufigkeiten Darstellung

Mehr

Statistiktutorium (Kurs Frau Jacobsen)

Statistiktutorium (Kurs Frau Jacobsen) Statistiktutorium (Kurs Frau Jacobsen) von Timo Beddig Einführungsveranstaltung am 16.4.2012 1 Grundbegriffe I Gegenstand einer statistischen Untersuchung sind bestimmte Objekte (z.b. Personen, Unternehmen)

Mehr

1.1 Graphische Darstellung von Messdaten und unterschiedliche Mittelwerte. D. Horstmann: Oktober

1.1 Graphische Darstellung von Messdaten und unterschiedliche Mittelwerte. D. Horstmann: Oktober 1.1 Graphische Darstellung von Messdaten und unterschiedliche Mittelwerte D. Horstmann: Oktober 2014 4 Graphische Darstellung von Daten und unterschiedliche Mittelwerte Eine Umfrage nach der Körpergröße

Mehr

4 Statistische Maßzahlen

4 Statistische Maßzahlen 4 Statistische Maßzahlen 4.1 Maßzahlen der mittleren Lage 4.2 Weitere Maßzahlen der Lage 4.3 Maßzahlen der Streuung 4.4 Lineare Transformationen, Schiefemaße 4.5 Der Box Plot Ziel: Charakterisierung einer

Mehr

Kapitel 1: Deskriptive Statistik

Kapitel 1: Deskriptive Statistik Kapitel 1: Deskriptive Statistik Grafiken Mit Hilfe von SPSS lassen sich eine Vielzahl unterschiedlicher Grafiken für unterschiedliche Zwecke erstellen. Wir besprechen hier die zwei in Kapitel 1.1 thematisierten

Mehr

Mathematik für Biologen

Mathematik für Biologen Mathematik für Biologen Prof. Dr. Rüdiger W. Braun Heinrich-Heine-Universität Düsseldorf 20. Oktober 2010 1 empirische Verteilung 2 Lageparameter Modalwert Arithmetisches Mittel Median 3 Streuungsparameter

Mehr

TEIL 7: EINFÜHRUNG UNIVARIATE ANALYSE TABELLARISCHE DARSTELLUNG / AUSWERTUNG

TEIL 7: EINFÜHRUNG UNIVARIATE ANALYSE TABELLARISCHE DARSTELLUNG / AUSWERTUNG TEIL 7: EINFÜHRUNG UNIVARIATE ANALYSE TABELLARISCHE DARSTELLUNG / AUSWERTUNG Statistik eine Umschreibung Mathematische Hilfswissenschaft mit der Aufgabe, Methoden für die Sammlung, Aufbereitung, Analyse

Mehr

Einführung in die Statistik für Wirtschaftswissenschaftler für Betriebswirtschaft und Internationales Management

Einführung in die Statistik für Wirtschaftswissenschaftler für Betriebswirtschaft und Internationales Management Einführung in die Statistik für Wirtschaftswissenschaftler für Betriebswirtschaft und Internationales Management Sommersemester 03 Hochschule Augsburg : Gliederung Einführung Deskriptive Statistik 3 Wahrscheinlichkeitstheorie

Mehr

Deskriptive Statistik

Deskriptive Statistik Deskriptive Statistik 1 Ziele In der deskriptiven (=beschreibenden) Statistik werden Untersuchungsergebnisse übersichtlich dargestellt, durch Kennzahlen charakterisiert und grafisch veranschaulicht. 2

Mehr

Musterlösung zur Übungsklausur Statistik

Musterlösung zur Übungsklausur Statistik Musterlösung zur Übungsklausur Statistik WMS4A Oettinger 6/205 Aufgabe (a) Falsch: der Modus ist die am häufigsten auftretende Merkmalsausprägung in einer Stichprobe. (b) Richtig: ein ordinales Merkmal

Mehr

WISTA WIRTSCHAFTSSTATISTIK

WISTA WIRTSCHAFTSSTATISTIK WISTA WIRTSCHAFTSSTATISTIK PROF DR ROLF HÜPEN FAKULTÄT FÜR WIRTSCHAFTSWISSENSCHAFT Seminar für Theoretische Wirtschaftslehre Vorlesungsprogramm 07052013 Mittelwerte und Lagemaße II 1 Anwendung und Berechnung

Mehr

Analytische Statistik II

Analytische Statistik II Analytische Statistik II Institut für Geographie 1 Schätz- und Teststatistik 2 Grundproblem Generell sind wir nur selten in der Geographie in der Lage, Daten über die Grundgesamtheit zur Verfügung zu haben.

Mehr

Ermitteln Sie auf 2 Dezimalstellen genau die folgenden Kenngrößen der bivariaten Verteilung der Merkmale Weite und Zeit:

Ermitteln Sie auf 2 Dezimalstellen genau die folgenden Kenngrößen der bivariaten Verteilung der Merkmale Weite und Zeit: 1. Welche der folgenden Kenngrößen, Statistiken bzw. Grafiken sind zur Beschreibung der Werteverteilung des Merkmals Konfessionszugehörigkeit sinnvoll einsetzbar? A. Der Modalwert. B. Der Median. C. Das

Mehr

Die Korrelation von Merkmalen

Die Korrelation von Merkmalen Die Korrelation von Merkmalen In der Analse von Datenmaterial ist eines der Hauptziele der Statistik eine Abhängigkeit bzw. einen Zusammenhang zwischen Merkmalen zu erkennen. Die Korrelation ermittelt

Mehr

Lösungsskizzen zur Präsenzübung 01

Lösungsskizzen zur Präsenzübung 01 Lösungsskizzen zur Präsenzübung 01 Hilfestellung zur Vorlesung Anwendungen der Mathematik im Wintersemester 2015/2016 Fakultät für Mathematik Universität Bielefeld Veröffentlicht am 02. November 2015 von:

Mehr

Übungsrunde 2, Gruppe 2 LVA , Übungsrunde 1, Gruppe 2, Markus Nemetz, TU Wien, 10/2006

Übungsrunde 2, Gruppe 2 LVA , Übungsrunde 1, Gruppe 2, Markus Nemetz, TU Wien, 10/2006 1 1.2.3.4. 1.1 Angabe Übungsrunde 2, Gruppe 2 LVA 107.369, Übungsrunde 1, Gruppe 2, 24.10. Markus Nemetz, markus.nemetz@tuwien.ac.at, TU Wien, 10/2006 Bestimmen Sie für den Datensatz bulb.dat die Quartile,

Mehr

2. Deskriptive Statistik

2. Deskriptive Statistik Philipps-Universitat Marburg 2.1 Stichproben und Datentypen Untersuchungseinheiten: mogliche, statistisch zu erfassende Einheiten je Untersuchungseinheit: ein oder mehrere Merkmale oder Variablen beobachten

Mehr