4. Auswertung eindimensionaler Daten

Save this PDF as:
 WORD  PNG  TXT  JPG

Größe: px
Ab Seite anzeigen:

Download "4. Auswertung eindimensionaler Daten"

Transkript

1 4. Auswertung eindimensionaler Daten Ziel dieses Kapitels: Präsentation von Methoden zur statistischen Auswertung eines einzelnen Merkmals 64

2 Bezeichnungen (Wiederholung): Merkmalsträger: e 1,..., e n Grundgesamtheit: G = {e 1,..., e n } Zu untersuchendes Merkmal: X Mögliche Merkmalswerte: ξ 1,..., ξ J Daten in Urliste: x 1,..., x n 65

3 Fragestellungen: Formale und grafische Darstellung der Daten Berechnung aussagekräftiger Kenngrößen der Daten Vorgehensweise: Vorstellung der statistischen Methoden anhand des Skalenniveaus des Merkmals X 66

4 4.1 Beliebig skalierte Daten Skalenniveau des zu untersuchenden Merkmals X: Nominalskala (oder höher) Häufigkeiten des Merkmals X mit Ausprägungen ξ 1,..., ξ J : Absolute Häufigkeit der Ausprägung ξ j (j = 1,... J): n j = Anzahl von Daten mit Merkmalswert ξ j Relative Häufigkeit der Ausprägung ξ j (j = 1,... J): f j = n j n = Anteil von Daten mit Merkmalswert ξ j 67

5 Offensichtlich gilt: 0 n j n sowie J j=1 n j = n (warum?) 0 f j 1 sowie J j=1 f j = 1 (warum?) Jetzt: Mit den Begriffen der absoluten und relativen Häufigkeiten gelangt man zur 1. Darstellungsform des Merkmals X, nämlich zur Häufigkeitstabelle 68

6 Definition 4.1: (Häufigkeitstabelle) Unter der Häufigkeitstabelle des Merkmals X versteht man die folgende tabellarische Darstellung: j ξ j n j f j = n j /n 1 ξ 1 n 1 f 1 2. ξ 2. n 2. f 2. J ξ J n J f J Summe: n 1 69

7 Beispiel (Verkehrsmittelbenutzung): Grundgesamtheit bestehe aus 20 Beschäftigten eines Betriebes, d.h. G = {e 1,..., e 20 } Zu untersuchendes Merkmal X: Benutztes Verkehrsmittel zum Arbeitsplatz Merkmalsausprägungen: ξ 1 = Bus ξ 2 = PKW ξ 3 = Motorrad ξ 4 = Fahrrad ξ 5 = zu Fuß 70

8 Erhobene Urliste: 1, 1, 2, 2, 2, 4, 3, 5, 2, 2, 5, 2, 4, 1, 1, 2, 2, 1, 2, 1 Häufigkeitstabelle: j ξ j n j f j = n j /n 1 Bus 6 6/20 = PKW 9 9/20 = Motorrad 1 1/20 = Fahrrad 2 2/20 = zu Fuß 2 2/20 = 0.10 Summe:

9 Man beachte den folgenden Trade-Off : Übergang von Urliste zur Häufigkeitstabelle erhöht die Übersichtlichkeit führt zu einem Informationsverlust Grafische Darstellungen von Häufigkeitstabellen durch Säulendiagramme Balkendiagramme 72

10 Balken- oder Stabdiagramm (absolute Häufigkeiten) Bus PKW Motorrad Fahrrad zu Fuß Kuchen- oder Kreisdiagramm (relative Häufigkeiten) Motorrad 5% Fahrrad 10% zu Fuß 10% PKW 45% Bus 30%

11 Vorsicht bei der Interpretation von Grafiken: Grafiken können auf viele Weisen manipuliert werden Manipulation muss nicht immer schlecht sein Verzerren der Achsen Bestimmte Bereiche werden hervorgehoben Bestimmte Bereiche werden unterdrückt Skalierungen der Y -Achsen Bestimmte Entwicklungen werden dramatisiert Bestimmte Entwicklungen werden verschwiegen 74

12 Wichtige Kennzahl einer Datenreihe ist der Modus: Definition 4.2: (Modus) Ein Merkmalswert ξ j heißt Modus, wenn seine (absolute oder relative) Häufigkeit mindestens so groß ist wie die aller anderen Merkmalswerte, d.h. wenn n j n k für alle k {1,..., J} gilt. Offensichtlich: Eine Datenreihe kann mehrere Modi aufweisen 75

13 4.2 Mindestens ordinal skalierte Daten Jetzt: Daten seien mindestens ordinal skaliert, d.h. erhobene Daten können sinnvoll geordnet werden Wichtige Darstellungsform der Daten: Empirische Verteilungsfunktion 76

14 Definition 4.3: (Empirische Verteilungsfunktion) Gegeben seien die Daten x 1,..., x n einer Urliste. Für jede reelle Zahl x R definiert man die empirische Verteilungsfunktion an der Stelle x (in Zeichen: F (x)) als den Anteil der Daten x 1,..., x n, die kleiner oder gleich x sind: Bemerkung: F (x) = Anzahl aller x i x. n Es gibt alternative Möglichkeiten, die empirische Verteilungsfunktion auszudrücken. Z.B. kann man alle Merkmalsausprägungen ξ j (j = 1,..., J) betrachten, die kleiner oder gleich x sind und deren relative Häufigkeiten f j = n j /n aufsummieren: F (x) = f j ξ j x 77

15 Beispiel (Klausurnoten): [I] 16 Studierende erzielten in einer Klausur die folgenden ganzzahligen Noten: 3, 4, 2, 1, 2, 4, 5, 5, 2, 1, 4, 5, 3, 3, 2, 4 Zur Berechnung der emp. VF sortieren wir die Urliste von der kleinsten zur größten Beobachtung 1, 1, 2, 2, 2, 2, 3, 3, 3, 4, 4, 4, 4, 5, 5, 5 78

16 Beispiel (Klausurnoten): [II] Die emp. VF ergibt sich wie folgt: F (x) = = für x < 1 = für 1 x < 2 = für 2 x < 3 = für 3 x < = für 4 x < = für x 5 79

17 1 0,8 0,6 0,4 0, Bemerkung: Wir notieren die vom kleinsten Datenwert (Minimum) zum größten Datenwert (Maximum) geordnete Urliste als x (1) x (2)... x (n). (x (1) = Minimum der Urliste, x (n) = Maximum) 80

18 Eigenschaften der empirischen Verteilungsfunktion: [I] F (x) = 0 für alle x < x (1) F (x) = 1 für alle x x (n) F (x) ist eine Treppenfunktion. Sprünge erfolgen an den Stellen, die als Daten in der Urliste vorkommen. Die Sprunghöhe an der Stelle x = ξ j beträgt f j = n j /n. F (x) ist rechtsseitig stetig Ist die Urliste sehr lang (d.h. n sehr groß), so wird F (x) immer glatter 81

19 Eigenschaften der empirischen Verteilungsfunktion: [II] Aus F (x) lassen sich die beobachteten Merkmalswerte und deren relativen Häufigkeiten rekonstruieren. Kennt man zusätzlich noch n, so folgen aus F (x) auch die absoluten Häufigkeiten Wichtige Kennzahlen einer Datenreihe: Quantile Definition der Quantile über emp. Verteilungsfkt. F (x) 82

20 Definition 4.4: (p-quantil) Gegeben seien die Daten x 1,..., x n einer Urliste. Man betrachte eine beliebige reelle Zahl p mit 0 < p < 1. Das p-quantil (oder der p 100%-Punkt) der Daten (in Zeichen: x p ) ist definiert als x p = min {x R F (x) p} = kleinstes x R für das gilt F (x) p. Bemerkung: Das p-quantil x p ist also der kleinste Wert x R mit der Eigenschaft, dass mindestens p 100% der Daten kleiner oder gleich x p sind 83

21 Bisher: Bestimmung von Quantilen über emp. Verteilungsfunktion F (x) Jetzt: Technische Vorschrift (Algorithmus) zur Bestimmung von Quantilen aus der Urliste x 1,... x n (ohne Berechnung der emp. VF F (x)) Betrachte dazu: Geordnete Urliste der Daten x (1) x (2)... x (n) 84

22 Das p-quantil ist dann gegeben durch: x p = { x(n p), falls n p ganzzahlig ist x ( n p +1) sonst ( n p bezeichnet den ganzzahligen Anteil von n p) Definition 4.5: (Spezielle Quantile) Einige p-quantile haben besondere Namen: Median (p = 0.5): x 0.5 Quartile (p = 0.25, 0.5, 0.75): x 0.25, x 0.5, x 0.75 Quintile (p = 0.2, 0.4, 0.6, 0.8): x 0.2, x 0.4, x 0.6, x

23 Beispiel (Klausurnoten): [I] Urliste (ungeordnet) x 1 x 2 x 3 x 4 x 5 x 6 x 7 x x 9 x 10 x 11 x 12 x 13 x 14 x 15 x Geordnete Urliste x (1) x (2) x (3) x (4) x (5) x (6) x (7) x (8) x (9) x (10) x (11) x (12) x (13) x (14) x (15) x (16)

24 Beispiel (Klausurnoten): [II] Berechnung des 0.25-Quantils: n = 16, p = 0.25 n p = = 4 (ganzzahlig) x 0.25 = x (n p) = x (4) = 2 Berechnung des Medians: n = 16, p = 0.5 n p = = 8 (ganzzahlig) x 0.5 = x (n p) = x (8) = 3 Berechnung des 0.8-Quantils: n = 16, p = 0.8 n p = = 12.8 (nicht ganzzahlig) x 0.8 = x ( n p +1) = x ( ) = x (12+1) = x (13) = 4 87

25 4.3 Metrisch skalierte Daten Jetzt: Metrisch skaliertes Merkmal X (vgl. Folie 29) Rechenoperationen mit Daten x 1,..., x n sinnvoll Unter dieser Voraussetzung: Einführung von Kennzahlen zur Beschreibung der Lage (Abschnitte 4.3.1, 4.3.2) der Streuung (Abschnitt 4.3.3) der Symmetrie (Abschnitt 4.3.6) der metrisch skalierten Daten x 1,..., x n 88

26 4.3.1 Lagemessung Wichtige Frage der deskriptiven Statistik: Beschreibung des Lagezentrums der erhobenen Daten x 1,..., x n durch geeignete Kennzahlen (Lagekennziffern, Lagemaße) Man beachte: Je nach Skalenniveau der Daten kommen unterschiedliche Lagemaße in Betracht 89

27 Beispiele: Für ordinal skalierte Daten kennen wir bereits den Modus (häufigster Wert einer Datenreihe) den Median (0.5-Quantil, 50%-Wert) Wichtigstes Lagemaß für metrisch skalierte Daten: Definition 4.6: (Arithmetisches Mittel) Für die metrisch skalierten Daten x 1,..., x n ist das arithmetische Mittel (auch: Mittelwert oder Durchschnitt) definiert durch x = 1 n (x 1 + x x n ) = 1 n n i=1 x i. 90

28 Eigenschaften des arithmetischen Mittels: [I] Arithm. Mittel und Merkmalssumme n i=1 x i = n x = x + x x } {{ } n mal x liegt zwischen Minimum und Maximum: x (1) = min{x 1,..., x n } x max{x 1,..., x n } = x (n) Schwerpunkteigenschaft: n i=1 (x i x) = n i=1 x i n x = n x n x = 0 91

29 Eigenschaften des arithmetischen Mittels: [II] Minimumeigenschaft: Für x gilt: n i=1 (x i x) 2 = min c R n i=1 (x i c) 2 Weitere Berechnungsmöglichkeiten für x: Anhand von relativen bzw. absoluten Häufigkeiten (vgl. Folie 67) x = 1 n n i=1 x i = 1 n J j=1 ξ j n j = J j=1 ξ j f j 92

30 Beispiel: Grundgesamtheit: n = 520 Haushalte eines Vorortes Merkmal: Anzahl der Haushaltsmitglieder ξ j n j Summe: 520 Durchschnittliche Haushaltsgröße: x = ( ) =

31 Verallgemeinerung des arithmetischen Mittels: Das gewogene arithmetische Mittel: x w = n i=1 w i x i mit den Gewichten w 1,..., w n, wobei 0 w i 1 n i=1 w i = 1 94

32 Bemerkungen: Mit w 1 = w 2 =... = w n = 1/n ergibt sich das arithmetische Mittel als Spezialfall Das gewogene Mittel ist zu verwenden, falls das relative Gewicht einzelner Untersuchungseinheiten an der Grundgesamtheit von Bedeutung ist. Soll z.b. der durchschnittliche Strukturwandel in der BRD statistisch erfasst werden, so sind bei der Durchschnittsbildung über die einzelnen Bundesländer deren wirtschaftliche Kapazitäten zu berücksichtigen. Z.B. erhält in der Strukturberichterstattung der gemessene Strukturwandel in NRW ein höheres Gewicht als der des Saarlandes. 95

33 Arithmetisches Mittel vs. Median Wiederholung (vgl. Folie 85): Median ist 0.5-Quantil x 0.5 = { x (n/2), x ( n/2 +1), falls n gerade falls n ungerade Man beachte: Sowohl das arithmetische Mittel x als auch der Median x 0.5 sind populäre Lagemaße 96

34 Vergleich Mittelwert / Median: In die Berechnung von x fließen alle Beobacht. ein Vorteil: Es wird keinerlei Information verschenkt Nachteil: x reagiert empfindlich auf extreme Ausreißer in den Daten x 0.5 wird durch Ermittlung der mittleren Position der geordneten Urliste bestimmt ist robust gegenüber extremen Datenaus- Vorteil: x 0.5 reißern Nachteil: Es wird Information verschenkt, da nur die Position der Beobachtungen eine Rolle spielt 97

35 4.3.2 Weitere Mittelwerte Neben dem (gewogenen) arithmetischen Mittel gibt es eine Reihe weiterer Mittelwerte: Definition 4.7: (Harmonisches, geometrisches Mittel) Es seien x 1,..., x n metrisch skalierte Daten mit x i > 0 für i = 1,..., n. Das harmonische Mittel x H sowie das geometrische Mittel x G sind definiert als x H = 1 1 n n i=1 1 x i = 1 n n i=1 x 1 i 1 98

36 bzw. x G = n x 1 x 2... x n = n x i i=1 1 n. Spezielle Anwendungsgebiete: Harmonisches Mittel: Indizes vom Typ Paasche (Kapitel 5) Geometrisches Mittel: Wachstumsfaktoren und Wachstumsraten (Kapitel 5) 99

37 4.3.3 Streuungsmaße Weitere Frage der dekriptiven Statistik: Wie stark streuen die Daten x 1,..., x n um ein geeignet definiertes Zentrum? (Kennzahlen: Streuungs- oder Dispersionsmaße) Man beachte: Mit alternativen Lagemaßen für das Zentrum ergeben sich unterschiedliche Streuungsmaße Wichtigste Streuungsmaße für metrische Daten: Varianz und Standardabweichung 100

38 Definition 4.8: (Varianz, Standardabweichung) Für die metrisch skalierten Daten x 1,..., x n ist die Varianz (in Zeichen: s 2 ) definiert durch s 2 = 1 n n i=1 (x i x) 2. Die Standardabweichung (in Zeichen: s) ist definiert als die Wurzel aus der Varianz, d.h. s = s 2 = 1 n n (x i x) 2. Bemerkung: i=1 Meist wird bei der Berechnung von s 2 bzw. s nicht durch n, sondern durch n 1 dividiert (Begründung: in Statistik II) 101

39 Eigenschaften von s 2 und s: [I] s 2 hat quadratische Dimension, s hat gleiche Dimension wie die Daten x 1,..., x n Es gilt stets: s 2 0 und s 0 Ferner: s = 0 s 2 = 0 x 1 = x 2 =... = x n, d.h. Varianz und Std.Abwch. sind genau dann gleich 0, wenn alle Daten gleich sind (keine Streuung) 102

40 Eigenschaften von s 2 und s: [II] Alternative Darstellungen: s 2 = 1 n n i=1 x 2 i x2 (Proseminar) s 2 = 1 2n 2 n n i=1 j=1 ( xi x j ) 2 103

41 Zwei weitere zentrale Eigenschaften: [I] Es seien a, b R und x 1,..., x n erhobene Daten eines Merkmals X. Das Merkmal Y sei eine lineare Transformation von X, d.h. Y = a X + b, so dass für die Daten des Merkmals Y gilt y i = a x i + b für alle i = 1,..., n. Dann folgt für die Varianz s 2 Y s Y des Merkmals Y : bzw. die Standardabweichung s 2 Y = a2 s 2 X bzw. s Y = a s X 104

42 Zwei weitere zentrale Eigenschaften: [II] Für jede reelle Zahl c R gilt der Verschiebungssatz: 1 n n i=1 (x i c) 2 = s 2 + (x c) 2 Hieraus folgt die Minimumeigenschaft des arithmetischen Mittels (vgl. Folie 92): Die durchschnittliche quadratische Abweichung der Daten von einem Bezugspunkt c wird minimal, wenn man c = x wählt 105

43 Alternative Streuungsmaße: [I] Mittlere absolute Abweichung vom Median: d = 1 n n i=1 x i x 0.5 Es gilt die Minimierungseigenschaft: d = min c R 1 n n i=1 x i c Quartilsabstand Q Q = x 0.75 x 0.25 (Länge des Bereichs mit mittleren 50% der Daten) 106

44 Alternative Streuungsmaße: [II] Spannweite R R = max {x i} i=1,...,n (Länge des gesamten Datenbereichs) min i=1,...,n {x i} = x (n) x (1) Jetzt: Berechnung von Streuungsmaßen anhand von Häufigkeiten Zur Erinnerung (vgl. Folie 67): Merkmal X hat die J Ausprägungen ξ 1,..., ξ J mit den jeweiligen absoluten Häufigkeiten n 1,..., n J 107

45 Damit folgende Formeln für die Streuungsmaße: s 2 = 1 n s = J j=1 1 J n j=1 ( ξj x ) 2 nj ( ξj x ) 2 nj d = 1 n J j=1 ξ j x 0.5 nj R = max j=1,...,j {ξ j n j > 0} min {ξ j n j > 0} j=1,...,j 108

46 4.3.4 Additionssätze für arithmetische Mittel und Varianzen Ausgangssituation: Grundgesamtheit G gliedert sich in K Teilgesamtheiten G 1,..., G K Mittelwerte bzw. Varianzen in den K Teilgesamtheiten sind x 1,..., x K bzw. s 2 1,..., s2 K Umfänge der Teilgesamtheiten seien n 1,..., n K Damit ist der Umfang der Grundgesamtheit n = K n k k=1 109

47 Frage: Zusammenhänge zwischen dem Mittelwert x bzw. der Varianz s 2 der Grundgesamtheit und den Mittelwerten bzw. Varianzen der Teilgesamtheiten? Additionssatz für Mittelwerte: x = K k=1 x k nk n (Mittelwert der Grundgesamtheit ist gewichtetes Mittel der Mittelwerte der Teilgesamtheiten) 110

48 Additionssatz für Varianzen: s 2 = K s 2 k nk n k=1 } {{ } =s 2 int + K (x k x) 2 nk n k=1 } {{ } =sext 2 Bedeutung der internen bzw. externen Varianzen s 2 int, s2 ext : Interne Varianz ist gewichtetes Mittel aus den Varianzen der Teilgesamtheiten Externe Varianz ist gewichtete quadratische Abweichung der Mittelwerte x k der K Teilgesamtheiten vom Mittelwert x der Grundgesamtheit 111

49 Offensichtlich: Gesamtvarianz lässt sich exakt in Summe aus interner und externer Varianz zerlegen: s 2 = s 2 int + s2 ext Beispiel: 100 (Wieder-)Erwerbstätige wurden nach der Dauer X der früheren Arbeitslosigkeit befragt (in Monaten) Frauen Männer Anzahl Mittlere Arbeitslosigkeitsdauer Std.-Abwchg. der Arbeitslosigkeitsdauer

50 Berechnungen: x = 9.2 s 2 int = = s 2 ext = ( ) = ( ) = s 2 = s 2 int + s2 ext = = s =

51 4.3.5 Stetig klassierte Daten Häufiges praktisches Problem: Daten liegen nicht als Urliste x 1,..., x n vor (Einzeldaten), sondern zusammengefasst nach Klassen (stetig klassierte oder Gruppendaten) Beispiel: Verfügbares Monatseinkommen (in Euro) von 5000 Studierenden 114

52 f j EK-Klasse K j Studierende n j f j j x o j xu j 1 0 bis mehr als 250 bis mehr als 500 bis mehr als 750 bis mehr als Summe: Grund für stetige Klassierung: Bei sehr langen Datenreihen ist die Angabe von Häufigkeiten jedes einzelnen Datenpunktes oft sinnlos 115

53 Notationen zur Auswertung stetig klassierter Daten: Betrachte die J Klassen (Intervalle) K 1 = [x u 1, xo 1 ], K j = (x u j, xo j ], j = 2,..., J, wobei für die Intervallgrenzen gelten soll x u 1 < xo 1 = xu 2 < xo 2 = xu 3 < xo 3 <... < xo J 1 = xu J < xo J Bemerkungen: Die untere Grenze x1 u der 1. Klasse kann sein Die obere Grenze x o J der J. Klasse kann sein n j ist die Anzahl der Daten in Klasse K j f j = n j n ist der Anteil der Daten in Klasse K j 116

54 Damit: Die Häufigkeitsverteilung der stetig klassierten Daten ist gegeben durch bzw. durch (K 1, n 1 ), (K 2, n 2 ),..., (K J, n J ) (K 1, f 1 ), (K 2, f 2 ),..., (K J, f J ) Bemerkung: Es wird nichts über die Datenverteilung innerhalb der Klassen ausgesagt Informationsverlust 117

55 Probleme bei der stetigen Klassierung: Wieviele Klassen J soll man wählen? Faustregel: Wähle bei n Daten J 10 log 10 n Soll man die J Klassen alle gleich breit wählen? Ist es möglich, die oberste Klasse durch eine endliche Obergrenze sinnvoll abzuschließen? 118

56 Definition 4.9: (Empirische Dichte, Histogramm) Den Quotienten n j n (x o j xu j ) = f j x o j xu j bezeichnet man als empirische Dichte der Daten in der Klasse K j, j = 1, 2,..., J. Trägt man die empirischen Dichten als waagerechte Linien über den Klassen ab und zeichnet an den Klassengrenzen senkrechte Linien in Höhe der jeweiligen emprischen Dichten ein, so entsteht ein Histogramm der Daten. 119

57 Empirische Dichten und Histogramm zum Beispiel Studierende 0,002 0,0016 0,0012 0,0008 0,

58 Bemerkungen zum Histogramm: Das Rechteck über der Klasse j hat die Fläche (x o j xu j ) f j x o j xu j = f j Die Gesamtfläche unter dem Histogramm beträgt 1, denn Gesamtfläche = Summe der Rechteckflächen = J j=1 (xj o xu j ) f j x o j xu j = J j=1 f j = 1 121

59 Jetzt: Berechnung statistischer Kenngrößen bei stetig klassierten Daten Zunächst: Empirische Verteilungsfunktion und Quantile Erinnerung: (vgl. Folie 77, Definition 4.3) Der Wert der emp. Verteilungsfunktion F (x) ist definiert als Anteil der Daten, die kleiner oder gleich x sind 122

60 Problem bei stetiger Klassierung: Verteilung der Daten in Klasse K j ist unbekannt Für ein x K j (x nicht auf der Ober- oder Untergrenze) ist der Anteil nicht bestimmbar Vorgehensweise: Betrachte zunächst die x R, für die die emp. Verteilungsfunktion F (x) exakt berechenbar ist 123

61 Zunächst gilt: F (x) = 0 für x < x u 1 1 für x x o J Weiterhin gilt an den Obergrenzen aller Klassen: F (x o j ) = j f r r=1 für alle j = 1, 2,..., J Übrig bleibt: Berechnung von F (x) für x (x u j, xo j ] 124

62 Vorgehensweise: Lineare Interpolation von F (x) für x (x u j, xo j ]: F (x) F (x u j ) + f j x o j xu j = F (x o j 1 ) + f j x o j xu j (x x u j ) (x x u j ) = j 1 r=1 f r + f j x o j xu j (x x u j ) 125

63 Beispiel: (vgl. Folien 114, 115) [I] Monatseinkommen von 5000 Studierenden Obergrenze der letzten Klasse wurde willkürlich auf 1500 Euro gesetzt j EK-Klasse K j f j F (x o j ) 1 0 bis mehr als 250 bis mehr als 500 bis mehr als 750 bis mehr als 1000 bis

64 Beispiel: [I] Zwischen Klassengrenzen wird linear interpoliert, z.b. F (650) f 1 + f 2 + f 3 x o 3 (x x u xu 3 ) 3 = Empirische Verteilungsfunktion zum Beispiel Studierende 0.4 ( ) = ,8 0,86 F(x) 0,6 0,4 0,66 0,2 0 0,26 0, x 127

65 Jetzt: Berechnung von Quantilen bei stetiger Klassierung über empirische Verteilungsfunktion F (x) (vgl. Folie 83, Definition 4.4) Zusatzannahme: Keine der Klassen K j besitzt die Häufigkeit 0 = Emp. VF F (x) ist streng monoton wachsend = Für jedes p (0, 1) hat die Gleichung F (x) = p eine eindeutige Lösung, nämlich das p-quantil x p 128

66 Explizite Berechnung von x p : [I] 1. Bestimme die Klasse K j in der x p liegt, d.h. bestimme das j für das gilt F (x u j ) < p F (xo j ) 2. Löse die Gleichung p = F (x u j ) + f j x o j (x x xu j u ) j nach x auf. Die Lösung approximiert das Quantil x p. 129

67 Explizite Berechnung von x p : [II] p = F (x u j ) + f j x o j xu j (x x u j ) x x u j = p F (xu j ) f j (x o j xu j ) x = x u j + p F (xu j ) f j (x o j xu j ) x = x u j + p F (xu j ) F (x o j ) F (xu j )(xo j xu j ) } {{ } x p 130

68 Beispiel: (vgl. Folie 126, Einkommen Studierende ) Gesucht: unteres Quartil x 0.25 Berechnung von x 0.25 : = F (x u 2 ) < = F (xo 2 ), d.h. x 0.25 K 2 = (250, 500] 2. Damit folgt: x ( ) =

69 Es verbleibt: Berechnung weiterer statistischer Kennzahlen, z.b. Arithmetisches Mittel Varianz bzw. Standardabweichung (Nicht in der VL) 132

70 4.3.6 Schiefemessung Situation: Betrachte Urliste x 1,..., x n (keine stetige Klassierung) Wichtige praktische Feststellung: In der empirischen Wirtschaftsforschung werden Kennzahlen wie arithmetisches Mittel, Varianz, Standardabweichung etc. in der Praxis nicht per Hand ausgerechnet, sondern mit spezieller Auswertungssoftware (z.b. EViews) 133

71 Beispiel: (vgl. Folie 12) Tägliche Wechselkursveränderungsraten der griechischen Drachme zum Euro Stabdiagramm und statistische Kennzahlen für GRD-Veränderungsraten Series: GRD_RET Sample 16/12/1998 1/01/2001 Observations 748 Mean Median Maximum Minimum Std. Dev Skewness Kurtosis Jarque-Bera Probability

72 Sy mmetris c he Verteilung Series: SYMMETRIE Sample Observations Mean Median Maximum Minimum Std. Dev Skewness Kurtosis Jarque-Bera Probability Rechtsschiefe Verteilung Series: RECHTS Sample Observations Mean Median Max imum Minimum Std. Dev Skewness Kurtosis Jarque-Bera Probability Linksschiefe Verteilung Series: LINKS Sample Observations 5000 Mean Median Maximum Minimum Std. Dev Skewness Kurtosis Jarque-Bera Probability

73 Fazit: Datenreihen zeigen unterschiedliches Symmetrieverhalten Jetzt: Kennzahl für Symmetrieverhalten 136

74 Definition 4.10: (Schiefe) Die Schiefe einer Urliste x 1,..., x n ist definiert durch n ( xi x ) 3, wobei wie üblich und g = 1 n s = i=1 x = 1 n 1 n n i=1 s n x i i=1 (x i x) 2 das arithmetische Mittel sowie die Standardabweichung der Daten bezeichnen. 137

75 Bemerkungen: Der zentrale Term in Definition 4.10 ist n i=1 (x i x) 3 Liegen viele Daten x i rechts von x, so ist g tendenziell positiv Liegen viele Daten x i links von x, so ist g tendenziell negativ Insgesamt gelten die folgenden Relationen: g < 0 g 0 g > 0 = Verteilung ist linksschief = Verteilung ist symmetrisch = Verteilung ist rechtsschief 138

1,11 1,12 1,13 1,14 1,15 1,16 1,17 1,17 1,17 1,18

1,11 1,12 1,13 1,14 1,15 1,16 1,17 1,17 1,17 1,18 3. Deskriptive Statistik Ziel der deskriptiven (beschreibenden) Statistik (explorativen Datenanalyse) ist die übersichtliche Darstellung der wesentlichen in den erhobenen Daten enthaltene Informationen

Mehr

2. Deskriptive Statistik 2.1. Häufigkeitstabellen, Histogramme, empirische Verteilungsfunktionen

2. Deskriptive Statistik 2.1. Häufigkeitstabellen, Histogramme, empirische Verteilungsfunktionen 4. Datenanalyse und Modellbildung Deskriptive Statistik 2-1 2. Deskriptive Statistik 2.1. Häufigkeitstabellen, Histogramme, empirische Verteilungsfunktionen Für die Auswertung einer Messreihe, die in Form

Mehr

Analyse klassierter Daten: Vor der Analyse fasst man jeweils mehrere Merkmalsausprägungen in (Merkmalswerte-)Klassen zusammen.

Analyse klassierter Daten: Vor der Analyse fasst man jeweils mehrere Merkmalsausprägungen in (Merkmalswerte-)Klassen zusammen. 4. Analyse univariater Daten: Übersicht Mathematik ist die Wissenschaft der reinen Zahl, Statistik die der empirischen Zahl Von univariaten Daten spricht man, wenn bei der Datenerhebung nur ein Merkmal

Mehr

Statistik I für Betriebswirte Vorlesung 2

Statistik I für Betriebswirte Vorlesung 2 Statistik I für Betriebswirte Vorlesung 2 PD Dr. Frank Heyde TU Bergakademie Freiberg Institut für Stochastik 16. April 2015 PD Dr. Frank Heyde Statistik I für Betriebswirte Vorlesung 2 1 ii) empirische

Mehr

2. Eindimensionale (univariate) Datenanalyse

2. Eindimensionale (univariate) Datenanalyse 2. Eindimensionale (univariate) Datenanalyse Dr. Antje Kiesel Institut für Angewandte Mathematik WS 2011/2012 Kennzahlen, Statistiken In der Regel interessieren uns nicht so sehr die beobachteten Einzeldaten

Mehr

Willkommen zur Vorlesung Statistik

Willkommen zur Vorlesung Statistik Willkommen zur Vorlesung Statistik Thema dieser Vorlesung: Maßzahlen für zentrale Tendenz, Streuung und andere Eigenschaften von Verteilungen Prof. Dr. Wolfgang Ludwig-Mayerhofer Universität Siegen Philosophische

Mehr

1. Einführung und statistische Grundbegriffe. Grundsätzlich unterscheidet man zwei Bedeutungen des Begriffs Statistik:

1. Einführung und statistische Grundbegriffe. Grundsätzlich unterscheidet man zwei Bedeutungen des Begriffs Statistik: . Einführung und statistische Grundbegriffe Grundsätzlich unterscheidet man zwei Bedeutungen des Begriffs Statistik: Quantitative Information Graphische oder tabellarische Darstellung von Datenmaterial

Mehr

1 Verteilungen und ihre Darstellung

1 Verteilungen und ihre Darstellung GKC Statistische Grundlagen für die Korpuslinguistik Kapitel 2: Univariate Deskription von Daten 8.11.2004 Univariate (= eindimensionale) Daten bestehen aus Beobachtungen eines einzelnen Merkmals. 1 Verteilungen

Mehr

Deskriptive Statistik

Deskriptive Statistik Deskriptive Statistik In der beschreibenden Statistik werden Methoden behandelt, mit deren Hilfe man Daten übersichtlich darstellen und kennzeichnen kann. Die Urliste (=Daten in der Reihenfolge ihrer Erhebung)

Mehr

Felix Klug SS 2011. 2. Tutorium Deskriptive Statistik

Felix Klug SS 2011. 2. Tutorium Deskriptive Statistik 2. Tutorium Deskriptive Statistik Felix Klug SS 2011 Skalenniveus Weitere Beispiele für Skalenniveus (Entnommen aus Wiederholungsblatt 1.): Skalenniveu Nominalskala Ordinalskala Intervallskala Verhältnisskala

Mehr

4. Kumulierte Häufigkeiten und Quantile

4. Kumulierte Häufigkeiten und Quantile 4. Kumulierte Häufigkeiten und Quantile Kumulierte Häufigkeiten Oft ist man nicht an der Häufigkeit einzelner Merkmalsausprägungen interessiert, sondern an der Häufigkeit von Intervallen. Typische Fragestellung:

Mehr

Statistik und Wahrscheinlichkeitsrechnung

Statistik und Wahrscheinlichkeitsrechnung Statistik und Wahrscheinlichkeitsrechnung Übung 2 28.02.2008 1 Inhalt der heutigen Übung Beschreibende Statistik Gemeinsames Lösen der Übungsaufgaben 2.1: Häufigkeitsverteilung 2.2: Tukey Boxplot 25:Korrelation

Mehr

Teil I: Deskriptive Statistik

Teil I: Deskriptive Statistik Teil I: Deskriptive Statistik 2 Grundbegriffe 2.1 Merkmal und Stichprobe 2.2 Skalenniveau von Merkmalen 2.3 Geordnete Stichproben und Ränge 2.1 Merkmal und Stichprobe An (geeignet ausgewählten) Untersuchungseinheiten

Mehr

4. Kumulierte Häufigkeiten und Quantile

4. Kumulierte Häufigkeiten und Quantile 4. Kumulierte Häufigkeiten und Quantile Statistik für SoziologInnen 1 4. Kumulierte Häufigkeiten und Quantile Kumulierte Häufigkeiten Oft ist man nicht an der Häufigkeit einzelner Merkmalsausprägungen

Mehr

9. Schätzen und Testen bei unbekannter Varianz

9. Schätzen und Testen bei unbekannter Varianz 9. Schätzen und Testen bei unbekannter Varianz Dr. Antje Kiesel Institut für Angewandte Mathematik WS 2011/2012 Schätzen und Testen bei unbekannter Varianz Wenn wir die Standardabweichung σ nicht kennen,

Mehr

Deskriptive Statistik

Deskriptive Statistik Deskriptive Statistik Deskriptive Statistik: Ziele Daten zusammenfassen durch numerische Kennzahlen. Grafische Darstellung der Daten. Quelle: Ursus Wehrli, Kunst aufräumen 1 Modell vs. Daten Bis jetzt

Mehr

Weitere Lagemaße: Quantile/Perzentile I

Weitere Lagemaße: Quantile/Perzentile I 3 Auswertung von eindimensionalen Daten Lagemaße 3.3 Weitere Lagemaße: Quantile/Perzentile I Für jeden Median x med gilt: Mindestens 50% der Merkmalswerte sind kleiner gleich x med und ebenso mindestens

Mehr

Deskriptive Statistik. (basierend auf Slides von Lukas Meier)

Deskriptive Statistik. (basierend auf Slides von Lukas Meier) Deskriptive Statistik (basierend auf Slides von Lukas Meier) Deskriptive Statistik: Ziele Daten zusammenfassen durch numerische Kennzahlen. Grafische Darstellung der Daten. Quelle: Ursus Wehrli, Kunst

Mehr

Verteilungsfunktion und dquantile

Verteilungsfunktion und dquantile Statistik 1 für SoziologInnen Verteilungsfunktion und dquantile Univ.Prof. Dr. Marcus Hudec Kumulierte Häufigkeiten Hinweis: Damit die Kumulation inhaltlich sinnvoll ist, muss das Merkmal zumindest ordinal

Mehr

Kapitel 3: Lagemaße. Ziel. Komprimierung der Daten zu einer Kenngröße, welche die Lage, das Zentrum der Daten beschreibt

Kapitel 3: Lagemaße. Ziel. Komprimierung der Daten zu einer Kenngröße, welche die Lage, das Zentrum der Daten beschreibt Kapitel 3: Lagemaße Ziel Komprimierung der Daten zu einer Kenngröße, welche die Lage, das Zentrum der Daten beschreibt Dr. Matthias Arnold 52 Definition 3.1 Seien x 1,...,x n Ausprägungen eines kardinal

Mehr

Methoden der empirischen Sozialforschung I

Methoden der empirischen Sozialforschung I Methoden der empirischen Sozialforschung I Annelies Blom, PhD TU Kaiserslautern Wintersemester 2011/12 Übersicht Quantitative Datenauswertung: deskriptive und induktive Statistik Wiederholung: Die wichtigsten

Mehr

Korrelation (II) Korrelation und Kausalität

Korrelation (II) Korrelation und Kausalität Korrelation (II) Korrelation und Kausalität Situation: Seien X, Y zwei metrisch skalierte Merkmale mit Ausprägungen (x 1, x 2,..., x n ) bzw. (y 1, y 2,..., y n ). D.h. für jede i = 1, 2,..., n bezeichnen

Mehr

Primzahlen und RSA-Verschlüsselung

Primzahlen und RSA-Verschlüsselung Primzahlen und RSA-Verschlüsselung Michael Fütterer und Jonathan Zachhuber 1 Einiges zu Primzahlen Ein paar Definitionen: Wir bezeichnen mit Z die Menge der positiven und negativen ganzen Zahlen, also

Mehr

4. Erstellen von Klassen

4. Erstellen von Klassen Statistik mit Tabellenkalkulation 4. Erstellen von Klassen Mit einem einfachen Befehl lässt sich eine Liste von Zahlen auf die Häufigkeit der einzelnen Werte untersuchen. Verwenden Sie dazu den Befehl

Mehr

Deskriptive Statistik

Deskriptive Statistik Deskriptive Statistik [descriptive statistics] Ziel der deskriptiven (beschreibenden) Statistik einschließlich der explorativen Datenanalyse [exploratory data analysis] ist zunächst die übersichtliche

Mehr

Kapitel 1 Beschreibende Statistik

Kapitel 1 Beschreibende Statistik Beispiel 1.25: fiktive Aktienkurse Zeitpunkt i 0 1 2 Aktienkurs x i 100 160 100 Frage: Wie hoch ist die durchschnittliche Wachstumsrate? Dr. Karsten Webel 53 Beispiel 1.25: fiktive Aktienkurse (Fortsetzung)

Mehr

1 Darstellen von Daten

1 Darstellen von Daten 1 Darstellen von Daten BesucherInnenzahlen der Bühnen Graz in der Spielzeit 2010/11 1 Opernhaus 156283 Hauptbühne 65055 Probebühne 7063 Ebene 3 2422 Next Liberty 26800 Säulen- bzw. Balkendiagramm erstellen

Mehr

Kapitel 2. Häufigkeitsverteilungen

Kapitel 2. Häufigkeitsverteilungen 6 Kapitel 2 Häufigkeitsverteilungen Ziel: Darstellung bzw Beschreibung (Exploration) einer Variablen Ausgangssituation: An n Einheiten ω,, ω n sei das Merkmal X beobachtet worden x = X(ω ),, x n = X(ω

Mehr

Kreisdiagramm, Tortendiagramm

Kreisdiagramm, Tortendiagramm Kreisdiagramm, Tortendiagramm Darstellung der relativen (absoluten) Häufigkeiten als Fläche eines Kreises Anwendung: Nominale Merkmale Ordinale Merkmale (Problem: Ordnung nicht korrekt wiedergegeben) Gruppierte

Mehr

Zusammenhänge zwischen metrischen Merkmalen

Zusammenhänge zwischen metrischen Merkmalen Zusammenhänge zwischen metrischen Merkmalen Darstellung des Zusammenhangs, Korrelation und Regression Daten liegen zu zwei metrischen Merkmalen vor: Datenpaare (x i, y i ), i = 1,..., n Beispiel: x: Anzahl

Mehr

Expertenrunde Gruppe 1: Wiederholungsgruppe EXCEL (Datenerfassung, Darstellungsformen, Verwertung)

Expertenrunde Gruppe 1: Wiederholungsgruppe EXCEL (Datenerfassung, Darstellungsformen, Verwertung) Epertenrunde Gruppe 1: Wiederholungsgruppe EXCEL (Datenerfassung, Darstellungsformen, Verwertung) Im Folgenden wird mit Hilfe des Programms EXEL, Version 007, der Firma Microsoft gearbeitet. Die meisten

Mehr

Verfahren für metrische Variable

Verfahren für metrische Variable Verfahren für metrische Variable Grafische Methoden Histogramm Mittelwertsplot Boxplot Lagemaße Mittelwert, Median, Quantile Streuungsmaße Standardabweichung, Interquartilsabstand Lagemaße und Streumaße

Mehr

Einfache statistische Auswertungen mit dem TI-Nspire

Einfache statistische Auswertungen mit dem TI-Nspire 1. Neues Dokument und darin eine neue Seite anlegen Als Typ 6: Lists & Spreadsheet wählen. Darin die Messwerte in einer Spalte erfassen. Dies ergibt die Urliste. Wenn mehrere Messwerte vorliegen, die diejenigen,

Mehr

Univariate Häufigkeitsverteilungen Kühnel, Krebs 2001: Statistik für die Sozialwissenschaften, S.41-66

Univariate Häufigkeitsverteilungen Kühnel, Krebs 2001: Statistik für die Sozialwissenschaften, S.41-66 Univariate Häufigkeitsverteilungen Kühnel, Krebs 2001: Statistik für die Sozialwissenschaften, S.41-66 Gabriele Doblhammer: Empirische Sozialforschung Teil II, SS 2004 1/19 Skalenniveaus Skalenniveau Relation

Mehr

Statistik I für Betriebswirte Vorlesung 9

Statistik I für Betriebswirte Vorlesung 9 Statistik I für Betriebswirte Vorlesung 9 Dr. Andreas Wünsche TU Bergakademie Freiberg Institut für Stochastik Vorlesung am 8. Juni 2017 im Audi-Max (AUD-1001) Dr. Andreas Wünsche Statistik I für Betriebswirte

Mehr

1 Mathematische Grundlagen

1 Mathematische Grundlagen Mathematische Grundlagen - 1-1 Mathematische Grundlagen Der Begriff der Menge ist einer der grundlegenden Begriffe in der Mathematik. Mengen dienen dazu, Dinge oder Objekte zu einer Einheit zusammenzufassen.

Mehr

Kontingenzkoeffizient (nach Pearson)

Kontingenzkoeffizient (nach Pearson) Assoziationsmaß für zwei nominale Merkmale misst die Unabhängigkeit zweier Merkmale gibt keine Richtung eines Zusammenhanges an 46 o jl beobachtete Häufigkeiten der Kombination von Merkmalsausprägungen

Mehr

Verteilungsfunktion und Quantile

Verteilungsfunktion und Quantile Statistik 1 für SoziologInnen Verteilungsfunktion und Quantile Univ.Prof. Dr. Marcus Hudec Kumulierte Häufigkeiten Hinweis: Damit das Kumulieren inhaltlich sinnvoll ist, muss das Merkmal zumindest ordinal

Mehr

Statistik im Versicherungs- und Finanzwesen

Statistik im Versicherungs- und Finanzwesen Springer Gabler PLUS Zusatzinformationen zu Medien von Springer Gabler Grimmer Statistik im Versicherungs- und Finanzwesen Eine anwendungsorientierte Einführung 2014 1. Auflage Übungsaufgaben zu Kapitel

Mehr

Codierungstheorie Rudolf Scharlau, SoSe 2006 9

Codierungstheorie Rudolf Scharlau, SoSe 2006 9 Codierungstheorie Rudolf Scharlau, SoSe 2006 9 2 Optimale Codes Optimalität bezieht sich auf eine gegebene Quelle, d.h. eine Wahrscheinlichkeitsverteilung auf den Symbolen s 1,..., s q des Quellalphabets

Mehr

Einführung in Quantitative Methoden

Einführung in Quantitative Methoden Einführung in Quantitative Methoden Mag. Dipl.Ing. Dr. Pantelis Christodoulides & Mag. Dr. Karin Waldherr SS 2014 Christodoulides / Waldherr Einführung in Quantitative Methoden- 2.VO 1/57 Die Deskriptivstatistik

Mehr

Deskriptive Statistik

Deskriptive Statistik Deskriptive Statistik 1 Ziele In der deskriptiven (=beschreibenden) Statistik werden Untersuchungsergebnisse übersichtlich dargestellt, durch Kennzahlen charakterisiert und grafisch veranschaulicht. 2

Mehr

Franz Kronthaler. Statistik angewandt. Datenanalyse ist (k)eine Kunst. Excel Edition. ^ Springer Spektrum

Franz Kronthaler. Statistik angewandt. Datenanalyse ist (k)eine Kunst. Excel Edition. ^ Springer Spektrum Franz Kronthaler Statistik angewandt Datenanalyse ist (k)eine Kunst Excel Edition ^ Springer Spektrum Inhaltsverzeichnis Teil I Basiswissen und Werkzeuge, um Statistik anzuwenden 1 Statistik ist Spaß 3

Mehr

6. Auswertung mehrdimensionaler Daten

6. Auswertung mehrdimensionaler Daten 6. Auswertung mehrdimensionaler Daten Bisher: Auswertungsmethoden für Daten eines einzelnen Merkmals, z.b. Diskrete Klassierung Grafische Darstellungen (Verteilungsfunktion) Lagemaße Streungsmaße Schiefemaße

Mehr

Folien zur Vorlesung. Statistik I (Deskriptive Statistik)

Folien zur Vorlesung. Statistik I (Deskriptive Statistik) Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00-11.30 Uhr Hörsaal: Aula am Aasee Prof. Dr. Bernd Wilfling Westfälische Wilhelms-Universität Münster Inhalt

Mehr

Verteilungsfunktion und Quantile

Verteilungsfunktion und Quantile Statistik 1 für SoziologInnen Verteilungsfunktion und Quantile Univ.Prof. Dr. Marcus Hudec Kumulierte Häufigkeiten Hinweis: Damit das Kumulieren inhaltlich sinnvoll ist, muss das auszuwertende Merkmal

Mehr

11.3 Komplexe Potenzreihen und weitere komplexe Funktionen

11.3 Komplexe Potenzreihen und weitere komplexe Funktionen .3 Komplexe Potenzreihen und weitere komplexe Funktionen Definition.) komplexe Folgen: z n = x n + j. y n mit zwei reellen Folgen x n und y n.) Konvergenz: Eine komplexe Folge z n = x n + j. y n heißt

Mehr

Statistik I für Betriebswirte Vorlesung 5

Statistik I für Betriebswirte Vorlesung 5 Statistik I für Betriebswirte Vorlesung 5 PD Dr. Frank Heyde TU Bergakademie Freiberg Institut für Stochastik 07. Mai 2015 PD Dr. Frank Heyde Statistik I für Betriebswirte Vorlesung 5 1 Klassische Wahrscheinlichkeitsdefinition

Mehr

x 2 2x + = 3 + Es gibt genau ein x R mit ax + b = 0, denn es gilt

x 2 2x + = 3 + Es gibt genau ein x R mit ax + b = 0, denn es gilt - 17 - Die Frage ist hier also: Für welche x R gilt x = x + 1? Das ist eine quadratische Gleichung für x. Es gilt x = x + 1 x x 3 = 0, und man kann quadratische Ergänzung machen:... ( ) ( ) x x + = 3 +

Mehr

2 Häufigkeitsverteilungen

2 Häufigkeitsverteilungen 2 Häufigkeitsverteilungen Ziel: Darstellung bzw Beschreibung (Exploration) einer Variablen Ausgangssituation An n Einheiten ω 1,,ω n sei das Merkmal X beobachtet worden x 1 = X(ω 1 ),,x n = X(ω n ) Also

Mehr

Auswertung und Darstellung wissenschaftlicher Daten (1)

Auswertung und Darstellung wissenschaftlicher Daten (1) Auswertung und Darstellung wissenschaftlicher Daten () Mag. Dr. Andrea Payrhuber Zwei Schritte der Auswertung. Deskriptive Darstellung aller Daten 2. analytische Darstellung (Gruppenvergleiche) SPSS-Andrea

Mehr

90-minütige Klausur Statistik für Studierende der Kommunikationswissenschaft

90-minütige Klausur Statistik für Studierende der Kommunikationswissenschaft Prof. Dr. Helmut Küchenhoff SS08 90-minütige Klausur Statistik für Studierende der Kommunikationswissenschaft am 22.7.2008 Anmerkungen Überprüfen Sie bitte sofort, ob Ihre Angabe vollständig ist. Sie sollte

Mehr

Nichtlineare Optimierung ohne Nebenbedingungen

Nichtlineare Optimierung ohne Nebenbedingungen Kapitel 2 Nichtlineare Optimierung ohne Nebenbedingungen In diesem Abschnitt sollen im wesentlichen Verfahren zur Bestimmung des Minimums von nichtglatten Funktionen in einer Variablen im Detail vorgestellt

Mehr

4 Statistische Maßzahlen

4 Statistische Maßzahlen 4 Statistische Maßzahlen 4.1 Maßzahlen der mittleren Lage 4.2 Weitere Maßzahlen der Lage 4.3 Maßzahlen der Streuung 4.4 Lineare Transformationen, Schiefemaße 4.5 Der Box Plot Ziel: Charakterisierung einer

Mehr

Herzlich willkommen zur Vorlesung Statistik. Streuungsmaße oder die Unterschiedlichkeit der Daten nebst kurzen Ausführungen zu Schiefe und Wölbung

Herzlich willkommen zur Vorlesung Statistik. Streuungsmaße oder die Unterschiedlichkeit der Daten nebst kurzen Ausführungen zu Schiefe und Wölbung FB 1 W. Ludwig-Mayerhofer Statistik 1 Herzlich willkommen zur Vorlesung Statistik smaße oder die Unterschiedlichkeit der Daten nebst kurzen Ausführungen zu Schiefe und Wölbung FB 1 W. Ludwig-Mayerhofer

Mehr

Fachrechnen für Tierpfleger

Fachrechnen für Tierpfleger Z.B.: Fachrechnen für Tierpfleger A10. Statistik 10.1 Allgemeines Was ist Statistik? 1. Daten sammeln: Durch Umfragen, Zählung, Messung,... 2. Daten präsentieren: Tabellen, Grafiken 3. Daten beschreiben/charakterisieren:

Mehr

Statistik I für Betriebswirte Vorlesung 9

Statistik I für Betriebswirte Vorlesung 9 Statistik I für Betriebswirte Vorlesung 9 Prof. Dr. Hans-Jörg Starkloff TU Bergakademie Freiberg Institut für Stochastik 06. Juni 2016 Prof. Dr. Hans-Jörg Starkloff Statistik I für Betriebswirte Vorlesung

Mehr

Füllmenge. Füllmenge. Füllmenge. Füllmenge. Mean = 500,0029 Std. Dev. = 3,96016 N = 10.000. 485,00 490,00 495,00 500,00 505,00 510,00 515,00 Füllmenge

Füllmenge. Füllmenge. Füllmenge. Füllmenge. Mean = 500,0029 Std. Dev. = 3,96016 N = 10.000. 485,00 490,00 495,00 500,00 505,00 510,00 515,00 Füllmenge 2.4 Stetige Zufallsvariable Beispiel. Abfüllung von 500 Gramm Packungen einer bestimmten Ware auf einer automatischen Abfüllanlage. Die Zufallsvariable X beschreibe die Füllmenge einer zufällig ausgewählten

Mehr

h i Deskriptive Statistik 1-dimensionale Daten Daten und Häufigkeiten Seite 1 Nominal Ordinal Metrisch (Kardinal) Metrisch - klassiert

h i Deskriptive Statistik 1-dimensionale Daten Daten und Häufigkeiten Seite 1 Nominal Ordinal Metrisch (Kardinal) Metrisch - klassiert Deskriptive Statistik dimesioale Date Date ud Häufigkeite Seite Nomial Ordial Metrisch (Kardial Metrisch klassiert Beschreibug: Date habe keie atürliche Reihefolge. Bsp: Farbe, Religio, Geschlecht, Natioalität...

Mehr

Klausur zu Methoden der Statistik I (mit Kurzlösung) Wintersemester 2007/2008. Aufgabe 1

Klausur zu Methoden der Statistik I (mit Kurzlösung) Wintersemester 2007/2008. Aufgabe 1 Lehrstuhl für Statistik und Ökonometrie der Otto-Friedrich-Universität Bamberg Prof. Dr. Susanne Rässler Klausur zu Methoden der Statistik I (mit Kurzlösung) Wintersemester 2007/2008 Aufgabe 1 Ihnen liegt

Mehr

Empirische Verteilungsfunktion

Empirische Verteilungsfunktion Empirische Verteilungsfunktion H(x) := Anzahl der Werte x ist. Deskriptive

Mehr

Statistik I für Betriebswirte Vorlesung 11

Statistik I für Betriebswirte Vorlesung 11 Statistik I für Betriebswirte Vorlesung 11 Prof. Dr. Hans-Jörg Starkloff TU Bergakademie Freiberg Institut für Stochastik 22. Juni 2012 Prof. Dr. Hans-Jörg Starkloff Statistik I für Betriebswirte Vorlesung

Mehr

Datenanalyse und Statistik

Datenanalyse und Statistik Datenanalyse und Statistik p. 1/44 Datenanalyse und Statistik Vorlesung 2 (Graphik I) K.Gerald van den Boogaart http://www.stat.boogaart.de Datenanalyse und Statistik p. 2/44 Daten Schätzung Test Mathe

Mehr

Dokumentation. estat Version 2.0

Dokumentation. estat Version 2.0 Dokumentation estat Version 2.0 Installation Die Datei estat.xla in beliebiges Verzeichnis speichern. Im Menü Extras AddIns... Durchsuchen die Datei estat.xla auswählen. Danach das Auswahlhäkchen beim

Mehr

Behörde für Bildung und Sport Abitur 2008 Lehrermaterialien zum Leistungskurs Mathematik

Behörde für Bildung und Sport Abitur 2008 Lehrermaterialien zum Leistungskurs Mathematik Abitur 8 II. Insektenpopulation LA/AG In den Tropen legen die Weibchen einer in Deutschland unbekannten Insektenpopulation jedes Jahr kurz vor Beginn der Regenzeit jeweils 9 Eier und sterben bald darauf.

Mehr

Teil II: Einführung in die Statistik

Teil II: Einführung in die Statistik Teil II: Einführung in die Statistik (50 Punkte) Bitte beantworten Sie ALLE Fragen. Es handelt sich um multiple choice Fragen. Sie müssen die exakte Antwortmöglichkeit angeben, um die volle Punktzahl zu

Mehr

5. Schließende Statistik. 5.1. Einführung

5. Schließende Statistik. 5.1. Einführung 5. Schließende Statistik 5.1. Einführung Sollen auf der Basis von empirischen Untersuchungen (Daten) Erkenntnisse gewonnen und Entscheidungen gefällt werden, sind die Methoden der Statistik einzusetzen.

Mehr

Anhand des bereits hergeleiteten Models erstellen wir nun mit der Formel

Anhand des bereits hergeleiteten Models erstellen wir nun mit der Formel Ausarbeitung zum Proseminar Finanzmathematische Modelle und Simulationen bei Raphael Kruse und Prof. Dr. Wolf-Jürgen Beyn zum Thema Simulation des Anlagenpreismodels von Simon Uphus im WS 09/10 Zusammenfassung

Mehr

Einführung in Quantitative Methoden

Einführung in Quantitative Methoden Einführung in Quantitative Methoden Mag. Dipl.Ing. Dr. Pantelis Christodoulides & Mag. Dr. Karin Waldherr SS 2011 Christodoulides / Waldherr Einführung in Quantitative Methoden- 2.VO 1/62 Summenzeichen

Mehr

Statistik I. Zusammenfassung und wichtiges zur Prüfungsvorbereitung. Malte Wissmann. 9. Dezember Universität Basel.

Statistik I. Zusammenfassung und wichtiges zur Prüfungsvorbereitung. Malte Wissmann. 9. Dezember Universität Basel. Zusammenfassung und wichtiges zur Prüfungsvorbereitung 9. Dezember 2008 Begriffe Kenntnis der wichtigen Begriffe und Unterscheidung dieser. Beispiele: Merkmal, Merkmalsraum, etc. Skalierung: Nominal etc

Mehr

Verteilungsfunktion und Quantile

Verteilungsfunktion und Quantile Statistik 1 für SoziologInnen Verteilungsfunktion und Quantile Univ.Prof. Dr. Marcus Hudec Kumulierte Häufigkeiten Hinweis: Damit das Kumulieren inhaltlich sinnvoll ist, muss das Merkmal zumindest ordinal

Mehr

Kapitel 3: Eindimensionale Häufigkeitsverteilungen

Kapitel 3: Eindimensionale Häufigkeitsverteilungen Kapitel 3: Eindimensionale Häufigkeitsverteilungen. Unklassierte Daten...29 a) Häufigkeitsverteilung...29 b) Tabellen und Graphiken...3 c) Summenhäufigkeiten...34 2. Klassierte Daten...38 a) Größenklassen...38

Mehr

2.12 Potenzreihen. 1. Definitionen. 2. Berechnung 2.12. POTENZREIHEN 207. Der wichtigste Spezialfall von Funktionenreihen sind Potenzreihen.

2.12 Potenzreihen. 1. Definitionen. 2. Berechnung 2.12. POTENZREIHEN 207. Der wichtigste Spezialfall von Funktionenreihen sind Potenzreihen. 2.2. POTENZREIHEN 207 2.2 Potenzreihen. Definitionen Der wichtigste Spezialfall von Funktionenreihen sind Potenzreihen. Eine Potenzreihe mit Entwicklungspunkt x 0 ist eine Reihe a n x x 0 n. Es gilt: es

Mehr

Standardisierung von Daten Darstellung von Daten in Texten, Tabellen und Abbildungen. Standardisierung von Daten

Standardisierung von Daten Darstellung von Daten in Texten, Tabellen und Abbildungen. Standardisierung von Daten DAS THEMA: TABELLEN UND ABBILDUNGEN Standardisierung von Daten Darstellung von Daten in Texten, Tabellen und Abbildungen Standardisierung von Daten z-standardisierung Standardnormalverteilung 1 DIE Z-STANDARDISIERUNG

Mehr

Diskrete Zufallsvariablen (Forts.) I

Diskrete Zufallsvariablen (Forts.) I 9 Eindimensionale Zufallsvariablen Diskrete Zufallsvariablen 9.4 Diskrete Zufallsvariablen (Forts.) I T (X ) ist endlich oder abzählbar unendlich, die Elemente von T (X ) werden daher im Folgenden häufig

Mehr

Diskrete Zufallsvariablen (Forts.) I

Diskrete Zufallsvariablen (Forts.) I 9 Eindimensionale Zufallsvariablen Diskrete Zufallsvariablen 9.4 Diskrete Zufallsvariablen (Forts.) I T (X ) ist endlich oder abzählbar unendlich, die Elemente von T (X ) werden daher im Folgenden häufig

Mehr

Deskription, Statistische Testverfahren und Regression. Seminar: Planung und Auswertung klinischer und experimenteller Studien

Deskription, Statistische Testverfahren und Regression. Seminar: Planung und Auswertung klinischer und experimenteller Studien Deskription, Statistische Testverfahren und Regression Seminar: Planung und Auswertung klinischer und experimenteller Studien Deskriptive Statistik Deskriptive Statistik: beschreibende Statistik, empirische

Mehr

Zufallsgrößen. Vorlesung Statistik für KW 29.04.2008 Helmut Küchenhoff

Zufallsgrößen. Vorlesung Statistik für KW 29.04.2008 Helmut Küchenhoff Zufallsgrößen 2.5 Zufallsgrößen 2.5.1 Verteilungsfunktion einer Zufallsgröße 2.5.2 Wahrscheinlichkeits- und Dichtefunktion Wahrscheinlichkeitsfunktion einer diskreten Zufallsgröße Dichtefunktion einer

Mehr

2 Analyse statistischer Daten zu einem Merkmal Lösungshinweise

2 Analyse statistischer Daten zu einem Merkmal Lösungshinweise 6 2 Analyse statistischer Daten zu einem Merkmal Lösungshinweise 2 Analyse statistischer Daten zu einem Merkmal Lösungshinweise : In der folgenden Tabelle ist eine Teilstichprobe zu den Studierenden in

Mehr

Lineare Gleichungssysteme

Lineare Gleichungssysteme Brückenkurs Mathematik TU Dresden 2015 Lineare Gleichungssysteme Schwerpunkte: Modellbildung geometrische Interpretation Lösungsmethoden Prof. Dr. F. Schuricht TU Dresden, Fachbereich Mathematik auf der

Mehr

Lineare Funktionen. 1 Proportionale Funktionen 3 1.1 Definition... 3 1.2 Eigenschaften... 3. 2 Steigungsdreieck 3

Lineare Funktionen. 1 Proportionale Funktionen 3 1.1 Definition... 3 1.2 Eigenschaften... 3. 2 Steigungsdreieck 3 Lineare Funktionen Inhaltsverzeichnis 1 Proportionale Funktionen 3 1.1 Definition............................... 3 1.2 Eigenschaften............................. 3 2 Steigungsdreieck 3 3 Lineare Funktionen

Mehr

Der Zwei-Quadrate-Satz von Fermat

Der Zwei-Quadrate-Satz von Fermat Der Zwei-Quadrate-Satz von Fermat Proseminar: Das BUCH der Beweise Fridtjof Schulte Steinberg Institut für Informatik Humboldt-Universität zu Berlin 29.November 2012 1 / 20 Allgemeines Pierre de Fermat

Mehr

Statistik und Wahrscheinlichkeitsrechnung

Statistik und Wahrscheinlichkeitsrechnung Statistik und Wahrscheinlichkeitsrechnung 3. Vorlesung Dr. Jochen Köhler 1 Inhalte der heutigen Vorlesung Ziel: Daten Modellbildung Probabilistisches Modell Wahrscheinlichkeit von Ereignissen Im ersten

Mehr

Profil A 49,3 48,2 50,7 50,9 49,8 48,7 49,6 50,1 Profil B 51,8 49,6 53,2 51,1 51,1 53,4 50,7 50 51,5 51,7 48,8

Profil A 49,3 48,2 50,7 50,9 49,8 48,7 49,6 50,1 Profil B 51,8 49,6 53,2 51,1 51,1 53,4 50,7 50 51,5 51,7 48,8 1. Aufgabe: Eine Reifenfirma hat für Winterreifen unterschiedliche Profile entwickelt. Bei jeweils gleicher Geschwindigkeit und auch sonst gleichen Bedingungen wurden die Bremswirkungen gemessen. Die gemessenen

Mehr

1. Mathematik-Schularbeit 6. Klasse AHS

1. Mathematik-Schularbeit 6. Klasse AHS . Mathematik-Schularbeit 6. Klasse AHS Arbeitszeit: 50 Minuten Lernstoff: Mathematische Grundkompetenzen: (Un-)Gleichungen und Gleichungssysteme: AG. Einfache Terme und Formeln aufstellen, umformen und

Mehr

Statistik K urs SS 2004

Statistik K urs SS 2004 Statistik K urs SS 2004 3.Tag Grundlegende statistische Maße Mittelwert (mean) Durchschnitt aller Werte Varianz (variance) s 2 Durchschnittliche quadrierte Abweichung aller Werte vom Mittelwert >> Die

Mehr

Plotten von Linien ( nach Jack Bresenham, 1962 )

Plotten von Linien ( nach Jack Bresenham, 1962 ) Plotten von Linien ( nach Jack Bresenham, 1962 ) Ac Eine auf dem Bildschirm darzustellende Linie sieht treppenförmig aus, weil der Computer Linien aus einzelnen (meist quadratischen) Bildpunkten, Pixels

Mehr

Melanie Kaspar, Prof. Dr. B. Grabowski 1

Melanie Kaspar, Prof. Dr. B. Grabowski 1 7. Hypothesentests Ausgangssituation: Man muss sich zwischen 2 Möglichkeiten (=Hypothesen) entscheiden. Diese Entscheidung soll mit Hilfe von Beobachtungen ( Stichprobe ) getroffen werden. Die Hypothesen

Mehr

4 Statistische Maßzahlen

4 Statistische Maßzahlen 4 Statistische Maßzahlen 4.1 Maßzahlen der mittleren Lage 4.2 Weitere Maßzahlen der Lage 4.3 Maßzahlen der Streuung 4.4 Lineare Transformationen, Schiefemaße 4.5 Der Box Plot Ziel: Charakterisierung einer

Mehr

Übungsklausur. Bitte wählen Sie fünf Aufgaben aus! Aufgabe 1. Übungsklausur zu Mathematik I für BWL und VWL (WS 2008/09) PD Dr.

Übungsklausur. Bitte wählen Sie fünf Aufgaben aus! Aufgabe 1. Übungsklausur zu Mathematik I für BWL und VWL (WS 2008/09) PD Dr. Übungsklausur zu Mathematik I für BWL und VWL (WS 2008/09) PD Dr. Gert Zöller Übungsklausur Hilfsmittel: Taschenrechner, Formblatt mit Formeln. Lösungswege sind stets anzugeben. Die alleinige Angabe eines

Mehr

1. Allgemeine Hinweise Alexander.Martin.Koenig@TU-Clausthal.de

1. Allgemeine Hinweise Alexander.Martin.Koenig@TU-Clausthal.de 1. Allgemeine Hinweise Alexander.Martin.Koenig@TU-Clausthal.de Man sollte eine Excel-Tabelle immer so übersichtlich wie möglich halten. Dazu empfiehlt es sich, alle benötigten Daten, Konstanten und Messwerte

Mehr

Unterrichtsmaterialien in digitaler und in gedruckter Form. Auszug aus: Übungsbuch für den Grundkurs mit Tipps und Lösungen: Analysis

Unterrichtsmaterialien in digitaler und in gedruckter Form. Auszug aus: Übungsbuch für den Grundkurs mit Tipps und Lösungen: Analysis Unterrichtsmaterialien in digitaler und in gedruckter Form Auszug aus: Übungsbuch für den Grundkurs mit Tipps und Lösungen: Analysis Das komplette Material finden Sie hier: Download bei School-Scout.de

Mehr

Lösungen zu Janssen/Laatz, Statistische Datenanalyse mit SPSS 1

Lösungen zu Janssen/Laatz, Statistische Datenanalyse mit SPSS 1 LÖSUNG 3A Lösungen zu Janssen/Laatz, Statistische Datenanalyse mit SPSS 1 Mit den Berechnungsfunktionen LG10(?) und SQRT(?) in "Transformieren", "Berechnen" können logarithmierte Werte sowie die Quadratwurzel

Mehr

1.1 Graphische Darstellung von Messdaten und unterschiedliche Mittelwerte. D. Horstmann: Oktober

1.1 Graphische Darstellung von Messdaten und unterschiedliche Mittelwerte. D. Horstmann: Oktober 1.1 Graphische Darstellung von Messdaten und unterschiedliche Mittelwerte D. Horstmann: Oktober 2014 4 Graphische Darstellung von Daten und unterschiedliche Mittelwerte Eine Umfrage nach der Körpergröße

Mehr

Einfache Statistiken in Excel

Einfache Statistiken in Excel Einfache Statistiken in Excel Dipl.-Volkswirtin Anna Miller Bergische Universität Wuppertal Schumpeter School of Business and Economics Lehrstuhl für Internationale Wirtschaft und Regionalökonomik Raum

Mehr

Kapitel 1 Beschreibende Statistik

Kapitel 1 Beschreibende Statistik Beispiel 1.5: Histogramm (klassierte erreichte Punkte, Fortsetzung Bsp. 1.1) 0.25 0.2 Höhe 0.15 0.1 0.05 0 0 6 7 8,5 10 11 erreichte Punkte Dr. Karsten Webel 24 Beispiel 1.5: Histogramm (Fortsetzung) Klasse

Mehr

2. Deskriptive Statistik

2. Deskriptive Statistik Philipps-Universitat Marburg 2.1 Stichproben und Datentypen Untersuchungseinheiten: mogliche, statistisch zu erfassende Einheiten je Untersuchungseinheit: ein oder mehrere Merkmale oder Variablen beobachten

Mehr

Kapitel 3. Zufallsvariable. Wahrscheinlichkeitsfunktion, Dichte und Verteilungsfunktion. Erwartungswert, Varianz und Standardabweichung

Kapitel 3. Zufallsvariable. Wahrscheinlichkeitsfunktion, Dichte und Verteilungsfunktion. Erwartungswert, Varianz und Standardabweichung Kapitel 3 Zufallsvariable Josef Leydold c 2006 Mathematische Methoden III Zufallsvariable 1 / 43 Lernziele Diskrete und stetige Zufallsvariable Wahrscheinlichkeitsfunktion, Dichte und Verteilungsfunktion

Mehr