Statistik I für Betriebswirte Vorlesung 9

Ähnliche Dokumente
Statistik I für Betriebswirte Vorlesung 9

Statistik I für Betriebswirte Vorlesung 2

Statistik I für Betriebswirte Vorlesung 4

Einführung in Quantitative Methoden

Verfahren für metrische Variable

Einführung in Quantitative Methoden

Weitere Lagemaße: Quantile/Perzentile I

Statistik und Wahrscheinlichkeitsrechnung

3. Deskriptive Statistik

Statistik K urs SS 2004

Kapitel 3: Lagemaße. Ziel. Komprimierung der Daten zu einer Kenngröße, welche die Lage, das Zentrum der Daten beschreibt

Mathematik für Biologen

Institut für Biometrie und klinische Forschung. WiSe 2012/2013

Kapitel 1 Beschreibende Statistik

Mathematik für Biologen

Empirische Verteilungsfunktion

Der Modus ist. Der Median ist. 3. Übung. Aufgabe 1. a) der häufigste Wert. b) der Wert unter dem 50 % aller anderen Werte liegen.

htw saar 1 EINFÜHRUNG IN DIE STATISTIK: BESCHREIBENDE STATISTIK

4 Statistische Maßzahlen

Fachrechnen für Tierpfleger

Herzlich willkommen zur Vorlesung Statistik. Streuungsmaße oder die Unterschiedlichkeit der Daten nebst kurzen Ausführungen zu Schiefe und Wölbung

Statistik und Wahrscheinlichkeitsrechnung

Häufigkeitsverteilungen und Statistische Maßzahlen. Häufigkeitsverteilungen und Statistische Maßzahlen. Variablentypen. Stichprobe und Grundgesamtheit

PROC MEANS. zum Berechnen statistischer Maßzahlen (für quantitative Merkmale)

Univariate Häufigkeitsverteilungen Kühnel, Krebs 2001: Statistik für die Sozialwissenschaften, S.41-66

Deskription, Statistische Testverfahren und Regression. Seminar: Planung und Auswertung klinischer und experimenteller Studien

Statistik und Wahrscheinlichkeitsrechnung

Deskriptive Statistik

4 Statistische Maßzahlen

Verteilungsfunktion und Quantile

Statistik SS Deskriptive Statistik. Bernhard Spangl 1. Universität für Bodenkultur. March 6, 2012

Statistik für Ingenieure Vorlesung 10

(x i x) 2. (x i a) 2, x i x med. x i a. i=1. 3 Lage- und Streuungsmaße 134

Diese Lücken sollten nicht auch bei Ihnen vorhanden sein: Aufgrund einer statistischen Untersuchung entsteht eine geordnete bzw. ungeordnete, die durc

Statistik I für Betriebswirte Vorlesung 10

Stochastik und Statistik für Ingenieure Vorlesung 10

2. Deskriptive Statistik

4. Kumulierte Häufigkeiten und Quantile

Verteilungsfunktion und Quantile

Grundlagen der Wahrscheinlichkeitstheorie und Statistik für Studierende der Informatik

Statistik I für Betriebswirte Vorlesung 10

Beschreibende Statistik Eindimensionale Daten

Lösungen. w58r4p Lösungen. w58r4p. Name: Klasse: Datum:

a) x = 1150 ; x = 950 ; x = 800 b) Die Lagemaße unterscheiden sich voneinander. c) Der Median charakterisiert die Stichprobe am besten.

Statistik für Ingenieure Vorlesung 3

Verteilungen und ihre Darstellungen

5 Exkurs: Deskriptive Statistik

Deskriptive Statistik Kapitel VI - Lage- und Streuungsparameter

Verteilungsfunktion und Quantile

Statistik I. Zusammenfassung und wichtiges zur Prüfungsvorbereitung. Malte Wissmann. 9. Dezember Universität Basel.

Arbeitsbuch zur deskriptiven und induktiven Statistik

Statistik für Ingenieure Vorlesung 9

Inhaltsverzeichnis Grundlagen aufigkeitsverteilungen Maßzahlen und Grafiken f ur eindimensionale Merkmale

Wahrscheinlichkeits - rechnung und Statistik

Kapitel VI - Lage- und Streuungsparameter

Deskriptive Statistik

Deskriptive Statistik Aufgaben und Lösungen

Statistische Kennzahlen für die Lage

Mathematik für Biologen

Kapitel VII - Konzentration von Merkmalswerten

Der Mittelwert (arithmetisches Mittel)

Teil / Ein paar statistische Grundlagen 25. Kapitel 1 Was Statistik ist und Warum sie benötigt Wird 2 7

Lagemaße Übung. Zentrale Methodenlehre, Europa Universität - Flensburg

Statistik I für Betriebswirte Vorlesung 14

Deskriptivstatistik a) Univariate Statistik Weiters zum Thema der statistischen Informationsverdichtung

Stochastik Deskriptive Statistik

Grundlagen der empirischen Sozialforschung

Kreisdiagramm, Tortendiagramm

1 45, 39, 44, 48, 42, 39, 40, , 31, 46, 35, 31, 42, 51, , 42, 33, 46, 33, 44, 43

Statistik II für Betriebswirte Vorlesung 2

Deskriptive Statistik

WISTA WIRTSCHAFTSSTATISTIK

Ermitteln Sie auf 2 Dezimalstellen genau die folgenden Kenngrößen der bivariaten Verteilung der Merkmale Weite und Zeit:

Das arithmetische Mittel. x i = = 8. x = 1 4. und. y i = = 8

absolute Häufigkeit h: Anzahl einer bestimmten Note relative Häufigkeit r: Anzahl einer bestimmten Note, gemessen an der Gesamtzahl der Noten

Ü B U N G S S K R I P T S T A T I S T I K

Deskriptive Statistik Auswertung durch Informationsreduktion

Beschreibende Statistik Kenngrößen in der Übersicht (Ac )

Statistik I für Betriebswirte Vorlesung 9

Lage- und Streuungsmaße

Die erhobenen Daten werden zunächst in einer Urliste angeschrieben. Daraus ermittelt man:

Deskriptive Statistik Erläuterungen

Einführung in die Statistik für Wirtschaftswissenschaftler für Betriebswirtschaft und Internationales Management

Beispiel 4 (Einige weitere Aufgaben)

Mathematische und statistische Methoden II

Kapitel 1 Beschreibende Statistik

Beispiel für Anwendung: z-tabelle kann genutzt werden, um z.b. Poissonverteilung näherungsweise zu integrieren. Beispiel: wie wahrscheinlich ist es

Statistische Formeln und Tabellen

0 Einführung: Was ist Statistik

Statistik... formeln für Dummies

4. Kumulierte Häufigkeiten und Quantile

1,11 1,12 1,13 1,14 1,15 1,16 1,17 1,17 1,17 1,18

Beispiel 2 (Einige Aufgaben zu Lageparametern) Aufgabe 1 (Lageparameter)

2. Beschreibung von eindimensionalen (univariaten) Stichproben

3) Lagemaße: Mittelwert, Median, Modus

Inhaltsverzeichnis DESKRIPTIVE STATISTIK. 1 Grundlagen Grundbegriffe Skalen... 15

Merkmalstypen Univ.-Prof. Dr. rer. nat. et med. habil. Andreas Faldum

Transkript:

Statistik I für Betriebswirte Vorlesung 9 Prof. Dr. Hans-Jörg Starkloff TU Bergakademie Freiberg Institut für Stochastik 06. Juni 2016 Prof. Dr. Hans-Jörg Starkloff Statistik I für Betriebswirte Vorlesung 9 Version: 13. Juni 2016 1

2.2 Eindimensionale Merkmale 2.2.1 Häufigkeitsverteilungen Eine Stichprobe vom Umfang n sei erhoben und die Variable X (das Merkmal X ) sei beobachtet worden. Urliste (Rohdaten): Liste, in der die erhobenen Beobachtungswerte von X nacheinander aufgeschrieben werden; Bezeichnung: x 1,..., x n. a 1,..., a k : Merkmalsausprägungen, die in der Urliste vorkommen; k n. Absolute Häufigkeit der Ausprägung a i : H i = H(a i ) beschreibt, wie oft die Ausprägung a i bei den n Beobachtungen vorkommt. Relative Häufigkeit der Ausprägung a i : h i = h(a i ) = H i n entspricht dem Anteil der Ausprägung a i bezogen auf die n Beobachtungen. Prof. Dr. Hans-Jörg Starkloff Statistik I für Betriebswirte Vorlesung 9 Version: 13. Juni 2016 2

Beispiel 2.4 Prüfungsnoten Urliste Person Note Person Note Person Note Person Note 1 4 16 3 31 4 46 1 2 3 17 2 32 1 47 2 3 3 18 5 33 4 48 4 4 1 19 3 34 2 49 5 5 5 20 4 35 3 50 3 6 4 21 4 36 5 51 5 7 5 22 5 37 5 52 4 8 3 23 4 38 4 53 5 9 1 24 5 39 3 54 2 10 5 25 5 40 4 55 2 11 5 26 5 51 4 56 3 12 2 27 3 42 4 57 5 13 3 28 4 43 3 58 4 14 5 29 5 44 3 59 4 15 3 30 4 45 5 Prof. Dr. Hans-Jörg Starkloff Statistik I für Betriebswirte Vorlesung 9 Version: 13. Juni 2016 3

Fortsetzung Beispiel 2.4 Note (a i ) 1 2 3 4 5 abs H. (H i ) 4 6 14 17 18 rel. H. (h i ) 0.068 0.102 0.237 0.288 0.305 Prof. Dr. Hans-Jörg Starkloff Statistik I für Betriebswirte Vorlesung 9 Version: 13. Juni 2016 4

Klassenbildung Bei Erstellung einer Häufigkeitsverteilung ist es oft sinnvoll oder sogar nötig, die Informationen aus der Urliste zu straffen, falls die Anzahl der Merkmalsausprägungen k zu groß ist, und/oder ein stetiges Merkmal vorliegt. Ausweg: Klassenbildung: Benachbarte Merkmalsausprägungen werden zu einer Klasse oder Gruppe zusammen gefasst. In der gruppierten Häufigkeitsverteilung erscheinen nur noch die Gruppen mit der Häufigkeit aller Ausprägungen in der Gruppe. Bei der Klassenbildung ist zu beachten: Merkmalsausprägungen möglichst gleichmäßig auf die Klassen verteilen (möglichst gleiche Klassenbreite); keine Überschneidungen der Klassen; Klassen müssen vollständig sein. Prof. Dr. Hans-Jörg Starkloff Statistik I für Betriebswirte Vorlesung 9 Version: 13. Juni 2016 5

Beispiel 2.5 Mieten Merkmal: Mieten (2013) für zufällig ausgewählte Einraumwohnungen in Berlin Mitte in Euro Quelle: Eckstein, Statistik für Wirtschaftswissenschaftler, 5. Auflage 2016, Springer Urliste für n = 45 Wohnungen: 219 275 163 299 268 282 283.1 195.4 327.7 272 243 310 324 280 285 329 227 265.6 334.1 150 321 322 307 300 238 322.5 332.3 385 292.2 360 341 418 340.3 275 286 365 402.1 351 408 501.4 509.5 670 926.1 910 1087 Prof. Dr. Hans-Jörg Starkloff Statistik I für Betriebswirte Vorlesung 9 Version: 13. Juni 2016 6

Häufigkeitstabelle für gruppierte (klassierte) Daten Beispiel 2.5 Mieten Häufigkeitstabellen für Miete Untere Obere Relative Kumulative Kum. Rel. Klasse Grenze Grenze Mittelpunkt Häufigkeit Häufigkeit Häufigkeit Häufigkeit bei oder unterhalb 100 0 0,0000 0 0,0000 1 100 200,0 150,0 3 0,0667 3 0,0667 2 200 300,0 250,0 17 0,3778 20 0,4444 3 300 400,0 350,0 16 0,3556 36 0,8000 4 400 500,0 450,0 3 0,0667 39 0,8667 5 500 600,0 550,0 2 0,0444 41 0,9111 6 600 700,0 650,0 1 0,0222 42 0,9333 7 700 800,0 750,0 0 0,0000 42 0,9333 8 800 900,0 850,0 0 0,0000 42 0,9333 9 900 1000,0 950,0 2 0,0444 44 0,9778 10 1000 1100,0 1050,0 1 0,0222 45 1,0000 oberhalb 1100 0 0,0000 45 1,0000 Mittelwert = 362,273 Standardabweichungen = 188,907 Der StatAdvisor Hier wird eine Häufigkeitstabelle erzeugt, indem der Wertebereich von Miete in gleichbreite Intervalle aufgeteilt und die Anzahl von Datenwerten in jedem Intervall gezählt wird. Die (absoluten) Häufigkeiten sind die Anzahl von Datenwerten in jedem Intervall, während die relativen Häufigkeiten den Anteil der Daten in jedem Intervall (bezogen auf die Gesamtanzahl) zeigen. Sie können die Einstellungen für die Intervalle ändern, indem Sie die rechte Maustaste drücken und die Ergebnisfenster-Optionen auswählen. Sie können sich die Häufigkeiten in einer Grafik anschauen, wenn Sie das Häufigkeitsdiagramm von der Liste der Grafiken auswählen. Prof. Dr. Hans-Jörg Starkloff Statistik I für Betriebswirte Vorlesung 9 Version: 13. Juni 2016 7

Histogramm für gruppierte Daten Bemerkung: Regel für Säulenhöhen: Höhe= Besetzungszahl/Breite, bei abweichenden Klassenbreiten wird die Skalierung der senkrechten Achse meistens weggelassen. Histogramm Beispiel 2.5 Mieten Prof. Dr. Hans-Jörg Starkloff Statistik I für Betriebswirte Vorlesung 9 Version: 13. Juni 2016 8

2.2.2 Statistische Kenngrößen Lagemaße (Wo liegt Mehrzahl / Mitte / Schwerpunkt der beobachteten Merkmalswerte?) Streumaße (Über welchen Bereich erstrecken sich die Beobachtungen, wie stark schwanken sie?) Konzentrationsmaße (Wie sind die Merkmalsausprägungen auf die Merkmalsträger verteilt?) Prof. Dr. Hans-Jörg Starkloff Statistik I für Betriebswirte Vorlesung 9 Version: 13. Juni 2016 9

Lagemaße i) Mittelwerte (für quantitative Merkmale) a) Arithmetisches Mittel: x = 1 n n x i = 1 n (x 1 + x 2 +... + x n ). i=1 Auf Basis relativer Häufigkeiten: x = m h j a j = h 1 a 1 + h 2 a 2 +... + h m a m j=1 bei m Merkmalsausprägungen a j und relativen Häufigkeiten h j. 219 +... + 1087 Im Beispiel 2.5 Mieten: x = = 362.273. 45 Prof. Dr. Hans-Jörg Starkloff Statistik I für Betriebswirte Vorlesung 9 Version: 13. Juni 2016 10

Klassierte (gruppierte) Daten Die Formel x = m h j a j = h 1 a 1 + h 2 a 2 +... + h m a m j=1 kann auch für klassierte Daten verwendet werden zur näherungsweisen Berechnung des arithmetischen Mittels mit a j Klassenmitten. Z.B. in Beispiel 2.5 gilt x 363.333 = 3 150 + 17 250 + 16 350 + 3 450 + 2 550 + 650 + 2 950 + 1050 45. Prof. Dr. Hans-Jörg Starkloff Statistik I für Betriebswirte Vorlesung 9 Version: 13. Juni 2016 11

Zusammenfassung von Mittelwerten Beispiel 2.6 (Quelle: Bleymüller et al, Statistik für Wirtschaftswissenschaftler, 14. Auflage) Unternehmen mit Betrieben A und B A: 400 Beschäftige mit Bruttodurchschnittsverdienst 1920.84 e B: 300 Beschäftige mit Bruttodurchschnittsverdienst 2012.17 e durchschnittlicher Bruttomonatsverdienst sämtlicher 700 Beschäftigten von A und B zusammen: x = 400 1920.84 e + 300 2012.17 e 700 = 1959.98 e Für Mittelwerte aus Teilgesamtheiten gilt: Liegt ein Datensatz in r Teilgesamtheiten (sog. Schichten) vor und kennt man die Stichprobenumfänge n j sowie die arithmetischen Mittel x j pro Schicht, so lässt sich daraus das Gesamtmittel x berechnen als x = 1 r n j x j. n j=1 Prof. Dr. Hans-Jörg Starkloff Statistik I für Betriebswirte Vorlesung 9 Version: 13. Juni 2016 12

b) Geometrisches Mittel Definition: x G = n x 1 x 2... x n Voraussetzung: x i > 0, i = 1, 2,..., n. Berechnung über Häufigkeiten: x G = a h 1 1 ah 2 2... ahm m bei m Merkmalsausprägungen a j und relativen Häufigkeiten h j. Anwendung zum Beispiel bei der Mittelung von Wachstumsfaktoren. Zahlenbeispiel Zeitpunkt 0 1 2 Kapital 100 81 100 Wachstumsfaktor x 1 = 0.81 x 2 = 1.234 x G = 1.000 aber x = 1.022 (obwohl insgesamt kein Wachstum des Kapitals). Es gilt immer x G x. Prof. Dr. Hans-Jörg Starkloff Statistik I für Betriebswirte Vorlesung 9 Version: 13. Juni 2016 13

ii) Empirische Quantile Ordnen der Datenreihe x 1, x 2,..., x n ergibt geordnete Datenreihe (geordnete Stichprobe, Variationsreihe) x min := x (1) x (2)... x (n 1) x (n) =: x max. Empirisches α-quantil (0 < α < 1): Zahlenwert x α, so dass α 100% der Werte in der Variationsreihe links davon liegen: x (k) falls nα keine ganze Zahl ist, k ist x α = dann die auf nα folgende ganze Zahl ( ) x(k) + x (k+1) falls nα =: k eine ganze Zahl ist 1 2 (für quantitative Merkmale). Prof. Dr. Hans-Jörg Starkloff Statistik I für Betriebswirte Vorlesung 9 Version: 13. Juni 2016 14

Empirischer Median, empirische Quartile Empirischer Median: empirisches 0.5-Quantil, (mittlerer Wert der geordneten Stichprobe) x ( n+1 2 ), falls n ungerade; x = x med := x 0.5 = 1 2 ( x ( n 2) + x ( n 2 +1) ), falls n gerade. Unteres empirisches Quartil (unterer Viertelwert): V u = x 0.25. Oberes empirisches Quartil (oberer Viertelwert): V o = x 0.75. Bemerkung: Der arithmetische Mittelwert x ist empfindlich gegenüber Ausreißern, der Median x weniger. Prof. Dr. Hans-Jörg Starkloff Statistik I für Betriebswirte Vorlesung 9 Version: 13. Juni 2016 15

iii) Empirischer Modalwert, Modus x mod Wert mit der größten Häufigkeit in der Stichprobe. Hängt bei klassierten Daten stark von der gewählten Klasseneinteilung ab Modalklasse. Im Allgemeinen gilt x x x mod. Auch verwendbar bei qualitativen Merkmalen. Zum Beispiel Partei mit den meisten Stimmen bei einer Wahl. Prof. Dr. Hans-Jörg Starkloff Statistik I für Betriebswirte Vorlesung 9 Version: 13. Juni 2016 16

Streumaße (für metrisch skalierte Daten) Spannweite: = x max x min. Quartilsabstand (Viertelweite): d Q = V o V u. Empirische Varianz (Stichprobenstreuung): ( s 2 = 1 n n ) (x i x) 2 = 1 xi 2 nx 2. n 1 n 1 i=1 Empirische Standardabweichung: s = s 2. Empirischer Variationskoeffizient: v = s 100% (falls x > 0), x besitzt keine phys. Einheit, er ist für kleine Werte x nicht sehr aussagekräftig. Ausreißergrenzen: A u = V u 1.5d Q A o = V o + 1.5d Q. i=1 (sogenannte innere Zäune; äußere Zäune bei ±3d Q ). Prof. Dr. Hans-Jörg Starkloff Statistik I für Betriebswirte Vorlesung 9 Version: 13. Juni 2016 17

Beispieldaten Geordnete Stichprobe: (n = 11) k 1 2 3 4 5 6 7 8 9 10 11 x (k) 1 4 13 14 14 15 17 19 19 21 23 Median: 11 0.5 = 5.5 x = x (6) = 15. Unteres Quartil: 11 0.25 = 2.75 V u = x (3) = 13. Oberes Quartil: 11 0.75 = 8.25 V o = x (9) = 19. Quartilsabstand (Viertelweite): d Q = V o V u = 19 13 = 6. Ausreißergrenzen: A u = V u 1.5d Q = 13 9 = 4 = x (2), A o = V o + 1.5d Q = 19 + 9 = 28 > x (11) = 23. Prof. Dr. Hans-Jörg Starkloff Statistik I für Betriebswirte Vorlesung 9 Version: 13. Juni 2016 18

Statgraphics für Beispieldatensatz k 1 2 3 4 5 6 7 8 9 10 11 x (k) 1 4 13 14 14 15 17 19 19 21 23 Summenstatistiken für Col_1 Anzahl 11 Arithm. Mittelwert 14,5455 Standardabweichungen 6,75816 Variationskoeffizient 46,4624% Minimum 1,0 Maximum 23,0 Spannweite 22,0 Stand. Schiefe -1,39246 Stand. Wölbung 0,374684 Box-Whisker-Plot Der StatAdvisor Diese Perzentile Tabelle für zeigt Col_1 Summenstatistiken für Col_1. Sie enthält Maßzahlen für die zentrale Lage, die Variabilität und die Gestalt der Von speziellem Perzentile Interesse sind hier die standardisierte Schiefe und die standardisierte Wölbung, die man verwenden kann, um herau ob 1,0% die Daten normalverteilt 1,0 sind. Falls die Werte dieser Statistiken außerhalb des Bereiches von 2 bis +2 liegen, bedeutet das eine signifikante 5,0% Abweichung 1,0 von der Normalverteilung, wodurch ein statistischer Test (bei dem Normalverteilung unterstellt wird) (z.b Bezug zur Standardabweichung problematisch ist. In diesem Fall liegt der Wert für die standardisierte Schiefe innerhalb des Bereic man 10,0% für normalverteilte 4,0 Daten erwarten würde. Der Wert für die standardisierte Wölbung liegt innerhalb des Bereiches, den man fü normalverteilte 25,0% 13,0 Daten erwarten würde. 50,0% 15,0 0 4 8 12 16 20 24 75,0% 19,0 Col_1 90,0% 21,0 95,0% 23,0 99,0% 23,0 Der StatAdvisor Prof. Dr. Hans-Jörg Starkloff Statistik I für Betriebswirte Vorlesung 9 Version: 13. Juni 2016 19

Box-Plot I Aussagekräftige graphische Darstellung der Fünfer-Charakteristik, bestehend aus Median x, den empirischen Quartilen (Viertelwerten) V u, V o und den Ausreißergrenzen A u, A o. Die untere Begrenzungslinie wird dabei bestimmt durch den kleinsten Wert, der A u ist, (= x min falls x min A u ) während die obere Begrenzungslinie durch den größten Wert, der A o ist, definiert wird (= x max falls x max A o ). Ausreißer (Datenwerte außerhalb der Ausreißergrenzen) werden extra durch Punkte angegeben. Prof. Dr. Hans-Jörg Starkloff Statistik I für Betriebswirte Vorlesung 9 Version: 13. Juni 2016 20

Box-Plot II Beispiel 2.5 Mieten Box-Whisker-Plot 0 200 400 600 800 1000 1200 Miete Prof. Dr. Hans-Jörg Starkloff Statistik I für Betriebswirte Vorlesung 9 Version: 13. Juni 2016 21

Box-Plot III Beispiel zum Vergleich 40 Box-and-Whisker Plot 30 Punkte 20 10 0 1 2 3 4 5 6 7 Fach 1: Bilanzierung 5: Produktion und Beschaffung 2: Wirtschaftsinformatik 6: Investition und Finanzierung 3: Organisation 7: Anlagenwirtschaft 4: Marketing Prof. Dr. Hans-Jörg Starkloff Statistik I für Betriebswirte Vorlesung 9 Version: 13. Juni 2016 22