3. Deskriptive Statistik

Ähnliche Dokumente
1,11 1,12 1,13 1,14 1,15 1,16 1,17 1,17 1,17 1,18

Charakterisierung der Daten: Sind es genug? Sind alle notwendig? Was ist naturgegeben, was von Menschen beeinflusst (beeinflussbar)?

Statistik I für Betriebswirte Vorlesung 9

Einführung in Quantitative Methoden

Der Modus ist. Der Median ist. 3. Übung. Aufgabe 1. a) der häufigste Wert. b) der Wert unter dem 50 % aller anderen Werte liegen.

Statistik K urs SS 2004

Kapitel 1 Beschreibende Statistik

Statistik I für Betriebswirte Vorlesung 9

Deskription, Statistische Testverfahren und Regression. Seminar: Planung und Auswertung klinischer und experimenteller Studien

Weitere Lagemaße: Quantile/Perzentile I

Institut für Biometrie und klinische Forschung. WiSe 2012/2013

Ermitteln Sie auf 2 Dezimalstellen genau die folgenden Kenngrößen der bivariaten Verteilung der Merkmale Weite und Zeit:

Mathematik für Biologen

Häufigkeitsverteilungen und Statistische Maßzahlen. Häufigkeitsverteilungen und Statistische Maßzahlen. Variablentypen. Stichprobe und Grundgesamtheit

Einführung in die Statistik für Wirtschaftswissenschaftler für Betriebswirtschaft und Internationales Management

Empirische Verteilungsfunktion

Einführung in Quantitative Methoden

Verfahren für metrische Variable

Deskriptivstatistik a) Univariate Statistik Weiters zum Thema der statistischen Informationsverdichtung

Statistik und Wahrscheinlichkeitsrechnung

Deskriptive Statistik Erläuterungen

Deskriptive Statistik

Grundlagen der Statistik

Grundlagen der Statistik I

Univariate Häufigkeitsverteilungen Kühnel, Krebs 2001: Statistik für die Sozialwissenschaften, S.41-66

Das arithmetische Mittel. x i = = 8. x = 1 4. und. y i = = 8

Diese Lücken sollten nicht auch bei Ihnen vorhanden sein: Aufgrund einer statistischen Untersuchung entsteht eine geordnete bzw. ungeordnete, die durc

4 Statistische Maßzahlen

Lösungen. w58r4p Lösungen. w58r4p. Name: Klasse: Datum:

Aufgabe 3 Bei 16 PKWs desselben Typs wurde der Benzinverbrauch pro 100 km gemessen. Dabei ergab sich die folgende Urliste (in Liter pro 100km):

Kapitel 3: Lagemaße. Ziel. Komprimierung der Daten zu einer Kenngröße, welche die Lage, das Zentrum der Daten beschreibt

Fachrechnen für Tierpfleger

Herzlich willkommen zur Vorlesung Statistik. Streuungsmaße oder die Unterschiedlichkeit der Daten nebst kurzen Ausführungen zu Schiefe und Wölbung

Kapitel VI - Lage- und Streuungsparameter

Beispiel 2 (Einige Aufgaben zu Lageparametern) Aufgabe 1 (Lageparameter)

1 45, 39, 44, 48, 42, 39, 40, , 31, 46, 35, 31, 42, 51, , 42, 33, 46, 33, 44, 43

Statistik und Wahrscheinlichkeitsrechnung

Ü B U N G S S K R I P T S T A T I S T I K

Grundlagen der empirischen Sozialforschung

Deskriptive Statistik Kapitel VI - Lage- und Streuungsparameter

Lage- und Streuungsmaße

Median 2. Modus < Median < Mittelwert. Mittelwert < Median < Modus. 2 Modalwerte oder Modus viel größer bzw. viel kleiner als Mittelwert

beruflicher Bildungsabschluss incl. Hochschulabschl. 4Kat.(m) Häufigkeit Prozent Gültig Lehre/Beruffachgesundh.Schule ,2 59,2 59,2

4 Statistische Maßzahlen

Tutorium Mathematik in der gymnasialen Oberstufe 1. Veranstaltung: Beschreibende Statistik 19. Oktober 2016

Günther Bourier. Beschreibende Statistik. Praxisorientierte Einführung - Mit. Aufgaben und Lösungen. 12., überarbeitete und aktualisierte Auflage

W-Rechnung und Statistik für Ingenieure Übung 4

Statistik I. Zusammenfassung und wichtiges zur Prüfungsvorbereitung. Malte Wissmann. 9. Dezember Universität Basel.

Beschreibende Statistik

Musterlösung zur Übungsklausur Statistik

Deskriptive Statistik Auswertung durch Informationsreduktion

Beispiel 4 (Einige weitere Aufgaben)

a) x = 1150 ; x = 950 ; x = 800 b) Die Lagemaße unterscheiden sich voneinander. c) Der Median charakterisiert die Stichprobe am besten.

Verteilungen und ihre Darstellungen

Beispiel für Anwendung: z-tabelle kann genutzt werden, um z.b. Poissonverteilung näherungsweise zu integrieren. Beispiel: wie wahrscheinlich ist es

Gliederung der Vorlesung

Streuungsmaße von Stichproben

Arbeitsbuch zur deskriptiven und induktiven Statistik

Inhaltsverzeichnis Grundlagen aufigkeitsverteilungen Maßzahlen und Grafiken f ur eindimensionale Merkmale

Lage- und Streuungsparameter

Kreisdiagramm, Tortendiagramm

Statistik SS Deskriptive Statistik. Bernhard Spangl 1. Universität für Bodenkultur. March 6, 2012

1 x 1 y 1 2 x 2 y 2 3 x 3 y 3... n x n y n

LV: Höhere und Angewandte Mathematik Teil: Statistik (Teil: Numerik&Simulation: Prof. Günter)

Deskriptive Statistik

Das Ergebnis der Untersuchung eines kardinalskalierten Merkmals X sei in folgender Tabelle wiedergegeben: Ausprägung Anzahl

Statistische Kennzahlen für die Lage

Wahrscheinlichkeits - rechnung und Statistik

1 Grundlagen statistischer Versuchsauswertung

PROC MEANS. zum Berechnen statistischer Maßzahlen (für quantitative Merkmale)

Statistik Skalen (Gurtner 2004)

Graphische Darstellung einer univariaten Verteilung:

Stochastik Deskriptive Statistik

absolute Häufigkeit h: Anzahl einer bestimmten Note relative Häufigkeit r: Anzahl einer bestimmten Note, gemessen an der Gesamtzahl der Noten

Deskriptive Statistik Aufgaben und Lösungen

Deskriptive Statistik

Stochastik 01 Deskriptive Statistik

Deskriptive Statistik


htw saar 1 EINFÜHRUNG IN DIE STATISTIK: BESCHREIBENDE STATISTIK

Die erhobenen Daten werden zunächst in einer Urliste angeschrieben. Daraus ermittelt man:

Beide Verteilungen der Zeiten sind leicht schief. Der Quartilsabstand für Zeiten zum Surfen ist kleiner als der zum Fernsehen.

Philipp Sibbertsen Hartmut Lehne. Statistik. Einführung für Wirtschafts- und. Sozialwissenschaftler. 2., überarbeitete Auflage. 4^ Springer Gabler

WISTA WIRTSCHAFTSSTATISTIK

Anwendung A_0801_Quantile_Minimum_Maximum

Inhaltsverzeichnis DESKRIPTIVE STATISTIK. 1 Grundlagen Grundbegriffe Skalen... 15

Merkmalstypen Univ.-Prof. Dr. rer. nat. et med. habil. Andreas Faldum

Mathematik für Biologen

Die erhobenen Daten (Urliste) werden mithilfe einer Strichliste geordnet. Damit kann die absolute Häufigkeit einfach und schnell erfasst werden.

Ziel: Breite der Verteilung auf der Achse beschreiben nur bei quantitativen Merkmalen mo glich hier:

Kapitel 5 Kenngrößen empirischer Verteilungen 5.1. Lagemaße. x mod (lies: x-mod) Wofür? Lageparameter. Modus/ Modalwert Zentrum. Median Zentralwert

1 GRUNDLAGEN Grundbegriffe Skalen...15

2. Beschreibung von eindimensionalen (univariaten) Stichproben

benötigen. Die Zeit wird dabei in Minuten angegeben und in einem Boxplot-Diagramm veranschaulicht.

5 Exkurs: Deskriptive Statistik

Das harmonische Mittel

Inhaltsverzeichnis. Inhalt Teil I: Beschreibende (Deskriptive) Statistik Seite. 1.0 Erste Begriffsbildungen Merkmale und Skalen 5

Transkript:

3. Deskriptive Statistik Eindimensionale (univariate) Daten: Pro Objekt wird ein Merkmal durch Messung / Befragung/ Beobachtung erhoben. Resultat ist jeweils ein Wert (Merkmalsausprägung) x i : - Gewicht einer Person, - Gehalt einer Person, - Wohngegend Zweidimensionale (bivariate) Daten: Pro Objekt werden zwei Merkmale erhoben: (Gewicht und Größe einer Person) (Ausbildung, Gehalt) (Wohngegend, Wagentyp) 1

3.1. Univariate Verteilungen, grafische Darstellungen und Kenngrößen Selbststudium Ausgangspunkt: Urliste Häufigkeiten: x 1, x 2,..., x n H i... Anzahl oder absolute Häufigkeit des Auftretens der Merkmalsausprägung a i, i = 1,..., l Darstellung in Strichlisten, Häufigkeitstabellen, Balkenoder Stabdiagrammen bei zu vielen Ausprägungen (und ordinalen Daten): Klasseneinteilung; subjektiv, Manipulationsmöglichkeit! h i = H i /n... relative Häufigkeit von a i, i = 1,..., l. Darstellung in Kreisdiagrammen bei ordinalen Daten: kumulierte absolute und relative Häufigkeiten: K i = i j=1 H j, k i = i h j j=1 Darstellung in Summenkurven (Summenpolygon) 2

Kenngrößen eindimensionaler Verteilungen Charakterisierung von Verteilungen durch statistische Maßzahlen (Kenngrößen, Parameter), die die Eigenschaften (Zentrum, Ausbreitung, Form) der Verteilung widerspiegeln wichtigste Maßzahlen sind Lage- und Streuungsparameter Wichtig: Skalierungsniveau beachten Lageparameter: Der Modalwert = die am häufigsten auftretende Merkmalsausprägung = die Klasse (Klassenmitte) mit der größten Häufigkeit bei gruppierten Daten (Klassen) Mehrere Maxima: kein Modalwert Eigenschaften und Interpretation: Wert, der am ehesten zu beobachten ist (sprachl. Formulierungen wie: Diese Krankheit dauert normalerweise 3 Tage., Die Fahrzeit beträgt normalerweise 2 Stunden. ) unempfindlich gegenüber Ausreißern (extremen Werten) 3

Median mindestens ordinale Daten Median heißt jede Merkmalsausprägung a, für die gilt: h i 1/2, h i 1/2 i : x i a i : x i a oberhalb und unterhalb der Mediane befinden sich gleichviele Elemente der Stichprobe Bei metrischen Daten wird häufig der Mittelwert der Mediane als Median angegeben. Eigenschaften und Interpretation: zentraler Wert bei ordinalen Merkmalen unempfindlich gegenüber Ausreißern Minimaleigenschaft bez. absoluter Abweichungen (metrische Daten), jeder Median löst n x i z min 4

Das arithmetische Mittel metrische Daten x = 1 n n x i = l j=1 a j h j Eigenschaften und Interpretation: Schwerpunkt der Verteilung, empfindlich gegenüber Ausreißern (vgl. Median), Minimaleigenschaft bezüglich quadratischer Abweichungen: n hat die Lösung z = x (x i z) 2 min (Beweis: Übung). bei gruppierten Daten mit Klassenmitten x i Klassenhäufigkeiten n i : und x = 1 n k n i x i gewichtetes Mittel der Klassenmitten Im Gegensatz zum Median kann das arithmetische Mittel bei gruppierten Daten mit offenen Randklassen nicht berechnet werden. 5

Streuungsparameter (Variabilitätsparameter) Maßzahlen zur Bewertung der Variabilität der Messwerte, der Breite einer Verteilung, der Abweichungen vom Mittelwert Ziel von Analysen: Zerlegung der Variabilität der Messwerte nach verschiedenen Ursachen (Faktoren, Fehler des Messgerätes usw.), Analyse der Wirkung des Zufalls Streuungsparameter für metrische Daten Spannweite: v = x max x min empirische Varianz: s 2 s 2 = 1 n 1 n (x i x) 2 = 1 ( n n 1 mittlere quadratische Abweichung 1 n 1 2 ( ) Dimension von s 2 : ist z.b. x i eine Konzentration, dann mg 2 /l 2 x 2 i n x 2 ) Eigentlich müsste durch n geteilt werden. Grund für die Division durch n 1 ist die Anwendung der so erhaltenen Größe in der schließenden Statistik. Standardabweichung s = s 2, gleiche Dimension wie x i. Variationskoeffizient v = 100% s x dimensionslos 6

Quartilsabstand Grundgedanke: Ähnlich der Spannweite (s.o.) wird die Spannweite der mittleren 50% der Werte berechnet. Unteres Quartil q 0.25 heißt jede Merkmalsausprägung a, für die gilt: i : x i a h i 1/4, i : x i a h i 3/4. Oberes Quartil q 0.75 heißt jede Merkmalsausprägung a, für die gilt: i : x i a h i 3/4, i : x i a h i 1/4. q 0.25 und q 0.75 sind i.a. nicht eindeutig bestimmt. Falls doch, dann heißt q 0.75 q 0.25 (empirischer) Quartilsabstand, Interquartilbereich, IQR. In Statistiksoftware sind unterschiedliche Interpolationsregeln für die Quartile realisiert. 7

Veranschaulichung von Median, Quartilen, IQR, Minimum, Maximum im Boxplot: Ausreißer (mit Fallnummer) maximale Zaunlänge = 1,5 Boxlänge oberes Quartil unteres Quartil Median kleinster Wert, der nicht als Ausreißer erkannt wird Beispiel: ALLBUS, Monatliches Haushalt-Nettoeinkommen (die ersten 300 Fälle, nur 178 haben geantwortet). 8