Verfahren für metrische Variable

Ähnliche Dokumente
Kapitel 1 Beschreibende Statistik

Merkmalstypen Univ.-Prof. Dr. rer. nat. et med. habil. Andreas Faldum

Statistik I für Betriebswirte Vorlesung 9

Deskription, Statistische Testverfahren und Regression. Seminar: Planung und Auswertung klinischer und experimenteller Studien

Einführung in Quantitative Methoden

Univariate Häufigkeitsverteilungen Kühnel, Krebs 2001: Statistik für die Sozialwissenschaften, S.41-66

4 Statistische Maßzahlen

Fachrechnen für Tierpfleger

Häufigkeitsverteilungen und Statistische Maßzahlen. Häufigkeitsverteilungen und Statistische Maßzahlen. Variablentypen. Stichprobe und Grundgesamtheit

htw saar 1 EINFÜHRUNG IN DIE STATISTIK: BESCHREIBENDE STATISTIK

Der Mittelwert (arithmetisches Mittel)

Deskriptive Statistik

Grundlagen der empirischen Sozialforschung

Das harmonische Mittel

4 Statistische Maßzahlen

Statistik und Wahrscheinlichkeitsrechnung

Herzlich willkommen zur Vorlesung Statistik. Streuungsmaße oder die Unterschiedlichkeit der Daten nebst kurzen Ausführungen zu Schiefe und Wölbung

Bitte am PC mit Windows anmelden!

Einführung in Quantitative Methoden

PROC MEANS. zum Berechnen statistischer Maßzahlen (für quantitative Merkmale)

Statistik und Wahrscheinlichkeitsrechnung

Anteile Häufigkeiten Verteilungen Lagemaße Streuungsmaße Merkmale von Verteilungen. Anteile Häufigkeiten Verteilungen

Lagemaße Übung. Zentrale Methodenlehre, Europa Universität - Flensburg

2. Deskriptive Statistik

1. Maße der zentralen Tendenz Beispiel: Variable Anzahl der Geschwister aus Jugend '92. Valid Cum Value Frequency Percent Percent Percent

Weitere Lagemaße: Quantile/Perzentile I

3. Deskriptive Statistik

Kapitel 3: Lagemaße. Ziel. Komprimierung der Daten zu einer Kenngröße, welche die Lage, das Zentrum der Daten beschreibt

5 Exkurs: Deskriptive Statistik

Wiederholung Statistik I. Statistik für SozialwissenschaftlerInnen II p.8

3.2 Streuungsmaße. 3 Lage- und Streuungsmaße 133. mittlere Variabilität. geringe Variabilität. große Variabilität

Statistik II: Grundlagen und Definitionen der Statistik

a) x = 1150 ; x = 950 ; x = 800 b) Die Lagemaße unterscheiden sich voneinander. c) Der Median charakterisiert die Stichprobe am besten.

Mathematische und statistische Methoden II

W-Rechnung und Statistik für Ingenieure Übung 4

Korrelation, Regression und Signifikanz

Streuungsmaße von Stichproben

Empirische Verteilungsfunktion

Ermitteln Sie auf 2 Dezimalstellen genau die folgenden Kenngrößen der bivariaten Verteilung der Merkmale Weite und Zeit:

Dr. Reinhard Vonthein, Dipl. Statistiker (Univ.)

3. Lektion: Deskriptive Statistik

Statistik und Wahrscheinlichkeitsrechnung

I.V. Methoden 2: Deskriptive Statistik WiSe 02/03

2. Beschreibung von eindimensionalen (univariaten) Stichproben

Empirische Softwaretechnik. Boxplots. Graphische Darstellung. Median

Eindimensionale Darstellungen

Statistik und Wahrscheinlichkeitsrechnung. Wahrscheinlichkeitsrechnung

Statistik I. Zusammenfassung und wichtiges zur Prüfungsvorbereitung. Malte Wissmann. 9. Dezember Universität Basel.

1 45, 39, 44, 48, 42, 39, 40, , 31, 46, 35, 31, 42, 51, , 42, 33, 46, 33, 44, 43

7. Lösungen weitere Übungsaufgaben Statistik für Ingenieure WiSe 16/17

1 Univariate Statistiken

Teil VII. Deskriptive Statistik. Woche 5: Deskriptive Statistik. Arbeitsschritte der Datenanalyse. Lernziele

Teil / Ein paar statistische Grundlagen 25. Kapitel 1 Was Statistik ist und Warum sie benötigt Wird 2 7

STATISTIK I Übung 04 Spannweite und IQR. 1 Kurze Wiederholung. Was sind Dispersionsparameter?

1 Einleitung und Grundlagen 1

Deskriptive Statistik II. Statistische Methoden in der Korpuslinguistik Heike Zinsmeister WS 2008/09

Forschungsstatistik I

Beispiel 4 (Einige weitere Aufgaben)

1.1 Graphische Darstellung von Messdaten und unterschiedliche Mittelwerte. D. Horstmann: Oktober

Univariate Kennwerte mit SPSS

Mathematik für Biologen

10. Medizinische Statistik

Beschreibende Statistik Eindimensionale Daten

Die erhobenen Daten werden zunächst in einer Urliste angeschrieben. Daraus ermittelt man:

Inhaltsverzeichnis DESKRIPTIVE STATISTIK. 1 Grundlagen Grundbegriffe Skalen... 15

Frank Lammers. Statistik I: deskriptive und explorative Statistik. Lehr- und Übungsbuch

Einführung in die Statistik

Prüfung aus Statistik 1 für SoziologInnen

Beide Verteilungen der Zeiten sind leicht schief. Der Quartilsabstand für Zeiten zum Surfen ist kleiner als der zum Fernsehen.

benötigen. Die Zeit wird dabei in Minuten angegeben und in einem Boxplot-Diagramm veranschaulicht.

Inhaltsverzeichnis Grundlagen aufigkeitsverteilungen Maßzahlen und Grafiken f ur eindimensionale Merkmale

1 GRUNDLAGEN Grundbegriffe Skalen...15

Statistik. Jan Müller

BOXPLOT 1. Begründung. Boxplot A B C

Grundlagen der empirischen Sozialforschung

Statistik I für Betriebswirte Vorlesung 2

Deskriptive Statistik Winfried Zinn

Einfache statistische Auswertungen mit dem TI-Nspire

Lösung Aufgabe 19. ( ) = [Mio Euro]. Empirische Varianz s 2 = 1 n

Begriffe zur Statistik-Vorlesung

Willkommen zur Vorlesung Statistik

1,11 1,12 1,13 1,14 1,15 1,16 1,17 1,17 1,17 1,18

Dr. Maike M. Burda. Welchen Einfluss hat die Körperhöhe auf das Körpergewicht? Eine Regressionsanalyse. HU Berlin, Econ Bootcamp 7.-9.

Statistische Methoden der Datenanalyse Wintersemester 2012/2013 Albert-Ludwigs-Universität Freiburg

Streuungsmaße. Die angegebenen Maßzahlen sind empirisch, d.h. sie sind Schätzungen für die wahre Varianz (empirische) Varianz (Streuung) s 2 = 1 n

Anzahl( X ) Histogramm. Freizeit. S1 = Anzahl ( Groesse) S3 =

Häufigkeitsauszählungen, zentrale statistische Kennwerte und Mittelwertvergleiche

3 Lage- und Streuungsmaße

Deskriptive Statistik

beruflicher Bildungsabschluss incl. Hochschulabschl. 4Kat.(m) Häufigkeit Prozent Gültig Lehre/Beruffachgesundh.Schule ,2 59,2 59,2

Univariate explorative Datenanalyse in R

Statistische Methoden in den Umweltwissenschaften

Einführung in die Statistik für Politikwissenschaftler Sommersemester 2011

Inhaltsverzeichnis. Teil 1 Basiswissen und Werkzeuge, um Statistik anzuwenden

Stochastik-Praktikum

Vorlesungsskript. Deskriptive Statistik. Prof. Dr. Günter Hellmig

MATHEMATIK MTA 12 SCHULJAHR 07/08 STATISTIK

Median 2. Modus < Median < Mittelwert. Mittelwert < Median < Modus. 2 Modalwerte oder Modus viel größer bzw. viel kleiner als Mittelwert

Spezielle Verteilungen

ÜBUNGSAUFGABEN ZUR DESKRIPTIVEN UND EXPLORATIVEN DATENANALYSE

Transkript:

Verfahren für metrische Variable Grafische Methoden Histogramm Mittelwertsplot Boxplot Lagemaße Mittelwert, Median, Quantile Streuungsmaße Standardabweichung, Interquartilsabstand

Lagemaße und Streumaße Üblicherweise wird der Mittelwert gemeinsam mit der Standardabweichung und der Median gemeinsam mit dem Interquartilsabstand präsentiert. Speziell für schief verteilte Daten ist der Median zu bevorzugen.

Arithmetisches Mittel, Varianz und Standardabweichung Stichprobe der Größe = n Daten der Stichprobe: x 1, x,, x n Mittelwert: Varianz: s x = = 1 n 1 n 1 n i= 1 n i= 1 x i ( x i x) Standardabweichung: s = s

Rechenbeispiel: Die Zahl der Kühe von 4 Bauern sei: 3, 6, 7, 4 Stichprobenumfang: n=4 ( x i x) x s = = 1 4 1 3 (3 + 6 + (4 + 1+ 7 + 4) 4 + 1) = = 10 3 0 4 = = 5 3,333 s =1,86

Drei Dörfer Dorf 1 Dorf Dorf 3 5, 5, 5, 5 3, 6, 7, 4 0, 0, 0, 0 x = 5 x = 5 x = 5 s = 0 s =1,86 s = 8,66

Variationskoeffizient Setzt die Standardabweichung in Relation zum arithmetischen Mittel v Rechenbeispiel: = x s 100 1,86 v = 100 = 36,5 % 5

Beispiel Kleber s x = = 1 43 1 4 = 9,63 MPa (,80 + 3,63 +... + 14,01+ 14,48) = 8,8 MPa [ (,80 8,8) + (3,63 8,8) +... + (14,48 8,8) ] s = 9,63 = 3,10 MPa

Grafische Darstellung Mittelwert und Standardabweichung 14 1 10 MPa 8 6 4 0 Kleber

Der Median Ist ein anderes Lagemaß für metrische sowie auch ordinale Merkmale. Definition: Der Median ist eine Zahl, so dass mindestens die Hälfte der Daten größer oder gleich und mindestens die Hälfte der Daten kleiner oder gleich dem Wert x~ sind. x~

n gerade In diesem Fall liegt der Median zwischen zwei Datenpunkten. An welcher Stelle der Rangliste? unterer Datenpunkt: Stelle = n/ obere Datenpunkt: Stelle = (n/)+1 Median = (unterer + oberer Datenpunkt)/

Rechenbeispiel zum Median (n gerade, d.h. n/ eine ganze Zahl) Daten:,1 3,4 7,3 8,9 untere Stelle: Wert: 3,4 obere Stelle: 3 Wert: 7,3 Median = (3,4 + 7,3)/ = 5,35

n ungerade In diesem Fall ist der Median einer der Datenpunkte! An welcher Stelle der Rangliste liegt der Median? Stelle = n/ aufgerundet auf die nächste ganze Zahl. z.b. n = 5 n/=,5 Stelle = 3

Rechenbeispiel zum Median (n ungerade, d.h. n/ keine ganze Zahl) Daten 3/5=60% 3/5=60% 1,3,6 3,6 4,3 5,1 Median ~ = 3,6 x

Median der Haftstärke Rangliste: (n = 43),80; 3,63; 4,14; 4,0; 4,58; 5,; 5,8; 5,51; 6,05; 6,11; 6,49; 6,88; 7,19; 7,6; 7,3; 7,3; 7,39; 7,86; 7,89; 8,0; 8,1; 8,7; 8,88; 8,98; 9,33; 9,39; 10,19; 10,19; 10,5; 11,05; 11,05; 11,08; 11,46; 11,71; 11,90; 1,10; 1,51; 1,70; 13,18; 13,31; 13,43; 14,01; 14,48. 43/ = 1,5 Daher ist Median die -te Beobachtung der Rangliste

Das erste und dritte Quartil Das 1. Quartil: (5%-Percentil) eine Zahl, so dass mind. 5% der Beobachtungen kleiner gleich und mind. 75% der Beobachtungen größer gleich dieser Zahl sind. Das 3. Quartil: (75%-Percentil) eine Zahl, so dass mind. 75% der Beobachtungen kleiner gleich und mind. 5% der Beobachtungen größer gleich dieser Zahl sind. Das. Quartil ist der Median

Berechnung des 1. Quartils (5%-Percentil) n (1/4) eine ganze Zahl: untere Stelle: n (1/4) obere Stelle: n (1/4)+1 z.b. n = 4, n (1/4)=1 untere Stelle = 1 obere Stelle = n (1/4) keine ganze Zahl: Stelle = n (1/4) aufgerundet auf die nächste ganze Zahl z.b. n=5 n (1/4)=1,5 Stelle =

Rechenbeispiele zum 1. Quartil Beispiel 1: n/4=1.5 /5=40% 4/5=80% 1,3;,6; 3,6; 4,3; 5,1 1. Quartil =,6

Rechenbeispiele zum 1. Quartil Beispiel :,1; 3,4 ; 7,3 ; 8,9 n/4=1 1. Quartil = (,1 + 3,4 )/ =.75

Berechnung des 3-ten Quartils (75%-Percentil) n (3/4) eine ganze Zahl: n (3/4) keine ganze Zahl: untere Stelle: n (3/4) obere Stelle: n (3/4)+1 z.b. n = 4, n (3/4)=3 untere Stelle = 3 obere Stelle = 4 Stelle = n (3/4) aufgerundet auf die nächste ganze Zahl z.b. n=5 n (3/4)=3,75 Stelle = 4

Rechenbeispiele zum 3. Quartil 4/5=80% /5=40% Beispiel 1: 1,3;,6; 3,6; 4,3; 5,1 n (3/4)=3,75 3. Quartil = 4,3

Rechenbeispiele zum 3. Quartil Beispiel : n (3/4)=3,1; 3,4 ; 7,3 ; 8,9 3. Quartil = (7,3 + 8,9 )/ = 8,1

1. Und 3.Quartil der Haftstärke Rangliste: (n = 43),80; 3,63; 4,14; 4,0; 4,58; 5,; 5,8; 5,51; 6,05; 6,11; 6,49; 6,88; 7,19; 7,6; 7,3; 7,3; 7,39; 7,86; 7,89; 8,0; 8,1; 8,7; 8,88; 8,98; 9,33; 9,39; 10,19; 10,19; 10,5; 11,05; 11,05; 11,08; 11,46; 11,71; 11,90; 1,10; 1,51; 1,70; 13,18; 13,31; 13,43; 14,01; 14,48. 43 (1/4) 43 (3/4) =10,75 =3,5 Daher ist das 1. 3. Quartil die 11-te 33-te Beobachtung der Rangliste

Berechnung des q-quantils (q 100 %-Percentil) n q eine ganze Zahl: n q keine ganze Zahl: untere Stelle: n q obere Stelle: n q+1 q- Quantil ist der Mittelwert der entsprechenden Werte aus der Rangliste Stelle = n q aufgerundet auf die nächste ganze Zahl q-quantil ist der Wert aus der Rangliste an dieser Stelle

Box & Whisker - Plot Haftstärke [MPa] 14 1 10 8 6 4 Max = 14,48 3. Quartil = 11,46 Median = 8,7 1. Quartil = 6,49 Min =,80 0 Kleber

Interquartilsabstand Interquartilsabstand = 3. Quartil 1. Quartil ist ein Streuungsmaß. Wird im Zusammenhang mit Median verwendet. Haftstärke in Beispiel 1.: Interquartilsabstand = 11,46 6,49 = 4,97

Vergleich der grafischen Methoden für metrische Variable Histogramm Zeigt die detailierte Verteilung der Daten. Ausreißer sind gut erkennbar Mittelwertsplot sehr starke Reduktion der Information Boxplot Gibt einen guten Eindruck der Verteilung der Daten, Minimum, Maximum, Median, Quartile und Quartilsabstand sind direkt ablesbar Platzsparender als Histogramme Relative Häufigkeit Haftstärke [MPa] 0,3 0,5 0, 0,15 0,1 0,05 MPa 0 14 1 10 8 6 4 0 14 1 10 8 6 4 0 3 5 7 9 11 13 15 Haftstärke [MPa] Mittelwert und Standardfehler Kleber Kleber

Vergleich der Lage- und Streuungsmaße Mittelwert und Varianz Nur für metrische Variable Instabil gegenüber Ausreißern Interpretierbar als durchschnittlicher Wert Spezielle Interpretation für Normalverteilung Der Mittelwert beschreibt das Zentrum der Verteilung von schiefverteilten Daten schlecht. Median und Interquartilsabstand Für metrische und ordinale Variable Robust gegenüber Ausreißern

Robustheit gegen Ausreißer Anzahl der täglich gerauchten Zigaretten (7 Personen wurden befragt) Beispiel 1: 0 5 5 10 8 15 0 Mittelwert: 9 Median: 8 Beispiel : 0 5 5 10 8 15 100 Mittelwert: 0.4 Median: 8

Anzahl Anzahl Symmetrie Verteilung (Rechts-)Schiefe Verteilung 30 30 0 0 10 10 0 -,00-1,00 0,00 1,00,00 3,00 norm 0 1,00,00 3,00 absnorm

Mittelwert und Median bei einer symmetrischen Verteilung 150 F r e q u e n c y 100 50 0 1.5.75 4.5 5.75 7.5 Ery Mean=4.05 Median=4.0 Mode=3.67

Mittelwert und Median bei einer schiefen Verteilung Häufigkeit 40 35 30 5 0 15 10 5 0 10 30 50 70 90 Mittelwert=3.9 Median=3.5

Die Momente einer Verteilung Um die Schiefe einer Verteilung mathematisch zu beschreiben definieren wir zunächst die Momente. Definition: n 1 m = ( x x) k i n i= 1 k Beachte: m 1 = 0 m = n n 1 s

Die Schiefe Die Schiefe ist proportional dem dritten Moment α 3 = m m 3 3/ = n i= 1 i= 1 ( x ( x x) Verteilung symmetrisch: α 3 = 0 n n i i x) rechts schief: α 3 > 0 links schief: α 3 < 0 3 3/

Alternatives Maß für Schiefe Wie bereits gesehen befindet sich bei einer rechtsschiefen (linksschiefen)verteilung der Mittlewert rechts (links) vom Median. Bei symmetrischen Verteilung sind Mittelwert und Median gleich. Dieser Zusammenhang kann für folgende Definition genutzt werden: 3( x ~ x) α 3 = s