Einführung in Quantitative Methoden

Ähnliche Dokumente
Einführung in Quantitative Methoden

Univariate Häufigkeitsverteilungen Kühnel, Krebs 2001: Statistik für die Sozialwissenschaften, S.41-66

3. Deskriptive Statistik

Statistik I für Betriebswirte Vorlesung 9

Herzlich willkommen zur Vorlesung Statistik. Streuungsmaße oder die Unterschiedlichkeit der Daten nebst kurzen Ausführungen zu Schiefe und Wölbung

Deskription, Statistische Testverfahren und Regression. Seminar: Planung und Auswertung klinischer und experimenteller Studien

1. Maße der zentralen Tendenz Beispiel: Variable Anzahl der Geschwister aus Jugend '92. Valid Cum Value Frequency Percent Percent Percent

Statistik und Wahrscheinlichkeitsrechnung

Bitte am PC mit Windows anmelden!

Beispiel 2 (Einige Aufgaben zu Lageparametern) Aufgabe 1 (Lageparameter)

Fachrechnen für Tierpfleger

Deskriptive Statistik

htw saar 1 EINFÜHRUNG IN DIE STATISTIK: BESCHREIBENDE STATISTIK

Graphische Darstellung einer univariaten Verteilung:

Deskriptive Statistik Kapitel VI - Lage- und Streuungsparameter

Kapitel 1 Beschreibende Statistik

Statistik und Wahrscheinlichkeitsrechnung

Kapitel 5 Kenngrößen empirischer Verteilungen 5.1. Lagemaße. x mod (lies: x-mod) Wofür? Lageparameter. Modus/ Modalwert Zentrum. Median Zentralwert

PROC MEANS. zum Berechnen statistischer Maßzahlen (für quantitative Merkmale)

Streuungsmaße von Stichproben

Deskriptivstatistik a) Univariate Statistik Weiters zum Thema der statistischen Informationsverdichtung

1,11 1,12 1,13 1,14 1,15 1,16 1,17 1,17 1,17 1,18

Anteile Häufigkeiten Verteilungen Lagemaße Streuungsmaße Merkmale von Verteilungen. Anteile Häufigkeiten Verteilungen

Diese Lücken sollten nicht auch bei Ihnen vorhanden sein: Aufgrund einer statistischen Untersuchung entsteht eine geordnete bzw. ungeordnete, die durc

3. Lektion: Deskriptive Statistik

beruflicher Bildungsabschluss incl. Hochschulabschl. 4Kat.(m) Häufigkeit Prozent Gültig Lehre/Beruffachgesundh.Schule ,2 59,2 59,2

Statistische Kennzahlen für die Lage

Lagemaße Übung. Zentrale Methodenlehre, Europa Universität - Flensburg

2. Deskriptive Statistik

Kapitel 3: Lagemaße. Ziel. Komprimierung der Daten zu einer Kenngröße, welche die Lage, das Zentrum der Daten beschreibt

Häufigkeitsverteilungen und Statistische Maßzahlen. Häufigkeitsverteilungen und Statistische Maßzahlen. Variablentypen. Stichprobe und Grundgesamtheit

Mittelwert und Standardabweichung

Willkommen zur Vorlesung Statistik

Lage- und Streuungsparameter

Mathematik für Biologen

Empirische Verteilungsfunktion

Grundlagen der empirischen Sozialforschung

1 45, 39, 44, 48, 42, 39, 40, , 31, 46, 35, 31, 42, 51, , 42, 33, 46, 33, 44, 43

Statistik eindimensionaler Größen

1.1 Graphische Darstellung von Messdaten und unterschiedliche Mittelwerte. D. Horstmann: Oktober

5 Exkurs: Deskriptive Statistik

Inhaltsverzeichnis Grundlagen aufigkeitsverteilungen Maßzahlen und Grafiken f ur eindimensionale Merkmale

Statistische Grundlagen I

Statistik I für Humanund Sozialwissenschaften

4 Statistische Maßzahlen

Einführung in die Statistik für Wirtschaftswissenschaftler für Betriebswirtschaft und Internationales Management

Mathematische Statistik. Zur Notation

Statistik und Wahrscheinlichkeitsrechnung

Dr. Quapp: Statistik für Mathematiker mit SPSS. Lösungs Hinweise 1. Übung Beschreibende Statistik & Verteilungsfunktion

Maße der zentralen Tendenz

Wiederholung Statistik I. Statistik für SozialwissenschaftlerInnen II p.8

Der Mittelwert (arithmetisches Mittel)

I.V. Methoden 2: Deskriptive Statistik WiSe 02/03

Deskriptive Statistik Erläuterungen

absolute Häufigkeit h: Anzahl einer bestimmten Note relative Häufigkeit r: Anzahl einer bestimmten Note, gemessen an der Gesamtzahl der Noten

Ermitteln Sie auf 2 Dezimalstellen genau die folgenden Kenngrößen der bivariaten Verteilung der Merkmale Weite und Zeit:

Auswertung und Darstellung wissenschaftlicher Daten (1)

Beide Verteilungen der Zeiten sind leicht schief. Der Quartilsabstand für Zeiten zum Surfen ist kleiner als der zum Fernsehen.

Kapitel 2. Mittelwerte

Vorlesungsskript. Deskriptive Statistik. Prof. Dr. Günter Hellmig

Inhaltsverzeichnis. 1 Über dieses Buch Zum Inhalt dieses Buches Danksagung Zur Relevanz der Statistik...

Wahrscheinlichkeits - rechnung und Statistik

Angewandte Statistik 3. Semester

3 Lage- und Streuungsmaße

2 Häufigkeitsverteilungen

Kapitel 2. Häufigkeitsverteilungen

Inhaltsverzeichnis. Inhalt Teil I: Beschreibende (Deskriptive) Statistik Seite. 1.0 Erste Begriffsbildungen Merkmale und Skalen 5

Häufigkeitsauszählungen, zentrale statistische Kennwerte und Mittelwertvergleiche

Statistik I. Zusammenfassung und wichtiges zur Prüfungsvorbereitung. Malte Wissmann. 9. Dezember Universität Basel.

3 Lage- und Streuungsmaße

Kreisdiagramm, Tortendiagramm

4 Statistische Maßzahlen

Einführung in die Statistik für Politikwissenschaftler Sommersemester 2011

Einführung in die Statistik

Franz Kronthaler. Statistik angewandt. Datenanalyse ist (k)eine Kunst. mit dem R Commander. A Springer Spektrum

Die erhobenen Daten werden zunächst in einer Urliste angeschrieben. Daraus ermittelt man:

Statistik II: Grundlagen und Definitionen der Statistik

Korrelation, Regression und Signifikanz

Thema: Mittelwert einer Häufigkeitsverteilung. Welche Informationen kann der Mittelwert geben?

Die ABSOLUTE HÄUFIGKEIT einer Merkmalsausprägung gibt an, wie oft diese in der Erhebung eingetreten ist.

Deskriptive Statistik & grafische Darstellung

STATISTIK FÜR STATISTIK-AGNOSTIKER Teil 1 (wie mich)

2. Deskriptive Statistik 2.1. Häufigkeitstabellen, Histogramme, empirische Verteilungsfunktionen

Deskriptive Statistik Auswertung durch Informationsreduktion

Statistik und Wahrscheinlichkeitsrechnung. Wahrscheinlichkeitsrechnung

Median 2. Modus < Median < Mittelwert. Mittelwert < Median < Modus. 2 Modalwerte oder Modus viel größer bzw. viel kleiner als Mittelwert

WISTA WIRTSCHAFTSSTATISTIK

Statistik. Ronald Balestra CH St. Peter

Mathematische und statistische Methoden I

1. Tutorial. Online-Tutorium-Statistik von T.B.

STATISTIK I Übung 04 Spannweite und IQR. 1 Kurze Wiederholung. Was sind Dispersionsparameter?

Datenstrukturen. Querschnitt. Grösche: Empirische Wirtschaftsforschung

Verteilungsfunktion und Quantile

Transkript:

Einführung in Quantitative Methoden Mag. Dipl.Ing. Dr. Pantelis Christodoulides & Mag. Dr. Karin Waldherr SS 2014 Christodoulides / Waldherr Einführung in Quantitative Methoden- 2.VO 1/57

Die Deskriptivstatistik dient der Beschreibung der erhobenen Daten in der Stichprobe durch 1. Tabellen, 2. Statistische Kennwerte, und/oder 3. Grafiken. Diese Strukturierung, Zusammenfassung und anschauliche Darstellung der Daten dient aber auch dazu, sich zunächst einen Überblick zu verschaffen und ev. Widersprüchlichkeiten zu entdecken (verursacht z.b. durch Dateneingabefehler, falsche Angaben eines Untersuchungsteilnehmers, etc.). Christodoulides / Waldherr Einführung in Quantitative Methoden- 2.VO 2/57

Die Datenmatrix liefert Informationen über die Charakteristika jeder einzelnen Person. Im allgemeinen ist man allerdings daran interessiert, wie häufig die einzelnen Merkmalsausprägungen in der Stichprobe vorkommen. Dazu kann man sich die Häufigkeitstabelle bzw. Häufigkeitsverteilung ansehen. Christodoulides / Waldherr Einführung in Quantitative Methoden- 2.VO 3/57

Nominalskalierte Merkmale Absolute Häufigkeit, f j, ist die Anzahl von Personen mit der j-ten Ausprägung des Merkmals X. Es gilt stets: Die Summe der absoluten Häufigkeiten für die verschiedenen Ausprägungen beträgt n: k f j = n j=1 Christodoulides / Waldherr Einführung in Quantitative Methoden- 2.VO 4/57

Die absoluten Häufigkeiten sind vom Stichprobenumfang abhängig; eignen sich nicht um die Ergebnisse verschiedener Erhebungen mit unterschiedlichem Stichprobenumfang zu vergleichen. Größen, die unabhängig vom Stichprobenumfang sind, sind die relative Häufigkeit und Prozentwerte. Christodoulides / Waldherr Einführung in Quantitative Methoden- 2.VO 5/57

Relative Häufigkeit, r j, ist der Quotient absolute Häufigkeit Anzahl der Personen = f j n Es gilt stets: Es können nur Werte zwischen 0 und 1 vorkommen; die Summe der relativen Häufigkeiten für die verschiedenen Ausprägungen beträgt 1. Prozentwerte, pz j : k r j = 1 j=1 Prozentuelle Häufigkeit = r j 100 Christodoulides / Waldherr Einführung in Quantitative Methoden- 2.VO 6/57

Datenbeispiel 1: Allgemeine Bevölkerungsumfrage der Sozialwissenschaften (ALLBUS 2006): 1 Variable Erhebungsgebiet: Alte Bundesländer (= Westdeutschland) oder Neue Bundesländer (= Ostdeutschland) ; Zufallsstichprobe von n = 50 Personen. Kodierung: 1 = Westdeutschland, 2 = Ostdeutschland. Urliste: 2, 2, 2, 1, 1, 1, 1, 1, 2, 2, 1, 1, 1, 1, 1, 1, 1, 1, 2, 1, 1, 1, 1, 2, 2, 2, 2, 1, 2, 2, 1, 1, 1, 2, 1, 1, 2, 1, 2, 2, 1, 2, 1, 2, 2, 1, 1, 2, 1, 2 1 Das ALLBUS-Programm ist 1980-1986 und 1991 von der DFG (Deutsche Forschungsgemeinschaft) gefördert worden. Die weiteren Erhebungen wurden von Bund und Ländern über die GESIS (Gesellschaft sozialwissenschaftlicher Infrastruktureinrichtungen) finanziert. ALLBUS wird innerhalb der GESIS an den Standorten Mannheim und Köln in Zusammenarbeit mit dem ALLBUS-Ausschuß realisiert. Die vorgenannten Institutionen und Personen tragen keine Verantwortung für die Verwendung der Daten in dieser Vorlesung. Christodoulides / Waldherr Einführung in Quantitative Methoden- 2.VO 7/57

Häufigkeitstabelle für Datenbeispiel 1 Erhebungsgebiet Strichliste abs. H. rel. H. Prozent x j f j r j pz j Westdeutschland 29 0.58 58 Ostdeutschland 21 0.42 42 Summe 50 1 100 Christodoulides / Waldherr Einführung in Quantitative Methoden- 2.VO 8/57

Ordinalskalierte Merkmale Zusätzlich kumulative Häufigkeitsfunktionen interessant und sinnvoll. Voraussetzung ist, dass die Merkmalsausprägungen der Größe nach geordnet sind. Kumulierte absolute Häufigkeit oder Empirische Verteilungsfunktion f + = die Summe der absoluten Häufigkeiten der betreffenden Merkmalsausprägung und aller kleineren. Gibt an, wieviele Personen einen Wert haben, der kleiner oder gleich der betreffenden Kategorie l ist. f + l = l j=1 f j Christodoulides / Waldherr Einführung in Quantitative Methoden- 2.VO 9/57

Kumulierte relative Häufigkeit r + = die Summe der relativen Häufigkeiten der betreffenden Merkmalsausprägung und aller kleineren. Anteil der Personen, die einen Wert haben, der kleiner oder gleich der betreffenden Kategorie l ist. r + l = 1 n l j=1 f j Kumulierte prozentuelle Häufigkeit pz + = die Summe der prozentuellen Häufigkeiten der betreffenden Merkmalsausprägung und aller kleineren. Prozentwert der Personen, die einen Wert haben, der kleiner oder gleich der betreffenden Kategorie l ist. pz + l = r + l 100 Christodoulides / Waldherr Einführung in Quantitative Methoden- 2.VO 10/57

Es gilt stets: f + k = k f j = n j=1 r + k = 1 n k f j = 1 j=1 pz + k = 100 bei j = 1,..., k Merkmalsausprägungen. Christodoulides / Waldherr Einführung in Quantitative Methoden- 2.VO 11/57

Datenbeispiel 2: Variable Gesundheitszustand aus ALLBUS (2006): Kodierung: 1 = sehr gut, 2 = gut, 3 = zufriedenstellend, 4 = weniger gut, 5 = schlecht; Zufallsstichprobe von n = 50 Personen. Urliste: 1, 2, 3, 2, 3, 2, 3, 4, 3, 2, 2, 5, 2, 3, 3, 2, 2, 3, 2, 2, 2, 2, 2, 1, 1, 1, 2, 4, 3, 3, 2, 4, 3, 5, 1, 3, 5, 2, 1, 2, 2, 2, 2, 4, 2, 3, 1, 2, 4, 4 Christodoulides / Waldherr Einführung in Quantitative Methoden- 2.VO 12/57

Häufigkeitstabelle für Datenbeispiel 2 Gesundheitszustand f j r j pz j f + j r + j pz + j sehr gut 7 0.14 14 7 0.14 14 gut 22 0.44 44 29 (7+22) 0.58 58 zufriedenstellend 12 0.24 24 41 (29+12) 0.82 82 weniger gut 6 0.12 12 47 0.94 94 schlecht 3 0.06 6 50 1.00 100 Summe 50 1.00 100 - - - Christodoulides / Waldherr Einführung in Quantitative Methoden- 2.VO 13/57

Metrische Merkmale Univariate Deskriptive Statistik Häufigkeitstabelle unübersichtlich, insbesondere bei stetigen Variablen Intervalle (= Klassenzusammenfassung oder gruppierte Daten). 5-15 Intervalle (max. 20). Je weniger Intervalle umso größer Informationsverlust, je mehr Intervalle umso unübersichtlicher. Variable Alter aus ALLBUS (2006), Zufallsstichprobe von n = 50 Personen. Christodoulides / Waldherr Einführung in Quantitative Methoden- 2.VO 14/57

Häufigkeitstabelle für Datenbeispiel 3 mit Originaldaten Alter f j r j pz j f + j r + j pz + j 19 1 0.02 2 1 0.02 2 20 1 0.02 2 2 0.04 4 24 2 0.04 4 4 0.08 8 31 1 0.02 2 5 0.10 10 33 1 0.02 2 6 0.12 12 35 1 0.02 2 7 0.14 14 36 2 0.04 4 9 0.18 18 38 2 0.04 4 11 0.22 22 40 4 0.08 8 15 0.30 30 41 2 0.04 4 17 0.34 34 42 2 0.04 4 19 0.38 38 43 1 0.02 2 20 0.40 40 Christodoulides / Waldherr Einführung in Quantitative Methoden- 2.VO 15/57

Fortsetzung Häufigkeitstabelle für Datenbeispiel 3 mit Originaldaten 45 1 0.02 2 21 0.42 42 46 2 0.04 4 23 0.46 46 47 2 0.04 4 25 0.50 50 48 2 0.04 4 27 0.54 54 49 1 0.02 2 28 0.56 56 51 1 0.02 2 29 0.58 58 52 1 0.02 2 30 0.60 60 53 2 0.04 4 32 0.64 64 54 1 0.02 2 33 0.66 66 55 2 0.04 4 35 0.70 70 56 1 0.02 2 36 0.72 72 57 1 0.02 2 37 0.74 74 58 1 0.02 2 38 0.76 76 Christodoulides / Waldherr Einführung in Quantitative Methoden- 2.VO 16/57

Fortsetzung Häufigkeitstabelle für Datenbeispiel 3 mit Originaldaten 60 1 0.02 2 39 0.78 78 62 1 0.02 2 40 0.80 80 64 2 0.04 4 42 0.84 84 66 1 0.02 2 43 0.86 86 67 1 0.02 2 44 0.88 88 69 1 0.02 2 45 0.90 90 71 2 0.04 4 47 0.94 94 75 1 0.02 2 48 0.96 96 82 1 0.02 2 49 0.98 98 85 1 0.02 2 50 1.00 100 Christodoulides / Waldherr Einführung in Quantitative Methoden- 2.VO 17/57

Häufigkeitstabelle für Datenbeispiel 3 mit gruppierten Daten Alter f j r j pz j f + j r + j pz + j 29 Jahre 4 0.08 8 4 0.08 8 30-39 Jahre 7 0.14 14 11 0.22 22 40-49 Jahre 17 0.34 34 28 0.56 56 50-59 Jahre 10 0.20 20 38 0.76 76 60-69 Jahre 7 0.14 14 45 0.90 90 70 Jahre 5 0.10 10 50 1.00 100 Summe 50 1 100 Christodoulides / Waldherr Einführung in Quantitative Methoden- 2.VO 18/57

Häufigkeitstabelle mit SPSS Menü Analysieren... Deskriptive Statistik Häufigkeiten... Christodoulides / Waldherr Einführung in Quantitative Methoden- 2.VO 19/57

Histogramm Univariate Deskriptive Statistik Histogramm oder Blockdiagramm - Grafische Darstellung der Häufigkeitstabelle Beobachtete Ausprägungen x j geordnet auf der X -Achse Relative (r j ) oder absolute Häufigkeiten (f j ) auf der Y -Achse Rechtecksflächen sind gleich den r j oder f j Gesamtfläche des Histogramms ist gleich 1 bzw. n Maßstab auf der X -Achse beliebig und wird so gewählt, dass die Verteilung möglichst anschaulich wird Balkendiagramm für nominalskalierte Variablen Christodoulides / Waldherr Einführung in Quantitative Methoden- 2.VO 20/57

Christodoulides / Waldherr Einführung in Quantitative Methoden- 2.VO 21/57

Treppenfunktion Univariate Deskriptive Statistik Grafische Darstellung der kumulativen Häufigkeitstabelle analog zu Histogramm Letzte und größte Teilfläche ist gleich 1 bzw. n Christodoulides / Waldherr Einführung in Quantitative Methoden- 2.VO 22/57

Treppenfunktion Univariate Deskriptive Statistik Christodoulides / Waldherr Einführung in Quantitative Methoden- 2.VO 23/57

Lagemaße - Zweck Univariate Deskriptive Statistik Wir wollen die zentrale Tendenz einer Stichprobe möglichst gut schätzen Eine Maßzahl, die in geeigneter Weise ein Zentrum der Stichprobe angibt Mittelwert, Modalwert und Median Christodoulides / Waldherr Einführung in Quantitative Methoden- 2.VO 24/57

Arithmetisches Mittel (Mittelwert) Der Mittelwert oder Durchschnittswert ist die Summe aller Werte dividiert durch den Stichprobenumfang n: n x = i=1 n x i = 1 n n i=1 Das arithmetische Mittel ist nur für metrische Variablen sinnvoll! x i Christodoulides / Waldherr Einführung in Quantitative Methoden- 2.VO 25/57

Arithmetisches Mittel (Mittelwert) Beispiel: Anzahl der Kinder: Urliste: 0 1 2 3 2 1 2 2 4 3 1 2 3 1 0 x = 0 + 1 + 2 + 3 + 2 + 1 + 2 + 2 + 4 + 3 + 1 + 2 + 3 + 1 + 0 15 = 27 15 = 1.8 Die durchschnittliche Kinderzahl in der Stichprobe beträgt 1.8 Kinder. = Christodoulides / Waldherr Einführung in Quantitative Methoden- 2.VO 26/57

Arithmetisches Mittel (Mittelwert) Auf Grundlage der Häufigkeitstabelle lässt sich der Mittelwert berechnen, indem man jede Merkmalsausprägung mit ihrer absoluten Häufigkeit multipliziert und die Summe über alle Merkmalsausprägungen bildet. x = 1 n k x j f j j=1 Beispiel: Berechnung des Mittelwertes für Datenbeispiel 3 aus der Häufigkeitstabelle x = 1 2459 (19 1 + 20 1 + 24 2 + 31 1 +...) = 50 50 = 49.18 Christodoulides / Waldherr Einführung in Quantitative Methoden- 2.VO 27/57

Eigenschaften des Mittelwertes (1) Die Summe der Differenzen aller Werte vom Mittelwert ist Null, n (x i x) = 0 i=1 d.h. positive und negative Abweichungen vom Mittelwert heben sich auf. Christodoulides / Waldherr Einführung in Quantitative Methoden- 2.VO 28/57

Eigenschaften des Mittelwertes (2) Die Summe der quadrierten Differenzen aller Werte zum Mittelwert ist ein Minimum (d.h. ist kleiner als die Summe der quadrierten Differenzen aller Werte zu irgendeinem anderen Wert) n (x i x) 2 = Min i=1 Christodoulides / Waldherr Einführung in Quantitative Methoden- 2.VO 29/57

Gemeinsamer Mittelwert für zwei oder mehr Datensätze Den gemeinsamen Mittelwert aus zwei Stichproben mit Mittelwerten x 1 und x 2 und Stichprobenumfängen n 1 und n 2 berechnet man, indem man die Mittelwerte mit den Stichprobenumfängen gewichtet: x = n 1 x 1 + n 2 x 2 n 1 + n 2 Analog für mehr als zwei Datensätze. Christodoulides / Waldherr Einführung in Quantitative Methoden- 2.VO 30/57

Median und das α-quantil Der Median ist dadurch charakterisiert, dass jeweils mindestens 50% der Beobachtungen einen Wert größer oder gleich bzw. kleiner oder gleich dem Median annehmen Sind x (1) x (n) die der Größe nach geordneten Beobachtungswerte, so ist der Median definiert als x = x ( n+1 2 ) falls n ungerade x ( n 2 ) + x ( n+2 2 ) 2 falls n gerade Bei einer ungeraden Anzahl von Merkmalsausprägungen ist der Median der Wert in der Mitte der geordneten Reihe Bei einer geraden Anzahl ist der Median das arithmetische Mittel zwischen den beiden mittleren Werten der geordneten Reihe Christodoulides / Waldherr Einführung in Quantitative Methoden- 2.VO 31/57

Median und das α-quantil Beispiel 1: Anzahl der Kinder (n = 15): Urliste: 0 1 2 3 2 1 2 2 4 3 1 2 3 1 0 Geordn. Urliste: 0 0 1 1 1 1 2 2 2 2 2 3 3 3 4 x = x (8) = 2 Beispiel 2: Anzahl der Kinder (n = 16): Urliste: 0 1 2 3 2 1 2 2 4 3 1 2 3 1 0 5 Geordn. Urliste: 0 0 1 1 1 1 2 2 2 2 2 3 3 3 4 5 x = x (8) + x (9) 2 = 2 + 2 2 = 2 Christodoulides / Waldherr Einführung in Quantitative Methoden- 2.VO 32/57

Median und das α-quantil Sind x (1) x (n) die der Größe nach geordneten Beobachtungswerte, so ist das α-quantil (0 < α < 1) definiert als x α = x (l) falls n α keine ganze Zahl ist; l = die auf n α folgende ganze Zahl x (l) +x (l+1) 2 falls n α eine ganze Zahl ist; l = n α Der Median ist das Quantil mit α = 0.50 (0.50-Quantil) Die Quantile mit α = 0.25 und α = 0.75 heißen unteres bzw. oberes Quartil Christodoulides / Waldherr Einführung in Quantitative Methoden- 2.VO 33/57

Median und das α-quantil Beispiel Anzahl der Kinder (n = 15): Urliste: 0 1 2 3 2 1 2 2 4 3 1 2 3 1 0 Geordnete Urliste: 0 0 1 1 1 1 2 2 2 2 2 3 3 3 4 x = x (8) = 2 x 0.25 = x (4) = 1 x 0.75 = x (12) = 3 Christodoulides / Waldherr Einführung in Quantitative Methoden- 2.VO 34/57

Median und das α-quantil Der Median hat gegenüber dem arithmetischen Mittel den Vorteil, dass er auch bei rangskalierten Merkmalen verwendet werden kann Der Median ist weniger empfindlich gegenüber Ausreissern in der Stichprobe Werte, die weit von allen übrigen entfernt liegen, beeinflussen den Median kaum Christodoulides / Waldherr Einführung in Quantitative Methoden- 2.VO 35/57

Ausreisser - Graphische Überprüfung Christodoulides / Waldherr Einführung in Quantitative Methoden- 2.VO 36/57

Modalwert Bei nominalskalierten Merkmalen wie Geschlecht oder Beruf kann man weder das arithmetische Mittel noch den Median als Lagemaß verwenden Der Modalwert (Mod) (häufigster Wert) ist ein dafür geeignetes Lagemaß Der Modalwert gibt die Ausprägung an, welche die größte Häufigkeit in der Stichprobe besitzt Falls mehrere Ausprägungen diese Bedingung erfüllen, der Modalwert also nicht eindeutig ist, ist es nicht sinnvoll ihn als Lagemaß zu verwenden Christodoulides / Waldherr Einführung in Quantitative Methoden- 2.VO 37/57

Modalwert Univariate Deskriptive Statistik Beispiel Anzahl der Kinder (n = 15): Urliste: 0 1 1 3 2 2 2 3 4 3 1 2 3 1 0 Mod = 1, 2, 3 Modalwert nicht eindeutig Christodoulides / Waldherr Einführung in Quantitative Methoden- 2.VO 38/57

Bemerkungen zu den Lagemaßen Bei mehrgipfeligen und U-förmigen Häufigkeitsverteilungen sind Lagemaße nicht charakteristisch für die Verteilung Vor der Verwendung eines Lagemaßes immer seine Sinnhaftigkeit überprüfen Charakterisierung von Häufigkeitsverteilungen Christodoulides / Waldherr Einführung in Quantitative Methoden- 2.VO 39/57

Charakterisierung von Häufigkeitsverteilungen Bei einer symmetrischen Verteilung gilt x = x = Mod Christodoulides / Waldherr Einführung in Quantitative Methoden- 2.VO 40/57

Charakterisierung von Häufigkeitsverteilungen Lagemaße charakterisieren den Datensatz nicht richtig Christodoulides / Waldherr Einführung in Quantitative Methoden- 2.VO 41/57

Bei einer linksschiefen Verteilung gilt x < x < Mod Bei einer rechtsschiefen Verteilung gilt x > x > Mod Christodoulides / Waldherr Einführung in Quantitative Methoden- 2.VO 42/57

Wegweiser Lagemaße Christodoulides / Waldherr Einführung in Quantitative Methoden- 2.VO 43/57

Streuungsmaße - Zweck Streuungsmaße beschreiben die Abweichung von einem Zentrum einer Häufigkeitsverteilung Präzisierung einer Häufigkeitsverteilung durch Lagemaß und Streuungsmaß Spannweite, Standardabweichung, Varianz, Variationskoeffizient und Quartilabstand Christodoulides / Waldherr Einführung in Quantitative Methoden- 2.VO 44/57

Spannweite Univariate Deskriptive Statistik Streubereich einer Häufigkeitsverteilung ist derjenige Bereich, in dem alle Werte der Stichprobe liegen Sind x (1) x (n) die der Größe nach geordneten Beobachtungswerte, so ist das Intervall [ x (1), x (n) ] der Streubereich der Stichprobe Spannweite R = x (n) x (1), d.h. die Breite des Streubereichs Ausreisser beeinflussen die Spannweite sehr stark Berechnung der Spannweite ist nur für metrische Variablen sinnvoll Christodoulides / Waldherr Einführung in Quantitative Methoden- 2.VO 45/57

Varianz Univariate Deskriptive Statistik Die Varianz s 2 ist ein Maß, das die Streuung der Werte um den Mittelwert ausdrückt s 2 = 1 n 1 [ n n (x i x) 2 = 1 n 1 i=1 i=1 x 2 i ( n i=1 x i) 2 n }{{} praktische Berechnungsformel Varianz ist ein quadratisches Streuungsmaß und nimmt somit stets positive Werte an Ausreisser beeinflussen die Varianz sehr stark, da die Bezugsgröße der Mittelwert ist Berechnung der Varianz ist nur für metrische Variablen sinnvoll Christodoulides / Waldherr Einführung in Quantitative Methoden- 2.VO 46/57 ]

Varianz Univariate Deskriptive Statistik Beispiel Anzahl der Kinder (n = 15): Urliste: 0 1 1 3 2 2 2 3 4 3 1 2 3 1 0 15 i=1 x i = 28 15 i=1 xi 2 = 72 s 2 = 1 [ 72 784 ] = 1.38 14 15 Die Varianz läßt sich auch durch die Häufigkeitstabelle berechnen, analog zu Mittelwert s 2 = 1 k f j x j 2 ( k j=1 f jx j )2 n 1 n j=1 Christodoulides / Waldherr Einführung in Quantitative Methoden- 2.VO 47/57

Varianz Univariate Deskriptive Statistik Beispiel Datenbeispiel 3: Häufigkeitstabelle siehe 1. Vorlesungseinheit 50 i=1 s 2 = 1 49 x i = 2459 50 i=1 [132027 24592 50 x 2 i = 132027 ] = 226.396 Christodoulides / Waldherr Einführung in Quantitative Methoden- 2.VO 48/57

Standardabweichung Univariate Deskriptive Statistik Die Standardabweichung s ist die positive Wurzel aus der Varianz einer Stichprobe s = + s 2 = 1 + n 1 n (x i x) 2 Die Standardabweichung besitzt die gleiche Dimension wie die Beobachtungswerte (Vorteil gegenüber der Varianz) Ausreisser beeinflussen die Standardabweichung sehr stark, da die Bezugsgröße der Mittelwert ist i=1 Berechnung der Standardabweichung ist sinnvoll nur für metrische Variablen Christodoulides / Waldherr Einführung in Quantitative Methoden- 2.VO 49/57

Variationskoeffizient Univariate Deskriptive Statistik Der Variationskoeffizient v ist ein vom Mittelwert bereinigtes Streuungsmaß v = s x Der Variationskoeffizient misst das Verhältnis von Standardabweichung und Mittelwert Berechnung von v nur für metrische Variablen mit positiven Werten sinnvoll Der Variationskoeffizient eignet sich zum Vergleich der Streuungen verschiedener Messreihen Christodoulides / Waldherr Einführung in Quantitative Methoden- 2.VO 50/57

Quartilabstand Univariate Deskriptive Statistik q A = x 0.75 x 0.25 Quartilabstand ist robust gegenüber Ausreissern Zwischen dem unteren und oberen Quartil liegen 50% aller Werte Berechnung des Quartilabstandes ist sinnvoll für mindestens rangskalierte Variablen Christodoulides / Waldherr Einführung in Quantitative Methoden- 2.VO 51/57

Quartilabstand Univariate Deskriptive Statistik Beispiel Anzahl der Kinder (n = 15): Urliste: 0 1 2 3 2 1 2 2 4 3 1 2 3 1 0 Geordnete Urliste: 0 0 1 1 1 1 2 2 2 2 2 3 3 3 4 x = x (8) = 2 x 0.25 = x (4) = 1 x 0.75 = x (12) = 3 q A = x 0.75 x 0.25 = 2 Christodoulides / Waldherr Einführung in Quantitative Methoden- 2.VO 52/57

Ausreisser - Grafische Überprüfung Christodoulides / Waldherr Einführung in Quantitative Methoden- 2.VO 53/57

Wegweiser Streuungsmaße Christodoulides / Waldherr Einführung in Quantitative Methoden- 2.VO 54/57

Schiefe Univariate Deskriptive Statistik Die Schiefe g 1 ist eine Maßzahl, die uns angibt, in welche Richtung eine Häufigkeitsverteilung schief ist g 1 = 1 n n i=1 (x i x) 3 ( 1 n n i=1 (x i x) 2 ) 3 Ist g 1 = 0, so ist die Verteilung symmetrisch Je stärker negativ/positiv g 1 ist, desto linksschiefer/rechtsschiefer ist die Verteilung Die Schiefe ist sinnvoll für eingipfelige Verteilungen Christodoulides / Waldherr Einführung in Quantitative Methoden- 2.VO 55/57

Messwerte von Personen verschiedener Populationen sind oft nicht direkt vergleichbar, z.b. die Leistung eines Mädchens in Kugelstoßen mit jener eines Knaben Dennoch möchte man ausdrücken können, wie gut jeder der beiden Leistungen innerhalb der Bezugsgruppe ist Der Standardmesswert ti bezieht den beobachteten Messwert x i der i-ten Person auf den Mittelwert x der Gruppe und drückt die Abweichung in Standardeinheiten s aus Es gilt t = 0 und s 2 t = 1 t i = x i x s Christodoulides / Waldherr Einführung in Quantitative Methoden- 2.VO 56/57

Beispiel Ein Knabe erzielt 5.20m bei Gruppenkennwerten x M = 5.03, bzw. s M = 0.92 Ein Mädchen erreicht 4.50m bei Gruppenkennwerten x W = 4.21, bzw. s W = 0.85 Daher ist t M = 0.18 und t W = 0.42 Der Knabe liegt 0.18, das Mädchen 0.42 Standardeinheiten über dem Mittelwert (0!); die Leistung des Mädchens ist relativ besser Christodoulides / Waldherr Einführung in Quantitative Methoden- 2.VO 57/57