Lage- und Streuungsparameter

Ähnliche Dokumente
Statistik K urs SS 2004

1. Maße der zentralen Tendenz Beispiel: Variable Anzahl der Geschwister aus Jugend '92. Valid Cum Value Frequency Percent Percent Percent

Anteile Häufigkeiten Verteilungen Lagemaße Streuungsmaße Merkmale von Verteilungen. Anteile Häufigkeiten Verteilungen

Maße der zentralen Tendenz

Wiederholung Statistik I. Statistik für SozialwissenschaftlerInnen II p.8

Statistik II: Grundlagen und Definitionen der Statistik

Statistik eindimensionaler Größen

Das arithmetische Mittel. x i = = 8. x = 1 4. und. y i = = 8

Median 2. Modus < Median < Mittelwert. Mittelwert < Median < Modus. 2 Modalwerte oder Modus viel größer bzw. viel kleiner als Mittelwert

Deskriptive Statistik

Beispiel 2 (Einige Aufgaben zu Lageparametern) Aufgabe 1 (Lageparameter)

3. Lektion: Deskriptive Statistik

Deskriptivstatistik a) Univariate Statistik Weiters zum Thema der statistischen Informationsverdichtung

Lage- und Streuungsmaße

Deskriptive Statistik Erläuterungen

Lagemaße Übung. Zentrale Methodenlehre, Europa Universität - Flensburg

Einführung in Quantitative Methoden

W-Seminar: Versuche mit und am Menschen 2017/2019 Skript

Univariate Häufigkeitsverteilungen Kühnel, Krebs 2001: Statistik für die Sozialwissenschaften, S.41-66

Graphische Darstellung einer univariaten Verteilung:

Mathematische und statistische Methoden I

Diese Lücken sollten nicht auch bei Ihnen vorhanden sein: Aufgrund einer statistischen Untersuchung entsteht eine geordnete bzw. ungeordnete, die durc

Ausführliche Lösungen zu ausgewählten Aufgaben von ÜB 5 und 6. Streudiagramm

3. Deskriptive Statistik

Statistik und Wahrscheinlichkeitsrechnung

Streuungsmaße von Stichproben

Kapitel 5 Kenngrößen empirischer Verteilungen 5.1. Lagemaße. x mod (lies: x-mod) Wofür? Lageparameter. Modus/ Modalwert Zentrum. Median Zentralwert

Deskriptive Statistik & grafische Darstellung

Das harmonische Mittel

Einführung in Quantitative Methoden

Mathematische und statistische Methoden II

Mittelwert und Standardabweichung

Lösungen. w58r4p Lösungen. w58r4p. Name: Klasse: Datum:

htw saar 1 EINFÜHRUNG IN DIE STATISTIK: BESCHREIBENDE STATISTIK

Lagemasse und Streuung

Vorlesung Gesamtbanksteuerung Mathematische Grundlagen II Dr. Klaus Lukas Carsten Neundorf. Vorlesung 04 Mathematische Grundlagen II,

Herzlich willkommen zur Vorlesung Statistik. Streuungsmaße oder die Unterschiedlichkeit der Daten nebst kurzen Ausführungen zu Schiefe und Wölbung

Fachrechnen für Tierpfleger

Der Mittelwert (arithmetisches Mittel)

3) Lagemaße: Mittelwert, Median, Modus

8. Statistik Beispiel Noten. Informationsbestände analysieren Statistik

Deskription, Statistische Testverfahren und Regression. Seminar: Planung und Auswertung klinischer und experimenteller Studien

1 45, 39, 44, 48, 42, 39, 40, , 31, 46, 35, 31, 42, 51, , 42, 33, 46, 33, 44, 43

Deskriptive Statistik. (basierend auf Slides von Lukas Meier)

Deskriptive Statistik

Kapitel 1 Beschreibende Statistik

Statistische Grundlagen I

Die erhobenen Daten werden zunächst in einer Urliste angeschrieben. Daraus ermittelt man:

Die erhobenen Daten werden zunächst in einer Urliste angeschrieben. Daraus ermittelt man:

1.1 Graphische Darstellung von Messdaten und unterschiedliche Mittelwerte. D. Horstmann: Oktober

Deskriptive Statistik Winfried Zinn

TEIL 12: BIVARIATE ANALYSE FÜR METRISCH SKALIERTE VARIABLEN

Kapitel 1: Deskriptive Statistik

Statistische Methoden in den Umweltwissenschaften

Grundlagen der empirischen Sozialforschung

(x i x) 2. (x i a) 2, x i x med. x i a. i=1. 3 Lage- und Streuungsmaße 134

Mathematik für Biologen

1 Univariate Statistiken

Weitere Lagemaße: Quantile/Perzentile I

I.V. Methoden 2: Deskriptive Statistik WiSe 02/03

2. Statistisches Rüstzeug

Was sind Zusammenhangsmaße?

Einfache Varianzanalyse für unabhängige Stichproben

Bitte am PC mit Windows anmelden!

1.5 Berechnung von Rangzahlen

Lage- und Streuungsmaße

Kapitel 2. Mittelwerte

beruflicher Bildungsabschluss incl. Hochschulabschl. 4Kat.(m) Häufigkeit Prozent Gültig Lehre/Beruffachgesundh.Schule ,2 59,2 59,2

a) x = 1150 ; x = 950 ; x = 800 b) Die Lagemaße unterscheiden sich voneinander. c) Der Median charakterisiert die Stichprobe am besten.

Statistische Methoden in den Umweltwissenschaften

Deskriptive Statistik

Statistik I. Methodologie der Psychologie

Lage- und Streuungsmaße

Kapitel 3: Lagemaße. Ziel. Komprimierung der Daten zu einer Kenngröße, welche die Lage, das Zentrum der Daten beschreibt

STATISTIK FÜR STATISTIK-AGNOSTIKER Teil 1 (wie mich)

Kennwerte eindimensionaler Häufigkeitsverteilungen

4 Statistische Maßzahlen

Beispiel 4 (Einige weitere Aufgaben)

3.2 Streuungsmaße. 3 Lage- und Streuungsmaße 133. mittlere Variabilität. geringe Variabilität. große Variabilität

Thema: Mittelwert einer Häufigkeitsverteilung. Welche Informationen kann der Mittelwert geben?

Univ.-Prof. Dr. Georg Wydra

Wahrscheinlichkeitsverteilungen

Aufbau des Experiments Reihung von Versuchsitems und Distraktoren

T-Test für unabhängige Stichproben

Korrelation, Regression und Signifikanz

Der Modus ist. Der Median ist. 3. Übung. Aufgabe 1. a) der häufigste Wert. b) der Wert unter dem 50 % aller anderen Werte liegen.

= 3. Kapitel 4: Normalverteilung.. und Standardnormalverteilung und: das Konfidenzintervall..

Übersicht Teil 1 - deskriptive Statistik

Sommersemester Marktforschung

Statistik und Wahrscheinlichkeitsrechnung

Deskriptive Statistik Kapitel VI - Lage- und Streuungsparameter

TEIL 12: BIVARIATE ANALYSE FÜR METRISCH SKALIERTE VARIABLEN

Ü B U N G S S K R I P T S T A T I S T I K

Dr. Maike M. Burda. Welchen Einfluss hat die Körperhöhe auf das Körpergewicht? Eine Regressionsanalyse. HU Berlin, Econ Bootcamp

Statistische Kennzahlen für die Lage

Einführung in die Statistik für Wirtschaftswissenschaftler für Betriebswirtschaft und Internationales Management

Beschreibende Statistik Eindimensionale Daten

Transkript:

Lage- und Streuungsparameter Beziehen sich auf die Verteilung der Ausprägungen von intervall- und ratio-skalierten Variablen Versuchen, diese Verteilung durch Zahlen zu beschreiben, statt sie graphisch darzustellen Soweit die Berechnung ohne einen Computer erfolgt, ist es sinnvoll, die Daten zu gruppieren, d.h. eine Häufigkeitstabelle zu erstellen, mit der die Berechnungen vereinfacht werden können 1

Alter der Kursteilnehmer: Häufigkeitstabelle Ausprägung Häufigkeit 20 4 21 6 22 7 23 3 24 1 25 0 26 5 27 0 28 0 29 0 30 1 31 1 2

Lageparameter (=Mittelwerte) Beziehen sich auf die zentrale Tendenz einer Verteilung Berechnung nur dann sinnvoll, wenn die Verteilung tatsächlich eine zentrale Tendenz aufweist, d.h. möglichst eingipflig ist Vielzahl von Mittelwerten. Hier behandelt werden Modus (=Modalwert) Median Arithmetisches Mittel (= Durchschnitt ) 3

Modus Ist der Meßwert, der in der Verteilung am häufigsten vorkommt. Abkürzung x Mo Im Beispiel: 22 Jahre Wenn zwei Werte gleich häufig vorkommen arithmetisches Mittel bestimmen, soweit sinnvoll und möglich ansonsten auf Angabe des Modus verzichten Kann unmittelbar aus der Verteilung bestimmt werden Ist unempfindlich gegenüber Extremwerten Kann für alle Skalenniveaus bestimmt werden Niedriger Informationsgehalt 4

Median Ist der Meßwert, der die aufsteigend angeordneten Meßwerte in der Mitte teilt Bei einer ungeraden Anzahl von Meßwerten gibt es genau einen Wert, der diese Bedingung erfüllt Bei einer geraden Anzahl von Werten wird das arithmetische Mittel aus den beiden mittleren Werten gebildet Berücksichtigt alle Meßwerte und ist robust gegen Ausreißer In diesem Fall (22+22)/2=22 x~!! 20 20 20 20 21 21 21 21 21 21 22 22 22 22 22 22 22 23 23 23 24 26 26 26 26 26 30 31 5

Arithmetisches Mittel Ist der bekannteste Mittelwert Prinzip: alle Werte werden aufsummiert, dann wird durch die Zahl der Fälle geteilt In unserem Fall: 644/28=23 Empfindlich gegen Ausreißer: Bleiben die ältesten beiden Kursteilnehmer unberücksichtigt, sinkt das arithmetische Mittel auf 22,42 Jahre. Modus und Median bleiben unbeeinflußt Nutzt das Maximum an Information, das in den Daten enthalten ist Die Summe der Abweichungen vom arithmetischen Mittel ist null Die Summe der quadrierten Abweichungen vom arithmetischen Mittel ist minimal x 6

Rechnen mit dem Summenzeichen In der Statistik wird häufig das Summenzeichen (Sigma) benutzt Dieses Zeichen symbolisiert eine Aufsummierung über alle Fälle Unter dem Summenzeichen steht meist i=1, was den Laufindex über die Fälle und dessen Startwerte repräsentiert Über dem Summenzeichen steht n, was bedeutet, das bis zum letzten (n-ten) Fall aufsummiert werden soll Beide Zusätze werden häufig weggelassen n i=1 n x i = x 7

Form der Verteilung Aus dem Verhältnis der drei Mittelwerte zueinander kann man auf die Form der Verteilung schließen: Linkssteile Verteilung Die häufigste Ausprägung liegt weit links, deshalb ist der Modus der kleinste der drei Werte Der Median, der die Verteilung halbiert, liegt in der Mitte und ist deshalb größer als der Modus Das arithmetische Mittel reagiert auf die wenigen Ausreißer am rechten Rand der Verteilung und ist deshalb nochmals größer als der Median Rechtssteile Verteilung: Reihenfolge kehrt sich um Symmetrische Verteilung: alle drei Mittelwerte fallen zusammen 8

Streuungsparameter Mittelwerte informieren über die zentrale Tendenz einer Verteilung Streuungsparameter informieren darüber, wie homogen eine Verteilung ist: im Falle einer absolut homogenen Verteilung sind alle Werte mit dem Mittelwert identisch, die Streuung ist gleich null je heterogener die Verteilung, desto stärker streuen die Meßwerte um den Mittelwert im Falle einer zweigipfeligen Verteilung unterscheiden sich die die Meßwerte extrem vom Mittelwert Zur Beschreibung der Streuung existieren verschiedene Maße. Im Kurs behandelt werden Variationsweite (auch Spannweite, range) Varianz und die daraus abgeleitete Standardabweichung 9

Variationsweite Die Variationsweite (V) ist einfach die Differenz zwischen dem größten und dem kleinsten Meßwert In unserem Fall: 31-20= 11 Jahre Kann direkt aus der Verteilung abgelesen werden Einfache Interpretation Basiert auf lediglich zwei Meßwerten Wertet nur einen Bruchteil der in den Daten enthaltenen Information aus Extrem anfällig für Ausreißer 10

Varianz Berücksichtigt alle Meßwerte Entspricht der durchschnittlichen quadrierten Abweichung der Meßwerte von ihrem Mittelwert Abkürzung s 2 In unserem Fall: 8,07 Warum werden Abweichungen quadriert? Damit das Vorzeichen verschwindet (Summe der einfachen Abweichungen wäre null) Damit große Abweichungen vom Mittelwert stärker gewichtet werden Problem: Die Maßeinheit geht verloren bzw. kann nicht interpretiert werden (Quadratjahre) 11

Berechnung der Varianz Varianz II Mittelwert berechnen Für jeden Meßwert Differenz zum Mittelwert berechnen Differenz quadrieren und aufaddieren Summe durch Zahl der Fälle teilen s 2 = SAQ (Summe der Abweichungs-Quadrate)/n Die Varianz einer Stichprobe unterschätzt die Varianz der Grundgesamtheit um den Faktor (n-1)/n Deshalb muß die Stichprobenvarianz mit dem Faktor n/(n-1) multipliziert werden, wenn eine Schätzung für die Grundgesamtheit gewünscht wird Das führt zur Vereinfachung SAQ/n*n/(n-1) = SAQ/n-1 Diese Korrektur wird nur dann vorgenommen, wenn eine Schätzung erforderlich ist 12

Varianz III ID Meßwert arith. Mittel Abweichung AQ Varianz 2 20-23 = -3 9 17 26-23 = 3 9 10 24-23 = 1 1... 226 226/28=8,07 13

Standardabweichung Die Standardabweichung (s) wird direkt aus der Varianz berechnet, indem aus der Varianz die Quadratwurzel gezogen wird Wird teilweise mit S.D. (standard deviation) abgekürzt Vorteil: Liegt wieder in der ursprünglichen Einheit vor In unserem Fall: 2,84 Jahre Interpretation trotzdem nicht ganz einfach s ist nicht die mittlere Abweichung vom Durchschnitt s entspricht auch nicht dem Mittel der Beträge der einzelnen Abweichungen 14

z-transformation Meßwerte aus unterschiedlichen Verteilungen (bspw. unterschiedliche Statistikklausuren) sollen miteinander verglichen werden Dazu wird zunächst von jedem Meßwert der Mittelwert seiner Verteilung abgezogen (Zentrierung), um Niveauunterschiede auszugleichen Die unterschiedliche Streuung (z.b. durch unterschiedliche Maßeinheiten) der Verteilungen wird kompensiert, indem die zentrierten Werte durch die Standardabweichung ihrer Verteilung geteilt werden 15

z-werte Sind das Ergebnis der z-transformation Repräsentieren die Abweichung des ursprünglichen Meßwertes vom Mittelwert seiner Verteilung Diese Abweichung wird in Standardabweichungen der ursprünglichen Verteilung ausgedrückt Damit informieren z-werte skalenunabhängig über die Lage des ursprünglichen Meßwertes innerhalb seiner Verteilung z-werte weisen ihrerseits einen Mittelwert von 0 und eine Standardabweichung von 1 auf 16