Kapitel 5 Kenngrößen empirischer Verteilungen 5.1. Lagemaße. x mod (lies: x-mod) Wofür? Lageparameter. Modus/ Modalwert Zentrum. Median Zentralwert

Ähnliche Dokumente
3.2 Streuungsmaße. 3 Lage- und Streuungsmaße 133. mittlere Variabilität. geringe Variabilität. große Variabilität

Statistik K urs SS 2004

Einführung in Quantitative Methoden

Herzlich willkommen zur Vorlesung Statistik. Streuungsmaße oder die Unterschiedlichkeit der Daten nebst kurzen Ausführungen zu Schiefe und Wölbung

Statistische Grundlagen I

Das arithmetische Mittel. x i = = 8. x = 1 4. und. y i = = 8

Einführung in Quantitative Methoden

Deskriptive Statistik

Kapitel 1 Beschreibende Statistik

Kapitel 3: Lagemaße. Ziel. Komprimierung der Daten zu einer Kenngröße, welche die Lage, das Zentrum der Daten beschreibt

Kapitel VI - Lage- und Streuungsparameter

Kenngrößen von Zufallsvariablen

Univariate Häufigkeitsverteilungen Kühnel, Krebs 2001: Statistik für die Sozialwissenschaften, S.41-66

Weitere Lagemaße: Quantile/Perzentile I

Deskription, Statistische Testverfahren und Regression. Seminar: Planung und Auswertung klinischer und experimenteller Studien

Lage- und Streuungsparameter

Das harmonische Mittel

N

4 Statistische Maßzahlen

Fachrechnen für Tierpfleger

Mathematische und statistische Methoden II

Sommersemester Marktforschung

Mittelwert und Standardabweichung

1. Maße der zentralen Tendenz Beispiel: Variable Anzahl der Geschwister aus Jugend '92. Valid Cum Value Frequency Percent Percent Percent

4 Statistische Maßzahlen

Lagemasse und Streuung

Teil I: Deskriptive Statistik

3) Lagemaße: Mittelwert, Median, Modus

3. Deskriptive Statistik

benötigen. Die Zeit wird dabei in Minuten angegeben und in einem Boxplot-Diagramm veranschaulicht.

Statistik und Wahrscheinlichkeitsrechnung

Institut für Biometrie und klinische Forschung. WiSe 2012/2013

Der Mittelwert (arithmetisches Mittel)

Deskriptive Statistik Beschreiben, Zusammenfassen, Darstellen gegebener Daten (Datenreduktion!)

Deskriptive Statistik

htw saar 1 EINFÜHRUNG IN DIE STATISTIK: BESCHREIBENDE STATISTIK

Inhaltsverzeichnis Grundlagen aufigkeitsverteilungen Maßzahlen und Grafiken f ur eindimensionale Merkmale

Einführung in die Statistik für Politikwissenschaftler Sommersemester 2011

Die erhobenen Daten werden zunächst in einer Urliste angeschrieben. Daraus ermittelt man:

Die erhobenen Daten werden zunächst in einer Urliste angeschrieben. Daraus ermittelt man:

a 1 < a 2 <... < a k. 2 Häufigkeitsverteilungen 52

Analytische Statistik II

Ermitteln Sie auf 2 Dezimalstellen genau die folgenden Kenngrößen der bivariaten Verteilung der Merkmale Weite und Zeit:

Statistik eindimensionaler Größen

5 Kenngrößen univariater empirischer Verteilungen

3 Lage- und Streuungsmaße

Der Modus ist. Der Median ist. 3. Übung. Aufgabe 1. a) der häufigste Wert. b) der Wert unter dem 50 % aller anderen Werte liegen.

Deskriptive Statistik Erläuterungen

Lösung Aufgabe 19. ( ) = [Mio Euro]. Empirische Varianz s 2 = 1 n

Inhaltsverzeichnis. 1 Über dieses Buch Zum Inhalt dieses Buches Danksagung Zur Relevanz der Statistik...

Mathematik für Biologen

Übungsrunde 2, Gruppe 2 LVA , Übungsrunde 1, Gruppe 2, Markus Nemetz, TU Wien, 10/2006

Deskriptive Statistik. (basierend auf Slides von Lukas Meier)

Deskriptive Statistik

absolute Häufigkeit h: Anzahl einer bestimmten Note relative Häufigkeit r: Anzahl einer bestimmten Note, gemessen an der Gesamtzahl der Noten

Verfahren für metrische Variable

Deskriptive Statistik

2. Statistisches Rüstzeug

1 Univariate Statistiken

Beispiel 2 (Einige Aufgaben zu Lageparametern) Aufgabe 1 (Lageparameter)

Graphische Darstellung einer univariaten Verteilung:

4.2 Grundlagen der Testtheorie. Wintersemester 2008 / 2009 Hochschule Magdeburg-Stendal (FH) Frau Prof. Dr. Gabriele Helga Franke

STATISTIK I Übung 04 Spannweite und IQR. 1 Kurze Wiederholung. Was sind Dispersionsparameter?

P (X = 2) = 1/36, P (X = 3) = 2/36,...

Bitte am PC mit Windows anmelden!

Kapitel 2. Mittelwerte

Über dieses Buch Die Anfänge Wichtige Begriffe... 21

4 Spezifizierende Beschreibung empirischer Verteilungen

4 Spezifizierende Beschreibung empirischer Verteilungen

Statistische Methoden der Datenanalyse Wintersemester 2012/2013 Albert-Ludwigs-Universität Freiburg

825 e 290 e 542 e 945 e 528 e 486 e 675 e 618 e 170 e 500 e 443 e 608 e. Zeichnen Sie das Box-Plot. Sind in dieser Stichprobe Ausreißer vorhanden?

Inferenzstatistik (=schließende Statistik)

Deskriptive Statistik Kapitel IX - Kontingenzkoeffizient

Diskrete Zufallsvariablen (Forts.) I

Diskrete Zufallsvariablen (Forts.) I

Statistik mit und ohne Zufall

Deskriptivstatistik a) Univariate Statistik Weiters zum Thema der statistischen Informationsverdichtung

8. Statistik Beispiel Noten. Informationsbestände analysieren Statistik

Vorlesung Gesamtbanksteuerung Mathematische Grundlagen II Dr. Klaus Lukas Carsten Neundorf. Vorlesung 04 Mathematische Grundlagen II,

Statistik und Wahrscheinlichkeitsrechnung

fh management, communication & it Constantin von Craushaar fh-management, communication & it Statistik Angewandte Statistik

Statistische Methoden in den Umweltwissenschaften

Forschungsstatistik I

Deskriptive Statistik

Woche 2: Zufallsvariablen

Deskriptive Statistik Auswertung durch Informationsreduktion

Vorlesungsskript. Deskriptive Statistik. Prof. Dr. Günter Hellmig

Prüfung aus Statistik 1 für SoziologInnen- Gruppe A

Deskriptive Statistik II. Statistische Methoden in der Korpuslinguistik Heike Zinsmeister WS 2008/09

Lösungen. w58r4p Lösungen. w58r4p. Name: Klasse: Datum:

Statistik. Jan Müller

I. Deskriptive Statistik 1

3 Lage- und Streuungsmaße

W-Seminar: Versuche mit und am Menschen 2017/2019 Skript

Mathematik für Biologen

Grundkompetenzkatalog. Mathematik

Statistische Kennzahlen für die Lage

Transkript:

Kapitel 5 Kenngrößen empirischer Verteilungen 5.1. Lagemaße Wofür? Lageparameter Modus/ Modalwert Zentrum Median Zentralwert Im Datensatz stehende Informationen auf wenige Kenngrößen verdichten ermöglicht eine unmissverständliche Beschreibung von Charakteristika eines Datensatzes, ist aber grundsätzlich mit Informationsverlust verbunden dienen dem Zweck, solche Befunde zu präzisieren und zu objektivieren x mod (lies: x-mod) Dieser lässt sich immer anwenden, also auch bei Merkmalen, deren Ausprägungen nur Kategorien sind (qualitative Merkmale). Er ist definiert als die Merkmalsausprägung mit der größten Häufigkeit. (lies: x-schlange) Natürliche Rangordnung, mittlerer Wert des geordneten Datensatzes Ungerade z.b. 5 Werte, gibt es einen genauen Median Gerade z.b. 6 Werte, nicht eindeutig bei ordinalskaliert, metrisch wird der Mittelwert gebildet Mittelwert Arithmetisches Mittel x (x quer) nur metrisch anwendbar, es werden alle Werte addiert und mit der Anzahl n dividiert. Reagiert empfindlich gegenüber extremen Werten (höhere Sensivität) Geringere Robustheit des Mittelwerts gegenüber Ausreißern, d.h. gegenüber auffällig großen oder kleinen Beobachtungswerten Folgende Gleichung beinhaltet, dass sich der Mittelwert als Schwerpunkt des Datensatzes interpretieren lässt Alternative zur Berechnung des Mittelwerts Der Mittelwert lässt sich als Summe der mit den relativen Häufigkeiten gewichteten Ausprägungen ermitteln

Welche Lageparameter ist geeignet? - Skalierung des Merkmals nominalskaliertes Merkmal > Modalwert metrisch skaliertes Merkmal > Modalwert, Median und Mittelwert - Fragestellung ist wichtig überlegen, wie robust die zu berechnende Kenngröße gegenüber Extremwerten sein soll 5.2. Streuungsmaße Definition Spannweite Charakterisiert Abstände zwischen den Merkmalsausprägungen Charakterisiert die Differenz aus größten x n und kleinsten x 1 Wert, geordneter Datensatz nach aufsteigende Größe, für metrisch skalierte Werte Nachteil: hohe Sensivität gegenüber Ausreißern Formel R (range) R x n -x 1 Varianz Auch empirische Varianz s 2 (Abkürzung) Quadratisches Streuungsmaß, bildet den Mittelwert aus den Quadraten der Abweichungen, es gilt: Formel Standardabweichung s (Abkürzung) lineares (geradliniges) Streuungsmaß, wenn aus der Varianz die Wurzel gezogen wird = anschauliches Streuungsmaß Korrigierte Varianz & Standardabweichung In der Literatur nicht einheitlich, es gibt noch folgende Formeldarstellungen zu s *2 & s *

Wichtig zu wissen zu den Formeln! Alternative Formel zur Varianz Die Unterschiede zwischen beiden Größen verschwinden mit zunehmendem n, können aber bei kleinem n ins Gewicht fallen. Die korrigierte Varianz wird beim Schätzen und Testen bevorzugt verwendet, weil sie günstigere Eigenschaften besitzen. Die Division durch n-1 wird erst im Kontext der schließenden Statistik nachvollziehbar!! Relative Häufigkeitsverteilung Liegt für ein diskretes Merkmal X mit den Ausprägungen a 1,,a k eine größere Anzahl n von Beobachtungswerten x 1,,x n (n > k) Vergleich von Grundgesamtheiten = z- Transformation (Z) Der Einsatzzweck ist, wenn unterschiedlich verteilte Zufallsvariablen miteinander vergleichen zu können jedem Element X eines Datensatzes jeweils dessen Mittelwert μ subtrahieren und die Differenz noch durch die Standardabweichung σ oder die korrigierte Standardabweichung dividieren = standardisierte Zufallsvariable mit Erwartungswert/Mittelwert 0 und Varianz/Standardabweichung 1 5.3. Quantile und Boxplots Median Makiert die Mitte eines Datensatzes, verallgemeinert q-quantile, setzt wieder ein metrisch (eindeutig) oder zumindest ordinalskaliertes Merkmal (nicht eindeutig) voraus x p (Abkürzung) hat die Eigenschaft, dass mindestens p*100% der Elemente der geordneten Folge kleiner oder gleich und mindestens (1-p)*100% größer oder gleich x p sind. Veranschaulichung Formal

Spezielle Quantile Differenz der Quantile Dezile Asymmetrische Verteilung Q x 0,75 x 0,25 Misst den Quartilabstand, auch Interquartilabstand IQR. Ferner sind noch die Dezile zu nennen, die sich bei Wahl von p=0,1; p=0,2; ;p=0,9 ergeben und oft mit D1, D2,..., D9 abgekürzt werden. Der Median stimmt also mit dem Dezil D5 überein. Die Nicht-Übereinstimmung von Median und Mittelwert einer empirischen Verteilung ist stets ein Indiz für eine Asymmetrie dieser Verteilung Linkssteile (rechtsschiefe) Verteilung Rechtssteile (linksschiefe) Verteilung http://images.slideplayer.org/1/662836/slides/slide_4.jpg Boxplot Schachtelzeichnung https://de.wikipedia.org/wiki/boxplot

Basisversion