Bestimmen von Quantilen

Ähnliche Dokumente
Empirische Verteilungsfunktion

Wahrscheinlichkeits - rechnung und Statistik

Statistik für Ingenieure Vorlesung 3

4. Kumulierte Häufigkeiten und Quantile

Mathematische und statistische Methoden II

4. Kumulierte Häufigkeiten und Quantile

Verteilungsfunktion und dquantile

Kreisdiagramm, Tortendiagramm

1 Wahrscheinlichkeitsrechnung. 2 Zufallsvariablen und ihre Verteilung. 3 Statistische Inferenz. 4 Hypothesentests. 5 Regression

Fit for Abi & Study Stochastik

Inhaltsverzeichnis. Inhalt Teil I: Beschreibende (Deskriptive) Statistik Seite. 1.0 Erste Begriffsbildungen Merkmale und Skalen 5

I Beschreibende Statistik 1

Zufallsgröße. Würfelwurf mit fairem Würfel. Wahrscheinlichkeitsverteilung einer diskreten

Statistik I für Betriebswirte Vorlesung 3

Statistik I für Betriebswirte Vorlesung 3

Bio- Statistik 1. mit 87 Abbildungen, 40 Tabellen und 102 Beispielen

Philipp Sibbertsen Hartmut Lehne. Statistik. Einführung für Wirtschafts- und. Sozialwissenschaftler. 2., überarbeitete Auflage. 4^ Springer Gabler

I. Zahlen, Rechenregeln & Kombinatorik

Statistik und Wahrscheinlichkeitsrechnung

Statistik I. 1. Klausur Wintersemester 2010/2011 Hamburg, Art der Anmeldung: STiNE FlexNow Zulassung unter Vorbehalt

Aufgabe 3 Bei 16 PKWs desselben Typs wurde der Benzinverbrauch pro 100 km gemessen. Dabei ergab sich die folgende Urliste (in Liter pro 100km):

Übungsblatt 7 zur Vorlesung Wahrscheinlichkeitsrechnung und mathematische Statistik für Informatiker

Wahrscheinlichkeitsrechnung und schließende Statistik

Teil / Ein paar statistische Grundlagen 25. Kapitel 1 Was Statistik ist und Warum sie benötigt Wird 2 7

Verteilungsfunktion und Quantile

Verteilungsfunktion und Quantile

Eine Zufallsvariable X sei stetig gleichverteilt im Intervall [0,5]. Die Wahrscheinlichkeit P(2< x <4) ist dann

Lösung Aufgabe 19. ( ) = [Mio Euro]. Empirische Varianz s 2 = 1 n

Kapitel 1 Beschreibende Statistik

Wolfgang Kohn Riza Öztürk. Statistik für Ökonomen. Datenanalyse mit R und SPSS. 3., überarbeitete Auflage. 4^ Springer Gabler

Biomathematik für Mediziner, Klausur WS 1999/2000 Seite 1

Mathematische Statistik. Zur Notation

Zufallsgröße X : Ω R X : ω Anzahl der geworfenen K`s

Angewandte Mathematik4

Angewandte Statistik 1

Statistik für Ökonomen

Stochastik für Ingenieure

Woche 2: Zufallsvariablen

1. Einführung und statistische Grundbegriffe. Grundsätzlich unterscheidet man zwei Bedeutungen des Begriffs Statistik:

Statistik für Ökonomen

Eindimensionale Zufallsvariablen

Die ABSOLUTE HÄUFIGKEIT einer Merkmalsausprägung gibt an, wie oft diese in der Erhebung eingetreten ist.

Kapitel VI - Lage- und Streuungsparameter

Uwe Hassler. Statistik im. Bachelor-Studium. Eine Einführung. für Wirtschaftswissenschaftler. ^ Springer Gabler

I. Deskriptive Statistik 1

Statistik I für Betriebswirte Vorlesung 4

Lagemaße Übung. Zentrale Methodenlehre, Europa Universität - Flensburg

Wahrscheinlichkeitsrechnung und schließende Statistik

Zufallsvariable, Verteilung, Verteilungsfunktion

Timischl Prugger WIRTSCHAFT MATHEMATIK. Kompetenzliste

Elementare Stochastik

1. Was ist eine Wahrscheinlichkeit P(A)?

Erwartungswert, Umgebungswahrscheinlichkeiten und die Normalverteilung

Wirtschaftswissenschaftliches Prüfungsamt Bachelor-Prüfung Deskriptive Statistik und Wahrscheinlichkeitsrechnung Wintersemester 2010/11.

SozialwissenschaftlerInnen II

Inhalt. I. Deskriptive Statistik Einführung Die Grundgesamtheit Merkmale und Verteilungen Tabellen und Grafiken...

Deskriptive Statistik

Vorlesung Gesamtbanksteuerung Mathematische Grundlagen II Dr. Klaus Lukas Carsten Neundorf. Vorlesung 04 Mathematische Grundlagen II,

Statistik I für Humanund Sozialwissenschaften

Notenpunkte: Unterschrift: Zur Bestimmung des arithmetischen Mittels ist es wichtig die Daten der Größe nach zu ordnen.!!

Verteilungsfunktion und Quantile

Inhaltsverzeichnis. 2 Kurzbeschreibung von SPSS Der SPSS-Dateneditor Statistische Analysen mit SPSS DieDaten...

7. Konzentrations- und Disparitätsmessung

Statistik I für Betriebswirte Vorlesung 9

Verfahren für metrische Variable

Zusammenfassung Mathe II. Themenschwerpunkt 2: Stochastik (ean) 1. Ein- und mehrstufige Zufallsexperimente; Ergebnismengen

Arbeitsbuch zur deskriptiven und induktiven Statistik

1.5.4 Quantile und Modi. Bem [Quantil, Modus]

= 3. Kapitel 4: Normalverteilung.. und Standardnormalverteilung und: das Konfidenzintervall..

Grundlagen der Wahrscheinlichkeitstheorie und Statistik für Studierende der Informatik

Wirtschaftsstatistik für Studienanfänger

Einführung in die Statistik

Beispiel für Anwendung: z-tabelle kann genutzt werden, um z.b. Poissonverteilung näherungsweise zu integrieren. Beispiel: wie wahrscheinlich ist es

P (X = 2) = 1/36, P (X = 3) = 2/36,...

Inhaltsbereich Wahrscheinlichkeit und Statistik

Grundlagen der. h Rückblick. Dr. K. Krüger. Grundwissen Mathematik

WISTA WIRTSCHAFTSSTATISTIK

3. Deskriptive Statistik

Über dieses Buch Die Anfänge Wichtige Begriffe... 21

Musterlösung zur Übungsklausur Statistik

Mathematik für Biologen

Transkript:

Workshop im Rahmen der VIV-Begabtenförderung Bestimmen von Quantilen Wie Rückwärtsdenken in der Stochastik hilft Leitung: Tobias Wiernicki-Krips Samstag, 10. Januar 2015 1 / 29

Motivation Wie bestimmt man (empirische) p-quantile x p bzw. Q p? Invertieren/Rückgängigmachen am Beispiel der Quantilsbestimmung in der Stochastik Vorgehensweise: realitätsbezogen mathematisch formal anspruchsvoll 2 / 29

Motivation Stochastik enthält 1 Statistik (Analyse von Daten und Planung von empirischen Untersuchungen): Beschreibende Statistik Schließende Statistik 2 Wahrscheinlichkeitsrechnung Hier: Quantile in der Beschreibenden Statistik Ausblick zu Quantilen in der Wahrscheinlichkeitsrechnung 3 / 29

Gliederung 1 Quantile in der Beschreibenden Statistik Empirische Quantile, Boxplot Empirische Verteilungsfunktion Lorenzkurve 2 Quantile in der Wahrscheinlichkeitsrechnung 3 Fazit und Ausblick 4 / 29

1.1 Empirische Quantile, Boxplot Empirische Quantile Definition 1: Gegeben ist eine geordnete Urliste x 1... x n eines quantitativen Merkmals. Dann nennt man für 0 < p < 1 { x x p := ([np]+1), falls np / N 1 2 (x (np) + x (np+1) ), falls np N das empirische p-quantil von x 1,..., x n. Bemerkung Für ein empirisches p-quantil gilt: Mindestens p 100% der Listenwerte sind kleiner oder gleich x p und mindestens (1 p) 100% der Werte sind größer oder gleich x p. 5 / 29

1.1 Empirische Quantile, Boxplot Sonderfälle x 0,25 heißt unteres Quartil, x 0,5 Median, x 0,75 oberes Quartil und x k 10 k-tes Dezentil für k {1,..., 9}. Für den Median ist folgende Definition äquivalent zu Definition 1: Definition 2: Gegeben ist eine geordnete Urliste x 1... x n eines quantitativen Merkmals. Dann nennt man { x( n+1 x 0,5 := ), falls n ungerade 2 1 2 (x ( n 2 ) + x ( n 2 +1) ), falls n gerade den Median von x 1,..., x n. 6 / 29

1.1 Empirische Quantile, Boxplot Boxplot erstellen: a) Pulsmessung in Ruhe 1 Geordnete Urliste x 1... x n 2 Median, unteres und oberes Quartil 3 Minimum, Maximum 4 Boxplot zeichnen b) Pulsmessung nach 15 Kniebeugen und zweites Boxplot über derselben Skala zeichnen 7 / 29

1.1 Empirische Quantile, Boxplot Urlisten und Berechnung von Median und unterem Quartil: 8 / 29

1.1 Empirische Quantile, Boxplot Boxplots zur Pulsmessung aller 10 Anwesenden: Auf einen Blick Vergleich möglich 9 / 29

1.1 Empirische Quantile, Boxplot Zusammenfassung zur Quantilsbestimmung mit Hilfe einer geordneten Urliste: Berechnen von kumulierten relativen Häufigkeiten als bekannte Richtung: x k Anteil k i=1 h i der ersten k Werte am Stichprobenumfang Quantilsbestimmung als Umkehraufgabe: x k Anteil x p der ersten k Werte am Stichprobenumfang 10 / 29

1.2 Empirische Verteilungsfunktion Empirische Verteilungsfunktion (Kumulierte Häufigkeitsfunktion) Definition 3: Zu einer geordneten Urliste x 1... x n seien u 1 <... < u m die m verschiedenen Merkmalsausprägungen eines quantitativen Merkmals. Dann nennt man die Funktion F n : R [0, 1] mit 0, falls x < u 1 F n (x) = i:u i x h i, falls u 1 x u m 1, falls x > u m empirische Verteilungsfunktion zu x 1... x n. 11 / 29

1.2 Empirische Verteilungsfunktion Empirische Verteilungsfunktion anhand des Bsp. Pulsmessung (in Ruhe): relative Häufigkeiten berechnen relative Häufigkeiten aufsummieren Graphen zeichnen Wie kann man empirische Quantile am Graphen ablesen? Oft nicht: siehe nächste Folie 12 / 29

1.2 Empirische Verteilungsfunktion Rückwärtslesen (rot), n = 10: Problem der Nicht-Eindeutigkeit hier bei x 0.5 Bestimmung empirischer Quantile nicht sinnvoll mit F n möglich 13 / 29

1.2 Empirische Verteilungsfunktion Eigenschaften der empirischen Verteilungsfunktion F n : monoton steigend nicht umkehrbar bzw. nicht injektiv Treppenfunktion Sprunghöhe bei u i = h i rechtsseitig stetig F n x 1 und F n x 0 14 / 29

1.3 Lorenzkurve OECD Kluft zwischen Arm und Reich wächst Berlin. In Deutschland und zahlreichen anderen Ländern wächst der Abstand zwischen Arm und Reich, teilte die Organisation für wirtschaftliche Zusammenarbeit und Entwicklung (OECD) mit. In Deutschland hätten Mitte der 80er Jahre die reichsten zehn Prozent der Bevölkerung fünf Mal so viel verdient wie die ärmsten zehn Prozent. Heute liegt das Verhältnis nach OECD-Angaben bei sieben zu eins. (afp) (Kölner Stadt-Anzeiger 9.12.2014) 15 / 29

1.3 Lorenzkurve Wie kann man die Einkommenskonzentration einer Bevölkerung darstellen? Beispiel Stiftanien: Verteilung von 100 Chips als Gesamteinkommen an die 10 Anwesenden, die jeweils für 10% der Bevölkerung von Stiftanien stehen Lorenzkurve: Graph einer kumulierten und linear interpolierten Klassenverteilung (stückweise linear) Vergleich der Lorenzkurven von Stiftanien und Deutschland: Je größer die Fläche zwischen Diagonale und Lorenzkurve, desto größer die Ungleichheit 16 / 29

1.3 Lorenzkurve Lorenzkurven in Stiftanien und Deutschland: blaue Tabelle: Stiftanien; schwarze Tabelle: Deutschland (Cingano 2014, S. 36) 17 / 29

1.3 Lorenzkurve Lorenzkurven: Quantile x p für 0 < p < 1 (scheinbar) eindeutig ablesbar Aber: für Bereiche zwischen u i nur Schätzung möglich (linear interpoliert) Je mehr verschiedene Merkmalsausprägungen u i vorliegen, desto genauer kann man x p ablesen. 18 / 29

2. Quantile in der Wahrscheinlichkeitsrechnung Einteilung der Wahrscheinlichkeitsrechnung: Diskrete Zufallsgrößen (Merkmale): z.b. beim Würfelwurf interessiert die Augensumme, das sind nur 11 Ausprägungen Stetige Zufallsgrößen (Merkmale): z.b. Körpergröße, hier sind es viel mehr mögliche Ergebnisse 19 / 29

2. Quantile in der Wahrscheinlichkeitsrechnung Würfeldoppelwurf: Merkmal Augensumme Subjektive Wahrscheinlichkeitsverteilung? (EA, 30s) absolute und relative Häufigkeiten aller Schülerinnen und Schüler Neue Schätzung auf Grundlage der relativen Häufigkeiten Berechnung der Wahrscheinlichkeiten 20 / 29

2. Quantile in der Wahrscheinlichkeitsrechnung Würfeldoppelwurf zweigeteilter Prozess: 1 Würfeln (hier Zufall): 36 Würfelkombinationen: {(1, 1),..., (1, 6),..., (6, 6)} Wahrscheinlichkeit für Kombination: 1 P(A) = Anzahl der günstigen Ergebnisse Anzahl der möglichen Ergebnisse = A 36 36 (Laplace-Experiment) 2 Augensumme bestimmen ( X beschreibt die Augensumme ) Augensummen: 2,..., 12 Welche Kombinationen werden den Augensummen zugeordnet? 2 {(1, 1)}, 3 {(2, 1), (1, 2)},..., 12 {6, 6} Wahrscheinlichkeit für Augensummen: P(X = 2) = 1 36, P(X = 3) = 2 1 36,..., P(X = 12) = 36 21 / 29

2. Quantile in der Wahrscheinlichkeitsrechnung Verteilungsfunktion (Kumulierte Wahrscheinlichkeitsverteilung) Definition 4: Zu einer Zufallsgröße X mit Wahrscheinlichkeitsverteilung P X heißt F : R R mit F (x) = P(X x) die Verteilungsfunktion von P X. Quantile Definition 5: Zu einer Verteilungsfunktion F heißt die Funktion F 1 : (0, 1) R mit F 1 (y) = min{x R F (x) y} Quantilfunktion von F. Q p := F 1 (p) nennt man p-quantil von F. 22 / 29

2. Quantile in der Wahrscheinlichkeitsrechnung Verteilungsfunktion für die Augensumme (Würfeldoppelwurf) und Rückwärtslesen für Q 0,1 23 / 29

2. Quantile in der Wahrscheinlichkeitsrechnung Eigenschaften der Verteilungsfunktion F (analog zur empirischen Verteilungsfunktion): monoton steigend im Allgemeinen nicht umkehrbar bzw. nicht injektiv Treppenfunktion bei diskreten Zufallsgrößen Sprunghöhe bei x i = P(X = x i ) rechtsseitig stetig F x 1 und F x 0 Ablesen der Quantile durch Rückwärtslesen (vgl. Cramer/Kamps, S. 198): vgl. letzte Folie: Q 0,1 = 4 bei Mehrdeutigkeiten Einigung auf Minimum: z.b. bei Q 1/12 = 3 24 / 29

2. Quantile in der Wahrscheinlichkeitsrechnung Ablesen der Quantile durch Rückwärtslesen: (Abbildungen mit GeoGebra erstellt nach Cramer/Kamps, S. 198): Diskrete Verteilung: Ausblick zu stetigen Verteilungen: 25 / 29

3. Fazit und Ausblick In Beschreibender Statistik: Empirische Quantile insbesondere zur Erstellung eines Boxplots wichtig Empirische Quantile i.a. bei empirischen Verteilungsfunktionen nicht eindeutig ablesbar, geordnete Urliste notwendig Beispiel Einkommenskonzentration: Einkommenskonzentration durch Lorenzkurve beschreibbar Ablesen von Quantilen aus Lorenzkurve nur scheinbar genau und eindeutig ablesbar: Lorenzkurve entsteht durch lineare Interpolation von Klassenwerten 26 / 29

3. Fazit und Ausblick Bei diskreten Wahrscheinlichkeitsverteilungen: Ablesen von Quantilen bei Verteilungsfunktionen Eindeutigkeitsproblematik wie bei empirischen Verteilungsfunktionen Einigung auf das Minimum in Frage kommender Werte Anknüpfungspunkt bei diskreten und stetigen Wahrscheinlichkeitsverteilungen in Q2: Hypothesentests in Schließender Statistik i.d.r. Binomialverteilungen und Normalverteilungen als Näherungen 27 / 29

3. Fazit und Ausblick Ausblick auf stetige Verteilungen: Quantile von streng monoton steigenden Verteilungsfunktionen eindeutig ablesbar Beispiel Normalverteilung des Intelligenzquotienten: Youtube-Video von DorFuchs (Gesehen am 5.2.2015): https://www.youtube.com/watch?v=m-nebs4qpyw DGhK (Gesehen am 5.2.2015): https://dghk-hh.de/index.php?id=5 (nach Cramer/Kamps, S. 199) 28 / 29

Literatur Auer, B., Rottmann, H. (2015). Statistik und Ökonometrie für Wirtschaftswissenschaftler. 3. Auflage. Wiesbaden: Springer Gabler. Cingano, F. (2014). Trends in Income Inequality and its Impact on Economic Growth. OECD Social, Employment and Migration Working Papers Nr. 163. Im Internet erhältlich unter: http://www.oecd.org/els/soc/ [02.02.2015] Cramer, E., Kamps, U. (2014). Grundlagen der Wahrscheinlichkeitsrechnung und Statistik. Ein Skript für Studierende der Ingenieur- und Wirtschaftswissenschaften. 3. Auflage. Berlin, Heidelberg: Springer. Henze, N. (2012). Stochastik für Einsteiger. 9. Auflage. Wiesbaden: Vieweg+Teubner. Fotos: T. Wiernicki-Krips 29 / 29