Verteilungsfunktion und dquantile

Ähnliche Dokumente
4. Kumulierte Häufigkeiten und Quantile

Verteilungsfunktion und Quantile

4. Kumulierte Häufigkeiten und Quantile

Verteilungsfunktion und Quantile

Verteilungsfunktion und Quantile

Empirische Verteilungsfunktion

Kreisdiagramm, Tortendiagramm

Deskriptive Statistik. (basierend auf Slides von Lukas Meier)

Deskriptive Statistik

2 Häufigkeitsverteilungen

Bestimmen von Quantilen

Kapitel 2. Häufigkeitsverteilungen

Wahrscheinlichkeits - rechnung und Statistik

Statistik I für Betriebswirte Vorlesung 9

Grafische Darstellung von Häufigkeitsverteilungen (1)

3. Deskriptive Statistik

Kapitel 1 Beschreibende Statistik

Beispiel 2 (Einige Aufgaben zu Lageparametern) Aufgabe 1 (Lageparameter)

Kapitel IV - Häufigkeitsverteilungen

2. Deskriptive Statistik

Dr. Reinhard Vonthein, Dipl. Statistiker (Univ.)

Weitere Lagemaße: Quantile/Perzentile I

Statistik 2 für SoziologInnen. Normalverteilung. Univ.Prof. Dr. Marcus Hudec. Themen dieses Kapitels sind:

Mathematische und statistische Methoden II

Kapitel V - Graphische Darstellung von Häufigkeitsverteilungen

3 Häufigkeitsverteilungen

Deskriptive Statistik Aufgaben und Lösungen

Marcus Hudec. Statistik 2 für SoziologInnen. Normalverteilung. Univ.Prof. Dr. Marcus Hudec. Statistik 2 für SoziologInnen 1 Normalverteilung

3 Häufigkeitsverteilungen

Lage- und Streuungsmaße

Einführung in Quantitative Methoden

Willkommen zur Vorlesung Statistik

Wirtschaftswissenschaftliches Prüfungsamt Bachelor-Prüfung Deskriptive Statistik und Wahrscheinlichkeitsrechnung Wintersemester 2010/11.

Einführung in die Statistik für Wirtschaftswissenschaftler für Betriebswirtschaft und Internationales Management

Marcus Hudec. Statistik 2 für SoziologInnen. Normalverteilung. Univ.Prof. Dr. Marcus Hudec. Statistik 2 für SoziologInnen 1 Normalverteilung

Herzlich willkommen zur Vorlesung Statistik. Streuungsmaße oder die Unterschiedlichkeit der Daten nebst kurzen Ausführungen zu Schiefe und Wölbung

Beispiel 6 (Einige Aufgaben zur Gleichverteilung)

4. Auswertung eindimensionaler Daten

Statistik und Wahrscheinlichkeitsrechnung

WISTA WIRTSCHAFTSSTATISTIK

Univariate Häufigkeitsverteilungen Kühnel, Krebs 2001: Statistik für die Sozialwissenschaften, S.41-66

Wirtschaftswissenschaftliches Prüfungsamt Bachelor-Prüfung Deskriptive Statistik und Wahrscheinlichkeitsrechnung Wintersemester 2012/13

Statistik I für Betriebswirte Vorlesung 10

Deskriptive Statistik Kapitel VI - Lage- und Streuungsparameter

Zufallsvariablen. Diskret. Stetig. Verteilung der Stichprobenkennzahlen. Binomial Hypergeometrisch Poisson. Normal Lognormal Exponential

Zentraler Grenzwertsatz

Kapitel 3: Lagemaße. Ziel. Komprimierung der Daten zu einer Kenngröße, welche die Lage, das Zentrum der Daten beschreibt

Standardnormalverteilung

Mathematik für Biologen

a 1 < a 2 <... < a k. 2 Häufigkeitsverteilungen 52

Ermitteln Sie auf 2 Dezimalstellen genau die folgenden Kenngrößen der bivariaten Verteilung der Merkmale Weite und Zeit:

Statistik 1 für SoziologInnen. Univariate Häufigkeitstabellen Tabellarische und graphische Aufbereitung von Daten

htw saar 1 EINFÜHRUNG IN DIE STATISTIK: BESCHREIBENDE STATISTIK

Statistik I. Zusammenfassung und wichtiges zur Prüfungsvorbereitung. Malte Wissmann. 9. Dezember Universität Basel.

Prüfung aus Statistik 1 für SoziologInnen

Aufgabenstellung und Ergebnisse zur. Bachelor-Prüfung Deskriptive Statistik und Wahrscheinlichkeitsrechnung Wintersemester 2018/19

Einführung in Quantitative Methoden

Beschreibung von Daten

Zentraler Grenzwertsatz

Wirtschaftswissenschaftliches Prüfungsamt Bachelor-Studiengang Deskriptive Statistik und Wahrscheinlichkeitsrechnung Sommersemester 2010

Deskriptive Statistik Erläuterungen

Mathematische und statistische Methoden I

GRUPPE B Prüfung aus Statistik 1 für SoziologInnen

Kapitel VI - Lage- und Streuungsparameter

Fachrechnen für Tierpfleger

Muster einer Fachabschlußklausur (90 Min.)

Statistik I. 2. Klausur Wintersemester 2011/2012 Hamburg, BITTE LESERLICH IN DRUCKBUCHSTABEN AUSFÜLLEN!

Mittelwert Median Stabw StabwN 1. Quartil 3. Quartil 27,22 % 26,06 % 8,07 % 8,03 % 22,12 % 31,25 %

Statistik 1 für SoziologInnen. Univariate Häufigkeitstabellen Tabellarische und graphische Aufbereitung von Daten. Univ.Prof. Dr.

Statistik I. 2. Klausur Wintersemester 2011/2012 Hamburg, BITTE LESERLICH IN DRUCKBUCHSTABEN AUSFÜLLEN!

Graphische Darstellung einer univariaten Verteilung:

Deskription, Statistische Testverfahren und Regression. Seminar: Planung und Auswertung klinischer und experimenteller Studien

Statistik und Wahrscheinlichkeitsrechnung

1 Beschreibende Statistik

Wirtschaftswissenschaftliches Prüfungssekretariat Bachelor-Prüfung Deskriptive Statistik und Wahrscheinlichkeitsrechnung Sommersemester 2015

Skriptteufel Klausurworkshop

Wirtschaftswissenschaftliches Prüfungsamt Bachelor-Prüfung Deskriptive Statistik und Wahrscheinlichkeitsrechnung Wintersemester 2011/12.

Der Modus ist. Der Median ist. 3. Übung. Aufgabe 1. a) der häufigste Wert. b) der Wert unter dem 50 % aller anderen Werte liegen.

Streuungsmaße von Stichproben

Beispiel 4 (Einige weitere Aufgaben)

Bivariate explorative Datenanalyse in R

Binomialverteilung Vertrauensbereich für den Anteil

Verfahren für metrische Variable

Transkript:

Statistik 1 für SoziologInnen Verteilungsfunktion und dquantile Univ.Prof. Dr. Marcus Hudec Kumulierte Häufigkeiten Hinweis: Damit die Kumulation inhaltlich sinnvoll ist, muss das Merkmal zumindest ordinal skaliert sein! Oft ist man nicht an der Häufigkeit einzelner Merkmalsausprägungen interessiert, sondern an der Häufigkeit von Intervallen. Typische Fragestellung: Wie groß ist der Anteil aller Merkmalsträger mit einem Merkmalswert größer (bzw. kleiner) als ein bestimmter Wert x? Hierzu summiert man die Häufigkeitstabelle schrittweise auf. 2 Statistik 1 - Verteilungsfunktion und Quantile 1

Kumulierte Häufigkeiten bei diskreten Merkmalen Beispiel: "Produktives Denken" i x i n i N i h i h i in % H i H i in % 1 0 0 0 000 0,00 000% 0,00% 000 0,00 000% 0,00% 2 1 0 0 0,00 0,00% 0,00 0,00% 3 2 0 0 0,00 0,00% 0,00 0,00% 4 3 7 7 0,06 5,83% 0,06 5,83% 5 4 12 19 0,10 10,00% 0,16 15,83% 6 5 38 57 0,32 31,67% 0,48 47,50% 7 6 29 86 0,24 24,17% 0,72 71,67% 8 7 27 113 0,23 22,50% 0,94 94,17% 9 8 6 119 0,05 5,00% 0,99 99,17% 10 9 1 120 0,01 0,83% 1,00 100,00% Gesamt 120 1,00 100,00% 3 Statistik 1 - Verteilungsfunktion und Quantile Kumulierte Häufigkeiten Die absoluten kumulierten Häufigkeiten geben die Anzahl der Beobachtungen an, die einen bestimmten Wert x nicht übertreffen. N(X x) z.b. 19 Personen haben einen Score-Wert kleiner gleich 4 Die entsprechenden relativen kumulierten Häufigkeiten bezeichnen wir mit H(X x) = N(X x)/n z.b. 15,8% der Personen haben einen Score-Wert kleiner gleich 4 Sie geben uns den Anteil der Beobachtungen mit einem Wert kleiner gleich x an. Die empirische Verteilungsfunktion F(x) ist definiert durch F(x) = H(X x) 4 Statistik 1 - Verteilungsfunktion und Quantile 2

Empirische Verteilungsfunktion F(x) 72% aller Testteilnehmer haben einen Wert kleiner gleich 6 erzielt 5 Statistik 1 - Verteilungsfunktion und Quantile Interpolation macht keinen Sinn Beachte: Bei diskreten Merkmalen ist eine Interpolation nicht zulässig! 6 Statistik 1 - Verteilungsfunktion und Quantile 3

Falls ein Linienzug gewünscht wird, gibt nur eine Treppenkurve ein korrektes Bild der Verteilung 7 Statistik 1 - Verteilungsfunktion und Quantile Kumulierte Häufigkeiten (Einzeldaten) Größe Häufigkeit rel. Häufigkeit kumul. Rel. Häufigkeit 150 0 0,00 0,00 151 0 0,00 0,00 152 0 0,00 0,00 153 1 0,01 0,01 154 1 0,01 0,02 155 1 0,01, 0,03, 156 0 0,00 0,03 157 1 0,01 0,04 158 0 0,00 0,04 159 0 0,00 0,04 160 3 0,03 0,07 161 1 0,01 0,08 162 2 0,02 0,10 163 1 0,01 0,11 164 3 0,03 0,14 165 3 0,03 0,17 166 4 0,04 0,21 167 3 0,03 0,24 168 2 0,02 0,26 169 2 0,02 0,28 170 5 0,05 0,33 171 3 0,03 0,36 172 4 0,04 0,40 173 7 0,07 0,47 174 5 0,05 0,52 175 4 0,04 0,56 Größe Häufigkeit rel. Häufigkeit kumul. Rel. Häufigkeit 176 4 0,04 0,60 177 5 0,05 0,65 178 3 0,03 0,68 179 3 0,03 0,71 180 5 0,05 0,76 181 1 0,01 0,77 182 4 0,04 0,81 183 2 0,02 0,83 184 2 0,02 0,85 185 2 0,02 0,87 186 2 0,02 0,89 187 4 0,04 0,93 188 3 0,03 0,96 189 0 0,00 0,96 190 1 0,01 0,97 191 0 0,00 0,97 192 0 0,00 0,97 193 0 0,00 0,97 194 0 0,00 0,97 195 1 0,01 0,98 196 1 0,01 0,99 197 1 0,01 1,00 198 0 0,00 1,00 199 0 0,00 1,00 200 0 0,00 1,00 Kumulierte relative Häufigkeiten ~ Empirische Verteilungsfunktion 8 Statistik 1 - Verteilungsfunktion und Quantile 4

Empirische Verteilungsfunktion 1,00 0,80 0,60 0,40 0,20 Graphische Darstellung ~ Treppenfunktion 0,00 150 155 160 165 170 175 180 185 190 195 200 9 Statistik 1 - Verteilungsfunktion und Quantile Empirische Verteilungsfunktion (Leseprobe) 0.8 1.0 2 0.4 0.6 0 0.0 0.2 60% der Studenten sind 60% < 176 kleiner gleich 176 cm 150 160 170 180 190 200 10 Statistik 1 - Verteilungsfunktion und Quantile 5

Eigenschaften der empirischen Verteilungsfunktion Treppenfunktion Bei jedem beobachteten Wert findet sich ein vertikaler Anstieg Die Höhe des Anstiegs beim Wert x i ist n(x=x i )/n = h(x i ) gleich der relativen Häufigkeit dieses Wertes Hohe Sprünge ~ häufiger Wert Steiler Verlauf ~ hohe Wertedichte Treten in einem Wertebereich keine Werte auf, so verläuft die empirische Verteilungsfunktion in diesem Bereich horizontal 11 Statistik 1 - Verteilungsfunktion und Quantile Unterschiedliche Sprunghöhen 1,00 0,80 0,60 0,40 h(x=174)=0.05 0,20 h(x=163)=0.0 1 0,00 150 155 160 165 170 175 180 185 190 195 200 12 Statistik 1 - Verteilungsfunktion und Quantile 6

Konstante Bereiche ~ keine Werte Empirische Verteilungsfunktion 1.0 0.4 0.6 0.8 keine Werte 158 bzw. 159 0.0 0.2 150 160 170 180 190 200 kg 13 Statistik 1 - Verteilungsfunktion und Quantile Eigenschaften der emp. Verteilungsfunktion Treppenfunktion Bei jedem beobachteten Wert findet sich ein vertikaler Anstieg Die Höhe des Anstiegs beim Wert x i ist n(x=x i )/n = h(x i ) Hohe Sprünge ~ häufiger Wert Steiler Verlauf ~ hohe Wertedichte Treten in einem Wertebereich keine Werte auf, so verläuft die emp. Verteilungsfunktion in diesem Bereich horizontal Die emp. Verteilungsfunktion ist monoton steigend Die Funktionswerte liegen zwischen 0 und 1 14 Statistik 1 - Verteilungsfunktion und Quantile 7

Kumulierte Häufigkeiten (klassierte Daten) Bereich n i h i N i H i 150+ bis 155 3 0,03 3 0,03 155+ bis 160 4 0,04 7 0,07 160+ bis 165 10 0,10 17 0,17 165+ bis 170 16 0,16 33 0,33 170+ bis 175 23 0,23 56 0,56 175+ bis 180 20 0,20 76 0,76 180+ bis 185 11 0,11 87 0,87 185+ bis 190 10 0,10 97 0,97 190+ bis 195 1 0,01 98 0,98 195+ bis 200 2 0,02 100 1 Gesamt 100 1 15 Statistik 1 - Verteilungsfunktion und Quantile Verteilungsfunktion bei klassierten Daten 1 0,9 0,8 0,7 Beachte: Bei klassierten Merkmalen ist eine Interpolation als Approximation an die Treppenfunktion zulässig! 0,6 0,5 0,4 H(175)=0,56 0,3 0,2 0,1 H(170)=0,33 Klassenobergrenzen 0 150 160 170 180 190 200 210 16 Statistik 1 - Verteilungsfunktion und Quantile 8

Verteilungsfunktion bei klassierten Daten Bei klassierten Daten können exakte Werte nur an den oberen Klassengrenzen bestimmt werden Ein näherungsweise Bestimmung der Werte der Verteilungsfunktion kann unter der Annahme der Gleichverteilung innerhalb der Klassen, mittels linearer Interpolation erfolgen In der Graphik bedeutet dies, dass wir die Punkte durch Geradenstücke zu einer durchgezogenen Linie verbinden Die Steigung dieser Geradenstücke entspricht der Dichte in der Klasse Man nennt diese Approximation der empirischen Verteilungsfunktion bei klassierten Daten auch die Summenkurve 17 Statistik 1 - Verteilungsfunktion und Quantile Summenkurve 1 0,9 0,8 0,7 0,6 0,5 0,4 H(175)=0,56 0,3 0,2 H(170)=0,33 0,1 0 150 160 170 180 190 200 210 18 Statistik 1 - Verteilungsfunktion und Quantile 9

Verteilungsfunktion bei klassierten Daten (Beispiel) Aus der Tabelle könne wir folgende Informationen ablesen 56% der Studenten sind kleiner gleich 175 cm 33% der Studenten sind kleiner gleich 170 cm Frage: Wieviel % der Studenten sind kleiner gleich 172 cm? Exakte Antwort aus klassierten Daten nicht mehr möglich Näherungsweise Lösung: Lineare Interpolation 19 Statistik 1 - Verteilungsfunktion und Quantile Interpolation Gesucht ist der Funktionswert der Summenkurve an der Stelle x: F(x)=F(u F(u i )+y F(o i ) F(u i ) x y=? F(u i ) u i oi 20 Statistik 1 - Verteilungsfunktion und Quantile 10

Anwendung des Strahlensatzes y : {F(o i )-F(u i )} = (x-u i ) : (o i -u i ) y : h i = (x-u i ) : b i F(x) =F(u i ) + (x-u i )/ b i *h i y=? x F(o i ) h i = F(o i )-F(u i ) F(u i ) b i = (o i -u i ) u i oi 21 Statistik 1 - Verteilungsfunktion und Quantile Im Beispiel F(x) =F(u i ) + (x-u i )/ b i *h i F(172) = 0,33 + 2/5*0,23 23 = 0,33+0,092=0,422 y=? F(u i )=0,33 x=172 F(o i )=0,56 h i = F(o i ) - F(u i )=0,23 b i = (o i -u i ) =5 u i =170 o i =175 22 Statistik 1 - Verteilungsfunktion und Quantile 11

Summary Die Interpolation auf der Basis der Summenkurve (klassierte Daten) hat ergeben, dass 42,2% der Studenten kleiner gleich 1,72m sind. Auf Basis der Einzeldaten (siehe Folie 8) ergab sich jedoch ein Wert von 40%. Die Abweichung begründet sich aus dem Informationsverlust, der sich durch die Klassierung ergeben hat. Solche Techniken sind für die Analyse von Sekundärdaten bedeutsam. Beachte aber dabei immer, die implizite Unschärfe. 23 Statistik 1 - Verteilungsfunktion und Quantile Konzept der Quantile Das Teilen eines geordneten Datensatz in q gleich große Teilmengen ist die Motivation für Quantile Die Quantile markieren die Grenzen zwischen aufeinanderfolgende f d Til Teilmengen Quartiles of a Distribution 0.15 0.20 q(75%)=182,4 q(50%)=136,8 q(25%)=103,5 3rd Quartile (Upper Quartile) 2nd Quartile (Median) 1st Quartile (Lower Quartile) 0.00 0.05 0.10 24 50 100 150 200 250 300 350 Statistik 1 - Verteilungsfunktion und Quantile 12

Empirisches Quantil Ausgehend von einem Anteilswert p (y-achse) wird der zugehörige Wert bestimmt, für den F(x) zum ersten mal größer als oder zumindest gleich groß wie p ist. Das bedeutet ein p-quantil ist jener möglichst kleine Merkmalswert für den gerade noch gilt, dass p-prozent der Beobachtungen kleiner gleich als eben dieser Merkmalswert sind. 1 0,9 0,8 0,7 0,6 0,5 0,4 0,3 0,2 0,1 0 150 160 170 180 190 200 210 25 Statistik 1 - Verteilungsfunktion und Quantile Empirisches Quantil 0 < p < 1 Datensatz: x 1,..., x n Das Empirische p-quantil x p ist dann der kleinste Wert x für den F(x) p gilt. Seien x (1),... x (n) die geordneten Werte: x p =x (k), ist also der k-te Wert in der geordneten Stichprobe, wobei k wie folgt gegeben ist: (k-1)/n < p k/n 26 Statistik 1 - Verteilungsfunktion und Quantile 13

Beispiele zu empirischen Quantilen Gesucht ist ein Wert, so dass 95% der Studenten kleiner gleich diesem Wert sind Datensatz Körpergröße n=100 p=0,95 x 0,95 =? (k-1)/n < p k/n (k-1) < np k (k-1) < 95 k ==> k=95 x 0,95 = 188 Datensatz produktives Denken n=120 x 0,50 =? p=0,5 (k-1) < 120*0,5 k ==> k=60 x 0,50 = 7 27 Statistik 1 - Verteilungsfunktion und Quantile Bestimmung des Quantils 1,00 0,80 0,60 F(X=188)=0,96 0,40 0,20 0,00 150 155 160 165 170 175 180 185 190 195 200 28 Statistik 1 - Verteilungsfunktion und Quantile 14

Wichtige Quantile Einige wichtige Quantile, die häufig kommuniziert werden tragen einen eigenen Namen: Terzile x 033 0,33 x 066 0,66 Quartile x 0,25 x 0,5 x 0,75 Dezile x 0,1... x 0,9 Perzentile x 0,01, x 0,02... x 0,99 Für kleine Stichproben sind Quantile nicht eindeutig definiert Beachte: Unterschiedliche Softwaresysteme verwenden leicht unterschiedliche Definitionen von Quantilen 29 Statistik 1 - Verteilungsfunktion und Quantile Anwendung von Quantilen in Einkommensstatistik Vertikale und intra-industrielle Lohn- und Gehaltsstreuung in Österreich 1995-2000 M. Mesch, Materialien zur Wirtschaft, 2004 AK 30 Statistik 1 - Verteilungsfunktion und Quantile 15

Anwendung von Dezilen Quelle: Statistik Austria 31 Statistik 1 - Verteilungsfunktion und Quantile Empirische Quantile bei klassierten Daten Bei klassierten Daten ergibt sich das p-quantil durch Interpolation Ausgangspunkt ist jene Klasse, in der die kumulierten Häufigkeiten den p-wert übersteigen 32 Statistik 1 - Verteilungsfunktion und Quantile 16

Bestimmung des 0,5 Quantils Bereich n i h i N i H i 150+ bis 155 3 0,03 3 0,03 155+ bis 160 4 0,04 7 0,07 160+ bis 165 10 0,10 17 0,17 165+ bis 170 16 0,16 33 0,33 170+ bis 175 23 0,23 56 0,56 175+ bis 180 20 0,20 76 0,76 180+ bis 185 11 0,11 87 0,87 185+ bis 190 10 0,10 97 0,97 190+ bis 195 1 0,01 98 0,98 195+ bis 200 2 0,02 100 1 Gesamt 100 1 33 Statistik 1 - Verteilungsfunktion und Quantile Empirische Quantile bei klassierten Daten y : b i = (p-f(u i )) : h i F(o i ) x p = u i + (p-f(u i ))/ h i *b i p y h i = F(o i )-F(u i ) F(u i ) b i = (o i -u i ) u i oi 34 Statistik 1 - Verteilungsfunktion und Quantile 17

Empirische Quantile bei klassierten Daten y : 5= (0,5-0,33): 0,23 F(o i )=0,56 X 0,5 = 170 + 0,17/0,23*5=173,7 p=0,5 h i = F(o i )-F(u i ) =0,23 F(u i )=0,33 y b i = (175-170) =5 170 175 35 Statistik 1 - Verteilungsfunktion und Quantile Empirische Quantile Beispiel: Körpergröße (Originalwerte) 1.Quartil = x 0.25 2.Quartil = x 0.50 3.Quartil = x 0.75 Five Digits Summary Min. 1st Qu. 2nd Qu. 3rd Qu. Max. 153 168 174 180 197 x (1) x (25) x (50) x (75) x (100) 36 Statistik 1 - Verteilungsfunktion und Quantile 18

Box-Plots Basierend auf den 5 zusammenfassenden Werten einer Verteilung: Minimum, 1.Quartil, 2.Quartil, 3.Quartil und Maximum lassen sich instruktive Graphiken zur Darstellung einer Verteilung entwickeln, die insbesondere zum Vergleich mehrerer Gruppen gut geeignet sind. Häufig werden die horizontal begrenzenden Linien nicht bis zum Minimum und Maximum der Daten gezogen. Die Balkenlänge wird mit der 1,5-fachen Boxhöhe begrenzt und extreme Datenwerte werden extra markiert. 37 Statistik 1 - Verteilungsfunktion und Quantile Boxplot (Box-Whisker-Plot) Maximum bzw. Obergrenze maximal 1,5-fache Boxlänge 75% Quantil Median 25% Quantil Minimum bzw. Untergrenze 38 Statistik 1 - Verteilungsfunktion und Quantile 19

Zur Interpretation von Boxplots 39 Statistik 1 - Verteilungsfunktion und Quantile Beispiel einer rechtsschiefen Verteilung 0 10 0 1 0 20 20 30 40 50 60 2 3 4 5 6 40 60 80 100 0 1 2 3 4 5 6 0 1 2 3 4 5 6 x.r 40 Statistik 1 - Verteilungsfunktion und Quantile 20

Beispiel einer linksschiefen Verteilung 0 10 4 5 0 20 20 30 40 50 60 6 7 8 9 10 40 60 80 100 4 5 6 7 8 9 10 4 5 6 7 8 9 10 x.l 41 Statistik 1 - Verteilungsfunktion und Quantile Vergleich von Verteilungen g g g 0.000 0.002 0.000 0.005 0.000 0.002 Density 0.004 0.006 0.008 0.010 Density 0.010 0.015 Density 0.004 0.006 0.008 0.012 0.020 100 200 300 400 0 50 100 150 200 100 200 300 400 500 21

Vergleich von Verteilungen 0 100 200 300 400 Pisa Studie 2000 Darstellung von E. Neuwirth 44 Statistik 1 - Verteilungsfunktion und Quantile 22

Pisa Studie 2000 Darstellung von E. Neuwirth 45 Statistik 1 - Verteilungsfunktion und Quantile 4 alternative Darstellungen eines Datensatzes Histogram Boxplot Fre equency 0 50 10 00 150 200 30 40 50 60 70 80 20 30 40 50 60 70 80 Kernel Estimate Distribution Function 0.00 0.01 0.02 0.03 0.0 0.2 0.4 0.6 0.8 1.0 20 40 60 80 100 20.0 32.6 45.2 57.8 70.4 83.0 46 Statistik 1 - Verteilungsfunktion und Quantile 23

4 alternative Darstellungen eines Datensatzes Histogram Boxplot Fre equency 0 50 10 00 200 0 100 2 00 300 400 0 100 200 300 400 500 Kernel Estimate Distribution Function 06 1.0 0.000 0.002 0.004 0.0 0.0 0.2 0.4 0.6 0.8-100 0 100 300 500-13.0 86.2 284.6 483.0 47 Statistik 1 - Verteilungsfunktion und Quantile Kombination von Darstellungsvarianten Die kombinierte unterschiedlicher Darstellungstypen ist durchaus empfehlenswert, um die Form der Verteilung besser zu verstehen bzw. zu kommunizieren 48 Statistik 1 - Verteilungsfunktion und Quantile 24