Box-Plots. Werkzeuge der empirischen Forschung. W. Kössler. Einleitung. Datenbehandlung. Wkt.rechnung. Beschreibende Statistik 174 / 258

Ähnliche Dokumente
Streuungsmaße. Die angegebenen Maßzahlen sind empirisch, d.h. sie sind Schätzungen für die wahre Varianz (empirische) Varianz (Streuung) s 2 = 1 n

Normalverteilung. 1 2πσ. Gauß. 2 e 1 2 ((x µ)2 σ 2 ) Werkzeuge der empirischen Forschung. W. Kössler. Einleitung. Datenbehandlung. Wkt.

4.2 Moment und Varianz

7.2 Moment und Varianz

Biostatistik, Winter 2011/12

5.8 Anpassungstests. W. Kössler (IfI HU Berlin) Werkzeuge der empirischen Forschung 389 / 419

7. Lösungen weitere Übungsaufgaben Statistik für Ingenieure WiSe 16/17

Biostatistik, Sommer 2017

Werkzeuge der empirischen Forschung

70 Wichtige kontinuierliche Verteilungen

Statistik I für Betriebswirte Vorlesung 5

Mathematische und statistische Methoden II

Statistik. Sommersemester Stefan Etschberger. für Betriebswirtschaft, Internationales Management, Wirtschaftsinformatik und Informatik

9 Die Normalverteilung

Zufallsvariablen. Diskret. Stetig. Verteilung der Stichprobenkennzahlen. Binomial Hypergeometrisch Poisson. Normal Lognormal Exponential

Finanzierung und Investition

Mathematik für Biologen

Statistik für Ingenieure Vorlesung 5

Zufallsvariablen. f(x) dx = 1. Die stetige Zufallsvariable X wird also durch seine Dichtefunktion beschrieben. P(c < X < d) =

DWT 1.4 Rechnen mit kontinuierlichen Zufallsvariablen 240/476 c Ernst W. Mayr

DWT 1.4 Rechnen mit kontinuierlichen Zufallsvariablen 234/467 Ernst W. Mayr

Wichtige Begriffe und Sätze aus der Wahrscheinlichkeitsrechnung

Normalverteilung und Standardisierung

Eine Einführung in R: Dichten und Verteilungsfunktionen

ETWR Teil B. Spezielle Wahrscheinlichkeitsverteilungen (stetig)

Wahrscheinlichkeitstheorie und Statistik

5. Spezielle stetige Verteilungen

0, t 0,5

Wahrscheinlichkeitsfunktion. Binomialverteilung. Binomialverteilung. Wahrscheinlichkeitshistogramme

Verfahren für metrische Variable

Statistik für Informatiker, SS Verteilungen mit Dichte

Fit for Abi & Study Stochastik

Eine Einführung in R: Dichten und Verteilungsfunktionen

Binomialverteilung. Häufigkeit, mit der Ereignis A bei n unabhängigen Versuchen eintritt. Träger von X : X = {0, 1, 2,..., n}.

Häufigkeitsdiagramme PROC UNIVARIATE PROC GCHART

4 Absolutstetige Verteilungen und Zufallsvariablen 215/1

5.9. Nichtparametrische Tests Übersicht

Statistik für Informatiker, SS Grundlagen aus der Wahrscheinlichkeitstheorie

Vorlesung: Statistik II für Wirtschaftswissenschaft

Wahrscheinlichkeit und Statistik: Zusammenfassung

Der Erwartungswert E[g(X)] von g(x) ist definiert. g(x k )w(x = x k ),

Stetige Standardverteilungen

f(x) = P (X = x) = 0, sonst heißt Poisson-verteilt mit Parameter (oder Rate) λ > 0, kurz X P o(λ). Es gilt x x! 1 Wahrscheinlichkeitsrechnung 212

15.5 Stetige Zufallsvariablen

Vorlesung 7b. Unabhängigkeit bei Dichten. und die mehrdimensionale Standardnormalverteilung

Spezielle stetige Verteilungen

Was Aktuare über Abhängigkeit wissen sollten

Hypothesentests für Erwartungswert und Median. Statistik (Biol./Pharm./HST) FS 2015

Definition Sei X eine stetige Z.V. mit Verteilungsfunktion F und Dichte f. Dann heißt E(X) :=

Einführung in Quantitative Methoden

1.5.4 Quantile und Modi

Teil VIII. Zentraler Grenzwertsatz und Vertrauensintervalle. Woche 6: Zentraler Grenzwertsatz und Vertrauensintervalle. Lernziele. Typische Situation

Wahrscheinlichkeitsrechnung. Sommersemester Kurzskript

Statistik für Ingenieure Vorlesung 10

Standardnormalverteilung

Gegenbeispiele in der Wahrscheinlichkeitstheorie

Wirtschaftsmathematik

Zentralübung zur Vorlesung Diskrete Wahrscheinlichkeitstheorie

7.4 Charakteristische Funktionen

Statistik. Sommersemester Prof. Dr. Stefan Etschberger Hochschule Augsburg. für Betriebswirtschaft und internationales Management

Folie zur Vorlesung Wahrscheinlichkeitsrechnung und Stoch. Prozesse

Wiederholung Analysis

Kapitel 12 Stetige Zufallsvariablen Dichtefunktion und Verteilungsfunktion. stetig. Verteilungsfunktion

13 Grenzwertsätze Das Gesetz der großen Zahlen

12 Ungleichungen. Wir beginnen mit einer einfachen Ungleichung über die Varianz. Satz 35 Es sei X eine zufällige Variable.

Wirtschaftswissenschaftliches Prüfungsamt Bachelor-Prüfung Deskriptive Statistik und Wahrscheinlichkeitsrechnung Sommersemester 2011

Vorlesung Gesamtbanksteuerung Mathematische Grundlagen II Dr. Klaus Lukas Carsten Neundorf

Teil VII. Deskriptive Statistik. Woche 5: Deskriptive Statistik. Arbeitsschritte der Datenanalyse. Lernziele

4. Kumulierte Häufigkeiten und Quantile

1. Grundbegri e. T n i=1 A i = A 1 \ A 2 \ : : : \ A n alle A i treten ein. na = A das zu A komplementäre Ereignis; tritt ein, wenn A nicht eintritt.

Sigma-Umgebung. Vergleichen wir die beiden Binomialverteilungen: n = 30 p = 0,5. n = 20 p = 0,75

Kennwerteverteilungen von Häufigkeiten und Anteilen

SozialwissenschaftlerInnen II

Psychologische Methodenlehre und Statistik I

Zufallsvariablen. Diskret. Stetig. Verteilung der Stichprobenkennzahlen. Binomial Hypergeometrisch Poisson. Normal Lognormal Exponential

Wichtige Begriffe und Sätze aus der Wahrscheinlichkeitsrechnung

7. Zusammenfassung. Zusammenfassung

10 Transformation von Zufallsvariablen

Mathematik für Naturwissenschaften, Teil 2

11.4 Korrelation. Def. 44 Es seien X 1 und X 2 zwei zufällige Variablen, für die gilt: 0 < σ X1,σ X2 < +. Dann heißt der Quotient

Stochastik-Praktikum

1.5 Mehrdimensionale Verteilungen

Statistik für Ingenieure Vorlesung 3

Einstichprobenproblem t-test

Mathematische und statistische Methoden II

Wirtschaftswissenschaftliches Prüfungsamt Bachelor-Prüfung Deskriptive Statistik und Wahrscheinlichkeitsrechnung Sommersemester 2011.

Eine Einführung in R: Dichten und Verteilungsfunktionen

1.6 Der Vorzeichentest

Statistische Methoden

15.3 Statistische Tests von Pseudozufallszahlen

Tests für Erwartungswert & Median

Demokurs. Modul Grundlagen der Wirtschaftsmathematik Grundlagen der Statistik

Merkmalstypen Univ.-Prof. Dr. rer. nat. et med. habil. Andreas Faldum

1. Übungsblatt zu Wahrscheinlichkeitsrechnung und Statistik in den Ingenieurswissenschaften

Wahrscheinlichkeitsrechnung und Statistik

1 Verteilungsfunktionen, Zufallsvariable etc.

Kapitel 3 Schließende Statistik

Teil IV Deskriptive Statistik

Klassifikation von Signifikanztests

Forschungsstatistik I

Transkript:

174 / 258 Box-Plots Ziel: übersichtliche Darstellung der Daten. Boxplot zu dem Eingangsbeispiel mit n=5: Descr_Boxplot0.sas Prozeduren: UNIVARIATE, GPLOT, BOXPLOT

174 / 258 Box-Plots Ziel: übersichtliche Darstellung der Daten. Boxplot zu dem Eingangsbeispiel mit n=5: Descr_Boxplot0.sas Prozeduren: UNIVARIATE, GPLOT, BOXPLOT PROC UNIVARIATE PLOT;

174 / 258 Box-Plots Ziel: übersichtliche Darstellung der Daten. Boxplot zu dem Eingangsbeispiel mit n=5: Descr_Boxplot0.sas Prozeduren: UNIVARIATE, GPLOT, BOXPLOT PROC UNIVARIATE PLOT; SYMBOL1 INTERPOL=BOXT10; PROC GPLOT; PLOT y*x=1;

174 / 258 Box-Plots Ziel: übersichtliche Darstellung der Daten. Boxplot zu dem Eingangsbeispiel mit n=5: Descr_Boxplot0.sas Prozeduren: UNIVARIATE, GPLOT, BOXPLOT PROC UNIVARIATE PLOT; SYMBOL1 INTERPOL=BOXT10; PROC GPLOT; PLOT y*x=1; PROC BOXPLOT; PLOT y*x /BOXSTYLE=SCHEMATIC; /BOXSTYLE=SKELETAL;

Prozedur BOXPLOT * Ausreißer???. x 0.75 + 1.5 IR Max... x 0.75 + X x 0.5.. +. x 0.25.. x 0.25 1.5 IR Schematic Min. Skeletal 175 / 258

Erläuterung zu BOXSTYLE=Schematic X N(µ, σ 2 ) etwa 99% der Daten liegen zwischen den fences. 0.99 = 0.995 0.005 = Φ(2.575) Φ( 2.575) = P(µ 2.575σ < X < µ + 2.575σ) P(x 0.5 2.575 0.7434 }{{ IR} < X < x 0.5 + 2.575 0.7434 }{{ IR} ) = P(x 0.5 1.914 IR < X < x 0.5 + 1.914 IR) P(x 0.5 2 IR < X < x 0.5 + 2 IR) = P(x 0.25 1.5 IR < X < x 0.75 + 1.5 IR) 176 / 258

177 / 258 Prozedur UNIVARIATE, Option PLOT. * Ausreißer?? x0.75 + 3 IR x 0.75 + 1.5 IR oder Max... + X. x 0.75 x 0.5 x 0.25 x 0.25 1.5 IR oder Min.. x 0.25 3 IR

179 / 258 Box-Plots in SAS Ein Merkmal, eine Gruppe (Merkmal gr) gr = 1; PROC BOXPLOT; PLOT zeit*gr; RUN; Ein Merkmal (zeit), mehrere Gruppen (gr) PROC BOXPLOT; PLOT zeit*gr; RUN; Ein Merkmal (X), mehrere Gruppen (gr) SYMBOL INTERPOL=BOXT10; PROC GPLOT; PLOT X*gr; RUN; Descr_Boxplot.sas Descr_Boxplot1.sas

180 / 258 Boxplots - Beispiele Lebensdauern von 100 Kühlaggregaten

180 / 258 Boxplots - Beispiele Lebensdauern von 100 Kühlaggregaten Schädelmaße in zwei Regionen Tibets

Box-Plots in SAS (2) Box-Plots von mehreren Variablen Descr_Boxplot2.sas 1. Data-Step: Definition von neuen Variablen, die konstant gesetzt werden. 2. Symbol-Anweisungen für die einzelnen darzustellenden Variablen definieren. 3. Achsenbeschriftung entsprechend den Variablen definieren. 4. Prozedur GPLOT; 182 / 258

Probability Plots Erinnerung: Normalverteilung (i) Dichte der Standard-Normalverteilung φ(x) = 1 2 π e x2 2, < x < (ii) Verteilungsfunktion der Standard-Normal Φ(x) = x 1 2 π e t2 2 dt, < x < (iii) Dichte der Normalverteilung 1 σ φ(x µ σ ) = 1 e (x µ)2 σ 2, 2πσ 2 mit Erwartungswert µ und Varianz σ 2. 183 / 258

Probability Plots Erinnerung: Normalverteilung, Quantile Der Wert Φ 1 (u) heißt u-quantil der Standard-Normalverteilung. Die Funktion Φ 1 (u), u (0, 1), heißt Quantilfunktion der Standard-Normalverteilung. α = 0.05 Φ 1 (1 α) = Φ 1 (0.95) = 1.645 Φ 1 (1 α 2 ) = Φ 1 (0.975) = 1.96 Φ 1 (α): x α = x ( αn ) : α-quantil, theoretisch α-quantil, empirisch 184 / 258

186 / 258 Q-Q-Plot Variante 1 Wenn Normalverteilung zutrifft, so müssen die Punkte (Φ 1 (α), x α ) etwa auf einer Geraden liegen, Φ 1 (α) x α µ = x ( αn ) µ σ σ PROC UNIVARIATE PLOT; RUN; Die theoretischen Werte (+) werden durch die Werte (*) überschrieben. Je weniger + -Zeichen zu sehen sind, desto näher sind wir an der NV. Descr_QQPlot.sas

188 / 258 Q-Q-Plot Variante 2 PROC UNIVARIATE; QQPLOT var /Optionen; RUN; wie oben, bessere Grafik, aber keine Linie. Es werden die Punkte geplottet. i = 1,...,n. ( Φ 1 ( i 0.375 n + 0.25 ), x ) (i) Bem.: Φ 1 ( i 0.375 n+0.25 ) ist eine Approximation von EX (i) bei Standard-Normalverteilung.

189 / 258 Q-Q Plots - Beispiele Lebensdauern von 100 Kühlaggregaten

189 / 258 Q-Q Plots - Beispiele Lebensdauern von 100 Kühlaggregaten Abmessungen von Banknoten

189 / 258 Q-Q Plots - Beispiele Lebensdauern von 100 Kühlaggregaten Abmessungen von Banknoten Verlängerung der Schlafdauer

191 / 258 Probability Plot PROC UNIVARIATE; PROBPLOT var /Optionen; RUN; wie oben, x-achse hat die selbe Skala, aber eine andere Beschriftung, statt x α steht α, also ( ) (i 0.375 α, x(i) = n + 0.25, x ) (i) Bem.: Es können auch einige andere Verteilungen verwendet werden.

192 / 258 Q-Q Plot Übersicht wenige Punkte weg von der Geraden Ausreißer linkes Ende unter der Linie rechtes Ende über der Linie lange Tails linkes Ende über der Linie rechtes Ende unter der Linie kurze Tails gebogene Kurve, steigender Anstieg rechtsschief gebogene Kurve, fallender Anstieg linksschief Plateaus und Sprünge diskrete Daten gerundete Dat. Gerade y = x empirische theoretische Verteil. Gerade y = ax + b nur Lage- oder Skalenunterschied