Statistische Modellbildung mit EXCEL im Rahmen der Übungen aus Angewandter Statistik/EDV und Biometrie (Version 2005)

Größe: px
Ab Seite anzeigen:

Download "Statistische Modellbildung mit EXCEL im Rahmen der Übungen aus Angewandter Statistik/EDV und Biometrie (Version 2005)"

Transkript

1 W. Timischl: Statistische Modellbildung mit Excel 1 Statistische Modellbildung mit EXCEL im Rahmen der Übungen aus Angewandter Statistik/EDV und Biometrie (Version 2005) Begleitskriptum zum Lehrbuch Biostatistik - Eine Einführung für Biologen und Mediziner von W. Timischl (Wien-New York: Springer 2000) Voraussetzung: Excel- Grundkenntnisse Literaturhinweise zur statistischen Problemlösung mit Excel: Fleischhauer, Chr.: Excel in Naturwissenschaft und Technik. München: Adison-Wesley Liengme, B.: A Guide to MS Excel for Scientists and Engineers. Oxford: Butterworth Levie, Robert de.: How to use Excel in Analytical Chemistry and in General Data Analysis. Cambridge: University Press Monka, M., Voß, W.: Statistik am PC. München- Wien: Hanser INHALT 1 Biometrie - Grundaufgaben 1.1 Rechnen mit Wahrscheinlichkeiten Aufgabe 1.1.1: Multiplikationsregel Aufgabe 1.1.2: Bedingte Wahrscheinlichkeiten und Formel von Bayes 1.2 Wahrscheinlichkeitsverteilungen Aufgabe 1.2.1: Binomialverteilung Aufgabe 1.2.2: Normalverteilung 1.3 Eindimensionale Datenbeschreibung und Parameterschätzung Aufgabe 1.3.1: Häufigkeitsverteilung und univariate Statistiken Aufgabe 1.3.2: Mittelwertschätzung bei normalverteilten Zufallsvariablen Aufgabe 1.3.3: Planung des Stichprobenumfangs bei der Mittelwertschätzung Aufgabe 1.3.4: Schätzung von Wahrscheinlichkeiten 1.4 Ein-Stichprobenvergleiche Aufgabe 1.4.1: Binomialtest Aufgabe 1.4.2: Einstichproben - t-test Aufgabe 1.4.3: Planung des Stichprobenumfangs beim Einstichproben - t-test Aufgabe 1.4.4: Chiquadrat-Test zur Anpassungsprüfung 1.5 Zwei-Stichprobenvergleiche I: Paarvergleiche Aufgabe 1.5.1: t-test für abhängige Stichproben Aufgabe 1.5.2: Vorzeichentest für abhängige Stichproben Aufgabe 1.5.3: Änderungsmessung mit dem McNemar-Test Aufgabe 1.5.4: Gleichwertigkeit von Mittelwerten 1.6 Zwei-Stichprobenvergleiche II: Parallelversuche Aufgabe 1.6.1: Vergleich von zwei Varianzen (F-Test) Aufgabe 1.6.2: Vergleich von zwei Mittelwerten (Welch-, 2-Stichproben t-test) Aufgabe 1.6.3: Vergleich zweier Anteile Aufgabe 1.6.4: Vergleich zweier Häufigkeitsverteilungen (Homogenitätsprüfung) 1.7 Korrelation und Regression Aufgabe 1.7.1: Abhängigkeit zwischen mehrstufig skalierten Variablen Aufgabe 1.7.2: Korrelation bei metrischen Merkmalen Aufgabe 1.7.3: Einfache lineare Regression 2 Nützliche Excel - Tools Aufgabe 2.1: Einfach gegliederte Berichte mit Gruppenstatistiken Aufgabe 2.2: Zweidimensionale Häufigkeitstabellen - Pivot-Tabellen Aufgabe 2.3: Einfache Variablenergänzungen Aufgabe 2.4: Datensätze filtern Aufgabe 2.5: Datenbankfunktionen 3 Ergänzung: Internet-Rechner zur Stichprobenumfangs- und Power-Berechnung 3.1 Planung des Stichprobenumfangs bei Parameterschätzungen 3.2 Planung des Stichprobenumfangs und Power-Berechnung bei Testverfahren stat_excel_ue05, Inhalt

2 W. Timischl: Statistische Modellbildung mit Excel 2 1 Biometrie - Grundaufgaben Was wird von jeder Problemlösung erwartet? Eine Präzisierung des Problems (Voraussetzungen, Hypothesen,... ); eine Darstellung der verwendeten Methoden (welche, warum); nachvollziehbare Berechnungen; eine prägnante Darstellung und Interpretation der Resultate. 1.1 Rechnen mit Wahrscheinlichkeiten Aufgabe 1.1.1: Multiplikationsregel Bei der Bearbeitung eines Problems sind 2 voneinander unabhängige Entscheidungen zu treffen, von denen jede einzelne mit der Wahrscheinlichkeit 5% eine Fehlentscheidung sein kann. Wie groß ist die simultane Irrtumswahrscheinlichkeit, d.h. die Wahrscheinlichkeit, dass wenigstens in einem Fall falsch entschieden wird? F 1 und F 2 bezeichen die Ereignisse, dass die erste bzw. zweite Entscheidung falsch ist. P(F 1 ) = P(F 2 ) = α = 0,05. Wenn R 1 und R 2 die Ereignisse bezeichnen, dass die erste bzw. zweite Entscheidung richtig ist, gilt P(R 1 ) = P(R 2 ) = 1 - α. Die Ereignisse R 1 und R 2 sind voneinander unabhängig. Gesucht: P(F 1 oder F 2 ) Berechnung: α = 0,05 P(F 1 oder F 2 ) = 1 - P(R 1 und R 2 ) = 1 - P(R 1 ) P(R 2 ) = 1 - (1 - α) 2 = 0,0975 Ergebnis: Hat man zwei mit jeweils 5%igem Irrtumsrisiko behaftete Entscheidungen zu treffen, ist die Wahrscheinlichkeit 9,75%, wenigstens in einem Fall falsch zu entscheiden. Aufgabe 1.1.2: Bedingte Wahrscheinlichkeiten und Formel von Bayes Unter Sensitivität eines diagnostischen Verfahrens zum Nachweis einer Erkrankung bezeichnet man die Wahrscheinlichkeit, ein richtig-positives Ergebnis zu erhalten; die Spezifität ist die Wahrscheinlichkeit, mit dem Diagnoseverfahren ein richtig-negatives Ergebnis zu erhalten. Für ein Diagnoserverfahren sei die Sensitivität 93% und die Spezifität 85%. Die Wahrscheinlichkeit für das Auftreten der Krankheit in einer bestimmten Zielgruppe sei 0.5%. Man berechne die Wahrscheinlichkeit, dass bei positivem Ergebnis tatsächlich eine Erkrankung vorliegt. Es bezeichnen D+ (D-) die Ereignisse, dass die Erkrankung vorliegt (nicht vorliegt), und T+ (T-) die Wahrscheinlichkeit, dass der Test positiv (negativ) ausfällt. Sensitivität = P(T+ D+) = 0,93 Sepzifität = P(T- D-) = 0,85 Prävalenz = P(D+) = 0,005 Gesucht: P(D+ T+ ) Berechnung: mittels Übergang zu absoluten Häufigkeiten; Anzahl der Personen in der Zielgruppe = D+ D T+ T- T+ T P(D+ T+)= 3,02% Ergebnis: Nur 3,02% der testpositiven Probanden sind tatsächlich krank!

3 W. Timischl: Statistische Modellbildung mit Excel Wahrscheinlichkeitsverteilungen Aufgabe 1.2.1: Binomialverteilung Für eine bestimmte Blumenzwiebelsorte wird eine Wahrscheinlichkeit von mindestens 80% garantiert, dass eine Zwiebel nach dem Einsetzen austreibt. Jemand kauft 5 Zwiebeln und stellt fest, dass nur 3 austreiben. Unter der Voraussetzung, dass die garantierte Mindestwahrscheinlichkeit von 80% zutrifft, gebe man die Wahrscheinlichkeit dafür an, dass höchstens 3 der 5 Zwiebeln austreiben. Gesucht: Berechnung: X (Anzahl der austreibenden Zwiebel) ist binomialverteilt mit den Parametern p = 0,8 (Erfolgswahrscheinlichkeit) und n = 5 (Anz. d. Versuche). P(X <= 3) = 1 - P(X > 3) = 1 - P(X = 4) - P(X = 5) mit Excel-Funktion BINOMVERT(Zahl_Erfolge;Versuche;Erfolgswahrsch;Kumuliert) P(X = Zahl_Erfolge ) = BINOMVERT(Zahl_Erfolge; Versuche; Erfolgswahrsch; 0) P(X <= Zahl_Erfolge ) = BINOMVERT(Zahl_Erfolge; Versuche; Erfolgswahrsch; 1) Variante 1: Berechnung mit Verteilungsfunktion (Kumuliert = 1) P(X <= 3 ) = BINOMVERT(3; 5; 0,8; 1) = 0,263 Variante 2: Berechnung mit Wahrscheinlichkeitsfunktion (Kumuliert = 0) P(X = 4 ) = BINOMVERT(Zahl_Erfolge; Versuche; Erfolgswahrsch; Kumuliert) = BINOMVERT(4; 5; 0,8; 0) = 0,410 P(X = 5 ) = BINOMVERT(5; 5; 0,8; 0) = 0,328 P(X <= 3 ) = 0,263 Ergebnis: Mit 26,3%iger Wahrscheinlichkeit treiben maximal 3 Zwiebeln aus! Aufgabe 1.2.2: Normalverteilung Die Masse (in mg) einer Wirksubstanz W in einem Präparat sei normalverteilt mit dem Mittelwert 10 und der Varianz 0,25. i) Welcher Anteil von Präparaten mit der Substanz W zwischen 9mg und 11mg ist zu erwarten? ii) Wie groß ist der Median sowie das 25%- und das 75%-Quantil der Verteilung? Mit welcher Wahrscheinlichkeit wird ein Wert außerhalb des 2-fachen Interquartilabstandes um den Mittelwert angenommen? iii) Man stelle die Wahrscheinlichkeitsdichte grafisch dar! Verteilungsmodell: X (Masse der Wirksubstanz) ist normalverteilt mit dem Mittelwert µ = E[X] = 10 und der Standardabweichung σ = 0,5. Gesucht: i) P(9 <= X <= 11) = P(X <= 11) - P(X <= 9) ii) unteres Quartil u mit der Eigenschaft P(X <= u) = 0,25 iii) oberes Quantil o mit der Eigenschaft P(X <= o) = 0,75 Berechnung: i) mit Excel-Funktion NORMVERT(x; Mittelwert; Standabwn; Kumuliert) P(X <= x) = NORMVERT(x; Mittelwert;Standabwn; 1) P(X <= 11) = NORMVERT(11; 10; 0,5; 1) = 0,9772 P(X <= 9) = NORMVERT(9; 10; 0,5; 1) = 0,0228 Zu erwartender Anteil P(9 <= X <= 11) = 0,9545 Ergebnis: Es können mehr als 95% der Präparate zwischen 9mg und 11mg erwartet werden! ii) Das 25%-Quantil ist die Lösung u der Gleichung P(X <= u) =0,25. Berechnung der Quantile der Normalverteilung mit der Excel-Funktion u = NORMINV(0,25;10;0,5) = 9,6628 Das 75%-Quantil ist die Lösung o der Gleichung P(X <= o) =0,75. o = NORMINV(0,75;10;0,5) = 10,3372

4 W. Timischl: Statistische Modellbildung mit Excel 4 Interquartilabstand IR = o - u = 0,6745 P(X < µ-2xir)=normvert(µ-2xir;µ;σ;1) = 0,0035 P(X <µ 2xIR oder X > µ+2xir) = 0,70% Ergebnis: Nur 0,7% der Präparate sind mit einer Masse außerhalb der zweifachen Interquartilabstandes um den Mittelwert zu erwarten! iii) Den Wert f(x) der Dichtefunktion der N(µ, σ 2 )-Verteilung an der Stelle x erhält man mit der Excel- Funktion NORMVERT(x;Mittelwert; Standabwn; Kumuliert) mit Mittelwert = µ, Standabn = σ und Kumuliert = 0 (FALSCH). Wertetabelle: x f(x) 8,00 0, ,25 0, ,50 0, ,75 0, ,00 0, ,25 0, ,50 0, ,75 0, ,00 0, ,25 0, ,50 0, ,75 0, ,00 0, ,25 0, ,50 0, ,75 0, ,00 0, ,9 0,8 0,7 0,6 0,5 0,4 0,3 0,2 0,1 0,0 Werte der Normalverteilung mit m=10 und s =0, x

5 W. Timischl: Statistische Modellbildung mit Excel Eindimensionale Datenbeschreibung und Parameterschätzung Aufgabe 1.3.1: Häufigkeitsverteilung und univariate Statistiken Die Messung der Ozonkonzentration während der Sommermonate ergab für eine Großstadt die in der folgenden Tabelle enthaltenen Werte (Angaben in ppm/100). Man stelle die Verteilung der Ozonkonzentration dar (tabellarisch, grafisch) und berechne den Mittelwert, die Standardabweichung, den Median und die Quartile. Stichprobe: 3,6 1,5 6,6 6,0 4,2 6,7 2,5 5,4 4,5 5,4 2,5 3,0 5,6 4,7 6,5 6,7 1,7 5,3 4,6 7,4 5,4 4,1 5,1 5,6 5,4 6,1 7,6 6,2 6,0 5,5 5,8 8,2 3,1 5,8 2,6 9,5 3,4 8,8 7,3 1,3 6,9 3,2 4,7 3,8 5,9 6,6 4,4 5,7 4,5 7,7 Gesucht: Häufigkeitstabelle, Histogramm, Mittelwert, Standardabweichung, Median und Quartile Häufigkeitsverteilung: i) Bestimmung der Klassenbreite n = ANZAHL(Bereich) = 50 (Bereich = Stichprobe) min = MIN(Bereich) = 1,3 max = MAX(Bereich) = 9,5 Anzahl k d. Klassen = approx. (n) = 7,07 (=) 7 approx. Klassenbreite = (max - min)/k = = 1,16 (=) 1,5 approx. ii) Analyse-Funktionen - Histogramm... (Bereich "Klassengrenzen" müssen vorbereitet werden) Klassengrenzen (bis <=) Klasse Häufigkeit 1,5 1,5 2 3,0 3,0 5 4,5 4,5 10 6,0 6,0 18 7,5 7,5 10 9,0 9,0 4 10,5 10,5 1 und größer 0 Häufigkeit ,5 3,0 4,5 6,0 7,5 9,0 10,5 und größer Ozonkonzentration

6 W. Timischl: Statistische Modellbildung mit Excel 6 Statistiken: Mittelwert = MITTELWERT(Bereich) = 5,21 Standardabweichung = STABW(Bereich) = 1,85 Median = MEDIAN(Bereich) = 5,40 unteres Quartil = QUANTIL(Bereich;0,25) = 4,13 oberes Quartil = QUANTIL(Bereich;0,75) = 6,43 (Bereich = Stichprobe) Aufgabe 1.3.2: Mittelwertschätzung bei normalverteilten Zufallsvariablen Die Sprosshöhe X eine Pflanze sei normalverteilt. Aus einer Stichprobe vom Umfang n = 40 wurden die Schätzwerte 50 und 5 für den Mittelwert bzw. die Standardabweichung ermittelt. Man bestimme zum Niveau 1 - α = 0,95 ein Konfidenzintervall für den Mittelwert µ von X. X ist normalverteilt mit Mittelwert µ und Stanbdradabweichung σ Schätzung von µ und σ aus gegebenen Stichproben Gesucht: 95%iges Konfidenzintervall für µ Lösungsmethoden: i) Approximation für große Stichproben Berechnung mit KONFIDENZ(Alpha;Standabwn;Umfang_S) mit Alpha = 0,05 Standabwn = 5 Umfang_S = 40 (= n) Stichprobenmittelwert = 50 Untere Grenze = Stichprobenmittel - KONFIDENZ(Alpha;Standabwn;Umfang_S) Obere Grenze = Stichprobenmittel + KONFIDENZ(Alpha;Standabwn;Umfang_S) KONFIDENZ(0,05;5;40) = 1,55 Untere Grenze = 48,45 Obere Grenze = 51,55 Hinweis: Die Excel-Funktion KONFIDENZ(Alpha;Standabwn;Umfang_S) liefert die halbe Breite ii) Exakte Rechnung (1 - α/2) -Quantil der t-verteilung mit f = n - 1 = 39 Freiheitsgraden = TINV(Wahrsch;Freiheitsgrade) mit Wahrsch=α (!) und Freiheitsgrade=n-1 = TINV(0,05;39) = 2,0227 Halbe Intervallbreite = s/wurzel(n) x TINV(α;n-1) = s/wurzel(n) x TINV(α;n-1) = 5/WURZEL(40) x TINV(0,05;39) = 1,60 Untere Grenze = Stichprobenmittel - halbe Intervallbreite = 48,40 Obere Grenze = Stichprobenmittel + halbe Intervallbreite = 51,60 Aufgabe 1.3.3: Planung des Stichprobenumfangs bei der Mittelwertschätzung Die Masse X (in mg) einer Substanz in einem Präparat soll absolut auf +/-0,5 genau mit einer Sicherheit von 95% bestimmt werden. Für die Standardabweichung möge die Abschätzung σ<=2 zutreffen. Wieviele Proben müssen untersucht werden, wenn X als normalverteilt vorausgesetzt werden kann? Masse X ist nach Voraussetzung N(µ, σ²)-verteilt mit σ <= 2. σ = 2 Genauigkeit d = 0,5 Sicherheit 1 - α = 0,95 Berechnungen: Quantil z(1 - α/2) = STANDNORMINV(1 - α/2) = 1,96 Mindeststichprobenumfang n >= [σ z(1-α/2)/d]² = 61,46 Hinweis: Einschlägige Software zu Bestimmung von n z.b. nquery Advisor (Statistical Solutions, Cork, Ireland) oder Internet-Calculators z.b. unter Interpretation: Es muß ein Mindeststichprobenumfang von 62 geplant werden, um den Mittelwert auf +/-0,5 genau mit einer Sicherheit von 95% schätzen zu können.

7 W. Timischl: Statistische Modellbildung mit Excel 7 Aufgabe 1.3.4: Schätzung von Wahrscheinlichkeiten In einem Feldversuch werden 60 Blumenzwiebeln ausgesetzt, von denen 36 keimten. i) Es soll die Keimfähigkeit p (d.h. Wahrscheinlichkeit, dass ein ausgesetzter Zwiebel keimt) geschätzt und die Genauigkeit der Schätzung durch ein 95%-Konfidenzintervall belegt werden. ii) Ist die Fallzahl richtig geplant, um den Schätzwert mit einer Sicherheit von 95% auf +/- 0,05 genau schätzen zu können? Anzahl n der Versuche = 60 Anzahl m der erfolgreichen Versuche = 36 p = P(Zwiebel treibt aus) X (Anzahl der Keimlinge) ist binomialverteilt mit den Parametern p und n Gesucht: i) Schätzwert für p, 95%-Konfidenzintervall für p ii) Mindeststichprobenumfang Berechnungen: i) Schätzung von p Anteil h der erfolgr. Zwiebeln=Schätzwert für p = m/n = 0,6 Intervallschätzung i.1) Approximatives 95%-Konfidenzintervall für p Voraussetzungen: n > 20 und 10 <= m <= n-10 Sicherheit 1 - α = 0,95 >> (1-α/2)-Quantil der N(0,1)-Verteilung = STANDNORMINV(1-(1-α)/2) = 1,96 Untere Grenze = h - z(1-α/2) (h(1-h)/n) = 0,4760 Obere Grenze = h + z(1-α/2) (h(1-h)/n) = 0,7240 i.2) Exaktes Intervall mit den Pearson-Clopper-Werten 1-α/2 = 0,975 q 1 = α/2-quantil der F(2m, 2(n-m+1))-Verteil.= FINV(1- α/2;2m;2(n-m+1)) = 0,6046 q 2 = 1- α/2-quantil der F(2(m+1), 2(n-m))-Verteil.= FINV(α/2;2(m+1);2(n-m)) = 1,7048 Hinweis: FINV(α; Freiheitsgr.1; Freiheitsgr. 2) liefert das (1 - α)-quantil! Untere Grenze = m q 1 /(n - m m q 1 ) = 0,4654 Obere Grenze = (m +1) q 2 /(n - m + (m +1) q 2 ) = 0,7244 ii) Mindesstichprobenumfang Normalverteilungsapproximation: Y = X/n ist normalverteilt mit Mittelwert p und Varianz p(1-p)/n Anteil h = 0,6 α = 0,05 z 1-α/2 = 1,960 Genauigkeit d = 0,05 Mindeststichprobenumfang n >= h(1-h) [z(1-α/2)/d]² = 368,78

8 W. Timischl: Statistische Modellbildung mit Excel Ein-Stichprobenvergleiche Aufgabe 1.4.1: Binomialtest Für ein Produkt wird vom Hersteller garantiert, dass der Gehalt einer Substanz mindestens 75% beträgt. In einer Stichprobe von 60 Proben entsprachen 35 der Produktdeklaration. i) Liegt eine signifikante Unterschreitung des garantierten Mindestwertes vor? Man prüfe diese Frage auf dem Signifikanzniveau α = 5%. ii) Welche Fallzahl ist notwendig, um eine Unterschreitung des garantierten Anteils um 0.1 mit einer Sicherheit von 90% feststellen zu können? X = Anzahl der "entsprechenden" Proben ist binomialverteilt mit den Parametern n = 60 p o = 0,75 m = 35 (Realisation von X) i) Test auf signifikante Unterschreitung Hypothesen: Ho: p >= p ο = 0,75 vs. H1: p < p ο = 0,75 Lösungsvariante 1: Exakte Rechnung Berechnung: P-Wert = P(X <= m n, p=p o ) = BINOMVERT(m;n;p o ;1) = 0, Entscheidung: P-Wert < α = 0,05 >> Ho ablehnen! Lösungsvariante 2: Normalverteilungsapproximation Voraussetzungen: n > 20 und 10 <= np o <= n-10 Berechnung: µ = np ο = 45 σ = [np(1-p ο )] = 3,3541 Z = (X - µ)/σ ist standardnormalverteilt >> approx. P-Wert = P(Z < (m-µ)/σ)) = STANDNORMVERT((m-µ)/σ) = = 0, Entscheidung: P-Wert < α = 0,05 >> Ho ablehnen! Hinweis: Bessere Approximationen erreicht man mit der sog. Stetigkeitskorrektur, nach der der Zahl x das Intervall (x-0,5; x+0,5) entspricht. In der Formel ist demnach m durch m+0,5 zu ersetzen. Dies ergibt: approx. P-Wert = P(Z < (m+0,5-µ)/σ)) = STANDNORMVERT((m+0,5-µ)/σ) = 0, (mit dieser Approximation arbeitete z.b. SPSS, Version 8) ii) Planung des Stichprobenumfangs (Normalverteilungsapproximation): Vorgaben: α = 0,05 β = 0,10 = 0,10 p o = 0,75 Berechnung: Quantile der Standardnormalverteilung: z(1 - a) = STANDNORMINV(1 - α) = 1,645 z(1 - β) = STANDNORMINV(1 - β) = 1,282 Abschätzung für n: n>= (1/ ²)[z(1-α) (p ο (1-p ο )) + z(1-β) ((p ο )(1-p ο + ))]² 175,2 (ohne Stetigkeitskorrektur) Hinweis auf einschlägige Software: z.b. nquery Advisor (Statistical Solutions, Cork, Ireland) oder "Internet Calculators" (z.b. )

9 W. Timischl: Statistische Modellbildung mit Excel 9 Aufgabe 1.4.2: Einstichproben - t-test Die Verpackung einer bestimmten Zigarettensorte weist einen mittleren Nikotingehalt von 15 mg pro Zigarette aus. Es wird eine Zufallsstichprobe von 100 Zigaretten getestet. Dabei ergab sich ein mittlerer Nikotingehalt von 16.5 mg und eine Standardabweichung von 4 mg. Kann aus dem Ergebnis der Stichprobe auf 1%igem Signifikanzniveau der Schluss gezogen werden, dass der tatsächliche Nikotingehalt im Mittel über 15 mg liegt? Daten: Sollwert µ ο = 15 Stichprobenmittelwert m = 16,5 Standardabweichung s = 4 Stichtpobenumfang n = 100 Verteilungsvoraussetzung: X = Nikotingehalt ist N(µ, σ²)-verteilt mit µ = µ ο Hypothesen: Ho: µ <= µο = 15 vs. H1: µ > µο = 15 Berechnung: Entscheidung: Testgröße: TG = [(M - µο)/s] (n) ist t-verteilt mit f = n - 1 Freiheitsgraden TG(s) = (m - µ ο )/s (n) = 3,75 P-Wert: P = P(TG > TG(s) µ=µo) =TVERT(x;Freiheitsgrade;Seiten) = 0, [x = TG(s), Freiheitsgrade = n - 1, Seiten = 1 (1-seitige Ausläuferfläche)] Hinweis: x darf in TVERT(x;Freiheitsgrade;Seiten) nicht negativ sein! P-Wert < α = 0,01 >> Ho ablehnen! Hinweis: TVERT(x;Freiheitsgrade;Seiten) liefert für Seiten=1 die "Überschreitungswahrscheinlichkeit" P(X > x) (!) Aufgabe 1.4.3: Planung des Stichprobenumfangs beim Einstichproben - t-test Es sei X eine normalverteilte Umweltmessgröße mit dem (unbekannten) Mittelwert µ und der Standardabweichung σ = 10. Mit Hilfe einer Stichprobe soll geprüft werden, ob eine Überschreitung des Grenzwertes K vorliegt, wobei das α- Risiko mit 5% vorgegeben ist und eine kritische Überschreitung von 6.5 mit 90%iger Sicherheit erkannt werden soll. Welcher Stichprobenumfang ist zu planen? Berechnung: Gegeben: σ = 10 α-fehler α = 0,05 Power 1-β = 0,90 krit.abw. = 6,50 Modell: X = Umweltmessgröße ist N(µ, σ²)-verteilt Hypothesen: Ho: µ <= K vs. H1: µ > K Voraussetzung: Normalverteilungsapproximation Quantile: z(1 - α) = STANDNORMINV(1 - α) = 1,645 z(1 - β) = STANDNORMINV(1 - β) = 1,282 Abschätzformel: n >= (σ/ )² [z(1-α) + z(1-β)]² = 20,27 Hinweis auf einschlägige Software: z.b. nquery Advisor (Statistical Solutions, Cork, Ireland) oder "Internet Calculators" (z.b. )

10 W. Timischl: Statistische Modellbildung mit Excel 10 Aufgabe 1.4.4: Chiquadrat-Test zur Anpassungsprüfung Bei einem seiner Kreuzungsversuche mit Erbsen erhielt Mendel 315 runde gelbe Samen, 108 runde grüne, 101 kantige gelbe und 32 kantige grüne. Sprechen die Beobachtungswerte gegen das theoretische Aufspaltungsverhältnis der Phänotypen von 9 : 3 : 3 : 1? Man wähle als Signifikanzniveau α = 5%. Modell: X (Phänotyp) ist eine 4-stufige Zufallsvariable mit den Werten x1 = rund/gelb, x2 = rund/grün, x3 = kantig/gelb, x4 = kantig/grün und der theoretischen Verteilung p1 = P(X = x1), p2 = P(X = x2), p3 = P(X = x3), p4 = P(X = x4). Stichprobenumfang: n = = 556 Hypothesen: Ho: Wahrscheinlichkeiten p1 = 9/16 = 0,5625 p2 = 3/16 = 0,1875 p3 = 3/16 = 0,1875 p4 = 1/16 = 0,0625 bzw. erwartete Häufigkeiten E1=556x9/16= 312,75 E2=556x3/16= 104,25 E3=556x3/16= 104,25 E4=556x1/16= 34,75 H1: X weicht von den theoretischen Wahrscheinlichkeiten bzw. erwarteten Häufigkeiten ab. Berechnung: Testgröße: GF = Σ(O - E)²/E erw.häufigk. beob.häufigk. (E-O)²/E Klassen E O rund/gelb 312, ,0162 rund/grün 104, ,1349 kantig/gelb 104, ,1013 kantig/grün 34, , ,4700 = GF(s) P-Wert: P = P(GF > GF(s)) = CHIVERT(x;Freiheitsgrade) = 0,9254 (mit x = GF(s) und Freiheitsgrade FG = Anz.d.Klassen - 1) Entscheidung: P-Wert >= α = 0,05 >> Ho kann nicht abgelehnt werden! Hinweis: CHIVERT(x;Freiheitsgrade) liefert die "Überschreitungswahrscheinlichkeit" P(X > x) (!)

11 W. Timischl: Statistische Modellbildung mit Excel Zwei-Stichprobenvergleiche I: Paarvergleiche Aufgabe 1.5.1: t-test für abhängige Stichproben Die folgende Tabelle zeigt die Änderung des (systolischen) Blutdrucks (in mm Hg) bei zehn einer gewissen Behandlung unterworfenen Patienten. X_b und X_e bezeichnen die Blutdruckwerte am Beginn bzw. am Ende der Behandlung. i) Gibt es einen signifikanten Behandlungseffekt? ii) Welcher Stichprobenumfang muss geplant werden, um einen Effekt in der Größe von 25% der Änderung der Stichprobenmittelwerte mit einer Sicherheit von 90% feststellen zu können (α = 5%)? Daten: X_b X_e >> Differenzstichprobe >> D=X_b - X_e Statistiken der Differenzstichprobe (Bereich = Differenzstichprobe): Stichpr.umfang n = ANZAHL(Bereich) = 10 Mittelwert=m D =MITTELWERT(Bereich) = 16,70 Standardabweich. s=stabw(bereich) = 9,776 Der Effekt wird als Differenz D des Beginn- und des Endwertes dargestellt. Damit ergibt sich ein 1- Stichprobenproblem mit der Differenz D als Zielvariable. Diese wird als N(µ, σ²)-verteilt angenommen. Teilaufgabe i) Test auf signifikante Abweichung Hypothesen: H0: µ = µο = 0 vs. H1: µ <> µο = 0 Berechnung: Testgröße: TG(s) = [(m D - µo)/s] n = 5,4021 P-Wert: P = 2 P(TG < TG(s) ) = TVERT(x;Freiheitsgrade;Seiten) = 0, [x=tg(s), Freiheitsgrade=n-1, Seiten=2 (2-seitige Ausläuferfläche)] Hinweis: x darf in TVERT(x;Freiheitsgrade;Seiten) nicht negativ sein! Entscheidung: P-Wert < α = 0,05 >> H1, d.h., Behandlungseffekt ist signifikant! Teilaufgabe ii) Berechnung: Planung des Stichprobenumfanges Gegeben: σ = s = 9,776 α-fehler α = 0,05 Power 1-β = 0,90 krit.abw. = 4,175 (=0,25x m D ) Hypothesen: H0: µ = µο = 0 vs. H1: µ <> µο = 0 Voraussetzung: Normalverteilungsapproximation Quantile: z(1 - α/2) = STANDNORMINV(1 - α/2) = 1,960 z(1 - β) = STANDNORMINV(1 - β) = 1,282 Abschätzformel: n >= (σ/ )² [z(1-α/2) + z(1-β)]² = 57,6 Hinweis auf einschlägige Software: z.b. nquery bzw. Internet Calculators (www.stat.ucla.edu )

12 W. Timischl: Statistische Modellbildung mit Excel 12 Aufgabe 1.5.2: Vorzeichentest für abhängige Stichproben Zur Prüfung der Wirksamkeit eines Präparates wurde u.a. Die Zielvariable "Kopfschmerz" auf einer 3-stufigen Skala mit den Werten 1 (nicht vorhanden), 2 (leicht ausgeprägt) und 3 (deutlich ausgeprägt) am Beginn (Variable X 1 ) und am Ende (Variable X 2 ) der Behandlung an 22 Personen erhoben. Es soll mit dem Vorzeichentest auf dem 5%-Niveau geprüft werden, ob der Anteil der Personen mit einer Verbesserung signifikant größer als 0.5 ist. Daten: Kopfschmerz Kopfschmerz/Ende X 2 Beginn X 1 1 (nicht v.) 2 (leicht) 3 (deutlich) Bei = 14 Probanden ist X 2 < X 1, d.h. es ist eine Verbesserung eingetreten. Bei 1 Probanden kam es zu einer Verschlechterung, bei = 7 trat keine Änderung ein. Indem eine Bindung (Fall ohne Änderung) weggelassen und die restlichen 6 je zur Hälfte zur Kategorie "Verbesserung" bzw. "Verschlechterung" gezählt wird, ergibt sich als Anzahl Y von Personen mit einer Verbesserung der Stichprobenwert x = 14+3=17. Die Anzahl Y ist binomialverteilt mit den Parametern p (=Wahrscheinlichkeit, dass bei einem Probanden eine Verbesserung eintritt) und n = 21 (ein Fall wurde weggelassen). n = 21 p 0 = 0,5 m = 17 (Realisation von Y) Hypothesen: H 0 : p <= p o = 1/2 vs. H 1 : p > 1/2 Lösungsvariante 1: Exakte Rechnung Berechnung: P-Wert = P(Y >= m n, p=p 0 ) = 1 - P(Y<m n, p=p 0 ) = 1 - BINOMVERT(m-1;n;p 0 ;1) = = 0, Entscheidung: P-Wert < α = 0,05 >> H1 Lösungsvariante 2: Normalverteilungsapproximation Voraussetzungen: n > 20 und 10 <= np o <= n-10 Berechnung: µ = np 0 = 10,5 σ = [np(1-p ο )] = 2,2913 Z = (X - µ)/σ ist standardnormalverteilt >> approx. P-Wert = P(Z >= (m-µ)/σ)) = 1- P(Z < (m-µ)/σ) = 1- STANDNORMVERT((m-µ)/σ) = 0, Entscheidung: P-Wert < α = 0,05 >> H1 Hinweis: Bessere Approximationen erreicht man mit der sog. Stetigkeitskorrektur, nach der der Zahl x das Intervall (x-0,5; x+0,5) entspricht. In der Formel ist demnach m durch m-0,5 zu ersetzen. Dies ergibt: approx. P-Wert = 1-P(Z < (m-0,5-µ)/σ)) = 1 - STANDNORMVERT((m-0,5-µ)/σ) = 0, (mit dieser Approximation arbeitete z.b. SPSS, Version 8)

13 W. Timischl: Statistische Modellbildung mit Excel 13 Aufgabe 1.5.3: Änderungsmessung mit dem McNemar-Test In einer Studie wurde u.a. das Ges. Eiweiß i.s. am Beginn und am Ende bestimmt. Es ergab sich, dass bei 32 Probanden der Eiweißwert vor und nach Ende der Studie im Normbereich lag, bei 22 Probanden lag der Wert vorher im Normbereich und nachher außerhalb, bei 9 Probanden vorher außerhalb und nachher im Normbereich und bei 7 vorher und nachher außerhalb des Normbereichs. Hat sich während der Studie eine signifikante Änderung hinsichtlich des Normbereichs ergeben (α = 5%)? Daten: Berechnung: Entscheidung: Ende Beginn innerh. (+) außerh. (-) innerh. (+) 32 (a) 22 (b) außerh. (-) 9 (c) 7 (d) Jede der b+c Veränderungen wird durch ein Zufallsexperiment mit zwei Ausgängen (Änderung von + nach - bzw. von - nach +) simuliert. Es finden b+c Wiederholungen statt. Jede Wiederholung führt mit der Wahrscheinlichkeit p + - von + nach -. b = 22 c = 9 Hypothesen: H o : p + _ = 1/2 vs. H 1 : p + _ <> 1/2 Näherungsrechnung (Voraussetzung: b+c>20) Testgröße: TG = ( b - c -1) 2 /(b+c) ist näherungsweise Chiquadrat-verteilt mit einem Freiheitsgrad TG(s) = 4,645 P-Wert: P = P(GF > GF(s)) = CHIVERT(x;Freiheitsgrade) = 0,03114 (mit x = GF(s) und Freiheitsgrade = 1) P-Wert < α = 0,05 >> H1 Aufgabe 1.5.4: Gleichwertigkeit von Mittelwerten In einer Bioverfügbarkeitsstudie wurden 7 Probanden zeitlich hintereinander ein Testpräparat (t) und ein Kontrollpräparat (k) verabreicht; die Zuordnung der Präparatsequenzen tk bzw. kt erfolgte zufällig. Die Zielvariable ist die Halbwertszeit X t bzw. X k (in h) für die Elimination des jeweiligen Wirkstoffes aus dem Blut. Es ergaben sich die folgenden Wertepaare für (X t, X k ): (1.50, 1.95), (1.92, 2.05), (1.43, 2.46), (1.68, 2.88), (1.97, 2.52), (2.01, 1.80), (1.85, 2.03). i) Äquivalenzprüfung: Man prüfe, ob Gleichwertigkeit hinsichtlich der mittleren Halbwertszeiten besteht; die Wirkstoffe mögen als gleichwertig gelten, wenn sich die mittleren Halbwertszeiten um weniger als 20% des Kontrollmittels unterscheiden. ii) Wirksamkeitsprüfung: Ferner prüfe man, ob zwischen den mittleren Halbwertszeiten ein signifikanter Unterschied besteht. In beiden Fällen sei α = 5% vereinbart. Daten: X t X k >> Differenzstichprobe >> D=X t - X k 1,50 1,95-0,45 1,92 2,05-0,13 1,43 2,46-1,03 1,68 2,88-1,20 1,97 2,52-0,55 2,01 1,80 0,21 1,85 2,03-0,18 Statistiken der Differenzstichprobe (Bereich = Differenzstichprobe): Stichprobenumfang = ANZAHL(Bereich ) = 7 Mittelwert = m D = MITTELWERT(Bereich) = -0,4757 Standardabweichung s D = STABW(Bereich) = 0,5025 Der Effekt wird als Differenz D des Test- und des Kontrollwertes dargestellt. Damit ergibt sich ein 1-Stichprobenproblem mit der Differenz D als Zielvariable. Diese wird als N(µ, σ²)-verteilt angenommen.

14 W. Timischl: Statistische Modellbildung mit Excel 14 Teilaufgabe i) Hypothesen: Äquivalenzprüfung H 0 : µ t - µ k >= versus H 1 : µ t µ k < Toleranzintervall (-, + ): Mittelwert der Kontroll-Stichprobe = 2,2414 Toleranzgrenze =20% v. X k -Mittelwert= 0,4483 Berechnung: Entscheidungskriterium von Westlake: H 0 wird auf Testniveau α abgelehnt, wenn das (1-2α)-Konfidenzintervall [u, o] für den Mittelwert m der Differenzstichprobe im Toleranzintervall (-, + ) enthalten ist. SE = s D / (n) = 0,190 t(n-1,1-2α) = t(6, 0.9) = 1,943 u = m D - t(n-1,1-2α) = -0,8448 o = m D + t(n-1,1-2α) = -0,1066 Entscheidung: [u, o] nicht enthalten in (-, + ) >> H 0 (Nichtgleichwertigkeit) kann nicht abgelehnt werden Teilaufgabe ii) Wirksamkeitsprüfung Hypothesen: H 0 : µ = µ t - µ k = 0 versus H 1 : µ = µ t µ k <> 0 Berechnung: Testgröße: TG = [(m D - 0)/S] n ist t-verteilt mit f = n - 1 Freiheitsgraden TG(s) = -2,505 P-Wert: P = 2 P(TG < TG(s) ) = TVERT(x;Freiheitsgrade;Seiten) = TVERT(x;n-1;2) = 0,04624 [x = TG(s), Freiheitsgrade = n-1, Seiten = 2 (2-seitige Ausläuferfl.)] Hinweis: x darf in TVERT(x;Freiheitsgrade;Seiten) nicht negativ sein! Entscheidung: P-Wert < α = 0,05 >> H1, d.h. der Behandlungseffekt ist signifikant

15 W. Timischl: Statistische Modellbildung mit Excel Zwei-Stichprobenvergleiche II: Parallelversuche Aufgabe 1.6.1: Vergleich von zwei Varianzen (F-Test) Im Rahmen einer Bioäquivalenzstudie wurde die Halbwertszeit (in Stunden) für die Elimination eines Testpräparats bestimmt an 12 Versuchspersonen bestimmt. Zum Vergleich wurde eine Kontrollgruppe mit 12 weiteren Personen gebildetet und die Halberwertszeiten für ein Kontrollpräparat ermittelt. Es ergaben sich die in der folgenden Tabelle angeführten Werte. Man prüfe auf 5%igem Testniveau, ob sich die Stichprobenvarianzen signifikant voneinander unterscheiden. Daten: Lösung: Variante 1: Variante 2: Halbwertszeit X t (Testpräp.) X k (Kontrollpr.) 2,45 3,25 1,92 2,48 2,62 3,94 1,56 2,26 2,17 1,95 2,76 3,00 2,89 2,85 2,40 1,97 1,41 2,03 2,09 1,95 1,81 1,52 Statistiken: 1,68 1,87 n = Mittelwert= 2,1467 2,4225 STD= 0,4845 0,7044 Varianz= 0,2347 0,4962 Die Variablen Xt und X k werden als N(µ t, σ t ²)- bzw. N(µ t, σ t ²)-verteilt angenommen. Hinweis: Der F-Test ist wenig robust gegenüber Abweichungen von der Normalitätsvoraussetzung! Hypothesen: Ho: σ 2 t = σ 2 k vs. H1: σ 2 2 t <> σ k Explizite Berechnung: Testgröße: TG = Sk²/St² ist F-verteilt mit dem ersten Freiheitsgrad (FG1) nk - 1 (Freiheitsgrad der Zählervarianz) und dem zweiten Freiheitsgrad (FG2) nt - 1 (Freiheitsgrad der Nennervarianz) TG(s) = 2,1141 P-Wert: P = 2 P(TG>TG(s)) = 2*FVERT(x:FG1; FG2) = 0,2301 (mit x = TG(s), FG1 = nk - 1, FG2 = nt - 1) Entscheidung: P-Wert >= α = 0,05 >> Ho (Varianzhomogenität) wird beibehalten! Hinweis: FVERT(x;Freiheitsgrad1;Freiheitsgrad2) liefert die "Überschreitungswahrscheinlichkeit" P(X > x) (!) Berechnung mit der Excel-Funktion FTEST: P-Wert: P = 2 P(TG > TG(s)) = FTEST(Bereich1;Bereich2) = = 0,2301 (Bereich1,2 = Bereich der X t - bzw. X k -Stichprobe)

16 W. Timischl: Statistische Modellbildung mit Excel 16 Variante 3: Berechnung mit der Prozedur "Zwei-Stichproben F-Test" Hinweis: Diese Prozedur steht unter "Extras - Analyse-Funktionen" zur Verfügung und setzt eine Anordnung der Stichproben in Spalten bzw. Zeilen voraus! Variable 1 Variable 2 Mittelwert 2,4225 2,1467 Varianz 0,4962 0,2347 Beobachtungen Freiheitsgrade (df) Prüfgröße (F) 2,1141 P(F<=f) einseitig 0,1150 *) Kritischer F-Wert bei einseitigem Test 2,8179 Aufgabe 1.6.2: Vergleich von zwei Mittelwerten (Welch-Test, 2-Stichproben t-test) Im Rahmen einer Bioäquivalenzstudie wurde die Halbwertszeit (in Stunden) für die Elimination eines Testpräparats bestimmt an 12 Versuchspersonen bestimmt. Zum Vergleich wurde eine Kontrollgruppe mit 12 weiteren Personen gebildetet und die Halberwertszeiten für ein Kontrollpräparat ermittelt. i) Man prüfe auf 5%igem Testniveau, ob sich die Stichprobenmittelwerte voneinander signifikant unterscheiden. ii) Bei nicht-signifikantem Ausgang bestimme man den notwendigen Mindeststichprobenumfang, um die beobachtete Mittelwertdifferenz mit einer Sicherheit von 90% als signifikant erkennen zu können. Daten: (wie Aufg.1.6.1) *) Hinweis: Hier wird die Wahrscheinlichkeit angegeben, mit der die Realisation der Testgröße (=Prüfgröße) überschritten wird. Zur Testentscheidung ist die Überschreitungswahrscheinlichkeit mit α/2 zu vergleichen! Halbwertszeit X t (Testpräp.) X k (Kontrollpr.) 2,45 3,25 1,92 2,48 2,62 3,94 1,56 2,26 2,17 1,95 2,76 3,00 2,89 2,85 2,40 1,97 1,41 2,03 2,09 1,95 1,81 1,52 Statistiken: 1,68 1,87 n = (n t, n k ) Mittelwert= 2,1467 2,4225 (m t, m k ) STD= 0,4845 0,7044 (s t, s k ) Varianz= 0,2347 0,4962 Die Variablen X t (=Halbwertszeit/Testpräparat) und X k (=Halbwertszeit/Kontrollopräparat) sind N(µt, σt²)- bzw. N(µk, σk²)-verteilt. Hypothesen: Ho: µt = µκ vs. H1: µτ <> µk i) Prüfung auf signifikanten Unterschied der Mittelwerte Methode 1: Vergleich der Mittelwerte mit dem Welch-Test (ohne Kenntnis der Gleichheit der Varianzen) Lösungsvariante 1: Explizite Berechnung Freiheitsgrade: FG = (st²/n t + sk² /n k ) 2 / [(s t ²/n t ) 2 /(n t -1) + (s k ²/n k ) 2 /(n k -1)] = 19,5038 Testgröße: TG(s) = (m t - m k )/ [ (st²/n t + sk² /n k ] -1,1176 P-Wert: P = P(TG < - TG(s) ) + P(TG > TG(s) ) = TVERT(x;Freiheitsgrade;Seiten) = 0,2770 *) [mit x= TG(s), Freiheitsgrade = FG+0,5 und Seiten = 2] *) Beachte: TVERT rundet bei nicht ganzem FG auf die nächstkleinere ganze Zahl ab! Entscheidung: P-Wert >= α = 0,05 >> Ho (Gleicheit der Mittelwerte) kann nicht abgelehnt werden!

17 W. Timischl: Statistische Modellbildung mit Excel 17 Lösungsvariante 2: Berechnung mit der Excel-Funktion TTEST P-Wert: P = TTEST(Matrix1;Matrix2;Seiten;Typ) Es bedeuten: Matrix1 = Bereich der ersten Stichprobe (Bereich1, Testpräparat) Matrix2 = Bereich der zweiten Stichprobe (Bereich2, Kontrollpräparat) Seiten = 1 bei 1-seitigen Hypothesen 2 bei 2-seitiger Hypothese Typ = 1 bei abhängigen Stichproben 2 bei unabhängigen Stichproben gleicher Varianz 3 bei unabhängigen Stichproben ungleicher Varianz Für die betrachtete Aufgabe gilt: Matrix1 = Bereich1, Matrix2 = Bereich2, Seiten = 2, Typ = 3, also P = TTEST(Bereich1;Bereich2;2;3) = 0,2773 Lösunsvariante 3: Berechnung mit der Prozedur "Zwei-Stichproben t-test: Unterschiedliche Varianzen" Hinweis: Diese Prozedur steht unter "Extras - Analyse-Funktionen" zur Verfügung und setzt eine Anordnung der Stichproben in Spalten bzw. Zeilen voraus! Variable 1 Variable 2 Mittelwert 2,1467 2,4225 Varianz 0,2347 0,4962 Beobachtungen Hypothetische Differenz der Mittelwerte 0 Freiheitsgrade (df) 20 *) t-statistik -1,1176 P(T<=t) einseitig 0,1385 Kritischer t-wert bei einseitigem t-test 1,7247 P(T<=t) zweiseitig 0,2770 **) Kritischer t-wert bei zweiseitigem t-test 2,0860 *) Freiheitsgrade werden gerundet. **) Entscheidung: P(zweiseitig) >= α = 5%>> H0 kann nicht abgelehnt werden! Methode 2: Vergleich der Mittelwerte mit dem 2-Stichproben - t-test Voraussetzung: Es liegt Varianzhomogenität vor! Vortest: Prüfung auf Varianzungleichheit (Varianzinhomogenität) mit dem F-Test Hypothesen: Ho: σ1² = σ2² vs. H1: σ1² <> σ2² Entscheidung: Annahme gleicher Varianzen (H0) kann nicht falsifiziert werden! (siehe Aufgabe 1.6.1) Haupttest: Vergleich der Mittelwerte mit dem Zwei-Stichproben t-test: Lösungsvariante 1: Explizite Berechnung Gewichtete Varianz: sp² = [(nt-1)st² + (nk-1)sk²]/(nt+nk-2) = 0,3655 sp = (sp²) = 0,6046 Testgröße: TG(s) = (mt - mk)/[sp (1/nt + 1/nk)] = -1,1176 P-Wert: P = P(TG < - TG(s) )+ P(TG > TG(s) ) = TVERT(x;Freiheitsgrade;Seiten) = 0,2758 [x= TG(s), Freiheitsgrade = nt+ nk - 2 und Seiten = 2] Entscheidung: P-Wert >= α = 0,05 >> Ho (Gleichheit der Mittelwerte) kann nicht abgelehnt werden!

18 W. Timischl: Statistische Modellbildung mit Excel 18 Lösungsvariante 2: Berechnung mit der EXCEL Funktion TTEST P-Wert: P = TTEST(Matrix1;Matrix2;Seiten;Typ) Es bedeuten: Matrix1 = Bereich der ersten Stichprobe (Bereich1, Testpräparat) Matrix2 = Bereich der zweiten Stichprobe (Bereich2, Kontrollpräparat) Seiten = 1 bei 1-seitigen Hypothesen 2 bei 2-seitiger Hypothese Typ = 1 bei abhängigen Stichproben 2 bei unabhängigen Stichproben gleicher Varianz 3 bei unabhängigen Stichproben ungleicher Varianz Für die betrachtete Aufgabe gilt: Matrix1 = Bereich1, Matrix2 = Bereich2, Seiten = 2, Typ = 2, also P = TTEST(Bereich1;Bereich2;2;2) = 0,2758 Lösungsvariante 3: Berechnung mit der Prozedur "Zwei-Stichproben t-test: Gleiche Varianzen" Hinweis: Diese Prozedur steht unter "Extras - Analyse-Funktionen" zur Verfügung und setzt eine Anordnung der Stichproben in Spalten bzw. Zeilen voraus! Variable 1 Variable 2 Mittelwert 2,1467 2,4225 Varianz 0,2347 0,4962 Beobachtungen Gepoolte Varianz 0,3655 Hypothetische Differenz der Mittelwerte 0 Freiheitsgrade (df) 22 t-statistik -1,1176 P(T<=t) einseitig 0,1379 Kritischer t-wert bei einseitigem t-test 1,7171 P(T<=t) zweiseitig 0,2758 *) Kritischer t-wert bei zweiseitigem t-test 2,0739 *) Entscheidung: P(zweiseitig) >= α = 5% >> H0 kann nicht abgelehnt werden! ii) Planung des Stichprobenumfanges n = n t = n k Gegeben: α-fehler α = 0,05 Power 1-β = 0,90 krit.abw. = m t - m k = 0,2758 σ = s p = 0,6046 Berechnung (Normalverteilungsaproximation): z(1 - α/2) = STANDNORMINV(1 - α/2) = 1,960 z(1 - β) = STANDNORMINV(1 - β) = 1,282 n >= 2(σ/ )² [z(1-α/2) + z(1-β)]² = 100,95 Ergebnis: Aus dem nicht-signifikanten Testausgang kann nicht der Schluss gezogen werden, dass H0 (Gleichheit der Mittelwerte) gilt. Planung des Versuchs ist unzureichend! Aufgabe 1.6.3: Vergleich zweier Anteile Im Rahmen einer Untersuchung des Ernährungsstatus von Schulkindern aus Oberösterreich und der Steiermark wurde u.a. das Gesamtcholesterin (in mg/dl) stichprobenartig erfasst (siehe nachfolgende Tabelle). Man prüfe auf 5%igem Niveau, ob sich die Schüleranteile in der optimalen Kategorie zwischen den Bundesländern signifikant unterscheidet. Daten: U-Merkm. X 1 Gliederungsmerkmal X 2 Summe Gesamtchol. OÖ St <170 (opt.) 93 (n 11 ) 42 (n 12 ) n 1. = 135 >=170(Risik.) 52 (n 21 ) 29 (n 22 ) n 2. = 81 Summe n.1 = 145 n.2 = 71 n.. = 216 Die Werte a 1 (opt.) und a 2 (Risik.) des Untersuchungsmerkmals sind Realisationen einer Zweipunktvariablen mit dem Parameter p 1 =P(X 1 =a 1 X 2 =OÖ) in der ersten Stichprobe und dem Parameter p 2 =P(X1=a1 X 2 =St) in der zweiten Stichprobe. Hypothesen: H o : p 1 = p 2 vs. H 1 : p 1 <> p 2

19 W. Timischl: Statistische Modellbildung mit Excel 19 Berechnung: Entscheidung: Methode: Normalverteilungsapproximation bei großen Stichproben Testgröße: TG(s) = (n.. )(n 11 n 22 - n 12 n 21 )/ (n.1 n.2 n 1. n 2. ) = 0,711 P-Wert: P = P(TG < - TG(s) ) + P(TG > TG(s) ) = STANDNORMVERT(- TG(s) )+1-STANDNORMVERT( TG(s) ) = 0,477 P-Wert >= α = 0,05 >> Ho kann nicht abgelehnt werden! Aufgabe 1.6.4: Vergleich zweier Häufigkeitsverteilungen (Homogenitätsprüfung) In einer Studie wurden 33 Personen mit dem Präparat A und 27 Personen mit dem Präparat B behandelt. Der Behandlungserfolg wurde auf einer 3-stufigen Skala mit den Skalenwerten Verbesserung, keine Änderung, Verschlechterung dargestellt. In der Präparatgruppe A gab es 13 Personen mit einer Verbesserung, 13 Personen zeigten keine Veränderung und 7 Personen eine Verschlechterung. Die entsprechenden Häufigkeiten für die Präparatgruppe B sind 6, 16 bzw. 5. Man prüfe, ob der Behandlungserfolg vom Präparat abhängt (α = 5%). Berechnung: Testgröße: Chiquadratsumme GF = Σ(O - E)²/E Die Summe erstreckt sich über alle Zellen der Präparat/Behandlungserfolg-Kombinationen; O und E sind die beobachteten bzw. die unter H0 erwarteten Zellenhäufigkeiten (= Zeilensumme x Spaltensumme/Gesamtsumme). GF ist unter Ho näherungsweise chiquadratverteilt mit FG Freiheitsgraden (FG = um 1 verminderte Anzahl der Skalenstufen). Voraussetzung für die Approximation: alle erwartetn Häufigkeiten >= 1und höchstens 20% von ihnen kleiner als 5. Bestimmung der Realisationen von E: Daten: beobachtete Behandl.- Präparat Häufigk. (O) Erfolg A B Σ (Zeilen) Verbess k.änderung Verschl Σ (Spalten) Σ (Gesamt) Es seien p ia und p ib die Wahrscheinlichkeiten, dass unter Präparat A bzw. B der Behandlungserfolg i (i = Verbesserung, k. Änderung, Verschlechterung) eintritt. Der Behandlungserfolg hängt nicht vom Präparat ab, wenn p ia = p ib für alle i gilt. Die Abhängigkeit des Behandlungserfolgs vom Präparat ist auf dem vorgegebenen Testniveau α nachgewiesen, wenn die Nullhypothese H0: p ia = p ib abgelehnt werden kann. Behandl.- Präparat Erfolg A B Verbess. 10,45 8,55 k.änderung 15,95 13,05 Verschl. 6,6 5,4 GF(s) = = 2,65 P-Wert: P = P(GF > GF(s)) = CHIVERT(x;Freiheitsgrade) = 0,2659 [x = GF(s) = 2,65 und Freiheitsgrade = FG] Entscheidung: P-Wert > α = 0,05>> Ho kann nicht abgelehnt werden!

20 W. Timischl: Statistische Modellbildung mit Excel Korrelation und Regression Aufgabe 1.7.1: Abhängigkeit zwischen mehrstufig skalierten Variablen Die Wirksamkeit einer Behandlung wurde einerseits durch den Probanden (Variable X) und andererseits durch den Prüfarzt (Variable Y) beurteilt. Man beschreibe den Zusammenhang zwischen den Beurteilungen mit einem geeigneten Korrelationsmaß. Wie groß sind die bei einer angenommenen Unabhängigkeit zu erwartenden absoluten Häufigkeiten? Ist die Korrelation signifikant von null verschieden? (α = 5%) Daten: beobachtete Arzt Häufigk. (O) Proband sehr gut gut mäßig Σ (Zeilen) sehr gut gut mäßig Σ (Spalten) (=n) Σ (Gesamt) Berechnung: Es sei p ij = P(X=i und Y=j) die Wahrscheinlichkeit, dass X den Wert i und Y den Wert j aufweist. X und Y variieren voneinander unabhängig, wenn p ij = p i p j mit p i = P(X=i) und p j =P(Y=j) ist. Die Abhängigkeit der Variablen X und Y ist auf dem vorgegebenen Testniveau a nachgewiesen, wenn die Nullhypothese H0: pij = p i p j (für alle i, j) abgelehnt werden kann. Testgröße: Chiquadratsumme GF = Σ(O - E)²/E Die Summe erstreckt sich über alle Zellen der Proband/Arzt-Beurteilungskombinationen. O und E sind die beobachteten bzw. die unter H0 erwarteten Zellenhäufigkeiten (= Zeilensumme x Spaltensumme/Gesamtsumme). GF ist unter Ho näherungsweise chiquadratverteilt mit FG Freiheitsgraden (FG = Produkt der jeweils um 1 verminderten Anzahl der Skalenstufen von X und Y). Voraussetzung für die Approximation: alle erwarteten Häufigkeiten >= 1und höchstens 20% von ihnen kleiner als 5. Bestimmung der Realisationen von E: Arzt Proband sehr gut gut mäßig sehr gut 22,38 16,19 11,43 gut 13,43 9,71 6,86 mäßig 11,19 8,10 5,71 Bestimmung der Realsation von GF: Arzt Proband sehr gut gut mäßig Summe sehr gut 8,287 2,367 4,829 15,483 gut 4,109 4,067 0,190 8,367 mäßig 3,425 0,001 6,914 10,340 34,190 =GF(s) P-Wert: P = P(GF > GF(s)) = CHIVERT(x;Freiheitsgrade) = 0, [x = GF(s) und Freiheitsgrade = FG) Entscheidung: P-Wert < α = 0,05 >> H1 (X und Y sind voneinander abhängig) Cramersche Kontingenzindex V: V = [GF(s)/n/(min(k,m) -1)] = 0,40 (k = Anz. d. Zeilen, m = Anz. d. Spalten in der Kontingenztafel)

9. Schätzen und Testen bei unbekannter Varianz

9. Schätzen und Testen bei unbekannter Varianz 9. Schätzen und Testen bei unbekannter Varianz Dr. Antje Kiesel Institut für Angewandte Mathematik WS 2011/2012 Schätzen und Testen bei unbekannter Varianz Wenn wir die Standardabweichung σ nicht kennen,

Mehr

Statistik II für Betriebswirte Vorlesung 3

Statistik II für Betriebswirte Vorlesung 3 PD Dr. Frank Heyde TU Bergakademie Freiberg Institut für Stochastik Statistik II für Betriebswirte Vorlesung 3 5. November 2013 Beispiel: Aktiensplit (Aczel & Sounderpandan, Aufg. 14-28) Ein Börsenanalyst

Mehr

Klassifikation von Signifikanztests

Klassifikation von Signifikanztests Klassifikation von Signifikanztests nach Verteilungsannahmen: verteilungsabhängige = parametrische Tests verteilungsunabhängige = nichtparametrische Tests Bei parametrischen Tests werden im Modell Voraussetzungen

Mehr

Ausgewählte Kapitel der Statistik: Regressions- u. varianzanalytische Modelle Lösung von Grundaufgaben mit SPSS Statistics 20.0

Ausgewählte Kapitel der Statistik: Regressions- u. varianzanalytische Modelle Lösung von Grundaufgaben mit SPSS Statistics 20.0 1 Ausgewählte Kapitel der Statistik: Regressions- u. varianzanalytische Modelle Lösung von Grundaufgaben mit SPSS Statistics 20.0 Text: grund1_spss20.doc Daten: grund1_?.sav Lehrbuch: W. Timischl, Biostatistik.

Mehr

Statistik II für Betriebswirte Vorlesung 2

Statistik II für Betriebswirte Vorlesung 2 PD Dr. Frank Heyde TU Bergakademie Freiberg Institut für Stochastik Statistik II für Betriebswirte Vorlesung 2 21. Oktober 2014 Verbundene Stichproben Liegen zwei Stichproben vor, deren Werte einander

Mehr

Einige Statistische Tests für den Ein- Zwei- und k-stichprobenfall (Nach Sachs, Stat. Meth.)

Einige Statistische Tests für den Ein- Zwei- und k-stichprobenfall (Nach Sachs, Stat. Meth.) ue biostatistik: nichtparametrische testverfahren / ergänzung 1/6 h. Lettner / physik Statistische Testverfahren Einige Statistische Tests für den Ein- Zwei- und k-stichprobenfall (Nach Sachs, Stat. Meth.)

Mehr

Eine Einführung in R: Statistische Tests

Eine Einführung in R: Statistische Tests Eine Einführung in R: Statistische Tests Bernd Klaus, Verena Zuber Institut für Medizinische Informatik, Statistik und Epidemiologie (IMISE), Universität Leipzig http://www.uni-leipzig.de/ zuber/teaching/ws12/r-kurs/

Mehr

Einfache statistische Testverfahren

Einfache statistische Testverfahren Einfache statistische Testverfahren Johannes Hain Lehrstuhl für Mathematik VIII (Statistik) 1/29 Hypothesentesten: Allgemeine Situation Im Folgenden wird die statistische Vorgehensweise zur Durchführung

Mehr

12. Vergleich mehrerer Stichproben

12. Vergleich mehrerer Stichproben 12. Vergleich mehrerer Stichproben Dr. Antje Kiesel Institut für Angewandte Mathematik WS 2011/2012 Häufig wollen wir verschiedene Populationen, Verfahren, usw. miteinander vergleichen. Beipiel: Vergleich

Mehr

Profil A 49,3 48,2 50,7 50,9 49,8 48,7 49,6 50,1 Profil B 51,8 49,6 53,2 51,1 51,1 53,4 50,7 50 51,5 51,7 48,8

Profil A 49,3 48,2 50,7 50,9 49,8 48,7 49,6 50,1 Profil B 51,8 49,6 53,2 51,1 51,1 53,4 50,7 50 51,5 51,7 48,8 1. Aufgabe: Eine Reifenfirma hat für Winterreifen unterschiedliche Profile entwickelt. Bei jeweils gleicher Geschwindigkeit und auch sonst gleichen Bedingungen wurden die Bremswirkungen gemessen. Die gemessenen

Mehr

Analytische Statistik I. Statistische Methoden in der Korpuslinguistik Heike Zinsmeister WS 2009/10

Analytische Statistik I. Statistische Methoden in der Korpuslinguistik Heike Zinsmeister WS 2009/10 Analytische Statistik I Statistische Methoden in der Korpuslinguistik Heike Zinsmeister WS 2009/10 Testen Anpassungstests (goodness of fit) Weicht eine gegebene Verteilung signifikant von einer bekannten

Mehr

Güte von Tests. die Wahrscheinlichkeit für den Fehler 2. Art bei der Testentscheidung, nämlich. falsch ist. Darauf haben wir bereits im Kapitel über

Güte von Tests. die Wahrscheinlichkeit für den Fehler 2. Art bei der Testentscheidung, nämlich. falsch ist. Darauf haben wir bereits im Kapitel über Güte von s Grundlegendes zum Konzept der Güte Ableitung der Gütefunktion des Gauss im Einstichprobenproblem Grafische Darstellung der Gütefunktionen des Gauss im Einstichprobenproblem Ableitung der Gütefunktion

Mehr

Biostatistik, WS 2015/2016 Der zwei-stichproben-t-test

Biostatistik, WS 2015/2016 Der zwei-stichproben-t-test 1/29 Biostatistik, WS 2015/2016 Der zwei-stichproben-t-test (t-test für ungepaarte Stichproben) Matthias Birkner http://www.staff.uni-mainz.de/birkner/biostatistik1516/ 11.12.2015 2/29 Inhalt 1 t-test

Mehr

Ein möglicher Unterrichtsgang

Ein möglicher Unterrichtsgang Ein möglicher Unterrichtsgang. Wiederholung: Bernoulli Experiment und Binomialverteilung Da der sichere Umgang mit der Binomialverteilung, auch der Umgang mit dem GTR und den Diagrammen, eine notwendige

Mehr

Willkommen zur Vorlesung Statistik (Master)

Willkommen zur Vorlesung Statistik (Master) Willkommen zur Vorlesung Statistik (Master) Thema dieser Vorlesung: Verteilungsfreie Verfahren Prof. Dr. Wolfgang Ludwig-Mayerhofer Universität Siegen Philosophische Fakultät, Seminar für Sozialwissenschaften

Mehr

Grundlagen quantitativer Sozialforschung Interferenzstatistische Datenanalyse in MS Excel

Grundlagen quantitativer Sozialforschung Interferenzstatistische Datenanalyse in MS Excel Grundlagen quantitativer Sozialforschung Interferenzstatistische Datenanalyse in MS Excel 16.11.01 MP1 - Grundlagen quantitativer Sozialforschung - (4) Datenanalyse 1 Gliederung Datenanalyse (inferenzstatistisch)

Mehr

Konfidenzintervalle Grundlegendes Prinzip Erwartungswert Bekannte Varianz Unbekannte Varianz Anteilswert Differenzen von Erwartungswert Anteilswert

Konfidenzintervalle Grundlegendes Prinzip Erwartungswert Bekannte Varianz Unbekannte Varianz Anteilswert Differenzen von Erwartungswert Anteilswert Konfidenzintervalle Grundlegendes Prinzip Erwartungswert Bekannte Varianz Unbekannte Varianz Anteilswert Differenzen von Erwartungswert Anteilswert Beispiel für Konfidenzintervall Im Prinzip haben wir

Mehr

Wahrscheinlichkeitsrechnung und Statistik für Biologen 5. Der zwei-stichproben-t-test. und der Wilcoxon-Test

Wahrscheinlichkeitsrechnung und Statistik für Biologen 5. Der zwei-stichproben-t-test. und der Wilcoxon-Test Wahrscheinlichkeitsrechnung und Statistik für Biologen 5. Der zwei-stichproben-t-test (t-test für ungepaarte Stichproben) und der Wilcoxon-Test Dirk Metzler 22. Mai 2015 Inhaltsverzeichnis 1 Wiederholung:

Mehr

Skriptum zur Veranstaltung. Quantitative Methoden (Mathematik/Statistik) Teil Induktive Statistik. 1. Version (mehr Draft als Skriptum)

Skriptum zur Veranstaltung. Quantitative Methoden (Mathematik/Statistik) Teil Induktive Statistik. 1. Version (mehr Draft als Skriptum) Skriptum zur Veranstaltung Quantitative Methoden (Mathematik/Statistik) Teil Induktive Statistik 1. Version (mehr Draft als Skriptum) Anmerkungen, Aufzeigen von Tippfehlern und konstruktive Kritik erwünscht!!!

Mehr

5. Schließende Statistik. 5.1. Einführung

5. Schließende Statistik. 5.1. Einführung 5. Schließende Statistik 5.1. Einführung Sollen auf der Basis von empirischen Untersuchungen (Daten) Erkenntnisse gewonnen und Entscheidungen gefällt werden, sind die Methoden der Statistik einzusetzen.

Mehr

9. StatistischeTests. 9.1 Konzeption

9. StatistischeTests. 9.1 Konzeption 9. StatistischeTests 9.1 Konzeption Statistische Tests dienen zur Überprüfung von Hypothesen über einen Parameter der Grundgesamtheit (bei einem Ein-Stichproben-Test) oder über die Verteilung einer Zufallsvariablen

Mehr

Füllmenge. Füllmenge. Füllmenge. Füllmenge. Mean = 500,0029 Std. Dev. = 3,96016 N = 10.000. 485,00 490,00 495,00 500,00 505,00 510,00 515,00 Füllmenge

Füllmenge. Füllmenge. Füllmenge. Füllmenge. Mean = 500,0029 Std. Dev. = 3,96016 N = 10.000. 485,00 490,00 495,00 500,00 505,00 510,00 515,00 Füllmenge 2.4 Stetige Zufallsvariable Beispiel. Abfüllung von 500 Gramm Packungen einer bestimmten Ware auf einer automatischen Abfüllanlage. Die Zufallsvariable X beschreibe die Füllmenge einer zufällig ausgewählten

Mehr

Statistische Tests (Signifikanztests)

Statistische Tests (Signifikanztests) Statistische Tests (Signifikanztests) [testing statistical hypothesis] Prüfen und Bewerten von Hypothesen (Annahmen, Vermutungen) über die Verteilungen von Merkmalen in einer Grundgesamtheit (Population)

Mehr

Franz Kronthaler. Statistik angewandt. Datenanalyse ist (k)eine Kunst. Excel Edition. ^ Springer Spektrum

Franz Kronthaler. Statistik angewandt. Datenanalyse ist (k)eine Kunst. Excel Edition. ^ Springer Spektrum Franz Kronthaler Statistik angewandt Datenanalyse ist (k)eine Kunst Excel Edition ^ Springer Spektrum Inhaltsverzeichnis Teil I Basiswissen und Werkzeuge, um Statistik anzuwenden 1 Statistik ist Spaß 3

Mehr

Bachelorabschlussseminar Dipl.-Kfm. Daniel Cracau

Bachelorabschlussseminar Dipl.-Kfm. Daniel Cracau 1 Einführung in die statistische Datenanalyse Bachelorabschlussseminar Dipl.-Kfm. Daniel Cracau 2 Gliederung 1.Grundlagen 2.Nicht-parametrische Tests a. Mann-Whitney-Wilcoxon-U Test b. Wilcoxon-Signed-Rank

Mehr

90-minütige Klausur Statistik für Studierende der Kommunikationswissenschaft

90-minütige Klausur Statistik für Studierende der Kommunikationswissenschaft Prof. Dr. Helmut Küchenhoff SS08 90-minütige Klausur Statistik für Studierende der Kommunikationswissenschaft am 22.7.2008 Anmerkungen Überprüfen Sie bitte sofort, ob Ihre Angabe vollständig ist. Sie sollte

Mehr

Übungsserie Nr. 10 mit Lösungen

Übungsserie Nr. 10 mit Lösungen Übungsserie Nr. 10 mit Lösungen 1 Ein Untersuchungsdesign sieht einen multivariaten Vergleich einer Stichprobe von Frauen mit einer Stichprobe von Männern hinsichtlich der Merkmale X1, X2 und X3 vor (Codierung:

Mehr

Teil I Beschreibende Statistik 29

Teil I Beschreibende Statistik 29 Vorwort zur 2. Auflage 15 Vorwort 15 Kapitel 0 Einführung 19 0.1 Methoden und Aufgaben der Statistik............................. 20 0.2 Ablauf statistischer Untersuchungen..............................

Mehr

Mathematik IV für Maschinenbau und Informatik (Stochastik) Universität Rostock, Institut für Mathematik Sommersemester 2007

Mathematik IV für Maschinenbau und Informatik (Stochastik) Universität Rostock, Institut für Mathematik Sommersemester 2007 Mathematik IV für Maschinenbau und Informatik Stochastik Universität Rostock, Institut für Mathematik Sommersemester 007 Prof. Dr. F. Liese Dipl.-Math. M. Helwich Serie Termin: 9. Juni 007 Aufgabe 3 Punkte

Mehr

Prüfen von Mittelwertsunterschieden: t-test

Prüfen von Mittelwertsunterschieden: t-test Prüfen von Mittelwertsunterschieden: t-test Sven Garbade Fakultät für Angewandte Psychologie SRH Hochschule Heidelberg sven.garbade@hochschule-heidelberg.de Statistik 1 S. Garbade (SRH Heidelberg) t-test

Mehr

Weiterbildungskurs Stochastik

Weiterbildungskurs Stochastik Hansruedi Künsch Seminar für Statistik Departement Mathematik, ETH Zürich 24. Juni 2009 Inhalt STATISTIK DER BINOMIALVERTEILUNG 1 STATISTIK DER BINOMIALVERTEILUNG 2 Fragestellungen Typische Fragestellungen

Mehr

1.6 Der Vorzeichentest

1.6 Der Vorzeichentest .6 Der Vorzeichentest In diesem Kapitel soll der Vorzeichentest bzw. Zeichentest vorgestellt werden, mit dem man Hypothesen bezüglich des Medians der unabhängig und identisch stetig verteilten Zufallsvariablen

Mehr

Statistische Auswertung der Daten von Blatt 13

Statistische Auswertung der Daten von Blatt 13 Statistische Auswertung der Daten von Blatt 13 Problemstellung 1 Graphische Darstellung der Daten 1 Diskussion der Normalverteilung 3 Mittelwerte und deren Konfidenzbereiche 3 Signifikanz der Behandlung

Mehr

1.4 Der Binomialtest. Die Hypothesen: H 0 : p p 0 gegen. gegen H 1 : p p 0. gegen H 1 : p > p 0

1.4 Der Binomialtest. Die Hypothesen: H 0 : p p 0 gegen. gegen H 1 : p p 0. gegen H 1 : p > p 0 1.4 Der Binomialtest Mit dem Binomialtest kann eine Hypothese bezüglich der Wahrscheinlichkeit für das Auftreten einer Kategorie einer dichotomen (es kommen nur zwei Ausprägungen vor, z.b. 0 und 1) Zufallsvariablen

Mehr

Business Value Launch 2006

Business Value Launch 2006 Quantitative Methoden Inferenzstatistik alea iacta est 11.04.2008 Prof. Dr. Walter Hussy und David Tobinski UDE.EDUcation College im Rahmen des dokforums Universität Duisburg-Essen Inferenzstatistik Erläuterung

Mehr

Statistik im Bachelor-Studium der BWL und VWL

Statistik im Bachelor-Studium der BWL und VWL Max C. Wewel Statistik im Bachelor-Studium der BWL und VWL Methoden, Anwendung, Interpretation Mit herausnehmbarer Formelsammlung ein Imprint von Pearson Education München Boston San Francisco Harlow,

Mehr

Einführung in die Statistik für Wirtschaftswissenschaftler für Betriebswirtschaft und Internationales Management

Einführung in die Statistik für Wirtschaftswissenschaftler für Betriebswirtschaft und Internationales Management Einführung in die Statistik für Wirtschaftswissenschaftler für Betriebswirtschaft und Internationales Management Sommersemester 2013 Hochschule Augsburg : Gliederung 1 Einführung 2 Deskriptive Statistik

Mehr

METHODENLEHRE I WS 2013/14 THOMAS SCHÄFER

METHODENLEHRE I WS 2013/14 THOMAS SCHÄFER METHODENLEHRE I WS 2013/14 THOMAS SCHÄFER DAS THEMA: INFERENZSTATISTIK IV INFERENZSTATISTISCHE AUSSAGEN FÜR ZUSAMMENHÄNGE UND UNTERSCHIEDE Inferenzstatistik für Zusammenhänge Inferenzstatistik für Unterschiede

Mehr

Klausur zu Methoden der Statistik I (mit Kurzlösung) Wintersemester 2007/2008. Aufgabe 1

Klausur zu Methoden der Statistik I (mit Kurzlösung) Wintersemester 2007/2008. Aufgabe 1 Lehrstuhl für Statistik und Ökonometrie der Otto-Friedrich-Universität Bamberg Prof. Dr. Susanne Rässler Klausur zu Methoden der Statistik I (mit Kurzlösung) Wintersemester 2007/2008 Aufgabe 1 Ihnen liegt

Mehr

Hypothesen: Fehler 1. und 2. Art, Power eines statistischen Tests

Hypothesen: Fehler 1. und 2. Art, Power eines statistischen Tests ue biostatistik: hypothesen, fehler 1. und. art, power 1/8 h. lettner / physik Hypothesen: Fehler 1. und. Art, Power eines statistischen Tests Die äußerst wichtige Tabelle über die Zusammenhänge zwischen

Mehr

Test auf den Erwartungswert

Test auf den Erwartungswert Test auf den Erwartungswert Wir interessieren uns für den Erwartungswert µ einer metrischen Zufallsgröße. Beispiele: Alter, Einkommen, Körpergröße, Scorewert... Wir können einseitige oder zweiseitige Hypothesen

Mehr

Grundlagen der Inferenzstatistik: Was Ihnen nicht erspart bleibt!

Grundlagen der Inferenzstatistik: Was Ihnen nicht erspart bleibt! Grundlagen der Inferenzstatistik: Was Ihnen nicht erspart bleibt! 1 Einführung 2 Wahrscheinlichkeiten kurz gefasst 3 Zufallsvariablen und Verteilungen 4 Theoretische Verteilungen (Wahrscheinlichkeitsfunktion)

Mehr

Statistik für Studenten der Sportwissenschaften SS 2008

Statistik für Studenten der Sportwissenschaften SS 2008 Statistik für Studenten der Sportwissenschaften SS 008 Aufgabe 1 Man weiß von Rehabilitanden, die sich einer bestimmten Gymnastik unterziehen, dass sie im Mittel µ=54 Jahre (σ=3 Jahre) alt sind. a) Welcher

Mehr

Deskription, Statistische Testverfahren und Regression. Seminar: Planung und Auswertung klinischer und experimenteller Studien

Deskription, Statistische Testverfahren und Regression. Seminar: Planung und Auswertung klinischer und experimenteller Studien Deskription, Statistische Testverfahren und Regression Seminar: Planung und Auswertung klinischer und experimenteller Studien Deskriptive Statistik Deskriptive Statistik: beschreibende Statistik, empirische

Mehr

5.2. Nichtparametrische Tests. 5.2.1. Zwei unabhängige Stichproben: U- Test nach MANN- WHITNEY

5.2. Nichtparametrische Tests. 5.2.1. Zwei unabhängige Stichproben: U- Test nach MANN- WHITNEY 5.2. Nichtparametrische Tests 5.2.1. Zwei unabhängige Stichproben: U- Test nach MANN- WHITNEY Voraussetzungen: - Die Verteilungen der beiden Grundgesamtheiten sollten eine ähnliche Form aufweisen. - Die

Mehr

Klausur zur Vorlesung Multivariate Verfahren, SS 2006 6 Kreditpunkte, 90 min

Klausur zur Vorlesung Multivariate Verfahren, SS 2006 6 Kreditpunkte, 90 min Klausur, Multivariate Verfahren, SS 2006, 6 Kreditpunkte, 90 min 1 Prof. Dr. Fred Böker 08.08.2006 Klausur zur Vorlesung Multivariate Verfahren, SS 2006 6 Kreditpunkte, 90 min Gesamtpunkte: 39 Aufgabe

Mehr

Prüfung aus Wahrscheinlichkeitstheorie und Statistik MASCHINENBAU 2003

Prüfung aus Wahrscheinlichkeitstheorie und Statistik MASCHINENBAU 2003 Prüfung aus Wahrscheinlichkeitstheorie und Statistik MASCHINENBAU 2003. Eine seltene Krankheit trete mit Wahrscheinlichkeit : 0000 auf. Die bedingte Wahrscheinlichkeit, dass ein bei einem Erkrankten durchgeführter

Mehr

, dt. $+ f(x) = , - + < x < +, " > 0. " 2# Für die zugehörige Verteilungsfunktion F(x) ergibt sich dann: F(x) =

, dt. $+ f(x) = , - + < x < +,  > 0.  2# Für die zugehörige Verteilungsfunktion F(x) ergibt sich dann: F(x) = 38 6..7.4 Normalverteilung Die Gauß-Verteilung oder Normal-Verteilung ist eine stetige Verteilung, d.h. ihre Zufallsvariablen können beliebige reelle Zahlenwerte annehmen. Wir definieren sie durch die

Mehr

Übungsaufgaben zu Kapitel 5. Aufgabe 101. Inhaltsverzeichnis:

Übungsaufgaben zu Kapitel 5. Aufgabe 101. Inhaltsverzeichnis: Inhaltsverzeichnis: Übungsaufgaben zu Kapitel 5... 1 Aufgabe 101... 1 Aufgabe 102... 2 Aufgabe 103... 2 Aufgabe 104... 2 Aufgabe 105... 3 Aufgabe 106... 3 Aufgabe 107... 3 Aufgabe 108... 4 Aufgabe 109...

Mehr

Fragestellungen der Schließenden Statistik

Fragestellungen der Schließenden Statistik Fragestellungen der Schließenden Statistik Bisher: Teil I: Beschreibende Statistik Zusammenfassung von an GesamtheitM N {e,,e N } erhobenem Datensatz x,,x N durch Häufigkeitsverteilung und Kennzahlen für

Mehr

Einfache Statistiken in Excel

Einfache Statistiken in Excel Einfache Statistiken in Excel Dipl.-Volkswirtin Anna Miller Bergische Universität Wuppertal Schumpeter School of Business and Economics Lehrstuhl für Internationale Wirtschaft und Regionalökonomik Raum

Mehr

k np g(n, p) = Pr p [T K] = Pr p [T k] Φ. np(1 p) DWT 4.1 Einführung 359/467 Ernst W. Mayr

k np g(n, p) = Pr p [T K] = Pr p [T k] Φ. np(1 p) DWT 4.1 Einführung 359/467 Ernst W. Mayr Die so genannte Gütefunktion g gibt allgemein die Wahrscheinlichkeit an, mit der ein Test die Nullhypothese verwirft. Für unser hier entworfenes Testverfahren gilt ( ) k np g(n, p) = Pr p [T K] = Pr p

Mehr

DIPLOMVORPRÜFUNG GRUNDZÜGE DER STATISTIK, TEIL B WINTERSEMESTER 2006/07 28.02.2007

DIPLOMVORPRÜFUNG GRUNDZÜGE DER STATISTIK, TEIL B WINTERSEMESTER 2006/07 28.02.2007 Wirtschaftswissenschaftliches Prüfungsamt DIPLOMVORPRÜFUNG GRUNDZÜGE DER STATISTIK, TEIL B WINTERSEMESTER 006/07 8.0.007 Lösung Prof. Dr. R Friedmann / Dr. R. Hauser Hinweise für die Klausurteilnehmer

Mehr

Aufgabe 1 10 ECTS. y i x j gering mittel hoch n i Hausrat 200 25 0 225 KFZ 0 10 75 85 Unfall 20 35 90 145 Reiserücktritt 40 5 0 45 n j 260 75 165 500

Aufgabe 1 10 ECTS. y i x j gering mittel hoch n i Hausrat 200 25 0 225 KFZ 0 10 75 85 Unfall 20 35 90 145 Reiserücktritt 40 5 0 45 n j 260 75 165 500 Aufgabe 1 Für die Securance-Versicherung liegen Ihnen die gemeinsamen absoluten Häugkeiten der Merkmale X: Schadenshöhe und Y : Versicherungsart für die letzten 500 gemeldeten Schäden vor. 1. Interpretieren

Mehr

Testen von Hypothesen:

Testen von Hypothesen: Testen von Hypothesen: Ein Beispiel: Eine Firma produziert Reifen. In der Entwicklungsabteilung wurde ein neues Modell entwickelt, das wesentlich ruhiger läuft. Vor der Markteinführung muss aber auch noch

Mehr

Varianzanalyse ANOVA

Varianzanalyse ANOVA Varianzanalyse ANOVA Johannes Hain Lehrstuhl für Mathematik VIII Statistik 1/23 Einfaktorielle Varianzanalyse (ANOVA) Bisher war man lediglich in der Lage, mit dem t-test einen Mittelwertsvergleich für

Mehr

Lösungen zu den Übungsaufgaben in Kapitel 10

Lösungen zu den Übungsaufgaben in Kapitel 10 Lösungen zu den Übungsaufgaben in Kapitel 10 (1) In einer Stichprobe mit n = 10 Personen werden für X folgende Werte beobachtet: {9; 96; 96; 106; 11; 114; 114; 118; 13; 14}. Sie gehen davon aus, dass Mittelwert

Mehr

Marktforschung I. Marktforschung I 2

Marktforschung I. Marktforschung I 2 Marktforschung I Marktforschung I Einführung in die Testtheorie (Toporowski) Mathematische Grundlagen (Toporowski) Varianzanalyse (Toporowski) Regressionsanalyse (Boztuğ) Diskriminanzanalyse (Hammerschmidt)

Mehr

a) Zeichnen Sie in das nebenstehende Streudiagramm mit Lineal eine Regressionsgerade ein, die Sie für passend halten.

a) Zeichnen Sie in das nebenstehende Streudiagramm mit Lineal eine Regressionsgerade ein, die Sie für passend halten. Statistik für Kommunikationswissenschaftler Wintersemester 2009/200 Vorlesung Prof. Dr. Helmut Küchenhoff Übung Cornelia Oberhauser, Monia Mahling, Juliane Manitz Thema 4 Homepage zur Veranstaltung: http://www.statistik.lmu.de/~helmut/kw09.html

Mehr

Einführung in die Induktive Statistik: Testen von Hypothesen

Einführung in die Induktive Statistik: Testen von Hypothesen Einführung in die Induktive Statistik: Testen von Hypothesen Jan Gertheiss LMU München Sommersemester 2011 Vielen Dank an Christian Heumann für das Überlassen von TEX-Code! Testen: Einführung und Konzepte

Mehr

Grundlagen der Inferenzstatistik

Grundlagen der Inferenzstatistik Grundlagen der Inferenzstatistik (Induktive Statistik oder schließende Statistik) Dr. Winfried Zinn 1 Deskriptive Statistik versus Inferenzstatistik Die Deskriptive Statistik stellt Kenngrößen zur Verfügung,

Mehr

Klausur Statistik Lösungshinweise

Klausur Statistik Lösungshinweise Klausur Statistik Lösungshinweise Prüfungsdatum: 1. Juli 2015 Prüfer: Etschberger, Heiden, Jansen Studiengang: IM und BW Aufgabe 1 14 Punkte Ein Freund von Ihnen hat über einen Teil seiner Daten, die er

Mehr

Biomathematik für Mediziner, Klausur SS 2001 Seite 1

Biomathematik für Mediziner, Klausur SS 2001 Seite 1 Biomathematik für Mediziner, Klausur SS 2001 Seite 1 Aufgabe 1: Von den Patienten einer Klinik geben 70% an, Masern gehabt zu haben, und 60% erinnerten sich an eine Windpockeninfektion. An mindestens einer

Mehr

Jost Reinecke. 7. Juni 2005

Jost Reinecke. 7. Juni 2005 Universität Bielefeld 7. Juni 2005 Testtheorie Test für unabhängige Stichproben Test für abhängige Stichproben Testtheorie Die Testtheorie beinhaltet eine Reihe von Testverfahren, die sich mit der Überprüfung

Mehr

3 Grundlagen statistischer Tests (Kap. 8 IS)

3 Grundlagen statistischer Tests (Kap. 8 IS) 3 Grundlagen statistischer Tests (Kap. 8 IS) 3.1 Beispiel zum Hypothesentest Beispiel: Betrachtet wird eine Abfüllanlage für Mineralwasser mit dem Sollgewicht µ 0 = 1000g und bekannter Standardabweichung

Mehr

Chi-Quadrat Verfahren

Chi-Quadrat Verfahren Chi-Quadrat Verfahren Chi-Quadrat Verfahren werden bei nominalskalierten Daten verwendet. Die einzige Information, die wir bei Nominalskalenniveau zur Verfügung haben, sind Häufigkeiten. Die Quintessenz

Mehr

Weitere (wählbare) Kontraste in der SPSS Prozedur Allgemeines Lineares Modell

Weitere (wählbare) Kontraste in der SPSS Prozedur Allgemeines Lineares Modell Einfaktorielle Versuchspläne 27/40 Weitere (wählbare) Kontraste in der SPSS Prozedur Allgemeines Lineares Modell Abweichung Einfach Differenz Helmert Wiederholt Vergleich Jede Gruppe mit Gesamtmittelwert

Mehr

Hypothesentests mit SPSS. Beispiel für einen t-test

Hypothesentests mit SPSS. Beispiel für einen t-test Beispiel für einen t-test Daten: museum-f-v04.sav Hypothese: Als Gründe, in ein Museum zu gehen, geben mehr Frauen als Männer die Erweiterung der Bildung für Kinder an. Dies hängt mit der Geschlechtsrolle

Mehr

Dipl.-Volksw. Markus Pullen Wintersemester 2012/13

Dipl.-Volksw. Markus Pullen Wintersemester 2012/13 Statistische Auswertungen mit R Universität Kassel, FB 07 Wirtschaftswissenschaften Dipl.-Volksw. Markus Pullen Wintersemester 2012/13 Beispiele 8. Sitzung Konfidenzintervalle, Hypothesentests > # Anwendungsbeispiel

Mehr

8. Methoden der klassischen multivariaten Statistik

8. Methoden der klassischen multivariaten Statistik 8. Methoden der klassischen multivariaten Statistik 8.1. Darstellung von Daten Voraussetzungen auch in diesem Kapitel: Grundgesamtheit (Datenraum) Ω von Objekten (Fällen, Instanzen), denen J-Tupel von

Mehr

Medizinische Statistik Epidemiologie und χ 2 Vierfeldertest

Medizinische Statistik Epidemiologie und χ 2 Vierfeldertest Universität Wien Institut für Mathematik Wintersemester 2009/2010 Medizinische Statistik Epidemiologie und χ 2 Vierfeldertest Seminar Angewandte Mathematik Ao. Univ. Prof. Dr. Peter Schmitt von Nadja Reiterer

Mehr

4. Erstellen von Klassen

4. Erstellen von Klassen Statistik mit Tabellenkalkulation 4. Erstellen von Klassen Mit einem einfachen Befehl lässt sich eine Liste von Zahlen auf die Häufigkeit der einzelnen Werte untersuchen. Verwenden Sie dazu den Befehl

Mehr

Webergänzung zu Kapitel 10

Webergänzung zu Kapitel 10 Webergänzung zu Kapitel 10 10.1.4 Varianzanalyse (ANOVA: analysis of variance) Im Kapitel 10 haben wir uns hauptsächlich mit Forschungsbeispielen beschäftigt, die nur zwei Ergebnissätze hatten (entweder

Mehr

Biometrie und Methodik (Statistik) - WiSem08/09 Probeklausur 1

Biometrie und Methodik (Statistik) - WiSem08/09 Probeklausur 1 Biometrie und Methodik (Statistik) - WiSem08/09 Probeklausur 1 Aufgabe 1 (10 Punkte). 10 Schüler der zehnten Klasse unterziehen sich zur Vorbereitung auf die Abschlussprüfung einem Mathematiktrainingsprogramm.

Mehr

Übung zur Vorlesung Statistik I WS Übungsblatt 9

Übung zur Vorlesung Statistik I WS Übungsblatt 9 Übung zur Vorlesung Statistik I WS 2012-2013 Übungsblatt 9 17. Dezember 2012 Aufgabe 26 (4 Punkte): In einer Studie mit n = 10 Patienten soll die Wirksamkeit eines Medikaments gegen Bluthochdruck geprüft

Mehr

Gibt es einen Geschmacksunterschied zwischen Coca Cola und Cola Zero?

Gibt es einen Geschmacksunterschied zwischen Coca Cola und Cola Zero? Gibt es einen Geschmacksunterschied zwischen Coca Cola und Cola Zero? Manche sagen: Ja, manche sagen: Nein Wie soll man das objektiv feststellen? Kann man Geschmack objektiv messen? - Geschmack ist subjektiv

Mehr

Einfache statistische Auswertungen mit dem Programm SPSS

Einfache statistische Auswertungen mit dem Programm SPSS Einfache statistische Auswertungen mit dem Programm SPSS Datensatz: fiktive_daten.sav Dipl. Päd. Anne Haßelkus Dr. Dorothea Dette-Hagenmeyer 11/2011 Überblick 1 Deskriptive Statistiken; Mittelwert berechnen...

Mehr

Überblick über die Verfahren für Ordinaldaten

Überblick über die Verfahren für Ordinaldaten Verfahren zur Analyse ordinalskalierten Daten 1 Überblick über die Verfahren für Ordinaldaten Unterschiede bei unabhängigen Stichproben Test U Test nach Mann & Whitney H Test nach Kruskal & Wallis parametrische

Mehr

Einführung in statistische Testmethoden

Einführung in statistische Testmethoden Einführung in statistische Testmethoden und die Bearbeitung von Messdaten mit Excel 1. Beispielhafte Einführung in den Gebrauch von Testmethoden 2. Typen von Messwerten, Verteilungen 3. Mittelwert, Varianz,

Mehr

Welch-Test. Welch-Test

Welch-Test. Welch-Test Welch-Test Welch-Test Test auf Lageunterschied zweier normalverteilter Grundgesamtheiten mit unbekannten Varianzen durch Vergleich der Mittelwerte zweier unabhängiger Zufallsstichproben. Beispiel Im Labor

Mehr

Lösungen zu Janssen/Laatz, Statistische Datenanalyse mit SPSS 1

Lösungen zu Janssen/Laatz, Statistische Datenanalyse mit SPSS 1 LÖSUNG 9B a) Lösungen zu Janssen/Laatz, Statistische Datenanalyse mit SPSS 1 Man kann erwarten, dass der Absatz mit steigendem Preis abnimmt, mit höherer Anzahl der Außendienstmitarbeiter sowie mit erhöhten

Mehr

8. Konfidenzintervalle und Hypothesentests

8. Konfidenzintervalle und Hypothesentests 8. Konfidenzintervalle und Hypothesentests Dr. Antje Kiesel Institut für Angewandte Mathematik WS 2011/2012 Beispiel. Sie wollen den durchschnittlichen Fruchtsaftgehalt eines bestimmten Orangennektars

Mehr

Statistische Tests für unbekannte Parameter

Statistische Tests für unbekannte Parameter Konfidenzintervall Intervall, das den unbekannten Parameter der Verteilung mit vorgegebener Sicherheit überdeckt ('Genauigkeitsaussage' bzw. Zuverlässigkeit einer Punktschätzung) Statistischer Test Ja-Nein-Entscheidung

Mehr

Auswertung mit dem Statistikprogramm SPSS: 30.11.05

Auswertung mit dem Statistikprogramm SPSS: 30.11.05 Auswertung mit dem Statistikprogramm SPSS: 30.11.05 Seite 1 Einführung SPSS Was ist eine Fragestellung? Beispiel Welche statistische Prozedur gehört zu welcher Hypothese? Statistische Berechnungen mit

Mehr

6. METRISCHE UND KATEGORIALE MERKMALE

6. METRISCHE UND KATEGORIALE MERKMALE 6. METRISCHE UND KATEGORIALE MERKMALE wenn an einer Beobachtungseinheit eine (oder mehrere) metrische und eine (oder mehrere) kategoriale Variable(n) erhoben wurden Beispiel: Haushaltsarbeit von Teenagern

Mehr

Kapitel 10 Mittelwert-Tests Einstichproben-Mittelwert-Tests 10.2 Zweistichproben Mittelwert-Tests

Kapitel 10 Mittelwert-Tests Einstichproben-Mittelwert-Tests 10.2 Zweistichproben Mittelwert-Tests Kapitel 10 Mittelwert-Tests 10.1 Einstichproben-Mittelwert-Tests 10.2 Zweistichproben Mittelwert-Tests 10.1 Einstichproben- Mittelwert-Tests 10.1.1 Einstichproben- Gauß-Test Dichtefunktion der Standard-Normalverteilung

Mehr

Box-and-Whisker Plot -0,2 0,8 1,8 2,8 3,8 4,8

Box-and-Whisker Plot -0,2 0,8 1,8 2,8 3,8 4,8 . Aufgabe: Für zwei verschiedene Aktien wurde der relative Kurszuwachs (in % beobachtet. Aus den jeweils 20 Quartaldaten ergaben sich die folgenden Box-Plots. Box-and-Whisker Plot Aktie Aktie 2-0,2 0,8,8

Mehr

Schätzen und Testen von Populationsparametern im linearen Regressionsmodell PE ΣO

Schätzen und Testen von Populationsparametern im linearen Regressionsmodell PE ΣO Schätzen und Testen von Populationsparametern im linearen Regressionsmodell PE ΣO 4. Dezember 2001 Generalisierung der aus Stichprobendaten berechneten Regressionsgeraden Voraussetzungen für die Generalisierung

Mehr

Melanie Kaspar, Prof. Dr. B. Grabowski 1

Melanie Kaspar, Prof. Dr. B. Grabowski 1 7. Hypothesentests Ausgangssituation: Man muss sich zwischen 2 Möglichkeiten (=Hypothesen) entscheiden. Diese Entscheidung soll mit Hilfe von Beobachtungen ( Stichprobe ) getroffen werden. Die Hypothesen

Mehr

Multivariate Statistik

Multivariate Statistik Hermann Singer Multivariate Statistik 1 Auflage 15 Oktober 2012 Seite: 12 KAPITEL 1 FALLSTUDIEN Abbildung 12: Logistische Regression: Geschätzte Wahrscheinlichkeit für schlechte und gute Kredite (rot/blau)

Mehr

Statistiktraining im Qualitätsmanagement

Statistiktraining im Qualitätsmanagement Gerhard Linß Statistiktraining im Qualitätsmanagement ISBN-0: -446-75- ISBN-: 978--446-75-4 Leserobe Weitere Informationen oder Bestellungen unter htt://www.hanser.de/978--446-75-4 sowie im Buchhandel

Mehr

Einführung in die Statistik mit EXCEL und SPSS

Einführung in die Statistik mit EXCEL und SPSS Christine Duller Einführung in die Statistik mit EXCEL und SPSS Ein anwendungsorientiertes Lehr- und Arbeitsbuch Zweite, überarbeitete Auflage Mit 71 Abbildungen und 26 Tabellen Physica-Verlag Ein Unternehmen

Mehr

Statistik Rechnerübungen Beispiele für die Einführungsstunde mit Lösungsweg

Statistik Rechnerübungen Beispiele für die Einführungsstunde mit Lösungsweg Statistik Rechnerübungen Beispiele für die Einführungsstunde mit Lösungsweg Prof. Dr. Peter Plappert Fakultät Grundlagen Für alle Beispiele benötigen Sie die Datei einf_daten.xls. Für Beispiel 1 ist zusätzlich

Mehr

Mathematik für Biologen

Mathematik für Biologen Mathematik für Biologen Prof. Dr. Rüdiger W. Braun Heinrich-Heine-Universität Düsseldorf 19. Januar 2011 1 Nichtparametrische Tests Ordinalskalierte Daten 2 Test für ein Merkmal mit nur zwei Ausprägungen

Mehr

Stochastik Abitur 2009 Stochastik

Stochastik Abitur 2009 Stochastik Abitur 2009 Stochastik Beilage ea (erhöhtes Anforderungsniveau) ga (grundlegendes Anforderungsniveau) ISBN 978-3-8120-0108-3 und ISBN 978-3-8120-0223-3 1 Aufgabe 2 (ea) Rauchen ist das größte vermeidbare

Mehr

Ein bisschen Statistik

Ein bisschen Statistik Prof. Dr. Beat Siebenhaar ein bisschen Statistik 1 Ein bisschen Statistik (orientiert an Hüsler/Zimmermann (006) mit Umsetzung auf die linguistische Fragen) 1. Datentypen und Grafik Grafische Darstellungen

Mehr

$ % + 0 sonst. " p für X =1 $

$ % + 0 sonst.  p für X =1 $ 31 617 Spezielle Verteilungen 6171 Bernoulli Verteilung Wir beschreiben zunächst drei diskrete Verteilungen und beginnen mit einem Zufallsexperiment, indem wir uns für das Eintreffen eines bestimmten Ereignisses

Mehr

Universität Bonn 28. Juli 2010 Fachbereich Rechts- und Wirtschaftswissenschaften Statistische Abteilung Prof. Dr. A. Kneip. KLAUSUR Statistik B

Universität Bonn 28. Juli 2010 Fachbereich Rechts- und Wirtschaftswissenschaften Statistische Abteilung Prof. Dr. A. Kneip. KLAUSUR Statistik B Universität Bonn 28. Juli 2010 Fachbereich Rechts- und Wirtschaftswissenschaften Statistische Abteilung Prof. Dr. A. Kneip Sommersemester 2010 KLAUSUR Statistik B Hinweise zur Bearbeitung: Bei allen Teilaufgaben

Mehr

1,11 1,12 1,13 1,14 1,15 1,16 1,17 1,17 1,17 1,18

1,11 1,12 1,13 1,14 1,15 1,16 1,17 1,17 1,17 1,18 3. Deskriptive Statistik Ziel der deskriptiven (beschreibenden) Statistik (explorativen Datenanalyse) ist die übersichtliche Darstellung der wesentlichen in den erhobenen Daten enthaltene Informationen

Mehr

Zweiseitiger Test für den unbekannten Mittelwert µ einer Normalverteilung bei unbekannter Varianz

Zweiseitiger Test für den unbekannten Mittelwert µ einer Normalverteilung bei unbekannter Varianz Grundlage: Zweiseitiger Test für den unbekannten Mittelwert µ einer Normalverteilung bei unbekannter Varianz Die Testvariable T = X µ 0 S/ n genügt der t-verteilung mit n 1 Freiheitsgraden. Auf der Basis

Mehr