Statistische Modellbildung mit EXCEL im Rahmen der Übungen aus Angewandter Statistik/EDV und Biometrie (Version 2005)

Größe: px
Ab Seite anzeigen:

Download "Statistische Modellbildung mit EXCEL im Rahmen der Übungen aus Angewandter Statistik/EDV und Biometrie (Version 2005)"

Transkript

1 W. Timischl: Statistische Modellbildung mit Excel 1 Statistische Modellbildung mit EXCEL im Rahmen der Übungen aus Angewandter Statistik/EDV und Biometrie (Version 2005) Begleitskriptum zum Lehrbuch Biostatistik - Eine Einführung für Biologen und Mediziner von W. Timischl (Wien-New York: Springer 2000) Voraussetzung: Excel- Grundkenntnisse Literaturhinweise zur statistischen Problemlösung mit Excel: Fleischhauer, Chr.: Excel in Naturwissenschaft und Technik. München: Adison-Wesley Liengme, B.: A Guide to MS Excel for Scientists and Engineers. Oxford: Butterworth Levie, Robert de.: How to use Excel in Analytical Chemistry and in General Data Analysis. Cambridge: University Press Monka, M., Voß, W.: Statistik am PC. München- Wien: Hanser INHALT 1 Biometrie - Grundaufgaben 1.1 Rechnen mit Wahrscheinlichkeiten Aufgabe 1.1.1: Multiplikationsregel Aufgabe 1.1.2: Bedingte Wahrscheinlichkeiten und Formel von Bayes 1.2 Wahrscheinlichkeitsverteilungen Aufgabe 1.2.1: Binomialverteilung Aufgabe 1.2.2: Normalverteilung 1.3 Eindimensionale Datenbeschreibung und Parameterschätzung Aufgabe 1.3.1: Häufigkeitsverteilung und univariate Statistiken Aufgabe 1.3.2: Mittelwertschätzung bei normalverteilten Zufallsvariablen Aufgabe 1.3.3: Planung des Stichprobenumfangs bei der Mittelwertschätzung Aufgabe 1.3.4: Schätzung von Wahrscheinlichkeiten 1.4 Ein-Stichprobenvergleiche Aufgabe 1.4.1: Binomialtest Aufgabe 1.4.2: Einstichproben - t-test Aufgabe 1.4.3: Planung des Stichprobenumfangs beim Einstichproben - t-test Aufgabe 1.4.4: Chiquadrat-Test zur Anpassungsprüfung 1.5 Zwei-Stichprobenvergleiche I: Paarvergleiche Aufgabe 1.5.1: t-test für abhängige Stichproben Aufgabe 1.5.2: Vorzeichentest für abhängige Stichproben Aufgabe 1.5.3: Änderungsmessung mit dem McNemar-Test Aufgabe 1.5.4: Gleichwertigkeit von Mittelwerten 1.6 Zwei-Stichprobenvergleiche II: Parallelversuche Aufgabe 1.6.1: Vergleich von zwei Varianzen (F-Test) Aufgabe 1.6.2: Vergleich von zwei Mittelwerten (Welch-, 2-Stichproben t-test) Aufgabe 1.6.3: Vergleich zweier Anteile Aufgabe 1.6.4: Vergleich zweier Häufigkeitsverteilungen (Homogenitätsprüfung) 1.7 Korrelation und Regression Aufgabe 1.7.1: Abhängigkeit zwischen mehrstufig skalierten Variablen Aufgabe 1.7.2: Korrelation bei metrischen Merkmalen Aufgabe 1.7.3: Einfache lineare Regression 2 Nützliche Excel - Tools Aufgabe 2.1: Einfach gegliederte Berichte mit Gruppenstatistiken Aufgabe 2.2: Zweidimensionale Häufigkeitstabellen - Pivot-Tabellen Aufgabe 2.3: Einfache Variablenergänzungen Aufgabe 2.4: Datensätze filtern Aufgabe 2.5: Datenbankfunktionen 3 Ergänzung: Internet-Rechner zur Stichprobenumfangs- und Power-Berechnung 3.1 Planung des Stichprobenumfangs bei Parameterschätzungen 3.2 Planung des Stichprobenumfangs und Power-Berechnung bei Testverfahren stat_excel_ue05, Inhalt

2 W. Timischl: Statistische Modellbildung mit Excel 2 1 Biometrie - Grundaufgaben Was wird von jeder Problemlösung erwartet? Eine Präzisierung des Problems (Voraussetzungen, Hypothesen,... ); eine Darstellung der verwendeten Methoden (welche, warum); nachvollziehbare Berechnungen; eine prägnante Darstellung und Interpretation der Resultate. 1.1 Rechnen mit Wahrscheinlichkeiten Aufgabe 1.1.1: Multiplikationsregel Bei der Bearbeitung eines Problems sind 2 voneinander unabhängige Entscheidungen zu treffen, von denen jede einzelne mit der Wahrscheinlichkeit 5% eine Fehlentscheidung sein kann. Wie groß ist die simultane Irrtumswahrscheinlichkeit, d.h. die Wahrscheinlichkeit, dass wenigstens in einem Fall falsch entschieden wird? F 1 und F 2 bezeichen die Ereignisse, dass die erste bzw. zweite Entscheidung falsch ist. P(F 1 ) = P(F 2 ) = α = 0,05. Wenn R 1 und R 2 die Ereignisse bezeichnen, dass die erste bzw. zweite Entscheidung richtig ist, gilt P(R 1 ) = P(R 2 ) = 1 - α. Die Ereignisse R 1 und R 2 sind voneinander unabhängig. Gesucht: P(F 1 oder F 2 ) Berechnung: α = 0,05 P(F 1 oder F 2 ) = 1 - P(R 1 und R 2 ) = 1 - P(R 1 ) P(R 2 ) = 1 - (1 - α) 2 = 0,0975 Ergebnis: Hat man zwei mit jeweils 5%igem Irrtumsrisiko behaftete Entscheidungen zu treffen, ist die Wahrscheinlichkeit 9,75%, wenigstens in einem Fall falsch zu entscheiden. Aufgabe 1.1.2: Bedingte Wahrscheinlichkeiten und Formel von Bayes Unter Sensitivität eines diagnostischen Verfahrens zum Nachweis einer Erkrankung bezeichnet man die Wahrscheinlichkeit, ein richtig-positives Ergebnis zu erhalten; die Spezifität ist die Wahrscheinlichkeit, mit dem Diagnoseverfahren ein richtig-negatives Ergebnis zu erhalten. Für ein Diagnoserverfahren sei die Sensitivität 93% und die Spezifität 85%. Die Wahrscheinlichkeit für das Auftreten der Krankheit in einer bestimmten Zielgruppe sei 0.5%. Man berechne die Wahrscheinlichkeit, dass bei positivem Ergebnis tatsächlich eine Erkrankung vorliegt. Es bezeichnen D+ (D-) die Ereignisse, dass die Erkrankung vorliegt (nicht vorliegt), und T+ (T-) die Wahrscheinlichkeit, dass der Test positiv (negativ) ausfällt. Sensitivität = P(T+ D+) = 0,93 Sepzifität = P(T- D-) = 0,85 Prävalenz = P(D+) = 0,005 Gesucht: P(D+ T+ ) Berechnung: mittels Übergang zu absoluten Häufigkeiten; Anzahl der Personen in der Zielgruppe = D+ D T+ T- T+ T P(D+ T+)= 3,02% Ergebnis: Nur 3,02% der testpositiven Probanden sind tatsächlich krank!

3 W. Timischl: Statistische Modellbildung mit Excel Wahrscheinlichkeitsverteilungen Aufgabe 1.2.1: Binomialverteilung Für eine bestimmte Blumenzwiebelsorte wird eine Wahrscheinlichkeit von mindestens 80% garantiert, dass eine Zwiebel nach dem Einsetzen austreibt. Jemand kauft 5 Zwiebeln und stellt fest, dass nur 3 austreiben. Unter der Voraussetzung, dass die garantierte Mindestwahrscheinlichkeit von 80% zutrifft, gebe man die Wahrscheinlichkeit dafür an, dass höchstens 3 der 5 Zwiebeln austreiben. Gesucht: Berechnung: X (Anzahl der austreibenden Zwiebel) ist binomialverteilt mit den Parametern p = 0,8 (Erfolgswahrscheinlichkeit) und n = 5 (Anz. d. Versuche). P(X <= 3) = 1 - P(X > 3) = 1 - P(X = 4) - P(X = 5) mit Excel-Funktion BINOMVERT(Zahl_Erfolge;Versuche;Erfolgswahrsch;Kumuliert) P(X = Zahl_Erfolge ) = BINOMVERT(Zahl_Erfolge; Versuche; Erfolgswahrsch; 0) P(X <= Zahl_Erfolge ) = BINOMVERT(Zahl_Erfolge; Versuche; Erfolgswahrsch; 1) Variante 1: Berechnung mit Verteilungsfunktion (Kumuliert = 1) P(X <= 3 ) = BINOMVERT(3; 5; 0,8; 1) = 0,263 Variante 2: Berechnung mit Wahrscheinlichkeitsfunktion (Kumuliert = 0) P(X = 4 ) = BINOMVERT(Zahl_Erfolge; Versuche; Erfolgswahrsch; Kumuliert) = BINOMVERT(4; 5; 0,8; 0) = 0,410 P(X = 5 ) = BINOMVERT(5; 5; 0,8; 0) = 0,328 P(X <= 3 ) = 0,263 Ergebnis: Mit 26,3%iger Wahrscheinlichkeit treiben maximal 3 Zwiebeln aus! Aufgabe 1.2.2: Normalverteilung Die Masse (in mg) einer Wirksubstanz W in einem Präparat sei normalverteilt mit dem Mittelwert 10 und der Varianz 0,25. i) Welcher Anteil von Präparaten mit der Substanz W zwischen 9mg und 11mg ist zu erwarten? ii) Wie groß ist der Median sowie das 25%- und das 75%-Quantil der Verteilung? Mit welcher Wahrscheinlichkeit wird ein Wert außerhalb des 2-fachen Interquartilabstandes um den Mittelwert angenommen? iii) Man stelle die Wahrscheinlichkeitsdichte grafisch dar! Verteilungsmodell: X (Masse der Wirksubstanz) ist normalverteilt mit dem Mittelwert µ = E[X] = 10 und der Standardabweichung σ = 0,5. Gesucht: i) P(9 <= X <= 11) = P(X <= 11) - P(X <= 9) ii) unteres Quartil u mit der Eigenschaft P(X <= u) = 0,25 iii) oberes Quantil o mit der Eigenschaft P(X <= o) = 0,75 Berechnung: i) mit Excel-Funktion NORMVERT(x; Mittelwert; Standabwn; Kumuliert) P(X <= x) = NORMVERT(x; Mittelwert;Standabwn; 1) P(X <= 11) = NORMVERT(11; 10; 0,5; 1) = 0,9772 P(X <= 9) = NORMVERT(9; 10; 0,5; 1) = 0,0228 Zu erwartender Anteil P(9 <= X <= 11) = 0,9545 Ergebnis: Es können mehr als 95% der Präparate zwischen 9mg und 11mg erwartet werden! ii) Das 25%-Quantil ist die Lösung u der Gleichung P(X <= u) =0,25. Berechnung der Quantile der Normalverteilung mit der Excel-Funktion u = NORMINV(0,25;10;0,5) = 9,6628 Das 75%-Quantil ist die Lösung o der Gleichung P(X <= o) =0,75. o = NORMINV(0,75;10;0,5) = 10,3372

4 W. Timischl: Statistische Modellbildung mit Excel 4 Interquartilabstand IR = o - u = 0,6745 P(X < µ-2xir)=normvert(µ-2xir;µ;σ;1) = 0,0035 P(X <µ 2xIR oder X > µ+2xir) = 0,70% Ergebnis: Nur 0,7% der Präparate sind mit einer Masse außerhalb der zweifachen Interquartilabstandes um den Mittelwert zu erwarten! iii) Den Wert f(x) der Dichtefunktion der N(µ, σ 2 )-Verteilung an der Stelle x erhält man mit der Excel- Funktion NORMVERT(x;Mittelwert; Standabwn; Kumuliert) mit Mittelwert = µ, Standabn = σ und Kumuliert = 0 (FALSCH). Wertetabelle: x f(x) 8,00 0, ,25 0, ,50 0, ,75 0, ,00 0, ,25 0, ,50 0, ,75 0, ,00 0, ,25 0, ,50 0, ,75 0, ,00 0, ,25 0, ,50 0, ,75 0, ,00 0, ,9 0,8 0,7 0,6 0,5 0,4 0,3 0,2 0,1 0,0 Werte der Normalverteilung mit m=10 und s =0, x

5 W. Timischl: Statistische Modellbildung mit Excel Eindimensionale Datenbeschreibung und Parameterschätzung Aufgabe 1.3.1: Häufigkeitsverteilung und univariate Statistiken Die Messung der Ozonkonzentration während der Sommermonate ergab für eine Großstadt die in der folgenden Tabelle enthaltenen Werte (Angaben in ppm/100). Man stelle die Verteilung der Ozonkonzentration dar (tabellarisch, grafisch) und berechne den Mittelwert, die Standardabweichung, den Median und die Quartile. Stichprobe: 3,6 1,5 6,6 6,0 4,2 6,7 2,5 5,4 4,5 5,4 2,5 3,0 5,6 4,7 6,5 6,7 1,7 5,3 4,6 7,4 5,4 4,1 5,1 5,6 5,4 6,1 7,6 6,2 6,0 5,5 5,8 8,2 3,1 5,8 2,6 9,5 3,4 8,8 7,3 1,3 6,9 3,2 4,7 3,8 5,9 6,6 4,4 5,7 4,5 7,7 Gesucht: Häufigkeitstabelle, Histogramm, Mittelwert, Standardabweichung, Median und Quartile Häufigkeitsverteilung: i) Bestimmung der Klassenbreite n = ANZAHL(Bereich) = 50 (Bereich = Stichprobe) min = MIN(Bereich) = 1,3 max = MAX(Bereich) = 9,5 Anzahl k d. Klassen = approx. (n) = 7,07 (=) 7 approx. Klassenbreite = (max - min)/k = = 1,16 (=) 1,5 approx. ii) Analyse-Funktionen - Histogramm... (Bereich "Klassengrenzen" müssen vorbereitet werden) Klassengrenzen (bis <=) Klasse Häufigkeit 1,5 1,5 2 3,0 3,0 5 4,5 4,5 10 6,0 6,0 18 7,5 7,5 10 9,0 9,0 4 10,5 10,5 1 und größer 0 Häufigkeit ,5 3,0 4,5 6,0 7,5 9,0 10,5 und größer Ozonkonzentration

6 W. Timischl: Statistische Modellbildung mit Excel 6 Statistiken: Mittelwert = MITTELWERT(Bereich) = 5,21 Standardabweichung = STABW(Bereich) = 1,85 Median = MEDIAN(Bereich) = 5,40 unteres Quartil = QUANTIL(Bereich;0,25) = 4,13 oberes Quartil = QUANTIL(Bereich;0,75) = 6,43 (Bereich = Stichprobe) Aufgabe 1.3.2: Mittelwertschätzung bei normalverteilten Zufallsvariablen Die Sprosshöhe X eine Pflanze sei normalverteilt. Aus einer Stichprobe vom Umfang n = 40 wurden die Schätzwerte 50 und 5 für den Mittelwert bzw. die Standardabweichung ermittelt. Man bestimme zum Niveau 1 - α = 0,95 ein Konfidenzintervall für den Mittelwert µ von X. X ist normalverteilt mit Mittelwert µ und Stanbdradabweichung σ Schätzung von µ und σ aus gegebenen Stichproben Gesucht: 95%iges Konfidenzintervall für µ Lösungsmethoden: i) Approximation für große Stichproben Berechnung mit KONFIDENZ(Alpha;Standabwn;Umfang_S) mit Alpha = 0,05 Standabwn = 5 Umfang_S = 40 (= n) Stichprobenmittelwert = 50 Untere Grenze = Stichprobenmittel - KONFIDENZ(Alpha;Standabwn;Umfang_S) Obere Grenze = Stichprobenmittel + KONFIDENZ(Alpha;Standabwn;Umfang_S) KONFIDENZ(0,05;5;40) = 1,55 Untere Grenze = 48,45 Obere Grenze = 51,55 Hinweis: Die Excel-Funktion KONFIDENZ(Alpha;Standabwn;Umfang_S) liefert die halbe Breite ii) Exakte Rechnung (1 - α/2) -Quantil der t-verteilung mit f = n - 1 = 39 Freiheitsgraden = TINV(Wahrsch;Freiheitsgrade) mit Wahrsch=α (!) und Freiheitsgrade=n-1 = TINV(0,05;39) = 2,0227 Halbe Intervallbreite = s/wurzel(n) x TINV(α;n-1) = s/wurzel(n) x TINV(α;n-1) = 5/WURZEL(40) x TINV(0,05;39) = 1,60 Untere Grenze = Stichprobenmittel - halbe Intervallbreite = 48,40 Obere Grenze = Stichprobenmittel + halbe Intervallbreite = 51,60 Aufgabe 1.3.3: Planung des Stichprobenumfangs bei der Mittelwertschätzung Die Masse X (in mg) einer Substanz in einem Präparat soll absolut auf +/-0,5 genau mit einer Sicherheit von 95% bestimmt werden. Für die Standardabweichung möge die Abschätzung σ<=2 zutreffen. Wieviele Proben müssen untersucht werden, wenn X als normalverteilt vorausgesetzt werden kann? Masse X ist nach Voraussetzung N(µ, σ²)-verteilt mit σ <= 2. σ = 2 Genauigkeit d = 0,5 Sicherheit 1 - α = 0,95 Berechnungen: Quantil z(1 - α/2) = STANDNORMINV(1 - α/2) = 1,96 Mindeststichprobenumfang n >= [σ z(1-α/2)/d]² = 61,46 Hinweis: Einschlägige Software zu Bestimmung von n z.b. nquery Advisor (Statistical Solutions, Cork, Ireland) oder Internet-Calculators z.b. unter Interpretation: Es muß ein Mindeststichprobenumfang von 62 geplant werden, um den Mittelwert auf +/-0,5 genau mit einer Sicherheit von 95% schätzen zu können.

7 W. Timischl: Statistische Modellbildung mit Excel 7 Aufgabe 1.3.4: Schätzung von Wahrscheinlichkeiten In einem Feldversuch werden 60 Blumenzwiebeln ausgesetzt, von denen 36 keimten. i) Es soll die Keimfähigkeit p (d.h. Wahrscheinlichkeit, dass ein ausgesetzter Zwiebel keimt) geschätzt und die Genauigkeit der Schätzung durch ein 95%-Konfidenzintervall belegt werden. ii) Ist die Fallzahl richtig geplant, um den Schätzwert mit einer Sicherheit von 95% auf +/- 0,05 genau schätzen zu können? Anzahl n der Versuche = 60 Anzahl m der erfolgreichen Versuche = 36 p = P(Zwiebel treibt aus) X (Anzahl der Keimlinge) ist binomialverteilt mit den Parametern p und n Gesucht: i) Schätzwert für p, 95%-Konfidenzintervall für p ii) Mindeststichprobenumfang Berechnungen: i) Schätzung von p Anteil h der erfolgr. Zwiebeln=Schätzwert für p = m/n = 0,6 Intervallschätzung i.1) Approximatives 95%-Konfidenzintervall für p Voraussetzungen: n > 20 und 10 <= m <= n-10 Sicherheit 1 - α = 0,95 >> (1-α/2)-Quantil der N(0,1)-Verteilung = STANDNORMINV(1-(1-α)/2) = 1,96 Untere Grenze = h - z(1-α/2) (h(1-h)/n) = 0,4760 Obere Grenze = h + z(1-α/2) (h(1-h)/n) = 0,7240 i.2) Exaktes Intervall mit den Pearson-Clopper-Werten 1-α/2 = 0,975 q 1 = α/2-quantil der F(2m, 2(n-m+1))-Verteil.= FINV(1- α/2;2m;2(n-m+1)) = 0,6046 q 2 = 1- α/2-quantil der F(2(m+1), 2(n-m))-Verteil.= FINV(α/2;2(m+1);2(n-m)) = 1,7048 Hinweis: FINV(α; Freiheitsgr.1; Freiheitsgr. 2) liefert das (1 - α)-quantil! Untere Grenze = m q 1 /(n - m m q 1 ) = 0,4654 Obere Grenze = (m +1) q 2 /(n - m + (m +1) q 2 ) = 0,7244 ii) Mindesstichprobenumfang Normalverteilungsapproximation: Y = X/n ist normalverteilt mit Mittelwert p und Varianz p(1-p)/n Anteil h = 0,6 α = 0,05 z 1-α/2 = 1,960 Genauigkeit d = 0,05 Mindeststichprobenumfang n >= h(1-h) [z(1-α/2)/d]² = 368,78

8 W. Timischl: Statistische Modellbildung mit Excel Ein-Stichprobenvergleiche Aufgabe 1.4.1: Binomialtest Für ein Produkt wird vom Hersteller garantiert, dass der Gehalt einer Substanz mindestens 75% beträgt. In einer Stichprobe von 60 Proben entsprachen 35 der Produktdeklaration. i) Liegt eine signifikante Unterschreitung des garantierten Mindestwertes vor? Man prüfe diese Frage auf dem Signifikanzniveau α = 5%. ii) Welche Fallzahl ist notwendig, um eine Unterschreitung des garantierten Anteils um 0.1 mit einer Sicherheit von 90% feststellen zu können? X = Anzahl der "entsprechenden" Proben ist binomialverteilt mit den Parametern n = 60 p o = 0,75 m = 35 (Realisation von X) i) Test auf signifikante Unterschreitung Hypothesen: Ho: p >= p ο = 0,75 vs. H1: p < p ο = 0,75 Lösungsvariante 1: Exakte Rechnung Berechnung: P-Wert = P(X <= m n, p=p o ) = BINOMVERT(m;n;p o ;1) = 0, Entscheidung: P-Wert < α = 0,05 >> Ho ablehnen! Lösungsvariante 2: Normalverteilungsapproximation Voraussetzungen: n > 20 und 10 <= np o <= n-10 Berechnung: µ = np ο = 45 σ = [np(1-p ο )] = 3,3541 Z = (X - µ)/σ ist standardnormalverteilt >> approx. P-Wert = P(Z < (m-µ)/σ)) = STANDNORMVERT((m-µ)/σ) = = 0, Entscheidung: P-Wert < α = 0,05 >> Ho ablehnen! Hinweis: Bessere Approximationen erreicht man mit der sog. Stetigkeitskorrektur, nach der der Zahl x das Intervall (x-0,5; x+0,5) entspricht. In der Formel ist demnach m durch m+0,5 zu ersetzen. Dies ergibt: approx. P-Wert = P(Z < (m+0,5-µ)/σ)) = STANDNORMVERT((m+0,5-µ)/σ) = 0, (mit dieser Approximation arbeitete z.b. SPSS, Version 8) ii) Planung des Stichprobenumfangs (Normalverteilungsapproximation): Vorgaben: α = 0,05 β = 0,10 = 0,10 p o = 0,75 Berechnung: Quantile der Standardnormalverteilung: z(1 - a) = STANDNORMINV(1 - α) = 1,645 z(1 - β) = STANDNORMINV(1 - β) = 1,282 Abschätzung für n: n>= (1/ ²)[z(1-α) (p ο (1-p ο )) + z(1-β) ((p ο )(1-p ο + ))]² 175,2 (ohne Stetigkeitskorrektur) Hinweis auf einschlägige Software: z.b. nquery Advisor (Statistical Solutions, Cork, Ireland) oder "Internet Calculators" (z.b. )

9 W. Timischl: Statistische Modellbildung mit Excel 9 Aufgabe 1.4.2: Einstichproben - t-test Die Verpackung einer bestimmten Zigarettensorte weist einen mittleren Nikotingehalt von 15 mg pro Zigarette aus. Es wird eine Zufallsstichprobe von 100 Zigaretten getestet. Dabei ergab sich ein mittlerer Nikotingehalt von 16.5 mg und eine Standardabweichung von 4 mg. Kann aus dem Ergebnis der Stichprobe auf 1%igem Signifikanzniveau der Schluss gezogen werden, dass der tatsächliche Nikotingehalt im Mittel über 15 mg liegt? Daten: Sollwert µ ο = 15 Stichprobenmittelwert m = 16,5 Standardabweichung s = 4 Stichtpobenumfang n = 100 Verteilungsvoraussetzung: X = Nikotingehalt ist N(µ, σ²)-verteilt mit µ = µ ο Hypothesen: Ho: µ <= µο = 15 vs. H1: µ > µο = 15 Berechnung: Entscheidung: Testgröße: TG = [(M - µο)/s] (n) ist t-verteilt mit f = n - 1 Freiheitsgraden TG(s) = (m - µ ο )/s (n) = 3,75 P-Wert: P = P(TG > TG(s) µ=µo) =TVERT(x;Freiheitsgrade;Seiten) = 0, [x = TG(s), Freiheitsgrade = n - 1, Seiten = 1 (1-seitige Ausläuferfläche)] Hinweis: x darf in TVERT(x;Freiheitsgrade;Seiten) nicht negativ sein! P-Wert < α = 0,01 >> Ho ablehnen! Hinweis: TVERT(x;Freiheitsgrade;Seiten) liefert für Seiten=1 die "Überschreitungswahrscheinlichkeit" P(X > x) (!) Aufgabe 1.4.3: Planung des Stichprobenumfangs beim Einstichproben - t-test Es sei X eine normalverteilte Umweltmessgröße mit dem (unbekannten) Mittelwert µ und der Standardabweichung σ = 10. Mit Hilfe einer Stichprobe soll geprüft werden, ob eine Überschreitung des Grenzwertes K vorliegt, wobei das α- Risiko mit 5% vorgegeben ist und eine kritische Überschreitung von 6.5 mit 90%iger Sicherheit erkannt werden soll. Welcher Stichprobenumfang ist zu planen? Berechnung: Gegeben: σ = 10 α-fehler α = 0,05 Power 1-β = 0,90 krit.abw. = 6,50 Modell: X = Umweltmessgröße ist N(µ, σ²)-verteilt Hypothesen: Ho: µ <= K vs. H1: µ > K Voraussetzung: Normalverteilungsapproximation Quantile: z(1 - α) = STANDNORMINV(1 - α) = 1,645 z(1 - β) = STANDNORMINV(1 - β) = 1,282 Abschätzformel: n >= (σ/ )² [z(1-α) + z(1-β)]² = 20,27 Hinweis auf einschlägige Software: z.b. nquery Advisor (Statistical Solutions, Cork, Ireland) oder "Internet Calculators" (z.b. )

10 W. Timischl: Statistische Modellbildung mit Excel 10 Aufgabe 1.4.4: Chiquadrat-Test zur Anpassungsprüfung Bei einem seiner Kreuzungsversuche mit Erbsen erhielt Mendel 315 runde gelbe Samen, 108 runde grüne, 101 kantige gelbe und 32 kantige grüne. Sprechen die Beobachtungswerte gegen das theoretische Aufspaltungsverhältnis der Phänotypen von 9 : 3 : 3 : 1? Man wähle als Signifikanzniveau α = 5%. Modell: X (Phänotyp) ist eine 4-stufige Zufallsvariable mit den Werten x1 = rund/gelb, x2 = rund/grün, x3 = kantig/gelb, x4 = kantig/grün und der theoretischen Verteilung p1 = P(X = x1), p2 = P(X = x2), p3 = P(X = x3), p4 = P(X = x4). Stichprobenumfang: n = = 556 Hypothesen: Ho: Wahrscheinlichkeiten p1 = 9/16 = 0,5625 p2 = 3/16 = 0,1875 p3 = 3/16 = 0,1875 p4 = 1/16 = 0,0625 bzw. erwartete Häufigkeiten E1=556x9/16= 312,75 E2=556x3/16= 104,25 E3=556x3/16= 104,25 E4=556x1/16= 34,75 H1: X weicht von den theoretischen Wahrscheinlichkeiten bzw. erwarteten Häufigkeiten ab. Berechnung: Testgröße: GF = Σ(O - E)²/E erw.häufigk. beob.häufigk. (E-O)²/E Klassen E O rund/gelb 312, ,0162 rund/grün 104, ,1349 kantig/gelb 104, ,1013 kantig/grün 34, , ,4700 = GF(s) P-Wert: P = P(GF > GF(s)) = CHIVERT(x;Freiheitsgrade) = 0,9254 (mit x = GF(s) und Freiheitsgrade FG = Anz.d.Klassen - 1) Entscheidung: P-Wert >= α = 0,05 >> Ho kann nicht abgelehnt werden! Hinweis: CHIVERT(x;Freiheitsgrade) liefert die "Überschreitungswahrscheinlichkeit" P(X > x) (!)

11 W. Timischl: Statistische Modellbildung mit Excel Zwei-Stichprobenvergleiche I: Paarvergleiche Aufgabe 1.5.1: t-test für abhängige Stichproben Die folgende Tabelle zeigt die Änderung des (systolischen) Blutdrucks (in mm Hg) bei zehn einer gewissen Behandlung unterworfenen Patienten. X_b und X_e bezeichnen die Blutdruckwerte am Beginn bzw. am Ende der Behandlung. i) Gibt es einen signifikanten Behandlungseffekt? ii) Welcher Stichprobenumfang muss geplant werden, um einen Effekt in der Größe von 25% der Änderung der Stichprobenmittelwerte mit einer Sicherheit von 90% feststellen zu können (α = 5%)? Daten: X_b X_e >> Differenzstichprobe >> D=X_b - X_e Statistiken der Differenzstichprobe (Bereich = Differenzstichprobe): Stichpr.umfang n = ANZAHL(Bereich) = 10 Mittelwert=m D =MITTELWERT(Bereich) = 16,70 Standardabweich. s=stabw(bereich) = 9,776 Der Effekt wird als Differenz D des Beginn- und des Endwertes dargestellt. Damit ergibt sich ein 1- Stichprobenproblem mit der Differenz D als Zielvariable. Diese wird als N(µ, σ²)-verteilt angenommen. Teilaufgabe i) Test auf signifikante Abweichung Hypothesen: H0: µ = µο = 0 vs. H1: µ <> µο = 0 Berechnung: Testgröße: TG(s) = [(m D - µo)/s] n = 5,4021 P-Wert: P = 2 P(TG < TG(s) ) = TVERT(x;Freiheitsgrade;Seiten) = 0, [x=tg(s), Freiheitsgrade=n-1, Seiten=2 (2-seitige Ausläuferfläche)] Hinweis: x darf in TVERT(x;Freiheitsgrade;Seiten) nicht negativ sein! Entscheidung: P-Wert < α = 0,05 >> H1, d.h., Behandlungseffekt ist signifikant! Teilaufgabe ii) Berechnung: Planung des Stichprobenumfanges Gegeben: σ = s = 9,776 α-fehler α = 0,05 Power 1-β = 0,90 krit.abw. = 4,175 (=0,25x m D ) Hypothesen: H0: µ = µο = 0 vs. H1: µ <> µο = 0 Voraussetzung: Normalverteilungsapproximation Quantile: z(1 - α/2) = STANDNORMINV(1 - α/2) = 1,960 z(1 - β) = STANDNORMINV(1 - β) = 1,282 Abschätzformel: n >= (σ/ )² [z(1-α/2) + z(1-β)]² = 57,6 Hinweis auf einschlägige Software: z.b. nquery bzw. Internet Calculators (www.stat.ucla.edu )

12 W. Timischl: Statistische Modellbildung mit Excel 12 Aufgabe 1.5.2: Vorzeichentest für abhängige Stichproben Zur Prüfung der Wirksamkeit eines Präparates wurde u.a. Die Zielvariable "Kopfschmerz" auf einer 3-stufigen Skala mit den Werten 1 (nicht vorhanden), 2 (leicht ausgeprägt) und 3 (deutlich ausgeprägt) am Beginn (Variable X 1 ) und am Ende (Variable X 2 ) der Behandlung an 22 Personen erhoben. Es soll mit dem Vorzeichentest auf dem 5%-Niveau geprüft werden, ob der Anteil der Personen mit einer Verbesserung signifikant größer als 0.5 ist. Daten: Kopfschmerz Kopfschmerz/Ende X 2 Beginn X 1 1 (nicht v.) 2 (leicht) 3 (deutlich) Bei = 14 Probanden ist X 2 < X 1, d.h. es ist eine Verbesserung eingetreten. Bei 1 Probanden kam es zu einer Verschlechterung, bei = 7 trat keine Änderung ein. Indem eine Bindung (Fall ohne Änderung) weggelassen und die restlichen 6 je zur Hälfte zur Kategorie "Verbesserung" bzw. "Verschlechterung" gezählt wird, ergibt sich als Anzahl Y von Personen mit einer Verbesserung der Stichprobenwert x = 14+3=17. Die Anzahl Y ist binomialverteilt mit den Parametern p (=Wahrscheinlichkeit, dass bei einem Probanden eine Verbesserung eintritt) und n = 21 (ein Fall wurde weggelassen). n = 21 p 0 = 0,5 m = 17 (Realisation von Y) Hypothesen: H 0 : p <= p o = 1/2 vs. H 1 : p > 1/2 Lösungsvariante 1: Exakte Rechnung Berechnung: P-Wert = P(Y >= m n, p=p 0 ) = 1 - P(Y<m n, p=p 0 ) = 1 - BINOMVERT(m-1;n;p 0 ;1) = = 0, Entscheidung: P-Wert < α = 0,05 >> H1 Lösungsvariante 2: Normalverteilungsapproximation Voraussetzungen: n > 20 und 10 <= np o <= n-10 Berechnung: µ = np 0 = 10,5 σ = [np(1-p ο )] = 2,2913 Z = (X - µ)/σ ist standardnormalverteilt >> approx. P-Wert = P(Z >= (m-µ)/σ)) = 1- P(Z < (m-µ)/σ) = 1- STANDNORMVERT((m-µ)/σ) = 0, Entscheidung: P-Wert < α = 0,05 >> H1 Hinweis: Bessere Approximationen erreicht man mit der sog. Stetigkeitskorrektur, nach der der Zahl x das Intervall (x-0,5; x+0,5) entspricht. In der Formel ist demnach m durch m-0,5 zu ersetzen. Dies ergibt: approx. P-Wert = 1-P(Z < (m-0,5-µ)/σ)) = 1 - STANDNORMVERT((m-0,5-µ)/σ) = 0, (mit dieser Approximation arbeitete z.b. SPSS, Version 8)

13 W. Timischl: Statistische Modellbildung mit Excel 13 Aufgabe 1.5.3: Änderungsmessung mit dem McNemar-Test In einer Studie wurde u.a. das Ges. Eiweiß i.s. am Beginn und am Ende bestimmt. Es ergab sich, dass bei 32 Probanden der Eiweißwert vor und nach Ende der Studie im Normbereich lag, bei 22 Probanden lag der Wert vorher im Normbereich und nachher außerhalb, bei 9 Probanden vorher außerhalb und nachher im Normbereich und bei 7 vorher und nachher außerhalb des Normbereichs. Hat sich während der Studie eine signifikante Änderung hinsichtlich des Normbereichs ergeben (α = 5%)? Daten: Berechnung: Entscheidung: Ende Beginn innerh. (+) außerh. (-) innerh. (+) 32 (a) 22 (b) außerh. (-) 9 (c) 7 (d) Jede der b+c Veränderungen wird durch ein Zufallsexperiment mit zwei Ausgängen (Änderung von + nach - bzw. von - nach +) simuliert. Es finden b+c Wiederholungen statt. Jede Wiederholung führt mit der Wahrscheinlichkeit p + - von + nach -. b = 22 c = 9 Hypothesen: H o : p + _ = 1/2 vs. H 1 : p + _ <> 1/2 Näherungsrechnung (Voraussetzung: b+c>20) Testgröße: TG = ( b - c -1) 2 /(b+c) ist näherungsweise Chiquadrat-verteilt mit einem Freiheitsgrad TG(s) = 4,645 P-Wert: P = P(GF > GF(s)) = CHIVERT(x;Freiheitsgrade) = 0,03114 (mit x = GF(s) und Freiheitsgrade = 1) P-Wert < α = 0,05 >> H1 Aufgabe 1.5.4: Gleichwertigkeit von Mittelwerten In einer Bioverfügbarkeitsstudie wurden 7 Probanden zeitlich hintereinander ein Testpräparat (t) und ein Kontrollpräparat (k) verabreicht; die Zuordnung der Präparatsequenzen tk bzw. kt erfolgte zufällig. Die Zielvariable ist die Halbwertszeit X t bzw. X k (in h) für die Elimination des jeweiligen Wirkstoffes aus dem Blut. Es ergaben sich die folgenden Wertepaare für (X t, X k ): (1.50, 1.95), (1.92, 2.05), (1.43, 2.46), (1.68, 2.88), (1.97, 2.52), (2.01, 1.80), (1.85, 2.03). i) Äquivalenzprüfung: Man prüfe, ob Gleichwertigkeit hinsichtlich der mittleren Halbwertszeiten besteht; die Wirkstoffe mögen als gleichwertig gelten, wenn sich die mittleren Halbwertszeiten um weniger als 20% des Kontrollmittels unterscheiden. ii) Wirksamkeitsprüfung: Ferner prüfe man, ob zwischen den mittleren Halbwertszeiten ein signifikanter Unterschied besteht. In beiden Fällen sei α = 5% vereinbart. Daten: X t X k >> Differenzstichprobe >> D=X t - X k 1,50 1,95-0,45 1,92 2,05-0,13 1,43 2,46-1,03 1,68 2,88-1,20 1,97 2,52-0,55 2,01 1,80 0,21 1,85 2,03-0,18 Statistiken der Differenzstichprobe (Bereich = Differenzstichprobe): Stichprobenumfang = ANZAHL(Bereich ) = 7 Mittelwert = m D = MITTELWERT(Bereich) = -0,4757 Standardabweichung s D = STABW(Bereich) = 0,5025 Der Effekt wird als Differenz D des Test- und des Kontrollwertes dargestellt. Damit ergibt sich ein 1-Stichprobenproblem mit der Differenz D als Zielvariable. Diese wird als N(µ, σ²)-verteilt angenommen.

14 W. Timischl: Statistische Modellbildung mit Excel 14 Teilaufgabe i) Hypothesen: Äquivalenzprüfung H 0 : µ t - µ k >= versus H 1 : µ t µ k < Toleranzintervall (-, + ): Mittelwert der Kontroll-Stichprobe = 2,2414 Toleranzgrenze =20% v. X k -Mittelwert= 0,4483 Berechnung: Entscheidungskriterium von Westlake: H 0 wird auf Testniveau α abgelehnt, wenn das (1-2α)-Konfidenzintervall [u, o] für den Mittelwert m der Differenzstichprobe im Toleranzintervall (-, + ) enthalten ist. SE = s D / (n) = 0,190 t(n-1,1-2α) = t(6, 0.9) = 1,943 u = m D - t(n-1,1-2α) = -0,8448 o = m D + t(n-1,1-2α) = -0,1066 Entscheidung: [u, o] nicht enthalten in (-, + ) >> H 0 (Nichtgleichwertigkeit) kann nicht abgelehnt werden Teilaufgabe ii) Wirksamkeitsprüfung Hypothesen: H 0 : µ = µ t - µ k = 0 versus H 1 : µ = µ t µ k <> 0 Berechnung: Testgröße: TG = [(m D - 0)/S] n ist t-verteilt mit f = n - 1 Freiheitsgraden TG(s) = -2,505 P-Wert: P = 2 P(TG < TG(s) ) = TVERT(x;Freiheitsgrade;Seiten) = TVERT(x;n-1;2) = 0,04624 [x = TG(s), Freiheitsgrade = n-1, Seiten = 2 (2-seitige Ausläuferfl.)] Hinweis: x darf in TVERT(x;Freiheitsgrade;Seiten) nicht negativ sein! Entscheidung: P-Wert < α = 0,05 >> H1, d.h. der Behandlungseffekt ist signifikant

15 W. Timischl: Statistische Modellbildung mit Excel Zwei-Stichprobenvergleiche II: Parallelversuche Aufgabe 1.6.1: Vergleich von zwei Varianzen (F-Test) Im Rahmen einer Bioäquivalenzstudie wurde die Halbwertszeit (in Stunden) für die Elimination eines Testpräparats bestimmt an 12 Versuchspersonen bestimmt. Zum Vergleich wurde eine Kontrollgruppe mit 12 weiteren Personen gebildetet und die Halberwertszeiten für ein Kontrollpräparat ermittelt. Es ergaben sich die in der folgenden Tabelle angeführten Werte. Man prüfe auf 5%igem Testniveau, ob sich die Stichprobenvarianzen signifikant voneinander unterscheiden. Daten: Lösung: Variante 1: Variante 2: Halbwertszeit X t (Testpräp.) X k (Kontrollpr.) 2,45 3,25 1,92 2,48 2,62 3,94 1,56 2,26 2,17 1,95 2,76 3,00 2,89 2,85 2,40 1,97 1,41 2,03 2,09 1,95 1,81 1,52 Statistiken: 1,68 1,87 n = Mittelwert= 2,1467 2,4225 STD= 0,4845 0,7044 Varianz= 0,2347 0,4962 Die Variablen Xt und X k werden als N(µ t, σ t ²)- bzw. N(µ t, σ t ²)-verteilt angenommen. Hinweis: Der F-Test ist wenig robust gegenüber Abweichungen von der Normalitätsvoraussetzung! Hypothesen: Ho: σ 2 t = σ 2 k vs. H1: σ 2 2 t <> σ k Explizite Berechnung: Testgröße: TG = Sk²/St² ist F-verteilt mit dem ersten Freiheitsgrad (FG1) nk - 1 (Freiheitsgrad der Zählervarianz) und dem zweiten Freiheitsgrad (FG2) nt - 1 (Freiheitsgrad der Nennervarianz) TG(s) = 2,1141 P-Wert: P = 2 P(TG>TG(s)) = 2*FVERT(x:FG1; FG2) = 0,2301 (mit x = TG(s), FG1 = nk - 1, FG2 = nt - 1) Entscheidung: P-Wert >= α = 0,05 >> Ho (Varianzhomogenität) wird beibehalten! Hinweis: FVERT(x;Freiheitsgrad1;Freiheitsgrad2) liefert die "Überschreitungswahrscheinlichkeit" P(X > x) (!) Berechnung mit der Excel-Funktion FTEST: P-Wert: P = 2 P(TG > TG(s)) = FTEST(Bereich1;Bereich2) = = 0,2301 (Bereich1,2 = Bereich der X t - bzw. X k -Stichprobe)

16 W. Timischl: Statistische Modellbildung mit Excel 16 Variante 3: Berechnung mit der Prozedur "Zwei-Stichproben F-Test" Hinweis: Diese Prozedur steht unter "Extras - Analyse-Funktionen" zur Verfügung und setzt eine Anordnung der Stichproben in Spalten bzw. Zeilen voraus! Variable 1 Variable 2 Mittelwert 2,4225 2,1467 Varianz 0,4962 0,2347 Beobachtungen Freiheitsgrade (df) Prüfgröße (F) 2,1141 P(F<=f) einseitig 0,1150 *) Kritischer F-Wert bei einseitigem Test 2,8179 Aufgabe 1.6.2: Vergleich von zwei Mittelwerten (Welch-Test, 2-Stichproben t-test) Im Rahmen einer Bioäquivalenzstudie wurde die Halbwertszeit (in Stunden) für die Elimination eines Testpräparats bestimmt an 12 Versuchspersonen bestimmt. Zum Vergleich wurde eine Kontrollgruppe mit 12 weiteren Personen gebildetet und die Halberwertszeiten für ein Kontrollpräparat ermittelt. i) Man prüfe auf 5%igem Testniveau, ob sich die Stichprobenmittelwerte voneinander signifikant unterscheiden. ii) Bei nicht-signifikantem Ausgang bestimme man den notwendigen Mindeststichprobenumfang, um die beobachtete Mittelwertdifferenz mit einer Sicherheit von 90% als signifikant erkennen zu können. Daten: (wie Aufg.1.6.1) *) Hinweis: Hier wird die Wahrscheinlichkeit angegeben, mit der die Realisation der Testgröße (=Prüfgröße) überschritten wird. Zur Testentscheidung ist die Überschreitungswahrscheinlichkeit mit α/2 zu vergleichen! Halbwertszeit X t (Testpräp.) X k (Kontrollpr.) 2,45 3,25 1,92 2,48 2,62 3,94 1,56 2,26 2,17 1,95 2,76 3,00 2,89 2,85 2,40 1,97 1,41 2,03 2,09 1,95 1,81 1,52 Statistiken: 1,68 1,87 n = (n t, n k ) Mittelwert= 2,1467 2,4225 (m t, m k ) STD= 0,4845 0,7044 (s t, s k ) Varianz= 0,2347 0,4962 Die Variablen X t (=Halbwertszeit/Testpräparat) und X k (=Halbwertszeit/Kontrollopräparat) sind N(µt, σt²)- bzw. N(µk, σk²)-verteilt. Hypothesen: Ho: µt = µκ vs. H1: µτ <> µk i) Prüfung auf signifikanten Unterschied der Mittelwerte Methode 1: Vergleich der Mittelwerte mit dem Welch-Test (ohne Kenntnis der Gleichheit der Varianzen) Lösungsvariante 1: Explizite Berechnung Freiheitsgrade: FG = (st²/n t + sk² /n k ) 2 / [(s t ²/n t ) 2 /(n t -1) + (s k ²/n k ) 2 /(n k -1)] = 19,5038 Testgröße: TG(s) = (m t - m k )/ [ (st²/n t + sk² /n k ] -1,1176 P-Wert: P = P(TG < - TG(s) ) + P(TG > TG(s) ) = TVERT(x;Freiheitsgrade;Seiten) = 0,2770 *) [mit x= TG(s), Freiheitsgrade = FG+0,5 und Seiten = 2] *) Beachte: TVERT rundet bei nicht ganzem FG auf die nächstkleinere ganze Zahl ab! Entscheidung: P-Wert >= α = 0,05 >> Ho (Gleicheit der Mittelwerte) kann nicht abgelehnt werden!

17 W. Timischl: Statistische Modellbildung mit Excel 17 Lösungsvariante 2: Berechnung mit der Excel-Funktion TTEST P-Wert: P = TTEST(Matrix1;Matrix2;Seiten;Typ) Es bedeuten: Matrix1 = Bereich der ersten Stichprobe (Bereich1, Testpräparat) Matrix2 = Bereich der zweiten Stichprobe (Bereich2, Kontrollpräparat) Seiten = 1 bei 1-seitigen Hypothesen 2 bei 2-seitiger Hypothese Typ = 1 bei abhängigen Stichproben 2 bei unabhängigen Stichproben gleicher Varianz 3 bei unabhängigen Stichproben ungleicher Varianz Für die betrachtete Aufgabe gilt: Matrix1 = Bereich1, Matrix2 = Bereich2, Seiten = 2, Typ = 3, also P = TTEST(Bereich1;Bereich2;2;3) = 0,2773 Lösunsvariante 3: Berechnung mit der Prozedur "Zwei-Stichproben t-test: Unterschiedliche Varianzen" Hinweis: Diese Prozedur steht unter "Extras - Analyse-Funktionen" zur Verfügung und setzt eine Anordnung der Stichproben in Spalten bzw. Zeilen voraus! Variable 1 Variable 2 Mittelwert 2,1467 2,4225 Varianz 0,2347 0,4962 Beobachtungen Hypothetische Differenz der Mittelwerte 0 Freiheitsgrade (df) 20 *) t-statistik -1,1176 P(T<=t) einseitig 0,1385 Kritischer t-wert bei einseitigem t-test 1,7247 P(T<=t) zweiseitig 0,2770 **) Kritischer t-wert bei zweiseitigem t-test 2,0860 *) Freiheitsgrade werden gerundet. **) Entscheidung: P(zweiseitig) >= α = 5%>> H0 kann nicht abgelehnt werden! Methode 2: Vergleich der Mittelwerte mit dem 2-Stichproben - t-test Voraussetzung: Es liegt Varianzhomogenität vor! Vortest: Prüfung auf Varianzungleichheit (Varianzinhomogenität) mit dem F-Test Hypothesen: Ho: σ1² = σ2² vs. H1: σ1² <> σ2² Entscheidung: Annahme gleicher Varianzen (H0) kann nicht falsifiziert werden! (siehe Aufgabe 1.6.1) Haupttest: Vergleich der Mittelwerte mit dem Zwei-Stichproben t-test: Lösungsvariante 1: Explizite Berechnung Gewichtete Varianz: sp² = [(nt-1)st² + (nk-1)sk²]/(nt+nk-2) = 0,3655 sp = (sp²) = 0,6046 Testgröße: TG(s) = (mt - mk)/[sp (1/nt + 1/nk)] = -1,1176 P-Wert: P = P(TG < - TG(s) )+ P(TG > TG(s) ) = TVERT(x;Freiheitsgrade;Seiten) = 0,2758 [x= TG(s), Freiheitsgrade = nt+ nk - 2 und Seiten = 2] Entscheidung: P-Wert >= α = 0,05 >> Ho (Gleichheit der Mittelwerte) kann nicht abgelehnt werden!

18 W. Timischl: Statistische Modellbildung mit Excel 18 Lösungsvariante 2: Berechnung mit der EXCEL Funktion TTEST P-Wert: P = TTEST(Matrix1;Matrix2;Seiten;Typ) Es bedeuten: Matrix1 = Bereich der ersten Stichprobe (Bereich1, Testpräparat) Matrix2 = Bereich der zweiten Stichprobe (Bereich2, Kontrollpräparat) Seiten = 1 bei 1-seitigen Hypothesen 2 bei 2-seitiger Hypothese Typ = 1 bei abhängigen Stichproben 2 bei unabhängigen Stichproben gleicher Varianz 3 bei unabhängigen Stichproben ungleicher Varianz Für die betrachtete Aufgabe gilt: Matrix1 = Bereich1, Matrix2 = Bereich2, Seiten = 2, Typ = 2, also P = TTEST(Bereich1;Bereich2;2;2) = 0,2758 Lösungsvariante 3: Berechnung mit der Prozedur "Zwei-Stichproben t-test: Gleiche Varianzen" Hinweis: Diese Prozedur steht unter "Extras - Analyse-Funktionen" zur Verfügung und setzt eine Anordnung der Stichproben in Spalten bzw. Zeilen voraus! Variable 1 Variable 2 Mittelwert 2,1467 2,4225 Varianz 0,2347 0,4962 Beobachtungen Gepoolte Varianz 0,3655 Hypothetische Differenz der Mittelwerte 0 Freiheitsgrade (df) 22 t-statistik -1,1176 P(T<=t) einseitig 0,1379 Kritischer t-wert bei einseitigem t-test 1,7171 P(T<=t) zweiseitig 0,2758 *) Kritischer t-wert bei zweiseitigem t-test 2,0739 *) Entscheidung: P(zweiseitig) >= α = 5% >> H0 kann nicht abgelehnt werden! ii) Planung des Stichprobenumfanges n = n t = n k Gegeben: α-fehler α = 0,05 Power 1-β = 0,90 krit.abw. = m t - m k = 0,2758 σ = s p = 0,6046 Berechnung (Normalverteilungsaproximation): z(1 - α/2) = STANDNORMINV(1 - α/2) = 1,960 z(1 - β) = STANDNORMINV(1 - β) = 1,282 n >= 2(σ/ )² [z(1-α/2) + z(1-β)]² = 100,95 Ergebnis: Aus dem nicht-signifikanten Testausgang kann nicht der Schluss gezogen werden, dass H0 (Gleichheit der Mittelwerte) gilt. Planung des Versuchs ist unzureichend! Aufgabe 1.6.3: Vergleich zweier Anteile Im Rahmen einer Untersuchung des Ernährungsstatus von Schulkindern aus Oberösterreich und der Steiermark wurde u.a. das Gesamtcholesterin (in mg/dl) stichprobenartig erfasst (siehe nachfolgende Tabelle). Man prüfe auf 5%igem Niveau, ob sich die Schüleranteile in der optimalen Kategorie zwischen den Bundesländern signifikant unterscheidet. Daten: U-Merkm. X 1 Gliederungsmerkmal X 2 Summe Gesamtchol. OÖ St <170 (opt.) 93 (n 11 ) 42 (n 12 ) n 1. = 135 >=170(Risik.) 52 (n 21 ) 29 (n 22 ) n 2. = 81 Summe n.1 = 145 n.2 = 71 n.. = 216 Die Werte a 1 (opt.) und a 2 (Risik.) des Untersuchungsmerkmals sind Realisationen einer Zweipunktvariablen mit dem Parameter p 1 =P(X 1 =a 1 X 2 =OÖ) in der ersten Stichprobe und dem Parameter p 2 =P(X1=a1 X 2 =St) in der zweiten Stichprobe. Hypothesen: H o : p 1 = p 2 vs. H 1 : p 1 <> p 2

19 W. Timischl: Statistische Modellbildung mit Excel 19 Berechnung: Entscheidung: Methode: Normalverteilungsapproximation bei großen Stichproben Testgröße: TG(s) = (n.. )(n 11 n 22 - n 12 n 21 )/ (n.1 n.2 n 1. n 2. ) = 0,711 P-Wert: P = P(TG < - TG(s) ) + P(TG > TG(s) ) = STANDNORMVERT(- TG(s) )+1-STANDNORMVERT( TG(s) ) = 0,477 P-Wert >= α = 0,05 >> Ho kann nicht abgelehnt werden! Aufgabe 1.6.4: Vergleich zweier Häufigkeitsverteilungen (Homogenitätsprüfung) In einer Studie wurden 33 Personen mit dem Präparat A und 27 Personen mit dem Präparat B behandelt. Der Behandlungserfolg wurde auf einer 3-stufigen Skala mit den Skalenwerten Verbesserung, keine Änderung, Verschlechterung dargestellt. In der Präparatgruppe A gab es 13 Personen mit einer Verbesserung, 13 Personen zeigten keine Veränderung und 7 Personen eine Verschlechterung. Die entsprechenden Häufigkeiten für die Präparatgruppe B sind 6, 16 bzw. 5. Man prüfe, ob der Behandlungserfolg vom Präparat abhängt (α = 5%). Berechnung: Testgröße: Chiquadratsumme GF = Σ(O - E)²/E Die Summe erstreckt sich über alle Zellen der Präparat/Behandlungserfolg-Kombinationen; O und E sind die beobachteten bzw. die unter H0 erwarteten Zellenhäufigkeiten (= Zeilensumme x Spaltensumme/Gesamtsumme). GF ist unter Ho näherungsweise chiquadratverteilt mit FG Freiheitsgraden (FG = um 1 verminderte Anzahl der Skalenstufen). Voraussetzung für die Approximation: alle erwartetn Häufigkeiten >= 1und höchstens 20% von ihnen kleiner als 5. Bestimmung der Realisationen von E: Daten: beobachtete Behandl.- Präparat Häufigk. (O) Erfolg A B Σ (Zeilen) Verbess k.änderung Verschl Σ (Spalten) Σ (Gesamt) Es seien p ia und p ib die Wahrscheinlichkeiten, dass unter Präparat A bzw. B der Behandlungserfolg i (i = Verbesserung, k. Änderung, Verschlechterung) eintritt. Der Behandlungserfolg hängt nicht vom Präparat ab, wenn p ia = p ib für alle i gilt. Die Abhängigkeit des Behandlungserfolgs vom Präparat ist auf dem vorgegebenen Testniveau α nachgewiesen, wenn die Nullhypothese H0: p ia = p ib abgelehnt werden kann. Behandl.- Präparat Erfolg A B Verbess. 10,45 8,55 k.änderung 15,95 13,05 Verschl. 6,6 5,4 GF(s) = = 2,65 P-Wert: P = P(GF > GF(s)) = CHIVERT(x;Freiheitsgrade) = 0,2659 [x = GF(s) = 2,65 und Freiheitsgrade = FG] Entscheidung: P-Wert > α = 0,05>> Ho kann nicht abgelehnt werden!

20 W. Timischl: Statistische Modellbildung mit Excel Korrelation und Regression Aufgabe 1.7.1: Abhängigkeit zwischen mehrstufig skalierten Variablen Die Wirksamkeit einer Behandlung wurde einerseits durch den Probanden (Variable X) und andererseits durch den Prüfarzt (Variable Y) beurteilt. Man beschreibe den Zusammenhang zwischen den Beurteilungen mit einem geeigneten Korrelationsmaß. Wie groß sind die bei einer angenommenen Unabhängigkeit zu erwartenden absoluten Häufigkeiten? Ist die Korrelation signifikant von null verschieden? (α = 5%) Daten: beobachtete Arzt Häufigk. (O) Proband sehr gut gut mäßig Σ (Zeilen) sehr gut gut mäßig Σ (Spalten) (=n) Σ (Gesamt) Berechnung: Es sei p ij = P(X=i und Y=j) die Wahrscheinlichkeit, dass X den Wert i und Y den Wert j aufweist. X und Y variieren voneinander unabhängig, wenn p ij = p i p j mit p i = P(X=i) und p j =P(Y=j) ist. Die Abhängigkeit der Variablen X und Y ist auf dem vorgegebenen Testniveau a nachgewiesen, wenn die Nullhypothese H0: pij = p i p j (für alle i, j) abgelehnt werden kann. Testgröße: Chiquadratsumme GF = Σ(O - E)²/E Die Summe erstreckt sich über alle Zellen der Proband/Arzt-Beurteilungskombinationen. O und E sind die beobachteten bzw. die unter H0 erwarteten Zellenhäufigkeiten (= Zeilensumme x Spaltensumme/Gesamtsumme). GF ist unter Ho näherungsweise chiquadratverteilt mit FG Freiheitsgraden (FG = Produkt der jeweils um 1 verminderten Anzahl der Skalenstufen von X und Y). Voraussetzung für die Approximation: alle erwarteten Häufigkeiten >= 1und höchstens 20% von ihnen kleiner als 5. Bestimmung der Realisationen von E: Arzt Proband sehr gut gut mäßig sehr gut 22,38 16,19 11,43 gut 13,43 9,71 6,86 mäßig 11,19 8,10 5,71 Bestimmung der Realsation von GF: Arzt Proband sehr gut gut mäßig Summe sehr gut 8,287 2,367 4,829 15,483 gut 4,109 4,067 0,190 8,367 mäßig 3,425 0,001 6,914 10,340 34,190 =GF(s) P-Wert: P = P(GF > GF(s)) = CHIVERT(x;Freiheitsgrade) = 0, [x = GF(s) und Freiheitsgrade = FG) Entscheidung: P-Wert < α = 0,05 >> H1 (X und Y sind voneinander abhängig) Cramersche Kontingenzindex V: V = [GF(s)/n/(min(k,m) -1)] = 0,40 (k = Anz. d. Zeilen, m = Anz. d. Spalten in der Kontingenztafel)

9. Schätzen und Testen bei unbekannter Varianz

9. Schätzen und Testen bei unbekannter Varianz 9. Schätzen und Testen bei unbekannter Varianz Dr. Antje Kiesel Institut für Angewandte Mathematik WS 2011/2012 Schätzen und Testen bei unbekannter Varianz Wenn wir die Standardabweichung σ nicht kennen,

Mehr

9. StatistischeTests. 9.1 Konzeption

9. StatistischeTests. 9.1 Konzeption 9. StatistischeTests 9.1 Konzeption Statistische Tests dienen zur Überprüfung von Hypothesen über einen Parameter der Grundgesamtheit (bei einem Ein-Stichproben-Test) oder über die Verteilung einer Zufallsvariablen

Mehr

12. Vergleich mehrerer Stichproben

12. Vergleich mehrerer Stichproben 12. Vergleich mehrerer Stichproben Dr. Antje Kiesel Institut für Angewandte Mathematik WS 2011/2012 Häufig wollen wir verschiedene Populationen, Verfahren, usw. miteinander vergleichen. Beipiel: Vergleich

Mehr

Grundlagen quantitativer Sozialforschung Interferenzstatistische Datenanalyse in MS Excel

Grundlagen quantitativer Sozialforschung Interferenzstatistische Datenanalyse in MS Excel Grundlagen quantitativer Sozialforschung Interferenzstatistische Datenanalyse in MS Excel 16.11.01 MP1 - Grundlagen quantitativer Sozialforschung - (4) Datenanalyse 1 Gliederung Datenanalyse (inferenzstatistisch)

Mehr

Prüfen von Mittelwertsunterschieden: t-test

Prüfen von Mittelwertsunterschieden: t-test Prüfen von Mittelwertsunterschieden: t-test Sven Garbade Fakultät für Angewandte Psychologie SRH Hochschule Heidelberg sven.garbade@hochschule-heidelberg.de Statistik 1 S. Garbade (SRH Heidelberg) t-test

Mehr

Profil A 49,3 48,2 50,7 50,9 49,8 48,7 49,6 50,1 Profil B 51,8 49,6 53,2 51,1 51,1 53,4 50,7 50 51,5 51,7 48,8

Profil A 49,3 48,2 50,7 50,9 49,8 48,7 49,6 50,1 Profil B 51,8 49,6 53,2 51,1 51,1 53,4 50,7 50 51,5 51,7 48,8 1. Aufgabe: Eine Reifenfirma hat für Winterreifen unterschiedliche Profile entwickelt. Bei jeweils gleicher Geschwindigkeit und auch sonst gleichen Bedingungen wurden die Bremswirkungen gemessen. Die gemessenen

Mehr

Fragestellungen der Schließenden Statistik

Fragestellungen der Schließenden Statistik Fragestellungen der Schließenden Statistik Bisher: Teil I: Beschreibende Statistik Zusammenfassung von an GesamtheitM N {e,,e N } erhobenem Datensatz x,,x N durch Häufigkeitsverteilung und Kennzahlen für

Mehr

Statistik im Bachelor-Studium der BWL und VWL

Statistik im Bachelor-Studium der BWL und VWL Max C. Wewel Statistik im Bachelor-Studium der BWL und VWL Methoden, Anwendung, Interpretation Mit herausnehmbarer Formelsammlung ein Imprint von Pearson Education München Boston San Francisco Harlow,

Mehr

Grundlagen der Inferenzstatistik: Was Ihnen nicht erspart bleibt!

Grundlagen der Inferenzstatistik: Was Ihnen nicht erspart bleibt! Grundlagen der Inferenzstatistik: Was Ihnen nicht erspart bleibt! 1 Einführung 2 Wahrscheinlichkeiten kurz gefasst 3 Zufallsvariablen und Verteilungen 4 Theoretische Verteilungen (Wahrscheinlichkeitsfunktion)

Mehr

8. Methoden der klassischen multivariaten Statistik

8. Methoden der klassischen multivariaten Statistik 8. Methoden der klassischen multivariaten Statistik 8.1. Darstellung von Daten Voraussetzungen auch in diesem Kapitel: Grundgesamtheit (Datenraum) Ω von Objekten (Fällen, Instanzen), denen J-Tupel von

Mehr

Einfache Statistiken in Excel

Einfache Statistiken in Excel Einfache Statistiken in Excel Dipl.-Volkswirtin Anna Miller Bergische Universität Wuppertal Schumpeter School of Business and Economics Lehrstuhl für Internationale Wirtschaft und Regionalökonomik Raum

Mehr

90-minütige Klausur Statistik für Studierende der Kommunikationswissenschaft

90-minütige Klausur Statistik für Studierende der Kommunikationswissenschaft Prof. Dr. Helmut Küchenhoff SS08 90-minütige Klausur Statistik für Studierende der Kommunikationswissenschaft am 22.7.2008 Anmerkungen Überprüfen Sie bitte sofort, ob Ihre Angabe vollständig ist. Sie sollte

Mehr

Übungsserie Nr. 10 mit Lösungen

Übungsserie Nr. 10 mit Lösungen Übungsserie Nr. 10 mit Lösungen 1 Ein Untersuchungsdesign sieht einen multivariaten Vergleich einer Stichprobe von Frauen mit einer Stichprobe von Männern hinsichtlich der Merkmale X1, X2 und X3 vor (Codierung:

Mehr

Bachelorabschlussseminar Dipl.-Kfm. Daniel Cracau

Bachelorabschlussseminar Dipl.-Kfm. Daniel Cracau 1 Einführung in die statistische Datenanalyse Bachelorabschlussseminar Dipl.-Kfm. Daniel Cracau 2 Gliederung 1.Grundlagen 2.Nicht-parametrische Tests a. Mann-Whitney-Wilcoxon-U Test b. Wilcoxon-Signed-Rank

Mehr

Beispiel: Sonntagsfrage. Einführung in die induktive Statistik. Statistische Tests. Statistische Tests

Beispiel: Sonntagsfrage. Einführung in die induktive Statistik. Statistische Tests. Statistische Tests Beispiel: Sonntagsfrage Vier Wochen vor der österreichischen Nationalratswahl 1999 wurde 499 Haushalten die Sonntagsfrage gestellt: Falls nächsten Sonntag Wahlen wären, welche Partei würden Sie wählen?

Mehr

Varianzanalyse ANOVA

Varianzanalyse ANOVA Varianzanalyse ANOVA Johannes Hain Lehrstuhl für Mathematik VIII Statistik 1/23 Einfaktorielle Varianzanalyse (ANOVA) Bisher war man lediglich in der Lage, mit dem t-test einen Mittelwertsvergleich für

Mehr

Welch-Test. Welch-Test

Welch-Test. Welch-Test Welch-Test Welch-Test Test auf Lageunterschied zweier normalverteilter Grundgesamtheiten mit unbekannten Varianzen durch Vergleich der Mittelwerte zweier unabhängiger Zufallsstichproben. Beispiel Im Labor

Mehr

Ausgewählte Kapitel der Statistik: Regressions- u. varianzanalytische Modelle Lösung von Grundaufgaben mit SPSS (ab V. 11.0)

Ausgewählte Kapitel der Statistik: Regressions- u. varianzanalytische Modelle Lösung von Grundaufgaben mit SPSS (ab V. 11.0) Ausgewählte Kapitel der Statistik: Regressions- u. varianzanalytische e Lösung von Grundaufgaben mit SPSS (ab V..0) Text: akmv_v.doc Daten: akmv??.sav Lehrbuch: W. Timischl, Biostatistik. Wien - New York:

Mehr

Übungsaufgaben zu Kapitel 5. Aufgabe 101. Inhaltsverzeichnis:

Übungsaufgaben zu Kapitel 5. Aufgabe 101. Inhaltsverzeichnis: Inhaltsverzeichnis: Übungsaufgaben zu Kapitel 5... 1 Aufgabe 101... 1 Aufgabe 102... 2 Aufgabe 103... 2 Aufgabe 104... 2 Aufgabe 105... 3 Aufgabe 106... 3 Aufgabe 107... 3 Aufgabe 108... 4 Aufgabe 109...

Mehr

Füllmenge. Füllmenge. Füllmenge. Füllmenge. Mean = 500,0029 Std. Dev. = 3,96016 N = 10.000. 485,00 490,00 495,00 500,00 505,00 510,00 515,00 Füllmenge

Füllmenge. Füllmenge. Füllmenge. Füllmenge. Mean = 500,0029 Std. Dev. = 3,96016 N = 10.000. 485,00 490,00 495,00 500,00 505,00 510,00 515,00 Füllmenge 2.4 Stetige Zufallsvariable Beispiel. Abfüllung von 500 Gramm Packungen einer bestimmten Ware auf einer automatischen Abfüllanlage. Die Zufallsvariable X beschreibe die Füllmenge einer zufällig ausgewählten

Mehr

T-TEST BEI EINER STICHPROBE:

T-TEST BEI EINER STICHPROBE: Kapitel 19 T-Test Mit Hilfe der T-TEST-Prozeduren werden Aussagen über Mittelwerte getroffen. Dabei wird versucht, aus den Beobachtungen einer Stichprobe Rückschlüsse auf die Grundgesamtheit zu ziehen.

Mehr

Probeklausur (1) Biostatistische Verfahren

Probeklausur (1) Biostatistische Verfahren Ernst-Abbe-Hochschule Jena FB Grundlagenwissenschaften Probeklausur (1) Biostatistische Verfahren Tag der Prüfung Studiengang Name: Matrikel-Nr.: Bearbeitungszeit 90 min Hilfsmittel Formelsammlung, auch

Mehr

Multivariate Statistik

Multivariate Statistik Hermann Singer Multivariate Statistik 1 Auflage 15 Oktober 2012 Seite: 12 KAPITEL 1 FALLSTUDIEN Abbildung 12: Logistische Regression: Geschätzte Wahrscheinlichkeit für schlechte und gute Kredite (rot/blau)

Mehr

Grundlagen von Versuchsmethodik und Datenanalyse

Grundlagen von Versuchsmethodik und Datenanalyse Grundlagen von Versuchsmethodik und Datenanalyse Der Anfang: Hypothesen über Ursache-Wirkungs-Zusammenhänge Ursache Wirkung Koffein verbessert Kurzzeitgedächtnis Gewaltfilme führen zu aggressivem Verhalten

Mehr

6. METRISCHE UND KATEGORIALE MERKMALE

6. METRISCHE UND KATEGORIALE MERKMALE 6. METRISCHE UND KATEGORIALE MERKMALE wenn an einer Beobachtungseinheit eine (oder mehrere) metrische und eine (oder mehrere) kategoriale Variable(n) erhoben wurden Beispiel: Haushaltsarbeit von Teenagern

Mehr

29. Mai 2006. 5. Bei Unterschleif gilt die Klausur als nicht bestanden und es erfolgt eine Meldung an das Prüfungsamt.

29. Mai 2006. 5. Bei Unterschleif gilt die Klausur als nicht bestanden und es erfolgt eine Meldung an das Prüfungsamt. L. Fahrmeir, C. Belitz Department für Statistik Bitte für die Korrektur freilassen! Aufgabe 1 2 3 4 Punkte Klausur zur Vorlesung Statistik III für Studenten mit Wahlfach Statistik 29. Mai 2006 Hinweise:

Mehr

1,11 1,12 1,13 1,14 1,15 1,16 1,17 1,17 1,17 1,18

1,11 1,12 1,13 1,14 1,15 1,16 1,17 1,17 1,17 1,18 3. Deskriptive Statistik Ziel der deskriptiven (beschreibenden) Statistik (explorativen Datenanalyse) ist die übersichtliche Darstellung der wesentlichen in den erhobenen Daten enthaltene Informationen

Mehr

Biostatistik, Winter 2011/12

Biostatistik, Winter 2011/12 Biostatistik, Winter 2011/12 Vergleich zweier Stichproben, nichtparametrische Tests Prof. Dr. Achim Klenke http://www.aklenke.de 11. Vorlesung: 27.01.2012 1/86 Inhalt 1 Tests t-test 2 Vergleich zweier

Mehr

25. Januar 2010. Ruhr-Universität Bochum. Methodenlehre III, WS 2009/2010. Prof. Dr. Holger Dette. 4. Multivariate Mittelwertvergleiche

25. Januar 2010. Ruhr-Universität Bochum. Methodenlehre III, WS 2009/2010. Prof. Dr. Holger Dette. 4. Multivariate Mittelwertvergleiche Ruhr-Universität Bochum 25. Januar 2010 1 / 75 2 / 75 4.1 Beispiel: Vergleich von verschiedenen Unterrichtsmethoden Zwei Zufallsstichproben (A und B) mit je 10 Schülern und 8 Schülern Gruppe A wird nach

Mehr

2. Korrelation, lineare Regression und multiple Regression

2. Korrelation, lineare Regression und multiple Regression multiple 2.2 Lineare 2.2 Lineare 1 / 130 2.2 Lineare 2 / 130 2.1 Beispiel: Arbeitsmotivation Untersuchung zur Motivation am Arbeitsplatz in einem Chemie-Konzern 25 Personen werden durch Arbeitsplatz zufällig

Mehr

Box-and-Whisker Plot -0,2 0,8 1,8 2,8 3,8 4,8

Box-and-Whisker Plot -0,2 0,8 1,8 2,8 3,8 4,8 . Aufgabe: Für zwei verschiedene Aktien wurde der relative Kurszuwachs (in % beobachtet. Aus den jeweils 20 Quartaldaten ergaben sich die folgenden Box-Plots. Box-and-Whisker Plot Aktie Aktie 2-0,2 0,8,8

Mehr

Kapitel 3. Zufallsvariable. Wahrscheinlichkeitsfunktion, Dichte und Verteilungsfunktion. Erwartungswert, Varianz und Standardabweichung

Kapitel 3. Zufallsvariable. Wahrscheinlichkeitsfunktion, Dichte und Verteilungsfunktion. Erwartungswert, Varianz und Standardabweichung Kapitel 3 Zufallsvariable Josef Leydold c 2006 Mathematische Methoden III Zufallsvariable 1 / 43 Lernziele Diskrete und stetige Zufallsvariable Wahrscheinlichkeitsfunktion, Dichte und Verteilungsfunktion

Mehr

Varianzanalytische Methoden Zweifaktorielle Versuchspläne 4/13. Durchführung in SPSS (File Trait Angst.sav)

Varianzanalytische Methoden Zweifaktorielle Versuchspläne 4/13. Durchführung in SPSS (File Trait Angst.sav) Zweifaktorielle Versuchspläne 4/13 Durchführung in SPSS (File Trait Angst.sav) Analysieren > Allgemeines Lineares Modell > Univariat Zweifaktorielle Versuchspläne 5/13 Haupteffekte Geschlecht und Gruppe

Mehr

3.2 Bivariate Verteilungen

3.2 Bivariate Verteilungen 3.2 Bivariate Verteilungen zwei Variablen X, Y werden gemeinsam betrachtet (an jedem Objekt i, i = 1,..., n, werden gleichzeitig zwei Merkmale beobachtet) Beobachtungswerte sind Paare/Kombinationen von

Mehr

Kapitel 7: Varianzanalyse mit Messwiederholung

Kapitel 7: Varianzanalyse mit Messwiederholung Kapitel 7: Varianzanalyse mit Messwiederholung Durchführung einer einfaktoriellen Varianzanalyse mit Messwiederholung 1 Durchführung einer zweifaktoriellen Varianzanalyse mit Messwiederholung auf einem

Mehr

Häufigkeitstabellen. Balken- oder Kreisdiagramme. kritischer Wert für χ2-test. Kontingenztafeln

Häufigkeitstabellen. Balken- oder Kreisdiagramme. kritischer Wert für χ2-test. Kontingenztafeln Häufigkeitstabellen Menüpunkt Data PivotTable Report (bzw. entsprechendes Icon): wähle Data Range (Zellen, die die Daten enthalten + Zelle mit Variablenname) wähle kategoriale Variable für Spalten- oder

Mehr

Multiple Regression II: Signifikanztests, Gewichtung, Multikollinearität und Kohortenanalyse

Multiple Regression II: Signifikanztests, Gewichtung, Multikollinearität und Kohortenanalyse Multiple Regression II: Signifikanztests,, Multikollinearität und Kohortenanalyse Statistik II Übersicht Literatur Kausalität und Regression Inferenz und standardisierte Koeffizienten Statistik II Multiple

Mehr

Anhang A: Fragebögen und sonstige Unterlagen

Anhang A: Fragebögen und sonstige Unterlagen Anhang Anhang A: Fragebögen und sonstige Unterlagen A.: Flyer zur Probandenrekrutierung 46 A.: Fragebogen zur Meditationserfahrung 47 48 A.3: Fragebogen Angaben zur Person 49 5 5 A.4: Termin- und Einladungsschreiben

Mehr

Gibt es einen Geschmacksunterschied zwischen Coca Cola und Cola Zero?

Gibt es einen Geschmacksunterschied zwischen Coca Cola und Cola Zero? Gibt es einen Geschmacksunterschied zwischen Coca Cola und Cola Zero? Manche sagen: Ja, manche sagen: Nein Wie soll man das objektiv feststellen? Kann man Geschmack objektiv messen? - Geschmack ist subjektiv

Mehr

5.2. Nichtparametrische Tests. 5.2.1. Zwei unabhängige Stichproben: U- Test nach MANN- WHITNEY

5.2. Nichtparametrische Tests. 5.2.1. Zwei unabhängige Stichproben: U- Test nach MANN- WHITNEY 5.2. Nichtparametrische Tests 5.2.1. Zwei unabhängige Stichproben: U- Test nach MANN- WHITNEY Voraussetzungen: - Die Verteilungen der beiden Grundgesamtheiten sollten eine ähnliche Form aufweisen. - Die

Mehr

Modul G.1 WS 07/08: Statistik 17.01.2008 1. Die Korrelation ist ein standardisiertes Maß für den linearen Zusammenhangzwischen zwei Variablen.

Modul G.1 WS 07/08: Statistik 17.01.2008 1. Die Korrelation ist ein standardisiertes Maß für den linearen Zusammenhangzwischen zwei Variablen. Modul G.1 WS 07/08: Statistik 17.01.2008 1 Wiederholung Kovarianz und Korrelation Kovarianz = Maß für den linearen Zusammenhang zwischen zwei Variablen x und y Korrelation Die Korrelation ist ein standardisiertes

Mehr

Statistik Musterlösungen

Statistik Musterlösungen Statistik Musterlösungen Regina Tüchler & Achim Zeileis Institut für Statistik & Mathematik Wirtschaftsuniversität Wien 1 Grundbegriffe (1.23) Skript Reaktionen auf Videofilm. Aussagen M, E, P, S h(m)

Mehr

Analog zu Aufgabe 16.1 werden die Daten durch folgenden Befehl eingelesen: > kredit<-read.table("c:\\compaufg\\kredit.

Analog zu Aufgabe 16.1 werden die Daten durch folgenden Befehl eingelesen: > kredit<-read.table(c:\\compaufg\\kredit. Lösung 16.3 Analog zu Aufgabe 16.1 werden die Daten durch folgenden Befehl eingelesen: > kredit

Mehr

Universität Bonn 28. Juli 2010 Fachbereich Rechts- und Wirtschaftswissenschaften Statistische Abteilung Prof. Dr. A. Kneip. KLAUSUR Statistik B

Universität Bonn 28. Juli 2010 Fachbereich Rechts- und Wirtschaftswissenschaften Statistische Abteilung Prof. Dr. A. Kneip. KLAUSUR Statistik B Universität Bonn 28. Juli 2010 Fachbereich Rechts- und Wirtschaftswissenschaften Statistische Abteilung Prof. Dr. A. Kneip Sommersemester 2010 KLAUSUR Statistik B Hinweise zur Bearbeitung: Bei allen Teilaufgaben

Mehr

Inhaltsverzeichnis. Regressionsanalyse. http://mesosworld.ch - Stand vom: 20.1.2010 1

Inhaltsverzeichnis. Regressionsanalyse. http://mesosworld.ch - Stand vom: 20.1.2010 1 Inhaltsverzeichnis Regressionsanalyse... 2 Lernhinweise... 2 Einführung... 2 Theorie (1-8)... 2 1. Allgemeine Beziehungen... 3 2. 'Best Fit'... 3 3. 'Ordinary Least Squares'... 4 4. Formel der Regressionskoeffizienten...

Mehr

Statistik und Wahrscheinlichkeitsrechnung

Statistik und Wahrscheinlichkeitsrechnung Statistik und Wahrscheinlichkeitsrechnung Übung 2 28.02.2008 1 Inhalt der heutigen Übung Beschreibende Statistik Gemeinsames Lösen der Übungsaufgaben 2.1: Häufigkeitsverteilung 2.2: Tukey Boxplot 25:Korrelation

Mehr

Kommentierter SPSS-Ausdruck zur logistischen Regression

Kommentierter SPSS-Ausdruck zur logistischen Regression Daten: POK V AG 3 (POKV_AG3_V07.SAV) Kommentierter SPSS-Ausdruck zur logistischen Regression Fragestellung: Welchen Einfluss hat die Fachnähe und das Geschlecht auf die interpersonale Attraktion einer

Mehr

Medizinische Statistik Epidemiologie und χ 2 Vierfeldertest

Medizinische Statistik Epidemiologie und χ 2 Vierfeldertest Universität Wien Institut für Mathematik Wintersemester 2009/2010 Medizinische Statistik Epidemiologie und χ 2 Vierfeldertest Seminar Angewandte Mathematik Ao. Univ. Prof. Dr. Peter Schmitt von Nadja Reiterer

Mehr

2. Deskriptive Statistik 2.1. Häufigkeitstabellen, Histogramme, empirische Verteilungsfunktionen

2. Deskriptive Statistik 2.1. Häufigkeitstabellen, Histogramme, empirische Verteilungsfunktionen 4. Datenanalyse und Modellbildung Deskriptive Statistik 2-1 2. Deskriptive Statistik 2.1. Häufigkeitstabellen, Histogramme, empirische Verteilungsfunktionen Für die Auswertung einer Messreihe, die in Form

Mehr

Multivariate Verfahren

Multivariate Verfahren Selbstkontrollarbeit 2 Multivariate Verfahren Musterlösung Aufgabe 1 (28 Punkte) Der Marketing-Leiter einer Lebensmittelherstellers möchte herausfinden, mit welchem Richtpreis eine neue Joghurt-Marke auf

Mehr

Schätzer (vgl. Kapitel 1): Stichprobenmittel X N. Stichprobenmedian X N

Schätzer (vgl. Kapitel 1): Stichprobenmittel X N. Stichprobenmedian X N Prof. Dr. J. Franke Statistik II für Wirtschaftswissenschaftler 8.1 Schätzer für Lage- und Skalenparameter und Verteilungsmodellwahl Lageparameter (l(x + a) = l(x) + a): Erwartungswert EX Median von X

Mehr

Webergänzung zu Kapitel 10

Webergänzung zu Kapitel 10 Webergänzung zu Kapitel 10 10.1.4 Varianzanalyse (ANOVA: analysis of variance) Im Kapitel 10 haben wir uns hauptsächlich mit Forschungsbeispielen beschäftigt, die nur zwei Ergebnissätze hatten (entweder

Mehr

2. Eindimensionale (univariate) Datenanalyse

2. Eindimensionale (univariate) Datenanalyse 2. Eindimensionale (univariate) Datenanalyse Dr. Antje Kiesel Institut für Angewandte Mathematik WS 2011/2012 Kennzahlen, Statistiken In der Regel interessieren uns nicht so sehr die beobachteten Einzeldaten

Mehr

Univariate Lineare Regression. (eine unabhängige Variable)

Univariate Lineare Regression. (eine unabhängige Variable) Univariate Lineare Regression (eine unabhängige Variable) Lineare Regression y=a+bx Präzise lineare Beziehung a.. Intercept b..anstieg y..abhängige Variable x..unabhängige Variable Lineare Regression y=a+bx+e

Mehr

Univariate/ multivariate Ansätze. Klaus D. Kubinger. Test- und Beratungsstelle. Effektgrößen

Univariate/ multivariate Ansätze. Klaus D. Kubinger. Test- und Beratungsstelle. Effektgrößen Univariate/ multivariate Ansätze Klaus D. Kubinger Effektgrößen Rasch, D. & Kubinger, K.D. (2006). Statistik für das Psychologiestudium Mit Softwareunter-stützung zur Planung und Auswertung von Untersuchungen

Mehr

Stochastik Abitur 2009 Stochastik

Stochastik Abitur 2009 Stochastik Abitur 2009 Stochastik Beilage ea (erhöhtes Anforderungsniveau) ga (grundlegendes Anforderungsniveau) ISBN 978-3-8120-0108-3 und ISBN 978-3-8120-0223-3 1 Aufgabe 2 (ea) Rauchen ist das größte vermeidbare

Mehr

Einseitig gerichtete Relation: Mit zunehmender Höhe über dem Meeresspiegel sinkt im allgemeinen die Lufttemperatur.

Einseitig gerichtete Relation: Mit zunehmender Höhe über dem Meeresspiegel sinkt im allgemeinen die Lufttemperatur. Statistik Grundlagen Charakterisierung von Verteilungen Einführung Wahrscheinlichkeitsrechnung Wahrscheinlichkeitsverteilungen Schätzen und Testen Korrelation Regression Einführung Die Analyse und modellhafte

Mehr

Standardab er des. Testwert = 145.5 95% Konfidenzintervall. T df Sig. (2-seitig) Differenz Untere Obere -2.011 698.045-5.82-11.50 -.14.

Standardab er des. Testwert = 145.5 95% Konfidenzintervall. T df Sig. (2-seitig) Differenz Untere Obere -2.011 698.045-5.82-11.50 -.14. Aufgabe : einfacher T-Test Statistik bei einer Stichprobe Standardfehl Standardab er des Mittelwert weichung Mittelwertes 699 39.68 76.59 2.894 Test bei einer Sichprobe Testwert = 45.5 95% Konfidenzintervall

Mehr

Weitere (wählbare) Kontraste in der SPSS Prozedur Allgemeines Lineares Modell

Weitere (wählbare) Kontraste in der SPSS Prozedur Allgemeines Lineares Modell Einfaktorielle Versuchspläne 27/40 Weitere (wählbare) Kontraste in der SPSS Prozedur Allgemeines Lineares Modell Abweichung Einfach Differenz Helmert Wiederholt Vergleich Jede Gruppe mit Gesamtmittelwert

Mehr

$ % + 0 sonst. " p für X =1 $

$ % + 0 sonst.  p für X =1 $ 31 617 Spezielle Verteilungen 6171 Bernoulli Verteilung Wir beschreiben zunächst drei diskrete Verteilungen und beginnen mit einem Zufallsexperiment, indem wir uns für das Eintreffen eines bestimmten Ereignisses

Mehr

Auswertung mit dem Statistikprogramm SPSS: 30.11.05

Auswertung mit dem Statistikprogramm SPSS: 30.11.05 Auswertung mit dem Statistikprogramm SPSS: 30.11.05 Seite 1 Einführung SPSS Was ist eine Fragestellung? Beispiel Welche statistische Prozedur gehört zu welcher Hypothese? Statistische Berechnungen mit

Mehr

Stichprobenauslegung. für stetige und binäre Datentypen

Stichprobenauslegung. für stetige und binäre Datentypen Stichprobenauslegung für stetige und binäre Datentypen Roadmap zu Stichproben Hypothese über das interessierende Merkmal aufstellen Stichprobe entnehmen Beobachtete Messwerte abbilden Schluss von der Beobachtung

Mehr

Klausur zur Vorlesung Statistik III für Studenten mit dem Wahlfach Statistik

Klausur zur Vorlesung Statistik III für Studenten mit dem Wahlfach Statistik Ludwig Fahrmeir, Nora Fenske Institut für Statistik Bitte für die Korrektur freilassen! Aufgabe 1 2 3 4 Punkte Klausur zur Vorlesung Statistik III für Studenten mit dem Wahlfach Statistik 29. März 21 Hinweise:

Mehr

Methoden Quantitative Datenanalyse

Methoden Quantitative Datenanalyse Leitfaden Universität Zürich ISEK - Andreasstrasse 15 CH-8050 Zürich Telefon +41 44 635 22 11 Telefax +41 44 635 22 19 www.isek.uzh.ch 11. September 2014 Methoden Quantitative Datenanalyse Vorbereitung

Mehr

Schätzung des Lifetime Values von Spendern mit Hilfe der Überlebensanalyse

Schätzung des Lifetime Values von Spendern mit Hilfe der Überlebensanalyse Schätzung Lifetime Values von Spenn mit Hilfe Überlebensanalyse Einführung in das Verfahren am Beispiel Einzugsgenehmigung Überlebensanalysen o Ereignisdatenanalysen behandeln das Problem, mit welcher

Mehr

Statistische Methoden: Tests, Regression und multivariate Verfahren

Statistische Methoden: Tests, Regression und multivariate Verfahren (CM)²-Nachwuchsring, Workshop Statistik, 25.Januar 2013 Statistische Methoden: Tests, Regression und multivariate Verfahren Ralf Korn ((CM)², TU Kaiserslautern, Fraunhofer ITWM) 0. Einige Probleme aus

Mehr

Das Dialogfeld für die Regressionsanalyse ("Lineare Regression") findet sich im Statistik- Menu unter "Regression"-"Linear":

Das Dialogfeld für die Regressionsanalyse (Lineare Regression) findet sich im Statistik- Menu unter Regression-Linear: Lineare Regression Das Dialogfeld für die Regressionsanalyse ("Lineare Regression") findet sich im Statistik- Menu unter "Regression"-"Linear": Im einfachsten Fall werden mehrere Prädiktoren (oder nur

Mehr

Institut für Soziologie. Methoden 2. Regressionsanalyse I: Einfache lineare Regression

Institut für Soziologie. Methoden 2. Regressionsanalyse I: Einfache lineare Regression Institut für Soziologie Methoden 2 Regressionsanalyse I: Einfache lineare Regression Programm Anwendungsbereich Vorgehensweise Interpretation Annahmen Zusammenfassung Übungsaufgabe Literatur # 2 Anwendungsbereich

Mehr

Statistische Software P. Fink. Statistische Software (R) Wiederholungshausübung SoSe 2015

Statistische Software P. Fink. Statistische Software (R) Wiederholungshausübung SoSe 2015 Allgmeine Hinweise Die Hausübung umfasst 7 Aufgaben mit insgesamt 120 Punkten. Erstellen Sie eine R Skript-Datei mit Ihrer Matrikelnummer als Dateinamen. Diese Datei enthält Ihren vollständigen und mit

Mehr

Tutorial: Homogenitätstest

Tutorial: Homogenitätstest Tutorial: Homogenitätstest Eine Bank möchte die Kreditwürdigkeit potenzieller Kreditnehmer abschätzen. Einerseits lebt die Bank ja von der Vergabe von Krediten, andererseits verursachen Problemkredite

Mehr

Korrelation - Regression. Berghold, IMI

Korrelation - Regression. Berghold, IMI Korrelation - Regression Zusammenhang zwischen Variablen Bivariate Datenanalyse - Zusammenhang zwischen 2 stetigen Variablen Korrelation Einfaches lineares Regressionsmodell 1. Schritt: Erstellung eines

Mehr

Lineare Modelle in R: Einweg-Varianzanalyse

Lineare Modelle in R: Einweg-Varianzanalyse Lineare Modelle in R: Einweg-Varianzanalyse Achim Zeileis 2009-02-20 1 Datenaufbereitung Wie schon in der Vorlesung wollen wir hier zur Illustration der Einweg-Analyse die logarithmierten Ausgaben der

Mehr

Probeklausur Zeitreihenökonometrie (Sommersemester 2014) 1

Probeklausur Zeitreihenökonometrie (Sommersemester 2014) 1 Probeklausur Zeitreihenökonometrie (Sommersemester 2014) 1 Aufgabe 1: Betrachtet wird folgendes Modell zur Erklärung des Managergehalts salary durch den Umsatz sales, die Eigenkapitalrendite roe und die

Mehr

14.01.14 DAS THEMA: INFERENZSTATISTIK II. Standardfehler Konfidenzintervalle Signifikanztests. Standardfehler

14.01.14 DAS THEMA: INFERENZSTATISTIK II. Standardfehler Konfidenzintervalle Signifikanztests. Standardfehler DAS THEMA: INFERENZSTATISTIK II INFERENZSTATISTISCHE AUSSAGEN Standardfehler Konfidenzintervalle Signifikanztests Standardfehler der Standardfehler Interpretation Verwendung 1 ZUR WIEDERHOLUNG... Ausgangspunkt:

Mehr

Inhaltsverzeichnis. I Einführung in STATISTICA 1. 1 Erste Schritte in STATISTICA 3

Inhaltsverzeichnis. I Einführung in STATISTICA 1. 1 Erste Schritte in STATISTICA 3 I Einführung in STATISTICA 1 1 Erste Schritte in STATISTICA 3 2 Datenhaltung in STATISTICA 11 2.1 Die unterschiedlichen Dateitypen in STATISTICA....... 11 2.2 Import von Daten......... 12 2.3 Export von

Mehr

Verteilungsanalyse. Johannes Hain. Lehrstuhl für Mathematik VIII Statistik 1/35

Verteilungsanalyse. Johannes Hain. Lehrstuhl für Mathematik VIII Statistik 1/35 Verteilungsanalyse Johannes Hain Lehrstuhl für Mathematik VIII Statistik 1/35 Datentypen Als Sammeln von Daten bezeichnet man in der Statistik das Aufzeichnen von Fakten. Erhobene Daten klassifziert man

Mehr

Kapitel 3. Erste Schritte der Datenanalyse. 3.1 Einlesen und Überprüfen der Daten

Kapitel 3. Erste Schritte der Datenanalyse. 3.1 Einlesen und Überprüfen der Daten Kapitel 3 Erste Schritte der Datenanalyse 3.1 Einlesen und Überprüfen der Daten Nachdem die Daten erfasst worden sind, etwa mit Hilfe eines Fragebogens, ist die nächste Frage, wie ich sie in den Rechner

Mehr

werden können. Wenn der Benutzer zudem eine konkrete Differenz mit praktischen Konsequenzen angibt, berechnet der Assistent den Stichprobenumfang,

werden können. Wenn der Benutzer zudem eine konkrete Differenz mit praktischen Konsequenzen angibt, berechnet der Assistent den Stichprobenumfang, Dieses White Paper ist Teil einer Reihe von Veröffentlichungen, welche die Forschungsarbeiten der Minitab-Statistiker erläutern, in deren Rahmen die im Assistenten der Minitab 17 Statistical Software verwendeten

Mehr

Tabelle 6a: Deskriptive Statistiken der metrischen Variablen

Tabelle 6a: Deskriptive Statistiken der metrischen Variablen Ergebnisse 77 5 Ergebnisse Das folgende Kapitel widmet sich der statistischen Auswertung der Daten zur Ü- berprüfung der Hypothesen. Die hier verwendeten Daten wurden mit den in 4.3 beschriebenen Instrumenten

Mehr

V A R I A N Z A N A L Y S E

V A R I A N Z A N A L Y S E V A R I A N Z A N A L Y S E Ziel / Funktion: statistische Beurteilung des Einflusses von nominal skalierten (kategorialen) Faktoren auf intervallskalierte abhängige Variablen Vorteil: die Wirkung von mehreren,

Mehr

Abhängigkeit zweier Merkmale

Abhängigkeit zweier Merkmale Abhängigkeit zweier Merkmale Johannes Hain Lehrstuhl für Mathematik VIII Statistik 1/33 Allgemeine Situation Neben der Untersuchung auf Unterschiede zwischen zwei oder mehreren Untersuchungsgruppen hinsichtlich

Mehr

Statistik I für Wirtschaftswissenschaftler Klausur am 06.07.2007, 14.00 16.00.

Statistik I für Wirtschaftswissenschaftler Klausur am 06.07.2007, 14.00 16.00. 1 Statistik I für Wirtschaftswissenschaftler Klausur am 06.07.2007, 14.00 16.00. Bitte unbedingt beachten: a) Gewertet werden alle 9 gestellten Aufgaben. b) Lösungswege sind anzugeben. Die Angabe des Endergebnisses

Mehr

Analyse bivariater Kontingenztafeln

Analyse bivariater Kontingenztafeln Analyse bivariater Kontingenztafeln Werden zwei kategoriale Merkmale mit nicht zu vielen möglichen Ausprägungen gemeinsam analysiert, so kommen zur Beschreibung der gemeinsamen Verteilung im allgemeinen

Mehr

Auswertung und Darstellung wissenschaftlicher Daten (1)

Auswertung und Darstellung wissenschaftlicher Daten (1) Auswertung und Darstellung wissenschaftlicher Daten () Mag. Dr. Andrea Payrhuber Zwei Schritte der Auswertung. Deskriptive Darstellung aller Daten 2. analytische Darstellung (Gruppenvergleiche) SPSS-Andrea

Mehr

Eine Einführung in SPSS

Eine Einführung in SPSS Eine Einführung in SPSS Aufbau von SPSS 14 Bemerkung: SPSS 14 kann in den Subzentren in der Kopernikusgasse installiert werden, falls dies noch nicht geschehen ist. Dazu öffnet man den Application Explorer

Mehr

Multinomiale logistische Regression

Multinomiale logistische Regression Multinomiale logistische Regression Die multinomiale logistische Regression dient zur Schätzung von Gruppenzugehörigkeiten bzw. einer entsprechenden Wahrscheinlichkeit hierfür, wobei als abhänginge Variable

Mehr

Linearer Zusammenhang von Datenreihen

Linearer Zusammenhang von Datenreihen Linearer Zusammenhang von Datenreihen Vielen Problemen liegen (möglicherweise) lineare Zusammenhänge zugrunde: Mein Internetanbieter verlangt eine Grundgebühr und rechnet minutenweise ab Ich bestelle ein

Mehr

26 Nichtparametrische Tests

26 Nichtparametrische Tests 26 Nichtparametrische Tests Das Menü und auch die Ergebnisausgabe von Nichtparametrische Tests ist seit der Version 18 neu gestaltet. Die Darstellung in der 8. Auflage des Buches bezieht sich ausschließlich

Mehr

Allgemeines Lineares Modell: Univariate Varianzanalyse und Kovarianzanalyse

Allgemeines Lineares Modell: Univariate Varianzanalyse und Kovarianzanalyse Allgemeines Lineares Modell: Univariate Varianzanalyse und Kovarianzanalyse Univariate Varianz- und Kovarianzanlyse, Multivariate Varianzanalyse und Varianzanalyse mit Messwiederholung finden sich unter

Mehr

PRAKTIKUM Experimentelle Prozeßanalyse 2. VERSUCH AS-PA-2 "Methoden der Modellbildung statischer Systeme" Teil 2 (für ausgewählte Masterstudiengänge)

PRAKTIKUM Experimentelle Prozeßanalyse 2. VERSUCH AS-PA-2 Methoden der Modellbildung statischer Systeme Teil 2 (für ausgewählte Masterstudiengänge) FACHGEBIET Systemanalyse PRAKTIKUM Experimentelle Prozeßanalyse 2 VERSUCH AS-PA-2 "Methoden der Modellbildung statischer Systeme" Teil 2 (für ausgewählte Masterstudiengänge) Verantw. Hochschullehrer: Prof.

Mehr

Willkommen zur Vorlesung Statistik

Willkommen zur Vorlesung Statistik Willkommen zur Vorlesung Statistik Thema dieser Vorlesung: Varianzanalyse Prof. Dr. Wolfgang Ludwig-Mayerhofer Universität Siegen Philosophische Fakultät, Seminar für Sozialwissenschaften Prof. Dr. Wolfgang

Mehr

Stellen Sie bitte den Cursor in die Spalte B2 und rufen die Funktion Sverweis auf. Es öffnet sich folgendes Dialogfenster

Stellen Sie bitte den Cursor in die Spalte B2 und rufen die Funktion Sverweis auf. Es öffnet sich folgendes Dialogfenster Es gibt in Excel unter anderem die so genannten Suchfunktionen / Matrixfunktionen Damit können Sie Werte innerhalb eines bestimmten Bereichs suchen. Als Beispiel möchte ich die Funktion Sverweis zeigen.

Mehr

Kapitel 3: Interpretationen

Kapitel 3: Interpretationen Kapitel 3: 1. Interpretation von Outputs allgemein... 1 2. Interpretation von Signifikanzen... 1 2.1. Signifikanztests / Punktschätzer... 1 2.2. Konfidenzintervalle... 2 3. Interpretation von Parametern...

Mehr

MS-Excel 2003 Datenbanken Pivot-Tabellen

MS-Excel 2003 Datenbanken Pivot-Tabellen The Company Datenbanken Pivot-Tabellen (Schnell-Einführung) Seestrasse 160, CH-8002 Zürich E-Mail: info@iswsolution.ch Autor: F. Frei The Company 2 Inhaltsverzeichnis Inhaltsverzeichnis... 2 Datenbank...

Mehr

Abschlussklausur (60 Minuten), 15. Juli 2014

Abschlussklausur (60 Minuten), 15. Juli 2014 Prof. Dr. Amelie Wuppermann Volkswirtschaftliche Fakultät Universität München Sommersemester 2014 Empirische Ökonomie 1 Abschlussklausur (60 Minuten), 15. Juli 2014 Bearbeitungshinweise Die Bearbeitungszeit

Mehr

Datenanalyse mit SPSS spezifische Analysen

Datenanalyse mit SPSS spezifische Analysen Datenanalyse mit SPSS spezifische Analysen Arnd Florack Tel.: 0251 / 83-34788 E-Mail: florack@psy.uni-muenster.de Raum 2.015 Sprechstunde: Dienstags 15-16 Uhr 25. Mai 2001 2 Auswertung von Häufigkeitsdaten

Mehr

i x k k=1 i u i x i v i 1 0,2 24 24 0,08 2 0,4 30 54 0,18 3 0,6 54 108 0,36 4 0,8 72 180 0,60 5 1,0 120 300 1,00 2,22 G = 1 + 1 n 2 n i=1

i x k k=1 i u i x i v i 1 0,2 24 24 0,08 2 0,4 30 54 0,18 3 0,6 54 108 0,36 4 0,8 72 180 0,60 5 1,0 120 300 1,00 2,22 G = 1 + 1 n 2 n i=1 1. Aufgabe: Der E-Commerce-Umsatz (in Millionen Euro) der fünf größten Online- Shopping-Clubs liegt wie folgt vor: Club Nr. Umsatz 1 120 2 72 3 54 4 30 5 24 a) Bestimmen Sie den Ginikoeffizienten. b) Zeichnen

Mehr

Messgeräte: Mess-System-Analyse und Messmittelfähigkeit

Messgeräte: Mess-System-Analyse und Messmittelfähigkeit Messgeräte: Mess-System-Analyse und Messmittelfähigkeit Andreas Berlin 14. Juli 2009 Bachelor-Seminar: Messen und Statistik Inhalt: 1 Aspekte einer Messung 2 Mess-System-Analyse 2.1 ANOVA-Methode 2.2 Maße

Mehr

q = 1 p = 0.8 0.2 k 0.8 10 k k = 0, 1,..., 10 1 1 0.8 2 + 10 0.2 0.8 + 10 9 1 2 0.22 1 = 0.8 8 [0.64 + 1.6 + 1.8] = 0.678

q = 1 p = 0.8 0.2 k 0.8 10 k k = 0, 1,..., 10 1 1 0.8 2 + 10 0.2 0.8 + 10 9 1 2 0.22 1 = 0.8 8 [0.64 + 1.6 + 1.8] = 0.678 Lösungsvorschläge zu Blatt 8 X binomialverteilt mit p = 0. und n = 10: a PX = = 10 q = 1 p = 0.8 0. 0.8 10 = 0, 1,..., 10 PX = PX = 0 + PX = 1 + PX = 10 10 = 0. 0 0.8 10 + 0. 1 0.8 9 + 0 1 10 = 0.8 8 [

Mehr

Regressionsanalysen. Zusammenhänge von Variablen. Ziel der Regression. ( Idealfall )

Regressionsanalysen. Zusammenhänge von Variablen. Ziel der Regression. ( Idealfall ) Zusammenhänge von Variablen Regressionsanalysen linearer Zusammenhang ( Idealfall ) kein Zusammenhang nichtlinearer monotoner Zusammenhang (i.d.regel berechenbar über Variablentransformationen mittels

Mehr