3 Konfidenzintervalle

Ähnliche Dokumente
Willkommen zur Vorlesung Statistik (Master)

VS PLUS

Willkommen zur Vorlesung Statistik (Master)

2.3 Intervallschätzung

Thema der Stunde. I. Die Form der Stichprobenkennwerteverteilung. II. Schlüsse von der Stichprobe auf die Population

Jost Reinecke. 7. Juni 2005

Konfidenzintervalle so einfach wie möglich erklärt

Mathematik für Biologen

Übungsblätter zu Methoden der Empirischen Sozialforschung III: Inferenzstatistik. Lösungsblatt zu Nr. 5

Aufgabenblock 4. Da Körpergröße normalverteilt ist, erhalten wir aus der Tabelle der t-verteilung bei df = 19 und α = 0.05 den Wert t 19,97.

Forschungsstatistik I

Methodenlehre. Vorlesung 10. Prof. Dr. Björn Rasch, Cognitive Biopsychology and Methods University of Fribourg

Konfidenzintervalle. Statistische Methoden in der Korpuslinguistik Heike Zinsmeister WS 2008/09

Analyse von Querschnittsdaten. Signifikanztests I Basics

Stichproben Parameterschätzung Konfidenzintervalle:

Konfidenzintervalle. SeKo. Heute. Konjunktion, Disjunktion, bedingte Wahrscheinlichkeit

2.3 Intervallschätzung

INFERENZSTATISTISCHE AUSSAGEN FÜR LAGEMAßE UND STREUUNGSMAßE. Inferenzstatistik für Lagemaße Inferenzstatistik für Streuungsmaße

= 3. Kapitel 4: Normalverteilung.. und Standardnormalverteilung und: das Konfidenzintervall..

So berechnen Sie einen Schätzer für einen Punkt

Konfidenzintervalle Grundlegendes Prinzip Erwartungswert Bekannte Varianz Unbekannte Varianz Anteilswert Differenzen von Erwartungswert Anteilswert

1 Wahrscheinlichkeitsrechnung. 2 Zufallsvariablen und ihre Verteilung. 3 Statistische Inferenz. 4 Intervallschätzung

Vorlesung: Statistik II für Wirtschaftswissenschaft

Zentraler Grenzwertsatz/Konfidenzintervalle

Evaluation & Forschungsstrategien. B.Sc.-Seminar. Sitzung IV: Konfidenzintervalle // Normalverteilungstests

4.1. Nullhypothese, Gegenhypothese und Entscheidung

1 Beispiel zur Methode der kleinsten Quadrate

Wie liest man Konfidenzintervalle? Teil I. Premiu m

Statistik I für Betriebswirte Vorlesung 14

Hypothesenprüfung. Darüber hinaus existieren zahlreiche andere Testverfahren, die alle auf der gleichen Logik basieren

T-Test für unabhängige Stichproben

Kapitel 3 Schließende Statistik

Methodenlehre. Vorlesung 12. Prof. Dr. Björn Rasch, Cognitive Biopsychology and Methods University of Fribourg

Statistik für SozialwissenschaftlerInnen II p.85

Dr. H. Grunert Schließende Statistik Vorlesungscharts. Vorlesung 7. Schätzverfahren

8. Konfidenzintervalle und Hypothesentests

SozialwissenschaftlerInnen II

Verteilungen eindimensionaler stetiger Zufallsvariablen Stetige Verteilungen. Chi-Quadrat-Verteilung Studentverteilung Fisher-Verteilung

Medizinische Statistik

Statistischer Rückschluss und Testen von Hypothesen

Statistische Methoden in der MMST: Schließende Statistik

Mathematische und statistische Methoden II

Beschreibende Statistik Deskriptive Statistik. Schließende Statistik Inferenzstatistik. Schluss von der Stichprobe auf die Grundgesamtheit

Statistik Testverfahren. Heinz Holling Günther Gediga. Bachelorstudium Psychologie. hogrefe.de

Statistik II. IV. Hypothesentests. Martin Huber

Konfidenzintervall für den Anteilswert θ. Konfidenzintervalle. Jost Reinecke. Universität Bielefeld. 13. Juni 2005

Willkommen zur Vorlesung Statistik

Statistik I. Methodologie der Psychologie

Biostatistik, WS 2013/2014 Konfidenzintervalle

Bereiche der Statistik

Statistische Methoden in der MMST: Schließende Statistik

Methodenlehre. Vorlesung 10. Prof. Dr. Björn Rasch, Cognitive Biopsychology and Methods University of Fribourg

7. Übung: Aufgabe 1. b), c), e) Aufgabe 2. a), c), e) Aufgabe 3. c), e) Aufgabe 4. Aufgabe 5. Aufgabe 6. Aufgabe 7. Aufgabe 8. Aufgabe 9.

Übungen mit dem Applet Vergleich von zwei Mittelwerten

Marcel Dettling. GdM 2: LinAlg & Statistik FS 2017 Woche 13. Winterthur, 24. Mai Institut für Datenanalyse und Prozessdesign

3.3 Konfidenzintervalle für Regressionskoeffizienten

Lösungen zu den Übungsaufgaben in Kapitel 10

Analyse von Querschnittsdaten. Signifikanztests I Basics

6. Schätzverfahren für Parameter

Elisabeth Aufhauser, unveröffentlichter Text Unterrichtsmaterial Statistik-UE für Soziologie

Statistische Methoden in den Umweltwissenschaften

Statistische Tests für unbekannte Parameter

Aussagen hierzu sind mit einer unvermeidbaren Unsicherheit behaftet, die statistisch über eine Irrtumswahrscheinlichkeit bewertet wird.

Statistische Tests für unbekannte Parameter

Teil VIII. Zentraler Grenzwertsatz und Vertrauensintervalle. Woche 6: Zentraler Grenzwertsatz und Vertrauensintervalle. Lernziele. Typische Situation

Das Konfidenzintervall (Confidence Interval CI) Vertrauen schaffen, Signifikanz erkennen Autor: Beat Giger

Statistik K urs SS 2004

Wiederholung. Statistik I. Sommersemester 2009

Mathematische und statistische Methoden II

Macht des statistischen Tests (power)

8 Stichprobenkennwerteverteilung

Probleme bei kleinen Stichprobenumfängen und t-verteilung

Auswertung von Messungen Teil II

Softwaretechnik. Prof. Dr. Rainer Koschke. Fachbereich Mathematik und Informatik Arbeitsgruppe Softwaretechnik Universität Bremen

Modul G.1 WS 07/08: Statistik

Wahrscheinlichkeitsrechnung und Statistik für Biologen 2. Der Standardfehler

WS 2014/15. (d) Bestimmen Sie die Wahrscheinlichkeitsfunktion von X. (e) Bestimmen Sie nun den Erwartungswert und die Varianz von X.

Kapitel 3 Schließende Statistik

Zufallsvariablen. Diskret. Stetig. Verteilung der Stichprobenkennzahlen. Binomial Hypergeometrisch Poisson. Normal Lognormal Exponential

Schließende Statistik

Mathematische und statistische Methoden II

Prüfgröße: Ist die durch eine Schätzfunktion zugeordnete reelle Zahl (etwa Mittelwert 7 C).

Wahrscheinlichkeitsverteilungen

Wiederholung Hypothesentests Zusammenfassung. Hypothesentests. Statistik I. Sommersemester Statistik I Hypothesentests I (1/36)

Konkretes Durchführen einer Inferenzstatistik

Methodenlehre. Vorlesung 11. Prof. Dr. Björn Rasch, Cognitive Biopsychology and Methods University of Fribourg

Wahrscheinlichkeit und Statistik: Zusammenfassung

Biostatistik, WS 2017/18 Der Standardfehler

Konfidenzintervalle so einfach wie möglich erklärt

Binomialverteilung Vertrauensbereich für den Anteil

Macht des statistischen Tests (power)

Lösungen Klausur Statistik 2/re/soz

Fit for Abi & Study Stochastik

Statistik Einführung // Stichprobenverteilung 6 p.2/26

Inzidenz = Penetration: Welche Stichprobe ist realistisch?

Grundlagen der schließenden Statistik

Mathematik für Biologen

Transkript:

3 Konfidenzintervalle Konfidenzintervalle sind das Ergebnis von Intervallschätzungen. Sicheres Wissen über Grundgesamtheiten kann man anhand von Stichproben nicht gewinnen. Aber mit Hilfe der Statistik können Intervalle angegeben werden, innerhalb derer sich die Parameter der Grundgesamtheit wahrscheinlich bewegen. Diese Bandbreiten nennt man Konfidenzintervalle. Beispiel Mit einer Wahrscheinlichkeit von 95 % wird der Stimmenanteil der Partei LILA zwischen 35 % und 41 % liegen. Mit einer Wahrscheinlichkeit von 99 % liegt der Ertrag mit dem Dünger XYZ zwischen 8,7 und 9,3 dz/ha. Wie kommt man aber zu diesen Aussagen? 15

4 Auswahl eines Konfidenzintervalls Um ein Intervall anzugeben, in dem der geschätzte Wert für die Grundgesamtheit wahrscheinlich liegt, benötigt man eine Irrtumswahrscheinlichkeit. Ein α von 5 % bedeutet, dass diese Intervall den gesuchten Wert der Grundgesamtheit mit 95 % Wahrscheinlichkeit enthält. Eine (gesetzte) Irrtumswahrscheinlichkeit von 5 % bedeutet, dass das Intervall die mittleren 95% der Kennwerteverteilung überdeckt, Beziehungsweise jeweils 2,5 % auf der linken und der rechten Seite der Kennwerteverteilung werden nicht berücksichtigt. 16

Grenzen des Vertrauensintervalls Allgemein: Die linke (untere) Grenze des Konfidenz-intervalls liegt bei: o Schätzwert Standardfehler * (1-α/2)-Quantilwert Die rechte (obere) Grenze deskonfidenz-intervalls liegt bei o Schätzwert+Standardfehler * (1-α/2)-Quantilwert Quantile sind Punkte einer nach Rang oder Größe der Einzelwerte sortierten statistischen Verteilung. 17

Vorteil der Standardnormalverteilung Standardnormalverteilung 0,5 0,45 0,4 99,73% 95,45% 68,27% 0,35 0,3 f(z) 0,25 WP WP 0,2 0,15 0,1 0,05 0-4 -3-2 -1 0 1 2 3 4 z 18

Etwa 68 % der Stichprobenergebnisse liegen im Bereich von ± 1 Standardfehler um den wahren Wert (in der Grundgesamtheit) Etwa 95 % der Stichprobenergebnisse liegen im Bereich von ± 2 Standardfehlern. Oder genauer exakt 95 % liegen im Bereich ± 1,96 Standardfehlern um den wahren Wert Etwa 99 % der Stichprobenergebnisse liegen im Bereich von ± 2,5 Standardfehlern. Oder genauer exakt 99 % liegen im Bereich ± 2,58 Standardfehlern um den wahren Wert Hinweis Die Verteilungsfunktionen der wichtigsten Zufallsverteilungen sind in allen brauchbaren Statistiklehrbüchern zumindest auszugsweise tabelliert. 19

Zentrale Bedeutung des Standardfehlers Für die Berechnung des Konfidenzintervalls benötigen wir den Standardfehler (die Standardabweichung der Stichprobenverteilung) ˆ δ SE = ˆ δ x = (SE, standard error) n Wovon hängt der Stichprobenfehler ab? 20

Für die Größe des Standardfehlers sind 2 Aspekte ausschlaggebend o Stichprobengröße (je größer n, umso kleiner SE) o Streuung der Werte in der Grundgesamtheit (Je größer die Streuung, umso größer der SE) 21

Bei Daten in großen Stichproben kann man die bekannten t-werte nehmen: Beispiel Alter Stichprobe von 100 Personen aus Dresden Mittelwert ist 42 Standardabweichung ist 11,1 Der Vertrauensbereich soll 95 % betragen (α=5 %), der zugehörige t-wert ist 1,96 11,1 o Untere Grenze 42 1,96 = 39, 8 100 11,1 o Obere Grenze 42 + 1,96 = 44, 2 100 Mit 95 % Wahrscheinlichkeit, sind die Dresdner zwischen 39,8 und 44,2 Jahren alt. 22

Beispiel: Konfidenzintervall für Mittelwerte (kleine Stichprobe) Eine zufällig ausgewählte Gruppe von 11 Studierenden der Soziologie hat an einem IQ-Test teilgenommen. Die resultieren den Werte sind 203, 195, 193, 193, 193, 188, 185, 184, 172, 170 und 162. Wir möchten nun das arithmetische Mittel der IQ-Werte für die entsprechende Population schätzen und als Indikator der Genauigkeit der Schätzung ein 90 % Konfidenzintervall bestimmen. 23

Wir benötigen also zuerst den Stichprobenmittelwert und die geschätzte Populationsvarianz: 203 + 195... + 162 x = = 185,27 11 ˆ δ n 1 = ( x i x) n 1 i= 1 2 = 1 [(203 10 185,27) 2 + (195 185,27) 2 +... + (162 185,27) 2 ] = 154,818 = 12,443 SE ˆ ˆ δ 12,443 = δ = = n 11 = x 3,752 24

Jetzt benötigen wir noch die t-werte für n-1 = 10 Freiheitsgrade und eine Konfidenz von 90 %. Diese findet man in den Tabellenanhängen für bestimmt werden: t 10, Konf = 90% Untere Grenze x ˆ δ = 185,27 3,752 1,813 178, 47 t x df, Konf = Obere Grenze x ˆ δ = 185,27 3,752 1,813 192, 07 + t x df, Konf = = 1,813. Nun können die Grenzen des Konfidenzintervalls Wir können also mit 90 % Sicherheit sagen, dass das Intervall zwischen 178 und 192 den wahren IQ-Wert der Soziologie-Studierenden enthält. 25

Was beeinflusst die Größe eines Konfidenzintervalls? 26

Stichprobengröße Streuung der Werte Größe des Effekts 27

Vorteil von Konfidenzintervallen Liefern im Gegensatz zu den p-werten Informationen in der gleichen Skala wie die untersuchte Variable. Hier lässt sich also auch etwas über die Unsicherheit zur Stärke des Effekts sagen. Man kann die Signifikanz direkt ablesen. 28

5 Veröffentlichung von Ergebnissen Von Signifikanztests keine Sternchen berichten Exakte p-werte (gerundet) angeben, z.b. p = 0,02, oder bei sehr niedrigen p-werten das niedrigste unterschrittene Signifikanzniveau Z.B. Kühne, M.; Böhme, R. (2006): Effekte von Informationsstand, Wissen und Einstellungsstärke von Befragten auf die Antwortstabilität in Online-Befragungen mit Selbstrekrutierung. ZUMA-Nachrichten. 59, S. 42-71. 29

Von Konfidenzintervallen Die Vertrauensbereich, der Kennwert und die Grenzen sollten berichtet werden. Z.B. (Mittelwert[M]; 0,10; 95 % CI; 0.01 0.70) ([M]; 1,35; 95 % CI; 1,23 1,56) 30