Statistik I im Sommersemester 2007

Größe: px
Ab Seite anzeigen:

Download "Statistik I im Sommersemester 2007"

Transkript

1 Themen am : Statistik I im Sommersemester 2007 Zusammenhangsanalyse in der Vierfeldertabelle Von der Anteilsdifferenz zur Vierfeldertabelle Probeklausur 2 Lernziele: 1. Aufbau einer Kreuztabelle: Zeilen- und Spaltenvariable 2. Unterschied zwischen gemeinsamen und bedingten Verteilungen 3. Univariate Verteilungen und Randverteilungen in einer Kreuztabelle 4. Interpretation einer Prozentsatzdifferen 5. Kennwerteverteilung und Konfidenzintervalle von Proezntsatzdifferenzen 6. Hypothesentests über Prozentsatzdifferenzen

2 Wiederholung Statistischer Test sind Entscheidungsregeln, die Stichprobendaten nutzen; H 0 ist richtig H 0 ist falsch Akzeptanz von H 0 Verwerfen von H 0 richtige Entscheidung falsche Entscheidung = α-fehler (Fehler erster Art) falsche Entscheidung = β-fehler (Fehler zweiter Art) richtige Entscheidung Test über Konfidenzintervalle, Signifikanztests nach Fisherund Hypothesentests nach Neyman u. Pearson; Vorgehensweise bei Hypothesentests: Schritt 1: Formulierung von Null- und Alternativhypothese, wobei die Forschungshypothese möglichst der Alternativhypothese entsprechen soll.. Schritt 2: Auswahl von Teststatistik und Testverteilung Schritt 3: Festlegung von Irrtumswahrscheinlichkeit α unter Berücksichtigung der Trennschärfe und des Ablehnungsbereiches der Nullhypothese über die kritischen Werte wobei zwischen einseitigen und zweiseitigen Tests unterschieden werden soll. Schritt 4: Berechnung der Teststatistik und Entscheidung Schritt 5: Kontrolle der Anwendungsvoraussetzungen Vorlesung Statistik I 1

3 Empirisches Signifikanzniveau Zusätzlich zum Wert der Teststatistik wird vor allem bei Signifikanztests oft das empirische Signifikanzniveau berichtet, das die Wahrscheinlichkeit angibt, dass eine Teststatistik bei (gerade noch) zutreffender Nullhypothese den beobachteten Wert annimmt oder einen Wert, der noch stärker gegen die Nullhypothes spricht. f(p 1 π 1 = 0.5) Z= % Z= % Im Beispiel des zweiseitigen Tests der Nullhypothese H 0 : π 1 = 0.5 beträgt der Wert der Teststatistik Diesem Wert entspricht im zweiseitigen Test ein empirisches Signifikanzniveau von 52.8%: Pr(Z 0.632) = 1 Φ(0.632) = 26.4% Pr(Z 0.632) = Φ( 0.632) = 26.4% Pr( Z 0.632) = 52.8% Ist das empirische Signifikanzniveau kleiner als die maximale Irrtumswahrscheinlichkeit α, dann ist die Nullhypothese zu verwerfen; ist das empirische Signifikanzniveau größer oder gleich der maximale Irrtumswahrscheinlichkeit α, dann ist die Nullhypothese beizubehalten. Z Vorlesung Statistik I 2

4 Signifikanztest und Neyman-Pearson-Test Die Vorgehensweise beim Signifikanztest nach Fisher und dem Hypothesentest nach Neyman und Pearson ist bei der praktischen Anwendung meistens identisch: Die Nullhypothese wird abgelehnt, wenn der Wert der Teststatistik in der Stichprobe bei gegebener maximaler α-fehlerwahrscheinlichkeit im Ablehnungsbereich liegt, wobei die Nullhypothese (möglichst) das Gegenteil der eigentlich interessierenden Forschungshypothese postuliert. Der Unterschied liegt vor allem darin, dass beim Neyman-Pearson-Test von vornherein auch die Möglichkeit eines β-fehlers berücksichtigt wird. Dies hat zur Folge, dass als Teststatistik nur eine Statistik in Frage kommt, deren Kennwerteverteilung sich bei Zutreffen der Null- bzw. der Alternativhypothese unterscheidet. Die Berücksichtigung der Trennschärfe führt zudem dazu, dass vor der Durchführung eines Tests der notwendige Stichprobenumfang und der Wert der maximalen α-fehlerwahrscheinlichkeit stärker ins Blickfeld gerät. Dies ermöglicht es, Kritik an einer rein mechanischen Anwendung von Signifikanztests zu begegnen. Die Kritik an Signifikanztest bezieht sich vor allem darauf, dass bei sehr großen Fallzahlen praktisch jede empirische Teststatistik signifikant wird, die Nullhypothese also abgelehnt wird. Umgekehrt ist es bei sehr kleinen Fallzahlen oft kaum möglich ein signifikantes Ergebnis zu erhalten. Beide Ergebnisse sind Folge der eigentlich erwünschten Eigenschaft, dass die Höhe des Standardfehlers einer Teststatistik mit steigender Fallzahl sinkt. Dies hat die Folge, dass auch der Ablehnungsbereich bei großen Fallzahlen sehr groß ist, bei kleinen Fallzahlen dagegen sehr klein ist. Vorlesung Statistik I 3

5 Signifikanztest und Neyman-Pearson-Test -> Fallzahlanpassung Beim Neyman-Pearson-Test kann dies berücksichtigt werden, indem entsprechend die α-fehlerwahrscheinlichkeit an die Fallzahl angepasst wird, bei großen Fallzahlen also nur eine sehr kleine maximale α-fehlerwahrscheinlichkeit akzeptiert wird. Bei sehr kleinen Fallzahlen kann dagegen auch bei großen α-fehlerwahrscheinlichkeiten die Trennschärfe so gering sein, dass der Test nicht informativ ist. Dann ist die Duchführung eines Tests gar nicht mehr sinnvoll. Bei der Anwendung eines statistischen Tests kommt es zudem darauf an, auch inhaltlich relevante Hypothesenpaare zu formulieren. Wird etwa die Nullhypothese, dass es keinen Zusammenhang zwischen zwei Variablen gibt, gegen die Altenativhypothese geprüft, dass es einen Zusammenhang gibt, dann führt ein Test korrekterweise bei großen Fallzahlen vermutlich selbst dann zu einem signifikanten Ergebnis, wenn der Zusammenhang sehr gering ist. Wenn aber ein nur geringer Zusammenhang inhaltlich nicht interessiert, wäre eine Hypothesenformulierung angemessener, bei der die Nullhypothese behauptet, dass ein Zusammenhang geringer oder gleich einem Minimalwert ist, der als praktisch irrelevant betrachtet wird. Vorlesung Statistik I 4

6 Beziehung zwischen Hypothesentest und Konfidenzintervallen Es wurde bereits darauf hingewiesen, dass ein Hypothesentest auch über die Berechnung eines Konfidenzintervalls durchgeführt werden kann. Tatsächlich entspricht die Berechnung eines Konfidenzintervalls einem zweiseitigen Hypothesentest, bei dem die Nullhypothese immer dann abgelehnt wird, wenn der durch die Nullhypothese postulierter Wert außerhalb der Grenzen des Konfidenzintervalls liegt. Die Nullhypothese wird umgekehrt beibehalten, wenn der durch die Nullhypothese postulierter Wert innerhalb des Konfidenzintervalls liegt. Entsprechend kann der Annahmebereich beim zweiseitigen Hypothesentest analog der Berechnung eines Konfidenzintervalls als Berechnung eines Intervalls um den durch die Nullhypothese postulierten Wert erfolgen. Dies kann am Beispiel des Test eines Populationsanteils verdeutlicht werden, wenn als Teststatistik nicht Z, sondern der Stichprobenanteil verwendet wird. Der Annahmebereich des Hypothesenpaars H 0 : π 1 = π vs. H 1 : π 1 πberechnet sich dann nach: Annahmebereich von H : c.i. ( H ) π =π ± H 0 1H ( 1 1H ) π π 0 0 Der Unterschied zum üblichen Konfidenzintervall besteht allein darin, dass beim Konfidenzintervall das Intervall um den Stichprobenwert berechnet wird: ( ) Konfidenzintervall von π: c.i. π = p ± ( ) p 1 p 1 1 n n Vorlesung Statistik I 5

7 Von der Anteilsdifferenz zur Vierfeldertabelle Eine der wichtigsten Aufgaben der Statistik in den Sozialwissenschaften besteht in der Analyse von Zusammenhängen. So mag sich z.b. ein Sozialwissenschaftler dafür interessieren, ob die Einstellung zum Schwangerschaftsabbruch bei Männern und Frauen unterschiedlich ist. Als empirische Datenbasis findet sich im Allbus 1996 die Antworten von Befragten auf die Frage, ob Schwangerschaftsabbruch bei finanzieller Notlage erlaubt oder verboten sein sollte. Um diese Fragen zu beantworten, müssen die Antworten der Männer auf diese Frage mit den Antworten der Frauen auf diese Frage verglichen werden. Berechnet man getrennt die Häufigkeitsverteilung von Männern und Frauen ergibt sich folgendes Bild: Antworten männlicher Befragter Schwangerschaftsabbruch bei finanzieller Notlage n k p k cp k - sollte erlaubt sein sollte verboten sein Summe (Quelle: Allbus 1996) Antworten weiblicher Befragter Schwangerschaftsabbruch bei finanzieller Notlage n k p k cp k - sollte erlaubt sein sollte verboten sein Summe (Quelle: Allbus 1996) Vorlesung Statistik I 6

8 Von der Anteilsdifferenz zur Vierfeldertabelle Antworten männlicher Befragter Schwangerschaftsabbruch bei finanzieller Notlage n k p k cp k - sollte erlaubt sein sollte verboten sein Summe (Quelle: Allbus 1996) Antworten weiblicher Befragter Schwangerschaftsabbruch bei finanzieller Notlage n k p k cp k - sollte erlaubt sein sollte verboten sein Summe (Quelle: Allbus 1996) Der Vergleich der beiden Verteilungen zeigt, dass die weiblichen Befragten in der Allbus- Stichprobe sich zu einem geringfügig größeren Anteil für die Erlaubnis des Schwangerschaftsabbruchs aussprechen als die männlichen Befragten: Die Differenz der entsprechenden Anteile beträgt = Die Darstellung der Häufigkeitsverteilungen der Antworten in zwei getrennten Tabellen für Männer und Frauen erscheint nicht sehr sinnvoll, wenn die Zahlen für die Interpretation wieder zusammengestellt werden müssen. Tatsächlich kann in der bivariaten Zusammenhangsanalyse die gemeinsame Häufigkeitsverteilung von zwei Variablen in einer Kreuztabelle analysiert werden. Vorlesung Statistik I 7

9 Von der Anteilsdifferenz zur Vierfeldertabelle Antworten männlicher Befragter Schwangerschaftsabbruch bei finanzieller Notlage n k p k cp k - sollte erlaubt sein sollte verboten sein Summe Antworten weiblicher Befragter Schwangerschaftsabbruch bei finanzieller Notlage n k p k cp k - sollte erlaubt sein sollte verboten sein Summe Kreuztabelle von Haltung zum Schwangerschaftsabbruch und Geschlecht: - sollte erlaubt sein sollte verboten sein Summe Die Daten in der Kreuztabelle enthalten die gleichen Zahlen wie die getrennten univariaten Häufigkeitstabellen. So ist erkennbar, dass von den 1532 männlichen Befragten 908 für eine Erlaubnis und 624 für ein Verbot des Schwangerschaftsabbruchs bei finanzieller Notlage sind und von den 1568 Frauen 962 für eine Erlaubnis und 606 für ein Verbot. Vorlesung Statistik I 8

10 Von der Anteilsdifferenz zur Vierfeldertabelle Antworten männlicher Befragter Schwangerschaftsabbruch bei finanzieller Notlage n k p k cp k - sollte erlaubt sein sollte verboten sein Summe Antworten weiblicher Befragter Schwangerschaftsabbruch bei finanzieller Notlage n k p k cp k - sollte erlaubt sein sollte verboten sein Summe Kreuztabelle von Haltung zum Schwangerschaftsabbruch und Geschlecht: - sollte erlaubt sein sollte verboten sein Summe Zusätzlich enthält die Kreuztabelle aber auch in der unteren Zeile bzw. der rechten Randspalte Informationen über die univariaten Häufigkeitsverteilungen der beiden betrachteten Variablen X ( Geschlecht ) und Y ( Schwangerschaftsabbruch ). Vorlesung Statistik I 9

11 Von der Anteilsdifferenz zur Vierfeldertabelle Schwangerschaftsabbruch (Y) bei finanzieller Notlage n k p k cp k - sollte erlaubt sein sollte verboten sein Summe Geschlecht (X) des Befragten n k p k cp k - männlich weiblich Summe Zeilenvar riable Spaltenvariable - sollte erlaubt sein sollte verboten sein Summe Die Variable, deren Ausprägungen die Zeilen der Kreuztabelle festlegen, heißt Zeilenvariable. Im Beispiel ist die Variable Y Haltung zum Schwangerschaftsabbruch Zeilenvariable. Die Variable, deren Ausprägungen die Spalten der Kreuztabelle festlegen, heißt Spaltenvariable. Im Beispiel ist die Variable X Gechlecht Spaltenvariable. Vorlesung Statistik I 10

12 Von der Anteilsdifferenz zur Vierfeldertabelle Schwangerschaftsabbruch (Y) bei finanzieller Notlage n k p k cp k - sollte erlaubt sein sollte verboten sein Summe Geschlecht (X) des Befragten n k p k cp k - männlich weiblich Summe Zeilenvar riable Spaltenvariable - sollte erlaubt sein sollte verboten sein Summe Entsprechend der Zahl der Ausprägungen der Zeilen- und der Spaltenvariable spricht man von I J-Tabellen (engl. r by c-tables), wenn die Zeilenvariable I Ausprägungen und die Spaltenvariable J Ausprägungen hat. Im Beispiel liegt eine 2 mal 2 -Tabelle vor, da beide Variablen dichotom sind, also nur 2 Ausprägungen haben. Die 2 2-Tabelle ist die kleinstmögliche Kreuztabelle von zwei Variablen. Sie hat 2 2 = 4 (innere) Zellen. Man bezeichnet solche Kreuztabellen auch als Vierfeldertabelle (oder Vierfeldertafel). Vorlesung Statistik I 11

13 Von der Anteilsdifferenz zur Vierfeldertabelle Zeilenvar riable Spaltenvariable - sollte erlaubt sein n n n sollte verboten sein n n n Summe n n Um die einzelnen Zellen einer Kreuztabelle eindeutig zu identifizieren, werden Indizes verwendet, die die Nummer der Ausprägung der Zeilen- und Spaltenvariablen angeben. Im Beispiel gibt es 908 Fälle mit der Ausprägungskombination männlich und sollte erlaubt sein, d.h. n 11 = 908 An erster Stelle steht immer der Zeilenindex, an zweiter Stelle der Spaltenindex. n 21 ist daher die gemeinsame Häufigkeit der zweiten Ausprägung der Zeilenvariable und der ersten Ausprägung der Spaltenvariable. n 12 ist dagegen die gemeinsame Häufigkeit der ersten Ausprägung der Zeilenvariable und der zweiten Ausprägung der Spaltenvariable. Die univariaten Verteilungen am rechten und unteren Rand, die sich auch durch Aufsummieren der inneren Tabellenzellen ergeben, werden dadurch gekennzeichnet, dass ein oder ein + für den Index steht, über den aufsummiert wird. n 1 oder n 1+ ist daher die Häufigkeit der ersten Ausprägung der Zeilenvariable; n 1 oder n +1 ist daher die Häufigkeit der ersten Ausprägung der Spaltenvariable Vorlesung Statistik I 12

14 Von der Anteilsdifferenz zur Vierfeldertabelle Zeilenvar riable Spaltenvariable - sollte erlaubt sein n n n sollte verboten sein n n n Summe n n n 3100 n In der untersten rechten Zelle steht dann die Gesamtfallzahl n (oder einfach n). Im Beispiel ist n=3100. In der Regel werden in einer Kreuztabelle Ausprägungen für ungültige Fäle (missing values) nicht aufgeführt. Wenn es keine ungültigen Fälle gibt, ist die Gesamtfallzahl gleich dem Stichprobenumfang. Tatsächlich enthält der Allbus Fälle, von denen 1738 männlich und 1780 weiblich sind. Geschlecht n k - männlich weiblich k. A. 0 Summe 3518 Bei der Frage nach dem Schwangerschaftsabbruch bei finanzieller Notlage gibt es jedoch 418 ungültige Angaben, wobei 396 Befragte mit weiß nicht antworteten und von 22 Befragten keine Angabe vorliegt. Abtreibung n k - erlaubt verboten w. n k. A. 22 Summe 3518 Vorlesung Statistik I 13

15 Von der Anteilsdifferenz zur Vierfeldertabelle Zeilenvar riable Spaltenvariable - sollte erlaubt sein a 908 b a+b - sollte verboten sein c 624 d c+d Summe a+c 1532 b+d n In Vierfeldertabellen gibt es die Besonderheit, dass die vier inneren Tabellenzellen auch durch die ersten vier kleinen Buchstaben des Alphabets bezeichnet werden. Im Beispiel ist a=908, b=962, c=623 und d=606. Wenn wie im Beispiel die Zellen einer Kreuztabelle die absoluten Auftretenshäufigkeiten enthalten, dann zeigt die Tabelle die gemeinsame oder bivariate Häufigkeitsverteilung der Zeilen- und der Spaltenvariable in der Stichprobe. Da die univariate Häufigkeitsverteilungen der beiden Variablen in den rechten bzw. unteren Randzellen der Tabelle wiedergegeben werden, werden die univariaten Verteilungen in diesem Kontext auch als Randverteilungen bezeichnet. Formal ergeben sich Randverteilungen durch Aggregation über die Ausprägungen anderer Variablen. Die Randverteilung der ZeilenvariableGeschlechts ergibt sich im Beispiel durch Aufsummieren über die Ausprägungen der Spaltenvariable. Vorlesung Statistik I 14

16 Zusammenhangsanalyse in der Vierfeldertabelle Kreuztabelle von Haltung zum Schwangerschaftsabbruch und Geschlecht: - sollte erlaubt sein sollte verboten sein Summe Ziel der Betrachtung einer bivariaten Verteilung ist die Beantwortung der Frage, ob, und wenn, welcher Zusammenhang zwischen den beiden Variablen besteht. Im Beispiel sollte der Frage nachgegangen werden, ob sich die Einstellung zum Schwangerschaftsabbruch bei Männern und Frauen unterscheidet. Dazu wurden die relativen Häufigkeiten von Männern und Frauen verglichen. Statistisch gesehen ist der Vergleich der relativen Antworthäufigkeiten der Männern mit der der Frauen ein Vergleich von bedingten (konditionalen) Verteilungen. - sollte erlaubt sein (908) (962) (1870) - sollte verboten sein (624) (606) (1230) Summe (1532) (1568) (3100) (Quelle: Allbus 1996 Vorlesung Statistik I 15

17 Zusammenhangsanalyse in der Vierfeldertabelle - sollte erlaubt sein (908) (962) (1870) - sollte verboten sein (624) (606) (1230) Summe (1532) (1568) (3100) (Quelle: Allbus 1996 Bei der Berechnung werden die Zellenhäufigkeiten in jeder Spalte durch die Spaltensumme in der unteren Zeile geteilt: nij p = i(j) n j - sollte erlaubt sein p 1(1) = n 11 /n 1 p 1(2) = n 12 /n 2 p 1 = n 1 /n - sollte verboten sein p 2(1) = n 21 /n 1 p 2(2) = n 22 /n 2 p 2 = n 2 /n Summe (n 1 ) (n 2 ) (n) Um die bedingende Variable von der bedingten zu unterscheiden, wird der Index der bedingenden Variable - Beispiel die Spaltenvariable Geschlecht - in Klammern gesetzt. p i(j) steht also für die (konditionale) relative Häufigkeit der i-ten Ausprägung der Zeilenvariable, wenn die Spaltenvariable die j-te Ausprägung aufweist. Vorlesung Statistik I 16

18 Zusammenhangsanalyse in der Vierfeldertabelle - sollte erlaubt sein 59.3% (908) 61.4% (962) % (1870) - sollte verboten sein 40.7% (624) 38.6% (606) % (1230) Summe 100.0% (1532) 100.0% (1568) 100.0% (3100) (Quelle: Allbus 1996) Anstelle der Anteile werden oft Prozentwerte angegeben. Wärend 59.3% der Männer der Ansicht sind, Schwangerschaftsabbruch bei finanzieller Notlage sollte erlaubt sein, sind es 61.4% der Frauen, die diese Ansicht teilen. Zwei Zufallsvariablen sind statistisch unabhängig voneinander, wenn bedingte und unbedingte Verteilungen gleich sind. Bei Unabhängigkeit sollten daher in der Kreuztabelle die relativen Häufigkeiten der konditionalen Verteilungen gleich den Randverteilungen sein. Im Beispiel müssten dann die Prozentwerte in der ersten Zeile stets 60.3% betragen und in der zweiten Zeile 39.7%. Da sich relative Häufigkeiten und absolute Häufigkeiten ineinander umrechnen lassen, lässt sich berechnen, welche absoluten Häufigkeiten zu erwarten wären, wenn Unabhängigkeit zwischen den Variablen bestünde, indem die relativen Häufigkeiten mit der jeweiligen Bezugszahl multipliziert wird. Vorlesung Statistik I 17

19 Zusammenhangsanalyse in der Vierfeldertabelle - sollte erlaubt sein 59.3% (908) 61.4% (962) 60.3% (1870) - sollte verboten sein 40.7% (624) 38.6% (606) 39.7% (1230) Summe 100.0% (1532) 100.0% (1568) 100.0% (3100) (Quelle: Allbus 1996) Bei Unabhängigkeit ergäbe sich für a = = 923.8, b = = 945.5, c = = und d = = Bei Unabhängigkeit erwartete Häufigkeiten - sollte erlaubt sein 60.3% (923.8) 60.3% (945.5) 60.3% (1870) - sollte verboten sein 39.7% (608.2) 39.7% (622.5) 39.7% (1230) Summe 100.0% (1532) 100.0% (1568) 100.0% (3100) In der Realität sind allerdings Häufigkeiten mit Nachkommastellen unmöglich. Tatsächlich sind die bei Unabhängigkeit erwarteten Häufigkeiten als Erwartungswerte von binomialverteilten Zufallsvariablen zu interpretieren: Wenn es in einer Population sowohl unter den Männern wie den Frauen 60.3% gibt, die für die Erlaubnis des Schwangerschaftsabbruchs sind, und in einfachen Zufallsauswahlen jeweils 1532 Männer und 1568 Frauen ausgewählt werden, dann wäre der Erwartungswert der Männer (= n π 1 = ) und der der Frauen Vorlesung Statistik I 18

20 Zusammenhangsanalyse in der Vierfeldertabelle - sollte erlaubt sein 59.3% (908) 61.4% (962) 60.3% (1870) - sollte verboten sein 40.7% (624) 38.6% (606) 39.7% (1230) Summe 100.0% (1532) 100.0% (1568) 100.0% (3100) (Quelle: Allbus 1996) Neben dem Extrem statistischer Unabhängigkeit (kein Zusammenhang) kann auch der umgekehrte Fall eines maximalen (perfekten) Zusammenhangs interessieren. Im Beispiel wäre das der Fall, wenn entweder alle Männer für Erlaubnis und alle Frauen für ein Verbot wären oder umgekehrt alle Männer für ein Verbot und alle Frauen für Erlaubnis. - sollte erlaubt sein 100% (1532) 0% (0) 49.4% (1532) - sollte verboten sein 0% (0) 100% (1568) 50.6% (1568) Summe 100% (1532) 100% (1568) 100.0% (3100) - sollte erlaubt sein 0% (0) 100% (1568) 50.6% (1568) - sollte verboten sein 100% (1532) 0% (0) 49.4% (1532) Summe 100% (1532) 100% (1568) 100.0% (3100) Vorlesung Statistik I 19

21 Prozentsatzdifferenz - sollte erlaubt sein 59.3% (908) 61.4% (962) 60.3% (1870) - sollte verboten sein 40.7% (624) 38.6% (606) 39.7% (1230) Summe 100.0% (1532) 100.0% (1568) 100.0% (3100) (Quelle: Allbus 1996) Als Maß für die Stärke des Zusammenhang bietet es sich daher an, die Differenz der Prozentwerte der Ausprägungen der Haltung zum Schwangerschaftsabruch zwischen den beiden Gechlechtern als Zusammenhangsmaß zu verwenden. Dieses Zusammenhangsmaß heißt Prozentsatzdifferenz d YX % und gibt die Differenz der bedingten relativen Häufigkeiten in Prozentpunkten an: n11 n 11 a b d YX % = 100 ( p1(1) p1( 2) ) = 100 = 100 n 1 n 2 a+ c b+ d - sollte erlaubt sein a 908 b a+b - sollte verboten sein c 624 d c+d Summe a+c 1532 b+d n Im Beispiel beträgt die Prozentsatzdifferenz 100 (908/ /1568) = 2.08 Prozentpunkte. Vorlesung Statistik I 20

22 Prozentsatzdifferenz Der Wertebereich der Prozentsatzdifferenz liegt zwischen 100 Prozentpunkten und +100 Prozentpunkten. Besteht kein Zusammenhang, beträgt der Wert 0 Prozentpunkte. Schwangerschaftsabbruch Geschlecht (X) Summe - sollte erlaubt sein 60.3% 60.3% 60.3% - sollte verboten sein 39.7% 39.7% 39.7% Summe (1532) (1568) (3100) d YX = 0.0% kein Zusammenhang Schwangerschaftsabbruch Geschlecht (X) Summe - sollte erlaubt sein 100% 0% 49.4% - sollte verboten sein 0% 100% 50.6% Summe (1532) (1568) (3100) d YX = % perfekter positiver Zusammenhang Schwangerschaftsabbruch Geschlecht (X) Summe - sollte erlaubt sein 0% 100% 50.6% - sollte verboten sein 100% 0% 49.4% Summe (1532) (1568) (3100) d YX = 100.0% perfekter negativer Zusammenhang Vorlesung Statistik I 21

23 Prozentsatzdifferenz Als Faustregel für die Interpretation einer Prozentsatzdifferenz wird der Wertebereich in Regionen eingeteilt: 5% < d YX % < +5% praktisch kein Zusammenhang +5% d YX % < +10% bzw. 10% < d YX % 5% +10% d YX % < +25% bzw. 25% < d YX % 10% +25% d YX % bzw. 25% d YX % geringer Zusammenhang mittlerer Zusammenhang starker Zusammenhang Das Vorzeichen ist ab ordinalem Skalenniveau interpretierbar. Bei der Interpretation des Vorzeichens ist allerdings Vorsicht angebracht, da es von der Kodierung der Variablen abhängt, ob eine Prozentsatzdifferenz positiv oder negativ ist. Das Vorzeichen der Prozentsatzdifferenz stimmt mit der Richtung der Beziehung (positiv: je mehr X desto mehr Y bzw. negativ: je mehr X desto weniger Y) nur, wenn die erste Ausprägung sowohl der Spalten- wie auch der Zeilenvariablen entweder für ein mehr oder für ein weniger einer Eigenschaft stehen. Im Zweifelsfall sollte nur der Absolutbetrag der Prozentsatzdifferenz berichtet werden. Vorlesung Statistik I 22

24 Prozentsatzdifferenz - sollte erlaubt sein 59.3% (908) 61.4% (962) 60.3% (1870) - sollte verboten sein 40.7% (624) 38.6% (606) 39.7% (1230) Summe 100.0% (1532) 100.0% (1568) 100.0% (3100) (Quelle: Allbus 1996) Stärke eines Zusammenhangs praktisch kein 0 d YX % < 5 geringer 5 d YX % < 10 mittlerer 10 d YX % < 25 starker 25 d YX % Die Prozentsatzdifferenz von nur 2.1 Prozentpunkten weist darauf hin, dass es praktisch keinen Unterschied zwischen Männern und Frauen bei der Frage gibt, ob ein Schwangerschaftsabbruch bei finanzieller Notlage erlaubt oder verboten sein sollte. Das negative Vorzeichen ( = 2.1) besagt aufgrund der Kodierung, dass bei Frauen ein höherer Wert steht als bei Männern. Wären die Werte für weibliche Befragte in der ersten Spalte oder wären in der ersten Zeile der ersten Zeile die Werte derjenigen aufgetragen, die für ein Verbot sind, dann wäre die Prozentsatzdifferenz positiv. Vorlesung Statistik I 23

25 Kennwerteverteilung der Prozentsatzdifferenz Zeilenvar riable Spaltenvariable - sollte erlaubt sein 59.3% (908) 61.4% (962) 60.3% (1870) - sollte verboten sein 40.7% (624) 38.6% (606) 39.7% (1230) Summe 100.0% (1532) 100.0% (1568) 100.0% (3100) (Quelle: Allbus 1996) Die Prozentsatzdifferenz ist eine Linearkombination von zwei Anteilen p 1(1) und p 1(2) in einer Kreuztabelle. In einer einfachen Zufallsauswahl sind die beiden Anteile jeweils asymptotisch normalverteilt und statistisch unabhängig voneinander, wenn entweder getrennte Stichproben für die beiden Ausprägungen der Spaltenvariable gezogen werden, oder aber es dem Zufalls der Auswahl überlassen bleibt, welche Ausprägung bei der Spaltenvariable realisiert wird. Die Kennwerteverteilung ist dann ebenfalls asymptotisch normalverteilt, wobei sich Erwartungswert und Varianz nach den Regeln für Linearkombinationen berechnen lassen: d YX % = 100 p 1(1) + ( 100) p 1(2) f d YX % N 100 1(1) 1( 2) ;100 π π π π n 1 n 2 2 1(1) 2(1) 1( 2) 2( 2) ( ) = ( π π ) + Vorlesung Statistik I 24

26 Kennwerteverteilung der Prozentsatzdifferenz Zeilenvar riable Spaltenvariable - sollte erlaubt sein 59.3% a (908) 61.4% b(962) 60.3% (1870) - sollte verboten sein 40.7% c(624) 38.6% d(606) 39.7% (1230) Summe 100.0% (1532) 100.0% (1568) 100.0% (3100) (Quelle: Allbus 1996) Da die Populationsanteile π 1(1), π 2(1), π 1(2) und π 2(2) unbekannt sind, werden sie durch die Stichprobenanteile p 1(1), p 2(1), p 1(2) und p 2(2) geschätzt. Der Standardfehler der Prozentsatzdifferenz beträgt dann: p p p p a c b d σ ˆ d % = = ( ) 1(1) 2(1) 1( 2) 2( 2) YX 3 3 n 1 n 2 a c b d ( + ) ( + ) Die Annäherung an die Normalverteilung ist hinreichend genau, wenn (a) n 1 p 1(1) /p 2(1) = (a+c) a/c > 9 bzw. n 1 p 2(1) /p 1(1) = (a+c) c/a > 9, (b) n 2 p 1(2) /p 2(2) = (b+d) b/d > 9 bzw. n 2 p 2(2) /p 1(2) = (b+d) d/b > 9, (c) n 1 > 60 und (c) n 2 > 60 Vorlesung Statistik I 25

27 Konfidenzintervall für die Prozentsatzdifferenz Zeilenvar riable Spaltenvariable - sollte erlaubt sein 59.3% a (908) 61.4% b(962) 60.3% (1870) - sollte verboten sein 40.7% c(624) 38.6% d(606) 39.7% (1230) Summe 100.0% (1532) 100.0% (1568) 100.0% (3100) (Quelle: Allbus 1996) Für das Beispiel des Zusammenhangs zwischen Haltung zum Schwangerschaftsabbruch und Geschlecht ergibt sich anhand der Allbus-Daten ein Standardfehler von: σ ˆ d % = = 1.76 ( ) ( 1532) ( 1568) YX 3 3 Analog zum Vorgehen bei Anteilen lässt sich das (1 α)-konfidenzintervall für die Prozentsatzdifferenz berechnen nach: a c c.i. δ % = d % ± z σ d % = d % ± z ( ) ˆ ( ) b d ( a+ c) ( b+ d) YX YX 1 α/ 2 YX YX 1 α/ Die Grenzen des 95%-Konfidenzintervalls berechnen sich für das Beispiel nach: 2.08 ± = [ 5.64 ; 1.48 ] Vorlesung Statistik I 26

28 Hypothesentests über Prozentsatzdifferenzen Die Kennwerteverteilung lässt sich auch für Hypothesentests über Prozentsatzdifferenzen nutzen. Schritt 1: Formulierung von Null- und Alternativhypothese Wie bei einfachen Anteilen lassen sich drei Hypothesenpaare unterscheiden: (a) H 0 : δ YX % = d% versus H 1 : δ YX % d% (b) H 0 : δ YX % d% versus H 1 : δ YX % > d% (c) H 0 : δ YX % d% versus H 1 : δ YX % < d% In den Hypothesen steht d% für einen vorgegebenen Wert, den die Prozentsatzdifferenz nach der Nullhypothese einnimmt (a), nicht überschreitet (b) oder nicht unterschreitet (c). Das erste Hypothesenpaar führt zu einem zweiseitigen, das zweite und dritte zu einseitigen Tests. Schritt 2: Auswahl von Teststatistik und Kennwerteverteilung Für die Teststatistik wird die asymptotische Normalverteilung der Kennwerteverteilung ausgenutzt und die Prozentsatzdifferenz in der Stichprobe unter der Annahme, dass d YX % = d% ist, standardisiert: a b d% X d YX% d% a + c b + d 100 Z = = Y 1 2 σˆ ( d YX% ) a c b d 1 a b a+b 3 3 ( a+ c) ( b+ d) 2 c d c+d a+c b+d n Vorlesung Statistik I 27

29 Hypothesentests über Prozentsatzdifferenzen Wenn die Prozentsatzdifferenz d YX % tatsächlich gleich d% ist, dann ist die Test-Statistik asymptotisch standardnormalverteilt. Trifft diese Annahme nicht zu, ist die Teststatistik normalverteilt mit einem Erwartungswert größer Null, wenn die Prozentsatzdifferenz δ YX % in der Population größer d% ist, bzw. mit einem Erwartungswert kleiner Null, wenn die Prozentsatzdifferenz δ YX % in der Population kleiner d% ist. Spezieller Standardfehler, wenn δ YX % = 0: Ein Wert von d% = 0 korrespondiert mit Nullhypothesen, nach denen die Prozentsatzdifferenz in der Population 0 ist, 0 nicht überschreitet oder unterschreitet. Falls tatsächlich δ YX % = 0, dann sind in der Population bedingte und unbedingte relative Häufigkeiten gleich. Dies kann bei der Berechnung des Standardfehlers ausgenutzt werden, in dem bei der Berechnung anstelle der bedingten Anteile aus den beiden Tabellenspalten jeweils der Standardfehler des unbedingten Anteils aus der Randverteilung herangezogen wird. Der Standardfehler der Teststatistik berechnet sich dann also nach: ( YX ) ˆ Z % 0 ( a+ b) ( c+ d) p p p p 1 1 n n n n a+ c b+ d σ δ = = + = X Y a b a+b 2 c d c+d a+c b+d n Vorlesung Statistik I 28

30 Hypothesentests über Prozentsatzdifferenzen Die Teststatistik ergibt sich nun nach: a b p1(1) p 2(1) Z = = a+ c b+ d 1 1 ( a+ b) ( c+ d) 1 1 p1 p + 2i + 2 n n a c b d 1 n X Y a b a+b 2 c d c+d a+c b+d n Schritt 3: Festlegung von Irrtumswahrscheinlichkeit und kritischen Werten Bei gegebener Irrtumswahrscheinlichkeit α (i.a. 5% oder 1%) ergeben sich die kritischen Werte wie beim Testen eines einfachen Anteils. Bei Test a) sind die kritischen Werte das (α/2)- und das (1 α/2)-quantil, beim Test b) das (1 α)-quantil und beim Test c) das α-quantil der Standardnormalverteilung. Schritt 4: Berechnung der Teststatistik und Entscheidung Im letzten Schritt wird die Teststatistik berechnet und anhand des resultierenden Wertes die Nullhypothese beibehalten bzw. verworfen. Die Nullhypothese H 0 wird mit einer Irrtumswahrscheinlichkeit α abgelehnt, wenn (a) beim Test von H 0 : δ YX % = d% gilt: Z z α/2 oder Z z 1 α/2, (b) beim Test von H 0 : δ YX % d% gilt: Z z 1 α bzw. (c) beim Test von H 0 : δ YX % d% gilt: Z z α. Vorlesung Statistik I 29

31 Hypothesentests über Prozentsatzdifferenzen: Ablehnungsbereich Die Ablehnungsbereiche ergeben sich jeweils danach, wann eine Teststatistik gegen die Nullhypothese spricht: Ablehnungsbereich bei H 0 : δ YX % = d% sehr kleine oder sehr große Werte sprechen gegen H 0 Ablehnungsbereich bei H 0 : δ YX % d% sehr große Werte sprechen gegen H 0 Ablehnungsbereich bei H 0 : δ YX % d% sehr kleine Werte sprechen gegen H 0 α/2 α/2 α α Z Z Z Aus dieser Betrachtung folgt: Die Nullhypothese H 0 wird mit einer Irrtumswahrscheinlichkeit α abgelehnt, wenn (a) beim Test von H 0 : δ YX % = d% gilt: Z z α/2 oder Z z 1 α/2, (b) beim Test von H 0 : δ YX % d% gilt: Z z 1 α bzw. (c) beim Test von H 0 : δ YX % d% gilt: Z z α. Vorlesung Statistik I 30

32 Hypothesentests über Prozentsatzdifferenzen Schritt 5: Prüfung der Anwendungsvoraussetzungen Vor der endgütligen Interpretation der Ergebnisse ist zu prüfen, ob die Anwendungsvoraussetzungen für die Durchführung des Tests erfüllt sind. Die Annäherung an die Normalverteilung ist hinreichend genau, wenn (a) n 1 p 1(1) /p 2(1) = (a+c) a/c > 9 bzw. n 1 p 2(1) /p 1(1) = (a+c) c/a > 9, (b) n 2 p 1(2) /p 2(2) = (b+d) b/d > 9 bzw. n 2 p 2(2) /p 1(2) = (b+d) d/b > 9, (c) n 1 > 60 und (c) n 2 > 60. Wird der Standardfehler unter der Annahme δ YX % = 0% berechnet, ist die Annäherung an die Normalverteilung bereits hinreichend genau, wenn (a) n p 1 /p 2 = n (a+b)/(c+d) > 9 bzw. n p 2 /p 1 = n (c+d)/(a+b) > 9 (b) n > 60 Beispiel: Als Beispiel soll geprüft werden, dass Frauen eher gegen ein Verbot von Schwangerschaftsabbrüchen sind als Männer. Diese Vermutung wird als Alternativhypothese eines Tests der Prozentsatzdifferenz formuliert. Datenbasis für den Test ist wiederum die Vierfeldertabelle mit den Allbus-Daten. Vorlesung Statistik I 31

33 Hypothesentests über Prozentsatzdifferenzen - sollte erlaubt sein 59.3% (908) 61.4% (962) 60.3% (1870) - sollte verboten sein 40.7% (624) 38.6% (606) 39.7% (1230) Summe 100.0% (1532) 100.0% (1568) 100.0% (3100) (Quelle: Allbus 1996) Schritt 1: Formulierung von Null und Alternativhypothese Aus der Forschungshypothese und der Anordnung der Variablen in der Tabelle folgt als zu testendes Hypothesenpaar: H 0 : δ YX % 0% versus H 1 : δ YX % < o% Die Forschungshypothese postuliert also eine negative Prozentsatzdifferenz. Zur Prüfung wird entsprechend ein einseitiger Test der Prozentsatzdifferenz nach unten durchgeführt. Schritt 2: Auswahl von Teststatistik und Kennwerteverteilung Als Teststatistik wird die Prozentsatzdifferenz in der Stichprobe an der Trennstelle zwischen Null- und Alternativhypothese standardisiert. Die Teststatistik Z ist dann standardnormalverteilt, wenn die Nullhypothese gerade noch richtig ist. Da nach der Nullhypothese δ YX % = 0%, wird der Standardfehler der Anteilsdifferenz über die Randverteilung der Zeilenvariable geschätzt. Vorlesung Statistik I 32

34 Hypothesentests über Prozentsatzdifferenzen - sollte erlaubt sein 59.3% (908) 61.4% (962) 60.3% (1870) - sollte verboten sein 40.7% (624) 38.6% (606) 39.7% (1230) Summe 100.0% (1532) 100.0% (1568) 100.0% (3100) (Quelle: Allbus 1996) X Y a b a+b 2 c d c+d a+c b+d n Zum Vergleich wird der Standardfehler der Anteilsdifferenz unter beiden Bedingungen berechnet. Ist δ YX % 0 berechnet sich der Standardfehler für die Allbusdaten nach: a c b d σ ˆ ( d YX% /100) = + = + = ( a+ c) ( b+ d) Unter der Annahme δ YX % 0 berechnet sich der Standardfehler für die Allbusdaten dagegen nach: ( ) ( ) a+ b c+ d σ ˆ ( d YX% /100) = = 2 + = n a + c b + d Aufgrund der sehr hohen Fallzahlen sind die Standardfehler bei diesen Daten bis auf die dritte Nachkommastelle gleich. Vorlesung Statistik I 33

35 Hypothesentests über Prozentsatzdifferenzen Die Teststatstik berechnet sich für diesen Test nach: a b Z = a+ c b+ d ( a+ b) ( c+ d) n a+ c b+ d X Y a b a+b 2 c d c+d a+c b+d n Ist die Prozentsatzdifferenz in der Population null, ist die Z standardnormalverteilt. Bei einer positiven Prozentsatzdifferenz in der Population ist die Teststatistik mit einem Erwartungswert größer Null, bei negativer Prozentsatzdifferenz in der Population mit einem Erwartungswert kleiner Null normalverteilt. Schritt 3: Festlegung von Irrtumswahrscheinlichkeit und kritischen Werten Die Irrtumswahrscheinlichkeit wird auf die üblichen 5% gesetzt. Die Nullhypothese wird bei dem einseitigen Test nach unten abgelehnt, wenn die Teststatistik kleiner oder gleich dem 5%- Quantil der Standardnormalverteilung ist, also den Wert erreicht oder unterschreitet. Schritt 4: Berechnung der Teststatistik und Entscheidung Die Berechnung führt zu einem nichtsignifikanten Ergebnis. Vorlesung Statistik I 34

36 Hypothesentests über Prozentsatzdifferenzen - sollte erlaubt sein 59.3% (908) 61.4% (962) 60.3% (1870) - sollte verboten sein 40.7% (624) 38.6% (606) 39.7% (1230) Summe 100.0% (1532) 100.0% (1568) 100.0% (3100) (Quelle: Allbus 1996) X Y a b a+b 2 c d c+d a+c b+d n a b Z = a + c b + d = = ( a+ b) ( c+ d) n a+ c b+ d Da Z=1.185 > 1.645, kann die Nullhypothese nicht verworfen werden. Bei einer Irrtumswahrscheinlichkeit von 5% kann nicht ausgeschlossen werden, dass sich Männer und Frauen bei der Haltung nicht unterscheiden oder Männer entgegen der Forschungshypothese sogar liberaler sind als Frauen. Schritt 5: Prüfung der Anwendungsvoraussetzungen Die Anwendungsvoraussetzungen sind erfüllt: (a) /1870 = 2039 > 9 und (b) 3100 > 60. Vorlesung Statistik I 35

9 Prinzipien der statistischen Hypothesenprüfung

9 Prinzipien der statistischen Hypothesenprüfung 9 Prinzipien der statistischen Hypothesenprüfung Prinzipien der statistischen Hypothesenprüfung Bei der Schätzung eines Populationsparamters soll dessen Wert aus Stichprobendaten erschlossen werden. Wenn

Mehr

Bivariater Zusammenhang in der Vierfeldertafel PEΣO

Bivariater Zusammenhang in der Vierfeldertafel PEΣO Bivariater Zusammenhang in der Vierfeldertafel PEΣO 12. Oktober 2001 Zusammenhang zweier Variablen und bivariate Häufigkeitsverteilung Die Bivariate Häufigkeitsverteilung gibt Auskunft darüber, wie zwei

Mehr

9 Prinzipien der statistischen Hypothesenprüfung

9 Prinzipien der statistischen Hypothesenprüfung 9 Prinzipien der statistischen Hypothesenprüfung Prinzipien der statistischen Hypothesenprüfung Bei der Schätzung eines Populationsparamters soll dessen Wert aus Stichprobendaten erschlossen werden. Wenn

Mehr

Bivariate Kreuztabellen

Bivariate Kreuztabellen Bivariate Kreuztabellen Kühnel, Krebs 2001 S. 307-342 Gabriele Doblhammer: Empirische Sozialforschung Teil II, SS 2004 1/33 Häufigkeit in Zelle y 1 x 1 Kreuztabellen Randverteilung x 1... x j... x J Σ

Mehr

Statistisches Testen

Statistisches Testen Statistisches Testen Grundlegendes Prinzip Erwartungswert Bekannte Varianz Unbekannte Varianz Differenzen Anteilswert Chi-Quadrat Tests Gleichheit von Varianzen Prinzip des Statistischen Tests Konfidenzintervall

Mehr

3 Grundlagen statistischer Tests (Kap. 8 IS)

3 Grundlagen statistischer Tests (Kap. 8 IS) 3 Grundlagen statistischer Tests (Kap. 8 IS) 3.1 Beispiel zum Hypothesentest Beispiel: Betrachtet wird eine Abfüllanlage für Mineralwasser mit dem Sollgewicht µ 0 = 1000g und bekannter Standardabweichung

Mehr

So berechnen Sie einen Schätzer für einen Punkt

So berechnen Sie einen Schätzer für einen Punkt htw saar 1 EINFÜHRUNG IN DIE STATISTIK: SCHÄTZEN UND TESTEN htw saar 2 Schätzen: Einführung Ziel der Statistik ist es, aus den Beobachtungen eines Merkmales in einer Stichprobe Rückschlüsse über die Verteilung

Mehr

Einführung in die Induktive Statistik: Testen von Hypothesen

Einführung in die Induktive Statistik: Testen von Hypothesen Einführung in die Induktive Statistik: Testen von Hypothesen Jan Gertheiss LMU München Sommersemester 2011 Vielen Dank an Christian Heumann für das Überlassen von TEX-Code! Testen: Einführung und Konzepte

Mehr

5. Seminar Statistik

5. Seminar Statistik Sandra Schlick Seite 1 5. Seminar 5. Seminar Statistik 30 Kurztest 4 45 Testen von Hypothesen inkl. Übungen 45 Test- und Prüfverfahren inkl. Übungen 45 Repetitorium und Prüfungsvorbereitung 15 Kursevaluation

Mehr

4.1. Nullhypothese, Gegenhypothese und Entscheidung

4.1. Nullhypothese, Gegenhypothese und Entscheidung rof. Dr. Roland Füss Statistik II SS 8 4. Testtheorie 4.. Nullhypothese, Gegenhypothese und Entscheidung ypothesen Annahmen über die Verteilung oder über einzelne arameter der Verteilung eines Merkmals

Mehr

Allgemeines zu Tests. Statistische Hypothesentests

Allgemeines zu Tests. Statistische Hypothesentests Statistische Hypothesentests Allgemeines zu Tests Allgemeines Tests in normalverteilten Grundgesamtheiten Asymptotische Tests Statistischer Test: Verfahren Entscheidungsregel), mit dem auf Basis einer

Mehr

Statistik II. IV. Hypothesentests. Martin Huber

Statistik II. IV. Hypothesentests. Martin Huber Statistik II IV. Hypothesentests Martin Huber 1 / 41 Übersicht Struktur eines Hypothesentests Stichprobenverteilung t-test: Einzelner-Parameter-Test F-Test: Multiple lineare Restriktionen 2 / 41 Struktur

Mehr

Einführung in SPSS. Sitzung 4: Bivariate Zusammenhänge. Knut Wenzig. 27. Januar 2005

Einführung in SPSS. Sitzung 4: Bivariate Zusammenhänge. Knut Wenzig. 27. Januar 2005 Sitzung 4: Bivariate Zusammenhänge 27. Januar 2005 Inhalt der letzten Sitzung Übung: ein Index Umgang mit missing values Berechnung eines Indexes Inhalt der letzten Sitzung Übung: ein Index Umgang mit

Mehr

Hypothesentests. Hypothese Behauptung eines Sachverhalts, dessen Überprüfung noch aussteht.

Hypothesentests. Hypothese Behauptung eines Sachverhalts, dessen Überprüfung noch aussteht. Hypothese Behauptung eines Sachverhalts, dessen Überprüfung noch aussteht. Wissenschaftliche Vorgehensweise beim Hypothesentest Forscher formuliert eine Alternativhypothese H 1 (die neue Erkenntnis, die

Mehr

WS 2014/15. (d) Bestimmen Sie die Wahrscheinlichkeitsfunktion von X. (e) Bestimmen Sie nun den Erwartungswert und die Varianz von X.

WS 2014/15. (d) Bestimmen Sie die Wahrscheinlichkeitsfunktion von X. (e) Bestimmen Sie nun den Erwartungswert und die Varianz von X. Fragenkatalog zur Übung Methoden der empirischen Sozialforschung WS 2014/15 Hier finden Sie die denkbaren Fragen zum ersten Teil der Übung. Das bedeutet, dass Sie zu diesem Teil keine anderen Fragen im

Mehr

Hypothesen über die Grundgesamtheit. Aufgabenstellung der Testtheorie Hypothesen (Annahmen, Vermutungen oder

Hypothesen über die Grundgesamtheit. Aufgabenstellung der Testtheorie Hypothesen (Annahmen, Vermutungen oder Hypothesen über die Grundgesamtheit Aufgabenstellung der Testtheorie Hypothesen (Annahmen, Vermutungen oder Behauptungen) über die unbekannte Grundgesamtheit anhand einer Stichprobe als richtig oder falsch

Mehr

Prüfung aus Statistik 2 für SoziologInnen

Prüfung aus Statistik 2 für SoziologInnen Prüfung aus Statistik 2 für SoziologInnen 11. Oktober 2013 Gesamtpunktezahl =80 Name in Blockbuchstaben: Matrikelnummer: Wissenstest (maximal 16 Punkte) Kreuzen ( ) Sie die jeweils richtige Antwort an.

Mehr

SozialwissenschaftlerInnen II

SozialwissenschaftlerInnen II Statistik für SozialwissenschaftlerInnen II Henning Best best@wiso.uni-koeln.de Universität zu Köln Forschungsinstitut für Soziologie Statistik für SozialwissenschaftlerInnen II p.1 Testen von Hypothesen

Mehr

Fit for Abi & Study Stochastik

Fit for Abi & Study Stochastik Fit for Abi & Study Stochastik Prof. Dr. Tilla Schade Hochschule Harz 15. und 16. April 2014 No. 1 Stochastik besteht aus: Wahrscheinlichkeitsrechnung Statistik No. 2 Gliederung Grundlagen Zufallsgrößen

Mehr

Bivariater Zusammenhang in der Mehrfeldertafel PEΣO

Bivariater Zusammenhang in der Mehrfeldertafel PEΣO Bivariater Zusammenhang in der Mehrfeldertafel PEΣO 9. November 2001 Bivariate Häufigkeitsverteilungen in Mehrfeldertabellen In der Mehrfeldertabelle werden im Gegensatz zur Vierfeldertabelle keine dichotomen

Mehr

Vorlesung: Statistik II für Wirtschaftswissenschaft

Vorlesung: Statistik II für Wirtschaftswissenschaft Vorlesung: Statistik II für Wirtschaftswissenschaft Prof. Dr. Helmut Küchenhoff Institut für Statistik, LMU München Sommersemester 2017 Einführung 1 Wahrscheinlichkeit: Definition und Interpretation 2

Mehr

Statistik. Sommersemester Prof. Dr. Stefan Etschberger Hochschule Augsburg. für Betriebswirtschaft und internationales Management

Statistik. Sommersemester Prof. Dr. Stefan Etschberger Hochschule Augsburg. für Betriebswirtschaft und internationales Management für Betriebswirtschaft und internationales Management Sommersemester 2015 Prof. Dr. Stefan Etschberger Hochschule Augsburg Testverteilungen Chi-Quadrat-Verteilung Sind X 1,..., X n iid N(0; 1)-verteilte

Mehr

Beurteilende Statistik

Beurteilende Statistik Beurteilende Statistik Wahrscheinlichkeitsrechnung und Beurteilende Statistik was ist der Unterschied zwischen den beiden Bereichen? In der Wahrscheinlichkeitstheorie werden aus gegebenen Wahrscheinlichkeiten

Mehr

STATISTIK Teil 2 Wahrscheinlichkeitsrechnung und schließende Statistik

STATISTIK Teil 2 Wahrscheinlichkeitsrechnung und schließende Statistik Kapitel 15 Statistische Testverfahren 15.1. Arten statistischer Test Klassifikation von Stichproben-Tests Einstichproben-Test Zweistichproben-Test - nach der Anzahl der Stichproben - in Abhängigkeit von

Mehr

3) Testvariable: T = X µ 0

3) Testvariable: T = X µ 0 Beispiel 4.9: In einem Molkereibetrieb werden Joghurtbecher abgefüllt. Der Sollwert für die Füllmenge dieser Joghurtbecher beträgt 50 g. Aus der laufenden Produktion wurde eine Stichprobe von 5 Joghurtbechern

Mehr

2 Wiederholung statistischer Grundlagen Schließende Statistik empirischen Information aus Stichprobenrealisation x von X

2 Wiederholung statistischer Grundlagen Schließende Statistik empirischen Information aus Stichprobenrealisation x von X Hypothesentests Bisher betrachtet: Punkt- bzw. Intervallschätzung des unbekannten Mittelwerts Hierzu: Verwendung der 1 theoretischen Information über Verteilung von X empirischen Information aus Stichprobenrealisation

Mehr

Statistik II. Statistische Tests. Statistik II

Statistik II. Statistische Tests. Statistik II Statistik II Statistische Tests Statistik II - 5.5.2006 1 Ausgangslage Wir können Schätzen (z.b. den Erwartungswert) Wir können abschätzen, wie zuverlässig unsere Schätzungen sind: In welchem Intervall

Mehr

Vorlesung: Statistik II für Wirtschaftswissenschaft

Vorlesung: Statistik II für Wirtschaftswissenschaft Vorlesung: Statistik II für Wirtschaftswissenschaft Prof. Dr. Helmut Küchenhoff Institut für Statistik, LMU München Sommersemester 2017 Einführung 1 Wahrscheinlichkeit: Definition und Interpretation 2

Mehr

Jost Reinecke. 7. Juni 2005

Jost Reinecke. 7. Juni 2005 Universität Bielefeld 7. Juni 2005 Testtheorie Test für unabhängige Stichproben Test für abhängige Stichproben Testtheorie Die Testtheorie beinhaltet eine Reihe von Testverfahren, die sich mit der Überprüfung

Mehr

Schätzen und Testen von Populationsparametern im linearen Regressionsmodell PE ΣO

Schätzen und Testen von Populationsparametern im linearen Regressionsmodell PE ΣO Schätzen und Testen von Populationsparametern im linearen Regressionsmodell PE ΣO 4. Dezember 2001 Generalisierung der aus Stichprobendaten berechneten Regressionsgeraden Voraussetzungen für die Generalisierung

Mehr

Modul 141 Statistik. 1. Studienjahr 11. Sitzung Signifikanztests

Modul 141 Statistik. 1. Studienjahr 11. Sitzung Signifikanztests Modul 141 Statistik 1. Studienjahr 11. Sitzung Signifikanztests Inhalt der 11. Sitzung 1. Parametrische Signifikanztests 2. Formulierung der Hypothesen 3. Einseitige oder zweiseitige Fragestellung 4. Signifikanzniveau

Mehr

Einführung in Quantitative Methoden

Einführung in Quantitative Methoden Einführung in Quantitative Methoden Pantelis Christodoulides & Karin Waldherr 4. Juni 2014 Christodoulides / Waldherr Einführung in Quantitative Methoden 1/35 Ein- und Zweiseitige Hypothesen H 0 : p =

Mehr

Statistische Tests (Signifikanztests)

Statistische Tests (Signifikanztests) Statistische Tests (Signifikanztests) [testing statistical hypothesis] Prüfen und Bewerten von Hypothesen (Annahmen, Vermutungen) über die Verteilungen von Merkmalen in einer Grundgesamtheit (Population)

Mehr

THEMA: "STATISTIK IN DER PRAXIS TESTEN IST BESSER ALS VERMUTEN" TORSTEN SCHOLZ

THEMA: STATISTIK IN DER PRAXIS TESTEN IST BESSER ALS VERMUTEN TORSTEN SCHOLZ WEBINAR@LUNCHTIME THEMA: "STATISTIK IN DER PRAXIS TESTEN IST BESSER ALS VERMUTEN" TORSTEN SCHOLZ EINLEITENDES BEISPIEL SAT: Standardisierter Test, der von Studienplatzbewerbern an amerikanischen Unis gefordert

Mehr

2. Formulieren von Hypothesen. Nullhypothese: H 0 : µ = 0 Gerät exakt geeicht

2. Formulieren von Hypothesen. Nullhypothese: H 0 : µ = 0 Gerät exakt geeicht 43 Signifikanztests Beispiel zum Gauß-Test Bei einer Serienfertigung eines bestimmten Typs von Messgeräten werden vor der Auslieferung eines jeden Gerätes 10 Kontrollmessungen durchgeführt um festzustellen,

Mehr

Kapitel 3 Schließende Statistik

Kapitel 3 Schließende Statistik Bemerkung 3.34: Die hier betrachteten Konfidenzintervalle für unbekannte Erwartungswerte sind umso schmaler, je größer der Stichprobenumfang n ist, je kleiner die (geschätzte) Standardabweichung σ (bzw.

Mehr

8. Konfidenzintervalle und Hypothesentests

8. Konfidenzintervalle und Hypothesentests 8. Konfidenzintervalle und Hypothesentests Dr. Antje Kiesel Institut für Angewandte Mathematik WS 2011/2012 Beispiel. Sie wollen den durchschnittlichen Fruchtsaftgehalt eines bestimmten Orangennektars

Mehr

2.4 Hypothesentests Grundprinzipien statistischer Hypothesentests. Hypothese:

2.4 Hypothesentests Grundprinzipien statistischer Hypothesentests. Hypothese: 2.4.1 Grundprinzipien statistischer Hypothesentests Hypothese: Behauptung einer Tatsache, deren Überprüfung noch aussteht (Leutner in: Endruweit, Trommsdorff: Wörterbuch der Soziologie, 1989). Statistischer

Mehr

Wahrscheinlichkeitsrechnung und Statistik für Biologen Spezielle Verteilungen

Wahrscheinlichkeitsrechnung und Statistik für Biologen Spezielle Verteilungen Wahrscheinlichkeitsrechnung und Statistik für Biologen Spezielle Verteilungen Noémie Becker & Dirk Metzler http://evol.bio.lmu.de/_statgen 7. Juni 2013 1 Binomialverteilung 2 Normalverteilung 3 T-Verteilung

Mehr

3.Wiederholung: Toleranzbereiche Für EX Geg:

3.Wiederholung: Toleranzbereiche Für EX Geg: 3.Wiederholung: Toleranzbereiche Für EX Geg: Vl. 24.2.2017 Schätzfunktion für Güte: Ist X Problem: Feb 17 13:21 > Wir berechnen Bereiche (Toleranzbereiche) für sind untere und obere Grenzen, berechnet

Mehr

Wahrscheinlichkeitsrechnung und Statistik für Biologen Wiederholung: Verteilungen

Wahrscheinlichkeitsrechnung und Statistik für Biologen Wiederholung: Verteilungen Wahrscheinlichkeitsrechnung und Statistik für Biologen Wiederholung: Verteilungen Noémie Becker & Dirk Metzler 31. Mai 2016 Inhaltsverzeichnis 1 Binomialverteilung 1 2 Normalverteilung 2 3 T-Verteilung

Mehr

Kapitel 3 Schließende Statistik

Kapitel 3 Schließende Statistik Beispiel 3.4: (Fortsetzung Bsp. 3.) bekannt: 65 i=1 X i = 6, also ˆp = X = 6 65 = 0, 4 Überprüfen der Voraussetzungen: (1) n = 65 30 () n ˆp = 6 10 (3) n (1 ˆp) = 39 10 Dr. Karsten Webel 194 Beispiel 3.4:

Mehr

Wahrscheinlichkeit 1-α: richtige Entscheidung - wahrer Sachverhalt stimmt mit Testergebnis überein. Wahrscheinlichkeit α: falsche Entscheidung -

Wahrscheinlichkeit 1-α: richtige Entscheidung - wahrer Sachverhalt stimmt mit Testergebnis überein. Wahrscheinlichkeit α: falsche Entscheidung - wahrer Sachverhalt: Palette ist gut Palette ist schlecht Entscheidung des Tests: T K; Annehmen von H0 ("gute Palette") positive T > K; Ablehnen von H0 ("schlechte Palette") negative Wahrscheinlichkeit

Mehr

Pflichtlektüre: Kapitel 12 - Signifikanztest Wie funktioniert ein Signifikanztest? Vorgehensweise nach R. A. Fisher.

Pflichtlektüre: Kapitel 12 - Signifikanztest Wie funktioniert ein Signifikanztest? Vorgehensweise nach R. A. Fisher. Pflichtlektüre: Kapitel 12 - Signifikanztest Überblick Signifikanztest Populationsparameter Ein Verfahren zur Überprüfung von Hypothesen, Grundlage bilden auch hier Stichprobenverteilungen, das Ergebnis

Mehr

DWT 2.1 Maximum-Likelihood-Prinzip zur Konstruktion von Schätzvariablen 330/467 Ernst W. Mayr

DWT 2.1 Maximum-Likelihood-Prinzip zur Konstruktion von Schätzvariablen 330/467 Ernst W. Mayr 2.1 Maximum-Likelihood-Prinzip zur Konstruktion von Schätzvariablen Wir betrachten nun ein Verfahren zur Konstruktion von Schätzvariablen für Parameter von Verteilungen. Sei X = (X 1,..., X n ). Bei X

Mehr

Lösungen zu den Übungsaufgaben in Kapitel 10

Lösungen zu den Übungsaufgaben in Kapitel 10 Lösungen zu den Übungsaufgaben in Kapitel 10 (1) In einer Stichprobe mit n = 10 Personen werden für X folgende Werte beobachtet: {9; 96; 96; 106; 11; 114; 114; 118; 13; 14}. Sie gehen davon aus, dass Mittelwert

Mehr

fh management, communication & it Constantin von Craushaar fh-management, communication & it Statistik Angewandte Statistik

fh management, communication & it Constantin von Craushaar fh-management, communication & it Statistik Angewandte Statistik fh management, communication & it Folie 1 Überblick Grundlagen (Testvoraussetzungen) Mittelwertvergleiche (t-test,..) Nichtparametrische Tests Korrelationen Regressionsanalyse... Folie 2 Überblick... Varianzanalyse

Mehr

Wiederholung Hypothesentests Zusammenfassung. Hypothesentests. Statistik I. Sommersemester Statistik I Hypothesentests I (1/36)

Wiederholung Hypothesentests Zusammenfassung. Hypothesentests. Statistik I. Sommersemester Statistik I Hypothesentests I (1/36) Statistik I Sommersemester 2009 Statistik I I (1/36) Wiederholung Grenzwertsatz Konfidenzintervalle Logik des 0.0 0.1 0.2 0.3 0.4 4 2 0 2 4 Statistik I I (2/36) Zum Nachlesen Agresti/Finlay: Kapitel 6+7

Mehr

Macht des statistischen Tests (power)

Macht des statistischen Tests (power) Macht des statistischen Tests (power) Realer Treatment ja Ergebnis der Studie H 0 verworfen statistisch signifikant O.K. Macht H 0 beibehalten statistisch nicht signifikant -Fehler Effekt nein -Fehler

Mehr

Testen von Hypothesen

Testen von Hypothesen Statistik 2 für SoziologInnen Testen von Hypothesen Univ.Prof. Dr. Marcus Hudec Statistik für SoziologInnen 1 Testtheorie Inhalte Themen dieses Kapitels sind: Erklären der Grundbegriffe der statistischen

Mehr

Testen von Hypothesen

Testen von Hypothesen Statistik 2 für SoziologInnen Testen von Hypothesen Univ.Prof. Dr. Marcus Hudec Statistik für SoziologInnen 1 Testtheorie Inhalte Themen dieses Kapitels sind: Erklären der Grundbegriffe der statistischen

Mehr

Überblick Hypothesentests bei Binomialverteilungen (Ac)

Überblick Hypothesentests bei Binomialverteilungen (Ac) Überblick Hypothesentests bei Binomialverteilungen (Ac) Beim Testen will man mit einer Stichprobe vom Umfang n eine Hypothese H o (z.b.p o =70%) widerlegen! Man geht dabei aus von einer Binomialverteilung

Mehr

Einführung in die Statistik

Einführung in die Statistik Elmar Klemm Einführung in die Statistik Für die Sozialwissenschaften Westdeutscher Verlag INHALTSVERZEICHNIS 1. Einleitung und Begrifflichkeiten 11 1.1 Grundgesamtheit, Stichprobe 12 1.2 Untersuchungseinheit,

Mehr

Mathematik für Biologen

Mathematik für Biologen Mathematik für Biologen Prof. Dr. Rüdiger W. Braun Heinrich-Heine-Universität Düsseldorf 16. Januar 2013 1 Allgemeine Hypothesentests Nullhypothese und Alternative Beispiel: Blutdrucksenker Testverfahren

Mehr

Universität Potsdam Institut für Informatik Lehrstuhl Maschinelles Lernen. Hypothesenbewertung. Christoph Sawade/Niels Landwehr Tobias Scheffer

Universität Potsdam Institut für Informatik Lehrstuhl Maschinelles Lernen. Hypothesenbewertung. Christoph Sawade/Niels Landwehr Tobias Scheffer Universität Potsdam Institut für Informatik Lehrstuhl Maschinelles Lernen Hypothesenbewertung Christoph Sawade/Niels Landwehr Tobias Scheffer Überblick Wiederholung: Konfidenzintervalle Statistische Tests

Mehr

Kapitel 13. Grundbegriffe statistischer Tests

Kapitel 13. Grundbegriffe statistischer Tests Kapitel 13 Grundbegriffe statistischer Tests Oft hat man eine Vermutung über die Verteilung einer Zufallsvariablen X. Diese Vermutung formuliert man als Hypothese H 0.Sokönnte man daran interessiert sein

Mehr

Die Familie der χ 2 (n)-verteilungen

Die Familie der χ 2 (n)-verteilungen Die Familie der χ (n)-verteilungen Sind Z 1,..., Z m für m 1 unabhängig identisch standardnormalverteilte Zufallsvariablen, so genügt die Summe der quadrierten Zufallsvariablen χ := m Z i = Z 1 +... +

Mehr

Statistik II für Betriebswirte Vorlesung 1

Statistik II für Betriebswirte Vorlesung 1 Statistik II für Betriebswirte Vorlesung 1 Dr. Andreas Wünsche TU Bergakademie Freiberg Institut für Stochastik 16. Oktober 2017 Dr. Andreas Wünsche Statistik II für Betriebswirte Vorlesung 1 Version:

Mehr

Die Familie der χ 2 (n)-verteilungen

Die Familie der χ 2 (n)-verteilungen Die Familie der χ (n)-verteilungen Sind Z 1,..., Z m für m 1 unabhängig identisch standardnormalverteilte Zufallsvariablen, so genügt die Summe der quadrierten Zufallsvariablen χ := m Z i = Z 1 +... +

Mehr

Hypothesenprüfung. Darüber hinaus existieren zahlreiche andere Testverfahren, die alle auf der gleichen Logik basieren

Hypothesenprüfung. Darüber hinaus existieren zahlreiche andere Testverfahren, die alle auf der gleichen Logik basieren Hypothesenprüfung Teil der Inferenzstatistik Befaßt sich mit der Frage, wie Hypothesen über eine (in der Regel unbekannte) Grundgesamtheit an einer Stichprobe überprüft werden können Behandelt werden drei

Mehr

Analyse von Querschnittsdaten. Signifikanztests I Basics

Analyse von Querschnittsdaten. Signifikanztests I Basics Analyse von Querschnittsdaten Signifikanztests I Basics Warum geht es in den folgenden Sitzungen? Kontinuierliche Variablen Generalisierung kategoriale Variablen Datum 13.10.2004 20.10.2004 27.10.2004

Mehr

Bereiche der Statistik

Bereiche der Statistik Bereiche der Statistik Deskriptive / Exploratorische Statistik Schließende Statistik Schließende Statistik Inferenz-Statistik (analytische, schließende oder konfirmatorische Statistik) baut auf der beschreibenden

Mehr

Klassifikation von Signifikanztests

Klassifikation von Signifikanztests Klassifikation von Signifikanztests nach Verteilungsannahmen: verteilungsabhängige = parametrische Tests verteilungsunabhängige = nichtparametrische Tests Bei parametrischen Tests werden im Modell Voraussetzungen

Mehr

Chi-Quadrat Verfahren

Chi-Quadrat Verfahren Chi-Quadrat Verfahren Chi-Quadrat Verfahren werden bei nominalskalierten Daten verwendet. Die einzige Information, die wir bei Nominalskalenniveau zur Verfügung haben, sind Häufigkeiten. Die Quintessenz

Mehr

Bivariate Analyse: Gemeinsame (bivariate) Häufigkeitstabelle. Sie wird auch Kontingenz-, Assoziations- oder Korrelationstabelle (f b )genannt.

Bivariate Analyse: Gemeinsame (bivariate) Häufigkeitstabelle. Sie wird auch Kontingenz-, Assoziations- oder Korrelationstabelle (f b )genannt. Bivariate Analyse: Tabellarische Darstellung: Gemeinsame (bivariate) Häufigkeitstabelle. Sie wird auch Kontingenz-, Assoziations- oder Korrelationstabelle (f b )genannt. Beispiel: Häufigkeitsverteilung

Mehr

11. Zusammenhangsmaße für nominale Variablen

11. Zusammenhangsmaße für nominale Variablen Statistik I Übung 11. Zusammenhangsmaße für nominale Variablen Dozent: Jürgen Leibold 1 Evaluation Nominale Zusammenhangsmaße Übersicht Chi-Quadrat Phi Cramers V Nominale Zusammenhangsmaße 3 Randverteilung

Mehr

Lösungen zu Janssen/Laatz, Statistische Datenanalyse mit SPSS 1

Lösungen zu Janssen/Laatz, Statistische Datenanalyse mit SPSS 1 LÖSUNG 4B a.) Lösungen zu Janssen/Laatz, Statistische Datenanalyse mit SPSS 1 Mit "Deskriptive Statistiken", "Kreuztabellen " wird die Dialogbox "Kreuztabellen" geöffnet. POL wird in das Eingabefeld von

Mehr

Testen von Hypothesen

Testen von Hypothesen Statistik 2 für SoziologInnen Testen von Hypothesen Univ.Prof. Dr. Marcus Hudec Statistik für SoziologInnen 1 Testtheorie Inhalte Themen dieses Kapitels sind: Erklären der Grundbegriffe der statistischen

Mehr

Test auf den Erwartungswert

Test auf den Erwartungswert Test auf den Erwartungswert Wir interessieren uns für den Erwartungswert µ einer metrischen Zufallsgröße. Beispiele: Alter, Einkommen, Körpergröße, Scorewert... Wir können einseitige oder zweiseitige Hypothesen

Mehr

R. Brinkmann Seite

R. Brinkmann  Seite R. Brinkmann http://brinkmann-du.de Seite 1 17.3.21 Grundlagen zum Hypothesentest Einführung: Wer Entscheidungen zu treffen hat, weiß oft erst im nachhinein ob seine Entscheidung richtig war. Die Unsicherheit

Mehr

Testen von Hypothesen:

Testen von Hypothesen: Testen von Hypothesen: Ein Beispiel: Eine Firma produziert Reifen. In der Entwicklungsabteilung wurde ein neues Modell entwickelt, das wesentlich ruhiger läuft. Vor der Markteinführung muss aber auch noch

Mehr

Aufgabenblock 4. Da Körpergröße normalverteilt ist, erhalten wir aus der Tabelle der t-verteilung bei df = 19 und α = 0.05 den Wert t 19,97.

Aufgabenblock 4. Da Körpergröße normalverteilt ist, erhalten wir aus der Tabelle der t-verteilung bei df = 19 und α = 0.05 den Wert t 19,97. Aufgabenblock 4 Aufgabe ) Da s = 8. cm nur eine Schätzung für die Streuung der Population ist, müssen wir den geschätzten Standardfehler verwenden. Dieser berechnet sich als n s s 8. ˆ = = =.88. ( n )

Mehr

Statistik I für Betriebswirte Vorlesung 14

Statistik I für Betriebswirte Vorlesung 14 Statistik I für Betriebswirte Vorlesung 14 Dr. Andreas Wünsche TU Bergakademie Freiberg Institut für Stochastik 13. Juli 017 Dr. Andreas Wünsche Statistik I für Betriebswirte Vorlesung 14 Version: 8. Juli

Mehr

Institut für Soziologie Werner Fröhlich. Methoden 2. Kontingenztabellen Chi-Quadrat-Unabhängigkeitstest

Institut für Soziologie Werner Fröhlich. Methoden 2. Kontingenztabellen Chi-Quadrat-Unabhängigkeitstest Institut für Soziologie Methoden 2 Kontingenztabellen Chi-Quadrat-Unabhängigkeitstest Aufbau der Sitzung Was sind Kontingenztabellen? Wofür werden Kontingenztabellen verwendet? Aufbau und Interpretation

Mehr

Beispiel für Gütefunktionen Rechtsseitiger Test (µ 0 = 500) zum Signifikanzniveau α = 0.10

Beispiel für Gütefunktionen Rechtsseitiger Test (µ 0 = 500) zum Signifikanzniveau α = 0.10 6 Hypothesentests Gauß-Test für den Mittelwert bei bekannter Varianz 6.3 Beispiel für Gütefunktionen Rechtsseitiger Test (µ 0 = 500) zum Signifikanzniveau α = 0.10 G(µ) 0 α 0. 0.4 0.6 0.8 1 n = 10 n =

Mehr

Mathematische und statistische Methoden II

Mathematische und statistische Methoden II Methodenlehre e e Prof. Dr. G. Meinhardt 6. Stock, Wallstr. 3 (Raum 06-06) Sprechstunde jederzeit nach Vereinbarung und nach der Vorlesung. Mathematische und statistische Methoden II Dr. Malte Persike

Mehr

Statistische Tests für unbekannte Parameter

Statistische Tests für unbekannte Parameter Konfidenzintervall Intervall, das den unbekannten Parameter der Verteilung mit vorgegebener Sicherheit überdeckt ('Genauigkeitsaussage' bzw. Zuverlässigkeit einer Punktschätzung) Statistischer Test Ja-Nein-Entscheidung

Mehr

Klassifikation von Signifikanztests

Klassifikation von Signifikanztests Klassifikation von Signifikanztests nach Verteilungsannahmen: verteilungsabhängige = parametrische Tests verteilungsunabhängige = nichtparametrische Tests Bei parametrischen Tests werden im Modell Voraussetzungen

Mehr

Einführung in Web- und Data-Science

Einführung in Web- und Data-Science Einführung in Web- und Data-Science Prof. Dr. Ralf Möller Universität zu Lübeck Institut für Informationssysteme Tanya Braun (Übungen) P-Wert (einseitiger Ablehnungsbereich) Hypothesentest H 0 vs. H 1

Mehr

Hypothesentests mit SPSS. Beispiel für einen t-test

Hypothesentests mit SPSS. Beispiel für einen t-test Beispiel für einen t-test Daten: museum-f-v04.sav Hypothese: Als Gründe, in ein Museum zu gehen, geben mehr Frauen als Männer die Erweiterung der Bildung für Kinder an. Dies hängt mit der Geschlechtsrolle

Mehr

Hypothesen: Fehler 1. und 2. Art, Power eines statistischen Tests

Hypothesen: Fehler 1. und 2. Art, Power eines statistischen Tests ue biostatistik: hypothesen, fehler 1. und. art, power 1/8 h. lettner / physik Hypothesen: Fehler 1. und. Art, Power eines statistischen Tests Die äußerst wichtige Tabelle über die Zusammenhänge zwischen

Mehr

Je genauer und sicherer, desto größer muss der Stichprobenumfang sein

Je genauer und sicherer, desto größer muss der Stichprobenumfang sein 2.3 Intervallschätzung 2.3.5 Bestimmung des Stichprobenumfangs Eine große praktische Bedeutung haben Konfidenzintervalle auch für die Stichprobenplanung. Sie werden herangezogen, um den benötigten Stichprobenumfang

Mehr

Empirische Wirtschaftsforschung

Empirische Wirtschaftsforschung Empirische Wirtschaftsforschung Prof. Dr. Bernd Süßmuth Universität Leipzig Institut für Empirische Wirtschaftsforschung Volkswirtschaftslehre, insbesondere Ökonometrie 1 4. Basiskonzepte der induktiven

Mehr

Statistik II. Statistische Tests. Statistik II

Statistik II. Statistische Tests. Statistik II Statistik II Statistische Tests Statistik II - 12.5.2006 1 Test auf Anteilswert: Binomialtest Sei eine Stichprobe unabhängig, identisch verteilter ZV (i.i.d.). Teile diese Stichprobe in zwei Teilmengen

Mehr

Prüfgröße: Ist die durch eine Schätzfunktion zugeordnete reelle Zahl (etwa Mittelwert 7 C).

Prüfgröße: Ist die durch eine Schätzfunktion zugeordnete reelle Zahl (etwa Mittelwert 7 C). Statistik Grundlagen Charakterisierung von Verteilungen Einführung Wahrscheinlichkeitsrechnung Wahrscheinlichkeitsverteilungen Schätzen und Testen Korrelation Regression Einführung Aus praktischen Gründen

Mehr

7. Hypothesentests. Ausgangssituation erneut: ZV X repräsentiere einen Zufallsvorgang. X habe die unbekannte VF F X (x)

7. Hypothesentests. Ausgangssituation erneut: ZV X repräsentiere einen Zufallsvorgang. X habe die unbekannte VF F X (x) 7. Hypothesentests Ausgangssituation erneut: ZV X repräsentiere einen Zufallsvorgang X habe die unbekannte VF F X (x) Interessieren uns für einen unbekannten Parameter θ der Verteilung von X 350 Bisher:

Mehr

Sozialwissenschaftliche Fakultät der Universität Göttingen. Sommersemester Statistik mit SPSS

Sozialwissenschaftliche Fakultät der Universität Göttingen. Sommersemester Statistik mit SPSS Sommersemester 2009 Statistik mit SPSS 15. Mai 2009 15. Mai 2009 Statistik Dozentin: mit Esther SPSSOchoa Fernández 1 Überblick Kreuztabellen 1. Ziel der Kreuztabellierung 2. Übersicht CROSSTABS - Syntax

Mehr

Serie 9, Musterlösung

Serie 9, Musterlösung WST www.adams-science.org Serie 9, Musterlösung Klasse: 4U, 4Mb, 4Eb Datum: FS 18 1. Mädchen vs. Knaben 442187 Unter 3000 in einer Klinik neugeborenen Kindern befanden sich 1578 Knaben. Testen Sie mit

Mehr

Statistik II im Wintersemester 2006/2007

Statistik II im Wintersemester 2006/2007 Statistik II im Wintersemester 2006/2007 Themen am 7.11. Drittvariablenkontrolle in der Tabellenanalyse Korrelation und Kausalität Statistische Tests in dreidimensionalen Kreuztabellen Lernziele: 1. Aufbau

Mehr

Statistik Testverfahren. Heinz Holling Günther Gediga. Bachelorstudium Psychologie. hogrefe.de

Statistik Testverfahren. Heinz Holling Günther Gediga. Bachelorstudium Psychologie. hogrefe.de rbu leh ch s plu psych Heinz Holling Günther Gediga hogrefe.de Bachelorstudium Psychologie Statistik Testverfahren 18 Kapitel 2 i.i.d.-annahme dem unabhängig. Es gilt also die i.i.d.-annahme (i.i.d = independent

Mehr

Institut für Soziologie Sabine Düval. Methoden 2. Kontingenztabellen Chi-Quadrat-Unabhängigkeitstest

Institut für Soziologie Sabine Düval. Methoden 2. Kontingenztabellen Chi-Quadrat-Unabhängigkeitstest Institut für Soziologie Methoden 2 Kontingenztabellen Chi-Quadrat-Unabhängigkeitstest Aufbau der Sitzung Wiederholung Exkurs zur Inferenzstatistik Was sind Kontingenztabellen? Recodieren, Kategorisieren

Mehr

Methodenlehre. Vorlesung 10. Prof. Dr. Björn Rasch, Cognitive Biopsychology and Methods University of Fribourg

Methodenlehre. Vorlesung 10. Prof. Dr. Björn Rasch, Cognitive Biopsychology and Methods University of Fribourg Methodenlehre Vorlesung 10 Prof. Dr., Cognitive Biopsychology and Methods University of Fribourg 1 Methodenlehre I Woche Datum Thema 1 FQ Einführung, Verteilung der Termine 1 25.9.13 Psychologie als Wissenschaft

Mehr