2.4.1 Grundprinzipien statistischer Hypothesentests



Ähnliche Dokumente
Evaluierung einer Schulungsmaßnahme: Punktezahl vor der Schulung Punktezahl nach der Schulung. Autoritarismusscore vor/nach Projekt

Statistik Einführung // Konfidenzintervalle für einen Parameter 7 p.2/39

15.4 Diskrete Zufallsvariablen

Statistik I/Empirie I

2 Vollständige Induktion

Wissenschaftliches Arbeiten Studiengang Energiewirtschaft

2. Diophantische Gleichungen

Innerbetriebliche Leistungsverrechnung

Formelsammlung Mathematik

Übungen zur Vorlesung Funktionentheorie Sommersemester Musterlösung zu Blatt 0

Variiert man zusätzlich noch die Saatstärke (z.b. 3 Stärkearten), würde man von einer zweifaktoriellen Varianzanalyse sprechen.

Auch im Risikofall ist das Entscheidungsproblem gelöst, wenn eine dominante Aktion in A existiert.

AUFGABENSTELLUNG (ZUSAMMENFASSUNG) 2 SPEZIFIKATION 2. Datenfluß und Programmablauf 2. Vorbedingung 3. Nachbedingung 3. Schleifeninvariante 3

Tests statistischer Hypothesen

BINOMIALKOEFFIZIENTEN. Stochastik und ihre Didaktik Referentin: Iris Winkler

n 1,n 2,n 3,...,n k in der Stichprobe auftreten. Für die absolute Häufigkeit können wir auch die relative Häufigkeit einsetzen:

Lerneinheit 2: Grundlagen der Investition und Finanzierung

3. Einführung in die Statistik

Übungsblatt 1 zur Vorlesung Angewandte Stochastik

Korrekturrichtlinie zur Studienleistung Wirtschaftsmathematik am Betriebswirtschaft BB-WMT-S

10. Testen von Hypothesen Seite 1 von 6

Kapitel 5: Schließende Statistik

Versicherungstechnik

6 Vergleich mehrerer unverbundener Stichproben

Wahrscheinlichkeit & Statistik Musterlösung Serie 13

Statistische Maßzahlen. Statistik Vorlesung, 10. März, Beispiel. Der Median. Beispiel. Der Median für klassifizierte Werte.

Testumfang für die Ermittlung und Angabe von Fehlerraten in biometrischen Systemen

Stochastik für WiWi - Klausurvorbereitung

Institut für Stochastik Prof. Dr. N. Bäuerle Dipl.-Math. S. Urban

Flexibilität beim Lagern und Kommissionieren: Schienengeführte Regalbediengeräte

Aufgaben und Lösungen der Probeklausur zur Analysis I

Kapitel 6: Statistische Qualitätskontrolle

h i Deskriptive Statistik 1-dimensionale Daten Daten und Häufigkeiten Seite 1 Nominal Ordinal Metrisch (Kardinal) Metrisch - klassiert

Grundgesamtheitsanaylsen und Stichproben. Betrachtungen zur Stichprobenfindung

4 Schwankungsintervalle Schwankungsintervalle 4.2

Kapitel 6: Quadratisches Wachstum

Statistik mit Excel Themen-Special. Peter Wies. 1. Ausgabe, Februar 2014 W-EX2013S

2 Induktive Statistik

Stichproben im Rechnungswesen, Stichprobeninventur

Statistik. 5. Schließende Statistik: Typische Fragestellung anhand von Beispielen. Kapitel 5: Schließende Statistik

... a ik) i=1...m, k=1...n A = = ( a mn

Allgemeine Lösungen der n-dimensionalen Laplace-Gleichung und ihre komplexe Variable

Gliederung. Value-at-Risk

3 Vergleich zweier unverbundener Stichproben

Die notwendigen Verteilungstabellen finden Sie z.b. hier:

e) ( 4a + 8b + 9a + 18b ) : a + 2b f) 2 log (x) + 3 log (2y) 0.5 log (z)

1 Analysis T1 Übungsblatt 1

Vl Statistische Prozess und Qualitätskontrolle und Versuchsplanung Übung 3

Wirksamkeit, Effizienz

Vl Statistische Prozess- und Qualitätskontrolle und Versuchsplanung Übung 5

Prof. Dr.-Ing. Bernd Kochendörfer. Bauwirtschaft und Baubetrieb. Investitionsrechnung

Kryptologie: Kryptographie und Kryptoanalyse Kryptologie ist die Wissenschaft, die sich mit dem Ver- und Entschlüsseln von Informationen befasst.

Kleines Matrix-ABC. Fachgebiet Regelungstechnik Leiter: Prof. Dr.-Ing. Johann Reger. 1 Elementares

KUNDENPROFIL FÜR GELDANLAGEN

Finanzmathematische Formeln und Tabellen

Arbeitsplätze in SAP R/3 Modul PP

Satz Ein Boolescher Term t ist eine Tautologie genau dann, wenn t unerfüllbar ist.

Die Gasgesetze. Die Beziehung zwischen Volumen und Temperatur (Gesetz von J.-L. und J. Charles): Gay-Lussac

Gütefunktion und Fehlerwahrscheinlichkeiten Rechtsseitiger Test (µ 0 = 500) zum Signifikanzniveau α = Interpretation von Testergebnissen I

Lösungen der Aufgaben zur Vorbereitung auf die Klausur Mathematik für Informatiker I

Ausgangspunkt: Über einen endlichen Zeitraum wird aus einem Kapital (Rentenbarwert RBW v n,i

SUCHPROBLEME UND ALPHABETISCHE CODES

Linsengesetze und optische Instrumente

Gruppe 108: Janina Bär Christian Hörr Robert Rex

4 Punkt- und Intervallschätzung

Kapitel 6 : Punkt und Intervallschätzer

Klausur Grundlagen der Investition und Finanzierung

Wahrscheinlichkeit & Statistik

Wirksamkeit, Effizienz

Musterlösung für die Klausur zur Vorlesung Stochastik I im WiSe 2014/2015

Güte von Tests. die Wahrscheinlichkeit für den Fehler 2. Art bei der Testentscheidung, nämlich. falsch ist. Darauf haben wir bereits im Kapitel über

Nachklausur - Analysis 1 - Lösungen

VAIO-Link Kundenservice Broschüre

Die Optimalität von Randomisationstests

17. Kapitel: Die Investitionsplanung

3. Tilgungsrechnung Tilgungsarten

Wirksamkeit, Effizienz. Beispiel: Effizienz. Mittlerer quadratischer Fehler (MSE) Konsistenz im quadratischen Mittel

Vereinheitlichung Einheitlicher Maßstab der Risikoeinschätzung. Limitierung / Steuerung Messung und Limitierung ist fundamental für die Steuerung

GIBS. Übungsaufgaben zur Vertiefung. V1. Beschriften Sie die Konstruktionen! n n n n ' ' ' ' Modul 1.5. Geometrische Optik 1 58.

Übungen zu QM III Mindeststichprobenumfang

2. Repetition relevanter Teilbereiche der Statistik

Tests für beliebige Zufallsvariable

Medienzentrum. Bibliothek. Handreichung zur Literatursuche

Kapitel 4.1: Dr. Jörg Franke. Technische Universität Dortmund. Sommersemester 2011

Kunde. Kontobewegung

6. Übung - Differenzengleichungen

Testen statistischer Hypothesen

Auszüge der nichtparametrischen Statisik

Heute Kapitalanlage morgen ein Zuhause

Vorlesung Informationssysteme

Feldeffekttransistoren in Speicherbauelementen

Tutorial: Homogenitätstest

Melanie Kaspar, Prof. Dr. B. Grabowski 1

Statistik. Prof. Dr. K. Melzer.

Mit Ideen begeistern. Mit Freude schenken.

Statistik und Wahrscheinlichkeitsrechnung

So lösen Sie die Gleichung für den Korrelationskoeffizienten

Einführung in die Investitionsrechnung

Transkript:

86 2.4. Hypothesetests 2.4 Hypothesetests 2.4.1 Grudprizipie statistischer Hypothesetests Hypothese: Behauptug eier Tatsache, dere Überprüfug och aussteht (Leuter i: Edruweit, Trommsdorff: Wörterbuch der Soziologie, 1989). Statistischer Test: Überprüfug vo Hypothese über die Grudgesamtheit ahad eier Stichprobe Idealtypische Vorgehesweise: Wisseschaftlicher Fortschritt durch Falsifikatio vo Hypothese Exkurs: Warum icht Verifikatio vo Hypothese? Arte vo Hypothese: existetielle Hypothese z.b. Es gibt schwarze Schwäe. verifizierbar durch Beobachtug vo eiem schwarze Schwa icht falsifizierbar (außer durch Beobachtug aller Schwäe auf der gaze Welt) uiverselle Hypothese (meist iteressater) z.b. Alle Schwäe sid schwarz. falsifizierbar durch Beobachtug vo eiem weiße Schwa = Gegebeispiel icht verifizierbar (außer durch Beobachtug aller Schwäe auf der gaze Welt) Empirischer Gehalt: Nach dem Wisseschaftstheoretiker Karl Popper hat eie Hypothese umso mehr empirische Gehalt, je mehr Möglichkeite zur Falsifikatio sie bietet (z.b. idem sie präziser formuliert ist). Je mehr Versuche der Falsifikatio eie Hypothese besteht, umso höher ist ihr Bewährugsgrad. Wisseschaftlicher Fortschritt ergibt sich laut Popper also durch das Aussortiere falscher Hypothese. Statistische Testtheorie: Schließe vo Stichprobe auf Grudgesamtheit Vorgehe: ihaltliche Hypothese aufstelle Operatioalisierug ihaltliche Hypothese i statistische Hypothese übersetze statistischer Test

Kapitel 2. Iduktive Statistik 87 Beispiel: Studie zur Eistellug der Mücher Bevölkerug zu psychisch Krake (1989). Wir betrachte eie Teilstudie: Kooperatiosbereitschaft i der Befragug. 1. Theorie : Aktive Stellug im öffetliche Lebe beeiflusst Kooperatiosbereitschaft positiv. Aktiv Altruismus Iteresse a öffetliche Agelegeheite eher bereit, die Rolle des Befragte eizuehme 2. Hypothese: Uterscheidet sich die Koorperatiosbereitschaft der aktive Persoe vom Rest der Bevölkerug? 3. Operatioalisierug: Aktiv im öffetliche Lebe Verbadsmitgliedschaft ja/ei = Variable X Kooperatiosbereitschaft atwortet freiwillig (Koorperativer)/ur auf safte Druck (Primärverweigerer) = Variable Y 4. Statistische Hypothese: Besteht ei Zusammehag zwische X ud Y? Statistisches Vorgehe: Ka die sog. Nullhypothese Es besteht kei Zusammehag zwische X ud Y abgeleht werde? Herleitug / Motivatio eies geeigete Prüfverfahres Gegebee Date (relative ud absolute Häufigkeite): aktiv ja ei. kooperativ ja ei 0.27 0.05 (95) (17) 0.53 0.15 (186) (54) 0.8 0.2 (281) (71) Vergleiche gegebee Tafel mit der Uabhägigkeitstafel 0.32 (112) 0.68 (240) 1 (352) kooperativ ja ei ja 0.256 0.064 0.32 aktiv ei 0.544 0.136 0.68 0.8 0.2 1 Die Häufigkeite i der Uabhägigkeitstafel weiche vo de tatsächliche Date ab. Vgl. Statistik I: Je stärker die Abweichug, desto stärker ist der Zusammehag.

88 2.4. Hypothesetests Wie groß muss die Abweichug sei, um die Nullhypothese abzulehe? Beachte: Die Date etstamme eier Stichprobe, die mit eiem Zufallsfehler behaftet ist. Selbst bei Uabhägigkeit ist die Wskt., geau die Uabhägigkeitstafel zu beobachte, sehr gerig. Kardialfrage der Testtheorie: Weiche die tatsächliche Date vo der bei Gültigkeit der Nullhypothese zu erwartede Situatio überzufällig stark ab, d.h. so stark, dass ma die Abweichug icht mehr ur der Zufallsstreuug zuschreibe ka? Nur i diesem Fall ist die Nullhypothese abzulehe. Idee: kleie Abweichug ur Zufallsstreuug große Abweichug Zufallsstreug + ihaltlicher Uterschied Nullhypothese ablehe Wa ist die Abweichug groß geug, d.h. überzufällig? Teste mit Hilfe des p-wertes (Alterative: Teste mithilfe eies Ablehbereichs, s.u.) Bestimme eie Zufallsvariable T, die i geeigeter Weise de Uterschied eier zufällige Stichprobe zur Situatio der Nullhypothese misst (hier: der χ 2 -Abstad zwische eier Stichprobe ud der Uabhägigkeitstafel, vgl. Statistik I). Bestimme die Realisatio t vo T ahad der kokrete Date (hier: χ 2 =2.11). Bereche die Wahrscheilichkeit, eie midestes so extreme Wert vo T zu beobachte, falls H 0 richtig ist: (hier: p-wert=0.15). p-wert := P (T t H 0 ) Falls p-wert 5%, da H 0 ablehe, sost beibehalte. (hier: p-wert zu groß: Die Nullhypothese ka icht abgeleht werde.) Der Richtwert 5%, das sogeate Sigifikaziveau soll sicherstelle, dass die Nullhypothese ur i 5% der Fälle fälschlicherweise abgeleht wird. Fehler 1. Art (α-fehler): Die Nullhypothese wird abgeleht, obwohl sie i Wirklichkeit richtig ist. z.b.: Behaupte, es bestüde ei Zusammehag, obwohl i Wirklichkeit kei Zusammehag besteht. Der Fehler 1. Art soll klei sei (üblich sid 5% oder 10%). Allerdigs ka ma icht forder, dass der Fehler 1. Art bei 0% liege soll, sost würde ma die Nullhypothese ie ablehe. Fehler 2. Art

Kapitel 2. Iduktive Statistik 89 Fehler 2. Art (β-fehler): Die Nullhypothese wird beibehalte, obwohl sie i Wirklichkeit falsch ist. Ei guter statistischer Test garatiert bei eiem vergegebee iedrige Sigifikaziveau (Fehler 1. Art) auch eie möglichst gerige Fehler 2. Art. 2.4.2 Kostruktio eies parametrische statistische Tests 1. Aufstelle der substazwisseschaftliche Hypothese / ihaltliche Fragestellug (z.b. Rot/Grü bekommt die absolute Mehrheit, das Eikomme vo Akademiker beträgt midestes 3000 Euro) 2. Formuliere eies geeigete statistische Modells Im Folgede stets X 1,..., X i.i.d. Stichprobe sowie parametrisches Modell mit ubekatem Parameter ϑ. Ateil Rot/Grü: B(1, π) Durchschittseikomme: N (µ; 2 ). 3. Formulierug der statistische Hypothese Umformuliere der substatielle Hypothese als Hypothese über ϑ. Vergliche wird immer eie sog. Nullhypothese (H 0 ) mit eier sog. Alterativhypothese (H 1 ). Bei parametrische Fragestelluge: a) Eiseitige Testprobleme: H 0 : ϑ ϑ 0 gege H 1 : ϑ > ϑ 0 (z.b. der Ateil vo Rot/Grü ist kleier gleich 50% oder größer) b) Zweiseitiges Testproblem: H 0 : ϑ ϑ 0 gege H 1 : ϑ < ϑ 0 H 0 : ϑ = ϑ 0 gege H 1 : ϑ ϑ 0 ( Das Durchschittseikomme ist 3000 Euro, Abweichuge ach ute oder obe möglich) ϑ 0 ist ei fester, vorgegebeer Wert, der vo ihaltlichem Iteresse ist. 4. Festlegug des Sigifikaziveaus α Beim Teste sid folgede Etscheiduge möglich: H 0 : ablehe oder H 0 : beibehalte Damit sid zwei verschiedee Arte vo Fehler möglich:

90 2.4. Hypothesetests H 0 wahr H 0 falsch H 0 beibehalte Fehler 2. Art H 0 ablehe Fehler 1.Art Ma ka icht beide Fehlerwahrscheilichkeite gleichzeitig kotrolliere! asymmetrische Vorgehesweise: Der Fehler 1. Art wird kotrolliert durch die Agabe eier Oberschrake α ( Sigifikaziveau ) Typische Werte: üblich α = 0.1, α = 0.05, α = 0.01 margial sigifikat sigifikat hoch sigifikat Implizit wird also der Fehler 1. Art als schwerwiegeder betrachtet. koservative Perspektive : Nullhypothese erst ablehe, we wirklich icht mehr mit de Date verträglich. z.b. i der Medizi: H 0 : keie Wirkug. Nur we die Wirkug des Medikamets überzeuged ist, soll es zugelasse werde. 5. Festlege eier Testgröße ud eier kritische Regio Eie Testgröße T ist eie Zufallsgröße T = g(x 1,..., X ), die empfidlich gegeüber Abweichuge vo H 0 ist. Die Kritische Regio KR ( Ablehugsbe- reich ) besteht aus potetielle Werte vo T, die gege H 0 spreche. Ählich wie obe: Werte, die uter H 0 sehr uwahrscheilich sid, spreche gege H 0. Fällt die Beobachtug für T i KR, wird ma sich gege H 0 etscheide. Damit der Fehler 1. Art durch α beschräkt bleibt muss die kritische Regio KR also so gewählt werde, dass P (T KR H 0 ) α gilt, d.h. die Wahrscheilichkeit, dass T i der kritische Regio liegt ud damit zur Ablehug vo H 0 führt darf höchstes α sei, we H 0 stimmt. Umgekehrt soll P (T KR H 1 ) möglichst groß sei, da dies die Wahrscheilichkeit ist, die Nullhypothese H 0 abzulehe, falls sie falsch ist. (Gegewahrscheilichkeit zur Wahrscheilichkeit für de Fehler 2. Art, auch als Power oder Güte des Tests bezeichet.) 6. Auswerte der Stichprobe Berechug der Realisatio t der Testgröße T basiered auf der kokret vorliegede Stichprobe. 7. Testetscheidug Ist t KR, da H 0 ablehe, sost icht ablehe.

Kapitel 2. Iduktive Statistik 91 Bemerkuge: Die wesetliche Elemete des Test (Sigifikaziveau, Testgröße, kritische Regio) sid uabhägig vo de Date, also vor der Auswertug zu bestimme. Da ur die Fehlerwahrscheilichkeit 1. Art kotrolliert werde ka, ka H 0 icht mit eier a priori kotrollierte Fehlerwahrscheilichkeit ageomme, soder ur abgeleht, werde. Als guter Forscher sollte ma deshalb immer das, was ma zeige will, i die Alterativhypothese schreibe. z.b. Forscher will zeige, dass sei Medikamet besser wirkt als ei aderes. Nullhypothese: Es wirkt schlechter oder gleich gut. Alterativhypothese: Es wirkt besser. Durch die Kotrolle des Fehlers 1. Art ist gewährleistet, dass es sich der Forscher möglichst schwer macht, die Überlegeheit des Medikamets zu zeige ud umso überzeugeder ist es, we er es trotzdem schafft. Allerdigs gibt es icht immer eie (eifache) statistische Test für jede Nullhypothese. z.b. ist es techisch viel eifacher als Nullhypothese θ = θ 0 zu verwede, als θ θ 0 ( Äquivaleztest ). Verwedet ma deshalb eie Test mit H 0 : θ = θ 0, möchte ma ihaltlich aber geau dies zeige, kehre sich die Rolle des Fehlers 1. Art ud des Fehlers 2. Art um. Um i diesem Fall eie gerigere Fehler 2. Art zu erziele, sollte das Sigifikaziveau höher als üblich gewählt werde. 2.4.3 Typische Tests I: Tests auf Lageparameter Aufgabe: Kostruiere Test für eie Hypothese über die Lage eier Verteilug. Wir betrachte ausschließlich de Erwartugswert µ eies ormalverteilte Merkmals, bzw. de Erwartugswert π eier biäre Zufallsgröße. Gauss-Test 1. ihaltliche Hypothese 2. Statistisches Modell: X 1,..., X i.i.d. Stichprobe, wobei X i jeweils ormalverteilt sei mit ubekatem Mittelwert µ ud bekater Variaz 2. 3. Formulierug der statistische Hypothese: Fall 1: H 0 : µ µ 0 H 1 : µ > µ 0 Fall 2: H 0 : µ µ 0 H 1 : µ < µ 0 Fall 3: H 0 : µ = µ 0 H 1 : µ µ 0

92 2.4. Hypothesetests 4. Festlege des Sigifikaziveaus: Wir reche im Folgede allgemei. Übliche Werte sid: 10% : margial sigifikat 5% : sigifikat 1% : hoch sigifikat 5. Testgröße: T := X µ 0 Ausgagspukt geau wie bei Kofidezitervall ( später: Dualitätsprizip) T ist empfidlich gegeüber Abweichuge vo H 0. Falls µ = µ 0 (falls also die Nullhypothese zutrifft) gilt Kritische Regioe: T = X µ 0 gege H 0 spreche im Fall 1: Fall 3: Fall 3: N (0, 1). große Werte vo T kleie Werte vo T große ud kleie Werte vo T zu Fall 1: Kritische Regio aus dem uter H 0 extrem uwahrscheiliche Bereich. Hier vo der Form [z; ), wobei z so, dass P (T KR H 0 ) = P (T z H 0 ) = α 1 α z Dichte vo T α D.h., z ist das (1 α)-quatil der Stadardormalverteilug. Damit ist H 0 abzulehe, geau da we T z 1 α X µ 0 z1 α X µ 0 + z 1 α also falls X [ ) µ 0 + z 1 α ; Aalog gilt im Fall 2: Sehr kleie Werte vo T spreche gege H 0, d.h. KR = (, z], wobei z so, dass P (T z H 0 ) = α. (z α icht tabelliert verwede z 1 α )

Kapitel 2. Iduktive Statistik 93 Dichte vo T α z H 0 ablehe T z 1 α X µ 0 z1 α H 0 ablehe im Fall 2, falls ] X ( ; µ 0 z 1 α Im Fall 3: Die KR hat die Form (, z) (z, ) = kleie ud große Werte spreche gege H 0 α auf beide Bereiche aufteile α 2 z = z 1 α 2 z = z α 2 (icht tabelliert verwede z 1 α 2 ) Dichte vo T H 0 ablehe im Fall 3, falls α/2 z α/2 z T (, z 1 α 2 ] [z 1 α 2, ) also we T z 1 α 2. Beispiel: Der IQ i eier gewisse Populatio sei ormalverteilt mit ubekatem Mittelwert µ ud Variaz 2 = 225. Es wird vermutet, dass µ > 120 gilt. Ka diese Vermutug mit eier Fehlerwahrscheilichkeit vo α = 5% bestätigt werde, we eie Stichprobe mit = 100 de Wert x = 125 ergab? Hypothese: H 0 : µ 120 vs. H 1 : µ > 120 (was gezeigt werde soll gehört i die Alterative). Testgröße: T = X µ 0 N(0, 1)

94 2.4. Hypothesetests H 0 ablehe, falls der Wert vo T > z 1 α ist. Dabei ist z 1 α = z 0.95 = 1.65 ud der Wert vo T = 125 120 10 = 1 10 = 3.3 > 1.65. 15 3 Also H 0 ablehe. Die Vermutug µ > 120 ist mit eier Fehlerwahrscheilichkeit vo 5% statistisch bestätigt. t-test Situatio wie beim Gauß-Test, aber mit ubekater Variaz 2 : X 1,..., X i.i.d. Stichprobe, wobei X i jeweils ormalverteilt sei mit ubekatem Mittelwert µ ud ubekater Variaz 2. Aaloges Vorgehe zur Kostruktio des Tests, aber durch S = S 2 schätze mehr Usicherheit breitere Verteilug der Teststatistik: t-verteilug die Teststatistik T ersetze durch T = X µ 0 S T ist für µ = µ 0 t-verteilt mit 1 Freiheitsgrade, also muss ma überall z 1 α bzw. z 1 α durch die etsprechede Quatile t 1 α( 1), t 2 1 α ( 1) ersetze. 2 H 0 ablehe, falls Fall 1 T t 1 α ( 1) Fall 2 T t 1 α ( 1) Fall 3 T t 1 α 1 α ( 1) 2 2 Approximative Tests für Hypothese über Ateilswerte Mit Hilfe der Biomialapproximatio (vgl. Kapitel 1.7) ermögliche die ebe besprochee Tests auch umittelbar die Prüfug vo Hypothese über Ateilswerte. Eigebettet i Beispiel: 1. Rot/Grü wird icht die Mehrheit bekomme. 2. Statistisches Modell: X 1,..., X i.i.d. Stichprobe vo { 1 Rot/Grü X = 0 sost wobei π der Ateil der Eiheite mit Ausprägug 1 i der Grudgesamtheit ist. 3. Statistische Hypothese: 1 H 0 : π π 0 H 1 : π > π 0 2 H 0 : π π 0 H 1 : π < π 0 3 H 0 : π = π 0 H 1 : π π 0 Hier: π 0 = 0.5 ud H 0 : π 0.5 H 1 : π < 0.5

Kapitel 2. Iduktive Statistik 95 4. Vorgabe des Sigifikaziveaus: α = 0.05 5. Testgröße ud kritische Regio: Approximativ gilt für große Stichprobeumfag also speziell für π = π 0 (uter H 0 ) X π π(1 π) N (0, 1), T = X π 0 π 0 (1 π 0 ) Damit ergebe sich die kritische Regioe N (0, 1) 1 H 0 ablehe, falls T z 1 α 2 H 0 ablehe, falls T z 1 α 3 H 0 ablehe, falls T z 1 α 2 oder T z 1 α 2 6. Berechug der Realisatioe t 0 vo T Wahlumfrage: = 500, X = 46.5% (Ateil Rot/Grü), α = 0.05 H 0 ablehe, falls Wert vo T z 1 α. Ablese aus der Tabelle z 1 α = 1.65. Wert vo T : H 0 : π 0.5 gege H 1 : π < 0.5 T = 0.465 0.5 0.5(1 0.5) 500 = 1.56 Testetscheidug: t 0 = 1.56 > 1.65 = z 1 α, also wird H 0 icht abgeleht. Die Nullhypothese π 0.5 (rot-grü bekommt die Mehrheit) ka icht zur Irrtumswahrscheilichkeit 5% verworfe werde, ist also beizubehalte. 2.4.4 Typische Tests II: Lagevergleiche aus uabhägige Stichprobe Allgemeie Situatio: Ei stetiges Merkmal, erhobe i zwei Gruppe A ud B. Ziel: Vergleich der Erwartugswerte i de beide Gruppe. Typische Fragestelluge, z.b. Verdiee Mäer mehr als Fraue? Sid A-Wähler autoritärer als B-Wähler?

96 2.4. Hypothesetests Kokret aus Studie (Bild des psychisch Krake): Kooperatiosbereitschaft ud Vorurteile. 1. Substazwisseschaftliche Hypothese: Je weiger die Eistellug gegeüber psychisch Krake durch Vorurteile ud Stereotype gekezeichet ist, desto größer ist die Kooperatiosbereitschaft im Iterview. 2. Statistisches Modell: X 1,..., X i.i.d. Stichprobe aus Gruppe A, Y 1,..., Y i.i.d. Stichprobe aus Gruppe B Zuächst seie die Variaze 2 X ud 2 Y X i N (µ X ; 2 X) Y i N (µ Y ; 2 Y ). als bekat ageomme. X: Vorurteilsidex aus Fragebatterie mit Statemets (1,..., 5) ud aschließeder Likert-Skalierug gewoe, im Folgede als ormalverteilt ageomme. (Kleier Wert etspricht große Vorurteile.) Gruppe A: Kooperative Gruppe B: Primärverweigerer Zwei-Stichprobe-Gauss-Test 3. Formuliere der statistische Hypothese: 1 H 0 : µ X µ Y H 1 : µ X > µ Y 2 H 0 : µ X µ Y H 1 : µ X < µ Y 3 H 0 : µ X = µ Y H 1 : µ X µ Y I userem Beispiel vermute wir, dass Gruppe A gerigere Vorurteile, also eie größere durchschittliche Score hat. Also betrachte wir Fall 1: H 0 : µ X µ Y H 1 : µ X > µ Y 4. Festlege eies Sigifikaziveaus: Allgemei α, hier z.b. α = 0.01. 5. Festlege eier Testgröße ud eier Kritische Regio: Testgröße: Vergleich der arithmetische Mittel X ud Ȳ basiered auf T = 2 X X Ȳ + 2 Y m Var( X Ȳ ) = Var X + Var Ȳ = 2 X + 2 Y m T ist N (µ X µ Y, 1) verteilt. Falls µ X = µ Y ist, gilt T N (0, 1)

Kapitel 2. Iduktive Statistik 97 Festlege der Kritische Regio: Fall 1: Gege H 0 spreche sehr große Werte vo T, d.h. KR = (z, ), wobei z so, dass P (T z H 0 ) α. Also: H 0 ablehe, falls T z 1 α Fall 2: Gege H 0 spreche sehr kleie Werte, d.h. KR = (, z), wobei z so, dass P (T z H 0 ) α. Also: H 0 ablehe, falls T z 1 α Fall 3: Gege H 0 spreche große Werte ud sehr kleie Werte, d.h. KR = (, z) oder (z, ). Also: H 0 ablehe, falls T z 1 α 2 oder T z 1 α 2, d.h. T > z 1 α 2. Zwei-Stichprobe-t-Test Abwadlug vo Schritt 5 bei ubekate Variaze: wobei jetzt die Variaze 2 X, 2 Y X i N (µ X, 2 X), i = 1,..., Y i N (µ Y, 2 Y ), i = 1,..., m ubekat seie. Variate a): Ist bekat, dass die Variaze gleich sid, so schätzt ma sie mittels SX 2 ud SY 2 ud betrachtet X T = Ȳ ( 1 + ) 1 ( 1)S 2 X +(m 1)SY 2 m +m 2 Falls µ X = µ Y gehorcht T eier t-verteilug mit ( + m 2) Freiheitsgrade. Vorgehe bei der Kostruktio der Kritische Regio aalog zu vorher: Im Beispiel: Fall 1 T t 1 α Fall 2 H 0 ablehe, falls T t 1 α Fall 3 T t 1 α 2 oder T t 1 α, also T t 1 α 2 2 X = 51.11 Kooperative = 270 Ȳ = 48.76 Primärverweigerer m = 58 SX 2 = 40.2 SY 2 = 35.5 Wir lehe ab, we die Realisatio vo T > t (+m 2) 1 α ist, wobei hier die Azahl der Freiheitsgrade + m 2 = 270 + 58 2 = 326 > 30 ist, also rechet ma mit z 1 α. Für α = 0.01 erhält ma z 0.99 = 2.33. Als Realisatio vo T ergibt sich t 0 = ( 1 + 1 m x ȳ = 2.35 0.908 = 2.59 ) ( 1)s 2 x +(m 1)s 2 y +m 2 =

98 2.4. Hypothesetests Wege 2.59 > 2.33 wird H 0 abgeleht. Es wurde statistisch gesichert achgewiese, dass die Primärverweigerer stärkere Vorurteile gegeüber psychisch Krake habe als die Kooperative, d.h. der Uterschied ist auf dem 1%-Niveau sigifikat. Variate b) Sid die Variaze ubekat ud köe icht als gleich ageomme werde, so ka ma für großes ud großes m mit T = S 2 X X Ȳ + S2 Y m reche. T ist für µ X = µ Y approximativ stadardormalverteilt ud ka auch agewedet werde, we keie Normalverteilug vorliegt. (Ist aber ebe ur approximativ, icht exakt.) Viele Software-Pakete reche beide Arte vo t-tests ud gebe oft auch das Ergebis eies (i der Vorlesug icht betrachtete F -)Tests auf Gleichheit der Variaze a. Die korrekte Teststatistik für kleies T ist außerordetlich kompliziert; sie wird i der Vorlesug icht betrachtet, weshalb aus Übugsgrüde im Rahme der Verastaltug bei ugleiche Variaze stets mit der approximative Variate gearbeitet werde darf. Erweiterug: Oft fidet ma Formel für allgemeie Hypothese der Form µ X µ Y δ µ X µ Y + δ Ma ka dies (auch mit Software) direkt löse, idem ma icht X ud Y, soder X ud Ỹ vergleicht, wobei Ỹi = Y i + δ, i = 1,..., m. Es gilt Ỹ N (µ Ỹ, 2 Y ), wobei µ Ỹ = µ Y + δ. Obige Hypothese ist also äquivalet zur Hypothese µ X µỹ die mit de behadelte Methode getestet werde ka. Variazaalyse: Solle die Mittelwerte i mehr als zwei Gruppe vergliche werde, verwedet ma die Variazaalyse. Dabei testet ma zuächst, ob es eie sigifikate Uterschied zwische midestes zwei der Mittelwerte gibt. Daach wird i eiem sogeate post-hoc-test jeder Vergleich eizel bzw. ach ihaltliche Hypothese überprüft. Die Variazaalyse lässt sich auch als lieares Modell auffasse (vgl. Statistik I ud Ede des Skripts).

Kapitel 2. Iduktive Statistik 99 2.4.5 Gauss-Test ud t-test für verbudee Stichprobe Verbudee Stichprobe: Vergleich zweier Merkmale X ud Y, die jetzt a deselbe Persoe erhobe werde. Vorsicht: Leicht zu verwechsel mit vorheriger Fragestellug! Beispiele: Evaluierug eier Schulugsmaßahme: X Y Autoritarismusscore vor/ach Projekt Puktezahl vor der Schulug Puktezahl ach der Schulug Klassisches Medizibeispiel: rechts/liks-vergleiche: Test zweier Salbe bei Ekzeme Split-Half Reliabilität vo aus viele Eizelfrage bestehede Scores Ma köte auf zweierlei Arte vorgehe: a) Ma bestimmt zufällig zwei Gruppe, i der eie erhebt ma X, i der adere Y. Daach Vergleich der Mittelwerte wie im vorherige Kapitel beschriebe. b) Ma erhebt a jeder Perso beide Merkmale. Beim Vorgehe i a) köte es sei, dass sich die beide Gruppe i de Auspräguge wichtiger beeiflusseder Variable uterscheide etwa i de erste beide Beispiele: Vorbildug bzw. Erährugsgewohheite. Bei b) werde die Drittvariable implizit kotrolliert: Bei Messug a ei ud derselbe Perso sid solche Effekte automatisch ausgeschaltet. Kostruktio der Tests: Zum Teste vo Hypothese der Form X 1,..., X i.i.d. N (µ X, X 2 ) Y 1,..., Y i.i.d. N (µ Y, Y 2 ) 1 H 0 : µ X µ Y gege H 1 : µ X > µ Y 2 H 0 : µ X µ Y gege H 1 : µ X < µ Y 3 H 0 : µ X = µ Y gege H 1 : µ X µ Y betrachtet ma die Differez D i = X i Y i. Für de Erwartugswert µ D gilt E µ D = E(D i ) = E(X i Y i ) = E(X i ) E(Y i ) = µ X µ Y ud für die Variaz 2 D 2 D := Var(X i Y i ) = Var(X i + ( 1) Y i ) = Var(X i ) + ( 1) 2 Var(Y i ) 2 Cov(X i, Y i ), also 2 D = 2 X + 2 Y 2 XY mit XY = Cov(X, Y )

100 2.4. Hypothesetests Im allgemeie ist XY relativ groß D ist deutlich kleier als 2 X + 2 Y = V ar(x i Y i ) bei Uabhägigkeit. Im Folgede sei immer ageomme, dass auch D i ormalverteilt ist. Wege D i N (µ D, 2 D ) mit µ D = µ X µ Y ud 2 D = 2 X +2 Y 2 XY sid obige Hypothese äquivalet zu de Hypothese 1 H 0 : µ D 0 gege H 1 : µ D > 0 2 H 0 : µ D 0 gege H 1 : µ D < 0 3 H 0 : µ D = 0 gege H 1 : µ D 0 ud ma ka umittelbar die Tests aus 2.4.3 awede. Sid die Variaze ubekat, so ka ma D aus de Differeze D i, i = 1,..., schätze. Zur Prüfug ist da die t-verteilug herazuziehe. 2.4.6 χ 2 -Test Tests basiered auf diskrete bzw. diskretisierte Merkmale. Grob gesproche eige sich χ 2 -Tests, um zu etscheide, ob eie empirische Verteilug sigifikat vo eier Modellverteilug abweicht. Haupttype: χ 2 -Uabhägigkeitstest: Weicht die empirische gemeisame Verteilug vo der uter Uabhägigkeit zu erwartede sigifikat ab? χ 2 -Apassugstest z.b. Abweichug vo der Gleichverteilug H 0 : P (X = 1) = P (X = 2) = P (X = 3) = 1 3 χ 2 -Homogeitätstest: Gilt i k Subpopulatioe jeweils dieselbe Verteilug? Hier ur ausführlicher: χ 2 -Uabhägigkeitstest I Beispiel eigebettet: 1. Aktive Stellug im öffetliche Lebe beeiflusst Kooperatiosbereitschaft im Iterview 2. Statistische Modelle: Zwei diskrete Merkmale X ud Y Y X Verbadsmitgliedschaft Kooperatiosbereitschaft (X 1, Y 1 ),..., (X, Y ) i.i.d. Stichprobe des zwei-dimesioale Merkmals (X, Y ). 3. Statistische Hypothese: H 0 : H 1 : Es herrscht Uabhägigkeit Es herrscht keie Uabhägigkeit

Kapitel 2. Iduktive Statistik 101 d.h. H 0 : P (X = x i, Y = y i ) = P (X = x i ) P (Y = y i ) für alle Paare i, j gege H 1 : P (X = x i, Y = y i ) P (X = x i ) P (Y = y i ) 4. Festlege des Sigifikaziveaus 5. Testgröße ud kritische Regio Sesitive Testgröße: χ 2 -Abstad Beobachtete Tafel der relative Häufigkeite: Y X/Y 1... m für midestes ei Paar i, j X 1. k h 11 h k1... h ij... h 1m h km h 1 h k h 1... h m h ij absolute Häufigkeit des Ereigisses {X = x i } {Y = y i } i der Stichprobe h ij Schätzer für P (X = x i, Y = y i ). Zu vergleiche mit der Uabhägigkeitstafel: h ij Y X/Y 1... m X 1. h 1 h 1... 2 h i h j 2 k... h 1 h i h k Teststatistik: T = = k i=1 k i=1 j=1 h 1 ( m h ij h i h j m j=1 h i h j ) 2 (f ij f i f j ) f i f j = h j k i=1 h m m j=1 1 ( ) 2 hj h i h j 2 h i h j 2

102 2.4. Hypothesetests T = alle Zelle (beobachtet erwartet) 2 Normierug Uter H 0 gehorcht T approximativ eier sogeate χ 2 Verteilug mit (k 1) (m 1) Freiheitsgrade. Kritische Regio: Je stärker H 0 verletzt ist, umso stärker weiche die beobachtete Häufigkeite h ij ud die uter Uabhägigkeit zu erwartede Häufigkeite h i h j 2 voeiader ab, d.h desto größer ist T. Also kritische Regio aus große Werte vo T : KR = [z, ) wobei z so, dass P (T KR H 0 ) = P (T z H 0 ) α z ist das (1 α)-quatil der etsprechede χ 2 Verteilug: χ 2 1 α((k 1) (m 1)). χ 2 -Verteilug χ 2 1 α Beispiel: Beobachtete Tabelle: Uabhägigkeitstabelle: Hier hat ma eie Freiheitsgrad, de z.b. χ 2 0.9(1) = 2.7055 χ 2 0.95(1) = 3.8415 χ 2 0.99(1) = 6.6349 kooperativ ja ei ja 0.27 0.05 0.32 Mitglied ei 0.53 0.15 0.68 0.8 0.2 1 kooperativ ja ei ja 0.256 0.064 0.32 Mitglied ei 0.544 0.136 0.68 0.8 0.2 1 (k 1) (m 1) = (2 1) (2 1) = 1 Bei α = 0.1 erhält ma χ 2 1 α(1) = 2.7055, also KR = [2.7055, ).

Kapitel 2. Iduktive Statistik 103 Die Teststatistik T hat hier de Wert (0.27 0.256)2 (0.53 0.544)2 (0.05 0.064)2 t = 352 ( + + + 0.256 0.544 0.064 (0.15 0.136)2 ) = 1.98 0.136 Hier ist das Ergebis stark rudugsabhägig. Dies wäre ei Argumet, mit absolute Häufigkeite zu reche! (Bei Berechug am Computer sollte Rudugsfehler praktisch keie Rolle mehr spiele.) Testetscheidug: Da t = 1.98 / KR, ka die Nullhypothese icht abgeleht werde; ei Zusammehag zwische Aktivität im öffetliche Lebe ud der Kooperatiosbereitschaft kote zum Sigifikaziveau vo 10% icht achgewiese werde. 2.4.7 Zur praktische Awedug statistischer Tests Testetscheiduge ud Statistik-Software Statistik-Software berechet meist de p-wert, also die Wahrscheilichkeit uter H 0 midestes eie so stark für die Alterative sprechede Wert zu erhalte, wie de tatsächlich beobachtete Wert der Teststatistik. Dies ist die Wahrscheilichkeit für de Fehler 1. Art, ma ka also sage: H 0 ka geau da abgeleht werde, we der p-wert kleier gleich dem vorgegebee Sigifikaziveaus ist. Bei viele Tests ist hier aber Vorsicht gebote. Die vom Programm betrachtete Nullhypothese muss icht die tatsächlich iteressierede Nullhypothese sei! Beim Gauss- ud t-test sid beispielsweise drei verschiedee Nullhypothese möglich: H 0 : µ µ 0, H 0 : µ = µ 0, H 0 : µ µ 0 SPSS gibt hier eie zweiseitige p-wert (2-tailed sigificace) a, der zur Hypothese H 0 : µ = µ 0 gege H 1 : µ µ 0 ud damit zur kritische Regio (, z 1 α ) (z 1 α, ) 2 2 gehört. Möchte ma dagege H 0 : µ µ 0 teste, so darf ma H 0 ablehe, falls 1. der Wert der Teststatistik größer als µ 0 ist (also auf der richtige Seite liegt ) ud 2. falls gilt: p-wert 2 Sigifikaziveau. (aalog für H 0 : µ µ 0 ) Pukt 1. sollte icht vergesse werde, da ma sost leicht Usi produziere ka. Ei Wert vo T = 90000 liefert eie zweiseitige p-wert vo fast 0, führt aber atürlich icht zur Ablehug vo H 0 : µ 0. Zur Hypothesewahl: Es sei ochmal dara eriert: Statistisch gesichert zur vorgegebee Fehlerwahrscheilichkeit ist ur die Ablehug der Nullhypothese. Hat ma die Wahl (bei eiseitige Tests), so setzt ma das, was ma zeige will, i die Alterativhypothese.

104 2.4. Hypothesetests Dualitätsprizip vo Test ud Kofidezitervall: H 0 : µ = µ 0 gege H 1 : µ µ 0. H 0 wird abgeleht, we X µ 0 X µ 0 > z 1 α 2 > z 1 α oder X µ 0 2 X > µ 0 + z 1 α 2 < z 1 α 2 oder X µ 0 < z 1 α oder X < µ 0 z 1 α 2 2 d.h. abgeleht werde alle Nullhypothese µ = µ 0 mit oder µ 0 < x z 1 α 2 µ 0 > x + z 1 α 2 Vergleiche diese Ablehbereiche mit dem Kofidezitervall [ ] X z 1+γ ; X + z 1+γ. 2 2 Passe α ud γ zusamme, gilt also z 1 α = z 2 1+γ, so sid diese Ausdrücke komplemetär: 2 1 α 2! = 1+γ 2 α = 1 + γ 2 γ = 1 α α = 1 γ Ma leht also geau diejeige Nullhypohese H 0 : µ = µ 0 zum Niveau α ab, zu dee ma zum Niveau γ = 1 α kei Vertraue hat. Beispiel Normalverteilug: X ubekat, bekat T = X µ 0 Werte i der Mitte Kofidezitervall extreme Werte Test Dieses Beispiel ist verallgemeierbar. Es besteht geerell ei sehr eger Zusammehag zwische Tests ud Kofidezitervalle: Gegebe eie Pivotgröße T, besteht ei Kofidezitervall zum Vertrauesgrad γ geau aus all jee Werte ϑ 0 eies Parameters ϑ, bei dee die Hypothese H 0 : ϑ = ϑ 0 zum Sigifikaziveau α = 1 γ icht abgeleht wurde. Ma leht H 0 : ϑ = ϑ 0 geau da icht zuguste vo H 1 : ϑ ϑ 0 ab, we ϑ 0 zu dejeige Werte gehört, zu dee ma ahad der Stichprobe zum Niveau γ = 1 α Vertraue hat. Eie praktische Kosequez daraus: Gegebe ei Kofidezitervall [A(X 1,..., X ), B(X 1,..., X )]

Kapitel 2. Iduktive Statistik 105 für ϑ, ka ma Hypothese der Form umittelbar teste. Betrachte ach der Stichprobe das Itervall H 0 : ϑ = ϑ 0 [A(X 1,..., X ), B(X 1,..., X )]. Liegt ϑ 0 dari, da ka H 0 : ϑ = ϑ 0 icht abgeleht werde, sost scho. (Mache Softwarepakete gebe deshalb bei bestimmte Prozedure ur Kofidezitervalle, aber keie Tests a.) Beispiel Wahlumfrage: = 500, x = 46.5% Ateil Rot/Grü, γ = 95% Ma erhielt das Kofidezitervall [0.421; 0.508]. Da π = 0.5 im Kofidezitervall liegt, ka die Hypothese π = 0.5 icht abgeleht werde. Beispiel: Ma iteressiert sich, ob gewisse Gummibärchepackuge geau die agegebee Füllmege vo 250g ethalte, möchte also H 0 : µ = 250g gege H 1 : µ 250g zu α = 0.05 teste. Hat ma zu γ = 0.95 das auf der t-verteilug beruhedes Kofidezitervall [239.675, 250.325] erhalte, so ka obige Hypothese icht abgeleht werde, da der Wert 250 im Kofidezitervall liegt. Sigifikaz versus Relevaz: Die übliche Testgröße häge vom Stichprobeumfag ab: Je größer, umso leichter ka ma eie Abweichug als sigifikat achweise. 1. Aus der Nichtsigifikaz eies Uterschieds ka icht otwedig geschlosse werde, dass kei ihaltlich relevater Uterschied vorliegt. Vielleicht war ur der Stichprobeumfag zu klei, um eie durchaus vorhadee Uterschied auch als sigifikat achweise zu köe. 2. Adererseits ka es sei, dass bei große Stichprobeumfäge selbst miimale Abweichuge sigifikat sid. Nicht jede statistisch sigifikate Abweichug ist daher auch ihaltlich relevat, weshalb Vorsicht bei der ihaltliche Iterpretatio gerade bei große Datesätze agebracht ist. Mögliche Auswege: Ergebisse kritisch betrachte. Betrachtug sogeater Effektstärkemaße. Utersuche statt der Hypothese µ A > µ B die Hypothese µ A > µ B + δ mit (ihaltlich) relevatem Uterschied δ. Multiple Testprobleme: Gegebe sei ei rei zufälliger Datesatz mit 50 Variable ohe irgedeie Zusammehag.

106 2.5. Lieare Regressiosmodelle Ma testet alle Variablepaare auf eie Zusammehag Tests. ( ) 50 = 1225 2 Bei vorgegebeer Irrtumswahrscheilichkeit vo 5% gilt für die Azahl fälschlich verworfeer Nullhypothese X B(1225, 0.05) ud somit E(X) = 61, 25. Im Durchschitt wird also mehr als 61 mal die Nullhypothese, dass kei Zusammehag besteht, verworfe. weige, sivolle Hypothese vorher ihaltlich überlege ud ur diese teste! Es gibt Asätze, wie ma bei große Hypothesesysteme diesem Problem etkommt: Theorie des multiple Testes. Z.B. Boferroi-Adjustierug des Irrtumswahrscheilichkeit: Statt α betrachte ma α/azahl der Tests. Diese spezielle Korrektur ist aber meist überkoservativ ud ka durch bessere Korrekture ersetzt werde. Nichtparametrische Tests Bis auf de χ 2 -Uabhägigkeits-Test baue alle Tests auf der (zumidestes approximative Gültigkeit der) Normalverteilugsaahme auf. Problematisch, z.b. bei kleie Stichprobeumfäge oder bei ordiale Date mit weige uterschiedliche Auspräguge. Hier ka die ureflektierte Awedug der Stadardtests zu Fehlergebisse führe. Ei wichtiger Ausweg: ichtparametrische Tests = Verteilugsfreie Verfahre Hier wird die Iformatio i de Beobachtuge auf Räge, bzw. größer/kleier Vergleiche reduziert. Bekateste Beispiele: Wilcoxo-Test, Vorzeichetest. 2.5 Lieare Regressiosmodelle 2.5.1 Wiederholug aus Statistik I Beispiel: Kaffeeverkauf auf drei Flohmärkte X Y Azahl verkaufter Tasse Kaffee zugehöriger Gewi (Preis Verhadlugssache)

Kapitel 2. Iduktive Statistik 107 i x i y i y i ȳ x i x (x i x) 2 1 10 9-1 0 0 2 15 21 11 5 25 3 5 0-10 -5 25 x = 10 ȳ = 10 Ma bestimme die Regressiosgerade ud iterpretiere die erhaltee KQ-Schätzuge! Welcher Gewi ist bei zwölf verkaufte Tasse zu erwarte? ˆb = i=1 (x i x)(y i ȳ) i=1 (x i x) 2 = 0 ( 1) + 5 11 + ( 5) ( 10) 0 + 25 + 25 = 105 50 = 2.1 Mit der Erhöhug der Mege X um eie Eiheit erhöht sich der Gewi Y um 2.1 Eiheite, also ist ˆb so etwas wie der durchschittliche Gewi pro Tasse. â = ȳ ˆb x = 10 2.1 10 = 11 Grudlevel, Gewi bei 0 Tasse (Fixkoste). Vorhergesagte Werte ud Residue: ŷ i = â + ˆb x i, ˆε i = y i ŷ i Zur Kotrolle: ˆɛ 1 + ˆɛ 2 + ˆɛ 3 = 0 ŷ 1 = 11 + 2.1 10 = 10 ˆε 1 = 1 ŷ 2 = 11 + 2.1 15 = 20.5 ˆε 2 = 0.5 ŷ 3 = 11 + 2.1 5 = 0.5 ˆε 3 = 0.5 Progose: x = 12 = ŷ = â + ˆb x = 11 + 2.1 12 = 14.2 Beispiel: Arbeitszeit ud Eikomme Multiples Regressiosmodell: y i = β 0 + β 1 x 1i + β 2 x 2i + ε i mit X 1 = { 1 mälich 0 weiblich X 2 = (vertragliche) Arbeitszeit Y = Eikomme Iterpretatio:

108 2.5. Lieare Regressiosmodelle Die geschätzte Gerade für die Mäer lautet für die Fraue higege erhält ma ŷ i = ˆβ 0 + ˆβ 1 1 + ˆβ 2 x 2i ŷ i = ˆβ 0 + ˆβ 1 0 + ˆβ 2 x 2i = ˆβ 0 + ˆβ 2 x 2i y } ˆβ { β2 ˆ 1 ˆβ 0 { x 2 β 0 β 2 β 1 Grudlevel durchschittlicher Studeloh Zusatzeffekt des Geschlechts zum Grudlevel. Beispiel zur Dummykodierug Nomiales Merkmal mit q Kategorie, z.b. X = Parteipräferez mit 1 CDU/CSU oder FDP X = 2 SPD oder Grüe 3 Sostige Ma darf X icht eifach mit Werte 1 bis 3 besetze, da es sich um ei omiales Merkmal hadelt. Idee: Mache aus der eie Variable mit q (hier 3) Auspräguge q 1 (hier 2) Variable mit de Auspräguge ja/ei ( ˆ=0/1). Diese Dummyvariable dürfe da i der Regressio verwedet werde. X 1 = { 1 CDU/CSU oder FDP 0 adere X 2 = { 1 SPD, Grüe 0 adere Durch die Auspräguge vo X 1 ud X 2 sid alle mögliche Auspräguge vo X vollstädig beschriebe:

Kapitel 2. Iduktive Statistik 109 Beispiel zur Iterpretatio: Y : Score auf Autoritarismusskala X bzw. X 1, X 2 : Parteiepräferez X 3 : Eikomme X Text X 1 X 2 1 CDU/CSU, FDP 1 0 2 SPD, Grüe 0 1 3 Sostige 0 0 y i = β 0 + β 1 x 1i + β 2 x 2i + β 3 x 3i + ε i β 0 : Grudiveau β 1 : ceteris paribus Effekt (Erhöhug des Grudiveaus) vo CDU/CSU ud FDP β 2 : ceteris paribus Effekt (Erhöhug des Grudiveaus) vo SPD ud Grüe β 3 : ceteris paribus Effekt des Eikommes Multiples Regressiosmodell: Y i abhägige Variable X i1 X i2. X ip uabhägige Variable metrisch/quasistetig metrische/quasistetige oder dichotome (0/1) Variable (kategoriale Variable mit mehr Kategorie Dummy-Kodierug) Asatz: liearer Zusammehag. Ermittle aus de Date Wirkugsstärke der eizele Variable. Im Folgede: Probabilistische Modelle i Aalogie zu de deskriptive Modelle aus Statistik I (damit Verallgemeierug auf die Grudgesamtheit möglich). 2.5.2 Lieare Eifachregressio Zuächst Modelle mit ur eier uabhägige Variable. Statistische Sichtweise: Wahres Modell y i = β 0 + β 1 x i

110 2.5. Lieare Regressiosmodelle β 0 Grudiveau β 1 Elastizität : Wirkug der Äderug vo X i um eie Eiheit gestört durch zufällige Fehler ɛ i Ma beobachtet Datepaare, (X i, Y i ), i = 1,..., mit wobei Y i = β 0 + β 1 X i + ɛ i ɛ i N (0, 2 ) 2 für alle i gleich ɛ i1, ɛ i2 stochastisch uabhägig für i 1 i 2 Nach de Modellaahme gilt für die bedigte Verteilug vo Y i gegebe X i = x i : Y i N (β 0 + β 1 x i, 2 ) i = 1,...,. Iterpretatio: verschiedee Normalverteiluge jeweils mit verschobeem Mittelwert µ i = β 0 + β 1 x i, aber gleicher Variaz. β 0 + β 1 x 2 β 0 + β 1 x 1 x 1 x 2 Aufgabe: Schätze die Parameter β 0, β 1 ud 2. Die Schätzwerte ud Schätzfuktioe werde üblicherweise mit ˆβ 0, ˆβ 1 ud ˆ 2 bezeichet. I der ebe beschriebee Situatio gilt:

Kapitel 2. Iduktive Statistik 111 1. Die Maximum Likelihood Schätzer laute: ˆβ 1 = (Xi X)(Y i Ȳ ) i=1 (X i X) 2, mit de geschätzte Residue ˆβ 0 = Ȳ ˆβ 1 X, ˆ 2 = 1 2 i=1 ˆε 2 i ˆε i = Y i ˆβ 0 ˆβ 1 X i. 2. Mit gilt ud aalog mit gilt ˆ ˆβ0 := ˆ ˆβ1 := ˆ i=1 X2 i i=1 (X i X) 2 ˆβ 0 β 0 ˆ ˆβ0 t( 2) ˆ i=1 (X i X) 2 ˆβ 1 β 1 ˆ ˆβ1 t( 2). Bemerkuge: ˆβ 0 ud ˆβ 1 sid die KQ-Schätzer aus Statistik I. Uter Normalverteilug fällt hier das ML- mit dem KQ-Prizip zusamme. Ma ka umittelbar Tests ud Kofidezitervalle ermittel (völlig aalog zum Vorgehe i Kapitel 2.3 ud 2.4). Kofidezitervalle zum Sicherheitsgrad γ: Mit der Teststatistik ergibt sich für β 0 : [ ˆβ 0 ± ˆ ˆβ0 t 1+ γ ( 2)] 2 für β 1 : [ ˆβ 1 ± ˆ ˆβ1 t 1+γ ( 2)] 2 T β 1 = ˆβ 1 β 1 ˆ ˆβ1 Hypothese kritische Regio I. H 0 : β 1 β1 gege β 1 > β1 T t 1 α ( 2) II. H 0 : β 1 β1 gege β 1 < β1 T t 1 α ( 2) III. H 0 : β 1 = β1 gege β 1 β1 T t 1 α ( 2) 2

112 2.5. Lieare Regressiosmodelle (aalog für ˆβ 0 ). Vo besoderem Iteresse ist der Fall β1 = 0: X eie sigifikate Eifluss hat oder icht. Typischer SPSS-Output Koeffiziete a Hiermit ka ma überprüfe, ob Stadardisierte Koeffiziete β Stadardfehler Beta T Sigifikaz Kostate ˆβ0 ˆ ˆβ0 5) 1) 3) Uabhägige Variable ˆβ1 ˆ ˆβ1 6) 2) 4) a abhägige Variable 1) Wert der Teststatistik T β 0 = ˆβ 0 ˆ ˆβ0. zum Teste vo H 0 : β 0 = 0 gege H 1 : β 0 0. 2) Aalog: Wert vo T β 1 = ˆβ 1 ˆ ˆβ1 zum Teste vo H 0 : β 1 = 0 gege H 1 : β 1 0. 3) p-wert zu 1) 4) p-wert zu 2) 5), 6) hier icht vo Iteresse. Die Testetscheidug ˆβ1 sigifikat vo 0 verschiede etspricht dem statistische Nachweis eies Eiflusses vo X. 2.5.3 Multiple lieare Regressio Aaloger Modellierugsasatz, aber mit mehrere erklärede Variable: Y i = β 0 + β 1 X i1 + β 2 X i2 +... + β p X ip + ɛ i Schätzug vo β 0, β 1,..., β p ud 2 sivollerweise über Matrixrechug bzw. Software. Aus dem SPSS-Output sid ˆβ 0, ˆβ 1,..., ˆβ p sowie ˆ ˆβ0, ˆ ˆβ1,..., ˆ ˆβp ablesbar. (Outputs lese köe ist absolut klausurrelevat! Matrixrechug wird icht verlagt.)

Kapitel 2. Iduktive Statistik 113 Es gilt für jedes j = 0,..., p ˆβ j β j ˆ ˆβj t( p 1) ud ma erhält wieder Kofidezitervalle für β j : sowie etsprechede Tests. [ ˆβ j ± ˆ ˆβj t 1+ γ ( p 1)] 2 Vo besoderem Iteresse ist wieder der Test H 0 : β j = 0, H 1 : β j 0. Der zugehörige p-wert fidet sich im SPSS-Ausdruck (Vorsicht mit Problematik des multiple Testes!). Ma ka auch simulta teste, z.b. β 1 = β 2 =... = β p = 0. Dies führt zu eiem sogeate F-Test ( Software). Sid alle X ij 0/1-wertig, so erhält ma eie sogeate Variazaalyse, was dem Vergleich vo mehrere Mittelwerte etspricht. Für Befragte mit X ij = 0 für alle j gilt: E(Y ) = β 0 Ist X i1 = 1 ud X ij = 0 für j 2, so gilt E(Y ) = β 0 + β 1 Ist X i1 = 1 ud X i2 = 1, sowie X ij = 0 für j 3, so gilt E(Y ) = β 0 + β 1 + β 2 etc. 2.5.4 Variazaalyse Vor allem i der agewadte Literatur wird die Variazaalyse uabhägig vom Regressiosmodell etwickelt. Ziel: Mittelwertvergleiche i mehrere Gruppe, häufig i (quasi-) experimetelle Situatioe. Verallgemeierug des t-tests. Dort ur zwei Gruppe.

114 2.5. Lieare Regressiosmodelle Hier ur eifaktorielle Variazaalyse (Eie Gruppierugsvariable). Beispiel: Eistellug zu Atomkraft ahad eies Scores, achdem ei Film gezeigt wurde. 3 Gruppe ( Faktorstufe ): Pro-Atomkraft-Film Cotra-Atomkraft-Film ausgewogeer Film Variazaalyse: Vergleich der Variabilität i ud zwische de Gruppe Beobachtuge: Y ij j = 1,..., J Faktorstufe i = 1,..., j Persoeidex i der j-te Faktorstufe Zwei äquivalete Modellformulieruge: a) Modell i Mittelwertdarstellug: Y ij = µ j + ɛ ij j = 1,..., J, i = 1,..., j, mit Testproblem: µ j faktorspezifischer Mittelwert ɛ ij zufällige Störgröße ɛ ij N (0, 2 ), ɛ 11, ɛ 12,..., ɛ JJ uabhägig. H 0 : µ 1 = µ 2 =... µ J gege H 1 : µ l µ q für midestes ei Paar (l, q) b) Modell i Effektdarstellug: Y ij = µ + α j + ɛ ij wobei α j so, dass J j α j = 0. j=1 Testproblem: µ globaler Erwartugswert α j Effekt i der j-te Faktorstufe, systematische Abweichug vo µ H 0 : α 1 = α 2 =... α J = 0 gege H 1 : α j 0 für midestes ei j

Kapitel 2. Iduktive Statistik 115 Die beide Modelle sid äquivalet: setze µ j := µ + α j. Streuugszerlegug Mittelwerte: Ȳ Ȳ j Gesamtmittelwert i der Stichprobe Mittelwert i der j-te Faktorstufe Es gilt (vgl. Statistik I) die Streuugszerlegug: J j J J (Y ij Ȳ ) 2 = j (Ȳ j Ȳ ) 2 } {{ } + j (Y ij Ȳ j) 2 j=1 j=1 i=1 = SQE } {{ } Variabilität der Gruppe = SQR Variabilität i de Gruppe j=1 j=1 Die Testgröße SQE/(J 1) F = SQR/( J) ist geeiget zum Teste der Hypothese beziehugsweise H 0 : µ 1 = µ 2 =... µ J gege H 1 : µ l µ q für midestes ei Paar (l, q) H 0 : α 1 = α 2 =... α J = 0 gege H 1 : α j 0 für midestes ei j Sie besitzt eie sog. F -Verteilug mit (J 1) ud ( J) Freiheitsgrade. Die kritische Regio besteht aus de große Werte vo F (Vorsicht: obwohl H 0 vo Gleichheitsform ). Also H 0 ablehe falls T > F 1 α (J 1, J), mit dem etsprechede (1 α)-quatil der F -Verteilug mit (J 1) ud ( J) Freiheitsgrade. (Je größer die Variabilität zwische de Gruppe im Vergleich zu der Variabilität i de Gruppe, desto uplausibler ist die Nullhypothese, dass alle Gruppemittelwerte gleich sid.) Bei Ablehug des globale Tests ist da oft vo Iteresse, welche Gruppe sich uterscheide. Teste spezifischer Hypothese über die Effekte α j bzw. die Mittelwerte µ j. Dabei tritt allerdigs wieder Problematik des multiple Testes auf.