Willkommen zur Vorlesung Statistik

Ähnliche Dokumente

Willkommen zur Vorlesung Statistik (Master)

Einfache Varianzanalyse für abhängige

Willkommen zur Vorlesung Statistik (Master)

Webergänzung zu Kapitel 10

Business Value Launch 2006

9. Schätzen und Testen bei unbekannter Varianz

Statistik II für Betriebswirte Vorlesung 2

Überblick über die Verfahren für Ordinaldaten

Melanie Kaspar, Prof. Dr. B. Grabowski 1

Varianzanalyse (ANOVA: analysis of variance)

Motivation. Wilcoxon-Rangsummentest oder Mann-Whitney U-Test. Wilcoxon Rangsummen-Test Voraussetzungen. Bemerkungen

Lineargleichungssysteme: Additions-/ Subtraktionsverfahren

Statistische Auswertung:

Profil A 49,3 48,2 50,7 50,9 49,8 48,7 49,6 50,1 Profil B 51,8 49,6 53,2 51,1 51,1 53,4 50, ,5 51,7 48,8

Tutorial: Homogenitätstest

Welche Lagen können zwei Geraden (im Raum) zueinander haben? Welche Lagen kann eine Gerade bezüglich einer Ebene im Raum einnehmen?

Auswerten mit Excel. Viele Video-Tutorials auf Youtube z.b.

Messung von Veränderungen. Dr. Julia Kneer Universität des Saarlandes

Formelsammlung zur Kreisgleichung

Grundlagen der Inferenzstatistik

Wurzeln als Potenzen mit gebrochenen Exponenten. Vorkurs, Mathematik

QM: Prüfen -1- KN

Weitere (wählbare) Kontraste in der SPSS Prozedur Allgemeines Lineares Modell

Herzlich Willkommen zur Vorlesung Statistik

Grundlagen quantitativer Sozialforschung Interferenzstatistische Datenanalyse in MS Excel

Zeichen bei Zahlen entschlüsseln

Mittelwertvergleiche, Teil II: Varianzanalyse

Forschungsstatistik I

Name (in Druckbuchstaben): Matrikelnummer: Unterschrift:

Was meinen die Leute eigentlich mit: Grexit?

Stichprobenauslegung. für stetige und binäre Datentypen

METHODENLEHRE I WS 2013/14 THOMAS SCHÄFER

Was ist Sozial-Raum-Orientierung?

Quantitative Methoden der Bildungsforschung

6. Bayes-Klassifikation. (Schukat-Talamazzini 2002)

Repetitionsaufgaben Wurzelgleichungen

Biostatistik, WS 2015/2016 Der zwei-stichproben-t-test

Auswertung mit dem Statistikprogramm SPSS:

Beurteilung der biometrischen Verhältnisse in einem Bestand. Dr. Richard Herrmann, Köln

Kontingenzkoeffizient (nach Pearson)

Funktion Erläuterung Beispiel

Franz Kronthaler. Statistik angewandt. Datenanalyse ist (k)eine Kunst. Excel Edition. ^ Springer Spektrum

Das große ElterngeldPlus 1x1. Alles über das ElterngeldPlus. Wer kann ElterngeldPlus beantragen? ElterngeldPlus verstehen ein paar einleitende Fakten

Die Post hat eine Umfrage gemacht

geben. Die Wahrscheinlichkeit von 100% ist hier demnach nur der Gehen wir einmal davon aus, dass die von uns angenommenen

Die Optimalität von Randomisationstests

Anhand des bereits hergeleiteten Models erstellen wir nun mit der Formel

Varianzanalyse ANOVA

15.3 Bedingte Wahrscheinlichkeit und Unabhängigkeit

Kapitalerhöhung - Verbuchung

Professionelle Seminare im Bereich MS-Office

Rente = laufende Zahlungen, die in regelmäßigen Zeitabschnitten (periodisch) wiederkehren Rentenperiode = Zeitabstand zwischen zwei Rentenzahlungen

Klausur zur Vorlesung Multivariate Verfahren, SS Kreditpunkte, 90 min

Güte von Tests. die Wahrscheinlichkeit für den Fehler 2. Art bei der Testentscheidung, nämlich. falsch ist. Darauf haben wir bereits im Kapitel über

Eine Einführung in R: Statistische Tests

Korrelation (II) Korrelation und Kausalität

Abituraufgabe zur Stochastik, Hessen 2009, Grundkurs (TR)

Einige Statistische Tests für den Ein- Zwei- und k-stichprobenfall (Nach Sachs, Stat. Meth.)

Prüfung eines Datenbestandes

Universität Bonn 28. Juli 2010 Fachbereich Rechts- und Wirtschaftswissenschaften Statistische Abteilung Prof. Dr. A. Kneip. KLAUSUR Statistik B

Die Übereckperspektive mit zwei Fluchtpunkten

Also kann nur A ist roter Südler und B ist grüner Nordler gelten.

Auswertung zur. Hauptklausur Unternehmensbesteuerung. vom und Ergebnisse der Kundenbefragung

sondern alle Werte gleich behandelt. Wir dürfen aber nicht vergessen, dass Ergebnisse, je länger sie in der Vergangenheit

Wie Projektziele gemessen werden können oder wie man Indikatoren entwickeln kann?

Statistik I für Betriebswirte Vorlesung 11

Auswertung des Jahresabschlusses Bilanzanalyse 2

Zahlen und das Hüten von Geheimnissen (G. Wiese, 23. April 2009)

Grundbegriffe der Informatik

Hochschule Rhein-Main. Sommersemester 2015

Informationsblatt Induktionsbeweis

Übersicht: Modul 2. Methoden der empirischen Sozialforschung, Statistik und computergestützte Datenanalyse. Dr. H.-G. Sonnenberg

mehrmals mehrmals mehrmals alle seltener nie mindestens **) in der im Monat im Jahr 1 bis 2 alle 1 bis 2 Woche Jahre Jahre % % % % % % %

Lohnvergleich Primar Dienstjahre

NINA DEISSLER. Flirten. Wie wirke ich? Was kann ich sagen? Wie spiele ich meine Stärken aus?

Statistik II für Betriebswirte Vorlesung 3

Eva Douma: Die Vorteile und Nachteile der Ökonomisierung in der Sozialen Arbeit

90-minütige Klausur Statistik für Studierende der Kommunikationswissenschaft

Die Gesellschaftsformen

Etwas positive Tendenz ist beim Wechsel der Temperatur von 120 auf 170 zu erkennen.

Analysis I für Studierende der Ingenieurwissenschaften

Dieses erste Kreisdiagramm, bezieht sich auf das gesamte Testergebnis der kompletten 182 getesteten Personen. Ergebnis

Lernmaterial für die Fernuni Hagen effizient und prüfungsnah

Physik & Musik. Stimmgabeln. 1 Auftrag

1. Man schreibe die folgenden Aussagen jeweils in einen normalen Satz um. Zum Beispiel kann man die Aussage:

Was ist das Budget für Arbeit?

Die neuen Familienleistungen machen vieles leichter. Kinderbetreuungskosten.

Prozentrechnung. Wir können nun eine Formel für die Berechnung des Prozentwertes aufstellen:

Vertrauen in Medien und politische Kommunikation die Meinung der Bürger

Erklärung zu den Internet-Seiten von

Gibt es einen Geschmacksunterschied zwischen Coca Cola und Cola Zero?

Analyse von Querschnittsdaten. Regression mit Dummy-Variablen

Mah Jongg - Ein Spiel für 4 Spieler

Wir gehen aus von euklidischen Anschauungsraum bzw. von der euklidischen Zeichenebene. Parallele Geraden schneiden einander nicht.

Lösungen zu Janssen/Laatz, Statistische Datenanalyse mit SPSS 1

Studieren- Erklärungen und Tipps

Auswertung und Darstellung wissenschaftlicher Daten (1)

Transkript:

Willkommen zur Vorlesung Statistik Thema dieser Vorlesung: Varianzanalyse Prof. Dr. Wolfgang Ludwig-Mayerhofer Universität Siegen Philosophische Fakultät, Seminar für Sozialwissenschaften Prof. Dr. Wolfgang Ludwig-Mayerhofer Statistik Universität Siegen

Die Varianzanalyse Fragestellung und Grundidee Ein Beispiel Das Zusammenhangsmaß η 2 Der F-Test Abschließendes 2 / 19

Fragestellung und Grundidee Varianzanalyse In der Kreuztabellenanalyse haben wir ein Merkmal mit (relativ) wenigen Ausprägungen durch ein anderes Merkmal (ebenfalls mit wenigen Ausprägungen) zu erklären versucht. Zu diesem Zweck haben wir die bedingten Anteilswerte verglichen z. B. den Anteil der Hauptschüler unter der Bedingung, dass man aus einer Arbeiterfamilie stammt, mit dem Anteil der Hauptschüler unter der Bedingung, dass man aus einer Angestelltenfamilie stammt. Ist die abhängige Variable (das Merkmal, das erklärt werden soll) metrisch, die unabhängige Variable dagegen nominalskaliert (oder ordinalskaliert mit wenigen Gruppen), so werden statt dessen die bedingten Mittelwerte, die Gruppenmittelwerte, verglichen. 3 / 19

Fragestellung und Grundidee Veranschaulichung Daten zu Universitäten in drei deutschen Regionen (siehe Datenblatt erste Woche, hier aber anderes Fach): 20 Betreuungsquoten Bauingenieurwesen, 2005, nach FOCUS 15 10 5 0 Süddeutschland West-/Norddeutschland Ostdeutschland Diamanten zeigen Gruppenmittelwerte, gestrichelte Linie den Gesamtmittelwert Achtung Daten dienen nur der Illustration, Gültigkeit ist fraglich! 4 / 19

Fragestellung und Grundidee Die Grundidee der Varianzanalyse verbal Die Unterschiedlichkeit (Varianz) der Datenwerte kann in zwei Teile zerlegt werden: Die Unterschiedlichkeit, die auf die Gruppenzugehörigkeit zurückgeht, ausgedrückt in den Abweichungen der Gruppenmittelwerte ȳ i vom Gesamtmittelwert ȳ. Die Unterschiedlichkeit, die nicht auf die Gruppenzugehörigkeit zurückgeht, ausgedrückt in den Abweichungen der individuellen Messwerte vom jeweiligen Gruppenmittelwert. 5 / 19

Fragestellung und Grundidee Varianzanalyse die Grundidee formal Gegeben sind i, i = 1... r Gruppen In jeder Gruppe werden Daten von j, j = 1... m Personen erhoben (d. h., pro Gruppe gleich viele Personen wichtige Vereinfachung, die bei experimentellen Studien oft befolgt wird). Die Summe aller quadrierten Abweichungen vom Mittelwert ( Quadratsumme, QS) lässt sich zerlegen in r m r r m (y ij ȳ) 2 = m (ȳ i ȳ) 2 + (y ij ȳ i ) 2 i=1 j=1 i=1 i=1 j=1 oder: QS total = QS zwischen + QS innerhalb 6 / 19

Ein Beispiel Varianzanalyse: ein Beispiel Eine Miniversion der Daten könnte so aussehen: Süd W/N Ost 4 11 18 7 14 19 7 20 26 Mittelwerte 6 15 21 Mittelwert über alle (ȳ): 14 7 / 19

Ein Beispiel Beispiel, Schritt I Die gesamte Quadratsumme (QS total ) muss nicht unbedingt berechnet werden, doch kann dies zur Kontrolle zweckmäßig sein: Süd West/Nord Ost (4 14) 2 = 100 (11 14) 2 = 9 (18 14) 2 = 16 (7 14) 2 = 49 (14 14) 2 = 0 (19 14) 2 = 25 (7 14) 2 = 49 (20 14) 2 = 36 (26 14) 2 = 144 QS total = 428 8 / 19

Ein Beispiel Beispiel, Schritt II Abweichungen der Einzelwerte vom Gruppenmittelwert: Süd West/Nord Ost (4 6) 2 = 4 (11 15) 2 = 16 (18 21) 2 = 9 (7 6) 2 = 1 (14 15) 2 = 1 (19 21) 2 = 4 (7 6) 2 = 1 (20 15) 2 = 25 (26 21) 2 = 25 QS innerhalb = 86 9 / 19

Ein Beispiel Beispiel, Schritt III Abweichungen der Gruppenmittelwerte vom Gesamtmittelwert: Süd West/Nord Ost (6 14) 2 = 64 (15 14) 2 = 1 (21 14) 2 = 49 (6 14) 2 = 64 (15 14) 2 = 1 (21 14) 2 = 49 (6 14) 2 = 64 (15 14) 2 = 1 (21 14) 2 = 49 QS zwischen = 342 10 / 19

Ein Beispiel Zusammenfassung der Quadratsummen QS Total 428 Zwischen 342 Innerhalb 86 11 / 19

Das Zusammenhangsmaß η 2 Das Zusammenhangsmaß η 2 Das Verhältnis der durch die Gruppenzugehörigkeit bedingten Abweichungen vom Mittelwert (QS zwischen ) zur Gesamtheit der Abweichungen ist ein Maß für die Stärke des Einflusses der Gruppenzugehörigkeit: η 2 (Eta-Quadrat) = QS zwischen QS total η 2 kann Werte zwischen 0 und 1 annehmen. Im vorliegenden Fall beträgt der Wert 342/428 = 0, 799 (gibt es in echten Studien selten; die echten Daten in der Graphik zu Beginn der Vorlesung ergeben ein η 2 von 0, 23). 12 / 19

Das Zusammenhangsmaß η 2 η 2 als PRE-Maß PRE: Proportional Reduction of Error Fehler hier: Die Differenz zwischen dem (auf Grundlage unseres Modells) geschätzten Wert und dem wahren Wert. Kennen wir die Gruppenzugehörigkeit nicht, ist bester Schätzwert der Gesamtmittelwert (Schwerpunkteigenschaft des arithmetischen Mittels). Der Fehler (E 1 ) ist dann QS total. Kennen wir die Gruppenzugehörigkeit, ist der beste Schätzwert der Gruppenmittelwert. Der Fehler (E 2 ) ist dann QS innerhalb. 13 / 19

Das Zusammenhangsmaß η 2 η 2 als PRE-Maß Die Reduzierung des Fehlers, d. h., der Unterschied zwischen den beiden Fehlern (E 1 E 2 ), muss in Beziehung gesetzt werden zum Ausgangsfehler (E 1 ). Allgemein werden PRE-Maße also nach folgender Formel berechnet: Im Falle von η 2 heißt das: PRE Maß = E 1 E 2 E 1 η 2 = QS total QS innerhalb QS total = QS zwischen QS total 14 / 19

Der F-Test Inferenzstatistik I Zur Prüfung, ob sich die Gruppen überzufällig unterscheiden, werden nicht die Quadratsummen, sondern die Varianzen zueinander in Beziehung gesetzt. Diese heißen hier auch mittlere Quadratsummen (MQS). m r (ȳ i ȳ) 2 MQS zwischen = QS zwischen r 1 MQS innerhalb = QS innerhalb n r = = i=1 r 1 r m (y ij ȳ i ) 2 i=1 j=1 n r 15 / 19

Der F-Test Inferenzstatistik II Die Größe F = MQS zwischen MQS innerhalb folgt einer F-Verteilung mit r-1 und n-r Freiheitsgraden. Sie prüft, ob sich irgendwelche Gruppenmittelwerte voneinander unterscheiden, also H 0 : µ 1 = µ 2 =... = µ r = µ H 1 : µ i µ für mindestens ein i 16 / 19

Der F-Test Inferenzstatistik im Beispiel QS df MQS Total 428 8 Zwischen 342 2 171,00 Innerhalb 86 6 14,33 Kritischer Wert bei 2 und 6 df, α = 0, 05: 5,143. Teststatistik F hier: 171/14, 33 = 11, 93 > 5, 143. Die Nullhypothese wird also abgelehnt. 17 / 19

Abschließendes Alternativen und Anwendungsvoraussetzungen Liegen nur zwei Gruppen vor, wird oft der t-test für die Inferenzstatistik verwendet; die Varianzanalyse kommt jedoch zu den gleichen Schlussfolgerungen. Die Anwendbarkeit der Varianzanalyse (ebenso wie des t-tests) hängt von einigen Voraussetzungen ab, vor allem: gleiche Varianzen in den Gruppen und Normalverteilung der abhängigen Variablen. Weichen die Daten stark von diesen Annahmen ab (vor allem bei kleinen oder sehr unterschiedlich großen Gruppen), müssen alternative ( verteilungsfreie ) Verfahren verwendet werden. 18 / 19

Abschließendes Letzte Worte zur Varianzanalyse Der F-Test ist nur ein globaler Test ( es gibt irgendwelche Unterschiede ). Zum Testen spezifischer Hypothesen gibt es weitere Prüfverfahren. Mit der Varianzanalyse können auch Einflüsse mehrerer Gruppierungsvariablen analysiert werden (z.b. zwei Therapien bei zwei verschiedenen Krankheitsformen). Es gibt auch Verfahren für abhängige Stichproben, z. B. Messwiederholungen. 19 / 19