STATISTIK II. Hans-Otfried Müller Institut für Mathematische Stochastik.
|
|
- Eduard Schreiber
- vor 7 Jahren
- Abrufe
Transkript
1 STATISTIK II Hans-Otfried Müller Institut für Mathematische Stochastik 1
2 Ausgewählte Verfahren der multivariaten Datenanalyse und Statistik Werden bei einer Analyse gleichzeitig mehrere Merkmale oder Stichproben einbezogen, so kommen Verfahren der multivariaten Datenanalyse und Statistik zum Einsatz. Das generelle Ziel besteht dabei darin, Eigenschaften der gemeinsamen Verteilung der einbezogenen Zufallsvariablen bzw. Beobachtungen d.h. speziell eine evtl. vorhandene Abhängigkeitsstruktur zu erfassen. 2
3 Das Spektrum multivariater Analyseverfahren ist in Abhängigkeit von der Zahl und der Art der einbezogenen Variablen und der unterstellten Struktur der Abhängigkeit außerordentlich vielfältig. Grob unterscheiden kann man z.b. dimensionsreduzierende Verfahren, die den Merkmalsraum komprimieren, (z.b. Cluster- oder Faktorenanalyse) und hypothesentestende Verfahren, mit denen der Einfluss von unabhängigen Variablen (Einflussgrößen) auf abhängige Variable (Zielgrößen) untersucht wird (z.b. Varianz- und Regressionsanalyse). Im Rahmen der Vorlesung werden einige typische multivariate Analyseverfahren, die in den Sozialwissenschaften häufig zum Einsatz kommen, in ihren Grundzügen vorgestellt. 3
4 Varianzanalyse Mit Hilfe der Techniken der Varianzanalyse (ANOVA: analysis of variance) kann die Abhängigkeit metrischer (intervallskalierter) Zielgrößen von kategorialen (nominalskalierten) Einflussgrößen untersucht werden. Einfaktorielle Varianzanalyse Das einfachste Modell stellt die einfaktorielle (oneway) ANOVA mit festen Effekten dar, die die Abhängigkeit einer metrischen Zielgröße von den Ausprägungen einer kategorialen Einflussgröße (Faktor) untersucht. 4
5 Das Verfahren entspricht dem Vergleich der Mittelwerte der abhängigen Variablen für die Gruppen, die sich aus den Ausprägungen (Faktorstufen) der unabhängigen kategorialen Variablen ergeben (k unabhängige Stichproben). Beispiel: Bildung gleich Manipulation? Wie stark lassen sich Jugendliche durch Informationsmaterial in ihren Einstellungen beeinflussen? Fragebogen zur Ermittlung der Einstellung von Jugendlichen zur Nutzung von Atomkraft bei der Energiegewinnung 5
6 zufällige Aufteilung von n = 24 zufällig ausgewählten Jugendlichen (Stichprobe) auf k = 3 Gruppen, denen unterschiedliche Filme zur Nutzung der Atomkraft gezeigt werden: Gruppe 1 (Pro Gruppe): Film befürwortet die Nutzung der Atomkraft Gruppe 2 (Kontra Gruppe): Film demonstriert die Risiken der Nutzung der Atomkraft Gruppe 3 (Kontrollgruppe): Film demonstriert sowohl die Vor- als auch die Nachteile der Nutzung der Atomkraft Die kategoriale Einflussgröße erfasst hier also die Art des gezeigten Films. 6
7 Nachdem die Probanden den jeweiligen Film gesehen haben, erfolgt die Messung der Einstellung zur Nutzung der Atomkraft mit Hilfe des Fragebogens. Durch Zusammenfassen von Items zu einem Index (siehe später in diesem Semester) ergibt sich für jede Person ein Messwert (score). Hohe Messwerte entsprechen dabei einer Befürwortung der Nutzung der Atomkraft. Die folgende Tabelle enthält die Messwerte der n = 24 Jugendlichen: 7
8 Gr. 1: Gr. 2: Gr. 3: Fragestellung: Hat die Art des Informationsmaterials (und damit die Gruppenzugehörigkeit) Einfluss auf die Einstellung der Jugendlichen? Intuitiv ist klar, dass bei einem entsprechenden Test die Gruppenmittelwerte und damit die durchschnittliche Einstellung in den k = 3 Gruppen miteinander verglichen werden. 8
9 Mittelwert der i ten Gruppe: ȳ i = 1 n i n i Gesamtmittelwert: j=1 y ij = 1 n i (y i1 + y i y i ni ) ȳ = 1 n k n i i=1 j=1 y ij = 1 n k n i ȳ i i=1 Hängt die Einstellung der Jugendlichen nicht von der Art des gezeigten Filmes und damit von der Gruppenzugehörigkeit ab, dann werden die Gruppenmittelwerte sich kaum unterscheiden und jeweils etwa dem Gesamtmittelwert entsprechen. 9
10 Für unser Beispiel ergibt sich: ȳ 1 = 12, ȳ 2 = 6, ȳ 3 = 10 und ȳ = 9.5 Die für den Globaltest der ANOVA verwendete Stichprobenfunktion basiert auf der Streuungszerlegung (Zerlegung der Gesamtvariabilität): 10
11 k n i k k n i (y ij ȳ ) 2 = n i (ȳ i ȳ ) 2 + (y ij ȳ i ) 2 i=1 j=1 i=1 i=1 j=1 SQT = SQE + SQR sum of squares total... explained... residual Summe der gewichtete Summe der Summe der Abweichungsquadrate Abweichungsquadrate Abweichungsquadrate der y ij vom der Gruppenmittel ȳ i der y ij von den Gesamtmittel ȳ vom Gesamtmittel ȳ Gruppenmitteln ȳ i (vom Modell) Gesamtvariabilität= erklärte Variabilität + Restvariabilität 11
12 Die Gesamtvariabilität zerfällt also in die durch die Modellvorstellung unterschiedlicher Gruppenmittel erklärte Variabilität zwischen den Gruppen und die Restvariabilität innerhalb der Gruppen. Häufig wird dafür der Begriff Streuungszerlegung verwendet. Unterscheiden sich die Gruppenmittel deutlich zeigt also die kategoriale Einflussgröße eine Wirkung dann ist die Variabilität zwischen den Gruppen (die erklärte Variabilität) groß im Verhältnis zur Variabilität innerhalb der Gruppen. Für unser Beispiel ergibt sich: SQT = 330, SQE = 162 und SQR =
13 Als Testgröße (Stichprobenfunktion) verwendet man das Verhältnis der Varianz (!) zwischen den Gruppen zur Varianz (!) innerhalb der Gruppen: SQE k 1 SQR n k Daraus resultiert auch die Bezeichnung Varianzanalyse für ein Verfahren, das eigentlich Mittelwerte vergleicht. Wenn die kategoriale Einflussgröße keine Wirkung hat, nimmt die Testgröße kleine Werte an. 13
14 Die Nullhypothese, dass die kategoriale Einflussgröße keine Wirkung hat, wird man demnach ablehnen, wenn die Gruppenmittel sich stark unterscheiden und daher die Testgröße große Werte annimmt. Für unser Beispiel ergibt sich: t = SQE k 1 SQR n k = = Welche Schlussfolgerungen kann man aus diesem Wert ziehen? Dazu wird ein mathematisches Modell formuliert, um einen entsprechenden Signifikanztest begründen zu können. 14
15 F Test (oneway ANOVA) Anliegen: Parametrischer Test zur Überprüfung von Hypothesen über die Gleichheit der Erwartungswerte von k unabhängigen normalverteilten Zufallsvariablen bei unbekannten, aber gleichen Varianzen (Varianzhomogenität, s. Levene Test); Verallgemeinerung des doppelten t Tests auf k Stichproben Voraussetzungen: Die k unabhängigen mathematischen Stichproben (Y 11, Y 12,..., Y 1n1 ), (Y 21, Y 22,..., Y 2n2 ),..., (Y k1, Y k2,..., Y knk ) stammen aus normalverteilten Schichten der Grundgesamtheit mit unbekannten, aber gleichen Varianzen σ 2 (Varianzhomogenität). 15
16 Für die Stichprobenvariablen Y ij gilt demnach die folgende Darstellung (Modellannahme): Y ij = µ i + E ij i = 1,..., k, j = 1,..., n i Die Zufallsvariablen E ij sind dabei unabhängig und normalverteilt mit Mittelwert 0 und Varianz σ 2. µ i ist der Erwartungswert der Gruppe i (fester Effekt der Gruppe). Hypothesen: H 0 : µ 1 = µ 2 =... = µ k (Globalhypothese) H A : µ i µ j für mindestens ein Paar (i, j) 16
17 Testgröße: T = SQE k 1 SQR n k Unter H 0 ist die Testgröße F verteilt mit (k 1, n k) Freiheitsgraden. p Wert: p = P (T t) Entscheidungsregel: Ablehnung von H 0 falls p α. 17
18 Bemerkung: Sind Y und Z unabhängige χ 2 verteilte Zufallsvariablen mit m bzw. n Freiheitsgraden. Dann heißt die Verteilung der Zufallsvariablen Y m X = Z n F Verteilung mit (m, n) Freiheitsgraden. 18
19 Im Beispiel ist t = und p = P (T ) = Die Nullhypothese wird daher abgelehnt. Es kann also mit sehr großer Sicherheit von einer Beeinflussung der Jugendlichen durch die Filme ausgegangen werden. Hinweis: SPSS gibt im Zusammenhang mit einer ANOVA stets eine Tafel der Varianzanalyse aus, die u.a. die Streuungszerlegung und die Überschreitungswahrscheinlichkeit für den globalen F Test enthält. 19
20 Bemerkungen Grundgedanke des Verfahrens ist die Streuungszerlegung, daher auch der Name Varianzanalyse. Der doppelte t Test für 2 unabhängige Stichproben ist ein Spezialfall der einfaktoriellen ANOVA mit festen Effekten. Der Faktor (Einflussgröße) besitzt in diesem Fall nur 2 Faktorstufen. Mehrfache Paarvergleiche mit Hilfe des doppelten t Tests sind bei echten varianzanalytischen Fragestellungen nicht zu empfehlen. Wie der doppelte t Test ist auch die ANOVA relativ robust gegenüber Abweichungen von den Modellvoraussetzungen: 20
21 Für nicht zu kleine und nicht zu unterschiedliche Stichprobenumfänge in den Gruppen kann von einer F Verteilung der Teststatistik ausgegangen werden. Bei berechtigten Zweifeln an der Normalverteilungsannahme können nichtparametrische Tests zum Einsatz kommen (siehe Kruskal Wallis Test als Verallgemeinerung des Wilcoxon Rangsummen Tests). Die Varianzhomogenität kann mit dem Levene Test geprüft werden. Die Unabhängigkeit ist bei Messwiederholungen mehreren Messungen am gleichen Objekt verletzt. Dafür kommen spezielle Modelle der ANOVA zum Einsatz. 21
22 Wird die Globalhypothese Gleichheit aller Gruppenmittel abgelehnt, so ist man häufig an der Aufklärung der Struktur der vorhandenen Abhängigkeit interessiert. Bei entsprechenden Testverfahren unterscheidet man zwischen a priori und a posteriori Hypothesen und zugehörigen Tests (z.b. von Kontrasten). SPSS bietet ein breites Spektrum derartiger Tests an. 22
23 Der η Koeffizient η (sprich: eta) ist der 7. Buchstabe im griechischen Alphabet. Mit Hilfe der Streuungszerlegung SQT = SQE + SQR lässt sich ein Koeffizient zur Beschreibung der Abhängigkeit einer metrischen (mindestens intervallskalierten) Variablen von einer kategorialen (nominalskalierten) Variablen einführen. 23
24 Setzen wir η 2 = SQE SQT so erhalten wir aus der obigen Gleichung durch Division durch SQT (Gesamtvariabilität) 1 = SQE SQT } {{ } + SQR SQT } {{ } = η 2 = 1 η 2 η 2 ist damit eine Zahl zwischen 0 und 1 und stellt den Anteil der Variabilität der metrischen Variablen dar, der mit Hilfe der kategorialen (durch die Gruppenmittel) vorhergesagt werden kann. Der Koeffizient η, die Wurzel aus SQT SQE, nimmt also ebenfalls Werte zwischen 0 und 1 an. 24
25 η 2 ist ein PRE Maß (proportional reduction in error). PRE Maße beschreiben die anteilige Reduktion von Vorhersagefehlern bei der Vorhersage einer abhängigen Variablen unter Verwendung der Kenntnis der Ausprägungen einer unabhängigen Variablen gegenüber einer Vorhersage ohne Kenntnis der Ausprägungen der unabhängigen Variablen. Im Gegensatz zum Test der Globalhypothese (Signifikanz) liefert η 2 eine Information über eine Effektstärke (Relevanz; die Bedeutung des verwendeten Modells für die Vorhersage). 25
26 Im Fall η = 0, also SQE= 0, ist die Kenntnis der Ausprägungen der unabhängigen Variablen ohne Bedeutung für die Vorhersage der abhängigen Variablen, wenn zur Vorhersage Gruppenmittel (das ist das verwendete Modell, siehe unten) benutzt werden. Im Fall η = 1, also SQR= 0, ist eine perfekte (fehlerlose) Vorhersage der Ausprägungen der abhängigen Variablen bei Kenntnis der Ausprägungen der unabhängigen Variablen mit Hilfe von Gruppenmitteln möglich. 26
27 Für das Modell der einfaktoriellen ANOVA sind die Vorhersagen wie folgt zu realisieren: Wollen wir für einen zufällig auszuwählenden Merkmalsträger den Messwert vorhersagen, ohne dass wir die Gruppenzugehörigkeit (z.b. den gezeigten Film) kennen, so stellt das Gesamtmittel ȳ die optimale Prognose (warum eigentlich?) dar. Den Fehler, den man bei Anwendung dieser Regel auf die vorliegenden Daten y ij begeht, kann man durch SQT (Gesamtvariabilität) beschreiben. Kennen wir jedoch zusätzlich die Gruppenzugehörigkeit (z.b. den gezeigten Film), dann verwenden wir zur Vorhersage des Messwertes eines Probanden aus Gruppe i das Gruppenmittel ȳ i dieser i-ten Gruppe. 27
28 η 2 = SQT SQE beschreibt die anteilige Reduktion des Fehlers bei Verwendung der Vorhersage unter Kenntnis der Gruppenzugehörigkeit. η = 1 ist gleichbedeutend mit SQR = 0 und damit y ij = ȳ i, d.h. alle Ausprägungen innerhalb einer Gruppe sind gleich und können über die Gruppenzugehörigkeit perfekt vorhergesagt werden. η wird auch als Determinationskoeffizient oder Korrelationsverhältnis (correlation ratio) bezeichnet. 28
29 Im Beispiel gilt η 2 = SQE SQT = = 0.49 und damit η = Bei Kenntnis des gezeigten Films und Verwendung des Gruppenmittels zur Vorhersage reduziert sich der Vorhersagefehler gegenüber der Verwendung des Gesamtmittels um 49%. 29
Die Funktion f wird als Regressionsfunktion bezeichnet.
Regressionsanalyse Mit Hilfe der Techniken der klassischen Regressionsanalyse kann die Abhängigkeit metrischer (intervallskalierter) Zielgrößen von metrischen (intervallskalierten) Einflussgrößen untersucht
MehrEinführung in die Induktive Statistik: Varianzanalyse
Einführung in die Induktive Statistik: Varianzanalyse Jörg Drechsler LMU München Wintersemester 2011/2012 Varianzanalyse bisher: Vergleich der Erwartungswerte für zwei normalverteilte Variablen durch t-test
MehrEine Einführung in R: Varianzanalyse
Eine Einführung in R: Varianzanalyse Bernd Klaus, Verena Zuber Institut für Medizinische Informatik, Statistik und Epidemiologie (IMISE), Universität Leipzig 13. Januar 2009 Bernd Klaus, Verena Zuber Das
MehrEinfaktorielle Varianzanalyse
Kapitel 16 Einfaktorielle Varianzanalyse Im Zweistichprobenproblem vergleichen wir zwei Verfahren miteinander. Nun wollen wir mehr als zwei Verfahren betrachten, wobei wir unverbunden vorgehen. Beispiel
MehrEine Einführung in R: Varianzanalyse
Eine Einführung in R: Varianzanalyse Bernd Klaus, Verena Zuber Institut für Medizinische Informatik, Statistik und Epidemiologie (IMISE), Universität Leipzig 6. Januar 2011 Bernd Klaus, Verena Zuber Das
MehrStatistische Tests (Signifikanztests)
Statistische Tests (Signifikanztests) [testing statistical hypothesis] Prüfen und Bewerten von Hypothesen (Annahmen, Vermutungen) über die Verteilungen von Merkmalen in einer Grundgesamtheit (Population)
Mehr1 Wahrscheinlichkeitsrechnung. 2 Zufallsvariablen und ihre Verteilung. 3 Statistische Inferenz. 4 Intervallschätzung. 5 Hypothesentests.
0 Einführung 1 Wahrscheinlichkeitsrechnung 2 Zufallsvariablen und ihre Verteilung 3 Statistische Inferenz 4 Intervallschätzung 5 Hypothesentests 6 Regression Lineare Regressionsmodelle Deskriptive Statistik:
MehrEine Einführung in R: Varianzanalyse
Eine Einführung in R: Varianzanalyse Bernd Klaus, Verena Zuber Institut für Medizinische Informatik, Statistik und Epidemiologie (IMISE), Universität Leipzig 13. Dezember 2012 Bernd Klaus, Verena Zuber,
MehrMittelwertvergleiche, Teil I: Zwei Gruppen
FB W. Ludwig-Mayerhofer Statistik II Mittelwertvergleiche Herzlich willkommen zur Vorlesung Mittelwertvergleiche, Teil I: Zwei Gruppen FB W. Ludwig-Mayerhofer Statistik II Mittelwertvergleiche Mittelwertvergleiche:
MehrVarianzvergleiche bei normalverteilten Zufallsvariablen
9 Mittelwert- und Varianzvergleiche Varianzvergleiche bei zwei unabhängigen Stichproben 9.3 Varianzvergleiche bei normalverteilten Zufallsvariablen Nächste Anwendung: Vergleich der Varianzen σa 2 und σ2
MehrHypothesentests mit SPSS. Beispiel für eine einfaktorielle Varianzanalyse Daten: museum_m_v05.sav
Beispiel für eine einfaktorielle Varianzanalyse Daten: museum_m_v05.sav Hypothese: Die Beschäftigung mit Kunst ist vom Bildungsgrad abhängig. 1. Annahmen Messniveau: Modell: Die Skala zur Erfassung der
MehrMittelwertsvergleich bei mehr als 2 Stichproben
Mittelwertsvergleich bei mehr als 2 Stichproben Im Fall von 2 Gruppen kennen wir nunmehr verschiedene Varianten des t-tests für den Vergleich der Mittelwerte Liegen k > 2 Gruppen von Beobachtungen vor
MehrEinfaktorielle Varianzanalyse Vergleich mehrerer Mittelwerte
Einfaktorielle Varianzanalyse Vergleich mehrerer Mittelwerte Es wurden die anorganischen Phosphatwerte im Serum (mg/dl) eine Stunde nach einem Glukosetoleranztest bei übergewichtigen Personen mit Hyperinsulinämie,
MehrKlassifikation von Signifikanztests
Klassifikation von Signifikanztests nach Verteilungsannahmen: verteilungsabhängige = parametrische Tests verteilungsunabhängige = nichtparametrische Tests Bei parametrischen Tests werden im Modell Voraussetzungen
MehrMittelwertsvergleich bei mehr als 2 Stichproben. Marcus Hudec
Mittelwertsvergleich bei mehr als 2 Stichproben Im Fall von 2 Gruppen kennen wir nunmehr verschiedene Varianten des t-tests für den Vergleich der Mittelwerte Liegen k > 2 Gruppen von Beobachtungen vor
Mehr2.5 Lineare Regressionsmodelle
2.5.1 Wiederholung aus Statistik I Gegeben Datenpunkte (Y i, X i ) schätze die beste Gerade Y i = β 0 + β 1 X i, i = 1,..., n. 2 Induktive Statistik 409 Bsp. 2.30. [Kaffeeverkauf auf drei Flohmärkten]
MehrStatistik II. IV. Hypothesentests. Martin Huber
Statistik II IV. Hypothesentests Martin Huber 1 / 22 Übersicht Weitere Hypothesentests in der Statistik 1-Stichproben-Mittelwert-Tests 1-Stichproben-Varianz-Tests 2-Stichproben-Tests Kolmogorov-Smirnov-Test
Mehr5. Lektion: Einfache Signifikanztests
Seite 1 von 7 5. Lektion: Einfache Signifikanztests Ziel dieser Lektion: Du ordnest Deinen Fragestellungen und Hypothesen die passenden einfachen Signifikanztests zu. Inhalt: 5.1 Zwei kategoriale Variablen
MehrStatistik II für Betriebswirte Vorlesung 4
Statistik II für Betriebswirte Vorlesung 4 Dr. Andreas Wünsche TU Bergakademie Freiberg Institut für Stochastik 6. November 2017 Dr. Andreas Wünsche Statistik II für Betriebswirte Vorlesung 4 Version:
MehrStatistische Methoden in den Umweltwissenschaften
Statistische Methoden in den Umweltwissenschaften Post Hoc Tests A priori Tests (Kontraste) Nicht-parametrischer Vergleich von Mittelwerten 50 Ergebnis der ANOVA Sprossdichte der Seegräser 40 30 20 10
MehrLösung Aufgabe 1 (Regression) Es wurden in einer Befragung zwei metrische Merkmale X und Y erhoben. Betrachten Sie dazu die
Statistik für Kommunikationswissenschaftler Wintersemester 2010/2011 Vorlesung Prof. Dr. Nicole Krämer Übung Nicole Krämer, Cornelia Oberhauser, Monia Mahling Lösung Thema 9 Homepage zur Veranstaltung:
MehrVorlesung: Statistik II für Wirtschaftswissenschaft
Vorlesung: Statistik II für Wirtschaftswissenschaft Prof. Dr. Helmut Küchenhoff Institut für Statistik, LMU München Sommersemester 2017 6 Genzwertsätze Einführung 1 Wahrscheinlichkeit: Definition und Interpretation
MehrBiostatistik 7. Zweistichproben-t-Test, F-Test
Biostatistik 7. Zweistichproben-t-Test, F-Test Zweistichproben-t-Test Vergleich von zwei unabhängigen Stichproben Versuchssituation: dieselbe Variable wird bei zwei unabhängigen Stichproben geprüft Kontrollgruppe,
MehrModul G.1 WS 07/08: Statistik 31.01.2008 1
Modul G.1 WS 07/08: Statistik 31.01.2008 1 Varianzanalyse Als Varianzanalyse bezeichnet man eine große Gruppe datenanalytischer und mustererkennender statistischer Verfahren, die zahlreiche unterschiedliche
MehrVersuchsplanung. Teil 2 Varianzanalyse (ANOVA) Dr. Tobias Kiesling
Versuchsplanung Teil 2 Varianzanalyse (ANOVA) Dr. Tobias Kiesling Gliederung Grundlagen der Varianzanalyse Streuungszerlegung und Modellschätzer Modellannahmen und Transformationen
MehrEinführung in die Induktive Statistik: Regressionsanalyse
Einführung in die Induktive Statistik: Regressionsanalyse Jan Gertheiss LMU München Sommersemester 2011 Vielen Dank an Christian Heumann für das Überlassen von TEX-Code! Regressionsanalyse Ziel: Analyse
MehrMittelwertvergleiche, Teil II: Varianzanalyse
FB 1 W. Ludwig-Mayerhofer Statistik II 1 Herzlich willkommen zur Vorlesung Mittelwertvergleiche, Teil II: FB 1 W. Ludwig-Mayerhofer Statistik II 2 : Wichtigste Eigenschaften Anwendbar auch bei mehr als
MehrPrüfungsliteratur: Rudolf & Müller S
1 Beispiele zur univariaten Varianzanalyse Einfaktorielle Varianzanalyse (Wiederholung!) 3 Allgemeines lineares Modell 4 Zweifaktorielle Varianzanalyse 5 Multivariate Varianzanalyse 6 Varianzanalyse mit
MehrTEIL 13: DIE EINFACHE LINEARE REGRESSION
TEIL 13: DIE EINFACHE LINEARE REGRESSION Die einfache lineare Regression Grundlagen Die einfache lineare Regression ist ebenfalls den bivariaten Verfahren für metrische Daten zuzuordnen 1 Sie hat einen
MehrVergleich von Gruppen I
Vergleich von Gruppen I t-test und einfache Varianzanalyse (One Way ANOVA) Werner Brannath VO Biostatistik im WS 2006/2007 Inhalt Der unverbundene t-test mit homogener Varianz Beispiel Modell Teststatistik
MehrTest auf einen Anteilswert (Binomialtest) Vergleich zweier Mittelwerte (t-test)
Spezielle Tests Test auf einen Anteilswert (Binomialtest) Vergleich zweier Anteilswerte Test auf einen Mittelwert (Ein-Stichproben Gauss bzw. t-test) Vergleich zweier Mittelwerte (t-test) Test auf einen
MehrInhalt. Vorwort Univariate Verteilungen Verteilungen Die Normalverteilung... 47
Inhalt Vorwort... 9 1 Einleitung: Grundlagen der Statistik... 11 1.1 Die statistische Fragestellung im Forschungsprozess... 11 1.2 Grundbegriffe der Statistik... 13 1.3 Voraussetzung jeder Statistik: Die
MehrSozialwissenschaftlerInnen II
Statistik für SozialwissenschaftlerInnen II Henning Best best@wiso.uni-koeln.de Universität zu Köln Forschungsinstitut für Soziologie Statistik für SozialwissenschaftlerInnen II p.1 Varianzanalyse Statistik
MehrLehrinhalte Statistik (Sozialwissenschaften)
Lehrinhalte Technische Universität Dresden Institut für Mathematische Stochastik Dresden, 13. November 2007 Seit 2004 Vorlesungen durch Klaus Th. Hess und Hans Otfried Müller. Statistik I: Beschreibende
MehrKlassifikation von Signifikanztests
Klassifikation von Signifikanztests Nach Verteilungsannahmen: verteilungsabhängig: parametrischer [parametric] Test verteilungsunabhängig: nichtparametrischer [non-parametric] Test Bei parametrischen Tests
MehrSPSS IV Gruppenvergleiche (>2 Gruppen) A priori & post hoc-tests. H0: Die mittlere Anzahl der Seegräser (µ) hängt nicht von der Seeigel menge ab.
SPSS IV Gruppenvergleiche (>2 Gruppen) A priori & post hoc-tests A parametrisch -- ANOVA Beispieldatei: Seegräser_ANOVA H0: Die mittlere Anzahl der Seegräser (µ) hängt nicht von der Seeigel menge ab. µ
MehrMusterlösung. Modulklausur Multivariate Verfahren
Musterlösung Modulklausur 31821 Multivariate Verfahren 25. September 2015 Aufgabe 1 (15 Punkte) Kennzeichnen Sie die folgenden Aussagen zur Regressionsanalyse mit R für richtig oder F für falsch. F Wenn
MehrStatistische Methoden in den Umweltwissenschaften
Statistische Methoden in den Umweltwissenschaften t-test Varianzanalyse (ANOVA) Übersicht Vergleich von Mittelwerten 2 Gruppen: t-test einfaktorielle ANOVA > 2 Gruppen: einfaktorielle ANOVA Seeigel und
MehrName Vorname Matrikelnummer Unterschrift
Dr. Hans-Otfried Müller Institut für Mathematische Stochastik Fachrichtung Mathematik Technische Universität Dresden Klausur Statistik II (Sozialwissenschaft, Nach- und Wiederholer) am 26.10.2007 Gruppe
MehrBereiche der Statistik
Bereiche der Statistik Deskriptive / Exploratorische Statistik Schließende Statistik Schließende Statistik Inferenz-Statistik (analytische, schließende oder konfirmatorische Statistik) baut auf der beschreibenden
MehrParametrische vs. Non-Parametrische Testverfahren
Parametrische vs. Non-Parametrische Testverfahren Parametrische Verfahren haben die Besonderheit, dass sie auf Annahmen zur Verteilung der Messwerte in der Population beruhen: die Messwerte sollten einer
MehrKlassifikation von Signifikanztests
Klassifikation von Signifikanztests nach Verteilungsannahmen: verteilungsabhängige = parametrische Tests verteilungsunabhängige = nichtparametrische Tests Bei parametrischen Tests werden im Modell Voraussetzungen
Mehr2. Formulieren von Hypothesen. Nullhypothese: H 0 : µ = 0 Gerät exakt geeicht
43 Signifikanztests Beispiel zum Gauß-Test Bei einer Serienfertigung eines bestimmten Typs von Messgeräten werden vor der Auslieferung eines jeden Gerätes 10 Kontrollmessungen durchgeführt um festzustellen,
MehrEinführung in die Varianzanalyse mit SPSS
Einführung in die Varianzanalyse mit SPSS SPSS-Benutzertreffen am URZ Carina Ortseifen 6. Mai 00 Inhalt. Varianzanalyse. Prozedur ONEWAY. Vergleich von k Gruppen 4. Multiple Vergleiche 5. Modellvoraussetzungen
MehrStatistik II. Weitere Statistische Tests. Statistik II
Statistik II Weitere Statistische Tests Statistik II - 19.5.2006 1 Überblick Bisher wurden die Test immer anhand einer Stichprobe durchgeführt Jetzt wollen wir die statistischen Eigenschaften von zwei
MehrLösung Übungsblatt 5
Lösung Übungsblatt 5 5. Januar 05 Aufgabe. Die sogenannte Halb-Normalverteilung spielt eine wichtige Rolle bei der statistischen Analyse von Ineffizienzen von Produktionseinheiten. In Abhängigkeit von
MehrPrüfung aus Wahrscheinlichkeitstheorie und Statistik MASCHINENBAU 2003
Prüfung aus Wahrscheinlichkeitstheorie und Statistik MASCHINENBAU 2003. Eine seltene Krankheit trete mit Wahrscheinlichkeit : 0000 auf. Die bedingte Wahrscheinlichkeit, dass ein bei einem Erkrankten durchgeführter
MehrKapitel 5 - Einfaktorielle Experimente mit festen und zufälligen Effekten
Kapitel 5 - Einfaktorielle Experimente mit festen und zufälligen Effekten 5.1. Einführung Einfaktorielle Varianzanalyse Überprüft die Auswirkung einer gestuften (s), unabhängigen Variable X, auch Faktor
MehrÜBUNGSAUFGABEN ZU INFERENZSTATISTIK II
ÜBUNGSAUFGABEN ZU INFERENZSTATISTIK II 1.1 Durch welche Elemente lässt sich laut der Formel für die multiple Regression der Wert einer Person auf einer bestimmten abhängigen Variable Y vorhersagen? a)
MehrKlassifikation von Signifikanztests
Klassifikation von Signifikanztests nach Verteilungsannahmen: verteilungsabhängige = parametrische Tests verteilungsunabhängige = nichtparametrische Tests Bei parametrischen Tests werden im Modell Voraussetzungen
MehrKapitel 5 - Einfaktorielle Experimente mit festen und zufälligen Effekten
Kapitel 5 - Einfaktorielle Experimente mit festen und zufälligen Effekten 5.1. Einführung Einfaktorielle Varianzanalyse Überprüft die Auswirkung einer gestuften (s), unabhängigen Variable X, auch Faktor
MehrMathematik für Biologen
Mathematik für Biologen Prof. Dr. Rüdiger W. Braun Heinrich-Heine-Universität Düsseldorf 20. Januar 2011 1 Der F -Test zum Vergleich zweier Varianzen 2 Beispielhafte Fragestellung Bonferroni-Korrektur
Mehr6.4 Der Kruskal-Wallis Test
6.4 Der Kruskal-Wallis Test Der Test von Kruskal und Wallis, auch H-Test genannt, ist ein Test, mit dem man die Verteilungen von Teilstichproben auf Unterschiede untersuchen kann. Bei diesem Test geht
MehrVorlesung Wirtschaftsstatistik 2 (FK 040637) Multiple lineare Regression. Dipl.-Ing. Robin Ristl Wintersemester 2012/13
Vorlesung Wirtschaftsstatistik 2 (FK 040637) Multiple lineare Regression Dipl.-Ing. Robin Ristl Wintersemester 2012/13 1 Grundidee: Eine abhängige Variable soll als Linearkombination mehrerer unabhängiger
MehrWahrscheinlichkeitsrechnung und Statistik für Biologen Faktorielle Varianzanalyse
Wahrscheinlichkeitsrechnung und Statistik für Biologen Faktorielle Varianzanalyse Dirk Metzler & Martin Hutzenthaler 15. Juni 2010 Inhaltsverzeichnis 1 Die einfaktorielle Varianzanalyse und der F -Test
MehrLiegen 2 Beobachtungen an n Objekten vor, spricht man von einer gebundenen Stichprobe Typische Struktur bei "stimulus-response" Versuchen
Mittelwertsvergleich bei gebundenen Stichproben Liegen Beobachtungen an n Objekten vor, spricht man von einer gebundenen Stichprobe Typische Struktur bei "stimulus-response" Versuchen Obj.1 Obj.... Obj.n
MehrSchließende Statistik
Schließende Statistik Die schließende Statistik befasst sich mit dem Rückschluss von einer Stichprobe auf die Grundgesamtheit (Population). Die Stichprobe muss repräsentativ für die Grundgesamtheit sein.
MehrFür diese Beschreibungen sind Grundlagen der Statistik vorteilhaft. Weiterführende und verwandte
Voraussetzung und verwandte Themen Für diese Beschreibungen sind Grundlagen der Statistik vorteilhaft. Weiterführende und verwandte Themen sind: media.crgraph.de/hypothesentests.pdf media.crgraph.de/multiple_regression.pdf
MehrKategoriale und metrische Daten
Kategoriale und metrische Daten Johannes Hain Lehrstuhl für Mathematik VIII Statistik 1/14 Übersicht Abhängig von der Anzahl der Ausprägung der kategorialen Variablen unterscheidet man die folgenden Szenarien:
MehrStatistische Datenanalyse
Wolf-Michael Kahler Statistische Datenanalyse Verfahren verstehen und mit SPSS gekonnt einsetzen 6., verbesserte und erweiterte Auflage Mit 345 Abbildungen STUDIUM VIEWEG+ TEUBNER Inhaltsverzeichnis 1
MehrÜbersicht über verschiedene Signifikanztests und ihre Voraussetzungen
SPSSinteraktiv von Signifikanztests - 1 - Übersicht über verschiedene Signifikanztests und ihre Verfahren zur Überprüfung von Unterschieden in der zentralen Tendenz Unterschieden werden können Testsituationen
MehrVorlesung: Multivariate Statistik für Psychologen
Vorlesung: Multivariate Statistik für Psychologen 8. Vorlesung: 08.05.003 was man/frau schon immer wissen wollte I Interpolation und Extrapolation Schlussfolgerung auf erwarteten Wert einer Person aufgrund
MehrSkript zur Vorlesung Statistik 2
Weder die Autorin noch der Fachschaftsrat Psychologie übernimmt Irgendwelche Verantwortung für dieses Skript. Das Skript soll nicht die Lektüre der Prüfungsliteratur ersetzen. Verbesserungen und Korrekturen
MehrÜ b u n g s b l a t t 15
Einführung in die Stochastik Sommersemester 07 Dr. Walter Oevel 2. 7. 2007 Ü b u n g s b l a t t 15 Hier ist zusätzliches Übungsmaterial zur Klausurvorbereitung quer durch die Inhalte der Vorlesung. Eine
MehrMesswiederholungen und abhängige Messungen
Messwiederholungen und abhängige Messungen t Tests und Varianzanalysen für Messwiederholungen Kovarianzanalyse Thomas Schäfer SS 009 1 Messwiederholungen und abhängige Messungen Bei einer Messwiederholung
MehrSPSS III Mittelwerte vergleichen
SPSS III Mittelwerte vergleichen A Zwei Gruppen ------------ Zwei-Stichproben t-test Beispieldatei: Seegräser Fragestellung: Unterscheidet sich die Anzahl der Seegräser in Gebieten mit und ohne Seeigelvorkommen
MehrBivariate lineare Regression. Statistik für SozialwissenschaftlerInnen II p.154
Bivariate lineare Regression Statistik für SozialwissenschaftlerInnen II p.154 Grundidee und Typen der Regression Die Regressionsanalyse dient zur Quantifizierung des Zusammenhangs und der statistisch
MehrAnalyse von Kontingenztafeln
Analyse von Kontingenztafeln Mit Hilfe von Kontingenztafeln (Kreuztabellen) kann die Abhängigkeit bzw. die Inhomogenität der Verteilungen kategorialer Merkmale beschrieben, analysiert und getestet werden.
MehrVergleich von Parametern zweier Stichproben
Vergleich von Parametern zweier Stichproben Vergleich von Mittelwerten bei gebundenen Stichproben Vergleich von Mittelwerten bei unabhängigen Stichproben Vergleich von Varianzen bei unabhängigen Stichproben
MehrHerzlich willkommen zum Thema SPSS
Herzlich willkommen zum Thema SPSS (SUPERIOR PERFORMING SOFTWARE SYSTEM) Qualitative und quantitative Forschungsmethoden Qualitative Methoden: Qualitative Verfahren werden oft benutzt, wenn der Forschungsgegenstand
MehrStatistik II (Sozialwissenschaften)
Dr. Hans-Otfried Müller Institut für Mathematische Stochastik Fachrichtung Mathematik Technische Universität Dresden http://www.math.tu-dresden.de/sto/mueller/ Statistik II (Sozialwissenschaften) 2. Konsultationsübung,
MehrMultivariate lineare Regression. Statistik für SozialwissenschaftlerInnen II p.167
Multivariate lineare Regression Statistik für SozialwissenschaftlerInnen II p.167 Multivariate Regression Verfahren zur Prüfung des gemeinsamen linearen Einflusses mehrerer unabhängiger Variablen auf eine
MehrTEIL 13: DIE LINEARE REGRESSION
TEIL 13: DIE LINEARE REGRESSION Dozent: Dawid Bekalarczyk GLIEDERUNG Dozent: Dawid Bekalarczyk Lineare Regression Grundlagen Prognosen / Schätzungen Verbindung zwischen Prognose und Zusammenhang zwischen
MehrHerzlich willkommen zur Vorlesung Statistik
FB 1 W. Ludwig-Mayerhofer Statistik 1 Herzlich willkommen zur Vorlesung Statistik Zusammenhänge zwischen nominalen (und/oder ordinalen) Merkmalen: analyse und II: Signifikanztests und Maße der Assoziation
MehrOnline Statistik-Coaching
Online Statistik-Coaching Modul 3 Statistisches Testen - Auswahl der passenden Methode - Durchführung mit SPSS - Interpretation und Darstellung Dipl.-Math. Daniela Keller www.statistik-und-beratung.de
Mehr12 Rangtests zum Vergleich zentraler Tendenzen
12 Rangtests zum Vergleich zentraler Tendenzen 12.1 Allgemeine Bemerkungen 12.2 Gepaarte Stichproben: Der Wilcoxon Vorzeichen- Rangtest 12.3 Unabhängige Stichproben: Der Wilcoxon Rangsummentest und der
MehrFH- Management & IT. Constantin von Craushaar FH-Management & IT Statistik Angewandte Statistik (Übungen)
FH- Management & IT Folie 1 Rückblick Häufigkeiten berechnen Mittelwerte berechnen Grafiken ausgeben Grafiken anpassen und als Vorlage abspeichern Variablenoperationen Fälle vergleichen Fälle auswählen
MehrStatistisches Testen
Statistisches Testen Grundlegendes Prinzip Erwartungswert Bekannte Varianz Unbekannte Varianz Differenzen Anteilswert Chi-Quadrat Tests Gleichheit von Varianzen Prinzip des Statistischen Tests Konfidenzintervall
MehrErmitteln Sie auf 2 Dezimalstellen genau die folgenden Kenngrößen der bivariaten Verteilung der Merkmale Weite und Zeit:
1. Welche der folgenden Kenngrößen, Statistiken bzw. Grafiken sind zur Beschreibung der Werteverteilung des Merkmals Konfessionszugehörigkeit sinnvoll einsetzbar? A. Der Modalwert. B. Der Median. C. Das
MehrBiostatistik. 4y Springer. Wolfgang Köhler Gabriel Schachtel Peter Voleske. Vierte, aktualisierte und erweiterte Auflage
Wolfgang Köhler Gabriel Schachtel Peter Voleske Biostatistik Vierte, aktualisierte und erweiterte Auflage Mit 65 Abbildungen und 50 Tabellen 4y Springer Einleitung 1 Kapitel I: Merkmalsauswahl 5 1 Wahl
MehrStatistik II: Signifikanztests /1
Medien Institut : Signifikanztests /1 Dr. Andreas Vlašić Medien Institut (0621) 52 67 44 vlasic@medien-institut.de Gliederung 1. Noch einmal: Grundlagen des Signifikanztests 2. Der chi 2 -Test 3. Der t-test
MehrProbeklausur zur Vorlesung Statistik II für Studierende der Soziologie und Nebenfachstudierende
Probeklausur zur Vorlesung Statistik II für Studierende der Soziologie und Nebenfachstudierende im Sommersemester 2012 Prof. Dr. H. Küchenhoff, J. Brandt, G. Schollmeyer, G. Walter Aufgabe 1 Betrachten
MehrKapitel 5: Einfaktorielle Varianzanalyse
Kapitel 5: Einfaktorielle Varianzanalyse Durchführung einer einfaktoriellen Varianzanalyse ohne Messwiederholung 1 Berechnung der Effektstärke und der beobachteten Teststärke einer einfaktoriellen Varianzanalyse
MehrWeitere (wählbare) Kontraste in der SPSS Prozedur Allgemeines Lineares Modell
Einfaktorielle Versuchspläne 27/40 Weitere (wählbare) Kontraste in der SPSS Prozedur Allgemeines Lineares Modell Abweichung Einfach Differenz Helmert Wiederholt Vergleich Jede Gruppe mit Gesamtmittelwert
MehrKapitel 8: Verfahren für Rangdaten
Kapitel 8: Verfahren für Rangdaten Der Mann-Whitney U-Test 1 Der Wilcoxon-Test 3 Der Kruskal-Wallis H-Test 4 Vergleich von Mann-Whitney U-Test und Kruskal-Wallis H-Test 6 Der Mann-Whitney U-Test In Kapitel
MehrValidierung von Messmethoden. Validierung von Messmethoden
Validierung von Messmethoden Was soll eine gute Messmethode erfüllen? 1. Richtigkeit (accucacy) 2. Genauigkeit (precision) PD Dr. Sven Reese, LMU München 1 Richtigkeit (accuracy) Gibt Auskunft darüber,
MehrWillkommen zur Vorlesung Statistik (Master)
Willkommen zur Vorlesung Statistik (Master) Thema dieser Vorlesung: Mittelwertvergleiche Prof. Dr. Wolfgang Ludwig-Mayerhofer Universität Siegen Philosophische Fakultät, Seminar für Sozialwissenschaften
Mehr1 Übungsaufgaben zur Regressionsanalyse
1 Übungsaufgaben zur Regressionsanalyse 1 1 Übungsaufgaben zur Regressionsanalyse 1.1 Übungsaufgaben zu Seite 1 und 2 1. Wie lautet die Regressionsfunktion? 2. Welche Absatzmenge ist im Durchschnitt bei
MehrStatistik. Jan Müller
Statistik Jan Müller Skalenniveau Nominalskala: Diese Skala basiert auf einem Satz von qualitativen Attributen. Es existiert kein Kriterium, nach dem die Punkte einer nominal skalierten Variablen anzuordnen
MehrEinleitung. Statistik. Bsp: Ertrag Weizen. 6.1 Einfache Varianzanalyse
Einleitung Statistik Institut für angewandte Statistik & EDV Universität für Bodenkultur Wien Der Begriff Varianzanalyse (analysis of variance, ANOVA) taucht an vielen Stellen in der Statistik mit unterschiedlichen
Mehr3.Wiederholung: Toleranzbereiche Für EX Geg:
3.Wiederholung: Toleranzbereiche Für EX Geg: Vl. 24.2.2017 Schätzfunktion für Güte: Ist X Problem: Feb 17 13:21 > Wir berechnen Bereiche (Toleranzbereiche) für sind untere und obere Grenzen, berechnet
MehrANalysis Of VAriance (ANOVA) 1/2
ANalysis Of VAriance (ANOVA) 1/2 Markus Kalisch 16.10.2014 1 ANOVA - Idee ANOVA 1: Zwei Medikamente zur Blutdrucksenkung und Placebo (Faktor). Gibt es einen sign. Unterschied in der Wirkung (kontinuierlich)?
MehrSTATISTISCHE MUSTERANALYSE - DARSTELLUNGSVORSCHLAG
STATISTISCHE MUSTERANALYSE - DARSTELLUNGSVORSCHLAG Statistische Methoden In der vorliegenden fiktiven Musterstudie wurden X Patienten mit XY Syndrom (im folgenden: Gruppe XY) mit Y Patienten eines unauffälligem
MehrEinfache Varianzanalyse für unabhängige Stichproben
Einfache Varianzanalyse für unabhängige Stichproben VARIANZANALYSE Die Varianzanalyse ist das dem t-test entsprechende Mittel zum Vergleich mehrerer (k 2) Stichprobenmittelwerte. Sie wird hier mit VA abgekürzt,
Mehr