Einführung in die Grundlagen der explorativen Pfadanalyse

Größe: px
Ab Seite anzeigen:

Download "Einführung in die Grundlagen der explorativen Pfadanalyse"

Transkript

1 Dr. Wolfgang Langer - Integrierte Veranstaltung Methoden IV WS2002/ Einführung in die Grundlagen der explorativen Pfadanalyse Wenden wir uns zunächst dem Wrightschen Pfadfinderspiel zu. Ausgangspunkt: Pfaddiagramm (Asher 983, S. 35) Abbildung: Hypothetisches Pfadmodell nach Asher Ziel des Spiels: Aufgabe: Trenne die kausalen Effekte einer exogenen Variablen (X) auf eine endogene Variable (Y) von ihren Scheineffekten. Gehe auf so vielen Streckenzügen (Pfaden) wie möglich von X nach Y! Herbert B. Asher (983): Causal modeling. Newburg Park, Ca: SAGE (Quantitative Applications in the Social Sciences, Vol. 3)

2 Dr. Wolfgang Langer - Integrierte Veranstaltung Methoden IV WS2002/ Beachte hierbei folgende Spielregeln: (Wright 934). Beim Abgehen eines Streckenzuges (Pfades) darf jede Variable nur einmal passiert werden. No path may pass through the same variable more than once. 2. Laufe niemals rückwärts (entgegen der Pfeilrichtung) auf einer Strecke, wenn Du bereits zuvor auf einer anderen Strecke vorwärts (mit der Pfeilrichtung) gegangen bist. ( Never return to the same arrow! oder nur zu Beginn darfst Du einmal rückwärts laufen) No path may go backward on (against the direction of) an arrow after the path has gone forward on a different arrow. 3. Auf deinem Weg (Pfad) darfst Du Korrelationen (Doppelpfeile) nur in eine Richtung durchlaufen (Einbahnstraßenregelung). No path may pass through a double-headed curved arrow (representing an unanalyzed correlation between exogenous variables) more than once in any single Path. Wer ist der Sieger des Pfadfinderspiel? Derjenige, der. ein möglichst sparsames Pfaddiagramm/-modell entwickelt hat und 2. unter Beachtung der Spielregeln möglichst wenige Scheineffekte im Pfadmodell identifiziert hat.

3 Dr. Wolfgang Langer - Integrierte Veranstaltung Methoden IV WS2002/ Explorative Pfadanalyse: Ziele des Analyseverfahrens:. Entwicklung / Test von differenzierten Kausalmodellen für hierarchisch gegliederte Hypothesensets. Der Test zielt auf die Falsifikation restriktiver e. 2. Trennung von kausalen und nichtkausalen Effekten in einem Pfadmodell. Annahme: Alle Indikatoren weisen keine Messfehler auf. (jeder Indikator bildet sein Konstrukt / seinen theoretischen Begriff vollständig ab!) Graphische Darstellung des Pfadmodells als Graphendiagramm: Konvention: X : Y : X Y: Unabhängige, exogene Variable Abhängige, endogene Variable Ein gerichteter Pfeil symbolisiert eine asymmetrische Kausalbeziehung: X bedingt / bewirkt Y X ÛY:Eine gekrümmte Linie mit Pfeilen an ihren Enden entspricht der ungerichtete Korrelation: X korreliert mit Y X Y Zwei entgegengesetzt gerichtete Pfeile symbolisieren eine Rückkoppelung bei nonrekursiven, interdependenten en X Z Y: Bei Z handelt es sich zwar um eine abhängige Variable. Da sie aber durch X erklärt wird, fungiert sie als intervenierende Variable zwischen X und Y. Über sie werden indirekte Beziehungen vermittelt.

4 Dr. Wolfgang Langer - Integrierte Veranstaltung Methoden IV WS2002/ Theoreme der explorativen Pfadanalyse nach Wright (92): Bei den Pfadkoeffizienten P YX handelt es sich um den standardisierten partiellen Regressionskoeffizienten ß yx. Sie können ihn über die ihm zugrunde liegenden bivariaten Korrelationen berechnen oder mit Hilfe von SPSSfWin im Regressionsmodell schätzen. Sind die unabhängigen Variablen nicht korreliert oder gibt es nur ein einziges exogenes Merkmal, so können Sie die bivariaten Korrelationen direkt verwenden 2. Jede beobachtete Korrelation zwischen X und X n läßt sich zerlegen in die Summen der direkten kausalen Effekte, der indirekten kausalen Effekte, der indirekt korrelierten Effekte und der Effekte von Drittvariablen. 3. Indirekte kausale Effekte, indirekt korrelierte Effekte und die Effekte von Drittvariablen werden durch Multiplikation der zu gehörigen Pfadkoeffizienten (Korrelationen, standardisierte Regressionskoeffizienten) berechnet. 4. Der kausale Gesamteffekt ( total effect ) eines exogenen Merkmals ergibt sich aus der Summe seiner direkten und indirekten kausalen Effekte. 5. Nichtkausale "Effekte" setzen sich aus der Summe der indirekt korrelierten Effekte und der Drittvariableneffekten zusammen. 6. Die Varianz jedes endogenen Merkmals läßt sich zerlegen in diejenige, die durch die vorgelagerten exogenen Merkmale "erklärt" ("gebunden") wird, und diejenige, die durch sie nicht erklärt wird. 7. Der zu Y gehörende Residualpfad e bildet den Einfluß modellexterner unabhängiger Variablen ab. Daher ist das formal geschlossen, d.h., vollständig determiniert.. Seine Stärke entspricht der Quadratwurzel des zu Y gehörenden Alienationskoeffizienten, d.h. der Wurzel aus dem Anteil der Varianz von Y, die durch die vorgeschalteten exogenen Merkmale nicht erklärt wird. 8. Die Residualpfade verschiedener endogener Merkmale korrelieren weder untereinander noch mit den exogenen Merkmalen. Nur aufgrund dieser Bedingung können die Pfadkoeffizienten mit Hilfe der Kleinste-Quadrate-Schätzung durch getrennte Regressionsmodelle ermittelt werden.

5 Dr. Wolfgang Langer - Integrierte Veranstaltung Methoden IV WS2002/ Die Anwendung der explorativen Pfadanalyse nach Wright Anhand der Daten des General Social Surey 978" haben Bohrnstedt&Knoke den Alkoholkonsum der amerikanischen Bevölkerung untersucht. Die Autoren stellen hierbei einen Zusammenhang zwischen den folgenden vier Variablen her: P Y2X r XX2 ALTER: X P YX e e2 HÄUFIGKEIT KNEIPENBE- SUCH: Y P Y2Y ALKOHOL- KONSUMS: Y2 BILDUNG in Schuljahren: X2 P YX2 P Y2X2 Abbildung2: Saturiertes Pfadmodell zur Erklärung des Alkoholkonsums - Alter (Age in years): Alter in Jahren (X ) - Bildung (Education in years): Bildungsabschluß gemessen in Schuljahren (X 2 ) - Häufigkeit des Kneipenbesuchs (Frequenting Bars): How often do you go to a bar or tavern? (Y ) - Alkoholmenge (Drinking): Do you ever have occasion to use any alcoholic beverages, such as liquer, wine, or beer, or are you total abstainer) Do you sometimes drink more than you think you should? (Y 2 ) Zur Vorhersage des Trinkverhaltens haben sie das folgende Kausal- / Pfadmodell entwickelt, das die einzelnen Pfadbezeichnungen bereits enthält. Der erste Index des Pfadkoeffizienten P bezeichnet den Zielpunkt des Pfades (Spitze), während der zweite Index den Ausgangs- oder Startpunkt festlegt. Für die Schätzung der Pfadkoeffizienten benötigen wir die folgende Korrelationsmatrix, die auf 52 befragten Personen basiert: X2 X Y Y2 BILDUNG (X2),0000 ALTER (X) -,300,0000 KNEIPE (Y),450 -,3400,0000 TRINKEN (Y2),2480 -,2830,5360,0000

6 Dr. Wolfgang Langer - Integrierte Veranstaltung Methoden IV WS2002/ Mit Hilfe von SPSSfWin können wir die partiellen standardisierten Regressionskoeffizienten schätzen, die den Pfadkoeffizienten P entsprechen. Hierzu müssen wir zunächst die Korrelationsmatrix mit Hilfe des MATRIX DATA-Befehls einlesen, wobei wir zusätzlich die Mittelwerte und Standardabweichungen unserer Indikatoren anzugeben haben. Da es sich bei der Korrelationsmatrix um die Kovarianzmatrix der Z-standardisierten Variablen handelt, tragen wir für die Mittelwerte und Standardabweichungen jeweils eine Null bzw. eine Eins ein. Mit der Option /FILE=INLINE geben wir an, dass wir die Korrelationsmatrix direkt in der Befehlsdatei zwischen einen BEGIN DATA und END DATA-Befehl einlesen. Mit der Angabe /FOR- MAT=FREE LOWER DIAGONAL vereinbaren wir, eine untere Dreiecksmatrix im freien Format einzulesen. Mit der Option /CONTENTS=CORR MEAN SD spezifizieren wir den einzulesenden Inhalt. In unserem Fall handelt es sich um die Korrelationsmatrix und die Vektoren der Mittelwerte und Standardabweichungen. Abschließend legen wir mit der Option /N=52" die Anzahl der Beobachtungen fest, auf denen die berechnete Korrelationsmatrix beruht. TITLE 'Meth.IV: Explorative Pfadanalyse'. SUBTITLE 'Einfaches PFADMODELL: Bohrnstedt/Knoke 982, S.48'. SET DECIMALS=DOT. MATRIX DATA VARIABLES=BILDUNG ALTER KNEIPE TRINKEN /FILE=INLINE /FORMAT=FREE LOWER DIAGONAL /CONTENTS=CORR MEAN SD /N=52. BEGIN DATA END DATA. VARIABLE LABELS BILDUNG 'Anzahl der Schuljahre'/ ALTER 'Alter in Jahren'/ KNEIPE 'Häufigkeit des Kneipenbesuchs'/ TRINKEN 'Ausmaß des Alkoholkonsums'. * Schätzung der Strukturgleichung. REGRESSION MATRIX=IN(*) /DEPENDENT=KNEIPE /METHOD=ENTER ALTER BILDUNG. Beim Regressionsbefehl geben wir mit Hilfe der Option MATRIX=IN(*) an, dass unser Regressionsmodell auf der Grundlage einer von uns in der Befehlsdatei eingelesenen Korrelationsmatrix geschätzt werden soll.

7 Dr. Wolfgang Langer - Integrierte Veranstaltung Methoden IV WS2002/ Für unser saturiertes Pfadmodell, in dem alle exogenen Variablen auf das intervenierende und endogene Merkmale gleichzeitig wirken, erhalten wir das folgende SPSSfWin-Ausgabeprotokoll: Vorhersage der Häufigkeit des Kneipenbesuches durch das Lebensalter und den Bildungsabschluß: Aufgenommene/Entfernte Variablen b Aufgenomme Entfernte ne Variablen Variablen Methode Anzahl der Schuljahre, Alter in Jahren a, Eingeben a. Alle gewünschten Variablen wurden aufgenommen. b. Abhängige Variable: Häufigkeit des Kneipenbesuchs zusammenfassung Standardf Korrigiertes ehler des R R-Quadrat R-Quadrat Schätzers,343 a,7,6,9402 a. Einflußvariablen : (Konstante), Anzahl der Schuljahre, Alter in Jahren Regression Residuen Gesamt ANOVA b Quadrats Mittel der umme df Quadrate F Signifikanz 78, ,75 00,896,000 a 34,65 58, , a. Einflußvariablen : (Konstante), Anzahl der Schuljahre, Alter in Jahren b. Abhängige Variable: Häufigkeit des Kneipenbesuchs

8 Dr. Wolfgang Langer - Integrierte Veranstaltung Methoden IV WS2002/ (Konstante) Alter in Jahren Anzahl der Schuljahre Koeffizienten a Nicht standardisierte Koeffizienten a. Abhängige Variable: Häufigkeit des Kneipenbesuchs Standardi sierte Koeffizien ten Standardf B ehler Beta T Signifikanz,000,024,000,000 -,326,025 -,326-2,870,000,044,025,044,727,084 Auf der Grundlage von Alter und Bildung erklären wir lediglich,7% der Varianz der Besuchshäufigkeit der Kneipe. Wie dem F-Wert von 00,90 bei 2 bzw. 58 Freiheitsgraden zu entnehmen ist, gilt dieser Erklärungsbeitrag ebenfalls für die Grundgesamtheit der amerikanischen Wohnbevölkerung im Jahre 978. Die nichtstandardisierten partiellen Regressionskoeffizienten entsprechen exakt den standardisierten, da die Schätzung auf der Basis z-standardisierter Variablen erfolgt ist. Mit zunehmenden Alter sinkt im signifikanten Maße die Häufigkeit des Kneipenbesuches, wie der standardisierte Regressionskoeffizient von rd. -0,33 belegt. Hingegen übt der Bildungsabschluß des Befragten keinen nennenswerten Einfluß auf die Besuchshäufigkeit aus, wie der standardisierte Steigungskoeffizient von +0,044 zeigt. Er unterschreitet deutlich die.0 - Grenze für die sinnvolle Interpretation standardisierter Koeffizienten. Vorhersage des Alkoholkonsums auf der Grundlage des Kneipenbesuchs, des Alters und der Bildung Zur Vorhersage des Trinkverhaltens benötigen wir den folgenden SPSSfWin-Befehl: * Schätzung der Strukturgleichung 2a. REGRESSION MATRIX=IN(*) /DEPENDENT=TRINKEN /METHOD=ENTER KNEIPE ALTER BILDUNG. Wir erhalten das folgende Ausgabeprotokoll:

9 Dr. Wolfgang Langer - Integrierte Veranstaltung Methoden IV WS2002/ Aufgenommene/Entfernte Variablen b Aufgenomme ne Variablen Anzahl der Schuljahre, Häufigkeit des Kneipenbesu chs, Alter in Jahren a Entfernte Variablen Methode, Eingeben a. Alle gewünschten Variablen wurden aufgenommen. b. Abhängige Variable: Ausmaß des Alkoholkonsums zusammenfassung Standardf Korrigiertes ehler des R R-Quadrat R-Quadrat Schätzers,566 a,32,39, a. Einflußvariablen : (Konstante), Anzahl der Schuljahre, Häufigkeit des Kneipenbesuchs, Alter in Jahren ANOVA b Quadrats umme df Mittel der Quadrate F Signifikanz Regression 487, , ,707,000 a Residuen 032,563 57,68 Gesamt 520, a. Einflußvariablen : (Konstante), Anzahl der Schuljahre, Häufigkeit des Kneipenbesuchs, Alter in Jahren b. Abhängige Variable: Ausmaß des Alkoholkonsums (Konstante) Häufigkeit des Kneipenbesuchs Alter in Jahren Anzahl der Schuljahre Koeffizienten a Nicht standardisierte Koeffizienten a. Abhängige Variable: Ausmaß des Alkoholkonsums Standardi sierte Koeffizien ten Standardf B ehler Beta T Signifikanz,000,02,000,000,490,023,490 2,767,000 -,068,023 -,068-2,90,004,56,022,56 6,994,000

10 Dr. Wolfgang Langer - Integrierte Veranstaltung Methoden IV WS2002/ Mit Hilfe der von uns verwendeten exogenen Merkmale erklären wir rd. 3,8% der Varianz der getrunkenen Alkoholmenge. Dieser Erklärungsbeitrag gilt ebenfalls für die Grundgesamtheit, wie dem F-Wert von 238,7 bei 3 respektive 57 Freiheitsgraden zu entnehmen ist. Den stärksten Einfluß übt die Häufigkeit des Kneipenbesuchs aus, deren standardisierter Regressionskoeffizient +0,49 beträgt. Mit deutlichem Abstand folgt der Bildungsabschluß mit +0,56 und das Lebensalter mit -0,068. Alle drei Steigungskoeffizienten sind signifikant von Null verschieden, wie ihre T-Tests zeigen. Mit Hilfe der geschätzten Pfadkoeffizienten zerlegen wir nun die beobachteten Korrelation in ihre kausalen und nichtkausalen Bestandteile. Den Ausgangspunkt dieser Korrelationszerlegung bildet das folgende Pfadmodelle, das die geschätzten Pfadkoeffizienten und die Interkorrelation der exogenen Merkmale enthält. Abbildung3: Vollständiges, saturiertes zur Erklärung des Trinkverhaltens. USA 978. (N = 52) Die Koeffizienten der zur Häufigkeit des Kneipenbesuchs und der Menge des Alkoholkonsums gehörenden Residualpfade berechnen wir folgendermaßen: Berechnung der Residualpfade: P FE R Y 2 0,64 0,8836 0,940 P DE2 R Y2 2 0,394 0,6805 0,825

11 Dr. Wolfgang Langer - Integrierte Veranstaltung Methoden IV WS2002/ Zugehörige Strukturgleichungen: Y P Y X X P Y X 2 X 2 P Y E E Y 2 P Y2 Y Y P Y2 X X P Y2 X 2 X 2 P Y2 E 2 E 2 Zugehörige Zerlegungsgleichungen: r X Y P Y X r X X 2 P Y X 2 r X2 Y P Y X 2 r X X 2 P Y X r Y Y 2 P Y2 Y P Y2 X P Y X P Y2 X 2 P Y X 2 P Y X r X X 2 P Y2 X 2 P Y X 2 r X X 2 P Y2 X r Y2 X 2 P Y2 X 2 P Y X 2 P Y2 Y r X X 2 P Y2 X r X X 2 P Y X P Y2 Y r Y2 X P Y2 X P Y X P Y2 Y r X X 2 P Y2 X 2 r X X 2 P Y X 2 P Y2 Y Die beobachtete Korrelation zwischen dem Lebensalter und der Häufigkeit des Kneipenbesuchs pro Woche zerlegen wir in den direkten kausalen Pfad vom Alter zum Kneipenbesuch (fett gezeichnet) und dem indirekt korrelierten (Schein-) Effekt, der über die Interkorrelation vom Alter und der Bildung in Schuljahren ermittelt wird. Dieser Scheineffekt ergibt sich aus der Multiplikation der Korrelation r XX2 mit dem direkten Effekt der Bildung auf die Häufigkeit des Kneipenbesuchs P YX2 (gestrichelt gezeichnet). Abbildung4: Zerlegung der beobachteten Korrelation zwischen Alter und der Häufigkeit des Kneipenbesuchs

12 Dr. Wolfgang Langer - Integrierte Veranstaltung Methoden IV WS2002/ Zerlegung der beobachteten Korrelation zwischen Alter und Kneipenbesuch r Y X P Y X r X X 2 P Y X 2 0,340 0,326 ( 0,300,044) 0,326 0,04 0,340 Die Korrelation zwischen der Bildung und der Häufigkeit des Kneipenbesuchs können wir analog zu derjenigen des Alters zerlegen. Sie beinhaltet den direkten kausalen Pfad P YX2 (fett) und den über die Interkorrelation mit Alter konstituierten Scheineffekt r XX2 * P YX (gestrichelt). Abbildung5: Zerlegung der beobachteten Korrelation zwischen Bildung und der Häufigkeit des Kneipenbesuchs Zerlegung der beobachteten Korrelation zwischen Bildung und Kneipenbesuch: r Y X 2 P Y X 2 r X X 2 P Y X 0,45 0,044 ( 0,30 0,326) 0,044 0,0 0,45 Die beobachtete Korrelation zwischen der Menge des Alkoholkonsums und der Häufigkeit des Kneipenbesuchs zerlegen wir in den direkten kausalen Effekt P Y2Y und der Summe zweier Drittvariableneffekte. Letztere entstehen immer dann, wenn ein exogenes Merkmale sowohl der intervenierenden als auch der endogenen Variablen kausal vorgelagert ist und es gleichzeitig auf beide Variablen wirkt. In unserem Fall wirken das Lebensalter und die Bildung gleichzeitig auf die Häufigkeit des Kneipenbesuchs und die Menge des Alkoholkonsums. Durch die Multiplikation der zugehörigen Pfadkoeffizienten P YX*P Y2X bzw. P YX2*P Y2X2 erhalten wir jeweils den zugehörigen Drittvariableneffekt. Sie werden im folgenden Pfaddiagramm gestrichelt dargestellt. Darüber hinaus liegen noch zwei korrelative Scheineffekte vor, die sich aus Interkorrelation von Alter und Bildung ergeben. Hierfür müssen wir folgende Pfadstrecken ablaufen

13 Dr. Wolfgang Langer - Integrierte Veranstaltung Methoden IV WS2002/ und die zugehörigen Scheineffekte durch die Multiplikation der Pfadkoeffizienten und der Korrelation r XX2 bilden: ) P YX * r XX2 * P Y2X2 und 2) P YX2 * r XX2 * P Y2X Abbildung6: Zerlegung der beobachteten Korrelation zwischen der Menge des Alkoholkonsums und der Häufigkeit des Kneipenbesuchs Zerlegung der beobachteten Korrelation zwischen Kneipenbesuch und der Menge des Alkoholkonsums r Y Y 2 direkter Kausaleffekt P Y2 Y 0,490 Drittvariableneffekte P Y2 X P Y X 0,068 0,326 0,022 P Y2 X P 2 Y X 0,560,044 0,007 2 Korrelative Effekte P Y X r X X P 2 Y2 X 0,326 0,300,56 0,06 2 P Y X r 2 X X P 2 Y2 X 0,044 0,30 0,068 0,00 0,536 0,490 0,022 0,007 0,06 0,00 0,536 Die Zerlegung der beobachteten Korrelation zwischen dem Lebensalter und der konsumierten Alkoholmenge erweist sich als deutlich komplizierter. Die zugehörigen kausalen Effekte beinhalten den direkten Effekt P DA und einen indirekten über die Häufigkeit des Kneipenbesuchs vermittelten Effekt P YX*P Y2Y. Beide Effekte werden in der folgenden Abbildung 7 als fette Pfeile gezeichnet.

14 Dr. Wolfgang Langer - Integrierte Veranstaltung Methoden IV WS2002/ Abbildung7: Zerlegung der beobachteten Korrelation zwischen der Menge des Alkoholkonsums und dem Lebensalter Bei den korrelierten indirekten (Schein-)Effekten, die über die Interkorrelation mit der Bildung vermittelt werden, müssen wir zwei Wegstrecken unterscheiden. Den direkten Pfad von der Bildung auf den Alkoholkonsum ( r XX2 *P Y2X2 ) und den indirekten Pfad über die Häufigkeit des Kneipenbesuchs auf die Menge des Alkoholkonsums ( r XX2 *P YX2 *P Y2Y ). Zerlegung der beobachteten Korrelation zwischen Menge des Alkoholkonsums und dem Lebensalter direkter Kausaleffekt P Y2 X 0,068 r Y2 X indirekte Kausaleffekt P Y X P Y2 Y 0,3260,490 0,60 Korrelative Effekte r X X 2 P Y2 X 2 0,300,56 0,048 0,283 0,068 0,60 0,048 0,007 0,283 r X X 2 P Y X 2 P Y2 Y 0,300,0440,490 0,007 Bei der Zerlegung der beobachteten Korrelation zwischen der Bildung und der konsumierten Alkoholmenge erhalten wir den direkten kausalen Effekte P Y2X2, den indirekten Kausaleffekt P YX2 *P Y2Y sowie die korrelativen Scheineffekte r XX2* P YX und r XX2 *P YX *P Y2Y. Im folgenden Pfaddiagramm werden die kausalen Pfade fett und die Scheineffekte gestrichelt dargestellt.

15 Dr. Wolfgang Langer - Integrierte Veranstaltung Methoden IV WS2002/ Abbildung8: Zerlegung der beobachteten Korrelation zwischen Bildung und der konsumierten Alkoholmenge Zerlegung der beobachteten Korrelation zwischen der Menge des Alkoholkonsums und der Bildung direkter Kausaleffekt P Y2 X 2 0,56 r Y2 X 2 indirekte Kausaleffekt P Y X 2 P Y2 Y Korrelative Effekte r X X 2 P Y2 X 0,0440,490 0,022 0,30 0,068 0,02 0,248 0,56 0,022 0,02 0,050 0,248 r X X 2 P Y X P Y2 Y 0,30 0,3260,490 0,050 Oftmals benötigen wir nur eine summarische Betrachtung der Scheineffekte. Hierfür ist es nicht erforderlich alle Drittvariablen- und korrelativen Effekte einzeln zu identifizieren. Mit Hilfe des Wright-Theorems können wir die Größe des Scheineffekts berechnen, indem wir von der beobachteten Korrelation die Summen der direkten und indirekten Kausaleffekt abziehen. In unserem Beispiel führen wir diese summarische Zerlegung der beobachten Korrelation zwischen der Menge des konsumierten Alkohols und dem Lebensalter bzw. der Bildung durch. Hierbei zeigt sich, dass die Summe der kausalen Effekte jeweils fast dreimal so stark ist wie diejenige der Scheineffekt. Dies gilt gleichermaßen für die beiden betrachteten exogenen Merkmale.

16 Dr. Wolfgang Langer - Integrierte Veranstaltung Methoden IV WS2002/ Tab.: Summarische Bestimmung der nichtkausalen Effekte im vollständigen Pfadmodell exogene Merkmale Bivariate Korrelation mit Drinking (Y 2 ) direkter kausaler Effekt auf Drinking (Y 2 ) indirekter kausaler Effekt über Frequenting Kausaler Gesamteffekt: Total Nichtkausaler Effekt: Beobachtetes r - Kausaler Gesamteffekt ALTER (X ) BILDUNG (X 2 ) - 0,283-0,068-0,326*0,490 = - 0,5 +0,248 +0,56 +0,044*0,490 = +0,022-0,28-0, ,78 +0,070 Restringiertes Pfadmodelle Oftmals identifizieren Theorien mittlerer Reichweite zentrale intervenierende Variablen, über welche die Effekte der exogenen Merkmale vermittelt werden. In unserem Beispiel vertritt beispielsweise ein skandinavischer Forscher die Hypothese, daß nur die Kneipenkultur zum Alkoholmißbrauch führe. Direkte Effekte des Alters oder der Bildung erwarte er nicht. Daher nimmt er a priori an, dass die zum Alter und der Bildung gehörenden Pfadkoeffizienten P Y2X und P Y2X2 Null sind. Da in diesem reduzierten nur noch die Besuchshäufigkeit auf die konsumierte Alkoholmenge wirkt, setzen wir direkt die beobachtete Korrelation als Pfadkoeffizient ein. Alternativ hierzu können wir auch ein bivariates Regressionsmodell schätzen, welches uns einen mit der bivariaten Korrelation identischen Pfadkoeffizienten P Y2Y ermittelt. Wir benötigen hierzu den folgenden SPSS-Befehl: SPSSfWin-Befehl: * Reduziertes : Strukturgleichung 2b. REGRESSION MATRIX=IN(*) /DEPENDENT=TRINKEN /METHOD=ENTER KNEIPE.

17 Dr. Wolfgang Langer - Integrierte Veranstaltung Methoden IV WS2002/ Wir erhalten das folgende SPSSfWin-Ausgabeprotokoll: Aufgenommene/Entfernte Variablen b Aufgenomme ne Variablen Entfernte Variablen Methode Häufigkeit des Kneipenbesu chs a, Eingeben a. Alle gewünschten Variablen wurden aufgenommen. b. Abhängige Variable: Ausmaß des Alkoholkonsums zusammenfassung Standardf Korrigiertes ehler des R R-Quadrat R-Quadrat Schätzers,536 a,287,287, a. Einflußvariablen : (Konstante), Häufigkeit des Kneipenbesuchs Regression Residuen Gesamt ANOVA b Quadrats Mittel der umme df Quadrate F Signifikanz 436, ,690 62,320,000 a 083,30 59,73 520, a. Einflußvariablen : (Konstante), Häufigkeit des Kneipenbesuchs b. Abhängige Variable: Ausmaß des Alkoholkonsums (Konstante) Häufigkeit des Kneipenbesuchs Koeffizienten a Nicht standardisierte Koeffizienten a. Abhängige Variable: Ausmaß des Alkoholkonsums Standardi sierte Koeffizien ten Standardf B ehler Beta T Signifikanz,000,022,000,000,536,022,536 24,745,000 Mit Anteil von 28,7 % erklärter Varianz des konsumierten Alkoholmenge fällt der Erklärungsbeitrag des reduzierten s um 3,4% niedriger aus als im vollständigen Pfadmodell. Der beobachtete Effekt der Besuchsfrequenz gilt ebenfalls für die Grundgesamtheit, wie dem F-Test zu entnehmen ist.

18 Dr. Wolfgang Langer - Integrierte Veranstaltung Methoden IV WS2002/ ALTER (X) - 0,326 E 0,940 E2 0,844 HÄUFIGKEIT KNEIPENBE- SUCH (Y) R² =,64% + 0,536 ALKOHOL- KONSUMS (Y2) R² = 28,73% BILDUNG in Schuljahren (X2) + 0,044 Abbildung9: Restringiertes ohne direkte Effekte von Alter und Bildung auf den Alkoholkonsum Angesichts dieses Verlustes von 3,4% erklärter Varianz stellt sich die Frage, ob der skandinavische Forscher mit seiner Kneipenhypothese Recht hat. Formal gesehen haben wir zu überprüfen, ob das restringierte Pfadmodell noch im hinreichenden Maße die beobachteten Korrelation der Indikatoren reproduziert. Nach Wright gilt eine struktur nicht als widerlegt, so lange die Differenz zwischen den beobachteten und den reproduzierten Korrelationen nicht größer als 0,0 ausfällt. Um das restringierte zu testen, müssen wir jeweils die reproduzierte Korrelation für Alter bzw. Bildung mit der konsumierten Alkoholmenge berechnen. Da unser Forscher ihre direkten kausalen Effekt a priori auf Null gesetzt hat, berechnen wir zunächst ihre indirekten Kausaleffekte und korrelativen Scheineffekte. Tab.2: Effektzerlegung für das restringierte Kausalmodell exogene Merkmale Bivariate Korrelation mit Drinking (Y2) direkter kausaler Effekt auf Drinking (Y2) indirekter kausaler Effekt über Frequenting (Y) Korrelativen Scheineffekte Reproduzierte Korrelation: ALTER (X ) - 0,283 - P YX *P Y2Y - 0,326*0,536 = - 0,75 r XX2 *P YX2 *P Y2Y = - 0,30 * +0,044*0,536 = - 0,0074-0, ,0074 = -0,824 BILDUNG (X 2 ) +0,248 - P YX2 *P Y2Y +0,044*0,536 = +0,024 r XX2 *P YX *P Y2Y = - 0,30 * - 0,326 * +0,536 = +0, ,024+,00543 = +0,0783 Die reproduzierten Korrelationen zwischen Alter und Trinken bzw. Bildung und Trinken betragen -0,824 bzw. +0,0783. Um zu überprüfen, ob das sparsamere Pfadmodell auf die Daten

19 Dr. Wolfgang Langer - Integrierte Veranstaltung Methoden IV WS2002/ paßt, ziehen wir von der beobachteten Korrelation jeweils die reproduzierte Korrelation ab. Fällt die berechnete Differenz größer als 0,0 aus, so gilt die struktur im Hinblick auf den betrachteten Nullpfad als widerlegt. Tab.3: Vergleich der beobachteten und reproduzierten Korrelationen Variablen: Beobachtetes r: Reproduziertes r: Differenz: F <-> D +0,536 +0, ,000 Alter <-> Trinken -0,283-0,824-0,006 Bildung <-> Trinken +0,248 +0, ,697 Die Differenz zwischen der beobachteten und der reproduzierten Korrelation fällt für das exogenen Merkmal Bildung mit +0,697 deutlich höher als die Daumenregel 0,0 aus. Daher müssen wir die Hypothese verwerfen, dass der Pfadkoeffizient zwischen der konsumierten Alkoholmenge und der Bildung Null sei. Im Hinblick auf diesen Nullpfad ist das sparsamere eindeutig falsifiziert worden. Beim Nullpfad zwischen Alter und konsumiertes Alkoholmenge erreicht die Differenz zwischen beobachteter und reproduzierter Korrelation den Wert der Daumenregel, ohne ihn aber zu überschreiten. Daher können wir nicht eindeutig entscheiden, ob das sparsamere im Hinblick auf den Nullpfad zwischen Alter und Trinken widerlegt wird. Vergleicht man die beobachteten mit den vom Kausalmodell reproduzierten Korrelationen, so zeigt sich, dass unser Kausalmodell anhand der vorliegenden Daten falsifiziert wird. Die festgestellten Abweichungen liegen eindeutig über dem kritischen Grenzwert von 0,0. Ein adäquateres Kausalmodell kann auf den direkten Einfluß der Bildung auf das Trinkverhalten nicht verzichten.

20 Dr. Wolfgang Langer - Integrierte Veranstaltung Methoden IV WS2002/ Restriktion: P Y2 X P Y2 X 2 0 Zugehörige Strukturgleichungen des restringierten s: Y P Y X X P Y X 2 X 2 P Y E E Y 2 P Y2 Y Y P Y2 E 2 E 2 Zugehörige Zerlegungsgleichungen: r Y X P Y X r X X 2 P Y X 2 r Y X 2 P Y X 2 r X X 2 P Y X r Y2 Y P Y2 Y 0,536 r Y2 X P Y X P Y2 Y r X X 2 P Y X 2 P Y2 Y ( 0,3260,536) ( 0,300,0440,536) 0,824 r Y2 X 2 P Y X 2 P Y2 Y r X X 2 P Y X P Y2 Y (0,0440,536) ( 0,30 0,3260,536) 0,0783 Wie lässt sich ein restringiertes Kausal-/Pfadmodell inferenzstatistisch falsifizieren? Zur inferenzstatistischen Falsifikation eines restringierten Pfadmodells bietet sich der $²- Anpassungstest für große Stichproben an. Er stellt die bisher bekannte Logik des aus der Kontingenztabellenanalyse bekannten $²-Tests vom Kopf auf die Füße. Im Gegensatz zu ersteren sind wir nunmehr nicht an signifikanten Abweichungen von der Indifferenztabelle interessiert, sondern wir suchen ein restringiertes, sparsames Pfadmodell, dessen Residuen von denjenigen des saturierten s nicht im statistisch signifikanten Ausmaße abweichen. Daher lautet seine Nullhypothese: Die Residuen des restringierten s weichen nicht bedeutsam von denjenigen des saturierten s ab. Die Anzahl der Freiheitsgrade des Anpassungstests bestimmt sich über die Anzahl der Nullpfade des restringierten s. Erreicht sein berechneter $² den zu den Freiheitsgraden gehörenden kritischen $²-Wert, so sind die Residuen des restringierten s statistisch signifikant. D.h., seine Kausalstruktur eignet sich nicht mehr zur Reproduktion der beobachteten Korrelationsmatrix. Daher muß das restringierte Pfadmodell verworfen werden. 2 2 Nie, N.H., Hull, C.H., Jenkins, J.G, Steinbrenner, K.,& Bent, D.H.: SPSS. Statistical Package for the Social Sciences. New York: McGraw-Hill, 975², S. 394

21 Dr. Wolfgang Langer - Integrierte Veranstaltung Methoden IV WS2002/ X² Anpassungstest für große Stichproben: y Empirische X² Wert i y Anzahl der Freiheitsgrade i Legende: y: Anzahl der abhängigen Variablen N ln ( R 2 ri )/ d ri ( R 2 fi )/ d fi y d ri i ( R 2 fi ): Alienationskoeffizient des restringiertens d ri : Freiheitsgrade des restringierten s N L ( R 2 ri ): Alienationskoeffizient des satuierten s d fi : Freiheitsgrade des satuierten s N K d fi Anwendung auf das Drinking-Beispiel: Beim Drinking-Beispiel unterscheiden wir die zwei abhängigen Variablen Kneipenbesuch und Alkoholkonsum. Da wir das Pfadmodell nur für den Alkoholkonsum ändern, indem wir die direkten Pfade von der Bildung bzw. dem Alter auf das Trinkverhalten explizit auf Null setzen, müssen wir nur den Anteil der nichterklärten Variation des Trinkverhalten im restringierten mit demjenigen des saturierten s vergleichen. Bei der Vorhersage des Kneipenbesuches haben wir keinerlei Änderungen vorgenommen.

22 Dr. Wolfgang Langer - Integrierte Veranstaltung Methoden IV WS2002/ X² Anpassungstest für große Stichproben: X² 52 ln ( 0,2873) / (52 ) ( 0,394) / (52 3 ) 52 ln ( 0,2873) ( 52 ) ( 0,394) ( 52 3 ) 52 ln ( 0,2873) (52 3 ) ( 0,394) ( 52 ) 52 ln (0,727) 57 (0,6806) ln 08,7 033,83 52 ln [,05] 52 0,04 68,0 Anzahl der Freiheitsgrade (52 ) (52 3 ) Kritischer 2 Wert bei 2 Freiheitsgraden für 5% Signifikanzniveau 5,99 Restringierte struktur wird falsifiziert, da 68,0 > 5,99 größer. Da die empirische Prüfgröße des $ 2 -Anpassungstest größer ist als der kritische Prüfwert, sind die Residuen des sparsameren s statistisch signifikant von Null verschieden. Daher müssen wir das sparsamere verwerfen.

Einführung in die Grundlagen der explorativen Pfadanalyse nach Wright

Einführung in die Grundlagen der explorativen Pfadanalyse nach Wright Dr. Wolfgang Langer - Methoden V: LISREL - SoSe 2002 - Einführung in die Grundlagen der explorativen Pfadanalyse nach Wright Wenden wir uns zunächst dem Wrightschen Pfadfinderspiel zu. Ausgangspunkt: Pfaddiagramm

Mehr

Die Anwendung des globalen und partiellen F-Tests beim Regressionsmodell

Die Anwendung des globalen und partiellen F-Tests beim Regressionsmodell Dr. Wolfgang Langer - Integrierte Veranstaltung Methoden IV WS 2002/2003-1 Die Anwendung des globalen und partiellen F-Tests beim Regressionsmodell von XENOPHOB auf V247 und POSTMAT, MATERIAL Für unsere

Mehr

Ziel: Vorhersage eines Kriteriums/Regressand Y durch einen Prädiktor/Regressor X.

Ziel: Vorhersage eines Kriteriums/Regressand Y durch einen Prädiktor/Regressor X. Lineare Regression Einfache Regression Beispieldatensatz: trinkgeld.sav Ziel: Vorhersage eines Kriteriums/Regressand Y durch einen Prädiktor/Regressor X. H0: Y lässt sich nicht durch X erklären, das heißt

Mehr

Forschungspraktikum Gruppenbezogene Menschenfeindlichkeit. 21. Juni 2007: Pfadanalyse und lineare Strukturgleichungsmodelle

Forschungspraktikum Gruppenbezogene Menschenfeindlichkeit. 21. Juni 2007: Pfadanalyse und lineare Strukturgleichungsmodelle Forschungspraktikum Gruppenbezogene Menschenfeindlichkeit 2. Juni 2007: Pfadanalyse und lineare Strukturgleichungsmodelle In vielen Untersuchungen soll eine komplexere Beziehungsstruktur untersucht werden.

Mehr

Test von Hypothesen: Signifikanz des Zusammenhangs (F-Test)

Test von Hypothesen: Signifikanz des Zusammenhangs (F-Test) Test von Hyothesen: Signifikanz des Zusammenhangs (F-Test) Die Schätzung der Regressionsfunktion basiert auf Daten einer Stichrobe Inwiefern können die Ergebnisse dieser Schätzung auf die Grundgesamtheit

Mehr

Statistik II Übung 4: Skalierung und asymptotische Eigenschaften

Statistik II Übung 4: Skalierung und asymptotische Eigenschaften Statistik II Übung 4: Skalierung und asymptotische Eigenschaften Diese Übung beschäftigt sich mit der Skalierung von Variablen in Regressionsanalysen und mit asymptotischen Eigenschaften von OLS. Verwenden

Mehr

4.1. Verteilungsannahmen des Fehlers. 4. Statistik im multiplen Regressionsmodell Verteilungsannahmen des Fehlers

4.1. Verteilungsannahmen des Fehlers. 4. Statistik im multiplen Regressionsmodell Verteilungsannahmen des Fehlers 4. Statistik im multiplen Regressionsmodell In diesem Kapitel wird im Abschnitt 4.1 zusätzlich zu den schon bekannten Standardannahmen noch die Annahme von normalverteilten Residuen hinzugefügt. Auf Basis

Mehr

Hypothesentests mit SPSS

Hypothesentests mit SPSS Beispiel für eine einfache Regressionsanalyse (mit Überprüfung der Voraussetzungen) Daten: bedrohfb_v07.sav Hypothese: Die Skalenwerte auf der ATB-Skala (Skala zur Erfassung der Angst vor terroristischen

Mehr

SozialwissenschaftlerInnen II

SozialwissenschaftlerInnen II Statistik für SozialwissenschaftlerInnen II Henning Best best@wiso.uni-koeln.de Universität zu Köln Forschungsinstitut für Soziologie Statistik für SozialwissenschaftlerInnen II p.1 Varianzanalyse Statistik

Mehr

SPSS-Ausgabe 1: Univariate Varianzanalyse. Profildiagramm. [DatenSet1] D:\Sozialwiss2006_7\STAT2\Daten\mathsalaries.sav. Seite 1

SPSS-Ausgabe 1: Univariate Varianzanalyse. Profildiagramm. [DatenSet1] D:\Sozialwiss2006_7\STAT2\Daten\mathsalaries.sav. Seite 1 SPSS-Ausgabe : Univariate Varianzanalyse [DatenSet] D:\Sozialwiss2006_7\STAT2\Daten\mathsalaries.sav Tests der Zwischensubjekteffekte Abhängige Variable: Einkommen Quelle Korrigiertes Modell Konstanter

Mehr

Literatur: Rudolf & Müller, S Dr. Matthias Rudolf: M3 Multivariate Statistik Vorlesung Einführung SEM Folie Nr. 1

Literatur: Rudolf & Müller, S Dr. Matthias Rudolf: M3 Multivariate Statistik Vorlesung Einführung SEM Folie Nr. 1 1 Korrelation und Kausalität 2 Grundsätzliches 3 Pfaddiagramme und lineare Strukturgleichungen 4 Struktur- und Messmodell 5 Modellspezifikation 6 Parameterschätzungen 7 Beurteilung der Schätzergebnisse

Mehr

Ziel der linearen Regression

Ziel der linearen Regression Regression 1 Ziel der linearen Regression Bei der linearen Regression wird untersucht, in welcher Weise eine abhängige metrische Variable durch eine oder mehrere unabhängige metrische Variablen durch eine

Mehr

Sozialwissenschaftliche Fakultät der Universität Göttingen. Sommersemester Statistik mit SPSS

Sozialwissenschaftliche Fakultät der Universität Göttingen. Sommersemester Statistik mit SPSS Sommersemester 2009 Statistik mit SPSS 15. Mai 2009 15. Mai 2009 Statistik Dozentin: mit Esther SPSSOchoa Fernández 1 Überblick 1. Korrelation vs. Regression 2. Ziele der Regressionsanalyse 3. Syntax für

Mehr

Teil: lineare Regression

Teil: lineare Regression Teil: lineare Regression 1 Einführung 2 Prüfung der Regressionsfunktion 3 Die Modellannahmen zur Durchführung einer linearen Regression 4 Dummyvariablen 1 Einführung o Eine statistische Methode um Zusammenhänge

Mehr

Sozialwissenschaftliche Fakultät der Universität Göttingen. Sommersemester 2009, Statistik mit SPSS

Sozialwissenschaftliche Fakultät der Universität Göttingen. Sommersemester 2009, Statistik mit SPSS Sommersemester 2009, Statistik mit SPSS 28. August 2009 28. August 2009 Statistik Dozentin: mit Anja SPSS Mays 1 Überblick 1. Korrelation vs. Regression 2. Ziel der Regressionsanalyse 3. Syntax für den

Mehr

Drittvariablenkontrolle in der linearen Regression: Trivariate Regression

Drittvariablenkontrolle in der linearen Regression: Trivariate Regression Drittvariablenkontrolle in der linearen Regression: Trivariate Regression 14. Januar 2002 In der Tabellenanalyse wird bei der Drittvariablenkontrolle für jede Ausprägung der Kontrollvariablen eine Partialtabelle

Mehr

Statistischer Rückschluss und Testen von Hypothesen

Statistischer Rückschluss und Testen von Hypothesen Statistischer Rückschluss und Testen von Hypothesen Statistischer Rückschluss Lerne von der Stichprobe über Verhältnisse in der Grundgesamtheit Grundgesamtheit Statistischer Rückschluss lerne aus Analyse

Mehr

Kapitel 4: Merkmalszusammenhänge

Kapitel 4: Merkmalszusammenhänge Kapitel 4: Merkmalszusammenhänge Korrelationen 1 Lineare Regression 3 Literatur 5 Korrelationen Mit Hilfe von G*Power lässt sich analog zum Vorgehen beim t-test (Kapitel 3, Band I) vor einer Untersuchung

Mehr

Statistik II Übung 2: Multivariate lineare Regression

Statistik II Übung 2: Multivariate lineare Regression Statistik II Übung 2: Multivariate lineare Regression Diese Übung beschäftigt sich mit dem Zusammenhang zwischen Flugpreisen und der Flugdistanz, dem Passagieraufkommen und der Marktkonzentration. Verwenden

Mehr

Musterlösung. Modulklausur Multivariate Verfahren

Musterlösung. Modulklausur Multivariate Verfahren Musterlösung Modulklausur 31821 Multivariate Verfahren 25. September 2015 Aufgabe 1 (15 Punkte) Kennzeichnen Sie die folgenden Aussagen zur Regressionsanalyse mit R für richtig oder F für falsch. F Wenn

Mehr

9 Faktorenanalyse. Wir gehen zunächst von dem folgenden Modell aus (Modell der Hauptkomponentenanalyse): Z = F L T

9 Faktorenanalyse. Wir gehen zunächst von dem folgenden Modell aus (Modell der Hauptkomponentenanalyse): Z = F L T 9 Faktorenanalyse Ziel der Faktorenanalyse ist es, die Anzahl der Variablen auf wenige voneinander unabhängige Faktoren zu reduzieren und dabei möglichst viel an Information zu erhalten. Hier wird davon

Mehr

Multivariate Verfahren

Multivariate Verfahren Selbstkontrollarbeit 1 Multivariate Verfahren Musterlösung Aufgabe 1 (40 Punkte) Auf der dem Kurs beigelegten CD finden Sie im Unterverzeichnis Daten/Excel/ die Datei zahlen.xlsx. Alternativ können Sie

Mehr

Statistik II Übung 3: Hypothesentests Aktualisiert am

Statistik II Übung 3: Hypothesentests Aktualisiert am Statistik II Übung 3: Hypothesentests Aktualisiert am 12.04.2017 Diese Übung beschäftigt sich mit der Anwendung diverser Hypothesentests (zum Beispiel zum Vergleich der Mittelwerte und Verteilungen zweier

Mehr

Das Identifikationsproblem

Das Identifikationsproblem Draft 1 Das Identifikationsproblem Simultane Strukturmodelle sind insbesondere in den Sozialwissenschaften wichtig, da dort Zusammenhänge sehr häufig interdependenter Natur sind. Dies wirft einige schwerwiegende

Mehr

Schätzen und Testen von Populationsparametern im linearen Regressionsmodell PE ΣO

Schätzen und Testen von Populationsparametern im linearen Regressionsmodell PE ΣO Schätzen und Testen von Populationsparametern im linearen Regressionsmodell PE ΣO 4. Dezember 2001 Generalisierung der aus Stichprobendaten berechneten Regressionsgeraden Voraussetzungen für die Generalisierung

Mehr

Statistik II Übung 2: Multivariate lineare Regression

Statistik II Übung 2: Multivariate lineare Regression Statistik II Übung 2: Multivariate lineare Regression Diese Übung beschäftigt sich mit dem Zusammenhang zwischen Flugpreisen und der Flugdistanz, dem Passagieraufkommen und der Marktkonzentration. Verwenden

Mehr

Hypothesentests mit SPSS. Beispiel für einen t-test

Hypothesentests mit SPSS. Beispiel für einen t-test Beispiel für einen t-test Daten: museum-f-v04.sav Hypothese: Als Gründe, in ein Museum zu gehen, geben mehr Frauen als Männer die Erweiterung der Bildung für Kinder an. Dies hängt mit der Geschlechtsrolle

Mehr

B. Regressionsanalyse [progdat.sav]

B. Regressionsanalyse [progdat.sav] SPSS-PC-ÜBUNG Seite 9 B. Regressionsanalyse [progdat.sav] Ein Unternehmen möchte den zukünftigen Absatz in Abhängigkeit von den Werbeausgaben und der Anzahl der Filialen prognostizieren. Dazu wurden über

Mehr

Bestimmung der Zuverlässigkeit / Reliabilität einer additiven Itemskala. Cronbach s. 1 (k 1)r

Bestimmung der Zuverlässigkeit / Reliabilität einer additiven Itemskala. Cronbach s. 1 (k 1)r Dr. Wolfgang Langer - Methoden V: Explorative Faktorenanalyse SoSe 1999-1 Bestimmung der Zuverlässigkeit / Reliabilität einer additiven Itemskala Für die Schätzung der Zuverlässigkeit einer additiven Itemskala,

Mehr

Chi-Quadrat Verfahren

Chi-Quadrat Verfahren Chi-Quadrat Verfahren Chi-Quadrat Verfahren werden bei nominalskalierten Daten verwendet. Die einzige Information, die wir bei Nominalskalenniveau zur Verfügung haben, sind Häufigkeiten. Die Quintessenz

Mehr

Annahmen des linearen Modells

Annahmen des linearen Modells Annahmen des linearen Modells Annahmen des linearen Modells zusammengefasst A1: Linearer Zusammenhang: y = 0 + 1x 1 + 2x 2 + + kx k A2: Zufallsstichprobe, keine Korrelation zwischen Beobachtungen A3: Erwartungswert

Mehr

Übung V Lineares Regressionsmodell

Übung V Lineares Regressionsmodell Universität Ulm 89069 Ulm Germany Dipl.-WiWi Michael Alpert Institut für Wirtschaftspolitik Fakultät für Mathematik und Wirtschaftswissenschaften Ludwig-Erhard-Stiftungsprofessur Sommersemester 2007 Übung

Mehr

Statistik II. IV. Hypothesentests. Martin Huber

Statistik II. IV. Hypothesentests. Martin Huber Statistik II IV. Hypothesentests Martin Huber 1 / 41 Übersicht Struktur eines Hypothesentests Stichprobenverteilung t-test: Einzelner-Parameter-Test F-Test: Multiple lineare Restriktionen 2 / 41 Struktur

Mehr

Standardab er des. Testwert = 145.5 95% Konfidenzintervall. T df Sig. (2-seitig) Differenz Untere Obere -2.011 698.045-5.82-11.50 -.14.

Standardab er des. Testwert = 145.5 95% Konfidenzintervall. T df Sig. (2-seitig) Differenz Untere Obere -2.011 698.045-5.82-11.50 -.14. Aufgabe : einfacher T-Test Statistik bei einer Stichprobe Standardfehl Standardab er des Mittelwert weichung Mittelwertes 699 39.68 76.59 2.894 Test bei einer Sichprobe Testwert = 45.5 95% Konfidenzintervall

Mehr

Empirische Analysen mit dem SOEP

Empirische Analysen mit dem SOEP Empirische Analysen mit dem SOEP Methodisches Lineare Regressionsanalyse & Logit/Probit Modelle Kurs im Wintersemester 2007/08 Dipl.-Volksw. Paul Böhm Dipl.-Volksw. Dominik Hanglberger Dipl.-Volksw. Rafael

Mehr

Kreuzvalidierung. 1. Schritt: Aufteilung der Stichprobe in ungefähr gleiche Hälften nach dem Zufall. SPSS:

Kreuzvalidierung. 1. Schritt: Aufteilung der Stichprobe in ungefähr gleiche Hälften nach dem Zufall. SPSS: Kreuzvalidierung. Schritt: Aufteilung der Stichprobe in ungefähr gleiche Hälften nach dem Zufall. SPSS: SPSS erzeugt eine neue Variable Filter_$. Die herausgefilterten Fälle werden im Datenfenster angezeigt

Mehr

Statistik II Übung 3: Hypothesentests

Statistik II Übung 3: Hypothesentests Statistik II Übung 3: Hypothesentests Diese Übung beschäftigt sich mit der Anwendung diverser Hypothesentests (zum Beispiel zum Vergleich der Mittelwerte und Verteilungen zweier Stichproben). Verwenden

Mehr

Multiple Regressionsanalyse - Kurzabriss

Multiple Regressionsanalyse - Kurzabriss Multiple Regressionsanalyse - Kurzabriss Ziele: Schätzung eines Kriteriums aus einer Linearkombination von Prädiktoren Meist zu Screening-Untersuchungen, um den Einfluß von vermuteten Ursachenvariablen

Mehr

Kapitel 4: Merkmalszusammenhänge

Kapitel 4: Merkmalszusammenhänge Kapitel 4: Merkmalszusammenhänge Streudiagramme SPSS bietet die Möglichkeit, verschiedene Arten von Streudiagrammen zu zeichnen. Gehen Sie auf Grafiken Streu-/Punkt-Diagramm und wählen Sie die Option Einfaches

Mehr

Multivariate lineare Regression. Statistik für SozialwissenschaftlerInnen II p.167

Multivariate lineare Regression. Statistik für SozialwissenschaftlerInnen II p.167 Multivariate lineare Regression Statistik für SozialwissenschaftlerInnen II p.167 Multivariate Regression Verfahren zur Prüfung des gemeinsamen linearen Einflusses mehrerer unabhängiger Variablen auf eine

Mehr

Parametrische vs. Non-Parametrische Testverfahren

Parametrische vs. Non-Parametrische Testverfahren Parametrische vs. Non-Parametrische Testverfahren Parametrische Verfahren haben die Besonderheit, dass sie auf Annahmen zur Verteilung der Messwerte in der Population beruhen: die Messwerte sollten einer

Mehr

Statistisches Testen

Statistisches Testen Statistisches Testen Grundlegendes Prinzip Erwartungswert Bekannte Varianz Unbekannte Varianz Differenzen Anteilswert Chi-Quadrat Tests Gleichheit von Varianzen Prinzip des Statistischen Tests Konfidenzintervall

Mehr

Prüfung aus Wahrscheinlichkeitstheorie und Statistik MASCHINENBAU 2002

Prüfung aus Wahrscheinlichkeitstheorie und Statistik MASCHINENBAU 2002 Prüfung aus Wahrscheinlichkeitstheorie und Statistik MASCHINENBAU 2002 1. Ein Chemiestudent hat ein Set von 10 Gefäßen vor sich stehen, von denen vier mit Salpetersäure Stoff A), vier mit Glyzerin Stoff

Mehr

Einführung in die Statistik für Politikwissenschaftler Sommersemester 2011

Einführung in die Statistik für Politikwissenschaftler Sommersemester 2011 Einführung in die Statistik für Politikwissenschaftler Sommersemester 2011 Es können von den Antworten alle, mehrere oder keine Antwort(en) richtig sein. Nur bei einer korrekten Antwort (ohne Auslassungen

Mehr

Statistik II. II. Univariates lineares Regressionsmodell. Martin Huber 1 / 20

Statistik II. II. Univariates lineares Regressionsmodell. Martin Huber 1 / 20 Statistik II II. Univariates lineares Regressionsmodell Martin Huber 1 / 20 Übersicht Definitionen (Wooldridge 2.1) Schätzmethode - Kleinste Quadrate Schätzer / Ordinary Least Squares (Wooldridge 2.2)

Mehr

a) Man bestimme ein 95%-Konfidenzintervall für den Anteil der Wahlberechtigten, die gegen die Einführung dieses generellen

a) Man bestimme ein 95%-Konfidenzintervall für den Anteil der Wahlberechtigten, die gegen die Einführung dieses generellen 2) Bei einer Stichprobe unter n=800 Wahlberechtigten gaben 440 an, dass Sie gegen die Einführung eines generellen Tempolimits von 100km/h auf Österreichs Autobahnen sind. a) Man bestimme ein 95%-Konfidenzintervall

Mehr

1. Lösungen zu Kapitel 7

1. Lösungen zu Kapitel 7 1. Lösungen zu Kapitel 7 Übungsaufgabe 7.1 Um zu testen ob die Störterme ε i eine konstante Varianz haben, sprich die Homogenitätsannahme erfüllt ist, sind der Breusch-Pagan-Test und der White- Test zwei

Mehr

Statistik II: Signifikanztests /1

Statistik II: Signifikanztests /1 Medien Institut : Signifikanztests /1 Dr. Andreas Vlašić Medien Institut (0621) 52 67 44 vlasic@medien-institut.de Gliederung 1. Noch einmal: Grundlagen des Signifikanztests 2. Der chi 2 -Test 3. Der t-test

Mehr

Multivariate Verfahren

Multivariate Verfahren Selbstkontrollarbeit 1 Multivariate Verfahren Diese Selbstkontrollarbeit bezieht sich auf die Kapitel 1 bis 4 der Kurseinheit 1 (Multivariate Statistik) des Kurses Multivariate Verfahren (883). Hinweise:

Mehr

Lösungen zu Janssen/Laatz, Statistische Datenanalyse mit SPSS 1. LÖSUNG 7 a)

Lösungen zu Janssen/Laatz, Statistische Datenanalyse mit SPSS 1. LÖSUNG 7 a) LÖSUNG 7 a) Lösungen zu Janssen/Laatz, Statistische Datenanalyse mit SPSS 1 Aufrufen der Varianzanalyse: "Analysieren", "Mittelwerte vergleichen", "Einfaktorielle ANOVA ", "Abhängige Variablen:" TVHOURS;

Mehr

Vergleich zweier Stichproben

Vergleich zweier Stichproben zurück zum Inhaltsverzeichnis Die Werte sind verbunden, abhängig oder korreliert. Beispiel: Eine Probe wird mit zwei Messgeräten bestimmt. Es gibt eine paarweise Zuordnung. Die Werte sind unabhängig also

Mehr

Analyse von Querschnittsdaten. Signifikanztests I Basics

Analyse von Querschnittsdaten. Signifikanztests I Basics Analyse von Querschnittsdaten Signifikanztests I Basics Warum geht es in den folgenden Sitzungen? Kontinuierliche Variablen Generalisierung kategoriale Variablen Datum 13.10.2004 20.10.2004 27.10.2004

Mehr

Bivariater Zusammenhang in der Mehrfeldertafel PEΣO

Bivariater Zusammenhang in der Mehrfeldertafel PEΣO Bivariater Zusammenhang in der Mehrfeldertafel PEΣO 9. November 2001 Bivariate Häufigkeitsverteilungen in Mehrfeldertabellen In der Mehrfeldertabelle werden im Gegensatz zur Vierfeldertabelle keine dichotomen

Mehr

Lineare Regression II

Lineare Regression II Lineare Regression II Varianzanalyse als multiple Regession auf Designvariablen Das lineare Regressionsmodell setzt implizit voraus, dass nicht nur die abhängige, sondern auch die erklärenden Variablen

Mehr

Kapitel 7. Regression und Korrelation. 7.1 Das Regressionsproblem

Kapitel 7. Regression und Korrelation. 7.1 Das Regressionsproblem Kapitel 7 Regression und Korrelation Ein Regressionsproblem behandelt die Verteilung einer Variablen, wenn mindestens eine andere gewisse Werte in nicht zufälliger Art annimmt. Ein Korrelationsproblem

Mehr

Statistik II. Weitere Statistische Tests. Statistik II

Statistik II. Weitere Statistische Tests. Statistik II Statistik II Weitere Statistische Tests Statistik II - 19.5.2006 1 Überblick Bisher wurden die Test immer anhand einer Stichprobe durchgeführt Jetzt wollen wir die statistischen Eigenschaften von zwei

Mehr

Kapitel 6: Zweifaktorielle Varianzanalyse

Kapitel 6: Zweifaktorielle Varianzanalyse Kapitel 6: Zweifaktorielle Varianzanalyse Berechnen der Teststärke a priori bzw. Stichprobenumfangsplanung 1 Teststärkebestimmung a posteriori 4 Berechnen der Effektgröße f² aus empirischen Daten und Bestimmung

Mehr

Empirische Wirtschaftsforschung

Empirische Wirtschaftsforschung Empirische Wirtschaftsforschung Prof. Dr. Bernd Süßmuth Universität Leipzig Institut für Empirische Wirtschaftsforschung Volkswirtschaftslehre, insbesondere Ökonometrie 6.. Herleitung des OLS-Schätzers

Mehr

Einfaktorielle Varianzanalyse

Einfaktorielle Varianzanalyse Kapitel 16 Einfaktorielle Varianzanalyse Im Zweistichprobenproblem vergleichen wir zwei Verfahren miteinander. Nun wollen wir mehr als zwei Verfahren betrachten, wobei wir unverbunden vorgehen. Beispiel

Mehr

Franz Kronthaler. Statistik angewandt. Datenanalyse ist (k)eine Kunst. mit dem R Commander. A Springer Spektrum

Franz Kronthaler. Statistik angewandt. Datenanalyse ist (k)eine Kunst. mit dem R Commander. A Springer Spektrum Franz Kronthaler Statistik angewandt Datenanalyse ist (k)eine Kunst mit dem R Commander A Springer Spektrum Inhaltsverzeichnis Teil I Basiswissen und Werkzeuge, um Statistik anzuwenden 1 Statistik ist

Mehr

5. Seminar Statistik

5. Seminar Statistik Sandra Schlick Seite 1 5. Seminar 5. Seminar Statistik 30 Kurztest 4 45 Testen von Hypothesen inkl. Übungen 45 Test- und Prüfverfahren inkl. Übungen 45 Repetitorium und Prüfungsvorbereitung 15 Kursevaluation

Mehr

Das Lineare Regressionsmodell

Das Lineare Regressionsmodell Das Lineare Regressionsmodell Bivariates Regressionsmodell Verbrauch eines Pkw hängt vom Gewicht des Fahrzeugs ab Hypothese / Theorie: Je schwerer ein Auto, desto mehr wird es verbrauchen Annahme eines

Mehr

Statistische Methoden in den Umweltwissenschaften

Statistische Methoden in den Umweltwissenschaften Statistische Methoden in den Umweltwissenschaften Korrelationsanalysen Kreuztabellen und χ²-test Themen Korrelation oder Lineare Regression? Korrelationsanalysen - Pearson, Spearman-Rang, Kendall s Tau

Mehr

Lösungen zu Janssen/Laatz, Statistische Datenanalyse mit SPSS 1

Lösungen zu Janssen/Laatz, Statistische Datenanalyse mit SPSS 1 LÖSUNG 4B a.) Lösungen zu Janssen/Laatz, Statistische Datenanalyse mit SPSS 1 Mit "Deskriptive Statistiken", "Kreuztabellen " wird die Dialogbox "Kreuztabellen" geöffnet. POL wird in das Eingabefeld von

Mehr

Statistik, Datenanalyse und Simulation

Statistik, Datenanalyse und Simulation Dr. Michael O. Distler distler@kph.uni-mainz.de Mainz, 31. Mai 2011 4. Methode der kleinsten Quadrate Geschichte: Von Legendre, Gauß und Laplace zu Beginn des 19. Jahrhunderts eingeführt. Die Methode der

Mehr

Hypothesentests mit SPSS

Hypothesentests mit SPSS Beispiel für einen chi²-test Daten: afrikamie.sav Im Rahmen der Evaluation des Afrikamie-Festivals wurden persönliche Interviews durchgeführt. Hypothese: Es gibt einen Zusammenhang zwischen dem Geschlecht

Mehr

Inhaltsverzeichnis. Über die Autoren Einleitung... 21

Inhaltsverzeichnis. Über die Autoren Einleitung... 21 Inhaltsverzeichnis Über die Autoren.... 7 Einleitung... 21 Über dieses Buch... 21 Was Sie nicht lesen müssen... 22 Törichte Annahmen über den Leser... 22 Wie dieses Buch aufgebaut ist... 23 Symbole, die

Mehr

1 Beispiel zur Methode der kleinsten Quadrate

1 Beispiel zur Methode der kleinsten Quadrate 1 Beispiel zur Methode der kleinsten Quadrate 1.1 Daten des Beispiels t x y x*y x 2 ŷ ˆɛ ˆɛ 2 1 1 3 3 1 2 1 1 2 2 3 6 4 3.5-0.5 0.25 3 3 4 12 9 5-1 1 4 4 6 24 16 6.5-0.5 0.25 5 5 9 45 25 8 1 1 Σ 15 25

Mehr

Name Vorname Matrikelnummer Unterschrift

Name Vorname Matrikelnummer Unterschrift Dr. Hans-Otfried Müller Institut für Mathematische Stochastik Fachrichtung Mathematik Technische Universität Dresden Klausur Statistik II (Sozialwissenschaft, Nach- und Wiederholer) am 26.10.2007 Gruppe

Mehr

Messwiederholungen und abhängige Messungen

Messwiederholungen und abhängige Messungen Messwiederholungen und abhängige Messungen t Tests und Varianzanalysen für Messwiederholungen Kovarianzanalyse Thomas Schäfer SS 009 1 Messwiederholungen und abhängige Messungen Bei einer Messwiederholung

Mehr

Analyse von Querschnittsdaten. Signifikanztests II Advanced Stuff

Analyse von Querschnittsdaten. Signifikanztests II Advanced Stuff Analyse von Querschnittsdaten Signifikanztests II Advanced Stuff Warum geht es in den folgenden Sitzungen? Kontinuierliche Variablen Generalisierung kategoriale Variablen Datum..4..4 7..4..4..4 7..4 4..4..4

Mehr

Kapitel 5: Einfaktorielle Varianzanalyse

Kapitel 5: Einfaktorielle Varianzanalyse Rasch, Friese, Hofmann & Naumann (010). Quantitative Methoden. Band (3. Auflage). Heidelberg: Springer. Kapitel 5: Einfaktorielle Varianzanalyse Berechnen der Teststärke a priori bzw. Stichprobenumfangsplanung

Mehr

Konfirmatorische Faktorenanalyse. Regressionsmodelle für Politikwissenschaftler

Konfirmatorische Faktorenanalyse. Regressionsmodelle für Politikwissenschaftler Konfirmatorische Faktorenanalyse Regressionsmodelle für Politikwissenschaftler Was ist ein Faktor? Faktor oder latente Variable Regressionsmodelle für Politikwissenschaftler Konfirmatorische Faktorenanalyse

Mehr

8. Konfidenzintervalle und Hypothesentests

8. Konfidenzintervalle und Hypothesentests 8. Konfidenzintervalle und Hypothesentests Dr. Antje Kiesel Institut für Angewandte Mathematik WS 2011/2012 Beispiel. Sie wollen den durchschnittlichen Fruchtsaftgehalt eines bestimmten Orangennektars

Mehr

Kapitel 3 Schließende lineare Regression Einführung. induktiv. Fragestellungen. Modell. Matrixschreibweise. Annahmen.

Kapitel 3 Schließende lineare Regression Einführung. induktiv. Fragestellungen. Modell. Matrixschreibweise. Annahmen. Kapitel 3 Schließende lineare Regression 3.1. Einführung induktiv Fragestellungen Modell Statistisch bewerten, der vorher beschriebenen Zusammenhänge auf der Basis vorliegender Daten, ob die ermittelte

Mehr

Das multiple lineare Regressionsmodell

Das multiple lineare Regressionsmodell Das multiple lineare Regressionsmodell Worum geht es in diesem Lernmodul? Das Modell Schätzen der Koeffizienten Interpretation der Koeffizienten Testen der Koeffizienten Worum geht es in diesem Lernmodul?

Mehr

Seminar zur Energiewirtschaft:

Seminar zur Energiewirtschaft: Seminar zur Energiewirtschaft: Ermittlung der Zahlungsbereitschaft für erneuerbare Energien bzw. bessere Umwelt Vladimir Udalov 1 Modelle mit diskreten abhängigen Variablen 2 - Ausgangssituation Eine Dummy-Variable

Mehr

Hypothesentests mit SPSS

Hypothesentests mit SPSS Beispiel für eine zweifaktorielle Varianzanalyse mit Messwiederholung auf einem Faktor (univariate Lösung) Daten: POKIII_AG4_V06.SAV Hypothese: Die physische Attraktivität der Bildperson und das Geschlecht

Mehr

Statistik II. Regressionsanalyse. Statistik II

Statistik II. Regressionsanalyse. Statistik II Statistik II Regressionsanalyse Statistik II - 23.06.2006 1 Einfachregression Annahmen an die Störterme : 1. sind unabhängige Realisationen der Zufallsvariable, d.h. i.i.d. (unabh.-identisch verteilt)

Mehr

Bivariater Zusammenhang in der Vierfeldertafel PEΣO

Bivariater Zusammenhang in der Vierfeldertafel PEΣO Bivariater Zusammenhang in der Vierfeldertafel PEΣO 12. Oktober 2001 Zusammenhang zweier Variablen und bivariate Häufigkeitsverteilung Die Bivariate Häufigkeitsverteilung gibt Auskunft darüber, wie zwei

Mehr

Übung zur Empirischen Wirtschaftsforschung V. Das Lineare Regressionsmodell

Übung zur Empirischen Wirtschaftsforschung V. Das Lineare Regressionsmodell Universität Ulm 89069 Ulm Germany Dipl.-WiWi Christian Peukert Institut für Wirtschaftspolitik Fakultät für Mathematik und Wirtschaftswissenschaften Ludwig-Erhard-Stiftungsprofessur Sommersemester 2010

Mehr

Formelsammlung für das Modul. Statistik 2. Bachelor. Sven Garbade

Formelsammlung für das Modul. Statistik 2. Bachelor. Sven Garbade Version 2015 Formelsammlung für das Modul Statistik 2 Bachelor Sven Garbade Prof. Dr. phil. Dipl.-Psych. Sven Garbade Fakultät für Angewandte Psychologie SRH Hochschule Heidelberg sven.garbade@hochschule-heidelberg.de

Mehr

Kapitel 8. Einfache Regression. Anpassen des linearen Regressionsmodells, OLS. Eigenschaften der Schätzer für das Modell

Kapitel 8. Einfache Regression. Anpassen des linearen Regressionsmodells, OLS. Eigenschaften der Schätzer für das Modell Kapitel 8 Einfache Regression Josef Leydold c 2006 Mathematische Methoden VIII Einfache Regression 1 / 21 Lernziele Lineares Regressionsmodell Anpassen des linearen Regressionsmodells, OLS Eigenschaften

Mehr

Aufgaben zu Kapitel 3

Aufgaben zu Kapitel 3 Aufgaben zu Kapitel 3 Aufgabe 1 a) Berechnen Sie einen t-test für unabhängige Stichproben für den Vergleich der beiden Verarbeitungsgruppen strukturell und emotional für die abhängige Variable neutrale

Mehr

Statistik III Regressionsanalyse, Varianzanalyse und Verfahren bei Messwiederholung mit SPSS

Statistik III Regressionsanalyse, Varianzanalyse und Verfahren bei Messwiederholung mit SPSS Statistik III Regressionsanalyse, Varianzanalyse und Verfahren bei Messwiederholung mit SPSS Verena Hofmann Dr. phil. des. Departement für Sonderpädagogik Universität Freiburg Petrus-Kanisius-Gasse 21

Mehr

Konfirmatorische Faktorenanalyse

Konfirmatorische Faktorenanalyse Konfirmatorische Faktorenanalyse Regressionsmodelle für Politikwissenschaftler Was ist ein Faktor? Faktor oder latente Variable nicht direkt beobachtbare Größe die beobachtbare Variablen ( Indikatoren

Mehr

Statistik II Übung 1: Einfache lineare Regression

Statistik II Übung 1: Einfache lineare Regression Statistik II Übung 1: Einfache lineare Regression Diese Übung beschäftigt sich mit dem Zusammenhang zwischen dem Lohneinkommen von sozial benachteiligten Individuen (16-24 Jahre alt) und der Anzahl der

Mehr

Projekt Kaffeemaschine Welche Faktoren beeinflussen das Geschmacksurteil?

Projekt Kaffeemaschine Welche Faktoren beeinflussen das Geschmacksurteil? AKULTÄT ANGEWANDTE SOZIALWISSENSCHATEN PRO. DR. SONJA HAUG Projekt Kaffeemaschine Welche aktoren beeinflussen das Geschmacksurteil? Ausgehend von der Verkostung an der Hochschule Regensburg und der dabei

Mehr

Regression und Korrelation

Regression und Korrelation Kapitel 7 Regression und Korrelation Ein Regressionsproblem behandeltdie VerteilungeinerVariablen, wenn mindestens eine andere gewisse Werte in nicht zufälliger Art annimmt. Ein Korrelationsproblem dagegen

Mehr

Vorlesung: Multivariate Statistik für Psychologen

Vorlesung: Multivariate Statistik für Psychologen Vorlesung: Multivariate Statistik für Psychologen 6. Vorlesung: 28.04.2003 Organisatorisches Terminverlegung Übungsgruppen Gruppe 5 alter Termin: Donnerstag, 01.05.03, 12 14 Uhr, IfP SR 9 neuer Termin:

Mehr

Hypothesenprüfung. Darüber hinaus existieren zahlreiche andere Testverfahren, die alle auf der gleichen Logik basieren

Hypothesenprüfung. Darüber hinaus existieren zahlreiche andere Testverfahren, die alle auf der gleichen Logik basieren Hypothesenprüfung Teil der Inferenzstatistik Befaßt sich mit der Frage, wie Hypothesen über eine (in der Regel unbekannte) Grundgesamtheit an einer Stichprobe überprüft werden können Behandelt werden drei

Mehr

Tutorial: Anpassungstest

Tutorial: Anpassungstest Tutorial: Anpassungstest An einem Institut gibt es vier UniversitätslehrerInnen, die auch Diplomarbeiten betreuen. Natürlich erfordert die Betreuung einer Diplomarbeit einiges an Arbeit und Zeit und vom

Mehr

Kapitel 5: Einfaktorielle Varianzanalyse

Kapitel 5: Einfaktorielle Varianzanalyse Rasch, Friese, Hofmann & Naumann (006). Quantitative Methoden. Band (. Auflage). Heidelberg: Springer. Kapitel 5: Einfaktorielle Varianzanalyse Berechnen der Teststärke a priori bzw. Stichprobenumfangsplanung

Mehr

Bivariate Regressionsanalyse

Bivariate Regressionsanalyse Universität Bielefeld 15. März 2005 Kovarianz, Korrelation und Regression Kovarianz, Korrelation und Regression Ausgangspunkt ist folgende Datenmatrix: Variablen 1 2... NI 1 x 11 x 12... x 1k 2 x 21 x

Mehr

Geschlecht + Anfangsgehalt. T-Test für das Anfangsgehalt Gruppenstatistiken. Der SPSS Output der aktuellen Computerübung zum Aufgabenblatt 3

Geschlecht + Anfangsgehalt. T-Test für das Anfangsgehalt Gruppenstatistiken. Der SPSS Output der aktuellen Computerübung zum Aufgabenblatt 3 Der SPSS Output der aktuellen Computerübung zum Aufgabenblatt 3 Geschlecht + Anfangsgehalt 14000 399 403 7000 12000 335 Anfangsgehalt 10000 8000 6000 4000 2000 N = 28 63 185 291 227 52 215 158 88 284 193

Mehr

WS 2014/15. (d) Bestimmen Sie die Wahrscheinlichkeitsfunktion von X. (e) Bestimmen Sie nun den Erwartungswert und die Varianz von X.

WS 2014/15. (d) Bestimmen Sie die Wahrscheinlichkeitsfunktion von X. (e) Bestimmen Sie nun den Erwartungswert und die Varianz von X. Fragenkatalog zur Übung Methoden der empirischen Sozialforschung WS 2014/15 Hier finden Sie die denkbaren Fragen zum ersten Teil der Übung. Das bedeutet, dass Sie zu diesem Teil keine anderen Fragen im

Mehr

Statistik II Übung 1: Einfache lineare Regression

Statistik II Übung 1: Einfache lineare Regression Statistik II Übung 1: Einfache lineare Regression Diese Übung beschäftigt sich mit dem Zusammenhang zwischen dem Lohneinkommen von sozial benachteiligten Individuen (16-24 Jahre alt) und der Anzahl der

Mehr

1.8 Kolmogorov-Smirnov-Test auf Normalverteilung

1.8 Kolmogorov-Smirnov-Test auf Normalverteilung 1.8 Kolmogorov-Smirnov-Test auf Normalverteilung Der Kolmogorov-Smirnov-Test ist einer der klassischen Tests zum Überprüfen von Verteilungsvoraussetzungen. Der Test vergleicht die Abweichungen der empirischen

Mehr