Datenanalyse mit SPSS erste Schritte Arnd Florack Tel.: 0251 / 83-34788 E-Mail: florack@psy.uni-muenster.de Raum 2.001b Sprechstunde: Dienstags 15-16 Uhr 23. Mai 2000 aktualisiert am 25. Mai 2001
2 Anlegen einer Datendatei wichtige Variablen: VP-Nr. (Zahl links neben der ersten Spalte ersetzt diese nicht!) Bedingungen (jeder Bedingung eine einzelne Spalte zuweisen) z.b. Experte (1, 2), Stimmung (1, 2),... HINWEIS: nur Text eingeben, wenn es sich nicht vermeiden läßt Kategorien wie männlich / weiblich als 0 / 1 kodieren gleiches gilt für die Studienzugehörigkeit... Variablen definieren 1.) unter Fenster Dateneditor wählen 2.) im unteren Bildrand Variablenansicht anklicken 3.) Namen, Label, Werte, Wertelabel eingeben bei kontinuierlichen Variablen die Endpunkte eingeben ACHTUNG: Neue Eingaben jeweils durch Hinzufügen bestätigen Tipp: Es bietet sich an, Variablen eines gemeinsamen Konzeptes oder einer Skala mit dem gleichen Anfangsbuchstaben zu versehen, dann sind sie bei weiteren Analysen leicht zuzuordnen (z.b. bei mehreren Einschätzungsitems: ein_1, ein_2, ein_3,...). Zur Dateneingabe in die Datenansicht wechseln (unterer Bildrand)!
3 Nach Beenden der Eingabe: Die Suche nach Fehlern Betrachten der Häufigkeiten 1.) Analysieren, deskriptive Statistik, Häufigkeiten 2.) Variablen auswählen und in das Feld Variablen hineinschießen Man erhält so Angaben darüber, ob fehlende Werte oder nicht-definierte Werte vorhanden sind. Sind fehlerhafte Werte vorhanden, sind diese zu suchen und zu prüfen. Bearbeiten, Suchen
4 Abspeichern Abspeichern sollten Sie nicht nur nach der endgültigen Eingabe aller Daten, sondern auch immer wieder zwischendurch. Abstürze sind bei modernen PCs eher noch häufiger als bei den alten Geräten! So speichern Sie beim ersten Mal: Datei, Speichern unter Wählen Sie in der oberen Leiste, das Verzeichnis in das Sie abspeichern wollen. Speichern Sie niemals Dateien auf der höchsten Verzeichnisebene ab. Haben Sie noch kein entsprechendes Verzeichnis angelegt, dann klicken Sie in der Titelleiste den kleinen gelben Ordner mit dem Sternchen an. Um dem Neuen Ordner einen Namen zu geben, klicken Sie ihn mit kurzem Abstand zweimal an (nicht zweimal schnell!) und geben den Namen ein. Bestätigen Sie mit der RETURN-Taste. Wählen Sie nun durch zweimaliges schnelles Klicken den Ordner aus und geben unter Dateiname den Namen der Datei ein, die sie abspeichern möchten. Bestätigen Sie mit Speichern.
5 Speichern, wenn Dateiname und Verzeichnis schon vorhanden sind Wählen Sie einfach: Datei, Speichern Wenn Sie den Inhalt eines Ausgabe- oder Syntaxfensters abspeichern möchten, führen Sie dies in gleicher Weise durch. ACHTUNG: Beachten Sie, daß Sie im richtigen Fenster sind. Wenn Sie beispielsweise im Ausgabe-Fenster sind, dann wird nur die entsprechende Ausgabe-Datei abgespeichert. Außerdem ist es möglich, mehrere Ausgabe- und Syntaxfenster gleichzeitig zu öffnen (beim Datenfenster ist das nicht möglich). Beachten Sie auch hier, daß Sie immer im richtigen Fenster sind (der oberste Balken erscheint dann farbig).
6 Wenn alle Fehler bereinigt sind: Umkodierungen In vielen Erhebungen sollen Items zu Skalen zusammengefügt werden. Häufig sind jedoch die Items unterschiedlich gepolt, das heißt, hohe Werte entsprechen nicht immer einer positiven Ausprägung. Es bietet sich dann an, diese Items in eine einheitliche Polung zu bringen. Beispiel: Variable attr_3 (Skala von 1 bis 9; 1 = positiv, 9 = negativ) soll so gepolt werden, daß die 9 der positivsten Bewertung entspricht. 1.) Transformieren, Berechnen... Anmerkung: die Auswahl Transformieren steht nur im Datenfenster zur Verfügung (grrr: in alten SPSS-Versionen war diese unsinnige Einschränkung nicht vorhanden) 2.) neue Variable (Zielvariable) benennen (möglichst so, daß eine eindeutige Identifizierung möglich ist: alter Name + n (für negativ)...) 3.) folgende Formel eingeben: Zahl der Skalenpunkte + 1 alte Variable 4.) mit OK bestätigen (siehe nächste Seite für eine Alternative)
7 Alternative: 1.) Transformieren, Umkodieren, in andere Variable 2.) Benennen der neuen Variable (mit Ändern bestätigen) 3.) Eingabe der alten und neuen Werte 4.) jeweils Hinzufügen nicht vergessen und mit Weiter bestätigen WICHTIG Damit man später noch weiß, wie man die einzelnen Items umkodiert hat, bietet es sich (bei beiden Alternativen) an, nicht mit OK, sondern mit Einfügen zu bestätigen. Dann wird der Befehl jedoch nicht direkt ausgeführt, sondern in dem aktuellen Syntaxfenster abgedruckt (wenn noch kein Syntaxfenster geöffnet ist, dann wird geschieht dies automatisch).
8 Man kann nun mehrere Umkodierungen in das Syntaxfenster einfügen. Damit sie jedoch wirksam werden, muß man: 1.) den Text mit der Maus oder den Pfeiltasten markieren 2.) auf das Playzeichen T in der Symbolleiste klicken oder auf die rechte Maustaste klicken und Aktuellen Befehl ausführen wählen Die neuen Variablen müssen sich nun am Ende der Datendatei befinden. Zur Erinnerung: Um zwischen dem Datenfenster und dem Syntaxfenster zu wechseln, wählen Sie unter Fenster in der Kopfleiste das gewünschte Fenster oder wählen Sie in der untersten Fußleiste das Fenster aus. War der Befehl nicht erfolgreich, wird im Ausgabefenster eine Fehlermeldung angegeben. War der Befehl erfolgreich, sollten sie wiedereinmal abspeichern und zwar das Datenfenster wie auch das Syntaxfenster. Gehen sie dazu in die jeweiligen Fenster und speichern dort separat! Wählen sie für die Syntax einen passenden Namen (z.b. umkod_1) und speichern sie es im gleichen Verzeichnis wie die Datendatei ab. ACHTUNG: Wenn man nur ein Fenster speichert, werden die anderen Fenster nicht abgespeichert.
9 Bilden einer Skala aus mehreren Items a) Prüfen einer Skala auf Reliabilität Bevor mehrere Items zu einer Skala zusammengefaßt werden, sollte man diese auf Reliabilität prüfen: 1.) Analysieren, Skalieren, Reliabilitätsanalyse 2.) gewünschte Items in das rechte Feld schießen 3.) eventuell Item-Labels anzeigen anklicken 4.) Statistik anklicken 5.) unter deskriptive Statistiken für (oben rechts) Item, Skala und Skala wenn Item gelöscht anklicken 6.) mit Weiter bestätigen 7.) mit OK Analyse rechnen
10 Ausgabe Der Alpha Wert unten links ist der aussagekräftige Wert. <.60 Skala ist nicht reliabel und damit fragwürdig >.60 Reliabilität ok >.80 Reliabilität sehr gut Die Werte unter Alpha if Item Deleted geben an, wie der Alpha-Wert aussieht, wenn das entsprechende Item aus der Skala herausgenommen wird. Auf diese Weise läßt sich eine Skala mit hoher Reliabilität zusammenstellen. Eliminiert man jedoch mehrere Items, so ist eine neue Reliabilitätsanalyse zu berechnen.
11 b) Zusammenfügen von mehreren Items zu einer Skala 1.) Transformieren, Berechnen 2.) Unter Zielvariable gibt man den Namen der neugebildeten Variable ein (am besten mit einer einheitlichen Endung wie z.b. _g ). 3.) Unter Numerischer Ausdruck gibt man MEAN zur Bildung des Mittelwerts ein und fügt die einzelnen Items (aus der Liste links) durch Kommata abgetrennt in eine Klammer ein. Zusätzlich kann man nach MEAN noch.x anhängen, um zu bestimmen, wieviel gültige Werte bei einer Vpn mindestens vorhanden sein müssen, damit der Mittelwert gebildet werden kann. Gibt man bei vier Items beispielsweise.3 an, dann würde der Mittelwert auch berechnet werden, wenn ein Versuchsteilnehmer bei einem Item keine Angabe gemacht hat. 4.) Bestätigen mit OK. HINWEIS: Auch hier bietet es sich an, nicht mit OK, sondern mit Einfügen zu bestätigen und den Befehl in das Syntaxfenster einzufügen. So behält man später den Überblick über die vorgenommenen Änderungen.
12 Die erste Analyse Mittelwertsberechnungen Sind die Fehler der Dateneingabe behoben und die gewünschten Skalen gebildet, kann mit den weiteren Analysen begonnen werden. Zuvor sollten jedoch problematische Fälle (z.b. Fragebogen unvollständig bearbeitet, bei allen Fragen wurde der gleiche Wert angekreuzt, Vp war der dt. Sprache nicht mächtig) ausgeschlossen werden. Wichtig ist, daß nicht jeder Fall ausgeschlossen wird, der in irgendeiner Weise merkwürdig erscheint. Vielmehr sollten nur eindeutig problematische Fälle ausgeschlossen werden. So schließt man einen Fall aus: 1.) Auswahl des Datenfenster, (diese Möglichkeit ist nur hier gegeben) 2.) Daten, Fälle auswählen, 3.) Falls Bedingung zutrifft wählen: Falls... Auswahlvariable in das große weiße Feld einfügen (im Beispiel: vp_nr) das ~ = Zeichen aus der Schaltfläche auswählen Wert eingeben, der ausgeschlossen werden soll (im Beispiel: 13) 4.) mit Weiter und OK bestätigen Auch hier bietet es sich wieder an, im letzten Schritt statt OK Einfügen auszuwählen, um die Auswahl in einer Syntaxdatei zu speichern (Aktivierung nicht vergessen: Markieren, rechte Maustaste: Befehl ausführen). Bei späteren SPSS-Sitzungen kann man diese dann immer wieder aufrufen und aktivieren (Öffnen einer Syntaxdatei: Datei, Datei öffnen, Dateityp: Syntax(*.sps), Verzeichnis und Datei wählen).
13 Mittelwerte berechnen über die Tabellenfunktion In einem ersten Schritt bietet sich eine Prüfung der Manipulation an (z.b. Hat die Stimmungsinduktion gewirkt?). Wählen Sie dazu 1.) Analysieren, Tabellen, Einfache Tabellen 2.) Fügen Sie in das Feld Auswerten, die abhängige Variable ein (z.b. Skala mit der die Stimmung gemessen werden soll). 3.) Fügen Sie in das Feld Spalte, die unabhängige Variable ein (z.b. Stimmungsmanipulation). Haben Sie in das Feld Auswerten ein einzelnes Item eingefügt, bei dem nur ganzzahlige Werte vorkommen (1, 2, 3,...), dann müssen Sie noch das Feld Statistik auswählen, damit auch die Nachkommastellen der Mittelwerte angezeigt werden. Wählen Sie hier: Mittelwert, Feld Format: z.b. (ddd.dd), Dezimalstellen 2, Wählen Sie dann: Hinzufügen Möchten Sie wissen, wie viele Vpn den einzelnen Bedingungen zugeordnet wurden, können Sie unter Statistik außerdem Anzahl und dann Hinzufügen wählen. 4.) Bestätigen Sie mit Weiter und OK.
14 Im Ausgabefenster erscheint nun die gewünschte Tabelle: Um nun zu prüfen, ob sich die Mittelwerte in den Bedingungen signifikant unterscheiden, ist ein t-test notwendig: 1.) Analysieren, Mittelwerte vergleichen, T-Test bei unabhängigen Stichproben
15 2.) Geben Sie unter Testvariable(n) die abhängig Variable ein (zur Erinnerung: Variable mit der die Veränderungen gemessen werden sollen). Geben Sie unter Gruppenvariable die unabhängige Variable ein und klicken Sie den Button Gruppen def. und geben die Bedingungen ein, die sie zuvor bei der Dateneingabe definiert hatten (z.b. 1 für negative, 2 für positive Stimmung). 3.) Bestätigen Sie mit Weiter und OK.
16 Es öffnet sich das Ausgabefenster mit den Ergebnissen: Hier finden Sie zunächst noch einmal die Mittelwerte sowie einen Test auf Gleichheit der Varianzen. Anders als bei der üblichen Testung sollten beim Levene Test auf Gleichheit der Varianzen der F-Wert möglichst klein (am besten < 1) und der Signifikanz-Wert (Alpha-Fehler) möglichst groß (>.15) sein, da hier auf Gleichheit und nicht auf Unterschiede getestet wird. Ist der Signifikanz-Wert hoch, so kann im folgenden auf die erste Zeile, sonst aber auf die zweite Zeile bezug genommen werden. Wichtig sind hier drei Werte: T, df, Sign. (2-seitig) Dabei sollte die Signifikanz unter.05 liegen. Wird einseitig getestet, d.h. besteht eine gerichtete Hypothese, so kann dieser Wert noch einmal halbiert werden. Bei Manipulation-Checks ist dies immer der Fall (z.b. Stimmung in Bedingung 1 schlechter als in Bedingung 2). T und df benötigt man für die korrekte Angabe in einem späteren Bericht. Im vorliegenden Beispiel wäre die Stimmungsmanipulation erfolgreich gewesen. Man würde hier schreiben: t(67) = -7.10, p <.001.
17 Eine erste Inspektion der Hypothesen In einem weiteren Schritt kann man nun auch einen Blick auf die Mittelwerte in den einzelnen Teilgruppen werfen. Hierzu geht man wie folgt vor: 1.) Analysieren, Tabellen, Einfache Tabellen 2.) Unter Spalten kann man nun mehrere Bedingungen gleichzeitig angeben. Hat man nur eine abhängige Variable unter Auswerten angegeben, kann man eine Bedingung auch in die Zeile einfügen. Bei mehreren abhängigen Variablen wird dies aber unübersichtlich. 3.) Gegebenenfalls weitere Einstellungen vornehmen (siehe oben). Bestätigen mit OK.
18 Im Beispiel ist ein Interaktionseffekt zu erkennen. Bei guter Stimmung scheint die Manipulation des Experten einen stärkeren Effekt als bei schlechter Stimmung zu haben. Geprüft werden kann dieser Effekt nun mit einer Varianzanalyse. Wählen Sie dazu: 1.) Analysieren, Varianzanalyse, Univariat Sie gelangen dann zu folgendem Feld: 2.) Fügen Sie im entsprechenden Feld die abhängige Variable (z.b. das Einstellungsmaß auf dem ein Unterschied festgestellt werden soll) und unter Feste Faktoren die unabhängigen Variablen (die Versuchsbedingungen: z.b. Experte Laie; gute schlechte Stimmung) ein. 3.) Bestätigen Sie mit OK.
19 Im Ausgabefenster finden Sie nun Angaben zu den Häufigkeiten in den Versuchsbedingungen und die Tests der Zwischensubjekteffekte. Die Tests der Zwischensubjekteffekt sind für Sie von Bedeutung. Schauen Sie hier vor allem in die letzte Spalte. Dort finden Sie die Angaben zur Signifikanz. Werte unter.05 bezeichnen wir als signifikant. Im Beispiel ergibt sich unter Berücksichtigung der Mittelwerte folgendes: 1.) Der Haupteffekt der Stimmung ist nicht signifikant, F(1,65) =.11, ns. Das heißt, die Hypothese, daß gut gestimmte Personen immer zu positiveren Einstellungen kommen als schlecht gestimmte kann nicht beibehalten werden. 2.) Der Haupteffekt der Experte-Laie Manipulation ist signifikant, F(1,65) = 10.51, p <.01. Unabhängig von der Stimmung resultiert eher eine positivere Einstellung, wenn die Meinung eines Experten als wenn die Meinung eines Laien gehört wurde. 3.) Die Interaktion Stimmung x Experte-Laie ist signifikant, F(1,65) = 4.28, p <.05. Der Effekt des Experten vs. Laien ist bei positiver Stimmung stärker als bei negativer Stimmung. Anmerkung: Hinter F gibt man in Klammern an: Freiheitsgrad des Effekts, Freiheitsgrad Fehler. p bezeichnet die Grenze des Signifikanzniveaus, die unterschritten wurde.