Fachhochschule Nürtingen Studiengang Volkswirtschaftslehre Einführung in SPSS (Version 9.0 1 ) Sommersemester 2003 Dr. Lorenz Braun 1 Diese Einführung basiert auf der SPSS-Basisversion mit dem Zusatzmodul Regression
SPSS-PC-ÜBUNG Seite 2 A. Einführung in SPSS Name: Version: ursprünglich: Statistical Package for the Social Science heute: Superior Performance Software Systems SPSS 9.0 für Windows 1. Vorgehen einer Analyse 1. Dateneingabe 1.1 Vorhandene Datei Öffnen DATEI / ÖFFNEN 1.2 Daten importieren DATEI / DATENBANKZUGRIFF / NEUE ABFRAGE... 1.3 Daten ("von Hand") eingeben DATEI / NEU / DATEN DATEN / VARIABLE DEFINIEREN 2. Datenbearbeitung, Modifikation (z.b. Sortieren) Dateneingabe DATEN / FÄLLE SORTIEREN 3. Tabellen, Kennzahlen ermitteln ANALYSIEREN / DESKRIPTIVE STATISTIKEN / HÄUFIGKEITEN... 4. Statistische Analyse ANALYSIEREN / REGRESSION / LINEAR... 5. Grafiken erstellen GRAFIKEN / BALKEN... / EINFACH 6. Daten, Ergebnisse speichern DATEI / SPEICHERN UNTER... 7. Interpretation ("von Hand") 2. Fenster Daten-Editor Viewer Diagramm-Editor Zeigt die Daten der Arbeitsdatei an. Er spiegelt die grundlegende Struktur einer Datendatei wieder. Anzeige der Ergebnisse von Berechnungen. (Wird automatisch geöffnet) Bietet eine Bearbeitungsmöglichkeit der Grafiken im Viewer. Jedes Fenster besitzt eine Menüleiste und eine Symbolleiste. Symbolleisten können an jeden beliebigen Ort verschoben werden. Wechseln zwischen den aktiven Fenstern über Menüleiste: FENSTER.
SPSS-PC-ÜBUNG Seite 3 3. Daten-Editor Spalte: Variablen, die beobachtet werden (z.b. Schulnote in Deutsch) Zeile: einzelne Beobachtungen, die gemacht werden (z.b. Schüler Nr. 12) Unter ANSICHT können Schriftarten und Symbolleisten eingestellt werden. Hier wird auch festgelegt, ob Gitterlinien bzw. Wertelabels angezeigt werden sollen. Definieren von Variablen: Entweder auf Spaltenkopf doppelklicken oder DATEN / VARIABLE DEFINIEREN... 1. Variablenname eingeben (nicht länger als 8 Zeichen!) 2. TYP... Variablentyp festlegen Es gibt verschiedene Datentypen: numerisch, Datum, Strings und weitere Sonderformate. Bei numerischen Variablen kann das Dezimaltrennzeichen entweder ein Punkt oder ein Komma sein. Die Art des Dezimaltrennzeichens ist abhängig von der Ländereinstellung in der Windows- Systemsteuerung. Ist das Dezimaltrennzeichen ein Punkt, so kann man auch den Variablentyp Punkt wählen, um ein Komma als Tennzeichen zu erhalten (incl. 1000-er Trennzeichen als Punkt). Der Wert der Breite entspricht der Gesamtbreite. Die Vorkommastellen berechn en sich bei Dezimalzahlen nach der Formel: Vorkommastellen = Breite Dezimalstellen 1! 3. LABELS... Es könen Variablen oder Variablenwerte beschrieben werden. (Achtung: ANSICHT / WERTELABELS aktivieren!) Unter Variablenlabel kann man der Variable einen längeren (meist auch schöneren) Namen geben. Dieser Name wird auch bei der Datenausgabe (Tabellen, Grafiken) verwendet! Groß- und Kleinschreibung wird beachtet. Unter Wertelabels kann man einzelnen Variablenwerten (z.b. 1) eine Beschreibung zuordnen (z.b. sehr gut ). Befindet man sich im Daten Editor, so kann man bei einer Variablen mit Wertelabels mit der rechten Maustaste unter LABELS... eine Liste der einzelnen Wertelabels aufrufen. 4. FEHLENDE WERTE... Liegen in bestimmten Fällten bei Variablen keine Antwortvorgaben vor (z.b. bei Geschlecht), so kann man diese Werte (z.b. 0) als fehlende Werte deklarieren. Dies kann für mache Analysen notwendig sein, da es sonst zu Verzerrungen kommen kann. 5. SPALTENFORMAT... Hier legt man Spaltenbreite und Textausrichtung fest. Wenn man einen Variablentyp öfter benötigt, ist es sinnvoll für diese Variable eine Formatvorlage zu erstellen (z.b. logische Variable JA / NEIN (0 / 1)). Solche Formatvorlagen können auch auf bereits existierende Variablen angewendet werden. Man kann dabei auswählen, ob man nur den Typ oder auch die Wertelabels etc. übernehmen möchte.
SPSS-PC-ÜBUNG Seite 4 Einen Zeitbezug kann SPSS selbst erstellen, und muß somit nicht aufwendig eingegeben werden. Unter DATEN / DATUM DEFINIEREN... kann man z.b. angeben, daß die Daten fortlaufenden Minuten entsprechen. Wird z.b. das Quadrat einer Variablen benötigt, so macht man das über TRANSFORMIEREN / BERECHNEN.... Hierbei wird eine neue Variable erstellt. Möchte man auf irgendeine Weise fehlende Werte ersetzen (z.b. durch den Mittelwert der beiden Nachbarpunkte), so macht man dies über TRANSFORMIEREN / FEHLENDE WERTE ERSETZEN.... Veränderungen im Daten-Editor müssen abgespeichert werden. Nach einer Veränderung werden die Berechnungen und Diagramme nicht automatisch angepaßt! Eine neue Berechnung ist dann erforderlich. 4. Viewer Der Aufbau und die Arbeitsweise ähnelt dem Windows-Explorer. Links ist die Ausgabestruktur sichtbar und rechts stehen die Ergebnisse der Berechnungen. Ausschneiden, Kopieren, Löschen und Einfügen funktioniert wie in Microsoft Office und kann auch teilweise programmübergreifend angewendet werden. Darstellung der Tabellen verändern: Tabelle per Doppelklick anklicken. Bearbeitung: FORMAT / TABELLENEIGENSCHAFTEN... Fertige Formate finden sich unter: FORMAT / TABELLENANSICHTEN... Grafiken bearbeiten: Grafik per Doppelklick anklicken. Es öffnet sich automatisch der Diagramm-Editor, mit dem die Grafik nun bearbeitet werden kann. 5. Diagramm-Editor Einzelne Werte (z. B. Ausreißer eines Streudiagramms) können über Anklicken des Symbols "Punkt identifizieren" und anschließendes Anklicken des Wertes identifiziert werden. Die entsprechende Zeile wird im Daten-Editor markiert, zu welchem man durch das Symbol "Gehe zu Daten" gelangt. 6. SPSS-Systemeinstellungen Die SPSS-Systemeinstellungen finden sich unter BEARBEITEN / OPTIONEN.... Veränderungen sind hier mit Vorsicht vorzunehmen! 7. Deskriptive Statistik [schüler.sav]
SPSS-PC-ÜBUNG Seite 5 SPSS unterstützt das Suchen von Zusammenhängen und das Überprüfen von Hypothesen. Mit Hilfe von Häufigkeits- und Kreuztabellen ( ANALYSIEREN / BERICHTE / FÄLLE ZUSAMMENFASSEN...) sowie grafischen Darstellungen wie Streudiagrammen und Histogrammen ( GRAFIKEN) läßt sich ein erster Überblick über das Datenmaterial recht schnell gewinnen. Achtung! Der Computer berechnet alles, die Sinnhaftigkeit muß selbst überprüft werden! Insbesondere ist auf das Vorliegen einer Stichprobe oder einer Vollerhebung zu achten. Dabei werden die Beobachtungen verschieden gemessen. Es gibt dichotom, nominal, ordinalskalierte Variablen, sowie Intervall- und Ratioskalen. Häufigkeitstabellen geben einen Überblick über die Anzahl der verschiedenen Ausprägungen einer Variabeln (ANALYSIEREN / DESKRIPTIVE STATISTIKEN / HÄUFIGKEITEN...). Unter STATISTIK... kann man u.a. die Berechnung von Mittelwerten, Quartilen und Streuungen veranlassen. Unter DIAGRAMME... kann man eine zusätzliche Ausgabe der Werte z.b. als Balkendiagramm einstellen. Kreuztabellen eignen sich besonders zur Analyse von Zusammenhängen zwischen zwei Variablen (ANALYSIEREN / DESRIPTIVE STATISTIK / KREUZTABELLEN...). Dabei kann man mehrere Variablen für Zeilen und für Spalten eingeben. SPSS berechnet z.b. bei zwei Zeilen- und drei Spaltenvariablen 2 3 = 6 Kreuztabellen. Im dritten Varieblenfeld kann man eine Variable eingeben, nach der die Kreuztabelle aufgeteilt werden soll. Unter ZELLE... kann man angebe, ob man zusätzlich erwartete Häufigkeiten berechnen lassen möchte (Aufteilung der Zeilensumme im Verhältnis der Spaltensumme). Hier kann man auch einstellen, daß man Prozentwerte als Ergebnis erhalten möchte. 8. Grafik Grafiken zeigen einfache Zusammenhänge und erläutern Zahlen. Unter GRAFIKEN / GALERIE kann man sich einen schnellen Überblick über die verschiedenen Darstellungsweisen verschaffen. Unter GRAFIKEN / INTERAKTIV erhält man eine Unterstützung bei der Ersellung einer Grafik. Es gibt u. a. folgende Darstellungsweisen: BALKEN: LINIE: FLÄCHE: KREIS... BOXPLOT: EINFACH, GRUPPIERT, GESTAPELT EINFACH, MEHRFACH, VERBUNDLINIE EINFACH, GESTAPELT EINFACH, GRUPPIERT
SPSS-PC-ÜBUNG Seite 6 Extremum Quartil Median Quartil Extremum Ausreißer Streudiagramm: EINFACH.ÜBERLAGERT, MATRIX, 3D 9.) Übungsaufgabe: Kurzer Strassenverkehrsunfallbericht Eine nichtrepräsentative Befragung ergab folgende Daten [unfälle.sav]: Geschlech t des Fahrers Alter des Fahrers Fahrer fühlt sich schuldig Fahrer fuhr mit Hut Unfallnummer Fahrzeughersteller Fahrzeugalter Alkoholspiegel Fahrer fuhr zu schnell 1 w 20 VW 10 sehr n 0,0 n 2 w 65 VW 1 sehr j 0,0 n 3 m 19 BMW 10 überhaupt nicht n 0,4 j 4 w 70 BMW 2 etwas n 0,0 j 5 w 25 Opel 9 sehr n 0,1 j 6 m 70 Mercedes 2 überhaupt nicht j 0,2 n 7 m 40 Opel 5 etwas n 0,8 n 8 w 50 Mercedes 3 zur Hälfte j 0,0 n 9 w 18 VW 4 etwas n 0,0 n 10 m 68 Mercedes 18 zur Hälfte j 0,0 j 11 w 47 Porsche 3 sehr n 0,2 n 12 m 29 Porsche 5 etwas n 0,0 j 13 m 19 BMW 12 sehr j 1,4 j 14 w 34 Opel 3 sehr n 1,7 j 15 w 56 Mercedes 1 zur Hälfte j 0,2 n 16 w 42 Opel 4 sehr n 0,0 j 17 m 23 BMW 9 etwas n 0,0 j 18 w 21 Porsche 3 zur Hälfte n 0,0 j 19 m 27 Opel 15 überhaupt nicht n 0,0 n 20 w 31 Opel 5 etwas n 0,1 j 21 w 19 VW 8 sehr n 0,0 n 22 w 67 VW 2 zur Hälfte j 0,0 j 23 m 89 VW 3 überhaupt nicht j 0,0 n Kurze Beschreibung der Variablen: Fahrer fühlt sich schuldig: 1 = "überhaupt nicht" 2 = "etwas" 3 = "zur Hälfte" 4 = "sehr" Fragen dazu:
SPSS-PC-ÜBUNG Seite 7 a) Wieviel Prozent der Fahrer fuhren zu schnell? b) Wieviel Prozent der Männer verunfallten in einem BMW? c) Stellen Sie in einem Kreisdiagramm die Anteile der Fahrzeughersteller dar! d) Wie hoch ist der durchschnittliche Alkoholspiegel? e) Tragen eher jüngere oder ältere Fahrer einen Hut? Stellen Sie den Zusammenhang graphisch dar! f) Untersuchen Sie die Variable "Fahrer fühlt sich schuldig" im Bezug auf das Geschlecht! g) Besteht ein Zusammenhang zwischen "Fahrzeugalter" und "Alter des Fahrers"?
SPSS-PC-ÜBUNG Seite 8 Zur Beantwortung der Fragen bieten sich folgende Prozeduren an: a) ANALYSIEREN / DESKRIPTIVE STATISTIKEN / HÄUFIGKEITEN... Als Variable schnell auswählen OK b) ANALYSIEREN / DESKRIPTIVE STATISTIKEN / KREUZTABELLEN... Als Zeile geschlecht und als Spalte fahrzeug auswählen Zellen... Prozentwerte zeilenweise auswählen Weiter OK Eine weitere Möglichkeit ist über DATEN / DATEI AUFTEILEN... Ausgabe nach Gruppen aufteilen Als Variable geschl auswählen Datei nach Gruppenvariablen sortieren OK Punkt a) nochmals mit Variable "fahrzeug" ausführen Das Zurücksetzen nicht vergessen: DATEN / DATEI AUFTEILEN... Zurücksetzen OK c) GRAFIKEN / KREIS... Auswertung über Kategorien einer Variablen Definieren Als Segmentvariable fahrzeug auswählen OK Im Ausgabe-Navigator Kreis doppelklicken Im Diagramm-Editor auf Segmentbeschriftung doppelklicken Beschriftung: Prozente OK d) ANALYSIEREN / DESKRIPTIVE STATISTIKEN / HÄUFIGKEITEN... Als Variable alkohol auswählen Statistik Lagemaße: Mittelwert Weiter OK e) GRAFIKEN / BOXPLOT... Einfach Definieren Als Variable "p_alter" auswählen Als Kategorienachse "hut" auswählen OK f) GRAFIKEN / BALKEN... Gruppiert Definieren Als Kategorienachse "schuldig" auswählen Gruppen definieren durch: "geschl" OK Im Diagramm-Editor kann man unter Format / Balkenart... einen 3D-Effekt der Balkendarstellung einstellen. g) GRAFIKEN / STREUDIAGRAMM... Einfach Definieren Als X-Achse "p_alter" auswählen Als Y-Achse "f_alter" auswählen OK