Das Erstellen einer Datenmaske

Ähnliche Dokumente
Kurzanleitung für SPSS Statistics 22

Datenmaske für SPSS. Für die Datenanalyse mit SPSS können die Daten auf verschiedene Weise aufbereitet

Einführung in SPSS Wintersemester 2000/2001

Einführung in SPSS. Sitzung 2: Datenbereinigung und Datenmanagement. Knut Wenzig. 4. Dezember 2006

Variablen und Codes eines MAXQDAProjekts analysieren

Mit externen Dateien im SPSS- oder Excel-Format arbeiten

Von SAS nach SPSS und umgekehrt


Einführung in SPSS. Sitzung 2: Datenbereinigung und Datenmanagement. Knut Wenzig. 15. Dezember 2005

Statistik-Programme. Inhalt. 1.1 Kleine Einführung in R Installieren und Starten von R

Basis-Kurs Statistik und SPSS für Mediziner Lösungen. SPSS-Übung Dateneingabe und -aufbereitung

3. Bestehende Dateien

1 Excel Schulung Andreas Todt

Einführung in SPSS für Windows

Einführung in SPSS. Sitzung 2: Datenbereinigung und Datenmanagement. Knut Wenzig. 9. Dezember 2004

Handbuch zum VivaWeb-Serienbrief-Programm

Sozialwissenschaftliche Fakultät der Universität Göttingen. Sommersemester 2009, Statistik mit SPSS

Microsoft Access Arbeiten mit Tabellen. Anja Aue

5 Einfache Datentransformationen

Aufbau des Minitab-Bildschirms. TQU-Schulungsunterlagen. TQU-Akademie 1. Einführung Minitab

Variablen in MATLAB. Unterschiede zur Mathematik: Symbolisches und numerisches Rechnen. Skriptdateien. for-schleifen.

Daten transformieren

Dateneingabe und Transformation Übersicht

ABA-Navi-Tool 002. Bedienungsanleitung

ILTIS-PLS. DataExport. IST Engineering AG

4. Datumsvariablen u.a.m

Unterlagen zu: Das Datenanalysesystem SAS SS 2000

Anleitung zum Gebrauch des Online-Mietvertrages

Anleitung zum Download der EBMG_Datei_9_2.xls

Inhaltsverzeichnis HÄUFIGKEITSTABELLEN... 1

Erste Schritte in etab

Die Variablenliste in MAXQDA Stats

Erzeugen benutzerdefinierter Buchstabenlisten in EXCEL

Fragenbogenerstellung mittels CSV-Datei 1

Im ersten Schritt müssen die Daten in die Datenansicht eingelesen werden.

Excel 2010 Werte aus einer Liste wählen

Spezifikationen für die Nutzung der Webanwendung (inkl. CSV/TXT-Datei) für Antragsteller von SSR-Nummern

Einstieg in SPSS. Man kann auch für jede Ausprägung einer Variablen ein Wertelabel vergeben.

Wettspiele auswerten

Excel-Daten/ CSV-Import

Import und Export von Veranstaltungen

Dokumentversion 1. Import von CSV-Files. Leitfaden. evergabe. Version 4.9

Statistische Erhebung (jahrgangsweise Erfassung)

5 Tabellenanpassung. 5.1 Spaltenbreite und Zeilenhöhe Spaltenbreite verändern

Datenexport aus DaNiS nach Excel

4) Um die Zellen eindeutig benennen zu können, erhält jede Spalte einen Buchstaben (A, B, C, D )

Python 3.6. Erste Schritte auf dem Mac. Syshack. 22. Juni 2017 Version 2.0. Python Erste Schritte auf dem Mac Syshack, 22.

Wir fragen um! 26. Gebrauchsanweisung: Szenario Abkürzung. 1. Du hast eine Umfrage gemacht, die Fragen und Antworten liegen neben dir bereit.

Aufgaben zu Kapitel 1

Powermail Formularbaukasten

In diesem Newsletter möchte ich Ihnen die Verwendung von Namen näher bringen.

Aufgaben zu Kapitel 1

Hilfe zum PDF Formular Editor

14. Es ist alles Ansichtssache

:44 1/8 Fachwahl

32 Verschiedenes Datendatei-Informationen, Codebuch. Fortsetzung der Seiten in der 8. Auflage

I.3. Computergestützte Methoden 1. Deskriptive Statistik. Master of Science Prof. Dr. G. H. Franke WS 2009/ 2010

Modell Bahn Verwaltung. Tutorial. Links. Min. Programm Version 0.65, März w w w. r f n e t. c h 1 / 11

Der Serienbrief bzw. Seriendruck

Zugriff auf die swhv-mitgliederverwaltung

ABA-Navi-Tool 002. Inbetriebnahme. Danach Datei öffnen, es erscheint die Startseite.

Bildungsstatistik Solothurn Anleitung Datenlieferung

Anleitung zum Erstellen einer CSV-Datei für den Import (Ausfüllanleitung zum Erfassungsbeleg)

MUNIA Bedienungsanleitung

Stopp-Listen. Die Funktion von Stopp-Listen. Das Fenster zur Verwaltung der Stopp-Listen

Access 2010 Programmierung Import und Export nach Excel

Anleitung zur Erstellung eines Serienbriefes

Handbuch für Redakteure

Ressourcenpool. Anleitungen für Merlin Project ProjectWizards GmbH

1. STICHPROBE FRAGEBOGEN DATENMATRIX

-Abwesenheitsnachricht einrichten

Hinweise zum Programm Überprüfung des Betriebszustandes von Kläranlagen. Bitte prüfen Sie regelmäßig den aktuellen Stand der Software im Internet!

registra Schnittstelle

Datenüberprüfung. Excel Aufbau ZID/Dagmar Serb V.02/Okt. 2015

Bungert. Dealer Management System. Inventur

14 Zusatzmodul: Zeiterfassung

Inventarimporter für Inventarisierung. Version 4.11 Stand: Februar 2013

GESTALTUNGSHELFER. Tipp zur Formatierung der Überschrift Die Überschrift erster Ebene soll immer auf einer neuen Seite angezeigt werden:

FASTPLOT 2 BEDIENUNGSANLEITUNG. diazzo ag lichtpausatelier Pelikanweg Basel Tel

Transkript:

Das Erstellen einer Datenmaske Seminar Forschungsmethoden I, Herbstsemester 2014 P.Wilhelm 1. Programme zum Einlesen von Daten Daten können direkt in eine SPSS-Daten-Datei eingegeben werden (vgl. 5). Sie können aber auch in einem anderen Programm (Excel, Access, WORD-Tabelle, etc.) eingegeben und danach ins SPSS übertragen werden (vgl. 4.). 2. Kodierung Bei der Kodierung werden Antworten im Fragebogen (Kreuze, Wörter) in Antwortkategorien übersetzt und durch Codes (Zahlen oder Buchstabenfolgen) abgebildet, die von einem Statistikprogramm ausgewertet werden können. Die Antwortkategorien werden bei der Erstellung des Fragebogens festgelegt. Häufig ist es sinnvoll auf dem Fragebogen schon die Codes mit anzugeben, um dadurch spätere Kodierfehler zu vermeiden. 3. Variablen 3.1 Typen von Variablen Um die in einem Fragebogen enthaltene Information in eine Datendatei zu übertragen, wird für jede Informationseinheit eine Variable erstellt. Dabei lassen sich verschiedene Typen von Variablen unterscheiden. 1. Metrische Variablen (z.b. Alter) Die Zahl kann direkt so, wie sie im Fragebogen steht in den Datensatz übernommen werden 2. Rangvariablen: (z.b. Werte einer Ratingskala: fast immer =1, oft = 2, manchmal = 3, fast nie = 4) Den verbalen Ankern sind meist im Fragebogen schon Zahlenwerte zugeordnet, die dann in die Datei übernommen werden. Ob Daten, die mit Hilfe von Ratingskalen gewonnen wurden, Ordinal- oder Intervallskalenniveau haben, darüber gibt es unterschiedliche Auffassungen. Sehr häufig werden sie jedoch auf Intervallskalenniveau ausgewertet. 3. Kategoriale Variablen (z.b. Geschlecht: männlich = 1, weiblich = 2) Eine Kodierregel wird festgelegt, die angibt welche Bedeutung ein bestimmter Zahlenwert hat. 4. String Variablen: (Antwort in einer offen Kategorie oder Restkategorie, z.b. Studienfach oder andere Religion) Die Variable erfaßt die Antwort auf eine offene Frage. Hier wird direkt eingetragen, was der Untersuchungsteilnehmer geschrieben hat. 1

3.2 Variablennamen Damit das SPSS die Variablennamen lesen kann, müssen bestimmte Bedingungen erfüllte sein: Jeder Variablenname darf nur einmal verwendet werden. Name darf maximal 8 Zeichen lang sein (für SPSS 12.0 gilt diese Einschränkung nicht mehr). Name muß mit Buchstaben beginnen. Umlaute (ä,ö,ü) sowie besondere Buchstaben wie z.b. ß sind nicht erlaubt. Am Ende kein Punkt (.) Befehlszeichen können nicht verwendet werden: z.b. - : * / +, SPSS-Befehlsworte dürfen nicht als Variablennamen verwendet werden: all, and, by, eq, ge, gt, le, lt, ne, not, or, to, with 3.3 Variablenformate im SPSS Numerisch: Variablen enthalten ausschließlich Zahlen. Alle SPSS-Operationen können ausgeführt werden. String: Variablen enthalten Zeichen. Auch Zahlen werden wie Zeichen behandelt. -> Nur eingeschränkte Operationen sind möglich Datum: Unterschiedliche Datums- bzw. Zeitdefinitionen sind möglich. Datumsvariablen können in numerische Variablen überführt werden. Da die meisten Operationen im SPSS nummerische Variablen voraussetzen, ist es sinnvoll auch kategoriale Variablen numerisch zu kodieren und so weit wie möglich auf String-Variablen zu verzichten. Es gibt keine gemischten Formate!!!: Ist das Variablenformat numerisch werden nur Zahlen akzeptiert, String-Information wird automatisch zu Missing-Value umkodiert. 2

4. Erstellen einer Datenmaske in Excel Gegenüber der direkten Kodierung der Daten im SPSS hat die Eingabe mit Hilfe von Excel vier entscheidende Vorteile: Excel ist fast auf allen Rechnern als Standardprogramm vorhanden Man kann Spalten und Zeilen, die Kodierinformation enthalten, fixieren, was die Navigation erheblich erleichtert. Man kann optische Marker setzen (z.b. Spalten farbig markieren) Man kann definieren, welche Werte als gültig betrachtet werden (Eingabekontrolle). Eingaben, die nicht dieser Definition entsprechen werden nicht akzeptiert. 4.1 Erstellen der Datenmaske Pro Variable wird eine Spalte definiert Die erste Zeile enthält die Variablennamen (Beachte Regeln für die Vergabe von Namen, vgl. 3.2) In die nachfolgenden Zeilen kann weitere Information zu den Variablen geschrieben werden z.b. genauere Bezeichnung der Variablen, Kodierungsregel. Abbildung 1 : Auszug aus einer Excel Datenmaske (1. Zeile Variablennamen, 3. und 4. Zeile Erläuterungen zu den Variablen, 5. Zeile Kodierregel, die weiteren Zeilen enthalten die Daten) 4.2 Optionen zur Gestaltung der Datenmaske Mit dem Befehl WINDOW -> SPLIT kann die Anzeige so gestaltet werden, daß definierte Zeilen bzw. Spalten immer sichtbar bleiben. Dazu kann man die angezeigten Linien mit dem Kursor an die gewünschte Position fahren. Mit dem Befehl WINDOW -> FREEZE PANES wird diese Position dann fixiert. Wichtig ist diese Operation, um die Übersicht zu behalten, welche Variable, von welcher Versuchsperson man gerade kodiert. Des Weiteren kann man ganze Spalten oder einzelne Zellen farbig markieren, was die Orientierung bei der Dateneingabe erheblich erleichtert. Diese Gestaltungsmöglichkeiten des Fensters bestehen im SPSS nicht. 3

4.3 Bei der Eingabe der Daten zu beachten Definieren wie fehlende Werte kodiert werden sollen (Felder ganz frei lassen oder Wert kodieren der in der Variablen nicht vorkommen kann, z.b. 999) Darauf achten, daß numerische Variablen keine String-Information enthalten. Da die Dateneingabe eine relativ monotone Tätigkeit ist, die bald automatisiert wird und eine Art Trance erzeugt, sollte man beim Kodieren nicht denken müssen. Die Kodierregeln sollten dies berücksichtigen. D.h. die Information sollte so in die Datei übernommen werden, wie sie im Fragebogen erhoben ist. Weitere Umgestaltungen, Veränderungen der Variablen sollten dann im SPSS erfolgen. 4.4. Datenkontrolle bei der Eingabe: Definition von gültigen Werten Der Bereich der gültigen Werte kann vordefiniert werden. Excel akzeptiert dann nur Daten, die im definierten Wertebreich liegen und gibt bei allen anderen Werten eine Fehlermeldung. DATA -> VALIDITION ->. Auswahloption, zur Definition des Wertebereichs. 4.5 Vorbereitung für Transfer nach SPSS Vor dem Transfer beachten!!! 1. Neuere SPSS Versionen (> 11) ordnen beim Einlesen automatisch das Variablenformat auf der Basis der Information zu, die in der Spalte enthalten sind. Findet SPSS Textzeichen in der Spalte, erhält die Variable Stringformat. Findet SPSS ausschliesslich Zahlen, erhält die Variable numerisches Format. Findet SPSS ein Datum, erhält die Variable Datumsformat, wenn kein Text in der Spalte steht. 2. Die Zusatzinformation, die das kodieren erleichtert hat, muß wieder gelöscht werden. In der ersten Zeile stehen die Variablennamen, in der zweiten Zeile müssen bereits die gültigen kodierten Werte enthalten sein. 3. Für ältere SPSS-Versionenen (Ausgabe < 10) ist zu beachten, dass die Excel-Datei im Format Microsoft Excel 4.0 Worksheet (bzw. Tabelle) abgespeichert wird. Befehlsfolge: FILE -> SAVE AS -> Im erscheinenden Menue Name der Datei und Laufwerk angeben sowie im unteren Balken Save File as Type Microsoft Excel Worksheet 4.0 anklicken. 4.6 Import der Excel-Datei ins SPSS. Eine Excel Datei kann man einlesen in dem man DATEI -> OEFFNEN -> DATEN anklickt. Im erscheinenden Dialogfenster wählt man dann bei Dateityp *.xls aus. Es erscheint dann ein Menüfenster, in dem angezeigt wird, welche Tabelle eingelesen werden soll (z.b. Tabelle 1 (A1:IV78) ) Wenn die Datentabelle einen Namen hat wird dieser Name angezeigt. WICHTIG!!!: Bei Optionen Variablennamen lesen ankreuzen. 4

SPSS transferiert dann automatisch die Excel-Datei in eine SPSS-Datei und übernimmt die Variablennnamen. Der SPSS Befehl zum Einlesen einer Excel Datei lautet: GET TRANSLATE /FILE Laufwerk:/Pfad/Dateiname.xls /TYPE xls /FIELDNAMES. 5. Erstellen einer Datenmaske im SPSS für Windows Ab Version SPSS 11 öffnet sich automatisch beim Start ein Menü, das u.a. die Option Type in data enthält, mit der eine neue Datendatei erstellt werden kann. In dieses Fenster kann man auch später jederzeit vom aktiven Datenfenster aus wechseln: Das Datenfenster hat nämlich zwei Anzeigeoptionen: Entweder es werden die Daten angezeigt (Data View), oder es wird angezeigt, wie die Variablen definiert sind (Variable View). Die Schaltfläche ist unten links im Fenster. Wenn man ein leeres Datenfenster hat, wird in der Variable View-Option eine leere Tabelle angezeigt, die vorgegebene Spalten enthält. Sobald man in die erste mit Name betitelte Spalte einen Variablennamen eingibt (z.b. Code) werden automatisch die übrigen Spalten aktiviert. Die automatischen Voreinstellungen kann man dann entsprechend verändern. Abbildung 2 zeigt ein Beispiel für ein Datenfenster im Variable View Modus, in dem bereits die Variablen definiert sind: Abbildung 2: SPSS-Datenfenster im Variable View Modus 5

Die Spalteninformation hat die folgende Bedeutung Name: Variablenname, hier werden die Variablennamen vergeben. Dabei sind die unter 3.2 spezifizierten Regeln zu beachten (z.b. maximal 8 Zeichen, u.a.) Typ: Hier wird definiert, ob die Spalte eine numerische Variable, eine Datumsvarbiable oder Stringvariable enthält (oder andere Variablentypen) Spaltenformat: Hier wird die Breite der Spalte definiert Dezimalstellen: Hier wird definiert, wie viele Dezimalstellen eine Variable hat Variablenlabels: Information zur Variablen (was bedeutet die Variable: z.b. Oekzufr = Zufriedenheit mit der finanziellen Situation) Wertelabels: Information was die Zahlenwerte einer Variablen bedeuten (z.b. 1 = männlich, 2 = weiblich) Fehlende Werte: Hier können bestimmte Zahlen als Missing definiert werden Spalten: Hier wird definiert wie breit die angezeigte Spalte ist Ausrichtung: Messniveau: Rolle: Ausrichtung der Information Das Skalenniveau wird definiert: Scale = Intervallskalenniveau, wird automatisch vergeben, wenn die Variable numerisch ist und keine Value Labels definiert sind. Ordinal = Ordinalskalenniveau, wird automatisch vergeben, wenn die Variable numerisch ist und Value Labels definiert sind. Nominal = wird automatisch vergeben, wenn es sich um eine String Variable handelt. Rolle, die Variable in der Analyse spielen soll, kann hier vordefiniert werden. Die Option Variable View ermöglicht es, den Überblick über die oft große Zahl von Variablen zu behalten. Veränderungen in der Voreinstellung können direkt im Fenster vorgenommen werden. Mit dem Abspeichern werden die entsprechenden Formatdefinitionen in die Datei übernommen. Definition der Variablennamen und Labelels über die SPSS - Syntax Man kann die Variablen auch über die Syntaxebene definieren (Befehlsfenster, in dem man SPSS Befehle schreiben und auch abspeichern kann). Da man auf der Syntaxebene den Texteditor benutzen kann, ist die Bearbeitung von längeren Dateien, die ähnliche Labels haben oft schneller. Ein grosser Vorteil besteht auch darin, dass die Variablendefinition unabhängig von der Datendatei abgelegt ist, d.h. man kann die Syntax auch über andere Dateien laufen lassen. Dies ist insbesondere dann, wenn ähnliche Datensätze erhoben und getrennt aufbereitet werden, ein grosse Zeitersparnis. 6

Die Befehlsstruktur für die Vergabe von Variable Labels und Value Labels sieht folgendermaßen aus: VARIABLE LABELS VALUE LABELS SEX Geschlecht. SEX 1 männlich 2 weiblich. Allgemeine Befehlsstruktur VARIABLE LABELS [Variable] [Information]. VALUE LABELS [Variable] Zahlenwert [Information] Zahlenwert [Information] Zahlenwert [Information] usw.. Wichtig ist die ( ) - Zeichen und den Punkt (.) am Ende des Befehls nicht zu vergessen. Hausaufgabe 1.) Kodierung den von Euch ausgefüllten Fragebogen Kodiert bitte den von Euch erhobenen Fragebogen. Benutzt dazu die Datenmaske, die der Version Eures Fragebogens entspricht. Auf dem Titelblatt ist in Klammern hinter der Überschrift Schweizer Werte die Version gekennzeichnet (z.b. DRT). Für die Version DRT benutz ihr die entsprechende Datei: Inter CH-2011_DRT.xls, die ich Euch attached per e-mail zusende. Kopiert die entsprechende Datei auf Eure Festplatte. Öffnet die Datei von Eurer Festplatte aus, benennt sie um und speichert sie unter einem neuen Namen ab (z.b. (xy_13_drt.xls ). Dann kodiert die Fragebogen und speichert die kodierten Werte in dieser Datei ab. Notiert Euch, wie ihr die Daten kodiert habt, die nicht eindeutig der Kodierregel entsprechen. Da ich gerne Eure Daten verwerten würde, wäre ich froh, wenn ihr mir die Datei zukommen lassen könntet. 7

2.) Erstellt eine Excel-Datenmaske für die nachfolgende Tagebuchabfrage, die wiederholt für die Erfassung eines spezifischen Momentes erstellt wurde. 8