Erste Datenbereinigung



Ähnliche Dokumente
Daten zusammenfügen und erste Datenbereinigung

Kapitel 5 FRAGESTELLUNG 1. Öffne die Datei alctobac.sav.

Kurzanleitung für SPSS Statistics 22

Sozialwissenschaftliche Fakultät der Universität Göttingen. Sommersemester 2009, Statistik mit SPSS

Datentransformation mit SPSS

Drucken und Löschen von angehaltenen Druckaufträgen

Datenaufbereitung in SPSS. Daten zusammenfügen

PREISE UND PREISLISTEN UNTER ORGAMAX BEARBEITEN

Arbeitshilfe für die Hinterlegung von Unterlagen der Rechnungslegung Eingabeformular

Drucken und Löschen von angehaltenen Druckaufträgen

Favoriten speichern und verwalten im Internetexplorer 6.0

-Abwesenheitsnachricht einrichten

Datenmaske für SPSS. Für die Datenanalyse mit SPSS können die Daten auf verschiedene Weise aufbereitet

Anhang Beispiele ausgewählter Praxisinformationssysteme

Um einen Datenverlust zu vermeiden empfehlen wir Ihnen Ihre gespeicherten Lastschriftvorlagen zu sichern.

Inhalt OpenOffice Writer: Grafik und Tabelle

Word 2010 Wasserzeichen erstellen

5 DATENSÄTZE SUCHEN, SORTIEREN UND

HWP Einlesen von Leistungstexte aus

UliCMS Umfrage-Modul. Version 1.0. Handbuch

Die Bearbeitungsmaske Ihrer Newsletter-Artikel beinhaltet jetzt neu einen Editor. Dort geben Sie den Text Ihres Artikels ein.

Excel 2010 Werte aus einer Liste wählen

Onlinehilfe zur Konfiguration von Mozilla Firefox für das NzüK-Portal

Bayerische Versorgungskammer Erstmaliger Start des Java-Zertifikatsmanagers im Browser Abholung von Benutzerzertifikaten...

Arbeiten mit TI-Nspire Bibliotheken

Oft gestellte Fragen. Fragen zum Informationswerkzeug Identify Wie kann ich gespeicherte Merkmale abfragen? Wie exportiere ich Tabellen in Excel?

Das Aussehen nicht-spielbarer Sims verändern (mit SimPE / Sims Surgery) Ein Tutorial von ReinyDay

Univariate Kennwerte mit SPSS

Sozialwissenschaftliche Fakultät der Universität Göttingen. Sommersemester Statistik mit SPSS

Testfragen erstellen. Lernplattform Testfragen erstellen

Basis-Kurs Statistik und SPSS für Mediziner Lösungen. SPSS-Übung Dateneingabe und -aufbereitung

PowerPoint 2007 Folien und Begleitmaterial drucken

Publizieren bei SCRIPTORIUM

Die Subskala besteht aus folgenden Items (Ausschnitt aus dem Codeplan):

Psi unter Ubuntu-Linux benutzen

PowerPoint 2013 in Bildern - Schritt für Schritt erklärt

Wissenschaftliche Arbeiten und große Dokumente. Kompaktkurs mit Word Dr. Susanne Weber 1. Ausgabe, Dezember 2013 K-WW2013-BW

ACW - Zürich Rangliste

Einstellungen für SEPA-Lastschriften in der VR-NetWorld-Software

Geschützte und ungeschützte Abschnitte in Smart-Templates 2

my.ohm Content Services Grundlagen

Sage Start Kunden, Lieferanten, Artikel erstellen / importieren Anleitung. Ab Version

Tutorial: Thunderbird 17 installieren, einstellen und s schreiben

Aufgebot-Karten A5 erstellen mit MS Word

Einführung in SPSS Wintersemester 2000/2001

Hinweise zum Arbeiten mit der Tabelle 521 Vergütungszuordnung und -berechnung

MOBILITY ONLINE ANLEITUNG

Peter Deckert. Hallo Tipp-Kick Freunde

Anleitung für die Datenübernahme etax.luzern

Datenüberprüfung. Excel Aufbau ZID/Dagmar Serb V.02/Okt. 2015

Ausführen eines Makros beim Starten von OpenOffice.org

Das Feld Script können Sie leer lassen. Hier könnten weitere Scripts eingebunden werden, welche Sie z.b. selbst entwickelt haben.

Mein Computerheft. Arbeiten mit Writer. Name: Ich kann ein Schreibprogramm öffnen und Texte schreiben. Öffne 00o4Kids mit einem Doppelklick!

PC-Kaufmann 2014 Endgültiger Jahresabschluss im Komplettpaket/-Pro

Anmeldedaten: ov-ortsvereinsname - Bsp. ov-arnegg, ov-asch, ov-berghülen usw.


Übersicht Shell-Scripten

Export bibliografischer Daten aus der FIS Bildung Literaturdatenbank und Import in die Endnote Literaturverwaltung

CSV-Import von Kontakten. Leicht gemacht

Mit Ihrer Bewerbung fängt alles an!

2.4 - Das Verwaltungsmodul moveon installieren - MS Access Version

3G FL760 Anleitung zur Installation


Kapitel 1: Deskriptive Statistik

Installation und Update von NX7.5

Hans-Böckler-Stiftung Ein schneller Einstieg in Bilanzanalyse für Windows

Wie lade ich meinen Hörbuch-Download (WMA-Format) erstmalig herunter?

Neues schreiben. Nachrichten Fenster. Klicken Sie auf «Neu», um direkt ins Nachrichtenfenster zu wechseln.

Aufzählung, Bennenung, Bedienung der wichtigsten Steuerelemente Verwenden von Menüs, Schaltflächen, Bildlaufleisten und Kontrollkästchen

Inhalte in Kurse einfügen. Um Inhalte in Kurse einzufügen, logge dich in Moodle ein und betrete deinen Kurs.

Achtung, Speichern nicht vergessen!

GEOGEBRA. Willkommen bei GeoGebra

Information, Kommunikation, Administration (IKA) Unterrichtsbereich Information 2. Semester 2. Band. 1. Ausgabe, Mai 2014

Erweiterung AE WWS Lite Win: Module Barcode Printing

Einführung in SPSS. Sitzung 2: Datenbereinigung und Datenmanagement. Knut Wenzig. 9. Dezember 2004

Im ersten Schritt müssen die Daten in die Datenansicht eingelesen werden.

Tipps & Tricks. Inventur durchführen *aktualisiert*: Inventur. Bearbeiten. In diesem Menüpunkt findet der wesentliche Ablauf der Inventur statt.

Erstellen von Datenträgeraustauschdateien für Eingangsrechnungen zur Übergabe an Bankprogramm

Schleifen: Immer wieder dasselbe tun

Einführung in SPSS. Sitzung 2: Datenbereinigung und Datenmanagement. Knut Wenzig. 15. Dezember 2005

Gutenberg Druck GmbH APOGEE WEBPORTAL. Kurzanleitung

Adobe Acrobat Professional - Portfolio. Leibniz Universität IT Services Anja Aue

Word starten. Word Word 2010 starten. Schritt 1

6 DATENBANKEN Datenbank. mit Spaltenüberschriften,

Monatsabrechnung durchführen

Nexus IP Quickguide. Für alle Nexus VW- und FW-Modelle

Internet-Projekte Kurt Stettler Tel

Handbuch ECDL 2003 Professional Modul 3: Kommunikation Aufgaben annehmen und zuweisen

Swiss Map online Schritt-für-Schritt-Anleitung

Datensicherung persönlicher Daten mit dem Programm >DirSync< Lizenz: Freeware für den privaten Gebrauch (deutsch und englisch) Website:

Inventur in raum level10 durchführen...

Installation SQL-Express und Migration PS3 nach SQL für 64-Bit-Systeme.

Bildungsstatistik Solothurn Anleitung Datenlieferung

ACDSee Pro 3-Tutorials: Markieren von Fotos

Einfache statistische Auswertungen mit dem Programm SPSS

Software-Lizenzierung

Anleitung zur Registrierung und Bestellung im Hauer Online Ersatzteilkatalog

Anleitung. UTF-8 codierte CSV-Dateien mit Microsoft Excel öffnen und anwenden

Transkript:

Erste Datenbereinigung I. Datenbereinigung klassisch I. Schritt: Praktisch: Auf zwei PCs die Datei herunterladen. Auf dem einen PC wird die Häufigkeitsauszählung durchgeführt, auf dem anderen PC wird die Datenkorrektur vorgenommen. II. Schritt: PC 1: Häufigkeitsauszählung (über Analysieren - Deskriptive Statistiken Häufigkeiten Alle Variablen markieren und über den Pfeil ins Variablenfenster kopieren

Dann auf OK klicken: Es erscheinen die Ergebnisse im Ausgabefenster (SPSS-Viewer, diese Datei kann gespeichert werden (*.spo, ab Version 15 *.spv). III. Schritt: Überprüfung der Werte. Durch Klicken auf die Variable im linken Übersichtsfenster wird die entsprechende Tabelle angezeigt. Sie müssen nun Tabelle auf Tabelle sorgfältig durchsehen, ob nicht erlaubte Werte auftauchen. 2

IV. Schritt: Wenn Fehler auftreten: Hier ist die Zahl 5 nicht erlaubt, da nur 1, 2 und 9 erlaubt sind. Diese Zahl wurde bei einer Person falsch eingegeben, die Person muss gefunden werden, um den Wert zu berichtigen. V. Schritt In dem Datenblatt die Variable markieren: dann die Zahl suchen: die 5 eingeben und auf Weitersuchen klicken 3

SPSS markiert die jeweilige Zelle (rechts oben). Da die Zahl nur einmal auftrat, können Sie auf Abrechen klicken. Dann klicken Sie ganz links auf die Zeile, in der der falsche Wert steht: Die Zeile springt ganz nach vorn, und die ID-Nummer kann abgelesen werden (hier der Wert 3): VI. Schritt: Für den Fragebogen mit der ID-Nummer 3 wurde also ein falscher Wert bei der Variablen eingegeben. Der Fragebogen muss herausgesucht werden, und es wird nach dem richtigen Wert geschaut. 4

VII. Schritt PC 2: Hier werden jetzt die korrekten Daten eingegeben. Mit der ENTER-Taste oder mit den Cursortasten wird der Wert gespeichert. VIII. Schritt Die Datei mit den korrigierten Werten unter einem neuen Namen speichern und dann in stud.ip hochladen. 5

II. Datenbereinigung mit Validierung (ab Version 14) 1. Schritt Klicken Sie unter Daten auf Validierung und dann auf Vordefinierte Regeln laden.: 2. Schritt: SPSS hält einige vordefinierte Regeln bereit, die Sie verwenden können und nicht extra definieren müssen. Sie müssen aber diese Schritte nicht durchführen, Sie können auch mit Schritt 3 anfangen. 6

3. Schritt: Klicken Sie dann auf Regeln definieren. Sie sehen dann folgendes Fenster: Links stehen die vordefinierten Regeln mit den jeweiligen Namen. Sie bedeutet 0,1 Dichotomie, dass nur die Werte 0 und 1 gültig sind. In der Regel handelt es sich bei der Datenbereinigung um numerische Werte ( Typ: Numerisch ), es können aber auch Regeln mit String-Variablen definiert werden. 7

4. Schritt: Definition einer neuen Regel: Sie wollen eine neue Regel definieren für eine Rating-Skala mit den gültigen Werten 1 6. Klicken Sie auf Neu : 5. Schritt: Geben Sie bei Regeldefinition einen Namen für die Regel ein. Es empfiehlt sich, die Namensbeispiele der vordefinierten Regeln zu übernehmen. Beachten Sie bitte, dass der Regelname keine Sonderzeichen wie ein Minuszeichen enthält, da es sonst zu einer Fehlermeldung kommt. 8

Bei Gültige Werte können Sie zwischen In einer Liste (Beispiel 0,1-Dichotomie) oder Innerhalb des Bereichs wählen. Hier ist Innerhalb des Bereichs günstiger, da Sie nur den minimalen und den maximalen gültigen Wert eingeben müssen. Klicken Sie abschließend auf OK. Das Fenster wird geschlossen. Wenn Sie das Fenster wieder öffnen, sehen Sie, dass die neue Regel aufgenommen wurde. 6. Schritt: Auf diese Weise definieren Sie alle Regeln für die Wertebereiche, die in Ihrem Fragebogen vorkommen. 7. Schritt: Jetzt können die Daten validiert werden: Zuerst müssen die Variablen definiert werden. In diesem Beispiel sind es die Variablen F05_01 F05_34 mit einer Ratingskala von 1 6. Sie sollten auch die ID (Fall)-Variablen berücksichtigen, da dann schneller der Fragebogen gefunden wird, aus dem ein falscher Wert eingegeben wurde. 9

10

8. Schritt: Klicken Sie jetzt auf Regeln für eine Variable. Sie sehen auf der linken Seite die Verteilungen der Variablen sowie die niedrigsten und höchsten auftretenden Werte. Auch an dieser Stelle ist eine Definition von Regeln möglich. 9. Schritt: Markieren Sie alle Variablen, die Sie überprüfen wollen. Klicken Sie dann auf der rechten Seite auf die gültige Regel. Auch entfernen Sie das Kästchen, das die Zahl der zu durchsuchenden Fälle beschränkt. Klicken Sie dann auf OK. Übrigens: Wenn Sie bei Minimum und Maximum sehen, dass alle Werte im gültigen Bereich zwischen 1 und 6 sind, können Sie sich die weiteren Schritte sparen, da ja keine Fehler vorhanden sind. Nach dem OK finden Sie im Ausgabefenster in diesem Fall die folgende Meldung: Warnungen Einige oder alle der angeforderten Ausgaben werden nicht gezeigt, weil alle Fälle, Variablen oder Datenwerte die angeforderten Prüfungen bestanden haben. Bei diesen Variablen wurden also keine falschen Werte gefunden. Falls falsche Werte vorhanden sein sollten, erhalten Sie von SPSS folgende Meldungen: 11

Es werden die Regeln nochmals beschrieben, die Sie angewendet haben. Sie können in einem Durchlauf mehrere Variablen mit unterschiedlichen Regeln überprüfen. Hier wurde nur diese Regel verwendet. Es wird angezeigt, bei welcher Variablen falsche Werte ( Verletzungen ) aufgetreten sind. In diesem Fall also eine Verletzung bei der Variablen F05_01. In dieser Tabelle werden die interne Fallnummer und die ID-Nummer angegeben. Der Fall 11 mit der ID-Nummer 538 hat also einen falschen Wert bei der Variablen F05_01. 10. Schritt: Zur Korrektur gehen Sie in die Datenmatrix, wählen den Fall mit der ID-Nummer 538 und geben bei der Variablen F05_01 den richtigen Wert ein. Hierzu benötigen Sie den Originalfragebogen. Sie sollten sich auch die Werte der vorangehenden Variablen anschauen, nicht selten sind die Zahlen einer Itembatterie auf einer Fragebogenseite verschoben worden. Alternativ können Sie auch im Syntaxfenster folgende Befehle eingeben (unter der Annahme, dass 1 der richtige Wert sei): IF (ID = 538) F05_01 = 1. EXECUTE. 12

III. Datenfehlersuche über Syntaxbefehle Eine einfache Überprüfung der Daten kann über Befehle im Syntaxfenster vorgenommen werden. Ziel ist hierbei, nur die Daten auszugeben, die fehlerbehaftet sind. Zusätzlich sollen die ID-Nummer, die Variable und der falsche Wert ausgegeben werden. Dies geschieht über DO IF END IF-Schleifen und dem PRINT-Befehl. Allerdings muss diese Schleife für jede Variable getrennt vorgenommen werden. Dies bedeutet einige Schreibarbeit, die aber über das übliche Copy & Paste vereinfacht werden kann. Beispiel: Für die Variable F02 sollen falsche Werte ermittelt werden. Gültige Werte auf der Ratingskala sind die Werte 1 5. Auch der systemfehlende Wert sollte nicht vorhanden sein. *** FRAGE 2. DO IF (F02 < 1 OR F01 > 5 OR SYSMIS(F02)). PRINT / 'ID: ' ID (F4.0,5X) 'F02: ' F02 (F2.0). END IF. EXECUTE. Es bedeuten: In der DO IF END IF-Schleife wird für die einzelne Variable angegeben, welche Werte keine gültigen Werte sind. Diese Werte können von Variable zu Variable je nach Skalenbreite unterschiedlich sein. 13

Nach dem PRINT / - Befehle werden in Hochkomma der Text eingegeben, der im Ausdruck erscheinen soll (auf Leerzeichen achten, das macht den Ausdruck lesbarer), gefolgt von dem Variablennamen. In den Klammern wird dann gemäß den FORTRAN-Konventionen die Ausgabeart wiedergegeben. 4.0 bedeutet, dass die Variable aus vier Zeichen ohne Komma besteht. Enthält die Variable nur 1 Zeichen, z.b. die Zahl 2, dann erscheint die Zahl rechtsbündig, die 3 Zeichen vor der 2 werden leer gelassen. 5X bedeutet, dass fünf Leerzeichen folgen, es wird also ein Abstand zu den nächsten Zeichen gelassen. Bevor Sie die Daten überprüfen, müssen Sie unter Optionen das Häkchen bei Befehle im Log anzeigen entfernen, da ansonsten die Ausgabe unübersichtlich wird. Die Ausgabe für F02 sieht dann wie folgt aus: Beim Fragebogen mit der ID-Nummer 119 wurde bei der Variablen F02 der falsche Wert 7 eingegeben, bei der ID 123 der falsche Wert 22. In dieser Weise können dann für jede Variable DO IF - END IF-Scheifen geschrieben werden. Sie sollten die Syntaxdatei speichern, dann die Prozedur jederzeit wiederholt werden. Das Gesamtergebnis könnte dann wie folgt aussehen: Fazit: Die Vorarbeit ist aufwändig und ist in der Regel nicht auf Anhieb fehlerfrei. Auf der anderen Seite ist der Ausdruck übersichtlich, die falschen Werte werden übersichtlich ausgegeben und in der Datei gefunden. 14