Kapitel 4 Datendateien



Ähnliche Dokumente
32.4 Anpassen von Menüs und Symbolleisten 795i

Excel Pivot-Tabellen 2010 effektiv

So importieren Sie einen KPI mithilfe des Assistenten zum Erstellen einer Scorecard

Die Dateiablage Der Weg zur Dateiablage

Handbuch ECDL 2003 Modul 4: Tabellenkalkulation Formatierungen von Zahlen- und Datumswerten

Auswertung erstellen: Liste mit -

Sichern der persönlichen Daten auf einem Windows Computer

Speichern. Speichern unter

3"PRÄSENTATION ERSTELLEN

Kurzanleitung. Einstieg in die TripleCard Profi-Software. Zeiterfassungs- Software für. TripleCard Terminal

iphone-kontakte zu Exchange übertragen

6.3 Serienbriefe über Microsoft Excel und Word

2. Word-Dokumente verwalten

Im Folgenden wird Ihnen an einem Beispiel erklärt, wie Sie Excel-Anlagen und Excel-Vorlagen erstellen können.

:LQGRZV([SORUHU &KULVWLQH%HHU

Einfügen mit Hilfe des Assistenten: Um eine Seite hinzufügen zu können, müssen Sie nur mehr auf ein Symbol Stelle klicken.

CVR Seniorentreff vom 04. und Serienbriefe/Seriendruck. Serienbriefe / Seriendruck

Leitfaden zum Umgang mit Mautaufstellung und Einzelfahrtennachweis

Bedienungsanleitung Anlassteilnehmer (Vereinslisten)

Artikel Schnittstelle über CSV

Datenmaske für SPSS. Für die Datenanalyse mit SPSS können die Daten auf verschiedene Weise aufbereitet

Fusszeile mit Datumsfeld und Dateiname

Mit der Maus im Menü links auf den Menüpunkt 'Seiten' gehen und auf 'Erstellen klicken.

Einkaufslisten verwalten. Tipps & Tricks

Folgeanleitung für Klassenlehrer

Folgeanleitung für Fachlehrer

Kommunikations-Management

S TAND N OVEMBE R 2012 HANDBUCH DUDLE.ELK-WUE.DE T E R M I N A B S P R A C H E N I N D E R L A N D E S K I R C H E

Anleitung zur Erstellung einer Gefährdungsbeurteilung

Kapitel 1: Betriebssystem IX. W indows Explorer und der Arbeitsplatz Teil 2

Import, Export und Löschung von Zertifikaten mit dem Microsoft Internet Explorer

Seriendruck für Avery Zweckform Etiketten in Microsoft Word 2010, 2007, 2003 & 2002/XP, 2000 & 97 für Windows

Bedienungsanleitung. Stand: Copyright 2011 by GEVITAS GmbH

Erzherzog Johann Jahr 2009

3 ORDNER UND DATEIEN. 3.1 Ordner

Kurzanleitung. Toolbox. T_xls_Import

teamspace TM Outlook Synchronisation

1 Einleitung. Lernziele. Symbolleiste für den Schnellzugriff anpassen. Notizenseiten drucken. eine Präsentation abwärtskompatibel speichern

Die neue Datenraum-Center-Administration in. Brainloop Secure Dataroom Service Version 8.30

Arbeiten mit dem Outlook Add-In

Es gibt situationsabhängig verschiedene Varianten zum Speichern der Dokumente. Word bietet im Menü DATEI unterschiedliche Optionen an.

Serienbrief erstellen

Faktura. IT.S FAIR Faktura. Handbuch. Dauner Str.12, D Mönchengladbach, Hotline: 0900/ (1,30 /Min)

Handbuch ECDL 2003 Professional Modul 2: Tabellenkalkulation Vorlagen benutzen und ändern

Installation des Zertifikats. Installationsanleitung für Zertifikate zur Nutzung des ISBJ Trägerportals

Bayerische Versorgungskammer

Handbuch B4000+ Preset Manager

Visio Grundlagen. Linda York. 1. Ausgabe, Oktober 2013

Dokumentenverwaltung. Copyright 2012 cobra computer s brainware GmbH

OutlookExAttachments AddIn

Neue Steuererklärung 2013 erstellen

SafeRun-Modus: Die Sichere Umgebung für die Ausführung von Programmen

ACDSee 10 Tutorials: Fotos herunterladen mit dem Fotoimport-Assistent

Installation des Zertifikats

-Versand an Galileo Kundenstamm. Galileo / Outlook

Personalisierte

Handbuch ECDL 2003 Basic Modul 3: Textverarbeitung Serienbrief erstellen - Datenquelle

Anleitung zur Erstellung einer Batchdatei. - für das automatisierte Verbinden mit Netzlaufwerken beim Systemstart -

Serienbriefe schreiben mit Ratio - Adressen (Microsoft Word Versionen 8.0 und 9.0)

Erstellen eines Formulars

Installation im Netzwerk

Handbuch ECDL 2003 Modul 2: Computermanagement und Dateiverwaltung Dateien löschen und wiederherstellen

Programm GArtenlisten. Computerhinweise

Empfehlungen zur Nutzung der CD zum Buch: Klee & Wiemann: Beweglichkeit und Dehnfähigkeit. Schorndorf: Hofmann,

Handbuch. ECDL 2003 Professional Modul 3: Kommunikation. Signatur erstellen und verwenden sowie Nachrichtenoptionen

Outlook 2010 Excel-Adressen in Outlook übernehmen

ACDSee 2009 Tutorials: Importien von Fotos mit dem Fenster "Importieren von"

Schrittweise Anleitung zur Installation von Zertifikaten der Bayerischen Versorgungskammer im Mozilla Firefox ab Version 2.0

Sie wollen Was heißt das? Grundvoraussetzung ist ein Bild oder mehrere Bilder vom Wechseldatenträger

Arbeitsgruppentermine in Microsoft Outlook -Kalender importieren

ODBC-Treiber Programmübersicht

Einrichten einer Festplatte mit FDISK unter Windows 95/98/98SE/Me

Wo hat mein Computer meine Dateien schon wieder versteckt? Tipps und Tricks Dateien wieder zu finden.

12. Dokumente Speichern und Drucken

LÖSUNGEN AUFGABEN: EXCEL XP (OHNE DATEIEN)

LEITFADEN -ZUSTELLUNG

Klicken Sie auf Weiter und es erscheint folgender Dialog

Programme im Griff Was bringt Ihnen dieses Kapitel?

Versand einer Exportdatei per , USB-Stick, etc.

Herzlich willkommen zum Kurs "MS Word 2003 Professional"

Wie kann ich meine Daten importieren? Wie kann ich meine Profile verwalten?

Schaltfläche Start/Drucker und Faxgeräte, mit rechter Maustaste auf Druckersymbol klicken, Befehl Eigenschaften wählen.

Seriendruck mit der Codex-Software

Starten der Software unter Windows 7

SIZ Modul 221: Outlook und Internetdienste

Konvertierung der Empfängerdaten von BFS- Online.PRO über ZV-Tools

Anleitung für TYPO Bevor Sie beginnen Newsletter anlegen Inhalt platzieren und bearbeiten Neuen Inhalt anlegen...

Newsletter. 1 Erzbistum Köln Newsletter

Die Beschreibung bezieht sich auf die Version Dreamweaver 4.0. In der Version MX ist die Sitedefinition leicht geändert worden.

hyscore Sollwerte-Import Version 3.1.6, September 2007

Klicken Sie auf Extras / Serienbriefe mit Word. Im Fenster Serienbriefe können Sie nun auswählen, an wen Sie den Serienbrief schicken möchten.

snap Adressen selektieren und Etiketten oder Serienbriefe in Word erstellen

Word 2010 Drucken von Serien-Etiketten

Import des persönlichen Zertifikats in Outlook Express

Microsoft Access 2013 Navigationsformular (Musterlösung)

Handbuch ECDL 2003 Basic Modul 5: Datenbank Access starten und neue Datenbank anlegen

PowerPoint 2010 Eigene Folienlayouts erstellen

VisiScan 2011 für cobra

Excel 2010 Kommentare einfügen

Kurzeinführung Excel2App. Version 1.0.0

Transkript:

Kapitel 4 Datendateien Datendateien bilden bei SPSS ein zentrales Element. In ihnen werden die Werte eingegeben und bearbeitet, die mit Hilfe von SPSS untersucht werden sollen. Sie können mit den SPSS Prozeduren ausschließlich solche Daten untersuchen, die sich in einer aktuell geöffneten Datendatei befinden. Daher müssen Sie alle relevanten Daten vor einer Analyse in eine SPSS-Datendatei einfügen. Hierzu können die Daten entweder direkt in eine SPSS-Datendatei eingegeben oder aus einer bereits bestehenden Datei wie beispielsweise einer Excel-Tabelle oder einer Access- Datenbank importiert werden. 4 Wenn Sie mit SPSS arbeiten, ist stets genau eine Datendatei geöffnet. Es ist somit nicht möglich, zwei oder mehr Datendateien gleichzeitig zu bearbeiten. Wenn Sie Daten, die sich in verschiedenen Dateien befinden, gemeinsam auswerten möchten, müssen Sie diese zuvor in einer Datei zusammenfassen. 5 Gleichzeitig ist es auch nicht möglich, das Programm SPSS ohne eine Datendatei - und sei es eine vollkommen leere Datei - geöffnet zu haben. So wird auch beim Starten von SPSS automatisch eine leere Datendatei erstellt. Sie können diese Voreinstellung jedoch ändern und festlegen, daß SPSS beim Programmstart nicht eine leere, sondern eine bereits bestehende Datendatei öffnet. 4.1 Neue Datendatei erstellen Wenn Sie eine neue Datendatei anlegen möchten, zum Beispiel, um die im Rahmen einer Umfrage gewonnenen Daten aus den Fragebögen in die Datendatei zu übertragen oder um Daten aus einer bereits bestehenden Datenbank in eine SPSS- Datendatei zu importieren, müssen Sie zunächst ein leere Datendatei öffnen, in die Sie anschließend die Werte eingeben oder importieren können. ¾ Neue Datendatei automatisch beim Programmstart öffnen: Beim Programmstart von SPSS wird automatisch eine leere Datendatei erstellt, sofern 4 Siehe hierzu Kapitel 5, Daten eingeben und bearbeiten. 5 Siehe hierzu Kapitel 11, Verschmelzen und Aggregieren von Datendateien.

28 Kapitel 4 Datendateien Sie nicht explizit vorgegeben haben, daß eine bereits bestehende Datei geöffnet werden soll. 6 ¾ Neue Datendatei während einer SPSS-Sitzung öffnen: Während einer laufenden SPSS-Sitzung können Sie mit dem Menübefehl DATEI NEU DATEN eine neue Datendatei anfordern. Alternativ können Sie auf das am linken Seitenrand abgebildete Symbol aus der Symbolleiste klicken. 7 Sie erhalten daraufhin eine leere Datendatei, die vorläufig noch keinen Namen trägt, bis Sie die Datei erstmalig speichern und ihr dabei einen Namen zuweisen. Bis dahin wird in der Titelleiste des Fensters anstelle des Dateinamens die Bezeichnung Ohne Titel oder Unbenannt angezeigt. Da Sie bei SPSS nicht mit zwei oder mehr Datendateien gleichzeitig arbeiten können, wird beim Öffnen einer neuen Datendatei automatisch die zuvor geöffnete Datendatei geschlossen. Haben Sie an dieser Datei Änderungen vorgenommen, die noch nicht gespeichert wurden, werden Sie von SPSS gefragt, ob Sie die Datei nun speichern möchten. Als Antwort stehen Ihnen drei Optionen zur Verfügung: y Ja: Wählen Sie die Schaltfläche Ja, um die Datei unter ihrem bestehenden Namen zu speichern. Falls die Datei noch keinen Namen hat, werden Sie aufgefordert, einen Namen festzulegen. 8 y Nein: Wenn Sie die Schaltfläche Nein wählen, wird die Datei ohne Speichern geschlossen, so daß Änderungen, die Sie seit dem letzten Speichern der Datei vorgenommen haben, verloren gehen. Die Datei liegt somit anschließend in der Form vor, in der sie zuletzt gespeichert wurde. Dateien, die bisher noch gar nicht gespeichert wurden, gehen vollständig verloren. y Abbrechen: Mit dieser Schaltfläche wird der gesamte Vorgang abgebrochen, so daß der Befehl DATEI, NEU, DATEN nicht ausgeführt wird. Damit bleibt die zuvor geöffnete Datendatei weiterhin geöffnet, und Sie können sie bearbeiten oder unter einem neuen Namen speichern, um anschließend erneut den Befehl DATEI, NEU, DATEN aufzurufen. 9 6 Siehe hierzu Abschnitt 4.2.2, Datendatei beim Programmstart von SPSS öffnen, S. 31. 7 Beachten Sie, daß dieses Symbol als Voreinstellung nicht in der Symbolleiste enthalten ist. Sie können es jedoch über den Befehl ANSICHT, SYMBOLLEISTEN einfügen. Siehe hierzu im einzelnen Abschnitt 3.3, Symbolleisten, S. 14. 8 Siehe hierzu Abschnitt 4.4.1, Datendatei unter neuem Namen oder im Fremdformat speichern, S. 49. 9 Zum Speichern bereits bestehender Dateien unter neuem Namen siehe Abschnitt 4.4.1, Datendatei unter neuem Namen oder im Fremdformat speichern, S. 49.

4.2 Bestehende Datendatei öffnen 29 4.2 Bestehende Datendatei öffnen Sie können eine bestehende Datendatei, die Sie zu einem früheren Zeitpunkt erstellt und gespeichert haben, jederzeit während der Arbeit mit SPSS öffnen. Zusätzlich gibt es die Möglichkeit, eine bestehende Datendatei automatisch beim Programmstart von SPSS öffnen zu lassen. Dies ist insbesondere dann sinnvoll, wenn Sie regelmäßig mit der gleichen Datendatei arbeiten. 4.2.1 Datendatei während einer SPSS-Sitzung öffnen Während Sie mit SPSS arbeiten, können Sie eine bestehende Datendatei auf zwei Arten öffnen. Der einfachste Weg besteht darin, in dem Menü DATEI aus einer Liste der zuletzt bearbeiteten SPSS-Dateien die gewünschte Datei auszuwählen. Wird die gesuchte Datei dort nicht aufgeführt, können Sie auf den Menübefehl DATEI, ÖFFNEN zurückgreifen. Wenn Sie eine Datendatei während einer SPSS-Sitzung öffnen, wird die bis dahin geöffnete Datendatei automatisch geschlossen. Haben Sie an dieser Datei noch nicht gespeicherter Änderungen vorgenommen, werden Sie zuvor gefragt, ob Sie die Datei speichern möchten. 10 Liste zuletzt geöffneter Dateien In dem Menü DATEI werden die Namen der zuletzt geöffneten Dateien aufgeführt. (Unmittelbar nach der Installation von SPSS werden Sie dort natürlich noch keine Einträge finden, da noch keine Dateien mit SPSS geöffnet wurden.) Um eine dieser Dateien zu öffnen, wählen Sie den entsprechenden Eintrag wie einen Menübefehl durch Anklicken mit der Maus oder über die Tastatur aus. Die Anzahl der in dem Menü DATEI aufgeführten letzten Dateien können Sie in dem Dialogfeld des Befehls BEARBEITEN, OPTIONEN selbst festlegen. Geben Sie hierzu in dem Register Allgemein in das Feld Einträge eine Zahl zwischen 0 und 9 ein. Menübefehl DATEI ÖFFNEN Zum Öffnen einer bestehenden Datendatei wählen Sie den Menübefehl DATEI ÖFFNEN... 6 + Q Diesen Befehl können Sie auch über die Tastenkombination 6 + Q oder mit Hilfe der abgebildeten Schaltfläche aufrufen. Der Befehl öffnet das in Abbildung 4.1 dargestellte Dialogfeld. 10 Dies wurde im vorhergehenden Abschnitt 4.1, Neue Datendatei erstellen, S. 27 ausführlicher beschrieben.

30 Kapitel 4 Datendateien Abbildung 4.1: Dialogfeld des Befehls DATEI, ÖFFNEN ¾ Datei öffnen: In der Dropdown-Liste Suchen in wird der aktuelle Ordner (Verzeichnis) angezeigt. Das darunterliegende Listenfeld führt alle in diesem Ordner enthaltenen SPSS-Datendateien auf. Um eine Datei zu öffnen, haben Sie verschiedene Möglichkeiten: y Wählen Sie eine der aufgeführten Dateien - zum Beispiel durch einfaches Anklicken mit der Maus - aus, und klicken Sie anschließend auf die Schaltfläche Öffnen, oder tippen Sie die Taste µ. y Doppelklicken Sie in dem Listenfeld auf den Namen der zu öffnenden Datei. y Schreiben Sie den Namen der Datei in das Feld Dateiname, und klicken Sie anschließend auf die Schaltfläche Öffnen, oder tippen Sie die µ-taste. Möchten Sie eine Datei öffnen, die sich nicht in dem aktuellen Ordner befindet, müssen Sie auch den Pfad in dem Feld Dateiname angeben oder zuvor den Ordner wechseln. ¾ Laufwerk und Ordner wechseln: In dem Dialogfeld Datei öffnen werden lediglich die Dateien des aktuellen Ordners aufgeführt. Um sich die in einem anderen Ordner liegenden Dateien anzeigen zu lassen, müssen Sie daher den aktuellen Ordner wechseln. 11 y Die Unterordner des aktuellen Ordners werden ebenfalls in der Liste der Dateien aufgeführt. Um einen der Unterordner zu öffnen, wählen Sie ihn aus, und tippen Sie anschließend die µ-taste, oder klicken Sie auf die Schaltfläche Öffnen. Alternativ können Sie mit der Maus auf den Unterordner doppelklicken. 11 Sie können den Ordner, der als Voreinstellung in den Dialogfeldern zum Öffnen und Speichern von SPSS-Dateien als aktueller Ordner ausgewählt ist, auf der Windows-Ebene in den Start-Eigenschaften von SPSS festlegen.

4.2 Bestehende Datendatei öffnen 31 y Wenn Sie das Listenfeld Suchen in aufschlagen, wird die gesamte Ordnerstruktur, die zu dem aktuellen Ordner hinführt, angezeigt. Nun können Sie einen der aufgeführten Ordner oder ein Laufwerk als aktuellen Ordner auswählen. Da die Unterordner des ausgewählten Ordners anschließend in der Liste der Dateien aufgeführt werden, können Sie auf diese Weise zu jedem gewünschten Ordner gelangen. ¾ Andere Dateitypen auswählen: Mit dem Befehl Datei öffnen können Sie nicht nur SPSS-Datendateien, sondern auch andere SPSS-Dateien wie Navigatordokumente oder Syntaxdateien öffnen. Zusätzlich können Sie den Befehl verwenden, um Datendateien mit Fremdformat wie zum Beispiel Excel- Tabellen oder Systat-Dateien zu öffnen. 12 In dem Dialogfeld Datei öffnen werden jedoch als Voreinstellung lediglich Datendateien im SPSS-Format aufgeführt. Um Dateien anderen Typs anzeigen zu lassen, können Sie in der Dropdown-Liste Dateityp das gewünschte Format auswählen. Möchten Sie alle Dateien des aktuellen Ordners sehen, wählen Sie die Option Alle Dateien (*.*). ¾ Weitere Dateiinformationen anzeigen: Mit den beiden am Seitenrand abgebildeten Schaltflächen aus dem Dialogfeld Datei öffnen können Sie den Umfang der im Dialogfeld angezeigten Dateiinformationen bestimmen. Wählen Sie die obere Schaltfläche Liste, um wie in Abbildung 4.1 lediglich die Dateinamen darstellen zu lassen. Wenn Sie auf die unteren Schaltfläche Details klicken, werden zusätzlich zum Namen auch die Größe, der Dateityp und das Datum der letzten Änderung der Datei angezeigt. 4.2.2 Datendatei beim Programmstart von SPSS öffnen Sie können beim Programmstart von SPSS automatisch eine bereits bestehende Datendatei öffnen. Hierzu gibt es grundsätzlich zwei Möglichkeiten: ¾ Sie können auf der Windows-Ebene in den Start-Eigenschaften von SPSS eine Datendatei angeben, die bei jedem Programmstart automatisch geöffnet werden soll. Diese Datei wird dann anstelle der leeren Datendatei, die SPSS als Voreinstellung beim Programmstart erstellt, geöffnet. ¾ Sie können die gewünschte Datendatei im Windows Explorer aufrufen, indem Sie die Datei auswählen und anschließend die µ-taste tippen oder auf den Dateinamen doppelklicken. Dadurch wird gleichzeitig SPSS gestartet und die Datendatei geöffnet. 12 Zum Öffnen von Datendateien im Fremdformat siehe Abschnitt 4.3, Daten aus Dateien mit Fremdformat einlesen, S. 32.

32 Kapitel 4 Datendateien 4.3 Daten aus Dateien mit Fremdformat einlesen SPSS bietet die Möglichkeit, Daten aus Dateien, die mit anderen Anwendungen erstellt wurden, in eine SPSS-Datendatei einzulesen. Die hierzu geeignete Vorgehensweise hängt entscheidend von der Datenquelle und damit von dem Format der Datei ab, aus der die Daten eingelesen werden sollen. Im wesentlichen lassen sich vier Verfahren zum Einlesen von Daten aus Dateien mit Fremdformat unterscheiden: ¾ Datei öffnen: Dateien, die mit früheren SPSS-Versionen, Systat, Microsoft Excel bis zu Version 4, Lotus 1-2-3 oder dbase erstellt wurden, sowie Textdateien, die als Trennzeichen zwischen den einzelnen Werten einen Tabulator verwenden, können über den Befehl DATEI, ÖFFNEN eingelesen werden. Dies wird ausführlicher im folgenden Abschnitt 4.3.1, Befehl Datei öffnen für Dateien im Fremdformat beschrieben. ¾ ASCII-Dateien einlesen: Textdateien im ASCII-Format können über den Menübefehl DATEI, ASCII-DATEN EINLESEN eingelesen werden. Dies ist jedoch nur möglich, wenn die Textdatei feste Spaltenbreiten aufweist oder als Trennzeichen zwischen den Werten ein Leerzeichen oder ein anderes einheitliches Zeichen verwendet wird. Siehe hierzu im einzelnen Abschnitt 4.3.2, Textdateien im ASCII-Format lesen, S. 38. ¾ ODBC: Sie können Daten aus einer Datenbank beliebigen Formats, einer Excel-Tabelle, die mit Microsoft Excel 5.0 oder höher erstellt wurde, oder einer Textdatei in SPSS einlesen, sofern auf Ihrem PC der entsprechende ODBC-Treiber installiert ist (vgl. hierzu Abschnitt 4.3.3, Daten mit ODBC aus Datenbanken importieren, S. 45). ¾ Zwischenablage: Sie können Daten aus der Windows-Zwischenablage in eine SPSS-Datendatei einfügen. Damit haben Sie grundsätzlich die Möglichkeit, Werte aus allen Quellen, die erlauben, Daten in die Zwischenablage einzufügen, in eine SPSS-Datendatei zu übertragen. Dieser Weg über die Zwischenablage wird häufig als wenig elegante Notlösung angesehen, stellt jedoch in Fällen, in denen einmalig eine überschaubare Datenmenge übertragen werden soll, die schnellste und einfachste Art des Datenimports dar. Gleichzeitig können Sie diesen Weg auch in umgekehrter Richtung beschreiten und die Zwischenablage zum Export von Daten aus einer SPSS-Datendatei verwenden. Die Verwendung der Zwischenablage wird im nächsten Kapitel in Abschnitt 5.4, Einfügen, Ausschneiden, Kopieren und Löschen von Werten, Fällen und Variablen, S. 88 beschrieben. 4.3.1 Befehl DATEI ÖFFNEN für Dateien im Fremdformat Allgemeine Vorgehensweise Wenn Sie Dateien im Fremdformat über den Befehl DATEI, ÖFFNEN aufrufen, werden diese Dateien nicht wirklich geöffnet, sondern es werden die in den Datei-

4.3 Daten aus Dateien mit Fremdformat einlesen 33 en enthaltenen Daten in eine SPSS-Datendatei eingelesen. Die Vorgehensweise entspricht im wesentlichen dem in Punkt Menübefehl Datei öffnen, S. 29 beschriebenen Vorgehen zum Öffnen einer SPSS-Datendatei im aktuellen Format von SPSS 8: ¾ Wählen Sie den Menübefehl DATEI, ÖFFNEN. ¾ Wählen Sie aus der Dropdown-Liste Dateityp das Format der zu öffnenden Datendatei aus. ¾ Wählen Sie aus der Liste der Dateien die gewünschte Datendatei, und öffnen Sie diese mit der Schaltfläche Öffnen oder durch Doppelklicken auf den Dateinamen. Wechseln Sie ggf. zuvor den aktuellen Ordner, oder geben Sie den Dateinamen mit vollständigen Pfadangaben in das Feld Dateiname ein. ¾ Wenn Sie Dateien einer Tabellenkalkulation oder Tabulator-getrennte Textdateien mit SPSS öffnen, wird vor dem Öffnen ein Dialogfeld angezeigt, in dem Sie bestimmen können, ob die Variablennamen aus der Quelldatei übernommen werden sollen. Zusätzlich können Sie für Dateien einer Tabellenkalkulation den Zellbereich festlegen, aus dem die Daten eingelesen werden sollen. Bei allen übrigen Dateiformaten - dies sind SPSS-Dateien früherer Versionen, Systat- und dbase-dateien - werden die Daten ohne weitere Abfrage eingelesen. Dateitypen für Datendateien In der Dropdown-Liste Dateityp des Dialogfelds Datei öffnen können Sie zwischen den folgenden Formaten für Datendateien wählen: ¾ SPSS (*.sav): Datendateien, die mit einer beliebigen Version von SPSS für Windows, Macintosh oder UNIX erstellt wurden ¾ SPSS/PC+ (*.sys): Datendateien, die mit der unter DOS laufenden SPSS- Version SPSS/PC+ erstellt wurden ¾ Systat (*.sys): Datendateien, die mit Systat erstellt wurden ¾ SPSS portable (*.por): Datendateien, die mit SPSS im sogenannten portablen Format gespeichert wurden. Diese Dateien können mit SPSS unter verschiedenen Betriebssystemen bearbeitet werden. ¾ Excel (*.xls): Dateien, die mit der Tabellenkalkulation Microsoft Excel erstellt wurden. Beachten Sie, daß Sie mit dem Befehl DATEI, ÖFFNEN, lediglich solche Excel-Dateien öffnen können, die im Format von Excel 4 oder im Format einer früheren Excel-Version gespeichert wurden. 13 13 Zum Einlesen von Daten aus Excel-Dateien jüngerer Versionen stehen grundsätzlich drei alternative Vorgehensweisen zur Verfügung. Ist auf Ihrem Computer der geeignete ODBC- Treiber installiert, können Sie die Daten mit Hilfe des Befehls DATEI, DATENBANKZUGRIFF importieren (vgl. hierzu im einzelnen Abschnitt 4.3.3, Daten mit ODBC aus Datenbanken importieren, S. 45). Ein zweiter Weg besteht darin, die betreffende Datei mit Excel im Format von Excel 4.0 (oder einem anderen von Excel angebotenen Format, das von SPSS gelesen werden

34 Kapitel 4 Datendateien ¾ Lotus (*.w*): Datendateien, die im Format der Versionen 1A, 2.0 oder 3.0 von Lotus 1-2-3 gespeichert wurden ¾ SYLK (*.slk): Datendateien im Format SYLK (Symbolic Link) ¾ dbase (*.dbf): Dateien, die mit dem Datenbankprogramm dbase in dem Format der Versionen II, III, III PLUS oder IV gespeichert wurden ¾ Tabulator-getrennt (*.dat): Textdateien im ASCII-Format, die als Trennzeichen zwischen den einzelnen Werten Tabulatoren verwenden Excel-, Lotus- und SYLK-Dateien öffnen Wenn Sie mit SPSS eine Datei öffnen, die im Format einer Tabellenkalkulation gespeichert wurde, wird vor dem Einlesen der Daten das in Abbildung 4.2 dargestellte Dialogfeld angezeigt. Abbildung 4.2: Optionen zum Öffnen von Dateien einer Tabellenkalkulation ¾ Variablennamen einlesen: Kreuzen Sie diese Option an, wenn die erste Zeile der Tabellendatei die Variablennamen enthält und diese in die SPSS- Datendatei übernommen werden sollen. Abbildung 4.3 skizziert das Einlesen von Daten aus eine Tabellendatei bei gleichzeitigem Einlesen der Variablennamen. Excel-Tabelle SPSS-Datendatei Abbildung 4.3: Einlesen von Daten und Variablennamen aus einer Tabellendatei Beachten Sie beim Verwenden der Option Variablennamen einlesen folgende Eigenheiten von SPSS: kann, wie beispielsweise SYLK oder Lotus 1-2-3) zu speichern und anschließend bei SPSS mit dem Befehl DATEI, ÖFFNEN einzulesen. Die dritte Möglichkeit besteht in dem bereits angesprochenen Verfahren, die gewünschten Daten mit Hilfe von Excel in die Windows-Zwischenablage zu kopieren und anschließend in eine SPSS-Datendatei einzufügen.

4.3 Daten aus Dateien mit Fremdformat einlesen 35 y Enthält eine Spalte in der ersten Zeile eine leere Zelle oder eine Zelle, deren Inhalt bei SPSS keinen zulässigen Variablennamen bildet 14 (zum Beispiel einen numerischen Wert oder ein Sonderzeichen), wird die gesamte Spalte nicht in die SPSS-Datendatei eingelesen. Haben Sie also die Option Variablennamen einlesen angekreuzt, obwohl die erste Zeile der Quelldatei keine Variablennamen, sondern (numerische) Werte enthält, wird kein Wert aus der Quelldatei übernommen. y Sind die Variablennamen in der Quelldatei länger als acht Zeichen, werden die Namen abgeschnitten. y Ist ein Variablenname in der Quelldatei mehr als einmal enthalten, wird dieser Name nur für eine Variable (die als erstes in der Quelldatei aufgeführt ist) übernommen. Den übrigen Variablen, die den gleichen Namen verwenden, weist SPSS einen Namen zu, der nichts mit dem Namen in der Quelldatei zu tun hat. Auf die gleiche Weise verfährt SPSS, wenn Variablennamen, die in der Quelldatei eine Länge von mehr als acht Zeichen haben, in den ersten acht Zeichen übereinstimmen. ¾ Bereich: Möchten Sie nicht den gesamten Inhalt der Tabellendatei einlesen, sondern lediglich einen Teil der Tabelle, geben Sie den gewünschten Wertebereich in dem Feld Bereich an. Zur Beschreibung des Wertebereichs können Sie den Ausdruck eingeben, der auch in der Tabellenkalkulation, mit der die Datei erstellt wurde, verwendet wird. Wenn Sie dem Wertebereich in der Quelldatei einen Namen zugewiesen haben, können Sie auch diesen in das Feld Bereich schreiben. Beispielsweise können Sie einen Wertebereich aus einer Excel- Tabelle durch die Angabe A2:H300 beschreiben. Haben Sie diesem Bereich in der Excel-Tabelle den Namen Medizindaten gegeben, können Sie alternativ diesen Begriff in das Feld Bereich schreiben. Berücksichtigen Sie beim Einlesen von Tabellendateien weiterhin die folgenden Hinweise: ¾ Variablennamen: Wenn Sie keine Variablennamen einlesen, bildet die erste Zeile der Tabellendatei auch die erste Datenzeile in der SPSS-Datendatei. Die Variablen werden dann bei SPSS nach den Spaltennamen der Quelldatei benannt. In Abbildung 4.3 würde die erste Variable somit den Namen A, die zweite den Namen B etc. erhalten. Dies entspricht der üblichen Bezeichnung der Spalten bei Excel sowie bei Lotus. Wird in der Quelldatei das Bezugsformat Z1S1 (bei englischsprachigen Anwendungen R1C1 ) verwendet, weist SPSS den Variablen die Namen C1, C2, C3 etc. zu. ¾ Variablentyp: SPSS bestimmt den Variablentyp für jede Variable automatisch anhand des in der ersten Datenzeile enthaltenen Wertes. Dabei unterscheidet SPSS nicht nur zwischen Text und numerischen Daten, sondern ist auch in der Lage, spezielle Formatierungen wie Datumsformate oder Zahlen in wissenschaftlicher Notation (1,30E+17) zu erkennen. 14 Unter Abschnitt 5.2.2, Variablennamen festlegen, S. 63 wird dargestellt, welche Regeln beim Zuweisen von Variablennamen beachtet werden müssen.

36 Kapitel 4 Datendateien Diese in vielen Fällen sehr hilfreiche Automatik ist leider nicht immer ganz unproblematisch. Enthält die Datendatei beispielsweise eine Textvariable, die sowohl numerische als auch alphanumerische Werte beinhaltet, wird der Variablen von SPSS ein numerisches Format zugewiesen, wenn in der ersten Zelle zufällig eine Zahl enthalten ist. Dies führt dazu, daß die alphanumerischen Werte dieser Variablen von SPSS nicht übernommen werden und den entsprechenden Feldern ein fehlender Wert zugewiesen wird (siehe folgenden Punkt). Problematischer noch ist die Tatsache, daß SPSS auch die Spaltenbreite anhand des Wertes in der ersten Datenzeile festlegt (wobei die von SPSS gewählte Spaltenbreite nicht exakt mit der Zeichenzahl des ersten Wertes übereinstimmt). Weist SPSS auf diese Weise einer Textvariablen zum Beispiel eine Spaltenbreite von 10 zu, werden alle in dieser Variablen enthaltenen Werte, die mehr als zehn Zeichen umfassen, abgeschnitten. ¾ Leere Felder/Fehlende Werte: Enthält eine numerische Variable (gemeint ist eine Variable, die in der ersten Datenzeile eine Zahl enthält und daher von SPSS ein numerisches Format zugewiesen bekommt) leere Felder oder Werte, die nicht dem numerischen Variablentyp entsprechen (insbesondere Textwerte), werden diese von SPSS automatisch in systemdefinierte fehlende Werte 15 umgewandelt. Enthält eine Textvariable leere Felder, werden diese von SPSS auch als leere Felder übernommen, ohne daß ihnen ein fehlender Wert zugewiesen wird. Der Grund hierfür besteht darin, daß ein leeres Feld für Textvariablen einen zulässigen Wert darstellt. Enthält eine Textvariable allerdings einen numerischen Wert (beispielsweise die Zahl 4), wird dieser nicht übernommen, sondern in ein leeres Feld umgewandelt. Eine Motivation hierfür läßt sich jedoch schwer finden, da Ziffern sowie Ziffernfolgen zulässige Werte für eine Textvariable bei SPSS sind (sie werden lediglich nicht als Zahl, sondern als Text interpretiert). dbase-dateien öffnen Beim Einlesen von dbase-dateien verfährt SPSS folgendermaßen: ¾ Variablennamen: Die Feldnamen der dbase-datei werden automatisch als Variablennamen in die SPSS-Datendatei übernommen. Feldnamen mit einer Länge von mehr als acht Zeichen werden abgeschnitten, so daß die ersten acht Zeichen des Feldnamens als Variablenname verwendet werden. Stimmen zwei oder mehr Feldnamen in den ersten acht Zeichen überein, wird der aus den ersten acht Zeichen gebildete Name lediglich für eine der betreffenden Variablen verwendet. Den übrigen Variablen weist SPSS einen Namen zu. 15 Zum Begriff systemdefinierter fehlender Werte siehe Abschnitt 5.1, Struktur einer Datendatei, S. 53.

4.3 Daten aus Dateien mit Fremdformat einlesen 37 Enthält ein Feldname in der dbase-datei einen Doppelpunkt, wird dieser in einen Unterstrich umgewandelt. ¾ Variablentyp: Der Variablentyp wird aus der dbase-datei übernommen und anhand des Feldtyps festgelegt. ¾ Zum Löschen markierte Datensätze: Enthält die dbase-datei Datensätze, die bereits als gelöscht gekennzeichnet, jedoch noch nicht aus der Datei entfernt wurden, werden auch diese in die SPSS-Datendatei eingelesen. Dabei erstellt SPSS automatisch eine zusätzliche Variable mit dem Namen d_r, die der Kennzeichnung der gelöschten Datensätze dient. Diese Variable ist vom Typ String (mit der Spaltenbreite 1) und enthält in jedem als gelöscht gekennzeichneten Fall einen Stern (*), während die Felder der übrigen Fälle leer sind. 16 Textdateien mit Tabulator als Trennzeichen öffnen Wenn Sie eine Tabulator-getrennte Textdatei öffnen, zeigt SPSS vor dem Einlesen der Daten das in Abbildung 4.2, S. 34 dargestellte Dialogfeld an, in dem jedoch - anders als in Abbildung 4.3 - lediglich die Option Variablennamen einlesen zur Verfügung steht. Kreuzen Sie diese Option an, wenn SPSS die Variablennamen aus der ersten Zeile der Textdatei einlesen soll. Dabei gelten die gleichen Regeln, die im Abschnitt Excel-, Lotus- und SYLK-Dateien öffnen, S. 34 für Tabellendateien genannt wurden. Wenn die Variablennamen nicht aus der Datendatei eingelesen werden, weist SPSS den Variablen die Namen var1, var2 etc. zu. Abbildung 4.4 zeigt den typischen Aufbau einer Tabulator-getrennten Textdatei, in der die erste Zeile die Variablennamen enthält. Dabei stehen die Pfeile als Platzhalter für die als Trennzeichen dienenden Tabulatoren. Wenn Sie eine solche Datei mit einem Texteditor betrachten, sind diese Tabulatoren häufig nicht als solche zu erkennen. Tabulator-getrennte Textdatei SPSS-Datendatei Wohnort Alter Geschlecht Hamburg 24 m Berlin 37 w München 43 w Abbildung 4.4: Einlesen von Daten und Variablennamen aus einer tabulator-getrennten Textdatei 16 Möchten Sie alle Fälle, die in der dbase-datei als gelöscht gekennzeichnet waren, auch in der SPSS-Datendatei endgültig löschen oder vorübergehend herausfiltern, können Sie hierzu den Befehl DATEN, FÄLLE AUSWÄHLEN verwenden. Wählen Sie in dem damit geöffneten Dialogfeld die Option Falls Bedingung zutrifft, und geben Sie die Bedingung d_r ~= * ein. Zu diesem Befehl siehe ausführlicher Abschnitt 10.4, Einzelne Fälle zur Analyse auswählen, S. 276.

38 Kapitel 4 Datendateien Berücksichtigen Sie beim Einlesen der Dateien weiterhin folgende Regeln: ¾ Namenserweiterung: Damit SPSS die Datei als Datendatei einlesen kann, muß die Datei die Namenserweiterung.dat tragen. Möchten Sie eine Datei mit einer anderen Namenserweiterung wie beispielsweise.txt öffnen, müssen Sie zunächst den Dateinamen entsprechend abändern. (Hierzu können Sie entweder die Datei in einem Texteditor öffnen und mit der Namenserweiterung.dat speichern, oder Sie können den Namen im Windows Explorer ändern.) Dateien mit der Namenserweiterung.txt werden von SPSS automatisch als Syntaxdateien und nicht als Datendateien geöffnet. ¾ Variablentyp: Beim Einlesen Tabulator-getrennter Textdateien unterscheidet SPSS lediglich zwischen numerischen Werten und Textwerten. Andere Formate wie beispielsweise Datumsangaben werden nicht als solche erkannt. Anhand des in der ersten Datenzeile enthaltenen Wertes weist SPSS jeder Variablen in der Datendatei automatisch einen Variablentyp (Numerisch oder String) zu. 17 4.3.2 Textdateien im ASCII-Format lesen Im vorgehenden Abschnitt wurde gezeigt, wie Sie Textdateien, bei denen die Werte durch einen Tabulator getrennt sind, mit dem Befehl DATEI, ÖFFNEN einlesen können. Ergänzend bietet der Befehl DATEI, ASCII-DATEN EINLESEN die Möglichkeit, solche Textdateien einzulesen, in denen die Daten als sogenannter freier Text oder in einem Format mit fest vorgegebenen Spaltenbreiten gespeichert sind. Textdatei mit freiem Format lesen Der Aufbau dieser Textdateien kann keinesfalls so frei gewählt werden, wie die Bezeichnung suggeriert. Vielmehr müssen die Dateien folgende Struktur aufweisen, damit sie von SPSS gelesen werden können: ¾ Die Variablennamen sollten nicht in der Datei enthalten sein. SPSS ist nicht in der Lage, die Namen als solche zu erkennen, und würde sie daher als Datenwerte interpretieren. ¾ Die Datenwerte müssen für jeden Fall in derselben Reihenfolge aufgeführt werden. Dabei ist es nicht erforderlich, daß jeder Fall genau einer Zeile der Textdatei entspricht. Vielmehr ist die Verteilung der Werte auf unterschiedliche Zeilen vollkommen irrelevant. Beispielsweise können sämtliche Werte der Datei in einer einzigen Zeile hintereinander geschrieben werden, und ebenso könnte die Datei für jeden Wert eine eigene Zeile aufweisen. Die Aufteilung der Werte auf verschiedene Zeilen muß auch nicht in der gesamten Datei einheitlich sein. Wichtig ist lediglich, daß die einzelnen Werte in der richtigen 17 Beachten Sie die erheblichen Probleme, die sich aus dem automatischen Zuweisen des Variablentyps ergeben können. Vgl. hierzu den Aufzählungspunkt Variablentyp auf S. 35.

4.3 Daten aus Dateien mit Fremdformat einlesen 39 Reihenfolge aufgeführt werden: An erster Stelle wird der erste Wert des ersten Falles genannt, an zweiter Stelle der Wert der zweiten Variablen im ersten Fall etc. Nach dem Wert, den die letzte Variable im ersten Fall aufweist, folgen die Werte des zweiten Falls in der gleichen Reihenfolge. Abbildung 4.5 skizziert drei Dateien im freien Textformat, die in unterschiedlicher Anordnung die gleichen Daten enthalten. Die Absatzmarken ( ) zeigen an, an welchen Stellen ausdrücklich der Beginn eines neues Absatzes festgelegt wurde. Jede der drei Dateien liefert beim Einlesen in SPSS die in Abbildung 4.4 dargestellte Datendatei. Hamburg 24 m Berlin 37 w München 43 w Hamburg 24 m Berlin 37 w München 43 w Hamburg 24 m Berlin 37 w München 43 w Abbildung 4.5: Zulässige Anordnungen der Daten in einer frei formatierten Textdatei ¾ Die einzelnen Werte in der Datei müssen durch ein einheitliches Zeichen voneinander getrennt sein. Hierbei kann es sich grundsätzlich um ein beliebiges Zeichen handeln, das Zeichen darf jedoch an keiner Stelle zugleich Bestandteil eines Datenwertes sein. Eine Besonderheit ergibt sich, wenn Leerzeichen als Trennzeichen verwendet wurden. Sofern Sie in den Ländereinstellungen von Windows als Dezimaltrennzeichen einen Punkt festgelegt haben, interpretiert SPSS in diesem Fall nicht nur Leerzeichen, sondern auch Kommata als Trennzeichen zwischen zwei Werten. Der Ausdruck 1,5 stellt dann die beiden Werte 1 und 5 dar. Ebenso würde der Ausdruck Kiel,Schleswig-Holstein die beiden Werte Kiel und Schleswig-Holstein bezeichnen. Haben Sie jedoch als Dezimaltrennzeichen ein Komma festgelegt, interpretiert auch SPSS das Komma als Dezimaltrennzeichen, einen Punkt jedoch nicht als Trennzeichen zwischen zwei Werten! Beachten Sie auch, daß SPSS jeden Textwert, der aus zwei durch ein Leerzeichen getrennten Wörtern besteht, als zwei einzelne Werte auffaßt, wenn zur Trennung zwischen den Werten Leerzeichen verwendet wurden. Der Ausdruck Lisa Müller bezeichnet somit die beiden Werte Lisa und Müller. ¾ In der Datei dürfen keine Werte fehlen. Das Fehlen einzelner Werte würde den gesamten Aufbau der restlichen Datendatei durcheinanderbringen. Sie können jedoch an der Stelle eines fehlenden numerischen Wertes ein Dezimaltrennzeichen (ohne weitere Ziffern) eingeben. SPSS weist dem entsprechenden Feld in der SPSS-Datendatei dann einen systemdefinierten fehlenden Wert zu. Beachten Sie hierbei auch, daß SPSS beim Einlesen der Datei nicht zwischen einem und mehreren Trennzeichen zwischen den Datenwerten unterscheidet. Zwei oder mehr Trennzeichen zwischen zwei Datenwerten haben somit den gleichen Effekt wie ein einzelnes Trennzeichen. Insbesondere deutet SPSS mehrere Trennzeichen in Folge nicht als Hinweis auf das Auslassen eines Wertes.

40 Kapitel 4 Datendateien ¾ Als Dezimaltrennzeichen muß das in den Ländereinstellungen von Windows festgelegte Zeichen verwendet werden. Um eine Textdatei im freien Format einzulesen, wählen Sie den Menübefehl DATEI ASCII-DATEN EINLESEN FREIES FORMAT. Der Befehl öffnet das in Abbildung 4.6 dargestellt Dialogfeld. Dieses Dialogfeld dient dazu, die zu öffnende Textdatei anzugeben und den Aufbau der Datei zu beschreiben. Das abgebildete Dialogfeld enthält die Beschreibung, mit der die in Abbildung 4.5 dargestellten Dateien gelesen werden können. Abbildung 4.6: Dialogfeld zum Einlesen von Textdateien im freien Format ¾ Dateinamen angeben: Klicken Sie auf die Schaltfläche Durchsuchen, um den Namen der Textdatei anzugeben. Sie öffnen damit ein Dialogfeld, das im wesentlichen dem des Befehls DATEI, ÖFFNEN entspricht. Wählen Sie in diesem Dialogfeld mit den üblichen Methoden die gewünschte Textdatei aus, und klicken Sie anschließend auf die Schaltfläche OK. Anders als beim Öffnen Tabulator-getrennter Textdateien mit dem Befehl DATEI, ÖFFNEN ist es hierbei nicht erforderlich, daß die Textdatei die Namenserweiterung.dat trägt, auch wenn SPSS dies als Voreinstellung erwartet. ¾ Trennzeichen: Geben Sie in dieser Gruppe an, welches Zeichen in der Textdatei als Trennzeichen zwischen den Werten fungiert. Sie können zwischen den folgenden Optionen wählen: y Komma oder Leerzeichen: Die Wirkung dieser Option hängt davon ab, ob in den Ländereinstellungen von Windows ein Punkt oder ein Komma als Dezimaltrennzeichen festgelegt wurde. Ist dort ein Punkt als Dezimaltrennzeichen angegeben, wird mit dieser Option jedes Leerzeichen sowie jedes Komma in der Quelldatei als Trennzeichen zwischen zwei Datenwerten

4.3 Daten aus Dateien mit Fremdformat einlesen 41 interpretiert. Ist in den Ländereinstellungen dagegen das Komma als Dezimaltrennzeichen festgelegt, werden lediglich Leerzeichen in der Quelldatei als Trennzeichen angesehen, Kommata werden dagegen als Dezimaltrennzeichen angesehen. y Tabulator: Ausschließlich Tabulatoren werden als Dezimaltrennzeichen zwischen zwei Datenwerten interpretiert. y Andere: Wählen Sie diese Option, wenn ein anderes Zeichen als Trennzeichen in der Datendatei verwendet wurde, und geben Sie das betreffende Zeichen in das Eingabefeld ein. ¾ Variablen beschreiben: Zur Beschreibung des Aufbaus der Textdatei müssen Sie die in der Datei enthaltenen Variablen sowie den jeweiligen Variablentyp angeben. Beim Einlesen freier Textdateien unterscheidet SPSS lediglich zwischen numerischen Variablen und Textvariablen, ist also nicht in der Lage, spezielle Formatierungen wie beispielsweise Datums- oder Währungsformate zu erkennen. Zur Beschreibung der in der Datei enthaltenen Variablen gehen Sie folgendermaßen vor: y Geben Sie in dem Feld Name einen Namen für die erste Variable an. y Legen Sie anschließend in der Gruppe Datentyp fest, ob es sich um eine numerische oder um eine Textvariable handelt. Numerischen Variablen weist SPSS automatisch das Standardformat zu. Dies ist jedoch lediglich eine Formatierung, die nur die Darstellung im Dateneditor betrifft. In jedem Fall werden die numerischen Werte vollständig eingelesen, auch wenn sie die Länge des Standardformats überschreiten. Bei Variablen des Typs String (Textvariablen) können Sie die Breite der Variablen explizit festlegen. Als Voreinstellung verwendet SPSS eine Breite von acht Zeichen. Textwerte, welche die in dem Feld Breite festgelegte Zeichenzahl überschreiten, werden beim Einlesen der Datei abgeschnitten. Der übrige Aufbau der Datendatei gerät jedoch nicht durcheinander. y Wenn Sie Namen und Datentyp der ersten Variablen festgelegt haben, klicken Sie auf die Schaltfläche Hinzufügen, um die Variablendefinition in die Liste Definierte Variablen einzufügen. Anschließend können Sie mit der Beschreibung der zweiten Variablen fortfahren. Achten Sie unbedingt darauf, die Variablen in der richtigen Reihenfolge anzugeben und keine Variablen auszulassen, da andernfalls der gesamte Aufbau der Datei durcheinandergeraten würde. Um eine Variablendefinition nachträglich zu ändern oder zu löschen, wählen Sie den entsprechenden Eintrag aus. Anschließend können Sie Angaben bearbeiten und mit der Schaltfläche Ändern aktualisieren oder den gesamten Eintrag mit der Schaltfläche Entfernen löschen.

42 Kapitel 4 Datendateien ¾ Warnung bei unzulässigem Datenformat: Enthält die Textdatei an einer Stelle, an der ein numerischer Wert erwartet wird, einen Texteintrag, weist SPSS dem entsprechenden Feld in der Datendatei einen systemdefinierten fehlenden Wert zu. Gleichzeitig wird in den Ausgabenavigator eine Warnung mit einem Hinweis auf die Verletzung des Datenformats eingefügt. Um diesen Hinweis zu unterdrücken, wählen Sie die Option Bei unzulässigem Datenformat Warnung anzeigen ab. ¾ Daten einlesen: Wenn Sie den Dateinamen angegeben und sämtliche Variablen beschrieben haben, klicken Sie auf die Schaltfläche OK, um die Datendatei in eine SPSS-Datendatei einzulesen. Beachten Sie, daß hierbei nicht die Textdatei geöffnet, sondern lediglich die Daten eingelesen werden. Die Quelldatei bleibt dabei unverändert erhalten. Textdatei mit festem Format lesen Textdateien mit festem Format müssen folgendermaßen aufgebaut sein, damit sie problemlos von SPSS gelesen werden können: ¾ Die Variablennamen sollten nicht in der Datei enthalten sein, da sie von SPSS als Datenwerte interpretiert werden würden. ¾ Grundsätzlich sollte jeder Fall (jede Beobachtungseinheit) genau einer Zeile in der Textdatei entsprechen. Innerhalb dieser Zeile müssen die Werte der einzelnen Variablen an festen Spaltenpositionen stehen, so daß alle Werte derselben Variablen in den unterschiedlichen Zeilen jeweils an der gleichen Position beginnen. Geben beispielsweise das siebente und das achte Zeichen in der ersten Zeile den Wert für eine Variable Alter an, muß der entsprechende Wert des zweiten Falles auch durch die Zeichen sieben und acht in der zweiten Zeile angegeben werden. Da die Zuordnung eines Wertes zu einer Variablen somit durch seine Position festgelegt ist, sind spezielle Trennzeichen wie beispielsweise Leerzeichen zwischen den einzelnen Werten nicht erforderlich. Leerzeichen können jedoch als Füllzeichen beliebig zwischen den Werten eingefügt werden. Abbildung 4.7 zeigt drei alternative Möglichkeiten, die Daten in einer Textdatei im festen Format anzuordnen. Die Punkte stehen dabei als Platzhalter für Leerzeichen, die Absatzmarken ( ) zeigen die explizit eingefügten Übergänge zu einer neuen Zeile an. Von der Regel, daß ein Fall genau einer Zeile in der Textdatei entsprechen sollte, kann folgendermaßen abgewichen werden: Es ist zulässig, daß sich ein Fall über zwei oder mehr Zeilen erstreckt. Die Aufteilung eines Falles auf mehrere Zeilen muß dann jedoch für jeden Fall in exakt der gleichen Weise vorgenommen werden. Zudem muß der Übergang zu einer neuen Zeile zwischen zwei Variablen liegen, so daß nicht ein Wert in der ersten Zeile beginnt und in der zweiten fortgesetzt wird.

4.3 Daten aus Dateien mit Fremdformat einlesen 43 Hamburg 24 m Berlin 37 w München 43 w Hamburg24m Berlin 37w München43w Hamburg 24 m Berlin 37 w München 43 w Abbildung 4.7: Alternativen des Aufbaus einer Textdatei im festen Format ¾ Als Dezimaltrennzeichen darf ausschließlich das in den Ländereinstellungen der Windows-Systemsteuerung festgelegte Dezimaltrennzeichen verwendet werden. Numerische Werte mit einem anderen Dezimaltrennzeichen werden als fehlende Werte interpretiert. Den entsprechenden Feldern in der SPSS-Datendatei wird ein systemdefinierter fehlender Wert zugewiesen. Um eine Textdatei mit festem Format zu lesen, öffnen Sie mit dem Menübefehl DATEI ASCII-DATEN EINLESEN FESTES FORMAT das in Abbildung 4.8 dargestellte Dialogfeld. Die Abbildung zeigt die Dateibeschreibung, mit der die Daten aus dem ersten Beispiel der Abbildung 4.7 eingelesen werden können. Abbildung 4.8: Dialogfeld zum Einlesen einer Textdatei im festen Format ¾ Dateinamen angeben: Klicken Sie auf die Schaltfläche Durchsuchen, und wählen Sie in dem damit geöffneten Dialogfeld die gewünschte Textdatei aus. Diese Datei muß nicht die von SPSS als Voreinstellung erwartete Namenserweiterung.dat aufweisen.

44 Kapitel 4 Datendateien ¾ Variablen beschreiben: Sie müssen alle Variablen beschreiben, die aus der Textdatei eingelesen werden sollen. Dabei gilt: y Es müssen nicht alle Daten aus der Textdatei übernommen werden. Sie brauchen somit nur die tatsächlich benötigten Variablen anzugeben, die übrigen Daten werden dann beim Einlesen ignoriert. y Sie können die Variablen in beliebiger Reihenfolge beschreiben, müssen also nicht der Anordnung der Variablen in der Quelldatei folgen. y Sie können dieselben Daten in mehrere Variablen einlesen, so daß sich die Positionen dieser Variablen in der Textdatei überschneiden. Enthält die Datei beispielsweise an der Position 10 bis 30 Ortsnamen einschließlich der Postleitzahl in der Form 22453 Hamburg, können Sie eine Variable Postleitzahl (Position 10-14), eine Variable Ort (Position 16-30) und eine kombinierte Variable Anschrift (Position 10-30) einlesen. Zur Beschreibung der Variablen sind folgende Angaben erforderlich: y Geben Sie in dem Feld Name einen Namen für die Variable an. y Erstrecken sich einzelne Fälle über mehr als eine Zeile, geben Sie in dem Feld Zeile im Datensatz an, in welcher Zeile sich die Variable befindet. y Geben Sie in den Feldern Erste Spalte und Letzte Spalte die Position der Variablen innerhalb der Zeile an. Erstrecken sich die Werte einer Variablen Wohnort von Position 10 bis Position 30, schreiben Sie in das Feld Erste Spalte den Wert 10 und in das Feld Letzte Spalte den Wert 30. y Wählen Sie in der Dropdown-Liste Datentyp den Variablentyp aus. Beim Einlesen von Textdateien im festen Format kann SPSS zahlreiche spezielle Formatierungen (insbesondere unterschiedliche Datumsformate) erkennen. Um Textwerte einzulesen, wählen Sie das Format String. Als allgemeines Format für numerische Werte bietet sich die Voreinstellung Numerisch, wie vorgegeben an. Eine ausführlichere Beschreibung der zur Verfügung stehenden Datentypen finden Sie in der Online-Hilfe von SPSS unter dem Indexeintrag ASCII-Textdateien: Datentypen. y Wenn Sie Namen, Position und Format einer Variablen angegeben haben, klicken Sie auf die Schaltfläche Hinzufügen, um sie in die Liste Definierte Variablen einzufügen. ¾ Wert für Leerzeichen bei numerischen Variablen: Enthält eine numerische Variable in der Textdatei Einträge, die ausschließlich aus Leerzeichen bestehen, können Sie wählen, ob SPSS den entsprechenden Feldern in der Datendatei einen systemdefinierten fehlenden Wert oder einen speziellen numerischen Wert (beispielsweise den Wert -1) zuweisen soll. ¾ Daten einlesen: Nachdem Sie alle Variablenbeschreibungen vorgenommen und die Textdatei ausgewählt haben, starten Sie das Einlesen der Daten mit der Schaltfläche OK. Dabei bleibt die Textdatei unverändert erhalten, die Daten werden lediglich aus der Datei gelesen und in eine SPSS-Datei importiert.

4.3 Daten aus Dateien mit Fremdformat einlesen 45 4.3.3 Daten mit ODBC aus Datenbanken importieren Mit Hilfe von ODBC (Open Database Connectivity) können Sie Daten aus einer Datenbank beliebigen Formats einlesen. Voraussetzung hierfür ist jedoch, daß auf Ihrem Computer der entsprechende ODBC-Treiber installiert ist. Jedes Dateiformat erfordert einen speziellen Treiber, der eigens auf dieses Format ausgelegt ist. Neben Datenbankdateien können Sie auch Excel-Dateien im Format von Excel 5 oder höher mit Hilfe von ODBC einlesen. Das Importieren von Daten aus Datenbankdateien oder Excel-Dateien jüngeren Formats erfolgt mit Hilfe von Abfragen. Wenn Sie eine Abfrage einmal formuliert haben, können Sie sie nicht nur unmittelbar zum Einlesen der Daten verwenden, sondern Sie können die Abfrage auch speichern und später jederzeit erneut ausführen oder bearbeiten. Abfrage formulieren Um eine neue Abfrage zu erstellen, wählen Sie den Menübefehl DATEI DATENBANKZUGRIFF NEUE ABFRAGE... Dieser Befehl ruft einen Assistenten auf, der Sie schrittweise durch den Vorgang zum Erstellen der Abfrage leitet. Dieser Vorgang umfaßt insgesamt sechs Schritte, die im folgenden nur kurz skizziert werden sollen. Der Assistent ist recht anschaulich gestaltet und zudem mit eigenen Hinweisen versehen, so daß das Importieren der Daten keine Probleme verursachen sollte. ¾ Schritt 1: Datenquelle auswählen. Geben Sie im ersten Schritt die Art der Datenquelle (Excel-Datei, Access-Datenbank, Paradox-Datenbank etc.) an. Die in Frage kommenden Datenquellen werden in einer Liste aufgeführt, aus der Sie den gewünschten Dateityp auswählen können. Anschließend werden Sie aufgefordert, den Namen der Quelldatei anzugeben. Haben Sie eine Datenquelle ausgewählt, die auf Ihrem Computer durch ein Paßwort geschützt ist, werden Sie um die Angabe dieses Paßwortes gebeten. ¾ Schritt 2: Tabellen und Felder auswählen. Nach der Angabe der Quelldatei werden alle in dieser Datei enthaltenen Tabellen sowie die darin enthaltenen Felder (Variablen) aufgeführt. Wählen Sie aus dieser Liste die zu importierenden Tabellen oder auch einzelne Felder aus, indem Sie sie aus der linken Liste Verfügbare Tabellen in die rechte Liste Felder in dieser Reihenfolge einlesen verschieben. Einzelne Felder, die Sie nicht einlesen möchten, können Sie aus der rechten Liste wieder entfernen, indem Sie sie in die linke Liste zurückschieben. ¾ Schritt 3: Beziehungen erstellen. Wenn Sie mehr als eine Tabelle zum Einlesen ausgewählt haben, müssen Sie eine Beziehung (Relation) zwischen den Tabellen herstellen. Eine solche Beziehung gibt an, in welcher Weise die Tabellen miteinander zusammenhängen, und legt damit fest, wie die Datensätze

46 Kapitel 4 Datendateien der verschiedenen Tabellen zu einheitlichen Datensätzen zusammengefaßt werden. Sie können zwei Arten von Beziehungen herstellen: y Innere Verbindung: Bei einer inneren Verbindung werden nur solche Datensätze eingelesen, bei denen die Werte in den miteinander verbundenen Feldern übereinstimmen. Enthält eine Tabelle in einem verbundenen Feld einen Wert, der in der anderen Tabelle nicht enthalten ist, wird der betreffende Fall nicht in die SPSS-Datendatei übernommen. y Äußere Verbindung: Bei einer äußeren Verbindung ist die Richtung der Verbindung relevant. Wird eine äußere Verbindung von Tabelle A auf Tabelle B hergestellt, werden aus Tabelle A sämtliche Datensätze eingelesen, während aus Tabelle B nur solche Datensätze eingelesen werden, die in den verbundenen Feldern Werte enthalten, die auch in den entsprechenden Feldern der Tabelle A vorkommen. Abbildung 4.9 skizziert das Importieren von Daten aus zwei Tabellen, die wahlweise über eine innere oder über eine äußere Verbindung miteinander verknüpft werden können. Tabelle: Personen Wohnort Alter Geschlecht Hamburg 24 m Berlin 37 w Hamburg 22 w Frankfurt 38 m München 43 w Tabelle: Orte Wohnort Vorwahl Hamburg 040 Berlin 030 München 089 Innere Verbindung Äußere Verbindung von Personen auf Orte Wohnort Alter Geschlecht Vorwahl Hamburg 24 m 040 Berlin 37 w 030 Hamburg 22 w 040 München 43 w 089 Wohnort Alter Geschlecht Vorwahl Hamburg 24 m 040 Berlin 37 w 030 Hamburg 22 w 040 Frankfurt 38 m, München 43 w 089 Abbildung 4.9: Daten importieren aus zwei Tabellen mit innerer und äußerer Beziehung

4.3 Daten aus Dateien mit Fremdformat einlesen 47 ¾ Schritt 4: Fälle auswählen. Sie können Kriterien festlegen, durch welche die zu importierenden Fälle näher beschrieben werden. Beispielsweise könnten Sie für die Tabellen aus Abbildung 4.9 vorgeben, daß nur solche Fälle importiert werden sollen, die sich auf Personen mit einem Alter unter 30 Jahren beziehen. 18 In jede Zeile der Tabelle in dem Dialogfeld können Sie eine Bedingung eingeben. In der ersten Spalte Verbindung legen Sie fest, ob die Bedingung der betreffenden Zeile zusätzlich (AND) zu den vorhergehenden Bedingungen erfüllt sein muß, oder ob es genügt, wenn eine der Bedingungen erfüllt ist (OR = Logisches Oder). In der ersten Zeile und damit für die erste Bedingung bleibt die Spalte Verbindung leer, da es noch keine vorhergehenden Bedingungen gibt, zu denen eine Verbindung hergestellt werden müßte. Zur Formulierung der Bedingung fügen Sie in die Spalten Ausdruck 1 und Ausdruck 2 jeweils einen Ausdruck ein, und wählen Sie in der Spalte Relation aus der Dropdown-Liste einen Vergleichsoperator (=, >, <= etc.). In der Liste Funktionen werden alle zur Formulierung eines Ausdrucks zur Verfügung stehenden Funktionen aufgezählt. Wenn Sie auf einen Eintrag dieser Liste doppelklicken, wird die betreffende Funktion in das aktuell markierte oder das nächste zu bearbeitende Ausdruck-Feld eingefügt. Auf die gleiche Weise können Sie Felder aus der Quelldatei in einen Ausdruck einfügen. ¾ Schritt 5: Variablen definieren. Im fünften Schritt wird ein Dialogfeld eingeblendet, in dem alle aus der Datenquelle zu lesenden Felder aufgeführt werden. Jedes dieser Felder bildet in der SPSS-Datendatei eine Variable, für die Sie an dieser Stelle einen Namen festlegen können. ¾ Schritt 6: Daten einlesen oder Abfrage speichern. Im fünften Schritt können Sie wählen, ob die Daten unmittelbar in eine SPSS-Datendatei eingelesen oder die bisher vorgenommene Beschreibung in Form von SPSS-Syntax in einer Syntaxdatei eingefügt werden soll. Zusätzlich besteht die Möglichkeit, die formulierte Abfrage als Datei zu speichern. Geben Sie hierzu in dem Feld Abfrage als Datei speichern das Zielverzeichnis und den Namen für die Abfrage an, oder wählen Sie beides in dem Dialogfeld der Schaltfläche Durchsuchen aus. Die Dateien erhalten per Voreinstellung die Namenserweiterung.spq. Abfrage bearbeiten Sie können eine gespeicherte Abfrage bearbeiten. Wählen Sie hierzu den Befehl DATEI DATENBANKZUGRIFF ABFRAGE BEARBEITEN... 18 Das Formulieren derartiger Kriterien wird in allgemeiner Form im Abschnitt 9.1.4, Bedingung zur Beschränkung auf einzelne Fälle formulieren, S. 220 beschrieben. Die Bedeutung der zur Verfügung stehenden Funktion wird im Kapitel 44, Funktionen dargestellt, das sich auf der beigefügten CD-ROM befindet.

48 Kapitel 4 Datendateien Dieser Befehl öffnet ein Dialogfeld, in dem die Datei der zu bearbeitenden Abfrage auszuwählen ist. Anschließend wird ein weiteres Dialogfeld zum Öffnen einer Datei eingeblendet. Hier muß die Quelldatei bestimmt werden, auf die die Abfrage im folgenden angewendet werden soll. 19 Nachdem Sie auch diese Datei angegeben haben, wird die Abfrage in ihrer bisherigen Form angezeigt. Hierzu wird das Dialogfeld eingeblendet, das dem sechsten Schritt beim Erstellen einer Abfrage entspricht (s.o.). Mit der Schaltfläche Zurück können Sie auch die früheren Schritte des Formulierens einer Abfrage wieder aufrufen und damit die Abfrage beliebig verändern. Abfrage ausführen Um eine gespeicherte Abfrage auszuführen, wählen Sie den Befehl DATEI DATENBANKZUGRIFF ABFRAGE AUSFÜHREN... Damit wird ein Dialogfeld eingeblendet, in dem Sie die Datei der gewünschten Abfrage auswählen können. Klicken Sie anschließend auf die Schaltfläche Öffnen, mit der die Abfrage unmittelbar ausgeführt wird. 4.4 Datendatei speichern Jede an einer Datei vorgenommene Änderung muß vor dem Schließen der Datei gespeichert werden, wenn die Änderung erhalten bleiben soll. Andernfalls gehen die Änderungen verloren, und die Datei liegt anschließend in der zuletzt gespeicherten Form vor. Wird eine Datei geschlossen, ohne jemals gespeichert worden zu sein, werden alle Inhalte der Datei endgültig gelöscht. Dies gilt nicht nur für Datendateien, sondern auch für Dateien in allen anderen Formaten wie beispielsweise Syntaxdateien und Navigatordokumente. Zum Speichern einer Datei stehen die beiden Befehle DATEI, SPEICHERN und DATEI, SPEICHERN UNTER zur Verfügung. Jeder der beiden Befehle speichert die jeweils aktive Datei. Um eine nicht aktive Datei zu speichern, müssen Sie diese daher zunächst zur aktiven Datei machen, zum Beispiel durch Anklicken des entsprechenden Fensters mit der Maus oder durch Auswählen der Datei im Menü FENSTER. Grundsätzlich dient der Befehl DATEI, SPEICHERN dazu, eine Datei unter ihrem bisherigen Namen sowie im bisher verwendeten Dateiformat zu speichern. Mit dem Befehl DATEI, SPEICHERN UNTER können Sie eine Datei dagegen unter einem neuen Namen und/oder mit einem neuen Format speichern. Wenn Sie allerdings 19 Es wurde zwar auch beim Erstellen der Abfrage eine Quelldatei festgelegt, da die Abfrage jedoch auch auf andere Dateien mit geeigneter Datenstruktur angewandt werden kann, wird die Quelldatei hier erneut abgefragt.