W.-M_ Kähler W.Schulte. SAS für Anfänger

Ähnliche Dokumente
W.-M. Kahler W. Schulte. SAS - Eine anwendungsorientierte

H. Pudlatz. Einführung in die Programmiersprache Modula-2

Vieweg Programmbibliothek Mikrocomputer 39. Simulationen in BASIC mit dem IBM PC, XT, AT

Dateneingabe und Transformation Übersicht

F. Sause W. Tölle. Einführung in die Programmiersprache C++

Regina B. und Rolf B. Baumeister (Hrsg.) Chart Software Training

SAS-Online Dokumentation: zu finden über Internetsuche nach sas online documentation

Effektives Arbeiten mit SAS

Wolf-Michael Köhler. SPSS für Windows

Software-Praktikum. Ein praxisorientiertes Vorgehen zur Software-Erstellung

Stefan Hering PC TOOLS 6.0. Ein praxisgerechtes Nachschlagewerk

Regina B. und Rolf B. Baumeister (Hrsg.) dbase III Software Training

Aufgabensammlung zur Einführung in die Statistik

Geyer Kredite aktiv verkaufen

Günter Wellenreuther Dieter Zastrow. Lösungsbuch Speicherprogrammierte Steuerungen SPS

Aufgabensammlung Fertigungstechnik

Ludwig Brandt. Antennentechnik. BASIC-Programme für den PC

Hans-Georg Kemper Henning Baars. Business Intelligence Arbeits- und Übungsbuch

Inhaltsverzeichnis. Vorwort

Grundlagen der Wahrscheinlichkeitsrechnung und Statistik

Günther Bourier. Statistik-Übungen

Günter Schmidt. Prozessmanagement. Modelle und Methoden. 3. überarbeitete Auflage

Springer Spektrum, Springer Vieweg und Springer Psychologie.

Experimente in der Politikwissenschaft

Kundenzufriedenheit im Mittelstand

Vermögenseinlagen stiller Gesellschafter, Genußrechtskapital und nachrangige Verbindlichkeiten als haftendes Eigenkapital von Kreditinstituten

Ratgeber Zwangsstörungen

Thomas Köhler. Das Selbst im Netz

Das C-Teile-Management bei KMU

Aufgabensammlung Technische Mechanik 2

Ratgeber zur Reihe Fortschritte der Psychotherapie Band 5 Ratgeber Bluthochdruck von Prof. Dr. Dieter Vaitl

Paul Chlebek. Praxis der User Interface-Entwicklung

Susanne von Bassewitz Stereotypen und Massenmedien Zum Deutschlandbild in französischen Tageszeitungen

Informatik. Christian Kuhn. Web 2.0. Auswirkungen auf internetbasierte Geschäftsmodelle. Diplomarbeit

Reiner Schmalz-Bruns Ansätze und Perspektiven der Institutionentheorie

Gene Zelazny Wie aus Zahlen Bilder werden

Planung der Materialbereitstellung in der Montage

Frau Schmitt, die Zigaretten und Sie

SURFJGGDWD IODHFKH SORW\[ ]FWRS \HOORZFWH[W EODFN

Erstellung eines Prototyps zum sicheren und gesteuerten Zugriff auf Dateien und Dokumente auf Basis von Lotus Domino und Notes

Thomas Schäfer. Statistik II

Sport. Silke Hubrig. Afrikanischer Tanz. Zu den Möglichkeiten und Grenzen in der deutschen Tanzpädagogik. Examensarbeit

Werkzeuge der empirischen Forschung

Grundlagen der doppelten Buchführung

Heinz-Jürgen Axt EU -Strukturpolitik

Mädchen spielen mit Puppen Jungen auch?

Bibliografische Information der Deutschen Nationalbibliothek:

Diplomarbeit BESTSELLER. Eva-Maria Matzker. Einrichtungen des Gesundheitswesens strategisch steuern. Anwendung der Balanced Scorecard

Niklas Hoppe/Friedrich Conzen. Europäische Europaische Distributionsnetzwerke

Ursula Schindler Kurt Klinner Wolfram Nestler. Excel-Grundlagen der Makroprogrammierung

Ralf Bohnsack Rekonstruktive Sozialforschung

Sandor Vajna Reinhard Ledderbogen. CATIAV5 - kurz und bündig

Bibliografische Information der Deutschen Nationalbibliothek:

Kapitalbedarfs- und Liquiditätsplanung bei einer Existenzgründung

COBOL Programmierte Unterweisung

Wolfgang Schneider. Einführung in BASIC

Kurt Franke (Hrsg.) Demokratie Lernen in Berlin

Vorwort 11 1 Einleitung Überblick Hardwareausstattung Softwarebausteine Programmentwicklung 19

Die Big Five und ihre Auswirkungen auf das Gründungsverhalten

Die Balanced Scorecard als Instrument des strategischen Managements aus Sicht eines mittelständischen Logistikunternehmens

McNeil Die Kraft im Zentrum

Spalten aufsummieren?!

Ratgeber Depression Hogrefe Verlag GmbH & Co. KG. Keine unerlaubte Weitergabe oder Vervielfältigung

ispa Prof. Dr. K.-F. Ackermann. Risikomanagement im Personalbereich

Jurgen Burberg Peter Schneid erlochner. Microsoft Excel 3.0. Einsteigen leichtgemacht

Das Internet als Instrument der Unternehmenskommunikation unter besonderer Berücksichtigung der Investor Relations

Hans-Jiirgen Bucher Ulrich Piischel (Hrsg.) Die Zeitung zwischen Print und Digitalisierung

Alfred Böge Wolfgang Böge Hrsg. Handbuch Maschinenbau. Grundlagen und Anwendungen der Maschinenbau-Technik 23. Auflage

Baizer Buchungen zum Jahresabschluß

Alfred Böge I Walter Schlemmer. Lösungen zuraufgabensammlung Technische Mechanik

Grundlagen der Finanzbuchhaltung

Sebastian Lerch. Selbstkompetenzen. Eine erziehungswissenschaftliche Grundlegung

Spätes Bietverhalten bei ebay-auktionen

Statistik IV Übung mit Stata 10. Statistik IV. 3. Datenaufbereitung II und erste Auswertungen. Göttingen 27. Mai Dozent: Jürgen Leibold

Holland/Holland. Mathematik im Betrieb

Annette von Alemann Soziologen als Berater

Verhaltenstherapeutische Hypnose bei chronischem Schmerz

Michael Pfeifer Bildungsbenachteiligung und das Potenzial von Schule und Unterricht

Bibliografische Information der Deutschen Nationalbibliothek:

Dennis Julius Broich. Mitarbeiterbindung in KMU. Analyse von Instrumenten und Maßnahmen

Georg-Moria Meyer / Sabine Collmer Zum UN-Einsatz bereit?

Das Konzept der organisationalen Identität

/.../ ein absolut lohnenswertes Buch. Prof. Dr. Stephan Kleuker, FH Nordakademie

S. Dietze / G. Pönisch. Starthilfe Graphikfähige Taschenrechner und Numerik

Josef Maisch. Wissensmanagement am Gymnasium

Soziale Arbeit in der Sozialhilfe

Werner Holly Ulrich Püschel Jörg Bergmann (Hrsg.) Der sprechende Zuschauer

Führung und Mikropolitik in Projekten

Programmieren lernen mit Perl

Fortschritte der Psychotherapie Manuale für die Praxis

Usability Analyse des Internetauftritts der Firma MAFI Transport-Systeme GmbH

Psychologische Tests und mehrwertige Logik

Bibliografische Information der Deutschen Nationalbibliothek:

Yoga - die Kunst, Körper, Geist und Seele zu formen

Illegale Migration und transnationale Lebensbewältigung

Arbeitsbuch Mathematik

Coaching in der Sozialwirtschaft

Dietmar Herrmann. Programrnierprinzipien in BASIC und Pascal

Michael Matzner. Vaterschaft aus der Sicht van Vătern

Transkript:

W.-M_ Kähler W.Schulte SAS für Anfänger

Mathematik für ---... Sozial- und Wirtschaftswissensehaft Elementare Einführung in die angewandte Statistik, von K. Bosch Aufgaben und Lösungen zur angewandten Statistik, von K. Bosch Elementare Einführung in die Wahrscheinlichkeitsrechnung, von K. Bosch Multivariate Statistik in den Natur- und Verhaltenswissenschaften, von C. M. Haf und T. Cheaib Mathematik für Wirtschaftswissenschaftler, von F. Pfuff SAS für Anfänger von W.-M. Kähler und W. Schulte SPSS X für Anfänger, von W.-M. Kähler Mikrocomputer-COBOL, von W.-M. Kähler Einführung in die Programmiersprache COBOL, von W.-M. Kähler Einführung in die Programmiersprache BASIC, von W.-D. Schwill und R. Weibezahn Einführung in die Programmiersprache Pascal, von K.-H. Becker und G. Lamprecht Methoden und Modelle des Operations Research, von H.-J. Zimmermann Vieweg -----------------/

Wolf-Michael Kähler Werner Schulte SAS für Anfänger Einführung in das Programmsystem Mit 9 Tabellen und 75 Abbildungen Springer Fachmedien Wiesbaden GmbH

CIP-Titelaufnahme der Deutschen Bibliothek Kähler, Wolf-Michael: SAS flir Anfänger: Einf. in d. Programmsystem/ Wolf-Michael Kähler; Werner Schulte. Braunschweig; Wiesbaden: Vieweg, 1987 (Mathematik flir Sozial- und Wirtschaftswissenschaft ) NE: Schulte, Werner: Eingetragene Warenzeichen sind nicht besonders gekennzeichnet. Deshalb ist den Bezeichnungen nicht zu entnehmen, ob sie freie Warennamen sind bzw. ob Patente oder Gebrauchsmuster vorliegen. Das in diesem Buch enthaltene Programm-Material ist mit keiner Verpflichtung oder Garantie irgendeiner Art verbunden. Der Autor übernimmt infolgedessen keine Verantwortung und wird keine daraus folgende oder sonstige Haftung übernehmen, die auf irgendeine Art aus der Benutzung dieses Programm Materials oder Teilen davon entsteht. Alle Rechte vorbehalten Springer Fachmedien Wiesbaden 1987 Ursprünglich erschienen bei Friedr. Vieweg & Sohn Verlagsgesellschaft mbh, Braunschweigl987. Das Werk einschließlich aller seiner Teile ist urheberrechtlich geschützt. Jede Verwertung außerhalb der engen Grenzen des Urheberrechtsgesetzes ist ohne Zustimmung des Verlags unzulässig und strafbar. Das gilt insbesondere für Vervielfältigungen, Übersetzungen, MikroverfIlmungen und die Einspeicherung und Verarbeitung in elektronischen Systemen. Umschlaggestaltung: Peter Lenz, Wiesbaden ISBN 978-3-528-04572-2 ISBN 978-3-663-13948-5 (ebook) DOI 10.1007/978-3-663-13948-5

VORWORT Das SAS (Statistical Analysis System) ist ein Programmsystem zur Informationsverarbeitung und statistischen Datenanalyse. Es -,.,.ird von Anwendern unterschiedlicher Fachgebiete (Wirtschafts- und Sozialwissenschaften, Psychologie, Biologie u.a.) eingesetzt. Eine weite Verbreitung hat das System auch in der industriellen Verwaltung gefunden, wo Informationen dargestellt, analysiert und bewertet werden mussen. Die Leistungsfähigkeit des SAS-Systems ermöglicht unter anderem: die Organisation von Daten, den Einsatz einfacher und komplexer statistischer Verfahren und die Erstellung individuell gestalteter Tabellen und Graphiken. Mit diesem Buch wird eine problembezogene und am Beispiel einer empirischen Untersuchung orientierte Einführung in das Programmsystem SAS vorgelegt. Es wendet sich an alle, die für die Analyse empirischer Daten grundlegende Kenntnisse in der statistischen Datenverarbeitung erwerben wollen. Die Darstellung ist so gehalten, daß keine Vorkenntnisse aus dem Bereich der Elektronischen Datenverarbeitung vorhanden sein müssen. Jedoch sollte der Leser statistische Grundkenntnisse in beschränktem Umfang besitzen. Das Buch ist so strukturiert, daß zunächst die Schritte der Vorbereitung und Durchführung einer Datenanalyse an einem einfachen Beispiel ausführlich beschrieben werden, bevor die gebräuchlichsten Prozeduren zur Kennzeichnung von Merkmalen und die vielfältigen Möglichkeiten der Daten- und Dateienmodifikation, die SAS bietet, vorgestellt werden. Dabei wird die zur Zeit aktuelle Version 5.16 des Programmsystems zugrunde gelegt. Das Buch kann sowohl als Begleitlektüre für Lehrveranstaltungen als auch zum Selbststudium empfohlen werden. Die Autoren danken Herrn Dr. Peter Bothner für die kritische Durchsicht des Manuskriptes und Herrn Dr. Georg Heygster für seine Unterstützung beim Einsatz des Textsystems I.lTE]X. Bremen, im Juli 1987 Wolf-Michael Kähler und Werner Schulte

Inhalt 1 Der Einsatz der EDV bei empirischen Untersuchungen 1 2 Statistische Datenanalyse mit dem Statistical Analysis System (SAS) 3 Was ist SAS?.......... 3 Warum Datenanalyse mit SAS? 3 3 Beispiel einer empirischen Untersuchung 5 4 Vorbereitung für die Datenanalyse 8 4.1 Kodierung von Daten und fehlenden Werten. 8 Was messen wir? 8 Kodeplan... 8 Skalenniveau der Merkmale 9 Kodierung fehlender Werte 11 4.2 Strukturierung der Daten und Datenerfassung. 12 Datenmatrix... 12 Datenerfassung in eine Daten-Datei. 13 Erfassungsvorschrift... 13 Datenträger.............. 15 4.3 Datenerfassung mit dem SAS- "Display Manager" 15 SAS-System und Betriebssystem 15 Dialogeröffnung..... 16 Allokierung einer Datei 18 Dateneingabe... 20 Editor-Puffer... 21 Sichern der erfaßten Daten (Datensicherung) 21 Weiterführung einer unterbrochenen Erfassung 23

VIII INHALT 5 Das SAS-Programm als Arbeitsauftrag an das SAS-System 24 5.1 Ein SAS-Programm zur Häufigkeitsauszählung 24 Das SAS-Programm.. 24 SAS-Datei und Variable 25 Basis der Datenanalyse. 28 Häufigkeitsauszählung. 28 Interpretation der Häufigkeitstabelle 29 5.2 Durchführung der Datenanalyse. SAS-Job.... Ausführung des SAS-Jobs Der Output-Schirm... Schrittweises Vorgehen.. Datenausgabe auf Drucker. Submit-Gedächtnis..... 29 29 32 32 34 35 35 SAS-Dialog.... 36 5.3 Erläuterung der Ausgabe des SAS-Systems Log-Protokoll.... 38 38 Output-Protokoll.......... 39 Fehlermeldungen im Log-Protokoll 41 6 Einrichtung einer SAS-Datei 43 6.1 Einleitung des DATA-Steps und Benennung der SAS-Datei (DATA- Anweisung)................................ 43 6.2 Dateneingabe und Vereinbarung der Variablen (INPUT-, INFILE- und CARDS-Anweisung). INPUT-Anweisung.... Variable.... Eingabe ganzzahliger Werte.... Eingabe nicht ganzzahliger Werte. Alphanumerische Variable INFILE-Anweisung.... CARDS-Anweisung.... 45 45 46 47 48 48 49 50 6.3 Etikettierung von Variablen (LABEL-Anweisung) 50 6.4 Etikettierung von Variablenwerten (FORMAT-Prozedur und FORMAT-Anweisung).. FORMAT-Prozedur. VALUE-Anweisung.. FORMAT-Anweisung Variablenliste... 51 51 52 53 53

INHALT IX 6.5 Datenmodifikationen Zuweisung.... IF-Anweisung.... 6.6 Vereinbarung von fehlenden Werten (MISSING-Anweisung) Eingabe fehlender Werte.... Spezielle fehlende Werte.... Zuweisung von fehlenden Werten. Sortierfolge von fehlenden Werten. Automatische Zuordnung von fehlenden Werten. 6.7 Überprüfung der Eingabedaten Eingabefehler....... Überprüfung der Satzfolge Die interne Variable -N _. Überprüfung von Werten 54 55 56 57 57 57 58 59 59 59 59 61 61 62 7 Protokollierung der Daten einer SAS-Datei 7.1 Druckausgabe (PRINT-Prozedur) Ausgabe ins Log-Protokoll... Ausgabe ins Output-Protokoll. Kennzeichnung der Werte Die Option LABEL..... Werteetiketten.... Überschriften und Fußnoten Fehlen der VARIABLES-Anweisung Auswahl von Datensätzen.... Spezifizierung einer Ausgabeseite.. 68 Ausgabe von systemspezifischen Voreinstellungen 68 7.2 Sortierte Datenausgabe (BY-Anweisung und SORT-Prozedur) 68 Satz gruppe.... 68 BY-Anweisung......... 69 SORT-Anweisung........ 71 Sortierung nach Satznummern. 73 8 Datenauswertung mit dem SAS-System 74 Übersicht über das Leistungsangebot von SAS. 74 Stuktur des Arbeitens mit SAS......... 75 9 Beschreibung von Merkmalen 76 9.1 Tabellarische Ausgabe von Häufigkeitsverteilungen (FREQ)..... 76 63 63 63 63 64 65 65 66 67 67

x INHALT Allgemeine Form der FREQ-Prozedur. Optionen zur PROC FREQ-Anweisung Die TABLES-Anweisung. Die WEIGHT-Anweisung... Die BY-Anweisung.... Beispiel einer Standard-Tabelle Beispiel mit MISSING- und NOCUM-Option Beispiel mit der Option ORDER=FORMATTED. 76 77 77 78 79 79 80 80 9.2 Graphische Ausgabe von Häufigkeitsverteilungen (CHART) 81 Horizontale Balkendiagramme. 82 Vertikale Balkendiagramme 84 Blockdiagramme........ 84 Kreis- und Sterndiagramme.. 86 9.3 Ausgabe von Verteilungskennziffern (UNIVARIATE, MEANS) 86 Skalenqualität und Verteilungskennwerte 87 9.3.1 Die UNIVARIATE-Prozedur 88 9.3.2 Die MEANS-Prozedur.... 96 10 Beschreibung der Beziehung von Merkmalen 99 10.1 Tabellarische Ausgabe von gemeinsamen Verteilungen (FREQ, TABULATE)......................... 99 10.1.1 Erstellung von Tabellen mit PROC FREQ.... 100 10.1.2 Erstellung von Tabellen mit PROC TABULATE 105 10.2 Graphische Ausgabe von gemeinsamen Verteilungen (CHART, GCHART, PLOT, GPLOT)................ 119 10.3 Beschreibung des statistischen Zusammenhangs..... 124 10.3.1 Assoziationsmaße für nominalskalierte Variablen 125 10.3.2 Assoziationsmaße für ordinale Variablen..... 131 10.3.3 Die Berechnung von Korrelationskoeffizienten (CORR). 134 10.4 Aggregation von Daten (SUMMARY)... 138 10.5 Lineare Einfachregression (REG).......... 141 10.6 Überprüfung von Gruppenunterschir-den (TTEST) 147 11 Leistungen des DATA-Steps 150 11.1 Einrichtung und Veränderung von Variablen (Zuweisung)... 150 11.1.1 Wert zuweisung und Initialisierung von Variablen (Zuweisung, RETAIN-Anweisung) 150 11.1.2 Funktionen 153 11.2 Ablaufsteuerung... 157

INHALT XI 11.2.1 Ein-und zweiseitige Auswahl (IF- und ELSE-Anweisung). 157 11.2.2 Anweisungsblock (DO-Anweisung)............. 159 11.2.3 Mehrfachauswahl (SELECT-Anweisung).......... 161 11.2.4 Bedingte Wiederholung (DO-Anweisung mit den Schlüsselwörtern WHILE und UNTIL)................. 162 11.2.5 11.2.6 Unbedingte Wiederholung (DO-Anweisung mit Laufvariable) Verarbeitung einer Variablengruppe (ARRAY- und DO-Anweisung mit dem Schlüsselwort OVER) 11.2.7 Abbruch der Programmausführung (STOP- und RETURN-Anweisung).... 11.3 Datenauswahl (DELETE-, IF- und INFILE-Anweisung) 164 166 167 169 Auswahl gemäß einer Bedingung.......... 169 Auswahl von aufeinanderfolgenden Beobachtungen 170 Zufallsauswahl... 170 11.4 Gewichtung (WEIGHT- und FREQ-Anweisung) 171 11.5 Kommentierung von SAS-Anweisungen und Ausgabe von Seitenüberschriften und Fußnoten (COMMENT-, TITLE- und FOOTNOTE-Anwei sung) 173 COMMENT-Anweisung. 173 TITLE-Anweisung............. 174 FOOTNOTE-Anweisung.......... 174 11.6 Temporäre und permanente SAS-Dateien 175 Temporäre SAS-Dateien.......... 175 Einrichtung von permanenten SAS-Dateien 175 Zugriff auf permanente SAS-Dateien 175 Voreingestellte SAS-Dateinamen... 176 11. 7 Modifikation von SAS-Dateien (SET-, KEEP-, DROP- und RENAME-Anweisung) 178 SET-Anweisung......... 179 Die SET-Optionen....... 180 DROP- und KEEP-Anweisung 181 RENAME-Anweisung... 181 11.8 Inhaltsverzeichnis von SAS-Dateien (CONTENTS-Prozedur) 182 11.9 Verknüpfung und Aufgliederung von SAS-Dateien (MERGE-, SET- und OUTPUT- Anweisung)... 184 Verknüpfung von parallelen SAS-Dateien...... 184 Verknüpfung von gleichstrukturierten SAS-Dateien 187 Aufgliederung von SAS-Dateien..... 189 11.10Weitere Möglichkeiten der Dateneingabe...... 191

XII INHALT 11.10.1Formatierte Dateneingabe................ 191 11.10.2Formatfreie, gelistete Dateneingabe........... 194 l1.11möglichkeiten der Datenausgabe (PUT-, FILE-Anweisungen) 195 Anhang 198 A.1 SAS-Dialog unter dem Betriebssystem VM/CMS 198 A.2 Liste der Befehle an den SAS-"Display-Manager" 200 A.3 Ausführung von SAS-Programmen im Stapelbetrieb 204 AA Das Arbeiten mit SAS-Dateien-Bibliotheken..... 206 Literaturangaben 208 Index 209