Grundlagen in Stata. Zusammenfassung

Ähnliche Dokumente
Die Benutzung von Stata

Übung zur Einführung in die empirische Mikroökonomik (Ökonometrie II) Einführung in STATA. Universität Bamberg. Professur für VWL, Sozialpolitik

Stata I: Analyseorganisation und erste Schritte

Tutorial. Stata und Wharton Research Data Services (WRDS)

Modell Bahn Verwaltung. Tutorial. Links. Min. Programm Version 0.65, März w w w. r f n e t. c h 1 / 11

Begleitmaterialien zur Übung Einführung in die empirische Mikroökonometrie - Ökonometrie II

Microsoft Excel 2007 Basis. Leseprobe

3 Kurzeinführung in Matlab

Zweiter Teil des Tutorials. Workspace M-files Matrizen Flow Control Weitere Datenstrukturen Gemeinsames Beispiel erarbeiten

Dateneingabe und Transformation Übersicht

Statistik-Programme. Inhalt. 1.1 Kleine Einführung in R Installieren und Starten von R

JavaScript. Dies ist normales HTML. Hallo Welt! Dies ist JavaScript. Wieder normales HTML.

Einführung in die Computerlinguistik

Unter Workfile structure type geben Sie die Struktur des gewünschten Workfiles an:

Übersicht Shell-Scripten

2 Konventionen und Begriffe zu diesem Buch

Fortgeschrittene Statistik SPSS Einführung

Bash-Skripting Linux-Kurs der Unix-AG

Strings. Daten aus Dateien einlesen und in Dateien speichern.

Bash-Skripting Linux-Kurs der Unix-AG

Es geht also im die SQL Data Manipulation Language.

Kapitel 8 Syntaxbefehle

Einführung in SPSS. Sitzung 2: Datenbereinigung und Datenmanagement. Knut Wenzig. 15. Dezember 2005

SciCa - Scientific Calculator

WiMa-Praktikum 1. Woche 8

Shell. Oder Konsole suchen im Application Finder. Auch Terminal, Bash oder Kommandozeile genannt. Bash nimmt Befehle entgegen und führt diese aus

Einführung in MATLAB + MATLAB Simulink. Dipl.-Inf. Markus Appel

GERICHTETER GEWICHTETER GRAPH DESIGNDOKUMENT

Funktionen in JavaScript

Übung Statistik I Statistik mit Stata SS Wiederholung und Probeklausur

Institut für Soziologie Werner Fröhlich. Methoden 2. Ziele, Organisatorisches und Einführung in Stata

Algorithmen und ihre Programmierung

Funktionen in JavaScript

Statistik IV Übung mit Stata 10. Statistik IV. 3. Datenaufbereitung II und erste Auswertungen. Göttingen 27. Mai Dozent: Jürgen Leibold

Hochschule Darmstadt Informatik-Praktikum (INF 1) WS 2014/2015 Wirtschaftsingenieur Bachelor 4. Aufgabe Datenstruktur, Dateieingabe und -ausgabe

C# - Einführung in die Programmiersprache Bedingte Anweisungen und Schleifen

Effizientes Arbeiten mit dem Emacs. Suchen und Ersetzen.

3.1 Allgemeines. Abbildung 3.1: Eröffnungsmenü einer Excel-Mappe

Einführung in SPSS. Sitzung 2: Datenbereinigung und Datenmanagement. Knut Wenzig. 9. Dezember 2004

Effizientes Arbeiten mit dem Emacs. Suchen und Ersetzen.

eassessment Oracle DB Engine Whitepaper

Hochschule Darmstadt Informatik-Praktikum (INF 1) WS 2015/2016 Wirtschaftsingenieur Bachelor 5. Aufgabe Datenstruktur, Dateieingabe und -ausgabe

Das Handbuch zu KCron

Maple V, Rel 5.1 Einführungskurs

Kurzanleitung für SPSS Statistics 22

Java: Eine kurze Einführung an Beispielen

Eine Einführung in R: Grundlagen II

Programmsteuerung mit PHP - if/else, elseif,switch

Anleitung Währungsrechner

Funktionen in Matlab. Nutzerdefinierte Funktionen können in.m-datei gespeichert werden

Daten transformieren

Kurzanleitung creator 2.0

PROC NPAR1WAY. zum Durchführen des U-Tests für zwei unverbundene Stichproben (für quantitative nicht-normalverteilte Merkmale)

Programmierkonventionen - 1 -

Excel Grundlagen. Peter Wies. 1. Ausgabe, Februar 2013

Kapitel 1: Informationsverarbeitung durch Programme

Programmieren mit statistischer Software

2 R die Basics. Inhalt. 2.1 Ziel. 2.2 R als Taschenrechner. Markus Burkhardt

Labor Software-Entwicklung 1

Im ersten Schritt müssen die Daten in die Datenansicht eingelesen werden.

Wiederholung SPSS und Einführung in die SPSS Syntax

Handhabung der tabellarischen Übersichten in MAXQDA

System.out.println("TEXT");

pue02 October 28, 2016

Fachhochschule Südwestfalen Wir geben Impulse. Kontrollstrukturen und Schleifen in Octave

Variablen in MATLAB. Unterschiede zur Mathematik: Symbolisches und numerisches Rechnen. Skriptdateien. for-schleifen.

Übungspaket 23 Mehrdimensionale Arrays

1 Zahlenmengen und einige mathematische Symbole

Inhalt. Übersicht über das Gerät 6. Die Hauptanwendung "Main" 7. Das Interaktivmenü 10. Variablen und Funktionen 15

Installation. Arbeiten mit der MATLAB-Entwicklungsumgebung. MATLAB als Taschenrechner mit Matrix- und Vektorrechnung.

3 Bibliotheken. Objekte sammeln und verwalten. Sie werden lernen, wie Sie vielbenutzte Objekte organisieren und verwalten.

Datenbank und Tabelle mit SQL erstellen

Übersicht. Einführung in Perl Datenstrukturen I. Datentypen Übersicht (1) Kernbegriffe. Kernbegriffe. Einführung der Datentypen.

Das Stata Starter Kit

Formale Sprachen. Inhaltsverzeichnis. M. Jakob. 10. Dezember Allgemeine Einführung. Aufbau formaler Sprachen

Funktionen in Matlab. Lehrstuhl für Angewandte Mathematik Sommersemester und 29. Mai 2008

Benutzung der Manpage, Shell Teil 3

Einführung in SPSS. 1. Die Datei Seegräser

syntax.tex Eine Übersicht

Objekte haben eine eigene Notation, also Schreibweise, beim Aufruf:

Lineare Algebra mit dem Statistikprogramm R

Ein kleiner Matlab Primer Frank Schimmel

Grundlagen der Informatik Vorlesungsskript

Abbildung : Aufruf des Wikis (Server: Interner Web-Server HTTPD auf Port 8080)

Handbuch zum VivaWeb-Serienbrief-Programm

Linux und Shell-Programmierung Teil 6

Informationsverarbeitung im Bauwesen

Kurzanleitung creator 2.0

LISREL-Beispiel zum Kapitel 15: Latent-State-Trait-Theorie

MATLAB Eine Einführung

Programmierpraktikum

PROC MEANS. zum Berechnen statistischer Maßzahlen (für quantitative Merkmale)

Grundlagen der Programmierung

Excel:mac 2011 Grundlagen & Funktionen

Schleifen: Immer wieder dasselbe tun

Zahlenraten: Ein Spiel in Java.

3 Geoverarbeitung mit dem ModelBuilder

Transkript:

Grundlagen in Stata 2 Zusammenfassung Dieses Einführungskapitel gibt eine knappe Übersicht über die Grundlagen der Kommandosprache in Stata als Basis für deren laufende Ergänzung im Rahmen der Analyse von SEM. Zusätzlich werden einige Anmerkungen und Tipps zur praktischen Anwendung von Stata generell gegeben. Ein Fokus richtet sich zuletzt auf Datenformate zur Analyse von SEM in Stata, nämlich die Möglichkeit der Analyse zusammengefasster Parameter (summary statistics). Der folgende Abschnitt bietet einen sehr knappen Überblick über den Aufbau und wichtige Befehlselemente in Stata. Leserinnen und Leser, die mit der Kommandosprache und Datenanalyse in Stata bereits gut vertraut sind, können diesen Teil daher überspringen und zu Kapitel 3 übergehen. Die Oberfläche von Stata besteht grundsätzlich aus verschiedenen nebeneinander stehenden Fenstern (s. Abbildung 4). Die Oberfläche setzt sich für gewöhnlich zusammen aus: Befehlsfenster (Eingabe von Kommandos): Command Review-Fenster (Rückblick auf Eingaben): Review Variablenliste (Variablennamen und deren Beschreibung): Variables Ergebnisfenster (Output der Analysen und Berechnungen) Springer Fachmedien Wiesbaden GmbH 2017 J. Aichholzer, Einführung in lineare Strukturgleichungsmodelle mit Stata, DOI 10.1007/978-3-658-16670-0_2

14 2 Grundlagen in Stata Abbildung 4 Benutzeroberfläche in Stata 2.1 Die Kommandosprache: Stata-Syntax Alle Befehlselemente der Kommandosprache in Stata (= Befehle) werden im Folgenden jeweils mittels der Schriftart Courier hervorgehoben. In diesem Skriptum wird, wie bereits erwähnt, deren Verwendung über das Befehlsfenster (Command) oder sogenannte do-files in Stata nahe gelegt. Es sei jedoch darauf hingewiesen, dass sich alternativ ein Großteil der Operationen auch über das Menü und den eigens entwickelten SEM Builder als grafische Eingabe in Stata durchführen ließe. Generell bietet die Software Stata eine vergleichsweise einfache Kommandosprache. Alle Befehle haben die folgende allgemeine Form (= Syntaxdiagramm): command [varlist] [if] [in] [weight] [, options] Elemente ohne Klammern bzw. in runden Klammern bedeuten, dass diese erwähnt werden müssen. Elemente in eckigen Klammern sind erlaubt, können also, müssen aber nicht angegeben werden. Nicht erlaubte Elemente werden im Syntaxdiagramm nicht genannt. Darüber hinaus sind jeweils erlaubte Abkürzungen des Befehls oder seiner Optionen durch Unterstreichung gekennzeichnet, wie z. B. help (Befehl zum Aufruf der Hilfe-Funktion).

2.2 Praktische Anmerkungen und Tipps 15 Das Element [varlist] steht für einen oder mehrere Variablennamen. Für beliebige Zufallsvariablen wird auch im Folgenden die Beschreibung varname oder varlist verwendet. Mehrere Variablen werden durch Leerzeichen getrennt oder über Symbole angegeben: von bis sowie eine beliebige Erweiterung? oder mehrere beliebige Erweiterungen des Variablennamens *. Abkürzungen der Variablennamen sind ebenfalls erlaubt, solange diese eindeutig zuordenbar sind. Das Element [if] beschreibt eine Bedingung ( wenn zutrifft, dass ), die den Befehl auf bestimmte Beobachtungen einschränkt und somit eine Art Filter ist. Ausdrücke in der if-bedingung können mit Hilfe von Operatoren und Funktionen definiert werden (s. help operators). Das Element [in] beschreibt ebenfalls eine Bedingung, die den Befehl jedoch auf bestimmte Beobachtungen laut der aktuellen Sortierung im Datensatz beschränkt. Die in-bedingung ist somit immer nur in Verbindung mit einer zuvor definierten Sortierung der Daten, z. B. mittels sort, sinnvoll. Das Element [weight] beschreibt grundsätzlich vier mögliche Gewichtungstypen (s. help weights), wie etwa Wahrscheinlichkeitsgewichte [pweight] zur Korrektur ungleicher Auswahlwahrscheinlichkeiten. Je nach Befehl sind unterschiedliche Gewichtungstypen erlaubt. Die Verwendung von Gewichten für den sem Befehl ist bspw. in Kombination mit [pweight] sowie der Definition eines konkreten Stichprobendesigns (s. help svyset) und dem Präfix svy:sem möglich. Das Element [, options] beschreibt alle zusätzlichen Optionen zum Befehl und oftmals wichtige Erweiterungen in der Analyse. Diese werden jedenfalls immer nach einem Komma angegeben. Im entsprechenden Hilfemenü des Hauptbefehls werden die Optionen, deren Funktion im Detail sowie mögliche Abkürzungen der Befehle erläutert. 2.2 Praktische Anmerkungen und Tipps Die praktische Verwendung der Kommandosprache in Stata mit Fokus SEM wird in den folgenden Kapiteln laufend eingeführt und ergänzt. Dennoch seien hier eini ge hilfreiche Anmerkungen und Tipps allgemeiner Natur erwähnt: Der Befehl help führt immer in das Hilfefenster und kann mit spezifischen Kommandos verbunden werden, z. B. help regress. Stata unterscheidet zwischen Groß- und Kleinschreibung (case sensitivity), d. h. sem und SEM ist nicht ident. Dies ist insofern von Bedeutung als der sem Befehl defaultmäßig Variablen, die mit Großbuchstaben beginnen, als latente und daher nicht gemessene Variablen erkennt. Diese Grundeinstellung

16 2 Grundlagen in Stata kann im Zuge des sem Befehls mit der Option sem paths, nocapslatent aufgehoben werden. Im Befehlsfenster können über die Tastatur mit Bild und Bild zur Wiederholung alle eingegebenen Befehle wieder aufgerufen werden. Auch kann hierzu das Review-Fenster herangezogen werden. Befehle (Kommandos) können in Stata über das Befehlsfenster eingegeben werden oder über sogenannte do-files (einfache Textfiles), die über doedit aufgerufen werden. Hier gilt schlichtweg der Vorteil der Nachvollziehbarkeit. Das gesamte do-file oder Zeilen daraus können schließlich mit dem Kürzel Strg+D ausgeführt werden. Bei langen Befehlen in do-files eignen sich Zeilenumbrüche mittels der folgenden Zeichenabfolge: /// Eine einfache Suche nach einem Variablen-Label, d. h. der Bezeichnung einer Variablen, ermöglicht bspw. der Befehl lookfor string. Zum Anzeigen längerer Outputs, anstatt einer schrittweisen Ausgabe mit Stopps (-more- im Ergebnisfenster), kann man set more off, permanently einstellen. Nachdem ein Befehl ausgeführt wurde, werden Ergebnisse (Koeffizienten, Modellparameter, etc.) immer kurzfristig gespeichert und können mittels return list (Koeffizienten) oder ereturn list (Modellparameter, Schätzergebnisse) aufgelistet werden. Koeffizienten aus gespeicherten Modellergebnissen sind mittels display (für Skalare) sowie matrix list (für Matrizen) einsehbar und können weiter verwendet werden. Von Nutzerinnen oder Nutzern geschriebene zusätzliche bzw. spezialisierte Befehle (Zusatzpakete) in Stata (Ado-Files) können über den Befehl net search word im Internet gesucht und danach selbst installiert werden. 2.3 Datenformate: Rohdaten und zusammengefasste Daten Stata kann, so wie andere Software-Pakete auch, verschiedenste Formate von Rohdaten einlesen (s. dazu ausführlicher z. B. Kohler & Kreuter, 2012, Kap. 10). Diese mit Stata kompatiblen Datenfiles werden schließlich als *.dta-files gespeichert und können optional unter Angabe des Speicherortes aufgerufen werden mit: use filename [, clear nolabel]

2.3 Datenformate: Rohdaten und zusammengefasste Daten 17 Eine Besonderheit im Rahmen der Analyse mit dem sem Befehl ist, dass auch zusammengefasste Parameter aus einem Datensatz (summary statistics), wie Kovarianzen, Korrelationen und Mittelwerte sowie die Zahl der Fälle (Beobachtungseinheiten), eingelesen und analysiert werden können. Der Grund ist, dass solche Parameter oftmals mit publiziert werden, um Analysen replizieren zu können (McDonald & Ho, 2002). Hierzu dient der Hauptbefehl ssd und wird mit ssd init varlist (Liste der Variablen) eingeleitet. Ein Beispiel soll mit fiktiven Daten für drei Variablen (hier: y, x1 und x2) die Verwendung veranschaulichen (s. Beispiel 1). Ein weiteres Beispiel zur Erstellung künstlicher Rohdaten aus zusammengefassten Parametern wird in Beispiel 2 (auf S. 30) angeführt. Wichtig ist, sich zu vergegenwärtigen, dass der beschriebene Datensatz nicht wirklich Informationen über 500 Fälle enthält (Rohdaten), sondern lediglich zusammengefasste Parameter. Sonst übliche Analyseschritte wären somit irreführend und falsch. Da in SEM generell Varianz-Kovarianz-Strukturen und Mittelwertstrukturen analysiert werden, erlaubt der sem Befehl jedoch dies zu berücksichtigen und liefert eine korrekte Abbildung der Datenstruktur aus den zuvor beschriebenen Variablen. Eine Angabe, dass es sich um zusammengefasste Parameter handelt, ist im Rahmen des sem Befehls daher nicht weiter notwendig. Beispiel 1 Erstellung fiktiver Daten für Analysebeispiele Variante 1 clear ssd init y x1 x2 ssd set observations 500 ssd set means 2 3 4 ssd set sd 5 6 7 ssd set correlations 1 \.4 1 \.3.25 1. ssd list Observations = 500 Means: y x1 x2 2 3 4 Standard deviations: y x1 x2 5 6 7 Correlations: y x1 x2 1.4 1.3.25 1

http://www.springer.com/978-3-658-16669-4