Datenerfassung und Datenmanagement



Ähnliche Dokumente
Wissenschaftliche Grundlagen und allgemeine Fähigkeiten I

Anforderungen an Datensätze für die statistische Analyse

Datenmaske für SPSS. Für die Datenanalyse mit SPSS können die Daten auf verschiedene Weise aufbereitet

Leitfaden zur Datenerfassung in Excel

Dieses erste Kreisdiagramm, bezieht sich auf das gesamte Testergebnis der kompletten 182 getesteten Personen. Ergebnis

2. Deskriptive Statistik 2.1. Häufigkeitstabellen, Histogramme, empirische Verteilungsfunktionen

Datenbanken Microsoft Access 2010

Grundlagen der Datenanalyse am Beispiel von SPSS

Dokumentation. estat Version 2.0

Excel Pivot-Tabellen 2010 effektiv

1 PIVOT TABELLEN. 1.1 Das Ziel: Basisdaten strukturiert darzustellen. 1.2 Wozu können Sie eine Pivot-Tabelle einsetzen?

Datenaufbereitung in SPSS. Daten zusammenfügen

1. Erreichen Sie, dass im Feld KdNr (Kunden-Nummer) nur 4-stellige Zahlen eingetragen

4. Erstellen von Klassen

Schnittstellenbeschreibung zur Importschnittstelle der Vollmachtsdatenbank

Anleitung zum GEPA EXCEL Import Tool

Professionelle Seminare im Bereich MS-Office

Laufende Auswertung von Feedback-Fragebögen Eine Vorlage zur Auswertung eines Fragebogens und die Präsentation erstellen...

Korrelation. Übungsbeispiel 1. Übungsbeispiel 4. Übungsbeispiel 2. Übungsbeispiel 3. Korrel.dtp Seite 1

Versand Etiketten / Endlosdruck

OECD Programme for International Student Assessment PISA Lösungen der Beispielaufgaben aus dem Mathematiktest. Deutschland

Bedingungen. Bedingungen. Bedingungen

Stellen Sie bitte den Cursor in die Spalte B2 und rufen die Funktion Sverweis auf. Es öffnet sich folgendes Dialogfenster

Snippets - das Erstellen von "Code- Fragmenten" - 1

Access Grundlagen für Anwender. Andrea Weikert 1. Ausgabe, 1. Aktualisierung, Juli inkl. zusätzlichem Übungsanhang ACC2010-UA

Handbuch ECDL 2003 Basic Modul 5: Datenbank Grundlagen von relationalen Datenbanken

MS Access 2010 Kompakt

Häufig wiederkehrende Fragen zur mündlichen Ergänzungsprüfung im Einzelnen:

Stand: Adressnummern ändern Modulbeschreibung

Datenexport aus JS - Software

Ihr Ideen- & Projektmanagement-Tool

Mallux.de CSV-Import Schnittstellen von Mallux.de. Beschreibung für den Import von CSV-Dateien. Stand: 01. Januar von Mallux.

2. Einrichtung der ODBC-Schnittstelle aus orgamax (für 32-bit-Anwendungen)

Auswertungssoftware des Deutschen-Motorik-Tests

Die Excel Schnittstelle - Pro Pack

Mit der Maus im Menü links auf den Menüpunkt 'Seiten' gehen und auf 'Erstellen klicken.

Leere Zeilen aus Excel-Dateien entfernen

Grundlagen der Tabellenkalkulation Die wichtigsten Funktionen im Überblick Christian Schett

1 Mathematische Grundlagen

Webalizer HOWTO. Stand:

Zur drittletzten Zeile scrollen

LimeSurvey. Fragebögen online erstellt und verwalten. von und mit CVC. cvc it-services

Fallbeispiel: Eintragen einer Behandlung

Erweiterung der Aufgabe. Die Notenberechnung soll nicht nur für einen Schüler, sondern für bis zu 35 Schüler gehen:

Arbeitshilfen zur Auftragsdatenverarbeitung

Online Rechnung Die Online Rechnung der Brennercom

Anleitung Mailrouting mit der Virtusertable

Die Umfrage in ILIAS

Auswerten mit Excel. Viele Video-Tutorials auf Youtube z.b.

Theoretische Informatik SS 04 Übung 1

Funktionsbeschreibung. Lieferantenbewertung. von IT Consulting Kauka GmbH

Quartalsabrechnung! " " " " " " " Stufe 1! Beheben von Abrechnungsfehlern" Stufe 2! Neue Abrechnung erstellen"

Handbuch Offline-Abgleich

Die Beschreibung bezieht sich auf die Version Dreamweaver 4.0. In der Version MX ist die Sitedefinition leicht geändert worden.

Abamsoft Finos im Zusammenspiel mit shop to date von DATA BECKER

MORE Profile. Pass- und Lizenzverwaltungssystem. Stand: MORE Projects GmbH

SEPA-Umstellungsanleitung Profi cash

Handbuch zum Excel Formular Editor

Inventur. Bemerkung. / Inventur

der Eingabe! Haben Sie das Ergebnis? Auf diesen schwarzen Punkt kommen wir noch zu sprechen.

6. Benutzerdefinierte Zahlenformate

Binäre Bäume. 1. Allgemeines. 2. Funktionsweise. 2.1 Eintragen

Access Verbrecherdatenbank Teil 3

Handbuch. NAFI Online-Spezial. Kunden- / Datenverwaltung. 1. Auflage. (Stand: )

Auswahlabfragen mit ACCESS

In diesem Thema lernen wir die Grundlagen der Datenbanken kennen und werden diese lernen einzusetzen. Access. Die Grundlagen der Datenbanken.

Konsolidieren von Daten in EXCEL

Varianzanalyse (ANOVA: analysis of variance)

Auswertung von Kinderleichtathletik- Wettkämpfen mit Excel und Word

Installation des Add-Ins für Lineare Algebra in Microsoft Excel

Word 2010 Schnellbausteine

Handreichung für Lehrer

Generelle Einstellungen

Kurzbeschreibung s&s Arbeitszeiterfassung

Struktur der Transplantationen in Deutschland in den Jahren 2004 und 2005

Lineargleichungssysteme: Additions-/ Subtraktionsverfahren

Data Quality Management: Abgleich großer, redundanter Datenmengen

Benutzer Anleitung Manegger Tourenbuch

90-minütige Klausur Statistik für Studierende der Kommunikationswissenschaft

novatime - Auftragsdatenerfassung / Projektzeiterfassung (ADE)

LEITFADEN ZUR SCHÄTZUNG DER BEITRAGSNACHWEISE

4. AUSSAGENLOGIK: SYNTAX. Der Unterschied zwischen Objektsprache und Metasprache lässt sich folgendermaßen charakterisieren:

Schnellanleitung: Verbuchung von Studien- und Prüfungsleistungen

Kommunikations-Management

Folgeanleitung für Fachlehrer

Noten ausrechnen mit Excel/Tabellenkalkulation. 1) Individuellen Notenschlüssel/Punkteschlüssel erstellen

Dokumentation für die software für zahnärzte der procedia GmbH Onlinedokumentation

Ihre Interessentendatensätze bei inobroker. 1. Interessentendatensätze

Bauteilattribute als Sachdaten anzeigen

Konzepte der Informatik

FAKULTÄT FÜR HUMAN- UND SOZIALWISSENSCHAFTEN. Projektplan

Statistische Auswertung:

Leichte-Sprache-Bilder

So gehts Schritt-für-Schritt-Anleitung

Geld wechseln kann als Visualisierung des Zehnerübergangs dienen. Die Zwischengrössen (CHF 2.-, 5.-, 20.-, 50.-) weglassen.

Artikel Schnittstelle über CSV

In diesem Tutorial lernen Sie, wie Sie einen Termin erfassen und verschiedene Einstellungen zu einem Termin vornehmen können.

Wärmebildkamera. Arbeitszeit: 15 Minuten

Aktivierung von Makros in den Erfassungshilfen

Transkript:

Datenerfassung und Datenmanagement Statistische Auswertungssysteme sind heute eine aus der angewandten Statistik nicht mehr wegzudenkende Hilfe. Dies gilt insbesondere für folgende Aufgabenbereiche: - die Auswertung großer, komplex gegliederter Datenmengen - multivariate Struktur der Daten - rechenintensive Auswertungsmethoden - ständig wiederkehrende Auswertungen mit jeweils neuem Datenbestand oder mit Bewegungsdaten - numerische Verfahren, komplexe Algorithmen - graphische Aufbereitungen statistischen Datenmaterials (Visualisierung, Präsentation) Statistik-Software: - allgemeine statistische Softwarepakete: SAS, SPSS, STATGRAPHICS, S-PLUS, R... - spezielle Pakete: STATXACT (exakte Tests), PASS, nquery Advisor (Fahlzahlschätzung)... - Wiss. Grundlagen und allgem. Fähigkeiten I Univ.-Prof. DI Dr. Andrea Berghold 10

Datenstruktur in statistischen Auswertungssystemen Grundlegende Struktur Jedes Programm erwartet Eingabedaten in einer bestimmten Form, Struktur und Abfolge. Die gängigen Auswertungssysteme basieren auf einer einheitlichen, rechteckigen Datenstruktur, der sogenannten Datenmatrix. Bei der Datenmatrix sollte jede Beobachtungseinheit (z.b. Fälle, Probanden, Versuchstiere) genau einer Zeile, die Merkmale (Variablen: z.b. Alter, Gewicht, Blutdruck) den Spalten der Datei entsprechen. Patient Alter Geschl Gewicht SBD DBD 1 25 1 75 120 85 3 34 1 80 130 80 4 56 2 145 90 6 71 2 52 150 95 Diese Datei besteht aus 4 Beobachtungseinheiten (Patienten) und 6 Variablen. Bei Patient 4 wurde das Gewicht nicht bestimmt. Mehrere Messungen pro Beobachtungseinheit Liegen mehrere Messungen pro Beobachtungseinheit vor (z.b. wiederholte Messungen des Blutdrucks im Laufe einer Therapie; Blutzuckermessungen nüchtern, 1 Stunde und 4 Stunden nach Glukosegabe), sollte für jede dieser Messungen eine Spalte angelegt werden. Patient SBD1 DBD1 SBD2 DBD2 1 120 85 120 80 3 130 80 125 80 4 145 90 130 90 6 150 95 135 90 Hier gibt es also zwei Messungen für den systolischen und den diastolischen Blutdruck. Oft wird auch der Zeitpunkt der Messung miterfasst. Wiss. Grundlagen und allgem. Fähigkeiten I Univ.-Prof. DI Dr. Andrea Berghold 11

Aufteilung in mehrere Dateien Zum Zwecke der Übersichtlichkeit kann es unter Umständen sinnvoll sein, den Gesamtdatenbestand auf mehrere Dateien aufzuteilen (z. B. Datei 1: demographische Angaben; Datei 2: Blutdruckwerte; Datei 3: Laborwerte). Dabei ist darauf zu achten, daß jede dieser Dateien nach dem oben beschriebenen Muster aufgebaut ist. Um Dateien für eine gemeinsame Auswertung kombinieren zu können, ist es wesentlich, dass in allen Dateien eine einheitliche und eindeutige Identifikationsvariable (wie z.b. die Patientennummer) existiert. Datei1: Datei2: Patient Alter Geschl Gewicht 1 25 1 75 3 34 1 80 4 56 2 6 71 2 52 Patient Neutro Eos Baso Lympho Mono 1 60 1 0 33 6 3 62 2 1 32 3 4 58 3 0 32 7 6 56 2 1 35 6 Mehrfachantworten Sind Mehrfachantworten auf eine Frage möglich, so ist für jede Antwortmöglichkeit in der Datenmatrix eine Ja/Nein-Antwort vorzusehen. Richtig: Patnr Diag1 Diag2 Diag3 Patnr Diagnose 1 0 0 1 Falsch: 1 3 2 1 1 0 2 1 und 2 Wiss. Grundlagen und allgem. Fähigkeiten I Univ.-Prof. DI Dr. Andrea Berghold 12

Anforderungen an Statistik-Software Ein statistisches Auswertungssystem muß im Hinblick auf statistische Prozeduren, die einen bestimmten Aufbau der Eingabedaten erfordern, in der Lage sein, die Daten entsprechend aufzubereiten. Ein statistisches Auswertungssystem benötigt - ein Datenmanagementsystem, das es ermöglicht, komplexe Beziehungen zwischen den Beobachtungseinheiten darzustellen und zu beschreiben und das die gespeicherten Daten den statistischen Verfahren in geeigneter Weise zugänglich macht und den Prozeß der statistischen Auswertung steuert - ein Analysesystem, das das Repertoire der statistischen Verfahren beinhaltet - Präsentationsmöglichkeiten (Grafiken, Tabellen etc.) Die statistische Auswertung besteht zumeist aus einer Abfolge von Datenmanagementoperationen und Statistikprozeduren <Datenmanagement> <Statistikprozedur> <Datenmanagement> <Statistikprozedur> <Datenmanagement> <Statistikprozedur> Nehme alle Probanden Ermittle Mittelwert Körpergröße Restriktion Nichtraucher Ermittle Mittelwert Körpergröße bei Nichtrauchern Nehme alle Probanden Korrelation Körpergröße - Körpergewicht Wiss. Grundlagen und allgem. Fähigkeiten I Univ.-Prof. DI Dr. Andrea Berghold 13

Dateneingabe Zur Dateneingabe bieten sich zwei Möglichkeiten an: - Eingabe der Daten direkt im Statistikpaket - Verwendung von anderen Programmen zur Dateneingabe (z.b. EXCEL, ACCESS etc.) Hinweis: Verwendet man ein anderes Programm zur Dateneingabe als für die Datenauswertung, so ist schon vorher darauf zu achten, ob die Daten problemlos in das nachher verwendete Statistikpaket übernommen werden können! Einige Richtlinien zur Eingabe der Daten: Struktur der Datenmatrix Die Variablennamen der Datenmatrix müssen in der ersten Zeile stehen. Abgesehen von dieser ersten Zeile darf die Tabelle nur Datenwerte enthalten (keine Zwischenresultate, Formeln, Graphiken, etc...). Die Beobachtungen (z.b: Patienten) stehen in den Zeilen, die Variablen stehen in den Spalten einer einzigen Tabelle. Die erste Variable soll die eindeutige Patientenkennung enthalten (z.b: Patnr). Codierungen Die Merkmalsausprägungen (=Einträge in die Datei) sollten weitgehend in numerischer Form vorliegen. Um flexible Analysen zu ermöglichen, ist es sinnvoll bei alphanumerischen Merkmalsausprägungen (z.b. weiblich, männlich) mit numerischen Codierungen (z.b. 1,2) zu arbeiten. Geordnete Merkmale sollen aufsteigend (ordnungserhaltend) vercodet werden. Codes für die gleichen Antwortkategorien sollen für alle Variablen gleich sein z.b.: 0=nein, 1=ja. Wiss. Grundlagen und allgem. Fähigkeiten I Univ.-Prof. DI Dr. Andrea Berghold 14

Werte In den Zellen dürfen nur Zahlen stehen und keine Maßeinheiten. Daher muß die gewählte Maßeinheit pro Variable für alle Eintragungen einheitlich sein. Bsp: Gewicht: 73 und nicht 73 kg. Im Falle fehlender Werte (missings) ist die entsprechende Zelle leer zu lassen (keine Leerzeichen, Nullen, etc...) bzw. ein Wert zu verwenden, der in den theoretisch möglichen Beobachtungen nicht vorkommt. Bsp.: Gewicht: -999. Statistikpakete (z.b. SPSS, SAS) verwenden oft einen Punkt (Komma) als fehlenden Wert (system missing) Zahlen sollen ohne "1000er-Trennzeichen" eingegeben werden. Bsp: 2303493 und nicht 2.303.493. Datumsvariablen müssen im Datumsformat sein. Bsp: 15. Oktober 1996 Eingabe 15.10.1996. Variablennamen Variablennamen sollten sprechend sein (SPSS: max. 64 Stellen). Es sollten nur Buchstaben von A-Z, Ziffern von 0-9 und Underliner _ verwendet werden. Das erste Zeichen sollte ein Buchstabe sein. Groß- und Kleinschreibung wird nicht unterschieden. Jeder Variablenname darf nur 1x verwendet werden. Wiss. Grundlagen und allgem. Fähigkeiten I Univ.-Prof. DI Dr. Andrea Berghold 15

Überprüfung der Daten Eine erste Überprüfung sollte bereits während der Datenerfassung erfolgen. Dabei wird primär geprüft auf: - doppelte Dateneingabe - Vorschalten von Plausibilitätskontrollen (Filter): z.b. Alter > 15 und Alter < 90 formale Prüfung der Daten: Bei der formalen Prüfung der Daten ist festzustellen, ob die erfaßten Daten mit dem im Codierplan angegebenen Wertebereich und der festgelegten Codierung übereinstimmen. Oft läßt eine optische Sichtung des Datenmaterials Erfassungsfehler erkennen (z.b. eine Zelle der Matrix wurde nicht ausgefüllt; in der Datei befinden sich unzulässige, nicht interpretierbare Zeichen). Weiters sollte überprüft werden, welche Merkmalsausprägungen aus dem normalen Wertebereich herausfallen, ob es Ausreißer gibt etc.: 1. Für jede metrische Variable etwa durch eine sortierte Liste, die alle Ausprägungen der Variablen enthält eine Tabelle mit deskriptiven Maßzahlen (z.b. Mittelwert, Median, Minimum, Maximum etc.) Scatterplots für ausgewählte metrische Variablen (Untersuchung der Merkmale auf ihre Plausibilität zueinander. Bsp.: Gewicht: 60 kg, Größe:196 cm) 2. Für jede kategorielle Variable mit einer Häufigkeitstabelle aller Ausprägungen. Wiss. Grundlagen und allgem. Fähigkeiten I Univ.-Prof. DI Dr. Andrea Berghold 16