Daten, Datentypen, Skalen

Ähnliche Dokumente
3. Merkmale und Daten

Forschungsmethoden in der Sozialen Arbeit

Standardisierte Vorgehensweisen und Regeln zur Gewährleistung von: Eindeutigkeit Schlussfolgerungen aus empirischen Befunden sind nur dann zwingend

Variablen und Skalenniveaus

Modul 04: Messbarkeit von Merkmalen, Skalen und Klassierung. Prof. Dr. W. Laufner Beschreibende Statistik

htw saar 1 EINFÜHRUNG IN DIE STATISTIK: BESCHREIBENDE STATISTIK

Einige Grundbegriffe der Statistik

Grundbegriffe. Bibliografie

Alle weiteren Messoperationen schließen die Klassifikation als Minimaloperation ein.

1 x 1 y 1 2 x 2 y 2 3 x 3 y 3... n x n y n

Forschungsmethoden VORLESUNG WS 2017/2018

Charakterisierung der Daten: Sind es genug? Sind alle notwendig? Was ist naturgegeben, was von Menschen beeinflusst (beeinflussbar)?

Phasen des Forschungsprozesses (hypothesenprüfende Studie)

Forschungsmethoden VORLESUNG SS 2017

Statistische Grundlagen I

0 Einführung: Was ist Statistik

DATENERHEBUNG: MESSEN-OPERATIONALISIEREN - SKALENARTEN

Skalenniveaus =,!=, >, <, +, -

JOACHIM BEHNKE / NINA BAUR / NATHALIE BEHNKE. Empirische Methoden der Politikwissenschaft

fh management, communication & it Constantin von Craushaar fh-management, communication & it Statistik Angewandte Statistik

Was heißt messen? Konzeptspezifikation Operationalisierung Qualität der Messung

Grundlagen empirischer Forschung. Korpuslinguistik Heike Zinsmeister WS 2009/10

Empirische Methoden der Politikwissenschaft

Messtherorie Definitionen

Statistik. Jan Müller

GASTVORTRAG IM RAHMEN DER: EINFÜHRUNG IN DIE EMPIRISCHE HUMAN- UND SOZIALFORSCHUNG. Mag. a Andrea Schaffar

Quantitative Methoden der Agrarmarktanalyse und des Agribusiness

Ermitteln Sie auf 2 Dezimalstellen genau die folgenden Kenngrößen der bivariaten Verteilung der Merkmale Weite und Zeit:

Statistik I für Betriebswirte Vorlesung 8

Forschungsstatistik I

Angewandte Statistik 3. Semester

Teil I: Deskriptive Statistik

Die deskriptive (beschreibende) Statistik hat als Aufgabe, große Datenmengen durch wenige Kennzahlen. oder Grafiken zu beschreiben.

Kapitel III - Merkmalsarten

Statistik II: Grundlagen und Definitionen der Statistik

Deskription, Statistische Testverfahren und Regression. Seminar: Planung und Auswertung klinischer und experimenteller Studien

Deskriptive Statistik Kapitel III - Merkmalsarten

GLIEDERUNG Das Messen eine Umschreibung Skalenniveaus von Variablen Drei Gütekriterien von Messungen Konstruierte Skalen in den Sozialwissenschaften

Forschungsmethoden VORLESUNG SS 2018

Bivariater Zusammenhang in der Vierfeldertafel PEΣO

Datenerhebung, Skalenniveaus und Systemdatei

1. Tutorial. Online-Tutorium-Statistik von T.B.

0 Einführung: Was ist Statistik

1 Einführung und Grundbegriffe

Gundlagen empirischer Forschung & deskriptive Statistik. Statistische Methoden in der Korpuslinguistik Heike Zinsmeister WS 2008/09

Wiederholung Statistik I. Statistik für SozialwissenschaftlerInnen II p.8

Statistikpraktikum. Carsten Rezny. Sommersemester Institut für angewandte Mathematik Universität Bonn

Einführung in die Statistik Einführung

Statistiktutorium (Kurs Frau Jacobsen)

2 Merkmalsausprägungen, Skalen, Häufigkeiten, Klassierung

Empirische Forschung. Übung zur Vorlesung Kognitive Modellierung. Kognitive Modellierung Dorothea Knopp Angewandte Informatik/ Kognitve Systeme

Grundlagen sportwissenschaftlicher Forschung Untersuchungsplanung 2 und Grundlagen des Messens

Einführung: Was ist Statistik?

Univariate Häufigkeitsverteilungen Kühnel, Krebs 2001: Statistik für die Sozialwissenschaften, S.41-66

Teil I: Deskriptive Statistik

Statistik Grundbegriffe

Dozent: Dawid Bekalarczyk Universität Duisburg-Essen Fachbereich Gesellschaftswissenschaften Institut für Soziologie Lehrstuhl für empirische

Statistik für Ingenieure Vorlesung 7

2. Deskriptive Statistik

Software Engineering I Prof. Dr. Martin Glinz. Kapitel 2. Zielsetzung, Messung. Universität Zürich Institut für Informatik

Klassifikation von Signifikanztests

Mathematik für Biologen

DIE FILES DÜRFEN NUR FÜR DEN EIGENEN GEBRAUCH BENUTZT WERDEN. DAS COPYRIGHT LIEGT BEIM JEWEILIGEN AUTOR.

Inhaltsverzeichnis: Aufgaben zur Vorlesung Statistik Seite 1 von 10 Prof. Dr. Karin Melzer, Prof. Dr. Gabriele Gühring, Fakultät Grundlagen

1. Einführung und statistische Grundbegriffe. Grundsätzlich unterscheidet man zwei Bedeutungen des Begriffs Statistik:

Leidlmair / Planung und statistische Auswertung psychologischer Untersuchungen I. Messtheoretische Vorüberlegungen

Überblick über multivariate Verfahren in der Statistik/Datenanalyse

STATISTIK FÜR STATISTIK-AGNOSTIKER Teil 1 (wie mich)

Empirisches Relativ: Eine Menge von Objekten, über die eine Relation definiert wurde.

Deskriptive Statistik

Statistik. Herzlich willkommen zur Vorlesung. Grundlagen Häufigkeiten Lagemaße Streuung Inferenzstatistik Kreuztabellen Gruppenunterschiede

Allgemeine Grundlagen Seite Termin: Eindimensionale Häufigkeitsverteilung

Beispiele qualitativer und quantitativer Sozialforschung

Empirische Sozialforschung

Gliederung. Ursachen von Ergebnisverfälschung. Antworttendenzen/Urteilsfehler. Empirische Forschungsmethoden

Forschungsmethoden in der Sozialen Arbeit (XI)

Statistik Einführung // Kategoriale Daten 10 p.2/26

Statistikpraktikum. Carsten Rezny. Sommersemester Institut für angewandte Mathematik Universität Bonn

Kreisdiagramm, Tortendiagramm

Empirische Verteilungsfunktion

I.3. Computergestützte Methoden 1. Deskriptive Statistik. Master of Science Prof. Dr. G. H. Franke WS 2009/ 2010

Grundlagen der empirischen Sozialforschung

Einführung in die Statistik für Politikwissenschaftler Sommersemester 2011

TEIL 7: EINFÜHRUNG UNIVARIATE ANALYSE TABELLARISCHE DARSTELLUNG / AUSWERTUNG

Skalenniveau Grundlegende Konzepte

Kapitel 1 Beschreibende Statistik

Cox-Regression. Ausgangspunkt Ansätze zur Modellierung von Einflussgrößen Das Cox-Modell Eigenschaften des Cox-Modells

1.5 Berechnung von Rangzahlen

STATISIK. LV Nr.: 0021 WS 2005/06 11.Oktober 2005

Inhaltsverzeichnis. 1 Über dieses Buch Zum Inhalt dieses Buches Danksagung Zur Relevanz der Statistik...

Serie 1 Serie 2 Serie 3 Serie 4 Serie 5 Serie 6. Statistik-Tutorium. Lösungsskizzen Übung SS2005. Thilo Klein. Grundstudium Sommersemester 2008

Deskriptive Statistik 1 behaftet.

Wahrscheinlichkeits - rechnung und Statistik

Statistik Grundbegriffe

Deskriptive Statistik Auswertung durch Informationsreduktion

Forschungsstatistik I

Transkript:

Bildung kommt von Bildschirm und nicht von Buch, sonst hieße es ja Buchung. Daten, Datentypen, Skalen [main types of data; levels of measurement] Die Umsetzung sozialwissenschaftlicher Forschungsvorhaben erfordert häufig die Planung und Durchführung entsprechender empirischer Untersuchungen. Zu klären ist z.b., welche theoretischen Konstrukte ( Leistungsmotivation, Ausländerfeindlichkeit, Sozialstatus,...) mit Hilfe welcher Indikatoren in welchen Populationen gemessen werden sollen. 1

Dabei sind u.a. Fragen der Operationalisierung von Begriffen, der Objektivität, Reliabilität und Validität von Messungen, der Messtheorie und angepasster Erhebungsformen und -umfänge (Versuchsplanung) zu klären ( Ringvorlesung bzw. Ende von Statistik II). 2

Grundlegende Begriffe: Grundgesamtheit (Population [population]): Menge aller Objekte/Personen [sampling unit], über die Aussagen gewonnen werden sollen. (z. B.: Gesamtheit aller in Deutschland wohnenden erwachsenen Personen.) Stichprobe [samle]: Tatsächlich untersuchte Teilmenge (z.b. von Probanden) aus der Grundgesamtheit. (z. B.: Im Allbus Programm befragte Personen.) 3

Merkmalsträger [sampling unit](fälle [cases]): Objekte/Personen der Grundgesamtheit als Träger von Eigenschaften. (z. B.: Erika Mustermann, 08150 Musterdorf, Musterstr. 1a) Merkmal [characteristic](variable [variable]): Interessierende Eigenschaft, die an den Merkmalsträgern beobachtet/gemessen/erfragt werden kann. (z. B.: Geschlecht, Alter, Konfession, Wahlabsicht) Merkmalsausprägung [outcome]: Mögliche Werte, die ein Merkmal annehmen kann. (z. B.: männl./weibl., 18,..., 120 Jahre, konf. los/kath./ev./ musl...., CDU/CSU/SPD/B90G/LINKE/FDP... ) Daten: (Sg. Datum, lat. datum = gegeben) In der Stichprobe z.b an Probanden beobachtete Merkmalsausprägungen. 4

Daten werden häufig als Datenmatrix [sample data set] organisiert (siehe unten bzw. Dateneditor in SPSS). Der Input einer Messung (z.b. Befragung) sind also Objekte (z.b. Probanden) mit ihren Eigenschaften (z.b. Merkmalsausprägungen) und die Beziehungen (Relationen) zwischen diesen. Als Output einer Messung treten häufig Zahlen auf, wobei die Zuordnung (Abbildung) der Objekte mit ihren Eigenschaften zu den Zahlen strukturerhaltend erfolgen sollte (Homomorphismus, Isomorphismus, Existenz, Eindeutigkeit,... Messtheorie). 5

In der Statistik/Datenanalyse unterscheiden wir in Abhängigkeit vom Informationsgehalt (Art der Relationen zwischen Merkmalsausprägungen) der Messungen und damit der vorliegenden Daten einerseits Skalen (-typen, -niveaus). Andererseits ist eine Klassifikation von Daten hinsichtlich der Zahl der möglichen Ausprägungen (z.b. dichotom/binär, diskret, stetig) und nach der Zahl der gleichzeitig an einem Objekt untersuchten Merkmale (univariat, bivariat, multivariat) üblich. Speziell für Sekundäranalysen sind diese Informationen für die verwendeten Daten unbedingt einzuholen. 6

Skalenniveaus, Datentypen Nominalskala [nominal/categorical data]: kategoriale Daten, qualitative Merkmale jede Beobachtung einer Merkmalsausprägung kann genau einer bestimmten Klasse (Kategorie) zugeordnet werden Klassen können nicht geordnet sondern nur unterschieden werden (Äquivalenzrelation), Klassen werden z.b. durch (natürliche) Zahlen charakterisiert Invarianz gegenüber eineindeutigen Transformationen Bsp.: Eigenschaften wie RaucherIn NichtraucherIn, krank gesund, Geschlecht (dichotom/binär), Farben, Berufsgruppe, ethnische Herkunft, Geburtsland 7

Ordinalskala [ordinal data]: sinnvolles Ordnen der Beobachtungen/Merkmalsausprägungen ist möglich (Rangordnung) Präferenzstruktur (Halbordnung, Ordnung) Unterschiede zwischen den Beobachtungen sind nicht vergleichbar (keine Abstände) wenn Rangordnung, dann üblicherweise durch natürliche Zahlen charakterisiert Invarianz gegenüber monoton wachsenden (isotonen) Transformationen Bsp.: Antwortvorgaben: stark ablehnend ablehnend unentschieden zustimmend stark zustimmend, Schulnoten, Platzierungen, Ratingskalen 8

Intervallskala [interval scale]: quantitative Merkmale, metrische Daten [numerical/measurement data] Abstände (Intervalle) zwischen den Werten der Skala besitzen eine Bedeutung; Berechnung von Differenzen sinnvoll (lineare Ordnung), kein absoluter Nullpunkt, deshalb z.b. Aussage 20 C sind doppelt so warm wie 10 C unsinnig, Invarianz gegenüber positiven linearen Transformationen y = ax + b, a > 0 Bsp.: Geburtsjahr, Wasserpegel, Temperatur in Grad Celsius und Grad Fahrenheit; Umrechnung von Fahrenheit in Celsius: T F = 1, 8 T C + 32 9

Verhältnisskala: wie Intervallskala, aber mit absolutem (natürlichen) Nullpunkt Invarianz gegenüber positiven (proportionalen) Transformationen y = ax, a > 0 Aussage Mustermann verdient doppelt so viel wie Musterfrau nicht unsinnig, Bsp.: Einkommen, Alter, Temperatur in Kelvin; Umrechnen von EUR in DM: G DM = 1, 95583 G EUR Bei einer Absolutskala handelt es sich um eine Intervallskala, bei der die Skaleneinheit nicht mehr frei gewählt werden kann (z.b. Wahrscheinlichkeiten, Häufigkeiten, Anzahlen). 10

Hierarchie der Skalenniveaus Absolutskala Verhältnisskala Intervallskala Ordinalskala Nominalskala 11

Die Überführung von einem Datenniveau in ein anderes ist abwärts (mit Informationsverlust) stets möglich. Die Wahl der geeigneten statistischen Verfahren zur Auswertung von Daten richtet sich nach der Art der Fragestellung, dem vorliegenden Datentyp und der Anzahl der eingehenden Variablen und ggf. ihrer Rolle (Einflussgrößen, abhängige Größen, sogen. asymmetrische Abhängigkeiten ). Bsp.: Analyse von Abhängigkeiten in gemischtskalierten, multivariaten Datensätzen oder Analyse (der Abhängigkeit) zweier intervallskalierter Merkmale 12

Die Festlegung des Datentyps hängt stets von der Art der Messung (Erfassung) der Daten ab, nicht nur von den tatsächlichen Eigenschaften der Daten. Wird z. B. das Alter von Personen nur in Klassen (0 25, 25 65, 65+) erfasst, liegt diese Variable nur als ordinale Variable vor (eigentlich Absolutskala). 13

Art der Erfassung Skala Daten Klassifikation Nominalskala kategorial in k Klassen (dichotom für k = 2) Ordnen Ordinalskala ordinal Messen ohne Intervallskala metrisch absoluten Nullpunkt Messen mit Verhältnisskala metrisch absoluten Nullpunkt 14

Darstellung von Daten (Rohdaten) Stichprobe vom Umfang n (untersuchte Objekte, befragte Personen), p gemessene, festgestellte oder erfragte Merkmale; Datenmatrix X: x ij X = (x ij ) i=1,...,n j=1,...,p = x 11 x 12... x 1p x 21 x 22... x 2p.. x n1 x n2... x np... Merkmalsausprägung des Merkmalsträgers i bezüglich des Merkmals j (vgl. Dateneditor von SPSS). 15

Zeilen: p Merkmalsausprägungen des entsprechenden Falles (Merkmalsträger, Proband, Objekt) Spalten: n Merkmalsausprägungen des entsprechenden Merkmals (der Variablen) Kodierung erfolgt vorzugsweise durch Zahlen Hinweis: Nicht alle Daten liegen in dieser Form bzw. als Rohdaten vor! Eine Hauptursache für Fehler bei statistischen Analysen ist das Rechnen mit Zahlen(-Kodes)ohne Berücksichtigung des nach der Kodierung für die Daten vorliegenden Skalenniveaus! 16