Statistik I im Sommersemester 2006

Größe: px
Ab Seite anzeigen:

Download "Statistik I im Sommersemester 2006"

Transkript

1 Statistik I im Sommersemester 2006 Themen am : Was ist Statistik, wozu Statistik? Überblick über das Modul M2: Grundlagen sozialwissenschaftlicher Datenanalyse (Statistik I) Einige Ergebnisse der Befragung zur Anmeldung Mathematisches Repititorium: Indizierte Summen Lernziele: 1. Bedeutung der Statistik für die Sozialwissenschaften 2. Beurteilung des Lernaufwands 3. Umgang mit Symbolen: Das Summenzeichen Statistik 1 (Vorlesung SoSe 06, ) 1

2 Was ist Statistik? Gegenstand der Statistk: Mathematische Modellierung von Verteilungen Begriffe: a) Verteilung: Eigenschaften einer Menge von Einheiten Beispiele: Einkommen von Haushalten in einer Stadt Zweitstimmen und Bewertungen von Parteien in einem Bundesland Konflikte zwischen Partnern Konsum alkoholischer Getränke einer Person Statistik 1 (Vorlesung SoSe 06, ) 2

3 Was ist Statistik? Gegenstand der Statistk: Mathematische Modellierung von Verteilungen Begriffe: b) Modellierung: Abstraktion von realen Einheiten durch Konzentration auf relevante und Ignorierung irrelvanter Aspekte Informationsverdichtung u. Informationsreduktion Beispiel: Straßenkarte als Modell einer Landschaft Statistik 1 (Vorlesung SoSe 06, ) 3

4 Was ist Statistik? Gegenstand der Statistk: Mathematische Modellierung von Verteilungen Begriffe: c) Mathematsche Modellierung; Modellformulierung in Sprache der Mathematik (Symbole u. Formeln) Beispiel: Verteilung der Körpergröße (X) in einer Population 1 f(x) = e 2π σ 2 X 1 2 ( x μ ) 2 σ X 2 X wobei: μ σ X 2 X =: durchschnittliche Körpergröße (Erwartungswert) =: Ausmaß der Unterschiedlichleit der Körpergrößen (Varianz) Statistik 1 (Vorlesung SoSe 06, ) 4

5 Warum Statistik? Relevanz für Sozialwissenschaften? Sozialwissenschaften befassen sich mit empirischen Regelmäßigkeiten (und den Abweichungen von Regelmäßigkeiten) in Interaktionen, Verhalten u. Vorstellungen von Menschen, deren Ursachen und Konsequenzen. Daher Gegenstand empirischer Analysen in den Sozialwissenschaften: Verteilungen von Interaktionen, Verhaltensweisen, Vorstellungen. Beispiele für sozialwissenschaftliche Fragestellungen zu Verteilungen: Sozialstruktur: Hat die Ungleichheit in Deutschland zugenommen? Verhalten: Gibt es Unterschiede bei der Wahlbeteiligung von Männern und Frauen? Einstellung: Wird die Todestrafe mehrheitlich befürwortet? Zur Beantwortung werden jeweils umfangreiche Datenmengen benötigt, die 1. für eine Fragestellung relevant sein und 2. im Hinblick auf die Fragestellung adäquat ausgewerte werden müssen. Statistik 1 (Vorlesung SoSe 06, ) 5

6 Warum Statistik? Ein Beispiel: Gibt es Unterschiede bei der Wahlbeteiligung von Männern und Frauen? a) relevante Daten: Fragen nach beabsichtigter Wahlbeteiligung u. Geschlecht in Umfrage {(ja, männlich), (ja, weiblich), (weiß nicht, männlich), (ja, männlich), (weiß nicht,weiblich,) (nein, männlich), (nein, männlich), (ja, männlich), (ja, weiblich), (ja, weiblich), (nein, weiblich), (ja, männlich), (ja, weiblich), (ja, männlich), (ja, männlich), (ja, männlich), (ja, weiblich), (ja, weiblich), (weiß nicht, weiblich), (nein, weiblich), (ja, weiblich), (ja, weiblich), (ja, weiblich), (weiß nicht, männlich), (ja, männlich), (ja, männlich), (ja, männlich), (ja, männlich), (ja, weiblich), (nein, weiblich), (weiß nicht, männlich), (weiß nicht, weiblich), (nein, männlich), (ja, männlich), (ja, weiblich), (ja, weiblich), (ja, weiblich), (nein, weiblich), (ja, weiblich), (nein, weiblich), (weiß nicht, weiblich) (weiß nicht, männlich), (ja, weiblich) (ja, männlich), (ja, männlich), (ja, männlich), (ja, weiblich), (nein, weiblich), (ja, weiblich), (ja, weiblich), (ja, weiblich), (weiß nicht, männlich), (ja, männlich), (weiß nicht,weiblich,)... } Antworten von insgesamt 3234 im März bis Juli 1998 befragten Personen in der Allgemeinen Bevölkerungsumfrage der Sozialwissenschaften (ALLBUS) Die Datenmenge lässt sich ohne statistische Modellierung praktisch nicht auswerten! Statistik 1 (Vorlesung SoSe 06, ) 6

7 Warum Statistik? b) Statistische Modellierung: Beabsichtigte Geschlecht Wahlbeteiligung Mann Frau Zusammenfassung der Daten in Häufigkeitstabelle: Geschlecht Mann Frau Geschlecht Mann Frau Geschlecht Mann Frau Geschlecht Mann Frau - ja nein weiß nicht keine Angabe nicht wahlberecht % 62.8% 4.2% 6.5% 13.0% 17.7% 9.9% 9.7% 6.3% 3.3% 71.1% 65.0% 4.6% 6.7% 13.8% 18.3% 10.5% 10.0% 79.5% 72.2% 5.1% 7.5% 15.4% 20.3% 94.0% 90.6% 6.0% 9.4% Total Was besagt das Ergebnis? 100.0% 100.0% (1498) (1736) Prozentuierung alle Befragten 100.0% 100.0% (1404) (1678) Prozentuierung wahlberecht. Befragte 100.0% 100.0% (1256) (1510) Prozentuierung ohne Verweigerungn - Ist der beobachtete Unterschied zwischen Männern und Frauen bedeutsam? - Wie sollen die Meinungslosen berücksichtigt werden? - Wie sehr gefährden die fehlende Angaben von 316 Befragten die Aussagekraft? Die Prozentuierungsbasis kann deutliche Auswirkungen haben! Aber: Statistik macht hierzu keine Vorgabe. Die Antwort muss daher aufgrund inhaltlicher Überlegungen erfolgen! 100.0% 100.0% (1062) (1203) Prozentuierung nur ja/nein Statistik 1 (Vorlesung SoSe 06, ) 7

8 Warum Statistik? Vor Prozentuierung: Beabsichtigte Geschlecht Wahlbeteiligung Mann Frau Welche Ausgangsdaten sollen verwendet werden? Geschlecht Mann Frau - ja nein weiß nicht keine Angabe nicht wahlberecht Total ungewichtete Daten gewichte Daten Gewichtungsvariablen: - Region: alte/neue Länder - HaushaltsGröße - Lassen sich die Ergebnisse von der Stichprobe auf die Gesamtheit aller Wähler verallgemeinern? Sind gewichtete Daten vorzuziehen? Statistik 1 (Vorlesung SoSe 06, ) 8

9 Warum Statistik? Sind die für die Untersuchung erobenen Daten aussagefähig? Beabsichtigte Wahlabsicht BTW 1998 Wahlbeteiligung Mann Frau Rückerinnerung BTW 1994 Mann Frau - ja 94.3% 90.9% - nein 5.7% 9.1% (1071) (1208) gewichtete Daten Tatsächliche Beteiligung Bundestagswahl % 91.8% 91.8% 8.2% 8.2% (1336) (1575) gewichtete Daten Tatsächliche Beteiligung Bundestagswahl % - Lässt die Absichtsfrage tatsächlich Rückschlüsse auf das tatsächliche Verhalten zu? - Warum weichen Rückerinnerung und tatsächliches Verhalten ab? Statistik 1 (Vorlesung SoSe 06, ) 9

10 Warum Statistik? Schlussfolgerungen: Zur Klärung von empirischen Fragen, Formulierung und Prüfung von Vermutungen benötigen die Sozialwissenschaften empirische Daten. Bei der Analyse der Daten besteht Gefahr von Fehlinterpretationen. Fehlerquellen: - ungenügendes inhaltliches Vorwissen über Forschungsgebiet, - ungenügende Kenntnisse über statistische Datenanalyse. Ziel der Statistikausbildung: Gewinnung von Kenntnissen über statistische Datenanalyse, + um Aussagekraft von empirischen Studien zu beurteilen, + um bei eigenen Analysen aussagekräftige Ergebnisse zu erhalten Statistik 1 (Vorlesung SoSe 06, ) 10

11 Klassische Einteilung der Statistik Univariate Verteilungen Deskriptive Statistik Verteilungsparameter (Quantile, Lagemaße, Streuungsmaße) Induktive Statistik / Inferenzstatistik Wahrscheinlichkeitstheorie, Schätzen und Testen Bivariate Verteilungen Multivariate Verteilungen Beschreibung und Prüfung von bivariaten Zuammenhängen Drittvariablenkontrolle Konditionale u. Partielle Effekte Prüfung der Angemessenheit statistischer Modelle Statistik 1 (Vorlesung SoSe 06, ) 11

12 Methoden-Modul 2. Grundlagen sozialwissenschaftlicher Datenanalyse (M2: Statistik I) M2 beinhaltet 2 Veranstaltungen: Workload = 8 Credits 1.Vorlesung Statistik I Abschlussklausur Teil A (60 Minuten) ( 90 Minuten Stoffvermittlung, Fragen, Übungaufgaben) dazu Tutorien zur Vorlesung (45-60 Minuten Lösung der Übungsaufgaben) 2. Übung zu Statistik I Abschlussklausur Teil B (30 Minuten) 2. Übung zu Statistik I A. Statistik mit Excel oder B. Statistik mit SPSS Vermittlung (a) (45 Minuten) Vermittlung (b) (45 Minuten) Übung (a) (45 Minuten Tutorium) Übung (b) (45 Minuten Tutorium) Statistik 1 (Vorlesung SoSe 06, ) 12

13 Veranstaltungsplan (Vorlesung) : Einführung Mathematisches Repititorium: Indizierte Summen : Von der theoretischen Fragestellung zu empirischen Daten Operationalisierung, Messung Skalenniveau Fälle, Variablen, Ausprägungen u. Realisationen: Die Datenmatrix Häufigkeitstabellen : Verteilungen I: Graphische Darstellung und Lagemaße Verteilungsfunktion und Quantile Graphische Darstellung univariater Verteilungen Modus, Median und arithmetisches Mittel : Verteilungen II: Lage- und Streuungsmaße Getrimmtes Mittel u. geometrisches Mittel Streuungsmaße, Schiefe und Steilheit Auswirkungen von Lineartransformationen und Zusammenfassungen Statistik 1 (Vorlesung SoSe 06, ) 13

14 Veranstaltungsplan (Vorlesung) : Übungsklausur I (15 Minuten, 5% Anerkennung auf Abschlussklausur A) Wahrscheinlichkeitstheorie I Stichprobe und Grundgesamtheit Zufallsexperiment und Wahrscheinlichkeiten Bedingte Wahrscheinlicheiten und statistische Unabhängigkeit Statistisches Modell und Realität (Gesetz der großen Zahl) : Wahrscheinlichkeitstheorie II Zufallsvariablen und Wahrscheinlichkeitsverteilungen Kennwerteverteilungen von Häufigkeiten und Anteilen : Wahrscheinlichkeitstheorie III Zentraler Grenzwertsatz Normalverteilung Quantile stetiger Verteilungen Statistik 1 (Vorlesung SoSe 06, ) 14

15 Veranstaltungsplan (Vorlesung) : Schätzen und Testen I Schätzer, Schätzungen und Wahrscheinlichkeitsverteilungen von Schätzern Schätzungen von Anteilen, Mittelwerten und Varianzen Die Logik von Konfidenzintervallen Anwendung von Konfidenzintervallen : Schätzen und Testen II Schätzen oder Testen? Die Logik statistischer Hypothesentests Prüfung von Hypothesen über Anteile und Mittelwerte : Übungsklausur II (15 Minuten, 5% Anerkennung auf Abschlussklausur A) Zusammenhangsanalyse I Die Vierfeldertafel und der Aufbau von Kreuztabellen Zusammenhangsmaße in der Vierfeldertabelle Statistik 1 (Vorlesung SoSe 06, ) 15

16 Veranstaltungsplan (Vorlesung) : Zusammenhangsanalyse II Zusammenhangsmaße für nominalskalierte Variablen Zusammenhangsmaße für ordinale Variablen auf der Basis von Paarvergleichen : Zusammenhangsanalyse III Von der Kreuztabelle zum Regressionsmodell Das Regressionsmodell in der Stichprobe Kovarianz und Produktmomentkorrelation : Zusammenhangsanalyse IV Annahmen bei der Schätzung von Regressionskoeffizienten Standardfehler und Konfidenzintervalle im bivariaten Regressionsmodell Hypothesentests im bivariaten Regressionsmodell : Abschlussklausur (Klausur A: Grundlagen der Statistik) Statistik 1 (Vorlesung SoSe 06, ) 16

17 Basisliteratur 3. Auflage, 2006 ISBN: Auflage, 2003 ISBN: Statistik 1 (Vorlesung SoSe 06, ) 17

18 Einige Ergebnisse der Befragung zur Anmeldung 1. Zusammenhang zwischen eingeplanten Zeitaufwand für Vor- und Nachbereitung des Lehrstoffes nach Einschätzung der Schwierigkeit des erfolgreichen Bestehens 15 Wieviele Stunden planen Sie pro Woche für die Vor- und Nachbereitung des Stoffes der Statistikveranstaltung ein? * F16 Wie schwer schätzen Sie den Statistik-1-Schein ein? Kreuztabelle % von F16 Wie schwer schätzen Sie den Statistik-1-Schein ein? F15 Wieviele Stunden planen Sie pro Woche für die Vor- und Nachbereitung des Stoffes der Statistikveranstaltung ein? Gesamt bis maximal 1 Stunde 2.00 mehr als 1 bis maximal 2 Stunden 3.00 mehr als 2 bis maximal 3 Stunden 4.00 mehr als 3 bis maximal 4 Stunden 5.00 mehr als 4 bis maximal 5 Stunden 6.00 mehr als 5 Stunden 1.00 sehr leicht F16 Wie schwer schätzen Sie den Statistik-1-Schein ein? 2.00 leicht 3.00 eher leicht 4.00 eher schwer 5.00 schwer 6.00 sehr schwer Gesamt 4.9% 7.3% 4.5% 100.0% 22.0% 34.1% 40.0% 30.9% 100.0% 39.0% 31.7% 44.0% 37.3% 100.0% 29.3% 12.2% 8.0% 18.2% 2.4% 7.3% 4.0% 4.5% 2.4% 7.3% 4.0% 4.5% 100.0% 100.0% 100.0% 100.0% 100.0% 100.0% 100.0% Basis: (1) (1) (1) (41) (41) (25) (110) Mittelwert: Statistik 1 (Vorlesung SoSe 06, ) 18

19 Einige Ergebnisse der Befragung zur Anmeldung 2. Axiomatische Messtheorie Frage 7 u. 8: Für welche (welches) Skalenniveau stellt die folgende Variable ausreichend Informationen zur Verfügung? Frage 7: Religionszgehörigkeit Nominal Ordinal Intervall Ratio weiß nicht n % % richtige Antw. + A.-Muster A.-Muster A.-Muster A.-Muster A.-Muster A.-Muster Statistik 1 (Vorlesung SoSe 06, ) 19

20 Einige Ergebnisse der Befragung zur Anmeldung 2. Axiomatische Messtheorie Frage 7 u. 8: Für welche (welches) Skalenniveau stellt die folgende Variable ausreichend Informationen zur Verfügung? Frage 8: Alter in Monaten Nominal Ordinal Intervall Ratio weiß nicht n % % richtige Antw A.-Muster A.-Muster A.-Muster A.-Muster A.-Muster A.-Muster A.-Muster A.-Muster A.-Muster Statistik 1 (Vorlesung SoSe 06, ) 20

21 Einige Ergebnisse der Befragung zur Anmeldung 3. Grundrechenarten Frage 9 u. 10: Welche Antwort stimmt? Frage 9: n % % Vorgabe a) Vorgabe b) Vorgabe c) Vorgabe d) weiß nicht Frage 10: n % % Vorgabe a) Vorgabe b) Vorgabe c) Vorgabe d) weiß nicht Statistik 1 (Vorlesung SoSe 06, ) 21

22 Einige Ergebnisse der Befragung zur Anmeldung 4. Dreisatz und Prozentrechnung Frage 11: In Göttingen leben 600 Enten. An einem See, der Zugvögel als Rasstpaltz dient, infizieren sich pro Stunde 24 Enten mit Vogelgrippe. Wieviel Prozent der Entenpopulation sind nach 14 Stunden infiziert? Infiziert sind n % % Vorgabe b) 21% Vorgabe f) 24% Vorgabe d) 56% Vorgabe e) 66% Vorgabe a) 96% Vorgabe c) 108% weiß nicht Statistik 1 (Vorlesung SoSe 06, ) 22

23 Einige Ergebnisse der Befragung zur Anmeldung 5. Indizierte Summen berechnen Vorgaben Frage 13 n % % % Vorgabe e) Fall X Y Vorgabe b) Frage 13: y i =? Vorgabe f) Vorgabe d) Vorgabe a) Frage 14: xi y i =? Vorgabe c) i= weiß nicht nicht gefragt Welche Antwort stimmt? Vorgaben Frage 14 n % % % Vorgabe e) Vorgabe b) Vorgabe f) Vorgabe d) Vorgabe a) Vorgabe c) weiß nicht nicht gefragt Statistik 1 (Vorlesung SoSe 06, ) 23

24 Das Summenzeichen Mathematisches Repititorium: Indizierte Summen Das große griechiche Sigma (Σ) steht in der Mathematik u.a. für die Summierung und heißt dann Summenzeichen. Es steht für die Summierung einer Menge von Elementen. Beispiel: Daten: X Y Wenn offensichtlich ist, über welche Menge summiert werden soll, wird einfach das Summenzeichen-Symbol verwendet. Anderenfalls muss die Menge, über die summiert wird, gekennzeichnet werden. X bezeichnet entsprechend die Summierung über alle Elemente einer Menge, die den Namen X hat. 28 X ist also die Summe über die erste Zeile, X = 28, 38 Y entsprechend die Summe über die zweite Zeile, Y = 38 Statistik 1 (Vorlesung SoSe 06, ) 24

25 Indizierte Summen Indizierte Summen Wenn nicht alle Elemente einer Summe, sondern eine Auswahl summiert werden soll, müssen die auszuwählenden Elemente gekennzeichnet werden. Dazu werden sie durchnummeriert. Die Nummer, die ihre Position angibt, wird als Index (oder Indexvariable) bezeichnet. Für Indizes werden sehr oft die Buchstabem i, j, k oer l verwendet. Wenn die Menge durch einen großen Buchstaben gekennzeichnet ist, werden die Elemente oft durch einen kleinen Buchstaben gekennzeichnet. Index X Y Z x 3 bezeichnet so das dritte Element von X (x 3 = 0), y 1 das erste Element von Y (y 1 = 4), z 6 das sechste (letzte) Element von z (z 6 = 1) Sollen im Beispiel nur das dritte bis fünfte Element von Y summiert werden, wird a) die Menge durch ein beliebiges Indexsymbol indiziert und b) der Anfang und das Ende der Indexnummern unten und oben am Summenzeichen angegeben: 5 y = y + y + y = = 7 i= 3 i Statistik 1 (Vorlesung SoSe 06, ) 25

26 Indizierte Summen Index X Y Z i= 3 5 i= 3 y i y = y + y + y = = 7 i i X Y Z Die Anzahl der Elemente (Fälle) insgesamt einer Menge wird oft duch den Buchstaben N oder n gekennzeichnet! n j= 1 j n j1 = z z = = 3 j j X Y Z Statistik 1 (Vorlesung SoSe 06, ) 26

27 Indizierte Summen Durch Verwendung von Formeln können in der Indizierung sehr spezifische Teilmengen ausgewählt. werden. Beispiel a): Auswahl jedes zweiten Elements einer Menge X, d.h. der geraden Elemente: Fall X n/2 i= 1 x = x + x + x 2i = = 8 Beispiel b): Auswahl der ungeraden Elemente einer Menge X Fall X n/2 i= 1 x = x + x + x 2i = = 7 Statistik 1 (Vorlesung SoSe 06, ) 27

28 Indizierte Summen Summen über Konstanten sind gleichbedeutend mit der Multiplikation der Konstante mit der zu summierenden Anzahl. Fall Wert i= 1 4= 5 4= 20 Konstanten innerhalb von Summen können daher oft ausgeklammert werden: Fall Wert k= 1 4w = = 20 k 5 5 k k= 1 k= 1 k ( ) 4 w = 4 w = = 4 5= 20 Statistik 1 (Vorlesung SoSe 06, ) 28

29 Indizierte Summen Summen können auch über Formeln von Elementen aus mehreren Mengen gebildet werden. n i= 1 n/2 i= 1 Fall X Y Z ( ) ( ) ( ) x + y = x + y + x + y + x + y i i n n ( ) ( ) ( ) ( ) ( ) ( ) = = 30 ( ) ( ) ( ) y z = y z + y z + y z i n+ 1 i 1 n 2 n 1 n/2 n/2+ 1 ( ) ( ) ( ) = = 4 Statistik 1 (Vorlesung SoSe 06, ) 29

30 Indizierte Summen Die Auflösung (Berechnung) von Summen von Summen kann aufwendig sein. Fall X Y Z Beispiel: 3 6 i= 1 j= i= 1 j= 4 x i + y j ( ( )) x + y = x + y + y + y i j ( x2 ( y4 y5 y6) ) ( x3 ( y4 y5 y6) ) ( ) = = ( ) ( 1 (10)) ( 0 (10)) = = 33 = x i i= 1 j= 4 y j Statistik 1 (Vorlesung SoSe 06, ) 30

31 Statistik I im Sommersemester 2006 Themen am : Von der theoretischen Fragestellung zu empirischen Daten Operationalisierung, Messung Skalenniveau Die Datenmatrix: Fälle, Variablen, Ausprägungen u. Realisationen Erstellung von Häufigkeitstabellen Lernziele: 1. Beurteilung der Relevanz von Operationalisierung und Messung für die Sozialforschung 2. Kenntniss über das Messniveau von Variablen und den daraus zu ziehenden Konsequenzen 3. Unterscheidung zwischen Variablen, Ausprägungen und Realisierungen 4. Berechnung von Häufigkeitstabellen und Verstehen der dabei angewendeten Formeln Statistik 1 (Vorlesung SoSe 06, ) 31

32 Wiederholung der wichtigsten Inhalte der letzten Sitzung Gegenstand der Statistk: Mathematische Modellierung von Verteilungen Univariate Verteilungen Deskriptive Statistik Verteilungsparameter (Quantile, Lagemaße, Streuungsmaße) Induktive Statistik / Inferenzstatistik Wahrscheinlichkeitstheorie, Schätzen und Testen Bivariate Verteilungen Multivariate Verteilungen Beschreibung und Prüfung von bivariaten Zuammenhängen Drittvariablenkontrolle Konditionale u. Partielle Effekte Prüfung der Angemessenheit statistischer Modelle Statistik 1 (Vorlesung SoSe 06, ) 32

33 Warum Statistik? Zur Klärung von empirischen Fragen, Formulierung und Prüfung von Vermutungen benötigen die Sozialwissenschaften empirische Daten. Bei der Analyse der Daten besteht Gefahr von Fehlinterpretationen. Fehlerquellen: - ungenügendes inhaltliches Vorwissen über Forschungsgebiet, - ungenügende Kenntnisse über statistische Datenanalyse. Ziel der Statistikausbildung: Gewinnung von Kenntnissen über statistische Datenanalyse, + um Aussagekraft von empirischen Studien zu beurteilen, + um bei eigenen Analysen aussagekräftige Ergebnisse zu erhalten Statistik 1 (Vorlesung SoSe 06, ) 33

34 Methoden-Modul 2. Grundlagen sozialwissenschaftlicher Datenanalyse M2 beinhaltet 2 Veranstaltungen: Workload = 8 Credits 1.Vorlesung Statistik I Abschlussklausur Teil A (60 Minuten) ( 90 Minuten Stoffvermittlung, Fragen, Übungaufgaben) dazu Tutorien zur Vorlesung (45-60 Minuten Lösung der Übungsaufgaben) 2. Übung zu Statistik I Abschlussklausur Teil B (30 Minuten) 2. Übung zu Statistik I A. Statistik mit Excel oder B. Statistik mit SPSS Vermittlung (a) (45 Minuten) Vermittlung (b) (45 Minuten) Übung (a) (45 Minuten Tutorium) Übung (b) (45 Minuten Tutorium) Statistik 1 (Vorlesung SoSe 06, ) 34

35 Mathematisches Repititorium: Indizierte Summen Das Summenzeichen Das große griechiche Sigma (Σ) steht in der Mathematik u.a. für die Summierung und heißt dann Summenzeichen. Es steht für die Summierung einer Menge von Elementen. n j1 = z j j X Y Z n j= 1 z = = 3 j Statistik 1 (Vorlesung SoSe 06, ) 35

36 Operationalisierung Ausgangspunkt: Forschungsfrage Beispiel: Je höher die Beinflussbarkeit des politischen Systems eingeschätzt wird und je höher die Reaktionsbereitschaft des politischen Systems eingeschätzt wird, desto höher ist die Unterstützung des politischen Systems (zu überprüfende Hypothese) Vor jeder empirischen Analyse: Klärung der Begriffe Einschätzung der Beeinflussbarkeit des politischen Systems: Urteil eines Staatsangehörigen darüber, wie sehr er auf politische Entscheidungen Einfluss nehmen kann. Einschätzung der Reaktionsbereitschaft des politischen Systems: Urteil eines Staatsangehörigen darüber, wie sehr politische Entscheidungsinstanzen bei ihren Entscheidungen auf Vorstellungen und Forderungen der Staatsangehörigen achten. Unterstützung des politischen Systems: Ausmaß der (positiven) Bewertungen der politischen Institutionen und deren Aktivitäten. Statistik 1 (Vorlesung SoSe 06, ) 36

37 Operationalisierung Hypothese: Je höher die Beinflussbarkeit des politischen Systems eingeschätzt wird und je höher die Reaktionsbereitschaft des politischen Systems eingeschätzt wird, desto höher ist die Unterstützung des politischen Systems Wenn es sich um eine empirische Hypothese handelt, hängt es von der Beschaffenheit der Realität ab, ob die Hypothese zutrifft oder nicht zutrifft. Für die Prüfung muss dann empirisch feststellbar sein, ob bzw. wie sehr die in den Begriffen der Hypothese vorkommenden Sachverhalte vorliegen oder nicht vorliegen. Operationalisierung Benennung von Korrespondenzregeln, mit deren Hilfe das Ausmaß des Vorliegens eines durch einen Begriff bezeichneten Sachverhalts festgestellt wird Über Operationalisierung erfolgt also Verbindung zwischen Begriffen und empirisch beobachtabaren Sachverhalten. Statistik 1 (Vorlesung SoSe 06, ) 37

38 Operationalisierung Operationalisierung Benennung von Korrespondenzregeln, mit deren Hilfe das Ausmaß des Vorliegens eines durch einen Begriff bezeichneten Sachverhalts festgestellt wird Beispiel: Operationalisierung des Begriffs "Systemunterstützung" durch die Frage (Variable): Was würden Sie allgemein zu der Demokratie in der Bundesrepublik, d.h. zu unseren politischen Parteien und zu unserem ganzen politischen System sagen? Sind Sie damit sehr zufrieden, eher zufrieden, eher unzufrieden oder sehr unzufrieden? Bei dieser Operationalisierung wird einer Person, der Eigenschaftsträgerin, eine starke Systemunterstützung zugeschrieben, wenn sie die Antwort sehr zufrieden gibt, eine geringe Systemunterstützung, wenn sie die Antwort eher zufrieden gibt, eine geringe Systemablehnung, wenn sie die Antwort eher unzufrieden gibt und eine starke Systemablehnung, wenn sie die Antwort sehr unzufrieden gibt. Statistik 1 (Vorlesung SoSe 06, ) 38

39 Operationalisierung Die Korrespondenzregeln schreiben also vor, welche Schlussfolgerungen aus einer empirischen Beobachtung, hier: der Antwort eines Befragten in einem Interview, hinsichtlich des Vorliegens des empirischen Sachverhalts getroffen werden sollen, der durch den Begriff bezeichnet wird. Korrespondenzregeln sind Konsequenzen einer Messtheorie, die Folgen der durch einen Begriff bezeichneten theoretisch erwartbaren Eigenschaften auf empirisch beobachtbare Sachverhalte benennt. Die Postulierung dieser Folgen heißen Korrespondenzhypothesen, im Beispiel: 1. Je höher die Unterstützung des politischem System bei einer Person ist, desto stärker ist die geäußerte Zufriedenheit in der Antwort auf die Frage nach dem Funktionieren der Demokratie in dem politischen System. 2. Wenn sich zwei Personen in ihren Unterszützung des politischen Systems deutlich unterscheiden, dann geben sie auch unterschiedliche Antworten auf die Frage nach der Demokratiezufriedenheit untercheiden. Statistik 1 (Vorlesung SoSe 06, ) 39

40 Operationalisierung Forschungsfrage mit Begriffen, die empirische Sachverhalte beinhalten Explikation der Begriffe Formulierung einer Messtheorie mit Korrepondenzhypothesen Formulierung von Korrespondenzregeln Was ist der Unterschied zwischen einer Korrespondenzregel und einer Korrespondenzhypothese? Probleme: (1) In der Regel keine explizite Formulierung der Messtheorie: Postulate der Messtheorie (Korrespondenzhypothesen) nicht bewusst. (2) Korrespondenzhypothesen können falsch sein: Korrespondenzregeln vermutlich unangemessen Empirische Beobachtung erlaubt keine Antwort auf Forschungsfrage. Statistik 1 (Vorlesung SoSe 06, ) 40

41 Operationalisierung Frage 1: Systeunterstützung Frage 2a: Einschätzung der Beeinflussbarkeit des politischen Systems (Efficacy) Frage 2b: Einschätzung der Reaktionsbereitschaft des politischen Systems (Responsiveness) Beobachtung: Geschlecht Frage 4: Alter (Quelle: Kühnel/ Krebs, 2006: S. 26) Statistik 1 (Vorlesung SoSe 06, ) Tabelle 2.1: Beispiel eines Erhebungsinstrumentes F R A G E A N T W O R T Code 1. Sind Sie mit der Art und Weise, wie die Demokratie in der Bundesrepublik funktioniert, alles in allem gesehen Nun einige Aussagen, über die man verschiedener Ansicht sein kann. Sagen Sie mir bitte jeweils, ob Sie der Aussage eher zustimmen oder eher nicht zustimmen. a) Leute wie ich haben so oder so keinen Einfluss darauf, was die Regierung tut b) Die Parteien wollen nur die Stimmen der Wähler, ihre Ansichten interessieren sie nicht ohne Abfrage eintragen! Das Interview wurde geführt mit Zum Schluss noch eine Frage zur Statistik. Sagen Sie mir bitte, in welchem Jahr Sie geboren sind.... sehr zufrieden, eher zufrieden, eher unzufrieden, oder völlig unzufrieden?... weiß nicht 1 keine Angabe stimme stimme weiß keine eher eher nicht nicht Angabe zu zu einem Mann... einer Frau... Geburtsjahr vierstellig eintragen! keine Angabe Kursiver gedruckter Text ist für den Interviewer bestimmt und wird nicht vorgelesen

42 Beobachten und Messen Im Erhebungsinstrument werden die Messvorschriften festgehalten, die sich aus den Korrespondenzregeln ergeben. Es dient als Hilfe bei der Erfassung der interessierenden Eigenschaften von Untersuchungseinheiten. Messen bezieht sich auf dann auf den Vorgang der Datengewinnung, d.h. der Anwendung der Korrespondenzregeln und der Umsetzung und Festhaltung der Beobachtungen in mathematische Größen (Zahlen). Bei dem oft nicht eindeutig verwendeten Begriff lassen sich zwei unterschiedliche Bedeutungen unterscheiden: (1) Messen im weiteren Sinne bezieht sich auf den Akt der Datenerhebung. In der Sozialforschung spricht man auch von Beobachtung. (2) Messen im engeren Sinne bezieht sich auf die Zuordnung von Zahlen zu den bereits beobachteten empirischen Eigenschaften eines Objekts Messen im engeren Sinne wird technisch auch als Kodierung bezeichnet. Statistik 1 (Vorlesung SoSe 06, ) 42

43 Beobachten F R A G E A N T W O R T Code 1. Sind Sie mit der Art und Weise, wie die Demokratie in der Bundesrepublik funktioniert, alles in allem gesehen Nun einige Aussagen, über die man verschiedener Ansicht sein kann. Sagen Sie mir bitte jeweils, ob Sie der Aussage eher zustimmen oder eher nicht zustimmen. a) Leute wie ich haben so oder so keinen Einfluss darauf, was die Regierung tut b) Die Parteien wollen nur die Stimmen der Wähler, ihre Ansichten interessieren sie nicht ohne Abfrage eintragen! Das Interview wurde geführt mit sehr zufrieden, eher zufrieden, eher unzufrieden, oder völlig unzufrieden?... weiß nicht 1 keine Angabe stimme stimme weiß keine eher eher nicht nicht Angabe zu zu einem Mann... einer Frau Zum Schluss noch eine Frage zur Geburtsjahr vierstellig eintragen! Statistik. Sagen Sie mir bitte, in 1943 welchem Jahr Sie geboren sind. keine Angabe Kursiver gedruckter Text ist für den Interviewer bestimmt und wird nicht vorgelesen. Statistik 1 (Vorlesung SoSe 06, ) Beobachten bedeutet im Beispiel: Stellen der Fragen und Notieren der Antworten Die Messung ergibt: Die befragte Person... (1) ist eher zufrieden mit dem Funktionieren der Demokratie, (2) stimmt der Aussage nicht zu, dass Leute wie die Person keinen Einfluss auf die Regierung hat, (3) stimmt auch nicht zu, dass die Parteien nicht an den Ansichten der Wähler interessiert sind, (4) ist männlich (5) und 1943 geboren. 43

44 Messen Mesen ist die Zuordnung von Zahlen zu den möglichen Vorkommensweisen einer Eigenschaften von Untersuchungseinheiten. Jedem empirischen Objekt wird eine Zahl (der Code) derart zugeordnet, dass der Zahl eine Eigenschaft des Objektes entspricht, und dem Vergleich von jeweils zwei Messungen der gemessenen Eigenschaft der Vergleich der zugeordneten Zahlen entspricht. Beispiel: gleiches Geschlecht gleiche Zahl, verschiedenes Geschlecht verschiedene Zahl. A B C D 1 2 Statistik 1 (Vorlesung SoSe 06, ) 44

45 Messen in der axiomatischen Messtheorie Definition von Messen in der axiomatischen Messtheorie: Messen ist eine homomorphe Abbildung eines empirischen Relativs in ein numerisches Relativ A B C D empirisches Relativ: empirische Objekte und Beziehungen (Relationen) zwischen den Objekten anhand deren Eigenschaften (hier: Vergleich nach Gleichheit bzw. Verschiedenheit von Menschen hinsichtlich ihres Geschlechts 1 2 numerisches Relativ: mathematische Objekte (Zahlen) und Beziehungen (Relationen) zwischen den Zahlen Homomorphe (strukturtreue) Abbildung: Vergleiche aufgrund der empischen Eigenschaft entsprechen Vergleiche von Zahlen und müssen daher zum gleichen Ergebnis kommen. hier: gleiche Zahl = gleiches Geschlecht, verschiedene Zahl = verschiedenes Geschlecht. Statistik 1 (Vorlesung SoSe 06, ) 45

46 Messniveau oder Skalenniveau: Die Informationshaltigkeit von Messungen Zwischen Zahlen lassen sich sehr verschiedenen Beziehungen (Relationen) herstellen. So ist die Zahl 2 doppelt so groß wie die Zahl 1; 2 = 2 1 Dieser Eigenschaft entspricht bei der Messung des Geschlechts keine empirische Eigenschaft: Weibliche Befragte (Code = 2) haben verglichen mit männlichen Befragten (Code = 1) kein doppeltes Ausmaß an der Eigenschaft Geschlecht; Geschlecht lässt gar sich nicht hinsichtlich seines Ausmaßes vergleichen. Das Messniveau oder Skalenniveau einer Messung legt fest, welche numerische Eigenschaften von Zahlen empirischen Bedeutungen entsprechen: Messungen auf Nominalskalenniveau enthalten nur Informationen, ob gleiche oder ungleiche Ausprägungen einer Eigenschaft vorliegen; Messungen auf Ordinalskalenniveau geben zusätzlich Auskunft über ein mehr oder weniger des Ausmaßes einer Eigenschaft; Messungen auf Intervallskalenniveau erlauben zusätzlich den Abstand zwischen einzelnen Messwerten inhaltlich zu interpretieren; Messungen auf Ratioskalenniveau (auch: Verhältnisskalenniveau, Proportionalskalenniveau) ermöglichen zusätzlich die Interpretation des Verhältnisses von Messwerten. Je höher das Messniveau, desto informationshaltiger die Messung Statistik 1 (Vorlesung SoSe 06, ) 46

47 Messniveau oder Skalenniveau: Die Informationshaltigkeit von Messungen Tabelle 2.2: Beispiele für Skalenniveaus Relation zwischen Skalenniveau Ausprägungen Beispiele Nominalskala Klassifikation Religion, Familienstand, Parteineigung Ordinalskala Rangordnung Einstellungsmessungen in Umfragen z.b. Ausmaß an Zustimmung zu einer Behauptung Intervallskala Abstand Temperatur in Grad Celsius, Geburtsjahr Ratioskala Verhältnis Alter, Größe, Einkommen (nach Kühnel/ Krebs, 2006: S. 31) Statistik 1 (Vorlesung SoSe 06, ) 47

48 Messniveau: Hierarchie zwischen den Messnievaus Zwischen den Messniveaus besteht eine hierarchische Ordnung: Alle Informationen eines geringeren Messniveaus gelten auch bei höherem Messniveau. Die zusätzlichen Informationen eines höheren Messniveaus können aber nicht bei einem geringeren Messniveau genutzt werden: Interpretierbare Relationen Identität Ränge Abstände Quotienten Nominalskala ja nein nein nein Ordinalskala ja ja nein nein Intervallskala ja ja ja nein Ratioskala ja ja ja ja Intervall- und Ratioskalen werden auch als metrische Skalen bezeichnet. Daraus folgt: Jede Messung auf Ratioskalenniveau ist auch eine Messung auf Intervallskalenniveau, auf Ordinalskalenniveau und auf Nominalskalenniveau; jede Messung auf Intervallskalenniveau ist auch eine Messung auf Ordinalskalenniveau und auf Nominalskalenniveau; jede Messung auf Ordinalskalenniveau ist auch eine Messung auf Nominalskalenniveau. Statistik 1 (Vorlesung SoSe 06, ) 48

49 Messniveau: Zulässige Transformationen Welche Zahlen den Ausprägungen eines Merkmals zugeordnet werden, ist solange willkürlich, solange die strukturtreue Abbildung der empirischen Beziehungen in die mathematischen Beziehungen erhalten bleibt. Messskalen (d.h. Kodierungen), die die gleichen Informationen erhalten, sind äquivalent. Beispiel: Ob bei der Ordinalskala Demokratiezufriedenheit die Zahlen 1,2,3,4 oder 0,1,2,3 oder 10,11,15,20 verwendet werden, ist beliebig, solange eine größere Zahl stets für eine größere Demokratiezufriedenheit steht. Antworten völlig unzufrieden eher unzufrieden eher zufrieden sehr zufrieden Alternative Kodierungen zulässige unzulässige Messskalen Der Wechsel (Übergang) von einer Kodierung zu einer anderen Kodierung wird als zulässige Transformation bezeichnet, wenn alle empirischen Informationen enthalten bleiben. Bei unzulässigen Transformationen gehen dagegen Informationen verloren. Es ist aber unzulässig, die Zahlen 1,2,4,3 zu verwenden, da dann eher zufrieden (4) für eine größere Zufriedenheit stehen würde als sehr zufrieden (3). Statistik 1 (Vorlesung SoSe 06, ) 49

50 Messniveau: Zulässige Transformationen Tabelle 2.3: Zulässige Transformationen Skalen- Zulässige Transformationen Beispiele für erlaubte mathematische niveau Operationen Nominal Alle ein-eindeutigen Transfor- Logarithmieren, Multiplikation, mationen Addition (Subtraktion) einer Konstanten Ordninal Alle positiv-monotonen, die Wenn Ausgangswerte > 0: Rangordnung wahrenden Trans- Quadrieren, Logarithmieren, Wurzelformationen ziehen Intervall Alle positiven linearen Trans- Y = a + b X mit b> 0 formationen Ratio Streckungen und Stauchungen Y = b X mit b> 0 (nach Kühnel/ Krebs, 2006: S. 32) Statistik 1 (Vorlesung SoSe 06, ) 50

51 Bedeutung des Skalenniveaus für die Sozialforschung Das Messniveau ist wichtig, weil es Aussagen über die Informationshaltigkeit von Messungen beinhaltet. Für die statistische Datenanalyse ist das Messniveau auch deswegen wichtig, weil es festgelegt, ob ein statistisches Analysemodell angemessen ist oder nicht: Wenn sich nach der Transformation einer Messwertreihe mit einer zulässigen Transformation die inhaltliche Aussage ändert, ist ein Analysemodell nicht angemessen.. Wenn ein nicht angemessenes Analysemodell verwendet wird, besteht die Gefahr der Produktion von Artefakten: Analyseergebnisse werden als vermeintliche empirische Befunde interpretiert, obwohl sie ungültig und Folge eines nicht angemessenen Analysemodells sind. Beispiel:Vergleich von Mittelwerten bei ordinalen Messungen Messwerte bei Ausgangsskala Gruppe 1 Gruppe Mittelwert: 10/3 11/3 Gruppe 2 hat im Mittel höheres Ausmaß an der interessierenden Eigenschaft. Statistik 1 (Vorlesung SoSe 06, ) zulässige Transformation der Ordinalskala: Ranginformationen bleiben erhalten. Messwerte nach Transformation Gruppe 1 Gruppe Mittelwert: 46/3 45/3 Gruppe 2 hat im Mittel höheres Ausmaß an der interessierenden Eigenschaft. 51

52 Bestimmung des Messniveaus Die axiomatischen Messtheorie nennt als Voraussetzungen Repräsentation, Eindeutigkeit und Bedeutsamkeit, die zur Erreichung eines bestimmten Messniveaus nachgewiesen werden müssen: (1) Repräsentationstheoreme geben für jedes Skalenniveau Präzisierungen an, um Repräsentation nachzuweisen. Beispiel bei einer Ordinalskala: Transitivitätsbedingung muss erfüllt sein. Wenn bei drei Beobachtungen A, B und C gilt: (a) bei Beobachtung B liegt eine höheres Ausmaß der zu messenden Eigenschaft vor als bei Beobachtung A, (b) bei Beobachtung C liegt eine höheres Ausmaß der zu messenden Eigenschaft vor als bei Beobachtung B, dann muss auch gelten: (c) bei Beobachtung C liegt eine höheres Ausmaß der zu messenden Eigenschaft vor als bei Beobachtung A. Gilt die Transitivitätsbedingung nicht, kann nicht auf Ordinalskalenniveau gemessen werden. Statistik 1 (Vorlesung SoSe 06, ) 52

53 Bestimmung des Messniveaus (2) Eindeutigkeitstheoreme geben die Bedingungen an, unter denen zulässige Transformationen im numerischen Relativ möglich sind. (3) Bedeutsamkeitstheoreme beziehen sich auf die statistischen Verfahren, die unter einem Skalenniveau zulässig sind. Repräsentation bezieht sich also auf den Informationsgehalt im empirischen Relativ, Eindeutigkeit auf die zulässigen Transformationen innerhalb des numerischen Relativs und Bedeutsamkeit auf die Gültigkeit statistischer Modelle innerhalb eines Messniveaus. Nach der axiomatischen Messtheorie muss für jede empirische Messkala das Vorliegen der drei Bedingungen nachgewiesen sein. In der Praxis erfolgt oft eine Festlegung des Skalenniveaus nach Augenschein ( measurement per fiat ). Statistik 1 (Vorlesung SoSe 06, ) 53

54 Bestimmung des Messniveaus Bei der Unterstellung eines Messniveaus sind drei Aspekte zu beachten: 1. Beim Messniveau sind empirische wie theoretische Gegebenheiten relevant. Daher kann auch das Messniveau einer Größe nicht theorielos (d.h. ohne theoretische Annahmen) ermittelt werden. Beispiel: Haarfarbe ist in der Soziologie der Mode eine nominalskalierte Größe. In der Physik ist Farbe dagegen eine auf Rationskalenniveau gemessene Frequenz von Lichtwellen. 2. Eine zu prüfende empirische Theorie kann ein bestimmtes Messniveau für die beteiligten Konzepte voraussetzen. Ist dieses nicht gegeben, ist die Theorie nicht oder nur eingeschränkt prüfbar. Beispiel: Die Nutzentheorie behauptet, dass sich der Nettonutzen einer Alternative aus der Produktsumme der Bewertungen der mit der Alternative verbundenen Konsequenzen und den Auftretenswahrscheinlichkeiten dieser Konsequenzten ergibt. Sind die Bewertungen und die Auftretenswahrscheinlichkeiten nicht auf metrischem Messniveau erfassbar, kann diese Behauptung nicht geprüft werden. Statistik 1 (Vorlesung SoSe 06, ) 54

55 Bestimmung des Messniveaus 3. Das Messniveau der beobachteten Größen kann sich vom Messniveau der eigentlich interessierenden theoretischen Eigenschaft unterscheiden und z..b. ein höheres Messniveau haben. Beispiel: Alter dürfte in der Regel auf Ratioskalenniveau messbar sein. Wird Alter aber in einer Studie im Sinne der theoretischen Konzeption des Lebenszyklus verwendet, handelt es sich möglicherweise nur um eine nominale Messung. Letztlich kommt es bei der Festlegung des Messniveaus und der Messkala (Kodierung) darauf an, ob die verwendeteten Zahlen und die eingesetzten Analysemodelle inhaltlich interpretierbar sind. Statistik 1 (Vorlesung SoSe 06, ) 55

56 Bestimmung des Messniveaus Beispiel für die Festlegung einer Messkala. Die Einstellung zu Schwangerschaftsabbrüchen wird durch die Frage operationalisiert: Welche Position haben Sie: Sollen Ihrer Ansicht nach Abtreibungen grundsätzlich verboten werden, sollen Abtreibungen grundsätzlich erlaubt sein oder sollen Abtreibungen nur in bestimmten Situationen erlaubt sein? Es wird folgende Kodierung verwendet: Antwort Messwerte grundsätzlich verboten 1 in bestimmten Situationen erlaubt 0 grundsätzlich erlaubt +1 Antwortverteilung in einer Umfrage % % % In einer Umfrage ergibt sich ein Mittelwert von 0.2 = 100 ( 1) (0) (+1). Dieser Wert ist inhaltlich interpretierbar: Es gibt 0.2, d.h. 20% mehr Personen, die eine Abtreibung grundsätzlich erlauben lassen wollen (nämlich 40%), als es Personen gibt, die eine Abbtreibung grundsätzlich verbieten lassen wollen (nämlich 20%). Statistik 1 (Vorlesung SoSe 06, ) 56

57 Variablen und deren Ausprägungen Begriffe wie Systemunterstützung sind sprachliche Konstruktionen, die im Kontext einer Theorie gebildet werden. In der Statistik sind nicht Begriffe, sondern Variablen die Ausgangsgrößen empirischer Analysen. Eine Variable bezeichnet eine mögliche Eigenschaft, d.h. ein Merkmal (Prädikat), die ein Merkmalsträger (z.b. ein Mensch oder eine Organisation) aufweisen oder aber nicht aufweisen kann. Die Ausprägungen (Kategorien, Werte) einer Variablen geben an, wie und evtl. in welchem Ausmaß die Eigenschaft bei den Merkmalsträgern vorliegen kannt. Beispiele: - Die Variable Geschlecht hat i.a. zwei Ausprägungen, männlich und weiblich ; - Die Variable Konfession kann in einer Umfrage z.b. 6 Ausprägungen haben: katholisch, protestantisch, muslimisch, jüdisch, andere, keine ; - Die Variable höchster allgemeinbildender Schulabschluss kann 3 Ausprägungen haben: kein Abschluss Volksschule/mittlere Reife (Fach-) Hochschulreife. Statistik 1 (Vorlesung SoSe 06, ) 57

58 Variablen und Ausprägungen Ausprägungen sollten nicht mit ihren Variablen verwechselt werden. So ist männlich keine Variable, sondern eine Ausprägung der Variablen Geschlecht. Ausprägungen beziehen sich immer auf alle möglichen Formen/Ausgestaltungen einer Eigenschaft, Variablen auf die Eigenschaft selbst! Es ist allerdings möglich, aus Ausprägungen einer Variablen eine neue und anderevariable zu konstruieren. So kann aus der Ausprägung mänlich des Geschlechts eine neue Variable Ist männlich mit den Ausprägungen trifft zu und trifft nicht zu generiert werden. Statistik 1 (Vorlesung SoSe 06, ) 58

59 Beobachtete und unbeobachtete Variablen Nicht immer sind alle interessierenden Eigenschaften tatsächlich beobachtet oder auch nur beobachtbar. Beispiele: (a) Bei der Frage nach dem Einkommen wird nicht das tatsächliche Einkommen erfasst, sondern die Antwort auf die Frage danach. Das tatsächliche Einkommen kann höher oder geringer sein als das berichtete Einkommen. Während das berichtete Einkommen eine beobachtete Variable ist, ist das tatsächliche Einkommen eine unbeobachtete Variable. (b)einstellungen sind prinzipiell unbeobachtbare Vorstellungen in den Köpfen von Personen. Beobachtbar sind oft Äußerungen, von denen auf Einstellungen rückgeschlossen wird. Unbeobachtbare oder in einer Untersuchung unbeobachtete Eigenschaften von Merkmalsträgern werden in der Statistik als latente Variablen oder Faktoren bezeichnet; die in einer Untersuchung beobachteten Variablen werden auch als Indikatoren bezeichnet, insbesondere dann, wenn mit ihrer Hilfe auf latente Variablen rückgeschlossen wird. Statistik 1 (Vorlesung SoSe 06, ) 59

60 Variablen und Begriffe/Konstrukte Zwischen Indikatoren und Faktoren besteht eine analoge Beziehungen wie zwischen Begriffen und deren operationalisierten Messungen. Theorie Begriff Faktor latente Ebene Verbindung Operationalisierung Messmodell Empirie Messung Indikator beobachtete Ebene Aber, Analogie bedeutet keine Gleichheit: Die Operationalisierung eines Begriffs kann zu verschiedenen Variablen führen, die beobachtet wie latent sein können. Begriffe können sich auch gleichzeitig auf mehrere und unterschiedliche Einheiten beziehen, Variablen sind immer Ausprägungen eines Merkmalsträgers. Statistik 1 (Vorlesung SoSe 06, ) 60

61 Fälle und Realisationen Fälle oder Untersuchungseinheiten sind die Merkmalsträger, auf die sich die in durch eine Variable bezeichnete Eigenschaft in einer Untersuchung bezieht. Die tatsächlich bei einem Merkmalsträger vorkommende Ausprägung einer Variable wird als Realisierung oder Realisation bezeichnet. Variable (z.b. Geschlecht ) hat Menge möglicher Ausprägungen (z.b.: {männlich, weiblich] bezieht sich auf Konkretisierung Fälle (z.b. Personen) Element aus der Menge aller Fälle Realisation bei einem Fall (z.b. Herr X ist männlich) Wenn alle Merkmalsträger bei einer Variable die gleiche Ausprägung haben, reduziert sich die Variable zu einer Konstanten. Statistik 1 (Vorlesung SoSe 06, ) 61

62 Die Datenmatrix F R A G E A N T W O R T Code 1. Sind Sie mit der Art und Weise, wie die Demokratie in der Bundesrepublik funktioniert, alles in allem gesehen Nun einige Aussagen, über die man verschiedener Ansicht sein kann. Sagen Sie mir bitte jeweils, ob Sie der Aussage eher zustimmen oder eher nicht zustimmen. a) Leute wie ich haben so oder so keinen Einfluss darauf, was die Regierung tut b) Die Parteien wollen nur die Stimmen der Wähler, ihre Ansichten interessieren sie nicht ohne Abfrage eintragen! Das Interview wurde geführt mit sehr zufrieden, eher zufrieden, eher unzufrieden, oder völlig unzufrieden?... weiß nicht 1 keine Angabe stimme stimme weiß keine eher eher nicht nicht Angabe zu zu einem Mann... einer Frau Zum Schluss noch eine Frage zur Geburtsjahr vierstellig eintragen! Statistik. Sagen Sie mir bitte, in 1943 welchem Jahr Sie geboren sind. keine Angabe Kursiver gedruckter Text ist für den Interviewer bestimmt und wird nicht vorgelesen. Statistik 1 (Vorlesung SoSe 06, ) Die Ergebnisse der Beobachtungen bei allen Fällen werden in einer Tabelle, der Datenmatrix zusammengefasst. Neben den gemessenen Variablen enthält eine Datenmatrix in der Regel zusätzliche Variablen. So werden den einzelnen Fällen eindeutige Nummern zugewiesen, die etwa nach der Reihenfolge der Durchführung von Interviews oder des Eingangs der Daten gebildet werden. Diese Nummern heißen Fallnummern (oder Identifikationsnummern). 62

63 Die Datenmatrix Tabelle 2.4: Beispiel einer Datenmatrix Untersuchungseinheiten (Fälle) Merkmale der Untersuchungseinheiten (Variablen) Antwort Frage 1 Antwort Frage 2a Antwort Frage 2b Fallnummer Geschlecht Geburtsjahr ID F1 F2A F2B F3 F In einer Datenmatrix sind die Informationen i.a. so angeordnet, dass jede Zeile die gesamten verfügbaren Informationen (Realisierungen aller Variablen) bei einem Fall enthält, und dass jede Spalte alle Realisierungen einer Variablen über alle Fälle enthält. (nach Kühnel/ Krebs, 2006: S. 37) alle Realisierungen der Variablen F1: Univariate Verteilung von F1 Statistik 1 (Vorlesung SoSe 06, ) Information über den ersten Fall 63

64 Datenmatrix: Kodierkonventionen für ungültige Fälle Bei empirischen Datenanalysen muss für jeden Fall und jede Variable eine Realisierung vorliegen. Wenn z.b. aufgrund von Antwortverweigerungen keine Antworten in einer vorgegebenen Antwortskala vorliegen, werden spezielle Ausprägungen, die sogenannten ungültigen oder fehlende Werte (missing values) verwendet. Dabei haben sich Konventionen eingespielt, die möglichst eingehalten werden sollten: einstellige zweistellige dreistellige Endziffer Variablen Variablen Variablen Verweigerung weiß nicht keine Angabe trifft nicht zu Da die meisten Analysemodelle davon ausgehen, dass es bei den betrachteten Variablen keine fehlenden Werte gibt, werden Fälle mit fehlenden Werten bei den betrachteten Variablen oft aus der Analyse ausgeschlossen (engl: listwise deletion of missing values). Statistik 1 (Vorlesung SoSe 06, ) 64

65 Häufigkeitstabellen Die empirische Verteilung einer Variablen gibt an, wie oft welche Ausprägungen einer Variable in der Datenmatrix (dem Datensatz), d.h. der Menge aller Untersuchungseinheiten, vorkommen. In der Regel handelt es sich bei einem Datensatz um eine Stichprobe, d.h. eine Teilmenge aus einer umfassenderen Population. Bei einer nicht zu hohen Anzahl von realiserten Ausprägungen lässt sich eine Häufigkeitsverteilung ohne Informationsverlust in einer Häufigkeitstabelle darstellen. Anteile kumulierte Ausprägung Code Häufigkeit insgesamt nur gültige Anteile völlig unzufrieden eher unzufrieden eher zufrieden sehr zufrieden weiß nicht keine Angabe Summe (gültige Fälle: 8; fehlende Fälle 2) Statistik 1 (Vorlesung SoSe 06, ) 65

66 Häufigkeitstabellen Anteile kumulierte Ausprägung Code Häufigkeit insgesamt nur gültige Anteile völlig unzufrieden eher unzufrieden eher zufrieden sehr zufrieden weiß nicht keine Angabe Summe (gültige Fälle: 8; fehlende Fälle 2) Die Tabelle enthält die absoluten Häufigkeiten mit der eine Ausprägung im Datensatz vorkommt. Im Beispiel kommt die 1. Ausprägung ( völlig zufrieden, Code 1 ) mit der absoluten Häufigkeit 1vor, die 4. Ausprägung ( völlig zufrieden, Code 4 ) mit der absoluten Häufigkeit 3 und die ungültige Ausprägung ( weiß nicht, Code 8 ) mit der absoluten Häufigkeit 1. Statistik 1 (Vorlesung SoSe 06, ) 66

Statistik I im Sommersemester 2006

Statistik I im Sommersemester 2006 Statistik I im Sommersemester 2006 Themen am 23.4.2007: Univariate Häufigkeitsverteilungen I Darstellung univariater Verteilungen in Häufigkeitstabellen Verteilungsfunktionen und Quantile Grafische Darstellungen

Mehr

Empirie-Vorlesung im Wintersemester 2006/2007 Teil A: Quantitative Methoden Themen am :

Empirie-Vorlesung im Wintersemester 2006/2007 Teil A: Quantitative Methoden Themen am : Empirie-Vorlesung im Wintersemester 2006/2007 Teil A: Quantitative Methoden Themen am 14.11.2006: Operationalisierung Begriffsexplikation Messtheorie, Korrespondenzhypothesen und Korrespondenzregeln Beobachten

Mehr

Alle weiteren Messoperationen schließen die Klassifikation als Minimaloperation ein.

Alle weiteren Messoperationen schließen die Klassifikation als Minimaloperation ein. 1 unterschiedliche Skalenniveaus Wir haben zuvor schon kurz von unterschiedlichen Skalenniveaus gehört, nämlich dem: - Nominalskalenniveau - Ordinalskalenniveau - Intervallskalenniveau - Ratioskalenniveau

Mehr

Forschungsmethoden in der Sozialen Arbeit

Forschungsmethoden in der Sozialen Arbeit Forschungsmethoden in der Sozialen Arbeit Fachhochschule für Sozialarbeit und Sozialpädagogik Alice- Salomon Hochschule für Soziale arbeit, Gesundheit, Erziehung und Bildung University of Applied Sciences

Mehr

Univariate Häufigkeitsverteilungen Kühnel, Krebs 2001: Statistik für die Sozialwissenschaften, S.41-66

Univariate Häufigkeitsverteilungen Kühnel, Krebs 2001: Statistik für die Sozialwissenschaften, S.41-66 Univariate Häufigkeitsverteilungen Kühnel, Krebs 2001: Statistik für die Sozialwissenschaften, S.41-66 Gabriele Doblhammer: Empirische Sozialforschung Teil II, SS 2004 1/19 Skalenniveaus Skalenniveau Relation

Mehr

Variablen und Skalenniveaus

Variablen und Skalenniveaus Analytics Grundlagen Variablen und Skalenniveaus : Photo Credit: Unsplash, Roman Mager Statistik Was ist eigentlich eine Variable? Variable In der Datenanalyse wird häufig die Bezeichnung Variable verwendet.

Mehr

Wiederholung Statistik I. Statistik für SozialwissenschaftlerInnen II p.8

Wiederholung Statistik I. Statistik für SozialwissenschaftlerInnen II p.8 Wiederholung Statistik I Statistik für SozialwissenschaftlerInnen II p.8 Konstanten und Variablen Konstante: Merkmal hat nur eine Ausprägung Variable: Merkmal kann mehrere Ausprägungen annehmen Statistik

Mehr

Daten, Datentypen, Skalen

Daten, Datentypen, Skalen Bildung kommt von Bildschirm und nicht von Buch, sonst hieße es ja Buchung. Daten, Datentypen, Skalen [main types of data; levels of measurement] Die Umsetzung sozialwissenschaftlicher Forschungsvorhaben

Mehr

htw saar 1 EINFÜHRUNG IN DIE STATISTIK: BESCHREIBENDE STATISTIK

htw saar 1 EINFÜHRUNG IN DIE STATISTIK: BESCHREIBENDE STATISTIK htw saar 1 EINFÜHRUNG IN DIE STATISTIK: BESCHREIBENDE STATISTIK htw saar 2 Grundbegriffe htw saar 3 Grundgesamtheit und Stichprobe Ziel: Über eine Grundgesamtheit (Population) soll eine Aussage über ein

Mehr

Standardisierte Vorgehensweisen und Regeln zur Gewährleistung von: Eindeutigkeit Schlussfolgerungen aus empirischen Befunden sind nur dann zwingend

Standardisierte Vorgehensweisen und Regeln zur Gewährleistung von: Eindeutigkeit Schlussfolgerungen aus empirischen Befunden sind nur dann zwingend Standardisierte Vorgehensweisen und Regeln zur Gewährleistung von: Eindeutigkeit Schlussfolgerungen aus empirischen Befunden sind nur dann zwingend oder eindeutig, wenn keine alternativen Interpretationsmöglichkeiten

Mehr

Was heißt messen? Konzeptspezifikation Operationalisierung Qualität der Messung

Was heißt messen? Konzeptspezifikation Operationalisierung Qualität der Messung Was heißt messen? Ganz allgemein: Eine Eigenschaft eines Objektes wird ermittelt, z.b. die Wahlabsicht eines Bürgers, das Bruttosozialprodukt eines Landes, die Häufigkeit von Konflikten im internationalen

Mehr

Statistische Grundlagen I

Statistische Grundlagen I Statistische Grundlagen I Arten der Statistik Zusammenfassung und Darstellung von Daten Beschäftigt sich mit der Untersuchung u. Beschreibung von Gesamtheiten oder Teilmengen von Gesamtheiten durch z.b.

Mehr

STATISTIK FÜR DIE SOZIALWISSENSCHAFTEN

STATISTIK FÜR DIE SOZIALWISSENSCHAFTEN Steffen-M. Kühnel Dagmar Krebs 2008 AGI-Information Management Consultants May be used for personal purporses only or by libraries associated to dandelon.com network. STATISTIK FÜR DIE SOZIALWISSENSCHAFTEN

Mehr

TEIL 7: EINFÜHRUNG UNIVARIATE ANALYSE TABELLARISCHE DARSTELLUNG / AUSWERTUNG

TEIL 7: EINFÜHRUNG UNIVARIATE ANALYSE TABELLARISCHE DARSTELLUNG / AUSWERTUNG TEIL 7: EINFÜHRUNG UNIVARIATE ANALYSE TABELLARISCHE DARSTELLUNG / AUSWERTUNG GLIEDERUNG Statistik eine Umschreibung Gliederung der Statistik in zwei zentrale Teilbereiche Deskriptive Statistik Inferenzstatistik

Mehr

Quantitative Methoden der Agrarmarktanalyse und des Agribusiness

Quantitative Methoden der Agrarmarktanalyse und des Agribusiness Quantitative Methoden der Agrarmarktanalyse und des Agribusiness Teil Quantitative Methoden der Agrarmarktanalyse Vorlesung: Montag und Mittwoch 8:30-10:00 Dr. Bernhard Brümmer Tel.: 0431-880-4449, Fax:

Mehr

Inhaltsverzeichnis. 1 Über dieses Buch Zum Inhalt dieses Buches Danksagung Zur Relevanz der Statistik...

Inhaltsverzeichnis. 1 Über dieses Buch Zum Inhalt dieses Buches Danksagung Zur Relevanz der Statistik... Inhaltsverzeichnis 1 Über dieses Buch... 11 1.1 Zum Inhalt dieses Buches... 13 1.2 Danksagung... 15 2 Zur Relevanz der Statistik... 17 2.1 Beispiel 1: Die Wahrscheinlichkeit, krank zu sein, bei einer positiven

Mehr

Forschungsstatistik I

Forschungsstatistik I Prof. Dr. G. Meinhardt 6. Stock, Taubertsberg 2 R. 06-206 (Persike) R. 06-214 (Meinhardt) Sprechstunde jederzeit nach Vereinbarung Forschungsstatistik I Dr. Malte Persike persike@uni-mainz.de http://psymet03.sowi.uni-mainz.de/

Mehr

Frank Lammers. Statistik I: deskriptive und explorative Statistik. Lehr- und Übungsbuch

Frank Lammers. Statistik I: deskriptive und explorative Statistik. Lehr- und Übungsbuch Frank Lammers Statistik I: deskriptive und explorative Statistik Lehr- und Übungsbuch 2004 Verlag der Gesellschaft für Unternehmensrechnung und Controlling m.b.h. Vorwort I Vorwort zur zweiten Auflage

Mehr

Einführung in die Statistik

Einführung in die Statistik Elmar Klemm Einführung in die Statistik Für die Sozialwissenschaften Westdeutscher Verlag INHALTSVERZEICHNIS 1. Einleitung und Begrifflichkeiten 11 1.1 Grundgesamtheit, Stichprobe 12 1.2 Untersuchungseinheit,

Mehr

Schließende Statistik

Schließende Statistik Schließende Statistik [statistical inference] Sollen auf der Basis von empirischen Untersuchungen (Daten) Erkenntnisse gewonnen und Entscheidungen gefällt werden, sind die Methoden der Statistik einzusetzen.

Mehr

Statistik II: Grundlagen und Definitionen der Statistik

Statistik II: Grundlagen und Definitionen der Statistik Medien Institut : Grundlagen und Definitionen der Statistik Dr. Andreas Vlašić Medien Institut (0621) 52 67 44 vlasic@medien-institut.de Gliederung 1. Hintergrund: Entstehung der Statistik 2. Grundlagen

Mehr

Deskription, Statistische Testverfahren und Regression. Seminar: Planung und Auswertung klinischer und experimenteller Studien

Deskription, Statistische Testverfahren und Regression. Seminar: Planung und Auswertung klinischer und experimenteller Studien Deskription, Statistische Testverfahren und Regression Seminar: Planung und Auswertung klinischer und experimenteller Studien Deskriptive Statistik Deskriptive Statistik: beschreibende Statistik, empirische

Mehr

Bitte am PC mit Windows anmelden!

Bitte am PC mit Windows anmelden! Einführung in SPSS Plan für heute: Grundlagen/ Vorwissen für SPSS Vergleich der Übungsaufgaben Einführung in SPSS http://weknowmemes.com/generator/uploads/generated/g1374774654830726655.jpg Standardnormalverteilung

Mehr

3. Lektion: Deskriptive Statistik

3. Lektion: Deskriptive Statistik Seite 1 von 5 3. Lektion: Deskriptive Statistik Ziel dieser Lektion: Du kennst die verschiedenen Methoden der deskriptiven Statistik und weißt, welche davon für Deine Daten passen. Inhalt: 3.1 Deskriptive

Mehr

Deskriptivstatistik a) Univariate Statistik Weiters zum Thema der statistischen Informationsverdichtung

Deskriptivstatistik a) Univariate Statistik Weiters zum Thema der statistischen Informationsverdichtung 20 Weiters zum Thema der statistischen Informationsverdichtung M a ß z a h l e n Statistiken bei Stichproben Parameter bei Grundgesamtheiten Maßzahlen zur Beschreibung univariater Verteilungen Maßzahlen

Mehr

Teil / Ein paar statistische Grundlagen 25. Kapitel 1 Was Statistik ist und Warum sie benötigt Wird 2 7

Teil / Ein paar statistische Grundlagen 25. Kapitel 1 Was Statistik ist und Warum sie benötigt Wird 2 7 Inhaltsverzeichnis Einführung 21 Über dieses Buch 21 Törichte Annahmen über den Leser 22 Wie dieses Buch aufgebaut ist 23 Teil I: Ein paar statistische Grundlagen 23 Teil II: Die beschreibende Statistik

Mehr

Einführung in Quantitative Methoden

Einführung in Quantitative Methoden Einführung in Quantitative Methoden Mag. Dipl.Ing. Dr. Pantelis Christodoulides & Mag. Dr. Karin Waldherr SS 2014 Christodoulides / Waldherr Einführung in Quantitative Methoden- 2.VO 1/57 Die Deskriptivstatistik

Mehr

Grundlagen der empirischen Sozialforschung

Grundlagen der empirischen Sozialforschung Grundlagen der empirischen Sozialforschung Sitzung 11 - Datenanalyseverfahren Jan Finsel Lehrstuhl für empirische Sozialforschung Prof. Dr. Petra Stein 5. Januar 2009 1 / 22 Online-Materialien Die Materialien

Mehr

Population und Stichprobe Wahrscheinlichkeitstheorie II

Population und Stichprobe Wahrscheinlichkeitstheorie II Population und Stichprobe Wahrscheinlichkeitstheorie II 5. Sitzung 1 S. Peter Schmidt 2003 1 Stichprobenziehung als Zufallsexperiment Definition Stichprobe: Teilmenge der Elemente der Grundgesamtheit bzw.

Mehr

Statistik mit und ohne Zufall

Statistik mit und ohne Zufall Christoph Weigand Statistik mit und ohne Zufall Eine anwendungsorientierte Einführung Mit 118 Abbildungen und 10 Tabellen Physica-Verlag Ein Unternehmen von Springer Inhaltsverzeichnis Teil I Deskriptive

Mehr

Bivariater Zusammenhang in der Vierfeldertafel PEΣO

Bivariater Zusammenhang in der Vierfeldertafel PEΣO Bivariater Zusammenhang in der Vierfeldertafel PEΣO 12. Oktober 2001 Zusammenhang zweier Variablen und bivariate Häufigkeitsverteilung Die Bivariate Häufigkeitsverteilung gibt Auskunft darüber, wie zwei

Mehr

Wahrscheinlichkeitsrechnung und Statistik

Wahrscheinlichkeitsrechnung und Statistik 9. Vorlesung - 2017 Monte Carlo Methode für numerische Integration Sei g : [0, 1] R stetige Funktion; man möchte 1 0 g(t)dt numerisch approximieren mit Hilfe von Zufallszahlen: Sei (U n ) n eine Folge

Mehr

1 x 1 y 1 2 x 2 y 2 3 x 3 y 3... n x n y n

1 x 1 y 1 2 x 2 y 2 3 x 3 y 3... n x n y n 3.2. Bivariate Verteilungen zwei Variablen X, Y werden gemeinsam betrachtet (an jedem Objekt werden gleichzeitig zwei Merkmale beobachtet) Beobachtungswerte sind Paare von Merkmalsausprägungen (x, y) Beispiele:

Mehr

3. Merkmale und Daten

3. Merkmale und Daten 3. Merkmale und Daten Ziel dieses Kapitels: Vermittlung des statistischen Grundvokabulars Zu klärende Begriffe: Grundgesamtheit Merkmale (Skalenniveau etc.) Stichprobe 46 3.1 Grundgesamtheiten Definition

Mehr

Wo stehen wir? empir. Sachverhalt ( Phänomen der Realität) semantische Analyse( ) Definition ( ).

Wo stehen wir? empir. Sachverhalt ( Phänomen der Realität) semantische Analyse( ) Definition ( ). Wo stehen wir? empir. Sachverhalt ( Phänomen der Realität) Operationalisierung (incl. Messvorschriften) dimensionale Analyse Zeichen Bedeutung semantische Analyse( ) Definition ( ). WS 2002/03 - Empirische

Mehr

5 Assoziationsmessung in Kontingenztafeln

5 Assoziationsmessung in Kontingenztafeln 5 Assoziationsmessung in Kontingenztafeln 51 Multivariate Merkmale 51 Multivariate Merkmale Gerade in der Soziologie ist die Analyse eindimensionaler Merkmale nur der allererste Schritt zur Beschreibung

Mehr

fh management, communication & it Constantin von Craushaar fh-management, communication & it Statistik Angewandte Statistik

fh management, communication & it Constantin von Craushaar fh-management, communication & it Statistik Angewandte Statistik fh management, communication & it Folie 1 Überblick Grundlagen (Testvoraussetzungen) Mittelwertvergleiche (t-test,..) Nichtparametrische Tests Korrelationen Regressionsanalyse... Folie 2 Überblick... Varianzanalyse

Mehr

Einführung in die Statistik

Einführung in die Statistik Einführung in die Statistik 1. Deskriptive Statistik 2. Induktive Statistik 1. Deskriptive Statistik 1.0 Grundbegriffe 1.1 Skalenniveaus 1.2 Empirische Verteilungen 1.3 Mittelwerte 1.4 Streuungsmaße 1.0

Mehr

Philipp Sibbertsen Hartmut Lehne. Statistik. Einführung für Wirtschafts- und. Sozialwissenschaftler. 2., überarbeitete Auflage. 4^ Springer Gabler

Philipp Sibbertsen Hartmut Lehne. Statistik. Einführung für Wirtschafts- und. Sozialwissenschaftler. 2., überarbeitete Auflage. 4^ Springer Gabler Philipp Sibbertsen Hartmut Lehne Statistik Einführung für Wirtschafts- und Sozialwissenschaftler 2., überarbeitete Auflage 4^ Springer Gabler Inhaltsverzeichnis Teil I Deskriptive Statistik 1 Einführung

Mehr

Einführung in Quantitative Methoden

Einführung in Quantitative Methoden Einführung in Quantitative Methoden Mag. Dipl.Ing. Dr. Pantelis Christodoulides & Mag. Dr. Karin Waldherr SS 2011 Christodoulides / Waldherr Einführung in Quantitative Methoden- 2.VO 1/62 Summenzeichen

Mehr

Mathematische und statistische Methoden II

Mathematische und statistische Methoden II Methodenlehre e e Prof. Dr. G. Meinhardt 6. Stock, Wallstr. 3 (Raum 06-206) Sprechstunde jederzeit nach Vereinbarung und nach der Vorlesung. Mathematische und statistische Methoden II Dr. Malte Persike

Mehr

DATENERHEBUNG: MESSEN-OPERATIONALISIEREN - SKALENARTEN

DATENERHEBUNG: MESSEN-OPERATIONALISIEREN - SKALENARTEN DATENERHEBUNG: MESSEN-OPERATIONALISIEREN - SKALENARTEN Was ist Messen? Messen - im weitesten Sinne - ist die Zuordnung von Zahlen zu Objekten und Ereignissen entsprechend einer Regel (Def. nach Stevensen

Mehr

Einführung in die Statistik für Politikwissenschaftler Sommersemester 2011

Einführung in die Statistik für Politikwissenschaftler Sommersemester 2011 Einführung in die Statistik für Politikwissenschaftler Sommersemester 2011 Es können von den Antworten alle, mehrere oder keine Antwort(en) richtig sein. Nur bei einer korrekten Antwort (ohne Auslassungen

Mehr

Einführendes zur Deskriptivstatistik

Einführendes zur Deskriptivstatistik Motto (amerikanischer) Sozialforschung, in Stein gemeisselt über dem Bogenfenster des sozialwissenschaftlichen Fakultätsgebäudes der Universität von Chicago: If you cannot measure, your knowledge is meagre

Mehr

Empirische Sozialforschung

Empirische Sozialforschung Helmut Kromrey Empirische Sozialforschung Modelle und Methoden der standardisierten Datenerhebung und Datenauswertung 11., überarbeitete Auflage Lucius & Lucius Stuttgart Inhalt Vorbemerkung: Wozu Methoden

Mehr

Parametrische vs. Non-Parametrische Testverfahren

Parametrische vs. Non-Parametrische Testverfahren Parametrische vs. Non-Parametrische Testverfahren Parametrische Verfahren haben die Besonderheit, dass sie auf Annahmen zur Verteilung der Messwerte in der Population beruhen: die Messwerte sollten einer

Mehr

Sozialwissenschaftliche Fakultät der Universität Göttingen. Sommersemester Statistik mit SPSS

Sozialwissenschaftliche Fakultät der Universität Göttingen. Sommersemester Statistik mit SPSS Sommersemester 2009 Statistik mit SPSS 09. Mai 2009 09. Mai 2009 Statistik Dozentin: mit Esther SPSSOchoa Fernández 1 Arbeitsschritte bei der Datenanalyse Datenmanagement (Einlesen von Daten, Teilen von

Mehr

Statistik. Herzlich willkommen zur Vorlesung. Grundlagen Häufigkeiten Lagemaße Streuung Inferenzstatistik Kreuztabellen Gruppenunterschiede

Statistik. Herzlich willkommen zur Vorlesung. Grundlagen Häufigkeiten Lagemaße Streuung Inferenzstatistik Kreuztabellen Gruppenunterschiede FB 1 W. Ludwig-Mayerhofer Statistik 1 Herzlich willkommen zur Vorlesung Statistik FB 1 W. Ludwig-Mayerhofer Statistik 2 Vorlesung Statistik für wen? BA Social Science/BA Sozialwissenschaften (Pflicht)

Mehr

Phasen des Forschungsprozesses (hypothesenprüfende Studie)

Phasen des Forschungsprozesses (hypothesenprüfende Studie) Phasen des Forschungsprozesses (hypothesenprüfende Studie) Konzeptspezifikation/ Operationalisierung/Messung rot: Planungsphase Auswahl des Forschungsproblems Theoriebildung Auswahl der Untersuchungseinheiten

Mehr

So berechnen Sie einen Schätzer für einen Punkt

So berechnen Sie einen Schätzer für einen Punkt htw saar 1 EINFÜHRUNG IN DIE STATISTIK: SCHÄTZEN UND TESTEN htw saar 2 Schätzen: Einführung Ziel der Statistik ist es, aus den Beobachtungen eines Merkmales in einer Stichprobe Rückschlüsse über die Verteilung

Mehr

Inhaltsverzeichnis. Inhalt Teil I: Beschreibende (Deskriptive) Statistik Seite. 1.0 Erste Begriffsbildungen Merkmale und Skalen 5

Inhaltsverzeichnis. Inhalt Teil I: Beschreibende (Deskriptive) Statistik Seite. 1.0 Erste Begriffsbildungen Merkmale und Skalen 5 Inhaltsverzeichnis Inhalt Teil I: Beschreibende (Deskriptive) Statistik Seite 1.0 Erste Begriffsbildungen 1 1.1 Merkmale und Skalen 5 1.2 Von der Urliste zu Häufigkeitsverteilungen 9 1.2.0 Erste Ordnung

Mehr

Angewandte Statistik 3. Semester

Angewandte Statistik 3. Semester Angewandte Statistik 3. Semester Übung 5 Grundlagen der Statistik Übersicht Semester 1 Einführung ins SPSS Auswertung im SPSS anhand eines Beispieles Häufigkeitsauswertungen Grafiken Statistische Grundlagen

Mehr

I Beschreibende Statistik 1

I Beschreibende Statistik 1 Inhaltsverzeichnis Vorwort ix I Beschreibende Statistik 1 Lernziele zu Teil I 2 1 Statistik, Daten und statistische Methoden 3 1.1 Statistik im Alltag, in Politik und Gesellschaft...... 3 1.2 Aufgaben

Mehr

Anteile Häufigkeiten Verteilungen Lagemaße Streuungsmaße Merkmale von Verteilungen. Anteile Häufigkeiten Verteilungen

Anteile Häufigkeiten Verteilungen Lagemaße Streuungsmaße Merkmale von Verteilungen. Anteile Häufigkeiten Verteilungen DAS THEMA: VERTEILUNGEN LAGEMAßE - STREUUUNGSMAßE Anteile Häufigkeiten Verteilungen Lagemaße Streuungsmaße Merkmale von Verteilungen Anteile Häufigkeiten Verteilungen Anteile und Häufigkeiten Darstellung

Mehr

Einführung in die Statistik

Einführung in die Statistik Einführung in die Statistik Analyse und Modellierung von Daten von Prof. Dr. Rainer Schlittgen Universität Hamburg 12., korrigierte Auflage Oldenbourg Verlag München Inhaltsverzeichnis 1 Statistische Daten

Mehr

Klausurvorbereitung - Statistik

Klausurvorbereitung - Statistik Aufgabe 1 Klausurvorbereitung - Statistik Studenten der Politikwissenschaft der Johannes Gutenberg-Universität wurden befragt, seit wie vielen Semestern sie eingeschrieben sind. Berechnen Sie für die folgenden

Mehr

Statistik Testverfahren. Heinz Holling Günther Gediga. Bachelorstudium Psychologie. hogrefe.de

Statistik Testverfahren. Heinz Holling Günther Gediga. Bachelorstudium Psychologie. hogrefe.de rbu leh ch s plu psych Heinz Holling Günther Gediga hogrefe.de Bachelorstudium Psychologie Statistik Testverfahren 18 Kapitel 2 i.i.d.-annahme dem unabhängig. Es gilt also die i.i.d.-annahme (i.i.d = independent

Mehr

Einführung in SPSS. Sitzung 4: Bivariate Zusammenhänge. Knut Wenzig. 27. Januar 2005

Einführung in SPSS. Sitzung 4: Bivariate Zusammenhänge. Knut Wenzig. 27. Januar 2005 Sitzung 4: Bivariate Zusammenhänge 27. Januar 2005 Inhalt der letzten Sitzung Übung: ein Index Umgang mit missing values Berechnung eines Indexes Inhalt der letzten Sitzung Übung: ein Index Umgang mit

Mehr

Operationalisierung (1)

Operationalisierung (1) Operationalisierung (1) Im Unterschied zur operationalen Definition handelt es sich bei der Operationalisierung nicht um eine Bedeutungszuweisung zu sprachlichen Zeichen, sondern um eine Handlungsanweisung

Mehr

Einführung in die computergestützte Datenanalyse

Einführung in die computergestützte Datenanalyse Karlheinz Zwerenz Statistik Einführung in die computergestützte Datenanalyse 6., überarbeitete Auflage DE GRUYTER OLDENBOURG Vorwort Hinweise zu EXCEL und SPSS Hinweise zum Master-Projekt XI XII XII TEIL

Mehr

Ermitteln Sie auf 2 Dezimalstellen genau die folgenden Kenngrößen der bivariaten Verteilung der Merkmale Weite und Zeit:

Ermitteln Sie auf 2 Dezimalstellen genau die folgenden Kenngrößen der bivariaten Verteilung der Merkmale Weite und Zeit: 1. Welche der folgenden Kenngrößen, Statistiken bzw. Grafiken sind zur Beschreibung der Werteverteilung des Merkmals Konfessionszugehörigkeit sinnvoll einsetzbar? A. Der Modalwert. B. Der Median. C. Das

Mehr

Es können keine oder mehrere Antworten richtig sein. Eine Frage ist NUR dann richtig beantwortet, wenn ALLE richtigen Antworten angekreuzt wurden.

Es können keine oder mehrere Antworten richtig sein. Eine Frage ist NUR dann richtig beantwortet, wenn ALLE richtigen Antworten angekreuzt wurden. Teil III: Statistik Alle Fragen sind zu beantworten. Es können keine oder mehrere Antworten richtig sein. Eine Frage ist NUR dann richtig beantwortet, wenn ALLE richtigen Antworten angekreuzt wurden. Wird

Mehr

Inhalt. 1 Ziel und Forschungsprozess Grundlage von Wissenschaft Wissenschaftstheoretische Grundbegriffe 27

Inhalt. 1 Ziel und Forschungsprozess Grundlage von Wissenschaft Wissenschaftstheoretische Grundbegriffe 27 Inhalt Vorwort 11 1 Ziel und Forschungsprozess 13 1.1 Ziel empirischer Sozialforschung 13 1.1.1 Exploration 13 1.1.2 Beschreibung sozialer Sachverhalte 13 1.1.3 Erklärung sozialer Sachverhalte 14 1.1.4

Mehr

Quantitative Analyseverfahren

Quantitative Analyseverfahren Markus Tausendpfund et al. Quantitative Analyseverfahren Eine Einführung Fakultät für Kultur- und Sozialwissenschaften Das Werk ist urheberrechtlich geschützt. Die dadurch begründeten Rechte, insbesondere

Mehr

Statistik. Datenanalyse mit EXCEL und SPSS. R.01denbourg Verlag München Wien. Von Prof. Dr. Karlheinz Zwerenz. 3., überarbeitete Auflage

Statistik. Datenanalyse mit EXCEL und SPSS. R.01denbourg Verlag München Wien. Von Prof. Dr. Karlheinz Zwerenz. 3., überarbeitete Auflage Statistik Datenanalyse mit EXCEL und SPSS Von Prof. Dr. Karlheinz Zwerenz 3., überarbeitete Auflage R.01denbourg Verlag München Wien Inhalt Vorwort Hinweise zu EXCEL und SPSS Hinweise zum Master-Projekt

Mehr

Bis heute: Überblick Einheit Literatur lesen. 2. Introspektion. 3. Thema definieren und eingrenzen. Untersuchungsproblem.

Bis heute: Überblick Einheit Literatur lesen. 2. Introspektion. 3. Thema definieren und eingrenzen. Untersuchungsproblem. Bis heute: 1. Literatur lesen 2. Introspektion 3. Thema definieren und eingrenzen 1 Seite (pro Gruppe) zusammenfassen und abgeben Folie 1 Überblick Einheit 2 Untersuchungsproblem Problemstellung Fragestellungen

Mehr

Inhalt. I Einführung. Kapitel 1 Konzept des Buches Kapitel 2 Messen in der Psychologie... 27

Inhalt. I Einführung. Kapitel 1 Konzept des Buches Kapitel 2 Messen in der Psychologie... 27 Inhalt I Einführung Kapitel 1 Konzept des Buches........................................ 15 Kapitel 2 Messen in der Psychologie.................................. 27 2.1 Arten von psychologischen Messungen....................

Mehr

Was sind Zusammenhangsmaße?

Was sind Zusammenhangsmaße? Was sind Zusammenhangsmaße? Zusammenhangsmaße beschreiben einen Zusammenhang zwischen zwei Variablen Beispiele für Zusammenhänge: Arbeiter wählen häufiger die SPD als andere Gruppen Hochgebildete vertreten

Mehr

Inhaltsverzeichnis. Teil I Einführung

Inhaltsverzeichnis. Teil I Einführung Teil I Einführung 1 Was ist Statistik?... 3 1.1 Der Begriff Statistik..................................... 3 1.2 Wozu Statistik?......................................... 4 1.3 Grundbegriffe...........................................

Mehr

Statistik K urs SS 2004

Statistik K urs SS 2004 Statistik K urs SS 2004 3.Tag Grundlegende statistische Maße Mittelwert (mean) Durchschnitt aller Werte Varianz (variance) s 2 Durchschnittliche quadrierte Abweichung aller Werte vom Mittelwert >> Die

Mehr

Empirische Sozialforschung

Empirische Sozialforschung Helmut Kromrey Empirische Sozialforschung Modelle und Methoden der standardisierten Datenerhebung und Datenauswertung mit ausführlichen Annotationen aus der Perspektive qualitativ-interpretativer Methoden

Mehr

Voraussetzung für statistische Auswertung: jeder Fall besitzt in bezug auf jedes Merkmal genau eine Ausprägung

Voraussetzung für statistische Auswertung: jeder Fall besitzt in bezug auf jedes Merkmal genau eine Ausprägung Rohdaten Urliste oder Rohdaten sind die auszuwertenden Daten in der Form, wie sie nach der Datenerhebung vorliegen. Dimensionen der Urliste sind die Fälle, Merkmale und ihre Ausprägungen. Voraussetzung

Mehr

Grundlagen der empirischen Sozialforschung

Grundlagen der empirischen Sozialforschung Grundlagen der empirischen Sozialforschung Sitzung 10 - Datenanalyseverfahren Jan Finsel Lehrstuhl für empirische Sozialforschung Prof. Dr. Petra Stein 22. Dezember 2008 1 / 21 Online-Materialien Die Materialien

Mehr

Einige Grundbegriffe der Statistik

Einige Grundbegriffe der Statistik Einige Grundbegriffe der Statistik 1 Überblick Das Gesamtbild (Ineichen & Stocker, 1996) 1. Ziehen einer Stichprobe Grundgesamtheit 2. Aufbereiten der Stichprobe (deskriptive Statistik) 3. Rückschluss

Mehr

Einführung in die Statistik Einführung

Einführung in die Statistik Einführung Professur E-Learning und Neue Medien Institut für Medienforschung Philosophische Fakultät Einführung in die Statistik Einführung Professur E-Learning und Neue Medien www.tu-chemnitz.de/phil/imf/elearning

Mehr

Statistik. Einführung in die com putergestützte Daten an alyse. Oldenbourg Verlag München B , überarbeitete Auflage

Statistik. Einführung in die com putergestützte Daten an alyse. Oldenbourg Verlag München B , überarbeitete Auflage Statistik Einführung in die com putergestützte Daten an alyse von Prof. Dr. Karlheinz Zwerenz 4., überarbeitete Auflage B 366740 Oldenbourg Verlag München Inhalt Vorwort XI Hinweise zu EXCEL und SPSS XII

Mehr

Uwe Hassler. Statistik im. Bachelor-Studium. Eine Einführung. für Wirtschaftswissenschaftler. ^ Springer Gabler

Uwe Hassler. Statistik im. Bachelor-Studium. Eine Einführung. für Wirtschaftswissenschaftler. ^ Springer Gabler Uwe Hassler Statistik im Bachelor-Studium Eine Einführung für Wirtschaftswissenschaftler ^ Springer Gabler 1 Einführung 1 2 Beschreibende Methoden univariater Datenanalyse 5 2.1 Grundbegriffe 5 2.2 Häufigkeitsverteilungen

Mehr

Empirische Sozialforschung

Empirische Sozialforschung Helmut Kromrey Empirische Sozialforschung Modelle und Methoden der Datenerhebung und Datenauswertung 8., durchgreifend überarbeitete und erweiterte Auflage Leske + Budrich, Opladen Inhalt Vorbemerkung:

Mehr

Statistisches Testen

Statistisches Testen Statistisches Testen Grundlegendes Prinzip Erwartungswert Bekannte Varianz Unbekannte Varianz Differenzen Anteilswert Chi-Quadrat Tests Gleichheit von Varianzen Prinzip des Statistischen Tests Konfidenzintervall

Mehr

Statistik I im Sommersemester 2007

Statistik I im Sommersemester 2007 Themen am 18.6.2007: Statistik I im Sommersemester 2007 Zusammenhangsanalyse in der Vierfeldertabelle Von der Anteilsdifferenz zur Vierfeldertabelle Probeklausur 2 Lernziele: 1. Aufbau einer Kreuztabelle:

Mehr

Einführung in die quantitative und qualitative Sozialforschung

Einführung in die quantitative und qualitative Sozialforschung Einführung in die quantitative und qualitative Sozialforschung Überblick Konzeption der Empirie Veranstaltungsplan quantitativ Scheinanforderungen Online-Informationen Anmeldung Wozu empirische Sozialforschung?

Mehr

Bivariate Kreuztabellen

Bivariate Kreuztabellen Bivariate Kreuztabellen Kühnel, Krebs 2001 S. 307-342 Gabriele Doblhammer: Empirische Sozialforschung Teil II, SS 2004 1/33 Häufigkeit in Zelle y 1 x 1 Kreuztabellen Randverteilung x 1... x j... x J Σ

Mehr

Wiederholung. Statistik I. Sommersemester 2009

Wiederholung. Statistik I. Sommersemester 2009 Statistik I Sommersemester 2009 Statistik I (1/21) Daten/graphische Darstellungen Lage- und Streuungsmaße Zusammenhangsmaße Lineare Regression Wahrscheinlichkeitsrechnung Zentraler Grenzwertsatz Konfidenzintervalle

Mehr

Statistik. Datenanalyse mit EXCEL und SPSS. Prof. Dr. Karlheinz Zwerenz. R.Oldenbourg Verlag München Wien. Von

Statistik. Datenanalyse mit EXCEL und SPSS. Prof. Dr. Karlheinz Zwerenz. R.Oldenbourg Verlag München Wien. Von Statistik Datenanalyse mit EXCEL und SPSS Von Prof. Dr. Karlheinz Zwerenz R.Oldenbourg Verlag München Wien Inhalt Vorwort Hinweise zu EXCEL und SPSS Hinweise zum Master-Projekt XI XII XII TEIL I GRUNDLAGEN

Mehr

Forschungsmethoden VORLESUNG WS 2017/2018

Forschungsmethoden VORLESUNG WS 2017/2018 Forschungsmethoden VORLESUNG WS 2017/2018 SOPHIE LUKES Übersicht Letzte Sitzung: Psychologie als empirische Wissenschaft Heute: Messen Rückblick: Qualitativer vs. quantitativer Ansatz Qualitativ Quantitativ

Mehr

1. Einführung in die induktive Statistik

1. Einführung in die induktive Statistik Wichtige Begriffe 1. Einführung in die induktive Statistik Grundgesamtheit: Statistische Masse, die zu untersuchen ist, bzw. über die Aussagen getroffen werden soll Stichprobe: Teil einer statistischen

Mehr

1 Wahrscheinlichkeitsrechnung. 2 Zufallsvariablen und ihre Verteilung. 3 Statistische Inferenz. 4 Hypothesentests. 5 Regression

1 Wahrscheinlichkeitsrechnung. 2 Zufallsvariablen und ihre Verteilung. 3 Statistische Inferenz. 4 Hypothesentests. 5 Regression 0 Einführung 1 Wahrscheinlichkeitsrechnung 2 Zufallsvariablen und ihre Verteilung 3 Statistische Inferenz 4 Hypothesentests 5 Regression Zufallsgrößen Ergebnisse von Zufallsexperimenten werden als Zahlen

Mehr

Einführung in die sozialwissenschaftliche Statistik

Einführung in die sozialwissenschaftliche Statistik Einführung in die sozialwissenschaftliche Statistik Sitzung 4 Bivariate Deskription Heinz Leitgöb in Vertretung von Katrin Auspurg Sommersemester 2015 04.05.2015 Überblick 1. Kontingenztabellen 2. Assoziationsmaße

Mehr

Inhaltsverzeichnis. Robert Galata, Sandro Scheid. Deskriptive und Induktive Statistik für Studierende der BWL. Methoden - Beispiele - Anwendungen

Inhaltsverzeichnis. Robert Galata, Sandro Scheid. Deskriptive und Induktive Statistik für Studierende der BWL. Methoden - Beispiele - Anwendungen Inhaltsverzeichnis Robert Galata, Sandro Scheid Deskriptive und Induktive Statistik für Studierende der BWL Methoden - Beispiele - Anwendungen Herausgegeben von Robert Galata, Markus Wessler ISBN (Buch):

Mehr

I. Deskriptive Statistik 1

I. Deskriptive Statistik 1 I. Deskriptive Statistik 1 1. Einführung 3 1.1. Grundgesamtheit und Stichprobe.................. 5 1.2. Merkmale und Verteilungen..................... 6 1.3. Tabellen und Grafiken........................

Mehr

Institut für Biometrie und klinische Forschung. WiSe 2012/2013

Institut für Biometrie und klinische Forschung. WiSe 2012/2013 Klinische Forschung WWU Münster Pflichtvorlesung zum Querschnittsfach Epidemiologie, Biometrie und Med. Informatik Praktikum der Medizinischen Biometrie (3) Überblick. Deskriptive Statistik I 2. Deskriptive

Mehr

Empirische Forschung. Übung zur Vorlesung Kognitive Modellierung. Kognitive Modellierung Dorothea Knopp Angewandte Informatik/ Kognitve Systeme

Empirische Forschung. Übung zur Vorlesung Kognitive Modellierung. Kognitive Modellierung Dorothea Knopp Angewandte Informatik/ Kognitve Systeme Empirische Forschung Übung zur Vorlesung Kognitive Modellierung S. 1 Gliederung 1. Was ist empirische Forschung? 2. Empirie Theorie 3. Gütekriterien empirischer Forschung 4. Sammlung von Daten 5. Beschreibung

Mehr

Forschungsstatistik I

Forschungsstatistik I Prof. Dr. G. Meinhardt 2. Stock, Nordflügel R. 02-429 (Persike) R. 02-431 (Meinhardt) Sprechstunde jederzeit nach Vereinbarung Forschungsstatistik I Dr. Malte Persike persike@uni-mainz.de WS 2008/2009

Mehr

Übungsblatt 3: Bivariate Deskription I (Sitzung 4)

Übungsblatt 3: Bivariate Deskription I (Sitzung 4) 1 Übungsblatt 3: Bivariate Deskription I (Sitzung 4) Aufgabe 1 Eine Kreuztabelle beinhaltet unterschiedliche Verteilungen. a) Geben Sie an, wie diese Verteilungen heißen und was sie beinhalten. b) Welche

Mehr

Inhaltsverzeichnis. II. Statistische Modelle und sozialwissenschaftliche Meßniveaus 16

Inhaltsverzeichnis. II. Statistische Modelle und sozialwissenschaftliche Meßniveaus 16 Vorwort 1 1. Kapitel: Der Stellenwert der Statistik für die sozialwissenschaflliche Forschung 1 1. Zur Logik (sozial-)wissenschaftlicher Forschung 1 1. Alltagswissen und wissenschaftliches Wissen 1 2.

Mehr