9. Datenaufbereitung und Datenanalyse

Größe: px
Ab Seite anzeigen:

Download "9. Datenaufbereitung und Datenanalyse"

Transkript

1 Dr. habil. Rüdiger Jacob Methoden und Techniken der empirischen Sozialforschung Vorlesung mit Diskussion 9. Datenaufbereitung und Datenanalyse Datenaufbereitung und Codierung, Datenmatrix, Datenfehler und Datenbereinigung, Korrelation und Kausalität, Individualdaten und Aggregatdaten univariate und bivariate Datenanalyse, Signifikanz und Assoziation, Drittfaktorkontrolle Jacob, Datenanalyse 1

2 Datenaufbereitung und Datenanalyse Individual- oder Mikrodaten: Daten von einzelnen Merkmalsträgern. Aggregat- oder Makrodaten: Daten von Kollektiven. Alle Arten von Raten oder Anteilswerten: Eheschließungs- und Scheidungsraten Arbeitslosenquote Lungenkrebsmorbiditätsraten in einer Stadt Anteil der Raucher in einer Stadt Jahres-Pro-Kopf-Menge des Verbrauchs von Butter und anderen tierischen Fetten Mortalitätsraten Herzinfarkt Bei Aggregatdaten: Ökologischer Fehlschluss bei Korrelationen Ökologische Korrelationen: Hinweise auf mögliche Zusammenhänge Zur Formulierung von Hypothesen gut geeignet, nicht zu deren Überprüfung! Jacob, Datenanalyse 2

3 Individualdaten und Aggregatdaten: Ernährung und Herzinfarkt. Vergleich zwischen Deutschland und Japan (1988/OECD-health-Data) Deutsch -land Japan Rel.Rate Japan (D =100%) Herzinfarktmortalität Frauen 105,0 29,0 27,6 Herzinfarktmortalität Männer 531,0 109,0 20,5 Täglicher Kalorienkonsum ,8 Täglicher Verbrauch von Getreideprotein in gr ,4 Jährlicher Verbrauch von Butter in Kg 8,4 0,7 8,3 Jacob, Datenanalyse 3

4 Variable: Merkmale, die verschiedene Ausprägungen haben können. Dichotome Variable: 2 Ausprägungen Trichotome Variable: 3 Ausprägungen Polytome Variable: mehr als 2 Ausprägungen Konstante: Merkmale mit nur einer Ausprägung. Ob Merkmale Konstante oder Variable darstellen, hängt wesentlich von der Forschungsfrage und der Struktur der untersuchten Population ab Jacob, Datenanalyse 4

5 Phasen der Datenauswertung Kodierung und Dateneingabe Fehlerkontrolle, Fehlerbereinigung, Ausschluss fehlerhafter und fehlender Angaben ("missing values") Umformung von Variablen (Rekodierung), Neubildung von Variablen, Indizes und Skalen (Variablentransformation) Statistische Analyse von Verteilungen und Zusammenhängen - univariat - bivariat - multivariat Jacob, Datenanalyse 5

6 Datenmatrix Variable Fälle Variable: Kopfseite Spalten Merkmalsträger, Fälle: Stirnseite Zeilen Jacob, Datenanalyse 6

7 ID V1 V2 V3 V4 V5 V6 V7 V8 V9 V : : : : : : : : : : : Jacob, Datenanalyse 7

8 Wichtig: Eine Datenmatrix ist nicht mit einer Tabelle zu verwechseln. Tabellen zeigen die Verteilung eines Merkmals (Häufigkeitstabelle) oder die gemeinsame Verteilung von zwei Merkmalen (Kreuztabelle). Eine Datenmatrix enthält dagegen alle erhobenen Merkmale einer Untersuchung. Erstellung einer Datenmatrix: Variablennamen Kodierung Platzhalter für Filter und fehlende Werte Fallnummern Jacob, Datenanalyse 8

9 7. Wie zufrieden sind Sie mit Ihrer Gesundheit? V7 A Sehr zufrieden 26,8 1 B Zufrieden 53,5 2 C Weniger zufrieden relative 13,6 3 D Unzufrieden Häufigkeiten 6,1 4 E Weiß nicht (Interviewer: nicht vorlesen) / 8 k.a. / 9 8. Und wie zufrieden sind Sie insgesamt mit der medizinischen Betreuung durch Ihre Ärzte? V8 A Sehr zufrieden 29,6 1 B Zufrieden 53,1 2 C Weniger zufrieden 13,2 3 D Unzufrieden 3,2 4 E Weiß nicht (Interviewer: nicht vorlesen) 1, An wen wenden Sie sich zunächst, wenn Sie eine leichtere Erkrankung feststellen? k. A. / 9 Ja Nein A an Partner oder Ehepartner (n=507) 58,6 41,4 1, 0 V9.A Variable Frage (hier = Variable) Frage B an Eltern / Verwandte (n=507) 32,3 67,7 1, 0 V9.B C an Freunde (n=507) 29,2 70,8 1, 0 V9.C D an Ärzte (n=507) 60,7 39,3 1, 0 V9.D E an Nachbarn (n=506) 7,3 92,7 1, 0 V9.E F an Arbeitskollegen (n=506) 15,2 84,8 1, 0 V9.F G an Krankenhaus (n=507) Jacob, Datenanalyse 10,3 89,7 1, 0 V9.G 9 n=507 n=507 Variablen name Fallzahl Codezahlen Variablen -namen

10 Univariate Analyse: Verteilung eines Merkmals Deskriptive Maßzahlen: 1. Maße der zentralen Tendenz Mean: arithmetisches Mittel Median: Zentralwert Mode, Modus, Modalwert: am häufigsten vorkommender Wert 2. Streuungsmaße Range, Spannweite: Differenz zwischen dem kleinsten und dem größten Wert Varianz: quadrierte, summierte Abweichungen der individuellen Merkmalsausprägungen vom Mittelwert, dividiert durch die Gesamtzahl der Fälle (dimensionsloser Wert) Standardabweichung: Wurzel aus der Varianz (gleiche Dimension wie die Ausgangsdaten) Jacob, Datenanalyse 10

11 Jacob, Datenanalyse 11

12 Rechtsschiefe/linkssteile Verteilung Jacob, Datenanalyse 12

13 Bei Normalverteilungen sind Modus, Median und arithmetisches Mittel identisch. Für normalverteilte Merkmale gilt: rund 2/3 aller Fälle (genau 68,26%) liegen in dem Intervall mit den Grenzen arith. Mittel + Standardabweichung und arith. Mittel - Standardabweichung. 95,44% aller Fälle liegen in dem Intervall mit den Grenzen arith. Mittel + 2 Standardabweichungen und arith. Mittel - 2 Standardabweichungen 99,74% aller Fälle liegen in dem Intervall mit den Grenzen arith. Mittel + 3 Standardabweichungen und arith. Mittel - 3 Standardabweichungen Bei schiefen Verteilungen gilt: Rechtsschiefe/linkssteile Verteilungen: Modus<Median<arith. Mittel Linksschiefe/rechtssteile Verteilungen: Modus>Median>arith. Mittel Jacob, Datenanalyse 13

14 Jacob, Datenanalyse 14

15 ,0 45,0 50,0 55,0 60,0 65,0 70,0 75,0 80,0 90,0 100,0 110,0 120,0 85,0 95,0 105,0 115,0 125,0 Std.abw. = 14 Mittel = 79,8 N = 195,00 Gewicht Jacob, Datenanalyse 15

16 ,0 155,0 160,0 165,0 170,0 175,0 180,0 185,0 190,0 152,5 157,5 162,5 167,5 172,5 177,5 182,5 187,5 Größe Std.abw. = 8,7 Mittel = 169,3 N = 193,00 Jacob, Datenanalyse 16

17 Übergewicht: Body-Mass-Index (BMI). Körpergewicht in KG geteilt durch das Quadrat der Körpergröße in m Gewicht(Kg) BMI = Körpergröße(m) 2 75Kg BMI = = 25,9 1,70m 2 Wertebereiche: unter 18: deutliches Untergewicht 18-20: Untergewicht 20-25: Normalgewicht 25-30: Übergewicht über 30: Adipositas Jacob, Datenanalyse 17

18 BMI Valid Cum Value Label Value Frequency Percent Percent Perce deutl. Unterg ,0 1,1 1, Normalg ,5 27,6 28, Überg ,2 39,7 68, Adipositas ,1 31,6 100,, 22 11,2 Missing Total ,0 100,0 Valid cases 174 Missing cases 22 ean 27,797 Std dev 4,214 edian 27,641 Variance 17,761 ode 24,221 Minimum 14,005 Maximum 41,016 Range 27,011 Jacob, Datenanalyse 18

19 BMI-Werte in der allgemeinen Bevölkerung ,9 18,1-20 5,6 20, ,2 25, ,9 30,1 oder mehr 6,4 N 2459 Quelle: Sozialwissenschaften-BUS 1996 Jacob, Datenanalyse 19

20 Dichotomisierung der Variablen: bis 25: kein Übergewicht über 25: Übergewicht Übergewicht (Angaben in Prozent) kein Übergewicht 56,7 Übergewicht 43,3 N 2459 Quelle: Sozialwissenschaften-BUS 1996 Jacob, Datenanalyse 20

21 Punkt- oder Intervallschätzung Wie viel Prozent der Bevölkerung sind übergewichtig? Wie genau schätzt der Anteilswert der Stichprobe den wahren Wert der Population? Voraussetzung zur Beantwortung der Frage: Zufallsstichprobe Kennwerte (Mittelwerte, Streuung, Anteilswerte) von Zufallsstichproben sind (approximativ) normalverteilt, der (unbekannte) Populationsparameter ist der Erwartungswert. Stichprobenergebnisse sind Intervallschätzer! Jacob, Datenanalyse 21

22 Konfidenzintervall 95,44% der Stichprobenkennwerte liegen in einem Bereich Populationsparameter (z.b. µ) +/- 2 Standardabweichungen. Populationsparameter, die mit einer Wahrscheinlichkeit von 95,44% einen spezifischen Stichprobenkennwert hervorbringen, liegen in dem Intervall Stichprobenkennwert +/- 2 Standardabweichungen. Die Wahrscheinlichkeit, dass dieser Kennwert zu einer Population gehört, deren Parameter ausserhalb dieses Intervalls liegt, beträgt höchstens 4,56%. Das Konfidenzintervall kennzeichnet den Bereich eines Merkmals, in dem sich ein bestimmter Prozentsatz aller möglichen Populationsparameter befindet, die den empirisch ermittelten Stichprobenkennwert erzeugt haben können Für solche Konfindenzintervalle übliche Bereiche: 95% Jacob, Datenanalyse 22

23 Mittelwert=0 68,26% 95,44% 95% -1,96 Jacob, Datenanalyse 23 1,96 2,58

24 Konfidenzintervall Das 95%-Konfidenzintervall für den Anteilswert berechnet sich nach der Formel: p 1,96. p.(1 n p) θ p + 1,96. p.(1 n p) 0,43-1,96*0, =0,43-0,01956=0,410 Untergrenze: 41% 0,43+1,96*0, =0,43+0,01956=0,449 Obergrenze:44,9% Die Stichprobe entstammt mit 95% Wahrscheinlichkeit einer Population mit einem Anteil übergewichtiger Personen, der zwischen 41% und rund 45% liegt. Jacob, Datenanalyse 24

25 Bivariate Analyse: gemeinsame Analyse von zwei Merkmalen Standardanwendung: Kreuztabellen/Korrelationsanalyse Ziel: Prüfung kausaler Hypothesen Beispiel: Geschlecht und Berufstätigkeit Jacob, Datenanalyse 25

26 Kreuztabellen/Kontingenztabellen 1. Ist ein Zusammenhang zwischen zwei Merkmalen erkennbar? 2. Ist ein solcher Zusammenhang nur zufällig aufgetreten oder bestehen signifikante Unterschiede zwischen Merkmalsgruppen, lässt sich das Ergebnis verallgemeinern? Sicherheit von Zusammenhängen, Signifikanz, Generalisierbarkeit 3. Lässt sich die Stärke des Zusammenhangs quantifizieren Korrelation, Assoziation 4. Gibt es weitere Variablen, durch die das Ergebnis einer zweidimensionalen Tabelle bestätigt oder geändert wird? Drittfaktorenkontrolle Jacob, Datenanalyse 26

27 Jacob, Datenanalyse 27

28 ungeordnete Population Jacob, Datenanalyse 28

29 Gruppierung nach Geschlecht und Berufstätigkeit Jacob, Datenanalyse 29

30 Männer Frauen berufstätige Männer berufstätige Frauen nicht berufstätige Männer nicht berufstätige Frauen Jacob, Datenanalyse 30

31 Tabelle mit Fallzahlen Tabelle mit Reihenprozentwerten Tabelle mit Spaltenprozentwerten Jacob, Datenanalyse 31

32 Tabellenanalyse: Gruppenvergleiche. Die Zahl der Gruppen wird durch die Menge der Merkmalsausprägungen des unabhängigen Merkmals definiert. einfachster Fall: Vierfeldertabelle Zwei allgemeine Konventionen zur Gestaltung von Tabellen: 1. Unabhängige Variablen stehen im Kopf der Tabellen, abhängige an der Stirnseite. 2. Prozentuiert wird spaltenweise, interpretiert wird zeilenweise. Interpretation: Vergleich der Anteilswerte Jacob, Datenanalyse 32

33 K O P F: x S T I R N y zeilenweise interpretieren spaltenweise prozentuieren Anzugeben sind: Titel Prozentuierungsbasen (= die absoluten Häufigkeiten bzw. Fallzahlen in den jeweiligen Kategorien des unabhängigen Merkmals) statistische Maßzahlen gegebenenfalls eine Quelle Jacob, Datenanalyse 33

34 Titel (über der Tabelle) Impfung gegen Grippe nach Altersklassen (Angaben in Prozent) Grippeimpfung 18- u u u u oder älter ja 12,5 9,0 18,4 19,0 39,8 nein 81,3 84,4 75,7 66,7 50,0 weiss nicht 6,3 Spaltenprozent 6,6 5,8 14,3 10,2 N N = 502. Sig. =.000, Cramer s V =.224 Quelle: Regionaler Gesundheitssurvey Trier, 2000 abhängiges Merkmal Y Interpretation: Nur knapp 13% der jüngsten, aber rund 40% der ältesten Befragten haben sich gegen Grippe impfen lassen Stichprobengröße, statistische Maßzahlen unabhängiges Merkmal X Fallzahlen der Merkmalsausprägungen von X Jacob, Datenanalyse 34

35 Welche Prozentwerte werden hier verglichen? Jacob, Datenanalyse 35

36 Geschlecht (x) RV y Unfalltod (y) Männer Frauen Ja 26% 74% 8758 Nein??? RV x??? Relevant ist die Frage nach den geschlechtsspezifischen bedingten Unfallrisiken abhängig von den jeweiligen Expositionen (=Teilnahme am Straßenverkehr). Diese Frage kann mit den vorhandenen Daten nicht beantwortet werden. Indikatoren für die Exposition? Jacob, Datenanalyse 36

37 Signifikanz: Ist das Gewicht abhängig von Geschlecht oder regionaler Herkunft? ewicht nach Geschlecht Kein Übergewicht Männer Frauen N 46,5% 65,9% 1393 Übergewicht 53,5% 34,1% 1065 N Gewicht nach regionaler Herkunft West Ost N Kein 56,8% 56,3% 1394 Übergewicht Übergewicht 43,2% 43,7% 1064 N Jacob, Datenanalyse 37

38 Geprüft wird, ob zwei Merkmale statistisch voneinander unabhängig sind (H0, Nullhypothese). In diesem Fall sind bei gegebenen Randverteilungen in den Zellen einer Zeile gleiche relative Häufigkeiten zu erwarten. Empirische Verteilungen werden verglichen mit einer Indifferenztabelle Tabelle mit Zellenbesetzungen, die sich bei gegebenen Randverteilungen ergeben, wenn die beiden Merkmale tatsächlich statistisch voneinander unabhängig sind. Jacob, Datenanalyse 38

39 Diese Erwartungswerte werden nach der Formel Zeilensumme x Spaltensumme durch Gesamtsumme berechnet. Für die erste Zelle der Tabelle ergibt sich damit: fe = 1168*1393/2458 = 661,9 Für die letzte Zelle erhalten wir: fe = 1260*1065/2458 = 558,9 Jacob, Datenanalyse 39

40 2. Wert: Erwartungswert Männer Frauen N Kein Übergewicht 661,9 731,1 Übergewicht ,1 558,9 N Chi-Square: 93,97133, Sig. = Spaltensummen Gewicht nach regionaler Herkunft, 1. Wert: N, 2. Wert: Erwartungswert West Ost N Kein Übergewicht 1113,8 280,2 Übergewicht ,2 213,8 N Chi-Square: 0,04820, Sig. = Zeilensummen Gesamtsumme Jacob, Datenanalyse 40

41 Die relativen Häufigkeiten sind bei diesen Erwartungswerten in den Zellen einer Zeile alle gleich: 661,9 = 56,67% von ,1 = 56,67% von ,1 = 43,33% von ,9 = 43,33% von 1290 Bei statistischer Unabhängigkeit: Erwartete und beobachtete Werte weichen nicht oder kaum voneinander ab. Prüfgröße Chi-Quadrat-Wert χ 2 = n k= 1 ( f bk f ek f ek )2 k: Zahl der Zellen fbk: Beobachtungswerte fek: Erwartungswerte Jacob, Datenanalyse 41

42 Männer Frauen N Kein 543 (f b ) Übergewicht 661,9 (f e ) 731,1 Übergewicht ,1 558,9 N Zelle f b -f e (f b -f e ) 2 (f b -f e ) 2 /f e 1, ,9=-118, ,21 21,35 1, ,1= 118, ,21 19,33 2, ,1= 118, ,21 27,93 2, ,9=-118, ,21 25,29 Summe 93,9 Jacob, Datenanalyse 42

43 Geprüft wird die Wahrscheinlichkeit, dass die Nullhypothese zutrifft. Ausgewiesen wird diese Wahrscheinlichkeit. p/α=.05 signifikantes Ergebnis (die Wahrscheinlichkeit für die H0 beträgt nur 5%) p/α=.01 hochsignifikantes Ergebnis (die Wahrscheinlichkeit für die H0 beträgt nur 1%) bedeutet nicht, dass die Wahrscheinlichkeit für die Nullhypothese exakt Null ist. Dieses Ergebnis ist mit statistischen Prüfverfahren nicht zu erreichen, vielmehr kommt irgendwann eine von Null verschiedene Zahl. Jacob, Datenanalyse 43

44 Basis für Signifikanztests: Chi-Quadrat-Verteilung(en) Frage: Mit welcher Wahrscheinlichkeit ist ein errechneter Chi-Quadrat-Wert bei einer theoretischen Chi-Quadrat-Verteilung zu erwarten. Wie wahrscheinlich ist ein bestimmter Wert bei statistischer Unabhängigkeit von zwei Merkmalen? Chi-Quadrat-Verteilungen bestehen aus der Summe quadrierter Merkmalsausprägungen voneinander unabhängiger normalverteilter z-transformierter Zufallsvariablen. Zufallsvariable: Merkmal, dessen Ausprägungen (=Elementarereignisse genannt werden), ausschließlich vom Zufall abhängen. Bsp.: Ein Würfelwurf ist eine Zufallsvariable mit 6 möglichen Elementarereignissen, die alle die Wahrscheinlichkeit 1/6 haben. Jacob, Datenanalyse 44

45 Eine neue Zufallsvariable auf der Basis dieser Variablen ist die Kombination der Augenzahlen von je zwei Würfelwürfen. Elementarereignisse sind dann nicht mehr die Augenzahlen 1 bis 6, sondern Kombinationen dieser beiden Wertereihen, also (1 1)(1 2)(2 1) usw. Die neue Zufallsvariable ist das Ergebnis der Kombination (additiv oder multiplikativ) der Elementarereignisse zweier voneinander unabhängiger Zufallsvariablen Jacob, Datenanalyse 45

46 46

47 Diskrete Zufallsvariablen: Elementarereignisse können abgezählt werden. Stetige Zufallsvariablen: Elementarereignisse können innerhalb eines bestimmten Intervalls jede beliebige Größe annehmen. Bestimmend für die Form der Verteilung ist die Wahrscheinlichkeitsfunktion. Bei diskreten Zufallsvariablen gibt diese Funktion an, mit welcher Wahrscheinlichkeit ein bestimmtes Elementarereignis zu erwarten ist, wenn das Zufallsexperiment (als z. B. der Wurf eines Würfels) unendlich oft wiederholt wird (in der Praxis bedeutet dies: sehr häufige Wiederholung untere Grenze: 100). Bei stetigen Zufallsvariablen wird die Wahrscheinlichkeitsdichte für das Auftreten von Elementarereignisse bestimmt, die innerhalb eines definierten Intervalls liegen. Jacob, Datenanalyse 47

48 Die Wahrscheinlichkeitsdichtefunktion hat stets Kurvenform. Die Gesamtwahrscheinlichkeit für eine stetige Zufallsvariable wird gleich Eins gesetzt und entspricht der Gesamtfläche unter der Kurve. Die Wahrscheinlichkeitsdichte für ein bestimmtes Intervall mit den Grenzen a und b entspricht der durch diese Punkte markierten und begrenzten Fläche der darüber liegenden Kurve. Je enger der Abstand von a und b ist und/oder je geringer der Abstand zwischen Kurve und X-Achse ist, umso kleiner wird die markierte Fläche und damit auch die Wahrscheinlichkeit des Auftretens von Elementarereignissen innerhalb der entsprechenden Intervallgrenzen. Chi2-Verteilungen können aus einer, zwei drei, vier oder 10 oder allgemein n Zufallsvariablen gebildet werden. Freiheitsgrade der Verteilung (DF= Degrees of Freedom). Jacob, Datenanalyse 48

49 Werte >= 4 haben bei den drei Verteilungen unterschiedliche Wahrscheinlichkeiten Jacob, Datenanalyse 49

50 Freiheitsgrade Restriktion empirischer Verteilungen auch bei statistischer Unabhängigkeit der Merkmale: Fallzahlen und Merkmalsausprägungen der Merkmale Gewicht nach regionaler Herkunft, 1. Wert: N, 2. Wert: Erwartungswert West Ost N Kein Übergewicht , , Übergewicht , , N Bei gegebenen Randverteilungen sind die Erwartungswerte Dezimalzahlen. Empirische Werte sind dagegen immer ganzzahlig. Jacob, Datenanalyse 50

51 Freiheitsgrade Frage: Wie viele Zellenbesetzungen können bei gegebenen Randverteilungen frei besetzt werden, bevor alle weiteren dadurch Zellbesetzungen festgelegt sind. DF: (Reihen minus 1) x (Spalten minus 1) Bei je zwei Reihen und Spalten beträgt DF = (2-1) x (2-1)=1. Jacob, Datenanalyse 51

52 Gewicht nach Geschlecht; Freiheitsgrade Männer Frauen N Kein Übergewicht Übergewicht N Jacob, Datenanalyse 52

53 Zu beachten ist: Berechnet werden Abweichungen der beobachteten von den erwarteten Häufigkeiten. Chi² ist fallzahlabhängig. Mit wachsender Stichprobengröße wächst die Wahrscheinlichkeit, dass Zusammenhänge als signifikant ausgewiesen werden. Die Stichprobengröße bedingt die Zellbesetzungen. Um Abweichungen empirischer von theoretischen Werten berechnen zu können, müssen Spielräume, Variationsbreiten vorliegen - also Mindestzellenbesetzungen - möglich sein, wobei hier eine Mindestbesetzung von fünf gefordert wird. Jacob, Datenanalyse 53

54 Männer Frauen N ,7 0, ,1-20 2,0 9, , ,9 56, , ,7 28, ,1 oder 6,8 6,0 157 mehr N Chi-Square: 129,85758, Sig. = BMI nach Geschlecht Männer Frauen N ,2 5,7 4 18,1-20 4,3 11,3 8 20, ,7 47, , ,3 26, ,1 oder 6,5 9,4 8 mehr N Chi-Square: 4,13111, Sig. = Tabellen mit gleichen Proportionen, aber unterschiedlichen Signifikanzniveaus 54

55 Korrelation und Kausalität Korrelation: gemeinsames Auftreten und Variieren zweier Variablen Kausalität: Ursache-Wirkungs-Beziehung: x verursacht y! Eine statistisch nachweisbare Korrelation von x und y kann bedeuten: 1. x verursacht y 2. y verursacht x 3. x und y werden von einer dritten Variable verursacht 1. x und y beeinflussen sich wechselseitig Jacob, Datenanalyse 55

56 Beispiel: x: Umweltbewusstsein, Indikator: Skala mit entsprechenden Items y: Umweltfreundliches Verhalten, Indikatoren: kein Auto, keine Flugreisen, Benutzung von Bus und Rad hohe Korrelation: Fast alle Personen im Sample, die sich durch ausgeprägtes Umweltbewusstsein auszeichnen, haben kein Auto, fliegen nicht und benutzen den Bus. Interpretation? Typ 1, 2, 3 oder 4? Jacob, Datenanalyse 56

57 Kausalität ist statistisch nicht nachweisbar. Messbar ist nur eine Korrelation von zwei Variablen. Kausalzusammenhänge: hypothetische Konstrukte! Voraussetzungen für den Schluss auf eine kausale Beziehung: X und Y korrelieren X geht Y zeitlich voran X und Y wurden exakt gemessen Korrelation ist notwendige, aber nicht hinreichende Voraussetzung für Kausalität, Kausalität lässt sich korrelationsstatistisch nur widerlegen, aber nicht beweisen. Jacob, Datenanalyse 57

58 Korrelation Korrelationskoeffizienten sind Maßzahlen für mindestens bivariate Verteilungen und informieren über die Stärke und (ab ordinalem Messniveau) die Richtung eines Zusammenhangs. Anforderungen 1. Koeffizienten werden standardisiert auf den Wertebereich zwischen 0 und 1, dabei zeigt der Wert 1 eine perfekte, der Wert 0 eine Nichtbeziehung an. Ab Ordinalskalenniveau lassen sich auch Koeffizienten mit Vorzeichen berechnen, wobei ein Wert von -1 eine perfekte negative (inverse) Beziehung darstellt (hohe X-Werte korrelieren mit niedrigen Y-Werten und umgekehrt). 2. Die Koeffizienten sollen invariant sein gegenüber unterschiedlichen absoluten Häufigkeiten der Tabelle und nur Unterschiede in den relativen Häufigkeiten zur Vergleichsgrundlage verwenden. Jacob, Datenanalyse 58

59 160 Gewicht in Abhängigkeit von Körpergröße Gewicht in kg Größe in cm Niedrigen x-werten entsprechen niedrige y-werte, hohen x-werten hohe y-werte: Kleinere Personen sind leichter als größere. Frage: Was ist ein niedriger x- oder y-wert? Jacob, Datenanalyse 59

60 Pearson s r: Maß für eine lineare Beziehung zwischen zwei mindestens intervallskalierten Variablen. Mittelwertbasierter Koeffizient: Mittelwert als Referenzwert für die Einstufung von X- bzw. Y-Werten als hoch oder niedrig Die Merkmalsausprägungen der einzelnen Merkmale werden in Beziehung gesetzt zu ihren jeweiligen Mittelwerten, man berechnet die Abweichungen, indem der Mittelwert von der jeweiligen Merkmalsausprägung subtrahiert wird. Handelt es sich um eine relativ hohe Position, ist diese Differenz positiv, ansonsten negativ. Jacob, Datenanalyse 60

61 Zur Berechnung eines Zusammenhangs werden nun diese Differenzen für X und für Y für jede UE berechnet, multipliziert und diese Produkte addiert. Man nennt das auch die Summe der Abweichungsprodukte (SAP) oder die Summe der Kreuzprodukte. Dividiert durch N erhält man die Kovarianz Standardisierung auf Werte zwischen 1 und 1: Kovarianz wird dividiert durch das Produkt der Standardabweichungen von X und Y r Jacob, Datenanalyse 61

62 Pearson s r Jacob, Datenanalyse 62

63 Katholikenanteil Stimmanteil der CDU 63

64 Y X Jacob, Datenanalyse 64

65 Jacob, Datenanalyse 65

66 91,40/52,68 54,99 43,96 34,89/37,68 Jacob, Datenanalyse 66

67 Jacob, Datenanalyse 67

68 Jacob, Datenanalyse 68

69 Jacob, Datenanalyse 69

70 Jacob, Datenanalyse 70

71 Kurvilineare Beziehung Jacob, Datenanalyse 71

72 Durchschnittlicher Alkoholkonsum pro Woche (Wein, Sekt, Bier, Viez) in Liter nach Schulbildung (Schulzeit in Jahren) 2,5 2,3 2,3 2 1,5 1,8 1 0,5 0 bis 9 Jahre 10 Jahre Jahre r =.04 Jacob, Datenanalyse 72

73 Ordinales Messniveau: Maßzahlen auf der Basis des Paarvergleichs Bei ordinalen Daten kann kein Mittelwert berechnet werden. Allerdings lassen sich ordinale Daten in eine Rangfolge bringen. Bei ordinalen Koeffizienten werden Wertepaare von verschiedenen Untersuchungseinheiten geordnet. Zusammenhänge werden z. B. daraufhin untersucht, ob Personen, die bei Variable X einen höheren Wert aufweisen, dies auch bei Y tun oder nicht. Jacob, Datenanalyse 73

74 Alter (X): Code: Label: 1 18 bis unter bis unter bis unter bis unter 60 5 Über 60 AIDS-Kranke brauchen Solidarität und Hilfe. (Y1) Schuld an AIDS sind die Hauptrisikogruppen. (Y2) Code: Label: 1 stimme sehr zu 2 stimme eher zu 3 teils-teils 4 stimme eher nicht zu 5 stimme überhaupt nicht zu Jacob, Datenanalyse 74

75 Konkordanter Zusammenhang (c) Merkmale: X= Alter mit 5 Altersklassen Codezahlen: 1= 18 b. u. 30, 5= 60 u. älter Y1 = Solidarität mit Aids-Kranken, fünfpolige Likert-Skala Codezahlen: 1= stimme sehr zu, 5= lehne sehr ab Alter X Person A 18 (1) Person B 60 (5) Solidarität Y1 s.s.z. (1) l.s.a. (5) X und Y-Wert von A sind kleiner als von B Jacob, Datenanalyse 75

76 Diskordanter Zusammenhang (d) Merkmale: X= Alter mit 5 Altersklassen Codezahlen: 1= 18 b. u. 30, 5= 60 u. älter Y2= Schuldattributionen, fünfpolige Likert-Skala Codezahlen: 1= stimme sehr zu, 5= lehne sehr ab Alter X Person A 18 (1) Person B 60 (5) HRG sind Schuld an AIDS Y2 l.s.a. (5) s.s.z. (1) Der X-Wert von A ist kleiner, der Y-Wert größer als von B Jacob, Datenanalyse 76

77 Person X Alter Y1 Solidarität A B C D E Y2 Schuld N ( N 1) Npaare = 2 Nc Nd TauA = Npaare X/Y1: 10-0/10 = 1 X/Y2: 0-10/10 = -1 Jacob, Datenanalyse 77

78 Alter Wichtigkeit von Recht und Ordnung 18- u u u ü sehr wichtig wichtig wenig. wicht unwichtig Σ N = 40 Jacob, Datenanalyse 78

79 Insgesamt möglich Paare: Konkordante Paare (Nc): Alle Zellhäufigkeiten, die rechts und unterhalb einer bestimmten Zelle liegen, summiert und multipliziert mit dieser Zelle, ergeben die Anzahl konkordanter Paare. Nc: 1( )=11 2(5)=10 1( )=12 2(2+1)=6 5(4+1)=25 5(1)=5 Nc =69 Alter Wichtigkeit von Recht und Ordnung 18- u u u ü sehr wichtig wichtig wenig. wicht unwichtig Jacob, Datenanalyse 79

80 Diskordante Paare (Nd): Alle Zellhäufigkeiten, die links und unterhalb einer bestimmten Zelle liegen, summiert und multipliziert mit dieser Zelle, ergeben die Anzahl diskordanter Paare Nd: 4( )=112 2( )=44 1(1+5+5)=11 5( )=110 3( )=57 2(5+5)=20 2(4)=8 2(5)=10 5(5)=25 Nd=397 Alter Wichtigkeit von Recht und Ordnung 18- u u u ü sehr wichtig wichtig wenig. wicht unwichtig Jacob, Datenanalyse 80

81 Tied on x (Tx): Alle Zellhäufigkeiten, die unterhalb einer bestimmten Zelle liegen, summiert und multipliziert mit dieser Zelle, ergeben die Anzahl der auf x verknüpften Paare. Tx: 1(5+5)=10 5(5)=25 1(2+5+4)=11 2(5+4)=18 5(4)=20 2(3+2+1)=12 3(2+1)=9 2(1)=2 4(5)=20 Tx=127 Alter Wichtigkeit von Recht und Ordnung 18- u u u ü sehr wichtig wichtig wenig. wicht unwichtig Jacob, Datenanalyse 81

82 Tied on y (Ty): Alle Zellhäufigkeiten, die neben einer bestimmten Zelle liegen, summiert und multipliziert mit dieser Zelle, ergeben die Anzahl der auf y verknüpften Paare. Ty: 1(2+4)=6 2(4)=8 1(2+3+5)=8 2(3+5)=16 3(5)=15 5(5+2)=35 5(2)=10 5(4+1)=25 4(1)=4 Ty=127 Alter Wichtigkeit von Recht und Ordnung 18- u u u ü sehr wichtig wichtig wenig. wicht unwichtig Jacob, Datenanalyse 82

83 Tied on x and y (Txy): Alle Untersuchungseinheiten in gleichen Zellen. n(n-1)/2 Txy: 2(2-1)/2=1 4(4-1)/2=6 2(2-1)/2=1 3(3-1)/2=3 5(5-1)/2=10 5(5-1)/2=10 5(5-1)/2=10 2(2-1)/2=1 5(5-1)/2=10 4(4-1)/2=6 Txy=60 Alter Wichtigkeit von 18- u u u. 50 ü. 50 Recht und Ordnung sehr wichtig wichtig wenig. wicht unwichtig Jacob, Datenanalyse 83

84 Npaare = Nc+Nd+Tx+Ty+Txy 780= Gamma = Nc Nc + Nd Nd = =.703 TauA Nc Nd = Npaare = =.420 TauB = ( Nc + Nd Nc + Tx) Nd ( Nc + Nd + Ty = =.553 TauC = 2R( Nc n²( R Nd 1) ) = =.546 mit: R = Minimum der Zeilen- bzw. Spaltenzahl n = Anzahl der Meßwerte 84

85 Abwechslung und Spaß sehr wichtig 1 wichtig 2 wenig. wicht. 3 unwichtig u u u ü symmetrische Tabelle 3 N =12, Npaare = 66, Nc = 54, Nd = 0, Tx = 0, Ty = 0, Txy = 12 Npaare = Nc+Nd+Tx+Ty+Txy 66 = Gamma = 54 = TauA TauB = = 54 = = TauC = 432 = 1.00 Jacob, Datenanalyse 85

86 Abwechs. 18 u u u u. 60 ü. 60 und Spaß sehr 3 wichtig wichtig 3 wen. wicht. 3 unwichtig 3 3 asymmetrische Tabelle N = 15, Npaare = 105, Nc = 81, Nd = 0, Tx = 0, Ty = 3(3)=9, Txy = 15 Npaare = Nc+Nd+Tx+Ty+Txy 105 = Gamma = 81 = TauA = TauB = 81 = , =.948 TauC = 648 =.960 Jacob, Datenanalyse 86

87 Person X Alter Y1 Solidarität Y2 Schuld A B C D E Rangkorrelation (Spearmann) rs = 1 6*( D1² + D2² +... Dx²) N *( N ² 1) D1 bis Dx: Differenzen der Rangplätze (=Codezahlen) für jeden der n Merkmalsträger Jacob, Datenanalyse 87

88 Person A B C D E Rang X Rang Y D D² rs 6*(0) = 1 = 1 5*(25 1) Jacob, Datenanalyse 88

89 Person A B C D E Rang X Rang Y D D² rs = 6 *( ) 1 = 1 2 = 1 5*(25 1) Jacob, Datenanalyse 89

90 Nominales Messniveau: Chi-Quadrat basierte Maßzahlen Grundgedanke: Eine Beziehung zwischen zwei Merkmalen ist umso stärker, je größer die Abweichung von der statistischen Unabhängigkeit ist. φ = χ ² N V = N χ ² min( r 1/ c 1) Wichtig: Bei Merkmalen unterschiedlichen Messniveaus bestimmt das jeweils niedrigste Skalenniveau die Wahl des Koeffizienten. Jacob, Datenanalyse 90

91 Erwartungswert Männer Frauen N Kein Übergewicht Übergewicht N Chi-Square: 100 φ = χ ² N φ = 100 = Jacob, Datenanalyse 91

92 Erwartungswert bis u. 30 bis u. 50 ü. 50 N kein Überg ,3 33,3 33,3 leichtes Ü ,3 33,3 33,3 Adipositas ,3 33,3 33,3 N Chi-Square: 600 φ = 600 = 300 1, V = N χ ² min( r 1/ c 1) V = 600 = 1 92

93 Schuld an AIDS sind die Hauptrisikogruppen stimme sehr zu 30,3% stimme eher zu 29,3% 59,6% teils-teils 23,3% lehne eher ab 10,1% 17,1% lehne sehr ab 7,0% N 2106 Quelle: ZUMA-Sozialwissenschaften-BUS 2/1990 Jacob, Datenanalyse 93

94 V10_7 Risikogruppen sind Schuld by ALTK Altersklassen ALTK Count Exp Val Row Pct ü. 60 Col Pct Row Tot Pct 1,00 2,00 3,00 4,00 5,00 Total V10_ stimme sehr zu 159,7 129,0 104,1 97,1 145,1 30,4% 15,1% 15,0% 17,2% 20,0% 32,8% 18,3% 22,4% 31,8% 39,7% 43,5% 4,6% 4,5% 5,2% 6,1% 9,9% stimme eher zu 154,4 124,7 100,7 93,9 140,3 29,3% 20,4% 19,2% 15,8% 17,6% 27,0% 23,8% 27,8% 28,3% 33,8% 34,7% 6,0% 5,6% 4,6% 5,2% 7,9% teils/teils 122,4 98,9 79,8 74,5 111,3 23,3% 31,2% 25,3% 17,7% 11,3% 14,6% 28,9% 28,9% 25,1% 17,2% 14,9% 7,3% 5,9% 4,1% 2,6% 3,4% lehne eher ab 53,3 43,1 34,8 32,4 48,4 10,1% 42,9% 21,7% 16,5% 11,3% 7,5% 17,3% 10,8% 10,2% 7,5% 3,3% 4,3% 2,2% 1,7% 1,1%,8% lehne sehr ab 36,2 29,3 23,6 22,0 32,9 6,9% 43,1% 29,9% 11,1% 4,2% 11,8% 11,8% 10,1% 4,7% 1,9% 3,6% 3,0% 2,1%,8%,3%,8% Column Total 25,1% 20,3% 16,4% 15,3% 22,8% 100,0% 94

Kontingenzkoeffizient (nach Pearson)

Kontingenzkoeffizient (nach Pearson) Assoziationsmaß für zwei nominale Merkmale misst die Unabhängigkeit zweier Merkmale gibt keine Richtung eines Zusammenhanges an 46 o jl beobachtete Häufigkeiten der Kombination von Merkmalsausprägungen

Mehr

Business Value Launch 2006

Business Value Launch 2006 Quantitative Methoden Inferenzstatistik alea iacta est 11.04.2008 Prof. Dr. Walter Hussy und David Tobinski UDE.EDUcation College im Rahmen des dokforums Universität Duisburg-Essen Inferenzstatistik Erläuterung

Mehr

3.2 Bivariate Verteilungen

3.2 Bivariate Verteilungen 3.2 Bivariate Verteilungen zwei Variablen X, Y werden gemeinsam betrachtet (an jedem Objekt i, i = 1,..., n, werden gleichzeitig zwei Merkmale beobachtet) Beobachtungswerte sind Paare/Kombinationen von

Mehr

Einführung in die statistische Datenanalyse I

Einführung in die statistische Datenanalyse I Einführung in die statistische Datenanalyse I Inhaltsverzeichnis 1. EINFÜHRUNG IN THEORIEGELEITETES WISSENSCHAFTLICHES ARBEITEN 2 2. KRITIERIEN ZUR AUSWAHL STATISTISCH METHODISCHER VERFAHREN 2 3. UNIVARIATE

Mehr

Übungsserie Nr. 10 mit Lösungen

Übungsserie Nr. 10 mit Lösungen Übungsserie Nr. 10 mit Lösungen 1 Ein Untersuchungsdesign sieht einen multivariaten Vergleich einer Stichprobe von Frauen mit einer Stichprobe von Männern hinsichtlich der Merkmale X1, X2 und X3 vor (Codierung:

Mehr

Willkommen zur Vorlesung Statistik (Master)

Willkommen zur Vorlesung Statistik (Master) Willkommen zur Vorlesung Statistik (Master) Thema dieser Vorlesung: Verteilungsfreie Verfahren Prof. Dr. Wolfgang Ludwig-Mayerhofer Universität Siegen Philosophische Fakultät, Seminar für Sozialwissenschaften

Mehr

Auswertung mit dem Statistikprogramm SPSS: 30.11.05

Auswertung mit dem Statistikprogramm SPSS: 30.11.05 Auswertung mit dem Statistikprogramm SPSS: 30.11.05 Seite 1 Einführung SPSS Was ist eine Fragestellung? Beispiel Welche statistische Prozedur gehört zu welcher Hypothese? Statistische Berechnungen mit

Mehr

Was sind Zusammenhangsmaße?

Was sind Zusammenhangsmaße? Was sind Zusammenhangsmaße? Zusammenhangsmaße beschreiben einen Zusammenhang zwischen zwei Variablen Beispiele für Zusammenhänge: Arbeiter wählen häufiger die SPD als andere Gruppen Hochgebildete vertreten

Mehr

Einfache statistische Auswertungen mit dem Programm SPSS

Einfache statistische Auswertungen mit dem Programm SPSS Einfache statistische Auswertungen mit dem Programm SPSS Datensatz: fiktive_daten.sav Dipl. Päd. Anne Haßelkus Dr. Dorothea Dette-Hagenmeyer 11/2011 Überblick 1 Deskriptive Statistiken; Mittelwert berechnen...

Mehr

Analyse bivariater Kontingenztafeln

Analyse bivariater Kontingenztafeln Analyse bivariater Kontingenztafeln Werden zwei kategoriale Merkmale mit nicht zu vielen möglichen Ausprägungen gemeinsam analysiert, so kommen zur Beschreibung der gemeinsamen Verteilung im allgemeinen

Mehr

Auswertung und Darstellung wissenschaftlicher Daten (1)

Auswertung und Darstellung wissenschaftlicher Daten (1) Auswertung und Darstellung wissenschaftlicher Daten () Mag. Dr. Andrea Payrhuber Zwei Schritte der Auswertung. Deskriptive Darstellung aller Daten 2. analytische Darstellung (Gruppenvergleiche) SPSS-Andrea

Mehr

Grundlagen quantitativer Sozialforschung Interferenzstatistische Datenanalyse in MS Excel

Grundlagen quantitativer Sozialforschung Interferenzstatistische Datenanalyse in MS Excel Grundlagen quantitativer Sozialforschung Interferenzstatistische Datenanalyse in MS Excel 16.11.01 MP1 - Grundlagen quantitativer Sozialforschung - (4) Datenanalyse 1 Gliederung Datenanalyse (inferenzstatistisch)

Mehr

a) Zeichnen Sie in das nebenstehende Streudiagramm mit Lineal eine Regressionsgerade ein, die Sie für passend halten.

a) Zeichnen Sie in das nebenstehende Streudiagramm mit Lineal eine Regressionsgerade ein, die Sie für passend halten. Statistik für Kommunikationswissenschaftler Wintersemester 2009/200 Vorlesung Prof. Dr. Helmut Küchenhoff Übung Cornelia Oberhauser, Monia Mahling, Juliane Manitz Thema 4 Homepage zur Veranstaltung: http://www.statistik.lmu.de/~helmut/kw09.html

Mehr

Überblick über die Verfahren für Ordinaldaten

Überblick über die Verfahren für Ordinaldaten Verfahren zur Analyse ordinalskalierten Daten 1 Überblick über die Verfahren für Ordinaldaten Unterschiede bei unabhängigen Stichproben Test U Test nach Mann & Whitney H Test nach Kruskal & Wallis parametrische

Mehr

Korrelation - Regression. Berghold, IMI

Korrelation - Regression. Berghold, IMI Korrelation - Regression Zusammenhang zwischen Variablen Bivariate Datenanalyse - Zusammenhang zwischen 2 stetigen Variablen Korrelation Einfaches lineares Regressionsmodell 1. Schritt: Erstellung eines

Mehr

Kreuztabellenanalyse -Zusammenhangsmaße

Kreuztabellenanalyse -Zusammenhangsmaße Lehrveranstaltung Empirische Forschung und Politikberatung der Universität Bonn, WS 2007/2008 Kreuztabellenanalyse -Zusammenhangsmaße 14. Dezember 2007 Anja Hall, Bundesinstitut für Berufsbildung, AB 2.2:

Mehr

Einseitig gerichtete Relation: Mit zunehmender Höhe über dem Meeresspiegel sinkt im allgemeinen die Lufttemperatur.

Einseitig gerichtete Relation: Mit zunehmender Höhe über dem Meeresspiegel sinkt im allgemeinen die Lufttemperatur. Statistik Grundlagen Charakterisierung von Verteilungen Einführung Wahrscheinlichkeitsrechnung Wahrscheinlichkeitsverteilungen Schätzen und Testen Korrelation Regression Einführung Die Analyse und modellhafte

Mehr

5. Schließende Statistik. 5.1. Einführung

5. Schließende Statistik. 5.1. Einführung 5. Schließende Statistik 5.1. Einführung Sollen auf der Basis von empirischen Untersuchungen (Daten) Erkenntnisse gewonnen und Entscheidungen gefällt werden, sind die Methoden der Statistik einzusetzen.

Mehr

2. Deskriptive Statistik 2.1. Häufigkeitstabellen, Histogramme, empirische Verteilungsfunktionen

2. Deskriptive Statistik 2.1. Häufigkeitstabellen, Histogramme, empirische Verteilungsfunktionen 4. Datenanalyse und Modellbildung Deskriptive Statistik 2-1 2. Deskriptive Statistik 2.1. Häufigkeitstabellen, Histogramme, empirische Verteilungsfunktionen Für die Auswertung einer Messreihe, die in Form

Mehr

Grundlagen der Inferenzstatistik: Was Ihnen nicht erspart bleibt!

Grundlagen der Inferenzstatistik: Was Ihnen nicht erspart bleibt! Grundlagen der Inferenzstatistik: Was Ihnen nicht erspart bleibt! 1 Einführung 2 Wahrscheinlichkeiten kurz gefasst 3 Zufallsvariablen und Verteilungen 4 Theoretische Verteilungen (Wahrscheinlichkeitsfunktion)

Mehr

METHODENLEHRE I WS 2013/14 THOMAS SCHÄFER

METHODENLEHRE I WS 2013/14 THOMAS SCHÄFER METHODENLEHRE I WS 2013/14 THOMAS SCHÄFER DAS THEMA: INFERENZSTATISTIK IV INFERENZSTATISTISCHE AUSSAGEN FÜR ZUSAMMENHÄNGE UND UNTERSCHIEDE Inferenzstatistik für Zusammenhänge Inferenzstatistik für Unterschiede

Mehr

Datenanalyse mit Excel. Wintersemester 2013/14

Datenanalyse mit Excel. Wintersemester 2013/14 Datenanalyse mit Excel 1 KORRELATIONRECHNUNG 2 Korrelationsrechnung Ziel der Korrelationsrechnung besteht im bivariaten Fall darin, die Stärke des Zusammenhangs zwischen zwei interessierenden statistischen

Mehr

1,11 1,12 1,13 1,14 1,15 1,16 1,17 1,17 1,17 1,18

1,11 1,12 1,13 1,14 1,15 1,16 1,17 1,17 1,17 1,18 3. Deskriptive Statistik Ziel der deskriptiven (beschreibenden) Statistik (explorativen Datenanalyse) ist die übersichtliche Darstellung der wesentlichen in den erhobenen Daten enthaltene Informationen

Mehr

Teil II: Einführung in die Statistik

Teil II: Einführung in die Statistik Teil II: Einführung in die Statistik (50 Punkte) Bitte beantworten Sie ALLE Fragen. Es handelt sich um multiple choice Fragen. Sie müssen die exakte Antwortmöglichkeit angeben, um die volle Punktzahl zu

Mehr

1.TABELLENANALYSEN MIT DICHOTOMEN VARIABLEN...

1.TABELLENANALYSEN MIT DICHOTOMEN VARIABLEN... Tabellenanalyse 1.TABELLENANALYSEN MIT DICHOTOMEN VARIABLEN... 2 1.1 BEISPIEL AUS DEM SKRIPT: DER ZUSAMMENHANG VON RAUCHEN UND KREBSERKRANKUNG... 2 1.2 DARSTELLUNG DES ZUSAMMENHANGS MIT SPSS:... 2 1.3

Mehr

Chi-Quadrat Verfahren

Chi-Quadrat Verfahren Chi-Quadrat Verfahren Chi-Quadrat Verfahren werden bei nominalskalierten Daten verwendet. Die einzige Information, die wir bei Nominalskalenniveau zur Verfügung haben, sind Häufigkeiten. Die Quintessenz

Mehr

Regelmäßigkeit (Erkennen von Mustern und Zusammenhängen) versus Zufall

Regelmäßigkeit (Erkennen von Mustern und Zusammenhängen) versus Zufall Wahrscheinlichkeitstheorie Was will die Sozialwissenschaft damit? Regelmäßigkeit (Erkennen von Mustern und Zusammenhängen) versus Zufall Auch im Alltagsleben arbeiten wir mit Wahrscheinlichkeiten, besteigen

Mehr

Eine computergestützte Einführung mit

Eine computergestützte Einführung mit Thomas Cleff Deskriptive Statistik und Explorative Datenanalyse Eine computergestützte Einführung mit Excel, SPSS und STATA 3., überarbeitete und erweiterte Auflage ^ Springer Inhaltsverzeichnis 1 Statistik

Mehr

Deskription, Statistische Testverfahren und Regression. Seminar: Planung und Auswertung klinischer und experimenteller Studien

Deskription, Statistische Testverfahren und Regression. Seminar: Planung und Auswertung klinischer und experimenteller Studien Deskription, Statistische Testverfahren und Regression Seminar: Planung und Auswertung klinischer und experimenteller Studien Deskriptive Statistik Deskriptive Statistik: beschreibende Statistik, empirische

Mehr

Franz Kronthaler. Statistik angewandt. Datenanalyse ist (k)eine Kunst. Excel Edition. ^ Springer Spektrum

Franz Kronthaler. Statistik angewandt. Datenanalyse ist (k)eine Kunst. Excel Edition. ^ Springer Spektrum Franz Kronthaler Statistik angewandt Datenanalyse ist (k)eine Kunst Excel Edition ^ Springer Spektrum Inhaltsverzeichnis Teil I Basiswissen und Werkzeuge, um Statistik anzuwenden 1 Statistik ist Spaß 3

Mehr

1. Maße der zentralen Tendenz Beispiel: Variable Anzahl der Geschwister aus Jugend '92. Valid Cum Value Frequency Percent Percent Percent

1. Maße der zentralen Tendenz Beispiel: Variable Anzahl der Geschwister aus Jugend '92. Valid Cum Value Frequency Percent Percent Percent Deskriptive Statistik 1. Verteilungsformen symmetrisch/asymmetrisch unimodal(eingipflig) / bimodal (zweigipflig schmalgipflig / breitgipflig linkssteil / rechtssteil U-förmig / abfallend Statistische Kennwerte

Mehr

9. Schätzen und Testen bei unbekannter Varianz

9. Schätzen und Testen bei unbekannter Varianz 9. Schätzen und Testen bei unbekannter Varianz Dr. Antje Kiesel Institut für Angewandte Mathematik WS 2011/2012 Schätzen und Testen bei unbekannter Varianz Wenn wir die Standardabweichung σ nicht kennen,

Mehr

Bitte schreiben Sie in Druckbuchstaben und vergessen Sie nicht zu unterschreiben. Name, Vorname:. Studiengang/ Semester:. Matrikelnummer:..

Bitte schreiben Sie in Druckbuchstaben und vergessen Sie nicht zu unterschreiben. Name, Vorname:. Studiengang/ Semester:. Matrikelnummer:.. Institut für Erziehungswissenschaft der Philipps-Universität Marburg Prof. Dr. Udo Kuckartz Arbeitsbereich Empirische Pädagogik/Methoden der Sozialforschung Wintersemester 004/005 KLAUSUR FEBRUAR 005 /

Mehr

Assoziation & Korrelation

Assoziation & Korrelation Statistik 1 für SoziologInnen Assoziation & Korrelation Univ.Prof. Dr. Marcus Hudec Einleitung Bei Beobachtung von 2 Merkmalen für jeden Merkmalsträger stellt sich die Frage, ob es systematische Zusammenhänge

Mehr

Der χ 2 -Test (Chiquadrat-Test)

Der χ 2 -Test (Chiquadrat-Test) Der χ 2 -Test (Chiquadrat-Test) Der Grundgedanke Mit den χ 2 -Methoden kann überprüft werden, ob sich die empirischen (im Experiment beobachteten) Häufigkeiten einer nominalen Variable systematisch von

Mehr

Eine Einführung in R: Statistische Tests

Eine Einführung in R: Statistische Tests Eine Einführung in R: Statistische Tests Bernd Klaus, Verena Zuber Institut für Medizinische Informatik, Statistik und Epidemiologie (IMISE), Universität Leipzig http://www.uni-leipzig.de/ zuber/teaching/ws12/r-kurs/

Mehr

Statistische Tests (Signifikanztests)

Statistische Tests (Signifikanztests) Statistische Tests (Signifikanztests) [testing statistical hypothesis] Prüfen und Bewerten von Hypothesen (Annahmen, Vermutungen) über die Verteilungen von Merkmalen in einer Grundgesamtheit (Population)

Mehr

Skript zur Übung: Grundlagen der empirischen Sozialforschung - Datenanalyse

Skript zur Übung: Grundlagen der empirischen Sozialforschung - Datenanalyse Skript zur Übung: Grundlagen der empirischen Sozialforschung - Datenanalyse Phasen des Forschungsprozesses Auswahl des Forschungsproblems Theoriebildung Theoretische Phase Konzeptspezifikation / Operationalisierung

Mehr

Prüfung zu Modul 26 (BA Bw) bzw. 10 (BA IB) (Wirtschaftsstatistik)

Prüfung zu Modul 26 (BA Bw) bzw. 10 (BA IB) (Wirtschaftsstatistik) 2 3 Klausur-Nr = Sitzplatz-Nr Prüfung zu Modul 26 (BA Bw) bzw. 10 (BA IB) (Wirtschaftsstatistik) Klausurteil 1: Beschreibende Statistik BeStat-1 (7 ) n = 400 Personen wurden gefragt, wie viele Stück eines

Mehr

Übung 1: Wiederholung Wahrscheinlichkeitstheorie

Übung 1: Wiederholung Wahrscheinlichkeitstheorie Übung 1: Wiederholung Wahrscheinlichkeitstheorie Ü1.1 Zufallsvariablen Eine Zufallsvariable ist eine Variable, deren numerischer Wert solange unbekannt ist, bis er beobachtet wird. Der Wert einer Zufallsvariable

Mehr

90-minütige Klausur Statistik für Studierende der Kommunikationswissenschaft

90-minütige Klausur Statistik für Studierende der Kommunikationswissenschaft Prof. Dr. Helmut Küchenhoff SS08 90-minütige Klausur Statistik für Studierende der Kommunikationswissenschaft am 22.7.2008 Anmerkungen Überprüfen Sie bitte sofort, ob Ihre Angabe vollständig ist. Sie sollte

Mehr

Willkommen zur Vorlesung Statistik

Willkommen zur Vorlesung Statistik Willkommen zur Vorlesung Statistik Thema dieser Vorlesung: Varianzanalyse Prof. Dr. Wolfgang Ludwig-Mayerhofer Universität Siegen Philosophische Fakultät, Seminar für Sozialwissenschaften Prof. Dr. Wolfgang

Mehr

Statistische Auswertung:

Statistische Auswertung: Statistische Auswertung: Die erhobenen Daten mittels der selbst erstellten Tests (Surfaufgaben) Statistics Punkte aus dem Punkte aus Surftheorietest Punkte aus dem dem und dem Surftheorietest max.14p.

Mehr

Statistik II für Betriebswirte Vorlesung 3

Statistik II für Betriebswirte Vorlesung 3 PD Dr. Frank Heyde TU Bergakademie Freiberg Institut für Stochastik Statistik II für Betriebswirte Vorlesung 3 5. November 2013 Beispiel: Aktiensplit (Aczel & Sounderpandan, Aufg. 14-28) Ein Börsenanalyst

Mehr

Auswerten mit Excel. Viele Video-Tutorials auf Youtube z.b. http://www.youtube.com/watch?v=vuuky6xxjro

Auswerten mit Excel. Viele Video-Tutorials auf Youtube z.b. http://www.youtube.com/watch?v=vuuky6xxjro Auswerten mit Excel Viele Video-Tutorials auf Youtube z.b. http://www.youtube.com/watch?v=vuuky6xxjro 1. Pivot-Tabellen erstellen: In der Datenmaske in eine beliebige Zelle klicken Registerkarte Einfügen

Mehr

Modul G.1 WS 07/08: Statistik

Modul G.1 WS 07/08: Statistik Modul G.1 WS 07/08: Statistik 10.01.2008 1 2 Test Anwendungen Der 2 Test ist eine Klasse von Verfahren für Nominaldaten, wobei die Verteilung der beobachteten Häufigkeiten auf zwei mehrfach gestufte Variablen

Mehr

Einführung in die Korrelationsrechnung

Einführung in die Korrelationsrechnung Einführung in die Korrelationsrechnung Sven Garbade Fakultät für Angewandte Psychologie SRH Hochschule Heidelberg sven.garbade@hochschule-heidelberg.de Statistik 1 S. Garbade (SRH Heidelberg) Korrelationsrechnung

Mehr

Bivariate Analyse: Gemeinsame (bivariate) Häufigkeitstabelle. Sie wird auch Kontingenz-, Assoziations- oder Korrelationstabelle (f b )genannt.

Bivariate Analyse: Gemeinsame (bivariate) Häufigkeitstabelle. Sie wird auch Kontingenz-, Assoziations- oder Korrelationstabelle (f b )genannt. Bivariate Analyse: Tabellarische Darstellung: Gemeinsame (bivariate) Häufigkeitstabelle. Sie wird auch Kontingenz-, Assoziations- oder Korrelationstabelle (f b )genannt. Beispiel: Häufigkeitsverteilung

Mehr

Willkommen zur Vorlesung Statistik

Willkommen zur Vorlesung Statistik Willkommen zur Vorlesung Statistik Thema dieser Vorlesung: Maßzahlen für zentrale Tendenz, Streuung und andere Eigenschaften von Verteilungen Prof. Dr. Wolfgang Ludwig-Mayerhofer Universität Siegen Philosophische

Mehr

Klausur: Einführung in die Statistik

Klausur: Einführung in die Statistik 1 Lösungen immer unter die jeweiligen Aufgaben schreiben. Bei Platzmangel auf die Rückseite schreiben (dann Nummer der bearbeiteten Aufgabe mit anmerken!!!). Lösungen, die nicht auf den Aufgabenblättern

Mehr

Herzlich Willkommen zur Vorlesung Statistik

Herzlich Willkommen zur Vorlesung Statistik Herzlich Willkommen zur Vorlesung Statistik Thema dieser Vorlesung: Kovarianz und Korrelation Prof. Dr. Wolfgang Ludwig-Mayerhofer Universität Siegen Philosophische Fakultät, Seminar für Sozialwissenschaften

Mehr

Grundlagen der Datenanalyse am Beispiel von SPSS

Grundlagen der Datenanalyse am Beispiel von SPSS Grundlagen der Datenanalyse am Beispiel von SPSS Einführung Dipl. - Psych. Fabian Hölzenbein hoelzenbein@psychologie.uni-freiburg.de Einführung Organisatorisches Was ist Empirie? Was ist Statistik? Dateneingabe

Mehr

Parametrische vs. Non-Parametrische Testverfahren

Parametrische vs. Non-Parametrische Testverfahren Parametrische vs. Non-Parametrische Testverfahren Parametrische Verfahren haben die Besonderheit, dass sie auf Annahmen zur Verteilung der Messwerte in der Population beruhen: die Messwerte sollten einer

Mehr

Einführung in die Statistik für Politikwissenschaftler Sommersemester 2011

Einführung in die Statistik für Politikwissenschaftler Sommersemester 2011 Einführung in die Statistik für Politikwissenschaftler Sommersemester 2011 Es können von den Antworten alle, mehrere oder keine Antwort(en) richtig sein. Nur bei einer korrekten Antwort (ohne Auslassungen

Mehr

Willkommen zur Vorlesung Statistik

Willkommen zur Vorlesung Statistik Willkommen zur Vorlesung Statistik Thema dieser Vorlesung: Analyse von Kreuztabellen Prof. Dr. Wolfgang Ludwig-Mayerhofer Universität Siegen Philosophische Fakultät, Seminar für Sozialwissenschaften Prof.

Mehr

Univariate Lineare Regression. (eine unabhängige Variable)

Univariate Lineare Regression. (eine unabhängige Variable) Univariate Lineare Regression (eine unabhängige Variable) Lineare Regression y=a+bx Präzise lineare Beziehung a.. Intercept b..anstieg y..abhängige Variable x..unabhängige Variable Lineare Regression y=a+bx+e

Mehr

Analog zu Aufgabe 16.1 werden die Daten durch folgenden Befehl eingelesen: > kredit<-read.table("c:\\compaufg\\kredit.

Analog zu Aufgabe 16.1 werden die Daten durch folgenden Befehl eingelesen: > kredit<-read.table(c:\\compaufg\\kredit. Lösung 16.3 Analog zu Aufgabe 16.1 werden die Daten durch folgenden Befehl eingelesen: > kredit

Mehr

B. Heger / R. Prust: Quantitative Methoden der empirischen Sozialforschung (Master Modul 1.3)

B. Heger / R. Prust: Quantitative Methoden der empirischen Sozialforschung (Master Modul 1.3) B. Heger / R. Prust: Quantitative Methoden der empirischen Sozialforschung (Master Modul 1.3) Übung 1 (mit SPSS-Ausgabe) 1. Erstellen Sie eine einfache Häufigkeitsauszählung der Variable V175 ( des/der

Mehr

Deskriptive Statistik

Deskriptive Statistik Deskriptive Statistik [descriptive statistics] Ziel der deskriptiven (beschreibenden) Statistik einschließlich der explorativen Datenanalyse [exploratory data analysis] ist zunächst die übersichtliche

Mehr

Bachelorabschlussseminar Dipl.-Kfm. Daniel Cracau

Bachelorabschlussseminar Dipl.-Kfm. Daniel Cracau 1 Einführung in die statistische Datenanalyse Bachelorabschlussseminar Dipl.-Kfm. Daniel Cracau 2 Gliederung 1.Grundlagen 2.Nicht-parametrische Tests a. Mann-Whitney-Wilcoxon-U Test b. Wilcoxon-Signed-Rank

Mehr

6. METRISCHE UND KATEGORIALE MERKMALE

6. METRISCHE UND KATEGORIALE MERKMALE 6. METRISCHE UND KATEGORIALE MERKMALE wenn an einer Beobachtungseinheit eine (oder mehrere) metrische und eine (oder mehrere) kategoriale Variable(n) erhoben wurden Beispiel: Haushaltsarbeit von Teenagern

Mehr

Einfache Statistiken in Excel

Einfache Statistiken in Excel Einfache Statistiken in Excel Dipl.-Volkswirtin Anna Miller Bergische Universität Wuppertal Schumpeter School of Business and Economics Lehrstuhl für Internationale Wirtschaft und Regionalökonomik Raum

Mehr

Abhängigkeit zweier Merkmale

Abhängigkeit zweier Merkmale Abhängigkeit zweier Merkmale Johannes Hain Lehrstuhl für Mathematik VIII Statistik 1/33 Allgemeine Situation Neben der Untersuchung auf Unterschiede zwischen zwei oder mehreren Untersuchungsgruppen hinsichtlich

Mehr

Statistische Grundlagen I

Statistische Grundlagen I Statistische Grundlagen I Arten der Statistik Zusammenfassung und Darstellung von Daten Beschäftigt sich mit der Untersuchung u. Beschreibung von Gesamtheiten oder Teilmengen von Gesamtheiten durch z.b.

Mehr

Felix-Nicolai Müller. Seminar Fragebogenmethodik - WS2009/2010 - Universität Trier Dr. Dirk Kranz 24.11.2009

Felix-Nicolai Müller. Seminar Fragebogenmethodik - WS2009/2010 - Universität Trier Dr. Dirk Kranz 24.11.2009 Cohen s Kappa Felix-Nicolai Müller Seminar Fragebogenmethodik - WS2009/2010 - Universität Trier Dr. Dirk Kranz 24.11.2009 Felix-Nicolai Müller Cohen s Kappa 24.11.2009 1 / 21 Inhaltsverzeichnis 1 2 3 4

Mehr

Kapitel 3. Zufallsvariable. Wahrscheinlichkeitsfunktion, Dichte und Verteilungsfunktion. Erwartungswert, Varianz und Standardabweichung

Kapitel 3. Zufallsvariable. Wahrscheinlichkeitsfunktion, Dichte und Verteilungsfunktion. Erwartungswert, Varianz und Standardabweichung Kapitel 3 Zufallsvariable Josef Leydold c 2006 Mathematische Methoden III Zufallsvariable 1 / 43 Lernziele Diskrete und stetige Zufallsvariable Wahrscheinlichkeitsfunktion, Dichte und Verteilungsfunktion

Mehr

Es können keine oder mehrere Antworten richtig sein. Eine Frage ist NUR dann richtig beantwortet, wenn ALLE richtigen Antworten angekreuzt wurden.

Es können keine oder mehrere Antworten richtig sein. Eine Frage ist NUR dann richtig beantwortet, wenn ALLE richtigen Antworten angekreuzt wurden. Teil III: Statistik Alle Fragen sind zu beantworten. Es können keine oder mehrere Antworten richtig sein. Eine Frage ist NUR dann richtig beantwortet, wenn ALLE richtigen Antworten angekreuzt wurden. Wird

Mehr

Grundbegriffe der Beschreibenden Statistik

Grundbegriffe der Beschreibenden Statistik Grundbegriffe der Beschreibenden Statistik 1. Datenmatrix und Messniveaus...3 1.1. Merkmale, Datenmatrix, uni- und multivariate Analysen...3 1.2. Messniveaus (Skalentypen)...4 2. Ausgewählte Verfahren

Mehr

E ektgrößen Metaanalysen. Zusammenhänge und Unterschiede quantifizieren E ektgrößen

E ektgrößen Metaanalysen. Zusammenhänge und Unterschiede quantifizieren E ektgrößen DAS THEMA: EFFEKTGRÖßEN UND METAANALYSE E ektgrößen Metaanalysen Zusammenhänge und Unterschiede quantifizieren E ektgrößen Was ist ein E ekt? Was sind E ektgrößen? Berechnung von E ektgrößen Interpretation

Mehr

Zusammenhänge zwischen metrischen Merkmalen

Zusammenhänge zwischen metrischen Merkmalen Zusammenhänge zwischen metrischen Merkmalen Darstellung des Zusammenhangs, Korrelation und Regression Daten liegen zu zwei metrischen Merkmalen vor: Datenpaare (x i, y i ), i = 1,..., n Beispiel: x: Anzahl

Mehr

Grundlagen der Inferenzstatistik

Grundlagen der Inferenzstatistik Grundlagen der Inferenzstatistik (Induktive Statistik oder schließende Statistik) Dr. Winfried Zinn 1 Deskriptive Statistik versus Inferenzstatistik Die Deskriptive Statistik stellt Kenngrößen zur Verfügung,

Mehr

Profil A 49,3 48,2 50,7 50,9 49,8 48,7 49,6 50,1 Profil B 51,8 49,6 53,2 51,1 51,1 53,4 50,7 50 51,5 51,7 48,8

Profil A 49,3 48,2 50,7 50,9 49,8 48,7 49,6 50,1 Profil B 51,8 49,6 53,2 51,1 51,1 53,4 50,7 50 51,5 51,7 48,8 1. Aufgabe: Eine Reifenfirma hat für Winterreifen unterschiedliche Profile entwickelt. Bei jeweils gleicher Geschwindigkeit und auch sonst gleichen Bedingungen wurden die Bremswirkungen gemessen. Die gemessenen

Mehr

Teil I: Deskriptive Statistik

Teil I: Deskriptive Statistik Teil I: Deskriptive Statistik 2 Grundbegriffe 2.1 Merkmal und Stichprobe 2.2 Skalenniveau von Merkmalen 2.3 Geordnete Stichproben und Ränge 2.1 Merkmal und Stichprobe An (geeignet ausgewählten) Untersuchungseinheiten

Mehr

8. Methoden der klassischen multivariaten Statistik

8. Methoden der klassischen multivariaten Statistik 8. Methoden der klassischen multivariaten Statistik 8.1. Darstellung von Daten Voraussetzungen auch in diesem Kapitel: Grundgesamtheit (Datenraum) Ω von Objekten (Fällen, Instanzen), denen J-Tupel von

Mehr

Modul G.1 WS 07/08: Statistik 17.01.2008 1. Die Korrelation ist ein standardisiertes Maß für den linearen Zusammenhangzwischen zwei Variablen.

Modul G.1 WS 07/08: Statistik 17.01.2008 1. Die Korrelation ist ein standardisiertes Maß für den linearen Zusammenhangzwischen zwei Variablen. Modul G.1 WS 07/08: Statistik 17.01.2008 1 Wiederholung Kovarianz und Korrelation Kovarianz = Maß für den linearen Zusammenhang zwischen zwei Variablen x und y Korrelation Die Korrelation ist ein standardisiertes

Mehr

Analytische Statistik I. Statistische Methoden in der Korpuslinguistik Heike Zinsmeister WS 2009/10

Analytische Statistik I. Statistische Methoden in der Korpuslinguistik Heike Zinsmeister WS 2009/10 Analytische Statistik I Statistische Methoden in der Korpuslinguistik Heike Zinsmeister WS 2009/10 Testen Anpassungstests (goodness of fit) Weicht eine gegebene Verteilung signifikant von einer bekannten

Mehr

Prüfung aus Statistik 1 für SoziologInnen- Gruppe A

Prüfung aus Statistik 1 für SoziologInnen- Gruppe A Prüfung aus Statistik 1 für SoziologInnen- Gruppe A 26. Juni 2012 Gesamtpunktezahl =80 Prüfungsdauer: 2 Stunden 1) Wissenstest (maximal 20 Punkte) Lösungen Kreuzen ( ) Sie die jeweils richtige Antwort

Mehr

fh management, communication & it Constantin von Craushaar fh-management, communication & it Statistik Angewandte Statistik

fh management, communication & it Constantin von Craushaar fh-management, communication & it Statistik Angewandte Statistik fh management, communication & it Folie 1 Überblick Grundlagen (Testvoraussetzungen) Mittelwertvergleiche (t-test,..) Nichtparametrische Tests Korrelationen Regressionsanalyse... Folie 2 Überblick... Varianzanalyse

Mehr

Einführung in die Geostatistik (2) Fred Hattermann (Vorlesung), hattermann@pik-potsdam.de Michael Roers (Übung), roers@pik-potsdam.

Einführung in die Geostatistik (2) Fred Hattermann (Vorlesung), hattermann@pik-potsdam.de Michael Roers (Übung), roers@pik-potsdam. Einführung in die Geostatistik () Fred Hattermann (Vorlesung), hattermann@pik-potsdam.de Michael Roers (Übung), roers@pik-potsdam.de Gliederung Allgemeine Statistik. Deskriptive Statistik. Wahrscheinlichkeitstheorie.3

Mehr

Bivariater Zusammenhang in der Mehrfeldertafel PEΣO

Bivariater Zusammenhang in der Mehrfeldertafel PEΣO Bivariater Zusammenhang in der Mehrfeldertafel PEΣO 9. November 2001 Bivariate Häufigkeitsverteilungen in Mehrfeldertabellen In der Mehrfeldertabelle werden im Gegensatz zur Vierfeldertabelle keine dichotomen

Mehr

Statistik im Bachelor-Studium der BWL und VWL

Statistik im Bachelor-Studium der BWL und VWL Max C. Wewel Statistik im Bachelor-Studium der BWL und VWL Methoden, Anwendung, Interpretation Mit herausnehmbarer Formelsammlung ein Imprint von Pearson Education München Boston San Francisco Harlow,

Mehr

Skriptum zur Veranstaltung. Quantitative Methoden (Mathematik/Statistik) Teil Induktive Statistik. 1. Version (mehr Draft als Skriptum)

Skriptum zur Veranstaltung. Quantitative Methoden (Mathematik/Statistik) Teil Induktive Statistik. 1. Version (mehr Draft als Skriptum) Skriptum zur Veranstaltung Quantitative Methoden (Mathematik/Statistik) Teil Induktive Statistik 1. Version (mehr Draft als Skriptum) Anmerkungen, Aufzeigen von Tippfehlern und konstruktive Kritik erwünscht!!!

Mehr

Grundlagen der Datenanalyse

Grundlagen der Datenanalyse Schematischer Überblick zur Behandlung quantitativer Daten Theorie und Modellbildung Untersuchungsdesign Codierung / Datenübertragung (Erstellung einer Datenmatrix) Datenerhebung Fehlerkontrolle / -behebung

Mehr

PROC FREQ für Kontingenztafeln

PROC FREQ für Kontingenztafeln zum Überprüfen von Zusammenhängen zweier qualitativer Merkmale Allgemeine Form: PROC FREQ DATA=name Optionen ; TABLES (variablenliste) * (variablenliste) / Optionen ; Beispiel und Beschreibung der Programm-Statements:

Mehr

Einige Statistische Tests für den Ein- Zwei- und k-stichprobenfall (Nach Sachs, Stat. Meth.)

Einige Statistische Tests für den Ein- Zwei- und k-stichprobenfall (Nach Sachs, Stat. Meth.) ue biostatistik: nichtparametrische testverfahren / ergänzung 1/6 h. Lettner / physik Statistische Testverfahren Einige Statistische Tests für den Ein- Zwei- und k-stichprobenfall (Nach Sachs, Stat. Meth.)

Mehr

Psychologische Methodenlehre und Statistik II

Psychologische Methodenlehre und Statistik II Psychologische Methodenlehre und Statistik II Pantelis Christodoulides & Karin Waldherr 9. Juni 2010 Pantelis Christodoulides & Karin Waldherr Psychologische Methodenlehre und Statistik II 1/47 Allgemeines

Mehr

Methoden Quantitative Datenanalyse

Methoden Quantitative Datenanalyse Leitfaden Universität Zürich ISEK - Andreasstrasse 15 CH-8050 Zürich Telefon +41 44 635 22 11 Telefax +41 44 635 22 19 www.isek.uzh.ch 11. September 2014 Methoden Quantitative Datenanalyse Vorbereitung

Mehr

Dr. habil. Rüdiger Jacob Methoden und Techniken der empirischen Sozialforschung Vorlesung mit Diskussion

Dr. habil. Rüdiger Jacob Methoden und Techniken der empirischen Sozialforschung Vorlesung mit Diskussion Dr. habil. Rüdiger Jacob Methoden und Techniken der empirischen Sozialforschung Vorlesung mit Diskussion 4. Messtheorie Messen in den Sozialwissenschaften, Operationalisierung und Indikatoren, Messniveaus,

Mehr

Elisabeth Raab-Steiner/Michael Benesch. Der Fragebogen. Von der Forschungsidee zur SPSS/PASW-Auswertung. 2., aktualisierte Auflage. facultas.

Elisabeth Raab-Steiner/Michael Benesch. Der Fragebogen. Von der Forschungsidee zur SPSS/PASW-Auswertung. 2., aktualisierte Auflage. facultas. Elisabeth Raab-Steiner/Michael Benesch Der Fragebogen Von der Forschungsidee zur SPSS/PASW-Auswertung 2., aktualisierte Auflage facultas.wuv Inhaltsverzeichnis 1 Elementare Definitionen 11 1.1 Deskriptive

Mehr

Methoden der empirischen Sozialforschung I

Methoden der empirischen Sozialforschung I Methoden der empirischen Sozialforschung I Annelies Blom, PhD TU Kaiserslautern Wintersemester 2011/12 Übersicht Quantitative Datenauswertung: deskriptive und induktive Statistik Wiederholung: Die wichtigsten

Mehr

Tabelle 6a: Deskriptive Statistiken der metrischen Variablen

Tabelle 6a: Deskriptive Statistiken der metrischen Variablen Ergebnisse 77 5 Ergebnisse Das folgende Kapitel widmet sich der statistischen Auswertung der Daten zur Ü- berprüfung der Hypothesen. Die hier verwendeten Daten wurden mit den in 4.3 beschriebenen Instrumenten

Mehr

3. Der t-test. Der t-test

3. Der t-test. Der t-test Der t-test 3 3. Der t-test Dieses Kapitel beschäftigt sich mit einem grundlegenden statistischen Verfahren zur Auswertung erhobener Daten: dem t-test. Der t-test untersucht, ob sich zwei empirisch gefundene

Mehr

Inhaltsverzeichnis. Regressionsanalyse. http://mesosworld.ch - Stand vom: 20.1.2010 1

Inhaltsverzeichnis. Regressionsanalyse. http://mesosworld.ch - Stand vom: 20.1.2010 1 Inhaltsverzeichnis Regressionsanalyse... 2 Lernhinweise... 2 Einführung... 2 Theorie (1-8)... 2 1. Allgemeine Beziehungen... 3 2. 'Best Fit'... 3 3. 'Ordinary Least Squares'... 4 4. Formel der Regressionskoeffizienten...

Mehr

Teil I Beschreibende Statistik 29

Teil I Beschreibende Statistik 29 Vorwort zur 2. Auflage 15 Vorwort 15 Kapitel 0 Einführung 19 0.1 Methoden und Aufgaben der Statistik............................. 20 0.2 Ablauf statistischer Untersuchungen..............................

Mehr

Webergänzung zu Kapitel 10

Webergänzung zu Kapitel 10 Webergänzung zu Kapitel 10 10.1.4 Varianzanalyse (ANOVA: analysis of variance) Im Kapitel 10 haben wir uns hauptsächlich mit Forschungsbeispielen beschäftigt, die nur zwei Ergebnissätze hatten (entweder

Mehr

Klausur Statistik Lösungshinweise

Klausur Statistik Lösungshinweise Klausur Statistik Lösungshinweise Prüfungsdatum: 1. Juli 2015 Prüfer: Etschberger, Heiden, Jansen Studiengang: IM und BW Aufgabe 1 14 Punkte Ein Freund von Ihnen hat über einen Teil seiner Daten, die er

Mehr

Sozialwissenschaftliche Fakultät der Universität Göttingen. Sommersemester 2009. Statistik mit SPSS

Sozialwissenschaftliche Fakultät der Universität Göttingen. Sommersemester 2009. Statistik mit SPSS Sommersemester 2009 Statistik mit SPSS 15. Mai 2009 15. Mai 2009 Statistik Dozentin: mit Esther SPSSOchoa Fernández 1 Überblick 1. Korrelationsanalysen Kovariation und Kovarianz Korrelation: - Interpretation

Mehr

Kapitel 13 Häufigkeitstabellen

Kapitel 13 Häufigkeitstabellen Kapitel 13 Häufigkeitstabellen Die gesammelten und erfaßten Daten erscheinen in der Datendatei zunächst als unübersichtliche Liste von Werten. In dieser Form sind die Daten jedoch wenig aussagekräftig

Mehr

2. Korrelation, lineare Regression und multiple Regression

2. Korrelation, lineare Regression und multiple Regression multiple 2.2 Lineare 2.2 Lineare 1 / 130 2.2 Lineare 2 / 130 2.1 Beispiel: Arbeitsmotivation Untersuchung zur Motivation am Arbeitsplatz in einem Chemie-Konzern 25 Personen werden durch Arbeitsplatz zufällig

Mehr