5 Assoziationsmessung in Kontingenztafeln

Größe: px
Ab Seite anzeigen:

Download "5 Assoziationsmessung in Kontingenztafeln"

Transkript

1 5 Assoziationsmessung in Kontingenztafeln

2 Multivariate Merkmale Die Analyse eindimensionaler Merkmale ist nur der allererste Schritt zur Beschreibung der Daten. Meist ist die Analyse von Zusammenhängen zwischen Merkmalen von grösserem inhaltlichen Interesse. Beispiele für typische Fragestellung: Beeinflusst das Geschlecht das Erwerbseinkommen? Gibt es einen Zusammenhang zwischen Schichtzugehörigkeit (als etwas veralteter, dennoch klassischer soziologischer Begriff) und sozialem Engagement? Spielt die Stärke der Kirchenbindung eine Rolle bei der Parteienpräferenz? Haben Studierende mit guten Mathematikvorkenntnissen bessere Statistiknoten?

3 226 Hierzu werden an jeder Einheit mehrere Merkmale erhoben und ihre Ausprägungen auch gemeinsam analysiert (z.b. wird das Geschlecht der i-ten Person mit ihrem Einkommen in Beziehung gesetzt). Hat man z.b. die Merkmale X,Y,Z und analysiert sie gemeinsam, so nennt man das Paar(X, Y) bzw. das Tripel(X, Y, Z) ein zweidimensionales(bivariates) bzw. dreidimensionales Merkmal (trivariates) Merkmal. Allgemein spricht man von mehrdimensionalen Merkmalen. (X,Y) : Ω (W X W X ) ω (X(ω),Y(ω))

4 227 Achtung: Die später folgenden statistischen Verfahren messen die Stärke von Zusammenhängen, aber erlauben keine Aussagen über Kausalität! Ob eine kausale Interpretation des Zusammenhangs zulässig ist, hängt davon ab, wie die Daten erhoben wurden. Statistische Zusammenhangsmaße können nicht klären: die Richtung des Zusammenhangs (was ist Ursache, was Wirkung?) Längsschnitt-Studie, cross-lag Design ob eine dritte, evtl. unbeobachtete Variable den Zusammenhang verursacht Experiment

5 Kontingenztafeln und bedingte Verteilungen Gemeinsame Verteilung, Randverteilung, Kontingenztafel Betrachtet wird ein zweidimensionales Merkmal (X,Y) bestehend aus den diskreten Merkmalen X und Y und die zugehörige Urliste (x 1,y 1 ),(x 2,y 2 ),...,(x n,y n ). Wir wollen ferner annehmen, dass X und Y nur endlich viele (wenige), verschiedene Werte a 1,...,a i,...,a k bzw. b 1,...,b j,...b m annehmen können.

6 Anmerkung: In vielen Büchern (v.a. zur induktiven Statistik) wird statt a 1,...,a k auch x 1,...,x k und analog statt b 1,...,b m auch y 1,...,y m geschrieben. Bei uns sind aber die (x i,y i ) Werte der Urliste, x i also der Wert der i-ten Einheit. Daraus ergibt sich zwar die Doppeldeutigkeit der Laufindizes i und j, wir bleiben jedoch bei dieser Notation um Einheitlichkeit mit Fahrmeir et al. (2009) und Jann (2005) herzustellen. 229

7 230 Beispiel (fiktiv): Fahrzeugmodell X = aggressives Fahrverhalten Y = 1, Kompaktklasse 2, Mittelklasse 3, Oberklasse { 1, ja 2, nein Typische Urliste des zweidimensionalen Merkmals (X, Y): (3,1),(2,2),(2,1),(3,1),(3,2),(3,1),(1,2),(1,1),(1,1),(1,2),(3,1),(3,1)

8 231 Einheit X Y

9 232 Achtung: Tupel sind im Gegensatz zu Mengen geordnete Anordnungen von Zahlen Die Tupel sind gemeinsam indiziert

10 233 Gemeinsame relative und absolute Häufigkeitsverteilung: h ij = h(a i,b j ), i = 1,...,k, j = 1,...,m, Anzahl von Beobachtungen mit x = a i und y = b j. f ij = h ij /n = f(a i,b j ), i = 1,...,k, j = 1,...,m, Anteil von Beobachtungen mit x = a i und y = b j. Man nennt (h ij ),i = 1,...,k,j = 1,...,m und (f ij ) die gemeinsame Verteilung von (X, Y) in absoluten bzw. relativen Häufigkeiten.

11 234 Kontingenztafel / Kontingenztabelle / Kreuztabelle: Darstellung der Häufigkeiten in Form einer (k m)-dimensionalen Häufigkeitstabelle b 1 b j b m a 1 h 11 h 1j h 1m h 1 a 2 h 21 h 2j h 2m h a i h i1 h ij h im h i..... a k h k1 h kj h km h k h 1 h j h m n

12 235 Der Punkt steht für Summation über den entsprechenden Index. Es ergeben sich die Randverteilungen h i = m j=1 h ij = h i h im = h(a i ), i = 1,...,k, für X und h j = k i=1 h ij = h 1j +...+h kj = h(b j ), j = 1,...,m, für Y. Es gilt also:

13 236 h i ist die absolute Häufigkeit von a i, h j ist die absolute Häufigkeit von b j. h i = m h ij, j=1 h j = k h ij i=1 Also ist h i die i-te Zeilensumme, h j die j-te Spaltensumme (daher der Name Randhäufigkeiten).

14 237 Kontingenztafel der relativen Häufigkeitsverteilung: b 1 b j b m a 1 f 11 f 1j f 1m f 1 a 2 f 21 f 2j f 2m f a i f i1 f ij f im f i..... a k f k1 f kj f km f k f 1 f j f m 1

15 238 mit der relativen Häufigkeiten f ij = h ij n und den Randverteilungen und f i = h i n = f i1+...+f im = f(a i ), i = 1,...,k, für X f j = h j n = f 1j +...+f kj = f(b j ), j = 1,...,m, für Y. Beispiel: Aggressives Fahren und Fahrzeugmodell (fiktiv)

16 239 Beachte: Aus der gemeinsamen Verteilung kann man die Randverteilungen berechnen (aber nicht umgekehrt, s.u.). Beispiel: Wahlabsicht und Bildungsabschluss (ALLBUS 2010: V327, V747). CDU-CSU SPD FDP GRÜNE LINKE NPD ANDERE NICHTW. OHNE ABSCHLUSS VOLKS-,HAUPTSCHULE MITTLERE REIFE FACHHOCHSCHULREIFE HOCHSCHULREIFE ANDERER ABSCHLUSS NOCH SCHUELER

17 240 Bemerkung: Ist k = m = 2 so spricht man von einer Vierfeldertafel. Dabei vereinfachen sich die Tabellen wesentlich, mit der Angabe der Häufigkeit in einer Zelle sind bei gegebenen Randhäufigkeiten auch die Häufigkeiten in den anderen Zellen bestimmt h 11 h 12 h 1 2 h 21 h 22 h 2 h 1 h 2 n z.b. gegeben h 11 h 12 = h 1 h 11 etc.

18 241 Unabhängige und abhängige Variable: Hat man eine Vermutung über die Richtung einer potentiellen Wirkung, so bezeichnet man die Variablen entsprechend als unabhängige (wirkende, erklärende) und abhängige (bewirkte, erklärte) Variable. In der Statistik ist es üblich, die unabhängige Variable mit X zu bezeichnen und die abhängige Variable mit Y, wie gewohnt ist dann Y eine Funktion von X. z.b: unabhängige (X) möglicherweise: Automodell eindeutig: Geschlecht allgemein: unabhängige abhängige (Y) aggressives Fahrverhalten Einkommen abhängige Variable Damit werden die Häufigkeitsverteilungen für feste Werte der unabhängigen Variablen in den Zeilen angegeben.

19 Vorsicht: In einigen sozialwissenschaftlichen Büchern wird entgegen dieser Konvention die unabhängige Variable in den Spalten und die abhängige in den Zeilen abgetragen. 242

20 Ökologischer Fehlschluss Es gibt sehr viele gemeinsame Verteilungen, die zu denselben Randhäufigkeiten passen. Im Beispiel oben passen u.a.: Man sieht also, wie wichtig es zur Feststellung potentieller Zusammenhänge ist, die gemeinsame Verteilung h ij zu kennen, also tatsächlich die Paare (x i,y i ) zu betrachten. Der unzulässige Schluss von der Randverteilung auf Eigenschaften der gemeinsamen Verteilung, also von zwei univariaten Ergebnissen auf ein bivariates, von der Kollektiv- auf die Individualebene, heißt ökologischer Fehlschluss. Kommen zwei Eigenschaften (verschiedene Merkmale) häufig vor, heißt dies nicht notwendig, dass sie gemeinsam häufig vorkommen.

21 Grafische Darstellung der gemeinsamen Verteilung Verschiedene Darstellungsarten: Mosaikplots: Darstellung der gemeinsamen Häufigkeiten h ij als flächentreue Kachelung 3D-Säulendiagramm der gemeinsamen Häufigkeiten h ij normale Säulendiagramme nach einer Variable aufgespalten, d.h. für jeden Wert a i von X werden jeweils die Häufigkeiten h ij bzw. f ij aufgetragen.

22 245 Mosaikplots Grafische Darstellung der gemeinsamen Häufigkeiten zweier diskreter Merkmale. Idee: Teile Quadrat auf in Rechtecke, deren Flächeninhalte f ij entsprechen. Vorgehen: 1. Teile Einheitsquadrat auf in horizontale Streifen deren Höhe proportional zu f i ist. 2. Teile horizontale Streifen in Rechtecke deren Breite für jedes i proportional zu f ij ist.

23 246 Beispiel: Aggressivität & Fahrverhalten Fahrzeugtyp & Fahrverhalten aggro Aggressivität nicht aggro Fahrzeug Oberklasse Mittelklasse Kompakt

24 247

25 248 3D-Säulendiagramm & Heatmaps Grafische Darstellung der gemeinsamen Häufigkeiten zweier diskreter Merkmale, auch erweiterbar auf (quasi)-stetige. Idee: Benutze Merkmalsausprägungen von X, Y als 2-D Koordinatensystem, gemeinsame Häufigkeiten für jede Kombination (a i,b j ) werden graphisch über Höhe oder über Farbe dargestellt.

26 249 Beispiel 1: Habilitationen nach Geschlecht und Fach (nach Fahrmeir et al., 2009). Grundgesamtheit: alle Habilitationen 1993 Geschlecht: X Fächergruppe: Y Sprachw. Rechtsw. Naturw. Kunst Medizin Kulturw. Wirts., Soz weiblich männlich

27 250 3D-Säulendiagramm: Häufigkeit männlich 0 Sprachw./Kulturw. Recht/Wirtschaft/Soz. Naturw. Kunst Medizin weiblich

28 251 Beispiel 2: Wahlabsicht und Bildungsabschluss: Häufigkeit NOCH SCHUELER ANDERER ABSCHLUSS HOCHSCHULREIFE FACHHOCHSCHULREIFE 0 CDU CSU SPD FDP DIE GRUENEN DIE LINKE NPD ANDERE PARTEI WUERDE NICHT WAEHLEN MITTLERE REIFE VOLKS,HAUPTSCHULE OHNE ABSCHLUSS 3D-Säulendiagramm hier ungünstig.

29 252 Oft bessere Alternative: Heatmaps (Häufigkeit wird als Farbe kodiert) OHNE ABSCHLUSS VOLKS,HAUPTSCHULE MITTLERE REIFE Schulabschluss FACHHOCHSCHULREIFE Häufigkeit HOCHSCHULREIFE ANDERER ABSCHLUSS NOCH SCHUELER CDU CSU SPD FDP DIE GRUENEN DIE LINKE Wahlabsicht NPD ANDERE PARTEI WUERDE NICHT WAEHLEN

30 CDU CSU SPD FDP DIE GRUENEN DIE LINKE ANDERE NPD PARTEI WUERDE NICHT WAEHLEN Zum Vergleich der Mosaikplot: OHNE ABSCHLUSS VOLKS,HAUPTSCHULE MITTLERE REIFE FACHHOCHSCHULREIFE HOCHSCHULREIFE NOCH SCHUELER ANDERER ABSCHLUSS 253

31 254 Gestapelte Balkendiagramme & gestapelte skalierte Balkendiagramme Häufigkeit rel. Häufigkeit Fach Sprachw./Kulturw. Recht/Wirtschaft/Soz. Naturw. Kunst Medizin weiblich männlich Geschlecht weiblich männlich Geschlecht

32 Medizin Naturw. Kunst Recht/Wirtschaft/Soz. Sprachw./Kulturw. Medizin Naturw. Kunst Fach Fach Geschlecht weiblich männlich Sprachw./Kulturw. Recht/Wirtschaft/Soz. Häufigkeit rel. Häufigkeit 255

33 Bedingte Häufigkeitsverteilungen Beispiel: Habilitationen nach Geschlecht und Fach (nach Fahrmeir et al., 2007). Grundgesamtheit: alle Habilitationen 1993 Geschlecht: X Fächergruppe: Y Sprachw. Rechtsw. Naturw. Kunst Medizin Kulturw. Wirts., Soz weiblich männlich

34 Zur Interpretation: 257

35 258 Definition: Seien h i > 0 und h j > 0 für alle i,j. Für jedes i = 1,...,k heißt f Y (b 1 a i ) := h i1 = h(a i,b 1 ) h i h(a i ),..., f Y(b m a i ) := h im = h(a i,b m ) h i h(a i ) bedingte (relative) Häufigkeitsverteilung von Y unter der Bedingung X = a i. Analog heißt für jedes j = 1,...,m f X (a 1 b j ) := h 1j = h(a 1,b j ) h j h(b j ),..., f X(a k b j ) := h kj = h(a k,b j ) h j h(b j ) bedingte (relative) Häufigkeitsverteilung von X unter der Bedingung Y = b j.

36 259 Im Beispiel: f X (Frau Habil. in Kunst) = f X (Frau Habil. in Naturw.) = Zu unterscheiden von bzw. f 13 = h 13 n = f Y (Habil. in Kunst Frau) = Die Verwechslung von gemeinsamer und bedingter Verteilung bzw. verschiedener bedingter Verteilungen ist eine häufige Fehlerquelle. Konvention: Bei Vermutung über Richtung des Zusammenhangs betrachtet man vorwiegend die bedingte Verteilung der abhängigen Variablen gegeben die festen Werte der unabhängigen Variable. In diese Richtung geht ja auch die Prognose! Man kennt den Wert der unabhängigen Variablen und will Aussagen über die abhängige machen.

37 Beispiel: Bedingte Verteilung der Fächergruppen gegeben das Geschlecht (f Y (b j a i ) für verschiedene i). 260

38 261 Sprachw. Rechtsw. Naturw. Kunst Medizin Kulturw. Wirts., Soz weiblich männlich Y : b j Sprachw. Rechtsw. Naturw. Kunst Medizin X : a i Kulturw. Wirts., Soz weiblich 1 männlich 2

39 262 f(rechtsw. weiblich) = f(kunst männlich) =

40 263 BedingteVerteilungdesGeschlechtsgegebendie Fachgruppe(f X (a i b j )fürverschiedene j). b j Sprachw. Rechtsw. Naturw. Kunst Medizin a i Kulturw. Wirts., Soz weiblich 1 männlich 2 f X (weiblich Rechtsw.) = f X (männlich Kunst) =

41 264 Nochmals zur Interpretation: 1. f X (weiblich Medizin) =. 2. f X (Medizin weiblich) =. 3. f 15 = f(medizin und weiblich) =. Es liegt jeweils eine andere Grundgesamtheit zu Grunde:

42 265 Bedingte Verteilungen werden automatisch durch relative Häufigkeiten ausgedrückt. Für die Berechnung gilt und analog f(a i b j ) = h ij h j = h ij n h j n f(b j a i ) = h ij h i = f ij f i. = f ij f j

43 266 Beispiel: Wahlabsicht und Bildung. CDU-CSU SPD FDP GRÜNE LINKE NPD ANDERE NICHTW. OHNE ABSCHLUSS VOLKS-,HAUPTSCHULE MITTLERE REIFE FACHHOCHSCHULREIFE HOCHSCHULREIFE ANDERER ABSCHLUSS NOCH SCHUELER

44 267 Bedingt auf Bildung: CDU-CSU SPD FDP DIE GRUENEN DIE LINKE NPD ANDERE NICHTW. OHNE ABSCHLUSS VOLKS-,HAUPTSCHULE MITTLERE REIFE FACHHOCHSCHULREIFE HOCHSCHULREIFE ANDERER ABSCHLUSS NOCH SCHUELER Gesamt

45 NOCH SCHUELER MITTLERE FACHHOCHSCHULREIFE HOCHSCHULREIFE ANDERER ABSCHLUSS VOLKS,HAUPTSCHULE OHNE ABSCHLUSS Schulabschluss 268 Sonntagsfrage CDU CSU SPD FDP DIE GRUENEN DIE LINKE NPD ANDERE PARTEI WUERDE NICHT WAEHLEN rel. Häufigkeit

46 269 Bedingt auf Wahlabsicht: CDU-CSU SPD FDP DIE GRUENEN DIE LINKE NPD ANDERE NICHTW. Gesamt OHNE ABSCHLUSS VOLKS-,HAUPTSCHULE MITTLERE REIFE FACHHOCHSCHULREIFE HOCHSCHULREIFE ANDERER ABSCHLUSS NOCH SCHUELER

47 WUERDE NICHT WAEHLEN NPD ANDERE PARTEI DIE GRUENEN DIE LINKE FDP SPD CDU CSU Sonntagsfrage 270 Schulabschluss OHNE ABSCHLUSS VOLKS,HAUPTSCHULE MITTLERE REIFE FACHHOCHSCHULREIFE HOCHSCHULREIFE ANDERER ABSCHLUSS NOCH SCHUELER rel. Häufigkeit

48 271 Einschub (A. Quatember: Unsinn in den Medien - Vom allzu sorglosen Umgang mit Daten) Man beachte: Es geht nun nicht darum, sich über Fehler anderer Leute lustig zu machen sondern darum, Sie dafür zu sensibilisieren, dass der Umgang gerade mit bedinten Häufigkeiten sehr viele Fehlerquellen mit sich bringt und große Schwierigkeiten macht. Rüstzeug, damit man selber solche Fehler nicht macht und Veröffentlichungen kritisch hinterfragen kann.

49 272

50 273 Bspl. A. Quatember (Institut für angewandte Statistik, Linz): Unsinn in in den Medien - Vom allzu sorglosen Umgang mit Daten (I): ( Man nehme kritisch Stellung zu dem folgenden Zeitungsausschnitt! Quelle: Kronen-Zeitung,

51 274 Bsp. A. Quatember: Unsinn in in den Medien - Vom allzu sorglosen Umgang mit Daten (II): ( Quelle: Der Standard,

52 (Empirische) Unabhängigkeit und χ (Empirische) Unabhängigkeit Durch den Vergleich der bedingten Häufigkeiten mit den Randhäufigkeiten kann man Zusammenhänge beurteilen Illustration an einem Beispiel: (Aggression und Fahrzeugklasse)

53 276 Empirische Unabhängigkeit: Die beiden Komponenten X und Y eines bivariaten Merkmals (X,Y) heißen voneinander (empirisch) unabhängig, falls für alle i = 1,...,k und j = 1,...,m f(b j a i ) = f j = f(b j ) (5.13) und gilt. Satz: f(a i b j ) = f i = f(a i ) (5.14) a) Es genügt, entweder (5.13) oder (5.14) zu überprüfen: Mit einer der beiden Beziehungen gilt auch die andere. b) X und Y sind genau dann empirisch unabhängig, wenn für alle i = 1,...k und alle j = 1,...m gilt: f ij = f i f j (5.15)

54 277 c) Gleichung (5.15) ist äquivalent zu h ij = h i h j n (5.16) Beweis:) DieletzteGleichungistauchäquivalentzu f ij f i = f j,alsozuf(b j a i ) = f j, was a beweist.

55 χ 2 -Abstand Zentrale Idee zur Assoziationsanalyse von Kontingenztafeln: Als Maß verwendet man den sog. χ 2 -Koeffizienten / χ 2 -Abstand. Mit definiert man h ij := h i h j n. χ 2 := = k i=1 m j=1 alle Zellen (h ij h ij ) 2 (5.17) h ij ( ) 2 beob. Häufigk. unter Unabh. zu erwartende Häufigk. unter Unabh. zu erwartende Häufigk.

56 279 Beispiel: Zusammenhang zwischen Geschlecht und Arbeitslosigkeit (fiktiv, nach Wagschal, 1999) Sei Y der Beschäftigungsstatus einer erwerbstätigen Person, X das Geschlecht mit Y = { 1 beschäftigt 2 arbeitslos und X = { 1 weiblich 2 männlich Gemeinsame Häufigkeitsverteilung: Y X

57 280 Zur Bestimmung des χ 2 -Koeffizienten: 1. Bestimme die Randverteilung. 2. Berechne die unter Unabhängigkeit zu erwartenden Häufigkeiten h ij. Man erhält: Die Formel 5.17 gilt für Kreuztabellen beliebiger Größe. Bei Vierfeldertafeln vereinfachen sich die Tabellen wesentlich da ja, mit der Angabe der Häufigkeit in einer Zelle bei gegebenen Randhäufigkeiten auch die Häufigkeiten in den anderen Zellen bestimmt sind.

58 281 Bemerkung: Bei Vierfeldertafeln (2 Zeilen, 2 Spalten) gibt es eine handliche Alternative zur Berechnung von χ 2 : χ 2 = n (h 11h 22 h 12 h 21 ) 2 h 1 h 2 h 1 h 2 (5.18) Veranschaulichung der Formel:

59 χ 2 -basierte Maßzahlen Bemerkungen zum χ 2 -Abstand: Unter empirischer Unabhängigkeit gilt definitionsgemäß χ 2 = 0. Je stärker χ 2 von 0 abweicht, umso stärker ist ceteris paribus, also unter gleichen sonstigen Größen, der Zusammenhang. Der χ 2 -Abstand wird die Grundlage bilden für den in Statistik 2 betrachteten χ 2 -Test. Als Masszahl ist χ 2 hingegen problematisch und nicht direkt interpretierbar, da sein Wert vom Stichprobenumfang n und von der Zeilen- und Spaltenzahl abhängt = geeignet normieren. Es gilt: χ 2 n (min{k,m} 1). Gleichheit gilt genau dann, wenn sich in jeder Spalte bzw. Zeile nur ein von Null verschiedener Eintrag befindet, also z.b. nur auf der Diagonalen von Null verschiedene Einträge aufsetzen. Dies entspräche dann einem perfektem Zusammenhang. Allerdings ist eine solche Extremsituation nicht bei allen Randverteilungen möglich.

60 283 χ 2 -basierte Zusammenhangsmaße a) Kontingenzkoeffizient nach Pearson: K := χ 2 n+χ2. (5.19) b) Korrigierter Kontingenzkoeffizient: K := K K max (5.20) mit K max := min{k,m} 1 min{k, m}

61 284 c) Kontingenzkoeffizient nach Cramér (Cramérs V): V = = χ 2 n (min{k,m} 1) χ 2 maximal möglicher Wert vonχ 2 (5.21) d) Bei der Vierfeldertafel (k = m = 2) gilt V = χ 2 n (min{k,m} 1) = χ 2 n Hierfür ist die Bezeichnung Phi-Koeffizient Φ üblich. Mit (5.18) ergibt sich also Φ = h 11 h 22 h 12 h 21. (5.22) h1 h 2 h 1 h 2

62 285 Lässt man die Betragsstriche weg, so erhält man den signierten Phi-Koeffizienten oder Punkt-Korrelationskoeffizienten Φ s = h 11h 22 h 12 h 21, h1 h 2 h 1 h 2 der häufig ebenfalls als Phi-Koeffizient bezeichnet wird. Φ S kann im Prinzip Werte zwischen -1 und 1 annehmen (ohne -1 und 1 immer erreichen zu können (s.u.), ). Vorteil gegenüber Φ: Zusätzlich ist die Richtung des Zusammenhangs erkennbar: Φ s > 0 und Φ s < 0

63 286 Bemerkungen K, K, V und Φ nehmen Werte zwischen 0 und 1 an, wohingegen χ 2 beliebig große positive Werte annehmen kann. Aufgrund ihrer Unabhängigkeit von n sind K, K, V und Φ prinzipiell zum Vergleich verschiedener Tabellen gleicher Größe geeignet; Φ natürlich nur bei Vierfeldertafeln, wegen ihrer Unabhängigkeit von k und m sind K und V auch zum Vergleich von Tabellen mit unterschiedlicher Zeilen und Spaltenzahl geeignet. Allerdings kann bei gegebener Randverteilung der Wert 1 nicht immer erreicht werden. Im Beispiel können bei insgesamt nur 30 Arbeitslosen nicht alle 80 Männer oder alle 65 Frauen arbeitslos sein. Es kann deshalb aussagekräftiger sein, noch zusätzlich auf die für die gegebene Randverteilung maximal mögliche Abhängigkeit zu normieren (s.u.).

64 287 Berechnung im Beispiel: Beschäftigungsstatus und Geschlecht. Zur Erinnerung: χ 2 = , m = k = 2, n = 150 K = besch. ja nein 1 2 Frauen Männer K max = K = V = Φ s =

65 288 Beispiel 2: Wahlabsicht und Bildungsabschluss (ALLBUS 2010: V327, V747). CDU CSU SPD FDP DIE GRUENEN DIE LINKE ANDERE NPD PARTEI WUERDE NICHT WAEHLEN OHNE ABSCHLUSS VOLKS,HAUPTSCHULE MITTLERE REIFE FACHHOCHSCHULREIFE HOCHSCHULREIFE ANDERER ABSCHLUSS NOCH SCHUELER Zusammenhangsmaße: χ 2 = ; K = 0.264; K = 0.284; V = 0.112

66 289 Beispiel 3: Aggression und Fahrzeugtyp. Fahrzeugtyp & Fahrverhalten aggro Aggressivität nicht aggro Fahrzeug Oberklasse Mittelklasse Kompakt Zusammenhangsmaße: χ 2 = 1.5; K = 0.333; K = 0.471; V = 0.354

67 290 Korrekturverfahren für Φ (Grundidee nach Wagschal (1999), hier in adaptierter Form: normiere auf den maximal möglichen Wert bei den gegebenen Randverteilungen) 1. Denke dir Randverteilungen als fest (gleiches Geschlechterverhältnis, feste Arbeitslosenquote) 2. Bilde die strukturtreue Extremtabelle mit Einträgen h ij, d.h. i. Berechne das Vorzeichen von Φ s : Ist h 11 h 22 h 12 h 21 > 0, so setze min(h 12,h 21 ) auf 0. Ist h 11 h 22 h 12 h 21 < 0, so setze min(h 11,h 22 ) auf 0. ii. Fülle die Tafel entsprechend der Randverteilung auf! 3. Berechne den zugehörigen Phi-Koeffizienten Φ extrem.

68 Berechne den korrigierten (signierten) Phi-Koeffizienten Φ korr := Φ Φ extrem bzw. Φ s,korr := Φ s Φ extrem.

69 292 Berechnung im Beispiel: Y X

5 Assoziationsmessung in Kontingenztafeln

5 Assoziationsmessung in Kontingenztafeln 5 Assoziationsmessung in Kontingenztafeln 51 Multivariate Merkmale 51 Multivariate Merkmale Gerade in der Soziologie ist die Analyse eindimensionaler Merkmale nur der allererste Schritt zur Beschreibung

Mehr

und der Medieninformatik des Nebenfachs Statistik Statistik 1 für Studierende der Soziologie, Thomas Augustin, Fabian Scheipl WS 2012/2013

und der Medieninformatik des Nebenfachs Statistik Statistik 1 für Studierende der Soziologie, Thomas Augustin, Fabian Scheipl WS 2012/2013 Statistik 1 für Studierende der Soziologie, des Nebenfachs Statistik und der Medieninformatik Thomas Augustin, Fabian Scheipl WS 2012/2013 Besonderer Dank gilt Prof. Dr. Thomas Kneib (jetzt Georg-August-Universität

Mehr

5.2.3 Grafische Darstellung der gemeinsamen Verteilung. Verschiedene Darstellungsarten, z.b. als 3D-Säulendiagramm der gemeinsamen Häufigkeiten

5.2.3 Grafische Darstellung der gemeinsamen Verteilung. Verschiedene Darstellungsarten, z.b. als 3D-Säulendiagramm der gemeinsamen Häufigkeiten 5.2.3 Grafische Darstellung der gemeinsamen Verteilung 5.2 Assoziationsmessung in Kontingenztafeln Verschiedene Darstellungsarten, z.b. als 3D-Säulendiagramm der gemeinsamen Häufigkeiten h ij oder normale

Mehr

5.3 (Empirische) Unabhängigkeit und χ 2

5.3 (Empirische) Unabhängigkeit und χ 2 5.3 (Empirische) Unabhängigkeit und χ 2 5.3.1 (Empirische) Unabhängigkeit Durch den Vergleich der bedingten Häufigkeiten mit den Randhäufigkeiten kann man Zusammenhänge beurteilen Illustration an einem

Mehr

5.3 (Empirische) Unabhängigkeit und χ 2

5.3 (Empirische) Unabhängigkeit und χ 2 5.3 (Empirische) Unabhängigkeit und χ 2 5.3 (Empirische) Unabhängigkeit und χ 2 5.3.1 (Empirische) Unabhängigkeit Durch den Vergleich der bedingten Häufigkeiten mit den Randhäufigkeiten kann man Zusammenhänge

Mehr

1 x 1 y 1 2 x 2 y 2 3 x 3 y 3... n x n y n

1 x 1 y 1 2 x 2 y 2 3 x 3 y 3... n x n y n 3.2. Bivariate Verteilungen zwei Variablen X, Y werden gemeinsam betrachtet (an jedem Objekt werden gleichzeitig zwei Merkmale beobachtet) Beobachtungswerte sind Paare von Merkmalsausprägungen (x, y) Beispiele:

Mehr

Zusammenhangsanalyse in Kontingenztabellen

Zusammenhangsanalyse in Kontingenztabellen Zusammenhangsanalyse in Kontingenztabellen Bisher: Tabellarische / graphische Präsentation Jetzt: Maßzahlen für Stärke des Zusammenhangs zwischen X und Y. Chancen und relative Chancen Zunächst 2 2 - Kontingenztafel

Mehr

Bivariater Zusammenhang in der Vierfeldertafel PEΣO

Bivariater Zusammenhang in der Vierfeldertafel PEΣO Bivariater Zusammenhang in der Vierfeldertafel PEΣO 12. Oktober 2001 Zusammenhang zweier Variablen und bivariate Häufigkeitsverteilung Die Bivariate Häufigkeitsverteilung gibt Auskunft darüber, wie zwei

Mehr

5.5 PRE-Maße (Fehlerreduktionsmaße) 6

5.5 PRE-Maße (Fehlerreduktionsmaße) 6 359 5.5 PRE-Maße (Fehlerreduktionsmaße) 6 5.5.1 Die grundlegende Konstruktion Völlig andere, sehr allgemeine Grundidee zur Beschreibung von Zusammenhängen. Grundlegendes Prinzip vieler statistischer Konzepte.

Mehr

erwartete Häufigkeit n=80 davon 50% Frauen fe=40 davon 50% Männer fe=40 Abweichung der beobachteten von den erwarteten Häufigkeiten:

erwartete Häufigkeit n=80 davon 50% Frauen fe=40 davon 50% Männer fe=40 Abweichung der beobachteten von den erwarteten Häufigkeiten: Verfahren zur Analyse von Nominaldaten Chi-Quadrat-Tests Vier-Felder Kontingenztafel Mehrfach gestufte Merkmale Cramers V, Kontingenzkoeffizient, Phi-Koeffizient Muster aller Chi-Quadrat-Verfahren eine

Mehr

Einführung in die sozialwissenschaftliche Statistik

Einführung in die sozialwissenschaftliche Statistik Einführung in die sozialwissenschaftliche Statistik Sitzung 4 Bivariate Deskription Heinz Leitgöb in Vertretung von Katrin Auspurg Sommersemester 2015 04.05.2015 Überblick 1. Kontingenztabellen 2. Assoziationsmaße

Mehr

Bivariate Analyse: Gemeinsame (bivariate) Häufigkeitstabelle. Sie wird auch Kontingenz-, Assoziations- oder Korrelationstabelle (f b )genannt.

Bivariate Analyse: Gemeinsame (bivariate) Häufigkeitstabelle. Sie wird auch Kontingenz-, Assoziations- oder Korrelationstabelle (f b )genannt. Bivariate Analyse: Tabellarische Darstellung: Gemeinsame (bivariate) Häufigkeitstabelle. Sie wird auch Kontingenz-, Assoziations- oder Korrelationstabelle (f b )genannt. Beispiel: Häufigkeitsverteilung

Mehr

5.5 PRE-Maße (Fehlerreduktionsmaße)

5.5 PRE-Maße (Fehlerreduktionsmaße) 5.5 PRE-Maße (Fehlerreduktionsmaße) 5.5.1 Die grundlegende Konstruktion Völlig andere, sehr allgemeine Grundidee zur Beschreibung von Zusammenhängen. Grundlegendes Prinzip vieler statistischer Konzepte.

Mehr

Vl Zweidimensionale Verteilungen Zusammenhangsmaße 3.1. Zwei dimensionale Häufigkeitstabellen. Absolute Häufigkeitstabelle

Vl Zweidimensionale Verteilungen Zusammenhangsmaße 3.1. Zwei dimensionale Häufigkeitstabellen. Absolute Häufigkeitstabelle Vl. 5.12.11 3. Zweidimensionale Verteilungen Zusammenhangsmaße 3.1. Zwei dimensionale Häufigkeitstabellen schnell mittel langsam 3 Arten von Häufigkeitstabellen: Absolute Häufigkeitstabelle relative Häufigkeitstabelle

Mehr

Grundlagen der empirischen Sozialforschung

Grundlagen der empirischen Sozialforschung Grundlagen der empirischen Sozialforschung Sitzung 11 - Datenanalyseverfahren Jan Finsel Lehrstuhl für empirische Sozialforschung Prof. Dr. Petra Stein 5. Januar 2009 1 / 22 Online-Materialien Die Materialien

Mehr

Statistik I für Betriebswirte Vorlesung 10

Statistik I für Betriebswirte Vorlesung 10 Statistik I für Betriebswirte Vorlesung 10 Dr. Andreas Wünsche TU Bergakademie Freiberg Institut für Stochastik 15. Juni 2017 Dr. Andreas Wünsche Statistik I für Betriebswirte Vorlesung 10 Version: 13.

Mehr

Skalenniveaus =,!=, >, <, +, -

Skalenniveaus =,!=, >, <, +, - ZUSAMMENHANGSMAßE Skalenniveaus Nominalskala Ordinalskala Intervallskala Verhältnisskala =,!= =,!=, >, < =,!=, >, ,

Mehr

Kapitel VIII - Mehrdimensionale Merkmale

Kapitel VIII - Mehrdimensionale Merkmale Institut für Volkswirtschaftslehre (ECON) Lehrstuhl für Ökonometrie und Statistik Kapitel VIII - Mehrdimensionale Merkmale Deskriptive Statistik Prof. Dr. W.-D. Heller Hartwig Senska Carlo Siebenschuh

Mehr

Leseprobe. Michael Sachs. Wahrscheinlichkeitsrechnung und Statistik. für Ingenieurstudenten an Fachhochschulen. ISBN (Buch):

Leseprobe. Michael Sachs. Wahrscheinlichkeitsrechnung und Statistik. für Ingenieurstudenten an Fachhochschulen. ISBN (Buch): Leseprobe Michael Sachs Wahrscheinlichkeitsrechnung und Statistik für Ingenieurstudenten an Fachhochschulen ISBN (Buch): 978-3-446-43797-5 ISBN (E-Book): 978-3-446-43732-6 Weitere Informationen oder Bestellungen

Mehr

0 Einführung: Was ist Statistik

0 Einführung: Was ist Statistik 0 Einführung: Was ist Statistik 1 Datenerhebung und Messung 2 Univariate deskriptive Statistik Häufigkeitsverteilungen Statistische Kennwerte 3 Multivariate Statistik 4 Regression 5 Ergänzungen Deskriptive

Mehr

11. Zusammenhangsmaße für nominale Variablen

11. Zusammenhangsmaße für nominale Variablen Statistik I Übung 11. Zusammenhangsmaße für nominale Variablen Dozent: Jürgen Leibold 1 Evaluation Nominale Zusammenhangsmaße Übersicht Chi-Quadrat Phi Cramers V Nominale Zusammenhangsmaße 3 Randverteilung

Mehr

Bivariate Verteilungen [bivariate data]

Bivariate Verteilungen [bivariate data] Bivariate Verteilungen [bivariate data] Zwei Variablen X, Y werden gemeinsam betrachtet, d.h. an jedem Objekt i werden zwei Merkmale beobachtet. Beobachtungswerte sind Paare/Kombinationen von Merkmalsausprägungen

Mehr

Bivariate Verteilungen

Bivariate Verteilungen Bivariate Verteilungen Tabellarische Darstellung: Bivariate Tabellen entstehen durch Kreuztabulation zweier Variablen. Beispiel: X Y Student(in) Herkunft Fakultät 0001 Europa Jura 000 Nicht-Europa Medizin

Mehr

5 Beschreibung und Analyse empirischer Zusammenhänge

5 Beschreibung und Analyse empirischer Zusammenhänge 5 Beschreibung und Analyse empirischer Zusammenhänge 132 5 Beschreibung und Analyse empirischer Zusammenhänge 5.1 Zusammenhänge zwischen kategorialen Merkmalen 137 5.1.1 Kontingenztabellen 137 Verteilungen

Mehr

Übungsblatt 3: Bivariate Deskription I (Sitzung 4)

Übungsblatt 3: Bivariate Deskription I (Sitzung 4) 1 Übungsblatt 3: Bivariate Deskription I (Sitzung 4) Aufgabe 1 Eine Kreuztabelle beinhaltet unterschiedliche Verteilungen. a) Geben Sie an, wie diese Verteilungen heißen und was sie beinhalten. b) Welche

Mehr

Inhaltsverzeichnis (Ausschnitt)

Inhaltsverzeichnis (Ausschnitt) 4 Zweidimensionale Daten Inhaltsverzeichnis (Ausschnitt) 4 Zweidimensionale Daten Häufigkeitsverteilungen unklassierter Daten Häufigkeitsverteilungen klassierter Daten Bedingte Häufigkeitsverteilungen

Mehr

Statistik I für Betriebswirte Vorlesung 10

Statistik I für Betriebswirte Vorlesung 10 Statistik I für Betriebswirte Vorlesung 10 Prof. Dr. Hans-Jörg Starkloff TU Bergakademie Freiberg Institut für Stochastik 13. Juni 2016 Prof. Dr. Hans-Jörg Starkloff Statistik I für Betriebswirte Vorlesung

Mehr

Wahrscheinlichkeitsrechnung und Statistik

Wahrscheinlichkeitsrechnung und Statistik Wahrscheinlichkeitsrechnung und Statistik Für Ingenieurstudenten an Fachhochschulen von Michael Sachs erweitert Wahrscheinlichkeitsrechnung und Statistik Sachs schnell und portofrei erhältlich bei beck-shopde

Mehr

V a r i a b l e X x 1 x 2 x 3 x 4 Σ y y y Σ Variable Y. V a r i a b l e X

V a r i a b l e X x 1 x 2 x 3 x 4 Σ y y y Σ Variable Y. V a r i a b l e X Ausgangsüberlegung: Verschiedene Kontingenztabellen bei gleicher Randverteilung und gleichem Stichprobenumfang n sind möglich. Beispiel: Variable Y V a r i a b l e X x 1 x x 3 x 4 Σ y 1 60 60 y 0 0 y 3

Mehr

Kreuztabellenanalyse und Assoziationsmaße. Assoziationsmaße. Allgemeines Beispiel Graphiken Notation. Risiken. Drittvariablenkontrolle.

Kreuztabellenanalyse und Assoziationsmaße. Assoziationsmaße. Allgemeines Beispiel Graphiken Notation. Risiken. Drittvariablenkontrolle. FB 1 W. Ludwig-Mayerhofer Zusammenhänge zwischen Merkmalen 1 Kreuztabellenanalyse und FB 1 W. Ludwig-Mayerhofer Zusammenhänge zwischen Merkmalen 2 Kreuztabellen eignen sich zur Darstellung und Analyse

Mehr

6 Korrelations- und Regressionsanalyse: Zusammenhangsanalyse stetiger Merkmale

6 Korrelations- und Regressionsanalyse: Zusammenhangsanalyse stetiger Merkmale 6 Korrelations- und Regressionsanalyse: Zusammenhangsanalyse stetiger Merkmale 397 6.1 Korrelationsanalyse Jetzt betrachten wir bivariate Merkmale (X, Y ), wobei sowohl X als auch Y stetig bzw. quasi-stetig

Mehr

1.3 Stochastische Unabhängigkeit und bedingte

1.3 Stochastische Unabhängigkeit und bedingte 1.3 Stochastische Unabhängigkeit und bedingte Wahrscheinlichkeiten Ziel: komplexere Modelle aus Verkettung ( Koppelung ) von Zufallsexperimenten bauen, insbesondere Ziehung von n-personen aus n-maliger

Mehr

Bivariate Zusammenhänge

Bivariate Zusammenhänge Bivariate Zusammenhänge Tabellenanalyse: Kreuztabellierung und Kontingenzanalyse Philosophische Fakultät Institut für Soziologie Berufsverläufe und Berufserfolg von Hochschulabsolventen Dozent: Mike Kühne

Mehr

Statistik I. 1. Klausur Wintersemester 2010/2011 Hamburg, Art der Anmeldung: STiNE FlexNow Zulassung unter Vorbehalt

Statistik I. 1. Klausur Wintersemester 2010/2011 Hamburg, Art der Anmeldung: STiNE FlexNow Zulassung unter Vorbehalt Statistik I 1. Klausur Wintersemester 2010/2011 Hamburg, 11.02.2011 BITTE LESERLICH IN DRUCKBUCHSTABEN AUSFÜLLEN! Nachname:............................................................................ Vorname:.............................................................................

Mehr

Kreuztabellen und Häufigkeitstabellen. Kreuztabellen: - unabhängige Variable in Zeilen (Ursache) - abhängige Variable in Spalten (Wirkung)

Kreuztabellen und Häufigkeitstabellen. Kreuztabellen: - unabhängige Variable in Zeilen (Ursache) - abhängige Variable in Spalten (Wirkung) Kreuztabellen und Häufigkeitstabellen Kreuztabellen: - unabhängige Variable in Zeilen (Ursache) - abhängige Variable in Spalten (Wirkung) kategoriale Variablen Beispiel: Wenn Frau (Ursache) dann Angst

Mehr

Bivariate Kreuztabellen

Bivariate Kreuztabellen Bivariate Kreuztabellen Kühnel, Krebs 2001 S. 307-342 Gabriele Doblhammer: Empirische Sozialforschung Teil II, SS 2004 1/33 Häufigkeit in Zelle y 1 x 1 Kreuztabellen Randverteilung x 1... x j... x J Σ

Mehr

Assoziation & Korrelation

Assoziation & Korrelation Statistik 1 für SoziologInnen Assoziation & Korrelation Univ.Prof. Dr. Marcus Hudec Einleitung Bei Beobachtung von Merkmalen stellt sich die Frage, ob es Zusammenhänge oder Abhängigkeiten zwischen den

Mehr

3.1 Zusammenhang zwischen einem qualitativen und einem quantitativen Merkmal

3.1 Zusammenhang zwischen einem qualitativen und einem quantitativen Merkmal Kapitel 3 Bivariate Analyse In Kapitel 2 haben wir gesehen, wie man ein Merkmal auswertet. Mit Hilfe statistischer Verfahren kann man aber auch untersuchen, ob zwischen mehreren Merkmalen Abhängigkeiten

Mehr

Biometrieübung 11 Kontingenztafeln

Biometrieübung 11 Kontingenztafeln Biometrieübung 11 (Kontingenztafeln) - Aufgabe Biometrieübung 11 Kontingenztafeln Aufgabe 1 2x2-Kontingenztafeln 100 weibliche Patienten sind mit einer konventionellen Therapie behandelt worden 85 Patientinnen

Mehr

Kreuztabellen und Häufigkeitstabellen. Kreuztabellen: - unabhängige Variable in Zeilen (Ursache) - abhängige Variable in Spalten (Wirkung)

Kreuztabellen und Häufigkeitstabellen. Kreuztabellen: - unabhängige Variable in Zeilen (Ursache) - abhängige Variable in Spalten (Wirkung) Kreuztabellen und Häufigkeitstabellen Kreuztabellen: - unabhängige Variable in Zeilen (Ursache) - abhängige Variable in Spalten (Wirkung) kategoriale Variablen Beispiel: Wenn Frau (Ursache) dann Angst

Mehr

Medizinisches Beispiel

Medizinisches Beispiel Problemstellung Stimmen zwei oder mehrere Beobachter in ihrer Einschätzung überein? (im engl.: rater agreement oder interrater agreement) Beispiel: Zwei Professoren beurteilen die Referate oder Seminararbeiten

Mehr

6Korrelationsanalyse:Zusammengangsanalysestetiger Merkmale

6Korrelationsanalyse:Zusammengangsanalysestetiger Merkmale 6Korrelationsanalyse:Zusammengangsanalysestetiger Merkmale Jetzt betrachten wir bivariate Merkmale (X, Y ), wobei sowohl X als auch Y stetig bzw. quasi-stetig und mindestens ordinalskaliert, typischerweise

Mehr

Kapitel 17. Unabhängigkeit und Homogenität Unabhängigkeit

Kapitel 17. Unabhängigkeit und Homogenität Unabhängigkeit Kapitel 17 Unabhängigkeit und Homogenität 17.1 Unabhängigkeit Im Rahmen der Wahrscheinlichkeitsrechnung ist das Konzept der Unabhängigkeit von zentraler Bedeutung. Die Ereignisse A und B sind genau dann

Mehr

Statistische Methoden in den Umweltwissenschaften

Statistische Methoden in den Umweltwissenschaften Statistische Methoden in den Umweltwissenschaften Korrelationsanalysen Kreuztabellen und χ²-test Themen Korrelation oder Lineare Regression? Korrelationsanalysen - Pearson, Spearman-Rang, Kendall s Tau

Mehr

13 Mehrdimensionale Zufallsvariablen Zufallsvektoren

13 Mehrdimensionale Zufallsvariablen Zufallsvektoren 3 Mehrdimensionale Zufallsvariablen Zufallsvektoren Bisher haben wir uns ausschließlich mit Zufallsexperimenten beschäftigt, bei denen die Beobachtung eines einzigen Merkmals im Vordergrund stand. In diesem

Mehr

Was sind Zusammenhangsmaße?

Was sind Zusammenhangsmaße? Was sind Zusammenhangsmaße? Zusammenhangsmaße beschreiben einen Zusammenhang zwischen zwei Variablen Beispiele für Zusammenhänge: Arbeiter wählen häufiger die SPD als andere Gruppen Hochgebildete vertreten

Mehr

3. Lektion: Deskriptive Statistik

3. Lektion: Deskriptive Statistik Seite 1 von 5 3. Lektion: Deskriptive Statistik Ziel dieser Lektion: Du kennst die verschiedenen Methoden der deskriptiven Statistik und weißt, welche davon für Deine Daten passen. Inhalt: 3.1 Deskriptive

Mehr

Assoziation & Korrelation

Assoziation & Korrelation Statistik 1 für SoziologInnen Assoziation & Korrelation Univ.Prof. Dr. Marcus Hudec Einleitung Bei Beobachtung von 2 Merkmalen stellt sich die Frage, ob es Zusammenhänge oder Abhängigkeiten zwischen den

Mehr

Kapitel V - Graphische Darstellung von Häufigkeitsverteilungen

Kapitel V - Graphische Darstellung von Häufigkeitsverteilungen Institut für Volkswirtschaftslehre (ECON) Lehrstuhl für Ökonometrie und Statistik Kapitel V - Graphische Darstellung von Häufigkeitsverteilungen Deskriptive Statistik Prof. Dr. W.-D. Heller Hartwig Senska

Mehr

Kapitel V - Graphische Darstellung von Häufigkeitsverteilungen

Kapitel V - Graphische Darstellung von Häufigkeitsverteilungen Universität Karlsruhe (TH) Institut für Statistik und Mathematische Wirtschaftstheorie Statistik 1 - Deskriptive Statistik Kapitel V - Graphische Darstellung von Häufigkeitsverteilungen Markus Höchstötter

Mehr

Assoziation & Korrelation

Assoziation & Korrelation Statistik 1 für SoziologInnen Assoziation & Korrelation Univ.Prof. Dr. Marcus Hudec Einleitung Bei Beobachtung von 2 Merkmalen stellt sich die Frage, ob es systematische Zusammenhänge oder Abhängigkeiten

Mehr

Bivariater Zusammenhang in der Mehrfeldertafel PEΣO

Bivariater Zusammenhang in der Mehrfeldertafel PEΣO Bivariater Zusammenhang in der Mehrfeldertafel PEΣO 9. November 2001 Bivariate Häufigkeitsverteilungen in Mehrfeldertabellen In der Mehrfeldertabelle werden im Gegensatz zur Vierfeldertabelle keine dichotomen

Mehr

Arbeitsbuch zur deskriptiven und induktiven Statistik

Arbeitsbuch zur deskriptiven und induktiven Statistik Helge Toutenburg Michael Schomaker Malte Wißmann Christian Heumann Arbeitsbuch zur deskriptiven und induktiven Statistik Zweite, aktualisierte und erweiterte Auflage 4ü Springer Inhaltsverzeichnis 1. Grundlagen

Mehr

Statistik Einführung // Kategoriale Daten 10 p.2/26

Statistik Einführung // Kategoriale Daten 10 p.2/26 Statistik Einführung Kategoriale Daten Kapitel 10 Statistik WU Wien Gerhard Derflinger Michael Hauser Jörg Lenneis Josef Leydold Günter Tirler Rosmarie Wakolbinger Statistik Einführung // Kategoriale Daten

Mehr

Statistik ohne Angst vor Formeln

Statistik ohne Angst vor Formeln Statistik ohne Angst vor Formeln Das Studienbuch für Wirtschaftsund Sozialwissenschaftler 4., aktualisierte Auflage Andreas Quatember 1.3 Kennzahlen statistischer Verteilungen 1.3.4 Kennzahlen des statistischen

Mehr

Lösungen zur deskriptiven Statistik

Lösungen zur deskriptiven Statistik Lösungen zur deskriptiven Statistik Aufgabe 1. Bei einer Stichprobe von n = Studenten wurden folgende jährliche Ausgaben (in e) für Urlaubszwecke ermittelt. 1 58 5 35 6 8 1 6 55 4 47 56 48 1 6 115 8 5

Mehr

Warum reicht die Varianz nicht zur Konzentrationsmessung aus? Betrachtet man die Merkmale X A (

Warum reicht die Varianz nicht zur Konzentrationsmessung aus? Betrachtet man die Merkmale X A ( Kapitel 4 Konzentrationsmaße Warum reicht die Varianz nicht zur Konzentrationsmessung aus? Betrachtet man die Merkmale X A ( Einkommen in Land A ) und X B ( Einkommen in Land B ) mit folgender Häufigkeitsverteilung

Mehr

Kapitel 5 Wichtige Maßzahlen für den Zusammenhang zwischen Merkmalen

Kapitel 5 Wichtige Maßzahlen für den Zusammenhang zwischen Merkmalen Kapitel 5 Wichtige Maßzahlen für den Zusammenhang zwischen Merkmalen 5.1 Darstellung der Verteilung zweidimensionaler Merkmale 5.2 Maßzahlen für den Zusammenhang zweier nominaler Merkmale 5.3 Maßzahlen

Mehr

TEIL 7: EINFÜHRUNG UNIVARIATE ANALYSE TABELLARISCHE DARSTELLUNG / AUSWERTUNG

TEIL 7: EINFÜHRUNG UNIVARIATE ANALYSE TABELLARISCHE DARSTELLUNG / AUSWERTUNG TEIL 7: EINFÜHRUNG UNIVARIATE ANALYSE TABELLARISCHE DARSTELLUNG / AUSWERTUNG GLIEDERUNG Statistik eine Umschreibung Gliederung der Statistik in zwei zentrale Teilbereiche Deskriptive Statistik Inferenzstatistik

Mehr

Grundlagen der Statistik

Grundlagen der Statistik www.nwb.de NWB Studium Betriebswirtschaft Grundlagen der Statistik Band 1: Beschreibende Verfahren Von Professor Dr. Jochen Schwarze 12., vollständig überarbeitete Auflage nwb STUDIUM Inhaltsverzeichnis

Mehr

Grundlagen der Statistik I

Grundlagen der Statistik I NWB-Studienbücher Wirtschaftswissenschaften Grundlagen der Statistik I Beschreibende Verfahren Von Professor Dr. Jochen Schwarze 10. Auflage Verlag Neue Wirtschafts-Briefe Herne/Berlin Inhaltsverzeichnis

Mehr

Standardisierte Vorgehensweisen und Regeln zur Gewährleistung von: Eindeutigkeit Schlussfolgerungen aus empirischen Befunden sind nur dann zwingend

Standardisierte Vorgehensweisen und Regeln zur Gewährleistung von: Eindeutigkeit Schlussfolgerungen aus empirischen Befunden sind nur dann zwingend Standardisierte Vorgehensweisen und Regeln zur Gewährleistung von: Eindeutigkeit Schlussfolgerungen aus empirischen Befunden sind nur dann zwingend oder eindeutig, wenn keine alternativen Interpretationsmöglichkeiten

Mehr

Der χ2-test Der χ2-test

Der χ2-test Der χ2-test Der χ 2 -Test Überblick Beim χ 2 -Test handelt es sich um eine Familie ähnlicher Tests, die bei nominal- oder ordinalskalierten Merkmalen mit zwei oder mehr Ausprägungen angewendet werden können. Wir behandeln

Mehr

Der χ 2 -Test. Überblick. Beispiel 1 (χ 2 -Anpassungstest)

Der χ 2 -Test. Überblick. Beispiel 1 (χ 2 -Anpassungstest) Der χ 2 -Test Überblick Beim χ 2 -Test handelt es sich um eine Familie ähnlicher Tests, die bei nominal- oder ordinalskalierten Merkmalen mit zwei oder mehr Ausprägungen angewendet werden können. Wir behandeln

Mehr

W-Rechnung und Statistik für Ingenieure Übung 5

W-Rechnung und Statistik für Ingenieure Übung 5 W-Rechnung und Statistik für Ingenieure Übung 5 Grafische/ tabellarische Darstellung für bivariate Daten diskrete Merkmale (qualitativ+ quantitativ diskret) stetige Merkmale (quantitativ stetig) Zusammenhangsmaße

Mehr

Statistisches Testen

Statistisches Testen Statistisches Testen Grundlegendes Prinzip Erwartungswert Bekannte Varianz Unbekannte Varianz Differenzen Anteilswert Chi-Quadrat Tests Gleichheit von Varianzen Prinzip des Statistischen Tests Konfidenzintervall

Mehr

3 Bivariate Deskription und Exploration von Daten

3 Bivariate Deskription und Exploration von Daten 3 Bivariate Deskription und Exploration von Daten In diesem Kapitel werden Methoden zur Darstellung der gemeinsamen Verteilung von zwei (oder mehreren) verschiedenen Merkmalen behandelt. Von besonderer

Mehr

Trim Size: 176mm x 240mm Lipow ftoc.tex V1 - March 9, :34 P.M. Page 11. Über die Übersetzerin 9. Einleitung 19

Trim Size: 176mm x 240mm Lipow ftoc.tex V1 - March 9, :34 P.M. Page 11. Über die Übersetzerin 9. Einleitung 19 Trim Size: 176mm x 240mm Lipow ftoc.tex V1 - March 9, 2016 6:34 P.M. Page 11 Inhaltsverzeichnis Über die Übersetzerin 9 Einleitung 19 Was Sie hier finden werden 19 Wie dieses Arbeitsbuch aufgebaut ist

Mehr

Eine zweidimensionale Stichprobe

Eine zweidimensionale Stichprobe Eine zweidimensionale Stichprobe liegt vor, wenn zwei qualitative Merkmale gleichzeitig betrachtet werden. Eine Urliste besteht dann aus Wertepaaren (x i, y i ) R 2 und hat die Form (x 1, y 1 ), (x 2,

Mehr

htw saar 1 EINFÜHRUNG IN DIE STATISTIK: BESCHREIBENDE STATISTIK

htw saar 1 EINFÜHRUNG IN DIE STATISTIK: BESCHREIBENDE STATISTIK htw saar 1 EINFÜHRUNG IN DIE STATISTIK: BESCHREIBENDE STATISTIK htw saar 2 Grundbegriffe htw saar 3 Grundgesamtheit und Stichprobe Ziel: Über eine Grundgesamtheit (Population) soll eine Aussage über ein

Mehr

Kreisdiagramm, Tortendiagramm

Kreisdiagramm, Tortendiagramm Kreisdiagramm, Tortendiagramm Darstellung der relativen (absoluten) Häufigkeiten als Fläche eines Kreises Anwendung: Nominale Merkmale Ordinale Merkmale (Problem: Ordnung nicht korrekt wiedergegeben) Gruppierte

Mehr

WISTA WIRTSCHAFTSSTATISTIK

WISTA WIRTSCHAFTSSTATISTIK WISTA WIRTSCHAFTSSTATISTIK PROF DR ROLF HÜPEN FAKULTÄT FÜR WIRTSCHAFTSWISSENSCHAFT Seminar für Theoretische Wirtschaftslehre Vorlesungsprogramm 23042013 Datenlagen und Darstellung eindimensionaler Häufigkeitsverteilungen

Mehr

Statistik I. 2. Klausur Wintersemester 2011/2012 Hamburg, BITTE LESERLICH IN DRUCKBUCHSTABEN AUSFÜLLEN!

Statistik I. 2. Klausur Wintersemester 2011/2012 Hamburg, BITTE LESERLICH IN DRUCKBUCHSTABEN AUSFÜLLEN! Statistik I A 2. Klausur Wintersemester 2011/2012 Hamburg, 20.03.2012 BITTE LESERLICH IN DRUCKBUCHSTABEN AUSFÜLLEN! Nachname:............................................................................

Mehr

Statistik I. Sommersemester 2009

Statistik I. Sommersemester 2009 I Sommersemester 2009 I χ 2 =?!? Nächste Woche: Maße für ordinale, nominal/intervallskalierte und intervallskalierte Daten I Zum Nachlesen Agresti/Finlay: Kapitel 8.1-8.4 Gehring/Weins: Kapitel 7.1 Schumann:

Mehr

Alternative Darstellung des 2-Stcihprobentests für Anteile

Alternative Darstellung des 2-Stcihprobentests für Anteile Alternative Darstellung des -Stcihprobentests für Anteile DCF CF Total n 111 11 3 Response 43 6 69 Resp. Rate 0,387 0,3 0,309 Bei Gültigkeit der Nullhypothese Beobachtete Response No Response Total absolut

Mehr

Statistik. Sommersemester Prof. Dr. Stefan Etschberger Hochschule Augsburg

Statistik. Sommersemester Prof. Dr. Stefan Etschberger Hochschule Augsburg für Betriebswirtschaft, Internationales Management, Wirtschaftsinformatik und Informatik Sommersemester 2016 Prof. Dr. Stefan Etschberger Hochschule Augsburg Weitere smaße skoeffizient: CR g = Anteil,

Mehr

6. Multivariate Verfahren Übersicht

6. Multivariate Verfahren Übersicht 6. Multivariate Verfahren 6. Multivariate Verfahren Übersicht 6.1 Korrelation und Unabhängigkeit 6.2 Lineare Regression 6.3 Nichtlineare Regression 6.4 Nichtparametrische Regression 6.5 Logistische Regression

Mehr

Philipp Sibbertsen Hartmut Lehne. Statistik. Einführung für Wirtschafts- und. Sozialwissenschaftler. 2., überarbeitete Auflage. 4^ Springer Gabler

Philipp Sibbertsen Hartmut Lehne. Statistik. Einführung für Wirtschafts- und. Sozialwissenschaftler. 2., überarbeitete Auflage. 4^ Springer Gabler Philipp Sibbertsen Hartmut Lehne Statistik Einführung für Wirtschafts- und Sozialwissenschaftler 2., überarbeitete Auflage 4^ Springer Gabler Inhaltsverzeichnis Teil I Deskriptive Statistik 1 Einführung

Mehr

Deskription, Statistische Testverfahren und Regression. Seminar: Planung und Auswertung klinischer und experimenteller Studien

Deskription, Statistische Testverfahren und Regression. Seminar: Planung und Auswertung klinischer und experimenteller Studien Deskription, Statistische Testverfahren und Regression Seminar: Planung und Auswertung klinischer und experimenteller Studien Deskriptive Statistik Deskriptive Statistik: beschreibende Statistik, empirische

Mehr

Statistik I. 2. Klausur Wintersemester 2011/2012 Hamburg, BITTE LESERLICH IN DRUCKBUCHSTABEN AUSFÜLLEN!

Statistik I. 2. Klausur Wintersemester 2011/2012 Hamburg, BITTE LESERLICH IN DRUCKBUCHSTABEN AUSFÜLLEN! Statistik I A 2. Klausur Wintersemester 2011/2012 Hamburg, 20.03.2012 BITTE LESERLICH IN DRUCKBUCHSTABEN AUSFÜLLEN! Nachname:............................................................................

Mehr

Musterlösung zur Aufgabensammlung Statistik I Teil 3

Musterlösung zur Aufgabensammlung Statistik I Teil 3 Musterlösung zur Aufgabensammlung Statistik I Teil 3 2008, Malte Wissmann 1 Zusammenhang zwischen zwei Merkmalen Nominale, Ordinale Merkmale und Mischungen Aufgabe 12 a) x\ y 1.Klasse 2.Klasse 3.Klasse

Mehr

Klausur zu Methoden der Statistik I (mit Kurzlösung) Sommersemester Aufgabe 1

Klausur zu Methoden der Statistik I (mit Kurzlösung) Sommersemester Aufgabe 1 Lehrstuhl für Statistik und Ökonometrie der Otto-Friedrich-Universität Bamberg Prof. Dr. Susanne Rässler Klausur zu Methoden der Statistik I (mit Kurzlösung) Sommersemester 2015 Aufgabe 1 In der aktuellen

Mehr

Multivariate Zufallsvariablen

Multivariate Zufallsvariablen Kapitel 7 Multivariate Zufallsvariablen 7.1 Diskrete Zufallsvariablen Bisher haben wir immer nur eine Zufallsvariable betrachtet. Bei vielen Anwendungen sind aber mehrere Zufallsvariablen von Interesse.

Mehr

Analyse bivariater Kontingenztafeln

Analyse bivariater Kontingenztafeln Analyse bivariater Kontingenztafeln Werden zwei kategoriale Merkmale mit nicht zu vielen möglichen Ausprägungen gemeinsam analysiert, so kommen zur Beschreibung der gemeinsamen Verteilung im allgemeinen

Mehr

Voraussetzung für statistische Auswertung: jeder Fall besitzt in bezug auf jedes Merkmal genau eine Ausprägung

Voraussetzung für statistische Auswertung: jeder Fall besitzt in bezug auf jedes Merkmal genau eine Ausprägung Rohdaten Urliste oder Rohdaten sind die auszuwertenden Daten in der Form, wie sie nach der Datenerhebung vorliegen. Dimensionen der Urliste sind die Fälle, Merkmale und ihre Ausprägungen. Voraussetzung

Mehr

Statistik I für Statistiker, Mathematiker und Informatiker Lösungen zu Blatt 6 Gerhard Tutz, Jan Ulbricht WS 05/06.

Statistik I für Statistiker, Mathematiker und Informatiker Lösungen zu Blatt 6 Gerhard Tutz, Jan Ulbricht WS 05/06. Statistik I für Statistiker, Mathematiker und Informatiker Lösungen zu Blatt Gerhard Tutz, Jan Ulbricht WS 05/0 Lösung Aufgabe 4 Notation: X: Rauchen, Y : chronische Bronchitis S X {ja, nein} {a 1, a },

Mehr

Sozialwissenschaftliche Fakultät der Universität Göttingen. Sommersemester 2009, Statistik mit SPSS

Sozialwissenschaftliche Fakultät der Universität Göttingen. Sommersemester 2009, Statistik mit SPSS Sommersemester 2009, Statistik mit SPSS 26. August 2009 26. August 2009 Statistik Dozentin: mit Anja SPSS Mays 1 1. Ziel der Kreuztabellierung 2. Übersicht CROSSTABS - Syntax 3. 2x2 Kreuztabellen Überblick

Mehr

Statistik I. Sommersemester 2009

Statistik I. Sommersemester 2009 I Sommersemester 2009 I Wiederholung/Einführung χ 2 =?!? I Wiederholung/Einführung χ 2 =?!? Nächste Woche: Maße für ordinale, nominal/intervallskalierte und intervallskalierte Daten I Zum Nachlesen Agresti/Finlay:

Mehr

6 Korrelationsanalyse: Zusammenhangsanalyse stetiger. Merkmale

6 Korrelationsanalyse: Zusammenhangsanalyse stetiger. Merkmale 6 Korrelationsanalyse: Zusammenhangsanalyse stetiger Merkmale 6.1 Korrelationsanalyse Jetzt betrachten wir bivariate Merkmale (X, Y ), wobei sowohl X als auch Y stetig bzw. quasi-stetig und mindestens

Mehr

Wahrscheinlichkeits - rechnung und Statistik

Wahrscheinlichkeits - rechnung und Statistik Michael Sachs Mathematik-Studienhilfen Wahrscheinlichkeits - rechnung und Statistik für Ingenieurstudenten an Fachhochschulen 4., aktualisierte Auflage 2.2 Eindimensionale Häufigkeitsverteilungen 19 absolute

Mehr

Geg.: Eine Menge von Elementen, z.b.

Geg.: Eine Menge von Elementen, z.b. 1.3 Zweidimensionale Häufigkeitsverteilungen Geg.: Eine Menge von Elementen, z.b. Schüler einer Schule Soldaten eines Bataillons Schrauben einer Stichprobe Tage eines Jahrhunderts Betrachtet werden zwei

Mehr

Beeinflusst das Geschlecht das Erwerbseinkommen?

Beeinflusst das Geschlecht das Erwerbseinkommen? 74 Kapitel 5 Analyse von Zusammenhängen 5.1 Multivariate Merkmale Gerade in der Soziologie ist die Analyse eindimensionaler Merkmale nur der allererste Schritt. Letztendlich kommt es auf die Analyse von

Mehr

Chi² Test und Kontingenzkoeffizient. - aber keine natürliche Reihenfolge

Chi² Test und Kontingenzkoeffizient. - aber keine natürliche Reihenfolge Chi² Test und Kontingenzoeffizient Für nominalsalierte Daten: - diese haben unterschiedliche Ausprägung, - aber eine natürliche Reihenfolge 1. Chi² Test Test nominalsalierter Daten Vergleich von beobachteten

Mehr

WISTA WIRTSCHAFTSSTATISTIK

WISTA WIRTSCHAFTSSTATISTIK WISTA WIRTSCHAFTSSTATISTIK PROF. DR. ROLF HÜPEN FAKULTÄT FÜR WIRTSCHAFTSWISSENSCHAFT Seminar für Theoretische Wirtschaftslehre Vorlesungsprogramm 04.06.2013 Zweidimensionale Datensätze 1. Kontingenztabelle

Mehr

Mehrdimensionale Zufallsvariablen

Mehrdimensionale Zufallsvariablen Mehrdimensionale Zufallsvariablen Im Folgenden Beschränkung auf den diskreten Fall und zweidimensionale Zufallsvariablen. Vorstellung: Auswerten eines mehrdimensionalen Merkmals ( ) X Ỹ also z.b. ω Ω,

Mehr

Ermitteln Sie auf 2 Dezimalstellen genau die folgenden Kenngrößen der bivariaten Verteilung der Merkmale Weite und Zeit:

Ermitteln Sie auf 2 Dezimalstellen genau die folgenden Kenngrößen der bivariaten Verteilung der Merkmale Weite und Zeit: 1. Welche der folgenden Kenngrößen, Statistiken bzw. Grafiken sind zur Beschreibung der Werteverteilung des Merkmals Konfessionszugehörigkeit sinnvoll einsetzbar? A. Der Modalwert. B. Der Median. C. Das

Mehr

Wirtschaftsstatistik für Studienanfänger

Wirtschaftsstatistik für Studienanfänger Günter Deweß / Helga Hartwig Wirtschaftsstatistik für Studienanfänger Begriffe - Aufgaben - Lösungen EAG. LE Edition am Gutenbergplatz Leipzig Inhalt Beschreibende Statistik: Daten und Maßzahlen 1 Grundgesamtheiten,

Mehr

Brückenkurs Statistik für Wirtschaftswissenschaften

Brückenkurs Statistik für Wirtschaftswissenschaften Peter von der Lippe Brückenkurs Statistik für Wirtschaftswissenschaften Weitere Übungsfragen UVK Verlagsgesellschaft mbh Konstanz Mit UVK/Lucius München UVK Verlagsgesellschaft mbh Konstanz und München

Mehr

Einführung in SPSS. Sitzung 4: Bivariate Zusammenhänge. Knut Wenzig. 27. Januar 2005

Einführung in SPSS. Sitzung 4: Bivariate Zusammenhänge. Knut Wenzig. 27. Januar 2005 Sitzung 4: Bivariate Zusammenhänge 27. Januar 2005 Inhalt der letzten Sitzung Übung: ein Index Umgang mit missing values Berechnung eines Indexes Inhalt der letzten Sitzung Übung: ein Index Umgang mit

Mehr

Vorlesung Grundlagen der Biometrie WS 2011/12 1. Grundbegriffe

Vorlesung Grundlagen der Biometrie WS 2011/12 1. Grundbegriffe Vorlesung Grundlagen der Biometrie WS 2011/12 1. Grundbegriffe Dr. Antje Kiesel Institut für Angewandte Mathematik WS 2011/2012 1. Grundbegriffe der beschreibenden Statistik Statistische Einheiten, Grundgesamtheit

Mehr