Beeinflusst das Geschlecht das Erwerbseinkommen?

Größe: px
Ab Seite anzeigen:

Download "Beeinflusst das Geschlecht das Erwerbseinkommen?"

Transkript

1 74

2 Kapitel 5 Analyse von Zusammenhängen 5.1 Multivariate Merkmale Gerade in der Soziologie ist die Analyse eindimensionaler Merkmale nur der allererste Schritt. Letztendlich kommt es auf die Analyse von Zusammenhängen an. Beispiele für typische Fragestellung: Beeinflusst das Geschlecht das Erwerbseinkommen? Gibt es einen Zusammenhang zwischen Schichtzugehörigkeit (als etwas veralteter, dennoch klassischer soziologischer Begriff) und Aggressionsneigung? Spielt die Stärke der Kirchenbindung eine Rolle bei der Parteienpräferenz? Haben Studierende mit guten Mathematikvorkenntnissen bessere Statistiknoten? Hierzu werden an jeder Einheit mehrere Variablen erhoben und ihre Ausprägungen auch gemeinsam analysiert (z.b. wird das Geschlecht der i-ten Person mit ihrem Einkommen in Beziehung gesetzt). Hat man z.b. die Merkmale X, Y, Z, so nennt man das Paar (X, Y ) bzw. das Tripel (X, Y, Z) ein zweidimensionales (bivariates) bzw. dreidimensionales Merkmal (trivariates) Merkmal. Allgemein spricht man von mehrdimensionalen Merkmalen. (X, Y ) : Ω (ω 1, ω ) X = ω (X(ω), Y (ω)) Y = 75 { 1 Hutträger 0 kein Hutträger { 1 Blumen ja 0 Blumen nein

3 Assoziationsmessung in Kontingenztafeln Achtung: * ω 1 x 1 = 1 y 1 = 1 (1, 1)... ω x = 1 y = 0 (1, 0) * ω j x j 0 y j = 1 (0, 1) ω n x n = 1 y n = 0 (0, 0) Statistische Verfahren analysieren Zusammenhänge und machen keine Aussage über Kausalitäten! Kausalitäten können nur aus sachlogischen Überlegungen abgeleitet werden. 5. Assoziationsmessung in Kontingenztafeln 5..1 Gemeinsame Verteilung, Randverteilung, Kontingenztafel Betrachtet wird ein zweidimensionales Merkmal (X, Y ) bestehend aus den diskreten Merkmalen X und Y und die zugehörige Urliste (x 1, y 1 ), (x, y ),..., (x n, y n ). Wir wollen ferner annehmen, dass X und Y nur endlich viele (wenige), verschiedene Werte annehmen können. a 1,..., a i,..., a k bzw. b 1,..., b j,... b m Anmerkung: In vielen Büchern (v.a. zur induktiven Statistik) wird statt a 1,..., a k auch x 1,..., x k und statt b 1,..., b m analog y 1,..., y m geschrieben. Bei uns sind aber die (x i, y i ) Werte der Urliste, x i also der Wert der i-ten Einheit. Daraus ergibt sich zwar die Doppeldeutigkeit der Laufindizes i und j, wir bleiben jedoch bei dieser Notation um Einheitlichkeit mit Fahrmeir et al. (007) und Jann (00/005) herzustellen. Beispiel (fiktiv): Y X latente Aggressivität Schichtzugehörigkeit { 1, ja, nein 1, Unterschicht, Mittelschicht 3, Oberschicht Typische Urliste des zweidimensionalen Merkmals (X, Y ): (3, 1), (, ), (, 1), (3, 1), (3, ), (3, 1), (1, ), (1, 1), (1, 1), (1, ), (3, 1), (3, 1)

4 Kapitel 5. Analyse von Zusammenhängen 77 Achtung: Tupel sind im Gegensatz zu Mengen geordnete Anordnungen von Zahlen, d.h. die erste Stelle bezieht sich immer auf X, die zweite auf Y. Also bedeutet (1, ) etwas anderes als (, 1) (vgl. obiges Beispiel). Die Tupel sind gemeinsam indiziert, d.h. die Werte in einem Tupel beziehen sich immer auf dieselbe Einheit. Bei (x i, y i ) sind x i und y i also die Ausprägungen derselben Einheit i (z.b. der Person i). Nur so können Zusammenhänge zwischen den Merkmalen sichtbar werden! Gemeinsame relative und absolute Häufigkeitsverteilung: h ij = h(a i, b j ), i = 1,..., k, j = 1,..., m, = Anzahl von Beobachtungen mit x = a i und y = b j. f ij = h ij /n = f(a i, b j ), i = 1,..., k, j = 1,..., m, = Anteil von Beobachtungen mit x = a i und y = b j. Man nennt (h ij ), i = 1,..., k, j = 1,..., m und (f ij ) die gemeinsame Verteilung von (X, Y ) in absoluten bzw. relativen Häufigkeiten. Kontingenztafel / Kontingenztabelle / Kreuztabelle: in Form einer (k m)-dimensionalen Häufigkeitstabelle Darstellung der Häufigkeiten b 1 b j b m a 1 h 11 h 1j h 1m h 1 a h 1 h j h m h..... a i h i1 h ij h im h i..... a k h k1 h kj h km h k h 1 h j h m n mit den Randverteilungen h i = h i h im = h(a i ), i = 1,..., k, für X und h j = h 1j h kj = h(b j ), j = 1,..., m, für Y.

5 Assoziationsmessung in Kontingenztafeln Kontigenztafel der relativen Häufigkeitsverteilung: b 1 b j b m a 1 f 11 f 1j f 1m f 1 a f 1 f j f m f..... a i f i1 f ij f im f i..... a k f k1 f kj f km f k f 1 f j f m n mit relativen Häufigkeiten f ij = h ij n und den Randverteilungen f i = h i n = f i f im = f(a i ), i = 1,..., k, für X und f j = h j n = f 1j f kj = f(b j ), j = 1,..., m, für Y. Beispiel: Aggressivität und Schichtzugehörigkeit In unserem Beispiel ist n = 1 a 1 = 1, a =, a 3 = 3 b 1 = 1, b = also k = 3 und m =. Als Kontingenztafel ergibt sich Y X Randhäufigkeiten: Aus der gemeinsamen Verteilung kann man die eindimensionalen Verteilungen berechnen (aber nicht umgekehrt, s.u.). Man nennt sie in diesem Kontext Randverteilungen. Die absoluten Häufigkeiten von X bezeichnet man mit h 1, h,..., h i,..., h k, die von Y mit h 1, h,..., h j,..., h m, analog f i, f j. Der Punkt steht für Summation über den entsprechenden Index. Es gilt also: h i ist die absolute Häufigkeit von a i, h j ist die absolute Häufigkeit von b j.

6 Kapitel 5. Analyse von Zusammenhängen 79 und h i = h j = m h ij, j=1 k h ij. Also ist h i die i-te Zeilensumme, h j die j-te Spaltensumme (daher der Name Randhäufigkeiten). Völlig analog definiert sind die relativen Randhäufigkeiten f i := m f ij und f j := j=1 k f ij. Beispiel: Parteipräferenz bei unterschiedlichem Einkommen (Befragung von 7 Personen, ) Unabhängige und abhängige Variable: Hat man eine Vermutung über die Richtung einer potentiellen Wirkung, so bezeichnet man die Variablen entsprechend als unabhängige (wirkende, erklärende) und abhängige Variable, z.b.: möglicherweise: Schicht latente Aggresivität eindeutig: Geschlecht Einkommen allgemein: unabhängige abhängige Variable Konventionen in den Sozialwissenschaften: Um mit Fahrmeir (007) konsistent zu bleiben, werden wir die unabhängige Variable in die Zeilen und die abhängige Variable in den Spalten der Kontingenztafel platzieren. In den Sozialwissenschaften ist die Konvention jedoch umgekehrt: Die unabhängige Variable steht in den Spalten, die abhängige in den Zeilen. In praktisch allen statistischen Verfahren (insbesondere der Regression, Kapitel 6) wird die abhängige Variable mit Y und die unabhängige Variable mit X bezeichnet. Wir werden daher im folgenden dieser (der statistischen) Notation folgen. Wiederum ist die übliche Konvention in den Sozialwissenschaften umgekehrt: Die unabhängige Variable wird mit Y und die abhängige mit X bezeichnet.

7 Assoziationsmessung in Kontingenztafeln Also im Folgenden: Y X abhängige Variable unabhängige Variable 5.. Ökologischer Fehlschluss Es gibt sehr viele gemeinsame Verteilungen, die zu denselben Randhäufigkeiten passen. Beispiel: Y X Bei dieser Konstellation ist von den Unterschichtsangehörigen niemand latent aggressiv, von den Mittel- und Oberschichtsangehörigen alle. Die Schichtungszugehörigkeit würde hier also völlig die Aggressivität determinieren. Man sieht also, wie wichtig es zur Feststellung potentieller Zusammenhänge ist, die gemeinsame Verteilung h ij zu kennen, also tatsächlich die Paare (x i, y i ) zu betrachten. Der unzulässige Schluss von der Randverteilung auf Eigenschaften der gemeinsamen Verteilung, also von zwei univariaten Ergebnissen auf ein bivariates, von der Kollektiv- auf die Individualebene, heißt ökologischer Fehlschluss. Klassisches Beispiel für ökologischen Fehlschluss: Je größer der Anteil an Arbeitern in einer Region, desto mehr SPD-Wähler gibt es. = Arbeiter wählen eher SPD. Je größer der Anteil der Nichtdeutschstämmigen ( Ausländer zweiter Generation ) in einer Region, desto mehr Wähler rechtsradikaler Parteien gibt es. = Nichtdeutschstämmige wählen rechtsradikal? 5..3 Grafische Darstellung der gemeinsamen Verteilung Verschiedene Darstellungsarten, z.b. als 3D-Säulendiagramm der gemeinsamen Häufigkeiten h ij oder nach einer Variable aufgespalten, d.h. für jeden Wert a i von X werden jeweils die Häufigkeiten h ij bzw. f ij aufgetragen.

8 Kapitel 5. Analyse von Zusammenhängen Wohnfläche Miete Bedingte Häufigkeitsverteilungen Beispiel: Habilitationen nach Geschlecht und Fach (aus Fahrmeir et al., 007). Grundgesamtheit: alle Habilitationen 1993 Geschlecht: Fächergruppe: X Y Absolute Häufigkeiten: Sprachw. Rechtsw. Naturw. Kunst Medizin Kulturw. Wirts., Soz Frauen Männer Relative Häufigkeiten Sprachw. Rechtsw. Naturw. Kunst Medizin Kulturw. Wirts., Soz Frauen Männer Zur Interpretation:

9 8 5.. Assoziationsmessung in Kontingenztafeln In Naturwissenschaften werden nur 30 Frauen habilitiert, in Kunst sogar nur 4. Ist das viel oder wenig? Das kommt ganz darauf an, wieviele Personen insgesamt dort habilitiert werden. (30 von 346 sehr wenig, 4 von 14 nicht so wenig). Man muss also die gemeinsamen Häufigkeiten bedingen. Man geht über zur sogenannten bedingten Verteilung. Sie gibt die Verteilung eines Merkmals an, unter der Bedingung ( wenn man weiß ), dass das andere Merkmal einen bestimmten Wert hat. z.b. Verteilung des Geschlechts unter den in Kunst bzw. Naturwissenschaften Habilitierten; Anteil der latent aggressiven Jugendlichen unter den Angehörigen der Oberschicht. Es wird also sozusagen die betrachtete Gesamtheit auf eine bestimmte Personengruppen eingeschränkt. Im Beispiel etwa Anzahl der Habil. von Frauen in Kunst Anzahl der Habil. in Kunst = h 14 h 4 Definition: Seien h i > 0 und h j > 0 für alle i, j. Für jedes i = 1,..., k heißt f Y (b 1 a i ) := h i1 = h(a i, b 1 ) h i h(a i ),..., f Y (b m a i ) := h im = h(a i, b m ) h i h(a i ) bedingte (relative) Häufigkeitsverteilung von Y unter der Bedingung X = a i. Analog heißt für jedes j = 1,..., m f X (a 1 b j ) := h 1j = h(a 1, b j ),..., f X (a k b j ) := h kj = h(a k, b j ) h j h(b j ) h j h(b j ) bedingte (relative) Häufigkeitsverteilung von X unter der Bedingung Y = b j. Im Beispiel: f Y (Frau Habil. in Kunst) = h 14 h 4 = 4 14 = f Y (Frau Habil. in Naturw.) = h 13 = 30 h Zu unterscheiden von f 13 = 0.05 = f(frau und Habil. in Naturw.) bzw. f X (Habil. in Kunst Frau) = h 14 = 4 h = Die Verwechslung von gemeinsamer und bedingter Verteilung ist eine häufige Fehlerquelle. Bei Vermutung über Richtung des Zusammenhangs betrachtet man vorwiegend die bedingte Verteilung der abhängigen Variablen gegeben die festen Werte der unabhängigen Variable. In diese Richtung geht ja auch die Prognose! Man kennt den Wert der unabhängigen Variablen und will Aussagen über die abhängige machen.

10 Kapitel 5. Analyse von Zusammenhängen 83 Beispiel: Bedingte Verteilung der Fächergruppen gegeben das Geschlecht (f(b j a i ) für verschiedene i). b j Sprachw. Rechtsw. Naturw. Kunst Medizin Kulturw. Wirts., Soz a i Frauen Männer f(rechtsw. Frau) = f(b a 1 ) = h 1 h 1 = = f(kunst Mann) = f(b 4 a ) = h 4 h = Bedingte Verteilung des Geschlechts gegeben die Fachgruppe (f(a i b j ) für verschiedene j). b j Sprachw. Rechtsw. Naturw. Kunst Medizin Kulturw. Wirts., Soz a i Frauen Männer Nochmals zur Interpretation: f(frau Rechtsw.) = f(a 1 b ) = h 1 h = 0 11 = f(mann Kunst) = f(a b 4 ) = h 4 h 4 = f(frau Medizin) = % = 9.%. 9.% aller erfolgreich in Medizin Habilitierten sind Frauen.. f(medizin Frau) = 30%. 30% aller Frauen, die sich habilitieren tun dies in der Medizin. 3. f 51 = f(medizin und Frau) = = 3.6%. 3.6% aller Habilitationen stammen von Medizinerinnen, d.h. von Frauen in der Medizinischen Fakultät. Es liegt jeweils eine andere Grundgesamtheit zu Grunde: 1. Habilitationen in Medizin. Habilitationen von Frauen 3. Habilitationen insgesamt

11 Assoziationsmessung in Kontingenztafeln Bedingte Verteilungen basieren immer auf relativen Häufigkeiten. Für die Berechnung gilt f(a i b j ) = h ij h j = h ij n h j n = f ij f j und analog f(b j a i ) = h ij h i = f ij f i. Beispiel: Parteipräferenzen (Empirische) Unabhängigkeit und χ Aus dem Vergleich der bedingten Häufigkeiten mit den Randhäufigkeiten kann man relativ gut Zusammenhänge beurteilen Beispiel: Aggression und Schichtzugehörigkeit. Bedingte Häufigkeiten: f(b j a i ) : relative Häufigkeit von b j, wenn man weiß, dass a i. Vergleiche zum Beispiel mit Gilt f(b 1 a 3 ): f 1 : Anteil der Personen mit Ausprägung b 1 (latent aggressiv) unter allen Personen mit Ausprägung a 3 (Oberschicht) Anteil der Personen mit b 1 (generell), also alle latent aggressiven Personen f(b 1 a 3 ) > f 1,

12 Kapitel 5. Analyse von Zusammenhängen 85 so erhöht a 3 die Tendenz von b 1 (erhöhte Aggressivität in der Oberschicht), gilt f(b 1 a 3 ) < f 1, so verringert a 3 die Tendenz von b 1 (geringere Aggressivität in der Oberschicht). Wäre hingegen f(b 1 a 3 ) = f 1, so wäre im Beispiel der Anteil der latent aggressiven Personen in der Oberschicht genauso groß wie in der Grundgesamtheit. Die Zugehörigkeit zur Oberschicht würde also nicht das Vorhandensein latenter Aggressivität beeinflussen. Gilt dies für alle Merkmalskombinationen, so beeinflussen sich die Variablen gegenseitig nicht. Die Merkmale sind voneinander sozusagen unabhängig. Empirische Unabhängigkeit: Die beiden Komponenten X und Y eines bivariaten Merkmals (X, Y ) heißen voneinander (empirisch) unabhängig, falls für alle i = 1,..., k und j = 1,..., m f(b j a i ) = f j = f(b j ) (5.1) und gilt. f(a i b j ) = f i = f(a i ) (5.) Also anschaulich: Genau bei empirischer Unabhängigkeit ist die Verteilung von Y in allen bezüglich Werten von X gebildeten Subgruppen identisch und umgekehrt. Satz: a) Es genügt, entweder (5.1) oder (5.) zu überprüfen: Mit einer der beiden Beziehungen gilt auch die andere. b) X und Y sind genau dann empirisch unabhängig, wenn für alle i = 1,... k und alle j = 1,... m gilt: f ij = f i f j (5.3) c) Gleichung (5.3) ist äquivalent zu h ij = h i h j n (5.4) Beweis zu b) : i, j beliebig vorgegeben, X, Y empirisch unabhängig. f(a i b j ) = f i für alle i, j f ij = f i f j für alle i, j f ij = f i f j für alle i, j

13 Assoziationsmessung in Kontingenztafeln Zentrale Idee zur Analyse von Kontingenztafeln: Man beurteilt das Ausmaß der Abhängigkeit von X und Y dadurch, dass man die beobachtete Kontingenztafel mit der Tafel vergleicht, die sich bei denselben Randverteilungen ergeben würde, wenn X und Y (empirisch) unabhängig wären. Man vergleicht also für alle i und j die beobachteten Häufigkeiten h ij mit den unter Unabhängigkeit erwarteten Besetzungszahlen h ij (vgl. die rechte Seite von (5.4)): h ij := h i h j. n Je größer die Unterschiede zwischen h ij und h ij sind, umso stärker sind die Daten von der Unabhängigkeit entfernt, und umso stärker ist also der Zusammenhang zwischen X und Y. Als Maß verwendet man den sog. χ -Koeffizienten / χ -Abstand: χ := = k m (h ij h ij ) (5.5) h j=1 ij ( ) beob. Häufigk. unter Unabh. zu erwarten unter Unabh. zu erwarten alle Zellen Beispiel: Zusammenhang zwischen Geschlecht und Arbeitslosigkeit (fiktiv, nach Wagschal, 1999) Sei Y der Beschäftigungsstatus einer erwerbstätigen Person, X das Geschlecht mit Y = { 1 beschäftigt arbeitslos und X = { 1 weiblich männlich Gemeinsame Häufigkeitsverteilung: Zur Bestimmung des χ -Koeffizienten: 1. Bestimme die Randverteilung. Y X Berechne die unter Unabhängigkeit zu erwartenden Häufigkeiten h ij. Indifferenztafel (bei empirischer Unabhängigkeit zu erwartende Kontingenztafel): h 11 = h 1 h 1 n h 1 = h h 1 n = = = = 68

14 Kapitel 5. Analyse von Zusammenhängen 87 Y X Beim Vergleich der beoachteten Häufigkeitsverteilung mit der unter Unabhängigkeit zu erwartenden erkennt man: Es gibt weniger beschäftigte Frauen und arbeitslose Männer als unter Unabhängigkeit zu erwarten wäre und mehr arbeitslose Frauen und beschäftigte Männer. Also hat das Geschlecht einen Einfluss; Männer sind tendenziell eher beschäftigt. Man erhält χ = k m j=1 (h ij h ij ) h ij (40 5) (5 13) (80 68) (5 17) = = = Bei Vierfeldertafeln ( Zeilen, Spalten) gibt es eine handliche Alternative zur Berechnung von χ : χ = n (h 11h h 1 h 1 ) h 1 h h 1 h (5.6) (Merksatz: Hauptdiagonalenprodukt Nebendiagonalenprodukt). Veranschaulichung der Formel: In der Hauptdiagonalen stehen die gleichgerichteten (konkordanten) Paare (1,1), (,) (kleines Y zu kleinem X und hohes Y gehört zu hohem X), in der Nebendiagonalen die entgegengerichteten (diskordanten) Paare (1,), (,1). Je stärker der Zusammenhang, desto stärker überwiegt eine dieser beiden Möglichkeiten, d.h. desto größer ist (h 11 h h 1 h 1 ) Ceteris paribus Betrachtung bei gleichen Randverteilungen: +1 1 h h h 1 h Angenommen, es ist h 11 h > h 1 h 1. Dann erhöhen sich h 11 und h, h 1 und h 1 erniedrigen sich χ wird größer. Berechnung im Beispiel mit alternativer Formel: χ = n (h 11h h 1 h 1 ) h 1 h h 1 h ( ) = = = = 150 (00 000)

15 Assoziationsmessung in Kontingenztafeln 5..6 χ -basierte Maßzahlen Bemerkungen zum χ -Abstand: Unter empirischer Unabhängigkeit gilt χ = 0 (nach Konstruktion). Je stärker χ von 0 abweicht, umso stärker ist ceteris paribus der Zusammenhang. Der χ -Abstand wird die Grundlage bilden für den in Statistik betrachteten χ - Test. χ ist aber direkt bestenfalls zum Vergleich von Tabellen gleichen Typs heranzuziehen, da es vom Stichprobenumfang n und von der Zeilen- und Spaltenzahl abhängt = geeignet normieren. Es gilt: χ n (min{k, m} 1). Gleichheit gilt genau dann, wenn sich in jeder Spalte bzw. Zeile nur ein von Null verschiedener Eintrag befindet, also z.b. perfekte Abhängigkeit: (ist aber gar nicht für zu jedem Y gehört genau ein X und umgekehrt. alle Randverteilungen möglich) χ -basierte Zusammenhangsmaße a) Kontingenzkoeffizient nach Pearson: χ K := n + χ. (5.7) b) Korrigierter Kontingenzkoeffizient: K := K K max (5.8) mit K max := min{k, m} 1 min{k, m} c) Kontingenzkoeffizient nach Cramér (Cramérs V): V = = χ n (min{k, m} 1) χ maximaler Wert (5.9) d) Bei der Vierfeldertafel (k = m = ) gilt χ V = n (min{k, m} 1) = χ n.

16 Kapitel 5. Analyse von Zusammenhängen 89 Hierfür ist auch die Bezeichnung Phi-Koeffizient Φ üblich. Mit (5.6) ergibt sich also Φ = h 11 h h 1 h 1. (5.10) h1 h h 1 h Lässt man die Betragsstriche weg, so erhält man den signierten Phi-Koeffizienten oder Punkt-Korrelationskoeffizienten Φ s = h 11h h 1 h 1, h1 h h 1 h der häufig ebenfalls als Phi-Koeffizient bezeichnet wird. Φ S kann im Prinzip Werte zwischen -1 und 1 annehmen (ohne -1 und 1 immer erreichen zu können (s.u.)). Vorteil gegenüber Φ: Zusätzlich ist die Richtung des Zusammenhangs erkennbar: Φ s > 0 bei gleichsinnigem Zusammenhang (1 bei X bewirkt eher 1 bei Y, ) und Φ s < 0 bei gegensinnigem Zusammenhang (1 bei X bewirkt eher bei Y, 1) Berechnung im Beispiel : Beschäftigungsstatus und Geschlecht. Zur Erinnerung: χ = 4.435, m = k =, n = 150 K = K max = besch. ja nein 1 Frauen Männer χ n + χ = = min{k, m} = = min{k, m} K K = = = 0.59 K max χ V = Φ = n = = Φ s = h 11h h 1 h 1 = h1 h h 1 h = Schwerpunkt auf der Nebendiagonalen: Beschäftigte Männer, arbeitslose Frauen. Φ =0.4, deutet auf Zusammenhangs mittlerer Stärke hin.

17 Assoziationsmessung in Kontingenztafeln K, K, V und Φ nehmen Werte zwischen 0 und 1 an. Aufgrund ihrer Unabhängigkeit von n und von k und m sind sie prinzipiell zum Vergleich verschiedener Tabellen geeignet. Allerdings kann bei gegebener Randverteilung der Wert 1 nicht immer erreicht werden. Im Beispiel können bei insgesamt nur 30 Arbeitslosen nicht alle 80 Männer oder alle 65 Frauen arbeitslos sein. Es kann deshalb aussagekräftiger sein, noch zusätzlich auf die für die gegebene Randverteilung maximal mögliche Abhängigkeit zu normieren. Korrekturverfahren für Φ (Wagschal) 1. Bilde die Extremtabelle mit Einträgen h ij, d.h. i. Ersetze die Zelle mit der kleinsten absoluten Häufigkeit durch 0 ii. Fülle die Tafel entsprechend der Randverteilung auf!. Berechne den zugehörigen Phi-Koeffizienten Φ extrem. 3. Berechne den korrigierten Phi-Koeffizienten Φ korr := Φ Φ extrem bzw. den zugehörigen korrigierten signierten Phi-Koeffizienten Φ s,korr := Φ s Φ extrem. Berechnung im Beispiel: Extremsituation: Alle Männer beschäftigt. besch. ja nein 1 Frauen Männer Mit (5.10) erhält man h Φ extrem = 11h h 1h 1 h 1 h h 1h = und damit Φ korr = Φ = Φ extrem und Φ s,korr Relativ zum gegebenen Geschlechterverhältnis und zur Beschäftigungsrelation ergibt sich ein ziemlich starker Zusammenhang (Φ korr ). Wegen Φ s,korr < 0 gehören kleine Y - Werte eher zu großen X-Werten, also sind Frauen tendenziell stärker von Arbeitslosigkeit betroffen als Männer.

18 Kapitel 5. Analyse von Zusammenhängen Weitere Methoden für Vierfeldertafeln Typische Fragestellung aus der Medizin: X Y an nicht an Krebs Krebs erkrankt erkrankt b 1 b exponiert: Schadstoffen a 1 h 11 h 1 ausgesetzt nicht exponiert: Schadstoffen a h 1 h nicht ausgesetzt In der Medizin bezeichnet man die bedingte relative Häufigkeit f(b j a i ) als Risiko für b j unter Bedingung a i : R(b j a i ) := f(b j a i ) = h ij h i i, j = 1,. In der Epidemiologie wird standardmäßig R(b 1 a 1 ) betrachtet. Dies ist das Erkrankungsrisiko für Personen, die exponiert waren. Als Zusammenhangsmaß zwischen X und Y in Vierfelder-Tafeln verwendet man auch das darauf aufbauende relative Risiko: Definition : Für eine Vierfelder-Tafel heißt RR(b 1 ) := f(b 1 a 1 ) f(b 1 a ) = h 11/h 1 h 1 /h relatives Risiko und ist das Verhältnis des Erkrankungsrisikos für Personen, die exponiert waren (im Zähler) und für Personen, die nicht exponiert waren (im Nenner). Eigenschaften: RR(b 1 ) kann Werte zwischen 0 und annehmen. RR(b 1 ) = 1 würde bedeuten: Personen, die exponiert waren, haben das gleiche Erkrankungsrisiko wie Personen, die nicht exponiert waren. Es besteht kein Zusammenhang zwischen Exposition (Merkmal X) und Erkrankung (Merkmal Y ). RR(b 1 ) = 5 würde bedeuten: Personen, die exponiert waren, haben ein 5-mal so großes Erkrankungsrisiko wie Personen, die nicht exponiert waren, d.h. das Erkrankungsrisiko wäre für exponierte Personen deutlich höher. RR(b 1 ) = 1 würde bedeuten: Personen, die exponiert waren, haben nur ein Fünftel 5 des Erkrankungsrisikos von Personen, die nicht exponiert waren, d.h. das Erkrankungsrisiko wäre für exponierte Personen deutlich niedriger.

19 9 5.. Assoziationsmessung in Kontingenztafeln In der Medizin bezieht sich Risiko meist auf negative Ereignisse wie z.b. Erkrankung. Grundsätzlich sind Risiken aber symmetrisch verwendbar, d.h. auch für positive Ereignisse wie z.b. Beschäftigung: beschäftigt ja nein 1 Frau Mann Gemessen wird jetzt das Risiko (bzw. die Tendenz), beschäftigt zu sein, wenn man dem (vermuteten) Nachteilsfaktor weiblich zu sein, ausgesetzt ist. R(beschäftigt Frau) = f(b 1 a 1 ) = h 11 h 1 = = 8 13 Man sieht, dass das Risiko für sich genommen noch wenig aussagekräftig ist. RR(beschäftigt) = R(b 1 a 1 ) R(b 1 a ) = h 11/h 1 h 1 /h = 40/ /85 = = = 17 6 = 0, 65 3 Das Risiko, beschäftigt zu sein, ist bei den Frauen nur so groß wie bei den Männern, 3 also um (1 ) = 1 geringer. 3 3 Hier inhaltlich viel naheliegender: Die Risiken sind hier genau die Arbeitslosigkeitsquoten. RR(arbeitslos) = h 1/h 1 = 5/65 h /h 5/ = 5 65 = = Das Arbeitslosigkeitsrisiko (die Arbeitslosigkeitsquoten) ist bei den Frauen 6.53 mal so groß wie bei den Männern. Es zeigt sich also ein deutlicher Gechlechtereinfluß. Bei den Frauen beträgt die Arbeitslosigkeitsquote 5 = 38.5%, bei den Männern hingegen nur %. Definition: Die Größe d%(b j ) := ( f(b j a 1 ) f(b j a ) ) 100, i = 1, heißt Prozentsatzdifferenz für b j. d%(b 1 ) heißt Prozentsatzdifferenz (schlechthin). Eigenschaften: d%(b 1 ) ist die Differenz aus den Erkrankungsrisiken für Personen, die exponiert waren, und für Personen, die nicht exponiert waren. d%(b j ) kann Werte zwischen 100 und 100 annehmen.

20 Kapitel 5. Analyse von Zusammenhängen 93 d%(b 1 ) = 0 würde bedeuten: Personen, die exponiert waren, haben das gleiche Erkrankungsrisiko wie Personen, die nicht exponiert waren. Es besteht kein Zusammenhang zwischen Exposition (Merkmal X) und Erkrankung (Merkmal Y ). d%(b 1 ) = 10 würde bedeuten: Personen, die exponiert waren, haben ein um 10 Prozentpunkte höheres Erkrankungsrisiko als Personen, die nicht exponiert waren. d%(b 1 ) = 10 würde bedeuten: Personen, die exponiert waren, haben ein um 10 Prozentpunkte niedrigeres Erkrankungsrisiko als Personen, die nicht exponiert waren. Beispiel: Beschäftigung von Männern und Frauen beschäftigt ja nein 1 Frau Mann d%(b 1 ) = (f(b 1 a 1 ) f(b 1 a )) 100 ( h11 = h ) h 1 h = = = = Der Beschäftigtenanteil unter den Frauen beträgt 61.5%, der unter den Männer 94.1%. Es ergibt sich eine Differenz von 3.6%, die auf einen deutlichen Einfluss des Geschlechts hinweist. Offensichtlich gilt Bemerkungen: d%(b ) = (f(b a 1 ) f(b a )) 100 = = h 1 h 1 h h 100 = 3.6 d%(b 1 ) = (f(b 1 a 1 ) f(b 1 a )) = = (1 f(b a 1 )) (1 f(b a )) = (f(b a 1 )) f(b a 1 ) = = d%(b ) Den in diesem Abschnitt betrachteten Maßzahlen ist gemein, dass im Gegensatz zu den χ -basierten Maßzahlen das Vertauschen von Zeilen und Spalten die Maßzahl verändert. Das bedeutet für die Praxis: Man muss sich sehr genau überlegen, was man als abhängige und was als unabhängige Variable wählt.

21 Assoziationsmessung in Kontingenztafeln Man kann die zwei Risiken in einer Vierfelder-Tafel auf zwei Arten vergleichen: durch den Quotienten: sind Zähler und Nenner eines Bruches gleich, hat er den Wert 1 (d.h. die 1 dient als Vergleichswert) der Bruch ist > 1, wenn der Zähler größer ist als der Nenner. der Bruch ist < 1, wenn der Zähler kleiner ist als der Nenner. durch die Differenz: sind die beiden Terme einer Differenz gleich, hat sie den Wert 0 (d.h. die 0 dient als Vergleichswert) die Differenz ist > 0, wenn der erste Term größer ist als der zweite. die Differenz ist < 0, wenn der erste Term kleiner ist als der zweite. Bei kleinen Risiken ist die Prozentsatzdifferenz nicht sensitiv, z.b.: f(b 1 a 1 ) = 0.4, f(b 1 a ) = 0.41 RR(b 1 ) = 1.0 d%(b 1 ) = 1 f(b 1 a 1 ) = 0.0, f(b 1 a ) = 0.01 RR(b 1 ) =.0 d%(b 1 ) = 1 In solchen Fällen muss man inhaltlich abwägen, ob der Quotient oder die Differenz aussagekräftiger ist. Definition: Die Größe O(a i ) := R(b 1 a i ) 1 R(b 1 a i ) i = 1, heißt Odds (engl. plural) oder Chance von a i. Eigenschaften: Die Odds für exponierte Personen sind das Verhältnis des Risikos, krank zu werden (im Zähler), zum Risiko, nicht krank zu werden, also 1 dem Risiko krank zu werden (im Nenner). Es gilt: O(a i ) = f(b 1 a i ) 1 f(b 1 a i ) = f(b 1 a i ) f(b a i ) = h i1/h i h i /h i = h i1 h i Interpretation: Odds O(a 1 ) = 3 bedeuten, dass exponierte Personen 3 häufiger krank werden, als dass sie gesund bleiben.

22 Kapitel 5. Analyse von Zusammenhängen 95 Interpretation als Wettchance: Odds O(a 1 ) = 3 bedeuten ich wäre bereit im Verhältnis 3 : 1 zu wetten, würde also jede Wette mit einem Einsatz von höchstens pro Euro Gewinn akzeptieren, dass eine exponierte Person krank wird Beispiel: Beschäftigung von Männern und Frauen beschäftigt ja nein 1 Frau Mann O(weiblich) = h 11 h 1 = 40 5 = 8 5 = 1.6 O(männlich) = h 1 h = 80 5 = 16 Unter den Frauen gibt es 1.6 mal so viele Beschäftigte wie Arbeitslose, unter den Männern sind es 16 mal so viele Beschäftigte wie Arbeitslose. Eine Chance für sich sagt noch nichts über den Zusammenhang zwischen X und Y aus. Wenn es unter den Exponierten halb so viele Kranke wie Gesunde gibt, so kann dies gut oder schlecht sein. Dies hängt von den Odds bei den Nichtexponierten ab. Daher verwendet man als Zusammenhangsmaß zwischen X und Y die relativen Odds, die als Odds Ratio bezeichnet werden. Definition: Die Größe OR := O(a 1) O(a ) heißt Odds Ratio und vergleicht die Odds von exponierten Personen (im Zähler) und nicht exponierten Personen (im Nenner). Eigenschaften: OR kann Werte zwischen 0 und annehmen. OR = 1 würde bedeuten: Personen, die exponiert waren, haben die gleichen Odds wie Personen, die nicht exponiert waren. Es besteht kein Zusammenhang zwischen Exposition (Merkmal X) und Erkrankung (Merkmal Y ). OR = 5 würde bedeuten: Personen, die exponiert waren, haben 5-mal so große Odds wie Personen, die nicht exponiert waren, d.h. die Chance zu erkranken wäre für exponierte Personen deutlich höher. OR = 1 würde bedeuten: Personen, die exponiert waren, haben nur ein Fünftel 5 der Odds von Personen, die nicht exponiert waren, d.h. die Chance zu erkranken wäre für exponierte Personen deutlich niedriger. Um die Asymmetrie des Wertebereichs ([0; 1) bei gegenläufigem Zusammenhang und (1, ] bei gleichgerichtetem Zusammenhang) zu umgehen, wird gelegentlich auch ln OR betrachtet. Sein Wertebereich ist (, ), wobei nun bei 0 auf keinen Zusammenhang hinweist.

23 Assoziationsmessung in Kontingenztafeln Der Odds Ratio wird auch als Kreuzproduktverhältnis bezeichnet, denn es gilt: OR = O(a 1) O(a ) = R(b 1 a 1 ) 1 R(b 1 a 1 ) R(b 1 a ) 1 R(b 1 a ) = f(b 1 a 1 ) f(b a 1 ) f(b 1 a ) f(b a ) = h 11 /h 1 h 1 /h 1 h 1 /h h /h = h 11/h 1 h 1 /h = h 11 h h 1 h 1 Hieraus erkennt man auch die Parallele zu den früheren Zusammenhangsmaßen Φ und χ für 4-Felder-Tafeln, die ebenfalls auf dem Unterschied in den Produkten der Diagonalelemente h 11 h und der Nebendiagonalelemente h 1 h 1 aufbauen. Für χ gilt χ = n (h 11 h h 1 h 1 ) h 1 h h 1 h. An dieser Formel erkennt man, dass die Differenz im Zähler h 11 h h 1 h 1 groß wird, wenn die Häufigkeiten h 11 und h auf der Hauptdiagonalen groß, und die Häufigkeiten h 1 und h 1 auf den Nebendiagonalen klein sind. Im umgekehrten Fall wird die Differenz klein. Durch das Quadrieren des Zählers in der Formel für χ (bzw. durch den Übergang zum Betrag in der Formel für Φ) spielt die Richtung aber keine Rolle mehr, und χ und Φ werden insgesamt groß, wenn oder h 11 h h 1 h 1 h 11 h h 1 h 1 gilt, d.h wenn eine Diagonalstruktur vorliegt, die auf einen Zusammenhang zwischen den Merkmalen Y und X hinweist. Im OR werden dieselben Häufigkeiten nicht in einer Differenz, sondern in einem Bruch verwendet. Deshalb ist hier nicht von Interesse, ob der Koeffizient von 0 abweicht, wie bei den auf der Differenz aufbauenden Maßzahlen χ und Φ, sondern uns interessiert, ob der OR von 1 abweicht. Beispiel: Beschäftigung von Männern und Frauen beschäftigt ja nein 1 Frau Mann OR = O(a 1) O(a ) = 1 10

3.2 Bivariate Verteilungen

3.2 Bivariate Verteilungen 3.2 Bivariate Verteilungen zwei Variablen X, Y werden gemeinsam betrachtet (an jedem Objekt i, i = 1,..., n, werden gleichzeitig zwei Merkmale beobachtet) Beobachtungswerte sind Paare/Kombinationen von

Mehr

Analyse bivariater Kontingenztafeln

Analyse bivariater Kontingenztafeln Analyse bivariater Kontingenztafeln Werden zwei kategoriale Merkmale mit nicht zu vielen möglichen Ausprägungen gemeinsam analysiert, so kommen zur Beschreibung der gemeinsamen Verteilung im allgemeinen

Mehr

Zusammenhänge zwischen metrischen Merkmalen

Zusammenhänge zwischen metrischen Merkmalen Zusammenhänge zwischen metrischen Merkmalen Darstellung des Zusammenhangs, Korrelation und Regression Daten liegen zu zwei metrischen Merkmalen vor: Datenpaare (x i, y i ), i = 1,..., n Beispiel: x: Anzahl

Mehr

Kontingenzkoeffizient (nach Pearson)

Kontingenzkoeffizient (nach Pearson) Assoziationsmaß für zwei nominale Merkmale misst die Unabhängigkeit zweier Merkmale gibt keine Richtung eines Zusammenhanges an 46 o jl beobachtete Häufigkeiten der Kombination von Merkmalsausprägungen

Mehr

Kreuztabellenanalyse -Zusammenhangsmaße

Kreuztabellenanalyse -Zusammenhangsmaße Lehrveranstaltung Empirische Forschung und Politikberatung der Universität Bonn, WS 2007/2008 Kreuztabellenanalyse -Zusammenhangsmaße 14. Dezember 2007 Anja Hall, Bundesinstitut für Berufsbildung, AB 2.2:

Mehr

5 Zusammenhangsmaße, Korrelation und Regression

5 Zusammenhangsmaße, Korrelation und Regression 5 Zusammenhangsmaße, Korrelation und Regression 5.1 Zusammenhangsmaße und Korrelation Aufgabe 5.1 In einem Hauptstudiumsseminar des Lehrstuhls für Wirtschafts- und Sozialstatistik machten die Teilnehmer

Mehr

Einseitig gerichtete Relation: Mit zunehmender Höhe über dem Meeresspiegel sinkt im allgemeinen die Lufttemperatur.

Einseitig gerichtete Relation: Mit zunehmender Höhe über dem Meeresspiegel sinkt im allgemeinen die Lufttemperatur. Statistik Grundlagen Charakterisierung von Verteilungen Einführung Wahrscheinlichkeitsrechnung Wahrscheinlichkeitsverteilungen Schätzen und Testen Korrelation Regression Einführung Die Analyse und modellhafte

Mehr

Eine computergestützte Einführung mit

Eine computergestützte Einführung mit Thomas Cleff Deskriptive Statistik und Explorative Datenanalyse Eine computergestützte Einführung mit Excel, SPSS und STATA 3., überarbeitete und erweiterte Auflage ^ Springer Inhaltsverzeichnis 1 Statistik

Mehr

6.1 Grundbegriffe und historischer Hintergrund

6.1 Grundbegriffe und historischer Hintergrund Kapitel 6 Regression 61 Grundbegriffe und historischer Hintergrund Bedeutung der Regression: Eines der am häufigsten verwendeten statistischen Verfahren Vielfache Anwendung in den Sozialwissenschaften

Mehr

Abhängigkeit zweier Merkmale

Abhängigkeit zweier Merkmale Abhängigkeit zweier Merkmale Johannes Hain Lehrstuhl für Mathematik VIII Statistik 1/33 Allgemeine Situation Neben der Untersuchung auf Unterschiede zwischen zwei oder mehreren Untersuchungsgruppen hinsichtlich

Mehr

2. Deskriptive Statistik 2.1. Häufigkeitstabellen, Histogramme, empirische Verteilungsfunktionen

2. Deskriptive Statistik 2.1. Häufigkeitstabellen, Histogramme, empirische Verteilungsfunktionen 4. Datenanalyse und Modellbildung Deskriptive Statistik 2-1 2. Deskriptive Statistik 2.1. Häufigkeitstabellen, Histogramme, empirische Verteilungsfunktionen Für die Auswertung einer Messreihe, die in Form

Mehr

Multinomiale logistische Regression

Multinomiale logistische Regression Multinomiale logistische Regression Die multinomiale logistische Regression dient zur Schätzung von Gruppenzugehörigkeiten bzw. einer entsprechenden Wahrscheinlichkeit hierfür, wobei als abhänginge Variable

Mehr

Korrelation - Regression. Berghold, IMI

Korrelation - Regression. Berghold, IMI Korrelation - Regression Zusammenhang zwischen Variablen Bivariate Datenanalyse - Zusammenhang zwischen 2 stetigen Variablen Korrelation Einfaches lineares Regressionsmodell 1. Schritt: Erstellung eines

Mehr

Modul G.1 WS 07/08: Statistik 17.01.2008 1. Die Korrelation ist ein standardisiertes Maß für den linearen Zusammenhangzwischen zwei Variablen.

Modul G.1 WS 07/08: Statistik 17.01.2008 1. Die Korrelation ist ein standardisiertes Maß für den linearen Zusammenhangzwischen zwei Variablen. Modul G.1 WS 07/08: Statistik 17.01.2008 1 Wiederholung Kovarianz und Korrelation Kovarianz = Maß für den linearen Zusammenhang zwischen zwei Variablen x und y Korrelation Die Korrelation ist ein standardisiertes

Mehr

Multivariate Statistik

Multivariate Statistik Hermann Singer Multivariate Statistik 1 Auflage 15 Oktober 2012 Seite: 12 KAPITEL 1 FALLSTUDIEN Abbildung 12: Logistische Regression: Geschätzte Wahrscheinlichkeit für schlechte und gute Kredite (rot/blau)

Mehr

Grundbegriffe (1) Grundbegriffe (2)

Grundbegriffe (1) Grundbegriffe (2) Grundbegriffe (1) S.1 Äquivalenzklasse Unter einer Äquivalenzklasse versteht man eine Klasse von Objekten, die man hinsichtlich bestimmter Merkmalsausprägungen als gleich (äquivalent) betrachtet. (z.b.

Mehr

90-minütige Klausur Statistik für Studierende der Kommunikationswissenschaft

90-minütige Klausur Statistik für Studierende der Kommunikationswissenschaft Prof. Dr. Helmut Küchenhoff SS08 90-minütige Klausur Statistik für Studierende der Kommunikationswissenschaft am 22.7.2008 Anmerkungen Überprüfen Sie bitte sofort, ob Ihre Angabe vollständig ist. Sie sollte

Mehr

Skript zur Übung: Grundlagen der empirischen Sozialforschung - Datenanalyse

Skript zur Übung: Grundlagen der empirischen Sozialforschung - Datenanalyse Skript zur Übung: Grundlagen der empirischen Sozialforschung - Datenanalyse Phasen des Forschungsprozesses Auswahl des Forschungsproblems Theoriebildung Theoretische Phase Konzeptspezifikation / Operationalisierung

Mehr

Regressionsanalysen. Zusammenhänge von Variablen. Ziel der Regression. ( Idealfall )

Regressionsanalysen. Zusammenhänge von Variablen. Ziel der Regression. ( Idealfall ) Zusammenhänge von Variablen Regressionsanalysen linearer Zusammenhang ( Idealfall ) kein Zusammenhang nichtlinearer monotoner Zusammenhang (i.d.regel berechenbar über Variablentransformationen mittels

Mehr

1,11 1,12 1,13 1,14 1,15 1,16 1,17 1,17 1,17 1,18

1,11 1,12 1,13 1,14 1,15 1,16 1,17 1,17 1,17 1,18 3. Deskriptive Statistik Ziel der deskriptiven (beschreibenden) Statistik (explorativen Datenanalyse) ist die übersichtliche Darstellung der wesentlichen in den erhobenen Daten enthaltene Informationen

Mehr

Willkommen zur Vorlesung Statistik

Willkommen zur Vorlesung Statistik Willkommen zur Vorlesung Statistik Thema dieser Vorlesung: Varianzanalyse Prof. Dr. Wolfgang Ludwig-Mayerhofer Universität Siegen Philosophische Fakultät, Seminar für Sozialwissenschaften Prof. Dr. Wolfgang

Mehr

Linearer Zusammenhang von Datenreihen

Linearer Zusammenhang von Datenreihen Linearer Zusammenhang von Datenreihen Vielen Problemen liegen (möglicherweise) lineare Zusammenhänge zugrunde: Mein Internetanbieter verlangt eine Grundgebühr und rechnet minutenweise ab Ich bestelle ein

Mehr

Codierungstheorie Rudolf Scharlau, SoSe 2006 9

Codierungstheorie Rudolf Scharlau, SoSe 2006 9 Codierungstheorie Rudolf Scharlau, SoSe 2006 9 2 Optimale Codes Optimalität bezieht sich auf eine gegebene Quelle, d.h. eine Wahrscheinlichkeitsverteilung auf den Symbolen s 1,..., s q des Quellalphabets

Mehr

9.2. DER SATZ ÜBER IMPLIZITE FUNKTIONEN 83

9.2. DER SATZ ÜBER IMPLIZITE FUNKTIONEN 83 9.. DER SATZ ÜBER IMPLIZITE FUNKTIONEN 83 Die Grundfrage bei der Anwendung des Satzes über implizite Funktionen betrifft immer die folgende Situation: Wir haben eine Funktion f : V W und eine Stelle x

Mehr

0 Einführung: Was ist Statistik

0 Einführung: Was ist Statistik 0 Einführung: Was ist Statistik 1 Datenerhebung und Messung Die Messung Skalenniveaus 2 Univariate deskriptive Statistik 3 Multivariate Statistik 4 Regression 5 Ergänzungen Grundbegriffe Statistische Einheit,

Mehr

Institut für Soziologie. Methoden 2. Regressionsanalyse I: Einfache lineare Regression

Institut für Soziologie. Methoden 2. Regressionsanalyse I: Einfache lineare Regression Institut für Soziologie Methoden 2 Regressionsanalyse I: Einfache lineare Regression Programm Anwendungsbereich Vorgehensweise Interpretation Annahmen Zusammenfassung Übungsaufgabe Literatur # 2 Anwendungsbereich

Mehr

Der Internetdienst für Ihre Online-Umfragen. Leitfaden statistische Auswertung

Der Internetdienst für Ihre Online-Umfragen. Leitfaden statistische Auswertung Der Internetdienst für Ihre Online-Umfragen Leitfaden statistische Auswertung Weitere in dieser Reihe bei 2ask erschienene Leitfäden Allgemeiner Leitfaden zur Fragebogenerstellung Sie möchten einen Fragebogen

Mehr

Analog zu Aufgabe 16.1 werden die Daten durch folgenden Befehl eingelesen: > kredit<-read.table("c:\\compaufg\\kredit.

Analog zu Aufgabe 16.1 werden die Daten durch folgenden Befehl eingelesen: > kredit<-read.table(c:\\compaufg\\kredit. Lösung 16.3 Analog zu Aufgabe 16.1 werden die Daten durch folgenden Befehl eingelesen: > kredit

Mehr

Profil A 49,3 48,2 50,7 50,9 49,8 48,7 49,6 50,1 Profil B 51,8 49,6 53,2 51,1 51,1 53,4 50,7 50 51,5 51,7 48,8

Profil A 49,3 48,2 50,7 50,9 49,8 48,7 49,6 50,1 Profil B 51,8 49,6 53,2 51,1 51,1 53,4 50,7 50 51,5 51,7 48,8 1. Aufgabe: Eine Reifenfirma hat für Winterreifen unterschiedliche Profile entwickelt. Bei jeweils gleicher Geschwindigkeit und auch sonst gleichen Bedingungen wurden die Bremswirkungen gemessen. Die gemessenen

Mehr

Statistik und Wahrscheinlichkeitsrechnung

Statistik und Wahrscheinlichkeitsrechnung Statistik und Wahrscheinlichkeitsrechnung Übung 2 28.02.2008 1 Inhalt der heutigen Übung Beschreibende Statistik Gemeinsames Lösen der Übungsaufgaben 2.1: Häufigkeitsverteilung 2.2: Tukey Boxplot 25:Korrelation

Mehr

Diskriminanzanalyse Beispiel

Diskriminanzanalyse Beispiel Diskriminanzanalyse Ziel bei der Diskriminanzanalyse ist die Analyse von Gruppenunterschieden, d. h. der Untersuchung von zwei oder mehr Gruppen hinsichtlich einer Vielzahl von Variablen. Diese Methode

Mehr

3 Zusammenhangsmaße Zusammenhangshypothesen

3 Zusammenhangsmaße Zusammenhangshypothesen 3 Zusammenhangsmaße Zusammenhangshypothesen Zusammenhänge (zwischen 2 Variablen) misst man mittels Korrelationen. Die Wahl der Korrelation hängt ab von: a) Skalenniveau der beiden Variablen: 1) intervallskaliert

Mehr

Varianzanalyse ANOVA

Varianzanalyse ANOVA Varianzanalyse ANOVA Johannes Hain Lehrstuhl für Mathematik VIII Statistik 1/23 Einfaktorielle Varianzanalyse (ANOVA) Bisher war man lediglich in der Lage, mit dem t-test einen Mittelwertsvergleich für

Mehr

Übungsserie Nr. 10 mit Lösungen

Übungsserie Nr. 10 mit Lösungen Übungsserie Nr. 10 mit Lösungen 1 Ein Untersuchungsdesign sieht einen multivariaten Vergleich einer Stichprobe von Frauen mit einer Stichprobe von Männern hinsichtlich der Merkmale X1, X2 und X3 vor (Codierung:

Mehr

6. METRISCHE UND KATEGORIALE MERKMALE

6. METRISCHE UND KATEGORIALE MERKMALE 6. METRISCHE UND KATEGORIALE MERKMALE wenn an einer Beobachtungseinheit eine (oder mehrere) metrische und eine (oder mehrere) kategoriale Variable(n) erhoben wurden Beispiel: Haushaltsarbeit von Teenagern

Mehr

Kapitel 3. Zufallsvariable. Wahrscheinlichkeitsfunktion, Dichte und Verteilungsfunktion. Erwartungswert, Varianz und Standardabweichung

Kapitel 3. Zufallsvariable. Wahrscheinlichkeitsfunktion, Dichte und Verteilungsfunktion. Erwartungswert, Varianz und Standardabweichung Kapitel 3 Zufallsvariable Josef Leydold c 2006 Mathematische Methoden III Zufallsvariable 1 / 43 Lernziele Diskrete und stetige Zufallsvariable Wahrscheinlichkeitsfunktion, Dichte und Verteilungsfunktion

Mehr

Elisabeth Raab-Steiner/Michael Benesch. Der Fragebogen. Von der Forschungsidee zur SPSS/PASW-Auswertung. 2., aktualisierte Auflage. facultas.

Elisabeth Raab-Steiner/Michael Benesch. Der Fragebogen. Von der Forschungsidee zur SPSS/PASW-Auswertung. 2., aktualisierte Auflage. facultas. Elisabeth Raab-Steiner/Michael Benesch Der Fragebogen Von der Forschungsidee zur SPSS/PASW-Auswertung 2., aktualisierte Auflage facultas.wuv Inhaltsverzeichnis 1 Elementare Definitionen 11 1.1 Deskriptive

Mehr

Quantitative Methoden der Bildungsforschung

Quantitative Methoden der Bildungsforschung Glieung Wieholung Korrelationen Grundlagen lineare Regression Lineare Regression in SPSS Übung Wieholung Korrelationen Standardisiertes Zusammenhangsmaß (unstandardisiert: Kovarianz) linearer Zusammenhang

Mehr

8. Methoden der klassischen multivariaten Statistik

8. Methoden der klassischen multivariaten Statistik 8. Methoden der klassischen multivariaten Statistik 8.1. Darstellung von Daten Voraussetzungen auch in diesem Kapitel: Grundgesamtheit (Datenraum) Ω von Objekten (Fällen, Instanzen), denen J-Tupel von

Mehr

Statistik im Bachelor-Studium der BWL und VWL

Statistik im Bachelor-Studium der BWL und VWL Max C. Wewel Statistik im Bachelor-Studium der BWL und VWL Methoden, Anwendung, Interpretation Mit herausnehmbarer Formelsammlung ein Imprint von Pearson Education München Boston San Francisco Harlow,

Mehr

5.2. Nichtparametrische Tests. 5.2.1. Zwei unabhängige Stichproben: U- Test nach MANN- WHITNEY

5.2. Nichtparametrische Tests. 5.2.1. Zwei unabhängige Stichproben: U- Test nach MANN- WHITNEY 5.2. Nichtparametrische Tests 5.2.1. Zwei unabhängige Stichproben: U- Test nach MANN- WHITNEY Voraussetzungen: - Die Verteilungen der beiden Grundgesamtheiten sollten eine ähnliche Form aufweisen. - Die

Mehr

Prüfung zu Modul 26 (BA Bw) bzw. 10 (BA IB) (Wirtschaftsstatistik)

Prüfung zu Modul 26 (BA Bw) bzw. 10 (BA IB) (Wirtschaftsstatistik) 2 3 Klausur-Nr = Sitzplatz-Nr Prüfung zu Modul 26 (BA Bw) bzw. 10 (BA IB) (Wirtschaftsstatistik) Klausurteil 1: Beschreibende Statistik BeStat-1 (7 ) n = 400 Personen wurden gefragt, wie viele Stück eines

Mehr

Multiple Regression. Ziel: Vorhersage der Werte einer Variable (Kriterium) bei Kenntnis der Werte von zwei oder mehr anderen Variablen (Prädiktoren)

Multiple Regression. Ziel: Vorhersage der Werte einer Variable (Kriterium) bei Kenntnis der Werte von zwei oder mehr anderen Variablen (Prädiktoren) Multiple Regression 1 Was ist multiple lineare Regression? Ziel: Vorhersage der Werte einer Variable (Kriterium) bei Kenntnis der Werte von zwei oder mehr anderen Variablen (Prädiktoren) Annahme: Der Zusammenhang

Mehr

Statistische Verfahren für das Data Mining in einem Industrieprojekt

Statistische Verfahren für das Data Mining in einem Industrieprojekt Statistische Verfahren für das Data Mining in einem Industrieprojekt Thorsten Dickhaus Forschungszentrum Jülich GmbH Zentralinstitut für Angewandte Mathematik Telefon: 02461/61-4193 E-Mail: th.dickhaus@fz-juelich.de

Mehr

Univariate/ multivariate Ansätze. Klaus D. Kubinger. Test- und Beratungsstelle. Effektgrößen

Univariate/ multivariate Ansätze. Klaus D. Kubinger. Test- und Beratungsstelle. Effektgrößen Univariate/ multivariate Ansätze Klaus D. Kubinger Effektgrößen Rasch, D. & Kubinger, K.D. (2006). Statistik für das Psychologiestudium Mit Softwareunter-stützung zur Planung und Auswertung von Untersuchungen

Mehr

0, v 6 = 2 2. 1, v 4 = 1. 2. span(v 1, v 5, v 6 ) = span(v 1, v 2, v 3, v 4, v 5, v 6 ) 4. span(v 1, v 2, v 4 ) = span(v 2, v 3, v 5, v 6 )

0, v 6 = 2 2. 1, v 4 = 1. 2. span(v 1, v 5, v 6 ) = span(v 1, v 2, v 3, v 4, v 5, v 6 ) 4. span(v 1, v 2, v 4 ) = span(v 2, v 3, v 5, v 6 ) Aufgabe 65. Ganz schön span(n)end. Gegeben sei folgende Menge M von 6 Vektoren v, v,..., v 6 R 4 aus Aufgabe P 6: M = v =, v =, v =, v 4 =, v 5 =, v 6 = Welche der folgenden Aussagen sind wahr? span(v,

Mehr

Kommentierter SPSS-Ausdruck zur logistischen Regression

Kommentierter SPSS-Ausdruck zur logistischen Regression Daten: POK V AG 3 (POKV_AG3_V07.SAV) Kommentierter SPSS-Ausdruck zur logistischen Regression Fragestellung: Welchen Einfluss hat die Fachnähe und das Geschlecht auf die interpersonale Attraktion einer

Mehr

Kapitel 4: Binäre Regression

Kapitel 4: Binäre Regression Kapitel 4: Binäre Regression Steffen Unkel (basierend auf Folien von Nora Fenske) Statistik III für Nebenfachstudierende WS 2013/2014 4.1 Motivation Ausgangssituation Gegeben sind Daten (y i, x i1,...,

Mehr

Log-lineare Analyse I

Log-lineare Analyse I 1 Log-lineare Analyse I Einleitung Die log-lineare Analysemethode wurde von L.A. Goodman in den 60er und 70er Jahren entwickelt. Sie dient zur Analyse von Zusammenhängen in mehrdimensionalen Kontingenztafeln

Mehr

Inhaltsverzeichnis. Regressionsanalyse. http://mesosworld.ch - Stand vom: 20.1.2010 1

Inhaltsverzeichnis. Regressionsanalyse. http://mesosworld.ch - Stand vom: 20.1.2010 1 Inhaltsverzeichnis Regressionsanalyse... 2 Lernhinweise... 2 Einführung... 2 Theorie (1-8)... 2 1. Allgemeine Beziehungen... 3 2. 'Best Fit'... 3 3. 'Ordinary Least Squares'... 4 4. Formel der Regressionskoeffizienten...

Mehr

Elemente der Analysis II

Elemente der Analysis II Elemente der Analysis II Kapitel 3: Lineare Abbildungen und Gleichungssysteme Informationen zur Vorlesung: http://www.mathematik.uni-trier.de/ wengenroth/ J. Wengenroth () 15. Mai 2009 1 / 35 3.1 Beispiel

Mehr

$ % + 0 sonst. " p für X =1 $

$ % + 0 sonst.  p für X =1 $ 31 617 Spezielle Verteilungen 6171 Bernoulli Verteilung Wir beschreiben zunächst drei diskrete Verteilungen und beginnen mit einem Zufallsexperiment, indem wir uns für das Eintreffen eines bestimmten Ereignisses

Mehr

Auswertung mit dem Statistikprogramm SPSS: 30.11.05

Auswertung mit dem Statistikprogramm SPSS: 30.11.05 Auswertung mit dem Statistikprogramm SPSS: 30.11.05 Seite 1 Einführung SPSS Was ist eine Fragestellung? Beispiel Welche statistische Prozedur gehört zu welcher Hypothese? Statistische Berechnungen mit

Mehr

Untersuchungen zum Thema Tracking Error

Untersuchungen zum Thema Tracking Error Untersuchungen zum Thema Tracking Error J. Fulmek 24. August 2003 1 Einleitung Im Folgenden werden folgende Punkte untersucht: 1. verschiedene in der Literatur übliche Definitionen des Tracking Errors

Mehr

12. Vergleich mehrerer Stichproben

12. Vergleich mehrerer Stichproben 12. Vergleich mehrerer Stichproben Dr. Antje Kiesel Institut für Angewandte Mathematik WS 2011/2012 Häufig wollen wir verschiedene Populationen, Verfahren, usw. miteinander vergleichen. Beipiel: Vergleich

Mehr

Einführung in die Vektor- und Matrizenrechnung. Matrizen

Einführung in die Vektor- und Matrizenrechnung. Matrizen Einführung in die Vektor- und Matrizenrechnung Matrizen Definition einer Matrix Unter einer (reellen) m x n Matrix A versteht man ein rechteckiges Schema aus reellen Zahlen, die wie folgt angeordnet sind:

Mehr

Trainingsaufgaben zur Klausurvorbereitung in Statistik I und II Thema: Satz von Bayes

Trainingsaufgaben zur Klausurvorbereitung in Statistik I und II Thema: Satz von Bayes Trainingsaufgaben zur Klausurvorbereitung in Statistik I und II Thema: Satz von Bayes Aufgabe 1: Wetterbericht Im Mittel sagt der Wetterbericht für den kommenden Tag zu 60 % schönes und zu 40% schlechtes

Mehr

Grundlagen der Inferenzstatistik: Was Ihnen nicht erspart bleibt!

Grundlagen der Inferenzstatistik: Was Ihnen nicht erspart bleibt! Grundlagen der Inferenzstatistik: Was Ihnen nicht erspart bleibt! 1 Einführung 2 Wahrscheinlichkeiten kurz gefasst 3 Zufallsvariablen und Verteilungen 4 Theoretische Verteilungen (Wahrscheinlichkeitsfunktion)

Mehr

Quantitative Risk Management

Quantitative Risk Management Quantitative Risk Management Copulas und Abhängigkeit Johannes Paschetag Mathematisches Institut der Universität zu Köln Wintersemester 2009/10 Betreuung: Prof. Schmidli, J. Eisenberg i Inhaltsverzeichnis

Mehr

Bachelorabschlussseminar Dipl.-Kfm. Daniel Cracau

Bachelorabschlussseminar Dipl.-Kfm. Daniel Cracau 1 Einführung in die statistische Datenanalyse Bachelorabschlussseminar Dipl.-Kfm. Daniel Cracau 2 Gliederung 1.Grundlagen 2.Nicht-parametrische Tests a. Mann-Whitney-Wilcoxon-U Test b. Wilcoxon-Signed-Rank

Mehr

x 2 2x + = 3 + Es gibt genau ein x R mit ax + b = 0, denn es gilt

x 2 2x + = 3 + Es gibt genau ein x R mit ax + b = 0, denn es gilt - 17 - Die Frage ist hier also: Für welche x R gilt x = x + 1? Das ist eine quadratische Gleichung für x. Es gilt x = x + 1 x x 3 = 0, und man kann quadratische Ergänzung machen:... ( ) ( ) x x + = 3 +

Mehr

Beispiel 48. 4.3.2 Zusammengesetzte Zufallsvariablen

Beispiel 48. 4.3.2 Zusammengesetzte Zufallsvariablen 4.3.2 Zusammengesetzte Zufallsvariablen Beispiel 48 Ein Würfel werde zweimal geworfen. X bzw. Y bezeichne die Augenzahl im ersten bzw. zweiten Wurf. Sei Z := X + Y die Summe der gewürfelten Augenzahlen.

Mehr

Teil II. Nichtlineare Optimierung

Teil II. Nichtlineare Optimierung Teil II Nichtlineare Optimierung 60 Kapitel 1 Einleitung In diesem Abschnitt wird die Optimierung von Funktionen min {f(x)} x Ω betrachtet, wobei Ω R n eine abgeschlossene Menge und f : Ω R eine gegebene

Mehr

ax 2 + bx + c = 0, (4.1)

ax 2 + bx + c = 0, (4.1) Kapitel 4 Komplexe Zahlen Wenn wir uns auf die reellen Zahlen beschränken, ist die Operation des Wurzelziehens (also die Umkehrung der Potenzierung) nicht immer möglich. Zum Beispiel können wir nicht die

Mehr

Dr. habil. Rüdiger Jacob Methoden und Techniken der empirischen Sozialforschung Vorlesung mit Diskussion

Dr. habil. Rüdiger Jacob Methoden und Techniken der empirischen Sozialforschung Vorlesung mit Diskussion Dr. habil. Rüdiger Jacob Methoden und Techniken der empirischen Sozialforschung Vorlesung mit Diskussion 4. Messtheorie Messen in den Sozialwissenschaften, Operationalisierung und Indikatoren, Messniveaus,

Mehr

1 Deskriptive Statistik

1 Deskriptive Statistik 1 1 Deskriptive Statistik Statistik und die von dieser Wissenschaft bereitgestellten Methoden sind stets notwendig, wenn im Rahmen empirischer Untersuchungen Daten erhoben und analysiert werden sollen.

Mehr

2. Eindimensionale (univariate) Datenanalyse

2. Eindimensionale (univariate) Datenanalyse 2. Eindimensionale (univariate) Datenanalyse Dr. Antje Kiesel Institut für Angewandte Mathematik WS 2011/2012 Kennzahlen, Statistiken In der Regel interessieren uns nicht so sehr die beobachteten Einzeldaten

Mehr

Mathematik-Dossier. Die lineare Funktion

Mathematik-Dossier. Die lineare Funktion Name: Mathematik-Dossier Die lineare Funktion Inhalt: Lineare Funktion Lösen von Gleichungssystemen und schneiden von Geraden Verwendung: Dieses Dossier dient der Repetition und Festigung innerhalb der

Mehr

Koeffizienten der Logitanalyse. Kurt Holm. Almo Statistik-System www.almo-statistik.de holm@almo-statistik.de kurt.holm@jku.at

Koeffizienten der Logitanalyse. Kurt Holm. Almo Statistik-System www.almo-statistik.de holm@almo-statistik.de kurt.holm@jku.at Koeffizienten der Logitanalyse Kurt Holm Almo Statistik-System www.almo-statistik.de holm@almo-statistik.de kurt.holm@jku.at 1 Kurt Holm Koeffizienten der Logitanalyse Eine häufig gestellte Frage lautet:

Mehr

Vorlesung. Funktionen/Abbildungen 1

Vorlesung. Funktionen/Abbildungen 1 Vorlesung Funktionen/Abbildungen 1 1 Grundlagen Hinweis: In dieser Vorlesung werden Funktionen und Abbildungen synonym verwendet. In der Schule wird eine Funktion häufig als eindeutige Zuordnung definiert.

Mehr

Messsystemanalyse (MSA)

Messsystemanalyse (MSA) Messsystemanalyse (MSA) Inhaltsverzeichnis Ursachen & Auswirkungen von Messabweichungen Qualifikations- und Fähigkeitsnachweise Vorteile einer Fähigkeitsuntersuchung Anforderungen an das Messsystem Genauigkeit

Mehr

Quantitative empirische Sozialforschung

Quantitative empirische Sozialforschung Heinz-Günter Micheel Quantitative empirische Sozialforschung Mit 37 Abbildungen und 34 Tabellen Ernst Reinhardt Verlag München Basel Dr. Heinz-Günter Micheel ist Privatdozent an der Fakultät für Erziehungswissenschaft

Mehr

Seminararbeit für das SE Reine Mathematik- Graphentheorie

Seminararbeit für das SE Reine Mathematik- Graphentheorie Seminararbeit für das SE Reine Mathematik- Graphentheorie Der binäre Rang, der symplektische Graph, die Spektralzerlegung und rationale Funktionen Vortrag am 24.01.2012 Heike Farkas 0410052 Inhaltsverzeichnis

Mehr

Bisher angenommen: jeder Spieler kennt alle Teile des Spiels. - Diskontfaktor des Verhandlungspartners

Bisher angenommen: jeder Spieler kennt alle Teile des Spiels. - Diskontfaktor des Verhandlungspartners 1 KAP 15. Spiele unter unvollständiger Information Bisher angenommen: jeder Spieler kennt alle Teile des Spiels seine Gegenspieler, deren Aktionen, deren Nutzen, seinen eigenen Nutzen etc. Oft kennt man

Mehr

Grundlagen quantitativer Sozialforschung Interferenzstatistische Datenanalyse in MS Excel

Grundlagen quantitativer Sozialforschung Interferenzstatistische Datenanalyse in MS Excel Grundlagen quantitativer Sozialforschung Interferenzstatistische Datenanalyse in MS Excel 16.11.01 MP1 - Grundlagen quantitativer Sozialforschung - (4) Datenanalyse 1 Gliederung Datenanalyse (inferenzstatistisch)

Mehr

Kundenzufriedenheitsbefragung 2014

Kundenzufriedenheitsbefragung 2014 Kundenzufriedenheitsbefragung 2014 Auswertungsband über alle bisher erhobenen Augenoptiker Anton Optik e.k. Februar 2015, V100 Label TÜV SÜD Management Service GmbH 1 1 2 Hintergrund der Erhebung Zusammenfassung

Mehr

Auswertung und Darstellung wissenschaftlicher Daten (1)

Auswertung und Darstellung wissenschaftlicher Daten (1) Auswertung und Darstellung wissenschaftlicher Daten () Mag. Dr. Andrea Payrhuber Zwei Schritte der Auswertung. Deskriptive Darstellung aller Daten 2. analytische Darstellung (Gruppenvergleiche) SPSS-Andrea

Mehr

Christian FG Schendera. Regressionsanalyse. mit SPSS. 2. korrigierte und aktualisierte Auflage DE GRUYTER OLDENBOURG

Christian FG Schendera. Regressionsanalyse. mit SPSS. 2. korrigierte und aktualisierte Auflage DE GRUYTER OLDENBOURG Christian FG Schendera Regressionsanalyse mit SPSS 2. korrigierte und aktualisierte Auflage DE GRUYTER OLDENBOURG Inhalt Vorworte V 1 Korrelation 1 1.1 Einführung 1 1.2 Erste Voraussetzung: Das Skalenniveau

Mehr

Austausch- bzw. Übergangsprozesse und Gleichgewichtsverteilungen

Austausch- bzw. Übergangsprozesse und Gleichgewichtsverteilungen Austausch- bzw. Übergangsrozesse und Gleichgewichtsverteilungen Wir betrachten ein System mit verschiedenen Zuständen, zwischen denen ein Austausch stattfinden kann. Etwa soziale Schichten in einer Gesellschaft:

Mehr

Häufigkeitstabellen. Balken- oder Kreisdiagramme. kritischer Wert für χ2-test. Kontingenztafeln

Häufigkeitstabellen. Balken- oder Kreisdiagramme. kritischer Wert für χ2-test. Kontingenztafeln Häufigkeitstabellen Menüpunkt Data PivotTable Report (bzw. entsprechendes Icon): wähle Data Range (Zellen, die die Daten enthalten + Zelle mit Variablenname) wähle kategoriale Variable für Spalten- oder

Mehr

Binäre abhängige Variablen

Binäre abhängige Variablen Binäre abhängige Variablen Thushyanthan Baskaran thushyanthan.baskaran@awi.uni-heidelberg.de Alfred Weber Institut Ruprecht Karls Universität Heidelberg Einführung Oft wollen wir qualitative Variablen

Mehr

11.3 Komplexe Potenzreihen und weitere komplexe Funktionen

11.3 Komplexe Potenzreihen und weitere komplexe Funktionen .3 Komplexe Potenzreihen und weitere komplexe Funktionen Definition.) komplexe Folgen: z n = x n + j. y n mit zwei reellen Folgen x n und y n.) Konvergenz: Eine komplexe Folge z n = x n + j. y n heißt

Mehr

Übungen zur Ingenieur-Mathematik III WS 2009/10 Blatt 10 21.12.2009

Übungen zur Ingenieur-Mathematik III WS 2009/10 Blatt 10 21.12.2009 Übungen zur Ingenieur-Mathematik III WS 2009/10 Blatt 10 21.12.2009 Aufgabe 35: Thema: Singulärwertzerlegung und assoziierte Unterräume Sei A eine m n Matrix mit Rang r und A = UDV T ihre Singulärwertzerlegung.

Mehr

Klausur zur Vorlesung Statistik III für Studenten mit dem Wahlfach Statistik

Klausur zur Vorlesung Statistik III für Studenten mit dem Wahlfach Statistik Ludwig Fahrmeir, Nora Fenske Institut für Statistik Bitte für die Korrektur freilassen! Aufgabe 1 2 3 4 Punkte Klausur zur Vorlesung Statistik III für Studenten mit dem Wahlfach Statistik 29. März 21 Hinweise:

Mehr

6. Bayes-Klassifikation. (Schukat-Talamazzini 2002)

6. Bayes-Klassifikation. (Schukat-Talamazzini 2002) 6. Bayes-Klassifikation (Schukat-Talamazzini 2002) (Böhm 2003) (Klawonn 2004) Der Satz von Bayes: Beweis: Klassifikation mittels des Satzes von Bayes (Klawonn 2004) Allgemeine Definition: Davon zu unterscheiden

Mehr

(2) (x 2 1 + x 2 2 + + x 2 n)(y 2 1 + y 2 2 + + y 2 n) = z 2 1 + z 2 2 + + z 2 n

(2) (x 2 1 + x 2 2 + + x 2 n)(y 2 1 + y 2 2 + + y 2 n) = z 2 1 + z 2 2 + + z 2 n Über die Komposition der quadratischen Formen von beliebig vielen Variablen 1. (Nachrichten von der k. Gesellschaft der Wissenschaften zu Göttingen, Mathematisch-physikalische Klasse, 1898, S. 309 316.)

Mehr

Einführung in die Statistik mir R

Einführung in die Statistik mir R Einführung in die Statistik mir R ww w. syn t egris.de Überblick GESCHÄFTSFÜHRUNG Andreas Baumgart, Business Processes and Service Gunar Hofmann, IT Solutions Sven-Uwe Weller, Design und Development Jens

Mehr

29. Mai 2006. 5. Bei Unterschleif gilt die Klausur als nicht bestanden und es erfolgt eine Meldung an das Prüfungsamt.

29. Mai 2006. 5. Bei Unterschleif gilt die Klausur als nicht bestanden und es erfolgt eine Meldung an das Prüfungsamt. L. Fahrmeir, C. Belitz Department für Statistik Bitte für die Korrektur freilassen! Aufgabe 1 2 3 4 Punkte Klausur zur Vorlesung Statistik III für Studenten mit Wahlfach Statistik 29. Mai 2006 Hinweise:

Mehr

Tabelle 6a: Deskriptive Statistiken der metrischen Variablen

Tabelle 6a: Deskriptive Statistiken der metrischen Variablen Ergebnisse 77 5 Ergebnisse Das folgende Kapitel widmet sich der statistischen Auswertung der Daten zur Ü- berprüfung der Hypothesen. Die hier verwendeten Daten wurden mit den in 4.3 beschriebenen Instrumenten

Mehr

Statistik I für Wirtschaftswissenschaftler Klausur am 06.07.2007, 14.00 16.00.

Statistik I für Wirtschaftswissenschaftler Klausur am 06.07.2007, 14.00 16.00. 1 Statistik I für Wirtschaftswissenschaftler Klausur am 06.07.2007, 14.00 16.00. Bitte unbedingt beachten: a) Gewertet werden alle 9 gestellten Aufgaben. b) Lösungswege sind anzugeben. Die Angabe des Endergebnisses

Mehr

Univariate Lineare Regression. (eine unabhängige Variable)

Univariate Lineare Regression. (eine unabhängige Variable) Univariate Lineare Regression (eine unabhängige Variable) Lineare Regression y=a+bx Präzise lineare Beziehung a.. Intercept b..anstieg y..abhängige Variable x..unabhängige Variable Lineare Regression y=a+bx+e

Mehr

Marktliquidität von Aktien

Marktliquidität von Aktien Marktliquidität von Aktien Inauguraldissertation zur Erlangung der Würde eines Doctor rerum oeconomicarum der Wirtschafts- und Sozialwissenschaftlichen Fakultät der Universität Bern Lukas Roth Die Fakultät

Mehr

Conjoint Analyse. Ordnen Sie bitte die Objekte Ihren Präferenzen entsprechend in eine Rangreihe.

Conjoint Analyse. Ordnen Sie bitte die Objekte Ihren Präferenzen entsprechend in eine Rangreihe. Conjoint Analyse CONsidered JOINTly Conjoint Analyse Ordnen Sie bitte die Objekte Ihren Präferenzen entsprechend in eine Rangreihe. traditionelle auswahlbasierte Wählen Sie bitte aus den Alternativen,

Mehr

Medizinische Statistik Epidemiologie und χ 2 Vierfeldertest

Medizinische Statistik Epidemiologie und χ 2 Vierfeldertest Universität Wien Institut für Mathematik Wintersemester 2009/2010 Medizinische Statistik Epidemiologie und χ 2 Vierfeldertest Seminar Angewandte Mathematik Ao. Univ. Prof. Dr. Peter Schmitt von Nadja Reiterer

Mehr

Inhaltsverzeichnis. I Einführung in STATISTICA 1. 1 Erste Schritte in STATISTICA 3

Inhaltsverzeichnis. I Einführung in STATISTICA 1. 1 Erste Schritte in STATISTICA 3 I Einführung in STATISTICA 1 1 Erste Schritte in STATISTICA 3 2 Datenhaltung in STATISTICA 11 2.1 Die unterschiedlichen Dateitypen in STATISTICA....... 11 2.2 Import von Daten......... 12 2.3 Export von

Mehr

Lineare Algebra - alles was man wissen muß

Lineare Algebra - alles was man wissen muß Statistik für Bioinformatiker SoSe 3 Rainer Spang Lineare Algebra - alles was man wissen muß Der Titel ist natürlich gelogen, aber was wir hier zusammengetragen haben ist zumindest ein Anfang. Weniger

Mehr

Verteilungsmodelle. Verteilungsfunktion und Dichte von T

Verteilungsmodelle. Verteilungsfunktion und Dichte von T Verteilungsmodelle Verteilungsfunktion und Dichte von T Survivalfunktion von T Hazardrate von T Beziehungen zwischen F(t), S(t), f(t) und h(t) Vorüberlegung zu Lebensdauerverteilungen Die Exponentialverteilung

Mehr

HTS-Berichte des ZTD - 01/2002 Vergleichsuntersuchung WILDE-Intelligenz-Test - Daten BFW Leipzig Bearbeiterin: A. Bettinville

HTS-Berichte des ZTD - 01/2002 Vergleichsuntersuchung WILDE-Intelligenz-Test - Daten BFW Leipzig Bearbeiterin: A. Bettinville UNIVERSITÉ DE FRIBOURG SUISSE UNIVERSITÄT FREIBURG SCHWEIZ ZENTRUM FÜR TESTENTWICKLUNG UND DIAGNOSTIK AM DEPARTEMENT FÜR PSYCHOLOGIE CENTRE POUR LE DEVELOPPEMENT DE TESTS ET LE DIAGNOSTIC AU DEPARTEMENT

Mehr

Stichprobenauslegung. für stetige und binäre Datentypen

Stichprobenauslegung. für stetige und binäre Datentypen Stichprobenauslegung für stetige und binäre Datentypen Roadmap zu Stichproben Hypothese über das interessierende Merkmal aufstellen Stichprobe entnehmen Beobachtete Messwerte abbilden Schluss von der Beobachtung

Mehr

Medizinische Biometrie (L5)

Medizinische Biometrie (L5) Medizinische Biometrie (L5) Vorlesung II Daten Deskription Prof. Dr. Ulrich Mansmann Institut für Medizinische Informationsverarbeitung, Biometrie und Epidemiologie mansmann@ibe.med.uni-muenchen.de IBE,

Mehr