Warum reicht die Varianz nicht zur Konzentrationsmessung aus? Betrachtet man die Merkmale X A (

Größe: px
Ab Seite anzeigen:

Download "Warum reicht die Varianz nicht zur Konzentrationsmessung aus? Betrachtet man die Merkmale X A ("

Transkript

1 Kapitel 4 Konzentrationsmaße Warum reicht die Varianz nicht zur Konzentrationsmessung aus? Betrachtet man die Merkmale X A ( Einkommen in Land A ) und X B ( Einkommen in Land B ) mit folgender Häufigkeitsverteilung Land A j a j f j Land B j a j f j so gilt s X A s X B, obwohl die Verteilungen ganz unterschiedlich sind. A B Arm Reich Arm Reich In Land A haben Wenige ein geringes Einkommen, während in Land B Viele ein geringes Einkommen haben. Gleicher Wert der Varianz / Streuung, aber ganz unterschiedliches Streuverhalten. Die üblichen Streuungsmaße messen symmetrisch die Variabilität um das Zentrum (arithmetisches Mittel, Median). Überschreiten und Unterschreiten des Mittelwerts werden also gleich gewichtet, geben aber keine Auskunft über die Gleichmäßigkeit der Verteilung bzw. über die sog. Konzentration. Grundfrage der Konzentrationsmessung: Wie verteilt sich die Gesamtsumme (etwa das Vermögen) unter den einzelnen Einheiten? Beispiel: Welchen Anteil am Gesamtvermögen haben die Reichsten? Durchgängige Annahmen in diesem Kapitel: X sei ein verhältnisskaliertes Merkmal mit Urliste x 1,..., x n. 55

2 Relative Konzentrationsmessung x i 0, für alle i 1,..., n und verschieden). Betrachtet werden die der Größe nach geordneten Daten: n x i > 0 (d.h mindestens ein Wert ist von Null x (1) x ()... x (n) Achtung: Die Klammern im Index werden in der Literatur oft weggelassen (z.b in Fahrmeir et al., 007). Dann muss man vor dem Anwenden der dortigen Formeln die Daten ordnen. Später wird allerdings, wenn auf die Ausprägungen a 1,..., a k übergegangen wird, angenommen, dass a 1 < a <... < a k gilt, dass also diese Ausprägungen bereits geordnet sind. 4.1 Relative Konzentrationsmessung Lorenzkurve Erste und bekannteste Form der Konzentrationsmessung. Bezeichne mit u j : j n den Anteil der j kleinsten Merkmalsträger und mit j j v j : x (i) n x i den anteiligen Beitrag dieser Einheiten ( kumulierte relative Merkmalssumme ) zur Gesamtsumme n n x i x (i). Die stückweise lineare Kurve durch die Punkte (0, 0), (u 1, v 1 ), (u, v ),..., (u n, v n ) (1, 1), heißt Lorenzkurve. n x (i) x (i) 1

3 Kapitel 4. Konzentrationsmaße 57 Interpretation der Lorenzkurve: Der Punkt (u j, v j ) bedeutet: Die u j 100% Einheiten mit den kleinsten Ausprägungen (z.b. die 90% Ärmsten) haben v j 100% des Gesamtbestandes (z.b. 8.5% des Gesamtvermögens). Wie liegen die Punkte bei minimaler Konzentration? (Konzentration0, entspricht gleichmäßiger Verteilung) 10% kleinste haben 10% 0% 0% usw. Es gilt also u j v j für alle j, d.h. die Punkte (u j, v j ) liegen auf der Winkelhalbierenden. Die Lorenzkurve ist nach unten gewölbt (konvexe Funktion). Punkte oberhalb der Winkelhalbierenden kommen nicht vor. Ähnlich überlegt man sich: die Kurve muss monoton wachsend sein. Gegenbeispiel: z.b. Punkte (0.6,0.8) und (0.7,0.7) würden bedeuten: die 60% Ärmsten haben 80% des Vermögens aber die 70% Ärmsten haben nur 70% des Vermögens. Extremfall: vollständige Konzentration n 1 n-te Personen haben gar nichts Person hat alles 1 n 1 1 n Konzentration 0 bedeutet gleichmässige Verteilung in dem Sinne, dass jede Einheit denselben Wert bzw. denselben Anteil an der Gesamtsumme hat. Dies bedeutet x 1 x... x n und damit h j n bzw. f j 1 für eine bestimmte Ausprägung a j x 1. Dies ist zu unterscheiden von der sog. Gleichverteilung der Häufigkeiten. Dort ist h 1 h... h k, also jede Ausprägung a j gleich häufig vertreten. alle denselben Wert, Konzentration 0 jeder Wert gleich häufig

4 Relative Konzentrationsmessung Je weiter die Kurve von der Winkelhalbierenden entfernt ist, also je tiefer ceteris paribus v j ist, umso stärker ist die Konzentration. Insbesondere bei größeren Datensätzen vereinfacht sich die Berechnung wesentlich, wenn man die relativen/absoluten Häufigkeiten f 1,..., f k bzw. h 1,..., h k der der Größe nach geordneten Merkmalsausprägungen a 1 < a <... < a k benutzt. Dann ist für j 1,..., k und u j j h l n j f l F (a j ) j j v j h l a l h l a l f l a l f l a l partielles arith. Mittel über die ersten j. x Ist bei klassierten Daten mit den Klassen [c 0, c 1 ), [c 1, c ),..., [c k 1, c k ] die Merkmalsverteilung in den Klassen nicht bekannt, so nimmt man wie bei den Berechnungen zum arithmetischen Mittel als Approximation an, dass alle Ausprägungen in dieser Klasse auf die Klassenmitte m l c l 1+c l fallen und erhält: j v j h l m l. h l m l (untere Abschätzung: in jeweiliger Klasse keine Konzentration). Während normalerweise bei Lorenzkurven nur die Punkte (0, 0), (u 1, v 1 ),... interpretierbar sind, sind bei klassierten Daten auch die linearen Zwischenstücke interpretierbar. Berechnung der Lorenzkurve im Beispiel: l a A l f A l j f A l u j f A l a A l j f A l a A l j f l a l vj A f l a l

5 Kapitel 4. Konzentrationsmaße 59 l a B l f B l j f B l u j f B l a B l j f B l a B l v B j Gini-Koeffizient Will man die Konzentration durch eine einzige Maßzahl beschreiben, so liegt es nahe, die Fläche zwischen der Winkelhalbierenden und der Kurve heranzuziehen. Definition: Gegeben sei die geordnete Urliste x (1), x (),..., x (n) eines verhältnisskalierten Merkmals X. Dann heißt n G : i x (i) n n x n + 1 i n Gini-Koeffizient und G : n n 1 G normierter Gini-Koeffizient (Lorenz-Münzner-Koeffizient). Bemerkungen: Man kann zeigen (Herleitung über Trapezformel, z.b. Toutenburg, 006): Es gilt G Fläche zwischen Winkelhalbierender und Lorenzkurve Fläche zwischen Winkelhalbierender und Abszisse Fläche zwischen Winkelhalbierender und Lorenzkurve Es gilt bei minimaler Konzentration G 0 und bei maximaler Konzentration G n 1 n. Damit ist also G 0 bei minimaler Konzentration und G 1 bei maximaler Konzentration. Ist n sehr groß, so gilt n 1 n 1, also G G.

6 Relative Konzentrationsmessung Betrachtet man die geordneten Ausprägungen a 1 < a <... < a k mit den Häufigkeiten h 1, h,..., h k, so gilt G (u l 1 + u l )f l a l 1 f l a l (u l 1 + u l )h l a l 1 h l a l mit und u 0 : 0. u j 1 n j h l Beispiel: j l Land I: a l f l u l f l a l f l a l j fl a l fj a j j l Land II: a l f l u l f l a l f l a l j fl a l fl a l Die Formel vereinfacht sich hier zu G k (u l 1 + u l )f l a l k f la l 1 und man erhält für G (0 + u 1) f 1 a 1 + (u 1 + u ) f a f 1 a 1 + f a 1 Land I: ( ) G

7 Kapitel 4. Konzentrationsmaße 61 Land II: ( ) G Alternativ kann man direkt mit den Flächen rechnen: G Fläche zwischen Winkelhalbierender und Lorenzkurve. Land I: Berechne zunächst die Fläche unter der Lorenzkurve: G ( 1 0.3) 0.4 Analog für Land II: G ( 1 0.3) 0.4 Wie man sieht, können unterschiedliche Situationen zu demselben Gini-Index führen. auch Lorenzkurven betrachten! Quantilsbezogene relative Konzentrationsmessung Oft werden Daten quantilsbezogen vergröbert bzw. zusammengefasst und auch nur die entsprechenden Anteile der Merkmalssumme in den Quantilen angegeben. Beispiel: Einkommenskonzentration in Brasilien Quintile der Bevölkerung: 0% 40% 60% 80% 100% Prozent des Einkommens: z 1 z z 3 z 4 z 5 (Summe Prozent > 100 wegen Rundung) Für α, α, 3α,... (α 0. im Beispiel) erhält man die zugehörigen v-werte der Lorenzkurve v 1, v, v 3,..., durch jα n Also im Beispiel: v j x (i) n l j x (i) u 1 α 0. v 1 z 1.5% u α 0.4 v z 1 + z.5% + 4.9% 7.4% u 3 3α 0.6 v 3 z 1 + z + z % u 4 4α 0.8 v 4 z 1 + z + z 3 + z % u 5 5α 1 v 5 z 1 + z + z 3 + z 4 + z 5 100% z j

8 Relative Konzentrationsmessung Damit lässt sich die Lorenzkurve an den Punkten (α, v 1 ), (α, v ),... darstellen. Berechnung des Gini-Koeffizienten: Beim Gini-Koeffizienten muss man sich mit einer Zusatzannahme behelfen: Wenn im jeweiligen Quantil alle Einkommen gleich sind, so hat man Häufigkeitsdaten mit den Ausprägungen a 1, a,..., a k vorliegen, d.h. a l ist der Wert im l-ten Quantil und man erhält G (u l 1 + u l )f l a l 1 f l a l (u l 1 + u l ) f l a l 1 f l a l ( l ) (u l 1 + u l ) z l 1 Dieser so berechnete Wert von G ist eine untere Schranke für das wahre G! (insb. Verlauf im letzten Quantil verschleiert!) Zurück zum Beispiel Brasilien: G (u l 1 + u l ) z l 1 (0 + 0.) ( ) ( ) ( ) ( ) Weitere Gini-Koeffizienten: China Deutschland Finnland Kann es wirklich sein, dass die Einkommenskonzentration in Deutschland ungefähr diesselbe ist wie in Niger? Ja, denn betrachtet wird hier nur die Verteilung der Gesamtsumme und keine absoluten Werte Weitere relative Konzentrationsmaße Insbesondere basierend auf der natürlichen, äquidistanten Einteilung mit Hilfe von Quantilen lassen sich weitere relative Konzentrationsmaße definieren:

9 Kapitel 4. Konzentrationsmaße 63 Robin-Hood-Index (Wagschal, 1999, S.135ff) Idee: Wieviel müsste den Reichen weggenommen werden, um zu einer Konzentration von 0 zu kommen? Ermittle jeweils für jedes j für das j α-quantil den Abstand seines Anteils zu α. Aufaddieren der positiven Abstände liefert den Robin-Hood-Index. Dieser Anteil müsste verteilt werden, um zu einer gleichen Verteilung zu kommen! Grafische Bestimmung des Robin-Hood-Indexes Wagschal (1999, S.13). Quantilverhältnisse Bilde das Verhältnis von (1 α)- und α-quantil, zum Beispiel: x 0.9 x 0.1 Dezilverhältnis (falls x 0.1 > 0). Interpretation am Beispiel des Einkommensvergleichs: Um welchen Faktor ist der Besitz der 10% Reichsten größer als der Besitz der 10% Ärmsten. Minimale Konzentration erhält man, wenn alle Beobachtungen in einem Punkt zusammenfallen. Dann gilt beispielsweise x 0.1 x 0.9 und damit Dezilverhältnis 1. Vorsicht: Ist das Dezilverhältnis 1, so folgt nicht automatisch, dass minimale Konzentration vorliegt. Beispiel: 99% besitzen praktisch gar nichts, 1% fast alles, dann ist das Dezilverhältnis auch 1. Problematisch bei der Betrachtung extremer Ungleichheit, beispielsweise für Einkommen in Entwicklungsländern. Für die Einkommensverhältnisse in OECD-Ländern dagegen sehr anschauliches Maß. Beispiel: Dezilverhältnisse des Einkommens von Vollbeschäftigten im internationalen Vergleich (Wagschal, 1999, S.138) Norwegen 1.98 Italien.80 Schweden.13 Neuseeland 3.04 Dänemark.17 Japan 3.04 Belgien.5 Frankreich 3.6 Finnland.9 Großbritannien 3.33 Deutschland.3 Österreich 3.58 Niederlande.59 Kanada 4.0 Schweiz.71 Portugal 4.05 Australien.79 USA Absolute Konzentrationsmessung Alle bisherigen Maße betrachteten die relative Konzentration: Sowohl die u j als auch die v j waren Anteile.

10 Absolute Konzentrationsmessung Zu unterscheiden davon ist die absolute Konzentration, die die absolute Zahl der Merkmalsträger miteinbezieht. Beispiel Duopolsituation (Markt mit nur zwei Anbietern): Haben beide denselben Umsatz, so ist die relative Konzentration 0, es liegt aber eine sehr starke absolute Konzentration vor. Es ist jeweils inhaltlich zu entscheiden, welche der beiden Arten von Konzentration von Interesse ist. Relative Konzentrationsmessung ist heranzuziehen, wenn die Merkmalssumme auf sehr viele Einheiten verteilt wird, oder bei der Frage: Herrscht im Markt ein Übergewicht? Absolute Konzentrationsmaße werden v.a. dann verwendet, wenn die Merkmalsumme nur auf wenige Einheiten aufgeteilt wird. Konzentrationsrate Naheliegende Idee zur Messung absoluter Konzentration: Betrachte den Anteil, der auf die größten g Einheiten entfällt (nicht auf die größten g% Einheiten). Definition: Sei 0 x (1) x ()... x (n) die geordnete Urliste eines verhältnisskalierten Merkmals mit n x i > 0. Mit p (i) : x (i) n j1 x j heißt n CR g : in g+1 p (i) Konzentrationsrate vom Grad g. Bestandteile der Formel: p (i) Anteil der i-ten Beobachtung am gesamten Vermögen/Markt/etc. Summiert werden die Indizes n g + 1, n g +,..., n, also in der Tat über die g Einheiten mit den größten Ausprägungen. Maximale Konzentration: CR 1 1 (die größte Beobachtung hat alles).

11 Kapitel 4. Konzentrationsmaße 65 Minimale Konzentration: x (1) x ()... x (n) : x. Dann gilt p (i) x (i) n x i x n x und damit n CR g in g+1 p (i) g n Wahl von g? Typischerweise klein : oder 3 Beispiel: Zweitstimmenanteile politischer Parteien bei Bundestagswahlen (Waagschal, 1999, S.14) CDU/CSU 31,0% 45,% 47,6% 44,9% 48,8% 41,5% 38,5% 35,% SPD 9,% 8,8% 39,3% 45,8% 38,% 36,4% 38,5% 34,% FDP 11,9% 9,5% 9,5% 8,4% 7,0% 6,9% 7,4% 9,8% Grüne ,6% 7,3% 8,6% 8,1% Sonstige 7,9% 16,5% 3,6% 0,9% 0,4% 7,9% 7,0% 1,7% Es ergeben sich folgende Konzentrationsraten für das Parteiensystem der Bundesrepublik Deutschland für die untersuchten Jahre: CR (1949) (31,0+9,)/100 0,60 CR (1953) (45,+8,8)/100 0,740 CR (1965) (47,6+39,3)/100 0,869 CR (197) 0,907 CR (1983) 0,870 CR (1994) 0,779 CR (00) 0,770 CR (005) 0,694 CR 3 (1949) (31,0+9,+11,9)/100 0,71 CR 3 (1953) (45,+8,8+9,5)/100 0,835 CR 3 (1965) (47,6+39,3+9,5)/100 0,964 CR 3 (197) 0,991 CR 3 (1983) 0,940 CR 3 (1994) 0,85 CR 3 (00) 0,856 CR 3 (005) 0,79 Herfindahl-Index: Die Konzentrationsrate berücksichtigt nur die g größten Werte. Will man dies nicht, so empfiehlt sich der sogenannte Herfindahl-Index.

12 Absolute Konzentrationsmessung Definition: Sei 0 x (1) x ()... x (n) die geordnete Urliste eines verhältnisskalierten Merkmals mit n x i > 0. Mit p (i) : x (i) n j1 x j heißt H : n p (i) Herfindahl-Index (wobei die Reihenfolge keine Rolle spielt, wenn alle Merkmalsträger in die Berechnung eingehen). Die Größe 1 H wird auch als Rae-Index bezeichnet. n p i Eigenschaften : H liegt zwischen 1 n und 1. Minimale Konzentration ergibt sich bei p (i) 1 n : H n ( ) 1 1 n n n 1 n Maximale Konzentration ergibt sich bei p (n) 1 und p (i) 0 für alle restlichen i. H 1. In der Tat wird die absolute Konzentration gemessen: Hat man q Einheiten mit jeweils gleichen Anteilen, so gilt: q 1 H 1 q q 3 H ( 1 ) + ( 1 ) 1 H ( 1 3 ) + ( 1 3 ) + ( 1 3 ) 1 3 während für den Gini-Koeffizienten immer G 0 gilt. Beispiel: Herfindahl- und Rae-Index des deutschen Parteienwesens (005). p (i) p (i) CDU/CSU 35,% SPD 34,% FDP 9.8% Grüne 8.1% Linkspartei 8.7% Sonstige (als eine Partei) 4,0% H 0.66 RAE

13 Kapitel 4. Konzentrationsmaße 67 Beispiel: Durchschnittliche Fraktionalisierung von Parteiensystemen (Waagschal, 1999, S. 145). Land durchschnittlicher Rae-Index USA 0.53 Österreich 0.60 Großbritannien 0.6 Deutschland 0.64 Schweiz 0.71 Italien 0.75 Frankreich 0.79 Niederlande 0.79 Finnland 0.8

14 Kapitel 5 Analyse von Zusammenhängen 5.1 Multivariate Merkmale Gerade in der Soziologie ist die Analyse eindimensionaler Merkmale nur der allererste Schritt zur Beschreibung der Daten. Meist ist die Analyse von Zusammenhängen zwischen Merkmalen von grösserem Interesse. Beispiele für typische Fragestellung: Beeinflusst das Geschlecht das Erwerbseinkommen? Gibt es einen Zusammenhang zwischen Schichtzugehörigkeit (als etwas veralteter, dennoch klassischer soziologischer Begriff) und Aggressionsneigung? Spielt die Stärke der Kirchenbindung eine Rolle bei der Parteienpräferenz? Haben Studierende mit guten Mathematikvorkenntnissen bessere Statistiknoten? Hierzu werden an jeder Einheit mehrere Merkmale erhoben und ihre Ausprägungen auch gemeinsam analysiert (z.b. wird das Geschlecht der i-ten Person mit ihrem Einkommen in Beziehung gesetzt). Hat man z.b. die Merkmale X, Y, Z, so nennt man das Paar (X, Y ) bzw. das Tripel (X, Y, Z) ein zweidimensionales (bivariates) bzw. dreidimensionales Merkmal (trivariates) Merkmal. Allgemein spricht man von mehrdimensionalen Merkmalen. { 1 Hutträger X 0 kein Hutträger { 1 Blumen ja Y 0 Blumen nein (X, Y ) : Ω (ω 1, ω ) ω (X(ω), Y (ω)) 68

15 Kapitel 5. Analyse von Zusammenhängen 69 Achtung: Die folgenden statistischen Verfahren messen die Stärke von Zusammenhängen, aber erlauben keine Aussagen über Kausalität! Ob eine kausale Interpretation des Zusammenhangs zulässig ist, hängt davon ab, wie die Daten erhoben wurden. Statistische Zusammenhänge können nicht klären: die Richtung des Zusammenhangs (was ist Ursache, was Wirkung?) Längsschnitt-Studie, cross-lag Design ob eine dritte, evtl. unbeobachtete Variable den Zusammenhang verursacht Experiment 5. Assoziationsmessung in Kontingenztafeln 5..1 Gemeinsame Verteilung, Randverteilung, Kontingenztafel Betrachtet wird ein zweidimensionales Merkmal (X, Y ) bestehend aus den diskreten Merkmalen X und Y und die zugehörige Urliste (x 1, y 1 ), (x, y ),..., (x n, y n ). Wir wollen ferner annehmen, dass X und Y nur endlich viele (wenige), verschiedene Werte annehmen können. a 1,..., a i,..., a k bzw. b 1,..., b j,... b m Anmerkung: In vielen Büchern (v.a. zur induktiven Statistik) wird statt a 1,..., a k auch x 1,..., x k und analog statt b 1,..., b m auch y 1,..., y m geschrieben. Bei uns sind aber die (x i, y i ) Werte der Urliste, x i also der Wert der i-ten Einheit. Daraus ergibt sich zwar die Doppeldeutigkeit der Laufindizes i und j, wir bleiben jedoch bei dieser Notation um Einheitlichkeit mit Fahrmeir et al. (007) und Jann (00/005) herzustellen. Beispiel (fiktiv): Y X latente Aggressivität Schichtzugehörigkeit { 1, ja, nein 1, Unterschicht, Mittelschicht 3, Oberschicht Typische Urliste des zweidimensionalen Merkmals (X, Y ): (3, 1), (, ), (, 1), (3, 1), (3, ), (3, 1), (1, ), (1, 1), (1, 1), (1, ), (3, 1), (3, 1)

16 Assoziationsmessung in Kontingenztafeln Achtung: Tupel sind im Gegensatz zu Mengen geordnete Anordnungen von Zahlen, d.h. die erste Stelle bezieht sich immer auf X, die zweite auf Y. Also bedeutet (1, ) etwas anderes als (, 1) (vgl. obiges Beispiel). Die Tupel sind gemeinsam indiziert, d.h. die Werte in einem Tupel beziehen sich immer auf dieselbe Einheit. Bei (x i, y i ) sind x i und y i also die Ausprägungen derselben Einheit i (z.b. der Person i). Nur so können Zusammenhänge zwischen den Merkmalen sichtbar werden! Gemeinsame relative und absolute Häufigkeitsverteilung: h ij h(a i, b j ), i 1,..., k, j 1,..., m, Anzahl von Beobachtungen mit x a i und y b j. f ij h ij /n f(a i, b j ), i 1,..., k, j 1,..., m, Anteil von Beobachtungen mit x a i und y b j. Man nennt (h ij ), i 1,..., k, j 1,..., m und (f ij ) die gemeinsame Verteilung von (X, Y ) in absoluten bzw. relativen Häufigkeiten. Kontingenztafel / Kontingenztabelle / Kreuztabelle: in Form einer (k m)-dimensionalen Häufigkeitstabelle Darstellung der Häufigkeiten b 1 b j b m a 1 h 11 h 1j h 1m h 1 a h 1 h j h m h..... a i h i1 h ij h im h i..... a k h k1 h kj h km h k h 1 h j h m n mit den Randverteilungen h i h i h im h(a i ), i 1,..., k, für X und h j h 1j h kj h(b j ), j 1,..., m, für Y.

17 Kapitel 5. Analyse von Zusammenhängen 71 Kontigenztafel der relativen Häufigkeitsverteilung: b 1 b j b m a 1 f 11 f 1j f 1m f 1 a f 1 f j f m f..... a i f i1 f ij f im f i..... a k f k1 f kj f km f k f 1 f j f m 1 mit relativen Häufigkeiten f ij h ij n und den Randverteilungen f i h i n f i f im f(a i ), i 1,..., k, für X und f j h j n f 1j f kj f(b j ), j 1,..., m, für Y. Beispiel: Aggressivität und Schichtzugehörigkeit In unserem Beispiel ist n 1 a 1 1, a, a 3 3 b 1 1, b also k 3 und m. Als Kontingenztafel ergibt sich Y X Randhäufigkeiten: Aus der gemeinsamen Verteilung kann man die eindimensionalen Verteilungen berechnen (aber nicht umgekehrt, s.u.). Man nennt sie in diesem Kontext Randverteilungen. Die absoluten Häufigkeiten von X bezeichnet man mit h 1, h,..., h i,..., h k, die von Y mit h 1, h,..., h j,..., h m, analog f i, f j. Der Punkt steht für Summation über den entsprechenden Index. Es gilt also: h i ist die absolute Häufigkeit von a i, h j ist die absolute Häufigkeit von b j.

18 7 5.. Assoziationsmessung in Kontingenztafeln und h i h j m h ij, j1 h ij. Also ist h i die i-te Zeilensumme, h j die j-te Spaltensumme (daher der Name Randhäufigkeiten). Völlig analog definiert sind die relativen Randhäufigkeiten f i : m f ij und f j : j1 f ij. Beispiel: Parteipräferenz bei unterschiedlichem Einkommen (Befragung von 7 Personen, ) Unabhängige und abhängige Variable: Hat man eine Vermutung über die Richtung einer potentiellen Wirkung, so bezeichnet man die Variablen entsprechend als unabhängige (wirkende, erklärende) und abhängige Variable, z.b.: möglicherweise: Schicht latente Aggresivität eindeutig: Geschlecht Einkommen allgemein: unabhängige abhängige Variable Anmerkung: In einigen sozialwissenschaftlichen Büchern wird entgegen dieser Konvention die unabhängige Variable in den Spalten und die abhängige in den Zeilen abgetragen. 5.. Ökologischer Fehlschluss Es gibt sehr viele gemeinsame Verteilungen, die zu denselben Randhäufigkeiten wie im Beispiel oben passen, u.a.:

19 Kapitel 5. Analyse von Zusammenhängen 73 Y X Bei dieser Konstellation wäre von den Unterschichtsangehörigen niemand latent aggressiv, von den Mittel- und Oberschichtsangehörigen alle. Die Schichtungszugehörigkeit würde hier also völlig die Aggressivität determinieren. Man sieht also, wie wichtig es zur Feststellung potentieller Zusammenhänge ist, die gemeinsame Verteilung h ij zu kennen, also tatsächlich die Paare (x i, y i ) zu betrachten. Der unzulässige Schluss von der Randverteilung auf Eigenschaften der gemeinsamen Verteilung, also von zwei univariaten Ergebnissen auf ein bivariates, von der Kollektiv- auf die Individualebene, heißt ökologischer Fehlschluss. Beispiel für ökologischen Fehlschluss: Je größer der Anteil an Arbeitern in einer Region, desto mehr SPD-Wähler gibt es. Arbeiter wählen eher SPD? Kann man nicht aus Randverteilung schliessen! Muss gemeinsame Verteilung betrachten Grafische Darstellung der gemeinsamen Verteilung Verschiedene Darstellungsarten, z.b. als 3D-Säulendiagramm der gemeinsamen Häufigkeiten h ij oder normale Säulendiagramme nach einer Variable aufgespalten, d.h. für jeden Wert a i von X werden jeweils die Häufigkeiten h ij bzw. f ij aufgetragen.

20 Assoziationsmessung in Kontingenztafeln Wohnfläche Miete Bedingte Häufigkeitsverteilungen Beispiel: Habilitationen nach Geschlecht und Fach (aus Fahrmeir et al., 007). Grundgesamtheit: alle Habilitationen 1993 Geschlecht: Fächergruppe: X Y Sprachw. Rechtsw. Naturw. Kunst Medizin Kulturw. Wirts., Soz Frauen Männer Zur Interpretation: In Naturwissenschaften werden nur 30 Frauen habilitiert, in Kunst sogar nur 4. Ist das viel oder wenig? Das kommt ganz darauf an, wieviele Personen insgesamt dort habilitiert werden. (30 von 346 sehr wenig, 4 von 14 nicht so wenig). Man muss also die gemeinsamen Häufigkeiten auf die Randhäufigkeiten bedingen. Man geht über zur sogenannten bedingten Verteilung. Sie gibt die Verteilung eines Merkmals an, unter der Bedingung ( wenn man weiß ), dass das andere Merkmal einen bestimmten Wert hat.

21 Kapitel 5. Analyse von Zusammenhängen 75 z.b. Verteilung des Geschlechts unter den in Kunst bzw. Naturwissenschaften Habilitierten; Anteil der latent aggressiven Jugendlichen unter den Angehörigen der Oberschicht. Es wird also sozusagen die betrachtete Gesamtheit auf eine bestimmte Personengruppen eingeschränkt. Im Beispiel etwa Anzahl der Habil. von Frauen in Kunst Anzahl der Habil. in Kunst 4 14 Definition: Seien h i > 0 und h j > 0 für alle i, j. Für jedes i 1,..., k heißt f Y (b 1 a i ) : h i1 h(a i, b 1 ) h i h(a i ),..., f Y (b m a i ) : h im h(a i, b m ) h i h(a i ) bedingte (relative) Häufigkeitsverteilung von Y unter der Bedingung X a i. Analog heißt für jedes j 1,..., m f X (a 1 b j ) : h 1j h(a 1, b j ),..., f X (a k b j ) : h kj h(a k, b j ) h j h(b j ) h j h(b j ) bedingte (relative) Häufigkeitsverteilung von X unter der Bedingung Y b j. Im Beispiel: f Y (Frau Habil. in Kunst) h 14 h Zu unterscheiden von bzw. f Y (Frau Habil. in Naturw.) h 13 h f 13 h 13 n f(frau und Habil. in Naturw.) 116 f X (Habil. in Kunst Frau) h 14 h Die Verwechslung von gemeinsamer und bedingter Verteilung ist eine häufige Fehlerquelle. Bei Vermutung über Richtung des Zusammenhangs betrachtet man vorwiegend die bedingte Verteilung der abhängigen Variablen gegeben die festen Werte der unabhängigen Variable. In diese Richtung geht ja auch die Prognose! Man kennt den Wert der unabhängigen Variablen und will Aussagen über die abhängige machen.

22 Assoziationsmessung in Kontingenztafeln Beispiel: Bedingte Verteilung der Fächergruppen gegeben das Geschlecht (f(b j a i ) für verschiedene i). b j Sprachw. Rechtsw. Naturw. Kunst Medizin a i Kulturw. Wirts., Soz Frauen Männer f(rechtsw. Frau) f(b a 1 ) h 1 h f(kunst Mann) f(b 4 a ) h 4 h Bedingte Verteilung des Geschlechts gegeben die Fachgruppe (f(a i b j ) für verschiedene j). b j Sprachw. Rechtsw. Naturw. Kunst Medizin a i Kulturw. Wirts., Soz Frauen Männer Nochmals zur Interpretation: f(frau Rechtsw.) f(a 1 b ) h 1 h f(mann Kunst) f(a b 4 ) h 4 h f(frau Medizin) % 9.%. 9.% aller Habilitationen in Medizin sind von Frauen.. f(medizin Frau) 30%. 30% aller Habilitationen von Frauen sind im Fach Medizin. 3. f 51 f(medizin und Frau) %. 3.6% aller Habilitationen stammen von Frauen im Fach Medizin. Es liegt jeweils eine andere Grundgesamtheit zu Grunde: 1. Habilitationen in Medizin. Habilitationen von Frauen 3. Habilitationen insgesamt

23 Kapitel 5. Analyse von Zusammenhängen 77 Bedingte Verteilungen werden automatisch durch relative Häufigkeiten ausgedrückt. Für die Berechnung gilt und analog f(a i b j ) h ij h j f(b j a i ) h ij h i h ij n h j n f ij f i. f ij f j Beispiel: Parteipräferenzen (Empirische) Unabhängigkeit und χ Durch den Vergleich der bedingten Häufigkeiten mit den Randhäufigkeiten kann man Zusammenhänge beurteilen Beispiel: Aggression und Schichtzugehörigkeit. Bedingte Häufigkeiten: f(b j a i ) : relative Häufigkeit von b j, wenn man weiß, dass a i. Vergleiche zum Beispiel mit Gilt f(b 1 a 3 ): f 1 : Anteil der Personen mit Ausprägung b 1 (latent aggressiv) unter allen Personen mit Ausprägung a 3 (Oberschicht) Anteil der Personen mit b 1 (generell), also alle latent aggressiven Personen f(b 1 a 3 ) > f 1,

24 Assoziationsmessung in Kontingenztafeln so erhöht a 3 die Tendenz von b 1 (erhöhte Aggressivität in der Oberschicht), gilt f(b 1 a 3 ) < f 1, so verringert a 3 die Tendenz von b 1 (geringere Aggressivität in der Oberschicht). Wäre hingegen f(b 1 a 3 ) f 1, so wäre im Beispiel der Anteil der latent aggressiven Personen in der Oberschicht genauso groß wie in der Grundgesamtheit. Die Zugehörigkeit zur Oberschicht würde also nicht das Vorhandensein latenter Aggressivität beeinflussen. Gilt dies für alle Merkmalskombinationen, so beeinflussen sich die Variablen gegenseitig nicht. Die Merkmale sind voneinander unabhängig. Empirische Unabhängigkeit: Die beiden Komponenten X und Y eines bivariaten Merkmals (X, Y ) heißen voneinander (empirisch) unabhängig, falls für alle i 1,..., k und j 1,..., m f(b j a i ) f j f(b j ) (5.1) und gilt. f(a i b j ) f i f(a i ) (5.) Also anschaulich: Genau bei empirischer Unabhängigkeit ist die Verteilung von Y in allen bezüglich Werten von X gebildeten Subgruppen identisch und umgekehrt. Satz: a) Es genügt, entweder (5.1) oder (5.) zu überprüfen: Mit einer der beiden Beziehungen gilt auch die andere. b) X und Y sind genau dann empirisch unabhängig, wenn für alle i 1,... k und alle j 1,... m gilt: f ij f i f j (5.3) c) Gleichung (5.3) ist äquivalent zu h ij h i h j n (5.4) Beweis zu b) : i, j beliebig vorgegeben, X, Y empirisch unabhängig. f(a i b j ) f i für alle i, j f ij f i f j für alle i, j f ij f i f j für alle i, j

25 Kapitel 5. Analyse von Zusammenhängen 79 Zentrale Idee zur Analyse von Kontingenztafeln: Man beurteilt das Ausmaß der Abhängigkeit von X und Y dadurch, dass man die beobachtete Kontingenztafel mit der Tafel vergleicht, die sich bei denselben Randverteilungen ergeben würde, wenn X und Y (empirisch) unabhängig wären. Man vergleicht also für alle i und j die beobachteten Häufigkeiten h ij mit den unter Unabhängigkeit erwarteten Besetzungszahlen h ij (vgl. die rechte Seite von (5.4)): h ij : h i h j. n Je größer die Unterschiede zwischen h ij und h ij sind, umso stärker sind die Daten von der Unabhängigkeit entfernt, d.h. umso stärker ist also der Zusammenhang zwischen X und Y. Als Maß verwendet man den sog. χ -Koeffizienten / χ -Abstand: χ : m (h ij h ij ) (5.5) h j1 ij ( ) beob. Häufigk. unter Unabh. zu erwartende Häufigk. unter Unabh. zu erwartende Häufigk. alle Zellen Beispiel: Zusammenhang zwischen Geschlecht und Arbeitslosigkeit (fiktiv, nach Wagschal, 1999) Sei Y der Beschäftigungsstatus einer erwerbstätigen Person, X das Geschlecht mit { { 1 beschäftigt 1 weiblich Y und X arbeitslos männlich Gemeinsame Häufigkeitsverteilung: Zur Bestimmung des χ -Koeffizienten: 1. Bestimme die Randverteilung. Y X Berechne die unter Unabhängigkeit zu erwartenden Häufigkeiten h ij. Indifferenztafel (bei empirischer Unabhängigkeit zu erwartende Kontingenztafel): h 11 h 1 h 1 n h 1 h h 1 n etc

26 Assoziationsmessung in Kontingenztafeln Y X Beim Vergleich der beoachteten Häufigkeitsverteilung mit der unter Unabhängigkeit zu erwartenden erkennt man: Es gibt weniger beschäftigte Frauen und weniger arbeitslose Männer als unter Unabhängigkeit zu erwarten wäre, aber mehr arbeitslose Frauen und mehr beschäftigte Männer. Also hat das Geschlecht einen Einfluss; Männer sind tendenziell eher beschäftigt. Man erhält χ m j1 (h ij h ij ) h ij (40 5) (5 13) (80 68) (5 17) Bei Vierfeldertafeln ( Zeilen, Spalten) gibt es eine handliche Alternative zur Berechnung von χ : χ n (h 11h h 1 h 1 ) h 1 h h 1 h (5.6) (Merksatz: Hauptdiagonalenprodukt Nebendiagonalenprodukt). Veranschaulichung der Formel: In der Hauptdiagonalen stehen die gleichgerichteten (konkordanten) Paare (1,1), (,) (kleines Y zu kleinem X und hohes Y gehört zu hohem X), in der Nebendiagonalen die entgegengerichteten (diskordanten) Paare (1,), (,1). Je stärker der Zusammenhang, desto stärker überwiegt eine dieser beiden Möglichkeiten, d.h. desto größer ist (h 11 h h 1 h 1 ) Ceteris paribus Betrachtung bei gleichen Randverteilungen: +1 1 h h h 1 h Angenommen, es ist h 11 h > h 1 h 1. Dann erhöhen sich h 11 und h, h 1 und h 1 erniedrigen sich χ wird größer. Wegen dem Quadrieren der Differenzen gilt auch umgekehrt: ist h 11 h < h 1 h 1 χ wird größer. Berechnung im Beispiel mit alternativer Formel: χ n (h 11h h 1 h 1 ) h 1 h h 1 h ( ) (00 000)

27 Kapitel 5. Analyse von Zusammenhängen χ -basierte Maßzahlen Bemerkungen zum χ -Abstand: Unter empirischer Unabhängigkeit gilt per Definition χ 0. Je stärker χ von 0 abweicht, umso stärker ist ceteris paribus der Zusammenhang. Der χ -Abstand wird die Grundlage bilden für den in Statistik betrachteten χ - Test. Als Masszahl ist χ hingegen problematisch und nicht direkt interpretierbar, da sein Wert vom Stichprobenumfang n und von der Zeilen- und Spaltenzahl abhängt geeignet normieren. Es gilt: χ n (min{k, m} 1). Gleichheit gilt genau dann, wenn sich in jeder Spalte bzw. Zeile nur ein von Null verschiedener Eintrag befindet, also z.b. nur auf der Diagonalen (entspräche perfektem Zusammenhang, ist aber gar nicht bei allen Randverteilungen möglich). χ -basierte Zusammenhangsmaße a) Kontingenzkoeffizient nach Pearson: χ K : n + χ. (5.7) b) Korrigierter Kontingenzkoeffizient: K : K K max (5.8) mit K max : min{k, m} 1 min{k, m} c) Kontingenzkoeffizient nach Cramér (Cramérs V): V χ n (min{k, m} 1) χ maximaler Wert (5.9) d) Bei der Vierfeldertafel (k m ) gilt χ V n (min{k, m} 1) χ n. Hierfür ist auch die Bezeichnung Phi-Koeffizient Φ üblich.

28 8 5.. Assoziationsmessung in Kontingenztafeln Mit (5.6) ergibt sich also Φ h 11 h h 1 h 1. (5.10) h1 h h 1 h Lässt man die Betragsstriche weg, so erhält man den signierten Phi-Koeffizienten oder Punkt-Korrelationskoeffizienten Φ s h 11h h 1 h 1, h1 h h 1 h der häufig ebenfalls als Phi-Koeffizient bezeichnet wird. Φ S kann im Prinzip Werte zwischen -1 und 1 annehmen (ohne -1 und 1 immer erreichen zu können (s.u.)). Vorteil gegenüber Φ: Zusätzlich ist die Richtung des Zusammenhangs erkennbar: Φ s > 0 bei gleichsinnigem Zusammenhang (1 bei X bewirkt eher 1 bei Y, ) und Φ s < 0 bei gegensinnigem Zusammenhang (1 bei X bewirkt eher bei Y, 1) Berechnung im Beispiel : Beschäftigungsstatus und Geschlecht. Zur Erinnerung: χ 4.435, m k, n 150 K K max besch. ja nein 1 Frauen Männer χ n + χ min{k, m} min{k, m} K K K max χ V Φ n Φ s h 11h h 1 h 1 h1 h h 1 h Schwerpunkt auf der Nebendiagonalen: Beschäftigte Männer, arbeitslose Frauen. Φ 0.4, deutet auf Zusammenhangs mittlerer Stärke hin. K, K, V und Φ nehmen Werte zwischen 0 und 1 an, wohingegen χ beliebeig grosse positive Werte annehmen kann.

29 Kapitel 5. Analyse von Zusammenhängen 83 Aufgrund ihrer Unabhängigkeit von n und von k und m sind K, K, V und Φ prinzipiell zum Vergleich verschiedener Tabellen geeignet. Allerdings kann bei gegebener Randverteilung der Wert 1 nicht immer erreicht werden. Im Beispiel können bei insgesamt nur 30 Arbeitslosen nicht alle 80 Männer oder alle 65 Frauen arbeitslos sein. Es kann deshalb aussagekräftiger sein, noch zusätzlich auf die für die gegebene Randverteilung maximal mögliche Abhängigkeit zu normieren. Korrekturverfahren für Φ (Wagschal) 1. Bilde die Extremtabelle mit Einträgen h ij, d.h. i. Ersetze die Zelle mit der kleinsten absoluten Häufigkeit durch 0 ii. Fülle die Tafel entsprechend der Randverteilung auf!. Berechne den zugehörigen Phi-Koeffizienten Φ extrem. 3. Berechne den korrigierten Phi-Koeffizienten Φ korr : Φ Φ extrem bzw. den zugehörigen korrigierten signierten Phi-Koeffizienten Φ s,korr : Φ s Φ extrem. Berechnung im Beispiel: Extremsituation: Alle Männer beschäftigt. besch. ja nein 1 Frauen Männer Mit (5.10) erhält man h Φ extrem 11h h 1h 1 h 1 h h 1h und damit Φ korr Φ Φ extrem und Φ s,korr Relativ zum gegebenen Geschlechterverhältnis und zur Beschäftigungsrelation ergibt sich ein stärkerer Zusammenhang (Φ korr ). Am signierten Koeffizienten Φ s,korr < 0 lässt sich auch die Richtung des Zusammenhangs ablesen: kleine Y -Werte gehören eher zu großen X-Werten, also sind Frauen tendenziell stärker von Arbeitslosigkeit betroffen als Männer.

30 Assoziationsmessung in Kontingenztafeln 5..7 Weitere Methoden für Vierfeldertafeln Typische Fragestellung aus der Medizin: X Y an nicht an Krebs Krebs erkrankt erkrankt b 1 b exponiert: Schadstoffen a 1 h 11 h 1 ausgesetzt nicht exponiert: Schadstoffen a h 1 h nicht ausgesetzt In der Medizin bezeichnet man die bedingte relative Häufigkeit f(b j a i ) als Risiko für b j unter Bedingung a i : R(b j a i ) : f(b j a i ) h ij h i i, j 1,. In der Epidemiologie wird standardmäßig R(b 1 a 1 ) betrachtet. Dies ist das Erkrankungsrisiko für Personen, die exponiert waren. Als Zusammenhangsmaß zwischen X und Y in Vierfelder-Tafeln verwendet man auch das darauf aufbauende relative Risiko: Definition : Für eine Vierfelder-Tafel heißt RR(b 1 ) : f(b 1 a 1 ) f(b 1 a ) h 11/h 1 h 1 /h relatives Risiko und ist das Verhältnis des Erkrankungsrisikos für Personen, die exponiert waren (im Zähler) und für Personen, die nicht exponiert waren (im Nenner). Eigenschaften: RR(b 1 ) kann Werte zwischen 0 und annehmen. RR(b 1 ) 1 würde bedeuten: Personen, die exponiert waren, haben das gleiche Erkrankungsrisiko wie Personen, die nicht exponiert waren. Es besteht kein Zusammenhang zwischen Exposition (Merkmal X) und Erkrankung (Merkmal Y ). RR(b 1 ) 5 würde bedeuten: Personen, die exponiert waren, haben ein 5-mal so großes Erkrankungsrisiko wie Personen, die nicht exponiert waren, d.h. das Erkrankungsrisiko wäre für exponierte Personen deutlich höher. RR(b 1 ) 1 würde bedeuten: Personen, die exponiert waren, haben nur ein Fünftel 5 des Erkrankungsrisikos von Personen, die nicht exponiert waren, d.h. das Erkrankungsrisiko wäre für exponierte Personen deutlich niedriger.

31 Kapitel 5. Analyse von Zusammenhängen 85 In der Medizin bezieht sich Risiko meist auf negative Ereignisse wie z.b. Erkrankung. Grundsätzlich sind Risiken aber symmetrisch verwendbar, d.h. auch für positive Ereignisse wie z.b. Beschäftigung: beschäftigt ja nein 1 Frau Mann Gemessen wird jetzt das Risiko (bzw. die Tendenz), beschäftigt zu sein, wenn man dem (vermuteten) Nachteilsfaktor weiblich zu sein, ausgesetzt ist. R(beschäftigt Frau) f(b 1 a 1 ) h 11 h Man sieht, dass das Risiko für sich genommen noch wenig aussagekräftig ist. RR(beschäftigt) R(b 1 a 1 ) R(b 1 a ) h 11/h 1 h 1 /h 40/ / , 65 3 Das Risiko, beschäftigt zu sein, ist bei den Frauen nur 3 so groß wie bei den Männern. Hier umgekehrte Betrachtung inhaltlich naheliegender: Risiko für Arbeitslosigkeit. Die Risiken in den beiden Gruppen sind dann genau die Arbeitslosigkeitsquoten. RR(arbeitslos) h 1/h 1 5/ h /h 5/ Das Arbeitslosigkeitsrisiko (die Arbeitslosigkeitsquote) ist bei den Frauen 6.53 mal so groß wie bei den Männern. Es zeigt sich also ein deutlicher Gechlechtereinfluß. Bei den Frauen beträgt die Arbeitslosigkeitsquote %, bei den Männern hingegen nur %. Definition: Die Größe heißt Prozentsatzdifferenz für b j. Eigenschaften: d%(b j ) : ( f(b j a 1 ) f(b j a ) ) 100, i 1, d%(b 1 ) ist z.b. die Differenz aus den Erkrankungsrisiken für Personen, die exponiert waren, und für Personen, die nicht exponiert waren. d%(b j ) kann Werte zwischen 100 und 100 annehmen.

32 Assoziationsmessung in Kontingenztafeln d%(b 1 ) 0 würde bedeuten: Personen, die exponiert waren, haben das gleiche Erkrankungsrisiko wie Personen, die nicht exponiert waren. Es besteht kein Zusammenhang zwischen Exposition (Merkmal X) und Erkrankung (Merkmal Y ). d%(b 1 ) 10 würde bedeuten: Personen, die exponiert waren, haben ein um 10 Prozentpunkte höheres Erkrankungsrisiko als Personen, die nicht exponiert waren. d%(b 1 ) 10 würde bedeuten: Personen, die exponiert waren, haben ein um 10 Prozentpunkte niedrigeres Erkrankungsrisiko als Personen, die nicht exponiert waren. Beispiel: Beschäftigung von Männern und Frauen beschäftigt ja nein 1 Frau Mann d%(b 1 ) (f(b 1 a 1 ) f(b 1 a )) 100 ( h11 h ) h 1 h Der Beschäftigtenanteil unter den Frauen beträgt 61.5%, der unter den Männer 94.1%. Es ergibt sich eine Prozentsatzdifferenz von 3.6%, die auf einen deutlichen Einfluss des Geschlechts hinweist. Offensichtlich gilt bei zwei Ausprägungen Bemerkungen: d%(b ) (f(b a 1 ) f(b a )) 100 h 1 h 1 h h d%(b 1 ) (f(b 1 a 1 ) f(b 1 a )) (1 f(b a 1 )) (1 f(b a )) (f(b a 1 )) f(b a 1 ) d%(b ) Den in diesem Abschnitt betrachteten Maßzahlen ist gemein, dass im Gegensatz zu den χ -basierten Maßzahlen das Vertauschen von Zeilen und Spalten die Maßzahl verändert. Das bedeutet für die Praxis: Man muss sich sehr genau überlegen, was man als abhängige und was als unabhängige Variable wählt.

33 Kapitel 5. Analyse von Zusammenhängen 87 Man kann die zwei Risiken in einer Vierfelder-Tafel auf zwei Arten vergleichen: durch den Quotienten: sind Zähler und Nenner eines Bruches gleich, hat er den Wert 1 (d.h. die 1 dient als Vergleichswert) der Bruch ist > 1, wenn der Zähler größer ist als der Nenner. der Bruch ist < 1, wenn der Zähler kleiner ist als der Nenner. durch die Differenz: sind die beiden Terme einer Differenz gleich, hat sie den Wert 0 (d.h. die 0 dient als Vergleichswert) die Differenz ist > 0, wenn der erste Term größer ist als der zweite. die Differenz ist < 0, wenn der erste Term kleiner ist als der zweite. Bei kleinen Risiken ist die Prozentsatzdifferenz nicht sensitiv, z.b.: f(b 1 a 1 ) 0.4, f(b 1 a ) 0.41 RR(b 1 ) 1.0 d%(b 1 ) 1 f(b 1 a 1 ) 0.0, f(b 1 a ) 0.01 RR(b 1 ).0 d%(b 1 ) 1 In solchen Fällen muss man inhaltlich abwägen, ob der Quotient oder die Differenz aussagekräftiger ist. Definition: Die Größe O(b 1 a i ) : R(b 1 a i ) 1 R(b 1 a i ) i 1, heißt Odds (engl. plural) oder Chance von b 1 unter der Bedingung a i. Eigenschaften: Die Odds für exponierte Personen sind das Verhältnis des Risikos, krank zu werden (im Zähler), zum Risiko, nicht krank zu werden, also 1 dem Risiko krank zu werden (im Nenner). Es gilt: O(b 1 a i ) f(b 1 a i ) 1 f(b 1 a i ) f(b 1 a i ) f(b a i ) h i1/h i h i /h i h i1 h i Interpretation: Odds O(b 1 a 1 ) 3 bedeuten, dass exponierte Personen 3 häufiger krank werden, als dass sie gesund bleiben.

34 Assoziationsmessung in Kontingenztafeln Interpretation als Wettchance: Odds O(b 1 a 1 ) 3 bedeuten ich wäre bereit im Verhältnis 3 : 1 zu wetten, dass eine exponierte Person krank wird. Beispiel: Beschäftigung von Männern und Frauen beschäftigt ja nein 1 Frau Mann O(beschäftigt weiblich) h 11 h O(beschäftigt männlich) h 1 h Unter den Frauen gibt es 1.6 mal so viele Beschäftigte wie Arbeitslose, unter den Männern sind es 16 mal so viele Beschäftigte wie Arbeitslose. Eine Chance für sich sagt noch nichts über den Zusammenhang zwischen X und Y aus. Wenn es unter den Exponierten halb so viele Kranke wie Gesunde gibt, so kann dies gut oder schlecht sein. Dies hängt von den Odds bei den Nichtexponierten ab. Daher verwendet man als Zusammenhangsmaß zwischen X und Y die relativen Odds, die als Odds Ratio bezeichnet werden. Definition: Die Größe OR(b 1 ) : O(b 1 a 1 ) O(b 1 a ) heißt Odds Ratio und vergleicht die Odds von exponierten Personen (im Zähler) und nicht exponierten Personen (im Nenner). Eigenschaften: OR kann Werte zwischen 0 und annehmen. OR 1 würde bedeuten: Personen, die exponiert waren, haben die gleichen Odds wie Personen, die nicht exponiert waren. Es besteht kein Zusammenhang zwischen Exposition (Merkmal X) und Erkrankung (Merkmal Y ). OR 5 würde bedeuten: Personen, die exponiert waren, haben 5-mal so große Odds wie Personen, die nicht exponiert waren, d.h. die Chance zu erkranken wäre für exponierte Personen deutlich höher. OR 1 würde bedeuten: Personen, die exponiert waren, haben nur ein Fünftel 5 der Odds von Personen, die nicht exponiert waren, d.h. die Chance zu erkranken wäre für exponierte Personen deutlich niedriger. Um die Asymmetrie des Wertebereichs, [0; 1) bei gegenläufigem Zusammenhang und (1, ] bei gleichgerichtetem Zusammenhang, zu umgehen, wird gelegentlich auch ln OR betrachtet. Sein Wertebereich ist (, ), wobei nun der Wert 0 auf keinen Zusammenhang hinweist.

35 Kapitel 5. Analyse von Zusammenhängen 89 Der Odds Ratio wird auch als Kreuzproduktverhältnis bezeichnet, denn es gilt: OR(b 1 ) : O(b 1 a 1 ) O(b 1 a ) R(b 1 a 1 ) 1 R(b 1 a 1 ) R(b 1 a ) 1 R(b 1 a ) f(b 1 a 1 ) f(b a 1 ) f(b 1 a ) f(b a ) h 11 /h 1 h 1 /h 1 h 1 /h h /h h 11/h 1 h 1 /h h 11 h h 1 h 1 Hieraus erkennt man auch die Parallele zu den früheren Zusammenhangsmaßen Φ und χ für 4-Felder-Tafeln, die ebenfalls auf dem Unterschied in den Produkten der Diagonalelemente h 11 h und der Nebendiagonalelemente h 1 h 1 aufbauen. Für χ gilt χ n (h 11 h h 1 h 1 ) h 1 h h 1 h. An dieser Formel erkennt man, dass die Differenz im Zähler h 11 h h 1 h 1 groß wird, wenn die Häufigkeiten h 11 und h auf der Hauptdiagonalen groß, und die Häufigkeiten h 1 und h 1 auf den Nebendiagonalen klein sind. Im umgekehrten Fall wird die Differenz klein. Durch das Quadrieren des Zählers in der Formel für χ (bzw. durch den Übergang zum Betrag in der Formel für Φ) spielt die Richtung aber keine Rolle mehr, und χ und Φ werden insgesamt groß, wenn oder h 11 h h 1 h 1 h 11 h h 1 h 1 gilt, d.h wenn eine Diagonalstruktur vorliegt, die auf einen Zusammenhang zwischen den Merkmalen Y und X hinweist. Im OR werden dieselben Häufigkeiten nicht in einer Differenz, sondern in einem Bruch verwendet. Deshalb ist hier nicht von Interesse, ob der Koeffizient von 0 abweicht, wie bei den auf der Differenz aufbauenden Maßzahlen χ und Φ, sondern uns interessiert, ob der OR von 1 abweicht. Beispiel: Beschäftigung von Männern und Frauen beschäftigt ja nein 1 Frau Mann OR(b 1 ) : O(b 1 a 1 ) O(b 1 a ) 1 10

36 Assoziationsmessung in Kontingenztafeln Frauen haben nur ein Zehntel so hohe Odds für die Beschäftigung im Vergleich zu Männern. Das Verhältnis aus Beschäftigten und Arbeitslosen ist also bei den Frauen um den Faktor 10 geringer als bei den Männern. Definition: heißt Yules Q. Die Größe Q : h 11 h h 1 h 1 h 11 h + h 1 h 1 Bemerkungen Q ist ein Spezialfall von γ nach Goodman und Kruskal (vgl. später) und vergleicht diskordante und konkordante Paare. Q nimmt Werte zwischen -1 und 1 an und ist 0 bei Unabhängigkeit. Ist eine Zelle mit 0 besetzt, so ist Q 1 oder Q 1. Q zeigt also dann bereits eine perfekte Abhängigkeit. Beispiel: Beschäftigung von Männern und Frauen beschäftigt ja nein 1 Frau Mann Q h 11 h h 1 h 1 h 11 h + h 1 h Wieder: starker Zusammenhang in Richtung Nebendiagonale: Männer Arbeit, Frauen Arbeitslos 5..8 PRE-Maße (Prädiktionsmaße) Völlig andere, sehr allgemeine Grundidee zur Beschreibung von Zusammenhängen. Grundlegendes Prinzip vieler statistischer Konzepte. Hängt mit Streuungszerlegung metrischer Daten zusammen. Anwendbar für Kreuztabellen beliebiger Größe. In der Soziologie sehr gebräuchlich. Hintergrund: Ein Modell versucht, ein empirisches Phänomen zu beschreiben. Ein Modell ist umso besser, je genauer es ein Phänomen reproduzieren/vorhersagen kann. Die Vorhersagekraft der einen Variablen für die andere dient dann als Maß des Zusammenhangs. Im medizinischen Kontext: Das Ergebnis eines zusätzlichen Tests ( X) verbessert die Diagnose ( Prognose des Y -Werts) umso mehr, je mehr X und Y zusammenhängen.

37 Kapitel 5. Analyse von Zusammenhängen 91 Betrachte zwei Modelle zur Vorhersage des Wertes y i der abhängigen Variable Y einer beliebigen Beobachtung i: Modell 1: verwendet (ausschließlich) die Randverteilung von Y : (h j ), j 1,..., m. Modell : verwendet die gemeinsame Verteilung von (X, Y ) bzw. die bedingte Verteilung von Y gegeben X. Im Beispiel zur Erwerbstätitgkeit berücksichtigt Modell 1 nur die Verteilung der Erwerbstätigkeit unabhängig vom Geschlecht, während Modell zusätzlich noch das Geschlecht der Person i berücksichtigt. Idee: Der Zusammenhang zwischen X und Y ist umso größer, je stärker die Kenntnis von X die Prognose von Y im Vergleich zu Modell 1 verbessert. Definition: PRE P roportional Reduction in E rror P RE E 1 E E 1 1 E E 1 wobei PRE ist automatisch auf [0; 1] normiert: E 1 : Vorhersagefehler bei Modell 1 E : Vorhersagefehler bei Modell P RE 1 gilt genau dann wenn E 0, d.h. bei vollständiger Vorhersage bzw. vollständigem Zusammenhang. P RE 0 gilt genau dann wenn E 1 E, d.h. die Vorhersage wird durch Kenntnis der unabhängigen Variablen nicht unterstützt, d.h. es besteht kein Zusammenhang. Intuitives Beispiel: Y : X 1 : X : Beschäftigungsstatus Geschlecht Sternzeichen der Nachbarin der Schwiegermutter Kenntnis von X 1 verbessert Vorhersage von Y wohl deutlich mehr als die von X stärkerer Zusammenhang zwischen X 1 und Y als zwischen X und Y. Guttmans Lambda Verteilungen. Modell 1 (nur Y ): Modell (mit X): Fehler im Modell 1: Basiert auf dem Modus der Randverteilung bzw. der bedingten Modus der Randverteilung. Modi unter der Bedingung X a i Richtig vorhergesagt werden alle Einheiten, deren Ausprägungen tatsächlich auf den Modus fallen, das sind max j (h j ) Einheiten.

38 9 5.. Assoziationsmessung in Kontingenztafeln Es gilt also E 1 n max(h j ). j Fehler im Modell : Aufspalten nach den einzelnen Werten a i, i 1,..., k. Korrekt vorhergesagt werden jeweils diejenigen Einheiten, deren Ausprägungen tatsächlich auf den bedingten Modus fallen, das sind, für jedes feste i, max j (h ij ) Einheiten. Es gilt also E PRE-Maß für abhängige Variable Y : λ Y E 1 E E 1 ( ( max(h ij ) j (h i max(h ij )) n j ) n max(h j ) j ) n max(h j ) j max(h j ) j ( n n max(h j ) j max(h ij ) j max(h ij ) j Wenn unklar ist, welche Variable die abhängige und welche die unabhängige ist, dann bildet man eine symmetrische Version. Dazu betrachtet man zunächst analog die Prognose von X (ohne und mit Y ). Die entsprechende Formel ergibt sich durch Vertauschen der Rolle von X und Y : ( m j1 λ X ) max(h ij ) max(h i ) i i n max i (h i ) Symmetrische Version durch poolen : ) λ m max(h ij ) + max(h ij ) max(h j ) max(h i ) j i j i j1. n max j (h j ) max i (h i ) Beispiel: Erwerbstätigkeit von Männern und Frauen beschäftigt ja nein 1 Frau Mann Prognose insgesamt: Prognose bei Frauen: Prognose bei Männern: ja ja ja

39 Kapitel 5. Analyse von Zusammenhängen 93 ( ) λ Y max(h ij ) j n max(h j ) j max(h j ) j Vorhersage über den Modus ist zu unspezifisch; Maß erkennt hier keinen Zusammenhang. Manipulationsmöglichkeit? Kritisches Einsetzen von Methodenwissen! Extrem konservatives Maß, kann aber z.b. in Medizin (Frage nach Wirksamkeit eines Medikaments mit extrem starken Nebenwirkungen) sehr wichtig sein. Gepoolte Version: Erlaubt? Eigentlich eindeutig: Geschlecht unabhängige Variable. Hier v.a. aus Übungsgründen. λ max(h ij ) + j m j1 max(h ij ) max(h j ) max(h i ) i j i n max j (h j ) max i (h i ) Eher schwacher Zusammenhang: Die Kenntnis beider Variablen reduziert die durchschnittliche Prognoseungenauigkeit nur um 1%. Vorsicht: Ist dies überhaupt noch ein PRE-Maß? Goodmans und Kruskals Tau Idee: statt deterministischer Vorhersagen (immer Modus) probabilistische Vorhersagen (mit Wahrscheinlichkeiten). Modell 1: Vorhersage b j mit Wahrscheinlichkeit f j, j 1,..., m. (z.b. bei einem Beschäftigtenanteil von /3 Personen nicht immer Beschäftigung, sondern im Durchschnitt bei 3 Personen -mal Beschäftigung und 1 mal Arbeitslosigkeit, Prognose: Auswürfeln mit Wahrscheinlichkeitsverteilung f i ) Modell : Für jedes i Vorhersage b j mit Wahrscheinlichkeit f(b j a i ) h ij (E(Treffer) E(Treffer 1) π 1 + E(Treffer ) π +... E(Treffer k) π k π 1 π 1 + π π +...) h i f ij f i. Man kann zeigen (mit Hilfe der Wahrscheinlichkeitsrechnung, nächstes Semester): erwarteter Wert von E 1 1 erwarteter Wert von E 1 m j1 m j1 f j f ij f i Damit ergibt sich: τ Y m j1 1 f ij f i m j1 m j1 f j f j τ X m j1 1 f ij f j f i f i

5.2.3 Grafische Darstellung der gemeinsamen Verteilung. Verschiedene Darstellungsarten, z.b. als 3D-Säulendiagramm der gemeinsamen Häufigkeiten

5.2.3 Grafische Darstellung der gemeinsamen Verteilung. Verschiedene Darstellungsarten, z.b. als 3D-Säulendiagramm der gemeinsamen Häufigkeiten 5.2.3 Grafische Darstellung der gemeinsamen Verteilung 5.2 Assoziationsmessung in Kontingenztafeln Verschiedene Darstellungsarten, z.b. als 3D-Säulendiagramm der gemeinsamen Häufigkeiten h ij oder normale

Mehr

5 Assoziationsmessung in Kontingenztafeln

5 Assoziationsmessung in Kontingenztafeln 5 Assoziationsmessung in Kontingenztafeln 51 Multivariate Merkmale 51 Multivariate Merkmale Gerade in der Soziologie ist die Analyse eindimensionaler Merkmale nur der allererste Schritt zur Beschreibung

Mehr

5.3 (Empirische) Unabhängigkeit und χ 2

5.3 (Empirische) Unabhängigkeit und χ 2 5.3 (Empirische) Unabhängigkeit und χ 2 5.3.1 (Empirische) Unabhängigkeit Durch den Vergleich der bedingten Häufigkeiten mit den Randhäufigkeiten kann man Zusammenhänge beurteilen Illustration an einem

Mehr

Kontingenzkoeffizient (nach Pearson)

Kontingenzkoeffizient (nach Pearson) Assoziationsmaß für zwei nominale Merkmale misst die Unabhängigkeit zweier Merkmale gibt keine Richtung eines Zusammenhanges an 46 o jl beobachtete Häufigkeiten der Kombination von Merkmalsausprägungen

Mehr

5.3 (Empirische) Unabhängigkeit und χ 2

5.3 (Empirische) Unabhängigkeit und χ 2 5.3 (Empirische) Unabhängigkeit und χ 2 5.3 (Empirische) Unabhängigkeit und χ 2 5.3.1 (Empirische) Unabhängigkeit Durch den Vergleich der bedingten Häufigkeiten mit den Randhäufigkeiten kann man Zusammenhänge

Mehr

4 Konzentrationsmessung

4 Konzentrationsmessung 4 Konzentrationsmessung 4.0 Vorbemerkungen 4.0 Vorbemerkungen Konzentration: Ausmaß der Ballung von großen Anteilen an der gesamten Merkmalssumme auf wenige Einheiten (Frage zum Beispiel: Welchen Anteil

Mehr

Primzahlen und RSA-Verschlüsselung

Primzahlen und RSA-Verschlüsselung Primzahlen und RSA-Verschlüsselung Michael Fütterer und Jonathan Zachhuber 1 Einiges zu Primzahlen Ein paar Definitionen: Wir bezeichnen mit Z die Menge der positiven und negativen ganzen Zahlen, also

Mehr

1. Man schreibe die folgenden Aussagen jeweils in einen normalen Satz um. Zum Beispiel kann man die Aussage:

1. Man schreibe die folgenden Aussagen jeweils in einen normalen Satz um. Zum Beispiel kann man die Aussage: Zählen und Zahlbereiche Übungsblatt 1 1. Man schreibe die folgenden Aussagen jeweils in einen normalen Satz um. Zum Beispiel kann man die Aussage: Für alle m, n N gilt m + n = n + m. in den Satz umschreiben:

Mehr

Beeinflusst das Geschlecht das Erwerbseinkommen?

Beeinflusst das Geschlecht das Erwerbseinkommen? 74 Kapitel 5 Analyse von Zusammenhängen 5.1 Multivariate Merkmale Gerade in der Soziologie ist die Analyse eindimensionaler Merkmale nur der allererste Schritt. Letztendlich kommt es auf die Analyse von

Mehr

Analyse bivariater Kontingenztafeln

Analyse bivariater Kontingenztafeln Analyse bivariater Kontingenztafeln Werden zwei kategoriale Merkmale mit nicht zu vielen möglichen Ausprägungen gemeinsam analysiert, so kommen zur Beschreibung der gemeinsamen Verteilung im allgemeinen

Mehr

50. Mathematik-Olympiade 2. Stufe (Regionalrunde) Klasse 11 13. 501322 Lösung 10 Punkte

50. Mathematik-Olympiade 2. Stufe (Regionalrunde) Klasse 11 13. 501322 Lösung 10 Punkte 50. Mathematik-Olympiade. Stufe (Regionalrunde) Klasse 3 Lösungen c 00 Aufgabenausschuss des Mathematik-Olympiaden e.v. www.mathematik-olympiaden.de. Alle Rechte vorbehalten. 503 Lösung 0 Punkte Es seien

Mehr

Lineargleichungssysteme: Additions-/ Subtraktionsverfahren

Lineargleichungssysteme: Additions-/ Subtraktionsverfahren Lineargleichungssysteme: Additions-/ Subtraktionsverfahren W. Kippels 22. Februar 2014 Inhaltsverzeichnis 1 Einleitung 2 2 Lineargleichungssysteme zweiten Grades 2 3 Lineargleichungssysteme höheren als

Mehr

90-minütige Klausur Statistik für Studierende der Kommunikationswissenschaft

90-minütige Klausur Statistik für Studierende der Kommunikationswissenschaft Prof. Dr. Helmut Küchenhoff SS08 90-minütige Klausur Statistik für Studierende der Kommunikationswissenschaft am 22.7.2008 Anmerkungen Überprüfen Sie bitte sofort, ob Ihre Angabe vollständig ist. Sie sollte

Mehr

Willkommen zur Vorlesung Statistik

Willkommen zur Vorlesung Statistik Willkommen zur Vorlesung Statistik Thema dieser Vorlesung: Varianzanalyse Prof. Dr. Wolfgang Ludwig-Mayerhofer Universität Siegen Philosophische Fakultät, Seminar für Sozialwissenschaften Prof. Dr. Wolfgang

Mehr

Korrelation (II) Korrelation und Kausalität

Korrelation (II) Korrelation und Kausalität Korrelation (II) Korrelation und Kausalität Situation: Seien X, Y zwei metrisch skalierte Merkmale mit Ausprägungen (x 1, x 2,..., x n ) bzw. (y 1, y 2,..., y n ). D.h. für jede i = 1, 2,..., n bezeichnen

Mehr

Austausch- bzw. Übergangsprozesse und Gleichgewichtsverteilungen

Austausch- bzw. Übergangsprozesse und Gleichgewichtsverteilungen Austausch- bzw. Übergangsrozesse und Gleichgewichtsverteilungen Wir betrachten ein System mit verschiedenen Zuständen, zwischen denen ein Austausch stattfinden kann. Etwa soziale Schichten in einer Gesellschaft:

Mehr

Tipp III: Leiten Sie eine immer direkt anwendbare Formel her zur Berechnung der sogenannten "bedingten Wahrscheinlichkeit".

Tipp III: Leiten Sie eine immer direkt anwendbare Formel her zur Berechnung der sogenannten bedingten Wahrscheinlichkeit. Mathematik- Unterrichts- Einheiten- Datei e. V. Klasse 9 12 04/2015 Diabetes-Test Infos: www.mued.de Blutspenden werden auf Diabetes untersucht, das mit 8 % in der Bevölkerung verbreitet ist. Dabei werden

Mehr

Das große ElterngeldPlus 1x1. Alles über das ElterngeldPlus. Wer kann ElterngeldPlus beantragen? ElterngeldPlus verstehen ein paar einleitende Fakten

Das große ElterngeldPlus 1x1. Alles über das ElterngeldPlus. Wer kann ElterngeldPlus beantragen? ElterngeldPlus verstehen ein paar einleitende Fakten Das große x -4 Alles über das Wer kann beantragen? Generell kann jeder beantragen! Eltern (Mütter UND Väter), die schon während ihrer Elternzeit wieder in Teilzeit arbeiten möchten. Eltern, die während

Mehr

5 Zusammenhangsmaße, Korrelation und Regression

5 Zusammenhangsmaße, Korrelation und Regression 5 Zusammenhangsmaße, Korrelation und Regression 5.1 Zusammenhangsmaße und Korrelation Aufgabe 5.1 In einem Hauptstudiumsseminar des Lehrstuhls für Wirtschafts- und Sozialstatistik machten die Teilnehmer

Mehr

Güte von Tests. die Wahrscheinlichkeit für den Fehler 2. Art bei der Testentscheidung, nämlich. falsch ist. Darauf haben wir bereits im Kapitel über

Güte von Tests. die Wahrscheinlichkeit für den Fehler 2. Art bei der Testentscheidung, nämlich. falsch ist. Darauf haben wir bereits im Kapitel über Güte von s Grundlegendes zum Konzept der Güte Ableitung der Gütefunktion des Gauss im Einstichprobenproblem Grafische Darstellung der Gütefunktionen des Gauss im Einstichprobenproblem Ableitung der Gütefunktion

Mehr

Lineare Gleichungssysteme

Lineare Gleichungssysteme Lineare Gleichungssysteme 1 Zwei Gleichungen mit zwei Unbekannten Es kommt häufig vor, dass man nicht mit einer Variablen alleine auskommt, um ein Problem zu lösen. Das folgende Beispiel soll dies verdeutlichen

Mehr

Zeichen bei Zahlen entschlüsseln

Zeichen bei Zahlen entschlüsseln Zeichen bei Zahlen entschlüsseln In diesem Kapitel... Verwendung des Zahlenstrahls Absolut richtige Bestimmung von absoluten Werten Operationen bei Zahlen mit Vorzeichen: Addieren, Subtrahieren, Multiplizieren

Mehr

geben. Die Wahrscheinlichkeit von 100% ist hier demnach nur der Gehen wir einmal davon aus, dass die von uns angenommenen

geben. Die Wahrscheinlichkeit von 100% ist hier demnach nur der Gehen wir einmal davon aus, dass die von uns angenommenen geben. Die Wahrscheinlichkeit von 100% ist hier demnach nur der Vollständigkeit halber aufgeführt. Gehen wir einmal davon aus, dass die von uns angenommenen 70% im Beispiel exakt berechnet sind. Was würde

Mehr

Profil A 49,3 48,2 50,7 50,9 49,8 48,7 49,6 50,1 Profil B 51,8 49,6 53,2 51,1 51,1 53,4 50,7 50 51,5 51,7 48,8

Profil A 49,3 48,2 50,7 50,9 49,8 48,7 49,6 50,1 Profil B 51,8 49,6 53,2 51,1 51,1 53,4 50,7 50 51,5 51,7 48,8 1. Aufgabe: Eine Reifenfirma hat für Winterreifen unterschiedliche Profile entwickelt. Bei jeweils gleicher Geschwindigkeit und auch sonst gleichen Bedingungen wurden die Bremswirkungen gemessen. Die gemessenen

Mehr

7 Rechnen mit Polynomen

7 Rechnen mit Polynomen 7 Rechnen mit Polynomen Zu Polynomfunktionen Satz. Zwei Polynomfunktionen und f : R R, x a n x n + a n 1 x n 1 + a 1 x + a 0 g : R R, x b n x n + b n 1 x n 1 + b 1 x + b 0 sind genau dann gleich, wenn

Mehr

Professionelle Seminare im Bereich MS-Office

Professionelle Seminare im Bereich MS-Office Der Name BEREICH.VERSCHIEBEN() ist etwas unglücklich gewählt. Man kann mit der Funktion Bereiche zwar verschieben, man kann Bereiche aber auch verkleinern oder vergrößern. Besser wäre es, die Funktion

Mehr

5.5 PRE-Maße (Fehlerreduktionsmaße) 6

5.5 PRE-Maße (Fehlerreduktionsmaße) 6 359 5.5 PRE-Maße (Fehlerreduktionsmaße) 6 5.5.1 Die grundlegende Konstruktion Völlig andere, sehr allgemeine Grundidee zur Beschreibung von Zusammenhängen. Grundlegendes Prinzip vieler statistischer Konzepte.

Mehr

Fortgeschrittene Statistik Logistische Regression

Fortgeschrittene Statistik Logistische Regression Fortgeschrittene Statistik Logistische Regression O D D S, O D D S - R A T I O, L O G I T T R A N S F O R M A T I O N, I N T E R P R E T A T I O N V O N K O E F F I Z I E N T E N, L O G I S T I S C H E

Mehr

Beispiel 48. 4.3.2 Zusammengesetzte Zufallsvariablen

Beispiel 48. 4.3.2 Zusammengesetzte Zufallsvariablen 4.3.2 Zusammengesetzte Zufallsvariablen Beispiel 48 Ein Würfel werde zweimal geworfen. X bzw. Y bezeichne die Augenzahl im ersten bzw. zweiten Wurf. Sei Z := X + Y die Summe der gewürfelten Augenzahlen.

Mehr

Informationsblatt Induktionsbeweis

Informationsblatt Induktionsbeweis Sommer 015 Informationsblatt Induktionsbeweis 31. März 015 Motivation Die vollständige Induktion ist ein wichtiges Beweisverfahren in der Informatik. Sie wird häufig dazu gebraucht, um mathematische Formeln

Mehr

5 Assoziationsmessung in Kontingenztafeln

5 Assoziationsmessung in Kontingenztafeln 5 Assoziationsmessung in Kontingenztafeln 225 5.1 Multivariate Merkmale Die Analyse eindimensionaler Merkmale ist nur der allererste Schritt zur Beschreibung der Daten. Meist ist die Analyse von Zusammenhängen

Mehr

Stellen Sie bitte den Cursor in die Spalte B2 und rufen die Funktion Sverweis auf. Es öffnet sich folgendes Dialogfenster

Stellen Sie bitte den Cursor in die Spalte B2 und rufen die Funktion Sverweis auf. Es öffnet sich folgendes Dialogfenster Es gibt in Excel unter anderem die so genannten Suchfunktionen / Matrixfunktionen Damit können Sie Werte innerhalb eines bestimmten Bereichs suchen. Als Beispiel möchte ich die Funktion Sverweis zeigen.

Mehr

1 Mathematische Grundlagen

1 Mathematische Grundlagen Mathematische Grundlagen - 1-1 Mathematische Grundlagen Der Begriff der Menge ist einer der grundlegenden Begriffe in der Mathematik. Mengen dienen dazu, Dinge oder Objekte zu einer Einheit zusammenzufassen.

Mehr

Vorlesung Diskrete Strukturen Graphen: Wieviele Bäume?

Vorlesung Diskrete Strukturen Graphen: Wieviele Bäume? Vorlesung Diskrete Strukturen Graphen: Wieviele Bäume? Bernhard Ganter Institut für Algebra TU Dresden D-01062 Dresden bernhard.ganter@tu-dresden.de WS 2013/14 Isomorphie Zwei Graphen (V 1, E 1 ) und (V

Mehr

Lineare Funktionen. 1 Proportionale Funktionen 3 1.1 Definition... 3 1.2 Eigenschaften... 3. 2 Steigungsdreieck 3

Lineare Funktionen. 1 Proportionale Funktionen 3 1.1 Definition... 3 1.2 Eigenschaften... 3. 2 Steigungsdreieck 3 Lineare Funktionen Inhaltsverzeichnis 1 Proportionale Funktionen 3 1.1 Definition............................... 3 1.2 Eigenschaften............................. 3 2 Steigungsdreieck 3 3 Lineare Funktionen

Mehr

Codierungstheorie Rudolf Scharlau, SoSe 2006 9

Codierungstheorie Rudolf Scharlau, SoSe 2006 9 Codierungstheorie Rudolf Scharlau, SoSe 2006 9 2 Optimale Codes Optimalität bezieht sich auf eine gegebene Quelle, d.h. eine Wahrscheinlichkeitsverteilung auf den Symbolen s 1,..., s q des Quellalphabets

Mehr

Repetitionsaufgaben Wurzelgleichungen

Repetitionsaufgaben Wurzelgleichungen Repetitionsaufgaben Wurzelgleichungen Inhaltsverzeichnis A) Vorbemerkungen B) Lernziele C) Theorie mit Aufgaben D) Aufgaben mit Musterlösungen 4 A) Vorbemerkungen Bitte beachten Sie: Bei Wurzelgleichungen

Mehr

11.3 Komplexe Potenzreihen und weitere komplexe Funktionen

11.3 Komplexe Potenzreihen und weitere komplexe Funktionen .3 Komplexe Potenzreihen und weitere komplexe Funktionen Definition.) komplexe Folgen: z n = x n + j. y n mit zwei reellen Folgen x n und y n.) Konvergenz: Eine komplexe Folge z n = x n + j. y n heißt

Mehr

9.2. DER SATZ ÜBER IMPLIZITE FUNKTIONEN 83

9.2. DER SATZ ÜBER IMPLIZITE FUNKTIONEN 83 9.. DER SATZ ÜBER IMPLIZITE FUNKTIONEN 83 Die Grundfrage bei der Anwendung des Satzes über implizite Funktionen betrifft immer die folgende Situation: Wir haben eine Funktion f : V W und eine Stelle x

Mehr

a n + 2 1 auf Konvergenz. Berechnen der ersten paar Folgenglieder liefert:

a n + 2 1 auf Konvergenz. Berechnen der ersten paar Folgenglieder liefert: Beispiel: Wir untersuchen die rekursiv definierte Folge a 0 + auf Konvergenz. Berechnen der ersten paar Folgenglieder liefert: ( ) (,, 7, 5,...) Wir können also vermuten, dass die Folge monoton fallend

Mehr

Statistik I für Betriebswirte Vorlesung 2

Statistik I für Betriebswirte Vorlesung 2 Statistik I für Betriebswirte Vorlesung 2 PD Dr. Frank Heyde TU Bergakademie Freiberg Institut für Stochastik 16. April 2015 PD Dr. Frank Heyde Statistik I für Betriebswirte Vorlesung 2 1 ii) empirische

Mehr

Theoretische Grundlagen der Informatik WS 09/10

Theoretische Grundlagen der Informatik WS 09/10 Theoretische Grundlagen der Informatik WS 09/10 - Tutorium 6 - Michael Kirsten und Kai Wallisch Sitzung 13 02.02.2010 Inhaltsverzeichnis 1 Formeln zur Berechnung Aufgabe 1 2 Hamming-Distanz Aufgabe 2 3

Mehr

Wirtschaftsstatistik. Konzentrations- und Disparitätsmessung 16.10.2007

Wirtschaftsstatistik. Konzentrations- und Disparitätsmessung 16.10.2007 Wirtschaftsstatistik Konzentrations- und Disparitätsmessung 16.10.2007 Begriffe Konzentration und Disparität Laut Oxford Advanced Learner s Dictionary by OUP, bzw. WordNet by Princeton University concentration:

Mehr

Die Gleichung A x = a hat für A 0 die eindeutig bestimmte Lösung. Für A=0 und a 0 existiert keine Lösung.

Die Gleichung A x = a hat für A 0 die eindeutig bestimmte Lösung. Für A=0 und a 0 existiert keine Lösung. Lineare Gleichungen mit einer Unbekannten Die Grundform der linearen Gleichung mit einer Unbekannten x lautet A x = a Dabei sind A, a reelle Zahlen. Die Gleichung lösen heißt, alle reellen Zahlen anzugeben,

Mehr

V 2 B, C, D Drinks. Möglicher Lösungsweg a) Gleichungssystem: 300x + 400 y = 520 300x + 500y = 597,5 2x3 Matrix: Energydrink 0,7 Mineralwasser 0,775,

V 2 B, C, D Drinks. Möglicher Lösungsweg a) Gleichungssystem: 300x + 400 y = 520 300x + 500y = 597,5 2x3 Matrix: Energydrink 0,7 Mineralwasser 0,775, Aufgabenpool für angewandte Mathematik / 1. Jahrgang V B, C, D Drinks Ein gastronomischer Betrieb kauft 300 Dosen Energydrinks (0,3 l) und 400 Liter Flaschen Mineralwasser und zahlt dafür 50, Euro. Einen

Mehr

Dieses erste Kreisdiagramm, bezieht sich auf das gesamte Testergebnis der kompletten 182 getesteten Personen. Ergebnis

Dieses erste Kreisdiagramm, bezieht sich auf das gesamte Testergebnis der kompletten 182 getesteten Personen. Ergebnis Datenanalyse Auswertung Der Kern unseres Projektes liegt ganz klar bei der Fragestellung, ob es möglich ist, Biere von und geschmacklich auseinander halten zu können. Anhand der folgenden Grafiken, sollte

Mehr

Einfache Varianzanalyse für abhängige

Einfache Varianzanalyse für abhängige Einfache Varianzanalyse für abhängige Stichproben Wie beim t-test gibt es auch bei der VA eine Alternative für abhängige Stichproben. Anmerkung: Was man unter abhängigen Stichproben versteht und wie diese

Mehr

LU-Zerlegung. Zusätze zum Gelben Rechenbuch. Peter Furlan. Verlag Martina Furlan. Inhaltsverzeichnis. 1 Definitionen.

LU-Zerlegung. Zusätze zum Gelben Rechenbuch. Peter Furlan. Verlag Martina Furlan. Inhaltsverzeichnis. 1 Definitionen. Zusätze zum Gelben Rechenbuch LU-Zerlegung Peter Furlan Verlag Martina Furlan Inhaltsverzeichnis Definitionen 2 (Allgemeine) LU-Zerlegung 2 3 Vereinfachte LU-Zerlegung 3 4 Lösung eines linearen Gleichungssystems

Mehr

Klausur zu Methoden der Statistik I (mit Kurzlösung) Wintersemester 2007/2008. Aufgabe 1

Klausur zu Methoden der Statistik I (mit Kurzlösung) Wintersemester 2007/2008. Aufgabe 1 Lehrstuhl für Statistik und Ökonometrie der Otto-Friedrich-Universität Bamberg Prof. Dr. Susanne Rässler Klausur zu Methoden der Statistik I (mit Kurzlösung) Wintersemester 2007/2008 Aufgabe 1 Ihnen liegt

Mehr

Abituraufgabe zur Stochastik, Hessen 2009, Grundkurs (TR)

Abituraufgabe zur Stochastik, Hessen 2009, Grundkurs (TR) Abituraufgabe zur Stochastik, Hessen 2009, Grundkurs (TR) Eine Firma stellt USB-Sticks her. Sie werden in der Fabrik ungeprüft in Packungen zu je 20 Stück verpackt und an Händler ausgeliefert. 1 Ein Händler

Mehr

4 Konzentrations- und Armutsmessung

4 Konzentrations- und Armutsmessung 4 Konzentrations- und Armutsmessung 196 4.0 Vorbemerkungen Konzentration: Ausmaß der Ballung von großen Anteilen an der gesamten Merkmalssumme auf wenige Einheiten. Literatur Fahrmeier, L. & Künstler,

Mehr

Einführung in statistische Analysen

Einführung in statistische Analysen Einführung in statistische Analysen Andreas Thams Econ Boot Camp 2008 Wozu braucht man Statistik? Statistik begegnet uns jeden Tag... Weihnachten macht Deutschen Einkaufslaune. Im Advent überkommt die

Mehr

Zusammenhänge zwischen metrischen Merkmalen

Zusammenhänge zwischen metrischen Merkmalen Zusammenhänge zwischen metrischen Merkmalen Darstellung des Zusammenhangs, Korrelation und Regression Daten liegen zu zwei metrischen Merkmalen vor: Datenpaare (x i, y i ), i = 1,..., n Beispiel: x: Anzahl

Mehr

Rekursionen. Georg Anegg 25. November 2009. Methoden und Techniken an Beispielen erklärt

Rekursionen. Georg Anegg 25. November 2009. Methoden und Techniken an Beispielen erklärt Methoden und Techniken an Beispielen erklärt Georg Anegg 5. November 009 Beispiel. Die Folge {a n } sei wie folgt definiert (a, d, q R, q ): a 0 a, a n+ a n q + d (n 0) Man bestimme eine explizite Darstellung

Mehr

0, v 6 = 2 2. 1, v 4 = 1. 2. span(v 1, v 5, v 6 ) = span(v 1, v 2, v 3, v 4, v 5, v 6 ) 4. span(v 1, v 2, v 4 ) = span(v 2, v 3, v 5, v 6 )

0, v 6 = 2 2. 1, v 4 = 1. 2. span(v 1, v 5, v 6 ) = span(v 1, v 2, v 3, v 4, v 5, v 6 ) 4. span(v 1, v 2, v 4 ) = span(v 2, v 3, v 5, v 6 ) Aufgabe 65. Ganz schön span(n)end. Gegeben sei folgende Menge M von 6 Vektoren v, v,..., v 6 R 4 aus Aufgabe P 6: M = v =, v =, v =, v 4 =, v 5 =, v 6 = Welche der folgenden Aussagen sind wahr? span(v,

Mehr

Analog zu Aufgabe 16.1 werden die Daten durch folgenden Befehl eingelesen: > kredit<-read.table("c:\\compaufg\\kredit.

Analog zu Aufgabe 16.1 werden die Daten durch folgenden Befehl eingelesen: > kredit<-read.table(c:\\compaufg\\kredit. Lösung 16.3 Analog zu Aufgabe 16.1 werden die Daten durch folgenden Befehl eingelesen: > kredit

Mehr

Universität Bonn 28. Juli 2010 Fachbereich Rechts- und Wirtschaftswissenschaften Statistische Abteilung Prof. Dr. A. Kneip. KLAUSUR Statistik B

Universität Bonn 28. Juli 2010 Fachbereich Rechts- und Wirtschaftswissenschaften Statistische Abteilung Prof. Dr. A. Kneip. KLAUSUR Statistik B Universität Bonn 28. Juli 2010 Fachbereich Rechts- und Wirtschaftswissenschaften Statistische Abteilung Prof. Dr. A. Kneip Sommersemester 2010 KLAUSUR Statistik B Hinweise zur Bearbeitung: Bei allen Teilaufgaben

Mehr

Statistik I für Betriebswirte Vorlesung 11

Statistik I für Betriebswirte Vorlesung 11 Statistik I für Betriebswirte Vorlesung 11 Prof. Dr. Hans-Jörg Starkloff TU Bergakademie Freiberg Institut für Stochastik 22. Juni 2012 Prof. Dr. Hans-Jörg Starkloff Statistik I für Betriebswirte Vorlesung

Mehr

Berechnung der Erhöhung der Durchschnittsprämien

Berechnung der Erhöhung der Durchschnittsprämien Wolfram Fischer Berechnung der Erhöhung der Durchschnittsprämien Oktober 2004 1 Zusammenfassung Zur Berechnung der Durchschnittsprämien wird das gesamte gemeldete Prämienvolumen Zusammenfassung durch die

Mehr

Vermögensbildung: Sparen und Wertsteigerung bei Immobilien liegen vorn

Vermögensbildung: Sparen und Wertsteigerung bei Immobilien liegen vorn An die Redaktionen von Presse, Funk und Fernsehen 32 02. 09. 2002 Vermögensbildung: Sparen und Wertsteigerung bei Immobilien liegen vorn Das aktive Sparen ist nach wie vor die wichtigste Einflussgröße

Mehr

Lineare Gleichungssysteme

Lineare Gleichungssysteme Brückenkurs Mathematik TU Dresden 2015 Lineare Gleichungssysteme Schwerpunkte: Modellbildung geometrische Interpretation Lösungsmethoden Prof. Dr. F. Schuricht TU Dresden, Fachbereich Mathematik auf der

Mehr

Lösungshinweise zur Einsendearbeit 2 SS 2011

Lösungshinweise zur Einsendearbeit 2 SS 2011 Lösungshinweise zur Einsendearbeit 2 zum Kurs 41500, Finanzwirtschaft: Grundlagen, SS2011 1 Lösungshinweise zur Einsendearbeit 2 SS 2011 Finanzwirtschaft: Grundlagen, Kurs 41500 Aufgabe Finanzierungsbeziehungen

Mehr

Leseprobe. Wilhelm Kleppmann. Versuchsplanung. Produkte und Prozesse optimieren ISBN: 978-3-446-42033-5. Weitere Informationen oder Bestellungen unter

Leseprobe. Wilhelm Kleppmann. Versuchsplanung. Produkte und Prozesse optimieren ISBN: 978-3-446-42033-5. Weitere Informationen oder Bestellungen unter Leseprobe Wilhelm Kleppmann Versuchsplanung Produkte und Prozesse optimieren ISBN: -3-44-4033-5 Weitere Informationen oder Bestellungen unter http://www.hanser.de/-3-44-4033-5 sowie im Buchhandel. Carl

Mehr

Was meinen die Leute eigentlich mit: Grexit?

Was meinen die Leute eigentlich mit: Grexit? Was meinen die Leute eigentlich mit: Grexit? Grexit sind eigentlich 2 Wörter. 1. Griechenland 2. Exit Exit ist ein englisches Wort. Es bedeutet: Ausgang. Aber was haben diese 2 Sachen mit-einander zu tun?

Mehr

Programm 4: Arbeiten mit thematischen Karten

Programm 4: Arbeiten mit thematischen Karten : Arbeiten mit thematischen Karten A) Anteil der ausländischen Wohnbevölkerung an der Wohnbevölkerung insgesamt 2001 in Prozent 1. Inhaltliche und kartographische Beschreibung - Originalkarte Bei dieser

Mehr

Alle gehören dazu. Vorwort

Alle gehören dazu. Vorwort Alle gehören dazu Alle sollen zusammen Sport machen können. In diesem Text steht: Wie wir dafür sorgen wollen. Wir sind: Der Deutsche Olympische Sport-Bund und die Deutsche Sport-Jugend. Zu uns gehören

Mehr

Gleichungen und Ungleichungen

Gleichungen und Ungleichungen Gleichungen Ungleichungen. Lineare Gleichungen Sei die Gleichung ax = b gegeben, wobei x die Unbekannte ist a, b reelle Zahlen sind. Diese Gleichung hat als Lösung die einzige reelle Zahl x = b, falls

Mehr

Gleichungen Lösen. Ein graphischer Blick auf Gleichungen

Gleichungen Lösen. Ein graphischer Blick auf Gleichungen Gleichungen Lösen Was bedeutet es, eine Gleichung zu lösen? Was ist überhaupt eine Gleichung? Eine Gleichung ist, grundsätzlich eine Aussage über zwei mathematische Terme, dass sie gleich sind. Ein Term

Mehr

ONLINE-AKADEMIE. "Diplomierter NLP Anwender für Schule und Unterricht" Ziele

ONLINE-AKADEMIE. Diplomierter NLP Anwender für Schule und Unterricht Ziele ONLINE-AKADEMIE Ziele Wenn man von Menschen hört, die etwas Großartiges in ihrem Leben geleistet haben, erfahren wir oft, dass diese ihr Ziel über Jahre verfolgt haben oder diesen Wunsch schon bereits

Mehr

Anhand des bereits hergeleiteten Models erstellen wir nun mit der Formel

Anhand des bereits hergeleiteten Models erstellen wir nun mit der Formel Ausarbeitung zum Proseminar Finanzmathematische Modelle und Simulationen bei Raphael Kruse und Prof. Dr. Wolf-Jürgen Beyn zum Thema Simulation des Anlagenpreismodels von Simon Uphus im WS 09/10 Zusammenfassung

Mehr

Was ist Sozial-Raum-Orientierung?

Was ist Sozial-Raum-Orientierung? Was ist Sozial-Raum-Orientierung? Dr. Wolfgang Hinte Universität Duisburg-Essen Institut für Stadt-Entwicklung und Sozial-Raum-Orientierte Arbeit Das ist eine Zusammen-Fassung des Vortrages: Sozialräume

Mehr

Einführung in die Algebra

Einführung in die Algebra Prof. Dr. H. Brenner Osnabrück SS 2009 Einführung in die Algebra Vorlesung 13 Einheiten Definition 13.1. Ein Element u in einem Ring R heißt Einheit, wenn es ein Element v R gibt mit uv = vu = 1. DasElementv

Mehr

3. LINEARE GLEICHUNGSSYSTEME

3. LINEARE GLEICHUNGSSYSTEME 176 3. LINEARE GLEICHUNGSSYSTEME 90 Vitamin-C-Gehalt verschiedener Säfte 18,0 mg 35,0 mg 12,5 mg 1. a) 100 ml + 50 ml + 50 ml = 41,75 mg 100 ml 100 ml 100 ml b) : Menge an Kirschsaft in ml y: Menge an

Mehr

QM: Prüfen -1- KN16.08.2010

QM: Prüfen -1- KN16.08.2010 QM: Prüfen -1- KN16.08.2010 2.4 Prüfen 2.4.1 Begriffe, Definitionen Ein wesentlicher Bestandteil der Qualitätssicherung ist das Prüfen. Sie wird aber nicht wie früher nach der Fertigung durch einen Prüfer,

Mehr

ERGÄNZUNGEN ZUR ANALYSIS II MITTELWERTSATZ UND ANWENDUNGEN

ERGÄNZUNGEN ZUR ANALYSIS II MITTELWERTSATZ UND ANWENDUNGEN ERGÄNZUNGEN ZUR ANALYSIS II MITTELWERTSATZ UND ANWENDUNGEN CHRISTIAN HARTFELDT. Zweiter Mittelwertsatz Der Mittelwertsatz Satz VI.3.4) lässt sich verallgemeinern zu Satz.. Seien f, g : [a, b] R auf [a,

Mehr

Beweisbar sichere Verschlüsselung

Beweisbar sichere Verschlüsselung Beweisbar sichere Verschlüsselung ITS-Wahlpflichtvorlesung Dr. Bodo Möller Ruhr-Universität Bochum Horst-Görtz-Institut für IT-Sicherheit Lehrstuhl für Kommunikationssicherheit bmoeller@crypto.rub.de 6

Mehr

Tutorial: Homogenitätstest

Tutorial: Homogenitätstest Tutorial: Homogenitätstest Eine Bank möchte die Kreditwürdigkeit potenzieller Kreditnehmer abschätzen. Einerseits lebt die Bank ja von der Vergabe von Krediten, andererseits verursachen Problemkredite

Mehr

Grundlagen der höheren Mathematik Einige Hinweise zum Lösen von Gleichungen

Grundlagen der höheren Mathematik Einige Hinweise zum Lösen von Gleichungen Grundlagen der höheren Mathematik Einige Hinweise zum Lösen von Gleichungen 1. Quadratische Gleichungen Quadratische Gleichungen lassen sich immer auf die sog. normierte Form x 2 + px + = 0 bringen, in

Mehr

Willkommen zur Vorlesung Statistik (Master)

Willkommen zur Vorlesung Statistik (Master) Willkommen zur Vorlesung Statistik (Master) Thema dieser Vorlesung: Verteilungsfreie Verfahren Prof. Dr. Wolfgang Ludwig-Mayerhofer Universität Siegen Philosophische Fakultät, Seminar für Sozialwissenschaften

Mehr

Auswerten mit Excel. Viele Video-Tutorials auf Youtube z.b. http://www.youtube.com/watch?v=vuuky6xxjro

Auswerten mit Excel. Viele Video-Tutorials auf Youtube z.b. http://www.youtube.com/watch?v=vuuky6xxjro Auswerten mit Excel Viele Video-Tutorials auf Youtube z.b. http://www.youtube.com/watch?v=vuuky6xxjro 1. Pivot-Tabellen erstellen: In der Datenmaske in eine beliebige Zelle klicken Registerkarte Einfügen

Mehr

3.1. Die komplexen Zahlen

3.1. Die komplexen Zahlen 3.1. Die komplexen Zahlen Es gibt viele Wege, um komplexe Zahlen einzuführen. Wir gehen hier den wohl einfachsten, indem wir C R als komplexe Zahlenebene und die Punkte dieser Ebene als komplexe Zahlen

Mehr

Varianzanalyse (ANOVA: analysis of variance)

Varianzanalyse (ANOVA: analysis of variance) Varianzanalyse (AOVA: analysis of variance) Einfaktorielle VA Auf der Basis von zwei Stichproben wird bezüglich der Gleichheit der Mittelwerte getestet. Variablen müssen Variablen nur nominalskaliert sein.

Mehr

Skript und Aufgabensammlung Terme und Gleichungen Mathefritz Verlag Jörg Christmann Nur zum Privaten Gebrauch! Alle Rechte vorbehalten!

Skript und Aufgabensammlung Terme und Gleichungen Mathefritz Verlag Jörg Christmann Nur zum Privaten Gebrauch! Alle Rechte vorbehalten! Mathefritz 5 Terme und Gleichungen Meine Mathe-Seite im Internet kostenlose Matheaufgaben, Skripte, Mathebücher Lernspiele, Lerntipps, Quiz und noch viel mehr http:// www.mathefritz.de Seite 1 Copyright

Mehr

Entladen und Aufladen eines Kondensators über einen ohmschen Widerstand

Entladen und Aufladen eines Kondensators über einen ohmschen Widerstand Entladen und Aufladen eines Kondensators über einen ohmschen Widerstand Vorüberlegung In einem seriellen Stromkreis addieren sich die Teilspannungen zur Gesamtspannung Bei einer Gesamtspannung U ges, der

Mehr

Gibt es einen Geschmacksunterschied zwischen Coca Cola und Cola Zero?

Gibt es einen Geschmacksunterschied zwischen Coca Cola und Cola Zero? Gibt es einen Geschmacksunterschied zwischen Coca Cola und Cola Zero? Manche sagen: Ja, manche sagen: Nein Wie soll man das objektiv feststellen? Kann man Geschmack objektiv messen? - Geschmack ist subjektiv

Mehr

Kapitalerhöhung - Verbuchung

Kapitalerhöhung - Verbuchung Kapitalerhöhung - Verbuchung Beschreibung Eine Kapitalerhöhung ist eine Erhöhung des Aktienkapitals einer Aktiengesellschaft durch Emission von en Aktien. Es gibt unterschiedliche Formen von Kapitalerhöhung.

Mehr

Felix Klug SS 2011. 2. Tutorium Deskriptive Statistik

Felix Klug SS 2011. 2. Tutorium Deskriptive Statistik 2. Tutorium Deskriptive Statistik Felix Klug SS 2011 Skalenniveus Weitere Beispiele für Skalenniveus (Entnommen aus Wiederholungsblatt 1.): Skalenniveu Nominalskala Ordinalskala Intervallskala Verhältnisskala

Mehr

infach Geld FBV Ihr Weg zum finanzellen Erfolg Florian Mock

infach Geld FBV Ihr Weg zum finanzellen Erfolg Florian Mock infach Ihr Weg zum finanzellen Erfolg Geld Florian Mock FBV Die Grundlagen für finanziellen Erfolg Denn Sie müssten anschließend wieder vom Gehaltskonto Rückzahlungen in Höhe der Entnahmen vornehmen, um

Mehr

Vorkurs Mathematik Übungen zu Polynomgleichungen

Vorkurs Mathematik Übungen zu Polynomgleichungen Vorkurs Mathematik Übungen zu en 1 Aufgaben Lineare Gleichungen Aufgabe 1.1 Ein Freund von Ihnen möchte einen neuen Mobilfunkvertrag abschließen. Es gibt zwei verschiedene Angebote: Anbieter 1: monatl.

Mehr

Bevor lineare Gleichungen gelöst werden, ein paar wichtige Begriffe, die im Zusammenhang von linearen Gleichungen oft auftauchen.

Bevor lineare Gleichungen gelöst werden, ein paar wichtige Begriffe, die im Zusammenhang von linearen Gleichungen oft auftauchen. R. Brinkmann http://brinkmann-du.de Seite 1 13.0.010 Lineare Gleichungen Werden zwei Terme durch ein Gleichheitszeichen miteinander verbunden, so entsteht eine Gleichung. Enthält die Gleichung die Variable

Mehr

Behörde für Bildung und Sport Abitur 2008 Lehrermaterialien zum Leistungskurs Mathematik

Behörde für Bildung und Sport Abitur 2008 Lehrermaterialien zum Leistungskurs Mathematik Abitur 8 II. Insektenpopulation LA/AG In den Tropen legen die Weibchen einer in Deutschland unbekannten Insektenpopulation jedes Jahr kurz vor Beginn der Regenzeit jeweils 9 Eier und sterben bald darauf.

Mehr

Name:... Matrikel-Nr.:... 3 Aufgabe Handyklingeln in der Vorlesung (9 Punkte) Angenommen, ein Student führt ein Handy mit sich, das mit einer Wahrscheinlichkeit von p während einer Vorlesung zumindest

Mehr

Daten sammeln, darstellen, auswerten

Daten sammeln, darstellen, auswerten Vertiefen 1 Daten sammeln, darstellen, auswerten zu Aufgabe 1 Schulbuch, Seite 22 1 Haustiere zählen In der Tabelle rechts stehen die Haustiere der Kinder aus der Klasse 5b. a) Wie oft wurden die Haustiere

Mehr

Access [basics] Gruppierungen in Abfragen. Beispieldatenbank. Abfragen gruppieren. Artikel pro Kategorie zählen

Access [basics] Gruppierungen in Abfragen. Beispieldatenbank. Abfragen gruppieren. Artikel pro Kategorie zählen Abfragen lassen sich längst nicht nur dazu benutzen, die gewünschten Felder oder Datensätze einer oder mehrerer Tabellen darzustellen. Sie können Daten auch nach bestimmten Kriterien zu Gruppen zusammenfassen

Mehr

Box-and-Whisker Plot -0,2 0,8 1,8 2,8 3,8 4,8

Box-and-Whisker Plot -0,2 0,8 1,8 2,8 3,8 4,8 . Aufgabe: Für zwei verschiedene Aktien wurde der relative Kurszuwachs (in % beobachtet. Aus den jeweils 20 Quartaldaten ergaben sich die folgenden Box-Plots. Box-and-Whisker Plot Aktie Aktie 2-0,2 0,8,8

Mehr

DAS PARETO PRINZIP DER SCHLÜSSEL ZUM ERFOLG

DAS PARETO PRINZIP DER SCHLÜSSEL ZUM ERFOLG DAS PARETO PRINZIP DER SCHLÜSSEL ZUM ERFOLG von Urs Schaffer Copyright by Urs Schaffer Schaffer Consulting GmbH Basel www.schaffer-consulting.ch Info@schaffer-consulting.ch Haben Sie gewusst dass... >

Mehr

a) Zeichnen Sie in das nebenstehende Streudiagramm mit Lineal eine Regressionsgerade ein, die Sie für passend halten.

a) Zeichnen Sie in das nebenstehende Streudiagramm mit Lineal eine Regressionsgerade ein, die Sie für passend halten. Statistik für Kommunikationswissenschaftler Wintersemester 2009/200 Vorlesung Prof. Dr. Helmut Küchenhoff Übung Cornelia Oberhauser, Monia Mahling, Juliane Manitz Thema 4 Homepage zur Veranstaltung: http://www.statistik.lmu.de/~helmut/kw09.html

Mehr

2. Deskriptive Statistik 2.1. Häufigkeitstabellen, Histogramme, empirische Verteilungsfunktionen

2. Deskriptive Statistik 2.1. Häufigkeitstabellen, Histogramme, empirische Verteilungsfunktionen 4. Datenanalyse und Modellbildung Deskriptive Statistik 2-1 2. Deskriptive Statistik 2.1. Häufigkeitstabellen, Histogramme, empirische Verteilungsfunktionen Für die Auswertung einer Messreihe, die in Form

Mehr

AUTOMATISIERTE HANDELSSYSTEME

AUTOMATISIERTE HANDELSSYSTEME UweGresser Stefan Listing AUTOMATISIERTE HANDELSSYSTEME Erfolgreich investieren mit Gresser K9 FinanzBuch Verlag 1 Einsatz des automatisierten Handelssystems Gresser K9 im Portfoliomanagement Portfoliotheorie

Mehr

Motivation. Formale Grundlagen der Informatik 1 Kapitel 5 Kontextfreie Sprachen. Informales Beispiel. Informales Beispiel.

Motivation. Formale Grundlagen der Informatik 1 Kapitel 5 Kontextfreie Sprachen. Informales Beispiel. Informales Beispiel. Kontextfreie Kontextfreie Motivation Formale rundlagen der Informatik 1 Kapitel 5 Kontextfreie Sprachen Bisher hatten wir Automaten, die Wörter akzeptieren Frank Heitmann heitmann@informatik.uni-hamburg.de

Mehr