6. Auswertung mehrdimensionaler Daten

Save this PDF as:
 WORD  PNG  TXT  JPG

Größe: px
Ab Seite anzeigen:

Download "6. Auswertung mehrdimensionaler Daten"

Transkript

1 6. Auswertung mehrdimensionaler Daten Bisher: Auswertungsmethoden für Daten eines einzelnen Merkmals, z.b. Diskrete Klassierung Grafische Darstellungen (Verteilungsfunktion) Lagemaße Streungsmaße Schiefemaße 199

2 Jetzt: Methoden zur Auswertung von Daten über mehrere Merkmale gleichzeitig (mehrdimensionale oder multivariate Daten) Ziele: Simultane Beschreibung durch Tabellen und Grafiken Mehrdimensionale Messung von Lage und Streuung Aufdecken von Beziehungen zwischen den Merkmalen (Korrelationen) 200

3 6.1 Grundbegriffe Ausgangssituation: [I] n Merkmalsträger e 1, e 2,..., e n Grundgesamtheit: G = {e 1, e 2,..., e n } 2 Merkmale X und Y, die jeweils am Merkmalsträger e i, i = 1,..., n, beobachtet werden können 201

4 Ausgangssituation: [II] Urliste lautet dann: (x 1, y 1 ), (x 2, y 2 ),..., (x n, y n ) oder in Matrix-Schreibweise (n 2 Matrix) x 1 y 1 x 2. y 2. x n y n 202

5 Beispiel: [I] Ausgaben für Werbung und Absätze von 84 Unternehmen in den USA im Jahr 1990 Merkmale X: Ausgaben für Werbung (in Mill. US-$) Y : Absatz (in Mill. US-$) 203

6 Beispiel: [II] Datensatz: i Werbeausgaben (X) Absätze (Y) Falls X und Y metrisch skaliert sind (wie hier), kann man die n Datenpunkte (x 1, y 1 ),..., (x n, y n ) in einem Streudiagramm darstellen 204

7 Streudiagramm Werbeausgaben gegen Absatzzahlen 560 Absatz in Mill. US-$ (Y) Werbeausgaben in Mill. US-$ (X) 205

8 Jetzt: Betrachte p 2 Merkmale X 1,..., X p mit Beobachtungen (x i1, x i2,..., x ip ) für die Untersuchungseinheit e i Urliste bzw. n p Datenmatrix: (x 11, x 12,..., x 1p ), (x 21, x 22,..., x 2p ),..., (x n1, x n2,..., x np ) x 11 x x 1p x 21 x x 2p x n1 x n2... x np 206

9 6.1.1 Kontingenztafel und Häufigkeiten Gegeben: 2 Merkmale X und Y n 2 Datenmatrix x 1 y 1 x 2. y 2. x n bzw. Urliste mit n Zahlenpaaren y n (x i, y i ), i = 1,..., n, 207

10 Ziel: Beschreibung von absoluten und relativen Häufigkeiten Notation: ξ 1,..., ξ J seien die J möglichen Werte von X η 1,..., η K seien die K möglichen Werte von Y 208

11 Definition 6.1: (Gemeinsame und Randhäufigkeiten) [I] Für jedes j = 1,..., J und k = 1,..., K versteht man 1. unter der gemeinsamen absoluten Häufigkeit die Anzahl n jk aller Datenpaare (x i, y i ) für die gilt x i = ξ j und y i = η k. 2. unter den absoluten Randhäufigkeiten der X-Ausprägung ξ j bzw. der Y -Ausprägung η k die Summen n j = K k=1 n jk bzw. n k = J j=1 n jk. 209

12 Definition 6.1: (Gemeinsame und Randhäufigkeiten) [II] 3. Die gemeinsamen absoluten Häufigkeiten zusammen mit den absoluten Randhäufigkeiten stellt man übersichtlich in der folgenden Häufigkeitstabelle dar, die man Kontingenztafel oder Kontingenztabelle nennt: η 1 η 2.. Y. = η K 1 η K ξ 1 n 11 n n 1(K 1) n 1K n 1 ξ 2 n 21 n X =... n 2(K 1). n 2K. n 2. ξ J 1 n (J 1)1 n (J 1)2... n (J 1)(K 1) n (J 1)K n (J 1) ξ J n J1 n J2... n J(K 1) n JK n J n 1 n 2... n (K 1) n K n 210

13 Beispiel: [I] Erhebung folgender Merkmale bei n = 1000 Personen: Berufszugehörigkeit X Ausmaß sportlicher Betätigung Y 211

14 Beispiel: [II] Kontingenztabelle: Y (sportliche Betätigung) X (Berufsgruppe) nie gelegentlich regelmäßig Arbeiter Angestellte Beamte Landwirte sonstige Offensichtlich: Aus gemeinsamen Häufigkeiten lassen sich Randhäufigkeiten eindeutig bestimmen (Umkehrung gilt nicht!) 212

15 Definition 6.2: (Relative Häufigkeiten, Randverteilung) Für jedes j = 1,..., J und k = 1,..., K heißen 1. f jk = n jk n die gemeinsame relative Häufigkeit von ξ j und η k, 2. f j = K k=1 f jk bzw. f k = J j=1 f jk die relative Randhäufigkeit von ξ j bzw. η k. 3. Die relativen Randhäufigkeiten f 1, f 2,..., f J der Werte von X nennt man die Randverteilung des Merkmals X. Entsprechend bilden die relativen Randhäufigkeiten f 1, f 2,..., f K die Randverteilung des Merkmals Y. 213

16 Kontingenztafel mit relativen Häufigkeiten: η 1 η 2.. Y. = η K 1 η K ξ 1 f 11 f f 1(K 1) f 1K f 1 ξ 2 f 21 f X =... f 2(K 1). f 2K. f 2. ξ J 1 f (J 1)1 f (J 1)2... f (J 1)(K 1) f (J 1)K f (J 1) ξ J f J1 f J2... f J(K 1) f JK f J f 1 f 2... f (K 1) f K 1 214

17 Bemerkung: Offensichtlich gilt: J K j=1 k=1 f jk = J j=1 f j = K k=1 f k = 1 (Die Summe über den relativen Randhäufigkeiten eines jeden Merkmals ist 1) 215

18 Kontingenztabelle mit relativen Häufigkeiten für das obige Beispiel: Y (sportliche Betätigung) X (Berufsgruppe) nie gelegentlich regelmäßig Arbeiter Angestellte Beamte Landwirte sonstige

19 6.1.2 Bedingte Verteilungen Jetzt: Weiteres wichtiges Konzept der mehrdimensionalen Datenanalyse Definition 6.3: (Bedingte relative Häufigkeiten) Für ein festes k {1,..., K} sowie für jedes j = 1,..., J nennt man die Größe f j Y =ηk = f jk f k die bedingte relative Häufigkeit von ξ j unter der Bedingung Y = η k. 217

20 Bemerkung: Die bedingte relative Häufigkeit f j Y =ηk ist die relative Häufigkeit der X-Ausprägung ξ j in der Teilgesamtheit aller derjenigen Einheiten, welche die Y -Ausprägung η k aufweisen, denn f j Y =ηk = f jk f k = Definition 6.4: (Bedingte Verteilung) n jk n n k n = n jk n k Gemäß Definition 6.3 kann man insgesamt J bedingte relative Häufigkeiten betrachten: f 1 Y =ηk, f 2 Y =ηk,..., f J Y =ηk. Die Gesamtheit dieser J Werte heißt die bedingte Verteilung von X unter (der Bedingung) Y = η k. 218

21 Bemerkungen: [I] Analog zu Definition 6.3 definiere für ein festes j {1,..., J} sowie für beliebige k = 1,..., K f k X=ξj = f jk f j. Diese Größe heißt bedingte relative Häufigkeit von η k unter (der Bedingung) X = ξ j. Analog zu Definition 6.4 heißt f 1 X=ξj, f 2 X=ξj,..., f K X=ξj die bedingte Verteilung von Y unter X = ξ j 219

22 Bemerkungen: [II] Offensichtlich gilt: J j=1 K k=1 f j Y =ηk = f k X=ξj = J j=1 K k=1 n jk n k = 1 n jk n j = 1 für jedes k = 1,..., K für jedes j = 1,..., J 220

23 Beispiel: (Berufsgruppe Sport, vgl. Folien 211 ff.) Gesucht: [I] Verteilung der sportlichen Aktivität bei Arbeitern oder statistisch ausgedrückt: Die bedingte Verteilung von Y unter X = ξ 1 f 1 X=ξ1 = n 11 = 240 n f 2 X=ξ1 = n 12 = 120 n f 3 X=ξ1 = n 13 n 1 = = (nie) = (gelegentlich) = (regelmäßig) 221

24 Gesucht: [II] Verteilung der Berufsgruppen bei regelmäßig Aktiven oder statistisch ausgedrückt: Die bedingte Verteilung von X unter Y = η 3 f 1 Y =η3 = f 2 Y =η3 = f 3 Y =η3 = f 4 Y =η3 = f 5 Y =η3 = = (Arbeiter) = (Angestellte) = (Beamte) = (Landwirte) = (sonstige) 222

25 6.1.3 Deskriptive Unabhängigkeit Jetzt: Frage nach dem Zusammenhang zwischen X und Y Definition 6.5: (Deskriptive Unabhängigkeit) Die Merkmale X und Y heißen deskriptiv unabhängig, falls sich für alle j = 1,..., J und für alle k = 1,..., K die gemeinsamen relativen Häufigkeiten als Produkt der relativen Randhäufigkeiten ergeben, d.h. falls gilt f jk = f j f k. 223

26 Beispiel: (Geschlecht (X) gewählte Partei (Y )) Kontingenztafel mit absoluten Häufigkeiten: Y (Partei) X (Geschlecht) A B C männlich weiblich

27 Kontingenztafel mit relativen Häufigkeiten: Y (Partei) X (Geschlecht) A B C männlich weiblich f 11 = 0.20 = = f 1 f 1 f 12 = 0.12 = = f 1 f 2 f 13 = 0.08 = = f 1 f 3 f 21 = 0.30 = = f 2 f 1 f 22 = 0.18 = = f 2 f 2 f 23 = 0.12 = = f 2 f 3 Fazit: X und Y sind deskriptiv unabhängig 225

28 Betrachte nun: Bedingte Verteilungen von X unter Y = η 1, Y = η 2, Y = η 3 Bedingte Verteilungen von Y unter X = ξ 1, X = ξ 2 Bedingte Verteilungen von X: [I] unter Y = η 1 : f 1 Y =η1 = f 11 f 1 = = 0.40 f 2 Y =η1 = f 21 f 1 = =

29 Bedingte Verteilungen von X: [II] unter Y = η 2 : f 1 Y =η2 = f 12 f 2 = = 0.40 f 2 Y =η2 = f 22 f 2 = = 0.60 unter Y = η 3 : f 1 Y =η3 = f 13 f 3 = = 0.40 f 2 Y =η3 = f 23 f 3 = =

30 Offensichtlich: Bedingte Verteilungen von X unter Y = η 1, Y = η 2, Y = η 3 sind alle gleich Man überprüft leicht, dass die bedingten Verteilungen von Y unter X = ξ 1, X = ξ 2 ebenfalls beide gleich sind 228

31 Allgemein gilt: X und Y sind genau dann deskriptiv unabhängig, sobald eine der folgenden äquivalenten Bedingungen erfüllt ist: Für alle j = 1,..., J und alle k = 1,..., K gilt: f jk = f j f k (= Definition 6.5) Für alle j = 1,..., J und alle k = 1,..., K gilt: Für alle j = 1,..., J gilt: n jk = n j n k n f j Y =η1 = f j Y =η2 =... = f j Y =ηk = f j Für alle k = 1,..., K gilt: f k X=ξ1 = f k X=ξ2 =... = f k X=ξJ = f k 229

32 6.1.4 Arithmetische Mittel und Varianzen Annahmen: X und Y sind metrisch skaliert (sinnvolle Arithmetik) Daten liegen in Kontingenztafeln vor (absolute oder relative Häufigkeiten) 230

33 Jetzt: Übertragung von Mittelwert und Varianz auf mehrdimensionale Daten Mittelwert- und Varianzbildung über Rand- bzw. bedingte Verteilungen Definition 6.6: (Arithmetische Mittel) Die arithmetischen Mittel von X und Y sind definiert als die arithmetischen Mittel der jeweiligen Randverteilung: x = 1 n J j=1 ξ j n j = J j=1 ξ j f j, y = 1 n K k=1 η k n k = K k=1 η k f k. 231

34 Bemerkung: In mehrdimensionalen Datensätzen sind die arithmetischen Mittel einzelner Merkmale einfach die Mittelwerte der einzelnen Datenreihen Definition 6.7: (Bedingte arithmetische Mittel) Das bedingte arithmetische Mittel von X unter Y = η k (k fest) sowie das bedingte arithmetische Mittel von Y unter X = ξ j (j fest) sind jeweils definiert als die arithmetischen Mittel der entsprechenden bedingten Verteilungen von X und Y : x k = 1 n k J j=1 ξ j n jk = J j=1 ξ j f j Y =ηk, y j = 1 n j K k=1 η k n jk = K k=1 η k f k X=ξj. 232

35 Bemerkungen: Sind X und Y deskriptiv unabhängig, so stimmen sämtliche bedingte Verteilungen von X mit der Randverteilung von X überein (vgl. Folie 229). Da das bedingte arithmetische Mittel von X unter Y = η k der Mittelwert der entsprechenden bedingten Verteilung von X ist, stimmt im Fall der deskriptiven Unabhängigkeit für jedes k der bedingte Mittelwert x k mit dem gewöhnlichen Mittelwert überein: x 1 = x 2 =... = x K = x Analog gilt im Fall der deskriptiven Unabhängigkeit für die bedingten Mittelwerte von Y : y 1 = y 2 =... = y J = y 233

36 Jetzt: Definition von Varianzen und bedingten Varianzen von X und Y Definition 6.8: (Varianz) Die Varianzen von X und Y sind definiert als die Varianzen der jeweiligen Randverteilungen, d.h. s 2 X = 1 n s 2 Y = 1 n J j=1 K k=1 ( ξj x ) 2 nj = 1 n (η k y) 2 n k = 1 n J j=1 K k=1 ξ 2 j n j x 2, η 2 k n k y

37 Bemerkung: In mehrdimensionalen Datensätzen sind die Varianzen der einzelnen Merkmale einfach die Varianzen der einzelnen Datenreihen Definition 6.9: (Bedingte Varianz) Die bedingte Varianz von X unter Y = η k (k fest) sowie die bedingte Varianz von Y unter X = ξ j (j fest) sind definiert als die Varianzen der entsprechenden bedingten Verteilungen von X und Y : s 2 X Y =η k = s 2 Y X=ξ j = J j=1 K k=1 ( ξj x k ) 2 n jk n k = ( ηk y j ) 2 n jk n j = J j=1 K k=1 ξ 2 j njk n k x 2 k, η 2 k njk n j y 2 j. 235

38 Bemerkungen: Sind X und Y deskriptiv unabhängig, so stimmen sämtliche bedingte Verteilungen von X mit der Randverteilung von X überein (vgl. Folie 229). Da die bedingte Varianz von X unter Y = η k die Varianz der entsprechenden bedingten Verteilung von X ist, stimmt im Fall der deskriptiven Unabhängigkeit für jedes k die bedingte Varianz s 2 X Y =η mit der gewöhnlichen k Varianz überein: s 2 X Y =η 1 = s 2 X Y =η 2 =... = s 2 X Y =η K = s 2 X Analog gilt im Fall der deskriptiven Unabhängigkeit für die bedingten Varianzen von Y : s 2 Y X=ξ 1 = s 2 Y X=ξ 2 =... = s 2 Y X=ξ J = s 2 Y 236

39 Beispiel: (Wohnraum) Betrachte n = 1000 Wohnungen Merkmale: X: Anzahl der Wohnräume pro Wohnung Y : Anzahl der Personen pro Wohnung 237

40 Y = 1 Y = 2 Y = 3 Y = 4 Y = 5 X = X = X = X = X = Berechnung von (bedingten) Mittelwerten und Varianzen Im Proseminar 238

41 6.2 Zusammenhangsmaße Gegeben: Zwei Merkmale X und Y mit Urliste der Länge n Gesucht: Maßzahl für den Zusammenhang zwischen X und Y 239

42 Beispiele: Zusammenhang zwischen Körpergröße (X) und Körpergewicht (Y ) Zusammenhang zwischen Inflationsrate (X) und Arbeitslosenquote (Y ) (Phillips-Kurve) Zusammenhang zwischen Arbeitslosigkeit (X) und Wirtschaftswachstum (Y ) (Okunsches Gesetz) 240

43 Wichtiges Charakteristikum: Datenniveau von X und Y Metrische Skalierung Ordinale Skalierung Nominale Skalierung 241

44 6.2.1 Metrische Daten: Korrelationskoeffizient Situation: X und Y sind metrisch skaliert Urliste: (x 1, y 1 ),..., (x n, y n ) Frage: Wie hängen X und Y zusammen? 242

45 Zunächst: Betrachte für ein festes i {1,..., n} die Größe T 1 = (x i x) (y i y) Offensichtlich gilt: T 1 > 0 = x i und y i sind beide jeweils größer oder beide jeweils kleiner als ihre Mittelwerte T 1 < 0 = x i und y i verhalten sich jeweils umgekehrt bzgl. ihrer Lage zum jeweiligen Mittelwert 243

46 Jetzt: Summenbildung über alle Daten T 2 = n i=1 (x i x) (y i y) T 2 0: = Die positiven Summanden in T 2 überwiegen die negativen erheblich. Zu hohen bzw. niedrigen x i gehören tendenziell hohe bzw. niedrige y i (positiver Zusammenhang) 244

47 Summenbildung über alle Daten: [II] T 2 0: = Die negativen Summanden in T 2 überwiegen die positiven erheblich. Zu hohen bzw. niedrigen x i gehören tendenziell nun niedrige bzw. hohe y i (negativer Zusammenhang) T 2 0: = Positive und negative Summanden in T 2 heben sich tendenziell auf. Zu hohen ( niedrigen ) x i gehören nun sowohl niedrige als auch hohe y i (kein Zusammenhang) 245

48 Definition 6.10: (Kovarianz) Die Kovarianz zwischen X und Y ist definiert durch s XY = 1 n n i=1 (x i x) (y i y) = 1 n n i=1 x i y i x y. Bemerkungen: [I] Die Kovarianz s XY ist symmetrisch, d.h. s XY = s Y X 246

49 Bemerkungen: [II] Die Kovarianz eines Merkmals mit sich selbst ist gleich der Varianz des Merkmals: s XX = 1 n n i=1 (x i x) 2 = s 2 X Liegt die Datenurliste in Form einer Häufigkeitstabelle vor, so ist die Kovarianz gegeben durch s XY = 1 n = 1 n J K j=1 k=1 J K j=1 k=1 ( ξj x ) (η k y) n jk ξ j η k n jk x y 247

50 Jetzt: Normierung der Kovarianz s XY durch Division durch das Produkt der Standardabweichungen von X und Y 248

51 Definition 6.11: (Korrelationskoeffizient von Bravais-Pearson) Der Korrelationskoeffizient zwischen X und Y ist definiert durch r XY = = s XY s 2 X n i=1 s 2 Y n i=1 = n i=1 n i=1 (x i x) (y i y) (x i x) 2 x i y i n x y x 2 i n x2 n i=1 n i=1 y 2 i n y2. (y i y) 2 249

52 Bemerkungen: [I] Der Korrelationskoeffizient r XY ist symmetrisch : r XY = r Y X Der Korrelationskoeffizient ist normiert, d.h. es gilt immer 1 r XY 1 Wenn r XY = 0 ist, so sagt man: Die Merkmale X und Y sind unkorreliert 250

53 Bemerkungen: [II] Sind X und Y deskriptiv unabhängig, so gilt: r XY = 0 (Deskrip. Unabhängigkeit impliziert Unkorreliertheit) Vorsicht: Die Umkehrung gilt im allgemeinen nicht (Unkorreliertheit (r XY = 0) impliziert nicht die deskriptive Unabhängigkeit von X und Y ) Ist r XY = 1 oder r XY = 1, so sagt man: Die Merkmale X und Y sind perfekt korreliert 251

54 Zentrales Resultat: Es gilt r XY = 1 genau dann, wenn es Zahlen a > 0, b R gibt, so dass y i = a x i + b für alle i = 1,..., n gilt (Alle Daten liegen auf einer Geraden mit positiver Steigung) Es gilt r XY = 1 genau dann, wenn es Zahlen a < 0, b R gibt, so dass y i = a x i + b für alle i = 1,..., n gilt (Alle Daten liegen auf einer Geraden mit negativer Steigung) 252

55 Offensichtlich: Der Korrelationskoefizient r XY ist ein Maß für den linearen Zusammenhang zwischen X und Y Vorsicht: r XY = 0 (bzw. r XY 0) bedeutet nur, dass kein (bzw. nur ein schwacher) linearer Zusammenhang zwischen X und Y besteht. Es können aber trotzdem starke andere (nichtlineare) Zusammenhänge zwischen X und Y bestehen 253

56 Korrelation zwischen X und Y: Korrelation zwischen X und Y2: Y 0 Y X X Korrelation zwischen X und Y1: Korrelation zwischen X und Y3: Y Y X X

57 Weitere Aspekte zur Korrelation: [I] Korrelation und Kausalität Scheinkorrelation: Die zu untersuchenden Merkmale X und Y hängen beide von einem 3. Merkmal Z ab, das nicht Gegenstand der Untersuchung ist. Ein hoher Wert für r XY kann daher zustandekommen, weil sowohl X als auch Y von Z abhängen (indirekter Zusammenhang) Beispiel: X: Wortschatz eines Kindes Y : Körpergröße eines Kindes Z: Alter eines Kindes 255

58 Weitere Aspekte zur Korrelation: [II] Nonsens-Korrelation: Hohe Korrelation zwischen völlig sachfremden Merkmalen X und Y Beispiel: Hohe Korrelation zwischen (menschlicher) Geburtenrate (X) einer Region und deren Population von Klapperstörchen (Y ) 256

59 6.2.2 Ordinale Daten: Rangkorrelationskoeffizient Jetzt: X und Y sind ordinal skaliert = Berechnung von arithmetischem Mittel Varianz und Kovarianz nicht sinnvoll Gesucht: Sinnvolles Korrelationsmaß für ordinale Daten 257

60 Zunächst Zusatzannahme: Alle Daten eines Merkmals sind verschieden, d.h. x i x j und y i = y j für alle i = j Damit: Einfache Definition der Rangzahl einer Merkmalsausprägung x i bzw. y i 258

61 Definition 6.12: (Rangzahl eines Datenpunktes) Gegeben seien die ungeordnete Urliste x 1,..., x n sowie die geordnete Urliste x (1) < x (2) <... < x (n) eines Merkmals X. Unter der Rangzahl (kurz: Rang) eines Datenwertes x i, in Zeichen R X (x i ), versteht man die Position, die x i in der geordneten Urliste einnimmt, d.h. R X (x i ) = r, falls x i = x (r). 259

62 Zahlenbeispiel: Ungeordnete Urliste x 1 x 2 x 3 x 4 x 5 x Geordnete Urliste x (1) x (2) x (3) x (4) x (5) x (6) (= x 1 ) (= x 4 ) (= x 2 ) (= x 5 ) (= x 3 ) (= x 6 ) Damit ergeben sich folgende Rangzahlen: R X (x 1 ) = 1, R X (x 2 ) = 3, R X (x 3 ) = 5, R X (x 4 ) = 2, R X (x 5 ) = 4, R X (x 6 ) = 6 260

63 Sinnvolles Korrelationsmaß für ordinale Daten: Korrelationskoeffizient aus Definition 6.11 angewendet auf die Ränge R X (x i ) und R Y (y i ) Definition 6.13: (Rangkorrelationskoeff. von Spearman) Es bezeichnen R X und R Y die arithmetischen Mittel der Rangzahlen der Merkmale X und Y. Der Rangkorrelationskoeffizient zwischen X und Y ist definiert durch n ( RX (x i ) R X ) ( RY (y i ) R Y ) r R XY = i=1 n i=1 ( RX (x i ) R X ) 2 n i=1 ( RY (y i ) R Y )

64 Man beachte: Für die arithmetischen Mittel R X und R Y gilt: R X = R Y = 1 n Hieraus folgt: r R XY = n i=1 n i=1 n ( i=1 i = 1 n n ( (n + 1) 2 R X (x i ) n R X (x i ) n ) 2 ) = n ( n R Y (y i ) n i=1 ( (vgl. Folie 27) ) R Y (y i ) n ) 2 262

65 Bemerkungen: Es gibt weitere, äquivalente Formeln für r R XY, z.b. r R XY = n i=1 n i=1 R X (x i ) 2 R X (x i ) R Y (y i ) n (n + 1)2 4 n i=1 n (n + 1)2 4 R Y (y i ) 2 n (n + 1)2 4 Sind alle x i und y i verschieden (wie hier zunächst angenommen), so ergibt sich die vereinfachte Formel r R,OB XY = 1 6 n i=1 [R X (x i ) R Y (y i )] 2 n (n 2 1) 263

66 Beispiel: (Schulnoten) 6 Schüler haben folgende Punktzahlen auf einer von 1 bis 10 reichenden Ordinalskala für Klausuren in Mathematik (X) und Physik (Y ) erreicht: Es gilt: x 1 x 2 x 3 x 4 x 5 x 6 y 1 y 2 y 3 y 4 y 5 y r R XY = rr,ob XY = (6 2 1) =

67 Wichtige Eigenschaften von r R XY : [I] r R XY ist symmetrisch, d.h. rr XY = rr Y X rxy R ist invariant gegenüber streng monoton wachsenden Transformationen: Sind f und g streng monoton wachsende Funktionen und überführt man die Ursprungsdaten (x i, y i ) in x i = f(x i) und y i = g(y i) für alle i = 1,..., n so gilt für alle i: und damit R X (x i ) = R X(x i ) R Y (y i ) = R Y (y i ) r R XY = rr X Y 265

68 Wichtige Eigenschaften von r R XY : [II] r R XY ist normiert: 1 r R XY 1 Extremfälle: r R XY = 1 R X(x i ) = R Y (y i ) für alle i = 1,..., n (völlig gleich gerichteter monoton wachsender Zusammenhang) r R XY = 1 R X(x i ) = n R Y (y i )+1 für alle i = 1,..., n (völlig gegenläufiger monoton fallender Zusammenhang) 266

69 Jetzt: Berücksichtigung von Bindungen durch Anwendung der Methode der Durchschnittsränge Zahlenbeispiel: [I] Ungeordnete Urliste x 1 x 2 x 3 x

70 Zahlenbeispiel: [II] Geordnete Urliste x (= (1) x 3 ) x (= (2) x 1 ) x (= (3) x 4 ) x (= (4) x 2 ) Vergabe von Rängen R X (x 3 ) = 1, R X (x 1 ) = 2, R X (x 4 ) = 3 } {{ } (wegen x 1 = x 4 = 3.7) R X (x 1 ) = 2.5, R X (x 4 ) = 2.5, R X (x 2 ) = 4 268

71 Bei Auftreten von Bindungen: Vergabe von Durchschnittsrängen sowohl für die x i als auch die y i Die vereinfachte Formel r R,OB zulässig XY (vgl. Folie 263) nicht mehr Stattdessen: Anwendung der äquivalenten Formeln für rxy R Folien 262, 263 auf den 269

72 6.2.3 Nominale Daten: Kontingenzkoeffizient Jetzt: X und Y sind nominal skaliert Daten in Kontingenztafel (absolute Häufigkeiten) Geeignetes Zusammenhangsmaß: Der Kontingenzkoeffizient 270

73 Vorüberlegung: X und Y sind deskriptiv unabhängig, wenn n jk = n j n k n für alle j = 1,..., J und k = 1,..., K (vgl. Folie 229) Abweichungsmaß von der deskriptiven Unabhängigkeit: χ 2 = J K j=1 k=1 ( n jk n j n k n n j n k n ) 2 = n J K j=1 k=1 n 2 jk n j n k 1 271

74 Bemerkung: Damit χ 2 definiert ist, muss gelten: n j > 0 und n k > 0 für alle j und alle k. Ist einer der beiden Ausdrücke für irgendein j oder k gleich 0, so können die zugehörigen Merkmalswerte ξ j bzw. η k aus der Kontingenztafel gestrichen werden Jetzt: Normierung von χ 2 liefert Kontingenzkoeffizient 272

75 Definition 6.14: (Kontingenzkoeffizient) Als Zusammenhangsmaß zwischen den nominal skalierten Merkmalen X und Y verwendet man den Kontingenzkoeffizienten, der definiert ist als C XY = χ 2 χ 2 + n min{j, K} min{j, K} 1. Bemerkung: Der Kontingenzkoeffizient C XY ist streng monoton wachsend in χ 2 und normiert, d.h. 0 C XY 1 273

76 Zentrales Ergebnis: Der Kontingenzkoeffizient C XY wird genau dann gleich 0, wenn χ 2 = 0 gilt, d.h. genau dann, wenn X und Y deskriptiv unabhängig sind Weitere Bemerkungen: Gilt C XY = 1, so spricht man von einem vollständigen Zusammenhang zwischen X und Y C XY misst nur die Stärke des Zusammenhangs zwischen X und Y, nicht jedoch die Richtung Jedoch misst C XY beliebige Zusammenhänge, also nicht nur lineare (wie r XY ) oder monotone wie r R XY 274

77 Zur praktischen Anwendung von r XY, r R XY, C XY : Unterschiedliche Datenniveaus von X und Y : Wähle Zusammenhangsmaß für das schwächste Datenniveau der Variablen X und Y (vgl. Folie 276) Ermittlung des allgemeinen Zusammenhangs von X und Y : Verwende C XY 275

78 Behandlung unterschiedlicher Datenniveaus: Y Nominal Ordinal Metrisch X Nominal C XY C XY C XY Ordinal C XY r R XY r R XY Metrisch C XY r R XY r XY 276

79 6.3 Deskriptive Regression Bedeutung des Begriffes Regression : Untersuchung des Zusammenhangs zwischen einer abhängigen Variablen (auch Regressand oder endogene Variable) und einer oder mehrerer unabhängiger Variablen (auch Regressoren oder exogene Variablen) Allgemeines mathematisches Modell: Y = f(x 1, X 2,..., X k ; β) + u 277

80 Bezeichnungen: Y : abhängige Variable, Regressand X: unabhängige Variablen, Regressoren f( ): funktionaler Zusammenhang β: unbekannter Parametervektor u: Fehler 278

81 Ziel der Regressionsrechnung: Möglichst genaue Aussagen über den Zusammenhang zwischen Regressand und Regressor(en) Beispiele: [I] Keynesianische Konsumfunktion Y = privater Konsum a = autonomer Konsum b = marginale Konsumquote X = verfügbares Einkommen Y = a + b X + u 279

82 Beispiele: [II] Zusammenhang zwischen Inflation und Geldmengenwachstum (Quantitätstheorie) Y = a + b X + u Y = Inflationsrate X = Wachstumsrate der Geldmenge (M2) Zusammenhang zwischen Inflation und Arbeitslosigkeit (Phillipskurve) Y = a + b 1 X + u Y = Inflationsrate X = Arbeitslosenquote (Vorsicht: f ist eine Hyperbel, nicht-linear) 280

83 Hier: Nur lineare Funktionen, d.h. Y = a + b X + u (vgl. Abschnitt 6.3.2) 281

84 6.3.1 Regression 1. Art Zunächst: Y wird zurückgeführt (regressiert) auf verschiedene Ausprägungen von X (ohne funktionalen Zusammenhang) Voraussetzungen: Y ist metrisch skaliert (mindestens intervallskaliert) X ist beliebig skaliert mit möglichen Ausprägungen ξ 1,..., ξ J 282

85 Jetzt: Bilde die bedingten Mittelwerte y j unter der Bedingung X = ξ j für j = 1,..., J (vgl. Definition 6.7, Folie 232) Definition 6.15: (Deskriptive Regression 1. Art) Die J Paare (ξ j, y j ), j = 1,..., J, nennt man deskriptive Regression 1. Art von Y auf X. 283

86 Beispiel: (Haushaltseinkommen) [I] Y : verfügbares Haushalts-Nettoeinkommen (Durchschnitte) X: Haushaltstyp 284

87 Beispiel: (Haushaltseinkommen) [II] Daten: Einkommen Y Anz. Haushalte j Haushaltstyp X (in DM) (in (1000) 1 Selbständige Beamte Angestellte Arbeiter Arbeitslose Nichterwerbstätige Summe:

88 Hier: Regressionsergebnis dargestellt als Balkendiagramm j=1 j=2 j=3 j=4 j=5 j=6 286

89 Offensichtlich: Durch die J Ausprägungen von X kann die Grundgesamtheit in J Teilgesamtheiten zerlegt werden Die J Teilgesamtheiten haben die Umfänge n 1, n 2,..., n J = Anwendung der Additionssätze für arithmetische Mittel und Varianzen des Merkmals Y (vgl. Abschnitt 4.3.4) 287

90 Es gilt: y = 1 n J j=1 y j n j s 2 Y = 1 n J s 2 Y X=ξ n j j + 1 n } j=1 {{ } =sint 2 J ( yj y ) 2 nj } j=1 {{ } =s 2 ext Hieraus: Maßzahl für den Erklärungswert der unabhängigen Variablen X für die abhängige Variable Y 288

91 Definition 6.16: (Bestimmtheitsmaß) Die Größe B = s2 ext s 2 Y heißt Bestimmtheitsmaß der deskriptiven Regression 1. Art. Bemerkungen: [I] Es gilt stets: 0 B 1 289

92 Bemerkungen: [II] Es gilt B = 0 genau dann, wenn s 2 ext = 0, d.h. wenn y 1 = y 2 =... = y J = y = Alle bedingten Mittel y j sind gleich = X hat keinen Erklärungswert für Y Es gilt B = 1 genau dann, wenn s 2 Y = s2 ext und s2 int = 0 = Für alle bedingten Varianzen gilt s 2 Y X=ξ j = 0 = X hat höchsten Erklärungswert für Y 290

93 Bemerkungen: [III] B gibt den Anteil der durch die Regression 1. Art erklärten Varianz an der Gesamtvarianz von Y an 291

94 6.3.2 Regression 2. Art: Die lineare Einfachregression Jetzt: X und Y sind beide metrisch skaliert Ziel: Erklärung der Abhängigkeit zwischen X und Y Gerade durch eine 292

95 Ausgangssituation: Urliste (x 1, y 1 ),..., (x n, y n ) Regressionsgleichung y i = a + b x i + u i (i = 1,..., n) a, b sind aus den Daten zu bestimmende Parameter u i ist die Abweichung (auch Fehler oder Residuum) 293

96 Problemstellung: Bestimme die Parameter a und b aus den Daten derart, dass ein geeignet definiertes Abweichungsmaß für die Residuen minimal wird Definition 6.17: (Lineare Einfachregression) Das Regressionsproblem von Folie 293 nennt man lineare Einfachregression von Y auf X. Beispiel: Zusammenhang zwischen Ausgaben für Werbung (X) und den Absätzen (Y ) gemessen an 84 Unternehmen in den USA im Jahr

97 Lineare Einfachregression Absatz = * Werbeausgaben + Fehler 560 Absatz in Mill. US-$ Werbeausgaben in Mill. US-$ 295

98 Jetzt: Sinnvolle Ermittlung der Parameter a und b aus den Daten (x 1, y 1 ),..., (x n, y n ) Dafür zunächst: Geeignetes Abweichungsmaß für die Residuen u i = y i (a + b x i ) (vertikaler Abstand des Datenpunktes (x i, y i ) von der Regressionsgeraden) 296

99 Sinnvolles Abstandsmaß ist: Q(α, β) = n i=1 [y i (α + β x i )] 2 Bemerkungen: Die Größen α, β R sind formaler Ersatz für die unbekannten Parameter a, b Die unbekannten Parameter a, b der Regressionsgeraden werden gleich durch spezielle Wahlen von α bzw. β ermittelt 297

100 Jetzt: Ermittle a und b durch Minimierung des Abstandsmaßes Q(α, β) bezüglich α und β Bemerkungen: a und b werden also derart gewählt, dass die Summe der quadrierten Abstände zwischen den Datenpunkten (x i, y i ) und der Regressionsgeraden minimal wird Die Regressionsgerade y i = a + b x i beschreibt dann die (x i, y i )-Punktwolke im Sinne des gewählten Abstandsmaßes optimal 298

101 Jetzt: Mathematische Bestimmung der Parameter a und b Formaler Ablauf: [I] Bilde die (partiellen) Ableitungen von Q(α, β) n α Q(α, β) = 2 i=1 n β Q(α, β) = 2 i=1 [y i (α + β x i )] ( 1) [y i (α + β x i )] ( x i ) 299

102 Formaler Ablauf: [II] Die jeweiligen Nullstellen der partiellen Ableitungen (bezeichnet mit a und b) liefern das potenzielle Minimum (d.h. die gesuchten Parameterwerte) (notwendige Bedingung) Es bleibt zu überprüfen, ob die Nullstellen tatsächlich ein Minimum darstellen (hinreichende Bedingung) 300

103 Endergebnisse: Die gesuchten Nullstellen ergeben sich als b = n i=1 n i=1 x i y i n x y x 2 i n x2 = s XY s 2 X = r XY sy s X, a = y b x Definition 6.18: (Kleinste-Quadrate-Methode) Die obige Vorgehensweise zur Bestimmung der Regressionskoeffizienten a und b nennt man die Methode der Kleinsten Quadrate. 301

104 Offensichtlich: Zur Berechnung der Kleinste-Quadrate-Koeffizienten benötigt man nur die 4 Größen x, y, s 2 X und s XY 302

105 Bemerkungen: Für die Regressionsgerade gilt also: y(x) = a + b x = y s XY x s 2 } {{ X } = a Für die Regresssionsgerade gilt somit: y(x) = y + s XY s 2 } {{ X } = b = Die Regressionsgerade verläuft durch den Punkt (x, y) x Interpretation der Regressionsgeraden nicht für alle x-werte sinnvoll 303

106 Beispiel: X = Werbeausgaben, Y = Absätze, n = 84 Es gilt: x = , y = , s 2 X = , s XY = Damit ergibt sich: b = = a = =

107 Erinnerung: Bestimmtheitsmaß B bei Regression 1. Art beschreibt Anteil an der Varianz s 2 Y, der durch die Regression erklärt wird Jetzt: Übetragung dieses Konzeptes auf Regression 2. Art Betrachte dazu: Werte der Regressionsgerade (ŷ i ) an den Stellen x i : ŷ i = a + b x i, i = 1,..., n 305

108 Offensichtlich gilt für die y-daten: y i = a + b x i + u i = ŷ i + u i Bedeutung: Datenwert y i ist Summe aus Wert auf Regressionsgeraden plus Fehler Nun gilt folgende Varianzzerlegung: s 2 Y = s2 Ŷ + s2 U 306

109 Fazit: Varianz der Y -Werte lässt sich in 2 Teile zerlegen s 2 Ŷ : Varianz der exakt auf der Regressionsgeraden liegenden Werte ŷ i (den durch die Regression erklärten Teil der Varianz der Y -Werte sy 2 ) s 2 U : Varianz der Residuen u i (Residualvarianz oder den durch die Regression nicht erklärten Teil der Varianz der Y -Werte s 2 Y ) 307

110 Definition 6.19: (Bestimmtheitsmaß) Das Bestimmtheitsmaß der deskriptiven Regression 2. Art definiert man als R 2 = s2 Ŷ s 2 Y = 1 s2 U s 2 Y. Bemerkungen: [I] Das R 2 ist der Anteil an der Varianz der y-werte, der durch die Regression erklärt wird Es gilt: 0 R

111 Bemerkungen: [II] R 2 = 0: Es ist dann s 2 U = s2 Y, d.h. die Residualvarianz entspricht exakt der Varianz der y-werte. Die Regression selbst liefert keinen Erklärungsbeitrag für die y-werte R 2 = 1: Es ist dann s 2 Ŷ = s2 Y. Die Regression erklärt die Varianz der y-werte vollständig (Alle Punkte (x i, y i ) liegen auf der Regressionsgeraden) 309

112 Bemerkungen: [III] Praktische Berechnungsmöglichkeit: R 2 = s XY s 2 X s 2 Y 2 = (r XY ) 2 (R 2 entspricht dem Quadrat des Korrelationskoeffizienten von Bravais-Pearson) 310

113 Beispiel: Im Beispiel Werbeausgaben Absatz gilt: R 2 = s XY s 2 X = s 2 Y 2 = ( )

114 6.4 Lineare Mehrfachregression Jetzt: Übertragung des Konzeptes auf k Regressoren X 1,..., X k (alle metrisch) Regressionsmodell: y i = a + b 1 x 1i b k x ki + u i, i = 1,..., n 312

115 Analog zu Abschnitt 6.3.2: Kleinste-Quadrate-Methode: mit Q(α, β 1,..., β k ) = min Q(α, β 1,..., β k ) α,β 1,...,β k n i=1 [y i (α + β 1 x 1i β k x ki )] 2 Definition des R 2 : R 2 = s2 Ŷ s 2 Y = 1 s2 U s 2 Y 313

Zusammenhänge zwischen metrischen Merkmalen

Zusammenhänge zwischen metrischen Merkmalen Zusammenhänge zwischen metrischen Merkmalen Darstellung des Zusammenhangs, Korrelation und Regression Daten liegen zu zwei metrischen Merkmalen vor: Datenpaare (x i, y i ), i = 1,..., n Beispiel: x: Anzahl

Mehr

a) Zeichnen Sie in das nebenstehende Streudiagramm mit Lineal eine Regressionsgerade ein, die Sie für passend halten.

a) Zeichnen Sie in das nebenstehende Streudiagramm mit Lineal eine Regressionsgerade ein, die Sie für passend halten. Statistik für Kommunikationswissenschaftler Wintersemester 2009/200 Vorlesung Prof. Dr. Helmut Küchenhoff Übung Cornelia Oberhauser, Monia Mahling, Juliane Manitz Thema 4 Homepage zur Veranstaltung: http://www.statistik.lmu.de/~helmut/kw09.html

Mehr

3.2 Bivariate Verteilungen

3.2 Bivariate Verteilungen 3.2 Bivariate Verteilungen zwei Variablen X, Y werden gemeinsam betrachtet (an jedem Objekt i, i = 1,..., n, werden gleichzeitig zwei Merkmale beobachtet) Beobachtungswerte sind Paare/Kombinationen von

Mehr

Korrelation - Regression. Berghold, IMI

Korrelation - Regression. Berghold, IMI Korrelation - Regression Zusammenhang zwischen Variablen Bivariate Datenanalyse - Zusammenhang zwischen 2 stetigen Variablen Korrelation Einfaches lineares Regressionsmodell 1. Schritt: Erstellung eines

Mehr

Teil I: Deskriptive Statistik

Teil I: Deskriptive Statistik Teil I: Deskriptive Statistik 2 Grundbegriffe 2.1 Merkmal und Stichprobe 2.2 Skalenniveau von Merkmalen 2.3 Geordnete Stichproben und Ränge 2.1 Merkmal und Stichprobe An (geeignet ausgewählten) Untersuchungseinheiten

Mehr

Datenanalyse mit Excel. Wintersemester 2013/14

Datenanalyse mit Excel. Wintersemester 2013/14 Datenanalyse mit Excel 1 KORRELATIONRECHNUNG 2 Korrelationsrechnung Ziel der Korrelationsrechnung besteht im bivariaten Fall darin, die Stärke des Zusammenhangs zwischen zwei interessierenden statistischen

Mehr

2. Deskriptive Statistik 2.1. Häufigkeitstabellen, Histogramme, empirische Verteilungsfunktionen

2. Deskriptive Statistik 2.1. Häufigkeitstabellen, Histogramme, empirische Verteilungsfunktionen 4. Datenanalyse und Modellbildung Deskriptive Statistik 2-1 2. Deskriptive Statistik 2.1. Häufigkeitstabellen, Histogramme, empirische Verteilungsfunktionen Für die Auswertung einer Messreihe, die in Form

Mehr

Eine zweidimensionale Stichprobe

Eine zweidimensionale Stichprobe Eine zweidimensionale Stichprobe liegt vor, wenn zwei qualitative Merkmale gleichzeitig betrachtet werden. Eine Urliste besteht dann aus Wertepaaren (x i, y i ) R 2 und hat die Form (x 1, y 1 ), (x 2,

Mehr

Kontingenzkoeffizient (nach Pearson)

Kontingenzkoeffizient (nach Pearson) Assoziationsmaß für zwei nominale Merkmale misst die Unabhängigkeit zweier Merkmale gibt keine Richtung eines Zusammenhanges an 46 o jl beobachtete Häufigkeiten der Kombination von Merkmalsausprägungen

Mehr

4. Auswertung eindimensionaler Daten

4. Auswertung eindimensionaler Daten 4. Auswertung eindimensionaler Daten Ziel dieses Kapitels: Präsentation von Methoden zur statistischen Auswertung eines einzelnen Merkmals 64 Bezeichnungen (Wiederholung): Merkmalsträger: e 1,..., e n

Mehr

Eine computergestützte Einführung mit

Eine computergestützte Einführung mit Thomas Cleff Deskriptive Statistik und Explorative Datenanalyse Eine computergestützte Einführung mit Excel, SPSS und STATA 3., überarbeitete und erweiterte Auflage ^ Springer Inhaltsverzeichnis 1 Statistik

Mehr

Einseitig gerichtete Relation: Mit zunehmender Höhe über dem Meeresspiegel sinkt im allgemeinen die Lufttemperatur.

Einseitig gerichtete Relation: Mit zunehmender Höhe über dem Meeresspiegel sinkt im allgemeinen die Lufttemperatur. Statistik Grundlagen Charakterisierung von Verteilungen Einführung Wahrscheinlichkeitsrechnung Wahrscheinlichkeitsverteilungen Schätzen und Testen Korrelation Regression Einführung Die Analyse und modellhafte

Mehr

Korrelation (II) Korrelation und Kausalität

Korrelation (II) Korrelation und Kausalität Korrelation (II) Korrelation und Kausalität Situation: Seien X, Y zwei metrisch skalierte Merkmale mit Ausprägungen (x 1, x 2,..., x n ) bzw. (y 1, y 2,..., y n ). D.h. für jede i = 1, 2,..., n bezeichnen

Mehr

Linearer Zusammenhang von Datenreihen

Linearer Zusammenhang von Datenreihen Linearer Zusammenhang von Datenreihen Vielen Problemen liegen (möglicherweise) lineare Zusammenhänge zugrunde: Mein Internetanbieter verlangt eine Grundgebühr und rechnet minutenweise ab Ich bestelle ein

Mehr

Franz Kronthaler. Statistik angewandt. Datenanalyse ist (k)eine Kunst. Excel Edition. ^ Springer Spektrum

Franz Kronthaler. Statistik angewandt. Datenanalyse ist (k)eine Kunst. Excel Edition. ^ Springer Spektrum Franz Kronthaler Statistik angewandt Datenanalyse ist (k)eine Kunst Excel Edition ^ Springer Spektrum Inhaltsverzeichnis Teil I Basiswissen und Werkzeuge, um Statistik anzuwenden 1 Statistik ist Spaß 3

Mehr

5 Zusammenhangsmaße, Korrelation und Regression

5 Zusammenhangsmaße, Korrelation und Regression 5 Zusammenhangsmaße, Korrelation und Regression 5.1 Zusammenhangsmaße und Korrelation Aufgabe 5.1 In einem Hauptstudiumsseminar des Lehrstuhls für Wirtschafts- und Sozialstatistik machten die Teilnehmer

Mehr

1,11 1,12 1,13 1,14 1,15 1,16 1,17 1,17 1,17 1,18

1,11 1,12 1,13 1,14 1,15 1,16 1,17 1,17 1,17 1,18 3. Deskriptive Statistik Ziel der deskriptiven (beschreibenden) Statistik (explorativen Datenanalyse) ist die übersichtliche Darstellung der wesentlichen in den erhobenen Daten enthaltene Informationen

Mehr

Multiple Regression. Ziel: Vorhersage der Werte einer Variable (Kriterium) bei Kenntnis der Werte von zwei oder mehr anderen Variablen (Prädiktoren)

Multiple Regression. Ziel: Vorhersage der Werte einer Variable (Kriterium) bei Kenntnis der Werte von zwei oder mehr anderen Variablen (Prädiktoren) Multiple Regression 1 Was ist multiple lineare Regression? Ziel: Vorhersage der Werte einer Variable (Kriterium) bei Kenntnis der Werte von zwei oder mehr anderen Variablen (Prädiktoren) Annahme: Der Zusammenhang

Mehr

Weitere Fragestellungen im Zusammenhang mit einer linearen Einfachregression

Weitere Fragestellungen im Zusammenhang mit einer linearen Einfachregression Weitere Fragestellungen im Zusammenhang mit einer linearen Einfachregression Speziell im Zusammenhang mit der Ablehnung der Globalhypothese werden bei einer linearen Einfachregression weitere Fragestellungen

Mehr

Assoziation & Korrelation

Assoziation & Korrelation Statistik 1 für SoziologInnen Assoziation & Korrelation Univ.Prof. Dr. Marcus Hudec Einleitung Bei Beobachtung von 2 Merkmalen für jeden Merkmalsträger stellt sich die Frage, ob es systematische Zusammenhänge

Mehr

Klausur zu Methoden der Statistik I (mit Kurzlösung) Wintersemester 2007/2008. Aufgabe 1

Klausur zu Methoden der Statistik I (mit Kurzlösung) Wintersemester 2007/2008. Aufgabe 1 Lehrstuhl für Statistik und Ökonometrie der Otto-Friedrich-Universität Bamberg Prof. Dr. Susanne Rässler Klausur zu Methoden der Statistik I (mit Kurzlösung) Wintersemester 2007/2008 Aufgabe 1 Ihnen liegt

Mehr

Regressionsanalysen. Zusammenhänge von Variablen. Ziel der Regression. ( Idealfall )

Regressionsanalysen. Zusammenhänge von Variablen. Ziel der Regression. ( Idealfall ) Zusammenhänge von Variablen Regressionsanalysen linearer Zusammenhang ( Idealfall ) kein Zusammenhang nichtlinearer monotoner Zusammenhang (i.d.regel berechenbar über Variablentransformationen mittels

Mehr

1. Lineare Regression (Ausgleichsgerade)

1. Lineare Regression (Ausgleichsgerade) Carl-Engler-Schule Karlsruhe Lineare Regression 1 (6) 1. Lineare Regression (Ausgleichsgerade) 1.1 Was ist eine Ausgleichsgerade? Die Ausgleichsgerade ist ein Ausgleichs-Verfahren zur Kurvenanpassung (Approximation).

Mehr

Statistik im Bachelor-Studium der BWL und VWL

Statistik im Bachelor-Studium der BWL und VWL Max C. Wewel Statistik im Bachelor-Studium der BWL und VWL Methoden, Anwendung, Interpretation Mit herausnehmbarer Formelsammlung ein Imprint von Pearson Education München Boston San Francisco Harlow,

Mehr

Kapitel 7: Zweidimensionale Häufigkeitsverteilungen

Kapitel 7: Zweidimensionale Häufigkeitsverteilungen Kapitel 7: Zweidimensionale Häufigkeitsverteilungen 1. Regression und Korrelation... 192 2. Darstellung mehrdimensionaler Datensätze... 193 a) Verbundene Beobachtungen, gemeinsame Verteilung... 193 b)

Mehr

Analyse bivariater Kontingenztafeln

Analyse bivariater Kontingenztafeln Analyse bivariater Kontingenztafeln Werden zwei kategoriale Merkmale mit nicht zu vielen möglichen Ausprägungen gemeinsam analysiert, so kommen zur Beschreibung der gemeinsamen Verteilung im allgemeinen

Mehr

Willkommen zur Vorlesung Statistik (Master)

Willkommen zur Vorlesung Statistik (Master) Willkommen zur Vorlesung Statistik (Master) Thema dieser Vorlesung: Verteilungsfreie Verfahren Prof. Dr. Wolfgang Ludwig-Mayerhofer Universität Siegen Philosophische Fakultät, Seminar für Sozialwissenschaften

Mehr

Teil I Beschreibende Statistik 29

Teil I Beschreibende Statistik 29 Vorwort zur 2. Auflage 15 Vorwort 15 Kapitel 0 Einführung 19 0.1 Methoden und Aufgaben der Statistik............................. 20 0.2 Ablauf statistischer Untersuchungen..............................

Mehr

Profil A 49,3 48,2 50,7 50,9 49,8 48,7 49,6 50,1 Profil B 51,8 49,6 53,2 51,1 51,1 53,4 50,7 50 51,5 51,7 48,8

Profil A 49,3 48,2 50,7 50,9 49,8 48,7 49,6 50,1 Profil B 51,8 49,6 53,2 51,1 51,1 53,4 50,7 50 51,5 51,7 48,8 1. Aufgabe: Eine Reifenfirma hat für Winterreifen unterschiedliche Profile entwickelt. Bei jeweils gleicher Geschwindigkeit und auch sonst gleichen Bedingungen wurden die Bremswirkungen gemessen. Die gemessenen

Mehr

Einfache Statistiken in Excel

Einfache Statistiken in Excel Einfache Statistiken in Excel Dipl.-Volkswirtin Anna Miller Bergische Universität Wuppertal Schumpeter School of Business and Economics Lehrstuhl für Internationale Wirtschaft und Regionalökonomik Raum

Mehr

Herzlich Willkommen zur Vorlesung Statistik

Herzlich Willkommen zur Vorlesung Statistik Herzlich Willkommen zur Vorlesung Statistik Thema dieser Vorlesung: Kovarianz und Korrelation Prof. Dr. Wolfgang Ludwig-Mayerhofer Universität Siegen Philosophische Fakultät, Seminar für Sozialwissenschaften

Mehr

Modul G.1 WS 07/08: Statistik 17.01.2008 1. Die Korrelation ist ein standardisiertes Maß für den linearen Zusammenhangzwischen zwei Variablen.

Modul G.1 WS 07/08: Statistik 17.01.2008 1. Die Korrelation ist ein standardisiertes Maß für den linearen Zusammenhangzwischen zwei Variablen. Modul G.1 WS 07/08: Statistik 17.01.2008 1 Wiederholung Kovarianz und Korrelation Kovarianz = Maß für den linearen Zusammenhang zwischen zwei Variablen x und y Korrelation Die Korrelation ist ein standardisiertes

Mehr

Teil II: Einführung in die Statistik

Teil II: Einführung in die Statistik Teil II: Einführung in die Statistik (50 Punkte) Bitte beantworten Sie ALLE Fragen. Es handelt sich um multiple choice Fragen. Sie müssen die exakte Antwortmöglichkeit angeben, um die volle Punktzahl zu

Mehr

6Korrelationsanalyse:Zusammenhangsanalysestetiger Merkmale

6Korrelationsanalyse:Zusammenhangsanalysestetiger Merkmale 6Korrelationsanalyse:Zusammenhangsanalysestetiger Merkmale 6.1 Korrelationsanalyse 6.1 Korrelationsanalyse Jetzt betrachten wir bivariate Merkmale (X, Y ), wobei sowohl X als auch Y stetig bzw. quasi-stetig

Mehr

Quantitative Methoden der Bildungsforschung

Quantitative Methoden der Bildungsforschung Glieung Wieholung Korrelationen Grundlagen lineare Regression Lineare Regression in SPSS Übung Wieholung Korrelationen Standardisiertes Zusammenhangsmaß (unstandardisiert: Kovarianz) linearer Zusammenhang

Mehr

Klausur zu Methoden der Statistik I (mit Kurzlösung) Sommersemester 2008. Aufgabe 1

Klausur zu Methoden der Statistik I (mit Kurzlösung) Sommersemester 2008. Aufgabe 1 Lehrstuhl für Statistik und Ökonometrie der Otto-Friedrich-Universität Bamberg Prof. Dr. Susanne Rässler Klausur zu Methoden der Statistik I (mit Kurzlösung) Sommersemester 2008 Aufgabe 1 I) Einige Mitarbeiter

Mehr

90-minütige Klausur Statistik für Studierende der Kommunikationswissenschaft

90-minütige Klausur Statistik für Studierende der Kommunikationswissenschaft Prof. Dr. Helmut Küchenhoff SS08 90-minütige Klausur Statistik für Studierende der Kommunikationswissenschaft am 22.7.2008 Anmerkungen Überprüfen Sie bitte sofort, ob Ihre Angabe vollständig ist. Sie sollte

Mehr

Auswertung und Darstellung wissenschaftlicher Daten (1)

Auswertung und Darstellung wissenschaftlicher Daten (1) Auswertung und Darstellung wissenschaftlicher Daten () Mag. Dr. Andrea Payrhuber Zwei Schritte der Auswertung. Deskriptive Darstellung aller Daten 2. analytische Darstellung (Gruppenvergleiche) SPSS-Andrea

Mehr

Nichtlineare Optimierung ohne Nebenbedingungen

Nichtlineare Optimierung ohne Nebenbedingungen Kapitel 2 Nichtlineare Optimierung ohne Nebenbedingungen In diesem Abschnitt sollen im wesentlichen Verfahren zur Bestimmung des Minimums von nichtglatten Funktionen in einer Variablen im Detail vorgestellt

Mehr

12. Bivariate Datenanalyse. In den Kapiteln 4-11 wurden univariate Daten betrachtet:

12. Bivariate Datenanalyse. In den Kapiteln 4-11 wurden univariate Daten betrachtet: 12. Bivariate Datenanalyse Während einer nur Zahlen im Kopf hat, kann er nicht auf den Kausalzusammenhang kommen Anonymus In den Kapiteln 4-11 wurden univariate Daten betrachtet: Von univariaten Daten

Mehr

Häufigkeitstabellen. Balken- oder Kreisdiagramme. kritischer Wert für χ2-test. Kontingenztafeln

Häufigkeitstabellen. Balken- oder Kreisdiagramme. kritischer Wert für χ2-test. Kontingenztafeln Häufigkeitstabellen Menüpunkt Data PivotTable Report (bzw. entsprechendes Icon): wähle Data Range (Zellen, die die Daten enthalten + Zelle mit Variablenname) wähle kategoriale Variable für Spalten- oder

Mehr

Institut für Soziologie. Methoden 2. Regressionsanalyse I: Einfache lineare Regression

Institut für Soziologie. Methoden 2. Regressionsanalyse I: Einfache lineare Regression Institut für Soziologie Methoden 2 Regressionsanalyse I: Einfache lineare Regression Programm Anwendungsbereich Vorgehensweise Interpretation Annahmen Zusammenfassung Übungsaufgabe Literatur # 2 Anwendungsbereich

Mehr

ZIV-Schulung. Statistik mit Excel 2010

ZIV-Schulung. Statistik mit Excel 2010 ZIV-Schulung Statistik mit Excel 2010 Statistische Möglichkeiten mit Excel 2010 2 Zur Unterstützung quantitativer Datenanalysen dienen in Excel 2010 vor allem: > die Basisfunktionen für Berechnungen in

Mehr

4. Erstellen von Klassen

4. Erstellen von Klassen Statistik mit Tabellenkalkulation 4. Erstellen von Klassen Mit einem einfachen Befehl lässt sich eine Liste von Zahlen auf die Häufigkeit der einzelnen Werte untersuchen. Verwenden Sie dazu den Befehl

Mehr

Multivariate Statistik

Multivariate Statistik Hermann Singer Multivariate Statistik 1 Auflage 15 Oktober 2012 Seite: 12 KAPITEL 1 FALLSTUDIEN Abbildung 12: Logistische Regression: Geschätzte Wahrscheinlichkeit für schlechte und gute Kredite (rot/blau)

Mehr

Methoden Quantitative Datenanalyse

Methoden Quantitative Datenanalyse Leitfaden Universität Zürich ISEK - Andreasstrasse 15 CH-8050 Zürich Telefon +41 44 635 22 11 Telefax +41 44 635 22 19 www.isek.uzh.ch 11. September 2014 Methoden Quantitative Datenanalyse Vorbereitung

Mehr

Die Korrelation von Merkmalen

Die Korrelation von Merkmalen Die Korrelation von Merkmalen In der Analse von Datenmaterial ist eines der Hauptziele der Statistik eine Abhängigkeit bzw. einen Zusammenhang zwischen Merkmalen zu erkennen. Die Korrelation ermittelt

Mehr

2. Korrelation, lineare Regression und multiple Regression

2. Korrelation, lineare Regression und multiple Regression multiple 2.2 Lineare 2.2 Lineare 1 / 130 2.2 Lineare 2 / 130 2.1 Beispiel: Arbeitsmotivation Untersuchung zur Motivation am Arbeitsplatz in einem Chemie-Konzern 25 Personen werden durch Arbeitsplatz zufällig

Mehr

Grundbegriffe (1) Grundbegriffe (2)

Grundbegriffe (1) Grundbegriffe (2) Grundbegriffe (1) S.1 Äquivalenzklasse Unter einer Äquivalenzklasse versteht man eine Klasse von Objekten, die man hinsichtlich bestimmter Merkmalsausprägungen als gleich (äquivalent) betrachtet. (z.b.

Mehr

6.1 Grundbegriffe und historischer Hintergrund

6.1 Grundbegriffe und historischer Hintergrund Kapitel 6 Regression 61 Grundbegriffe und historischer Hintergrund Bedeutung der Regression: Eines der am häufigsten verwendeten statistischen Verfahren Vielfache Anwendung in den Sozialwissenschaften

Mehr

Lösungen zu Janssen/Laatz, Statistische Datenanalyse mit SPSS 1

Lösungen zu Janssen/Laatz, Statistische Datenanalyse mit SPSS 1 LÖSUNG 9B a) Lösungen zu Janssen/Laatz, Statistische Datenanalyse mit SPSS 1 Man kann erwarten, dass der Absatz mit steigendem Preis abnimmt, mit höherer Anzahl der Außendienstmitarbeiter sowie mit erhöhten

Mehr

Skript zur Übung: Grundlagen der empirischen Sozialforschung - Datenanalyse

Skript zur Übung: Grundlagen der empirischen Sozialforschung - Datenanalyse Skript zur Übung: Grundlagen der empirischen Sozialforschung - Datenanalyse Phasen des Forschungsprozesses Auswahl des Forschungsproblems Theoriebildung Theoretische Phase Konzeptspezifikation / Operationalisierung

Mehr

Planen mit mathematischen Modellen 00844: Computergestützte Optimierung. Autor: Dr. Heinz Peter Reidmacher

Planen mit mathematischen Modellen 00844: Computergestützte Optimierung. Autor: Dr. Heinz Peter Reidmacher Planen mit mathematischen Modellen 00844: Computergestützte Optimierung Leseprobe Autor: Dr. Heinz Peter Reidmacher 11 - Portefeuilleanalyse 61 11 Portefeuilleanalyse 11.1 Das Markowitz Modell Die Portefeuilleanalyse

Mehr

Statistik Einführung // Lineare Regression 9 p.2/72

Statistik Einführung // Lineare Regression 9 p.2/72 Statistik Einführung Lineare Regression Kapitel 9 Statistik WU Wien Gerhard Derflinger Michael Hauser Jörg Lenneis Josef Ledold Günter Tirler Rosmarie Wakolbinger Statistik Einführung // Lineare Regression

Mehr

Deskriptive Statistik

Deskriptive Statistik Deskriptive Statistik [descriptive statistics] Ziel der deskriptiven (beschreibenden) Statistik einschließlich der explorativen Datenanalyse [exploratory data analysis] ist zunächst die übersichtliche

Mehr

Bachelorabschlussseminar Dipl.-Kfm. Daniel Cracau

Bachelorabschlussseminar Dipl.-Kfm. Daniel Cracau 1 Einführung in die statistische Datenanalyse Bachelorabschlussseminar Dipl.-Kfm. Daniel Cracau 2 Gliederung 1.Grundlagen 2.Nicht-parametrische Tests a. Mann-Whitney-Wilcoxon-U Test b. Wilcoxon-Signed-Rank

Mehr

Klausur zur Vorlesung Multivariate Verfahren, SS 2006 6 Kreditpunkte, 90 min

Klausur zur Vorlesung Multivariate Verfahren, SS 2006 6 Kreditpunkte, 90 min Klausur, Multivariate Verfahren, SS 2006, 6 Kreditpunkte, 90 min 1 Prof. Dr. Fred Böker 08.08.2006 Klausur zur Vorlesung Multivariate Verfahren, SS 2006 6 Kreditpunkte, 90 min Gesamtpunkte: 39 Aufgabe

Mehr

Teil II. Nichtlineare Optimierung

Teil II. Nichtlineare Optimierung Teil II Nichtlineare Optimierung 60 Kapitel 1 Einleitung In diesem Abschnitt wird die Optimierung von Funktionen min {f(x)} x Ω betrachtet, wobei Ω R n eine abgeschlossene Menge und f : Ω R eine gegebene

Mehr

TÜV Service tested Prüfgrundlagen

TÜV Service tested Prüfgrundlagen TÜV Service tested Prüfgrundlagen 60 Grundsätzliche Prüfgrundlagen Für die Auszeichnung TÜV Service tested müssen drei Voraussetzungen erfüllt sein: 1. Die Gesamtzufriedenheit muss von den Kunden des Unternehmens

Mehr

Sozialwissenschaftliche Fakultät der Universität Göttingen. Sommersemester 2009. Statistik mit SPSS

Sozialwissenschaftliche Fakultät der Universität Göttingen. Sommersemester 2009. Statistik mit SPSS Sommersemester 2009 Statistik mit SPSS 15. Mai 2009 15. Mai 2009 Statistik Dozentin: mit Esther SPSSOchoa Fernández 1 Überblick 1. Korrelationsanalysen Kovariation und Kovarianz Korrelation: - Interpretation

Mehr

Einführung in statistische Analysen

Einführung in statistische Analysen Einführung in statistische Analysen Andreas Thams Econ Boot Camp 2008 Wozu braucht man Statistik? Statistik begegnet uns jeden Tag... Weihnachten macht Deutschen Einkaufslaune. Im Advent überkommt die

Mehr

Betriebsstatistik. beschreibende Statistik. Inhalt

Betriebsstatistik. beschreibende Statistik. Inhalt in: Wirtschaftswissen für Betriebsräte - Seite 1 - Inhalt Betriebsstatistik beschreibende Statistik 1 Begriff... 1 1.1 Definitionen Was ist (Betriebs-) Statistik?... 3 1.2 Häufigkeiten und grafische Darstellungen...

Mehr

Anwendung von Statistik in Excel Deskriptive Statistik und Wirtschaftsstatistik

Anwendung von Statistik in Excel Deskriptive Statistik und Wirtschaftsstatistik Anwendung von Statistik in Excel Deskriptive Statistik und Wirtschaftsstatistik Wintersemester 08/09 Kai Schaal Universität zu Köln Organisatorisches und Einleitung (1) Was, wann, wo? Anwendung von Statistik

Mehr

3 Zusammenhangsmaße Zusammenhangshypothesen

3 Zusammenhangsmaße Zusammenhangshypothesen 3 Zusammenhangsmaße Zusammenhangshypothesen Zusammenhänge (zwischen 2 Variablen) misst man mittels Korrelationen. Die Wahl der Korrelation hängt ab von: a) Skalenniveau der beiden Variablen: 1) intervallskaliert

Mehr

1. Einführung und statistische Grundbegriffe. Grundsätzlich unterscheidet man zwei Bedeutungen des Begriffs Statistik:

1. Einführung und statistische Grundbegriffe. Grundsätzlich unterscheidet man zwei Bedeutungen des Begriffs Statistik: . Einführung und statistische Grundbegriffe Grundsätzlich unterscheidet man zwei Bedeutungen des Begriffs Statistik: Quantitative Information Graphische oder tabellarische Darstellung von Datenmaterial

Mehr

1. Einleitung. Ziel der Vorlesung: Einführung in deskriptive Statistik + Wirtschaftsstatistik. Internet-Seite der Vorlesung:

1. Einleitung. Ziel der Vorlesung: Einführung in deskriptive Statistik + Wirtschaftsstatistik. Internet-Seite der Vorlesung: 1. Einleitung Ziel der Vorlesung: Einführung in deskriptive Statistik + Wirtschaftsstatistik Internet-Seite der Vorlesung: http://www1.wiwi.uni-muenster.de/oeew/ Studium Veranstaltungen im Wintersemester

Mehr

Inhaltsverzeichnis. Regressionsanalyse. http://mesosworld.ch - Stand vom: 20.1.2010 1

Inhaltsverzeichnis. Regressionsanalyse. http://mesosworld.ch - Stand vom: 20.1.2010 1 Inhaltsverzeichnis Regressionsanalyse... 2 Lernhinweise... 2 Einführung... 2 Theorie (1-8)... 2 1. Allgemeine Beziehungen... 3 2. 'Best Fit'... 3 3. 'Ordinary Least Squares'... 4 4. Formel der Regressionskoeffizienten...

Mehr

Einführung in die statistische Datenanalyse I

Einführung in die statistische Datenanalyse I Einführung in die statistische Datenanalyse I Inhaltsverzeichnis 1. EINFÜHRUNG IN THEORIEGELEITETES WISSENSCHAFTLICHES ARBEITEN 2 2. KRITIERIEN ZUR AUSWAHL STATISTISCH METHODISCHER VERFAHREN 2 3. UNIVARIATE

Mehr

Dokumentation. estat Version 2.0

Dokumentation. estat Version 2.0 Dokumentation estat Version 2.0 Installation Die Datei estat.xla in beliebiges Verzeichnis speichern. Im Menü Extras AddIns... Durchsuchen die Datei estat.xla auswählen. Danach das Auswahlhäkchen beim

Mehr

Weiterbildungskurs Stochastik

Weiterbildungskurs Stochastik Hansruedi Künsch Seminar für Statistik Departement Mathematik, ETH Zürich 24. Juni 2009 Inhalt STATISTIK DER BINOMIALVERTEILUNG 1 STATISTIK DER BINOMIALVERTEILUNG 2 Fragestellungen Typische Fragestellungen

Mehr

Willkommen zur Vorlesung Statistik

Willkommen zur Vorlesung Statistik Willkommen zur Vorlesung Statistik Thema dieser Vorlesung: Maßzahlen für zentrale Tendenz, Streuung und andere Eigenschaften von Verteilungen Prof. Dr. Wolfgang Ludwig-Mayerhofer Universität Siegen Philosophische

Mehr

Datenerfassung und Datenmanagement

Datenerfassung und Datenmanagement Datenerfassung und Datenmanagement Statistische Auswertungssysteme sind heute eine aus der angewandten Statistik nicht mehr wegzudenkende Hilfe. Dies gilt insbesondere für folgende Aufgabenbereiche: -

Mehr

Analog zu Aufgabe 16.1 werden die Daten durch folgenden Befehl eingelesen: > kredit<-read.table("c:\\compaufg\\kredit.

Analog zu Aufgabe 16.1 werden die Daten durch folgenden Befehl eingelesen: > kredit<-read.table(c:\\compaufg\\kredit. Lösung 16.3 Analog zu Aufgabe 16.1 werden die Daten durch folgenden Befehl eingelesen: > kredit

Mehr

1.1 Was ist Statistik und warum ist Statistik wichtig?

1.1 Was ist Statistik und warum ist Statistik wichtig? 1.1 Was ist Statistik und warum ist Statistik wichtig? Typischer Lexikon-Eintrag für den Begriff Statistik : Methode zur Untersuchung von Massenerscheinungen Versuch, den Umfang, die Gliederung oder Struktur

Mehr

0 Einführung: Was ist Statistik

0 Einführung: Was ist Statistik 0 Einführung: Was ist Statistik 1 Datenerhebung und Messung Die Messung Skalenniveaus 2 Univariate deskriptive Statistik 3 Multivariate Statistik 4 Regression 5 Ergänzungen Grundbegriffe Statistische Einheit,

Mehr

EINFACHE LINEARE REGRESSION MODUL 13 PROSEMINAR DESKRIPTIVE STATISTIK ANALYSE UND DARSTELLUNG VON DATEN I GÜNTER HAIDER WS 1999/2000

EINFACHE LINEARE REGRESSION MODUL 13 PROSEMINAR DESKRIPTIVE STATISTIK ANALYSE UND DARSTELLUNG VON DATEN I GÜNTER HAIDER WS 1999/2000 INSTITUT FÜR ERZIEHUNGSWISSENSCHAFT - UNIVERSITÄT SALZBURG PROSEMINAR DESKRIPTIVE STATISTIK ANALYSE UND DARSTELLUNG VON DATEN I GÜNTER HAIDER WS 1999/2 MODUL 13 EINFACHE LINEARE REGRESSION Erziehungswissenschaft/Haider

Mehr

Abhängigkeit zweier Merkmale

Abhängigkeit zweier Merkmale Abhängigkeit zweier Merkmale Johannes Hain Lehrstuhl für Mathematik VIII Statistik 1/33 Allgemeine Situation Neben der Untersuchung auf Unterschiede zwischen zwei oder mehreren Untersuchungsgruppen hinsichtlich

Mehr

1 Darstellen von Daten

1 Darstellen von Daten 1 Darstellen von Daten BesucherInnenzahlen der Bühnen Graz in der Spielzeit 2010/11 1 Opernhaus 156283 Hauptbühne 65055 Probebühne 7063 Ebene 3 2422 Next Liberty 26800 Säulen- bzw. Balkendiagramm erstellen

Mehr

- Eine typische Ausfallrate, wie sie bei vielen technischen Anwendungen zu sehen ist hat die Form einer Badewanne, deshalb nennt man diese Kurve auch

- Eine typische Ausfallrate, wie sie bei vielen technischen Anwendungen zu sehen ist hat die Form einer Badewanne, deshalb nennt man diese Kurve auch 1 2 - Eine typische Ausfallrate, wie sie bei vielen technischen Anwendungen zu sehen ist hat die Form einer Badewanne, deshalb nennt man diese Kurve auch Badewannenkurve. -mit der Badewannenkurve lässt

Mehr

Statistische Verfahren für das Data Mining in einem Industrieprojekt

Statistische Verfahren für das Data Mining in einem Industrieprojekt Statistische Verfahren für das Data Mining in einem Industrieprojekt Thorsten Dickhaus Forschungszentrum Jülich GmbH Zentralinstitut für Angewandte Mathematik Telefon: 02461/61-4193 E-Mail: th.dickhaus@fz-juelich.de

Mehr

Kapitel 23 Lineare Regression

Kapitel 23 Lineare Regression Kapitel 23 Lineare Regression Sowohl einfache als auch multiple Regressionsanalysen können Sie mit dem Befehl STATISTIK REGRESSION LINEAR... durchführen. Dabei lassen sich mit Hilfe diverser Optionen zahlreiche

Mehr

Einführung in die Statistik mit EXCEL und SPSS

Einführung in die Statistik mit EXCEL und SPSS Christine Duller 2008 AGI-Information Management Consultants May be used for personal purporses only or by libraries associated to dandelon.com network. Einführung in die Statistik mit EXCEL und SPSS Ein

Mehr

Das Dialogfeld für die Regressionsanalyse ("Lineare Regression") findet sich im Statistik- Menu unter "Regression"-"Linear":

Das Dialogfeld für die Regressionsanalyse (Lineare Regression) findet sich im Statistik- Menu unter Regression-Linear: Lineare Regression Das Dialogfeld für die Regressionsanalyse ("Lineare Regression") findet sich im Statistik- Menu unter "Regression"-"Linear": Im einfachsten Fall werden mehrere Prädiktoren (oder nur

Mehr

Analyse klassierter Daten: Vor der Analyse fasst man jeweils mehrere Merkmalsausprägungen in (Merkmalswerte-)Klassen zusammen.

Analyse klassierter Daten: Vor der Analyse fasst man jeweils mehrere Merkmalsausprägungen in (Merkmalswerte-)Klassen zusammen. 4. Analyse univariater Daten: Übersicht Mathematik ist die Wissenschaft der reinen Zahl, Statistik die der empirischen Zahl Von univariaten Daten spricht man, wenn bei der Datenerhebung nur ein Merkmal

Mehr

Felix Klug SS 2011. 2. Tutorium Deskriptive Statistik

Felix Klug SS 2011. 2. Tutorium Deskriptive Statistik 2. Tutorium Deskriptive Statistik Felix Klug SS 2011 Skalenniveus Weitere Beispiele für Skalenniveus (Entnommen aus Wiederholungsblatt 1.): Skalenniveu Nominalskala Ordinalskala Intervallskala Verhältnisskala

Mehr

Korrelation. Übungsbeispiel 1. Übungsbeispiel 4. Übungsbeispiel 2. Übungsbeispiel 3. Korrel.dtp Seite 1

Korrelation. Übungsbeispiel 1. Übungsbeispiel 4. Übungsbeispiel 2. Übungsbeispiel 3. Korrel.dtp Seite 1 Korrelation Die Korrelationsanalyse zeigt Zusammenhänge auf und macht Vorhersagen möglich Was ist Korrelation? Was sagt die Korrelationszahl aus? Wie geht man vor? Korrelation ist eine eindeutige Beziehung

Mehr

Prüfung zu Modul 26 (BA Bw) bzw. 10 (BA IB) (Wirtschaftsstatistik)

Prüfung zu Modul 26 (BA Bw) bzw. 10 (BA IB) (Wirtschaftsstatistik) 2 Klausur-Nr = Sitzplatz-Nr Prüfung zu Modul 26 (BA Bw) bzw. 10 (BA IB) (Wirtschaftsstatistik) Klausurteil 1: Beschreibende Statistik Name, Vorname:... verteilung Teil 1: Beschreibende Statistik Aufgaben

Mehr

Univariate Lineare Regression. (eine unabhängige Variable)

Univariate Lineare Regression. (eine unabhängige Variable) Univariate Lineare Regression (eine unabhängige Variable) Lineare Regression y=a+bx Präzise lineare Beziehung a.. Intercept b..anstieg y..abhängige Variable x..unabhängige Variable Lineare Regression y=a+bx+e

Mehr

Prüfung zu Modul 26 (BA Bw) bzw. 10 (BA IB) (Wirtschaftsstatistik)

Prüfung zu Modul 26 (BA Bw) bzw. 10 (BA IB) (Wirtschaftsstatistik) 2 3 Klausur-Nr = Sitzplatz-Nr Prüfung zu Modul 26 (BA Bw) bzw. 10 (BA IB) (Wirtschaftsstatistik) Klausurteil 1: Beschreibende Statistik BeStat-1 (7 ) n = 400 Personen wurden gefragt, wie viele Stück eines

Mehr

5. Schließende Statistik. 5.1. Einführung

5. Schließende Statistik. 5.1. Einführung 5. Schließende Statistik 5.1. Einführung Sollen auf der Basis von empirischen Untersuchungen (Daten) Erkenntnisse gewonnen und Entscheidungen gefällt werden, sind die Methoden der Statistik einzusetzen.

Mehr

Vorlesung. Funktionen/Abbildungen 1

Vorlesung. Funktionen/Abbildungen 1 Vorlesung Funktionen/Abbildungen 1 1 Grundlagen Hinweis: In dieser Vorlesung werden Funktionen und Abbildungen synonym verwendet. In der Schule wird eine Funktion häufig als eindeutige Zuordnung definiert.

Mehr

Beeinflusst das Geschlecht das Erwerbseinkommen?

Beeinflusst das Geschlecht das Erwerbseinkommen? 74 Kapitel 5 Analyse von Zusammenhängen 5.1 Multivariate Merkmale Gerade in der Soziologie ist die Analyse eindimensionaler Merkmale nur der allererste Schritt. Letztendlich kommt es auf die Analyse von

Mehr

Einfache statistische Auswertungen mit dem TI-Nspire

Einfache statistische Auswertungen mit dem TI-Nspire 1. Neues Dokument und darin eine neue Seite anlegen Als Typ 6: Lists & Spreadsheet wählen. Darin die Messwerte in einer Spalte erfassen. Dies ergibt die Urliste. Wenn mehrere Messwerte vorliegen, die diejenigen,

Mehr

Der Internetdienst für Ihre Online-Umfragen. Leitfaden statistische Auswertung

Der Internetdienst für Ihre Online-Umfragen. Leitfaden statistische Auswertung Der Internetdienst für Ihre Online-Umfragen Leitfaden statistische Auswertung Weitere in dieser Reihe bei 2ask erschienene Leitfäden Allgemeiner Leitfaden zur Fragebogenerstellung Sie möchten einen Fragebogen

Mehr

MBA Quantitative Methoden

MBA Quantitative Methoden Quantitative Methoden Deskriptive Statistik - Seite 1 - Quantitative Methoden Deskriptive Statistik Peter Schmidt, Hochschule Bremen Inhalt 1 Quantitative Methoden; Statistik... 3 1.1 Definitionen Was

Mehr

Statistik I für Wirtschaftswissenschaftler Klausur am 06.07.2007, 14.00 16.00.

Statistik I für Wirtschaftswissenschaftler Klausur am 06.07.2007, 14.00 16.00. 1 Statistik I für Wirtschaftswissenschaftler Klausur am 06.07.2007, 14.00 16.00. Bitte unbedingt beachten: a) Gewertet werden alle 9 gestellten Aufgaben. b) Lösungswege sind anzugeben. Die Angabe des Endergebnisses

Mehr

Prof. Dr. P. von der Lippe Statistik I NK SS 2002 Seite 1

Prof. Dr. P. von der Lippe Statistik I NK SS 2002 Seite 1 Prof. Dr. P. von der Lippe Statistik I NK SS 2002 Seite 1 Aufgabe 1 a) BWL-Student S hat von seinem Lieblingsonkel 10.000 geschenkt bekommen mit der Auflage damit etwas Vernünftiges zu machen. Nachdem

Mehr

Bivariate lineare Regression. Statistik für SozialwissenschaftlerInnen II p.154

Bivariate lineare Regression. Statistik für SozialwissenschaftlerInnen II p.154 Bivariate lineare Regression Statistik für SozialwissenschaftlerInnen II p.154 Grundidee und Typen der Regression Die Regressionsanalyse dient zur Quantifizierung des Zusammenhangs und der statistisch

Mehr

Auswertung mit dem Statistikprogramm SPSS: 30.11.05

Auswertung mit dem Statistikprogramm SPSS: 30.11.05 Auswertung mit dem Statistikprogramm SPSS: 30.11.05 Seite 1 Einführung SPSS Was ist eine Fragestellung? Beispiel Welche statistische Prozedur gehört zu welcher Hypothese? Statistische Berechnungen mit

Mehr