WISTA WIRTSCHAFTSSTATISTIK

Größe: px
Ab Seite anzeigen:

Download "WISTA WIRTSCHAFTSSTATISTIK"

Transkript

1 WISTA WIRTSCHAFTSSTATISTIK PROF. DR. ROLF HÜPEN FAKULTÄT FÜR WIRTSCHAFTSWISSENSCHAFT Seminar für Theoretische Wirtschaftslehre Vorlesungsprogramm Zweidimensionale Datensätze 1. Kontingenztabelle und Streudiagramm 2. Korrelationsanalyse: Korrelationskoeffizienten von Fechner, Bravais-Pearson und Spearman 3. Regressionsanalyse: lineare Regression, Methode der kleinsten Quadrate Literatur: Degen, Horst / Lorscheid, Peter: Statistik-Lehrbuch, 2. Aufl., München-Wien 2002, S Mosler, Karl und Schmid, Friedrich: Beschreibende Statistik und Wirtschaftsstatistik, 4. Aufl., Berlin-Heidelberg-New York 2009, S von der Lippe, Peter: Deskriptive Statistik, Stuttgart 1993, Online-Ausgabe, S , S Wewel, Max C.: Statistik im Bachelor-Studium der BWL und VWL, 2. erw. Aufl., München 2011, S Übungsaufgaben: WS 07/08 A3; WS 08/09 A1; SS 09 A4; WS 09/10 A3; SS 10 A2; SS 11 A1+ A3.

2 Zweidimensionale Datensätze Einführung Mehrdimensionale Datensätze: Bei n Merkmalsträgern und m nicht häufbaren Merkmalen liegt für jeden Merkmalsträger ein m Tupel an Beobachtungswerten vor. Die Urliste besteht mithin aus n solcher m Tupel und somit aus n m Einzeldaten. Beispiel Absolventenumfrage 2002: n = 39 Personen haben jeweils m = 22 Fragen beantwortet. Also liegen = 858 Einzeldaten vor. Hier: Beschränkung auf m = 2 Merkmale Zweidimensionaler Datensatz: n Merkmalsträger 2 Merkmale X und Y Für jeden Merkmalsträger i liegt ein Wertepaar x i, y i vor. x i = Beobachtungswert für Merkmal X beim Merkmalsträger i. y i = Beobachtungswert für Merkmal Y beim Merkmalsträger i. Die Urliste besteht dann aus n Wertepaaren x 1, y 1, x 2, y 2,, x n, y n Darstellungsmöglichkeiten der Urliste: Kontingenztabelle Streudiagramm 2

3 Zweidimensionale Datensätze Kontingenztabelle Kontingenztabelle Die Kontingenztabelle ist eine zweidimensionale Häufigkeitstabelle, in der für jede mögliche Kombination von Ausprägungen der beiden Merkmale die absolute (oder relative) Häufigkeit notiert wird. Bei k möglichen Ausprägungen des Merkmals X und l möglichen Ausprägungen des Merkmals Y entsteht so eine k l-matrix mit k l absoluten Häufigkeiten der möglichen Wertepaare. Notation: Merkmal X hat k mögliche Ausprägungen a 1,, a k Merkmal Y hat l mögliche Ausprägungen b 1,, b l h ij = absolute Häufigkeit, mit der die Ausprägung a i, b j als Wertepaar in der Urliste auftritt. Randhäufigkeit Merkmal X: h i = Randhäufigkeit Merkmal Y: h j = l j=1 Zahl der Merkmalsträger: n = k i=1 h ij mit i = 1,, k h ij mit j = 1,, l k l i=1 j=1 h ij 3

4 Merkmal X Zweidimensionale Datensätze Kontingenztabelle Dann entsteht folgende Kontingenztabelle: Merkmal Y b 1 b 2 b j b l j a 1 h 11 h 12 h 1j h 1l h 1 a 2 h 21 h 22 h 2j h 2l h 2 a i h i1 h i2 h ij h il h i a k h k1 h k2 h kj h kl h k i h 1 h 2 h j h l n 4

5 Merkmal X Zweidimensionale Datensätze Kontingenztabelle Kontingenztabelle mit relativen Häufigkeiten f ij = h ij n: Merkmal Y b 1 b 2 b j b l j a 1 f 11 f 12 f 1j f 1l f 1 a 2 f 21 f 22 f 2j f 2l f 2 a i f i1 f i2 f ij f il f i a k f k1 f k2 f kj f kl f k i f 1 f 2 f j f l 1 5

6 Stellung im Beruf Zweidimensionale Datensätze Kontingenztabelle Zahlenbeispiel Erwerbstätige in NRW 2005 nach Wirtschaftsbereichen und Stellung im Beruf Angaben in Personen Wirtschaftsbereich Land- und Forstwirtschaft, Fischerei Produzierendes Gewerbe Handel, Gastgewerbe und Verkehr sonstige Dienstleistungen S Selbständige 1) Merkmale: Beamte / / Angestellte 2) Arbeiter 2) S ) Einschließlich mithelfende Familienangehörige, 2) Einschließlich Auszubildende, / = Keine Angabe, da Zahlenwert nicht sicher genug X = Stellung im Beruf Y = Wirtschaftsbereich Quelle: Landesamt für Statistik NRW, Internetseite Merkmalsausprägungen X: a 1 = Selbständige a 2 = Beamte a 3 = Angestellte a 4 = Arbeiter und Arbeiterinnen Merkmalsausprägungen Y: b 1 = Land- und Forstwirtschaft, Fischerei b 2 = Produzierendes Gewerbe b 3 = Handel, Gastgewerbe und Verkehr b 4 = sonstige Dienstleistungen 6

7 Stellung im Beruf Zweidimensionale Datensätze Kontingenztabelle Zahlenbeispiel Erwerbstätige in NRW 2005 nach Wirtschaftsbereichen und Stellung im Beruf Angaben in Prozent Wirtschaftsbereich Land- und Forstwirtschaft, Fischerei Produzierendes Gewerbe Handel, Gastgewerbe und Verkehr sonstige Dienstleistungen S Selbständige 1) 0,72 2,23 3,00 5,28 11,22 Merkmale: Beamte / / 0,48 5,88 6,37 Angestellte 2) 0,30 12,69 13,07 27,82 53,88 Arbeiter 2) 0,55 14,85 6,60 6,52 28,53 S 1,57 29,77 23,16 45,50 100,00 1) Einschließlich mithelfende Familienangehörige, 2) Einschließlich Auszubildende, / = Keine Angabe, da Zahlenwert nicht sicher genug X = Stellung im Beruf Y = Wirtschaftsbereich Quelle: Landesamt für Statistik NRW, Internetseite Merkmalsausprägungen X: a 1 = Selbständige a 2 = Beamte a 3 = Angestellte a 4 = Arbeiter und Arbeiterinnen Merkmalsausprägungen Y: b 1 = Land- und Forstwirtschaft, Fischerei b 2 = Produzierendes Gewerbe b 3 = Handel, Gastgewerbe und Verkehr b 4 = sonstige Dienstleistungen 7

8 Zweidimensionale Datensätze Kontingenztabelle Bedingte relative Häufigkeit Kontingenztabellen sind zur Darstellung zweidimensionaler Datensätze gut geeignet, wenn die Anzahl k der Merkmalsausprägungen von X klein ist, die Anzahl l der Merkmalsausprägungen von Y klein ist und viele der n Wertepaare x i, y i identisch sind. Diese Voraussetzungen sind in der Regel bei nominal skalierten Merkmalen erfüllt. Bedingte relative Häufigkeit f a i b j = h ij h j i = 1,, k f b j a i = h ij h i j = 1,, l Relative Häufigkeit, mit der die Ausprägung a i des Merkmals X bei denjenigen Merkmalsträgern auftritt, die bezüglich des zweiten Merkmals Y die Ausprägung b j besitzen. Relative Häufigkeit, mit der die Ausprägung b j des Merkmals Y bei denjenigen Merkmalsträgern auftritt, die bezüglich des ersten Merkmals X die Ausprägung a i besitzen. An den bedingten Häufigkeiten kann man erkennen, ob die beiden betrachteten Merkmale voneinander unabhängig sind oder nicht. 8

9 Stellung im Beruf Zweidimensionale Datensätze Kontingenztabelle Bedingte relative Häufigkeit Deskriptive Unabhängigkeit liegt vor, wenn die bedingten relativen Häufigkeiten mit den zugehörigen relativen Randhäufigkeiten übereinstimmen, also wenn gilt: f a i b j = h i n, i = 1,, k und f b j a i = h j n, j = 1,, l Berechnung der bedingten relativen Häufigkeiten für das Zahlenbeispiel mit dem Wirtschaftsbereich, also dem Merkmal Y als Bedingung: f a i b j = h ij h j Wirtschaftsbereiche Land- und Forstwirtschaft, Fischerei Produzierendes Gewerbe Handel, Gastgewerbe und Verkehr sonstige Dienstleistungen S Selbständige 1) Beamte Angestellte 2) Arbeiter 2) S

10 Stellung im Beruf Zweidimensionale Datensätze Kontingenztabelle Bedingte relative Häufigkeit Land- und Forstwirtschaft, Fischerei Wirtschaftsbereiche Produzierendes Gewerbe Handel, Gastgewerbe und Verkehr sonstige Dienstleistungen Relative Randhäufigkeit Selbständige 1) 0,46 0,07 0,13 0,12 0,11 Beamte 0,00 0,00 0,02 0,13 0,06 Angestellte 2) 0,19 0,43 0,56 0,61 0,54 Arbeiter 2) 0,35 0,50 0,29 0,14 0,29 S Ergebnis: Die Stellung im Beruf (Merkmal X) ist nicht unabhängig vom Wirtschaftsbereich (Merkmal Y) 10

11 Stellung im Beruf Zweidimensionale Datensätze Kontingenztabelle Bedingte relative Häufigkeit Berechnung der bedingten relativen Häufigkeiten für das Zahlenbeispiel mit der Stellung im Beruf, also dem Merkmal X als Bedingung: f b j a i = h ij h i Wirtschaftsbereiche Land- und Forstwirtschaft, Fischerei Produzierendes Gewerbe Handel, Gastgewerbe und Verkehr sonstige Dienstleistungen S Selbständige 1) Beamte Angestellte 2) Arbeiter 2) S

12 Stellung im Beruf Zweidimensionale Datensätze Kontingenztabelle Bedingte relative Häufigkeit Wirtschaftsbereiche Land- und Forstwirtschaft, Fischerei Produzierendes Gewerbe Handel, Gastgewerbe und Verkehr sonstige Dienstleistungen S Selbständige 1) 0,06 0,20 0,27 0,47 1 Beamte 0,00 0,00 0,08 0,92 1 Angestellte 2) 0,01 0,24 0,24 0,52 1 Arbeiter 2) 0,02 0,52 0,23 0,23 1 Relative Randhäufigkeit 0,02 0,30 0,23 0,46 1 Ergebnis: In welchem Wirtschaftsbereich (Merkmal Y) jemand arbeitet, ist nicht unabhängig von seiner Stellung im Beruf (Merkmal X). Beispielaufgabe 12

13 Stellung im Beruf Zweidimensionale Datensätze Kontingenztabelle Prüfung auf deskriptive Unabhängigkeit Erwerbstätige in NRW 2005 nach Wirtschaftsbereichen und Stellung im Beruf Angaben in Prozent Wirtschaftsbereich Land- und Forstwirtschaft, Fischerei Produzierendes Gewerbe Handel, Gastgewerbe und Verkehr sonstige Dienstleistungen S Selbständige 1) 0,72 2,23 3,00 5,28 11,22 Beamte / / 0,48 5,88 6,37 Angestellte 2) 0,30 12,69 13,07 27,82 53,88 Arbeiter 2) 0,55 14,85 6,60 6,52 28,53 S 1,57 29,77 23,16 45,50 100,00 Prüfung auf deskriptive Unabhängigkeit: Man kann zeigen, dass zwei Merkmale voneinander deskriptiv unabhängig sind, wenn sich die relativen Häufigkeiten in der Kontingenztabelle als Produkt aus den relativen Randhäufigkeiten ergeben: Beispiel: f ij = f i f j deskriptive Unabhängigkeit 0,5388 0,2977 = 0,1604 0,1269 Die Stellung im Beruf ist also nicht unabhängig vom Wirtschaftsbereich. 13

14 Zweidimensionale Datensätze Streudiagramm Streudiagramm In einem Streudiagramm werden die Wertepaare x i, y i Koordinatensystem dargestellt. als Punkte in einem x-y- Voraussetzung: Beide Merkmale sind kardinalskaliert. Streudiagramme sind zur Darstellung zweidimensionaler Häufigkeitsverteilungen besonders gut geeignet, wenn die n Wertepaare (fast) alle voneinander verschieden sind, wenn die Anzahl n der Wertepaare sehr groß ist, um sich einen ersten Eindruck über den (möglichen) Zusammenhang zwischen den Merkmalen zu verschaffen. 14

15 Lebensalter beim Examen (y) Zweidimensionale Datensätze Streudiagramm Zahlenbeispiel Zahlenbeispiel Absolventenumfrage, Merkmale: Fachsemester (X) und Lebensalter (Y) ID-Nr. i Fachsemeste r x i Lebensalter y i Streudiagramm Zahl der Fachsemester beim Examen (x) 15

16 Zweidimensionale Datensätze Korrelation allgemeine Aussagen Korrelationsanalyse Untersucht werden Stärke und Richtung des Zusammenhangs zweier mindestens ordinal skalierter Merkmale X und Y. 1) Zu diesem Zweck werden Korrelationskoeffizienten r berechnet: Für ordinal skalierte Merkmale der Rangkorrelationskoeffizient von Spearman. Für metrische Merkmale der Korrelationskoeffizient von Fechner und der von Bravais- Pearson. Die Korrelationskoeffizienten sind so konstruiert, dass sie nur Werte im Bereich r 1; +1 annehmen können. Dabei wird die Richtung des Zusammenhangs durch das Vorzeichen und die Stärke des Zusammenhangs durch den Absolutbetrag angezeigt. 1 ) Zusammenhangmaße für nominal skalierte Merkmale können nur die Stärke, nicht die Richtung messen und werden in dieser Veranstaltung nicht behandelt. 16

17 Zweidimensionale Datensätze Korrelation allgemeine Aussagen Richtung des Zusammenhangs: r > 0 positive Korrelation : x und y überwiegend gleichläufig. Zu kleinen x-werten gehören meist auch kleine y-werte, zu großen x-werten große y-werte. Je größer x umso größer tendenziell auch y. r < 0 negative Korrelation : x und y überwiegend gegenläufig. Zu kleinen x-werten gehören meist große y-werte, zu großen x-werten kleine y- Werte. Je größer x umso kleiner tendenziell y. Stärke des Zusammenhangs (Faustregel): 0, 8 < r 1 0, 5 < r 0, 8 0, 3 < r 0, 5 0 < r 0, 3 0, 3 r < 0 0, 5 r < 0, 3 0, 8 r < 0, 5 1 r < 0, 8 starke positive Korrelation mittlere positive Korrelation schwache positive Korrelation fehlende positive Korrelation fehlende negative Korrelation schwache negative Korrelation mittlere negative Korrelation starke negative Korrelation 17

18 Zweidimensionale Datensätze Korrelation allgemeine Aussagen Man beachte: Problem der Kausalität: Die Korrelationsanalyse lässt keinen Rückschluss auf eine kausale Beziehung zwischen den Merkmalen zu. Am Korrelationskoeffizienten kann man nicht erkennen, ob X die Ursache für Y oder Y die Ursache für X ist. Problem der Scheinkorrelation: X und Y korrelieren nur deshalb miteinander, weil sie gemeinsam von einer dritten Variablen Z abhängig sind. Beispiele: Geburtenzahl Urbanisierungsgrad Anzahl Störche, Schuhgröße Geschlecht Bruttoeinkommen Problem der Nonsens-Korrelation: Der Korrelationskoeffizient signalisiert einen Zusammenhang, für den es keine inhaltliche Erklärung gibt. Problem der Zufallskorrelation: Die Grundgesamtheit bzw. Stichprobe ist zu klein, um eine sinnvolle Korrelationsanalyse durchführen zu können. 18

19 Zweidimensionale Datensätze Korrelation Korrelationskoeffizient von Fechner Korrelationskoeffizient von Fechner Gegeben: n Wertepaare x i, y i, i = 1,, n als Beobachtungswerte. Dann ist der Korrelationskoeffizient von Fechner definiert als: r F = Ü N Ü + N wobei und Ü = Anzahl der in den Vorzeichen übereinstimmenden Paare x i x, y i y N = Anzahl der in den Vorzeichen nicht übereinstimmenden Paare x i x, y i y Fälle, in denen eine der Differenzen den Wert Null besitzt, werden als Übereinstimmung gezählt. Der Korrelationskoeffizient von Fechner setzt für beide Merkmale metrisches Skalenniveau voraus. Es gehen nur die Vorzeichen der Abweichungen und nicht die Abweichungen selbst in die Berechnung ein. 19

20 Zweidimensionale Datensätze Korrelation Korrelationskoeffizient von Fechner Zahlenbeispiel: Daten von 10 deutschen Kreditinstituten i = 1,, 10 x i = Anzahl Beschäftigte des Kreditinstituts i in 1 000, y i = Bilanzsumme des Kreditinstituts i in Mio Euro i x i y i x i x y i y Ü N 1 93, , , , , , , , , ,2 114 S 267, r F = Ü N Ü + N 20

21 Zweidimensionale Datensätze Korrelation Korrelationskoeffizient von Fechner Zahlenbeispiel: Daten von 10 deutschen Kreditinstituten i = 1,, 10 x i = Anzahl Beschäftigte des Kreditinstituts i in 1 000, y i = Bilanzsumme des Kreditinstituts i in Mio Euro i x i y i x i x y i y Ü N 1 93, ,48 484, , ,48 143, , ,98 57, , ,62 51, , ,18 30, , ,92-60, , ,82-143, , ,72-145, , ,52-193, , ,52-224,5 1 0 S 267, AM 26,72 338,5 r F = Ü N Ü + N = = 8 10 = 0,8 21

22 Bilanzsumme in Mio Euro Zweidimensionale Datensätze Korrelation Korrelationskoeffizient von Fechner Zugehöriges Streudiagramm: x x = 26,72 y = 338, r F = Ü N Ü + N = = 8 10 = 0, y 300 y x Beschäftigte in

23 Zweidimensionale Datensätze Korrelation Korrelationskoeffizient von Bravais-Pearson Korrelationskoeffizient von Bravais-Pearson Gegeben: n Wertepaare x i, y i, i = 1,, n als Beobachtungswerte Dann ist der Korrelationskoeffizient von Bravais-Person definiert als: 1 n x i x y i y n x i x y i y r = n i=1 r = i=1 2 1 n x i x 2 1 n y i y 2 2 n x i x 2 n y i y 2 n i=1 n i=1 i=1 i=1 Definiert man den Ausdruck s xy = 1 n n i=1 x i x y i y als empirische Kovarianz und berücksichtigt ferner die Formeln für die Varianz (mittlere quadratische Abweichung) für X bzw. Y, nämlich s 2 x = 1 n n i=1 x i x 2 und s 2 y = 1 n n i=1 y i y 2, so gilt für r : r = s xy s x 2 s y 2 = s xy s x s y mit s x = s x 2 und s y = s y 2 als jeweilige Standardabweichung. Somit ist r nur definiert, wenn s x 0 und s y 0. 23

24 Zweidimensionale Datensätze Korrelation Korrelationskoeffizient von Bravais-Pearson Eigenschaften des Korrelationskoeffizienten von Bravais-Pearson Beide Merkmale müssen metrisches Skalenniveau haben. Zerlegungsformeln: s xy = 1 n i=1 n x i y i x y n s x 2 = 1 n i=1 x i 2 x 2 n s y 2 = 1 n i=1 y i 2 y 2 Weitere Formel für den Korrelationskoeffizienten von Bravais-Pearson: r = n n i=1 n n i=1 x i y i n i=1 x i n i=1 x 2 i n 2 i=1 x i n n i=1 y 2 i n 2 i=1 y i y i Empirische Kovarianz linearer Transformationen: x i = a + b x i, y i = c + d y i s x y = b d s xy Korrelation linearer Transformationen: r x, y = r x, y falls b d > 0 r x, y falls b d < 0 r = 1 erhält man, wenn alle Wertepaare einer Geradengleichung y i = a + b x i mit positiver Steigung (b > 0) genügen. r = 1 erhält man, wenn alle Wertepaare einer Geradengleichung y i = a + b x i mit negativer Steigung (b < 0) genügen. 24

25 Zweidimensionale Datensätze Korrelation Korrelationskoeffizient von Bravais-Pearson Positive Korrelation: AM x AM x AM y AM y AM y AM y AM x AM x r = 1 r = 0,78 25

26 Zweidimensionale Datensätze Korrelation Korrelationskoeffizient von Bravais-Pearson Negative Korrelation: AM x AM x AM y AM y AM y AM y AM x AM x r = 1 r = 0,67 26

27 Zweidimensionale Datensätze Korrelation Korrelationskoeffizient von Bravais-Pearson Keine Korrelation: AM x AM x AM y AM y AM y AM y AM x AM x r = 0 r = 0,07 27

28 y Zweidimensionale Datensätze Korrelation Korrelationskoeffizient von Bravais-Pearson Zahlenbeispiel: i x i y i x i x y i y x i x y i y x i x 2 y i y AM ,2 10 AM x 9 r = n i=1 n i=1 x i x y i y x i x 2 n i=1 y i y = , oder: 5 AM y AM y r = s xy s x 2 s y 2 = 8 8 9,2 0, Beispielaufgabe 0 AM x x 28

29 Zweidimensionale Datensätze Korrelationskoeffizient von Spearman Korrelationskoeffizient von Spearman (Rangkorrelationskoeffizient) Gegeben sind n Wertepaar (x i, y i ), i = 1, n, als Beobachtungswerte Voraussetzung: Die Merkmale X und Y sind mindestens ordinal skaliert. Hauptanwendungsgebiet sind daher ordinal skalierte Merkmale. 1 Vorgehensweise: Man ordnet jedem x i -Wert bzw. y i -Wert eine Rangnummer R(x i ) bzw. R(y i ) zu, welche seinen Platz in der geordneten Urliste x (1) x 2 x (n) bzw. y (1) y 2 y (n) widerspiegelt. Im ersten Schritt erhält man dadurch die natürlichen Zahlen 1 bis n als vorläufige Rangnummern für jedes Merkmal. Gibt es nur voneinander verschiedene Beobachtungswerte, ist man fertig. Sind die Ausprägungen jeweils nicht alle voneinander verschieden (sog. Bindungen ), werden in einem zweiten Schritt den jeweils gleichen Werten das arithmetische Mittel der auf sie entfallenden vorläufigen Rangnummern als endgültige Rangnummern zugeordnet. Schließlich wird aus den n resultierenden Rangnummern R x i, R(y i ) nach dem Verfahren von Bravais-Pearson der Korrelationskoeffizient berechnet. 2 Formel: Für den Spearmanschen Korrelationskoeffizienten kann folgende Formel verwendet werden: 3 r Sp = 1 6 n 2 d i i=1 n n 2 1, mit d i = R x i R y i Extremwerte: r Sp = 1, wenn die Rangordnung der Merkmalsträger bei beiden Merkmalen dieselbe ist. r Sp = 1, wenn die Reihenfolge der Merkmalsträger beim zweiten Merkmal genau umgekehrt ist. 4 1 Man kann den Spearmanschen Korrelationskoeffizienten zwar auch für metrische Merkmale berechnen, würde dabei aber vorhandene Informationen etwa über Differenzen zwischen den Beobachtungswerten ignorieren. 2 Mit den Rangnummern wird gerechnet wie mit einem metrischen Merkmal, was eigentlich gleiche Abstände zwischen den Rängen voraussetzt. 3 Die Formel ist nur exakt, wenn keine Bindungen vorkommen. 4 Im ersten Fall ist R x i = R(y i ), im zweiten R x i = n + 1 R(y i ) für alle i = 1,, n 29

30 Zweidimensionale Datensätze Korrelationskoeffizient von Spearman Zahlenbeispiel: Zeugnisnoten von sieben Schülern in den Fächern Mathematik und Englisch Schüler Nr Mathematiknote ausreichend mangelhaft gut sehr gut befriedigend mangelhaft gut Englischnote gut ausreichend mangelhaft befriedigend gut sehr gut befriedigend Schüler Mathenote Englischnote vorläufiger Rang endgültiger Rang i x i y i R (x i ) R (y i ) R(x i ) R(y i ) d i d i ,5 2,5 6, ,5 6 0,5 0, ,5 7-4,5 20, ,5-3,5 12, ,5 1,5 2, ,5 1 5,5 30, ,5 4,5-2 4 Summe 75,5 n 2 di i=1 r Sp = 1 6 n n 2 1 = , = = ,3482 schwache negative Korrelation Beispielaufgabe 30

WISTA WIRTSCHAFTSSTATISTIK

WISTA WIRTSCHAFTSSTATISTIK WISTA WIRTSCHAFTSSTATISTIK PROF DR ROLF HÜPEN FAKULTÄT FÜR WIRTSCHAFTSWISSENSCHAFT Seminar für Theoretische Wirtschaftslehre Vorlesungsprogramm 23042013 Datenlagen und Darstellung eindimensionaler Häufigkeitsverteilungen

Mehr

WISTA WIRTSCHAFTSSTATISTIK

WISTA WIRTSCHAFTSSTATISTIK WISTA WIRTSCHAFTSSTATISTIK PROF DR ROLF HÜPEN FAKULTÄT FÜR WIRTSCHAFTSWISSENSCHAFT Seminar für Theoretische Wirtschaftslehre Vorlesungsprogramm 07052013 Mittelwerte und Lagemaße II 1 Anwendung und Berechnung

Mehr

Inhaltsverzeichnis (Ausschnitt)

Inhaltsverzeichnis (Ausschnitt) 4 Zweidimensionale Daten Inhaltsverzeichnis (Ausschnitt) 4 Zweidimensionale Daten Häufigkeitsverteilungen unklassierter Daten Häufigkeitsverteilungen klassierter Daten Bedingte Häufigkeitsverteilungen

Mehr

1 x 1 y 1 2 x 2 y 2 3 x 3 y 3... n x n y n

1 x 1 y 1 2 x 2 y 2 3 x 3 y 3... n x n y n 3.2. Bivariate Verteilungen zwei Variablen X, Y werden gemeinsam betrachtet (an jedem Objekt werden gleichzeitig zwei Merkmale beobachtet) Beobachtungswerte sind Paare von Merkmalsausprägungen (x, y) Beispiele:

Mehr

WISTA WIRTSCHAFTSSTATISTIK

WISTA WIRTSCHAFTSSTATISTIK WISTA WIRTSCHAFTSSTATISTIK PROF. DR. ROLF HÜPEN FAKULTÄT FÜR WIRTSCHAFTSWISSENSCHAFT Seminar für Theoretische Wirtschaftslehre Vorlesungsprogramm 28.05.2013 Konzentrationsmaße 1. Konzentrationsbegriff

Mehr

Lösungen zur deskriptiven Statistik

Lösungen zur deskriptiven Statistik Lösungen zur deskriptiven Statistik Aufgabe 1. Bei einer Stichprobe von n = Studenten wurden folgende jährliche Ausgaben (in e) für Urlaubszwecke ermittelt. 1 58 5 35 6 8 1 6 55 4 47 56 48 1 6 115 8 5

Mehr

Kapitel XI - Korrelationsrechnung

Kapitel XI - Korrelationsrechnung Universität Karlsruhe (TH) Institut für Statistik und Mathematische Wirtschaftstheorie Kapitel XI - Korrelationsrechnung Markus Höchstötter Uni Karlsruhe Karlsruhe, SS 2008 Kapitel XI - Korrelationsrechnung

Mehr

Statistische Methoden in den Umweltwissenschaften

Statistische Methoden in den Umweltwissenschaften Statistische Methoden in den Umweltwissenschaften Korrelationsanalysen Kreuztabellen und χ²-test Themen Korrelation oder Lineare Regression? Korrelationsanalysen - Pearson, Spearman-Rang, Kendall s Tau

Mehr

Lösungen zur Klausur zur Statistik Übung am

Lösungen zur Klausur zur Statistik Übung am Lösungen zur Klausur zur Statistik Übung am 28.06.2013 Fabian Kleine Staatswissenschaftliche Fakultät Aufgabe 1 Gegeben sei die folgende geordneten Urliste des Merkmals Y. 30 Punkte Y : 5 5 5 5 10 10 10

Mehr

Grundlagen der Statistik

Grundlagen der Statistik Grundlagen der Statistik Übung 2 2010 FernUniversität in Hagen Alle Rechte vorbehalten Fakultät für Wirtschaftswissenschaft Übersicht über die mit den Übungsaufgaben geprüften Lehrzielgruppen Lehrzielgruppe

Mehr

Deskription, Statistische Testverfahren und Regression. Seminar: Planung und Auswertung klinischer und experimenteller Studien

Deskription, Statistische Testverfahren und Regression. Seminar: Planung und Auswertung klinischer und experimenteller Studien Deskription, Statistische Testverfahren und Regression Seminar: Planung und Auswertung klinischer und experimenteller Studien Deskriptive Statistik Deskriptive Statistik: beschreibende Statistik, empirische

Mehr

Bivariate Verteilungen [bivariate data]

Bivariate Verteilungen [bivariate data] Bivariate Verteilungen [bivariate data] Zwei Variablen X, Y werden gemeinsam betrachtet, d.h. an jedem Objekt i werden zwei Merkmale beobachtet. Beobachtungswerte sind Paare/Kombinationen von Merkmalsausprägungen

Mehr

Ausführliche Lösungen zu ausgewählten Aufgaben von ÜB 5 und 6. Streudiagramm

Ausführliche Lösungen zu ausgewählten Aufgaben von ÜB 5 und 6. Streudiagramm y Aufgabe 3 Ausführliche Lösungen zu ausgewählten Aufgaben von ÜB 5 und 6 a) Zur Erstellung des Streudiagramms zeichnet man jeweils einen Punkt für jedes Datenpaar (x i, y i ) aus der zweidimensionalen

Mehr

Skalenniveaus =,!=, >, <, +, -

Skalenniveaus =,!=, >, <, +, - ZUSAMMENHANGSMAßE Skalenniveaus Nominalskala Ordinalskala Intervallskala Verhältnisskala =,!= =,!=, >, < =,!=, >, ,

Mehr

Statistik I. 1. Klausur Wintersemester 2010/2011 Hamburg, Art der Anmeldung: STiNE FlexNow Zulassung unter Vorbehalt

Statistik I. 1. Klausur Wintersemester 2010/2011 Hamburg, Art der Anmeldung: STiNE FlexNow Zulassung unter Vorbehalt Statistik I 1. Klausur Wintersemester 2010/2011 Hamburg, 11.02.2011 BITTE LESERLICH IN DRUCKBUCHSTABEN AUSFÜLLEN! Nachname:............................................................................ Vorname:.............................................................................

Mehr

TEIL 12: BIVARIATE ANALYSE FÜR METRISCH SKALIERTE VARIABLEN

TEIL 12: BIVARIATE ANALYSE FÜR METRISCH SKALIERTE VARIABLEN TEIL 12: BIVARIATE ANALYSE FÜR METRISCH SKALIERTE VARIABLEN Bivariate Analyse für metrisch skalierte Variablen Grundlagen Verfahren für metrische Daten nutzen den vollen mathematischen Informationsgehalt

Mehr

Eine zweidimensionale Stichprobe

Eine zweidimensionale Stichprobe Eine zweidimensionale Stichprobe liegt vor, wenn zwei qualitative Merkmale gleichzeitig betrachtet werden. Eine Urliste besteht dann aus Wertepaaren (x i, y i ) R 2 und hat die Form (x 1, y 1 ), (x 2,

Mehr

Statistik II. Lineare Regressionsrechnung. Wiederholung Skript 2.8 und Ergänzungen (Schira: Kapitel 4) Statistik II

Statistik II. Lineare Regressionsrechnung. Wiederholung Skript 2.8 und Ergänzungen (Schira: Kapitel 4) Statistik II Statistik II Lineare Regressionsrechnung Wiederholung Skript 2.8 und Ergänzungen (Schira: Kapitel 4) Statistik II - 09.06.2006 1 Mit der Kovarianz und dem Korrelationskoeffizienten können wir den statistischen

Mehr

Zusammenhänge zwischen metrischen Merkmalen

Zusammenhänge zwischen metrischen Merkmalen Zusammenhänge zwischen metrischen Merkmalen Darstellung des Zusammenhangs, Korrelation und Regression Daten liegen zu zwei metrischen Merkmalen vor: Datenpaare (x i, y i ), i = 1,..., n Beispiel: x: Anzahl

Mehr

Deskriptive Statistik Lösungen zu Blatt 5 Christian Heumann, Susanne Konrath SS Lösung Aufgabe 27. f X Y (a i b j ) = f i j = f ij f j

Deskriptive Statistik Lösungen zu Blatt 5 Christian Heumann, Susanne Konrath SS Lösung Aufgabe 27. f X Y (a i b j ) = f i j = f ij f j 1 Deskriptive Statistik Lösungen zu Blatt 5 Christian Heumann, Susanne Konrath SS 2011 Lösung Aufgabe 27 (a) Notation: X: Rauchen, Y : chronische Bronchitis S X {ja, nein} {a 1, a 2 }, S Y {ja, nein} {b

Mehr

6 Korrelations- und Regressionsanalyse: Zusammenhangsanalyse stetiger Merkmale

6 Korrelations- und Regressionsanalyse: Zusammenhangsanalyse stetiger Merkmale 6 Korrelations- und Regressionsanalyse: Zusammenhangsanalyse stetiger Merkmale 397 6.1 Korrelationsanalyse Jetzt betrachten wir bivariate Merkmale (X, Y ), wobei sowohl X als auch Y stetig bzw. quasi-stetig

Mehr

Eigene MC-Fragen (Teil II) "Kap. 9 Zusammenhangsmaße

Eigene MC-Fragen (Teil II) Kap. 9 Zusammenhangsmaße Eigene MC-Fragen (Teil II) "Kap. 9 Zusammenhangsmaße 1. Kreuze die richtige Aussage an! positiv sind, ist r stets identisch mit s xy. negativ sind, ist r stets identisch mit s xy. positiv sind, ist das

Mehr

Brückenkurs Statistik für Wirtschaftswissenschaften

Brückenkurs Statistik für Wirtschaftswissenschaften Peter von der Lippe Brückenkurs Statistik für Wirtschaftswissenschaften Weitere Übungsfragen UVK Verlagsgesellschaft mbh Konstanz Mit UVK/Lucius München UVK Verlagsgesellschaft mbh Konstanz und München

Mehr

Statistik. Sommersemester Stefan Etschberger. für Betriebswirtschaft, Internationales Management, Wirtschaftsinformatik und Informatik

Statistik. Sommersemester Stefan Etschberger. für Betriebswirtschaft, Internationales Management, Wirtschaftsinformatik und Informatik Stefan Etschberger für Betriebswirtschaft, Internationales Management, Wirtschaftsinformatik und Informatik Sommersemester 07 Gini-Koeffizient Numerisches Maß der : Gini-Koeffizient G Aus den Daten: G

Mehr

Statistik. Sommersemester Prof. Dr. Stefan Etschberger Hochschule Augsburg

Statistik. Sommersemester Prof. Dr. Stefan Etschberger Hochschule Augsburg für Betriebswirtschaft, Internationales Management, Wirtschaftsinformatik und Informatik Sommersemester 2016 Prof. Dr. Stefan Etschberger Hochschule Augsburg Weitere smaße skoeffizient: CR g = Anteil,

Mehr

Es können keine oder mehrere Antworten richtig sein. Eine Frage ist NUR dann richtig beantwortet, wenn ALLE richtigen Antworten angekreuzt wurden.

Es können keine oder mehrere Antworten richtig sein. Eine Frage ist NUR dann richtig beantwortet, wenn ALLE richtigen Antworten angekreuzt wurden. Teil III: Statistik Alle Fragen sind zu beantworten. Es können keine oder mehrere Antworten richtig sein. Eine Frage ist NUR dann richtig beantwortet, wenn ALLE richtigen Antworten angekreuzt wurden. Wird

Mehr

TEIL 12: BIVARIATE ANALYSE FÜR METRISCH SKALIERTE VARIABLEN

TEIL 12: BIVARIATE ANALYSE FÜR METRISCH SKALIERTE VARIABLEN TEIL 12: BIVARIATE ANALYSE FÜR METRISCH SKALIERTE VARIABLEN GLIEDERUNG Bivariate Analyse für metrisch skalierte Variablen Grundlagen Streudiagramme und Visualisierungen von Zusammenhängen Positive lineare

Mehr

Gibt es einen Zusammenhang zwischen Merkmalen? Korrelationen

Gibt es einen Zusammenhang zwischen Merkmalen? Korrelationen Arbeitsblatt SPSS Kapitel 8 Seite Gibt es einen Zusammenhang zwischen Merkmalen? Korrelationen Wie in allen Kapiteln gehen wir im Folgenden davon aus, dass Sie die Datei elporiginal.sav geöffnet haben.

Mehr

Statistik I für Betriebswirte Vorlesung 10

Statistik I für Betriebswirte Vorlesung 10 Statistik I für Betriebswirte Vorlesung 10 Dr. Andreas Wünsche TU Bergakademie Freiberg Institut für Stochastik 15. Juni 2017 Dr. Andreas Wünsche Statistik I für Betriebswirte Vorlesung 10 Version: 13.

Mehr

Ermitteln Sie auf 2 Dezimalstellen genau die folgenden Kenngrößen der bivariaten Verteilung der Merkmale Weite und Zeit:

Ermitteln Sie auf 2 Dezimalstellen genau die folgenden Kenngrößen der bivariaten Verteilung der Merkmale Weite und Zeit: 1. Welche der folgenden Kenngrößen, Statistiken bzw. Grafiken sind zur Beschreibung der Werteverteilung des Merkmals Konfessionszugehörigkeit sinnvoll einsetzbar? A. Der Modalwert. B. Der Median. C. Das

Mehr

Philipp Sibbertsen Hartmut Lehne. Statistik. Einführung für Wirtschafts- und. Sozialwissenschaftler. 2., überarbeitete Auflage. 4^ Springer Gabler

Philipp Sibbertsen Hartmut Lehne. Statistik. Einführung für Wirtschafts- und. Sozialwissenschaftler. 2., überarbeitete Auflage. 4^ Springer Gabler Philipp Sibbertsen Hartmut Lehne Statistik Einführung für Wirtschafts- und Sozialwissenschaftler 2., überarbeitete Auflage 4^ Springer Gabler Inhaltsverzeichnis Teil I Deskriptive Statistik 1 Einführung

Mehr

W-Rechnung und Statistik für Ingenieure Übung 5

W-Rechnung und Statistik für Ingenieure Übung 5 W-Rechnung und Statistik für Ingenieure Übung 5 Grafische/ tabellarische Darstellung für bivariate Daten diskrete Merkmale (qualitativ+ quantitativ diskret) stetige Merkmale (quantitativ stetig) Zusammenhangsmaße

Mehr

Statistik I. Zusammenfassung und wichtiges zur Prüfungsvorbereitung. Malte Wissmann. 9. Dezember Universität Basel.

Statistik I. Zusammenfassung und wichtiges zur Prüfungsvorbereitung. Malte Wissmann. 9. Dezember Universität Basel. Zusammenfassung und wichtiges zur Prüfungsvorbereitung 9. Dezember 2008 Begriffe Kenntnis der wichtigen Begriffe und Unterscheidung dieser. Beispiele: Merkmal, Merkmalsraum, etc. Skalierung: Nominal etc

Mehr

Sommersemester Marktforschung

Sommersemester Marktforschung Dipl.-Kfm. Sascha Steinmann Universität Siegen Lehrstuhl für Marketing steinmann@marketing.uni-siegen.de Sommersemester 2010 Marktforschung Übungsaufgaben zu den Themen 3-6 mit Lösungsskizzen Aufgabe 1:

Mehr

fh management, communication & it Constantin von Craushaar fh-management, communication & it Statistik Angewandte Statistik

fh management, communication & it Constantin von Craushaar fh-management, communication & it Statistik Angewandte Statistik fh management, communication & it Folie 1 Überblick Grundlagen (Testvoraussetzungen) Mittelwertvergleiche (t-test,..) Nichtparametrische Tests Korrelationen Regressionsanalyse... Folie 2 Überblick... Varianzanalyse

Mehr

6Korrelationsanalyse:Zusammengangsanalysestetiger Merkmale

6Korrelationsanalyse:Zusammengangsanalysestetiger Merkmale 6Korrelationsanalyse:Zusammengangsanalysestetiger Merkmale Jetzt betrachten wir bivariate Merkmale (X, Y ), wobei sowohl X als auch Y stetig bzw. quasi-stetig und mindestens ordinalskaliert, typischerweise

Mehr

Leseprobe. Michael Sachs. Wahrscheinlichkeitsrechnung und Statistik. für Ingenieurstudenten an Fachhochschulen. ISBN (Buch):

Leseprobe. Michael Sachs. Wahrscheinlichkeitsrechnung und Statistik. für Ingenieurstudenten an Fachhochschulen. ISBN (Buch): Leseprobe Michael Sachs Wahrscheinlichkeitsrechnung und Statistik für Ingenieurstudenten an Fachhochschulen ISBN (Buch): 978-3-446-43797-5 ISBN (E-Book): 978-3-446-43732-6 Weitere Informationen oder Bestellungen

Mehr

Grundlagen der Statistik I

Grundlagen der Statistik I NWB-Studienbücher Wirtschaftswissenschaften Grundlagen der Statistik I Beschreibende Verfahren Von Professor Dr. Jochen Schwarze 10. Auflage Verlag Neue Wirtschafts-Briefe Herne/Berlin Inhaltsverzeichnis

Mehr

Statistik II: Signifikanztests /2

Statistik II: Signifikanztests /2 Medien Institut : Signifikanztests /2 Dr. Andreas Vlašić Medien Institut (0621) 52 67 44 vlasic@medien-institut.de Gliederung 1. Korrelation 2. Exkurs: Kausalität 3. Regressionsanalyse 4. Key Facts 2 I

Mehr

5.5 PRE-Maße (Fehlerreduktionsmaße) 6

5.5 PRE-Maße (Fehlerreduktionsmaße) 6 359 5.5 PRE-Maße (Fehlerreduktionsmaße) 6 5.5.1 Die grundlegende Konstruktion Völlig andere, sehr allgemeine Grundidee zur Beschreibung von Zusammenhängen. Grundlegendes Prinzip vieler statistischer Konzepte.

Mehr

Karl Entacher. FH-Salzburg

Karl Entacher. FH-Salzburg Ahorn Versteinert Bernhard.Zimmer@fh-salzburg.ac.at Statistik @ HTK Karl Entacher FH-Salzburg karl.entacher@fh-salzburg.ac.at Beispiel 3 Gegeben sind 241 NIR Spektren (Vektoren der Länge 223) zu Holzproben

Mehr

Deskriptive Statistik Erläuterungen

Deskriptive Statistik Erläuterungen Grundlagen der Wirtschaftsmathematik und Statistik Erläuterungen Lernmaterial zum Modul - 40601 - der Fernuniversität Hagen 7 2.1 Einfache Lageparameter aus einer gegebenen Messreihe ablesen Erklärung

Mehr

Bivariate Analyse: Gemeinsame (bivariate) Häufigkeitstabelle. Sie wird auch Kontingenz-, Assoziations- oder Korrelationstabelle (f b )genannt.

Bivariate Analyse: Gemeinsame (bivariate) Häufigkeitstabelle. Sie wird auch Kontingenz-, Assoziations- oder Korrelationstabelle (f b )genannt. Bivariate Analyse: Tabellarische Darstellung: Gemeinsame (bivariate) Häufigkeitstabelle. Sie wird auch Kontingenz-, Assoziations- oder Korrelationstabelle (f b )genannt. Beispiel: Häufigkeitsverteilung

Mehr

5 Assoziationsmessung in Kontingenztafeln

5 Assoziationsmessung in Kontingenztafeln 5 Assoziationsmessung in Kontingenztafeln 51 Multivariate Merkmale 51 Multivariate Merkmale Gerade in der Soziologie ist die Analyse eindimensionaler Merkmale nur der allererste Schritt zur Beschreibung

Mehr

Musterlösung zur Aufgabensammlung Statistik I Teil 3

Musterlösung zur Aufgabensammlung Statistik I Teil 3 Musterlösung zur Aufgabensammlung Statistik I Teil 3 2008, Malte Wissmann 1 Zusammenhang zwischen zwei Merkmalen Nominale, Ordinale Merkmale und Mischungen Aufgabe 12 a) x\ y 1.Klasse 2.Klasse 3.Klasse

Mehr

Dr. Maike M. Burda. Welchen Einfluss hat die Körperhöhe auf das Körpergewicht? Eine Regressionsanalyse. HU Berlin, Econ Bootcamp 7.-9.

Dr. Maike M. Burda. Welchen Einfluss hat die Körperhöhe auf das Körpergewicht? Eine Regressionsanalyse. HU Berlin, Econ Bootcamp 7.-9. Dr. Maike M. Burda Welchen Einfluss hat die Körperhöhe auf das Körpergewicht? Eine Regressionsanalyse. HU Berlin, Econ Bootcamp 7.-9. Januar 2011 BOOTDATA11.GDT: 250 Beobachtungen für die Variablen...

Mehr

Parametrische vs. Non-Parametrische Testverfahren

Parametrische vs. Non-Parametrische Testverfahren Parametrische vs. Non-Parametrische Testverfahren Parametrische Verfahren haben die Besonderheit, dass sie auf Annahmen zur Verteilung der Messwerte in der Population beruhen: die Messwerte sollten einer

Mehr

Vl Zweidimensionale Verteilungen Zusammenhangsmaße 3.1. Zwei dimensionale Häufigkeitstabellen. Absolute Häufigkeitstabelle

Vl Zweidimensionale Verteilungen Zusammenhangsmaße 3.1. Zwei dimensionale Häufigkeitstabellen. Absolute Häufigkeitstabelle Vl. 5.12.11 3. Zweidimensionale Verteilungen Zusammenhangsmaße 3.1. Zwei dimensionale Häufigkeitstabellen schnell mittel langsam 3 Arten von Häufigkeitstabellen: Absolute Häufigkeitstabelle relative Häufigkeitstabelle

Mehr

Grundlagen der Statistik

Grundlagen der Statistik www.nwb.de NWB Studium Betriebswirtschaft Grundlagen der Statistik Band 1: Beschreibende Verfahren Von Professor Dr. Jochen Schwarze 12., vollständig überarbeitete Auflage nwb STUDIUM Inhaltsverzeichnis

Mehr

6 Korrelationsanalyse: Zusammenhangsanalyse stetiger. Merkmale

6 Korrelationsanalyse: Zusammenhangsanalyse stetiger. Merkmale 6 Korrelationsanalyse: Zusammenhangsanalyse stetiger Merkmale 6.1 Korrelationsanalyse Jetzt betrachten wir bivariate Merkmale (X, Y ), wobei sowohl X als auch Y stetig bzw. quasi-stetig und mindestens

Mehr

Statistik I für Statistiker, Mathematiker und Informatiker Lösungen zu Blatt 6 Gerhard Tutz, Jan Ulbricht WS 05/06.

Statistik I für Statistiker, Mathematiker und Informatiker Lösungen zu Blatt 6 Gerhard Tutz, Jan Ulbricht WS 05/06. Statistik I für Statistiker, Mathematiker und Informatiker Lösungen zu Blatt Gerhard Tutz, Jan Ulbricht WS 05/0 Lösung Aufgabe 4 Notation: X: Rauchen, Y : chronische Bronchitis S X {ja, nein} {a 1, a },

Mehr

Statistik. Ronald Balestra CH St. Peter

Statistik. Ronald Balestra CH St. Peter Statistik Ronald Balestra CH - 7028 St. Peter www.ronaldbalestra.ch 17. Januar 2010 Inhaltsverzeichnis 1 Statistik 1 1.1 Beschreibende Statistik....................... 1 1.2 Charakterisierung von Häufigkeitsverteilungen...........

Mehr

Kapitel VIII - Mehrdimensionale Merkmale

Kapitel VIII - Mehrdimensionale Merkmale Institut für Volkswirtschaftslehre (ECON) Lehrstuhl für Ökonometrie und Statistik Kapitel VIII - Mehrdimensionale Merkmale Deskriptive Statistik Prof. Dr. W.-D. Heller Hartwig Senska Carlo Siebenschuh

Mehr

Wahrscheinlichkeitsrechnung und Statistik

Wahrscheinlichkeitsrechnung und Statistik Wahrscheinlichkeitsrechnung und Statistik Für Ingenieurstudenten an Fachhochschulen von Michael Sachs erweitert Wahrscheinlichkeitsrechnung und Statistik Sachs schnell und portofrei erhältlich bei beck-shopde

Mehr

Franz Kronthaler. Statistik angewandt. Datenanalyse ist (k)eine Kunst. mit dem R Commander. A Springer Spektrum

Franz Kronthaler. Statistik angewandt. Datenanalyse ist (k)eine Kunst. mit dem R Commander. A Springer Spektrum Franz Kronthaler Statistik angewandt Datenanalyse ist (k)eine Kunst mit dem R Commander A Springer Spektrum Inhaltsverzeichnis Teil I Basiswissen und Werkzeuge, um Statistik anzuwenden 1 Statistik ist

Mehr

Statistik für Naturwissenschaftler

Statistik für Naturwissenschaftler Hans Walser Statistik für Naturwissenschaftler 3000 2500 KVG-Leistungen pro versicherte Person Durchschnitt Schweiz JU TI NE VD GE BS BL 2000 FR SO ZH TG AG BE VS SH SZGL SG 500 OW LU ZG GR UR AR Anzahl

Mehr

Deskriptive Beschreibung linearer Zusammenhänge

Deskriptive Beschreibung linearer Zusammenhänge 9 Mittelwert- und Varianzvergleiche Mittelwertvergleiche bei k > 2 unabhängigen Stichproben 9.4 Beispiel: p-wert bei Varianzanalyse (Grafik) Bedienungszeiten-Beispiel, realisierte Teststatistik F = 3.89,

Mehr

Der Korrelationskoezient nach Pearson

Der Korrelationskoezient nach Pearson Der Korrelationskoezient nach Pearson 1 Motivation In der Statistik werden wir uns häug mit empirisch erfassten Daten beschäftigen. Um diese auszuwerten, ist es oftmals notwendig einen Zusammenhang zwischen

Mehr

Beschreibende Statistik Zweidimensionale (bivariate) Daten

Beschreibende Statistik Zweidimensionale (bivariate) Daten Mathematik II für Biologen Beschreibende Statistik Zweidimensionale (bivariate) Daten 8. Mai 2009 Lineare Regression Transformationen Produktmomenten-Korrelation Rangkorrelation Warnung Stichprobe ( 1,y

Mehr

Kapitel 5 Wichtige Maßzahlen für den Zusammenhang zwischen Merkmalen

Kapitel 5 Wichtige Maßzahlen für den Zusammenhang zwischen Merkmalen Kapitel 5 Wichtige Maßzahlen für den Zusammenhang zwischen Merkmalen 5.1 Darstellung der Verteilung zweidimensionaler Merkmale 5.2 Maßzahlen für den Zusammenhang zweier nominaler Merkmale 5.3 Maßzahlen

Mehr

Inhaltsverzeichnis. Teil 1 Basiswissen und Werkzeuge, um Statistik anzuwenden

Inhaltsverzeichnis. Teil 1 Basiswissen und Werkzeuge, um Statistik anzuwenden Inhaltsverzeichnis Teil 1 Basiswissen und Werkzeuge, um Statistik anzuwenden 1 Statistik ist Spaß 3 Warum Statistik? 3 Checkpoints 4 Daten 4 Checkpoints 7 Skalen - lebenslang wichtig bei der Datenanalyse

Mehr

Zusammenhänge zwischen metrischen Merkmalen

Zusammenhänge zwischen metrischen Merkmalen Zusammenhänge zwischen metrischen Merkmalen Darstellung des Zusammenhangs, Korrelation und Regression Daten liegen zu zwei metrischen Merkmalen vor: Datenpaare (x i, y i ), i = 1,..., n Beispiel: x: Anzahl

Mehr

3. Lektion: Deskriptive Statistik

3. Lektion: Deskriptive Statistik Seite 1 von 5 3. Lektion: Deskriptive Statistik Ziel dieser Lektion: Du kennst die verschiedenen Methoden der deskriptiven Statistik und weißt, welche davon für Deine Daten passen. Inhalt: 3.1 Deskriptive

Mehr

Mathematik 2 für Naturwissenschaften

Mathematik 2 für Naturwissenschaften Hans Walser Mathematik 2 für Naturwissenschaften Modul 202 Regressionsgerade und Korrelation Lernumgebung. Teil Hans Walser: Modul 202, Regressionsgerade und Korrelation. Lernumgebung. ii Inhalt Messwertpaare...

Mehr

Inhaltsverzeichnis Grundlagen aufigkeitsverteilungen Maßzahlen und Grafiken f ur eindimensionale Merkmale

Inhaltsverzeichnis Grundlagen aufigkeitsverteilungen Maßzahlen und Grafiken f ur eindimensionale Merkmale 1. Grundlagen... 1 1.1 Grundgesamtheit und Untersuchungseinheit................ 1 1.2 Merkmal oder statistische Variable........................ 2 1.3 Datenerhebung.........................................

Mehr

Angewandte Statistik 3. Semester

Angewandte Statistik 3. Semester Angewandte Statistik 3. Semester Übung 5 Grundlagen der Statistik Übersicht Semester 1 Einführung ins SPSS Auswertung im SPSS anhand eines Beispieles Häufigkeitsauswertungen Grafiken Statistische Grundlagen

Mehr

Einführung in die Statistik

Einführung in die Statistik Elmar Klemm Einführung in die Statistik Für die Sozialwissenschaften Westdeutscher Verlag INHALTSVERZEICHNIS 1. Einleitung und Begrifflichkeiten 11 1.1 Grundgesamtheit, Stichprobe 12 1.2 Untersuchungseinheit,

Mehr

Inhaltsverzeichnis. Inhalt Teil I: Beschreibende (Deskriptive) Statistik Seite. 1.0 Erste Begriffsbildungen Merkmale und Skalen 5

Inhaltsverzeichnis. Inhalt Teil I: Beschreibende (Deskriptive) Statistik Seite. 1.0 Erste Begriffsbildungen Merkmale und Skalen 5 Inhaltsverzeichnis Inhalt Teil I: Beschreibende (Deskriptive) Statistik Seite 1.0 Erste Begriffsbildungen 1 1.1 Merkmale und Skalen 5 1.2 Von der Urliste zu Häufigkeitsverteilungen 9 1.2.0 Erste Ordnung

Mehr

Geg.: Eine Menge von Elementen, z.b.

Geg.: Eine Menge von Elementen, z.b. 1.3 Zweidimensionale Häufigkeitsverteilungen Geg.: Eine Menge von Elementen, z.b. Schüler einer Schule Soldaten eines Bataillons Schrauben einer Stichprobe Tage eines Jahrhunderts Betrachtet werden zwei

Mehr

Statistik eindimensionaler Größen

Statistik eindimensionaler Größen Statistik eindimensionaler Größen Michael Spielmann Inhaltsverzeichnis 1 Aufgabe der eindimensionalen Statistik 2 2 Grundbegriffe 2 3 Aufbereiten der Stichprobe 3 4 Die Kennzahlen Mittelwert und Streuung,

Mehr

htw saar 1 EINFÜHRUNG IN DIE STATISTIK: BESCHREIBENDE STATISTIK

htw saar 1 EINFÜHRUNG IN DIE STATISTIK: BESCHREIBENDE STATISTIK htw saar 1 EINFÜHRUNG IN DIE STATISTIK: BESCHREIBENDE STATISTIK htw saar 2 Grundbegriffe htw saar 3 Grundgesamtheit und Stichprobe Ziel: Über eine Grundgesamtheit (Population) soll eine Aussage über ein

Mehr

Übungsblatt 4. Berechnen Sie für die statistischen Reihen die Varianzen, Kovarianzen und Korrelationskoeffizienten

Übungsblatt 4. Berechnen Sie für die statistischen Reihen die Varianzen, Kovarianzen und Korrelationskoeffizienten Aufgabe 1: Übungsblatt 4 Berechnen Sie für die statistischen Reihen die Varianzen, Kovarianzen und Korrelationskoeffizienten a) s 2 X, s 2 Y, sz, 2 s 2 U, s 2 V, s 2 W, s 2 T b) c XY, c Y Z c) c ZU, c

Mehr

Teil / Ein paar statistische Grundlagen 25. Kapitel 1 Was Statistik ist und Warum sie benötigt Wird 2 7

Teil / Ein paar statistische Grundlagen 25. Kapitel 1 Was Statistik ist und Warum sie benötigt Wird 2 7 Inhaltsverzeichnis Einführung 21 Über dieses Buch 21 Törichte Annahmen über den Leser 22 Wie dieses Buch aufgebaut ist 23 Teil I: Ein paar statistische Grundlagen 23 Teil II: Die beschreibende Statistik

Mehr

Die folgende Tabelle 1 wurde im Rahmen einer Umfrage unter den Studenten eines Statistikseminars erstellt.

Die folgende Tabelle 1 wurde im Rahmen einer Umfrage unter den Studenten eines Statistikseminars erstellt. Nr. Die folgende Tabelle wurde im Rahmen einer Umfrage unter den Studenten eines Statistikseminars erstellt. Gewicht (x i ) Raucher Geschlecht Lieblingssportart Ausübung des Sports Geld pro Monat Klassenmitte

Mehr

Zusammenhangsanalyse mit SPSS. Messung der Intensität und/oder der Richtung des Zusammenhangs zwischen 2 oder mehr Variablen

Zusammenhangsanalyse mit SPSS. Messung der Intensität und/oder der Richtung des Zusammenhangs zwischen 2 oder mehr Variablen - nominal, ordinal, metrisch In SPSS: - Einfache -> Mittelwerte vergleichen -> Einfaktorielle - Mehrfaktorielle -> Allgemeines lineares Modell -> Univariat In SPSS: -> Nichtparametrische Tests -> K unabhängige

Mehr

WISTA WIRTSCHAFTSSTATISTIK

WISTA WIRTSCHAFTSSTATISTIK WISTA WIRTSCHAFTSSTATISTIK PROF. DR. ROLF HÜPEN FAKULTÄT FÜR WIRTSCHAFTSWISSENSCHAFT Seminar für Theoretische Wirtschaftslehre Vorlesungsprogramm 02.07.2013 Theorie der Indexzahlen 1. Konstruktion von

Mehr

Modul 11: Zur gemeinsamen Analyse mehrerer Merkmale. Prof. Dr. W. Laufner Beschreibende Statistik

Modul 11: Zur gemeinsamen Analyse mehrerer Merkmale. Prof. Dr. W. Laufner Beschreibende Statistik Zur gemeinsamen nalyse mehrerer Merkmale 1 ei einer empirischen Untersuchung werden i.. mehrere Merkmale gemessen, d.h., z..,, Z, usw. ei der ersten Datenauswertung werden die Daten einer univariaten nalyse

Mehr

Lösungsvorschläge zur Klausur Beschreibende Statistik und Wirtschaftsstatistik (Sommersemester 2013)

Lösungsvorschläge zur Klausur Beschreibende Statistik und Wirtschaftsstatistik (Sommersemester 2013) Lösungsvorschläge zur Klausur Beschreibende Statistik und Wirtschaftsstatistik (Sommersemester 203) Aufgabe (9 Punkte) Ein metrisches Merkmal X sei in einer Grundgesamtheit vom Umfang n = 200 diskret klassiert.

Mehr

ELEMENTARE EINFÜHRUNG IN DIE MATHEMATISCHE STATISTIK

ELEMENTARE EINFÜHRUNG IN DIE MATHEMATISCHE STATISTIK DIETER RASCH ELEMENTARE EINFÜHRUNG IN DIE MATHEMATISCHE STATISTIK MIT 53 ABBILDUNGEN UND 111 TABELLEN ZWEITE, BERICHTIGTE UND ERWEITERTE AUFLAGE s-~v VEB DEUTSCHER VERLAG DER WISSENSCHAFTEN BERLIN 1970

Mehr

Einführung in die Statistik für Politikwissenschaftler Sommersemester 2011

Einführung in die Statistik für Politikwissenschaftler Sommersemester 2011 Einführung in die Statistik für Politikwissenschaftler Sommersemester 2011 Es können von den Antworten alle, mehrere oder keine Antwort(en) richtig sein. Nur bei einer korrekten Antwort (ohne Auslassungen

Mehr

Serie 1 Serie 2 Serie 3 Serie 4 Serie 5 Serie 6. Statistik-Tutorium. Lösungsskizzen Übung SS2005. Thilo Klein. Grundstudium Sommersemester 2008

Serie 1 Serie 2 Serie 3 Serie 4 Serie 5 Serie 6. Statistik-Tutorium. Lösungsskizzen Übung SS2005. Thilo Klein. Grundstudium Sommersemester 2008 Serie 1 Serie 2 Serie 3 Serie 4 Serie 5 Serie 6 Lösungsskizzen Übung SS2005 Grundstudium Sommersemester 2008 Serie 1 Serie 2 Serie 3 Serie 4 Serie 5 Serie 6 Inhalt Serie 1 Serie 2 Serie 3 Serie 4 Serie

Mehr

Beschreibende Statistik

Beschreibende Statistik Gunther Bourier Beschreibende Statistik Praxisorientierte Einfuhrung Mit Aufgaben und Losungen 7., uberarbeitete Auflage GABIER Inhaltsverzeichnis Vorwort Inhaltsverzeichnis V VII 1 Einfuhrung 1 1.1 Begriff

Mehr

Statistik K urs SS 2004

Statistik K urs SS 2004 Statistik K urs SS 2004 3.Tag Grundlegende statistische Maße Mittelwert (mean) Durchschnitt aller Werte Varianz (variance) s 2 Durchschnittliche quadrierte Abweichung aller Werte vom Mittelwert >> Die

Mehr

Aufgabe 1. Studiensemester Anzahl Studierende 1. Semester Semester Semester Semester Semester 5 6.

Aufgabe 1. Studiensemester Anzahl Studierende 1. Semester Semester Semester Semester Semester 5 6. Aufgabe 1 Als sogenanntes Nachzügler-Phänomen wird im Bachelorstudium das Phänomen bezeichnet, dass zwar der Großteil der Studierenden die Pflichtkurse in ähnlicher Abfolge der Semester belegt, aber es

Mehr

Günther Bourier. Beschreibende Statistik. Praxisorientierte Einführung - Mit. Aufgaben und Lösungen. 12., überarbeitete und aktualisierte Auflage

Günther Bourier. Beschreibende Statistik. Praxisorientierte Einführung - Mit. Aufgaben und Lösungen. 12., überarbeitete und aktualisierte Auflage i Günther Bourier Beschreibende Statistik Praxisorientierte Einführung - Mit Aufgaben und Lösungen 12., überarbeitete und aktualisierte Auflage 4^ Springer Gabler Inhaltsverzeichnis Vorwort V 1 Einführung

Mehr

Die Beziehung zwischen ordinal skalierten Variablen

Die Beziehung zwischen ordinal skalierten Variablen Die Beziehung zwischen ordinal skalierten Variablen Schüler Englisch Deutsch a 5 5 b 4 besser 4 besser Konkordante Paare: Die Untersuchungseinheiten können im Hinblick auf X und Y dieselbe Rangordnung

Mehr

Deskriptive Statistik

Deskriptive Statistik Helge Toutenburg Christian Heumann Deskriptive Statistik Eine Einführung in Methoden und Anwendungen mit R und SPSS Siebte, aktualisierte und erweiterte Auflage Mit Beiträgen von Michael Schomaker 4ü Springer

Mehr

5 Beschreibung und Analyse empirischer Zusammenhänge

5 Beschreibung und Analyse empirischer Zusammenhänge 5 Beschreibung und Analyse empirischer Zusammenhänge 132 5 Beschreibung und Analyse empirischer Zusammenhänge 5.1 Zusammenhänge zwischen kategorialen Merkmalen 137 5.1.1 Kontingenztabellen 137 Verteilungen

Mehr

Statistik Klausur Wintersemester 2013/2014 Hamburg, BITTE LESERLICH IN DRUCKBUCHSTABEN AUSFÜLLEN!

Statistik Klausur Wintersemester 2013/2014 Hamburg, BITTE LESERLICH IN DRUCKBUCHSTABEN AUSFÜLLEN! Statistik 1 2. Klausur Wintersemester 2013/2014 Hamburg, 18.03.2014 BITTE LESERLICH IN DRUCKBUCHSTABEN AUSFÜLLEN! Nachname:............................................................................ Vorname:.............................................................................

Mehr

Einführung in die Statistik

Einführung in die Statistik Einführung in die Statistik Analyse und Modellierung von Daten Von Prof. Dr. Rainer Schlittgen 4., überarbeitete und erweiterte Auflage Fachbereich Materialwissenschaft! der Techn. Hochschule Darmstadt

Mehr

(a) Richtig, die Varianz ist eine Summe quadratischer Größen.

(a) Richtig, die Varianz ist eine Summe quadratischer Größen. Aufgabe Welche der folgenden Aussagen sind richtig? (a) Richtig, die Varianz ist eine Summe quadratischer Größen. (b) Falsch, die Abweichung ordinaler Merkmale vom Median ist nicht definiert - also auch

Mehr

Tabellarische und graphie Darstellung von univariaten Daten

Tabellarische und graphie Darstellung von univariaten Daten Part I Wrums 1 Motivation und Einleitung Motivation Satz von Bayes Übersetzten mit Paralleltext Merkmale und Datentypen Skalentypen Norminal Ordinal Intervall Verältnis Merkmalstyp Diskret Stetig Tabellarische

Mehr

Erwerbstätige laut Mikrozensus - Alle Wirtschaftszweige

Erwerbstätige laut Mikrozensus - Alle Wirtschaftszweige - Alle Wirtschaftszweige - Alle Wirtschaftszweige, 2000 36.604 20.680 15.924 100,0 56,5 43,5 2001 36.816 20.629 16.187 100,0 56,0 44,0 2002 36.536 20.336 16.200 100,0 55,7 44,3 2003 36.172 19.996 16.176

Mehr

Deskriptive Statistik

Deskriptive Statistik Dr. T. Deutler Seminar für Statistik UIVERSITÄT MAHEIM Beispiele, Tabellen, Grafiken und Formeln zur Veranstaltung Deskriptive Statistik Übersichtsschema Merkmalarten Merkmalart qualitativ quantitativ

Mehr

Weitere Lagemaße: Quantile/Perzentile I

Weitere Lagemaße: Quantile/Perzentile I 3 Auswertung von eindimensionalen Daten Lagemaße 3.3 Weitere Lagemaße: Quantile/Perzentile I Für jeden Median x med gilt: Mindestens 50% der Merkmalswerte sind kleiner gleich x med und ebenso mindestens

Mehr

Deskriptive Statistik Auswertung durch Informationsreduktion

Deskriptive Statistik Auswertung durch Informationsreduktion Deskriptive Statistik Auswertung durch Informationsreduktion Gliederung Ø Grundbegriffe der Datenerhebung Total-/Stichprobenerhebung, qualitatives/quantitatives Merkmal Einteilung der Daten (Skalierung,

Mehr

Mathematik für Biologen

Mathematik für Biologen Mathematik für Biologen Prof. Dr. Rüdiger W. Braun Heinrich-Heine-Universität Düsseldorf 21. Oktober 2010 1 Datenpaare Korrelation Lineare Regression Regression im exponentiellen Modell Datenpaare Häufig

Mehr