Kapitel VII - Konzentration von Merkmalswerten

Ähnliche Dokumente
Deskriptive Statistik Kapitel VII - Konzentration von Merkmalswerten

WISTA WIRTSCHAFTSSTATISTIK

Beispiel 9 (Einige Aufgaben und Illustrationen zur Lorenzkurve, Teil 2)

Wirtschaftsstatistik. Konzentrations- und Disparitätsmessung

3. Quintil. 2. Quintil

Statistik I für Betriebswirte Vorlesung 2

Wahrscheinlichkeits - rechnung und Statistik

Bivariate Analyse: Gemeinsame (bivariate) Häufigkeitstabelle. Sie wird auch Kontingenz-, Assoziations- oder Korrelationstabelle (f b )genannt.

Kapitel XIII - p-wert und Beziehung zwischen Tests und Konfidenzintervallen

WISTA WIRTSCHAFTSSTATISTIK

3. Deskriptive Statistik

8. Statistik Beispiel Noten. Informationsbestände analysieren Statistik

4. Kumulierte Häufigkeiten und Quantile

Anwendung A_0801_Quantile_Minimum_Maximum

Verteilungen und ihre Darstellungen

Lage- und Streuungsparameter

1) Warum ist die Lage einer Verteilung für das Ergebnis einer statistischen Analyse von Bedeutung?

Statistik eindimensionaler Größen

Deskriptive Statistik Kapitel IX - Kontingenzkoeffizient

Kapitel XII - Kennzahlen mehrdimensionaler Zufallsvariablen

3 Häufigkeitsverteilungen

Statistik. Ludwig Fahrmeir Rita Künstler Iris Pigeot Gerhard Tutz. Der Weg zur Datenanalyse. Springer. Zweite, verbesserte Auflage

WISTA WIRTSCHAFTSSTATISTIK

Kapitel VI - Lage- und Streuungsparameter

Wahrscheinlichkeitsrechnung und Statistik

absolute Häufigkeit h: Anzahl einer bestimmten Note relative Häufigkeit r: Anzahl einer bestimmten Note, gemessen an der Gesamtzahl der Noten

Kapitel XII - Gleichmäßig beste unverfälschte Tests und Tests zur Normalverteilung

Klausur zu Methoden der Statistik I (mit Kurzlösung) Wintersemester 2007/2008. Aufgabe 1

Statistik. Datenanalyse mit EXCEL und SPSS. R.01denbourg Verlag München Wien. Von Prof. Dr. Karlheinz Zwerenz. 3., überarbeitete Auflage

Kapitel XII - Einführung in die Zeitreihenanalyse

1 Verteilungen und ihre Darstellung

Lösung Aufgabe 19. ( ) = [Mio Euro]. Empirische Varianz s 2 = 1 n

Herzlich willkommen zur Vorlesung Statistik. Streuungsmaße oder die Unterschiedlichkeit der Daten nebst kurzen Ausführungen zu Schiefe und Wölbung

Statistik. Datenanalyse mit EXCEL und SPSS. Prof. Dr. Karlheinz Zwerenz. R.Oldenbourg Verlag München Wien. Von

Beschreibung von Daten

Verteilungsfunktion und dquantile

Ruhr-Universität Bochum

1. Maße der zentralen Tendenz Beispiel: Variable Anzahl der Geschwister aus Jugend '92. Valid Cum Value Frequency Percent Percent Percent

Statistik I. Hinweise zur Bearbeitung. Aufgabe 1

Übungen Teil 1: Weltbevölkerung, Armut, ICT, Lorenzkurve & Gini, Equity. Die Besprechung dieses Übungsblattes findet am Mittwoch, den

Statistik - Übungsaufgaben

Musterlösung zur Aufgabensammlung Statistik I Teil 3

Beispiel 2 (Einige Aufgaben zu Lageparametern) Aufgabe 1 (Lageparameter)

Lineare Funktionen. Klasse 8 Aufgabenblatt für Lineare Funktionen Datum: Donnerstag,

3.2 Streuungsmaße. 3 Lage- und Streuungsmaße 133. mittlere Variabilität. geringe Variabilität. große Variabilität

Funktion Das Skript erstellt ROC-Kurven mit Konfidenzbändern, berechnet (gewichtete) Cutoff-Punkte und (partial) Area under the Curve (AUC, pauc).

Deskriptive Statistik 1 behaftet.

Thema: Mittelwert einer Häufigkeitsverteilung. Welche Informationen kann der Mittelwert geben?

Brückenkurs Statistik für Wirtschaftswissenschaften

Parameter von Häufigkeitsverteilungen

4 Konzentrationsmessung

Statistik im Versicherungs- und Finanzwesen

Die Summen- bzw. Differenzregel

Kapitel III - Merkmalsarten

Bestimmen von Quantilen

Veranstaltung Statistik (BWL) an der FH Frankfurt/Main im WS 2004/05 (Dr. Faik) Klausur GRUPPE B - BEARBEITER/IN (NAME, VORNAME):

Statistik Testverfahren. Heinz Holling Günther Gediga. Bachelorstudium Psychologie. hogrefe.de

1 Goldener Schnitt Pascalsches Dreieck Der Binomische Lehrsatz ( ) ß mit a multipliziert. ( a+ b) 4 = a 3 +3a 2 b+3ab 2 + b 3

Tipps und Tricks für die Abschlussprüfung

Anpassungstests VORGEHENSWEISE

Unterrichtsreihe zur Parabel

3 Lage- und Streuungsmaße

Inhaltsverzeichnis: Aufgaben zur Vorlesung Statistik Seite 1 von 10 Prof. Dr. Karin Melzer, Prof. Dr. Gabriele Gühring, Fakultät Grundlagen

Lösungen zu Janssen/Laatz, Statistische Datenanalyse mit SPSS 1

Zusammenhangsanalyse in Kontingenztabellen

Kapitel VIII - Tests zum Niveau α

Vektorgeometrie. 1. Vektoren eingeben, Norm, Skalarprodukt. 2 In einem kartesischen Koordinatensystem sind die Vektoren. , v. und. gegeben.

Korrespondenzanalyse

1,11 1,12 1,13 1,14 1,15 1,16 1,17 1,17 1,17 1,18

Willkommen zur Vorlesung Statistik

825 e 290 e 542 e 945 e 528 e 486 e 675 e 618 e 170 e 500 e 443 e 608 e. Zeichnen Sie das Box-Plot. Sind in dieser Stichprobe Ausreißer vorhanden?

Segregation. Sozialstruktur SoSe2013

Harry Potter und die Kammer des Schreckens : m, s, g, a, a, a, sg, g, a, g, m, m, g, g, sg, s, a, a, a, g, a, a, g, g, a

Wolf-Gert Matthäus, Jörg Schulze. Statistik mit Excel. Beschreibende Statistik für jedermann. 3./ überarbeitete und erweiterte Auflage.

Häufigkeitsauszählungen, zentrale statistische Kennwerte und Mittelwertvergleiche

Pocket Cards (Winning Probabilities) 6.1 Anzahl der Kombinationen Monte Carlo Simulation Ergebnisse 6

Unterlagen für die Lehrkraft Zentrale Klausur am Ende der Einführungsphase 2011 Mathematik

Kapitel 2. Häufigkeitsverteilungen

WISTA WIRTSCHAFTSSTATISTIK

I. Deskriptive Statistik 1

Statistik I für Wirtschaftswissenschaftler Klausur am ,

Lineare Funktionen Auftrag 1: Bearbeitung mit dem GTR (grafikfähigen Taschenrechner)

Kapitel 1: Deskriptive Statistik

Dr. I. Fahrner WiSe 2016/17 Fakultät Grundlagen Hochschule Esslingen Übungsblatt 2. Statistik

Assoziation & Korrelation

Anteile Häufigkeiten Verteilungen Lagemaße Streuungsmaße Merkmale von Verteilungen. Anteile Häufigkeiten Verteilungen

Übungsaufgaben zu Kapitel 2 und 3

Assoziation & Korrelation

Mecklenburg - Vorpommern

Fachrechnen für Tierpfleger

Klausur Wirtschaftsmathematik ( ) Name: Vorname: Matrikelnummer: Themengebiete:

Kapitel V - Erwartungstreue Schätzfunktionen

MATHEMATIK Grundkurs 11m3 2010

Chi-Quadrat Verfahren

Oberstufe (11, 12, 13)

Inhaltsverzeichnis. Inhalt Teil I: Beschreibende (Deskriptive) Statistik Seite. 1.0 Erste Begriffsbildungen Merkmale und Skalen 5

Chi Quadrat-Unabhängigkeitstest

Zufallsgröße. Würfelwurf mit fairem Würfel. Wahrscheinlichkeitsverteilung einer diskreten

Deskriptive Statistik Kapitel III - Merkmalsarten

Hinweis: Es sind 4 aus 6 Aufgaben zu bearbeiten. Werden mehr als 4 Aufgaben bearbeitet, werden nur die ersten vier Aufgaben gewertet.

Transkript:

Institut für Volkswirtschaftslehre (ECON) Lehrstuhl für Ökonometrie und Statistik Kapitel VII - Konzentration von Merkmalswerten Deskriptive Statistik Prof. Dr. W.-D. Heller Hartwig Senska Carlo Siebenschuh

Agenda 1 Einleitung 2 Lorenzkurve 3 Gini-Koeffizient 4 Weitere Konzentrationsmaße Kapitel VII - Konzentration von Merkmalswerten 2

Einleitung Bei vielen Verteilungen sind Lage- und Streuungsparameter für die Analyse einer Häufigkeitsverteilung nicht ausreichend. Beispiel 7.1 Bei einer Einkommensverteilung ist neben dem arithmetischen Mittel, also dem durchschnittlichen Einkommen, ein Streuungsparameter, z.b. die Standardabweichung, von Bedeutung, die etwas über die Abweichung vom mittleren Einkommen aussagt. Die Standardabweichung ist allerdings nicht genügend aussagekräftig, da die Verteilung in der Regel nicht symmetrisch ist. Es kann z. B. viele mit geringeren Einkommen als dem Durchschnittseinkommen und einige wenige mit wesentlich höheren Einkommen geben. Das Ziel ist es diese Ungleichheit in der Verteilung der Einkommen mit Hilfe eines aussagekräftigen Maßes sichtbar und damit vergleichbar zu machen. Kapitel VII - Konzentration von Merkmalswerten 3

Einleitung Bei vielen Verteilungen sind Lage- und Streuungsparameter für die Analyse einer Häufigkeitsverteilung nicht ausreichend. Beispiel 7.1 Bei einer Einkommensverteilung ist neben dem arithmetischen Mittel, also dem durchschnittlichen Einkommen, ein Streuungsparameter, z.b. die Standardabweichung, von Bedeutung, die etwas über die Abweichung vom mittleren Einkommen aussagt. Die Standardabweichung ist allerdings nicht genügend aussagekräftig, da die Verteilung in der Regel nicht symmetrisch ist. Es kann z. B. viele mit geringeren Einkommen als dem Durchschnittseinkommen und einige wenige mit wesentlich höheren Einkommen geben. Das Ziel ist es diese Ungleichheit in der Verteilung der Einkommen mit Hilfe eines aussagekräftigen Maßes sichtbar und damit vergleichbar zu machen. Kapitel VII - Konzentration von Merkmalswerten 3

Einleitung Ziel: Beschreibung, graphische Darstellung und Messung von Ungleichheiten z.b. bei der Verteilung von Besitz Gegeben: Besitz -Verteilung in Form einer nichtnegativen geordneten Urliste 0 x (1) x (2)... x (n) Gesamtbesitz: Positive Merkmalssumme x = n x (i) > 0 i=1 Kapitel VII - Konzentration von Merkmalswerten 4

Einleitung Ziel: Beschreibung, graphische Darstellung und Messung von Ungleichheiten z.b. bei der Verteilung von Besitz Gegeben: Besitz -Verteilung in Form einer nichtnegativen geordneten Urliste 0 x (1) x (2)... x (n) Gesamtbesitz: Positive Merkmalssumme x = n x (i) > 0 i=1 Kapitel VII - Konzentration von Merkmalswerten 4

Einleitung Ziel: Beschreibung, graphische Darstellung und Messung von Ungleichheiten z.b. bei der Verteilung von Besitz Gegeben: Besitz -Verteilung in Form einer nichtnegativen geordneten Urliste 0 x (1) x (2)... x (n) Gesamtbesitz: Positive Merkmalssumme x = n x (i) > 0 i=1 Kapitel VII - Konzentration von Merkmalswerten 4

Einleitung Frage: Wie ist die Merkmalssumme auf die n Personen verteilt? Extremfälle: Alle besitzen gleich viel. Einer besitzt alles. Kapitel VII - Konzentration von Merkmalswerten 5

Einleitung Frage: Wie ist die Merkmalssumme auf die n Personen verteilt? Extremfälle: Alle besitzen gleich viel. Einer besitzt alles. Kapitel VII - Konzentration von Merkmalswerten 5

Agenda 1 Einleitung 2 Lorenzkurve 3 Gini-Koeffizient 4 Weitere Konzentrationsmaße Kapitel VII - Konzentration von Merkmalswerten 6

Lorenzkurve Wichtigstes graphisches Hilfsmittel zur Verdeutlichung von Konzentrationsphänomenen. Ausgegangen wird dabei von einer geordneten nichtnegativen statistischen Reihe mit positiver Summe der Beobachtungswerte (Merkmalssumme) n 0 x (1) x (2)... x (n), x = x (i) > 0 i=1 Prinzip: Gegenüberstellung des und des Anteils an der statistischen Masse Anteils an der Merkmalssumme der k statistischen Einheiten mit den kleinsten Merkmalswerten Kapitel VII - Konzentration von Merkmalswerten 7

Lorenzkurve Wichtigstes graphisches Hilfsmittel zur Verdeutlichung von Konzentrationsphänomenen. Ausgegangen wird dabei von einer geordneten nichtnegativen statistischen Reihe mit positiver Summe der Beobachtungswerte (Merkmalssumme) n 0 x (1) x (2)... x (n), x = x (i) > 0 i=1 Prinzip: Gegenüberstellung des und des Anteils an der statistischen Masse Anteils an der Merkmalssumme der k statistischen Einheiten mit den kleinsten Merkmalswerten Kapitel VII - Konzentration von Merkmalswerten 7

Lorenzkurve Anteil an der Merkmalssumme, der auf die k statistischen Einheiten mit den kleinsten Merkmalswerten (x (1),..., x (k) ) entfällt: k v k = x (i) i=1 n i=1 = x (1) +... + x (k) x x (1) +... + x (n) (i) Anteil an der gesamten statistischen Masse: u k = k n Kapitel VII - Konzentration von Merkmalswerten 8

Lorenzkurve Anteil an der Merkmalssumme, der auf die k statistischen Einheiten mit den kleinsten Merkmalswerten (x (1),..., x (k) ) entfällt: k v k = x (i) i=1 n i=1 = x (1) +... + x (k) x x (1) +... + x (n) (i) Anteil an der gesamten statistischen Masse: u k = k n Kapitel VII - Konzentration von Merkmalswerten 8

Lorenzkurve Damit steht also dem Anteil u k an der statistischen Masse ein Anteil v k an der Merkmalssumme gegenüber. Für k = 1,..., n trägt man die Punkte (u k, v k ) in ein Koordinatenkreuz ein und verbindet sie durch einen Streckenzug, beginnend mit dem Ursprung (0,0): Kapitel VII - Konzentration von Merkmalswerten 9

Lorenzkurve Anteil an der Merkmalssumme 1 (u n, v n) = (1, 1) (u 2, v 2 ) (u 1, v 1 ) (u 3, v 3 ) 0 1 Anteil an der statistischen Masse Abbildung - Lorenzkurve. Kapitel VII - Konzentration von Merkmalswerten 10

Lorenzkurve Beispiel 7.1 Die geordnete statistische Reihe der Monatslöhne in einem mittleren Handwerksbetrieb laute wie folgt in Euro: 500, 1900, 2050, 2200, 2250, 2400, 2600, 2950, 4000, 5000. Merkmalssumme ist: 25850. Damit erhält man folgende Tabelle: u k 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1.0 v k 0.02 0.09 0.17 0.26 0.34 0.44 0.54 0.65 0.81 1.0 Und die folgende Lorenzkurve... Kapitel VII - Konzentration von Merkmalswerten 11

Lorenzkurve Beispiel 7.1 Die geordnete statistische Reihe der Monatslöhne in einem mittleren Handwerksbetrieb laute wie folgt in Euro: 500, 1900, 2050, 2200, 2250, 2400, 2600, 2950, 4000, 5000. Merkmalssumme ist: 25850. Damit erhält man folgende Tabelle: u k 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1.0 v k 0.02 0.09 0.17 0.26 0.34 0.44 0.54 0.65 0.81 1.0 Und die folgende Lorenzkurve... Kapitel VII - Konzentration von Merkmalswerten 11

Lorenzkurve Beispiel 7.1 Die geordnete statistische Reihe der Monatslöhne in einem mittleren Handwerksbetrieb laute wie folgt in Euro: 500, 1900, 2050, 2200, 2250, 2400, 2600, 2950, 4000, 5000. Merkmalssumme ist: 25850. Damit erhält man folgende Tabelle: u k 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1.0 v k 0.02 0.09 0.17 0.26 0.34 0.44 0.54 0.65 0.81 1.0 Und die folgende Lorenzkurve... Kapitel VII - Konzentration von Merkmalswerten 11

Lorenzkurve Beispiel 7.1 Die geordnete statistische Reihe der Monatslöhne in einem mittleren Handwerksbetrieb laute wie folgt in Euro: 500, 1900, 2050, 2200, 2250, 2400, 2600, 2950, 4000, 5000. Merkmalssumme ist: 25850. Damit erhält man folgende Tabelle: u k 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1.0 v k 0.02 0.09 0.17 0.26 0.34 0.44 0.54 0.65 0.81 1.0 Und die folgende Lorenzkurve... Kapitel VII - Konzentration von Merkmalswerten 11

Lorenzkurve Kapitel VII - Konzentration von Merkmalswerten 12

Lorenzkurve Eigenschaften der Lorenzkurve: Die Lorenzkurve beginnt in (0,0) und endet in (1,1). Die Lorenzkurve verläuft nirgendwo oberhalb der Diagonalen. Die Lorenzkurve steigt monoton. Die Lorenzkurve ist konvex. Kapitel VII - Konzentration von Merkmalswerten 13

Lorenzkurve Eigenschaften der Lorenzkurve: Die Lorenzkurve beginnt in (0,0) und endet in (1,1). Die Lorenzkurve verläuft nirgendwo oberhalb der Diagonalen. Die Lorenzkurve steigt monoton. Die Lorenzkurve ist konvex. Kapitel VII - Konzentration von Merkmalswerten 13

Lorenzkurve Eigenschaften der Lorenzkurve: Die Lorenzkurve beginnt in (0,0) und endet in (1,1). Die Lorenzkurve verläuft nirgendwo oberhalb der Diagonalen. Die Lorenzkurve steigt monoton. Die Lorenzkurve ist konvex. Kapitel VII - Konzentration von Merkmalswerten 13

Lorenzkurve Eigenschaften der Lorenzkurve: Die Lorenzkurve beginnt in (0,0) und endet in (1,1). Die Lorenzkurve verläuft nirgendwo oberhalb der Diagonalen. Die Lorenzkurve steigt monoton. Die Lorenzkurve ist konvex. Kapitel VII - Konzentration von Merkmalswerten 13

Lorenzkurve Eigenschaften der Lorenzkurve: Die Lorenzkurve beginnt in (0,0) und endet in (1,1). Die Lorenzkurve verläuft nirgendwo oberhalb der Diagonalen. Die Lorenzkurve steigt monoton. Die Lorenzkurve ist konvex. Kapitel VII - Konzentration von Merkmalswerten 13

Lorenzkurve Anmerkung: Die Diagonale ist die Bezugskurve zur Lorenzkurve. Sind nämlich alle Beobachtungswerte gleich...... so ist für k = 1,..., n v k = 0 < x 1 = x 2 =... = x n, k x i i=1 n i=1 x i = k x 1 n x 1 = k n = u k. Kapitel VII - Konzentration von Merkmalswerten 14

Die Diagonale gibt also den Zustand wieder, in dem die Merkmalssumme völlig gleichmäßig über die Masse verteilt ist ( Gleichverteilung der Merkmalssumme ). Aus der Sicht der Konzentration der Idealzustand ohne jegliche Konzentration. Dem Idealzustand der Gleichverteilung entgegengesetzt ist der Extremfall, dass die gesamte Merkmalssumme in einer statistischen Einheit vereint ist: 0 = x (1) =... = x (n 1) < x (n). Kapitel VII - Konzentration von Merkmalswerten 15

Die Diagonale gibt also den Zustand wieder, in dem die Merkmalssumme völlig gleichmäßig über die Masse verteilt ist ( Gleichverteilung der Merkmalssumme ). Aus der Sicht der Konzentration der Idealzustand ohne jegliche Konzentration. Dem Idealzustand der Gleichverteilung entgegengesetzt ist der Extremfall, dass die gesamte Merkmalssumme in einer statistischen Einheit vereint ist: 0 = x (1) =... = x (n 1) < x (n). Kapitel VII - Konzentration von Merkmalswerten 15

Lorenzkurve Kapitel VII - Konzentration von Merkmalswerten 16

Lorenzkurve Weitere Anmerkung: Für großes n, also viele statistische Einheiten, erhält man bei vollständiger Konzentration nahezu die Katheden des rechtwinkligen Dreiecks mit den Eckpunkten (0,0), (1,0), (1,1). Interpretation der Lorenzkurve: Je weiter die Lorenzkurve von der Diagonalen entfernt ist, je mehr die Lorenzkurve also durchhängt, desto größer ist die Konzentration. Kapitel VII - Konzentration von Merkmalswerten 17

Lorenzkurve Weitere Anmerkung: Für großes n, also viele statistische Einheiten, erhält man bei vollständiger Konzentration nahezu die Katheden des rechtwinkligen Dreiecks mit den Eckpunkten (0,0), (1,0), (1,1). Interpretation der Lorenzkurve: Je weiter die Lorenzkurve von der Diagonalen entfernt ist, je mehr die Lorenzkurve also durchhängt, desto größer ist die Konzentration. Kapitel VII - Konzentration von Merkmalswerten 17

Lorenzkurve Beispiel 7.2 Gegeben ist die Häufigkeitsverteilung a 1 2 3 h(a) 2 3 1 p(a) 0. 3 0.5 0.1 6 Geordnete Urliste ist dann: 1, 1, 2, 2, 2, 3; Merkmalssumme ist 11. Damit erhält man die Koordinaten der Lorenzkurve: u k 0 1 6 2 6 3 6 4 6 5 6 1 v k 0 1 11 2 11 4 11 6 11 8 11 1 Kapitel VII - Konzentration von Merkmalswerten 18

Lorenzkurve Beispiel 7.2 Gegeben ist die Häufigkeitsverteilung a 1 2 3 h(a) 2 3 1 p(a) 0. 3 0.5 0.1 6 Geordnete Urliste ist dann: 1, 1, 2, 2, 2, 3; Merkmalssumme ist 11. Damit erhält man die Koordinaten der Lorenzkurve: u k 0 1 6 2 6 3 6 4 6 5 6 1 v k 0 1 11 2 11 4 11 6 11 8 11 1 Kapitel VII - Konzentration von Merkmalswerten 18

Lorenzkurve Beispiel 7.2 Gegeben ist die Häufigkeitsverteilung a 1 2 3 h(a) 2 3 1 p(a) 0. 3 0.5 0.1 6 Geordnete Urliste ist dann: 1, 1, 2, 2, 2, 3; Merkmalssumme ist 11. Damit erhält man die Koordinaten der Lorenzkurve: u k 0 1 6 2 6 3 6 4 6 5 6 1 v k 0 1 11 2 11 4 11 6 11 8 11 1 Kapitel VII - Konzentration von Merkmalswerten 18

Lorenzkurve Abbildung: Abbildung 7.4 - Lorenzkurve zu Beispiel 7.2 Kapitel VII - Konzentration von Merkmalswerten 19

Anmerkung: Man sieht, dass übereinstimmende Merkmalswerte zu Geradenstücken gleicher Steigung führen. Es genügt also, die Werte für k = 2 und k = 5 zu berechnen. Kapitel VII - Konzentration von Merkmalswerten 20

Lorenzkurve Ermittlung der Lorenzkurve aus der absoluten Häufigkeitsverteilung Merkmalssumme: x = a M a h(a) Zur Berechnung der Koordinaten sind die Merkmalsausprägungen zu ordnen: 0 a 1 < a 2 <... < a m. Kapitel VII - Konzentration von Merkmalswerten 21

Lorenzkurve Ermittlung der Lorenzkurve aus der absoluten Häufigkeitsverteilung Merkmalssumme: x = a M a h(a) Zur Berechnung der Koordinaten sind die Merkmalsausprägungen zu ordnen: 0 a 1 < a 2 <... < a m. Kapitel VII - Konzentration von Merkmalswerten 21

Lorenzkurve Ermittlung der Lorenzkurve aus der absoluten Häufigkeitsverteilung Anteil der k niedrigsten Merkmalsausprägungen an der Merkmalssumme: k a i h(a i ) i=1 v k = a h(a) a M Anteil dieser Merkmalsausprägungen an der statistischen Masse: u k = k h(a i ) h(a) i=1 a M Kapitel VII - Konzentration von Merkmalswerten 22

Lorenzkurve Ermittlung der Lorenzkurve aus der absoluten Häufigkeitsverteilung Anteil der k niedrigsten Merkmalsausprägungen an der Merkmalssumme: k a i h(a i ) i=1 v k = a h(a) a M Anteil dieser Merkmalsausprägungen an der statistischen Masse: u k = k h(a i ) h(a) i=1 a M Kapitel VII - Konzentration von Merkmalswerten 22

Lorenzkurve Beispiel 7.3 Im Beispiel 7.2 erhält man die notwendigen Koordinaten der Lorenzkurve u k 0 2 6 5 6 1 v k 0 2 11 8 11 1 Anmerkung: Der Unterschied besteht darin, dass hierbei lediglich die Knickstellen der Lorenzkurve berechnet werden. Kapitel VII - Konzentration von Merkmalswerten 23

Lorenzkurve Beispiel 7.3 Im Beispiel 7.2 erhält man die notwendigen Koordinaten der Lorenzkurve u k 0 2 6 5 6 1 v k 0 2 11 8 11 1 Anmerkung: Der Unterschied besteht darin, dass hierbei lediglich die Knickstellen der Lorenzkurve berechnet werden. Kapitel VII - Konzentration von Merkmalswerten 23

Lorenzkurve Ermittlung der Lorenzkurve aus der relativen Häufigkeitsverteilung Anteil der k niedrigsten Merkmalsausprägungen an der Merkmalssumme: k a i p(a i ) i=1 v k = a p(a) a M Anteil dieser Merkmalsausprägungen an der statistischen Masse: u k = k p(a i ) i=1 Kapitel VII - Konzentration von Merkmalswerten 24

Lorenzkurve Ermittlung der Lorenzkurve aus der relativen Häufigkeitsverteilung Anteil der k niedrigsten Merkmalsausprägungen an der Merkmalssumme: k a i p(a i ) i=1 v k = a p(a) a M Anteil dieser Merkmalsausprägungen an der statistischen Masse: u k = k p(a i ) i=1 Kapitel VII - Konzentration von Merkmalswerten 24

Lorenzkurve Beispiel 7.4 In Beispiel 7.2 erhält man und damit v 1 = 1 3 11 6 3 i=1 a i p(a i ) = 1 1 3 + 2 1 2 + 3 1 6 = 11 6 = 2 11, v 2 = ( 1 3 + 1) 11 = 8 11, v 3 = 1 wie in Beispiel 7.3. 6 Kapitel VII - Konzentration von Merkmalswerten 25

Lorenzkurve Beispiel 7.4 In Beispiel 7.2 erhält man und damit v 1 = 1 3 11 6 3 i=1 a i p(a i ) = 1 1 3 + 2 1 2 + 3 1 6 = 11 6 = 2 11, v 2 = ( 1 3 + 1) 11 = 8 11, v 3 = 1 wie in Beispiel 7.3. 6 Kapitel VII - Konzentration von Merkmalswerten 25

Lorenzkurve Ermittlung der Lorenzkurve bei klassierten Merkmalen Weder u k noch v k können gebildet werden. Seien I j die Klassen und h(i j ) bzw. p(i j ) die absoluten bzw. relativen Häufigkeiten. Die Klasse I hat damit den relativen Anteil p(i) = h(i) n an der statistischen Masse. Seien also die Klassen I 1,..., I m nach ihren Klassengrenzen geordnet, dann kann man statt u 1,..., u n die folgenden Werte verwenden: m p(i 1 ), p(i 1 ) + p(i 2 ),..., p(i j ) j=1 Kapitel VII - Konzentration von Merkmalswerten 26

Lorenzkurve Ermittlung der Lorenzkurve bei klassierten Merkmalen Der Anteil an der Merkmalssumme einer Klasse I lässt sich nur anhand der Urliste oder der Häufigkeitsverteilung der unklassierten Daten feststellen. Geht man davon aus, dass die Klassenmitte z I das arithmetische Mittel der Merkmalswerte der Klasse ist, so ist z I h(i) : Merkmalssumme der Klasse I und m z j h(i j ) : j=1 Merkmalssumme der Gesamtmasse. Kapitel VII - Konzentration von Merkmalswerten 27

Lorenzkurve Ermittlung der Lorenzkurve bei klassierten Merkmalen Der Anteil an der Merkmalssumme einer Klasse I lässt sich nur anhand der Urliste oder der Häufigkeitsverteilung der unklassierten Daten feststellen. Geht man davon aus, dass die Klassenmitte z I das arithmetische Mittel der Merkmalswerte der Klasse ist, so ist z I h(i) : Merkmalssumme der Klasse I und m z j h(i j ) : j=1 Merkmalssumme der Gesamtmasse. Kapitel VII - Konzentration von Merkmalswerten 27

Lorenzkurve Ermittlung der Lorenzkurve bei klassierten Merkmalen Punkte der Lorenzkurve für absolute Häufigkeiten: k z k j h(i j ) j=1 (u k, v k ) = p(i j ), m für k = 0,..., m j=1 z j h(i j ) j=1 Punkte der Lorenzkurve für relative Häufigkeiten: k z k j p(i j ) j=1 (u k, v k ) = p(i j ), m für k = 0,..., m j=1 z j p(i j ) j=1 Kapitel VII - Konzentration von Merkmalswerten 28

Lorenzkurve Ermittlung der Lorenzkurve bei klassierten Merkmalen Punkte der Lorenzkurve für absolute Häufigkeiten: k z k j h(i j ) j=1 (u k, v k ) = p(i j ), m für k = 0,..., m j=1 z j h(i j ) j=1 Punkte der Lorenzkurve für relative Häufigkeiten: k z k j p(i j ) j=1 (u k, v k ) = p(i j ), m für k = 0,..., m j=1 z j p(i j ) j=1 Kapitel VII - Konzentration von Merkmalswerten 28

Lorenzkurve Beispiel 7.5 Für eine Verbrauchsstudie wurden die Nettojahreseinkommen von 100 Männern festgestellt: Männer Einkommen in TEuro abs. H. rel. H. u k z j h(i j ) zj h(i j ) v k 0 bis unter 10 5 0.05 0.05 25 25 0.008 10 bis unter 20 15 0.15 0.20 225 250 0.085 20 bis unter 25 20 0.20 0.40 450 700 0.237 25 bis unter 30 25 0.25 0.65 687.5 1387.5 0.470 30 bis unter 40 20 0.20 0.85 700 2087.5 0.708 40 bis unter 60 10 0.10 0.95 500 2587.5 0.877 60 bis unter 85 5 0.05 1 362.5 2950 1 100 1 Kapitel VII - Konzentration von Merkmalswerten 29

Lorenzkurve Kapitel VII - Konzentration von Merkmalswerten 30

Agenda 1 Einleitung 2 Lorenzkurve 3 Gini-Koeffizient 4 Weitere Konzentrationsmaße Kapitel VII - Konzentration von Merkmalswerten 31

Gini-Koeffizient Anteil der Fläche zwischen der Diagonalen und der Lorenzkurve an Gesamtfläche unterhalb der Diagonalen. Er ist ein Maß für die Konzentration, die eben gerade der Abweichung der Lorenzkurve von der Diagonalen entspricht. G = Fläche zwischen Diagonale D und Lorenzkurve L Fläche zwischen Diagonale D und u-achse Kapitel VII - Konzentration von Merkmalswerten 32

F i (u i+1,v i+1) (u i,v i ) u i u i+1 Abbildung 7.6 - Zur Berechnung des Gini-Koeffizienten Kapitel VII - Konzentration von Merkmalswerten 33

Gini-Koeffizient Berechnung des Gini-Koeffizienten Für F i gilt F i = (u i+1 u i ) ( u i v i 2 + u i+1 v i+1 ), 2 da F i (um 90 o gedreht) ein Trapez ist, mit der Höhe u i+1 u i und der Mittellinie 0.5((u i v i ) + (u i+1 v i+1 )). Kapitel VII - Konzentration von Merkmalswerten 34

Gini-Koeffizient Berechnung des Gini-Koeffizienten Für F i gilt F i = (u i+1 u i ) ( u i v i 2 + u i+1 v i+1 ), 2 da F i (um 90 o gedreht) ein Trapez ist, mit der Höhe u i+1 u i und der Mittellinie 0.5((u i v i ) + (u i+1 v i+1 )). Kapitel VII - Konzentration von Merkmalswerten 34

Gini-Koeffizient Damit ist G = n 1 1 2 (u i+1 u i )(u i v i +u i+1 v i+1 ) i=0 1 = n 1 2 i=0 (u i+1 u i )(u i v i + u i+1 v i+1 ) Setzt man die Daten aus der geordneten Urliste ein, so erhält man nach einigem Rechenaufwand G = n n 2 i x (i) (n + 1) x (i) i=1 i=1. n n x (i) i=1 Kapitel VII - Konzentration von Merkmalswerten 35

Gini-Koeffizient Damit ist G = n 1 1 2 (u i+1 u i )(u i v i +u i+1 v i+1 ) i=0 1 = n 1 2 i=0 (u i+1 u i )(u i v i + u i+1 v i+1 ) Setzt man die Daten aus der geordneten Urliste ein, so erhält man nach einigem Rechenaufwand G = n n 2 i x (i) (n + 1) x (i) i=1 i=1. n n x (i) i=1 Kapitel VII - Konzentration von Merkmalswerten 35

Gini-Koeffizient Beispiel 7.6 (1) In Beispiel 7.1 erhält man: G = 1 (2 0.08 + 2 0.11 + 2 0.13 + 2 0.14 + 2 0.16 + 2 0.16 + 10 +2 0.16 + 2 0.15 + 2 0.09) = 2 1.18 = 0.236. 10 Nach der zweiten Formel erhält man: G = 2 172700 11 25850 10 25850 = 0.236. Kapitel VII - Konzentration von Merkmalswerten 36

Gini-Koeffizient Beispiel 7.6 (1) In Beispiel 7.1 erhält man: G = 1 (2 0.08 + 2 0.11 + 2 0.13 + 2 0.14 + 2 0.16 + 2 0.16 + 10 +2 0.16 + 2 0.15 + 2 0.09) = 2 1.18 = 0.236. 10 Nach der zweiten Formel erhält man: G = 2 172700 11 25850 10 25850 = 0.236. Kapitel VII - Konzentration von Merkmalswerten 36

Gini-Koeffizient Beispiel 7.6 (1) In Beispiel 7.1 erhält man: G = 1 (2 0.08 + 2 0.11 + 2 0.13 + 2 0.14 + 2 0.16 + 2 0.16 + 10 +2 0.16 + 2 0.15 + 2 0.09) = 2 1.18 = 0.236. 10 Nach der zweiten Formel erhält man: G = 2 172700 11 25850 10 25850 = 0.236. Kapitel VII - Konzentration von Merkmalswerten 36

Gini-Koeffizient Beispiel 7.6 (2) Aus den Daten von Beispiel 7.2 bzw. 7.3 erhält man: G = 2 ( 2 6 6 2 ) + 3 ( 2 11 6 6 + 5 6 2 11 8 11 = 2 6 10 66 + 3 6 17 66 + 1 6 7 66 = 78 6 66 = 13 66 = 0.20. (3) Für die Einkommensverteilung der Männer lautet der Gini-Koeffizient: ) + 1 ( 5 6 6 + 1 8 ) 11 1 G = 0.05 0.042 + 0.15 0.157 + 0.2 0.278 + 0.25 0.343 + 0.2 0.322 + 0.1 0.215 + 0.05 0.073 = 0.257. Kapitel VII - Konzentration von Merkmalswerten 37

Gini-Koeffizient Beispiel 7.6 (2) Aus den Daten von Beispiel 7.2 bzw. 7.3 erhält man: G = 2 ( 2 6 6 2 ) + 3 ( 2 11 6 6 + 5 6 2 11 8 11 = 2 6 10 66 + 3 6 17 66 + 1 6 7 66 = 78 6 66 = 13 66 = 0.20. (3) Für die Einkommensverteilung der Männer lautet der Gini-Koeffizient: ) + 1 ( 5 6 6 + 1 8 ) 11 1 G = 0.05 0.042 + 0.15 0.157 + 0.2 0.278 + 0.25 0.343 + 0.2 0.322 + 0.1 0.215 + 0.05 0.073 = 0.257. Kapitel VII - Konzentration von Merkmalswerten 37

Gini-Koeffizient Betrachte: Der Maximalwert des Gini-Koeffizienten ist für 0 = x (1) =... = x (n 1), x (n) = n i=1 x (i) nach der zweiten Formel G max = 2 n x (n) (n + 1) x (n) = n 1 n x (n) n Bei einer Maßzahl geht man üblicherweise von einem Maximalwert 1 aus. Aus diesem Grund normiert man den Ginikoeffizienten. Kapitel VII - Konzentration von Merkmalswerten 38

Gini-Koeffizient Betrachte: Der Maximalwert des Gini-Koeffizienten ist für 0 = x (1) =... = x (n 1), x (n) = n i=1 x (i) nach der zweiten Formel G max = 2 n x (n) (n + 1) x (n) = n 1 n x (n) n Bei einer Maßzahl geht man üblicherweise von einem Maximalwert 1 aus. Aus diesem Grund normiert man den Ginikoeffizienten. Kapitel VII - Konzentration von Merkmalswerten 38

Gini-Koeffizient Normierter Gini-Koeffizient Es gilt und G norm = n n 1 G. 0 G norm 1 G norm = 1 bei vollständiger Konzentration, G norm = 0 bei gleichmäßiger Verteilung der Merkmalssumme. Kapitel VII - Konzentration von Merkmalswerten 39

Gini-Koeffizient Normierter Gini-Koeffizient Es gilt und G norm = n n 1 G. 0 G norm 1 G norm = 1 bei vollständiger Konzentration, G norm = 0 bei gleichmäßiger Verteilung der Merkmalssumme. Kapitel VII - Konzentration von Merkmalswerten 39

Gini-Koeffizient Normierter Gini-Koeffizient Es gilt und G norm = n n 1 G. 0 G norm 1 G norm = 1 bei vollständiger Konzentration, G norm = 0 bei gleichmäßiger Verteilung der Merkmalssumme. Kapitel VII - Konzentration von Merkmalswerten 39

Gini-Koeffizient Kritikpunkte Unterschiedliche Lorenzkurven können zu dem selben Gini-Koeffizienten führen. Es besteht eine starke Abhängigkeit des Gini-Koeffizienten von der Zahl der einbezogenen statistischen Einheiten. Weglassen von kleinen Merkmalswerten verringert G. Der Gini-Koeffizient ist nur ein Maß für die relative Konzentration, nicht für die absolute Konzentration. Kapitel VII - Konzentration von Merkmalswerten 40

Gini-Koeffizient Kritikpunkte Unterschiedliche Lorenzkurven können zu dem selben Gini-Koeffizienten führen. Es besteht eine starke Abhängigkeit des Gini-Koeffizienten von der Zahl der einbezogenen statistischen Einheiten. Weglassen von kleinen Merkmalswerten verringert G. Der Gini-Koeffizient ist nur ein Maß für die relative Konzentration, nicht für die absolute Konzentration. Kapitel VII - Konzentration von Merkmalswerten 40

Gini-Koeffizient Kritikpunkte Unterschiedliche Lorenzkurven können zu dem selben Gini-Koeffizienten führen. Es besteht eine starke Abhängigkeit des Gini-Koeffizienten von der Zahl der einbezogenen statistischen Einheiten. Weglassen von kleinen Merkmalswerten verringert G. Der Gini-Koeffizient ist nur ein Maß für die relative Konzentration, nicht für die absolute Konzentration. Kapitel VII - Konzentration von Merkmalswerten 40

Gini-Koeffizient Beispiel 7.7 Die Messung der Wettbewerbskonzentration mit Hilfe des Gini-Koeffizienten auf zwei verschiedenen Märkten ergibt den selben Wert, obwohl die Märkte nicht identisch sind: G = 0 für zwei Firmen mit je 50% Marktanteil G = 0 für 20 Firmen mit je 5% Marktanteil Kapitel VII - Konzentration von Merkmalswerten 41

Gini-Koeffizient Beispiel 7.7 Die Messung der Wettbewerbskonzentration mit Hilfe des Gini-Koeffizienten auf zwei verschiedenen Märkten ergibt den selben Wert, obwohl die Märkte nicht identisch sind: G = 0 für zwei Firmen mit je 50% Marktanteil G = 0 für 20 Firmen mit je 5% Marktanteil Kapitel VII - Konzentration von Merkmalswerten 41

Gini-Koeffizient Beispiel 7.7 Die Messung der Wettbewerbskonzentration mit Hilfe des Gini-Koeffizienten auf zwei verschiedenen Märkten ergibt den selben Wert, obwohl die Märkte nicht identisch sind: G = 0 für zwei Firmen mit je 50% Marktanteil G = 0 für 20 Firmen mit je 5% Marktanteil Kapitel VII - Konzentration von Merkmalswerten 41

Gini-Koeffizient Kapitel VII - Konzentration von Merkmalswerten 42

Agenda 1 Einleitung 2 Lorenzkurve 3 Gini-Koeffizient 4 Weitere Konzentrationsmaße Kapitel VII - Konzentration von Merkmalswerten 43

Weitere Konzentrationsmaße Konzentrationskoeffizient CR g = n x (i) i=n g+1 n x (i) i=1 für g = (1, 2, )3,..., n CR g gibt an, welchen Anteil der Merkmalssumme die g letzten Merkmalswerte der geordneten statistischen Reihe in sich vereinen. Die Vorgehensweise entspricht der Konstruktion der Lorenzkurve, wobei die geordnete Urliste von rechts nach links, also in umgekehrter Reihenfolge abgearbeitet wird. Die zugehörige Kurve wird üblicherweise als Paretokurve bezeichnet. Kapitel VII - Konzentration von Merkmalswerten 44

Weitere Konzentrationsmaße Konzentrationskoeffizient CR g = n x (i) i=n g+1 n x (i) i=1 für g = (1, 2, )3,..., n CR g gibt an, welchen Anteil der Merkmalssumme die g letzten Merkmalswerte der geordneten statistischen Reihe in sich vereinen. Die Vorgehensweise entspricht der Konstruktion der Lorenzkurve, wobei die geordnete Urliste von rechts nach links, also in umgekehrter Reihenfolge abgearbeitet wird. Die zugehörige Kurve wird üblicherweise als Paretokurve bezeichnet. Kapitel VII - Konzentration von Merkmalswerten 44

Weitere Konzentrationsmaße Konzentrationskoeffizient CR g = n x (i) i=n g+1 n x (i) i=1 für g = (1, 2, )3,..., n CR g gibt an, welchen Anteil der Merkmalssumme die g letzten Merkmalswerte der geordneten statistischen Reihe in sich vereinen. Die Vorgehensweise entspricht der Konstruktion der Lorenzkurve, wobei die geordnete Urliste von rechts nach links, also in umgekehrter Reihenfolge abgearbeitet wird. Die zugehörige Kurve wird üblicherweise als Paretokurve bezeichnet. Kapitel VII - Konzentration von Merkmalswerten 44

Weitere Konzentrationsmaße Abbildung: Paretokurve zu Beispiel 7.8 Kapitel VII - Konzentration von Merkmalswerten 45

Weitere Konzentrationsmaße Herfindahl-Index H := i=1 n x i n x i i=1 2 H ist die Summe der quadrierten individuellen Anteile an der Merkmalssumme. Je größer H ist, desto größer ist die Konzentration. Kapitel VII - Konzentration von Merkmalswerten 46