Formelsammlung zur Statistik I Prof. Dr. Rolf Hüpen Prof. Dr. Manfred Lösch Fakultät für Wirtschaftswissenschaft
Inhaltsverzeichnis 1 Deskriptive Statistik 3 1.1 Datenlagen................................ 3 1.2 Quantile.................................. 5 1.3 Mittelwerte................................ 6 1.4 Streuungsmaße.............................. 9 1.5 Konzentrationsmaße........................... 10 1.6 Korrelationskoeffizienten......................... 12 1.7 Lineare Einfachregression......................... 13 1.8 Grundbegriffe der Zeitreihenanalyse................... 14 1.9 Zeitliche Veränderungszahlen....................... 16 1.10 Wachstumsmodelle............................ 19 1.11 Elastizitäten................................ 22 1.12 Indexzahlen................................ 23 1
1 Deskriptive Statistik 1.1 Datenlagen 1.1.1 Datenlage A n beobachtete Merkmalswerte liegen als Urliste x 1,..., x n vor. 1.1.2 Datenlage B Es liegen zu m von einander verschiedenen Merkmalsausprägungen x 1,..., x m die zugehörigen absoluten Häufigkeiten h 1,..., h m (h i 0) ihres Auftretens vor. n := h 1 +... + h m erhoben worden ist. ist die Anzahl der Merkmalsträger, bei denen das Merkmal f i := h i n heißt relative Häufigkeit der i-ten Ausprägung x i. H i := h 1 +... + h i heißt kumulierte absolute Häufigkeit und F i := f 1 +... + f i = 1 n (h 1 +... + h i ) = 1 n H i heißt kumulierte relative Häufigkeit. Häufigkeitstabelle: Merkmals- Häufigkeit kumulierte Häufigkeit i ausprägung absolut relativ absolut relativ 1 x 1 h 1 f 1 = h 1 /n H 1 F 1 2 x 2 h 2 f 2 = h 2 /n H 2 F 2...... m x m h m f m = h m /n H m = n F m = 1 n = m 1 = m h i f i 3
1 Deskriptive Statistik Empirische Verteilungsfunktion: 0, x < x 1 F (x) := F i, x i x < x i+1, i = 1,..., m 1 1, x m x 1.1.3 Datenlage C Es liegen vor k Klassen G 1 = [a 0, a 1 ),..., G k = [a k 1, a k ) mit der Breite i := a i a i 1 > 0 für alle i = 1,..., k, sowie die absoluten Häufigkeiten h 1,..., h k in den k Klassen. n := h 1 +...+h k ist die Anzahl der Merkmalsträger, bei denen das Merkmal erhoben worden ist. f i := h i n relative Häufigkeit zur Klasse G i, H i := h 1 +... + h i kumulierte absolute Häufigkeit zur Klasse G i und F i := f 1 +... + f i = 1 n H i kumulierte relative Häufigkeit Häufigkeitstabelle: Klasse Grenzen Mittel- Breite Häufigkeit kumulierte punkt absolut relativ relative H.keit G 1 [a 0, a 1 ) x 1 1 = a 1 a 0 h 1 f 1 = h 1 /n F 1 G 2 [a 1, a 2 ) x 2 2 = a 2 a 1 h 2 f 2 = h 2 /n F 2....... G k [a k 1, a k ) x k k = a k a k 1 h k f k = h k /n F k = 1 n = k 1 = k h i f i Approximierende empirische Verteilungsfunktion: ˆF (x) := 0, x < a 0 F i 1 + f i (x a i 1 ) i, a i 1 x < a i, i = 1,..., k 1, a k x Histogramm: Darstellung der Häufigkeiten unter Beachtung der Flächenproportionalität der Balken. Die Höhe des Rechtecks über der Klasse G i = [a i 1, a i ) wird wie folgt bestimmt: 4
1.2 Quantile Höhe g i := h i i bei absoluten Häufigkeiten Höhe d i := f i i bei relativen Häufigkeiten g i heißt absolute Häufigkeitsdichte d i heißt relative Häufigkeitsdichte 1.2 Quantile 1.2.1 Definition des p-quantils Zu 0 < p < 1 heißt x p p-quantil, falls sich unterhalb von x p höchstens 100 p % und oberhalb von x p höchstens 100 (1 p) % der Beobachtungswerte befinden. 0.25-Quantil := Q 1 := unteres Quartil 0.50-Quantil := Q 2 := mittleres Quartil oder Median 0.75-Quantil := Q 3 := oberes Quartil 1.2.2 Datenlage A: x p = { x([np+1]), np nicht ganzzahlig 1 (x 2 ([np]) + x ([np+1]) ), np ganzzahlig, wobei [α] := größte ganze Zahl, die kleiner oder gleich α ist und x (i) den i-ten Beobachtungswert in der geordneten Urliste x (1) x (2)... x (n) bezeichnet. 1.2.3 Datenlage B: wobei F 0 := 0 gesetzt wird. { xi, falls F i 1 < p < F i x p = 1 (x, 2 i + x i+1 ), falls p = F i 5
1 Deskriptive Statistik 1.2.4 Datenlage C: x p wird angenähert als Lösung der Gleichung ˆF ( x p ) = p mit der approximierenden empirischen Verteilungsfunktion ˆF berechnet. Man bestimme zunächst die Klasse G i = [a i 1, a i ) mit F i 1 < p F i, (F 0 := 0), und setze dann x p a i 1 + p F i 1 F i F i 1 (a i a i 1 ). Liegen absolute Häufigkeiten vor, bestimme man die Klasse G i H i 1 < n p H i, (H 0 := 0), und setze dann = [a i 1, a i ) mit x p a i 1 + n p H i 1 H i H i 1 (a i a i 1 ). 1.3 Mittelwerte 1.3.1 Datenlage A: Modus := häufigster Beobachtungswert Median := mittleres Quartil = 0.50-Quantil arithmetisches Mittel (AM): AM := 1 x i n harmonisches Mittel (HM): HM := n 1 x i geometrisches Mittel (GM): GM := n n x i 6
1.3 Mittelwerte 1.3.2 Datenlage B: Modus := Merkmalsausprägung mit der größten absoluten oder relativen Häufigkeit Median := x i, falls F i 1 < 0.5 < F i 1 2 (x i + x i+1 ), falls 0.5 = F i Gewichtetes arithmetisches Mittel (GAM): GAM := 1 m m m h i x i = f i x i h i Gewichtetes harmonisches Mittel (GHM): GHM := m h i ( ) = m hi 1 ( ) m fi x i x i Gewichtetes geometrisches Mittel (GGM): ( m ) m 1/ h i GGM := x h i i = n m x h i i 1.3.3 Datenlage C: Modus (Verfahren 1): Quadratische Interpolation in der modalen (häufigsten) Gruppe. Man bestimmt die modale Klasse G i, d.h. die Klasse G i = [a i 1, a i ) mit der größten Häufigkeitsdichte g i := h i /(a i a i 1 ) und legt ein quadratisches Polynom f(x) = ax 2 + bx + c durch die Punkte mit den Koordinaten (x i 1 ; g i 1 ), (x i ; g i ), (x i+1 ; g i+1 ), wobei x i 1, x i, x i+1 die Mittelpunkte der Klassen G i 1, G i, G i+1 bezeichnen. Die Stelle x 0, für die f(x) das Maximum annimmt, wird als Modus gewählt. 7
1 Deskriptive Statistik Modus (Verfahren 2): Näherungslösung für Verfahren 1 Man bestimmt wie beim Verfahren 1 die modale Klasse G i und berechnet Modus = a i(h i h i 1 ) + a i 1 (h i h i+1 ) (h i h i 1 ) + (h i h i+1 ) Bei unterschiedlichen Klassenbreiten sind in der obigen Formel die absoluten Häufigkeitsdichten g i anstelle von h i zu verwenden. Median: Man bestimme die Klasse G i = [a i 1, a i ) mit F i 1 < 0.5 F i. In diese Klasse G i fällt der Median. Eine Feinberechnung x des Medians läßt sich unter der Annahme der Gleichverteilung in den Klassen wie folgt durchführen: x = a i 1 + 0.5 F i 1 F i F i 1 (a i a i 1 ) = a i 1 + (0.5 F i 1 ) i f i Liegen absolute Häufigkeiten vor, bestimmt man die Klasse G i H i 1 < n H 2 i und approximiert den Median mit = [a i 1, a i ) mit x = a i 1 + 0.5 n H i 1 H i H i 1 (a i a i 1 ) = a i 1 + (0.5 n H i 1 ) i h i. Arithmetisches, harmonisches und geometrisches Mittel werden wie bei der Datenlage B in Form der gewichteten Mittel GAM, GHM und GGM mit Hilfe der Klassenmitten berechnet. 1.3.4 Allgemeine Aussagen für Mittelwerte x i = c für alle i = 1,..., n Modus = Median = AM = HM = GM HM < GM < AM, falls x i nicht konstant Lageregel von Fechner: Modus Median AM Modus Median AM Modus = Median = AM bei einer linkssteilen Verteilung bei einer rechtssteilen Verteilung bei einer symmetrischen Verteilung 8
1.4 Streuungsmaße 1.4 Streuungsmaße Normierte Entropie (E Norm ) für Datenlage B: E Norm = { 1 log(n) 1 log(m) n } m [ h i log(h i ) ] = ( ) m 1 f i log f i log(m) mit h i log h i = f i log( 1 f i ) := 0 für h i = f i = 0 Spannweite R:= Max - Min Quartilsabstand := Q 3 Q 1 Mittlere Spannweite (MSP): MSP := ( Q 2 Min 100 ; Max Q ) 2 100 Q 2 Q 2 Mittlerer Quartilsabstand (MQA): MQA := ( Q 2 Q 1 100 ; Q ) 3 Q 2 100 Q 2 Q 2 Mittlere quadratische Abweichung (s 2 ): Datenlage A: Datenlage B: Datenlage C: s 2 := 1 n s 2 := 1 n s 2 := 1 n (x i AM) 2 m h i (x i GAM) 2 k h i (x i GAM) 2 Standardabweichung (s): Variationskoeffizient (V): V := s AM s := + s 2 100 (in %) 9
1 Deskriptive Statistik 1.5 Konzentrationsmaße 1.5.1 Lorenzkurve 1.5.1.1 Datenlage A Gegeben: geordnete Urliste der n Beobachtungswerte: x (1) x (2)... x (n) Merkmalssumme: S = n x (i) Kumulierte relative Häufigkeit: F i = i n Kumulierter Anteil an der Merkmalssumme: G i = i x (j) j=1 S Dann entsteht die Lorenzkurve in einem F-G-Koordinatensystem als Streckenzug, der die Punkte (0, 0), (F 1, G 1 ), (F 2, G 2 ),..., (F n 1, G n 1 ), (1, 1) miteinander verbindet. 1.5.1.2 Datenlage B Gegeben: m voneinander verschiedene mögliche Merkmalsausprägungen x 1 < x 2 <... < x m mit den absoluten Häufigkeiten h 1, h 2,..., h m. Anzahl der Merkmalsträger: n = m h i mit m n Kumulierte relative Häufigkeiten: F i = i h j j=1 n Merkmalssumme: S = m (h i x i ) Kumulierter Anteil an der Merkmalssumme: G i = i (h j x j ) j=1 S Dann entsteht die Lorenzkurve in einem F-G-Koordinatensystem als Streckenzug, der die Punkte (0, 0), (F 1, G 1 ), (F 2, G 2 ),..., (F m 1, G m 1 ), (1, 1) miteinander verbindet. 10
1.5 Konzentrationsmaße 1.5.1.3 Datenlage C Die Merkmalsausprägungen sind in k Klassen i = 1, 2,..., k eingeteilt. Grenzen der Klasse i: [ a i 1, a i ) Mittelpunkt der Klasse i: x i = a i 1 + a i 2 Anzahl der Merkmalsträger in Klasse i: h i Gesamtzahl der Merkmalsträger: n = k h i mit k < n Kumulierte relative Häufigkeiten: F i = Näherungswert für die Merkmalssumme: i h j j=1 n Ŝ = k (h i x i ) Näherungswert für den kumulierten Anteil an der Merkmalssumme: Ĝ i = i (h j x j ) j=1 Ŝ Dann entsteht die Lorenzkurve in einem F-G-Koordinatensystem als Streckenzug, der die Punkte (0, 0), (F 1, Ĝ1), (F 2, Ĝ2),..., (F k 1, Ĝk 1), (1, 1) miteinander verbindet. 1.5.2 Gini-Koeffizient Berechnung der Fläche L unter der Lorenzkurve: Datenlage A: L = 1 2n (G i 1 + G i ), wobei G 0 = 0 gesetzt wird. Datenlage B: L = 1 m (G 2n i 1 + G i ) h i, wobei G 0 = 0 gesetzt wird. Datenlage C: L = 1 2n k (Ĝi 1 + Ĝi) h i, wobei Ĝ 0 = 0 gesetzt wird. Daraus erhält man den Gini-Koeffizienten: C G = 1 2 L 11
1 Deskriptive Statistik 1.6 Korrelationskoeffizienten Es liegen n Beobachtungen (x i, y i ), i = 1,..., n, vor. 1.6.1 Korrelationskoeffizient von Fechner wobei r F = Ü N Ü + N Ü : Anzahl der in den Vorzeichen übereinstimmenden Paare (x i x, y i ȳ) N : Anzahl der in den Vorzeichen nicht übereinstimmenden Paare (x i x, y i ȳ) 1.6.2 Korrelationskoeffizient von Bravais-Pearson r = = (x i x)(y i ȳ) (x i x) 2 n (y i ȳ) 2 [n n n n x i y i n x i y i x 2 i ( n x i ) 2 ] [n n yi 2 ( n y i ) 2 ] 1.6.3 Korrelationskoeffizient von Spearman (Rangkorrelationskoeffizient) mit r Sp = 1 6 n d 2 i n(n 2 1) d i := Differenz der Rangzahlen der Beobachtungen x i und y i 12
1.7 Lineare Einfachregression 1.7 Lineare Einfachregression Bei Vorliegen der Werte (x i, y i ), i = 1,..., n, mit x i c für alle i = 1,..., n lauten die Regressionskoeffizienten a und b für die Regressionsgleichung y i = a + bx i : b = (x i x)(y i ȳ) = (x i x) 2 n n x i y i n x i n n x 2 i ( n x i ) 2 y i und a = ȳ b x. mit x := 1 x n i und ȳ := 1 y n i. Der Quotient heißt Determinationskoeffizient. d := (yi ȳ) 2 (y i ȳ) 2 Es gilt: d = r 2 r = b sx s y, wobei s x := 1 n (x i x) 2 und s y = 1 n (y i ȳ) 2 13
1 Deskriptive Statistik 1.8 Grundbegriffe der Zeitreihenanalyse Es liegen n Zeitreihenwerte x 1,..., x n vor. Für die den Zeitindizes t zugeordneten Beobachtungswerte x t soll gelten x t = T t + Z t + S t + R t (additive Verknüpfung) wobei T t : Trendkomponente (beschreibt die monotone langfristige Entwicklung) Z t : zyklische Komponente (beschreibt den Konjunkturverlauf) G t = T t + Z t : glatte Komponente (Zusammenfassung von Trend und zyklischer Komponente) S t : Saisonkomponente (beschreibt die saisonale Abweichung von Trendkomponente und zyklischer Komponente) R t : irreguläre Komponente (Restkomponente; beschreibt den Teil der Beobachtungen, den T t, Z t und S t nicht beschreiben) 1.8.1 Trendbestimmung mit der Methode der kleinsten Quadrate Nach der Methode der kleinsten Quadrate ergibt sich für die Trendkomponente die Schätzung = a + b t mit T t b = n n tx t n t n x t t=1 t=1 t=1 n n t 2 ( n und a = 1 t) 2 n t=1 t=1 t=1 x t b 1 n t t=1 t = 1 n t=1 2 n(n + 1) und t 2 = 1 n(n + 1)(2n + 1) t=1 6 14
1.8 Grundbegriffe der Zeitreihenanalyse 1.8.2 Trendbestimmung mit der Methode der Reihenhälften Fall 1: Die Anzahl der vorhandenen Zeitreihenwerte ist gerade n = 2n. Reihenhälften x 1,..., x n und x n +1,..., x n x (1) = n 1 n t=1 T t = a + b t mit x t und x (2) = 1 n x t t=n +1 b = x (2) x (1) n und a = x (1) b n + 1 2 Fall 2: Die Anzahl der vorhandenen Zeitreihenwerte ist ungerade n = 2n + 1. Mittleren Wert x n +1 weglassen. Weiteres Vorgehen analog zu Fall 1. 1.8.3 Reihenglättung mit Hilfe gleitender Durchschnitte Für die Berechnung der gleitenden Durchschnitte werden die Beobachtungen des Stützbereichs [t m; t + m] herangezogen. 1. Anzahl der herangezogenen Beobachtungen: 2m + 1 x t = 1 2m + 1 t+m x i i=t m 2. Anzahl der herangezogenen Beobachtungen: 5 x t = 1 4 ( 1 2 x t 2 + x t 1 + x t + x t+1 + 1 2 x t+2 ) 3. Anzahl der herangezogenen Beobachtungen: 13 x t = 1 12 ( 1 2 x t 6 + x t 5 +... + x t +... + x t+5 + 1 2 x t+6 ) 15
1 Deskriptive Statistik 1.9 Zeitliche Veränderungszahlen Gegeben sind Zeitreihenwerte x 0, x 1,..., x n, die in zeitlich gleichen Abständen erhoben worden sind. 1.9.1 Messzahlen m b,t := x t x b = Messzahlen genügen folgenden Bedingungen: Identitätsprobe : m t,t = 1 Zeitumkehrprobe : m b,t m t,b = 1 Rundprobe : m 1,2 m 2,3 m t 1,t = m 1,t Proportionalitätsprobe : r m b,t = r x t x b Wert im Berichtsjahr t Wert im Basisjahr b Sind m x b,t, m y b,t und mz b,t Messzahlen zu den Zeitreihenwerten x i, y i, z i, i = 0,..., n, dann genügen die obigen Messzahlen der Faktorumkehrprobe, falls m x b,t m y b,t = mz b,t. Umbasierung von Messzahlen Messzahl m b,t wird auf eine neue Basis s umgestellt: Verkettung von Messzahlen m s,t = m b,t m b,s Zwei Reihen von Messzahlen zur Basis b und zur Basis s werden zu einer langen Reihe zur Basis b zusammengefügt: m b,t = m b,s m s,t 16
1.9 Zeitliche Veränderungszahlen 1.9.2 Erste Differenzen x t = x t x t 1 x t = x t 1 + x t n x t = x n x 0 t=1 Genügen die x t -Werte dem linearen Wachstumsmodell x t = a + b x t 1, dann gilt b = x t 1.9.3 Gliedzahlen (Wachstumsfaktoren) q t := m t 1,t := x t x t 1 x t = q t x t 1 n q t = m 0,n = x n x t=1 0 1.9.4 Wachstumsraten in diskreter Zeit p t := x t x t 1 x t 1 q t = p t = q t 1 x t x t 1 = 1 + p t x t = q t x t 1 = x t 1 + p t x t 1 n Für q := n q t gilt: x n = q n x 0 t=1 p := q 1 ist die mittlere Wachstumsrate der n Wachstumsraten p 1,..., p n. Genügen die x t -Werte dem exponentiellen Wachstumsmodell in diskreter Zeit x t = a q t, t = 0,..., n, dann gilt: q t = q und p t = p = q 1 für alle t = 1,..., n. 17
1 Deskriptive Statistik 1.9.5 Wachstumsraten in stetiger Zeit b t := ln ( ) xt x t 1 x t = e bt x t 1 b = 1 b n t ist die mittlere Wachstumsrate der n stetigen Wachstumsraten t=1 b 1,..., b n. Für b gilt: x n = e b n x 0 Genügen die x t -Werte dem exponentiellen Wachstumsmodell in stetiger Zeit x t = a e b t, t = 0, 1,..., n, dann gilt b t = b für alle t = 1,..., n. 18
1.10 Wachstumsmodelle 1.10 Wachstumsmodelle 1.10.1 Lineares Wachstumsmodell x t = a + b t, t = 0, 1,..., n x n : Endwert, Prognosewert x 0 : Anfangswert, Startwert b = x t x t 1 = x t : Erste Differenz Konstante a = x 0 Prognosewert: x n = x 0 + b n Startwert: x 0 = x n b n Durchschnittswachstum (absolut): b = x n x 0 n Zeitraum: n = x n x 0 b für b 0 Sind zwei Werte x t1 berechnet werden: und x t2, t 1 t 2, gegeben, dann können a und b wie folgt a = t 2 x t1 t 1 x t2 t 2 t 1 und b = x t 2 x t1 t 2 t 1 Vervielfachungszeit t α (x tα = α x 0, α > 0): t α = (α 1) x 0 b für b 0 Verdoppelungszeit: t 2 = x 0 b für b 0 Schnittpunkt S = (t S ; x S ) zweier linearer Wachstumsfunktionen a 1 + b 1 t und a 2 + b 2 t, b 1 b 2 : t S = a 2 a 1 b 1 b 2 und x S = a 1 + b 1 t S = a 2 + b 2 t S 19
1 Deskriptive Statistik 1.10.2 Exponentielles Wachstumsmodell in diskreter Zeit x t = a q t, t = 0, 1,..., n Wachstumsrate:= x t x t 1 x t 1 =: p für alle t 1 Wachstumsfaktor x t x t 1 =: q für alle t 1 Konstante a = x 0 Es gilt q = 1 + p und p = q 1 Prognosewert: x n = x 0 q n Barwert: x 0 = x n q n Durchschnittlicher Wachstumsfaktor q: q = n x n x 0 Durchschnittswachstum p = n x n x 0 1 Zeitraum: n = ln x n ln x 0 ln q für q 1 Sind zwei Werte x t1 berechnet werden: und x t2, t 1 t 2, gegeben, dann können a und q wie folgt a = x t1 ( xt1 x t2 ) t 1 t 2 t 1 und q = ( xt2 x t1 ) 1 t 2 t 1 Vervielfachungszeit t α (x tα = α x 0, α > 0): t α = ln α ln q für q 1 Schnittpunkt S = (t S ; x S ) zweier Wachstumsfunktionen a 1 q t 1 und a 2 q t 2, q 1 q 2 : t S = ln(a 2/a 1 ) ln(q 1 /q 2 ) und x S = a 1 q t S 1 = a 2 q t S 2 20
1.10 Wachstumsmodelle 1.10.3 Exponentielles Wachstumsmodell in stetiger Zeit x t = a e b t, t = 0, 1,..., n Wachstumsrate:=ln ( x t x t 1 ) = b für alle t 1 Wachstumsfaktor Konstante a = x 0 x t x t 1 = e b für alle t 1 Prognosewert: x n = x 0 e b n Startwert: x 0 = x n e b n Durchschnittswachstum b = ln x n ln x 0 n Zeitraum: n = ln x n ln x 0 b für b 0 Sind zwei Werte x t1 und x t2, t 1 t 2, gegeben, dann können a und b wie folgt berechnet werden: t 2 ln x t1 t 1 ln x t2 a = e t 2 t 1 und b = ln x t 2 ln x t1 t 2 t 1 Vervielfachungszeit t α (x tα = α x 0, α > 0): t α = ln α b für b 0 Schnittpunkt S = (t S ; x S ) zweier Wachstumsfunktionen a 1 e b 1 t und a 2 e b 2 t, b 1 b 2 : t S = ln a 2 ln a 1 b 1 b 2 und x S = a 1 e b 1 t S = a 2 e b 2 t S Falls x t = a e b t = a qt, dann und ln ( xt x t 1 ) = b = ln q und q = e b x t x t 1 x t 1 = p = q 1 = e b 1 21
1 Deskriptive Statistik 1.11 Elastizitäten Elastizität := Wachstumsrate Teilgröße T Wachstumsrate Gesamtgröße G Vorjahresvergleich unstetiges Wachstum stetiges Wachstum (T t T t 1 )/T t 1 ln(t t /T t 1 ) (G t G t 1 )/G t 1 ln(g t /G t 1 ) Basisjahrvergleich unstetiges Wachstum stetiges Wachstum (T t T 0 )/T 0 ln(t t /T 0 ) (G t G 0 )/G 0 ln(g t /G 0 ) im Jahresdurchschnitt unstetiges Wachstum (T n /T 0 ) 1/n 1 (G n /G 0 ) 1/n 1 stetiges Wachstum ln(t n /T 0 ) ln(g n /G 0 ) 22
1.12 Indexzahlen 1.12 Indexzahlen 1.12.1 Notation t : Berichtsjahr 0 : Basisjahr n : Anzahl Güter p i (t) : Preis des Gutes i zum Zeitpunkt t q i (t) : umgesetzte Menge des Gutes i zum Zeitpunkt t 1.12.2 Preisindex von Laspeyres P L(0, t): Drei Darstellungsmöglichkeiten: 1. Mit Hilfe der allgemeinen Gewichte w i := p i (0) q i (0): P L(0, t) = 1 w i w i pi(t) p i (0) 2. Mit Hilfe der normierten Gewichte g i := w i / n w j : 3. Aggregatform (Summenform): P L(0, t) = j=1 g i pi(t) p i (0) P L(0, t) = p i (t) q i (0) p i (0) q i (0) Interpretation des Preisindexes von Laspeyres: Preisänderungsrate vom Basisjahr 0 zum Berichtsjahr t in Prozent: (P L(0, t) 1) 100 23
1 Deskriptive Statistik Inflationsrate in % im Vorjahresvergleich: P L(0, t) P L(0, t 1) P L(0, t 1) 100 Jahresdurchschnittliche Inflationsrate in % im Zeitraum t 1 bis t 2 (t 1 < t 2 ): [ P L(0, t2 ) P L(0, t 1 ) Kaufkraft, Binnenwert des Geldes: ] 1 t 2 t 1 1 P L(0, t) 1 100 Kaufkraftänderungsrate in % im Vorjahresvergleich: P L(0, t 1) P L(0, t) P L(0, t) 100 Jahresdurchschnittliche Kaufkraftänderungsrate in % im Zeitraum t 1 bis t 2 (t 1 < t 2 ): [ ] 1 P L(0, t1 t ) 2 t 1 1 100 P L(0, t 2 ) Aggregation und Zerlegung des Preisindexes von Laspeyres: n Güter, 2 Gruppen: i = 1,..., k, k + 1,..., n P L 1 (0, t) = k p i (t)q i (0) k p i (0)q i (0), P L 2 (0, t) = p i (t)q i (0) i=k+1 p i (0)q i (0) i=k+1 Normierte Gewichte der Gruppen im Basisjahr: w 1 = k p i (0)q i (0) p i (0)q i (0), w 2 = p i (0)q i (0) i=k+1 p i (0)q i (0) Dann gilt für den Gesamtindex P L(0, t): P L(0, t) = w 1 P L 1 (0, t) + w 2 P L 2 (0, t) 24
1.12 Indexzahlen 1.12.3 Preisindex von Paasche P P (0, t): Fünf Darstellungsmöglichkeiten: Mit Hilfe der fiktiven Gewichte f i (t) := p i (0) q i (t): P P (0, t) = 1 f i (t) f i (t) pi(t) p i (0) Mit Hilfe der normierten fiktiven Gewichte h i (t) := f i (t)/ n f j (t): Aggregatform (Summenform): P P (0, t) = h i (t) pi(t) p i (0) j=1 P P (0, t) = p i (t) q i (t) p i (0) q i (t) Mit Hilfe der allgemeinen Gewichte w i (t) := p i (t)q i (t): P P (0, t) = w i (t) [ ] pi (0) w i (t) p i (t) Mit Hilfe der normierten allgemeinen Gewichte g i (t) := w i (t)/ n w j (t): j=1 P P (0, t) = 1 [ ] pi (0) g i (t) p i (t) 25
1 Deskriptive Statistik 1.12.4 Mengen- und Wertindizes und Reaktionsindex Mengenindex nach Laspeyres M L(0, t): ML(0, t) := p i (0) q i (t) p i (0) q i (0) Mengenindex nach Paasche MP (0, t): MP (0, t) := p i (t) q i (t) p i (t) q i (0) Wertindex W (0, t): W (0, t) := p i (t) q i (t) p i (0) q i (0) Reaktionsindex R(0, t): R(0, t) := W (0, t) = W (0, t) [ [ 1 1 ] P L(0, t) P P (0, t) ] ML(0, t) MP (0, t) 26
1.12 Indexzahlen 1.12.5 Allgemeine Aussagen für Indizes W (0, t) = P L(0, t) MP (0, t) = P P (0, t) ML(0, t) P L(0, t) > P P (0, t) ML(0, t) > MP (0, t) W (0, t) = ML(0, t) P L(0, t) + R(0, t) Umbasierung und Verkettung von Indizes erfolgt wie bei den Messzahlen. Werden beim Preis- bzw. Mengenindex die Mengen q i bzw. Preise p i unabhängig vom Berichts- und Basisjahr gewählt, so erhält man den Preis- bzw. Mengenindex von Lowe: P Lo(0, t) := MLo(0, t) := p i (t)q i p i (0)q i p i q i (t) p i q i (0) Die geometrischen Mittel und P F (0, t) := MF (0, t) := heißen Idealindizes von Fisher. P L(0, t) P P (0, t) ML(0, t) MP (0, t) 27