WISTA WIRTSCHAFTSSTATISTIK

Ähnliche Dokumente
Kapitel XI - Korrelationsrechnung

So lösen Sie die Gleichung für den Korrelationskoeffizienten

( ), der genau auf der Geraden ( ) 2 ( ) #( ) 8. Lineare Regression. = f i. Nach der Summe der kleinsten. mx i

s xy x i x y i y s xy = 1 n i=1 y 2 i=1 x 2 s 1 n x n i Streudiagramme empirische Kovarianz x=5,5 y=7,5

Methode der kleinsten Quadrate

Statistik I Februar 2005

2.2.1 Lagemaße. Exkurs: Quantile. und n. p n

Zeitreihenanalyse. Kapitel Einführung der Zeitreihen

Mathematik 2 für Naturwissenschaften

(a) Richtig, die Varianz ist eine Summe quadratischer Größen.

Herleitung der Parameter-Gleichungen für die einfache lineare Regression

Formelsammlung. zur Klausur. Beschreibende Statistik

+ a 3 cos (3ωt) + b 3 sin (3ωt)

h i :=h a i f i = h a i n Absolute Häufigkeit: Relative Häufigkeit: h 2 h 4 h 6 :=h der Elemente mit der Ausprägung i=6 zu der Anzahl n aller Werte

Umrechnung einer tatsächlichen Häufigkeitsverteilung in eine prozentuale Häufigkeitsverteilung

Für eine n n-matrix A müssen wir die Gleichung. lösen. Falls (A λi) invertierbar ist, dann ist. Dann ist aber λ kein Eigenwert.

Diesen Grenzwert nennt man partielle Ableitung von f nach x i und

n 2(a + bx i y i ) = 0 und i=1 n 2(a + bx i y i )x i = 0 i=1 gilt. Aus diesen beiden Gleichungen erhalten wir nach wenigen einfachen Umformungen

Statistik Einführung // Konfidenzintervalle für einen Parameter 7 p.2/39

Monotonie einer Folge

Empirische Verteilungsfunktion

4.1 Dezimalzahlen und Intervallschachtelungen. a) Reelle Zahlen werden meist als Dezimalzahlen dargestellt, etwa

D-HEST, Mathematik III HS 2015 Prof. Dr. E. W. Farkas R. Bourquin und M. Sprecher. Lösung 1

Lineare Transformationen

Mathematische und statistische Methoden I

LGÖ Ks VMa 12 Schuljahr 2017/2018

Statistik und Wahrscheinlichkeitsrechnung

Konzentration und Disparität

Kennwerte Univariater Verteilungen

Zusammenfassung: Gleichungen und Ungleichungen

Zusammenfassung: Gleichungen und Ungleichungen

Einführende Beispiele Arithmetische Folgen. Datei Nr SW. Das komplette Manuskript befindet sich auf der Mathematik - CD.

WISTA WIRTSCHAFTSSTATISTIK

Dritter Zirkelbrief: Ungleichungen

Fakultät für Wirtschafts- und Rechtswissenschaften

und wird als n-dimensionaler (reeller) Vektorraum bezeichnet. heißt der von v 1,..., v k aufgespannte Unterraum des R n.

Lineare Regression. Roland Heynkes. 18. April 2006, Aachen

2. Repetition relevanter Teilbereiche der Statistik

Statistik I für Studierende der Soziologie

Klausur 3 Kurs 11ma3g Mathematik

Positiv denken! Lösungen

10. Grundlagen der linearen Regressionsanalyse 10.1 Formulierung linearer Regressionsmodelle

Mathematische und statistische Methoden I

Normierte Vektorräume

Geometrische Folgen. Auch Wachstumsfolgen Viele Aufgaben. Lösungen nur auf der Mathe-CD Hier nur Ausschnitte. Datei Nr

Formelsammlung. Deskriptive Statistik und Elementare Wahrscheinlichkeitsrechnung. Prof. Dr. Ralf Runde Statistik und Ökonometrie, Universität Siegen

WISTA WIRTSCHAFTSSTATISTIK

Repetitionsaufgaben Potenzfunktionen

Es gibt verschiedene Möglichkeiten eine Folge zu definieren. Die zwei häufigsten Methoden

6. Übung - Differenzengleichungen

Anwendungen der Wahrscheinlichkeit II. Markovketten

Höhere Analysis. Lösungen zu Aufgabenblatt 6. Die Funktion f sei auf ( π, π] definiert durch f(x) = x und wird 2π-periodisch fortgesetzt.

n=0 f(x) = log(1 + x) = n=1

Wahrscheinlichkeitstheorie und Statistik vom

Wirksamkeit, Effizienz

Evaluierung einer Schulungsmaßnahme: Punktezahl vor der Schulung Punktezahl nach der Schulung. Autoritarismusscore vor/nach Projekt

Reader Teil 1: Beschreibende Statistik

K. Felten: Internet Network infrastucture Fachhochschule Kiel, Fachbereich IuE

Funktionenreihen. 1-E1 Ma 2 Lubov Vassilevskaya

6 Vergleich mehrerer unverbundener Stichproben

3 Vergleich zweier unverbundener Stichproben

Aufgabe 4.2. (a) lim 7 + = (b) lim. ( 2n 3 6n 2 + 3n 1. (c) lim n n 2 ( 1) n n 3) = lim. (d) n n + 1. lim. (e) n n. Aufgabe 4.3.

Statistik I/Empirie I

= 3. = 14,38... = x neu x = 0, = 97,87...%. Wie verändert sich der arithmetische Mittelwert von 20 Zahlen, wenn...

Der Groß-O-Kalkül. Additionsregel. Zunächst ein paar einfache "Rechen"-Regeln: " ": Sei. Lemma, Teil 2: Für beliebige Funktionen f und g gilt:

Kapitel 4. Folgen und Reihen. Josef Leydold Auffrischungskurs Mathematik WS 2017/18 4 Folgen und Reihen 1 / 38. a : N R, n a n

Abb. 1: Woher kommen die schwarzen Quadrate?

Angewandte Mathematik und Programmierung

Übungen zur Analysis 1 für Informatiker und Statistiker. Lösung zu Blatt 8

1. Einleitung. Uni- und bivariate Datenanalyse. Auswertung eines Merkmals. Verbundene Auswertung zweier Merkmale

Kapitel 2. Kapitel 1 Skalierungen. Graphische Darstellungen. Seite 1/5 Deskriptive Statistik. Aufgabe 1 Welche Skalenniveaus liegen vor?

Folgen und Reihen. 23. Mai 2002

Statistische Maßzahlen. Statistik Vorlesung, 10. März, Beispiel. Der Median. Beispiel. Der Median für klassifizierte Werte.

Kreisabbildungen. S 1 f S 1. Beispiele: (1) f = id, F = id,

3. Einführung in die Statistik

Technische Universität München Zentrum Mathematik. Übungsblatt 1

4 Schwankungsintervalle Schwankungsintervalle 4.2

Jugendliche (18-24 Jahre) in Westdeutschland

4. Reihen Definitionen

x 1, x 2,..., x n ist eine Liste von n reellen Zahlen. Das arithmetische Mittel x der Zahlen ist x = x 1 + x x n n

8. Regressionsanalyse

Statistik Einführung // Beschreibende Statistik 2 p.2/61

Vl Statistische Prozess und Qualitätskontrolle und Versuchsplanung Übung 3

n=1 b n, deren Summe n=1 (a n + b n ) eine konvergente Reihe ist. Die Aussage ist WAHR, ein mögliches Beispiel sind die divergenten Reihen 1

Nachklausur - Analysis 1 - Lösungen

Analysis I - Zweite Klausur

3 Grenzwerte. 3.1 Grenzwerte von Folgen

Kurvenanpassung durch Regression (3) Ac nichtlineare Regression/Linearisierung -

FormelnfürdieAnzahlmöglicherQuadrateaufn*nSpielfeldern

Analysis ZAHLENFOLGEN Teil 4 : Monotonie

1 Das Skalarprodukt und das Kreuzprodukt

Proseminar Lineare Algebra WS 2016/17

Zusammenfassung: Folgen und Konvergenz

Vorkurs Mathematik für Informatiker Folgen

Aufgabe 5: Grundlagen Wahr keit, Satz von Bayes und Binomialverteilung

Maximum Likelihood Version 1.6

Unsere Daten. Konzentrationsmessung. Konzentrationskurve Summenkurve der Bierkonsumierung. Statistik 2. Vorlesung, Feb. 29, 2012

Kapitel 6 Differenzierbarkeit

Strukturelle Modelle in der Bildverarbeitung Markovsche Ketten II

Reihen Arithmetische Reihen Geometrische Reihen. Datei Nr (Neu bearbeitet und erweitert) Juni Friedrich W. Buckel

Transkript:

WISTA WIRTSCHAFTSSTATISTIK PROF. DR. ROLF HÜPEN FAKULTÄT FÜR WIRTSCHAFTSWISSENSCHAFT Semiar für Theoretische Wirtschaftslehre Vorlesugsprogramm 11.06.2013 Zweidimesioale Datesätze (Fortsetzug) 3. Regressiosaalyse: lieare Regressio, Methode der kleiste Quadrate Grudlage der Zeitreiheaalyse 1. Kompoetezerlegug vo Zeitreihe 2. Tredbestimmug vo Zeitreihe 3. Glätte vo Zeitreihe Literatur: Dege, Horst / Lorscheid, Peter: Statistik-Lehrbuch, 2. Aufl., Müche-Wie 2002, S. 62 86, 87 98. Mosler, Karl ud Schmid, Friedrich: Beschreibede Statistik ud Wirtschaftsstatistik, 4. Aufl., Berli-Heidelberg-New York 2009, S. 153 201, 203 221. vo der Lippe, Peter: Deskriptive Statistik, Stuttgart 1993, Olie-Ausgabe, S. 259 301, S. 393 420. Wewel, Max C.: Statistik im Bachelor-Studium der BWL ud VWL, 2. erw. Aufl., Müche 2011, S. 97 123. Übugsaufgabe: SS 08 A4. WS 08/09 A4. SS 10 A5. WS 10/11 A4. WS 11/12 A2. SS 12 A5. Prof. Dr. Rolf Hüpe Modul Statistik I Sommersemester 2013

Zweidimesioale Datesätze Regressiosaalyse Regressiosaalyse Die Regressiosaalyse beschäftigt sich mit der Schätzug fuktioaler Beziehuge zwische zwei oder mehr metrisch skalierte Merkmale. Hier: Zweidimesioale Datesätze Eifache Regressio Es wird uterstellt, das eie metrische Merkmal (die uabhägige Variable, im Folgede immer mit x bezeichet) beeiflusse das adere metrische Merkmal (die abhägige Variable, im Folgede immer mit y bezeichet). Gesucht ist also die Fuktio y = f x, durch welche die gegebee Wertepaare x i, y i geeriert werde. Bei der lieare Regressio wird ageomme, die gesuchte Fuktio sei liear vo der Form y = a + b x Die vorliegede Wertepaare erfülle diese Beziehug i der Regel icht exakt, d. h. es gibt Abweichuge u i = y i a + b x i, i = 1,, Die lieare Eifachregressio läuft also darauf hiaus, die durch de Datesatz gegebee Puktwolke im Streudiagramm durch eie Gerade so azuäher, dass die Abweichuge u i möglichst gerig sid. Prof. Dr. Rolf Hüpe Modul Statistik I Sommersemester 2013 2

y Zweidimesioale Datesätze Lieare Eifachregressio Zahlebeispiel 10 i x i y i 1 0 3 2 2 1 3 4 4 9 8 u 5 4 6 8 7 u 4 5 8 9 6 5 I der Abbildug wurde i die Puktwolke mit der Freihadmethode eie Regressiosgerade eigezeichet. Die Abweichuge sid jeweils die sekrechte Abstäde zwische de Pukte ud der Gerade. 4 3 2 u 1 u 2 u 3 1 0-1 0 1 2 3 4 5 6 7 8 9 10-1 x Prof. Dr. Rolf Hüpe Modul Statistik I Sommersemester 2013 3

Zweidimesioale Datesätze Lieare Eifachregressio Methode der kleiste Quadrate ach Gauß: Die Koeffiziete a ud b der Regressiosgerade y = a + b x sid so zu wähle, dass die Summe der quadratische Abweichuge miimiert wird. Uter der Voraussetzug Q a, b = u i 2 = x i x 2 0 ist die Lösug dieser Miimierugsaufgabe eideutig ud lautet: y i (a + b x i ) 2 b = x i x y i y x i x 2 = s xy s x 2 a = y b x oder alterativ: 2 b = x i y i x i y i x i 2 x i a = y b x Beweis Prof. Dr. Rolf Hüpe Modul Statistik I Sommersemester 2013 4

y Zweidimesioale Datesätze Lieare Eifachregressio Zahlebeispiel: i x i y i x i x y i y x i x y i y x i x 2 1 0 3-4 -2 8 16 2 2 1-2 -4 8 4 3 4 4 0-1 0 0 4 6 8 2 3 6 4 5 8 9 4 4 16 16 S 20 25 38 40 AM 4 5 7,6 8 10 9 8 7 b = x i x y i y x i x 2 = 38 40 = 0,95 a = y b x = 5 0,95 4 = 1,2 Regressiosgerade y = 1,2 + 0,95 x 6 5 4 3 2 1 0-1 0 1 2 3 4 5 6 7 8 9 10-1 x Prof. Dr. Rolf Hüpe Modul Statistik I Sommersemester 2013 5

Zweidimesioale Datesätze Lieare Eifachregressio Zwische dem Korrelatioskoeffiziete r vo Bravais-Pearso ud dem Regressioskoeffiziete b gibt es folgede Beziehug: b = r s y s x mit s x = 1 x i x 2 ud s y = 1 y i y 2 Die sich durch Awedug der Regressiosgleichug aus de Beobachtugswerte ergebede Werte y i = a + b x i heiße theoretische y-werte oder durch die Regressio erklärte Werte. Die Abweichuge u i = y i y i zwische de beobachtete y-werte ud de theoretische y-werte heiße KQ-Residue. Prof. Dr. Rolf Hüpe Modul Statistik I Sommersemester 2013 6

y Zweidimesioale Datesätze Lieare Eifachregressio Zur Eischätzug der Güte der Regressio wird der Determiatioskoeffiziet d berechet. Diese bezeichet ma auch als Bestimmtheitsmaß. Er ist wie folgt defiiert: 10 9 8 d = y i y 2 y i y 2 7 6 5 mit y i y 2 0 4 Der Determiatioskoeffiziet misst, welcher Ateil der Variaz (quadratische Abweichug der Beobachtugswerte vom arithmetische Mittel y i y 2 ) durch die Regressio erklärt wird. 3 2 1 0-1 0 1 2 3 4 5 6 7 8 9 10-1 x Prof. Dr. Rolf Hüpe Modul Statistik I Sommersemester 2013 7

Zweidimesioale Datesätze Lieare Eifachregressio Für de Determiatioskoeffiziete gelte folgede Aussage: Der Determiatioskoeffiziet gibt a, wie groß der Ateil der durch die Regressiosgerade erklärte quadratische Abweichuge des abhägige Merkmals y vom seiem Mittelwert y a der Gesamtsumme der quadratische Abweichuge ist. d = 1 u i y i y 2 0 d 1 d = r 2 d = 1 geau da, we alle Pukte x i, y i auf der Regressiosgerade liege. d = 0 geau da, we beide Merkmale ukorreliert sid. Dies ist uter de Aahme s x 0 ud s y 0 geau da der Fall, we b = 0 ud a = y. Die Apassug durch die Regressiosgerade ist umso besser, je größer d ist. Prof. Dr. Rolf Hüpe Modul Statistik I Sommersemester 2013 8

Mege Zweidimesioale Datesätze Lieare Eifachregressio Zahlebeispiel Zahlebeispiel Obsthädler : 1 Ei Obsthädler otiert a zeh aufeiader folgede Tage de Preis (i Euro pro kg) eier bestimmte Erdbeersorte ud die verkaufte Tagesmege (i kg): Preis i Euro kg Mege i kg 4,70 70 4,30 75 3,80 80 4,50 75 5,40 50 5,00 60 4,10 70 4,30 65 3,90 75 4,00 85 90 85 80 75 70 65 60 55 50 45 40 3,00 3,50 4,00 4,50 5,00 5,50 6,00 Preis 1 Quelle für das Zahlebeispiel: Mosler / Schmid, Beschreibede Statistik ud Wirtschaftsstatistik, 4. Aufl., Berli-Heidelberg-New York 2009, S. 154. Prof. Dr. Rolf Hüpe Modul Statistik I Sommersemester 2013 9

Zweidimesioale Datesätze Lieare Eifachregressio Zahlebeispiel Arbeitstabelle: Preis Mege i x i y i x i x y i y x i x y i y x i x 2 y i y 2 1 4,70 70 0,30-0,50-0,15 0,09 0,25 2 4,30 75-0,10 4,50-0,45 0,01 20,25 3 3,80 80-0,60 9,50-5,7 0,36 90,25 4 4,50 75 0,10 4,50 0,45 0,01 20,25 5 5,40 50 1,00-20,50-20,5 1 420,25 6 5,00 60 0,60-10,50-6,3 0,36 110,25 7 4,10 70-0,30-0,50 0,15 0,09 0,25 8 4,30 65-0,10-5,50 0,55 0,01 30,25 9 3,90 75-0,50 4,50-2,25 0,25 20,25 10 4,00 85-0,40 14,50-5,8 0,16 210,25 S 44 705-40 2,34 922,5 AM 4,40 70,5-4 0,234 92,25 Korrelatioskoeffiziet: x i x y i y r = x i x 2 y i y 2 40 = 2,34 922,5 = 0,8609 Also starke egative Korrelatio. b = x i x y i y x i x 2 = 40 2,34 = 17,0940 a = y b x = 70,5 + 17,0940 4,4 = 145,7137 Regressiosgerade: y = 145,7137 17,0940 x Determiatioskoeffiziet: Ca. 74% der Abweichuge werde durch die Regressio erklärt. d = r 2 = 0,8609 2 = 0,7412 Prof. Dr. Rolf Hüpe Modul Statistik I Sommersemester 2013 10

Mege Zweidimesioale Datesätze Lieare Eifachregressio Zahlebeispiel 90 85 80 75 70 65 60 55 50 45 Die Regressiosgleichug ka zu Progosezwecke beutzt werde, we ma abschätze will, mit welchem y-wert bei eiem bestimmte x-wert zu reche ist. Im Beispiel Obsthädler ist etwa y 3,50 = 145,7137 17,0940 3,50 = 85,8847 sodass der Obsthädler damit reche ka, ca. 86 kg Erdbeere absetze zu köe, we er de Preis auf 3,50 /kg sekt. Je kleier d ud je weiter der eigesetzte x-wert vo de bisher beobachtete Werte etfert ist, umso usicherer ist jedoch die Progose. 40 3,00 3,50 4,00 4,50 5,00 5,50 6,00 Preis Beispiel Kosumfuktio Prof. Dr. Rolf Hüpe Modul Statistik I Sommersemester 2013 11

Zeitreiheaalyse Begriff der Zeitreihe Zeitreiheaalyse Zeitreihe etstehe bei statistische Lägsschittaalyse. Ei Merkmal X wird zu verschiedee, aufeiader folgede Zeitpukte oder Zeititervalle erhobe. Dadurch erhält ma eie zeitlich geordete Abfolge vo Beobachtugswerte. Der Gegebegriff ist die statistische Querschittaalyse, bei der sich die Beobachtugswerte verschiedeer statistischer Eiheite alle auf ei- ud deselbe Zeitpukt oder Zeitraum beziehe. Defiitio: Eie Folge vo Beobachtugswerte x t mit t = 1,2,, welche i der Reihefolge x 1, x 2,, x zeitlich acheiader beobachtet wurde, heißt Zeitreihe. t = 1,2,, heißt Zeitidex. Prof. Dr. Rolf Hüpe Modul Statistik I Sommersemester 2013 12

Zeitreiheaalyse Begriff der Zeitreihe Bei Zeitreihe ist Folgedes zu beachte: Hadelt es sich bei de Beobachtugswerte um Bestadsgröße, so ist der Zeitidex t als aufeiader folgede Reihe äquidistater Zeitpukte zu iterpretiere. x t ist da der Wert der Bestadsgröße zum Zeitpukt t, also z. B. die Eiwoherzahl Deutschlads am 9.5.2011. Hadelt es sich bei de Beobachtugswerte um Stromgröße, so ist der Zeitidex t als aufeiader folgede Reihe vo Zeitperiode eiheitlicher Dauer zu iterpretiere. 1 I diesem Fall bezeichet x t de währed der Dauer der Periode t kumulierte Wert der betrachtete Stromgröße, z. B. das Bruttoiladsprodukt im zweite Quartal 2010. Empirisch gehaltvolle Aussage erforder, dass der im Zeitidex ausgedrückte Modellzeit eideutig Kalederzeiteiheite zugeordet werde köe. Der Graph eier Zeitreihe mit t a der Abszisse ud x t a der Ordiate heißt Zeitreihediagramm (Plot). 1 ) Liege aufeiader folgede Zeitperiode T 1,, T vor, so gibt es Stromgröße x 1, x. Betrachtet ma die damit korrespodierede Afags- ud Edzeitpukte der Periode, so gibt es + 1 solcher Zeitpukte, ämlich t 0, t 1,, t mit T i = t i t i 1. Der Zeitidex für die Bestadsgröße ist da t = 0,1,,. So gehöre z. B. zu + 1 aufeiader folgede äquidistate Bestadsgröße geau aufeiader folgede Wachstumsrate. Prof. Dr. Rolf Hüpe Modul Statistik I Sommersemester 2013 13

Zeitreiheaalyse Zeitreihediagramm Registrierte Arbeitslose im alte Budesgebiet, Moatswerte 4 000 000 3 500 000 3 000 000 2 500 000 2 000 000 1 500 000 1 000 000 500 000 0 1950 1951 1952 1953 1954 1955 1956 1957 1958 1959 1960 1961 1962 1963 1964 1965 1966 1967 1968 1969 1970 1971 1972 1973 1974 1975 1976 1977 1978 1979 1980 1981 1982 1983 1984 1985 1986 1987 1988 1989 1990 1991 1992 1993 1994 1995 1996 1997 1998 1999 2000 2001 2002 2003 2004 2005 2006 2007 Prof. Dr. Rolf Hüpe Modul Statistik I Sommersemester 2013 14

Zeitreiheaalyse Zeitreihediagramm Registrierte Arbeitslose i Deutschlad, Moatswerte 6 000 000 5 000 000 4 000 000 3 000 000 2 000 000 1 000 000 0 1991 1992 1993 1994 1995 1996 1997 1998 1999 2000 2001 2002 2003 2004 2005 2006 2007 Prof. Dr. Rolf Hüpe Modul Statistik I Sommersemester 2013 15

Zeitreiheaalyse Kompoetezerlegug vo Zeitreihe Kompoetezerlegug vo Zeitreihe Bewegugskompoete beschreibe charakteristische Veräderuge der Beobachtugswerte im Zeitablauf: T t Z t G t = T t + Z t S t R t Tredkompoete: Beschreibt die mootoe lagfristige Etwicklug. Zyklische Kompoete: Beschreibt de Kojukturverlauf. Glatte Kompoete: Zusammefassug vo Tred ud zyklischer Kompoete. Saisokompoete: Beschreibt die saisoale Abweichug vo der glatte Kompoete. Irreguläre Kompoete: Restkompoete, beschreibt de Teil der Beobachtuge, de die vorgeate Kompoete icht erfasse. Additives Kompoetemodell: x t = T t + Z t + S t + R t G t Prof. Dr. Rolf Hüpe Modul Statistik I Sommersemester 2013 16

Zeitreiheaalyse Tredkompoete Methode der Reihehälfte Tredbestimmug mit der Methode der Reihehälfte Fall 1: Die Azahl der vorhadee Zeitreihewerte ist gerade = 2 Zeitreihe i die beide Hälfte x 1,, x ud x +1,, x aufteile. Die arithmetische Mittel x 1 = 1 x t ud x 2 = 1 t=1 t= +1 x t der beide Reihehälfte bereche. Eie Gerade durch die beide Pukte +1, x 2 1 ud Diese Gerade ist die Tredgerade. 3 +1 2, x 2 lege. Tredgerade: T t = a + b t Parameter der Tredgerade: b = x 2 x 1 ud a = x 1 b + 1 2 Fall 2: Die Azahl der vorhadee Zeitreihewerte ist ugerade = 2 + 1 Mittlere Wert x +1 weglasse. Weiteres Vorgehe aalog zu Fall 1. Prof. Dr. Rolf Hüpe Modul Statistik I Sommersemester 2013 17

Zeitreiheaalyse Tredkompoete Methode der Reihehälfte Bruttoiladsprodukt, preisbereiigt (verkettet, 1991 = 100) 130,00 120,00 110,00 100,00 Ketteidex, 1991 = 100 90,00 80,00 70,00 60,00 50,00 40,00 1965 1970 1975 1980 1985 1990 1995 2000 2005 2010 Prof. Dr. Rolf Hüpe Modul Statistik I Sommersemester 2013 18

Zeitreiheaalyse Tredkompoete Methode der Reihehälfte Jahr BIP Jahr BIP 1971 58,57 1989 90,37 1972 61,07 1990 95,32 1973 64,11 1991 100,27 1974 64,75 1992 102,13 1975 64,17 1993 101,32 1976 67,03 1994 104,08 1977 69,37 1995 106,14 1978 71,53 1996 107,20 1979 74,59 1997 109,18 1980 75,57 1998 111,18 1981 76,05 1999 113,27 1982 75,67 2000 117,20 1983 76,78 2001 118,81 1984 79,01 2002 118,81 1985 81,07 2003 118,54 1986 82,91 2004 119,22 1987 83,97 2005 120,37 1988 86,85 2006 124,08 Summe 1 313,07 Summe 1 977,47 x 1 72,9483 x 2 109,8596 b = x 2 = 36 = 18 + 1, x 2 1 = 9,5; 72,9483 3 + 1, x 2 2 = (27,5; 109,8596) x 1 = 109,8596 72,9483 18 a = x 1 b + 1 = 2 = 72,9483 2,0506 9,5 = 53,4674 Tredgerade: T t = a + b t = 53,4674 + 2,0506 t = 2,0506 Prof. Dr. Rolf Hüpe Modul Statistik I Sommersemester 2013 19

Zeitreiheaalyse Tredkompoete Methode der Reihehälfte Bruttoiladsprodukt, preisbereiigt (verkettet, 1991 = 100) 140,00 130,00 120,00 110,00 Ketteidex, 1991 = 100 100,00 90,00 80,00 70,00 60,00 50,00 40,00 1965 1970 1975 1980 1985 1990 1995 2000 2005 2010 Prof. Dr. Rolf Hüpe Modul Statistik I Sommersemester 2013 20

Zeitreiheaalyse Tredkompoete Methode der kleiste Quadrate Tredbestimmug mit der Methode der kleiste Quadrate Die Tredgerade wird wie bei der lieare Regressio mit der Methode der kleiste Quadrate agepasst, idem die Zeitreihewerte als abhägige Variable ud die Zeit t als uabhägige Variable iterpretiert werde. Die Parameter der Tredgerade T t = a + b t resultiere da als 2 b = t x t t x t t 2 t t=1 t=1 t=1 t=1 t=1 a = 1 x t b 1 t t=1 t=1 Dabei gilt: t=1 t=1 t = ( + 1) 2 t 2 = 1 + 1 (2 + 1) 6 Prof. Dr. Rolf Hüpe Modul Statistik I Sommersemester 2013 21

Zeitreiheaalyse Tredkompoete Methode der kleiste Quadrate Bruttoiladsprodukt (x t ), preisbereiigt (Ketteidex, 1991 = 100) Fortsetzug Jahr t x t t x t Jahr t x t t x t 1971 1 58,57 58,57 1989 19 90,37 1 717,03 1972 2 61,07 122,14 1990 20 95,32 1 906,40 1973 3 64,11 192,33 1991 21 100,27 2 105,67 1974 4 64,75 259,00 1992 22 102,13 2 246,86 1975 5 64,17 320,85 1993 23 101,32 2 330,36 1976 6 67,03 402,18 1994 24 104,08 2 497,92 1977 7 69,37 485,59 1995 25 106,14 2 653,50 1978 8 71,53 572,24 1996 26 107,20 2 787,20 1979 9 74,59 671,31 1997 27 109,18 2 947,86 1980 10 75,57 755,70 1998 28 111,18 3 113,04 1981 11 76,05 836,55 1999 29 113,27 3 284,83 1982 12 75,67 908,04 2000 30 117,20 3 516,00 1983 13 76,78 998,14 2001 31 118,81 3 683,11 1984 14 79,01 1 106,14 2002 32 118,81 3 801,92 1985 15 81,07 1 216,05 2003 33 118,54 3 911,82 1986 16 82,91 1 326,56 2004 34 119,22 4 053,48 1987 17 83,97 1 427,49 2005 35 120,37 4 212,95 1988 18 86,85 1 563,30 2006 36 124,08 4 466,88 t=1 t 2 = t=1 t = ( + 1) 2 + 1 2 + 1 6 t=1 t=1 = = 36 37 2 x t = 3290,56 tx t = 68459,01 = 666 36 37 73 6 Parameter der Tredgerade: = b = tx t t x t t 2 t 2 36 68459,01 666 3290,56 36 16206 666 2 = 1,9520 a = x t b t 3290,56 1,952033 666 = 36 = 55,2918 Tredgerade: T t = 55,2918 + 1,9520 t = 16206 Summe 1971 2006: 666 3 290,56 68 459,01 Prof. Dr. Rolf Hüpe Modul Statistik I Sommersemester 2013 22

Zeitreiheaalyse Tredkompoete Methode der kleiste Quadrate Bruttoiladsprodukt, preisbereiigt (verkettet, 1991 = 100) 140,00 130,00 120,00 110,00 Ketteidex, 1991 = 100 100,00 90,00 80,00 Ursprugswerte Tred, RH Tred, KQ 70,00 60,00 50,00 40,00 1970 1975 1980 1985 1990 1995 2000 2005 2010 Prof. Dr. Rolf Hüpe Modul Statistik I Sommersemester 2013 23

Zeitreiheaalyse Glatte Kompoete Methode der gleitede Durchschitte Reiheglättug mit der Methode der gleitede Durchschitte Versio 1: Zum Beobachtugswert x t zu eiem Zeitpukt (oder eier Zeitperiode) t werde m Vorgäger- ud m Nachfolgewerte hizugezoge. x t ud die hizugezogee Werte bilde zusamme de Stützbereich. Dieser umfasst also immer eie ugerade Azahl vo Werte, ämlich 2m + 1 Werte. Dem Zeitpukt (oder itervall) t wird soda der Durchschitt x t dieser 2m + 1 Werte zugeordet. x t = t m t+m x t 2m + 1 = x t m + x t m+1 + + x t + + x t+m 1 + x t+m 2m + 1 Versio 2: Der erste ud der letzte Wert des Stützbereichs gehe ur mit halbem Gewicht i die Berechug ei. Diese Versio ist relevat, we eie gerade Azahl (2m) uterjähriger, saisobehafteter Date geglättet werde soll, z. B. Moatsdate (2m = 12 Moate) oder Quartalsdate (2m = 4 Quartale). Die Saisofigur wird dadurch elimiiert. x t = 1 2 x t m + x t m+1 + + x t + + x t+m 1 + 1 2 x t+m 2m Für beide Versioe gilt: Für die erste m Werte ud die letzte m Werte der Zeitreihe ka der gleitede Durchschitt x t icht berechet werde, weil der Stützbereich zu klei ist. Prof. Dr. Rolf Hüpe Modul Statistik I Sommersemester 2013 24

Zeitreiheaalyse Glatte Kompoete Methode der gleitede Durchschitte Jahr Moat Arbeitslose Registrierte Arbeitslose i Deutschlad 1991-2010 Gleiteder Durchschitt m = 6 Gleiteder Jahr Moat Arbeitslose Durchschitt m = 6 1991 Jauar 2 631 151 2009 Jauar 3 488 801 3 314 963 Februar 2 655 847 Februar 3 551 911 3 336 975 Maerz 2 539 308 März 3 585 784 3 359 535 April 2 488 886 April 3 584 798 3 380 258 Mai 2 445 961 Mai 3 458 104 3 399 371 Jui 2 435 115 Jui 3 410 036 3 416 056 Juli 2 762 324 2 640 951 Juli 3 462 446 3 428 645 August 2 735 455 2 686 174 August 3 471 513 3 437 818 September 2 638 271 2 725 618 September 3 346 459 3 440 886 Oktober 2 647 486 2 763 237 Oktober 3 228 625 3 432 707 November 2 648 999 2 799 146 November 3 215 393 3 416 247 Dezember 2 768 927 2 832 946 Dezember 3 275 526 3 396 526 1992 Jauar 3 218 526 2 860 329 2010 Jauar 3 617 485 3 374 552 Februar 3 153 811 2 881 518 Februar 3 643 381 3 351 467 Maerz 2 987 994 2 902 810 März 3 567 944 3 326 530 April 2 943 067 2 925 162 April 3 406 344 3 301 603 Mai 2 853 582 2 950 263 Mai 3 241 529 3 277 963 Jui 2 838 697 2 978 570 Jui 3 153 300 Juli 3 015 946 3 003 160 Juli 3 191 800 August 2 990 366 3 025 980 August 3 188 122 September 2 894 374 3 054 762 September 3 031 354 Oktober 2 927 816 3 085 908 Oktober 2 945 491 November 2 971 093 3 117 679 November 2 931 170 Dezember 3 126 217 3 151 768 Dezember Prof. Dr. Rolf Hüpe Modul Statistik I Sommersemester 2013 25

1991 1992 1993 1994 1995 1996 1997 1998 1999 2000 2001 2002 2003 2004 2005 2006 2007 2008 2009 2010 Zeitreiheaalyse Glatte Kompoete Methode der gleitede Durchschitte Registrierte Arbeitslose i Deutschlad, Moatswerte 5500 000 5000 000 4500 000 4000 000 3500 000 3000 000 2500 000 2000 000 Origialwerte Glatte Kompoete (Versio 2) Prof. Dr. Rolf Hüpe Modul Statistik I Sommersemester 2013 26

Zeitreiheaalyse Glatte Kompoete Methode der gleitede Durchschitte Bruttoiladsprodukt (BIP) Quartalswerte (Mrd. Euro) Deutschlad Berechug des gleitede Durchschitts, beispielhaft für das dritte Quartal 2004: x 7 = 1 2 537,20 + 546,90 + 560,50 + 566,60 + 1 2 537,80 = 552,88 4 Kalederzeit t Ursprugswerte 2003 1.Vj 1 523,00 2.Vj 2 531,80 BIP i Mrd Gleiteder Durchschitt m = 2 3.Vj 3 552,00 542,73 4.Vj 4 557,00 546,39 2004 1.Vj 5 537,20 549,34 2.Vj 6 546,90 551,60 3.Vj 7 560,50 552,88 4.Vj 8 566,60 554,40 2005 1.Vj 9 537,80 557,20 2.Vj 10 558,50 559,85 3.Vj 11 571,30 563,79 4.Vj 12 577,00 568,01 2006 1.Vj 13 558,90 572,00 2.Vj 14 571,20 577,48 3.Vj 15 590,50 584,04 4.Vj 16 601,60 590,83 2007 1.Vj 17 586,80 597,56 2.Vj 18 597,60 3.Vj 19 618,00 Prof. Dr. Rolf Hüpe Modul Statistik I Sommersemester 2013 27

BIP i Mrd. Euro Zeitreiheaalyse Glatte Kompoete Methode der gleitede Durchschitte Bruttoiladsprodukt i Deutschlad, Quartalswerte 640 620 600 580 560 540 520 500 480 460 1.Vj 2.Vj 3.Vj 4.Vj 1.Vj 2.Vj 3.Vj 4.Vj 1.Vj 2.Vj 3.Vj 4.Vj 1.Vj 2.Vj 3.Vj 4.Vj 1.Vj 2.Vj 3.Vj 4.Vj 2003 2004 2005 2006 2007 Ursprugswerte Gleiteder Durchschitt (m = 2) Prof. Dr. Rolf Hüpe Modul Statistik I Sommersemester 2013 Beispiel Erwerbslose 28