5. Zeitreihenanalyse und Prognoseverfahren

5. Zeitreihenanalyse und Prognoseverfahren Stichwörter: Trend, Saisonalität, Noise, additives Modell, multiplikatives Modell, Trendfunktion, Autokorrelationsfunktion, Korrelogramm, Prognosehorizont, Prognoseintervall, Exponentielles Glätten, Verfahren nach Holt, Verfahren nach Winters, autoregressives Modell, AR- Modell, Box-Jenkins Modelle. Literatur: Newbold & Bos, Introductory Business Forecasting, 2 nd Edition. Besonders in den Betrieben werden viele Daten in Form von Zeitreihen erhoben. Fragestellungen, die mit Zeitreihen oft verbunden sind, betreffen ihre Beschreibung und die ihrer Komponenten wie Trend und Saisonalität, das Verstehen des Prozesses, in dem diese Daten entstanden sind, und vielleicht am häufigsten die nach der künftigen Entwicklung der Zeitreihe, also das Erstellen von Prognosen. Im ersten Teil des Kapitels befassen wir uns mit den Verfahren zum Beschreiben von Zeitreihen und zum Berechnen ihrer Komponenten. Im zweiten Teil werden wir einige Prognoseverfahren und insbesondere die Methode des exponentiellen Glättens in einigen Varianten behandeln. 1 Zeitreihen Unter einer Zeitreihe verstehen wir in regelmäßigen Zeitabständen genommene Beobachtungen y 1, y 2,..., y t,..., (y n ) eines Merkmals Y. Beispiele: jährliche Investitionen eines Unternehmens, die wöchentlichen Umsätze einer Supermarkt-Kette, die täglichen Börsenkurse einer Aktiengesellschaft. Aufgaben der Analyse von Zeitreihen: Beschreibung der Zeitreihe, Prognose, Erklärung des datengenerierenden Prozesses.

1.1 Beschreibung der Zeitreihe Komponenten von Zeitreihen sind Trend, Saisonale (und/oder zyklische) Schwankungen (Saisonalität), Irreguläre Schwankungen (Störterm, Noise). Allgemeine Modelle für Zeitreihen sind y t = T t + S t + u t (additives Modell) y t = T t S t u t (multiplikatives Modell) wobei y t für die Beobachtung von Y und die Größen T t, S t und u t für den Trend, die Saisonalität und den Störterm stehen, jeweils in der Periode t. Modelle für den Trend (Trendfunktionen) T t = α + β t (linearer Trend) T t = α + β t + γ t 2 +... (polynomialer Trend) T t = α e βt (exponentieller Trend) α T t = (Sättigungsmodell) 1 + β e γ t Der in jedem Modell notwendige, meist additive Störterm (u t ) wurde hier der Übersichtlichkeit halber nicht angeschrieben. Die Konstanten α, β und γ sind Parameter der Modelle, die normalerweise unbekannt sind. Das Schätzen der Parameter eines geeignet spezifizierten Modells aus den Daten gehört zu den Hauptaufgaben der Analyse von Zeitreihen, die dafür eine Vielzahl von Methoden entwickelt hat. Schätzen der Trendkomponente: Die Verfahren kann man einteilen in Methoden der globalen Anpassung: ein typischer Vertreter ist die Methode der kleinsten Quadrate; lokalen Anpassung: etwa die Methode der gleitenden Durchschnitte. Warum interessieren uns die Saisonkomponenten? Weil man die Saisonalitäten kennen möchte.

Weil man sie zum Saisonbereinigen benötigt. Schätzen der Saisonalitäten: Bei Annahme eines additiven Modells (y t = T t +S t +u t ) können die Saisonalitäten in einem mehrstufigen Verfahren geschätzt werden.: 1. Schätzung des Trends T t ; 2. Abziehen des Trends liefert näherungsweise S t + u t ; der Durchschnitt dieser Werte zu jeder Saisonkomponente gibt vorläufige Schätzer; 3. Abziehen des Durchschnittes der Saisonkomponenten (Zentrieren). 1.2 Die Autokorrelationsfunktion Unter Autokorrelation versteht man die Korrelation der Beobachtungen einer Zeitreihe, deren Beobachtungsperioden einen bestimmten Abstand haben. Der Autokorrelationskoeffizient r k ist definiert als (yt ȳ)(y t+k ȳ) r k = (yt ȳ) 2 mit der Stichprobenkovarianz = s k s 2 s k = 1 n (yt ȳ)(y t+k ȳ) und der Stichprobenvarianz s 2 = s 0 ; ȳ ist der Durchschnitt der y t. Der Autokorrelationskoeffizient r k ist ein Maß für die Stärke der Abhängigkeit zwischen y t und y t+k (oder y t k ). Unter der Autokorrelationsfunktion versteht man die Abhängigkeit des Autokorrelationskoeffizienten r k von k. Sie wird als Tabelle oder in graphischer Form dargestellt; diese graphische Darstellung von r 1, r 2, r 3,... nennt man auch ein Korrelogramm. Interpretation der Autokorrelationsfunktion oder des Korrelogramms: Das Korrelogramm zeigt saisonale Effekte an. Bei Zeitreihen mit Trend fällt Korrelogramm nur langsam ab. Autokorrelationsfunktion und Prognose: Stark korrelierte Reihe: Vergangene Werte können zur Prognose künftiger Werte verwendet werden Alle r k klein: Vergangene Werte sind keine Hilfe für die Prognose.

2 Prognoseverfahren Zeitreihe eines Merkmals Y : y 1, y 2,..., y n y n+1, y n+2,... y n+r ; die historischen Daten sind y 1, y 2,..., y n ; zukünftige Beobachtungen sind y n+1, y n+2,..., y n+r. Prognose oder Vorhersage für die Beobachtung y n+r der (zukünftigen) Periode n + r im Zeitpunkt n ist ŷ n (r) wir nennen n den Prognosezeitpunkt, r den Prognosehorizont. Prognoseintervall: ŷ n (r) ± c (vergleiche das Konfidenzintervall). Aufgabe der Prognoserechnung ist das Bestimmen von ŷ n (r) und c. Eine Systematik der Prognosemethoden: A. Univariate Methoden exponentielles Glätten Box-Jenkins ARIMA Modelle Strukturelle Zeitreihenmodelle B. Multivariate Methoden Regressionsmodelle Ökonometrische Modelle (simultane Gleichungssysteme) C. judgmental methods Software: EXCEL (nur beschränkt), ForecastPRO. 2.1 Methode des Exponentiellen Glättens Die Struktur der Zeitreihe ist für Wahl der Prognosemethode entscheidend. Wir unterscheiden die Fälle: Die Zeitreihe hat A. keinen Trend, keine Saisonalität B. Trend, keine Saisonalität C. Trend, Saisonalität

2.1.1 Prognose für Zeitreihen ohne Trend, ohne Saisonalität Ausgangspunkt ist das Modell y t = µ + u t µ : Niveau, u t : Irreguläre Schwankung (Störterm, Noise). Fall 1: Konstantes Niveau Wir schätzen µ mittels der Methode der Kleinsten Quadrate (OLS-Schätzung) zu ȳ = 1 n (y n + y n 1 +... + y 1 ). Als Prognose für y n+r nehmen wir ŷ n (r) = ȳ für alle r Beachte! Der Durchschnitt gibt allen Beobachtungen das gleiche Gewicht n 1. Fall 2: Variables Niveau Wir schätzen µ mittels der Methode des Exponentiellen Glättens. Wir bezeichnen das geschätzte Niveau mit L n ; wir erhalten es aus L n = α[y n + (1 α)y n 1 + (1 α) 2 y n 2 +...] ; dabei ist α die Glättungskonstante (0 α 1). Wir nehmen als Prognose für y n+r ŷ n (r) = L n für alle r. Die Prognose ist der gewichtete Durchschnitt der Beobachtungen aus der Vergangenheit, wobei den aktuelleren Beobachtungen mehr Gewicht gegeben wird als den älteren. Rekursion zur einfacheren Berechnung ( Update ) des Niveau-Schätzers: L n = αy n + (1 α)l n 1

Beispiel 1: Prognose einer einfachen Zeitreihe. Die beobachteten Werte der Zeitreihe sind y 1 = 5; y 2 = 4; y 3 = 5; y 4 = 6; y 5 = 8. Wir wählen den Anfangswert L 1 = y 1. Alternativ könnten wir den Durchschnitt der ersten (hier zwei oder drei) Beobachtungen nehmen. Wahl der Glättungskonstante: α = 0.2. Dann bekommen wir: Prognose für t = 6, 7,...: L 2 = αy 2 + (1 α)l 1 = (0.2)(4) + (0.8)(5) = 4.8 L 3 = (0.2)(5) + (0.8)(4.8) = 4.84 L 4 = (0.2)(6) + (0.8)(4.84) = 5.072 L 5 = (0.2)(8) + (0.8)(5.072) = 5.658 ŷ 5 (r) = 5.658 für alle r. Zur Wahl der Glättungskonstante α kann die Summe SSE der quadrierten einstufigen Prognosefehler minimiert werden: SSE = [y t ŷ t 1 (1)] 2. Manche Prognose-Software, nicht aber EXCEL, bieten das automatische Schätzen von α nach diesem Kriterium. Zum Verständnis zwei Fälle: A. α= 1: ŷ n (r) = L n = y n ; naive Prognose, random walk Prognose. B. α= 0: ŷ n (r) = L n = 1 n [y n + y n 1 +... + y 1 ] ; alle Beobachtungen bekommen das gleiche Gewicht. Beispiel 2: Koreanische Exporte. Die Daten gehen von 1970:1 bis 1986:2 (Quartalsdaten, n = 66). Mit α = 0.5156 ergeben sich L 66 = (0.5156)[y 66 + 0.4844y 65 + 0.2346y64 +...] = 8474.2, ŷ 66 (r) = 8474.2.

2.1.2 Exponentielles Glätten nach Holt Das Verfahren wird verwendet für Prognosen bei Zeitreihen mit Trend und ohne Saisonalität. Als Modell verwenden wir y t = µ + βt + u t µ: Niveau, β: Anstieg der Trendgeraden, u t : Irreguläre Schwankung, Störterm, Noise. Die OLS-Schätzung von µ und β funktioniert im Allgemeinen nicht gut. Als Prognose bekommen wir ŷ n (r) = L n + rt n für alle r, mit dem geschätzten Niveau L n und der geschätzten Trendkomponente T n. Rekursion zum Update der Schätzer: L n = α 1 y n + (1 α 1 )[L n 1 + T n 1 ] T n = α 2 [L n L n 1 ] + (1 α 2 )T n 1 ; Für die Glättungskonstanten α 1 und α 2 gilt 0 α 1 1 und 0 α 2 1; großer Wert einer Glättungskonstanten: Betonung der neuesten Information; kleiner Wert einer Glättungskonstanten: alle Beobachtungen bekommen ziemlich das gleiche Gewicht. Initialisierung: L 2 = y 2, T 2 = y 2 y 1. Wahl der Glättungskonstanten durch Minimieren der Summe der quadrierten einstufigen Prognosefehler. Beispiel 2: Koreanische Exporte (Fortsetzung). Die Daten gehen von 1970:1 bis 1986:2 (Quartalsdaten, n = 66). Mit α 1 = 0.064, α 2 = 0.971 erhalten wir ŷ 66 (r) = 8448.0 + 278.2 r ; ŷ 66 (1) = 8726.2. Beispiel 3: Verkauf von Thermostaten. Die Daten gehen von 1998:1 bis 2002:4 (Monatsdaten, n = 52). Mit α 1 = 0.246, α 2 = 0.093 erhalten wir Ŷ 52 (r) = 315.84 + 4.49 r Ŷ 52 (1) = 320.33

2.1.3 Exponentielles Glätten nach Holt-Winters Dieses Verfahren erlaubt die Prognose für Zeitreihen mit Trend und Saisonalität. Annahme: Wir untersuchen monatliche Daten mit einem jährlichen Saisonmuster (s = 12). Die Prognose für y n+r ergibt sich zu ŷ n (r) = [L n + rt n ]S n + r 12 für r = 1, 2,..., 12 = [L n + rt n ]S n + r 24 für r = 13, 14,..., 24 = etc. mit dem geschätzten Niveau L n, der geschätzten Trendkomponente T n und der saisonalen Komponente S n. Rekursion zum Update der Schätzer: L n = α 1 y n S n 12 + (1 α 1 )[L n 1 + T n 1 ] T n = α 2 [L n L n 1 ] + (1 α 2 )T n 1 S n = α 3 y n L n + (1 α 3 )S n 12 Für die Glättungskonstanten α 1, α 2 und α 3 gilt 0 α 1, α 2, α 3 1. Wahl der Glättungskonstanten durch Minimieren der Summe der quadrierten, einstufigen Prognosefehler. 2.2 Prognoseintervalle In Literatur und Zeitreihen-Software finden sich unterschiedliche Definitionen und Berechnungsverfahren. Prognoseintervall für y n (r): 1. Berechne alle r-stufigen Prognosefehler y r+1 ŷ 1 (r), y r+2 ŷ 2 (r),..., y n ŷ n r (r) 2. Ermittle die Standardabweichung der historischen Prognosefehler s 2 r = 1 n r [y t ŷ t r (r)] 2 t 3. Das 95%-ige (r-stufige) Prognoseintervall für y n+r ist ŷ n r (r) ± 2s r

2.3 Autoregressive Modelle zur Prognose Die AR-Modelle, auch Box-Jenkins Modelle genannt, definieren y t Funktion der eigenen früheren Beobachtungen. AR(1)-Modell: y t = β 0 + β 1 y t 1 + u t als lineare AR(2)-Modell: AR(p)-Modell: y t = β 0 + β 1 y t 1 + β 2 y t 2 + u t y t = β 0 + β 1 y t 1 +... + β p y tp + u t Aufgaben: Identifikation, d.h. Festlegen der Ordnung p des Modells, Schätzen der Parameter; zum Schätzen wird die OLS-Schätzung verwendet. Prognose für das AR(1)-Modell: ŷ n (1) = b 0 + b 1 y n ŷ n (2) = b 0 + b 1 ŷ n (1)... Prognose für das AR(2)-Modell: ŷ n (r) = b 0 + b 1 ŷ n (r 1) für r 2 ŷ n (1) = b 0 + b 1 y n + b 2 y n 1 ŷ n (2) = b 0 + b 1 ŷ n (1) + b 2 y n ŷ n (3) = b 0 + b 1 ŷ n (2) + b 2 ŷ n (1)... ŷ n (r) = b 0 + b 1 ŷ n (r 1) + b 2 ŷ n (r 2) für r 3 Beispiel 3: Verkauf von Thermostaten (Fortsetzung). Die Daten gehen von 1998:1 bis 2002:4 (Monatsdaten, n = 52). Das AR(2)-Modell ergibt sich zu (R 2 = 0.61) ŷ t = 25.37 + 0.54y t 1 + 0.34y t 2.

Aufgaben 1. Die Tabelle zeigt den Umsatz (in Mio ATS) eines Kaufhauses nach Quartalen: Jahr 1.Q 2.Q 3.Q 4.Q 1997 838 802 835 805 1998 897 867 893 873 1999 932 895 912 893 2000 941 897 925 899 2001 953 924 951 927 (Daten unter http://statistik.wu-wien.ac.at/stat4/hackl/ss02/05umsatz.htm) (a) Zeichnen Sie ein Zeitreihendiagramm. (b) Schätzen Sie (i) eine linearen und (ii) einen quadratischen Trend; interpretieren Sie die Trendfunktionen. Welche andere Trendfunktion kommt in Frage? (c) Bestimmen Sie die Saisonkomponenten. (a) Stelle Sie die desaisonalisierte und die ursprüngliche Zeitreihe einander in einem gemeinsamen Zeitreihendiagramm gegenüber. (d) Berechnen und zeichnen Sie das Korrelogramm. 2. Die EXCEL-Datei Exporte gibt Koreas Erlöse aus Exporten (in Mio USD) in der Zeit 1970:1 bis 1986:2 (Quartalsdaten) an. (a) Zeichnen Sie ein Zeitreihendiagramm. (b) Zeichnen Sie Korrelogramme der Zeitreihe, der Differenzen zum Vorwert und der Differenzen zum Vorjahreswert. (c) Berechnen Sie Prognosen für 1986:3 bis 1989:2 nach der Methode des Exponentiellen Glättens (i) ohne Trend und Saisonalität, (ii) mit Trend und ohne Saisonalität, und (iii) mit Trend und ohne Saisonalität. (d) Bestimmen Sie für alle Quartale bis Ende 1987 95%-ige Konfidenzintervalle; wählen Sie jenes Modell, das die Zeitreihe am besten repräsentiert. (e) Verwenden Sie Expert Selectio von ForecastPro und diskutieren Sie an Hand der Prognosefehler und anderer within-sample Statistics die Qualität der vier Modelle.