Kapitel 40 Zeitreihen: Autokorrelation und Kreuzkorrelation

Kapitel 40 Zeitreihen: Autokorrelation und Kreuzkorrelation Bei Zeitreihendaten ist häufig das Phänomen zu beobachten, daß die Werte der Zeitreihe zeitverzögert mit sich selbst korreliert sind. Dies bedeutet, daß ein Zusammenhang zwischen den zu unterschiedlichen Zeitpunkten beobachteten Werten besteht und aus einer heutigen Beobachtung möglicherweise Schlüsse auf spätere Beobachtungen gezogen werden können. Dies wird beispielsweise der Fall sein, wenn man ein Jahr lang jeden Tag die durchschnittliche Tagestemperatur an einem bestimmten Ort mißt. Obwohl über das gesamte Jahr gesehen möglicherweise Werte zwischen -10 und +20 zu messen sind, werden die Werte zweier aufeinanderfolgender Tage selten mehr als 5 voneinander abweichen und meistens noch wesentlich dichter beieinanderliegen. Die an einem bestimmten Tag gemessene Temperatur läßt damit bereits Rückschlüsse auf die Temperatur des Folgetages zu, denn wird eine durchschnittliche Tagestemperatur von 20 gemessen, liegt auch die Temperatur am nächsten Tag mit hoher Wahrscheinlichkeit in der Nähe von 20. Besteht ein derartiger Zusammenhang zwischen den unmittelbar aufeinanderfolgenden Beobachtungen einer Zeitreihe, spricht man von Autokorrelation erster Ordnung. Ebenso können sich Autokorrelationen mit größerer Zeitverzögerung ergeben. Beispielsweise liegt bei Quartalsdaten häufig Autokorrelation vierter Ordnung vor, also eine Korrelation zwischen den jeweils vier Perioden voneinander entfernten Beobachtungen. Mit einem Autokorrelationsdiagramm kann eine Zeitreihe daraufhin untersucht werden, ob Autokorrelation vorliegt. Dabei läßt sich zugleich der Grad der Autokorrelation identifizieren. Werden zwei Zeitreihen gleichzeitig betrachtet, kann sich das Phänomen der zeitverzögerten Korrelation auch zwischen den Zeitreihen ergeben. Es besteht dann eine Korrelation zwischen den Beobachtungen einer Zeitreihe und den jeweils um eine oder mehrere Perioden vorausgehenden Beobachtungen der anderen Zeitreihe. In einem solchen Fall spricht man von Kreuzkorrelation, die sich mit Hilfe von Kreuzkorrelationsdiagrammen erkennen läßt. Die Interpretation von Auto- und Kreuzkorrelationsdiagrammen erfolgt auf die gleiche Weise, so daß im folgenden Beispiel lediglich Autokorrelationsdiagramme betrachtet werden.

974 Kapitel 40 Zeitreihen: Autokorrelation und Kreuzkorrelation 40.1 Autokorrelation Abbildung 40.1 stellt den Verlauf der Arbeitslosenquote in den alten Bundesländer für den Zeitraum von 1960 bis 1996 dar. Das Diagramm wurde mit dem Befehl GRAFIKEN, SEQUENZ erstellt, die Daten finden Sie in der Datei Makrodaten.sav auf der Begleit-CD. Die Variable alq enthält die dargestellten Arbeitslosenquoten. In der Grafik ist bereits zu erkennen, daß die Arbeitslosenquote eines Jahres offenbar nicht vollkommen unabhängig von der entsprechenden Quote des Vorjahres bzw. von weiter zurückliegenden Arbeitslosenquoten ist. Vielmehr scheinen die Arbeitslosenquoten benachbarter Jahre relativ ähnlich zu sein, während sich bei weiter auseinander liegenden Jahren größere Unterschiede ergeben können. 10 8 6 4 Arbeitslosenquote 2 0 1960 1964 1968 1972 1976 1980 1984 1988 1992 1996 JAHR Abbildung 40.1: Arbeitslosenquote für die alten Bundesländer von 1960 bis 1996, dargestellt in einem Sequenzdiagramm Einfache Autokorrelation Autokorrelationsdiagramme für die Arbeitslosenquote werden mit den folgenden Einstellungen erzeugt: ¾ Befehl: Zum Erstellen von Autokorrelationsdiagrammen wählen Sie GRAFIKEN ZEITREIHEN AUTOKORRELATIONEN... ¾ Beschreibung des Diagramms: Fügen Sie in dem Dialogfeld dieses Befehls die Variable alq in das Feld Variablen ein. Alle übrigen Einstellungen werden unverändert übernommen, insbesondere bleiben die beiden Optionen der

40.1 Autokorrelation 975 Gruppe Anzeigen angekreuzt. Die verwendeten Einstellungen sind in dem Dialogfeld aus Abbildung 40.4, S. 977 wiedergegeben. Diese Einstellungen liefern unter anderem die Grafik aus Abbildung 40.2. Das Diagramm zeigt die Stärke der Autokorrelation für verschiedene Verzögerungen (Lags) an, also die Autokorrelationen unterschiedlicher Ordnung. Es werden bis zu 16 Lags dargestellt 429, die größte berücksichtigte Verzögerung beträgt also 16 Perioden und damit in diesem Beispiel 16 Jahre. Die stärkste Autokorrelation wird bei einer Verzögerung von nur einem Jahr beobachtet. Für die Autokorrelation erster Ordnung ergibt sich ein Wert von ungefähr 0,9, so daß der Zusammenhang zwischen den Arbeitslosenquoten der jeweils aufeinanderfolgenden Jahre sehr stark zu sein scheint. (Bei einer perfekten positiven Korrelation würde sich ein Wert von 1 ergeben, bei einer perfekten negativen Korrelation ein Wert von -1.) Die beiden schwarzen Linien in dem Diagramm stellen die Grenzen der 95%- Konfidenzintervalle dar. Für Lags, bei denen die ausgewiesene Korrelation über diesen Signifikanzgrenzen liegt, ist mit einer Wahrscheinlichkeit von über 95% somit tatsächlich Autokorrelation vorhanden. Korrelationen, die zwischen die Signifikanzgrenzen fallen, sind so gering, daß sie möglicherweise nur in der betrachteten Stichprobe, nicht aber in der Grundgesamtheit vorliegen. 1,0 Arbeitslosenquote,5 0,0 -,5 Konfidenzhöchstgrenz en ACF -1,0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 Koeffizient Lag-Nummer Abbildung 40.2: Autokorrelationsdiagramm für die Arbeitslosenquote 429 Die Zahl der zu berücksichtigenden Lags kann beim Erstellen der Grafik in dem Dialogfeld der Schaltfläche Optionen festgelegt werden, siehe auch Abschnitt Optionen, S. 979.

976 Kapitel 40 Zeitreihen: Autokorrelation und Kreuzkorrelation Partielle Autokorrelation Die in Abbildung 40.2 ausgewiesenen Korrelationen nehmen mit zunehmender Verzögerung ab und werden nach mehr als zwölf Verzögerungen sogar negativ. Für eine Verzögerung zwischen 1 und 10 Jahren werden signifikante positive Korrelationen angegeben. Dabei stellt sich jedoch die Frage, ob diese Korrelationen tatsächlich daraus resultieren, daß sich die Arbeitslosenquote eines Jahres auf die 10 Jahre später zu messende Quote auswirkt, oder ob sich die berechneten Korrelationen lediglich aus den Korrelationen erster Ordnung ergeben, die in jeweils abgeschwächter Form auf größere Verzögerungen zurückwirken. Die Korrelationen größerer Lags, die jeweils um die Korrelationen geringerer Verzögerungen bereinigt wurden, werden als partielle Korrelationen bezeichnet. Zur Darstellung dieser partiellen Korrelationen wurde von SPSS automatisch ein zweites Diagramm gezeichnet, das in Abbildung 40.3 wiedergegeben ist. Diese Grafik zeigt ein vollkommen anderes Bild als das Diagramm aus Abbildung 40.2. Die Autokorrelation erster Ordnung wird unverändert hoch mit ungefähr 0,9 ausgewiesen und liegt deutlich über der 95%-Signifikanzgrenze. Die Autokorrelationen höherer Ordnung sind dagegen alle sehr viel geringer und zudem nicht signifikant. Auch wechseln sich positive und negative partielle Korrelationen scheinbar zufällig und wenig plausibel ab. Die Darstellung legt somit den Schluß nahe, daß bei der Arbeitslosenquote eine starke Autokorrelation erster Ordnung und keine Autokorrelation höherer Ordnung vorliegt. 1,0 Arbeitslosenquote,5 0,0 Partielle ACF -,5-1,0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 Konfidenzhöchstgrenz en Koeffizient Lag-Nummer Abbildung 40.3: Partielle Autokorrelationen für die Arbeitslosenquote

40.2 Erstellen von Auto- und Kreuzkorrelationsdiagrammen 977 40.2 Erstellen von Auto- und Kreuzkorrelationsdiagrammen Um Autokorrelationsdiagramme zu erstellen, öffnen Sie das Dialogfeld aus Abbildung 40.4 mit dem Befehl GRAFIKEN ZEITREIHEN AUTOKORRELATIONEN... Das abgebildete Dialogfeld zeigt die Einstellungen, mit denen die beiden Autokorrelationsdiagramme aus Abbildung 40.2, S. 975 und Abbildung 40.3, S. 976 erzeugt wurden. Kreuzkorrelationsdiagramme erstellen Sie mit dem Befehl GRAFIKEN ZEITREIHEN KREUZKORRELATIONEN... Das Dialogfeld zum Erstellen von Kreuzkorrelationsdiagrammen ist weitgehend identisch mit dem Dialogfeld Autokorrelationen, enthält jedoch nicht die Optionen aus der Gruppe Anzeigen. Abbildung 40.4: Dialogfeld des Befehls GRAFIKEN, ZEITREIHEN, AUTOKORRELATIONEN ¾ Variablen: Geben Sie in dem Feld Variablen mindestens eine numerische Variable an, deren Autokorrelationen dargestellt werden sollen. Sie können mehrere Variablen auswählen, um für jede der Variablen eigene Grafiken zu erstellen. Die Angabe einer Variablen genügt bereits, um die Prozedur AU- TOKORRELATIONEN mit den Voreinstellungen auszuführen. Bei der Prozedur KREUZKORRELATIONEN müssen mindestens zwei Variablen angegeben werden. Wenn Sie mehr als zwei Variablen angeben, werden die Kreuzkorrelationen für alle Variablenpaare dargestellt, die sich aus den ausgewählten Variablen bilden lassen.

978 Kapitel 40 Zeitreihen: Autokorrelation und Kreuzkorrelation ¾ Transformieren: Wollen Sie die Werte der Variablen von einem möglichen Trend bereinigen, können Sie die Werte logarithmieren, die Differenzen zwischen den Werten berechnen oder, sofern in der Datendatei eine Datumsvariable definiert ist, saisonale Differenzen betrachten (s.u.). ¾ Anzeigen: Per Voreinstellung werden für jede Variable zwei Diagramme erstellt, eines für einfache und ein zweites für partielle Autokorrelationen. Sie können eines dieser Diagramme abwählen (s.u.). ¾ Optionen: In dem Dialogfeld der Schaltfläche Optionen können Sie die Anzahl der zu berücksichtigenden Verzögerungen festlegen und zwischen zwei Methoden zur Berechnung der Standardfehler der einfachen Autokorrelationskoeffizienten wählen. Ist in der Datendatei ein Datum definiert, können Sie die Berechnung der Autokorrelationen an der Periodizität dieses Datums ausrichten (s.u.). Anzeigen Diese Option steht nur für Autokorrelationsdiagramme zur Verfügung. Per Voreinstellung werden für jede ausgewählte Variable sowohl einfache als auch partielle Autokorrelationen dargestellt, es genügt jedoch, wenn nur eine der beiden folgenden Optionen angekreuzt ist. ¾ Autokorrelationen: Mit dieser Option erstellen Sie eine Grafik, in der die Autokorrelationskoeffizienten der einzelnen Intervalle (Verzögerungen) dargestellt werden. Zusätzlich wird in der Grafik das zweiseitige 95%-Konfidenzintervall für die Nullhypothese eingezeichnet, nach der keine Autokorrelationen vorliegen. Ergänzend wird in den Ausgabenavigator eine Grafik der Autokorrelationen eingefügt, die aus Textzeichen zusammengesetzt ist. In dieser Grafik werden zusätzlich zu jedem Lag die genauen Korrelationskoeffizienten, die Standardfehler und die Box-Ljung-Statistik mit dem Signifikanzniveau angegeben. Für die Berechnung des Standardfehlers können Sie in dem Dialogfeld der Schaltfläche Optionen zwischen zwei Alternativen wählen (s.u.). ¾ Partielle Autokorrelationen: Diese Option erzeugt Grafiken für partielle Korrelationskoeffizienten. In einem Diagramm werden die Koeffizienten der einzelnen Lags mit dem zweiseitigen 95%-Konfidenzintervall dargestellt. Eine zweite, aus Textzeichen bestehende Grafik mit gleichem Inhalt nennt zusätzlich den genauen Korrelationskoeffizienten sowie den Standardfehler. Transformieren Wenn die Werte der Zeitreihe einen Trend aufweisen, zum Beispiel in der Tendenz linear ansteigen oder eine exponentielle Kurve beschreiben, ist es sinnvoll, die Werte zu transformieren und die Autokorrelationen der transformierten Werte (beispielsweise der Differenzen oder der Logarithmen) zu betrachten, da diese häufig stationär sind, also keinen Trend mehr aufweisen. Die gebräuchlichsten Transformationen werden bei der Autokorrelationsprozedur angeboten. Diese wirken sich lediglich auf die Berechnung der Korrelationen aus, die Werte in der Da-

40.2 Erstellen von Auto- und Kreuzkorrelationsdiagrammen 979 tendatei bleiben unverändert. Wählen Sie zum Transformieren der Werte zwischen den folgenden Optionen: ¾ Natürlicher Logarithmus: Verwenden Sie diese Option, um die Autokorrelationskoeffizienten für die natürlichen Logarithmen (Logarithmen zur Basis e) der Originalwerte zu berechnen. Enthält die Zeitreihe Werte kleiner oder gleich 0, für die der Logarithmus nicht definiert ist, wird die Prozedur nicht ausgeführt, und es erscheint eine Fehlermeldung im Ausgabenavigator. ¾ Differenz: Mit dieser Option werden die Autokorrelationen für die Differenzen der einzelnen Werte einer Zeitreihe berechnet. Dabei können Sie den Grad der Differenzenbildung vorgeben. Per Voreinstellung werden die Differenzen vom Grad 1 gebildet, also jeweils die Differenzen zweier zeitlich aufeinanderfolgender Werte. Die Differenzen vom Grad 2 ergeben sich, indem zunächst die Differenzen vom Grad 1 berechnet und anschließend für die Folge der so berechneten Werte noch einmal die Differenzen gebildet werden. Die Differenzen vom Grad 2 sind somit die Differenzen der Differenzen. Die Anzahl der nach der Transformation verfügbaren Werte verringert sich um den Grad der Differenzenbildung, da für die ersten Fälle keine Differenzen berechnet werden können. ¾ Saisonale Differenz: Diese Option wird nur angeboten, wenn in der Datendatei mit dem Befehl DATEN, DATUM DEFINIEREN ein Zeitreihenformat definiert wurde. Sie können dann wie bei der vorhergehenden Option Differenz die Differenzen zwischen einzelnen Werten berechnen lassen, wobei sich der Grad der Differenzenbildung nicht auf einzelne Fälle, sondern auf die Periodizität des Zeitreihenformats bezieht. Enthält die Datendatei zum Beispiel Quartalsdaten und weist damit eine Periodizität von 4 auf, so werden die Differenzen ersten Grades berechnet, indem von jedem Wert der vier Perioden vorhergehende Wert abgezogen wird. Optionen Mit der Schaltfläche Optionen öffnen Sie das Dialogfeld aus Abbildung 40.5, in dem Sie die Anzahl der zu berücksichtigenden Zeitintervalle vorgeben und zwischen zwei alternativen Berechnungsmethoden für den Standardfehler einfacher Autokorrelationskoeffizienten wählen können. Ist in der Datendatei ein Zeitreihenformat mit einer Periodizität definiert, können Sie wählen, ob als Grundlage der Autokorrelationskoeffizienten die einzelnen Fälle der Datei oder die verschiedenen Perioden des Datums verwendet werden sollen.

980 Kapitel 40 Zeitreihen: Autokorrelation und Kreuzkorrelation Abbildung 40.5: Dialogfeld der Schaltfläche Optionen ¾ Maximale Anzahl von Intervallen: Per Voreinstellung werden bei Autokorrelationsdiagrammen 16 Lags berücksichtigt, das heißt, es wird jeweils ein Koeffizient für die Autokorrelation 1. bis 16. Ordnung berechnet. Sie können eine andere Zahl zwischen 1 und 999 eingeben, um mehr oder weniger Koeffizienten zu betrachten. Bei Kreuzkorrelationsdiagrammen ist die Anzahl von sieben Zeitintervallen voreingestellt. Dabei werden insgesamt 15 Korrelationskoeffizienten berechnet, denn jede Zeitreihe wird einmal gegenüber der jeweils anderen um eins bis sieben Perioden verzögert. Zusätzlich gibt ein Koeffizient die einfache Korrelation (ohne zeitliche Verzögerung einer der Zeitreihen, also mit einem Lag von 0) zwischen den Zeitreihen an. ¾ Methode für Standardfehler: Diese Option steht nur bei der Prozedur AUTOKORRELATIONEN zur Verfügung und bezieht sich dabei lediglich auf einfache Autokorrelationskoeffizienten. Sie ist daher nicht aktiv, wenn in dem Hauptdialogfeld lediglich die Berechnung partieller Korrelationen ausgewählt ist. Für den Standardfehler der Korrelationskoeffizienten können Sie zwischen den beiden folgenden Optionen wählen: y Unabhängigkeitsmodell: Diese Option ist voreingestellt. Bei der Berechnung des Standardfehlers wird angenommen, daß weißes Rauschen vorliegt, daß die Werte also nicht einem Muster folgen. y Bartlett-Approximation: Bei dieser Methode basiert die Berechnung der Standardfehler auf einer Approximation, die zutrifft, wenn die Werte einen gleitenden Durchschnitt mit einer Ordnung von k-1 aufweisen. Mit zunehmenden Lags wachsen auch die Standardfehler. ¾ Autokorrelationen für periodische Intervalle anzeigen: Diese Option steht nur zur Verfügung, wenn in der Datendatei mit dem Befehl DATEN, DATUM DEFINIEREN ein periodisches Zeitreihenformat festgelegt wurde. Kreuzen Sie die Option an, um die Autokorrelationen nicht für Lags einzelner Zeitintervalle (einzelner Fälle), sondern für Lags über die gesamte Periodizität zu berechnen. Weist die Datendatei eine Periodizität von 5 auf (weil zum Beispiel für jeden Arbeitstag eine Beobachtung vorliegt), werden lediglich Korrelationen für Lags von 5, 10, 15 etc. berechnet, so daß jeweils die Werte des gleichen Wochentages gegenübergestellt werden.