Kapitel 39 Sequenzdiagramme Sequenzdiagramme bilden eine spezielle Form von Liniendiagrammen. Die Besonderheit von Sequenzdiagrammen besteht darin, daß sie stets die einzelnen Werte einer Variablen aus der Datendatei in der Reihenfolge darstellen, in der die Werte in der Datendatei aufgeführt sind. Die Anordnung der Fälle in der Datendatei ist dementsprechend für die Wiedergabe einer Wertefolge im Sequenzdiagramm relevant. Sequenzdiagramme finden daher typischerweise immer dann Anwendung, wenn eine Folge von Werten dargestellt werden soll, die nach einem - wie auch immer definierten - Kriterium geordnet sind. Dies könnten zum Beispiel Messungen sein, die entlang eines Längengrades an verschiedenen Punkten auf der Erde durchgeführt wurden und deren Ordnung sich aus der Anordnung der Meßpunkte in Nord-Süd-Richtung ergibt. Mit Abstand am häufigsten werden Sequenzdiagramme jedoch für die Abbildung von Zeitreihen verwendet, also für die Darstellung einer Folge von Messungen oder Beobachtungen, die an verschiedenen Zeitpunkten vorgenommen wurden. Sollen die Meßergebnisse in ihrer zeitlichen Entwicklung wiedergegeben werden, bietet sich hierfür ein Sequenzdiagramm an. Dabei können die Werte auch verschiedenen Transformationen unterworfen werden, um beispielsweise eine Trendbereinigung durchzuführen oder anstatt der beobachteten Werte deren Veränderungen darzustellen. 39.1 Darstellung einer Zeitreihe Die Datendatei Makrodaten.sav von der Begleit-CD enthält einige Makroökonomische Daten für die alten Länder der Bundesrepublik Deutschland über den Zeitraum von 1960 bis 1986. Unter anderem ist dort in der Variablen alq die Arbeitslosenquote (als Prozentwert) angegeben. Um die zeitliche Entwicklung der Arbeitslosenquote darzustellen, wird mit den folgenden Einstellungen das Sequenzdiagramm aus Abbildung 39.1 erzeugt: ¾ Befehl: Zum Erstellen eines Sequenzdiagramms dient der Befehl GRAFIKEN SEQUENZ...
966 Kapitel 39 Sequenzdiagramme ¾ Beschreibung des Diagramms: Fügen Sie in dem Dialogfeld dieses Befehls die Variable alq in das Feld Variablen ein, und geben Sie in dem Feld Zeitachsenbeschriftung die Variable jahr an. Bei den übrigen Optionen werden die Voreinstellungen verwendet. Abbildung 39.3, S. 969 zeigt das Dialogfeld mit den beschriebenen Einstellungen. 424 10 Arbeitslosenquote - Alte Bundesländer 8 6 4 2 0 1960 1964 1968 1972 1976 1980 1984 1988 1992 1996 1962 1966 1970 1974 1978 1982 1986 1990 1994 JAHR Abbildung 39.1: Sequenzdiagramm mit der zeitlichen Entwicklung der Arbeitslosenquote in den alten Bundesländern von 1960 bis 1996 Die Grafik zeigt die Entwicklung der Arbeitslosenquote 425 von 1960 bis 1996. Es ist deutlich zu erkennen, daß die Arbeitslosenquote über den Gesamtzeitraum von 1960 bis 1996 erheblich angestiegen ist. Innerhalb dieses Zeitraums gibt es sowohl einzelne Jahre, in denen die Arbeitslosenquote über dem entsprechenden Vorjahreswert lag, als auch Jahre mit einer im Vergleich zum Vorjahr niedrigeren Arbeitslosenquote. Dabei fällt auf, daß sich die Arbeitslosenquote in aufeinanderfolgenden Jahren häufig in die gleiche Richtung entwickelt hat. Es ist also nicht so, daß die Arbeitslosenquote mehr oder weniger zufällig mal höher und mal niedriger ausgefallen ist als im jeweiligen Vorjahr. Vielmehr läßt sich der Zeitraum von 1960 bis 1996 in mehrere Jahre umfassende Abschnitte unterteilen, innerhalb derer die Arbeitslosenquote entweder ausschließlich angestiegen oder ausschließlich zurückgegangen ist. Ein derartiger Abschnitt mit einem kontinuierlichen Anstieg der Arbeitslosenquote erstreckt sich beispielsweise von 1980 bis 1985. In den nachfolgenden Jahren bis 1991 ist die Arbeitslosenquote dagegen stetig zurückge- 424 In der abgebildeten Grafik wurde die Beschriftung der Ordinate gegenüber der von SPSS automatisch erstellten Beschriftung etwas geändert. 425 Eine Arbeitslosenquote kann auf verschiedene Arten definiert werden. Den hier dargestellten Werten liegt eine Definition zugrunde, nach der die Arbeitslosenquote gleich dem Anteil der Arbeitslosen an den Erwerbspersonen (Erwerbstätige + Arbeitslose) ist.
39.2 Darstellung von Veränderungen 967 gangen, um in den weiteren Jahren bis 1996 dann wieder anzusteigen. Dabei sinkt die Arbeitslosenquote in keiner Phase des Rückgangs wieder auf das Niveau zurück, das sie vor der letzten Anstiegsphase hatte. Dies erklärt, warum die Arbeitslosenquote über den Gesamtzeitraum deutlich angestiegen ist, obwohl sich regelmäßig Phasen ansteigender und sinkender Arbeitslosenquoten abwechseln. 39.2 Darstellung von Veränderungen Anstatt der absoluten Werte einer Zeitreihe können auch deren Veränderungen gegenüber der jeweiligen Vorperiode dargestellt werden. Für die Arbeitslosenquote geschieht dies in Abbildung 39.2. Das Diagramm wurde mit den folgenden Einstellungen erzeugt: ¾ Befehl: Zum Erstellen eines Sequenzdiagramms dient der Befehl GRAFIKEN SEQUENZ... ¾ Beschreibung des Diagramms: Fügen Sie in dem Dialogfeld dieses Befehls die Variable alq in das Feld Variablen ein, und geben Sie in dem Feld Zeitachsenbeschriftung die Variable jahr an. Zusätzlich wird die Option Differenz angekreuzt. In dem Eingabefeld dieser Option wird der Wert 1 beibehalten. 426 Zunächst ist zu beachten, daß sich der erste Wert in dem Diagramm nicht wie in der vorhergehenden Grafik auf 1960, sondern auf 1961 bezieht. Dies liegt daran, daß für das Jahr 1960 keine Differenz 1. Ordnung berechnet werden konnte, da hierfür die Arbeitslosenquote von 1959 hätte bekannt sein müssen. Neben der Zeitreihe ist in der Grafik auch eine horizontale Linie auf dem Niveau einer Veränderung von null eingezeichnet. 427 Dadurch wird auch hier wieder deutlich, daß in mehreren aufeinanderfolgenden Jahren positive Veränderungen, also Erhöhungen der Arbeitslosenquote, beobachtet werden konnten. Das gleiche gilt für negative Veränderungen und damit für Jahre mit einem Rückgang der Arbeitslosenquote gegenüber dem Vorjahr. Auffällig ist, daß die positiven Veränderungen sehr viel größere Werte erreichen als die negativen Veränderungen. In mehreren Jahren können Erhöhungen der Arbeitslosenquoten zwischen 1,5 und 2 Prozentpunkten beobachtet werden. Der größte in einem Jahr beobachtete Rückgang beläuft sich dagegen auf nicht einmal einen Prozentpunkt. Offensichtlich sind die Phasen mit einem Rückgang der Arbeitslosenquote nicht wesentlich kür- 426 Der Wert 1 in diesem Feld legt fest, daß in dem Diagramm für jedes Jahr die Differenz zwischen dem für dieses Jahr beobachteten Wert und dem entsprechenden Vorjahreswert dargestellt wird. Dies sind die Differenzen erster Ordnung. Würden Sie in dem Feld den Wert 2 eingeben, würden damit die Differenzen 2. Ordnung wiedergegeben. Dies sind nicht etwa die Differenzen zwischen dem für ein Jahr beobachteten Wert und dem zwei Jahre vorhergehenden Wert, sondern es handelt sich um die Veränderungen der Differenzen 1. Ordnung, also um die Veränderung der Veränderung. Siehe hierzu auch Transformieren, S. 969. 427 Hierzu wurde im Grafikeditor mit dem Befehl DIAGRAMME, BEZUGSLINIE eine Bezugslinie für die Skalenachse eingefügt.
968 Kapitel 39 Sequenzdiagramme zer als die Phasen mit einer Zunahme der Quote, allerdings fällt die durchschnittliche Veränderung pro Jahr in den Phasen des Rückgangs niedriger aus. 2,5 Arbeitslosenquote - Alte Bundesländer 2,0 1,5 1,0,5 0,0 -,5-1,0 1962 1966 1970 1974 1978 1982 1986 1990 1994 1964 1968 1972 1976 1980 1984 1988 1992 1996 JAHR Transformiert: Differenz (1) Abbildung 39.2: Sequenzdiagramm mit den ersten Differenzen der Arbeitslosenquote 39.3 Erstellen eines Sequenzdiagramms Um ein Sequenzdiagramm zu erstellen, wählen Sie den Befehl GRAFIKEN SEQUENZ... Dieser Befehl öffnet das Dialogfeld aus Abbildung 39.3. Die Abbildung zeigt die Einstellungen, die für das Diagramm aus Abbildung 39.1, S. 966 verwendet wurden. Die Variablenliste führt alle Variablen der Datendatei auf. Textvariablen können für die Zeitachsenbeschriftung verwendet werden. ¾ Variablen: Geben Sie eine oder mehrere numerische Variablen an, deren Werte Sie als Folge in einem Sequenzdiagramm darstellen möchten. Wenn Sie mehrere Variablen angeben, werden die verschiedenen Wertefolgen per Voreinstellung gemeinsam in einer Grafik dargestellt. Sie können jedoch die Option Ein Diagramm je Variable ankreuzen, um für jede ausgewählte Variable ein eigenes Sequenzdiagramm zu erstellen. ¾ Zeitachsenbeschriftung: Per Voreinstellung wird die Kategorienachse (die Zeitachse) in dem Diagramm mit den Fallnummern aus der Datendatei beschriftet. Sie können aber eine numerische oder eine Textvariable in dem Feld Zeitachsenbeschriftung angeben, um deren Werte zur Achsenbeschriftung zu verwenden.
39.3 Erstellen eines Sequenzdiagramms 969 ¾ Transformation: Sie können Transformationen der Variablenwerte durchführen, um statt der Ursprungsdaten aus der Datendatei in dem Diagramm die transformierten Werte darzustellen. Auf diese Weise lassen sich die natürlichen Logarithmen, Differenzen oder saisonale Differenzen berechnen und darstellen (s.u.). ¾ Zeitlinien: In dem Dialogfeld der Schaltfläche Zeitlinien können Sie eine oder mehrere senkrecht zur Zeitachse verlaufende Bezugslinien in das Diagramm einfügen (s.u.). ¾ Format: Hier können Sie unter anderem festlegen, ob die Grafik als Linienoder als Flächendiagramm erstellt werden soll und welche der beiden Achsen dabei die Zeitachse bildet (s.u.). Abbildung 39.3: Dialogfeld des Befehls GRAFIKEN, SEQUENZ Transformieren Sie können auf die Variablenwerte eine oder mehrere der folgenden Transformationen anwenden: ¾ Natürlicher Logarithmus: Berechnet die natürlichen Logarithmen der Variablenwerte (Logarithmen zur Basis e). Werte kleiner oder gleich null, für die der Logarithmus nicht definiert ist, werden dabei wie fehlende Werte behandelt. An der entsprechenden Stelle wird in dem Diagramm kein Punkt dargestellt, und die Linie wird unterbrochen. ¾ Differenz: Es werden die Differenzen n-ter Ordnung berechnet. Den Grad der Ordnung n können Sie in dem Eingabefeld festlegen. Per Voreinstellung werden die Differenzen 1. Ordnung verwendet. Die Differenzen 1. Ordnung ergeben sind, indem von dem Wert eines Falles der Wert aus dem vorhergehenden Fall abgezogen wird. Die Differenzen 2. Ordnung werden berechnet, indem die
970 Kapitel 39 Sequenzdiagramme gleiche Prozedur auf die Differenzen erster Ordnung angewandt wird. Von der für einen Fall berechneten Differenz 1. Ordnung wird also die für den vorhergehenden Fall ermittelte Differenz 1. Ordnung abgezogen. Für die ersten n Fälle können die Differenzen nicht berechnet werden. ¾ Saisonale Differenz: Diese Option steht nur zur Verfügung, wenn in der Datendatei eine Zeitreihendefinition verwendet wird. 428 Die Periodizität der Zeitreihe wird unterhalb der Option Saisonale Differenz angegeben. Saisonale Differenzen 1. Ordnung werden berechnet, indem von dem Wert eines Falles der Wert der letzten vergleichbaren Periode abgezogen wird. Wenn Sie beispielsweise Quartalsdaten betrachten, beträgt die Periodizität 4. Die Differenz 1. Ordnung für den fünften Fall ergibt sich dann als Differenz zwischen dem Wert dieses Falles und dem Wert des ersten Falles aus der Datendatei. Für die ersten vier Fälle lassen sich dabei keine Differenzen 1. Ordnung berechnen. Entsprechend ergeben sich die Differenzen 2. Ordnung, indem von den Differenzen 1. Ordnung jeweils die vier Fälle vorhergehenden Differenzen 1. Ordnung abgezogen werden. Zeitlinien Als Zeitlinien werden bei den Sequenzdiagrammen Bezugslinien bezeichnet, die senkrecht zur Zeitachse verlaufen und damit einen ausgewählten Zeitpunkt markieren. Um eine oder mehrere dieser Zeitlinien in das Diagramm einzufügen, öffnen Sie mit der Schaltfläche Zeitlinien das Dialogfeld aus Abbildung 39.4, und wählen Sie dort zwischen den folgenden Optionen: ¾ Keine Bezugslinien: Diese Option ist voreingestellt, so daß in das Diagramm keine Zeitlinien eingefügt werden. ¾ Linie bei jedem Wechsel von: Sie können eine numerische Variable oder eine Textvariable angeben, um an jeder Stelle, an der sich der Wert dieser Variablen ändert, eine Bezugslinie in das Diagramm einzufügen. ¾ Linie bei Zeitpunkt: Mit dieser Option geben Sie einen Zeitpunkt vor, für den eine Bezugslinie in das Diagramm eingefügt werden soll. Wenn Sie in der Datendatei mit dem Befehl DATEN, DATUM DEFINIEREN eine Zeitreihe zur Definition eines Datums erstellt haben, werden für diese Option je nach zugrundeliegendem Datumsformat unterschiedliche Eingabefelder angeboten, mit denen Sie das Datum beschreiben können. Ist in der Datendatei kein Datum definiert, können Sie die Nummer einer Beobachtung angeben. Geben Sie beispielsweise die Zahl 22 an, um an der Position der 22. Beobachtung eine Zeitlinie einzufügen. Ist in der Datendatei ein aus mehreren Komponenten (z.b. Jahr, Quartal und Monat) bestehendes Datum definiert, müssen für die Einheiten der untersten Ebene keine Angaben vorgenommen werden. Geben Sie beispielsweise ledig- 428 Eine Zeitreihendefinition erstellen Sie mit dem Befehl DATEN, DATUM DEFINIEREN. Siehe hierzu im einzelnen Abschnitt 9.8, Datumsvariablen erstellen, S. 246.
39.3 Erstellen eines Sequenzdiagramms 971 lich das Jahr 1998 an, so wird an der Stelle des ersten Zeitpunktes aus diesem Jahr eine Zeitlinie eingefügt. Abbildung 39.4: Dialogfeld der Schaltfläche Zeitlinien Format Die Schaltfläche Format öffnet das Dialogfeld aus Abbildung 39.5, in dem Sie verschiedene Formatierungen der Grafik einstellen können. Abbildung 39.5: Dialogfeld der Schaltfläche Format ¾ Zeit auf horizontaler Achse: Diese Option ist per Voreinstellung angekreuzt, so daß die Abszisse die Zeitachse bildet. Wählen Sie die Option ab, wenn die Zeit an der Ordinate abgetragen werden soll. ¾ Diagramme einzelner Variablen: Die Optionen dieser Gruppe wirken sich ausschließlich auf Sequenzdiagramme mit nur einer Datenreihe aus. Für diese Diagramme können Sie wählen, ob die Zeitreihe in einem Liniendiagramm oder in einem Flächendiagramm dargestellt werden soll. Für die Darstellung mehrerer Zeitreihen in einer Grafik wird stets ein Liniendiagramm verwendet.
972 Kapitel 39 Sequenzdiagramme Mit der Option Bezugslinie am Mittelwert der Zeitreihe können Sie eine parallel zur Zeitachse verlaufende Bezugslinie auf der Höhe des Mittelwertes der dargestellten Variablen in das Diagramm einfügen. ¾ Diagramm mit mehreren Variablen: Wenn Sie mehrere Zeitreihen in einer Grafik darstellen, können die sich jeweils entsprechenden Punkte der verschiedenen Zeitreihenlinien durch senkrechte Linien miteinander verbunden werden. Kreuzen Sie hierzu die Option Fälle zwischen Variablen verbinden an.