Paket: MUCflights Seminararbeit für Statistical Data Analysis in R Aisen Yang im Studiengang Master-Wirtschaftsmathematik am Institut für Mathematik der Universität Augsburg Betreuer: Prof. Antony Unwin und Alexander Pilhöfer 19. Februar 2014 1
Zusammenfassung In dieser Seminararbeit wird das R-Paket MUCflights untersucht. Einige wichtige Variablen wie Fluggesellschaften, Staaten, Fliegertypen und Tageszeiten sowie ihre Zusammenhänge miteinander werden durch graphische Methoden dargestellt. 2
Inhaltsverzeichnis 1 Einführung 4 2 Beschreibung des Datensatzes 5 2.1 Verlauf aller Tage............................... 5 2.2 Fluggesellschaften............................... 7 2.3 Terminals.................................... 8 2.4 Staaten..................................... 9 2.5 Fliegertypen.................................. 13 2.6 Tageszeiten................................... 13 3 Analysen der Zusammenhänge zwischen Variablen 16 3.1 Zusammenhänge zwischen Staaten und Fluggesellschaften....... 16 3.2 Zusammenhänge zwischen Fluggesellschaften und Fliegertypen.... 21 3.3 Zusammenhänge zwischen Staaten und Fliegertypen........... 22 4 Zusammenfassung 23 3
1 Einführung Das Paket MUCflights enthält Flugdaten von München Franz-Josef-Strauß-Flughafen zwischen 9. November 2010 und 9. Februar 2011, also eine Zeitspanne von drei Monaten. In diesem R-Paket gibt es insgesamt vier Funktionen und einen Datensatz. Der Datensatz airports zeigt Informationen fast aller kommerziellen Flughafen von allen Ländern. Hier werden z.b. die Namen und geographische Lagen eines Flughafens dokumentiert. Die Funktion routes erzeugt geographische Positionen von Fliegern in verschiedenen Zeitpunkten und die Funktion movie erzeugt eine Animation der Flieger in verschiedenen Zeitpunkten. Mit den Funktionen flights und getflights können Informationen von Fluglinien auf und an im Flughafen München hervorgerufen werden. Ein Beispiel, wie wir mit der Funktion flights den gewünschten Daten vom 9. November 2010 für unsere Analyse hervorrufen können, wird folgend gezeigt: Abbildung 1: Funktion: flights In dieser Seminararbeit werden zuerst einige wichtige Variablen aus den durch Funktion flights erzeugten Datensätzen zusammengefasst, wie z.b. Fluggesellschaften aus lvg, Staaten aus lde, Ankunfts- oder Abflugszeiten aus ett und Fliegertypen aus typ. Nachdem wir diese Variablen einzeln betrachtet haben, plotten wir anschließend ihre Zusammenhänge miteinander. 4
2 Beschreibung des Datensatzes Um einen Überblick von diesen Datensatz zu bekommen, zeichnen wir zuerst die Anzahl von Ankunfts- und Abflugsfliegern zwischen den drei Monaten von 9. November 2010 bis 9. Februar 2011. 2.1 Verlauf aller Tage Abbildung 2: Anzahl von Ankunfts- und Abflugsfliegern Der Verlauf von täglicher Fliegeranzahl von Ankunft und Abflug entspricht einer v- förmigen Kurve, wie wir auf Abbildung 2 sehen können. Wir könnten vermuten, dass der Grund für diese Senkung vor allem an Weihnachten und Silvester am Ende des Jahres liegt, da man am Jahresende normalerweise dazu neigt, diese Zeit zu Hause mit Familie zusammen zu verbringen. Neben der v-förmigen Kurve sieht der Verlauf zwar zufällig aus, wenn man aber genau betrachtet, sieht man, dass es lokal aufsteigende Muster wie folgend gibt: Abbildung 3: Lokale Muster Hier sehen wir, dass jedes Muster sieben Punkte enthält, genau wie die Anzahl der 5
Wochentage. Was wir daraus vermuten können, ist die Abhängigkeit der Fliegeranzahl von verschiedenen Wochentagen. Gliedern wir es nach Wochentagen, haben wir: Abbildung 4: Muster nach Wochentagen Wir sehen hier, dass es tatsächlich Unterschiede in verschiedenen Wochentagen gibt. Die schwarze und graue Linien am ganz unten stehen jeweils für Sonntag und Samstag, d.h. am Wochenende reist man viel weniger mit Flugzeug in München Flughafen. Das kann man auch verstehen, weil Wochenende normalerweise keine Geschäftstage sind und man oft zu Hause bleibt, sinkt daher das Bedürfnis von Flugreisen. Wie wir noch sehen können, bleibt die Tendenz des Verlaufs für alle Wochentage wie eine v-förmige Kurve. Eine bemerkenswerte Sache hier ist, dass es eine Senkung der Fliegeranzahl gegen Ende November vorkommt. Abbildung 5: Senkung im Muster Wenn es Senkung nur in einem einzigen Tag gibt, könnten wir vermuten, dass es wegen Zufalls vorkommt; wenn aber die Fliegeranzahl von einigen nebeneinanderliegenden Tagen gleichzeitig sinkt, denken wir, dass es mit großer Wahrscheinlichkeit 6
Geschichte dahinten geben könnte. Es gibt auch tatsächlich einen Hintergrund dafür. Aus einem Streik des Lufthansa Abfertigungspersonals in Paris-Charles de Gaulle- Flughafen zwischen 29. November und 1. Dezember, werden 99 Flüge von Deutschland nach Paris gestrichen. Aus den direkten und indirekten Wirkungen vom diesen Streik hat sich die tägliche Fliegeranzahl auch gesenkt. Um es anhand des Verlaufs der Fliegeranzahl von Lufthansa zu sehen, haben wir folgendes Bild der Fliegeranzahl verschiedener Fluggesellschaften: 2.2 Fluggesellschaften Abbildung 6: Fluggesellschaften Hier steht blaue Punkte für Fliegeranzahl von Lufthansa, rote für AirBerlin und schwarze für die Summe aller anderen Fluggesellschaften. Hier sehen wir, dass Lufthansa einen dominanten Großteil der gesamten Geschäfte in Flughafen München macht und die Verläufe der täglichen Fliegeranzahl verschiedener Fluggesellschaften auch einer v-förmigen Kurve entsprechen. Was noch auffällt, ist die Senkung der Fliegeranzahl von Lufthansa im Vergleich zu anderen Fluggesellschaften gegen Ende November. Der Grund dafür könnte vor allem an dem Streik in Paris-Charles de Gaulle-Flughafen, wie wir davor erwähnt haben. Schauen wir die Situation von Fluggesellschaften durch Boxplot genauer, dann haben wir: 7
Abbildung 7: Fluggesellschaften in Boxploten Hier sehen wir, wie schon erkannt, dass Lufthansa einen Großteil der Geschäfte macht, während andere Fluggesellschaften viel weniger Geschäfte haben. In München Flughafen gibt es insgesamt zwei Terminals. Wir versuchen jetzt die Nutzungssituation von diesen beiden Terminals anschaulich zu sehen. Wir plotten wiederum den Verlauf der täglichen Fliegeranzahl von diesen beiden Terminals: 2.3 Terminals Abbildung 8: Terminals Die roten Punkte stehen für Terminal 2 und blau für Terminal 1. Im Vergleich zum Terminal 1 wird die tägliche Fliegeranzahl beim Terminal 2 viel stärker vom Jahresende beeinflußt. Im Vergleich zum Terminal 1 wurde Terminal 2 erst später am 29. Juni 8
2003 in Betrieb genommen. Damals wurde Terminal 2 teilweise von Lufthansa geplant und finanziert. Heutzutage wird Terminal 2 auch vor allem von Lufthansa und Star Allianz genutzt. Später werden wir noch durch graphische Darstellung sehen, dass die Nutzung von Terminal 2 vor allem durch Lufthansa belegt wird. 2.4 Staaten Abbildung 9: Verschiedene Staaten Blaue Punkte stehen für Deutschland, während grün, rot, orange, gold und schwarz jeweils für Italien, Großbritannien, Spanien, Niederland und die Summe aller anderen Staaten. Hier sehen wir, dass die Geschäfte innerhalb von Deutschland in Flughafen München im Vergleich zu anderen Staaten sehr groß ist. Auch hier entsprechen die Verläufe der verschiedenen Staaten einer v-förmigen Kurve. Betrachten wir verschiedene Staaten mit Boxploten, haben wir: 9
Abbildung 10: Staaten in Boxploten Hier sehen wir, dass Geschäfte innerhalb von Deutschland einen Großteil aller Geschäfte machen. Obwohl viele Staaten einer v-förmigen Tendenz folgt, gibt es einige Ausnahmen, die außergewöhnliche Muster besitzen. Zuerst schauen wir die Situation von Russland. Abbildung 11: Verlauf von Russland Statt einer normalen v-förmigen Kurve verläuft die Flieger zwischen Flughafen München und den in Russland wie ein umgekehrtes v. Der Grund dafür könnte an dem Tag der Bescherung am 6. Januar und dem orthodoxen neuen Jahr am 11. Januar liegen. Neben Russland schauen wir Griechenland: 10
Abbildung 12: Verlauf von Griechenland Hier bei Griechenland sehen wir, dass der Fliegeranzahl zwischen Flughafen in Griechenland und in München relativ konstant bleibt. Es gibt täglich fast immer 14 Flieger. Jahresende hat zwar Einfluss auf die Fliegeranzahl, ist es jedoch nicht sehr eindeutig zu erkennen. Am Ende betrachten wir auch die Situation in Spanien. Abbildung 13: Verlauf von Spanien Bei Spanien sehen wir, dass die Einflüsse von Silvester und Weihnachten relativ gering ist. Es gibt zwar Einflüsse vom Jahresende, ist es aber nicht so klar wie für andere Länder. Um es klarer zu erkennen, legen wir die Daten von drei Ländern mit ähnlicher Fliegeranzahl zusammen, dann haben wir: 11
Abbildung 14: Spanien, Schweiz und Polen Hier stehen die schwarzen Punkte für Spanien, rot für Polen und blau für Schweiz. Die Tendenz der Verläufe können wir anhand der Punkte nur ganz grob sehen. Glätten wir es mit lowess, dann haben wir: Abbildung 15: Spanien, Schweiz und Polen Dadurch sehen wir, dass der Verlauf der Fliegeranzahl von Spanien im Vergleich zu anderen zwei Ländern wirklich viel konstanter liegt. Nachdem wir die Situationen für verschiedene Länder gesehen haben, schauen wir noch kurz die Fliegertypen durch Boxploten an. 12
2.5 Fliegertypen Abbildung 16: Fliegertypen Die roten Boxploten stehen für Produkte von Airbus, blau für Boeing und grau für andere Fliegerhesteller. Wie wir hier sehen können, macht Produkte von Airbus einen Großteil der Flieger, während Produkte von Boeing viel weniger sind. Der Grund dafür liegt vor allem an Lufthansa, wie wir später noch sehen werden. Was uns noch interessiert, sind die Ankunfts- und Abflugszeiten. Wir wissen, dass die Fliegeranzahl auf verschiedenen Zeitpunkten am Tag unterschiedlich sind, z.b. tief in der Nacht gibt es wegen Flugverbots keine Flieger. Um den Tagesverlauf der Fliegeranzahl genauer zu wissen, betrachten wir jetzt das folgende Bild von Fliegeranzahl in verschiedenen Tageszeiten. 2.6 Tageszeiten Abbildung 17: Ankunfts- und Abflugszeiten 13
Das Bild zeigt die Summe der Fligeranzahl von allen Tagen innerhalb der drei Monaten von 9.11.2010 bis 9.2.2011 für verschiedene Tageszeiten. Das Intervall zwischen zwei Zeitpunkten auf X-Achse im Bild beträgt fünf Minuten, d.h. es gibt insgesamt 288(=24*12) Zeitpunkte für den ganzen Tag. Die auf und unten verlaufende Tendenz können wir nur grob erkennen. Glätten wir es anhand Mondrian mit Dichteschätzer, dann haben wir: Abbildung 18: Geglättete Ankunfts- und Abflugszeiten Hier sehen wir, dass die Tendenz wellenförmig verläuft. Zwischen 0 und 5 Uhr gibt es fast keine Flieger; dann steigt die Fliegeranzahl bis mittags, worauf eine Senkung folgt, vielleicht wegen Mittagspause. Anschließend steigt die Fliegeranzahl wieder und kommt dann die nächste Senkung um 17.30 Uhr, vielleicht wegen Pause für Abendessen. Am Abend steigt die Anzahl der Flieger zuerst wieder und sinkt langsam bis zum Tagesende. Wir fragen uns vielleicht dann, Gibt es Unterschiede für die Ankunfts- und Abflugszeiten?. Um es zu beantworten, betrachten wir die Verläufe der Fliegeranzahl von Ankunfts- und Abflugszeiten getrennt. Abbildung 19: Getrennte Zeiten Hier stehen die roten Punkte für Fliegeranzahl von Ankunft und blau für Abflug. Wie wir sehen können, dass beide Fälle wellenförmig laufen. Im Vergleich zum Abflug sind die Abweichungen der Ankunftszeiten viel konstanter. Um die Tendenz besser zu beobachten, glätten wir es durch lowess: 14
Abbildung 20: Getrennte Zeiten Hier sehen wir, dass die Tendenz von Ankunft und Abflug sich abwechseln, d.h. die Spitzen der Wellen von Ankunfts- und Abflugszeiten überschneiden sich nicht, sondern kommen alternierend vor. Ein möglicher Grund ist die Glättung der Arbeitskapazitäten des Flughafens. Statt Spitzbelastung ist es besser für das System, konstante und mildere Arbeitslast zu halten. Ein anderer Grund könnte an der Pause der Zeiten zwischen Ankunfts- und Abflugszeiten für einen Flieger liegen. Ein Flieger landet auf Flughafen München, macht eine Pause für ungefähr eine Stunde, dann fliegt er wieder ab. 15
3 Analysen der Zusammenhänge zwischen Variablen In diesem Kapitel versuchen wir die Zusammenhänge zwischen verschiedenen Variablen darzustellen. Alle Analysen in diesem Kapitel werden anhand Daten aus dem Tag 9. November 2010 durchgeführt. 3.1 Zusammenhänge zwischen Staaten und Fluggesellschaften Zuerst betrachten wir die Zusammenhänge zwischen Fluggesellschaften und Staaten durch Fluktuationsdiagramm aus dem R-Paket extracat für den Tag 9. November 2010: Abbildung 21: Getrennte Zeiten Auf der linken Y-Achse sind verschiedene Fluggesellschaften, auf der oberen X- Achse sind verschiedene Staaten. Um die Tendenz besser zu sehen, haben alle Einträge darin Fliegeranzahl größer als 5, d.h. Einträge mit kleinerer Fliegeranzahl werden ignoriert. Was uns hier zuerst auffällt, ist die lange horizontale Reihe von Lufthansa. Die lange Reihe zeigt, dass Lufthansa Geschäfte in vielen verschiedenen Staaten treibt, während andere Fluggesellschaften nur Geschäfte in bestimmtem Land hat. Früher haben wir erwähnt. dass Terminal 2 vor allem von Lufthansa und Star Allianz benutzt wird. Um es klarer zu sehen, betrachten wir jetzt die Situationen für verschiedene Terminals getrennt: 16
Abbildung 22: Terminal, Staaten und Fluggesellschaften Es gibt hier zwei Blöcke, der obere steht für Terminal 1 und der untere für Terminal 2. Hier werden nur Einträge mit Fliegeranzahl größer als 10 gezeigt. Wir sehen hier, dass Terminal 2 vor allem von drei Fluggesellschaften benutzt, nämlich LOT, Lufthansa und Skandinavian Airlines, die alle zum Star Allianz gehören. Alle anderen nicht zum Star Allianz gehörenden Fluggesellschaften wie Air France, Airberlin usw. treiben Geschäfte im Terminal 1. Auch in dieser Abbildung sehen wir, dass die Geschäfte von Lufthansa sehr umfangreich sind. Da Lufthansa einen Großteil der Geschäfte in Flughafen München macht, betrachten wir die Situation von Lufthansa durch parallele Koordinatenplot aus dem R-Paket extracat genauer: 17
Abbildung 23: Lufthansa Hier sehen wir, dass Lufthansa Geschäfte in vielen Ländern hat, aber nur durch Terminal 2. Auch Deutschland spielt eine wichtige Rolle für die Geschäfte in Flughafen München, wie Lufthansa für andere Fluggesellschaften. Betrachten wir die Situation von Deutschland genauer, dann haben wir: Abbildung 24: Deutschland Hier sehen wir, dass die Geschäfte in Deutschland vor allem von drei Fluggesellschaften getrieben werden, nämlich Lufthansa, Germanwings und Airberlin. Ebenfalls 18
sehen wir, dass die Geschäfte in Deutschland nicht nur auf ein Terminal konzentriert werden, sondern auf alle zwei verteilt sind. Um die Einzelheiten von den Geschäften der einzelnen Fluggesellschaften in Deutschland zu sehen, haben wir folgendes Fluktuationsdiagramm: Abbildung 25: Fluggesellschaften und deutsche Städte Hier sehen wir, dass Lufthansa und Airberlin Geschäfte in vielen verschiedenen Städten haben, während andere Fluggesellschaften sich auf bestimmte Städte spezialisieren, die sich nicht mit den Geschäften von Lufthansa oder Airberlin überschneiden. Wir stellen uns vielleicht die Frage, Wie läuft das ganze System zwischen Flughafen München und anderen Flughafen in Deutschland, d.h. wie viele Flieger fliegt täglich von München nach anderen Städten und umgekehrt? Um es zu beantworten, trennen wir jetzt die Situationen von Ankunft und Abflug in Flughafen München: 19
Abbildung 26: Hin- und Rückflug Wie wir hier sehen, dass es zwei Blöcke gibt, L für Ankommen und S für Abflug. Das auffällige Muster ist, dass diese zwei Blöcke fast gleich aussehen, d.h. wenn es z.b. zehn Flieger von München nach einer anderen Stadt in Deutschland fliegt, kommen am gleichen Tag genau so viele zurück. Wenn wir die Situation nicht nur in Deutschland betrachten, sondern international, können wir sehen, dass das gleiche Ergebnis auskommt: Abbildung 27: Hin- und Rückflug 20
Diese zwei Bilder zeigen zwar nur die Situation für den Tag 9. November 2010, sind die Situationen an anderen Tagen ähnlich, nämlich wie viele Flieger täglich von Flughafen München nach anderen Flughafen fliegen, kommen genauso viel am gleichen Tag zurück. Jetzt betrachten wir die Zusammenhänge zwischen Fluggesellschaften und Fliegertypen. Wie wir wissen, sind die zwei größte Flugzeugproduzenten Airbus und Boeing. Wenn wir die Situationen von Airbus und Boeing durch Mondrian für den Tag 9. November 2010 betrachten, haben wir folgendes: 3.2 Zusammenhänge zwischen Fluggesellschaften und Fliegertypen Abbildung 28: Airbus und Boeing Die linke Spalte zeigt die Fluggesellschaften und die rechte Spalte zeigt vor allem die Produkte von Airbus und Boeing. Hier sehen wir, dass viele Fluggesellschaften nur Produkte aus Airbus und Boeing bestellen. Für Lufthansa an der linken Spalte sehen wir, dass nur Hälfte der Produkte aus Airbus und Boeing kommen. Um die Produktstruktur von Lufthansa genauer zu sehen, machen wir folgend paralleles Koordinatenplot: 21
Abbildung 29: Lufthansa und Fliegertypen In dieser Abbildung werden nur Anzahl mit Einträgen größer als 5 gezählt. Hier sehen wir, dass Lufthansa der größte Käufer vieler Produkte von Airbus ist, wie z.b. A320 und A319, manchmal sogar der einziger Käufer, wie z.b. A321, A333, A343 und A346. Was zu merken ist, dass Lufthansa keine Produkte von Boeing in der Produktstruktur hat. Der Grund könnte an der Unterstützung der europäischen Fliegerproduzeten liegen. 3.3 Zusammenhänge zwischen Staaten und Fliegertypen Am Ende schauen wir kurz die Zusammenhänge zwischen Ländern und Fliegertypen: 22
Abbildung 30: Staaten und Fliegertypen In dieser Abbildung werden wie vorher nur Anzahl mit Einträgen größer als 5 gezählt. Wie wir hier sehen können, einige Fliegertypen sind in vielen Ländern eingesetzt, wie z.b. A320, CRJ9 und E190, während andere nur für ein bestimmtes Land eingesetzt wird, wie z.b. B737, A318, CRJ1 usw. Einige Fliegertypen sind zwar in vielen Ländern eingesetzt, macht aber mehr Geschäfte für bestimmte Länder, wie z.b. A320, A321 und DH8D für Deutschland, CRJ9 für Frankreich sowie E190 und AT72 für Italien. 4 Zusammenfassung Wie wir durch Grafiken bisher gesehen haben, gibt es einige Punkte zu achten. Zuerst wissen wir, dass der Verlauf der Fliegeranzahl eine v-förmige Kurve zeigt. Zweitens wird es auch gezeigt, dass Geschäfte von Lufthansa sowie innerhalb von Deutschland einen großen Bestandteil der gesamten Geschäfte in Flughafen München machen, wobei Lufthansa vor allem Geschäfte im Terminal 2 macht. Bezüglich Fliegertypen wissen wir, dass Lufthansa viele Flieger aus Airbus bestellt, aber kaum von Boeing. Für Tageszeiten wissen wir, dass Ankunftsanzahl und Abfluganzahl der Flieger unterschiedliche Muster erweisen. Im Vergleich zu Ankunft schwankt die Fliegeranzahl von Abflug viel stärker. 23