Big Data macht sich an den Datenschatz der SBB Bernhard Rytz, Jürg Frühauf
Wenn die SBB wüsste, was die SBB weiss SBB IT @ BAT Datenstrategie & Big Data 21.11.14 2
Ein Beispiel: Die Sicht auf den Kunden ist fragmentiert. Petra Muster Je nachdem welches Produkt Frau Muster kauft oder welche Dienstleistung sie in Anspruch nimmt, wird sie in unterschiedlichen Anwendungen* erfasst. Kauft im Railaway Online Shop Ein Kombi Angebot für das Kunstmuseum Basel. Kunde Railaway E-Boutique E-Boutique REM Kunde SBB Webshop MCS::CRM Konsultiert den Internet Fahrplan und kauft sich zusätzlich eine Fahrt Basel- Freiburg im Breisgau. SAP BI::UCV Kauft sich in Bern am Bahnhof einen Snack. Kunde anonym KUBA Wird im Zug nach Basel kontrolliert. Hat ihr HTA vergessen. Kunde mit Abonnement (öv Stammkunde) SAP CRM Reisende ohne gültigen Fahrausweis Kauft sich im Zug einen Kaffee. Kunde anonym SAP ERP::RogF Vergisst ihre Brieftasche im Zug und meldet dies. Kunde Lost & Found Ist gehbehindert und benötigt eine Hilfestellung beim Umsteigen in Basel. Kunde mit Handicap New Lost&Found Handicap Meldet sich beim Kundendienst um sich für den tollen Service zu bedanken. Kunde KUDI MailMinder *Alleine im Personenverkehr werden in mehr als 20 Anwendungen Kundendaten gehalten. Dazu kann eine Person zb auch noch bei IM Mieter sein etc. SBB IT @ BAT Datenstrategie & Big Data 21.11.14 3
Ziel: Kundennutzen und Effizienz dank professionellem Umgang mit Daten. Ziele: Wir schöpfen mehr Wert aus unseren Daten Wir senken die Kosten im Umgang mit Daten Wir managen Risiken im Umgang mit Daten besser Effekte eines professionellen Datenmanagements: Wir kennen unsere Daten Wir haben unsere Daten im Zugriff Wir schützen unsere Daten wo nötig Wir stellen sicher, dass unsere Daten die nötige Qualität haben Wir wissen, wer welche Verantwortung im Umgang mit Daten hat Wir steuern die Datenflüsse an der Unternehmensgrenze SBB IT @ BAT Datenstrategie & Big Data 21.11.14 4
Die «Datenkarte» - wir fokussieren auf definierte Handlungsfelder. Geschäftspartner Einheitliche Kundensicht Kunde Kunde P, G, I, IM Kanton Mitarbeiter Interne Externe Mitarbeiter TU Partner Lieferant Transportuntern. liefertâ Feste Anlagen Feste plantáanlage Material Rollmaterial Immobilie ICT Anlage erbringt à kauft à erbringt à bezieht sich auf ß ß beschreibt Produkt Trasse Verkehrsfahrt Gütertransport Immobilie besteht aus â Leistung Zug (Fahrt, Reinigung, ) Facility Management Kontrolle Ereignis Störung Anlagezustand Grundlagen Open Data Big Data Abweichung führt zu â steuert ß löst aus à ß erstellt/wartet Produktionsplan Betrieblicher Fahrplan Ressourcenplan Fertigungsplan plant â Auftrag/Projekt Beschaffung Bau Unterhalt ß ändert löst aus à löst aus á Langfristplan Angebotsplan MUP verfeinert â weisen potentiell einen Bezug zu allen Elementen auf Referenzdaten Verortung Standort Topologie / Infrastrukturnetz Organisation Betriebs- Finanzbuchhaltung Erlös / Kosten Dokumente Kommunikation Information nicht strukturiert SBB IT @ BAT Datenstrategie & Big Data 21.11.14 5
SBB Glossar und Dateninventar schaffen Transparenz als Grundlage für Standardisierung und Innovation. SBB Glossar Ein Zug ist ein einzelnes oder zusammengekuppeltes Triebfahrzeug mit oder ohne Wagen, die auf die Strecke übergehen Dateninventar Datenbestände IT-Systeme Fahrzeug Formation R CRUD Verwendung Datenmanagement Grundlage für eine effiziente Bewirtschaftung der Daten Abnützbarer Leiter, welcher der Stromübertragung zwischen Fahrleitungsanlage (FL) und Fahrzeugen dient. Anlage Standort Kunde CRUD CRUD CRUD CRUD CRUD In Planung DINAR Unternehmensarchitektur: IT-Planung und -Steuerung Vermeidung von (neuen) Datenredundanzen Standardisierung der Datenbeschaffung durch definierte Datenbezugspunkte Ein Kunde (Leistungsbezüger) ist ein Geschäftspartner (Person, Organisation, Gruppe) der eine durch die SBB vertriebene Leistung (z.b. Fahrausweis des Direkten Verkehrs, Geldwechsel, usw) bezieht oder durch das Marketing bearbeitet wird. Material CRUD CRUD Strategieentwicklung Erkennen von Mehrwerten aus Daten Innovation aus Daten SBB IT @ BAT Datenstrategie & Big Data 21.11.14 6
«Big Data» und der Datenschatz. «Datafication» Digitale Spur Sensoren Smart Devices Business z.b. bei SBB: Kampagnenmanagement; Optimierung Instandhaltung; Optimierung Bahnbetrieb Nutzen der Daten erkennen Fragestellungen Zusammenhänge verstehen z.b. bei SBB: Leittechnik und Disposition; Messfahrzeugdaten; Lok-Stromzähler Cloud Computing In-Memory Computing Massive Parallel Processing (MPP) 3V: Grössere Datenmengen (Volume) in vielfältigen Formaten (Variety) fallen in kürzerer Zeit (Velocity) an. Analytische Fähigkeiten im Business und hochentwickelte IT- Technologien ermöglichen, mehr geschäftsrelevante Erkenntnisse aus den wachsenden Datenbeständen zu gewinnen. Technologie SBB IT @ BAT Datenstrategie & Big Data 21.11.14 7
Hypothese 1: Die SBB haben keine «Big Data». 100 TB proprietäre binäre Dateiformate Diagnosefahrzeug Squat Offline Auswertung SBB IT @ BAT Datenstrategie & Big Data 21.11.14 8
Zukunft: Proaktives Handeln mit Prognosefähigkeit. Messung Nachbearbeitung Datenpool Analyse Planung 0.12 0.1 0.08 Corrugation measurement 2011-08 2011-10 2012-05 2012-11 2011-08 2011-10 2012-05 2011-08 2011-10 2011-08 Big Data Scope [Q] mmrms 0.06 0.04 0.02 [t 1 ] [t 2 ] 0 20 21 22 23 24 25 Line [km] SBB IT @ BAT Datenstrategie & Big Data 21.11.14 9
Hypothese 2: Zuerst muss die Datenqualität stimmen. Rollmaterial (Typ, Alter, etc.) Aufwandverhältnis Datenaufbereitung / Analyse: Ist: 80% / 20% Soll: 20% / 80% SBB IT @ BAT Datenstrategie & Big Data 21.11.14 10
Hypothese 3: Ich kriege ja meine Kennzahlen schon. Effizienzsteigerung vs. Effektivitätssteigerung SBB IT @ BAT Datenstrategie & Big Data 21.11.14 11
Gold allein macht nicht glücklich. SBB IT @ BAT Datenstrategie & Big Data 21.11.14 12
Hypothese 4: Uns fehlt das notwendige Know-how. P P P SBB IT @ BAT Datenstrategie & Big Data 21.11.14 13
Big Data Proof-of-Value Architektur. Integration Advanced Analytics Splunk / Hunk Relational DB / DWH SAP HANA Hadoop Cluster Hive / Hbase / Impala as pre-relational Data Store R SAS Mahout Matlab HDFS as Raw Data Store («Data Lake») Storm / CEP as Real Time Streaming Engine Raw Data Sourcing Pig Spark / MLib Java / Python Int. / ext. Data Streams Int. / ext. Data Sources SBB IT @ BAT Datenstrategie & Big Data 21.11.14 14
Chance: Big Data birgt ein grosses Enabler-Potential. Ú Big Data sind für Analytiker zentral verfügbar ( Data Lake ) Ú Plattform für Forschung & Entwicklung (Labor) Ú Unterstützt Innovationen ( wenn ich die Daten hätte, könnte ich mal die Einflussfaktoren untersuchen oder testen, ob eine Idee funktioniert ) Ú Benötigt Datenstrategie und Data Governance, damit nicht viele trübe Pfützen entstehen, sondern ein klarer Bergsee Ú Benötigt Wirkungsziele im Business SBB IT @ BAT Datenstrategie & Big Data 21.11.14 15
Fazit: Durchblick im Datensee. SBB IT @ BAT Datenstrategie & Big Data 21.11.14 16
Besten Dank. Aktuell gesucht: Daten- und Integrationsarchitekt (Link)