Big Data Vorsprung durch Wissen Chancen erkennen und nutzen Prof. Dr. Stefan Wrobel Fraunhofer-Institut für Intelligente Analyse- und Informationssysteme IAIS www.iais.fraunhofer.de Prof. Dr. Stefan Wrobel
Fraunhofer IAIS: Intelligente Analyse- und Informationssysteme Do more with data Von Sensordaten bis Business Intelligence, von Medienanalyse bis zu visuellen Informationssystemen: wir versetzen Unternehmen in die Lage, mehr aus Daten zu machen. 200+ MA, am Campus Schloss Birlinghoven bei Bonn Forschungsgebiete Machine Learning and Data Mining Multimedia Pattern Recognition Visual Analytics Process Intelligence Autonomous Systems Prof. Dr. Stefan Wrobel 2
Fraunhofer-Initiative Big Data Gebündelte Kompetenzen in einer»big Data Factory«für Deutschland Strategien, Lösungen und Erfolge 20 Fraunhofer-Institute eine Anlaufstelle Bündelung eines breiten Kompetenzportfolios mit langjähriger Branchenexpertise Marktgerechte Big-Data-Lösungen für individuelle Fragestellungen und Qualifizierung von Nachwuchskräften zu Data Scientists Fraunhofer-Initiative Big Data Impulse für die Zukunft schon heute bigdata.fraunhofer.de Prof. Dr. Stefan Wrobel 3
Heute reden alle über Big Data Prof. Dr. Stefan Wrobel 4
Prof. Dr. Stefan Wrobel 5 Quellen: http://m.sybase.com/detail?id=1095954 und McKinsey Studie, 2011
Big Data Trends Konvergenz Intelligente Systeme www. Nutzer-Inhalte Open Data Prof. Dr. Stefan Wrobel 6
Übersicht öffentlicher Datenquellen (Open Data, Auswahl) 6 Milliarden Webseiten 200 TB Genomdaten 86 Milliarden ngrams 400 Millionen Fakten Über 4,1 Millionen Artikel (in Englisch) 270 Datenkataloge Prof. Dr. Stefan Wrobel 7
Big Data Digitale Spiegelung? Prof. Dr. Stefan Wrobel 8
Big Data Die technische Sicht Prof. Dr. Stefan Wrobel 9 Quelle: BITKOM Big Data Leitfaden, 2012. BITKOM AK Big Data.
Suppliers and technologies in the context of Big Data (Selection) Prof. Dr. Stefan Wrobel 10
Big Data Versuch einer Definition Big Data bezeichnet allgemein Den Trend zur Verfügbarkeit immer detaillierterer und zeitnäherer Daten Den Wechsel von einer modellgetriebenen zu einer daten- und modellgetriebenen Herangehensweise Die wirtschaftlichen Potenziale, die sich aus der Analyse großer Datenbestände bei Integration in Unternehmensprozesse ergeben Big Data unterstreicht aktuell technisch folgende Aspekte Volume, Variety, Velocity In-memory computing, Hadoop etc. Real-time analysis und Skaleneffekte Big Data muss gesellschaftliche Aspekte zentral mit berücksichtigen Prof. Dr. Stefan Wrobel 11
Beispiele für (Big)-Data-driven Enterprises Prof. Dr. Stefan Wrobel 12
Innovationspotenzialanalyse Big Data Recherche (Bestandsaufnahme) Detaillierter Überblick nat. und int. Big Data Landschaft Über 50 systematisierte Big Data Business Cases Branchenspezifische Zukunftsworkshops (Qualitative Untersuchung) Expertenworkshops Finanz, Telekom, Mafo, E-Comm., Versicherung Online-Umfrage (Quantitative Untersuchung) 1.10.2012 bis 30.11.2012 82 Entscheider aus KMUs und Großunternehmen Prof. Dr. Stefan Wrobel 13
Quantitative Big-Data Online-Umfrage Prof. Dr. Stefan Wrobel 14
Jede Branche hat demnach charakteristische Unternehmensbereiche für Big Data Anwendungen Prof. Dr. Stefan Wrobel 15
Steigerung der Umsätze und Einsparung von Kosten sind die häufigsten Ziele Prof. Dr. Stefan Wrobel 16
Für jede Branche lassen sich Schwerpunkte bei den Aufgaben der Big-Data-Anwendungen identifizieren Prof. Dr. Stefan Wrobel 17
In den meisten Anwendungsfällen werden die Analysen laufend durchgeführt Prof. Dr. Stefan Wrobel 18
Ausgewählte Ergebnisse der Online-Umfrage 69% aller Befragten in unserer Online-Umfrage wollen strategische Wettbewerbsvorteile durch Big Data erzielen. 78% teilen mit, dass sie Ihre personellen Ressourcen im Bereich Big Data verbessern müssen. 67% der Befragten teilen mit, dass das Budget für Big Data Themen (Technologien, Analysen, Datenquellen exkl. Personal) steigen sollte. Nur 8% der Befragten geben an, dass keine Umsetzungsbarrieren existieren. Prof. Dr. Stefan Wrobel 19
Ausgewählte Ergebnisse der Online-Umfrage Die Hauptprobleme in der Umsetzung liegen in den Bereichen Datenschutz und -sicherheit (49%) Budget/Prioritätensetzung (45%) technische Herausforderungen des Datenmanagements (38%) Expertise (36%) mangelnde Bekanntheit von Big Data Anwendungen und Technologien (35%) Um die bestehenden Defizite zu ändern, wünschen sich 95% der Befragten Förderung in Form von Best Practices, Trainings, gefolgt von Anbieter- und Lösungsübersichten sowie überarbeiteten Datenschutzvorgaben Prof. Dr. Stefan Wrobel 20
Welche Fördermaßnahmen wären aus Sicht der Entscheider wichtig und geeignet? wichtig Prof. Dr. Stefan Wrobel 21
Vier zentrale Chancen für Unternehmen in Deutschland Chance 1: Effizienteres Unternehmensmanagement Chance 2: Massenindividualisierung von Diensten Chance 3: Intelligente Produkte Chance 4: Predictive Monitoring Prof. Dr. Stefan Wrobel 22
Chance 1: Effizienteres Unternehmensmanagement Big Data Information: Mehr und aktuellere Daten im direkten Zugriff Prognose: Häufigere Prognosen Zunahme an automatisierten Entscheidungen Big Business Neue Low-Cost-Geschäftsmodelle werden möglich Höhere Attraktivität für Investoren durch geringere Kapitalbindung Verdrängung von Unternehmen mit geringerer Effizienz speziell in margenschwachen Branchen Heutiger Trend sind detaillierte Informationen der Filialen zum hineinzoomen (Handel) da ist noch viel Saft drin (Banken) Prof. Dr. Stefan Wrobel 23
Chance 2: Massenindividualisierung von Diensten Big Data Wir erleben eine Integration von eigenen mit externen Datenquellen Standardisierung nach (Open Data, Data Pools von Mitbewerbern) Innen und eine Aufbau einer datenschutzrechtlich möglichen Wissensbasis Individualisierung nach über Objekte und Konsumenten Außen (Banken) Nutzung der Wissensbasis für massenindividualisierte Dienstleistungen Big Business Neue Formen der Kundenbindung durch Individualisierung Stärkere Kundenbindung Verdrängung von Unternehmen mit fehlender Individualisierung Zersplitterung von Zielgruppen bis hin zu Zielpersonen statt Gruppen (Handel) Automatisierte Beratung für das Massengeschäft (Versicherungen) Prof. Dr. Stefan Wrobel 24
Chance 3: Intelligente Produkte und Produktion Big Data Nutzung von komplexer Sensorik Einbindung von Big Data Methoden in den Entwicklungsprozess Visualisierungs- und Interaktionstechniken, Analyse von Kunden- und Entwicklungsdaten Produkte erhalten eine gewisse Eigenintelligenz für Big Data in kollaborativen Produktentwicklungsprozessen Internet der Dinge, RFID, NFC, GPS, Sensornetze, Wearables, Big Business Aufwertung bestehender Produkte mit Mehrwertdiensten Langfristige IP-Wertsteigerung, da exklusives Produktwissen vorliegt Wettbewerbssteigerung ganzer Schlüsselbranchen möglich Prof. Dr. Stefan Wrobel 25
Chance 4: Predictive Monitoring Big Data Schwerpunkt auf Realtime-Fähigkeit und Data Streams Vom Event Processing zur Vorsorge In Prozesse integriert Big Business Enorme Einsparpotenziale durch bessere Planbarkeit Erhöhung von Sicherheit, Komfort, Verlässlichkeit Potenziale bei Unternehmen und im öffentlichen Bereich Prof. Dr. Stefan Wrobel 26
Steigerung der Produktionseffizienz Produktion optimieren auf Knopfdruck Big-Data-Informationssystem verdichtet Millionen Einzelmeldungen von Produktionsanlagen zu Kennzahlen Fraunhofer-Software schützt vor Stillständen, steigert die Effizienz und sichert die Qualität in Produktionsprozessen Das Manufacturing-Intelligence-System wird bereits von einem internationalen Automobilhersteller eingesetzt Skalierbare Technologie für das Internet der Dinge Prof. Dr. Stefan Wrobel 27
Betrugserkennung auf Finanzdaten Betrüger erkennen in Echtzeit Big Data Algorithmen erkennen betrügerische Kreditkartentransaktionen in Millisekunden Fraunhofer-Software schützt Kreditkartenunternehmen und ihre Kunden Die Software ist erfolgreich bei einem führenden europäischen Zahlungsabwickler im Einsatz und schützt ein Portfolio von vielen Millionen Kreditkarten Prof. Dr. Stefan Wrobel 28
Mobile Netze planen und optimieren 50.000 Zellen 100+ Terabytes >50 Parameter Hardwarevielfalt Fragen aus der Praxis: Worin liegen die Ursachen für schlechte Gesprächsqualität und häufige Gesprächsabbrüche oder Verbindungsprobleme? Wie beeinflusst dies meine Kundenzufriedenheit und -treue? Wie verteilt sich die Nachfrage nach Bandbreite? Prof. Dr. Stefan Wrobel 29
Was passiert gerade im Internet? Konsumenten vernetzen sich in unbekanntem Ausmaße Die Anzahl öffentlicher Beiträge über Produkte und Marken wächst überproportional Bald können mehr als 6 Mrd. Konsumenten über internetfähige mobile Endgeräte am Point of Sale Beiträge lesen und ihre Kaufentscheidungen daraufhin anpassen ITU International Telecommunications Union Prof. Dr. Stefan Wrobel 30
Showcase: Emotions-Monitoring im Web Architektur Analysen infür Echtzeit Emotionen Technik Motor Input Stream Getriebe message passing Data Storage Über 3,5 Mio. Emotionen Elektronik Batch Layer Batch View Verbrauch Sound message passing Real-time Real-time Layer View Visuelle Datenexploration Freude Ärger Prof. Dr. Stefan Wrobel 31 Optik Features technology from
message passing Fraunhofer Living Lab Big Data A Core Architecture for Scalable and Real-Time Analytics hochskalierbar, flexibel, herstellerneutral Data Storage Batch Layer Batch View Exploration in Echtzeit Daten, Texte, Offline or realtime message passing Real-time Layer Real-time View Features technology from Prof. Dr. Stefan Wrobel 32
Fraunhofer Living Lab Big Data Schulungen zum Data Scientist Batch-Anwendung Analyse von Kundenfeedback Realtime-Anwendung Big Data Forschungsmonitor 5 Milliarden Webseiten (Q1/2012) ~ 20TB nur Text Ausgewählte Technologien Anwendungsfälle Big Data Datensatz Prof. Dr. Stefan Wrobel 33
Privacy-preserving Data Mining Vereinbart Data Mining und Datenschutz Rechtlichen Fragen und öffentliche Meinung Auch: Schutz von Unternehmensinteressen im verteilten Data Mining Privacy by Design Entwicklung von Datenschutz-kompatiblen Analyseansätzen Soviel Anonymität wie nötig, soviel Wissen wie möglich Projektbeispiele Data Mining in der Betrugserkennung für - Banco Bilbao Vizcaya Argentaria (BBVA) - Arvato Infoscore LIFT Safe Zone Technologie Prof. Dr. Stefan Wrobel 34
Big Data Big Opportunities Der Big Data Trend beginnt erst physische und virtuelle Welt wachsen zusammen Big Data ist nicht nur big, sondern auch divers, dynamisch und komplex; Auswertung erfordert Zusammenspiel von Technologien Nutzung von Big Data wird im Wettbewerb spielentscheidend sein Find Partners and Start Now! Prof. Dr. Stefan Wrobel 35
Ab hier Reservefolien Prof. Dr. Stefan Wrobel 36
Big Ideas + Big Data = Big Business made in Germany Chancen Chance 1: Effizienteres Unternehmensmanagement Chance 2: Massenindividualisierung von Diensten Chance 3: Intelligente Produkte Chance 4: Predictive Monitoring Prof. Dr. Stefan Wrobel 37
Mobility Mining für die Außenwerbung Mobilitätsdaten zur Prognose von Medialeistung nutzen Der Frequenzatlas Fragestellungen Wie viele Personen kommen im Durchschnitt pro Tag an einem Plakatstandort vorbei? Wie verteilt sich die Frequenz auf ÖPNV, Auto und Fußgänger? Was macht das Modellbesonders? Erstes Modell für alle 6,9 Millionen Straßenabschnitte in Deutschland Zentrale Säule zur Ermittlung der Leistungswerte für das Medium Plakat Basis für alle verkehrsbezogenen Fragestellungen der Marktforschung Prof. Dr. Stefan Wrobel 38
Wissensquelle Mobilfunkdaten Mobility Mining erschließt Mobilfunkdaten Qualität von Mobilfunkdaten hohe Abdeckung der Bevölkerung müssen nicht kostenintensiv erhoben werden bieten eine sowohl räumliche als auch zeitliche Dynamik der Mobilität auf verschiedenen Ebenen können in Echtzeit verarbeitet werden Mobilfunkdaten sind Indikatoren für Mobilität Fraunhofer München: Lastverteilung auf Basis von GSM-Daten Unsere Forschungsexpertise: 2005 GeoPKDD EU - FET 2010 MODAP EU - CA 2011 LIFT EU FET 2011 DATASIM EU FET Prof. Dr. Stefan Wrobel 39
Mobilfunkzelle Beispiel Allianz Arena 29&30.7.9: Audi Cup Champions League VS Juventus Turin DFB-Pokal VS Eintracht Frankfurt Champions League VS Lyon Champions League Champions League VS AC Florenz VS Manchester Länderspiel Deutschland VS Argentinien Bundesliga Heimspiele FC Bayern München je Stunde ein Wert Prof. Dr. Stefan Wrobel 40
Unser Ansatz: Integration der Datenquellen Frequenz Atlas GPS Haushaltsdatenbank Dynamisches Mobilitäts- Verhalten Geodaten Mobilfunk Interviews (CATI) Prof. Dr. Stefan Wrobel 41
Die Fraunhofer Mobility Map Ein dynamisches Modell für Deutschland Idee: durch Kombination von statischem Mobilitätsmodell (Frequenzatlas) und Mobilfunkdaten Gewinnung eines dynamischen Mobilitätsmodells (zeitlich + räumlich) Ganz Deutschland Alle Standorte, Alle Strassen Alle Zeiten Kombinierbar mit Soziodemographie und weiteren Daten Prof. Dr. Stefan Wrobel 42
Unternehmensstrukturen optimieren Big Data Impact maximieren durch TM-Modelle Wir machen Modelle TM-Modelle sind ein neuer Ansatz, um von Menschen gemachte Systeme wie Unternehmen, IT oder Großprojekte einfach und aussagestark zu modellieren. Aus der Praxis für die Praxis TM-Modellierung wurde in den Anwendungsprojekten der letzten 10 Jahre schrittweise entwickelt und ist mittlerweile empirisch verifiziert. Vom Kopf in den Rechner Die Modelle empfinden die Entwurfs- und Denkprozesse von Menschen nach und sind deshalb gut verständlich und vielseitig einsetzbar. Prof. Dr. Stefan Wrobel 43
Die Genese: vom Detail zum Gesamtverständnis Mikro-Simulation Gleichung: Detailberechnungen Agent based Systems Dynamik: Abläufe simulieren TM -Modelle System: Komponenten und Abhängigkeiten managen 2002 2005 2006 2008 2009 2011 2012 2013 Simulation von Verkehren Simulation von militärischen Operationen Modellierung von Telkos Schutz kritischer Infrastrukturen Front Loading Systeme für Differenzengleichungen Produkt- Strategien IT-Strategie Sensible Systeme Logistik Nutzen für die Kunden Retail 2.0 Unternehmens- Strategie METI Bw BMBF Telekom EU T-Mobile T-Labs P&I Bw Harting GEMA MSH Prof. Dr. Stefan Wrobel 44
Die Idee: Getrennt modellieren, situativ kombinieren Identifikation und Beschreibung von hierarchischen Teilaspekten des Modells Erfassen von matrixartigen Abhängigkeiten zwischen den Aspekten Erkennen und Managen von längeren Abhängigkeitsketten Große Anzahl von Darstellungsvarianten Ziele Maßnahmen Ziele Maßnahmen Anforderungen (M1) Diese Anforderungen unterstützen diese Ziele (M2) Diese Maßnahmen setzen diese Anforderungen um Anforderungen (M1) Diese Anforderungen unterstützen diese Ziele (M2) Diese Maßnahmen setzen diese Anforderungen um Fähigkeiten (M3) Diese Fähigkeiten unterstützen diese Ziele (M4) Diese Maßnahmen verändern diese Fähigkeiten Fähigkeiten (M3) Diese Fähigkeiten unterstützen diese Ziele (M4) Diese Maßnahmen verändern diese Fähigkeiten Kosten (M5) Diese Maßnahmen Kosten Kosten (M5) Diese Maßnahmen Kosten Prof. Dr. Stefan Wrobel 45
Beispiele für effizienteres Unternehmensmanagement Vorhersage von Verkaufszahlen auf Produktebene Dynamisches Pricing von Produkten und Services Prognose der Kündigerwahrscheinlichkeit Permanente Überwachung der Markenwahrnehmung Frühzeitige Fehlererkennung aus Logfile-Analysen Automatisierte Fallbearbeitung Prognose der Personalkapazitäten Energiebedarfsprognosen Automatische Compliance Überwachung von Prozessen Routenplanung der Fahrzeugflotten Prof. Dr. Stefan Wrobel 46
Einzelbeispiel Risikoversicherung in der Landwirtschaft The Climate Corporation Big Data Sammlung von Temperatur-, Niederschlags-, Bodenfeuchtigkeits- und Ertragsdaten über ein großes Sensornetz. Ermittlung und Prognose von Schäden auf Mikroebene für 20 Millionen Farmen in den USA. Die Auszahlungen berechnen sich danach, ob diese Faktoren eine Schwelle überschreiten, bei der die Ernte gefährdet ist. Big Business Die Climate Corporation versichert Risiken in der Landwirtschaft pro Farm pro Tag. Prof. Dr. Stefan Wrobel 47
Galileo Videolexikon powered by Fraunhofer IAIS Auftraggeber: SevenOne Intermedia/ ProSiebenSat.1 Media AG Projektinhalt: Galileo-Beiträge als audiovisuelles Wissenslexikon im Internet Zweit-Vermarktung des Galileo-Bestandes von 1998 bis heute Fraunhofer IAIS: Audio Search & Tag Cloud Generation Automatische Erschließung des Galileo-Archivbestands Prof. Dr. Stefan Wrobel 48
Beispiele für massenindividualisierte Dienstleistungen, die durch Big Data möglich werden Ad hoc Gesundheitsberatung Assisted Finance für individuelle Finanziele Personal TV / Radio Individualisierte Zeitschriften und Bücher Verhaltensbasierte Energieberatung Individualisierte Pauschalreisen Schutzengelfunktion im betreuten Wohnen Individuelle Mobilitätsassistenz für alle Verkehrsträger Hochauflösende Versicherungen für Objekte Preventive Maintenance für Maschinen Prof. Dr. Stefan Wrobel 49
Einzelbeispiel Intelligentes Produkt Big Data in the (Heated or Cooled) Air Around You Big Data Das Thermostat studiert das Verhalten der Bewohner und prognostiziert, wann Heizung oder Kühlung gebraucht wird. Thermostate in verschiedenen Räumen kommunizieren miteinander und mit der Cloud, wo die Daten mit weiteren Daten, wie Wetterprognosen kombiniert und analysiert werden. So können die Thermostate mit spezifischen Algorithmen zur weiteren Energieeffizienz geladen werden. Big Business Fokussierung auf Premium-Segment mit hohen Margen Neue Mehrwertdienste werden möglich Exklusives Wissen Prof. Dr. Stefan Wrobel 50
Steigerung der Produktionseffizienz Produktion optimieren auf Knopfdruck Big-Data-Informationssystem verdichtet Millionen Einzelmeldungen von Produktionsanlagen zu Kennzahlen Fraunhofer-Software schützt vor Stillständen, steigert die Effizienz und sichert die Qualität in Produktionsprozessen Das Manufacturing-Intelligence-System wird bereits von einem internationalen Automobilhersteller eingesetzt Skalierbare Technologie für das Internet der Dinge Prof. Dr. Stefan Wrobel 51
Beispiele für intelligente Produkte, die durch Big Data möglich werden Intelligente Häuser und Haushaltsgeräte ohne Programmieraufwände Virtuelle Assistenten für unterschiedlichste Fragestellungen (SIRI/Watson) Maschinen- und Anlagenparks mit Selbstwartungsfunktion Intelligente Kleidung Elektrofahrzeuge als Teil des Smart Grids Servicerobotik in komplexen Umfeldern Autonome Fahrzeuge Prof. Dr. Stefan Wrobel 52
Beispiele für Big Data Predictive Monitoring Infrastrukturen überwachen und optimieren Cloud und service monitoring Maschinenausfälle langzeitig vorhersagen (predictive maintenance) Risikolagen im öffentlichen Bereich sicher erkennen Internet und Social Media Monitoring Prof. Dr. Stefan Wrobel 53
Big Data erfordert gesellschaftlichen Diskurs Zerrissenheit der Gesellschaft und des Einzelnen zwischen Bequemlichkeit/Nutzen und Privatheit, Solidarität, Gerechtigkeit Facebook und Twitter als Demokratiebringer und Machtinstrument Privatsphäre und Daten werden Resssource und Wirtschaftsgut Quantified Self Bewegung, Analyse des eigenen Genoms Spaltung nach Alter, nach sozialen Gruppen, nach Kulturen, nach Ländern, zum Teil widersprüchlich in einem Individuum (Facebook nicht nutzen, aber Kundenkarte mit Rabatt) Droht ein neuer digital Divide????? Rapide Entwicklung, siehe Google Street View, zunächst umstritten, jetzt sehr akzeptiert in wenigen Jahren! Prof. Dr. Stefan Wrobel 54