Visual Business Analytics Effektiver Zugang zu Daten und Informationen Dr.-Ing. Jörn Kohlhammer Fraunhofer-Institut für Graphische Datenverarbeitung (IGD) Fraunhoferstraße 5 64283 Darmstadt Tel.: +49 6151 155-646 Fax: +49 6151 155-139 Email: joern.kohlhammer@igd.fraunhofer.de http://www.igd.fraunhofer.de/iva
Ausbaustufen von Visual Business Analytics Informationsdesign Bestmögliche Verwendung von visuellen Elementen im Reporting Informationsvisualisierung Dynamische Informationen interaktiv und visuell zugänglich machen Visuelle Analyse (Visual Analytics) Neue Erkenntnisse durch das abgestimmte Zusammenspiel von Mensch und System 2
Visual Analytics 3
Ausbaustufen von Visual Business Analytics 4
Nutzen der Visualisierung Grafische Unterstützung macht uns klüger! Zwei Ziele der grafischen Unterstützung Bessere Kommunikation vorhandener Ideen Entdeckung neuer Ideen Nutzung von visuellen Hilfsmitteln zum Denken und Entscheiden Allein Stift und Papier reduzieren die Rechenzeit um den Faktor 5 5
Beispiel aus der Statistik Anscombe s quartet (Tufte, 1983) 6
Beispiel aus der Statistik Vier Datensätze mit identischem linearen Modell (Tufte, 1983) 7
Beispiel (Reporting) 8
Beispiel (Reporting) 9
Ausbaustufen von Visual Business Analytics Informationsdesign Bestmögliche Verwendung von visuellen Elementen im Reporting Informationsvisualisierung Dynamische Informationen interaktiv und visuell zugänglich machen Visuelle Analyse (Visual Analytics) Neue Erkenntnisse durch das abgestimmte Zusammenspiel von Mensch und System 10
Informationsvisualisierung Wir benutzen auf natürliche Weise unsere Augen, um die Welt zu verstehen... (Stephen Few) Daten Informations- Wissen visualisierung Eine interaktive Grafik sagt mehr als 1000 Excel-Tabellen. 11
Herkunft der Informationsvisualisierung Wissenschaftliche Visualisierung Informations- Visualisierung Visual Analytics 12
Beispiel: Tree Maps Hier: Darstellung der Entwicklung von Börsenkursen (2001) Übersicht über aktuelle Börsentrends Branchenklassifikation Fokus auf relevante Informationen 13
Informationsvisualisierung Beachtung der menschlichen Wahrnehmung Beispiel: Change Blindness 14
Informationsvisualisierung Change Blindness 15
Informationsvisualisierung Beachtung der menschlichen Wahrnehmung Beispiel: Change Blindness Vorsicht bei: Animation und interaktiven Visualisierungen Springen zwischen Darstellungen Mehrseitigen Darstellungen 16
Menschliche Wahrnehmung Hervorspringen von Informationen Ein Hervorspringen erfolgt, wenn das Zielobjekt eine Eigenschaft besitzt, die kein anderes ablenkendes Objekt besitzt. (Suchen Sie das blaue T ) 17
Menschliche Wahrnehmung 18
Menschliche Wahrnehmung (Suchen Sie das / ) 19
Menschliche Wahrnehmung 20
Menschliche Wahrnehmung Ein Hervorspringen erfolgt, wenn das Zielobjekt eine Eigenschaft besitzt, die kein anderes ablenkendes Objekt besitzt. 21
Menschliche Wahrnehmung Eine serielle Suche ist nötig, wenn jede visuelle Eigenschaft des Zielobjekts auch unter den ablenkenden Objekten vorkommt. (Suchen Sie das grüne T ) 22
Menschliche Wahrnehmung 23
Interaktive Visualisierung Besseres Verständnis durch Interaktion und bewegte Daten Hans Rosling (Gapminder) at TED Talks 24
Daten, Information, Wissen Daten Rohform Information Bedeutung Kontext Wissen Zusammenhänge 25
Informationsvisualisierung basierend auf Stuart Card et al. 26
Datenarten Rohdaten in vielfältiger Form Datentabellen Datenströme Bilder, Videos, Audio etc. Texte Text Text Text 27
Informationsvisualisierung basierend auf Stuart Card et al. 28
Informationsvisualisierung Vier grundlegende Typen von sichtbaren Dingen im Raum 29
Sichtbare Eigenschaften 30
Informationsvisualisierung basierend auf Stuart Card et al. 31
Beispiel: Gapminder 32
Informationsvisualisierung basierend auf Stuart Card et al. 33
Interaktive Visualisierung Wie erstellt man gute, interaktive Visualisierungen? Shneiderman-Vorgehen 1. Überblick über alle Daten 2. Zoom und Filter 3. Details auf Anfrage 34
Informationsvisualisierung Shneiderman-Vorgehen 1. Überblick aller Daten 2. Zoom und Filter 3. Details auf Anfrage Filmfinder, Ahlberg&Shneiderman 35
Big Data Zu viele Daten für den Überblick nach Shneiderman 100 Mio. FedEx Transaktionen pro Tag Über 1800 Gbps über DE-CIX peak traffic 7,2 Mrd. VISA Kreditkartentransaktionen pro Jahr 36
Big Data 37
VBA-Studie: Relevanz von Big Data 38
Beispiel: Kreditkarten Real-Time Online Switch Acquirer POS Geldautomaten Host / Issuer 39
Beispiel: Kreditkarten Datenbank Regeln und Abfragen Alerts! Visualisierung Reports 40
Beispiel: Kreditkarten 50 und mehr Attribute Amount Merchant# Location Local Transaction Time Country Code POS PAN MCC Expiry Date Card# Große Anzahl Transaktionen (z.b. 7,2 Mrd. VISA-Transaktionen in 2009) Problem: Fixe Regeln erkennen nur bekannte Betrugsschemata Wie erkennt man neue Fälle möglichst rasch und proaktiv? 41
Relevante Muster in Daten erkennen Dynamische Daten Verkaufsdaten Transaktionsdaten Betrugserkennung Schnelles Erkennen von Korrelationen Neuartige Verhaltensmuster Sich verändernde Transaktionsmuster Experten im Zentrum der Analyse 42
Histogramm für ein Attribut Beispiel: Zeit der Kreditkartentransaktion 1-dimensionales Histogramm Time of Day 05:00-08:59 09:00-11:59 12:00-15:59 16:00-18:59 19:00-22:59 23:00-01:59 02:00-04:59 43
Histogramme und Tabelle für zwei Attribute -$9 $10-$99 4 6 10 25 12 15 16 10 10 28 23 13 16 12 Beispiel: Zeit der Transaktion abgebildet auf Zahlungsbetrag $100-$299 $300-$499 $500-$699 $700-$999 $1000-4 2 0 1 0 32 31 5 1 2 41 35 6 12 6 28 20 6 8 5 14 10 30 17 5 8 4 9 6 3 5 3 0 2 0 Zwei 1-dimensionale Verteilungen kombiniert in einer Tabelle (Zahlen stehen für die Größe der verschiedenen Gruppen) 44
Mustererkennung -$9 $10-$99 $100-$299 $300-$499 4 2 10 25 32 31 12 15 16 10 10 28 41 35 23 28 20 13 16 12 Abbildung der Gruppengröße auf Helligkeit Interessante Bereiche können auf einen Blick erkannt werden. $500-$699 0 5 6 6 $700-$999 1 1 12 8 $1000-0 2 6 5 45
pos atm pos atm pos atm pos atm pos atm pos atm pos atm Herausforderung: Sehr viele Attribute -$9 $10-$99 $100-$299 $300-$499 Verwobene Darstellung von drei (und mehr) Attributen Hier zusätzliches Attribut: POS oder ATM $500-$699 $700-$999 $1000-46
Visualisierung mehrdimensionaler Beziehungen KVMap: 100.000 Datensätze in sechs Dimensionen 47
KVMap-System Komplexe Muster von 10 und mehr Dimensionen als farbige Muster Erkennen von neuen Zusammenhängen ohne kognitiven Aufwand Automatische Methoden im Hintergrund Identifizierung interessanter Muster aus Datenbank oder DWH Mächtige Analysetechnik für das Back Office 48
Visual Analytics 49
Heutige Graphiken für große Datenmengen? USA EU Japan Portugal Spanien Frankreich Großbritannien Polen Slowakei Tschechien Slowenien Schweiz Italien Österreich Irland Ungarn Rumnänien Deutschland Dänemark Kroatien Schweden Finnland 16 14 12 10 8 6 4 2 0 0 2 4 6 8 10 12 50
Warum Visual Analytics, warum heute? Große und wachsende Datensammlungen (Big Data) Notwendigkeit schneller und informierter Entscheidungsfindung auf Basis dieser Daten Reine Visualisierungsmethoden (Informationsvisualisierung) nicht adäquat für Milliarden von Datensätzen Vollautomatische Knowledge Discovery-Ansätze/Modelle nur für wohldefinierte und eindeutig spezifizierbare Probleme Beispiel: Abwehrsituationen: Betrug, Viren, SPAM, DOS-Angriffe, Wettbewerb, 51
Was ist das Neue an Visual Analytics? Was gibt es schon? Automatisches Knowledge Discovery & Data Mining Interaktive visuelle Daten-Exploration Was brauchen wir? Enge Integration visueller und automatischer Datenanalysemethoden mit Datenbanktechnologien für skalierbare interaktive Entscheidungsunterstützung Visuelle Daten-Exploration Visualisierung Daten Wissen Modelle Data Mining Feedback Loop 52
Visual Business Analytics Visual Analytics Neue Möglichkeiten durch Integration mit automatischen Verfahren Stärkerer Einfluss der menschlichen Erfahrung und Ideen in den Gesamtprozess Effektiverer Umgang mit Big Data Erste Ansätze in heutigen Tools in Erweiterungen zur interaktiven Exploration, Prediction oder Simulation 53
Aktuelle Tools SAS Visual Analytics Tableau TIBCO Spotfire 54
VBA-Studie: Relevanz von Visual Analytics-Tools sehr relevant - 1 18% 30% 2 24% 35% 3 15% 19% 4 15% 22% überhaupt nicht relevant - 5 4% 18% Zeitraum: xx.xx.2013-10.10.2013 n=148 (71) 55
Weitere Einsatzgebiete von Visual Analytics CRM-/Kundenanalysen Trendanalysen Portfolioanalysen IT-Sicherheit Medizin Analysen im Fertigungsumfeld Überall dort, wo massive Datenmengen anfallen 56
Analyse von Netzwerken Analyse von Verbindungen und Relationen Anwendungen Unternehmens- und Beteilungsnetzwerke Personennetzwerke Dokumente und Referenzen 57
Einsatz im Bankenbereich 58
Visual Analytics Neue Ansätze in Standard-Werkzeugen wie SAS Visual Analytics, Tableau, Spotfire, u.a. Visual Analytics für spezifische Anwendungen und Aufgaben basierend auf Big Data Fraunhofer IGD Beratung zu verfügbaren Visualisierungs- und Analysemethoden Beurteilung der Visualisierungslösungen mit Unternehmensdaten Anpassung an spezifischen Anwendungsfall 59
Kontakt Dr. Jörn Kohlhammer Fraunhofer-Institut für Graphische Datenverarbeitung Fraunhoferstraße 5 64283 Darmstadt Deutschland Tel.: +49 (6151) 155 646 Fax: +49 (6151) 155 139 Email: joern.kohlhammer@igd.fraunhofer.de http://www.igd.fraunhofer.de 60