Effektive Analyse großer Datenmengen im Public Sector



Ähnliche Dokumente
Visual Business Analytics Visueller Zugang zu Big Data

Interaktive Visualisierung und Visual Analytics

Visual Business Analytics Effektiver Zugang zu Daten und Informationen

Visual Business Analytics Effektiver Zugang zu Daten und Informationen

Visuelle Analyse und Entscheidungsunterstützung

VISUAL BUSINESS ANALYTICS EFFEKTIVER ZUGANG ZU DATEN UND INFORMATIONEN

Visual Business Intelligence Eine Forschungsperspektive

Advanced Analytics. Michael Ridder. Copyright TIBCO Software Inc.

Seminar Business Intelligence Teil II. Data Mining & Knowledge Discovery

Eurobarometer-Umfrage*, Angaben in in Prozent der der Bevölkerung**, Europäische Union Union und und ausgewählte europäische Staaten, Ende 2005

THE KNOWLEDGE PEOPLE. CompanyFlyer.indd :48:05

User-Centered Visual Analytics

Virtual Roundtable: Business Intelligence - Trends

Requirements Engineering

Professionelle Seminare im Bereich MS-Office

Entwicklung des Dentalmarktes in 2010 und Papier versus Plastik.

Formwerk AG. Die Sicherstellung konsistenter Nutzungserlebnisse über den gesamten SW-Produktlebenszyklus durch Human Centered Design.

01 AMETRAS Informatik Business Discovery BUSINESS DISCOVERY MIT. Partner

SMART Newsletter Education Solutions April 2015

INFOS FÜR MENSCHEN AUS DEM AUSLAND WENN SIE FÜR EINEN FREIWILLIGEN-DIENST NACH DEUTSCHLAND KOMMEN WOLLEN: IN DIESEM TEXT SIND ALLE WICHTIGEN INFOS.

Suche schlecht beschriftete Bilder mit Eigenen Abfragen

All for One Steeb. Das SAP Haus. ALL FOR ONE STEEB DAS SAP HAUS

Mitteilungen der Juristischen Zentrale

Workshops. Gewinnen Sie mehr Zeit und Qualität im Umgang mit Ihrem Wissen

esearch one-single-point-of-information Federated Search Modul

Requirements Engineering für IT Systeme

! APS Advisor for Automic

Die Post hat eine Umfrage gemacht

THREAD ARCS: An Thread Visualization

Konzentration auf das. Wesentliche.

BI in der Cloud eine valide Alternative Überblick zum Leistungsspektrum und erste Erfahrungen

Reboard GbR.

Was sind Herausforderungen im Projektmanagement?

SJ OFFICE - Update 3.0

Predictive Modeling Markup Language. Thomas Morandell

Universität Zürich Informatikdienste. SpamAssassin. Spam Assassin Go Koordinatorenmeeting 27. April

Was ist Leichte Sprache?

Was meinen die Leute eigentlich mit: Grexit?

Updatehinweise für die Version forma 5.5.5

Kontaktlos bezahlen mit Visa

»Infografik GIS«bei der Stadt Erlangen. Version 1.0 Stand August 2015

Wie funktioniert automatisierte Übersetzung? Prof. Josef van Genabith (Deutsches Forschungszentrum für Künstliche Intelligenz)

Schluss mit langweiligen Papierexposees! Die Zukunft heißt immodisplay. Vision Displays GmbH Schnackenburgallee 41b Hamburg

Visualisierung. Rückblick. Scientific Visualization vs. Informationsvisualisierung. Allgemeine Ziele und Anforderungen Prof. Dr.-Ing.

YouTube: Video-Untertitel übersetzen

Kofax TotalAgility 7 WEGBEREITER. Eine kurze Anleitung für diejenigen, die mit Kunden arbeiten! für

Die Post erhebt bei Zustellung der Nachnahmesendung eine Sendungsgebühr in Höhe von 2,00 EUR zusätzlich zum Rechnungsbetrag.

Relaunch des Berliner Liegenschaftsfonds Feels like Berlin.

Look Inside: desite. modellorientiertes Arbeiten im Bauwesen. B.I.M.

Dr. Kraus & Partner Ihr Angebot zu Konfliktmanagement

Europäischer Fonds für Regionale Entwicklung: EFRE im Bundes-Land Brandenburg vom Jahr 2014 bis für das Jahr 2020 in Leichter Sprache

Warum. Natural AnalyticsTM. wichtig ist

Semantik Visualisierung

Busunternehmen Taxi und Autovermietung Billigfluglinien & Charter Airlines Andere

THEMA: "SAS STORED PROCESSES - SCHNELL GEZAUBERT" HELENE SCHMITZ

1 WEB ANALYTICS: PROFESSIONELLE WEB-ANALYSEN UND REPORTING FÜR IHR ONLINE MARKETING.

Guide DynDNS und Portforwarding

Anleitung auf SEITE 2

Textiltechnologische Innovationen im Bereich adaptierter Kleidung für Menschen mit Handicap

Das System sollte den Benutzer immer auf dem Laufenden halten, indem es angemessenes Feedback in einer angemessenen Zeit liefert.

Self Service BI der Anwender im Fokus

Nicht über uns ohne uns

Flow Session zum Entdecken Deines idealen Lebensstils

Applikations-Performance in Citrix Umgebungen

Das Standortreporting von MVV Energie. Ihre Energie immer im Blick mit unserem Online-Portal für Strom und Gas

Content Management System mit INTREXX 2002.

Das Leben von Frauen und Männern in Europa (LQVWDWLVWLVFKHV3RUWUlWYRQ)UDXHQXQG 0lQQHUQLQDOOHQ/HEHQVDEVFKQLWWHQ

Mitarbeiterbefragung als PE- und OE-Instrument

Blumen-bienen-Bären Academy. Kurzanleitung für Google Keyword Planer + Google Trends

Kurzanweisung für Google Analytics

Kampagnenmanagement mit Siebel Marketing/Oracle BI ein Praxisbericht

Emergency Room für Projektleiter

Entwicklung des realen BIP im Krisenjahr 2009

Microsoft (Dynamics) CRM 2020: Wie verändern sich Markt, Eco-System und Anwendungsszenarien nach Cloud & Co?

8 Juli Transparenz durch Governance Data Governance als kritischer Erfolgsfaktor für Predictive Analytics

Zahlen auf Rechnung. 1

SOA im Zeitalter von Industrie 4.0

Präsentation: Google-Kalender. Walli Ruedi Knupp Urdorf

Simple und einfache Verleihsoftware! Wann immer und wo immer durch Ihren Browser erreichbar!

Daten- visualisierung. (und wie man diese vermeidet)

Database Exchange Manager. Infinqa IT Solutions GmbH, Berlin Stralauer Allee Berlin Tel.:+49(0) Fax.:+49(0)

Ein Vorwort, das Sie lesen müssen!

IBM Software Demos Rational Software Delivery Platform - Anforderungsanalyse

Bankenkonzentration. Schweiz 54. Frankreich. Japan ** 42. Spanien 38. Großbritannien. Italien 24 USA ** 13. Deutschland 17

Anleitung WOBCOM Anti-Spam System

FIS: Projektdaten auf den Internetseiten ausgeben

Use Cases. Use Cases

5. Ausgaben für Bildungseinrichtungen 3 Jahre bis Schuleintritt 2009 (OECD-34)

Microsoft Office Visio 2007 Infotag SemTalk Thema: Prozessmodellierung

Würfelt man dabei je genau 10 - mal eine 1, 2, 3, 4, 5 und 6, so beträgt die Anzahl. der verschiedenen Reihenfolgen, in denen man dies tun kann, 60!.

Business Analytics im E-Commerce

Summer Workshop Mehr Innovationskraft mit Change Management

Sehr geehrte Faktor-IPS Anwender,

Data. Guido Oswald Solution Switzerland. make connections share ideas be inspired

Internetnutzung (Teil 1)

Anwendungsbeispiele Sign Live! Secure Mail Gateway

PowerPoint vertonen. by H.Schönbauer 1

Information zum deutschen Rentensystems ganz kurz

PARTNERSCHAFT forte 2.0

Fragebogen ISONORM 9241/110-S

Transkript:

Effektive Analyse großer Datenmengen im Public Sector Dr.-Ing. Jörn Kohlhammer Fraunhofer-Institut für Graphische Datenverarbeitung (IGD) Fraunhoferstraße 5 64283 Darmstadt Tel.: +49 6151 155-646 Fax: +49 6151 155-139 Email: joern.kohlhammer@igd.fraunhofer.de http://www.igd.fraunhofer.de/iva

Erstes deutschsprachiges Buch zum Thema Visualisierung im BI-Bereich Anwendung der besten Visual Business Analytics-Techniken zur Verarbeitung massiver Datenmengen und für den Einblick in komplexe Strukturen Verwendung von Visual Business Analytics für ein effizientes und verständliches Informationsmanagement Erscheinungstermin: Ende Q3/2013 2

Ausbaustufen von Visual Business Analytics Informationsdesign Gutes Verständnis und adäquate Verwendung von visuellen Elementen im Reporting Informationsvisualisierung Dynamische Informationen interaktiv und visuell zugänglich machen Visuelle Analyse (Visual Analytics) Neue Erkenntnisse durch das abgestimmte Zusammenspiel von Mensch und System 3

Informationsvisualisierung Wir benutzen auf natürliche Weise unsere Augen, um die Welt zu verstehen... Daten Informations- Wissen visualisierung Ein Bild sagt mehr als 1000 Worte. 4

Interaktive Visualisierung Grafische Unterstützung macht uns klüger. (Stuart Card) Zwei Ziele der grafischen Unterstützung Bessere Kommunikation vorhandener Ideen Entdeckung neuer Ideen Nutzung von visuellen Hilfsmitteln zum Denken und Entscheiden Allein Stift und Papier reduzieren die Rechenzeit um den Faktor 5 34 x 72 68 23 2 80 2448 5

Herkunft der Informationsvisualisierung Wissenschaftliche Visualisierung Informationsvisualisierung Visual Analytics 6

Beispiel: Tree Maps Hier: Darstellung der Entwicklung von Börsenkursen (2001) Übersicht über aktuelle Börsentrends Branchenklassifikation Fokus auf relevante Informationen 7

Informationsvisualisierung Beachtung der menschlichen Wahrnehmung Beispiel: Change Blindness 8

Informationsvisualisierung Change Blindness 9

Informationsvisualisierung Beachtung der menschlichen Wahrnehmung Beispiel: Change Blindness Vorsicht bei: Animation und interaktiven Visualisierungen Springen zwischen Darstellungen Mehrseitigen Darstellungen 10

Menschliche Wahrnehmung Hervorspringen von Informationen Ein Hervorspringen erfolgt, wenn das Zielobjekt eine Eigenschaft besitzt, die kein anderes ablenkendes Objekt besitzt. (Suchen Sie das blaue T ) 11

Menschliche Wahrnehmung 12

Menschliche Wahrnehmung (Suchen Sie das / ) 13

Menschliche Wahrnehmung 14

Menschliche Wahrnehmung Ein Hervorspringen erfolgt, wenn das Zielobjekt eine Eigenschaft besitzt, die kein anderes ablenkendes Objekt besitzt. 15

Menschliche Wahrnehmung Eine serielle Suche ist nötig, wenn jede visuelle Eigenschaft des Zielobjekts auch unter den ablenkenden Objekten vorkommt. (Suchen Sie das grüne T ) 16

Menschliche Wahrnehmung 17

Interaktive Visualisierung Besseres Verständnis durch Interaktion und bewegte Daten Hans Rosling (Gapminder) at TED Talks 18

Interaktive Visualisierung: Beispiel Gapminder 19

Daten, Information, Wissen Daten Rohform Information Bedeutung Kontext Wissen Zusammenhänge 20

Informationsvisualisierung Modell von Card et al. 21

Datenarten Rohdaten in vielfältiger Form Datentabellen Datenströme Bilder, Videos, Audio etc. Texte Text Text Text 22

Informationsvisualisierung Modell von Card et al. 23

Informationsvisualisierung Vier grundlegende Typen von sichtbaren Dingen im Raum 24

Sichtbare Eigenschaften 25

Informationsvisualisierung Modell von Card et al. 26

Beispiel: Gapminder 27

Informationsvisualisierung Modell von Card et al. 28

Interaktive Visualisierung Wie erstellt man gute, interaktive Visualisierungen? Shneiderman-Vorgehen 1. Überblick über alle Daten 2. Zoom und Filter 3. Details auf Anfrage 29

Informationsvisualisierung Shneiderman-Vorgehen 1. Überblick aller Daten 2. Zoom und Filter 3. Details auf Anfrage Filmfinder, Ahlberg&Shneiderman 30

Informationsvisualisierung Gegenbeispiel aus dem Notfallmanagement 1. Immer alle Details 2. Scroll und Select 3. Größere und mehr Monitore für den besseren Überblick 31

Big Data Zu viele Daten für den Überblick nach Shneiderman 100 Mio. FedEx Transaktionen pro Tag Über 1800 Gbps über DE-CIX peak traffic 7,2 Mrd. VISA Kreditkartentransaktionen pro Jahr 32

Beispiel: Kreditkarten Real-Time Online Switch Acquirer POS Geldautomaten Host / Issuer 33

Beispiel: Kreditkarten Datenbank Regeln und Abfragen Alerts! Visualisierung Reports 34

Beispiel: Kreditkarten 50 und mehr Attribute Amount Merchant# Location Local Transaction Time Country Code POS PAN MCC Expiry Date Card# Große Anzahl Transaktionen (z.b. 7,2 Mrd. VISA-Transaktionen in 2009) Problem: Fixe Regeln erkennen nur bekannte Betrugsschemata Wie erkennt man neue Fälle möglichst rasch und proaktiv? 35

Histogramm für ein Attribut Beispiel: Zeit der Kreditkartentransaktion 1-dimensionales Histogramm Time of Day 05:00-08:59 09:00-11:59 12:00-15:59 16:00-18:59 19:00-22:59 23:00-01:59 02:00-04:59 36

Histogramme und Tabelle für zwei Attribute -$9 $10-$99 4 6 10 25 12 15 16 10 10 28 23 13 16 12 Beispiel: Zeit der Transaktion abgebildet auf Zahlungsbetrag $100-$299 $300-$499 $500-$699 $700-$999 $1000-4 2 0 1 0 32 31 5 1 2 41 35 6 12 6 28 20 6 8 5 14 10 30 17 5 8 4 9 6 3 5 3 0 2 0 Zwei 1-dimensionale Verteilungen kombiniert in einer Tabelle (Zahlen stehen für die Größe der verschiedenen Gruppen) 37

Mustererkennung -$9 $10-$99 $100-$299 $300-$499 4 2 10 25 32 31 12 15 16 10 10 28 41 35 23 28 20 13 16 12 Abbildung der Gruppengröße auf Helligkeit Interessante Bereiche können auf einen Blick erkannt werden. $500-$699 0 5 6 6 $700-$999 1 1 12 8 $1000-0 2 6 5 38

pos atm pos atm pos atm pos atm pos atm pos atm pos atm Herausforderung: Sehr viele Attribute -$9 $10-$99 $100-$299 $300-$499 Verwobene Darstellung von drei (und mehr) Attributen Hier zusätzliches Attribut: POS oder ATM $500-$699 $700-$999 $1000-39

Visualisierung mehrdimensionaler Beziehungen KVMap: 100.000 Datensätze in sechs Dimensionen 40

KVMap-System Komplexe Muster von 10 und mehr Dimensionen als farbige Muster Erkennen von neuen Zusammenhängen ohne kognitiven Aufwand Automatische Methoden im Hintergrund Identifizierung interessanter Muster aus Datenbank oder DWH Mächtige Analysetechnik für das Back Office Experten im Zentrum der Analyse 41

Visual Analytics 42

Heutige Graphiken für große Datenmengen? USA EU Japan Portugal Spanien Frankreich Großbritannien Polen Slowakei Tschechien Slowenien Schweiz Italien Österreich Irland Ungarn Rumnänien Deutschland Dänemark Kroatien Schweden Finnland 16 14 12 10 8 6 4 2 0 0 2 4 6 8 10 12 43

Warum Visual Analytics, warum heute? Große und wachsende Datensammlungen (Big Data) Notwendigkeit schneller und informierter Entscheidungsfindung auf Basis dieser Daten Reine Visualisierungsmethoden (Informationsvisualisierung) nicht adäquat für Milliarden von Datensätzen Vollautomatische Knowledge Discovery-Ansätze/Modelle nur für wohldefinierte und eindeutig spezifizierbare Probleme Beispiel: Abwehrsituationen: Betrug, Viren, SPAM, DOS-Angriffe, Wettbewerb, 44

Was ist das Neue an Visual Analytics? Was gibt es schon? Automatisches Knowledge Discovery & Data Mining Interaktive visuelle Daten-Exploration Was brauchen wir? Enge Integration visueller und automatischer Datenanalysemethoden mit Datenbanktechnologien für skalierbare interaktive Entscheidungsunterstützung Visuelle Daten-Exploration Visualisierung Daten Wissen Modelle Data Mining Feedback Loop 45

Visual Analytics ein neuer Ansatz Kombination aus Informationsvisualisierung, Statistik, Data Mining, Business Intelligence und anderen Gebieten Informationsvisualisierung Wahrnehmungstheorie Interaktivität Benutzerfreundlichkeit Visual Analytics Data Mining Statistik Datenbankmanagement Wissensmanagement 46

Big Data und Visual Analytics Visual Analytics Neue Möglichkeiten durch Integration mit automatischen Verfahren Stärkerer Einfluss der menschlichen Erfahrung und Ideen in den Gesamtprozess Effektiverer Umgang mit Big Data Erste Ansätze in heutigen Tools in Erweiterungen zur interaktiven Exploration, Prediction oder Simulation Projekte im Bereich Policy Modeling 47

Visual Analytics im Public Sector Allgemeiner Policy-Making-Lifecycle Need for a policy Policy Impacts of the policy 48

Projekt epolicy (Engineering the policy making life-cycle) Forschungsprojekt gefördert durch die Europäische Kommission Bereich: egovernment und Policy Modeling Ziel: Unterstützung von Politikern und deren Teams bei der komplexen, globalen Entscheidungsfindung durch integrierte Optimierungsmodelle, Simulationen, Meinungsanalyse- und Visualisierungstechniken Use Case: Entwicklung eines nachhaltigen regionalen Energieplans 49

Vorteile bei der Verwendung von Visualisierung Policy Maker Policy Idea Policy Analyst Requirements Modeling Expert Model Validation Modeling Expert Analytical Model Modeling Expert Analysis Results Policy Analyst Solutions Policy Maker Decision Visualizations Visualization Visualization Policy Analyst Policy Maker 50

Demo 51

Weitere Einsatzgebiete von Visual Analytics Wähleranalysen Analysen von Fragebögen Trendanalysen Sicherheit Medizin Überall, wo massive Datenmengen anfallen 52

Informationsvisualisierung und Visual Analytics Verkürzung des Weges von Daten zur Entscheidung Daten Interaktive Informationen und Erkenntnisse Entscheidung Handlung 2012 Fraunhofer IGD 53

Kontakt Dr. Jörn Kohlhammer Fraunhofer IGD Fraunhoferstraße 5 64283 Darmstadt Deutschland Tel.: +49 (6151) 155 646 Fax: +49 (6151) 155 139 Email: joern.kohlhammer@igd.fraunhofer.de http://www.igd.fraunhofer.de 54