Visualisierung großer Datenmengen Heidrun Schumann Institut für Informatik, Universität Rostock Gliederung Motivation Informationsvisualisierung & Visual Analytics Die große Herausforderung - Skalierbarkeit Information Scalability Visual Scalability Display Scalability Guidance 2
Motivation Film im SciencExpress Expedition Zukunft 3 Informationsvisualisierung & Visual Analytics Ziel der Informationsvisualisierung: Verbesserte Kommunikation von Daten, Modellen und Konzepten durch visuelle Repräsentation und Interaktion. Ziel von Visual Analytics: Verknüpfung von Berechnungen mit visuellen und interaktiven Methoden zur visuellen Exploration sehr großer Datenmengen. Der Begriff wurde von J. Thomas, Seattle, USA 2002 geprägt. Die Hauptausrichtung in den USA war und ist: Homeland-Security. In Europa gibt es nationale und europäische Förderprogramme, z.b.: - wie das EU-Netwerkprojekt VisMaster Mastering the Information Age, http://www.vismaster.eu/home - das DFG Schwerpunktprogramm Scalable Visual Analytics, http://www.visualanalytics.de/ 4
VisMaster EU-Netzwerkprojekt ZieL: Netzwerkbildung zu Visual Analytics; Analyse von: STAR, Anwendungen, Systemen, Problemen, Potential, Herausforderungen, offenen Forschungsfragen. Ergebnis: Roadmap Mastering the Information Age solving problems with Visual Analytics http://www.vismaster.eu/book/ eu/book/ Unser Beitrag: Visuelle Analyse von Daten mit Raum- und Zeitbezug http://www.springer.com/computer/hci/book/ http://www.timeviz.net/ 8. Call der EU verweist auf Visual Analytics 5 Die große Herausforderung Skalierbarkeit bezogen auf Daten Information Scalability Visualisierung Visual Scalability Anzeige Display Scalability Nutzer Human Scalability Fuchs, 2011 J. J. Thomas, K. A. Cook: Illuminating the Path, Research Agenda for Visual Analytics, IEEE Computer Society Press, 2005 6
Information Scalability Sehr große Datenmengen erfordern vor der Visualisierung einen Abstraktionsschritt Multi-Level Unterschiedliche Abtastraten und Schrittweiten führen zu unterschiedlichen Skaleneigenschaften Multi-Skalen Welche Level/Skalen kodieren zusätzliche Informationen? Wie kann der Nutzer unterstützt werden, um interessante Informationen zu finden? Ansatz: Visualisierung der Heterogenität benachbarter Skalen als Hinweis, wo nach weiteren Informationen zu suchen ist. 7 Information Scalability High-resolution time-scale comprises more information than displayable. Local noise at peak. Missbehaviour i of simulator. Berechnung von Heterogenitätsmaßen Visualisierung von Heterogenitätsbändern und Datenwerten Interaktive Auswahl von Skalen und Exploration der Daten 8
Visual Scalability Ein einzelnes Bild kann nicht alle relevanten Eigenschaften einer Informationsmenge zeigen. Unterschiedliche visuelle Repräsentationen kommunizieren unterschiedliche Aspekte. A Graphic is not drawn once and for all Beispiele: Visuelle Repräsentationen für dynamische Netzwerke Aufgaben-bezogene Farbkodierung (Bertin, 1981) 9 unreduced time selection reduced abstraction unreduce ed [Ellson 2003] [Frishman 2008] [Steinbrückner 2010] structur re redu uced raction selec ction [Shi 2011] [Burch 2008] [Tu 2007] abst [John 2009] [Falkowski 2006] [Archambault 2009] 10
time unreduced reduced Interaktion Berechnung selection abstraction struc cture unredu uced red duced sele ection n abs stractio Hadlak, S.; Schulz,H.-J.; Schumann, H.: In Situ Exploration of Large Dynamic Networks. IEEE TVCG 17(12), Dez. 2011, S. 2334-2343 11 Visual Scalability Aufgaben-bezogene bezogene Farbkodierung - Warum? Standardfarbskalen garantieren keine adäquate Abbildung der Datenwerte Farbtonskala Regenbogen-Farbskala Temperatur-Farbskala Relative Farbabstände der Farbskalen 12
Visual Scalability Es gibt viele Untersuchungen zu Anforderungen und Guidelines der Farbkodierung Beispiele für wahrnehmungsbasierte Farbskalen 145 CZ A D 0 UK IT Daten-abhängige Farbskalen -78 CH 13 Visual Scalability Value range Linear mapping Color scale Box-Whisker plot Value scale 50% of values in this range Median Exponential mapping 14
Visual Scalability Unterschiedliche Nutzerziele erfordern unterschiedliche Farbkodierungen (human scalability) Nach Andrienko & Andrienko ergeben sich 3 Alternativen: Individuelle Werte vs. Wertemengen nicht- segmentierte oder segmentierte Farbskala Identifizieren vs. Lokalisieren Farbskala entspricht Datenwerten oder Farbskala unterstützt Hervorhebungen Lookup vs. Vergleich Mehrere lokale oder eine globale Farbskala 15 Visual Scalability Lookup vs. Vergleich AOK-Daten über M-V Individuelle Farbskalen Globale Farbskala 16
Visual Scalability Farbskala für Vergleichszwecke 17 Visual Scalability Beispiel: Simulationsmodell für biochemische Reaktionsnetzwerke Visualiserung: - Kantenikone: Reaktionspfeile - Knotenikone: aggregierte Time- Value-Plots 18
Display Scalability Bei großen Datenmengen können nicht alle Informationen gleichzeitig in derselben Genauigkeit dargestellt werden: Bereiche von Interesse werden detailliert dargestellt, allgemeine Kontextinformationen werden vereinfacht widergegeben. Unterschiedliche Nutzerziele (human scalability) erfordern unterschiedliche Fk Fokussierungen. Unterschiedliche Ausgabegeräte g erfordern unterschiedliche Anzeigetechniken. 19 Display Scalability Skalierung der Darstellung von Tabellendaten Ausgangspunkt: Table Lens (Rao, Card, 1994) Prinzip: - Textmodus für Fokuszeilen - Graphikmodus für Kontext. Erweiterung: - Data Table View (Kreuseler 2000) Anordnung der Tabellenzeilen nach Ähnlichkeiten (mit SOM) 20
Display Scalability 21 Display Scalability Willkürliche Anordnung Anordnung von 3 Attributen Ähnlichkeitsanordnung 22
Display Scalability Skalierung bezogen auf Ausgabedisplays durch Adaption bzw. Progression 23 Display Scalability Skalierung bezogen auf Ausgabedisplays durch Adaption bzw. Progression Adaption mit Layer-Technik (Reduzierung des Visual Cluttering), Radloff, 2008 Radloff, A.; Luboschik, M.; Schumann, H.: Smart Views in Smart Environments. Proceedings of Smart Graphics 2011 Skalierung der Ausgabe durch Progression, Thiede et al, 2009 24
Multi-User-Szenarien Caleydo. Graz Spindler, M.; Tominski, C.; Schumann, H.; Dachselt, R.: Tangible Views for Information Visualization. ACM Conference on Interactive Tabletops and Surfaces, ITS 2010, Nov., 2010. Video 25 Guidance Die Vielfalt der Optionen ist sehr groß. Der Anwender braucht eine Unterstützung, um für seine Daten, seine Aufgaben die richtigen Bilder und Interaktionen auszuwählen Guidance Der Workflow muss protokollierbar und reproduzierbar sein. Streit, M.; Schulz, H.-J.; Lex, A.; Schmalstieg, D.; Schumann, H.: Model-Driven Design for the Visual Analysis of Heterogeneous Data. IEEE TVCG, June, 2012 Video 26