Informations- visualisierung

Größe: px
Ab Seite anzeigen:

Download "Informations- visualisierung"

Transkript

1 Informations- visualisierung Thema: 3. Mehrdimensionale Daten Dozent: Dr. Dirk Zeckzer Sprechstunde: nach Vereinbarung Umfang: 2 Prüfungsfach: Modul Fortgeschrittene Computergraphik Medizininformatik, Angewandte Informatik

2 Übersicht 1. Einleitung 2. Datentypen 3. Uni-Variate Data 4. Bi-Variate Data 5. Tri-Variate Data 6. Multi-Variate Data 7. Dimension Sortierung (Anordnung) Informationsvisualisierung 3-2

3 3.1. Einleitung Informationsvisualisierung dient vor allem drei Zielen: Präsentation Zu präsentierenden Fakten sind a priori festgelegt. Visualisierungsprozess besteht aus Auswahl geeigneter Präsentationstechniken. Ergebnis stellt eine hochqualitative Visualisierung der Daten dar, welche die ausgewählten Fakten präsentiert. Informationsvisualisierung 3-3

4 3.1. Einleitung Informationsvisualisierung dient vor allem drei Zielen: Überprüfende Analyse Es existieren zu überprüfende Hypothesen über Daten. Visualisierungsprozess führt eine zielorientierte Untersuchung der Hypothesen durch. Als Ergebnis entsteht eine Visualisierung der Daten, welche die Hypothesen bestätigt oder verwirft. Informationsvisualisierung 3-4

5 3.1. Einleitung Informationsvisualisierung dient vor allem drei Zielen: Erkundende Analyse Es gibt keine Hypothesen zu den Daten. Visualisierungsprozess zeichnet sich durch eine interaktive, ungerichtete Suche nach Strukturen aus. Im Ergebnis führt dies zu Visualisierungen der Daten, aus denen Hypothesen über Daten abgeleitet werden können. Informationsvisualisierung 3-5

6 3.2. Datentypen Unterteilung von möglichen Daten in Klassen hängt eng mit Klassifikation von Wissen zusammen. Problem kann deshalb bislang nicht endgültig gelöst werden. Orientieren an Ideen aus Softwaremodellierung und Datenbanken - Unterscheidung nach folgenden Elementen Objekte, Dinge, Einheiten, Instanzen (engl. entity) Relationen (zwischen Objekt) Attribute (von Objekten oder Relationen) Operationen (auf Objekten oder Relationen) Metadaten (Ergebnisse von Datenanalysen abgeleitete Objekte und Relationen ggf. mit Attributen) Informationsvisualisierung 3-6

7 3.2. Datentypen Attribute spielen für Visualisierung oft besondere Rolle, da ihre Transformation in grafische Elemente oft die Auswahl der Visualisierungstechnik dominiert. Folgende Kategorien werden bei Attributen unterschieden: Nominale Attribute: Reine Aufzählungen bzw. Mengen ohne Ordnung (z.b. Früchte) Ordinale Attribute: Diskrete, zuweilen endliche Mengen mit einer Ordnung (z.b. natürliche oder ganze Zahlen, Schulnoten) Kontinuierliche Attribute (quantitative): Teilmenge der rationalen, meist der reellen Zahlen (z. B. Temperatur, Geschwindigkeit) Informationsvisualisierung 3-7

8 3.2. Datentypen Informationsvisualisierung wird in vielen Anwendungsdomänen genutzt. Im Prinzip kann jede Datei oder Sammlung von Dateien im Rechner Ausgangspunkt einer Informationsvisualisierung sein, einschließlich von Algorithmen und Prozessen (Softwarevisualisierung). Folgende Liste enthält wesentliche Datenquellen und ihre Einordnung gemäß der Einteilung der Datentypen: Tabellen = Objekte mit Attributen Graphen = Objekte mit Relationen, möglicherweise mit Attributen Mediadaten = Objekte mit Attributen, teilweise auch Relationen Prozesse = Objekte mit Relationen und Operationen, oft mit Attributen Informationsvisualisierung 3-8

9 3.2. Datentypen Tabellen Tabellarische Daten wurden noch vor Graphen bislang am häufigsten visualisiert. Sie bestehen aus mehreren Datensätzen (Objekte) d 1,...,d m Enthalten jeweils einen Wert für eine feste Menge von Attributen x 1,...,x n Die meisten Anwendungen im kaufmännischen Bereich und viele Statistikanwendungen sind tabellarische Daten. Die meisten Datenbanken sind so organisiert. Informationsvisualisierung 3-9

10 3.2. Datentypen Graphen Filesysteme, Internetverbindungen, Straßennetze und Kommunikationssysteme sind Beispiele für Verbindungsstrukturen. Lassen sich durch Graphen mit unterschiedlichen Spezialisierungen abbilden Graphen bestehen aus Objekten (Knoten) und Relationen (Kanten). Beiden Elementtypen können Attribute zugeordnet sein. Informationsvisualisierung 3-10

11 3.2. Datentypen Mediadaten Textdokumente, Musikstücke und Filme passen nicht gut in obigen Formate Da sich auch ihre Visualisierung von den anderen Bereichen unterscheidet, sind sie hier getrennt aufgeführt Textdokumente. Jedes Dokument d ist formal ein Wort über einem Alphabet A, d A *. Dokumente sind noch in Kapitel, Abschnitte, Paragraphen, Sätze und Worte (Worte im üblichen Sinn ohne Leerzeichen und Interpunktionen) untergliedert Bilder. Bilddaten können in verschiedenen Formaten vorliegen, beschreiben jedoch letztlich ein 2 oder 3-dimensionales Array von Pixeln mit Farbwerten. Sounddaten. Folge von Amplitudenwerten mit konstanter zeitlicher Abfolge Filmdaten. Folge von Einzelbildern mit konstanter zeitlicher Abfolge Multimediadateien. Hier sind Filmdaten, Sounddaten, Bilder und Texte mit zeitlichen und räumlichen Angaben verknüpft. Informationsvisualisierung 3-11

12 3.2. Datentypen Prozesse Auch Prozesse lassen sich darstellen. Neben Objekten und Relationen auch Operationen Häufig mit Attributen Beispiele Algorithmen Softwaresysteme Geschäftsprozessmodellierungen Ablaufplanungen für Fabriken oder Kliniken Informationsvisualisierung 3-12

13 3.2. Datentypen Die Transformation in visuelle Strukturen hängt von der Dimension der Daten ab: Dimension: Anzahl der Attribute (Variablen) 1D Uni-Variate Daten 2D Bi-Variate Daten 3D Tri-Variate Daten 4D Multi-Variate Daten (Hyper-Variate Daten) Informationsvisualisierung 3-13

14 3.2. Datentypen In der Informationsvisualisierung werde diese Daten in einem 2- oder 3-dimensionalen visuellen Raum dargestellt (visuelle Abbildung) Im Folgenden sind die Daten meistens quantitativ Uni-, Bi- und Tri-Variate Daten werden normalerweise über die Position von Markierungen auf orthogonalen Achsen dargestellt Multi-Variate Daten sind schwieriger darzustellen Wahrnehmung ist sehr wichtig für die visuelle Abbildung und die Bildung von visuellen Strukturen Informationsvisualisierung 3-14

15 3.3. Uni-Variate Daten Folge eindimensionaler numerischer Attribute (idr. nominale Attribute zur Bezeichnung der Objekte vorhanden) Visualisierungen nutzen fast alle die offensichtliche Methode Daten entlang einer Achse abzutragen Wobei in der dritten Spalte die 25%, 50% und 75% - Prozentteile als Boxen, die 10%- und 90%- Perzentile als Balken und die Ausnahmen als Datenpunkte gezeichnet sind. Man kann Perzentile auch nur zusätzlich einzeichnen oder nur Mittelwert und Varianz angeben Werte werden dargestellt als Punkte Balken Segment [R. Spence. Information Visualization. ACM Press/Addison Wesley, New York, ISBN , 2001, page 35] Informationsvisualisierung 3-15

16 3.3. Uni-Variate Daten Plot Plot mit Bezeichungen Tukey Box Plot [Spence 2001] Informationsvisualisierung 3-16

17 3.3. Uni-Variate Daten [Spence 2001] Informationsvisualisierung 3-17

18 3.3. Uni-Variate Daten Histogramme Können mit statistischen Angaben angereichert werden [Spence 2001] Informationsvisualisierung 3-18

19 3.3. Uni-Variate Daten Pie-Chart (Tortendiagramm, Kreisdiagramm) [R. Spence. Information Visualization. ACM Press/Addison Wesley, New York, ISBN , 2001, page 35] Informationsvisualisierung 3-19

20 3.3. Uni-Variate Daten Pie Charts Zeigen relative/anteilige Verteilung Kaum Verwendung im wissenschaftlichen Bereich, dafür für Geschäftsgraphiken Probleme: Fläche und Winkel sind schwieriger zu interpretieren als Länge Schwierig für (numerische) Vergleiche Nutzung von vielen Pie Charts gleichzeitig ist sehr schwierig Informationsvisualisierung 3-20

21 3.3. Uni-Variate Daten Semantische Vergrößerung [R. Spence. Information Visualization. ACM Press/Addison Wesley, New York, ISBN , 2001, page 39] Informationsvisualisierung 3-21

22 3.4. Bi-Variate Daten Bi-Variate Daten bestehen offensichtlich aus einer Menge von Objekten mit zwei Attributen. In der Regel wird ein Zusammenhang der beiden Attribute gesucht. Punktdarstellungen in einem kartesischen Koordinatensystem gehört zu den bekannten Standards: Scatterplot Beispiel: Hauspreise und Anzahl der Schlafzimmer werden gegenübergestellt. [Spence 2001] Informationsvisualisierung 3-22

23 3.4. Bi-Variate Daten Bei präsentativer Visualisierung können Statistische Analyseergebnisse eintragen werden Informationsvisualisierung 3-23

24 3.4. Bi-Variate Daten Man kann auch Histogramme wieder nutzen Müssen allerdings gekoppelt werden (linked) Farbe Pattern (Textur) Interaktion [Spence 2001] Informationsvisualisierung 3-24

25 3.5. Tri-Variate Daten Hier sind jedem Objekt drei kontinuierliche Attribute zugeordnet. IdR. wird Zusammenhang zwischen den Attributen gesucht. Punktdarstellung (Kugeln) gehört zu den offensichtlichen Lösungen. Logische oder geometrische 2D-Projektion der 3D Darstellung Verdeckungsproblem Informationsvisualisierung 3-25

26 3.5. Tri-Variate Daten Probleme 2D-Darstellung eines 3D-Raumes Wie bestimmt man die Werte? [Spence 2001] Informationsvisualisierung 3-26

27 3.5. Tri-Variate Daten Lösung: Betrachtung aller achsenparallelen Projektionen hilft oft weiter Alle drei möglichen 1-1 Beziehungen können untersucht werden [Spence 2001] Informationsvisualisierung 3-27

28 3.5. Tri-Variate Daten Scatterplot-Matrix: Übersichtlichere Anordnung Brushing: Markierung gleicher Punkte Scatter Plot Matrix Scatter Plot Matrix mit Brushing [Spence 2001] Informationsvisualisierung 3-28

29 3.5. Tri-Variate Daten Alternative: Repräsentation einer Dimension durch Größe oder Farbe Nachteil: Unterschiedliche Qualität in der Darstellung macht es schwieriger, Korrelationen zu sehen [Inspired by a lecture of J. Stasko] Informationsvisualisierung 3-29

30 3.5. Tri-Variate Daten Mit Hilfe von Interpolation kann man auch Flächen zur Darstellung verwenden. Schnitt-Ebenen können bei der Festlegung von Werten helfen ( Flooding ). In diesem Bereich treffen sich Informationsvisualisierung und wissenschaftliche Visualisierung. [Spence 2001] Informationsvisualisierung 3-30

31 Wenn mehr als drei kontinuierliche Attribute gegeben sind, können diese nicht mehr nur über die Position repräsentiert werden. Alternativen (Tri-Variate Darstellung): Scatterplot-Matrizen Repräsentation mittels Farbe oder Größe Neue Methoden Informationsvisualisierung 3-31

32 Geometrische Ansätze (Projektion) Scatterplot-Matrizen Auch für n-dimensionalen Fall nutzbar Es ergeben sich n2 n 2 verschiedene Koordinatenpaare [Cleveland W. S.: Visualizing Data AT&T Bell Labortories, Murray Hill, NJ, revised edition] [Ankerst et al. 2002] Informationsvisualisierung 3-32

33 Hyperslice Ohne strikte Festlegung auf orthogonale Projektionen n² Schnitte fester Breite durch Daten legen [van Wijk, van Liere, Hyperslice, Proc. Vis 1993] [Ankerst et al. 2002] Informationsvisualisierung 3-33

34 Prosection Views Auswahl einer n-dimensionaler Teilmenge (Hyperwürfel) Wird bei Projektion mit anderer Farbe dargestellt [Furnas G. W., Buja A.: Prosections Views: Dimensional Inferecel through Sections and Projections, Journal of Computational and Graphical Statistics, Vol. 3, No. 4, 1994, pp ] [Su H., Dawkes H., Tweedie L., Spence R.: An Interactive Visualization Tool for Tolerance Design, Technical Report, Imperial College, London, 1995] [Ankerst et al. 2002] Informationsvisualisierung 3-34

35 Hyperbox Oberfläche eines dreidimensionalen Polytops wird gezeichnet Sichtbare Polygone bestehen aus Vierecken, die genau allen auftretenden Attributpaaren entsprechen Knoten entsprechen in den beiden benachbarten Vierecken stets dem gleichen Attribut. Dies gilt auch für gegenüberliegenden Seiten jedes Viereck Werte können auf die Overfläche abgebildet werden Farbe Textur 6D-Hyperbox [Alpen und Carten, Hyperbox, Proc. IEEE Visualization, pp , 1991] [Spence 2001] Informationsvisualisierung 3-35

36 Koordinatenachsenbasierte Ansätze Parallele Koordinaten Es werden n parallele Achsen gezeichnet, gehören zu n Attributen. Jede Achse wird auf das [Minimum, Maximum]-Intervall der auftretenden Werte skaliert. Jeder Datensatz wird als Polygon dargestellt. [Inselberg 1985, Inselberg 1998, Wegman 1990] [Spence 2001] Informationsvisualisierung 3-36

37 Parallele Koordinaten [Inselberg 1985, Inselberg 1998, Wegman 1990] [Spence 2001] Informationsvisualisierung 3-37

38 Beispiele [Amit Goel. Parallel Coordinates Visualization Applet. Virginia Tech. http: //csgrad.cs.vt.edu/ agoel/parallel_coordinates/. (Cited on page 12.) 1995] [http://www.amitgoel.com/pcoord/stf/table1.stf] Informationsvisualisierung 3-38

39 Beispiele [http://davis.wpi.edu/~xmdv/] Informationsvisualisierung 3-39

40 Linienzüge zeigen lineare Abhängigkeiten der Daten. [Ankerst et al. 2002] Die Polygonzüge schneiden sich zwischen zwei Achsen in maximal einem Punkt. Man kann Regeln für k-dimensionale Unterräume ableiten. [Inselberg 1998] Informationsvisualisierung 3-40

41 Leichtes Rauschen verursacht Probleme. [Ankerst et al. 2002] Informationsvisualisierung 3-41

42 Nachteile von parallelen Koordinaten Bei einer großen Anzahl von Datensätzen gibt es viele Überlappungen Relativ unflexibel (anfangs) Viele Erweiterungen Um die Nachteile zu beseitigen, wurden Techniken wie Fokus und Kontext (siehe spätere Kapitel) eingesetzt Beispiel: Parvis Informationsvisualisierung 3-42

43 Parvis Beispiele Brushing [http://old.vrvis.at/via/research/ang-brush/] Informationsvisualisierung 3-43

44 Parvis Beispiele Brushing + Histogram [http://old.vrvis.at/via/research/ang-brush/] Informationsvisualisierung 3-44

45 Parvis Beispiele Auswahl über Achsenabschnitte und Winkel (in rot) Fokus [http://old.vrvis.at/via/research/ang-brush/] Informationsvisualisierung 3-45

46 [Jimmy Johansson, Revealing Structure within Clustered Parallel Coordinates Displays, InfoVis 2005] Informationsvisualisierung 3-46

47 [Jimmy Johansson, Revealing Structure within Clustered Parallel Coordinates Displays, InfoVis 2005] Informationsvisualisierung 3-47

48 [Jimmy Johansson, Revealing Structure within Clustered Parallel Coordinates Displays, InfoVis 2005] Informationsvisualisierung 3-48

49 [Jimmy Johansson, Revealing Structure within Clustered Parallel Coordinates Displays, InfoVis 2005] Informationsvisualisierung 3-49

50 Star Plot Wenn man Achsen nicht parallel, sondern sternförmig anordnet, erhält man den Star Plot. Einzelne Sterne pro Objekt erzeugen Ein Stern für alle Datensätze [Spence 2001] Informationsvisualisierung 3-50

51 Star Plot Beispiele Informationsvisualisierung 3-51

52 Star-Koordinaten Kombination von Star Plots und Scatterplots Initial haben alle Achsen die gleiche Länge Die Punkten werden wie in der Abbildung gezeigt positioniert Interaktion Skalierung der Achsen Rotieren der Achsen Auswahl von Punkten 8D-Star Coordinate [http://people.cs.vt.edu/~north/infoviz/starcoords.pdf] [E. Kandogan, Visualizing multi-dimensional clusters, trends, and outliers using star coordinates, Proc. of ACM SIGKDD Conference, 2001, pp ] Informationsvisualisierung 3-52

53 Star-Koordinaten [http://people.cs.vt.edu/~north/infoviz/starcoords.pdf] [E. Kandogan, Visualizing multi-dimensional clusters, trends, and outliers using star coordinates, Proc. of ACM SIGKDD Conference, 2001, pp ] Informationsvisualisierung 3-53

54 RadViz TM Bei RadViz werden Achsen ebenfalls radial aufgespannt Werte der einzelnen Attribute werden jedoch als Federkonstanten interpretiert, die Punkt, der ein Objekt darstellt, zu einem Eckpunkt zieht Dabei werden alle Attribute über ihr jeweiliges Min-Max-Intervall skaliert und in den nichtnegativen Raum verschoben (etwa alle auf [0, 1]). [Ankerst et al. 2002] Informationsvisualisierung 3-54

55 [Jarry H.T. Claessen, Jarke J. van Wijk, Flexible Linked Axes for Multivariate Data Visualization, InfoVis 2011] Informationsvisualisierung 3-55

56 [Jarry H.T. Claessen, Jarke J. van Wijk, Flexible Linked Axes for Multivariate Data Visualization, InfoVis 2011] Informationsvisualisierung 3-56

57 [Jarry H.T. Claessen, Jarke J. van Wijk, Flexible Linked Axes for Multivariate Data Visualization, InfoVis 2011] Informationsvisualisierung 3-57

58 [Jarry H.T. Claessen, Jarke J. van Wijk, Flexible Linked Axes for Multivariate Data Visualization, InfoVis 2011] Informationsvisualisierung 3-58

59 [Jarry H.T. Claessen, Jarke J. van Wijk, Flexible Linked Axes for Multivariate Data Visualization, InfoVis 2011] Informationsvisualisierung 3-59

60 [Jarry H.T. Claessen, Jarke J. van Wijk, Flexible Linked Axes for Multivariate Data Visualization, InfoVis 2011] Informationsvisualisierung 3-60

61 [Jarry H.T. Claessen, Jarke J. van Wijk, Flexible Linked Axes for Multivariate Data Visualization, InfoVis 2011] Informationsvisualisierung 3-61

62 [Jarry H.T. Claessen, Jarke J. van Wijk, Flexible Linked Axes for Multivariate Data Visualization, InfoVis 2011] Informationsvisualisierung 3-62

63 [Jarry H.T. Claessen, Jarke J. van Wijk, Flexible Linked Axes for Multivariate Data Visualization, InfoVis 2011] Informationsvisualisierung 3-63

64 [Jarry H.T. Claessen, Jarke J. van Wijk, Flexible Linked Axes for Multivariate Data Visualization, InfoVis 2011] Informationsvisualisierung 3-64

65 [Stef van den Elzen, Jarke J. van Wijk, Small Multiples, Large Singles, EuroVis 2013] Informationsvisualisierung 3-65

66 [Stef van den Elzen, Jarke J. van Wijk, Small Multiples, Large Singles, EuroVis 2013] Informationsvisualisierung 3-66

67 [Stef van den Elzen, Jarke J. van Wijk, Small Multiples, Large Singles, EuroVis 2013] Informationsvisualisierung 3-67

68 [Stef van den Elzen, Jarke J. van Wijk, Small Multiples, Large Singles, EuroVis 2013] Informationsvisualisierung 3-68

69 [Stef van den Elzen, Jarke J. van Wijk, Small Multiples, Large Singles, EuroVis 2013] Informationsvisualisierung 3-69

70 [Stef van den Elzen, Jarke J. van Wijk, Small Multiples, Large Singles, EuroVis 2013] Informationsvisualisierung 3-70

71 [Stef van den Elzen, Jarke J. van Wijk, Small Multiples, Large Singles, EuroVis 2013] Informationsvisualisierung 3-71

72 [Stef van den Elzen, Jarke J. van Wijk, Small Multiples, Large Singles, EuroVis 2013] Informationsvisualisierung 3-72

73 Dimensional Stacking Unterteilung in Untergruppen für Dimensionen Auf den Hauptachsen die Hauptdimensionen In Teilabschnitten die Nebendimensionen Gut bei einer geringen Kardinalität (Anzahl von Datenpunkten) Beschränkt in Anzahl der Dimensionen Informationsvisualisierung 3-73

74 Dimensional Stacking Breitengrad Bohrtiefe Steinqualität Längengrad Informationsvisualisierung 3-74

75 Stacked Histogram Viele Ansätze versuchen mehr Variablen in Histogramm zu packen Zwei Variablen Absolutes Histogramm [Wikipedia.de] Relatives Histogramm [Hauser, 2006] Informationsvisualisierung 3-75

76 ThemeRiver Sammlung wird in einzelne Zeitscheiben aufgeteilt (Dokumenten mit Zeitstempel) Informationsvisualisierung 3-76

77 Für sehr große Objektzahlen und/oder viele Attribute kommt man mit bisherigen Verfahren sehr schnell an Grenze der Bildschirmauflösung Pro Objekt und Attribut werden viele Pixel verwendet Überschneidungen verhindern schnell klare Sicht auf Daten Pixelbasierte Verfahren (Dense Pixel Displays) verwenden Darstellungs-kapazität das Bildschirms optimal Verwenden pro Attributwert eines Objektes genau ein Pixel Farbe des Pixels gibt Wert an Werte der einzelnen Attribute für alle Datensätze, also die Spalten der Tabelle, bilden eigene Teilfenster (subwindows) [Ankerst et al. 2002] Informationsvisualisierung 3-77

78 [Ankerst et al. 2002] Informationsvisualisierung 3-78

79 Folgende Fragen stellen sich Wie werden die Pixel innerhalb der Teilfenster positioniert? Sind neben Rechtecken andere Teilfensterformen möglich? Wie können die Attribute (Dimensionen, Teilfenster) angeordnet werden? Informationsvisualisierung 3-79

80 Anordnung der Pixel Suchen einer bijektiven Abbildung f: 1,, m 1,, b {1,, h}, m Objekte, b Teilfensterbreite, h Teilfensterhöhe, so dass die Funktion m i=1 m j=1 d f i, f j d 0,0, b i j m, h i j m minimiert wird. Dabei ist d(f i, f j ) eine L p -Norm (p = 1, 2), der Abstand von Pixel d i zu d j. Informationsvisualisierung 3-80

81 [Ankerst et al. 2002] Informationsvisualisierung 3-81

82 [Ankerst et al. 2002] Informationsvisualisierung 3-82

83 Rekursive Muster Man kann ein Muster der Ebene i-1 w i -mal in horizontaler Richtung und dann h i fach in vertikaler Richtung zeichnen. [Ankerst et al. 2002] Informationsvisualisierung 3-83

84 [Ankerst et al. 2002] Informationsvisualisierung 3-84

85 [Ankerst, Keim, Kriegel: Circle segments: A technique for visually exploring large dimensional datasets. IEEE Visualization Hot Topics 1996] Informationsvisualisierung 3-85

86 Form der Teilfenster Für Teilfenster eignen sich 2D-Arrays von Rechtecken und Kreissegmente. [Ankerst et al. 2002] Informationsvisualisierung 3-86

87 Circle segments Example Circle segment of visualization of 50 stocks in the past 20 years The arrangement of the pixels starts at the center of the circle and continues to the outside by plotting on a line orthogonal to the segment halving line All older values lie near the center and they are close to each other so that the visual comparison is enhanced [Ankerst, Keim, Kriegel: Circle segments: A technique for visually exploring large dimensional datasets. IEEE Visualization Hot Topics 1996] [Ankerst et al. 2002] Informationsvisualisierung 3-87

88 [Ankerst et al. 2002] Informationsvisualisierung 3-88

89 VisDB wurde zur Visualisierung und Erforschung von Datenbanken entwickelt [Keim D. A., Kriegel H.-P. VisDB: Database Exploration using Multidimensional Visualization, Computer Graphics & Applications Journal, 1994] Motivation: Datenbanken enthalten ein große Menge von Elementen in jeweils n Dimensionen n-dimensionale Abfrage der Datenbank Problem: oft keine exakte Übereinstimmung Lösung: finden von nahen Elementen Informationsvisualisierung 3-89

90 Wie nahe ist ein Eintrag zu einer Anfrage? Datensätze haben oft numerische Werte Jeder Wert einer Dimension hat einen gewissen Abstand zur Anfrage Aufsummieren der Abstände Relevanz ist der Kehrwert des Abstandes: Kleiner Abstand hohe Relevanz Großer Abstand geringe Relevanz Beispiel (5D, Integer von 0 bis 255) Anfrage: 6, 210, 73, 45, 92 Datensatz: 8, 200, 73, 50, 91 Abstand: = 18 Relevanz: = 1267 Informationsvisualisierung 3-90

91 Kodierung Berechne Relevanz aller Datensätze Sortiere sie nach ihrer Relevanz Verwende Spiraltechnik zur Anordnung der Werte von Innen nach Außen Verwende Farben zur Kodierung der Relevanz Informationsvisualisierung 3-91

92 Spiraltechnik Höchste Relevanz im Zentrum Absteigende Relevanz nach außen Informationsvisualisierung 3-92

93 Spiraltechnik 5 Dimensionen Informationsvisualisierung 3-93

94 Gruppierung Anstelle von mehreren Fenstern Gruppiere alle Dimensionen eines Datensatzes Informationsvisualisierung 3-94

95 VisDB Beispiele 8 Dimensionen und 1000 Datensätze Mehrere Fenster Gruppierung Informationsvisualisierung 3-95

96 VisDB Beispiele Informationsvisualisierung 3-96

97 Ordinale Attribute lassen sich gut mit Farben darstellen Pixeltechniken sind sogar eher für ordinale Variablen geeignet Mischungen von ordinalen und kontinuierlichen Attributen sind in der Regel ebenfalls möglich Aber: Bei koordinatenachsenorientierten Verfahren führen die ordinalen Attribute mit einer kleiner Wertmenge zu auffälligen Clustern Diese springen dem Anwender ins Auge und überbetonen damit diese Attribute Informationsvisualisierung 3-97

98 Projektions- und Koordinatenachsenansätze eignen sich nur sehr begrenzt für nominale Attribute, da die Reihenfolge der Werte künstlich erzeugt werden muss. Pixelbasierte Verfahren können dagegen gut mit kategorischen Variablen umgehen, da Farben nach Kapitel 2 im Allgemeinen nicht geordnet sind. Verwendung der Verfahren für kontinuierliche Attribute Einige Techniken sind für ordinale und nominale Attribute besonders geeignet. Informationsvisualisierung 3-98

99 Iconbasierte Techniken Bei den iconbasierten (icon = Bildelement) Techniken werden kleine Graphikelemente aufgrund der Werte eines oder mehrerer Attribute verändert. Werden auf dem Bildschirm dargestellt mit Hilfe Von Werten weiterer Variablen Geometrischer Lage Per ebenenfüllender Kurve (VisDB) Informationsvisualisierung 3-99

100 Chernoff Faces Bei den Chernoff Faces [Chernoff 1973] wird die Tatsache ausgenutzt, dass Menschen Gesichter besonders gut unterscheiden können. [H. Chernoff. The Use of Faces to Represent Points in k-dim Space Graphically, J. of American Statistical Association 68: , 1973] [http://bradandkathy.com/software/faces.html] [Spence 2001] Informationsvisualisierung 3-100

101 Chernoff Faces Bei den Chernoff Faces [Chernoff 1973] wird die Tatsache ausgenutzt, dass Menschen Gesichter besonders gut unterscheiden können. [H. Chernoff. The Use of Faces to Represent Points in k-dim Space Graphically, J. of American Statistical Association 68: , 1973] [Spence 2001] Informationsvisualisierung 3-101

102 [Ankerst et al. 2002] Informationsvisualisierung 3-102

103 Stick Figures Bei Strichfiguren (Stick Figures) werden zwei kontinuierliche oder ordinale Attribute (falls vorhanden) zur Positionierung in der Ebene verwendet Übrigen Attribute werden für Winkel und/oder Längen der Striche verwendet [Pickett R. M.: Visual Analyses of Texture in the Detection and Recognition of Objects in: Picture Processing and Psycho-Pictorics, Lipkin B. S., Rosenfeld A. (eds.), Academic Press, New York, 1970] [Tufte E. R.: The Visual Display of Quantitative Information ', Graphics Press, Cheshire, CT, 1983] [Ankerst et al. 2002] Informationsvisualisierung 3-103

104 Texturen aus diesen Figuren ergeben dann Datencharakteristika [Ankerst et al. 2002] Informationsvisualisierung 3-104

105 Shape Coding Nutzt kleine Rechtecke um die einzelnen Datensätze anzuzeigen Hält für jedes Attribut ein Teilquadrat bereit Rechtecke werden dann geeignet angeordnet, wozu häufig die Zeit (bei Zeitreihen) verwendet wird [Beddow J.: Shape Coding of Multidimensional Data on a Mircocomputer Display, Proc. IEEE Visualization, pp , 1990,] [Ankerst et al. 2002] Informationsvisualisierung 3-105

106 [Ankerst et al. 2002] Informationsvisualisierung 3-106

107 3.7. Dimension Ordering Clutter reduction in Multi-Dimensional Data Visualization [Wei Peng et al., Clutter Reduction in Multi-Dimensional Data Visualization Using Dimension Reordering, InfoVis 2004] Informationsvisualisierung 3-107

108 3.7. Dimension Ordering Maß für Clutter Measure in Parallelen Koordinaten Annahme: Ausreißer verschleiern die Struktur Maß: Verhältnis von Ausreißern zur Gesamtanzahl der Datenpunkte S outlier : Anzahl der Ausreißer zwischen benachbarten Dimensionen Anzahl der banachbarten Paare: n 1 S avg = S outlier n 1 S total : Gesamtzahl der Datenpunkte C = S avg S total = S outlier n 1 S total Informationsvisualisierung 3-108

109 3.7. Dimension Ordering [Wei Peng et al., Clutter Reduction in Multi-Dimensional Data Visualization Using Dimension Reordering, InfoVis 2004] Informationsvisualisierung 3-109

110 3.7. Dimension Ordering [Wei Peng et al., Clutter Reduction in Multi-Dimensional Data Visualization Using Dimension Reordering, InfoVis 2004] Informationsvisualisierung 3-110

111 3.7. Dimension Ordering [Wei Peng et al., Clutter Reduction in Multi-Dimensional Data Visualization Using Dimension Reordering, InfoVis 2004] Informationsvisualisierung 3-111

112 3.7. Dimension Ordering [Wei Peng et al., Clutter Reduction in Multi-Dimensional Data Visualization Using Dimension Reordering, InfoVis 2004] Informationsvisualisierung 3-112

113 3.7. Dimension Ordering [Wei Peng et al., Clutter Reduction in Multi-Dimensional Data Visualization Using Dimension Reordering, InfoVis 2004] Informationsvisualisierung 3-113

114 3.7. Dimension Ordering [Wei Peng et al., Clutter Reduction in Multi-Dimensional Data Visualization Using Dimension Reordering, InfoVis 2004] Visualization Algorithm complexity Dataset Size Dim. Time (min) Parallel Coordinates O(n n!) AAUP :03 Cereal :23 Voy :02 Scatterplot Matrices O(n 2 n!) Voy (6) 0:05 Star Glyphs O(m n n!) AAUP :13 Cars :18 Dimensional Stacking O(m 2 n!) Coal Disaster :10 Detroit :05 Informationsvisualisierung 3-114

115 Literatur R. Spence. Information Visualization. Addison-Wesley, Reading, MA, USA, M. Ankerst, G. Grinstein, D. Keim. Visual Data Mining, Tutorial at KDD 2002 Informationsvisualisierung 3-115

Visualisierung großer Datenbanken

Visualisierung großer Datenbanken Business Intelligence 1 Visualisierung großer Datenbanken Prof. Dr. Hans-Peter Kriegel, Institut für Informatik, Universität München und Prof. Dr. Daniel A. Keim, Institut für Informatik, Universität Halle-Wittenberg

Mehr

Visualisierung in Natur- und Technikwissenschaften. 0. Einführung. Vorlesung: Mi, 11:15 12:45 + Fr, 9:15 10:45, INF 368 532 Prof. Dr.

Visualisierung in Natur- und Technikwissenschaften. 0. Einführung. Vorlesung: Mi, 11:15 12:45 + Fr, 9:15 10:45, INF 368 532 Prof. Dr. Visualisierung in Natur- und Technikwissenschaften 0. Einführung Vorlesung: Mi, 11:15 12:45 + Fr, 9:15 10:45, INF 368 532 Prof. Dr. Heike Leitte Vertiefung Computergraphik und Visualisierung Jürgen Hesser

Mehr

Datenvisualisierung und Data Mining

Datenvisualisierung und Data Mining B 26 Datenvisualisierung und Data Mining 1 B 26 Datenvisualisierung und Data Mining B 26.1 Einleitung Die rasante technologische Entwicklung der letzten zwei Jahrzehnte ermöglicht heute die persistente

Mehr

Analyse alt- und mittelpaläolithischer Steinartefaktinventare mittels Parallelkoordinatenplots

Analyse alt- und mittelpaläolithischer Steinartefaktinventare mittels Parallelkoordinatenplots Einleitung Analyse alt- und mittelpaläolithischer Steinartefaktinventare mittels Parallelkoordinatenplots von Irmela Herzog Im Rahmen der Herbsttagung der AG DANK (Datenanalyse und Numerische Klassifikation)

Mehr

Datenvisualisierung und Data Mining

Datenvisualisierung und Data Mining Datenvisualisierung und Data Mining Daniel A. Keim Universität Konstanz und AT&T Shannon Research Labs 180 Park Ave, Florham Park, NJ, 07932, USA Telefon (+1) 973 360 8482, Fax (+1) 973 360 8077 keim@research.att.com

Mehr

Visual Data Mining im Überblick

Visual Data Mining im Überblick I Visual Data Mining im Überblick Lehrveranstaltung: Seminar Softwaretechnik Dozenten: Stefan Jähnichen, Susanne Jucknath Semester: WS 02 /03 Verfasser: Konrad Kellermann TU Berlin Matrikelnummer: 190213

Mehr

Häufigkeitstabellen. Balken- oder Kreisdiagramme. kritischer Wert für χ2-test. Kontingenztafeln

Häufigkeitstabellen. Balken- oder Kreisdiagramme. kritischer Wert für χ2-test. Kontingenztafeln Häufigkeitstabellen Menüpunkt Data PivotTable Report (bzw. entsprechendes Icon): wähle Data Range (Zellen, die die Daten enthalten + Zelle mit Variablenname) wähle kategoriale Variable für Spalten- oder

Mehr

Data Mining und Knowledge Discovery in Databases

Data Mining und Knowledge Discovery in Databases Data Mining und Knowledge Discovery in Databases Begriffsabgrenzungen... Phasen der KDD...3 3 Datenvorverarbeitung...4 3. Datenproblematik...4 3. Möglichkeiten der Datenvorverarbeitung...4 4 Data Mining

Mehr

Interaktive Analyse von Supercomputer-Leistungsdaten

Interaktive Analyse von Supercomputer-Leistungsdaten Institut für Visualisierung und Interaktive Systeme Universität Stuttgart Universitätsstraße 38 D 70569 Stuttgart Diplomarbeit Nr. 3483 Interaktive Analyse von Supercomputer-Leistungsdaten Jessica Hackländer

Mehr

Seminar Komplexe Objekte in Datenbanken

Seminar Komplexe Objekte in Datenbanken Seminar Komplexe Objekte in Datenbanken OPTICS: Ordering Points To Identify the Clustering Structure Lehrstuhl für Informatik IX - Univ.-Prof. Dr. Thomas Seidl, RWTH-Aachen http://www-i9.informatik.rwth-aachen.de

Mehr

1,11 1,12 1,13 1,14 1,15 1,16 1,17 1,17 1,17 1,18

1,11 1,12 1,13 1,14 1,15 1,16 1,17 1,17 1,17 1,18 3. Deskriptive Statistik Ziel der deskriptiven (beschreibenden) Statistik (explorativen Datenanalyse) ist die übersichtliche Darstellung der wesentlichen in den erhobenen Daten enthaltene Informationen

Mehr

Interaktive Plots. 2. Theorie und Beispiele. Motivation. 4. Fazit. 3. iplots. Gliederung. Fragen:

Interaktive Plots. 2. Theorie und Beispiele. Motivation. 4. Fazit. 3. iplots. Gliederung. Fragen: Interaktive Plots Peter Mayer betreut durch: Armin Monecke 13. Januar 2011 LMU München, Institut für Statistik, Wintersemester 10/11, Seminar: Graphiken in R im Bachelor-Studiengang 1 Motivation Datensatz

Mehr

Data Cube. Aggregation in SQL. Beispiel: Autoverkäufe. On-line Analytical Processing (OLAP) 1. Einführung. 2. Aggregation in SQL, GROUP BY

Data Cube. Aggregation in SQL. Beispiel: Autoverkäufe. On-line Analytical Processing (OLAP) 1. Einführung. 2. Aggregation in SQL, GROUP BY Data Cube On-line Analytical Processing (OLAP). Einführung Ziel: Auffinden interessanter Muster in großen Datenmengen 2. Aggregation in SQL, GROUP BY 3. Probleme mit GROUP BY 4. Der Cube-Operator! Formulierung

Mehr

bersicht Datenbanken und Datawarehouses Datenbank Datenbanksysteme Niels Schršter

bersicht Datenbanken und Datawarehouses Datenbank Datenbanksysteme Niels Schršter bersicht Niels Schršter EinfŸhrung GROUP BY Roll UpÔs Kreuztabellen Cubes Datenbank Ansammlung von Tabellen, die einen ãausschnitt der WeltÒ fÿr eine Benutzergruppe beschreiben. Sie beschreiben die funktionalen

Mehr

Räumliches Data Mining

Räumliches Data Mining Räumliches Data Mining Spatial Data Mining Data Mining = Suche nach "interessanten Mustern" in sehr großen Datensätzen => explorative Datenanlyse auch: Knowledge Discovery in Databases (KDD) verbreitete

Mehr

Animation der Montage von CATIA-Bauteilen

Animation der Montage von CATIA-Bauteilen Animation der Montage von CATIA-Bauteilen KONZEPTION UND PROTOTYP PRÄSENTATION ZUM PRAXISPROJEKT SS 2007 VON TIM HERMANN BETREUER: PROF. DR. HORST STENZEL Motivation Voraussetzungen Ziele Datenkonvertierung

Mehr

Visual Business Intelligence Eine Forschungsperspektive

Visual Business Intelligence Eine Forschungsperspektive Visual Business Intelligence Eine Forschungsperspektive Dr. Jörn Kohlhammer Fraunhofer-Institut für Graphische Datenverarbeitung IGD Fraunhoferstraße 5 64283 Darmstadt Tel.: +49 6151 155 646 Fax.: +49

Mehr

Algorithms for graph visualization

Algorithms for graph visualization Algorithms for graph visualization Project - Orthogonal Grid Layout with Small Area W INTER SEMESTER 2013/2014 Martin No llenburg KIT Universita t des Landes Baden-Wu rttemberg und nationales Forschungszentrum

Mehr

Eine computergestützte Einführung mit

Eine computergestützte Einführung mit Thomas Cleff Deskriptive Statistik und Explorative Datenanalyse Eine computergestützte Einführung mit Excel, SPSS und STATA 3., überarbeitete und erweiterte Auflage ^ Springer Inhaltsverzeichnis 1 Statistik

Mehr

4. Kapitel 3D Engine Geometry

4. Kapitel 3D Engine Geometry 15.11.2007 Mathematics for 3D Game Programming & Computer Graphics 4. Kapitel 3D Engine Geometry Anne Adams & Katharina Schmitt Universität Trier Fachbereich IV Proseminar Numerik Wintersemester 2007/08

Mehr

Visual Business Analytics Visueller Zugang zu Big Data

Visual Business Analytics Visueller Zugang zu Big Data Visual Business Analytics Visueller Zugang zu Big Data Dr.-Ing. Jörn Kohlhammer Fraunhofer-Institut für Graphische Datenverarbeitung (IGD) Fraunhoferstraße 5 64283 Darmstadt Tel.: +49 6151 155-646 Fax:

Mehr

Inhaltsverzeichnis. I Einführung in STATISTICA 1. 1 Erste Schritte in STATISTICA 3

Inhaltsverzeichnis. I Einführung in STATISTICA 1. 1 Erste Schritte in STATISTICA 3 I Einführung in STATISTICA 1 1 Erste Schritte in STATISTICA 3 2 Datenhaltung in STATISTICA 11 2.1 Die unterschiedlichen Dateitypen in STATISTICA....... 11 2.2 Import von Daten......... 12 2.3 Export von

Mehr

DLR_School_Lab- Versuch Haftmagnet

DLR_School_Lab- Versuch Haftmagnet Drucksachenkategorie DLR_School_Lab- Versuch Haftmagnet Untersuchung von Haftmagneten durch Messungen und numerische Simulation nach der Finite- Elemente-Methode (FEM) Version 3 vom 30. 6. 2014 Erstellt

Mehr

Detecting Near Duplicates for Web Crawling

Detecting Near Duplicates for Web Crawling Detecting Near Duplicates for Web Crawling Gurmeet Singh Manku et al., WWW 2007* * 16th international conference on World Wide Web Detecting Near Duplicates for Web Crawling Finde near duplicates in großen

Mehr

Statistik und Wahrscheinlichkeitsrechnung

Statistik und Wahrscheinlichkeitsrechnung Statistik und Wahrscheinlichkeitsrechnung Übung 2 28.02.2008 1 Inhalt der heutigen Übung Beschreibende Statistik Gemeinsames Lösen der Übungsaufgaben 2.1: Häufigkeitsverteilung 2.2: Tukey Boxplot 25:Korrelation

Mehr

Timeline Figure - Grafische Darstellung eines Subjekts in der klinischen Forschung

Timeline Figure - Grafische Darstellung eines Subjekts in der klinischen Forschung Timeline Figure - Grafische Darstellung eines Subjekts in der klinischen Forschung Poster Endri Endri DataFocus GmbH Lothringer Straße 23 D-50667 Köln endri0501@yahoo.de Zusammenfassung Eine Timeline-Grafik

Mehr

Einführung in die Wissensverarbeitung und Data Mining

Einführung in die Wissensverarbeitung und Data Mining Einführung in die Wissensverarbeitung und Data Mining Peter Becker FH Bonn-Rhein-Sieg Fachbereich Angewandte Informatik!" $# Vorlesung Wintersemester 2001/02 1. Einführung Vorbemerkungen 1 Einführung Vorbemerkungen

Mehr

Exploration und Klassifikation von BigData

Exploration und Klassifikation von BigData Exploration und Klassifikation von BigData Inhalt Einführung Daten Data Mining: Vorbereitungen Clustering Konvexe Hülle Fragen Google: Riesige Datenmengen (2009: Prozessieren von 24 Petabytes pro Tag)

Mehr

Realisierung von OLAP Operatoren in einem visuellen Analysetool. Vortrag von Alexander Spachmann und Thomas Lindemeier

Realisierung von OLAP Operatoren in einem visuellen Analysetool. Vortrag von Alexander Spachmann und Thomas Lindemeier Realisierung von OLAP Operatoren in einem visuellen Analysetool Vortrag von Alexander Spachmann und Thomas Lindemeier Gliederung Ausgangssituation/Motivation Was ist OLAP? Anwendungen Was sind Operatoren?

Mehr

Computer Vision: 3D-Geometrie. D. Schlesinger () Computer Vision: 3D-Geometrie 1 / 17

Computer Vision: 3D-Geometrie. D. Schlesinger () Computer Vision: 3D-Geometrie 1 / 17 Computer Vision: 3D-Geometrie D. Schlesinger () Computer Vision: 3D-Geometrie 1 / 17 Lochkamera Modell C Projektionszentrum, Optische Achse, Bildebene, P Hauptpunkt (optische Achse kreuzt die Bildebene),

Mehr

Methoden der Datenanalyse AI-basierte Decision Support Systeme WS 2006/07

Methoden der Datenanalyse AI-basierte Decision Support Systeme WS 2006/07 Regression Trees Methoden der Datenanalyse AI-basierte Decision Support Systeme WS 2006/07 Ao.Univ.Prof. Dr. Marcus Hudec marcus.hudec@univie.ac.at Institut für Scientific Computing, Universität Wien 2

Mehr

Personalisierung. Der Personalisierungsprozess Nutzerdaten erheben aufbereiten auswerten Personalisierung. Data Mining.

Personalisierung. Der Personalisierungsprozess Nutzerdaten erheben aufbereiten auswerten Personalisierung. Data Mining. Personalisierung Personalisierung Thomas Mandl Der Personalisierungsprozess Nutzerdaten erheben aufbereiten auswerten Personalisierung Klassifikation Die Nutzer werden in vorab bestimmte Klassen/Nutzerprofilen

Mehr

Übungen zur Ingenieur-Mathematik III WS 2009/10 Blatt 10 21.12.2009

Übungen zur Ingenieur-Mathematik III WS 2009/10 Blatt 10 21.12.2009 Übungen zur Ingenieur-Mathematik III WS 2009/10 Blatt 10 21.12.2009 Aufgabe 35: Thema: Singulärwertzerlegung und assoziierte Unterräume Sei A eine m n Matrix mit Rang r und A = UDV T ihre Singulärwertzerlegung.

Mehr

PPC und Data Mining. Seminar aus Informatik LV-911.039. Michael Brugger. Fachbereich der Angewandten Informatik Universität Salzburg. 28.

PPC und Data Mining. Seminar aus Informatik LV-911.039. Michael Brugger. Fachbereich der Angewandten Informatik Universität Salzburg. 28. PPC und Data Mining Seminar aus Informatik LV-911.039 Michael Brugger Fachbereich der Angewandten Informatik Universität Salzburg 28. Mai 2010 M. Brugger () PPC und Data Mining 28. Mai 2010 1 / 14 Inhalt

Mehr

SemTalk Services. SemTalk UserMeeting 29.10.2010

SemTalk Services. SemTalk UserMeeting 29.10.2010 SemTalk Services SemTalk UserMeeting 29.10.2010 Problemstellung Immer mehr Anwender nutzen SemTalk in Verbindung mit SharePoint Mehr Visio Dokumente Viele Dokumente mit jeweils wenigen Seiten, aber starker

Mehr

die Kunst, mit wenig Farbklexen bunte Bilder zu machen Halftoning, Dithering

die Kunst, mit wenig Farbklexen bunte Bilder zu machen Halftoning, Dithering Farbreduktion die Kunst, mit wenig Farbklexen bunte Bilder zu machen Halftoning, Dithering zwei Schritte: geeignete Farben (Repäsentanten) finden Farbreduktion alle Bildfarben den Repräsentanten zuordnen

Mehr

Seminar Business Intelligence Teil II. Data Mining & Knowledge Discovery

Seminar Business Intelligence Teil II. Data Mining & Knowledge Discovery Seminar Business Intelligence Teil II Data Mining & Knowledge Discovery Was ist Data Mining? Sabine Queckbörner Was ist Data Mining? Data Mining Was ist Data Mining? Nach welchen Mustern wird gesucht?

Mehr

Sequential Pattern Analysis und Markov-Modelle. Christian Weiß Institut für Angewandte Mathematik und Statistitik Universität Würzburg

Sequential Pattern Analysis und Markov-Modelle. Christian Weiß Institut für Angewandte Mathematik und Statistitik Universität Würzburg Sequential Pattern Analysis und Markov-Modelle. Christian Weiß Institut für Angewandte Mathematik und Statistitik Universität Würzburg Sequential Pattern Analysis Historische Aspekte Data Mining als Teildisziplin

Mehr

2. Deskriptive Statistik 2.1. Häufigkeitstabellen, Histogramme, empirische Verteilungsfunktionen

2. Deskriptive Statistik 2.1. Häufigkeitstabellen, Histogramme, empirische Verteilungsfunktionen 4. Datenanalyse und Modellbildung Deskriptive Statistik 2-1 2. Deskriptive Statistik 2.1. Häufigkeitstabellen, Histogramme, empirische Verteilungsfunktionen Für die Auswertung einer Messreihe, die in Form

Mehr

Zeichnen von Graphen. graph drawing

Zeichnen von Graphen. graph drawing Zeichnen von Graphen graph drawing WS 2006 / 2007 Gruppe: D_rot_Ala0607 Christian Becker 11042315 Eugen Plischke 11042351 Vadim Filippov 11042026 Gegeben sei ein Graph G = (V; E) Problemstellung V E =

Mehr

4. Relationen. Beschreibung einer binären Relation

4. Relationen. Beschreibung einer binären Relation 4. Relationen Relationen spielen bei Datenbanken eine wichtige Rolle. Die meisten Datenbanksysteme sind relational. 4.1 Binäre Relationen Eine binäre Relation (Beziehung) R zwischen zwei Mengen A und B

Mehr

Algorithmen und Datenstrukturen

Algorithmen und Datenstrukturen Algorithmen und Datenstrukturen Dipl. Inform. Andreas Wilkens aw@awilkens.com Überblick Grundlagen Definitionen Elementare Datenstrukturen Rekursionen Bäume 2 1 Datenstruktur Baum Definition eines Baumes

Mehr

Projekt AGB-10 Fremdprojektanalyse

Projekt AGB-10 Fremdprojektanalyse Projekt AGB-10 Fremdprojektanalyse 17. Mai 2010 1 Inhaltsverzeichnis 1 Allgemeines 3 2 Produktübersicht 3 3 Grundsätzliche Struktur und Entwurfsprinzipien für das Gesamtsystem 3 3.1 Die Prefuse Library...............................

Mehr

Objektorientierte Datenmodelle und - verwaltung

Objektorientierte Datenmodelle und - verwaltung Schlagworte der 90er: Objektorientiertes GIS OpenGIS Case-Tool Geoökologe Legt Problemstellung fest (Art, Anzahl, Dimension, Skalierung) Wählt Koordinatensystem Wählt Fachattribute OOUI (object-oriented

Mehr

Fachgruppe Statistik, Risikoanalyse & Computing. STAT672 Data Mining. Sommersemester 2007. Prof. Dr. R. D. Reiß

Fachgruppe Statistik, Risikoanalyse & Computing. STAT672 Data Mining. Sommersemester 2007. Prof. Dr. R. D. Reiß Fachgruppe Statistik, Risikoanalyse & Computing STAT672 Data Mining Sommersemester 2007 Prof. Dr. R. D. Reiß Überblick Data Mining Begrifflichkeit Unter Data Mining versteht man die Computergestützte Suche

Mehr

Das Knowledge Grid. Eine Architektur für verteiltes Data Mining

Das Knowledge Grid. Eine Architektur für verteiltes Data Mining Das Knowledge Grid Eine Architektur für verteiltes Data Mining 1 Gliederung 1. Motivation 2. KDD und PDKD Systeme 3. Knowledge Grid Services 4. TeraGrid Projekt 5. Das Semantic Web 2 Motivation Rapide

Mehr

Einführung in SPSS. 1. Die Datei Seegräser

Einführung in SPSS. 1. Die Datei Seegräser Einführung in SPSS 1. Die Datei Seegräser An 25 verschiedenen Probestellen wurde jeweils die Anzahl der Seegräser pro m 2 gezählt und das Vorhandensein von Seeigeln vermerkt. 2. Programmaufbau Die wichtigsten

Mehr

Visuelle Simulation eines Radiosity Algorithmus und ihre Anwendung in Lernprozessen

Visuelle Simulation eines Radiosity Algorithmus und ihre Anwendung in Lernprozessen Visuelle Simulation eines Radiosity Algorithmus und ihre Anwendung in Lernprozessen Abschlussvortrag zur Diplomarbeit von Jörg Karpf Graphische Datenverarbeitung, Institut für Informatik 3. September 2009

Mehr

Data Mining-Modelle und -Algorithmen

Data Mining-Modelle und -Algorithmen Data Mining-Modelle und -Algorithmen Data Mining-Modelle und -Algorithmen Data Mining ist ein Prozess, bei dem mehrere Komponenten i n- teragieren. Sie greifen auf Datenquellen, um diese zum Training,

Mehr

fh management, communication & it Constantin von Craushaar fh-management, communication & it Statistik Angewandte Statistik

fh management, communication & it Constantin von Craushaar fh-management, communication & it Statistik Angewandte Statistik fh management, communication & it Folie 1 Angewandte Statistik Übersicht Semester 1 Einführung ins SPSS Auswertung im SPSS anhand eines einfachen Beispieles Häufigkeitsauswertungen Grafiken Datenmanipulationen

Mehr

Business Intelligence und Geovisualisierung in der Gesundheitswirtschaft

Business Intelligence und Geovisualisierung in der Gesundheitswirtschaft Business Intelligence und Geovisualisierung in der Gesundheitswirtschaft Prof. Dr. Anett Mehler-Bicher Fachhochschule Mainz, Fachbereich Wirtschaft Prof. Dr. Klaus Böhm health&media GmbH 2011 health&media

Mehr

Histogramme in der Datenbankoptimierung. Marian Marx 26.06.2008

Histogramme in der Datenbankoptimierung. Marian Marx 26.06.2008 Histogramme in der Datenbankoptimierung Marian Marx 26.06.2008 Inhaltsverzeichnis 1. Histogramme im Allgemeinen 1.1 Definition Histogramm 1.2 Beispiel Histogramm 2. Histogramme in der Datenbankoptimierung

Mehr

Data-Mining: Ausgewählte Verfahren und Werkzeuge

Data-Mining: Ausgewählte Verfahren und Werkzeuge Fakultät Informatik Institut für Angewandte Informatik Lehrstuhl Technische Informationssysteme Data-Mining: Ausgewählte Verfahren und Vortragender: Jia Mu Betreuer: Dipl.-Inf. Denis Stein Dresden, den

Mehr

Visual Business Analytics Effektiver Zugang zu Daten und Informationen

Visual Business Analytics Effektiver Zugang zu Daten und Informationen Visual Business Analytics Effektiver Zugang zu Daten und Informationen Dr.-Ing. Jörn Kohlhammer Fraunhofer-Institut für Graphische Datenverarbeitung (IGD) Fraunhoferstraße 5 64283 Darmstadt Tel.: +49 6151

Mehr

Seminar Spezielle Themen der Visualisierung. Prof. Heike Jänicke Computergraphik und Visualisierung

Seminar Spezielle Themen der Visualisierung. Prof. Heike Jänicke Computergraphik und Visualisierung Seminar Spezielle Themen der Visualisierung Prof. Heike Jänicke Computergraphik und Visualisierung Ablauf Informationen zum Seminar Bearbeitung des Themas Seiten der Arbeitsgruppe Computergraphik und Visualisierung

Mehr

A) Durchsuchen von Datenbanken im Internet durch Endnote

A) Durchsuchen von Datenbanken im Internet durch Endnote EINLEITUNG/ANWEISUNGEN ZU DIESEM TEXT Wir werden die obere Liste (File/ Edit usw.) benutzen, obwohl die meisten Funktionen auch möglich mit rechtem Mausklick, mit Kombinationen der Tastatur oder mit den

Mehr

Integration Services - Dienstarchitektur

Integration Services - Dienstarchitektur Integration Services - Dienstarchitektur Integration Services - Dienstarchitektur Dieser Artikel solle dabei unterstützen, Integration Services in Microsoft SQL Server be sser zu verstehen und damit die

Mehr

The integration of business intelligence and knowledge management

The integration of business intelligence and knowledge management The integration of business intelligence and knowledge management Seminar: Business Intelligence Ketevan Karbelashvili Master IE, 3. Semester Universität Konstanz Inhalt Knowledge Management Business intelligence

Mehr

Workshop: Einführung in die 3D-Computergrafik. Julia Tolksdorf Thies Pfeiffer Christian Fröhlich Nikita Mattar

Workshop: Einführung in die 3D-Computergrafik. Julia Tolksdorf Thies Pfeiffer Christian Fröhlich Nikita Mattar Workshop: Einführung in die 3D-Computergrafik Julia Tolksdorf Thies Pfeiffer Christian Fröhlich Nikita Mattar 1 Organisatorisches Tagesablauf: Vormittags: Theoretische Grundlagen Nachmittags: Bearbeitung

Mehr

Ermittlung von Assoziationsregeln aus großen Datenmengen. Zielsetzung

Ermittlung von Assoziationsregeln aus großen Datenmengen. Zielsetzung Ermittlung von Assoziationsregeln aus großen Datenmengen Zielsetzung Entscheidungsträger verwenden heutzutage immer häufiger moderne Technologien zur Lösung betriebswirtschaftlicher Problemstellungen.

Mehr

Kurzanleitung Zeichnungsmodul ACD Chemsketch 11.0 Freeware

Kurzanleitung Zeichnungsmodul ACD Chemsketch 11.0 Freeware U. Schütz Seite 1 von 7 Kurzanleitung Zeichnungsmodul ACD Chemsketch 11.0 Freeware Draw Durch Anklicken der Schaltfläche Draw wechselt das Programm in den Zeichnungsmodus. Optionen Show Grid Raster anzeigen

Mehr

Bilddateien. Für die Speicherung von Bilddaten existieren zwei grundsätzlich unterschiedliche Verfahren. Bilder können als

Bilddateien. Für die Speicherung von Bilddaten existieren zwei grundsätzlich unterschiedliche Verfahren. Bilder können als Computerdateien Alle Dateien auf dem Computer, egal ob nun Zeichen (Text), Bilder, Töne, Filme etc abgespeichert wurden, enthalten nur eine Folge von Binärdaten, also Nullen und Einsen. Damit die eigentliche

Mehr

DATA ANALYSIS AND REPRESENTATION FOR SOFTWARE SYSTEMS

DATA ANALYSIS AND REPRESENTATION FOR SOFTWARE SYSTEMS DATA ANALYSIS AND REPRESENTATION FOR SOFTWARE SYSTEMS Master Seminar Empirical Software Engineering Anuradha Ganapathi Rathnachalam Institut für Informatik Software & Systems Engineering Agenda Introduction

Mehr

2D- versus 3D-Scatterplots: Vorteile & Nachteile

2D- versus 3D-Scatterplots: Vorteile & Nachteile Präsentation Seminararbeit 2D- versus 3D-Scatterplots: Vorteile & Nachteile AG Mensch-Computer Interaktion Inhalt Definition Scatterplot Information und Scientific Visualization Hauptanwendung von Scatterplots

Mehr

Motivation. Themenblock: Data Preprocessing. Einsatzgebiete für Data Mining I. Modell von Gianotti und Pedreschi

Motivation. Themenblock: Data Preprocessing. Einsatzgebiete für Data Mining I. Modell von Gianotti und Pedreschi Motivation Themenblock: Data Preprocessing We are drowning in information, but starving for knowledge! (John Naisbett) Was genau ist Datenanalyse? Praktikum: Data Warehousing und Data Mining Was ist Data

Mehr

Übungsserie Nr. 10 mit Lösungen

Übungsserie Nr. 10 mit Lösungen Übungsserie Nr. 10 mit Lösungen 1 Ein Untersuchungsdesign sieht einen multivariaten Vergleich einer Stichprobe von Frauen mit einer Stichprobe von Männern hinsichtlich der Merkmale X1, X2 und X3 vor (Codierung:

Mehr

Data Warehousing. Sommersemester 2005. Ulf Leser Wissensmanagement in der Bioinformatik

Data Warehousing. Sommersemester 2005. Ulf Leser Wissensmanagement in der Bioinformatik Data Warehousing Sommersemester 2005 Ulf Leser Wissensmanagement in der Bioinformatik ... Der typische Walmart Kaufagent verwendet täglich mächtige Data Mining Werkzeuge, um die Daten der 300 Terabyte

Mehr

Data Mining (ehem. Entscheidungsunterstützungssysteme)

Data Mining (ehem. Entscheidungsunterstützungssysteme) Data Mining (ehem. Entscheidungsunterstützungssysteme) Melanie Pfoh Anja Tetzner Christian Schieder Übung WS 2014/15 AGENDA TEIL 1 Aufgabe 1 (Wiederholung OPAL / Vorlesungsinhalte) ENTSCHEIDUNG UND ENTSCHEIDUNGSTHEORIE

Mehr

Data Warehouse Definition (1) http://de.wikipedia.org/wiki/data-warehouse

Data Warehouse Definition (1) http://de.wikipedia.org/wiki/data-warehouse Data Warehouse Definition (1) http://de.wikipedia.org/wiki/data-warehouse Ein Data-Warehouse bzw. Datenlager ist eine zentrale Datensammlung (meist eine Datenbank), deren Inhalt sich aus Daten unterschiedlicher

Mehr

Sructred Query Language

Sructred Query Language Sructred Query Language Michael Dienert 11. November 2010 Inhaltsverzeichnis 1 Ein kurzer Versionsüberblick 1 2 SQL-1 mit einigen Erweiterungen aus SQL-92 2 3 Eine Sprache zur Beschreibung anderer Sprachen

Mehr

Komponenten und Architekturen von Analytischen Informationssystemen (AIS)

Komponenten und Architekturen von Analytischen Informationssystemen (AIS) Komponenten und Architekturen von Analytischen Informationssystemen (AIS) Melanie Pfoh Konsultation 27. Juni 2013 Hinweis Diese Folien ersetzen keinesfalls den Übungsstoff des zugehörigen e-learning-kurses.

Mehr

VOM RÖNTGENBILD ZUM COMPUTERTOMOGRAMM

VOM RÖNTGENBILD ZUM COMPUTERTOMOGRAMM VOM RÖNTGENBILD ZUM COMPUTERTOMOGRAMM REFERAT IM RAHMEN DES FACHSEMINARS WS2009/10 AUSARBEITUNG BEI PROF. KARL-OTTO LINN BJÖRN SAßMANNSHAUSEN 1 0. INHALT 1. Vorwort... 3 2. Geschichte Der Computertomogrphie...

Mehr

3.2 Bivariate Verteilungen

3.2 Bivariate Verteilungen 3.2 Bivariate Verteilungen zwei Variablen X, Y werden gemeinsam betrachtet (an jedem Objekt i, i = 1,..., n, werden gleichzeitig zwei Merkmale beobachtet) Beobachtungswerte sind Paare/Kombinationen von

Mehr

Begriffe: (grafische) Benutzeroberfläche, (grafische) Benutzerschnittstelle,

Begriffe: (grafische) Benutzeroberfläche, (grafische) Benutzerschnittstelle, Gestaltung der Benutzeroberfläche Begriffe: (grafische) Benutzeroberfläche, (grafische) Benutzerschnittstelle, GUI (graphics user interface), Drei Grundsätze vorab: Halten Sie sich, wo immer möglich, an

Mehr

Visuelle Suche in Digitalen Filmarchiven Visual Search in Digital Film Archives. Visuelle Exploration Digitaler Bibliothken

Visuelle Suche in Digitalen Filmarchiven Visual Search in Digital Film Archives. Visuelle Exploration Digitaler Bibliothken Visuelle Suche in Digitalen Filmarchiven Visual Search in Digital Film Archives Visuelle Exploration Digitaler Bibliothken Prof. Dr. am Beispiel des Projektes MedioVis Harald.Reiterer@uni-konstanz.de Kurzvorstellung

Mehr

Grafikformate. Grafikformate. Digitale Bildverarbeitung Bildkompression

Grafikformate. Grafikformate. Digitale Bildverarbeitung Bildkompression Digitale Bildverarbeitung Bildkompression Einleitung Datenmenge für ein unkomprimiertes Bild Verwendungszweck des Bildes Bild soll weiterverarbeitet werden Bild soll archiviert werden Bild soll per E-Mail

Mehr

Künstliche Intelligenz Dirk Krechel SS 2009

Künstliche Intelligenz Dirk Krechel SS 2009 Künstliche Intelligenz Dirk Krechel SS 2009 Überblick über das Modul 1. Einführung 2. Symbolische Verfahren Logik Aussagenlogik Prädikatenlogik Horn Logik Prolog 3. Suchen und Bewerten Problemlösen durch

Mehr

Web Data Mining. Alexander Hinneburg Sommersemester 2007

Web Data Mining. Alexander Hinneburg Sommersemester 2007 Web Data Mining Alexander Hinneburg Sommersemester 2007 Termine Vorlesung Mi. 10:00-11:30 Raum?? Übung Mi. 11:45-13:15 Raum?? Klausuren Mittwoch, 23. Mai Donnerstag, 12. Juli Buch Bing Liu: Web Data Mining

Mehr

Visual Analytics. Seminar. [Guo, 2006] [Wong, 2006] [Keim, 2006] [Proulx, 2006] [Chang, 2007] [Kosara, 2006]

Visual Analytics. Seminar. [Guo, 2006] [Wong, 2006] [Keim, 2006] [Proulx, 2006] [Chang, 2007] [Kosara, 2006] Seminar Visual Analytics [Guo, 2006] [Keim, 2006] [Wong, 2006] [Proulx, 2006] [Chang, 2007] [Kosara, 2006] Visual Analytics - Definitions Visual analytics is the science of analytical reasoning facilitated

Mehr

Unsupervised Kernel Regression

Unsupervised Kernel Regression 9. Mai 26 Inhalt Nichtlineare Dimensionsreduktion mittels UKR (Unüberwachte KernRegression, 25) Anknüpfungspunkte Datamining I: PCA + Hauptkurven Benötigte Zutaten Klassische Kernregression Kerndichteschätzung

Mehr

Aufgabe 2: Anzahl Erdbeben als Funktion der Zeit

Aufgabe 2: Anzahl Erdbeben als Funktion der Zeit Übung 2 Analyse von Zeitreihen in der Umweltphysik und Geophysik 1 Aufgabe 2: Anzahl Erdbeben als Funktion der Zeit In dieser Übung wollen wir der Frage nachgehen, was war die Anzahl Erdbeben mit M>1 pro

Mehr

9.2. DER SATZ ÜBER IMPLIZITE FUNKTIONEN 83

9.2. DER SATZ ÜBER IMPLIZITE FUNKTIONEN 83 9.. DER SATZ ÜBER IMPLIZITE FUNKTIONEN 83 Die Grundfrage bei der Anwendung des Satzes über implizite Funktionen betrifft immer die folgende Situation: Wir haben eine Funktion f : V W und eine Stelle x

Mehr

Assessment of disgn-flows in water management, Classical methods, nonstationary and multidimensional extensions of Extreme Value Modeling (EVM)

Assessment of disgn-flows in water management, Classical methods, nonstationary and multidimensional extensions of Extreme Value Modeling (EVM) Assessment of disgn-flows in water management, Classical methods, nonstationary and multidimensional extensions of Extreme Value Modeling (EVM) Dr. Winfried Willems, IAWG Outline Classical Approach, short

Mehr

Proseminar - Data Mining

Proseminar - Data Mining Proseminar - Data Mining SCCS, Fakultät für Informatik Technische Universität München SS 2012, SS 2012 1 Data Mining Pipeline Planung Aufbereitung Modellbildung Auswertung Wir wollen nützliches Wissen

Mehr

Dokumentation. Gnuplot

Dokumentation. Gnuplot Dokumentation Gnuplot Inhaltsverzeichnis 1 Einführung 1.1 Allgemeine Beschreibung des Programms 1.2 Installation des Programms 1.3 Deinstallation des Programms 2 Hauptteil (Befehle, Einstellungen und Anwendungsbeispiele)

Mehr

Termin3 Klassifikation multispektraler Daten unüberwachte Verfahren

Termin3 Klassifikation multispektraler Daten unüberwachte Verfahren Ziel Termin3 Klassifikation multispektraler Daten unüberwachte Verfahren Einteilung (=Klassifikation) der Pixel eines multispektralen Datensatzes in eine endliche Anzahl von Klassen. Es sollen dabei versucht

Mehr

Umsetzung der Anforderungen - analytisch

Umsetzung der Anforderungen - analytisch Umsetzung der Anforderungen - analytisch Titel des Lernmoduls: Umsetzung der Anforderungen - analytisch Themengebiet: New Economy Gliederungspunkt im Curriculum: 4.2.5.5 Zum Inhalt: In diesem Modul wird

Mehr

6. Algorithmen der Computer-Geometrie

6. Algorithmen der Computer-Geometrie 6. Algorithmen der Computer-Geometrie 1. Einführung 2. Schnitt von zwei Strecken 3. Punkt-in-Polygon-Test 4. Schnitt orthogonaler Strecken 5. Punkteinschlussproblem Geo-Informationssysteme 146 6.1 Computer-Geometrie

Mehr

Computer Graphics Gerätetechnik, Programmierung und Anwendung graphischer Systeme

Computer Graphics Gerätetechnik, Programmierung und Anwendung graphischer Systeme Computer Graphics Gerätetechnik, Programmierung und Anwendung graphischer Systeme Von Prof. Dr.-Ing. Jose Encarnacäo Prof. Dr.-Ing. Wolfgang Straßer, Technische Hochschule Darmstadt, Fachbereich Informatik

Mehr

Im Original veränderbare Word-Dateien

Im Original veränderbare Word-Dateien Computergrafik Bilder, Grafiken, Zeichnungen etc., die mithilfe von Computern hergestellt oder bearbeitet werden, bezeichnet man allgemein als Computergrafiken. Früher wurde streng zwischen Computergrafik

Mehr

Was ist Data Mining... in der Fundraising Praxis?

Was ist Data Mining... in der Fundraising Praxis? Was ist Data Mining...... in der Fundraising Praxis? Erkennen von unbekannten Mustern in sehr grossen Datenbanken (> 1000 GB) wenige und leistungsfähige Verfahren Automatisierung Erkennen von unbekannten

Mehr

Spatial Data Mining. Thomas Gäbler 04IN1

Spatial Data Mining. Thomas Gäbler 04IN1 Spatial Data Mining 1. Motivation 2. Räumliche Datenbanken 2.1 Unterschied zum klassischen Data Mining 2.2 topologische Beziehungen 2.3 metrische Beziehungen 2.4 gerichtete Beziehungen 3. Spatial Data

Mehr

Assoziation und Aggregation

Assoziation und Aggregation Assoziation und Aggregation Martin Wirsing in Zusammenarbeit mit Matthias Hölzl, Nora Koch 05/03 2 Ziele Verstehen der Begriffe Assoziation und Aggregation Implementierung von Assoziationen in Java schreiben

Mehr

Kartographische Visualisierung

Kartographische Visualisierung Kartographische Visualisierung Einführung in die Geovisualisierung V/Ü: Kartographische Informationsverarbeitung Geovisualisierung Definition: Sichtbarmachung von georäumlichen Erkenntnissen oder Daten

Mehr

Einfache Statistiken in Excel

Einfache Statistiken in Excel Einfache Statistiken in Excel Dipl.-Volkswirtin Anna Miller Bergische Universität Wuppertal Schumpeter School of Business and Economics Lehrstuhl für Internationale Wirtschaft und Regionalökonomik Raum

Mehr

GPU-basiertes Volumenrendering von multimodalen medizinischen Bilddaten in Echtzeit

GPU-basiertes Volumenrendering von multimodalen medizinischen Bilddaten in Echtzeit GPU-basiertes Volumenrendering von multimodalen medizinischen Bilddaten in Echtzeit Ingrid Scholl 1, Nicole Schubert 1, Pascal Ziener 1, Uwe Pietrzyk 2 1 Fachbereich für Elektrotechnik und Informationstechnik,

Mehr

Grundlagen Statistik Angewandte Statistik 3. Semester

Grundlagen Statistik Angewandte Statistik 3. Semester Angewandte Statistik 3. Semester Zur Person Constantin von Craushaar Consultant / Partner Innstat e.u. (www.innstat.com) info@innstat.com Grundlagen der Statistik Übersicht Semester 1 Einführung ins SPSS

Mehr

Diplomarbeit. Übersicht, Gegenüberstellung und Bewertung der Analyseregeln von Datenvisualisierungen hochdimensionaler Datensätze

Diplomarbeit. Übersicht, Gegenüberstellung und Bewertung der Analyseregeln von Datenvisualisierungen hochdimensionaler Datensätze Diplomarbeit Übersicht, Gegenüberstellung und Bewertung der Analyseregeln von Datenvisualisierungen hochdimensionaler Datensätze Autor: Marco Kirschke Fachbereich: Informatik Hochschullehrer: Prof. Dr-Ing.habil.

Mehr

Kurze Einführung in IBM SPSS für Windows

Kurze Einführung in IBM SPSS für Windows Kurze Einführung in IBM SPSS für Windows SPSS Inc. Chicago (1968) SPSS GmbH Software München (1986) 1984: Datenanalyse Software für den PC 1992: Datenanalyse Software unter Windows 1993: Datenanalyse Software

Mehr

Interaktive Visualisierung und Visual Analytics

Interaktive Visualisierung und Visual Analytics Interaktive Visualisierung und Visual Analytics Dr.-Ing. Jörn Kohlhammer Fraunhofer-Institut für Graphische Datenverarbeitung (IGD) Fraunhoferstraße 5 64283 Darmstadt Tel.: +49 6151 155-646 Fax: +49 6151

Mehr