Visualisierung der Imperfektion in multidimensionalen Daten
|
|
|
- Kerstin Lang
- vor 10 Jahren
- Abrufe
Transkript
1 Universität Karlsruhe (TH) Fakultät für Informatik Institut für Programmstrukturen und Datenorganisation (IPD) Hauptseminar Imperfektion und erweiterte Konzepte im Data Warehousing Visualisierung der Imperfektion in multidimensionalen Daten Seminararbeit von Cand.-Inform. Horst Fortner Sommersemester 2005
2
3 Inhaltsverzeichnis Abbildungsverzeichnis iii 8 Visualisierung der Imperfektion in multidimensionalen Daten Einführung Motivation Begriffe Visualisierung imperfekter Informationen im Straßenverkehr Benutzergruppen im Straßenverkehrsbereich Visualisierungstechniken (noch ohne Imperfektion) Erweiterung der drei vorgestellten Verfahren um Imperfektion Skizzierung des Visualisierungswerkzeugs Datenvisualisierung und Visual Data Mining (VDM) Einordnung des VDM Automatisiertes Data Mining und seine Schwächen Visuelle Datenexploration Beispiel-Einsatzgebiet für VDM: Kooperatives Data Mining Klassifizierung visueller Data Mining Techniken Einordnung und Vergleich Zusammenfassung und Ausblick Literaturverzeichnis 23 i
4 Inhaltsverzeichnis ii
5 Abbildungsverzeichnis 8.1 Übersicht der Visualisierungstechniken [For05] Bewertungstabelle Visualisierungstechniken [For05] Beispiel ThemeRiver [SHW02] Prinzip der parallelen Koordinaten [Spe01] Inxight Table Lens [IS] ThemeRiver ohne (li.) und mit (re.) Ergänzung um Ungenauigkeit - auf beiden Seiten ist die Unschärfe durch linguistische Variablen visualisiert. [For05] Parallele Koordinaten, erweitert um Imperfektion. [For05] Table Lens, erweitert um Imperfektion. [For05] Bewertung der um Imperfektion erweiterten Visualisierungstechniken. [For05] Paketstruktur im Visualisierungswerkzeug [For05] Einordnung des VDM zwischen Data Mining und Informationsvisualisierung [Fay96] VDM im KDD-Prozess [Fay96] Ansätze des visuellen Data Mining Exemplarischer Entscheidungsbaum [Ank04] Der interaktive Mining-Prozess mit DataJewel [Ank04] Die Visualisierungstechnik CalendarView [Ank04] Klassifikation visueller DM-Techniken [Kei01] iii
6
7 Horst Fortner 8 Visualisierung der Imperfektion in multidimensionalen Daten 8.1 Einführung Motivation Die Visualisierung multidimensionaler Daten verbessert typische Data Mining Anwendungen sowie OLAP-Anwendungen (Online Analytical Processing) und ermöglicht kooperatives Data Mining, bei dem der Benutzer interaktiv die Datenanalyse steuert. In dieser Seminararbeit werden zunächst bestehende Visualisierungstechniken daraufhin untersucht, wie sie sich um imperfekte Informationen erweitern lassen und anschließend bewertet. Weiterhin wird auf die Bedeutung des Visual Data Mining (VDM) eingegangen und erläutert, welche Rolle die Visualisierung im VDM spielt. Anschließend werden die vorgestellten Visualisierungstechniken sowie die VDM-Techniken mittels eines orthogonalen Klassifikationsschemas eingeordnet. Das letzte Kapitel fasst die Ergebnisse zusammen und gibt einen Ausblick auf interessante zukünftige Forschungszweige Begriffe Imperfekte Informationen: Es lässt sich eine Grobeinteilung imperfekter Informationen in drei Kategorien durchführen [Koo04], nämlich in unsichere, unscharfe und ungenaue Informationen. Unsicher ist eine Information, wenn nicht entschieden werden kann, ob sie wahr oder falsch ist. Unsichere Informationen treten z. B. in Wettervorhersagen auf, da diese Prognosen nur wahrscheinlich sind, nicht aber sicher. 1
8 8 Visualisierung der Imperfektion in multidimensionalen Daten Unscharf ist eine Information, wenn bei Verwendung von Kategorien für gewisse Eigenschaften keine eindeutige Grenze gezogen werden kann (linguistische Variablen), z.b. ist nicht scharf abgrenzbar, ob ein Mensch groß oder ein Produkt teuer ist. Ungenau ist eine Information, wenn sie durch Intervalle angegeben wird, die nicht beliebig genau (bzw. kurz) sein können, z. B. spricht man bei Messungen in der Physik von Messungenauigkeit. Visualisierung: Laut Wikipedia bedeutet Visualisierung, abstrakte Daten in eine angebrachte, verstehbare Form zu bringen. Dabei können Details weggelassen werden, die im Kontext vernachlässigbar sind. Visualisierte Daten müssen daher korrekt interpretiert werden. Diese Definition weist schon darauf hin, dass bei der Visualisierung Imperfektion implizit vorhanden sein kann, da Informationen ( Details ) weggelassen werden können. Im Rahmen dieser Seminararbeit bedeutet Visualisierung insbesondere die grafische Darstellung von multidimensionalen Datenmengen. Multidimensionale Daten: Dies bedeutet, dass es sich um Daten mit vielen Attributwerten handelt, die sich zu orthogonalen Dimensionen zusammenfassen lassen und als Ausgangsbasis für Analyseanwendungen dienen. 8.2 Visualisierung imperfekter Informationen im Straßenverkehr 1 Im Straßenverkehr treten imperfekte Informationen z.b. bei unsicheren Angaben von Staulängen, bei ungenauen Baustellenlängenangaben oder auch bei Berechnungen von Radiosendern, die den erwarteten Zeitverlust angeben. All diesen Beispielen ist gemein, dass sie dem Benutzer aber immerhin das ungefähre Ausmaß der zu erwartenden Verspätung aufzeigen. In diesem Kapitel werden zunächst die Benutzergruppen im Straßenverkehrsbereich identifiziert. Danach werden drei Visualisierungstechniken eingeführt und eine Einschätzung gegeben, wie gut diese für die Benutzergruppen geeignet sind. Anchließend werden diese Verfahren um Imperfektion erweitert und schließlich wird das Visualisierungswerkzeug aus der Studienarbeit [For05] skizziert Benutzergruppen im Straßenverkehrsbereich Verkehrsteilnehmer On-Trip: Für den Verkehrsteilnehmer On-Trip sind seine aktuelle Position und Geschwindigkeit sowie Informationen zum Verkehrsfluss besonders wichtig. Wird z. B. eine Straße gesperrt, benötigt er zwei Nachrichten: Eine beim Inkrafttreten der Sperrung und eine bei deren Aufhebung. Des Weiteren sind das Wetter sowie Baustellen ebenfalls von Interesse für diesen Verkehrsteilnehmer, 1 Die Ausführungen dieses Kapitels basieren auf der Studienarbeit [For05] von Oliver Forster 2
9 8.2 Visualisierung imperfekter Informationen im Straßenverkehr insbesondere wenn sie Einfluss auf den Verkehrsfluss haben (Eis, Nebel, nur einspurig befahrbare Baustellen etc.). Verkehrsteilnehmer Pre-Trip: Dieser Benutzertyp plant seine Route im Vorfeld und braucht dazu Informationen zum Verkehrsnetz. Im Vorfeld bekannte Störgrößen für den Verkehrsfluss, etwa Langzeitbaustellen oder auch gesperrte Straßen, sind für ihn wichtig. Auch das zu erwartende Verkehrsaufkommen (z. B. ein hohes Aufkommen zur Urlaubszeit) ist ein wichtiger Faktor bei seiner Planung. Das Wetter spielt, insbesondere bei früher Routenplanung, eine ungeordnete Rolle, da z.b. über eine Woche hinausgehende Wettervorhersagen zu unsicher sind, als dass sie als Entscheidungskriterium herhalten könnten. Verkehrsingenieur: Der Ingenieur benötigt alle Arten von Informationen zum Verkehrsnetz, damit er einen Überblick hat, wenn z.b. Umleitungen empfohlen werden sollen. Zudem ist der aktuelle Verkehrsfluss auf seinem Zuständigkeitsgebiet (und nicht etwa nur auf einer geplanten Route) von großer Bedeutung, da er auf Störfaktoren z. B. mit Umleitungen und Temporegulierungen reagieren kann und somit möglichst frühzeitig informiert werden sollte. Verkehrswissenschaftler: Für den Wissenschaftler sind vor allem aggregierte und statistisch nutzbare Daten interessant statt Einzeldaten wie ein Unfall. Je nach Art der Untersuchung, die er anstellt, können für ihn bestimmte Daten wichtig und andere irrelevant sein (das gesamte Verkehrsnetz spielt keine Rolle, wenn nur eine Strecke untersucht wird). Zusammenfassend lässt sich feststellen, dass verschiedene Informationen für die besprochenen Benutzergruppen von Bedeutung sind und jede Gruppe daher andere Anforderungen an die Visualisierung stellt Visualisierungstechniken (noch ohne Imperfektion) Nach der Identifikation der beteiligten Benutzergruppen und deren Anforderungen werden in diesem Abschnitt drei Visualisierungstechniken vorgestellt. Bewertungskriterien für Visualisierungstechniken im Hinblick auf die Benutzergruppen Um die drei vorzustellenden Visualisierungstechniken bewerten zu können, werden in diesem Abschnitt zunächst vier Bewertungskriterien eingeführt, welche eine qualitative Einordnung der Techniken ermöglichen und Aufschluss darüber geben, inwieweit sie für die zuvor vorgestellten Benutzergruppen geeignet sind. Übersichtlichkeit Dieses Kriterium bringt zum Ausdruck, wie schnell sich der Betrachter einer visualisierten Datenmenge die für ihn interessanten Informationen herauslesen kann und wie deutlich es erkennbar ist (z. B. auch ohne Exper- 3
10 8 Visualisierung der Imperfektion in multidimensionalen Daten tenwissen, denn deutlich erkennbar ist natürlich subjektiv). Negativ auf die Übersichtlichkeit wirkt sich eine zu große Detailtreue aus - insofern besteht hier Konfliktpotential bezüglich des Kriteriums der Vollständigkeit. Insbesondere für den Verkehrsteilnehmer ist dieses Kriterium hoch zu bewerten, die anderen Gruppen arbeiten beruflich damit, weshalb ihr Blick geschulter ist beim Erkennen wichtiger Informationen. Vollständigkeit Um die Vollständigkeit zu erfüllen, muss eine Visualisierungstechnik alle vorhandenen Daten mit in die Darstellung einbeziehen. Fehlen wichtige Informationen, etwa hohe Windgeschwindigkeiten bei in die Darstellung mit einbezogenem Glatteis, so ist die Darstellung nicht mehr vollständig zu nennen. Vor allem der Verkehrsingenieur und der Verkehrswissenschaftler fordern die Erfüllung dieses Kriteriums. Möglichkeit zur Interaktion Da der Benutzer nur eine begrenzte Zahl von Daten verarbeiten kann, sollte ihm die Möglichkeit gegeben werden, die Darstellung interaktiv zu verändern, z.b. durch das Weglassen von Informationen, deren andere Gewichtung oder auch durch die Navigation in Hierarchien. In [Spe01] wird als Beispiel für sog. Fokus + Kontext-Techniken der Fisheyeview genannt, der das Hauptaugenmerk auf einen Ausschnitt der Informationen lenkt und den Rest unscharf erscheinen lässt. Prinzipiell ist die Interaktionsmöglichkeit für alle Benutzergruppen von Interesse. Anwendbarkeit auf ein Verkehrsszenario Dieses nur auf den Verkehr bezogene Kriterium spielt in der Studienarbeit von Oliver Forster eine besondere Rolle, tritt hier aber in den Hintergrund. Dieses Kriterium bewertet, wie gut eine Technik sich im Verkehr einsetzen lässt unabhängig von den anderen drei Kriterien. Kategorien und Verfahren In Oliver Forsters Studienarbeit werden 18 Verfahren vorgestellt (siehe Abbildung 8.1) und sieben davon um Imperfektion erweitert. An dieser Stelle werde ich drei dieser Verfahren beschreiben, und zwar ThemeRiver aus der Kategorie Dokumente und Table Lens und Parallele Koordinaten aus der Kategorie Hochdimensionale Daten. Die restlichen Visualisierungsarten finden sich in Abbildung 8.2, und zwar jeweils mit Bewertung. Da diese Techniken in [For05] näher vorgestellt werden, verzichte ich hier auf die genaue Beschreibung aller 18 Verfahren. ThemeRiver Der ThemeRiver ist eine Visualisierungstechnik für Dokumente, die Veränderungen des thematischen Schwerpunkts innerhalb einer Menge Dokumente visualisiert. Der Themenfluss wird über die Zeitachse dargestellt, die Themenschwerpunkte werden farblich voneinander abgegrenzt, wobei die Dicke einer 4
11 8.2 Visualisierung imperfekter Informationen im Straßenverkehr Abbildung 8.1: Übersicht der Visualisierungstechniken [For05] Schicht proportional zur Bedeutung des Themas ist. Von einem Fluss spricht man, da zwischen diskreten Zeitpunkten z.b. mittels Splines interpoliert wird. Beim ThemeRiver sind Interaktion und das Zoomen auf der Zeitachse möglich. Diese relativ einfache und leicht verständliche Darstellung ermöglicht auch Laien einen einfachen Zugang. Der Verkehrsteilnehmer On-Trip und Pre-Trip sollte die Schaubilder daher gut verstehen können. In Abbildung 8.3 ist die Häufigkeit von Texten Fidel Castros im Zeitraum von November 1959 bis Juni 1961 dargestellt. Parallele Koordinaten Mittels paralleler Koordinaten lässt sich eine Vielzahl von Dimensionen auf zweidimensionalen Medien wie Papier oder Monitor ausgeben. Dazu werden alle Achsen (bzw. Variablen oder Attribute) des multidimensionalen Raums nebeneinander parallel angeordnet. Die Länge der parallelen Strecken spiegelt dabei den Wertebereich jedes Attributs wider, wobei die eingezeichneten Attributwerte als Punkte eingezeichnet und schließlich mit einer Linie verbunden werden (siehe Abbildung 8.4. Eine solche zur besseren Erkennbarkeit oft eingefärbte Linie stellt bei n Attributen ein einzelnes n-tupel dar. Ein großer Vorteil der parallelen Koordinaten ist, dass die beliebig vielen Attribute alle gleich behandelt werden. Interaktion ist dadurch gegeben, dass der Benutzer die Achsen anders anordnen kann, was dem besseren Verständnis der Beziehung zwischen zwei Attributen dienen kann. Zudem können Attribute (bzw. deren Achsen) auch ausgeblendet werden, was für eine gefilterte Darstellung sorgt und dieses Verfahren flexibel macht. Auch Vollständigkeit wird gewährleistet, da alle Attributwerte durch die Verwendung einer eigenen Achse visualisiert werden. Allerdings wird die Darstellung bei Einbeziehung aller Attribute schnell unübersichtlich, insbesondere wenn viele Tupel vorliegen und sich die Verbindungslinien der Tupel oft überkreuzen oder nah beieinander liegen. Experten der Interpretation von parallelen Koordinaten können dieser Visualisierung viele Informationen entnehmen, gerade auch durch die flexible Anordnung 5
12 8 Visualisierung der Imperfektion in multidimensionalen Daten Abbildung 8.2: Bewertungstabelle Visualisierungstechniken [For05] der Achsen. Während dem Verkehrsingenieur durch die aggregierte Darstellung der Blick auf einzelne Teilstrecken erschwert wird, eignet sich diese Technik sehr gut für den Verkehrswissenschaftler. Für den Pre-Trip Verkehrsteilnehmer erfordert diese Technik zu viel Einarbeitungszeit auf Grund der ungewohnten Darstellung mehrerer Achsen nebeneinander und überfordert den On-Trip Verkehrsteilnehmer völlig. Table Lens Die Table Lens Technik dient der Daten-Analyse durch den Benutzer, der diese interaktiv steuern kann. Wie in Abbildung 8.5 zu sehen ist, ist die Ausgabe tabellarisch aufgebaut. Interessante Bereiche werden mittels der Fokus + Kontext-Technik in den Vordergrund gerückt (ähnlich der Fisheye-Sicht), wodurch man auch in großen Datenmengen gezielt Informationen hervorheben kann. Für On-Trip Verkehrsteilnehmer eignet sich diese Darstellung auf Grund ihrer Komplexität nicht, ebenso wenig für den Pre-Trip. Für die beiden anderen Gruppen, Wissenschaftler und Ingenieur, ist die Technik hingegen gut geeignet eben durch ihre vollständige Darstellung mit Fokussierungsmöglichkeit Erweiterung der Verfahren um Imperfektion 2 Die Visualisierung der drei Aspekte der Imperfektion (Unsicherheit, Unschärfe, Ungenauigkeit) ist unterschiedlich einfach zu realisieren. Zudem lassen sich die drei vorgestellten Techniken nicht immer um alle Aspekte sinnvoll erweitern. Der ThemeRiver eignet sich für eine Erweiterung um Unschärfe, indem Linienstärke proportional zu einer linguistischen Variablen eingezeichnet wird (z.b. 2 Vgl. [For05]. 6
13 8.2 Visualisierung imperfekter Informationen im Straßenverkehr Abbildung 8.3: Beispiel ThemeRiver [SHW02] Abbildung 8.4: Prinzip der parallelen Koordinaten [Spe01] kein, wenig, viel beim Niederschlag in Abbildung 8.6). Unsicherheit lässt sich z.b. durch Musterungen wie im rechten Bild in Abbildung 8.6 darstellen, wobei der schraffierte Bereich ein Ungenauigkeitsintervall darstellt, in dem keine eindeutige Aussage darüber möglich ist, ob die Strecke z.b. frei ist oder ob Staugefahr herrscht. Ich denke, dass man die schraffierten Bereiche auch einfach durch eine weitere Farbe visualisieren könnte und dieser dann eine neue linguistische Variable zuweisen könnte, z.b. könnte man Frei/Staugefahr braun einfärben und Staugefahr/Stau orange, wodurch dann fünf statt drei Variablen vorhanden wären. Die in der Abbildung verwendete Schraffur verdeutlicht aber besser den Zusammenhang zwischen sicherer und unsicherer Information, da die voll ausgefüllten Linien einen sicheren Mindestwert darstellen und die Unsicherheit durch die Schraffur schnell als solche erkennbar ist. Bei den parallelen Koordinaten in Abbildung 8.7 ist die Unsicherheit im linken Bild durch den Graustufenwert visualisiert, wobei eine Linie einem Streckabschnitt der A5 entspricht und die Graustufe der Sicherheit des Datensatzes gemäß gewählt ist. An dieser Stelle möchte ich anmerken, dass man durch diese Darstellung etwas eingeschränkt ist, da man zum Beispiel nicht visualisieren kann, dass auf einem Streckenabschnitt ganz sicher kein Nebel vorhanden ist, man aber gleichzeitig über die Rutschgefahr keine Aussage treffen kann. Um unterschiedlichen Attributen wie Nebel und Rutschgefahr verschiedene Sicherheitsgrade zuzuweisen, würde ich hier eine kleine Erweiterung vorschlagen, und zwar wäre ein Wechsel der Graustufe innerhalb des Streckenzuges sinnvoll, sodass eine Linie beim Übergang von einem Attribut zum anderen in der Graustufe (und damit der Sicherheit der Information) veränderbar ist. Die Ungenauigkeit wird dadurch visualisiert, dass eine Linie vor 7
14 8 Visualisierung der Imperfektion in multidimensionalen Daten Abbildung 8.5: Inxight Table Lens [IS] einem mit Ungenauigkeit behafteten Attribut aufgespaltet und danach wieder zusammengeführt wird. Dies ist im Beispiel beim Attribut Niederschlag in der Mitte von Abbildung 8.7 zu sehen. Unschärfe lässt sich bei dieser Visualisierungstechnik schwieriger visualisieren. Im rechten Bild von Abbildung 8.7 sind die Werte der Zugehörigkeitsfunktion zu den linguistischen Variablen des Niederschlags, nämlich kein, schwach und stark um 90 gedreht zur Zeichenebene angetragen. Die Linie, die den Streckenabschnitt A5/73 repräsentiert, bedeutet nun, dass die Zugehörigkeitsfunktion viele Werte der linguistischen Variable kein zuordnet, wohingegen schwach und stark nur wenige Werte auf sich vereinen können, d.h. insgesamt kann man wohl zu Recht von keinem Niederschlag auf diesem Streckenabschnitt sprechen. Bei der Table Lens Technik lässt sich die Unsicherheit wie in Abbildung 8.8 auf der linken Seite zu sehen mittels Graustufen visualisieren, wobei dunklere Graustufen eine größere Sicherheit darstellen. Die Unschärfe wird durch einen für jede linguistische Variable jeweils anders gefärbten Balken dargestellt, dessen Länge proportional zu den Werten der Terme eingezeichnet wird. Die rechte Seite von Abbildung 8.8 kombiniert schließlich Unsicherheit und Ungenaugikeit, indem zur Graustufen-Färbung der Balken noch ein gepunktetes Segment ans Ende der Balken angehängt wird, welches das Ungenauigkeitsintervall darstellt, d.h. der Anfang dieses Segments markiert die untere Intervallgrenze, während das Ende des gesamten Balkens die obere Intervallgrenze markiert. 8
15 8.2 Visualisierung imperfekter Informationen im Straßenverkehr Abbildung 8.6: ThemeRiver ohne (li.) und mit (re.) Ergänzung um Ungenauigkeit - auf beiden Seiten ist die Unschärfe durch linguistische Variablen visualisiert. [For05] Abbildung 8.7: Parallele Koordinaten, erweitert um Imperfektion. [For05] Bewertungskriterien bei der Erweiterung einer Technik um Imperfektion Bei der Erweiterung von Verfahren um Imperfektion sollten nach [For05] folgende vier Punkte beachtet werden: 1. Verhältnismäßigkeit: Die Imperfektion sollte keinen größeren Stellenwert in der Visualisierung bekommen als die eigentliche Information, d.h. die Imperfektion soll die Hauptinformation nur ergänzen. 2. Imperfektionsabgrenzung: Imperfekte Informationen sollten in der Visualsierung klar von perfekten Informationen unterschieden werden können. 3. Unterscheidbarkeit: Mehrere dargestellte Imperfektionsarten sollten innerhalb einer Visualisierung voneinander unterscheidbar sein. 9
16 8 Visualisierung der Imperfektion in multidimensionalen Daten Abbildung 8.8: Table Lens, erweitert um Imperfektion. [For05] 4. Mächtigkeitserhaltung: Die Möglichkeiten einer Visualisierungstechnik sollten durch die Erweiterung um Imperfektion nicht beschnitten werden, insbesondere sollte die erweiterte Technik nicht unübersichtlicher werden. Bewertung der erweiterten Verfahren In der Tabelle in Abbildung 8.9 sind alle in der Studienarbeit [For05] um Imperfektion erweiterten Visualisierungstechniken an Hand der vier eingeführten Kriterien bewertet. Die beiden Techniken für hochdimensionale Daten, Table Lens und Parallele Koordinaten, schneiden in dieser Bewertung in allen Kategorien gut bis sehr gut ab, womit sie sich für die Imperfektionserweiterung sehr gut eignen. Abbildung 8.9: Bewertung der um Imperfektion erweiterten Visualisierungstechniken. [For05] 10
17 8.3 Datenvisualisierung und Visual Data Mining (VDM) Skizzierung des Visualisierungswerkzeugs Das von Oliver Forster mit Java-Swing implementierte Visualisierungswerkzeug Visualizerlässt den Benutzer den Typ der zu visualisierenden Information mit verschiedenen Visualisierungstechniken darstellen. Er implementierte exemplarisch zwei Techniken, nämlich die erweiterten Balkendiagramme (Teil der Table Lens Technik) und ThemeRiver. Das Paket Visualizer enthält vier Hauptklassen Abbildung 8.10: Paketstruktur im Visualisierungswerkzeug [For05] (siehe Abbildung 8.10 und jeweils in einem gesonderten Paket Klassen, die das Laden von Information bzw. das Layout betreffen. Die Kopplung des Werkzeuges mit den Visualisierungstechniken erfolgt über die Pakete fuzzythemeriver und impchart2d, welche jeweils die Erweiterung einer bereits vorhandenen Software und deren Anbindung an den Visualizer übernehmen. Vorhandene Informationen müssen zur Darstellung im Visualizer zunächst über den DataLoader in ein festgelegtes zentrales Format gebracht werden und werden danach vom TechniqueLoader in das technikspezifische Format für eine Visualisierung umgewandelt. Für neue Informationsarten reicht es aus, eine Klasse zur Erzeugung des festgelegten zentralen Formats zu erstellen; es muss also nicht für jede Technik eine neue Klasse zur Umwandlung in deren Format geschrieben werden beim Hinzufügen neuer Informationsarten, wodurch eine einfache Erweiterbarkeit sichergestellt ist. Das Visualisierungswerkzeug eignet sich für den Verkehrsteilnehmer Pre-Trip und für Teilaufgaben des Verkehrsingenieurs/-wissenschaftlers. Nähere Details zum Visualizer finden sich in [For05]. 8.3 Datenvisualisierung und Visual Data Mining (VDM) Nachdem im letzten Kapitel die Erweiterung von Visualisierungstechniken um Imperfektion auf dem Sektor Straßenverkehr behandelt wurden, beschäftigt sich 11
18 8 Visualisierung der Imperfektion in multidimensionalen Daten dieses Kapitel mit dem in der Literatur beim Thema Visualisierung auftauchenden Begriff des Visual Data Mining (VDM), einem mit der Visualisierung von multidimensionalen Daten in Beziehung stehenden Teilbereich des Data Mining. Zunächst gebe ich eine Einführung in verschiedene VDM-Ansätze, danach werden das automatisierte Data Mining und seine Schwächen behandelt, die zum Ansatz der Visuellen Datenexploration geführt haben. Anschließend werden Beispiel- Einsatzgebiete des Kooperativen Data Mining vorgestellt, nämlich die Kooperative Klassifikation und das Interaktive Temporale Data Mining. Bei jeder vorgestellten Technik werde ich darauf eingehen, in wie weit bereits Imperfektion in der Technik bereits vorhanden ist und wie sie dargestellt wird, sofern sie überhaupt berücksichtigt wurde. Schließlich wird noch eine Klassifikationsmöglichkeit vorgestellt, an Hand derer VDM-Techniken entlang orthogonaler Achsen eingeordnet werden können Einordnung des VDM Wie in Abbildung 8.11 zu sehen, befindet sich das Visual Data Mining (VDM) in der Schnittmenge von Data Mining und Information Visualization, d.h. dass im VDM Algorithmen aus dem Mining-Bereich eingesetzt werden und Visualisierungstechniken aus dem Bereich des Informationsvisualisierung. Eine Definition Abbildung 8.11: Einordnung des VDM zwischen Data Mining und Informationsvisualisierung [Fay96] des VDM gibt Mihael Ankerst in seiner Dissertation: Visuelles Data Mining ist ein Teil des KDD-Prozesses, der Visualisierung als Kommunikationsmittel zwischen Mensch und Computer nutzt, um neue und interpretierbare Muster zu erkennen und Wissen zu generieren. [Ank01] Ein Überblick darüber, in welchem Bereich das VDM im KDD-Prozess (Knowledge Discovery in Databases) angesiedelt ist, wird im Schema in Abbildung 8.12 gegeben. Das Schema basiert auf der allgemein anerkannten Definition des KDD- Begriffs von Fayyad: Wissensentdeckung in Datenbanken ist der nichttriviale Prozess der Identifizierung gültiger, neuartiger, potentiell nützlicher und verständlicher Muster in (großen) Datenbeständen. [Fay96] Im Grunde geht es beim VDM darum, den Data Mining Schritt und den Interpretationsschritt im ständigen Wechsel durchzuführen und den Menschen bei der Klassifikation oder Mustersuche zu unterstützen bzw. seine Intuition miteinzubeziehen, um schneller zu Ergebnissen zu kommen und redundante Muster zu entfer- 12
19 8.3 Datenvisualisierung und Visual Data Mining (VDM) nen. Damit kombiniert das VDM die letzten beiden Schritte des KDD-Prozesses zu einer neuen Einheit. Abbildung 8.12: VDM im KDD-Prozess [Fay96] Im VDM lassen sich mehrere Ansätze unterscheiden (siehe Abbildung 8.13). Ansatz a) setzt auf klassischen Data Mining Algorithmen auf, deren Ergebnisse (z.b. erkannte Muster) visualisiert werden. Nachdem die Ergebnisse der Visualisierung vorliegen, entscheidet der Benutzer, ob der Data Mining-Prozess erfolgreich war oder ob der Prozess rekursiv beginnend beim Algorithmus mit geänderten Parametern neu gestartet wird. In der Literatur werden auf diesem Ansatz aufbauende Visualisierungsmethoden auch als Visual Data Mining Tools bezeichnet. Ansatz b) visualisiert die Zwischenergebnisse; dadurch wird der Benutzer stärker in den DM-Prozess einbezogen. Es werden Algorithmen verwendet, die nur präprozessierte Zwischenergebnisse liefern, in denen der Benutzer durch Einsatz von Visualisierungstechniken nach aussagekräftigen Mustern sucht. Der Hauptvorteil dieses Ansatzes ist, dass DM-Algorithmen losgelöst von der Problemstellung verwendet werden (zur Berechnung der Zwischenergebnisse). Allerdings ist hier im Gegensatz zu Ansatz a) keinerlei Rekursion integriert, was für mich die Frage aufwirft, wie mit unzufrieden stellenden Ergebnissen umgegangen wird. Schließlich ist nicht jeder Versuch, Wissen aus Daten zu gewinnen, von Erfolg gekrönt. Ansatz c) schließlich visualisiert Rohdaten und verwendet keine klassischen DM- Algorithmen. Es findet eine Rekursion zwischen den Benutzereingaben und der Visualisierung statt, wodurch die Interaktionsmöglichkeit hier am größten ist, was auch durch die sofortige Aktualisierung der Darstellung (durch interaktive Werkzeuge wie z.b. dynamische Abfragetechniken) unterstrichen wird. Bei diesem Ansatz sprechen Soukup und Davidson in [TS03] auch von Data Visualization - Techniken. Besonders Ansatz c) kommt dem Online Analytical Processing (OLAP) sehr nahe, denn einige der zwölf von Edgar F. Codd in [Cod93] aufgestellten Regeln bzw. Anforderungen an ein OLAP-System werden auch von Ansatz c) erfüllt, darunter vor allem die zehnte Regel (Intuitive Datenanalyse), aber auch die elfte Regel (Flexibles Berichtswesen, Ergebnisse im Report frei anordbar) und die zwölfte (Unbegrenzte Anzahl von Dimensionen und Konsolidierungsebenen) können von Ansatz c) erfüllt werden. Andere Regeln von Codd, wie etwa Regel fünf (Client- Server Archtitektur) oder acht (Mehrbenutzerunterstützung) sind hingegen nicht 13
20 8 Visualisierung der Imperfektion in multidimensionalen Daten Abbildung 8.13: Ansätze des visuellen Data Mining in dem VDM-Ansatz c) festgeschrieben, wodurch aus meiner Sicht auch ein OLAP- System mit diesem Ansatz beschrieben könnte, allerdings mit der Einschränkung, dass in Ansatz c) keine so präzisen Regeln wie die von Codd formuliert sind (d.h. Ansatz c) ist etwas abstrakter gehalten als OLAP) Automatisiertes Data Mining und seine Schwächen Data Mining ist ein iterativer Prozess, dessen Ergebnisse im Rahmen der Datenanalyse die Voraussetzung für eine spätere Evaluierung sind. Beim Data Mining, das auf vorverarbeiteten Daten operiert, soll mittels effizienter Verfahren potentiell nützliches Wissen in großen Datenmengen aufgefunden werden [Ank04] d.h. es sollen Informationen aus Datenmengen gewonnen werden. Heutzutage sind das Data Mining sowie die gesamte Datenanalyse weitgehend automatisiert, was dazu führt, dass einige Probleme auftreten, die durch die Automatisierung nur unzureichend gelöst werden. Erstens fließt vorhandenes Wissen in den Köpfen der Menschen nur schwer oder gar nicht in die Datenanalyse mit ein. Zweitens lassen sich die Erkenntnisse einer Iteration oft nur schwer in eine verbesserte weitere Iteration transferieren, sodass letztlich weiter zurückgegangen wird zum Vorverarbeitungsschritt und eine andere Vorverarbeitung der Daten erfolgt, die bessere Ergebnisse verspricht. Drittens wenden sich heutige Produkte an Experten auf dem Gebiet des Data Mining, weshalb die Fähigkeit dieser Experten, die gewonnenen Ergebnisse zu kommunizieren, von zentraler Bedeutung ist - mit anderen Worten ist es denkbar, dass ein Data Mining Projekt auf Grund der (Un-)Fähigkeit des Experten scheitert, gewonnene Informationen an den oder die Auftraggeber zu vermitteln. 14
21 8.3 Datenvisualisierung und Visual Data Mining (VDM) Visuelle Datenexploration Auf Grund der Schwächen des automatisierten Data Mining schlägt Ankerst in [Ank04] einen benutzerorientierten Ansatz vor, bei dem der Mensch die Datenanalyse steuert. Bei der visuellen Datenexploration (vgl. [Kei02]) sollen die Kreativität und das Verständnis des Menschen verbunden werden mit der der hohen Speicherkapazität und Rechenleistung des Computers. Durch die Visualisierung der Daten kann der Mensch die Struktur der Daten verstehen, Hypothesen aufstellen und diese interaktiv verifizieren bzw. falsifizieren. Dadurch muss der Benutzer nicht auf die oft lange dauernden automatischen Berechnungen warten, sondern er bekommt Zwischenschritte angezeigt und kann den weiteren Verlauf der Exploration damit in eine neue Richtung lenken. Infolgedessen kann auch ein Rechenlauf frühzeitig abgebrochen werden, wenn sich bereits bei den Zwischenschritten abzeichnet, dass mit den gewählten Data-Mining-Parametern keine sinnvollen Ergebnisse zu erwarten sind. Vorteile bietet VDM insbesondere dann, wenn die Explorationsziele nicht genau spezifiziert sind und wenn stark inhomogene und verrauschte Daten vorliegen. Da die visuelle Datenxploration einfacher ist (eine Kenntnis von komplexen Algorithmen ist nicht erforderlich), kann sie auch von Nicht-Spezialisten durchgeführt werden. Weiterhin ist vorteilhaft, dass der Nutzer besser versteht, wie die gewonnen Informationen zu Stande kamen, da der Nutzer den Explorationsvorgang schließlich mitgelenkt hat. Im Endeffekt sind so häufig bessere Ergebnissen erzielbar, gerade in Szenarien, in denen die Automatisierung versagt. Die visuelle Datenexploration lässt sich gemäß dem Information Seeking Mantra [Shn96] in drei Schritte untergliedern: Der Overview-Schritt soll dem Benutzer einen Überblick über die Daten verschaffen. Beim Zoom and Filter-Schritt kann der Benutzer erkannte Muster selektieren (filtern) und genauer betrachten (zoomen). Schließlich bietet der Details-on-Demand -Schritt dem Nutzer die Möglichkeit, auf Details der Daten zuzugreifen Beispiel-Einsatzgebiet für VDM: Kooperatives Data Mining Beim kooperativen Data Mining [Ank04] werden Data Mining Algorithmen und Visualisierungstechniken integriert, sodass bestehende automatisierte Verfahren um die Möglichkeit bereichert werden, den Benutzer interaktiv am Mining Prozess teilnehmen zu lassen. Das Wort kooperativ wird hier synonym zu interaktiv verwendet. An dieser Stelle sollen zwei konkrete Data-Mining-Verfahren vorgestellt werden, die kooperative Klassifikation und das interaktive temporale Data Mining. Ein weiteres Verfahren [Hin99], welches hier jedoch nicht näher behandelt wird, wendet die Idee des kooperativen Data Mining auf hochdimensionale Clustering- Algorithmen an. Kooperative Klassifikation Die Klassifikation ist eines der zentralen Verfahren des Data Mining. Im ersten der zwei Schritte der Klassifikation werden bereits klassifizierte Daten (sog. Trai- 15
22 8 Visualisierung der Imperfektion in multidimensionalen Daten ningsdaten) analysiert, sodass ein Modell mit charakteristischen Attributwerten erstellt werden kann, um im zweiten Schritt der Klassifikation neue Daten gemäß diesem Modell in Klassen einzuteilen. Zur Erstellung eines Klassifikationsmodells wird häufig ein Entscheidungsbaum-Klassifikator verwendet. Aus den Trainingsdaten wird von der Wurzel beginnend ein Entscheidungsbaum konstruiert, wobei Knoten eine Teilmenge der Trainingsdaten, Kanten einen Test auf das Attribut des Vaterknotens und Blätter die Zugehörigkeit zu einer Klasse bedeuten. Die Sensoren im abgebildeten Baum 8.14 bestimmen das Ausfallrisiko eines Heizkörpers. Bei der Konstruktion des Baumes wird zuerst derjenige Sensor gesucht, der die Trainingsdaten am besten in zwei Klassen einteilt. Dies tut Sensor 1, weshalb er zur Wurzel wird. Für die Kinder und deren Kinder wird rekursiv ebenso solch ein am besten separierender Sensor gesucht, bis alle Knoten einen ausreichenden Anteil an einer einzigen Klasse haben, was sie zu Blättern werden lässt. In diesem ausreichenden Anteil steckt bereits ein gewisses Maß an Imper- Abbildung 8.14: Exemplarischer Entscheidungsbaum [Ank04] fektion, nämlich die Unsicherheit, dass nicht alle Daten, die beim Verfolgen der Kanten zu einem Blatt (= Risikoklasse) führen, auch berechtigterweise in diese Risikoklasse eingeordnet werden können, z.b. wenn man den ausreichenden Anteil auf 95% festlegt, liegen 5% der Daten mit negativem Wert bei Sensor 1 und positivem Wert bei Sensor 5 in der hohen Risikoklasse statt in der niedrigen. Weiterhin ist die Abgrenzung in positive und negative Messwerte der Sensoren zwar scharf, doch ist das Ziehen einer Grenze, ab der man Trainingsdaten in eine andere Klasse einteilt, nicht immer einfach. Es kann nämlich eine Rolle spielen, wie dicht die Trainingsdaten an der Grenze beieinander liegen, denn viele nur ganz knapp die Grenze über-/unterschreitende Daten könnten einen Hinweis darauf liefern, dass die Grenze falsch gezogen wurde. Im Wesentlichen gibt es drei Kritikpunkte der automatischen Entscheidungsbaum-Klassifikatoren: Erstens kann der Benutzer sein vorhandenes Wissen in das Verfahren kaum einfließen lassen, zweitens wird zur Laufzeitverkürzung ein Greedy-Verfahren verwendet und drittens werden nicht im Entscheidungsbaum verwendete Attribute einfach weggelassen. Kritikpunkt 16
23 8.3 Datenvisualisierung und Visual Data Mining (VDM) zwei und drei lassen wieder Imperfektion erahnen. So kann das Greedy-Verfahren sub-optimale Ergebnisse produzieren und die unterschlagenen Informationen aus Punkt 3 sind zwar nicht imperfekt im Sinne der drei Arten der Imperfektion aus Definition 1.2, jedoch ist der Baum damit unvollständig im Bezug auf die Verwendung aller über die Daten zur Verfügung stehenden Informationen. Interaktives temporales Data Mining Beim interaktiven temporalen Data Mining haben die zu analysierenden Daten für jeden Datensatz eine zeitliche Information, etwa einen Messzeitpunkt bei einer Messreihe. Hier soll die Architektur sowohl von DM-Experten als auch von Fachexperten (die aber im DM unerfahren sind) benutzbar sein. Auch bei dieser Variante hat der Besucher die volle Palette der Zoom-and-Filter Möglichkeiten. Beispielhaft soll hier auf das Mining-System DataJewel und dessen Visualisierungstechnik CalenderView verwiesen werden. Wie DataJewel arbeitet und welche Interaktionsmöglichkeiten dem Benutzer zur Verfügung stehen, ist in Abbildung 8.15 ersichtlich. CalendarView in Abbildung 8.16 visualisiert die zeitliche Ver- Abbildung 8.15: Der interaktive Mining-Prozess mit DataJewel [Ank04] teilung von Ereignishäufigkeiten in Kalenderform, was den Vorteil hat, dass die Darstellung zum einen den meisten Personen schon vertraut ist und zum anderen, dass z.b. Wochenenden oder wöchentliche Wiederholungen von Ereignissen leichter wahrgenommen werden können. Zudem werden verschiedene Ereignisse auf mit verschiedenen Farben dargestellt, was für Menschen allerdings nur bei einer kleinen Anzahl von Ereignissen übersichtlich bleibt, da bei einer größeren Anzahl die Ereignisse nicht mehr unterscheidbar sind. Bei einer größeren Zahl von 17
24 8 Visualisierung der Imperfektion in multidimensionalen Daten Ereignissen können daher DM-Algorithmen aufgerufen werden, die in Sekunden zeitliche Muster finden. Für diese Form des Data Mining müssen bestehende Algorithmen dahingehend modifiziert werden, dass bereits nach einem linearen Durchlauf der Daten ein Zwischenergebnis vorliegt, was interaktives Arbeiten mit der Software ermöglicht. Die berechneten Ergebnisse der Algorithmen haben dann eine veränderte Farbzuweisung zur Folge, wobei der Benutzer auch alternativ die Farbzuweisung nach seinen Vorstellungen interaktiv verändern kann und so Teilsysteme, etwa die Triebwerke eines Flugzeugs betreffende Teilsyssteme anders einfärben als solche, die für die Klimatisierung des Flugzeuginneren zuständig sind. Abbildung 8.16: Die Visualisierungstechnik CalendarView [Ank04] Imperfektion im VDM: Sowohl die kooperative Klassifikation als auch das interaktive temporale Data Ming sind inhärent unvollkommen. Denn wie schon oben erwähnt, ist beim Entscheidungsbaum-Klassifikator die Festlegung der Grenze, ab der bestimmte Daten einer Klasse angehören, teilweise recht schwierig, vor allem bei diffusen, verrauschten Daten. Außerdem steckt in der Klasseneinteilung die Unsicherheit, dass nicht alle Daten korrekterweise zu einer Klasse zusammengefasst werden, sondern dass eben eine festgelegte Schwelle erreicht wurde, sodass ein geringer Prozentsatz in der Klasse eigentlich nicht in diese gehört. Nach außen hin wird diese Art der Imperfektion allerdings nicht repräsentiert, außer vielleicht in einem Bericht, welcher einer Analyse beiliegt und Meta-Informationen enthält, etwa eben warum gewisse Schwellwerte gewählt wurden, ob die Daten schwer in Klassen einteilbar waren oder auch ob andere Schwierigkeiten im Zusammenhang mit Imperfektion auftraten. Bei der Visualisierungstechnik CalenderView ist die Beschränkung auf einen Tag als kleinste Einheit grobkörnig gewählt, denn es könnte z.b. eine Rolle spielen, zu welcher Uhrzeit innerhalb eines Tages ein Wartungsintervall stattfindet, etwa bei 18
25 8.4 Einordnung und Vergleich Zügen und deren Radreifen. Die Reaktion auf Fehler wäre schneller, wenn die Routine-Kontrolle früh am Tag erfolgt als Nachts - dieser Unterschied wird aber nicht visualisiert Klassifizierung visueller Data Mining Techniken Die Klassifikation in Abbildung 8.17 wurde in [Kei01] eingeführt und ermöglicht eine orthogonale Einordnung von VDM-Techniken. Damit lassen sich die Visualisierungstechniken, die in dieser Arbeit vorgestellt wurden, in folgendem Koordinatensystem einzeichnen. Der zu visualisierende Datentyp umfasst die verschiede- Abbildung 8.17: Klassifikation visueller DM-Techniken [Kei01] nen Arten von vorliegenden Daten, von eindimensionalen Daten, wie z.b. mit dem ThemeRiver visualisierte temporale Daten über multidimensionale Daten etwa aus relationalen Datenbanken bis hin zu Graphen der Internetstruktur (z.b. Skitter- Graph). Die Visualisierungstechniken fangen bei bekannten Techniken wie Säulenoder Kreisdiagrammen an und gehen bis hin zu geschachtelten Visualisierungen, etwa bei Treemaps. Mit Interaktions- und Verzerrungstechniken lässt sich das visuelle Data-Mining vom Benutzer in eine bestimmte Richtung lenken. Hier soll eine Aufzählung von Verfahren genügen: GrandTour-System (interaktive Projektion), Polaris-System (interaktive Selektion), spotfire-system (interaktives Zooming), Hyperbolic Tree (interaktive Verzerrung), XGobi System (interakives Linkging and brushing). 8.4 Einordnung und Vergleich Will man die im zweiten Kapitel vorgestellten Visualisierungstechniken im Verkehrsbereich an Hand der im letzten Kapitel vorgestellten orthogonalen Klassifikation einordnen, lassen sich meiner Ansicht nach nur die beiden Achsen zu visualisierender Datentyp und Visualisierungstechnik genauer eingrenzen, in der 19
26 8 Visualisierung der Imperfektion in multidimensionalen Daten Richtung Interaktions- und Verzerrungstechniken gebe ich nur eine persönliche Einschätzung über nötige und wünschenswerte Interaktionstechniken, da mir diese Dimension vom Verfahren her nicht eindeutig festgelegt erscheint. ThemeRiver würde ich in Sachen Interaktions- und Verzerrungstechnik unter Zoom, bei Datentyp unter eindimensional und bei Visualisierungstechnik unter Standard 2D/3D Visualisierung einordnen, wobei die Möglichkeit der Inter- aktion nicht auf das Zoomen beschränkt sein muss und auch eine Verzerrung nicht ausgeschlossen ist. Zoomen ist aber deshalb wichtig, da es bei großen Sammlungen von Texten erforderlich sein kann, auf der Zeitachse zu zoomen, um damit z.b. kürzere Abschnitte der Schaffensphasen eines Schriftstellers oder Politikers genauer zu analysieren. Die parallelen Koordinaten müssen mindestens die interaktive Selektion unterstützen, damit die gewünschten Dimensionen ein- und ausgeblendet werden können. Der Datentyp ist multidimensional und die Visualisierungstechnik ist eine geometrische Transformation. Projektion und Zoom sind bei dieser Technik sinnvolle Interaktionstechniken - je nach Anwendungszweck und Datenbasis. Die Table Lens-Technik ist vom Datentyp her multidimensional und als Visualisierungstechnik eine Standard 2D/3D Visualisierung. Als Interaktionstechnik sollte dem Benutzer auf jeden Fall eine Filter-Möglichkeit an die Hand gegeben werden, damit er sich z.b. bei sehr vielen Autobahnabschnitts-Daten von verschiedenen Autobahnen nur diejenigen anzeigen lassen kann, die zu der von ihm betrachteten Autobahn gehören. Wie oben schon erwähnt, muss das aber nicht die einzige Interaktionsmöglichkeit sein; für die Selektion und die Verzerrung sind auch sinnvolle Anwendungen denkbar, etwa die Auswahl von Strecken, die von Glatteis betroffen sind oder die verzerrte Darstellung z.b. von sehr windigen Streckabschnitten in der Visualisierung, damit sie in der Flut von Streckabschnitten auffallen, die ein Verkehrsingenieur visualisieren lässt. Die beiden in Kapitel 8.3 vorgestellten VDM-Techniken Kooperative Klassifikation und Interaktives temporales Data Mining verwenden beide pixel-basierte Visualierungstechniken und arbeiten vom Datentyp her mit multidimensionalen Daten. Die Möglichkeiten zur Interaktion im DataJewel-System (vgl. [Ank04]) sind vielfältig und übersteigen die im Koordinatensystem eingezeichneten Interaktionstechniken sogar. Für beide ist meiner Meinung nach auch eine Anwendung im Verkehr denkbar. Mit Hilfe der kooperativen Klassifikation kann z.b. ein Verkehrswissenschafter Modelle entwickeln an Hand von Daten, die ihm Durchfahrts- Messstellen geliefert haben, um damit bestimmte Stausituationen besser vorhersagen zu können. Auch die Modellierung von sinnvollen Verkehrsregulierungsmaßnahmen wäre so möglich, z.b. folgendermaßen: Wenn an einer Messstelle wenige Autos durchfahren und ihre Geschwindigkeit nahe an der auf diesem Streckenabschnitt zugelassenen Maximalgeschwindigkeit liegt, könnte man die Geschwindigkeitsbegrenzung aufheben. Wenn allerdings eine bestimmte Schwelle von durchfahrenden Autos überschritten wird oder auf einem folgenden Abschnitt ein Stau oder ein Unfall registriert ist, sollte dieses Aufheben unterlassen werden. Auch das interaktive temporale Data Mining hat meiner Ansicht nach inter- 20
27 8.5 Zusammenfassung und Ausblick essante Anwendungsgebiete im Verkehr. Neben der Flugzeugwartung, die bei der Vorstellung als Beispiel diente, wäre ein solches System auch bei der Auto-Wartung denkbar, da heutige Fahrzeuge zunehmend komplexer werden und eine Fülle von Elektronik enthalten, was die Fehlerdiagnose komplexer, durch Einsatz von Computern aber auch automatisierbar macht. Wenn z.b. in der Werkstatt bei einem Systemcheck bestimmte Fehler aufgedeckt werden, können diese sogleich in einer Datenbank aufgenommen werden, damit man temporales Data-Mining interaktiv darauf betreiben kann, um z.b. bestimmte Vermutungen bezüglich des Auftretens von Störungen oder Pannen zu verifizieren oder zu falsifizieren. Wenn man etwa den Verdacht hat, dass eine bestimmte produzierte Serie von Fahrzeugen zu Fehlern an der Lenksäule neigt, lässt sich durch das interaktive temporale DM feststellen, ob die Werkstattdaten aller Werkstätten in Deutschland diesen Verdacht erhärten können, indem der Data-Mining-Benutzer geschickt Modell-Reihe, Serie und betrachtetes Zeitintervall eingrenzt und so eine aussagekräftige Visualisierung erhält, die Aufschluss über auffällige Reparaturhäufigkeiten gibt. 8.5 Zusammenfassung und Ausblick In dieser Seminararbeit wurden zunächst Visualisierungstechniken aus dem Straßenverkehrsbereich sowie Kriterien für deren Klassifikation vorgestellt, mit denen die Techniken bewertet wurden. Anschließend wurden die um Imperfektion erweiterten Techniken und deren Bewertung vorgestellt. Das dritte Kapitel umfasst die Einführung in das Visual Data Mining und dessen drei verschiedene Ansätze sowie die Vorstellung zweier konkreter Techniken des Visual Data Mining und gibt eine Klassifikationsmöglichkeit an, die auf alle in dieser Arbeit besprochenen fünf Techniken angewendet wird, nämlich ThemeRiver, Parallele Koordinaten, Table Lens, Kooperative Klassifikation und Interaktives Temporales Data Mining. Ferner wurde gezeigt, dass den beiden letztgenannten, zum kooperativen Data Mining zählenden VDM-Verfahren, ein gewisses Maß an Imperfektion bereits im Verfahren innewohnt, ohne dass die Imperfektion bewusst in die Verfahren integriert worden wäre. Spätestens da, wo klare Grenzen werden müssen, die letztlich willkürlich sind, findet keine perfekte Abbildung der Wirklichkeit mehr statt, sodass man es mit unsicheren, unscharfen oder ungenauen Modellen zu tun hat wie beispielsweise mit der Unschärfe im Falle des Entscheidungsbaumklassifikators oder der Ungenauigkeit bei CalendarView. Allerdings erscheint es wiederum notwendig, dass bei der Abstraktion von den Einzeldaten, wie sie bei der Klassifikation durchgeführt wird, eine Reduktion von Klassen stattfindet, welche fast immer mit einem Informationsverlust einhergeht und damit mit Imperfektion. Diesen Preis ist man aber häufig bereit zu zahlen, um Informationen überhaupt erst beherrschbar und überschaubar zu machen. Den Lerneffekt in diesem Seminarthema sehe ich vor allem darin, dass der Blick darauf geschärft wird, was bei Visualisierungen weggelassen wird und was in den Vordergrund gerückt wird. Letztendlich ist jede Form der Visualisierung nur ein Modell, ein Ausschnitt desssen, was an Informa- 21
28 8 Visualisierung der Imperfektion in multidimensionalen Daten tionen in einem (multidimensionalen) Datensatz vorhanden ist. Die Erweiterung von bestehenden Techniken um Imperfektion ist daher vor allem sinnvoll, um dem Betrachter von Visualisierungen vor Augen zu führen, an welchen Stellen bekanntermaßen unsichere, unscharfe oder ungenaue Daten visualisiert werden, damit er sich ein fundierteres Bild über den Informationsgehalt der visualisierten Daten machen kann. Lässt man die Imperfektion bei der Darstellung nämlich außer Acht, so kann es den Anschein machen, als beruhte die Visualisierung auf sicheren Daten, was zu falschen Erkenntnissen beim Betrachter führen kann. Die Integration von Data-Mining-Algorithmen und Visualisierungstechniken beim interaktiven bzw. kooperativen Data Mining lässt auch in Zukunft noch genug Raum für Forschungen, da für interaktive Anwendungen die bestehenden Data Mining Algorithmen dahingehend umgeformt werden müssen, dass sie in wenigen Sekunden Zwischenergebnisse liefern, damit für den Benutzer die Verzögerungen beim Arbeiten akzeptabel bleiben. Diese Verkürzung der Laufzeiten auf der einen Seite und das Ausloten der Möglichkeiten (und Grenzen) des kooperativen Data Mining auf der anderen Seiten sind zwei interessante Forschungsfelder auf Gebiet der Informationsgewinnung. Das kooperative Data Mining ist heutzutage vor allem deshalb interessant, weil der menschliche Intellekt beim Auffinden von Mustern dem Computer noch einiges voraus hat bzw. weil der Mensch weiß, in welche Richtung er die Suche nach Informationen in einer Unmenge von Daten lenken will. Spannend ist daher auch die Frage, inwieweit dem Computer diese Zielstrebigkeit beigebracht werden kann, damit er selbst Informationen in großen Datenmengen zu erkennen und zu verknüpfen vermag - ganz ohne Benutzerinteraktion. 22
29 Literaturverzeichnis [Ank01] [Ank04] Mihael Ankerst. Visual Data Mining. Dissertation, Ludwig Maximilian Universität München, Mihael Ankerst. Kooperatives data mining: Eine integration von datamining-algorithmen und visualisierungstechniken. Datenbank-Spektrum, 9, [Cod93] S. B.; Salley C. T. Codd, Edgar F.; Codd. Providing olap to useranalysts: An it mandate. Codd & Associates, [Fay96] G.; Smyth P. Fayyad, U. M.; Piatetski-Shapiro. The kdd process for extracting useful knowledge from volumes of data. Comm. of the ACM, 39(11):27 34, [For05] Oliver Forster. Visualisierung imperfekter informationen in einem analyse-werkzeug. Studienarbeit, Universität Karlsruhe (TH), [Hin99] [IS] [Kei01] D.A.; Wawryniuk M. Hinneburg, A.; Keim. Hd-eye: Visual mining of high dimensional data. IEEE Computer Graphics and Applications, 19(5):22 31, Inc. Inxight Software. Inxight table lens - the fastest way to put data into decision. Daniel A. Keim. Visual exploration of large databases. Communications of the ACM, 44(8):38 44, [Kei02] Daniel A. Keim. Datenvisualisierung und data mining. Datenbank- Spektrum, 2, [Koo04] [Shn96] Erik Koop. Datenbankunterstützung für imperfekte Daten im Verkehrsumfeld. Diplomarbeit, Universität Karlsruhe (TH), Ben Shneiderman. The eye have it: A task by date type taxonomy for information visualizations. Visual Languages, [SHW02] L. Nowell S. Havre, B. Hetzler and P. Whitney. Themeriver: Visualizing thematic changes in large document collections [Spe01] Robert Spence. Information Visualization. Addison-Wesley,
30 Literaturverzeichnis [TS03] Ian Davidson Tom Soukup. Visual Data Mining. Wiley,
Visualisierung der Imperfektion in multidimensionalen Daten
Visualisierung der Imperfektion in multidimensionalen Daten Horst Fortner Imperfektion und erweiterte Konzepte im Data Warehousing Betreuer: Heiko Schepperle 2 Begriffe (1) Visualisierung [Wikipedia] abstrakte
Lineargleichungssysteme: Additions-/ Subtraktionsverfahren
Lineargleichungssysteme: Additions-/ Subtraktionsverfahren W. Kippels 22. Februar 2014 Inhaltsverzeichnis 1 Einleitung 2 2 Lineargleichungssysteme zweiten Grades 2 3 Lineargleichungssysteme höheren als
Kreativ visualisieren
Kreativ visualisieren Haben Sie schon einmal etwas von sogenannten»sich selbst erfüllenden Prophezeiungen«gehört? Damit ist gemeint, dass ein Ereignis mit hoher Wahrscheinlichkeit eintritt, wenn wir uns
1 topologisches Sortieren
Wolfgang Hönig / Andreas Ecke WS 09/0 topologisches Sortieren. Überblick. Solange noch Knoten vorhanden: a) Suche Knoten v, zu dem keine Kante führt (Falls nicht vorhanden keine topologische Sortierung
Zeichen bei Zahlen entschlüsseln
Zeichen bei Zahlen entschlüsseln In diesem Kapitel... Verwendung des Zahlenstrahls Absolut richtige Bestimmung von absoluten Werten Operationen bei Zahlen mit Vorzeichen: Addieren, Subtrahieren, Multiplizieren
Suche schlecht beschriftete Bilder mit Eigenen Abfragen
Suche schlecht beschriftete Bilder mit Eigenen Abfragen Ist die Bilderdatenbank über einen längeren Zeitraum in Benutzung, so steigt die Wahrscheinlichkeit für schlecht beschriftete Bilder 1. Insbesondere
Primzahlen und RSA-Verschlüsselung
Primzahlen und RSA-Verschlüsselung Michael Fütterer und Jonathan Zachhuber 1 Einiges zu Primzahlen Ein paar Definitionen: Wir bezeichnen mit Z die Menge der positiven und negativen ganzen Zahlen, also
Kapiteltests zum Leitprogramm Binäre Suchbäume
Kapiteltests zum Leitprogramm Binäre Suchbäume Björn Steffen Timur Erdag überarbeitet von Christina Class Binäre Suchbäume Kapiteltests für das ETH-Leitprogramm Adressaten und Institutionen Das Leitprogramm
3. GLIEDERUNG. Aufgabe:
3. GLIEDERUNG Aufgabe: In der Praxis ist es für einen Ausdruck, der nicht alle Detaildaten enthält, häufig notwendig, Zeilen oder Spalten einer Tabelle auszublenden. Auch eine übersichtlichere Darstellung
4. Jeder Knoten hat höchstens zwei Kinder, ein linkes und ein rechtes.
Binäre Bäume Definition: Ein binärer Baum T besteht aus einer Menge von Knoten, die durch eine Vater-Kind-Beziehung wie folgt strukturiert ist: 1. Es gibt genau einen hervorgehobenen Knoten r T, die Wurzel
Lineare Funktionen. 1 Proportionale Funktionen 3 1.1 Definition... 3 1.2 Eigenschaften... 3. 2 Steigungsdreieck 3
Lineare Funktionen Inhaltsverzeichnis 1 Proportionale Funktionen 3 1.1 Definition............................... 3 1.2 Eigenschaften............................. 3 2 Steigungsdreieck 3 3 Lineare Funktionen
Pädagogik. Melanie Schewtschenko. Eingewöhnung und Übergang in die Kinderkrippe. Warum ist die Beteiligung der Eltern so wichtig?
Pädagogik Melanie Schewtschenko Eingewöhnung und Übergang in die Kinderkrippe Warum ist die Beteiligung der Eltern so wichtig? Studienarbeit Inhaltsverzeichnis 1. Einleitung.2 2. Warum ist Eingewöhnung
1 Mathematische Grundlagen
Mathematische Grundlagen - 1-1 Mathematische Grundlagen Der Begriff der Menge ist einer der grundlegenden Begriffe in der Mathematik. Mengen dienen dazu, Dinge oder Objekte zu einer Einheit zusammenzufassen.
Fachbericht zum Thema: Anforderungen an ein Datenbanksystem
Fachbericht zum Thema: Anforderungen an ein Datenbanksystem von André Franken 1 Inhaltsverzeichnis 1 Inhaltsverzeichnis 1 2 Einführung 2 2.1 Gründe für den Einsatz von DB-Systemen 2 2.2 Definition: Datenbank
Handbuch ECDL 2003 Basic Modul 5: Datenbank Grundlagen von relationalen Datenbanken
Handbuch ECDL 2003 Basic Modul 5: Datenbank Grundlagen von relationalen Datenbanken Dateiname: ecdl5_01_00_documentation_standard.doc Speicherdatum: 14.02.2005 ECDL 2003 Basic Modul 5 Datenbank - Grundlagen
Dokumentation von Ük Modul 302
Dokumentation von Ük Modul 302 Von Nicolas Kull Seite 1/ Inhaltsverzeichnis Dokumentation von Ük Modul 302... 1 Inhaltsverzeichnis... 2 Abbildungsverzeichnis... 3 Typographie (Layout)... 4 Schrift... 4
OECD Programme for International Student Assessment PISA 2000. Lösungen der Beispielaufgaben aus dem Mathematiktest. Deutschland
OECD Programme for International Student Assessment Deutschland PISA 2000 Lösungen der Beispielaufgaben aus dem Mathematiktest Beispielaufgaben PISA-Hauptstudie 2000 Seite 3 UNIT ÄPFEL Beispielaufgaben
Lineare Gleichungssysteme
Lineare Gleichungssysteme 1 Zwei Gleichungen mit zwei Unbekannten Es kommt häufig vor, dass man nicht mit einer Variablen alleine auskommt, um ein Problem zu lösen. Das folgende Beispiel soll dies verdeutlichen
Dieses erste Kreisdiagramm, bezieht sich auf das gesamte Testergebnis der kompletten 182 getesteten Personen. Ergebnis
Datenanalyse Auswertung Der Kern unseres Projektes liegt ganz klar bei der Fragestellung, ob es möglich ist, Biere von und geschmacklich auseinander halten zu können. Anhand der folgenden Grafiken, sollte
Seminar Business Intelligence Teil II. Data Mining & Knowledge Discovery
Seminar Business Intelligence Teil II Data Mining & Knowledge Discovery Was ist Data Mining? Sabine Queckbörner Was ist Data Mining? Data Mining Was ist Data Mining? Nach welchen Mustern wird gesucht?
Konzepte der Informatik
Konzepte der Informatik Vorkurs Informatik zum WS 2011/2012 26.09. - 30.09.2011 17.10. - 21.10.2011 Dr. Werner Struckmann / Christoph Peltz Stark angelehnt an Kapitel 1 aus "Abenteuer Informatik" von Jens
geben. Die Wahrscheinlichkeit von 100% ist hier demnach nur der Gehen wir einmal davon aus, dass die von uns angenommenen
geben. Die Wahrscheinlichkeit von 100% ist hier demnach nur der Vollständigkeit halber aufgeführt. Gehen wir einmal davon aus, dass die von uns angenommenen 70% im Beispiel exakt berechnet sind. Was würde
1. LINEARE FUNKTIONEN IN DER WIRTSCHAFT (KOSTEN, ERLÖS, GEWINN)
1. LINEARE FUNKTIONEN IN DER WIRTSCHAFT (KOSTEN, ERLÖS, GEWINN) D A S S O L L T E N N A C H E U R E M R E F E R A T A L L E K Ö N N E N : Kostenfunktion, Erlösfunktion und Gewinnfunktion aufstellen, graphisch
1. Man schreibe die folgenden Aussagen jeweils in einen normalen Satz um. Zum Beispiel kann man die Aussage:
Zählen und Zahlbereiche Übungsblatt 1 1. Man schreibe die folgenden Aussagen jeweils in einen normalen Satz um. Zum Beispiel kann man die Aussage: Für alle m, n N gilt m + n = n + m. in den Satz umschreiben:
Professionelle Seminare im Bereich MS-Office
Der Name BEREICH.VERSCHIEBEN() ist etwas unglücklich gewählt. Man kann mit der Funktion Bereiche zwar verschieben, man kann Bereiche aber auch verkleinern oder vergrößern. Besser wäre es, die Funktion
GEVITAS Farben-Reaktionstest
GEVITAS Farben-Reaktionstest GEVITAS Farben-Reaktionstest Inhalt 1. Allgemeines... 1 2. Funktionsweise der Tests... 2 3. Die Ruhetaste und die Auslösetaste... 2 4. Starten der App Hauptmenü... 3 5. Auswahl
WAS finde ich WO im Beipackzettel
WAS finde ich WO im Beipackzettel Sie haben eine Frage zu Ihrem? Meist finden Sie die Antwort im Beipackzettel (offiziell "Gebrauchsinformation" genannt). Der Aufbau der Beipackzettel ist von den Behörden
etutor Benutzerhandbuch XQuery Benutzerhandbuch Georg Nitsche
etutor Benutzerhandbuch Benutzerhandbuch XQuery Georg Nitsche Version 1.0 Stand März 2006 Versionsverlauf: Version Autor Datum Änderungen 1.0 gn 06.03.2006 Fertigstellung der ersten Version Inhaltsverzeichnis:
Meet the Germans. Lerntipp zur Schulung der Fertigkeit des Sprechens. Lerntipp und Redemittel zur Präsentation oder einen Vortrag halten
Meet the Germans Lerntipp zur Schulung der Fertigkeit des Sprechens Lerntipp und Redemittel zur Präsentation oder einen Vortrag halten Handreichungen für die Kursleitung Seite 2, Meet the Germans 2. Lerntipp
Software Engineering. Sommersemester 2012, Dr. Andreas Metzger
Software Engineering (Übungsblatt 2) Sommersemester 2012, Dr. Andreas Metzger Übungsblatt-Themen: Prinzip, Technik, Methode und Werkzeug; Arten von Wartung; Modularität (Kohäsion/ Kopplung); Inkrementelle
Stellen Sie bitte den Cursor in die Spalte B2 und rufen die Funktion Sverweis auf. Es öffnet sich folgendes Dialogfenster
Es gibt in Excel unter anderem die so genannten Suchfunktionen / Matrixfunktionen Damit können Sie Werte innerhalb eines bestimmten Bereichs suchen. Als Beispiel möchte ich die Funktion Sverweis zeigen.
Dokumentation zum Spielserver der Software Challenge
Dokumentation zum Spielserver der Software Challenge 10.08.2011 Inhaltsverzeichnis: Programmoberfläche... 2 Ein neues Spiel erstellen... 2 Spielfeldoberfläche... 4 Spielwiederholung laden... 5 Testdurchläufe...
mysql - Clients MySQL - Abfragen eine serverbasierenden Datenbank
mysql - Clients MySQL - Abfragen eine serverbasierenden Datenbank In den ersten beiden Abschnitten (rbanken1.pdf und rbanken2.pdf) haben wir uns mit am Ende mysql beschäftigt und kennengelernt, wie man
Das Leitbild vom Verein WIR
Das Leitbild vom Verein WIR Dieses Zeichen ist ein Gütesiegel. Texte mit diesem Gütesiegel sind leicht verständlich. Leicht Lesen gibt es in drei Stufen. B1: leicht verständlich A2: noch leichter verständlich
Microsoft Access 2013 Navigationsformular (Musterlösung)
Hochschulrechenzentrum Justus-Liebig-Universität Gießen Microsoft Access 2013 Navigationsformular (Musterlösung) Musterlösung zum Navigationsformular (Access 2013) Seite 1 von 5 Inhaltsverzeichnis Vorbemerkung...
Eine der Aktien hat immer einen höheren Gewinn als die andere Aktie. Ihre Aufgabe ist es diese auszuwählen.
Instruktionen am Anfang von Experiment 1 (auf Papier ausgeteilt: grünmarkierte Textstellen zeigen den Instruktionstext in der jeweiligen Bedingung an; Kommentare sind gelb markiert.) Stellen Sie sich vor,
Das große ElterngeldPlus 1x1. Alles über das ElterngeldPlus. Wer kann ElterngeldPlus beantragen? ElterngeldPlus verstehen ein paar einleitende Fakten
Das große x -4 Alles über das Wer kann beantragen? Generell kann jeder beantragen! Eltern (Mütter UND Väter), die schon während ihrer Elternzeit wieder in Teilzeit arbeiten möchten. Eltern, die während
In diesem Tutorial lernen Sie, wie Sie einen Termin erfassen und verschiedene Einstellungen zu einem Termin vornehmen können.
Tutorial: Wie erfasse ich einen Termin? In diesem Tutorial lernen Sie, wie Sie einen Termin erfassen und verschiedene Einstellungen zu einem Termin vornehmen können. Neben den allgemeinen Angaben zu einem
Welche Gedanken wir uns für die Erstellung einer Präsentation machen, sollen Ihnen die folgende Folien zeigen.
Wir wollen mit Ihnen Ihren Auftritt gestalten Steil-Vorlage ist ein österreichisches Start-up mit mehr als zehn Jahren Erfahrung in IT und Kommunikation. Unser Ziel ist, dass jede einzelne Mitarbeiterin
Anmerkungen zur Übergangsprüfung
DM11 Slide 1 Anmerkungen zur Übergangsprüfung Aufgabeneingrenzung Aufgaben des folgenden Typs werden wegen ihres Schwierigkeitsgrads oder wegen eines ungeeigneten fachlichen Schwerpunkts in der Übergangsprüfung
Gleichungen Lösen. Ein graphischer Blick auf Gleichungen
Gleichungen Lösen Was bedeutet es, eine Gleichung zu lösen? Was ist überhaupt eine Gleichung? Eine Gleichung ist, grundsätzlich eine Aussage über zwei mathematische Terme, dass sie gleich sind. Ein Term
Beschreibung des MAP-Tools
1. Funktionen des MAP-Tool 2. Aufbau des MAP-Tools 3. Arbeiten mit dem MAP-Tool Beschreibung MAP-Tool.doc Erstellt von Thomas Paral 1 Funktionen des MAP-Tool Die Hauptfunktion des MAP-Tools besteht darin,
Ist Excel das richtige Tool für FMEA? Steve Murphy, Marc Schaeffers
Ist Excel das richtige Tool für FMEA? Steve Murphy, Marc Schaeffers Ist Excel das richtige Tool für FMEA? Einleitung Wenn in einem Unternehmen FMEA eingeführt wird, fangen die meisten sofort damit an,
Anwendungshinweise zur Anwendung der Soziometrie
Anwendungshinweise zur Anwendung der Soziometrie Einführung Die Soziometrie ist ein Verfahren, welches sich besonders gut dafür eignet, Beziehungen zwischen Mitgliedern einer Gruppe darzustellen. Das Verfahren
Was meinen die Leute eigentlich mit: Grexit?
Was meinen die Leute eigentlich mit: Grexit? Grexit sind eigentlich 2 Wörter. 1. Griechenland 2. Exit Exit ist ein englisches Wort. Es bedeutet: Ausgang. Aber was haben diese 2 Sachen mit-einander zu tun?
Fachdidaktik der Informatik 18.12.08 Jörg Depner, Kathrin Gaißer
Fachdidaktik der Informatik 18.12.08 Jörg Depner, Kathrin Gaißer Klassendiagramme Ein Klassendiagramm dient in der objektorientierten Softwareentwicklung zur Darstellung von Klassen und den Beziehungen,
Datensicherung. Beschreibung der Datensicherung
Datensicherung Mit dem Datensicherungsprogramm können Sie Ihre persönlichen Daten problemlos Sichern. Es ist möglich eine komplette Datensicherung durchzuführen, aber auch nur die neuen und geänderten
Access [basics] Rechnen in Berichten. Beispieldatenbank. Datensatzweise berechnen. Berechnung im Textfeld. Reporting in Berichten Rechnen in Berichten
Berichte bieten die gleichen Möglichkeit zur Berechnung von Werten wie Formulare und noch einige mehr. Im Gegensatz zu Formularen bieten Berichte die Möglichkeit, eine laufende Summe zu bilden oder Berechnungen
Lineare Gleichungssysteme
Brückenkurs Mathematik TU Dresden 2015 Lineare Gleichungssysteme Schwerpunkte: Modellbildung geometrische Interpretation Lösungsmethoden Prof. Dr. F. Schuricht TU Dresden, Fachbereich Mathematik auf der
Data Mining-Projekte
Data Mining-Projekte Data Mining-Projekte Data Mining stellt normalerweise kein ei nmaliges Projekt dar, welches Erkenntnisse liefert, die dann nur einmal verwendet werden, sondern es soll gewöhnlich ein
PTV VISWALK TIPPS UND TRICKS PTV VISWALK TIPPS UND TRICKS: VERWENDUNG DICHTEBASIERTER TEILROUTEN
PTV VISWALK TIPPS UND TRICKS PTV VISWALK TIPPS UND TRICKS: VERWENDUNG DICHTEBASIERTER TEILROUTEN Karlsruhe, April 2015 Verwendung dichte-basierter Teilrouten Stellen Sie sich vor, in einem belebten Gebäude,
Anleitung zur Daten zur Datensicherung und Datenrücksicherung. Datensicherung
Anleitung zur Daten zur Datensicherung und Datenrücksicherung Datensicherung Es gibt drei Möglichkeiten der Datensicherung. Zwei davon sind in Ges eingebaut, die dritte ist eine manuelle Möglichkeit. In
Grundbegriffe der Informatik
Grundbegriffe der Informatik Einheit 15: Reguläre Ausdrücke und rechtslineare Grammatiken Thomas Worsch Universität Karlsruhe, Fakultät für Informatik Wintersemester 2008/2009 1/25 Was kann man mit endlichen
Diese Ansicht erhalten Sie nach der erfolgreichen Anmeldung bei Wordpress.
Anmeldung http://www.ihredomain.de/wp-admin Dashboard Diese Ansicht erhalten Sie nach der erfolgreichen Anmeldung bei Wordpress. Das Dashboard gibt Ihnen eine kurze Übersicht, z.b. Anzahl der Beiträge,
Modul 2: Automatisierung des Posteingangs - Regel- und Abwesenheits-Assistent
Outlook 2003 - Aufbaukurs 19 Modul 2: Automatisierung des Posteingangs - Regel- und Abwesenheits-Assistent Wie kann ich die Bearbeitung von Nachrichten automatisieren? Wie kann ich Nachrichten automatisch
Wie optimiert man die Werbungserkennung von Ad- Detective?
Wie optimiert man die Werbungserkennung von Ad- Detective? Die Ad-Detective-Werbe-Erkennung von VideiReDo basiert auf der Erkennung von Schwarzwerten / scharzen Bildern, die die Werbeblöcke abgrenzen.
Multicheck Schülerumfrage 2013
Multicheck Schülerumfrage 2013 Die gemeinsame Studie von Multicheck und Forschungsinstitut gfs-zürich Sonderauswertung ICT Berufsbildung Schweiz Auswertung der Fragen der ICT Berufsbildung Schweiz Wir
Prozessbewertung und -verbesserung nach ITIL im Kontext des betrieblichen Informationsmanagements. von Stephanie Wilke am 14.08.08
Prozessbewertung und -verbesserung nach ITIL im Kontext des betrieblichen Informationsmanagements von Stephanie Wilke am 14.08.08 Überblick Einleitung Was ist ITIL? Gegenüberstellung der Prozesse Neuer
Anleitung über den Umgang mit Schildern
Anleitung über den Umgang mit Schildern -Vorwort -Wo bekommt man Schilder? -Wo und wie speichert man die Schilder? -Wie füge ich die Schilder in meinen Track ein? -Welche Bauteile kann man noch für Schilder
Zahlen auf einen Blick
Zahlen auf einen Blick Nicht ohne Grund heißt es: Ein Bild sagt mehr als 1000 Worte. Die meisten Menschen nehmen Informationen schneller auf und behalten diese eher, wenn sie als Schaubild dargeboten werden.
Insiderwissen 2013. Hintergrund
Insiderwissen 213 XING EVENTS mit der Eventmanagement-Software für Online Eventregistrierung &Ticketing amiando, hat es sich erneut zur Aufgabe gemacht zu analysieren, wie Eventveranstalter ihre Veranstaltungen
Binäre Bäume. 1. Allgemeines. 2. Funktionsweise. 2.1 Eintragen
Binäre Bäume 1. Allgemeines Binäre Bäume werden grundsätzlich verwendet, um Zahlen der Größe nach, oder Wörter dem Alphabet nach zu sortieren. Dem einfacheren Verständnis zu Liebe werde ich mich hier besonders
Satzhilfen Publisher Seite Einrichten
Satzhilfen Publisher Seite Einrichten Es gibt verschiedene Möglichkeiten die Seite einzurichten, wir fangen mit der normalen Version an, Seite einrichten auf Format A5 Wählen Sie zunächst Datei Seite einrichten,
Gutes Leben was ist das?
Lukas Bayer Jahrgangsstufe 12 Im Hirschgarten 1 67435 Neustadt Kurfürst-Ruprecht-Gymnasium Landwehrstraße22 67433 Neustadt a. d. Weinstraße Gutes Leben was ist das? Gutes Leben für alle was genau ist das
Die Gleichung A x = a hat für A 0 die eindeutig bestimmte Lösung. Für A=0 und a 0 existiert keine Lösung.
Lineare Gleichungen mit einer Unbekannten Die Grundform der linearen Gleichung mit einer Unbekannten x lautet A x = a Dabei sind A, a reelle Zahlen. Die Gleichung lösen heißt, alle reellen Zahlen anzugeben,
Jederzeit Ordnung halten
Kapitel Jederzeit Ordnung halten 6 auf Ihrem Mac In diesem Buch war bereits einige Male vom Finder die Rede. Dieses Kapitel wird sich nun ausführlich diesem so wichtigen Programm widmen. Sie werden das
Kommunikations-Management
Tutorial: Wie importiere und exportiere ich Daten zwischen myfactory und Outlook? Im vorliegenden Tutorial lernen Sie, wie Sie in myfactory Daten aus Outlook importieren Daten aus myfactory nach Outlook
Professionelle Diagramme mit Excel 2010 erstellen. Peter Wies. 1. Ausgabe, 2. Aktualisierung, März 2014. Themen-Special W-EX2010DI
Peter Wies 1. Ausgabe, 2. Aktualisierung, März 2014 Professionelle Diagramme mit Excel 2010 erstellen Themen-Special W-EX2010DI 2 Professionelle Diagramme mit Excel 2010 erstellen - Themen-Special 2 Wichtige
Die Textvorlagen in Microsoft WORD und LibreOffice Writer
Die Textvorlagen in Microsoft WORD und LibreOffice Writer Liebe Teilnehmer(-innen) am Landeswettbewerb Deutsche Sprache und Literatur Baden- Württemberg, Diese Anleitung soll Ihnen helfen Ihren Wettbewerbsbeitrag
Fragebogen: Abschlussbefragung
Fragebogen: Abschlussbefragung Vielen Dank, dass Sie die Ameise - Schulung durchgeführt haben. Abschließend möchten wir Ihnen noch einige Fragen zu Ihrer subjektiven Einschätzung unseres Simulationssystems,
Anhand des bereits hergeleiteten Models erstellen wir nun mit der Formel
Ausarbeitung zum Proseminar Finanzmathematische Modelle und Simulationen bei Raphael Kruse und Prof. Dr. Wolf-Jürgen Beyn zum Thema Simulation des Anlagenpreismodels von Simon Uphus im WS 09/10 Zusammenfassung
! " # $ " % & Nicki Wruck worldwidewruck 08.02.2006
!"# $ " %& Nicki Wruck worldwidewruck 08.02.2006 Wer kennt die Problematik nicht? Die.pst Datei von Outlook wird unübersichtlich groß, das Starten und Beenden dauert immer länger. Hat man dann noch die.pst
Projektmanagement in der Spieleentwicklung
Projektmanagement in der Spieleentwicklung Inhalt 1. Warum brauche ich ein Projekt-Management? 2. Die Charaktere des Projektmanagement - Mastermind - Producer - Projektleiter 3. Schnittstellen definieren
Die Übereckperspektive mit zwei Fluchtpunkten
Perspektive Perspektive mit zwei Fluchtpunkten (S. 1 von 8) / www.kunstbrowser.de Die Übereckperspektive mit zwei Fluchtpunkten Bei dieser Perspektivart wird der rechtwinklige Körper so auf die Grundebene
Wie Sie mit Mastern arbeiten
Wie Sie mit Mastern arbeiten Was ist ein Master? Einer der großen Vorteile von EDV besteht darin, dass Ihnen der Rechner Arbeit abnimmt. Diesen Vorteil sollten sie nutzen, wo immer es geht. In PowerPoint
Softwaretechnologie -Wintersemester 2013/2014 - Dr. Günter Kniesel
Übungen zur Vorlesung Softwaretechnologie -Wintersemester 2013/2014 - Dr. Günter Kniesel Übungsblatt 3 - Lösungshilfe Aufgabe 1. Klassendiagramme (9 Punkte) Sie haben den Auftrag, eine Online-Videothek
Welche Unterschiede gibt es zwischen einem CAPAund einem Audiometrie- Test?
Welche Unterschiede gibt es zwischen einem CAPAund einem Audiometrie- Test? Auch wenn die Messungsmethoden ähnlich sind, ist das Ziel beider Systeme jedoch ein anderes. Gwenolé NEXER g.nexer@hearin gp
2.5.2 Primärschlüssel
Relationale Datenbanken 0110 01101110 01110 0110 0110 0110 01101 011 01110 0110 010 011011011 0110 01111010 01101 011011 0110 01 01110 011011101 01101 0110 010 010 0110 011011101 0101 0110 010 010 01 01101110
Reporting Services und SharePoint 2010 Teil 1
Reporting Services und SharePoint 2010 Teil 1 Abstract Bei der Verwendung der Reporting Services in Zusammenhang mit SharePoint 2010 stellt sich immer wieder die Frage bei der Installation: Wo und Wie?
50. Mathematik-Olympiade 2. Stufe (Regionalrunde) Klasse 11 13. 501322 Lösung 10 Punkte
50. Mathematik-Olympiade. Stufe (Regionalrunde) Klasse 3 Lösungen c 00 Aufgabenausschuss des Mathematik-Olympiaden e.v. www.mathematik-olympiaden.de. Alle Rechte vorbehalten. 503 Lösung 0 Punkte Es seien
Visualisierung imperfekter Informationen in einem Analyse-Werkzeug
Visualisierung imperfekter Informationen in einem Analyse-Werkzeug Vortrag zur Studienarbeit von Oliver Forster Betreuer: Dipl.-Inform. H. Schepperle 31.01.2005 Universität Karlsruhe Institut für Programmstrukturen
Handbuch zur Anlage von Turnieren auf der NÖEV-Homepage
Handbuch zur Anlage von Turnieren auf der NÖEV-Homepage Inhaltsverzeichnis 1. Anmeldung... 2 1.1 Startbildschirm... 3 2. Die PDF-Dateien hochladen... 4 2.1 Neue PDF-Datei erstellen... 5 3. Obelix-Datei
infach Geld FBV Ihr Weg zum finanzellen Erfolg Florian Mock
infach Ihr Weg zum finanzellen Erfolg Geld Florian Mock FBV Die Grundlagen für finanziellen Erfolg Denn Sie müssten anschließend wieder vom Gehaltskonto Rückzahlungen in Höhe der Entnahmen vornehmen, um
PowerPoint 2010 Mit Folienmastern arbeiten
PP.002, Version 1.1 07.04.2015 Kurzanleitung PowerPoint 2010 Mit Folienmastern arbeiten Der Folienmaster ist die Vorlage für sämtliche Folien einer Präsentation. Er bestimmt das Design, die Farben, die
Charakteristikum des Gutachtenstils: Es wird mit einer Frage begonnen, sodann werden die Voraussetzungen Schritt für Schritt aufgezeigt und erörtert.
Der Gutachtenstil: Charakteristikum des Gutachtenstils: Es wird mit einer Frage begonnen, sodann werden die Voraussetzungen Schritt für Schritt aufgezeigt und erörtert. Das Ergebnis steht am Schluß. Charakteristikum
In diesem Thema lernen wir die Grundlagen der Datenbanken kennen und werden diese lernen einzusetzen. Access. Die Grundlagen der Datenbanken.
In diesem Thema lernen wir die Grundlagen der Datenbanken kennen und werden diese lernen einzusetzen. Access Die Grundlagen der Datenbanken kurspc15 Inhaltsverzeichnis Access... Fehler! Textmarke nicht
Microsoft Office Visio 2007 Infotag SemTalk Thema: Prozessmodellierung
Microsoft Office Visio 2007 Infotag SemTalk Thema: Prozessmodellierung Dr.-Ing. Frauke Weichhardt, Semtation GmbH Christian Fillies, Semtation GmbH Claus Quast, Microsoft Deutschland GmbH Prozessmodellierung
Objektorientierte Programmierung für Anfänger am Beispiel PHP
Objektorientierte Programmierung für Anfänger am Beispiel PHP Johannes Mittendorfer http://jmittendorfer.hostingsociety.com 19. August 2012 Abstract Dieses Dokument soll die Vorteile der objektorientierten
1 PIVOT TABELLEN. 1.1 Das Ziel: Basisdaten strukturiert darzustellen. 1.2 Wozu können Sie eine Pivot-Tabelle einsetzen?
Pivot Tabellen PIVOT TABELLEN. Das Ziel: Basisdaten strukturiert darzustellen Jeden Tag erhalten wir umfangreiche Informationen. Aber trotzdem haben wir oft das Gefühl, Entscheidungen noch nicht treffen
Was ist Sozial-Raum-Orientierung?
Was ist Sozial-Raum-Orientierung? Dr. Wolfgang Hinte Universität Duisburg-Essen Institut für Stadt-Entwicklung und Sozial-Raum-Orientierte Arbeit Das ist eine Zusammen-Fassung des Vortrages: Sozialräume
Verband der TÜV e. V. STUDIE ZUM IMAGE DER MPU
Verband der TÜV e. V. STUDIE ZUM IMAGE DER MPU 2 DIE MEDIZINISCH-PSYCHOLOGISCHE UNTERSUCHUNG (MPU) IST HOCH ANGESEHEN Das Image der Medizinisch-Psychologischen Untersuchung (MPU) ist zwiespältig: Das ist
Das Persönliche Budget in verständlicher Sprache
Das Persönliche Budget in verständlicher Sprache Das Persönliche Budget mehr Selbstbestimmung, mehr Selbstständigkeit, mehr Selbstbewusstsein! Dieser Text soll den behinderten Menschen in Westfalen-Lippe,
Alle Schlüssel-Karten (blaue Rückseite) werden den Schlüssel-Farben nach sortiert und in vier getrennte Stapel mit der Bildseite nach oben gelegt.
Gentlemen", bitte zur Kasse! Ravensburger Spiele Nr. 01 264 0 Autoren: Wolfgang Kramer und Jürgen P. K. Grunau Grafik: Erhard Dietl Ein Gaunerspiel für 3-6 Gentlemen" ab 10 Jahren Inhalt: 35 Tresor-Karten
Modellbildungssysteme: Pädagogische und didaktische Ziele
Modellbildungssysteme: Pädagogische und didaktische Ziele Was hat Modellbildung mit der Schule zu tun? Der Bildungsplan 1994 formuliert: "Die schnelle Zunahme des Wissens, die hohe Differenzierung und
Der Kalender im ipad
Der Kalender im ipad Wir haben im ipad, dem ipod Touch und dem iphone, sowie auf dem PC in der Cloud einen Kalender. Die App ist voreingestellt, man braucht sie nicht laden. So macht es das ipad leicht,
V 2 B, C, D Drinks. Möglicher Lösungsweg a) Gleichungssystem: 300x + 400 y = 520 300x + 500y = 597,5 2x3 Matrix: Energydrink 0,7 Mineralwasser 0,775,
Aufgabenpool für angewandte Mathematik / 1. Jahrgang V B, C, D Drinks Ein gastronomischer Betrieb kauft 300 Dosen Energydrinks (0,3 l) und 400 Liter Flaschen Mineralwasser und zahlt dafür 50, Euro. Einen
Gruppenrichtlinien und Softwareverteilung
Gruppenrichtlinien und Softwareverteilung Ergänzungen zur Musterlösung Bitte lesen Sie zuerst die gesamte Anleitung durch! Vorbemerkung: Die Begriffe OU (Organizational Unit) und Raum werden in der folgenden
Plotten von Linien ( nach Jack Bresenham, 1962 )
Plotten von Linien ( nach Jack Bresenham, 1962 ) Ac Eine auf dem Bildschirm darzustellende Linie sieht treppenförmig aus, weil der Computer Linien aus einzelnen (meist quadratischen) Bildpunkten, Pixels
2.1 Präsentieren wozu eigentlich?
2.1 Präsentieren wozu eigentlich? Gute Ideen verkaufen sich in den seltensten Fällen von allein. Es ist heute mehr denn je notwendig, sich und seine Leistungen, Produkte etc. gut zu präsentieren, d. h.
1. Einführung. 2. Archivierung alter Datensätze
1. Einführung Mit wachsender Datenmenge und je nach Konfiguration, kann orgamax mit der Zeit langsamer werden. Es gibt aber diverse Möglichkeiten, die Software wieder so zu beschleunigen, als würden Sie
