Kapitel 6 Visuelle Data Mining-Applikationen

Größe: px
Ab Seite anzeigen:

Download "Kapitel 6 Visuelle Data Mining-Applikationen"

Transkript

1 Kapitel 6 Visuelle Data Mining-Applikationen Im vorausgehenden Kapitel wurden die Aufgaben und die Bedeutung des Data Mining im Bereich der chemischen Forschung erläutert. Dabei wurden insbesondere die Methoden und Eigenschaften des visuellen Data Minings sowie die hierfür notwendigen Techniken der Informationsvisualisierung beschrieben. Die Methoden und Applikationen dieses speziellen Data Mining-Feldes haben in jüngster Zeit insbesondere im Wirkstoffdesign aufgrund der drastischen Zunahme an generierten Daten stark an Bedeutung gewonnen. Der entscheidende Vorteil dieser Systeme gegenüber klassischen, "Black Box"-ähnlichen Data Mining-Ansätzen ist die einfache und von speziellen Data Mining-Kenntnissen unabhängige Architektur. Visuelle Data Mining-Anwendungen können daher direkt von den Chemikern eingesetzt werden, die auch für die Generierung der Datensätze verantwortlich sind und ermöglichen somit eine best- und schnellstmögliche Analyse und Interpretation der Daten. Screeningdatensätze und kombinatorische Daten liegen in der Regel in Form firmeninterner oder öffentlich zugänglicher Datenbanken vor und sollten daher auch durch firmeninterne Informationssysteme oder über das Internet zugreifbar und analysierbar sein. Zu Beginn der dieser Dissertation zugrundeliegenden Entwicklungsarbeiten gab es jedoch keine portablen Möglichkeiten, um hochdimensionale Datensätze im Internet zu visualisieren und zu analysieren. Dieses Kapitel beschreibt verschiedene, im Rahmen dieser Arbeit entwickelte Ansätze und Applikationen, die ein portables, WWW-fähiges visuelles Data Mining multivariater, chemischer Datensätze ermöglichen. Der erste Teil des Kapitels beschreibt ein auf VRML basierendes 3D-Interface für die weltweit größte frei zugängliche chemische Strukturdatenbank, die Antitumor-Screening- Datenbank des amerikanischen Krebsforschungsinstituts (National Cancer Institute, NCI). Das Interface dient dabei der Visualisierung und Analyse der in der Datenbank enthaltenen cancerotoxischen und cancerostatischen Messwerte. Der zweite Teil des Kapitels widmet sich dem Aufbau und der Funktionsweise des in Java implementierten InfVis-Programms. Das sowohl als Standalone-Anwendung als auch als 117

2 6 Visuelle Data Mining-Applikationen Applet ausführbare Programm wurde nicht wie das zuvor erwähnte Interface zur Analyse eines spezifischen Datensatzes sondern für den allgemeinen Umgang mit beliebigen, multivariaten bzw. multidimensionalen Datensätzen konzipiert. Abschließend wird im letzten Teil des Kapitels der Online-Dienst NCI Screening Data 3D Miner vorgestellt. Der Online-Dienst stellt dabei eine auf InfVis basierende Weiterentwicklung des bereits erwähnten NCI Datenbank-Interfaces dar. In vielen chemischen und mathematischen Modellen wird das dreidimensionale Koordinatensystem so dargestellt, dass die z-achse nach oben weist. Im Gegensatz dazu ist in der 3D- Visualisierung das kartesische Koordinatensystem in der rechtshändigen Form (Rechte-Hand- Regel) weit verbreitet (Abbildung 6-1). Bei gespreizten Fingern der rechten Hand zeigt der Zeigefinger in x-richtung, der Mittelfinger in y-richtung und der Daumen in z-richtung. Diese Form des Koordinatensystems liegt gewöhnlich allen 3D-Visualisierungsapplikationen (darunter auch chemischen Anwendungen wie Molcad [250]) sowie den etablierten 3D-Graphikschnittstellen wie beispielsweise OpenGL (vgl. Abschnitt ) zugrunde und ist auch Basis der in diesen Kapitel vorgestellten Applikationen. y hinten z vorne x Abb. 6-1: Dreidimensionales Koordinatensystem (Rechte-Hand-Form). 6.1 NCI Antitumor-Datenbank-Interface Motivation und Zielsetzung Die Antitumor- antivirale Screening-Datenbank des US Krebsforschungszentrums stellt mit über Verbindungen die derzeit größte, frei zugängliche chemische Strukturdatenbank dar. Seit Beginn des in-vitro Screeningtest im Jahre 1990 wurden dabei bereits über (davon frei zugängliche) dieser Verbindungen durch das NCI Developmental Therapeutics Program (DTP) [202] gegen einen standardisierten Satz von sechzig Krebszelllinien getestet (vgl. Anhang C) [203, 204]. Die resultierenden Screeningdatensätze wurden 118

3 6.1 NCI Antitumor-Datenbank-Interface mit Hilfe verschiedener Data Mining-Experimente analysiert und waren Gegenstand zahlreichen Publikationen [205]. Darüber hinaus wurden einige Online-Schnittstellen für die Suche und Analyse der Datenbank entwickelt, wobei der Enhanced CACTVS NCI Database Browser den umfangreichsten und am weitesten entwickelten Vertreter darstellt [93]. Dieser in einer Kooperationsarbeit zwischen dem Computer-Chemie-Centrum und dem Laboratory of Medicinal Chemistry des NCI (LMC, Center for Cancer Research, NCI, NIH) entwickelte Online-Dienst vereint alle öffentlich zugänglichen Daten der NCI Datenbank und wurde darüber hinaus um dreidimensionale Strukturinformationen und berechnete und experimentelle molekulare Eigenschaften erweitert. Trotz der Vielzahl der implementierten komplexen Suchund Analysemöglichkeiten können in der gegenwärtigen Version keine Suchverfahren auf den Antitumor-Screeningdaten durchgeführt werden. Darüber hinaus werden die Screeningdaten der einzelnen Verbindungen auch nur in einer tabellarischen Liste ausgegeben, was die Identifikation potentieller Wirkstoffkandidaten erschwert. Im Gegensatz dazu ist eine durch den Benutzer definierte Suche innerhalb der Screeningdaten mit Hilfe der vom DTP entwikkelten Online-Werkzeuge möglich. Leider beschränkt sich die Visualisierung der Screeningdaten jedoch nur auf ein zweidimensionales Balkendiagramm, das den Vergleich von maximal zwei verschiedenen Verbindungen zulässt. Diese stark limitierte Darstellungsform ist für die Erkennung allgemeiner Struktur-Aktivitätsprinzipien ungeeignet, da hierfür die Screeningdaten einer Vielzahl strukturell ähnlicher Verbindungen betrachtet und verglichen werden müssen. Das Ziel war daher die Entwicklung einer Online-Anwendung, die eine effektive Darstellung und Analyse der NCI Screeningdaten ermöglichte. Um eine visuelle Erkennung von Struktur-Aktivitäts-Prinzipien zu gewährleisten, musste der Online-Dienst in der Lage sein, die biologischen Aktivitäten einer Vielzahl von Verbindungen darzustellen. Da bei der Realisierung der Anwendung der Internetstandard VRML eingesetzte wurde, sollte in einer weiteren Fragestellung die Verwendbarkeit dieses Graphikformats für den Einsatz im visuellen Data Mining überprüft werden Funktionsbeschreibung Das Eingabeformular (Abbildung 6-2) des Online-Dienstes besteht aus drei Bereichen. Der obere Teil des HTML-Fomulars dient dabei zur Festlegung der Kriterien für die Struktursuche. Der Benutzer kann zum einen mit Hilfe von CAS-Nummern oder internen Kennzeichnungen des amerikanische Krebsforschungsinstituts, den sogenannten NSC-Nummern, nach bestimmten Verbindungen suchen. Im Allgemeinen sind diese speziellen Identifier dem Benutzer jedoch nicht bekannt und kommen daher nur in seltenen Fällen zum Einsatz. In der Regel erfolgt die Suche nach Verbindungen über die chemische Struktur bzw. Konnektivität. 119

4 6 Visuelle Data Mining-Applikationen Abb. 6-2: Eingabeformular des NCI Antitumor-Datenbank-Interface. Der Benutzer hat deshalb die Möglichkeit Konnektivitätsdaten in Form der SMILES-Notation [104] an den Service zu übergeben. Dieses Austauschformat kann entweder von mit der SMILES-Syntax vertrauten Benutzern direkt eingegeben oder mit Hilfe der Copy & Paste- Funktion aus aktuellen, chemischen Struktureditoren übernommen werden. Darüber hinaus bietet die Anwendung wie auch die im ersten Teil dieser Arbeit beschriebenen Online-Applikationen die Nutzung eines Java-basierten Struktureditors [12] zur Generierung von SMILES-Strings an. Der Anwender kann die eingegebene Konnektivitätsinformation zum einen für die Suche nach exakten Strukturen einsetzen. Wesentlich interessanter ist jedoch die Möglichkeit die strukturelle Information zur Substruktursuche zu verwenden. Neben der Substruktursuche können auch noch diverse Ähnlichkeitssuchen (98%, 95%, 90% und 75% strukturelle Ähnlichkeit) durchgeführt werden. Der NCI in-vitro Screeningtest wurde so definiert, dass die sechzig Standard-Krebszelllinien sowohl die wichtigsten organbezogenen Krebsarten als auch die wichtigsten biochemischen Mechanismen umfasst. Im mittleren Teil des Eingabeformulars kann der Benutzer daher die für die Fragestellung interessanten Krebsfamilien wie Brust-, Lungen-, Eierstock-, Prostata-, Augen- und Darmkrebs sowie Leukämie, Melanome und Krebsarten des Zentralen Nervensystems selektieren. Der untere Teil des Online-Dienstes dient letztendlich zur Selektion der biologischen Aktivitäten. Dabei kann der Benutzer zwischen drei unterschiedlichen Messwerten wählen 120

5 6.1 NCI Antitumor-Datenbank-Interface GI50, TGI und LC50. Der GI50-Wert beschreibt die Konzentration einer chemischen Verbindung, bei der eine 50%-ige Wachstumsinhibition festgestellt wurde. Der TGI-Wert ist die Konzentration bei der kein Wachstum der Zellen mehr beobachtet werden konnte und beschreibt daher den cancerostatischen Effekt einer Verbindung. Der letzte zur Wahl stehende Wert ist der LC50. Dieser Wert steht für die Konzentration bei der die Zellpopulation um 50 Prozent minimiert wurde und ist damit ein Indiz für den cytotoxischen Effekt einer Verbindung. Darüber hinaus kann der Benutzer entscheiden, ob die biologische Aktivität in einer absoluten oder relativen Form dargestellt werden sollen. Bei der absoluten Aktivität werden die gemessenen logarithmischen Werte direkt eingesetzt. Die relative Aktivität wird hingegen nach dem Mean Graph -Prinzip von Paull definiert [204, 206]. Dabei wird für eine gegebene Verbindung die gemittelte biologische Aktivität über alle Krebszelllinien bestimmt. Der gemittelte Wert wird anschließend von den einzelnen, zellspezifischen Aktivitäten subtrahiert, wodurch sich eine relative Darstellung ergibt. Diese Auftragung hat sich als besonders nützlich zur Identifikation spezifischer Wirkungsweisen herausgestellt. Schließlich kann der Benutzer die Datenbanksuche starten. Um eine Überfrachtung der graphischen Szene zu vermeiden, wird dabei die Trefferliste auf einhundert Verbindungen begrenzt. Abb. 6-3: VRML-Szene mit biologischen Aktivitäten (relative Auftragung) in einer Balkendiagramm- Darstellung (Farbabbildung: Anhang A, Abbildung A-11). 121

6 6 Visuelle Data Mining-Applikationen Nachdem die Datenbankrecherche beendet ist, werden die biologischen Aktivitäten in Form einer VRML-Szene in einem zweiten Browserfenster dargestellt (Abbildung 6-3). Dabei werden die Krebszelllinien auf der x-achse und die chemischen Verbindungen auf der z-achse aufgetragen. Die biologischen Aktivitäten werden zum einen durch die Größe (Auslenkung entlang der y-achse) als auch durch die Farbe der 3D-Balken dargestellt. Die Farbwerte entsprechen dabei dem Spektrum des sichtbaren Lichtes und verlaufen von violett für niedrige biologische Aktivitäten nach rot für große Aktivitätswerte. In der Mean Graph - Darstellung (relative Auftragung der Werte) wird der biologische Aktivitätswert zudem durch die Ausrichtung der Balken repräsentiert. Verbindungen mit einer unterdurchschnittlichen Aktivität zeigen dabei nach unten aus der xz-ebene heraus, während überdurchschnittliche Aktivitäten durch nach oben ausgerichtete Balken dargestellt sind. Fehlende Messwerte werden in der graphischen Szene durch Löcher symbolisiert. Neben den Namen der einzelnen Krebszelllinien sind auf der x-achse auch zusätzliche numerische Identifikatoren (ID) aufgetragen. Diese IDs wurden zur einfachen, weiter unten beschriebene Selektion der Krebszellen eingefügt. Darüber hinaus enthält auch die z-achse neben den Identifikationsnummern für die chemischen Verbindungen zusätzliche Objekte in Form von roten Kugeln. Diese graphischen Objekte sind sogenannte Ankerknoten, die den Hyperlinks in HTML-Seiten entsprechen und dienen in diesem Fall zur Abfrage chemischer Detailinformation. Jeder Ankerknoten enthält dabei eine HTTP-kodierte Datenbankabfrage für den bereits erwähnten Enhanced CACTVS NCI Database Browser [93]. Durch Anklicken der Kugeln kann der Benutzer diesen Online-Dienst in einem weiteren Browserfenster öffnen und somit auf sämtliche in der Datenbank gespeicherten Daten der korrespondierenden Verbindung zugreifen. Darüber hinaus kann der Benutzer den Service auch für weitergehende Arbeitsschritte verwenden. Der Anwender kann sich innerhalb der Szene frei bewegen und die dargestellte Datenlandschaft mit Standard-Navigationswerkzeugen wie Translation, Rotation und Zoom erforschen. Neben der Darstellung der VRML-Szene wird auch das ursprüngliche Dateneingabeformular im ersten Browserfenster durch ein neues HTML-Formular ersetzt (Abbildung 6-4). Dieses Formular besteht dabei ebenfalls wie das erste Formular aus drei Bereichen der obere Teil zur Selektion der chemischen Verbindungen, der mittlere Teil zur Wahl der Krebszelllinien und der untere Teil zur Auswahl der Aktivitätsdaten. Im Gegensatz zum ursprünglichen Formular dient das neue, dynamisch generierte HTML-Formular jedoch nicht zur Formulierung einer neuen Datenbankanfrage sondern vielmehr zur Selektion interessanter Aktivitätsdaten. Aus diesem Grund enthält das Formular zwei Textfelder, in denen die Identifikationsnummern der in der VRML-Szene dargestellten chemischen Verbindungen und Krebszelllinien enthalten sind. Nachdem der Benutzer interessante Struktur-Aktivitäts- Muster innerhalb der graphischen Übersicht ausgemacht hat, kann er die Identifikationsnum- 122

7 6.1 NCI Antitumor-Datenbank-Interface mern uninteressanter Verbindungs-Krebszelllinien-Kombinationen aus den Textfeldern entfernen. Nach Betätigung des Refine Results -Knopfes werden sowohl die in der VRML- Szene dargestellten Aktivitäten als auch die im Selektionsformular enthaltenen Daten der durch den Benutzer definierten Auswahl entsprechend angepasst. Dieser Vorgang kann dabei so oft wiederholt werden, bis die gewünschten Struktur-Aktivitäts-Daten isoliert wurden. Abb. 6-4: NCI Antitumor-Datenbankinterface: Selektionsformular. Neben diesen grundsätzlichen Funktionen bietet der untere Formularteil einige zusätzliche Selektionsoptionen. Zum einen kann zu jedem Zeitpunkt die graphische Darstellung der biologischen Aktivitätsdaten von einer relativen in eine absolute Darstellung bzw. umgekehrt geändert werden. Darüber hinaus kann der Benutzer für die selektierten Verbindungen und Krebszelllinien die zugrundeliegenden biologischen Aktivitätsdaten (GI50, LC50, TGI) austauschen, um so beispielsweise Unterschiede im cytotoxischen und cytostatischen Verhalten einer Verbindung zu identifizieren. In einigen Fällen ermöglicht das Formular auch den Wechsel der Substanzkonzentration. Dies ist dann der Fall, wenn eine als hoch aktive Substanz identifizierte Verbindung in verschiedenen Verdünnungsgraden im in-vitro Screeningtest eingesetzt wurde. Liegt die entsprechende Information für den selektierten Datensatz in der Datenbank vor, so werden alle entsprechenden Konzentrationen automatisch zur Auswahl 123

8 6 Visuelle Data Mining-Applikationen gestellt. Der Online-Dienst informiert den Benutzer darüber hinaus, für wieviele der dargestellten Verbindungen die gewählte Konzentration relevant ist Implementierung Wie auch die im ersten Teil der Arbeit beschriebenen Online-Dienste basiert das NCI Datenbank-Interface auf dem chemischen Datenmanagementsystem CACTVS (vgl. Abschnitt 2.3.1). Darüber hinaus kamen zum einen die Datenbank (spezifisches CACTVS-Format) des Enhanced CACTVS NCI Database Browser mit molekularen Eigenschaften und Strukturinformationen der über Verbindungen der NCI Datenbank als auch eine MySQL-Datenbank [207] mit den NCI in-vitro Screeningdaten von (Stand: April 2002) chemischen Verbindungen zum Einsatz. Im Gegensatz zu den im ersten Teil der Arbeit beschriebenen Visualisierungsansätzen wurden bei der Implementierung des Web-fähigen Datenbank-Interfaces keine zusätzlichen CACTVS-Module entwickelt. Vielmehr diente das CACTVS-System zur Ausführung der aufwendigen Substruktur- und Ähnlichkeitssuchen sowie für den Zugriff auf die CACTVS- Datenbank des Enhanced CACTVS NCI Database Browser. Die einzelnen Prozessabläufe der in Abbildung 6-5 schematisch dargestellten Datenvisualisierungssitzung werden im Folgenden näher beschrieben. Nachdem der Benutzer die gewünschten Suchparameter zur Auswahl der chemischen Verbindungen und Krebszelllinien angegeben und die Datenbankrecherche gestartet hat, überprüft das CGI-Skript in einem ersten Schritt die Syntax der übermittelten Parameter. Anschließend wird je nach Benutzereinstellung (CAS, NSC, Substruktur- oder Ähnlichkeitssuche) die Datenbank des Enhanced CACTVS NCI Database Browser durchsucht und die relevanten Treffer in Form von NSC-Nummern an das CGI-Skript zurückgeliefert. Die Suche ist dabei durch Angabe zusätzlicher Suchparameter nur auf solche Verbindungen limitiert, für die auch Antitumor-Screeningdaten vorliegen ( von Verbindungen). Die vom CACTVS-System gefundenen NSC-Nummern werden anschließend mit den vom Benutzer selektierten Krebszelllinien in Form einer SQL-Datenbankanfrage kombiniert und diese zur Abfrage der biologischen Aktivitätsdaten an die MySQL-Datenbank übergeben. Darüber hinaus entnimmt das CGI-Skript der Datenbank die verschiedenen Konzentrationsangaben, die für die entsprechende Kombination zur Verfügung stehen. Mit Hilfe der zurückgelieferten Daten generiert das CGI-Skript schließlich zum einen die VRML-Szene zur graphischen Darstellung der biologischen Aktivitäten und zum anderen das temporäre HTML-Formular zur Selektion von Teildatensätzen. 124

9 Krebszellen 6.1 NCI Antitumor-Datenbank-Interface Client Server Eingabe HTML- Formular Auswahl HTML- Formular CGI-Skript Strukturen Strukturen CACTVS-System Einlesen, Analyse Datenbanksuche (Substruktursuche, Ähnlichkeitssuche, etc.) MySQL- NCI-Datenbank CACTVS- NCI-Datenbank > Strukturdaten, Molekulare Eigenschaften 2346, 2569, 2890, , , , , , ,... 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20-28, 60,... Hitlist Selektion Screeningdaten Ausgabe VRML VRML-Szene CACTVS-System Detail HTML- Formular Auswahl Detail- Information Einlesen, Analyse Datenbanksuche (Substruktursuche, Ähnlichkeitssuche, etc.) N R 2 N Abb. 6-5: Schematische Darstellung einer Datenvisualisierungssitzung mit dem NCI-Datenbank-Interface. Der rautierte Bereich kennzeichnet Elemente des Enhanced CACTVS NCI Database Browser [93], welcher nicht Teil dieser Arbeit war. Der Benutzer kann im Folgenden Verbindungen und Krebszelllinien, welche er vorher anhand auffälliger Aktivitätsmuster in der graphischen VRML-Darstellung ausgemacht hat, im dynamisch generierten HTML-Formular selektieren bzw. die uninteressanten Einträge löschen und die Daten zur Aktualisierung an den Server übermitteln. Im Gegensatz zur ersten Datenbanksuche muss dabei kein erneuter Zugriff auf die Datenbank des Enhanced CACTVS NCI Database Browser erfolgen, da zu diesem Zeitpunkt bereits alle relevanten NSC-Daten dem CGI-Skript bekannt sind. Die neuselektierten Daten werden wieder zur Generierung einer MySQL-Datenbankanfrage verwendet und die resultierende, neue VRML-Szene sowie das aktualisierte HTML-Formular an den Benutzer übertragen. Dieser Vorgang kann beliebig oft wiederholt werden. 125

10 6 Visuelle Data Mining-Applikationen Wie bereits erwähnt, ist die VRML-Szene mit sogenannten VRML-Ankerknoten ausgestattet, um dem Benutzer die Abfrage von Detailinformation zu erlauben. Diese Ankerknoten enthalten dabei einen Hyperlink zum Enhanced CACTVS NCI Database Browser mit einer kodierten NSC-Nummer der entsprechenden Verbindung. Durch Anklicken der entsprechenden, roten Kugeln wird dann eine reguläre Online-Sitzung des Database Browsers gestartet und die korrespondierende Detailinformation in einem dritten Browserfenster dargestellt. Da letztere Funktionalität nicht durch das NCI Datenbank-Interface realisiert wird, wurden die entsprechenden Teile in Abbildung 6-5 besonders hervorgehoben (rautiert) Diskussion Während zum Implementierungszeitpunkt des graphischen Datenbank-Interfaces bereits zahlreiche Web-Applikationen zur Visualisierung verschiedener Datentypen wie beispielsweise Volumen vorlagen, gab es kaum portable Informationsvisualisierungs-Anwendungen, die zur Darstellung großer Datensätze und somit zur Analyse und Suche nach Mustern und Beziehungen geeignet waren. Darüber hinaus erlaubte der Großteil der wenigen, verfügbaren Applikationen lediglich die Präsentation aber nicht die für visuelles Data Mining essentielle Exploration von Datensätzen. Erste Arbeiten auf dem Gebiet der portablen, explorativen Informationsvisualisierung wurden in der National Security Agency (NSA, USA) entwickelt und basierten auf der Virtual Reality Modeling Language [208]. Der Visualisierungsansatz diente zur Darstellung hierarchischer Daten und Graphen wie beispielsweise der Organisationsstruktur der NSA und nutzte deshalb spezielle Visualisierungstechniken wie die Cone Tree-Technik (vgl. Abschnitt ). Wie auch im vorliegenden Datenbank-Interface wurde in diesem frühen Ansatz die VRML-eigene Ankerknotentechnik eingesetzte, um Hyperlinks in die VRML-Szene zu integrieren und somit zusätzliche Zugriffsmöglichkeiten in Form von statischen HTML-Seiten oder CGI-vermittelten Datenbanksuchen zu erlauben. Obwohl mit Hilfe dieses Ansatzes eine Visualisierung, Analyse und Navigation innerhalb großer Datensätze möglich war, fehlten essentielle Funktionen wie beispielsweise Filter- und Selektionswerkzeuge, die für ein effektives visuelles Data Mining nötig sind. Ein anderer mehr zur Präsentation als zur explorativen Analyse geeigneter Ansatz wurde von der Firma StockSmart, einem Provider von Online-Analysewerkzeugen für Finanz- und Investmentdaten, entwickelt [209]. Durch einen auf VRML basierenden, dreidimensionalen Liniengraphen (vgl. Abschnitt ) wird der zeitliche Verlauf von Firmenbilanzen dargestellt. Die VRML-Szene wurde mit Berührungs-Sensoren sowie Skriptknoten ausgestattet, die zur Darstellung von Detailinformationen innerhalb der VRML-Szene dienen. Der Benutzer kann dabei mit dem Mauszeiger über bestimmte Regionen des Liniengraphen fahren, was 126

11 6.1 NCI Antitumor-Datenbank-Interface zu einer farblichen Hervorhebung der einzelnen Bereiche und zur textuellen Darstellung der korrespondierenden Detailinformation führt. Weitere Funktionalitäten sind nicht vorhanden. Da die im VRML-Standard vorhandenen Interaktionstechniken für ein effektives visuelles Data Mining im Allgemeinen nicht ausreichen, wurden verschiedene Ansätze zur Erweiterung der Benutzerinteraktionsfähigkeiten entwickelt. Eine Möglichkeit bietet dabei die bereits im ersten Teil dieser Arbeit vorgestellte Kombination von VRML und Java über das External Authoring Interface. Eine auf dieser Technik basierende Demonstrationsapplikation wurde von Roskothen vorgestellt [210]. Die Online-Demo besteht dabei aus einer VRML- Szene mit einer Balkendiagramm-Darstellung sowie einem Java-Applet, an das ein Datenarray übergeben wird. Durch Betätigung eines Schiebereglers kann der Benutzer nun direkt die Histogramm-Darstellung beeinflussen. Eine konkrete Nutzung dieser Technik innerhalb einer visuellen Data Mining-Anwendung ist uns nicht bekannt. Ein anderer Weg zur Verbesserung der Interaktionsfähigkeiten wurde von der Firma EM7 beschrieben und stellt darüber hinaus die wahrscheinlich erste kommerzielle, VRML-basierte Softwarelösung im Bereich der Informationsvisualisierung dar [211]. Zum einen beinhaltet die auf einer Client-Server-Architektur aufbauende Anwendung ein ActiveX-basiertes Application Programmable Interface (API), mit dessen Hilfe die Server-seitige Anbindung an externe Programmpakete als auch an verschiedene Datenbankformate möglich ist. Darüber hinaus entwickelte EM7 eine umfassende Sammlung an VRML-Erweiterungen, das sogenannte ProtoPac, das die limitierten Funktionen des VRML-Standards durch diverse, speziell für die Bedürfnisse der Informationsvisualisierung angepasste Funktionen ergänzte. Diese Sammlung enthält dabei Werkzeuge zur Navigation, Interaktion und Datenbankkommunikation. Leider schliesst die Nutzung des Microsoft-Standards ActiveX den Einsatz dieser Technik auf nicht-windows-basierten Systemen aus. Darüber hinaus zeigte ein kürzlicher Besuch auf der Homepage von EM7, dass es innerhalb der letzten ein bis zwei Jahre keine Aktualisierungen der Technik gegeben hat und daher offensichtlich auch keine neuen Webbrowser- und VRML-Plugin-Generationen unterstützt werden. Dieser Verdacht bestätigte sich bei der Ausführung der EM7-Demonstrationsanwendungen, die unter Verwendung des CORTONA- VRML-Plugins [212] und Netscape 6.2 keine sinnvollen Darstellungen ergab. Schließlich sollen an dieser Stelle noch zwei besondere VRML-basierte Programme zur Exploration und Analyse von Datensätzen erwähnt werden RInvoice und 3D Active Chart [213]. Die beiden von der Firma First Information Systems entwickelten Programme stellen jedoch im Gegensatz zu den anderen hier beschriebenen Ansätzen keine portablen WWW- Applikationen dar. Dennoch nutzen sie den VRML-Standard zur Visualisierung der Datensätze. Im Gegensatz zu den Web-fähigen Ansätzen werden in diesem Fall die VRML-Szenen durch die ActiveX-Schnittstelle des VRML-Players CORTONA [212] in Standalone-Win- 127

12 6 Visuelle Data Mining-Applikationen dows-applikationen eingebunden. Dies ermöglicht auf der einen Seite ein Maximum an Datenzugiffsmöglichkeiten und interaktiver Datenmanipulation, aber beschränkt auf der anderen Seite die Nutzung dieser Programme auf Einzelplatzrechner mit Windows-Betriebssystemen. Das NCI Datenbank-Interface stellt nach unserem Wissen die erste VRML-basierte Anwendung dar, die speziell zur Visualisierung und Analyse chemischer, multidimensionaler Datensätze im Internet entwickelt wurde. Darüber hinaus ist uns bis dato kein anderer Online- Dienst bekannt, der den VRML-Standard zur Darstellung und Exploration von Datensätzen der Chemie (ausgenommen molekulare Modelle wie Strukturen und Oberflächen) verwendet. Der Einsatz der Virtual Reality Modeling Language birgt dabei sowohl Vor- als auch Nachteile. Zum Zeitpunkt der Implementierung stellte der VRML-Standard die einzige standardisierte Technologie zur Vermittlung dreidimensionaler Szenen über das Internet dar. Ein wesentlicher Vorteil dieses Standards basiert auf der leichten Verfügbarkeit. VRML-Szenen können durch diverse, frei verfügbare VRML-Plugins in fast allen wichtigen Webbrowsern sowie nahezu auf allen Plattformen und Betriebssystemen dargestellt werden. Darüber hinaus baut VRML auf low-level Graphikschnittstellen wie OpenGL oder Direct3D auf und nutzt daher die Fähigkeiten moderner 3D-Graphikhardware. Ein wesentlicher Nachteil des VRML-Standards stellen die begrenzten Interaktions- und Dynamik-Fähigkeiten des VRML-Formates dar. Obwohl mit Hilfe der implementierten Funktionen einige grundsätzliche, explorative Werkzeuge wie beispielweise weiterführende, auf Hyperlink-Technik basierende Detail- und Datenbankabfragen realisiert werden können, sind zur Realisierung effektiver, visueller Data Mining-Applikationen zusätzliche Interaktionswerkzeuge nötig. Im vorliegenden Fall wird dieses Defizit durch die Kombination der VRML-Darstellung mit dynamisch generierten HTML-Formularen gelöst, wodurch dem Benutzer die Selektion von Datenpunkten bzw. interessanter Muster ermöglicht wird. Die typische Client-Server-Architektur von VRML-basierten Online-Diensten kann ebenfalls zu Nachteilen bei der Visualisierung großer Datensätze führen. Dabei wird im Allgemeinen die VRML-Szene auf der Serverseite durch entsprechende Data Mining-Applikationen aus den Originaldaten generiert und an den Client übermittelt. Während dieser Graphiktransfer von Daten (vgl. Abschnitt 3.3.3) bei kleinen Datensätzen problemlos zu realisieren ist, werden mit zunehmender Datensatzgröße die Übertragungszeiten zwischen Server und Client immer größer was letztendlich eine effektive Arbeit unmöglich macht. Die Ursache für dieses Problem liegt dabei nicht unmittelbar in der Größe der relativ kompakten, tabellarischen Originaldaten begründet, sondern basiert auf der Größe der VRML-Dateien, die in der Regel um ein Vielfaches größer sind als die korrespondierenden Rohdaten. Im Fall des NCI Datenbank- Interfaces fällt dieser Sachverhalt weniger ins Gewicht, da zum einen die Datenbankrecher- 128

13 6.2 Das InfVis-Programm che auf maximal einhundert Verbindungen limitiert ist und zum anderen der Benutzer nach spezifischen Struktur- und Krebszellen-Kombinationen sucht, die in der Regel zu kleineren Datensätzen führen. Der generelle Einsatz von VRML zur Realisierung Web-fähiger Applikationen des visuellen Data Minings ist nach unserer Auffassung nur bei Vorlage relativ kleiner Datensätze und innerhalb spezifischer, auf bestimmte Problemstellungen ausgerichteter Applikationen zu empfehlen. Mit zunehmender Datensatzgröße und vor allem steigendem Unbekanntheitsgrad der zugrundeliegenden Daten wird der Einsatz von VRML in der explorativen Visualisierung zunehmend ungünstig und letztendlich sinnlos. Schlussfolgernd eignet sich VRML daher vor allem zur Datenpräsentation und zur konfirmativen Datenanalyse aber nur im begrenzten Umfang und unter Berücksichtigung spezieller Rahmenbedingungen für explorative Analyseansätze. Im Gegensatz zu den in Kapitel 4 beschriebenen Applikationen wurde das NCI Datenbank-Interface nicht als offizieller Online-Dienst betrieben. Vielmehr diente der Service zum internen Gebrauch am Computer-Chemie-Centrum sowie am Laboratory of Medicinal Chemistry des NCI. Das VRML-Interface soll in die nächste Version des Enhanced CACTVS NCI Database Browser integriert werden. Darüber hinaus wurde im Rahmen dieser Arbeit ein weiterentwickeltes, auf der Programmiersprache Java basierendes Interface entwickelt, das als Online-Dienst zur Verfügung steht (vgl. Abschnitt 6.3). Neben VRML-Ansätzen wurden in den letzten Jahren auch Java-Applikationen sowie spezielle auf Microsoft-Technologien aufbauende Applikationen zur explorativen Informationsvisualisierung entwickelt. Diese Ansätze werden in den Abschnitten 6.2 und 6.3 vorgestellt. 6.2 Das InfVis-Programm Zielsetzung Da die für visuelle Data Mining-Ansätze essentiellen, interaktiven Werkzeuge mit Hilfe von VRML-Applikationen nur sehr begrenzt oder garnicht zu realisieren sind, war ein primäres Ziel des InfVis-Programms die Entwicklung und Einbettung interaktiver und dynamischer Funktionen, die dem Benutzer unter anderem die Identifikation und Extraktion von Mustern ermöglichen. Die Benutzung dieser Funktionen sollte darüber hinaus zu einer unmittelbaren Aktualisierung der Datendarstellung führen, da nur so eine effektive, visuelle Exploration sichergestellt werden kann. Eine Aufteilung der Data Mining-Mechanismen auf Client und Server wie im Fall des NCI Datenbank-Interfaces kam aus diesem Grund nicht in Frage. Vielmehr musste die Client-seitige Applikation in der Lage sein, Rohdaten direkt zu importieren 129

14 6 Visuelle Data Mining-Applikationen und zu speichern sowie die entsprechende graphische Darstellung zu generieren und zu manipulieren. Das Programm sollte darüber hinaus nicht nur auf einen Datensatz wie beispielsweise die NCI Antitumor-Datenbank festgelegt sein, sondern die Darstellung und Visualisierung beliebiger, chemischer Datensätze ermöglichen. Zu Beginn der zugrundeliegenden Entwicklungsarbeiten hatte sich bereits eine visuelle Data Mining-Applikation besonders in der LifeScience-Forschung etabliert Spotfire [214, 215]. Obwohl das auf dem Microsoft-Betriebssystem basierende Programm in großen Stückzahlen in vielen großen Pharmaunternehmen wie Pfizer oder Bayer speziell für den Gebrauch durch Laborchemiker angeschafft wurde, blieb der erhoffte Erfolg, nämlich die Integration der Synthesechemiker sowie ihres Fachwissens in den Data Mining-Prozess, zunächst aus [216]. Die Ursache hierfür lag vor allem in der großen und auf den ersten Blick unüberschaubaren Anzahl an Funktionen der Applikation sowie dem für die Industrie typischen, enormen Zeitdruck der Mitarbeiter begründet, der eine langwierige Einarbeitung in das Programm nur bedingt oder garnicht zulässt. Viele vor allem mit Computern weniger vertraute Chemiker lehnten aus diesen Gründen die Arbeit mit Spotfire ab [216]. Darüber hinaus ergaben interne Umfragen innerhalb der Bayer AG, dass sich die betroffenen Chemiker eine simple Visualisierungsapplikation mit ein bis zwei interaktiven Funktionen wie beispielsweise Zoom wünschten [217]. Diese Erfahrungswerte sollten bei der Implementierung des InfVis-Programms berücksichtigt werden. Die Applikation sollte daher neben den bereits erwähnten Zielen einfach und intuitiv und vor allem ohne die Notwendigkeit einer langwierigen Einarbeitungszeit zu bedienen sein. Außerdem sollte die Interpretation bzw. die visuelle Mustererkennung ebenfalls möglichst intuitiv erfolgen. Schließlich sollte das Programm wie alle anderen in dieser Arbeit vorgestellten Entwicklungen unabhängig von spezifischen Plattformen und Betriebssystemen sein und auch den Einsatz im Internet bzw. Intranet ermöglichen Übersicht Um alle im vorhergehenden Abschnitt aufgelisteten Zielsetzungen zu erfüllen, wurde zur Implementierung der InfVis-Applikation die plattformunabhängige Programmiersprache Java (vgl. Abschnitt 2.2.4) eingesetzt. Darüber hinaus wurde zur Realisierung einer möglichst einfachen visuellen Datenexploration wie auch bereits im NCI Datenbank-Interface (vgl. Abschnitt 6.1) eine dreidimensionale Datenrepräsentationstechnik verwendet. Nach unserer Meinung erlauben insbesondere dreidimensionale Visualisierungsansätze wie Balkendiagramme oder Scatterplots eine einfache Interpretation der dargestellten Datensätze, während komplexere Verfahren wie die Parallel Coordinates-Technik eine ablehnende Haltung bei 130

15 6.2 Das InfVis-Programm ungeübten bzw. im Umgang mit Computern weniger erfahrenen Benutzer hervorrufen können. Um insbesondere die Darstellung multidimensionaler Datensätze zu ermöglichen, basiert das InfVis-Programm auf der 3D-Glyph-Technik, welche bereits in Abschnitt 5-10 vorgestellt wurde. Dieser Ansatz nutzt zum einen die weite Verbreitung und hohe Akzeptanz der Scatterplot-Technik und erlaubt zum anderen das Abbilden einer Vielzahl von Datendimensionen durch retinale Eigenschaften. Zur Darstellung der dreidimensionalen Szenen wurde die verhältnismäßig junge Java- Erweiterung Java3D (vgl. Abschnitt 2.2.6) eingesetzt, die zum einen Client-seitig vorhandene 3D-Kapazitäten nutzt und zum anderen im Gegensatz zu VRML frei programmierbar ist, so dass ein Maximum an Interaktion innerhalb der Szene realisiert werden kann. Darüber hinaus kann die Erweiterung problemlos mit vorhandenen Java Virtual Machines und Java-Plugins eingesetzt werden. Abb. 6-6: Das InfVis-Programm (Farbabbildung: Anhang A, Abbildung A-12). 131

16 6 Visuelle Data Mining-Applikationen Abbildung 6-6 zeigt einen Screenshot des InfVis-Programms. Das graphische User-Interface des Programms besteht aus vier Bereichen dem Menü (Abbildung 6-6, oben), dem Visualisierungsfenster (Abbildung 6-6, oben rechts), dem Werkzeugfenster (Abbildung 6-6, oben links) und dem Mapping -Fenster (Abbildung 6-6, unten). Die einzelnen Fenster sind dabei durch sogenannte SplitPanes miteinander verbunden, die sowohl eine Größenveränderung als auch das Ein- und Ausblenden der einzelnen Fenster erlauben. Auf die verschiedenen Funktionen der einzelnen graphischen Elemente soll im Folgenden nicht näher eingegangen werden. Vielmehr werden die grundsätzlichen Konzepte und Eigenschaften des Programms erläutert. Eine detaillierte Funktionsbeschreibung der Applikation kann über das Internet heruntergeladen werden (URL in Anhang B) Daten-Integration und -Management Eine der wichtigsten Aufgaben bei der Planung und Entwicklung einer visuellen Data Mining-Applikation besteht in der Implementierung von Schnittstellen, die eine einfache Integration von Daten aus verschiedenen Datenquellen ermöglichen. Die umständliche und vor allem zeitaufwendige Konvertierung von Daten führt ansonsten beim Benutzer zu einer deutlichen Abnahme der Akzeptanz. Die InfVis-Applikation ist deshalb mit zwei verschiedenen Datenschnittstellen ausgestattet. Zum einen kann das Programm mit Hilfe der Java Database Connectivity-Erweiterung (JDBC) [218] auf diverse frei verfügbare und kommerzielle Datenbanken zugreifen. In der derzeitigen Version unterstützt die Anwendung dabei lediglich den JDBC-vermittelten Zugriff auf MySQL-Datenbanken [219]. Jedoch kann diese Funktionalität zu jeder Zeit ohne großen Aufwand auf andere Datenbanksysteme erweitert werden. Die zweite Schnittstelle erlaubt die Dateneingabe durch Dateien, in denen die diversen Datenwerte durch Kommas getrennt sind (CSV-Dateien, Comma Separated Value Format). Dieses Datenformat wird vor allem von Tabellenkalkulationsprogrammen wie beispielsweise Excel aber auch von anderen Softwareanwendungen als Standardausgabeformat unterstützt. In beiden Fällen analysiert das InfVis-Programm die eingelesenen Daten und extrahiert neben den eigentlichen Rohdaten auch zusätzliche Information wie beispielsweise Spaltenüberschriften. Darüber hinaus wird während des Lesevorgangs der Datentyp der einzelnen Dimensionen ermittelt. Dabei unterscheidet die Anwendung zwischen kontinuierlichen und diskreten Datentypen sowie Metadaten wie beispielsweise Hyperlinks oder Base64-kodierten Bilddateien. Neben der Datenintegration ist im visuellen Data Mining auch das Datenmanagement von großer Bedeutung. Unter Datenmanagement ist dabei in erster Linie die parallele Verwaltung verschiedener Datensätze zu verstehen. Erst durch die Verfügbarkeit diverser Datensätze wie beispielsweise unter bestimmten Bedingungen selektierten oder in verschiedenen Darstellun- 132

17 6.2 Das InfVis-Programm gen vorliegenden Teildatensätzen ist ein Vergleich zwischen den einzelnen Daten möglich und der Benutzter letztendlich in der Lage, relevante Informationen oder Beziehungen zu erkennen. Im InfVis-Programm kann der Benutzer selektierte oder gefilterte Teildatensätze in separaten Datenspeichern ablegen. Dabei werden nicht nur die entsprechenden Rohdaten sondern auch alle für die Darstellung relevanten und vom Benutzer definierten graphischen Einstellungen gespeichert. Der Benutzer kann zwischen den verschiedenen Datenslots hin- und herschalten, was zu einer unmittelbaren Aktualisierung der graphischen Szene führt. Darüber hinaus besitzt das Programm ein Datenmanagementfenster, in dem zum einen die wichtigsten Informationen zu dem entsprechenden Datensatz dargestellt werden. Zum anderen enthält das Fenster auch Funktionen, die dem Benutzer die Umbenennung und das Löschen von Datensätzen ermöglichen Datenvisualisierung Wie bereits erwähnt, erlaubt die Verwendung dreidimensionaler Visualisierungstechniken wie 3D-Balkendiagrammen, Scatterplots und 3D-Glyphen eine einfache visuelle Exploration von multidimensionalen Datensätzen. Da auch im Umgang mit Visualisierungstechniken weniger erfahrene Chemiker im Allgemeinen bereits mit diesen Darstellungsformen gearbeitet haben, ist die Akzeptanz bei der Verwendung dieser Techniken entsprechend hoch. In der InfVis-Applikation wurde zur Realisierung der dreidimensionalen Szenen die Java3D API verwendet. Im Gegensatz zu alternativen Ansätzen wie der Pseudo-3D-Visualisierung (vgl. Abschnitt ) erlaubt Java3D die Nutzung aktueller, fortgeschrittener 3D-Hardwarefähigkeiten. Darüber hinaus wird in der Regel eine bessere Darstellungsqualität erzielt und der Einsatz von Virtual Reality-Peripherie (vgl. Abschnitt ) wie beispielsweise Stereobrillen ermöglicht. Abb. 6-7: InfVis: a) Balkendiagramm, b) Scatterplotdiagramm, c) 3D-Glyph-Technik (Farbabbildung: Anhang A, Abbildung A-13). 133

18 6 Visuelle Data Mining-Applikationen Die Applikation nutzt in erster Linie die 3D-Glyph-Technik (Abbildung 6-7c), um multidimensionale Datensätze darzustellen. Darüber hinaus werden aber auch andere, weitverbreitete Darstellungsformen wie die Balkendiagramm- (Abbildung 6-7a) oder die Scatterplot- Technik unterstützt (Abbildung 6-7b) Visuelles Mapping Beim visuellen Mapping werden die einzelnen Datendimensionen bzw. Tabellenspalten auf diverse visuelle Attribute graphischer Objekte sowie auf die drei orthogonalen Koordinatenachsen abgebildet. Die visuellen Eigenschaften der InfVis-Applikation basieren dabei vor allem auf den von Bertin definierten retinalen Eigenschaften Form, Farbe und Größe [180]. Das Abbilden der Datendimensionen auf visuelle Dimensionen ermöglicht dabei die Generierung einer Vielzahl verschiedener Datenrepräsentationen, was letztendlich höhere Interpretations- und Analysemöglichkeiten zulässt. Beim Einlesen der Datensätze generiert InfVis automatisch eine vordefinierte Darstellungsform, wobei der Abbildungsvorgang der Reihenfolge der Datendimensionen im Datensatz sowie der InfVis-internen Reihenfolge der graphischen Attribute (X > Y > Z > Größe > Farbe > Form) folgt. Diese Darstellung kann zu jedem Zeitpunkt vom Benutzer interaktiv verändert werden, wodurch eine wichtige Anforderung an visuelle Data Mining-Applikationen erfüllt wird. Die Wahl der besten Datenpräsentation bzw. Abbildungsreihenfolge hängt dabei stark von den Daten selbst, von der Fragestellung des Analysten aber auch von den Vorlieben und den Wahrnehmungsfähigkeiten des Benutzers ab. Neben den Datendimensionen müssen auch die entsprechenden Datenwerte bzw. der Datentyp der einzelnen Dimensionen während des Abbildungs-Prozesses (Mapping) berücksichtigt werden. Ob und wie eine Datenvariable repräsentiert wird, hängt dabei von der Charakteristik der Daten ab. Grundsätzlich kann hierbei zwischen diskreten und kontinuierlichen Datenwerten unterschieden werden. Ein diskreter Datentyp, auch kategorische Variable genannt, liegt dann vor, wenn alle in einer Datenspalte enthaltenen Werte durch eine limitierte Anzahl einzigartiger Werte beschrieben werden können. Zu diesem Datentyp zählen unter anderen textuelle Enumerationen aber unter Umständen auch eine begrenzte Abfolge von Integerwerten. In der Regel bewegt sich der Datenwertbereich diskreter Datenvariablen zwischen einem bis wenigen Hundert Einzelwerten. Im Gegensatz zu den diskreten Datentypen basieren kontinuierliche bzw. numerische Datentypen auf Datendimensionen deren Variablen in einem weitgesteckten numerischen Wertebereich liegen. Typische Vertreter dieses Datentyps sind daher vor allem Dezimalwerte oder auch Datumsangaben, deren Wertebereich dabei zwischen einigen zehn bis theoretisch unendlich vielen Dateneinheiten variieren kann. Bevor im Folgenden der Mappingprozess der kontinuierlichen und diskreten Datentypen auf die gra- 134

19 6.2 Das InfVis-Programm phischen Dimensionen näher beschrieben wird, soll noch eine dritte Klasse von Datentypen erwähnt werden die Metadaten. Metadaten werden im Gegensatz zu den zuvor genannten Datentypen nicht auf visuelle Attribute abgebildet, da die darin enthaltene Information nur beschreibenden Charakter hat. Dabei kann es sich beispielsweise um Hyperlinks oder Base64-kodierte Bilder handeln. Datendimensionen mit Metainformation werden daher von InfVis gesondert behandelt und interpretiert und in der Detailansicht dargestellt (vgl. Abschnitt ) Orthogonale Raumachsen Stellvertretend für die drei Raumachsen wird an dieser Stelle das Einstellungsfenster für die x-achse beschrieben. Wie alle Mapping-Fenster enthält auch das x-optionsfenster einen Bereich (Abbildung 6-8, oben rechts), welcher Informationen über den Datentyp (kontinuierlich, numerisch), die Anzahl der einzelnen Datenwerte und den Namen der entsprechenden, abgebildeten Datendimension enthält. Dieser Bereich dient darüber hinaus auch zur Änderung der abgebildeten Datendimension. Auf die drei Raumachsen können sowohl kontinuierliche als auch kategorische Datenvariablen abgebildet werden. Während bei Vorlage kategorischer Variablen die diskreten Datenwerte in einem standardisierten Abstand auf den Achsen abgebildet werden, können numerische Daten direkt und entsprechend ihres Wertes aufgetragen werden. Darüber hinaus kann bei Vorlage numerischer Werte zwischen einer sogenannten nice numbers und einer Grenzwert-Skalierung gewählt werden. Bei Bedarf können numerische Werte auch in kategorischer Form aufgetragen werden, während der umgekehrte Fall natürlich ausgeschlossen ist. Das Optionsfenster enthält weitere Funktionen, mit denen die graphische Eigenschaften beeinflusst werden können. Nähere Informationen hierzu können dem InfVis-Handbuch entnommen werden. Abb. 6-8: InfVis: Einstellungsfenster für die x-achse. 135

20 6 Visuelle Data Mining-Applikationen Größe Die Größe der graphischen Objekte kann ebenfalls verwendet werden, um sowohl kontinuierliche als auch diskrete Datentypen darzustellen (Abbildung 6-9). Dabei gelten die gleichen Voraussetzungen wie beim Mapping der Datendimensionen auf die Raumachsen. Der Benutzer kann zudem die absolute Größendarstellung (maximale und minimale Ausdehnung der Szenenobjekte) mit Hilfe von Schiebereglern beeinflussen. Die Größe der graphischen Objekte sollte vor allem zur Repräsentation numerischer Daten verwendet werden, die der Wissenschaftler ohnehin als Größenangaben versteht. Eine entsprechende Datendimension wäre beispielweise die Reaktionsausbeute. Datendimensionen mit kategorischen Variablen sollten nur dann zum Einsatz kommen, wenn die Anzahl der diskreten Datenwerte klein ist und somit eine Unterscheidung der einzelnen Datenwerte durch den Benutzer noch gewährleistet ist. Abb. 6-9: InfVis: Einstellungsfenster für die Objektgröße Farbe Die Farbgebung der Datenobjekte spielt eine wichtige Rolle bei der Analyse und Identifikation von Mustern und Relationen, da sie die retinale Eigenschaft darstellt, die am leichtesten und besten zur Darstellung von Information genutzt werden kann. Dennoch müssen diverse physiologische und psychologische Aspekte beim Einsatz von Farben berücksichtigt werden. So existieren bei einigen Menschen physiologische Einschränkungen wie die Rot- Grün-Sehschwäche, was beim Einsatz bestimmter Farbkombinationen zu einer Fehlinterpretation der Datensätze führen kann. Darüber hinaus ist auch die visuelle Wahrnehmungsfähigkeit der Menschen sehr unterschiedlich ausgeprägt. So können Männer im Allgemeinen zwischen einer wesentlich geringeren Zahl von Farbwerten als Frauen unterscheiden, was insbesondere beim Abbilden kategorischer bzw. diskreter Datendimensionen berücksichtigt werden muss. Für eine detaillierte Betrachtung dieser Thematik sei an dieser Stelle das Buch von Colin Ware empfohlen [153]. 136

Suche schlecht beschriftete Bilder mit Eigenen Abfragen

Suche schlecht beschriftete Bilder mit Eigenen Abfragen Suche schlecht beschriftete Bilder mit Eigenen Abfragen Ist die Bilderdatenbank über einen längeren Zeitraum in Benutzung, so steigt die Wahrscheinlichkeit für schlecht beschriftete Bilder 1. Insbesondere

Mehr

Datenbank-basierte Webserver

Datenbank-basierte Webserver Datenbank-basierte Webserver Datenbank-Funktion steht im Vordergrund Web-Schnittstelle für Eingabe, Wartung oder Ausgabe von Daten Datenbank läuft im Hintergrund und liefert Daten für bestimmte Seiten

Mehr

TM1 mobile intelligence

TM1 mobile intelligence TM1 mobile intelligence TM1mobile ist eine hochportable, mobile Plattform State of the Art, realisiert als Mobile BI-Plug-In für IBM Cognos TM1 und konzipiert als Framework für die Realisierung anspruchsvoller

Mehr

Visual Business Intelligence Eine Forschungsperspektive

Visual Business Intelligence Eine Forschungsperspektive Visual Business Intelligence Eine Forschungsperspektive Dr. Jörn Kohlhammer Fraunhofer-Institut für Graphische Datenverarbeitung IGD Fraunhoferstraße 5 64283 Darmstadt Tel.: +49 6151 155 646 Fax.: +49

Mehr

Anleitung DONATSCH WebShare V02

Anleitung DONATSCH WebShare V02 Anleitung DONATSCH WebShare V02 1. Einleitung Ihr von uns gescanntes Objekt kann auf Wunsch via Webbrowser abgerufen werden. Sämtliche Scans sind einsehbar und es können Messungen darin durchgeführt werden.

Mehr

Business Intelligence und Geovisualisierung in der Gesundheitswirtschaft

Business Intelligence und Geovisualisierung in der Gesundheitswirtschaft Business Intelligence und Geovisualisierung in der Gesundheitswirtschaft Prof. Dr. Anett Mehler-Bicher Fachhochschule Mainz, Fachbereich Wirtschaft Prof. Dr. Klaus Böhm health&media GmbH 2011 health&media

Mehr

Anleitung zu Projekte

Anleitung zu Projekte Web Site Engineering GmbH Anleitung zu Projekte Projekte im WPS Version 4.3 Seite 1 Projekte verwalten...1 2 Projekt hinzufügen...4 3 Projekt löschen...9 4 Projekt ändern...9 5 Projektdaten drucken und

Mehr

[DIA] Webinterface 2.4

[DIA] Webinterface 2.4 [DIA] Webinterface 2.4 2 Inhalt Inhalt... 2 1. Einleitung... 3 2. Konzept... 4 2.1 Vorteile und Anwendungen des... 4 2.2 Integration in bestehende Systeme und Strukturen... 4 2.3 Verfügbarkeit... 5 3.

Mehr

KompetenzManager http://www.kompetenzmanager.ch/mah Manual für die Benutzung der Website

KompetenzManager http://www.kompetenzmanager.ch/mah Manual für die Benutzung der Website KompetenzManager http://www.kompetenzmanager.ch/mah Manual für die Benutzung der Website Inhalt Inhalt... 1 1. Anmelden beim Kompetenzmanager... 3 2. Erstellen eines neuen Kompetenzprofils... 4 2.1. Wizard

Mehr

Unlimited Controlling

Unlimited Controlling smcolap Unlimited Controlling Heute müssen beliebige Bereiche eines Unternehmens schnell und effizient analysiert werden. Dabei darf es keine Rolle spielen, wo die Daten liegen und in welcher Relation

Mehr

Apparo Fast Edit Datenmanagement mit der Standalone Version Technische Übersicht

Apparo Fast Edit Datenmanagement mit der Standalone Version Technische Übersicht Apparo Fast Edit Datenmanagement mit der Standalone Version Technische Übersicht 2 Apparo Fast Edit ist die das Standardprogramm für unternehmensweite Dateneingabe, mit der Sie Daten ändern, importieren

Mehr

Vereinfachen Sie komplexe Vorgänge durch vielfältige intuitive und professionelle Diagrammwerkzeuge.

Vereinfachen Sie komplexe Vorgänge durch vielfältige intuitive und professionelle Diagrammwerkzeuge. Versionsvergleich Vergleichen Sie die Hauptfunktionalitäten der Microsoft -Version zur Diagrammerstellung mit ihren Vorgängerversionen und überzeugen Sie sich, wie Sie und Ihr Geschäft von einem Upgrade

Mehr

Handbuch zu AS Connect für Outlook

Handbuch zu AS Connect für Outlook Handbuch zu AS Connect für Outlook AS Connect für Outlook ist die schnelle, einfache Kommunikation zwischen Microsoft Outlook und der AS Datenbank LEISTUNG am BAU. AS Connect für Outlook Stand: 02.04.2013

Mehr

http://www.nvu-composer.de

http://www.nvu-composer.de Kapitel 16 Seite 1 Ein portabler Web-Editor Wer viel Zeit in eine Website investieren will ist gut beraten, eine professionelle Software für Webdesigner zu beschaffen. Diese Programme sind sehr leistungsfähig,

Mehr

Ad hoc - Reports. Case Study. ComfortSQL Query-Edition versus Ms-Excel

Ad hoc - Reports. Case Study. ComfortSQL Query-Edition versus Ms-Excel Ad hoc - Reports ComfortSQL Query-Edition versus Ms-Excel Ein großes österreichisches Unternehmen sieht sich Herausforderungen hinsichtlich häufig zu erledigender, aber nicht standardisierten DB-Reports

Mehr

HIS-LSF-Mitarbeiter-Daten in TYPO3-Webauftritten

HIS-LSF-Mitarbeiter-Daten in TYPO3-Webauftritten April 2012 Die Mitarbeiter-Daten der LUH werden in dem Einrichtungs- und Personenverzeichnis HIS-LSF verwaltet. Diese Daten können über eine Schnittstelle in die TYPO3-Websites einer Einrichtung eingebunden

Mehr

tfacet: Hierarchisch-facettierte Exploration semantischer Daten mit Hilfe bekannter Interaktionskonzepte

tfacet: Hierarchisch-facettierte Exploration semantischer Daten mit Hilfe bekannter Interaktionskonzepte IVDW-Workshop 2011, Berlin (6. Oktober) Institut für Visualisierung und Interaktive Systeme tfacet: Hierarchisch-facettierte Exploration semantischer Daten mit Hilfe bekannter Interaktionskonzepte Philipp

Mehr

Datenvisualisierung ohne Grenzen?

Datenvisualisierung ohne Grenzen? Datenvisualisierung ohne Grenzen? Zürich explorer Schweizer Tage der öffentlichen Vaduz 20. September 2012 Marco Sieber Agenda Ausgangslage Evaluation von Standardprogrammen Möglichkeiten und Grenzen von

Mehr

neximage DHTML Image Editor

neximage DHTML Image Editor product information http://www.neximage.com Idee, Konzept, Design, Umsetzung by nexbyte gmbh product profile neximage ist eine Bildbearbeitungssoftware, die für den Einsatz im Webbrowser konzipiert wurde.

Mehr

Erklärung der Webalizer Statistik

Erklärung der Webalizer Statistik Webhost Linux Erklärung der Webalizer Statistik - 1 - Erklärung der Webalizer-Statistik Dieses Dokument beschreibt den Aufbau der Auswertung der Webserver-Statistiken. Die Auswertungen sind täglich ab

Mehr

Thema. Aufgabenstellung. Fachpraktikum Visualisierung und interaktive Systeme WS 2011. Aufgabe 5: 3D-Tetris. 3D - Tetris.

Thema. Aufgabenstellung. Fachpraktikum Visualisierung und interaktive Systeme WS 2011. Aufgabe 5: 3D-Tetris. 3D - Tetris. Fachpraktikum Visualisierung und interaktive Systeme WS 2011 Aufgabe 5: 3D-Tetris Thema 3D - Tetris. Aufgabenstellung Die Aufgabe ist, ein Drei-Dimensionales Tetrisspiel zu konstruieren. Es werden zufällig

Mehr

Netzwerk Technologien in LabVIEW

Netzwerk Technologien in LabVIEW Netzwerk Technologien in LabVIEW von Dirk Wieprecht NI Germany Hier sind wir: Agenda Agenda Bedeutung des Ethernet für die Messtechnik Ethernet-basierende Technologien in LabVIEW Low Level- TCP/IP Objekt

Mehr

Microsoft Visio 2010 Funktionalitäten und Leistungen

Microsoft Visio 2010 Funktionalitäten und Leistungen Microsoft Visio 2010 Funktionalitäten und Leistungen Die fortgeschrittenen Funktionen zur Diagrammerstellung von Visio 2010 helfen Ihnen, komplexe Inhalte und Zusammenhänge schneller und einfacher zu vermitteln.

Mehr

Online-Ansichten und Export Statistik

Online-Ansichten und Export Statistik ACS Data Systems AG Online-Ansichten und Export Statistik (Version 10.08.2009) Buchhaltung für Schulen ACS Data Systems AG Bozen / Brixen / Trient Tel +39 0472 27 27 27 obu@acs.it 2 Inhaltsverzeichnis

Mehr

Browser Grid Funktionalitäten

Browser Grid Funktionalitäten Browser Grid Funktionalitäten Die Browser Grid Funktionalitäten können durch rechts Klick auf dem Grid eines Browsers aufgerufen werden. Fig. 1 Die erste Option Gruppe (bis zur ersten linie in Fig.1) enthält

Mehr

A-Plan 12.0. Zeiterfassung 2.0. Ausgabe 1.1. Copyright. Warenzeichenhinweise

A-Plan 12.0. Zeiterfassung 2.0. Ausgabe 1.1. Copyright. Warenzeichenhinweise A-Plan 12.0 Zeiterfassung 2.0 Ausgabe 1.1 Copyright Copyright 1996-2014 braintool software gmbh Kein Teil dieses Handbuches darf ohne ausdrückliche Genehmigung von braintool software gmbh auf mechanischem

Mehr

Analyse alt- und mittelpaläolithischer Steinartefaktinventare mittels Parallelkoordinatenplots

Analyse alt- und mittelpaläolithischer Steinartefaktinventare mittels Parallelkoordinatenplots Einleitung Analyse alt- und mittelpaläolithischer Steinartefaktinventare mittels Parallelkoordinatenplots von Irmela Herzog Im Rahmen der Herbsttagung der AG DANK (Datenanalyse und Numerische Klassifikation)

Mehr

UI-Testing mit Microsoft Test Manager (MTM) Philip Gossweiler / 2013-04-18

UI-Testing mit Microsoft Test Manager (MTM) Philip Gossweiler / 2013-04-18 UI-Testing mit Microsoft Test Manager (MTM) Philip Gossweiler / 2013-04-18 Software Testing Automatisiert Manuell 100% 70% 1 Überwiegender Teil der Testing Tools fokusiert auf automatisiertes Testen Microsoft

Mehr

Asklepius-DA Die intelligente Technologie für die umfassende Analyse medizinischer Daten Leistungsbeschreibung

Asklepius-DA Die intelligente Technologie für die umfassende Analyse medizinischer Daten Leistungsbeschreibung Asklepius-DA Die intelligente Technologie für die umfassende Analyse medizinischer Daten Leistungsbeschreibung Datei: Asklepius DA Flyer_Leistung_2 Seite: 1 von:5 1 Umfassende Datenanalyse Mit Asklepius-DA

Mehr

Telephone Integration für Microsoft CRM 4.0 (TI)

Telephone Integration für Microsoft CRM 4.0 (TI) Telephone Integration für Microsoft CRM 4.0 (TI) Benutzerhandbuch Der Inhalt des Dokuments ist Änderungen vorbehalten. Microsoft und Microsoft CRM sind registrierte Markenzeichen von Microsoft Inc. Alle

Mehr

SAP BW + Microsoft Excel Viel genutzt, oft unterschätzt

SAP BW + Microsoft Excel Viel genutzt, oft unterschätzt Corporate Performance Management SAP BW + Microsoft Excel Viel genutzt, oft unterschätzt Martin Krejci, Manager CPM Matthias Schmidt, BI Consultant Kristian Rümmelin, Senior BI Consultant Braincourt GmbH

Mehr

Messdaten auswerten und visualisieren 5 Tipps, die passende Darstellungstechnik für ein Messsystem zu finden

Messdaten auswerten und visualisieren 5 Tipps, die passende Darstellungstechnik für ein Messsystem zu finden Messdaten auswerten und visualisieren 5 Tipps, die passende Darstellungstechnik für ein Messsystem zu finden 27.05.13 Autor / Redakteur: Nach Unterlagen von National Instruments / Hendrik Härter Messdaten

Mehr

17.2 MS-Access Projekte

17.2 MS-Access Projekte 964 Von MS-Access 2000 zum SQL-Server 17.2 MS-Access Projekte MS-Access-Projekte, die die Dateiendung adp besitzen, werden als Front-End-Anwendung verwendet. Für die Back-End-Seite gibt es mehrere Möglichkeiten.

Mehr

Weiterentwicklung digitaler Bibliothekssysteme zu OpenArchives-Systemen

Weiterentwicklung digitaler Bibliothekssysteme zu OpenArchives-Systemen Weiterentwicklung digitaler Bibliothekssysteme zu OpenArchives-Systemen Osnabrück, 2003-03-13 Prof. Dr. G. Specht, U Ulm Dipl.-Inform. Michael G. Bauer, TU München 1. OMNIS/2 Motivation 2. Übersicht über

Mehr

Die Laborjournalführungs-Software professionell - zuverlässig

Die Laborjournalführungs-Software professionell - zuverlässig Produktinformation Die Laborjournalführungs-Software professionell - zuverlässig Integration von InfoChem ICEdit, ensochemeditor, MDL ISIS / Draw und CS ChemDraw Optional mit Schnittstelle zu anderen Datenbanksystemen

Mehr

WIRIS quizzes Datenbank, Mathematik für Moodle Quiz

WIRIS quizzes Datenbank, Mathematik für Moodle Quiz WIRIS quizzes Datenbank, Mathematik für Moodle Quiz Carles Aguiló Maths for More WIRIS quizzes verbessert die Funktionalität von Moodle Quiz in der Mathematik und in anderen wissenschaftlichen Themengebieten.

Mehr

Bedienung von BlueJ. Klassenanzeige

Bedienung von BlueJ. Klassenanzeige Im Folgenden werden wichtige Funktionen für den Einsatz von BlueJ im Unterricht beschrieben. Hierbei wird auf den Umgang mit Projekten, Klassen und Objekten eingegangen. Abgeschlossen wird dieses Dokument

Mehr

Anleitung zum Applet Schiefer Wurf

Anleitung zum Applet Schiefer Wurf Anleitung zum Applet: Schiefer Wurf 1 Anleitung zum Applet Schiefer Wurf Bearbeitung von: Mathias Hartner SS 2009 Studiengang: Elektronik und Informationstechnik Betreuung durch: Prof. Dr. Wilhelm Kleppmann

Mehr

Interaktive Plots. 2. Theorie und Beispiele. Motivation. 4. Fazit. 3. iplots. Gliederung. Fragen:

Interaktive Plots. 2. Theorie und Beispiele. Motivation. 4. Fazit. 3. iplots. Gliederung. Fragen: Interaktive Plots Peter Mayer betreut durch: Armin Monecke 13. Januar 2011 LMU München, Institut für Statistik, Wintersemester 10/11, Seminar: Graphiken in R im Bachelor-Studiengang 1 Motivation Datensatz

Mehr

Microsoft Access 2010 Bilder

Microsoft Access 2010 Bilder Microsoft Access 2010 Bilder Hyperlinks... arbeiten ähnlich wie ein Link in einer Webseite. sind ein Verweis auf eine Datei (access2010\material\beispiel\tabledevelop\automat.accdb). können ein Verweis

Mehr

1 Einleitung. Betriebswirtschaftlich administrative Systeme

1 Einleitung. Betriebswirtschaftlich administrative Systeme 1 1 Einleitung Data Warehousing hat sich in den letzten Jahren zu einem der zentralen Themen der Informationstechnologie entwickelt. Es wird als strategisches Werkzeug zur Bereitstellung von Informationen

Mehr

Konzepte zur Datenhaltung für Webseiten in einem Web-Content- Management-System

Konzepte zur Datenhaltung für Webseiten in einem Web-Content- Management-System Konzepte zur Datenhaltung für Webseiten in einem Web-Content- Management-System Web-Content-Management-Systeme () dienen dazu, komplexe Websites zu verwalten und den Autoren einzelner Webseiten möglichst

Mehr

Glossarverwaltung GV3

Glossarverwaltung GV3 Glossarverwaltung GV3 Designbeschreibung VQWiki Leszek Kotas Sebastian Knappe Gerrit Mattausch Raimund Rönn 23. Mai 2004 Inhaltsverzeichnis 1 Allgemeines 3 1.1 Kurzcharakteristik.................................

Mehr

Lernplattform LOGINEO/Moodle Anleitung für Studierende

Lernplattform LOGINEO/Moodle Anleitung für Studierende Lernplattform LOGINEO/Moodle Anleitung für Studierende 2 Inhalt Seite 1) Internetadresse, Benutzerkennung und Passwort 3 2) Die LOGINEO Dienste 4 Überblick Ändern des Passwortes 3) Die Lernplattform Moodle

Mehr

Projekt AGB-10 Fremdprojektanalyse

Projekt AGB-10 Fremdprojektanalyse Projekt AGB-10 Fremdprojektanalyse 17. Mai 2010 1 Inhaltsverzeichnis 1 Allgemeines 3 2 Produktübersicht 3 3 Grundsätzliche Struktur und Entwurfsprinzipien für das Gesamtsystem 3 3.1 Die Prefuse Library...............................

Mehr

Handbuch DrahtexLabelwriter 3.0

Handbuch DrahtexLabelwriter 3.0 Handbuch DrahtexLabelwriter 3.0 Inhaltsverzeichnis INSTALLATION 3 DER PROGRAMMSTART 7 DIE PROGRAMMOBERFLÄCHE 8 DIE STARTSEITE DES PROGRAMMES 8 DIE PROGRAMMSYMBOLLEISTE 9 EIN NEUES PROJEKT ERSTELLEN 10

Mehr

Der Website-Generator

Der Website-Generator Der Website-Generator Der Website-Generator im Privatbereich gibt Ihnen die Möglichkeit, schnell eine eigene Website in einheitlichem Layout zu erstellen. In Klassen, Gruppen und Institutionen können auch

Mehr

Data Mining-Projekte

Data Mining-Projekte Data Mining-Projekte Data Mining-Projekte Data Mining stellt normalerweise kein ei nmaliges Projekt dar, welches Erkenntnisse liefert, die dann nur einmal verwendet werden, sondern es soll gewöhnlich ein

Mehr

Excel-Anwendung Lagerverwaltung

Excel-Anwendung Lagerverwaltung Excel-Anwendung Lagerverwaltung 1. Eigenschaften 2. Installation 3. Makros in Excel 2010 aktivieren 4. Hinweise zur Eingabe der Daten 5. Dateneingabe 6. Suchblatt 7. Autor 1. Eigenschaften (zurück) Lagerverwaltung

Mehr

Welche Edition von Visio 2010 ist für Sie am besten geeignet?

Welche Edition von Visio 2010 ist für Sie am besten geeignet? Welche Edition von 2010 ist für Sie am besten geeignet? Vergleichen Sie die wichtigsten jeder Microsoft 2010-Edition, und erfahren Sie, welche für Sie und Ihr Unternehmen geeignet ist. Wichtige Vorlagen

Mehr

Integration Services - Dienstarchitektur

Integration Services - Dienstarchitektur Integration Services - Dienstarchitektur Integration Services - Dienstarchitektur Dieser Artikel solle dabei unterstützen, Integration Services in Microsoft SQL Server be sser zu verstehen und damit die

Mehr

Dokumentation für die Arbeit mit dem Redaktionssystem (Content Management System -CMS) zur Wartung Ihrer Homepage (Website)

Dokumentation für die Arbeit mit dem Redaktionssystem (Content Management System -CMS) zur Wartung Ihrer Homepage (Website) Dokumentation für die Arbeit mit dem Redaktionssystem (Content Management System -CMS) zur Wartung Ihrer Homepage (Website) Redaktion Mit der Redaktion einer Webseite konzentrieren Sie sich auf die inhaltliche

Mehr

ANSOFKOP-Verkauf Anwendersoftware für Kopierer

ANSOFKOP-Verkauf Anwendersoftware für Kopierer ANSOFKOP-Verkauf Anwendersoftware für Kopierer Kundenverwaltung Angebotsverwaltung Terminverwaltung Gerätetechnik Serienbrieferstellung René Gladis Badeteichstraße 55 39126 Magdeburg Tel.: (03 91) 5 05

Mehr

Benutzerhandbuch ABBREV:X. Eine kompakte Anleitung zur effizienten Arbeit mit Abkürzungen

Benutzerhandbuch ABBREV:X. Eine kompakte Anleitung zur effizienten Arbeit mit Abkürzungen Benutzerhandbuch ABBREV:X Eine kompakte Anleitung zur effizienten Arbeit mit Abkürzungen ABBREV:X Effizientes Arbeiten mit Abkürzungen ABBREV:X unterstützt Sie bei der Arbeit mit und der Verwaltungen von

Mehr

Bilder im Internet. Hans Magnus Enzensberger

Bilder im Internet. Hans Magnus Enzensberger Kapitel 4 Alle reden von Kommunikation, aber die wenigsten haben sich etwas mitzuteilen. Hans Magnus Enzensberger Bilder im Internet Nach der etwas umfangreichen vorangehenden Lektion zum Ausklang der

Mehr

FME Desktop. Data in Motion

FME Desktop. Data in Motion FME Desktop Data in Motion Übersicht Reporting Ausführen, Debuggen, Inspizieren, Profilen Neuigkeiten bei Datenbanken Reporting Move Your Data Analysis Organized Reporting in FME Tabellenkalkulationen

Mehr

E-Mail-Archivierung für Microsoft Outlook und Exchange Server

E-Mail-Archivierung für Microsoft Outlook und Exchange Server windream Exchange E-Mail-Archivierung für Microsoft Outlook und Exchange Server 2 E-Mail-Archivierung für Microsoft Outlook und Exchange Server Das ständig wachsende Volumen elektronischer Mitteilungen

Mehr

Ziel: Ziel der Aufgabe Ziel ist es, die Funktionalitäten von qs-stat millennium, sowie die Beurteilung von Datensätzen kennen zu lernen.

Ziel: Ziel der Aufgabe Ziel ist es, die Funktionalitäten von qs-stat millennium, sowie die Beurteilung von Datensätzen kennen zu lernen. Datenqualität 1/19 Ziel: Ziel der Aufgabe Ziel ist es, die Funktionalitäten von qs-stat millennium, sowie die Beurteilung von Datensätzen kennen zu lernen. Ausgangssituation: Sie wollen anhand des Werteverlaufs

Mehr

Motivation. Inhalt. URI-Schemata (1) URI-Schemata (2)

Motivation. Inhalt. URI-Schemata (1) URI-Schemata (2) 14. URIs Uniform Resource Identifier 14-1 14. URIs Uniform Resource Identifier 14-2 Motivation Das WWW ist ein Hypermedia System. Es enthält: Resourcen (Multimedia Dokumente) Verweise (Links) zwischen

Mehr

Mein erstes Tableau-Dashboard. Tableau Software Schritt für Schritt kennenlernen und ein erstes Dashboard erstellen

Mein erstes Tableau-Dashboard. Tableau Software Schritt für Schritt kennenlernen und ein erstes Dashboard erstellen Tableau Software Schritt für Schritt kennenlernen und ein erstes Dashboard erstellen Vorgehensweise 1) Datenaufbereitung in Microsoft Excel 2) Tableau - Datenimport 3) Erstellung verschiedener Tableau-Arbeitsblätter

Mehr

Ausarbeitung zum Vortrag Java Web Start von Adrian Fülöp Fach: Komponentenbasierte Softwareentwicklung WS 06/07 Fachhochschule Osnabrück

Ausarbeitung zum Vortrag Java Web Start von Adrian Fülöp Fach: Komponentenbasierte Softwareentwicklung WS 06/07 Fachhochschule Osnabrück Ausarbeitung zum Vortrag Java Web Start von Adrian Fülöp Fach: Komponentenbasierte Softwareentwicklung WS 06/07 Fachhochschule Osnabrück Adrian Fülöp (297545) - 1 - Inhaltsverzeichnis: 1. Einführung 2.

Mehr

Softwaretool Data Delivery Designer

Softwaretool Data Delivery Designer Softwaretool Data Delivery Designer 1. Einführung 1.1 Ausgangslage In Unternehmen existieren verschiedene und häufig sehr heterogene Informationssysteme die durch unterschiedliche Softwarelösungen verwaltet

Mehr

Dataport IT Bildungs- und Beratungszentrum. HTML- Grundlagen und CSS... 2. XML Programmierung - Grundlagen... 3. PHP Programmierung - Grundlagen...

Dataport IT Bildungs- und Beratungszentrum. HTML- Grundlagen und CSS... 2. XML Programmierung - Grundlagen... 3. PHP Programmierung - Grundlagen... Inhalt HTML- Grundlagen und CSS... 2 XML Programmierung - Grundlagen... 3 PHP Programmierung - Grundlagen... 4 Java - Grundlagen... 5 Java Aufbau... 6 ASP.NET Programmierung - Grundlagen... 7 1 HTML- Grundlagen

Mehr

Berechnungen in Excel Zahlen, Formeln und Funktionen

Berechnungen in Excel Zahlen, Formeln und Funktionen René Martin Berechnungen in Excel Zahlen, Formeln und Funktionen ISBN-10: 3-446-41029-5 ISBN-13: 978-3-446-41029-9 Leseprobe Weitere Informationen oder Bestellungen unter http://www.hanser.de/978-3-446-41029-9

Mehr

Neuerungen im Enterprise Miner 5.2 & Text Miner 2.3

Neuerungen im Enterprise Miner 5.2 & Text Miner 2.3 Neuerungen im Enterprise Miner 5.2 & Text Miner 2.3 Copyright 2005, SAS Institute Inc. All rights reserved. Ulrich Reincke, SAS Deutschland Agenda Der Neue Enterprise Miner 5.2 Der Neue Text Miner 2.3

Mehr

xcall Technische Dokumentation

xcall Technische Dokumentation xcall Technische Dokumentation zu Version 4.x Autor: Martin Roth Erstelldatum: 14.08.2008 Version: 1.4 Seite 2 / 7 Zweck...3 Schnittstellenarchitektur...3 Outbound-Schnittstellen...3 Outlook...3 TwixTel...3

Mehr

Whitepaper Walkyre Enterprise Resource Manangement

Whitepaper Walkyre Enterprise Resource Manangement Whitepaper Walkyre Enterprise Resource Management Seite 1 Whitepaper Walkyre Enterprise Resource Manangement Stand 15.11.2004 Inhalt 1. Hinweis... 2 2. Grundsätzliches zur Funktionalität... 3 3. Der Walkyre-Client...

Mehr

In dieser Lektion erlernen Sie die Verwendung von Vorlagen, die Anwendung von Mastern sowie die Bearbeitung von Kopf- und Fußzeilen.

In dieser Lektion erlernen Sie die Verwendung von Vorlagen, die Anwendung von Mastern sowie die Bearbeitung von Kopf- und Fußzeilen. In dieser Lektion erlernen Sie die Verwendung von Vorlagen, die Anwendung von Mastern sowie die Bearbeitung von Kopf- und Fußzeilen. Was erfahren Sie in diesem Kapitel? Wie Sie den Folienmaster anwenden

Mehr

1.1 So sollten Sie Ihr Excel-Modell aufbauen!

1.1 So sollten Sie Ihr Excel-Modell aufbauen! 1.1 So sollten Sie Ihr Excel-Modell aufbauen! Die Möglichkeiten von Excel in Bezug auf den Aufbau von Modell für das Controlling / Finanzwesen sind nahezu unbegrenzt. Die Grenzen werden allein von der

Mehr

1.4 Portfolio-Analyse (Marktwachstums-Marktanteils-Portfolio)

1.4 Portfolio-Analyse (Marktwachstums-Marktanteils-Portfolio) FACHHOCHSCHULE LAUSITZ Prof. Dr.-Ing. M. Strunz Lehrgebiet Projektmanagement Übungsskript l 1.4 Portfolio-Analyse (Marktwachstums-Marktanteils-Portfolio) Zu den bekanntesten Instrumenten des strategischen

Mehr

SharePoint Foundation 2013. für Anwender. Dr. Benjamin S. Bergfort. 1. Ausgabe, November 2013

SharePoint Foundation 2013. für Anwender. Dr. Benjamin S. Bergfort. 1. Ausgabe, November 2013 SharePoint Foundation 2013 Dr. Benjamin S. Bergfort 1. Ausgabe, November 2013 für Anwender SHPAN2013 3 SharePoint Foundation 2013 für Anwender 3 SharePoint 2013 anwenden In diesem Kapitel erfahren Sie

Mehr

- 1 - LOGION CMS. MedienService Ladewig

- 1 - LOGION CMS. MedienService Ladewig - 1 - LOGION CMS MedienService Ladewig - 2 - Administration Einführung: Warum Online Redaktion einfach sein kann... Wer Informationen aufbereitet und verteilt, steht mit den Mitteln moderner Informationstechnologie

Mehr

Tutorial RODEON metric. Aufnahme Feuerwache

Tutorial RODEON metric. Aufnahme Feuerwache Tutorial RODEON metric Aufnahme Feuerwache 1 In diesem praxisorientierten Tutorial werden die einzelnen Bedienschritte kurz und anschaulich dargestellt detaillierte Beschreibungen können der Bedienungsanleitung

Mehr

In diesem Kapitel werden wir nun mehrere Anwendungen von XML in der betrieblichen Praxis vorstellen. Sie sollen XML bei der Arbeit zeigen.

In diesem Kapitel werden wir nun mehrere Anwendungen von XML in der betrieblichen Praxis vorstellen. Sie sollen XML bei der Arbeit zeigen. 181 In diesem Kapitel werden wir nun mehrere Anwendungen von XML in der betrieblichen Praxis vorstellen. Sie sollen XML bei der Arbeit zeigen. Wir beginnen mit dem Startup-Unternehmen Seals GmbH aus Frankfurt,

Mehr

OrthoWin ShapeDesigner Software-Anleitung

OrthoWin ShapeDesigner Software-Anleitung OrthoWin ShapeDesigner Software-Anleitung Inhalt ORTHEMA Seite 1 1 Einleitung...3 2 Menüsteuerung...3 3 Hauptfenster...4 4 Datei Menü...5 4.1 Neu und Öffnen...5 4.2 Speichern und Speichern unter...5 4.3

Mehr

Windows SharePoint Services als gemeinsamen Dateispeicher einrichten

Windows SharePoint Services als gemeinsamen Dateispeicher einrichten Windows SharePoint Services als gemeinsamen Dateispeicher einrichten (Engl. Originaltitel: Setting up Windows SharePoint Services as a Collaborative File Store) Dustin Friesenhahn Veröffentlicht: August

Mehr

Einstellungen des Windows-Explorers

Einstellungen des Windows-Explorers Einstellungen des Windows-Explorers Die Ordnerstruktur des Explorers Der Explorer ist der Manager für die Verwaltung der Dateien auf dem Computer. Er wird mit Rechtsklick auf Start oder über Start Alle

Mehr

Öffnen einer Suchanfrage / Abgeben eines Angebotes (Offene Anfragen)

Öffnen einer Suchanfrage / Abgeben eines Angebotes (Offene Anfragen) Öffnen einer Suchanfrage / Abgeben eines Angebotes (Offene Anfragen) Wenn sie sich eine Anfrage ansehen wollen, weil sie mehr darüber erfahren möchten, oder weil sie für diese Anfrage eine Angebot abgeben

Mehr

ECMS ionas 3 media edition Media Asset Management mit ionas 3 media edition

ECMS ionas 3 media edition Media Asset Management mit ionas 3 media edition Ihr Web-Auftritt oder Intranet-Portal enthält viele Bilder oder Dateien zum Download? Bilder sollen im CMS farblich nachbearbeitet, skaliert oder zugeschnitten werden? Sie wollen Media Assets in Kollektionen

Mehr

VRML Tools. Markus Czok, Carsten Rohde

VRML Tools. Markus Czok, Carsten Rohde VRML Tools Markus Czok, Carsten Rohde Viewer Viewer Def.: Englische Bezeichnung für (Datei-)Betrachter. Für die meisten im PC Bereich üblichen Datenformate gibt es derartige Viewer, die es erlauben den

Mehr

Technische Beschreibung: EPOD Server

Technische Beschreibung: EPOD Server EPOD Encrypted Private Online Disc Technische Beschreibung: EPOD Server Fördergeber Förderprogramm Fördernehmer Projektleitung Projekt Metadaten Internet Foundation Austria netidee JKU Linz Institut für

Mehr

Versuchsauswertung mit Polynom-Regression in Excel

Versuchsauswertung mit Polynom-Regression in Excel Versuchsauswertung mit Polynom-Regression in Excel Aufgabenstellung: Gegeben sei die in Bild 1 gezeigte Excel-Tabelle mit Messwertepaaren y i und x i. Aufgrund bekannter physikalischer Zusammenhänge wird

Mehr

SWN-NetT Webmail. Benutzerhandbuch für SWN-NetT Webmail. SWN-NetT Webmail finden Sie unter: http://webmail.swn-nett.de

SWN-NetT Webmail. Benutzerhandbuch für SWN-NetT Webmail. SWN-NetT Webmail finden Sie unter: http://webmail.swn-nett.de SWN-NetT Webmail Benutzerhandbuch für SWN-NetT Webmail SWN-NetT Webmail finden Sie unter: http://webmail.swn-nett.de Übersicht Einstieg... 2 Menü... 2 E-Mail... 3 Funktionen... 4 Auf eine neue Nachricht

Mehr

Outlook Web App 2010. Kurzanleitung. interner OWA-Zugang

Outlook Web App 2010. Kurzanleitung. interner OWA-Zugang interner OWA-Zugang Neu-Isenburg,08.06.2012 Seite 2 von 15 Inhalt 1 Einleitung 3 2 Anmelden bei Outlook Web App 2010 3 3 Benutzeroberfläche 4 3.1 Hilfreiche Tipps 4 4 OWA-Funktionen 6 4.1 neue E-Mail 6

Mehr

Ein Auszug aus... Studie. Content Management Systeme im Vergleich. Empfehlungen und Entscheidungshilfen für Unternehmensbereiche

Ein Auszug aus... Studie. Content Management Systeme im Vergleich. Empfehlungen und Entscheidungshilfen für Unternehmensbereiche Ein Auszug aus... Studie Content Management Systeme im Vergleich Empfehlungen und Entscheidungshilfen für Unternehmensbereiche Die komplette Studie ist bei amazon.de käuflich zu erwerben. Inhaltsverzeichnis

Mehr

Fertigprodukte. Bruno Blumenthal und Roger Meyer. 18. Juli 2003. Zusammenfassung

Fertigprodukte. Bruno Blumenthal und Roger Meyer. 18. Juli 2003. Zusammenfassung Fertigprodukte Bruno Blumenthal und Roger Meyer 18. Juli 2003 Zusammenfassung Dieses Dokument beschreibt die Fertigprodukte welche im Projekt NetWACS eingesetzt werden sollen. Es soll als Übersicht dienen

Mehr

PO-250. Fingerpulsoximeter. 1. Wie führe ich eine Echtzeitübertragung vom PULOX PO-250 zum PC durch und speichere meine Messdaten auf dem PC?

PO-250. Fingerpulsoximeter. 1. Wie führe ich eine Echtzeitübertragung vom PULOX PO-250 zum PC durch und speichere meine Messdaten auf dem PC? Mini-FAQ v1.5 PO-250 Fingerpulsoximeter 1. Wie führe ich eine Echtzeitübertragung vom PULOX PO-250 zum PC durch und speichere meine Messdaten auf dem PC? 2. Wie nehme ich mit dem PULOX PO-250 Daten auf

Mehr

1,11 1,12 1,13 1,14 1,15 1,16 1,17 1,17 1,17 1,18

1,11 1,12 1,13 1,14 1,15 1,16 1,17 1,17 1,17 1,18 3. Deskriptive Statistik Ziel der deskriptiven (beschreibenden) Statistik (explorativen Datenanalyse) ist die übersichtliche Darstellung der wesentlichen in den erhobenen Daten enthaltene Informationen

Mehr

Motivation. Themenblock: Data Preprocessing. Einsatzgebiete für Data Mining I. Modell von Gianotti und Pedreschi

Motivation. Themenblock: Data Preprocessing. Einsatzgebiete für Data Mining I. Modell von Gianotti und Pedreschi Motivation Themenblock: Data Preprocessing We are drowning in information, but starving for knowledge! (John Naisbett) Was genau ist Datenanalyse? Praktikum: Data Warehousing und Data Mining Was ist Data

Mehr

Projektthema: Modul Programmiersprachen (Java)

Projektthema: Modul Programmiersprachen (Java) Projektthema: Modul Programmiersprachen (Java) Thema: Fliegender Ball Entwickeln Sie ein Java- Programm mit dem Namen FliegenderBall. Dieses zeigt einen Ball, der sich über die Bildfläche bewegt und an

Mehr

Migration in Access 2010

Migration in Access 2010 Inhalt dieses Handbuchs Microsoft Microsoft Access 2010 unterscheidet sich im Aussehen deutlich von Access 2003. Daher wurde dieses Handbuch erstellt, damit Sie schnell mit der neuen Version vertraut werden.

Mehr

Handbuch J-EDI Viewer 2.0

Handbuch J-EDI Viewer 2.0 regiocom GmbH Marienstraße 1 39112 Magdeburg Handbuch J-EDI Viewer 2.0 Javabasierter EDI-Energy Dokumenten-Viewer Stand vom: 01.06.2015 Inhaltsverzeichnis 1 Einführung... 3 2 Installationsbeschreibung...

Mehr

Leckage-Überwachung LECKAGE - NACHTVERBRAUCH LECKAGE - VORLAGE

Leckage-Überwachung LECKAGE - NACHTVERBRAUCH LECKAGE - VORLAGE Mai, 2010 Leckage-Überwachung LECKAGE - NACHTVERBRAUCH Alle Messwerte werden in kurzen Intervallen (15 Minuten Werte), ausgelesen. Deshalb lässt sich eine präzise Verbrauchskurve für den jeweiligen Leitungsabschnitt

Mehr

Von ODBC zu OLE DB. Neue Möglichkeiten der Datenintegration. Harald Gladytz, Team Vertrieb ESRI Niederlassung Leipzig

Von ODBC zu OLE DB. Neue Möglichkeiten der Datenintegration. Harald Gladytz, Team Vertrieb ESRI Niederlassung Leipzig Von ODBC zu OLE DB Neue Möglichkeiten der Datenintegration Harald Gladytz, Team Vertrieb ESRI Niederlassung Leipzig Von ODBC zu OLE DB Begriffsbestimmung ODBC, OLE DB, COM, ADO... Unterschiede zwischen

Mehr

http://www.video2brain.com/de/products-612.htm

http://www.video2brain.com/de/products-612.htm Eine Datenbank zu erstellen ist nicht so einfach und intuitiv, wie einen Brief zu schreiben. Ein klein wenig theoretisches Wissen über Datenbankdesign ist für etwas größere Datenbanken unumgänglich. Lassen

Mehr

Data Mining im Internet

Data Mining im Internet Data Mining im Internet Dipl.-Dok. Helga Walter Bayer HealthCare, Wuppertal PH-R-EU Scientific Information and Documentation 1 Arten / Quellen wissenschaftlicher Information Strukturierte Informationen:

Mehr

HILFE Datei. UPC Online Backup

HILFE Datei. UPC Online Backup HILFE Datei UPC Online Backup Inhalt Login Screen......? Welcome Screen:......? Manage Files Screen:...? Fotoalbum Screen:.........? Online backup Client Screen...? Frequently Asked Questions (FAQ s)...?

Mehr

Graphing - SNMP DATA - MRTG II

Graphing - SNMP DATA - MRTG II Graphing - SNMP DATA - MRTG II Netzwerkmanagement Software hat sich in den letzten Jahren vom hilfreichen Produkt zur integralen Grundlage für den professionellen IT Betrieb gewandelt. Grosse und leistungsfähige

Mehr

Archivierung von digitalen Daten Lösungsansätze mit SIARD und OAIS

Archivierung von digitalen Daten Lösungsansätze mit SIARD und OAIS Archivierung von digitalen Daten Lösungsansätze mit SIARD und OAIS Informationsveranstaltung Forschungsarbeit im Bereich Historisierung und Archivierung von Geodaten Bern, 3. Juli 2009 Dr. K. Ohnesorge

Mehr

U P T I M E products. SAP-Archivierung

U P T I M E products. SAP-Archivierung U P T I M E products SAP-Archivierung Zerfifizierte Archiv-Schnittstelle Daten und Dokumente eines SAP-Systems können über den SAP Archive Link in ein Archivsystem ausgelagert und bei Bedarf wieder zurückgeladen

Mehr