Business Intelligence und Data Mining

Ähnliche Dokumente
pro4controlling - Whitepaper [DEU] Whitepaper zur CfMD-Lösung pro4controlling Seite 1 von 9

Handbuch ECDL 2003 Basic Modul 5: Datenbank Grundlagen von relationalen Datenbanken

Professionelle Seminare im Bereich MS-Office

Schritt 1: Verwenden von Excel zum Erstellen von Verbindungen zu SQL Server Analysis Services-Daten

Schritt 1: Verwenden von Excel zum Erstellen von Verbindungen mit SQL Server-Daten

Suche schlecht beschriftete Bilder mit Eigenen Abfragen

Barrierefreie Webseiten erstellen mit TYPO3

Hilfe Bearbeitung von Rahmenleistungsverzeichnissen

ARCO SQL T5 - Business Intelligence

.htaccess HOWTO. zum Schutz von Dateien und Verzeichnissen mittels Passwortabfrage

Um zusammenfassende Berichte zu erstellen, gehen Sie folgendermaßen vor:

Leitfaden #1a. "zanox Publisher-Statistik" (next generation)

3. GLIEDERUNG. Aufgabe:

Urlaubsregel in David

Er musste so eingerichtet werden, dass das D-Laufwerk auf das E-Laufwerk gespiegelt

Handbuch ECDL 2003 Professional Modul 2: Tabellenkalkulation Arbeiten mit Pivot-Tabellen

White Paper WinLine "Business Intelligence"

Handbuch Fischertechnik-Einzelteiltabelle V3.7.3

So gehts Schritt-für-Schritt-Anleitung

mysql - Clients MySQL - Abfragen eine serverbasierenden Datenbank

12. Dokumente Speichern und Drucken

Hilfe zur Urlaubsplanung und Zeiterfassung

Verarbeitung der Eingangsmeldungen in einem Callcenter

1 PIVOT TABELLEN. 1.1 Das Ziel: Basisdaten strukturiert darzustellen. 1.2 Wozu können Sie eine Pivot-Tabelle einsetzen?

So importieren Sie einen KPI mithilfe des Assistenten zum Erstellen einer Scorecard

FIS: Projektdaten auf den Internetseiten ausgeben

Universal Dashboard auf ewon Alarmübersicht auf ewon eigener HTML Seite.

2. Einrichtung der ODBC-Schnittstelle aus orgamax (für 32-bit-Anwendungen)

Speicher in der Cloud

Bedingungen. Bedingungen. Bedingungen

Access [basics] Gruppierungen in Abfragen. Beispieldatenbank. Abfragen gruppieren. Artikel pro Kategorie zählen

Seite 1 von 14. Cookie-Einstellungen verschiedener Browser

Datenmigration K1Max (Exchange)

ISA Server 2004 Protokollierung - Von Marc Grote. Die Informationen in diesem Artikel beziehen sich auf:

In diesem Thema lernen wir die Grundlagen der Datenbanken kennen und werden diese lernen einzusetzen. Access. Die Grundlagen der Datenbanken.

Excel Pivot-Tabellen 2010 effektiv

Abamsoft Finos im Zusammenspiel mit shop to date von DATA BECKER

Kommunikations-Management

1 Möglichkeiten zur Darstellung von Daten

Ihre Interessentendatensätze bei inobroker. 1. Interessentendatensätze

1. Einführung. 2. Alternativen zu eigenen Auswertungen. 3. Erstellen eigener Tabellen-Auswertungen

PowerWeiss Synchronisation

Fachbericht zum Thema: Anforderungen an ein Datenbanksystem

5. Übung: PHP-Grundlagen

mobilepoi 0.91 Demo Version Anleitung Das Software Studio Christian Efinger Erstellt am 21. Oktober 2005

Persönliches Adressbuch

Inhalt. 1 Einleitung AUTOMATISCHE DATENSICHERUNG AUF EINEN CLOUDSPEICHER

Bedienungsanleitung: Onlineverifizierung von qualifiziert signierten PDF-Dateien

HTML5. Wie funktioniert HTML5? Tags: Attribute:

TECHNISCHE INFORMATION LESSOR LOHN/GEHALT BEITRAGSNACHWEIS-AUSGLEICH BUCH.-BLATT MICROSOFT DYNAMICS NAV

Content Management System mit INTREXX 2002.

Berechnungen in Access Teil I

Mit der Maus im Menü links auf den Menüpunkt 'Seiten' gehen und auf 'Erstellen klicken.

Handbuch zur Anlage von Turnieren auf der NÖEV-Homepage

Die Lernumgebung des Projekts Informationskompetenz

aviita reporting portal

Anwendungshinweise zur Anwendung der Soziometrie

Microsoft Access 2013 Navigationsformular (Musterlösung)

WinWerk. Prozess 6a Rabatt gemäss Vorjahresverbrauch. KMU Ratgeber AG. Inhaltsverzeichnis. Im Ifang Effretikon

1. Adressen für den Serienversand (Briefe Katalogdruck Werbung/Anfrage ) auswählen. Die Auswahl kann gespeichert werden.

Datenexport aus JS - Software

Kontakte Dorfstrasse 143 CH Kilchberg Telefon 01 / Telefax 01 / info@hp-engineering.com

Outlook Web App 2010 Kurzanleitung

Anleitung für die Registrierung und das Einstellen von Angeboten

ARCO Software - Anleitung zur Umstellung der MWSt

Outlook Vorlagen/Templates

In diesem Tutorial lernen Sie, wie Sie einen Termin erfassen und verschiedene Einstellungen zu einem Termin vornehmen können.

Die Beschreibung bezieht sich auf die Version Dreamweaver 4.0. In der Version MX ist die Sitedefinition leicht geändert worden.

Kapitel 4 Die Datenbank Kuchenbestellung Seite 1

Dokumentation von Ük Modul 302

FastBill Automatic. Dokumentation Versand. FastBill GmbH. Holteyer Straße Essen Telefon Telefax

Objektorientierte Programmierung für Anfänger am Beispiel PHP

Diese Ansicht erhalten Sie nach der erfolgreichen Anmeldung bei Wordpress.

Um ein solches Dokument zu erzeugen, muss eine Serienbriefvorlage in Word erstellt werden, das auf die von BüroWARE erstellte Datei zugreift.

Informatik 12 Datenbanken SQL-Einführung

Serien- mit oder ohne Anhang

Dazu stellen Sie den Cursor in die Zeile, aus der eine Überschrift werden soll, und klicken auf die gewünschte Überschrift.

AZK 1- Freistil. Der Dialog "Arbeitszeitkonten" Grundsätzliches zum Dialog "Arbeitszeitkonten"

Handbuch zum Excel Formular Editor

Installationsanleitung dateiagent Pro

GEVITAS Farben-Reaktionstest

Windows. Workshop Internet-Explorer: Arbeiten mit Favoriten, Teil 1

Handbuch zum Statistiktool Pentaho Stand: Dezember 2013

Agentur für Werbung & Internet. Schritt für Schritt: Newsletter mit WebEdition versenden

Binäre Bäume. 1. Allgemeines. 2. Funktionsweise. 2.1 Eintragen

Datenübernahme von HKO 5.9 zur. Advolux Kanzleisoftware

Warum beschäftigt sich ein Linux-Systemhaus mit der Installation von OTRS mit einem Microsoft SQL Server?

Lineargleichungssysteme: Additions-/ Subtraktionsverfahren

MS Excel 2010 Kompakt

1 Konto für HBCI/FinTS mit Chipkarte einrichten

Proxy. Krishna Tateneni Übersetzer: Stefan Winter

Programm GArtenlisten. Computerhinweise

Erste Schritte mit CVP 9.0

1.5 Umsatzsteuervoranmeldung

Outsourcing und Offshoring. Comelio und Offshoring/Outsourcing

Bauteilattribute als Sachdaten anzeigen

Anleitung servicedirekt. Anmeldung. Das einfache Überlauf Routing

einrichtung in den kaufmännischen Programmen der WISO Reihe

Software zum Registrieren und Auswerten von Projektzeiten im Netzwerk

Beschaffung mit. Auszug aus dem Schulungshandbuch: Erste Schritte im UniKat-System

Transkript:

Business Intelligence und Data Mining

Business Intelligence und Data Mining Unternehmen sollten über einen eigenen Prozess im Bereich Business Intelligence ve rfügen. Eine einfache ad-hoc- Auswertung einer Befragung ist normalerweise nur in sehr seltenen Fällen gewünscht oder zielführend. Stattdessen kann man eher davon ausgehen, dass auf der einen Seite Daten aus der betrieblichen Leistungserstellung (Rec h- nungswesen, Produktion, Auftrags- und Projektabwicklung etc.) mit weiteren Daten aus einer Befragung angereichert werden, um ein umfassenderes Bild über den aktuellen Stand und die Entwicklung verschiedener interessierender Kennzahlen oder Phänom e- ne zu erhalten, und dass auf der anderen Seite Untersuchungen auf diesen Daten s o- wie ihre Beschaffung nicht nur einmalig abläuft, sondern zum Zwecke des Vergleichs und der Ableitung von Ten denzen und Veränderungen wiederholt durchgeführt we r- den. Dazu stehen verschiedene Einzeltechniken zur Verfügung, welche sowohl auf st a- tistische Grundlagen zurückgreifen wie auch auf einfachen Mitteln der tabellarischen Datenverarbeitung beruhen. In diesem Abschnitt sollen nun verschiedene dieser Tec h- niken, die man dem Bereich Business Intelligence zuordnen würde, kurz porträtiert werden.

Berichte Die zentrale Plattform für die Darstellung von ausgewerteten Daten ist der Bericht. Er kann sowohl reine Auswertungen in tabellarischer und grafischer Form enthalten wie auch individuell formulierte oder durch Textbausteine zusammengesetzte Texte enthalten, welche das Zahlenmaterial textuell in einem Gutachten oder einer Beschreibung darstellen. Auch eine Verwendung von Kennzahlen, die als gewichtete Summe, Quotient oder Verhältnis von mehreren einzelnen anderen Zahlen auftreten, kommt als Zusammenfassung in Betracht. Berichte lassen sich nach einer Reihe von Kriterien unterscheiden, von denen einige in der nachfolgenden Übersicht enthalten sind. Auslieferungsart Berichte können in nahezu allen Formaten ausgeliefert werden, in denen Texte, Zahlen unddiagramme enthalten sein können. Dabei stechen einige besonders hervor, während andere wie insbesondere multimediale Verfahren eher ungebräuchlich sind. Eine typische Unterscheidung in diesem Bereich ist eine elektronische gegenüber einer gedruckten Auslieferung, wobei es bei elektronischen Formaten oft die zusätzliche Möglichkeit gibt, den Bericht auch zu drucken. Der entscheidende ergänzende Unterschied zwischen diesen beiden Formaten ist eher darin zu sehen, inwieweit auch interaktive Elemente im Bericht enthalten sind, die nicht in jedem Fall auch in einer gedruckten Form umgesetzt werden können. Ein Verweis auf einen Teilbericht lässt sich mit einem Textverweis auch drucken, doch ein interaktiver Wechsel von zusammenfassenden Daten zu einer Detaildarstellung inkl. der Möglichkeit einer spontanen Filterung ist ausschließlich in einer elektronischen Variante denkbar. Neben diesen beiden grundlegenden Formaten kann man noch Berichte dahingehend unterscheiden, ob sie als einzelne Datei bzw. als einzelnes Dokument ausgeliefert werden oder in einem anderen- Kontext eingebettet sind. Dies lässt sich insbesondere gut bei einer reinen HTML- Darstellung vorstellen, wobei nur der reine Ausdruck als PDF oder tatsächlich gedrucktes Dokument dann wieder zu einer einzelnen Darstellung führen würde, der ursprüngliche Bericht jedoch mehrals Teil eines Portal-Systems betrachtet würde.

Aufbau Berichte können sowohl in gedruckter wie auch elektronischer Form einen festen oder variablen Aufbau besitzen. Oftmals ist diese davon abhängig, wie und in welchen Abständen der Bericht erzeugt wird. Ein nur einmalig erzeugter Bericht kann zwangsläufig kein festes Format haben, da er ja individuell und zu einer einzigen Gelegenheit erstellt wurde. Wiederholt ausgelieferte Berichte sind allerdings im Regelfall möglichst vergleichbar und einheitlich formatiert, um bspw. leichter Vergleiche zwischen zwei Berichtsperioden vornehmen zu können und einen durch den gleichen Aufbau begünstigten Lerneffekt im Adressatenkreis zu bewirken. Sofern Berichte Elemente enthalten, die nur bei bestimmten Untergruppen aller Leser Interesse finden, ist es lohnenswert sie auch physisch immer gleichartig darzustellen und dies möglicherweise sogar bei einer eher seitenbasierten Darstellung auch in dieser Hinsicht zu fixieren. So ist es dann nach einigen Perioden möglich, über ein Inhaltsverzeichnis oder die Seitenzahl direkt einen bestimmten Bereich anzuspringen und nur diesen zu lesen, um andere weniger interessante Bereiche unberücksichtigt zu lassen. Bei sehr flexiblen Formen könnte man sich vorstellen, dass aufgrund unterschiedlicher Kriterien wechselnde Darstellunen entstehen. Bspw. könnte man sich vorstellen, dass Benutzer selbst ihre eigenen Berichte zusammenstellen, Berichtsteile nur ausgegeben werden, wenn bestimme Datengrenzen erreicht oder überschritten werden oder sogar zielgruppenspezifische Anpassungen vorgenommen werden.

Interaktivität Auslieferungsform und der Aufbau berührten fast zwangsläufig auch den Bereich der Interaktivität. Ein einfaches Beispiel für ein interaktives Element sind Verweise auf Unterberichte, besondere Berichtsteile oder sogar externe Quellen. In einem sehr anspruchsvollen Szenario wäre es denkbar, dass Leser gar keinen fertig aufbereiteten Bericht erhalten, sondern sich diesen Bericht vielmehr selbst elektronisch zusammenstellen und diese Zusammenstellung (Auswahl von Informationseinheiten, Formatierung, Filter und Darstellungsoptionen) als Profil speichern und so quasi einen eigenen Bericht aufbauen. Zwischen diesen beiden Extrempunkten lassen sich dann variantenreiche Abstufungen einordnen, wobei fast alle immer wieder als Voraussetzung eine elektronische Darstellung/Definition erfordern. Beispiele für Berichte bei Business Intelligence-Anwendungen

In der Abbildung ist ein tabellarischer Bericht enthalten, der mit MS SQL Server Reporting Services in HTML dargestellt und auch bei Bedarf in anderen Formaten wie PDF oder MS Excel exportiert werden kann. Diese serverbasierte Lösung ist ein Beispiel für ein ganzes Berichtssystem und nicht nur einen einzelnen Bericht. Zu einem solchen System gehören im Wesentlichen die beiden Komponenten Berichtsdefinition und Berichtsanzeige. Die Anzeige erfolgt hier im Regelfall elektronisch auf einer HTML-Webseite, die in einer eigenen Portal-Seite ausgewählt oder in einer selbst programmierten Anwendungen in einem integrierten Browser über die URL des Berichts integriert werden kann. In dieser speziellen Lösung wäre es auch möglich, den Bericht von vornherein in einem der möglichen Export-Formate wie insbesondere PDF oder MS Excel zu erzeugen und in einen Server-Ordner oder in das Email-Postfach der Adressaten zu übertragen. Man erkennt eine allgemeine Bedienleiste, in der solche Aktionen wie Zoom, Export, Suche im Bericht oder auch Parameterauswahl/-vorgabe durchgeführt werden können. Die Lösung ergänzt diese Aktionen noch um eine Ordnerstruktur sowie administrative Funktionen. Der Bericht selbst kann als einfache oder gegliederte Tabelle sowie in Form einer Matrix-/Pivot- Darstellung ausgeliefert werden. Alle gängigen Berichtssysteme bieten Möglichkeiten, mehrere Tabellen in einem Bericht zu erstellen, sie mit Grafiken/Diagrammen und Texten zu ergänzen sowie auch in Abhängigkeit von der Auslieferungsart interaktive Elemente zu erstellen. Dies könnten hier Navigation entlang einer Gliederung, dynamische Sortierung, Filterung über vorgegebene oder freie Werte sowie der Aufruf von Detaildaten, Unterberichten oder externen Informationen. Hier ähnelt dann ein solcher Bericht sehr einer datenorientierten Webseite. In der Abbildung erkennt man unten auch noch neben der Auslieferung in solche gängigen Formate wie PDF oder MS Excel für die eigener Sicherung, Weiterverarbeitung oder den Ausdruck die beiden weiteren Exportformate XML und CSV/Text. Diese beiden Formate ermöglichen dann manchmal besser noch als ein Export nach MS Excel die weitere Verarbeitung der Berichtsdaten. Dabei enthält die XML- Darstellung neben den Text-Daten auch die Formatierungs-/Layoutinformationen, sodass man nicht nur die einfachen Daten für eine weitere Verarbeitung erhält, sondern auch eigene Auslieferungsformate wie bspw. MS Powerpoint-Folien erstellen könnte. Dies erfordert allerdings typischerweise eigene Programmierung. Dieses Produkt erlaubt neben der Definition von solchen Berichten auch, so genannte Berichtsmodelle zu erstellen. Dabei veröffentlicht man Teile der ursprünglichen Datenbasis in Form von Tabellen mit thematisch angepassten Datenstrukturen und ggf. auch schon direkt abrufbaren Aggregaten (Häufigkeiten, Summen, Durchschnitten), die dann bspw. in MS Excel zu eigenen Berichtszwecken abgerufen werden können.

Data Warehousing und Würfel/Cubes Neben der Erstellung von Berichten direkt aus einer relationalen Datenquelle oder auf Basis von in einem Statistik-Programm aufbereiteten Daten gibt es auch noch die Möglichkeit, so genannte Würfel bspw. im Rahmen eines Data Warehouse-Systems aufzubauen. Dabei handelt es sich normalerweise um eine Technik, deren Einsatz bei sehr großen Datenmengen bekannt ist und damit auch normalerweise gedanklich in Verbindung gebracht wird. Tatsächlich ist es jedoch auch denkbar, dass man auch bei einem kleinen Datenbestand einen oder mehrere Würfel aufbaut, um die eigentlichen Vorteile dieser Technik zu nutzen. Diese liegen darin, dass interessierende Daten unter verschiedenen thematischen Blickwinkeln und unter verschiedenen inhaltlichen Dimensionen betrachtet werden können. Die Dimensionen enthalten einzelne Attribute/Felder, die darüber hinaus auch noch in Hierarchien auftreten können. Für Felder und Hierarchie-Elemente, die es inhaltlich zulassen, kann man dann mit verschiedenen Aggregatfunktionen (darunter sicherlich besonders oft Häufigkeit und Summe) die Daten von sehr zusammengefassten Werten bis hinunter zu einer sehr detaillierten Stufe betrachten sowie mit Zugriff auf die Werte entlang der Hierarchie oder mit freien Werten und den üblichen Operatoren Filterungen vornehmen. Die Besonderheit bei der Würfel-Technik (Cube) liegt dabei genau in dieser multidimensionalen Betrachtungsweise von Daten und einem schnellen Zugriff auch auf sehr große Datenbestände, die durch spezielle Speicheroptionen sowie einer teilweisen Vorausberechnung der Aggregatwerte erreicht wird. Die Einrichtung und der Betrieb eines Data Warehouse sowie die Gestaltung von Cubes ist eine anspruchsvolle Aufgabe, wird allerdings von vielfältigen Werkzeugen auch grafisch unterstützt. Die Abbildung zeigt, wie dies für den MS SQL Server mit den Analysis Services durchgeführt wird. Auf Basis einer vorhandenen Datenlandschaft, die aus einer oder mehreren Datenbanken von unterschiedlichen Herstellern bestehen kann, errichtet man thematisch orientierte abstrakte Datenmodelle. Sie können insbesondere verschiedene Datenquellen miteinander in einem neuen Datenmodell darstellen und dabei eine angepasste Feldauswahl, Feldberechnungen sowie optimierte Feldbenennungen und Bezüge besitzen. Dies führt zu einer Reihe von Datenquellensichten und einem vereinheitlichten Gesamt- Datenmodell.

Erstellung und Testen eines Würfels (Cubes) bei Business Intelligence-Projekten Ein Würfel setzt sich dann aus interessierenden Kenngrößen (Measures) zusammen, die typischerweise in Zahlen auftreten. In betrieblichen Zusammenhängen wären dies Verkäufe, Bestellungen, Vormerkungen, Anfragen, Kontaktzahlen und dergleichen. Im Hinblick auf Befragungen könnten dies auf der Detail-Ebene die kodierten Antworten zu Fragen einer

Befragung sein. Neben diesen Measures gibt es dann Dimensionen, wobei gerade in betrieblichen Themengebieten Zeit und Ort als Standard-Dimensionen auftreten. Diese beiden Dimensionen enthalten darüber hinaus auch noch Hierarchien, wobei bei der Zeit eine Standardhierarchie vorgegeben ist und beim Ort oftmals eigene Gruppierungszuordnungen neben den geographischen verwendet werden. Eine Dimension enthält alle Werte, für die Measures theoretisch ermittelt werden können. Zusätzlich hat man in Abhängigkeit von der inhaltlichen Bedeutung eines Measure die Option, Aggregate für einen Wert oder einen Wert auf einer bestimmten Hierarchiestufe berechnen zu lassen. Neben diesen beiden kennzeichnenden Bestandteilen eines Würfels gibt es je nach Produkt noch weitere. Von diesen sind Kennzahlen sehr häufig verlangt, denn sie erlauben die Berechnung und Ermittlung von Werten, die außerhalb der Dimensionen/Hierarchien angesiedelt sind und typischerweise mit (komplexen) Berechnungsformeln ermittelt werden. Die Abbildung zeigt neben der Projektstruktur innerhalb des MS Visual Studio auch noch den Cube Browser, mit dem man testweise direkt in einem BI-Projekt auf den Würfel zu-greifen kann. Die Abfragen führen entweder zu einfachen Tabellendarstellungen oder zu mehrstufigen Matrix-/Pivotdarstellungen, wobei insbesondere die Leichtigkeit, mit der Spalten und Zeilen ausgewählt und vertauscht, Filter gesetzt und kombiniert sowie Maßzahlen in unterschiedlichen Aggregationsstufen abgerufen werden können, hervorgehoben werden muss. Die zweite Abbildung zeigt als ein mögliches Client-Programm MS Excel. Die Kombination aus Analysis Services und MS Excel macht es oftmals unnötig, einen anderen Klienten zu verwenden oder einen Klienten selbst zu programmieren. Als wesentliches Werkzeug steht hier die SQL-ähnliche Abfragesprache DMX, mit der Abfragen an einen Würfel gestellt werden können. MS Excel bietet an dieser Stelle ein umfangreiches Zusatzwerkzeug, mit dem man sich direkt mit einem Cube verbinden kann, um Abfragen zu machen. Auch eine lokale Kopie des Würfels ist möglich, um sozusagen offline Abfragen über eine grafische Oberfläche einzurichten, die im Wesentlichen dem Werkzeug für Pivot-Tabellen ähnelt.

Verwendung eines Würfels (Analysis Services-Cubes) mit MS Excel

Erweiterte Analysen mit Data Mining Neben einfachen beschreibenden statistischen Untersuchungen, die Datenmengen mit Hilfe von charakteristischen Größen verdichten wollen, oder mit tabellarischen und grafischen Auswertungen, welche insbesondere Häufigkeiten vergleichen und Tendenzen/Entwicklungen abbilden wollen, sowie Zusammenhangsanalysen, die den Zusammenhang/die Korrelation zwischen zwei oder mehr Variablen messen wollen, gibt es noch die ebenfalls mathematisch-statistisch begründeten Methoden des Data Mining. Sie haben keine darstellende Funktion, sondern bieten Techniken an, mit denen Muster in Daten erkannt werden können. Neben einfachen beschreibenden statistischen Untersuchungen, die Datenmengen mit Hilfe von charakteristischen Größen verdichten wollen, oder mit tabellarischen und grafischen Auswertungen, welche insbesondere Häufigkeiten vergleichen und Tendenzen/Entwicklungen abbilden wollen, sowie Zusammenhangsanalysen, die den Zusammenhang/die Korrelation zwischen zwei oder mehr Variablen messen wollen, gibt es noch die ebenfalls mathematisch-statistisch begründeten Methoden des Data Mining. Sie haben keine darstellende Funktion, sondern bieten Techniken an, mit denen Muster in Daten erkannt werden können. Die folgende Liste enthält einen kurzen Überblick über häufig eingesetzte Verfahren: Clusteranalyse anhand von nah zusammen liegenden Werten von Attributen werden Gruppen in der untersuchten Datenmenge gebildet Hauptkomponentenanalyse Faktorenanalyse einzelne Attribute von zu untersuchenden Objekten werden als Haupteinflussfaktoren ermittelt mehrere Attribute werden zu Einflussfaktoren zusammengefasst Assoziationsanalyse Beziehungen zwischen Daten werden über häufig gleichzeitig auftretende Attributwerte ermittelt Klassifikationsverfahren Strukturierung von Objekten in Klassen und Kategorien

Diskriminanzanalyse Einordnung von Objekten vorab nicht bekannter Klassenzugehörigkeit aufgrund von Wertunterschieden und ihren Abständen Entscheidungsbäume Ableitung von Baumstrukturen, die mehrstufige und hierarchische Entscheidungen aufgrund von Attributwerten abbilden Regressionsanalyse zwischen einer abhängigen und einer oder mehrerer unabhängigen Variablen werden Beziehungen abgeleitet MS SQL Server und Analysis Services mit Data Mining (1)

MS SQL Server und Analysis Services mit Data Mining (2) Die beiden Abbildungen geben einen allgemeinen Eindruck der grafischen Benutzeroberfläche, die sich im MS Visual Studio im Data Mining-Bereich eines Analysis Services-Projekt bietet.

Comelio GmbH Goethestraße 34 13086 Berlin Tel.: 030-8145622-00 Fax: 030-8145622-10 Web: www.comelio.com E-Mail: info@comelio.com