Data Mining-Modelle und -Algorithmen



Ähnliche Dokumente
Neuerungen Analysis Services

So importieren Sie einen KPI mithilfe des Assistenten zum Erstellen einer Scorecard

Die Beschreibung bezieht sich auf die Version Dreamweaver 4.0. In der Version MX ist die Sitedefinition leicht geändert worden.

Softwaretechnologie -Wintersemester 2013/ Dr. Günter Kniesel

Anleitung - Archivierung

Ordner Berechtigung vergeben Zugriffsrechte unter Windows einrichten

POP -Konto auf iphone mit ios 6 einrichten

Task: Nmap Skripte ausführen

Big, Bigger, CRM: Warum Sie auch im Kundenmanagement eine Big-Data-Strategie brauchen

Virtueller Seminarordner Anleitung für die Dozentinnen und Dozenten

Reporting Services und SharePoint 2010 Teil 1

Allgemeine Hinweise: Hinweis:

ISA Server 2004 Protokollierung - Von Marc Grote. Die Informationen in diesem Artikel beziehen sich auf:

Bauteilattribute als Sachdaten anzeigen

Internet online Update (Internet Explorer)

Wie Sie mit PO Convert eine Rechnung aus einer Bestellung erstellen können.

pro4controlling - Whitepaper [DEU] Whitepaper zur CfMD-Lösung pro4controlling Seite 1 von 9

Würfelt man dabei je genau 10 - mal eine 1, 2, 3, 4, 5 und 6, so beträgt die Anzahl. der verschiedenen Reihenfolgen, in denen man dies tun kann, 60!.

Im Anschluss finden Sie einige Tipps für die ersten Schritte mit häufigen Aufgaben. Erste Schritte Serie

TechNote: Exchange Journaling aktivieren

FIS: Projektdaten auf den Internetseiten ausgeben

Mit der Maus im Menü links auf den Menüpunkt 'Seiten' gehen und auf 'Erstellen klicken.

Database Exchange Manager. Infinqa IT Solutions GmbH, Berlin Stralauer Allee Berlin Tel.:+49(0) Fax.:+49(0)

Web-Kürzel. Krishna Tateneni Yves Arrouye Deutsche Übersetzung: Stefan Winter

Schritt 1: Verwenden von Excel zum Erstellen von Verbindungen zu SQL Server Analysis Services-Daten

Installation und Einrichtung des Microsoft SQL Servers 2005 Express. Abb.1.0

Inkrementelles Backup

OP-LOG

Zeichen bei Zahlen entschlüsseln

Rechnung Angebot Zeiterfassung

Automatisches Beantworten von - Nachrichten mit einem Exchange Server-Konto

Microsoft Dynamics NAV 2013 R/2 Installationsanleitung. Inhalt: Begleitmaterial des ERP Übungsbuchs:

Sichere Anleitung Zertifikate / Schlüssel für Kunden der Sparkasse Germersheim-Kandel. Sichere . der

Handbuch ECDL 2003 Basic Modul 5: Datenbank Grundlagen von relationalen Datenbanken

In diesem Thema lernen wir die Grundlagen der Datenbanken kennen und werden diese lernen einzusetzen. Access. Die Grundlagen der Datenbanken.

Ihre Interessentendatensätze bei inobroker. 1. Interessentendatensätze

SCHRITT 1: Öffnen des Bildes und Auswahl der Option»Drucken«im Menü»Datei«...2. SCHRITT 2: Angeben des Papierformat im Dialog»Drucklayout«...

Windows Server 2008 (R2): Anwendungsplattform

Fachdidaktik der Informatik Jörg Depner, Kathrin Gaißer

Neue Kennwortfunktionalität. Kurzanleitung GM Academy. v1.0

Professionelle Seminare im Bereich MS-Office

mysql - Clients MySQL - Abfragen eine serverbasierenden Datenbank

Eine der Aktien hat immer einen höheren Gewinn als die andere Aktie. Ihre Aufgabe ist es diese auszuwählen.

Wie richten Sie Ihr Web Paket bei Netpage24 ein

IBM Software Demos Tivoli Provisioning Manager for OS Deployment

Lineargleichungssysteme: Additions-/ Subtraktionsverfahren

In diesem Tutorial lernen Sie, wie Sie einen Termin erfassen und verschiedene Einstellungen zu einem Termin vornehmen können.

Excel Pivot-Tabellen 2010 effektiv

SWOT Analyse zur Unterstützung des Projektmonitorings

Installationshilfe VisKalk V5

Integration Services - Dienstarchitektur

Schritt 1: Verwenden von Excel zum Erstellen von Verbindungen mit SQL Server-Daten

Musterlösung für Schulen in Baden-Württemberg. Windows 200x. Lehrerfortbildung. Pflege des Exchange-Servers. Johannes Kühn

Erstellen eines Formulars

I. Travel Master CRM Installieren

Durchführung der Netzwerk bzw. Mehrplatzinstallation

Installationsanleitung WibuKey Treiber

Installationsanleitung CLX.PayMaker Home

Wollen Sie einen mühelosen Direkteinstieg zum Online Shop der ÖAG? Sie sind nur einen Klick davon entfernt!

Updatehinweise für die Version forma 5.5.5

Dokumentation zum Spielserver der Software Challenge

Was meinen die Leute eigentlich mit: Grexit?

Wiederkehrende Bestellungen. Tipps & Tricks

Suche schlecht beschriftete Bilder mit Eigenen Abfragen

Anwenden eines Service Packs auf eine Workstation

Die Invaliden-Versicherung ändert sich

SharePoint Demonstration

ebanking Business Edition

Lehrer: Kurs wiederherstellen

Kostenstellen verwalten. Tipps & Tricks

DOKUMENTATION PASY. Patientendaten verwalten

NAS 259 Ihre Daten mit Remote Sync (Rsync) schützen

anleitung für einen 2Wire- Account im Microsoft Outlook 2007

Die Post hat eine Umfrage gemacht

Variablen & erweiterte Aktionen nutzen

Umfrage. Didaktischer Kommentar. Lernplattform

1 Mathematische Grundlagen

Installation des Authorware Webplayers für den Internet Explorer unter Windows Vista

EMC SourceOne TM für Microsoft SharePoint 7.1 Archivsuche Kurzreferenz

Upgrade auf die Standalone Editionen von Acronis Backup & Recovery 10. Technische Informationen (White Paper)

White Paper. Konfiguration und Verwendung des Auditlogs Winter Release

OKB Die MS SQL-Volltextsuche für organice SQL einrichten

Feiertage in Marvin hinterlegen

OWA Benutzerhandbuch. Benutzerhandbuch Outlook Web App 2010

Installation und Bedienung von vappx unter Android

ACDSee Pro 3-Tutorials: Versenden von Bilder an eine FTP-Site

Benutzerhandbuch. Leitfaden zur Benutzung der Anwendung für sicheren Dateitransfer.

Arbeiten mit dem Outlook Add-In

Richtlinien für das Design und das Bestellen von Nutzen für Leiterplatten im Pool

Datensicherung EBV für Mehrplatz Installationen

ISA Server 2004 Erstellen eines neuen Netzwerkes - Von Marc Grote

Willkommen bei KONTAKTMANAGEMENT INTERAKTIVE-TOUR

Leitfaden #1a. "zanox Publisher-Statistik" (next generation)

2. Einrichtung der ODBC-Schnittstelle aus orgamax (für 32-bit-Anwendungen)

Data Mining mit Microsoft SQL Server

Lernprogramm "Veröffentlichen von WMS- Services"

Lizenzierung von System Center 2012

Anti-Botnet-Beratungszentrum. Windows XP in fünf Schritten absichern

Transkript:

Data Mining-Modelle und -Algorithmen

Data Mining-Modelle und -Algorithmen Data Mining ist ein Prozess, bei dem mehrere Komponenten i n- teragieren. Sie greifen auf Datenquellen, um diese zum Training, für Tests oder für Vorhe rsagen zu verwenden. Sie definieren Data Mining-Strukturen und -Modelle und können dann Abfragen erstellen und Analysen durchführen.

Data Mining-Lösungen und -Projekte Um ein Data Mining-Projekt zu erstellen, müssen Sie Datenquellen, Data Mining-Strukturen und Data Mining-Modelle definieren. Das erstellte Data Mining-Projekt kann auch Testsätze zum Überprüfen des Modells enthalten. Nachdem Sie ein Projekt auf dem Server bereitgestellt haben, können Sie fortfahren, indem Sie in der Originallösung neue Modelle entwickeln und testen. Data Mining-Quelldaten Data Mining-Quelldaten Sie müssen keinen Cube oder andere spezielle Datenquellen verwenden, um das Data Mining ausführen zu können. Sie können das Data Mining für relationale Datentabellen oder andere beliebige Datenquellenschnell und einfach durchführen. Die Daten, die Sie beim Data Mining verwenden, werden nicht in der Data Mining-Lösung gespeichert. Es werden nur die Bindungen gespeichert. Die Daten können sich in einer Datenbank befinden, oder in einem CRM-System oder sogar einer Flatfile. Sie können auch Tabellen hinzufügen, die eine n:1-beziehung aufweisen, um geschachtelte Tabellenspalten zu erstellen. Sie haben die Möglichkeit, die Data Mining- Lösung fortlaufend mit neuen Daten zu aktualisieren, oder Sie können ein gut funktionierendes Modell bereitstellen und keine neuen Daten mehr hinzufügen. Sie können die Daten auch in Trainings- und Testdatensätze unterteilen, damit Sie Ihre Data Mining- Modelle mit einem repräsentativen, zufä;llig ausgewählten Satz von Daten testen können. Data Mining-Strukturen Data Mining-Strukturen Eine Data Mining- Struktur ist eine logische Datenstruktur, die die Datendomäne definiert, aus der die Miningmodelle erstellt werden. Eine einzelne Miningstruktur kann mehrere Miningmodelle unterstützen, die dieselbe Domäne verwenden. Sie können die Data Mining-Struktur auch in einen Trainings- und Testsatz partitionieren, indem Sie einen Prozentsatz oder eine Menge von Daten als HOLDOUT angeben. Eine Data Mining-Struktur kann geschachtelte Tabellen enthalten. In einer geschachtelten Tabelle werden weitere Details zu dem Fall bereitgestellt, der in der primären Datentabelle modelliert ist.

Data Mining-Modelle Data Mining-Modelle Ein Data Mining- Modell umfasst eine Kombination von Daten, einen Data Mining-Algorithmus und eine Auflistung von Parameter- und Filtereinstellungen, die sich auf die verwendeten Daten und die Art der Verarbeitung auswirken. Nachdem Sie die Struktur des Miningmodells festgelegt haben, verarbeiten Sie das Modell, indem Sie die leere Struktur mit den Mustern auffüllen, die das Modell beschreiben. Dies wird auch als Trainieren des Modells bezeichnet. Muster werden gefunden, indem auf die Originaldaten ein mathematischer Algorithmus angewendet wird. Mithilfe von Parametern kann jeder Algorithmus angepasst werden. Beim Erstellen neuer Data Mining-Modelle testen Sie diese iterativ, indem Sie Vorhersagen erstellen, und nehmen dann Änderungen vor, um die Ergebnisse zu optimieren. Eine Änderung kann z. B. das Hinzufügen zusätzlicher Daten oder das Ändern der Parameter des Modells sein, um eine bessere Datenanpassung zu erzielen. Data Mining-Algorithmen Der Data Mining-Algorithmus ist ein Mechanismus zur Erstellung eines Data Mining-Modells. Der Algorithmus analysiert zunächst Daten auf der Suche nach bestimmten Mustern und Trends, um ein Modell zu erstellen. Mithilfe der Ergebnisse dieser Analyse definiert der Algorithmus die Parameter für das Miningmodell. Diese Parameter werden dann für das gesamte Dataset übernommen, um aussagefähige Muster und ausführliche Statistiken zu extrahieren. Das von einem Algorithmus erstellte Miningmodell kann verschiedene Formen annehmen, einschließlich der folgenden: Eine Gruppe von Regeln, die beschreiben, wie Produkte bei einer Transaktion gruppiert werden. Ein Entscheidungsbaum, der vorhersagt, ob ein bestimmter Kunde ein Produkt kaufen wird. Ein mathematisches Modell zum Vorhersagen von Umsätzen. Eine Reihe von Clustern, die die Beziehungen der Fälle in einem Dataset beschreiben. Microsoft SQL Server Microsoft SQL Server Analysis Services stellt verschiedene Algorithmen bereit, die in den Data Mining-Projektmappen verwendet werden können. Diese Algorithmen sind eine Teilmenge aller Algorithmen, die für Data Mining verwendet werden können. Sie können darüber hinaus Algorithmen von Drittanbietern verwenden, die der Spezifikation OLE DB für Data Mining entsprechen.

Typen von Data Mining-Algorithmen Analysis Services enthält die folgenden Alg orithmentypen: Klassifikationsalgorithmen sagen basierend auf den anderen Attributen im Dataset mindestens eine diskrete Variable voraus. Ein Beispiel für einen Klassifikationsalgorithmus ist der Microsoft Decision Trees- Regressionsalgorithmen sagen basierend auf anderen Attribute im Dataset mindestens eine kontinuierliche Variable voraus. Ein Beispiel für einen Regressionsalgorithmus ist der Microsoft Time Series- Segmentierungsalgorithmen teilen Daten in Gruppen oder Cluster aus Elementen auf, die ä;hnliche Eigenschaften haben. Ein Beispiel für einen Segmentierungsalgorithmus ist der Microsoft Clustering- Zuordnungsalgorithmen suchen nach Korrelationen zwischen verschiedenen Attributen in einem Dataset. Die häufigste Anwendung dieser Algorithmusart besteht im Erstellen von Zuordnungsregeln, die für eine Warenkorbanalyse verwendet werden können. Ein Beispiel für einen Zuordnungsalgorithmus ist der Microsoft Association- Sequenzanalysealgorithmen fassen häufige Datensequenzen oder Periodizitäten wie z. B. einen Webpfadfluss zusammen. Ein Beispiel für einen Sequenzanalysealgorithmus ist der Microsoft Sequence Clustering- Anwenden der Algorithmen Es kann schwierig sein, den besten Algorithmus für eine bestimmte Geschäftsaufgabe auszuwählen. Während verschiedene Algorithmen zum Ausführen derselben Geschäftsaufgabe verwendet werden können, liefert jeder Algorithmus ein anderes Ergebnis und einige Algorithmen können mehr als eine Ergebnisart ergeben. Sie können z. B. den Microsoft Decision Trees-Algorithmus nicht nur für Vorhersagen verwenden, sondern auch als Möglichkeit, die Anzahl der Spalten in einem Dataset zu reduzieren, weil der Entscheidungsbaum Spalten identifizieren kann, die sich nicht auf das endgültige Miningmodell auswirken. Sie müssen die Algorithmen außerdem nicht unabhängig voneinander verwenden. In einer einzelnen Data Mining-Projektmappe können einige Algorithmen zum Durchsuchen von Daten und andere Algorithmen zum Vorhersagen bestimmter Ausgaben auf Grundlage dieser Daten verwendet werden. Sie können z. B. einen Clusteringalgorithmus zum Erkennen von Mustern verwenden, um Daten in mehr oder weniger homogene Gruppen aufzuteilen, und im Anschluss daran mit den Ergebnissen ein besseres Entscheidungsbaummodell erstellen. Sie können mehrere Algorithmen innerhalb einer Projektmappe zum Ausführen separater Aufgaben verwenden, z. B. können Sie mit einem Regressionsstrukturalgorithmus Finanzprognosen erstellen und eine Warenkorbanalyse mit einem regelbasierten Algorithmus ausführen.

Mithilfe von Miningmodellen können Werte vorhergesagt, Datenzusammenfassungen erstellt und verborgene Korrelationen gesucht werden. In der folgenden Tabelle finden Sie Empfehlungen zum Verwenden von Algorithmen für bestimmte Aufgaben, die Ihnen beim Auswählen der Algorithmen für eine Data Mining-Projektmappe helfen sollen. Vorhersagen eines diskreten Attributs Sie möchten z. B. vorhersagen, ob der Em pfänger einer Targeted Mailing -Kampagne ein Produkt kaufen wird: Microsoft Decision Trees-Algorithmus Microsoft Naive Bayes-Algorithmus Microsoft Clustering-Algorithmus Microsoft Neural Network-Algorithmus Vorhersagen eines kontinuierlichen Attributs Sie möchten z. B. den Verkaufstrend für das nächste Jahr vorhersagen. Microsoft Decision Trees-Algorithmus Microsoft Time Series-Algorithmus Vorhersagen einer Sequenz Sie möchten z. B. bei einer Unternehmenswebsite eine Clickstreamanalyse ausführen. Microsoft Sequence Clustering-Algorithmus Suchen von Gruppen aus allgemeinen Elementen in Transaktionen. Sie möchten z. B. die Warenkorbanalyse verwenden, um einem Kunden weitere Produkte vorzuschl agen. Microsoft Association-Algorithmus Microsoft Decision Trees-Algorithmus Suchen von Gruppen mit ähnlichen Elementen Sie möchten z. B. demografische Daten in Gruppen unterteilen, um die Beziehungen zwischen den Attributen besser zu verstehen Microsoft Clustering-Algorithmus Microsoft Sequence Clustering-Algorithmus