Seminar Business Intelligence Teil II. Data Mining & Knowledge Discovery



Ähnliche Dokumente
PPC und Data Mining. Seminar aus Informatik LV Michael Brugger. Fachbereich der Angewandten Informatik Universität Salzburg. 28.

Was ist Data Mining?

Data Mining als Arbeitsprozess

Tiefgreifende Prozessverbesserung und Wissensmanagement durch Data Mining

DISKUSSIONSBEITRÄGE DER FAKULTÄT FÜR BETRIEBSWIRTSCHAFTSLEHRE MERCATOR SCHOOL OF MANAGEMENT UNIVERSITÄT DUISBURG-ESSEN. Nr. 374

Business Intelligence und Geovisualisierung in der Gesundheitswirtschaft

Sendungen aufgeben > Briefe: Aufgabeverzeichnis Anleitung Auftragserfassung Dienstleister

Data Mining-Modelle und -Algorithmen

Data Warehouse Definition (1)

Internet Explorer Version 6

Sichere Anleitung Zertifikate / Schlüssel für Kunden der Sparkasse Germersheim-Kandel. Sichere . der

Spezialisierung Business Intelligence

Handbucherweiterung Zuschlag

Aufgabe 1: [Logische Modellierung]

Umsetzung der Anforderungen - analytisch

Data Mining-Projekte

Anleitung zur Bearbeitung von Prüferkommentaren in der Nachreichung

Dokumentation Data Dictionary (SIP)

Datenidentifikation und -synchronisation: Grundlage zur Erfüllung der Qualitätsanforderungen beim Datenaustausch zwischen Systemen

Inhalt. meliarts. 1. Allgemeine Informationen Administration Aufruf Das Kontextmenü Vorlagen...

Bei der Focus Methode handelt es sich um eine Analyse-Methode die der Erkennung und Abstellung von Fehlerzuständen dient.

Anleitung Lernobjekt-Depot (LOD)

Data Mining: Einige Grundlagen aus der Stochastik

Mitarbeiterbefragung als PE- und OE-Instrument

Projektsteuerung Projekte effizient steuern. Welche Steuerungsinstrumente werden eingesetzt?

Business Intelligence. Business Intelligence Seminar, WS 2007/08

Objektorientierter Software-Entwurf Grundlagen 1 1. Analyse Design Implementierung. Frühe Phasen durch Informationssystemanalyse abgedeckt

DCCP (Data Collection Cash Processing) Schaubild Version 1.0

eevolution Business Intelligence Oliver Rzeniecki COMPRA GmbH Programmierer & Datenbankadministrator

Data Mining Anwendungen und Techniken

Ermittlung von Assoziationsregeln aus großen Datenmengen. Zielsetzung

Visualisierung. Rückblick. Scientific Visualization vs. Informationsvisualisierung. Allgemeine Ziele und Anforderungen Prof. Dr.-Ing.

Unterrichtsmaterialien in digitaler und in gedruckter Form. Auszug aus: Übungsbuch für den Grundkurs mit Tipps und Lösungen: Analysis

Data/Information Quality Management

Anleitung Redmine. Inhalt. Seite 1 von 11. Anleitung Redmine

Dokumentenmanagement mit active.pdm

2. Konfiguration der Adobe Software für die Überprüfung von digitalen Unterschriften

Anmeldung als Affiliate bei Affilinet

MapReduce und Datenbanken Thema 15: Strom bzw. Onlineverarbeitung mit MapReduce

Hilfe zur Urlaubsplanung und Zeiterfassung

ESD einfach, schnell, digital. Electronic Software Distribution

Anleitung Redmine. Inhalt. Seite 1 von 11. Anleitung Redmine

Folgende Einstellungen sind notwendig, damit die Kommunikation zwischen Server und Client funktioniert:

SERVICE SUCHE ZUR UNTERSTÜTZUNG

Suche schlecht beschriftete Bilder mit Eigenen Abfragen

Christian Kurze BI-Praktikum IBM WS 2008/09

HQ Prozessvisualisierung

Das in diesem Werk enthaltene Programm-Material ist mit keiner Verpflichtung oder Garantie irgendeiner Art verbunden.

SQL Server 2012 und SharePoint im Unternehmenseinsatz. Referent Daniel Caesar

Stellvertretenden Genehmiger verwalten. Tipps & Tricks

Wichtige Information zur Verwendung von CS-TING Version 9 für Microsoft Word 2000 (und höher)

Mai Hauptseminar: Nichtrelationale Datenbanken Historisch-Kulturwissenschaftliche Informationsverarbeitung Universität zu Köln

Inventur. mit Microsoft Dynamics NAV 2013 R2

Betriebswirtschaftliches Beratungstool für Steuerberater Ziele, Inhalte und Struktur

Verkaufen Sie doch wo Sie wollen. Ihr einfacher Weg zu mehr Umsatz und dauerhaft steigendem Erfolg im E-Business

Durch Drücken des Buttons Bestätigen (siehe Punkt 2) wird Ihre an Ihr Outlookpostfach weiterleiten.

Business Application Framework für SharePoint Der Kern aller PSC-Lösungen

Customer Relationship Ana lyt ics

Datensicherung. mit. Ocster Backup Pro. it.kröger Hinweis:

Grundlegende Informationen zur Einrichtung des SSLVPN beim DSR-1000N/DSR-500N(FW 1.03B27).

Zimmertypen. Zimmertypen anlegen

AGROPLUS Buchhaltung. Daten-Server und Sicherheitskopie. Version vom b

Data Cube. Aggregation in SQL. Beispiel: Autoverkäufe. On-line Analytical Processing (OLAP) 1. Einführung. 2. Aggregation in SQL, GROUP BY

Installation & Konfiguration AddOn AD-Password Changer

Vorarlberger Standardschulinstallation Anbindung von Android Mobile Devices

Prof. Dr.-Ing. Rainer Schmidt 1

Data Mining Standards am Beispiel von PMML. Data Mining Standards am Beispiel von PMML

Was ist Analyse? Hannover, CeBIT 2014 Patrick Keller

W.WIINM32.11 (Datawarehousing) W.WIMAT03.13 (Statistik)

Lars Priebe Senior Systemberater. ORACLE Deutschland GmbH

Fragenkatalog Geschäftsmodellierung Grundlagen

Sage Start Zahlungsmethoden Anleitung. Ab Version

Anleitung zur Konstruktion eines Stegs mit Preci-Geschieben auf Klebebasis.

Fragen und Antworten

Business Intelligence Praktikum 1

Installation des edu-sharing Plug-Ins für Moodle

Data Mining und maschinelles Lernen

TBooking: Integration der Online-Buchung auf der eigenen Homepage. Version 1.0. Bayern Reisen & Service GmbH Im Gewerbepark D Regensburg

LSF-Anleitung für Studierende

Outlook Vorlagen/Templates

Installation und Bedienung von vappx unter ios

Master Data Management

Checkliste Webauftritt

TimeSafe Zeiterfassung. Version 2.5 (April 2009)

Business Intelligence für Controller

Fassade. Objektbasiertes Strukturmuster. C. Restorff & M. Rohlfing

Installation des edu- sharing Plug- Ins für Moodle

FOSD-Treffen 2012 Struktur- und Constraintbasierte Konfiguration

ClubWebMan Veranstaltungskalender

Willkommen im Online-Shop der Emser Therme GmbH

Lernende Suchmaschinen

Anleitung zur Excel-Anwendung Basisprämienberechnung

Gesetzliche Aufbewahrungspflicht für s

Die Anmeldung zum Prüfungsvorbereitungsportal von Westermann in fünf einfachen Schritten:

INFORMATION LIFECYCLE MANAGEMENT

Partnerportal Installateure Registrierung

Warum. Natural AnalyticsTM. wichtig ist

Kurzanleitung zur Softwareverteilung von BitDefender Produkten...2

In diesem Tutorial lernen Sie, wie Sie einen Termin erfassen und verschiedene Einstellungen zu einem Termin vornehmen können.

Elliptische Kurven in der Kryptographie

Transkript:

Seminar Business Intelligence Teil II Data Mining & Knowledge Discovery

Was ist Data Mining? Sabine Queckbörner

Was ist Data Mining? Data Mining Was ist Data Mining? Nach welchen Mustern wird gesucht? Wie wird gesucht? Knowledge Discovery in Databases (KDD) Der KDD-Prozess Gegenüberstellung Data Mining und KDD Online Analytical Processing (OLAP) Gegenüberstellung Data Mining und OLAP Problemfelder des Data Mining Übersicht

Data Mining Begriffsbestimmung Was ist Data Mining? Analyse großer mengen mit automatischen oder halbautomatischen Werkzeugen (Berry, Linoff) Methode zur Problemlösung um logische oder mathematische, zum Teil komplexe Beschreibungen von Mustern und Regelmäßigkeiten in sätzen zu entdecken (Decker, Focardy)

Data Mining Begriffsbestimmung Was ist Data Mining? Teilschritt des KDD-Prozesses, der aus der Anwendung von analysealgorithmen besteht und zu einer Auflistung von Mustern, die aus gewonnen wurden, führt (Fayyad, Piatetsky-Shapiro und Smyth) Data Mining als Anwendung von Algorithmen auf mit der Zielsetzung, Muster aus den zu extrahieren.

Data Mining Nach welchen Mustern wird gesucht Data Mining Was ist Data Mining? Nach welchen Mustern wird gesucht? Wie wird gesucht? Knowledge Discovery in Databases (KDD) Der KDD-Prozess Gegenüberstellung Data Mining und KDD Online Analytical Processing (OLAP) Gegenüberstellung Data Mining und OLAP

Data Mining Nach welchen Mustern wird gesucht Ausprägungen Regeln und Abhängigkeiten Gruppen (Cluster) Verbindungsmuster (Link) Zeitliche Muster (Sequence) Abweichungen Formeln und Gesetzmäßigkeiten

Data Mining Nach welchen Mustern wird gesucht Nicht alle gefundenen Muster sind für den Benutzer interessant! Nicht alle für den Benutzer relevanten Muster werden gefunden!

Data Mining Wie wird gesucht? Data Mining Was ist Data Mining? Nach welchen Mustern wird gesucht? Wie wird gesucht? Knowledge Discovery in Databases (KDD) Der KDD-Prozess Gegenüberstellung Data Mining und KDD Online Analytical Processing (OLAP) Gegenüberstellung Data Mining und OLAP Problemfelder des Data Mining

Data Mining Wie wird gesucht? Möglichkeiten Nach mehreren Mustern parallel suchen In verschiedenen Abstraktionsebenen suchen Nach verschiedenen Schwerpunkten

Data Mining Wie wird gesucht? Methoden Künstliche neuronale Netze Kohonen-Netze Lineare Regression Genetische Algorithmen CHAID Regelbasierte Systeme

KDD Data Mining Was ist Data Mining? Nach welchen Mustern wird gesucht? Wie wird gesucht? Knowledge Discovery in Databases Der KDD-Prozess Der KDD-Prozess Gegenüberstellung Data Mining und KDD Online Analytical Processing (OLAP) Gegenüberstellung Data Mining und OLAP Problemfelder des Data Mining

KDD Der KDD-Prozess Prozess zur Identifikation von Mustern Gültig Neuartig Potentiell nützlich Verständlich Wissen

KDD Der KDD-Prozess Auswahl Integration Bereinigung Reduktion Projektion Data Mining Interpretation Zieldaten Vorbereitete Transformierte Muster Wissen Auswahl Zieldaten

KDD Der KDD-Prozess Auswahl Integration Bereinigung Reduktion Projektion Data Mining Interpretation Zieldaten Vorbereitete Transformierte Muster Wissen Integration Bereinigung Zieldaten Vorbereitete

KDD Der KDD-Prozess Auswahl Integration Bereinigung Reduktion Projektion Data Mining Interpretation Zieldaten Vorbereitete Transformierte Muster Wissen Reduktion Projektion Vorbereitete Transformierte

KDD Der KDD-Prozess Auswahl Integration Bereinigung Reduktion Projektion Data Mining Interpretation Zieldaten Vorbereitete Transformierte Muster Wissen Data Mining Transformierte Muster

KDD Der KDD-Prozess Auswahl Integration Bereinigung Reduktion Projektion Data Mining Interpretation Zieldaten Vorbereitete Transformierte Muster Wissen Interpretation Muster Wissen

KDD Data Mining Was ist Data Mining? Nach welchen Mustern wird gesucht? Wie wird gesucht? Data Mining KDD Knowledge Discovery in Databases Der KDD-Prozess Gegenüberstellung Data Mining und KDD Online Analytical Processing (OLAP) Gegenüberstellung Data Mining und OLAP Problemfelder des Data Mining

KDD Data Mining KDD Auswahl Integration Bereinigung Reduktion Projektion Data Mining Interpretation Alle Zieldaten Vorbereitete Transformierte Muster Wissen Data Mining ist ein Teilschritt des KDD-Prozesses

OLAP Data Mining Was ist Data Mining? Nach welchen Mustern wird gesucht? Wie wird gesucht? Knowledge Discovery in Databases (KDD) Der KDD-Prozess Gegenüberstellung Data Mining und KDD Online Analytical Processing (OLAP) Gegenüberstellung Data Mining und OLAP Problemfelder des Data Mining

OLAP würfel n Dimensionen n Attribute Beispiel: Ort 3 Dimensionen: Ort, Zeit, Produkt Zeit Produkt

OLAP würfel n Dimensionen n Attribute Wertebereich kontinuierlich diskret Hierarchien Abstraktionsebenen

OLAP Hierarchien Beispiel: Hierarchie auf Attribut Zeit Jahr 2003 Quartal 1.Quartal 2003... 4. Quartal 2003 Januar 2003 Februar 2003 März 2003... Dezember 2003 Monat

OLAP Roll-Up Drill-Down Drill-Down 1.Quartal 2003 Januar 2003 Februar 2003 März 2003 Roll-Up

OLAP Roll-Up Drill-Down Ort Produkt Ort Produkt = Radio Slice Zeit Zeit Ort = KL Ort Zeit Produkt Zeit Produkt

OLAP Roll-Up Drill-Down Slice Dice Ort Produkt Ort = RLP Zeit = 4.Quartal Produkt = Rundfunkgeräte Ort Zeit Produkt Zeit

OLAP Roll-Up Drill-Down Slice Dice Rotate (Pivote)

OLAP Data Mining OLAP Data Mining Was ist Data Mining? Nach welchen Mustern wird gesucht? Wie wird gesucht? Knowledge Discovery in Databases (KDD) Der KDD-Prozess Gegenüberstellung Data Mining und KDD Online Analytical Processing (OLAP) Gegenüberstellung Data Mining und OLAP Problemfelder des Data Mining

OLAP Rennpferd Arbeitspferd OLAP = Arbeitspferd Data Mining = Rennpferd Data Mining OLAP

OLAP Data Mining OLAP Data Mining als Erweiterung des OLAP OLAP Data Mining Analyseziel notwendig (z.b. Hypothese) Kein Analyseziel notwendig (kann Hypothesen liefern) Ergebnis steht fest (z.b. Bestätigung der Hypothese) Ergebnis steht nicht fest, unbekannte Muster möglich müssen bekannt sein (Benutzer wählt aus) können vollkommen unbekannt sein Benutzerinteraktive Analyse (aktive Auswertung der ) Automatische Analyse (computergestützte Algorithmen) Ergebnis ist eine andere Darstellungsform der Ergebnis sind Zusammenhänge und Muster in den

OLAP OLAP Mining Data Mining OLAP integrierte, konsistente und gesäuberte Anwendung von Data-Mining-Algorithmen Interaktive Analyse und anschauliche Interpretation wie bei OLAP OLAP-Mining-Funktionen (Auszug) Cubing then Mining Mining then Cubing

Problemfelder Problemfelder des Data Mining Data Mining Was ist Data Mining? Nach welchen Mustern wird gesucht? Wie wird gesucht? Knowledge Discovery in Databases (KDD) Der KDD-Prozess Gegenüberstellung Data Mining und KDD Online Analytical Processing (OLAP) Gegenüberstellung Data Mining und OLAP Problemfelder des Data Mining

Problemfelder Problemfelder des Data Mining Speichergröße Problem: Lösung: Antwortzeit Problem: Lösung: passen nicht vollständig in den Speicher Algorithmen, die zum Beispiel in mehreren Durchgängen analysieren schnellere Analysen gewünscht kürzere Antwortzeiten des Systems parallele Analysetechniken Vielfalt der typen Problem: neue typen, Videos... Benutzerfreundlichkeit schutz und Sicherheit

Was ist Data Mining? Zusammenfassung Data Mining Muster, Verfahren KDD-Prozess Data Mining als Teilschritt des KDD-Prozesses OLAP modell, Data Mining als Erweiterung des OLAP Problemfelder

Vielen Dank