Personalisierung internetbasierter Handelsszenarien. Matthias Pretzer

Größe: px
Ab Seite anzeigen:

Download "Personalisierung internetbasierter Handelsszenarien. Matthias Pretzer"

Transkript

1 Matthias Pretzer Fachbereich Informatik Abteilung Informationssysteme Prof. Dr. Appelrath Inhalt: Motivation Grundlagen Anwendungsszenario Realisierung Fazit

2 Was ist Personalisierung (im Kontext der PG)? Verhalten des Kunden analysieren für häufig gekaufte Produkte Rabatte geben beim Kauf bestimmter Produkte dazu passende anbieten Warum Personalisierung? Optimierung der Werbekosten Stärkung der Kundenbindung alte Kunden zu halten ist billiger, als neue zu gewinnen Warum internetbasiert? Verhältnismäßig einfach darstellbar Probleme gläserner Kunde Datenschutz wird im Kontext der Projektgruppe nicht betrachtet Motivation Grundlagen Anwendungsszenario Realisierung Fazit 1/15

3 Zielsetzung der PG: Entwicklung einer Java-Bibliothek, die Kunden gruppiert und klassifiziert, Muster im Kaufverhalten der Kunden aufdeckt, temporale Datenquellen bei der Analyse beachtet, durch Meta-Daten gesteuert wird und eine verteilte Analyse ermöglicht Entwicklung eines Konzeptes zur Personalisierung auf Basis der von der Bibliothek gefundenen Muster Entwicklung eines exemplarischen Online-Shops mit personalisiertem Angebot Motivation Grundlagen Anwendungsszenario Realisierung Fazit 2/15

4 Basis der Datenanalyse: KDD (Knowledge Discovery in Databases) Phasen des KDD-Prozesses: Selektion: die zu analysierenden Daten auswählen Vorverarbeitung: Bereinigung und Integration der Daten Transformation: die Daten in ein analysierbares Format bringen Data Mining: Muster in den Daten entdecken Interpretation: gefundene Muster interpretieren Data-Mining Methoden: Clustering: Daten in Gruppen hoher Ähnlichkeit einteilen Klassifikation: Daten in vordefinierte Klassen einteilen Assoziationsanalyse: Regeln aufstellen, z.b. Wenn eine Person Bier kauft, kauft sie mit 40%iger Wahrscheinlichkeit auch Chips. Motivation Grundlagen Anwendungsszenario Realisierung Fazit 3/15

5 Grundlagen temporaler Datenbanken: ermöglichen, Veränderungen in den Daten zu speichern bekanntes Modell: bitemporal conceptual data model (BCDM) Speicherung zweier Zeitstempel: Transaktionszeit: bestimmt, wann der Eintrag in der DB gültig ist Gültigkeitszeit: bestimmt, wann der Eintrag in der realen Welt gültig ist Tupel-basierte Zeitstempelung: für jeden Datensatz wird eine Transaktionszeit und eine Gültigkeitszeit gespeichert Attribut-basierte Zeitstempelung: für einzelne Attribute eines Tupels wird eine eigene Zeitstempelung durchgeführt erfordert zusätzliche Entität im relationalen Modell für jedes attributbasiert zeitgestempelte Attribut Motivation Grundlagen Anwendungsszenario Realisierung Fazit 4/15

6 keine generelle Beschränkung auf Online-Shops wie identifiziert man Kunden in traditionellen Geschäften? Kundenkarten (wie z.b. Payback) Szenario: Bestellungen Transaktionsdaten Kunde Händler Kartenanbieter personalisiertes Angebot Analyseergebnisse Händler identifizieren Kunden anhand der Karten Kartenanbieter analysieren die Transaktionsdaten Händler erstellen aufgrund der Ergebnisse ein personalisiertes Angebot Motivation Grundlagen Anwendungsszenario Realisierung Fazit 5/15

7 konkretes Anwendungsszenario in der PG: ein Online-Shop; sammelt zusätzliche Daten über Weblogs ein klassischer Filial-Händler; sammelt Daten über Umfragen, Gewinnspiele ein Kartenanbieter; speichert Transaktions-, Produkt- und Kundendaten Analyseergebnisse Online-Shop Händler 1 Personalisierung Händler 2 Daten Analyseergebnisse aggregierte Daten Kartenanbieter Bibliothek Ergebnisse Analyseergebnisse Daten Analyseergebnisse Motivation Grundlagen Anwendungsszenario Realisierung Fazit 6/15

8 Drei Phasen der Projektgruppenarbeit: 0. Vorbereitendes Seminar: Teilnehmer erarbeiten grundlegende Themen zu KDD und temporalen Datenbanken 1. Aufsetzen des Anwendungsszenarios: Einteilung in drei Kleingruppen à vier Studierenden (WiWi+Inf) unabhängiger Entwurf der Datenbankschemata für die Händler und den Kartenanbieter 2. Realisierung der Bibliothek, des Personalisierungskonzeptes und des exemplarischen Online-Shops Motivation Grundlagen Anwendungsszenario Realisierung Fazit 7/15

9 1. Phase: Aufbau des Anwendungsszenarios: Verwendung des BCDM, um Daten temporal zu speichern sowohl tupel- als auch attribut-basierte Zeitstempelung Kartenanbieter: Vewaltung der verschiedenen Kartensysteme Verwaltung der Kunden, die Karten besitzen Verwaltung der mit Karten ausgeführten Transaktionen dynamische Attribute für Kunden und Produkte 48 Entitäten Händler 1 (Online-Shop): Produkthierarchie dynamische Attribute für Produkte 30 Entitäten Motivation Grundlagen Anwendungsszenario Realisierung Fazit 8/15

10 Händler 2 (klassischer Händler): Unterscheidung zwischen Kunden mit Karten und anonymen Kunden 16 Entitäten Generierung von Testdaten als Grundlage für die Analysen teilweise wenige, manuell angelegte Testdaten (z.b. Kartensysteme) Kunden, Produkte usw. mit zufalls-basierten Skripten erzeugt Millionen Transaktionen mit kalendarischem Muster durch tbasket ( yli/tbasket/) erzeugt Motivation Grundlagen Anwendungsszenario Realisierung Fazit 9/15

11 Datenbankschema des Kartenanbieters Motivation Grundlagen Anwendungsszenario Realisierung Fazit 10/15

12 Kunden Name KundenID: Integer tza: DATE Name: Varchar(255) Vorname: Varchar(255) tze: DATE gze: DATE gza: DATE Kunden Familienstand KundenID: Integer tza: DATE Familienstand: Integer tze: DATE gze: DATE gza: DATE Kunden KundenID: Integer Geburtsdatum: DATE Geschlecht: Smallint KStringAttribut KStringAttributID: Integer KundenID: Integer tza: DATE Wert: Varchar(255) tze: DATE gze: DATE gza: DATE KNumberAttribut KNumberAttributID: Integer KundenID: Integer tza: DATE Wert: Integer tze: DATE gze: DATE gza: DATE KundenAttribut KundenAttributID: Integer Name: Varchar(40) Beschreibung: Varchar(255) Einheit: Varchar(40) Typ: Varchar(10) Motivation Grundlagen Anwendungsszenario Realisierung Fazit 11/15

13 2. Phase: Realisierung der Bibliothek die Bibliothek soll das verteilte Analysieren ermöglichen keine Bindung an ein spezielles Datenschema daher Verwendung von Metadatenstandards zur Steuerung angedacht als Basis Waikato Environment for Knowledge Analysis (WEKA) ( + freie Java-Bibliothek (GPL) + bietet verschiedene Clusterer und Klassifikatoren + ein Algorithmus zum Erstellen von Assoziationsregeln (Apriori) + Filter ermöglichen es, Daten zu bereinigen arbeitet komplett im Hauptspeicher keine Beachtung von temporalen Informationen Motivation Grundlagen Anwendungsszenario Realisierung Fazit 12/15

14 WEKA ergänzen/erweitern um: metadaten-gesteuerte Schnittstelle Möglichkeiten, nicht komplett im Hauptspeicher zu arbeiten vor allem: Analysen auf temporalen Daten Veränderungen von Clustern/Klassen über die Zeit entdecken und darstellen Kalenderbasierte Assoziationsregeln finden ( vor Ostern werden zu Eiern mit einer Wahrscheinlichkeit von 50 % auch Eierfarben gekauft ) Motivation Grundlagen Anwendungsszenario Realisierung Fazit 13/15

15 Online-Shop zur Verifikation auf Basis der Datenbank des Online-Händlers rudimentäre Features baumartige Katalogstruktur darstellen Produktdetailseiten Warenkorb Bestellung Personalisierung auf den Detailseiten eines Produktes andere Produkte gemäß den Assoziationsregeln einblenden guten Kunden Sonderangebote unterbreiten Produkte innerhalb der Katalogstruktur gemäß den Präferenzen des Kunden hervorheben Motivation Grundlagen Anwendungsszenario Realisierung Fazit 14/15

16 Abgeschlossen sind: das Aufsetzen des Anwendungsszenarios die Planung der zweiten Projektphase Zwischenbericht ist kurz vor der Fertigstellung bis Oktober 2003 ist noch zu tun: Implementierung der Bibliothek Implementierung des Online-Shops Abschlußbericht Was haben wir bislang gelernt? Grundlagen KDD Grundlagen temporaler Datenbanken Teamarbeit ist mit viel Verwaltungsaufwand verbunden Motivation Grundlagen Anwendungsszenario Realisierung Fazit 15/15

Anforderungsdefinition Gesamtszenario

Anforderungsdefinition Gesamtszenario Carl von Ossietzky Universität Oldenburg Anforderungsdefinition Gesamtszenario Fachbereich Informatik Abteilung Informationssysteme Prof. Dr. Appelrath Projektgruppe Personalisierung internetbasierter

Mehr

Data Mining auf Datenströmen Andreas M. Weiner

Data Mining auf Datenströmen Andreas M. Weiner Technische Universität Kaiserslautern Fachbereich Informatik Lehrgebiet Datenverwaltungssysteme Integriertes Seminar Datenbanken und Informationssysteme Sommersemester 2005 Thema: Data Streams Andreas

Mehr

Ermittlung von Assoziationsregeln aus großen Datenmengen. Zielsetzung

Ermittlung von Assoziationsregeln aus großen Datenmengen. Zielsetzung Ermittlung von Assoziationsregeln aus großen Datenmengen Zielsetzung Entscheidungsträger verwenden heutzutage immer häufiger moderne Technologien zur Lösung betriebswirtschaftlicher Problemstellungen.

Mehr

Data Mining im Einzelhandel Methoden und Werkzeuge

Data Mining im Einzelhandel Methoden und Werkzeuge Fakultät Informatik Institut für Angewandte Informatik Professur Technische Informationssysteme Proseminar Technische Informationssysteme Data Mining im Einzelhandel Methoden und Werkzeuge Betreuer: Dipl.-Ing.

Mehr

WEKA A Machine Learning Interface for Data Mining

WEKA A Machine Learning Interface for Data Mining WEKA A Machine Learning Interface for Data Mining Frank Eibe, Mark Hall, Geoffrey Holmes, Richard Kirkby, Bernhard Pfahringer, Ian H. Witten Reinhard Klaus Losse Künstliche Intelligenz II WS 2009/2010

Mehr

Dokumentation Händler 1

Dokumentation Händler 1 Dokumentation Händler 1 Tim Brüggemann, Michael Onken, Carsten Saathoff, Oliver Wien 16. Mai 2003 1 Inhaltsverzeichnis 1 Aufgabenbeschreibung 4 1.1 Kurze Beschreibung des Händlers......................

Mehr

Zwischenbericht Teil A. Personalisierung internetbasierter Handelsszenarien

Zwischenbericht Teil A. Personalisierung internetbasierter Handelsszenarien Zwischenbericht Teil A der Projektgruppe Personalisierung internetbasierter Handelsszenarien DATA IN KNOWLEDGE OUT Tim Brüggemann, Tina Goldau, Christian Lüpkes, Michael Onken, Matthias Pretzer, Christian

Mehr

Apriori-Algorithmus zur Entdeckung von Assoziationsregeln

Apriori-Algorithmus zur Entdeckung von Assoziationsregeln Apriori-Algorithmus zur Entdeckung von PG 42 Wissensmanagment Lehrstuhl für Künstliche Intelligenz 22. Oktober 21 Gliederung Motivation Formale Problemdarstellung Apriori-Algorithmus Beispiel Varianten

Mehr

Data Mining-Modelle und -Algorithmen

Data Mining-Modelle und -Algorithmen Data Mining-Modelle und -Algorithmen Data Mining-Modelle und -Algorithmen Data Mining ist ein Prozess, bei dem mehrere Komponenten i n- teragieren. Sie greifen auf Datenquellen, um diese zum Training,

Mehr

Knowledge Discovery. Lösungsblatt 1

Knowledge Discovery. Lösungsblatt 1 Universität Kassel Fachbereich Mathematik/nformatik Fachgebiet Wissensverarbeitung Hertie-Stiftungslehrstuhl Wilhelmshöher Allee 73 34121 Kassel Email: hotho@cs.uni-kassel.de Tel.: ++49 561 804-6252 Dr.

Mehr

Introduction to Data and Knowledge Engineering Übung 1: Entity Relationship Model

Introduction to Data and Knowledge Engineering Übung 1: Entity Relationship Model Introduction to Data and Knowledge Engineering Übung 1: Entity Relationship Model FB Informatik Datenbanken und Verteilte Systeme Arthur Herzog 1 Entity Relationship Model FB Informatik Datenbanken und

Mehr

Data Mining mit RapidMiner

Data Mining mit RapidMiner Motivation Data Mining mit RapidMiner CRISP: DM-Prozess besteht aus unterschiedlichen Teilaufgaben Datenvorverarbeitung spielt wichtige Rolle im DM-Prozess Systematische Evaluationen erfordern flexible

Mehr

Seminar Business Intelligence Teil II. Data Mining & Knowledge Discovery

Seminar Business Intelligence Teil II. Data Mining & Knowledge Discovery Seminar Business Intelligence Teil II Data Mining & Knowledge Discovery Was ist Data Mining? Sabine Queckbörner Was ist Data Mining? Data Mining Was ist Data Mining? Nach welchen Mustern wird gesucht?

Mehr

Dr. Andreas Hotho, Robert Jäschke Fachgebiet Wissensverarbeitung 30.10.2008. Wintersemester 2008/2009

Dr. Andreas Hotho, Robert Jäschke Fachgebiet Wissensverarbeitung 30.10.2008. Wintersemester 2008/2009 Dr. Andreas Hotho, Robert Jäschke Fachgebiet Wissensverarbeitung 30.10.2008 1. Übung Knowledge Discovery Wintersemester 2008/2009 Vorbemerkungen Vorlesungsfolien und Übungsblätter können Sie im Internet

Mehr

Kapitel 4: Data Mining

Kapitel 4: Data Mining LUDWIG- MAXIMILIANS- UNIVERSITY MUNICH DEPARTMENT INSTITUTE FOR INFORMATICS Skript zur Vorlesung: Einführung in die Informatik: Systeme und Anwendungen Sommersemester 2017 Kapitel 4: Data Mining Vorlesung:

Mehr

Datenbanken und Informationssysteme

Datenbanken und Informationssysteme Datenbanken und Informationssysteme Lehrangebot Stefan Conrad Heinrich-Heine-Universität Düsseldorf Institut für Informatik April 2012 Stefan Conrad (HHU) Datenbanken und Informationssysteme April 2012

Mehr

Klausur Datenbanken Wintersemester 2011/2012 Prof. Dr. Wolfgang May 8. Februar 2012, 14-16 Uhr Bearbeitungszeit: 90 Minuten

Klausur Datenbanken Wintersemester 2011/2012 Prof. Dr. Wolfgang May 8. Februar 2012, 14-16 Uhr Bearbeitungszeit: 90 Minuten Klausur Datenbanken Wintersemester 2011/2012 Prof. Dr. Wolfgang May 8. Februar 2012, 14-16 Uhr Bearbeitungszeit: 90 Minuten Vorname: Nachname: Matrikelnummer: Studiengang: Bei der Klausur sind keine Hilfsmittel

Mehr

Fortgeschrittene Computerintensive Methoden: Assoziationsregeln Steffen Unkel Manuel Eugster, Bettina Grün, Friedrich Leisch, Matthias Schmid

Fortgeschrittene Computerintensive Methoden: Assoziationsregeln Steffen Unkel Manuel Eugster, Bettina Grün, Friedrich Leisch, Matthias Schmid Fortgeschrittene Computerintensive Methoden: Assoziationsregeln Steffen Unkel Manuel Eugster, Bettina Grün, Friedrich Leisch, Matthias Schmid Institut für Statistik LMU München Sommersemester 2013 Zielsetzung

Mehr

Informationssysteme. Prof. Dr. Hans Czap. Lehrstuhl für Wirtschaftsinformatik I. Lehrstuhl für Wirtschaftsinformatik I - II - 1 -

Informationssysteme. Prof. Dr. Hans Czap. Lehrstuhl für Wirtschaftsinformatik I. Lehrstuhl für Wirtschaftsinformatik I - II - 1 - Vorlesung Grundlagen betrieblicher Informationssysteme Prof. Dr. Hans Czap Email: Hans.Czap@uni-trier.de - II - 1 - Inhalt Kap. 1 Ziele der Datenbanktheorie Kap. 2 Datenmodellierung und Datenbankentwurf

Mehr

DOAG BI Data-Mining in sozialen Online-Netzwerken

DOAG BI Data-Mining in sozialen Online-Netzwerken DOAG BI 2013 Data-Mining in sozialen Online-Netzwerken Bianca Vornamen Böckelmann, Name, 17. dd.mm.yyyy April 2013 Agenda Über Robotron Motivation Knowledge Discovery in Databases (KDD)-Prozess Oracle

Mehr

Temporale Datenintegration in Data-Warehouse-Systemen

Temporale Datenintegration in Data-Warehouse-Systemen Temporale Datenintegration in Data-Warehouse-Systemen Arne Harren 4. März 2005 BTW 2005 11. GI-Fachtagung für Datenbanksysteme in Business, Technologie und Web Karlsruhe, 2. - 4. März 2005 Datenintegration

Mehr

Endbericht der Projektgruppe. Personalisierung internetbasierter Handelsszenarien DATA IN KNOWLEDGE OUT

Endbericht der Projektgruppe. Personalisierung internetbasierter Handelsszenarien DATA IN KNOWLEDGE OUT Endbericht der Projektgruppe Personalisierung internetbasierter Handelsszenarien DATA IN KNOWLEDGE OUT Tim Brüggemann, Tina Goldau, Christian Lüpkes, Michael Onken, Matthias Pretzer, Christian Reitenberger,

Mehr

Wirtschaftsinformatik 2. Tutorium im WS 11/12

Wirtschaftsinformatik 2. Tutorium im WS 11/12 Wirtschaftsinformatik 2. Tutorium im WS 11/12 Entity/Relationship-Modell SQL Statements Tutorium Wirtschaftsinformatik WS 11/12 2.1 Datenmodellierung mit ERM (1) Datenmodellierung zur Erarbeitung des konzeptionellen

Mehr

6.6 Vorlesung: Von OLAP zu Mining

6.6 Vorlesung: Von OLAP zu Mining 6.6 Vorlesung: Von OLAP zu Mining Definition des Begriffs Data Mining. Wichtige Data Mining-Problemstellungen, Zusammenhang zu Data Warehousing,. OHO - 1 Definition Data Mining Menge von Techniken zum

Mehr

Maschinelles Lernen: Symbolische Ansätze

Maschinelles Lernen: Symbolische Ansätze Maschinelles Lernen: Symbolische Ansätze Wintersemester 2009/2010 Musterlösung für das 13. Übungsblatt Aufgabe 1: Apriori Gegeben seien folgende Beobachtungen vom Kaufverhalten von Kunden: beer chips dip

Mehr

DBS5 Kap. 4. Data Mining

DBS5 Kap. 4. Data Mining DBS5 Kap. 4 Data Mining Klassifikationen und Cluster-Bildung: Auffinden von Regeln zur Partitionierung von Daten in disjunkte Teilmengen (Anwendungsbeispiel: Risikoabschätzung) bzw. Herstellen von Gruppierungen

Mehr

Datenbanksysteme 2009

Datenbanksysteme 2009 Datenbanksysteme 2009 Kapitel 17: Data Warehouse Oliver Vornberger Institut für Informatik Universität Osnabrück 1 OLTP versus OLAP OLTP (Online Transaction Processing) z.b. Flugreservierung, Handelsunternehmen

Mehr

PG-402 Wissensmanagement: Zeitreihen in Datenbanken

PG-402 Wissensmanagement: Zeitreihen in Datenbanken PG-402 Wissensmanagement: Zeitreihen in Datenbanken 07.05.2002 Klaus Unterstein 07.05.02 PG402 Wissensmanagement Zeitreihen in Datenbanken 1 Übersicht Zeitreihen Schritte bei der Zeitreihenanalyse Anwendungsfallbeispiel:

Mehr

Erkennung Sequenzieller Muster Algorithmen und Anwendungen

Erkennung Sequenzieller Muster Algorithmen und Anwendungen Achim Eisele, Thema 1.4.3: Sequenzielle Muster 1 FernUniversität in Hagen Seminar 01912 im Sommersemester 2008 Erkennung Sequenzieller Muster Algorithmen und Anwendungen Thema 1.4.3: Sequenzielle Muster

Mehr

Automatische Klassifikation: Stand der Technik und Veränderungen im Berufsbild des Dokumentars. Automatische Klassifikation:

Automatische Klassifikation: Stand der Technik und Veränderungen im Berufsbild des Dokumentars. Automatische Klassifikation: 02. Mai 2005 P R O J E C T C O N S U L T GmbH GmbH 1 Agenda Einführung Automatische Klassifikation Qualität Veränderung des Arbeitsumfeldes Ausblick GmbH 2 1 Einführung GmbH 3 Eine Herausforderung geordnete

Mehr

NoSQL Datenbanken EIN ÜBERBLICK ÜBER NICHT-RELATIONALE DATENBANKEN UND DEREN POTENTIALE IM ALLGEMEINEN UND IN DER INDUSTRIE

NoSQL Datenbanken EIN ÜBERBLICK ÜBER NICHT-RELATIONALE DATENBANKEN UND DEREN POTENTIALE IM ALLGEMEINEN UND IN DER INDUSTRIE NoSQL Datenbanken EIN ÜBERBLICK ÜBER NICHT-RELATIONALE DATENBANKEN UND DEREN POTENTIALE IM ALLGEMEINEN UND IN DER INDUSTRIE Was bedeutet NoSQL? Ein Sammelbegriff für alternative Datenbanklösungen, die

Mehr

Datenbanksysteme: Entwurf

Datenbanksysteme: Entwurf Wichtigste Themen hier: Datenbanksysteme: Entwurf DB Entwurf ist in der Regel eingebettet in ein größeres Projekt: siehe Informationssysteme Die Daten dienen einem Zweck und sind dennoch universell nutzbar:

Mehr

Assoziationsregeln & Sequenzielle Muster. A. Hinneburg, Web Data Mining MLU Halle-Wittenberg, SS 2007

Assoziationsregeln & Sequenzielle Muster. A. Hinneburg, Web Data Mining MLU Halle-Wittenberg, SS 2007 Assoziationsregeln & Sequenzielle Muster 0 Übersicht Grundlagen für Assoziationsregeln Apriori Algorithmus Verschiedene Datenformate Finden von Assoziationsregeln mit mehren unteren Schranken für Unterstützung

Mehr

Business Analytics im E-Commerce

Business Analytics im E-Commerce Business Analytics im E-Commerce Kunde, Kontext und sein Verhalten verstehen für personalisierte Kundenansprache Janusz Michalewicz CEO Über die Firma Crehler Erstellung von Onlineshops Analyse von Transaktionsdaten

Mehr

Kontext-basierte Personalisierung von Web Services

Kontext-basierte Personalisierung von Web Services Kontext-basierte Personalisierung von Web Services Markus Keidl, Stefan Seltzsam, Christof König und Alfons Kemper Universität Passau Fakultät für Mathematik und Informatik 94030 Passau @db.fmi.uni-passau.de

Mehr

Matthias-Claudius-Gymnasium Fachcurriculum Informatik

Matthias-Claudius-Gymnasium Fachcurriculum Informatik Klasse 8 (2-stündig) Grundlagen der Informatik Einführung in die Programmierung mit Scratch 10 Wochen Betriebssysteme - die Aufgaben eines Betriebssystems nennen. - Einstellungen des Betriebssystems in

Mehr

Lernen von Assoziationsregeln

Lernen von Assoziationsregeln Lernen von Assoziationsregeln Gegeben: R eine Menge von Objekten, die binäre Werte haben t eine Transaktion, t! R r eine Menge von Transaktionen S min " [0,] die minimale Unterstützung, Conf min " [0,]

Mehr

Datenbankanwendungen werden oft über einen sehr langen Zeitraum (z.b. Jahrzehnte) eingesetzt

Datenbankanwendungen werden oft über einen sehr langen Zeitraum (z.b. Jahrzehnte) eingesetzt 2. Datenbankentwurf Motivation Datenbankanwendungen werden oft über einen sehr langen Zeitraum (z.b. Jahrzehnte) eingesetzt Fehler sind umso teurer zu beheben, je weiter die Entwicklung bzw. der Einsatz

Mehr

Frequent Itemset Mining und FP-Tree

Frequent Itemset Mining und FP-Tree Übung 4 Frequent Itemset Mining und FP-Tree Frequent Itemset Mining Motivation: Es existiert eine Datenbank mit vielen Einträgen Man möchte wissen, welche Einträge oft zusammen vorkommen Frequent Itemset

Mehr

Wirtschaftsinformatik 2

Wirtschaftsinformatik 2 Wirtschaftsinformatik 2 Prof. Dr. Dr. L. Schmidt-Thieme MSc. André Busche Übung 2 1. Übungsblatt 2 2. Saalübung 02.05.12 2/ Aufgabe 2a (2 Punkte) Welche Vorteile bietet die Verwaltung von Daten in Datenbanken?

Mehr

Grundlagen der Programmentwurfstechnik Fundamentals of Software Engineering 1

Grundlagen der Programmentwurfstechnik Fundamentals of Software Engineering 1 Fundamentals of Software Engineering 1 Inhaltsverzeichnis 1. Einführung 2. Allgemeine Modellbildung - Klassische Konzepte des Software Engineering- 2.1 Das Kontextmodell 2.2 Entscheidungstabellen 2.3 Zustandsmodelle

Mehr

Präsentation der Bachelorarbeit

Präsentation der Bachelorarbeit Präsentation der Bachelorarbeit Einrichtung einer BI-Referenzumgebung mit Oracle 11gR1 Jörg Bellan Hochschule Ulm Fakultät Informatik Institut für Betriebliche Informationssysteme 15. Oktober 2009 Agenda

Mehr

Business Intelligence

Business Intelligence Hochschule Darmstadt Business Intelligence Fachbereich Informatik Praktikumsaufgabe 3 Prof. Dr. C. Wentzel Dipl. Inf. Dipl. Math. Y. Orkunoglu Datum: 11.06.2007 Business Intelligence Aufgabenstellung 1.

Mehr

Visuelle Exploration und semantikbasierte Fusion multivariater Datenbestände

Visuelle Exploration und semantikbasierte Fusion multivariater Datenbestände Visuelle Exploration und semantikbasierte Fusion multivariater Datenbestände Stefan Audersch, Guntram Flach, Tom Klipps Zentrum für Graphische Datenverarbeitung e.v., Rostock Joachim-Jungius-Str. 11, 18059

Mehr

Datenmodellierung VU Einführung SS 2016

Datenmodellierung VU Einführung SS 2016 184.685 Datenmodellierung VU Einführung SS 2016 Nysret Musliu, Sebastian Skritek Institut für Informationssysteme Technische Universität Wien Nysret Musliu, Sebastian Skritek Seite 1 1. Motivation Motivation

Mehr

Seminare/Praktika/ Projekte

Seminare/Praktika/ Projekte Seminare/Praktika/ Projekte ANGEWANDTE INFORMATIK IV PROF.DR.-ING. STEFAN JABLONSKI TOPICS PROCESS MANAGEMENT AND DATA SCIENCE Processes In organisations many kinds of systems and people work together

Mehr

Management Support Systeme

Management Support Systeme Management Support Systeme WS 24-25 4.-6. Uhr PD Dr. Peter Gluchowski Folie Gliederung MSS WS 4/5. Einführung Management Support Systeme: Informationssysteme zur Unterstützung betrieblicher Fach- und Führungskräfte

Mehr

Schlüssel bei temporalen Daten im relationalen Modell

Schlüssel bei temporalen Daten im relationalen Modell Schlüssel bei temporalen Daten im relationalen Modell Gesine Mühle > Präsentation > Bilder zum Inhalt zurück weiter 322 Schlüssel im relationalen Modell Schlüssel bei temporalen Daten im relationalen Modell

Mehr

Datenbanken-Themen im OS "Data Mining" SS 2010

Datenbanken-Themen im OS Data Mining SS 2010 Prof. Dr.-Ing. Thomas Kudraß HTWK Leipzig, FIMN Datenbanken-Themen im OS "Data Mining" SS 2010 Die Vorträge sollten eine Dauer von 60 Minuten (Einzelvortrag) bzw. 45 Minuten (Doppelvortrag) haben. Nachfolgend

Mehr

Motivation. Themenblock: Data Preprocessing. Einsatzgebiete für Data Mining I. Modell von Gianotti und Pedreschi

Motivation. Themenblock: Data Preprocessing. Einsatzgebiete für Data Mining I. Modell von Gianotti und Pedreschi Motivation Themenblock: Data Preprocessing We are drowning in information, but starving for knowledge! (John Naisbett) Was genau ist Datenanalyse? Praktikum: Data Warehousing und Data Mining Was ist Data

Mehr

Einführung in Data Mining anhand des Modells CRISP-DM

Einführung in Data Mining anhand des Modells CRISP-DM Einführung in Data Mining anhand des Modells CRISP-DM Seminarvortrag Linnea Passing Seminar, Scientific Programming, FH Aachen Stand: 11.01.2011 Rechen- und Kommunikationszentrum (RZ) Agenda Motivation

Mehr

Mining the Web. Analyse von Benutzerpfaden und Nutzertypen im Internet. Business Unit CRM Solutions SAS Deutschland. Dr.

Mining the Web. Analyse von Benutzerpfaden und Nutzertypen im Internet. Business Unit CRM Solutions SAS Deutschland. Dr. Mining the Web Analyse von Benutzerpfaden und Nutzertypen im Internet Dr. Frank Säuberlich Business Unit CRM Solutions SAS Deutschland Agenda 1. Einleitung: Der Lebenszyklus eines e-kunden Begriffsdefinition

Mehr

1 Einleitung... 1. 2 Vorstellung der Fallstudie KnowBeer... 5

1 Einleitung... 1. 2 Vorstellung der Fallstudie KnowBeer... 5 1 Einleitung... 1 2 Vorstellung der Fallstudie KnowBeer... 5 Teil I: Überblick Der Business Rules Ansatz 3 Ausgangslage... 11 3.1 Was ist das Problem?... 11 3.2 Motivation: Sinnvolle Unternehmen... 12

Mehr

Entwicklung eines E-Learning Topic-Map Rahmenwerks

Entwicklung eines E-Learning Topic-Map Rahmenwerks Institut für Betriebssysteme und Rechnerverbund der TU Braunschweig Verteilte Systeme, Prof. Dr. Fischer Entwicklung eines Topic-Map Rahmenwerks Betreuer: Martin Gutbrod Bearbeitet von: Yichen Yu Gliederung

Mehr

Datenbanken. Seminararbeit. Einführung in das wissenschaftliche Arbeiten

Datenbanken. Seminararbeit. Einführung in das wissenschaftliche Arbeiten Seminararbeit vorgelegt von: Gutachter: Studienbereich: Christian Lechner Dr. Georg Moser Informatik Datum: 6. Juni 2013 Inhaltsverzeichnis Inhaltsverzeichnis 1 Einführung in Datenbanken 1 1.1 Motivation....................................

Mehr

Datenmodelle und Datenbanken 2

Datenmodelle und Datenbanken 2 Datenmodelle und Datenbanken 2 Prof. N. Fuhr Institut für Informatik und Interaktive Systeme Arbeitsgruppe Informationssysteme 24. Februar 2005 Hinweise zur Bearbeitung Die Zeit läuft erst, wenn Sie alle

Mehr

Data-Mining: Ausgewählte Verfahren und Werkzeuge

Data-Mining: Ausgewählte Verfahren und Werkzeuge Fakultät Informatik Institut für Angewandte Informatik Lehrstuhl Technische Informationssysteme Data-Mining: Ausgewählte Verfahren und Vortragender: Jia Mu Betreuer: Dipl.-Inf. Denis Stein Dresden, den

Mehr

Data Mining Standards am Beispiel von PMML. Data Mining Standards am Beispiel von PMML

Data Mining Standards am Beispiel von PMML. Data Mining Standards am Beispiel von PMML Data Mining Standards am Beispiel von PMML Allgemeine Definitionen im Data Mining Data Mining (DM) Ein Prozess, um interessante neue Muster, Korrelationen und Trends in großen Datenbeständen zu entdecken,

Mehr

Data Mining und Knowledge Discovery in Databases

Data Mining und Knowledge Discovery in Databases Data Mining und Knowledge Discovery in Databases Begriffsabgrenzungen... Phasen der KDD...3 3 Datenvorverarbeitung...4 3. Datenproblematik...4 3. Möglichkeiten der Datenvorverarbeitung...4 4 Data Mining

Mehr

Web Data Management Systeme

Web Data Management Systeme Web Data Management Systeme Seminar: Web-Qualitätsmanagement Arne Frenkel Agenda Einführung Suchsysteme Suchmaschinen & Meta-Suchmaschinen W3QS WebSQL WebLog Information Integration Systems Ariadne TSIMMIS

Mehr

Endbericht der Projektgruppe. Personalisierung internetbasierter Handelsszenarien

Endbericht der Projektgruppe. Personalisierung internetbasierter Handelsszenarien Endbericht der Projektgruppe Personalisierung internetbasierter Handelsszenarien DATA IN KNOWLEDGE OUT Tim Brüggemann, Tina Goldau, Christian Lüpkes, Michael Onken, Matthias Pretzer, Christian Reitenberger,

Mehr

SL PROVISOR Automation in der Qualitätssicherung sinnvoll erhöhen

SL PROVISOR Automation in der Qualitätssicherung sinnvoll erhöhen SL PROVISOR Automation in der Qualitätssicherung sinnvoll erhöhen Christian Langmann langmann@softwareloft.de Stefan Kohrs kohrs@softwareloft.de Oktober 2013 SoftwareLoft IT-Solutions GmbH gegründet 2004

Mehr

Klassifikation von Integrationskonflikten

Klassifikation von Integrationskonflikten Klassifikation von Integrationskonflikten Christiane Telöken 1 Inhaltsverzeichnis 1. Was bedeutet Integration? 2. Strukturelle Heterogenitätskonflikte 2.1 Konflikte bei bilateralen Korrespondenzen 2.2

Mehr

Dokument Klassifikation. Thomas Uhrig: Data-Mining SS10

Dokument Klassifikation. Thomas Uhrig: Data-Mining SS10 Agenda: 1: Klassifizierung allgemein 2: der naive Bayes-Klassifizierer 3: Beispiel 4: Probleme 5: Fazit 6: Quellen 1: Klassifizierung allgemein: 1: Klassifizierung allgemein: - Einordnung von Objekten

Mehr

Hands-on-Workshop Datenmodellierung mit dem neuen Innovator for Database Architects. MID Insight Nürnberg,

Hands-on-Workshop Datenmodellierung mit dem neuen Innovator for Database Architects. MID Insight Nürnberg, Hands-on-Workshop Datenmodellierung mit dem neuen Innovator for Database Architects MID Insight 2010 - Nürnberg, 09.11.2010 I N H A L T 1. Konzeptionelle ER-Modellierung 2. Das Datenbankschema entsteht

Mehr

Data Mining - Wiederholung

Data Mining - Wiederholung Data Mining - Wiederholung Norbert Fuhr 18. Januar 2006 Problemstellungen Problemstellungen Daten vs. Information Def. Data Mining Arten von strukturellen Beschreibungen Regeln (Klassifikation, Assoziations-)

Mehr

Data Mining mit der SEMMA Methodik. Reinhard Strüby, SAS Institute Stephanie Freese, Herlitz PBS AG

Data Mining mit der SEMMA Methodik. Reinhard Strüby, SAS Institute Stephanie Freese, Herlitz PBS AG Data Mining mit der SEMMA Methodik Reinhard Strüby, SAS Institute Stephanie Freese, Herlitz PBS AG Data Mining Data Mining: Prozeß der Selektion, Exploration und Modellierung großer Datenmengen, um Information

Mehr

Data Warehouse Definition (1) http://de.wikipedia.org/wiki/data-warehouse

Data Warehouse Definition (1) http://de.wikipedia.org/wiki/data-warehouse Data Warehouse Definition (1) http://de.wikipedia.org/wiki/data-warehouse Ein Data-Warehouse bzw. Datenlager ist eine zentrale Datensammlung (meist eine Datenbank), deren Inhalt sich aus Daten unterschiedlicher

Mehr

Datenbanken Datenbanken 1 Belegnummer Belegnummer

Datenbanken Datenbanken 1 Belegnummer Belegnummer Datenbanken Datenbanken 1 Belegnummer 30.7302 Belegnummer 30.7312 Blockkurs 31.08. 11.09.2015 Wintersemester 2015/16 (Bachelor) Materialien zur Vorlesung Michael Roth Inge Hochschule Darmstadt Fachbereich

Mehr

Common Warehouse Metamodel und Imperfektion

Common Warehouse Metamodel und Imperfektion Common Warehouse Metamodel und Imperfektion Christoph Goebel Imperfektion und erweiterte Konzepte im Data Warehousing 2 Fragestellungen Welche Bedeutung haben Metadaten in der Information Supply Chain

Mehr

Datenbanken und Informationssysteme Sommersemester 2012 Probeklausur

Datenbanken und Informationssysteme Sommersemester 2012 Probeklausur Datenbanken und Informationssysteme Sommersemester 2012 Probeklausur 1 Konzeptuelle Modellierung (12 Punkte) Die folgende Beschreibung skizziert ein Informationssystem zur Verwaltung von Musikern: Jeder

Mehr

BERUFSPRAKTIKUM UND -VORBEREITUNG

BERUFSPRAKTIKUM UND -VORBEREITUNG Department für Geographie Marco Brey BERUFSPRAKTIKUM UND -VORBEREITUNG Crashkurs IT-Methoden ein anwendungsorientierter Einstieg in Datenbanksysteme, Programmierung und fortgeschrittene Excel-Funktionen

Mehr

Informations-, Daten- und Wissensmanagement

Informations-, Daten- und Wissensmanagement Informations-, Daten- und Wissensmanagement Lesen Sie den Artikel Schürfen in der Datenhalde und beantworten Sie folgende Fragen: Was ist Wissensmanagement? Forschungsgebiet / Managementthema, das sich

Mehr

SQL Tutorial. SQL - Tutorial SS 06. Hubert Baumgartner. INSO - Industrial Software

SQL Tutorial. SQL - Tutorial SS 06. Hubert Baumgartner. INSO - Industrial Software SQL Tutorial SQL - Tutorial SS 06 Hubert Baumgartner INSO - Industrial Software Institut für Rechnergestützte Automation Fakultät für Informatik Technische Universität Wien Inhalt des Tutorials 1 2 3 4

Mehr

Konzeptionelle Modellierung von XML-Dokumenttypen

Konzeptionelle Modellierung von XML-Dokumenttypen Konzeptionelle Modellierung von XML-Dokumenttypen Rainer Eckstein Institut für Informatik LFE DBIS Humboldt-Universität zu Berlin Rainer Eckstein 1 Konzeptionelle Modellierung von XML: XML (extensible

Mehr

Data Mining Anwendungen und Techniken

Data Mining Anwendungen und Techniken Data Mining Anwendungen und Techniken Knut Hinkelmann DFKI GmbH Entdecken von Wissen in banken Wissen Unternehmen sammeln ungeheure mengen enthalten wettbewerbsrelevantes Wissen Ziel: Entdecken dieses

Mehr

Maschinelles Lernen: Symbolische Ansätze

Maschinelles Lernen: Symbolische Ansätze Semestralklausur zur Vorlesung Maschinelles Lernen: Symbolische Ansätze Prof. J. Fürnkranz / Dr. G. Grieser Technische Universität Darmstadt Wintersemester 2005/06 Termin: 23. 2. 2006 Name: Vorname: Matrikelnummer:

Mehr

Kapitel 17: Date Warehouse

Kapitel 17: Date Warehouse Kapitel 17: Date Warehouse 1 OLTP versus OLAP OLTP (Online Transaction Processing) z.b. Flugreservierung, Handelsunternehmen kleine, kurze Transaktionen jeweils auf jüngstem Zustand OLAP (Online Analytical

Mehr

Visualisierung der Imperfektion in multidimensionalen Daten

Visualisierung der Imperfektion in multidimensionalen Daten Visualisierung der Imperfektion in multidimensionalen Daten Horst Fortner Imperfektion und erweiterte Konzepte im Data Warehousing Betreuer: Heiko Schepperle 2 Begriffe (1) Visualisierung [Wikipedia] abstrakte

Mehr

Abschluss Einblick und Ausblick

Abschluss Einblick und Ausblick Abschluss Einblick und Ausblick Prof. Dr. T. Kudraß 1 Benutzer Komponenten eines DBMS (Überblick) I/O-Prozessor Output-Generierung Parser für selbst. oder eingebettete Kommandos Precompiler Autorisierungs-Kontrolle

Mehr

Praktikum Datenbanken und verteilte Systeme SS Einführung August 2008

Praktikum Datenbanken und verteilte Systeme SS Einführung August 2008 Praktikum Datenbanken und verteilte Systeme SS 2007 - Einführung - 18. August 2008 Verteilte Systeme und Informationssysteme (VSIS) Department Informatik Universität Hamburg VSIS Arbeitsbereich VSIS: Verteilte

Mehr

Seminar Informationsintegration und Informationsqualität. Dragan Sunjka. 30. Juni 2006

Seminar Informationsintegration und Informationsqualität. Dragan Sunjka. 30. Juni 2006 Seminar Informationsintegration und Informationsqualität TU Kaiserslautern 30. Juni 2006 Gliederung Autonomie Verteilung führt zu Autonomie... Intra-Organisation: historisch Inter-Organisation: Internet

Mehr

Data Mining Künstliche Neuronale Netze vs. Entscheidungsbäume

Data Mining Künstliche Neuronale Netze vs. Entscheidungsbäume Data Mining Künstliche Neuronale Netze vs. Entscheidungsbäume Grundseminar HAW Master Informatik 18.04.2017 Inhaltsübersicht Data Mining & Begriffswelt des Data Mining Klassifikation & Klassifikatoren

Mehr

Informatik II Datenorganisation Datenbanken

Informatik II Datenorganisation Datenbanken Informatik II Datenorganisation Datenbanken Studiengang Wirtschaftsingenieurwesen (2. Semester) Prof. Dr. Sabine Kühn Tel. (0351) 462 2490 Fachbereich Informatik/Mathematik skuehn@informatik.htw-dresden.de

Mehr

Kapitel 1: Einleitung

Kapitel 1: Einleitung Ludwig Maximilians Universität München Institut für Informatik Lehr- und Forschungseinheit für Datenbanksysteme Skript zur Vorlesung Knowledge Discovery in Databases im Wintersemester 2003/2004 Kapitel

Mehr

TransAction Allianz 2.0

TransAction Allianz 2.0 Quality Address Bestes Timing für Ihr Mailing TransAction Allianz 2.0 Stand Januar 2016 Adresse Prime Data AG Badenerstr. 13 CH-5200 Brugg www.primedata.ch Kontakt Tel. 056 544 52 00 contact@primedata.ch

Mehr

Präsentation zur Diplomprüfung. Thema der Diplomarbeit:

Präsentation zur Diplomprüfung. Thema der Diplomarbeit: Präsentation zur Diplomprüfung Thema der Diplomarbeit: Analyse der Einsatzmöglichkeiten von Data Mining- Verfahren innerhalb einer Unternehmens - Balanced Scorecard und Entwicklung eines Empfehlungskatalogs.

Mehr

Anwendungen des Data Mining in der Praxis. Seminarvortrag von Holger Dürr

Anwendungen des Data Mining in der Praxis. Seminarvortrag von Holger Dürr Anwendungen des Data Mining in der Praxis Seminarvortrag von Holger Dürr Seminar Data Mining Wintersemester 2003/20042004 Professor Dr. Schweigert - Universität Ulm Themenübersicht Data Mining - Kleine

Mehr

Kapitel 11: Association Rules

Kapitel 11: Association Rules Kapitel 11: Association Association Einleitung Association : Eine wichtige Art von Mustern, an der man im Data-Mining Kontext interessiert ist. Muster mit einfacher Struktur. Ziel im folgenden: Finden

Mehr

Preisdynamik im Kaufverhalten - Regularitäten, Formen und Verhaltensmuster im Bereich der Fast Moving Consumer Goods

Preisdynamik im Kaufverhalten - Regularitäten, Formen und Verhaltensmuster im Bereich der Fast Moving Consumer Goods Preisdynamik im Kaufverhalten - Regularitäten, Formen und Verhaltensmuster im Bereich der Fast Moving Consumer Goods von Constance Scheffler Wissenschaftliche Gesellschaft für Innovatives Marketing e.v.

Mehr

Predictive Modeling Markup Language. Thomas Morandell

Predictive Modeling Markup Language. Thomas Morandell Predictive Modeling Markup Language Thomas Morandell Index Einführung PMML als Standard für den Austausch von Data Mining Ergebnissen/Prozessen Allgemeine Struktur eines PMML Dokuments Beispiel von PMML

Mehr

Datenanalyse mit Data Mining

Datenanalyse mit Data Mining Datenanalyse mit Data Mining von Jan-Christoph Meier Hamburg, 19.01.2012 1 Ablauf Motivation Speicherung der Daten für das Data Mining Data Mining Algorithmen Ausblick auf die Masterarbeit Konferenzen

Mehr

Universität Augsburg, Institut für Informatik WS 2009/2010 Prof. Dr. W. Kießling 06. Nov Dr. A. Huhn, F. Wenzel, M. Endres Lösungsblatt 2

Universität Augsburg, Institut für Informatik WS 2009/2010 Prof. Dr. W. Kießling 06. Nov Dr. A. Huhn, F. Wenzel, M. Endres Lösungsblatt 2 Universität Augsburg, Institut für Informatik WS 2009/2010 Prof. Dr. W. Kießling 06. Nov. 2009 Dr. A. Huhn, F. Wenzel, M. Endres Lösungsblatt 2 Aufgabe 1: ER-Modellierung 1. Siehe Unterstreichungen in

Mehr

Softwareentwicklungsumgebungen

Softwareentwicklungsumgebungen Softwareentwicklungsumgebungen Pit Pietsch Dipl.-Wirt.-Inform. Universität Siegen Fachgruppe Praktische Informatik Themen 1. SEU / Eclipse 2. Emf Ecore & Model Driven Engineering 3. Model-Repositories

Mehr

Temporale Daten in objekt-relationalen Datenbanksystemen

Temporale Daten in objekt-relationalen Datenbanksystemen Temporale Daten in objekt-relationalen Datenbanksystemen Carsten Kleiner Universität Hannover Institut für Informatik FG Datenbanken und Informationssysteme (dbis) 30159 Hannover 13.Workshop Grundlagen

Mehr

Relationale Datenbanken Datenbankgrundlagen

Relationale Datenbanken Datenbankgrundlagen Datenbanksystem Ein Datenbanksystem (DBS) 1 ist ein System zur elektronischen Datenverwaltung. Die wesentliche Aufgabe eines DBS ist es, große Datenmengen effizient, widerspruchsfrei und dauerhaft zu speichern

Mehr

Normalisierung Szenario [nach Zehnder; Informationssysteme und Datenbanken. Teubner, 1989]

Normalisierung Szenario [nach Zehnder; Informationssysteme und Datenbanken. Teubner, 1989] Informatik Normalisierung / ERM 1 Normalisierung Szenario [nach Zehnder; Informationssysteme und Datenbanken. Teubner, 1989] Die Firma EDV-Soft beschäftigt die Personen Müller, Meyer, Schultze, Schmidt.

Mehr

Hochschule Darmstadt Data Warehouse SS 2015 Fachbereich Informatik Praktikumsversuch 5

Hochschule Darmstadt Data Warehouse SS 2015 Fachbereich Informatik Praktikumsversuch 5 Hochschule Darmstadt Data Warehouse SS 2015 Fachbereich Informatik Praktikumsversuch 5 Prof. Dr. S. Karczewski Dipl. Inf. Dipl. Math. Y. Orkunoglu Datum: 25.06.2015 1. Kurzbeschreibung Dieses Praktikum

Mehr

Analyse von Transaktionsdaten im Online-Ticketing mit Data-Mining-Methoden

Analyse von Transaktionsdaten im Online-Ticketing mit Data-Mining-Methoden 1 Analyse von Transaktionsdaten im Online-Ticketing mit Data-Mining-Methoden Marten Pfannenschmidt, Freie Universität Berlin Prof. Dr. Jan Fabian Ehmke, Europa-Universität Viadrina Frank Schreier, Berliner

Mehr