Data Mining im Einzelhandel Methoden und Werkzeuge

Größe: px
Ab Seite anzeigen:

Download "Data Mining im Einzelhandel Methoden und Werkzeuge"

Transkript

1 Fakultät Informatik Institut für Angewandte Informatik Professur Technische Informationssysteme Proseminar Technische Informationssysteme Data Mining im Einzelhandel Methoden und Werkzeuge Betreuer: Dipl.-Ing. Clemens Schwenke Vortragender: Martin Peukert Dresden,

2 Gliederung - Motivation - KDD und Data Mining Einordnung - Methoden Clustering Warenkorbanalyse Assoziationsregeln - Werkzeuge - Ausblick - Zusammenfassung - Quellen Folie 2 von 36

3 Motivation - Warenkorbanalyse - gemeinsam gekaufte Produkte - Produktpalette - Platzierung der Produkte optimieren - Kundenbindung - gezielte Werbung (cross selling) - Gewinn maximieren Folie 3 von 36

4 - Motivation - KDD und Data Mining Einordnung - Methoden - Werkzeuge - Ausblick - Zusammenfassung - Quellen Folie 4 von 36

5 KDD und Data Mining Einordnung - Fokussierung Vorverarbeitung Transformation Data Mining Evaluation Folie 5 von 36

6 - Motivation - KDD und Data Mining Einordnung - Methoden - Werkzeuge - Ausblick - Zusammenfassung - Quellen Folie 6 von 36

7 Methoden Clustering - Bildung kompakter Gruppen - gleiche Gruppe = ähnlich - versch. Gruppen = unähnlich - Ähnlichkeit = Nähe im Koord.system - z.b. Finden von Arten von Schwertlinien Folie 7 von 36

8 Methoden Clustering - Bildung kompakter Gruppen - gleiche Gruppe = ähnlich - versch. Gruppen = unähnlich - Ähnlichkeit = Nähe im Koord.system - z.b. Finden von Arten von Schwertlinien Folie 8 von 36

9 Methoden Clustering Folie 9 von 36

10 Methoden Clustering Folie 10 von 36

11 Methoden Clustering Folie 11 von 36

12 Methoden Clustering Folie 12 von 36

13 Methoden Clustering Folie 13 von 36

14 Methoden Clustering Folie 14 von 36

15 Methoden Clustering Folie 15 von 36

16 Methoden Clustering Folie 16 von 36

17 Methoden Clustering Folie 17 von 36

18 Methoden Clustering Folie 18 von 36

19 Methoden Clustering - Clustering durch Varianz-Minimierung - Variante: k-means-algorithmus - Neuberechnung der Centroide nach jedem neu zugeordneten Objekt - Konvergenz gegen [lokales] Maximum - Laufzeit und Ergebnis abhängig von initialer Zerlegung und Punkte-Reihenfolge - am häufigsten verwendet - Wahl von k? experimentell Folie 19 von 36

20 Methoden Clustering Übersicht Folie 20 von 36

21 Methoden Clustering Warenkorbanalyse - Warenkorb: Menge von Produkten binärer Vektor (1,1,0,0,1,0,...) Dimension d = Anzahl der Produkte euklidische Distanz ungeeignet anderes Distanzmaß nur die Produkte der beteiligten Warenkörbe berücksichtigen - z.b. Quotient aus Anzahl der beteiligten Produkte und Anzahl der übereinstimmenden Produkte Folie 21 von 36

22 Methoden Clustering Warenkorbanalyse - Quotient aus Anzahl der beteiligten Produkte und Anzahl der übereinstimmenden Produkte - Warenkorb A = {Apfel, Birne, Milch} - Warebkorb B = {Apfel, Birne, Bier, Zeitung} Folie 22 von 36

23 Methoden Clustering Ergebnis Folie 23 von 36

24 Methoden Assoziationsregeln - A => B, A,B...Menge von Produkten z.b. {Brot, Butter} => {Milch} Wahrscheinlichkeitsmaße: support und confidence am häufigsten verwendet: Apriori-Algorithmus Folie 24 von 36

25 - Motivation - KDD und Data Mining Einordnung - Methoden - Werkzeuge - Ausblick - Zusammenfassung - Quellen Folie 25 von 36

26 Werkzeuge open source - R (S) - PSPP (SPSS) - RapidMiner - Weka - KNIME kommerziell - S-PLUS (S) - SPSS - SAS - Statistica - Oracle Data Miner - Microsoft SQL Server Folie 26 von 36

27 Werkzeuge KNIME Folie 27 von 36

28 Werkzeuge R Folie 28 von 36

29 Werkzeuge R Folie 29 von 36

30 Werkzeuge R Folie 30 von 36

31 Werkzeuge R Folie 31 von 36

32 - Motivation - KDD und Data Mining Einordnung - Methoden - Werkzeuge - Ausblick - Zusammenfassung - Quellen Folie 32 von 36

33 Ausblick - RFID-Chips an vielen Artikeln, Regalen, Einkaufswagen - Einkaufswagen mit Display - Komfort: Einkaufliste überspielen Navigation Zusatzinformationen - Tracking: welches Produkt wann aus dem Regal genommen? Aufenthaltsdauer, Zielstrebigkeit welcher Kundentyp => gezielt werben Folie 33 von 36

34 - Motivation - KDD und Data Mining Einordnung - Methoden - Werkzeuge - Ausblick - Zusammenfassung - Quellen Folie 34 von 36

35 Zusammenfassung - gemeinsam gekaufte Produkte erkennen - Clustering Gruppen von ähnlichen Objekten Distanzmaß z.b. k-means-algorithmus - Assoziationsregeln Implikationen Interessantheitsmaße z.b. Apriori-Algorithmus - Werkzeuge: KNIME, R - Zukunft: RFID, Einkaufswagen mit Displays; Komfort und Tracking Folie 35 von 36

36 Quellen - Ester, Martin; Sander, Jörg: Knowledge Discovery in Databases - Techniken und Anwendungen. 1. Aufl. Berlin : Springer-Verlag, ISBN Data Mining im Einzelhandel Methoden und Werkzeuge Folie 36 von 36

Ermittlung von Assoziationsregeln aus großen Datenmengen. Zielsetzung

Ermittlung von Assoziationsregeln aus großen Datenmengen. Zielsetzung Ermittlung von Assoziationsregeln aus großen Datenmengen Zielsetzung Entscheidungsträger verwenden heutzutage immer häufiger moderne Technologien zur Lösung betriebswirtschaftlicher Problemstellungen.

Mehr

Data-Mining: Ausgewählte Verfahren und Werkzeuge

Data-Mining: Ausgewählte Verfahren und Werkzeuge Fakultät Informatik Institut für Angewandte Informatik Lehrstuhl Technische Informationssysteme Data-Mining: Ausgewählte Verfahren und Vortragender: Jia Mu Betreuer: Dipl.-Inf. Denis Stein Dresden, den

Mehr

Personalisierung internetbasierter Handelsszenarien. Matthias Pretzer

Personalisierung internetbasierter Handelsszenarien. Matthias Pretzer Matthias Pretzer matthias.pretzer@informatik.uni-oldenburg.de http://diko-project.de/ Fachbereich Informatik Abteilung Informationssysteme Prof. Dr. Appelrath Inhalt: Motivation Grundlagen Anwendungsszenario

Mehr

Fortgeschrittene Computerintensive Methoden: Assoziationsregeln Steffen Unkel Manuel Eugster, Bettina Grün, Friedrich Leisch, Matthias Schmid

Fortgeschrittene Computerintensive Methoden: Assoziationsregeln Steffen Unkel Manuel Eugster, Bettina Grün, Friedrich Leisch, Matthias Schmid Fortgeschrittene Computerintensive Methoden: Assoziationsregeln Steffen Unkel Manuel Eugster, Bettina Grün, Friedrich Leisch, Matthias Schmid Institut für Statistik LMU München Sommersemester 2013 Zielsetzung

Mehr

Data/Information Quality Management

Data/Information Quality Management Data/Information Quality Management Seminar WI/Informationsmanagement im Sommersemester 2002 Markus Berberov, Roman Eder, Peter Gerstbach 11.6.2002 Inhalt! Daten und Datenqualität! Einführung und Definition!

Mehr

Erkennung Sequenzieller Muster Algorithmen und Anwendungen

Erkennung Sequenzieller Muster Algorithmen und Anwendungen Achim Eisele, Thema 1.4.3: Sequenzielle Muster 1 FernUniversität in Hagen Seminar 01912 im Sommersemester 2008 Erkennung Sequenzieller Muster Algorithmen und Anwendungen Thema 1.4.3: Sequenzielle Muster

Mehr

PROSEMINAR: INFORMATIONSGEWINN DURCH EXPERIMENTE WS 09/10

PROSEMINAR: INFORMATIONSGEWINN DURCH EXPERIMENTE WS 09/10 PROSEMINAR: INFORMATIONSGEWINN DURCH EXPERIMENTE WS 09/10 DATA MINING ALS EXPERIMENT VORTRAG: CHRISTOPH NÖLLENHEIDT 26.01.10 Ablauf Das CRISP-DM-Modell Zwei verschiedene Standpunkte über die Theoriebildung

Mehr

Datenbanken-Themen im OS "Data Mining" SS 2010

Datenbanken-Themen im OS Data Mining SS 2010 Prof. Dr.-Ing. Thomas Kudraß HTWK Leipzig, FIMN Datenbanken-Themen im OS "Data Mining" SS 2010 Die Vorträge sollten eine Dauer von 60 Minuten (Einzelvortrag) bzw. 45 Minuten (Doppelvortrag) haben. Nachfolgend

Mehr

Data Mining mit der SEMMA Methodik. Reinhard Strüby, SAS Institute Stephanie Freese, Herlitz PBS AG

Data Mining mit der SEMMA Methodik. Reinhard Strüby, SAS Institute Stephanie Freese, Herlitz PBS AG Data Mining mit der SEMMA Methodik Reinhard Strüby, SAS Institute Stephanie Freese, Herlitz PBS AG Data Mining Data Mining: Prozeß der Selektion, Exploration und Modellierung großer Datenmengen, um Information

Mehr

Entwicklung einer Entscheidungssystematik für Data- Mining-Verfahren zur Erhöhung der Planungsgüte in der Produktion

Entwicklung einer Entscheidungssystematik für Data- Mining-Verfahren zur Erhöhung der Planungsgüte in der Produktion Entwicklung einer Entscheidungssystematik für Data- Mining-Verfahren zur Erhöhung der Planungsgüte in der Produktion Vortrag Seminararbeit David Pogorzelski Aachen, 22.01.2015 Agenda 1 2 3 4 5 Ziel der

Mehr

Data Mining Studie. Praxistest & Benchmarking. -Zusammenfassung-

Data Mining Studie. Praxistest & Benchmarking. -Zusammenfassung- Data Mining Studie Praxistest & Benchmarking -Zusammenfassung- Data Mining Studie 2010 Praxistest & Benchmarking Vielfältiger Data-Mining-Softwaremarkt Die immer stärkere Verbreitung des Data Mining in

Mehr

Management Support Systeme

Management Support Systeme Management Support Systeme WS 24-25 4.-6. Uhr PD Dr. Peter Gluchowski Folie Gliederung MSS WS 4/5. Einführung Management Support Systeme: Informationssysteme zur Unterstützung betrieblicher Fach- und Führungskräfte

Mehr

Einführung in Data Mining anhand des Modells CRISP-DM

Einführung in Data Mining anhand des Modells CRISP-DM Einführung in Data Mining anhand des Modells CRISP-DM Seminarvortrag Linnea Passing Seminar, Scientific Programming, FH Aachen Stand: 11.01.2011 Rechen- und Kommunikationszentrum (RZ) Agenda Motivation

Mehr

Data Mining - Oracle vs. Open Source

Data Mining - Oracle vs. Open Source Data Mining - Oracle vs. Open Source ein Erfahrungsbericht Prof. Dr. Reinhold von Schwerin D. Adam, K. Böll, S. Funk, F. Knittel, F. Langenbruch S. Nagel, H. Weissbach Hochschule Ulm, Fakultät für Informatik

Mehr

Fachgruppe Statistik, Risikoanalyse & Computing. STAT672 Data Mining. Sommersemester 2007. Prof. Dr. R. D. Reiß

Fachgruppe Statistik, Risikoanalyse & Computing. STAT672 Data Mining. Sommersemester 2007. Prof. Dr. R. D. Reiß Fachgruppe Statistik, Risikoanalyse & Computing STAT672 Data Mining Sommersemester 2007 Prof. Dr. R. D. Reiß Überblick Data Mining Begrifflichkeit Unter Data Mining versteht man die Computergestützte Suche

Mehr

Data Mining mit Rapidminer im Direktmarketing ein erster Versuch. Hasan Tercan und Hans-Peter Weih

Data Mining mit Rapidminer im Direktmarketing ein erster Versuch. Hasan Tercan und Hans-Peter Weih Data Mining mit Rapidminer im Direktmarketing ein erster Versuch Hasan Tercan und Hans-Peter Weih Motivation und Ziele des Projekts Anwendung von Data Mining im Versicherungssektor Unternehmen: Standard

Mehr

DBS5 Kap. 4. Data Mining

DBS5 Kap. 4. Data Mining DBS5 Kap. 4 Data Mining Klassifikationen und Cluster-Bildung: Auffinden von Regeln zur Partitionierung von Daten in disjunkte Teilmengen (Anwendungsbeispiel: Risikoabschätzung) bzw. Herstellen von Gruppierungen

Mehr

Knowledge Discovery. Lösungsblatt 1

Knowledge Discovery. Lösungsblatt 1 Universität Kassel Fachbereich Mathematik/nformatik Fachgebiet Wissensverarbeitung Hertie-Stiftungslehrstuhl Wilhelmshöher Allee 73 34121 Kassel Email: hotho@cs.uni-kassel.de Tel.: ++49 561 804-6252 Dr.

Mehr

Business Intelligence. Data Warehouse / Analyse Sven Elvers 2005-07-06

Business Intelligence. Data Warehouse / Analyse Sven Elvers 2005-07-06 Business Intelligence Data Warehouse / Analyse Sven Elvers 2005-07-06 Einleitung Dieses Dokument beschreibt einen für das Verständnis relevanten Teil der Präsentation. Business Intelligence Motivation

Mehr

Citizen Data Science. Balázs Bárány. 29. April 2016. Linuxwochen Wien 2016

Citizen Data Science. Balázs Bárány. 29. April 2016. Linuxwochen Wien 2016 Citizen Data Science Balázs Bárány Linuxwochen Wien 2016 29. April 2016 Inhalt Einführung: Data Science Werkzeuge und Methoden Citizen Data Science Daten holen Daten verstehen Daten-Vorverarbeitung Prädiktive

Mehr

6.6 Vorlesung: Von OLAP zu Mining

6.6 Vorlesung: Von OLAP zu Mining 6.6 Vorlesung: Von OLAP zu Mining Definition des Begriffs Data Mining. Wichtige Data Mining-Problemstellungen, Zusammenhang zu Data Warehousing,. OHO - 1 Definition Data Mining Menge von Techniken zum

Mehr

Navigation und virtuelle Begleitung von Behinderten mittels GIS. Masterarbeit von Ralf Schweizer

Navigation und virtuelle Begleitung von Behinderten mittels GIS. Masterarbeit von Ralf Schweizer Navigation und virtuelle Begleitung von Behinderten mittels GIS Masterarbeit von Ralf Schweizer Zürich, 23. Januar 2007 Inhalt Einleitung Ziele Grundlagen Über Weg und Zeit Betreuungsablauf Verwirklichung

Mehr

Oberseminar Data Mining. Systeme und Tools zum Data Mining: RapidMiner

Oberseminar Data Mining. Systeme und Tools zum Data Mining: RapidMiner Folie 2 von 56 Motivation Folie 3 von 56 Inhalt 1 Das Projekt RapidMiner 2 Funktionen 3 KDD-Prozess 4 Weitere Werkzeuge von Rapid-I 5 Zusammenfassung Folie 4 von 56 Das Projekt RapidMiner Entwicklung Entwicklung

Mehr

Voraussetzung wieder: Datenraum mit Instanzen, mehrere Attribute - kein ausgezeichnetes Zielattribut, keine vorgegebenen Klassen

Voraussetzung wieder: Datenraum mit Instanzen, mehrere Attribute - kein ausgezeichnetes Zielattribut, keine vorgegebenen Klassen 7. Clusteranalyse (= Häufungsanalyse; Clustering-Verfahren) wird der multivariaten Statistik zugeordnet Voraussetzung wieder: Datenraum mit Instanzen, mehrere Attribute - kein ausgezeichnetes Zielattribut,

Mehr

Seminar Datenbanksysteme

Seminar Datenbanksysteme Seminar Datenbanksysteme Recommender System mit Text Analysis für verbesserte Geo Discovery Eine Präsentation von Fabian Senn Inhaltsverzeichnis Geodaten Geometadaten Geo Discovery Recommendation System

Mehr

Data Warehousing. Sommersemester 2005. Ulf Leser Wissensmanagement in der Bioinformatik

Data Warehousing. Sommersemester 2005. Ulf Leser Wissensmanagement in der Bioinformatik Data Warehousing Sommersemester 2005 Ulf Leser Wissensmanagement in der Bioinformatik ... Der typische Walmart Kaufagent verwendet täglich mächtige Data Mining Werkzeuge, um die Daten der 300 Terabyte

Mehr

Data-Mining und Knowledge Discovery in Databases (KDD) Ein Überblick

Data-Mining und Knowledge Discovery in Databases (KDD) Ein Überblick Institut für Angewandte Informatik Professur für Technische Informationssysteme Fakultätsname XYZ Fachrichtung XYZ Institutsname XYZ, Professur XYZ Data-Mining und Knowledge Discovery in Databases (KDD)

Mehr

Datenbanken und Informationssysteme

Datenbanken und Informationssysteme Datenbanken und Informationssysteme Lehrangebot Stefan Conrad Heinrich-Heine-Universität Düsseldorf Institut für Informatik April 2012 Stefan Conrad (HHU) Datenbanken und Informationssysteme April 2012

Mehr

Data Mining in SAP NetWeaver BI

Data Mining in SAP NetWeaver BI Martin Kießwetter, Dirk Vahl kam p Data Mining in SAP NetWeaver BI Galileo Press Bonn Boston 2.1 Was ist Data Mining? 17 2.2 Data Mining, KDD und Business Intelligence 20 2.3 KDD-Prozessmodelle 22 2.4

Mehr

Data Mining Standards am Beispiel von PMML. Data Mining Standards am Beispiel von PMML

Data Mining Standards am Beispiel von PMML. Data Mining Standards am Beispiel von PMML Data Mining Standards am Beispiel von PMML Allgemeine Definitionen im Data Mining Data Mining (DM) Ein Prozess, um interessante neue Muster, Korrelationen und Trends in großen Datenbeständen zu entdecken,

Mehr

Algorithms for Pattern Mining AprioriTID. Stefan George, Felix Leupold

Algorithms for Pattern Mining AprioriTID. Stefan George, Felix Leupold Algorithms for Pattern Mining AprioriTID Stefan George, Felix Leupold Gliederung 2 Einleitung Support / Confidence Apriori ApriorTID Implementierung Performance Erweiterung Zusammenfassung Einleitung 3

Mehr

Teil A Grundlagen und Methoden 1. 1 Customer Relationship Management ein Bezugsrahmen 3

Teil A Grundlagen und Methoden 1. 1 Customer Relationship Management ein Bezugsrahmen 3 xi Teil A Grundlagen und Methoden 1 1 Customer Relationship Management ein Bezugsrahmen 3 1.1 Die Entwicklung zum kundenzentrierten Unternehmen 3 1.2 Ziel und Kernkonzepte des CRM 5 1.2.1 Ziel: Profitable

Mehr

Customer Relationship Ana lyt ics

Customer Relationship Ana lyt ics Peter Necke1 Bernd Knobloch Customer Relationship Ana lyt ics Praktische Anwendung des Data Mining im CRM d p u n kt.ve r I ag 1 1.1 1.2 1.3 Customer Relationship Management. ein Bezugsrahmen Die Entwicklung

Mehr

Hauptseminar zum Thema:

Hauptseminar zum Thema: Fakultät Informatik Institut für angewandte Informatik Professur Technische Informationssysteme Hauptseminar zum Thema: Vergleich ARCH- und GARCH- Modelle bei der Analyse von Zeitreihen mit veränderlichen

Mehr

Universität Dortmund Integrating Knowledge Discovery into Knowledge Management

Universität Dortmund Integrating Knowledge Discovery into Knowledge Management Integrating Knowledge Discovery into Knowledge Management Katharina Morik, Christian Hüppe, Klaus Unterstein Univ. Dortmund LS8 www-ai.cs.uni-dortmund.de Overview Integrating given data into a knowledge

Mehr

Open Source BI Trends. 11. Dezember 2009 Wien Konstantin Böhm

Open Source BI Trends. 11. Dezember 2009 Wien Konstantin Böhm Open Source BI Trends 11. Dezember 2009 Wien Konstantin Böhm Profil Folie 2 JAX 2009 11.12.2009 Gründung 2002, Nürnberg 50 Mitarbeiter Innovative Kunden Spezialisiert auf Open Source Integration Open Source

Mehr

Quo vadis, OPC? - von Data Access bis Unified Architecture - Dipl.-Ing. (BA) Erik Hennig Dresden, 25.10.2007

Quo vadis, OPC? - von Data Access bis Unified Architecture - Dipl.-Ing. (BA) Erik Hennig Dresden, 25.10.2007 Informatik» Angewandte Informatik» Technische Informationssysteme Quo vadis, OPC? - von Data Access bis Unified Architecture - Dipl.-Ing. (BA) Erik Hennig Dresden, 25.10.2007 Gliederung Einführung Was

Mehr

Verborgene Schätze heben

Verborgene Schätze heben Verborgene Schätze heben Data Mining mit dem Microsoft SQL Server Martin Oesterer Leiter Vertrieb HMS Analytical Software GmbH Data Mining. Was ist eigentlich wichtig? Data Mining ist: die Extraktion von

Mehr

Methoden zur Visualisierung von ereignisdiskreten Analysedaten

Methoden zur Visualisierung von ereignisdiskreten Analysedaten Fakultät Informatik, Institut für Angewandte Informatik, Professur Technische Informationssysteme Methoden zur Visualisierung von ereignisdiskreten Analysedaten Referent: Hendrik Freund Betreuer: Vladimir

Mehr

Vergleich von Open-Source und kommerziellen Programmen zur Durchführung eines ETL-Prozesses

Vergleich von Open-Source und kommerziellen Programmen zur Durchführung eines ETL-Prozesses Vergleich von Open-Source und kommerziellen Programmen zur Durchführung eines ETL-Prozesses Exposé zur Diplomarbeit Humboldt-Universität zu Berlin Mathematisch-Naturwissenschaftliche Fakultät II Institut

Mehr

Business Intelligence Data Warehouse. Jan Weinschenker

Business Intelligence Data Warehouse. Jan Weinschenker Business Intelligence Data Warehouse Jan Weinschenker 28.06.2005 Inhaltsverzeichnis Einleitung eines Data Warehouse Data Warehouse im Zusammenfassung Fragen 3 Einleitung Definition: Data Warehouse A data

Mehr

Warenkorbanalyse mit Hilfe der Statistiksoftware R

Warenkorbanalyse mit Hilfe der Statistiksoftware R Warenkorbanalyse mit Hilfe der Statistiksoftware R Michael Hahsler (1), Kurt Hornik (2) & Thomas Reutterer (3) (1) Institut für Informationswirtschaft, WU-Wien. (2) Institut für Statistik und Mathematik,

Mehr

Archivierung in DBMS

Archivierung in DBMS Archivierung in DBMS Marcus Brisgen 9. März 2004 Gliederung Gliederung Motivation Archivierung Grundlagen Anwendungsorientiertes Archivieren Architekturen Erweiterungen ASQL XML-Archivierungsoperator Beispiele

Mehr

Data Warehouse Technologien

Data Warehouse Technologien Veit Köppen Gunter Saake Kai-Uwe Sattler Data Warehouse Technologien Inhaltsverzeichnis Inhaltsverzeichnis vii 1 Einführung in Data-Warehouse-Systeme 1 1.1 Anwendungsszenario Getränkemarkt...............

Mehr

Proseminar - Data Mining

Proseminar - Data Mining Proseminar - Data Mining SCCS, Fakultät für Informatik Technische Universität München SS 2012, SS 2012 1 Data Mining Pipeline Planung Aufbereitung Modellbildung Auswertung Wir wollen nützliches Wissen

Mehr

tdwi E U R D P E OPEN SOURCE BUSINESS INTELLIGENCE HANSER MÖGLICHKEITEN, CHANCEN UND RISIKEN QUELLOFFENER BI-LÖSUNGEN

tdwi E U R D P E OPEN SOURCE BUSINESS INTELLIGENCE HANSER MÖGLICHKEITEN, CHANCEN UND RISIKEN QUELLOFFENER BI-LÖSUNGEN OPEN SOURCE BUSINESS INTELLIGENCE MÖGLICHKEITEN, CHANCEN UND RISIKEN QUELLOFFENER BI-LÖSUNGEN uwehaneke Stephan TRAHASCH tobias HAGEN tobias LAUER (Hrsg.)' tdwi E U R D P E HANSER Vorwort 9 Einführung

Mehr

Kapitel 1: Einleitung

Kapitel 1: Einleitung Ludwig Maximilians Universität München Institut für Informatik Lehr- und Forschungseinheit für Datenbanksysteme Skript zur Vorlesung Knowledge Discovery in Databases im Wintersemester 2003/2004 Kapitel

Mehr

OpenSource Business Strategien. Thomas Uhl Topalis AG

OpenSource Business Strategien. Thomas Uhl Topalis AG OpenSource Business Strategien Thomas Uhl Topalis AG Firmenübersicht 14.07.09 Thomas Uhl 2 Open Source ist ein alternativer Weg, bessere Software zu produzieren (Forbes Magazine) 14.07.09 Thomas Uhl 3

Mehr

Präsentation zur Diplomprüfung. Thema der Diplomarbeit:

Präsentation zur Diplomprüfung. Thema der Diplomarbeit: Präsentation zur Diplomprüfung Thema der Diplomarbeit: Analyse der Einsatzmöglichkeiten von Data Mining- Verfahren innerhalb einer Unternehmens - Balanced Scorecard und Entwicklung eines Empfehlungskatalogs.

Mehr

Proseminar - Data Mining

Proseminar - Data Mining Proseminar - Data Mining SCCS, Fakultät für Informatik Technische Universität München SS 2014, SS 2014 1 Data Mining: Beispiele (1) Hausnummererkennung (Klassifikation) Source: http://arxiv.org/abs/1312.6082,

Mehr

Veit Köppen Gunter Saake Kai-Uwe Sattler. 2. Auflage. Data Warehouse Technologien

Veit Köppen Gunter Saake Kai-Uwe Sattler. 2. Auflage. Data Warehouse Technologien Veit Köppen Gunter Saake Kai-Uwe Sattler 2. Auflage Data Warehouse Technologien Inhaltsverzeichnis Inhaltsverzeichnis ix 1 Einführung in Data-Warehouse-Systeme 1 1.1 Anwendungsszenario Getränkemarkt...

Mehr

Data Mining mit RapidMiner

Data Mining mit RapidMiner Motivation Data Mining mit RapidMiner CRISP: DM-Prozess besteht aus unterschiedlichen Teilaufgaben Datenvorverarbeitung spielt wichtige Rolle im DM-Prozess Systematische Evaluationen erfordern flexible

Mehr

VII.3 Assoziationsregeln

VII.3 Assoziationsregeln VII.3 Assoziationsregelverfahren VII.3. Einführung [Bollinger 96] VII.3 Assoziationsregeln Algorithmen zum Entdecken von Assoziationsregeln sind typische Vertreter von Data Mining Verfahren. Assoziationsregeln

Mehr

FernUniversität in Hagen. Seminar 01912 Data Mining im Sommersemester 2008 Häufige Muster und Assoziationsregeln. Thema 1.1.1 Der Apriori-Algorithmus

FernUniversität in Hagen. Seminar 01912 Data Mining im Sommersemester 2008 Häufige Muster und Assoziationsregeln. Thema 1.1.1 Der Apriori-Algorithmus FernUniversität in Hagen Seminar 01912 Data Mining im Sommersemester 2008 Häufige Muster und Assoziationsregeln Thema 1.1.1 Der Apriori-Algorithmus Referentin: Olga Riener Olga Riener. Thema 1.1.1. Der

Mehr

Data Mining (ehem. Entscheidungsunterstützungssysteme)

Data Mining (ehem. Entscheidungsunterstützungssysteme) Data Mining (ehem. Entscheidungsunterstützungssysteme) Melanie Pfoh Anja Tetzner Christian Schieder Übung WS 2014/15 AGENDA TEIL 1 Aufgabe 1 (Wiederholung OPAL / Vorlesungsinhalte) ENTSCHEIDUNG UND ENTSCHEIDUNGSTHEORIE

Mehr

BERÜCKSICHTIGUNG INTELLIGENTER GEBÄUDEAUTOMATION IM NEUEN GEBÄUDE-ENERGIEAUSWEIS

BERÜCKSICHTIGUNG INTELLIGENTER GEBÄUDEAUTOMATION IM NEUEN GEBÄUDE-ENERGIEAUSWEIS Fakultät Informatik, Institut für Angewandte Informatik, Professur für Technische Informationssysteme BERÜCKSICHTIGUNG INTELLIGENTER GEBÄUDEAUTOMATION IM NEUEN GEBÄUDE-ENERGIEAUSWEIS Vortragender: Alexander

Mehr

Präsentation der Bachelorarbeit

Präsentation der Bachelorarbeit Präsentation der Bachelorarbeit Einrichtung einer BI-Referenzumgebung mit Oracle 11gR1 Jörg Bellan Hochschule Ulm Fakultät Informatik Institut für Betriebliche Informationssysteme 15. Oktober 2009 Agenda

Mehr

Knowledge Discovery In Databases. Data Mining - Der moderne Goldrausch?

Knowledge Discovery In Databases. Data Mining - Der moderne Goldrausch? Oberseminar Data Mining 07. April 2010 Methodik des Data Mining Knowledge Discovery In Databases oder auch Data Mining - Der moderne Goldrausch? Data Mining...? Hochleistungsrechnen Geoinformationssysteme

Mehr

Data Mining Software. Funktionsvergleich und Benchmarkstudie. -Zusammenfassung-

Data Mining Software. Funktionsvergleich und Benchmarkstudie. -Zusammenfassung- Data Mining Software Funktionsvergleich und Benchmarkstudie -Zusammenfassung- mayato -Studie Data Mining Software 2009 Analyseerfolge zu überschaubaren Kosten Der Markt für Data-Mining-Software ist in

Mehr

CSGIS Gbr Canalejo & Schönbuchner GIS. Der VfS Viewer: Ein auf Open Source basiertes Web GIS zur Information von Waldbesitzern in Bayern

CSGIS Gbr Canalejo & Schönbuchner GIS. Der VfS Viewer: Ein auf Open Source basiertes Web GIS zur Information von Waldbesitzern in Bayern Der VfS Viewer: Ein auf Open Source basiertes Web GIS zur Information von Waldbesitzern in Bayern Gliederung Präsentation VfS Von analogen Standortkarten zu digitalen Daten Einleitung zum forstlichen Informationssystem

Mehr

Überblick. Seminar Beauty is our Business Tipps zur Ausarbeitung. 12.7.2007 Felix Naumann

Überblick. Seminar Beauty is our Business Tipps zur Ausarbeitung. 12.7.2007 Felix Naumann Seminar Beauty is our Business Tipps zur Ausarbeitung 12.7.2007 Felix Naumann Überblick 2 Organisatorisches Tipps zur Ausarbeitung Literatur Ihre Gliederungen 1 Organisatorisches 3 Heute letzter Termin

Mehr

Fortgeschrittene Analysetechnologien: Abgrenzung, Produktübersicht, Erfolgsfaktoren

Fortgeschrittene Analysetechnologien: Abgrenzung, Produktübersicht, Erfolgsfaktoren Fortgeschrittene Analysetechnologien: Abgrenzung, Produktübersicht, Erfolgsfaktoren BI, Big Data, CRM Forum @ CeBIT 2015, Hannover, 19.03.2015 Patrick Keller, Senior Analyst Status Quo Business Intelligence

Mehr

Die Bedeutung der Prozessmodellierung bei der Weiterentwicklung des DWHs der DAK Der Innovator als Missing Link

Die Bedeutung der Prozessmodellierung bei der Weiterentwicklung des DWHs der DAK Der Innovator als Missing Link Die Bedeutung der Prozessmodellierung bei der Weiterentwicklung des DWHs der DAK Der Innovator als Missing Link Konrad Linner, solvistas GmbH Nürnberg, 20.November 2012 Inhaltsverzeichnis Vorstellung solvistas

Mehr

Data Warehouse Technologien

Data Warehouse Technologien mitp Professional Data Warehouse Technologien von Veit Köppen, Gunter Saake, Kai-Uwe Sattler 2. Auflage 2014 Data Warehouse Technologien Köppen / Saake / Sattler schnell und portofrei erhältlich bei beck-shop.de

Mehr

Vom Suchen und Finden individueller Empfehlungen aus großen Objektmengen. PD Dr.-Ing. habil. Meike Klettke meike.klettke@uni-rostock.

Vom Suchen und Finden individueller Empfehlungen aus großen Objektmengen. PD Dr.-Ing. habil. Meike Klettke meike.klettke@uni-rostock. Vom Suchen und Finden individueller Empfehlungen aus großen Objektmengen PD Dr.-Ing. habil. Meike Klettke meike.klettke@uni-rostock.de 1 Informationsflut Amazon: Alle lieferbaren Bücher (930.000 Titeln

Mehr

PPC und Data Mining. Seminar aus Informatik LV-911.039. Michael Brugger. Fachbereich der Angewandten Informatik Universität Salzburg. 28.

PPC und Data Mining. Seminar aus Informatik LV-911.039. Michael Brugger. Fachbereich der Angewandten Informatik Universität Salzburg. 28. PPC und Data Mining Seminar aus Informatik LV-911.039 Michael Brugger Fachbereich der Angewandten Informatik Universität Salzburg 28. Mai 2010 M. Brugger () PPC und Data Mining 28. Mai 2010 1 / 14 Inhalt

Mehr

On-Line Analytical Processing

On-Line Analytical Processing OLAP und Data Mining ƒ OLAP Begriff Coddsche Regeln FASMI Operationen und Anfragesprachen ƒ Data Mining Begriff und Prozeß Verfahren Vorlesung Data-Warehouse-Technologien 9-1 On-Line Analytical Processing

Mehr

Recommender-gestützte Erweiterung der Discovery in Geoportalen

Recommender-gestützte Erweiterung der Discovery in Geoportalen 232 Recommender-gestützte Erweiterung der Discovery in Geoportalen Bernhard VOCKNER und Manfred MITTLBÖCK Zusammenfassung Geoportale stellen zentrale Zugriffspunkte auf geographische (Metadaten-)Information

Mehr

OLAP und Data Mining. On-Line Analytical Processing. Coddsche Regeln OLAP. Data Mining. Begriff Coddsche Regeln FASMI Operationen und Anfragesprachen

OLAP und Data Mining. On-Line Analytical Processing. Coddsche Regeln OLAP. Data Mining. Begriff Coddsche Regeln FASMI Operationen und Anfragesprachen OLAP und Data Mining OLAP Begriff Coddsche Regeln FASMI Operationen und Anfragesprachen Data Mining Begriff und Prozeß Verfahren Vorlesung Data-Warehouse-Technologien 9-1 On-Line Analytical Processing

Mehr

Kapitel 1: Einleitung

Kapitel 1: Einleitung Ludwig-Maximilians-Universität München Institut für Informatik Lehr- und Forschungseinheit für Datenbanksysteme Skript zur Vorlesung Knowledge Discovery in Databases im Sommersemester 2013 Kapitel 1: Einleitung

Mehr

Seminar im Sommersemester 2005 DATA WAREHOUSING. Data Mining. Christian Knappe. Fachrichtung Wirtschaftsinformatik Friedrich-Schiller-Universität Jena

Seminar im Sommersemester 2005 DATA WAREHOUSING. Data Mining. Christian Knappe. Fachrichtung Wirtschaftsinformatik Friedrich-Schiller-Universität Jena Seminar im Sommersemester 2005 DATA WAREHOUSING Data Mining Christian Knappe Fachrichtung Wirtschaftsinformatik Friedrich-Schiller-Universität Jena Fakultät für Mathematik und Informatik Lehrstuhl für

Mehr

Wissensentdeckung in Datenbanken / Data Mining

Wissensentdeckung in Datenbanken / Data Mining Datenflut! Immer mehr Daten werden generiert:! Banken, Telecom, Geschäftstransaktionen...! Wissenschaftliche Daten: Astronomie, Biologie,...! Web, Text, e-commerce!! Speichertechnik schneller and billiger!

Mehr

Einführung in die Wissensverarbeitung und Data Mining

Einführung in die Wissensverarbeitung und Data Mining Einführung in die Wissensverarbeitung und Data Mining Peter Becker FH Bonn-Rhein-Sieg Fachbereich Angewandte Informatik!" $# Vorlesung Wintersemester 2001/02 1. Einführung Vorbemerkungen 1 Einführung Vorbemerkungen

Mehr

Ihr Microsoft Spezialist für Migrationen, Upgrades und Infrastruktur-Konzeption für Microsoft SQL Server und Microsoft SharePoint.

Ihr Microsoft Spezialist für Migrationen, Upgrades und Infrastruktur-Konzeption für Microsoft SQL Server und Microsoft SharePoint. Ihr Microsoft Spezialist für Migrationen, und Infrastruktur-Konzeption für Microsoft und Microsoft SharePoint. Unsere Infrastructure Services unterstützen Kunden mit folgenden Angeboten: Migrationen von

Mehr

Nicht nur im Einzelhandel Die vielfältigen Einsatzgebiete der Assoziationsanalyse

Nicht nur im Einzelhandel Die vielfältigen Einsatzgebiete der Assoziationsanalyse Nicht nur im Einzelhandel Die vielfältigen Einsatzgebiete der Assoziationsanalyse von Peter Gerngroß Was ist Assoziationsanalyse? Das früheste bekannte Beispiel für die Nutzung von Assoziationsanalysen

Mehr

Management Support Systeme

Management Support Systeme Management Support Systeme WS 2004-2005 14.00-16.00 Uhr PD Dr. Peter Gluchowski Folie 1 Gliederung MSS WS 04/05 1. Einführung Management Support Systeme: Informationssysteme zur Unterstützung betrieblicher

Mehr

Seminar Business Intelligence Teil II. Data Mining & Knowledge Discovery

Seminar Business Intelligence Teil II. Data Mining & Knowledge Discovery Seminar Business Intelligence Teil II Data Mining & Knowledge Discovery Was ist Data Mining? Sabine Queckbörner Was ist Data Mining? Data Mining Was ist Data Mining? Nach welchen Mustern wird gesucht?

Mehr

Einführung in Data Mining mit Weka. Philippe Thomas Ulf Leser

Einführung in Data Mining mit Weka. Philippe Thomas Ulf Leser Einführung in Data Mining mit Weka Philippe Thomas Ulf Leser Data Mining Drowning in Data yet Starving for Knowledge Computers have promised us a fountain of wisdom but delivered a flood of data The non

Mehr

5. Assoziationsregeln

5. Assoziationsregeln 5. Generieren von Assoziationsregeln Grundbegriffe 5. Assoziationsregeln Assoziationsregeln beschreiben gewisse Zusammenhänge und Regelmäßigkeiten zwischen verschiedenen Dingen, z.b. den Artikeln eines

Mehr

R-Akademie Kursangebot November 2012

R-Akademie Kursangebot November 2012 Kooperationspartner der R-Akademie Kursangebot November 2012 Was ist R? R ist eine Open Source Programmiersprache zur statistischen Datenanalyse und -visualisierung. Mittlerweile hat sich R, neben den

Mehr

Kapitel 17: Date Warehouse

Kapitel 17: Date Warehouse Kapitel 17: Date Warehouse 1 OLTP versus OLAP OLTP (Online Transaction Processing) z.b. Flugreservierung, Handelsunternehmen kleine, kurze Transaktionen jeweils auf jüngstem Zustand OLAP (Online Analytical

Mehr

6. Überblick zu Data Mining-Verfahren

6. Überblick zu Data Mining-Verfahren 6. Überblick zu Data Mining-Verfahren Einführung Clusteranalyse k-means-algorithmus Canopy Clustering Klassifikation Klassifikationsprozess Konstruktion eines Entscheidungsbaums Assoziationsregeln / Warenkorbanalyse

Mehr

Industrie 4.0 und Smart Data

Industrie 4.0 und Smart Data Industrie 4.0 und Smart Data Herausforderungen für die IT-Infrastruktur bei der Auswertung großer heterogener Datenmengen Richard Göbel Inhalt Industrie 4.0 - Was ist das? Was ist neu? Herausforderungen

Mehr

8.1 Temporal Data Mining. 8. Besondere Datentypen und Anwendungen. 8.1 Temporal Data Mining. 8.1 Zeitreihen-Analyse. Problemstellung.

8.1 Temporal Data Mining. 8. Besondere Datentypen und Anwendungen. 8.1 Temporal Data Mining. 8.1 Zeitreihen-Analyse. Problemstellung. 8. Besondere Datentypen und Anwendungen Inhalt dieses Kapitels 8.1 Temporal Data Mining, Sequential Patterns, Modifikation des Apriori-Algorithmus 8.2 Spatial Data Mining Aufgaben und Probleme, typische

Mehr

Anforderungsverarbeitung zur kundenorientierten Planung technischer Anlagen am Beispiel der Intralogistik. Vortragender: Dipl.-Inf.

Anforderungsverarbeitung zur kundenorientierten Planung technischer Anlagen am Beispiel der Intralogistik. Vortragender: Dipl.-Inf. sverarbeitung zur kundenorientierten Planung technischer Anlagen am Beispiel der Intralogistik Forderungsgerechte Auslegung von intralogistischen Systemen Vortragender: Dipl.-Inf. Jonas Mathis Universität

Mehr

Schnelle und genaue Routenplanung

Schnelle und genaue Routenplanung Sanders/Schultes: Routenplanung 1 Schnelle und genaue Routenplanung Peter Sanders Dominik Schultes Institut für Theoretische Informatik Algorithmik II Universität Karlsruhe Uni für Einsteiger, 22. November

Mehr

HP Asset LiVe. Carsten Bernhardt, HP Software Presales

HP Asset LiVe. Carsten Bernhardt, HP Software Presales HP Asset LiVe Carsten Bernhardt, HP Software Presales HP Asset LiVe Einführung Ergebnisse Sie fragen wir antworten 2 HP Asset LiVe Einführung HP Asset LiVe? Wieder ein anglistisches Akronym oder HP Asset

Mehr

Selbststeuerung in der Logistik

Selbststeuerung in der Logistik Fakultät Informatik, Institut für Angewandte Informatik, Professur für Technische Informationssysteme Proseminar Technische Informationssysteme Selbststeuerung in der Logistik René Fierdel Dresden, 29.06.2012

Mehr

Prüfungsberatungs-Stunde Datenbanksysteme 1 (Dbs1)

Prüfungsberatungs-Stunde Datenbanksysteme 1 (Dbs1) Prüfungsberatungs-Stunde Datenbanksysteme 1 (Dbs1) Herbstsemester 2013/14 Prof. S. Keller Informatik HSR Januar 2014, HS13/14 Dbs1 - Prüfungsvorbereitung 1 Dbs1 Ziele Grundlagenwissen in folgenden Gebieten

Mehr

Vorlesung Text und Data Mining S9 Text Clustering. Hans Hermann Weber Univ. Erlangen, Informatik

Vorlesung Text und Data Mining S9 Text Clustering. Hans Hermann Weber Univ. Erlangen, Informatik Vorlesung Text und Data Mining S9 Text Clustering Hans Hermann Weber Univ. Erlangen, Informatik Document Clustering Überblick 1 Es gibt (sehr viele) verschiedene Verfahren für das Bilden von Gruppen Bei

Mehr

STUDIE BI/DWH Daten-, Projekt- und Prozessmanagement 2005, Status quo

STUDIE BI/DWH Daten-, Projekt- und Prozessmanagement 2005, Status quo STUDIE BI/DWH Daten-, Projekt- und Prozessmanagement 2005, Status quo Der Erfolgreichste im Leben ist der, der am besten informiert wird. Benjamin Disraeli (1804-81) Summary Nach einer grundlegenden Einführung

Mehr

Web Mining effektive Analyse des Nutzer- Verhaltens im Internet

Web Mining effektive Analyse des Nutzer- Verhaltens im Internet Web Mining effektive Analyse des Nutzer- Verhaltens im Internet Dr. Frank Säuberlich Business Unit e-intelligence SAS Deutschland Agenda 1. Begriffsdefinition e-intelligence: Systemdimension Angebotsdimension

Mehr

Vorlesungsplan. Von Naïve Bayes zu Bayesischen Netzwerk- Klassifikatoren. Naïve Bayes. Bayesische Netzwerke

Vorlesungsplan. Von Naïve Bayes zu Bayesischen Netzwerk- Klassifikatoren. Naïve Bayes. Bayesische Netzwerke Vorlesungsplan 17.10. Einleitung 24.10. Ein- und Ausgabe 31.10. Reformationstag, Einfache Regeln 7.11. Naïve Bayes, Entscheidungsbäume 14.11. Entscheidungsregeln, Assoziationsregeln 21.11. Lineare Modelle,

Mehr

Stefan Ebener, Manager Presales Consulting NetApp Deutschland GmbH

Stefan Ebener, Manager Presales Consulting NetApp Deutschland GmbH Bestimmung des Herstellereinflusses auf die Auftragswahrscheinlichkeit von öffentlichen Ausschreibungen mittels systematisierter Text- und Metadaten-Analyse* Stefan Ebener, Manager Presales Consulting

Mehr

Leseprobe. Holger Schrödl. Business Intelligence mit Microsoft SQL Server 2008. BI-Projekte erfolgreich umsetzen ISBN: 978-3-446-41210-1

Leseprobe. Holger Schrödl. Business Intelligence mit Microsoft SQL Server 2008. BI-Projekte erfolgreich umsetzen ISBN: 978-3-446-41210-1 Leseprobe Holger Schrödl Business Intelligence mit Microsoft SQL Server 2008 BI-Projekte erfolgreich umsetzen ISBN: 978-3-446-41210-1 Weitere Informationen oder Bestellungen unter http://www.hanser.de/978-3-446-41210-1

Mehr

Data Mining und Knowledge Discovery in Databases

Data Mining und Knowledge Discovery in Databases Data Mining und Knowledge Discovery in Databases Begriffsabgrenzungen... Phasen der KDD...3 3 Datenvorverarbeitung...4 3. Datenproblematik...4 3. Möglichkeiten der Datenvorverarbeitung...4 4 Data Mining

Mehr

Suchdienste für Dokumente

Suchdienste für Dokumente Wer aufhört zu werben, um Geld zu sparen, kann ebenso seine Uhr anhalten, um Zeit zu sparen. (Henry Ford, 1863-1947) Suchdienste für Dokumente Vergleich von Ansätzen zur Suche, Navigation und Präsentation

Mehr

Automatisierte Dossier- Erstellung mittels Text-Mining

Automatisierte Dossier- Erstellung mittels Text-Mining Automatisierte Dossier- Erstellung mittels Text-Mining Paul Assendorp Grundseminar 11.12.2014 Paul Assendorp Automatisierte Dossier-Erstellung 1 Gliederung Motivation Textmining Tools Aktueller Stand Ausblick

Mehr

Lehrangebot. Fachgebiet Informationssysteme Prof. Dr. Norbert Fuhr. N. Fuhr, U. Duisburg-Essen. Lehrangebot

Lehrangebot. Fachgebiet Informationssysteme Prof. Dr. Norbert Fuhr. N. Fuhr, U. Duisburg-Essen. Lehrangebot Lehrangebot Fachgebiet Informationssysteme Prof. Dr. Norbert Fuhr N. Fuhr, U. Duisburg-Essen Lehrangebot 1 Lehrangebot des FG Informationssysteme Datenbanken Internet-Suchmaschinen Information Retrieval

Mehr

Advanced Analytics. Michael Ridder. Copyright 2000-2014 TIBCO Software Inc.

Advanced Analytics. Michael Ridder. Copyright 2000-2014 TIBCO Software Inc. Advanced Analytics Michael Ridder Was ist Advanced Analytics? 2 Was heißt Advanced Analytics? Advanced Analytics ist die autonome oder halbautonome Prüfung von Daten oder Inhalten mit ausgefeilten Techniken

Mehr