Künstliche Neuronale Netze und Data Mining

Größe: px
Ab Seite anzeigen:

Download "Künstliche Neuronale Netze und Data Mining"

Transkript

1 Künstliche Neuronale Netze und Data Mining Catherine Janson, icasus GmbH Heidelberg Abstract Der Begriff "künstliche Neuronale Netze" fasst Methoden der Informationstechnik zusammen, deren Entwicklung durch vergleichende Betrachtung der Arbeitsweisen von Computer und menschlichem Gehirn motiviert war. Unter anderem können damit Aufgaben zur Klassifikation und Vorhersage erfüllt werden, die typischerweise im Data Mining auftreten. Im angebotenen Vortrag wird nach einer kurzen Einführung / Auffrischung in das Thema Data Mining zunächst der theoretische Hintergrund vorwärtsgerichteter Neuronaler Netze behandelt (Schlagworte sind: Berechnungselemente, Netzarchitektur, Lernen / Training). Zum Vergleich werden auch kurz weitere Klassifikationsverfahren besprochen. Anschliessend werden die Methoden an einem Klassifikationsbeispiel mit Hilfe des SAS Enterprise Miner demonstriert. 1

2 Definition Data Mining DM ist ein Prozeß, aus großen, bislang unübersehbaren Datenmengen nichttriviale Informationen zu gewinnen, die bisher unbekannt waren und die in konkrete Aktionen und Business-Entscheidungen umsetzbar sind. Interdisziplinäres Feld: Techniken aus Visualisierung, machine learning, Mustererkennung, Statistik allgemeine Aufgaben Aufdeckung unbekannter Gesetzmäßigkeiten, Gruppierungen in Beobachtungen oder Variablen - Visualisierung, explorative Datenanalyse, Clusterverfahren, Faktorenanalyse Herausfiltern derjenigen Informationen / Variablen, die für eine Vorhersage / Klassifikation relevant sind - Variablenselektion Prognose auf Basis von Informationen aus der Vergangenheit - überwachte Klassifikation, Funktionsanpassung 2

3 Ziel / Anwendungsgebiete Database-Marketing: gezieltere Marketing-Maßnahmen auf Basis von Kundendaten Customer Relationship Management: Segmentierung des Kundenbestandes in homogene Gruppen (Eigenschaften / Kaufverhalten) Identifikation profitabler / nicht profitabler Kunden (Scoring) Identifikation absprunggefährdeter Kunden, Bindung / Rückgewinnung weitere Anwendungsgebiete: Produkt-/Angebotsgestaltung / Warenpräsentation Cross-Selling Preis-/Tarifgestaltung Lagerhaltung, Disposition, Nachfrageprognose Aufdecken von Betrug Bonitätsprüfung / Kreditscoring Entwicklungsprognosen (Netzauslastung, Kundenzahl) WEB-Mining personalisierte Seiten, Seitenstruktur / Nutzerführung 3

4 Branchen: Zugang, elektronische Haltung von (umfangreichen) Kundendaten: Banken, Versicherungen, Versandhandel, Telekommunikation, -Business Datenbasis: Kundeneigenschaften - Alter, Geschlecht, Beruf, Familie, Lifestyle Kundenverhalten - Produktpräferenz, Kauffrequenz, Dauer der Geschäftsbeziehung externe Daten - sozioökonomische Daten DM-Prozess SEMMA : Sample: Stichprobenziehen, Partitionierung Explore: Hypothesengenerierung, (multidimensionale) Visualisierung, Plausibilitäts- Konsistenzprüfung, Assoziations-, Sequenzanalysen Modifikation: Ausreisser, Missings, Transformation, Faktorenanalyse Modellierung: Regression, Entscheidungsbaum, Neuronale Netze, Diskriminanzanalyse, Zeitreihen Auswertung: Modellbewertung, -vergleich 4

5 Klassifikationsverfahren Unüberwachte Klassifikation: Klassifizieren der Daten nur aufgrund der erfaßten Merkmale, keine a priori Klassen-Variable vorhanden. > Clusterverfahren Überwachte Klassifikation: Erstellen eines Modells (Abbildungsvorschrift) auf Basis vorhandener Klasseninformation. Anwendung des Modells auf neue Daten > (logistische) Regression, Entscheidungsbäume, Neuronale Netze, Diskriminanzanalysen Klassifikation, Scoring: qualitative Zielgröße (kauft / kauft nicht) Vorhersage: quantitative Zielgröße (Absatzprognose) (Künstliche) Neuronale Netze Idee: Verknüpfung von einfachen Berechungseinheiten Neuronale Netze als Sammelbegriff für flexible, nichtlineare Modelle Vielzahl von Architekturen, Trainingsalgorithmen, Aktivierungs- und Schwellwertfunktionen, Fehlerfunktionen hier: vorwärtsgerichtete NN Input: Unabhängige Gewichtung Variablen, Einflußfaktoren Output: abhängige Variablen, Klassifikation, Zielgröße 5

6 Neuronale Netze: ein Berechnungselement (hier: Multilayer Perceptron) o i W i,j o i+1 o i+2 W i+1,j W i+2,j W i+3,j Σ f() Ausgabe: f(θ j + Σ ni w ij o i ) o i+3 o i+4 W i+4,j +θ j Schwellwertfunktion f Aktivierungsfunktion sigmoid, z.b. tanh,(1+e -x ) -1 Neuronale Netze: Architektur bedingt Modellgleichung logistische Regression, falls f logistisch, multivariate lineare Regression, f linear: out = f(θ i + Σ i w i in i ) multivariate, multiple nichtlineare Regression: out k = f(θ k + Σ nh w jk f(θ j + Σ ni w ij in i ) 6

7 Lernen = Schätzen der Parameter wiederholte Präsentation der Trainingsdaten und Anpassung der Gewichte w jk mit dem Ziel Minimierung des Klassifikationsfehlers bzw. der Fehlerfunktion, z.b. Quadratsumme (beobachtete erwartete Ausgabe) über alle Ausgabe-Einheiten und alle Trainingsbeobachtungen Fehlerfunktion E = Σ np Σ no (t ik o ik ) 2 Lernen : Trainingsalgorithmus Gradientenabstiegsverfahren (Modifikationen des Backpropagation Algorithmus) wjk = γ E wjk? Lokale Minima Startpunkt 7

8 Probleme Stichprobengröße N Anzahl zu schätzender Parameter Np Daumenregel: N > 5 bis 25 mal Np Modellkomplexität Überanpassung an Trainingsdaten (Overtraining) -> Daten- Partition und Nutzung von Validierungsdaten Interpretierbarkeit Neural networks are especially useful for prediction problems where: no mathematical formula is known that relates inputs to outputs. prediction is more important than explanation. there is lots of training data. 8

9 Optimum der Fehlerfunktion 9

Data Mining mit der SEMMA Methodik. Reinhard Strüby, SAS Institute Stephanie Freese, Herlitz PBS AG

Data Mining mit der SEMMA Methodik. Reinhard Strüby, SAS Institute Stephanie Freese, Herlitz PBS AG Data Mining mit der SEMMA Methodik Reinhard Strüby, SAS Institute Stephanie Freese, Herlitz PBS AG Data Mining Data Mining: Prozeß der Selektion, Exploration und Modellierung großer Datenmengen, um Information

Mehr

TNS EX A MINE BehaviourForecast Predictive Analytics for CRM. TNS Infratest Applied Marketing Science

TNS EX A MINE BehaviourForecast Predictive Analytics for CRM. TNS Infratest Applied Marketing Science TNS EX A MINE BehaviourForecast Predictive Analytics for CRM 1 TNS BehaviourForecast Warum BehaviourForecast für Sie interessant ist Das Konzept des Analytischen Customer Relationship Managements (acrm)

Mehr

9 Resümee. Resümee 216

9 Resümee. Resümee 216 Resümee 216 9 Resümee In der vorliegenden Arbeit werden verschiedene Methoden der Datenreduktion auf ihre Leistungsfähigkeit im sozialwissenschaftlichstatistischen Umfeld anhand eines konkreten Anwendungsfalls

Mehr

Tiefgreifende Prozessverbesserung und Wissensmanagement durch Data Mining

Tiefgreifende Prozessverbesserung und Wissensmanagement durch Data Mining Tiefgreifende Prozessverbesserung und Wissensmanagement durch Data Mining Ausgangssituation Kaizen Data Mining ISO 9001 Wenn andere Methoden an ihre Grenzen stoßen Es gibt unzählige Methoden, die Abläufe

Mehr

Data Mining - Marketing-Schlagwort oder ernstzunehmende Innovation?

Data Mining - Marketing-Schlagwort oder ernstzunehmende Innovation? 1. Konferenz der A Benutzer KFE in Forschung und Entwicklung Data Mining - Marketing-chlagwort oder ernstzunehmende Innovation? Hans-Peter Höschel,, Heidelberg 1. Konferenz der A Benutzer KFE in Forschung

Mehr

Predictive Modeling Markup Language. Thomas Morandell

Predictive Modeling Markup Language. Thomas Morandell Predictive Modeling Markup Language Thomas Morandell Index Einführung PMML als Standard für den Austausch von Data Mining Ergebnissen/Prozessen Allgemeine Struktur eines PMML Dokuments Beispiel von PMML

Mehr

MS SQL Server 2012 (4)

MS SQL Server 2012 (4) MS SQL Server 2012 (4) Data Mining, Analyse und multivariate Verfahren Marco Skulschus Jan Tittel Marcus Wiederstein Webseite zum Buch: http://vvwvv.comelio-medien.com/buch-kataiog/ms sql_server/ms sql

Mehr

Automatische Mustererkennung zur Klassifikation von Konsumentenverhalten am Beispiel der Kreditwürdigkeitsprüfung

Automatische Mustererkennung zur Klassifikation von Konsumentenverhalten am Beispiel der Kreditwürdigkeitsprüfung Prof. Dr. Gerhard Arminger Dipl.-Ök. Alexandra Schwarz Bergische Universität Wuppertal Fachbereich Wirtschaftswissenschaft Fach Statistik Automatische Mustererkennung zur Klassifikation von Konsumentenverhalten

Mehr

Data-Mining: Ausgewählte Verfahren und Werkzeuge

Data-Mining: Ausgewählte Verfahren und Werkzeuge Fakultät Informatik Institut für Angewandte Informatik Lehrstuhl Technische Informationssysteme Data-Mining: Ausgewählte Verfahren und Vortragender: Jia Mu Betreuer: Dipl.-Inf. Denis Stein Dresden, den

Mehr

Begriffsbestimmung CRISP-DM-Modell Betriebswirtschaftliche Einsatzgebiete des Data Mining Web Mining und Text Mining

Begriffsbestimmung CRISP-DM-Modell Betriebswirtschaftliche Einsatzgebiete des Data Mining Web Mining und Text Mining Gliederung 1. Einführung 2. Grundlagen Data Mining Begriffsbestimmung CRISP-DM-Modell Betriebswirtschaftliche Einsatzgebiete des Data Mining Web Mining und Text Mining 3. Ausgewählte Methoden des Data

Mehr

Allgemeine Regressionsanalyse. Kovariablen / Prädiktoren / unabhängige Variablen X j R d, evtl. deterministisch

Allgemeine Regressionsanalyse. Kovariablen / Prädiktoren / unabhängige Variablen X j R d, evtl. deterministisch Prof. Dr. J. Franke Statistik II für Wirtschaftswissenschaftler 9.1 Allgemeine Regressionsanalyse Daten (X j, Y j ), j = 1,..., N unabhängig Kovariablen / Prädiktoren / unabhängige Variablen X j R d, evtl.

Mehr

Qualitäts- und Kostenoptimierung von verfahrenstechnischen Prozessen mit Data-Mining-Methoden

Qualitäts- und Kostenoptimierung von verfahrenstechnischen Prozessen mit Data-Mining-Methoden Qualitäts- und Kostenoptimierung von verfahrenstechnischen Prozessen mit Data-Mining-Methoden Dr. Thomas Bernard 6. Karlsruher Automations-Treff (KAT) Leit- und Automatisierungstechnik der Zukunft Karlsruhe,

Mehr

Data Mining und maschinelles Lernen

Data Mining und maschinelles Lernen Data Mining und maschinelles Lernen Einführung und Anwendung mit WEKA Caren Brinckmann 16. August 2000 http://www.coli.uni-sb.de/~cabr/vortraege/ml.pdf http://www.cs.waikato.ac.nz/ml/weka/ Inhalt Einführung:

Mehr

26. GIL Jahrestagung

26. GIL Jahrestagung GeorgAugustUniversität Göttingen 26. GIL Jahrestagung Einsatz von künstlichen Neuronalen Netzen im Informationsmanagement der Land und Ernährungswirtschaft: Ein empirischer Methodenvergleich Holger Schulze,

Mehr

Data Mining (ehem. Entscheidungsunterstützungssysteme)

Data Mining (ehem. Entscheidungsunterstützungssysteme) Data Mining (ehem. Entscheidungsunterstützungssysteme) Melanie Pfoh Anja Tetzner Christian Schieder Übung WS 2014/15 AGENDA TEIL 1 Aufgabe 1 (Wiederholung OPAL / Vorlesungsinhalte) ENTSCHEIDUNG UND ENTSCHEIDUNGSTHEORIE

Mehr

Commercial Banking Übung 1 Kreditscoring

Commercial Banking Übung 1 Kreditscoring Commercial Banking Übung Kreditscoring Dr. Peter Raupach raupach@wiwi.uni-frankfurt.de Sprechzeit Dienstag 6-7:00 Uhr Raum 603 B Kreditscoring Gliederung Grundanliegen Das Sample Modellspezifikation Diskriminanzanalyse

Mehr

Algorithmische Modelle als neues Paradigma

Algorithmische Modelle als neues Paradigma Algorithmische Modelle als neues Paradigma Axel Schwer Seminar über Philosophische Grundlagen der Statistik, WS 2010/11 Betreuer: Prof. Dr. Thomas Augustin München, den 28. Januar 2011 1 / 29 LEO BREIMAN

Mehr

Inhaltsverzeichnis. I Einführung in STATISTICA 1. 1 Erste Schritte in STATISTICA 3

Inhaltsverzeichnis. I Einführung in STATISTICA 1. 1 Erste Schritte in STATISTICA 3 I Einführung in STATISTICA 1 1 Erste Schritte in STATISTICA 3 2 Datenhaltung in STATISTICA 11 2.1 Die unterschiedlichen Dateitypen in STATISTICA....... 11 2.2 Import von Daten......... 12 2.3 Export von

Mehr

Webinar, 28.11.2013. Verborgene Schätze heben. Data Mining mit dem Microsoft SQL Server. Thomas Jahnke Martin Oesterer. HMS Analytical Software GmbH

Webinar, 28.11.2013. Verborgene Schätze heben. Data Mining mit dem Microsoft SQL Server. Thomas Jahnke Martin Oesterer. HMS Analytical Software GmbH Webinar, 28.11.2013 Verborgene Schätze heben Data Mining mit dem Microsoft SQL Server Thomas Jahnke Martin Oesterer HMS Analytical Software GmbH 1 Unsere heutige Agenda Verborgene Schätze heben Herzlich

Mehr

Proseminar - Data Mining

Proseminar - Data Mining Proseminar - Data Mining SCCS, Fakultät für Informatik Technische Universität München SS 2012, SS 2012 1 Data Mining Pipeline Planung Aufbereitung Modellbildung Auswertung Wir wollen nützliches Wissen

Mehr

Datengrab oder Goldgrube: Steigerung der Prozess-Effizienz und Produktqualität mit Data-Mining-Methoden

Datengrab oder Goldgrube: Steigerung der Prozess-Effizienz und Produktqualität mit Data-Mining-Methoden Datengrab oder Goldgrube: Steigerung der Prozess-Effizienz und Produktqualität mit Data-Mining-Methoden Dr. Thomas Bernard Fraunhofer-Institut für Systemtechnik, Optronik und Bildauswertung Karlsruhe HANNOVER

Mehr

CRM intern - Mit Data-Mining die besten Kunden finden

CRM intern - Mit Data-Mining die besten Kunden finden Hans-Peter Höschel 2008 AGI-Information Management Consultants May be used for personal purporses only or by libraries associated to dandelon.com network. CRM intern - Mit Data-Mining die besten Kunden

Mehr

Personalisierung. Der Personalisierungsprozess Nutzerdaten erheben aufbereiten auswerten Personalisierung. Data Mining.

Personalisierung. Der Personalisierungsprozess Nutzerdaten erheben aufbereiten auswerten Personalisierung. Data Mining. Personalisierung Personalisierung Thomas Mandl Der Personalisierungsprozess Nutzerdaten erheben aufbereiten auswerten Personalisierung Klassifikation Die Nutzer werden in vorab bestimmte Klassen/Nutzerprofilen

Mehr

Entfesseln Sie Ihr Potential als Realzeit-Unternehmen!

Entfesseln Sie Ihr Potential als Realzeit-Unternehmen! Entfesseln Sie Ihr Potential als Realzeit-Unternehmen! CC NOW 2013-19.9.13 in Düsseldorf Klaus-J. Zschaage authensis AG stellen Sie sich vor Seite 2 stellen Sie sich vor was ist dafür zu tun? Seite 3 Geschäftsoptimierung

Mehr

Data Mining mit Rapidminer im Direktmarketing ein erster Versuch. Hasan Tercan und Hans-Peter Weih

Data Mining mit Rapidminer im Direktmarketing ein erster Versuch. Hasan Tercan und Hans-Peter Weih Data Mining mit Rapidminer im Direktmarketing ein erster Versuch Hasan Tercan und Hans-Peter Weih Motivation und Ziele des Projekts Anwendung von Data Mining im Versicherungssektor Unternehmen: Standard

Mehr

Web Mining bei der VICTORIA Versicherung

Web Mining bei der VICTORIA Versicherung KSFE 2002 Web Mining bei der VICTORIA Versicherung Information Works Agenda Web Mining bei der VICTORIA Verfahren Auswertung Fazit Agenda Web Mining bei der VICTORIA Verfahren Auswertung Fazit Ausgangssituation:

Mehr

Was ist Data Mining... in der Fundraising Praxis?

Was ist Data Mining... in der Fundraising Praxis? Was ist Data Mining...... in der Fundraising Praxis? Erkennen von unbekannten Mustern in sehr grossen Datenbanken (> 1000 GB) wenige und leistungsfähige Verfahren Automatisierung Erkennen von unbekannten

Mehr

Verborgene Schätze heben

Verborgene Schätze heben Verborgene Schätze heben Data Mining mit dem Microsoft SQL Server Martin Oesterer Leiter Vertrieb HMS Analytical Software GmbH Data Mining. Was ist eigentlich wichtig? Data Mining ist: die Extraktion von

Mehr

(künstliche) Neuronale Netze. (c) Till Hänisch 2003,2015, DHBW Heidenheim

(künstliche) Neuronale Netze. (c) Till Hänisch 2003,2015, DHBW Heidenheim (künstliche) Neuronale Netze (c) Till Hänisch 2003,2015, DHBW Heidenheim Literatur zusätzlich zum Lit. Verz. Michael Negnevitsky, Artificial Intelligence, Addison Wesley 2002 Aufbau des Gehirns Säugetiergehirn,

Mehr

Machine Learning - Maschinen besser als das menschliche Gehirn?

Machine Learning - Maschinen besser als das menschliche Gehirn? Machine Learning - Maschinen besser als das menschliche Gehirn? Seminar Big Data Science Tobias Stähle 23. Mai 2014 KIT Universität des Landes Baden-Württemberg und nationales Forschungszentrum in der

Mehr

Inhaltsverzeichnis. Fragestellungen und Methoden 11. Vorwort 15. Kapitel 1 Einführung 17. Kapitel 2 Statistische Grundbegriffe 23

Inhaltsverzeichnis. Fragestellungen und Methoden 11. Vorwort 15. Kapitel 1 Einführung 17. Kapitel 2 Statistische Grundbegriffe 23 Fragestellungen und Methoden 11 Vorwort 15 Kapitel 1 Einführung 17 1.1 KonzeptiondesBuchs... 18 1.2 AufbaudesBuchs... 19 1.3 Programmversionen von PASW bzw. SPSS..... 20 1.4 WiekanndiesesBuchverwendetwerden?...

Mehr

Data/Information Quality Management

Data/Information Quality Management Data/Information Quality Management Seminar WI/Informationsmanagement im Sommersemester 2002 Markus Berberov, Roman Eder, Peter Gerstbach 11.6.2002 Inhalt! Daten und Datenqualität! Einführung und Definition!

Mehr

Neuronale Netze, Fuzzy Control, Genetische Algorithmen. Prof. Jürgen Sauer. 5. Aufgabenblatt: Neural Network Toolbox 1

Neuronale Netze, Fuzzy Control, Genetische Algorithmen. Prof. Jürgen Sauer. 5. Aufgabenblatt: Neural Network Toolbox 1 Neuronale Netze, Fuzzy Control, Genetische Algorithmen Prof. Jürgen Sauer 5. Aufgabenblatt: Neural Network Toolbox 1 A. Mit Hilfe der GUI vom Neural Network erstelle die in den folgenden Aufgaben geforderten

Mehr

Proseminar - Data Mining

Proseminar - Data Mining Proseminar - Data Mining SCCS, Fakultät für Informatik Technische Universität München SS 2014, SS 2014 1 Data Mining: Beispiele (1) Hausnummererkennung (Klassifikation) Source: http://arxiv.org/abs/1312.6082,

Mehr

Informationsflut bewältigen - Textmining in der Praxis

Informationsflut bewältigen - Textmining in der Praxis Informationsflut bewältigen - Textmining in der Praxis Christiane Theusinger Business Unit Data Mining & CRM Solutions SAS Deutschland Ulrich Reincke Manager Business Data Mining Solutions SAS Deutschland

Mehr

COMMERCIAL BANKING Sommersemester 2002 Wahrenburg / Raupach Aufgabenblatt 1. Aufgabenblatt 1

COMMERCIAL BANKING Sommersemester 2002 Wahrenburg / Raupach Aufgabenblatt 1. Aufgabenblatt 1 COMMERCIAL BANKING Sommersemester 2002 Wahrenburg / Raupach Aufgabenblatt Aufgabenblatt. (Präsentation zum Kreditscoring) 2. Sie haben einen Kredit an eine börsennotierte Firma XY vergeben. Bestimmen Sie

Mehr

Kapitel 4: Binäre Regression

Kapitel 4: Binäre Regression Kapitel 4: Binäre Regression Steffen Unkel (basierend auf Folien von Nora Fenske) Statistik III für Nebenfachstudierende WS 2013/2014 4.1 Motivation Ausgangssituation Gegeben sind Daten (y i, x i1,...,

Mehr

Inhalt. l Wie man die besten Kunden findet 1. HEREIN SPAZIERT 9

Inhalt. l Wie man die besten Kunden findet 1. HEREIN SPAZIERT 9 Inhalt 1. HEREIN SPAZIERT 9 l Wie man die besten Kunden findet U 2. KARRIERE- UND BERUFSAUSSICHTEN IM DATA-MINING 12 2.1 Verdienst-Möglichkeiten im Data-Mining 12 2.2 Was erwartet dich in deinem Job? 14

Mehr

Fachgruppe Statistik, Risikoanalyse & Computing. STAT672 Data Mining. Sommersemester 2007. Prof. Dr. R. D. Reiß

Fachgruppe Statistik, Risikoanalyse & Computing. STAT672 Data Mining. Sommersemester 2007. Prof. Dr. R. D. Reiß Fachgruppe Statistik, Risikoanalyse & Computing STAT672 Data Mining Sommersemester 2007 Prof. Dr. R. D. Reiß Überblick Data Mining Begrifflichkeit Unter Data Mining versteht man die Computergestützte Suche

Mehr

Predictive Analytics 25.06.2014. Prediction is very difficult, especially if it s about the future. (Bohr, Niels)

Predictive Analytics 25.06.2014. Prediction is very difficult, especially if it s about the future. (Bohr, Niels) Predictive Analytics München, 25. Juni 2014 Markus Enderlein, Stefan Jäschke, Gert Jan Feick TDWI Konferenz 2014 Prediction is very difficult, especially if it s about the future. (Bohr, Niels) 25.06.2014

Mehr

Motivation. Themenblock: Klassifikation. Binäre Entscheidungsbäume. Ansätze. Praktikum: Data Warehousing und Data Mining.

Motivation. Themenblock: Klassifikation. Binäre Entscheidungsbäume. Ansätze. Praktikum: Data Warehousing und Data Mining. Motivation Themenblock: Klassifikation Praktikum: Data Warehousing und Data Mining Ziel Item hat mehrere Attribute Anhand von n Attributen wird (n+)-tes vorhergesagt. Zusätzliches Attribut erst später

Mehr

MythMiner. Ein Empfehlungssystem für Fernsehprogramme auf Basis von RapidMiner. Balázs Bárány. Linuxwochen Wien, 7. 5. 2011

MythMiner. Ein Empfehlungssystem für Fernsehprogramme auf Basis von RapidMiner. Balázs Bárány. Linuxwochen Wien, 7. 5. 2011 Voraussetzungen für Data Mining und Text Mining Schluÿ Ein Empfehlungssystem für Fernsehprogramme auf Basis von RapidMiner Linuxwochen Wien, 7. 5. 2011 Voraussetzungen für Data Mining und Text Mining Schluÿ

Mehr

Azure Machine Learning

Azure Machine Learning Azure Machine Learning Alexander Wechsler Wechsler Consulting GmbH & Co. KG Was ist Machine Learning? Technologie zur Vorhersage Ermittlung von Wahrscheinlichkeiten mit Hilfe von Mustern in großen Datenmengen

Mehr

Market Basket Analysis oder: isst man Salat zum Schnitzel?

Market Basket Analysis oder: isst man Salat zum Schnitzel? Market Basket Analysis oder: isst man Salat zum Schnitzel? SAS Forum Switzerland, 07. Mai 2013 Ralph Wenzl Migros-Genossenschafts-Bund Customer & Web Intelligence Agenda 1 2 3 4 Muster in Warenkörben 3

Mehr

2. Microsoft Innovationstag Nord Integrierte Lösungen in der Öffentlichen Verwaltung

2. Microsoft Innovationstag Nord Integrierte Lösungen in der Öffentlichen Verwaltung 2. Microsoft Innovationstag Nord Integrierte Lösungen in der Öffentlichen Verwaltung Reporting, Analyse und Data Mining André Henkel, initions AG 22. und 23. Oktober 2013 in Hamburg

Mehr

Data Mining und Knowledge Discovery in Databases

Data Mining und Knowledge Discovery in Databases Data Mining und Knowledge Discovery in Databases Begriffsabgrenzungen... Phasen der KDD...3 3 Datenvorverarbeitung...4 3. Datenproblematik...4 3. Möglichkeiten der Datenvorverarbeitung...4 4 Data Mining

Mehr

DataMining in der polizeilichen Anwendung

DataMining in der polizeilichen Anwendung Hintergrund / Motivation DataMining in der polizeilichen Anwendung Heiko Held, BKA Wiesbaden Zur Zuständigkeit des Fachbereichs KI14 zählt u.a. die Marktbeobachtung und Toolauswahl im Bereich von Analysesoftware.

Mehr

Treffsichere Absatzprognosen durch Predictive Analytics

Treffsichere Absatzprognosen durch Predictive Analytics Treffsichere Absatzprognosen durch Predictive Analytics Prof. Dr. Michael Feindt, Karlsruhe Institute of Technology KIT Chief Scientific Advisor, Phi-T GmbH und Blue Yonder GmbH & Co KG 3. Europäischer

Mehr

Data Mining und Statistik: Gemeinsamkeiten und Unterschiede

Data Mining und Statistik: Gemeinsamkeiten und Unterschiede Universität Ulm Seminararbeit zum Thema Data Mining und Statistik: Gemeinsamkeiten und Unterschiede vorgelegt von: Daniel Meschenmoser betreut von: Dr. Tomas Hrycej Dr. Matthias Grabert Ulm, im Februar

Mehr

Seminar im Sommersemester 2005 DATA WAREHOUSING. Data Mining. Christian Knappe. Fachrichtung Wirtschaftsinformatik Friedrich-Schiller-Universität Jena

Seminar im Sommersemester 2005 DATA WAREHOUSING. Data Mining. Christian Knappe. Fachrichtung Wirtschaftsinformatik Friedrich-Schiller-Universität Jena Seminar im Sommersemester 2005 DATA WAREHOUSING Data Mining Christian Knappe Fachrichtung Wirtschaftsinformatik Friedrich-Schiller-Universität Jena Fakultät für Mathematik und Informatik Lehrstuhl für

Mehr

Die Microsoft-Komplettlösung für Datawarehousing, Big Data und Business Intelligence im Überblick. Volker.Hinz@microsoft.com

Die Microsoft-Komplettlösung für Datawarehousing, Big Data und Business Intelligence im Überblick. Volker.Hinz@microsoft.com Die Microsoft-Komplettlösung für Datawarehousing, Big Data und Business Intelligence im Überblick Volker.Hinz@microsoft.com Was sagt der Markt? Fakten Meinung der Analysten zu Microsofts Angeboten Nutzen

Mehr

Motivation. Themenblock: Data Preprocessing. Einsatzgebiete für Data Mining I. Modell von Gianotti und Pedreschi

Motivation. Themenblock: Data Preprocessing. Einsatzgebiete für Data Mining I. Modell von Gianotti und Pedreschi Motivation Themenblock: Data Preprocessing We are drowning in information, but starving for knowledge! (John Naisbett) Was genau ist Datenanalyse? Praktikum: Data Warehousing und Data Mining Was ist Data

Mehr

Data Mining Anwendungen und Techniken

Data Mining Anwendungen und Techniken Data Mining Anwendungen und Techniken Knut Hinkelmann DFKI GmbH Entdecken von Wissen in banken Wissen Unternehmen sammeln ungeheure mengen enthalten wettbewerbsrelevantes Wissen Ziel: Entdecken dieses

Mehr

Risiken bei der Analyse sehr großer Datenmengen. Dr. Thomas Hoppe

Risiken bei der Analyse sehr großer Datenmengen. Dr. Thomas Hoppe Risiken bei der Analyse sehr großer Datenmengen Dr. Thomas Hoppe Datenaufbereitung Datenanalyse Data Mining Data Science Big Data Risiken der Analyse Sammlung Integration Transformation Fehlerbereinigung

Mehr

Übungsblatt LV Künstliche Intelligenz, Data Mining (1), 2014

Übungsblatt LV Künstliche Intelligenz, Data Mining (1), 2014 Übungsblatt LV Künstliche Intelligenz, Data Mining (1), 2014 Aufgabe 1. Data Mining a) Mit welchen Aufgabenstellungen befasst sich Data Mining? b) Was versteht man unter Transparenz einer Wissensrepräsentation?

Mehr

Zeit- und Ressourcenplanung leicht gemacht - Unterstützung durch Simulation

Zeit- und Ressourcenplanung leicht gemacht - Unterstützung durch Simulation - für Zeit- und Ressourcenplanung leicht gemacht - Unterstützung durch Simulation Zeit- und Ressourcenplanung leicht gemacht - Unterstützung durch Simulation Thomas Hanne *, Patrick Lang, Stefan Nickel,

Mehr

DISKUSSIONSBEITRÄGE DER FAKULTÄT FÜR BETRIEBSWIRTSCHAFTSLEHRE MERCATOR SCHOOL OF MANAGEMENT UNIVERSITÄT DUISBURG-ESSEN. Nr. 374

DISKUSSIONSBEITRÄGE DER FAKULTÄT FÜR BETRIEBSWIRTSCHAFTSLEHRE MERCATOR SCHOOL OF MANAGEMENT UNIVERSITÄT DUISBURG-ESSEN. Nr. 374 DISKUSSIONSBEITRÄGE DER FAKULTÄT FÜR BETRIEBSWIRTSCHAFTSLEHRE MERCATOR SCHOOL OF MANAGEMENT UNIVERSITÄT DUISBURG-ESSEN Nr. 374 Eignung von Verfahren der Mustererkennung im Process Mining Sabrina Kohne

Mehr

Einführung in. Neuronale Netze

Einführung in. Neuronale Netze Grundlagen Neuronale Netze Einführung in Neuronale Netze Grundlagen Neuronale Netze Zusammengestellt aus: Universität Münster: Multimediales Skript Internetpräsentation der MFH Iserlohn (000) U. Winkler:

Mehr

1 Predictive Analytics mit Random Forest

1 Predictive Analytics mit Random Forest Predictive Analytics Demokratie im Wald 1 Agenda 1. Predictive Analytics Übersicht 2. Random Forest Grundkonzepte und Anwendungsfelder 3. Entscheidungsbaum Classification and Regression Tree (CART) 4.

Mehr

Was ist Big Data? Versuch einer Positionsbestimmung. Wolfgang Marquardt

Was ist Big Data? Versuch einer Positionsbestimmung. Wolfgang Marquardt Was ist Big Data? Versuch einer Positionsbestimmung Wolfgang Marquardt Vorstandsvorsitzender des Forschungszentrum Jülich 02.06.2015 Jahrestagung des deutschen Ethikrates Ganz sicher auch ein Hype hohe

Mehr

Data Mining Techniken und Anwendungsbereiche. Daten Informationen Wissen Aktionen Profit. Agenda. Was ist Data Mining? Das Ziel

Data Mining Techniken und Anwendungsbereiche. Daten Informationen Wissen Aktionen Profit. Agenda. Was ist Data Mining? Das Ziel Agenda Data Mining Techniken und Anwendungsbereiche Reinhard Dechent, Compaq Michael Wetzel, Was ist Data Mining? Das Ziel The process of extracting meaningful information from large databases - information

Mehr

Große Datenmengen knacken mit SAS High-Performance Analytics

Große Datenmengen knacken mit SAS High-Performance Analytics make connections share ideas be inspired Große Datenmengen knacken mit SAS High-Performance Analytics Martin Schütz CC Analytics SAS Institute GmbH Agenda Terminologie: SAS High-Performance Analytics SAS

Mehr

Approximation von Warteschlangenkennzahlen mit Künstlichen Neuronalen Netzen

Approximation von Warteschlangenkennzahlen mit Künstlichen Neuronalen Netzen Optimale Echtzeit-Personaleinsatzplanung durch Approximation von Warteschlangenkennzahlen mit Künstlichen Neuronalen Netzen 7.05.2006 Frank Köller koeller@iwi.uni-hannover.de Gliederung Motivation Vorgehensweise

Mehr

Data Warehousing und Data Mining

Data Warehousing und Data Mining Data Warehousing und Data Mining Einführung in Data Mining Ulf Leser Wissensmanagement in der Bioinformatik Wo sind wir? Einleitung & Motivation Architektur Modellierung von Daten im DWH Umsetzung des

Mehr

Data Mining - Wiederholung

Data Mining - Wiederholung Data Mining - Wiederholung Norbert Fuhr 9. Juni 2008 Problemstellungen Problemstellungen Daten vs. Information Def. Data Mining Arten von strukturellen Beschreibungen Regeln (Klassifikation, Assoziations-)

Mehr

Neuerungen im Enterprise Miner 5.2 & Text Miner 2.3

Neuerungen im Enterprise Miner 5.2 & Text Miner 2.3 Neuerungen im Enterprise Miner 5.2 & Text Miner 2.3 Copyright 2005, SAS Institute Inc. All rights reserved. Ulrich Reincke, SAS Deutschland Agenda Der Neue Enterprise Miner 5.2 Der Neue Text Miner 2.3

Mehr

Teil II. Nichtlineare Optimierung

Teil II. Nichtlineare Optimierung Teil II Nichtlineare Optimierung 60 Kapitel 1 Einleitung In diesem Abschnitt wird die Optimierung von Funktionen min {f(x)} x Ω betrachtet, wobei Ω R n eine abgeschlossene Menge und f : Ω R eine gegebene

Mehr

Räumliches Data Mining

Räumliches Data Mining Räumliches Data Mining Spatial Data Mining Data Mining = Suche nach "interessanten Mustern" in sehr großen Datensätzen => explorative Datenanlyse auch: Knowledge Discovery in Databases (KDD) verbreitete

Mehr

Data Mining für die industrielle Praxis

Data Mining für die industrielle Praxis Data Mining für die industrielle Praxis von Ralf Otte, Viktor Otte, Volker Kaiser 1. Auflage Hanser München 2004 Verlag C.H. Beck im Internet: www.beck.de ISBN 978 3 446 22465 0 Zu Leseprobe schnell und

Mehr

Exploration und Klassifikation von BigData

Exploration und Klassifikation von BigData Exploration und Klassifikation von BigData Inhalt Einführung Daten Data Mining: Vorbereitungen Clustering Konvexe Hülle Fragen Google: Riesige Datenmengen (2009: Prozessieren von 24 Petabytes pro Tag)

Mehr

Automatische Gesprächsauswertung im Callcenter

Automatische Gesprächsauswertung im Callcenter Einleitung Forschungsbeitrag Automatische Gesprächsauswertung im Callcenter Projekt CoachOST Dipl.-Wirtsch.-Inf. Mathias Walther Prof. Dr. Taïeb Mellouli Lehrstuhl für Wirtschaftsinformatik und Operations

Mehr

kurse 2013 Die genauen Kurstermine und Anmeldeformulare finden Sie unter www.dynelytics.com

kurse 2013 Die genauen Kurstermine und Anmeldeformulare finden Sie unter www.dynelytics.com Kurse 2013 SPSS kurse 2013 1 2 3 4 5 6 7 Einführungskurs Arbeiten mit IBM SPSS Statistics IBM SPSS Statistics in der Medizin Praktische Einführung in die quantitative Marktforschung Vertiefungskurs Arbeiten

Mehr

Proaktive Entscheidungsunterstützung für Geschäftsprozesse durch neuronale Netze

Proaktive Entscheidungsunterstützung für Geschäftsprozesse durch neuronale Netze Proaktive Entscheidungsunterstützung für Geschäftsprozesse durch neuronale Netze INAUGURALDISSERTATION zur Erlangung des akademischen Grades eines Doktors der Wirtschaftswissenschaften an der Wirtschaftswissenschaftlichen

Mehr

SAS Education. Grow with us. Der richtige Einstieg in SAS

SAS Education. Grow with us. Der richtige Einstieg in SAS 2014 SAS Education Grow with us Der richtige Einstieg in SAS SAS Programmierung I SAS Enterprise Guide SAS Analytics I Data Mining I Business Intelligence Data Integration I Platform Administration sas.de/education

Mehr

Statistische Verfahren für das Data Mining in einem Industrieprojekt

Statistische Verfahren für das Data Mining in einem Industrieprojekt Statistische Verfahren für das Data Mining in einem Industrieprojekt Thorsten Dickhaus Forschungszentrum Jülich GmbH Zentralinstitut für Angewandte Mathematik Telefon: 02461/61-4193 E-Mail: th.dickhaus@fz-juelich.de

Mehr

Kernel, Perceptron, Regression. Erich Schubert, Arthur Zimek. 2014-07-20 KDD Übung

Kernel, Perceptron, Regression. Erich Schubert, Arthur Zimek. 2014-07-20 KDD Übung Kernel, Perceptron, Regression Erich Schubert, Arthur Zimek Ludwig-Maximilians-Universität München 2014-07-20 KDD Übung Kernel-Fukctionen Kernel kann mehrdeutig sein! Unterscheidet zwischen: Kernel function

Mehr

.wvw. Identifikation kritischer Erfolgsfaktoren deutscher Lebensversicherungsunternehmen auf Basis einer Jahresabschlußanalyse.

.wvw. Identifikation kritischer Erfolgsfaktoren deutscher Lebensversicherungsunternehmen auf Basis einer Jahresabschlußanalyse. Passauer Reihe Risiko, Versicherung und Finanzierung Band 15 Herausgegeben von Prof. Dr. Bernhard Kromschröder Prof. Dr. Jochen Wilhelm Identifikation kritischer Erfolgsfaktoren deutscher Lebensversicherungsunternehmen

Mehr

Dominik Pretzsch TU Chemnitz 2011

Dominik Pretzsch TU Chemnitz 2011 Dominik Pretzsch TU Chemnitz 2011 Wir leben im Informationszeitalter und merken es daran, dass wir uns vor Information nicht mehr retten können. Nicht der überwältigende Nutzen der Information, sondern

Mehr

Dr. Andreas Hotho, Robert Jäschke Fachgebiet Wissensverarbeitung 30.10.2008. Wintersemester 2008/2009

Dr. Andreas Hotho, Robert Jäschke Fachgebiet Wissensverarbeitung 30.10.2008. Wintersemester 2008/2009 Dr. Andreas Hotho, Robert Jäschke Fachgebiet Wissensverarbeitung 30.10.2008 1. Übung Knowledge Discovery Wintersemester 2008/2009 Vorbemerkungen Vorlesungsfolien und Übungsblätter können Sie im Internet

Mehr

Visual Business Intelligence Eine Forschungsperspektive

Visual Business Intelligence Eine Forschungsperspektive Visual Business Intelligence Eine Forschungsperspektive Dr. Jörn Kohlhammer Fraunhofer-Institut für Graphische Datenverarbeitung IGD Fraunhoferstraße 5 64283 Darmstadt Tel.: +49 6151 155 646 Fax.: +49

Mehr

Maschinelles Lernen und Data Mining: Methoden und Anwendungen

Maschinelles Lernen und Data Mining: Methoden und Anwendungen Maschinelles Lernen und Data Mining: Methoden und Anwendungen Eyke Hüllermeier Knowledge Engineering & Bioinformatics Fachbereich Mathematik und Informatik GFFT-Jahrestagung, Wesel, 17. Januar 2008 Knowledge

Mehr

Künstliche Intelligenz Dirk Krechel SS 2009

Künstliche Intelligenz Dirk Krechel SS 2009 Künstliche Intelligenz Dirk Krechel SS 2009 Überblick über das Modul 1. Einführung 2. Symbolische Verfahren Logik Aussagenlogik Prädikatenlogik Horn Logik Prolog 3. Suchen und Bewerten Problemlösen durch

Mehr

Predictive Modeling for Sports and Gaming Eine Präsentation von Manuel Wolf

Predictive Modeling for Sports and Gaming Eine Präsentation von Manuel Wolf Predictive Modeling for Sports and Gaming Eine Präsentation von Manuel Wolf 28.05.14 Inhalt Die Glückssträhne Statistische Simulationen Baseball, Basketball & andere Sportarten Maschinelles Lernen Windhund-und

Mehr

Eine computergestützte Einführung mit

Eine computergestützte Einführung mit Thomas Cleff Deskriptive Statistik und Explorative Datenanalyse Eine computergestützte Einführung mit Excel, SPSS und STATA 3., überarbeitete und erweiterte Auflage ^ Springer Inhaltsverzeichnis 1 Statistik

Mehr

Data Mining: Modellierung, Methodik und Durchführung. ausgewählter Fallstudien. Diplomarbeit

Data Mining: Modellierung, Methodik und Durchführung. ausgewählter Fallstudien. Diplomarbeit Data Mining: Modellierung, Methodik und Durchführung ausgewählter Fallstudien mit dem SAS Enterprise Miner Diplomarbeit für die Prüfung für Diplom-Volkswirte eingereicht beim Prüfungsausschuss für Diplom-Volkswirte

Mehr

Fachhochschule Köln. Konzepte des maschinellen Lernens. Ausarbeitung. Florian Keller

Fachhochschule Köln. Konzepte des maschinellen Lernens. Ausarbeitung. Florian Keller Fachhochschule Köln 07 Fakultät für Informations-, Medien-, und Elektrotechnik Institut für Nachrichtentechnik Studiengang Master Technische Informatik Konzepte des maschinellen Lernens Ausarbeitung vorgelegt

Mehr

Multiple Regression. Ziel: Vorhersage der Werte einer Variable (Kriterium) bei Kenntnis der Werte von zwei oder mehr anderen Variablen (Prädiktoren)

Multiple Regression. Ziel: Vorhersage der Werte einer Variable (Kriterium) bei Kenntnis der Werte von zwei oder mehr anderen Variablen (Prädiktoren) Multiple Regression 1 Was ist multiple lineare Regression? Ziel: Vorhersage der Werte einer Variable (Kriterium) bei Kenntnis der Werte von zwei oder mehr anderen Variablen (Prädiktoren) Annahme: Der Zusammenhang

Mehr

MEHR ANALYTICS FÜR MEHR ANWENDER DR. GERHARD SVOLBA COE ANALYTICS DACH WIEN, 11. JUNI 2015

MEHR ANALYTICS FÜR MEHR ANWENDER DR. GERHARD SVOLBA COE ANALYTICS DACH WIEN, 11. JUNI 2015 MEHR ANALYTICS FÜR MEHR ANWENDER DR. GERHARD SVOLBA COE ANALYTICS DACH WIEN, 11. JUNI 2015 DAS ERWARTET SIE IN MEINEM VORTRAG Neue Anforderungen, neue Herausforderungen, neue Möglichkeiten Software Demo:

Mehr

NeuroBayes -Prognosen für optimale Entscheidungen

NeuroBayes -Prognosen für optimale Entscheidungen NeuroBayes -Prognosen für optimale Entscheidungen Prof. Dr. Michael Feindt, Karlsruhe Institute of Technology KIT Chief Scientific Advisor, Blue Yonder GmbH & Co KG Handelslogistik-Kongress, Köln, 20.3.2012

Mehr

ML-Werkzeuge und ihre Anwendung

ML-Werkzeuge und ihre Anwendung Kleine Einführung: und ihre Anwendung martin.loesch@kit.edu (0721) 608 45944 Motivation Einsatz von maschinellem Lernen erfordert durchdachtes Vorgehen Programmieren grundlegender Verfahren aufwändig fehlerträchtig

Mehr

Seminar Data Mining and Learning from Data. Predictive Modeling. Thorsten Holz

Seminar Data Mining and Learning from Data. Predictive Modeling. Thorsten Holz Seminar Data Mining and Learning from Data Predictive Modeling Thorsten Holz Human Language Technology and Pattern Recognition Lehrstuhl für Informatik VI, Computer Science Department RWTH Aachen University

Mehr

Management Support Systeme

Management Support Systeme Management Support Systeme WS 24-25 4.-6. Uhr PD Dr. Peter Gluchowski Folie Gliederung MSS WS 4/5. Einführung Management Support Systeme: Informationssysteme zur Unterstützung betrieblicher Fach- und Führungskräfte

Mehr

Realisierung von CI- Regelalgorithmen auf verschiedenen Hardwareplattformen

Realisierung von CI- Regelalgorithmen auf verschiedenen Hardwareplattformen Realisierung von CI- Regelalgorithmen auf verschiedenen Hardwareplattformen Prof.Dr.-Ing. K.-D. Morgeneier FH Jena, FB Elektrotechnik und Informationstechnik www.fh-jena.de Gliederung 2. Einführung 3.

Mehr

Next Best Product. Kundenspezifische Produktangebote in einer Multichannel Umgebung

Next Best Product. Kundenspezifische Produktangebote in einer Multichannel Umgebung Next Best Product Kundenspezifische Produktangebote in einer Multichannel Umgebung - Mag. Thomas Schierer - Erste Bank der oesterreichischen Sparkassen AG Agenda Erste Bank Allgemeine Information CRM in

Mehr

Analytisches CRM im Dialogmarketing

Analytisches CRM im Dialogmarketing Analytisches CRM im Dialogmarketing Von Marco Denzl und Hauke Friedrich, gkk DialogGroup, München Das Dialogmarketing ist eine dynamische und interaktive Form der Marktbearbeitung. Im Gegensatz zu klassischen

Mehr

Optimiertes IT Service Management durch Predictive Analytics. München, 23.06.2015 Dr. Katrin Zaiß, Kay Kasperkowitz TDWI Konferenz 2015

Optimiertes IT Service Management durch Predictive Analytics. München, 23.06.2015 Dr. Katrin Zaiß, Kay Kasperkowitz TDWI Konferenz 2015 Optimiertes IT Service Management durch Predictive Analytics München, 23.06.2015 Dr. Katrin Zaiß, Kay Kasperkowitz TDWI Konferenz 2015 Agenda Herausforderungen im IT Service Management (ITSM) Predictive

Mehr

Vorwort zur zweiten Auflage...V. Vorwort zur ersten Auflage... VIII

Vorwort zur zweiten Auflage...V. Vorwort zur ersten Auflage... VIII Vorwort zur zweiten Auflage...V Vorwort zur ersten Auflage... VIII 1 Management Support Systeme und Business Intelligence Anwendungssysteme zur Unterstützung von Managementaufgaben...1 1.1 Computergestützte

Mehr

Psychologische Zielgruppensegmentierung durch Verknüpfung von Bestandsdaten und Marktforschungsergebnissen

Psychologische Zielgruppensegmentierung durch Verknüpfung von Bestandsdaten und Marktforschungsergebnissen Psychologische Zielgruppensegmentierung durch Verknüpfung von Bestandsdaten und Marktforschungsergebnissen Ein Projekt der psychonomics AG mit STATISTICA Data Miner Einleitung Die psychonomics AG betreibt

Mehr