2165 DWH & Data Mining. WU Wien, SS 2009 Teil Data Mining Dr. Michaela Denk

Größe: px
Ab Seite anzeigen:

Download "2165 DWH & Data Mining. WU Wien, SS 2009 Teil Data Mining Dr. Michaela Denk"

Transkript

1 2165 DWH & Data Mining WU Wien, SS 2009 Teil Data Mining Dr. Michaela Denk

2 Überblick Vorstellung Themen Organisatorisches Zeitplan Aufgabenstellungen Gruppeneinteilung Einführung WU SS DWH & DM - Michaela Denk 2

3 Vorstellung Ausbildung Diplom Statistik (Uni Wien) Doktorat SoWi-Wissenschaften (Uni Wien) Forschung, Entwicklung & Beratung Statistische Informationssysteme Metadaten Datenintegration Datenqualität Datenanalyse Partner & Auftraggeber Kontakt Uni Wien, WU Wien E-Commerce Compentence Center Paradigma Consulting Statistik Austria, ISTAT Internationale EU-geförderte Projekte WU SS DWH & DM - Michaela Denk 3

4 Themen Einführung Definition Fragestellungen Prozess Methoden Software Data Validation Methoden Entscheidungsbäume Faktoren-/Hauptkomponentenanalyse Neuronale Netze Diskriminanzanalyse & Logistische Regression Clusteranalyse (Soziale) Netzwerkanalyse WU SS DWH & DM - Michaela Denk 4

5 Zeitplan Organisatorisches Einführung Data Validation Methoden Entscheidungsbäume Faktoren- & Hauptkomponentenanalyse Neuronale Netze Methoden Diskriminanzanalyse Logistische Regression Clusteranalyse (Soziale) Netzwerkanalyse Gruppenpräsentationen 15 Min. Besprechung pro Gruppe 5 bis 10 ppt-slides Aufgabenstellung Vorgangsweise erste Ergebnisse offene Fragen Terminplan ab im Internet Abgabe schriftliche Arbeit ca. 20 Seiten gezählt ohne Deckblatt, Inhaltsverzeichnis, etc. per an mdenk@wu-wien.ac.at Erläuterung der Arbeitsteilung in der Gruppe, d.h. Beiträge der einzelnen Gruppenmitglieder WU SS DWH & DM - Michaela Denk 5

6 Aufgabenstellungen Datenanalyse (A1 bis A5) praktische Fragestellung Datensatz Software frei wählbar Literatur (B1 bis B3) methodische Fragestellung Lehrbücher, wiss. Publikationen Software (C1 bis C3) Analyse der Funktionalität bestehender bzw. Implementierung eigener Methoden Demonstration mit Datensatz Software vorgegeben WU SS DWH & DM - Michaela Denk 6

7 A Datenanalyse A1 Kundensegmentierung Der vorliegende Datensatz enthält Informationen über Kreditantragsteller einer EU-weit tätigen Bank. Analysieren Sie den Datensatz auf seine Validität und führen Sie eventuell erforderliche Bereinigungen durch. Identifizieren Sie anhand geeigneter Data Mining Verfahren möglichst heterogene (jedoch in sich homogene) Kundensegmente anhand der verfügbaren Eigenschaften der Kreditantragsteller. Beschreiben und visualisieren Sie die Kundensegmente. Wodurch unterscheiden sie sich und wie können sie charakterisiert werden? WU SS DWH & DM - Michaela Denk 7

8 A Datenanalyse A2 Credit Scoring Der vorliegende Datensatz enthält Informationen über Kreditantragsteller einer EU-weit tätigen Bank. Untersuchen Sie zunächst die Validität der Daten und führen Sie, sofern notwendig, Bereinigungen durch. Entwickeln Sie unter Einsatz geeigneter Data Mining Methoden Modelle zur Prognose der Qualität eines Kunden (d.h. der Wahrscheinlichkeit, dass der Kunde den Kredit zurückzahlen kann; Zielvariable Good_Bad) anhand der verfügbaren Eigenschaften der Kreditantragsteller. Wenden Sie dabei insb. auch zwei Entscheidungsbaumverfahren an mit Schwerpunkt auf Pruning und Cross Validation Techniken WU SS DWH & DM - Michaela Denk 8

9 A Datenanalyse A3 Kundensegmentierung Der vorliegende Datensatz enthält Informationen über Kreditantragsteller einer EU-weit tätigen Bank. Untersuchen Sie zunächst die Validität der Daten und führen Sie, sofern notwendig, Bereinigungen durch. Identifizieren Sie aus den verfügbaren Variablen unter Einsatz der Hauptkomponentenanalyse neue Variablen (Hauptkomponenten) zur Dimensionsreduktion. Entwickeln Sie mithilfe dieser Hauptkomponenten eine Segmentierung der Daten. Beschreiben Sie die gefundenen Segmente und die Qualität der Segmentierung. Untersuchen Sie die Segmente auch hinsichtlich des Merkmals Good_Bad, das primär zwischen guten und schlechten Kunden unterscheidet (d.h. Kreditantragstellern, die ihren Kredit zurückgezahlt bzw. nicht zurückgezahlt haben) WU SS DWH & DM - Michaela Denk 9

10 A Datenanalyse A4 Credit Scoring Der vorliegende Datensatz enthält Informationen über Kreditantragsteller einer EU-weit tätigen Bank. Analysieren Sie den Datensatz auf seine Validität und führen Sie eventuell erforderliche Bereinigungen durch. Wenden Sie geeignete Data Mining Methoden an, um ein Modell zur optimalen Diskriminierung von guten und schlechten Kunden (d.h. Kunden, die ihren Kredit zurückzahlen bzw. nicht zurückzahlen können) zu erhalten (Zielvariable Good_Bad). Welche Eigenschaften der Kreditantragsteller spielen bei der Klassifikation eine besondere Rolle? Beurteilen Sie die Qualität des Modells WU SS DWH & DM - Michaela Denk 10

11 A Datenanalyse A5 Credit Scoring Der vorliegende Datensatz enthält Informationen über Kreditantragsteller einer EU-weit tätigen Bank. Analysieren Sie den Datensatz auf seine Validität und führen Sie eventuell erforderliche Bereinigungen durch. Untersuchen Sie Ähnlichkeiten und vor allem Unterschiede der Supervised Learning Verfahren Logistische Regression, Entscheidungsbäume und Diskriminanzanalyse im Rahmen der Klassifikation der Kunden in die Kategorien good und bad der Zielvariable Good_Bad. Vergleichen und diskutieren Sie die Qualität der Klassifikation durch die angegebenen Verfahren. Wieviele Kunden werden unterschiedlich klassifiziert? Wodurch sind diese Kundengruppen charakterisiert? WU SS DWH & DM - Michaela Denk 11

12 B Literatur B1 Geschichte des Data Mining Schreiben Sie die Geschichte des Data Mining. Recherchieren Sie die Entstehung, die Entwicklung, sowie aktuelle Trends des Data Mining. Berücksichtigen Sie dabei sowohl Vorläufer wie KDD (Knowledge Discovery in Databases) oder AI (Artificial Intelligence) als auch jüngere Entwicklungen wie z.b. Text Mining. Legen Sie besonderen Wert auf eine systematische Darstellung der Teilbereiche und deren Zusammenhänge WU SS DWH & DM - Michaela Denk 12

13 B Literatur B2 Text Mining Recherchieren Sie aktuelle Artikel zum Thema Text Mining. Beschreiben Sie Aufgabenstellung, Lösungsansätze, Methoden und Anwendungsbeispiele aus der Praxis. Geben Sie einen Überblick über verfügbare Text Mining Software. Diskutieren Sie, in welcher Weise Text Mining eingesetzt werden kann, um zu einer 360 Sicht des Kunden zu gelangen WU SS DWH & DM - Michaela Denk 13

14 B Literatur B3 Assoziationsanalyse Recherchieren Sie aktuelle Artikel zum Thema Assoziationsanalyse. Beschreiben Sie Problemstellung, Lösungsansätze, Methoden und Anwendungsbeispiele aus der Praxis. Geben Sie einen Überblick über verfügbare Software. Diskutieren Sie, in welcher Weise Assoziationsanalyse eingesetzt werden kann, um eine Warenkorbanalyse durchzuführen WU SS DWH & DM - Michaela Denk 14

15 C Software C1 Softwarevergleich Stellen Sie die Funktionalität der Softwareprodukte WEKA, Clementine und R hinsichtlich der angebotenen (supervised) Klassifikationsverfahren gegenüber. Welche Verfahren werden unterstützt? Welche Parameter können vom Benutzer eingestellt werden? Wie sieht das gelieferte Ergebnis aus? Welche Vorteile/Nachteile gibt es? Demonstrieren Sie die Anwendung der Methoden mithilfe des vorliegenden Datensatzes aus dem Credit Scoring (Zielvariable Good_bad ) WU SS DWH & DM - Michaela Denk 15

16 C Software C2 (Soziale) Netzwerkanalyse Recherchieren Sie, welche Software für (Soziale) Netzwerkanalyse angeboten wird (kommerziell und open source). Beschreiben und vergleichen Sie die Funktionalität dieser Software. Wählen Sie eine frei verfügbare SNA-Software aus und demonstrieren Sie deren grundlegende Funktionalität anhand der vorliegenden Beispieldaten WU SS DWH & DM - Michaela Denk 16

17 C Software C3 Implementierung Implementieren Sie eine Funktion in R, die Folgendes unterstützt: hierarchische UND partitionierende Clustering-Verfahren mind. 3 unterschiedl. Clustermethoden bei hierarch. Vefahren (z.b. single linkage, Ward) und 3 Techniken zur Festlegung der Startlösung für partition. Verfahren (z.b. die Werte von k zufällig ausgewählten Beobachtungen, aus hierarchischer Analyse) mind. 2 unterschiedl. Distanzfunktionen pro Skalenniveau (z.b. Euklidische Distanz für metrische, Jaccard oder Tanimoto für nominale Variablen) und eine kombinierte Distanzfunktion für Datensätze mit Variablen auf unterschiedl. Skalenniveau zwei unterschiedl. Arten der Standardisierung der Ausgangsvariablen eine Kombination von hierarchischen und partitionierenden Verfahren, d.h. Ermittlung der Anzahl der Cluster mittels hierarchischem Verfahren, Bestimmung der endgültigen Clusterzuordnung mittels partitionierendem Verfahren die Beurteilung der Qualität der Clusterlösung durch eine anschl. Varianzanalyse die Beschreibung der Cluster durch die Gegenüberstellung deskriptiver Statistiken bestimmter Merkmale (auch graphisch) Die Ergebnisse der Funktion sollen in einem Listenobjekt zusammengefasst sein. Die Einbindung von Funktionen aus den Packages stats, MASS, graphics und flexclust ist erlaubt. Demonstrieren Sie die Funktionsweise Ihres Programms anhand des vorliegenden Credit Scoring Datensatzes WU SS DWH & DM - Michaela Denk 17

18 Einführung Data Mining Definition Fragestellungen Prozess Methoden Software WU SS DWH & DM - Michaela Denk 18

19 Einführung Data Mining Definition Fragestellungen Prozess Methoden Software WU SS DWH & DM - Michaela Denk 19

20 Data Mining istheanalysisof (oftenlarge) observational data sets to find unsuspected relationships and to summarize the data in novel ways that are both understandable and useful to the data owner. (Hand, Mannila, Smyth) WU SS DWH & DM - Michaela Denk 20

21 Data Mining is the process of discovering meaningful new correlations, patterns and trends by "mining" large amounts of stored data using pattern recognition technologies, as well as statistical and mathematical techniques. (Ashby, Simms) WU SS DWH & DM - Michaela Denk 21

22 Data Mining is the exploration and analysis, by automatic and semiautomatic means, of large quantities of data in order to discover meaningful patterns and rules. (Berry, Linoff) WU SS DWH & DM - Michaela Denk 22

23 Data Mining... is an interdisciplinary field bringing togther techniques from machine learning, pattern recognition, statistics, databases, and visualization to address the issue of information extraction from large data bases. (Simoudis) WU SS DWH & DM - Michaela Denk 23

24 Data Mining Sammlung von Methoden zum Auffinden von validen, neuen, relevanten, interpretierbaren und nützlichen (verwertbaren) Mustern, Regeln, Gruppen und Abhängigkeiten in großen Datenbeständen ( DWH) Fokus hier: betriebswirtschaftliche Fragestellungen WU SS DWH & DM - Michaela Denk 24

25 Einführung Data Mining Definition Fragestellungen Prozess Methoden Software WU SS DWH & DM - Michaela Denk 25

26 Beispiele für Quellen großer Datenmengen Supermarkt - Scannerdaten Banken - Transaktionsdaten Webseiten - Clickstream Daten Telekommunikation - Verbindungsdaten Genetik - Forschungsdatenbanken Meteorologie - Satellitendaten WU SS DWH & DM - Michaela Denk 26

27 DM-Problemstellungen Zielgruppenmarketing Direct Mailing Kampagnen Optimierung des Vertriebs- oder Marketingkanals Warenkorbanalysen Cross- & Up-Selling z.b. Versandhandel, Webshops, Supermärkte Kunden-/User-Profiling Churn-Analyse Prognose des Churnzeitpunkts Prognose der Ausfallwahrscheinlichkeit Prognose des Kreditrisikos, Bewertung der Kreditwürdigkeit Prognose von Konkursen Analyse der Zahlungsmoral Profitabilitätsanalysen WU SS DWH & DM - Michaela Denk 27

28 DM-Problemstellungen Fraud-Detection z.b. Steuerhinterziehung, Versicherungsbetrug, Kreditkarten Schadensfallanalyse Preisfestsetzung Prognose von Produkt-Ersatzzyklen Spam-Erkennung Handschrifterkennung Ermittlung potenzieller Verdächtiger aus Gerichtsprotokollen und Strafregistern Aufdecken von Verbrechensnetzwerken WU SS DWH & DM - Michaela Denk 28

29 DM-Problemstellungen Web Usage Mining Web Server Log Files Verhaltensmuster von Online- Kunden Bewegungspfade auf der Website Seitenoptimierung Wer sieht welche Inhalte wie oft? Profitabelste Online-Kundensegmente Welche Partner generieren kommerziell interessanten Traffic? Personalisierung von Seiteninhalten Prognose von Kaufwahrscheinlichkeiten Erkennung potentieller Käufer Prognose der Surf -Dauer bis ein Kauf getätigt wird WU SS DWH & DM - Michaela Denk 29

30 Beispiel Zielgruppenmarketing WU SS DWH & DM - Michaela Denk 30

31 Beispiel Zielgruppenmarketing Kunden angeschrieben davon haben (positiv) reagiert Auswahl der laut DM-Modell wahrscheinlichsten 10% (10.000) erreicht 400 der positiven Antworten, also 40% der Zielpopulation bei 40% Auswahl 80% der Zielpopulation WU SS DWH & DM - Michaela Denk 31

32 Einführung Data Mining Definition Fragestellungen Prozess Methoden Software WU SS DWH & DM - Michaela Denk 32

33 Klassischer KDD Prozess KDD Knowledge Discovery in Data Bases WU SS DWH & DM - Michaela Denk 33

34 Prozessstruktur - Beispiele SEMMA (SAS) Sample Explore Modify Model Assess CRISP-DM (ursprüngl. SPSS) Cross Industry Standard Process for Data Mining WU SS DWH & DM - Michaela Denk 34

35 CRISP-DM Business/Research Understanding Definition des Problemfeldes und der Ziele Übersetzung in Data Mining Fragestellung Identifikation der verfügbaren Daten Technische Voraussetzungen Schaffung eines entsprechenden IT-Umfeldes Datenbeschaffung WU SS DWH & DM - Michaela Denk 35

36 CRISP-DM Data Understanding Explorative Datenanalyse Qualität der Daten / Validierung Data Preparation Erstellung des finalen Datensatzes für die Modellierung Auswahl und Transformation von Variablen Auswahl der zu analysierenden Beobachtungen Datenbereinigung WU SS DWH & DM - Michaela Denk 36

37 CRISP-DM Modellierung Auswahl und Anwendung geeigneter Data Mining Verfahren Vergleich unterschiedlicher Ansätze Kalibrierung des Modells zur Optimierung der Ergebnisse Modellevaluation Bewertung der Qualität des Modells / der Modelle mittels geeigneter Kennzahlen Vergleich mit ursprünglichen Zielen Auswahl eines Modells für die Umsetzung Deployment Anwendung der Ergebnisse Reporting / Monitoring WU SS DWH & DM - Michaela Denk 37

38 CRISP-DM ein iterativer Prozess WU SS DWH & DM - Michaela Denk 38

39 Datenqualität essentiell für Qualität des DM-Ergebnisses Garbage in Garbage out! große Bedeutung von Data Understanding und Data Preparation 80:20 Regel Trend: Modellierungstechniken auch für diese Prozessphasen Datenqualitätsprojekte Exploratory Data Mining and Data Cleaning (Dasu, Johnson) Data Preparation for Analytics Using SAS (Svolba) WU SS DWH & DM - Michaela Denk 39

40 CRISP-DM Beispiel Fallstudie 5 aus Discovering Knowledge in Data (Larose) Profiling des Tourismusmarkts mittels Clusteranalyse WU SS DWH & DM - Michaela Denk 40

41 Business Understanding Phase University of Calgary, Alberta, Canada intraprovince tourist behavior in Alberta create profiles of domestic Albertan tourists based on the decision behavior of tourists form a quantitative basis for the development of an intraprovince marketing campaign, sponsored by Travel Alberta determine which factors were important in choosing destinations in Alberta evaluate the domestic perceptions of the Alberta vacation product comprehend the travel decision-making process WU SS DWH & DM - Michaela Denk 41

42 Data Understanding Phase data were collected in late 1999 phone survey of Albertans > 18 years old traveled for leisure at least 80 kilometers for at least one night within Alberta in the past year 3071 of the completed the survey and were eligible for inclusion in the study WU SS DWH & DM - Michaela Denk 42

43 Data Preparation Phase survey question to what extent do each of the factors from the following list of 13 factors most influence your travel decisions? quality of accommodations school holidays weather conditions cluster analysis performed upon these variables preparation included plausibility checks WU SS DWH & DM - Michaela Denk 43

44 Modeling Phase clustering natural choice for generating customer segment profiles k-means clustering quick and efficient as long as you know the number of clusters you expect to find two to six cluster models were explored final five-cluster solution Cluster 1: the young urban outdoor market. Youngest of all clusters, equally balanced genderwise, with school schedules and budgets looming large in their travel decisions. Cluster 2: the indoor leisure traveler market. Next youngest and very female, mostly married with children, with visiting family and friends a major factor in travel plans WU SS DWH & DM - Michaela Denk 44

45 Modeling Phase final five-cluster solution Cluster 3: the children-first market. More married and more children than any other cluster, with children s sports and competition schedules having great weight in deciding where to travel in Alberta. Cluster 4: the fair-weather-friends market. Second-oldest, slightly more male group, with weather conditions influencing travel decisions. Cluster 5: the older, cost-conscious traveler market. The oldest of the clusters, most influenced by cost/value considerations and a secure environment when making Alberta travel decisions WU SS DWH & DM - Michaela Denk 45

46 Evaluation Phase discriminant analysis to verify the reality of the cluster categorizations rate of correct classifications: 93% differences between clusters statistically significant WU SS DWH & DM - Michaela Denk 46

47 Deployment Phase launch of a new marketing campaign Alberta, Made to Order customized to cluster types launch of more than 80 projects through a cooperative arrangement between government and business Alberta, Made to Order TV commercials viewed about 20 times by over 90% of adults under 55 increase of over 20% in the number of Albertans who indicated Alberta as a top-of-the-mind travel destination WU SS DWH & DM - Michaela Denk 47

48 Einführung Data Mining Definition Fragestellungen Prozess Methoden Software WU SS DWH & DM - Michaela Denk 48

49 nach Art der Fragestellung Deskriptive Fragestellungen einfache Darstellung relevanter Strukturen, z.b. durch Datenreduktion und/oder graphische Veranschaulichung z.b. Faktorenanalyse, Multidimensionale Skalierung, Visualisierungsmethoden Abweichungsanalysen: automatisierte Identifikation abweichender Objekte, z.b. Erkennung von verändertem Kaufverhalten über die Zeit vgl. Methoden der Datenvalidierung wie z.b. für Ausreißererkennung Assoziation: Beschreibung von Abhängigkeiten zwischen Objekten, z.b. Warenkorbanalyse z.b. Assoziationsanalyse, Korrelationsanalyse, Netzwerkanalyse Gruppenbildung (Clustering): Einteilung der Objekte in Klassen, die ähnliche Merkmalsausprägungen aufweisen, z.b. Kundensegmente z.b. Clusteranalyse, Blockmodeling WU SS DWH & DM - Michaela Denk 49

50 nach Art der Fragestellung Prädiktive Fragestellungen Klassifikation: Zuordnung von neuen Objekten zu vorab definierten Klassen, z.b. Kreditrisiko z.b. logistische Regression, Diskriminanzanalyse, Entscheidungsbäume, neuronale Netze Prognose: Bestimmung einer unbekannten Merkmalsausprägung eines Objektes auf Basis bekannter Merkmale, z.b. Vorhersage der Höhe der Weihnachtseinkäufe einer bestimmten Kundengruppe, Imputation fehlender Werte z.b. lineare Regression, neuronale Netze WU SS DWH & DM - Michaela Denk 50

51 Modell- oder Datengeleitet? Theorie-/Modellgeleitet Korrelationsanalyse Lineare Regression (Varianzanalyse) Logistische Regression Diskriminanzanalyse Zeitreihenanalyse Datengeleitet Clusteranalyse Blockmodeling Faktorenanalyse Multidimensionale Skalierung Assoziationsanalyse Entscheidungsbäume Neuronale Netze Netzwerkanalyse WU SS DWH & DM - Michaela Denk 51

52 Korrelationsanalyse besteht ein linearer Zusammenhang zwischen zwei oder mehreren Merkmalen? Variablen gleichberechtigt Beispiel: Steht die Häufigkeit (und/oder Dauer) der Benutzung einer Webseite in Zusammenhang mit der Häufigkeit (und/oder dem Volumen) der Einkäufe im angeschlossenen Online-Shop? WU SS DWH & DM - Michaela Denk 52

53 Lineare Regression erforscht die Art des linearen Zusammenhangs zwischen Variablen abhängige und erklärende Variablen abhängige Variable ist metrisch Beispiel: Jährl. Einkaufsvolumen = a + b*surfhäufigkeit + c*geschlecht + + Fehler WU SS DWH & DM - Michaela Denk 53

54 (Varianzanalyse) besteht ein Unterschied zwischen definierten Gruppen hinsichtlich bestimmter Merkmale? abhängige Variable ist metrisch Gruppierung ist erklärende Variable Beispiel: Gibt es einen Unterschied bezüglich der Profitabilität eines Kunden je nach Ausbildungsniveau? WU SS DWH & DM - Michaela Denk 54

55 Logistische Regression erforscht den Zusammenhang zwischen einer dichotomen abhängigen Variable und beliebigen erklärenden Variablen Prognose von Wahrscheinlichkeiten Beispiel: Vorhersage des Kreditrisikos in Abhängigkeit von demographischen Variablen, Kreditsumme, Art und Ausmaß der Besicherung WU SS DWH & DM - Michaela Denk 55

56 Diskriminanzanalyse erstellt Zuordnungsregeln zu bestehenden Gruppen (Klassifikation) erforscht Zusammenhang zwischen kategorieller abhängiger Variable und erklärenden Variablen Einsatz statt logistischer Regression möglich Beispiel: Churn-Prediction WU SS DWH & DM - Michaela Denk 56

57 Diskriminanzanalyse Linear Quadratisch WU SS DWH & DM - Michaela Denk 57

58 Clusteranalyse erstellt Gruppierung der Beobachtungen basierend auf Ähnlichkeiten der verfügbaren Merkmale Unterschied zu Diskriminanzanalyse Gruppierung wird erstellt, ist noch nicht vorgegeben Beispiel: Kundensegmentierung anhand demographischer Eigenschaften, Einkäufe im letzten Jahr, WU SS DWH & DM - Michaela Denk 58

59 (Soziale) Netzwerkanalyse Untersuchung von relationalen Daten (=Netzwerk) umfasst Methoden der Visualisierung Netzwerkgraphen, Adjazenzgraphiken, Heat Maps Beschreibung insb. graphentheoretische Kennzahlen Gruppenbildung z.b. Blockmodeling Prognose spezielle Regressionsmodelle für relationale Daten Beispiel: Mobilfunkkunden sind Knoten im Netzwerk Welche Teil-Netzwerke können identifiziert werden? Welche Kunden telefonieren v.a. innerhalb des eigenen Netzes? WU SS DWH & DM - Michaela Denk 59

60 Faktorenanalyse Reduktion einer Vielzahl von verfügbaren Merkmalen auf eine geringe Anzahl von zugrunde liegenden Faktoren Beispiel: Auf welche grundlegenden Faktoren können die Merkmale, die eine Bank über ihre Kunden gesammelt hat, zurückgeführt werden? WU SS DWH & DM - Michaela Denk 60

61 Entscheidungsbäume dienen wie die Diskriminanzanalyse und die logistische Regression zur Klassifikation von Objekten abhängige Variable ist dichotom (oder kategoriell) für erklärende Variablen werden Schwellwerte festgelegt entstehende Gruppen möglichst homogen hinsichtlich der abhängigen Variable Beispiel: Prognose der Kaufwahrscheinlichkeit in Abhängigkeit verschiedener Kundenmerkmale WU SS DWH & DM - Michaela Denk 61

62 Neuronale Netze eigentlich künstliche neuronale Netze Nervenzellvernetzungen im Gehirn nachempfunden Informationsweitergabe zwischen Neuronen Netz wird auf bestimmte Fragestellung, z.b. Klassifikation oder Prognose, trainiert meist als Black Box empfunden schwer vermittelbar Problem des Overfitting WU SS DWH & DM - Michaela Denk 62

63 Hybride Modellierung & Evaluierung Ermittlung mehrerer Modell-Kandidaten unterschiedliche Methoden unterschiedliche Parametrisierung Einsatz von Resampling-Techniken Kreuzvalidierung, Bootstrap, Jacknife Prognose Randomisieren Durchschnitt der Modelle, Voting (Bagging) Gewichtung durch Expertenmeinung Adaptive Gewichtung (Boosting) Meta-Lernen (Stacking) Trainings- und Testdaten WU SS DWH & DM - Michaela Denk 63

64 Einführung Data Mining Definition Fragestellungen Prozess Methoden Software WU SS DWH & DM - Michaela Denk 64

65 Kommerzielle DM-Software SAS Enterprise Miner Graphische Benutzeroberfläche Prozessfluss durch Knoten und Verknüpfungen darstellbar Knoten = Methoden zu SEMMA-Phasen Große Auswahl an statistischen Methoden Standard-SAS-Code kann eingebunden werden Anbindung an SAS- (und andere) DWH möglich v.a. bei großen Unternehmen im Einsatz kostspielig WU SS DWH & DM - Michaela Denk 65

66 SAS Enterprise Miner WU SS DWH & DM - Michaela Denk 66

67 Kommerzielle DM-Software SPSS Clementine Graphische Benutzeroberfläche Prozessfluss durch Knoten und Verknüpfungen darstellbar folgt CRISP-DM-Prozess große Auswahl an statistischen Methoden Anbindung an Datenbanken möglich v.a. in der Markt- und Meinungsforschung im Einsatz weniger kostspielig WU SS DWH & DM - Michaela Denk 67

68 SPSS Clementine WU SS DWH & DM - Michaela Denk 68

69 Freie DM-Software WEKA Waikato Environment for Knowledge Analysis Graphische Benutzeroberfläche Ebenfalls Darstellung des Prozessflusses möglich Speziell an DM orientiert Einsatz v.a. in Forschung und Lehre Open Source WU SS DWH & DM - Michaela Denk 69

70 WEKA WU SS DWH & DM - Michaela Denk 70

71 Freie DM-Software R allgemeine statistische Programmierumgebung keine graphische Benutzeroberfläche für DM Funktionen für klassische statistische Verfahren Pakete für spezielle Data Mining Algorithmen i.a. auch sehr aktuelle Verfahren verfügbar Einsatz v.a. in Forschung und Lehre Open Source WU SS DWH & DM - Michaela Denk 71

72 Software für spezielle DM-Algorithmen Pajek Soziale Netzwerkanalyse Pro Price Preisoptimierung Pro Deli Marktsegmentierung Conjoint Analyse Simulation von Marktanteilen WU SS DWH & DM - Michaela Denk 72

Data Mining mit der SEMMA Methodik. Reinhard Strüby, SAS Institute Stephanie Freese, Herlitz PBS AG

Data Mining mit der SEMMA Methodik. Reinhard Strüby, SAS Institute Stephanie Freese, Herlitz PBS AG Data Mining mit der SEMMA Methodik Reinhard Strüby, SAS Institute Stephanie Freese, Herlitz PBS AG Data Mining Data Mining: Prozeß der Selektion, Exploration und Modellierung großer Datenmengen, um Information

Mehr

Fachgruppe Statistik, Risikoanalyse & Computing. STAT672 Data Mining. Sommersemester 2007. Prof. Dr. R. D. Reiß

Fachgruppe Statistik, Risikoanalyse & Computing. STAT672 Data Mining. Sommersemester 2007. Prof. Dr. R. D. Reiß Fachgruppe Statistik, Risikoanalyse & Computing STAT672 Data Mining Sommersemester 2007 Prof. Dr. R. D. Reiß Überblick Data Mining Begrifflichkeit Unter Data Mining versteht man die Computergestützte Suche

Mehr

Seminar Business Intelligence Teil II. Data Mining & Knowledge Discovery

Seminar Business Intelligence Teil II. Data Mining & Knowledge Discovery Seminar Business Intelligence Teil II Data Mining & Knowledge Discovery Was ist Data Mining? Sabine Queckbörner Was ist Data Mining? Data Mining Was ist Data Mining? Nach welchen Mustern wird gesucht?

Mehr

PPC und Data Mining. Seminar aus Informatik LV-911.039. Michael Brugger. Fachbereich der Angewandten Informatik Universität Salzburg. 28.

PPC und Data Mining. Seminar aus Informatik LV-911.039. Michael Brugger. Fachbereich der Angewandten Informatik Universität Salzburg. 28. PPC und Data Mining Seminar aus Informatik LV-911.039 Michael Brugger Fachbereich der Angewandten Informatik Universität Salzburg 28. Mai 2010 M. Brugger () PPC und Data Mining 28. Mai 2010 1 / 14 Inhalt

Mehr

Predictive Modeling Markup Language. Thomas Morandell

Predictive Modeling Markup Language. Thomas Morandell Predictive Modeling Markup Language Thomas Morandell Index Einführung PMML als Standard für den Austausch von Data Mining Ergebnissen/Prozessen Allgemeine Struktur eines PMML Dokuments Beispiel von PMML

Mehr

Tiefgreifende Prozessverbesserung und Wissensmanagement durch Data Mining

Tiefgreifende Prozessverbesserung und Wissensmanagement durch Data Mining Tiefgreifende Prozessverbesserung und Wissensmanagement durch Data Mining Ausgangssituation Kaizen Data Mining ISO 9001 Wenn andere Methoden an ihre Grenzen stoßen Es gibt unzählige Methoden, die Abläufe

Mehr

Exploration und Klassifikation von BigData

Exploration und Klassifikation von BigData Exploration und Klassifikation von BigData Inhalt Einführung Daten Data Mining: Vorbereitungen Clustering Konvexe Hülle Fragen Google: Riesige Datenmengen (2009: Prozessieren von 24 Petabytes pro Tag)

Mehr

Die Wahlpflichtfächer. Operations Research Statistik/Ökonometrie. Optimierung linearer Modelle Statistische Analyseverfahren

Die Wahlpflichtfächer. Operations Research Statistik/Ökonometrie. Optimierung linearer Modelle Statistische Analyseverfahren Die Wahlpflichtfächer Operations Research Statistik/Ökonometrie Modellierung ökonomischer Sachverhalte mit mathematischen Mitteln Einsatz statistischer Modelle zur Erfassung und zur Auswertung von Daten

Mehr

Data Mining-Modelle und -Algorithmen

Data Mining-Modelle und -Algorithmen Data Mining-Modelle und -Algorithmen Data Mining-Modelle und -Algorithmen Data Mining ist ein Prozess, bei dem mehrere Komponenten i n- teragieren. Sie greifen auf Datenquellen, um diese zum Training,

Mehr

Web Mining effektive Analyse des Nutzer- Verhaltens im Internet

Web Mining effektive Analyse des Nutzer- Verhaltens im Internet Web Mining effektive Analyse des Nutzer- Verhaltens im Internet Dr. Frank Säuberlich Business Unit e-intelligence SAS Deutschland Agenda 1. Begriffsdefinition e-intelligence: Systemdimension Angebotsdimension

Mehr

DISKUSSIONSBEITRÄGE DER FAKULTÄT FÜR BETRIEBSWIRTSCHAFTSLEHRE MERCATOR SCHOOL OF MANAGEMENT UNIVERSITÄT DUISBURG-ESSEN. Nr. 374

DISKUSSIONSBEITRÄGE DER FAKULTÄT FÜR BETRIEBSWIRTSCHAFTSLEHRE MERCATOR SCHOOL OF MANAGEMENT UNIVERSITÄT DUISBURG-ESSEN. Nr. 374 DISKUSSIONSBEITRÄGE DER FAKULTÄT FÜR BETRIEBSWIRTSCHAFTSLEHRE MERCATOR SCHOOL OF MANAGEMENT UNIVERSITÄT DUISBURG-ESSEN Nr. 374 Eignung von Verfahren der Mustererkennung im Process Mining Sabrina Kohne

Mehr

MEHR ANALYTICS FÜR MEHR ANWENDER DR. GERHARD SVOLBA COE ANALYTICS DACH WIEN, 11. JUNI 2015

MEHR ANALYTICS FÜR MEHR ANWENDER DR. GERHARD SVOLBA COE ANALYTICS DACH WIEN, 11. JUNI 2015 MEHR ANALYTICS FÜR MEHR ANWENDER DR. GERHARD SVOLBA COE ANALYTICS DACH WIEN, 11. JUNI 2015 DAS ERWARTET SIE IN MEINEM VORTRAG Neue Anforderungen, neue Herausforderungen, neue Möglichkeiten Software Demo:

Mehr

Was ist Analyse? Hannover, CeBIT 2014 Patrick Keller

Was ist Analyse? Hannover, CeBIT 2014 Patrick Keller Was ist? Hannover, CeBIT 2014 Patrick Keller Business Application Research Center Historie 1994: Beginn der Untersuchung von Business-Intelligence-Software am Lehrstuhl Wirtschaftsinformatik der Universität

Mehr

Seminar C02 - Praxisvergleich OLAP Tools

Seminar C02 - Praxisvergleich OLAP Tools C02: Praxisvergleich OLAP Tools Ein Seminar der DWH academy Seminar C02 - Praxisvergleich OLAP Tools Das Seminar "Praxisvergleich OLAP-Tools" bietet den Teilnehmern eine neutrale Einführung in die Technologien

Mehr

Data/Information Quality Management

Data/Information Quality Management Data/Information Quality Management Seminar WI/Informationsmanagement im Sommersemester 2002 Markus Berberov, Roman Eder, Peter Gerstbach 11.6.2002 Inhalt! Daten und Datenqualität! Einführung und Definition!

Mehr

Entscheidungsbaumverfahren

Entscheidungsbaumverfahren Entscheidungsbaumverfahren Allgemeine Beschreibung Der Entscheidungsbaum ist die Darstellung einer Entscheidungsregel, anhand derer Objekte in Klassen eingeteilt werden. Die Klassifizierung erfolgt durch

Mehr

Business Analytics im E-Commerce

Business Analytics im E-Commerce Business Analytics im E-Commerce Kunde, Kontext und sein Verhalten verstehen für personalisierte Kundenansprache Janusz Michalewicz CEO Über die Firma Crehler Erstellung von Onlineshops Analyse von Transaktionsdaten

Mehr

Voraussetzung wieder: Datenraum mit Instanzen, mehrere Attribute - kein ausgezeichnetes Zielattribut, keine vorgegebenen Klassen

Voraussetzung wieder: Datenraum mit Instanzen, mehrere Attribute - kein ausgezeichnetes Zielattribut, keine vorgegebenen Klassen 7. Clusteranalyse (= Häufungsanalyse; Clustering-Verfahren) wird der multivariaten Statistik zugeordnet Voraussetzung wieder: Datenraum mit Instanzen, mehrere Attribute - kein ausgezeichnetes Zielattribut,

Mehr

360 - Der Weg zum gläsernen Unternehmen mit QlikView am Beispiel Einkauf

360 - Der Weg zum gläsernen Unternehmen mit QlikView am Beispiel Einkauf 360 - Der Weg zum gläsernen Unternehmen mit QlikView am Beispiel Einkauf Von der Entstehung bis heute 1996 als EDV Beratung Saller gegründet, seit 2010 BI4U GmbH Firmensitz ist Unterschleißheim (bei München)

Mehr

Hauptseminar am Fachgebiet für Quantitative Methoden der Wirtschaftswissenschaften

Hauptseminar am Fachgebiet für Quantitative Methoden der Wirtschaftswissenschaften Hauptseminar am Fachgebiet für Quantitative Methoden der Wirtschaftswissenschaften Fehlende Daten in der Multivariaten Statistik SS 2011 Allgemeines Das Seminar richtet sich in erster Linie an Studierende

Mehr

Entwicklung des Dentalmarktes in 2010 und Papier versus Plastik.

Entwicklung des Dentalmarktes in 2010 und Papier versus Plastik. Sehr geehrter Teilnehmer, hier lesen Sie die Ergebnisse aus unserer Umfrage: Entwicklung des Dentalmarktes in 2010 und Papier versus Plastik. Für die zahlreiche Teilnahme an dieser Umfrage bedanken wir

Mehr

Bestandskundenmanagement Wo drückt bei Ihnen der Schuh?

Bestandskundenmanagement Wo drückt bei Ihnen der Schuh? Bestandskundenmanagement Wo drückt bei Ihnen der Schuh? best-reactions GmbH Hirschberger Straße 33 D 90559 Burgthann Alle Rechte vorbehalten HRB 23679, Amtsgericht Nürnberg Geschäftsführer Alexander P.

Mehr

26. GIL Jahrestagung

26. GIL Jahrestagung GeorgAugustUniversität Göttingen 26. GIL Jahrestagung Einsatz von künstlichen Neuronalen Netzen im Informationsmanagement der Land und Ernährungswirtschaft: Ein empirischer Methodenvergleich Holger Schulze,

Mehr

Verborgene Schätze heben

Verborgene Schätze heben Verborgene Schätze heben Data Mining mit dem Microsoft SQL Server Martin Oesterer Leiter Vertrieb HMS Analytical Software GmbH Data Mining. Was ist eigentlich wichtig? Data Mining ist: die Extraktion von

Mehr

Begriffsbestimmung CRISP-DM-Modell Betriebswirtschaftliche Einsatzgebiete des Data Mining Web Mining und Text Mining

Begriffsbestimmung CRISP-DM-Modell Betriebswirtschaftliche Einsatzgebiete des Data Mining Web Mining und Text Mining Gliederung 1. Einführung 2. Grundlagen Data Mining Begriffsbestimmung CRISP-DM-Modell Betriebswirtschaftliche Einsatzgebiete des Data Mining Web Mining und Text Mining 3. Ausgewählte Methoden des Data

Mehr

C09: Einsatz SAP BW im Vergleich zur Best-of-Breed-Produktauswahl

C09: Einsatz SAP BW im Vergleich zur Best-of-Breed-Produktauswahl C09: Einsatz SAP BW im Vergleich zur Best-of-Breed-Produktauswahl Ein Seminar der DWH academy Seminar C09 Einsatz SAP BW im Vergleich zur Best-of-Breed- Produktauswahl Befasst man sich im DWH mit der Auswahl

Mehr

Funktionaler Zusammenhang. Lehrplan Realschule

Funktionaler Zusammenhang. Lehrplan Realschule Funktionaler Bildungsstandards Lehrplan Realschule Die Schülerinnen und Schüler nutzen Funktionen als Mittel zur Beschreibung quantitativer Zusammenhänge, erkennen und beschreiben funktionale Zusammenhänge

Mehr

Was ist Data Mining... in der Fundraising Praxis?

Was ist Data Mining... in der Fundraising Praxis? Was ist Data Mining...... in der Fundraising Praxis? Erkennen von unbekannten Mustern in sehr grossen Datenbanken (> 1000 GB) wenige und leistungsfähige Verfahren Automatisierung Erkennen von unbekannten

Mehr

Informationsflut bewältigen - Textmining in der Praxis

Informationsflut bewältigen - Textmining in der Praxis Informationsflut bewältigen - Textmining in der Praxis Christiane Theusinger Business Unit Data Mining & CRM Solutions SAS Deutschland Ulrich Reincke Manager Business Data Mining Solutions SAS Deutschland

Mehr

IC Power-Pricing-Tool

IC Power-Pricing-Tool www.interconnectionconsulting.com Interconnection Vienna I Oberstdorf I Lviv www.interconnectionconsulting.com www.interconnectionconsulting.com we show you the way IC Power-Pricing-Tool Der Nutzen des

Mehr

1 WEB ANALYTICS: PROFESSIONELLE WEB-ANALYSEN UND REPORTING FÜR IHR ONLINE MARKETING.

1 WEB ANALYTICS: PROFESSIONELLE WEB-ANALYSEN UND REPORTING FÜR IHR ONLINE MARKETING. 1 WEB ANALYTICS: PROFESSIONELLE WEB-ANALYSEN UND REPORTING FÜR IHR ONLINE MARKETING. Web Analytics, Reporting & Beratung Erfolgskontrolle mit professionellen Web Analysen! Web Analytics mit Google Analytics

Mehr

SWOT-Analyse. Der BABOK V2.0 (Business Analysis Body Of Knowledge) definiert die SWOT-Analyse wie folgt:

SWOT-Analyse. Der BABOK V2.0 (Business Analysis Body Of Knowledge) definiert die SWOT-Analyse wie folgt: SWOT-Analyse Die SWOT-Analyse stammt ursprünglich aus dem militärischen Bereich und wurde in den 1960er-Jahren von der Harvard Business School zur Anwendung in Unternehmen vorgeschlagen. Die SWOT-Analyse

Mehr

Agile Vorgehensmodelle in der Softwareentwicklung: Scrum

Agile Vorgehensmodelle in der Softwareentwicklung: Scrum C A R L V O N O S S I E T Z K Y Agile Vorgehensmodelle in der Softwareentwicklung: Scrum Johannes Diemke Vortrag im Rahmen der Projektgruppe Oldenburger Robot Soccer Team im Wintersemester 2009/2010 Was

Mehr

Lars Priebe Senior Systemberater. ORACLE Deutschland GmbH

Lars Priebe Senior Systemberater. ORACLE Deutschland GmbH Lars Priebe Senior Systemberater ORACLE Deutschland GmbH Data Mining als Anwendung des Data Warehouse Konzepte und Beispiele Agenda Data Warehouse Konzept und Data Mining Data Mining Prozesse Anwendungs-Beispiele

Mehr

Institut für Computational Engineering ICE. N ä h e r d ra n a m S ys t e m d e r Te c h n i k d e r Z u ku n f t. w w w. n t b.

Institut für Computational Engineering ICE. N ä h e r d ra n a m S ys t e m d e r Te c h n i k d e r Z u ku n f t. w w w. n t b. Institut für Computational Engineering ICE N ä h e r d ra n a m S ys t e m d e r Te c h n i k d e r Z u ku n f t w w w. n t b. c h Rechnen Sie mit uns Foto: ESA Das Institut für Computational Engineering

Mehr

Advanced Analytics. Michael Ridder. Copyright 2000-2014 TIBCO Software Inc.

Advanced Analytics. Michael Ridder. Copyright 2000-2014 TIBCO Software Inc. Advanced Analytics Michael Ridder Was ist Advanced Analytics? 2 Was heißt Advanced Analytics? Advanced Analytics ist die autonome oder halbautonome Prüfung von Daten oder Inhalten mit ausgefeilten Techniken

Mehr

Vorhersagetechniken für zukünftiges Verhalten von Kunden

Vorhersagetechniken für zukünftiges Verhalten von Kunden IBM 360 Grad-Sicht auf den Kunden: Vorhersagetechniken für zukünftiges Verhalten von Kunden Sven Fessler, sven.fessler@de.ibm.com Solution Architect, IBM Germany Business Analytics & Optimization Das Spektrum

Mehr

Analyse zum Thema: Laufzeit von Support-Leistungen für ausgewählte Server OS

Analyse zum Thema: Laufzeit von Support-Leistungen für ausgewählte Server OS Analyse zum Thema: Laufzeit von Support-Leistungen für Axel Oppermann Advisor phone: +49 561 506975-24 mobile: +49 151 223 223 00 axel.oppermann@experton-group.com Januar 2010 Inhalt Summary und Key Findings

Mehr

9 Resümee. Resümee 216

9 Resümee. Resümee 216 Resümee 216 9 Resümee In der vorliegenden Arbeit werden verschiedene Methoden der Datenreduktion auf ihre Leistungsfähigkeit im sozialwissenschaftlichstatistischen Umfeld anhand eines konkreten Anwendungsfalls

Mehr

Auswahl alter Klausuraufgaben aus einer ähnlichen Vorlesung Maßgeblich für die Prüfung sind die Vorlesungsinhalte!

Auswahl alter Klausuraufgaben aus einer ähnlichen Vorlesung Maßgeblich für die Prüfung sind die Vorlesungsinhalte! Auswahl alter Klausuraufgaben aus einer ähnlichen Vorlesung Maßgeblich für die Prüfung sind die Vorlesungsinhalte! Aufgabe 1: Grundlagen (5 Punkte) a) Definieren Sie kurz Usability und User Experience.

Mehr

Data Mining (ehem. Entscheidungsunterstützungssysteme)

Data Mining (ehem. Entscheidungsunterstützungssysteme) Data Mining (ehem. Entscheidungsunterstützungssysteme) Melanie Pfoh Anja Tetzner Christian Schieder Übung WS 2014/15 AGENDA TEIL 1 Aufgabe 1 (Wiederholung OPAL / Vorlesungsinhalte) ENTSCHEIDUNG UND ENTSCHEIDUNGSTHEORIE

Mehr

Dominik Stockem Datenschutzbeauftragter Microsoft Deutschland GmbH

Dominik Stockem Datenschutzbeauftragter Microsoft Deutschland GmbH Dominik Stockem Datenschutzbeauftragter Microsoft Deutschland GmbH Peter Cullen, Microsoft Corporation Sicherheit - Die Sicherheit der Computer und Netzwerke unserer Kunden hat Top-Priorität und wir haben

Mehr

Objektorientierter Software-Entwurf Grundlagen 1 1. Analyse Design Implementierung. Frühe Phasen durch Informationssystemanalyse abgedeckt

Objektorientierter Software-Entwurf Grundlagen 1 1. Analyse Design Implementierung. Frühe Phasen durch Informationssystemanalyse abgedeckt Objektorientierter Software-Entwurf Grundlagen 1 1 Einordnung der Veranstaltung Analyse Design Implementierung Slide 1 Informationssystemanalyse Objektorientierter Software-Entwurf Frühe Phasen durch Informationssystemanalyse

Mehr

Hans-Friedrich Eckey SS 2004. Skript zur Lehrveranstaltung Multivariate Statistik

Hans-Friedrich Eckey SS 2004. Skript zur Lehrveranstaltung Multivariate Statistik Hans-Friedrich Eckey SS 2004 Skript zur Lehrveranstaltung Multivariate Statistik Vormerkungen I Vorbemerkungen Das Manuskript beinhaltet den gesamten Stoff, der Bestandteil der Lehrveranstaltung "Multivariate

Mehr

Big Data: Nutzen und Anwendungsszenarien. CeBIT 2014 Dr. Carsten Bange, Gründer und Geschäftsführer BARC

Big Data: Nutzen und Anwendungsszenarien. CeBIT 2014 Dr. Carsten Bange, Gründer und Geschäftsführer BARC Big Data: Nutzen und Anwendungsszenarien CeBIT 2014 Dr. Carsten Bange, Gründer und Geschäftsführer BARC Big Data steht für den unaufhaltsamen Trend, dass immer mehr Daten in Unternehmen anfallen und von

Mehr

Mining the Web. Analyse von Benutzerpfaden und Nutzertypen im Internet. Business Unit CRM Solutions SAS Deutschland. Dr.

Mining the Web. Analyse von Benutzerpfaden und Nutzertypen im Internet. Business Unit CRM Solutions SAS Deutschland. Dr. Mining the Web Analyse von Benutzerpfaden und Nutzertypen im Internet Dr. Frank Säuberlich Business Unit CRM Solutions SAS Deutschland Agenda 1. Einleitung: Der Lebenszyklus eines e-kunden Begriffsdefinition

Mehr

Analytisches CRM. Workshop Data Mining im Datenbasierten Marketing. Michael Lamprecht und Jan Frick, Altran GmbH & Co. KG 26.06.

Analytisches CRM. Workshop Data Mining im Datenbasierten Marketing. Michael Lamprecht und Jan Frick, Altran GmbH & Co. KG 26.06. Analytisches CRM Workshop Data Mining im Datenbasierten Marketing Michael Lamprecht und Jan Frick, Altran GmbH & Co. KG 26.06.2015 Data Mining bietet Antworten auf zahlreiche analytische Fragestellungen

Mehr

Preisliste für The Unscrambler X

Preisliste für The Unscrambler X Preisliste für The Unscrambler X english version Alle Preise verstehen sich netto zuzüglich gesetzlicher Mehrwertsteuer (19%). Irrtümer, Änderungen und Fehler sind vorbehalten. The Unscrambler wird mit

Mehr

Market Basket Analysis oder: isst man Salat zum Schnitzel?

Market Basket Analysis oder: isst man Salat zum Schnitzel? Market Basket Analysis oder: isst man Salat zum Schnitzel? SAS Forum Switzerland, 07. Mai 2013 Ralph Wenzl Migros-Genossenschafts-Bund Customer & Web Intelligence Agenda 1 2 3 4 Muster in Warenkörben 3

Mehr

So versprüht man digitalen Lockstoff

So versprüht man digitalen Lockstoff So versprüht man digitalen Lockstoff ist ein Spezialist für hyperlokales mobiles Advertising. Wir haben eine Webanwendung entwickelt, mit der potenzielle Kunden genau da erreicht werden, wo Sie es wünschen.

Mehr

How-to: Webserver NAT. Securepoint Security System Version 2007nx

How-to: Webserver NAT. Securepoint Security System Version 2007nx Securepoint Security System Inhaltsverzeichnis Webserver NAT... 3 1 Konfiguration einer Webserver NAT... 4 1.1 Einrichten von Netzwerkobjekten... 4 1.2 Erstellen von Firewall-Regeln... 6 Seite 2 Webserver

Mehr

e-business - Patterns Stefan Brauch (sb058) -- Julian Stoltmann (js057)

e-business - Patterns Stefan Brauch (sb058) -- Julian Stoltmann (js057) e-business - Patterns Stefan Brauch (sb058) -- Julian Stoltmann (js057) 1 e-business Patterns??? e-business Patterns Architekturen, die sich über die Zeit bewährt haben. Pattern-Fundgrube web-basierte

Mehr

Whitepaper. Produkt: combit Relationship Manager 7. combit Relationship Manager email-rückläufer Script. combit GmbH Untere Laube 30 78462 Konstanz

Whitepaper. Produkt: combit Relationship Manager 7. combit Relationship Manager email-rückläufer Script. combit GmbH Untere Laube 30 78462 Konstanz combit GmbH Untere Laube 30 78462 Konstanz Whitepaper Produkt: combit Relationship Manager 7 combit Relationship Manager email-rückläufer Script Inhalt Einleitung 3 Notwendige Anpassungen 3 crm Solution

Mehr

Korrelation (II) Korrelation und Kausalität

Korrelation (II) Korrelation und Kausalität Korrelation (II) Korrelation und Kausalität Situation: Seien X, Y zwei metrisch skalierte Merkmale mit Ausprägungen (x 1, x 2,..., x n ) bzw. (y 1, y 2,..., y n ). D.h. für jede i = 1, 2,..., n bezeichnen

Mehr

Look Inside: desite. modellorientiertes Arbeiten im Bauwesen. B.I.M.

Look Inside: desite. modellorientiertes Arbeiten im Bauwesen. B.I.M. Building Information Modeling Look Inside: desite modellorientiertes Arbeiten im Bauwesen. B.I.M. desite MD unterstützt Sie bei der täg lichen Arbeit mit Gebäudemodellen und ermöglicht den Zugang zu den

Mehr

Marketing Funnel INSIDERWISSEN INSIDERWISSEN: MARKETING FUNNEL

Marketing Funnel INSIDERWISSEN INSIDERWISSEN: MARKETING FUNNEL Marketing Funnel INSIDERWISSEN: MARKETING FUNNEL Mit diesen Materialien geben wir Ihnen alles mit auf den Weg, was Sie zum Thema Conversion-Rate Optimierung und Traffic Gernerierung wissen sollten. Erfahren

Mehr

Seminar Textmining SS 2015 Grundlagen des Maschinellen Lernens

Seminar Textmining SS 2015 Grundlagen des Maschinellen Lernens Seminar Textmining SS 2015 Grundlagen des Maschinellen Lernens Martin Hacker Richard Schaller Künstliche Intelligenz Department Informatik FAU Erlangen-Nürnberg 17.04.2015 Entscheidungsprobleme beim Textmining

Mehr

riskkv Scorenalyse riskkv Scoring Seite 1 von 9

riskkv Scorenalyse riskkv Scoring Seite 1 von 9 riskkv Scorenalyse riskkv Scoring Seite 1 von 9 Das Modul dient der flexiblen Erstellung, Auswertung und Verwendung von Scores. Durch vordefinierte Templates können in einer Einklicklösung bspw. versichertenbezogene

Mehr

Web Information Retrieval. Zwischendiskussion. Überblick. Meta-Suchmaschinen und Fusion (auch Rank Aggregation) Fusion

Web Information Retrieval. Zwischendiskussion. Überblick. Meta-Suchmaschinen und Fusion (auch Rank Aggregation) Fusion Web Information Retrieval Hauptseminar Sommersemester 2003 Thomas Mandl Überblick Mehrsprachigkeit Multimedialität Heterogenität Qualität, semantisch, technisch Struktur Links HTML Struktur Technologische

Mehr

Erfolg und Vermögensrückgänge angefertigt im Rahmen der Lehrveranstaltung Nachrichtentechnik von: Eric Hansen, eric-hansen@gmx.de am: 07.09.

Erfolg und Vermögensrückgänge angefertigt im Rahmen der Lehrveranstaltung Nachrichtentechnik von: Eric Hansen, eric-hansen@gmx.de am: 07.09. Abstract zum Thema Handelssysteme Erfolg und Vermögensrückgänge angefertigt im Rahmen der Lehrveranstaltung Nachrichtentechnik von: Eric Hansen, eric-hansen@gmx.de am: 07.09.01 Einleitung: Handelssysteme

Mehr

Masterarbeiten am Lehrstuhl für Marke3ng und Innova3on im Wintersemester 2012/13

Masterarbeiten am Lehrstuhl für Marke3ng und Innova3on im Wintersemester 2012/13 Masterarbeiten am Lehrstuhl für Marke3ng und Innova3on im Wintersemester 2012/13 1 Themenliste (I/IV) 1. Kaufentscheidungsprozesse im Internet aus Kundensicht In einer qualita/ven Studie soll untersucht

Mehr

Knowledge Discovery. Lösungsblatt 1

Knowledge Discovery. Lösungsblatt 1 Universität Kassel Fachbereich Mathematik/nformatik Fachgebiet Wissensverarbeitung Hertie-Stiftungslehrstuhl Wilhelmshöher Allee 73 34121 Kassel Email: hotho@cs.uni-kassel.de Tel.: ++49 561 804-6252 Dr.

Mehr

Daten fu r Navigator Mobile (ipad)

Daten fu r Navigator Mobile (ipad) [Kommentare] Inhalte Navigator Mobile für das ipad... 3 Programme und Dateien... 4 Folgende Installationen sind erforderlich:... 4 Es gibt verschiedene Dateiformate.... 4 Die Installationen... 5 Installation

Mehr

Summer Workshop Mehr Innovationskraft mit Change Management

Summer Workshop Mehr Innovationskraft mit Change Management Your Partner in Change. Your Partner in Innovation. Summer Workshop Mehr Innovationskraft mit Change Management Praxisbeispiel: Innovation im Tagesgeschäft etablieren www.integratedconsulting.at 1 Ausgangslage,

Mehr

Research Note zum Thema: Laufzeit von Support-Leistungen für Server OS

Research Note zum Thema: Laufzeit von Support-Leistungen für Server OS Research Note zum Thema: Laufzeit von Support-Leistungen für Axel Oppermann Advisor phone: +49 561 506975-24 mobile: +49 151 223 223 00 axel.oppermann@experton-group.com November 2009 Inhalt 1 EINFÜHRUNG

Mehr

Cross-Selling bei Versicherungen. Empirische Analyse zu Status quo, Trends und zukünftigen Anforderungen

Cross-Selling bei Versicherungen. Empirische Analyse zu Status quo, Trends und zukünftigen Anforderungen Georg Wittmann Christiane Früchtl Silke Weisheit Cross-Selling bei Versicherungen Empirische Analyse zu Status quo, Trends und zukünftigen Management Summary In der Studie Cross-Selling bei Versicherungen

Mehr

Delta Audit - Fragenkatalog ISO 9001:2014 DIS

Delta Audit - Fragenkatalog ISO 9001:2014 DIS QUMedia GbR Eisenbahnstraße 41 79098 Freiburg Tel. 07 61 / 29286-50 Fax 07 61 / 29286-77 E-mail info@qumedia.de www.qumedia.de Delta Audit - Fragenkatalog ISO 9001:2014 DIS Zur Handhabung des Audit - Fragenkatalogs

Mehr

Registrierungsprozess des Boardgeräts (OBU) Inhalt. 1.1. Registrierung auf der Online-Benutzeroberfläche HU-GO

Registrierungsprozess des Boardgeräts (OBU) Inhalt. 1.1. Registrierung auf der Online-Benutzeroberfläche HU-GO Registrierungsprozess des Boardgeräts (OBU) Inhalt 1. Einloggen... 1 1.1. Registrierung auf der Online-Benutzeroberfläche HU-GO... 1 1.2. Einloggen in das System HU-GO... 4 1.3. Auswahl des Kontos... 5

Mehr

Prof. Dr.-Ing. Rainer Schmidt 1

Prof. Dr.-Ing. Rainer Schmidt 1 Prof. Dr.-Ing. Rainer Schmidt 1 Business Analytics und Big Data sind Thema vieler Veröffentlichungen. Big Data wird immer häufiger bei Google als Suchbegriff verwendet. Prof. Dr.-Ing. Rainer Schmidt 2

Mehr

IMPLEMENTIERUNG VON GOOD PRACTICE ZUR REDUZIERUNG VON MEDIKATIONSFEHLERN IN SPITÄLERN

IMPLEMENTIERUNG VON GOOD PRACTICE ZUR REDUZIERUNG VON MEDIKATIONSFEHLERN IN SPITÄLERN IMPLEMENTIERUNG VON GOOD PRACTICE ZUR REDUZIERUNG VON MEDIKATIONSFEHLERN IN SPITÄLERN Zusammenfassende Beschreibung des Good practice -Beispieles Check der Medikation bei Aufnahme und Entlassung Im gegenständlichen

Mehr

MS SQL Server 2012 (4)

MS SQL Server 2012 (4) MS SQL Server 2012 (4) Data Mining, Analyse und multivariate Verfahren Marco Skulschus Jan Tittel Marcus Wiederstein Webseite zum Buch: http://vvwvv.comelio-medien.com/buch-kataiog/ms sql_server/ms sql

Mehr

Zielsetzung des Seminars IT Dienstleistungen in der Praxis Siemens Enterprise Communications Capgemini Gruppeneinteilung und Formales

Zielsetzung des Seminars IT Dienstleistungen in der Praxis Siemens Enterprise Communications Capgemini Gruppeneinteilung und Formales Seminar: Current Issues in IT-Service-Management Prof. Dr. Rüdiger Zarnekow TU Berlin, Fakultät VIII Institut für Technologie und Management Kommunikationsmanagement Agenda Zielsetzung des Seminars IT

Mehr

Fraud Prevention. Intelligente Bekämpfung von Betrug in Finanzinstituten

Fraud Prevention. Intelligente Bekämpfung von Betrug in Finanzinstituten Intelligente Bekämpfung von Betrug in Finanzinstituten Frankfurt, Ausgangssituation Wieso rückt das Thema Betrug immer mehr in den Fokus? In den vergangenen Jahren wurden Fragen nach dem Risikomanagement

Mehr

Clusteranalyse. Clusteranalyse. Fragestellung und Aufgaben. Abgrenzung Clusteranalyse - Diskriminanzanalyse. Rohdatenmatrix und Distanzmatrix

Clusteranalyse. Clusteranalyse. Fragestellung und Aufgaben. Abgrenzung Clusteranalyse - Diskriminanzanalyse. Rohdatenmatrix und Distanzmatrix TECHNISCHE UNIVERSITÄT MÜNCHEN-WEIHENSTEPHAN MATHEMATIK UND STATISTIK INFORMATIONS- UND DOKUMENTATIONSZENTRUM R. Biometrische und Ökonometrische Methoden II SS 00 Fragestellung und Aufgaben Abgrenzung

Mehr

Instruktionsheft für neue Webshop Hamifleurs

Instruktionsheft für neue Webshop Hamifleurs Instruktionsheft für neue Webshop Hamifleurs Instruktionen für neue Webshop Hamifleurs Gehen Sie zu www.hamifleurs.nl. Klicken Sie auf Login Kunden und es erscheint der Bildschirm auf der nächsten Seite.

Mehr

Workflow, Business Process Management, 4.Teil

Workflow, Business Process Management, 4.Teil Workflow, Business Process Management, 4.Teil 24. Januar 2004 Der vorliegende Text darf für Zwecke der Vorlesung Workflow, Business Process Management des Autors vervielfältigt werden. Eine weitere Nutzung

Mehr

Daten haben wir reichlich! 25.04.14 The unbelievable Machine Company 1

Daten haben wir reichlich! 25.04.14 The unbelievable Machine Company 1 Daten haben wir reichlich! 25.04.14 The unbelievable Machine Company 1 2.800.000.000.000.000.000.000 Bytes Daten im Jahr 2012* * Wenn jedes Byte einem Buchstaben entspricht und wir 1000 Buchstaben auf

Mehr

BETTER.SECURITY AWARENESS FÜR INFORMATIONSSICHERHEIT

BETTER.SECURITY AWARENESS FÜR INFORMATIONSSICHERHEIT FÜR INFORMATIONSSICHERHEIT FÜR INFORMATIONSSICHERHEIT Informationssicherheit bedingt höhere Anforderungen und mehr Verantwortung für Mitarbeiter und Management in Unternehmen und Organisationen. Awareness-Trainings

Mehr

Data Mining und maschinelles Lernen

Data Mining und maschinelles Lernen Data Mining und maschinelles Lernen Einführung und Anwendung mit WEKA Caren Brinckmann 16. August 2000 http://www.coli.uni-sb.de/~cabr/vortraege/ml.pdf http://www.cs.waikato.ac.nz/ml/weka/ Inhalt Einführung:

Mehr

Management Summary. Zusammenfassung der Ergebnisse aus dem ersten Teil der Analyse des Twitter Follower Netzwerks

Management Summary. Zusammenfassung der Ergebnisse aus dem ersten Teil der Analyse des Twitter Follower Netzwerks Management Summary Zusammenfassung der Ergebnisse aus dem ersten Teil der Analyse des Twitter Follower Netzwerks Research, Analysis & Consulting www.schwerdtundfeger.de 1 Datengrundlage Twitter Follower

Mehr

Prototypenentwicklung zur Identifikation gleichartiger Nachrichtenticker am Beispiel des Gashandels

Prototypenentwicklung zur Identifikation gleichartiger Nachrichtenticker am Beispiel des Gashandels Prototypenentwicklung zur Identifikation gleichartiger Nachrichtenticker am Beispiel des Gashandels TDWI Konferenz München, 24.06.2014 M.Sc.Susann Dreikorn Institut für Wirtschaftsinformatik, 2014 Agenda

Mehr

BI in der Cloud eine valide Alternative Überblick zum Leistungsspektrum und erste Erfahrungen 11.15 11.45

BI in der Cloud eine valide Alternative Überblick zum Leistungsspektrum und erste Erfahrungen 11.15 11.45 9.30 10.15 Kaffee & Registrierung 10.15 10.45 Begrüßung & aktuelle Entwicklungen bei QUNIS 10.45 11.15 11.15 11.45 Von Big Data zu Executive Decision BI für den Fachanwender bis hin zu Advanced Analytics

Mehr

W.WIINM32.11 (Datawarehousing) W.WIMAT03.13 (Statistik)

W.WIINM32.11 (Datawarehousing) W.WIMAT03.13 (Statistik) Modulbeschrieb Business Intelligence and Analytics 16.10.2013 Seite 1/5 Modulcode Leitidee Art der Ausbildung Studiengang Modultyp W.WIINM42.13 Information ist eine derart wichtige Komponente bei der Entscheidungsfindung,

Mehr

fh management, communication & it Constantin von Craushaar fh-management, communication & it Statistik Angewandte Statistik

fh management, communication & it Constantin von Craushaar fh-management, communication & it Statistik Angewandte Statistik fh management, communication & it Folie 1 Angewandte Statistik Übersicht Semester 1 Einführung ins SPSS Auswertung im SPSS anhand eines einfachen Beispieles Häufigkeitsauswertungen Grafiken Datenmanipulationen

Mehr

Task: Nmap Skripte ausführen

Task: Nmap Skripte ausführen Task: Nmap Skripte ausführen Inhalt Einfache Netzwerkscans mit NSE Ausführen des Scans Anpassung der Parameter Einleitung Copyright 2009-2015 Greenbone Networks GmbH Herkunft und aktuellste Version dieses

Mehr

Digitaler Vertriebsassistent Ihr Potential

Digitaler Vertriebsassistent Ihr Potential Digitaler Vertriebsassistent Ihr Potential Referenzen Unsere Kunden, die mit dem Digitalen Vertriebsassistenten potentielle B2B-Kunden generieren, qualifizieren und transferieren IT und Telekommunikation

Mehr

Data Mining als Arbeitsprozess

Data Mining als Arbeitsprozess Data Mining als Arbeitsprozess Hagen Knaf Studiengang Angewandte Mathematik Hochschule RheinMain 31. Dezember 2015 In Unternehmen werden umfangreichere Aktivitäten oder Projekte im Bereich des Data Mining

Mehr

SHARE_Personas Stimulierungsprojekt FFG Programm Benefit 5. Aussschreibung. Bernhard Wöckl Mai 2010

SHARE_Personas Stimulierungsprojekt FFG Programm Benefit 5. Aussschreibung. Bernhard Wöckl Mai 2010 SHARE_Personas Stimulierungsprojekt FFG Programm Benefit 5. Aussschreibung Bernhard Wöckl Mai 2010 Projektpartner CURE Center for Usability Research and Engineering Know-How in den Bereichen Personas Erstellung

Mehr

Grundlagen Statistik Angewandte Statistik 3. Semester

Grundlagen Statistik Angewandte Statistik 3. Semester Angewandte Statistik 3. Semester Zur Person Constantin von Craushaar Consultant / Partner Innstat e.u. (www.innstat.com) info@innstat.com Grundlagen der Statistik Übersicht Semester 1 Einführung ins SPSS

Mehr

WEBINAR@LUNCHTIME THEMA: "SAS STORED PROCESSES - SCHNELL GEZAUBERT" HELENE SCHMITZ

WEBINAR@LUNCHTIME THEMA: SAS STORED PROCESSES - SCHNELL GEZAUBERT HELENE SCHMITZ WEBINAR@LUNCHTIME THEMA: "SAS STORED PROCESSES - SCHNELL GEZAUBERT" HELENE SCHMITZ HERZLICH WILLKOMMEN BEI WEBINAR@LUNCHTIME Moderation Anne K. Bogner-Hamleh SAS Institute GmbH Education Consultant Training

Mehr

Fuzzy Logik und Genetische Algorithmen für adaptive Prozesskontrolle

Fuzzy Logik und Genetische Algorithmen für adaptive Prozesskontrolle Fuzzy Logik und Genetische Algorithmen für adaptive Prozesskontrolle Umgang mit unsicherem Wissen VAK 03-711.08 Oliver Ahlbrecht 8. Dezember 2005 Struktur 1. Einleitung 2. Beispiel Cart-Pole 3. Warum Hybride

Mehr

HMS. Statistiken mit SAS ins Internet. HMS Analytical Software GmbH - Johannes Lang

HMS. Statistiken mit SAS ins Internet. HMS Analytical Software GmbH - Johannes Lang HMS Statistiken mit SAS ins Internet HMS Analytical Software GmbH - Johannes Lang Schweizer Tage der öffentlichen Statistik, Davos 08.09. 10.09.2008 1 Agenda Vorstellung Inhaltliche Einleitung Statische

Mehr

Content Management System mit INTREXX 2002.

Content Management System mit INTREXX 2002. Content Management System mit INTREXX 2002. Welche Vorteile hat ein CM-System mit INTREXX? Sie haben bereits INTREXX im Einsatz? Dann liegt es auf der Hand, dass Sie ein CM-System zur Pflege Ihrer Webseite,

Mehr

Übungen zur Softwaretechnik

Übungen zur Softwaretechnik Technische Universität München Fakultät für Informatik Lehrstuhl IV: Software & Systems Engineering Markus Pister, Dr. Bernhard Rumpe WS 2002/2003 Lösungsblatt 9 17. Dezember 2002 www4.in.tum.de/~rumpe/se

Mehr

Ein Muster für ein Thesis Proposal

Ein Muster für ein Thesis Proposal Ein Muster für ein Thesis Proposal (Auszug aus der Vorlesung Schlüsselkompetenzen III) 1/12 03.07.09 Thesis Proposal Ein Thesis Proposal ist ein Dokument, das ein geplantes Dissertationsprojekt beschreibt

Mehr

Teil A Grundlagen und Methoden 1. 1 Customer Relationship Management ein Bezugsrahmen 3

Teil A Grundlagen und Methoden 1. 1 Customer Relationship Management ein Bezugsrahmen 3 xi Teil A Grundlagen und Methoden 1 1 Customer Relationship Management ein Bezugsrahmen 3 1.1 Die Entwicklung zum kundenzentrierten Unternehmen 3 1.2 Ziel und Kernkonzepte des CRM 5 1.2.1 Ziel: Profitable

Mehr

Erfolgreiche Webseiten: Zur Notwendigkeit die eigene(n) Zielgruppe(n) zu kennen und zu verstehen!

Erfolgreiche Webseiten: Zur Notwendigkeit die eigene(n) Zielgruppe(n) zu kennen und zu verstehen! Erfolgreiche Webseiten: Zur Notwendigkeit die eigene(n) Zielgruppe(n) zu kennen und zu verstehen! www.wee24.de. info@wee24.de. 08382 / 6040561 1 Experten sprechen Ihre Sprache. 2 Unternehmenswebseiten

Mehr

Künstliches binäres Neuron

Künstliches binäres Neuron Künstliches binäres Neuron G.Döben-Henisch Fachbereich Informatik und Ingenieurwissenschaften FH Frankfurt am Main University of Applied Sciences D-60318 Frankfurt am Main Germany Email: doeben at fb2.fh-frankfurt.de

Mehr

OUTSOURCING ADVISOR. Analyse von SW-Anwendungen und IT-Dienstleistungen auf ihre Global Sourcing Eignung. Bewertung von Dienstleistern und Standorten

OUTSOURCING ADVISOR. Analyse von SW-Anwendungen und IT-Dienstleistungen auf ihre Global Sourcing Eignung. Bewertung von Dienstleistern und Standorten Outsourcing Advisor Bewerten Sie Ihre Unternehmensanwendungen auf Global Sourcing Eignung, Wirtschaftlichkeit und wählen Sie den idealen Dienstleister aus. OUTSOURCING ADVISOR Der Outsourcing Advisor ist

Mehr

Anleitung Typo3-Extension - Raumbuchungssystem

Anleitung Typo3-Extension - Raumbuchungssystem Anleitung Typo3-Extension - Raumbuchungssystem t3m_calendar v 1.1 Stand 15.12.2011 Mehr Datails siehe: http://www.typo3-macher.de/typo3-ext-raumbuchungssystem.html 1 INHALT 1. Bedienungsanleitung der Anwendung...

Mehr