2165 DWH & Data Mining. WU Wien, SS 2009 Teil Data Mining Dr. Michaela Denk
|
|
- Calvin Fuchs
- vor 8 Jahren
- Abrufe
Transkript
1 2165 DWH & Data Mining WU Wien, SS 2009 Teil Data Mining Dr. Michaela Denk
2 Überblick Vorstellung Themen Organisatorisches Zeitplan Aufgabenstellungen Gruppeneinteilung Einführung WU SS DWH & DM - Michaela Denk 2
3 Vorstellung Ausbildung Diplom Statistik (Uni Wien) Doktorat SoWi-Wissenschaften (Uni Wien) Forschung, Entwicklung & Beratung Statistische Informationssysteme Metadaten Datenintegration Datenqualität Datenanalyse Partner & Auftraggeber Kontakt Uni Wien, WU Wien E-Commerce Compentence Center Paradigma Consulting Statistik Austria, ISTAT Internationale EU-geförderte Projekte WU SS DWH & DM - Michaela Denk 3
4 Themen Einführung Definition Fragestellungen Prozess Methoden Software Data Validation Methoden Entscheidungsbäume Faktoren-/Hauptkomponentenanalyse Neuronale Netze Diskriminanzanalyse & Logistische Regression Clusteranalyse (Soziale) Netzwerkanalyse WU SS DWH & DM - Michaela Denk 4
5 Zeitplan Organisatorisches Einführung Data Validation Methoden Entscheidungsbäume Faktoren- & Hauptkomponentenanalyse Neuronale Netze Methoden Diskriminanzanalyse Logistische Regression Clusteranalyse (Soziale) Netzwerkanalyse Gruppenpräsentationen 15 Min. Besprechung pro Gruppe 5 bis 10 ppt-slides Aufgabenstellung Vorgangsweise erste Ergebnisse offene Fragen Terminplan ab im Internet Abgabe schriftliche Arbeit ca. 20 Seiten gezählt ohne Deckblatt, Inhaltsverzeichnis, etc. per an mdenk@wu-wien.ac.at Erläuterung der Arbeitsteilung in der Gruppe, d.h. Beiträge der einzelnen Gruppenmitglieder WU SS DWH & DM - Michaela Denk 5
6 Aufgabenstellungen Datenanalyse (A1 bis A5) praktische Fragestellung Datensatz Software frei wählbar Literatur (B1 bis B3) methodische Fragestellung Lehrbücher, wiss. Publikationen Software (C1 bis C3) Analyse der Funktionalität bestehender bzw. Implementierung eigener Methoden Demonstration mit Datensatz Software vorgegeben WU SS DWH & DM - Michaela Denk 6
7 A Datenanalyse A1 Kundensegmentierung Der vorliegende Datensatz enthält Informationen über Kreditantragsteller einer EU-weit tätigen Bank. Analysieren Sie den Datensatz auf seine Validität und führen Sie eventuell erforderliche Bereinigungen durch. Identifizieren Sie anhand geeigneter Data Mining Verfahren möglichst heterogene (jedoch in sich homogene) Kundensegmente anhand der verfügbaren Eigenschaften der Kreditantragsteller. Beschreiben und visualisieren Sie die Kundensegmente. Wodurch unterscheiden sie sich und wie können sie charakterisiert werden? WU SS DWH & DM - Michaela Denk 7
8 A Datenanalyse A2 Credit Scoring Der vorliegende Datensatz enthält Informationen über Kreditantragsteller einer EU-weit tätigen Bank. Untersuchen Sie zunächst die Validität der Daten und führen Sie, sofern notwendig, Bereinigungen durch. Entwickeln Sie unter Einsatz geeigneter Data Mining Methoden Modelle zur Prognose der Qualität eines Kunden (d.h. der Wahrscheinlichkeit, dass der Kunde den Kredit zurückzahlen kann; Zielvariable Good_Bad) anhand der verfügbaren Eigenschaften der Kreditantragsteller. Wenden Sie dabei insb. auch zwei Entscheidungsbaumverfahren an mit Schwerpunkt auf Pruning und Cross Validation Techniken WU SS DWH & DM - Michaela Denk 8
9 A Datenanalyse A3 Kundensegmentierung Der vorliegende Datensatz enthält Informationen über Kreditantragsteller einer EU-weit tätigen Bank. Untersuchen Sie zunächst die Validität der Daten und führen Sie, sofern notwendig, Bereinigungen durch. Identifizieren Sie aus den verfügbaren Variablen unter Einsatz der Hauptkomponentenanalyse neue Variablen (Hauptkomponenten) zur Dimensionsreduktion. Entwickeln Sie mithilfe dieser Hauptkomponenten eine Segmentierung der Daten. Beschreiben Sie die gefundenen Segmente und die Qualität der Segmentierung. Untersuchen Sie die Segmente auch hinsichtlich des Merkmals Good_Bad, das primär zwischen guten und schlechten Kunden unterscheidet (d.h. Kreditantragstellern, die ihren Kredit zurückgezahlt bzw. nicht zurückgezahlt haben) WU SS DWH & DM - Michaela Denk 9
10 A Datenanalyse A4 Credit Scoring Der vorliegende Datensatz enthält Informationen über Kreditantragsteller einer EU-weit tätigen Bank. Analysieren Sie den Datensatz auf seine Validität und führen Sie eventuell erforderliche Bereinigungen durch. Wenden Sie geeignete Data Mining Methoden an, um ein Modell zur optimalen Diskriminierung von guten und schlechten Kunden (d.h. Kunden, die ihren Kredit zurückzahlen bzw. nicht zurückzahlen können) zu erhalten (Zielvariable Good_Bad). Welche Eigenschaften der Kreditantragsteller spielen bei der Klassifikation eine besondere Rolle? Beurteilen Sie die Qualität des Modells WU SS DWH & DM - Michaela Denk 10
11 A Datenanalyse A5 Credit Scoring Der vorliegende Datensatz enthält Informationen über Kreditantragsteller einer EU-weit tätigen Bank. Analysieren Sie den Datensatz auf seine Validität und führen Sie eventuell erforderliche Bereinigungen durch. Untersuchen Sie Ähnlichkeiten und vor allem Unterschiede der Supervised Learning Verfahren Logistische Regression, Entscheidungsbäume und Diskriminanzanalyse im Rahmen der Klassifikation der Kunden in die Kategorien good und bad der Zielvariable Good_Bad. Vergleichen und diskutieren Sie die Qualität der Klassifikation durch die angegebenen Verfahren. Wieviele Kunden werden unterschiedlich klassifiziert? Wodurch sind diese Kundengruppen charakterisiert? WU SS DWH & DM - Michaela Denk 11
12 B Literatur B1 Geschichte des Data Mining Schreiben Sie die Geschichte des Data Mining. Recherchieren Sie die Entstehung, die Entwicklung, sowie aktuelle Trends des Data Mining. Berücksichtigen Sie dabei sowohl Vorläufer wie KDD (Knowledge Discovery in Databases) oder AI (Artificial Intelligence) als auch jüngere Entwicklungen wie z.b. Text Mining. Legen Sie besonderen Wert auf eine systematische Darstellung der Teilbereiche und deren Zusammenhänge WU SS DWH & DM - Michaela Denk 12
13 B Literatur B2 Text Mining Recherchieren Sie aktuelle Artikel zum Thema Text Mining. Beschreiben Sie Aufgabenstellung, Lösungsansätze, Methoden und Anwendungsbeispiele aus der Praxis. Geben Sie einen Überblick über verfügbare Text Mining Software. Diskutieren Sie, in welcher Weise Text Mining eingesetzt werden kann, um zu einer 360 Sicht des Kunden zu gelangen WU SS DWH & DM - Michaela Denk 13
14 B Literatur B3 Assoziationsanalyse Recherchieren Sie aktuelle Artikel zum Thema Assoziationsanalyse. Beschreiben Sie Problemstellung, Lösungsansätze, Methoden und Anwendungsbeispiele aus der Praxis. Geben Sie einen Überblick über verfügbare Software. Diskutieren Sie, in welcher Weise Assoziationsanalyse eingesetzt werden kann, um eine Warenkorbanalyse durchzuführen WU SS DWH & DM - Michaela Denk 14
15 C Software C1 Softwarevergleich Stellen Sie die Funktionalität der Softwareprodukte WEKA, Clementine und R hinsichtlich der angebotenen (supervised) Klassifikationsverfahren gegenüber. Welche Verfahren werden unterstützt? Welche Parameter können vom Benutzer eingestellt werden? Wie sieht das gelieferte Ergebnis aus? Welche Vorteile/Nachteile gibt es? Demonstrieren Sie die Anwendung der Methoden mithilfe des vorliegenden Datensatzes aus dem Credit Scoring (Zielvariable Good_bad ) WU SS DWH & DM - Michaela Denk 15
16 C Software C2 (Soziale) Netzwerkanalyse Recherchieren Sie, welche Software für (Soziale) Netzwerkanalyse angeboten wird (kommerziell und open source). Beschreiben und vergleichen Sie die Funktionalität dieser Software. Wählen Sie eine frei verfügbare SNA-Software aus und demonstrieren Sie deren grundlegende Funktionalität anhand der vorliegenden Beispieldaten WU SS DWH & DM - Michaela Denk 16
17 C Software C3 Implementierung Implementieren Sie eine Funktion in R, die Folgendes unterstützt: hierarchische UND partitionierende Clustering-Verfahren mind. 3 unterschiedl. Clustermethoden bei hierarch. Vefahren (z.b. single linkage, Ward) und 3 Techniken zur Festlegung der Startlösung für partition. Verfahren (z.b. die Werte von k zufällig ausgewählten Beobachtungen, aus hierarchischer Analyse) mind. 2 unterschiedl. Distanzfunktionen pro Skalenniveau (z.b. Euklidische Distanz für metrische, Jaccard oder Tanimoto für nominale Variablen) und eine kombinierte Distanzfunktion für Datensätze mit Variablen auf unterschiedl. Skalenniveau zwei unterschiedl. Arten der Standardisierung der Ausgangsvariablen eine Kombination von hierarchischen und partitionierenden Verfahren, d.h. Ermittlung der Anzahl der Cluster mittels hierarchischem Verfahren, Bestimmung der endgültigen Clusterzuordnung mittels partitionierendem Verfahren die Beurteilung der Qualität der Clusterlösung durch eine anschl. Varianzanalyse die Beschreibung der Cluster durch die Gegenüberstellung deskriptiver Statistiken bestimmter Merkmale (auch graphisch) Die Ergebnisse der Funktion sollen in einem Listenobjekt zusammengefasst sein. Die Einbindung von Funktionen aus den Packages stats, MASS, graphics und flexclust ist erlaubt. Demonstrieren Sie die Funktionsweise Ihres Programms anhand des vorliegenden Credit Scoring Datensatzes WU SS DWH & DM - Michaela Denk 17
18 Einführung Data Mining Definition Fragestellungen Prozess Methoden Software WU SS DWH & DM - Michaela Denk 18
19 Einführung Data Mining Definition Fragestellungen Prozess Methoden Software WU SS DWH & DM - Michaela Denk 19
20 Data Mining istheanalysisof (oftenlarge) observational data sets to find unsuspected relationships and to summarize the data in novel ways that are both understandable and useful to the data owner. (Hand, Mannila, Smyth) WU SS DWH & DM - Michaela Denk 20
21 Data Mining is the process of discovering meaningful new correlations, patterns and trends by "mining" large amounts of stored data using pattern recognition technologies, as well as statistical and mathematical techniques. (Ashby, Simms) WU SS DWH & DM - Michaela Denk 21
22 Data Mining is the exploration and analysis, by automatic and semiautomatic means, of large quantities of data in order to discover meaningful patterns and rules. (Berry, Linoff) WU SS DWH & DM - Michaela Denk 22
23 Data Mining... is an interdisciplinary field bringing togther techniques from machine learning, pattern recognition, statistics, databases, and visualization to address the issue of information extraction from large data bases. (Simoudis) WU SS DWH & DM - Michaela Denk 23
24 Data Mining Sammlung von Methoden zum Auffinden von validen, neuen, relevanten, interpretierbaren und nützlichen (verwertbaren) Mustern, Regeln, Gruppen und Abhängigkeiten in großen Datenbeständen ( DWH) Fokus hier: betriebswirtschaftliche Fragestellungen WU SS DWH & DM - Michaela Denk 24
25 Einführung Data Mining Definition Fragestellungen Prozess Methoden Software WU SS DWH & DM - Michaela Denk 25
26 Beispiele für Quellen großer Datenmengen Supermarkt - Scannerdaten Banken - Transaktionsdaten Webseiten - Clickstream Daten Telekommunikation - Verbindungsdaten Genetik - Forschungsdatenbanken Meteorologie - Satellitendaten WU SS DWH & DM - Michaela Denk 26
27 DM-Problemstellungen Zielgruppenmarketing Direct Mailing Kampagnen Optimierung des Vertriebs- oder Marketingkanals Warenkorbanalysen Cross- & Up-Selling z.b. Versandhandel, Webshops, Supermärkte Kunden-/User-Profiling Churn-Analyse Prognose des Churnzeitpunkts Prognose der Ausfallwahrscheinlichkeit Prognose des Kreditrisikos, Bewertung der Kreditwürdigkeit Prognose von Konkursen Analyse der Zahlungsmoral Profitabilitätsanalysen WU SS DWH & DM - Michaela Denk 27
28 DM-Problemstellungen Fraud-Detection z.b. Steuerhinterziehung, Versicherungsbetrug, Kreditkarten Schadensfallanalyse Preisfestsetzung Prognose von Produkt-Ersatzzyklen Spam-Erkennung Handschrifterkennung Ermittlung potenzieller Verdächtiger aus Gerichtsprotokollen und Strafregistern Aufdecken von Verbrechensnetzwerken WU SS DWH & DM - Michaela Denk 28
29 DM-Problemstellungen Web Usage Mining Web Server Log Files Verhaltensmuster von Online- Kunden Bewegungspfade auf der Website Seitenoptimierung Wer sieht welche Inhalte wie oft? Profitabelste Online-Kundensegmente Welche Partner generieren kommerziell interessanten Traffic? Personalisierung von Seiteninhalten Prognose von Kaufwahrscheinlichkeiten Erkennung potentieller Käufer Prognose der Surf -Dauer bis ein Kauf getätigt wird WU SS DWH & DM - Michaela Denk 29
30 Beispiel Zielgruppenmarketing WU SS DWH & DM - Michaela Denk 30
31 Beispiel Zielgruppenmarketing Kunden angeschrieben davon haben (positiv) reagiert Auswahl der laut DM-Modell wahrscheinlichsten 10% (10.000) erreicht 400 der positiven Antworten, also 40% der Zielpopulation bei 40% Auswahl 80% der Zielpopulation WU SS DWH & DM - Michaela Denk 31
32 Einführung Data Mining Definition Fragestellungen Prozess Methoden Software WU SS DWH & DM - Michaela Denk 32
33 Klassischer KDD Prozess KDD Knowledge Discovery in Data Bases WU SS DWH & DM - Michaela Denk 33
34 Prozessstruktur - Beispiele SEMMA (SAS) Sample Explore Modify Model Assess CRISP-DM (ursprüngl. SPSS) Cross Industry Standard Process for Data Mining WU SS DWH & DM - Michaela Denk 34
35 CRISP-DM Business/Research Understanding Definition des Problemfeldes und der Ziele Übersetzung in Data Mining Fragestellung Identifikation der verfügbaren Daten Technische Voraussetzungen Schaffung eines entsprechenden IT-Umfeldes Datenbeschaffung WU SS DWH & DM - Michaela Denk 35
36 CRISP-DM Data Understanding Explorative Datenanalyse Qualität der Daten / Validierung Data Preparation Erstellung des finalen Datensatzes für die Modellierung Auswahl und Transformation von Variablen Auswahl der zu analysierenden Beobachtungen Datenbereinigung WU SS DWH & DM - Michaela Denk 36
37 CRISP-DM Modellierung Auswahl und Anwendung geeigneter Data Mining Verfahren Vergleich unterschiedlicher Ansätze Kalibrierung des Modells zur Optimierung der Ergebnisse Modellevaluation Bewertung der Qualität des Modells / der Modelle mittels geeigneter Kennzahlen Vergleich mit ursprünglichen Zielen Auswahl eines Modells für die Umsetzung Deployment Anwendung der Ergebnisse Reporting / Monitoring WU SS DWH & DM - Michaela Denk 37
38 CRISP-DM ein iterativer Prozess WU SS DWH & DM - Michaela Denk 38
39 Datenqualität essentiell für Qualität des DM-Ergebnisses Garbage in Garbage out! große Bedeutung von Data Understanding und Data Preparation 80:20 Regel Trend: Modellierungstechniken auch für diese Prozessphasen Datenqualitätsprojekte Exploratory Data Mining and Data Cleaning (Dasu, Johnson) Data Preparation for Analytics Using SAS (Svolba) WU SS DWH & DM - Michaela Denk 39
40 CRISP-DM Beispiel Fallstudie 5 aus Discovering Knowledge in Data (Larose) Profiling des Tourismusmarkts mittels Clusteranalyse WU SS DWH & DM - Michaela Denk 40
41 Business Understanding Phase University of Calgary, Alberta, Canada intraprovince tourist behavior in Alberta create profiles of domestic Albertan tourists based on the decision behavior of tourists form a quantitative basis for the development of an intraprovince marketing campaign, sponsored by Travel Alberta determine which factors were important in choosing destinations in Alberta evaluate the domestic perceptions of the Alberta vacation product comprehend the travel decision-making process WU SS DWH & DM - Michaela Denk 41
42 Data Understanding Phase data were collected in late 1999 phone survey of Albertans > 18 years old traveled for leisure at least 80 kilometers for at least one night within Alberta in the past year 3071 of the completed the survey and were eligible for inclusion in the study WU SS DWH & DM - Michaela Denk 42
43 Data Preparation Phase survey question to what extent do each of the factors from the following list of 13 factors most influence your travel decisions? quality of accommodations school holidays weather conditions cluster analysis performed upon these variables preparation included plausibility checks WU SS DWH & DM - Michaela Denk 43
44 Modeling Phase clustering natural choice for generating customer segment profiles k-means clustering quick and efficient as long as you know the number of clusters you expect to find two to six cluster models were explored final five-cluster solution Cluster 1: the young urban outdoor market. Youngest of all clusters, equally balanced genderwise, with school schedules and budgets looming large in their travel decisions. Cluster 2: the indoor leisure traveler market. Next youngest and very female, mostly married with children, with visiting family and friends a major factor in travel plans WU SS DWH & DM - Michaela Denk 44
45 Modeling Phase final five-cluster solution Cluster 3: the children-first market. More married and more children than any other cluster, with children s sports and competition schedules having great weight in deciding where to travel in Alberta. Cluster 4: the fair-weather-friends market. Second-oldest, slightly more male group, with weather conditions influencing travel decisions. Cluster 5: the older, cost-conscious traveler market. The oldest of the clusters, most influenced by cost/value considerations and a secure environment when making Alberta travel decisions WU SS DWH & DM - Michaela Denk 45
46 Evaluation Phase discriminant analysis to verify the reality of the cluster categorizations rate of correct classifications: 93% differences between clusters statistically significant WU SS DWH & DM - Michaela Denk 46
47 Deployment Phase launch of a new marketing campaign Alberta, Made to Order customized to cluster types launch of more than 80 projects through a cooperative arrangement between government and business Alberta, Made to Order TV commercials viewed about 20 times by over 90% of adults under 55 increase of over 20% in the number of Albertans who indicated Alberta as a top-of-the-mind travel destination WU SS DWH & DM - Michaela Denk 47
48 Einführung Data Mining Definition Fragestellungen Prozess Methoden Software WU SS DWH & DM - Michaela Denk 48
49 nach Art der Fragestellung Deskriptive Fragestellungen einfache Darstellung relevanter Strukturen, z.b. durch Datenreduktion und/oder graphische Veranschaulichung z.b. Faktorenanalyse, Multidimensionale Skalierung, Visualisierungsmethoden Abweichungsanalysen: automatisierte Identifikation abweichender Objekte, z.b. Erkennung von verändertem Kaufverhalten über die Zeit vgl. Methoden der Datenvalidierung wie z.b. für Ausreißererkennung Assoziation: Beschreibung von Abhängigkeiten zwischen Objekten, z.b. Warenkorbanalyse z.b. Assoziationsanalyse, Korrelationsanalyse, Netzwerkanalyse Gruppenbildung (Clustering): Einteilung der Objekte in Klassen, die ähnliche Merkmalsausprägungen aufweisen, z.b. Kundensegmente z.b. Clusteranalyse, Blockmodeling WU SS DWH & DM - Michaela Denk 49
50 nach Art der Fragestellung Prädiktive Fragestellungen Klassifikation: Zuordnung von neuen Objekten zu vorab definierten Klassen, z.b. Kreditrisiko z.b. logistische Regression, Diskriminanzanalyse, Entscheidungsbäume, neuronale Netze Prognose: Bestimmung einer unbekannten Merkmalsausprägung eines Objektes auf Basis bekannter Merkmale, z.b. Vorhersage der Höhe der Weihnachtseinkäufe einer bestimmten Kundengruppe, Imputation fehlender Werte z.b. lineare Regression, neuronale Netze WU SS DWH & DM - Michaela Denk 50
51 Modell- oder Datengeleitet? Theorie-/Modellgeleitet Korrelationsanalyse Lineare Regression (Varianzanalyse) Logistische Regression Diskriminanzanalyse Zeitreihenanalyse Datengeleitet Clusteranalyse Blockmodeling Faktorenanalyse Multidimensionale Skalierung Assoziationsanalyse Entscheidungsbäume Neuronale Netze Netzwerkanalyse WU SS DWH & DM - Michaela Denk 51
52 Korrelationsanalyse besteht ein linearer Zusammenhang zwischen zwei oder mehreren Merkmalen? Variablen gleichberechtigt Beispiel: Steht die Häufigkeit (und/oder Dauer) der Benutzung einer Webseite in Zusammenhang mit der Häufigkeit (und/oder dem Volumen) der Einkäufe im angeschlossenen Online-Shop? WU SS DWH & DM - Michaela Denk 52
53 Lineare Regression erforscht die Art des linearen Zusammenhangs zwischen Variablen abhängige und erklärende Variablen abhängige Variable ist metrisch Beispiel: Jährl. Einkaufsvolumen = a + b*surfhäufigkeit + c*geschlecht + + Fehler WU SS DWH & DM - Michaela Denk 53
54 (Varianzanalyse) besteht ein Unterschied zwischen definierten Gruppen hinsichtlich bestimmter Merkmale? abhängige Variable ist metrisch Gruppierung ist erklärende Variable Beispiel: Gibt es einen Unterschied bezüglich der Profitabilität eines Kunden je nach Ausbildungsniveau? WU SS DWH & DM - Michaela Denk 54
55 Logistische Regression erforscht den Zusammenhang zwischen einer dichotomen abhängigen Variable und beliebigen erklärenden Variablen Prognose von Wahrscheinlichkeiten Beispiel: Vorhersage des Kreditrisikos in Abhängigkeit von demographischen Variablen, Kreditsumme, Art und Ausmaß der Besicherung WU SS DWH & DM - Michaela Denk 55
56 Diskriminanzanalyse erstellt Zuordnungsregeln zu bestehenden Gruppen (Klassifikation) erforscht Zusammenhang zwischen kategorieller abhängiger Variable und erklärenden Variablen Einsatz statt logistischer Regression möglich Beispiel: Churn-Prediction WU SS DWH & DM - Michaela Denk 56
57 Diskriminanzanalyse Linear Quadratisch WU SS DWH & DM - Michaela Denk 57
58 Clusteranalyse erstellt Gruppierung der Beobachtungen basierend auf Ähnlichkeiten der verfügbaren Merkmale Unterschied zu Diskriminanzanalyse Gruppierung wird erstellt, ist noch nicht vorgegeben Beispiel: Kundensegmentierung anhand demographischer Eigenschaften, Einkäufe im letzten Jahr, WU SS DWH & DM - Michaela Denk 58
59 (Soziale) Netzwerkanalyse Untersuchung von relationalen Daten (=Netzwerk) umfasst Methoden der Visualisierung Netzwerkgraphen, Adjazenzgraphiken, Heat Maps Beschreibung insb. graphentheoretische Kennzahlen Gruppenbildung z.b. Blockmodeling Prognose spezielle Regressionsmodelle für relationale Daten Beispiel: Mobilfunkkunden sind Knoten im Netzwerk Welche Teil-Netzwerke können identifiziert werden? Welche Kunden telefonieren v.a. innerhalb des eigenen Netzes? WU SS DWH & DM - Michaela Denk 59
60 Faktorenanalyse Reduktion einer Vielzahl von verfügbaren Merkmalen auf eine geringe Anzahl von zugrunde liegenden Faktoren Beispiel: Auf welche grundlegenden Faktoren können die Merkmale, die eine Bank über ihre Kunden gesammelt hat, zurückgeführt werden? WU SS DWH & DM - Michaela Denk 60
61 Entscheidungsbäume dienen wie die Diskriminanzanalyse und die logistische Regression zur Klassifikation von Objekten abhängige Variable ist dichotom (oder kategoriell) für erklärende Variablen werden Schwellwerte festgelegt entstehende Gruppen möglichst homogen hinsichtlich der abhängigen Variable Beispiel: Prognose der Kaufwahrscheinlichkeit in Abhängigkeit verschiedener Kundenmerkmale WU SS DWH & DM - Michaela Denk 61
62 Neuronale Netze eigentlich künstliche neuronale Netze Nervenzellvernetzungen im Gehirn nachempfunden Informationsweitergabe zwischen Neuronen Netz wird auf bestimmte Fragestellung, z.b. Klassifikation oder Prognose, trainiert meist als Black Box empfunden schwer vermittelbar Problem des Overfitting WU SS DWH & DM - Michaela Denk 62
63 Hybride Modellierung & Evaluierung Ermittlung mehrerer Modell-Kandidaten unterschiedliche Methoden unterschiedliche Parametrisierung Einsatz von Resampling-Techniken Kreuzvalidierung, Bootstrap, Jacknife Prognose Randomisieren Durchschnitt der Modelle, Voting (Bagging) Gewichtung durch Expertenmeinung Adaptive Gewichtung (Boosting) Meta-Lernen (Stacking) Trainings- und Testdaten WU SS DWH & DM - Michaela Denk 63
64 Einführung Data Mining Definition Fragestellungen Prozess Methoden Software WU SS DWH & DM - Michaela Denk 64
65 Kommerzielle DM-Software SAS Enterprise Miner Graphische Benutzeroberfläche Prozessfluss durch Knoten und Verknüpfungen darstellbar Knoten = Methoden zu SEMMA-Phasen Große Auswahl an statistischen Methoden Standard-SAS-Code kann eingebunden werden Anbindung an SAS- (und andere) DWH möglich v.a. bei großen Unternehmen im Einsatz kostspielig WU SS DWH & DM - Michaela Denk 65
66 SAS Enterprise Miner WU SS DWH & DM - Michaela Denk 66
67 Kommerzielle DM-Software SPSS Clementine Graphische Benutzeroberfläche Prozessfluss durch Knoten und Verknüpfungen darstellbar folgt CRISP-DM-Prozess große Auswahl an statistischen Methoden Anbindung an Datenbanken möglich v.a. in der Markt- und Meinungsforschung im Einsatz weniger kostspielig WU SS DWH & DM - Michaela Denk 67
68 SPSS Clementine WU SS DWH & DM - Michaela Denk 68
69 Freie DM-Software WEKA Waikato Environment for Knowledge Analysis Graphische Benutzeroberfläche Ebenfalls Darstellung des Prozessflusses möglich Speziell an DM orientiert Einsatz v.a. in Forschung und Lehre Open Source WU SS DWH & DM - Michaela Denk 69
70 WEKA WU SS DWH & DM - Michaela Denk 70
71 Freie DM-Software R allgemeine statistische Programmierumgebung keine graphische Benutzeroberfläche für DM Funktionen für klassische statistische Verfahren Pakete für spezielle Data Mining Algorithmen i.a. auch sehr aktuelle Verfahren verfügbar Einsatz v.a. in Forschung und Lehre Open Source WU SS DWH & DM - Michaela Denk 71
72 Software für spezielle DM-Algorithmen Pajek Soziale Netzwerkanalyse Pro Price Preisoptimierung Pro Deli Marktsegmentierung Conjoint Analyse Simulation von Marktanteilen WU SS DWH & DM - Michaela Denk 72
Data Mining mit der SEMMA Methodik. Reinhard Strüby, SAS Institute Stephanie Freese, Herlitz PBS AG
Data Mining mit der SEMMA Methodik Reinhard Strüby, SAS Institute Stephanie Freese, Herlitz PBS AG Data Mining Data Mining: Prozeß der Selektion, Exploration und Modellierung großer Datenmengen, um Information
MehrFachgruppe Statistik, Risikoanalyse & Computing. STAT672 Data Mining. Sommersemester 2007. Prof. Dr. R. D. Reiß
Fachgruppe Statistik, Risikoanalyse & Computing STAT672 Data Mining Sommersemester 2007 Prof. Dr. R. D. Reiß Überblick Data Mining Begrifflichkeit Unter Data Mining versteht man die Computergestützte Suche
MehrSeminar Business Intelligence Teil II. Data Mining & Knowledge Discovery
Seminar Business Intelligence Teil II Data Mining & Knowledge Discovery Was ist Data Mining? Sabine Queckbörner Was ist Data Mining? Data Mining Was ist Data Mining? Nach welchen Mustern wird gesucht?
MehrPPC und Data Mining. Seminar aus Informatik LV-911.039. Michael Brugger. Fachbereich der Angewandten Informatik Universität Salzburg. 28.
PPC und Data Mining Seminar aus Informatik LV-911.039 Michael Brugger Fachbereich der Angewandten Informatik Universität Salzburg 28. Mai 2010 M. Brugger () PPC und Data Mining 28. Mai 2010 1 / 14 Inhalt
MehrPredictive Modeling Markup Language. Thomas Morandell
Predictive Modeling Markup Language Thomas Morandell Index Einführung PMML als Standard für den Austausch von Data Mining Ergebnissen/Prozessen Allgemeine Struktur eines PMML Dokuments Beispiel von PMML
MehrTiefgreifende Prozessverbesserung und Wissensmanagement durch Data Mining
Tiefgreifende Prozessverbesserung und Wissensmanagement durch Data Mining Ausgangssituation Kaizen Data Mining ISO 9001 Wenn andere Methoden an ihre Grenzen stoßen Es gibt unzählige Methoden, die Abläufe
MehrExploration und Klassifikation von BigData
Exploration und Klassifikation von BigData Inhalt Einführung Daten Data Mining: Vorbereitungen Clustering Konvexe Hülle Fragen Google: Riesige Datenmengen (2009: Prozessieren von 24 Petabytes pro Tag)
MehrDie Wahlpflichtfächer. Operations Research Statistik/Ökonometrie. Optimierung linearer Modelle Statistische Analyseverfahren
Die Wahlpflichtfächer Operations Research Statistik/Ökonometrie Modellierung ökonomischer Sachverhalte mit mathematischen Mitteln Einsatz statistischer Modelle zur Erfassung und zur Auswertung von Daten
MehrData Mining-Modelle und -Algorithmen
Data Mining-Modelle und -Algorithmen Data Mining-Modelle und -Algorithmen Data Mining ist ein Prozess, bei dem mehrere Komponenten i n- teragieren. Sie greifen auf Datenquellen, um diese zum Training,
MehrWeb Mining effektive Analyse des Nutzer- Verhaltens im Internet
Web Mining effektive Analyse des Nutzer- Verhaltens im Internet Dr. Frank Säuberlich Business Unit e-intelligence SAS Deutschland Agenda 1. Begriffsdefinition e-intelligence: Systemdimension Angebotsdimension
MehrDISKUSSIONSBEITRÄGE DER FAKULTÄT FÜR BETRIEBSWIRTSCHAFTSLEHRE MERCATOR SCHOOL OF MANAGEMENT UNIVERSITÄT DUISBURG-ESSEN. Nr. 374
DISKUSSIONSBEITRÄGE DER FAKULTÄT FÜR BETRIEBSWIRTSCHAFTSLEHRE MERCATOR SCHOOL OF MANAGEMENT UNIVERSITÄT DUISBURG-ESSEN Nr. 374 Eignung von Verfahren der Mustererkennung im Process Mining Sabrina Kohne
MehrMEHR ANALYTICS FÜR MEHR ANWENDER DR. GERHARD SVOLBA COE ANALYTICS DACH WIEN, 11. JUNI 2015
MEHR ANALYTICS FÜR MEHR ANWENDER DR. GERHARD SVOLBA COE ANALYTICS DACH WIEN, 11. JUNI 2015 DAS ERWARTET SIE IN MEINEM VORTRAG Neue Anforderungen, neue Herausforderungen, neue Möglichkeiten Software Demo:
MehrWas ist Analyse? Hannover, CeBIT 2014 Patrick Keller
Was ist? Hannover, CeBIT 2014 Patrick Keller Business Application Research Center Historie 1994: Beginn der Untersuchung von Business-Intelligence-Software am Lehrstuhl Wirtschaftsinformatik der Universität
MehrSeminar C02 - Praxisvergleich OLAP Tools
C02: Praxisvergleich OLAP Tools Ein Seminar der DWH academy Seminar C02 - Praxisvergleich OLAP Tools Das Seminar "Praxisvergleich OLAP-Tools" bietet den Teilnehmern eine neutrale Einführung in die Technologien
MehrData/Information Quality Management
Data/Information Quality Management Seminar WI/Informationsmanagement im Sommersemester 2002 Markus Berberov, Roman Eder, Peter Gerstbach 11.6.2002 Inhalt! Daten und Datenqualität! Einführung und Definition!
MehrEntscheidungsbaumverfahren
Entscheidungsbaumverfahren Allgemeine Beschreibung Der Entscheidungsbaum ist die Darstellung einer Entscheidungsregel, anhand derer Objekte in Klassen eingeteilt werden. Die Klassifizierung erfolgt durch
MehrBusiness Analytics im E-Commerce
Business Analytics im E-Commerce Kunde, Kontext und sein Verhalten verstehen für personalisierte Kundenansprache Janusz Michalewicz CEO Über die Firma Crehler Erstellung von Onlineshops Analyse von Transaktionsdaten
MehrVoraussetzung wieder: Datenraum mit Instanzen, mehrere Attribute - kein ausgezeichnetes Zielattribut, keine vorgegebenen Klassen
7. Clusteranalyse (= Häufungsanalyse; Clustering-Verfahren) wird der multivariaten Statistik zugeordnet Voraussetzung wieder: Datenraum mit Instanzen, mehrere Attribute - kein ausgezeichnetes Zielattribut,
Mehr360 - Der Weg zum gläsernen Unternehmen mit QlikView am Beispiel Einkauf
360 - Der Weg zum gläsernen Unternehmen mit QlikView am Beispiel Einkauf Von der Entstehung bis heute 1996 als EDV Beratung Saller gegründet, seit 2010 BI4U GmbH Firmensitz ist Unterschleißheim (bei München)
MehrHauptseminar am Fachgebiet für Quantitative Methoden der Wirtschaftswissenschaften
Hauptseminar am Fachgebiet für Quantitative Methoden der Wirtschaftswissenschaften Fehlende Daten in der Multivariaten Statistik SS 2011 Allgemeines Das Seminar richtet sich in erster Linie an Studierende
MehrEntwicklung des Dentalmarktes in 2010 und Papier versus Plastik.
Sehr geehrter Teilnehmer, hier lesen Sie die Ergebnisse aus unserer Umfrage: Entwicklung des Dentalmarktes in 2010 und Papier versus Plastik. Für die zahlreiche Teilnahme an dieser Umfrage bedanken wir
MehrBestandskundenmanagement Wo drückt bei Ihnen der Schuh?
Bestandskundenmanagement Wo drückt bei Ihnen der Schuh? best-reactions GmbH Hirschberger Straße 33 D 90559 Burgthann Alle Rechte vorbehalten HRB 23679, Amtsgericht Nürnberg Geschäftsführer Alexander P.
Mehr26. GIL Jahrestagung
GeorgAugustUniversität Göttingen 26. GIL Jahrestagung Einsatz von künstlichen Neuronalen Netzen im Informationsmanagement der Land und Ernährungswirtschaft: Ein empirischer Methodenvergleich Holger Schulze,
MehrVerborgene Schätze heben
Verborgene Schätze heben Data Mining mit dem Microsoft SQL Server Martin Oesterer Leiter Vertrieb HMS Analytical Software GmbH Data Mining. Was ist eigentlich wichtig? Data Mining ist: die Extraktion von
MehrBegriffsbestimmung CRISP-DM-Modell Betriebswirtschaftliche Einsatzgebiete des Data Mining Web Mining und Text Mining
Gliederung 1. Einführung 2. Grundlagen Data Mining Begriffsbestimmung CRISP-DM-Modell Betriebswirtschaftliche Einsatzgebiete des Data Mining Web Mining und Text Mining 3. Ausgewählte Methoden des Data
MehrC09: Einsatz SAP BW im Vergleich zur Best-of-Breed-Produktauswahl
C09: Einsatz SAP BW im Vergleich zur Best-of-Breed-Produktauswahl Ein Seminar der DWH academy Seminar C09 Einsatz SAP BW im Vergleich zur Best-of-Breed- Produktauswahl Befasst man sich im DWH mit der Auswahl
MehrFunktionaler Zusammenhang. Lehrplan Realschule
Funktionaler Bildungsstandards Lehrplan Realschule Die Schülerinnen und Schüler nutzen Funktionen als Mittel zur Beschreibung quantitativer Zusammenhänge, erkennen und beschreiben funktionale Zusammenhänge
MehrWas ist Data Mining... in der Fundraising Praxis?
Was ist Data Mining...... in der Fundraising Praxis? Erkennen von unbekannten Mustern in sehr grossen Datenbanken (> 1000 GB) wenige und leistungsfähige Verfahren Automatisierung Erkennen von unbekannten
MehrInformationsflut bewältigen - Textmining in der Praxis
Informationsflut bewältigen - Textmining in der Praxis Christiane Theusinger Business Unit Data Mining & CRM Solutions SAS Deutschland Ulrich Reincke Manager Business Data Mining Solutions SAS Deutschland
MehrIC Power-Pricing-Tool
www.interconnectionconsulting.com Interconnection Vienna I Oberstdorf I Lviv www.interconnectionconsulting.com www.interconnectionconsulting.com we show you the way IC Power-Pricing-Tool Der Nutzen des
Mehr1 WEB ANALYTICS: PROFESSIONELLE WEB-ANALYSEN UND REPORTING FÜR IHR ONLINE MARKETING.
1 WEB ANALYTICS: PROFESSIONELLE WEB-ANALYSEN UND REPORTING FÜR IHR ONLINE MARKETING. Web Analytics, Reporting & Beratung Erfolgskontrolle mit professionellen Web Analysen! Web Analytics mit Google Analytics
MehrSWOT-Analyse. Der BABOK V2.0 (Business Analysis Body Of Knowledge) definiert die SWOT-Analyse wie folgt:
SWOT-Analyse Die SWOT-Analyse stammt ursprünglich aus dem militärischen Bereich und wurde in den 1960er-Jahren von der Harvard Business School zur Anwendung in Unternehmen vorgeschlagen. Die SWOT-Analyse
MehrAgile Vorgehensmodelle in der Softwareentwicklung: Scrum
C A R L V O N O S S I E T Z K Y Agile Vorgehensmodelle in der Softwareentwicklung: Scrum Johannes Diemke Vortrag im Rahmen der Projektgruppe Oldenburger Robot Soccer Team im Wintersemester 2009/2010 Was
MehrLars Priebe Senior Systemberater. ORACLE Deutschland GmbH
Lars Priebe Senior Systemberater ORACLE Deutschland GmbH Data Mining als Anwendung des Data Warehouse Konzepte und Beispiele Agenda Data Warehouse Konzept und Data Mining Data Mining Prozesse Anwendungs-Beispiele
MehrInstitut für Computational Engineering ICE. N ä h e r d ra n a m S ys t e m d e r Te c h n i k d e r Z u ku n f t. w w w. n t b.
Institut für Computational Engineering ICE N ä h e r d ra n a m S ys t e m d e r Te c h n i k d e r Z u ku n f t w w w. n t b. c h Rechnen Sie mit uns Foto: ESA Das Institut für Computational Engineering
MehrAdvanced Analytics. Michael Ridder. Copyright 2000-2014 TIBCO Software Inc.
Advanced Analytics Michael Ridder Was ist Advanced Analytics? 2 Was heißt Advanced Analytics? Advanced Analytics ist die autonome oder halbautonome Prüfung von Daten oder Inhalten mit ausgefeilten Techniken
MehrVorhersagetechniken für zukünftiges Verhalten von Kunden
IBM 360 Grad-Sicht auf den Kunden: Vorhersagetechniken für zukünftiges Verhalten von Kunden Sven Fessler, sven.fessler@de.ibm.com Solution Architect, IBM Germany Business Analytics & Optimization Das Spektrum
MehrAnalyse zum Thema: Laufzeit von Support-Leistungen für ausgewählte Server OS
Analyse zum Thema: Laufzeit von Support-Leistungen für Axel Oppermann Advisor phone: +49 561 506975-24 mobile: +49 151 223 223 00 axel.oppermann@experton-group.com Januar 2010 Inhalt Summary und Key Findings
Mehr9 Resümee. Resümee 216
Resümee 216 9 Resümee In der vorliegenden Arbeit werden verschiedene Methoden der Datenreduktion auf ihre Leistungsfähigkeit im sozialwissenschaftlichstatistischen Umfeld anhand eines konkreten Anwendungsfalls
MehrAuswahl alter Klausuraufgaben aus einer ähnlichen Vorlesung Maßgeblich für die Prüfung sind die Vorlesungsinhalte!
Auswahl alter Klausuraufgaben aus einer ähnlichen Vorlesung Maßgeblich für die Prüfung sind die Vorlesungsinhalte! Aufgabe 1: Grundlagen (5 Punkte) a) Definieren Sie kurz Usability und User Experience.
MehrData Mining (ehem. Entscheidungsunterstützungssysteme)
Data Mining (ehem. Entscheidungsunterstützungssysteme) Melanie Pfoh Anja Tetzner Christian Schieder Übung WS 2014/15 AGENDA TEIL 1 Aufgabe 1 (Wiederholung OPAL / Vorlesungsinhalte) ENTSCHEIDUNG UND ENTSCHEIDUNGSTHEORIE
MehrDominik Stockem Datenschutzbeauftragter Microsoft Deutschland GmbH
Dominik Stockem Datenschutzbeauftragter Microsoft Deutschland GmbH Peter Cullen, Microsoft Corporation Sicherheit - Die Sicherheit der Computer und Netzwerke unserer Kunden hat Top-Priorität und wir haben
MehrObjektorientierter Software-Entwurf Grundlagen 1 1. Analyse Design Implementierung. Frühe Phasen durch Informationssystemanalyse abgedeckt
Objektorientierter Software-Entwurf Grundlagen 1 1 Einordnung der Veranstaltung Analyse Design Implementierung Slide 1 Informationssystemanalyse Objektorientierter Software-Entwurf Frühe Phasen durch Informationssystemanalyse
MehrHans-Friedrich Eckey SS 2004. Skript zur Lehrveranstaltung Multivariate Statistik
Hans-Friedrich Eckey SS 2004 Skript zur Lehrveranstaltung Multivariate Statistik Vormerkungen I Vorbemerkungen Das Manuskript beinhaltet den gesamten Stoff, der Bestandteil der Lehrveranstaltung "Multivariate
MehrBig Data: Nutzen und Anwendungsszenarien. CeBIT 2014 Dr. Carsten Bange, Gründer und Geschäftsführer BARC
Big Data: Nutzen und Anwendungsszenarien CeBIT 2014 Dr. Carsten Bange, Gründer und Geschäftsführer BARC Big Data steht für den unaufhaltsamen Trend, dass immer mehr Daten in Unternehmen anfallen und von
MehrMining the Web. Analyse von Benutzerpfaden und Nutzertypen im Internet. Business Unit CRM Solutions SAS Deutschland. Dr.
Mining the Web Analyse von Benutzerpfaden und Nutzertypen im Internet Dr. Frank Säuberlich Business Unit CRM Solutions SAS Deutschland Agenda 1. Einleitung: Der Lebenszyklus eines e-kunden Begriffsdefinition
MehrAnalytisches CRM. Workshop Data Mining im Datenbasierten Marketing. Michael Lamprecht und Jan Frick, Altran GmbH & Co. KG 26.06.
Analytisches CRM Workshop Data Mining im Datenbasierten Marketing Michael Lamprecht und Jan Frick, Altran GmbH & Co. KG 26.06.2015 Data Mining bietet Antworten auf zahlreiche analytische Fragestellungen
MehrPreisliste für The Unscrambler X
Preisliste für The Unscrambler X english version Alle Preise verstehen sich netto zuzüglich gesetzlicher Mehrwertsteuer (19%). Irrtümer, Änderungen und Fehler sind vorbehalten. The Unscrambler wird mit
MehrMarket Basket Analysis oder: isst man Salat zum Schnitzel?
Market Basket Analysis oder: isst man Salat zum Schnitzel? SAS Forum Switzerland, 07. Mai 2013 Ralph Wenzl Migros-Genossenschafts-Bund Customer & Web Intelligence Agenda 1 2 3 4 Muster in Warenkörben 3
MehrSo versprüht man digitalen Lockstoff
So versprüht man digitalen Lockstoff ist ein Spezialist für hyperlokales mobiles Advertising. Wir haben eine Webanwendung entwickelt, mit der potenzielle Kunden genau da erreicht werden, wo Sie es wünschen.
MehrHow-to: Webserver NAT. Securepoint Security System Version 2007nx
Securepoint Security System Inhaltsverzeichnis Webserver NAT... 3 1 Konfiguration einer Webserver NAT... 4 1.1 Einrichten von Netzwerkobjekten... 4 1.2 Erstellen von Firewall-Regeln... 6 Seite 2 Webserver
Mehre-business - Patterns Stefan Brauch (sb058) -- Julian Stoltmann (js057)
e-business - Patterns Stefan Brauch (sb058) -- Julian Stoltmann (js057) 1 e-business Patterns??? e-business Patterns Architekturen, die sich über die Zeit bewährt haben. Pattern-Fundgrube web-basierte
MehrWhitepaper. Produkt: combit Relationship Manager 7. combit Relationship Manager email-rückläufer Script. combit GmbH Untere Laube 30 78462 Konstanz
combit GmbH Untere Laube 30 78462 Konstanz Whitepaper Produkt: combit Relationship Manager 7 combit Relationship Manager email-rückläufer Script Inhalt Einleitung 3 Notwendige Anpassungen 3 crm Solution
MehrKorrelation (II) Korrelation und Kausalität
Korrelation (II) Korrelation und Kausalität Situation: Seien X, Y zwei metrisch skalierte Merkmale mit Ausprägungen (x 1, x 2,..., x n ) bzw. (y 1, y 2,..., y n ). D.h. für jede i = 1, 2,..., n bezeichnen
MehrLook Inside: desite. modellorientiertes Arbeiten im Bauwesen. B.I.M.
Building Information Modeling Look Inside: desite modellorientiertes Arbeiten im Bauwesen. B.I.M. desite MD unterstützt Sie bei der täg lichen Arbeit mit Gebäudemodellen und ermöglicht den Zugang zu den
MehrMarketing Funnel INSIDERWISSEN INSIDERWISSEN: MARKETING FUNNEL
Marketing Funnel INSIDERWISSEN: MARKETING FUNNEL Mit diesen Materialien geben wir Ihnen alles mit auf den Weg, was Sie zum Thema Conversion-Rate Optimierung und Traffic Gernerierung wissen sollten. Erfahren
MehrSeminar Textmining SS 2015 Grundlagen des Maschinellen Lernens
Seminar Textmining SS 2015 Grundlagen des Maschinellen Lernens Martin Hacker Richard Schaller Künstliche Intelligenz Department Informatik FAU Erlangen-Nürnberg 17.04.2015 Entscheidungsprobleme beim Textmining
Mehrriskkv Scorenalyse riskkv Scoring Seite 1 von 9
riskkv Scorenalyse riskkv Scoring Seite 1 von 9 Das Modul dient der flexiblen Erstellung, Auswertung und Verwendung von Scores. Durch vordefinierte Templates können in einer Einklicklösung bspw. versichertenbezogene
MehrWeb Information Retrieval. Zwischendiskussion. Überblick. Meta-Suchmaschinen und Fusion (auch Rank Aggregation) Fusion
Web Information Retrieval Hauptseminar Sommersemester 2003 Thomas Mandl Überblick Mehrsprachigkeit Multimedialität Heterogenität Qualität, semantisch, technisch Struktur Links HTML Struktur Technologische
MehrErfolg und Vermögensrückgänge angefertigt im Rahmen der Lehrveranstaltung Nachrichtentechnik von: Eric Hansen, eric-hansen@gmx.de am: 07.09.
Abstract zum Thema Handelssysteme Erfolg und Vermögensrückgänge angefertigt im Rahmen der Lehrveranstaltung Nachrichtentechnik von: Eric Hansen, eric-hansen@gmx.de am: 07.09.01 Einleitung: Handelssysteme
MehrMasterarbeiten am Lehrstuhl für Marke3ng und Innova3on im Wintersemester 2012/13
Masterarbeiten am Lehrstuhl für Marke3ng und Innova3on im Wintersemester 2012/13 1 Themenliste (I/IV) 1. Kaufentscheidungsprozesse im Internet aus Kundensicht In einer qualita/ven Studie soll untersucht
MehrKnowledge Discovery. Lösungsblatt 1
Universität Kassel Fachbereich Mathematik/nformatik Fachgebiet Wissensverarbeitung Hertie-Stiftungslehrstuhl Wilhelmshöher Allee 73 34121 Kassel Email: hotho@cs.uni-kassel.de Tel.: ++49 561 804-6252 Dr.
MehrDaten fu r Navigator Mobile (ipad)
[Kommentare] Inhalte Navigator Mobile für das ipad... 3 Programme und Dateien... 4 Folgende Installationen sind erforderlich:... 4 Es gibt verschiedene Dateiformate.... 4 Die Installationen... 5 Installation
MehrSummer Workshop Mehr Innovationskraft mit Change Management
Your Partner in Change. Your Partner in Innovation. Summer Workshop Mehr Innovationskraft mit Change Management Praxisbeispiel: Innovation im Tagesgeschäft etablieren www.integratedconsulting.at 1 Ausgangslage,
MehrResearch Note zum Thema: Laufzeit von Support-Leistungen für Server OS
Research Note zum Thema: Laufzeit von Support-Leistungen für Axel Oppermann Advisor phone: +49 561 506975-24 mobile: +49 151 223 223 00 axel.oppermann@experton-group.com November 2009 Inhalt 1 EINFÜHRUNG
MehrCross-Selling bei Versicherungen. Empirische Analyse zu Status quo, Trends und zukünftigen Anforderungen
Georg Wittmann Christiane Früchtl Silke Weisheit Cross-Selling bei Versicherungen Empirische Analyse zu Status quo, Trends und zukünftigen Management Summary In der Studie Cross-Selling bei Versicherungen
MehrDelta Audit - Fragenkatalog ISO 9001:2014 DIS
QUMedia GbR Eisenbahnstraße 41 79098 Freiburg Tel. 07 61 / 29286-50 Fax 07 61 / 29286-77 E-mail info@qumedia.de www.qumedia.de Delta Audit - Fragenkatalog ISO 9001:2014 DIS Zur Handhabung des Audit - Fragenkatalogs
MehrRegistrierungsprozess des Boardgeräts (OBU) Inhalt. 1.1. Registrierung auf der Online-Benutzeroberfläche HU-GO
Registrierungsprozess des Boardgeräts (OBU) Inhalt 1. Einloggen... 1 1.1. Registrierung auf der Online-Benutzeroberfläche HU-GO... 1 1.2. Einloggen in das System HU-GO... 4 1.3. Auswahl des Kontos... 5
MehrProf. Dr.-Ing. Rainer Schmidt 1
Prof. Dr.-Ing. Rainer Schmidt 1 Business Analytics und Big Data sind Thema vieler Veröffentlichungen. Big Data wird immer häufiger bei Google als Suchbegriff verwendet. Prof. Dr.-Ing. Rainer Schmidt 2
MehrIMPLEMENTIERUNG VON GOOD PRACTICE ZUR REDUZIERUNG VON MEDIKATIONSFEHLERN IN SPITÄLERN
IMPLEMENTIERUNG VON GOOD PRACTICE ZUR REDUZIERUNG VON MEDIKATIONSFEHLERN IN SPITÄLERN Zusammenfassende Beschreibung des Good practice -Beispieles Check der Medikation bei Aufnahme und Entlassung Im gegenständlichen
MehrMS SQL Server 2012 (4)
MS SQL Server 2012 (4) Data Mining, Analyse und multivariate Verfahren Marco Skulschus Jan Tittel Marcus Wiederstein Webseite zum Buch: http://vvwvv.comelio-medien.com/buch-kataiog/ms sql_server/ms sql
MehrZielsetzung des Seminars IT Dienstleistungen in der Praxis Siemens Enterprise Communications Capgemini Gruppeneinteilung und Formales
Seminar: Current Issues in IT-Service-Management Prof. Dr. Rüdiger Zarnekow TU Berlin, Fakultät VIII Institut für Technologie und Management Kommunikationsmanagement Agenda Zielsetzung des Seminars IT
MehrFraud Prevention. Intelligente Bekämpfung von Betrug in Finanzinstituten
Intelligente Bekämpfung von Betrug in Finanzinstituten Frankfurt, Ausgangssituation Wieso rückt das Thema Betrug immer mehr in den Fokus? In den vergangenen Jahren wurden Fragen nach dem Risikomanagement
MehrClusteranalyse. Clusteranalyse. Fragestellung und Aufgaben. Abgrenzung Clusteranalyse - Diskriminanzanalyse. Rohdatenmatrix und Distanzmatrix
TECHNISCHE UNIVERSITÄT MÜNCHEN-WEIHENSTEPHAN MATHEMATIK UND STATISTIK INFORMATIONS- UND DOKUMENTATIONSZENTRUM R. Biometrische und Ökonometrische Methoden II SS 00 Fragestellung und Aufgaben Abgrenzung
MehrInstruktionsheft für neue Webshop Hamifleurs
Instruktionsheft für neue Webshop Hamifleurs Instruktionen für neue Webshop Hamifleurs Gehen Sie zu www.hamifleurs.nl. Klicken Sie auf Login Kunden und es erscheint der Bildschirm auf der nächsten Seite.
MehrWorkflow, Business Process Management, 4.Teil
Workflow, Business Process Management, 4.Teil 24. Januar 2004 Der vorliegende Text darf für Zwecke der Vorlesung Workflow, Business Process Management des Autors vervielfältigt werden. Eine weitere Nutzung
MehrDaten haben wir reichlich! 25.04.14 The unbelievable Machine Company 1
Daten haben wir reichlich! 25.04.14 The unbelievable Machine Company 1 2.800.000.000.000.000.000.000 Bytes Daten im Jahr 2012* * Wenn jedes Byte einem Buchstaben entspricht und wir 1000 Buchstaben auf
MehrBETTER.SECURITY AWARENESS FÜR INFORMATIONSSICHERHEIT
FÜR INFORMATIONSSICHERHEIT FÜR INFORMATIONSSICHERHEIT Informationssicherheit bedingt höhere Anforderungen und mehr Verantwortung für Mitarbeiter und Management in Unternehmen und Organisationen. Awareness-Trainings
MehrData Mining und maschinelles Lernen
Data Mining und maschinelles Lernen Einführung und Anwendung mit WEKA Caren Brinckmann 16. August 2000 http://www.coli.uni-sb.de/~cabr/vortraege/ml.pdf http://www.cs.waikato.ac.nz/ml/weka/ Inhalt Einführung:
MehrManagement Summary. Zusammenfassung der Ergebnisse aus dem ersten Teil der Analyse des Twitter Follower Netzwerks
Management Summary Zusammenfassung der Ergebnisse aus dem ersten Teil der Analyse des Twitter Follower Netzwerks Research, Analysis & Consulting www.schwerdtundfeger.de 1 Datengrundlage Twitter Follower
MehrPrototypenentwicklung zur Identifikation gleichartiger Nachrichtenticker am Beispiel des Gashandels
Prototypenentwicklung zur Identifikation gleichartiger Nachrichtenticker am Beispiel des Gashandels TDWI Konferenz München, 24.06.2014 M.Sc.Susann Dreikorn Institut für Wirtschaftsinformatik, 2014 Agenda
MehrBI in der Cloud eine valide Alternative Überblick zum Leistungsspektrum und erste Erfahrungen 11.15 11.45
9.30 10.15 Kaffee & Registrierung 10.15 10.45 Begrüßung & aktuelle Entwicklungen bei QUNIS 10.45 11.15 11.15 11.45 Von Big Data zu Executive Decision BI für den Fachanwender bis hin zu Advanced Analytics
MehrW.WIINM32.11 (Datawarehousing) W.WIMAT03.13 (Statistik)
Modulbeschrieb Business Intelligence and Analytics 16.10.2013 Seite 1/5 Modulcode Leitidee Art der Ausbildung Studiengang Modultyp W.WIINM42.13 Information ist eine derart wichtige Komponente bei der Entscheidungsfindung,
Mehrfh management, communication & it Constantin von Craushaar fh-management, communication & it Statistik Angewandte Statistik
fh management, communication & it Folie 1 Angewandte Statistik Übersicht Semester 1 Einführung ins SPSS Auswertung im SPSS anhand eines einfachen Beispieles Häufigkeitsauswertungen Grafiken Datenmanipulationen
MehrTask: Nmap Skripte ausführen
Task: Nmap Skripte ausführen Inhalt Einfache Netzwerkscans mit NSE Ausführen des Scans Anpassung der Parameter Einleitung Copyright 2009-2015 Greenbone Networks GmbH Herkunft und aktuellste Version dieses
MehrDigitaler Vertriebsassistent Ihr Potential
Digitaler Vertriebsassistent Ihr Potential Referenzen Unsere Kunden, die mit dem Digitalen Vertriebsassistenten potentielle B2B-Kunden generieren, qualifizieren und transferieren IT und Telekommunikation
MehrData Mining als Arbeitsprozess
Data Mining als Arbeitsprozess Hagen Knaf Studiengang Angewandte Mathematik Hochschule RheinMain 31. Dezember 2015 In Unternehmen werden umfangreichere Aktivitäten oder Projekte im Bereich des Data Mining
MehrSHARE_Personas Stimulierungsprojekt FFG Programm Benefit 5. Aussschreibung. Bernhard Wöckl Mai 2010
SHARE_Personas Stimulierungsprojekt FFG Programm Benefit 5. Aussschreibung Bernhard Wöckl Mai 2010 Projektpartner CURE Center for Usability Research and Engineering Know-How in den Bereichen Personas Erstellung
MehrGrundlagen Statistik Angewandte Statistik 3. Semester
Angewandte Statistik 3. Semester Zur Person Constantin von Craushaar Consultant / Partner Innstat e.u. (www.innstat.com) info@innstat.com Grundlagen der Statistik Übersicht Semester 1 Einführung ins SPSS
MehrWEBINAR@LUNCHTIME THEMA: "SAS STORED PROCESSES - SCHNELL GEZAUBERT" HELENE SCHMITZ
WEBINAR@LUNCHTIME THEMA: "SAS STORED PROCESSES - SCHNELL GEZAUBERT" HELENE SCHMITZ HERZLICH WILLKOMMEN BEI WEBINAR@LUNCHTIME Moderation Anne K. Bogner-Hamleh SAS Institute GmbH Education Consultant Training
MehrFuzzy Logik und Genetische Algorithmen für adaptive Prozesskontrolle
Fuzzy Logik und Genetische Algorithmen für adaptive Prozesskontrolle Umgang mit unsicherem Wissen VAK 03-711.08 Oliver Ahlbrecht 8. Dezember 2005 Struktur 1. Einleitung 2. Beispiel Cart-Pole 3. Warum Hybride
MehrHMS. Statistiken mit SAS ins Internet. HMS Analytical Software GmbH - Johannes Lang
HMS Statistiken mit SAS ins Internet HMS Analytical Software GmbH - Johannes Lang Schweizer Tage der öffentlichen Statistik, Davos 08.09. 10.09.2008 1 Agenda Vorstellung Inhaltliche Einleitung Statische
MehrContent Management System mit INTREXX 2002.
Content Management System mit INTREXX 2002. Welche Vorteile hat ein CM-System mit INTREXX? Sie haben bereits INTREXX im Einsatz? Dann liegt es auf der Hand, dass Sie ein CM-System zur Pflege Ihrer Webseite,
MehrÜbungen zur Softwaretechnik
Technische Universität München Fakultät für Informatik Lehrstuhl IV: Software & Systems Engineering Markus Pister, Dr. Bernhard Rumpe WS 2002/2003 Lösungsblatt 9 17. Dezember 2002 www4.in.tum.de/~rumpe/se
MehrEin Muster für ein Thesis Proposal
Ein Muster für ein Thesis Proposal (Auszug aus der Vorlesung Schlüsselkompetenzen III) 1/12 03.07.09 Thesis Proposal Ein Thesis Proposal ist ein Dokument, das ein geplantes Dissertationsprojekt beschreibt
MehrTeil A Grundlagen und Methoden 1. 1 Customer Relationship Management ein Bezugsrahmen 3
xi Teil A Grundlagen und Methoden 1 1 Customer Relationship Management ein Bezugsrahmen 3 1.1 Die Entwicklung zum kundenzentrierten Unternehmen 3 1.2 Ziel und Kernkonzepte des CRM 5 1.2.1 Ziel: Profitable
MehrErfolgreiche Webseiten: Zur Notwendigkeit die eigene(n) Zielgruppe(n) zu kennen und zu verstehen!
Erfolgreiche Webseiten: Zur Notwendigkeit die eigene(n) Zielgruppe(n) zu kennen und zu verstehen! www.wee24.de. info@wee24.de. 08382 / 6040561 1 Experten sprechen Ihre Sprache. 2 Unternehmenswebseiten
MehrKünstliches binäres Neuron
Künstliches binäres Neuron G.Döben-Henisch Fachbereich Informatik und Ingenieurwissenschaften FH Frankfurt am Main University of Applied Sciences D-60318 Frankfurt am Main Germany Email: doeben at fb2.fh-frankfurt.de
MehrOUTSOURCING ADVISOR. Analyse von SW-Anwendungen und IT-Dienstleistungen auf ihre Global Sourcing Eignung. Bewertung von Dienstleistern und Standorten
Outsourcing Advisor Bewerten Sie Ihre Unternehmensanwendungen auf Global Sourcing Eignung, Wirtschaftlichkeit und wählen Sie den idealen Dienstleister aus. OUTSOURCING ADVISOR Der Outsourcing Advisor ist
MehrAnleitung Typo3-Extension - Raumbuchungssystem
Anleitung Typo3-Extension - Raumbuchungssystem t3m_calendar v 1.1 Stand 15.12.2011 Mehr Datails siehe: http://www.typo3-macher.de/typo3-ext-raumbuchungssystem.html 1 INHALT 1. Bedienungsanleitung der Anwendung...
Mehr