Begriffsbestimmung CRISP-DM-Modell Betriebswirtschaftliche Einsatzgebiete des Data Mining Web Mining und Text Mining
|
|
- Damian Otto
- vor 8 Jahren
- Abrufe
Transkript
1 Gliederung 1. Einführung 2. Grundlagen Data Mining Begriffsbestimmung CRISP-DM-Modell Betriebswirtschaftliche Einsatzgebiete des Data Mining Web Mining und Text Mining 3. Ausgewählte Methoden des Data Mining Künstliche Neuronale Netze Entscheidungsbaumverfahren Clusterverfahren 4. Zusammenfassung und Ausblick Folie 28
2 Begriffsbestimmung Prozessorientiertes Verständnis von Data Mining (entspricht Knowledge Discovery in Databases): Data Mining als Prozess,... der aus einer Datenmenge implizit vorhandene, aber bisher unentdeckte, nützliche Informationen extrahiert. Mertens, Bissantz, Hagedorn: Datenmustererkennung in der Ergebnisrechnung mit Hilfe der Clusteranalyse, in: Die Betriebswirtschaft (DBW), 54. Jg., Heft 6, 1994, S Methodenorientiertes Verständnis von Data Mining (entspricht einer Phase im KDD-Prozess): Data Mining umfasst alle Aktivitäten,»that find a logical or mathematical description, eventually of a complex nature, of patterns and regularities in a set of data.«bankhofer: Data Mining und seine betriebswirtschaftliche Relevanz, in: Betriebswirtschaftliche Forschung und Praxis (BFuP), 56. Jg., Heft 4, 2004, S Folie 29
3 Cross Industry Standard Process for Data Mining-Modell (CRISP-DM-Modell) Prozessmodell (Industriestandard) für die Durchführung von Data Mining- Projekten mit sechs Phasen Chapman et al.: CRISP-DM 1.0, Step-by-step data mining guide, aufgerufen im Internet unter: S. 13 Folie 30
4 CRISP-DM Business Understanding Formulierung einer genauen Problembeschreibung einschließlich einer darauf folgenden Aufgabendefinition Abstimmung mit vorhandenen organisatorischen Strukturen und Abläufen einer Unternehmung Teilschritte: Situationsanalyse und Aufgabendefinition Formulierung der Data-Mining-Ziele Erstellung des Projektplans Folie 31
5 CRISP-DM Data Understanding Identifizierung benötigter Daten in internen und externen Quellen Auswahl relevanter Daten Erste Analysen des Datenbestandes durch Nutzung von Visualisierungstechniken sowie Methoden der deskriptiven Statistik Abschätzung der Datenqualität Folie 32
6 Extraktion relevanter Daten Sind die nötigen Daten verfügbar? Evtl. Datenerhebung (Testmailing), Datenanreicherung Berücksichtigung aller internen Datenquellen Informationen aus den Fachabteilungen Informationen aus der DV DM-Daten Verstehen der Daten! Daten in Vorsystemen Extraktion Folie 33
7 Externe (demografische) Daten Firmeninterne Informationen zu einem Kunden zumeist Kundenstammdaten und Vertragsdaten Zusätzliche demografische Informationen zu diesen Kunden Bevölkerungskennzahlen, Arbeitsloseninformationen, private Kaufkraft, finanzielle Situation, Status, bevorzugte Automarken, Bildungslevel, Art des Wohngebietes,... detaillierteres Bild des Kunden - Erhöhung der Analysequalität Folie 34
8 Externe Daten Lifestyledaten aus Haushaltsbefragungen (Konsumprofile, Konsuminteressen) Wohngebäudedatenbanken (Wohnverhältnisse) Inkassodaten (Bonität) Marktforschungsdaten Folie 35
9 Externe (demografische) Daten Prinzip demografischer Daten: In einem Wohngebiet leben meist Personen mit ähnlichem gesellschaftlichen Status, Lebensstil und finanziellen Möglichkeiten. Verschiedenste Anbieter externer Daten (demografisch, Finanzkennzahlen): Schufa, AZ Direct, Axciom, Schober, Informa,... Folie 36
10 Demografische Daten auf Kundengruppenebene 1. Die Datenanbieter erheben auf kleinen Wohneinheiten (Kreisgemeindeschlüssel) Informationen über die Bewohner. 2. Ein Kunde wird an Hand eines Adressabgleichs einer Einheit zugeordnet. 3. Die durchschnittliche Information auf dieser Einheit wird als geschätzter Wert für den Kunden verwendet. Folie 37
11 Beispiel Acxiom 2 Mio Haushalte werden regelmäßig befragt Fragen zu Themen wie: Auto, Beruf, Hobbys, Geld&Versicherung, Spendenbereitschaft etc. Fragen zu zukünftigen Kaufabsichten Folie 38
12 Folie 39 Beispiel AZ Direct Person Haushalt Haus Mikrogeographische Datenbank (Ø 70 Haushalte pro Straßenabschnitt) Wahlbezirk Gemeinde/Postleitahlgebiet Anrede Akademischer Titel Berufscode Vorname, Name Telefon-Nr. Alterskategorie Geburtsdatum Sperrkennzeichen Konsum-Schwerpunkte Familie Textilien Zeitschriften Hobby Körperpflege, Gesundheit Heim, Haus, Garten Neuheiten Nahrungs-/Genussmittel Horoskope, Esoterik Ökologie, Natur, Bio Finanzdienstleistungen Fernsehen Manager, Führungskräfte, Entscheider Postkaufaffinität... Haushaltsvorstand Haushaltsart Anzahl der Haushaltsmitglieder PLZ Ortsname Straße Anzahl Familien pro Haus Wohngebietstyp Kaufkraft Mail-order-Neigung Altersstruktur Bebauungsstruktur Business-Struktur... KFZ-Informationen Koordinaten... Gemeindegrößenklasse offizielle Statistiken Koordinaten...
13 CRISP-DM Data Preparation (Preprocessing) Zielgerichtete Aufbereitung der Daten für die nachfolgenden Analysen Bis zu 80% der zeitlichen, technischen und personellen Ressourcen Teilschritte: Datenbereinigung (Data Cleansing) Datentransformation (Data Transformation) Folie 40
14 Data Preparation (Datenaufbereitung) Gründe: Datenqualität Methodische Anforderungen Data Mining Problemstellung Verbesserung der Analyseergebnisse Reduzierung des Zeitaufwandes Folie 41
15 CRISP-DM Data Cleansing Maßnahmen zur Erhöhung der Qualität des Datenbestandes und damit der Datenanwendbarkeit Korrektur fehlerhafter Daten Ergänzung fehlender Daten Eliminierung von Redundanzen Kriterien zur Beurteilung der Datenqualität Vollständigkeit Konsistenz Genauigkeit Korrektheit Aktualität Folie 42
16 Data Cleansing Name Age Region City Children Meier 56 NRW Duisburg 3 Schulz 32 NRW Duisburg Yes Muster NRW Essen 2 Müller 18 NRW Diusburg 4 fehlende Werte fehlerhafte Werte Redundanz Folie 43
17 Data Cleansing -Behandlung fehlender Werte Daten aus operativen Prozessen oft lückenhaft Je nach Methode sind vollständige Datensätze Voraussetzung Möglichkeiten: Ausschluss unvollständiger Datensätze Ausschluss lückenhafter Merkmale Ersetzen fehlender Werte Kodierung fehlender Werte als zusätzliche Ausprägung Folie 44
18 Data Cleansing -Ersetzen fehlender Werte Einsetzen eines plausiblen Wertes Einfachste Vorgehensweise: Arithmetisches Mittel Modalwert Anspruchsvolleres Vorgehen: Anwendung statistischer Verfahren Korrelationsbeziehungen zwischen Merkmalen Individuelle Schätzwerte Folie 45
19 Data Cleansing - Beispiel Vorname Produkt Werbeweg Alter Jennifer CD Backstreet Boys Internet Gertrude CD Lustige Musikanten Couponanzeige im Goldenen Blatt Fehlende Werte Folie 46
20 Data Cleansing - Beispiel Vorname Produkt Werbeweg Alter Jennifer CD Tokio Hotel Internet 17 Gertrude CD Lustige Musikanten Couponanzeige im Goldenen Blatt 68 Zu Vorname, Produkt und Werbeweg passendes Durchschnittsalter Folie 47
21 CRISP-DM Data Transformation Maßnahmen Formatumwandlungen Datenstrukturen Datenanreicherung Datenreduktion Alphanumerische und numerische Datentypen Anpassung von Skalenniveaus Normierung Abgeleitete Merkmale Folie 48
22 Grundlegende Bezeichnungen Datenbestand / Database / Datenbasis Zur Verfügung stehendes Datenmaterial Unterscheidung zwischen Training, Test, Validierung Bei Modellbildung: Historische Daten Beobachtung Zeile, Tupel einer Tabelle Daten zu einer Einheit / einem Vorgang / einem Individuum / einem Vertrag... Folie 49
23 Grundlegende Bezeichnungen Attribut / Feld / Variable Spalten in einer Tabelle Merkmal oder Eigenschaft Wert / Ausprägung Realisierung eines Feldes für eine bestimmte Beobachtung Folie 50
24 Variablenarten (Analysesicht) Zielvariable Abhängige Variable Zu erklärende Variable Für neue Beobachtungen unbekannt Einflussvariable Erklärungspotential Immer bekannt ID-Variable Indikator für Transaktionsgruppe Folie 51
25 Beispiel Variablenarten Name PLZ Geschlecht Familienstand Alter Anz_Konten Beruf Storno Meier G Müller m Schulze m Berger w Jansen 6656 w Müller m Becker 6718 m Knorr m Einflussvariablen Zielvariable Folie 52
26 Data Transformation - Datenformat DTZeit KZeit Monat Jahr FTMain DTModell KModell Modell KModellgruppe Modellgruppe KMotor Motor Relationales Datenmodell (DWH) DTVerkäufer KVerkäufer Name KNiederlassung Niederlassung KLand Land KZeit KVerkäufer KModell KModellvariante KModellfarbe KKundentyp KVertragstyp DTModellvaria nte KModellvariante Modellvariante DTKundentyp KKundentyp Kundentyp Ist-Umsatz Ist-Absatzmenge DTVertragstyp KVertragstyp Vertragstyp DTModellfarbe KModellfarbe Modellfarbe Flache Tabelle (DM) Quelle: Hahne, a.a.o. Transformation Zielvariable Attribut1 Attribut2... Z1 Ausprägung11 Ausprägung12 Z2 Ausprägung21 Ausprägung22 Z3 Ausprägung31... Folie 53
27 Data Transformation - Datenanreicherung Externe Daten auf höherer Aggregationsebene Marktforschung Kundendaten Artikelumsatz pro Alter Jahr m Geschlecht w Name Alter Geschlecht Geo-Typ... Online-Käufe pro Jahr Geo-Typ Villen- Stadt Vorort Dorf m Geschlecht w Artikelumsatz Online- Käufe Meier 35 m Villen-Vorort Müller 48 w Stadt 20 3 Schulze 53 w Dorf Folie 54
28 Data Transformation - Datenreduktion Zeilen: Stichprobe Aggregation Aggregation auf Transaktionsebene, Kundenebene, Marktsegmentebene,... Vergröberung des Zeitrasters bei Längsschnittstudien Spalten: Dimensionsreduktion Folie 55
29 Data Transformation - Stichproben Zufallsstichprobe Repräsentativität Gesamtzahl der Datensätze Besetzungsdichte der wichtigen Merkmale Geschichtete Stichprobe (z. B Schlechtzahler und 5000 Gutzahler) Sensibilität des Data Mining Verfahrens Trainingsstichprobe, Validierungsstichprobe Folie 56
30 Data Transformation - Aggregation Zusammenfassung mehrerer Datensätze niedriger Aggregationsebenen zu einem Datensatz auf höherer Aggregationsebene Z.B. Zusammenfassung verschiedener Käufe auf Kundenebene oder verschiedener Transaktionen auf Kontoebene Aggregationsfunktionen Summierung (Umsatzsumme, Kaufanzahl) Mittelwertbildung (mittlerer Umsatz pro Monat) Folie 57
31 Data Transformation - Informationsverlust Informationsverlust Informationsdichte ID Name Produkt Umsatz 1 Müller Hemd 60 2 Müller Hose 80 3 Müller Hemd 70 Name Käufe Hemden Hosen Umsatzsumme Standardabweichung Müller Folie 58
32 Data Transformation - Dimensionsreduktion Hoch korrelierte Merkmale redundante Information Reduzierung der Merkmalsanzahl Merkmalsteilmenge mit gleicher Beschreibungs-, Erklärungs- und Prognosefähigkeit Ausschluss offensichtlich überflüssiger Merkmale Folie 59
33 Data Transformation - Skalentransformation Überführung auf ein niedrigeres Skalenniveau Informationsverlust Klassenbildung (Cluster) Erfüllung von Modellvoraussetzungen Verringerung der Modellkomplexität Folie 60
34 Data Transformation - Skalentransformation 1. Nominalskala Niedrigstes Skalenniveau Keine Rangfolge Keine Vergleichbarkeit Bsp.: Farbe, Beruf 2. Ordinalskala Werte unterscheiden sich in Intensität Werte lassen sich ordnen Rangfolge Keine Interpretation der Abstände zwischen Merkmalsausprägungen möglich Bsp.: gut mittel schlecht, Zensuren Folie 61
35 Data Transformation - Skalentransformation 3. Metrische Skala Höchstes Skalenniveau Reihenfolge der Ausprägungen Interpretierbarkeit der Abstände Bsp.: Gewicht, Größe, Lebensdauer Folie 62
36 Data Transformation - Normierung Abbildung durch mathematische Funktion Logarithmus, Exponentialfunktion, Wurzel Merkmal mit bestimmten Lage- und Streuungsmaßen Standardnormalverteilung Wertebereich [0,1] Komplexitätsreduktion Erfüllung von Modellvoraussetzungen Folie 63
37 Data Transformation -Abgeleitete Merkmale Abbildung bestehender Merkmale auf ein neues Merkmal Beispiele: Marktanteil = Absatz / Marktvolumen Pro-Kopf-Umsatz = Umsatz / Kundenzahl Share of Voice = Werbeausgaben / Wettbewerbswerbeausgaben Expertenwissen, Abbildung nichttrivialer Wirkungsrelationen Folie 64
38 CRISP-DM Data Modeling Anwendung der Data Mining-Verfahren Anwendung verschiedener Data Mining-Verfahren auf Grundlage einer abgestimmten Modellbildung Anwendungsbereiche: Kategorisierung bzw. Segmentierung Klassifikation Assoziation (Prognose) Folie 65
39 CRISP-DM Evaluation Bewertung und Interpretation Bewertung der Data Mining-Ergebnisse Interessantheit Gültigkeit Neuartigkeit Nützlichkeit Verständlichkeit Interpretation hinsichtlich der Aufgabenstellung bzw. des Projektziels Bewertung des gesamten Data Mining-Prozesses Aufdeckung von Schwachstellen Folie 66 Erarbeitung von Verbesserungsmöglichkeiten
40 CRISP-DM Deployment Anwendung der Ergebnisse Bestimmung der Art und Weise zur Nutzung der erzielten Ergebnisse in der Unternehmung Einmalige oder dauerhafte Verwendung der Ergebnisse Entscheidung für konkrete Maßnahmen Folie 67
Entscheidungsunterstützungssysteme
Vorlesung WS 2013/2014 Christian Schieder Professur Wirtschaftsinformatik II cschie@tu-chemnitz.eu Data Mining Wiederholung Begriffsverständnis Prozessorientiertes Verständnis von Data Mining: entspricht
MehrData Mining (Entscheidungsunterstützungssysteme)
Vorlesung (Entscheidungsunterstützungssysteme) WS 2014/2015 Prof. Dr. Peter Gluchowski Professur Wirtschaftsinformatik II Dr. Christian Schieder Professur Wirtschaftsinformatik II Übersicht 1. Einführung
MehrSeminar Business Intelligence Teil II. Data Mining & Knowledge Discovery
Seminar Business Intelligence Teil II Data Mining & Knowledge Discovery Was ist Data Mining? Sabine Queckbörner Was ist Data Mining? Data Mining Was ist Data Mining? Nach welchen Mustern wird gesucht?
MehrData/Information Quality Management
Data/Information Quality Management Seminar WI/Informationsmanagement im Sommersemester 2002 Markus Berberov, Roman Eder, Peter Gerstbach 11.6.2002 Inhalt! Daten und Datenqualität! Einführung und Definition!
MehrGrundlagen der Datenanalyse am Beispiel von SPSS
Grundlagen der Datenanalyse am Beispiel von SPSS Einführung Dipl. - Psych. Fabian Hölzenbein hoelzenbein@psychologie.uni-freiburg.de Einführung Organisatorisches Was ist Empirie? Was ist Statistik? Dateneingabe
MehrTiefgreifende Prozessverbesserung und Wissensmanagement durch Data Mining
Tiefgreifende Prozessverbesserung und Wissensmanagement durch Data Mining Ausgangssituation Kaizen Data Mining ISO 9001 Wenn andere Methoden an ihre Grenzen stoßen Es gibt unzählige Methoden, die Abläufe
MehrDISKUSSIONSBEITRÄGE DER FAKULTÄT FÜR BETRIEBSWIRTSCHAFTSLEHRE MERCATOR SCHOOL OF MANAGEMENT UNIVERSITÄT DUISBURG-ESSEN. Nr. 374
DISKUSSIONSBEITRÄGE DER FAKULTÄT FÜR BETRIEBSWIRTSCHAFTSLEHRE MERCATOR SCHOOL OF MANAGEMENT UNIVERSITÄT DUISBURG-ESSEN Nr. 374 Eignung von Verfahren der Mustererkennung im Process Mining Sabrina Kohne
MehrData Mining (ehem. Entscheidungsunterstützungssysteme)
Data Mining (ehem. Entscheidungsunterstützungssysteme) Melanie Pfoh Anja Tetzner Christian Schieder Übung WS 2014/15 AGENDA TEIL 1 Aufgabe 1 (Wiederholung OPAL / Vorlesungsinhalte) ENTSCHEIDUNG UND ENTSCHEIDUNGSTHEORIE
MehrIhr Logo. Willkommen zur Schulung. Kundenorientierung. 2014 WEKA MEDIA GmbH & Co. KG. Folie 0/01
Willkommen zur Schulung Kundenorientierung 0/01 Einführung Was ist Kundenorientierung? Kundenorientierung ist die umfassende, kontinuierliche Ermittlung und Analyse der Kundenerwartungen sowie deren interne
MehrBegriffsbestimmung CRISP-DM-Modell Betriebswirtschaftliche Einsatzgebiete des Data Mining Web Mining und Text Mining
Gliederung 1. Einführung 2. Grundlagen Data Mining Begriffsbestimmung CRISP-DM-Modell Betriebswirtschaftliche Einsatzgebiete des Data Mining Web Mining und Text Mining 3. Ausgewählte Methoden des Data
Mehr26. GIL Jahrestagung
GeorgAugustUniversität Göttingen 26. GIL Jahrestagung Einsatz von künstlichen Neuronalen Netzen im Informationsmanagement der Land und Ernährungswirtschaft: Ein empirischer Methodenvergleich Holger Schulze,
MehrData Mining-Projekte
Data Mining-Projekte Data Mining-Projekte Data Mining stellt normalerweise kein ei nmaliges Projekt dar, welches Erkenntnisse liefert, die dann nur einmal verwendet werden, sondern es soll gewöhnlich ein
MehrDatenqualität erfolgreich steuern
Edition TDWI Datenqualität erfolgreich steuern Praxislösungen für Business-Intelligence-Projekte von Detlef Apel, Wolfgang Behme, Rüdiger Eberlein, Christian Merighi 3., überarbeitete und erweiterte Auflage
MehrEntscheidungsunterstützungssysteme
Vorlesung WS 2013/2014 Christian Schieder Professur Wirtschaftsinformatik II cschie@tu-chemnitz.eu Literatur zur Vorlesung Gluchowski, P.; Gabriel, R.; Dittmar, C.: Management Support Systeme und Business
MehrAuswerten mit Excel. Viele Video-Tutorials auf Youtube z.b. http://www.youtube.com/watch?v=vuuky6xxjro
Auswerten mit Excel Viele Video-Tutorials auf Youtube z.b. http://www.youtube.com/watch?v=vuuky6xxjro 1. Pivot-Tabellen erstellen: In der Datenmaske in eine beliebige Zelle klicken Registerkarte Einfügen
MehrDatenmanagement. Simone Unfried, Passau Vitaly Aleev, Passau Claus Schönleber, Passau. Strategisches Informationsmanagement 1 (01/2006)
Simone Unfried, Passau Vitaly Aleev, Passau Claus Schönleber, Passau (01/2006) Strategisches Informationsmanagement 1 Definition Notwendige Vermaischung der Daten in der Vorstufe zur Destillation von hochprozentiger
MehrData Mining und maschinelles Lernen
Data Mining und maschinelles Lernen Einführung und Anwendung mit WEKA Caren Brinckmann 16. August 2000 http://www.coli.uni-sb.de/~cabr/vortraege/ml.pdf http://www.cs.waikato.ac.nz/ml/weka/ Inhalt Einführung:
Mehrerfolgreich steuern Datenqualität rä dpunkt.verlag Ldwi Praxislösungen für Business-Intelligence-Projekte Rüdiger Eberlein Edition TDWI
Detlef Apel Wolfgang Behme Rüdiger Eberlein Christian Merighi Datenqualität erfolgreich steuern Praxislösungen für Business-Intelligence-Projekte 3., überarbeitete und erweiterte Auflage Edition TDWI rä
MehrBewerbung für den Supplier Innovation Award der Deutschen Bahn AG
Bewerbung für den Supplier Innovation Award der Deutschen Bahn AG Fraunhofer-Institut für System- und Innovationsforschung ISI DB Supplier Innovation Award Breslauer Straße 48 76139 Karlsruhe Bewerbungsschluss
MehrBachelorabschlussseminar Dipl.-Kfm. Daniel Cracau
1 Einführung in die statistische Datenanalyse Bachelorabschlussseminar Dipl.-Kfm. Daniel Cracau 2 Gliederung 1.Grundlagen 2.Nicht-parametrische Tests a. Mann-Whitney-Wilcoxon-U Test b. Wilcoxon-Signed-Rank
MehrSchulungspaket QM. Prozesse optimieren Methoden einführen Kundenzufriedenheit erhöhen. Bearbeitet von Anja Kranefeld
Schulungspaket QM Prozesse optimieren Methoden einführen Kundenzufriedenheit erhöhen Bearbeitet von Anja Kranefeld 1. Auflage Onlineprodukt. ISBN 978 3 8111 2970 2 Wirtschaft > Management > Qualitätsmanagement
MehrData Mining Standards am Beispiel von PMML. Data Mining Standards am Beispiel von PMML
Data Mining Standards am Beispiel von PMML Allgemeine Definitionen im Data Mining Data Mining (DM) Ein Prozess, um interessante neue Muster, Korrelationen und Trends in großen Datenbeständen zu entdecken,
MehrBig Data, Amtliche Statistik und der Datenschutz
Konferenz für Sozial- und Wirtschaftsdaten 20./21. Februar 2014, Berlin Gute Forschung braucht gute Daten aber bitte anonymisiert! Big Data, Amtliche Statistik und der Datenschutz Peter Schaar Europäische
MehrSeminar C16 - Datenmodellierung für SAP BW
C16: Datenmodellierung für SAP BW Ein Seminar der DWH academy Seminar C16 - Datenmodellierung für SAP BW Dieses Seminar soll einen umfassenden Einblick in die Datenmodellierung beim Einsatz von SAP BW
MehrAllgemeines zu Datenbanken
Allgemeines zu Datenbanken Was ist eine Datenbank? Datensatz Zusammenfassung von Datenelementen mit fester Struktur Z.B.: Kunde Alois Müller, Hegenheimerstr. 28, Basel Datenbank Sammlung von strukturierten,
MehrStichprobenauslegung. für stetige und binäre Datentypen
Stichprobenauslegung für stetige und binäre Datentypen Roadmap zu Stichproben Hypothese über das interessierende Merkmal aufstellen Stichprobe entnehmen Beobachtete Messwerte abbilden Schluss von der Beobachtung
MehrData Quality Management: Abgleich großer, redundanter Datenmengen
Data Quality Management: Abgleich großer, redundanter Datenmengen Westendstr. 14 809 München Tel 089-5100 907 Fax 089-5100 9087 E-Mail Datras@Datras.de Redundanz und relationales Datenbankmodell Redundanz:
MehrWege zur Service Orientierten Organisation. Prof. Dr. Eberhard Schott e-mail: eberhard.schott @ fh-aschaffenburg.de
Vortrag Prof. Dr. Eberhard Schott e-mail: eberhard.schott @ fh-aschaffenburg.de 1. Anforderungen an eine Service Orientierte -Organisation Eine -Organisation sollte den Mentalitätswandel zum Dienstleistungsanbieter
MehrWas ist Data Mining... in der Fundraising Praxis?
Was ist Data Mining...... in der Fundraising Praxis? Erkennen von unbekannten Mustern in sehr grossen Datenbanken (> 1000 GB) wenige und leistungsfähige Verfahren Automatisierung Erkennen von unbekannten
MehrFührungsgespräch Fordern, Fördern, Entwickeln
Angaben zur Person Name, Vorname: Karin Musterfrau Funktion: Leiterin Abrechnung Betrachtungszeitraum: Ergebnis 2007; Vereinbarung: Febr Dezember 2008 Datum: 15.1.08, korrigiert am 30.7.08 Datum des letzten
MehrData Mining Anwendungen und Techniken
Data Mining Anwendungen und Techniken Knut Hinkelmann DFKI GmbH Entdecken von Wissen in banken Wissen Unternehmen sammeln ungeheure mengen enthalten wettbewerbsrelevantes Wissen Ziel: Entdecken dieses
Mehr7. Übung - Datenbanken
7. Übung - Datenbanken Informatik I für Verkehrsingenieure Aufgaben inkl. Beispiellösungen 1. Aufgabe: DBS a Was ist die Kernaufgabe von Datenbanksystemen? b Beschreiben Sie kurz die Abstraktionsebenen
MehrGIS 1 Kapitel 5: Bedeutung von Metadaten und Qualität t von Daten
GIS 1 Kapitel 5: und Qualität t von Daten Stephan Mäs Prof. Dr.-Ing. Wolfgang Reinhardt Arbeitsgemeinschaft GIS Universität der Bundeswehr München Wolfgang.Reinhardt@unibw.de www.agis.unibw.de - Definition
MehrAuswahl alter Klausuraufgaben aus einer ähnlichen Vorlesung Maßgeblich für die Prüfung sind die Vorlesungsinhalte!
Auswahl alter Klausuraufgaben aus einer ähnlichen Vorlesung Maßgeblich für die Prüfung sind die Vorlesungsinhalte! Aufgabe 1: Grundlagen (5 Punkte) a) Definieren Sie kurz Usability und User Experience.
Mehr2.1 An welchen Weiterbildungsmaßnahmen haben Sie bisher teilgenommen? Beurteilen Sie bitte rückblickend deren Relevanz für Ihr Tätigkeitsfeld?
E X P E R T E N I N T E R V I E W 1. Allgemeine Daten und Berufsbiografie Name: Vorname: Gruppe/Abteilung: weiblich männlich Geburtsdatum: Eintrittsdatum: Aktuelle Berufs-/Tätigkeitsbezeichnung: 1.1 Welchen
MehrData Mining als Arbeitsprozess
Data Mining als Arbeitsprozess Hagen Knaf Studiengang Angewandte Mathematik Hochschule RheinMain 31. Dezember 2015 In Unternehmen werden umfangreichere Aktivitäten oder Projekte im Bereich des Data Mining
MehrWeb Information Retrieval. Zwischendiskussion. Überblick. Meta-Suchmaschinen und Fusion (auch Rank Aggregation) Fusion
Web Information Retrieval Hauptseminar Sommersemester 2003 Thomas Mandl Überblick Mehrsprachigkeit Multimedialität Heterogenität Qualität, semantisch, technisch Struktur Links HTML Struktur Technologische
Mehr14 PRÜFUNGSINHALTE MARKETINGFACH- LEUTE
14 PRÜFUNGSINHALTE MARKETINGFACH- LEUTE Marktforschung (Prüfungszeit: 1.5 Stunden schriftlich) ALLGEMEIN Sinnvolle Selektionskriterien für die Wahl eines geeigneten Marktforschungsinstitutsumschreiben
MehrData Mining-Modelle und -Algorithmen
Data Mining-Modelle und -Algorithmen Data Mining-Modelle und -Algorithmen Data Mining ist ein Prozess, bei dem mehrere Komponenten i n- teragieren. Sie greifen auf Datenquellen, um diese zum Training,
MehrEducase. Release Notes 1.7: Neue Funktionen und Verbesserungen. Base-Net Informatik AG Wassergrabe 14 CH-6210 Sursee
Educase Release Notes 1.7: Neue Funktionen und Verbesserungen Version: 1.0 Datum: 01.12.2015 08:34 Ersteller: Andreas Renggli Status: Abgeschlossen Base-Net Informatik AG Wassergrabe 14 CH-6210 Sursee
MehrC09: Einsatz SAP BW im Vergleich zur Best-of-Breed-Produktauswahl
C09: Einsatz SAP BW im Vergleich zur Best-of-Breed-Produktauswahl Ein Seminar der DWH academy Seminar C09 Einsatz SAP BW im Vergleich zur Best-of-Breed- Produktauswahl Befasst man sich im DWH mit der Auswahl
MehrAnalyse der Qualität von Klinikinformationen (online / print) im Hinblick auf eine zielgruppengerechte Außendarstellung
HTW Analyse der Qualität von Klinikinformationen (online / print) im Hinblick auf eine zielgruppengerechte Außendarstellung Anna Gädicke Wissenschaftliche Begleitung: Prof. Dr. Thomas Altenhöner (HTW)
Mehr1. Einfuhrung zur Statistik
Philipps-Universitat Marburg Was ist Statistik? Statistik = Wissenschaft vom Umgang mit Daten Phasen einer statistischen Studie 1 Studiendesign Welche Daten sollen erhoben werden? Wie sollen diese erhoben
MehrCheckliste zur qualitativen Nutzenbewertung
Checkliste zur qualitativen Nutzenbewertung Herausgeber Pentadoc Consulting AG Messeturm Friedrich-Ebert-Anlage 49 60308 Frankfurt am Main Tel +49 (0)69 509 56-54 07 Fax +49 (0)69 509 56-55 73 E-Mail info@pentadoc.com
MehrW.WIINM32.11 (Datawarehousing) W.WIMAT03.13 (Statistik)
Modulbeschrieb Business Intelligence and Analytics 16.10.2013 Seite 1/5 Modulcode Leitidee Art der Ausbildung Studiengang Modultyp W.WIINM42.13 Information ist eine derart wichtige Komponente bei der Entscheidungsfindung,
MehrTNS EX A MINE GeoCheck Evaluation und Selektion mikrogeographischer Daten für Marketing und Vertrieb. TNS Infratest Applied Marketing Science
TNS EX A MINE GeoCheck Evaluation und Selektion mikrogeographischer Daten für Marketing und Vertrieb 1 TNS EX A MINE GeoCheck Warum GeoCheck für Sie interessant ist Mikrogeographische Informationen werden
MehrAnalytisches CRM. Workshop Data Mining im Datenbasierten Marketing. Michael Lamprecht und Jan Frick, Altran GmbH & Co. KG 26.06.
Analytisches CRM Workshop Data Mining im Datenbasierten Marketing Michael Lamprecht und Jan Frick, Altran GmbH & Co. KG 26.06.2015 Data Mining bietet Antworten auf zahlreiche analytische Fragestellungen
MehrJan Ehmke Doktorandenworkshop 2008 St. Andreasberg, 10.03.2008
Ermittlung dynamischer Fahrzeiten für die City-Logistik Jan Ehmke Doktorandenworkshop 2008 St. Andreasberg, 10.03.2008 Inhalt Einführung Planung in der City-Logistik Erhebung dynamischer Fahrzeiten Konzeption
MehrAnforderungen an die HIS
Anforderungen an die HIS Zusammengefasst aus den auf IBM Software basierenden Identity Management Projekten in NRW Michael Uebel uebel@de.ibm.com Anforderung 1 IBM Software Group / Tivoli Ein Feld zum
Mehr2. Deskriptive Statistik 2.1. Häufigkeitstabellen, Histogramme, empirische Verteilungsfunktionen
4. Datenanalyse und Modellbildung Deskriptive Statistik 2-1 2. Deskriptive Statistik 2.1. Häufigkeitstabellen, Histogramme, empirische Verteilungsfunktionen Für die Auswertung einer Messreihe, die in Form
Mehr6. Oracle DWH Community Mainz 2011. Koexistenz SAP BW und mit unternehmensweitem zentralen DWH
6. Oracle DWH Community Mainz 2011 Koexistenz SAP BW und mit unternehmensweitem zentralen DWH 2 6. Oracle DWH Community Mainz 2011 Agenda Vorstellung Globus Historische Entwicklung des DWH-Systems Globus
MehrManagement Support Systeme
Management Support Systeme WS 24-25 4.-6. Uhr PD Dr. Peter Gluchowski Folie Gliederung MSS WS 4/5. Einführung Management Support Systeme: Informationssysteme zur Unterstützung betrieblicher Fach- und Führungskräfte
MehrUntersuchungsdesign: 23.11.05
Untersuchungsdesign: 23.11.05 Seite 1! Ablauf Untersuchungsdesign! Beispiel! Kleine Übung! Diskussion zur Vorbereitung von Übung 2 Während Sie das Untersuchungsdesign festlegen, planen und bestimmen Sie:
MehrDas moderne Redaktionshandbuch als Rückgrat technischer Dokumentation
als Rückgrat technischer Dokumentation Gertraud Fischer cognitas. Gesellschaft für Technik-Dokumentation mbh 85521 Ottobrunn, Alte Landstr. 6 33106 Paderborn, Heinz-Nixdorf-Ring 1 www.cognitas.de gertraud.fischer@cognitas.de
MehrAufgaben zum Datenmanagement
Aufgaben zum Datenmanagement Johannes Hain Lehrstuhl für Mathematik VIII Statistik 1/10 Datentransformationen Berechnung neuer Variablen Berechne das Durchschnittsalter und die Durchschnittsgröße beider
MehrTNS EX A MINE DataFusion Die Brücke zur gemeinsamen Betrachtung von Daten aus unterschiedlichen Datenquellen. TNS Infratest Applied Marketing Science
TNS EX A MINE DataFusion Die Brücke zur gemeinsamen Betrachtung von Daten aus unterschiedlichen Datenquellen 1 Umfassendes Kundenverständnis Existieren in Ihrem Unternehmen verschiedene Befragungsdaten?
MehrImportdatei EGID/EDID mit Excel erstellen und bearbeiten
Importdatei EGID/EDID mit Excel erstellen und bearbeiten Benutzerhandbuch Datum: 26.03.2015 Version: 1.1 Bearbeiter/in: Christoph Rüfenacht Status: In Arbeit Freigegeben Klassifikation: öffentlich Verteiler:
MehrÜbung Datenbanksysteme
Übung Datenbanksysteme Martin Reifberger Übungsaufgabe 1 Sachverhalt: Ein mittelständiges Industrieunternehmen möchte sein Auftragswesen datenbankbasiert organisieren, da die tägliche Flut auflaufender
MehrUniversität Passau. Betriebswirtschaftslehre mit Schwerpunkt Internationales Management Prof. Dr. Carola Jungwirth. Bachelorarbeit Netzwerkservices
Universität Passau Betriebswirtschaftslehre mit Schwerpunkt Internationales Management Prof. Dr. Carola Jungwirth Bachelorarbeit Netzwerkservices Betreuer: Robert Richter Eingereicht von: Alexander Gehm
MehrTÜV Service tested Prüfgrundlagen
TÜV Service tested Prüfgrundlagen 60 Grundsätzliche Prüfgrundlagen Für die Auszeichnung TÜV Service tested müssen drei Voraussetzungen erfüllt sein: 1. Die Gesamtzufriedenheit muss von den Kunden des Unternehmens
MehrTypisierung des Replikationsplan Wirries, Denis Datenbankspezialist
Typisierung des Replikationsplan Wirries, Denis Datenbankspezialist Feintypisierung - Überblick Ergebnisse Ergebnisse aus aus anderen anderen Arbeitsergebnissen Arbeitsergebnissen Replikationsplan Replikationsplan
MehrTender Manager. Sparen Sie Zeit und Kosten durch eine optimierte Erstellung Ihrer individuellen IT-Ausschreibungen
Tender Manager Sparen Sie Zeit und Kosten durch eine optimierte Erstellung Ihrer individuellen IT-Ausschreibungen Tender Manager Der plixos Tender Manager reduziert drastisch den Aufwand bei der Durchführung
MehrFlorian Frötscher und Demet Özçetin
Statistische Tests in der Mehrsprachigkeitsforschung Aufgaben, Anforderungen, Probleme. Florian Frötscher und Demet Özçetin florian.froetscher@uni-hamburg.de SFB 538 Mehrsprachigkeit Max-Brauer-Allee 60
MehrDominik Pretzsch TU Chemnitz 2011
Dominik Pretzsch TU Chemnitz 2011 Wir leben im Informationszeitalter und merken es daran, dass wir uns vor Information nicht mehr retten können. Nicht der überwältigende Nutzen der Information, sondern
MehrUmsetzung der Anforderungen - analytisch
Umsetzung der Anforderungen - analytisch Titel des Lernmoduls: Umsetzung der Anforderungen - analytisch Themengebiet: New Economy Gliederungspunkt im Curriculum: 4.2.5.5 Zum Inhalt: In diesem Modul wird
MehrSkalenniveau Grundlegende Konzepte
Skalenniveau Grundlegende Konzepte M E R K M A L / V A R I A B L E, M E R K M A L S A U S P R Ä G U N G / W E R T, C O D I E R U N G, D A T E N - M A T R I X, Q U A N T I T A T I V E S M E R K M A L, Q
Mehr1 PIVOT TABELLEN. 1.1 Das Ziel: Basisdaten strukturiert darzustellen. 1.2 Wozu können Sie eine Pivot-Tabelle einsetzen?
Pivot Tabellen PIVOT TABELLEN. Das Ziel: Basisdaten strukturiert darzustellen Jeden Tag erhalten wir umfangreiche Informationen. Aber trotzdem haben wir oft das Gefühl, Entscheidungen noch nicht treffen
MehrDatenprüfung. Analyse von Datenbeständen
Datenprüfung Analyse von Datenbeständen Datenprüfungen Die Daten eines Unternehmens sind ein wichtiges Fundament für eine erfolgreiche Geschäftstätigkeit. Aus ihnen lassen sich risikorelevante Faktoren
MehrLösungsvorschlag zur Klausur zu Projektorganisation und Management in der Software-Entwicklung
Prof. Dr. Dr. h.c. M. Broy Klausurlösung Dr. H. Ehler, S. Wagner 2. Juli 2004 Lösungsvorschlag zur Klausur zu Projektorganisation und Management in der Software-Entwicklung Aufgabe 1 Prozessmodelle (4
MehrTeil I: Deskriptive Statistik
Teil I: Deskriptive Statistik 2 Grundbegriffe 2.1 Merkmal und Stichprobe 2.2 Skalenniveau von Merkmalen 2.3 Geordnete Stichproben und Ränge 2.1 Merkmal und Stichprobe An (geeignet ausgewählten) Untersuchungseinheiten
MehrFallbeispiel. Auswahl und Evaluierung eines Software- Lokalisierungstools. Tekom Herbsttagung 2004 Angelika Zerfaß
Fallbeispiel Auswahl und Evaluierung eines Software- Lokalisierungstools Tekom Herbsttagung 2004 Angelika Zerfaß Beratung und Training für Translation Tools Projekt: Software-Lokalisierungstool Die Firma
MehrKompetenz von IT-Experten in internetbasierten Gründungsunternehmen
Matthias Hasel Kompetenz von IT-Experten in internetbasierten Gründungsunternehmen Eine conjointanalytische Untersuchung von Präferenzen und Wertwahrnehmung Mit einem Geleitwort von Prof. Dr. Tobias Kollmann
MehrÜbung 6: Datenbanken und Informationsmanagement
Übung zur Veranstaltung Wirtschaftsinformatik (PWIN) SS 2009 Übung 6: Datenbanken und Informationsmanagement Das InstantONS Szenario wird zur Lösung einiger Aufgabenstellungen dieser Übung benötigt. Es
MehrHandbuch ECDL 2003 Basic Modul 5: Datenbank Grundlagen von relationalen Datenbanken
Handbuch ECDL 2003 Basic Modul 5: Datenbank Grundlagen von relationalen Datenbanken Dateiname: ecdl5_01_00_documentation_standard.doc Speicherdatum: 14.02.2005 ECDL 2003 Basic Modul 5 Datenbank - Grundlagen
MehrDatenbanken: Relationales Datenbankmodell RDM
Das RDM wurde in den 70'er Jahren von Codd entwickelt und ist seit Mitte der 80'er Jahre definierter Standard für Datenbanksysteme! Der Name kommt vom mathematischen Konzept einer Relation: (Sind A, B
Mehr9 Resümee. Resümee 216
Resümee 216 9 Resümee In der vorliegenden Arbeit werden verschiedene Methoden der Datenreduktion auf ihre Leistungsfähigkeit im sozialwissenschaftlichstatistischen Umfeld anhand eines konkreten Anwendungsfalls
Mehrpro4controlling - Whitepaper [DEU] Whitepaper zur CfMD-Lösung pro4controlling Seite 1 von 9
Whitepaper zur CfMD-Lösung pro4controlling Seite 1 von 9 1 Allgemeine Beschreibung "Was war geplant, wo stehen Sie jetzt und wie könnte es noch werden?" Das sind die typischen Fragen, mit denen viele Unternehmer
MehrAbamsoft Finos im Zusammenspiel mit shop to date von DATA BECKER
Abamsoft Finos im Zusammenspiel mit shop to date von DATA BECKER Abamsoft Finos in Verbindung mit der Webshopanbindung wurde speziell auf die Shop-Software shop to date von DATA BECKER abgestimmt. Mit
Mehrwww.odgersberndtson.de HUMAN ASSET REVIEW
www.odgersberndtson.de HUMAN ASSET REVIEW DAS STRATEGISCHE WERKZEUG HUMAN ASSET REVIEW Erfolgreiche Strategen schauen durch das Fernglas und das Mikroskop sie erkennen Trends und gleichzeitig analysieren
MehrProjektsteuerung Projekte effizient steuern. Welche Steuerungsinstrumente werden eingesetzt?
1.0 Projektmanagement Mitarbeiter, die Projekte leiten oder zukünftig übernehmen sollen Vermittlung von Grundwissen zur erfolgreichen Durchführung von Projekten. Die Teilnehmer erarbeiten anhand ihrer
MehrKommunales Bildungsmonitoring Bereitstellung regionalisierter Bildungsdaten am Beispiel der Landesdatenbank NRW
Kommunales Bildungsmonitoring Bereitstellung regionalisierter Bildungsdaten am Beispiel der Landesdatenbank NRW Bettina Lander, IT.NRW 1 Überblick Projekt Kommunales Bildungsmonitoring - Hintergrund Daten,
MehrInformationssicherheit als Outsourcing Kandidat
Informationssicherheit als Outsourcing Kandidat aus Kundenprojekten Frankfurt 16.06.2015 Thomas Freund Senior Security Consultant / ISO 27001 Lead Auditor Agenda Informationssicherheit Outsourcing Kandidat
MehrRealisierung der Anbindung an den Handelsplatz Koeln.de Leitfaden zur Projektplanung bei Lieferanten
Handelsplatz Köln.de Leitfaden zur Projektplanung bei en Realisierung der Anbindung an den Handelsplatz Koeln.de Leitfaden zur Projektplanung bei en Autor: Christoph Winkelhage Status: Version 1.0 Datum:
Mehr90-minütige Klausur Statistik für Studierende der Kommunikationswissenschaft
Prof. Dr. Helmut Küchenhoff SS08 90-minütige Klausur Statistik für Studierende der Kommunikationswissenschaft am 22.7.2008 Anmerkungen Überprüfen Sie bitte sofort, ob Ihre Angabe vollständig ist. Sie sollte
MehrSWE5 Übungen zu Software-Engineering
1 Übungen zu Software-Engineering 1) Klassen und Objekte 2) Telefonanlage 3) Objekt- und Klassendiagramme 4) Assoziationen 5) Telefonanlage (Erweiterung) 6) Fahrzeuge 7) Familien 2 Aufgabe 1: Klassen und
MehrIV. Datenbankmanagement
Wirtschaftsinformatik 2 (PWIN) IV. Datenbankmanagement Kapitel 2: Datenmanipulationssprache SQL Wirtschaftsinformatik 2 (PWIN) SS 2009, Professur für Mobile Business & Multilateral Security 1 Agenda 1.
MehrSnippets - das Erstellen von "Code- Fragmenten" - 1
Snippets - das Erstellen von "Code- Fragmenten" Das Erstellen von "Code- Fragmenten", welche mit dem TinyMCE ausgewählt werden können. Grundlegendes: Die Datei, welche die in Folge erklärten Daten und
MehrEnergieaudit oder Energiemanagementsystem? Eine Entscheidungshilfe
Energieaudit oder Energiemanagementsystem? Eine Entscheidungshilfe Juni Die Bewertung hängt von der unternehmensspezifischen Energiesituation des Unternehmens und seiner Ziele ab. Bewertung der Alternativen
MehrDatenaufbereitung in SPSS. Daten zusammenfügen
Daten zusammenfügen I. Fälle hinzufügen Diese Schritte müssen Sie unternehmen, wenn die Daten in unterschiedlichen Dateien sind; wenn also die Daten von unterschiedlichen Personen in unterschiedlichen
MehrGrundlagen der Inferenzstatistik
Grundlagen der Inferenzstatistik (Induktive Statistik oder schließende Statistik) Dr. Winfried Zinn 1 Deskriptive Statistik versus Inferenzstatistik Die Deskriptive Statistik stellt Kenngrößen zur Verfügung,
MehrProseminar: Website-Managment-System. NetObjects Fusion. von Christoph Feller
Proseminar: Website-Managment-System NetObjects Fusion von Christoph Feller Netobjects Fusion - Übersicht Übersicht Einleitung Die Komponenten Übersicht über die Komponenten Beschreibung der einzelnen
MehrManagementbewertung Managementbewertung
Managementbewertung Grundlagen für die Erarbeitung eines Verfahrens nach DIN EN ISO 9001:2000 Inhalte des Workshops 1. Die Anforderungen der ISO 9001:2000 und ihre Interpretation 2. Die Umsetzung der Normanforderungen
MehrMarktforschung. Marketing für den KMU / J. Schoch
Marktforschung 9. Unterrichtsblock Marketing für den KMU Die Marktforschung hat zum Ziel, Informationen sei es auf dem Feld oder mit Statistiken zu gewinnen, um Trends, Möglichkeiten, Alternativen, Sinn
MehrLeseprobe. Tobias Müller-Prothmann, Nora Dörr. Innovationsmanagement. Strategien, Methoden und Werkzeuge für systematische Innovationsprozesse
Leseprobe Tobias Müller-Prothmann, Nora Dörr Innovationsmanagement Strategien, Methoden und Werkzeuge für systematische Innovationsprozesse ISBN: 978-3-446-41799-1 Weitere Informationen oder Bestellungen
MehrWir beraten Sie. Wir unterstützen Sie. Wir schaffen Lösungen. Wir bringen Qualität. Wir beraten Sie. Wir unterstützen Sie. Wir schaffen Lösungen
Was bedeutet es, ein Redaktionssystem einzuführen? Vorgehensmodell für die Einführung eines Redaktionssystems Die Bedeutung Fast alle Arbeitsabläufe in der Abteilung werden sich verändern Die inhaltliche
MehrLogische Modelle für OLAP. Burkhard Schäfer
Logische Modelle für OLAP Burkhard Schäfer Übersicht Einführung in OLAP Multidimensionale Daten: Hypercubes Operationen Formale Grundlagen Zusammenfassung Einführung in OLAP Verfahren zur Analyse großer
MehrEin Beispiel. Ein Unternehmen will Internettechnologien im Rahmen des E- Business nutzen Welche Geschäftsprozesse?
Ein Beispiel Ein Unternehmen will Internettechnologien im Rahmen des E- Business nutzen Welche Geschäftsprozesse? Dipl.-Kfm. Claus Häberle WS 2015 /16 # 42 XML (vereinfacht) visa
MehrAuswertung mit dem Statistikprogramm SPSS: 30.11.05
Auswertung mit dem Statistikprogramm SPSS: 30.11.05 Seite 1 Einführung SPSS Was ist eine Fragestellung? Beispiel Welche statistische Prozedur gehört zu welcher Hypothese? Statistische Berechnungen mit
Mehr