Data Mining (ehem. Entscheidungsunterstützungssysteme)



Ähnliche Dokumente
Tiefgreifende Prozessverbesserung und Wissensmanagement durch Data Mining

Skalenniveau Grundlegende Konzepte

Teil I: Deskriptive Statistik

Grundlagen der Datenanalyse am Beispiel von SPSS

Seminar Business Intelligence Teil II. Data Mining & Knowledge Discovery

Data Mining: Einige Grundlagen aus der Stochastik

Auswahl alter Klausuraufgaben aus einer ähnlichen Vorlesung Maßgeblich für die Prüfung sind die Vorlesungsinhalte!

DISKUSSIONSBEITRÄGE DER FAKULTÄT FÜR BETRIEBSWIRTSCHAFTSLEHRE MERCATOR SCHOOL OF MANAGEMENT UNIVERSITÄT DUISBURG-ESSEN. Nr. 374

Mitarbeiterbefragung als PE- und OE-Instrument

Stichprobenauslegung. für stetige und binäre Datentypen

Was meinen die Leute eigentlich mit: Grexit?

Markovketten. Bsp. Page Ranking für Suchmaschinen. Wahlfach Entscheidung unter Risiko und stat. Datenanalyse

Grundlagen der Inferenzstatistik

Vgl. Kapitel 5 aus Systematisches Requirements Engineering, Christoph Ebert

Data Mining als Arbeitsprozess

Data Mining und Knowledge Discovery in Databases

Forschungsmethoden in der Sozialen Arbeit

Bachelorabschlussseminar Dipl.-Kfm. Daniel Cracau

Statistik I für Betriebswirte Vorlesung 5

Übung - Arbeiten mit Android

Predictive Modeling Markup Language. Thomas Morandell

Basis (=100%) zusätzlichen Schulabschluss an. Befragungszeitraum:

8. Grundlagen der empirischen Sozialforschung

Führen von blinden Mitarbeitern

Klausur Informationsmanagement

«Eine Person ist funktional gesund, wenn sie möglichst kompetent mit einem möglichst gesunden Körper an möglichst normalisierten Lebensbereichen

Personalentwicklung. Umfrage zur Personalentwicklung. Februar Cisar - consulting and solutions GmbH. In Zusammenarbeit mit

CITIES AGAINST RACISM RESPONSIBILITIES OF CITIES IN COUNTERACTING RACISM SUSTAINABILITY. Evaluation der Plakatkampagne der Stadt Graz gegen Rassismus

Weiterentwicklung des Studiengangkonzepts. Das erweiterte QM-Gespräch für Studium und Lehre

Internationale Unternehmensführung. Übung:

Gedanken zu: Wildbäche und Murgänge eine Herausforderung für Praxis und Forschung

Informationssystemanalyse Lebenszyklusmodelle 3 1. Lebenszyklusmodelle sollen hauptsächlich drei Aufgaben erfüllen:

Erhebung von Anforderungen an den Einsatz von ebusiness-standards in kleinen und mittleren Unternehmen

Anwendung der Predictive Analytics

Zeichen bei Zahlen entschlüsseln

Übungsfragen (I) 1. Grundkonzepte der Absatzwirtschaft

SSC BP MUSTERPRÜFUNG Prüfungsfach: Projektmanagement

Fachwirt. Geprüfter. werden. Intensivtraining für eine erfolgreiche IHK-Prüfung. Teil A wirtschaftsübergreifende Qualifikationen

Quantitative Methoden der Bildungsforschung

Kontingenzkoeffizient (nach Pearson)

Klausur zur Veranstaltung. Airline- und Airportmanagement. im WS

Kundenzufriedenheit im IT-Outsourcing grundsätzliche Überlegungen und empirische Ergebnisse Prof. Dr. Eberhard Schott

Korrelation (II) Korrelation und Kausalität

Erfolgreiche Webseiten: Zur Notwendigkeit die eigene(n) Zielgruppe(n) zu kennen und zu verstehen!

Fragenkatalog zur Bewertung Ihres ERP Geschäftsvorhabens:

Fortgeschrittene Statistik Logistische Regression

Felix Klug SS Tutorium Deskriptive Statistik

Wärmedämmungsexperiment 1

Auslobung des Wettbewerbs Reinickendorfer Frauen in Führung

Checkliste zur qualitativen Nutzenbewertung

Wissensmanagement im Geschäftsalltag: Wie unterstützt es mich in der beruflichen Praxis?

Bestandskundenmanagement Wo drückt bei Ihnen der Schuh?

Ideation-Day Fit für Innovation

Landes-Arbeits-Gemeinschaft Gemeinsam Leben Gemeinsam Lernen Rheinland-Pfalz e.v.

Verkaufsstätten. Dipl.- Ing.(FH) M.Eng.(TU) Thomas Höhne

Unterrichtsmaterialien in digitaler und in gedruckter Form. Auszug aus: Übungsbuch für den Grundkurs mit Tipps und Lösungen: Analysis

Recherche nach Stellenanzeigen in Zeitungen

Data Mining-Projekte

Fragebogen ISONORM 9241/110-S

BigData Wie wichtig ist die Datenqualität bei der Analyse und Auswertung von großen Daten Praxisbeispiel. Christin Otto

Neuronale Netze (I) Biologisches Neuronales Netz

Übungen zur Softwaretechnik

1. Einfuhrung zur Statistik

Datenbanken I - Übung 1

1 Einleitung. 1.1 Motivation und Zielsetzung der Untersuchung

11.3 Komplexe Potenzreihen und weitere komplexe Funktionen

ISO 9001:Kundenorientierung

Das System sollte den Benutzer immer auf dem Laufenden halten, indem es angemessenes Feedback in einer angemessenen Zeit liefert.

WS 2002/03. Prof. Dr. Rainer Manthey. Institut für Informatik III Universität Bonn. Informationssysteme. Kapitel 1. Informationssysteme

WERKZEUG KUNDENGRUPPEN BILDEN

Knowledge Discovery. Lösungsblatt 1

7. Das Spannungsfeld von Wissenschaft und Praxis

Was ist Sozial-Raum-Orientierung?

Inhaltsverzeichnis: Definitionen Informationssysteme als Kommunikationssystem Problemlösende Perspektiven Allgemeine System Annäherung Fazit

Data Mining-Modelle und -Algorithmen

Rhetorik und Argumentationstheorie.

Themenbereich "Bestattungskosten"

Die Zentralheizung der Stadt Wer heizt wie?

Wärmebildkamera. Arbeitszeit: 15 Minuten

Evaluation des Projektes

Integrierte Dienstleistungen regionaler Netzwerke für Lebenslanges Lernen zur Vertiefung des Programms. Lernende Regionen Förderung von Netzwerken

Erfolg beginnt im Kopf

WAS finde ich WO im Beipackzettel

Management Report. Hernstein. Befragung von Führungskräften in Österreich, Deutschland und der Schweiz

Im Prüfungsteil Mündlicher Ausdruck sollen Sie zeigen, wie gut Sie Deutsch sprechen.

Maschinelles Lernen und Data Mining: Methoden und Anwendungen

Bachelor Prüfungsleistung

SDD System Design Document

Aufgabe 3. Grundlagen des Dienstleistungsmanagement (Klausur WS10/11) Hagen, Univ.-Prof. Dr. Sabine Fließ Marco Wehler, MScBM

Führungsgespräch Fordern, Fördern, Entwickeln

RUNDE TISCHE /World Cafe. Themen

Managementbewertung Managementbewertung

Benchmark zur Kompetenzbestimmung in der österreichischen SW Industrie. Mag. Robert Kromer NCP / AWS Konferenz Wien,

Marketing IV - Investitionsgüter- und Technologiemarketing (WS 2014/15)

Persönliches Coaching

Repetitorium zum Staatsexamen für Lehramtsstudenten. Informationswirtschaft & Planung und Entscheidung NB-201. Sommersemester 2014

Fachbereich Wirtschaftswissenschaften Die Vorsitzenden der Prüfungsausschüsse

... hab ich gegoogelt. webfinder. Suchmaschinenmarketing !!!!!!

Transkript:

Data Mining (ehem. Entscheidungsunterstützungssysteme) Melanie Pfoh Anja Tetzner Christian Schieder Übung WS 2014/15

AGENDA TEIL 1 Aufgabe 1 (Wiederholung OPAL / Vorlesungsinhalte)

ENTSCHEIDUNG UND ENTSCHEIDUNGSTHEORIE 1. Aufgabe a) Wodurch ist ein Entscheidungsproblem gekennzeichnet? Auswahl aus mind. zwei Alternativen (Handlungsalternativen, Entscheidungsmöglichkeiten, Aktionen, Strategien) durch wenigstens einen Entscheidungsträger (z.b. Individuum, Unternehmen, Staat) unter Sicherheit oder Unsicherheit (Ungewissheit, Risiko, Unschärfe). b) Wie sieht ein typischer Prozess des Entscheidens aus? Entscheidung = Willensbildung + Entschluss; Entscheidungsprozess = Ablauf einer Entscheidung (mehrstufige Entscheidung) Phasen: Problemformulierung (nach Wahrnehmung von Symptomen, die eine Entscheidung erfordern) Präzisierung des Zielsystems für die Alternativensuche und -bewertung Alternativensuche und Ergebnisprognose (für die einzelnen Alternativen) Alternativenauswahl = eigentliche Entscheidung Ggf. weitere Entscheidungen während der Realisierungsphase (konkreten Umsetzung)

ENTSCHEIDUNG UND ENTSCHEIDUNGSTHEORIE 1. Aufgabe c) Was ist das Ziel der Entscheidungstheorie und worin liegt der Unterschied zwischen deskriptiver und präskriptiver Entscheidungstheorie? Entscheidungstheorie befasst sich mit Entscheidungsverhalten Teilgebiete: Deskriptive Entscheidungstheorie: fragt nach tatsächlichem Entscheidungsverhalten (induktiv) Präskriptive ( normative ) Entscheidungstheorie: fragt danach, wie Entscheidungen rational getroffen werden können sucht nach den Grundlagen und Verfahren logischen Entscheidens -> Entscheidungslogik Ziel: Entwicklung von mathematischen Modellen, mit deren Hilfe aus einem gegebenen Input der zu erwartende Output bestimmt werden kann

ENTSCHEIDUNG UND ENTSCHEIDUNGSTHEORIE 1. Aufgabe d) Lösung zum Exkurs: Deskriptive Statistik (OPAL)

ANWENDUNGSSYSTEME UND SYSTEMKATEGORIEN VON EUS 2. Aufgabe a) Erklären Sie die Begriffe Administrationssystem und Dispositionssystem! Grenzen Sie diese Systemklasse von den Planungs- und Kontrollsystemen ab!

ANWENDUNGSSYSTEME UND SYSTEMKATEGORIEN VON EUS 2. Aufgabe a) Erklären Sie die Begriffe Administrationssystem und Dispositionssystem! Grenzen Sie diese Systemklasse von den Planungs- und Kontrollsystemen ab! Administrations- und Dispositionssysteme Operative Systeme zur Unterstützung des operativen (Tages-)Geschäftes nur bedingt Managementunterstützend: stellen lediglich die Datenbasis für die Beurteilung des gegenwärtigen und vergangenen Betriebsgeschehens dar 1. Klasse: Operative Systeme, Pyramide unterer Teil Planungs- und Kontrollsysteme (Führungssysteme): direkt auf die Belange der Fach- und Führungskräfte ausgerichtet. Informationssysteme, Entscheidungsunterstützungssysteme, Berichts- und Kontrollsysteme 2. Klasse: Planungs- und Kontrollsysteme, Pyramide oberer Teil

ANWENDUNGSSYSTEME UND SYSTEMKATEGORIEN VON EUS 2. Aufgabe b) In welche Systemklasse lassen sich die Dispositiven Informationssysteme einordnen? c) Grenzen Sie die Begriffe Executive Information System, Decision Support System und Management Support System voneinander ab!

ANWENDUNGSSYSTEME UND SYSTEMKATEGORIEN VON EUS 2. Aufgabe d) Nennen Sie zwei Beispiele für Operative Systeme innerhalb eines Unternehmens.

DATA MINING 3. Aufgabe a) Überlegen und erläutern Sie an einem selbstgewählten Beispiel, wo Sie im Alltag mit Data Mining in Berührung kommen! b) Was ist KDD? Welche Ziele werden damit verfolgt? Knowledge Discovery in Databases describes the non-trivial process of identifying valid, novel, potentially useful, and ultimately understandable patterns in data. Nicht-trivialer Prozess (non-trivial process) dessen Ziel es ist, Muster (patterns) aus großen Datenbeständen (data) zu extrahieren, welche für einen großen Teil des Datenbestandes gültig sind (valid), bislang unbekannte (novel), potenziell nützliche (potentially useful) und leicht verständliche (ultimately understandable) Zusammenhänge innerhalb des Datenbestandes beschreiben.

DATA MINING 3. Aufgabe c) Worin liegt der Unterschied zwischen Knowledge Discovery und Data Mining? d) Welche Aufgabenbereiche des Data Mining kennen Sie und welche Problembereiche lassen sich daraus ableiten? Problemtypen des Data Mining: Beschreibungsaufgaben descriptive data mining Segmentierung (Welche Kundengruppen gibt es?) Abhängigkeiten (Welche Waren werden oft zusammen gekauft?) Prognoseaufgaben predictive data mining Klassifikation (Ist der Kunde kündigungsgefährdet?) Regression (Umsatz des Kunden in der nächsten Saison?)

DATEN-/INFORMATIONSQUALITÄT U. SKALENNIVEAUS 4. Aufgabe a) Grenzen Sie Daten, Information und Wissen voneinander ab und erläutern Sie die Übergänge!

DATEN-/INFORMATIONSQUALITÄT U. SKALENNIVEAUS 4. Aufgabe b) Nennen Sie jeweils vier wichtige Kriterien für Daten- und Informationsqualität!

DATEN-/INFORMATIONSQUALITÄT U. SKALENNIVEAUS 4. Aufgabe c) Was ist ein Skalenniveau und welcher Zusammenhang besteht hinsichtlich der Daten- bzw. Informationsqualität? Skalenniveau = Eigenschaft von Merkmalen bzw. von Variablen statistischen Informationsgehalt von Bedeutung für die Interpretation der Daten und die Eignung statistischer Verfahren gibt an Welche Vergleichsaussagen und welche rechnerischen Operationen für die Skalenwerte sinnvoll und somit zulässig sind Welche Transformationen von Skalenwerten die Messung erhalten (sogenannte zulässige Transformationen)

DATEN-/INFORMATIONSQUALITÄT U. SKALENNIVEAUS 4. Aufgabe d) Ergebnisse der OPAL-Aufgabe? Diskrete Werte Stetige Werte abzählbar viele Merkmalsausprägungen beliebige Werte in einem Bereich (Intervall) Metrische Daten gemessene reelle Zahl mit interpretierbaren Abständen, quantitativ (z.b. Gewicht, Größe) =/ </> +/- ( / ) -> diskret oder stetig Ordinale Daten Nominale Daten lassen sich ordnen, Ordnung aber nicht durch reellen Wert ausdrückbar (z.b. Schulnoten sehr gut ) =/ </> -> meist diskret zählbar aber keine Ordnung gegeben, qualitativ (z.b. Geschlecht) =/ -> stets diskret Weitere Beispiele: Alter (0-100 Jahre), Temperatur (0-100 C) Würfeln (2, 3, 4, ) Platzierung Sport (1., 2., 3. Platz) stetig, metrische Skala diskret, metrische Skala diskret, ordinale Skala

AGENDA TEIL 2 Fallstudie Teil 1 (ohne EB)

DM-Software RapidMiner Fallstudie Teil I

DM-Software RapidMiner Fallstudie Teil I

DM-Software RapidMiner erste Schritte (4.)

DM-Software RapidMiner Fallstudie Teil II

DM-Software RapidMiner erste Schritte Hauptprozess: Data Mining Bsp. Entscheidungsbaum