Data Mining (ehem. Entscheidungsunterstützungssysteme)

Größe: px
Ab Seite anzeigen:

Download "Data Mining (ehem. Entscheidungsunterstützungssysteme)"

Transkript

1 Data Mining (ehem. Entscheidungsunterstützungssysteme) Melanie Pfoh Anja Tetzner Christian Schieder Übung WS 2014/15

2 AGENDA TEIL 1 Aufgabe 1 (Wiederholung OPAL / Vorlesungsinhalte)

3 ENTSCHEIDUNG UND ENTSCHEIDUNGSTHEORIE 1. Aufgabe a) Wodurch ist ein Entscheidungsproblem gekennzeichnet? Auswahl aus mind. zwei Alternativen (Handlungsalternativen, Entscheidungsmöglichkeiten, Aktionen, Strategien) durch wenigstens einen Entscheidungsträger (z.b. Individuum, Unternehmen, Staat) unter Sicherheit oder Unsicherheit (Ungewissheit, Risiko, Unschärfe). b) Wie sieht ein typischer Prozess des Entscheidens aus? Entscheidung = Willensbildung + Entschluss; Entscheidungsprozess = Ablauf einer Entscheidung (mehrstufige Entscheidung) Phasen: Problemformulierung (nach Wahrnehmung von Symptomen, die eine Entscheidung erfordern) Präzisierung des Zielsystems für die Alternativensuche und -bewertung Alternativensuche und Ergebnisprognose (für die einzelnen Alternativen) Alternativenauswahl = eigentliche Entscheidung Ggf. weitere Entscheidungen während der Realisierungsphase (konkreten Umsetzung)

4 ENTSCHEIDUNG UND ENTSCHEIDUNGSTHEORIE 1. Aufgabe c) Was ist das Ziel der Entscheidungstheorie und worin liegt der Unterschied zwischen deskriptiver und präskriptiver Entscheidungstheorie? Entscheidungstheorie befasst sich mit Entscheidungsverhalten Teilgebiete: Deskriptive Entscheidungstheorie: fragt nach tatsächlichem Entscheidungsverhalten (induktiv) Präskriptive ( normative ) Entscheidungstheorie: fragt danach, wie Entscheidungen rational getroffen werden können sucht nach den Grundlagen und Verfahren logischen Entscheidens -> Entscheidungslogik Ziel: Entwicklung von mathematischen Modellen, mit deren Hilfe aus einem gegebenen Input der zu erwartende Output bestimmt werden kann

5 ENTSCHEIDUNG UND ENTSCHEIDUNGSTHEORIE 1. Aufgabe d) Lösung zum Exkurs: Deskriptive Statistik (OPAL)

6 ANWENDUNGSSYSTEME UND SYSTEMKATEGORIEN VON EUS 2. Aufgabe a) Erklären Sie die Begriffe Administrationssystem und Dispositionssystem! Grenzen Sie diese Systemklasse von den Planungs- und Kontrollsystemen ab!

7 ANWENDUNGSSYSTEME UND SYSTEMKATEGORIEN VON EUS 2. Aufgabe a) Erklären Sie die Begriffe Administrationssystem und Dispositionssystem! Grenzen Sie diese Systemklasse von den Planungs- und Kontrollsystemen ab! Administrations- und Dispositionssysteme Operative Systeme zur Unterstützung des operativen (Tages-)Geschäftes nur bedingt Managementunterstützend: stellen lediglich die Datenbasis für die Beurteilung des gegenwärtigen und vergangenen Betriebsgeschehens dar 1. Klasse: Operative Systeme, Pyramide unterer Teil Planungs- und Kontrollsysteme (Führungssysteme): direkt auf die Belange der Fach- und Führungskräfte ausgerichtet. Informationssysteme, Entscheidungsunterstützungssysteme, Berichts- und Kontrollsysteme 2. Klasse: Planungs- und Kontrollsysteme, Pyramide oberer Teil

8 ANWENDUNGSSYSTEME UND SYSTEMKATEGORIEN VON EUS 2. Aufgabe b) In welche Systemklasse lassen sich die Dispositiven Informationssysteme einordnen? c) Grenzen Sie die Begriffe Executive Information System, Decision Support System und Management Support System voneinander ab!

9 ANWENDUNGSSYSTEME UND SYSTEMKATEGORIEN VON EUS 2. Aufgabe d) Nennen Sie zwei Beispiele für Operative Systeme innerhalb eines Unternehmens.

10 DATA MINING 3. Aufgabe a) Überlegen und erläutern Sie an einem selbstgewählten Beispiel, wo Sie im Alltag mit Data Mining in Berührung kommen! b) Was ist KDD? Welche Ziele werden damit verfolgt? Knowledge Discovery in Databases describes the non-trivial process of identifying valid, novel, potentially useful, and ultimately understandable patterns in data. Nicht-trivialer Prozess (non-trivial process) dessen Ziel es ist, Muster (patterns) aus großen Datenbeständen (data) zu extrahieren, welche für einen großen Teil des Datenbestandes gültig sind (valid), bislang unbekannte (novel), potenziell nützliche (potentially useful) und leicht verständliche (ultimately understandable) Zusammenhänge innerhalb des Datenbestandes beschreiben.

11 DATA MINING 3. Aufgabe c) Worin liegt der Unterschied zwischen Knowledge Discovery und Data Mining? d) Welche Aufgabenbereiche des Data Mining kennen Sie und welche Problembereiche lassen sich daraus ableiten? Problemtypen des Data Mining: Beschreibungsaufgaben descriptive data mining Segmentierung (Welche Kundengruppen gibt es?) Abhängigkeiten (Welche Waren werden oft zusammen gekauft?) Prognoseaufgaben predictive data mining Klassifikation (Ist der Kunde kündigungsgefährdet?) Regression (Umsatz des Kunden in der nächsten Saison?)

12 DATEN-/INFORMATIONSQUALITÄT U. SKALENNIVEAUS 4. Aufgabe a) Grenzen Sie Daten, Information und Wissen voneinander ab und erläutern Sie die Übergänge!

13 DATEN-/INFORMATIONSQUALITÄT U. SKALENNIVEAUS 4. Aufgabe b) Nennen Sie jeweils vier wichtige Kriterien für Daten- und Informationsqualität!

14 DATEN-/INFORMATIONSQUALITÄT U. SKALENNIVEAUS 4. Aufgabe c) Was ist ein Skalenniveau und welcher Zusammenhang besteht hinsichtlich der Daten- bzw. Informationsqualität? Skalenniveau = Eigenschaft von Merkmalen bzw. von Variablen statistischen Informationsgehalt von Bedeutung für die Interpretation der Daten und die Eignung statistischer Verfahren gibt an Welche Vergleichsaussagen und welche rechnerischen Operationen für die Skalenwerte sinnvoll und somit zulässig sind Welche Transformationen von Skalenwerten die Messung erhalten (sogenannte zulässige Transformationen)

15 DATEN-/INFORMATIONSQUALITÄT U. SKALENNIVEAUS 4. Aufgabe d) Ergebnisse der OPAL-Aufgabe? Diskrete Werte Stetige Werte abzählbar viele Merkmalsausprägungen beliebige Werte in einem Bereich (Intervall) Metrische Daten gemessene reelle Zahl mit interpretierbaren Abständen, quantitativ (z.b. Gewicht, Größe) =/ </> +/- ( / ) -> diskret oder stetig Ordinale Daten Nominale Daten lassen sich ordnen, Ordnung aber nicht durch reellen Wert ausdrückbar (z.b. Schulnoten sehr gut ) =/ </> -> meist diskret zählbar aber keine Ordnung gegeben, qualitativ (z.b. Geschlecht) =/ -> stets diskret Weitere Beispiele: Alter (0-100 Jahre), Temperatur (0-100 C) Würfeln (2, 3, 4, ) Platzierung Sport (1., 2., 3. Platz) stetig, metrische Skala diskret, metrische Skala diskret, ordinale Skala

16 AGENDA TEIL 2 Fallstudie Teil 1 (ohne EB)

17 DM-Software RapidMiner Fallstudie Teil I

18 DM-Software RapidMiner Fallstudie Teil I

19 DM-Software RapidMiner erste Schritte (4.)

20 DM-Software RapidMiner Fallstudie Teil II

21 DM-Software RapidMiner erste Schritte Hauptprozess: Data Mining Bsp. Entscheidungsbaum

Data Mining und Knowledge Discovery in Databases

Data Mining und Knowledge Discovery in Databases Data Mining und Knowledge Discovery in Databases Begriffsabgrenzungen... Phasen der KDD...3 3 Datenvorverarbeitung...4 3. Datenproblematik...4 3. Möglichkeiten der Datenvorverarbeitung...4 4 Data Mining

Mehr

Teil I: Deskriptive Statistik

Teil I: Deskriptive Statistik Teil I: Deskriptive Statistik 2 Grundbegriffe 2.1 Merkmal und Stichprobe 2.2 Skalenniveau von Merkmalen 2.3 Geordnete Stichproben und Ränge 2.1 Merkmal und Stichprobe An (geeignet ausgewählten) Untersuchungseinheiten

Mehr

Anwendung der Predictive Analytics

Anwendung der Predictive Analytics TDWI Konferenz mit BARC@TDWI Track 2014 München, 23. 25. Juni 2014 Anwendung der Predictive Analytics Prof. Dr. Carsten Felden Dipl. Wirt. Inf. Claudia Koschtial Technische Universität Bergakademie Freiberg

Mehr

Maschinelles Lernen und Data Mining: Methoden und Anwendungen

Maschinelles Lernen und Data Mining: Methoden und Anwendungen Maschinelles Lernen und Data Mining: Methoden und Anwendungen Eyke Hüllermeier Knowledge Engineering & Bioinformatics Fachbereich Mathematik und Informatik GFFT-Jahrestagung, Wesel, 17. Januar 2008 Knowledge

Mehr

Knowledge Discovery. Lösungsblatt 1

Knowledge Discovery. Lösungsblatt 1 Universität Kassel Fachbereich Mathematik/nformatik Fachgebiet Wissensverarbeitung Hertie-Stiftungslehrstuhl Wilhelmshöher Allee 73 34121 Kassel Email: hotho@cs.uni-kassel.de Tel.: ++49 561 804-6252 Dr.

Mehr

Data Mining als Arbeitsprozess

Data Mining als Arbeitsprozess Data Mining als Arbeitsprozess Hagen Knaf Studiengang Angewandte Mathematik Hochschule RheinMain 31. Dezember 2015 In Unternehmen werden umfangreichere Aktivitäten oder Projekte im Bereich des Data Mining

Mehr

Entscheidungsunterstützungssysteme

Entscheidungsunterstützungssysteme Vorlesung WS 2013/2014 Christian Schieder Professur Wirtschaftsinformatik II cschie@tu-chemnitz.eu Literatur zur Vorlesung Gluchowski, P.; Gabriel, R.; Dittmar, C.: Management Support Systeme und Business

Mehr

0 Einführung: Was ist Statistik

0 Einführung: Was ist Statistik 0 Einführung: Was ist Statistik 1 Datenerhebung und Messung Die Messung Skalenniveaus 2 Univariate deskriptive Statistik 3 Multivariate Statistik 4 Regression 5 Ergänzungen Grundbegriffe Statistische Einheit,

Mehr

Skalenniveau Grundlegende Konzepte

Skalenniveau Grundlegende Konzepte Skalenniveau Grundlegende Konzepte M E R K M A L / V A R I A B L E, M E R K M A L S A U S P R Ä G U N G / W E R T, C O D I E R U N G, D A T E N - M A T R I X, Q U A N T I T A T I V E S M E R K M A L, Q

Mehr

Management Support Systeme

Management Support Systeme Management Support Systeme WS 24-25 4.-6. Uhr PD Dr. Peter Gluchowski Folie Gliederung MSS WS 4/5. Einführung Management Support Systeme: Informationssysteme zur Unterstützung betrieblicher Fach- und Führungskräfte

Mehr

Grundbegriffe (1) Grundbegriffe (2)

Grundbegriffe (1) Grundbegriffe (2) Grundbegriffe (1) S.1 Äquivalenzklasse Unter einer Äquivalenzklasse versteht man eine Klasse von Objekten, die man hinsichtlich bestimmter Merkmalsausprägungen als gleich (äquivalent) betrachtet. (z.b.

Mehr

Tiefgreifende Prozessverbesserung und Wissensmanagement durch Data Mining

Tiefgreifende Prozessverbesserung und Wissensmanagement durch Data Mining Tiefgreifende Prozessverbesserung und Wissensmanagement durch Data Mining Ausgangssituation Kaizen Data Mining ISO 9001 Wenn andere Methoden an ihre Grenzen stoßen Es gibt unzählige Methoden, die Abläufe

Mehr

Deskriptive Statistik Kapitel III - Merkmalsarten

Deskriptive Statistik Kapitel III - Merkmalsarten Deskriptive Statistik Kapitel III - Merkmalsarten Georg Bol bol@statistik.uni-karlsruhe.de hoechstoetter@statistik.uni-karlsruhe.de April 26, 2006 Typeset by FoilTEX Agenda 1. Merkmalsarten 2. Skalen 3.

Mehr

Ermittlung von Assoziationsregeln aus großen Datenmengen. Zielsetzung

Ermittlung von Assoziationsregeln aus großen Datenmengen. Zielsetzung Ermittlung von Assoziationsregeln aus großen Datenmengen Zielsetzung Entscheidungsträger verwenden heutzutage immer häufiger moderne Technologien zur Lösung betriebswirtschaftlicher Problemstellungen.

Mehr

Seminar Business Intelligence Teil II. Data Mining & Knowledge Discovery

Seminar Business Intelligence Teil II. Data Mining & Knowledge Discovery Seminar Business Intelligence Teil II Data Mining & Knowledge Discovery Was ist Data Mining? Sabine Queckbörner Was ist Data Mining? Data Mining Was ist Data Mining? Nach welchen Mustern wird gesucht?

Mehr

Florian Frötscher und Demet Özçetin

Florian Frötscher und Demet Özçetin Statistische Tests in der Mehrsprachigkeitsforschung Aufgaben, Anforderungen, Probleme. Florian Frötscher und Demet Özçetin florian.froetscher@uni-hamburg.de SFB 538 Mehrsprachigkeit Max-Brauer-Allee 60

Mehr

Vorwort zur zweiten Auflage...V. Vorwort zur ersten Auflage... VIII

Vorwort zur zweiten Auflage...V. Vorwort zur ersten Auflage... VIII Vorwort zur zweiten Auflage...V Vorwort zur ersten Auflage... VIII 1 Management Support Systeme und Business Intelligence Anwendungssysteme zur Unterstützung von Managementaufgaben...1 1.1 Computergestützte

Mehr

Skript zur Übung: Grundlagen der empirischen Sozialforschung - Datenanalyse

Skript zur Übung: Grundlagen der empirischen Sozialforschung - Datenanalyse Skript zur Übung: Grundlagen der empirischen Sozialforschung - Datenanalyse Phasen des Forschungsprozesses Auswahl des Forschungsproblems Theoriebildung Theoretische Phase Konzeptspezifikation / Operationalisierung

Mehr

Planung und Auswertung klinischer und experimenteller Studien: Datenmanagement

Planung und Auswertung klinischer und experimenteller Studien: Datenmanagement Planung und Auswertung klinischer und experimenteller Studien: Datenmanagement Institut für Medizininformatik, Biometrie und Epidemiologie Universität Erlangen - Nürnberg 1 Einordnung in den Ablauf 1.

Mehr

Grundlagen der Datenanalyse

Grundlagen der Datenanalyse Schematischer Überblick zur Behandlung quantitativer Daten Theorie und Modellbildung Untersuchungsdesign Codierung / Datenübertragung (Erstellung einer Datenmatrix) Datenerhebung Fehlerkontrolle / -behebung

Mehr

Matrikelnr: Name: Vorname: Aufgabe 1 2 3 4 Summe Maximal erreichbare 20 30 30 20 100 Punktzahl Erreichte Punktzahl. Note:

Matrikelnr: Name: Vorname: Aufgabe 1 2 3 4 Summe Maximal erreichbare 20 30 30 20 100 Punktzahl Erreichte Punktzahl. Note: Fakultät für Wirtschaftswissenschaft Matrikelnr: Name: Vorname: : Modul 32711 Business Intelligence Termin: 28.03.2014, 9:00 11:00 Uhr Prüfer: Univ.-Prof. Dr. U. Baumöl Aufbau und Bewertung der Aufgabe

Mehr

1. Einführung und statistische Grundbegriffe. Grundsätzlich unterscheidet man zwei Bedeutungen des Begriffs Statistik:

1. Einführung und statistische Grundbegriffe. Grundsätzlich unterscheidet man zwei Bedeutungen des Begriffs Statistik: . Einführung und statistische Grundbegriffe Grundsätzlich unterscheidet man zwei Bedeutungen des Begriffs Statistik: Quantitative Information Graphische oder tabellarische Darstellung von Datenmaterial

Mehr

Grundlagen Statistik Angewandte Statistik 3. Semester

Grundlagen Statistik Angewandte Statistik 3. Semester Angewandte Statistik 3. Semester Zur Person Constantin von Craushaar Consultant / Partner Innstat e.u. (www.innstat.com) info@innstat.com Grundlagen der Statistik Übersicht Semester 1 Einführung ins SPSS

Mehr

1. GEGENSTAND UND GRUNDBEGRIFFE DER STATISTIK

1. GEGENSTAND UND GRUNDBEGRIFFE DER STATISTIK 1 1. GEGENSTAND UND GRUNDBEGRIFFE DER STATISTIK 1.1 Gegenstand der Statistik Die Statistik stellt ein Instrumentarium bereit, um Informationen über die Realität oder Wirklichkeit verfügbar zu machen. Definition

Mehr

Modul 04: Messbarkeit von Merkmalen, Skalen und Klassierung. Prof. Dr. W. Laufner Beschreibende Statistik

Modul 04: Messbarkeit von Merkmalen, Skalen und Klassierung. Prof. Dr. W. Laufner Beschreibende Statistik Modul 04: Messbarkeit von Merkmalen, Skalen und 1 Modul 04: Informationsbedarf empirische (statistische) Untersuchung Bei einer empirischen Untersuchung messen wir Merkmale bei ausgewählten Untersuchungseinheiten

Mehr

Personalisierung. Der Personalisierungsprozess Nutzerdaten erheben aufbereiten auswerten Personalisierung. Data Mining.

Personalisierung. Der Personalisierungsprozess Nutzerdaten erheben aufbereiten auswerten Personalisierung. Data Mining. Personalisierung Personalisierung Thomas Mandl Der Personalisierungsprozess Nutzerdaten erheben aufbereiten auswerten Personalisierung Klassifikation Die Nutzer werden in vorab bestimmte Klassen/Nutzerprofilen

Mehr

Steuerungsverfahren und ihre Datenstrukturen 02 - Datenmanagement

Steuerungsverfahren und ihre Datenstrukturen 02 - Datenmanagement Steuerungsverfahren und ihre Datenstrukturen 02 - Datenmanagement 1 Übersicht - Datenmanagement 1 Übersicht - Datenmanagement...1 2 Übersicht: Datenbanken - Datawarehouse...2 3 Übersicht: Data Mining...11

Mehr

Repetitorium zum Staatsexamen für Lehramtsstudenten. Informationswirtschaft & Planung und Entscheidung 30.05.2014 NB-201. Sommersemester 2014

Repetitorium zum Staatsexamen für Lehramtsstudenten. Informationswirtschaft & Planung und Entscheidung 30.05.2014 NB-201. Sommersemester 2014 Sommersemester 2014 Repetitorium zum Staatsexamen für Lehramtsstudenten Informationswirtschaft & Planung und Entscheidung 30.05.2014 NB-201 Lehrstuhl für ABWL und Wirtschaftsinformatik Prof. Dr. Alexandros

Mehr

fh management, communication & it Constantin von Craushaar fh-management, communication & it Statistik Angewandte Statistik

fh management, communication & it Constantin von Craushaar fh-management, communication & it Statistik Angewandte Statistik fh management, communication & it Folie 1 Angewandte Statistik Übersicht Semester 1 Einführung ins SPSS Auswertung im SPSS anhand eines einfachen Beispieles Häufigkeitsauswertungen Grafiken Datenmanipulationen

Mehr

3. Merkmale und Daten

3. Merkmale und Daten 3. Merkmale und Daten Ziel dieses Kapitels: Vermittlung des statistischen Grundvokabulars Zu klärende Begriffe: Grundgesamtheit Merkmale (Skalenniveau etc.) Stichprobe 46 3.1 Grundgesamtheiten Definition

Mehr

Knowledge Discovery In Databases. Data Mining - Der moderne Goldrausch?

Knowledge Discovery In Databases. Data Mining - Der moderne Goldrausch? Oberseminar Data Mining 07. April 2010 Methodik des Data Mining Knowledge Discovery In Databases oder auch Data Mining - Der moderne Goldrausch? Data Mining...? Hochleistungsrechnen Geoinformationssysteme

Mehr

Business Intelligence

Business Intelligence Business Intelligence Anwendungssysteme (BIAS) Lösung Aufgabe 1 Übung WS 2012/13 Business Intelligence Erläutern Sie den Begriff Business Intelligence. Gehen Sie bei der Definition von Business Intelligence

Mehr

Daten, Datentypen, Skalen

Daten, Datentypen, Skalen Bildung kommt von Bildschirm und nicht von Buch, sonst hieße es ja Buchung. Daten, Datentypen, Skalen [main types of data; levels of measurement] Die Umsetzung sozialwissenschaftlicher Forschungsvorhaben

Mehr

Kapitel III - Merkmalsarten

Kapitel III - Merkmalsarten Universität Karlsruhe (TH) Institut für Statistik und Mathematische Wirtschaftstheorie Statistik 1 - Deskriptive Statistik Kapitel III - Merkmalsarten Markus Höchstötter Lehrstuhl für Statistik, Ökonometrie

Mehr

Dr. Andreas Hotho, Robert Jäschke Fachgebiet Wissensverarbeitung 30.10.2008. Wintersemester 2008/2009

Dr. Andreas Hotho, Robert Jäschke Fachgebiet Wissensverarbeitung 30.10.2008. Wintersemester 2008/2009 Dr. Andreas Hotho, Robert Jäschke Fachgebiet Wissensverarbeitung 30.10.2008 1. Übung Knowledge Discovery Wintersemester 2008/2009 Vorbemerkungen Vorlesungsfolien und Übungsblätter können Sie im Internet

Mehr

Alles für den Kunden Analyse von Kundendaten. Katrin Plickert, Heiko Hartenstein

Alles für den Kunden Analyse von Kundendaten. Katrin Plickert, Heiko Hartenstein Alles für den Kunden Analyse von Kundendaten Katrin Plickert, Heiko Hartenstein Zum Verständnis 9. Februar 2007 Heiko Hartenstein, Katrin Plickert 2 Quelle: Heilmann, Kempner, Baars: Business and Competitive

Mehr

Einführung in die Wissensverarbeitung und Data Mining

Einführung in die Wissensverarbeitung und Data Mining Einführung in die Wissensverarbeitung und Data Mining Peter Becker FH Bonn-Rhein-Sieg Fachbereich Angewandte Informatik!" $# Vorlesung Wintersemester 2001/02 1. Einführung Vorbemerkungen 1 Einführung Vorbemerkungen

Mehr

Behavioral Targeting und selbstlernende Kampagnen. Aktuelle Herausforderungen für Data Mining. Dr. Alexander K. Seewald

Behavioral Targeting und selbstlernende Kampagnen. Aktuelle Herausforderungen für Data Mining. Dr. Alexander K. Seewald Behavioral Targeting und selbstlernende Kampagnen Aktuelle Herausforderungen für Data Mining Dr. Alexander K. Seewald Behavioral Targeting Kognitive Neurowissenschaften Verhalten aussagekräftiger als Erklärung

Mehr

Predictive Modeling Markup Language. Thomas Morandell

Predictive Modeling Markup Language. Thomas Morandell Predictive Modeling Markup Language Thomas Morandell Index Einführung PMML als Standard für den Austausch von Data Mining Ergebnissen/Prozessen Allgemeine Struktur eines PMML Dokuments Beispiel von PMML

Mehr

9 Resümee. Resümee 216

9 Resümee. Resümee 216 Resümee 216 9 Resümee In der vorliegenden Arbeit werden verschiedene Methoden der Datenreduktion auf ihre Leistungsfähigkeit im sozialwissenschaftlichstatistischen Umfeld anhand eines konkreten Anwendungsfalls

Mehr

Statistik II: Grundlagen und Definitionen der Statistik

Statistik II: Grundlagen und Definitionen der Statistik Medien Institut : Grundlagen und Definitionen der Statistik Dr. Andreas Vlašić Medien Institut (0621) 52 67 44 vlasic@medien-institut.de Gliederung 1. Hintergrund: Entstehung der Statistik 2. Grundlagen

Mehr

Statistische Grundlagen I

Statistische Grundlagen I Statistische Grundlagen I Arten der Statistik Zusammenfassung und Darstellung von Daten Beschäftigt sich mit der Untersuchung u. Beschreibung von Gesamtheiten oder Teilmengen von Gesamtheiten durch z.b.

Mehr

Bachelorabschlussseminar Dipl.-Kfm. Daniel Cracau

Bachelorabschlussseminar Dipl.-Kfm. Daniel Cracau 1 Einführung in die statistische Datenanalyse Bachelorabschlussseminar Dipl.-Kfm. Daniel Cracau 2 Gliederung 1.Grundlagen 2.Nicht-parametrische Tests a. Mann-Whitney-Wilcoxon-U Test b. Wilcoxon-Signed-Rank

Mehr

0 Einführung: Was ist Statistik

0 Einführung: Was ist Statistik 0 Einführung: Was ist Statistik 1 Datenerhebung und Messung 2 Univariate deskriptive Statistik 3 Multivariate Statistik 4 Regression 5 Ergänzungen Explorative Datenanalyse EDA Auffinden von Strukturen

Mehr

Eigene MC-Fragen Grundbegriffe der Statistik (X aus 5)

Eigene MC-Fragen Grundbegriffe der Statistik (X aus 5) Eigene MC-Fragen Grundbegriffe der Statistik (X aus 5) 1. Welche Reihenfolge ist zutreffend auf den Ablauf einer statistischen Untersuchung laut SB? A B C D Aufbereitung Erhebung Planung Auswertung C-D-A-B

Mehr

Statistik I für Betriebswirte Vorlesung 5

Statistik I für Betriebswirte Vorlesung 5 Statistik I für Betriebswirte Vorlesung 5 PD Dr. Frank Heyde TU Bergakademie Freiberg Institut für Stochastik 07. Mai 2015 PD Dr. Frank Heyde Statistik I für Betriebswirte Vorlesung 5 1 Klassische Wahrscheinlichkeitsdefinition

Mehr

Einführung in die Statistik mit EXCEL und SPSS

Einführung in die Statistik mit EXCEL und SPSS Christine Duller 2008 AGI-Information Management Consultants May be used for personal purporses only or by libraries associated to dandelon.com network. Einführung in die Statistik mit EXCEL und SPSS Ein

Mehr

Data Mining (ehem. Entscheidungsunterstützungssysteme)

Data Mining (ehem. Entscheidungsunterstützungssysteme) Data Mining (ehem. Entscheidungsunterstützungssysteme) Melanie Pfoh Anja Tetzner Christian Schieder Übung WS 2014/15 AGENDA TEIL 1 Aufgabe 2 (Wiederholung OPAL / Vorlesungsinhalte) ENTSCHEIDUNGSBAUMVERFAHREN

Mehr

Bestandskundenmanagement Wo drückt bei Ihnen der Schuh?

Bestandskundenmanagement Wo drückt bei Ihnen der Schuh? Bestandskundenmanagement Wo drückt bei Ihnen der Schuh? best-reactions GmbH Hirschberger Straße 33 D 90559 Burgthann Alle Rechte vorbehalten HRB 23679, Amtsgericht Nürnberg Geschäftsführer Alexander P.

Mehr

Alle weiteren Messoperationen schließen die Klassifikation als Minimaloperation ein.

Alle weiteren Messoperationen schließen die Klassifikation als Minimaloperation ein. 1 unterschiedliche Skalenniveaus Wir haben zuvor schon kurz von unterschiedlichen Skalenniveaus gehört, nämlich dem: - Nominalskalenniveau - Ordinalskalenniveau - Intervallskalenniveau - Ratioskalenniveau

Mehr

Grundlagen der Datenanalyse am Beispiel von SPSS

Grundlagen der Datenanalyse am Beispiel von SPSS Grundlagen der Datenanalyse am Beispiel von SPSS Einführung Dipl. - Psych. Fabian Hölzenbein hoelzenbein@psychologie.uni-freiburg.de Einführung Organisatorisches Was ist Empirie? Was ist Statistik? Dateneingabe

Mehr

PPC und Data Mining. Seminar aus Informatik LV-911.039. Michael Brugger. Fachbereich der Angewandten Informatik Universität Salzburg. 28.

PPC und Data Mining. Seminar aus Informatik LV-911.039. Michael Brugger. Fachbereich der Angewandten Informatik Universität Salzburg. 28. PPC und Data Mining Seminar aus Informatik LV-911.039 Michael Brugger Fachbereich der Angewandten Informatik Universität Salzburg 28. Mai 2010 M. Brugger () PPC und Data Mining 28. Mai 2010 1 / 14 Inhalt

Mehr

DISKUSSIONSBEITRÄGE DER FAKULTÄT FÜR BETRIEBSWIRTSCHAFTSLEHRE MERCATOR SCHOOL OF MANAGEMENT UNIVERSITÄT DUISBURG-ESSEN. Nr. 374

DISKUSSIONSBEITRÄGE DER FAKULTÄT FÜR BETRIEBSWIRTSCHAFTSLEHRE MERCATOR SCHOOL OF MANAGEMENT UNIVERSITÄT DUISBURG-ESSEN. Nr. 374 DISKUSSIONSBEITRÄGE DER FAKULTÄT FÜR BETRIEBSWIRTSCHAFTSLEHRE MERCATOR SCHOOL OF MANAGEMENT UNIVERSITÄT DUISBURG-ESSEN Nr. 374 Eignung von Verfahren der Mustererkennung im Process Mining Sabrina Kohne

Mehr

Sozialwissenschaftliche Methoden I [BA IM 2stündig] Sommersemester 2010

Sozialwissenschaftliche Methoden I [BA IM 2stündig] Sommersemester 2010 Sozialwissenschaftliche Methoden I [BA IM 2stündig] Sommersemester 2010 Max. Gesamtpunktzahl: 28 (bestanden mit 14 Punkten) Matrikelnummer: - Bei Antwortmöglichkeiten mit müssen Sie jeweils alle die Kästchen

Mehr

Einführung in die Statistik mir R

Einführung in die Statistik mir R Einführung in die Statistik mir R ww w. syn t egris.de Überblick GESCHÄFTSFÜHRUNG Andreas Baumgart, Business Processes and Service Gunar Hofmann, IT Solutions Sven-Uwe Weller, Design und Development Jens

Mehr

a) Zeichnen Sie in das nebenstehende Streudiagramm mit Lineal eine Regressionsgerade ein, die Sie für passend halten.

a) Zeichnen Sie in das nebenstehende Streudiagramm mit Lineal eine Regressionsgerade ein, die Sie für passend halten. Statistik für Kommunikationswissenschaftler Wintersemester 2009/200 Vorlesung Prof. Dr. Helmut Küchenhoff Übung Cornelia Oberhauser, Monia Mahling, Juliane Manitz Thema 4 Homepage zur Veranstaltung: http://www.statistik.lmu.de/~helmut/kw09.html

Mehr

8. Grundlagen der empirischen Sozialforschung

8. Grundlagen der empirischen Sozialforschung Einführung in das Studium der Management- und Wirtschaftswissenschaften WS 2013/14 8. Grundlagen der empirischen Sozialforschung Internationales Institut für Management und ökonomische Bildung Professur

Mehr

Teil I: Deskriptive Statistik

Teil I: Deskriptive Statistik Teil I: Deskriptive Statistik 2 Grundbegriffe 2.1 Merkmal und Stichprobe 2.2 Skalenniveau von Merkmalen 2.3 Geordnete Stichproben und Ränge 2.1 Merkmal und Stichprobe An (geeignet ausgewählten) Untersuchungseinheiten

Mehr

Data Mining Anwendungen und Techniken

Data Mining Anwendungen und Techniken Data Mining Anwendungen und Techniken Knut Hinkelmann DFKI GmbH Entdecken von Wissen in banken Wissen Unternehmen sammeln ungeheure mengen enthalten wettbewerbsrelevantes Wissen Ziel: Entdecken dieses

Mehr

Betriebswirtschaftliche Entscheidungstheorie

Betriebswirtschaftliche Entscheidungstheorie Prof. Dr. Günter Sieben Prof. Dr. Thomas Schildbach Betriebswirtschaftliche Entscheidungstheorie 3., überarbeitete und erweiterte Auflage 1990 Werner-Verlag Düsseldorf VII Inhaltsverzeichnis I. Begriffsbestimmung

Mehr

fh management, communication & it Constantin von Craushaar FH-management, communication & it Statistik Angewandte Statistik

fh management, communication & it Constantin von Craushaar FH-management, communication & it Statistik Angewandte Statistik fh management, communication & it Folie 1 Angewandte Statistik Übersicht Semester 1 Einführung ins SPSS Auswertung im SPSS anhand eines einfachen Beispieles Häufigkeitsauswertungen Grafiken Datenmanipulationen

Mehr

Künstliche Intelligenz Maschinelles Lernen

Künstliche Intelligenz Maschinelles Lernen Künstliche Intelligenz Maschinelles Lernen Stephan Schwiebert Sommersemester 2009 Sprachliche Informationsverarbeitung Institut für Linguistik Universität zu Köln Maschinelles Lernen Überwachtes Lernen

Mehr

Constantin von Craushaar FH-Management & IT Statistik Angewandte Statistik (Übungen) Folie 1

Constantin von Craushaar FH-Management & IT Statistik Angewandte Statistik (Übungen) Folie 1 FHManagement & IT Folie 1 Angewandte Statistik Übersicht Semester 1 Einführung ins SPSS Auswertung im SPSS anhand eines einfachen Beispieles Häufigkeitsauswertungen Grafiken Datenmanipulationen Mehrfachantworten

Mehr

Umsetzung der Anforderungen - analytisch

Umsetzung der Anforderungen - analytisch Umsetzung der Anforderungen - analytisch Titel des Lernmoduls: Umsetzung der Anforderungen - analytisch Themengebiet: New Economy Gliederungspunkt im Curriculum: 4.2.5.5 Zum Inhalt: In diesem Modul wird

Mehr

Stichprobenauslegung. für stetige und binäre Datentypen

Stichprobenauslegung. für stetige und binäre Datentypen Stichprobenauslegung für stetige und binäre Datentypen Roadmap zu Stichproben Hypothese über das interessierende Merkmal aufstellen Stichprobe entnehmen Beobachtete Messwerte abbilden Schluss von der Beobachtung

Mehr

Forschungsmethoden in der Sozialen Arbeit

Forschungsmethoden in der Sozialen Arbeit Forschungsmethoden in der Sozialen Arbeit Fachhochschule für Sozialarbeit und Sozialpädagogik Alice- Salomon Hochschule für Soziale arbeit, Gesundheit, Erziehung und Bildung University of Applied Sciences

Mehr

Sequential Pattern Analysis und Markov-Modelle. Christian Weiß Institut für Angewandte Mathematik und Statistitik Universität Würzburg

Sequential Pattern Analysis und Markov-Modelle. Christian Weiß Institut für Angewandte Mathematik und Statistitik Universität Würzburg Sequential Pattern Analysis und Markov-Modelle. Christian Weiß Institut für Angewandte Mathematik und Statistitik Universität Würzburg Sequential Pattern Analysis Historische Aspekte Data Mining als Teildisziplin

Mehr

Einführung in Data Mining anhand des Modells CRISP-DM

Einführung in Data Mining anhand des Modells CRISP-DM Einführung in Data Mining anhand des Modells CRISP-DM Seminarvortrag Linnea Passing Seminar, Scientific Programming, FH Aachen Stand: 11.01.2011 Rechen- und Kommunikationszentrum (RZ) Agenda Motivation

Mehr

Data-Mining: Ausgewählte Verfahren und Werkzeuge

Data-Mining: Ausgewählte Verfahren und Werkzeuge Fakultät Informatik Institut für Angewandte Informatik Lehrstuhl Technische Informationssysteme Data-Mining: Ausgewählte Verfahren und Vortragender: Jia Mu Betreuer: Dipl.-Inf. Denis Stein Dresden, den

Mehr

Überblick: Entscheidungstheoretische Konzepte Seminar Online-Optimierung Diana Balbus

Überblick: Entscheidungstheoretische Konzepte Seminar Online-Optimierung Diana Balbus Überblick: Entscheidungstheoretische Konzepte Seminar Online-Optimierung Diana Balbus Einleitung Ein Online-Algorithmus muss Ausgaben berechnen, ohne zukünftige Eingaben zu kennen. Für die Bewertung von

Mehr

Übungsfragen (I) 1. Grundkonzepte der Absatzwirtschaft

Übungsfragen (I) 1. Grundkonzepte der Absatzwirtschaft Übungsfragen (I) 1. Grundkonzepte der Absatzwirtschaft Zu 1.1 Begriffe und Funktionen der Absatzwirtschaft: Erklären Sie den Unterschied zwischen Absatz und Umsatz! Nennen Sie jeweils drei qualitative

Mehr

Einführung in die Statistik mit EXCEL und SPSS

Einführung in die Statistik mit EXCEL und SPSS Christine Duller Einführung in die Statistik mit EXCEL und SPSS Ein anwendungsorientiertes Lehr- und Arbeitsbuch Zweite, überarbeitete Auflage Mit 71 Abbildungen und 26 Tabellen Physica-Verlag Ein Unternehmen

Mehr

Kontingenzkoeffizient (nach Pearson)

Kontingenzkoeffizient (nach Pearson) Assoziationsmaß für zwei nominale Merkmale misst die Unabhängigkeit zweier Merkmale gibt keine Richtung eines Zusammenhanges an 46 o jl beobachtete Häufigkeiten der Kombination von Merkmalsausprägungen

Mehr

Empirische Wirtschaftsforschung und Ökonometrie III

Empirische Wirtschaftsforschung und Ökonometrie III Empirische Wirtschaftsforschung und Ökonometrie III Prof. Dr. Robert Jung Lehrstuhl für Ökonometrie Staatswissenschaftliche Fakultät Universität Erfurt http://www.uni-erfurt.de/oekonometrie SS 2009 BA

Mehr

Data Mining - Marketing-Schlagwort oder ernstzunehmende Innovation?

Data Mining - Marketing-Schlagwort oder ernstzunehmende Innovation? 1. Konferenz der A Benutzer KFE in Forschung und Entwicklung Data Mining - Marketing-chlagwort oder ernstzunehmende Innovation? Hans-Peter Höschel,, Heidelberg 1. Konferenz der A Benutzer KFE in Forschung

Mehr

Fragenkatalog zur Vorlesung "Grundlagen des Data Mining" (WS 2006/07)

Fragenkatalog zur Vorlesung Grundlagen des Data Mining (WS 2006/07) Fragenkatalog zur Vorlesung "Grundlagen des Data Mining" (WS 2006/07) 1. Grenzen Sie die Begriffe "Daten" und "Wissen" mit je 3 charakteristischen Eigenschaften gegeander ab. 2. Nennen Sie vier verschiedene

Mehr

Einführung in die Statistik Einführung

Einführung in die Statistik Einführung Professur E-Learning und Neue Medien Institut für Medienforschung Philosophische Fakultät Einführung in die Statistik Einführung Professur E-Learning und Neue Medien www.tu-chemnitz.de/phil/imf/elearning

Mehr

Dominik Pretzsch TU Chemnitz 2011

Dominik Pretzsch TU Chemnitz 2011 Dominik Pretzsch TU Chemnitz 2011 Wir leben im Informationszeitalter und merken es daran, dass wir uns vor Information nicht mehr retten können. Nicht der überwältigende Nutzen der Information, sondern

Mehr

Data Mining-Modelle und -Algorithmen

Data Mining-Modelle und -Algorithmen Data Mining-Modelle und -Algorithmen Data Mining-Modelle und -Algorithmen Data Mining ist ein Prozess, bei dem mehrere Komponenten i n- teragieren. Sie greifen auf Datenquellen, um diese zum Training,

Mehr

Forschungsmethoden in der Sozialen Arbeit

Forschungsmethoden in der Sozialen Arbeit Forschungsmethoden in der Sozialen Arbeit Erhebungsinstrument Lehrveranstaltung an der Fachhochschule für Sozialarbeit und Sozialpädagogik "Alice Salomon" Hochschule für Soziale Arbeit, Gesundheit, Erziehung

Mehr

Auswertung mit dem Statistikprogramm SPSS: 30.11.05

Auswertung mit dem Statistikprogramm SPSS: 30.11.05 Auswertung mit dem Statistikprogramm SPSS: 30.11.05 Seite 1 Einführung SPSS Was ist eine Fragestellung? Beispiel Welche statistische Prozedur gehört zu welcher Hypothese? Statistische Berechnungen mit

Mehr

Forschungsstatistik I

Forschungsstatistik I Prof. Dr. G. Meinhardt 6. Stock, TB II R. 06-206 (Persike) R. 06-321 (Meinhardt) Sprechstunde jederzeit nach Vereinbarung Forschungsstatistik I Dr. Malte Persike persike@uni-mainz.de http://psymet03.sowi.uni-mainz.de/

Mehr

Data Mining Standards am Beispiel von PMML. Data Mining Standards am Beispiel von PMML

Data Mining Standards am Beispiel von PMML. Data Mining Standards am Beispiel von PMML Data Mining Standards am Beispiel von PMML Allgemeine Definitionen im Data Mining Data Mining (DM) Ein Prozess, um interessante neue Muster, Korrelationen und Trends in großen Datenbeständen zu entdecken,

Mehr

Komponenten und Architekturen von Analytischen Informationssystemen (AIS)

Komponenten und Architekturen von Analytischen Informationssystemen (AIS) Komponenten und Architekturen von Analytischen Informationssystemen (AIS) Melanie Pfoh Konsultation 27. Juni 2013 Hinweis Diese Folien ersetzen keinesfalls den Übungsstoff des zugehörigen e-learning-kurses.

Mehr

I.O. BUSINESS. Checkliste Change Management

I.O. BUSINESS. Checkliste Change Management I.O. BUSINESS Checkliste Change Management Gemeinsam Handeln I.O. BUSINESS Checkliste Change Management Generell liegen die Ansatzpunkte für die Gestaltung von Veränderungsprozessen bei - dem einzelnen

Mehr

Data/Information Quality Management

Data/Information Quality Management Data/Information Quality Management Seminar WI/Informationsmanagement im Sommersemester 2002 Markus Berberov, Roman Eder, Peter Gerstbach 11.6.2002 Inhalt! Daten und Datenqualität! Einführung und Definition!

Mehr

NUTZWERTANALYSE IN DER SYSTEMTECHNIK. Eine Methodik zur multidimensionalen. Bewertung und Auswahl von Projektalternativen

NUTZWERTANALYSE IN DER SYSTEMTECHNIK. Eine Methodik zur multidimensionalen. Bewertung und Auswahl von Projektalternativen NUTZWERTANALYSE IN DER SYSTEMTECHNIK Eine Methodik zur multidimensionalen Bewertung und Auswahl von Projektalternativen von Prof. Dr.-Ing., Dipl.-Wirt.-lng. Christof Zangemeister 1 INHALTSVERZEICHNIS I.

Mehr

Management Support Systeme

Management Support Systeme Folie 1 Management Support Systeme Literatur zur Vorlesung MSS Gluchowski, Peter; Gabriel, Roland; Chamoni, Peter (1997): Management Support Systeme. Computergestützte Informationssysteme für Führungskräfte

Mehr

Grundbegriffe. Bibliografie

Grundbegriffe. Bibliografie Grundbegriffe Merkmale und Merkmalsausprägungen Skalen und Skalentransformation Einführung und Grundbegriffe II 1 Bibliografie Bleymüller / Gehlert / Gülicher Verlag Vahlen Statistik für Wirtschaftswissenschaftler

Mehr

Neuere Konzepte von Informationssystemen Teil II. Neuere Konzepte von Informationssystemen Teil II. Gliederung. Motivation #1.

Neuere Konzepte von Informationssystemen Teil II. Neuere Konzepte von Informationssystemen Teil II. Gliederung. Motivation #1. Neuere Konzepte von Informationssystemen Teil II Kapitel : KDD & Data Mining Gliederung Diese Vorlesung gliedert sich wie folgt: Einführung: Klassische Fragestellungen Data-Mining-Aufgaben Data-Mining-Verfahren

Mehr

Department Geoinformation in Environmental Planning Einsatz von Data Mining ein nichtparametrischer Klassifikator in der Umweltanalyse

Department Geoinformation in Environmental Planning Einsatz von Data Mining ein nichtparametrischer Klassifikator in der Umweltanalyse Deutsche Gesellschaft für Photogrammetrie, Fernerkundung und Geoinformation (DGPF) e.v. Arbeitskreis Auswertung von Fernerkundungsdaten 26 Oktober, Halle (Saale) Department Einsatz von Data Mining ein

Mehr

Fortgeschrittene Statistik SPSS Einführung

Fortgeschrittene Statistik SPSS Einführung Fortgeschrittene Statistik SPSS Einführung Q U A N T I T A T I V E M E R K M A L E, Q U A L I T A T I V E M E R K M A L E, A U S P R Ä G U N G E N, C O D I E R U N G E N, S K A L E N N I V E A U, D A T

Mehr

Vorlesung 1: Grundbegriffe, einführende Begriffe, Merkmale in der Statistik Gliederung und Aufgaben einer Vorlesung Statistik

Vorlesung 1: Grundbegriffe, einführende Begriffe, Merkmale in der Statistik Gliederung und Aufgaben einer Vorlesung Statistik 1 Vorlesung 1: Grundbegriffe, einführende Begriffe, Merkmale in der Statistik Gliederung und Aufgaben einer Vorlesung Statistik Letzter Stand: 12. Juni 2000, 5 Seiten Literaturbezug Dieses Kapitel (einschließlich

Mehr

Visualisierung der Imperfektion in multidimensionalen Daten

Visualisierung der Imperfektion in multidimensionalen Daten Visualisierung der Imperfektion in multidimensionalen Daten Horst Fortner Imperfektion und erweiterte Konzepte im Data Warehousing Betreuer: Heiko Schepperle 2 Begriffe (1) Visualisierung [Wikipedia] abstrakte

Mehr

Teil II: Einführung in die Statistik

Teil II: Einführung in die Statistik Teil II: Einführung in die Statistik (50 Punkte) Bitte beantworten Sie ALLE Fragen. Es handelt sich um multiple choice Fragen. Sie müssen die exakte Antwortmöglichkeit angeben, um die volle Punktzahl zu

Mehr

Allgemeine Grundlagen Seite Termin: Eindimensionale Häufigkeitsverteilung

Allgemeine Grundlagen Seite Termin: Eindimensionale Häufigkeitsverteilung Statistik für alle Gliederung insgesamt Allgemeine Grundlagen Seite 1 1. Termin: Allgemeine Grundlagen 2. Termin: Eindimensionale Häufigkeitsverteilung 3. Termin: Lageparameter 4. Termin: Streuungsparameter

Mehr

Data Mining mit RapidMiner

Data Mining mit RapidMiner Motivation Data Mining mit RapidMiner CRISP: DM-Prozess besteht aus unterschiedlichen Teilaufgaben Datenvorverarbeitung spielt wichtige Rolle im DM-Prozess Systematische Evaluationen erfordern flexible

Mehr

Inhaltsverzeichnis: Definitionen Informationssysteme als Kommunikationssystem Problemlösende Perspektiven Allgemeine System Annäherung Fazit

Inhaltsverzeichnis: Definitionen Informationssysteme als Kommunikationssystem Problemlösende Perspektiven Allgemeine System Annäherung Fazit Informationssysteme Inhaltsverzeichnis: Definitionen Informationssysteme als Kommunikationssystem Problemlösende Perspektiven Allgemeine System Annäherung Fazit Definitionen: Informationen Informationssysteme

Mehr

Übungsblatt LV Künstliche Intelligenz, Data Mining (1), 2014

Übungsblatt LV Künstliche Intelligenz, Data Mining (1), 2014 Übungsblatt LV Künstliche Intelligenz, Data Mining (1), 2014 Aufgabe 1. Data Mining a) Mit welchen Aufgabenstellungen befasst sich Data Mining? b) Was versteht man unter Transparenz einer Wissensrepräsentation?

Mehr

Data Warehouse Definition (1) http://de.wikipedia.org/wiki/data-warehouse

Data Warehouse Definition (1) http://de.wikipedia.org/wiki/data-warehouse Data Warehouse Definition (1) http://de.wikipedia.org/wiki/data-warehouse Ein Data-Warehouse bzw. Datenlager ist eine zentrale Datensammlung (meist eine Datenbank), deren Inhalt sich aus Daten unterschiedlicher

Mehr