Entwicklung einer Entscheidungssystematik für Data- Mining-Verfahren zur Erhöhung der Planungsgüte in der Produktion

Größe: px
Ab Seite anzeigen:

Download "Entwicklung einer Entscheidungssystematik für Data- Mining-Verfahren zur Erhöhung der Planungsgüte in der Produktion"

Transkript

1 Entwicklung einer Entscheidungssystematik für Data- Mining-Verfahren zur Erhöhung der Planungsgüte in der Produktion Vortrag Seminararbeit David Pogorzelski Aachen,

2 Agenda Ziel der Arbeit Stand der Technik Entwicklung einer Entscheidungssystematik Ergebnis Zusammenfassung Seite 3

3 Ziel der Arbeit Übergeordnetes Gesamtziel Erstellung einer Entscheidungsmatrix für potenzielle Data- Mining-Verfahren zur Erhöhung der Planungsgüte in der Produktion Teilziele der Arbeit Erarbeitung geeigneter Vergleichskriterien für Data-Mining-Verfahren Untersuchung bekannter Algorithmen aus dem Clustering und der Klassifikation Bewertung der Algorithmen anhand der hergeleiteten Kriterien Quelle: Seite 4

4 Agenda 1 2 Ziel der Arbeit Stand der Technik Produktionsplanung Data-Mining Entwicklung einer Entscheidungssystematik Ergebnis Zusammenfassung Seite 5

5 Agenda 1 2 Ziel der Arbeit Stand der Technik Produktionsplanung Data-Mining Entwicklung einer Entscheidungssystematik Ergebnis Zusammenfassung Seite 6

6 Produktionsplanung Probleme bei der Produktionsplanung Zufallsereignisse Schlechte Planungsgrundlage Beispiel Bearbeitungszeit Maschinenausfall Krankheit 2 min. Plan Eilaufträge 4 min. Ist Eine hohe Planungsgüte definiert sich als geringe Differenz zwischen Plan- und Ist-Werten Seite 7

7 Agenda 1 2 Ziel der Arbeit Stand der Technik Produktionsplanung Data-Mining Entwicklung einer Entscheidungssystematik Ergebnis Zusammenfassung Seite 8

8 Data Mining 1/2 Data Mining als potenzielles Mittel zur Analyse von Produktionsdaten Statistics Artificial Intelligence Machine Learning Natural Computing Definition Data Mining ist die Anwendung effizienter Algorithmen, die die in einer Datenbank enthaltenen gültigen Muster finden. Data Mining Nutzung historischer Produktionsdaten um z.b. zukünftige Bearbeitungszeiten realistischer prognostizieren zu können. Database systems Durch die riesige Menge an Produktionsdaten, stellt Data Mining ein großes Potenzial dar Quelle: Gorunescu, Data Mining Concecpts and Techniques, 2011 Seite 9

9 Data Mining 2/2 Vorstellung verschiedener Kategorien des Data Minings Clustering Ziel ist die Partitionierung einer Datenmenge in Gruppen Objekte eines Clusters sollen möglichst sein Ausreißer sollen zu keinem Cluster gehören Klassifikation Trainingsobjekte gegeben, die einer Klasse zugeordnet sind Zukünftige Objekte sollen über eine Funktion einer Klasse zugeordnet werden Diese Funktion soll mit Hilfe von Trainingsobjekten gelernt werden f x Quelle: 1),2) Ester M., Sander J., Knowledge Discovery in Databases, 2000 Seite 10

10 Agenda Ziel der Arbeit Stand der Technik Entwicklung einer Entscheidungssystematik Ordnungsrahmen der Entscheidungssystematik Vergleich ausgewählter Algorithmen 4 5 Ergebnis Zusammenfassung Seite 11

11 Agenda Ziel der Arbeit Stand der Technik Entwicklung einer Entscheidungssystematik Ordnungsrahmen der Entscheidungssystematik Vergleich ausgewählter Algorithmen 4 5 Ergebnis Zusammenfassung Seite 12

12 Ordnungsrahmen der Entscheidungssystematik Herleitung der Vergleichskriterien Anforderungen des Produktionsplaners Der Produktionsplaner soll jederzeit ein möglichst realistisches Bild über die zu erwartende Produktionssituation erhalten (kurz- bis mittelfristig) Z.B. möchte er auch wissen wie lange ein Arbeitsplatz für die Bearbeitung eines zukünftigen Auftrags brauchen wird Schnelligkeit Wissen Zuverlässigkeit Schlagwörter Möglichst viele Einflussfaktoren einbeziehen Kriterien für die zu untersuchenden Algorithmen Komplexität Einmaliger Durchlauf Wissen Attribute Anpassungsgrad Ausreißeranfälligkeit gering Ja 100% kategorial gering gering Nutzung der Kriterien zur Bewertung von Data-Mining-Algorithmen Seite 13

13 Agenda Ziel der Arbeit Stand der Technik Entwicklung einer Entscheidungssystematik Ordnungsrahmen der Entscheidungssystematik Vergleich ausgewählter Algorithmen 4 5 Ergebnis Zusammenfassung Seite 14

14 Untersuchung ausgewählter Algorithmen k-means-algorithmus x x x Initialmenge Zufällige Einteilung in k Cluster Berechnung der Centroide Neuzuordnung der Punkte Berechnung der Centroide μ C = (x 1 (C), x 2 C,, x d (C)), wobei x j (C) = 1 n c pεc x p j k-means zeichnet sich durch seine Einfachheit aus Seite 15

15 Untersuchung ausgewählter Algorithmen Komplexität Einmaliger Durchlauf Wissen Erlaubte Attribute Anpassungsgrad Ausreißerunempfindlichkeit k-means O(n) Trifft gar nicht zu / gering / 0% Trifft voll zu / hoch / 100% Seite 16

16 Untersuchung ausgewählter Algorithmen PAM-Algorithmus (Partitioning Around Medoids) Initialmenge Auswahl von k Medoiden (willkürlich) Vertauschung Von Medoid und Nicht-Medoid (paarweise) Berechnung der Kompaktheit und ggf. Vertauschung Maß für die Kompaktheit eines Clusters TD C = dist(p, m c ) p C Maß für die Kompaktheit eines Clusterings k TD = TD(C i ) i=1 Seite 17

17 Untersuchung ausgewählter Algorithmen Komplexität Einmaliger Durchlauf Wissen Erlaubte Attribute Anpassungsgrad Ausreißerunempfindlichkeit k-means O(n) PAM O(n³) kategorial Trifft gar nicht zu / gering / 0% Trifft voll zu / hoch / 100% Seite 18

18 Untersuchung ausgewählter Algorithmen CLARANS-Algorithmus (Clustering Large Applications based on RANdomized Search) Initialmenge Auswahl von k Medoiden (willkürlich) Maß für die Kompaktheit eines Clusters TD C = dist(p, m c ) p C Vertauschung <i Von Medoid und Nicht-Medoid <j (zufällige Auswahl) Berechnung der Kompaktheit und ggf. Vertauschung Maß für die Kompaktheit eines Clusterings k TD = TD(C i ) i=1 Seite 19

19 Untersuchung ausgewählter Algorithmen Komplexität Einmaliger Durchlauf Wissen Erlaubte Attribute Anpassungsgrad Ausreißerunempfindlichkeit k-means O(n) PAM O(n³) kategorial CLARANS O(n²) kategorial Trifft gar nicht zu / gering / 0% Trifft voll zu / hoch / 100% Seite 20

20 Untersuchung ausgewählter Algorithmen DBSCAN-Algorithmus (Density-Based Clustering of Applications with Noise) Kernobjekt In einer Umgebung ε müssen mind. m Punkte liegen Direkte Dichte-Erreichbarkeit B ist direkt dichte-erreichbar von A, wenn gilt A ist ein Kernobjekt B liegt in der Umgebung von A ε Dichte-Verbundenheit A und B sind dichte-verbunden, wenn es ein Objekt C gibt, so dass A und B dichte-erreichbar von C sind A C B Prinzip des Durchhangelns Dichte-Erreichbarkeit B ist dichte-erreichbar von A, wenn gilt A ist über eine Kette von direkt dichteerreichbaren Objekten erreichbar Alle Objekte, die miteinander dichte-verbunden sind, bilden ein Cluster Seite 21

21 Untersuchung ausgewählter Algorithmen Komplexität Einmaliger Durchlauf Wissen Erlaubte Attribute Anpassungsgrad Ausreißerunempfindlichkeit k-means O(n) PAM O(n³) kategorial CLARANS DBSCAN O(n²) O(n) kategorial kategorial Trifft gar nicht zu / gering / 0% Trifft voll zu / hoch / 100% Seite 22

22 Untersuchung ausgewählter Algorithmen k-nearest-neighbor-algorithmus 1 Wahl des Parameters k 2 k nächste Nachbarn des zu klassifizierenden Objekts q betrachten (Ermittlung über Distanzfunktion) 3 Über Mehrheitsentscheid bestimmen zu welcher Klasse q gehört k = 3 k-nearest-neighbor ist ein einfaches und effizientes Verfahren Seite 23

23 Untersuchung ausgewählter Algorithmen Komplexität Einmaliger Durchlauf Wissen Erlaubte Attribute Anpassungsgrad Ausreißerunempfindlichkeit k-means O(n) PAM O(n³) kategorial CLARANS DBSCAN O(n²) O(n) kategorial kategorial f(x) knn O(n) kategorial Trifft gar nicht zu / gering / 0% Trifft voll zu / hoch / 100% Seite 24

24 Untersuchung ausgewählter Algorithmen Künstliche neuronale Netze Ursprung Inspiration aus der Biologie Nachbau menschlicher Neuronen Aufbau Frühwarnsysteme Optimierung Anwendungen Zeitreihenanalyse (Wetter, Aktien ) Mustererkennung (Schrift- und Spracherkennung etc.) Robotik Klassifikation... Ein neuronales Netz wird speziell nach einem Anwendungsfall erstellt Input Layer Hidden Layer Output Layer Seite 25

25 Untersuchung ausgewählter Algorithmen Künstliche neuronale Netze - Prinzip x 1 w 1 x 2 w 2 TLU θ a y y = 1, wenn a θ 0, wenn a < θ Threshold Logic Unit hat nur boolesche Werte als Input Erzeugt nur boolesche Werte als Output Berechnung für die Aktivierung des TLU n a = w i x i i=1 Seite 26

26 Untersuchung ausgewählter Algorithmen Künstliche neuronale Netze x 1 w 1 y x 2 w 2 θ = 0.5 a TLU Training Initialgewichte w 1 und w 2 Input gewünschter Output? Nein? Anpassung der Gewichte: t: gewünschter Output v: Input y: tatsächlicher Output α: Lernrate 0 < α < 1 w w + α t y v Bis der gewünschte Output erreicht ist Schwierigere Netze In vielen Anwendungen sind die Netze wesentlich komplizierter Die Anpassung der Gewichte ist deutlich komplizierter Anwendung von Gradientenverfahren und stetigen Schwellenwertfunktionen Seite 27

27 Untersuchung ausgewählter Algorithmen Komplexität Einmaliger Durchlauf Wissen Erlaubte Attribute Anpassungsgrad Ausreißerunempfindlichkeit k-means O(n) PAM O(n³) kategorial CLARANS DBSCAN O(n²) O(n) kategorial kategorial f(x) knn O(n) kategorial f(x) Künstl. neuronale Netze Abhängig von Netzkomplexität kategorial Trifft gar nicht zu / gering / 0% Trifft voll zu / hoch / 100% Seite 28

28 Agenda Ziel der Arbeit Stand der Technik Entwicklung einer Entscheidungssystematik Ergebnis Zusammenfassung Seite 29

29 Ergebnis Clustering oder Klassifikation? Klassifikationen bringen den erheblichen Vorteil, dass sie nur einmal ausgeführt werden müssen, so dass eine Einordnung neuer Objekte schnell erfolgen kann knn sticht zudem durch seine geringe Komplexität und Einfachheit hervor Auch sind Klassifikatoren recht unempfindlich gegenüber Ausreißern Clustering-Verfahren bieten allerdings mehr Wissen als Klassifikatoren Klassifikatoren erfüllen die Anforderungen Schnelligkeit und Zuverlässigkeit Seite 30

30 Agenda Ziel der Arbeit Stand der Technik Entwicklung einer Entscheidungssystematik Ergebnis Zusammenfassung Seite 31

31 Zusammenfassung + Ausblick Erarbeitung geeigneter Kriterien für den Vergleich von Data-Mining-Algorithmen auf Grundlage von Anforderungen der Produktionsplanung Vergleich ausgewählter Algorithmen aus dem Clustering und der Klassifikation Einordnung der Algorithmen in eine Entscheidungssystematik Ergebnis: Die untersuchten Data-Mining-Verfahren stellen ein nützliches Potenzial für die Verbesserung der Produktionsplanung dar Weiteres Vorgehen: Implementierung geeigneter Verfahren auf Basis der Entwickelten Entscheidungsmatrix zur Steigerung der Planungsgüte in der Produktion Seite 32

32 Herzlichen Dank! David Pogorzelski

Inhaltliche Planung für die Vorlesung

Inhaltliche Planung für die Vorlesung Vorlesung: Künstliche Intelligenz - Mustererkennung - P LS ES S ST ME Künstliche Intelligenz Miao Wang 1 Inhaltliche Planung für die Vorlesung 1) Definition und Geschichte der KI, PROLOG 2) Expertensysteme

Mehr

Exploration und Klassifikation von BigData

Exploration und Klassifikation von BigData Exploration und Klassifikation von BigData Inhalt Einführung Daten Data Mining: Vorbereitungen Clustering Konvexe Hülle Fragen Google: Riesige Datenmengen (2009: Prozessieren von 24 Petabytes pro Tag)

Mehr

Kapitel 5: Clustering

Kapitel 5: Clustering Ludwig Maximilians Universität München Institut für Informatik Lehr- und Forschungseinheit für Datenbanksysteme Skript zur Vorlesung Knowledge Discovery in Databases im Wintersemester 2006/2007 Kapitel

Mehr

Data-Mining: Ausgewählte Verfahren und Werkzeuge

Data-Mining: Ausgewählte Verfahren und Werkzeuge Fakultät Informatik Institut für Angewandte Informatik Lehrstuhl Technische Informationssysteme Data-Mining: Ausgewählte Verfahren und Vortragender: Jia Mu Betreuer: Dipl.-Inf. Denis Stein Dresden, den

Mehr

Einführung in das Data Mining Clustering / Clusteranalyse

Einführung in das Data Mining Clustering / Clusteranalyse Einführung in das Data Mining Clustering / Clusteranalyse Sascha Szott Fachgebiet Informationssysteme HPI Potsdam 21. Mai 2008 Teil I Einführung Clustering / Clusteranalyse Ausgangspunkt: Menge O von Objekten

Mehr

Data Warehousing und Data Mining

Data Warehousing und Data Mining Data Warehousing und Data Mining Clustering Ulf Leser Wissensmanagement in der Bioinformatik Inhalt dieser Vorlesung Einführung Clustergüte Ähnlichkeiten Clustermitte Hierarchisches Clustering Partitionierendes

Mehr

Data Mining mit RapidMiner

Data Mining mit RapidMiner Motivation Data Mining mit RapidMiner CRISP: DM-Prozess besteht aus unterschiedlichen Teilaufgaben Datenvorverarbeitung spielt wichtige Rolle im DM-Prozess Systematische Evaluationen erfordern flexible

Mehr

Data Mining im Einzelhandel Methoden und Werkzeuge

Data Mining im Einzelhandel Methoden und Werkzeuge Fakultät Informatik Institut für Angewandte Informatik Professur Technische Informationssysteme Proseminar Technische Informationssysteme Data Mining im Einzelhandel Methoden und Werkzeuge Betreuer: Dipl.-Ing.

Mehr

Inhalt dieses Kapitels. Ziel des Clustering, Anwendungen, Typen von Clustering-Algorithmen

Inhalt dieses Kapitels. Ziel des Clustering, Anwendungen, Typen von Clustering-Algorithmen 2. Clustering Inhalt dieses Kapitels 3. Einleitung Ziel des Clustering, Anwendungen, Typen von Clustering-Algorithmen 3.2 Partitionierende Verfahren k-means, k-medoid, Expectation Maximization, Initialisierung

Mehr

Data/Information Quality Management

Data/Information Quality Management Data/Information Quality Management Seminar WI/Informationsmanagement im Sommersemester 2002 Markus Berberov, Roman Eder, Peter Gerstbach 11.6.2002 Inhalt! Daten und Datenqualität! Einführung und Definition!

Mehr

Data Mining Anwendungen und Techniken

Data Mining Anwendungen und Techniken Data Mining Anwendungen und Techniken Knut Hinkelmann DFKI GmbH Entdecken von Wissen in banken Wissen Unternehmen sammeln ungeheure mengen enthalten wettbewerbsrelevantes Wissen Ziel: Entdecken dieses

Mehr

Voraussetzung wieder: Datenraum mit Instanzen, mehrere Attribute - kein ausgezeichnetes Zielattribut, keine vorgegebenen Klassen

Voraussetzung wieder: Datenraum mit Instanzen, mehrere Attribute - kein ausgezeichnetes Zielattribut, keine vorgegebenen Klassen 7. Clusteranalyse (= Häufungsanalyse; Clustering-Verfahren) wird der multivariaten Statistik zugeordnet Voraussetzung wieder: Datenraum mit Instanzen, mehrere Attribute - kein ausgezeichnetes Zielattribut,

Mehr

Kapitel ML: I. I. Einführung. Beispiele für Lernaufgaben Spezifikation von Lernproblemen

Kapitel ML: I. I. Einführung. Beispiele für Lernaufgaben Spezifikation von Lernproblemen Kapitel ML: I I. Einführung Beispiele für Lernaufgaben Spezifikation von Lernproblemen ML: I-8 Introduction c STEIN/LETTMANN 2005-2010 Beispiele für Lernaufgaben Autoeinkaufsberater Welche Kriterien liegen

Mehr

DISKUSSIONSBEITRÄGE DER FAKULTÄT FÜR BETRIEBSWIRTSCHAFTSLEHRE MERCATOR SCHOOL OF MANAGEMENT UNIVERSITÄT DUISBURG-ESSEN. Nr. 374

DISKUSSIONSBEITRÄGE DER FAKULTÄT FÜR BETRIEBSWIRTSCHAFTSLEHRE MERCATOR SCHOOL OF MANAGEMENT UNIVERSITÄT DUISBURG-ESSEN. Nr. 374 DISKUSSIONSBEITRÄGE DER FAKULTÄT FÜR BETRIEBSWIRTSCHAFTSLEHRE MERCATOR SCHOOL OF MANAGEMENT UNIVERSITÄT DUISBURG-ESSEN Nr. 374 Eignung von Verfahren der Mustererkennung im Process Mining Sabrina Kohne

Mehr

Datenbanken-Themen im OS "Data Mining" SS 2010

Datenbanken-Themen im OS Data Mining SS 2010 Prof. Dr.-Ing. Thomas Kudraß HTWK Leipzig, FIMN Datenbanken-Themen im OS "Data Mining" SS 2010 Die Vorträge sollten eine Dauer von 60 Minuten (Einzelvortrag) bzw. 45 Minuten (Doppelvortrag) haben. Nachfolgend

Mehr

Einführung in Neuronale Netze

Einführung in Neuronale Netze Wintersemester 2005/2006 VO 181.138 Einführung in die Artificial Intelligence Einführung in Neuronale Netze Oliver Frölich Abteilung für Datenbanken und Artificial Intelligence Institut für Informationssysteme

Mehr

Einführung in Data Mining anhand des Modells CRISP-DM

Einführung in Data Mining anhand des Modells CRISP-DM Einführung in Data Mining anhand des Modells CRISP-DM Seminarvortrag Linnea Passing Seminar, Scientific Programming, FH Aachen Stand: 11.01.2011 Rechen- und Kommunikationszentrum (RZ) Agenda Motivation

Mehr

Datenbanken und Informationssysteme

Datenbanken und Informationssysteme Datenbanken und Informationssysteme Lehrangebot Stefan Conrad Heinrich-Heine-Universität Düsseldorf Institut für Informatik April 2012 Stefan Conrad (HHU) Datenbanken und Informationssysteme April 2012

Mehr

Clustering und Klassifikation

Clustering und Klassifikation Clustering und Klassifikation Matthias Pretzer matthias.pretzer@informatik.uni-oldenburg.de Ferdinand-von-Schill-Str. 3 26131 Oldenburg 5. Februar 2003 Im heutigen Informationszeitalter fallen immer schneller

Mehr

Data Mining - Wiederholung

Data Mining - Wiederholung Data Mining - Wiederholung Norbert Fuhr 9. Juni 2008 Problemstellungen Problemstellungen Daten vs. Information Def. Data Mining Arten von strukturellen Beschreibungen Regeln (Klassifikation, Assoziations-)

Mehr

Proseminar - Data Mining

Proseminar - Data Mining Proseminar - Data Mining SCCS, Fakultät für Informatik Technische Universität München SS 2012, SS 2012 1 Data Mining Pipeline Planung Aufbereitung Modellbildung Auswertung Wir wollen nützliches Wissen

Mehr

2. Datenvorverarbeitung

2. Datenvorverarbeitung Kurzreferat Das Ziel beim Clustering ist es möglichst gleich Datensätze zu finden und diese in Gruppen, sogenannte Cluster zu untergliedern. In dieser Dokumentation werden die Methoden k-means und Fuzzy

Mehr

Data Mining in SAP NetWeaver BI

Data Mining in SAP NetWeaver BI Martin Kießwetter, Dirk Vahl kam p Data Mining in SAP NetWeaver BI Galileo Press Bonn Boston 2.1 Was ist Data Mining? 17 2.2 Data Mining, KDD und Business Intelligence 20 2.3 KDD-Prozessmodelle 22 2.4

Mehr

Data Mining - Clustering. Sven Elvers

Data Mining - Clustering. Sven Elvers Agenda Data Mining Clustering Aktuelle Arbeiten Thesis Outline 2 Agenda Data Mining Clustering Aktuelle Arbeiten Thesis Outline 3 Data Mining Entdecken versteckter Informationen, Muster und Zusammenhänge

Mehr

Präsentation zur Diplomprüfung. Thema der Diplomarbeit:

Präsentation zur Diplomprüfung. Thema der Diplomarbeit: Präsentation zur Diplomprüfung Thema der Diplomarbeit: Analyse der Einsatzmöglichkeiten von Data Mining- Verfahren innerhalb einer Unternehmens - Balanced Scorecard und Entwicklung eines Empfehlungskatalogs.

Mehr

CLARANS. Semesterprojekt im Fach Wissensexktraktion / Data Mining, Hochschule Wismar, Studiengang Multimedia Engineering, Sommersemester 2013

CLARANS. Semesterprojekt im Fach Wissensexktraktion / Data Mining, Hochschule Wismar, Studiengang Multimedia Engineering, Sommersemester 2013 CLARANS Semesterprojekt im Fach Wissensexktraktion / Data Mining, Hochschule Wismar, Studiengang Multimedia Engineering, Sommersemester 2013 Daniel Schmidt Mohamed Ibrahim Sven Lautenschläger Inhaltsverzeichnis

Mehr

Personalisierung. Der Personalisierungsprozess Nutzerdaten erheben aufbereiten auswerten Personalisierung. Data Mining.

Personalisierung. Der Personalisierungsprozess Nutzerdaten erheben aufbereiten auswerten Personalisierung. Data Mining. Personalisierung Personalisierung Thomas Mandl Der Personalisierungsprozess Nutzerdaten erheben aufbereiten auswerten Personalisierung Klassifikation Die Nutzer werden in vorab bestimmte Klassen/Nutzerprofilen

Mehr

3.5 Datenbanktechniken zur Leistungssteigerung. 3. Clustering. 3.5 Datenbanktechniken zur Leistungssteigerung. 3. Clustering. Inhalt dieses Kapitels

3.5 Datenbanktechniken zur Leistungssteigerung. 3. Clustering. 3.5 Datenbanktechniken zur Leistungssteigerung. 3. Clustering. Inhalt dieses Kapitels 3.1 Einleitung 3. Clustering Inhalt dieses Kapitels Ziel des Clustering, Distanzfunktionen, Anwendungen, Typen von Algorithmen 3.2 Partitionierende Verfahren k-means, k-medoid, Expectation Maximization,

Mehr

Domain-independent. independent Duplicate Detection. Vortrag von Marko Pilop & Jens Kleine. SE Data Cleansing

Domain-independent. independent Duplicate Detection. Vortrag von Marko Pilop & Jens Kleine. SE Data Cleansing SE Data Cleansing Domain-independent independent Duplicate Detection Vortrag von Marko Pilop & Jens Kleine http://www.informatik.hu-berlin.de/~pilop/didd.pdf {pilop jkleine}@informatik.hu-berlin.de 1.0

Mehr

GMDS-Tagung 2006 Bioinformatik 1. Assessing the stability of unsupervised learning results in small-sample-size problems

GMDS-Tagung 2006 Bioinformatik 1. Assessing the stability of unsupervised learning results in small-sample-size problems GMDS-Tagung 2006 Bioinformatik 1 Assessing the stability of unsupervised learning results in small-sample-size problems Ulrich Möller Email: Ulrich.Moeller@hki-jena.de Leibniz Institute for Natural Product

Mehr

Proseminar - Data Mining

Proseminar - Data Mining Proseminar - Data Mining SCCS, Fakultät für Informatik Technische Universität München SS 2014, SS 2014 1 Data Mining: Beispiele (1) Hausnummererkennung (Klassifikation) Source: http://arxiv.org/abs/1312.6082,

Mehr

Data Mining - Marketing-Schlagwort oder ernstzunehmende Innovation?

Data Mining - Marketing-Schlagwort oder ernstzunehmende Innovation? 1. Konferenz der A Benutzer KFE in Forschung und Entwicklung Data Mining - Marketing-chlagwort oder ernstzunehmende Innovation? Hans-Peter Höschel,, Heidelberg 1. Konferenz der A Benutzer KFE in Forschung

Mehr

MS SQL Server 2012 (4)

MS SQL Server 2012 (4) MS SQL Server 2012 (4) Data Mining, Analyse und multivariate Verfahren Marco Skulschus Jan Tittel Marcus Wiederstein Webseite zum Buch: http://vvwvv.comelio-medien.com/buch-kataiog/ms sql_server/ms sql

Mehr

Knowledge Discovery in Datenbanken I (IN5042)

Knowledge Discovery in Datenbanken I (IN5042) Knowledge Discovery in Datenbanken I (IN5042) Titel Knowledge Discovery in Databases I Typ Vorlesung mit Übung Credits 6 ECTS Lehrform/SWS 3V + 2Ü Sprache Deutsch Modulniveau Master Arbeitsaufwand Präsenzstunden

Mehr

Konzepte der AI: Maschinelles Lernen

Konzepte der AI: Maschinelles Lernen Konzepte der AI: Maschinelles Lernen Nysret Musliu, Wolfgang Slany Abteilung für Datenbanken und Artificial Intelligence Institut für Informationssysteme, TU-Wien Übersicht Was ist Lernen? Wozu maschinelles

Mehr

Fachgruppe Statistik, Risikoanalyse & Computing. STAT672 Data Mining. Sommersemester 2007. Prof. Dr. R. D. Reiß

Fachgruppe Statistik, Risikoanalyse & Computing. STAT672 Data Mining. Sommersemester 2007. Prof. Dr. R. D. Reiß Fachgruppe Statistik, Risikoanalyse & Computing STAT672 Data Mining Sommersemester 2007 Prof. Dr. R. D. Reiß Überblick Data Mining Begrifflichkeit Unter Data Mining versteht man die Computergestützte Suche

Mehr

Data Warehouse Definition (1) http://de.wikipedia.org/wiki/data-warehouse

Data Warehouse Definition (1) http://de.wikipedia.org/wiki/data-warehouse Data Warehouse Definition (1) http://de.wikipedia.org/wiki/data-warehouse Ein Data-Warehouse bzw. Datenlager ist eine zentrale Datensammlung (meist eine Datenbank), deren Inhalt sich aus Daten unterschiedlicher

Mehr

Data Warehousing und Data Mining

Data Warehousing und Data Mining Data Warehousing und Data Mining Clustering Ulf Leser Wissensmanagement in der Bioinformatik Mehr Beobachtungen Sunny Hot High False Yes Sunny Hot High False No Sunny Hot High True No.. Ulf Leser: DWH

Mehr

Text-Mining: Einführung

Text-Mining: Einführung Text-Mining: Einführung Claes Neuefeind Fabian Steeg 22. April 2010 Organisatorisches Was ist Text-Mining? Definitionen Anwendungsbeispiele Textuelle Daten Aufgaben u. Teilbereiche Literatur Kontakt Sprechstunde:

Mehr

Spatial Data Mining. Thomas Gäbler 04IN1

Spatial Data Mining. Thomas Gäbler 04IN1 Spatial Data Mining 1. Motivation 2. Räumliche Datenbanken 2.1 Unterschied zum klassischen Data Mining 2.2 topologische Beziehungen 2.3 metrische Beziehungen 2.4 gerichtete Beziehungen 3. Spatial Data

Mehr

WEKA A Machine Learning Interface for Data Mining

WEKA A Machine Learning Interface for Data Mining WEKA A Machine Learning Interface for Data Mining Frank Eibe, Mark Hall, Geoffrey Holmes, Richard Kirkby, Bernhard Pfahringer, Ian H. Witten Reinhard Klaus Losse Künstliche Intelligenz II WS 2009/2010

Mehr

Clustering Seminar für Statistik

Clustering Seminar für Statistik Clustering Markus Kalisch 03.12.2014 1 Ziel von Clustering Finde Gruppen, sodas Elemente innerhalb der gleichen Gruppe möglichst ähnlich sind und Elemente von verschiedenen Gruppen möglichst verschieden

Mehr

Tiefgreifende Prozessverbesserung und Wissensmanagement durch Data Mining

Tiefgreifende Prozessverbesserung und Wissensmanagement durch Data Mining Tiefgreifende Prozessverbesserung und Wissensmanagement durch Data Mining Ausgangssituation Kaizen Data Mining ISO 9001 Wenn andere Methoden an ihre Grenzen stoßen Es gibt unzählige Methoden, die Abläufe

Mehr

6.6 Vorlesung: Von OLAP zu Mining

6.6 Vorlesung: Von OLAP zu Mining 6.6 Vorlesung: Von OLAP zu Mining Definition des Begriffs Data Mining. Wichtige Data Mining-Problemstellungen, Zusammenhang zu Data Warehousing,. OHO - 1 Definition Data Mining Menge von Techniken zum

Mehr

Data Mining und maschinelles Lernen

Data Mining und maschinelles Lernen Data Mining und maschinelles Lernen Einführung und Anwendung mit WEKA Caren Brinckmann 16. August 2000 http://www.coli.uni-sb.de/~cabr/vortraege/ml.pdf http://www.cs.waikato.ac.nz/ml/weka/ Inhalt Einführung:

Mehr

Data Mining (ehem. Entscheidungsunterstützungssysteme)

Data Mining (ehem. Entscheidungsunterstützungssysteme) Data Mining (ehem. Entscheidungsunterstützungssysteme) Melanie Pfoh Anja Tetzner Christian Schieder Übung WS 2014/15 AGENDA TEIL 1 Aufgabe 1 (Wiederholung OPAL / Vorlesungsinhalte) ENTSCHEIDUNG UND ENTSCHEIDUNGSTHEORIE

Mehr

2. Microsoft Innovationstag Nord Integrierte Lösungen in der Öffentlichen Verwaltung

2. Microsoft Innovationstag Nord Integrierte Lösungen in der Öffentlichen Verwaltung 2. Microsoft Innovationstag Nord Integrierte Lösungen in der Öffentlichen Verwaltung Reporting, Analyse und Data Mining André Henkel, initions AG 22. und 23. Oktober 2013 in Hamburg

Mehr

Neuronale Netze (I) Biologisches Neuronales Netz

Neuronale Netze (I) Biologisches Neuronales Netz Neuronale Netze (I) Biologisches Neuronales Netz Im menschlichen Gehirn ist ein Neuron mit bis zu 20.000 anderen Neuronen verbunden. Milliarden von Neuronen beteiligen sich simultan an der Verarbeitung

Mehr

Was bisher geschah Künstliche Neuronen: Mathematisches Modell und Funktionen: Eingabe-, Aktivierungs- Ausgabefunktion Boolesche oder reelle Ein-und

Was bisher geschah Künstliche Neuronen: Mathematisches Modell und Funktionen: Eingabe-, Aktivierungs- Ausgabefunktion Boolesche oder reelle Ein-und Was bisher geschah Künstliche Neuronen: Mathematisches Modell und Funktionen: Eingabe-, Aktivierungs- Ausgabefunktion Boolesche oder reelle Ein-und Ausgaben Aktivierungsfunktionen: Schwellwertfunktion

Mehr

Techniken zur Analyse von Logdaten

Techniken zur Analyse von Logdaten Techniken zur Analyse von Logdaten Yevgen Mexin Institut für Informatik, Fakultät EIM Prof. Dr. Kleine Büning, Dr. Anderka Einleitung Logs Protokolle Arbeitsprozess Erfolgreich erfüllte Aufgaben Entstehende

Mehr

3. Clustering. 3. Clustering. 3.5 Datenbanktechniken zur Leistungssteigerung. 3.5 Datenbanktechniken zur Leistungssteigerung. Inhalt dieses Kapitels

3. Clustering. 3. Clustering. 3.5 Datenbanktechniken zur Leistungssteigerung. 3.5 Datenbanktechniken zur Leistungssteigerung. Inhalt dieses Kapitels 3 Einleitung 3 Clustering Inhalt dieses Kapitels Ziel des Clustering, Distanzfunktionen, Anwendungen, Typen von Algorithmen 32 Partitionierende Verfahren k-means, k-medoid, Expectation Maximization, Initialisierung

Mehr

Seminar Business Intelligence Teil II. Data Mining & Knowledge Discovery

Seminar Business Intelligence Teil II. Data Mining & Knowledge Discovery Seminar Business Intelligence Teil II Data Mining & Knowledge Discovery Was ist Data Mining? Sabine Queckbörner Was ist Data Mining? Data Mining Was ist Data Mining? Nach welchen Mustern wird gesucht?

Mehr

Data-Mining und Knowledge Discovery in Databases (KDD) Ein Überblick

Data-Mining und Knowledge Discovery in Databases (KDD) Ein Überblick Institut für Angewandte Informatik Professur für Technische Informationssysteme Fakultätsname XYZ Fachrichtung XYZ Institutsname XYZ, Professur XYZ Data-Mining und Knowledge Discovery in Databases (KDD)

Mehr

Prüfungsplan Master of Science in Wirtschaftsinformatik

Prüfungsplan Master of Science in Wirtschaftsinformatik Prüfungsplan Master of Science in Wirtschaftsinformatik Modul Art Creditpunkte Schwerpunkt Very Large Business Applications Module aus dem Bereich Wirtschaftsinformatik SWS Empfohlenes Semester Prüfungsart

Mehr

Industrie 4.0 und Smart Data

Industrie 4.0 und Smart Data Industrie 4.0 und Smart Data Herausforderungen für die IT-Infrastruktur bei der Auswertung großer heterogener Datenmengen Richard Göbel Inhalt Industrie 4.0 - Was ist das? Was ist neu? Herausforderungen

Mehr

Erkennung Sequenzieller Muster Algorithmen und Anwendungen

Erkennung Sequenzieller Muster Algorithmen und Anwendungen Achim Eisele, Thema 1.4.3: Sequenzielle Muster 1 FernUniversität in Hagen Seminar 01912 im Sommersemester 2008 Erkennung Sequenzieller Muster Algorithmen und Anwendungen Thema 1.4.3: Sequenzielle Muster

Mehr

Data Mining in der Cloud

Data Mining in der Cloud Data Mining in der Cloud von Jan-Christoph Meier Hamburg, 21.06.2012 1 Ablauf Einführung Verwandte Arbeiten Fazit / Ausblick Literatur 2 Ablauf Einführung Verwandte Arbeiten Fazit / Ausblick Literatur

Mehr

zur Erlangung des akademischen Grades Mag.rer.soc.oec. eingereicht von

zur Erlangung des akademischen Grades Mag.rer.soc.oec. eingereicht von KOMBINIERTES DATA MINING KLASSIFIKATION UNTER VERWENDUNG VON DURCH CLUSTERING GEWONNENEN HILFSINFORMATIONEN DIPLOMARBEIT zur Erlangung des akademischen Grades Mag.rer.soc.oec. eingereicht von MARKUS HUMER

Mehr

Proseminar - Data Mining

Proseminar - Data Mining Vorbesprechung Proseminar - Data Mining SCCS, Fakultät für Informatik Technische Universität München SS 2015 Vorbesprechung, SS 2015 1 Data Mining: Beispiele (1) Hausnummererkennung (Klassifikation) Source:

Mehr

Herzlich Willkommen. Spielstrategien. gehalten von Nils Böckmann

Herzlich Willkommen. Spielstrategien. gehalten von Nils Böckmann Herzlich Willkommen Spielstrategien gehalten von Nils Böckmann Agenda 1. Einführung 2. Problemstellung 3. Abgrenzung 4. Zielstellung / grober Überblick 5. Vorstellen der Konzepte 1. Umgebungslogik 2. Spielbäume

Mehr

Clustern. Teile nicht kategorisierte Beispiele in disjunkte Untermengen, so genannte Cluster, ein, so dass:

Clustern. Teile nicht kategorisierte Beispiele in disjunkte Untermengen, so genannte Cluster, ein, so dass: Text-Clustern 1 Clustern Teile nicht kategorisierte Beispiele in disjunkte Untermengen, so genannte Cluster, ein, so dass: Beispiele innerhalb eines Clusters sich sehr ähnlich Beispiele in verschiedenen

Mehr

Visualisierung der Imperfektion in multidimensionalen Daten

Visualisierung der Imperfektion in multidimensionalen Daten Visualisierung der Imperfektion in multidimensionalen Daten Horst Fortner Imperfektion und erweiterte Konzepte im Data Warehousing Betreuer: Heiko Schepperle 2 Begriffe (1) Visualisierung [Wikipedia] abstrakte

Mehr

Seminar Komplexe Objekte in Datenbanken

Seminar Komplexe Objekte in Datenbanken Seminar Komplexe Objekte in Datenbanken OPTICS: Ordering Points To Identify the Clustering Structure Lehrstuhl für Informatik IX - Univ.-Prof. Dr. Thomas Seidl, RWTH-Aachen http://www-i9.informatik.rwth-aachen.de

Mehr

Maschinelles Lernen: Neuronale Netze. Ideen der Informatik Kurt Mehlhorn

Maschinelles Lernen: Neuronale Netze. Ideen der Informatik Kurt Mehlhorn Maschinelles Lernen: Neuronale Netze Ideen der Informatik Kurt Mehlhorn 16. Januar 2014 Übersicht Stand der Kunst im Bilderverstehen: Klassifizieren und Suchen Was ist ein Bild in Rohform? Biologische

Mehr

Masterarbeit. im Studiengang Informatik. Kombinationen von Data Mining-Verfahren: Analyse und Automatisierung. Ulf Mewe Matrikel.-Nr.

Masterarbeit. im Studiengang Informatik. Kombinationen von Data Mining-Verfahren: Analyse und Automatisierung. Ulf Mewe Matrikel.-Nr. LEIBNIZ UNIVERSITÄT HANNOVER FAKULTÄT FÜR ELEKTROTECHNIK UND INFORMATIK INSTITUT FÜR PRAKTISCHE INFORMATIK FACHGEBIET DATENBANKEN UND INFORMATIONSSYSTEME Masterarbeit im Studiengang Informatik Kombinationen

Mehr

Grid-Produkte Marktüberblick, Anspruch Wirklichkeit

Grid-Produkte Marktüberblick, Anspruch Wirklichkeit Grid-Produkte Marktüberblick, Anspruch Wirklichkeit Frank Itschert betreut von Dr. Hans-Peter Steiert Gliederung 1. Marktüberblick 2. Grid in der Industrie der Versuch einer Definition 3. Grid Kategorien

Mehr

Universität Duisburg-Essen, Standort Duisburg Institut für Informatik und interaktive Systeme Fachgebiet Informationssysteme

Universität Duisburg-Essen, Standort Duisburg Institut für Informatik und interaktive Systeme Fachgebiet Informationssysteme Universität Duisburg-Essen, Standort Duisburg Institut für Informatik und interaktive Systeme Fachgebiet Informationssysteme Studienprojekt Invisible Web (Dipl.-Inform. Gudrun Fischer - WS 2003/04) Blockseminar

Mehr

Innovationen in Prognoseverfahren und deren Anwendung

Innovationen in Prognoseverfahren und deren Anwendung AG Prognoseverfahren der GOR Innovationen in Prognoseverfahren und deren Anwendung Prof. em. Dr. Klaus Spicher, Iserlohn Ingoldstadt, 8./9. Juni 2015 1 Hinweis /Disclaimer Alle im Vortrag verwendeten Daten

Mehr

Fragenkatalog zur Vorlesung "Grundlagen des Data Mining" (WS 2006/07)

Fragenkatalog zur Vorlesung Grundlagen des Data Mining (WS 2006/07) Fragenkatalog zur Vorlesung "Grundlagen des Data Mining" (WS 2006/07) 1. Grenzen Sie die Begriffe "Daten" und "Wissen" mit je 3 charakteristischen Eigenschaften gegeander ab. 2. Nennen Sie vier verschiedene

Mehr

Master Logistik. Modultitel / Bezeichnung der Lehrveranstaltung Vertiefungsmodul Verfahren und IT-Systeme 1-3. Anzahl der SWS.

Master Logistik. Modultitel / Bezeichnung der Lehrveranstaltung Vertiefungsmodul Verfahren und IT-Systeme 1-3. Anzahl der SWS. Modulnummer 8 a 8 c Modultitel / Bezeichnung der Lehrveranstaltung Vertiefungsmodul Verfahren und IT-Systeme 1-3 Kurzbezeichnung Semeste Anzahl der SWS Häufigkeit des - r 12 Angebots 1 oder 2 jedes Semester/jedes

Mehr

Wärmebedarfsprognose für Einfamilienhaushalte auf Basis von Künstlichen Neuronalen Netzen

Wärmebedarfsprognose für Einfamilienhaushalte auf Basis von Künstlichen Neuronalen Netzen Wärmebedarfsprognose für Einfamilienhaushalte auf Basis von Künstlichen Neuronalen Netzen Internationale Energiewirtschaftstagung Wien - 12.02.2015 Maike Hasselmann, Simon Döing Einführung Wärmeversorgungsanlagen

Mehr

Detecting Near Duplicates for Web Crawling

Detecting Near Duplicates for Web Crawling Detecting Near Duplicates for Web Crawling Gurmeet Singh Manku et al., WWW 2007* * 16th international conference on World Wide Web Detecting Near Duplicates for Web Crawling Finde near duplicates in großen

Mehr

Ermittlung von Assoziationsregeln aus großen Datenmengen. Zielsetzung

Ermittlung von Assoziationsregeln aus großen Datenmengen. Zielsetzung Ermittlung von Assoziationsregeln aus großen Datenmengen Zielsetzung Entscheidungsträger verwenden heutzutage immer häufiger moderne Technologien zur Lösung betriebswirtschaftlicher Problemstellungen.

Mehr

Produktionsbasiertes Energiemanagement in der Lebensmittelindustrie

Produktionsbasiertes Energiemanagement in der Lebensmittelindustrie Produktionsbasiertes Energiemanagement in der Lebensmittelindustrie Ansätze und Ergebnisse aus einem Forschungsprojekt, aufbereitet für die Lehrstuhl für Lebensmittelverpackungstechnik, Lehrstuhl für mathematische

Mehr

Prognose von Ressourcenbedarfen zur langfristigen Prozessoptimierung

Prognose von Ressourcenbedarfen zur langfristigen Prozessoptimierung ibi research Seite 1 Prognose von Ressourcenbedarfen zur langfristigen Prozessoptimierung Christian Ritter ibi research an der Universität Regensburg GmbH Competence Center Business Process and Quality

Mehr

Seminar Visual Analytics and Visual Data Mining

Seminar Visual Analytics and Visual Data Mining Seminar Visual Analytics and Visual Data Mining Dozenten:, AG Visual Computing Steffen Oeltze, AG Visualisierung Organisatorisches Seminar für Diplom und Bachelor-Studenten (max. 18) (leider nicht für

Mehr

Portfoliomanagement Universität Wien

Portfoliomanagement Universität Wien Portfoliomanagement Universität Wien MSc Harald Peterka, DI Bernhard Herzog 24.01.2012 http://rrm.univie.ac.at/ Agenda Ausgangssituation Ziele Projektteam und Vorgehensweise Definition der Bewertungskriterien

Mehr

Anwendung der Predictive Analytics

Anwendung der Predictive Analytics TDWI Konferenz mit BARC@TDWI Track 2014 München, 23. 25. Juni 2014 Anwendung der Predictive Analytics Prof. Dr. Carsten Felden Dipl. Wirt. Inf. Claudia Koschtial Technische Universität Bergakademie Freiberg

Mehr

Part I Conceptualization and Definition of Evolutions of Economies in Four General Equilibrium Frameworks

Part I Conceptualization and Definition of Evolutions of Economies in Four General Equilibrium Frameworks Contents 1 General Introduction 1 2 Notations and Mathematical Preliminaries 13 Part I Conceptualization and Definition of Evolutions of Economies in Four General Equilibrium Frameworks 3 Introduction

Mehr

Anwendung der Business Analytics

Anwendung der Business Analytics Anwendung der Business Analytics TDWI 2013 München Prof. Dr. Carsten Felden Dipl.-Wirt.-Inf. Claudia Koschtial Technische Universität Bergakademie Freiberg (Sachsen) Institut für Wirtschaftsinformatik

Mehr

Knowledge Discovery. Lösungsblatt 1

Knowledge Discovery. Lösungsblatt 1 Universität Kassel Fachbereich Mathematik/nformatik Fachgebiet Wissensverarbeitung Hertie-Stiftungslehrstuhl Wilhelmshöher Allee 73 34121 Kassel Email: hotho@cs.uni-kassel.de Tel.: ++49 561 804-6252 Dr.

Mehr

Einführung in die Wissensverarbeitung und Data Mining

Einführung in die Wissensverarbeitung und Data Mining Einführung in die Wissensverarbeitung und Data Mining Peter Becker FH Bonn-Rhein-Sieg Fachbereich Angewandte Informatik!" $# Vorlesung Wintersemester 2001/02 1. Einführung Vorbemerkungen 1 Einführung Vorbemerkungen

Mehr

Kapitel 4: Data Mining

Kapitel 4: Data Mining LUDWIG- MAXIMILIANS- UNIVERSITY MUNICH DEPARTMENT INSTITUTE FOR INFORMATICS Skript zur Vorlesung: Einführung in die Informatik: Systeme und Anwendungen Sommersemester 2013 Kapitel 4: Data Mining i Vorlesung:

Mehr

Bioinformatik I (Einführung)

Bioinformatik I (Einführung) Kay Diederichs, Sommersemester 2015 Bioinformatik I (Einführung) Algorithmen Sequenzen Strukturen PDFs unter http://strucbio.biologie.unikonstanz.de/~dikay/bioinformatik/ Klausur: Fr 17.7. 10:00-11:00

Mehr

Data Mining: Klassifikations- und Clusteringverfahren

Data Mining: Klassifikations- und Clusteringverfahren Westfälische Wilhelms-Universität Münster Data Mining: Klassifikations- und Clusteringverfahren Ausarbeitung im Rahmen des Projektseminars CRM für Finanzdienstleister im Fachgebiet Wirtschaftsinformatik

Mehr

Kapitel 7: Data Mining in großen Datensammlungen

Kapitel 7: Data Mining in großen Datensammlungen Ludwig Maximilians Universität München Institut für Informatik Lehr- und Forschungseinheit für Datenbanksysteme Skript zur Vorlesung Knowledge Discovery in Databases II im Wintersemester 2013/2014 Kapitel

Mehr

Methoden zur Datenanalyse

Methoden zur Datenanalyse Methoden zur Datenanalyse Inhaltsverzeichnis 1 Übersicht 2 1.1 Seite 1................................. 2 2 Statistische Schätz- und Testmethoden 3 2.1 Seite 1................................. 3 3 Methoden

Mehr

Entscheidungsunterstützende Systeme

Entscheidungsunterstützende Systeme Entscheidungsunterstützende Systeme (WS 015/016) Klaus Berberich (klaus.berberich@htwsaar.de) Rainer Lenz (rainer.lenz@htwsaar.de) 0. Organisatorisches Dozenten Klaus Berberich (klaus.berberich@htwsaar.de)

Mehr

Management Support Systeme

Management Support Systeme Management Support Systeme WS 24-25 4.-6. Uhr PD Dr. Peter Gluchowski Folie Gliederung MSS WS 4/5. Einführung Management Support Systeme: Informationssysteme zur Unterstützung betrieblicher Fach- und Führungskräfte

Mehr

Vorlesungsplan. Von Naïve Bayes zu Bayesischen Netzwerk- Klassifikatoren. Naïve Bayes. Bayesische Netzwerke

Vorlesungsplan. Von Naïve Bayes zu Bayesischen Netzwerk- Klassifikatoren. Naïve Bayes. Bayesische Netzwerke Vorlesungsplan 17.10. Einleitung 24.10. Ein- und Ausgabe 31.10. Reformationstag, Einfache Regeln 7.11. Naïve Bayes, Entscheidungsbäume 14.11. Entscheidungsregeln, Assoziationsregeln 21.11. Lineare Modelle,

Mehr

Masterarbeit. im Studiengang Informatik. Analyse und Erweiterung von Methoden des Data Mining in räumlichen Datenbanken

Masterarbeit. im Studiengang Informatik. Analyse und Erweiterung von Methoden des Data Mining in räumlichen Datenbanken LEIBNIZ UNIVERSITÄT HANNOVER FAKULTÄT FÜR ELEKTROTECHNIK UND INFORMATIK INSTITUT FÜR PRAKTISCHE INFORMATIK FACHGEBIET DATENBANKEN UND INFORMATIONSSYSTEME Masterarbeit im Studiengang Informatik Analyse

Mehr

B I D D I G I T A L E T B A H N. Deutsche Bahn und Big Data

B I D D I G I T A L E T B A H N. Deutsche Bahn und Big Data Platzhalter für Titelbild Hier können Sie Bilder aus der Mediathek einfügen! Placeholder for title picture You can insert here pictures from the Mediathek! Deutsche Bahn und Big Data B I D D I G I T A

Mehr

Semestralklausur zur Vorlesung. Web Mining. Prof. J. Fürnkranz Technische Universität Darmstadt Sommersemester 2004 Termin: 22. 7.

Semestralklausur zur Vorlesung. Web Mining. Prof. J. Fürnkranz Technische Universität Darmstadt Sommersemester 2004 Termin: 22. 7. Semestralklausur zur Vorlesung Web Mining Prof. J. Fürnkranz Technische Universität Darmstadt Sommersemester 2004 Termin: 22. 7. 2004 Name: Vorname: Matrikelnummer: Fachrichtung: Punkte: (1).... (2)....

Mehr

Large Scale Data Management

Large Scale Data Management Large Scale Data Management Beirat für Informationsgesellschaft / GOING LOCAL Wien, 21. November 2011 Prof. Dr. Wolrad Rommel FTW Forschungszentrum Telekommunikation Wien rommel@ftw.at Gartner's 2011 Hype

Mehr

Business Intelligence. Business Intelligence Seminar, WS 2007/08

Business Intelligence. Business Intelligence Seminar, WS 2007/08 Business Intelligence Seminar, WS 2007/08 Prof. Dr. Knut Hinkelmann Fachhochschule Nordwestschweiz knut.hinkelmann@fhnw.ch Business Intelligence Entscheidungsorientierte Sammlung, Aufbereitung und Darstellung

Mehr

9 Resümee. Resümee 216

9 Resümee. Resümee 216 Resümee 216 9 Resümee In der vorliegenden Arbeit werden verschiedene Methoden der Datenreduktion auf ihre Leistungsfähigkeit im sozialwissenschaftlichstatistischen Umfeld anhand eines konkreten Anwendungsfalls

Mehr

Informationsflut bewältigen - Textmining in der Praxis

Informationsflut bewältigen - Textmining in der Praxis Informationsflut bewältigen - Textmining in der Praxis Christiane Theusinger Business Unit Data Mining & CRM Solutions SAS Deutschland Ulrich Reincke Manager Business Data Mining Solutions SAS Deutschland

Mehr