Projekt-INF Folie 1

Ähnliche Dokumente
WEKA A Machine Learning Interface for Data Mining

Realtime Daten-Rückschreibung in Tableau mit der Extensions API //

Machine Learning Tutorial

Mathematische Grundlagen III

Data Mining Cup deck using PDA or similar devices. Wissensextraktion Multimedia Engineering

Entwicklung einer Entscheidungssystematik für Data- Mining-Verfahren zur Erhöhung der Planungsgüte in der Produktion

Vladislav Ladyzhenskiy, Sebastian Staudenmaier, und Mohsen Zarei

Einführung in das Maschinelle Lernen I

Android-Entwicklung und Integration in verschiedene Umgebungen. Rudolf Kasper CEO mission-webstyle ohg

Teil VIII. Weiterführende Veranstaltungen im FG Wissensverarbeitung

Folien zu Data Mining von I. H. Witten und E. Frank. übersetzt von N. Fuhr

Data Mining mit RapidMiner. Fakultät Informatik Lehrstuhl für Künstliche Intelligenz

(Software) Architektur der Dinge. Roland Graf / Simon Kranzer IKT-Forum 2016 I(o)T for Industry - Von IT zu IoT

INTELLIGENTE DATENANALYSE IN MATLAB

Maschinelles Lernen und Data Mining

Vergleich von SVM und Regel- und Entscheidungsbaum-Lernern

ML-Werkzeuge und ihre Anwendung

Data Mining - Wiederholung

Stand der Entwicklung von Shibboleth 2

Bachelorarbeit Erkennung von Fließtext in PDF-Dokumenten

Clustering 2010/06/11 Sebastian Koch 1

Methoden zur Cluster - Analyse

Personalisierung internetbasierter Handelsszenarien. Matthias Pretzer

Linux I II III Res WN/TT NLTK XML XLE I II Weka E. Freitag. 9 XLE Transfer. 10 Weka. Ressourcen-Vorkurs

Klassifikation und Ähnlichkeitssuche

Entwurf und Prototypische Implementierung einer Data Mashup Plattform. Abschlussvortrag Projekt-INF

INTELLIGENTE DATENANALYSE IN MATLAB. Einführungsveranstaltung

Business Breakfast im Café Landtmann. 22. November 2016

Dokument Klassifikation. Thomas Uhrig: Data-Mining SS10

Nutzung maschinellen Lernens zur Extraktion von Paragraphen aus PDF-Dokumenten

Mustererkennung. Übersicht. Unüberwachtes Lernen. (Un-) Überwachtes Lernen Clustering im Allgemeinen k-means-verfahren Gaussian-Mixture Modelle

Business Intelligence & Machine Learning

Exploration und Klassifikation von BigData

Mail Integration Solution White Paper

WebForms ohne Oracle Application Server

Clustering. Ausarbeitung von Michael Speckner. Proseminar Data Mining

Vorhersage von nicht-funktionalen Feature-Interaktionen

Data-Mining: Ausgewählte Verfahren und Werkzeuge

LIVIVO: Das neue ZB MED-Suchportal für Lebenswissenschaften Jana Pössel. AGMB-Tagung Basel, Seite

Einführung in Google Web Toolkit

dacore Datenbanksysteme AG Neue Konzepte zur Optimierung der Auslastungsplanung und Big Data im Informationsmanagement

Apriori-Algorithmus zur Entdeckung von Assoziationsregeln

Maschinelles Lernen zur Hautkrebsvorhersage

BIG DATA IM RETAIL-SEKTOR AM BEISPIEL KASSENBONDATEN BUSINESS ANALYTICS DAY

Inhalt. 6.1 Motivation. 6.2 Klassifikation. 6.3 Clusteranalyse. 6.4 Asszoziationsanalyse. Datenbanken & Informationssysteme / Kapitel 6: Data Mining

Jens Schmidt Senior Member Technical Staff

Echtzeitfähige Algorithmen für markerloses Tracking und Umfelderkennung , Dr.-Ing. Steffen Herbort, A.R.T. GmbH

AMA. Applied Machine Learning Academy. Prof. Wolfgang Nejdl

Anwendung der Roblet -Tec hnol ogie

Eine Untersuchung der Funktionen des Apache Wicket Webframeworks

Werkzeugunterstützung für UML Profiles. Verteidigung des Großen Belegs Andreas Pleuß

Bertrandt Ingenieurbüro GmbH Maschinelles Lernen für Autonomes Fahren

Mustererkennung und Klassifikation

Weblogic Server - Administration für Umsteiger

SEMINAR KLASSIFIKATION & CLUSTERING EINFÜHRUNG. Stefan Langer CIS Universität München Wintersemester 2016/17

Inhaltliche Planung für die Vorlesung

Sicherheitsaspekte in e Learning Umgebungen unter Berücksichtigung digitaler Signaturkarten

Data Mining und Maschinelles Lernen Lösungsvorschlag für das 7. Übungsblatt

Studierende, die diese Vorlesung hören, haben sich auch für folgende Lehrveranstaltungen interessiert:

Herzlich willkommen DevDay 2016 Performance Profiling mit JProfiler

Data Mining und Maschinelles Lernen Lösungsvorschlag für das 1. Übungsblatt

Projektgruppe. Text Labeling mit Sequenzmodellen

Übersicht. A. Hinneburg, Web Data Mining MLU Halle-Wittenberg, SS 2007

Klassifikation von Textabschnitten

Bayes sches Lernen: Übersicht

Mit PL/SQL auf s ipad

Vergleich der Voice Assistenten

DicomStar. DicomStar. Dateien. True IT Solutions For You

VDMA RETROFIT DIE VOR- UND NACHTEILE VON "EDGE COMPUTING" UND "CLOUD-PLATTFORMEN"

Inhalt. 4.1 Motivation. 4.2 Evaluation. 4.3 Logistische Regression. 4.4 k-nächste Nachbarn. 4.5 Naïve Bayes. 4.6 Entscheidungsbäume

VAADIN, SPRING BOOT & REST

Masterkurs Verteilte betriebliche Informationssysteme

Universität Potsdam Institut für Informatik Lehrstuhl Maschinelles Lernen. Tobias Scheffer Christoph Sawade

Entwicklungstand der GUI

Ideen und Konzepte der Informatik. Maschinelles Lernen. Kurt Mehlhorn

Anleitung zur Integration der /data.mill API in SAP Java Applikationen

Tomcat Konfiguration und Administration

Text-Mining: Klassifikation I - Naive Bayes vs. Rocchio

Data Mining und maschinelles Lernen

Node.js Einführung Manuel Hart

Maschinelles Lernen: Symbolische Ansätze

Fakultät für Informatik Übung zu Kognitive Systeme Sommersemester 2016

SAS Text Analytics findet Zusammenhänge in Texten Ergebnisse eines Selbstversuchs

AW2. related work. Benedikt Johannsen INF-M2 Anwendung 2 - Sommersemester Juni 2010

Verteilte Web-Anwendungen mit Ruby. Ruben Schempp Anwendungen

Was ist neu in der SQS-TEST /Professional Suite

Bayes sches Lernen: Übersicht

Gold schürfen im Marketing mit Data Science

Profitieren Sie von einer offenen und flexiblen Clouddienstplattform

Progressive Web Apps mit APEX. Till Albert

Schnelles Denken - Maschinelles Lernen mit Apache Spark 2

Data Mining-Modelle und -Algorithmen

Maschinelles Lernen: Symbolische Ansätze

Simulation von Sensornetzwerken Dennis Pfisterer, Alexander Kröller

Weka: Software-Suite mit Maschineller Lernsoftware

Oracle Database Cloud Service

Vorlesungsplan. Von Naïve Bayes zu Bayesischen Netzwerk- Klassifikatoren. Naïve Bayes. Bayesische Netzwerke

Transkript:

Folie 1 Projekt-INF Entwicklung eines Testbed für den empirischen Vergleich verschiedener Methoden des maschinellen Lernens im Bezug auf die Erlernung von Produktentwicklungswissen

Folie 2 Inhalt Ziel des Projekts Unser Lösungsansatz WEKA Verwendete Algorithmen Verwendete Technologien Implementierung und Beispiel Zusammenfassung

Folie 3 Ziel des Projekts Entwicklung eines Testbeds, also einer Plattform Experimente Implementierung verschiedener Machine- Learning Algorithmen Vergleich der verwendeten Algorithmen

Folie 4 Unser Lösungsansatz Implementierung einer Webanwendung und Middleware in einer Java-Servlet-Umgebung Einfache Benutzeroberfläche mit grundlegenden Klassifizierungs- und Clusteringverfahren Evaluierung und Empfehlung eines Algorithmus für den Benutzer Nutzung bereits existierenden Werkzeuge (WEKA) und Algorithmen

Folie 5 WEKA Waikato Environment for Knowledge Analysis Freie Software für maschinelles Lernen sowie Data-Mining unter GPL-Lizenz, in Java geschrieben Enthält unter anderem Filter für Vorverarbeitung der Daten und Klassifizierungs-, Clusteringsowie Assoziations-Algorithmen

Folie 6

Folie 7 ARFF-Datenformat Für WEKA übliches Datenformat Besteht aus einem Header mit der Beschreibung der Attribute sowie dem Datenbereich Erinnert an CSV- Dateien

Folie 8 Verwendete Algorithmen Clustering Gruppierung der Daten auf Basis ihrer Gemeinsamkeiten Clusterzahl wird vom Benutzer vorgegeben Wichtiger Parameter: Abstand der Elemente im Cluster kleiner als der Elemente in verschiedenen Cluster Klassifizierung Teilt Datenbereich in vorgegebenen Klassen auf Klassen stellen gemeinsame Eigenschaften von Daten dar Klassifikation bedeutet Einordnen in die Eigenschaftsklasse oder in die Klasse mit den wenigsten Kosten

Folie 9 Klassifizierungsalgorithmen Naive-Bayes (NB): NB-Klassifikator hat das Ziel, zu einem gegebenen Datenpunkt zu schätzen, mit welcher Wahrscheinlichkeit er in eine Kategorie passt Setzt Unabhängigkeit der Attribute voraus daher naiv Liefert in der Praxis trotzdem gute Ergebnisse K Nearest Neighbour Training besteht aus simplen Abspeichern von Trainigsdaten Abstand zu allen Trainingsdaten berechnen k nächste Nachbarvektoren betrachten und die Kategorie bestimmen

Folie 10 Clusteringalgorithmus Bildquelle:Sapna Jain, M Afshar Aalam, M. N Doja: K-MEANS CLUSTERING USING WEKA INTERFACE, 2010

Folie 11 Verwendete Technologien Unsere Software läuft auf Java-Servlets Google App Engine Platform-as-a-Service von Google Bietet Zugriff auf andere Google-Dienste Eingeschränkte Servlet-Umgebung Tomcat-Server mit WEKA-Einbindung Übliche Webtechnologien, JQuery

Folie 12

Folie 13 Implementierung Unsere Implementierung besteht aus zwei Teilen: Der Frontend-Server läuft auf der Google App Engine, hier werden die Daten eingegeben und aus die Antworten des Backend-Servers verarbeitet Der Backend-Server nimmt die Daten entgegen und führt mit Hilfe der WEKA-Klassen die Algorithmen aus

Folie 14 Implementierung Die beiden Komponenten kommunizieren über ein von uns definiertes Protokoll, das wiederum HTTP verwendet Der Tomcat-Server führt eine Art Middleware aus. Die Algorithmen können hier z.b. ausgetauscht werden.

Folie 15

Folie 16 Ausblick und Erweiterungsmöglichkeiten Speichern von Ergebnissen in Google App Engine Visualisierung von Daten Bessere Dateneingabe, speziell für größere Datenmengen Vollständige Integration in Google App Engine

Folie 17 Fazit Anwender muss nur für korrekt formatierte Daten sorgen, durch Algorithmenempfehlung kann man sich ansonsten "durchklicken" Ermöglicht es allen möglichen Anwendern ohne Vorkenntnisse und Installation Machine- Learning Algorithmen zu nutzen Anpassungen an verschiedene Bedürfnisse und Fachrichtungen möglich

Folie 18 Fragen?