Predictive Modeling Markup Language Thomas Morandell
Index Einführung PMML als Standard für den Austausch von Data Mining Ergebnissen/Prozessen Allgemeine Struktur eines PMML Dokuments Beispiel von PMML anhand des SAS Enterprise Miner TM Die Zukunft von PMML/Geplante Änderungen Fazit
Index Einführung PMML als Standard für den Austausch von Data Mining Ergebnissen/Prozessen Allgemeine Struktur eines PMML Dokuments Beispiel von PMML anhand des SAS Enterprise Miner TM Die Zukunft von PMML/Geplante Änderungen Fazit
Definition Data Mining Analyse des Datenbestands ohne exakte Fragestellung um bislang unentdeckte Zusammenhänge aus den Daten zu extrahieren Vorhersage unbekannter oder zukünftiger Werte
Warum Standards? Kleiner Teil im Gesamtprozess Sehr viele Data Mining Tools Warum nicht den besten Algorithmus für jeden Schritt?
Index Einführung PMML als Standard für den Austausch von Data Mining Ergebnissen/Prozessen Allgemeine Struktur eines PMML Dokuments Beispiel von PMML anhand des SAS Enterprise Miner TM Die Zukunft von PMML/Geplante Änderungen Fazit
Idee, die dahinter steckt Ein Hauptziel von PMML ist es, Anwendungen und on-line-analysten mit Modellen von verschiedenen Quellen arbeiten zu lassen, ohne sich um die einzelne Unterschiede zwischen jenen Quellen zu beschäftigen
Verbreitung/Einsatz 1998 Entstanden durch die Data Mining Group (www.dmg.org) Aktuell Version 2.1, Frühjahr 2004 Version 3.0 Zusammenschluss von vielen Unternehmen Einsatz bei Modelldistributionen in operative Anwendungen......oder bei Austausch von DM Prozessen zwischen verschiedenen Analysten
Von PMML unterstütze Modelle Data Preparation Linear Regression Logistic Regression Decision Tree Neural Network Clustering Associations
Index Einführung PMML als Standard für den Austausch von Data Mining Ergebnissen/Prozessen Allgemeine Struktur eines PMML Dokuments Beispiel von PMML anhand des SAS Enterprise Miner TM Die Zukunft von PMML/Geplante Änderungen Fazit
XML als Hintergrund PMML baut auf XML auf 2 Teile Document Type Definition (DTD) Elemente der Auszeichnungssprache werden definiert Eigentliche Daten
Aufbau Header Data Dictionary Transformation Dictionary Model Mining Schema Output Section Local Transformations Target Section Model Details
Schnittstellen Jeder XML Parser Xelopes offene und Plattformunabhängige Bibliothek, die Data Mining Standards unterstützt. Unter anderem PMML http://www.prudsys.com/produkte/algorithmen/x elopes/produktinfo/ Java Bibliotheken
Visualisierung http://cyber.felk.cvut.cz/solomon/pmml/pmmldminer.html
Index Einführung PMML als Standard für den Austausch von Data Mining Ergebnissen/Prozessen Allgemeine Struktur eines PMML Dokuments Beispiel von PMML anhand des SAS Enterprise Miner TM Die Zukunft von PMML/Geplante Änderungen Fazit
PMML Dokument von SAS
PMML Dokument von SAS
PMML Dokument von SAS
SASXML package SAS 8.2 XML Modelle lesen http://www.omegahat.org/sasxml/
Index Einführung PMML als Standard für den Austausch von Data Mining Ergebnissen/Prozessen Allgemeine Struktur eines PMML Dokuments Beispiel von PMML anhand des SAS Enterprise Miner TM Die Zukunft von PMML/Geplante Änderungen Fazit
Weiterentwicklung von PMML Durch Standard in den Daten kommt es zu Standard im Prozess Prozessablauf soll übertragbar sein Daten, mit denen das Modell erstellt wurde sollen auch zugänglich sein
Fazit Unternehmen setzen die Standards durch Möglichkeit, Modelle vielseitig zu nutzen Noch sehr viel Weiterentwicklung möglich SVM, Daten ablegen,... Modelle müssten änderbar sein um sich neuen Markforderungen anzupassen