Einführung in Maschinelles Lernen zur Datenanalyse
|
|
- Claus Dresdner
- vor 5 Jahren
- Abrufe
Transkript
1 Einführung in Maschinelles Lernen zur Datenanalyse Prof. Dr. Ing. Morris Riedel School of Engineering and Natural Sciences, University of Iceland Research Group Leader, Juelich Supercomputing Centre, Germany Smart Data Innovation Lab, Leitung Community Medizin TUTORIAL TEIL 2 Klassifikation von Daten in Anwendungen 13. Oktober 2016 Karlsruhe
2 Gliederung 2/ 47
3 Gliederung des Tutorials 1. Grundlagen und Überblick 2. Klassifikation von Daten in Anwendungen Das Tutorial ist nur ein kleiner Ausschnitt an Grundlagen und Skills die ein normaler Universitätskurs vermittelt und kann daher nicht die volle Breite des maschinellen Lernens zeigen 3/ 47
4 Gliederung Teil 2 Klassifikation von Daten in Anwendungen Klassifikation Realisierbarkeit des Lernens Komponenten und Ablauf Anwendungebeisspiele Herausforderungen Probleme Anwendungsbeispiel Fernbeobachtung Anwendungsbeispiele Verstehen der Datensätze vom Tutorial Validation und Modellselektion Vorteile Parallelisierung auf SDIL Platform 4/ 47
5 Klassifikation 5/ 47
6 Zur Erinnerung: Lernansatz Überwachtes Lernen Jeder Prädiktor hat einen Response Der Output überwacht den Lernfortschritt Input Output Daten Ziel: Ein Modell trainieren das Response mit Prediktor verbindet Prädiktiv: Versucht so akkurat wie möglich Vorhersagen über die Reponse von zukünftigen Beobachtungen zu machen Inferenz: Versucht besser die Beziehungen zwischen Response und Prädiktor zu verstehen Überwachte Lernansätze trainieren ein Modell das Reponse mit Prädiktor verbindet Überwachte Lernansätze werden in Klassifikationsalgorithmen wie SVMs benutzt Überwachte Lernansätze arbeiten mit Daten = [input, korrekter output] [1] An Introduction to Statistical Learning 6/ 47
7 Zur Erinnerung Lernmodell Support Vector Machines SVMs SVMs sind häufig benutzt & flexible Klassifikationsmethode Idee: Linear model funktionieren, geht besser Beispiel: was ist die beste Entscheidungsgrenze hier für Zukünftige Daten (lineares Beispiel) ( maximal margin classifier example) Support Vector Machines (SVM) und Kernelmethoden sind ca. 2-3 Vorlesungen, hier nur benutzt 7/ 47
8 Datensatz Rome 8/ 47
9 Übung Rome SVM Training auf SDIL Platform (1) Job Skripte Dateien unter /gpfs/sdic16/tutorials/pisvm-script-examples 9/ 47
10 Übung Rome SVM Training auf SDIL Platform (2) Job Skripte Dateien unter /gpfs/sdic16/tutorials 10 / 47
11 Übungen Rome SVM Training auf SDIL Platform 11 / 47
12 Realisierbarkeit des Lernens Statistische Lerntheorie handelt vom Finden einer prädiktiven Funktion basierend auf Daten Theoretisches Framework das praktisches Lernen ermöglicht E.g. Support Vector Machines (SVMs) Best understood for Supervised Learning [2] Wikipedia on statistical learning theory Theoretische Hintergrund das benutzt wird für Lernprobleme Hauptbestandteil ist die target function die Input nach Output ermöglicht Die gelernte Funktion Unknown Target Function kann dann Klassen von zukünftigen Punkten vorhersagen (Ideale Funktion unbekannt!) ( nur fit existierender Daten nicht genug ) [3] Valiant, A Theory of the Learnable, 1984 Diese Theorie ist Basis für maschinelles Lernen & umfasst 2-3 Vorlesungen, hier stark vereinfacht 12 / 47
13 Komponenten und Ablauf (1) Unknown Target Function (ideale Funktion) Elements we not exactly (need to) know Training Examples (historische Daten, Groundtruth Daten, Beispiele) Elements we must and/or should have and that might raise huge demands for storage Elements that we derive from our skillset and that can be computationally intensive Elements that we derive from our skillset 13 / 47
14 Komponenten und Ablauf (2) Unknown Target Function (ideale Funktion) Elements we not exactly (need to) know Training Examples (historische Daten, Groundtruth Daten, Beispiele) Elements we must and/or should have and that might raise huge demands for storage Final Hypothesis (finale Formel) Elements that we derive from our skillset and that can be computationally intensive Hypothesis Set (Auswahl von Formelkandidaten) Elements that we derive from our skillset 14 / 47
15 Komponenten und Ablauf (3) Unknown Target Function (ideale Funktion) Elements we not exactly (need to) know Training Examples (historische Daten, Groundtruth Daten, Beispiele) Elements we must and/or should have and that might raise huge demands for storage Learning Algorithm ( train a system ) (Auswahl bekannter Algorithmen) Final Hypothesis (finale Formel) Elements that we derive from our skillset and that can be computationally intensive Hypothesis Set (Auswahl von Formelkandidaten) Elements that we derive from our skillset 15 / 47
16 Komponenten und Ablauf (4) Unknown Target Function (ideale Funktion) Training Examples (historische Daten, Groundtruth Daten, Beispiele) Probability Distribution Elements we not exactly (need to) know constants in learning Elements we must and/or should have and that might raise huge demands for storage Learning Algorithm ( train a system ) (Auswahl bekannter Algorithmen) Final Hypothesis (finale Formel) Elements that we derive from our skillset and that can be computationally intensive Hypothesis Set (Auswahl von Formelkandidaten) Elements that we derive from our skillset 16 / 47
17 Komponenten und Ablauf (5) Unknown Target Distribution Function target function plus noise (ideale Funktion) Training Examples (historische Daten, Groundtruth Daten, Beispiele) Error Measure Probability Distribution Elements we not exactly (need to) know constants in learning Elements we must and/or should have and that might raise huge demands for storage Learning Algorithm ( train a system ) (Auswahl bekannter Algorithmen) Final Hypothesis (finale Formel) Elements that we derive from our skillset and that can be computationally intensive Hypothesis Set (Auswahl von Formelkandidaten) Elements that we derive from our skillset 17 / 47
18 Datensatz Rome 18 / 47
19 Übung Rome SVM Testing auf SDIL Platform (1) Job Skripte Dateien unter /gpfs/sdic16/tutorials 19 / 47
20 Übung Rome SVM Testing auf SDIL Platform (2) Job Skripte Dateien unter /gpfs/sdic16/tutorials/pisvm-script-examples 20 / 47
21 Übung Rome SVM Testing auf SDIL Platform (3) Job Skripte Dateien unter /gpfs/sdic16/tutorials 21 / 47
22 Übung Rome SVM Testing auf SDIL Platform (4) 22 / 47
23 Übungen Rome SVM Testing auf SDIL Platform 23 / 47
24 Herausforderungen: Warum ist es nicht so einfach in Praxis? Skalierbarkeit Gigabytes, Terabytes, und Petabytes Datensätze passen nicht in Speicher Bspw. Algorithmen werden gebraucht mit out-of-core/cpu Strategien Hohe Dimensionen Datensötze mit Attributen werden immer öfter benutzt Bspw. Bioinformatik mit Gendaten haben tausende von Features Heterogene und komplexe Daten Viele komplexe Daten in strukturierten und unstrukturierten Datensätzen Bspw. Erdbeobachtungen über lange Zeit in globaler Betrachtung Datenbesitz und Verteilung Verteilte Datensätze oft (bspw. Sicherheits und Transferprobleme) Herausforderungen für das traditionelle maschinelle Lernen sind Skalierbarkeit, hohe Dimensionen, heterogene und komplexe Daten sowie Datenbesitz und Datenverteilung [5] Introduction to Data Mining 24 / 47
25 Anwendungsbeispiel in Industrie Netflix ~ Netflix Prize Challenge 2009 Daten: Netflix Firma gab Daten um von Filmen zu lernen Herausforderung: Verbesserung des Netflix in-house Recommendersystem Preis: US $ für das Team das 10% Verbesserung schaft Ansätze: Algorithmen des maschinellen Lernens Gewinner: Preis erhalten durch Künstliche Neuronalen Netze (KNN) [6] A. Töscher and M. Jahrer, The BigChaos Solution to the Netflix Grand Prize, / 47
26 Komplexe Anwendunge in Wissenschaft & Engineering Klassifikation von Abweichungen in Gehirn MRI Bildern Nutzung Support Vector Machines (SVMs) Klassifizierung zwischen normalen und Abweichungen zusammen mit der Erkennung der Krankheit? [7] D. Singh et al., 2012 input data class Infected by clot class normal brain class Infected by tumor class Infected by bleed Klassifikation Landnutzung von multi-spektralen Satellitendaten Nutzung Support Vector Machines (SVMs) Klassifikation der Landnutzung durch Bilddaten und Feature Engineering [8] G. Cavallaro & M. Riedel et al., 2014? Verschiedene Typen der Landnutzung 26 / 47
27 Problem nicht linear separable Daten 3 (4) Modelling Phase 2.5 (resampled, again N = 100 samples) 2? Iris-versicolor Iris-virginica (lineare Entscheidungsgrenze) (nicht-lineare Entscheidungsgrenze) (lessons learned in Praxis: man muss ein paar Fehler zulassen so dass die gesamte Klassifikation besser wird) (lessons learned in Praxis: nicht-lineare Entscheidungsgrenzen gebraucht) 27 / 47
28 Problem des Overfitting [4] Stop Overfitting, YouTube 28 / 47
29 Anwendungsbeispiel 29 / 47
30 Datensatz Indianpines 30 / 47
31 Übungen Indian Pines SVM Training auf SDIL Platform 31 / 47
32 Grobes Verständnis des Anwendungsgebiets Fernbeobachtung (engl. Remote Sensing) ist die Erzeugung von Informationen über ein Objekt ohne in physischen Kontakt mit dem Objekt zu kommen [11] Wikipedia on Remote Sensing Das gesamte System ist sehr komplex Emissions von Energie der Erdoberfläche einsammeln Sendung durch die Atmosphäre zu Instrumenten auf Fernbeobachtungs-Platformen (bspw. Satelliten) Sendung der Daten zurück zur Erdoberfläche Verarbeiten in Bilder für die Anwender und Datenanalyse teams 32 / 47
33 Anwendungsdaten Labelled Data ist Gold (hohe Dimension) Pansharpened (UDWT) low-resolution (2.4m) multispectral images (Quickbird) Sattelite Data Groundtruth Classification Study of Land Cover Types [8] G. Cavallaro & M. Riedel et al., 2014 Model & Algorithm 33 / 47
34 Remote Sensing Application The Dataset Example dataset: Geographical location: Image of Rome, Italy Remote sensor data obtained by Quickbird satellite High-resolution (0.6m) panchromatic image Pansharpened (UDWT) low-resolution (2.4m) multispectral images (high dimension) (Reasoning for picking SVM: Good classification accuracies on high dimensional datasets, even with a small rare number of training samples) 34 / 47
35 Datensatz Indianpines Herausfordernder Datensatz (nicht linear separabel) 52 Klassen; wenig groundtruth Samples; mixed pixels; hohe Dimension remote sensing cube & ground reference [10] G. Cavallaro, M. Riedel, J.A. Benediktsson et al., Journal of Selected Topics in Applied Earth Observation and Remote Sensing, / 47
36 Datensatz Indianpines Indian Pines Dataset Processed Training Indian_processed_training.el LibSVM data format: class feature1:value1 feature2:value2 36 / 47
37 Datensatz Indianpines 37 / 47
38 Übungen Indian Pines SVM Testing auf SDIL Platform 38 / 47
39 Validation Technik Modellselektion Modellselektion nutzt (a) verschiedene Typen von Modellen oder (b) Modellparameter Modellselektion nutzt Validierungsfehler zur Entscheidung Nutze das beste Modell im Lauf Hypothesis Set (Potentielle Hypothesen und Modelle) Viele Modelle Nutzung validation error um Entscheidungen zu treffen je Modell Vorsicht ist geboten: Wahl ist Entscheidung Hypothese hat damit ein bias ( kontaminiert) Using M times Final Hypothesis (testen auf ungesehene Daten gut, aber braucht mehr Daten in Praxis) (Training run auf ganzen Datensatz) (out-of-sample bzgl. D Train ) (training) (validate) (nehme best bias) (finales Training auf allen Daten, Nutzung der Validierungsdaten) (unbiased estimates) (Entscheidung Modell) (finales Training : bessere Genauigkeit out-of-sample) 39 / 47
40 (Datensatz) Validation Technik 10-fold cross validation 10-fold cross validation wird meist in praktischen Problemen benutzt fold K = N/10 for real data Durch N/K training sessions auf N K Punkte jedes mal braucht computing ( Parallelisierung) Leave-one-out N training sessions auf N 1 Datenpunkten jedes mal Leave-more-out (leave 1 point out bei jedem run viele runs) Training Examples (Generalisierung zu leave k Punkte raus bei jedem run) Training Examples K-fold Daten in Folds aufteilen N/K training sessions auf N K Datenpunkten jedes mal (weniger sessions) Beispiel: 10-fold cross-valdation with K = N/10 multiple times (N/K) (Nutze 1/10 zur Validierung, aber 9/10 für Training, dann wieder 1/10 N/K mal) Training Examples 1 (Praxis um bias zu vermeiden & Kontamination: Reste für tests als ungesehene Daten ) (involviert im Training jetzt) (involviert im Training jetzt) (Darstellung eines Runs) 40 / 47
41 pisvm-train Parameter bietet cross-validation Weitere Parameter der parallelen pisvm Version (Erzeugt kein Modell, aber gibt eine Prognose für ungesehene Daten zur Modelselektion) 41 / 47
42 Vorteile Parallelisierung & Möglichkeiten im SDIL Jeder Eintrag ist selbst parallelisiert berechenbar Die ganzen Tabelleneinträge sind auch gleichzeitig berechenbar Die SDIL Platform bietet die Möglichkeit Analyse zu beschleunigen (1) Scenario unprocessed data, 10xCV serial: accuracy (min) (2) Scenario pre-processed data, 10xCV serial: accuracy (min) (1) Scenario unprocessed data 10xCV parallel: accuracy (min) (2) Scenario pre-processed data, 10xCV parallel: accuracy (min) First Result: best parameter set from min to 4.09 min Second Result: all parameter sets from ~3 days to ~2 hours First Result: best parameter set from min to 1.02 min Second Result: all parameter sets from ~9 hours to ~35 min [10] G. Cavallaro, M. Riedel, J.A. Benediktsson et al., Journal of Selected Topics in Applied Earth Observation and Remote Sensing, / 47
43 Übungen Indian Pines Cross-Validation auf SDIL Platform 43 / 47
44 [Video] Remote Sensing [9] YouTube Video, Remote Sensing 44 / 47
45 Referenzen 45 / 47
46 Referenzen (1) [1] An Introduction to Statistical Learning with Applications in R, Online: [2] Wikipedia on Statistical Learning Theory, Online: [3] Leslie G. Valiant, A Theory of the Learnable, Communications of the ACM 27(11): , 1984, Online: [4] Udacity, Overfitting, Online: [5] Introduction to Data Mining, Pang-Ning Tan, Michael Steinbach, Vipin Kumar, Addison Wesley, ISBN , English, ~769 pages, 2005 [6] Andreas Töscher and Michael Jahrer, The BigChaos Solution to the Netflix Grand Prize, 2009 [7] D. Singh and K. Kaur, Classification of Abnormalities in Brain MRI Images Using, International Journal of Engineering and Advanced Technology, ISSN: , Volume 1, Issue-6, 2012 [8] G. Cavallaro and M. Riedel, Smart Data Analytics Methods for Remote Sensing Applications, 35th Canadian Symposium on Remote Sensing (IGARSS), 2014, Quebec, Canada [9] Video: What is Remote Sensing Online: [10] G. Cavallaro, M. Riedel, J.A. Benediktsson et al., Journal of Selected Topics in Applied Earth Observation and Remote Sensing, 2015 [11] Wikipedia on Remote Sensing, Online: 46 / 47
47 Folien sind in Kürze erhältlich auf: 47 / 47
Einführung in Maschinelles Lernen zur Datenanalyse
Einführung in Maschinelles Lernen zur Datenanalyse Prof. Dr. Ing. Morris Riedel School of Engineering and Natural Sciences, University of Iceland Research Group Leader, Juelich Supercomputing Centre, Germany
Validation Model Selection Kreuz-Validierung Handlungsanweisungen. Validation. Oktober, von 20 Validation
Validation Oktober, 2013 1 von 20 Validation Lernziele Konzepte des maschinellen Lernens Validierungsdaten Model Selection Kreuz-Validierung (Cross Validation) 2 von 20 Validation Outline 1 Validation
Machine Learning Tutorial
Machine Learning Tutorial a very fast WEKA Introduction busche@ismll.uni-hildesheim.de 05.01.09 1 Hauptbestandteile von WEKA: Instances Instance Attribute FastVector Classifier Evaluation (Filter) http://weka.wiki.sourceforge.net/
Künstliche Intelligenz im Maschinen- und Anlagenbau Heilsbringer oder Hypebringer?
ASQF Automation Day 2018 - Predictive Analytics Künstliche Intelligenz im Maschinen- und Anlagenbau Heilsbringer oder Hypebringer? Vasilij Baumann Co-Founder/Co-CEO vasilij.baumann@instrunext.com +49 931
DOKUMENTENKLASSIFIKATION MIT MACHINE LEARNING
DOKUMENTENKLASSIFIKATION MIT MACHINE LEARNING Andreas Nadolski Softwareentwickler andreas.nadolski@enpit.de Twitter: @enpit Blogs: enpit.de/blog medium.com/enpit-developer-blog 05.10.2018, DOAG Big Data
, Data Mining, 2 VO Sommersemester 2008
Evaluation 188.646, Data Mining, 2 VO Sommersemester 2008 Dieter Merkl e-commerce Arbeitsgruppe Institut für Softwaretechnik und Interaktive Systeme Technische Universität Wien www.ec.tuwien.ac.at/~dieter/
Workshop Aktuelle Entwicklungen bei der Auswertung von Fernerkundungsdaten für forstliche Aufgabenstellungen
Workshop Aktuelle Entwicklungen bei der Auswertung von Fernerkundungsdaten für forstliche Aufgabenstellungen Schätzung von Holzvorräten und Baumartenanteilen mittels Wahrscheinlichkeitsmodellen Haruth
Statistics, Data Analysis, and Simulation SS 2015
Mainz, June 11, 2015 Statistics, Data Analysis, and Simulation SS 2015 08.128.730 Statistik, Datenanalyse und Simulation Dr. Michael O. Distler Dr. Michael O. Distler
Using TerraSAR-X data for mapping of damages in forests caused by the pine sawfly (Dprion pini) Dr. Klaus MARTIN klaus.martin@slu-web.
Using TerraSAR-X data for mapping of damages in forests caused by the pine sawfly (Dprion pini) Dr. Klaus MARTIN klaus.martin@slu-web.de Damages caused by Diprion pini Endangered Pine Regions in Germany
Microsoft Azure Deutschland ist jetzt verfügbar -
Einordnung und Überblick Data Scientist Operationalisierung IT-Abteilung Anwendungsentwickler Der Data Scientist agil Tool seiner Wahl möglichst wenig Zeit Skalierung Code für die Operationalisierung Der
Climate change and availability of water resources for Lima
Climate change and availability of water resources for Lima András Bárdossy bardossy@iws.uni-stuttgart.de Lima Marzo 12. 2009 1 Engineers and the future Knowledge about Past Design for Future Lima Marzo
Artificial Intelligence. Was ist das? Was kann das?
Artificial Intelligence Was ist das? Was kann das? Olaf Erichsen Tech-Day Hamburg 13. Juni 2017 Sehen wir hier bereits Künstliche Intelligenz (AI)? Quelle: www.irobot.com 2017 Hierarchie der Buzzwords
Ridge Regression und Kernalized Support Vector Machines : Einführung und Vergleich an einem Anwendungsbeispiel
Ridge Regression und Kernalized Support Vector Machines : Einführung und Vergleich an einem Anwendungsbeispiel Dr. Dominik Grimm Probelehrveranstaltung Fakultät für Informatik und Mathematik Hochschule
Bio-Inspired Credit Risk Analysis
Bio-Inspired Credit Risk Analysis Computational Intelligence with Support Vector Machines Bearbeitet von Lean Yu, Shouyang Wang, Kin Keung Lai, Ligang Zhou 1. Auflage 2008. Buch. XVI, 244 S. Hardcover
Echtzeitfähige Algorithmen für markerloses Tracking und Umfelderkennung , Dr.-Ing. Steffen Herbort, A.R.T. GmbH
Echtzeitfähige Algorithmen für markerloses Tracking und Umfelderkennung 26.10.2016, TP 2: Arbeiten von A.R.T. TP2: Tracking und Umfelderkennung Markerloses Tracking texturierte Objekte Umfelderkennung
Einführung in Support Vector Machines (SVMs)
Einführung in (SVM) Januar 31, 2011 Einführung in (SVMs) Table of contents Motivation Einführung in (SVMs) Outline Motivation Vektorrepräsentation Klassifikation Motivation Einführung in (SVMs) Vektorrepräsentation
A New Target Detector Based on Geometrical Perturbation Filters for Polarimetric Synthetic Aperture Radar (POL-SAR)
Springer Theses A New Target Detector Based on Geometrical Perturbation Filters for Polarimetric Synthetic Aperture Radar (POL-SAR) Bearbeitet von Armando Marino 1. Auflage 2012. Buch. xxii, 242 S. Hardcover
Applying Pléiades in the ASAP project HighSens
Applying Pléiades in the ASAP project HighSens Highly versatile, new satellite Sensor applications for the Austrian market and International Development (Contract number: 833435) Dr. Eva Haas, GeoVille
Predictive Analytics VON PAUL BAUMGARTEN
Predictive Analytics VON PAUL BAUMGARTEN 1 Der Fall Target Werbemail an minderjährige mit Babyartikeln regt Vater auf. Vater beschwert sich beim Manager der entschuldigt sich. Manager ruft nach ein paar
Summary Details for Performance, Duration and Acoustic Measurements for the. Aircon 10S Wind Turbine. UK MCS Certification Summary
Summary Details for Performance, Duration and Acoustic Measurements for the Aircon 10S Wind Turbine UK MCS Certification Summary Certificate Number MCS TUV0007 Small Wind Turbine Certification Summary
IMPULSVORTRAG KÜNSTLICHE INTELLIGENZ & HELMHOLTZ
IMPULSVORTRAG KÜNSTLICHE INTELLIGENZ & HELMHOLTZ PROF. DR. ING. MORRIS RIEDEL, JUELICH SUPERCOMPUTING CENTRE (JSC) / UNIVERSITY OF ICELAND GRUPPENLEITER HIGH PRODUCTIVITY DATA PROCESSING & CROSS-SECTIONAL
Wortdekodierung. Vorlesungsunterlagen Speech Communication 2, SS Franz Pernkopf/Erhard Rank
Wortdekodierung Vorlesungsunterlagen Speech Communication 2, SS 2004 Franz Pernkopf/Erhard Rank Institute of Signal Processing and Speech Communication University of Technology Graz Inffeldgasse 16c, 8010
Approximate Maximum Margin Algorithms with Rules Controlled by the Number of Mistakes
Approximate Maximum Margin Algorithms with Rules Controlled by the Number of Mistakes Seminar Maschinelles Lernen VORTRAGENDER: SEBASTIAN STEINMETZ BETREUT VON: ENELDO LOZA MENCÍA Inhalt Vorbedingungen
Modulliste. für den Masterstudiengang. Data & Knowledge Engineering (alt) an der Otto von Guericke Universität Magdeburg Fakultät für Informatik
Modulliste für den Masterstudiengang Data & Knowledge Engineering (alt) an der Otto von Guericke Universität Magdeburg Fakultät für Informatik vom Sommersemester 2019 Der Masterstudiengang Data & Knowledge
Automatic segmentation for dental operation planning. Diplomarbeit. Nguyen The Duy
Automatic segmentation for dental operation planning Diplomarbeit Nguyen The Duy 24.02.2012 Motivation Quelle: bestbudapestdentist.com Aufgabenstellung Segmentierung des Oberkiefers (Maxilla) Detektion
Arbeitsprozess und Notwendigkeit einer RDA IG am Beispiel der Interest Group Big Data Analytics Morris Riedel et al., Forschungszentrum Juelich
Arbeitsprozess und Notwendigkeit einer RDA IG am Beispiel der Interest Group Big Data Morris Riedel et al., Forschungszentrum Juelich 20. November 2014 RDA Deutschland Treffen, Deutsches GeoForschungszentrum,
Weitere Untersuchungen hinsichtlich der Anwendung von KNN für Solvency 2. Tom Schelthoff
Weitere Untersuchungen hinsichtlich der Anwendung von KNN für Solvency 2 Tom Schelthoff 30.11.2018 Inhaltsverzeichnis Deep Learning Seed-Stabilität Regularisierung Early Stopping Dropout Batch Normalization
Maschinelle Sprachverarbeitung Übung
Maschinelle Sprachverarbeitung Übung Aufgabe 3: SPAM-Klassifikation Mario Sänger Aufgabe Rund 50% des weltweiten Email-Verkehrs ist Spam* Spam- und Phishing-Mails stellen eines der größten Sicherheitsrisiken
Customer-specific software for autonomous driving and driver assistance (ADAS)
This press release is approved for publication. Press Release Chemnitz, February 6 th, 2014 Customer-specific software for autonomous driving and driver assistance (ADAS) With the new product line Baselabs
Bachelor-Seminar Eingebettete Interaktive Systeme. Farming 4.0: Agriculture in the Context of Digitalization
Bachelor-Seminar Eingebettete Interaktive Systeme Farming 4.0: Agriculture in the Context of Digitalization Prof. Dr. Matthias Kranz 2 Overiew 1. Administrative Organisation 3 5801S Bachelorseminar Embedded
Modell Komplexität und Generalisierung
Modell Komplexität und Generalisierung Christian Herta November, 2013 1 von 41 Christian Herta Bias-Variance Lernziele Konzepte des maschinellen Lernens Targetfunktion Overtting, Undertting Generalisierung
Number of Maximal Partial Clones
Number of Maximal Partial Clones KARSTEN SCHÖLZEL Universität Rostoc, Institut für Mathemati 26th May 2010 c 2010 UNIVERSITÄT ROSTOCK MATHEMATISCH-NATURWISSENSCHAFTLICHE FAKULTÄT, INSTITUT FÜR MATHEMATIK
Geovisualisierung: Wie aus Daten Informationen werden. Doris Dransch Helmholtz Zentrum Potsdam Deutsches GeoForschungsZentrum (GFZ)
Geovisualisierung: Wie aus Daten Informationen werden Doris Dransch Helmholtz Zentrum Potsdam Deutsches GeoForschungsZentrum (GFZ) Agenda Situation in den Geowissenschaften Geovisualisierung und Visual
Vergleich von SVM und Regel- und Entscheidungsbaum-Lernern
Vergleich von SVM und Regel- und Entscheidungsbaum-Lernern Chahine Abid Bachelor Arbeit Betreuer: Prof. Johannes Fürnkranz Frederik Janssen 28. November 2013 Fachbereich Informatik Fachgebiet Knowledge
Privacy-preserving Ubiquitous Social Mining via Modular and Compositional Virtual Sensors
Privacy-preserving Ubiquitous Social Mining via Modular and Compositional s Evangelos Pournaras, Iza Moise, Dirk Helbing (Anpassung im Folienmaster: Menü «Ansicht» à «Folienmaster») ((Vorname Nachname))
SKOPOS Webinar 22. Mai 2018
SKOPOS Webinar 22. Mai 2018 Marktforschung 2020: Künstliche Intelligenz und automatische Text Analysen? Christopher Harms, Consultant Research & Development 2 So? Terminator Exhibition: T-800 by Dick Thomas
Supply Chain Management
Supply Chain Management Forecasting Methods Prof. Dr.-Ing. Burkhard Schmager Department of Industrial Engineering EAH Jena Sept 2016 SS 2016 Kapitel 2-1 Material Planning Approaches MRP - methods deterministical
Dienstleistungsmanagement Übung 3
Dienstleistungsmanagement Übung 3 Univ.-Prof. Dr.-Ing. Wolfgang Maass Chair in Economics Information and Service Systems (ISS) Saarland University, Saarbrücken, Germany ANKÜNDIGUNG Veranstaltung Enterprise
ELBA2 ILIAS TOOLS AS SINGLE APPLICATIONS
ELBA2 ILIAS TOOLS AS SINGLE APPLICATIONS An AAA/Switch cooperative project run by LET, ETH Zurich, and ilub, University of Bern Martin Studer, ilub, University of Bern Julia Kehl, LET, ETH Zurich 1 Contents
Künstliche Intelligenz
Künstliche Intelligenz Data Mining Approaches for Instrusion Detection Espen Jervidalo WS05/06 KI - WS05/06 - Espen Jervidalo 1 Overview Motivation Ziel IDS (Intrusion Detection System) HIDS NIDS Data
Data Science Anwendungen bei innogy Netz & Infrastruktur (G&I)
Data Science Anwendungen bei innogy Netz & Infrastruktur (G&I) - Grid Research and Insights Platform (GRIP) - Essener Energiegespräche 25. Oktober 2018 Philipp Clasen, Freier Mitarbeiter innogy SE 1 Einleitung
Big Data und die Energiewende: Kann man genug Daten haben?
Big Data und die Energiewende: Kann man genug Daten haben? Malek Alouini Fachgespräch BigData Konzepte zur Analyse komplexer Infrastrukturen 16. Mai 2017 Was ist Big Data? Technologien zur Verarbeitung
Informatik - Übungsstunde
Informatik - Übungsstunde Jonas Lauener (jlauener@student.ethz.ch) ETH Zürich Woche 08-25.04.2018 Lernziele const: Reference const: Pointer vector: iterator using Jonas Lauener (ETH Zürich) Informatik
Deep Learning für Automatische Dokumentanalyse
Deep Learning für Automatische Dokumentanalyse apl. Prof. Marcus Liwicki DIVA Group, University of Fribourg MindGarage, University of Kaiserslautern marcus.liwicki@unifr.ch www.mindgarage.de Können Sie
JPlus Platform Independent Learning with Environmental Information in School
JPlus Platform Independent Learning with Environmental Information in School Mario Härtwig, Pierre Karrasch Salzburg, 7. Juli 2010 Genesis Umweltmonitoring als Beitrag zur Umweltbildung an Schulen. Kulturlandschaftsentwicklung
Mastering Social Media, Web, Satellite and Spatial Data with R. Dr. Martin Vogt Seminar
Mastering Social Media, Web, Satellite and Spatial Data with R Dr. Martin Vogt Seminar Big Data und Data Literacy Daten sind der Rohstoff der Zukunft. (Angela Merkel) Big data is at the foundation of all
Aktuelle Anwendung von Fernerkundungsdaten
Literaturhinweis: ALBERTZ, Jörg (2007): Einführung in die Fernerkundung, Grundlagen der Interpretation von Luft- und Satellitenbildern, 3. Auflage, Wisssenschaftliche Buchgemeinschaft Darmstadt Grundlagen
Learning to Rank Sven Münnich
Learning to Rank Sven Münnich 06.12.12 Fachbereich 20 Seminar Recommendersysteme Sven Münnich 1 Übersicht 1. Einführung 2. Methoden 3. Anwendungen 4. Zusammenfassung & Fazit 06.12.12 Fachbereich 20 Seminar
Innovationsmanagement. Internet of Things (IoT) Zühlke. Business. Things. Internet. Systems Engineering
Business Zühlke Systems Engineering Things Innovationsmanagement Internet Internet of Things (IoT) Folie 1 Bildquelle Universal Music 2015 Copyright www.greenprophet.com Life Cycle Management «Beton vs.
Big Data - und nun? Was kann die Bioinformatik?
Big Data - und nun? Was kann die Bioinformatik? Jochen Kruppa Institut für Biometrie und Klinische Epidemiologie jochenkruppa@charitede 1 59 Vorstellung Wer spricht heute zu Ihnen? Studium der Pflanzenbiotechnologie
Lehrveranstaltungen im Wintersemester 2012/2013
Lehrveranstaltungen im Wintersemester 2012/2013 Information Systems and Machine Learning Lab (ISMLL) Prof. Dr. Dr. Lars Schmidt-Thieme Hildesheim, Juli 2012 1 / 1 Übersicht Praktika Hildesheim, Juli 2012
Künstliche Intelligenz
1. Juni, 2017 Künstliche Intelligenz Stand der Forschung, Aktuelle Probleme & Herausforderungen Prof. Dr. Roland Kwitt Fachbereich Computerwissenschaften Universität Salzburg Übersicht Begrifflichkeiten
Elementary Intensive Reading I German UN1113 Fall 2017
Section Elementary Intensive Reading I German UN1113 Fall 2017 Instructor Day/Time Location UN1113-Section 001 Ross Shields MW 10:11-2:25pm TBA Hamilton Hall Elementary German I. Course Objectives: The
Globale und Individuelle Schmerz-Klassifikatoren auf Basis relationaler Mimikdaten
Globale und Individuelle Schmerz-Klassifikatoren auf Basis relationaler Mimikdaten M. Siebers 1 U. Schmid 2 1 Otto-Friedrich-Universität Bamberg 2 Fakultät für Wirtschaftsinformatik und Angewandte Informatik
Magic Figures. We note that in the example magic square the numbers 1 9 are used. All three rows (columns) have equal sum, called the magic number.
Magic Figures Introduction: This lesson builds on ideas from Magic Squares. Students are introduced to a wider collection of Magic Figures and consider constraints on the Magic Number associated with such
Open queueing network model of a computer system: completed jobs
E Queueing Networks E Queueing Networks Open queueing network model of a computer system: Stream of new jobs Disk CPU Printer Stream of completed jobs Magnetic Tape E.164 E Queueing Networks "Central-Server-Model
Institut für Künstliche Intelligenz
Institut für Künstliche Intelligenz Prof. Sebstaian Rudolph --- Computational Logic Prof. Steffen Hölldobler --- Wissensverarbeitung Prof. Ivo F. Sbalzarini --- Wissenschaftliches Rechnen für Systembiologie
Technische Universität Kaiserslautern Lehrstuhl für Virtuelle Produktentwicklung
functions in SysML 2.0 La Jolla, 22.05.2014 12/10/2015 Technische Universität Kaiserslautern Lehrstuhl für Virtuelle Produktentwicklung Dipl. Wirtsch.-Ing. Christian Muggeo Dipl. Wirtsch.-Ing. Michael
Mustererkennung und Klassifikation
Mustererkennung und Klassifikation WS 2007/2008 Fakultät Informatik Technische Informatik Prof. Dr. Matthias Franz mfranz@htwg-konstanz.de www-home.htwg-konstanz.de/~mfranz/heim.html Grundlagen Überblick
Predicting the duration of disruptions in the SBB railway network with RNN
Gabriel Krummenacher Data Science Zühlke Engineering AG Beat Wettstein Research & Innovation SBB AG Predicting the duration of disruptions in the SBB railway network with RNN Predicting disruptions in
WE SHAPE INDUSTRY 4.0 BOSCH CONNECTED INDUSTRY DR.-ING. STEFAN AßMANN
WE SHAPE INDUSTRY 4.0 BOSCH CONNECTED INDUSTRY DR.-ING. STEFAN AßMANN Bosch-Definition for Industry 4.0 Our Seven Features Connected Manufacturing Connected Logistics Connected Autonomous and Collaborative
Logistische Regression
Logistische Regression Christian Herta August, 2013 1 von 45 Christian Herta Logistische Regression Lernziele Logistische Regression Konzepte des maschinellen Lernens (insb. der Klassikation) Entscheidungsgrenze,
Bayesian updating in natural hazard risk assessment
International Forum on Engineering Decision Making, Third IFED Forum, Shoal Bay, Australia, 12-15 15 December 2007 1/23 Bayesian updating in natural hazard risk assessment Mathias Graf, Kazuyoshi Nishijima,
Feature Selection / Preprocessing
1 Feature Selection / Preprocessing 2 Was ist Feature Selection? 3 Warum Feature Selection? Mehr Variablen führen nicht automatisch zu besseren Ergebnissen. Lernen von unwichtigen Daten Mehr Daten notwendig
Analytics Entscheidungsbäume
Analytics Entscheidungsbäume Professional IT Master Prof. Dr. Ingo Claßen Hochschule für Technik und Wirtschaft Berlin Regression Klassifikation Quellen Regression Beispiel Baseball-Gehälter Gehalt: gering
Pareto optimale lineare Klassifikation
Seminar aus Maschinellem Lernen Pareto optimale lineare Klassifikation Vesselina Poulkova Betreuer: Eneldo Loza Mencía Gliederung 1. Einleitung 2. Pareto optimale lineare Klassifizierer 3. Generelle Voraussetzung
Informatik für Mathematiker und Physiker Woche 6. David Sommer
Informatik für Mathematiker und Physiker Woche 6 David Sommer David Sommer October 31, 2017 1 Heute: 1. Rückblick Übungen Woche 5 2. Libraries 3. Referenzen 4. Step-Wise Refinement David Sommer October
Lineare Regression 2: Gute Vorhersagen
Lineare Regression 2: Gute Vorhersagen Markus Kalisch 23.09.2014 1 Big Picture: Statistisches Lernen Supervised Learning (X,Y) Unsupervised Learning X VL 7, 11, 12 Regression Y kontinuierlich VL 1, 2,
Lehrstuhl für Allgemeine BWL Strategisches und Internationales Management Prof. Dr. Mike Geppert Carl-Zeiß-Str. 3 07743 Jena
Lehrstuhl für Allgemeine BWL Strategisches und Internationales Management Prof. Dr. Mike Geppert Carl-Zeiß-Str. 3 07743 Jena http://www.im.uni-jena.de Contents I. Learning Objectives II. III. IV. Recap
Mul$media im Netz (Online Mul$media) Wintersemester 2014/15. Übung 02 (Nebenfach)
Mul$media im Netz (Online Mul$media) Wintersemester 2014/15 Übung 02 (Nebenfach) Mul=media im Netz WS 2014/15 - Übung 2-1 Organiza$on: Language Mul=ple requests for English Slides Tutorial s=ll held in
Klassische Klassifikationsalgorithmen
Klassische Klassifikationsalgorithmen Einführung in die Wissensverarbeitung 2 VO 708.560+ 1 UE 442.072 SS 2013 Institut für Signalverarbeitung und Sprachkommunikation TU Graz Inffeldgasse 12/1 www.spsc.tugraz.at
Parametric Spectral Estimation
Parametric Spectral Estimation Exercises for Digital Signal Processing II Exercise 2.3.26 Stefan Goetze / Volker Mildner Infos about the examination Diploma students: Oral examinations on March, 29 th.-
Nutzung maschinellen Lernens zur Extraktion von Paragraphen aus PDF-Dokumenten
Nutzung maschinellen Lernens zur Extraktion von Paragraphen aus PDF-Dokumenten Albert-Ludwigs-Universität zu Freiburg 13.09.2016 Maximilian Dippel max.dippel@tf.uni-freiburg.de Überblick I Einführung Problemstellung
Ground Truth ohne Datenqualität kein Machine Learning. Erfolgsfaktoren für Predictive Analytics, BI und Data Mining
Ground Truth ohne Datenqualität kein Machine Learning. Erfolgsfaktoren für Predictive Analytics, BI und Data Mining Prof. Dr.-Ing. Peter Lehmann Hochschule der Medien Stuttgart GLIEDERUNG Etwas über Machine
Cloud-based Real Time ADL Recognition Using Wearable Devices. Robert Baldauf
Cloud-based Real Time ADL Recognition Using Wearable Devices Robert Baldauf Grundlagen ADL Recognition Offline ADL Recognition Cloud-based ADL Recognition Ergebnisse Diskussion & Ausblick Robert Baldauf
Algorithms for graph visualization
Algorithms for graph visualization Project - Orthogonal Grid Layout with Small Area W INTER SEMESTER 2013/2014 Martin No llenburg KIT Universita t des Landes Baden-Wu rttemberg und nationales Forschungszentrum
Clustering 2010/06/11 Sebastian Koch 1
Clustering 2010/06/11 1 Motivation Quelle: http://www.ha-w.de/media/schulung01.jpg 2010/06/11 2 Was ist Clustering Idee: Gruppierung von Objekten so, dass: Innerhalb einer Gruppe sollen die Objekte möglichst
MACHINE VISION KLASSIFIKATOREN VORTEILE UND HERAUSFORDERUNGEN AUSGEWÄHLTER METHODEN
MACHINE VISION KLASSIFIKATOREN VORTEILE UND HERAUSFORDERUNGEN AUSGEWÄHLTER METHODEN FRANK ORBEN, TECHNICAL SUPPORT / DEVELOPER IMAGE PROCESSING, STEMMER IMAGING GLIEDERUNG Einführung Aufgabe: Klassifikation
Bielefeld Graphics & Geometry Group. Brain Machine Interfaces Reaching and Grasping by Primates
Reaching and Grasping by Primates + 1 Reaching and Grasping by Primates Inhalt Einführung Theoretischer Hintergrund Design Grundlagen Experiment Ausblick Diskussion 2 Reaching and Grasping by Primates
Von der Entscheidungsunterstützung zur Entscheidungsautomatisierung mit Big Data und Künstlicher Intelligenz
Von der Entscheidungsunterstützung zur Entscheidungsautomatisierung mit Big Data und Künstlicher Intelligenz Dr. Stefan Wess CEO Empolis Information Management, Kaiserslautern Seite 1 Historie der Empolis
Geostatistics for modeling of soil spatial variability in Adapazari, Turkey
1 Geostatistics for modeling of soil spatial variability in Adapazari, Turkey Jack W. Baker Michael H. Faber (IBK) ETH - Zürich 2 Practical evaluation of liquefaction occurrence Obtained from empirical
Ein Vergleich von Methoden für Multi-klassen Support Vector Maschinen
Ein Vergleich von Methoden für Multi-klassen Support Vector Maschinen Einführung Auf binären Klassifikatoren beruhende Methoden One-Against-All One-Against-One DAGSVM Methoden die alle Daten zugleich betrachten
Geistes-, Natur-, Sozial- und Technikwissenschaften gemeinsam unter einem Dach. Programmes for refugees at Bielefeld University
Programmes for refugees at Bielefeld University 1 Bielefeld University Funded in 1969 Middle-sized university with 28.000 students, 1800 of them international students, 13 faculties: main focus on Natural
Priorities (time independent and time dependent) Different service times of different classes at Type-1 nodes -
E.6 Approximate Analysis of Non-product-Form Queueing Networks Non exponentially distributed service times Priorities (time independent and time dependent) Different service times of different classes
INTELLIGENTE DATENANALYSE IN MATLAB
INTELLIGENTE DATENANALYSE IN MATLAB Einführungsveranstaltung Überblick Organisation Literatur Inhalt und Ziele der Vorlesung Beispiele aus der Praxis 2 Organisation Vorlesung/Übung + Projektarbeit. 4 Semesterwochenstunden.
Extraction of Wind and Wave Field from SAR data
Extraction of Wind and Wave Field from SAR data S. Lehner, X. Li, Th. Bruns, W. Rosenthal German Aerospace Center (DLR), Oberpfaffenhofen Motivation Derive integrated Wave Parameters (e.g. SWH, mean period)
Browser- gestützte Visualisierung komplexer Datensätze: Das ROAD System
AG Computeranwendungen und QuanLtaLve Methoden in der Archäologie 5. Workshop Tübingen 14. 15. Februar 2014 Browser- gestützte Visualisierung komplexer Datensätze: Das ROAD System Volker Hochschild, Michael
A novel displacement-based measure to assess the quality of mesoscale EPS forecasts
A novel displacement-based measure to assess the quality of mesoscale EPS forecasts Christian Keil and George C.Craig DLR Oberpfaffenhofen, Germany Motivation Exploitation of spatio-temporal information
Mitglied der Leibniz-Gemeinschaft
Methods of research into dictionary use: online questionnaires Annette Klosa (Institut für Deutsche Sprache, Mannheim) 5. Arbeitstreffen Netzwerk Internetlexikografie, Leiden, 25./26. März 2013 Content
Übersicht. Definition Daten Problemklassen Fehlerfunktionen
Übersicht 1 Maschinelle Lernverfahren Definition Daten Problemklassen Fehlerfunktionen 2 Entwickeln von maschinellen Lernverfahren Aufteilung der Daten Underfitting und Overfitting Erkennen Regularisierung
Fluid-Particle Multiphase Flow Simulations for the Study of Sand Infiltration into Immobile Gravel-Beds
3rd JUQUEEN Porting and Tuning Workshop Jülich, 2-4 February 2015 Fluid-Particle Multiphase Flow Simulations for the Study of Sand Infiltration into Immobile Gravel-Beds Tobias Schruff, Roy M. Frings,
Atline Inspection of Casting Production Process at Volkswagen using VG Inline
Atline Inspection of Casting Production Process at Volkswagen using VG Inline Atline Inspection of Casting Production Process at Volkswagen using VG Inline Authors: Dr.-Ing. Raimund Rösch, Frank Jeltsch
Integrated result data management in the development process of vehicle systems based on the ASAM ODS standard
Integrated result data management in the development process of vehicle systems based on the ASAM ODS standard Dipl.-Ing. (FH) Stefan Geneder, Technische Hochschule Ingolstadt Dr. Felix Pfister, AVL List,
Integration of Simulation and Testing in Power Train Engineering Based on the Example of the Dual Mass Flywheel
Integration of Simulation and Testing in Power Train Engineering Based on the Example of the Dual Mass Flywheel Institute of Machine Design and Automotive Engineering University of Karlsruhe, Germany o.
GIS-based Mapping Tool for Urban Energy Demand
GIS-based Mapping Tool for Urban Energy Demand Building Services, Mechanical and Building Industry Days Conference Johannes Dorfner Debrecen, 14 October 2011 Outline 1. Motivation 2. Method 3. Result 4.
Objektmerkmale für die räumlich-spektrale Klassifikation
Objektmerkmale für die räumlich-spektrale Klassifikation AG Geomatik Geographisches Institut Ruhr-Universität Bochum AK Fernerkundung, Bochum 2012 Übersicht Ansatz zur automatischen Bildinterpretation:
Data Mining auf Datenströmen Andreas M. Weiner
Technische Universität Kaiserslautern Fachbereich Informatik Lehrgebiet Datenverwaltungssysteme Integriertes Seminar Datenbanken und Informationssysteme Sommersemester 2005 Thema: Data Streams Andreas
jasimasolutions Simulation based process optimization for the agri food sector jasimabeverageplanner jasima Solutions Spin Off from
jasima Solutions Spin Off from BIBA - Bremer Institut für Produktion und Logistik GmbH Simulation based process optimization for the agri food sector jasimabeverageplanner Torsten Hildebrandt Torsten.Hildebrandt@.de
Registration of residence at Citizens Office (Bürgerbüro)
Registration of residence at Citizens Office (Bürgerbüro) Opening times in the Citizens Office (Bürgerbüro): Monday to Friday 08.30 am 12.30 pm Thursday 14.00 pm 17.00 pm or by appointment via the Citizens