(Pro-)Seminar - Data Mining
|
|
|
- Lisa Monica Weiß
- vor 6 Jahren
- Abrufe
Transkript
1 (Pro-)Seminar - Data Mining Vorbesprechung SCCS, Fakultät für Informatik Technische Universität München SS 2018
2 Data Mining: Beispiele (1) Hausnummererkennung (Klassikation) Source:
3 Data Mining: Beispiele (2) Image Segmentation (Clustering)
4 Data Mining: Beispiele (3) Ähnliche Gene (Clustering) [Hastie et al.]
5 Data Mining: Beispiele (4) Vorausschauender Versand (Klassikation) Source:
6 Warum Data Mining? Data Scientist: The Sexiest Job of the 21st Century (Harvard Business Review) We are drowning in information and starving for knowledge. (Rutherford D. Roger) The future belongs to the companies and people that turn data into products. (Mike Loukides, O'Reilly) Rank 5 in Computerworld's Top IT skills wanted for 2012 Rank 1 in Computerworld's IT skills that employers can't say no to http: //
7 Finding Data Science Unicorn
8 Data Mining Pipeline Planung Aufbereitung Modellbildung Auswertung Wir wollen nützliches Wissen aus Daten extrahieren Planung. Finden des Problems. Was soll gemacht werden? Dafür nötige Daten sammeln. Aufbereitung. Rohdaten (unvollständig, redundant, verschiedene Formate, Einheiten, etc.) werden in eine brauchbare Form gebracht. Modellbildung. Daten werden mit verschiedenen Methoden (Regression, Klassikation, Clustering, etc.) analysiert. Auswertung. Interpretation und Auswertung der Ergebnisse.
9 Themen I Überblick Data Mining Pipeline Software: Spark und Zeppelin Software: Python Software: R Hardware: GPUs Hardware: CPUs und TPUs Autodi Statistics for Datamining Numerische Optimierung
10 Themen II Aufbereitung von Daten, Pre-Processing Lineare Modelle für Regression und Klassikation Lernen mit Kernels Support Vector Machines Entscheidungsbäume Association Rules Graph Mining
11 Themen III Clustering Dichteschätzung Neuronale Netze I: Grundlagen Neuronale Netze II: Deep Learning Neuronale Netze III: Deep Learning Software (TensorFlow) Ensemble Learning Principal Component Analysis
12 Themen IV Bayesian Machine Learning Markov Chain Monte Carlo Spam Filtering with Naive Bayes Classier Recommender Systems Data Mining in Science Data Mining für soziale Netzwerke Data Mining und Gesellschaft: Datenschutz, Verantwortung, usw.
13 Reviews Jede Ausarbeitung wird von zwei anderen Teilnehmern überprüft. Dabei wird geachtet auf: Inhaltliches: Wissenschaftlichkeit, Verständlichkeit, Zusammenhänge klar, Beispiele hilfreich,... Formelles: Sinnvolle Struktur der Ausarbeitung, Richtig zitiert, Graken mit Quelle versehen,... Sprachliches: Rechtschreib- und Grammatikfehler (sollten eigentlich keine vorhanden sein ;-) ) Damit der Review-Prozess funktionniert, muss die Ausarbeitung zur Deadline abgegeben werden! Der Stand der Ausarbeitung ist dabei "Release Candidate", nicht alpha oder beta Nach Abgabe der Reviews: Einarbeitung der Anmerkungen in die eigene Ausarbeitung Dann: Abgabe der nalen Ausarbeitung beim Betreuer
14 Organisatorisches I Jedem Teilnehmer wird ein Betreuer zugewiesen Vortrag: ca. 20min + Diskussion Ausarbeitung: mind. 5 und max. 6 Seiten (L A TEX) im IEEE Format (Webseite), excl. Quellenangaben. Wichtige Termine: Anmeldung bei Betreuern (3 Themen) bis 14. Februar, über das Anmeldeformular (LS Webseite) Anmeldung im Matching System bis practical-courses-and-seminar-courses.html Themenzuteilung: oder
15 Organisatorisches II Webseite: Obligatorische Termine: 1. Kick-O Veranstaltung am voraussichtlich Literaturrecherche Workshop am Vortragstermin wird (geblockt) zugeteilt, voraussichtlich Am Tag des ersten Vortrages - Abgabe der Ausarbeitung 5. 1 Woche nach dem ersten Vortrag - Einreichung der Reviews 6. 2 Wochen nach dem ersten Vortrag - Einreichung der fertigen Ausarbeitung oder Teaching Summer 18 Proseminar - Data Mining
16 Die ersten Schritte im Seminar Kontaktiere deinen Betreuer wegen dem Thema und Referenzen (falls noch keine erhalten). Mache ein LaTeX Tutorial, z.b. online. Lade das IEEE Template und lerne die Struktur kennen. Lese das IEEE Editorial Style Manual, markiere für diese Arbeit relevante Teile und nutze es später als Nachschlagewerk. Vor der ersten Abgabe der Ausarbeitung Mache eine automatische Rechtschreibkorrektur. Gehe durch die Checkliste auf der LS Webseite. Hast du alle Punkte berücksichtigt? Überprüfe ob die Regeln aus IEEE Editorial Style Manual berücksichtigt sind. Vor der letzten Abgabe der Ausarbeitung Mache die gleichen Schritte wie bei der ersten Abgabe. Überprüfe ob die Angaben im Literaturverzeichnis korrekt sind.
Proseminar - Data Mining
Vorbesprechung Proseminar - Data Mining SCCS, Fakultät für Informatik Technische Universität München SS 2015 Vorbesprechung, SS 2015 1 Data Mining: Beispiele (1) Hausnummererkennung (Klassifikation) Source:
Proseminar - Data Mining
Proseminar - Data Mining SCCS, Fakultät für Informatik Technische Universität München SS 2014, SS 2014 1 Data Mining: Beispiele (1) Hausnummererkennung (Klassifikation) Source: http://arxiv.org/abs/1312.6082,
Proseminar - Data Mining
Proseminar - Data Mining SCCS, Fakultät für Informatik Technische Universität München SS 2012, SS 2012 1 Data Mining Pipeline Planung Aufbereitung Modellbildung Auswertung Wir wollen nützliches Wissen
Deep Learning Prof. Dr. E. Rahm und Mitarbeiter
Deep Learning Prof. Dr. E. Rahm und Mitarbeiter Seminar, WS 2017/18 Big Data Analyse-Pipeline Dateninte -gration/ Anreicherung Datenextraktion / Cleaning Datenbeschaffung Datenanalyse Interpretation Volume
Web Engineering Prof. Dr. Martin Gaedke, Dipl.-Inf. Olexiy Chudnovskyy
Verteilte und selbstorganisierende Rechnersysteme WS SS 11/12 Seminar Web Engineering Prof. Dr. Martin Gaedke, Dipl.-Inf. Olexiy Chudnovskyy Technische Universität Chemnitz Fakultät für Informatik Professur
Data Mining Künstliche Neuronale Netze vs. Entscheidungsbäume
Data Mining Künstliche Neuronale Netze vs. Entscheidungsbäume Grundseminar HAW Master Informatik 18.04.2017 Inhaltsübersicht Data Mining & Begriffswelt des Data Mining Klassifikation & Klassifikatoren
Nutzung maschinellen Lernens zur Extraktion von Paragraphen aus PDF-Dokumenten
Nutzung maschinellen Lernens zur Extraktion von Paragraphen aus PDF-Dokumenten Albert-Ludwigs-Universität zu Freiburg 13.09.2016 Maximilian Dippel [email protected] Überblick I Einführung Problemstellung
Schnelles Denken - Maschinelles Lernen mit Apache Spark 2
Schnelles Denken - Maschinelles Lernen mit Apache Spark 2 Heiko Spindler Apache Spark - Components Machine Learning Machine learning explores the construction and study of algorithms that can learn from
Maschinelles Lernen zur Hautkrebsvorhersage
Maschinelles Lernen zur Hautkrebsvorhersage Eine Bachelorarbeit von Daniel Fischer Betreuung: Dipl. Inf. Frederik Janssen Prof. Dr. Johannes Fürnkranz Dr. med. Matthias Herbst 03.07.2011 Fachbereich Informatik
TensorFlow Open-Source Bibliothek für maschinelles Lernen. Matthias Täschner Seminar Deep Learning WS1718 Abteilung Datenbanken Universität Leipzig
TensorFlow Open-Source Bibliothek für maschinelles Lernen Seminar Deep Learning WS1718 Abteilung Datenbanken Universität Leipzig Motivation Renaissance bei ML und KNN Forschung bei DNN fortgeschrittene
Business Analytics. Aktuelle Methoden und Werkzeuge im Zeitalter der Digitalisierung. Business Analytics
Aktuelle Methoden und Werkzeuge im Zeitalter der Digitalisierung Workshop für Führungskräfte (Gesamtheitlicher Überblick) mit Excel 2019 mit R Workshop für Führungskräfte (Gesamtheitlicher Überblick) Chancen
Deductive Software Verification The KeY Book Haupt- und Proseminar in SoSe 2017
Deductive Software Verification The KeY Book Haupt- und Proseminar in SoSe 2017 Bernhard Beckert 02.05.17 INSTITUT FÜR THEORETISCHE INFORMATIK, KIT KIT âăş Die ForschungsuniversitÃd t in der Helmholtz-Gemeinschaft
Business Intelligence & Machine Learning
AUSFÜLLHILFE: BEWEGEN SIE DEN MAUSZEIGER ÜBER DIE ÜBERSCHRIFTEN. AUSFÜHRLICHE HINWEISE: LEITFADEN MODULBESCHREIBUNG Business Intelligence & Machine Learning Kennnummer Workload Credits/LP Studiensemester
Artificial Intelligence. Was ist das? Was kann das?
Artificial Intelligence Was ist das? Was kann das? Olaf Erichsen Tech-Day Hamburg 13. Juni 2017 Sehen wir hier bereits Künstliche Intelligenz (AI)? Quelle: www.irobot.com 2017 Hierarchie der Buzzwords
Modulliste. für den Masterstudiengang. Data & Knowledge Engineering (alt) an der Otto von Guericke Universität Magdeburg Fakultät für Informatik
Modulliste für den Masterstudiengang Data & Knowledge Engineering (alt) an der Otto von Guericke Universität Magdeburg Fakultät für Informatik vom Sommersemester 2019 Der Masterstudiengang Data & Knowledge
(Software) Architektur der Dinge. Roland Graf / Simon Kranzer IKT-Forum 2016 I(o)T for Industry - Von IT zu IoT
(Software) Architektur der Dinge Roland Graf / Simon Kranzer IKT-Forum 2016 I(o)T for Industry - Von IT zu IoT Hardware Mainframe Speichersysteme Rechner Kopplung Zentralisierung Anwendungsprogramme Software
Vorbesprechung für das Bachelorseminar Information Theoretic Data Mining
Vorbesprechung für das Bachelorseminar Information Theoretic Data Mining Prof. Dr. Christian Böhm Dominik Mautz Dr. Bianca Wackersreuther Allgemeines Termine: Di, 25.04.2017, 12.00-14.00 Uhr in Raum C
Fachgruppe Statistik, Risikoanalyse & Computing. STAT672 Data Mining. Sommersemester 2007. Prof. Dr. R. D. Reiß
Fachgruppe Statistik, Risikoanalyse & Computing STAT672 Data Mining Sommersemester 2007 Prof. Dr. R. D. Reiß Überblick Data Mining Begrifflichkeit Unter Data Mining versteht man die Computergestützte Suche
Data-Warehouse-Praktikum
Data-Warehouse-Praktikum WS 18/19 Universität Leipzig, Institut für Informatik Abteilung Datenbanken Prof. Dr. E. Rahm V. Christen, M. Franke, Z. Sehili {christen, franke, sehili}@informatik.uni-leipzig.de
Seminare WS2018/19 : Informationsveranstaltung
Seminare WS2018/19 : Informationsveranstaltung 09.07.2018 Lehrstuhl für Wirtschaftsinformatik Prof. Dr. Richard Lackes technische universität dortmund 1 Organisatorisches Ansprechpartner Organisatorische
Wissenschaftliches Arbeiten
Wissenschaftliches Arbeiten Schriftliche Ausarbeitungen Guido de Melo Seite 2 Ablauf von Seminaren Blockseminar Themenvergabe Recherche Ausarbeitung Review Vortrag/Präsentation Seite 3 Lernziele Eigenständige
Projektseminar Mobilkommunikation Projektseminar MIKS
Projektseminar Mobilkommunikation Projektseminar MIKS Sommersemester 2013 Umfang Ablauf Themenvorstellung - 1 - Umfang Für Bachelor Informatik: 6. Semester Wahlpflichtmodul Mobilkommunikation 4 SWS, 5
Entwicklung einer KI für Skat. Hauptseminar Erwin Lang
Entwicklung einer KI für Skat Hauptseminar Erwin Lang Inhalt Skat Forschung Eigene Arbeit Risikoanalyse Skat Entwickelte sich Anfang des 19. Jahrhunderts Kartenspiel mit Blatt aus 32 Karten 3 Spieler Trick-taking
Vertiefte Themen in Mobilen und Verteilten Systemen
Seminar Vertiefte Themen in Mobilen und Verteilten Systemen Veranstalter: Prof. Dr. Linnhoff-Popien Durchführung: Marie Kiermeier, Sebastian Feld Seminar Vertiefte Themen in Mobilen und Verteilten Systemen
Data Mining 7-1. Kapitel 7: Advertising on the Web. Johannes Zschache Wintersemester 2018/19
Data Mining Kapitel 7: Advertising on the Web Johannes Zschache Wintersemester 2018/19 Abteilung Datenbanken, Universität Leipzig http://dbs.uni-leipzig.de Data Mining 7-1 7-2 Data Mining Übersicht Hochdimension.
Wissenschaftliches Arbeiten in der Informatik 1 (Wintersemester 2017/18)
Wissenschaftliches Arbeiten in der Informatik 1 (Wintersemester 2017/18) Steffen Lange [email protected] copyrighted material (for h_da student use only) Über mich Fachgebiet: Theoretische Informatik
Geometrische Algorithmen für Anwendungen in der Geovisualisierug
Geometrische Algorithmen für Anwendungen in der Geovisualisierug Institut für Theoretische Informatik Lehrstuhl für Algorithmik Prof. Dorothea Wagner Institut für Algebra und Geometrie Arbeitsgruppe Diskrete
Kick-Off Paralleles Programmieren
Fakultät Informatik Institut für Software- und Multimediatechnik, Lehrstuhl für Softwaretechnologie Kick-Off Paralleles Programmieren Thomas Kühn Motivation Moore's Law The complexity for minimum component
Pioniere der Informatik
Pioniere der Informatik Seminar im Wintersemester 2009/10 Martin Lange Institut für Informatik, LMU München 20. Oktober 2009 Pioniere der Informatik, M. Lange, IFI/LMU: Organisatorisches 1 Termine Seminar
Artificial Intelligence. Deep Learning Neuronale Netze
Artificial Intelligence Deep Learning Neuronale Netze REVOLUTION Lernende Maschinen Mit lernenden Maschinen/Deep Learning erleben wir aktuell eine Revolution in der Informationsverarbeitung. Neue Methoden
Mustererkennung und Klassifikation
Mustererkennung und Klassifikation WS 2007/2008 Fakultät Informatik Technische Informatik Prof. Dr. Matthias Franz [email protected] www-home.htwg-konstanz.de/~mfranz/heim.html Grundlagen Überblick
Seminar Programmierung und Reaktive Systeme
Seminar Programmierung und Reaktive Systeme Qualitätssicherung Softwareintensiver Eingebetteter Systeme Betreuer: Sascha Lity, Hauke Baller in Kooperation mit dem Institut für Softwaretechnik und Fahrzeuginformatik
Seminar: Maschinelles Lernen und Deep Learning
Seminar: Maschinelles Lernen und Deep Learning Sommersemester 2018 Prof. Dr. Xiaoyi Jiang, Sören Klemm, Aaron Scherzinger Institut für Informatik, Arbeitsgruppe Pattern Recognition and Image Analysis (PRIA)
:21 Uhr Modulbeschreibung #1290/1 Seite 1 von 5
04.12.2015 16:21 Uhr Modulbeschreibung #1290/1 Seite 1 von 5 Modulbeschreibung Maschinelles Lernen 1 Modultitel: Maschinelles Lernen 1 Machine Learning 1 URL: Leistungspunkte: 9 Sekretariat: Modulsprache:
Die Beziehung zwischen Mensch und Maschine wird neu definiert
Die Beziehung zwischen Mensch und Maschine wird neu definiert www.futuristgerd.com www.gerdleonhard.de www.gerdtube.com @gleonhard Was macht ein Futurist? Es regnete nicht als Noah die Arche baute Foresights
Globale und Individuelle Schmerz-Klassifikatoren auf Basis relationaler Mimikdaten
Globale und Individuelle Schmerz-Klassifikatoren auf Basis relationaler Mimikdaten M. Siebers 1 U. Schmid 2 1 Otto-Friedrich-Universität Bamberg 2 Fakultät für Wirtschaftsinformatik und Angewandte Informatik
Trends in Mobilen und Verteilten Systemen
Seminar Trends in Mobilen und Verteilten Systemen Veranstalter: Prof. Dr. Linnhoff-Popien Durchführung: Sebastian Feld Seminar Trends in Mobilen und Verteilten Systemen Folie 1 Termine Termine Mo, 27.04.15,
Support Vector Machines und Kernel-Methoden
Support Vector Machines und Kernel-Methoden Seminar Bernd Bischl und Heike Trautmann Lehrstuhl Computergestützte Statistik Fakultät Statistik TU Dortmund 7. Juli 2010 Trautmann, Bischl (Fakultät Statistik)
Machinelles Lernen. «Eine kleine Einführung» BSI Business Systems Integration AG
Machinelles Lernen «Eine kleine Einführung» @ZimMatthias Matthias Zimmermann BSI Business Systems Integration AG «Welcher Unterschied besteht zum Deep Blue Schachcomputer vor 20 Jahren?» AlphaGo Hardware
Was ist, kann und darf Deep Learning? Dr. Beat Tödtli Laboratory for Web Science
Was ist, kann und darf Deep Learning? Dr. Beat Tödtli Laboratory for Web Science 15.12.2017 Suchinteresse 15.12.2017 Was ist, kann und darf Deep Learning? 2 Google Trends für Deep Learning ILSVRC 2012:
Supervised & Unsupervised Machine Learning
Machine Learning-Algorithmen in Python mit scikit-learn Machine Learning-Algorithmen in Python mit scikit-learn Kurzbeschreibung Machine Learning-Algorithmen sind ein elementares Element von Künstlicher
Seminare SS 2019: Informationsveranstaltung
Seminare SS 2019: Informationsveranstaltung 17.01.2019 Lehrstuhl für Wirtschaftsinformatik Prof. Dr. Richard Lackes technische universität dortmund 1 Organisatorisches Ansprechpartner Organisatorische
Übersicht & Einführung
Michael Wand Institut für Informatik. Angewandte Mathematik am Rechner 2 WINTERSEMESTER 2017/18 *#$?!! Kapitel 0 Übersicht & Einführung Links! WWW-Ressourcen Webseite zum Praktikum Einstieg (Weiterleitung
Statistische Methoden der Datenanalyse
Statistische Methoden der Datenanalyse Vorlesung im Sommersemester 2008 H. Kolanoski Humboldt-Universität zu Berlin Inhaltsverzeichnis Literaturverzeichnis iii 1 Grundlagen der Statistik 3 1.1 Wahrscheinlichkeit............................
Secure Software Engineering/ Sicherheit und Softwaretechnik
1/ 14 Secure Software Engineering/ Sicherheit und Softwaretechnik Sommersemester 2016 RGSE - Research Group for Software Engineering 27.04.2016 Agenda 2/ 14 1 Hintergründe zum Seminar 2 Organisatorisches
Lars Schmidt-Thieme et al., Information Systems and Machine Learning Lab (ISMLL), University of Hildesheim, Germany, 0/13
0/13 Lehrveranstaltungen Wintersemester 2011/2012 WI-Gebiet Anwendungssysteme (teilw.) WI-Gebiet Business Intelligence Informatik-Gebiet KI & Maschinelles Lernen Prof. Dr. Dr. Lars Schmidt-Thieme Information
Gerhard Svolba, SAS Austria Mannheim, 2. März KSFE
Wie bringe ich 4 unterschiedliche Analytik-Benutzergruppen an einen Tisch? Die Offenheit von SAS Viya ermöglicht eine Analyseplattform für unterschiedliche Benutzertypen Gerhard Svolba, SAS Austria Mannheim,
Seminar Informationssysteme. Prof. Roberto V. Zicari
Seminar Informationssysteme Prof. Roberto V. Zicari Dr. Karsten Tolle, Todor Ivanov, Marten Rosselli, Kim Hee Sommersemester 2017 Termine - Seminar Di. 25.4.2017 Vorbesprechung und Themenausgabe 14:15
Praxis der Forschung im Sommersemester 2017
Praxis der Forschung im Sommersemester 2017 Prof. Dr.-Ing. Tamim Asfour, Prof. Dr. Bernhard Beckert, Prof. Dr. Ralf Reussner, Prof. Dr.-Ing. Michael Beigl, Prof. Dr.-Ing. Rainer Stiefelhagen Fakultät für
Foundations of Image Formation and. Pattern Recognition
Foundations of Image Formation and Picture Analysis - Pattern Recognition Prof. Dr. H. Burkhardt Chair of Pattern Recognition and Image Processing Computer Science Faculty Albert-Ludwigs-University of
Neue Trends und neue Möglichkeiten der datengetriebenen Versorgungsforschung
Neue Trends und neue Möglichkeiten der datengetriebenen Versorgungsforschung Hamburg 16.11.2016 Nmedia Fotolia Fraunhofer-Institut für Intelligente Analyseund Informationssysteme Fraunhofer IAIS - Wir
Vergleich von SVM und Regel- und Entscheidungsbaum-Lernern
Vergleich von SVM und Regel- und Entscheidungsbaum-Lernern Chahine Abid Bachelor Arbeit Betreuer: Prof. Johannes Fürnkranz Frederik Janssen 28. November 2013 Fachbereich Informatik Fachgebiet Knowledge
Master-Studiengang & Bewerbung/Zulassung. Judith Zimmermann Studienkoordinatorin, Departement Informatik, ETH Zürich
Master-Studiengang & Bewerbung/Zulassung Judith Zimmermann Studienkoordinatorin, Departement Informatik, ETH Zürich Master's in Data Science 120 Core Courses 62 Data Analysis 16 Information and Learning
Seminarvorbesprechung
Seminarvorbesprechung Christian Funk, Christiane Barz, Christoph Sorge, Heiko Schepperle, Patrick Jochem Ausgewählte technische, rechtliche und ökonomische Aspekte des Entwurfs von Fahrerassistenzsystemen
Allgemeine Geschäftsbedingungen, Version 0.7
Allgemeine Geschäftsbedingungen, Version 0.7 Präambel Anregung für die Ausarbeitung, Leitfaden zur Selbsteinschätzung, Grundlage zur kritischen Auseinandersetzung, transparente Kriterien für eine Bewertung
Seminar Informationsvisualisierung
Seminar Informationsvisualisierung Thema: Seminar Dozent: Dr. Dirk Zeckzer [email protected] Sprechstunde: nach Vereinbarung Umfang: 2 Prüfungsfach: Modul Fortgeschrittene Computergrafik
Collaboration and Motivation in Social Networks
Wirtschaftswissenschaftliche Fakultät Collaboration and Motivation in Social Networks Geblocktes Bachelorseminar Sommersemester 2017 Sommersemester 2017 Prof. Dr. Marina Fiedler M.Sc. Franz Strich Lehrstuhl
Seminar. Textdatenanalyse. Carsten Jentsch & Jonas Rieger. Sommersemester fakultät statistik
Seminar Textdatenanalyse Carsten Jentsch & Jonas Rieger Sommersemester 2019 fakultät statistik Was versteht man unter Textdatenanalyse? Text Mining (Wikipedia): Text Mining, seltener auch Textmining, Text
Evolutionäre Algorithmen Einführung
Evolutionäre Algorithmen Einführung Prof. Dr. Rudolf Kruse Pascal Held {kruse,pheld}@iws.cs.uni-magdeburg.de Otto-von-Guericke-Universität Magdeburg Fakultät für Informatik Institut für Wissens- und Sprachverarbeitung
