WERKZEUGE DER MUSTERERKENNUNG UND DES MASCHINELLEN LERNENS Vorlesung im Sommersemester 2017 Prof. E.G. Schukat-Talamazzini Stand: 5. April 2017 Lehrbereich Informatik Intelligente Systeme Vertiefung Künstliche Intelligenz und Mustererkennung Professur für Musteranalyse Lehrangebot Wintersemester & Sommersemester Inhaltliche Abhängigkeiten STOCHASTISCHE GRAMMATIK- MODELLE 2V M.Sc. WERKZEUGE ( R ) der Mustererkennung und des Maschinellen Lernens 2V/U B.Sc. MUSTERERKENNUNG 4V B.Sc. MASCHINELLES LERNEN UND DATA MINING 4V M.Sc. SPEZIELLE MUSTERANALYSE- SYSTEME 2V M.Sc. Meine Lehrveranstaltungen für... Informatiker & Bioinformatiker & Informatikerinnen & Bioinformatikerinnen SOMMERSEMESTER ASQ und Intelligente Systeme 4V EF Inf. Bachelor Mustererkennung 4V Master Werkzeuge ME/ML Gramma- 2V Stochastische tikmodelle Biometriesysteme (Seminar) 2Ü Statistische Musteranalyse 2S WINTERSEMESTER Literaturarbeit und Präsentation ASQ Strukturiertes Programmieren Maschinelles Lernen und Datamining 2S 4V+2Ü 4V Spezielle Musteranalysesysteme 2V
Wie studiere ich MUSTERANALYSE? Studiengänge: Informatik Bioinformatik Angewandte Informatik Werkzeuge Mustererkennung & Maschinelles Lernen Vorlesung der Bachelor/Master-Studiengänge 2V/P 3 LP Bachelor Mustererkennung 6LP We kzeuge ME/ML 3LP Vertiefungsangebote auf Antrag beim Prüfungsamt: Maschinelles Lernen 6LP Master Maschinelles Lernen 6LP Stochast. Grammatik 3LP Musteranalysesysteme 3LP Nivellierungsmodule auf Antrag beim Prüfungsamt: Mustererkennung 6LP We kzeuge ME/ML 3LP B.Sc. Informatik B.Sc. Ang.Inform. B.Sc. Bioinform. Zusatzmodul KI/ME & INT auf Antrag Mustererkennung Vorlesung der Bachelor/Master-Studiengänge 4V 6 LP Maschinelles Lernen & Data Mining Vorlesung der Master-Studiengänge 4V 6 LP B.Sc. Informatik B.Sc. Bioinform. B.Sc. Ang.Inform. Pflicht im Anw.fach CNS LG Informatik FS 6 9 Schwerpunkt KI/ME M.Sc. Comp.Science B.Sc. Informatik Zusatzangebot LG Informatik FS 6 9
Stochastische Grammatikmodelle Vorlesung der Master-Studiengänge 2V 3 LP Spezielle Musteranalysesysteme Vorlesung der Master-Studiengänge 2V 3 LP Schwerpunkt KI/ME M.Sc. Comp.Science Informatik Vorlesungsstoff Inhaltliche Strukturierung 1. Die Programmiersprache Sprachumfang, Installation, Sitzung, Elementargrafik 2. Rechnen in : die wichtigen Klassen Vektor, Matrix, Liste, Dataframe, Faktor, Kontrolle, Vektorisierung, Funktionen, S3-Klassen 3. Datensätze & Grafikfunktionen in Zeichenkette, Datensatz, E/A, Paket Grafik: 1D, 2D, 3D, HD 4. Modellieren in Statistikfunktionen, Verteilungen, Formula-Objekte, Vorhersagemodelle, Optimierung 5. Ausgewählte Werkzeuge für ME/ML/DM Signalverarbeitung, Transformation, Regression, Klassifikation, Clustering
Semesterstart (Sitzungen 1 3) 90 Minuten Vorlesungsfolien Vorlesung Sitzungsablauf und Vorlesungsfolien Semesterhauptteil (Sitzungen 4 14) 45 Minuten Übungsaufgaben 45 Minuten Vorlesungsfolien Die Vorlesungsinhalte sind hierarchisch gegliedert. (wenn man Glück hat) Die Vorlesung selbst besitzt svst. eine streng lineare Abfolge. Ein Vorlesungsskript auch, aber Sie können es in beliebiger Reihenfolge lesen. Das Folienskript folgt der inhaltlichen Hierarchie... Einfaches neben Schwierigem Standards neben Exoten Vorlesung Nutzung der Folienpräsentation Die Folien sollen vom Mitschreiben während der Vorlesung entlasten. Das Mitschreiben wird dadurch nicht überflüssig. Die Folien sind kein Lehrbuch. Die Folien sind daher im allgemeinen nur mit den Erläuterungen während der Vorlesung und entsprechenden eigenen Notizen verständlich. Übungsaufgaben Bearbeitung der Aufgabenblätter URL: http://www.minet.uni-jena.de/fakultaet/schukat/wmm/ss17/node2.html Aufgabenblätter 10 Übungsblätter (Woche #3 bis Woche #13) 2 3 Programmieraufgaben je Blatt (WWW) Ü-Blatt/PDF & Datensätze, Infotexte, Codeschnipsel... Bearbeitung Teamarbeit oder Arbeitsteilung Verweise auf Skript Mustererkennung Rückfragen per e-mail (2 Mitglieder/Gruppe) (Kapitel/Seitenzahl) (reply ALLE) Abgabe der Lösung Programmcode Schriftliche Antworten Grafikausgaben, Tabellen e-mail mit Anhängen oder Archiv (Textdatei) (Textdatei oder PDF) (PDF, Text)
Übungsaufgaben Lösen der Hausaufgaben in Arbeitsgruppen Übungsaufgaben Workflow für die Bearbeitung der Übungsserien Arbeitsgruppen Hausaufgabenblätter werden in Gruppenarbeit gelöst. Jede Arbeitsgruppe besteht aus genau 2 Mitgliedern. (Ausnahmen nur nach persönlicher Absprache) Anmeldung per e-mail Jede Gruppe meldet sich bis Montagabend (10.4.2017) an. Gruppenname plus (Vor/Zuname/Mail) je Mitglied. Kostenloses Speed-Dating Singles melden sich bitte ebenfalls bei mir (s.o.). Sie werden dann im round-robin-verfahren verkuppelt. Ausgabe Die neue Aufgabenstellung wird freitags im Internet veröffentlicht. Woche M Abgabe Woche M + 1 Die Arbeitsgruppen liefern ihre Lösungen ab. ( 1 Papierstoß, 1 Archiv, 1 e-mail, bitte!) Deadline ist Sonntag 23:59 Uhr Rückgabe & Besprechung Woche M + 2 Die Aufgaben und ihre Lösung werden im Falle öffentlichen Interesses in der Übungsveranstaltung besprochen. Erstes Übungsblatt Ausgabe am Karfreitag, den 14.4.2017 Prüfung Was wird wann wie von wem geprüft? Prüfungsgegenstand Bearbeitung der Übungsaufgabenblätter Abgabe der Lösungen (gruppenweise) Summe erzielter Punkte Prüfungstermine (nur in Einzel- und Ausnahmefällen) Prüfungsstoff Programmierung in R Anmeldung und Zulassung zur Teilnahme und zur Prüfung
W.N. Venables and B.D. Ripley. Modern Applied Statistics with S. Springer, 2002. U. Ligges. Programmieren mit R. Springer, 2004. Norman Matloff. Art of R Programming. No Starch Press, 2011. Jürgen Groß. Grundlegende Statistik mit R. Vieweg, Wiesbaden, 2010. Programmieren in R Dirk Eddelbuettel. Seamless R and C++ Integration with Rcpp. Number 64 in Use R! Springer, 2013. Daten- und Musteranalyse in R Weitere Anwendungen für R Brian Everitt and Torsten Hothorn. An Introduction to Applied Multivariate Analysis with R. Use R. Springer, 2011. Paul S.P. Cowpertwait and Andrew V. Metcalfe. Introductory Time Series with R. Use R! Springer, 2009. Bertrand Clarke, Ernest Fokoue, and Hao Helen Zhang. Principles and Theory for Data Mining and Machine Learning. Springer Series in Statistics. Springer, 2009. Graham Williams. Data Mining with Rattle and R. Use R. Springer, 2011. Randall Pruim. Foundations and Applications of Statistics: An Introduction Using R, volume 13 of Pure and Applied Undergraduate Texts. American Mathematical Society, 2011. Søren Højsgaard, David Edwards, and Steffen Lauritzen. Graphical Models with R. Use R! Springer, 2012. Jim Albert. Bayesian Computation with R. Use R! Springer, 2009. F. Hahne, W. Huber, R. Gentleman, and S. Falcon. Bioconductor Case Studies. Use R. Springer, 2008. Giovanni Petris, Sonia Petrone, and Patrizia Campagnoli. Dynamic Linear Models with R. Use R! Springer, 2009. Eric D. Kolaczyk and Gábor Csárdi. Statistical Analysis of Network Data with R. Use R! Springer, 2014.
Maschinelles Lernen Data Mining & Modellierung G. James, D. Witten, T. Hastie, and R. Tibshirani. An Introduction to Statistical Learning. Number 103 in Springer Texts in Statistics. Springer, 2013. Christopher M. Bishop. Pattern Recognition and Machine Learning. Springer, 2006. Hardcover 60 EUR. T. Hastie, R. Tibshirani, and J. Friedman. The Elements of Statistical Learning. Springer, 2001. R.O. Duda, P.E. Hart, and D.G. Stork. Pattern Classification. Wiley Interscience, 2001. S. Furui. Digital Speech Processing, Synthesis, and Recognition. Marcel Dekker, New York, 2001. J. Han and M. Kamber. Data Mining: Concepts and Techniques. Morgan Kaufmann, 2000. David Edwards. Introduction to Graphical Modelling. Springer Texts in Statistics. Springer, New York, NY, 1995. John C. Loehlin. Latent Variable Models. Lawrence Erlbaum Assoc Inc, 2004. K.A. Bollen. Structural Equations With Latent Variables. John Wiley & Sons, 1989. Regression & Statistik Mathematische Grundlagen Alan Julian Izenman. Modern Multivariate Statistical Techniques. Regression, Classification, and Manifold Learning. Springer Texts in Statistics. Springer, 2008. Ludwig Fahrmeir, Thomas Kneib, and Stefan Lang. Regression. Springer, 2007. Peter Bühlmann and Sara van de Geer. Statistics for High-Dimensional Data. Springer Series in Statistics. Springer, 2011. J. Kreiß and G. Neuhaus. Einführung in die Zeitreihenanalyse. Springer, 2006. H.L. Harney. Bayesian Inference. Springer, 2003. M. Drmota, B. Gittenberger, G. Karigl, and A. Panholzer. Mathematik für Informatik. Heldermann Verlag, 2007. 438 Seiten fester Einband 36 EUR. L. Dümbgen. Stochastik für Informatiker. Springer, 2003. G.H. Golub and C.F. Van Loan. Matrix Computations. Johns Hopkins University Press, 1996. I.N. Bronstein and K.A. Semendjajew. Taschenbuch der Mathematik. Verlag Harri Deutsch, Thun und Frankfurt/Main, 24 edition, 1989.
Andere Sprachen & Systeme Ian H. Witten and Eibe Frank. Data Mining: Practical Machine Learning Tools and Techniques. Morgan Kaufmann, 2005. 2. Auflage. I.T. Nabney. NETLAB. Algorithms for Pattern Recognition. Advances in Pattern Recognition. Springer, 2001. Dietrich W. R. Paulus and Joachim Hornegger. Pattern Recognition of Images and Speech in C++. Advanced Studies in Computer Science. Vieweg, Wiesbaden, 1997. Willi-Hans Steeb. The Nonlinear Workbook. World Scientific, 2005. Paperback 29 Pound.