Computerlinguistische Textanalyse

Größe: px
Ab Seite anzeigen:

Download "Computerlinguistische Textanalyse"

Transkript

1 Computerlinguistische Textanalyse 10. Sitzung Einführung in die Textklassifikation Franz Matthies Lehrstuhl für Computerlinguistik Institut für Germanistische Sprachwissenschaft Friedrich-Schiller Universität Jena

2 Übersicht Klassifikation was ist das? Erster Klassifizierer (Personen Namen) Überwachtes vs. Unüberwachtes Lernen Übungsaufgaben Übersicht 2/12

3 Allgemein: Begriffliche Einordnung (Nicht )Zugehörigkeit von Objekten zu Kategorien Obst: Apfel, Birne, Mango Gemüse: Bohne, Gurke, Spinat???: Rhabarber, Melone, Erdbeere Ein Klassifizierer würde also diese Zuordnung treffen Dafür werden bestimmte Regeln benötigt Klassifikation was ist das? (1/2) 3/12

4 Spezieller: Textklassifikationen Spam oder kein Spam? Textgenre Urheberschaft Bewertungen: positiv oder negativ? Worum geht es in Forschungstexten? Klassifikation was ist das? (2/2) 4/12

5 Klassifikationsregeln die Klassifikationsregeln können von Hand erstellt oder (in den meisten Fällen sinnvoller) erlernt werden Erstellen von Trainings und Testmaterial: ng_list = [(name,gender[:-4]) for gender in names.fileids() for name in names.words(gender)] random.shuffle(ng_list) * ng_dev = ng_list[:500] ng_test = ng_list[500:1000] ng_train = ng_list[1000:] (* benötigt das modul random und names von nltk.corpus) Erster Klassifizierer (Personen Namen) (1/4) 5/12

6 Features Als nächstes brauchen wir Angaben darüber, was betrachtet werden soll ('features') Diese müssen sorgfältig gewählt werden ('overfitting' vs. 'underfitting'): def gender_features(word): features = {} word = word.lower() # features here... features['first_letter'] = word[0] return features Erster Klassifizierer (Personen Namen) (2/4) 6/12

7 Training und Test Sets Der 'feature extractor' wird nun angewendet um ein sogenanntes 'training set' und 'test set' zu erstellen: TEST = ng_dev train_set = [(gender_features(n), gender) for (n, gender) in ng_train] test_set = [(gender_features(n), gender) for (n, gender) in TEST] Noch besser ist mit apply_features zu arbeiten: train_set = nltk.classify.apply_features(gender_features, ng_train) test_set = nltk.classify.apply_features(gender_features, TEST) Erster Klassifizierer (Personen Namen) (3/4) 7/12

8 Naive Bayes in NLTK Anmerkung: bei einem Naive Bayes Klassifizierer von Klassifikationsregeln zu sprechen ist etwas irreführend, da hier keine absoluten Regeln sondern ein Wahrscheinlichkeitsmodel für Zuordnungen erlernt wird. (siehe z.b.: NLTK, Kapitel 6.5) Trainieren und Auswerten eines Naive Bayes Klassifizieres: nb_classifier = nltk.naivebayesclassifier.train(train_set) print(nltk.classify.accuracy(nb_classifier, test_set)) Erster Klassifizierer (Personen Namen) (4/4) 8/12

9 Überwachtes Lernen Lernen anhand von Trainingsmaterial, dessen Zuordnungen bekannt sind Bias Varianz Dilemma: Bias kommt durch falsche Annahmen des Klassifizierers; Abhängigkeiten werden nicht erkannt ( underfitting) Varianz kommt durch zu hohe Sensibilität gegenüber Abweichungen in den Trainingsdaten ( overfitting) Überwachtes vs. Unüberwachtes Lernen (1/2) 9/12

10 Unüberwachtes Lernen Die zugrundeliegende Struktur von Daten soll allein durch deren Erscheinung abgeleitet werden 'Einfaches' Beispiel: Clustering (Bild: Überwachtes vs. Unüberwachtes Lernen (2/2) 10/12

11 Personen Namen Klassifizierer Schau dir das 'Notebook' name-gender-classifier an (insbesondere den Abschnitt 'Evaluation'). Erweitere dann den 'feature extractor' unter konstanter Beobachtung durch die Evaluationsmechanismen. Kannst du die Genauigkeit des Naive Bayes Klassifizierers durch geeignete Features erhöhen? Übungsaufgaben (1/2) 11/12

12 Hausaufgaben Les' das Kapitel 6.1.3: Document Classification des NLTK Buchs Vollziehe nach, was dort gezeigt wird und löse dann die Übung 4 des Kapitels * Versuche weitere Features hinzuzufügen und überlege warum es besser/schlechter wird. (Denke auch an vorherige Sitzungen!) Dokumentiere bitte was du versuchst. Übungsaufgaben (2/2) 12/12

TEXTKLASSIFIKATION. WS 2011/12 Computerlinguistik I Deasy Sukarya & Tania Bellini

TEXTKLASSIFIKATION. WS 2011/12 Computerlinguistik I Deasy Sukarya & Tania Bellini TEXTKLASSIFIKATION WS 2011/12 Computerlinguistik I Deasy Sukarya & Tania Bellini GLIEDERUNG 1. Allgemeines Was ist Textklassifikation? 2. Aufbau eines Textklassifikationssystems 3. Arten von Textklassifikationssystemen

Mehr

Seminar Text- und Datamining Datamining-Grundlagen

Seminar Text- und Datamining Datamining-Grundlagen Seminar Text- und Datamining Datamining-Grundlagen Martin Hacker Richard Schaller Künstliche Intelligenz Department Informatik FAU Erlangen-Nürnberg 23.05.2013 Gliederung 1 Klassifikationsprobleme 2 Evaluation

Mehr

ML-Werkzeuge und ihre Anwendung

ML-Werkzeuge und ihre Anwendung Kleine Einführung: und ihre Anwendung martin.loesch@kit.edu (0721) 608 45944 Motivation Einsatz von maschinellem Lernen erfordert durchdachtes Vorgehen Programmieren grundlegender Verfahren aufwändig fehlerträchtig

Mehr

Vortrag zum Paper Results of the Active Learning Challenge von Guyon, et. al. Sören Schmidt Fachgebiet Knowledge Engineering

Vortrag zum Paper Results of the Active Learning Challenge von Guyon, et. al. Sören Schmidt Fachgebiet Knowledge Engineering Vortrag zum Paper Results of the Active Learning Challenge von Guyon, et. al. Sören Schmidt Fachgebiet Knowledge Engineering 11.12.2012 Vortrag zum Paper Results of the Active Learning Challenge von Isabelle

Mehr

Textmining Klassifikation von Texten Teil 1: Naive Bayes

Textmining Klassifikation von Texten Teil 1: Naive Bayes Textmining Klassifikation von Texten Teil 1: Naive Bayes Dept. Informatik 8 (Künstliche Intelligenz) Friedrich-Alexander-Universität Erlangen-Nürnberg (Informatik 8) Klassifikation von Texten 1: Naive

Mehr

Data Mining und maschinelles Lernen

Data Mining und maschinelles Lernen Data Mining und maschinelles Lernen Einführung und Anwendung mit WEKA Caren Brinckmann 16. August 2000 http://www.coli.uni-sb.de/~cabr/vortraege/ml.pdf http://www.cs.waikato.ac.nz/ml/weka/ Inhalt Einführung:

Mehr

14-TAGE NUTRICO DIET TAGESMENÜ

14-TAGE NUTRICO DIET TAGESMENÜ 14-TAGE NUTRICO DIET TAGESMENÜ PHASE 1: ANGRIFF Tag 1 Gemüse (Spinat oder Kohl unbegrenzte Menge) Obst (1 Birne oder 3 Pflaumen) Proteinreiche Nahrung (180 g fettarmes Fleisch - Putenfleisch) Abendessen

Mehr

Klassifikation im Bereich Musik

Klassifikation im Bereich Musik Klassifikation im Bereich Musik Michael Günnewig 30. Mai 2006 Michael Günnewig 1 30. Mai 2006 Inhaltsverzeichnis 1 Was ist eine Klassifikation? 3 1.1 Arten und Aufbau von Klassifikationen.................

Mehr

Seminar Künstliche Intelligenz WS 2013/14 Grundlagen des Maschinellen Lernens

Seminar Künstliche Intelligenz WS 2013/14 Grundlagen des Maschinellen Lernens Seminar Künstliche Intelligenz WS 2013/14 Grundlagen des Maschinellen Lernens Martin Hacker Richard Schaller Künstliche Intelligenz Department Informatik FAU Erlangen-Nürnberg 19.12.2013 Allgemeine Problemstellung

Mehr

Seminar Textmining SS 2015 Grundlagen des Maschinellen Lernens

Seminar Textmining SS 2015 Grundlagen des Maschinellen Lernens Seminar Textmining SS 2015 Grundlagen des Maschinellen Lernens Martin Hacker Richard Schaller Künstliche Intelligenz Department Informatik FAU Erlangen-Nürnberg 17.04.2015 Entscheidungsprobleme beim Textmining

Mehr

Automatisches Übersetzen von Gebärdensprache

Automatisches Übersetzen von Gebärdensprache 5. Aachener Gebärdenworkshop 2004 29.10.2004 Automatisches Übersetzen von Gebärdensprache Jan Bungeroth Human Language Technology and Pattern Recognition Lehrstuhl für Informatik VI D-52056 Aachen, Deutschland

Mehr

EXTRAKTION UND KLASSIFIKATION VON BEWERTETEN PRODUKTFEATURES AUF WEBSEITEN

EXTRAKTION UND KLASSIFIKATION VON BEWERTETEN PRODUKTFEATURES AUF WEBSEITEN EXTRAKTION UND KLASSIFIKATION VON BEWERTETEN PRODUKTFEATURES AUF WEBSEITEN T-SYSTEMS MULTIMEDIA SOLUTIONS GMBH, 16. FEBRUAR 2012 1. Schlüsselworte Semantic Web, Opinion Mining, Sentiment Analysis, Stimmungsanalyse,

Mehr

Vorbereitungsaufgaben

Vorbereitungsaufgaben Praktikum Bildverarbeitung / Bildinformationstechnik Versuch BV 4 / BIT 3: Mustererkennung Paddy Gadegast, CV00, 160967 Alexander Opel, CV00, 16075 Gruppe 3 Otto-von-Guericke Universität Magdeburg Fakultät

Mehr

Meine Lernplanung Wie lerne ich?

Meine Lernplanung Wie lerne ich? Wie lerne ich? Zeitraum Was will ich erreichen? Wie? Bis wann? Kontrolle Weiteres Vorgehen 17_A_1 Wie lerne ich? Wenn du deine gesteckten Ziele nicht erreicht hast, war der gewählte Weg vielleicht nicht

Mehr

Semestralklausur zur Vorlesung. Web Mining. Prof. J. Fürnkranz Technische Universität Darmstadt Sommersemester 2004 Termin: 22. 7.

Semestralklausur zur Vorlesung. Web Mining. Prof. J. Fürnkranz Technische Universität Darmstadt Sommersemester 2004 Termin: 22. 7. Semestralklausur zur Vorlesung Web Mining Prof. J. Fürnkranz Technische Universität Darmstadt Sommersemester 2004 Termin: 22. 7. 2004 Name: Vorname: Matrikelnummer: Fachrichtung: Punkte: (1).... (2)....

Mehr

Korpora in NLTK Vortrag im Seminar Computerlinguis6sche Textanalyse WS 2014/15 (B- GSW- 12, M- GSW- 09)

Korpora in NLTK Vortrag im Seminar Computerlinguis6sche Textanalyse WS 2014/15 (B- GSW- 12, M- GSW- 09) Korpora in NLTK Vortrag im Seminar Computerlinguis6sche Textanalyse WS 2014/15 (B- GSW- 12, M- GSW- 09) Johannes Hellrich Lehrstuhl für Computerlinguis6k Ins6tut für Germanis6sche SprachwissenschaQ Friedrich-

Mehr

The integration of business intelligence and knowledge management

The integration of business intelligence and knowledge management The integration of business intelligence and knowledge management Seminar: Business Intelligence Ketevan Karbelashvili Master IE, 3. Semester Universität Konstanz Inhalt Knowledge Management Business intelligence

Mehr

Phishingerkennung mittels visuellem Ähnlichkeitsvergleich. Felix Hill Ruhr-Universität Bochum felix.hill@rub.de

Phishingerkennung mittels visuellem Ähnlichkeitsvergleich. Felix Hill Ruhr-Universität Bochum felix.hill@rub.de Phishingerkennung mittels visuellem Ähnlichkeitsvergleich Felix Hill Ruhr-Universität Bochum felix.hill@rub.de 1 ÜBERSICHT Entwicklung im Bereich Phishing Ansatz Bilderkennung Evaluation G DATA EINFACH

Mehr

Data-Mining: Ausgewählte Verfahren und Werkzeuge

Data-Mining: Ausgewählte Verfahren und Werkzeuge Fakultät Informatik Institut für Angewandte Informatik Lehrstuhl Technische Informationssysteme Data-Mining: Ausgewählte Verfahren und Vortragender: Jia Mu Betreuer: Dipl.-Inf. Denis Stein Dresden, den

Mehr

Beruf als institutionelle Grundlage des Arbeitsmarktes: Anmerkungen zu einer Neukonzipierung der Berufsforschung. Martin Abraham

Beruf als institutionelle Grundlage des Arbeitsmarktes: Anmerkungen zu einer Neukonzipierung der Berufsforschung. Martin Abraham Beruf als institutionelle Grundlage des Arbeitsmarktes: Anmerkungen zu einer Neukonzipierung der Berufsforschung Workshop Perspektiven einer arbeitsmarktbezogenen Berufsforschung in Deutschland IAB 10.6.2008

Mehr

Data Mining - Wiederholung

Data Mining - Wiederholung Data Mining - Wiederholung Norbert Fuhr 9. Juni 2008 Problemstellungen Problemstellungen Daten vs. Information Def. Data Mining Arten von strukturellen Beschreibungen Regeln (Klassifikation, Assoziations-)

Mehr

Vorlesungsplan. Von Naïve Bayes zu Bayesischen Netzwerk- Klassifikatoren. Naïve Bayes. Bayesische Netzwerke

Vorlesungsplan. Von Naïve Bayes zu Bayesischen Netzwerk- Klassifikatoren. Naïve Bayes. Bayesische Netzwerke Vorlesungsplan 17.10. Einleitung 24.10. Ein- und Ausgabe 31.10. Reformationstag, Einfache Regeln 7.11. Naïve Bayes, Entscheidungsbäume 14.11. Entscheidungsregeln, Assoziationsregeln 21.11. Lineare Modelle,

Mehr

Naive Bayes. 5. Dezember 2014. Naive Bayes 5. Dezember 2014 1 / 18

Naive Bayes. 5. Dezember 2014. Naive Bayes 5. Dezember 2014 1 / 18 Naive Bayes 5. Dezember 2014 Naive Bayes 5. Dezember 2014 1 / 18 Inhaltsverzeichnis 1 Thomas Bayes 2 Anwendungsgebiete 3 Der Satz von Bayes 4 Ausführliche Form 5 Beispiel 6 Naive Bayes Einführung 7 Naive

Mehr

KLASSIFIZIERUNG VON SCHADSOFTWARE ANHAND VON SIMULIERTEM NETZWERKVERKEHR

KLASSIFIZIERUNG VON SCHADSOFTWARE ANHAND VON SIMULIERTEM NETZWERKVERKEHR Retail KLASSIFIZIERUNG VON SCHADSOFTWARE ANHAND VON SIMULIERTEM NETZWERKVERKEHR Technology Life Sciences & Healthcare Florian Hockmann Ruhr-Universität Bochum florian.hockmann@rub.de Automotive Consumer

Mehr

Qualitätsmanagement an beruflichen Schulen in Deutschland: Stand der Implementierung. Diplomarbeit

Qualitätsmanagement an beruflichen Schulen in Deutschland: Stand der Implementierung. Diplomarbeit Qualitätsmanagement an beruflichen Schulen in Deutschland: Stand der Implementierung Diplomarbeit vorgelegt an der Universität Mannheim Lehrstuhl für Wirtschaftspädagogik Prof. Dr. Hermann G. Ebner von

Mehr

Projektaufgaben Block 2

Projektaufgaben Block 2 Kurs BZQ III - Stochastikpraktikum WS 2013/14 Humboldt-Universität zu Berlin Randolf Altmeyer Philip-Moritz Eckert Projektaufgaben Block 2 Abgabe: bis 10.12.2013 Zur Einstimmung (freiwillig, ohne Abgabe)

Mehr

Mit KI gegen SPAM. Proseminar Künstliche Intelligenz

Mit KI gegen SPAM. Proseminar Künstliche Intelligenz Mit KI gegen SPAM Proseminar Künstliche Intelligenz SS 2006 Florian Laib Ausblick Was ist SPAM? Warum SPAM-Filter? Naive Bayes-Verfahren Fallbasiertes Schließen Fallbasierte Filter TiMBL Vergleich der

Mehr

Klassifikationsaufgaben mit der SENTRAX. Konkreter Fall: Automatische Detektion von SPAM. Dirk T. Frobese

Klassifikationsaufgaben mit der SENTRAX. Konkreter Fall: Automatische Detektion von SPAM. Dirk T. Frobese Proceedings des Fünften Hildesheimer Evaluierungs- und Retrievalworkshop (HIER 2006) Klassifikationsaufgaben mit der SENTRAX. Konkreter Fall: Automatische Detektion von SPAM Dirk T. Frobese Universität

Mehr

Universität Zürich Informatikdienste. SpamAssassin. Spam Assassin. 25.04.06 Go Koordinatorenmeeting 27. April 2006 1

Universität Zürich Informatikdienste. SpamAssassin. Spam Assassin. 25.04.06 Go Koordinatorenmeeting 27. April 2006 1 Spam Assassin 25.04.06 Go Koordinatorenmeeting 27. April 2006 1 Ausgangslage Pro Tag empfangen die zentralen Mail-Gateways der Universität ca. 200 000 E-Mails Davon werden über 70% als SPAM erkannt 25.04.06

Mehr

Bevorzugte Lebensmittel / Kunden

Bevorzugte Lebensmittel / Kunden Lieber Kunde, www.body-coaches.de Bevorzugte Lebensmittel / Kunden damit wit Ihre Planung so angenehm wie möglich für Sie gestalten können bitten wir Sie, sich ein paar Minuten zeit zu nehmen und die ua.

Mehr

Sentiment Analysis & Opinion Mining. Sonja Subičin 04. Mai 2010

Sentiment Analysis & Opinion Mining. Sonja Subičin 04. Mai 2010 Sentiment Analysis & Opinion Mining Sonja Subičin 04. Mai 2010 Gliederung Text Mining Sentiment Analysis & Opinion Mining System zur Sentiment Classification System Experimente Perspektiven Text Mining

Mehr

Auszüge eines Vortrags von Axel Braunger im Rahmen der TOPIX Tour 2009

Auszüge eines Vortrags von Axel Braunger im Rahmen der TOPIX Tour 2009 Ressourcenplanung Auszüge eines Vortrags von Axel Braunger im Rahmen der TOPIX Tour 2009 28.09.09 bis 08.10.09 TOPIX Informationssysteme AG Ressourcenplanung Grundlagen Im Zuge des Aufbaus der Ressourcenplanung

Mehr

Kapitel 3 Das Projekt Bankkonto Seite 1

Kapitel 3 Das Projekt Bankkonto Seite 1 Kapitel 3 Das Projekt Bankkonto Seite 1 3 Das Projekt Bankkonto Nun wirst du dich etwas gründlicher mit dem Quelltext einer Klasse beschäftigen. Du lernst, wie zwei Objekte eine gemeinsame Aufgabe erledigen.

Mehr

INFOnline SZM Administration Guide Event, (Non-)PI, Code, KAT2.0

INFOnline SZM Administration Guide Event, (Non-)PI, Code, KAT2.0 INFOnline SZM Administration Guide Event, (Non-)PI, Code, KAT2.0 SZM mobile Applications Einleitung Die SZM-Messung von APPs ist ein modernes Mess-Verfahren welches eine standardisierte Nutzungsmessung

Mehr

Güte von Tests. die Wahrscheinlichkeit für den Fehler 2. Art bei der Testentscheidung, nämlich. falsch ist. Darauf haben wir bereits im Kapitel über

Güte von Tests. die Wahrscheinlichkeit für den Fehler 2. Art bei der Testentscheidung, nämlich. falsch ist. Darauf haben wir bereits im Kapitel über Güte von s Grundlegendes zum Konzept der Güte Ableitung der Gütefunktion des Gauss im Einstichprobenproblem Grafische Darstellung der Gütefunktionen des Gauss im Einstichprobenproblem Ableitung der Gütefunktion

Mehr

Statistik und Wahrscheinlichkeitsrechnung

Statistik und Wahrscheinlichkeitsrechnung Statistik und Wahrscheinlichkeitsrechnung Übung 2 28.02.2008 1 Inhalt der heutigen Übung Beschreibende Statistik Gemeinsames Lösen der Übungsaufgaben 2.1: Häufigkeitsverteilung 2.2: Tukey Boxplot 25:Korrelation

Mehr

Info zum Junk-Mail-Filter in Thunderbird:

Info zum Junk-Mail-Filter in Thunderbird: Datenverarbeitungszentrale Datenverarbeitungszentrale dvz@fh-muenster.de www.fh-muenster.de/dvz Info zum Junk-Mail-Filter in Thunderbird: Der Grossteil der Benutzer verwendet zusätzlich zum zentralen Mail-Filter

Mehr

Ernährungspyramide: Gemüse, Salat, Obst

Ernährungspyramide: Gemüse, Salat, Obst Empfehlung Täglich 3 Portionen Gemüse und 2 Portionen Obst; möglichst einheimisches Saisongemüse und Saisonobst verwenden.! Hinweis Die Verarbeitung ist von entscheidender Bedeutung für die Zuordnung in

Mehr

MS SQL Server 2012 (4)

MS SQL Server 2012 (4) MS SQL Server 2012 (4) Data Mining, Analyse und multivariate Verfahren Marco Skulschus Jan Tittel Marcus Wiederstein Webseite zum Buch: http://vvwvv.comelio-medien.com/buch-kataiog/ms sql_server/ms sql

Mehr

Tiefgreifende Prozessverbesserung und Wissensmanagement durch Data Mining

Tiefgreifende Prozessverbesserung und Wissensmanagement durch Data Mining Tiefgreifende Prozessverbesserung und Wissensmanagement durch Data Mining Ausgangssituation Kaizen Data Mining ISO 9001 Wenn andere Methoden an ihre Grenzen stoßen Es gibt unzählige Methoden, die Abläufe

Mehr

8 Kapitel TypoScript 219

8 Kapitel TypoScript 219 8 Kapitel TypoScript TypoScript gehört zu den umfangreichsten und zugleich wichtigsten Bereichen, die ein TYPO3 Integrator beherrschen muss. Nahezu die gesamte Erstellung einer Website, angefangen bei

Mehr

www.wunderwelten.net team@wunderwelten.net Blöcker & Jenner Pohlstraße 33 10785 Berlin Tel. 0049 (0)30 269 30 690

www.wunderwelten.net team@wunderwelten.net Blöcker & Jenner Pohlstraße 33 10785 Berlin Tel. 0049 (0)30 269 30 690 www.wunderwelten.net team@wunderwelten.net Blöcker & Jenner Pohlstraße 33 10785 Berlin Tel. 0049 (0)30 269 30 690 Herzlich willkommen! Auf den folgenden Seiten finden Sie Unterrichtsmaterial, das Ihnen

Mehr

Vortrag Diplomarbeit. Testentwurf in komplexen softwareintensiven Systemen mit der Klassifikationsbaummethode. von Rebecca Tiede

Vortrag Diplomarbeit. Testentwurf in komplexen softwareintensiven Systemen mit der Klassifikationsbaummethode. von Rebecca Tiede Vortrag Diplomarbeit Testentwurf in komplexen softwareintensiven Systemen mit der Klassifikationsbaummethode von Rebecca Tiede 1 Inhalt des Vortrags Einführung und Motivation Klassifikationsbaummethode

Mehr

Ihr Ergebnis der Ausbildungsevaluation anhand des Freiburger Qualitätsbogen Coachingausbildung

Ihr Ergebnis der Ausbildungsevaluation anhand des Freiburger Qualitätsbogen Coachingausbildung Ihr Ergebnis der Ausbildungsevaluation anhand des Freiburger Qualitätsbogen Coachingausbildung Evaluation Ihrer Coachingausbildung Name der Ausbildung Muster Überreicht an Max Mustermann Der Freiburger

Mehr

Text Mining 4. Seminar Klassifikation

Text Mining 4. Seminar Klassifikation Text Mining 4. Seminar Klassifikation Stefan Bordag 1. Klassifikation Stringklassifikation (männliche-weibliche Vornamen) Dokument klassifikation Bayesian Neuronal network (Decision tree) (Rule learner)

Mehr

Übersicht Modulangebot

Übersicht Modulangebot Übersicht Modulangebot Grundlagen Code Studienjahr Typ Titel LP Workload B-PSY-101 1 P Allgemeine Psychologie I 6 B-PSY-102 1 P Allgemeine Psychologie II 6 B-PSY-103 1 P Biologische Psychologie 9 B-PSY-104

Mehr

6. Künstliche Intelligenz

6. Künstliche Intelligenz 6.1. Turing-Test 6.2. Lernen In diesem Abschnitt besprechen wir wie man an Hand von Beispielen lernt, Objekte zu erkennen und verschiedene Dinge voneinander zu unterscheiden. Diese sogenannte Mustererkennung

Mehr

Kurzgeschichte zum Training der Aufmerksamkeit. Natürlich kann die Geschichte auch vom Kind gelesen werden.

Kurzgeschichte zum Training der Aufmerksamkeit. Natürlich kann die Geschichte auch vom Kind gelesen werden. Kurzgeschichte zum Training der Aufmerksamkeit 1. Der Trainer liest die original Geschichte vor, während das Kind aufmerksam zuhören soll. 2. Der Trainer liest die gefälschte Geschichte vor, und das Kind

Mehr

Personalisierung. Der Personalisierungsprozess Nutzerdaten erheben aufbereiten auswerten Personalisierung. Data Mining.

Personalisierung. Der Personalisierungsprozess Nutzerdaten erheben aufbereiten auswerten Personalisierung. Data Mining. Personalisierung Personalisierung Thomas Mandl Der Personalisierungsprozess Nutzerdaten erheben aufbereiten auswerten Personalisierung Klassifikation Die Nutzer werden in vorab bestimmte Klassen/Nutzerprofilen

Mehr

Ideen der Informatik. Maschinelles Lernen. Kurt Mehlhorn Adrian Neumann Max-Planck-Institut für Informatik

Ideen der Informatik. Maschinelles Lernen. Kurt Mehlhorn Adrian Neumann Max-Planck-Institut für Informatik Ideen der Informatik Maschinelles Lernen Kurt Mehlhorn Adrian Neumann Max-Planck-Institut für Informatik Übersicht Lernen: Begriff Beispiele für den Stand der Kunst Spamerkennung Handschriftenerkennung

Mehr

Access 2013. Grundlagen für Anwender. Susanne Weber. 1. Ausgabe, 1. Aktualisierung, Juni 2013

Access 2013. Grundlagen für Anwender. Susanne Weber. 1. Ausgabe, 1. Aktualisierung, Juni 2013 Access 2013 Susanne Weber 1. Ausgabe, 1. Aktualisierung, Juni 2013 Grundlagen für Anwender ACC2013 2 Access 2013 - Grundlagen für Anwender 2 Mit Datenbanken arbeiten In diesem Kapitel erfahren Sie was

Mehr

Evaluation. Caroline Sporleder. Computational Linguistics Universität des Saarlandes. Sommersemester 2011 26.05.2011

Evaluation. Caroline Sporleder. Computational Linguistics Universität des Saarlandes. Sommersemester 2011 26.05.2011 Evaluation Caroline Sporleder Computational Linguistics Universität des Saarlandes Sommersemester 2011 26.05.2011 Caroline Sporleder Evaluation (1) Datensets Caroline Sporleder Evaluation (2) Warum evaluieren?

Mehr

Text Mining und CRM. Hans Hermann Weber Univ. Erlangen IMMD 8, den 12.09.03

Text Mining und CRM. Hans Hermann Weber Univ. Erlangen IMMD 8, den 12.09.03 Text Mining und CRM Hans Hermann Weber Univ. Erlangen IMMD 8, den 12.09.03 Was ist Textmining Unstrukturierte Daten (Text) anreichern mit Strukturinformation: Metadaten hinzufügen Struktur (Segmentinformation)

Mehr

Nachweis der Nährstoffe (Fette, Kohlenhydrate, Eiweiß) in verschiedenen Nahrungsmittel

Nachweis der Nährstoffe (Fette, Kohlenhydrate, Eiweiß) in verschiedenen Nahrungsmittel Nachweis der Nährstoffe (Fette, Kohlenhydrate, Eiweiß) in verschiedenen Nahrungsmittel 1. Nachweis von Fett Material: - verschiedene Lebensmittel zum Testen, z. B. Apfel, Gurke, Saft, Kartoffelchips, Butter,

Mehr

Service Transition. Martin Beims. WKV SS13 Karsten Nolte. Mittwoch, 19. Juni 13

Service Transition. Martin Beims. WKV SS13 Karsten Nolte. Mittwoch, 19. Juni 13 Service Transition Martin Beims WKV SS13 Karsten Nolte Inhalt Einführung & Ziele Transition Planning & Support Change Management Service Asset & Configuration Management Release & Deployment Management

Mehr

3. Entscheidungsbäume. Verfahren zum Begriffslernen (Klassifikation) Beispiel: weiteres Beispiel: (aus Böhm 2003) (aus Morik 2002)

3. Entscheidungsbäume. Verfahren zum Begriffslernen (Klassifikation) Beispiel: weiteres Beispiel: (aus Böhm 2003) (aus Morik 2002) 3. Entscheidungsbäume Verfahren zum Begriffslernen (Klassifikation) Beispiel: weiteres Beispiel: (aus Böhm 2003) (aus Morik 2002) (aus Wilhelm 2001) Beispiel: (aus Böhm 2003) Wann sind Entscheidungsbäume

Mehr

Sentiment Analysis (SA) Robert Bärhold & Mario Sänger Text Analytics WS 2012/13 Prof. Leser

Sentiment Analysis (SA) Robert Bärhold & Mario Sänger Text Analytics WS 2012/13 Prof. Leser Sentiment Analysis (SA) Robert Bärhold & Mario Sänger Text Analytics WS 2012/13 Prof. Leser Gliederung Einleitung Problemstellungen Ansätze & Herangehensweisen Anwendungsbeispiele Zusammenfassung 2 Gliederung

Mehr

Automatische Gesprächsauswertung im Callcenter

Automatische Gesprächsauswertung im Callcenter Einleitung Forschungsbeitrag Automatische Gesprächsauswertung im Callcenter Projekt CoachOST Dipl.-Wirtsch.-Inf. Mathias Walther Prof. Dr. Taïeb Mellouli Lehrstuhl für Wirtschaftsinformatik und Operations

Mehr

Computerlinguistik in Requirements Engineering

Computerlinguistik in Requirements Engineering Computerlinguistik in Requirements Engineering Dr. Leonid Kof kof@in.tum.de TU München, Fakultät für Informatik, Lehrstuhl Software und Systems Engineering 24.11.06 Leonid Kof, TUM: Computerlinguistik

Mehr

Web Application Security

Web Application Security Web Application Security WS 14/15 Sebastian Vogl, Christian von Pentz Lehrstuhl für Sicherheit in der Informatik / I20 Prof. Dr. Claudia Eckert Technische Universität München 07.10.2014 S. Vogl, C. von

Mehr

Mathe III. Garance PARIS. Mathematische Grundlagen III. Evaluation. 16. Juli /25

Mathe III. Garance PARIS. Mathematische Grundlagen III. Evaluation. 16. Juli /25 Mathematische Grundlagen III Evaluation 16 Juli 2011 1/25 Training Set und Test Set Ein fairer Test gibt an, wie gut das Modell im Einsatz ist Resubstitution: Evaluation auf den Trainingsdaten Resubstitution

Mehr

GIS 1 Kapitel 5: Bedeutung von Metadaten und Qualität t von Daten

GIS 1 Kapitel 5: Bedeutung von Metadaten und Qualität t von Daten GIS 1 Kapitel 5: und Qualität t von Daten Stephan Mäs Prof. Dr.-Ing. Wolfgang Reinhardt Arbeitsgemeinschaft GIS Universität der Bundeswehr München Wolfgang.Reinhardt@unibw.de www.agis.unibw.de - Definition

Mehr

Analyse l Training l Dokumentation MEDICAL PRO. Die neue Generation der Dynamed-Trainingsgeräte

Analyse l Training l Dokumentation MEDICAL PRO. Die neue Generation der Dynamed-Trainingsgeräte BECKENbODENTRAINER Analyse l Training l Dokumentation MEDICAL PRO Die neue Generation der Dynamed-Trainingsgeräte Der Beckenbodentrainer von Dynamed Der Dynamed - Beckenbodentrainer ist ein medizinisches

Mehr

Ressourcenplanung. Stand 21.12.2009. TOPIX Informationssysteme AG

Ressourcenplanung. Stand 21.12.2009. TOPIX Informationssysteme AG Ressourcenplanung Stand 21.12.2009 TOPIX Informationssysteme AG Inhalt Ressourcenplanung... 3 1. Grundlagen... 3 2. Anlage der Kategoriennamen... 3 3. Einstellungen... 4 5. Planungsmöglichkeiten... 7 6.

Mehr

Die Lernumgebung des Projekts Informationskompetenz

Die Lernumgebung des Projekts Informationskompetenz Beitrag für Bibliothek aktuell Die Lernumgebung des Projekts Informationskompetenz Von Sandra Merten Im Rahmen des Projekts Informationskompetenz wurde ein Musterkurs entwickelt, der den Lehrenden als

Mehr

Die druckfähige pdf-version ist zu laden von lernelesen.com/bedienungsanleitung.htm

Die druckfähige pdf-version ist zu laden von lernelesen.com/bedienungsanleitung.htm 1 Die druckfähige pdf-version ist zu laden von lernelesen.com/bedienungsanleitung.htm Anleitung LeLe_S1 ------------------- Diese App ist inhaltlich gleich mit LeLe_1. Nur die Darstellung und der Zugriff

Mehr

Zu Modul 9: Förderung des eigenverantwortlichen Lernens Integrierte Schülerübungen Thema Dichte. a) integrierte Schülerübung. b) gemeinsame Auswertung

Zu Modul 9: Förderung des eigenverantwortlichen Lernens Integrierte Schülerübungen Thema Dichte. a) integrierte Schülerübung. b) gemeinsame Auswertung SET 2 Realschule Bayern integrierte Schülerübung / Dichte Seite 1 Zu Modul 9: Förderung des eigenverantwortlichen Lernens Integrierte Schülerübungen Thema Dichte Aktionen Inhalte / Erwartungen Erfahrungen

Mehr

6. Bayes-Klassifikation. (Schukat-Talamazzini 2002)

6. Bayes-Klassifikation. (Schukat-Talamazzini 2002) 6. Bayes-Klassifikation (Schukat-Talamazzini 2002) (Böhm 2003) (Klawonn 2004) Der Satz von Bayes: Beweis: Klassifikation mittels des Satzes von Bayes (Klawonn 2004) Allgemeine Definition: Davon zu unterscheiden

Mehr

Text-Zahlen-Formatieren

Text-Zahlen-Formatieren Text-Zahlen-Formatieren Beobachtung: Bei der Formatierung einer Zahl in eine Textzahl und umgekehrt zeigt Excel ein merkwürdiges Verhalten, welches nachfolgend skizziert werden soll: Wir öffnen eine neue

Mehr

Vektormodelle. Universität zu Köln HS: Systeme der maschinellen Sprachverarbeitung Prof. Dr. J. Rolshoven Referentin: Alena Geduldig

Vektormodelle. Universität zu Köln HS: Systeme der maschinellen Sprachverarbeitung Prof. Dr. J. Rolshoven Referentin: Alena Geduldig Vektormodelle Universität zu Köln HS: Systeme der maschinellen Sprachverarbeitung Prof. Dr. J. Rolshoven Referentin: Alena Geduldig Gliederung Vektormodelle Vector-Space-Model Suffix Tree Document Model

Mehr

Statistische Methoden der Datenanalyse

Statistische Methoden der Datenanalyse Aktuelle Probleme der experimentellen Teilchenphysik (Modul P23.1.2b) Statistische Methoden der Datenanalyse Ulrich Husemann Humboldt-Universität zu Berlin Wintersemester 2010/2011 Vorstellung Vorlesung:

Mehr

Methodentraining in der Klasse 5 am Erich Kästner-Gymnasium

Methodentraining in der Klasse 5 am Erich Kästner-Gymnasium Methodentraining in der Klasse 5 am Erich Kästner-Gymnasium Inhalte des Methodentrainings Elternbrief... Seite 3 Ranzen packen... Seite 4 Arbeitsplatz gestalten... Seite 5 Hausaufgaben... Seiten 6 7 Heftführung...

Mehr

Begriffsbestimmung CRISP-DM-Modell Betriebswirtschaftliche Einsatzgebiete des Data Mining Web Mining und Text Mining

Begriffsbestimmung CRISP-DM-Modell Betriebswirtschaftliche Einsatzgebiete des Data Mining Web Mining und Text Mining Gliederung 1. Einführung 2. Grundlagen Data Mining Begriffsbestimmung CRISP-DM-Modell Betriebswirtschaftliche Einsatzgebiete des Data Mining Web Mining und Text Mining 3. Ausgewählte Methoden des Data

Mehr

Online-Algorithmen Prof. Dr. Heiko Röglin

Online-Algorithmen Prof. Dr. Heiko Röglin Online-Algorithmen Prof. Dr. Heiko Röglin Veranstaltungsbewertung der Fachschaft Informatik 12. Oktober 2015 Abgegebene Fragebögen: 8 1 Bewertung der Vorlesung 1.1 Bitte beurteile die Gestaltung der Vorlesung.

Mehr

Unterrichtsmaterialien in digitaler und in gedruckter Form. Auszug aus: Genial! Mathematik 2 - Ich kann's!: Ferien-Trainings-Heft

Unterrichtsmaterialien in digitaler und in gedruckter Form. Auszug aus: Genial! Mathematik 2 - Ich kann's!: Ferien-Trainings-Heft Unterrichtsmaterialien in digitaler und in gedruckter Form Auszug aus: - Ich kann's!: Ferien-Trainings-Heft Das komplette Material finden Sie hier: School-Scout.de Klammerheftung, Rückenzeile leicht versetzt

Mehr

Nichtlineare Optimierung ohne Nebenbedingungen

Nichtlineare Optimierung ohne Nebenbedingungen Kapitel 2 Nichtlineare Optimierung ohne Nebenbedingungen In diesem Abschnitt sollen im wesentlichen Verfahren zur Bestimmung des Minimums von nichtglatten Funktionen in einer Variablen im Detail vorgestellt

Mehr

Java Einführung Umsetzung von Beziehungen zwischen Klassen. Kapitel 7

Java Einführung Umsetzung von Beziehungen zwischen Klassen. Kapitel 7 Java Einführung Umsetzung von Beziehungen zwischen Klassen Kapitel 7 Inhalt Wiederholung: Klassendiagramm in UML Java-Umsetzung von Generalisierung Komposition Assoziationen 2 Das Klassendiagramm Zweck

Mehr

Obst, Müsli, Gemüsesticks

Obst, Müsli, Gemüsesticks Obst, Müsli, Gemüsesticks 400 Obstsalat verschiedene Sorten geschnittenes Obst nach Saison kg 401 Ananas Geschnittene Ananas kg 402 Orangenfilets Orangenfilets kg 403 Grapefruit Grapefruitfilets kg 404

Mehr

Motivation. Themenblock: Klassifikation. Binäre Entscheidungsbäume. Ansätze. Praktikum: Data Warehousing und Data Mining.

Motivation. Themenblock: Klassifikation. Binäre Entscheidungsbäume. Ansätze. Praktikum: Data Warehousing und Data Mining. Motivation Themenblock: Klassifikation Praktikum: Data Warehousing und Data Mining Ziel Item hat mehrere Attribute Anhand von n Attributen wird (n+)-tes vorhergesagt. Zusätzliches Attribut erst später

Mehr

Semestralklausur zur Vorlesung. Web Mining. Prof. J. Fürnkranz Technische Universität Darmstadt Sommersemester 2006 Termin:

Semestralklausur zur Vorlesung. Web Mining. Prof. J. Fürnkranz Technische Universität Darmstadt Sommersemester 2006 Termin: Semestralklausur zur Vorlesung Web Mining Prof. J. Fürnkranz Technische Universität Darmstadt Sommersemester 2006 Termin: 26. 7. 2006 Name: Vorname: Matrikelnummer: Fachrichtung: Punkte: (1).... (2)....

Mehr

TeamSphere. Die Geo-Wissensdatenbank. Entwickelt von

TeamSphere. Die Geo-Wissensdatenbank. Entwickelt von Entwickelt von Erhöhung der Beratungsqualität Die zentrale Verwaltung des Wissens aller Mitarbeiter und der schnelle Zugriff während des Kundengespräches ermöglicht eine neue Dimension in der Beratung.

Mehr

Telemedizinische Schlaganfallrehabilitation in den eigenen 4 Wänden Steffen Ortmann, Jan Schäffner, Peter Langendörfer

Telemedizinische Schlaganfallrehabilitation in den eigenen 4 Wänden Steffen Ortmann, Jan Schäffner, Peter Langendörfer Telemedizinische Schlaganfallrehabilitation in den eigenen 4 Wänden Steffen Ortmann, Jan Schäffner, Peter Langendörfer Konsortium Motivation Ca. 2 Millionen Menschen pro Jahr erleiden einen Schlaganfall

Mehr

Handbucherweiterung Zuschlag

Handbucherweiterung Zuschlag Handbucherweiterung Zuschlag Inhalt 1. Allgemeines S. 1 2. Installation S. 1 3. Erweiterungen bei den Zeitplänen S. 1 4. Erweiterung der Baumstruktur S. 2 5. Erweiterung im Personalstamm S. 2 6. Erweiterung

Mehr

Web Data Mining. Alexander Hinneburg Sommersemester 2007

Web Data Mining. Alexander Hinneburg Sommersemester 2007 Web Data Mining Alexander Hinneburg Sommersemester 2007 Termine Vorlesung Mi. 10:00-11:30 Raum?? Übung Mi. 11:45-13:15 Raum?? Klausuren Mittwoch, 23. Mai Donnerstag, 12. Juli Buch Bing Liu: Web Data Mining

Mehr

Automatische Mustererkennung zur Klassifikation von Konsumentenverhalten am Beispiel der Kreditwürdigkeitsprüfung

Automatische Mustererkennung zur Klassifikation von Konsumentenverhalten am Beispiel der Kreditwürdigkeitsprüfung Prof. Dr. Gerhard Arminger Dipl.-Ök. Alexandra Schwarz Bergische Universität Wuppertal Fachbereich Wirtschaftswissenschaft Fach Statistik Automatische Mustererkennung zur Klassifikation von Konsumentenverhalten

Mehr

Bildkarten Set: Obst. Leseprobe

Bildkarten Set: Obst. Leseprobe Leseprobe Bildkarten Set Obst Ananas Apfel Apfelsine Aprikose Banane Birne Brombeere Erdbeere Grapefruit Himbeere Kirsche Kiwi Mango Pfirsich Pflaume Weintrauben Zitrone Autorin / Layout: Bianka Blöcker

Mehr

Workshop. Projektmanagement für Schülerfirmen. Dozentin: Ramona Hasenfratz, Dozentin der IHK Schwarzwald-Baar-Heuberg

Workshop. Projektmanagement für Schülerfirmen. Dozentin: Ramona Hasenfratz, Dozentin der IHK Schwarzwald-Baar-Heuberg Schüler- und Juniorfirmen Beratungsstelle c/o IHK Schwarzwald-Baar-Heuberg Romäusring 4 78050 Villingen-Schwenningen Melanie John Fon: 07721 / 922-206 Fax: 07721 / 922-182 E-Mail: john@villingen-schwenningen.ihk.de

Mehr

Einführung in Data Mining mit Weka. Philippe Thomas Ulf Leser

Einführung in Data Mining mit Weka. Philippe Thomas Ulf Leser Einführung in Data Mining mit Weka Philippe Thomas Ulf Leser Data Mining Drowning in Data yet Starving for Knowledge Computers have promised us a fountain of wisdom but delivered a flood of data The non

Mehr

Feldphase. Nicolás Albacete, Pirmin Fessler, Peter Lindner. (Abteilung für volkswirtschaftliche Analysen, OeNB)

Feldphase. Nicolás Albacete, Pirmin Fessler, Peter Lindner. (Abteilung für volkswirtschaftliche Analysen, OeNB) Feldphase Nicolás Albacete, Pirmin Fessler, Peter Lindner (Abteilung für volkswirtschaftliche Analysen, OeNB) Technischer Workshop zum HFCS in Östereich 25. und 26.2.2013 Albacete, Fessler, Lindner (OeNB)

Mehr

Text Mining Praktikum. Durchführung: Andreas Niekler Email: aniekler@informatik.uni-leipzig.de Zimmer: Paulinum (P) 818

Text Mining Praktikum. Durchführung: Andreas Niekler Email: aniekler@informatik.uni-leipzig.de Zimmer: Paulinum (P) 818 Text Mining Praktikum Durchführung: Andreas Niekler Email: aniekler@informatik.uni-leipzig.de Zimmer: Paulinum (P) 818 Rahmenbedingungen Gruppen von 2- (max)4 Personen Jede Gruppe erhält eine Aufgabe Die

Mehr

Meisterstück Karin Gangl, BA Literatur- und Ressourcenplattform für den Studiengang Angewandtes Wissensmanagement

Meisterstück Karin Gangl, BA Literatur- und Ressourcenplattform für den Studiengang Angewandtes Wissensmanagement Meisterstück Karin Gangl, BA Literatur- und Ressourcenplattform für den Studiengang Angewandtes Wissensmanagement Fragebogen zur Onlinebefragung Mastertudiengang Angewandtes Wissensmanagement FH Burgenland,

Mehr

Ausarbeitung des Seminarvortrags zum Thema

Ausarbeitung des Seminarvortrags zum Thema Ausarbeitung des Seminarvortrags zum Thema Anlagepreisbewegung zum Seminar Finanzmathematische Modelle und Simulationen bei Raphael Kruse und Prof. Dr. Wolf-Jürgen Beyn von Imke Meyer im W9/10 Anlagepreisbewegung

Mehr

Unterweisung zur Ausbilder Eignungs Prüfung

Unterweisung zur Ausbilder Eignungs Prüfung Unterweisung zur Ausbilder Eignungs Prüfung Prüfungs Teilnehmer: Achim Rohleder Prüfungs Nummer: 25/0704 Prüfungs Tag: 08. Juli 2004 Prüfungs Ort: IHK Köln Zu unterweisender: Beruf: Auszubildender: Ausbildungsjahr:

Mehr

Säureangriff. Zähne bestehen aus einem ähnlichen Material wie Eierschalen. Teste an einem Ei, wie Säure die Schale angreift.

Säureangriff. Zähne bestehen aus einem ähnlichen Material wie Eierschalen. Teste an einem Ei, wie Säure die Schale angreift. Säureangriff Durch Süßigkeiten oder andere Lebensmittel mit viel Zucker entsteht Säure in deinem Mund. Diese greift deine Zähne an und du kannst Löcher bekommen. 1. AUFLAGE 2013 Zähne bestehen aus einem

Mehr

Data Mining Anwendungen und Techniken

Data Mining Anwendungen und Techniken Data Mining Anwendungen und Techniken Knut Hinkelmann DFKI GmbH Entdecken von Wissen in banken Wissen Unternehmen sammeln ungeheure mengen enthalten wettbewerbsrelevantes Wissen Ziel: Entdecken dieses

Mehr

Gesundheitliche Risikobewertung bei der Produktentwicklung?

Gesundheitliche Risikobewertung bei der Produktentwicklung? Gesundheitliche Risikobewertung bei der Produktentwicklung? Austrian Technology Platform - ATP Roland Grossgut, AGES Institut Risikobewertung 29. Juni 2006 Inhalt gesundheitliche Risikobewertung betriebswirtschaftliche

Mehr

Eine fremde Sprache lernen Wie geht das eigentlich vor sich? Prof. Dr. Elke Grundler, PH Weingarten

Eine fremde Sprache lernen Wie geht das eigentlich vor sich? Prof. Dr. Elke Grundler, PH Weingarten Eine fremde Sprache lernen Wie geht das eigentlich vor sich? Prof. Dr. Elke Grundler, PH Weingarten Worum soll es gehen? 1. Grundsätzliches im Selbstversuch 2. Was denkt die Wissenschaft, wie man Sprachen

Mehr

Zum State of the Art automatischer Inhaltsanalyse

Zum State of the Art automatischer Inhaltsanalyse Zum State of the Art automatischer Inhaltsanalyse Michael Scharkow, M.A. Universität Hohenheim Institut für Kommunikationswissenschaft (540G) michael.scharkow@uni-hohenheim.de Typologie der Verfahren deskriptive/explorative

Mehr