Natural Language Processing

Größe: px
Ab Seite anzeigen:

Download "Natural Language Processing"

Transkript

1 Natural Language Processing Kapitel 1: Einführung Prof. Dr. Johannes Maucher HdM MIB Version Prof. Dr. Johannes Maucher (HdM MIB) NLP Kapitel 1: Einführung Version / 30

2 Document History Version Date Changes Nr Initiale Version Korrekturen und Anpassungen; Grundlage für SS Umstellung der Lehrinhalte; Grundlage für SS Anpassungen für WS 13/ Übersicht NLP Prozesskette entfernt Anpassungen für WS 14/ Anpassungen für WS 16/ Komplette Überarbeitung/Neustrukturierung Prof. Dr. Johannes Maucher (HdM MIB) NLP Kapitel 1: Einführung Version / 30

3 Übersicht Kapitel Einführung 1 Was ist NLP Definition und Ziele Einordnung 2 Anwendungen 3 Schwerpunkt (Trend) in NLP allgemein 4 Herausforderungen und Probleme 5 NLP Ansätze 6 Die Vorlesung NLP Lernziele Inhalt Prüfung Prof. Dr. Johannes Maucher (HdM MIB) NLP Kapitel 1: Einführung Version / 30

4 Was ist NLP Definition und Ziele Definitionen In dieser Vorlesung liegt der Schwerpunkt eindeutig auf NL Understanding von Text. Prof. Dr. Johannes Maucher (HdM MIB) NLP Kapitel 1: Einführung Version / 30

5 Was ist NLP Definition und Ziele Vision und Ziel Vision Entwicklung von Computermodellen, die natürliche Sprache so gut verstehen und sprechen können wie Menschen. Ziel (realisitisch) Bau von Computermodellen, die Bedeutung in natürlich sprachlich verfassten Dokumenten und Sprache verstehen und daraus Schlüsse ziehen können. Prof. Dr. Johannes Maucher (HdM MIB) NLP Kapitel 1: Einführung Version / 30

6 Was ist NLP Definition und Ziele Es wäre schön, wenn uns ein Computer folgende Fragen beantworten könnte: Auf welches Produkt bezieht sich der Review? Prof. Dr. Johannes Maucher (HdM MIB) NLP Kapitel 1: Einführung Version / 30

7 Was ist NLP Definition und Ziele Es wäre schön, wenn uns ein Computer folgende Fragen beantworten könnte: Auf welches Produkt bezieht sich der Review? Wird das Produkt gut bewertet? Prof. Dr. Johannes Maucher (HdM MIB) NLP Kapitel 1: Einführung Version / 30

8 Was ist NLP Definition und Ziele Es wäre schön, wenn uns ein Computer folgende Fragen beantworten könnte: Auf welches Produkt bezieht sich der Review? Wird das Produkt gut bewertet? Werden Produktkomponenenten bzw. Produkteigenschaften individuell bewertet? Prof. Dr. Johannes Maucher (HdM MIB) NLP Kapitel 1: Einführung Version / 30

9 Was ist NLP Definition und Ziele Es wäre schön, wenn uns ein Computer folgende Fragen beantworten könnte: Auf welches Produkt bezieht sich der Review? Wird das Produkt gut bewertet? Werden Produktkomponenenten bzw. Produkteigenschaften individuell bewertet? Für welches Produkt dieser Kategorie wird eine bestimmte Eigenschaft insgesamt (über alle möglichen Reviews, Foren- und Blogbeiträge), am besten bewertet? Prof. Dr. Johannes Maucher (HdM MIB) NLP Kapitel 1: Einführung Version / 30

10 Was ist NLP Einordnung Informatik, Linguistik und Künstliche Intelligenz Prof. Dr. Johannes Maucher (HdM MIB) NLP Kapitel 1: Einführung Version / 30

11 Anwendungen Dialog Systeme / Question Answering Benötigt u.a.: Spracherkennung Sprache verstehen: Syntax und Semantik Semantische Suche, Information Retrieval Inferenzverfahren (Schlüsse ziehen) Sprachsynthese Prof. Dr. Johannes Maucher (HdM MIB) NLP Kapitel 1: Einführung Version / 30

12 Anwendungen Bedeutung des Textverstehens innerhalb der KI Ausschnitt aus Die ZEIT, Ausgabe : Ist er besser als wir?...ibm-konzern. Als dessen Computer Deep Blue 1997 den damaligen Schachweltmeister Garri Kasparow besiegte, war das beachtlich, aber auch zu erwarten. Schach ist ein Spiel nach mathematischen Regeln. Computer mögen so was. Doch ein bedeutender Teil der Datenwelt blieb den Computern verschlossen wie einem Analphabeten die Bücher: die im Netz und auf Computern Tag für Tag anschwellende Masse an Texten und Bildern. Das neue Forschungsziel der IBM-Führung nach dem Sieg im Schach war deshalb: ein alphabetisierter Computer, der unstrukturierte Texte verstehen kann. Das Kalkül: Kein Arzt der Erde kann alle Studien zu seinem Fach lesen und bewerten, kein Jurist binnen Sekunden Tausende Seiten erfassen, kein Risikoanalyst einer Bank alle Nachrichten zu einem Thema in seine Entscheidungen einbeziehen und kein Geheimagent das ganze Internet durchforsten. Ein Computer, der zu alldem in der Lage wäre und den Nutzern obendrein Antworten auf konkrete Fragen zu Medizin, Finanzen oder Terrorgefahren geben könnte, wäre ein Riesengeschäft. Prof. Dr. Johannes Maucher (HdM MIB) NLP Kapitel 1: Einführung Version / 30

13 Anwendungen Digitale Assistenten Gardner: Marktpotenzial Digitale Assistenten Siri Google Now, Google Pixel Cortana Amazon Echo Google Home Mini belauscht Nutzer Prof. Dr. Johannes Maucher (HdM MIB) NLP Kapitel 1: Einführung Version / 30

14 Anwendungen Automatische Übersetzung Skype-Echtzeitübersetzung in 8 Sprachen DeepL en Prof. Dr. Johannes Maucher (HdM MIB) NLP Kapitel 1: Einführung Version / 30

15 Anwendungen Dokumentklassifikation Allgemein: Automatische Einteilung von Dokumenten in verschiedene Klassen Beispiel: Spam-Filter Eingesetzt werden hierfür Verfahren des überwachten maschinellen Lernens in Verbindung mit NLP Techniken. Nutzerspezifische Klassifikation von Nachrichten, Posts,..., z.b. in Facebook Prof. Dr. Johannes Maucher (HdM MIB) NLP Kapitel 1: Einführung Version / 30

16 Anwendungen Opinion Mining (Sentiment Analysis) Document Level Sentiment Analysis bestimmt ob das Objekt, auf welches sich das Dokument bezieht, insgesamt eher gut oder schlecht beschrieben wird. Beispiele: Stimmungsanalyse auf Tweets Spiegel-Artikel vom Sentence Level Sentiment Analysis damit können auch einzelne Produktbestandteile und Produkteigenschaften analysiert werden. Quelle: Bing Liu; Sentiment Analysis: A Multifaced Problem; IEEE Intelligent Systems; June 2010 Prof. Dr. Johannes Maucher (HdM MIB) NLP Kapitel 1: Einführung Version / 30

17 Anwendungen Trendanalyse, z.b. mit Google Ngram Viewer Prof. Dr. Johannes Maucher (HdM MIB) NLP Kapitel 1: Einführung Version / 30

18 Anwendungen Weitere Anwendungen Textverarbeitung: Automatische Korrektur Information Retrieval: Suche nach bestimmten Inhalten in Texten. Herkömmliche Suche und semantische Suche. Sprachsynthese, eingesetzt in Dialogsystemen, Navigationsgeräten usw. Human Computer Interaction (HCI) z.b. als bevorzugte Schnittstelle im Auto Prof. Dr. Johannes Maucher (HdM MIB) NLP Kapitel 1: Einführung Version / 30

19 Schwerpunkt (Trend) in NLP allgemein Neural Network Language Models, Distributional Semantic Models Durch DSMs, speziell NNLMs, konnte in den vergangenen Monaten die Performanz vieler NLP Anwendungen trastisch verbessert werden. Semantische Ähnlichkeit wird auf Ähnlichkeit (Nähe) im Vektorraum abgebildet Prof. Dr. Johannes Maucher (HdM MIB) NLP Kapitel 1: Einführung Version / 30

20 Schwerpunkt (Trend) in NLP allgemein Beispiel für neuronal gelerntes Sprachmodell HdM Masterarbeit (Sascha Can): Erlernen von politisch ausgerichteten Sprachmodellen Prof. Dr. Johannes Maucher (HdM MIB) NLP Kapitel 1: Einführung Version / 30

21 Herausforderungen und Probleme Mehrdeutigkeit in der Phonologie / Homophonie Homophone sind Worte oder Wortfolgen, die gleich ausgesprochen werden, aber unterschiedliche Bedeutungen haben, z.b. bis - Biss Graf - Graph wahr - war Arm dran - arm dran fair tun - vertun einladen - ein Laden Relevant nur für das Sprachverstehen Prof. Dr. Johannes Maucher (HdM MIB) NLP Kapitel 1: Einführung Version / 30

22 Herausforderungen und Probleme Mehrdeutigkeit in der Morphologie Als Morphene werden die kleinsten bedeutungstragenden Einheiten einer Sprache bezeichnet. Morphologische Mehrdeutigkeit liegt vor, wenn ein Wort auf mehrere Arten in Morphene zerlegt werden kann, z.b. Stau becken - Staub ecken Kult urgeschichte - Kultur geschichte Uran brenner - Ur anbrenner Prof. Dr. Johannes Maucher (HdM MIB) NLP Kapitel 1: Einführung Version / 30

23 Herausforderungen und Probleme Lexikalische Mehrdeutigkeit / Homonyme Als Homonym bezeichnet man ein Wort, das für verschiedene Begriffe oder unterschiedliche Einzeldinge steht. Homonyme sind lexikalisch mehrdeutig (unterschiedliche Semantik) Beispiele: Bank Leitung Schloß Problematisch sind weiterhin Synonyme (Unterschiedliche Worte, die das gleiche bezeichnen, z.b. Bank und Geldinstitut) Prof. Dr. Johannes Maucher (HdM MIB) NLP Kapitel 1: Einführung Version / 30

24 Herausforderungen und Probleme Mehrdeutigkeit in der Syntax Komplexe sprachliche Zeichen (Wortfolgen) sind syntaktisch mehrdeutig, wenn ihnen mehr als eine syntaktische Interpretation zugeschrieben werden kann. Menschen können in diesem Fall meist aus der Semantik auf die Syntax schließen. Bei komplexeren Sätzen liefert die syntaktische Analyse oft mehrere Hundert Analysen. Die meisten von ihnen sind höchst unwahrscheinlich, werden aber durch die zugrunde liegende Grammatik gedeckt. Beispiel: Bert sah die Frau mit dem Fernglas Hierbei kann mit dem Fernglas entweder zum Prädikat (sah) oder zum Objekt (die Frau) gehören. Prof. Dr. Johannes Maucher (HdM MIB) NLP Kapitel 1: Einführung Version / 30

25 Herausforderungen und Probleme Mehrdeutigkeit in der Semantik Manchen komplexen Zeichen können mehrere Bedeutungen zugeordnet werden. Der Unterschied in der Bedeutung kann mit der Mehrdeutigkeit einzelner lexikalischer Zeichen oder mit der syntaktischen Mehrdeutigkeit des Satzes korrespondieren. Beispiel: Jeder Mann liebt eine Frau. Jeder Mann liebt mindestens eine Frau. Jeder Mann liebt genau eine Frau. Alle Männer lieben dieselbe Frau. Es gibt genau eine Frau, und alle Männer lieben sie. Prof. Dr. Johannes Maucher (HdM MIB) NLP Kapitel 1: Einführung Version / 30

26 Herausforderungen und Probleme Mehrdeutigkeit in der Aufeinanderfolge von Sätzen / Satzteilen Auf welches Wort im vorigen Satz /Satzteil bezieht sich das Pronomen? Beispiele: Die Kanne fiel gegen die Scheibe, dabei zerbrach sie. Das traurige Mädchen saß im Auto. Es kam nicht mehr weiter. Prof. Dr. Johannes Maucher (HdM MIB) NLP Kapitel 1: Einführung Version / 30

27 Herausforderungen und Probleme Pragmatische Mehrdeutigkeit Einer Äußerung, die syntaktisch und semantisch eindeutig ist, können in einem Sprechakt mehrere Bedeutungen zugeordnet werden. Beispiel: Mit dem Satz: Da ist etwas Grünes in der Suppe könnte der Sprecher folgendes beabsichtigen 1 : Sachebene: Ich sehe etwas Grünes. Selbstoffenbarung: Ich weiß nicht, was es ist. Beziehung: Du wirst es wissen. Appell: Sag mir bitte, was es ist! 1 Nach dem Vier-Seiten-Modell von Friedemann Schulz von Thun Prof. Dr. Johannes Maucher (HdM MIB) NLP Kapitel 1: Einführung Version / 30

28 NLP Ansätze Regelbasierter vs. Statistischer Ansatz Anytime a linguist leaves the group the recognition rate goes up 2 2 Zitat Fred Jelinek, früherer Chef der IBM Sprachgruppe Prof. Dr. Johannes Maucher (HdM MIB) NLP Kapitel 1: Einführung Version / 30

29 Die Vorlesung NLP Lernziele Lernziele Anwendungen Was kann man mit den NLP Verfahren alles machen? Welche Bedeutung kommt diesen Anwendungen heute und in Zukunft zu? Wie können Inhalt und Bedeutung von natürlichsprachlich verfassten Dokumenten maschinell erschlossen werden? Was sind die grundlegenden Techniken des NLP? Wie können diese Techniken implementiert werden? Link zu den Checker Fragen Prof. Dr. Johannes Maucher (HdM MIB) NLP Kapitel 1: Einführung Version / 30

30 Die Vorlesung NLP Inhalt Inhalte und Struktur der Vorlesung 1 Einführung: Definitionen, Ziele, Anwendungen und Übersicht 2 Textbeschaffung und Preprocessing 3 Vektorraummodell von Dokumenten, Ähnlichkeitsmaße 4 Latent Semantic Indexing 5 Textklassifikation, Grundlagen der Wahrscheinlichkeitsrechnung, Naive Bayes Classifier, Spam Filter 6 N-Gram Sprachmodelle 7 Distributional Semantic Models (DSM) 8 Neural Network Language Models (NNLM) 9 Tiefe Neuronale Netze für die Textklassifikation 10 Tiefe Neuronale Netze für die Automatische Übersetzung Optional: 1 Part Of Speech Tagging: Wortklassen, Bestimmung der Wortklassen 2 Information Extraction: Named Entity Recognition, Relation Recognition 3 Syntaktische Analyse, Syntax-Parsing Prof. Dr. Johannes Maucher (HdM MIB) NLP Kapitel 1: Einführung Version / 30

31 Die Vorlesung NLP Inhalt Checker-Fragen Link zu den Checker-Fragen Prof. Dr. Johannes Maucher (HdM MIB) NLP Kapitel 1: Einführung Version / 30

32 Die Vorlesung NLP Prüfung Prüfung Die Vorlesung Natural Language Processing (NLP) und das Praktikum Data Mining und Mustererkennung bilden zusammen das Modul Data Mining. Die Note im Praktikum Data Mining und Mustererkennung wird aus den Versuchen des Praktikums gebildet. Die Note der Vorlesung NLP wird in einer mündlichen Prüfung ermittelt. In die Modulnote fließt die NLP Note zu 2 Teilen und die Data Mining Note zu 3 Teilen ein. Die Modulprüfung ist in dem Semester anzumelden, in dem die letzte der beiden Teilnoten vorliegen wird. Prof. Dr. Johannes Maucher (HdM MIB) NLP Kapitel 1: Einführung Version / 30

33 Referenzen S. Bird, E. Klein, E. Loper Natural Language Processing with Python; O Reilly, 2009 D. Jurafsky, J.H. Martin; Speech and Language Processing Language Processing; Pearson International Edition, 2009 D. Manning, H. Schütze; Foundations of Statistical Language Processing; MIT Press, 1999 K.-U. Carstensen, Ch. Ebert, C. Ebert, S. Jekat, R. Klabunde, H. Langer Computerlinguistik und Sprachtechnologie Spektrum-Verlag, 3. Auflage 2010 N. Indurkhya, F.J. Damerau (Editors); Handbook of Natural Language Processing; Chapman & Hall/ CRC, 2010 G. Heyer, U. Quasthoff, T. Wittig; Text Mining: Wissensrohstoff Text; W3L-Verlag, Herdecke, Bochum, 2006 Ethem Alpaydin Maschinelles Lernen; deutschsprachige Ausgabe erschienen im Oldenbourg Verlag, München 2008 Wikipedia: Mehrdeutigkeit Prof. Dr. Johannes Maucher (HdM MIB) NLP Kapitel 1: Einführung Version / 30

EXTRAKTION UND KLASSIFIKATION VON BEWERTETEN PRODUKTFEATURES AUF WEBSEITEN

EXTRAKTION UND KLASSIFIKATION VON BEWERTETEN PRODUKTFEATURES AUF WEBSEITEN EXTRAKTION UND KLASSIFIKATION VON BEWERTETEN PRODUKTFEATURES AUF WEBSEITEN T-SYSTEMS MULTIMEDIA SOLUTIONS GMBH, 16. FEBRUAR 2012 1. Schlüsselworte Semantic Web, Opinion Mining, Sentiment Analysis, Stimmungsanalyse,

Mehr

NLP - Analyse des Wissensrohstoffs Text

NLP - Analyse des Wissensrohstoffs Text NLP - Analyse des Wissensrohstoffs Text Vorlesung Beginn: 8. April 2008 Dienstag 10.15 h - 11.45 h, in Raum 1607 oder 0443 Übungen Dr. Andreas Hotho Dominik Benz Beate Krause Sommersemester 2008 Beginn:

Mehr

Computerlinguistik und Sprachtechnologie

Computerlinguistik und Sprachtechnologie Computerlinguistik und Sprachtechnologie Eine Einführung Herausgegeben von: Kai-Uwe Carstensen, Christian Ebert, Cornelia Endriss, Susanne Jekat, Ralf Klabunde und Hagen Langer Spektrum Akademischer Verlag

Mehr

VO 340088 Sprachtechnologien. Informations- und Wissensmanagement. Bartholomäus Wloka. Zentrum für Translationswissenschaft

VO 340088 Sprachtechnologien. Informations- und Wissensmanagement. Bartholomäus Wloka. Zentrum für Translationswissenschaft , Informations- und Wissensmanagement Zentrum für Translationswissenschaft Grundlagen und Definitionen Maschinelle Sprachverarbeitung Breites Spektrum an Methoden der Computerverarbeitung von Sprache.

Mehr

Proseminar - Data Mining

Proseminar - Data Mining Proseminar - Data Mining SCCS, Fakultät für Informatik Technische Universität München SS 2014, SS 2014 1 Data Mining: Beispiele (1) Hausnummererkennung (Klassifikation) Source: http://arxiv.org/abs/1312.6082,

Mehr

Text-Mining: Einführung

Text-Mining: Einführung Text-Mining: Einführung Claes Neuefeind Fabian Steeg 22. April 2010 Organisatorisches Was ist Text-Mining? Definitionen Anwendungsbeispiele Textuelle Daten Aufgaben u. Teilbereiche Literatur Kontakt Sprechstunde:

Mehr

Einführung in die Computerlinguistik D IALOGSYSTEME WS 2009/2010. Bojan Georgievski Prashanna Thangeswaran David Höfig

Einführung in die Computerlinguistik D IALOGSYSTEME WS 2009/2010. Bojan Georgievski Prashanna Thangeswaran David Höfig Einführung in die Computerlinguistik D IALOGSYSTEME WS 2009/2010 Bojan Georgievski Prashanna Thangeswaran David Höfig Einführung Was sind Dialogsysteme? Beispiele von Dialogsystemen Wo werden Dialogsysteme

Mehr

Einführung in die Computerlinguistik Überblick

Einführung in die Computerlinguistik Überblick Einführung in die Computerlinguistik Überblick Hinrich Schütze & Robert Zangenfeind Centrum für Informations- und Sprachverarbeitung, LMU München 2015-10-12 1 / 19 Was ist Computerlinguistik? Definition

Mehr

Opinion Mining in der Marktforschung

Opinion Mining in der Marktforschung Opinion Mining in der Marktforschung von andreas.boehnke@stud.uni-bamberg.de S. 1 Überblick I. Motivation Opinion Mining II. Grundlagen des Text Mining III. Grundlagen des Opinion Mining IV. Opinion Mining

Mehr

Einführung in die Computerlinguistik Statistische Grundlagen

Einführung in die Computerlinguistik Statistische Grundlagen Statistik 1 Sommer 2015 Einführung in die Computerlinguistik Statistische Grundlagen Laura Heinrich-Heine-Universität Düsseldorf Sommersemester 2015 Statistik 2 Sommer 2015 Überblick 1. Diskrete Wahrscheinlichkeitsräume

Mehr

Text- und Datamining

Text- und Datamining Text- und Datamining Verwaltungtechnisches und Themenübersicht Jan Schrader, Morgan Harvey, Martin Hacker .@cs.fau.de Organisatorisches Folien eine Woche vor Präsentation abgeben (per Email)

Mehr

Parsing mit NLTK. Parsing mit NLTK. Parsing mit NLTK. Parsing mit NLTK. Beispiel: eine kleine kontextfreie Grammatik (cf. [BKL09], Ch. 8.

Parsing mit NLTK. Parsing mit NLTK. Parsing mit NLTK. Parsing mit NLTK. Beispiel: eine kleine kontextfreie Grammatik (cf. [BKL09], Ch. 8. Gliederung Natürlichsprachliche Systeme I D. Rösner Institut für Wissens- und Sprachverarbeitung Fakultät für Informatik Otto-von-Guericke Universität Magdeburg 1 WS 2011/12, 26. Oktober 2011, c 2010-2012

Mehr

Sudoku. Warum 6? Warum 6?

Sudoku. Warum 6? Warum 6? . / Sudoku Füllen Sie die leeren Felder so aus, dass in jeder Zeile, in jeder Spalte und in jedem x Kästchen alle Zahlen von bis stehen.. / Warum?. / Warum?. / Geschichte der Logik Syllogismen (I) Beginn

Mehr

NLP Eigenschaften von Text

NLP Eigenschaften von Text NLP Eigenschaften von Text Dr. Andreas Hotho Dominik Benz Beate Krause Sommersemester 2008 Folie: 1 Übersicht Einführung Eigenschaften von Text Words I: Satzgrenzenerkennung, Tokenization, Kollokationen

Mehr

Proseminar - Data Mining

Proseminar - Data Mining Vorbesprechung Proseminar - Data Mining SCCS, Fakultät für Informatik Technische Universität München SS 2015 Vorbesprechung, SS 2015 1 Data Mining: Beispiele (1) Hausnummererkennung (Klassifikation) Source:

Mehr

Proseminar - Data Mining

Proseminar - Data Mining Proseminar - Data Mining SCCS, Fakultät für Informatik Technische Universität München SS 2012, SS 2012 1 Data Mining Pipeline Planung Aufbereitung Modellbildung Auswertung Wir wollen nützliches Wissen

Mehr

Sports Data Mining. The Field and Methodology. Sublogo. 24.05.2014 Fachbereich Informatik Prof. Johannes Fürnkranz 1

Sports Data Mining. The Field and Methodology. Sublogo. 24.05.2014 Fachbereich Informatik Prof. Johannes Fürnkranz 1 Sports Data Mining The Field and Methodology 24.05.2014 Fachbereich Informatik Prof. Johannes Fürnkranz 1 Definition Hierarchie für Sport und Sportdatenbeziehungen Eins kein Zusammenhang Zwei Domain-Experten

Mehr

Sentiment Analysis (SA) Robert Bärhold & Mario Sänger Text Analytics WS 2012/13 Prof. Leser

Sentiment Analysis (SA) Robert Bärhold & Mario Sänger Text Analytics WS 2012/13 Prof. Leser Sentiment Analysis (SA) Robert Bärhold & Mario Sänger Text Analytics WS 2012/13 Prof. Leser Gliederung Einleitung Problemstellungen Ansätze & Herangehensweisen Anwendungsbeispiele Zusammenfassung 2 Gliederung

Mehr

INFORMATIONSEXTRAKTION IN SUCHMASCHINEN

INFORMATIONSEXTRAKTION IN SUCHMASCHINEN INFORMATIONSEXTRAKTION IN SUCHMASCHINEN S E M I N A R S U C H M A S C H I N E N S O M M E R S E M ESTER 2014 S T E FA N L A N G E R, C I S, U N I V E R S I TÄT M Ü N C H E N Schematische Architektur einer

Mehr

INFORMATIONSGEWINNUNG AUS KURZEN TEXTEN

INFORMATIONSGEWINNUNG AUS KURZEN TEXTEN INFORMATIONSGEWINNUNG AUS KURZEN TEXTEN T-SYSTEMS MULTIMEDIA SOLUTIONS GMBH, 14. OKTOBER 2011 1. Schlüsselworte Semantik, Informationsextraktion, Automatisierte Syntaxanalyse, Validierung, Chunking, Tagging,

Mehr

Interdisziplinäre Fachdidaktik: Natürliche Sprachen und Formale Sprachen. Wie verstehen Computer natürliche Sprachen?

Interdisziplinäre Fachdidaktik: Natürliche Sprachen und Formale Sprachen. Wie verstehen Computer natürliche Sprachen? Interdisziplinäre Fachdidaktik: Natürliche Sprachen und Formale Sprachen Wie verstehen Computer natürliche Sprachen? LVA Leiter: Elizabeta Jenko Wilfried Grossmann erstellt von Egbert Althammer 9031924

Mehr

Elementare Begriffe der Wahrscheinlichkeitstheorie für die Sprachverarbeitung

Elementare Begriffe der Wahrscheinlichkeitstheorie für die Sprachverarbeitung Elementare Begriffe der Wahrscheinlichkeitstheorie für die Sprachverarbeitung Kursfolien Karin Haenelt 1 Übersicht Wahrscheinlichkeitsfunktion P Wahrscheinlichkeit und bedingte Wahrscheinlichkeit Bayes-Formeln

Mehr

Statistische Verfahren in der Computerlinguistik

Statistische Verfahren in der Computerlinguistik Statistische Verfahren in der Computerlinguistik Zweiter Teil Einführung in die Computerlinguistik Sommersemester 2009 Übersicht Statistische vs. symbolische Verfahren in der CL Statistik beschreibende

Mehr

Digitale Bildverarbeitung

Digitale Bildverarbeitung Digitale Bildverarbeitung 01a: Einführung und Motivation Prof. Dr. Gudrun Socher Dozentin Dozentin Prof. Dr. Gudrun Socher (gudrun.socher@hm.edu) Sprechstunde Donnerstag 9:15-10:00 Uhr Anmeldung per E-Mail

Mehr

20. Mitteilungsblatt Nr. 24

20. Mitteilungsblatt Nr. 24 20. Mitteilungsblatt Nr. 24 Mitteilungsblatt der Medizinischen Universität Wien Studienjahr 2013/2014 20. Stück; Nr. 24 C U R R I C U L A Änderung des Curriculums für das Masterstudium Medizinische Informatik

Mehr

Lösungsvorschlag für das Übungsblatt 1. Aufgabe 1.

Lösungsvorschlag für das Übungsblatt 1. Aufgabe 1. Lösungsvorschlag für das Übungsblatt 1. Aufgabe 1. Zusammengefasst aus Ihren Beiträgen Wie bewerten sie das System ingesamt? Das Watson System verdeutlicht den Fortschritt der Künstlichen Intelligenz Forschung/Computerlinguistik/Informatik

Mehr

Grundlagen der natürlichsprachlichen Mensch-Computer Interaktion

Grundlagen der natürlichsprachlichen Mensch-Computer Interaktion Grundlagen der natürlichsprachlichen Mensch-Computer Interaktion Donnerstag 29. 04. 2004 2-1 Richtziel: Erlernen möglicher Verwendung von Markup-Programmiersprachen für Modellierung der natürlichsprachlichen

Mehr

Einführung in die Methoden der Künstlichen Intelligenz

Einführung in die Methoden der Künstlichen Intelligenz Einführung in die Methoden der Künstlichen Intelligenz --- Vorlesung vom 17.4.2007 --- Sommersemester 2007 Prof. Dr. Ingo J. Timm, Andreas D. Lattner Professur für Wirtschaftsinformatik und Simulation

Mehr

Anlage 1: Modularisierung des Bachelor-Studiengangs Theoretische und Angewandte Computerlinguistik

Anlage 1: Modularisierung des Bachelor-Studiengangs Theoretische und Angewandte Computerlinguistik Anlage : Modularisierung des Bachelor-Studiengangs Theoretische und Angewandte Legende: PM = Pflichtmodul; WPM = Wahlpflichtmodul; WM = Wahlmodul VL = Vorlesung; PS = Proseminar; HS = Hauptseminar; Ü =

Mehr

V1/2.S Sprachwissenschaft

V1/2.S Sprachwissenschaft V1/2.S Sprachwissenschaft Die Studierenden verfügen über Kenntnisse, die sie befähigen, sprachliche Strukturen zu durchschauen. Sie sind in der Lage, die Einheiten und Regeln der sprachlichen Kommunikation

Mehr

Friedrich-Alexander-Universität Professur für Computerlinguistik. Nguyen Ai Huong

Friedrich-Alexander-Universität Professur für Computerlinguistik. Nguyen Ai Huong Part-of-Speech Tagging Friedrich-Alexander-Universität Professur für Computerlinguistik Nguyen Ai Huong 15.12.2011 Part-of-speech tagging Bestimmung von Wortform (part of speech) für jedes Wort in einem

Mehr

Text Mining. Joachim Schole. Fakultät Technik und Informatik Hochschule für angewandte Wissenschaften Hamburg. Grundseminar, WS 2014

Text Mining. Joachim Schole. Fakultät Technik und Informatik Hochschule für angewandte Wissenschaften Hamburg. Grundseminar, WS 2014 Text Mining Joachim Schole Fakultät Technik und Informatik Hochschule für angewandte Wissenschaften Hamburg Grundseminar, WS 2014 Joachim Schole (HAW Hamburg) Text Mining Grundseminar, WS 2014 1 / 26 Agenda

Mehr

Textmining Klassifikation von Texten Teil 2: Im Vektorraummodell

Textmining Klassifikation von Texten Teil 2: Im Vektorraummodell Textmining Klassifikation von Texten Teil 2: Im Vektorraummodell Dept. Informatik 8 (Künstliche Intelligenz) Friedrich-Alexander-Universität Erlangen-Nürnberg (Informatik 8) Klassifikation von Texten Teil

Mehr

Modellierung eines Epidemie- Frühwarnsystems mit. Nicolas With Master Seminar WS 2012/13

Modellierung eines Epidemie- Frühwarnsystems mit. Nicolas With Master Seminar WS 2012/13 Modellierung eines Epidemie- Frühwarnsystems mit SocialMedia Mining Nicolas With Master Seminar WS 2012/13 Agenda Einstieg Motivation Abgrenzung Ziel Status Projekt 1 Projekt 2 Ausblick Chancen Risiken

Mehr

Natürlichsprachliche Mensch-Computer Interaktion mit VoiceXML

Natürlichsprachliche Mensch-Computer Interaktion mit VoiceXML Natürlichsprachliche Mensch-Computer Interaktion mit VoiceXML 1-1 Natürlichsprachliche Mensch-Computer Interaktion mit VoiceXML Prof. Dr.-Ing. Václav Matoušek Lehrstuhl für Informatik und Rechentechnik

Mehr

Automatisches Verstehen gesprochener Sprache

Automatisches Verstehen gesprochener Sprache Automatisches Verstehen gesprochener Sprache 5. Sprachverstehen und Morphologie Martin Hacker Bernd Ludwig Günther Görz Professur für Künstliche Intelligenz Department Informatik Friedrich-Alexander-Universität

Mehr

Text Mining und Textzusammenfassung. Jürgen Kirkovits Doris Rongitsch Daniela Wagenhofer

Text Mining und Textzusammenfassung. Jürgen Kirkovits Doris Rongitsch Daniela Wagenhofer Text Mining und Textzusammenfassung Jürgen Kirkovits Doris Rongitsch Daniela Wagenhofer Übersicht 1. Definition 2. Prozessablauf 3. Textzusammenfassung 4. Praxisbeispiel Definition Text Mining is the art

Mehr

Studienstruktur nach PO 2011 und PO (Projektseminar nur in PO 2014, in PO 2011 statt dessen Projektarbeit)

Studienstruktur nach PO 2011 und PO (Projektseminar nur in PO 2014, in PO 2011 statt dessen Projektarbeit) Vergleich der Studienstrukturen des Masterstudiengangs IMIT nach Prüfungsordnungen 2011 und 2014 1 Studienstruktur nach PO 2011 und PO 2014 (Projektseminar nur in PO 2014, in PO 2011 statt dessen Projektarbeit)

Mehr

Anhang III: Modulhandbuch

Anhang III: Modulhandbuch Anhang III: Modulhandbuch Das Modulhandbuch wird gemäß 1 Abs. (1) der Satzung der Technischen Universität Darmstadt zur Regelung der Bekanntmachung von Satzungen der Technischen Universität Darmstadt vom

Mehr

Text Mining mit LingPipe

Text Mining mit LingPipe Text Mining mit LingPipe Hauptseminar Information Retrieval PD Dr. Karin Haenelt Universität Heidelberg Vortrag von Alexander Kappe im Wintersemester 2008/2009 Übersicht Text Mining Definition & Abgrenzung

Mehr

Einführung in die Phonetik und Phonologie. Allgemeiner Überblick

Einführung in die Phonetik und Phonologie. Allgemeiner Überblick Einführung in die Phonetik und Phonologie Allgemeiner Überblick Phonetik und Phonologie Die beiden Bezeichnungen Phonetik und Phonologie sind aus dem griechischen Wort ϕωνþ (phōnē) abgeleitet, welches

Mehr

8 Fakultät für Philologie

8 Fakultät für Philologie 8 Fakultät für Philologie 8.1 Linguistik 8.1.1 Linguistik, PO 2004 Fach Linguistik (101) Abschluss 2-Fach Bachelor (81) PO-Version 2004 Folgendes ist zurzeit in HISPOS eingerichtet: Modul-Typen: o Nachgewiesene

Mehr

!!!!T!!! Systems!() Multimedia Solutions

!!!!T!!! Systems!() Multimedia Solutions Inhalt. Was ist das semantische Web? Wie findet man einen Arzttermin mit Hilfe des semantischen Web? Wie gibt man Inhalten einen Sinn? Welche Werkzeuge stehen zur Verfügung? Wo können strukturierte Inhalte

Mehr

Vortrag im Rahmen der Vorlesung Data Warehouse Dozentin: Prof. Dr. Frey-Luxemburger WS 2011/2012. Referent: Florian Kalisch (GR09)

Vortrag im Rahmen der Vorlesung Data Warehouse Dozentin: Prof. Dr. Frey-Luxemburger WS 2011/2012. Referent: Florian Kalisch (GR09) Vortrag im Rahmen der Vorlesung Data Warehouse Dozentin: Prof. Dr. Frey-Luxemburger WS 2011/2012 Referent: Florian Kalisch (GR09) Einleitung Rückblick Opinion Mining Einführung Theoretische Grundlagen

Mehr

Modulhandbuch. Module des beantragten Master-Studiengangs Sprach- und Texttechnologie (Nebenfach) im Fachbereich II an der Universität Trier SWS:

Modulhandbuch. Module des beantragten Master-Studiengangs Sprach- und Texttechnologie (Nebenfach) im Fachbereich II an der Universität Trier SWS: Modulhandbuch Module des beantragten Master-Studiengangs Sprach- und Texttechnologie (Nebenfach) im Fachbereich II an der Universität Trier Modul: Sprach- und Textverarbeitung STTMN1 Leistungspunkte pro

Mehr

Otto-Friedrich-Universität Bamberg Fakultät Wirtschaftsinformatik und Angewandte Informatik Bachelorstudiengang Angewandte Informatik

Otto-Friedrich-Universität Bamberg Fakultät Wirtschaftsinformatik und Angewandte Informatik Bachelorstudiengang Angewandte Informatik Module und Teilprüfungen der Bachelorprüfung im Bachelorstudiengang Angewandte Informatik gemäß Anhang 1 der Fachprüfungsordnung (FPO B AI) gültig ab SS 2007 ID Modul Semester ECTS SWS Prüfung A1 Modulgruppe:

Mehr

Text Mining Praktikum. Durchführung: Andreas Niekler Email: aniekler@informatik.uni-leipzig.de Zimmer: Paulinum (P) 818

Text Mining Praktikum. Durchführung: Andreas Niekler Email: aniekler@informatik.uni-leipzig.de Zimmer: Paulinum (P) 818 Text Mining Praktikum Durchführung: Andreas Niekler Email: aniekler@informatik.uni-leipzig.de Zimmer: Paulinum (P) 818 Rahmenbedingungen Gruppen von 2- (max)4 Personen Jede Gruppe erhält eine Aufgabe Die

Mehr

Background for Hybrid Processing

Background for Hybrid Processing Background for Hybrid Processing Hans Uszkoreit Foundations of LST WS 04/05 Scope Classical Areas of Computational Linguistics: computational morphology, computational syntax computational semantics computational

Mehr

Einführung in die portugiesische Sprachwissenschaft

Einführung in die portugiesische Sprachwissenschaft Annette Endruschat Jürgen Schmidt-Radefeldt Einführung in die portugiesische Sprachwissenschaft Gunter Narr Verlag Tübingen Inhalt Vorwort 9 Abkürzungen und Abbildungsverzeichnis 12 1 Weltsprache Portugiesisch

Mehr

Besuch der Gesellschaft für Wissensmanagement, Theseus Innovationszentrum, 04.05.2011. DFKI Fakten. Aljoscha Burchardt

Besuch der Gesellschaft für Wissensmanagement, Theseus Innovationszentrum, 04.05.2011. DFKI Fakten. Aljoscha Burchardt Besuch der Gesellschaft für Wissensmanagement, Theseus Innovationszentrum, 04.05.20 DFKI Fakten Aljoscha Burchardt Deutsches Forschungszentrum für Künstliche Intelligenz, DFKI GmbH Alt-Moabit 9c 0559 Berlin,

Mehr

Part-Of-Speech-Tagging mit Viterbi Algorithmus

Part-Of-Speech-Tagging mit Viterbi Algorithmus Part-Of-Speech-Tagging mit Viterbi Algorithmus HS Endliche Automaten Inna Nickel, Julia Konstantinova 19.07.2010 1 / 21 Gliederung 1 Motivation 2 Theoretische Grundlagen Hidden Markov Model Viterbi Algorithmus

Mehr

Seminar Künstliche Intelligenz WS 2013/14 Grundlagen des Maschinellen Lernens

Seminar Künstliche Intelligenz WS 2013/14 Grundlagen des Maschinellen Lernens Seminar Künstliche Intelligenz WS 2013/14 Grundlagen des Maschinellen Lernens Martin Hacker Richard Schaller Künstliche Intelligenz Department Informatik FAU Erlangen-Nürnberg 19.12.2013 Allgemeine Problemstellung

Mehr

Mehrdeutigkeiten finden, auflösen, vermeiden. tekom Jahrestagung Wiesbaden November 2013

Mehrdeutigkeiten finden, auflösen, vermeiden. tekom Jahrestagung Wiesbaden November 2013 Mehrdeutigkeiten finden, auflösen, vermeiden tekom Jahrestagung Wiesbaden November 2013 euroscript title slide 2 Mehrdeutigkeiten finden, auflösen, vermeiden euroscript title slide 4 Vagheit Vagheit findet

Mehr

Teil II: Phrasen und Phrasenstruktur

Teil II: Phrasen und Phrasenstruktur Teil II: Phrasen und Phrasenstruktur Übersicht: Grammatische Funktionen Kategorien Konstituenten & Strukturbäume Konstituententest Endozentrizität 1 Einfacher Satzbau Drei allgemeine Grundfragen der Syntax:

Mehr

Vertiefungsrichtung. Medieninformatik. Prof. Dr. Günther Görz (AG Digital Humanities) Prof. Dr. Klaus Meyer-Wegener (Inf. 6)

Vertiefungsrichtung. Medieninformatik. Prof. Dr. Günther Görz (AG Digital Humanities) Prof. Dr. Klaus Meyer-Wegener (Inf. 6) Vertiefungsrichtung. Medieninformatik Prof. Dr. Günther Görz (AG Digital Humanities) Prof. Dr. Klaus Meyer-Wegener (Inf. 6) Vertiefungsrichtung im Informatikstudium Gestaltung (Design) als Ergänzung zu

Mehr

Spracherkennung. Gliederung:

Spracherkennung. Gliederung: Spracherkennung Gliederung: - Einführung - Geschichte - Spracherkennung - Einteilungen - Aufbau und Funktion - Hidden Markov Modelle (HMM) - HMM bei der Spracherkennung - Probleme - Einsatzgebiete und

Mehr

Neue Trends und neue Möglichkeiten der datengetriebenen Versorgungsforschung

Neue Trends und neue Möglichkeiten der datengetriebenen Versorgungsforschung Neue Trends und neue Möglichkeiten der datengetriebenen Versorgungsforschung Hamburg 16.11.2016 Nmedia Fotolia Fraunhofer-Institut für Intelligente Analyseund Informationssysteme Fraunhofer IAIS - Wir

Mehr

Watson für Handelsunternehmen Kognitive Texterkennung für den deutschen Handelsmarkt

Watson für Handelsunternehmen Kognitive Texterkennung für den deutschen Handelsmarkt Watson für Handelsunternehmen Kognitive Texterkennung für den deutschen Handelsmarkt Dr. Stefan Heine, CTO Enterprise Business Unit West 23. Februar 2016, Düsseldorf, EuroCIS - The Leading Trade Fair for

Mehr

VO Sprachtechnologien. Informations- und Wissensmanagement. Bartholomäus Wloka. Zentrum für Translationswissenschaft

VO Sprachtechnologien. Informations- und Wissensmanagement. Bartholomäus Wloka. Zentrum für Translationswissenschaft , Informations- und Wissensmanagement Zentrum für Translationswissenschaft Poesie in einer Programmiersprache #define ( bb!bb ) Übersetzungstechnologien Maschinelle Übersetzung Begriffe MÜS Maschinelles

Mehr

Einführung III. Lexikalisch-semantische Ressourcen

Einführung III. Lexikalisch-semantische Ressourcen Semantik im automatischen Sprachverstehen Prof. Dr. Iryna Gurevych, Daniel Bär, Elisabeth Wolf Einführung III Lexikalisch-semantische Ressourcen Unser Seminar fängt mit einer Einführung in das Thema an:

Mehr

Wissensbasierte Sprachverarbeitung Inhalt der Vorlesung 0. Einleitung

Wissensbasierte Sprachverarbeitung Inhalt der Vorlesung 0. Einleitung Wissensbasierte Sprachverarbeitung Inhalt der Vorlesung 0. Einleitung i) Worum geht es? ii) Aufgaben und Anwendungen iii) Mehrdeutigkeit - Das Kernproblem iv) linguistische Grundlagen I. Der synthetische

Mehr

Einführung in die Computerlinguistik

Einführung in die Computerlinguistik Einführung in die Computerlinguistik Syntax II WS 2011/2012 Manfred Pinkal Geschachtelte Strukturen in natürlicher Sprache [ der an computerlinguistischen Fragestellungen interessierte Student im ersten

Mehr

Einführung in die Computerlinguistik. Semantik

Einführung in die Computerlinguistik. Semantik Einführung in die Computerlinguistik Semantik WS 2006/2007 Manfred Pinkal Einführung in die Computerlinguistik 2006/2007 M. Pinkal UdS 1 Semantik für Dialogverarbeitung U: Ist der Flug um 2 nach London

Mehr

Klausurtermine Informatik Herbst 2016 Stand: Änderungen sind rot markiert Wochentag Prüfungstermin: Prüfungsbezeichnung: Raum/Räume:

Klausurtermine Informatik Herbst 2016 Stand: Änderungen sind rot markiert Wochentag Prüfungstermin: Prüfungsbezeichnung: Raum/Räume: Klausurtermine Informatik Herbst 2016 Stand: 20.07.2016 Änderungen sind rot markiert Wochentag Prüfungstermin: Prüfungsbezeichnung: Raum/Räume: Semester Montag 18.07.2016 11.00-14.00 Digitalschaltungen

Mehr

Information Retrieval

Information Retrieval Information Retrieval Norbert Fuhr 12. April 2010 Einführung 1 IR in Beispielen 2 Was ist IR? 3 Dimensionen des IR 4 Daten Information Wissen 5 Rahmenarchitektur für IR-Systeme IR in Beispielen IR-Aufgaben

Mehr

Event Recognition Engine

Event Recognition Engine Event Recognition Engine Eine Analysis Engine im UIMA Framework Hauptseminar Information Retrieval Tobias Beck 10.01.2011 2 Übersicht: Einordnung UIMA Komponenten einer UIMA Pipeline Selbst erstellte Event

Mehr

Master of Science Internet- und Web-basierte Systeme. Gesamtkatalog (Stand: )

Master of Science Internet- und Web-basierte Systeme. Gesamtkatalog (Stand: ) Master of Science Internet- und Web-basierte Systeme Gesamtkatalog (Stand: 31.10.2016) Pflichtbereich Bereich 1 V-Art FB Deutscher Titel / Englischer Titel Dozent Turnus WS16 CP TUCaN Internet V2 Ü2 20

Mehr

Einführung Grundbegriffe

Einführung Grundbegriffe Einführung Grundbegriffe 1.1 Der Modellbegriff Broy: Informatik 1, Springer 1998 (2) Die Modellbildung der Informatik zielt auf die Darstellung der unter dem Gesichtspunkt einer gegebenen Aufgabenstellung

Mehr

Vertriebssteuerung & Kundenmanagement bei Finanzinstituten. 1. Dezember 2010, Frankfurt am Main

Vertriebssteuerung & Kundenmanagement bei Finanzinstituten. 1. Dezember 2010, Frankfurt am Main Vertriebssteuerung & Kundenmanagement bei Finanzinstituten 1. Dezember 2010, Frankfurt am Main Erweitern Sie Ihre Analyse auch um unstrukturierte Daten: mehr Einblicke, bessere Entscheidungen! Unsere Agenda

Mehr

Wie geht man mit dem gestiegenen Interesse an Erkennung und Übersetzung arabischer Sprachen um?

Wie geht man mit dem gestiegenen Interesse an Erkennung und Übersetzung arabischer Sprachen um? Wie geht man mit dem gestiegenen Interesse an Erkennung und Übersetzung arabischer Sprachen um? Hassan Sawaf hassan@apptek.com 10 Jahre Verbmobil Rückblick und Ausblick 16. November 2010 by AppTek 2004-2010

Mehr

Social Business Intelligence Text Mining und Hadoop bei DB Fernverkehr AG

Social Business Intelligence Text Mining und Hadoop bei DB Fernverkehr AG Social Business Intelligence Text Mining und Hadoop bei DB Fernverkehr AG DB Fernverkehr AG Dr.-Ing. Axel Schulz, Dr. Matthias Platho P.FMB 2, DB Fernverkehr AG Frankfurt, 22.05.2015 Motivation An meinem

Mehr

Kapitel IR:I. I. Einführung. Retrieval-Szenarien Begriffsbildung Einordnung Information Retrieval

Kapitel IR:I. I. Einführung. Retrieval-Szenarien Begriffsbildung Einordnung Information Retrieval Kapitel IR:I I. Einführung Retrieval-Szenarien Begriffsbildung Einordnung Information Retrieval IR:I-1 Introduction STEIN 2005-2010 Retrieval-Szenarien Liefere Dokumente, die die Terme «Information» und

Mehr

2 Sprachliche Einheiten

2 Sprachliche Einheiten 2 Sprachliche Einheiten Inhalt Semiotische Begriffe Wörter Wortbestandteile Wortzusammensetzungen Wortgruppen Text und Dialog Wort- und Satzbedeutung 2.1 Semiotische Begriffe Semiotische Begriffe Semiotik

Mehr

Prüfungsplan Master of Science in Wirtschaftsinformatik

Prüfungsplan Master of Science in Wirtschaftsinformatik Prüfungsplan Master of Science in Wirtschaftsinformatik Modul Art Creditpunkte Schwerpunkt Very Large Business Applications Module aus dem Bereich Wirtschaftsinformatik SWS Empfohlenes Semester Prüfungsart

Mehr

Opinion Mining Herausforderungen und Anwendung in der Politik

Opinion Mining Herausforderungen und Anwendung in der Politik Opinion Mining Herausforderungen und Anwendung in der Politik 28.09.2011 Umut Yilmaz Inhaltsübersicht 1. Einführung 2. Grundlagen 3. Anwendung in der Politik 4. Anwendungsbeispiel 5. Fazit 2 1. Einführung

Mehr

Kapitel IR:III (Fortsetzung)

Kapitel IR:III (Fortsetzung) Kapitel IR:III (Fortsetzung) III. Retrieval-Modelle Modelle und Prozesse im IR Klassische Retrieval-Modelle Bool sches Modell Vektorraummodell Retrieval-Modelle mit verborgenen Variablen Algebraisches

Mehr

Terminus Sprache, Phonologie und Grammatik

Terminus Sprache, Phonologie und Grammatik Terminus Sprache, Phonologie und Grammatik Terminus Sprache Beinhaltet 4 verschiedene Bedeutungen Langage: menschliche Fähigkeit Langue: eine bestimmte Sprache, Untersuchungsgebiet der Linguistik Parole:

Mehr

Bemerkung: Termine und Orte für die einzelnen Lehrveranstaltungen sind dem Stundenplan zu entnehmen.

Bemerkung: Termine und Orte für die einzelnen Lehrveranstaltungen sind dem Stundenplan zu entnehmen. Allgemeine Modulbeschreibungen für das erste Semester Bachelor Informatik 1. Objektorientierte Programmierung Bestehend aus - Vorlesung Objektorientierte Programmierung (Prof. Zimmermann) - Übung zu obiger

Mehr

Text Mining - Wissensrohstoff Text

Text Mining - Wissensrohstoff Text Text Mining - Wissensrohstoff Text Gerhard Heyer Universität Leipzig heyer@informatik.uni-leipzig.de Institut für Informatik Grundlagen und Begriff 2 Informatik und ihre Anwendungen 1940-1960 Wissenschaftliches

Mehr

Einführung Computerlinguistik. Überblick

Einführung Computerlinguistik. Überblick Einführung Computerlinguistik Überblick Hinrich Schütze & Robert Zangenfeind Centrum für Informations- und Sprachverarbeitung, LMU München 2013-10-14 Schütze & Zangenfeind: Überblick 1 / 30 Take-away Schütze

Mehr

Inaugural-Dissertation. Philosophie

Inaugural-Dissertation. Philosophie Ontology On Demand Vollautomatische Ontologieerstellung aus deutschen Texten mithilfe moderner Textmining-Prozesse Inaugural-Dissertation zur Erlangung des Grades eines Doktors der Philosophie in der Fakultät

Mehr

Übungen Softwaretechnik I

Übungen Softwaretechnik I Universität Stuttgart Institut für Automatisierungstechnik und Softwaresysteme Prof. Dr.-Ing. M. Weyrich Übungen Softwaretechnik I Übung 5: Objektorientierte Analyse Einführung Objektorientierung in der

Mehr

Kapitel 16. Begriffe. HHU Düsseldorf, WS 2008/09 Information Retrieval 250

Kapitel 16. Begriffe. HHU Düsseldorf, WS 2008/09 Information Retrieval 250 Kapitel 16 Begriffe HHU Düsseldorf, WS 2008/09 Information Retrieval 250 Semantisches Umfeld "Find what I mean, not what I say" (Susan Feldman) natürlichsprachiges Umfeld Werkzeug: natürlichsprachiger

Mehr

DARIAH-DKPro-Wrapper Nils Reimers

DARIAH-DKPro-Wrapper Nils Reimers DARIAH-DKPro-Wrapper Nils Reimers 1 Maschinelle Textverarbeitung In einer Pipeline werden unterschiedliche Komponenten zusammengeschaltet Word- / Satztrennung Stopp- Wörter Lemmatisierung Named- Entities

Mehr

Intelligente Systeme WS 2015/16

Intelligente Systeme WS 2015/16 Lehrgebiet Intelligente Systeme WS 2015/16 Andreas Dengel Fragestellungen Automatisierung von intelligentem" Verhalten im Sinn eines Leistungsverstärkers für den Menschen, z.b. Verstehen von Bildern, Sprache

Mehr

Systemtheorie 1. Einführung Systemtheorie 1 Formale Systeme 1 # WS 2006/2007 Armin Biere JKU Linz Revision: 1.4

Systemtheorie 1. Einführung Systemtheorie 1 Formale Systeme 1 # WS 2006/2007 Armin Biere JKU Linz Revision: 1.4 Einführung intro 1 Grobklassifizierung r Methoden in der Informatik intro 2 Systemtheorie 1 Systeme 1 #342234 http://fmv.jku.at/fs1 WS 2006/2007 Johannes Kepler Universität Linz, Österreich Univ. Prof.

Mehr

Einführung in die Computerlinguistik Einführung

Einführung in die Computerlinguistik Einführung Die Disziplin Anwendungen Sprache & Ambiguität Hausaufgaben Einführung in die Computerlinguistik Einführung Dozentin: Wiebke Petersen Wiebke Petersen Einführung CL (1. Sitzung) 1 Die Disziplin Anwendungen

Mehr

KSM. Willkommen in Flensburg!

KSM. Willkommen in Flensburg! KSM Willkommen in Flensburg! MA KSM Akkreditierung im WS 2007/08 Studienbeginn: WS 2008/09, dann immer zum WS 4 Semester 6 Kerndisziplinen: Kulturwissenschaft Literaturwissenschaft Linguistik Medienwissenschaft

Mehr

INFORMATIONSEXTRAKTION

INFORMATIONSEXTRAKTION INFORMATIONSEXTRAKTION Referentin: Syriane Kemayou Yamga Universität Heidelberg, Computerlinguistik, Hauptseminar: Information Retrieval PD. Dr. Karin Haenelt 16.01.2006 Informationsextraktion (IE) 1.

Mehr

Kapitel 1.0. Aussagenlogik: Einführung. Mathematische Logik (WS 2011/12) Kapitel 1.0: Aussagenlogik: Einführung 1/ 1

Kapitel 1.0. Aussagenlogik: Einführung. Mathematische Logik (WS 2011/12) Kapitel 1.0: Aussagenlogik: Einführung 1/ 1 Kapitel 1.0 Aussagenlogik: Einführung Mathematische Logik (WS 2011/12) Kapitel 1.0: Aussagenlogik: Einführung 1/ 1 Ziele der Aussagenlogik In der Aussagenlogik analysiert man die Wahrheitswerte zusammengesetzter

Mehr

SAS TEXT ANALYTICS EVENT

SAS TEXT ANALYTICS EVENT SAS TEXT ANALYTICS EVENT DIENSTAG, 21. APRIL 2015 AGENDA Zeit Inhalt 16:00-16:30 Registrierung & Willkommenskaffee 16:30-16:45 16:45-17:15 17:15-17:45 Begrüssung und Einleitung ins Thema Text Analytics

Mehr

Spezielle Themen der KI. NLP Natural Language Processing. Sprachverstehen

Spezielle Themen der KI. NLP Natural Language Processing. Sprachverstehen Spezielle Themen der KI NLP Natural Language Processing Sprachverstehen NLP - Verarbeitungsstufen des Sprachverstehen 2 Phonologie und Phonetik Phonologie Lautlehre oder Sprachgebilde-Lautlehre untersucht

Mehr

1. Jurafsky und Martin

1. Jurafsky und Martin Vertiefung 1. Jurafsky und Martin Book Description (from amazon.com) This book offers a unified vision of speech and language processing, presenting state-of-the-art algorithms and techniques for both

Mehr

Qualitative Aspekte Enterprise Search Volltextsuche & Text Mining. Franz Kögl Vorstand IntraFind Software AG

Qualitative Aspekte Enterprise Search Volltextsuche & Text Mining. Franz Kögl Vorstand IntraFind Software AG Qualitative Aspekte Enterprise Search Volltextsuche & Text Mining Franz Kögl Vorstand IntraFind Software AG Vorstellung IntraFind AG Qualitative Sucherweiterung: Search+ Wildcardsuche Einbindung von Synonymen

Mehr

Sprachkontrastive Darstellung Deutsch-Türkisch

Sprachkontrastive Darstellung Deutsch-Türkisch Germanistik Nuran Aksoy Sprachkontrastive Darstellung Deutsch-Türkisch Studienarbeit Freie Universität Berlin Wintersemester 2003/2004 Fachbereich Philosophie und Geisteswissenschaften: Fächergruppe deutsche

Mehr

Algorithmen und Formale Sprachen

Algorithmen und Formale Sprachen Algorithmen und Formale Sprachen Algorithmen und formale Sprachen Formale Sprachen und Algorithmen Formale Sprachen und formale Algorithmen (formale (Sprachen und Algorithmen)) ((formale Sprachen) und

Mehr

Eigennamenerkennung mit großen lexikalischen Ressourcen. Jörg Didakowski BBAW

Eigennamenerkennung mit großen lexikalischen Ressourcen. Jörg Didakowski BBAW Eigennamenerkennung mit großen lexikalischen Ressourcen Jörg Didakowski BBAW Was sind Eigennamen? Sprachliche Zeichen (Eigennamen) das Bezeichnete (Named Entity) Was sind Eigennamen? Eigennamen bezeichnen

Mehr

Mit Computerlinguistik und Sprachtechnologie in die Zukunft: Die Technik

Mit Computerlinguistik und Sprachtechnologie in die Zukunft: Die Technik 1 Mit Computerlinguistik und Sprachtechnologie in die Zukunft: Die Technik Ein Fragebogen zur Einschätzung der Aktualität von Methoden und zum Zeithorizont von Entwicklungen. Karin Haenelt, 25.06.2002

Mehr

Textmining Klassifikation von Texten Teil 1: Naive Bayes

Textmining Klassifikation von Texten Teil 1: Naive Bayes Textmining Klassifikation von Texten Teil 1: Naive Bayes Dept. Informatik 8 (Künstliche Intelligenz) Friedrich-Alexander-Universität Erlangen-Nürnberg (Informatik 8) Klassifikation von Texten 1: Naive

Mehr

Geometrie & Bedeutung

Geometrie & Bedeutung Geometrie & Bedeutung Seminar für Sprachwissenschaft Universität Tübingen Christian Ebert christian.ebert@uni-tuebingen.de Fritz Hamm friedrich.hamm@uni-tuebingen.de Wilhelmstr. 19 Wilhelmstr. 19 Zimmer

Mehr