Text-Mining: Einführung

Save this PDF as:
 WORD  PNG  TXT  JPG

Größe: px
Ab Seite anzeigen:

Download "Text-Mining: Einführung"

Transkript

1 Text-Mining: Einführung Claes Neuefeind Fabian Steeg 22. April 2010

2 Organisatorisches Was ist Text-Mining? Definitionen Anwendungsbeispiele Textuelle Daten Aufgaben u. Teilbereiche Literatur

3 Kontakt Sprechstunde: Nach dem Seminar / nach Vereinbarung Mail: Büro: Philosophikum, 3. Etage, Zimmer 334 (SIV)

4 Materialien Homepage zum Seminar: spinfo-textmining.html Literatur: Soweit nicht online verfügbar, wird die Literatur in einem Seminarordner bereitgestellt

5 Definitionen Definition nach Feldman/Sanger Text mining [... ] tries to solve the information overload problem by using techniques from data mining, machine learning, natural language processing, information retrieval and knowledge management. [Feldman and Sanger, 2006, S. 1]

6 Definitionen Data Mining Knowledge discovery in databases Explorative Datenanalyse Trends und Muster über große Datenmengen DM operiert auf strukturierten Daten Neue Informationen

7 Definitionen Information-Retrieval Effiziente Suche in Texten IR operiert auf unstrukturierten Daten Informationsbedarf erfüllen Bekannte Informationen

8 Definitionen Abgrenzung nach [Heyer et al., 2006, S. 5] Ergebnis Ergebnis holen interpretieren Strukturierte Datenabfrage Datenanfrage Daten DB-Systeme DM-Werkzeuge Unstrukturierte Inhaltsabfrage Inhaltsanfrage Daten IR-Techniken TM-Werkzeuge

9 Definitionen Definition nach Heyer et al. Mit [... ] Text Mining werden computergestützte Verfahren für die semantische Analyse von Texten bezeichnet, welche die automatische bzw. semi-automatische Strukturierung von Texten, insbesondere sehr großen Mengen von Texten, unterstützen. [Heyer et al., 2006, S. 3] TM = Wissenserschließung aus Texten durch Strukturierung auf versch. Ebenen Siehe

10 Anwendungsbeispiele Hypothesenbildung durch Text-Mining Aufdecken von Mustern/Korrelationen Ableiten von Regeln Formulieren von Hypothesen durch Inferenz und/oder Transfer Evidenz durch experimentelle Überprüfung

11 Anwendungsbeispiele Beispiel: Medizinische Texte [Hearst, 2003, S. 621] Beobachtungen: Stress ist assoziiert mit Migräne Stress kann zu Magnesiummangel führen Blockieren der Calcium-Zufuhr kann Migräne verhindern Magnesium ist ein Calcium-Blocker... Hypothesen: Magnesiummangel spielt eine Rolle für bestimmte Arten von Migräne Magnesium kann Migräne lindern...

12 Anwendungsbeispiele TM-Tasks Effiziente Recherche in spezialisierten Textbeständen Filterung u. Verteilung von Mails, Korrespondenzen, etc. Erstellung firmen- u. fachspezifischer Glossare u. Thesauri Aufbau semantischer Netze für Wissensmanagement Autom. Zusammenfassen (Abstracting) Verbesserung IR Semantic Web... etc.

13 Eigenschaften textueller Daten Allgemein Redundanz Unschärfe Latente Strukturierung Markup Metadaten Ling. Struktur

14 Eigenschaften textueller Daten Heterogenität hinsichtlich der Formate Sprache? Dateiformat? Zeichensatz? Identifikation wichtig für Vorverarbeitung

15 Eigenschaften textueller Daten Heterogenität hinsichtlich der Inhalte Textsorte? Herkunft? Sachgebiet? Identifikation wichtig bei Weiterverarbeitung

16 Leitfragen Aufgabe: Unstrukturierte Daten aufbereiten, so dass das enthaltene Wissen extrahiert werden kann Informationsanreicherung Leitfrage: Welche Informationen werden benötigt? Semantische Relationen als Schlüssel zum Wissen Leitfragen des Seminars: Wie kommen wir an diese Informationen? Wie nutzen wir diese Informationen?

17 Bausteine für ein TM-System Datenstrukturen: Indexterme Vektoren für Dokumente/Terme Verfahren: Musteranalyse Klassifikation Clustering

18 Erste Schritte: Datenaufbereitung Korpuserstellung: Crawling, Ablegen in DB Tokenisierung: Ermitteln der Untersuchungseinheiten Normalisierung: Vereinheitlichen der Untersuchungseinheiten Stemming/Lemmatisierung: Anzahl der Untersuchungseinheiten reduzieren Siehe dazu u.a. [Manning et al., 2008], Kap 2.2

19 Feldman, R. and Sanger, J. (2006). The Text Mining Handbook: Advanced Approaches in Analyzing Unstructured Data. Cambridge University Press. Hearst, M. A. (2003). Text data mining. In Mitkov, R., editor, The Oxford Handbook of Computational Linguistics, Oxford Handbooks in Linguistics, pages Oxford University Press, Oxford. Heyer, G., Quasthoff, U., and Wittig, T. (2006). Text Mining: Wissensrohstoff Text. w3l Verlag, Herdecke/Bochum. Manning, C. D., Raghavan, P., and Schütze, H. (2008). Introduction to Information Retrieval. Cambridge University Press.

Big Data bei unstrukturierten Daten. AW1 Vortrag Sebastian Krome

Big Data bei unstrukturierten Daten. AW1 Vortrag Sebastian Krome Big Data bei unstrukturierten Daten AW1 Vortrag Sebastian Krome Agenda Wiederholung Aspekte von Big Data Datenverarbeitungsprozess TextMining Aktuelle Paper Identification of Live News Events Using Twitter

Mehr

Gerhard Heyer Universität Leipzig heyer@informatik.uni-leipzig.de

Gerhard Heyer Universität Leipzig heyer@informatik.uni-leipzig.de Text Mining Wissensrohstoff Text Gerhard Heyer Universität Leipzig heyer@informatik.uni-leipzig.de Institut für Informatik Grundlagen und Begriff 2 Informatik und ihre Anwendungen 1940-1960 Wissenschaftliches

Mehr

Text Mining - Wissensrohstoff Text

Text Mining - Wissensrohstoff Text Text Mining - Wissensrohstoff Text Gerhard Heyer Universität Leipzig heyer@informatik.uni-leipzig.de Institut für Informatik Grundlagen und Begriff 2 Informatik und ihre Anwendungen 1940-1960 Wissenschaftliches

Mehr

Text Mining mit LingPipe

Text Mining mit LingPipe Text Mining mit LingPipe Hauptseminar Information Retrieval PD Dr. Karin Haenelt Universität Heidelberg Vortrag von Alexander Kappe im Wintersemester 2008/2009 Übersicht Text Mining Definition & Abgrenzung

Mehr

EXTRAKTION UND KLASSIFIKATION VON BEWERTETEN PRODUKTFEATURES AUF WEBSEITEN

EXTRAKTION UND KLASSIFIKATION VON BEWERTETEN PRODUKTFEATURES AUF WEBSEITEN EXTRAKTION UND KLASSIFIKATION VON BEWERTETEN PRODUKTFEATURES AUF WEBSEITEN T-SYSTEMS MULTIMEDIA SOLUTIONS GMBH, 16. FEBRUAR 2012 1. Schlüsselworte Semantic Web, Opinion Mining, Sentiment Analysis, Stimmungsanalyse,

Mehr

Text Mining Wissensrohstoff Text

Text Mining Wissensrohstoff Text Text Mining Wissensrohstoff Text Gerhard Heyer Universität Leipzig heyer@informatik.uni-leipzig.de Institut für Informatik Text Mining 2 Text als Grundlage der Wissensverarbeitung Einige Arbeitshypothesen

Mehr

Text Mining und CRM. Hans Hermann Weber Univ. Erlangen IMMD 8, den 12.09.03

Text Mining und CRM. Hans Hermann Weber Univ. Erlangen IMMD 8, den 12.09.03 Text Mining und CRM Hans Hermann Weber Univ. Erlangen IMMD 8, den 12.09.03 Was ist Textmining Unstrukturierte Daten (Text) anreichern mit Strukturinformation: Metadaten hinzufügen Struktur (Segmentinformation)

Mehr

Text Mining Praktikum. Durchführung: Andreas Niekler Email: aniekler@informatik.uni-leipzig.de Zimmer: Paulinum (P) 818

Text Mining Praktikum. Durchführung: Andreas Niekler Email: aniekler@informatik.uni-leipzig.de Zimmer: Paulinum (P) 818 Text Mining Praktikum Durchführung: Andreas Niekler Email: aniekler@informatik.uni-leipzig.de Zimmer: Paulinum (P) 818 Rahmenbedingungen Gruppen von 2- (max)4 Personen Jede Gruppe erhält eine Aufgabe Die

Mehr

Volltextsuche und Text Mining

Volltextsuche und Text Mining 1 Volltextsuche und Text Mining Datum: 22.12.2009 Seminar: Einführung in die Computerlinguistik Referenten: Cornelia Baldauf, Valentin Heinz, Adriana Kosior 2 Agenda 1. Einführung a) Volltextsuche b) Text

Mehr

Kapitel IR:I. I. Einführung. Retrieval-Szenarien Begriffsbildung Einordnung Information Retrieval

Kapitel IR:I. I. Einführung. Retrieval-Szenarien Begriffsbildung Einordnung Information Retrieval Kapitel IR:I I. Einführung Retrieval-Szenarien Begriffsbildung Einordnung Information Retrieval IR:I-1 Introduction STEIN 2005-2010 Retrieval-Szenarien Liefere Dokumente, die die Terme «Information» und

Mehr

Proseminar - Data Mining

Proseminar - Data Mining Proseminar - Data Mining SCCS, Fakultät für Informatik Technische Universität München SS 2012, SS 2012 1 Data Mining Pipeline Planung Aufbereitung Modellbildung Auswertung Wir wollen nützliches Wissen

Mehr

Proseminar - Data Mining

Proseminar - Data Mining Proseminar - Data Mining SCCS, Fakultät für Informatik Technische Universität München SS 2014, SS 2014 1 Data Mining: Beispiele (1) Hausnummererkennung (Klassifikation) Source: http://arxiv.org/abs/1312.6082,

Mehr

Extraktion von Metadaten als Basis für eine semantische Integration heterogener Informationssysteme

Extraktion von Metadaten als Basis für eine semantische Integration heterogener Informationssysteme Extraktion von Metadaten als Basis für eine semantische Integration heterogener Informationssysteme Liane Haak, Axel Hahn Abteilung Wirtschaftsinformatik Carl von Ossietzky Universität Oldenburg Fakultät

Mehr

Datenbanken-Themen im OS "Data Mining" SS 2010

Datenbanken-Themen im OS Data Mining SS 2010 Prof. Dr.-Ing. Thomas Kudraß HTWK Leipzig, FIMN Datenbanken-Themen im OS "Data Mining" SS 2010 Die Vorträge sollten eine Dauer von 60 Minuten (Einzelvortrag) bzw. 45 Minuten (Doppelvortrag) haben. Nachfolgend

Mehr

Einführung in die Wissensverarbeitung und Data Mining

Einführung in die Wissensverarbeitung und Data Mining Einführung in die Wissensverarbeitung und Data Mining Peter Becker FH Bonn-Rhein-Sieg Fachbereich Angewandte Informatik!" $# Vorlesung Wintersemester 2001/02 1. Einführung Vorbemerkungen 1 Einführung Vorbemerkungen

Mehr

Text Mining Gliederung. Text Mining. OS Datamining SS 10. Thomas Boy. 25. Mai 2010 1 / 37

Text Mining Gliederung. Text Mining. OS Datamining SS 10. Thomas Boy. 25. Mai 2010 1 / 37 Gliederung Text Mining OS Datamining SS 10 Thomas Boy 25. Mai 2010 1 / 37 Gliederung 1 Gliederung 2 Einleitung Motivation Konkretisierung 3 Allgemeines Definiton Text Mining Ablaufschema 4 Anwendungen

Mehr

Semantic Web. Anwendungsbereiche & Entwicklungen. http://www.know-center.at. Dr. Michael Granitzer

Semantic Web. Anwendungsbereiche & Entwicklungen. http://www.know-center.at. Dr. Michael Granitzer Semantic Web Anwendungsbereiche & Entwicklungen Dr. Michael Granitzer - gefördert durch das Kompetenzzentrenprogramm Agenda Die Vision und warum das Semantic Web Sinn macht Grundlagen: Wissensrepräsentation

Mehr

Sprachtechnologie in der Wissenschaft: Digital-Turn in evidenzbasierter Bildungsforschung und -information

Sprachtechnologie in der Wissenschaft: Digital-Turn in evidenzbasierter Bildungsforschung und -information Sprachtechnologie in der Wissenschaft: Digital-Turn in evidenzbasierter Bildungsforschung und -information Iryna Gurevych Sprachtechnologie-Feuerwerk: Aktuelle Anwendungsbeispiele und Zukunftsvisionen

Mehr

Textmining Klassifikation von Texten Teil 1: Naive Bayes

Textmining Klassifikation von Texten Teil 1: Naive Bayes Textmining Klassifikation von Texten Teil 1: Naive Bayes Dept. Informatik 8 (Künstliche Intelligenz) Friedrich-Alexander-Universität Erlangen-Nürnberg (Informatik 8) Klassifikation von Texten 1: Naive

Mehr

Automatisierte Dossier- Erstellung mittels Text-Mining

Automatisierte Dossier- Erstellung mittels Text-Mining Automatisierte Dossier- Erstellung mittels Text-Mining Paul Assendorp Grundseminar 11.12.2014 Paul Assendorp Automatisierte Dossier-Erstellung 1 Gliederung Motivation Textmining Tools Aktueller Stand Ausblick

Mehr

Qualitative Aspekte Enterprise Search Volltextsuche & Text Mining. Franz Kögl Vorstand IntraFind Software AG

Qualitative Aspekte Enterprise Search Volltextsuche & Text Mining. Franz Kögl Vorstand IntraFind Software AG Qualitative Aspekte Enterprise Search Volltextsuche & Text Mining Franz Kögl Vorstand IntraFind Software AG Vorstellung IntraFind AG Qualitative Sucherweiterung: Search+ Wildcardsuche Einbindung von Synonymen

Mehr

Bildungsbedarfsanalyse auf Grundlage von Stellenanzeigen. Prof. Dr. Frank Bensberg Department für Wirtschaft

Bildungsbedarfsanalyse auf Grundlage von Stellenanzeigen. Prof. Dr. Frank Bensberg Department für Wirtschaft Bildungsbedarfsanalyse auf Grundlage von Stellenanzeigen Prof. Dr. Frank Bensberg Department für Wirtschaft Agenda Motivation Herausforderungen und Instrumente des Bildungsbedarfsmanagements Technische

Mehr

Rheinlandtreffen 7. November 2006

Rheinlandtreffen 7. November 2006 Dirk Thorleuchter No 1 Inhalt Einleitung Motivation Aufgabenstellung Methode / Vorgehensweise KDT-Prozess Beispiele Evoluation Zusammenfassung No 2 1 Einleitung Motivation Trend zur kontinuierlich ansteigende

Mehr

Web Information Retrieval. Zwischendiskussion. Überblick. Meta-Suchmaschinen und Fusion (auch Rank Aggregation) Fusion

Web Information Retrieval. Zwischendiskussion. Überblick. Meta-Suchmaschinen und Fusion (auch Rank Aggregation) Fusion Web Information Retrieval Hauptseminar Sommersemester 2003 Thomas Mandl Überblick Mehrsprachigkeit Multimedialität Heterogenität Qualität, semantisch, technisch Struktur Links HTML Struktur Technologische

Mehr

Data Warehouse Definition (1) http://de.wikipedia.org/wiki/data-warehouse

Data Warehouse Definition (1) http://de.wikipedia.org/wiki/data-warehouse Data Warehouse Definition (1) http://de.wikipedia.org/wiki/data-warehouse Ein Data-Warehouse bzw. Datenlager ist eine zentrale Datensammlung (meist eine Datenbank), deren Inhalt sich aus Daten unterschiedlicher

Mehr

DIE ZUKUNFT WARTET NICHT. ANALYSIERE SIE.

DIE ZUKUNFT WARTET NICHT. ANALYSIERE SIE. INFORMATION SCIENCE & BIG DATA ANALYTICS * MASTER OF SCIENCE (MSc ) FLORIAN KALCHER, NDU Student DIE ZUKUNFT WARTET NICHT. ANALYSIERE SIE. *in Akkreditierung DAS DATENUNIVERSUM MEISTERN In der digitalen

Mehr

Das Knowledge Grid. Eine Architektur für verteiltes Data Mining

Das Knowledge Grid. Eine Architektur für verteiltes Data Mining Das Knowledge Grid Eine Architektur für verteiltes Data Mining 1 Gliederung 1. Motivation 2. KDD und PDKD Systeme 3. Knowledge Grid Services 4. TeraGrid Projekt 5. Das Semantic Web 2 Motivation Rapide

Mehr

Datenbanken und Informationssysteme

Datenbanken und Informationssysteme Datenbanken und Informationssysteme Lehrangebot Stefan Conrad Heinrich-Heine-Universität Düsseldorf Institut für Informatik April 2012 Stefan Conrad (HHU) Datenbanken und Informationssysteme April 2012

Mehr

Fachgruppe Statistik, Risikoanalyse & Computing. STAT672 Data Mining. Sommersemester 2007. Prof. Dr. R. D. Reiß

Fachgruppe Statistik, Risikoanalyse & Computing. STAT672 Data Mining. Sommersemester 2007. Prof. Dr. R. D. Reiß Fachgruppe Statistik, Risikoanalyse & Computing STAT672 Data Mining Sommersemester 2007 Prof. Dr. R. D. Reiß Überblick Data Mining Begrifflichkeit Unter Data Mining versteht man die Computergestützte Suche

Mehr

Text Mining für News-Sites Nina Hälker

Text Mining für News-Sites Nina Hälker Ablauf Department Informatik, HAW Hamburg Sommersemester 2014 A Motivation Aufbauprojekt Was sagt das Ausland? Fokus der Masterarbeit: Text Mining für News-Sites B Drei Papers: Fokus, Ergebnisse, eigenes

Mehr

Für das Text Mining wichtige Grundbegriffe sind Text, Information und Wissen. Diese Begriffe werden näher erläutert:

Für das Text Mining wichtige Grundbegriffe sind Text, Information und Wissen. Diese Begriffe werden näher erläutert: 1 1 Wissen und Text * Text ist ein bedeutender Wissensrohstoff, der im Zeitalter des Internet in großen Mengen in digitaler Form zur Verfügung steht. Mit Hilfe von Text Mining kann das in Texten enthaltene

Mehr

Detecting Near Duplicates for Web Crawling

Detecting Near Duplicates for Web Crawling Detecting Near Duplicates for Web Crawling Gurmeet Singh Manku et al., WWW 2007* * 16th international conference on World Wide Web Detecting Near Duplicates for Web Crawling Finde near duplicates in großen

Mehr

Prüfungsplan Master of Science in Wirtschaftsinformatik

Prüfungsplan Master of Science in Wirtschaftsinformatik Prüfungsplan Master of Science in Wirtschaftsinformatik Modul Art Creditpunkte Schwerpunkt Very Large Business Applications Module aus dem Bereich Wirtschaftsinformatik SWS Empfohlenes Semester Prüfungsart

Mehr

Mathematisch-algorithmische Grundlagen für Big Data

Mathematisch-algorithmische Grundlagen für Big Data Mathematisch-algorithmische Grundlagen für Big Data Numerische Algorithmen für Datenanalyse und Optimierung Prof. Dr. Peter Becker Fachbereich Informatik Hochschule Bonn-Rhein-Sieg Sommersemester 2016

Mehr

Informationswissenschaft zwischen virtueller Infrastruktur und materiellen Lebenswelten

Informationswissenschaft zwischen virtueller Infrastruktur und materiellen Lebenswelten Inhaltsverzeichnis 3 Hans-Christoph Hobohm (Hrsg.) Informationswissenschaft zwischen virtueller Infrastruktur und materiellen Lebenswelten Information Science between Virtual Infrastructure and Material

Mehr

Ontologien. Ontologien (aus ISM Kap. 3. Wissensrepräsentation für Texte) Ontologien: Konstrukte. Konzepte/Klassen

Ontologien. Ontologien (aus ISM Kap. 3. Wissensrepräsentation für Texte) Ontologien: Konstrukte. Konzepte/Klassen Ontologien Ontologien (aus ISM Kap. 3. Wissensrepräsentation für Texte) Norbert Fuhr Ursprung: semantische Netze aus der künstlichen Intelligenz (1970er) weiterentwickelt als terminologische Logiken, Beschreibungslogiken

Mehr

Ontologien (aus ISM Kap. 3. Wissensrepräsentation für Texte) Norbert Fuhr

Ontologien (aus ISM Kap. 3. Wissensrepräsentation für Texte) Norbert Fuhr Ontologien (aus ISM Kap. 3. Wissensrepräsentation für Texte) Norbert Fuhr 1 / 23 Ontologien Ursprung: semantische Netze aus der künstlichen Intelligenz (1970er) weiterentwickelt als terminologische Logiken,

Mehr

Präsentation zur Diplomprüfung. Thema der Diplomarbeit:

Präsentation zur Diplomprüfung. Thema der Diplomarbeit: Präsentation zur Diplomprüfung Thema der Diplomarbeit: Analyse der Einsatzmöglichkeiten von Data Mining- Verfahren innerhalb einer Unternehmens - Balanced Scorecard und Entwicklung eines Empfehlungskatalogs.

Mehr

Informationsflut bewältigen - Textmining in der Praxis

Informationsflut bewältigen - Textmining in der Praxis Informationsflut bewältigen - Textmining in der Praxis Christiane Theusinger Business Unit Data Mining & CRM Solutions SAS Deutschland Ulrich Reincke Manager Business Data Mining Solutions SAS Deutschland

Mehr

Ausgangsposition. Aspekte der Texttechnologie. Aspekte der Texttechnologie. Susanne J. Jekat Zürcher Hochschule Winterthur E-mail: jes@zhwin.

Ausgangsposition. Aspekte der Texttechnologie. Aspekte der Texttechnologie. Susanne J. Jekat Zürcher Hochschule Winterthur E-mail: jes@zhwin. Aspekte der Texttechnologie Susanne J. Jekat Zürcher Hochschule Winterthur E-mail: jes@zhwin.ch Aspekte der Texttechnologie Thema 5 Semantic Web Termine: 24. Mai 2007 Lernfrage: Was ist das Semantic Web

Mehr

Organisatorisches. Unit1: Intro and Basics. Bewertung. About Me.. Datenorientierte Systemanalyse. Gerhard Wohlgenannt

Organisatorisches. Unit1: Intro and Basics. Bewertung. About Me.. Datenorientierte Systemanalyse. Gerhard Wohlgenannt Organisatorisches Datenorientierte Systemanalyse Unit1: Intro and Basics Gerhard Wohlgenannt Inhalt: Datenorientierte Systemanalyse Umfang: 5 units XX.10.2013 XX.11.2013 09:00-13:30 Uhr Room XXX Infos,

Mehr

Entwicklung von IR-Algorithmen zur automatischen Bewertung von Krankenversicherungstarifen

Entwicklung von IR-Algorithmen zur automatischen Bewertung von Krankenversicherungstarifen Sören Auer, Thomas Riechert, Johannes Schmidt (Hrsg.): SKIL 2011 Studentenkonferenz Informatik Leipzig 2011, Leipziger Beiträge zur Informatik Band XXVII, Leipziger Informatik-Verbund (LIV), 2011 ISBN

Mehr

Data/Information Quality Management

Data/Information Quality Management Data/Information Quality Management Seminar WI/Informationsmanagement im Sommersemester 2002 Markus Berberov, Roman Eder, Peter Gerstbach 11.6.2002 Inhalt! Daten und Datenqualität! Einführung und Definition!

Mehr

Kurze Einführung in Web Data Mining

Kurze Einführung in Web Data Mining Kurze Einführung in Web Data Mining Yeong Su Lee Centrum für Informations- und Sprachverarbeitung (CIS), LMU 17.10.2007 Kurze Einführung in Web Data Mining 1 Überblick Was ist Web? Kurze Geschichte von

Mehr

Text Mining in der Wettbewerberanalyse: Konvertierung von Textarchiven in XML-Dokumente

Text Mining in der Wettbewerberanalyse: Konvertierung von Textarchiven in XML-Dokumente Text Mining in der Wettbewerberanalyse: Konvertierung von Textarchiven in XML-Dokumente Karsten Winkler 1 und Myra Spiliopoulou Handelshochschule Leipzig (HHL) Lehrstuhl für Wirtschaftsinformatik des E-Business

Mehr

SAS TEXT ANALYTICS EVENT

SAS TEXT ANALYTICS EVENT SAS TEXT ANALYTICS EVENT DIENSTAG, 21. APRIL 2015 AGENDA Zeit Inhalt 16:00-16:30 Registrierung & Willkommenskaffee 16:30-16:45 16:45-17:15 17:15-17:45 Begrüssung und Einleitung ins Thema Text Analytics

Mehr

Informationsextraktion. Karin Haenelt 1.12.2012

Informationsextraktion. Karin Haenelt 1.12.2012 Informationsextraktion Karin Haenelt 1.12.2012 Informationsextraktion Ziel Identifikation bestimmter Information (Daten) in einem unstrukturierten oder teilstrukturierten textuellen Dokument Transformation

Mehr

Maschinelles Lernen und Data Mining: Methoden und Anwendungen

Maschinelles Lernen und Data Mining: Methoden und Anwendungen Maschinelles Lernen und Data Mining: Methoden und Anwendungen Eyke Hüllermeier Knowledge Engineering & Bioinformatics Fachbereich Mathematik und Informatik GFFT-Jahrestagung, Wesel, 17. Januar 2008 Knowledge

Mehr

Innovationsbeobachtung!

Innovationsbeobachtung! ! Innovationsbeobachtung! Dr. Feiyu Xu Deutsches Forschungszentrum für Künstliche Intelligenz (DFKI)! Das ständige Radar Ein proaktiv handelndes Unternehmen identifiziert Chancen und Gefahren durch künftige

Mehr

!"#$%&'()$"*+,(%'-()$"

!#$%&'()$*+,(%'-()$ "#$%&'()$"*+,(%'-()$" A$,()'*B'3)#01*C*.,D$*43(%(, "#$%&'(%&)*+,-.#/$0(.,12)#$#3)(04,5 7,(2)#1(080*94*:;', ?>@=>?? "#$%&'(%&)*+,-.#/$0(.,12)#$#3)(04,5*6*7,(2)#1(080*94*:;',*6*?>@=>??

Mehr

!!!!T!!! Systems!() Multimedia Solutions

!!!!T!!! Systems!() Multimedia Solutions Inhalt. Was ist das semantische Web? Wie findet man einen Arzttermin mit Hilfe des semantischen Web? Wie gibt man Inhalten einen Sinn? Welche Werkzeuge stehen zur Verfügung? Wo können strukturierte Inhalte

Mehr

Proseminar - Data Mining

Proseminar - Data Mining Vorbesprechung Proseminar - Data Mining SCCS, Fakultät für Informatik Technische Universität München SS 2015 Vorbesprechung, SS 2015 1 Data Mining: Beispiele (1) Hausnummererkennung (Klassifikation) Source:

Mehr

Modul 02: Zum Ablauf einer statistischen (empirischen) Untersuchung. Prof. Dr. W. Laufner. Beschreibende Statistik. Wozu statistische Methoden

Modul 02: Zum Ablauf einer statistischen (empirischen) Untersuchung. Prof. Dr. W. Laufner. Beschreibende Statistik. Wozu statistische Methoden Modul 02: Zum Ablauf einer statistischen (empirischen) Untersuchung 1 Modul 02: unübersichtliche, unstrukturierte große Datenmenge Wozu statistische Methoden Informationen, Erkenntnisse DV-gestützte Datenanalyse

Mehr

Christian Zietzsch / Norman Zänker. Text Mining. und dessen Implementierung. Diplomica Verlag

Christian Zietzsch / Norman Zänker. Text Mining. und dessen Implementierung. Diplomica Verlag Christian Zietzsch / Norman Zänker Text Mining und dessen Implementierung Diplomica Verlag Christian Zietzsch, Norman Zänker Text Mining und dessen Implementierung ISBN: 978-3-8428-0970-3 Herstellung:

Mehr

Vorwort zur zweiten Auflage...V. Vorwort zur ersten Auflage... VIII

Vorwort zur zweiten Auflage...V. Vorwort zur ersten Auflage... VIII Vorwort zur zweiten Auflage...V Vorwort zur ersten Auflage... VIII 1 Management Support Systeme und Business Intelligence Anwendungssysteme zur Unterstützung von Managementaufgaben...1 1.1 Computergestützte

Mehr

Tiefgreifende Prozessverbesserung und Wissensmanagement durch Data Mining

Tiefgreifende Prozessverbesserung und Wissensmanagement durch Data Mining Tiefgreifende Prozessverbesserung und Wissensmanagement durch Data Mining Ausgangssituation Kaizen Data Mining ISO 9001 Wenn andere Methoden an ihre Grenzen stoßen Es gibt unzählige Methoden, die Abläufe

Mehr

Social Business Intelligence Text Mining und Hadoop bei DB Fernverkehr AG

Social Business Intelligence Text Mining und Hadoop bei DB Fernverkehr AG Social Business Intelligence Text Mining und Hadoop bei DB Fernverkehr AG DB Fernverkehr AG Dr.-Ing. Axel Schulz, Dr. Matthias Platho P.FMB 2, DB Fernverkehr AG Frankfurt, 22.05.2015 Motivation An meinem

Mehr

VO 340088 Sprachtechnologien. Informations- und Wissensmanagement. Bartholomäus Wloka. Zentrum für Translationswissenschaft

VO 340088 Sprachtechnologien. Informations- und Wissensmanagement. Bartholomäus Wloka. Zentrum für Translationswissenschaft , Informations- und Wissensmanagement Zentrum für Translationswissenschaft Grundlagen und Definitionen Maschinelle Sprachverarbeitung Breites Spektrum an Methoden der Computerverarbeitung von Sprache.

Mehr

9 Resümee. Resümee 216

9 Resümee. Resümee 216 Resümee 216 9 Resümee In der vorliegenden Arbeit werden verschiedene Methoden der Datenreduktion auf ihre Leistungsfähigkeit im sozialwissenschaftlichstatistischen Umfeld anhand eines konkreten Anwendungsfalls

Mehr

Masterstudium Softwareentwicklung- Wirtschaft CURRICULUM 2005 IN DER VERSION 2013 MICHAEL KRISPER, BASISGRUPPE INFORMATIK & SOFTWAREENTWICKLUNG

Masterstudium Softwareentwicklung- Wirtschaft CURRICULUM 2005 IN DER VERSION 2013 MICHAEL KRISPER, BASISGRUPPE INFORMATIK & SOFTWAREENTWICKLUNG Masterstudium Softwareentwicklung- Wirtschaft CURRICULUM 2005 IN DER VERSION 2013 MICHAEL KRISPER, BASISGRUPPE INFORMATIK & SOFTWAREENTWICKLUNG Infos für den Anfang Curriculum ist im Mitteilungsblatt veröffentlicht:

Mehr

Knowledge Discovery In Databases. Data Mining - Der moderne Goldrausch?

Knowledge Discovery In Databases. Data Mining - Der moderne Goldrausch? Oberseminar Data Mining 07. April 2010 Methodik des Data Mining Knowledge Discovery In Databases oder auch Data Mining - Der moderne Goldrausch? Data Mining...? Hochleistungsrechnen Geoinformationssysteme

Mehr

Ein Beispiel. Ein Unternehmen will Internettechnologien im Rahmen des E- Business nutzen Welche Geschäftsprozesse?

Ein Beispiel. Ein Unternehmen will Internettechnologien im Rahmen des E- Business nutzen Welche Geschäftsprozesse? Ein Beispiel Ein Unternehmen will Internettechnologien im Rahmen des E- Business nutzen Welche Geschäftsprozesse? Dipl.-Kfm. Claus Häberle WS 2015 /16 # 42 XML (vereinfacht) visa

Mehr

Meaning-Based Computing

Meaning-Based Computing Universität Salzburg Institut für Computerwissenschaften Seminar aus Informatik SS 2009 Leiter: Univ.-Prof. Dr. Wolfgang Pree Simon Kranzer, Sabine Klausner {simon.kranzer sabine.klausner} at cosy dot

Mehr

Big [Data] Picture im Wissensmanagement

Big [Data] Picture im Wissensmanagement Big [Data] Picture im Wissensmanagement Mit selbstlernenden Verfahren wichtiges internes und externes Wissen identifizieren und nutzen Jörg Hoffmann, Projektleiter; Dr. Gerhard Paaß, Senior Research Scientist;

Mehr

GMDS-Tagung 2006 Bioinformatik 1. Assessing the stability of unsupervised learning results in small-sample-size problems

GMDS-Tagung 2006 Bioinformatik 1. Assessing the stability of unsupervised learning results in small-sample-size problems GMDS-Tagung 2006 Bioinformatik 1 Assessing the stability of unsupervised learning results in small-sample-size problems Ulrich Möller Email: Ulrich.Moeller@hki-jena.de Leibniz Institute for Natural Product

Mehr

Technologischen Rahmenbedingungen und Werkzeuge für eine wertschöpfende Controller-Rolle

Technologischen Rahmenbedingungen und Werkzeuge für eine wertschöpfende Controller-Rolle Technologischen Rahmenbedingungen und Werkzeuge für eine wertschöpfende Controller-Rolle 40. Congress der Controller, Themenzentrum C, München Steffen Vierkorn, Geschäftsführer Qunis GmbH, Neubeuern Die

Mehr

Visualisierung der Imperfektion in multidimensionalen Daten

Visualisierung der Imperfektion in multidimensionalen Daten Visualisierung der Imperfektion in multidimensionalen Daten Horst Fortner Imperfektion und erweiterte Konzepte im Data Warehousing Betreuer: Heiko Schepperle 2 Begriffe (1) Visualisierung [Wikipedia] abstrakte

Mehr

EXASOL Anwendertreffen 2012

EXASOL Anwendertreffen 2012 EXASOL Anwendertreffen 2012 EXAPowerlytics Feature-Architektur EXAPowerlytics In-Database Analytics Map / Reduce Algorithmen Skalare Fkt. Aggregats Fkt. Analytische Fkt. Hadoop Anbindung R LUA Python 2

Mehr

Intelligente Unterstützung für argumentatives Schreiben

Intelligente Unterstützung für argumentatives Schreiben Intelligente Unterstützung für argumentatives Schreiben Christian Stab Workshop Text als Werkstu ck - Wege zu einer computergestu tzten U berarbeitung von deutschen Texten Deutsches Institut fu r Internationale

Mehr

Christian Zietzsch / Norman Zänker. Text Mining. und dessen Implementierung. Diplomica Verlag

Christian Zietzsch / Norman Zänker. Text Mining. und dessen Implementierung. Diplomica Verlag Christian Zietzsch / Norman Zänker Text Mining und dessen Implementierung Diplomica Verlag Christian Zietzsch, Norman Zänker Text Mining und dessen Implementierung ISBN: 978-3-8428-0970-3 Herstellung:

Mehr

Technische Aspekte einer Videosuchmaschine. Björn Wilmsmann, CEO - MetaSieve GmbH

Technische Aspekte einer Videosuchmaschine. Björn Wilmsmann, CEO - MetaSieve GmbH Technische Aspekte einer Videosuchmaschine Björn Wilmsmann, CEO - MetaSieve GmbH 1 Über MetaSieve http://www.metasieve.com Softwareentwicklung Internet Software Spezialisiert auf Suchmaschinentechnologie

Mehr

Ausarbeitung. Nicolas With. Vergleich von Text Mining Algorithmen in Social Media in Bezug auf ein Epidemie-Frühwarnsystem

Ausarbeitung. Nicolas With. Vergleich von Text Mining Algorithmen in Social Media in Bezug auf ein Epidemie-Frühwarnsystem Ausarbeitung Nicolas With Vergleich von Text Mining Algorithmen in Social Media in Bezug auf ein Epidemie-Frühwarnsystem Fakultät Technik und Informatik Studiendepartment Informatik Faculty of Engineering

Mehr

Einführung. Arbeitsgruppe. Proseminar Corporate Semantic Web. Prof. Dr. Adrian Paschke

Einführung. Arbeitsgruppe. Proseminar Corporate Semantic Web. Prof. Dr. Adrian Paschke Arbeitsgruppe Proseminar Corporate Semantic Web Einführung Prof. Dr. Adrian Paschke Arbeitsgruppe Corporate Semantic Web (AG-CSW) Institut für Informatik, Freie Universität Berlin paschke@inf.fu-berlin.de

Mehr

Welche Textklassifikationen gibt es und was sind ihre spezifischen Merkmale?

Welche Textklassifikationen gibt es und was sind ihre spezifischen Merkmale? Text Welche Textklassifikationen gibt es und was sind ihre spezifischen Merkmale? Textklassifikationen Natürliche bzw. unstrukturierte Texte Normale Texte ohne besondere Merkmale und Struktur Semistrukturierte

Mehr

Universität Dortmund Integrating Knowledge Discovery into Knowledge Management

Universität Dortmund Integrating Knowledge Discovery into Knowledge Management Integrating Knowledge Discovery into Knowledge Management Katharina Morik, Christian Hüppe, Klaus Unterstein Univ. Dortmund LS8 www-ai.cs.uni-dortmund.de Overview Integrating given data into a knowledge

Mehr

Fachprojekt Data Mining Datenanalyse und Sprache

Fachprojekt Data Mining Datenanalyse und Sprache Fachprojekt Data Mining Datenanalyse und Sprache Prof. Dr. Katharina Morik Informatik LS8 Eine Fülle von Daten liegt in Form natürlicher Sprache vor und eine Vielzahl von Methoden und Werkzeugen gibt es,

Mehr

Forschunsprojekte und Independent Coursework. Prof. Dr. Christian Herta 29. Januar 2013

Forschunsprojekte und Independent Coursework. Prof. Dr. Christian Herta 29. Januar 2013 Forschunsprojekte und Independent Coursework Prof. Dr. Christian Herta 29. Januar 2013 Forschungsgebiete Suchtechnologie, Text- und Webmining Verarbeitung unstrukturierter Daten, insbesondere Text Large

Mehr

Vorlesung Information Retrieval Wintersemester 04/05

Vorlesung Information Retrieval Wintersemester 04/05 Vorlesung Information Retrieval Wintersemester 04/05 14. Oktober 2004 Institut für Informatik III Universität Bonn Tel. 02 28 / 73-45 31 Fax 02 28 / 73-43 82 jw@informatik.uni-bonn.de 1 Themenübersicht

Mehr

Java EE Projektseminar

Java EE Projektseminar Java EE Projektseminar Daniel Alberts & Sonja Subicin Sprachliche Informationsverarbeitung Universität zu Köln Sommersemester 2010 Sitzung Organisatorisches zum Seminar Java EE Projektplanung Defi nition

Mehr

Entscheidungsunterstützende Systeme

Entscheidungsunterstützende Systeme Entscheidungsunterstützende Systeme (WS 015/016) Klaus Berberich (klaus.berberich@htwsaar.de) Rainer Lenz (rainer.lenz@htwsaar.de) 0. Organisatorisches Dozenten Klaus Berberich (klaus.berberich@htwsaar.de)

Mehr

Wissen aus unstrukturierten natürlichsprachlichen

Wissen aus unstrukturierten natürlichsprachlichen ZKI Tagung AK Supercomputing, 19.-20. Okt. 2015 Wissen aus unstrukturierten natürlichsprachlichen Daten Sprachtechnologie und Textanalytik in the large Udo Hahn Jena University Language & Information Engineering

Mehr

Personalisierung. Der Personalisierungsprozess Nutzerdaten erheben aufbereiten auswerten Personalisierung. Data Mining.

Personalisierung. Der Personalisierungsprozess Nutzerdaten erheben aufbereiten auswerten Personalisierung. Data Mining. Personalisierung Personalisierung Thomas Mandl Der Personalisierungsprozess Nutzerdaten erheben aufbereiten auswerten Personalisierung Klassifikation Die Nutzer werden in vorab bestimmte Klassen/Nutzerprofilen

Mehr

Seminar Business Intelligence Teil II. Data Mining & Knowledge Discovery

Seminar Business Intelligence Teil II. Data Mining & Knowledge Discovery Seminar Business Intelligence Teil II Data Mining & Knowledge Discovery Was ist Data Mining? Sabine Queckbörner Was ist Data Mining? Data Mining Was ist Data Mining? Nach welchen Mustern wird gesucht?

Mehr

Web Market Research.360

Web Market Research.360 .360 Kunden verstehen durch Zuhören - nicht durch Befragen! Research, Analysis & Consulting www.schwerdtundfeger.de trifft das Social Als Marktforschung kann man den Als Social wird die Gesamtheit von

Mehr

Mehrsprachige Kategorisierung

Mehrsprachige Kategorisierung know-how innovation Mehrsprachige Kategorisierung für die automatische Beschlagwortung 22.3.2011, Dr. Peter Schäuble solution Information Retrieval Anwendungen im Bibliotheksumfeld! Information Retrieval

Mehr

Seminar Objekterkennung in Bildern und Videos WS 2008/2009. - Einführung - Sandra Witt Lehrstuhl Multimedia Computing Universität Augsburg

Seminar Objekterkennung in Bildern und Videos WS 2008/2009. - Einführung - Sandra Witt Lehrstuhl Multimedia Computing Universität Augsburg Seminar Objekterkennung in Bildern und Videos WS 2008/2009 - Einführung - Sandra Witt Lehrstuhl Multimedia Computing Universität Augsburg Überblick Wozu Seminare? Organisatorisches Literaturrecherche Vortrag

Mehr

m2n Intelligence Management Semantic Technologies Knowledge Discovery Modelbased Development Technologies

m2n Intelligence Management Semantic Technologies Knowledge Discovery Modelbased Development Technologies Semantic Technologies Knowledge Discovery Modelbased Development Technologies Application Layer Application Semantic Mapping Configuration Rules Model Layer User Data Data Mapping Structured Data Data

Mehr

Thementisch Anwendungsgebiete und

Thementisch Anwendungsgebiete und Thementisch Anwendungsgebiete und b Erfolgsgeschichten KMUs und Big Data Wien 08. Juni 2015 Hermann b Stern, Know-Center www.know-center.at Know-Center GmbH Know-Center Research Center for Data-driven

Mehr

Seminar Visual Analytics and Visual Data Mining

Seminar Visual Analytics and Visual Data Mining Seminar Visual Analytics and Visual Data Mining Dozenten:, AG Visual Computing Steffen Oeltze, AG Visualisierung Organisatorisches Seminar für Diplom und Bachelor-Studenten (max. 18) (leider nicht für

Mehr

Cloud Computing für Big-Data-Analysen in der Medizin. Dr. Martin Sedlmayr Lehrstuhl für Medizinische Informatik, FAU

Cloud Computing für Big-Data-Analysen in der Medizin. Dr. Martin Sedlmayr Lehrstuhl für Medizinische Informatik, FAU Cloud Computing für Big-Data-Analysen in der Medizin Dr. Martin Sedlmayr Lehrstuhl für Medizinische Informatik, FAU Herausforderungen Herausforderungen für Leistungserbringer im Gesundheitswesen: Verbesserung

Mehr

Data Mining Standards am Beispiel von PMML. Data Mining Standards am Beispiel von PMML

Data Mining Standards am Beispiel von PMML. Data Mining Standards am Beispiel von PMML Data Mining Standards am Beispiel von PMML Allgemeine Definitionen im Data Mining Data Mining (DM) Ein Prozess, um interessante neue Muster, Korrelationen und Trends in großen Datenbeständen zu entdecken,

Mehr

Benutzermodelle, Information Retrieval und Visualisierung

Benutzermodelle, Information Retrieval und Visualisierung Benutzermodelle, Information Retrieval und Visualisierung Swantje Willms University of Pittsburgh, Pennsylvania, USA swillms@mail.sis.pitt.edu Abstract: Wir stellen eine zweischichtige Visualisierung vor,

Mehr

DYONIPOS: Wissenszentrierte Unterstützung und Steuerung von Prozessen

DYONIPOS: Wissenszentrierte Unterstützung und Steuerung von Prozessen DYONIPOS: Wissenszentrierte Unterstützung und Steuerung von Prozessen Ein Pilotprojekt mit dem Bundesministerium für Finanzen 07.09.2006, I-KNOW 06 Doris Reisinger [m2n consulting and development gmbh]

Mehr

Grenzen und Gemeinsamkeiten: Die Beziehung zwischen der Computerlinguistik und den Digital Humanities

Grenzen und Gemeinsamkeiten: Die Beziehung zwischen der Computerlinguistik und den Digital Humanities Grenzen und Gemeinsamkeiten: Die Beziehung zwischen der Computerlinguistik und den Digital Humanities Gerhard Heyer Universität Leipzig heyer@informatik.uni-leipzig.de Institut für Informatik Kurzvorstellung

Mehr

Data Mining und Knowledge Discovery in Databases

Data Mining und Knowledge Discovery in Databases Data Mining und Knowledge Discovery in Databases Begriffsabgrenzungen... Phasen der KDD...3 3 Datenvorverarbeitung...4 3. Datenproblematik...4 3. Möglichkeiten der Datenvorverarbeitung...4 4 Data Mining

Mehr

Tagging von Online-Blogs

Tagging von Online-Blogs Tagging von Online-Blogs Gertrud Faaß (vertreten durch Josef Ruppenhofer) STTS tagset and tagging: special corpora 24. September 2012 Faaß MODEBLOGS 1 Korpuslinguistische studentische Projekte am IwiSt

Mehr

Opinion Mining in der Marktforschung

Opinion Mining in der Marktforschung Opinion Mining in der Marktforschung von andreas.boehnke@stud.uni-bamberg.de S. 1 Überblick I. Motivation Opinion Mining II. Grundlagen des Text Mining III. Grundlagen des Opinion Mining IV. Opinion Mining

Mehr

Seminar im Sommersemester 2005 DATA WAREHOUSING. Data Mining. Christian Knappe. Fachrichtung Wirtschaftsinformatik Friedrich-Schiller-Universität Jena

Seminar im Sommersemester 2005 DATA WAREHOUSING. Data Mining. Christian Knappe. Fachrichtung Wirtschaftsinformatik Friedrich-Schiller-Universität Jena Seminar im Sommersemester 2005 DATA WAREHOUSING Data Mining Christian Knappe Fachrichtung Wirtschaftsinformatik Friedrich-Schiller-Universität Jena Fakultät für Mathematik und Informatik Lehrstuhl für

Mehr

PG-402 Wissensmanagement: Ontologiebasierte Wissensextraktion

PG-402 Wissensmanagement: Ontologiebasierte Wissensextraktion PG-402 Wissensmanagement: Ontologiebasierte Wissensextraktion WS2001/2002 Klaus Unterstein 20.10.2001 PG-402 Wissensmanagement: Ontologiebasierte Wissensextraktion 1 Verlauf Begriffsklärung Ontologiebasierte

Mehr

Semantic Web Technologies I

Semantic Web Technologies I Semantic Web Technologies I Lehrveranstaltung im WS11/12 Dr. Elena Simperl PD Dr. Sebastian Rudolph M. Sc. Anees ul Mehdi Ontology Engineering Dr. Elena Simperl XML und URIs Einführung in RDF RDF Schema

Mehr