Text-Mining: Einführung

Größe: px
Ab Seite anzeigen:

Download "Text-Mining: Einführung"

Transkript

1 Text-Mining: Einführung Claes Neuefeind Fabian Steeg 22. April 2010

2 Organisatorisches Was ist Text-Mining? Definitionen Anwendungsbeispiele Textuelle Daten Aufgaben u. Teilbereiche Literatur

3 Kontakt Sprechstunde: Nach dem Seminar / nach Vereinbarung Mail: Büro: Philosophikum, 3. Etage, Zimmer 334 (SIV)

4 Materialien Homepage zum Seminar: spinfo-textmining.html Literatur: Soweit nicht online verfügbar, wird die Literatur in einem Seminarordner bereitgestellt

5 Definitionen Definition nach Feldman/Sanger Text mining [... ] tries to solve the information overload problem by using techniques from data mining, machine learning, natural language processing, information retrieval and knowledge management. [Feldman and Sanger, 2006, S. 1]

6 Definitionen Data Mining Knowledge discovery in databases Explorative Datenanalyse Trends und Muster über große Datenmengen DM operiert auf strukturierten Daten Neue Informationen

7 Definitionen Information-Retrieval Effiziente Suche in Texten IR operiert auf unstrukturierten Daten Informationsbedarf erfüllen Bekannte Informationen

8 Definitionen Abgrenzung nach [Heyer et al., 2006, S. 5] Ergebnis Ergebnis holen interpretieren Strukturierte Datenabfrage Datenanfrage Daten DB-Systeme DM-Werkzeuge Unstrukturierte Inhaltsabfrage Inhaltsanfrage Daten IR-Techniken TM-Werkzeuge

9 Definitionen Definition nach Heyer et al. Mit [... ] Text Mining werden computergestützte Verfahren für die semantische Analyse von Texten bezeichnet, welche die automatische bzw. semi-automatische Strukturierung von Texten, insbesondere sehr großen Mengen von Texten, unterstützen. [Heyer et al., 2006, S. 3] TM = Wissenserschließung aus Texten durch Strukturierung auf versch. Ebenen Siehe

10 Anwendungsbeispiele Hypothesenbildung durch Text-Mining Aufdecken von Mustern/Korrelationen Ableiten von Regeln Formulieren von Hypothesen durch Inferenz und/oder Transfer Evidenz durch experimentelle Überprüfung

11 Anwendungsbeispiele Beispiel: Medizinische Texte [Hearst, 2003, S. 621] Beobachtungen: Stress ist assoziiert mit Migräne Stress kann zu Magnesiummangel führen Blockieren der Calcium-Zufuhr kann Migräne verhindern Magnesium ist ein Calcium-Blocker... Hypothesen: Magnesiummangel spielt eine Rolle für bestimmte Arten von Migräne Magnesium kann Migräne lindern...

12 Anwendungsbeispiele TM-Tasks Effiziente Recherche in spezialisierten Textbeständen Filterung u. Verteilung von Mails, Korrespondenzen, etc. Erstellung firmen- u. fachspezifischer Glossare u. Thesauri Aufbau semantischer Netze für Wissensmanagement Autom. Zusammenfassen (Abstracting) Verbesserung IR Semantic Web... etc.

13 Eigenschaften textueller Daten Allgemein Redundanz Unschärfe Latente Strukturierung Markup Metadaten Ling. Struktur

14 Eigenschaften textueller Daten Heterogenität hinsichtlich der Formate Sprache? Dateiformat? Zeichensatz? Identifikation wichtig für Vorverarbeitung

15 Eigenschaften textueller Daten Heterogenität hinsichtlich der Inhalte Textsorte? Herkunft? Sachgebiet? Identifikation wichtig bei Weiterverarbeitung

16 Leitfragen Aufgabe: Unstrukturierte Daten aufbereiten, so dass das enthaltene Wissen extrahiert werden kann Informationsanreicherung Leitfrage: Welche Informationen werden benötigt? Semantische Relationen als Schlüssel zum Wissen Leitfragen des Seminars: Wie kommen wir an diese Informationen? Wie nutzen wir diese Informationen?

17 Bausteine für ein TM-System Datenstrukturen: Indexterme Vektoren für Dokumente/Terme Verfahren: Musteranalyse Klassifikation Clustering

18 Erste Schritte: Datenaufbereitung Korpuserstellung: Crawling, Ablegen in DB Tokenisierung: Ermitteln der Untersuchungseinheiten Normalisierung: Vereinheitlichen der Untersuchungseinheiten Stemming/Lemmatisierung: Anzahl der Untersuchungseinheiten reduzieren Siehe dazu u.a. [Manning et al., 2008], Kap 2.2

19 Feldman, R. and Sanger, J. (2006). The Text Mining Handbook: Advanced Approaches in Analyzing Unstructured Data. Cambridge University Press. Hearst, M. A. (2003). Text data mining. In Mitkov, R., editor, The Oxford Handbook of Computational Linguistics, Oxford Handbooks in Linguistics, pages Oxford University Press, Oxford. Heyer, G., Quasthoff, U., and Wittig, T. (2006). Text Mining: Wissensrohstoff Text. w3l Verlag, Herdecke/Bochum. Manning, C. D., Raghavan, P., and Schütze, H. (2008). Introduction to Information Retrieval. Cambridge University Press.

Text Mining - Wissensrohstoff Text

Text Mining - Wissensrohstoff Text Text Mining - Wissensrohstoff Text Gerhard Heyer Universität Leipzig heyer@informatik.uni-leipzig.de Institut für Informatik Grundlagen und Begriff 2 Informatik und ihre Anwendungen 1940-1960 Wissenschaftliches

Mehr

Big Data bei unstrukturierten Daten. AW1 Vortrag Sebastian Krome

Big Data bei unstrukturierten Daten. AW1 Vortrag Sebastian Krome Big Data bei unstrukturierten Daten AW1 Vortrag Sebastian Krome Agenda Wiederholung Aspekte von Big Data Datenverarbeitungsprozess TextMining Aktuelle Paper Identification of Live News Events Using Twitter

Mehr

EXTRAKTION UND KLASSIFIKATION VON BEWERTETEN PRODUKTFEATURES AUF WEBSEITEN

EXTRAKTION UND KLASSIFIKATION VON BEWERTETEN PRODUKTFEATURES AUF WEBSEITEN EXTRAKTION UND KLASSIFIKATION VON BEWERTETEN PRODUKTFEATURES AUF WEBSEITEN T-SYSTEMS MULTIMEDIA SOLUTIONS GMBH, 16. FEBRUAR 2012 1. Schlüsselworte Semantic Web, Opinion Mining, Sentiment Analysis, Stimmungsanalyse,

Mehr

Text Mining mit LingPipe

Text Mining mit LingPipe Text Mining mit LingPipe Hauptseminar Information Retrieval PD Dr. Karin Haenelt Universität Heidelberg Vortrag von Alexander Kappe im Wintersemester 2008/2009 Übersicht Text Mining Definition & Abgrenzung

Mehr

Text Mining Praktikum. Durchführung: Andreas Niekler Email: aniekler@informatik.uni-leipzig.de Zimmer: Paulinum (P) 818

Text Mining Praktikum. Durchführung: Andreas Niekler Email: aniekler@informatik.uni-leipzig.de Zimmer: Paulinum (P) 818 Text Mining Praktikum Durchführung: Andreas Niekler Email: aniekler@informatik.uni-leipzig.de Zimmer: Paulinum (P) 818 Rahmenbedingungen Gruppen von 2- (max)4 Personen Jede Gruppe erhält eine Aufgabe Die

Mehr

Gerhard Heyer Universität Leipzig heyer@informatik.uni-leipzig.de

Gerhard Heyer Universität Leipzig heyer@informatik.uni-leipzig.de Text Mining Wissensrohstoff Text Gerhard Heyer Universität Leipzig heyer@informatik.uni-leipzig.de Institut für Informatik Grundlagen und Begriff 2 Informatik und ihre Anwendungen 1940-1960 Wissenschaftliches

Mehr

Kapitel IR:I. I. Einführung. Retrieval-Szenarien Begriffsbildung Einordnung Information Retrieval

Kapitel IR:I. I. Einführung. Retrieval-Szenarien Begriffsbildung Einordnung Information Retrieval Kapitel IR:I I. Einführung Retrieval-Szenarien Begriffsbildung Einordnung Information Retrieval IR:I-1 Introduction STEIN 2005-2010 Retrieval-Szenarien Liefere Dokumente, die die Terme «Information» und

Mehr

Text Mining und CRM. Hans Hermann Weber Univ. Erlangen IMMD 8, den 12.09.03

Text Mining und CRM. Hans Hermann Weber Univ. Erlangen IMMD 8, den 12.09.03 Text Mining und CRM Hans Hermann Weber Univ. Erlangen IMMD 8, den 12.09.03 Was ist Textmining Unstrukturierte Daten (Text) anreichern mit Strukturinformation: Metadaten hinzufügen Struktur (Segmentinformation)

Mehr

Text Mining Wissensrohstoff Text

Text Mining Wissensrohstoff Text Text Mining Wissensrohstoff Text Gerhard Heyer Universität Leipzig heyer@informatik.uni-leipzig.de Institut für Informatik Text Mining 2 Text als Grundlage der Wissensverarbeitung Einige Arbeitshypothesen

Mehr

Volltextsuche und Text Mining

Volltextsuche und Text Mining 1 Volltextsuche und Text Mining Datum: 22.12.2009 Seminar: Einführung in die Computerlinguistik Referenten: Cornelia Baldauf, Valentin Heinz, Adriana Kosior 2 Agenda 1. Einführung a) Volltextsuche b) Text

Mehr

Proseminar - Data Mining

Proseminar - Data Mining Proseminar - Data Mining SCCS, Fakultät für Informatik Technische Universität München SS 2012, SS 2012 1 Data Mining Pipeline Planung Aufbereitung Modellbildung Auswertung Wir wollen nützliches Wissen

Mehr

Extraktion von Metadaten als Basis für eine semantische Integration heterogener Informationssysteme

Extraktion von Metadaten als Basis für eine semantische Integration heterogener Informationssysteme Extraktion von Metadaten als Basis für eine semantische Integration heterogener Informationssysteme Liane Haak, Axel Hahn Abteilung Wirtschaftsinformatik Carl von Ossietzky Universität Oldenburg Fakultät

Mehr

Data Warehouse Definition (1) http://de.wikipedia.org/wiki/data-warehouse

Data Warehouse Definition (1) http://de.wikipedia.org/wiki/data-warehouse Data Warehouse Definition (1) http://de.wikipedia.org/wiki/data-warehouse Ein Data-Warehouse bzw. Datenlager ist eine zentrale Datensammlung (meist eine Datenbank), deren Inhalt sich aus Daten unterschiedlicher

Mehr

Semantic Web. Anwendungsbereiche & Entwicklungen. http://www.know-center.at. Dr. Michael Granitzer

Semantic Web. Anwendungsbereiche & Entwicklungen. http://www.know-center.at. Dr. Michael Granitzer Semantic Web Anwendungsbereiche & Entwicklungen Dr. Michael Granitzer - gefördert durch das Kompetenzzentrenprogramm Agenda Die Vision und warum das Semantic Web Sinn macht Grundlagen: Wissensrepräsentation

Mehr

Sprachtechnologie in der Wissenschaft: Digital-Turn in evidenzbasierter Bildungsforschung und -information

Sprachtechnologie in der Wissenschaft: Digital-Turn in evidenzbasierter Bildungsforschung und -information Sprachtechnologie in der Wissenschaft: Digital-Turn in evidenzbasierter Bildungsforschung und -information Iryna Gurevych Sprachtechnologie-Feuerwerk: Aktuelle Anwendungsbeispiele und Zukunftsvisionen

Mehr

Textmining Klassifikation von Texten Teil 1: Naive Bayes

Textmining Klassifikation von Texten Teil 1: Naive Bayes Textmining Klassifikation von Texten Teil 1: Naive Bayes Dept. Informatik 8 (Künstliche Intelligenz) Friedrich-Alexander-Universität Erlangen-Nürnberg (Informatik 8) Klassifikation von Texten 1: Naive

Mehr

Fachgruppe Statistik, Risikoanalyse & Computing. STAT672 Data Mining. Sommersemester 2007. Prof. Dr. R. D. Reiß

Fachgruppe Statistik, Risikoanalyse & Computing. STAT672 Data Mining. Sommersemester 2007. Prof. Dr. R. D. Reiß Fachgruppe Statistik, Risikoanalyse & Computing STAT672 Data Mining Sommersemester 2007 Prof. Dr. R. D. Reiß Überblick Data Mining Begrifflichkeit Unter Data Mining versteht man die Computergestützte Suche

Mehr

!!!!T!!! Systems!() Multimedia Solutions

!!!!T!!! Systems!() Multimedia Solutions Inhalt. Was ist das semantische Web? Wie findet man einen Arzttermin mit Hilfe des semantischen Web? Wie gibt man Inhalten einen Sinn? Welche Werkzeuge stehen zur Verfügung? Wo können strukturierte Inhalte

Mehr

Web Information Retrieval. Zwischendiskussion. Überblick. Meta-Suchmaschinen und Fusion (auch Rank Aggregation) Fusion

Web Information Retrieval. Zwischendiskussion. Überblick. Meta-Suchmaschinen und Fusion (auch Rank Aggregation) Fusion Web Information Retrieval Hauptseminar Sommersemester 2003 Thomas Mandl Überblick Mehrsprachigkeit Multimedialität Heterogenität Qualität, semantisch, technisch Struktur Links HTML Struktur Technologische

Mehr

Textmining Klassifikation von Texten Teil 2: Im Vektorraummodell

Textmining Klassifikation von Texten Teil 2: Im Vektorraummodell Textmining Klassifikation von Texten Teil 2: Im Vektorraummodell Dept. Informatik 8 (Künstliche Intelligenz) Friedrich-Alexander-Universität Erlangen-Nürnberg (Informatik 8) Klassifikation von Texten Teil

Mehr

Automatisierte Dossier- Erstellung mittels Text-Mining

Automatisierte Dossier- Erstellung mittels Text-Mining Automatisierte Dossier- Erstellung mittels Text-Mining Paul Assendorp Grundseminar 11.12.2014 Paul Assendorp Automatisierte Dossier-Erstellung 1 Gliederung Motivation Textmining Tools Aktueller Stand Ausblick

Mehr

Bildungsbedarfsanalyse auf Grundlage von Stellenanzeigen. Prof. Dr. Frank Bensberg Department für Wirtschaft

Bildungsbedarfsanalyse auf Grundlage von Stellenanzeigen. Prof. Dr. Frank Bensberg Department für Wirtschaft Bildungsbedarfsanalyse auf Grundlage von Stellenanzeigen Prof. Dr. Frank Bensberg Department für Wirtschaft Agenda Motivation Herausforderungen und Instrumente des Bildungsbedarfsmanagements Technische

Mehr

Datenbanken-Themen im OS "Data Mining" SS 2010

Datenbanken-Themen im OS Data Mining SS 2010 Prof. Dr.-Ing. Thomas Kudraß HTWK Leipzig, FIMN Datenbanken-Themen im OS "Data Mining" SS 2010 Die Vorträge sollten eine Dauer von 60 Minuten (Einzelvortrag) bzw. 45 Minuten (Doppelvortrag) haben. Nachfolgend

Mehr

Data/Information Quality Management

Data/Information Quality Management Data/Information Quality Management Seminar WI/Informationsmanagement im Sommersemester 2002 Markus Berberov, Roman Eder, Peter Gerstbach 11.6.2002 Inhalt! Daten und Datenqualität! Einführung und Definition!

Mehr

Rheinlandtreffen 7. November 2006

Rheinlandtreffen 7. November 2006 Dirk Thorleuchter No 1 Inhalt Einleitung Motivation Aufgabenstellung Methode / Vorgehensweise KDT-Prozess Beispiele Evoluation Zusammenfassung No 2 1 Einleitung Motivation Trend zur kontinuierlich ansteigende

Mehr

Qualitative Aspekte Enterprise Search Volltextsuche & Text Mining. Franz Kögl Vorstand IntraFind Software AG

Qualitative Aspekte Enterprise Search Volltextsuche & Text Mining. Franz Kögl Vorstand IntraFind Software AG Qualitative Aspekte Enterprise Search Volltextsuche & Text Mining Franz Kögl Vorstand IntraFind Software AG Vorstellung IntraFind AG Qualitative Sucherweiterung: Search+ Wildcardsuche Einbindung von Synonymen

Mehr

Datenbanken und Informationssysteme

Datenbanken und Informationssysteme Datenbanken und Informationssysteme Lehrangebot Stefan Conrad Heinrich-Heine-Universität Düsseldorf Institut für Informatik April 2012 Stefan Conrad (HHU) Datenbanken und Informationssysteme April 2012

Mehr

Proseminar - Data Mining

Proseminar - Data Mining Proseminar - Data Mining SCCS, Fakultät für Informatik Technische Universität München SS 2014, SS 2014 1 Data Mining: Beispiele (1) Hausnummererkennung (Klassifikation) Source: http://arxiv.org/abs/1312.6082,

Mehr

Für das Text Mining wichtige Grundbegriffe sind Text, Information und Wissen. Diese Begriffe werden näher erläutert:

Für das Text Mining wichtige Grundbegriffe sind Text, Information und Wissen. Diese Begriffe werden näher erläutert: 1 1 Wissen und Text * Text ist ein bedeutender Wissensrohstoff, der im Zeitalter des Internet in großen Mengen in digitaler Form zur Verfügung steht. Mit Hilfe von Text Mining kann das in Texten enthaltene

Mehr

Informationsflut bewältigen - Textmining in der Praxis

Informationsflut bewältigen - Textmining in der Praxis Informationsflut bewältigen - Textmining in der Praxis Christiane Theusinger Business Unit Data Mining & CRM Solutions SAS Deutschland Ulrich Reincke Manager Business Data Mining Solutions SAS Deutschland

Mehr

Einführung in die Wissensverarbeitung und Data Mining

Einführung in die Wissensverarbeitung und Data Mining Einführung in die Wissensverarbeitung und Data Mining Peter Becker FH Bonn-Rhein-Sieg Fachbereich Angewandte Informatik!" $# Vorlesung Wintersemester 2001/02 1. Einführung Vorbemerkungen 1 Einführung Vorbemerkungen

Mehr

Text Mining Gliederung. Text Mining. OS Datamining SS 10. Thomas Boy. 25. Mai 2010 1 / 37

Text Mining Gliederung. Text Mining. OS Datamining SS 10. Thomas Boy. 25. Mai 2010 1 / 37 Gliederung Text Mining OS Datamining SS 10 Thomas Boy 25. Mai 2010 1 / 37 Gliederung 1 Gliederung 2 Einleitung Motivation Konkretisierung 3 Allgemeines Definiton Text Mining Ablaufschema 4 Anwendungen

Mehr

Informationswissenschaft zwischen virtueller Infrastruktur und materiellen Lebenswelten

Informationswissenschaft zwischen virtueller Infrastruktur und materiellen Lebenswelten Inhaltsverzeichnis 3 Hans-Christoph Hobohm (Hrsg.) Informationswissenschaft zwischen virtueller Infrastruktur und materiellen Lebenswelten Information Science between Virtual Infrastructure and Material

Mehr

Prüfungsplan Master of Science in Wirtschaftsinformatik

Prüfungsplan Master of Science in Wirtschaftsinformatik Prüfungsplan Master of Science in Wirtschaftsinformatik Modul Art Creditpunkte Schwerpunkt Very Large Business Applications Module aus dem Bereich Wirtschaftsinformatik SWS Empfohlenes Semester Prüfungsart

Mehr

InteractiveExtractor: Durchgängige Unterstützung bei der Extraktion von anforderungsrelevanten Informationen

InteractiveExtractor: Durchgängige Unterstützung bei der Extraktion von anforderungsrelevanten Informationen InteractiveExtractor: Durchgängige Unterstützung bei der Extraktion von anforderungsrelevanten Informationen Philipp Heim 1, Timo Stegemann 1, Steffen Lohmann 1, Jürgen Ziegler 1, Haiko Cyriaks 2, Horst

Mehr

VO 340088 Sprachtechnologien. Informations- und Wissensmanagement. Bartholomäus Wloka. Zentrum für Translationswissenschaft

VO 340088 Sprachtechnologien. Informations- und Wissensmanagement. Bartholomäus Wloka. Zentrum für Translationswissenschaft , Informations- und Wissensmanagement Zentrum für Translationswissenschaft Grundlagen und Definitionen Maschinelle Sprachverarbeitung Breites Spektrum an Methoden der Computerverarbeitung von Sprache.

Mehr

Innovationsbeobachtung!

Innovationsbeobachtung! ! Innovationsbeobachtung! Dr. Feiyu Xu Deutsches Forschungszentrum für Künstliche Intelligenz (DFKI)! Das ständige Radar Ein proaktiv handelndes Unternehmen identifiziert Chancen und Gefahren durch künftige

Mehr

Mathematisch-algorithmische Grundlagen für Big Data

Mathematisch-algorithmische Grundlagen für Big Data Mathematisch-algorithmische Grundlagen für Big Data Numerische Algorithmen für Datenanalyse und Optimierung Prof. Dr. Peter Becker Fachbereich Informatik Hochschule Bonn-Rhein-Sieg Sommersemester 2016

Mehr

DIE ZUKUNFT WARTET NICHT. ANALYSIERE SIE.

DIE ZUKUNFT WARTET NICHT. ANALYSIERE SIE. INFORMATION SCIENCE & BIG DATA ANALYTICS * MASTER OF SCIENCE (MSc ) FLORIAN KALCHER, NDU Student DIE ZUKUNFT WARTET NICHT. ANALYSIERE SIE. *in Akkreditierung DAS DATENUNIVERSUM MEISTERN In der digitalen

Mehr

Text Mining für News-Sites Nina Hälker

Text Mining für News-Sites Nina Hälker Ablauf Department Informatik, HAW Hamburg Sommersemester 2014 A Motivation Aufbauprojekt Was sagt das Ausland? Fokus der Masterarbeit: Text Mining für News-Sites B Drei Papers: Fokus, Ergebnisse, eigenes

Mehr

Ontologien. Ontologien (aus ISM Kap. 3. Wissensrepräsentation für Texte) Ontologien: Konstrukte. Konzepte/Klassen

Ontologien. Ontologien (aus ISM Kap. 3. Wissensrepräsentation für Texte) Ontologien: Konstrukte. Konzepte/Klassen Ontologien Ontologien (aus ISM Kap. 3. Wissensrepräsentation für Texte) Norbert Fuhr Ursprung: semantische Netze aus der künstlichen Intelligenz (1970er) weiterentwickelt als terminologische Logiken, Beschreibungslogiken

Mehr

Ontologien (aus ISM Kap. 3. Wissensrepräsentation für Texte) Norbert Fuhr

Ontologien (aus ISM Kap. 3. Wissensrepräsentation für Texte) Norbert Fuhr Ontologien (aus ISM Kap. 3. Wissensrepräsentation für Texte) Norbert Fuhr 1 / 23 Ontologien Ursprung: semantische Netze aus der künstlichen Intelligenz (1970er) weiterentwickelt als terminologische Logiken,

Mehr

Detecting Near Duplicates for Web Crawling

Detecting Near Duplicates for Web Crawling Detecting Near Duplicates for Web Crawling Gurmeet Singh Manku et al., WWW 2007* * 16th international conference on World Wide Web Detecting Near Duplicates for Web Crawling Finde near duplicates in großen

Mehr

Vorwort zur zweiten Auflage...V. Vorwort zur ersten Auflage... VIII

Vorwort zur zweiten Auflage...V. Vorwort zur ersten Auflage... VIII Vorwort zur zweiten Auflage...V Vorwort zur ersten Auflage... VIII 1 Management Support Systeme und Business Intelligence Anwendungssysteme zur Unterstützung von Managementaufgaben...1 1.1 Computergestützte

Mehr

Intelligente Unterstützung für argumentatives Schreiben

Intelligente Unterstützung für argumentatives Schreiben Intelligente Unterstützung für argumentatives Schreiben Christian Stab Workshop Text als Werkstu ck - Wege zu einer computergestu tzten U berarbeitung von deutschen Texten Deutsches Institut fu r Internationale

Mehr

SAS CONTEXTUAL ANALYSIS IN ACTION ERFAHRUNGEN AUS EINEM EIN SELBSTVERSUCH

SAS CONTEXTUAL ANALYSIS IN ACTION ERFAHRUNGEN AUS EINEM EIN SELBSTVERSUCH SAS CONTEXTUAL ANALYSIS IN ACTION ERFAHRUNGEN AUS EINEM EIN SELBSTVERSUCH GERHARD SVOLBA COMPETENCE CENTER ANALYTICS WIEN, 17. NOVEMBER 2015 SAS CONTEXTUAL ANALYSIS 14.1 EIN BLICK IN DIE PRODUKTBESCHREIBUNG

Mehr

!"#$%&'()$"*+,(%'-()$"

!#$%&'()$*+,(%'-()$ "#$%&'()$"*+,(%'-()$" A$,()'*B'3)#01*C*.,D$*43(%(, "#$%&'(%&)*+,-.#/$0(.,12)#$#3)(04,5 7,(2)#1(080*94*:;', ?>@=>?? "#$%&'(%&)*+,-.#/$0(.,12)#$#3)(04,5*6*7,(2)#1(080*94*:;',*6*?>@=>??

Mehr

Social Business Intelligence Text Mining und Hadoop bei DB Fernverkehr AG

Social Business Intelligence Text Mining und Hadoop bei DB Fernverkehr AG Social Business Intelligence Text Mining und Hadoop bei DB Fernverkehr AG DB Fernverkehr AG Dr.-Ing. Axel Schulz, Dr. Matthias Platho P.FMB 2, DB Fernverkehr AG Frankfurt, 22.05.2015 Motivation An meinem

Mehr

Vektormodelle. Universität zu Köln HS: Systeme der maschinellen Sprachverarbeitung Prof. Dr. J. Rolshoven Referentin: Alena Geduldig

Vektormodelle. Universität zu Köln HS: Systeme der maschinellen Sprachverarbeitung Prof. Dr. J. Rolshoven Referentin: Alena Geduldig Vektormodelle Universität zu Köln HS: Systeme der maschinellen Sprachverarbeitung Prof. Dr. J. Rolshoven Referentin: Alena Geduldig Gliederung Vektormodelle Vector-Space-Model Suffix Tree Document Model

Mehr

Modul 02: Zum Ablauf einer statistischen (empirischen) Untersuchung. Prof. Dr. W. Laufner. Beschreibende Statistik. Wozu statistische Methoden

Modul 02: Zum Ablauf einer statistischen (empirischen) Untersuchung. Prof. Dr. W. Laufner. Beschreibende Statistik. Wozu statistische Methoden Modul 02: Zum Ablauf einer statistischen (empirischen) Untersuchung 1 Modul 02: unübersichtliche, unstrukturierte große Datenmenge Wozu statistische Methoden Informationen, Erkenntnisse DV-gestützte Datenanalyse

Mehr

Web Mining und Farming

Web Mining und Farming Web Mining und Farming Shenwei Song Gliederung Übersicht über Web Mining und Farming Web Mining Klassifikation des Web Mining Wissensbasierte Wrapper-Induktion Web Farming Übersicht über Web-Farming-Systeme

Mehr

Organisatorisches. Unit1: Intro and Basics. Bewertung. About Me.. Datenorientierte Systemanalyse. Gerhard Wohlgenannt

Organisatorisches. Unit1: Intro and Basics. Bewertung. About Me.. Datenorientierte Systemanalyse. Gerhard Wohlgenannt Organisatorisches Datenorientierte Systemanalyse Unit1: Intro and Basics Gerhard Wohlgenannt Inhalt: Datenorientierte Systemanalyse Umfang: 5 units XX.10.2013 XX.11.2013 09:00-13:30 Uhr Room XXX Infos,

Mehr

Kurze Einführung in Web Data Mining

Kurze Einführung in Web Data Mining Kurze Einführung in Web Data Mining Yeong Su Lee Centrum für Informations- und Sprachverarbeitung (CIS), LMU 17.10.2007 Kurze Einführung in Web Data Mining 1 Überblick Was ist Web? Kurze Geschichte von

Mehr

GMDS-Tagung 2006 Bioinformatik 1. Assessing the stability of unsupervised learning results in small-sample-size problems

GMDS-Tagung 2006 Bioinformatik 1. Assessing the stability of unsupervised learning results in small-sample-size problems GMDS-Tagung 2006 Bioinformatik 1 Assessing the stability of unsupervised learning results in small-sample-size problems Ulrich Möller Email: Ulrich.Moeller@hki-jena.de Leibniz Institute for Natural Product

Mehr

Informationsextraktion. Karin Haenelt 1.12.2012

Informationsextraktion. Karin Haenelt 1.12.2012 Informationsextraktion Karin Haenelt 1.12.2012 Informationsextraktion Ziel Identifikation bestimmter Information (Daten) in einem unstrukturierten oder teilstrukturierten textuellen Dokument Transformation

Mehr

Text Mining in der Wettbewerberanalyse: Konvertierung von Textarchiven in XML-Dokumente

Text Mining in der Wettbewerberanalyse: Konvertierung von Textarchiven in XML-Dokumente Text Mining in der Wettbewerberanalyse: Konvertierung von Textarchiven in XML-Dokumente Karsten Winkler 1 und Myra Spiliopoulou Handelshochschule Leipzig (HHL) Lehrstuhl für Wirtschaftsinformatik des E-Business

Mehr

Technologischen Rahmenbedingungen und Werkzeuge für eine wertschöpfende Controller-Rolle

Technologischen Rahmenbedingungen und Werkzeuge für eine wertschöpfende Controller-Rolle Technologischen Rahmenbedingungen und Werkzeuge für eine wertschöpfende Controller-Rolle 40. Congress der Controller, Themenzentrum C, München Steffen Vierkorn, Geschäftsführer Qunis GmbH, Neubeuern Die

Mehr

SAS TEXT ANALYTICS EVENT

SAS TEXT ANALYTICS EVENT SAS TEXT ANALYTICS EVENT DIENSTAG, 21. APRIL 2015 AGENDA Zeit Inhalt 16:00-16:30 Registrierung & Willkommenskaffee 16:30-16:45 16:45-17:15 17:15-17:45 Begrüssung und Einleitung ins Thema Text Analytics

Mehr

Visualisierung der Imperfektion in multidimensionalen Daten

Visualisierung der Imperfektion in multidimensionalen Daten Visualisierung der Imperfektion in multidimensionalen Daten Horst Fortner Imperfektion und erweiterte Konzepte im Data Warehousing Betreuer: Heiko Schepperle 2 Begriffe (1) Visualisierung [Wikipedia] abstrakte

Mehr

Tiefgreifende Prozessverbesserung und Wissensmanagement durch Data Mining

Tiefgreifende Prozessverbesserung und Wissensmanagement durch Data Mining Tiefgreifende Prozessverbesserung und Wissensmanagement durch Data Mining Ausgangssituation Kaizen Data Mining ISO 9001 Wenn andere Methoden an ihre Grenzen stoßen Es gibt unzählige Methoden, die Abläufe

Mehr

Multimedia-Metadaten und ihre Anwendung

Multimedia-Metadaten und ihre Anwendung Multimedia-Metadaten und ihre Anwendung 14.02.2006 Video Retrieval und Video Summarization Maria Wagner Aspekte des Video Retrieval 2/14 Videoanalyse Analyse nötig, um Struktur und Metadaten zu erkennen

Mehr

Seminar Business Intelligence Teil II. Data Mining & Knowledge Discovery

Seminar Business Intelligence Teil II. Data Mining & Knowledge Discovery Seminar Business Intelligence Teil II Data Mining & Knowledge Discovery Was ist Data Mining? Sabine Queckbörner Was ist Data Mining? Data Mining Was ist Data Mining? Nach welchen Mustern wird gesucht?

Mehr

Forschunsprojekte und Independent Coursework. Prof. Dr. Christian Herta 29. Januar 2013

Forschunsprojekte und Independent Coursework. Prof. Dr. Christian Herta 29. Januar 2013 Forschunsprojekte und Independent Coursework Prof. Dr. Christian Herta 29. Januar 2013 Forschungsgebiete Suchtechnologie, Text- und Webmining Verarbeitung unstrukturierter Daten, insbesondere Text Large

Mehr

Masterstudium Softwareentwicklung- Wirtschaft CURRICULUM 2005 IN DER VERSION 2013 MICHAEL KRISPER, BASISGRUPPE INFORMATIK & SOFTWAREENTWICKLUNG

Masterstudium Softwareentwicklung- Wirtschaft CURRICULUM 2005 IN DER VERSION 2013 MICHAEL KRISPER, BASISGRUPPE INFORMATIK & SOFTWAREENTWICKLUNG Masterstudium Softwareentwicklung- Wirtschaft CURRICULUM 2005 IN DER VERSION 2013 MICHAEL KRISPER, BASISGRUPPE INFORMATIK & SOFTWAREENTWICKLUNG Infos für den Anfang Curriculum ist im Mitteilungsblatt veröffentlicht:

Mehr

Maschinelles Lernen und Data Mining: Methoden und Anwendungen

Maschinelles Lernen und Data Mining: Methoden und Anwendungen Maschinelles Lernen und Data Mining: Methoden und Anwendungen Eyke Hüllermeier Knowledge Engineering & Bioinformatics Fachbereich Mathematik und Informatik GFFT-Jahrestagung, Wesel, 17. Januar 2008 Knowledge

Mehr

Ausgangsposition. Aspekte der Texttechnologie. Aspekte der Texttechnologie. Susanne J. Jekat Zürcher Hochschule Winterthur E-mail: jes@zhwin.

Ausgangsposition. Aspekte der Texttechnologie. Aspekte der Texttechnologie. Susanne J. Jekat Zürcher Hochschule Winterthur E-mail: jes@zhwin. Aspekte der Texttechnologie Susanne J. Jekat Zürcher Hochschule Winterthur E-mail: jes@zhwin.ch Aspekte der Texttechnologie Thema 5 Semantic Web Termine: 24. Mai 2007 Lernfrage: Was ist das Semantic Web

Mehr

9 Resümee. Resümee 216

9 Resümee. Resümee 216 Resümee 216 9 Resümee In der vorliegenden Arbeit werden verschiedene Methoden der Datenreduktion auf ihre Leistungsfähigkeit im sozialwissenschaftlichstatistischen Umfeld anhand eines konkreten Anwendungsfalls

Mehr

Ein Beispiel. Ein Unternehmen will Internettechnologien im Rahmen des E- Business nutzen Welche Geschäftsprozesse?

Ein Beispiel. Ein Unternehmen will Internettechnologien im Rahmen des E- Business nutzen Welche Geschäftsprozesse? Ein Beispiel Ein Unternehmen will Internettechnologien im Rahmen des E- Business nutzen Welche Geschäftsprozesse? Dipl.-Kfm. Claus Häberle WS 2015 /16 # 42 XML (vereinfacht) visa

Mehr

Proseminar - Data Mining

Proseminar - Data Mining Vorbesprechung Proseminar - Data Mining SCCS, Fakultät für Informatik Technische Universität München SS 2015 Vorbesprechung, SS 2015 1 Data Mining: Beispiele (1) Hausnummererkennung (Klassifikation) Source:

Mehr

Das Knowledge Grid. Eine Architektur für verteiltes Data Mining

Das Knowledge Grid. Eine Architektur für verteiltes Data Mining Das Knowledge Grid Eine Architektur für verteiltes Data Mining 1 Gliederung 1. Motivation 2. KDD und PDKD Systeme 3. Knowledge Grid Services 4. TeraGrid Projekt 5. Das Semantic Web 2 Motivation Rapide

Mehr

Präsentation zur Diplomprüfung. Thema der Diplomarbeit:

Präsentation zur Diplomprüfung. Thema der Diplomarbeit: Präsentation zur Diplomprüfung Thema der Diplomarbeit: Analyse der Einsatzmöglichkeiten von Data Mining- Verfahren innerhalb einer Unternehmens - Balanced Scorecard und Entwicklung eines Empfehlungskatalogs.

Mehr

Masterstudium Informatik CURRICULUM 2006 IN DER VERSION 2013 MICHAEL KRISPER, BASISGRUPPE INFORMATIK & SOFTWAREENTWICKLUNG

Masterstudium Informatik CURRICULUM 2006 IN DER VERSION 2013 MICHAEL KRISPER, BASISGRUPPE INFORMATIK & SOFTWAREENTWICKLUNG Masterstudium Informatik CURRICULUM 2006 IN DER VERSION 2013 MICHAEL KRISPER, BASISGRUPPE INFORMATIK & SOFTWAREENTWICKLUNG Infos für den Anfang Curriculum ist im Mitteilungsblatt veröffentlicht: http://www.mibla.tugraz.at/12_13/stk_16e/16e.html

Mehr

XDOC Extraktion, Repräsentation und Auswertung von Informationen

XDOC Extraktion, Repräsentation und Auswertung von Informationen XDOC Extraktion, Repräsentation und Auswertung von Informationen Manuela Kunze Otto-von-Guericke Universität Magdeburg Fakultät für Informatik Institut für Wissens- und Sprachverarbeitung Gliederung Ausgangspunkt

Mehr

EXASOL Anwendertreffen 2012

EXASOL Anwendertreffen 2012 EXASOL Anwendertreffen 2012 EXAPowerlytics Feature-Architektur EXAPowerlytics In-Database Analytics Map / Reduce Algorithmen Skalare Fkt. Aggregats Fkt. Analytische Fkt. Hadoop Anbindung R LUA Python 2

Mehr

Semantic Web Technologies I

Semantic Web Technologies I Semantic Web Technologies I Lehrveranstaltung im WS11/12 Dr. Elena Simperl PD Dr. Sebastian Rudolph M. Sc. Anees ul Mehdi Ontology Engineering Dr. Elena Simperl XML und URIs Einführung in RDF RDF Schema

Mehr

Knowledge Management (KM) - Wirklich neu? -

Knowledge Management (KM) - Wirklich neu? - Knowledge Management (KM) - Wirklich neu? - Dr. Rainer Gnibl 1 1 Dr. Rainer Gnibl Regierung von Oberfranken Ludwigstr. 20 95444 Bayreuth Phone +49 981 53-1262 Fax +49 921 604-4950 Mail rainer.gnibl@reg-ofr.bayern.de

Mehr

Ontologien und Ontologiesprachen

Ontologien und Ontologiesprachen Ontologien und Ontologiesprachen Semantische Datenintegration SoSe2005 Uni Bremen Yu Zhao Gliederung 1. Was ist Ontologie 2. Anwendungsgebiete 3. Ontologiesprachen 4. Entwicklung von Ontologien 5. Zusammenfassung

Mehr

Christian Zietzsch / Norman Zänker. Text Mining. und dessen Implementierung. Diplomica Verlag

Christian Zietzsch / Norman Zänker. Text Mining. und dessen Implementierung. Diplomica Verlag Christian Zietzsch / Norman Zänker Text Mining und dessen Implementierung Diplomica Verlag Christian Zietzsch, Norman Zänker Text Mining und dessen Implementierung ISBN: 978-3-8428-0970-3 Herstellung:

Mehr

Entwicklung einer Entscheidungssystematik für Data- Mining-Verfahren zur Erhöhung der Planungsgüte in der Produktion

Entwicklung einer Entscheidungssystematik für Data- Mining-Verfahren zur Erhöhung der Planungsgüte in der Produktion Entwicklung einer Entscheidungssystematik für Data- Mining-Verfahren zur Erhöhung der Planungsgüte in der Produktion Vortrag Seminararbeit David Pogorzelski Aachen, 22.01.2015 Agenda 1 2 3 4 5 Ziel der

Mehr

Seminar Informationsintegration und Informationsqualität. Dragan Sunjka. 30. Juni 2006

Seminar Informationsintegration und Informationsqualität. Dragan Sunjka. 30. Juni 2006 Seminar Informationsintegration und Informationsqualität TU Kaiserslautern 30. Juni 2006 Gliederung Autonomie Verteilung führt zu Autonomie... Intra-Organisation: historisch Inter-Organisation: Internet

Mehr

Modulhandbuch für den Studiengang Informationswissenschaft und Sprachtechnologie

Modulhandbuch für den Studiengang Informationswissenschaft und Sprachtechnologie Modulhandbuch für den Studiengang Informationswissenschaft und Sprachtechnologie im Masterstudium der Philosophischen Fakultät der Heinrich-Heine-Universität Düsseldorf Stand: 07/2014 PO 2011/PO 2013 Inhaltsübersicht

Mehr

Einführung. Arbeitsgruppe. Proseminar Corporate Semantic Web. Prof. Dr. Adrian Paschke

Einführung. Arbeitsgruppe. Proseminar Corporate Semantic Web. Prof. Dr. Adrian Paschke Arbeitsgruppe Proseminar Corporate Semantic Web Einführung Prof. Dr. Adrian Paschke Arbeitsgruppe Corporate Semantic Web (AG-CSW) Institut für Informatik, Freie Universität Berlin paschke@inf.fu-berlin.de

Mehr

Entscheidungsunterstützende Systeme

Entscheidungsunterstützende Systeme Entscheidungsunterstützende Systeme (WS 015/016) Klaus Berberich (klaus.berberich@htwsaar.de) Rainer Lenz (rainer.lenz@htwsaar.de) 0. Organisatorisches Dozenten Klaus Berberich (klaus.berberich@htwsaar.de)

Mehr

Inhaltliche Erschließung von Arztbriefen in der Praxis

Inhaltliche Erschließung von Arztbriefen in der Praxis M:\Aussendarstellung\Foliensaetze\MN\xml.ppt Inhaltliche Erschließung von Arztbriefen in der Praxis Mark Neumann ID Berlin Übersicht ID LOGIK -Services verwendet in: 1. ID Arztbrief Online 2. ID Pharma

Mehr

Datenbanken (WS 2015/2016)

Datenbanken (WS 2015/2016) Datenbanken (WS 2015/2016) Klaus Berberich (klaus.berberich@htwsaar.de) Wolfgang Braun (wolfgang.braun@htwsaar.de) 0. Organisatorisches Dozenten Klaus Berberich (klaus.berberich@htwsaar.de) Sprechstunde

Mehr

Mehrsprachige Kategorisierung

Mehrsprachige Kategorisierung know-how innovation Mehrsprachige Kategorisierung für die automatische Beschlagwortung 22.3.2011, Dr. Peter Schäuble solution Information Retrieval Anwendungen im Bibliotheksumfeld! Information Retrieval

Mehr

Knowledge Discovery In Databases. Data Mining - Der moderne Goldrausch?

Knowledge Discovery In Databases. Data Mining - Der moderne Goldrausch? Oberseminar Data Mining 07. April 2010 Methodik des Data Mining Knowledge Discovery In Databases oder auch Data Mining - Der moderne Goldrausch? Data Mining...? Hochleistungsrechnen Geoinformationssysteme

Mehr

Web Market Research.360

Web Market Research.360 .360 Kunden verstehen durch Zuhören - nicht durch Befragen! Research, Analysis & Consulting www.schwerdtundfeger.de trifft das Social Als Marktforschung kann man den Als Social wird die Gesamtheit von

Mehr

Seminar Objekterkennung in Bildern und Videos WS 2008/2009. - Einführung - Sandra Witt Lehrstuhl Multimedia Computing Universität Augsburg

Seminar Objekterkennung in Bildern und Videos WS 2008/2009. - Einführung - Sandra Witt Lehrstuhl Multimedia Computing Universität Augsburg Seminar Objekterkennung in Bildern und Videos WS 2008/2009 - Einführung - Sandra Witt Lehrstuhl Multimedia Computing Universität Augsburg Überblick Wozu Seminare? Organisatorisches Literaturrecherche Vortrag

Mehr

Ausarbeitung. Nicolas With. Vergleich von Text Mining Algorithmen in Social Media in Bezug auf ein Epidemie-Frühwarnsystem

Ausarbeitung. Nicolas With. Vergleich von Text Mining Algorithmen in Social Media in Bezug auf ein Epidemie-Frühwarnsystem Ausarbeitung Nicolas With Vergleich von Text Mining Algorithmen in Social Media in Bezug auf ein Epidemie-Frühwarnsystem Fakultät Technik und Informatik Studiendepartment Informatik Faculty of Engineering

Mehr

Personalisierung. Der Personalisierungsprozess Nutzerdaten erheben aufbereiten auswerten Personalisierung. Data Mining.

Personalisierung. Der Personalisierungsprozess Nutzerdaten erheben aufbereiten auswerten Personalisierung. Data Mining. Personalisierung Personalisierung Thomas Mandl Der Personalisierungsprozess Nutzerdaten erheben aufbereiten auswerten Personalisierung Klassifikation Die Nutzer werden in vorab bestimmte Klassen/Nutzerprofilen

Mehr

Complex Event Processing

Complex Event Processing [10] Armin Steudte HAW Hamburg Masterstudiengang Informatik - WS 2011/2012 Agenda Motivation Grundlagen Event Processing Networks Ausblick Quellen 2 Agenda Motivation Grundlagen Event Processing Networks

Mehr

Thementisch Anwendungsgebiete und

Thementisch Anwendungsgebiete und Thementisch Anwendungsgebiete und b Erfolgsgeschichten KMUs und Big Data Wien 08. Juni 2015 Hermann b Stern, Know-Center www.know-center.at Know-Center GmbH Know-Center Research Center for Data-driven

Mehr

Cloud Computing für Big-Data-Analysen in der Medizin. Dr. Martin Sedlmayr Lehrstuhl für Medizinische Informatik, FAU

Cloud Computing für Big-Data-Analysen in der Medizin. Dr. Martin Sedlmayr Lehrstuhl für Medizinische Informatik, FAU Cloud Computing für Big-Data-Analysen in der Medizin Dr. Martin Sedlmayr Lehrstuhl für Medizinische Informatik, FAU Herausforderungen Herausforderungen für Leistungserbringer im Gesundheitswesen: Verbesserung

Mehr

Semantic Web Technologies I! Lehrveranstaltung im WS10/11! Dr. Andreas Harth! Dr. Sebastian Rudolph!

Semantic Web Technologies I! Lehrveranstaltung im WS10/11! Dr. Andreas Harth! Dr. Sebastian Rudolph! Semantic Web Technologies I! Lehrveranstaltung im WS10/11! Dr. Andreas Harth! Dr. Sebastian Rudolph! www.semantic-web-grundlagen.de Ontology Engineering! Dr. Sebastian Rudolph! Semantic Web Architecture

Mehr

Inaugural-Dissertation. Philosophie

Inaugural-Dissertation. Philosophie Ontology On Demand Vollautomatische Ontologieerstellung aus deutschen Texten mithilfe moderner Textmining-Prozesse Inaugural-Dissertation zur Erlangung des Grades eines Doktors der Philosophie in der Fakultät

Mehr

m2n Intelligence Management Semantic Technologies Knowledge Discovery Modelbased Development Technologies

m2n Intelligence Management Semantic Technologies Knowledge Discovery Modelbased Development Technologies Semantic Technologies Knowledge Discovery Modelbased Development Technologies Application Layer Application Semantic Mapping Configuration Rules Model Layer User Data Data Mapping Structured Data Data

Mehr

Java EE Projektseminar

Java EE Projektseminar Java EE Projektseminar Daniel Alberts & Sonja Subicin Sprachliche Informationsverarbeitung Universität zu Köln Sommersemester 2010 Sitzung Organisatorisches zum Seminar Java EE Projektplanung Defi nition

Mehr

Meaning-Based Computing

Meaning-Based Computing Universität Salzburg Institut für Computerwissenschaften Seminar aus Informatik SS 2009 Leiter: Univ.-Prof. Dr. Wolfgang Pree Simon Kranzer, Sabine Klausner {simon.kranzer sabine.klausner} at cosy dot

Mehr

Web Data Mining. Alexander Hinneburg Sommersemester 2007

Web Data Mining. Alexander Hinneburg Sommersemester 2007 Web Data Mining Alexander Hinneburg Sommersemester 2007 Termine Vorlesung Mi. 10:00-11:30 Raum?? Übung Mi. 11:45-13:15 Raum?? Klausuren Mittwoch, 23. Mai Donnerstag, 12. Juli Buch Bing Liu: Web Data Mining

Mehr