Lexikalisch-semantische Ressourcen für die automatische Analyse von Erziehungswissenschaftlicher Fachliteratur

Größe: px
Ab Seite anzeigen:

Download "Lexikalisch-semantische Ressourcen für die automatische Analyse von Erziehungswissenschaftlicher Fachliteratur"

Transkript

1 Workshop UKP Lab DIPF Knowledge Discovery 02. August 2012 Dr. Judith Eckle-Kohler Lexikalisch-semantische Ressourcen für die automatische Analyse von Erziehungswissenschaftlicher Fachliteratur In Teilen basierend auf Zusammenarbeit mit Iryna Gurevych, Silvana Hartmann, Michael Matuschek, Christian M. Meyer, Tri Duc Nghiem

2 Automatische Analyse von Erziehungswissenschaftlicher Fachliteratur Dokumente (pedocs ) Metadaten (Schlagwörter ) Automatische Sprachverarbeitung Natural Language Processing (NLP)

3 Automatische Sprachverarbeitung Natural Language Processing (NLP) Dokumente (pedocs ) Data import Linguistic preprocessing Morphological analysis Syntactic analysis Semantic analysis Metadaten (Schlagwörter ) Project specific analysis Data export

4 Automatische Sprachverarbeitung - wissensbasiert Dokumente (pedocs ) Automatische Sprachverarbeitung Metadaten (Schlagwörter ) Knowledge Base

5 Automatische Sprachverarbeitung - wissensbasiert Dokumente (pedocs ) Automatische Sprachverarbeitung Metadaten (Schlagwörter ) Lexikalisch-Semantische Ressource

6 Automatische Sprachverarbeitung - wissensbasiert Dokumente (pedocs ) Automatische Sprachverarbeitung Metadaten (Schlagwörter ) UBY

7 UBY Integration Lexikalisch-Semantischer Ressourcen WordNet UBY IMSlex-Subcat 2012/06/21 TU Darmstadt UKP-TUDA - Prof. Dr. Iryna Gurevych Dr. Judith Eckle-Kohler 7

8 UBY Deutsch Deutsches WordNet Synonyme, Hyponyme, Hypernyme Lemmas IMSlex-Subcat Valenz-Lexikon Welche Verben sind transitiv? Welche Verben, Nomen, Adjektive nehmen einen dass-satz? Lemmas

9 UBY Deutsch Kollaborative Ressourcen Maschinenlesbares Wörterbuch Lemmas Multilinguales WordNet Lemmas Reich an Named Entities, nur Nomen Lemmas

10 UBY Deutsch Nomen und Verben nach Ressourcen Nomen Verben GermaNet IMSlex Wiktionary

11 Pedocs Volltexte: Verben vs. UBY Verben mit semantischer Klassifizierung 784 Verben aus IMSlex sind in semantische Klassen eingeteilt Verben, die zu-infinitive oder Komplementsätze nehmen können (glauben, hoffen, planen, behaupten, ankündigen, ) Anzahl der Verbvorkommen in Pedocs: davon sind Vorkommen dieser 784 Verben Vorkommen von Verben mit semantischer Klassifizierung Vorkommen anderer Verben

12 Automatische Textanalyse mit semantischen Verbklassen Möglichkeiten Für Dokument-Sammlungen: Annotation von Publikationen mit linguistischen Metadaten Z.B. Textsorte, Stil, z.b. für die Abgrenzung von wissenschaftlicher und praxisorientierter Literatur in FIS Bildung Verwendung standardisierter Metadaten CLARIN Innerhalb von Dokumenten: Diskursstruktur (Argumentation Erkennung von Text-Segmenten, in denen es um Fakten / Meinungen / Hypothesen / Neue Methoden... geht

13 Vielen Dank für Ihre Aufmerksamkeit! Fragen?

14 Pedocs Verbfrequenzliste - Probleme 100 häufigste Verb Lemmas: Rank 52: e 7160 Rank 61: be 6160 Rank 74: nen 5339 Rank 79: ge 5018 Rank 84: n 4745 Rank 100: b 4313

15 Pedocs Verbfrequenzliste - Probleme Verb Lemmas Verb Lemmas mit Frequenz 1 (66% ) zurückspringen 1 zurückspielen 1 zurücksinken 1 zurückschwingt 1 zurückschwingen 1 zurückschreit 1 zurückschieben 1 zurückscheuten 1 zurückschaukeln 1 zurücksandte 1 zurückreichten 1 zurückreicht8 1 zurückrei 1

16 Pedocs Verbfrequenzliste - Probleme Verb Lemmas mit Frequenz 1 (66% ) zur9ckzukehren 1 zur9ckzog 1 zur9ckweisen 1 zur9ckverwiesen 1 zur9ckgelegt 1 zur9ckgegangen 1 zur9ckgeblieben 1 zur9ckfallen 1 zur9ckf9hren 1 zur9ck 1 zur ckzufinden 1 zur ckzuerobern 1 zur ckzahle 1

Automatische Vernetzung von Verben mit kontrastiven Valenzstrukturen in UBY

Automatische Vernetzung von Verben mit kontrastiven Valenzstrukturen in UBY Automatische Vernetzung von Verben mit kontrastiven Valenzstrukturen in UBY Judith Eckle-Kohler und Christian M. Meyer UBY 3. Sektionentagung der Gesellschaft für Angewandte Linguistik (GAL), Sektion Lexikographie

Mehr

Vernetzungsstrategien und Zugriffsstrukturen in kollaborativ erstellten Lexika

Vernetzungsstrategien und Zugriffsstrukturen in kollaborativ erstellten Lexika Vernetzungsstrategien und Zugriffsstrukturen in kollaborativ erstellten Lexika Christian M. Meyer und Iryna Gurevych Arbeiten am UKP Lab zu Sprachressourcen, Bedeutungsalignierung, Standardisierung von

Mehr

Sprachtechnologie in der Wissenschaft: Digital-Turn in evidenzbasierter Bildungsforschung und -information

Sprachtechnologie in der Wissenschaft: Digital-Turn in evidenzbasierter Bildungsforschung und -information Sprachtechnologie in der Wissenschaft: Digital-Turn in evidenzbasierter Bildungsforschung und -information Iryna Gurevych Sprachtechnologie-Feuerwerk: Aktuelle Anwendungsbeispiele und Zukunftsvisionen

Mehr

Promotionskolleg DIPF TU Darmstadt Knowledge Discovery in Scientific Literature Iryna Gurevych

Promotionskolleg DIPF TU Darmstadt Knowledge Discovery in Scientific Literature Iryna Gurevych Promotionskolleg DIPF TU Darmstadt Knowledge Discovery in Scientific Literature Iryna Gurevych 1 Leitvision Fachinformation der Zukunft geht von der ubiquitären Verfügbarkeit der wissenschaftlichen Literatur

Mehr

Relationen zwischen Nomen und ihren Assoziationen. Michael Roth

Relationen zwischen Nomen und ihren Assoziationen. Michael Roth Relationen zwischen Nomen und ihren Assoziationen Michael Roth 2 Assoziationen sind psychologisch interessant. Wie erfolgt der Zugriff auf sie? Welche Bedeutung haben sie? erfüllen einen linguistischen

Mehr

Using Lexical Semantic Resources to Extract Product Profiles from Text Catalogues. DGFS 06, Bielefeld, 23. Februar, 12:00 Uhr

Using Lexical Semantic Resources to Extract Product Profiles from Text Catalogues. DGFS 06, Bielefeld, 23. Februar, 12:00 Uhr Willkommen Using Lexical Semantic Resources to Extract Product Profiles from Text Catalogues DGFS 06, Bielefeld, 23. Februar, 12:00 Uhr Jan Burse XLOG Technologies GmbH janburse@xlog.ch Text, janburse@xlog.ch

Mehr

KL WS 03/04 - Anke Lüdeling. Gliederung. Polysemie. Systematische Polysemie

KL WS 03/04 - Anke Lüdeling. Gliederung. Polysemie. Systematische Polysemie KL WS 03/04 - Anke Lüdeling Arbeitsgruppe Miniprojekt 1: Lexikalische Semantik Kann man systematische Polysemie kontextuell (automatisch) bestimmen? Anne Urbschat Ruprecht v.waldenfels Jana Drescher Emil

Mehr

DFG-Rundgespräch Webknowlogy Die Nutzung von kollektivem Wissen aus dem Web ermöglichen

DFG-Rundgespräch Webknowlogy Die Nutzung von kollektivem Wissen aus dem Web ermöglichen DFG-Rundgespräch Webknowlogy Die Nutzung von kollektivem Wissen aus dem Web ermöglichen 19.-20.05.2011, Darmstadt Prof. Dr. Iryna Gurevych Ubiquitous Knowledge Processing (UKP Lab) Fachbereich Informatik

Mehr

Einführung III. Lexikalisch-semantische Ressourcen

Einführung III. Lexikalisch-semantische Ressourcen Semantik im automatischen Sprachverstehen Prof. Dr. Iryna Gurevych, Daniel Bär, Elisabeth Wolf Einführung III Lexikalisch-semantische Ressourcen Unser Seminar fängt mit einer Einführung in das Thema an:

Mehr

Proseminar Linguistische Annotation

Proseminar Linguistische Annotation Proseminar Linguistische Annotation Ines Rehbein und Josef Ruppenhofer SS 2010 Ines Rehbein und Josef Ruppenhofer (SS10) Linguistische Annotation April 2010 1 / 22 Seminarplan I. Linguistische Annotation

Mehr

Semiautomatische Erschließung von Psychologie-Information

Semiautomatische Erschließung von Psychologie-Information PETRUS-Workshop "Automatische Erschließungsverfahren" 21./22.03.2011 Dipl.-Psych. Michael Gerards Semiautomatische Erschließung von Psychologie-Information Kontext Die Literaturdatenbank PSYNDEX: Erschließt

Mehr

Seminar: Graph-based Methods for NLP

Seminar: Graph-based Methods for NLP Seminar: Graph-based Methods for NLP Use graphs to model various problems from Natural Language and Knowledge Processing such as word sense disambiguation, opinion mining, topic detection, text summarization,

Mehr

Schwierigkeitsbestimmung von C-Test-Lücken. Lisa Beinborn Assozierte Doktorandin UKP-DIPF UKP Lab, TU Darmstadt 09 July 2013

Schwierigkeitsbestimmung von C-Test-Lücken. Lisa Beinborn Assozierte Doktorandin UKP-DIPF UKP Lab, TU Darmstadt 09 July 2013 Schwierigkeitsbestimmung von C-Test-Lücken Lisa Beinborn Assozierte Doktorandin UKP-DIPF UKP Lab, TU Darmstadt 09 July 2013 Virtualisierung vereinfacht individuelle Förderung Anpassung von Lernmaterialien

Mehr

Studienprojekt TaxoSearch Spezifikation

Studienprojekt TaxoSearch Spezifikation Studienprojekt TaxoSearch Spezifikation Semantisch gestützte Suche im Internet Lehrstuhl für Computerlinguistik Ruprecht-Karls-Universität Heidelberg WS 2002-2003 vorgestellt von Thorsten Beinhorn, Vesna

Mehr

Ivana Daskalovska. Willkommen zur Übung Einführung in die Computerlinguistik. Semantik. Sarah Bosch,

Ivana Daskalovska. Willkommen zur Übung Einführung in die Computerlinguistik. Semantik. Sarah Bosch, Ivana Daskalovska Willkommen zur Übung Einführung in die Computerlinguistik Semantik Wiederholung Was ist die Semantik und womit beschäftigt sie sich? 3 Was ist die Semantik und womit beschäftigt sie sich?

Mehr

Einführung Konzepte und Begriffe Ähnliche Projekte Arbeiten mit WordNet

Einführung Konzepte und Begriffe Ähnliche Projekte Arbeiten mit WordNet Randy Witte http://wordnet.princeton.edu/ http://www.linguistik.uni-erlangen.de SemNet.pdf http://en.wikipedia.org/wiki/wordnet http://www.globalwordnet.org/ Einführung Konzepte und Begriffe Ähnliche Projekte

Mehr

Semi-automatische Semantifizierung des Web

Semi-automatische Semantifizierung des Web Semi-automatische Semantifizierung des Web Eine sprachtechnologische Perspektive Torsten Zesch UKP Lab Technische Universität Darmstadt Semantifizierung Leo Tolstoi In den folgenden Jahren seiner Ehe schrieb

Mehr

Semiautomatische Erschließung von Psychologie-Information

Semiautomatische Erschließung von Psychologie-Information PETRUS-Workshop "Automatische Erschließungsverfahren" 21./22.03.2011 Dipl.-Psych. Michael Gerards Semiautomatische Erschließung von Psychologie-Information Kontext Die Literaturdatenbank PSYNDEX: Erschließt

Mehr

Prof. Dr. Udo Hahn. Seminar im Modul B-GSW-12 SoSe 2018

Prof. Dr. Udo Hahn. Seminar im Modul B-GSW-12 SoSe 2018 Seminar im Modul B-GSW-12 SoSe 2018 Prof. Dr. Udo Hahn Lehrstuhl für Angewandte Germanistische Sprachwissenschaft / Computerlinguistik Institut für Germanistische Sprachwissenschaft Friedrich-Schiller-Universität

Mehr

Das Projekt Automatische Sacherschließung an der ZBW

Das Projekt Automatische Sacherschließung an der ZBW Das Projekt Automatische Sacherschließung an der ZBW Martin Toepfer (Wissenschaftlicher Mitarbeiter, M. Sc. Informatik) ZBW Leibniz-Informationszentrum Wirtschaft Workshop Computerunterstützte Inhaltserschließung

Mehr

Kollaborative Lexikographie und Nutzerbeteiligung in Wiktionary

Kollaborative Lexikographie und Nutzerbeteiligung in Wiktionary Kollaborative Lexikographie und Nutzerbeteiligung in Wiktionary Christian M. Meyer In Zusammenarbeit mit Yevgen Chebotar und Iryna Gurevych. Symposium Ihr Beitrag bitte! Der Nutzerbeitrag im Wörterbuchprozess.

Mehr

Anfrage Erweiterung 03.11.2011 Jan Schrader

Anfrage Erweiterung 03.11.2011 Jan Schrader Anfrage Erweiterung 03.11.2011 Jan Schrader Vocabulary Mismatch Problem Anfrage und Dokument passen nicht zusammen obwohl Dokument zur Anfrage relevant Grund: Synonymproblem verschiedene Menschen benennen

Mehr

Strukturelle und linguistische Annotation in historischen Textkorpora am Beispiel des Deutschen Textarchivs

Strukturelle und linguistische Annotation in historischen Textkorpora am Beispiel des Deutschen Textarchivs Strukturelle und linguistische Annotation in historischen Textkorpora am Beispiel des Deutschen Textarchivs Susanne Haaf, Alexander Geyken, Bryan Jurish, Matthias Schulz, Christian Thomas, Frank Wiegand

Mehr

Automatische Rekonstruktion und Spezifizierung von Attributnamen in Webtabellen

Automatische Rekonstruktion und Spezifizierung von Attributnamen in Webtabellen Automatische Rekonstruktion und Spezifizierung von Attributnamen in Webtabellen Mark Reinke Bachelorarbeit TU Dresden 17. Februar 2014 Webtabellen Warum sind Webtabellen von Bedeutung? Sie können relationale

Mehr

Ressourcen in den GSHS... am Beispiel LEXUS

Ressourcen in den GSHS... am Beispiel LEXUS > Digitale Ressourcen in den GSHS... am Beispiel LEXUS GSHS LIBRARY CONFERENCE Florenz 10.11.2006 < Marc Kemps-Snijders, Jaqcuelijn Ringersma, Peter Wittenburg MPI for Psycholinguistics, Netherlands

Mehr

NLP Eigenschaften von Text

NLP Eigenschaften von Text NLP Eigenschaften von Text Dr. Andreas Hotho Dominik Benz Beate Krause Sommersemester 2008 Folie: 1 Übersicht Einführung Eigenschaften von Text Words I: Satzgrenzenerkennung, Tokenization, Kollokationen

Mehr

Semantische Suche im audiovisuellen Kulturerbe Das Projekt mediaglobe

Semantische Suche im audiovisuellen Kulturerbe Das Projekt mediaglobe Semantische Suche im audiovisuellen Kulturerbe Das Projekt mediaglobe Johannes Hercher Hasso-Plattner-Institut für Sofwaresystemtechnik GmbH Teile dieser Arbeit werden vom Bundesministerium für Wirtschaft

Mehr

Agenda. Seminar: Informationsstrukturierung. SS 2007 Ulli Waltinger. Lexical Chaining Textkategorisierung und Lexical Chaining

Agenda. Seminar: Informationsstrukturierung. SS 2007 Ulli Waltinger. Lexical Chaining Textkategorisierung und Lexical Chaining Seminar: Informationsstrukturierung SS 2007 Ulli Waltinger Lexical Chaining Textkategorisierung und Lexical Chaining 1 Agenda Textkategorisierung Datenanalyse und Lemmatisierung Lexical Chaining Quelle:

Mehr

eine (sehr) kurze Einführung in formale Ontologien

eine (sehr) kurze Einführung in formale Ontologien kurzer historischer Überblick eine (sehr) kurze Einführung in Denis Brumann 5. April 2008 eine (sehr) kurze Einführung in kurzer historischer Überblick Ontologien in

Mehr

Wie man das World Wide Web als sprachliche Ressource versteht

Wie man das World Wide Web als sprachliche Ressource versteht 1 Das World Wide Web als computerlinguistische Ressource Iryna Gurevych 1.1 Einleitung Das World Wide Web (WWW) hat sich in den letzten Jahren einerseits zur wichtigsten Informations- und Kommunikationsstruktur

Mehr

Vertiefung der Grundlagen der Computerlinguistik. Semesterüberblick und Einführung zur Dependenz. Robert Zangenfeind

Vertiefung der Grundlagen der Computerlinguistik. Semesterüberblick und Einführung zur Dependenz. Robert Zangenfeind Vertiefung der Grundlagen der Computerlinguistik Semesterüberblick und Einführung zur Dependenz Robert Zangenfeind Centrum für Informations- und Sprachverarbeitung, LMU München 17.10.2017 Zangenfeind:

Mehr

Wie man die Geschichte des Korpus versteht

Wie man die Geschichte des Korpus versteht Issues in Exploiting GermaNet as a Resource in Real Applications Manuela Kunze, Dietmar Rösner Otto-von-Guericke Universität Magdeburg Fakultät für Informatik Institut für Wissens- und Sprachverarbeitung

Mehr

Semi-Automatic Extension of GermaNet with Sense Definitions from Wiktionary

Semi-Automatic Extension of GermaNet with Sense Definitions from Wiktionary Semi-Automatic Extension of GermaNet with Sense Definitions from Wiktionary Verena Henrich, Erhard Hinrichs, and Tatiana Vodolazova University of Tübingen Department of Linguistics LTC 2011 Introduction:

Mehr

Kapitel 16. Begriffe. HHU Düsseldorf, WS 2008/09 Information Retrieval 250

Kapitel 16. Begriffe. HHU Düsseldorf, WS 2008/09 Information Retrieval 250 Kapitel 16 Begriffe HHU Düsseldorf, WS 2008/09 Information Retrieval 250 Semantisches Umfeld "Find what I mean, not what I say" (Susan Feldman) natürlichsprachiges Umfeld Werkzeug: natürlichsprachiger

Mehr

Semantic Role Labeling im modernen Text-Analyse-Prozess

Semantic Role Labeling im modernen Text-Analyse-Prozess Semantic Role Labeling im modernen Text-Analyse-Prozess Bastian Haarmann info@bastianhaarmann.de http://www.bastianhaarmann.de Agenda I Text-Analyse-Prozesse 1. Motivation 2. Informationsextraktion 3.

Mehr

Einführung in BioConductor

Einführung in BioConductor Einführung in BioConductor Christian Netzer 03.03.2009 Christian Netzer Fakultät Statistik, TU Dortmund 22. Mai 2009 Seminar Bioinformatik Was ist BioConductor? http://www.bioconductor.org/ BioConductor

Mehr

Entity Search. Michel Manthey Arne Binder 2013

Entity Search. Michel Manthey Arne Binder 2013 Entity Search Michel Manthey Arne Binder 2013 Gliederung Idee Herausforderungen Allgemeine Herangehensweise Möglichkeiten und angewandte Verfahren Ausblick Quellen Idee Bisher: Suche nach Dokumenten, die

Mehr

Christoph Broschinski, <broschinski@uni bielefeld.de>

Christoph Broschinski, <broschinski@uni bielefeld.de> Normalisierung von Lizenzinformationen in OAI Metadaten: Ein Beitrag zur Verbesserung der Open Access Statusanzeige in wissenschaftlichen Suchmaschinen Christoph Broschinski,

Mehr

YAGO YAGO. A semantic knowledge base. Paul Boeck. Humboldt Universität zu Berlin Institut für Informatik. Dezember 2012 1/19

YAGO YAGO. A semantic knowledge base. Paul Boeck. Humboldt Universität zu Berlin Institut für Informatik. Dezember 2012 1/19 1/19 A semantic knowledge base Paul Boeck Humboldt Universität zu Berlin Institut für Informatik Dezember 2012 2/19 Übersicht 1 Einführung 2 Das Modell Struktur Semantik 3 Das System 4 Anwendung 3/19 Einführung

Mehr

Corpus-based language analysis in research and teaching:

Corpus-based language analysis in research and teaching: Corpus-based language analysis in research and teaching: Experiences, requirements and perspectives Angelika Storrer Corpus-based research projects Bericht zur Lage der deutschen Sprache [report on the

Mehr

Effektivere Informationssuche im WWW

Effektivere Informationssuche im WWW Effektivere Informationssuche im WWW Christopher Schwarz, BSc Psychologie Ubiquitous Knowledge Processing Lab AG Organisations- und Wirtschaftspsychologie Prof. Dr. Iryna Gurevych Prof. Dr. Nina Keith

Mehr

Modul 4: Automatische Korpusannotation mit computerlinguistischen Werkzeugen: Bestimmung von Wortarten und Grundformen

Modul 4: Automatische Korpusannotation mit computerlinguistischen Werkzeugen: Bestimmung von Wortarten und Grundformen Institut für Computerlinguistik Sprachtechnologie in den Digital Humanities Modul 4: Automatische Korpusannotation mit computerlinguistischen Werkzeugen: Bestimmung von Wortarten und Grundformen Simon

Mehr

Computerlinguistische Grundlagen. Jürgen Hermes Sommersemester 17 Sprachliche Informationsverarbeitung Institut für Linguistik Universität zu Köln

Computerlinguistische Grundlagen. Jürgen Hermes Sommersemester 17 Sprachliche Informationsverarbeitung Institut für Linguistik Universität zu Köln Computerlinguistische Grundlagen Jürgen Hermes Sommersemester 17 Sprachliche Informationsverarbeitung Institut für Linguistik Universität zu Köln Computerlinguistik: Schnittstellen Computerlinguistik aus

Mehr

CLARIN-D. Überblick, Metadaten, Demo. Christoph Kuras. Abt. Automatische Sprachverarbeitung Institut für Informatik, Universität Leipzig

CLARIN-D. Überblick, Metadaten, Demo. Christoph Kuras. Abt. Automatische Sprachverarbeitung Institut für Informatik, Universität Leipzig CLARIN-D Überblick, Metadaten, Demo Christoph Kuras Abt. Automatische Sprachverarbeitung Institut für Informatik, Universität Leipzig Institut für Informatik 1 CLARIN: Common Language Resource and Technology

Mehr

Korpus-basierte Recherche und Analyse mit Hilfe von Data Mining:

Korpus-basierte Recherche und Analyse mit Hilfe von Data Mining: KobRA: Korpus-basierte Recherche und Analyse mit Hilfe von Data Mining: Motivation und Zielsetzungen Angelika Storrer Überblick o o o o o o Leitziel und Zusammenspiel der Projektpartner Ausgangslage: Welche

Mehr

Grundlagen und Definitionen

Grundlagen und Definitionen Grundlagen und Definitionen Wissensmanagement VO 340088 Bartholomäus Wloka https://www.adaptemy.com Maschinelle Sprachverarbeitung Breites Spektrum an Methoden der Computerverarbeitung von Sprache. Kann

Mehr

SAS CONTEXTUAL ANALYSIS IN ACTION ERFAHRUNGEN AUS EINEM EIN SELBSTVERSUCH

SAS CONTEXTUAL ANALYSIS IN ACTION ERFAHRUNGEN AUS EINEM EIN SELBSTVERSUCH SAS CONTEXTUAL ANALYSIS IN ACTION ERFAHRUNGEN AUS EINEM EIN SELBSTVERSUCH GERHARD SVOLBA COMPETENCE CENTER ANALYTICS WIEN, 17. NOVEMBER 2015 SAS CONTEXTUAL ANALYSIS 14.1 EIN BLICK IN DIE PRODUKTBESCHREIBUNG

Mehr

Integrierte Suche in heterogenen digitalen Bibliotheken mit Daffodil

Integrierte Suche in heterogenen digitalen Bibliotheken mit Daffodil Integrierte Suche in heterogenen digitalen Bibliotheken mit Daffodil Juli 2005 Gliederung 1 Motivation und Konzepte 2 Verfügbare Funktionen 3 Evaluation 4 DELOS: Evaluationsframework 5 Resümee Problemstellung

Mehr

Akademisches Lehrmaterial online

Akademisches Lehrmaterial online Akademisches Lehrmaterial online Christian Weber cweber@akleon.de Entstanden im Rahmen des DFN-Projekts META-AKAD gefördert mit Mitteln des BMBF Mitwirkende an der TU Kaiserslautern Universitätsbibliothek

Mehr

Chancen im OPUS: Automatisiert SWD-Schlagwörter produzieren

Chancen im OPUS: Automatisiert SWD-Schlagwörter produzieren Chancen im OPUS: Automatisiert SWD-Schlagwörter produzieren SULB: Aufgabenspektrum Landesbibliothek SULB Universitätsbibliothek der Universität des Saarlandes Sondersammelgebiet Psychologie Landesbibliothek

Mehr

Exploiting Sublanguage and Domain Characteristics in a Bootstrapping Approach to Lexicon and Ontology Creation

Exploiting Sublanguage and Domain Characteristics in a Bootstrapping Approach to Lexicon and Ontology Creation Exploiting Sublanguage and Domain Characteristics in a Bootstrapping Approach to Lexicon and Ontology Creation Otto-von-Guericke University Magdeburg Department of Knowledge Processing and Language Engineering

Mehr

Quellen des Neuen Die Integration von Ressourcen zur schulischen und universitären Bildung in die CLARIN-D-Infrastruktur

Quellen des Neuen Die Integration von Ressourcen zur schulischen und universitären Bildung in die CLARIN-D-Infrastruktur Quellen des Neuen Die Integration von Ressourcen zur schulischen und universitären Bildung in die CLARIN-D-Infrastruktur - Ein CLARIN-D Kurationsprojekt der F-AG Neuere Geschichte - Maret Keller, Christian

Mehr

GermaNet-Workshop. Verena Henrich & Lars Horber. Eberhard Karls Universität Tübingen Seminar für Sprachwissenschaft Düsseldorf, 19.

GermaNet-Workshop. Verena Henrich & Lars Horber. Eberhard Karls Universität Tübingen Seminar für Sprachwissenschaft Düsseldorf, 19. GermaNet-Workshop Verena Henrich & Lars Horber Eberhard Karls Universität Tübingen Seminar für Sprachwissenschaft Düsseldorf, 19. Februar 2015 Wer wir sind Universität Tübingen > Seminar für Sprachwissenschaft

Mehr

Universität Potsdam Institut für Informatik Lehrstuhl Maschinelles Lernen. Sprachtechnologie. Tobias Scheffer Paul Prasse Michael Großhans

Universität Potsdam Institut für Informatik Lehrstuhl Maschinelles Lernen. Sprachtechnologie. Tobias Scheffer Paul Prasse Michael Großhans Universität Potsdam Institut für Informatik Lehrstuhl Maschinelles Lernen Sprachtechnologie Tobias Scheffer Paul Prasse Michael Großhans Organisation Vorlesung/Übung, praktische Informatik. 4 SWS. 6 Leistungspunkte

Mehr

WordNet. Referat von Johannes Braunias im Proseminar Word Sense Disambiguation bei Stefan Thater im Wintersemester

WordNet. Referat von Johannes Braunias im Proseminar Word Sense Disambiguation bei Stefan Thater im Wintersemester WordNet Referat von Johannes Braunias im Proseminar Word Sense Disambiguation bei Stefan Thater im Wintersemester 2010 15. November 2010 Synonymie Eine bestimmte Wortform in einem Satz, die durch eine

Mehr

Lexikalisch-semantische Disambiguierung mit WordNet

Lexikalisch-semantische Disambiguierung mit WordNet Lexikalische Semantik Lexikalisch-semantische Disambiguierung mit WordNet Conrad Steffens Paper: Rada Mihalcea & Dan I. Moldovan: A Method for Word Sense Disambiguation of Unrestricted Text Lexikalisch-semantische

Mehr

Wörter - Texte - Information. Möglichkeiten und Grenzen automatischer Erschließungsverfahren

Wörter - Texte - Information. Möglichkeiten und Grenzen automatischer Erschließungsverfahren Wörter - Texte - Information Möglichkeiten und Grenzen automatischer Erschließungsverfahren Automatische Indexierung - Einführung 1 Indexieren und Automatisches Indexieren Dokumente Volltexte bibliografische

Mehr

Universität Ulm Abteilung Künstliche Intelligenz. ExtrAns. Verarbeitung natürlicher, schriftlicher Sprache. C. Bohnacker

Universität Ulm Abteilung Künstliche Intelligenz. ExtrAns. Verarbeitung natürlicher, schriftlicher Sprache. C. Bohnacker UNIVERSITÄT ULM SCIENDO DOCENDO CURANDO Universität Ulm Abteilung Künstliche Intelligenz ExtrAns Verarbeitung natürlicher, schriftlicher Sprache C. Bohnacker Überblick Motivation Einleitung Eigenschaften

Mehr

Semantic Relations and User Interests

Semantic Relations and User Interests Semantic Relations and User Interests WordNet Lexical Database und mögliche Anwendungen bei der Benutzerinteraktion Sebastian Blohm Sorry... Wie kann eine Maschine beim Suchen helfen? Was Maschinen schon

Mehr

Einführung in die Computerlinguistik Überblick

Einführung in die Computerlinguistik Überblick Einführung in die Computerlinguistik Überblick Hinrich Schütze & Robert Zangenfeind Centrum für Informations- und Sprachverarbeitung, LMU München 2015-10-12 Schütze & Zangenfeind: Überblick 1 / 19 Was

Mehr

Centrum für Informations- und Sprachverarbeitung. Dr. M. Hadersbeck, Digitale Editionen, BAdW München

Centrum für Informations- und Sprachverarbeitung. Dr. M. Hadersbeck, Digitale Editionen, BAdW München # 1 Digitale Editionen und Auszeichnungssprachen Computerlinguistische FinderApps mit Facsimile-Reader Wittgenstein s Nachlass: WiTTFind Goethe s Faust: GoetheFind Hadersbeck M. et. al. Centrum für Informations-

Mehr

Simullda. Structured Interlingua MultiLingual Lexical Database Application. Sonja Weber

Simullda. Structured Interlingua MultiLingual Lexical Database Application. Sonja Weber Simullda Structured Interlingua MultiLingual Lexical Database Application Sonja Weber 1 Gliederung Background Begriffsklärung Multilinguale Datenbanken WordNet Maschinelle Übersetzung Formale Begriffsanalyse

Mehr

Vernetzung von Daten im Deutschen Textarchiv

Vernetzung von Daten im Deutschen Textarchiv Vernetzung von Daten im Deutschen Textarchiv Susanne Haaf, Matthias Boenig, Christian Thomas, Alexander Geyken, Bryan Jurish, Frank Wiegand Berlin-Brandenburgische Akademie der Wissenschaften/Deutsches

Mehr

Extraktion und Visualisierung von multidimensionalen Textinformationen zur Integration von Big Data in unternehmensspezifischen Wissenslandkarten

Extraktion und Visualisierung von multidimensionalen Textinformationen zur Integration von Big Data in unternehmensspezifischen Wissenslandkarten Extraktion und Visualisierung von multidimensionalen Textinformationen zur Integration von Big Data in unternehmensspezifischen Wissenslandkarten FOM Hochschulzentrum Dortmund, Fachbereich Wirtschaftsinformatik

Mehr

Anwendungen der KI / SoSe 2018

Anwendungen der KI / SoSe 2018 Anwendungen der KI / SoSe 2018 Organisatorisches Prof. Dr. Adrian Ulges Angewandte Informatik / Medieninformatik / Wirtschaftsinformatik / ITS Fachbereich DSCM Hochschule RheinMain KursWebsite: www.ulges.de

Mehr

Grundlagen der Textlinguistik

Grundlagen der Textlinguistik Grundlagen der Textlinguistik * WS 2003/04 1 Grundlagen der Textlinguistik Teil 11: Textproduktion Aufgabe: Schreiben Sie in fünf Minuten ein kurzes Essay über das Thema Ökologie. Nehmen Sie die Aussage:

Mehr

INFORMATIONSGEWINNUNG AUS KURZEN TEXTEN

INFORMATIONSGEWINNUNG AUS KURZEN TEXTEN INFORMATIONSGEWINNUNG AUS KURZEN TEXTEN T-SYSTEMS MULTIMEDIA SOLUTIONS GMBH, 14. OKTOBER 2011 1. Schlüsselworte Semantik, Informationsextraktion, Automatisierte Syntaxanalyse, Validierung, Chunking, Tagging,

Mehr

ETAP-3 Linguistic Processor: a Full- Fledged NLP Implementation of the Meaning Text Theory.

ETAP-3 Linguistic Processor: a Full- Fledged NLP Implementation of the Meaning Text Theory. ETAP-3 Linguistic Processor: a Full- Fledged NLP Implementation of the Meaning Text Theory. Jurij D. Apresian, Igor M. Boguslavsky, Leonid L. Iomdin, Alexander V. Lazursky, Vladimir Z. Sannikov, Victor

Mehr

Question Answering mit Support Vector Machines

Question Answering mit Support Vector Machines Question Answering mit Support Vector Machines Sabrina Stehwien 30.01.2012 HS Information Retrieval Dozentin: Karin Haenelt Überblick 1. Question Answering Systeme 2. Das SAIQA-II QA-System 3. Support

Mehr

Text Mining for Historical Documents. Historische Quellen mit (computer-)linguistischen Methoden analysieren Introduction to Computational Linguistics

Text Mining for Historical Documents. Historische Quellen mit (computer-)linguistischen Methoden analysieren Introduction to Computational Linguistics / Historische Quellen mit (computer-)linguistischen Methoden analysieren Introduction to Computational Linguistics Caroline Sporleder and Martin Schreiber Computational Linguistics & Kultur- und Mediengeschichte

Mehr

Semantic Technologies

Semantic Technologies Semantic Technologies Proseminar Künstliche Intelligenz Universität Ulm Mario Volke 15. Juli 2008 1 / 32 Inhaltsverzeichnis 1 Einführung 2 3 Schlusswort 2 / 32 Einführung Motivation DEMO Who was president

Mehr

Swoogle. Patrice Matthias Brend amour

Swoogle. Patrice Matthias Brend amour Swoogle Finding and Ranking Knowledge on the Semantic Web Patrice Matthias Brend amour Fachbereich Informatik und Informationswissenschaft Universität Konstanz Kurs: Web Services and Semantic Web Datum:

Mehr

Gleiche Daten, unterschiedliche Erkenntnisziele?

Gleiche Daten, unterschiedliche Erkenntnisziele? Gleiche Daten, unterschiedliche Erkenntnisziele? Zum Potential vermeintlich widersprüchlicher Zugänge zur Textanalyse Universität Hamburg Evelyn Gius Jan Christoph Meister Janina Jacke Marco Petris Universität

Mehr

Kollexem-Analyse. SE: Quantitative Analyse linguistischer Variation WS 2012/13. Germanistik

Kollexem-Analyse. SE: Quantitative Analyse linguistischer Variation WS 2012/13. Germanistik Kollexem-Analyse SE: Quantitative Analyse linguistischer Variation Germanistik WS 2012/13 WS 2012/13 1 / 14 Heutige Sitzung 1 Einführung: Quantitative syntaktische Analyse am Beispiel der Kollexem-Analyse

Mehr

Intelligente Unterstützung für argumentatives Schreiben

Intelligente Unterstützung für argumentatives Schreiben Intelligente Unterstützung für argumentatives Schreiben Christian Stab Workshop Text als Werkstu ck - Wege zu einer computergestu tzten U berarbeitung von deutschen Texten Deutsches Institut fu r Internationale

Mehr

DARIAH-DE. Digital Research Infrastructure for the Arts and Humani7es. de.dariah.eu

DARIAH-DE. Digital Research Infrastructure for the Arts and Humani7es. de.dariah.eu DARIAH-DE Digital Research Infrastructure for the Arts and Humani7es de.dariah.eu Umgang mit digitalen Ressourcen / Forschungsdaten Prof. Dr. Fo7s Jannidis, Universität Würzburg Dr. Stefan Schmunk, SUB

Mehr

Quantifizierung von Emotionen in historischer Sprache

Quantifizierung von Emotionen in historischer Sprache Quantifizierung von Emotionen in historischer Sprache Sven Büchel Jena University Language & Information Engineering (JULIE) Lab http://www.julielab.de Friedrich-Schiller-Universität Jena Sven Büchel Quantifizierung

Mehr

WordNet Eine elektronische lexikalische Datenbank

WordNet Eine elektronische lexikalische Datenbank WordNet Eine elektronische lexikalische Datenbank Michael Zilske WordNet enthält 95600 Wortformen, davon 51500 einfache Wörter und 44100 Kollokationen) in 70100 Bedeutungen mit kurzen Umschreibungen, manchmal

Mehr

TextGrid: Eine modulare Plattform für kooperative Textdatenverarbeitung

TextGrid: Eine modulare Plattform für kooperative Textdatenverarbeitung workshop: Perspektiven der Digital Humanities - 12. Oktober 2011, Würzburg TextGrid: Eine modulare Plattform für kooperative Textdatenverarbeitung Thomas Kollatz - Salomon Ludwig Steinheim-Institut für

Mehr

Automatische Beschlagwortung mit dem Vokabular der Schlagwortnormdatei (SWD) und der Personennamendatei (PND) Erfahrungen aus dem DNB-Projekt PETRUS

Automatische Beschlagwortung mit dem Vokabular der Schlagwortnormdatei (SWD) und der Personennamendatei (PND) Erfahrungen aus dem DNB-Projekt PETRUS Sandro Uhlmann Automatische Beschlagwortung mit dem Vokabular der Schlagwortnormdatei (SWD) und der Personennamendatei (PND) Erfahrungen aus dem DNB-Projekt PETRUS 1 Automatische Beschlagwortung mit dem

Mehr

LIVIVO: Das neue ZB MED-Suchportal für Lebenswissenschaften Jana Pössel. AGMB-Tagung Basel, Seite

LIVIVO: Das neue ZB MED-Suchportal für Lebenswissenschaften Jana Pössel. AGMB-Tagung Basel, Seite LIVIVO: Das neue ZB MED-Suchportal für Lebenswissenschaften Jana Pössel AGMB-Tagung Basel, 08.09.2015 MEDPILOT und GREENPILOT schließen einen Bund fürs Leben: LIVIVO Interdisziplinäre Literatursuche: Datenquellen

Mehr

Semantische Suche. Ulf Leser

Semantische Suche. Ulf Leser Semantische Suche Ulf Leser Source: http://www.recruitingblogs.com/forum/topics/tutorial-tuesday-what-is Ulf Leser: Semantische Suchmaschinen, 11/2013 3 Conventional Search Semantic Approaches to Semantic

Mehr

Logik und modelltheoretische Semantik. Grundlagen zum Bedeutung-Text-Modell (BTM)

Logik und modelltheoretische Semantik. Grundlagen zum Bedeutung-Text-Modell (BTM) Logik und modelltheoretische Semantik Grundlagen zum Bedeutung-Text-Modell (BTM) Robert Zangenfeind Centrum für Informations- und Sprachverarbeitung, LMU München 13.6.2017 Zangenfeind: BTM 1 / 26 Moskauer

Mehr

Computerlexikographie-Tutorium

Computerlexikographie-Tutorium Computerlexikographie-Tutorium 18.04.2008 Informationen: E-Buch: bitte angegebene Kapitel lesen (Material im Tutorium) weitere Materialien: http://www.lemnitzer.de/lothar/colex Hausaufgabe: für Übungsblatt

Mehr

Gate & Annie. Gate = General Architecture for Text Engineering Annie = A Nearly New Information Extraction system

Gate & Annie. Gate = General Architecture for Text Engineering Annie = A Nearly New Information Extraction system Gate & Annie Gate = General Architecture for Text Engineering Annie = A Nearly New Information Extraction system Was ist Gate? Rahmenwerk zur Verarbeitung von Texten (kann unabhängig von der Entwicklungsumgebung

Mehr

FID Soziologie: Erhöhung der Sichtbarkeit und Nachhaltigkeit

FID Soziologie: Erhöhung der Sichtbarkeit und Nachhaltigkeit FID Soziologie: Erhöhung der Sichtbarkeit und Nachhaltigkeit Positionsbestimmung Fachreferat und Fachinformationsdienste - Invited Session des VDB Dr. Johann Schaible Entwicklung zu Fachinformationsdiensten

Mehr

Technischer Bericht. Integration der KobRA-Verfahren in WebLicht

Technischer Bericht. Integration der KobRA-Verfahren in WebLicht Universität Tübingen Seminar für Sprachwissenschaft (SfS) Lehrstuhl Allgemeine Sprachwissenschaft und Computerlinguistik Technische Universität Dortmund Fakultät Informatik Lehrstuhl für Künstliche Intelligenz

Mehr

Einführung in die Computerlinguistik

Einführung in die Computerlinguistik Einführung in die Computerlinguistik Statistische Verfahren in der lexikalischen Semantik WS 2/22 Manfred Pinkal Beispiel: Adjektive im Wahrig-Korpus Frequenzen in einem kleinen Teilkorpus: n groß - -

Mehr

Einführung Computerlinguistik. Was ist ein Wort?

Einführung Computerlinguistik. Was ist ein Wort? Einführung Computerlinguistik Was ist ein Wort? Hinrich Schütze & Robert Zangenfeind Centrum für Informations- und Sprachverarbeitung, LMU München 2013-10-18 Schütze & Zangenfeind: Was ist ein Wort? 1

Mehr

Semiautomatische Erweiterung von Topic Maps mit Hilfe von Thesauri und User-Feedback

Semiautomatische Erweiterung von Topic Maps mit Hilfe von Thesauri und User-Feedback Semiautomatische Erweiterung von Topic Maps mit Hilfe von Thesauri und User-Feedback Andreas Bertram andy@asware.net Abstract: Das Semantic Web stellt die nächste Stufe der Evolution des World Wide Web

Mehr

Wortfinales Schwa in BeMaTaC: L1 vs. L2. Simon Sauer Korpuslinguistisches Kolloquium Humboldt-Universität zu Berlin

Wortfinales Schwa in BeMaTaC: L1 vs. L2. Simon Sauer Korpuslinguistisches Kolloquium Humboldt-Universität zu Berlin Wortfinales Schwa in BeMaTaC: L1 vs. L2 Simon Sauer Korpuslinguistisches Kolloquium Humboldt-Universität zu Berlin 27.01.2016 Phänomen In gesprochenem Deutsch wird wortfinales Schwa oft weggelassen ich

Mehr

3D-Tracks Kollaborative Planung von unterirdischen Bahntrassen

3D-Tracks Kollaborative Planung von unterirdischen Bahntrassen ANSYS Conference & 32. CADFEM Users Meeting 2014 Konferenz Digitale Städte 3D-Tracks Kollaborative Planung von unterirdischen Bahntrassen Andreas Donaubauer, Horst Steuer, Thomas H. Kolbe Leonhard Obermeyer

Mehr

Die Geschichte der Sprachverarbeitung ist eine Geschichte voller Mißverständnisse WS 2011/2012

Die Geschichte der Sprachverarbeitung ist eine Geschichte voller Mißverständnisse WS 2011/2012 Die Geschichte der Sprachverarbeitung ist eine Geschichte voller Mißverständnisse WS 2011/2012 Christian Kölbl Universität Augsburg, Lehrprofessur für Informatik 25. Oktober 2011 HAL 9000 - Zukunftsmusik

Mehr

PD3: Better Cross-Lingual Transfer By Combining Direct Transfer and Annotation Projection

PD3: Better Cross-Lingual Transfer By Combining Direct Transfer and Annotation Projection PD3: Better Cross-Lingual Transfer By Combining Direct Transfer and Annotation Projection Steffen Eger*, Andreas Rückle, Iryna Gurevych 27.03.2018 Fachbereich Informatik UKP Lab 1 Argumentation Mining

Mehr

Running head: Semantische Suche in Ausgestorbenen Sprachen 1

Running head: Semantische Suche in Ausgestorbenen Sprachen 1 Running head: Semantische Suche in Ausgestorbenen Sprachen 1 Semantische Suche in Ausgestorbenen Sprachen: Eine Fallstudie für das Hethitische Johannes Daxenberger 1, Susanne Görke 2, Darjush Siahdohoni

Mehr

Zugang zum Academic Invisible Web

Zugang zum Academic Invisible Web Zugang zum Academic Invisible Web Dr. Dirk Lewandowski Heinrich-Heine-Universität Düsseldorf, Abt. Informationswissenschaft dirk.lewandowski@uni-duesseldorf.de www.durchdenken.de/lewandowski Gliederung

Mehr

Über Struktur Relationen Anwendungen WORDNET. 10. Juli Magdalena Soyka, Christoph Berkholz WORDNET

Über Struktur Relationen Anwendungen WORDNET. 10. Juli Magdalena Soyka, Christoph Berkholz WORDNET Magdalena Soyka Christoph Berkholz 10. Juli 2008 Was ist WordNet? Ein am Cognitive Science Laboratory der Princeton University, New Jersey, USA, seit 1985 entwickelter Wortschatz der englischen Sprache.

Mehr

Tag Recommendations. in an Enterprise 2.0 Tool. Stefan Deser. 8. November Hintergrund Ziele der Arbeit Tag Recommender Systems Zeitplan

Tag Recommendations. in an Enterprise 2.0 Tool. Stefan Deser. 8. November Hintergrund Ziele der Arbeit Tag Recommender Systems Zeitplan Tag Recommendations in an Enterprise 2.0 Tool Stefan Deser 8. November 2010 Stefan Deser Tag Recommendations 8. November 2010 1 / 18 Inhalt Hintergrund Tagging und Folksonomies Enterprise 2.0 Ziele der

Mehr

xr, AI, ML, Mehr als ein Hype?!

xr, AI, ML, Mehr als ein Hype?! www.c-lp.de xr, AI, ML, Mehr als ein Hype?! Guido Walter (CEO Core Learning Production) xreality Experiences I Core Learning Production 2017 1 xreality Adaption / Verbreitung / Potenzial xreality Experiences

Mehr