Lexika & Zugriff. Marcel Boeing

Ähnliche Dokumente
Computerlinguistische Grundlagen. Jürgen Hermes Sommersemester 17 Sprachliche Informationsverarbeitung Institut für Linguistik Universität zu Köln

Die Wahl der Suchbegriffe

Fit für die Projektarbeit. Literaturrecherche leicht gemacht!

Informationen effizienter nutzen durch Semantische Informationsstrukturen

Apache Solr. Apache Solr. ALD:HS WiSe 2011/2012. Einleitung. Features. Implementation. Verwaltung. Benutzung

Metadaten in CLARIN-D

4. RADAR-WORKSHOP RADAR APPLICATION PROGRAMMING INTERFACE KARLSRUHE, 25./26. JUNI Matthias Razum, FIZ Karlsruhe

Fit für die Projektarbeit. Literaturrecherche leicht gemacht!

Wissensprozesse effizient unterstü tzen Semantische Suche und Integration

Universität Hamburg. Institut für Germanistik I Seminar 1b: Wort, Name, Begriff Seminarleiter: Prof. Dr. Walther v. Hahn

Ulrich Apel WaDokuJT-Projekt

> 90%! > Kollegen erecruiting Nationen > AMS PAR DUS. > /p.a. SPRACHEN. IN /min.

1. Suchbegriff Handbuch Projekte Gymnasium (2013), S. 23, Bestimmen des Informationsbedarfs

OO Programmiersprache vs relationales Model. DBIS/Dr. Karsten Tolle

Ihre Ausbildungschancen bei Gauselmann DUALE STUDIENGÄNGE.

Screenshot Xinoah Jens Forker Xinoah 2009

Erläuterungen zu Darstellung des DLQ-Datenportals

LINGUISTIK SYSTEMATIK DER AUFSTELLUNG

Die mobile Web-App»Orte jüdischer Geschichte«und die DARIAH-DE Infrastruktur

ANGEWANDTE LINGUISTISCHE DATENVERARBEITUNG PROF. DR. JÜRGEN ROLSHOVEN UTE WINKELMANN

DiversityCollection. Theorie, Projekte, Datenflüsse, Netzwerke und Dienste

Das zugängliche Web der Dinge

Duden Medizinische Fachbegriffe

Digital Humanities Recherche im DWDS und DTA

Rüth R 1, Michel-Backofen A 1, Kozelj M 2, Thun S 3, Semler SC 4,5, Röhrig R 1

Deutsch Synonyme Worterbuch

n2pdf PDF your Notes

Big Data Recherche im DPMA in der digitalen Zukunft

ordnet.dk Vernetzung zwischen Wörterbuch und Korpus

DiversityCollection. Theorie, Projekte, Datenflüsse, Netzwerke und Dienste

Summer School. Offene Gebäudeautomation. WebServices, Application Server und weitere Konzepte EMR. aus: Distributed Systems, A. Schill, TU Dresden

Schulbücher / Arbeitshefte SJ 2018/19

Profl: Torsten Mangner

Completing SDN The Northbound API

Anbindung an WebServices Robert Zacherl

Fit für die Projektarbeit. Thematische Literatursuche in 5 Schritten Basiert auf: Lotse, Skript zur Thematischen Literatursuche. Stand 1.10.

Simullda. Structured Interlingua MultiLingual Lexical Database Application. Sonja Weber

Architektur des agimatec-validation Frameworks

Apple's Swift trifft Oracle's Datenbank - Yes we can! -

Fit für die Projektarbeit. Thematische Literatursuche in 5 Schritten Quelle: Lotse, Skript zur Thematischen Literatursuche. Stand 1.10.

Automatische Schlagwortvergabe aus der SWD für

Senya Müller Sprachwörterbücher im Nationalsozialismus

Informationsmanagement mit Semantischen Netzen Dr. Günter Pees, SSG

Mit con terra Technologies die digitale Transformation meistern Halle Christoph Uhlenküken

REST Services To-Go Einfacher Einstieg in die REST Programmierung

Aufbau eines virtuellen privaten Netzes mit Peer-to-Peer-Technologie

Die Schlagwortnormdatei (SWD) in den digitalen Angeboten der Bayerischen Staatsbibliothek

xii Inhaltsverzeichnis Generalisierung Typisierte Merkmalsstrukturen Literaturhinweis

Interoperabilität heterogener Informationsquellen im Gesundheitswesen auf Grundlage von Standards für die medizinische Kommunikation und Dokumentation

TextGrid Arbeitsgruppen

Inhaltsverzeichnis. Bibliografische Informationen digitalisiert durch

Wie Open Source Sie unterstützt, ohne dass Sie es merken. Ing. Werner Hehenwarter Geschäftsführer

ARS. DevOps-Berater/ Ingenieur (m/w) ARS Computer und Consulting GmbH /

Fit für die Bib. Für BWL

Haben wir das Richtige getestet? Erfahrungen mit Test-Gap-Analyse für ABAP

Themenschwerpunkte der AG Lokalsysteme Amtsperiode

Brauchen wir neue Wörter?Lexikographische Behandlung von Neologismen im Deutschen. p.1

22. Januar Gruppe 2: TOPCASED

Angewandte Informatik - Ingenieurinformatik, Bachelor of Science

Links zu mehrsprachigem Informationsmaterial zu Gesundheitsthemen (Stand April 2010)

Zur Definition von Web-Services

Regeln von Computerspielen werden klassischerweise im Quellcode festgelegt.

Automatisierte Verfahren für die Themenanalyse nachrichtenorientierter Textquellen

Quo vadis, OPC? - von Data Access bis Unified Architecture - Dipl.-Ing. (BA) Erik Hennig Dresden,

CTX COMPUTERGESTÜTZTES TEXTERSCHLIESSUNGSSYSTEM

Schnittstellen und Interaktionen zwischen fahrer- und fahrzeugbezogenen Diensten

Verteiltes Programmieren mit Space Based Computing

Recherchetipps & Buchsuche

conhit 2014 Berlin 6. Mai 2014

In unserem fünftägigen Kurs "Python - Komplettkurs" erlangen Sie umfassende Kenntnisse in der Anwendungsentwicklung mit Python.

Sof o t f waretechn h o n l o og o i g en n f ü f r ü v e v rteilte S yst s eme Übung

Computerlinguistische Grundlagen. Jürgen Hermes Wintersemester 17/18 Sprachliche Informationsverarbeitung Institut für Linguistik Universität zu Köln

Board:Protokoll Pirates without Borders

briefe 054DE984E3E91E4CA5B47B7CE33D5C6C Briefe 1 / 5

QUALIA STRUKTUR NACH PUSTEJOVSKY

Universität Karlsruhe (TH) Moderne Programmiersysteme am Beispiel von.net

Barrierefreiheit mit Adobe Acrobat XI

Berater-Profil SW-Entwickler/-Berater (DB2, Java, MS-SQL-Server, WebSphere)

ArcGIS 9.0 Highlights oder was gibt s neues von ESRI? Katrin Twiehaus ESRI Niederlassung Hannover

Praktikum Textmining

Offene Daten und offene Software. Schweizer Statistiktage August 2018 Michael Grüebler

Die Analyse elektronischer Textkorpora als Methode linguistischer Untersuchungen

MoOdalis. Bildungsprozesse rund um Moodle gestalten

Wahlpflichtfächer der Gruppe Mathematik Integraltransformationen

Erprobung der OCLC WorldShare Management Services im Bibliotheksverbund Bayern

Das Hypertext-Konzept in der Lexikographie

Autorensysteme für mobile Anwendungen - Totgesagte leben länger. Prof. Dr. Michael Bauer Autorensysteme

Bestellliste der im Schuljahr 2013/14 ausleihbaren und anzuschaffenden Schulbücher und Lernmaterialien für den Schuljahrgang 5

Allgemeine Informationen

Oracle UCM. Produktiver Einsatz am Beispiel des Forschungszentrums Karlsruhe

Fürstinnenkorrespondenzen Experiment einer Nachnutzung. Stefan Dumont, Berlin

Praktikum Softwareentwicklung 2

M.Sc. Informatik, Studium angewandte Informatik M.Sc. Ing. Lasertechnik, Studium Laser und Photonik B.Sc. Elektrotechnik, Studium der Elektrotechnik

Erfolg durch Wissen. Petershauser Straße 6, D Hohenkammer

Semantische und konzeptionelle Modellierung

Stefan Lohrum/Viktoria Gerlach

Transkript:

Prof. J. Rolshoven Angewandte linguistische Datenverarbeitung Universität zu Köln 12. Dezember 2011

1 Einführung Was sind Lexika? 2 Digitale Lexika LEO DICT Projekt Deutscher Wortschatz Wikipedia 3 Quellen & Links

Was sind Lexika? Einfachste Definition Menge diskreter Lemmata.

Was sind Lexika? Einfachste Definition Menge diskreter Lemmata. {Auto; Papst; fahren}

Was sind Lexika? Duden 1880

Was sind Lexika? Metainformationen Menge diskreter Lemmata. {Auto; Papst; fahren} Lemmata mit Metainformationen.

Was sind Lexika? Metainformationen Menge diskreter Lemmata. {Auto; Papst; fahren} Lemmata mit Metainformationen. {Auto, N, n; Papst, N, m; fahren, V}

Was sind Lexika? Metainformationen Menge diskreter Lemmata. {Auto; Papst; fahren} Lemmata mit Metainformationen. {Auto, N, n; Papst, N, m; fahren, V} Lemmata mit Übersetzungsinformationen.

Was sind Lexika? Metainformationen Menge diskreter Lemmata. {Auto; Papst; fahren} Lemmata mit Metainformationen. {Auto, N, n; Papst, N, m; fahren, V} Lemmata mit Übersetzungsinformationen. {Auto, car; Papst, pope; fahren, drive}

Was sind Lexika? Langenscheidt

Was sind Lexika? Semantische Informationen Menge diskreter Lemmata. {Auto; Papst; fahren} Lemmata mit Metainformationen. {Auto, N, n; Papst, N, m; fahren, V} Lemmata mit Übersetzungsinformationen. {Auto, car; Papst, pope; fahren, drive} Lemmata mit semantischen Informationen.

Was sind Lexika? Semantische Informationen Menge diskreter Lemmata. {Auto; Papst; fahren} Lemmata mit Metainformationen. {Auto, N, n; Papst, N, m; fahren, V} Lemmata mit Übersetzungsinformationen. {Auto, car; Papst, pope; fahren, drive} Lemmata mit semantischen Informationen. {Papst, rel. Titel, Oberhaupt der r-k Kirche}

Was sind Lexika? Brockhaus

Digitale Lexika

Digitale Lexika LEO (TU München)

Digitale Lexika LEO (TU München) DICT

Digitale Lexika LEO (TU München) DICT Projekt Deutscher Wortschatz (Uni Leipzig)

Digitale Lexika LEO (TU München) DICT Projekt Deutscher Wortschatz (Uni Leipzig) Wikipedia

LEO LEO

LEO LEO Mehrere Sprachwörterbücher (de, en, fr, es, it, ru, zh)

LEO LEO Mehrere Sprachwörterbücher (de, en, fr, es, it, ru, zh) Verknüpfung mit weiteren Datenbanken (Aussprache, Synonyme, Antonyme,... )

LEO LEO Mehrere Sprachwörterbücher (de, en, fr, es, it, ru, zh) Verknüpfung mit weiteren Datenbanken (Aussprache, Synonyme, Antonyme,... ) Problem: Keine öffentliche API.

DICT DICT

DICT DICT Protokoll zur Kommunikation mit Wörterbuch-Servern.

DICT DICT Protokoll zur Kommunikation mit Wörterbuch-Servern. Standard der IETF (RFC 2229).

DICT DICT Protokoll zur Kommunikation mit Wörterbuch-Servern. Standard der IETF (RFC 2229). Quelloffen und frei zugänglich.

DICT DICT Protokoll zur Kommunikation mit Wörterbuch-Servern. Standard der IETF (RFC 2229). Quelloffen und frei zugänglich. APIs für gängige Programmiersprachen.

DICT DICT Protokoll zur Kommunikation mit Wörterbuch-Servern. Standard der IETF (RFC 2229). Quelloffen und frei zugänglich. APIs für gängige Programmiersprachen. Viele Server und viele Wörterbücher verfügbar.

DICT DICT-Abfrage

DICT DICT-Abfrage (Matching)

DICT DICT-Abfrage (mehrere Lexika)

DICT DICT-Abfrage (Java Dict API)

Projekt Deutscher Wortschatz Projekt Deutscher Wortschatz

Projekt Deutscher Wortschatz Projekt Deutscher Wortschatz Datenbank aus Korpus gegenwärtiger Texte.

Projekt Deutscher Wortschatz Projekt Deutscher Wortschatz Datenbank aus Korpus gegenwärtiger Texte. Verschiedene Sprachwörterbücher.

Projekt Deutscher Wortschatz Projekt Deutscher Wortschatz Datenbank aus Korpus gegenwärtiger Texte. Verschiedene Sprachwörterbücher. Viele Sonderfunktionen (Worthäufigkeit, Synonyme, Grundform, Nachbarn, etc.)

Projekt Deutscher Wortschatz Projekt Deutscher Wortschatz Datenbank aus Korpus gegenwärtiger Texte. Verschiedene Sprachwörterbücher. Viele Sonderfunktionen (Worthäufigkeit, Synonyme, Grundform, Nachbarn, etc.) Dienste über APIs und Webservices verfügbar.

Projekt Deutscher Wortschatz Projekt Deutscher Wortschatz Datenbank aus Korpus gegenwärtiger Texte. Verschiedene Sprachwörterbücher. Viele Sonderfunktionen (Worthäufigkeit, Synonyme, Grundform, Nachbarn, etc.) Dienste über APIs und Webservices verfügbar. (Größtenteils) frei zugänglich.

Projekt Deutscher Wortschatz Projekt Deutscher Wortschatz Datenbank aus Korpus gegenwärtiger Texte. Verschiedene Sprachwörterbücher. Viele Sonderfunktionen (Worthäufigkeit, Synonyme, Grundform, Nachbarn, etc.) Dienste über APIs und Webservices verfügbar. (Größtenteils) frei zugänglich. Exzellente Dokumentation und Einfachheit.

Projekt Deutscher Wortschatz Projekt Deutscher Wortschatz Datenbank aus Korpus gegenwärtiger Texte. Verschiedene Sprachwörterbücher. Viele Sonderfunktionen (Worthäufigkeit, Synonyme, Grundform, Nachbarn, etc.) Dienste über APIs und Webservices verfügbar. (Größtenteils) frei zugänglich. Exzellente Dokumentation und Einfachheit. http://wortschatz.uni-leipzig.de/axis/servlet/ ServiceOverviewServlet

Projekt Deutscher Wortschatz Semantik Semantik?

Projekt Deutscher Wortschatz Wikipedia

Wikipedia Wikipedia Semantische Informationen!

Wikipedia Wikipedia Semantische Informationen! Das gleiche Problem, wie bei LEO: Keine API.

Wikipedia Wikipedia Semantische Informationen! Das gleiche Problem, wie bei LEO: Keine API. Lösung am Horizont: WikiData.

Wikipedia Wikipedia Semantische Informationen! Das gleiche Problem, wie bei LEO: Keine API. Lösung am Horizont: WikiData. Faktenbasis und semantische Verknüpfungen.

Wikipedia Wikipedia Semantische Informationen! Das gleiche Problem, wie bei LEO: Keine API. Lösung am Horizont: WikiData. Faktenbasis und semantische Verknüpfungen. Im Beginn begriffen; Jobangebote offen. http://www.wikimedia.de/wiki/overview_%28all_ positions%29

Quellen & Links DICT Development Group http://www.dict.org/ RFC 2229 http://tools.ietf.org/html/rfc2229 Java DICT API http://sourceforge.net/projects/javadict/ Projekt Deutscher Wortschatz http://wortschatz.uni-leipzig.de/ Wikidata http://meta.wikimedia.org/wiki/new_wikidata