Terminology as a Service eine Plattform für kooperative Terminologiearbeit Tekom-Regionalgruppe Nordrhein 28. April 2015 FH Köln

Ähnliche Dokumente
TermTerm Die Terminologie der Terminologie

Tekom-Frühjahrstagung in Potsdam, 14./ Eindrücke, Erkenntnisse, Ideen

Master-Studiengang Terminologie Sprachtechnologie

30 Minuten zum Thema Terminologie: Welche Art von Terminologietool für welchen Zweck? Donnerstag, 30. Juni - 16:00 CET

Ausgewählte Techniken der Maschinellen Übersetzung. Susanne J. Jekat ZHW Subject: MTZH

CONTENT UND TRANSLATION MANAGEMENT SYSTEME. Herausforderungen bei der Pflege vielsprachiger Web-Portale

Bibliografische Information der Deutschen Nationalbibliothek:

Grundlagen und Definitionen

Terminologiemanagement für den kleinen Geldbeutel

Inhaltsverzeichnis. 1 Einleitung... 1

COTI-Plugin für SDL Trados Studio 1.0

Terminologie-Extraktion: Beispiel

tekom-frühjahrstagung 2010 vom 29. bis 30. April in Schweinfurt Dr. Nicole Keller, Universität Heidelberg

Terminologieextraktion mit Acrolinx IQ. Verbesserung von Unternehmenssprache und Übersetzungsprozess Melanie Siegel

Risikomanagement-Beraterin Die RisikoScouts Ottmann & Canfora GbR

Terminologiemanagement in der Praxis

Warum Künstliche Intelligenz intelligente Terminologien (und Terminologen) braucht

Diversity Workbench Mobilisation of High Quality Species Occurrence Data for GBIF

Terminologiemanagement

Terminologie im Team Terminologie als Teamwork

Synergien zwischen Terminologie und Taxonomie. Dr. Annette Weilandt Beate Früh

Car-to-Cloud Kommunikation für einen Automotive Big Data Marktplatz

Automatische Klassifikation: Stand der Technik und Veränderungen im Berufsbild des Dokumentars. Automatische Klassifikation:

Umfragereport Weiterbildung im Übersetzungsbereich

Petra Drewer & Melanie Siegel. Terminologieextraktion multilingual, semantisch und mehrfach verwendbar

Entwicklungssysteme für Lernumgebungen am Beispiel des Essener-Lern-Modells

International Office

Bibliotheksmanagement im Netz - vernetzt

Terminologieworkflows: Auf dem Weg zu mehr Konsistenz

Ausgangssprache. Terminologiearbeit. Terminologiearbeit: Methode (1)

memoq 2015 Übersetzung, Terminologie, Alignment Schulungshandbuch für Einsteiger

KMU-Instrument & IMP³rove

Übersetzungen in der Technischen Dokumentation (k)ein Kinderspiel?!

Ist-Analyse und Vergleich der Informationssystem-Architektur von Forschungsverbünden

JPlus Platform Independent Learning with Environmental Information in School

SOA und kollaborative Geschäftsprozessmodellierung im Internet der Dienste. Dr. Walter Waterfeld, Software AG

Terminology Life Cycle & Grenzbereiche der Terminologie. Klaus Fleischmann Kaleidoscope GmbH

Grundlagen der übersetzungsbezogenen Terminologiearbeit - Terminologienormung und Terminologieverwaltung

SARA 1. Project Meeting

Technology Transfer in Steep Terrain Timber Harvesting (TechnoSteep)

Erfolg durch Wissen. Petershauser Straße 6, D Hohenkammer

Mit Excel und Prüftool

Across Language Server. Individual-Training

Internationale Erfahrungen bei der Adaptation von SNOMED-CT. Bernd Blobel

Ein Fundament für den Wissensaustausch. Die Verbindung von Terminologie und maschineller Übersetzung. Grundlagen

HIR Method & Tools for Fit Gap analysis

Werkzeuge und Technologien für die Terminologiearbeit. Angelika Zerfaß

Erfolgreiches Terminologie- Management im Unternehmen

Übernahme von Digitalisaten mittels scopeingest

Softwareprojektpraktikum Maschinelle Übersetzung

Web Services. Web Services in the News. Vision: Web of Services. Learning for Results. DECUS Symposium 2002, Vortrag 1K07,

UNTERNEHMEN IN DER TERMINOLOGIEFALLE

Workshop Übersetzungsmanagement: Wege durch den Schnittstellendschungel

START DER INSTITUTS- PARTNERSCHAFT ZUM THEMA DIGITALISIERUNG

Ein- und Ansichten DOAG Regionaltreffen Bremen Oktober 2010

Informationssuche in Sozialen Medien. Adam Horvath Universität Pecs Institut für Wirtschaftsmethodologie

Terminologisches Basiswissen für Fachleute

DAS ZUFRIEDENE GEHIRN: FREI VON DEPRESSIONEN, TRAUMATA, ADHS, SUCHT UND ANGST. MIT DER BRAIN-STATE-TECHNOLOGIE DAS LEBEN AUSBALANCIEREN (GE

Praktikum "Wissens- und Contentmanagement" WS0708. Projektideen. Lutz Maicher, University of Leipzig.

THEMA: SAS DATA INTEGRATION STUDIO FÜR MEHR TRANSPARENZ IM DATENMANAGEMENT EVA-MARIA KEGELMANN

Projektgruppe. Thomas Kühne. Komponentenbasiertes Software Engineering mit OSGi

DIE DATEN IM ZENTRUM: SAS DATA MANAGEMENT

Dokumentieren im Wiki

Universität Karlsruhe (TH)

Terminologie: Von der Mündung bis zur Quelle und zurück

speak with one voice 1

Webbasiert und kollaborativ: ein Requirements Editor auf Basis von ReqIF

Terminologie zwischen normativer Referenz und deskriptiver Dokumentation. Dr. Birte Lönneker-Rodman, Across Systems GmbH

Neue Erkenntnisse aus unstrukturierten Daten gewinnen

Best Practices für RM/RE in einem Prozess Framework Thomas Schröder

European Qualification Strategies in Information and Communications Technology (ICT)

Webbasierte Exploration von großen 3D-Stadtmodellen mit dem 3DCityDB Webclient

Mit Excel und Prüftool Terminologieverwaltung und -prüfung konzernweit einführen

Automatisierung des Datenreinigungsprozesses in einer internationalen multizentrischen Follow-up-Studie (I.Family-Studie)

Translator s Workbench: Funktionalität Entwicklungen Kundenanforderungen

Druck für Studenten leicht gemacht

Günter Kraemer. Adobe Acrobat Connect Die Plattform für Kollaboration und Rapid Training. Business Development Manager Adobe Systems

Gesellschaft für Technische Kommunikation tekom e.v.

Integration mit Service Repositories zur SOA Governance

Wikis ersetzen Word im Mittelstand

Die Renaissance von Unified Communication in der Cloud. Daniel Jonathan Valik UC, Cloud and Collaboration

Herzlichen Dank für die Einladung!

DIMEX Data Import/Export

Empfehlungen für die Zukunft Mehrwerte für Ihre Daten. Prof. Felix Sasaki (Deutsches Forschungszentrum für Künstliche Intelligenz)

Mitglied der Leibniz-Gemeinschaft

Chili for Sharepoint

Angewandte Linguistik IUED Institut für Übersetzen und Dolmetschen Sprachtechnologie für die mehrsprachige Kommunikation

Web Engineering Prof. Dr. Martin Gaedke, Dipl.-Inf. Olexiy Chudnovskyy

IROMEC Roboter unterstütztes Spielen für Kinder mit Behinderung

Das Knowledge Grid. Eine Architektur für verteiltes Data Mining

Knowledge-Based system. Inference Engine. Prof. Dr. T. Nouri.

Chantal Eibner. Integratives Übersetzungsmanagement mit Translation Memory Systemen. Diplomica Verlag

Pilot project: Social firm gadplus

Forum International CIUTI-Marché du Travail, Anforderungen an den Übersetzer seitens der Wirtschaft

ADONIS NP Prozessmanagement-Know-how auf neuen Wegen

Szenarienrechnungen zu Extremniederschlägen mit potentieller Wirkung auf Infrastrukturen

Vorteile von Java und Konvergenz Service Creation mit JAIN Network Management mit JMX Fazit

Mehr Zeit für den Kunden und wirtschaftlicher Arbeiten mit BIB-Control

Maschinelle Übersetzung

Transkript:

Terminology as a Service eine Plattform für kooperative Terminologiearbeit Tekom-Regionalgruppe Nordrhein 28. April 2015 FH Köln Prof. Dr. Klaus-Dirk Schmitz Fachhochschule Köln - Fakultät 03 - ITMK

Crowd / Cloud und Terminologiearbeit Gute Terminologiearbeit ist zeitaufwändig und damit teuer. Warum nicht die Allgemeinheit (crowd) involvieren? Warum nicht mit mehreren Personen zusammenarbeiten? Wir brauchen eine Technologie (Werkzeug), die kollaborative Terminologiearbeit unterstützt bzw. erst ermöglicht. Beispiele: Wikipedia (www.wikipedia.org) TermWiki (www.termwiki.com) 2 Unterschiedliche Philosophie bei Werkzeugen: Web-Clients bei TMS (z.b. MultiTerm-Web) web-basierte TMS (z.b. TermWeb)

Crowd / Cloud und Terminologiearbeit Hauptfragen: Wie kann man die Allgemeinheit animieren? Hidden business model? Free services? Sharing data? Will / darf man seine Daten in der Cloud haben? Kann man die Anwendung etablierter terminologischen Prinzipien sicherstellen? (meta model, datcats, concept orientation, term autonomy) 3 Wie kann man Korrektheit sicherstellen? Wie kann man Vollständigkeit sicherstellen? Wie kann man Konsistenz sicherstellen? Wie kann man Verlässlichkeit sicherstellen?

Die TaaS-Idee 4

Das TaaS-Projekt TaaS - Terminology as a Service: Cloud-basierte Plattform für die Akquirierung, Bereinigung, gemeinsame Benutzung und Wiederverwendung von mehrsprachigen terminologischen Daten The project has received funding from the European Union Seventh Framework Programme (FP7/2007-2013), grant agreement no 296312. 5

Das TaaS-Projekt Partner: Tilde Lettland (Koordinator) TAUS Niederlande Kilgray Ungarn Fachhochschule Köln Deutschland University of Sheffield UK Laufzeit: 1. Juni 2012 31. Mai 2014 www.taas-project.eu 6

Basis-Dienste von TaaS Automatische Extraktion von Termkandidaten aus monolingualen Texten mit (state-of-the art) Termextraktionstechniken aus von Nutzer bereitgestellten Dokumenten Automatisches Finden von Übersetzungsäquivalenten für die extrahierten Termini, aus öffentlichen oder eigenen Termbanken, in vielen Sprachen Ermittlung von Übersetzungsäquivalnten für nicht in Termbanken gefundene Termini, aus parallelen Web-Daten unter Nutzung von aktuellen Methoden zur Termextraktion und bilingualem Terminologie-Alignment 7

Exkurs: Terminologie-Extraktion bei der textorientierten und fachgebietsorientierten Terminologiearbeit können Verfahren und Werkzeuge für die Term-Extraktion die Arbeit unterstützen: finde alle (neuen) Benennungen in einem Text, als Vorbreitung einer Übersetzung oder um die korrekte und konsistente Verwendung von Benennungen (Unternehmenssprache) zu überprüfen finde alle Benennungen eines Fachgebiets oder einer Unternehmenssprache, um eine neue Termbank aufzubauen oder eine vorhandene zu ergänzen 8

Exkurs: Terminologie-Extraktion Für die Erarbeitung von Terminologie in vielen Anwendungsbereichen werden Verfahren und Werkzeuge zur Terminologie-Extraktion gefordert. Es lassen sich folgende Extraktionsverfahren unterscheiden: Einsprachige Term-Extraktion (Text in elektronischer Form) Zweisprachige Term-Extraktion (parallele alignierte Texte, TM) Manuelle (humane) Term-Extraktion (gut, aber teuer ) Computer-unterstützte Term-Extraktion (Vorschläge) Mit statistischen Verfahren (für alle Sprachen) Mit linguistischen Verfahren (besser, aber nur für wenige Sprachen) Mit hybriden Verfahren (Kombination aus Statistik und Linguistik) 9

Exkurs: Manuelle Terminologie-Extraktion Was ist ein Term-Kandidat? Was ist eine Benennung? (Was ist fachsprachlich?) Was soll in die Termbank aufgenommen werden? Werden diese Fragen von allen Spracharbeitern (Technischen Redakteuren, Übersetzern, Terminologen) gleich beantwortet? 10 Regina Janke: Anforderungen an die Terminologieextraktion für die Terminologiearbeit in Unternehmen eine vergleichende Untersuchung der Bedürfnisse von Terminologen, Technischen Fachübersetzern und Technischen Redakteuren. Master-Thesis. Donau-Universität Krems. 2012

Exkurs: Manuelle Terminologie-Extraktion Umfrage bei Studierenden (29 TR / 10 Term. / 11 Übers.) Neben allgemeinen Fragen zu Qualifikation und Erfahrung, 2 praktische Übungen zur manuellen Term-Extraktion Quelle: Janke 2012 2 Texte: Linguistik (Göpferich) 280 Z. Verpackungstechnik (Betriebsanleitung) 298 Z. 11

12 Quelle: Janke 2012

Quelle: Janke 2012 13

Quelle: Janke 2012 14

Basis-Dienste von TaaS Automatische Extraktion von Termkandidaten aus monolingualen Texten mit (state-of-the art) Termextraktionstechniken aus von Nutzer bereitgestellten Dokumenten Automatisches Finden von Übersetzungsäquivalenten für die extrahierten Termini, aus öffentlichen oder eigenen Termbanken, in vielen Sprachen Ermittlung von Übersetzungsäquivalnten für nicht in Termbanken gefundene Termini, aus parallelen Web-Daten unter Nutzung von aktuellen Methoden zur Termextraktion und bilingualem Terminologie-Alignment 15

Basis-Dienste von TaaS Funktionalitäten zur Bearbeitung terminologischer Daten, z.b. durch Anreicherung nach Extraktion Funktionalitäten zur Bereinigung durch Abgleich mit terminologischen Daten (anderer) Nutzer Funktionalitäten zum Data-Sharing und zur Integration in andere Anwendungen/Tools durch APIs und Export-Werkzeuge 16

TaaS-Architektur 17

Terminologiearbeit Wie kann man die Personen, die Terminologiearbeit betreiben, bei ihrer Arbeit unterstützen? Wer sind diese Personen (Spracharbeiter)? Wonach suchen sie (meistens)? Wie machen sie Terminologiearbeit? Welche Programme und Formate nutzen sie? 18 Wären sie bereit, Ergebnisse zu teilen?

Nutzer-Typologie: Language worker 19 Zielgruppen: Übersetzer Dolmetscher Technische Redakteure Terminologen (Software-)Lokalisierer Sprachlerner Fachgebietsexperten CAT-Werkzeuge MÜ-Systeme (andere Werkzeuge)

Nutzer-Umfrage 20 Online-Befragung typischer Nutzergruppen: Deutscher Fachverband für Technische Kommunikation und Informationsentwicklung (tekom) Bundesverband der Dolmetscher und Übersetzer (BDÜ) Deutscher Terminologie-Tag (DTT) International Federation of Translators FIT (Europe) Internationales Terminologie-Netzwerk (TermNet) ProZ via TAUS Weitere Mailing-Listen 1.782 Antworten / Anfang Juli 2012

Nutzer-Umfrage Fragen: Tätigkeit, berufliches Umfeld Fachgebiet (Industrie, Dienstleister) genutzte Programme verwendete Formate Anteil Terminologiearbeit an Arbeitszeit Wichtigkeit der Terminologiearbeit Art und Zweck der Terminologiearbeit Wonach, wo und wie wird gesucht Probleme bei der Terminologie-Recherche Optimierungspotential Bereitschaft Terminologie im Web bereitzustellen 21

Umfrage: Profil 22

Umfrage: Arbeitsumfeld 23

Umfrage: Programme 24

Umfrage: Formate 25

Umfrage: Wichtigkeit 26

Umfrage: Zweck Terminologiearbeit 27

Umfrage: Wonach wird gesucht? 28

Umfrage: Sharing terminology 29

Umfrage: Sharing terminology 30

Umfrage: Formate 31

Spezifikation von TaaS Die Ergebnisse der Nutzerbefragung, der Analyse der Werkzeuge und die eigenen Erfahrungen bilden die Basis für die Spezifikation von TaaS: der generellen Funktionalitäten und Komponenten der TaaS-Plattform (TaaS service portfolio) der technischen Architektur des Systems der Nutzer-Schnittstellen (user interfaces) der Nutzerverwaltung (user group management) des Daten-/Dokument-Workflows 32

TaaS-Pattform: Nutzersicht 33

Beispiel: Termextraktion mit TaaS Gehe zu https://term.tilde.com 34

Beispiel: Termextraktion mit TaaS Gehe zu https://term.tilde.com Entweder direkte Suche 35

Beispiel: Termextraktion mit TaaS Gehe zu https://term.tilde.com Entweder direkte Suche Oder anmelden / registrieren für weitere Services 36

Beispiel: Termextraktion mit TaaS Gehe zu https://term.tilde.com Entweder direkte Suche Oder anmelden / registrieren für weitere Services Projekt zur Termextraktion anlegen 37

Beispiel: Termextraktion mit TaaS Gehe zu https://term.tilde.com Entweder direkte Suche Oder anmelden / registrieren für weitere Services Projekt zur Termextraktion anlegen Text(e) zur Extraktion laden 38

Beispiel: Termextraktion mit TaaS Gehe zu https://term.tilde.com Entweder direkte Suche Oder anmelden / registrieren für weitere Services Projekt zur Termextraktion anlegen Text(e) zur Extraktion laden 39

Beispiel: Termextraktion mit TaaS Gehe zu https://term.tilde.com Entweder direkte Suche Oder anmelden / registrieren für weitere Services Projekt zur Termextraktion anlegen Text(e) zur Extraktion laden Extraktionseinstellungen festlegen 40

Beispiel: Termextraktion mit TaaS Gehe zu https://term.tilde.com Entweder direkte Suche Oder anmelden / registrieren für weitere Services Projekt zur Termextraktion anlegen Text(e) zur Extraktion laden Extraktionseinstellungen festlegen Extraktion starten 41

Beispiel: Termextraktion mit TaaS Gehe zu https://term.tilde.com Entweder direkte Suche Oder anmelden / registrieren für weitere Services Projekt zur Termextraktion anlegen Text(e) zur Extraktion laden Extraktionseinstellungen festlegen Extraktion starten Prüfe und ergänze Extraktionsergebnisse 42

Beispiel: Termextraktion mit TaaS Gehe zu https://term.tilde.com Entweder direkte Suche Oder anmelden / registrieren für weitere Services Projekt zur Termextraktion anlegen Text(e) zur Extraktion laden Extraktionseinstellungen festlegen Extraktion starten Prüfe und ergänze Extraktionsergebnisse 43

Beispiel: Termextraktion mit TaaS Gehe zu https://term.tilde.com Entweder direkte Suche Oder anmelden / registrieren für weitere Services Projekt zur Termextraktion anlegen Text(e) zur Extraktion laden Extraktionseinstellungen festlegen Extraktion starten Prüfe und ergänze Extraktionsergebnisse Visualisierung 44

Beispiel: Termextraktion mit TaaS 45 Gehe zu https://term.tilde.com Entweder direkte Suche Oder anmelden / registrieren für weitere Services Projekt zur Termextraktion anlegen Text(e) zur Extraktion laden Extraktionseinstellungen festlegen Extraktion starten Prüfe und ergänze Extraktionsergebnisse Visualisierung Import, Export, Sharing

TaaS-Architektur 46

TaaS: CAT-Tool-Einbindung Auto-lookup Adding and editing terms Manual lookup Transferring term extraction lists 47 47

TaaS und Maschinelle Übersetzung 48 Online Terminology Services Translation Input Text for Translation Bilingual Term Extraction Bilingual term collections Online Translation Service Monolingual Term Extraction Translated Text Training 48 Parallel corpus Monolingual corpus SMT System Training and adaptation Trained SMT Model Data acquisition from SMT systems Export of multilingual terminology for reuse in MT systems

Conclusion TaaS offers free of charge services for terminology extraction, retrieval, management, and sharing The term extraction results are excellent, if the linguistic algorithms are available for that language Companies react very carefully concerning TaaS But the free services offered by TaaS may attract language workers to use TaaS for terminology management, to share (validated) terminology, and to collaborate with others. 49

Vielen Dank für Ihre Aufmerksamkeit Prof. Dr. Klaus-Dirk Schmitz klaus.schmitz@fh-koeln.de http://www.taas-project.eu https://term.tilde.com