Empfehlungen für die Zukunft Mehrwerte für Ihre Daten. Prof. Felix Sasaki (Deutsches Forschungszentrum für Künstliche Intelligenz)



Ähnliche Dokumente
Produktvorstellung: CMS System / dynamische Webseiten. 1. Vorwort

Your EDI Competence Center

Linked Open Data (LOD) in der Landwirtschaft. Workshop Anwendungsbeispiele nach Themen I

Vodafone Conferencing Meeting erstellen

Wie funktioniert automatisierte Übersetzung? Prof. Josef van Genabith (Deutsches Forschungszentrum für Künstliche Intelligenz)

Open Source als de-facto Standard bei Swisscom Cloud Services

SMART Newsletter Education Solutions April 2015

FORGE2015 HDC Session 4. Nachhaltige Infrastruktur als technologische Herausforderung. Tibor Kálmán Tim Hasler Sven Bingert

Der beste Plan für Office 365 Archivierung.

Dr. Klaus Körmeier BlueBridge Technologies AG

Weiterentwicklung digitaler Bibliothekssysteme zu OpenArchives-Systemen

Einrichten des Elektronischen Postfachs

Klaus Schild, XML Clearinghouse Namensräume

Geodatenmanagement und -harmonisierung mit GeoKettle

YouTube: Video-Untertitel übersetzen

Datei für Übersetzung vorbereiten

Korrekturen von Hand ausgeführt, per Post oder als Scan an Sie übermittelt.

Outlook Vorlagen/Templates

Software Engineering. Zur Architektur der Applikation Data Repository. Franz-Josef Elmer, Universität Basel, HS 2015

Digital signierte Rechnungen mit ProSaldo.net

Werkschau Web-Präsentationen

Umgang mit Daten in der Medizinischen Forschung Bedeutung von Datenbrücken

1. Einschränkung für Mac-User ohne Office Dokumente hochladen, teilen und bearbeiten

Hilft der Technischen Redaktion eine Schnittstelle zum Übersetzungsmanagement?

SWOT Analyse zur Unterstützung des Projektmonitorings

Webseiten und Web-Apps grafisch gestalten mit HTML5 Canvas ohne Flash und sonstige Tools

Erstellen einer in OWA (Outlook Web App)

Ihre Interessentendatensätze bei inobroker. 1. Interessentendatensätze

Veröffentlichen von Apps, Arbeitsblättern und Storys. Qlik Sense 1.1 Copyright QlikTech International AB. Alle Rechte vorbehalten.

EFFEKTIVE TEAM-UND PROJEKTARBEIT MIT

Mit suchmaschinenoptimierten Übersetzungen erfolgreich mit fremdsprachigen Webseiten

Management Selbst-Service: Szenarien

Ökonomik der Agrar und Ernährungswirtschaft in ILIAS

Metadaten bei der Digitalisierung von analogen archivalischen Quellen. Kathrin Mileta, Dr. Martina Wiech

SemTalk Services Stand: Februar 2015

Sichere Anleitung Zertifikate / Schlüssel für Kunden der Sparkasse Germersheim-Kandel. Sichere . der

Dokumentenmanagement als Dienst (DMS as a Service, DaaS)

RMeasy das SAP IS U Add On für Versorgungsunternehmen. Optimieren Sie Ihre Prozesse in Kundengewinnung und Kundenbindung.

der Firma BuchLogistikCompany GmbH Erstellt von Bernhard Neidl

Das Komplexe einfach machen

Zeichnungskoordination in der Cloud

Verbinden von Workflows und fachlichen Prozessmodellen im Rahmen eines SharePoint Prozessportals Semtation GmbH (Henrik Strauß)

Übung - Datensicherung und Wiederherstellung in Windows 7

Veröffentlichen von Apps, Arbeitsblättern und Storys. Qlik Sense Copyright QlikTech International AB. Alle Rechte vorbehalten.

Der Kontowecker: Einrichtung

E-Sourcing einfach, effizient und erfolgreich

SEPA-Umstellungshilfe für die VR-NetWorld-Software zur Nutzung von SEPA-Lastschriften

Windows Explorer Das unbekannte Tool. Compi-Treff vom 19. September 2014 Thomas Sigg

Workflow Monitoring basierend auf den SemTalk Services. Semtation GmbH

ADFlyer. Print goes Digital. Die optimale Web-Präsentation für Ihren Bedarf. ADFlyer-Generator ADFlyer-Produkt

Warum. Natural AnalyticsTM. wichtig ist

MO 27. Aug. 2007, 17:00 UHR JAVA FRAMEWORKS TIPPS VON PROFI-GÄRTNERN GEGEN WILDWUCHS

EINE PLATTFORM

Test zur Bereitschaft für die Cloud

IT-Asset-Management in der Cloud

Glaube an die Existenz von Regeln für Vergleiche und Kenntnis der Regeln

Flow Session zum Entdecken Deines idealen Lebensstils

ASV-Betrieb für die Coburger Schulen. Einbindung externer Schulen via RemoteApp

Chili for Sharepoint

Einführung in das Web Content Management System (CMS) Typo3

Gezielt über Folien hinweg springen

Vodafone Conferencing Meetings durchführen

Neue Kennwortfunktionalität. Kurzanleitung GM Academy. v1.0

Globalisierung fängt bei der Sprache an

Social viral - genial

die wichtigsten online-tools für augenoptiker websites

Grundlagen, Informationen und Hintergründe von Wiki Systemen

Wie ist das Wissen von Jugendlichen über Verhütungsmethoden?

Corporate Smart Process Content. Wissensmanagement mittels Prozesskontext

Der medizinische Fall Wie vernetzt man Leistungserbringer unterschiedlicher Sektoren datenschutzkonform?

Albert HAYR Linux, IT and Open Source Expert and Solution Architect. Open Source professionell einsetzen

Ursprung des Internets und WWW

Auswertung des Fragebogens Rahmenbedingungen des Umgangs mit Forschungsdaten in der Region

Onlinehilfe aus FrameMaker- Dokumenten was kommt nach WebWorks Publisher?

Fallbeispiel. Auswahl und Evaluierung eines Software- Lokalisierungstools. Tekom Herbsttagung 2004 Angelika Zerfaß

Die richtigen Partner finden, Ressourcen finden und zusammenführen

WinVetpro im Betriebsmodus Laptop

Anleitung für die Teilnahme an den Platzvergaben "Studio II, Studio IV und Studio VI" im Studiengang Bachelor Architektur SS15

GRS SIGNUM Product-Lifecycle-Management

BI in der Cloud eine valide Alternative Überblick zum Leistungsspektrum und erste Erfahrungen

Informationsaustausch mit StratOz ZUGVoGEL. Formatunabhängig, modular, clever.

Installation des edu- sharing Plug- Ins für Moodle

IT-SICHERHEIT IM UNTERNEHMEN Mehr Sicherheit für Ihre Entscheidung

Das Terminal. Einführung in das Postersystem

Inhalt. 1 Einleitung AUTOMATISCHE DATENSICHERUNG AUF EINEN CLOUDSPEICHER

12. Dokumente Speichern und Drucken

Kurzanleitung efax einrichten & Fax Versand

Ein Sozialprojekt der Rotary Clubs Paderbon Kaiserpfalz

Kurzanleitung für Benutzer. 1. Installieren von Readiris TM. 2. Starten von Readiris TM

Anzeige von eingescannten Rechnungen

FULFILLMENT VON ALLYOUNEED

nic.at - Salzamt im (österreichischen) Internet?

Über dieses Buch. Nutzungsrichtlinien

LineQuest-Leitfaden LineQuest Dialog-Portal. Generieren der LineQuest-Auswertungsdatei

Compiere eine neue ERP Alternative für den Mittelstand

Workflow, Business Process Management, 4.Teil

Ausbildungsplaner time2learn Kurzanleitung für Lernende

Transkript:

Empfehlungen für die Zukunft Mehrwerte für Ihre Daten Prof. Felix Sasaki (Deutsches Forschungszentrum für Künstliche Intelligenz) 1

Daten bisher: unverknüpfte Silos Original Übersetzung Proprietäre Formate Keine Verknüpfung der Daten Keine Wiederverwendung außerhalb des Kontexts Übersetzung Übersetzung 2

Mehrwert durch Wiederverwendbarkeit und Verknüpfung 5 Star Linked Data* 1. Daten im Web 2. Maschinenlesbare Form 3. Standards nutzen 4. RDF als zentrales Format 5. Verknüpfung von Daten * Vgl. http://www.w3.org/designissues/linkeddata.html 3

Mehrwert durch Wiederverwendbarkeit und Verknüpfung 5 Star Linked Data: 1. Daten im Web 2. Maschinenlesbare Form 3. Standards nutzen 4. RDF als zentrales Format 5. Verknüpfung von Daten Original Web = zusätzlicher Publikationskanal für Daten http://example.com/content/original/file1 4

Mehrwert durch Wiederverwendbarkeit und Verknüpfung 5 Star Linked Data: 1. Daten im Web 2. Maschinenlesbare Form 3. Standards nutzen 4. RDF als zentrales Format 5. Verknüpfung von Daten PDF, Scan Images,... http://example.com/content/original/file1 Filetyp: HTML, CSV, XML,... 5

Mehrwert durch Wiederverwendbarkeit und Verknüpfung 5 Star Linked Data: 1. Daten im Web 2. Maschinenlesbare Form 3. Standards* nutzen 4. RDF als zentrales Format 5. Verknüpfung von Daten Excel, Word,... *Standards = Kosten sparen durch Bessere Interoperabilität Nutzbarkeit von Open-Source Tools Standardisierte Technologien zumeist lizenzfrei ( royalty-free ) verfügbar Offene Formate erleichtern Erweiterungen http://example.com/content/original/file1 Filetyp: TBX, TMX, XLIFF (nicht verlinkt) > RDF (verlinkt) 6

Mehrwert durch Wiederverwendbarkeit und Verknüpfung 5 Star Linked Data: 1. Daten im Web 2. Maschinenlesbare Form 3. Standards nutzen 4. RDF* als zentrales Format 5. Verknüpfung von Daten Datensilo * RDF = Resource Description Framework, Technologie und Sammelbegriff für Linked Data Technologien Die Linked Data Cloud und die Linguistic Linked Data Cloud (vgl. nächste Folien) Kein Ersatz für TBX, TMX, XLIFF etc.; ein zusätzlicher Publikationskanal 7

Linked Data Cloud Verlinkte Daten im Web Dezentral, wie das Web selber Success stories in verschiedenen Domänen, z.b. Medizin & Bibliotheken Relevant für linguistische Daten die Linguistic Linked Data Cloud 8

Linguistic Linked Open Data Cloud Vgl. http://linguistic-lod.org/llod-cloud Linguistische Ressourcen als Linked Data (Trainings)korpora, Terminologien, Lexika,... Metadaten zu linguistischen Ressourcen Entdecken Sie was andere bereit stellen -> dezentral = Mehrwert durch den Netzwerkeffekt 9

Mehrwert Discovery Success Story LingHub http://linghub.lider-project.eu/ Kein Registrieren von Sprachressourcen, sondern Harvesting verteilter Ressourcen anhand von Metadaten der Netzwerkeffekt Verknüpfung verbreiteter Metadatenschemata META-SHARE, DataID, CLARIN, DCAT,... 10

Dritten erlauben die Daten zu verbessern Datensilo Alternative Übersetzung* http://example.com/content/uebersetzung/file1/segment1 Übersetzungssegmente Als Linked Data repräsentieren D.h. = im Web identifizieren Dadurch möglich: alternative Übersetzungen verlinken Bewahrung von Provenienz zur Qualitätssicherung 11

Übersetzungen mit Mehrwert anreichern Datensilo Anreicherung mit weiteren Quellen http://example.com/content/uebersetzung/file1/segment1/term1 Worte, Terme und Phrasen Als Linked Data repräsentieren D.h. = im Web identifizieren Dadurch möglich: Verlinkungen mit weiteren Datenquellen, um Übersetzungsalternativen zu generieren oder Inhalte weiter anzureichern Prominenten Quellen: BabelNet, DBpedia, EuroVoc,... 12

Rechte an Inhalten sicher stellen Datensilo Lizenzsicherung: Nur der Besitzer einer Lizenz darf das Segment verarbeiten! http://example.com/content/uebersetzung/file1/segment1 Lizenzen der Daten auf kleinster Ebene sichern 13

Datenmanagement von Sprachressourcen die Rolle von Linguistic Linked Data Validierung Wertschöpfungskette für Sprachressourcen Identifikation & Selektion von Daten Dokumen tation Datenbereinigung & Konvertierung Verarbeitung Speichern Rechtlicher Status Lizenzaspekte Privacy (z.b. Anonymisierung) Upload data to the Repository & Sharing Speicherung Möglicher Input zu einem Data management Plan (DMP) 14

Mehrwehrt ohne mehr Aufwand? Ja! Existierende Workflows müssen nicht geändert werden Linguistic Linked Data = ein zusätzlicher Publikationsworkflow Open Source Tooling und Beratung zur Nutzung von Linguistic Linked Data steht bereit Ist Linguistic Linked Data einmal im Workflow integriert entsteht der Mehrwert von selbst durch andere! Die Nachnutzung Ihrer Daten > Der Netzwerkeffekt 15

Zusammenfassung Die Zusammenfassung von übersetzungsrelevanten Daten im Web kann Mehrwerte schaffen Daten: Originaldokumente, übersetzte Dokumente, Übersetzungsmemories, Terminologiedatenbanken, Lexika,... Wer 5 Star Linked Data Prinzipien verfolgt kann diese Mehrwerte maximal ausnutzen 1. Daten im Web 2. Maschinenlesbare Form 3. Standards nutzen 4. RDF als zentrales Format 5. Verknüpfung von Daten Existierende Daten und Workflows sollten nicht aufgegeben werden Linked Data ist nur ein zusätzliches Publikationsformat Vorteile gibt es auf verschiedenen Ebenen Sprachressourcen entdecken durch Linked Data Metadaten -> Die Linguistic Linked Data Cloud Dritten erlauben die Sprachressourcen zu verbessern Übersetzungen mit weiteren Informationen anreichern Linked Data basiert auf Standards Etablierte Standards im Übersetzungsbereich: XLIFF, TBX, TMX,... Etablierte Standards im Bereich Linked Data. DCAT, LEMON, Provenance Ontology,... Linked Data bietet auch Mechanismen um Rechte an Daten sicher zu stellen nicht alles muss offen sein! 16

Hintergrund: Relevante EU Projekte und Initiativen LIDER http://lider-project.eu/ Support der Community um Linguistic Linked Data FALCON http://falcon-project.eu/ Linguistic Linked Data im Lokalisierungsprozess FREME http://freme-project.eu/ e-services für die Anreicherung von digitalen (Übersetzungs-)workflows mit (Linguistic) Linked Data Verschiedene W3C Gruppen zu technischen Aspekten um Linguistic Linked Data und Standards für Übersetzung im Web Vgl. Details unter http://www.multilingualweb.eu/projects/ 17

Präsentation für ELRC Workshop: Empfehlungen für die Zukunft Mehrwerte für Ihre Daten Author: Felix Sasaki Deutsches Forschungszentrum für Künstliche Intelligenz 18