WebApps - Einführung (Daten)

Ähnliche Dokumente
Event Recognition Engine

Anleitung OpenCms. Einfügen eines Template-Umschalters für den Wechsel zwischen mobiler und Dektop-Ansicht

Vorgeschlagene Verfahrensweise zum Erstellen von geometrischen Toleranzen in Pro/ENGINEER Wildfire 4.0 (Quelle: PTC Express Februar 2009)

RIS Abbild mit aktuellen Updates

Kulturelle Vielfalt. Posten 1 Vier Sprachen eine Einheit

Anleitung zur Einrichtung von Stellvertretungen in Outlook

Kontextualisierung von Sprachressourcen und -technologie in der geisteswissenschaftlichen Forschung

SALSAH eine virtuelle Forschungsumgebung für die Geisteswissenschaften

Kollaborative Konstruktionsglossare im Fachfremdsprachenlernen Deutsch, Estnisch, Lettisch, Litauisch AntConc Arbeit mit digitalen Textsammlungen

Adobe Reader X. Adobe Customization Wizard X. highsystem ag. Author(s): Paolo Sferrazzo. Version: 1.0 Erstellt am: Letzte Änderung: - 1 / 9

GATE General Architecture for Text Engineering. Alexander Hein & Erik Dießler (VL Text Analytics )

Webshop Neuerungen von Version 6.14 zu

German Sales Art Works, Art Markets, and Cultural Policy

e-gouernmenc mit fabasoft: uom antrag bis zur Zustellung

CartCalc FAQ (frequently asked questions) häufige Fragen zu CartCalc

Dateninteroperabilität für INSPIRE in der Praxis Datenintegration und -harmonisierung

ECM und Zusammenarbeit

Serienbrief mit Word erstellen

Kooperatives Forschungsprojekt Online-Brief-Datenbank. Ein Beispiel für disziplinspezifische Anwendungen

Anlage eines neuen Geschäftsjahres in der Office Line

Einrichten der TSM-Backup-Software unter dem Betriebssystem Mac OSX

2015 conject all rights reserved

Adobe Encore Einfaches Erstellen einer DVD

Bedienungsanleitung Elektronischer Zertifikatsaustausch

Aus Augias ins Internet: Die Erstellung von Onlinefindbücher aus Augias-Datenbanken mit dem ELKO- Augias, MidosaXML und MEX

Navigation. Drucken Klicken Sie auf ein Symbol, um nähere Informationen zu erhalten. Papierhandhabung Anzeigen der Online-Informationen


Vorankündigung Die Verlagsleitung und der Erfolgsautor der Blauen Business-Reihe ist auf der Frankfurter Buchmesse 2007 vertreten.

Umsetzung der Schulbuchaufbereitung in Österreich. Eine Fallstudie

XML Content Management in der technischen Redaktion 6. Publishers Forum

VMware vsphere Client

Verschlüsseln von Dateien mit Hilfe einer TCOS-Smartcard per Truecrypt. T-Systems International GmbH. Version 1.0 Stand

Wichtige Information zur Verwendung von CS-TING Version 9 für Microsoft Word 2000 (und höher)

TSM-Client unter Mac OS X einrichten

Projekt. Java-Anwendung für die Sequenzanalyse (Metagenomik und Transkriptomik)

Tel.: Fax: Ein Text oder Programm in einem Editor schreiben und zu ClassPad übertragen.

Mandanteninformation Die neue amtliche Muster-Widerrufsbelehrung Art Abs. 3 Satz 1 Anlage 1 EGBGB

NMP-Verlag Verlag für Nationalökonomie, Management und Politikberatung

1. Einleitung Geschichte Chronik des Romanischen Fakten Wie unterschiedlich sind die fünf Idiome?

PowerPoint 2007 Folienmaster und Masterlayouts gestalten

Anbindung des Onyx Editors an das Lernmanagementsystem OLAT Anwendungsdokumentation

ALKIS - GEORG Synchronisierung. Beschreibung der Anbindung von GEORG an die Verfahrenslösung. DAVID-Expertenarbeitsplatz von IBR

Anforderungskatalog an ein CDMS aus Sicht der FG Datenmanagement und FG IT des KKS Netzwerks

1 WEB ANALYTICS: PROFESSIONELLE WEB-ANALYSEN UND REPORTING FÜR IHR ONLINE MARKETING.

Workflow Monitoring basierend auf den SemTalk Services. Semtation GmbH

Anleitung Administration Alterssiedlungen Basel. So aktualisieren Sie Ihre Daten. Version:

Planung für Organisation und Technik

1. Einführung. 2. Alternativen zu eigenen Auswertungen. 3. Erstellen eigener Tabellen-Auswertungen

Screening for Illustrator. Benutzerhandbuch

SEARCH DRIVEN APPLICATIONS MIT DEM CONTENT SEARCH WEBPART

Installation des edu- sharing Plug- Ins für Moodle

Leitfaden. zur Anerkennung von Prüfungen für das Studium Biomedical Engineering

Widerspruch zu Ihrer Rechnung Nr vom für Kundennr , Rufnr

Sage Start Zahlungsmethoden Anleitung. Ab Version

«Die praktische letzte Seite: Piktogramme» Mario Somazzi, Nr. 3/2013-2/2014, S. 40

SF-RB Die optimale und Preisgünstige CRM, Mid & Backofficelösung für Ihr Reisebüro. Unser Standort ist Ihr Preisvorteil!

Anbindung einer Gateprotect GPO 150

Anforderungen an ein Tool zur Erstellung von Forschungsdatenmanagementplänen. Jochen Klar

Umfrage. Didaktischer Kommentar. Lernplattform

Infoblatt Nr Zeugnisbearbeitung mit Arbeitszeugnis Assistent

Nach der Installation des FolderShare-Satellits wird Ihr persönliches FolderShare -Konto erstellt.

Installation SPSS Netzwerkversion (Windows)

White Paper - Umsatzsteuervoranmeldung Österreich ab 01/2012

Datenbank Sonderbauwerke / Erfolgskontrolle

EEI Label. 34 kwh/1000h. EU Verordnung 874/ DEUTSCH. This luminaire is sold with a bulb of the energy class: 874/2012

Datenbanken Microsoft Access 2010

1 Part-of-Speech Tagging

How-to: Webserver NAT. Securepoint Security System Version 2007nx

Microsoft Access 2010 Navigationsformular (Musterlösung)

Integration von in den Bestellprozess

Themen. Web Services und SOA. Stefan Szalowski Daten- und Online-Kommunikation Web Services

Module Entwicklung. Um diese Eigenschaft aufzurufen, starten Sie die Adami Vista CRM Applikation und wählen Sie den Entwicklung Menü.

C A L D E R A G R A P H I C S. Wie geht das? Einrichten automatischer Druckprozesse

INNER WHEEL DEUTSCHLAND

Kapitel 4. Einführung in den Scannergenerator Flex. Einführung in den Scannergenerator Flex Wintersemester 2008/09 1 / 9

Präsenz 30 Vor- und Nachbereitung 20,5 Projektarbeit 8 Prüfung 1,5 gesamt 60

DVB-S Empfangsgerät, Videorecorder und Fernseher (Fernseher mit zwei Scart- (oder HDMI-)Eingängen)

Errata-Liste zum Kurs: Einführung in XML (2. Auflage)

i Korrekturlauf mit Acrobat Reader - Correction workflow using Acrobat Reader i.1 Vorbereitung / Preparations

Installation der Demoversion vom M-Doc AutoSigner

Dokumentenverwaltung im Internet

Tipps & Tricks für ConAktiv-User

Sichere Anleitung Zertifikate / Schlüssel für Kunden der Sparkasse Germersheim-Kandel. Sichere . der

deep AG Comercialstrasse 19 CH-7000 Chur Fon Fax Mail Opera Mail

Leere Zeilen aus Excel-Dateien entfernen

In interdisziplinär ausgerichteten Lernmodulen können Sie sich intensiv mit der Gender- & Diversity- Thematik auseinandersetzen:

Aktions-Tool. Online-Verwaltung für Einrichtungen & Unternehmen. Online-Verwaltung für Einrichtungen & Unternehmen

CM Studio.DMS-SERVER 2012

Zitieren mit Write-N-Cite III (Anleitung für Windows)

Entwicklung der Abiturdurchschnittsnoten an den öffentlichen und privaten Gymnasien in Baden-Württemberg seit Allgemeinbildende Gymnasien

Fachliches Auswahlverfahren für Übersetzerinnen und Übersetzer

Inhaltsverzeichnis. Teill 17 Einleitung 18

Fähigkeiten des BizTalk Servers

Transkript:

WebApps - Einführung (Daten) Die Rätoromanische Chrestomathie Claes Neuefeind & Mihail Atanassov Sprachliche Informationsverarbeitung Universität zu Köln 27. Oktober 2015

Das Ra toromanische DRC/ARC/PG Verortung/Daten U berblick I I I Digitale Tiefenerschließung der RC (DRC) Annotiertes Korpus des Romanischen (ARC) Pledari Grond - Lexikographische Ressourcen (PG) Abbildung: Ra toromanische Chrestomathie (Octopus Verlag, Chur) Sprachliche Informationsverarbeitung - Universita t zu Ko ln

Das Rätoromanische Sprachgebiete der Schweiz Einordnung, Eigenschaften Kollaborativer Aufbau von Sprachressourcen DRC-Projekt (2009-2011) ARC-Projekt (2013-2015) Pledari Grond (seit 2013) Ressourcen, Tools, Daten

Sprachgebiete der Schweiz Das Rätoromanische Sprachgebiete der Schweiz Einordnung, Eigenschaften Kollaborativer Aufbau von Sprachressourcen DRC-Projekt (2009-2011) ARC-Projekt (2013-2015) Pledari Grond (seit 2013) Ressourcen, Tools, Daten

Sprachgebiete der Schweiz Die vier Landessprachen

Sprachgebiete der Schweiz Kanton Graubünden

Einordnung, Eigenschaften Das Rätoromanische Sprachgebiete der Schweiz Einordnung, Eigenschaften Kollaborativer Aufbau von Sprachressourcen DRC-Projekt (2009-2011) ARC-Projekt (2013-2015) Pledari Grond (seit 2013) Ressourcen, Tools, Daten

Einordnung, Eigenschaften Chronik 15 v. Chr. Eroberung durch die Römer, Gründung der Provinz Raetien 5.-6. Jhd. Zerfall des röm. Reichs, Ansiedlung von Alemannen (Raetien nun Teil von Franken) 843 Chur wird dem Erzbistum Mainz zugeordnet 13./14. Jhd. Ansiedlung deutschsprachiger Walser 16./17. Jhd. erste Verschriftlichung des Romanischen 1803 Beitritt des dreisprachigen Kantons Graubünden zur Eidgenossenschaft 1880/92 formelle Gewährleistung der Dreisprachigkeit

Einordnung, Eigenschaften Die romanischen Sprachen Europas

Einordnung, Eigenschaften Genealogie

Einordnung, Eigenschaften Questione Ladina

Einordnung, Eigenschaften Lautunterschiede der Idiome

DRC-Projekt (2009-2011) Das Rätoromanische Sprachgebiete der Schweiz Einordnung, Eigenschaften Kollaborativer Aufbau von Sprachressourcen DRC-Projekt (2009-2011) ARC-Projekt (2013-2015) Pledari Grond (seit 2013) Ressourcen, Tools, Daten

Das Ra toromanische DRC/ARC/PG Verortung/Daten DRC-Projekt (2009-2011) Decurtins und die Chrestomathie I Caspar Decurtins (1855-1916) I Erschienen 1888-1919 I Ca. 8000 Seiten aus 4 Jhd. I Hoher Variantenreichtum I Repra sentativ: Textsorten, Regionen, Zeiten I Nachdruck Octopus Verlag (1982-85) mit Register Sprachliche Informationsverarbeitung - Universita t zu Ko ln

DRC-Projekt (2009-2011) Portalseite: www.crestomazia.ch Digital images OCR Coll. correction Corrected text

DRC-Projekt (2009-2011) Architektur: Editing vs. Reading/Searching

DRC-Projekt (2009-2011) DRC-Editor

DRC-Projekt (2009-2011) Daten

DRC-Projekt (2009-2011) Ergebnisse Erstellung einer digitalen Version der RC Kollaboratives Tool für die Bearbeitung Open Access zu Daten & Werkzeugen

ARC-Projekt (2013-2015) Das Rätoromanische Sprachgebiete der Schweiz Einordnung, Eigenschaften Kollaborativer Aufbau von Sprachressourcen DRC-Projekt (2009-2011) ARC-Projekt (2013-2015) Pledari Grond (seit 2013) Ressourcen, Tools, Daten

ARC-Projekt (2013-2015) DRC ARC Projektziel: Workflow vom Digitalisat zum annotierten Korpus Aufgaben: Bestehende lexikalische Ressourcen erschließen Semi-automatische Annotation (POS) Digital images (text) OCR Coll. correction corrected text split Biblioteca Digitala Romansh Chrestomathy + other collections... Digital images (lex) OCR parse, transform & generate fullform lexdb annotate training sets coll. annotation: review/disambiguate Refactoring des Editors POS tagging anno'd text

ARC-Projekt (2013-2015) ARC - Editor: Korrektur, Annotation

ARC-Projekt (2013-2015) ARC - Statistik Idiom Tokens % Types Sursilvan 1,010,278 37.711 136,155 Puter 468,277 17.48 87,565 Vallader 378,936 14.145 71,820 Surmiran 250,156 9.338 48,393 Sutsilvan 101,424 3.786 24,072 Bivio 26,722 0.997 8,394 Val Müstair 140,039 5.227 33,122 Sutsettisch 12,199 0.455 3,714 Bühlers Koine 115,222 4.301 18,645 Latein 2,106 0.079 1,180 Deutsch 12,771 0.477 5,465 Bergagliot 59,384 2.217 15,393 Italiano 631 0.024 335 Andere 25,285 0.944 11,539 CLASSIFIED: 2,603,430 97.179 465,792 NOT CLASSIFIED: 75565 2.821 TOTAL: 2,527,865 368,746

Pledari Grond (seit 2013) Das Rätoromanische Sprachgebiete der Schweiz Einordnung, Eigenschaften Kollaborativer Aufbau von Sprachressourcen DRC-Projekt (2009-2011) ARC-Projekt (2013-2015) Pledari Grond (seit 2013) Ressourcen, Tools, Daten

Pledari Grond (seit 2013) Das Pledari Grond

Pledari Grond (seit 2013) Maalr - Architektur

Das Rätoromanische Sprachgebiete der Schweiz Einordnung, Eigenschaften Kollaborativer Aufbau von Sprachressourcen DRC-Projekt (2009-2011) ARC-Projekt (2013-2015) Pledari Grond (seit 2013) Ressourcen, Tools, Daten

Kontext: Sprachressourcen für das Romanische DRC Collaborative OCR correction Corrected Text ARC Collaborative annotation Annotated Text LexDB Biblioteca Digitala Read, search and Edit Text Other Applications, e.g. translation, shallow parsing, etc. Maalr Collaborative lexicon expansion Online Dictionaries Abbildung: Die DRC-Projektfamilie.

Beispiel: Suche als Service

drcwebapp: Erweiterungen, Services, Views Suche (KWIC, Filter, RegEx) Bilddateien Ling/NLP (z.b. Stemming, Kontexte) Frontend/Layout Statistiken (TTR, Häufigkeiten, Korrelationen) Wortwolken (keywords, wordle) Metadatenanreicherung, XML- bzw. TEI-Export Inhalte (Infoseiten/News... ) Datei-Upload (Digitalisate) OCR (Abbyy, Open Source) Anbindung PG: Übersetzungen, Vorschläge...

Grazia fitg! neuefeind@spinfo.uni-koeln.de matanass@uni-koeln.de www.crestomazia.ch www.biblioteca-digitala.ch www.pledarigrond.ch www.liarumantscha.ch https://github.com/spinfo/drcwebapp https://github.com/spinfo/drc https://github.com/spinfo/arc https://github.com/spinfo/maalr-core