Qualitätssicherung in kollaborativer Umgebung. Frank Wiegand, Deutsches Textarchiv http://www.deutschestextarchiv.de/dtaq



Ähnliche Dokumente
Hinweise zum Übungsblatt Formatierung von Text:

Dokumentation von Ük Modul 302

Mit suchmaschinenoptimierten Übersetzungen erfolgreich mit fremdsprachigen Webseiten

Da die Bedienung des Editors viele Möglichkeiten aufweist, aber auch etwas Übung voraussetzt, haben wir ihm ein eigenes Unterkapitel gewidmet.

Ohne Fehler geht es nicht Doch wie viele Fehler sind erlaubt?

Anmeldeverfahren. Inhalt. 1. Einleitung und Hinweise

SAMMEL DEINE IDENTITÄTEN::: NINA FRANK :: :: WINTERSEMESTER 08 09

Novell Client. Anleitung. zur Verfügung gestellt durch: ZID Dezentrale Systeme. Februar ZID Dezentrale Systeme

Online-Anzeigenbestellung

Grundbegriffe der Informatik

Meldung der Waffennummern (Waffenkennzeichen) nach der Feuerwaffenverordnung der EU

Meine erste Homepage - Beispiele

Anleitung für den Euroweb-Newsletter

Word Grundkurs 89

Monatstreff für Menschen ab 50 WORD 2007 / 2010

FIS: Projektdaten auf den Internetseiten ausgeben

PHP - Projekt Personalverwaltung. Erstellt von James Schüpbach

Errata-Liste zum Kurs: Einführung in XML (2. Auflage)

Primarschule Birmensdorf PIA Anleitungen Word. Bevor du mit Schreiben beginnen kannst, musst du dein Word- Dokument einrichten.

Kurzskript Literaturverzeichnis Microsoft Office Word 2010

KEIL software. Inhaltsverzeichnis UPDATE. 1. Wichtige Informationen 1.1. Welche Änderungen gibt es?

Dokumentation für die software für zahnärzte der procedia GmbH Onlinedokumentation

OECD Programme for International Student Assessment PISA Lösungen der Beispielaufgaben aus dem Mathematiktest. Deutschland

Matrix42. Use Case - Anlegen einer neuen Störung über den Service Catalog. Version März

Die Stadt-Bibliothek Mannheim in einfacher Sprache.

MEIN ONLINEBANKING BEI DER EHNINGER BANK EG ERSTE SCHRITTE: PIN/TAN MIT MOBILE TAN

Anleitung für die Registrierung und das Einstellen von Angeboten

Internationales Altkatholisches Laienforum

Nutzerverwaltung für Moodle über LDAP

CSS-Grundlagen. Etwas über Browser. Kapitel. Die Vorbereitung

Allgemeiner Leitfaden zum Einfügen suchmaschinenoptimierter Texte

Inhalt. Technische Beschreibung - MEDIA3000 NEWSLETTERMODUL-PRO

Barrierefreie Webseiten erstellen mit TYPO3

Hilfe zur Urlaubsplanung und Zeiterfassung

Welche Gedanken wir uns für die Erstellung einer Präsentation machen, sollen Ihnen die folgende Folien zeigen.

FH-SY Chapter Version 3 - FH-SY.NET - FAQ -

4. BEZIEHUNGEN ZWISCHEN TABELLEN

Dokumentation für die software für zahnärzte der procedia GmbH Onlinedokumentation

Kurzleitfaden für Schüler

Bilder im Drachenforum per Klicklösung veröffentlichen

Anlage eines neuen Geschäftsjahres in der Office Line

Was man mit dem Computer alles machen kann

"Ich habe als Vereinsverantwortlicher eine erhalten - was mache ich, um Torwurf.de für meinen Verein einzusetzen?"

FAQ. Hilfe und Antworten zu häufig gestellten Fragen

Registrierungsanleitung Informatik-Biber

Evident VDDS-Anbindung von MIZ

EAP. Employee Administration Platform

Blumen-bienen-Bären Academy. Kurzanleitung für Google Keyword Planer + Google Trends

Hilfedatei der Oden$-Börse Stand Juni 2014

Ablaufbeschreibung für das neu Aufsetzen von Firebird und Interbase Datenbanken mit der IBOConsole

Benutzeranleitung Service Desk Tool Erizone

Anleitung zum Upgrade auf SFirm 3.x + Datenübernahme. I. Vorbereitungen

Was ist PDF? Portable Document Format, von Adobe Systems entwickelt Multiplattformfähigkeit,

Kostenstellen verwalten. Tipps & Tricks

Aufruf der Buchungssystems über die Homepage des TC-Bamberg

robotron*e count robotron*e sales robotron*e collect Anmeldung Webkomponente Anwenderdokumentation Version: 2.0 Stand:

Qt-Projekte mit Visual Studio 2005

Anleitung über den Umgang mit Schildern

Anwenderdokumentation AccountPlus GWUPSTAT.EXE

SupplyWEB Supplier Training Registration

Mit der Maus im Menü links auf den Menüpunkt 'Seiten' gehen und auf 'Erstellen klicken.

Ändern eines Kontotyps

Sich einen eigenen Blog anzulegen, ist gar nicht so schwer. Es gibt verschiedene Anbieter. ist einer davon.

Google Analytics einrichten

Anleitung zur Daten zur Datensicherung und Datenrücksicherung. Datensicherung

Dokumentation für die software für zahnärzte der procedia GmbH Onlinedokumentation

Platinen mit dem HP CLJ 1600 direkt bedrucken ohne Tonertransferverfahren

Hosted Exchange. Konfigurationsanleitung Outlook 2007

Beispiel Shop-Eintrag Ladenlokal & Online-Shop im Verzeichnis 1

Menü auf zwei Module verteilt (Joomla 3.4.0)

Quickreferenz V1.1. Frank Naumann

NetStream Helpdesk-Online. Verwalten und erstellen Sie Ihre eigenen Tickets

Anleitung zum Upgrade auf SFirm Datenübernahme

Unter Social SEO versteht man die klassische Suchmaschinenoptimierung mit Hilfe von sozialen Netzwerken wie Google+, Facebook und Twitter.

Wasserzeichen mit Paint-Shop-Pro 9 (geht auch mit den anderen Versionen. Allerdings könnten die Bezeichnungen und Ansichten etwas anders sein)

Wie lege ich eine neue Standardseite an?

Für die Verwendung des Wikis wird dringend der Microsoft Internet Explorer Version 7.0 empfohlen!

Anleitung. Verschieben des alten -Postfachs (z.b. unter Thunderbird) in den neuen Open Xchange-Account

Contao Schulung. Martin Kozianka Donnerstag,

Updatehinweise für die Version forma 5.5.5

DER WEG ZUR VISITENKARTE IHRES VEREINS AUF

- Google als Suchmaschine richtig nutzen -

ARCO Software - Anleitung zur Umstellung der MWSt

Autoformat während der Eingabe

Leere Zeilen aus Excel-Dateien entfernen

Online-Anzeigenbestellung

Literaturverwaltung mit Stud.IP

1. Einführung. 2. Alternativen zu eigenen Auswertungen. 3. Erstellen eigener Tabellen-Auswertungen

Suche schlecht beschriftete Bilder mit Eigenen Abfragen

Anleitung: Einrichtung der Fritz!Box 7272 mit VoIP Telefonanschluss

Anleitung. Steigen Sie auf ein und klicken Sie auf "Anmeldung zum Projekt".

Installation und Dokumentation juris Smarttags 1.0

Erzherzog Johann Jahr 2009

AUF LETZTER SEITE DIESER ANLEITUNG!!!

Startseite: Die Seitenangaben im Text beziehen sich auf die Leitfaden für QM-Pilot.

Die Excel Schnittstelle - Pro Pack

Schreiben fürs Web. Miriam Leifeld und Laura Schröder Stabsstelle Kommunikation und Marketing. 4. Mai 2015

Hier erfahren Sie, wie Sie im E-Banking DTA-Dateien übermitteln können:

1. Adressen für den Serienversand (Briefe Katalogdruck Werbung/Anfrage ) auswählen. Die Auswahl kann gespeichert werden.

Transkript:

Qualitätssicherung in kollaborativer Umgebung Frank Wiegand, Deutsches Textarchiv http://www.deutschestextarchiv.de/dtaq

Warum Qualitätssicherung? Transkriptionsfehler, z. B. Unterbaltung Unterhaltung Annotationsfehler, z. B. <stage> fehlt bei Bühnenanweisung im Drama Druckfehler, z. B. Ich uud meine Hund Präsentationsfehler (XSLT, HTML, Javascript) Fehler im Workflow, z. B. falsch beschnittene Bilder Fehler in den Metadaten Fehler in den Tools: Maſchiene Maschiene Ma/GN#Schiene[_NN] Fluss in Vietnam/Laos

DTAQ Features Webbasiertes Framework/Annotationstool Textdigitalisate in seitenweiser Darstellung, verschiedene Ansichten Annotation fehlerhafter Passagen Korrekturlesen (verschiedene Arten) Ticketsystem (Datenbank, Accounts, Rollen) Statistiken, Analysen

Parallele Ansicht: Bild HTML (mit Tickets)

Parallele Ansicht: Bild XML

Ticket-Details (Transkriptionsfehler)

Fehler in Tools Normalisierte Orthographie Beispiel: Leyden falsch erkannt als die Stadt in Holland einfache Transliteration (e.g. ſ s) unbekannte Form Canitz, Friedrich Rudolph Ludwig von: Neben-Stunden Unterschiedener Gedichte. Berlin, 1700, S. 18. www.deutschestextarchiv.de/canitz_gedichte_1700/18 Ausnahmelexikon magische Konversion

DTAQ Noch mehr Features Integrierte Suchmaschinen (DDC, egrep) Unicode-Tools Bildbearbeitung Integrierter Formeleditor (TeX-Syntax) Ausführliche Dokumentation

DTAQ Stand Oktober 2013 Im Einsatz seit Juni 2011 1 631 Werke, 466 393 Seiten, 761 Mio. Zeichen ca. 59 900 Tickets angelegt (ca. 50 900 gelöst) ca. 30 000 Seiten Korrektur gelesen ca. 300 aktive Nutzer (Expertisen: Griechisch, Hebräisch, mathematische/chemische Formeln, Sprachgeschichte etc.) DTAQ ist nach Anmeldung frei zugänglich: http://www.deutschestextarchiv.de/dtaq

Features in Arbeit Integrierter Text- bzw. XML-Editor NE-Erkenner (für Eigennamen) Mehr Suchmöglichkeiten: fremdsprachliches Material, unleserliche Stellen, niedrigfrequente Buchstaben-N-Gramme etc. Dokumentenimport: via Upload aus externen Quellen (Wikisource, Gutenberg*, )

DTAQ nutzt Open Source

Arbeiten mit DTAQ http://commons.wikimedia.org/wiki/file:question_book.svg

Voraussetzungen Technisch: Mind. Chrome 15, Firefox 7 oder Opera 11.50 Schriftarten (GNU Freefonts, Junicode ) Mind. 1400 px Bildschirmbreite sind optimal Inhaltlich Kenntnisse über: Richtlinien zur Texterfassung DTA-Basisformat Korrekturfibel Neuigkeiten

Terminologie Ticket: Fehler, Anmerkung CAB-Ansicht: normalisierte Orthographie TEI: Text Encoding Initiative (XML-Dialekt) DDC/OpenSearch: linguistische Suchmaschine Indexbau aller 7 Tage mächtig (Flexionen, Transliterierung etc.) keine Probleme mit Silbentrennung eigene Syntax

Terminologie (2) grep: herkömmliche Suchmaschine immer aktuell mächtig (Zeilenanfang etc.), aber langsam Silbentrennung nicht aufgehoben reguläre Ausdrücke

Fehlerarten Kritische Fehler: Transkriptionsfehler Auszeichnungsfehler (XML) Fehler in Metadaten/Workflow/Tools Dokumentation schafft Mehrwert im DTAKorpus: Druck-/Schreibfehler (alle Arten) Speziell: Darstellungsfehler (HTML)

Transkriptionsfehler Zeichen sind falsch oder fälschlich nicht aus der Vorlage übernommen gilt auch für graphische Objekte (Linien, Abbildungen, Formeln, Tabellen) Referenzdokumentation: Richtlinien zur Texterfassung (www.deutschestextarchiv.de/doku/richtlinien)

Häufige Transkriptionsfehler langes ſ f I l 1 (i. e. L i eins) in Fraktur: c e, k t, p v, r x B V, C E, M W, R K/N in Antiqua: e o, 0 O (i. e. null Oh) Haaf, Wiegand, Geyken (jtei 4, 2013)

Auszeichnungsarten (1) Zwei Arten von Tagging: 1. Semantik; 2. Typographie Semantik (Bedeutung): Wörter/Phrasen: date, q, quote, role, speaker etc. Textpassagen: argument, cit, closer, l, lb, lg, sp, p etc. Dokumentstruktur: back, body, div, front, pb, titlepage etc.

Auszeichnungsarten (2) Typographie (Aussehen): Zeichen-/Wortebene: fett, kursiv, gesperrt, Fraktur-/Antiquawechsel, unterstrichen etc. Blockebene: zentriert, eingerückt, rechtsbündig etc. wird nur dann ausgezeichnet, wenn vom Kontext abgehoben

Beispiel Auszeichnungsfehler <stage> innerhalb von <sp> <sp who="#rued"> <p> [ ] hier und acht<lb/> und vierzig Stunden! </p><lb/> <stage>(pauſe.)</stage><lb/> </sp> <sp who="#rued"> <p> [ ] hier und acht<lb/> und vierzig Stunden! </p><lb/> </sp> <stage>(pauſe.)</stage><lb/>

Fehler im Workflow kaputte Bilddigitalisate (falsche Beschneidung etc.) Zeichenersetzung (e über Vokal, ſ/ß-handling etc.) Achtung: Immer die evtl. schon vorhandenen Tickets ganzes Buch beachten!

Druck-/Schreibfehler müssen nicht zwingend gemeldet werden, sind aber nützlich eindeutige Fehler: Abteilnng Abteilung zweifelhafte Fehler: Hofnung Hoffnung Suchmaschinen nutzen! historische Schreibweisen berücksichtigen: Abtheilung Abteilung kein Fehler!

Darstellungsfehler automagische Darstellung: Absätze, zentrierte Überschriften, Abbildungen, Formeln (bedingt) Fuß-/Endnotenzeichen, Linien durch Hervorhebungen gekennzeichnet: Sprecher, Zitate, Frakturwechsel etc. nähere Beschreibung in der Korrekturfibel (www.deutschestextarchiv.de/doku/korrekturfibel) Achtung: kein Tagging keine Darstellung

DTAQ Oberfläche

DTAQ Oberfläche offene Tickets: 35 (2 ganzes Buch) Stand: Thu Feb 28 10:33:09 2013 offene Tickets: 35 (2 ganzes Buch) Stand: Thu Feb 28 10:33:09 2013 Transkriptionsquellen: - CN (China) - MTS (Muttersprachler) - OCR = OCR + MTS CN/MTS/OCR = DTA-Kernkorpus - DTAE, Wikisource, AEDit etc.

DTAQ Oberfläche offene Tickets: 35 (2 ganzes Buch) Stand: Thu Feb 28 10:33:09 2013

DTAQ Oberfläche HTML XML Text CAB POS ( Editor)

Transkriptionsfehler melden Wort mit Maus markieren, mind. 4 Zeichen Markierung möglichst nicht über Zeilengrenzen hinaus Im Feld Zusammenfassung : vollständige korrekte Form eintragen Dccorationsmalerei Decorationsmalerei ganze Gedanken - Reyhe knupft ſich feinem Ton bilden! Da, wo dieſer Ich nnd mein Hund. viele Herzeus- brecher wollen das Gedanken-Reyhe bilden! Da und mein Herzens-

Neues Ticket anlegen Transkriptionsfehler: im Feld Zusammenfassung die komplett richtige Form Fundstelle nicht vergessen

Korrekturstatūs Textkontrolle Text-/Bild-Kontrolle Textkontrolle: Text lesen, Ungereimtheiten mit Vorlage abgleichen, Druckfehler finden Text-/Bild-Kontrolle: Abgleich mit Vorlage Wort für Wort auf der Suche nach Abweichungen

Richtiges Korrekturlesen Vorbereitung: Korrekturfibel lesen Textgröße und Textfeldgröße optimal einstellen Welche Fehler gibt es schon? (besonders: Fehler ganzes Buch) Wer hat schon Korrektur gelesen? Passagen in fremden Skripten (Griechisch etc.) Seite gleich überspringen, außer: Experte; alternativ Ticket mit Typ Anderes anlegen Rechtzeitig pausieren nicht vergessen!

CAB-Ansicht (Normalisierung) CAB-Ansicht immer nutzen Alles, was bunt ist Änderungen gegenüber der Transkription Vorsicht v. a. bei orange, lila und rot Hilft nicht immer: gereiſt gereist oder gereift Ausfegung Auslegung CAB macht auch Fehler

Tipps & Tricks Einmal falsch öfter falsch Korpus-Suchfunktionen (DDC, grep) nutzen und ähnliche Fehler gleich melden Tastaturkürzel nutzen Bei Fragen: andere Nutzer oder das DTA kontaktieren Ziel: Aufbau einer FAQ Feedback geben (Featurewünsche etc.)

http://www.deutschestextarchiv.de/dtaq wiegand@bbaw.de