How to: Importieren einer Texttranskription

Ähnliche Dokumente
Diese Ansicht erhalten Sie nach der erfolgreichen Anmeldung bei Wordpress.

Carolo Knowledge Base

Import des persönlichen Zertifikats in Outlook 2003

Import des persönlichen Zertifikats in Outlook Express

ARAkoll 2013 Dokumentation. Datum:

Die Beschreibung bezieht sich auf die Version Dreamweaver 4.0. In der Version MX ist die Sitedefinition leicht geändert worden.

ACDSee Pro 2. ACDSee Pro 2 Tutorials: Übertragung von Fotos (+ Datenbank) auf einen anderen Computer. Über Metadaten und die Datenbank

1 Einleitung. Lernziele. Symbolleiste für den Schnellzugriff anpassen. Notizenseiten drucken. eine Präsentation abwärtskompatibel speichern

Mit der Maus im Menü links auf den Menüpunkt 'Seiten' gehen und auf 'Erstellen klicken.

Kursangebot gesammelt einlesen

HTML5. Wie funktioniert HTML5? Tags: Attribute:

Stellen Sie bitte den Cursor in die Spalte B2 und rufen die Funktion Sverweis auf. Es öffnet sich folgendes Dialogfenster

Novell Client. Anleitung. zur Verfügung gestellt durch: ZID Dezentrale Systeme. Februar ZID Dezentrale Systeme

Benutzerhandbuch. Leitfaden zur Benutzung der Anwendung für sicheren Dateitransfer.

AUTOMATISCHE -ARCHIVIERUNG. 10/07/28 BMD Systemhaus GmbH, Steyr Vervielfältigung bedarf der ausdrücklichen Genehmigung durch BMD!

Anleitung Abwesenheitsmeldung und -Weiterleitung (Kundencenter)

Es gibt situationsabhängig verschiedene Varianten zum Speichern der Dokumente. Word bietet im Menü DATEI unterschiedliche Optionen an.

Ein Tool zum Konvertieren von Pegasus Mail Adressbüchern und Verteilerlisten in Novell Groupwise Adressbücher.

Ihr CMS für die eigene Facebook Page - 1

Elexis-BlueEvidence-Connector

Handbuch ECDL 2003 Basic Modul 3: Textverarbeitung Dokument bearbeiten und speichern

Handbuch Fischertechnik-Einzelteiltabelle V3.7.3

Übung - Datensicherung und Wiederherstellung in Windows Vista

teischl.com Software Design & Services e.u. office@teischl.com

Anwendungsbeispiele Buchhaltung

Dokumentation für die software für zahnärzte der procedia GmbH Onlinedokumentation

Folgeanleitung für Fachlehrer

Folgeanleitung für Klassenlehrer

Flyer, Sharepics usw. mit LibreOffice oder OpenOffice erstellen

Einrichten eines Postfachs mit Outlook Express / Outlook bis Version 2000

ecall sms & fax-portal

Installieren von Microsoft Office Version 2.1

12. Dokumente Speichern und Drucken

Kurzanleitung. Toolbox. T_xls_Import

Mallux.de CSV-Import Schnittstellen von Mallux.de. Beschreibung für den Import von CSV-Dateien. Stand: 01. Januar von Mallux.

Zwischenablage (Bilder, Texte,...)

Kurzeinführung Excel2App. Version 1.0.0

Übung - Datensicherung und Wiederherstellung in Windows 7

OUTLOOK-DATEN SICHERN

TECHNISCHE INFORMATION LESSOR LOHN/GEHALT BEITRAGSNACHWEIS-AUSGLEICH BUCH.-BLATT MICROSOFT DYNAMICS NAV

Der vorliegende Konverter unterstützt Sie bei der Konvertierung der Datensätze zu IBAN und BIC.

teamsync Kurzanleitung

Einstieg in Exact Online Buchungen erfassen. Stand 05/2014

Matrix42. Use Case - Sicherung und Rücksicherung persönlicher Einstellungen über Personal Backup. Version September

Export des MS Outlook-Adressbuches und Import in das Adressverzeichnis der TOSHIBA e-bridge-modelle

Bauteilattribute als Sachdaten anzeigen

Ihre Interessentendatensätze bei inobroker. 1. Interessentendatensätze

Anleitung für den Datenaustausch mit mobile.de

Microsoft Access 2013 Navigationsformular (Musterlösung)

Benutzer-Handbuch. Import / Export von Adressen

YouTube: Video-Untertitel übersetzen

Wollen Sie einen mühelosen Direkteinstieg zum Online Shop der ÖAG? Sie sind nur einen Klick davon entfernt!

ACDSee 2009 Tutorials: Importien von Fotos mit dem Fenster "Importieren von"

Sichern der persönlichen Daten auf einem Windows Computer

Web-Kürzel. Krishna Tateneni Yves Arrouye Deutsche Übersetzung: Stefan Winter

Einrichten einer Festplatte mit FDISK unter Windows 95/98/98SE/Me

ACDSee Pro 3-Tutorials: Fotos (+ Datenbank) auf einen anderen Computer bringen

ANLEITUNG ZUR TEXTGESTALTUNG IN WORD 2003

Import des persönlichen Zertifikats in Outlook2007

Suche schlecht beschriftete Bilder mit Eigenen Abfragen

Anleitung zum Login. über die Mediteam- Homepage und zur Pflege von Praxisnachrichten

Memeo Instant Backup Kurzleitfaden. Schritt 1: Richten Sie Ihr kostenloses Memeo-Konto ein

Simple SMS SMS Gateway

Dieser Ablauf soll eine Hilfe für die tägliche Arbeit mit der SMS Bestätigung im Millennium darstellen.

Im Folgenden wird Ihnen an einem Beispiel erklärt, wie Sie Excel-Anlagen und Excel-Vorlagen erstellen können.

Handbuch für Redakteure

Tutorial: Entlohnungsberechnung erstellen mit LibreOffice Calc 3.5

Artikel Schnittstelle über CSV

Handbuch zur Anlage von Turnieren auf der NÖEV-Homepage

Anleitung zum LPI ATP Portal

MPDS4 MODELLE IMPORTIEREN

IDEP / KN8 für WINDOWS. Schnellstart

Anleitung Lernobjekt-Depot (LOD)

Inhalt. Allgemeine Einführung. Argumentationsvermögen. Räumliches Vorstellungsvermögen. Begabungen und Fähigkeiten messen

Einkaufslisten verwalten. Tipps & Tricks

Adobe Photoshop CS2, CS3, CS4, CS5 mit Auto-SoftProof-Ansicht

Titel. SCSM ITIL - CMDB - neue CI Klasse erstellen und benutzen. Eine beispielhafte Installationsanleitung zur Verwendung im Testlab

Einstellungen im Internet-Explorer (IE) (Stand 11/2013) für die Arbeit mit IOS2000 und DIALOG

GalBIB. TSB - Titelstamm Bibliographie. Mit dieser Erweiterung können:

FORUM HANDREICHUNG (STAND: AUGUST 2013)

Kommunikations-Management

GRAF-SYTECO. Handbuch. Zeichensatzgenerator für AT-Geräte. Erstellt: November SYsteme TEchnischer COmmunikation

Wie Sie mit Mastern arbeiten

Handbuch zum Excel Formular Editor

Um ein solches Dokument zu erzeugen, muss eine Serienbriefvorlage in Word erstellt werden, das auf die von BüroWARE erstellte Datei zugreift.

1. Software installieren 2. Software starten. Hilfe zum Arbeiten mit der DÖHNERT FOTOBUCH Software

Karten-Freischaltung mit dem UNLOCK MANAGER

Import und Export von Übergängern

Downloadfehler in DEHSt-VPSMail. Workaround zum Umgang mit einem Downloadfehler

Typo3 - Inhalte. 1. Gestaltung des Inhaltsbereichs. 2. Seitenunterteilung einfügen

Kurzanleitung fu r Clubbeauftragte zur Pflege der Mitgliederdaten im Mitgliederbereich

Hinweise zum neuen Buchungssystem

Second Steps in eport 2.0 So ordern Sie Credits und Berichte

Erstellen eines Screenshot

Schriftarten-Verwaltung. Craig Drummond Übersetzung: Stephan Johach

ipin CSV-Datenimport (Mac OS X)

Serien- mit oder ohne Anhang

Einrichtung -Account

Transkript:

How to: Importieren einer Texttranskription Dieses Dokument erklärt, wie Transkriptionen der gesprochener Sprache, die mithilfe eines Texteditors oder Textverarbeitungsprogramms erstellt wurden, in den Partitur-Editor (als "Simple EXMARaLDA" Format) importiert werden. Simple EXMARaLDA ist ein Format für einfache Textdateien, das auch einige grundlegende Annotationen, nicht-verbale Phänomene sowie Überlappungen verarbeiten kann. Vor dem Lesen dieser Anleitung wird empfohlen, folgendes Dokument zu lesen: Inhalt - Understanding the basics of EXMARaLDA A. Vorbereitung der Datei für den Import... 2 1. Struktur und Informationen der Quelldatei... 2 2. Das Simple EXMARaLDA Format... 3 3. Konvertierung von Dateien in das Simple EXMARaLDA Format... 4 4. Nur-Text (Plain text)... 4 5. Hinzufügen von Spuren... 4 B. Importieren der Datei in den Partitur-Editor... 5 1. Nachbearbeitung (Post-Editing)... 6 2. Metadata... 7 1

A. Vorbereitung der Datei für den Import 1. Struktur und Informationen der Quelldatei Der wohl einfachste Weg, eine Simple EXMARaLDA Datei zu erstellen, ist die unten beschriebenen Konventionen von Anfang an zu verwenden. Wenn Sie sich jedoch bereits für EXMARaLDA entschieden haben, wollen Sie sicherlich die Transkripte direkt in den Partitur-Editor eingeben. Das Simple EXMARaLDA Format ist im Normalfall die beste Lösung, um verschiedene Altdaten zu konvertieren. Je nach Gestaltung der Transkription und den darin verwendeten Konventionen, ist die Konvertierung in das Simple EXMARaLDA Format eine mehr oder weniger einfache Aufgabe. Als erstes muss festgestellt werden welche Art Markup verwendet wurde, um verschiedene Informationen in der transkribierten Kommunikation zu beschreiben. Eine vollautomatische Konvertierung des Transkriptionsformats in das Simple EXMARaLDA Format ist nur dann möglich, wenn das Layout und/oder Markup auf eine konsistente Weise verwendet wurde - sodass unterschiedliche Informationen, die verschieden kodiert sind, ohne menschliche Interpretation entschlüsselt werden können. Gegebenenfalls muss, um festzustellen ob irgendwelche mehrdeutigen Annotationen oder Markups manuell angepasst werden müssen, im Transkriptionsschlüssel nachgesehen werden. In diesem kurzen Transkript ist das einzige verwendete Markup die Unterstreichung, die die überlappende Rede markiert. Vor dem eigentlichen Beginn der Transkription gibt es im gleichen Dokument Metadaten über das kommunikative Ereignis und die beiden teilnehmenden Sprecher. Das Simple EXMARaLDA Format kann nur die Transkription verarbeiten. Wenn eine Einleitung mit z.b. Metadaten zur Kommunikation und Sprechern entfernt wird, sollte man daran denken, eine Kopie der Transkription mit den jeweiligen Metadaten zu speichern. Die EXMARaLDA-Transkriptionsformate umfassen auch Strukturen für Metadaten, mit denen z.b. die in der Kommunikation verwendeten Sprachen, Orte oder die L1 und L2 der einzelnen Sprecher verschlüsselt werden können. Wenn diese Information im Partitur-Editor korrekt 2

eingegeben wird, kann sie auch verwendet werden, um z.b. ein Korpus zu filtern, ein Subkorpus im Corpus Manager zu erstellen oder um Korpusabfragen und Analysen in EXAKT durchzuführen. 2. Das Simple EXMARaLDA Format Eine Simple EXMARaLDA Datei ist eine Textdatei, die den unten beschriebenen Simple EXMARaLDA Konventionen entspricht. Jede Zeile beginnt mit einem individuellen Sprecherkürzel, gefolgt von einem Doppelpunkt und einer Leertaste. Dabei ist zu beachten, dass hierbei die Groß-/Kleinschreibung unterschieden wird, z.b.. Tom und TOM werden als zwei unterschiedliche Sprecher behandelt. In dieser Beispiel-Transkription gibt es zwei Sprecher: TOM: TIM: Da jede Zeile genau einem separaten Ereignis in der EXMARaLDA-Datei entspricht, ist es nützlich, jede Äußerung in eine separate Zeile zu setzen. Da jedoch die Basis-Transkription aus der Simple EXMARaLDA Datei erstellt wird, findet keine tatsächliche Segmentierung 1 statt. Jede Zeile muss mit einem Zeilenumbruch enden, zusätzliche leere Zeilen, z.b. mit mehr als einem Zeilenumbruch, sind erlaubt. TOM: Hello, Tim! TIM: Hello, Tom. Der Text in eckigen Klammern vor dem Text wird als paralleles Ereignis (mit korrespondierenden Start- und Endpunkten) in die Kommentarspur eingefügt. Dieses eignet sich für nonverbales Verhalten, wie in diesem Beispiel, wo beide Sprecher winken während sie einander grüßen.. TOM: [waving] Hello, Tim! TIM: [waving] Hello, Tom. Der Text in geschweiften Klammern nach dem Text wird als paralleles Ereignis (mit korrespondierenden Start- und Endpunkten) in die Annotationsspur eingefügt. Dies ist für andere Arten von Informationen, wie z.b. Übersetzung, geeignet. Bitte beachten Sie, dass es nur möglich ist den Text in einer Zeile als Ganzes zu annotieren, sodass in diesem Beispiel das Winken von Anfang bis Ende der Äußerungen stattfindet und keine Wort-für-Wort Übersetzung vorliegt, obwohl die Wörter in diesem konkreten Fall übereinstimmen. TOM: [waving] Hello, Tim! {Salut, Tim!} TIM: [waving] Hello, Tom. {Salut, Tom!} Überlappende Rede ist durch spitze Klammern markiert. Die Kennziffer (vorzugsweise eine Zahl) zwischen den beiden schließenden Klammern muss für jede Überlappung einzigartig sein, d.h. sie kann nur in jedem der überlappenden Teile verwendet werden, um anzuzeigen, dass sie einander überlappen. 1 Wenn Sie eine Segmentation der Transkription benötigen, müssen Sie die EXMARaLDA Segmentationsfunktion anwenden. Näheres dazu gibt es in der Anleitung How to use segmentation. 3

TOM: [waving] Hello, <Tim!>1> {Salut, Tim!} TIM: [waving] <Hello,>1> Tom. {Salut, Tom!} Da die eckigen, geschweiften und spitzen Klammern Bedeutung im Simple EXMARaLDA Format haben, können sie in der Transkription ausschließlich mit dieser Bedeutung auftreten. 3. Konvertierung von Dateien in das Simple EXMARaLDA Format Da die Konvertierung in das Simple EXMARaLDA Format von dem ursprünglichen Dateiformat und den Transkriptionskonventionen abhängt, kann die Transformation von Transkriptionsdateien in das Simple EXMARaLDA Format nicht im Allgemeinen beschrieben werden. Obwohl die Konvertierung vorzugsweise automatisch erfolgen sollte, ist jede solche automatische Konvertierung von Transkriptionen immer ein wenig riskant. Selbst wenn die Konvertierungsschritte als fehlerfrei im Hinblick auf die Transkriptionskonventionen erscheinen, kann es sein, dass die Richtigkeit der mit einem Texteditor oder Textverarbeitungsprogramm erstellten Datei noch nicht geprüft wurde. Dies kann zur Folge haben, dass es Fehler in der Transkription gibt, die wiederum die Inhalte der konvertierten Datei ändern. Nachbearbeitung kann einige von diesen Problemen lösen. Für komplexe Transkriptionsformate von unbekannter Qualität kann der Aufwand der notwendigen Nachbearbeitung, um die konvertierten Dateien in Bezug auf Fehler in der ursprünglichen Datei zu korrigieren, zu hoch sein oder auch angesichts des hohem Zeitaufwands für das Definieren vom Konvertierungsprozess eines komplexen Dateiformates. In diesen Fällen kann es besser sein, sich nur auf einige Teile der Formate zu konzentrieren und z.b. die meisten Annotationen manuell einzutragen. 4. Nur-Text (Plain text) Da der Partitur-Editor Input-Dateien im Nur-Text ("Plain Text", Suffix.txt) Format erfordert und nicht etwa Word, PDF o.ä., muss diese Datei im.txt Format im Laufe des Konvertierungsprozesses gespeichert werden. Wurden bislang bestimmte Formatierungen (z.b. fett oder kursiv markierte Textstellen) als Markup und/oder für Annotationen oder Sprecher-Kennzeichnung (z.b. Tims Äußerungen in blauer, Toms in gelber Farbe) verwendet, so müssen diese mit dem entsprechenden Simple EXMARaLDA Markup oder zumindest alle Stellen mit einem Nur-Text (Plain Text) Markup, noch vor der Konvertierung ersetzt werden. Microsoft Word und OpenOffice verfügen über eine Option zu regulären Ausdrücken (in der Suchen und Ersetzen Funktion), die Suchen und Ersetzen von Formatierung sowie Verwenden von gefundenen Ausdrücken als Teil des zu ersetzenden Ausdrucks (z.b. hinzufügen von Start-und End-Tags) ermöglicht. 5. Hinzufügen von Spuren Da sich die Annotation in den geschweiften Klammern immer auf den gesamten Text in der gleichen Zeile bezieht, kann es besser sein, die Transkription anhand von existierenden Annotationen zu splitten um umfangreiche Nachbearbeitung zu vermeiden. Im Beispiel unten wurde Toms Äußerung auf drei Zeilen verteilt, um eine Annotation für die zwei Wörter "See you" zu erstellen. 4

Ein weiteres wichtiges Detail ist, dass nur die Annotation in den geschweiften Klammern am Ende eine Annotationsspur ergibt, wobei der Text in eckigen Klammern in eine Kommentarspur mit Typen-Bezeichnung umgewandelt wird. Das Format kann auch auf andere Weise als beabsichtigt verwendet werden, dabei sollten jedoch mögliche Konsequenzen beachtet werden. Beispielsweise müssen nach dem Import, da die Informationen in den Kommentarspuren anders als Annotationen mit EXMARaLDA - Werkzeugen behandelt werden, zunächst die Spurtypen geändert werden (Punkt Tier Properties im Menü Tier), um die Werkzeuge wie beabsichtigt benutzen zu können wenn zusätzliche Annotationen auf diese Weise hinzugefügt werden sollen. B. Importieren der Datei in den Partitur-Editor Der Import des Textes in den Partitur-Editor erfolgt über den Punkt Import aus dem Datei Menü. Suchen Sie zuerst die Datei, die Sie importieren möchten. Stellen Sie dann sicher, dass Sie den richtigen Filter ausgewählt haben, z.b. für den Dateityp Simple EXMARaLDA file (*.txt) und die entsprechende Char encoding, zum Beispiel die gleiche Zeichenkodierung wie in der Textdatei. Wenn Sie nicht wissen, welche Zeichenkodierung verwendet wurde, versuchen Sie es zuerst mit der Default- Auswahl (system-default): Wenn die ausgewählte Zeichenkodierung nicht mit der Ihrer Datei übereinstimmt, können die Sonderzeichen nach dem Import nicht mehr richtig angezeigt werden. Sollte dies geschehen, versuchen Sie Ihre Textdatei mit einer anderen Zeichenkodierung zu speichern, z.b. UTF-8. Dies kann z.b. durch Auswählen von Speichern unter... im Notepad (Betriebssystem Windows) und dann durch Spezifizierung der Zeichenkodierung gemacht werden. Versuchen Sie dann die Datei erneut mit der gewählten Zeichenkodierung zu importieren. 5

Als nächstes speichern Sie die Transkription im.exb Format (EXMARaDLA Basis- Transkription) bevor Sie mit der Eingabe von Metadaten oder Editieren der Transkription starten. Sollte die Datei noch nicht in Ordnung sein, erscheint eine Fehlermeldung mit drei Zeilen, die bei der Korrektur des Fehlers hilft. Die erste Zeile enthält die Zeilennummer, in der der (erste) Fehler aufgetreten ist, die zweite Zeile sagt etwas über den Fehlertyp aus, z.b. "no speaker separator", also der das Sprecherkürzel vom Text trennende Doppelpunkt fehlt; und die dritte ist die fehlerhafte Zeile selbst in der Sie den Fehler sehen können. Achten Sie darauf, dass die Datei dem Simple EXMARaLDA Format und den oben beschriebenen Konventionen entspricht und versuchen Sie dann, die Datei erneut zu importieren. 1. Nachbearbeitung (Post-Editing) Wenn Sie Annotations- und Kommentarspuren für Annotationen verwendet haben, müssen Sie den Spur-Typ von (D)escription in (A)nnotation ändern. Wenn Sie verschiedene Arten von Informationen in eine Annotationsspur gesetzt haben und jetzt einige von ihnen in eine andere Spur bewegen wollen, z.b. um eine Spur für Kommentare zur Aussprache und eine Spur für weitere Kommentare zu haben, können Sie beim Hinzufügen von weiteren Annotationsspuren die Option Ereignisse kopieren aus mit dem aktivierten Kontrollkästchen Copy text benutzen - dabei werden die Ereignisgrenzen samt Inhalte aus der ersten Spur in die nächste übertragen. 6

2. Metadata Bitte vergessen Sie nicht alle Metadaten zu der Kommunikation (Transkription > Meta- Information ) und den Sprechern hinzuzufügen (Transkription > Sprechertabelle )! Metadaten aus der ursprünglichen Transkription werden als Attribut-Wert- Paare zur EXMARaLDA Transkription hinzugefügt. Metadaten zu den Sprechern werden separat in die Sprechertabelle eingetragen. 7