Ausgewählte Techniken der Maschinellen Übersetzung Susanne J. Jekat ZHW E-mail: jes@zhwin.ch, Subject: MTZH
Übersicht Themenbereiche: 1. Erstellung und Standardisierung von Ressourcen für die Maschinelle Übersetzung 2. Grammatikformalismen für die Maschinelle Übersetzung 3. Maschinelles Dolmetschen 4. Computergestützte Übersetzung 5. Evaluation von Systemen zur Maschinellen Übersetzung
Thema 4: Computergestützte Übersetzung (Computer-Aided Translation, CAT) Wissensgebiete zu Thema 4: a) Maschinelles Übersetzen b) Translationswissenschaft? (eher Probleme der Translation) c) CAT ( auch Translation Memories, wenn auf Alignments zugegriffen werden kann) d) Mensch-Maschine Schnittstelle e) Alignment (praktische Umsetzung) f) Beispielbasierte Übersetzung g) Lokalisierung
Thema 4: CAT Übersicht Thema 4: 1. Einführung (s. CAT1EF.pdf) 2. Kurzcharakteristik der Systeme (Teil 1) 3. Kurzcharakteristik der Systeme (Teil 2) 4. Lokalisierung 5. Demos, praktische Übungen
Die CAT-Arbeitsumgebung des Übersetzers Alignierung Terminologie Übersetzungsbeispiele (Alignments) Textverarbeitung Datenbankmanagement
Praktischer Test: Deutsch-finnische Übersetzung in der Trados- Umgebung (die finnisch-deutschen Beispielsätze stammen aus Rutishauser 2004)
Arbeitsschritte 1. Einrichten eines Alignment-Projektes 2. Einlesen der Dateien in das Alignment- Tool
3. Alignierung und überprüfen der Alignierung Arbeitsschritte
Veränderung der Alignierungs-Ergebnisse durch Preediting: 1. Nicht-editierte Texte
Veränderung der Alignierungs-Ergebnisse durch Preediting: 2. Editierte Texte
4. Export der Alignierung Arbeitsschritte
Arbeitsschritte 5. Einrichten der Übersetzerarbeitsumgebung (Zugriff auf die Datenbasen) 6. Import der Daten 7. Verbindung der Textverarbeitung (hier Word [sic]) mit den Datenbasen
Arbeitsschritte
Arbeitsschritte Kein Match bei minimaler Matchwert 65% und Input: Das Auto ist auf
Offene Fragen Wie wird die Übersetzerarbeit durch CAT- Software verändert? Wie kann CAT-Software verglichen und evaluiert werden? Welche Entwicklungen im Bereich CAT- Software sind möglich und/oder wünschenswert?
Die folgende Darstellung wurde aus Badras 2003 zusammengestellt, an dieser Stelle herzlichen Dank an Catherine Badras für die Bereitstellung ihrer Folien. Lokalisierung Ausgangstexte für die Lokalisierung sind technische Dokumentationen, die bestimmten (rechtlichen etc.) Bedingungen unterliegen mit Redaktionssystemen erstellt und damit mit CAT-Umgebungen kombiniert werden können evtl. im Hinblick auf die Lokalisierung (Maschinelle Übersetzbarkeit) erstellt werden (kontrollierte Sprache)
Lokalisierung "If I'm selling to you, I speak your language. If I'm buying, dann müssen Sie Deutsch sprechen." Willy Brandt
Lokalisierung Definitionen: Oberflächenlokalisierung ("general localization"): Beschränkt sich auf Anpassungen wie den Sprachtransfer, die Umrechnung von Währungsangaben und Masseinheiten, die Anpassung von Datums- und Zeitangaben usw. Tiefenlokalisierung ("radical localization"): Berücksichtigt auch kulturelle Unterschiede in Bezug auf Denkmuster, Lernmethoden, Verhandlungsstrategien, sowie kulturell bedingte unterschiedliche Erwartungshaltungen
Der Faktor Kultur in der Lokalisierung Eisberg-Modell Oberfläche Unausgesprochene Regeln Unbewusste Regeln Charakteristik der Kultur: klar, erkennbar. Beispiel: Sprache, Zeit, Datum Charakteristik der Kultur: uns unbekannte Regeln, die aber im Situationskontext erkannt und studiert werden können. Beispiel: Geschäftsverhalten Charakteristik der Kultur liegt ausserhalb des Bewusstseins. Schwer zu erkennen. Beispiele: Unbewusste Anschauungen, Glaubenssätze, Wahrnehmungen
Analyse von Kultur z.b. nach dem Kulturmodell von Trompenaars (1993) Sieben Variablen, mit denen Unterschiede zwischen Kulturen gemessen werden können: Universalistische und partikularistische Orientierungen Individualismus und Kollektivismus Affektive contra neutrale Kulturen Spezifische contra diffuse Kulturen Askriptive contra leistungsorientierte Kulturen Selbstbestimmte und aussengeleitete Kulturen Zeitorientierung
Der Faktor Kultur in der Lokalisierung Individualistisch Man spricht mehr von "Ich" Repräsentanten entscheiden auf der Stelle Im Idealfall leisten Mitarbeiter ihre Arbeit als Einzelne und fühlen sich persönlich verantwortlich Kollektivistisch Man spricht mehr von "Wir" Delegierte entscheiden nach Rücksprache Im Idealfall leisten Mitarbeiter ihre Arbeit in Gruppen mit geteilter Verantwortung nach Trompenaars 1993
Der Faktor Kultur in der Lokalisierung Individualistisch Schweden USA Tschechoslowakei Schweiz Kollektivistisch Singapur Japan Grossbritannien Philippinen nach Trompenaars 1993
Kulturelle Anpassung Technischer Dokumentationen These Technische Dokumentation ist kulturneutral, da sie ausschliesslich objektive technische Sachverhalte beschreibt. Gegenthese Technische Dokumentation ist nicht zwangsläufig kulturneutral, da der Informationsgehalt einer Technischen Dokumentation stets abhängig ist von verschiedenen Aspekten, wie dem Umfeld, dem Vorwissen und der Vorbildung der Leser.
Bedingungen für die Lokalisierung Technischer Dokumentationen Gesetzliche Anforderungen an die Dokumentation, zum Beispiel unterschiedliche Rechtssysteme Unterschiede in den Verpflichtungen, die ein Hersteller in den verschiedenen Ländern eingeht juristische Festlegungen unabhängig von der Dokumentation "soziokulturelle" Hintergründe, die nur auf die eine der beiden Kommunikationsgemeinschaften zutreffen.
Beispiele Kulturspezifische Wahrnehmung von Illustrationen Welche ist die zweite Einschubleiste?
Beispiele Welche ist die zweite Einschubleiste? Korea Japan USA 1: Von oben 37.3 % 62.5% 36.4% 2: Von unten 62.2% 31.3% 63.6%
Beispiele Einsatz von Tönen Der Einsatz von Tönen in Softwareprodukten oder Websites kann in verschiedenen Kulturen unterschiedlich aufgefasst werden. Akustisches Signal bei Fehleingabe Europäisch-amerikanischer Sprachraum: akzeptabel Japan: peinlich, Gesichtsverlust
Beispiele Kulturspezifische Wahrnehmung von Illustrationen Welche Zahl ist gross ("big number")?
Beispiele Welche Zahl ist "gross"? Korea Japan USA 1: Big in graphic 41,4% 68,8% 45,5% 2: Big in content 58,6% 25,0% 54,5%
Beispiele Kulturspezifische Wahrnehmung von Illustrationen Leserichtung?
Beispiele Vorsicht bei der Verwendung von Symbolen Symbole werden oft aus anderen Lebensbereichen herangezogen und sind daher stark kulturspezifisch. positive Assoziation: gespartes Geld negative Assoziation: Unreinheit positive Assoziation: erledigt, vorhanden negative Assoziation: Fehler in Schulaufgaben (Japan)
Quellen Austermühl, Frank (2001) Electronic Tools for Translators, Manchester Badras, Catherine (2003) Lokalisierung Technische Dokumentationen für den internationalen Markt, Folien zum Seminar Lokalisierung, durchgeführt von Catherine Badras im Wintersemester 2003/04 an der Zürcher Hochschule Winterthur Bowker, Lynne (2002) Computer-Aided Translation Technology. A Practical Introduction. Ottawa: University of Ottawa Press Lee, Kun-Pyo & Harada, Akira (2000) A Study on the Cultural Effects on User Interface Design. http://globalisation.org/sigchi2000/xpapers/lkp- ADCpaper.pdf Rutishauser, Therese (2004) Zum Ähnlichkeitsmass des Translation Memory von across und Wordfast. Schriftliche Hausarbeit im Seminar Maschinelle und maschinengestützte Übersetzung, durchgeführt von Susanne J. Jekat im Sommersemester 2004 an der Universität Zürich Trompenaars, F. (1993) Handbuch Globales Managen, Econ