Maschinelle Übersetzung

Ähnliche Dokumente
Professionelle Seminare im Bereich MS-Office

Anleitung über den Umgang mit Schildern

Semestralklausur zur Vorlesung. Web Mining. Prof. J. Fürnkranz Technische Universität Darmstadt Sommersemester 2004 Termin:

Informationsblatt Induktionsbeweis

Welche Bereiche gibt es auf der Internetseite vom Bundes-Aufsichtsamt für Flugsicherung?

Senioren ans Netz. schreiben kurze Texte. Lektion 9 in Themen aktuell 2, nach Übung 7

Leichte-Sprache-Bilder

Grundbegriffe der Informatik

Bürgerhilfe Florstadt

Wir machen neue Politik für Baden-Württemberg

Können Hunde lächeln?

Würfelt man dabei je genau 10 - mal eine 1, 2, 3, 4, 5 und 6, so beträgt die Anzahl. der verschiedenen Reihenfolgen, in denen man dies tun kann, 60!.

L10N-Manager 3. Netzwerktreffen der Hochschulübersetzer/i nnen Mannheim 10. Mai 2016

Gezielt über Folien hinweg springen

Benutzerhandbuch - Elterliche Kontrolle

Kreativ visualisieren

Örtliche Angebots- und Teilhabeplanung im Landkreis Weilheim-Schongau

Statuten in leichter Sprache

Workflows verwalten. Tipps & Tricks

MORE Profile. Pass- und Lizenzverwaltungssystem. Stand: MORE Projects GmbH

Evident VDDS-Anbindung von MIZ

Grundlagen der Theoretischen Informatik, SoSe 2008

Produktionsplanung und steuerung (SS 2011)

Kapitel 4 Die Datenbank Kuchenbestellung Seite 1

Kommentartext Medien sinnvoll nutzen

Internationales Altkatholisches Laienforum

ONLINE-AKADEMIE. "Diplomierter NLP Anwender für Schule und Unterricht" Ziele

Erfahrungen mit Hartz IV- Empfängern

Repetitionsaufgaben Wurzelgleichungen

Hinweise zum Übungsblatt Formatierung von Text:

Lineargleichungssysteme: Additions-/ Subtraktionsverfahren

Woche 1: Was ist NLP? Die Geschichte des NLP.

Drucken von Webseiten Eine Anleitung, Version 1.0

Elternzeit Was ist das?

Internationale Beziehungen und Mobilitätsprogramme Fax: +43 / (0)316 / A Graz

1 topologisches Sortieren

SCHRITT 1: Öffnen des Bildes und Auswahl der Option»Drucken«im Menü»Datei«...2. SCHRITT 2: Angeben des Papierformat im Dialog»Drucklayout«...

Schuljahreswechsel im Schul-Webportal

Häufig gestellte Fragen (FAQ)

Schulung Marketing Engine Thema : Einrichtung der App

Mehr Arbeits-Plätze für Menschen mit Behinderung auf dem 1. Arbeits-Markt

Windows 10 - Probleme

AutoCAD Dienstprogramm zur Lizenzübertragung

mysql - Clients MySQL - Abfragen eine serverbasierenden Datenbank

Qualität und Verlässlichkeit Das verstehen die Deutschen unter Geschäftsmoral!

Eva Douma: Die Vorteile und Nachteile der Ökonomisierung in der Sozialen Arbeit

Evangelisieren warum eigentlich?

Webalizer HOWTO. Stand:

Serienbrieferstellung in Word mit Kunden-Datenimport aus Excel

Welches Übersetzungsbüro passt zu mir?

1.3. Installation und Konfiguration von Filr Desktop

Info zum Zusammenhang von Auflösung und Genauigkeit

Risikomanagement bei PPP Projekten: Erfahrungen aus Deutschland

Sehr geehrte Damen und Herren

Papierverbrauch im Jahr 2000

Holiday plans: ein Gespräch über Urlaubspläne

Sächsischer Baustammtisch

Nutzung von GiS BasePac 8 im Netzwerk

Persönliche Zukunftsplanung mit Menschen, denen nicht zugetraut wird, dass sie für sich selbst sprechen können Von Susanne Göbel und Josef Ströbl

Menschen und Natur verbinden

Handbuch. NAFI Online-Spezial. Kunden- / Datenverwaltung. 1. Auflage. (Stand: )

Anleitung für die Teilnahme an den Platzvergaben "Studio II, Studio IV und Studio VI" im Studiengang Bachelor Architektur SS15

Menü auf zwei Module verteilt (Joomla 3.4.0)

Hinweise in Leichter Sprache zum Vertrag über das Betreute Wohnen

Einstellen der Makrosicherheit in Microsoft Word

Prozentrechnung. Wir können nun eine Formel für die Berechnung des Prozentwertes aufstellen:

Terminabgleich mit Mobiltelefonen

IT-SICHERHEIT IM UNTERNEHMEN Mehr Sicherheit für Ihre Entscheidung

Wir arbeiten mit Zufallszahlen

Stellen Sie bitte den Cursor in die Spalte B2 und rufen die Funktion Sverweis auf. Es öffnet sich folgendes Dialogfenster

Das Werk einschließlich aller seiner Texte ist urheberrechtlich geschützt. Jede Verwertung außerhalb der engen Grenzen des Urheberrechts

Wie erstelle ich (m)einen Stundenplan?

Microsoft (Dynamics) CRM 2020: Wie verändern sich Markt, Eco-System und Anwendungsszenarien nach Cloud & Co?

Arbeit zur Lebens-Geschichte mit Menschen mit Behinderung Ein Papier des Bundesverbands evangelische Behindertenhilfe e.v.

Erstellen einer GoTalk-Auflage

EUROPEAN CONSORTIUM FOR THE CERTIFICATE OF ATTAINMENT IN MODERN LANGUAGES

Kateryna Khyzhniak. Universität Konstanz Geistenswissenschaftliche Sektion, Sprachwissenschaften Aufenthaltsbericht

Meinungen zur Altersvorsorge

Häufig gestellte Fragen zu Professional webmail

Webseiten sind keine Gemälde. Webstandards für ein besseres Web. Webstandards für ein besseres Web

Sind Sie reif fürs ASSESSEMENT CENTER?

AGROPLUS Buchhaltung. Daten-Server und Sicherheitskopie. Version vom b

Unterrichtsreihe: Freizeit und Unterhaltung

Vorbereitung auf die Sino-GermanJob-Fair

Installation OMNIKEY 3121 USB

2.8 Grenzflächeneffekte

Mehr Geld verdienen! Lesen Sie... Peter von Karst. Ihre Leseprobe. der schlüssel zum leben. So gehen Sie konkret vor!

Bedeutung der Bestände

mit attraktiven visuellen Inhalten

Bernadette Büsgen HR-Consulting

Checkliste. zur Gesprächsvorbereitung Mitarbeitergespräch. Aktivität / Frage Handlungsbedarf erledigt

Mobile Intranet in Unternehmen

Aber zuerst: Was versteht man unter Stromverbrauch im Standby-Modus (Leerlaufverlust)?

Platinen mit dem HP CLJ 1600 direkt bedrucken ohne Tonertransferverfahren

Gesucht und Gefunden: Die Funktionsweise einer Suchmaschine

Grundlagen der höheren Mathematik Einige Hinweise zum Lösen von Gleichungen

2 Evaluierung von Retrievalsystemen

Ein Vorwort, das Sie lesen müssen!

Zwischenablage (Bilder, Texte,...)

Moodle-Kurzübersicht Kurse Sichern und Zurücksetzen

Transkript:

Hauptstudiumsprojekt SoSe 07 Maschinelle Übersetzung Walther v. Hahn, Cristina Vertan {vhahn,vertan}@informatik.uni-hamburg.de Wozu dient ein Projekt? Projekte im Umfang von 6 SWS dienen der Bearbeitung größerer theoretischer, konstruktiver oder experimenteller Aufgaben und können in zwei aufeinander folgenden Semestern stattfinden. Ein Projekt kann in Zusammenarbeit mit einem Forschungsprojekt des Fachbereichs oder mit einer Einrichtung außerhalb des Fachbereichs veranstaltet werden. Projekte werden in Gruppen durchgeführt und ermöglichen das Erlernen von Gruppenarbeit. Die gesamte Projektgruppe arbeitet auf ein gemeinsames Ergebnis hin. Studienführer Informatik 1

Womit beschäftigt sich unsere Projekt? Maschinelle Übersetzung ist ein sehr aktuelles Thema, weniger wegen autonomer Übersetzung langer Texte, sondern im Zusammenhang mit Information Retrieval (IR), z.b. Webrecherchen und informeller Kommunikation. Das Hauptstudiumsprojekt wird Texte aus der Webseite der Dept. Informatik benutzen Ergebnisse sollen am Ende ermöglichen a) einen Vergleich zwischen on-line Systemen, Wort-zu Wort Übersetzungen und beispielbasierten Verfahren b) einen Qualitätsschwellwert für MÜ-Verfahren im Crosslingual Retrieval einschätzen zu können. Warum ist IR so wichtig? IR ist Bestandteil vieler Aktionen in unserem alltäglichen Leben: Musiksammlungen Organisation von Photos Web-Suche von Literaturquellen für einen Projekt oder Vortrag Informationsorganisation und -suche auf dem eigenen Rechner oder lokalen Netzwerk 2

Die Rolle von MÜ im Web Retrieval? Man hat zu wenig Kontrolle über die Datenorganisation Dokumente liegen in zahlreichen Formaten vor, Die Suche variiert von sehr spezifischen bis zu sehr vagen Anfragen, Viele Benutzer können Dokumente in mehr als einer Sprache lesen, d.h. das Suchverfahren muss die Anfrage auch in andere Sprachen (partiell) übersetzen können. Crosslingual Retrieval Crosslingual Retrieval -Verfahren Übersetzung Benutzerprofil MT Anfrage (EN) IR Anfrage (ES) IR Anfrage (DE) MT IR 3

Vorgehen 04.04 Einführung in MÜ und Experimente mit on-line Systemen 11.04 Implementierung: Pipeline on-line-systeme und Suchmaschine; Experimente mit Wort-zu-Wort Übersetzungen 18.04 Implementierung: Pipeline von on-line Lexika und terminologischen Lexika 24.04 Einführung in EBMT; Implementierung 02.05-09.05 - Implementierung 16.05 - Zwischenevaluation; Kriterien für MÜ-Evaluation 23.05-13.06 Implementierung 06.06 Software-Evaluation Kriterien 20.06 Zwischenvaluation; Implementierung 27.06-04.07 Implementierung; Vorbereitung End-Präsentation 11.07 - End Präsentation Was wollen wir erreichen? Kennenlernen von Grundverfahren der Maschinellen Übersetzung Evaluation von Ergebnissen: Übersetzungsqualität (linguistisch) Übersetzungsqualität im Bezug auf das Retrieval Wurden die relevanten Dokumente gefunden? Wie präzise muss die Übersetzung der Anfrage sein? Gruppen-Arbeit Testen und Evaluation des Systems 4

Scheinkriterien Teilnahmeschein Anwesenheit (maximal 2 Abwesenheiten) Implementierung, Testen und Evaluation eines Teils des Systems, Vortrag bei der Endpräsentation Leistungsschein Kriterien für Teilnahmeschein + Abfassung eines Projektberichts (bis Ende des Semesters). Ressourcen Webseite des Projekts http://nats-www.informatik.uni-hamburg.de/view/machinetranslation/ da befindet sich auch ein Test-Korpus Resourcen-Webseite: http://www.informatik.uni-hamburg.de/info/studium Search engine: http://www.informatik.uni-hamburg.de/harvest/suche.shtml On-line-Übersetzung-Systeme: http://babelfish.altavista.digital.com/babelfish/tr (oder siehe Liste auf der Projekt-Webseite On-line Lexikon http://dict.leo.org/ 5

Scenario Ein ausländischer Student sucht Informationen über Bachelor- und Master-Studium auf der Webseite des Dept. Informatik Die Seiten sind nur auf Deutsch Der Student kann mit Hilfe eines Wörterbuchs einige Seiten lesen aber die Suchanfragen kann er nur auf Englisch stellen. Mögliche verfügbare Lösungen Man benutzt ein On-line-Übersetzungsystem Man benutzt ein (On-line)-Lexikon und übesetzt die Anfrage Wort-zu-Wort Ergebnisse: Die Übersetzungsqualität ist schlecht weil: On-line-Systeme nicht disambiguieren können Wort-zu-Wort-Übersetzung keinerlei Morphologie einsetzt, außerdem kann die Disambiguierung auch falsch sein. 6

Was untersuchen wir im Projekt? Fehleranalyse bei: On-line-Übersetzungssystemen Wort-zu-Wort-Übersetzung Wie kann man solche Verfahren verbessern (beispiel-basierte Übersetzung) Wie gut muss die Übersetzungsqualität für Retrieval- Zwecke sein? System Architektur Suchanfrage (EN) On-line MÜ Lexikon Wort-zu-Wort MÜ EBMT Dokumente Suchanfrage (DE) Suchmaschine Web-Seiten 7

Ein paar Beispiele von On-Line Übersetzungen (Babelfish) -1- Suchanfrage: When can I enroll for the summer term? Übersetzung: Wenn ich für Sommerbezeichnung einschreiben kann Ein paar Beispiele von On-Line Übersetzungen (Babelfish) -2- Suchanfrage: How long lasts Bachelor in Computer Science? Übersetzung: Wie langer Letzte Junggeselle in der Informatik 8

Ein paar Beispiele von On-Line Übersetzungen (Babelfish)-3- Suchanfrage: Which lectures are obligatory in the first semester Übersetzung: Welche Vorträge sind im ersten Semester obligatorisch? Die teilweise falsche Übersetzung führt hier zu falschen Ergebnissen: Es werden die Kolloquiums- Vorträge gefunden! Aufgaben 04.04 /11.04 Wählen Sie 3 Suchmaschinen aus der Liste Übersetzen Sie das Testkorpus mit den on-line- Übersetzungssystemen Analysieren Sie die Ergebnisse und wählen sie das beste Übersetzungssystem Implementieren Sie die Schnittstelle zwischen dem on-line-übersetzungssystem und der Suchmaschine des Dept. Informatik. 9