Softwareprojektpraktikum Maschinelle Übersetzung

Größe: px
Ab Seite anzeigen:

Download "Softwareprojektpraktikum Maschinelle Übersetzung"

Transkript

1 Softwareprojektpraktikum Maschinelle Übersetzung Jan-Thorsten Peter, Andreas Guta, Jan Rosendahl Vorbesprechung 3. Aufgabe 19. Mai 2017 Human Language Technology and Pattern Recognition Lehrstuhl für Informatik 6 Computer Science Department RWTH Aachen University, Germany J.-T. Peter, A. Guta, J. Rosendahl Maschinelle Übersetzung 1 Vorbesprechung 19. Mai 2017

2 Wie lässt sich die Qualität von Übersetzungen beurteilen? Ziele: Vergleich der Performanz verschiedener maschineller Übersetzungssysteme Beurteilung des Effekts inkrementeller Änderungen während der Systementwicklung Optimierung freier Parameter Menschliche Bewertung: zeitaufwändig teuer Beurteilungen verschiedener Evaluatoren stimmen oft nicht überein Entscheidungen ein und desselben Evaluators sind oft nicht konsistent J.-T. Peter, A. Guta, J. Rosendahl Maschinelle Übersetzung 2 Vorbesprechung 19. Mai 2017

3 Adequacy und Fluency Mögliche Kriterien zur Beurteilung von Übersetzungen: Adequacy: Gibt die Übersetzung die Bedeutung des Quellsatzes wieder? Sind keine Inhalte ausgelassen oder hinzugefügt worden? Fluency: Ist die Übersetzung in der Zielsprache ein korrekt formulierter und flüssig lesbarer Satz? Auf einer Skala von 1 bis 5: The dog is barking. Adequacy Fluency Bellen das Hund. 5 2 Das Wetter ist schön. 1 5 Der Hund bellt. 5 5 J.-T. Peter, A. Guta, J. Rosendahl Maschinelle Übersetzung 3 Vorbesprechung 19. Mai 2017

4 Automatische Evaluationsmetriken Automatisierte Bewertung von Übersetzungen (Hypothesen) durch Vergleich mit einer oder mehreren von Menschen erstellten Referenzübersetzungen Gute automatische Metriken sollten eine hohe Korrelation mit menschlicher Bewertung aufweisen Verbreitete Metriken: F-Measure WER (Word Error Rate) PER (Position-independent Error Rate) BLEU (Bilingual Evaluation Understudy) METEOR (Metric for Evaluation of Translation with Explicit Ordering) NIST-Score CharacTER BEER... J.-T. Peter, A. Guta, J. Rosendahl Maschinelle Übersetzung 4 Vorbesprechung 19. Mai 2017

5 Beispiel: F-Measure Übereinstimmungen = Anzahl Wörter aus der Hypothese, die auch in der Referenz gefunden werden können Precision = Übereinstimmungen Hypothesenlänge Recall = Übereinstimmungen Referenzlänge F-Measure = = Precision Recall (Precision + Recall)/2 Übereinstimmungen (Hypothesenlänge + Referenzlänge)/2 J.-T. Peter, A. Guta, J. Rosendahl Maschinelle Übersetzung 5 Vorbesprechung 19. Mai 2017

6 Levenshtein-Distanz Minimale Anzahl an Einfügungs-, Auslassungs- und Ersetzungsoperationen, die nötig sind, um die Hypothese so zu editieren, dass sie mit der Referenz übereinstimmt Beispiel (Zeichenlevel) Hypothese: Referenz: B A N A N E A N A N A S Hypothese: B A N A N E Referenz: A N A N A S Operationen: d m m m m s i insertion (i), deletion (d), substitution (s), match (m) J.-T. Peter, A. Guta, J. Rosendahl Maschinelle Übersetzung 6 Vorbesprechung 19. Mai 2017

7 Dynamische Programmierung Berechnung der Levenshtein-Distanz B A N A N E A N A N A S Referenz vertikal, Hypothese horizontal Match: Nimm Kosten von diagonal links oben Substitution: Nimm Kosten von diagonal links oben, addiere 1 Insertion: Nimm Kosten von oben, addiere 1 Deletion: Nimm Kosten von links, addiere 1 Eintragung in Tabellenzelle ist Minimum aus Match/Substitution, Insertion und Deletion J.-T. Peter, A. Guta, J. Rosendahl Maschinelle Übersetzung 7 Vorbesprechung 19. Mai 2017

8 WER und PER WER: Dividiere Levenshtein-Distanz (Wortlevel) durch Referenzlänge Levenshtein-Distanz = Einfügungen + Auslassungen + Ersetzungen WER = Levenshtein-Distanz Referenzlänge PER: Zähle Anzahl der Übereinstimmungen unabhängig von der Wortreihenfolge PER = 1 Übereinstimmungen max(0, Hypothesenlänge Referenzlänge) Referenzlänge J.-T. Peter, A. Guta, J. Rosendahl Maschinelle Übersetzung 8 Vorbesprechung 19. Mai 2017

9 BLEU n-gram = eine Folge von n Wörtern modified n-gram Precision p n einer Hypothese C: p n = n-gram C Count match(n-gram) n-gram C Count(n-gram ) (1) Brevity Penalty BP (c Länge der Hypothese, r Länge der Referenz): BP = { 1 if c > r e ( 1 r c) if c r (2) BLEU (meist mit N = 4) ( N BLEU = BP exp n=1 1 N log p n ) (3) J.-T. Peter, A. Guta, J. Rosendahl Maschinelle Übersetzung 9 Vorbesprechung 19. Mai 2017

10 Modified n-gram Precision Beispiel Hypothese: the the the the the the the Referenz: the cat is on the mat modified 1-gram Precision: the kommt in der Referenz nur zweimal vor p 1 = 2/7 modified 2-gram Precision: the the kommt in der Referenz niemals vor p 2 = 0/6 = 0 J.-T. Peter, A. Guta, J. Rosendahl Maschinelle Übersetzung 10 Vorbesprechung 19. Mai 2017

11 Brevity Penalty Brevity Penalty: BP = { 1 if c > r e (1 r/c) if c r (4) Problem bei zu kurzen Hypothesen: modified n-gram Precision sehr hoch Bsp: Hypothese: the cat, Reference: the cat is on the mat modified n-gram Precision = 2/2 = 1 Lösung: Brevity Penalty bestraft zu kurze Hypothesen J.-T. Peter, A. Guta, J. Rosendahl Maschinelle Übersetzung 11 Vorbesprechung 19. Mai 2017

12 Aufgabe 3 Automatische Evaluierung der Ausgabe des maschinellen Übersetzungsprogramms aus Aufgabe 2 Einlesen einer Referenzübersetzung und einer zu bewertenden Übersetzung Levenshtein-Distanz mittels dynamischer Programmierung Berechnung von WER, PER und BLEU J.-T. Peter, A. Guta, J. Rosendahl Maschinelle Übersetzung 12 Vorbesprechung 19. Mai 2017

13 Einzelaufgaben Jede Praktikumsgruppe ist für die Vorstellung von einem existierenden Tool zuständig Vorbereitung von einem Vortrag für alle Teilnehmer (10-15 Minuten) über deren Nutzung (mit Beispielen an eurem Quellcode) Beispiele: Software-Dokumentation: z.b. doxygen Programmierung: Profiling mit z.b. gprof, valgrind und Verwendung von unittests Planung: Repository, z.b. mit git und einen Bug-Tracker, z.b. ditz J.-T. Peter, A. Guta, J. Rosendahl Maschinelle Übersetzung 13 Vorbesprechung 19. Mai 2017

14 Fragen? Viel Erfolg! J.-T. Peter, A. Guta, J. Rosendahl Maschinelle Übersetzung 14 Vorbesprechung 19. Mai 2017

Softwareprojektpraktikum Maschinelle Übersetzung Automatische Evaluation

Softwareprojektpraktikum Maschinelle Übersetzung Automatische Evaluation Softwareprojektpraktikum Maschinelle Übersetzung Automatische Evaluation Julian Schamper, Jan Rosendahl mtprak18@i6.informatik.rwth-aachen.de 11. April 2018 Human Language Technology and Pattern Recognition

Mehr

Softwareprojektpraktikum Maschinelle Übersetzung

Softwareprojektpraktikum Maschinelle Übersetzung Softwareprojektpraktikum Maschinelle Übersetzung Jan-Throsten Peter, Andreas Guta {peter,guta}@i6.informatik.rwth-aachen.de Vorbesprechung 3. Aufgabe 6. Mai 2014 Human Language Technology and Pattern Recognition

Mehr

Softwareprojektpraktikum Maschinelle Übersetzung

Softwareprojektpraktikum Maschinelle Übersetzung Softwareprojektpraktikum Maschinelle Übersetzung Jan-Thorsten Peter, Andreas Guta, Jan Rosendahl {peter,guta,rosendahl}@i6.informatik.rwth-aachen.de Vorbesprechung 4. Aufgabe 2. Juni 2017 Human Language

Mehr

So bewerten Sie einen Test

So bewerten Sie einen Test Fortgeschrittene Themen der statistische maschinelle Übersetzung (Advanced SMT) Evaluierung Miriam Kaeshammer Heinrich-Heine-Universität Düsseldorf Folien angepasst von T. Schoenemann Wintersemester 2014/15

Mehr

Softwareprojektpraktikum Maschinelle Übersetzung

Softwareprojektpraktikum Maschinelle Übersetzung Softwareprojektpraktikum Maschinelle Übersetzung Jan-Thorsten Peter, Andreas Guta, Jan Rosendahl max.bleu@i6.informatik.rwth-aachen.de 5. Mai 2017 Human Language Technology and Pattern Recognition Lehrstuhl

Mehr

Softwareprojektpraktikum Maschinelle Übersetzung

Softwareprojektpraktikum Maschinelle Übersetzung Softwareprojektpraktikum Maschinelle Übersetzung Jan-Thorsten Peter, Andreas Guta, Jan Rosendahl max.bleu@i6.informatik.rwth-aachen.de Vorbesprechung 5. Aufgabe 22. Juni 2017 Human Language Technology

Mehr

Praktikum Maschinelle Übersetzung: Evaluation

Praktikum Maschinelle Übersetzung: Evaluation Praktikum Maschinelle Übersetzung: Evaluation Um die Aufgaben auszuführen, können Sie Ihre Daten in folgendem Verzeichnis speichern: /project/smtstud/ss10/systems/username/ Wir werden uns einige der Übersetzungen

Mehr

Softwareprojektpraktikum Maschinelle Übersetzung

Softwareprojektpraktikum Maschinelle Übersetzung Softwareprojektpraktikum Maschinelle Übersetzung Jan Rosendahl, Jan-Thorsten Peter, Andreas Guta max.bleu@i6.informatik.rwth-aachen.de Vorbesprechung 6. Aufgabe 14. Juli 2017 Human Language Technology

Mehr

Softwareprojektpraktikum Maschinelle Übersetzung

Softwareprojektpraktikum Maschinelle Übersetzung Softwareprojektpraktikum Maschinelle Übersetzung Jan-Thorsten Peter, Andreas Guta {peter,guta}@i6.informatik.rwth-aachen.de Vorbesprechung 4. Aufgabe 19. Mai 2015 Human Language Technology and Pattern

Mehr

Qualitätskriterien für MT-Systeme Machen Mensch und Maschinen dieselben Fehler? Konika Minolta Symposium am 24. Februar 2011 in Langenhagen

Qualitätskriterien für MT-Systeme Machen Mensch und Maschinen dieselben Fehler? Konika Minolta Symposium am 24. Februar 2011 in Langenhagen Qualitätskriterien für MT-Systeme Machen Mensch und Maschinen dieselben Fehler? Konika Minolta Symposium am 24. Februar 2011 in Langenhagen D.O.G. Dokumentation ohne Grenzen GmbH www.dog-gmbh.de Dr. F.

Mehr

Kognitive Systeme. Übung 4

Kognitive Systeme. Übung 4 Kognitive Systeme Übung 4 Matthias Sperber Thai Son Nguyen 1 29.06.16 Wir bitten um Entschuldigung: Trotz anders lautender Ankündigung änderte sich die korrekte Lösung für Aufgabe 3e, sodass keine der

Mehr

Fakultät für Informatik Übung zu Kognitive Systeme Sommersemester Lösungsblatt 4 Maschinelles Lernen und Spracherkennung

Fakultät für Informatik Übung zu Kognitive Systeme Sommersemester Lösungsblatt 4 Maschinelles Lernen und Spracherkennung Fakultät für Informatik Übung zu Kognitive Systeme Sommersemester 2018 S. Constantin (stefan.constantin@kit.edu) S. Nguyen (thai.nguyen@kit.edu) Lösungsblatt 4 Maschinelles Lernen und Spracherkennung Aufgabe

Mehr

Fakultät für Informatik Übung zu Kognitive Systeme Sommersemester 2018

Fakultät für Informatik Übung zu Kognitive Systeme Sommersemester 2018 Fakultät für Informatik Übung zu Kognitive Systeme Sommersemester 2018 S. Constantin (stefan.constantin@kit.edu) S. Nguyen (thai.nguyen@kit.edu) Übungsblatt 4 Maschinelles Lernen und Spracherkennung Abgabe

Mehr

Fakultät für Informatik Übung zu Kognitive Systeme Sommersemester Lösungsblatt 4 Maschinelles Lernen und Spracherkennung

Fakultät für Informatik Übung zu Kognitive Systeme Sommersemester Lösungsblatt 4 Maschinelles Lernen und Spracherkennung Fakultät für Informatik Übung zu Kognitive Systeme Sommersemester 216 M. Sperber (matthias.sperber@kit.edu) S. Nguyen (thai.nguyen@kit.edu) Lösungsblatt 4 Maschinelles Lernen und Spracherkennung Aufgabe

Mehr

Maschinelle Übersetzung

Maschinelle Übersetzung Maschinelle Übersetzung Wissensmanagement VO 340088 Bartholomäus Wloka https://www.adaptemy.com MÜ Ansätze Zwei Dimensionen: Verarbeitungstiefe Art der verwendeten Technik Seite 2 Verarbeitunstiefe Seite

Mehr

Softwareprojektpraktikum Maschinelle Übersetzung Verbesserungen für Neuronale Übersetzungssysteme

Softwareprojektpraktikum Maschinelle Übersetzung Verbesserungen für Neuronale Übersetzungssysteme Softwareprojektpraktikum Maschinelle Übersetzung Verbesserungen für Neuronale Übersetzungssysteme Julian Schamper, Jan Rosendahl mtprak18@i6.informatik.rwth-aachen.de 04. Juli 2018 Human Language Technology

Mehr

Softwareprojektpraktikum Maschinelle Übersetzung Kurze Einführung in Python

Softwareprojektpraktikum Maschinelle Übersetzung Kurze Einführung in Python Softwareprojektpraktikum Maschinelle Übersetzung Kurze Einführung in Python Julian Schamper, Jan Rosendahl mtprak18@i6.informatik.rwth-aachen.de 11. April 2018 Human Language Technology and Pattern Recognition

Mehr

Übungsaufgaben zur Einführung in die Bioinformatik - Lösungen

Übungsaufgaben zur Einführung in die Bioinformatik - Lösungen 18.01.2013 Prof. P. Güntert 1 Vorlesung BPC I: Aspekte der Thermodynamik in der Strukturbiologie Übungsaufgaben zur Einführung in die Bioinformatik - Lösungen 1. Hamming und Levenshtein Distanzen a) Was

Mehr

Softwareprojektpraktikum Maschinelle Übersetzung Kurze Einführung in Python

Softwareprojektpraktikum Maschinelle Übersetzung Kurze Einführung in Python Softwareprojektpraktikum Maschinelle Übersetzung Kurze Einführung in Python Jan Rosendahl, Christian Herold mtprak19@i6.informatik.rwth-aachen.de 02. April 2019 Human Language Technology and Pattern Recognition

Mehr

Algorithmen und Datenstrukturen 2

Algorithmen und Datenstrukturen 2 Algorithmen und Datenstrukturen 2 Sommersemester 2006 9. Vorlesung Peter Stadler Universität Leipzig Institut für Informatik studla@bioinf.uni-leipzig.de Invertierte Listen Nutzung vor allem zur Textsuche

Mehr

Einführung in das 6. Aufgabenblatt: Bildverarbeitung und Klassifkation

Einführung in das 6. Aufgabenblatt: Bildverarbeitung und Klassifkation Einführung in das 6. Aufgabenblatt: Bildverarbeitung und Klassifkation Philippe Dreuw dreuw@i6.informatik.rwth-aachen.de Praktikum im Grundstudium SS 2007 28. Juni 2007 Human Language Technology and Pattern

Mehr

Algorithmen auf Sequenzen

Algorithmen auf Sequenzen Algorithmen auf Sequenzen Fehlertolerante Mustersuche: Distanz- und Ähnlichkeitsmaße Sven Rahmann Genominformatik Universitätsklinikum Essen Universität Duisburg-Essen Universitätsallianz Ruhr Einführung

Mehr

Algorithmen und Datenstrukturen in der Bioinformatik Zweites Übungsblatt WS 05/06 Musterlösung

Algorithmen und Datenstrukturen in der Bioinformatik Zweites Übungsblatt WS 05/06 Musterlösung Johanna Ploog, Konstantin Clemens Freie Universität Berlin Institut für Mathematik II Arbeitsgruppe für Mathematik in den Lebenswissenschaften Algorithmen und Datenstrukturen in der Bioinformatik Zweites

Mehr

Maschinelle Sprachverarbeitung: N-Gramm-Modelle

Maschinelle Sprachverarbeitung: N-Gramm-Modelle HUMBOLD-UNIVERSIÄ ZU BERLIN Institut für Informatik Lehrstuhl Wissensmanagement Maschinelle Sprachverarbeitung: N-Gramm-Modelle obias Scheffer, Ulf Brefeld Statistische Sprachmodelle Welche Sätze sind

Mehr

Algorithmische Bioinformatik 1

Algorithmische Bioinformatik 1 Algorithmische Bioinformatik 1 Dr. Hanjo Täubig Lehrstuhl für Effiziente Algorithmen (Prof. Dr. Ernst W. Mayr) Institut für Informatik Technische Universität München Sommersemester 2009 Übersicht Paarweises

Mehr

Dokumentation Umgang mit und Beurteilung von Auszubildenden Berlin, 1./

Dokumentation Umgang mit und Beurteilung von Auszubildenden Berlin, 1./ Dokumentation Umgang mit und Beurteilung von Auszubildenden Berlin, 1./2.9. 2014 4 Dokumentation Umgang mit und Beurteilung von Auszubildenden Berlin, 1./2.9. 2014 5 Dokumentation Umgang mit und Beurteilung

Mehr

Diskriminatives syntaktisches Reranking für SMT

Diskriminatives syntaktisches Reranking für SMT Diskriminatives syntaktisches Reranking für SMT Fortgeschrittene Themen der statistischen maschinellen Übersetzung Janina Nikolic 2 Agenda Problem: Ranking des SMT Systems Lösung: Reranking-Modell Nutzung

Mehr

Vortrag SWP Gruppe 3

Vortrag SWP Gruppe 3 Translation Memories für automatische Patentübersetzung Institut für Computerlinguistik 22.07.2013 2 / 26 Inhaltsübersicht 1 2 3 4 5 6 3 / 26 Erinnerung Aus PatTR-Korpus SMT-System lernen Fuzzy Matches

Mehr

Informatik I - Programmierung Globalübung Hoare-Kalkül. Thomas Weiler. Fachgruppe Informatik RWTH Aachen. T. Weiler, RWTH Aachen - 1 -

Informatik I - Programmierung Globalübung Hoare-Kalkül. Thomas Weiler. Fachgruppe Informatik RWTH Aachen. T. Weiler, RWTH Aachen - 1 - Informatik I - Programmierung Globalübung 11.11.2003 Hoare-Kalkül Thomas Weiler Fachgruppe Informatik RWTH Aachen T. Weiler, RWTH Aachen - 1 - Ariane 5 Die Ariane 5 ist das jüngste Modell der Trägerrakete

Mehr

Machine Translation. Hermann Ney! RWTH%Aachen%University% Aachen,%Germany%

Machine Translation. Hermann Ney! RWTH%Aachen%University% Aachen,%Germany% Machine Translation Hermann Ney! RWTH%Aachen%University% Aachen,%Germany% task definition: input: text (written language) Teams in Machine Translation source language target language input: speech (spoken

Mehr

Strukturierte Extraktion von Text aus PDF. Präsentation der Masterarbeit von Fabian Schillinger

Strukturierte Extraktion von Text aus PDF. Präsentation der Masterarbeit von Fabian Schillinger Strukturierte Extraktion von Text aus PDF Präsentation der Masterarbeit von Fabian Schillinger Übersicht Motivation Probleme bei der Textextraktion Ablauf des entwickelten Systems Ergebnisse Präsentation

Mehr

Einleitung Kappa F-Score Fazit. Softwarepraktikum. Evaluation. Franz Matthies

Einleitung Kappa F-Score Fazit. Softwarepraktikum. Evaluation. Franz Matthies Evaluation Lehrstuhl für Computerlinguistik Institut für Germanistische Sprachwissenschaft Friedrich-Schiller-Universität Jena www.julielab.de Sommersemester 2016 Sitzung 2 Überblick 1 Motivation Definition

Mehr

Inhalt. " DiaGen Historie und Beschreibung. " Architektur eines DiaGen-Editors. " Hypergraphen. " DiaGen-Editoren Komponenten

Inhalt.  DiaGen Historie und Beschreibung.  Architektur eines DiaGen-Editors.  Hypergraphen.  DiaGen-Editoren Komponenten DIAGEN Sven Goeckels Seminar : Visuelle Sprachen Universität Bremen FB Informatik WS 2001/2002 Inhalt " DiaGen Historie und Beschreibung " " Hypergraphen " DiaGen-Editoren Komponenten? Modeler? Reducer?

Mehr

Seminar "Softwareentwicklung in der Wissenschaft" "Code-Qualität"

Seminar Softwareentwicklung in der Wissenschaft Code-Qualität Seminar "Softwareentwicklung in der Wissenschaft" "Code-Qualität" Johann Weging 8weging@informatik.uni-hamburg.de Arbeitsbereich Wissenschaftliches Rechnen Department Informatik Universität Hamburg 2011-02-09

Mehr

Maschinelle Übersetzung

Maschinelle Übersetzung Maschinelle Übersetzung Wissensmanagement VO 340088 Bartholomäus Wloka https://www.adaptemy.com Abkürzungen MÜS Maschinelles Übersetzungssystem MÜ Maschinelle Übersetzung MT Machine Translation SMT Statistical

Mehr

Datenstrukturen und Algorithmen

Datenstrukturen und Algorithmen Datenstrukturen und Algorithmen Prof. Dr.-Ing. H. Ney, G. Leusch, C. Plahl, D. Stein dsal06@i6.informatik.rwth-aachen.de Einführungsveranstaltungen Informatik Sommersemester 2006 Human Language Technology

Mehr

Statistische Sprachmodelle

Statistische Sprachmodelle Universität Potsdam Institut für Informatik Lehrstuhl Maschinelles Lernen Statistische Sprachmodelle Tobias Scheffer Thomas Vanck Statistische Sprachmodelle Welche Sätze sind Elemente einer Sprache (durch

Mehr

Learning Phrase Representations using RNN Encoder Decoder for Statistical Machine Translation. Yupeng Guo

Learning Phrase Representations using RNN Encoder Decoder for Statistical Machine Translation. Yupeng Guo Learning Phrase Representations using RNN Encoder Decoder for Statistical Machine Translation Yupeng Guo 1 Agenda Introduction RNN Encoder-Decoder - Recurrent Neural Networks - RNN Encoder Decoder - Hidden

Mehr

ABP Wo steckt der Fehler in der SQL-Anfrage? Semantische Prüfung von Lösungen Prof. Dr. Inga Marina Saatz

ABP Wo steckt der Fehler in der SQL-Anfrage? Semantische Prüfung von Lösungen Prof. Dr. Inga Marina Saatz ABP 017 Wo steckt der Fehler in der SQL-Anfrage? Semantische Prüfung von Lösungen 017 - Prof. Dr. Inga Marina Saatz Inhaltsübersicht Prof. Inga M. Dr. Saatz I. Saatz Datenbanken SQLearn 1 Fachbereich ABP

Mehr

Algorithmen auf Sequenzen Paarweiser Sequenzvergleich: Alignments

Algorithmen auf Sequenzen Paarweiser Sequenzvergleich: Alignments Algorithmen auf Sequenzen Paarweiser Sequenzvergleich: Alignments Sven Rahmann Genominformatik Universitätsklinikum Essen Universität Duisburg-Essen Universitätsallianz Ruhr Einführung Bisher: Berechnung

Mehr

Grundlagen und Definitionen

Grundlagen und Definitionen Grundlagen und Definitionen Wissensmanagement VO 340088 Bartholomäus Wloka https://www.adaptemy.com Maschinelle Sprachverarbeitung Breites Spektrum an Methoden der Computerverarbeitung von Sprache. Kann

Mehr

Algorithmen und Datenstrukturen

Algorithmen und Datenstrukturen Algorithmen und Datenstrukturen Wintersemester 2012/13 26. Vorlesung Greedy- und Approximationsalgorithmen Prof. Dr. Alexander Wolff Lehrstuhl für Informatik I Operations Research Optimierung für Wirtschaftsabläufe:

Mehr

Boyer Moore Algorithmus

Boyer Moore Algorithmus LMU, CIS, SoSe 2006 Veranstaltung: Programmierung von Stringmatchingalgorithmen in C Kursleiter: Max Hadersbeck Referenten: Galina Hinova Stefan Partusch Andreas Neumann Die Erfinder J Strother Moore J.

Mehr

Referierende Ausdrücke

Referierende Ausdrücke Referierende Ausdrücke Proseminar Generierung Alexander Koller 10. Dezember 2010 Wo stehen wir? content selection discourse planning surface realization sentence planning Die Generation Gap a b > FILL

Mehr

Der Boyer-Moore Algorithmus

Der Boyer-Moore Algorithmus Der Boyer-Moore Algorithmus Hauptseminar Pattern-Matching und Textalgorithmen 29.10.2002 Thomas Hellwig Der Naive Algorithmus Um auf den Boyer-Moore Algorithmus hinzuleiten, betrachten wir zuerst das grundsätzliche

Mehr

Das Tübinger Softwareprojekt

Das Tübinger Softwareprojekt Das Tübinger Softwareprojekt Git & Social Coding Workshop Arbeiten im Team Begriffe Remote Repository Ein externes Repository im Netzwerk / Internet. Begriffe Remote Repository Ein externes Repository

Mehr

Recognizing Cars. André Justus. 7.Juni Louka Dlagnekov, Serge Belongie. Visuelle Überwachung Universität Bielefeld

Recognizing Cars. André Justus. 7.Juni Louka Dlagnekov, Serge Belongie. Visuelle Überwachung Universität Bielefeld Louka Dlagnekov, Serge Belongie Visuelle Überwachung Universität Bielefeld 7.Juni 2006 Überblick Überblick Szenario Hardware Überblick Szenario Hardware Nummernschildentdeckung Nummernschilderkennung Erkennung

Mehr

Entwicklung eines Parsers von BIND- Konfigurationsdateien zur Migration in eine MySQL-Datenbank Markus Dienstknecht

Entwicklung eines Parsers von BIND- Konfigurationsdateien zur Migration in eine MySQL-Datenbank Markus Dienstknecht Entwicklung eines Parsers von BIND- Konfigurationsdateien zur Migration in eine Markus Dienstknecht Seminarvortrag 15.01.2015 Inhaltsverzeichnis 1. Motivation 2. Domain Name System (DNS) a. Domain Name

Mehr

Ausgewählte Techniken der Maschinellen Übersetzung. Susanne J. Jekat ZHW E-mail: jes@zhwin.ch, Subject: MTZH

Ausgewählte Techniken der Maschinellen Übersetzung. Susanne J. Jekat ZHW E-mail: jes@zhwin.ch, Subject: MTZH Ausgewählte Techniken der Maschinellen Übersetzung Susanne J. Jekat ZHW E-mail: jes@zhwin.ch, Subject: MTZH Übersicht Themenbereiche: 1. Erstellung und Standardisierung von Ressourcen für die Maschinelle

Mehr

Ziele und Herausforderungen

Ziele und Herausforderungen Ziele und Herausforderungen Text soll automatisch aus einer Quellsprache in eine Zielsprache übertragen werden Dabei soll die Funktion des Textes erhalten bleiben Es werden sowohl computerlinguistische

Mehr

Impact of Economics on Compiler Optimization

Impact of Economics on Compiler Optimization Impact of Economics on Compiler Optimization Arch D. Robinson Kai Software Seminar Zwischensprachen & Codegenerierung IPD Goos Dimitar Dimitrov Betreuer Rubino Geiß 0 Überblick Überblick Problem Übersetzer

Mehr

Seminar Programmierung Eingebetteter Systeme

Seminar Programmierung Eingebetteter Systeme Seminar Programmierung Eingebetteter Systeme Prof. Sabine Glesner Robert Reicherdt Dirk Tetzlaff Daniel Stöhr Paula Herber Marcel Pockrandt Wintersemester 2011/12 Organisation der Veranstaltung Blocktermine:

Mehr

Chancen der Industrie 4.0 durch moderne Lokalisierungstechniken

Chancen der Industrie 4.0 durch moderne Lokalisierungstechniken Chancen der Industrie 4.0 durch moderne Lokalisierungstechniken 3. AnalytikTag 15. November 2018 Prof. Dr. Bodo Kraft, kraft@fh-aachen.de Oliver Schmidts, M. Sc., schmidts@fh-aachen.de FH AACHEN UNIVERSITY

Mehr

Algorithmische Bioinformatik

Algorithmische Bioinformatik FREIE UNIVERSITÄT BERLIN Fachbereich Mathematik und Informatik Institut für Informatik (WE 3) FU BERLIN Freie Universität Berlin FB Mathematik und Informatik, Institut für Informatik, Takustr. 9, D-14195

Mehr

OCR-Nachkorrektur Grundlagen Stringabstände

OCR-Nachkorrektur Grundlagen Stringabstände HS: Computerlinguistische Probleme bei der Digitalisierung historischer Texte CIS SoSe 2010 Referentin: Elena Levushkina Dozent: Prof. Dr. Klaus U. Schulz, Dr. Christoph Ringstetter OCR-Nachkorrektur Grundlagen

Mehr

Informatik II, SS 2018

Informatik II, SS 2018 Informatik II - SS 2018 (Algorithmen & Datenstrukturen) Vorlesung 19 (27.6.2018) Dynamische Programmierung III Algorithmen und Komplexität Dynamische Programmierung DP Rekursion + Memoization Memoize:

Mehr

Relative Lokalisierung in Sensornetzen

Relative Lokalisierung in Sensornetzen Relative Lokalisierung in Sensornetzen Raphael Schmid Seminar Lokalisierung bei Prof. F. Mattern, SS06 Betreuung: Christian Frank Inhalt des Vortrages Einführung und Motivation Übersicht über relative

Mehr

Algorithmen und Datenstrukturen

Algorithmen und Datenstrukturen Algorithmen und Datenstrukturen Professor Dr. Lehrstuhl für Algorithm Engineering, LS11 Fakultät für Informatik, TU Dortmund 1. VO A&D WS 08/09 14. Oktober 2008 1 bevor wir thematisch beginnen: Kapitel

Mehr

// DAS BRANDED CONTENT MANAGEMENT- UND SALES-TOOL.

// DAS BRANDED CONTENT MANAGEMENT- UND SALES-TOOL. // DAS BRANDED CONTENT MANAGEMENT- UND SALES-TOOL. Ihr digitaler, wissenschaftlich fundierter Assistent. Optimieren Sie die Qualität Ihrer Product Placement und Branded Entertainment Maßnahmen. Mit der

Mehr

Wortdekodierung. Vorlesungsunterlagen Speech Communication 2, SS Franz Pernkopf/Erhard Rank

Wortdekodierung. Vorlesungsunterlagen Speech Communication 2, SS Franz Pernkopf/Erhard Rank Wortdekodierung Vorlesungsunterlagen Speech Communication 2, SS 2004 Franz Pernkopf/Erhard Rank Institute of Signal Processing and Speech Communication University of Technology Graz Inffeldgasse 16c, 8010

Mehr

Softwareprojektpraktikum Maschinelle Übersetzung

Softwareprojektpraktikum Maschinelle Übersetzung Softwareprojektpraktikum Maschinelle Übersetzung Jan-Thorsten Peter, Andreas Guta {peter,guta}@i6.informatik.rwth-aachen.de Vorbesprechung 1. Aufgabe 09. April 2014 Human Language Technology and Pattern

Mehr

Prüfungsrelevante Studienleistung Logische Programmierung (Sommer 2006) Magische Quadrate. Patricia Röschke (46016) Martin Grandrath (46375)

Prüfungsrelevante Studienleistung Logische Programmierung (Sommer 2006) Magische Quadrate. Patricia Röschke (46016) Martin Grandrath (46375) Prüfungsrelevante Studienleistung Logische Programmierung (Sommer 2006) Magische Quadrate Patricia Röschke (46016) Martin Grandrath (46375) 31. Oktober 2006 Inhalt 1 Aufgabenstellung 2 2 Erläuterung der

Mehr

Learning Linear Ordering Problems for Better Translation

Learning Linear Ordering Problems for Better Translation Learning Linear Ordering Problems for Better Translation Roy Tromble, Google Pittsburgh Jason Eisner, Johns Hopkins August 7, 2009 Overview Monotonic translation is easier Construct sentence-specific Linear

Mehr

Algorithmen und Datenstrukturen in der Bioinformatik Erstes Übungsblatt WS 05/06 Musterlösung

Algorithmen und Datenstrukturen in der Bioinformatik Erstes Übungsblatt WS 05/06 Musterlösung Konstantin Clemens Johanna Ploog Freie Universität Berlin Institut für Mathematik II Arbeitsgruppe für Mathematik in den Lebenswissenschaften Algorithmen und Datenstrukturen in der Bioinformatik Erstes

Mehr

Maschinelle Übersetzung

Maschinelle Übersetzung Maschinelle Übersetzung Kluge Andreas, 13IN-M basierend auf Computerlinguistik und Sprachtechnologie, 3. Auflage, Spektrum, Heidelberg 2010 19. Juni 2014 Übersicht Gewünschte Funktionalität Schwierigkeiten

Mehr

KLAUSUR ZUM BACHELORMODUL PROBEKLAUSUR VORLESUNG COMPUTERLINGUISTISCHE ANWENDUNGEN PROBEKLAUSUR, DR. BENJAMIN ROTH KLAUSUR AM

KLAUSUR ZUM BACHELORMODUL PROBEKLAUSUR VORLESUNG COMPUTERLINGUISTISCHE ANWENDUNGEN PROBEKLAUSUR, DR. BENJAMIN ROTH KLAUSUR AM KLAUSUR ZUM BACHELORMODUL PROBEKLAUSUR VORLESUNG COMPUTERLINGUISTISCHE ANWENDUNGEN PROBEKLAUSUR, DR. BENJAMIN ROTH KLAUSUR AM VOR NACH MATRIKELNUMMER: STUDIENGANG: B.Sc. Computerlinguistik, B.Sc. Informatik,

Mehr

Maschinelle Übersetzung Sommersemester 2010

Maschinelle Übersetzung Sommersemester 2010 Maschinelle Übersetzung Sommersemester 2010 Einführung Praktischer Teil Jan Niehues KIT Universität des Landes Baden-Württemberg und nationales Forschungszentrum in der Helmholtz-Gemeinschaft www.kit.edu

Mehr

Interaktion von Mensch und Technik im Gesundheitskontext

Interaktion von Mensch und Technik im Gesundheitskontext Interaktion von Mensch und Technik im Gesundheitskontext Prof. Dr. Astrid Rosenthal-von der Pütten RWTH-Aachen University Vortrag im Rahmen der Ringvorlesung Psychologie und Gesundheit an der University

Mehr

Ausgewählte Techniken der Maschinellen Übersetzung. Susanne J. Jekat ZHW Subject: MTZH

Ausgewählte Techniken der Maschinellen Übersetzung. Susanne J. Jekat ZHW   Subject: MTZH Ausgewählte Techniken der Maschinellen Übersetzung Susanne J. Jekat ZHW E-mail: jes@zhwin.ch, Subject: MTZH Übersicht Themenbereiche: 1. Erstellung und Standardisierung von Ressourcen für die Maschinelle

Mehr

Kapitel 1: Informationsverarbeitung durch Programme

Kapitel 1: Informationsverarbeitung durch Programme LUDWIG- MAXIMILIANS- UNIVERSITY MUNICH DEPARTMENT INSTITUTE FOR INFORMATICS Skript zur Vorlesung: Einführung in die Informatik: Systeme und Anwendungen Sommersemester 2008 Kapitel 1: Informationsverarbeitung

Mehr

Universität Potsdam Institut für Informatik Lehrstuhl Maschinelles Lernen. Übersetzung. Tobias Scheffer Michael Großhans Paul Prasse Uwe Dick

Universität Potsdam Institut für Informatik Lehrstuhl Maschinelles Lernen. Übersetzung. Tobias Scheffer Michael Großhans Paul Prasse Uwe Dick Universität Potsdam Institut für Informatik Lehrstuhl Maschinelles Lernen Übersetzung Tobias Scheffer Michael Großhans Paul Prasse Uwe Dick Maschinelle Übersetzung 2 Maschinelle Übersetzung Gegeben Text

Mehr

Stochastisches Matchen. Klaus Pommerening IMBEI Oberseminar Medizin-Informatik

Stochastisches Matchen. Klaus Pommerening IMBEI Oberseminar Medizin-Informatik Stochastisches Matchen Klaus Pommerening IMBEI Oberseminar Medizin-Informatik 16. 7. 2002 Entscheidungssituation Y = M U disjunkte Zerlegung γ Beobachtungsfunktion Γ Merkmalsraum τ Entscheidungsfunktion

Mehr

Algorithmen und Datenstrukturen (ESE) Entwurf, Analyse und Umsetzung von Algorithmen (IEMS) WS 2013 / 2014 Vorlesung 14, Donnerstag, 6.

Algorithmen und Datenstrukturen (ESE) Entwurf, Analyse und Umsetzung von Algorithmen (IEMS) WS 2013 / 2014 Vorlesung 14, Donnerstag, 6. Algorithmen und Datenstrukturen (ESE) Entwurf, Analyse und Umsetzung von Algorithmen (IEMS) WS 2013 / 2014 Vorlesung 14, Donnerstag, 6. Februar 2014 (Editierdistanz, dynamische Programmierung) Junior-Prof.

Mehr

VO 340088 Sprachtechnologien. Informations- und Wissensmanagement. Bartholomäus Wloka. Zentrum für Translationswissenschaft

VO 340088 Sprachtechnologien. Informations- und Wissensmanagement. Bartholomäus Wloka. Zentrum für Translationswissenschaft , Informations- und Wissensmanagement Zentrum für Translationswissenschaft Grundlagen und Definitionen Maschinelle Sprachverarbeitung Breites Spektrum an Methoden der Computerverarbeitung von Sprache.

Mehr

ADS: Algorithmen und Datenstrukturen 2

ADS: Algorithmen und Datenstrukturen 2 ADS: Algorithmen und Datenstrukturen 2 Teil 10 Prof. Dr. Gerhard Heyer Institut für Informatik Abteilung Automatische Sprachverarbeitung Universität Leipzig 13. Juni 2018 [Letzte Aktualisierung: 12/06/2018,

Mehr

Ein Entscheidungsproblem des Alltags...

Ein Entscheidungsproblem des Alltags... Ein Entscheidungsproblem des Alltags... 23 Ich sehe ein neues Auto in ihrer Zukunft 24 3 wichtige Schritte beim AHP Zielformulierung: Auswahl einer Autos Definition Kriterien: Styling, Verlässlichkeit,

Mehr

Übersetzungsunterstützendetzende Systeme

Übersetzungsunterstützendetzende Systeme Übersetzungsunterstützendetzende Systeme Seminar Computerlinguistik Referentin: Virginija Siderkeviciüte INHALT 1. Einleitung 2. Begriffe und Grundlagen 2.1 Funktionsweise 3. Vorhandene Programme 4. Evaluationskriterien

Mehr

VO Sprachtechnologien. Informations- und Wissensmanagement. Bartholomäus Wloka. Zentrum für Translationswissenschaft

VO Sprachtechnologien. Informations- und Wissensmanagement. Bartholomäus Wloka. Zentrum für Translationswissenschaft , Informations- und Wissensmanagement Zentrum für Translationswissenschaft Outline Begriffe MÜS Maschinelles Übersetzungssystem MÜ Maschinelle Übersetzung MT Machine Translation SMT Statistical Machine

Mehr

Seminarvortrag zum Thema maschinelles Lernen I - Entscheidungsbäume. von Lars-Peter Meyer. im Seminar Methoden wissensbasierter Systeme

Seminarvortrag zum Thema maschinelles Lernen I - Entscheidungsbäume. von Lars-Peter Meyer. im Seminar Methoden wissensbasierter Systeme Seminarvortrag zum Thema maschinelles Lernen I - Entscheidungsbäume von Lars-Peter Meyer im Seminar Methoden wissensbasierter Systeme bei Prof. Brewka im WS 2007/08 Übersicht Überblick maschinelles Lernen

Mehr

Automatische Beschlagwortung mit dem Vokabular der Schlagwortnormdatei (SWD) und der Personennamendatei (PND) Erfahrungen aus dem DNB-Projekt PETRUS

Automatische Beschlagwortung mit dem Vokabular der Schlagwortnormdatei (SWD) und der Personennamendatei (PND) Erfahrungen aus dem DNB-Projekt PETRUS Sandro Uhlmann Automatische Beschlagwortung mit dem Vokabular der Schlagwortnormdatei (SWD) und der Personennamendatei (PND) Erfahrungen aus dem DNB-Projekt PETRUS 1 Automatische Beschlagwortung mit dem

Mehr

Bewertungskriterien für sichere Software

Bewertungskriterien für sichere Software Bewertungskriterien Bewertungskriterien David Schnura David Schnura Bewertungskriterien 1 Bewertungskriterien Bewertungskriterien braucht man, um gewisse Sicherheitsstandards etablieren zu können um ähnliche

Mehr

Vorlesung Programmierung

Vorlesung Programmierung - 1 - Vorlesung Programmierung n Inhalt der Vorlesung l Was ist ein Programm? l Was sind grundlegende Programmierkonzepte? l Wie konstruiert (entwickelt) man ein Programm? l Welche Programmier-Paradigmen

Mehr

Wichmann Innovations Award 2018

Wichmann Innovations Award 2018 Wichmann Innovations Award 2018 Einreichung per E-Mail an // Submission by e-mail to: info@gispoint.de Annahmeschluss // Deadline: 20.07.2018 Bitte senden Sie uns ein Logo Ihres Unternehmens in Druckauflösung

Mehr

Praktische Informatik 1

Praktische Informatik 1 Praktische Informatik 1 Imperative Programmierung und Objektorientierung Karsten Hölscher und Jan Peleska Wintersemester 2011/2012 Session 2 Programmierung Begriffe C/C++ Compiler: übersetzt Quellcode

Mehr

Refactoring. Vortrag im Rahmen des Softwareprojekts: Übersetzerbau. Referenten: Vivienne Severa Alpin Mete Sahin Florian Mercks. Datum:

Refactoring. Vortrag im Rahmen des Softwareprojekts: Übersetzerbau. Referenten: Vivienne Severa Alpin Mete Sahin Florian Mercks. Datum: Refactoring Vortrag im Rahmen des Softwareprojekts: Übersetzerbau Referenten: Vivienne Severa Alpin Mete Sahin Florian Mercks Datum: 20.06.2013 Überblick Einführung Refactoring im Einsatz Werkzeugunterstützung

Mehr

Optionally, an is sent : Erfahrungen mit automatisierter Erkennung schlechter Anforderungen

Optionally, an  is sent : Erfahrungen mit automatisierter Erkennung schlechter Anforderungen Richtig testen Hier soll das der Richtige Titel rein testen Optionally, an e-mail is sent : Erfahrungen mit automatisierter Erkennung schlechter Anforderungen www.qs-tag.de Maximilian Junker Qualicen GmbH

Mehr

EIGENSCHAFTEN VON SPRACHEN

EIGENSCHAFTEN VON SPRACHEN Vorlesung und Übung Universität Paderborn Wintersemester 2016/2017 Dr. Peter Pfahler EIGENSCHAFTEN VON SPRACHEN EWS, WS 2016/17, Pfahler C-1 Einführung Sprachen in der Informatik werden für bestimmte Zwecke

Mehr

Medizinisches Beispiel

Medizinisches Beispiel Problemstellung Stimmen zwei oder mehrere Beobachter in ihrer Einschätzung überein? (im engl.: rater agreement oder interrater agreement) Beispiel: Zwei Professoren beurteilen die Referate oder Seminararbeiten

Mehr

Eine Indexstruktur zur schnellen Nächste-Nachbar-Suche im metrischen Raum

Eine Indexstruktur zur schnellen Nächste-Nachbar-Suche im metrischen Raum Eine struktur zur schnellen Nächste-Nachbar-Suche im metrischen Raum (Zusammenarbeit mit Sören Balko) Brandenburgische Technische Universität Cottbus Institut für Informatik 4. Juli 2007 Gliederung 1 2

Mehr

STERNBURG BINGO STERNBURG BINGO UND SO FUNKTIONIERT S: MITMACHEN UND TOLLE PREISE GEWINNEN! RAUM FÜR EIGENE BEMERKUNGEN, GRÜSSE ETC.

STERNBURG BINGO STERNBURG BINGO UND SO FUNKTIONIERT S: MITMACHEN UND TOLLE PREISE GEWINNEN! RAUM FÜR EIGENE BEMERKUNGEN, GRÜSSE ETC. 85 61 19 27 78 52 90 45 03 39 54 88 89 76 21 69 15 94 22 10 24 18 62 79 53 Aufschrift befindet sich eine neue -Zahl. Wenn Sie eine -Zahl aus dem obigen Sobald Sie eine Reihe von 5 - -Zahlen horizontal,

Mehr

When Androids Control Robots

When Androids Control Robots When Androids Control Robots Inhalt Motivation Entwicklungsmethoden Workshop Evaluation Zusammenfassung 2/16 Motivation» Problem Informatik hat den Ruf kompliziert, unverständlich und langweilig und eine

Mehr

Themen für Bachelorprojekte und Bachelorarbeiten Lehrstuhl Prof. Dr. Pohl, Software Systems Engineering

Themen für Bachelorprojekte und Bachelorarbeiten Lehrstuhl Prof. Dr. Pohl, Software Systems Engineering Themen für Bachelorprojekte und Bachelorarbeiten Lehrstuhl Prof. Dr. Pohl, Software Systems Engineering 11.07.2018 Vergleich von Metriken zur Bewertung der Genauigkeit binärer Prozessprognosen anhand eines

Mehr

Übung Programmierung WS 2007/08 - Blatt 6

Übung Programmierung WS 2007/08 - Blatt 6 RHEINISCH- WESTFÄLISCHE TECHNISCHE HOCHSCHULE AACHEN LEHR- UND FORSCHUNGSGEBIET INFORMATIK 2 RWTH Aachen D-52056 Aachen GERMANY http://programmierung.informatik.rwth-aachen.de LuFG Informatik II Prof.

Mehr

Seminar Software Qualität im WS 2017/18

Seminar Software Qualität im WS 2017/18 Seminar Software Qualität im WS 2017/18 Vorbesprechung am 13. Juli 2017 Prof. Dr. Dr. h.c. Manfred Broy Dr. Maximilian Junker, Dr. Elmar Jürgens, Dr. Daniel Mendez, Dr. Benedikt Hauptmann, Henning Femmer,

Mehr

Strategisches Facility Management im Produktionsbetrieb anhand Risikomanagement. Ing. Reinhard Poglitsch, MBA

Strategisches Facility Management im Produktionsbetrieb anhand Risikomanagement. Ing. Reinhard Poglitsch, MBA Strategisches Facility Management im Produktionsbetrieb anhand Risikomanagement Ing. Reinhard Poglitsch, MBA Vorstellung Ing. Reinhard Poglitsch, MBA 26 Jahre in der Dienstleistungsbranche Leiter Business

Mehr

Kick-Off Paralleles Programmieren

Kick-Off Paralleles Programmieren Fakultät Informatik Institut für Software- und Multimediatechnik, Lehrstuhl für Softwaretechnologie Kick-Off Paralleles Programmieren Thomas Kühn Motivation Moore's Law The complexity for minimum component

Mehr