Automatisches Lernen von Regeln zur quellseitigen Umordnung

Größe: px
Ab Seite anzeigen:

Download "Automatisches Lernen von Regeln zur quellseitigen Umordnung"

Transkript

1 Automatisches Lernen von Regeln zur quellseitigen Umordnung E I N A N S AT Z V O N D M I T R I Y G E N Z E L Duwaraka Murugadas Fortgeschrittene Methoden der statistischen maschinellen Übersetzung (Miriam Käshammer)

2 Agenda 2 Das Problem Der Lösungsansatz Der Algorithmus Evaluation

3 Agenda 3 Das Problem Der Lösungsansatz Der Algorithmus Evaluation

4 Das Problem I 4 Er sagte mir, dass er gehen wollte. He told me that he wanted to leave.

5 Das Problem II 5

6 Das Problem II 5 Er sagte mir, dass er gehen wollte.

7 Das Problem II 5 Er sagte mir, dass er gehen wollte.

8 Das Problem II 5 Er sagte mir, dass er gehen wollte. Er sagte mir, dass er wollte gehen.

9 Das Problem II 5 Er sagte mir, dass er gehen wollte. Er sagte mir, dass er wollte gehen.

10 Das Problem II 5 Er sagte mir, dass er gehen wollte. Er sagte mir, dass er wollte gehen.

11 Das Problem II 5 Er sagte mir, dass er gehen wollte. Er sagte mir, dass er wollte gehen.

12 AGENDA 6 Das Problem Der Lösungsansatz Der Algorithmus Evaluation

13 Pre-ordering + Unabhängig vom eigentlichen Übersetzungssystem + Verkürzt die Dekodierungszeit 7 Umordnung kann im Nachhinein nicht mehr vorgenommen werden Ziel: automatisches Lernen von Pre-Ordering Regeln für möglichst viele Sprachpaare

14 Das Prinzip Umordnungen der Quellseite der Trainingsdaten Darstellung als Parsebaum 8

15 Parsebaum 9 _VBD nsubj head dobj advmod PRP I VBD saw _NN RB easily det head DT a NN man

16 Der Regelraum Jede Regel besteht aus zwei Teilen: Conditioning Context Aktion Für jeden Knoten wird bestimmt, ob ein Conditioning Context ein Match ist, und wenn ja, wird die entsprechende Aktion durchgeführt Jede Regel kann nur einmal auf einen Knoten angewendet werden 10

17 Conditioning Context I 11 Konjunktion von Bedingungen Bedingung = (Feature, Value)-Paar

18 Conditioning Context I 11 Konjunktion von Bedingungen Bedingung = (Feature, Value)-Paar Beschreibung eines Knotens

19 Conditioning Context II 12 _VBD nsubj head dobj advmod PRP I VBD saw _NN RB easily det head DT a NN man

20 Conditioning Context II 12 Knoten _VBD nsubj head dobj advmod PRP I VBD saw _NN RB easily det head DT a NN man

21 Conditioning Context II 12 _VBD POS-Tag nsubj head dobj advmod PRP I VBD saw _NN RB easily det head DT a NN man

22 Conditioning Context II 12 syntaktisches Label _VBD nsubj head dobj advmod PRP I VBD saw _NN RB easily det head DT a NN man

23 Conditioning Context III 13 Feature nt nl pt pl 1T Beschreibung POS-Tag des Knotens syntaktisches Label des Knotens POS-Tag des Mutterknotens syntaktisches Label des Mutterknotens POS-Tag des 1. Tochterknotens 1L syntaktisches Label des 1. Tochterknotens 2T POS-Tag des 2. Tochterknotens 2L syntaktisches Label des 2. Tochterknotens

24 Conditioning Context III 13 Feature nt nl pt pl 1T Beschreibung POS-Tag des Knotens syntaktisches Label des Knotens POS-Tag des Mutterknotens syntaktisches Label des Mutterknotens POS-Tag des 1. Tochterknotens 1L syntaktisches Label des 1. Tochterknotens 2T POS-Tag des 2. Tochterknotens 2L syntaktisches Label des 2. Tochterknotens

25 Conditioning Context III 13 Feature nt nl pt pl 1T Beschreibung POS-Tag des Knotens syntaktisches Label des Knotens POS-Tag des Mutterknotens syntaktisches Label des Mutterknotens POS-Tag des 1. Tochterknotens 1L syntaktisches Label des 1. Tochterknotens 2T POS-Tag des 2. Tochterknotens 2L syntaktisches Label des 2. Tochterknotens

26 Conditioning Context III 13 Feature nt nl pt pl 1T Beschreibung POS-Tag des Knotens syntaktisches Label des Knotens POS-Tag des Mutterknotens syntaktisches Label des Mutterknotens POS-Tag des 1. Tochterknotens 1L syntaktisches Label des 1. Tochterknotens 2T POS-Tag des 2. Tochterknotens 2L syntaktisches Label des 2. Tochterknotens

27 Conditioning Context III 13 Feature nt nl pt pl 1T Beschreibung POS-Tag des Knotens syntaktisches Label des Knotens POS-Tag des Mutterknotens syntaktisches Label des Mutterknotens POS-Tag des 1. Tochterknotens Bedingung: nt = NN 1L syntaktisches Label des 1. Tochterknotens 2T POS-Tag des 2. Tochterknotens 2L syntaktisches Label des 2. Tochterknotens

28 Conditioning Context III 13 Feature nt nl pt pl 1T Beschreibung POS-Tag des Knotens syntaktisches Label des Knotens POS-Tag des Mutterknotens syntaktisches Label des Mutterknotens POS-Tag des 1. Tochterknotens 1L syntaktisches Label des 1. Tochterknotens 2T POS-Tag des 2. Tochterknotens 2L syntaktisches Label des 2. Tochterknotens

29 Conditioning Context III 13 Feature nt nl pt pl 1T Beschreibung POS-Tag des Knotens syntaktisches Label des Knotens POS-Tag des Mutterknotens syntaktisches Label des Mutterknotens POS-Tag des 1. Tochterknotens 1L syntaktisches Label des 1. Tochterknotens 2T POS-Tag des 2. Tochterknotens 2L syntaktisches Label des 2. Tochterknotens

30 Conditioning Context III 13 Feature nt nl pt pl 1T Beschreibung POS-Tag des Knotens syntaktisches Label des Knotens POS-Tag des Mutterknotens syntaktisches Label des Mutterknotens POS-Tag des 1. Tochterknotens Bedingung: nl = dobj 1L syntaktisches Label des 1. Tochterknotens 2T POS-Tag des 2. Tochterknotens 2L syntaktisches Label des 2. Tochterknotens

31 Conditioning Context III 13 Feature nt nl pt pl 1T Beschreibung POS-Tag des Knotens syntaktisches Label des Knotens POS-Tag des Mutterknotens syntaktisches Label des Mutterknotens POS-Tag des 1. Tochterknotens 1L syntaktisches Label des 1. Tochterknotens 2T POS-Tag des 2. Tochterknotens 2L syntaktisches Label des 2. Tochterknotens

32 Conditioning Context III 13 Feature nt nl pt pl 1T Beschreibung POS-Tag des Knotens syntaktisches Label des Knotens POS-Tag des Mutterknotens syntaktisches Label des Mutterknotens POS-Tag des 1. Tochterknotens 1L syntaktisches Label des 1. Tochterknotens 2T POS-Tag des 2. Tochterknotens 2L syntaktisches Label des 2. Tochterknotens

33 Conditioning Context III 13 Feature nt nl pt pl 1T Beschreibung POS-Tag des Knotens syntaktisches Label des Knotens POS-Tag des Mutterknotens syntaktisches Label des Mutterknotens POS-Tag des 1. Tochterknotens Bedingung: pt = _VBD 1L syntaktisches Label des 1. Tochterknotens 2T POS-Tag des 2. Tochterknotens 2L syntaktisches Label des 2. Tochterknotens

34 Conditioning Context III 13 Feature nt nl pt pl 1T Beschreibung POS-Tag des Knotens syntaktisches Label des Knotens POS-Tag des Mutterknotens syntaktisches Label des Mutterknotens POS-Tag des 1. Tochterknotens 1L syntaktisches Label des 1. Tochterknotens 2T POS-Tag des 2. Tochterknotens 2L syntaktisches Label des 2. Tochterknotens

35 Conditioning Context III 13 Feature nt nl pt pl 1T Beschreibung POS-Tag des Knotens syntaktisches Label des Knotens POS-Tag des Mutterknotens syntaktisches Label des Mutterknotens POS-Tag des 1. Tochterknotens Bedingung: pl = none 1L syntaktisches Label des 1. Tochterknotens 2T POS-Tag des 2. Tochterknotens 2L syntaktisches Label des 2. Tochterknotens

36 Conditioning Context III 13 Feature nt nl pt pl 1T Beschreibung POS-Tag des Knotens syntaktisches Label des Knotens POS-Tag des Mutterknotens syntaktisches Label des Mutterknotens POS-Tag des 1. Tochterknotens 1L syntaktisches Label des 1. Tochterknotens 2T POS-Tag des 2. Tochterknotens 2L syntaktisches Label des 2. Tochterknotens

37 Conditioning Context III 13 Feature nt nl pt pl 1T Beschreibung POS-Tag des Knotens syntaktisches Label des Knotens POS-Tag des Mutterknotens syntaktisches Label des Mutterknotens POS-Tag des 1. Tochterknotens 1L syntaktisches Label des 1. Tochterknotens 2T POS-Tag des 2. Tochterknotens 2L syntaktisches Label des 2. Tochterknotens

38 Conditioning Context III 13 Feature nt nl pt pl 1T Beschreibung POS-Tag des Knotens syntaktisches Label des Knotens POS-Tag des Mutterknotens syntaktisches Label des Mutterknotens POS-Tag des 1. Tochterknotens Bedingung: 1T = DT 1L syntaktisches Label des 1. Tochterknotens 2T POS-Tag des 2. Tochterknotens 2L syntaktisches Label des 2. Tochterknotens

39 Conditioning Context III 13 Feature nt nl pt pl 1T Beschreibung POS-Tag des Knotens syntaktisches Label des Knotens POS-Tag des Mutterknotens syntaktisches Label des Mutterknotens POS-Tag des 1. Tochterknotens 1L syntaktisches Label des 1. Tochterknotens 2T POS-Tag des 2. Tochterknotens 2L syntaktisches Label des 2. Tochterknotens

40 Conditioning Context III 13 Feature nt nl pt pl 1T Beschreibung POS-Tag des Knotens syntaktisches Label des Knotens POS-Tag des Mutterknotens syntaktisches Label des Mutterknotens POS-Tag des 1. Tochterknotens 1L syntaktisches Label des 1. Tochterknotens 2T POS-Tag des 2. Tochterknotens 2L syntaktisches Label des 2. Tochterknotens

41 Conditioning Context III 13 Feature nt nl pt pl 1T Beschreibung POS-Tag des Knotens syntaktisches Label des Knotens POS-Tag des Mutterknotens syntaktisches Label des Mutterknotens POS-Tag des 1. Tochterknotens Bedingung: 1L = det 1L syntaktisches Label des 1. Tochterknotens 2T POS-Tag des 2. Tochterknotens 2L syntaktisches Label des 2. Tochterknotens

42 Conditioning Context III 13 Feature nt nl pt pl 1T Beschreibung POS-Tag des Knotens syntaktisches Label des Knotens POS-Tag des Mutterknotens syntaktisches Label des Mutterknotens POS-Tag des 1. Tochterknotens 1L syntaktisches Label des 1. Tochterknotens 2T POS-Tag des 2. Tochterknotens 2L syntaktisches Label des 2. Tochterknotens

43 Conditioning Context III 13 Feature nt nl pt pl 1T Beschreibung POS-Tag des Knotens syntaktisches Label des Knotens POS-Tag des Mutterknotens syntaktisches Label des Mutterknotens POS-Tag des 1. Tochterknotens 1L syntaktisches Label des 1. Tochterknotens 2T POS-Tag des 2. Tochterknotens 2L syntaktisches Label des 2. Tochterknotens

44 Conditioning Context III 13 Feature nt nl pt pl 1T Beschreibung POS-Tag des Knotens syntaktisches Label des Knotens POS-Tag des Mutterknotens syntaktisches Label des Mutterknotens POS-Tag des 1. Tochterknotens Bedingung: 2T = NN 1L syntaktisches Label des 1. Tochterknotens 2T POS-Tag des 2. Tochterknotens 2L syntaktisches Label des 2. Tochterknotens

45 Conditioning Context III 13 Feature nt nl pt pl 1T Beschreibung POS-Tag des Knotens syntaktisches Label des Knotens POS-Tag des Mutterknotens syntaktisches Label des Mutterknotens POS-Tag des 1. Tochterknotens 1L syntaktisches Label des 1. Tochterknotens 2T POS-Tag des 2. Tochterknotens 2L syntaktisches Label des 2. Tochterknotens

46 Conditioning Context III 13 Feature nt nl pt pl 1T Beschreibung POS-Tag des Knotens syntaktisches Label des Knotens POS-Tag des Mutterknotens syntaktisches Label des Mutterknotens POS-Tag des 1. Tochterknotens 1L syntaktisches Label des 1. Tochterknotens 2T POS-Tag des 2. Tochterknotens 2L syntaktisches Label des 2. Tochterknotens

47 Conditioning Context III 13 Feature nt nl pt pl 1T Beschreibung POS-Tag des Knotens syntaktisches Label des Knotens POS-Tag des Mutterknotens syntaktisches Label des Mutterknotens POS-Tag des 1. Tochterknotens Bedingung: 2L = head 1L syntaktisches Label des 1. Tochterknotens 2T POS-Tag des 2. Tochterknotens 2L syntaktisches Label des 2. Tochterknotens

48 Conditioning Context IV 14 Ein Conditioning Context ist eine Konjunktion aus Bedingungen, z.b.: nt = _VBD 1T = PRP 1L = nsubj 3T = _NN 3L = dobj

49 Conditioning Context V 15 Trifft ein Conditioning Context auf einen Knoten zu, wird eine Aktion durchgeführt. nt = _VBD 1T = PRP 1L = nsubj 3T = _NN 3L = dobj

50 Conditioning Context V 15 Trifft ein Conditioning Context auf einen Knoten zu, wird eine Aktion durchgeführt. nt = _VBD 1T = PRP 1L = nsubj 3T = _NN 3L = dobj

51 Conditioning Context V 15 Trifft ein Conditioning Context auf einen Knoten zu, wird eine Aktion durchgeführt. nt = _VBD 1T = PRP 1L = nsubj 3T = _NN 3L = dobj

52 Conditioning Context V 15 Trifft ein Conditioning Context auf einen Knoten zu, wird eine Aktion durchgeführt. nt = _VBD 1T = PRP 1L = nsubj 3T = _NN 3L = dobj

53 Conditioning Context V 15 Trifft ein Conditioning Context auf einen Knoten zu, wird eine Aktion durchgeführt. nt = _VBD 1T = PRP 1L = nsubj 3T = _NN 3L = dobj

54 Conditioning Context V 15 Trifft ein Conditioning Context auf einen Knoten zu, wird eine Aktion durchgeführt. nt = _VBD 1T = PRP 1L = nsubj 3T = _NN 3L = dobj

55 Conditioning Context V 15 Trifft ein Conditioning Context auf einen Knoten zu, wird eine Aktion durchgeführt. nt = _VBD 1T = PRP 1L = nsubj 3T = _NN 3L = dobj

56 Conditioning Context V 15 Trifft ein Conditioning Context auf einen Knoten zu, wird eine Aktion durchgeführt. nt = _VBD 1T = PRP 1L = nsubj 3T = _NN 3L = dobj

57 Conditioning Context V 15 Trifft ein Conditioning Context auf einen Knoten zu, wird eine Aktion durchgeführt. nt = _VBD 1T = PRP 1L = nsubj 3T = _NN 3L = dobj

58 Conditioning Context V 15 Trifft ein Conditioning Context auf einen Knoten zu, wird eine Aktion durchgeführt. nt = _VBD 1T = PRP 1L = nsubj 3T = _NN 3L = dobj

59 Conditioning Context V 15 Trifft ein Conditioning Context auf einen Knoten zu, wird eine Aktion durchgeführt. nt = _VBD 1T = PRP 1L = nsubj 3T = _NN 3L = dobj

60 Conditioning Context V 15 Trifft ein Conditioning Context auf einen Knoten zu, wird eine Aktion durchgeführt. nt = _VBD 1T = PRP 1L = nsubj 3T = _NN 3L = dobj

61 Conditioning Context V 15 Trifft ein Conditioning Context auf einen Knoten zu, wird eine Aktion durchgeführt. nt = _VBD 1T = PRP 1L = nsubj 3T = _NN 3L = dobj Regel kann durchgeführt werden.

62 Umordnungs-Metriken Crossing Score: Anzahl der Kreuzungen von Alignments 16 Estimated BLEU Gain: Unterschied des BLEU Scores mit und ohne die Anwendung einer Regel Ziel: Nützlichkeit einer Regel erfassen, nicht des ganzen Systems

63 Crossing Score 17

64 Crossing Score 17

65 Crossing Score 17 2 Crossings

66 Crossing Score 17 2 Crossings

67 Crossing Score 17 2 Crossings 0 Crossings

68 Crossing Score 17 2 Crossings 0 Crossings Optimal

69 Estimated BLEU Gain BLEU: Bilingual Evaluation Study Evaluiert Qualität einer maschinellen Übersetzung 18 Estimated BLEU Gain Was man nach Anwendung einer Regel bzw. einer Sequenz an Regeln an BLEU dazugewinnen würde

70 Agenda 19 Das Problem Der Lösungsansatz Der Algorithmus Evaluation

71 Vorbereitungen Input: Wort-alignierte Satzpaare (nach IBM 1) Alignments mit einer Wahrscheinlichkeit unter 0,25 entfernen Anschließend Satzpaare mit nur sehr wenigen Alignments löschen 20 ZIEL: Optimierung der Alignment Links

72 Funktionsweise I input: A set of aligned sentence pairs base = <empty sequence> for several iterations do end for 21 candidate_rules=generateallcandidaterul es(input,base) base.append(mincost(candidate_rules))

73 Funktionsweise I input: A set of aligned sentence pairs base = <empty sequence> for several iterations do end for 21 candidate_rules=generateallcandidaterul es(input,base) base.append(mincost(candidate_rules)) Wortalignierte Satzpaare werden eingelesen

74 Funktionsweise I input: A set of aligned sentence pairs base = <empty sequence> for several iterations do end for 21 candidate_rules=generateallcandidaterul es(input,base) base.append(mincost(candidate_rules)) Speicher für die besten Regeln

75 Funktionsweise I input: A set of aligned sentence pairs base = <empty sequence> for several iterations do end for 21 candidate_rules=generateallcandidaterul es(input,base) base.append(mincost(candidate_rules)) Ermittlung der besten Regel Nach jeder Iteration wird die Sequenz um eine Regel erweitert

76 Funktionsweise II 22 Durchgehen der Knoten in Sliding Windows _VBD nsubj head dobj advmod PRP I VBD saw _NN RB easily det head DT a NN man

77 Funktionsweise II 22 Durchgehen der Knoten in Sliding Windows _VBD nsubj head dobj advmod PRP I VBD saw _NN RB easily det head DT a NN man

78 Funktionsweise II 22 Durchgehen der Knoten in Sliding Windows 3 Töchter = 2 Fenster _VBD nsubj head dobj advmod PRP I VBD saw _NN RB easily det head DT a NN man

79 Funktionsweise II 22 Durchgehen der Knoten in Sliding Windows 3 Töchter = 2 Fenster _VBD nsubj head dobj advmod PRP I VBD saw _NN RB easily det head DT a NN man

80 Funktionsweise II 22 Durchgehen der Knoten in Sliding Windows 3 Töchter = 2 Fenster _VBD nsubj head dobj advmod PRP I VBD saw _NN RB easily det head DT a NN man

81 Funktionsweise II 22 Durchgehen der Knoten in Sliding Windows 2 Töchter = 3 Fenster _VBD nsubj head dobj advmod PRP I VBD saw _NN RB easily det head DT a NN man

82 Funktionsweise II 22 Durchgehen der Knoten in Sliding Windows 2 Töchter = 3 Fenster _VBD nsubj head dobj advmod PRP I VBD saw _NN RB easily det head DT a NN man

83 Funktionsweise II 22 Durchgehen der Knoten in Sliding Windows 2 Töchter = 3 Fenster _VBD nsubj head dobj advmod PRP I VBD saw _NN RB easily det head DT a NN man

84 Funktionsweise II 22 Durchgehen der Knoten in Sliding Windows 2 Töchter = 3 Fenster _VBD nsubj head dobj advmod PRP I VBD saw _NN RB easily det head DT a NN man

85 Funktionsweise II 22 Durchgehen der Knoten in Sliding Windows Wird wie zwei bzw. drei Knoten behandelt _VBD nsubj head dobj advmod PRP I VBD saw _NN RB easily det head DT a NN man

86 Variante 1 23 Optimieren des Crossing Scores Starten mit der leeren Base Sequenz Jede mögliche Regel generieren Evaluierung mittels Crossing Score Extrahieren der K besten Regeln Zu ähnliche Regeln entfernen, dabei die bessere behalten Subsequenzen evaluieren und ähnliche entfernen Beste übrige Regel zur Base Sequenz hinzufügen Wiederholen mit der nun erweiterten Base Sequenz

87 Variante 1 23 Optimieren des Crossing Scores Starten mit der leeren Base Sequenz Jede mögliche Regel generieren Evaluierung mittels Crossing Score Extrahieren der K besten Regeln Zu ähnliche Regeln entfernen, dabei die bessere behalten Subsequenzen evaluieren und ähnliche entfernen Beste übrige Regel zur Base Sequenz hinzufügen Wiederholen mit der nun erweiterten Base Sequenz

88 Variante 1 23 Optimieren des Crossing Scores Starten mit der leeren Base Sequenz Jede mögliche Regel generieren Evaluierung mittels Crossing Score Extrahieren der K besten Regeln Zu ähnliche Regeln entfernen, dabei die bessere behalten Subsequenzen evaluieren und ähnliche entfernen Beste übrige Regel zur Base Sequenz hinzufügen Wiederholen mit der nun erweiterten Base Sequenz

89 Variante 1 23 Optimieren des Crossing Scores Starten mit der leeren Base Sequenz Jede mögliche Regel generieren Evaluierung mittels Crossing Score Extrahieren der K besten Regeln Zu ähnliche Regeln entfernen, dabei die bessere behalten Subsequenzen evaluieren und ähnliche entfernen Beste übrige Regel zur Base Sequenz hinzufügen Wiederholen mit der nun erweiterten Base Sequenz

90 Variante 1 23 Optimieren des Crossing Scores Starten mit der leeren Base Sequenz Jede mögliche Regel generieren Evaluierung mittels Crossing Score Extrahieren der K besten Regeln Zu ähnliche Regeln entfernen, dabei die bessere behalten Subsequenzen evaluieren und ähnliche entfernen Beste übrige Regel zur Base Sequenz hinzufügen Wiederholen mit der nun erweiterten Base Sequenz

91 Variante 1 23 Optimieren des Crossing Scores Starten mit der leeren Base Sequenz Jede mögliche Regel generieren Evaluierung mittels Crossing Score Extrahieren der K besten Regeln Zu ähnliche Regeln entfernen, dabei die bessere behalten Subsequenzen evaluieren und ähnliche entfernen Beste übrige Regel zur Base Sequenz hinzufügen Wiederholen mit der nun erweiterten Base Sequenz

92 Variante 1 23 Optimieren des Crossing Scores Starten mit der leeren Base Sequenz Jede mögliche Regel generieren Evaluierung mittels Crossing Score Extrahieren der K besten Regeln Zu ähnliche Regeln entfernen, dabei die bessere behalten Subsequenzen evaluieren und ähnliche entfernen Beste übrige Regel zur Base Sequenz hinzufügen Wiederholen mit der nun erweiterten Base Sequenz

93 Variante 1 23 Optimieren des Crossing Scores Starten mit der leeren Base Sequenz Jede mögliche Regel generieren Evaluierung mittels Crossing Score Extrahieren der K besten Regeln Zu ähnliche Regeln entfernen, dabei die bessere behalten Subsequenzen evaluieren und ähnliche entfernen Beste übrige Regel zur Base Sequenz hinzufügen Wiederholen mit der nun erweiterten Base Sequenz

94 Variante 1 - Beispiel 24 B = { }

95 Variante 1 - Beispiel B = { } Regeln = {R1,R2,R3,R4,R5,R6,,Rn} 24

96 Variante 1 - Beispiel B = { } Regeln = {R1,R2,R3,R4,R5,R6,,Rn} K beste = {R3,R5,R2,R12} 24

97 Variante 1 - Beispiel B = { } Regeln = {R1,R2,R3,R4,R5,R6,,Rn} K beste = {R3,R5,R2,R12} R3 und R5 zu ähnlich {R3,R2,R12} 24

98 B = { } Variante 1 - Beispiel Regeln = {R1,R2,R3,R4,R5,R6,,Rn} K beste = {R3,R5,R2,R12} R3 und R5 zu ähnlich {R3,R2,R12} Vergleich der Sequenzen auf Ähnlichkeit: R3, R2, R12, R3 R2, R2 R12, R3 R2 R12 24

99 B = { } Variante 1 - Beispiel Regeln = {R1,R2,R3,R4,R5,R6,,Rn} K beste = {R3,R5,R2,R12} R3 und R5 zu ähnlich {R3,R2,R12} Vergleich der Sequenzen auf Ähnlichkeit: R3, R2, R12, R3 R2, R2 R12, R3 R2 R12 Übrig bleiben R3 und R2 R12 24

100 B = { } Variante 1 - Beispiel Regeln = {R1,R2,R3,R4,R5,R6,,Rn} K beste = {R3,R5,R2,R12} R3 und R5 zu ähnlich {R3,R2,R12} Vergleich der Sequenzen auf Ähnlichkeit: R3, R2, R12, R3 R2, R2 R12, R3 R2 R12 Übrig bleiben R3 und R2 R12 R2 R12 hat besseren Score 24

101 B = { } Variante 1 - Beispiel Regeln = {R1,R2,R3,R4,R5,R6,,Rn} K beste = {R3,R5,R2,R12} R3 und R5 zu ähnlich {R3,R2,R12} Vergleich der Sequenzen auf Ähnlichkeit: R3, R2, R12, R3 R2, R2 R12, R3 R2 R12 Übrig bleiben R3 und R2 R12 R2 R12 hat besseren Score B = {R2 R12} 24

102 Variante 2 25 Optimieren des Estimated BLEU Gain Starten mit der leeren Base Sequenz Jede mögliche Regel generieren Umordnung der Sätze mit allen Regelsequenzen und Evaluierung durch Estimated BLEU Gain Hinzufügen der Sequenz mit dem höchsten BLEU zur BASE Sequenz Wiederholen mit der nun erweiterten Base Sequenz

103 Variante 2 25 Optimieren des Estimated BLEU Gain Starten mit der leeren Base Sequenz Jede mögliche Regel generieren Umordnung der Sätze mit allen Regelsequenzen und Evaluierung durch Estimated BLEU Gain Hinzufügen der Sequenz mit dem höchsten BLEU zur BASE Sequenz Wiederholen mit der nun erweiterten Base Sequenz

104 Variante 2 25 Optimieren des Estimated BLEU Gain Starten mit der leeren Base Sequenz Jede mögliche Regel generieren Umordnung der Sätze mit allen Regelsequenzen und Evaluierung durch Estimated BLEU Gain Hinzufügen der Sequenz mit dem höchsten BLEU zur BASE Sequenz Wiederholen mit der nun erweiterten Base Sequenz

105 Variante 2 25 Optimieren des Estimated BLEU Gain Starten mit der leeren Base Sequenz Jede mögliche Regel generieren Umordnung der Sätze mit allen Regelsequenzen und Evaluierung durch Estimated BLEU Gain Hinzufügen der Sequenz mit dem höchsten BLEU zur BASE Sequenz Wiederholen mit der nun erweiterten Base Sequenz

106 Variante 2 25 Optimieren des Estimated BLEU Gain Starten mit der leeren Base Sequenz Jede mögliche Regel generieren Umordnung der Sätze mit allen Regelsequenzen und Evaluierung durch Estimated BLEU Gain Hinzufügen der Sequenz mit dem höchsten BLEU zur BASE Sequenz Wiederholen mit der nun erweiterten Base Sequenz

107 Variante 2 - Beispiel 26 B = { }

108 Variante 2 - Beispiel B = { } Regeln = {R1,R2,R3,R4,R5,R6,,Rn} 26

109 B = { } Variante 2 - Beispiel Regeln = {R1,R2,R3,R4,R5,R6,,Rn} Regelsequenzen bilden und zur Umordnung anwenden, z.b.: R1 R2 R3 oder R3 R7 R1 26

110 B = { } Variante 2 - Beispiel Regeln = {R1,R2,R3,R4,R5,R6,,Rn} Regelsequenzen bilden und zur Umordnung anwenden, z.b.: R1 R2 R3 oder R3 R7 R1 BLEU nach jeder Umordnung berechnen 26

111 B = { } Variante 2 - Beispiel Regeln = {R1,R2,R3,R4,R5,R6,,Rn} Regelsequenzen bilden und zur Umordnung anwenden, z.b.: R1 R2 R3 oder R3 R7 R1 BLEU nach jeder Umordnung berechnen Sequenz, die höchsten BLEU erzeugt: R1 R2 R3 26

112 B = { } Variante 2 - Beispiel Regeln = {R1,R2,R3,R4,R5,R6,,Rn} Regelsequenzen bilden und zur Umordnung anwenden, z.b.: R1 R2 R3 oder R3 R7 R1 BLEU nach jeder Umordnung berechnen Sequenz, die höchsten BLEU erzeugt: R1 R2 R3 B = {R1 R2 R3} 26

113 Variante 3 27 Optimieren des sequentiellen Estimated BLEU Gain Starten mit der leeren Base Sequenz Jede mögliche Regel generieren Evaluierung mittels Crossing Score Ausgangspunkt: Set von n Regeln absteigend sortiert nach Crossing Score An die Base Sequenz erst die erste Regel, dann die ersten 2, die ersten 3, bis n Regeln anhängen Sobald der BLEU kleiner wird, wenn eine weitere Regel angehangen wird, wird diese Regel entfernt Solange durchführen, bis die Score Sequenz monoton aufsteigend ist Alle übrig gebliebenen Regeln zur Base Sequenz hinzufügen Wiederholen mit der nun erweiterten Base Sequenz

114 Variante 3 27 Optimieren des sequentiellen Estimated BLEU Gain Starten mit der leeren Base Sequenz Jede mögliche Regel generieren Evaluierung mittels Crossing Score Ausgangspunkt: Set von n Regeln absteigend sortiert nach Crossing Score An die Base Sequenz erst die erste Regel, dann die ersten 2, die ersten 3, bis n Regeln anhängen Sobald der BLEU kleiner wird, wenn eine weitere Regel angehangen wird, wird diese Regel entfernt Solange durchführen, bis die Score Sequenz monoton aufsteigend ist Alle übrig gebliebenen Regeln zur Base Sequenz hinzufügen Wiederholen mit der nun erweiterten Base Sequenz

115 Variante 3 27 Optimieren des sequentiellen Estimated BLEU Gain Starten mit der leeren Base Sequenz Jede mögliche Regel generieren Evaluierung mittels Crossing Score Ausgangspunkt: Set von n Regeln absteigend sortiert nach Crossing Score An die Base Sequenz erst die erste Regel, dann die ersten 2, die ersten 3, bis n Regeln anhängen Sobald der BLEU kleiner wird, wenn eine weitere Regel angehangen wird, wird diese Regel entfernt Solange durchführen, bis die Score Sequenz monoton aufsteigend ist Alle übrig gebliebenen Regeln zur Base Sequenz hinzufügen Wiederholen mit der nun erweiterten Base Sequenz

116 Variante 3 27 Optimieren des sequentiellen Estimated BLEU Gain Starten mit der leeren Base Sequenz Jede mögliche Regel generieren Evaluierung mittels Crossing Score Ausgangspunkt: Set von n Regeln absteigend sortiert nach Crossing Score An die Base Sequenz erst die erste Regel, dann die ersten 2, die ersten 3, bis n Regeln anhängen Sobald der BLEU kleiner wird, wenn eine weitere Regel angehangen wird, wird diese Regel entfernt Solange durchführen, bis die Score Sequenz monoton aufsteigend ist Alle übrig gebliebenen Regeln zur Base Sequenz hinzufügen Wiederholen mit der nun erweiterten Base Sequenz

117 Variante 3 27 Optimieren des sequentiellen Estimated BLEU Gain Starten mit der leeren Base Sequenz Jede mögliche Regel generieren Evaluierung mittels Crossing Score Ausgangspunkt: Set von n Regeln absteigend sortiert nach Crossing Score An die Base Sequenz erst die erste Regel, dann die ersten 2, die ersten 3, bis n Regeln anhängen Sobald der BLEU kleiner wird, wenn eine weitere Regel angehangen wird, wird diese Regel entfernt Solange durchführen, bis die Score Sequenz monoton aufsteigend ist Alle übrig gebliebenen Regeln zur Base Sequenz hinzufügen Wiederholen mit der nun erweiterten Base Sequenz

118 Variante 3 27 Optimieren des sequentiellen Estimated BLEU Gain Starten mit der leeren Base Sequenz Jede mögliche Regel generieren Evaluierung mittels Crossing Score Ausgangspunkt: Set von n Regeln absteigend sortiert nach Crossing Score An die Base Sequenz erst die erste Regel, dann die ersten 2, die ersten 3, bis n Regeln anhängen Sobald der BLEU kleiner wird, wenn eine weitere Regel angehangen wird, wird diese Regel entfernt Solange durchführen, bis die Score Sequenz monoton aufsteigend ist Alle übrig gebliebenen Regeln zur Base Sequenz hinzufügen Wiederholen mit der nun erweiterten Base Sequenz

119 Variante 3 27 Optimieren des sequentiellen Estimated BLEU Gain Starten mit der leeren Base Sequenz Jede mögliche Regel generieren Evaluierung mittels Crossing Score Ausgangspunkt: Set von n Regeln absteigend sortiert nach Crossing Score An die Base Sequenz erst die erste Regel, dann die ersten 2, die ersten 3, bis n Regeln anhängen Sobald der BLEU kleiner wird, wenn eine weitere Regel angehangen wird, wird diese Regel entfernt Solange durchführen, bis die Score Sequenz monoton aufsteigend ist Alle übrig gebliebenen Regeln zur Base Sequenz hinzufügen Wiederholen mit der nun erweiterten Base Sequenz

120 Variante 3 27 Optimieren des sequentiellen Estimated BLEU Gain Starten mit der leeren Base Sequenz Jede mögliche Regel generieren Evaluierung mittels Crossing Score Ausgangspunkt: Set von n Regeln absteigend sortiert nach Crossing Score An die Base Sequenz erst die erste Regel, dann die ersten 2, die ersten 3, bis n Regeln anhängen Sobald der BLEU kleiner wird, wenn eine weitere Regel angehangen wird, wird diese Regel entfernt Solange durchführen, bis die Score Sequenz monoton aufsteigend ist Alle übrig gebliebenen Regeln zur Base Sequenz hinzufügen Wiederholen mit der nun erweiterten Base Sequenz

121 Variante 3 27 Optimieren des sequentiellen Estimated BLEU Gain Starten mit der leeren Base Sequenz Jede mögliche Regel generieren Evaluierung mittels Crossing Score Ausgangspunkt: Set von n Regeln absteigend sortiert nach Crossing Score An die Base Sequenz erst die erste Regel, dann die ersten 2, die ersten 3, bis n Regeln anhängen Sobald der BLEU kleiner wird, wenn eine weitere Regel angehangen wird, wird diese Regel entfernt Solange durchführen, bis die Score Sequenz monoton aufsteigend ist Alle übrig gebliebenen Regeln zur Base Sequenz hinzufügen Wiederholen mit der nun erweiterten Base Sequenz

122 B = { } Variante 3 - Beispiel Regeln = {R1,R2,R3,R4,R5,R6,,Rn} Regeln absteigend nach Crossing Score sortiert: {R2, R7, R1, R15, R4, } B = {R2} BLEU = 4 B = {R2 R7} BLEU = 4,5 B = {R2 R7 R1} BLEU = 4,2 B = {R2 R7} BLEU = 4,5 B = {R2 R7 R15} BLEU = 4,6 B = {R2 R7 R15 R4} 28

123 B = { } Variante 3 - Beispiel Regeln = {R1,R2,R3,R4,R5,R6,,Rn} Regeln absteigend nach Crossing Score sortiert: {R2, R7, R1, R15, R4, } B = {R2} BLEU = 4 B = {R2 R7} BLEU = 4,5 B = {R2 R7 R1} BLEU = 4,2 B = {R2 R7} BLEU = 4,5 B = {R2 R7 R15} BLEU = 4,6 B = {R2 R7 R15 R4} 28

124 B = { } Variante 3 - Beispiel Regeln = {R1,R2,R3,R4,R5,R6,,Rn} Regeln absteigend nach Crossing Score sortiert: {R2, R7, R1, R15, R4, } B = {R2} BLEU = 4 B = {R2 R7} BLEU = 4,5 B = {R2 R7 R1} BLEU = 4,2 B = {R2 R7} BLEU = 4,5 B = {R2 R7 R15} BLEU = 4,6 B = {R2 R7 R15 R4} 28

125 B = { } Variante 3 - Beispiel Regeln = {R1,R2,R3,R4,R5,R6,,Rn} Regeln absteigend nach Crossing Score sortiert: {R2, R7, R1, R15, R4, } B = {R2} BLEU = 4 B = {R2 R7} BLEU = 4,5 B = {R2 R7 R1} BLEU = 4,2 B = {R2 R7} BLEU = 4,5 B = {R2 R7 R15} BLEU = 4,6 B = {R2 R7 R15 R4} 28

126 B = { } Variante 3 - Beispiel Regeln = {R1,R2,R3,R4,R5,R6,,Rn} Regeln absteigend nach Crossing Score sortiert: {R2, R7, R1, R15, R4, } B = {R2} BLEU = 4 B = {R2 R7} BLEU = 4,5 B = {R2 R7 R1} BLEU = 4,2 B = {R2 R7} BLEU = 4,5 B = {R2 R7 R15} BLEU = 4,6 B = {R2 R7 R15 R4} 28

127 B = { } Variante 3 - Beispiel Regeln = {R1,R2,R3,R4,R5,R6,,Rn} Regeln absteigend nach Crossing Score sortiert: {R2, R7, R1, R15, R4, } B = {R2} BLEU = 4 B = {R2 R7} BLEU = 4,5 B = {R2 R7 R1} BLEU = 4,2 B = {R2 R7} BLEU = 4,5 B = {R2 R7 R15} BLEU = 4,6 B = {R2 R7 R15 R4} 28

128 B = { } Variante 3 - Beispiel Regeln = {R1,R2,R3,R4,R5,R6,,Rn} Regeln absteigend nach Crossing Score sortiert: {R2, R7, R1, R15, R4, } B = {R2} BLEU = 4 B = {R2 R7} BLEU = 4,5 B = {R2 R7 R1} BLEU = 4,2 B = {R2 R7} BLEU = 4,5 B = {R2 R7 R15} BLEU = 4,6 B = {R2 R7 R15 R4} 28

129 B = { } Variante 3 - Beispiel Regeln = {R1,R2,R3,R4,R5,R6,,Rn} Regeln absteigend nach Crossing Score sortiert: {R2, R7, R1, R15, R4, } B = {R2} BLEU = 4 B = {R2 R7} BLEU = 4,5 B = {R2 R7 R1} BLEU = 4,2 B = {R2 R7} BLEU = 4,5 B = {R2 R7 R15} BLEU = 4,6 B = {R2 R7 R15 R4} 28

130 B = { } Variante 3 - Beispiel Regeln = {R1,R2,R3,R4,R5,R6,,Rn} Regeln absteigend nach Crossing Score sortiert: {R2, R7, R1, R15, R4, } B = {R2} BLEU = 4 B = {R2 R7} BLEU = 4,5 B = {R2 R7 R1} BLEU = 4,2 B = {R2 R7} BLEU = 4,5 B = {R2 R7 R15} BLEU = 4,6 B = {R2 R7 R15 R4} 28

131 B = { } Variante 3 - Beispiel Regeln = {R1,R2,R3,R4,R5,R6,,Rn} Regeln absteigend nach Crossing Score sortiert: {R2, R7, R1, R15, R4, } B = {R2} BLEU = 4 B = {R2 R7} BLEU = 4,5 B = {R2 R7 R1} BLEU = 4,2 B = {R2 R7} BLEU = 4,5 B = {R2 R7 R15} BLEU = 4,6 B = {R2 R7 R15 R4} 28

132 Agenda 29 Das Problem Der Lösungsansatz Der Algorithmus Evaluation

133 Trainingsdaten I 30 Deutsch Japanisch Koreanisch Englisch Hindi Walisisch Russisch Tschechisch

134 Standard-Datensätze Englisch Deutsch Deutsch Englisch Trainingsdaten II Unveröffentlichte Datensätze Alle Sprachen 31

135 Unveröffentlichte Datensätze Nachrichtenartikel von WikiNews (996 Sätze) Zufällige Sätze aus dem Web (9000 Sätze) 32 3 Sets: Set Wiki Web dev dev test Für alle Sprachen gleich

136 Vorgehen 33 Für alle Testdaten Durchlaufen des Algorithmus in allen drei Varianten Durchlauf OHNE Umordnung im Dekodierer Reordering Rule Sequenz (40-50 Regeln) Umordnung im Dekodierer ist nicht notwendig

137 Ergebnisse I Varianten1 und 3 meistens besser als Variante 2 Jedoch alle nützlich 34 Standard-Datensatz Sprache Base %BLEU Var. 1 %BLEU Var. 2 %BLEU Var. 3 %BLEU EN DE 16,09 16,30 16,35 16,40 DE EN 21,00 22,45 22,13 22,05

138 Ergebnisse II 35 Interne Datensätze Sprache Google %BLEU Base %BLEU Var.1 Gain Var. 2 Gain Tschechisch 16,68 15,35-0,08 0,13 0,19 Deutsch 20,34 18,65 0,47 0,30 0,39 Hindi 19,15 16,85 2,25 2,08 0,15 Japanisch 30,74 25,91 3,05 2,60 3,05 Koreanisch 27,99 23,61 3,34 3,77 4,16 Russisch 16,80 15,33 0,08 0,10 0,10 Walisisch 27,38 25,48 1,25 0,77 1,43 Var. 3 Gain

139 Ergebnisse III: Top Regeln 36 Sprache Kontext Reihenfolge Beispiel Hindi Japanisch, Koreanisch Deutsch Russisch, Tschechisch Walisisch 1L:head 3L:none 2,1,3 I see him I him see 2L:prep 2,1 eat with a spoon eat a spoon with 1T:VBN 2L:prep 1L:nn 2L:head 1L:amod 2L:head 2,1 struck with a ball with a ball struck 2,1 a building entrance a entrance building 2,1 Blue ball ball blue

140 Diskussion Generieren von Regeln ohne Hilfe von Linguisten oder Muttersprachlern möglich 37 Nur Englisch und Deutsch als Quellsprachen Auch auf andere Sprachen anwendbar Trainingsdaten

141 38 Vielen Dank!

142 Referenzen 39 Genzel, D. (2010). Automatically Learning Source-side Reordering Rules for Large Scale Machine Translation. In C.-R. Huang & D. Jurafsky (Eds.), COLING The 23rd International Conference on Computational Linguistics : proceedings of the main conference, August 23-27, 2010, Beijing, China (pp ). Beijing: Tsinghua University Press.

Reranking. Parse Reranking. Helmut Schmid. Institut für maschinelle Sprachverarbeitung Universität Stuttgart

Reranking. Parse Reranking. Helmut Schmid. Institut für maschinelle Sprachverarbeitung Universität Stuttgart Institut für maschinelle Sprachverarbeitung Universität Stuttgart schmid@ims.uni-stuttgart.de Die Folien basieren teilweise auf Folien von Mark Johnson. Koordinationen Problem: PCFGs können nicht alle

Mehr

20.01.2015 Fabian Grimme und Tino Krüger 1 INDREX. Evaluierung von H2O. Enterprise Data Management Beuth Hochschule für Technik

20.01.2015 Fabian Grimme und Tino Krüger 1 INDREX. Evaluierung von H2O. Enterprise Data Management Beuth Hochschule für Technik 20.01.2015 Fabian Grimme und Tino Krüger 1 INDREX Evaluierung von H2O Enterprise Data Management Beuth Hochschule für Technik 20.01.2015 Fabian Grimme und Tino Krüger 2 INDREX im Überblick In-Database

Mehr

Programmieren in natürlicher Sprache: Alice-Kontrollstrukturen

Programmieren in natürlicher Sprache: Alice-Kontrollstrukturen Programmieren in natürlicher Sprache: Alice-Kontrollstrukturen Bachelorarbeit betreut von Mathias Landhäußer Ronny Hug 20. August 2014 IPD TICHY KIT Universität des Landes Baden-Württemberg und nationales

Mehr

Ziele und Herausforderungen

Ziele und Herausforderungen Ziele und Herausforderungen Text soll automatisch aus einer Quellsprache in eine Zielsprache übertragen werden Dabei soll die Funktion des Textes erhalten bleiben Es werden sowohl computerlinguistische

Mehr

Softwareprojektpraktikum Maschinelle Übersetzung

Softwareprojektpraktikum Maschinelle Übersetzung Softwareprojektpraktikum Maschinelle Übersetzung Jan-Thorsten Peter, Andreas Guta {peter,guta}@i6.informatik.rwth-aachen.de Vorbesprechung 4. Aufgabe 19. Mai 2015 Human Language Technology and Pattern

Mehr

3. Entscheidungsbäume. Verfahren zum Begriffslernen (Klassifikation) Beispiel: weiteres Beispiel: (aus Böhm 2003) (aus Morik 2002)

3. Entscheidungsbäume. Verfahren zum Begriffslernen (Klassifikation) Beispiel: weiteres Beispiel: (aus Böhm 2003) (aus Morik 2002) 3. Entscheidungsbäume Verfahren zum Begriffslernen (Klassifikation) Beispiel: weiteres Beispiel: (aus Böhm 2003) (aus Morik 2002) (aus Wilhelm 2001) Beispiel: (aus Böhm 2003) Wann sind Entscheidungsbäume

Mehr

Webinfolab / CHEVAL: Evaluationslabor für Information Retrieval Systeme mit semantischen und visuellen Komponenten

Webinfolab / CHEVAL: Evaluationslabor für Information Retrieval Systeme mit semantischen und visuellen Komponenten Webinfolab / CHEVAL: Evaluationslabor für Information Retrieval Systeme mit semantischen und visuellen Komponenten Vortrag anlässlich der ODOK 2007 (20. September 2007, Graz) Joachim Pfister Schweizerisches

Mehr

Einführung in die Computerlinguistik Statistische Grundlagen

Einführung in die Computerlinguistik Statistische Grundlagen Statistik 1 Sommer 2015 Einführung in die Computerlinguistik Statistische Grundlagen Laura Heinrich-Heine-Universität Düsseldorf Sommersemester 2015 Statistik 2 Sommer 2015 Überblick 1. Diskrete Wahrscheinlichkeitsräume

Mehr

Praktikum Maschinelle Übersetzung Language Model

Praktikum Maschinelle Übersetzung Language Model Praktikum Maschinelle Übersetzung Language Model Um die Aufgaben auszuführen, können Sie ihre Daten in folgendem Verzeichnis speichern: /project/smtstud/ss10/systems/username/ Wir werden verschiedene Sprachmodelle

Mehr

Kapitel 12: Schnelles Bestimmen der Frequent Itemsets

Kapitel 12: Schnelles Bestimmen der Frequent Itemsets Einleitung In welchen Situationen ist Apriori teuer, und warum? Kapitel 12: Schnelles Bestimmen der Frequent Itemsets Data Warehousing und Mining 1 Data Warehousing und Mining 2 Schnelles Identifizieren

Mehr

Eine Baumstruktur sei folgendermaßen definiert. Eine Baumstruktur mit Grundtyp Element ist entweder

Eine Baumstruktur sei folgendermaßen definiert. Eine Baumstruktur mit Grundtyp Element ist entweder Programmieren in PASCAL Bäume 1 1. Baumstrukturen Eine Baumstruktur sei folgendermaßen definiert. Eine Baumstruktur mit Grundtyp Element ist entweder 1. die leere Struktur oder 2. ein Knoten vom Typ Element

Mehr

rechtsbündige Leerzeichen mit einlesen im Datastep

rechtsbündige Leerzeichen mit einlesen im Datastep News Artikel Foren Projekte Links Über Redscope Join List Random Previous Next Startseite Foren ETL & Base SAS rechtsbündige Leerzeichen mit einlesen im Datastep 1 June, 2010-19:00 marcosch Hallo, wahrscheinlich

Mehr

Satz Umstrukturierung für statistisch. Anna Schiffarth Dozentin: Miriam Kaeshammer Fortgeschrittene Methoden der statistisch maschinellen Übersetzung

Satz Umstrukturierung für statistisch. Anna Schiffarth Dozentin: Miriam Kaeshammer Fortgeschrittene Methoden der statistisch maschinellen Übersetzung Satz Umstrukturierung für statistisch maschinelle Übersetzung Anna Schiffarth Dozentin: Miriam Kaeshammer Fortgeschrittene Methoden der statistisch maschinellen Übersetzung Einführung Beschreibung einer

Mehr

Tagging von Online-Blogs

Tagging von Online-Blogs Tagging von Online-Blogs Gertrud Faaß (vertreten durch Josef Ruppenhofer) STTS tagset and tagging: special corpora 24. September 2012 Faaß MODEBLOGS 1 Korpuslinguistische studentische Projekte am IwiSt

Mehr

BENUTZERHANDBUCH: Trading Central Indikator für die MT4 Plattform

BENUTZERHANDBUCH: Trading Central Indikator für die MT4 Plattform BENUTZERHANDBUCH: Trading Central Indikator für die MT4 Plattform 1 Inhalt Beschreibung...3 Installationsprozess...4 Funktionen und Parameter...8 Aktualisierungsprozess... 10 2 Beschreibung Trading Central

Mehr

Acrolinx Produktretrospektive

Acrolinx Produktretrospektive Acrolinx Produktretrospektive 10. Oktober 2014 #AcrolinxUserConference SAFE HARBOR ERKLÄRUNG Die folgende Präsentation skizziert die allgemeine Richtung der Produktentwicklung von Acrolinx. Sie dient ausschlieslich

Mehr

Enigmail Konfiguration

Enigmail Konfiguration Enigmail Konfiguration 11.06.2006 Steffen.Teubner@Arcor.de Enigmail ist in der Grundkonfiguration so eingestellt, dass alles funktioniert ohne weitere Einstellungen vornehmen zu müssen. Für alle, die es

Mehr

Moderne Methoden der KI: Maschinelles Lernen

Moderne Methoden der KI: Maschinelles Lernen Moderne Methoden der KI: Maschinelles Lernen Prof. Dr.Hans-Dieter Burkhard Vorlesung Entscheidungsbäume Darstellung durch Regeln ID3 / C4.5 Bevorzugung kleiner Hypothesen Overfitting Entscheidungsbäume

Mehr

Mining High-Speed Data Streams

Mining High-Speed Data Streams Mining High-Speed Data Streams Pedro Domingos & Geoff Hulten Departement of Computer Science & Engineering University of Washington Datum : 212006 Seminar: Maschinelles Lernen und symbolische Ansätze Vortragender:

Mehr

Waimea String Replacer

Waimea String Replacer Waimea String Replacer Eine benutzerfreundliche Software zum Ersetzen von Zeichenfolgen in Dateistapeln Version 3.0.0 12.03.2012 Waimea String Replacer Seite 2 1. Leistungsumfang Waimea String Replacer

Mehr

Filterregeln... 1. Einführung... 1. Migration der bestehenden Filterregeln...1. Alle eingehenden Nachrichten weiterleiten...2

Filterregeln... 1. Einführung... 1. Migration der bestehenden Filterregeln...1. Alle eingehenden Nachrichten weiterleiten...2 Jörg Kapelle 15:19:08 Filterregeln Inhaltsverzeichnis Filterregeln... 1 Einführung... 1 Migration der bestehenden Filterregeln...1 Alle eingehenden Nachrichten weiterleiten...2 Abwesenheitsbenachrichtigung...2

Mehr

Schritt für Schritt Anleitung zur Installation des Programmpaketes HBS + EASYHBS + KSL

Schritt für Schritt Anleitung zur Installation des Programmpaketes HBS + EASYHBS + KSL HBS 6.0 Installation F. Pommerenke 1 Schritt für Schritt Anleitung zur Installation des Programmpaketes HBS + EASYHBS + KSL Es wird vorausgesetzt, dass: der Rechner ein CD Laufwerk hat und das Betriebssystem

Mehr

Elektronische Bilderbücher mit Powerpoint 2010 erstellen

Elektronische Bilderbücher mit Powerpoint 2010 erstellen Anleitung Bücher in MS Powerpoint 2007 von Sabina Lange, Ergänzung und Übertragung für Powerpoint 2010 durch Igor Krstoski. Bedingt durch die wieder leicht veränderte Optik in Powerpoint 2010 und veränderte

Mehr

Unterscheidung: Workflowsystem vs. Informationssystem

Unterscheidung: Workflowsystem vs. Informationssystem 1. Vorwort 1.1. Gemeinsamkeiten Unterscheidung: Workflowsystem vs. Die Überschneidungsfläche zwischen Workflowsystem und ist die Domäne, also dass es darum geht, Varianten eines Dokuments schrittweise

Mehr

Part of Speech Tagging. Linguistische Sicht. Carolin Deck

Part of Speech Tagging. Linguistische Sicht. Carolin Deck Part of Speech Tagging Linguistische Sicht Carolin Deck Gliederung 1. Begriffsklärung 2. Vorstellung zwei wichtiger Tagsets (STTS & PTTS) 3. Bedeutung des POS-Tagging für die Sprachwissenschaft 4. Tagzuweisung

Mehr

Leitfaden Internet-Redaktion kursana.de

Leitfaden Internet-Redaktion kursana.de Leitfaden Internet-Redaktion kursana.de 1.»Log In«: Der Zugang zum Redaktionssystem 2. Anlegen einer neuen Veranstaltung 3. Anlegen eines neuen Stellenangebots 4.»Log Out«: Aus dem Redaktionssystem ausloggen

Mehr

Grundlagen der Informatik. Prof. Dr. Stefan Enderle NTA Isny

Grundlagen der Informatik. Prof. Dr. Stefan Enderle NTA Isny Grundlagen der Informatik Prof. Dr. Stefan Enderle NTA Isny 2 Datenstrukturen 2.1 Einführung Syntax: Definition einer formalen Grammatik, um Regeln einer formalen Sprache (Programmiersprache) festzulegen.

Mehr

Goethe. Einführung in die Computerlinguistik: Maschinelle Übersetzung. Können Computer übersetzen? Babel Fish Google

Goethe. Einführung in die Computerlinguistik: Maschinelle Übersetzung. Können Computer übersetzen? Babel Fish Google Goethe Einführung in die Computerlinguistik: Maschinelle Übersetzung WS 2012/2013 Manfred Pinkal! Über allen Gipfeln ist Ruh. In allen Wipfeln spürest du kaum einen Hauch! Over all summits is rest. In

Mehr

Ihre Software für effizientes Qualitätsmanagement

Ihre Software für effizientes Qualitätsmanagement Ihre Software für effizientes Qualitätsmanagement Sie wollen qualitativ hochwertig arbeiten? Wir haben die Lösungen. SWS VDA QS Ob Qualitäts-Management (QM,QS) oder Produktions-Erfassung. Ob Automobil-Zulieferer,

Mehr

Theoretische Grundlagen der Informatik

Theoretische Grundlagen der Informatik Theoretische Grundlagen der Informatik Vorlesung am 12.01.2012 INSTITUT FÜR THEORETISCHE 0 KIT 12.01.2012 Universität des Dorothea Landes Baden-Württemberg Wagner - Theoretische und Grundlagen der Informatik

Mehr

Abschluss Version 1.0

Abschluss Version 1.0 Beschreibung Der Abschluss wird normalerweise nur einmal jährlich durchgeführt. Dieses Tech-Note soll helfen, diesen doch seltenen aber periodisch notwendigen Vorgang problemlos durchzuführen. Abschlussvarianten

Mehr

Handbuch Fischertechnik-Einzelteiltabelle V3.7.3

Handbuch Fischertechnik-Einzelteiltabelle V3.7.3 Handbuch Fischertechnik-Einzelteiltabelle V3.7.3 von Markus Mack Stand: Samstag, 17. April 2004 Inhaltsverzeichnis 1. Systemvorraussetzungen...3 2. Installation und Start...3 3. Anpassen der Tabelle...3

Mehr

Der Adapter Z250I / Z270I lässt sich auf folgenden Betriebssystemen installieren:

Der Adapter Z250I / Z270I lässt sich auf folgenden Betriebssystemen installieren: Installationshinweise Z250I / Z270I Adapter IR USB Installation hints Z250I / Z270I Adapter IR USB 06/07 (Laden Sie den Treiber vom WEB, entpacken Sie ihn in ein leeres Verzeichnis und geben Sie dieses

Mehr

4. Lernen von Entscheidungsbäumen. Klassifikation mit Entscheidungsbäumen. Entscheidungsbaum

4. Lernen von Entscheidungsbäumen. Klassifikation mit Entscheidungsbäumen. Entscheidungsbaum 4. Lernen von Entscheidungsbäumen Klassifikation mit Entscheidungsbäumen Gegeben sei eine Menge von Objekten, die durch /Wert- Paare beschrieben sind. Jedes Objekt kann einer Klasse zugeordnet werden.

Mehr

Handbuch Version 1.2 Dezember 2009

Handbuch Version 1.2 Dezember 2009 Handbuch Version 1.2 Dezember 2009 1 / 8 Inhaltsverzeichnis 1 Installation...3 1.1 Systemvoraussetzungen...3 1.2 Programmstart und Installation...3 2 Bedienung...4 2.1 Einverständniserklärung...4 2.2 Hauptfenster...4

Mehr

alojamiento en mallorca unterkunft auf mallorca lodgings on majorca HANDBUCH

alojamiento en mallorca unterkunft auf mallorca lodgings on majorca HANDBUCH alojamiento en mallorca unterkunft auf mallorca lodgings on majorca HANDBUCH PRÄMISSEN Der Umgang mit Internetprogrammen (z.b. Microsoft Internet Explorer ) wird vorausgesetzt. Kenntnisse der Microsoft

Mehr

Monte-Carlo-Simulation

Monte-Carlo-Simulation Modellierung und Simulation Monte-Carlo-Simulation Universität Hamburg Johannes Schlundt 7. Januar 2013 Monte-Carlo-Simulation Johannes S. 1/31 Inhalt Motivation Geschichtliche Entwicklung Monte-Carlo-Simulation

Mehr

1 Part-of-Speech Tagging

1 Part-of-Speech Tagging 2. Übung zur Vorlesung NLP Analyse des Wissensrohstoes Text im Sommersemester 2008 Dr. Andreas Hotho, Dipl.-Inform. Dominik Benz, Wi.-Inf. Beate Krause 28. Mai 2008 1 Part-of-Speech Tagging 1.1 Grundlagen

Mehr

Architekturen. Aufbau von Systemen Direkte Systeme Transfersysteme Interlinguasysteme

Architekturen. Aufbau von Systemen Direkte Systeme Transfersysteme Interlinguasysteme Architekturen Aufbau von Systemen Direkte Systeme Transfersysteme Interlinguasysteme Architekturen von Übersetzungssystemen: automatisch Eingabe Übersetzung Ausgabe Architekturen von Übersetzungssystemen:

Mehr

Eine molekulare Lösung des Hamiltonkreisproblems mit DNA

Eine molekulare Lösung des Hamiltonkreisproblems mit DNA Eine molekulare Lösung des Hamiltonkreisproblems mit DNA Seminar Molecular Computing Bild: http://creatia2013.files.wordpress.com/2013/03/dna.gif Andreas Fehn 11. Juli 2013 Gliederung 1. Problemstellung

Mehr

Rechnerische Komplexität

Rechnerische Komplexität Proseminar Effiziente Algorithmen SS 2002 Rechnerische Komplexität Ulrike Krönert (34180) 0. Inhalt 1. Einführung 2. Algorithmen und Komplexität 2.1. Algorithmen 2.2. Laufzeitabschätzung 2.3. Polynomialzeit

Mehr

Views in SQL. 2 Anlegen und Verwenden von Views 2

Views in SQL. 2 Anlegen und Verwenden von Views 2 Views in SQL Holger Jakobs bibjah@bg.bib.de, holger@jakobs.com 2010-07-15 Inhaltsverzeichnis 1 Wozu dienen Views? 1 2 Anlegen und Verwenden von Views 2 3 Schreibfähigkeit von Views 3 3.1 Views schreibfähig

Mehr

Anleitung fu r die Vorlage restpunkte.xlsx

Anleitung fu r die Vorlage restpunkte.xlsx Anleitung fu r die Vorlage restpunkte.xlsx Inhalt 1 Einleitung... 1 2 Grundsätzliche Bedienungshinweise... 1 3 Wichtige Regeln für das Ausfüllen... 2 4 Erfassen der Information... 2 4.1 Das Blatt Inspektionen...

Mehr

Algorithmen und Datenstrukturen 2

Algorithmen und Datenstrukturen 2 Algorithmen und Datenstrukturen 2 Sommersemester 2007 4. Vorlesung Peter F. Stadler Universität Leipzig Institut für Informatik studla@bioinf.uni-leipzig.de Traversierung Durchlaufen eines Graphen, bei

Mehr

Teil A Grundlagen 31

Teil A Grundlagen 31 Schnellüberblick 11 Zu diesem Buch 17 So finden Sie den geeigneten Ausgangspunkt in diesem Buch 17 Neue Eigenschaften von Microsoft Excel 2000 19 Korrekturen, Kommentare und Hilfe 20 Besuchen Sie unsere

Mehr

Entwurf von Algorithmen - Kontrollstrukturen

Entwurf von Algorithmen - Kontrollstrukturen Entwurf von Algorithmen - Kontrollstrukturen Eine wichtige Phase in der Entwicklung von Computerprogrammen ist der Entwurf von Algorithmen. Dieser Arbeitsschritt vor dem Schreiben des Programmes in einer

Mehr

Häufige Item-Mengen: die Schlüssel-Idee. Vorlesungsplan. Apriori Algorithmus. Methoden zur Verbessung der Effizienz von Apriori

Häufige Item-Mengen: die Schlüssel-Idee. Vorlesungsplan. Apriori Algorithmus. Methoden zur Verbessung der Effizienz von Apriori Vorlesungsplan 17.10. Einleitung 24.10. Ein- und Ausgabe 31.10. Reformationstag, Einfache Regeln 7.11. Naïve Bayes, Entscheidungsbäume 14.11. Entscheidungsregeln, Assoziationsregeln 21.11. Lineare Modelle,

Mehr

Praktikum Maschinelle Übersetzung Lexikon and Word Alignment

Praktikum Maschinelle Übersetzung Lexikon and Word Alignment Praktikum Maschinelle Übersetzung Lexikon and Word Alignment Um die Aufgaben auszuführen, können Sie ihre Daten in folgendem Verzeichnis speichern: /project/smtstud/ss10/systems/username/ Wir werden zunächst

Mehr

Market Basket Analysis oder: isst man Salat zum Schnitzel?

Market Basket Analysis oder: isst man Salat zum Schnitzel? Market Basket Analysis oder: isst man Salat zum Schnitzel? SAS Forum Switzerland, 07. Mai 2013 Ralph Wenzl Migros-Genossenschafts-Bund Customer & Web Intelligence Agenda 1 2 3 4 Muster in Warenkörben 3

Mehr

Opponent Modelling in RoShamBo. Timo Bozsolik (timo.boz@gmx.de)

Opponent Modelling in RoShamBo. Timo Bozsolik (timo.boz@gmx.de) Opponent Modelling in RoShamBo Timo Bozsolik (timo.boz@gmx.de) 2 Überblick Einführung Theoretische Betrachtung Die optimale Strategie Basis Strategien Iocaine Powder Schlussfolgerungen 3 RoShamBo Die Regeln

Mehr

SOI 2013. Die Schweizer Informatikolympiade

SOI 2013. Die Schweizer Informatikolympiade SOI Die Schweizer Informatikolympiade Lösung SOI Wie schreibe ich eine gute Lösung? Bevor wir die Aufgaben präsentieren, möchten wir dir einige Tipps geben, wie eine gute Lösung für die theoretischen

Mehr

Teil 2 - Softwaretechnik. Modul: Programmierung B-PRG Grundlagen der Programmierung 1 Teil 2. Übersicht. Softwaretechnik

Teil 2 - Softwaretechnik. Modul: Programmierung B-PRG Grundlagen der Programmierung 1 Teil 2. Übersicht. Softwaretechnik Grundlagen der Programmierung 1 Modul: Programmierung B-PRG Grundlagen der Programmierung 1 Teil 2 Softwaretechnik Prof. Dr. O. Drobnik Professur Architektur und Betrieb verteilter Systeme Institut für

Mehr

KUNERT BRANDSCHUTZDATENTECHNIK

KUNERT BRANDSCHUTZDATENTECHNIK WARTUNGS- VERWALTUNGS- UND ABRECHNUNGSSYSTEME Modul: Inventarisierung KUNERT BRANDSCHUTZDATENTECHNIK email: kunert@feuerwehrsoftware.de URL: http://www.feuerwehrsoftware.de Inhaltsverzeichnis 1.0 Programmstart

Mehr

Modellbasierte Diagnosesysteme

Modellbasierte Diagnosesysteme Modellbasierte Diagnosesysteme Diagnose: Identifikation eines vorliegenden Fehlers (Krankheit) auf der Basis von Beobachtungen (Symptomen) und Hintergrundwissen über das System 2 Arten von Diagnosesystemen:

Mehr

Global. Village. Kurzanleitung

Global. Village. Kurzanleitung Global Village Kurzanleitung Willkommen! Sie haben sich für das Hardlock-System entschieden, das Ihnen ermöglicht, Ihre Software sicher und geschützt zu vertreiben. Hardlock ist ein umfassendes Schutzsystem

Mehr

Handbuch für die Termindatenbank

Handbuch für die Termindatenbank Handbuch für die Termindatenbank der NetzWerkstatt Kostenlos Termine im Internet veröffentlichen wie wird s gemacht? Eine Orientierungshilfe von der NetzWerkstatt Veranstalter Inhalt Usergruppen 3 Veranstalter

Mehr

1 Änderungen bei Windows Server 2008 R2

1 Änderungen bei Windows Server 2008 R2 1 Änderungen bei Windows Server 2008 R2 1.1 Der BranchCache Eine völlig neue Möglichkeit, auf Ressourcen zuzugreifen, bietet der BranchCache. In vielen Firmen gibt es Zweigstellen, die mit der Hauptstelle

Mehr

Dokumentation Authentische Strukturdaten

Dokumentation Authentische Strukturdaten Dokumentation Version 1.1 Version 1.0 Seite 1/18 31.10.2008 Inhaltsverzeichnis 1. Allgemeines...3 1.1 Phasenmodell...3 1.1.1 Phase I...3 1.1.2 Phase II...3 1.1.3 Phase III...3 1.2 Datenaktualität...3 2.

Mehr

Softwareprojektpraktikum Maschinelle Übersetzung

Softwareprojektpraktikum Maschinelle Übersetzung Softwareprojektpraktikum Maschinelle Übersetzung Jan-Throsten Peter, Andreas Guta {peter,guta}@i6.informatik.rwth-aachen.de Vorbesprechung 3. Aufgabe 6. Mai 2014 Human Language Technology and Pattern Recognition

Mehr

Nutzer-Synchronisation mittels WebWeaver Desktop. Handreichung

Nutzer-Synchronisation mittels WebWeaver Desktop. Handreichung Nutzer-Synchronisation mittels WebWeaver Desktop Handreichung Allgemeine Hinweise Um die Synchronisation der Nutzerdaten durchzuführen, starten Sie WebWeaver Desktop bitte ausschließlich mit dem für Ihre

Mehr

Gliederung. Einführung in die Computerlinguistik: Maschinelle Übersetzung. Können Computer übersetzen? Goethe Babel Fish Google

Gliederung. Einführung in die Computerlinguistik: Maschinelle Übersetzung. Können Computer übersetzen? Goethe Babel Fish Google Gliederung Einführung in die Computerlinguistik: Maschinelle Übersetzung WS 2008/2009 Manfred Pinkal! " Können Computer übersetzen?! " Was sind die Probleme?! " Was sind die möglichen Lösungen?! " Mensch-Computer-Interaktion

Mehr

State-of-the-Art in Software Product Line Testing and Lessons learned

State-of-the-Art in Software Product Line Testing and Lessons learned State-of-the-Art in Software Product Line Testing and Lessons learned Sebastian Oster Sebastian Oster oster@es.tu-darmstadt.de Tel.+49 6151 16 3776 ES Real-Time Systems Lab Prof. Dr. rer. nat. Andy Schürr

Mehr

UpToNet Installationsanleitung Einzelplatz und Netzwerk

UpToNet Installationsanleitung Einzelplatz und Netzwerk UpToNet Installationsanleitung Einzelplatz und Netzwerk Installationsanleitung Einzelplatz 1 Installationsanleitung Einzelplatz Wenn Sie im Besitz der Einzelplatz-Version der UpToNet KiSOffice Software

Mehr

Contao (Teil 37): Suchmaschinenoptimierung (1)

Contao (Teil 37): Suchmaschinenoptimierung (1) Web >> Contao Contao (Teil 37): Suchmaschinenoptimierung (1) Autor: daniel_koch Inhalt: Webseiten können eigentlich nur erfolgreich sein, wenn sie auch vernünftig über Suchmaschinen gefunden werden. Grund

Mehr

AutoSPARQL. Let Users Query Your Knowledge Base

AutoSPARQL. Let Users Query Your Knowledge Base AutoSPARQL Let Users Query Your Knowledge Base Christian Olczak Seminar aus maschinellem Lernen WS 11/12 Fachgebiet Knowledge Engineering Dr. Heiko Paulheim / Frederik Janssen 07.02.2012 Fachbereich Informatik

Mehr

Semantische Suche auf einem Web-Korpus

Semantische Suche auf einem Web-Korpus Semantische Suche auf einem Web-Korpus Philipp Bausch April 25, 2014 Philipp Bausch () Semantische Suche auf einem Web-Korpus April 25, 2014 1 / 18 Übersicht 1 Einleitung 2 Die Daten 3 Verarbeitung 4 Fazit

Mehr

Erkennung und Visualisierung attribuierter Phrasen in Poetiken

Erkennung und Visualisierung attribuierter Phrasen in Poetiken Erkennung und Visualisierung attribuierter Phrasen in Poetiken Andreas Müller (1), Markus John (2), Steffen Koch (2), Thomas Ertl (2) und Jonas Kuhn (1) Einleitung (1) Institut für Maschinelle Sprachverarbeitung,

Mehr

Umwandeln und Exportieren von Adobe-Illustrator-Dateien in Illustrator für Artcut

Umwandeln und Exportieren von Adobe-Illustrator-Dateien in Illustrator für Artcut Umwandeln und Exportieren von Adobe-Illustrator-Dateien in Illustrator für Artcut Unsere mitgelieferte Fonts & Grafik CD haben wir vom Hersteller des Plotters zur Verfügung gestellt bekommen. Die darauf

Mehr

Erzeugung zufälliger Graphen und Bayes-Netze

Erzeugung zufälliger Graphen und Bayes-Netze Erzeugung zufälliger Graphen und Bayes-Netze Proseminar Algorithmen auf Graphen Georg Lukas, IF2000 2002-07-09 E-Mail: georg@op-co.de Folien: http://op-co.de/bayes/ Gliederung 1. Einleitung 2. einfache

Mehr

Einführung Computerlinguistik. Konstituentensyntax II

Einführung Computerlinguistik. Konstituentensyntax II Einführung Computerlinguistik Konstituentensyntax II Hinrich Schütze & Robert Zangenfeind Centrum für Informations- und Sprachverarbeitung, LMU München 2013-11-18 Schütze & Zangenfeind: Konstituentensyntax

Mehr

Guideline. Integration von Google Analytics. in advertzoom

Guideline. Integration von Google Analytics. in advertzoom Guideline Integration von Google Analytics in advertzoom advertzoom GmbH advertzoom GmbH Stand November 2012 Seite [1] Inhalt 1 KPI aus Google Analytics übernehmen... 3 2 Grundlegende Funktionsweise...

Mehr

KUNERT BRANDSCHUTZDATENTECHNIK

KUNERT BRANDSCHUTZDATENTECHNIK WARTUNGS- VERWALTUNGS- UND ABRECHNUNGSSYSTEME Modul: Kleiderkammer KUNERT BRANDSCHUTZDATENTECHNIK email: kunert@feuerwehrsoftware.de URL: http://www.feuerwehrsoftware.de Inhaltsverzeichnis 1.0 Programmstart

Mehr

Sage 50 Allgemeine Datensicherung

Sage 50 Allgemeine Datensicherung Sage 50 Allgemeine Datensicherung Impressum Sage Software GmbH Hennes-Weisweiler-Allee 16 41179 Mönchengladbach Copyright 2015 Sage Software GmbH Die Inhalte und Themen in dieser Unterlage wurden mit sehr

Mehr

Basis. Schritt 1 Anmelden am Projess Testserver

Basis. Schritt 1 Anmelden am Projess Testserver Basis 2 Schritt 1 Anmelden am Projess Testserver 2 Schritt 2 Arbeitsstunden auf die bereits erfassten Projekte buchen 3 Schritt 3 Kostenaufwand auf die bereits erfassten Projekte buchen 4 Schritt 4 Gebuchte

Mehr

Bioinformatik. Lokale Alignierung Gapkosten. Silke Trißl / Ulf Leser Wissensmanagement in der. Bioinformatik

Bioinformatik. Lokale Alignierung Gapkosten. Silke Trißl / Ulf Leser Wissensmanagement in der. Bioinformatik Bioinformatik Lokale Alignierung Gapkosten Silke Trißl / Ulf Leser Wissensmanagement in der Bioinformatik Inhalt dieser Vorlesung Ähnlichkeit Lokales und globales Alignment Gapped Alignment Silke Trißl:

Mehr

1 topologisches Sortieren

1 topologisches Sortieren Wolfgang Hönig / Andreas Ecke WS 09/0 topologisches Sortieren. Überblick. Solange noch Knoten vorhanden: a) Suche Knoten v, zu dem keine Kante führt (Falls nicht vorhanden keine topologische Sortierung

Mehr

Sortierverfahren für Felder (Listen)

Sortierverfahren für Felder (Listen) Sortierverfahren für Felder (Listen) Generell geht es um die Sortierung von Daten nach einem bestimmten Sortierschlüssel. Es ist auch möglich, daß verschiedene Daten denselben Sortierschlüssel haben. Es

Mehr

Vorlesungsplan. Von Naïve Bayes zu Bayesischen Netzwerk- Klassifikatoren. Naïve Bayes. Bayesische Netzwerke

Vorlesungsplan. Von Naïve Bayes zu Bayesischen Netzwerk- Klassifikatoren. Naïve Bayes. Bayesische Netzwerke Vorlesungsplan 17.10. Einleitung 24.10. Ein- und Ausgabe 31.10. Reformationstag, Einfache Regeln 7.11. Naïve Bayes, Entscheidungsbäume 14.11. Entscheidungsregeln, Assoziationsregeln 21.11. Lineare Modelle,

Mehr

Social Business Intelligence Text Mining und Hadoop bei DB Fernverkehr AG

Social Business Intelligence Text Mining und Hadoop bei DB Fernverkehr AG Social Business Intelligence Text Mining und Hadoop bei DB Fernverkehr AG DB Fernverkehr AG Dr.-Ing. Axel Schulz, Dr. Matthias Platho P.FMB 2, DB Fernverkehr AG Frankfurt, 22.05.2015 Motivation An meinem

Mehr

22. Algorithmus der Woche Partnerschaftsvermittlung Drum prüfe, wer sich ewig bindet

22. Algorithmus der Woche Partnerschaftsvermittlung Drum prüfe, wer sich ewig bindet 22. Algorithmus der Woche Partnerschaftsvermittlung Drum prüfe, wer sich ewig bindet Autor Volker Claus, Universität Stuttgart Volker Diekert, Universität Stuttgart Holger Petersen, Universität Stuttgart

Mehr

Handbuch für Redakteure

Handbuch für Redakteure Handbuch für Redakteure Erste Schritte... 1 Artikel erstellen... 2 Artikelinhalt bearbeiten... 3 Artikel bearbeiten... 3 Grunddaten ändern... 5 Weitere Artikeleigenschaften... 5 Der WYSIWYG-Editor... 6

Mehr

Gliederung. Das TIGER-Korpus: Annotation und Exploration. TIGER-Korpus. 1. TIGER-Korpus. entstanden im Projekt TIGER (1999 heute) beteiligte Institute

Gliederung. Das TIGER-Korpus: Annotation und Exploration. TIGER-Korpus. 1. TIGER-Korpus. entstanden im Projekt TIGER (1999 heute) beteiligte Institute Das TIGER-Korpus: Annotation und Exploration Stefanie Dipper Forschungskolloquium Korpuslinguistik, 11.11.03 Gliederung 1. TIGER-Korpus 2. Annotation 3. Visualisierung 4. Suche, Retrieval 5. Demo 6. Repräsentation

Mehr

Leistungsbeschreibung. MWM-Pisa - Offerte. Die kostenlose GAEB-Angebotsbearbeitung für den Endanwender

Leistungsbeschreibung. MWM-Pisa - Offerte. Die kostenlose GAEB-Angebotsbearbeitung für den Endanwender Leistungsbeschreibung MWM-Pisa - Offerte Die kostenlose GAEB-Angebotsbearbeitung für den Endanwender Für unsere MWM-Pisa-Lizenznehmer steht nun die Anwendung MWM-Pisa-Offerte zur Verfügung. Um den Partnern

Mehr

Einführung in die Cross-Plattform Entwicklung Responsive Webdesign mit dem Intel XDK

Einführung in die Cross-Plattform Entwicklung Responsive Webdesign mit dem Intel XDK Einführung in die Cross-Plattform Entwicklung Responsive Webdesign mit dem Intel XDK Einführung Dieses Hands-on-Lab (HOL) macht den Leser mit dem Intel XDK und dem Responsive Webdesign vertraut. Es wird

Mehr

Wie erstellt man einen Kurs in OpenOLAT?

Wie erstellt man einen Kurs in OpenOLAT? Wie erstellt man einen Kurs in OpenOLAT? 1. Kurs anlegen 2. Kursstruktur aufbauen 3. Kurs publizieren und frei schalten 4. Kurs in den Katalog einfügen Voraussetzung: Autoren-Rechte Bevor Sie einen Kurs

Mehr

Antolin-Titel jetzt automatisch in WinBIAP kennzeichnen

Antolin-Titel jetzt automatisch in WinBIAP kennzeichnen & Antolin-Titel jetzt automatisch in WinBIAP kennzeichnen Immer mehr Schulen setzen das erfolgreiche Leseförderungsprojekt "Antolin" ein - und die Bibliotheken verzeichnen große Nachfrage nach den Kinderbüchern,

Mehr

Nachdem Sie die Datei (z.b. t330usbflashupdate.exe) heruntergeladen haben, führen Sie bitte einen Doppelklick mit der linken Maustaste darauf aus:

Nachdem Sie die Datei (z.b. t330usbflashupdate.exe) heruntergeladen haben, führen Sie bitte einen Doppelklick mit der linken Maustaste darauf aus: Deutsch 1.0 Vorbereitung für das Firmwareupdate Vergewissern Sie sich, dass Sie den USB-Treiber für Ihr Gerät installiert haben. Diesen können Sie auf unserer Internetseite unter www.testo.de downloaden.

Mehr

Algorithmische Methoden zur Netzwerkanalyse

Algorithmische Methoden zur Netzwerkanalyse Algorithmische Methoden zur Netzwerkanalyse Juniorprof. Dr. Henning Meyerhenke Institut für Theoretische Informatik 1 KIT Henning Universität desmeyerhenke, Landes Baden-Württemberg Institutund für Theoretische

Mehr

Babeș-Bolyai Universität Cluj Napoca Fakultät für Mathematik und Informatik Grundlagen der Programmierung MLG5005. Paradigmen im Algorithmenentwurf

Babeș-Bolyai Universität Cluj Napoca Fakultät für Mathematik und Informatik Grundlagen der Programmierung MLG5005. Paradigmen im Algorithmenentwurf Babeș-Bolyai Universität Cluj Napoca Fakultät für Mathematik und Informatik Grundlagen der Programmierung MLG5005 Paradigmen im Algorithmenentwurf Problemlösen Problem definieren Algorithmus entwerfen

Mehr

Dokumentation IBIS Monitor

Dokumentation IBIS Monitor Dokumentation IBIS Monitor Seite 1 von 16 11.01.06 Inhaltsverzeichnis 1. Allgemein 2. Installation und Programm starten 3. Programmkonfiguration 4. Aufzeichnung 4.1 Aufzeichnung mitschneiden 4.1.1 Inhalt

Mehr

Adobe Photoshop CS2, CS3, CS4, CS5 mit Auto-SoftProof-Ansicht

Adobe Photoshop CS2, CS3, CS4, CS5 mit Auto-SoftProof-Ansicht Typischerweise belässt und bearbeitet man digitale Bilder im RGB-Farbmodus, auch wenn das Hauptausgabeziel ein CMYK- Farbraum ist. Um eine farbliche Kontrolle des Ergebnisses während der Bearbeitung zu

Mehr

Mathematische Grundlagen der Computerlinguistik Bäume

Mathematische Grundlagen der Computerlinguistik Bäume Mathematische Grundlagen der Computerlinguistik Dozentin: Wiebke Petersen 6. Foliensatz (basierend auf Folien von Gerhard Jäger) Wiebke Petersen math. Grundlagen 1 Baumdiagramme Ein Baumdiagramm eines

Mehr

Import Zertifikate ELM

Import Zertifikate ELM Installation Zertifikate für ELM Um eine fehlerfreie Kommunikation mit dem ELM-Distributor zu gewährleisten, müssen zusätzlich Zertifikate installiert werden. Diese werden über den Konsolenstamm von Windows

Mehr

Rechner- und Systemoptimierung für die Benutzung von WinPC-NC Light und WinPC-NC Economy

Rechner- und Systemoptimierung für die Benutzung von WinPC-NC Light und WinPC-NC Economy Rechner- und Systemoptimierung für die Benutzung von WinPC-NC Light und WinPC-NC Economy Mit nachfolgendem Leitfaden beschreiben wir die Vorgehensweise, um ein bestehendes Windows XP- System soweit zu

Mehr

Programmierkurs Python II

Programmierkurs Python II Programmierkurs Python II Michaela Regneri & tefan Thater FR 4.7 Allgemeine Linguistik (Computerlinguistik) Universität des aarlandes ommersemester 2010 (Charniak, 1997) the dog biscuits N V N V the dog

Mehr

Semantic Web. Anwendungsbereiche & Entwicklungen. http://www.know-center.at. Dr. Michael Granitzer

Semantic Web. Anwendungsbereiche & Entwicklungen. http://www.know-center.at. Dr. Michael Granitzer Semantic Web Anwendungsbereiche & Entwicklungen Dr. Michael Granitzer - gefördert durch das Kompetenzzentrenprogramm Agenda Die Vision und warum das Semantic Web Sinn macht Grundlagen: Wissensrepräsentation

Mehr

Softwareprojektpraktikum Maschinelle Übersetzung

Softwareprojektpraktikum Maschinelle Übersetzung Softwareprojektpraktikum Maschinelle Übersetzung Jan-Thorsten Peter, Andreas Guta {peter,guta}@i6.informatik.rwth-aachen.de Vorbesprechung 1. Aufgabe 09. April 2014 Human Language Technology and Pattern

Mehr

Prozesse die unbekannten Wesen

Prozesse die unbekannten Wesen Logistiktag 2009 Prozesse die unbekannten Wesen SIRIUSlogic Frankfurt am Main, 23. Juni 2009 www.sirius-consult.com Agenda Vorstellung SIRIUS Consulting & Training AG Projektverständnis und -vorgehensweise

Mehr

Entwicklung einer KI für Skat. Hauptseminar Erwin Lang

Entwicklung einer KI für Skat. Hauptseminar Erwin Lang Entwicklung einer KI für Skat Hauptseminar Erwin Lang Inhalt Skat Forschung Eigene Arbeit Risikoanalyse Skat Entwickelte sich Anfang des 19. Jahrhunderts Kartenspiel mit Blatt aus 32 Karten 3 Spieler Trick-taking

Mehr

Handbuch. Terminverwaltungssoftware für Microsoft Windows und TomTom Telematics

Handbuch. Terminverwaltungssoftware für Microsoft Windows und TomTom Telematics Handbuch Terminverwaltungssoftware für Microsoft Windows und TomTom Telematics Systemanforderungen ab Microsoft Windows Vista Service Pack 2, Windows 7 SP 1 Microsoft.NET Framework 4.5 Full ab Microsoft

Mehr