Lösung - Übungsblatt 1

Ähnliche Dokumente
String Matching. Fabian Panse. Universität Hamburg. Komplexe Informationssysteme

Monotonie einer Folge

Elemente der Mathematik - Winter 2016/2017

Kleines Matrix-ABC. Fachgebiet Regelungstechnik Leiter: Prof. Dr.-Ing. Johann Reger. 1 Elementares

Kombinatorik. Systematisches Abzählen und Anordnen einer endlichen Menge von Objekten unter Beachtung vorgegebener Regeln.

6. Übung - Differenzengleichungen

9. ENDLICH ERZEUGTE MODULN UND GANZHEIT

Eigenschaften von Texten

String Matching. Fabian Panse. Universität Hamburg. Komplexe Informationssysteme

Nicht-Anwendbarkeit des Master- Theorems

Übungsaufgaben zu Analysis 1 Lösungen von Blatt XII vom sin(nx) n sin(x). sin(ax) a sin(x) z = re iϕ = r(cos(ϕ) + i sin(ϕ)) z n = w

Übungen zur Analysis 1 für Informatiker und Statistiker. Lösung zu Blatt 8

Klausur 1 über Folgen

Tutorium Mathematik I, M Lösungen

Numerische Lineare Algebra - Theorie-Blatt 2

Aufgaben zu Kapitel 2

D-ITET Analysis I HS 2018 Prof. Alessandra Iozzi. Musterlösung 6. und berechnen. = lim. = lim. n n. = lim

D-MATH, D-PHYS, D-CHAB Analysis II FS 2018 Prof. Manfred Einsiedler. Lösung 2

D-MATH, D-PHYS, D-CHAB Analysis I HS 2017 Prof. Manfred Einsiedler. Übungsblatt 8. b n := 1 n. a k. k=1

Herzlich Willkommen zur Vorlesung. Analysis I SoSe 2013

Funktionenreihen. 1-E1 Ma 2 Lubov Vassilevskaya

Kleingruppen zur Service-Veranstaltung Mathematik I fu r Ingenieure bei Prof. Dr. G. Herbort im WS12/13 Dipl.-Math. T. Pawlaschyk,

0.1 E: Der Haupsatz der Mineralogie

Zusammenfassung: Folgen und Konvergenz

Höhere Mathematik I (Analysis) für die Fachrichtung Informatik

Besprechung: S. 1/1

TECHNISCHE UNIVERSITÄT MÜNCHEN

( 1) n a n. a n 10. n=1 a n konvergiert, dann gilt lim a n = 0. ( 1) n+1

Reelle Folgen. Definition. Eine reelle Folge ist eine Abbildung f : N R. liefert ( 7 9, 37

Klausur zur Analysis II

Abschlussprüfung 2012 an den Realschulen in Bayern

Positiv denken! Lösungen

Vorlesung Informatik 2 Algorithmen und Datenstrukturen. (02 Funktionenklassen) Prof. Dr. Susanne Albers

ELEMENTE DER ZAHLENTHEORIE UND AUFBAU DES ZAHLENSYSTEMS

Übersicht. Datenstrukturen und Algorithmen. Rekursionsgleichungen. Übersicht. Vorlesung 6: Mastertheorem (K4) Joost-Pieter Katoen

Kunde. Kontobewegung

Die vollständige Induktion - Lösungen 1. Aufgabe: Sind die folgenden Aussageformen in N allgemeingültig?

Übungsblatt 02 Grundkurs IIIa für Physiker, Wirtschaftsphysiker und Physik Lehramt

Diplomvorprüfung Stochastik

K O M B I N A T O R I K

Die Wurzel einer Zahl a ist die Zahl, die mit sich selbst malgenommen wieder a ergibt.

Wir weisen die Gültigkeit der 4Axiome der sigma-algebra für die Potenzmenge einer endlichen Menge A nach!

Allgemeine Lösungen der n-dimensionalen Laplace-Gleichung und ihre komplexe Variable

Zusammenfassung: Folgen und Konvergenz

Tutorium Mathematik ITB1(B), WI1(B)

Index. Majorante, 24 Minorante, 23. Partialsumme, 17

3 Arrays, Strings. 3.1 Arrays 3-1. In der Mathematik und Technik tauchen oft Schreibweisen auf wie x i... i = 1, 2, 3,...n ...

Musterlösungen zur Klausur Analysis I Verständnisteil

Kapitel 2. Terme. oder (x + 1)(x 1) = x 2 1

Grundlagen der Mathematik (LPSI/LS-M1)

Computer-Graphik II Verallgemeinerte Baryzentrische Koordinaten

4.3 Relationen [ Partee 27-30, 39-51, McCawley , Chierchia ]

Der Groß-O-Kalkül. Additionsregel. Zunächst ein paar einfache "Rechen"-Regeln: " ": Sei. Lemma, Teil 2: Für beliebige Funktionen f und g gilt:

Indizieren Sie die folgenden Summen und Produkte gemäß der Vorgabe um und schreiben Sie sie einmal explizit aus: 5

10. Übungsblatt zur Einführung in die Stochastik

Lösungen zum Ferienkurs Analysis 1, Vorlesung 2 Wintersemester 2014/2015

4 Andreas Gathmann. x 2 +y 2 x 2 +y 2 x 2 +y 2

Proseminar Lineare Algebra WS 2016/17

MISSION ALPHA. Wähle einen Zielraum und führe dort eine Interagieren-Aktion aus. Wähle drei Schleusen aus und zerstöre sie. Sammle 5 Frags.

Langrange-Multiplikators und Hinreichende Bedingungen

Kompaktheit und gleichgradige Stetigkeit. 1 Einführung in die Kompaktheit in C 0

8. Übungsblatt Aufgaben mit Lösungen

Übungen zur Vorlesung Funktionentheorie Sommersemester Musterlösung zu Blatt 11. c n (z a) n,

4.1 Dezimalzahlen und Intervallschachtelungen. a) Reelle Zahlen werden meist als Dezimalzahlen dargestellt, etwa

Höhere Mathematik I für die Fachrichtungen Elektroingenieurwesen, Physik und Geodäsie Lösungsvorschläge zum 5. Übungsblatt

Zusatzmaterial zur Mathematik I für E-Techniker Übung 4

Gleichungen und Ungleichungen. Mathematische Grundlagen. Beispiel. Beispiel. Lösung einer quadratischen Gleichung:

7.7. Abstände und Winkel

9. Übungsblatt Aufgaben mit Lösungen

D-MATH, D-PHYS, D-CHAB Analysis I HS 2017 Prof. Manfred Einsiedler. Übungsblatt 5. (1 + x) n 1 + nx

h a 2 b 1 h a1 b 2 h a1 b 1 h a1. h a 2. h.b1 h ij h 11 h 12 h 21 a b h. j h 1. h 2. h.1 a b h i. =h i1 h i2... h i m h. j =h 1j h 2j... h k j h.

R. Brinkmann Seite

Kapitel I Zahlenfolgen und -reihen

Ungleichungen werden mit Äquivalenzumformungen gelöst. Hierzu werden die sogenannten Monotoniegesetze angegeben.

D-MATH Topologie FS 15 Theo Bühler. Musterlösung 2

Abschlussprüfung 2011 an den Realschulen in Bayern

Seminar: Randomisierte Algorithmen Routenplanung in Netzwerken

TECHNISCHE UNIVERSITÄT MÜNCHEN

4-1 Elementare Zahlentheorie

7.5. Aufgaben zu Skalarprodukt und Vektorprodukt

2. Diophantische Gleichungen

Analysis II Sommer 2016 Prof. Dr. George Marinescu / Dr. Frank Lapp Übung

Vorkurs Mathematik für Informatiker Folgen

Lösungen zum Aufgabenblatt 9

Übungen zur Analysis I WS 2008/2009

sfg Quadratwurzeln a ist diejenige nichtnegative Zahl (a 0), die quadriert a ergibt: Die Zahl a unter der Wurzel heißt Radikand:

TECHNISCHE UNIVERSITÄT MÜNCHEN

Humboldt-Universität zu Berlin Wintersemester 2017/18. Mathematisch-Naturwissenschaftliche Fakultät II Institut für Mathematik A.

Herzlich Willkommen zur Vorlesung. Analysis I SoSe 2014

Perkolation (WS 2014) Übungsblatt 2

Beweis des ausgezeichneten numerischen Theorems über die Koeffizienten der Binomialpotenzen

Aufgaben zu Kapitel 8

Ein Kreis mit dem Mittelpunkt M=(1 2) geht durch den Punkt P=(4-2). Bestimme den Radius des Kreises und die Kreisgleichung.

II. Grundlagen der Programmierung. Variable: Literale (Konstanten) Operatoren & Ausdrücke. Variablendeklaration:

(a) Richtig, die Varianz ist eine Summe quadratischer Größen.

1 Randomisierte Bestimmung des Medians

Es gibt verschiedene Möglichkeiten eine Folge zu definieren. Die zwei häufigsten Methoden

Übung 1 Algorithmen II

Höhere Mathematik I für die Fachrichtungen Elektroingenieurwesen, Physik und Geodäsie Lösungsvorschläge zum 7. Übungsblatt

Transkript:

Lösug - Übugsblatt 1 (Strig Matchig) Fabia Pase pase@iformatik.ui-hamburg.de Uiversität Hamburg

Aufgabe 1: Overlap Measure ud Jaccard Koeffiziet Gegebe: x = Heri Wateroose ud y = Hery Waterose Tokebildug durch -grams X = { ##H, #He, He, er, ri, ri, i W, Wa, Wat, ate, ter, er, ro, oo, oos, ose, se#, e## } Y = { ##H, #He, He, er, ry, ry, y W, Wa, Wat, ate, ter, er, ro, os, ose, se#, e## } X = { ##H, #He, He, er, ri, ri, i W, Wa, Wat, ate, ter, er, ro, oo, oos, ose, se#, e## } Y = { ##H, #He, He, er, ry, ry, y W, Wa, Wat, ate, ter, er, ro, os, ose, se#, e## } O(X, Y ) = 1 Jacc(X, Y ) = 1/ = 0.591 Fabia Pase Lösug - Blatt 1

Aufgabe : Leveshtei Distaz/Ählichkeit Gegebe: x = Sea ud y = Shaw ε s e a ε s h a w 0 1 1 5 LevDst(x, y) = LevSim(x, y) = 1 max(,5) = 0.6 Fabia Pase Lösug - Blatt 1

Aufgabe : Leveshtei Distaz/Ählichkeit Gegebe: x = Sea ud y = Shaw ε s e a ε s h a w 0 1 1 0 1 1 5 LevDst(x, y) = LevSim(x, y) = 1 max(,5) = 0.6 Fabia Pase Lösug - Blatt 1

Aufgabe : Leveshtei Distaz/Ählichkeit Gegebe: x = Sea ud y = Shaw ε s e a ε s h a w 0 1 1 0 1 1 1 5 LevDst(x, y) = LevSim(x, y) = 1 max(,5) = 0.6 Fabia Pase Lösug - Blatt 1

Aufgabe : Leveshtei Distaz/Ählichkeit Gegebe: x = Sea ud y = Shaw ε s e a ε s h a w 0 1 1 0 1 1 1 1 5 LevDst(x, y) = LevSim(x, y) = 1 max(,5) = 0.6 Fabia Pase Lösug - Blatt 1

Aufgabe : Leveshtei Distaz/Ählichkeit Gegebe: x = Sea ud y = Shaw ε s e a ε s h a w 0 1 1 0 1 1 1 1 5 LevDst(x, y) = LevSim(x, y) = 1 max(,5) = 0.6 Fabia Pase Lösug - Blatt 1

Aufgabe : Leveshtei Distaz/Ählichkeit Gegebe: x = Sea ud y = Shaw ε s e a ε s h a w 0 1 1 0 1 1 1 1 5 LevDst(x, y) = LevSim(x, y) = 1 max(,5) = 0.6 Fabia Pase Lösug - Blatt 1

Aufgabe : Affie Gap Distace Gegebe: x = Marti Thomas Doe ud y = Marti T Do Koste für Öffe eier Lücke: w g = 1 Koste für Weiterführe eier Lücke: w s = 0. Die erste Lücke l 1 umfasst de substrig homas Gesamtkoste der Lücke: w(l 1 ) = 1 + 0. = 1.8 Die zweite Lücke l umfasst de substrig e Gesamtkoste der Lücke: w(l ) = 1 Gesamtkoste:.8 Fabia Pase Lösug - Blatt 1

Aufgabe : Soudex Code Gegebe: x = depardieu, y = debado ud z = tepadeu depardieu debado tepadeu Step 1 dprd dbd tpd Step d16 d15 t1 Step d16 d15 t1 Step d16 d15 t10 Mit Ausahme des erste Buchstabe werde alle Vorkommisse der Buchstabe a, e, i, o, u, y, h, ud w etfert Mit Ausahme des erste Buchstabe werde alle verbliebede Buchstabe durch Ziffer ersetzt (b,p 1, r 6, d, 5) Alle aufeiaderfolgee Auftrete der gleiche Ziffer werde durch ei eizele Auftrete ersetzt Der Code wird auf die Läge vier beschräkt (Auffülle mit 0 ) Fabia Pase Lösug - Blatt 1 5

Aufgabe 5: Exteded Jaccard Gegebe: x = Tom Joh Kim ud y = Tim Jo threshold θ = 0.5 Leveshtei Ählichkeite der Toke Tom Joh Kim Tim / 0 / Jo 1/ / 0 shared(x, Y ) = {( Tom, Tim ),( Joh, Jo ),( Kim, Tim )} uique(x ) = uique(y ) = ExtJacc(X, Y ) = +0+0 = = 1 Fabia Pase Lösug - Blatt 1 6

Aufgabe 5: Geeralized Jaccard Gegebe: x = Tom Joh Kim ud y = Tim Jo threshold θ = 0.5 Tim 0.66 Tom 0. 0 Joh 0.75 Jo 0 0.66 Kim GeJacc(X, Y ) = 0.66+0.75 + = 1.1 = 0.7 Fabia Pase Lösug - Blatt 1 7

Aufgabe 5: Geeralized Jaccard Gegebe: x = Tom Joh Kim ud y = Tim Jo threshold θ = 0.5 Tim 0.66 Tom Jo 0.75 0.66 Joh Kim GeJacc(X, Y ) = 0.66+0.75 + = 1.1 = 0.7 Fabia Pase Lösug - Blatt 1 7

Aufgabe 5: Geeralized Jaccard Gegebe: x = Tom Joh Kim ud y = Tim Jo threshold θ = 0.5 Tim 0.66 Tom 0.75 Joh Jo Kim GeJacc(X, Y ) = 0.66+0.75 + = 1.1 = 0.7 Fabia Pase Lösug - Blatt 1 7

Aufgabe 5: Moge-Elka Tim 0.66 0. Tom Joh Tim Tom 0 Joh 0.75 Jo Kim Jo Kim Tom Tim Joh Jo 0 0.66 Kim MogeElka(Y, X ) = 1 (0.66 + 0.75 + 0.66) = 0.69 Fabia Pase Lösug - Blatt 1 8

Aufgabe 6: TF/IDF term frequecy: tf x 1 x x x x 5 x 6 Isurace 1 1 0 1 0 0 Compay 1 0 1 0 1 0 A&B 0 1 0 0 1 0 BC 0 0 1 0 0 0 AX 0 0 1 1 0 0 XY 0 0 0 0 0 Eterprises 0 0 0 0 0 1 Fabia Pase Lösug - Blatt 1 9

Aufgabe 6: TF/IDF iverse documet frequecy: idf Isurace 6/ = Compay 6/ = A&B 6/ = BC 6/1 = 6 AX 6/ = XY 6/1 = 6 Eterprises 6/1 = 6 Fabia Pase Lösug - Blatt 1 9

Aufgabe 6: TF/IDF Kosius Ählichkeit zwische x ud x : v =, 0,, 0, 0, 0, 0 v =, 0, 0, 0,, 0, 0 CosSim(x, x ) = (+0+0+0+0+0+0)/( + 9 + 9) = /( 1 1) = /1 Fabia Pase Lösug - Blatt 1 9

Aufgabe 7: Skalierbarkeit a) Aufbaue eies ivertierte Idexes über die Toke der eizele Strigwerte vo B Mege B Y 1 = {alpha, beta, delta, iota} Y = {gamma, delta} Y = {alpha, beta, zeta} Y = {alpha, gamma, iota, zeta} Y 5 = {alpha, iota} Toke i B ID Liste alpha 1,,,5 beta 1, gamma, delta 1, iota 1,,5 zeta, Kadidate aufgrud Toke alpha : {1,,,5} Kadidate aufgrud Toke delta : {1,} Kadidate aufgrud Toke zeta : {,} Gesamte Mege a Kadidate: {1,,,,5} (also alle) Fabia Pase Lösug - Blatt 1 10

Aufgabe 7: Skalierbarkeit b) Verwedug des Size Filterigs Mege B Y 1 = {alpha, beta, delta, iota} Y = {gamma, delta} Y = {alpha, beta, zeta} Y = {alpha, gamma, iota, zeta} Y 5 = {alpha, iota} Gegebe: θ = 0.8 ud X ={alpha, delta, zeta} Damit y i ei Match vo x sei ka, muss also gelte:. = 0.8 Y i /0.8 =.75 Das eizige y i B für welches dies gilt ist y Gesamte Mege a Kadidate: {} Fabia Pase Lösug - Blatt 1 11

Aufgabe 7: Skalierbarkeit c) Verwedug des Prefix Filterigs Mege B Y 1 = {alpha, beta, delta, iota} Y = {gamma, delta} Y = {alpha, beta, zeta} Y = {alpha, gamma, iota, zeta} Y 5 = {alpha, iota} Y i k X k 1 1 {alpha} {alpha} 5 {alpha} Gegebe: θ = 0.8, X =, Jaccard Koeffiziet Damit y i ei Match vo x sei ka, muss also gelte: X Y i k = θ 1+θ ( X + Y i ) = 0. ( + Y i ) Y i muss die erste X (k 1) Toke vo X beihalte 1 ud scheide aus, da sie gemeisame Toke bräuchte, ud 5 sid Kadidate we sie alpha beihalte Gesamte Mege a Kadidate: {,5} Fabia Pase Lösug - Blatt 1 1