Distanzen und Ähnlichkeitsmaÿe

Ähnliche Dokumente
Einleitung Grundlagen Einordnung. Normen. Thomas Gerstner. Institut für Mathematik Goethe-Universität Frankfurt am Main

Analysis 2 UE VI) 121, 129, 133, 134, 140, 143

Lineare Algebra I Vorlesung - Prof. Dr. Daniel Roggenkamp & Falko Gauß

Ähnlichkeits- und Distanzmaße

L3 Euklidische Geometrie: Längen, Winkel, senkrechte Vektoren...

L3 Euklidische Geometrie: Längen, Winkel, senkrechte Vektoren...

entspricht der Länge des Vektorpfeils. Im R 2 : x =

Mathematik für Anwender II

Reelles Skalarprodukt

Einführung in die Ähnlichkeitsmessung

Übungen zu Multimedia-Datenbanken Aufgabenblatt 4 - Musterlösungen

Kapitel 6. Metrik, Norm und Skalarproduktl. 6.1 Metrik (Abstand)

V. Metriken. Gliederung. I. Motivation. Lesen mathematischer Symbole. Wissenschaftliche Argumentation. Matrizenrechnung. Seite 67

Lineare Algebra. Inhalt. Hauptbestandteil der Vorlesung Mathematik 2 Literatur: Teschl/Teschl, Band 1, Kap. 9-14

1.2 Abstände und Winkel

5. Clusteranalyse. Lernziele: Grundlegende Algorithmen der Clusteranalyse kennen, ihre Eigenschaften

Vorlesung Mathematik 2 für Informatik

5. Clusteranalyse Vorbemerkungen. 5. Clusteranalyse. Grundlegende Algorithmen der Clusteranalyse kennen, ihre Eigenschaften

Vektorräume. 1. v + w = w + v (Kommutativität der Vektoraddition)

Mathematik I. Vorlesung 19. Metrische Räume

Topologische Grundbegriffe II. Inhaltsverzeichnis

Brückenkurs Mathematik

Klausur zur Mathematik I (Modul: Lineare Algebra I)

Skalarprodukt, Norm & Metrik

Kurzskript zur Vorlesung Mathematik I für MB, WI/MB und andere Prof. Dr. Ulrich Reif

Mathematik für Naturwissenschaftler II SS 2010

Erich Schubert, Arthur Zimek KDD Übung

5 Teilmengen von R und von R n

Angewandte Multivariate Statistik Prof. Dr. Ostap Okhrin

Kapitel VI. Euklidische Geometrie

Clustering 2010/06/11 Sebastian Koch 1

Entscheidungen bei der Durchführung einer Cluster-Analyse

1 Euklidische und unitäre Vektorräume

Metrische Räume und stetige Abbildungen. Inhaltsverzeichnis

Inhalt. Mathematik für Chemiker II Lineare Algebra. Vorlesung im Sommersemester Kurt Frischmuth. Rostock, April Juli 2015

Übungsaufgaben zu den mathematischen Grundlagen von KM

Mathematische Grundlagen

Lineare Algebra und analytische Geometrie II

Analyis I -Metrische Räume - eine Einführung in die Topologie

Verallgemeinerte Dreiecksungleichungen Michael Kapovich

Ähnlichkeits- und Distanzmaße

6 Distanzfunktionen (2) 6 Distanzfunktionen. 6.1 Eigenschaften und Klassifikationen. Einführung

Abstände und Zwischenwinkel

6 Distanzfunktionen. Quadratische Pseudo. 1. Eigenschaften und Klassifikation

Kapitel I: Vektorrechnung 2: Vektoren im Raum

1 Metrische Räume. In diesem Abschnitt wollen wir den Begriff des metrischen Raumes einführen und an einigen Beispielen illustrieren.

Kontrollfragen und Aufgaben zur 3. Konsultation

Mathematische Grundlagen

30 KAPITEL 2. REELLE UND KOMPLEXE ZAHLEN

Seminar Einführung in die Kunst mathematischer Ungleichungen

Vorkurs Mathematik Intensiv. Vektoren, Skalarprodukte und Geraden in der Ebene Musterlösung

Einführung in die Kodierungstheorie

Diskriminanzanalyse mit binären Daten

Tutorium 7. Definition. Sei V ein C-Vektorraum. Eine Abbildung, : V V C heißt komplexes Skalarprodukt : det F k > 0 mit F k := (f i,j ) C k k

Probeklausur zur Analysis 2, SoSe 2017

1. Funktionen und Stetigkeit

Das Universum als RaumZeit

1. Metrik, Norm und das Skalarprodukt

Gradient eines Skalarfeldes

Lineare Algebra. Mathematik II für Chemiker. Daniel Gerth

9 Metrische und normierte Räume

Brückenkurs Mathematik. Mittwoch Freitag

Vorkurs Mathematik. Vektoren, lineare Gleichungssysteme und Matrizen

achsenparallele Stauchung und Streckung durch Gewichte :

Kapitel 17 Skalar- und Vektorprodukt

FH Gießen-Friedberg, FB 06 (MNI) Lösungen zu Übungsblatt 5 Lineare Algebra 21. November 2008 Prof. Dr. H.-R. Metz

8 Euklidische und unitäre Vektorräume. Skalarprodukte Orthogonalität Matrizen

T = {t 1,..., t n } sei die Menge der Terme. D = {d 1,..., d m } sei die Menge der Dokumente.

Zahlen und metrische Räume

Wie in der reellen Analysis üblich notiert man Folgen f in der Form

03. Vektoren im R 2, R 3 und R n

Numerik I. Aufgaben und Lösungen

03. Vektoren im R 2, R 3 und R n

Lernunterlagen Vektoren in R 2

2 Euklidische Vektorräume

Mathematische Grundlagen III

Topologie metrischer Räume

TECHNISCHE UNIVERSITÄT MÜNCHEN Zentrum Mathematik

$Id: folgen.tex,v /05/31 12:40:06 hk Exp $ an 1 2 n 1 ist gerade, 3a n 1 + 1, a n 1 ist ungerade.

Metrische Räume. Kapitel Begriff des metrischen Raumes

Hauptsatz der Zahlentheorie.

Höhere Mathematik III für Physiker Analysis 2

Multivariate Verfahren

Zahlen und metrische Räume

Orthonormalisierung. ein euklidischer bzw. unitärer Vektorraum. Wir setzen

Ideen und Konzepte der Informatik. Maschinelles Lernen. Kurt Mehlhorn

Vektor und Matrixnormen Vorlesung vom

Lernende Vektorquantisierung

Die Hamming-Distanz definiert eine Metrik.

Theoretische Informatik 1

Z Zusätze. Z.1 Konvergenz in metrischen Räumen

Notation und Einführung

a) x 0, (Nichtnegativität) b) x = 0 x = 0, (Eindeutigkeit) c) αx = α x, (Skalierung)

1 C. Ee 1 D B C. ; : : : ; Ee n D ; Ee 2 D B C : : A 2Rn A : v 1 v 2. Ev D B. A D v 1Ee 1 C v 2 Ee 2 C C v n Ee n : (30.3) v n

Euklidische und unitäre Vektorräume

2.2 Kollineare und koplanare Vektoren

Länge eines Vektors und Abstand von zwei Punkten 2. 4 = 6. Skalarprodukt und Winkel zwischen Vektoren

Transkript:

Distanzen und Ähnlichkeitsmaÿe Michael Siebers Kognitive Systeme Universität Bamberg 25. Mai 2011 M. Siebers (KogSys) Distanzen und Ähnlichkeitsmaÿe 25. Mai 2011 1 / 14

Agenda 1 Distanzen 2 Ähnlichkeitsmaÿe 3 Nominale Attribute M. Siebers (KogSys) Distanzen und Ähnlichkeitsmaÿe 25. Mai 2011 2 / 14

Motivation Wo werden Distanzen und Ähnlichkeitsmaÿe verwendet? M. Siebers (KogSys) Distanzen und Ähnlichkeitsmaÿe 25. Mai 2011 3 / 14

Motivation Wo werden Distanzen und Ähnlichkeitsmaÿe verwendet? Clusteringverfahren M. Siebers (KogSys) Distanzen und Ähnlichkeitsmaÿe 25. Mai 2011 3 / 14

Motivation Wo werden Distanzen und Ähnlichkeitsmaÿe verwendet? Clusteringverfahren Lernverfahren (z. B. k-nearest neighbors) M. Siebers (KogSys) Distanzen und Ähnlichkeitsmaÿe 25. Mai 2011 3 / 14

Inhalt 1 Distanzen 2 Ähnlichkeitsmaÿe 3 Nominale Attribute M. Siebers (KogSys) Distanzen und Ähnlichkeitsmaÿe 25. Mai 2011 4 / 14

Distanzen informell Die Distanz zwischen zwei Objekten stellt intuitiv ihren Abstand voneinander dar. M. Siebers (KogSys) Distanzen und Ähnlichkeitsmaÿe 25. Mai 2011 5 / 14

Distanzen informell Die Distanz zwischen zwei Objekten stellt intuitiv ihren Abstand voneinander dar. Ein Objekt kann hierbei alles mögliche sein: M. Siebers (KogSys) Distanzen und Ähnlichkeitsmaÿe 25. Mai 2011 5 / 14

Distanzen informell Die Distanz zwischen zwei Objekten stellt intuitiv ihren Abstand voneinander dar. Ein Objekt kann hierbei alles mögliche sein: eine Zahl M. Siebers (KogSys) Distanzen und Ähnlichkeitsmaÿe 25. Mai 2011 5 / 14

Distanzen informell Die Distanz zwischen zwei Objekten stellt intuitiv ihren Abstand voneinander dar. Ein Objekt kann hierbei alles mögliche sein: eine Zahl ein Baum M. Siebers (KogSys) Distanzen und Ähnlichkeitsmaÿe 25. Mai 2011 5 / 14

Distanzen informell Die Distanz zwischen zwei Objekten stellt intuitiv ihren Abstand voneinander dar. Ein Objekt kann hierbei alles mögliche sein: eine Zahl ein Baum eine Funktion M. Siebers (KogSys) Distanzen und Ähnlichkeitsmaÿe 25. Mai 2011 5 / 14

Distanzen informell Die Distanz zwischen zwei Objekten stellt intuitiv ihren Abstand voneinander dar. Ein Objekt kann hierbei alles mögliche sein: eine Zahl ein Baum eine Funktion eine Menge von Objekten M. Siebers (KogSys) Distanzen und Ähnlichkeitsmaÿe 25. Mai 2011 5 / 14

Distanzen informell Die Distanz zwischen zwei Objekten stellt intuitiv ihren Abstand voneinander dar. Ein Objekt kann hierbei alles mögliche sein: eine Zahl ein Baum eine Funktion eine Menge von Objekten Normalerweise werden nur Distanzen zwischen gleichartigen Objekten betrachtet. M. Siebers (KogSys) Distanzen und Ähnlichkeitsmaÿe 25. Mai 2011 5 / 14

Distanzen formal Die Distanz zwischen zwei Objekten x und y wird geschrieben als: d(x, y). M. Siebers (KogSys) Distanzen und Ähnlichkeitsmaÿe 25. Mai 2011 6 / 14

Distanzen formal Die Distanz zwischen zwei Objekten x und y wird geschrieben als: d(x, y). d: M M R M. Siebers (KogSys) Distanzen und Ähnlichkeitsmaÿe 25. Mai 2011 6 / 14

Distanzen formal Die Distanz zwischen zwei Objekten x und y wird geschrieben als: d(x, y). d: M M R Damit es sich tatsächlich um eine Distanz handelt, muss sie für beliebige x, y, z M folgende Bedingungen erfüllen: M. Siebers (KogSys) Distanzen und Ähnlichkeitsmaÿe 25. Mai 2011 6 / 14

Distanzen formal Die Distanz zwischen zwei Objekten x und y wird geschrieben als: d(x, y). d: M M R Damit es sich tatsächlich um eine Distanz handelt, muss sie für beliebige x, y, z M folgende Bedingungen erfüllen: 1 d(x, y) = 0 x = y (Denitheit) M. Siebers (KogSys) Distanzen und Ähnlichkeitsmaÿe 25. Mai 2011 6 / 14

Distanzen formal Die Distanz zwischen zwei Objekten x und y wird geschrieben als: d(x, y). d: M M R Damit es sich tatsächlich um eine Distanz handelt, muss sie für beliebige x, y, z M folgende Bedingungen erfüllen: 1 d(x, y) = 0 x = y (Denitheit) 2 d(x, y) = d(y, x) (Symmetrie) M. Siebers (KogSys) Distanzen und Ähnlichkeitsmaÿe 25. Mai 2011 6 / 14

Distanzen formal Die Distanz zwischen zwei Objekten x und y wird geschrieben als: d(x, y). d: M M R Damit es sich tatsächlich um eine Distanz handelt, muss sie für beliebige x, y, z M folgende Bedingungen erfüllen: 1 d(x, y) = 0 x = y (Denitheit) 2 d(x, y) = d(y, x) (Symmetrie) 3 d(x, z) d(x, y) + d(y, z) (Dreiecksungleichung) M. Siebers (KogSys) Distanzen und Ähnlichkeitsmaÿe 25. Mai 2011 6 / 14

Distanzen formal Die Distanz zwischen zwei Objekten x und y wird geschrieben als: d(x, y). d: M M R Damit es sich tatsächlich um eine Distanz handelt, muss sie für beliebige x, y, z M folgende Bedingungen erfüllen: 1 d(x, y) = 0 x = y (Denitheit) 2 d(x, y) = d(y, x) (Symmetrie) 3 d(x, z) d(x, y) + d(y, z) (Dreiecksungleichung) Aus 1 und 3 ergibt sich automatisch d(x, y) 0 M. Siebers (KogSys) Distanzen und Ähnlichkeitsmaÿe 25. Mai 2011 6 / 14

Exkurs: Normen, Metriken Norm Eine Norm ist die Verallgemeinerung der Länge eines Vektors. Die Norm eines Vektors x wird als x notiert. Eine Norm muss für alle Vektoren x, y V und alle a R folgende Bedingungen erfüllen: M. Siebers (KogSys) Distanzen und Ähnlichkeitsmaÿe 25. Mai 2011 7 / 14

Exkurs: Normen, Metriken Norm Eine Norm ist die Verallgemeinerung der Länge eines Vektors. Die Norm eines Vektors x wird als x notiert. Eine Norm muss für alle Vektoren x, y V und alle a R folgende Bedingungen erfüllen: 1 x = 0 x = 0 (Denitheit) M. Siebers (KogSys) Distanzen und Ähnlichkeitsmaÿe 25. Mai 2011 7 / 14

Exkurs: Normen, Metriken Norm Eine Norm ist die Verallgemeinerung der Länge eines Vektors. Die Norm eines Vektors x wird als x notiert. Eine Norm muss für alle Vektoren x, y V und alle a R folgende Bedingungen erfüllen: 1 x = 0 x = 0 (Denitheit) 2 a x = a x (absolute Homogenität) M. Siebers (KogSys) Distanzen und Ähnlichkeitsmaÿe 25. Mai 2011 7 / 14

Exkurs: Normen, Metriken Norm Eine Norm ist die Verallgemeinerung der Länge eines Vektors. Die Norm eines Vektors x wird als x notiert. Eine Norm muss für alle Vektoren x, y V und alle a R folgende Bedingungen erfüllen: 1 x = 0 x = 0 (Denitheit) 2 a x = a x (absolute Homogenität) 3 x + y x + y (Dreiecksungleichung) M. Siebers (KogSys) Distanzen und Ähnlichkeitsmaÿe 25. Mai 2011 7 / 14

Exkurs: Normen, Metriken Norm Eine Norm ist die Verallgemeinerung der Länge eines Vektors. Die Norm eines Vektors x wird als x notiert. Eine Norm muss für alle Vektoren x, y V und alle a R folgende Bedingungen erfüllen: 1 x = 0 x = 0 (Denitheit) 2 a x = a x (absolute Homogenität) 3 x + y x + y (Dreiecksungleichung) Metrik Eine Metrik ist eine mathematische Funktion,die den Abstand zwischen zwei Elementen einer Menge angibt. M. Siebers (KogSys) Distanzen und Ähnlichkeitsmaÿe 25. Mai 2011 7 / 14

Normen/Distanzen Jede Norm lässt sich in eine Distanz umformulieren: d(x, y) = x y p-norm x p = ( n i=1 x i p ) 1 p, p 1 M. Siebers (KogSys) Distanzen und Ähnlichkeitsmaÿe 25. Mai 2011 8 / 14

Normen/Distanzen Jede Norm lässt sich in eine Distanz umformulieren: d(x, y) = x y p-norm x p = ( n i=1 x i p ) 1 p, p 1 Manhattan-Norm x 1 = n i=1 x i M. Siebers (KogSys) Distanzen und Ähnlichkeitsmaÿe 25. Mai 2011 8 / 14

Normen/Distanzen Jede Norm lässt sich in eine Distanz umformulieren: d(x, y) = x y p-norm x p = ( n i=1 x i p ) 1 p, p 1 Manhattan-Norm x 1 = n i=1 x i Euklidische-Norm x 2 = n i=1 x i 2 M. Siebers (KogSys) Distanzen und Ähnlichkeitsmaÿe 25. Mai 2011 8 / 14

Normen/Distanzen Jede Norm lässt sich in eine Distanz umformulieren: d(x, y) = x y p-norm x p = ( n i=1 x i p ) 1 p, p 1 Manhattan-Norm x 1 = n i=1 x i Euklidische-Norm x 2 = n i=1 x i 2 Chebyshev-Norm x = max ( x i ) M. Siebers (KogSys) Distanzen und Ähnlichkeitsmaÿe 25. Mai 2011 8 / 14

Inhalt 1 Distanzen 2 Ähnlichkeitsmaÿe 3 Nominale Attribute M. Siebers (KogSys) Distanzen und Ähnlichkeitsmaÿe 25. Mai 2011 9 / 14

Ähnlichkeitsmaÿe informell Die Ähnlichkeit zwischen zwei Objekten stellt ihre Nähe oder Gleichheit zueinander dar. M. Siebers (KogSys) Distanzen und Ähnlichkeitsmaÿe 25. Mai 2011 10 / 14

Ähnlichkeitsmaÿe informell Die Ähnlichkeit zwischen zwei Objekten stellt ihre Nähe oder Gleichheit zueinander dar. Ein Objekt kann hierbei alles mögliche sein wie bei Distanzen. M. Siebers (KogSys) Distanzen und Ähnlichkeitsmaÿe 25. Mai 2011 10 / 14

Ähnlichkeitsmaÿe informell Die Ähnlichkeit zwischen zwei Objekten stellt ihre Nähe oder Gleichheit zueinander dar. Ein Objekt kann hierbei alles mögliche sein wie bei Distanzen. Es gibt eine höchste Ähnlichkeit die Identität. M. Siebers (KogSys) Distanzen und Ähnlichkeitsmaÿe 25. Mai 2011 10 / 14

Ähnlichkeitsmaÿe informell Die Ähnlichkeit zwischen zwei Objekten stellt ihre Nähe oder Gleichheit zueinander dar. Ein Objekt kann hierbei alles mögliche sein wie bei Distanzen. Es gibt eine höchste Ähnlichkeit die Identität. Ähnlichkeiten machen nur zwischen gleichartigen Objekten Sinn. M. Siebers (KogSys) Distanzen und Ähnlichkeitsmaÿe 25. Mai 2011 10 / 14

Ähnlichkeitsmaÿe formell Die Ähnlichkeit zwischen zwei Objekten x und y wird als s(x, y) notiert. Eine Ähnlichkeit muss für alle x, y, z folgende Bedingungen erfüllen: 1 s(x, y) = s(y, x) (Symmetrie) M. Siebers (KogSys) Distanzen und Ähnlichkeitsmaÿe 25. Mai 2011 11 / 14

Ähnlichkeitsmaÿe formell Die Ähnlichkeit zwischen zwei Objekten x und y wird als s(x, y) notiert. Eine Ähnlichkeit muss für alle x, y, z folgende Bedingungen erfüllen: 1 s(x, y) = s(y, x) (Symmetrie) 2 s(i, j) s(i, i) M. Siebers (KogSys) Distanzen und Ähnlichkeitsmaÿe 25. Mai 2011 11 / 14

Ähnlichkeitsmaÿe formell Die Ähnlichkeit zwischen zwei Objekten x und y wird als s(x, y) notiert. Eine Ähnlichkeit muss für alle x, y, z folgende Bedingungen erfüllen: 1 s(x, y) = s(y, x) (Symmetrie) 2 s(i, j) s(i, i) 3 s(i, j) 0 M. Siebers (KogSys) Distanzen und Ähnlichkeitsmaÿe 25. Mai 2011 11 / 14

Ähnlichkeitsmaÿe formell Die Ähnlichkeit zwischen zwei Objekten x und y wird als s(x, y) notiert. Eine Ähnlichkeit muss für alle x, y, z folgende Bedingungen erfüllen: 1 s(x, y) = s(y, x) (Symmetrie) 2 s(i, j) s(i, i) 3 s(i, j) 0 4 s(i, i) = 1 M. Siebers (KogSys) Distanzen und Ähnlichkeitsmaÿe 25. Mai 2011 11 / 14

Inhalt 1 Distanzen 2 Ähnlichkeitsmaÿe 3 Nominale Attribute M. Siebers (KogSys) Distanzen und Ähnlichkeitsmaÿe 25. Mai 2011 12 / 14

Nominale Attribute Nominale Distanz d(x, y) = n i=0 δ(x i, y i ), wobei δ(a, b) = { 0 a = b 1 andernfalls M. Siebers (KogSys) Distanzen und Ähnlichkeitsmaÿe 25. Mai 2011 13 / 14

Others Jaccard Für binäre Attribute, Anteil gemeinsammer positiver Attribute M. Siebers (KogSys) Distanzen und Ähnlichkeitsmaÿe 25. Mai 2011 14 / 14

Others Jaccard Für binäre Attribute, Anteil gemeinsammer positiver Attribute Cosinus-Ähnlichkeit Winkel zwischen zwei Attribut-Vektoren M. Siebers (KogSys) Distanzen und Ähnlichkeitsmaÿe 25. Mai 2011 14 / 14

Others Jaccard Für binäre Attribute, Anteil gemeinsammer positiver Attribute Cosinus-Ähnlichkeit Winkel zwischen zwei Attribut-Vektoren Dice-Ähnlichkeit Ähnlich Jaccard M. Siebers (KogSys) Distanzen und Ähnlichkeitsmaÿe 25. Mai 2011 14 / 14