Ausgangspunkt: punktförmige hochdimensionale Feature-Objekte

Ähnliche Dokumente
R-Baum R + -Baum X-Baum M-Baum

Der Branching-Operator B

Eine Indexstruktur zur schnellen Nächste-Nachbar-Suche im metrischen Raum

Mobile Objekte Indexstrukturen

Rolf Wanka Sommersemester Vorlesung

Stud.-Nummer: Datenstrukturen & Algorithmen Seite 1

R-Baum eine dynamische Index-Strukur für räumliche Suche

1 topologisches Sortieren

Übung 13 Algorithmen II

Wie wird ein Graph dargestellt?

8.4 Digraphen mit negativen Kantengewichten Grundsätzliches Betrachte Startknoten s und einen Kreis C mit Gesamtlänge < 0.

Hallo Welt für Fortgeschrittene

Geometrische Algorithmen

Grundlagen zur Delaunay-Triangulierung und zur konvexen Hülle. zum Begriff des Voronoi-Diagramms (vgl. auch Vorlesung "Algorithmische Geometrie"):

Graphdurchmusterung, Breiten- und Tiefensuche

Geradenarrangements und Dualität von Punkten und Geraden

Geradenarrangements und Dualität von Punkten und Geraden

2. November Gradfolgen Zusammenhang Kürzeste Wege. H. Meyerhenke: Algorithmische Methoden zur Netzwerkanalyse 37

IR Seminar SoSe 2012 Martin Leinberger

... Text Clustern. Clustern. Einführung Clustern. Einführung Clustern

Algorithmen und Datenstrukturen

Datenbanken: Indexe. Motivation und Konzepte

5. Clusteranalyse. Lernziele: Grundlegende Algorithmen der Clusteranalyse kennen, ihre Eigenschaften

Übungen zu Multimedia-Datenbanken Aufgabenblatt 4 - Musterlösungen

k-nächste-nachbarn-schätzung

Nächster-Nachbar-Suche mittels Knotenhierarchie in der Delaunay-Triangulierung

Lösungen zu Aufgabenblatt 9

5. Clusteranalyse Vorbemerkungen. 5. Clusteranalyse. Grundlegende Algorithmen der Clusteranalyse kennen, ihre Eigenschaften

Datenbankanwendung. Prof. Dr.-Ing. Sebastian Michel TU Kaiserslautern. Wintersemester 2014/15.

Algorithmische Geometrie

Algorithmen und Datenstrukturen Bereichsbäume

Konvexe Hülle. Konvexe Hülle. Mathematik. Konvexe Hülle: Definition. Mathematik. Konvexe Hülle: Eigenschaften. AK der Algorithmik 5, SS 2005 Hu Bin

Algo&Komp. - Wichtige Begriffe Mattia Bergomi Woche 6 7

6 Distanzfunktionen. Quadratische Pseudo. 1. Eigenschaften und Klassifikation

Algorithmen und Datenstrukturen

9 Minimum Spanning Trees

Algorithmen und Datenstrukturen 1 VL Übungstest WS November 2007

{0,1} rekursive Aufteilung des Datenraums in die Quadranten NW, NE, SW und SE feste Auflösung des Datenraums in 2 p 2 p Gitterzellen

5. Bäume und Minimalgerüste

Indizierung von Geodaten - Raumbezogene Indexstrukturen. Seminar mobile Geoinformationssystem Vortrag von Markus Steger

Quadtrees. Christian Höner zu Siederdissen

Geometrische Algorithmen Segmentschnitt

Vorlesung Informatik 2 Algorithmen und Datenstrukturen. (25 Sortieren vorsortierter Daten)

Traversierung 1 / 16. P.F. Stadler & S. Will (Bioinf, Uni LE) ADS 2, V3 23. April / 16

Bäume Jiri Spale, Algorithmen und Datenstrukturen - Bäume 1

Algorithmische Geometrie: Schnittpunkte von Strecken

Datenbanken. Interne Datenorganisation:

Grundlagen der Programmierung

Keller, Schlangen und Listen. Elementare Datenstrukturen Keller, Schlangen und Listen 1 / 14

Vorlesung Datenstrukturen

8. A & D - Heapsort. Werden sehen, wie wir durch geschicktes Organsieren von Daten effiziente Algorithmen entwerfen können.

Übersicht über Informatik und Softwaresystemtechnik WS 99/00, Prof. Dr. Andreas Schwill

Verteilte Systeme. Synchronisation II. Prof. Dr. Oliver Haase

1 Kürzeste Pfade in Graphen

Algorithmische Geometrie 3. Schnitte von Liniensegmenten

4. Kreis- und Wegeprobleme Abstände in Graphen

Zustandsraumsuche: Blinde und Heuristische Suche. Blinde und Heuristische Suche

1 DFS-Bäume in ungerichteten Graphen

TU München, Fakultät für Informatik Lehrstuhl III: Datenbanksysteme Prof. Dr. Thomas Neumann

Technische Universität Wien Institut für Computergraphik und Algorithmen Arbeitsbereich für Algorithmen und Datenstrukturen

Teil 2: Graphenalgorithmen

Was bisher geschah. 1. Zerlegung in monotone Polygone 2. Triangulierung der monotonen Teilpolygone

Algorithmen und Datenstrukturen

Minimal spannende Bäume

Voronoi-Diagramme INSTITUT FÜR THEORETISCHE INFORMATIK FAKULTÄT FÜR INFORMATIK. Dr. Martin Nöllenburg Vorlesung Algorithmische Geometrie

Berechnung von Abständen

Data Cubes PG Wissensmangement Seminarphase

1. Motivation / Grundlagen 2. Sortierverfahren 3. Elementare Datenstrukturen / Anwendungen 4. Bäume / Graphen 5. Hashing 6. Algorithmische Geometrie

Distanzprobleme in der Ebene

Algorithmen und Datenstrukturen 2

Relationen und DAGs, starker Zusammenhang

Das Voronoi Diagramm. 1. Definition. 2. Eigenschaften. 3. Größe und Speicherung. 4. Konstruktion. 5. Verwendung

Boole'sches Modell <is web>

Euklidische Distanzmatrizen. Andrei Grecu

Kollisionserkennung

Universität Augsburg, Institut für Informatik WS 2009/2010 Prof. Dr. W. Kießling 15. Jan Dr. A. Huhn, F. Wenzel, M. Endres Lösungsblatt 10

6 Distanzfunktionen (2) 6 Distanzfunktionen. 6.1 Eigenschaften und Klassifikationen. Einführung

Lineare Programmierung

1 AVL-Bäume. 1.1 Aufgabentyp. 1.2 Überblick. 1.3 Grundidee

Vorlesung Algorithmische Geometrie Konvexe Hülle im R 3

Suche in Spielbäumen Spielbäume Minimax Algorithmus Alpha-Beta Suche. Suche in Spielbäumen. KI SS2011: Suche in Spielbäumen 1/20

Vorlesung 7 GRAPHBASIERTE BILDSEGMENTIERUNG

Mehrwegbäume Motivation

7. Sortieren Lernziele. 7. Sortieren

Geometrische Algorithmen

Multimedia-Datenbanken im SS 2010 Effiziente Algorithmen und Datenstrukturen II

Probeklausur Optimierung

Von Labyrinthen zu Algorithmen 2. Gerald Futschek

Datenstrukturen und Algorithmen D-INFK

Motivation. Überblick. Motivation. Sequentielle Verfahren

Seite 1 von 13 Name: Aufgabe 1: Suchalgorithmen (a) (4 Punkte ) Gegeben ist folgendes Streckennetz:

Algorithmen und Datenstrukturen Klausur WS 2006/07 Software-Engineering und Technische Informatik Bachelor

Erweitertes boolsches Retrieval

Geometrische Objekte im 3-dimensionalen affinen Raum oder,... wie nützlich ist ein zugehöriger Vektorraum der Verschiebungen

Teil IV: Erprobungsbericht

23. November Betweenness Centrality Closeness Centrality. H. Meyerhenke: Algorithmische Methoden zur Netzwerkanalyse 108

KD-Bäume. ein Vortrag von Jan Schaefer

Bewertung von Ergebnisdokumenten Auswertung von Bewertungen

Begriffsklärung: Dominanz

Transkript:

Baumverfahren Ausgangspunkt: punktförmige hochdimensionale Feature-Objekte B-Baum eindimensional Abbildung eines mehrdimensionalen Raums auf eine Dimension im Allgemeinen nicht distanzerhaltend möglich Simplex mit n+1 Punkten im n-dimensionalen Raum) Fazit: mehrdimensionale Indexverfahren nötig staab@uni-koblenz.de 1

Baumverfahren (2) Grundidee hierarchischer Indexierungsverfahren: Beschreiben von Punktmengen durch geometrische, umschreibende Regionen (Cluster) bei der Suche Test und evtl. Ausschluss von Clustern Cluster können sich gegenseitig enthalten Halbordnung und daher Hierarchie (Hasse-Diagramm) oder Baum staab@uni-koblenz.de 2

Unterscheidungskriterien von Baumstrukturen staab@uni-koblenz.de 3

Suchalgorithmen in Bäumen Algorithmen zur Berechnung des nächsten Niveaus Anfragepunkt Existenz zweier Distanzfunktionen Distanz zwischen zwei Punkten minimale Distanz zwischen und potentiellem Clusterpunkt eines Clusters staab@uni-koblenz.de 4

Branch-und-Bound-Algorithmus geht von Objektspeicherung in Blättern aus realisiert Tiefensuche verwendet dynamisch angepasste Distanz oberegrenze zu NN-Kandidat staab@uni-koblenz.de 5

Branch-and-Bound-Algorithmus (2) staab@uni-koblenz.de 6

RKV-Algorithmus Roussopoulos/Kelly/Vincent 1995 spezieller Branch-and-Bound-Algorithmus zur Nächste- Nachbarsuche Feature-Objekte als hochdimensionale Objekte für Baum mit lokal gruppierenden Hyperquadern und Feature-Objekten in den Blättern Hyperquader als MBR (engl. minimum bounding rectangle) jede Hyperfläche berührt mind. ein Feature-Objekt von außen MBR wird durch zwei Punkte (innerste und äußerste Ecke) identifiziert staab@uni-koblenz.de 7

MIN-Distanz MIN-Distanz: minimal mögliche Distanz zwischen Anfragepunkt und MBR mit staab@uni-koblenz.de 8

MINMAX-Distanz MINMAX-Distanz: maximal möglicher Abstand zum nächsten Nachbarn in Ausnutzen der Minimaleigenschaft eines MBR mit: staab@uni-koblenz.de 9

MIN- und MINMAX-Distanzen graphisch staab@uni-koblenz.de 10

Reduzierung des Suchaufwands Sortierung der Kindsknoten anhand MIN-Distanz (optimistisch) oder MINMAX-Distanz (pessimistisch) staab@uni-koblenz.de 11

Reduzierung des Suchaufwands (2) 3 Strategien zur Suchaufwandreduzierung (oberegrenze ist Distanz zum NN-Kandidaten) 1. MBR braucht nicht aufgesucht zu werden 2. 3. MBR braucht nicht aufgesucht zu werden staab@uni-koblenz.de 12

Reduzierung des Suchaufwands (2) 3 Strategien zur Suchaufwandreduzierung (oberegrenze ist Distanz zum NN-Kandidaten) 1. MBR braucht nicht aufgesucht zu werden 2. 3. MBR braucht nicht aufgesucht zu werden staab@uni-koblenz.de 13

Reduzierung des Suchaufwands (2) 3 Strategien zur Suchaufwandreduzierung (oberegrenze ist Distanz zum NN-Kandidaten) 1. MBR braucht nicht aufgesucht zu werden 2. 3. MBR braucht nicht aufgesucht zu werden staab@uni-koblenz.de 14

Reduzierung des Suchaufwands (2) 3 Strategien zur Suchaufwandreduzierung (oberegrenze ist Distanz zum NN-Kandidaten) 1. MBR braucht nicht aufgesucht zu werden 2. 3. MBR braucht nicht aufgesucht zu werden staab@uni-koblenz.de 15

Reduzierung des Suchaufwands graphisch staab@uni-koblenz.de 16

RKV-Algorithmus = staab@uni-koblenz.de 17

knn-anfragen mit RKV-Algorithmus Modifikation des Algorithmus: sortierte Warteschlange zur Verwaltung der Nächste-Nachbarschaftskandidaten oberegrenze ist Distanz zum letzten Kandidat staab@uni-koblenz.de 18

Bewertung RKV-Algorithmus getnext-anfragen werden nicht unterstützt (Problem aufgrund der Tiefensuche) ursprünglich für euklidsche Distanz entwickelt; funktioniert auch auf anderen Distanzfunktionen, so lange MIN- und MINMAX-Distanzen berechnet werden können Einschränkung auf MBRs als Clustergeometrien ansonsten statt MINMAX- die MAX-Distanz verwenden staab@uni-koblenz.de 19

HS-Algorithmus Hanrich/Hjaltason/Samet Algorithmus für getnext-anfragen statt Tiefensuche Verwendung einer global sortierten Warteschlange: enthält Knoten, Blätter und Feature-Objekte mit minimalen Distanzen lb zum Anfragepunkt legt Abarbeitungsreihenfolge aufgrund aufsteigender Distanz fest nur Kopfelemente werden entnommen staab@uni-koblenz.de 20

HS-Algorithmus (2) 1. Initialisierung mit Wurzelelementen 2. wenn entnommenes Kopfelement Knoten, dann werden Kinder eingefügt 3. wenn entnommenes Kopfelement Blatt, dann werden Feature-Objekte eingefügt 4. wenn entnommenes Kopfelement Feature-Objekt Ausgabe staab@uni-koblenz.de 21

HS-Algorithmus (3) staab@uni-koblenz.de 22

HS-Algorithmus graphisch staab@uni-koblenz.de 23

Bewertung HS-Algorithmus gut geeignet für getnext-anfragen unabhängig von Cluster-Geometrie Problem: Warteschlange kann zu groß für Hauptspeicher werden aufwändige Auslagerung auf Festplatte notwendig Navigation springt wegen Warteschlangensortierung; keine Tiefen/Breitensuche teure Festplattenzugriffe staab@uni-koblenz.de 24