Verwendung von merkmalsgestütztem Relevanz-Feedback zur Suche in einer Online-Bildergalerie

Größe: px
Ab Seite anzeigen:

Download "Verwendung von merkmalsgestütztem Relevanz-Feedback zur Suche in einer Online-Bildergalerie"

Transkript

1 Verwendung von merkmalsgestütztem Relevanz-Feedback zur Suche in einer Online-Bildergalerie Abgabevortrag der Diplomarbeit von Technische Universität Berlin Fakultät IV - Elektrotechnik und Informatik Institut für Kommunikationssysteme, Fachgebiet Nachrichtenübertragung Prof. Dr.-Ing. Thomas Sikora 6. Juni 2005

2 Gliederung 1 Überblick Related Work Relevanz Feedback - allgemein Motivation

3 Gliederung 1 Überblick Related Work Relevanz Feedback - allgemein Motivation 2 Bildergalerien Low-Level Deskriptoren Relevanz Feedback und Klassifikation Systemgewichte

4 Gliederung 1 Überblick Related Work Relevanz Feedback - allgemein Motivation 2 Bildergalerien Low-Level Deskriptoren Relevanz Feedback und Klassifikation Systemgewichte 3 Evaluierungsmaße Evaluierung des Retrievals Evaluierung der Klassifikation Eckdaten des Systems

5 Überblick bisheriger Systeme Related Work Relevanz Feedback - allgemein Motivation System RF Lernalgorithmus Features Cortina ja Query Vector Movement Feature Weighting (short term) Edge Histogramm Deskriptor Homogenous Texture Deskriptor, Dominant Color Deskriptor, Scalable Color Deskriptor FIRE ja Score, vergleiche [1] Invariant Feature Histogram MiAlbum ja Bayesscher Klassifikator (inkrementell, jedoch falsche Adaptionsvorschrift) Farbhistogramm im HSV, LUV Kohärenz Vektor, Tamura Coarseness, Directionality SIMPLIcity nein Segmentierung (K-Means) Klassifikation Integrated Region Matching (IRM) n.a. dieses System ja Bayesscher Klassifikator (inkrementell) Edge Histogram Deskriptor, Homogenous Texture Deskriptor, Color Layout Deskriptor, Local Average LUV Deskriptor

6 Related Work Relevanz Feedback - allgemein Motivation Anforderungen an das Relevanz Feedback damit eine Interaktion möglich ist, müssen die Algorithmen zum Lernen der Bildklassen bzw. zum Auswählen relevanter Bilder in Echtzeit arbeiten

7 Related Work Relevanz Feedback - allgemein Motivation Anforderungen an das Relevanz Feedback damit eine Interaktion möglich ist, müssen die Algorithmen zum Lernen der Bildklassen bzw. zum Auswählen relevanter Bilder in Echtzeit arbeiten Lernalgorithmus muss mit wenigen Trainingsdaten funktionsfähig bleiben muss schnell arbeiten, so dass die Wahl des Lernalgorithmus stark von den Kosten beeinflusst ist

8 Related Work Relevanz Feedback - allgemein Motivation Lernalgorithmen für das Relevanz Feedback Bewegen des Suchpunktes (query point movement (QPM), vergleiche [2])

9 Related Work Relevanz Feedback - allgemein Motivation Lernalgorithmen für das Relevanz Feedback Bewegen des Suchpunktes (query point movement (QPM), vergleiche [2]) Parameterschätzung von Verteilungsdichtefunktionen zur Unterscheidung von Bildklassen (Density-Based Estimation)

10 Related Work Relevanz Feedback - allgemein Motivation Lernalgorithmen für das Relevanz Feedback Bewegen des Suchpunktes (query point movement (QPM), vergleiche [2]) Parameterschätzung von Verteilungsdichtefunktionen zur Unterscheidung von Bildklassen (Density-Based Estimation) Einsatz von Support Vector Machines zum Unterscheiden von Bildklassen

11 Related Work Relevanz Feedback - allgemein Motivation Lernalgorithmen für das Relevanz Feedback Bewegen des Suchpunktes (query point movement (QPM), vergleiche [2]) Parameterschätzung von Verteilungsdichtefunktionen zur Unterscheidung von Bildklassen (Density-Based Estimation) Einsatz von Support Vector Machines zum Unterscheiden von Bildklassen Kernel Based Discriminating Analysis (BDA)

12 Related Work Relevanz Feedback - allgemein Motivation Algorithmen zum Zusammenstellen relevanter Bilder best matching Bilder, die am ehesten der Suchintention entsprechen

13 Related Work Relevanz Feedback - allgemein Motivation Algorithmen zum Zusammenstellen relevanter Bilder best matching Bilder, die am ehesten der Suchintention entsprechen most informative Bilder, die am meisten Informationen zum Formen der Klassengrenzen besitzen

14 Related Work Relevanz Feedback - allgemein Motivation Algorithmen zum Zusammenstellen relevanter Bilder best matching Bilder, die am ehesten der Suchintention entsprechen most informative Bilder, die am meisten Informationen zum Formen der Klassengrenzen besitzen hybride Verfahren erst most informative, dann best matching

15 Motivation zu dieser Arbeit Related Work Relevanz Feedback - allgemein Motivation 1 Ein Benutzer möchte nicht mehr als 4-10 Beispiele pro Iterationsschritt geben.

16 Motivation zu dieser Arbeit Related Work Relevanz Feedback - allgemein Motivation 1 Ein Benutzer möchte nicht mehr als 4-10 Beispiele pro Iterationsschritt geben. Informationsgehalt muss maximal genutzt werden

17 Motivation zu dieser Arbeit Related Work Relevanz Feedback - allgemein Motivation 1 Ein Benutzer möchte nicht mehr als 4-10 Beispiele pro Iterationsschritt geben. Informationsgehalt muss maximal genutzt werden inkrementeller Ansatz, der über alle Benutzerinteraktionen die Klassengrenzen adaptiert

18 Motivation zu dieser Arbeit Related Work Relevanz Feedback - allgemein Motivation 1 Ein Benutzer möchte nicht mehr als 4-10 Beispiele pro Iterationsschritt geben. Informationsgehalt muss maximal genutzt werden inkrementeller Ansatz, der über alle Benutzerinteraktionen die Klassengrenzen adaptiert 2 Die Low-Level Features besitzen je nach Anfrage irrelevante Koeffizienten, dessen Einfluss sollte nach Möglichkeit reduziert werden.

19 Motivation zu dieser Arbeit Related Work Relevanz Feedback - allgemein Motivation 1 Ein Benutzer möchte nicht mehr als 4-10 Beispiele pro Iterationsschritt geben. Informationsgehalt muss maximal genutzt werden inkrementeller Ansatz, der über alle Benutzerinteraktionen die Klassengrenzen adaptiert 2 Die Low-Level Features besitzen je nach Anfrage irrelevante Koeffizienten, dessen Einfluss sollte nach Möglichkeit reduziert werden. Bayesscher Klassifikator gewichtet jeden Koeffizient mit dessen Varianz

20 Motivation zu dieser Arbeit Related Work Relevanz Feedback - allgemein Motivation 1 Ein Benutzer möchte nicht mehr als 4-10 Beispiele pro Iterationsschritt geben. Informationsgehalt muss maximal genutzt werden inkrementeller Ansatz, der über alle Benutzerinteraktionen die Klassengrenzen adaptiert 2 Die Low-Level Features besitzen je nach Anfrage irrelevante Koeffizienten, dessen Einfluss sollte nach Möglichkeit reduziert werden. Bayesscher Klassifikator gewichtet jeden Koeffizient mit dessen Varianz 3 Benutzerinteraktion ist von zentraler Bedeutung.

21 Motivation zu dieser Arbeit Related Work Relevanz Feedback - allgemein Motivation 1 Ein Benutzer möchte nicht mehr als 4-10 Beispiele pro Iterationsschritt geben. Informationsgehalt muss maximal genutzt werden inkrementeller Ansatz, der über alle Benutzerinteraktionen die Klassengrenzen adaptiert 2 Die Low-Level Features besitzen je nach Anfrage irrelevante Koeffizienten, dessen Einfluss sollte nach Möglichkeit reduziert werden. Bayesscher Klassifikator gewichtet jeden Koeffizient mit dessen Varianz 3 Benutzerinteraktion ist von zentraler Bedeutung. Algorithmen müssen zügig arbeiten

22 Motivation zu dieser Arbeit Related Work Relevanz Feedback - allgemein Motivation 1 Ein Benutzer möchte nicht mehr als 4-10 Beispiele pro Iterationsschritt geben. Informationsgehalt muss maximal genutzt werden inkrementeller Ansatz, der über alle Benutzerinteraktionen die Klassengrenzen adaptiert 2 Die Low-Level Features besitzen je nach Anfrage irrelevante Koeffizienten, dessen Einfluss sollte nach Möglichkeit reduziert werden. Bayesscher Klassifikator gewichtet jeden Koeffizient mit dessen Varianz 3 Benutzerinteraktion ist von zentraler Bedeutung. Algorithmen müssen zügig arbeiten eventuell Featurereduktion mittels PCA

23 Bildergalerien Low-Level Deskriptoren Relevanz Feedback und Klassifikation Systemgewichte Bildergalerien Daten zur Verwaltung Get a Random Set Bilder (Binaries) Thumbnails Start Classification (Fileupload) Interface Start Matching (Fileupload) Feature Extraktion Get XML- Descriptors (Fileupload) show XML-Descriptors Deskriptoren (Binaries) relevante Bilder selektiert und den Retrieval Prozess gestartet XML- Deskriptoren 3s- Normierung Relevanz Feedback Retrieval Parameter MySQL Benutzerinteraktion 1 PCA modifizierte Deskriptoren (Binaries) Vorverarbeitung Modelle der 12 Bildklassen (Binaries) Offline Online

24 Softwareschnittstellen Bildergalerien Low-Level Deskriptoren Relevanz Feedback und Klassifikation Systemgewichte Template ausführbarer Programmcode C++ Klassifikation XHTML User Interface Perl Zwischenschicht MySQL C API CGI MySQL DBD::mysql

25 Retrieval-Prozess Überblick Bildergalerien Low-Level Deskriptoren Relevanz Feedback und Klassifikation Systemgewichte Suche mit einem zufälligen Bild Suche mit einem hochgeladenen Bild Anzeigen der Ergebnisse initiale Suche Auswählen der relevanten Bilder Relevanz Feedback Anzeigen der Ergebnisse iterative Suche

26 Verfügbare Bildergalerien Bildergalerien Low-Level Deskriptoren Relevanz Feedback und Klassifikation Systemgewichte Name Anzahl der Fotos Fotos der Corel Gallery Magic Wangs Subset der Corel Bildergalerie Fotos der Data Becker Premium Cliparts The CalTech-101 Object Categories Butterfly Database 619 Summe der online verfügbaren Fotos Ground Truth Database der University of Washington Bildersammlung zum Trainieren und Testen der Klassifikation 3.500

27 Lokale Features Überblick Bildergalerien Low-Level Deskriptoren Relevanz Feedback und Klassifikation Systemgewichte Quelle: [4] Charakteristika Textur Kantenhistogramm bestehend aus 5 Typen

28 Lokale Features Überblick Bildergalerien Low-Level Deskriptoren Relevanz Feedback und Klassifikation Systemgewichte Quelle: [4] Charakteristika Textur Kantenhistogramm bestehend aus 5 Typen Farbe Mittlere Farbkomponenten (LUV)

29 Globale Features Überblick Bildergalerien Low-Level Deskriptoren Relevanz Feedback und Klassifikation Systemgewichte Charakteristika Textur mehrdimensionales Gaborfilter im Frequenzbereich globale und semi-globale Kantenhistogramme

30 Globale Features Überblick Bildergalerien Low-Level Deskriptoren Relevanz Feedback und Klassifikation Systemgewichte Charakteristika Textur mehrdimensionales Gaborfilter im Frequenzbereich globale und semi-globale Kantenhistogramme Farbe DCT gefiltertes Mittelwertbild ( Zig-Zag Scan Reduktion auf jeweils 6 Koeffizienten 64 Koeffizienten Farbkomponente ),

31 Bildergalerien Low-Level Deskriptoren Relevanz Feedback und Klassifikation Systemgewichte Herleitung des Bayesschen Klassifikators (1) mittlerer Verlust l j ( x) = W L ij p(ω i x) i=1

32 Bildergalerien Low-Level Deskriptoren Relevanz Feedback und Klassifikation Systemgewichte Herleitung des Bayesschen Klassifikators (1) mittlerer Verlust binäre Verlustfunktion { W 0 für i = j l j ( x) = L ij p(ω i x) L ij = 1 δ ij = 1 für i j i=1

33 Bildergalerien Low-Level Deskriptoren Relevanz Feedback und Klassifikation Systemgewichte Herleitung des Bayesschen Klassifikators (1) mittlerer Verlust binäre Verlustfunktion { W 0 für i = j l j ( x) = L ij p(ω i x) L ij = 1 δ ij = 1 für i j i=1 minimize l j ( x) = p( x) p(ω j x)

34 Bildergalerien Low-Level Deskriptoren Relevanz Feedback und Klassifikation Systemgewichte Herleitung des Bayesschen Klassifikators (1) mittlerer Verlust binäre Verlustfunktion { W 0 für i = j l j ( x) = L ij p(ω i x) L ij = 1 δ ij = 1 für i j i=1 minimize l j ( x) = p( x) p(ω j x) maximize d j ( x) = p( x ω j)p(ω j ) p( x) für j = 1, 2,..., W

35 Bildergalerien Low-Level Deskriptoren Relevanz Feedback und Klassifikation Systemgewichte Herleitung des Bayesschen Klassifikators (1) mittlerer Verlust binäre Verlustfunktion { W 0 für i = j l j ( x) = L ij p(ω i x) L ij = 1 δ ij = 1 für i j i=1 minimize l j ( x) = p( x) p(ω j x) Bayesscher Klassifikator d j ( x) = p( x ω j )p(ω j ) für j = 1, 2,..., W

36 Bildergalerien Low-Level Deskriptoren Relevanz Feedback und Klassifikation Systemgewichte Herleitung des Bayesschen Klassifikators (2) p( x ω j ) = multivariate Gauss-Verteilungsdichtefunktion p(ω j ) = a-priori Wahrscheinlichkeit der Klasse j

37 Bildergalerien Low-Level Deskriptoren Relevanz Feedback und Klassifikation Systemgewichte Herleitung des Bayesschen Klassifikators (2) p( x ω j ) = multivariate Gauss-Verteilungsdichtefunktion p(ω j ) = a-priori Wahrscheinlichkeit der Klasse j Bayesscher Klassifikator für Gaussche Klassen d j ( x) = ln p(ω j ) k ln σ j,k 1 2 ( xk µ j,k σ j,k k ) 2

38 Retrieval - Relevanz Feedback Bildergalerien Low-Level Deskriptoren Relevanz Feedback und Klassifikation Systemgewichte Bayesscher Klassifikator für Gaussche Klassen Vereinfachungen für das Retrieval d j ( x) = ln p(ω j ) k ln σ j,k 1 2 ( xk µ j,k σ j,k k ) 2

39 Retrieval - Relevanz Feedback Bildergalerien Low-Level Deskriptoren Relevanz Feedback und Klassifikation Systemgewichte Bayesscher Klassifikator für Gaussche Klassen Vereinfachungen für das Retrieval d j ( x) = ln p(ω j ) k ln σ j,k 1 2 ( xk µ j,k k σ j,k 1 da alle Klassen gleichberechtigt auftreten können ) 2

40 Retrieval - Relevanz Feedback Bildergalerien Low-Level Deskriptoren Relevanz Feedback und Klassifikation Systemgewichte Bayesscher Klassifikator für Gaussche Klassen Vereinfachungen für das Retrieval d j ( x) = ln p(ω j ) ln σ j,k 1 2 k ( xk µ j,k k σ j,k 1 da alle Klassen gleichberechtigt auftreten können. 2 da alle Bilder mit einer Bildklasse verglichen werden. ) 2

41 Retrieval - Relevanz Feedback Bildergalerien Low-Level Deskriptoren Relevanz Feedback und Klassifikation Systemgewichte Bayesscher Klassifikator für Gaussche Klassen Retrieval minimize d j ( x) = k ( xk µ j,k σ j,k ) 2

42 Retrieval - Relevanz Feedback Bildergalerien Low-Level Deskriptoren Relevanz Feedback und Klassifikation Systemgewichte Bayesscher Klassifikator für Gaussche Klassen Retrieval minimize d j ( x) = k ( xk µ j,k σ j,k ) 2 Jetzt müssen noch die Parameter µ j und σ 2 j adaptiert werden.

43 Bildergalerien Low-Level Deskriptoren Relevanz Feedback und Klassifikation Systemgewichte Parameteradaption - Relevanz Feedback

44 Bildergalerien Low-Level Deskriptoren Relevanz Feedback und Klassifikation Systemgewichte Parameteradaption - Relevanz Feedback

45 Bildergalerien Low-Level Deskriptoren Relevanz Feedback und Klassifikation Systemgewichte Parameteradaption - Relevanz Feedback

46 Bildergalerien Low-Level Deskriptoren Relevanz Feedback und Klassifikation Systemgewichte Parameteradaption - Relevanz Feedback

47 Bildergalerien Low-Level Deskriptoren Relevanz Feedback und Klassifikation Systemgewichte Parameteradaption - Relevanz Feedback

48 Bildergalerien Low-Level Deskriptoren Relevanz Feedback und Klassifikation Systemgewichte Parameteradaption - Relevanz Feedback

49 Bildergalerien Low-Level Deskriptoren Relevanz Feedback und Klassifikation Systemgewichte Parameteradaption - Relevanz Feedback

50 Bildergalerien Low-Level Deskriptoren Relevanz Feedback und Klassifikation Systemgewichte Parameteradaption - Relevanz Feedback

51 Bildergalerien Low-Level Deskriptoren Relevanz Feedback und Klassifikation Systemgewichte Parameteradaption - Relevanz Feedback

52 Bildergalerien Low-Level Deskriptoren Relevanz Feedback und Klassifikation Systemgewichte Parameteradaption - Relevanz Feedback Bayesscher Klassifikator für Gaussche Klassen minimize d j ( x) = k ( xk µ j,k σ j,k ) 2 µ j,k wird mittelwertrichtig aus den neuen Mittelwerten erzeugt. σj,k 2 wird mittelwertrichtig aus den neuen Varianzen erzeugt.

53 Bildergalerien Low-Level Deskriptoren Relevanz Feedback und Klassifikation Systemgewichte Überblick buildings flowers faces landscapes coastal mountains cars sailing buses sunsets biplanes motorbikes Die Bildklassen

54 Klassifikation Überblick Bildergalerien Low-Level Deskriptoren Relevanz Feedback und Klassifikation Systemgewichte Bayesscher Klassifikator für Gaussche Klassen Klassifikation d j ( x) = ln p(ω j ) + }{{} =const k ln(σ j,k ) ( xk µ j,k σ j,k k ) 2 da alle Klassen gleichberechtigt auftreten können.

55 Klassifikation Überblick Bildergalerien Low-Level Deskriptoren Relevanz Feedback und Klassifikation Systemgewichte Bayesscher Klassifikator für Gaussche Klassen Klassifikation d j ( x) = ln p(ω j ) + ln(σ j,k ) + 1 ( xk µ j,k }{{} 2 σ j,k =const k k = ln(σ j,k ) + 1 ( ) xk µ 2 j,k 2 σ j,k k k da alle Klassen gleichberechtigt auftreten können. ) 2

56 Support Vector Machines Bildergalerien Low-Level Deskriptoren Relevanz Feedback und Klassifikation Systemgewichte Hinweise Diplomarbeit [3] Seite

57 Adaption der Systemgewichte Bildergalerien Low-Level Deskriptoren Relevanz Feedback und Klassifikation Systemgewichte Kombination der Scorefunktionen d j,f D j ( x) = d j,f α f + d j,f α f + d j,f α f + d j,f α f mit f HTD,EHD,CLD,LALD.

58 Adaption der Systemgewichte Bildergalerien Low-Level Deskriptoren Relevanz Feedback und Klassifikation Systemgewichte Kombination der Scorefunktionen d j,f D j ( x) = d j,f α f + d j,f α f + d j,f α f + d j,f α f mit f HTD,EHD,CLD,LALD. 1 best matching, d.h. der Deskriptortyp mit der kleinsten mittleren Varianz erhält mehr Gewicht.

59 Adaption der Systemgewichte Bildergalerien Low-Level Deskriptoren Relevanz Feedback und Klassifikation Systemgewichte Kombination der Scorefunktionen d j,f D j ( x) = d j,f α f + d j,f α f + d j,f α f + d j,f α f mit f HTD,EHD,CLD,LALD. 1 best matching, d.h. der Deskriptortyp mit der kleinsten mittleren Varianz erhält mehr Gewicht. 2 most informative, d.h. der Deskriptortyp mit der größten mittleren Varianz erhält mehr Gewicht.

60 Adaption der Systemgewichte Bildergalerien Low-Level Deskriptoren Relevanz Feedback und Klassifikation Systemgewichte Kombination der Scorefunktionen d j,f D j ( x) = d j,f α f + d j,f α f + d j,f α f + d j,f α f mit f HTD,EHD,CLD,LALD. 1 best matching, d.h. der Deskriptortyp mit der kleinsten mittleren Varianz erhält mehr Gewicht. 2 most informative, d.h. der Deskriptortyp mit der größten mittleren Varianz erhält mehr Gewicht. 3 manuelle Gewichtung, d.h. der Benutzer kann in die Gewichtung eingreifen.

61 Evaluierungsmaße Überblick Evaluierungsmaße Evaluierung des Retrievals Evaluierung der Klassifikation Eckdaten des Systems Receiver Operating Characteristic (ROC) Curves Confusion-Matrix Precision vs. Recall Graphen

62 Evaluierungsmaße Überblick Evaluierungsmaße Evaluierung des Retrievals Evaluierung der Klassifikation Eckdaten des Systems Receiver Operating Characteristic (ROC) Curves Klassifikation Confusion-Matrix Klassifikation Precision vs. Recall Graphen

63 Evaluierungsmaße Überblick Evaluierungsmaße Evaluierung des Retrievals Evaluierung der Klassifikation Eckdaten des Systems Receiver Operating Characteristic (ROC) Curves Klassifikation Confusion-Matrix Klassifikation Precision vs. Recall Graphen Retrieval

64 Retrieval Überblick Evaluierungsmaße Evaluierung des Retrievals Evaluierung der Klassifikation Eckdaten des Systems precision Bayesian (short term) buses africa 0.4 flowers elephants 0.3 horses beach 0.2 mountains mean values recall precision Bayesian (long term) buses africa 0.4 flowers elephants 0.3 horses beach 0.2 mountains 0.1 mean values recall precision different methods compared long term bayesian 0.2 euclidean FIRE recall Precision vs. Recall Graphen Precision Recall

65 Retrieval Überblick Evaluierungsmaße Evaluierung des Retrievals Evaluierung der Klassifikation Eckdaten des Systems precision Bayesian (short term) buses africa 0.4 flowers elephants 0.3 horses beach 0.2 mountains mean values recall precision Bayesian (long term) buses africa 0.4 flowers elephants 0.3 horses beach 0.2 mountains 0.1 mean values recall precision different methods compared long term bayesian 0.2 euclidean FIRE recall Precision vs. Recall Graphen Precision ist ein Maß dafür, zu wie viel Prozent eine Ergebnismenge aus relevanten Bildern besteht. Recall

66 Retrieval Überblick Evaluierungsmaße Evaluierung des Retrievals Evaluierung der Klassifikation Eckdaten des Systems precision Bayesian (short term) buses africa 0.4 flowers elephants 0.3 horses beach 0.2 mountains mean values recall precision Bayesian (long term) buses africa 0.4 flowers elephants 0.3 horses beach 0.2 mountains 0.1 mean values recall precision different methods compared long term bayesian 0.2 euclidean FIRE recall Precision vs. Recall Graphen Precision ist ein Maß dafür, zu wie viel Prozent eine Ergebnismenge aus relevanten Bildern besteht. Recall ist ein Maß für die Vollständigkeit einer Anfrage, es gibt an, wie viel Prozent der Bilder einer Kategorie im Ergebnisset enthalten sind.

67 Klassifikation Überblick Evaluierungsmaße Evaluierung des Retrievals Evaluierung der Klassifikation Eckdaten des Systems p(ω j ) = 0, p(ω j ) = 0, p(ω j ) = 0, p(ω j ) = 0, Confusion-Matrix

68 Klassifikation Überblick Evaluierungsmaße Evaluierung des Retrievals Evaluierung der Klassifikation Eckdaten des Systems p(ω j ) = 0, p(ω j ) = 0, p(ω j ) = 0, p(ω j ) = 0, Confusion-Matrix Die Confusion-Matrix visualisiert die falsch-negativ Klassifikationen.

69 Klassifikation Überblick Evaluierungsmaße Evaluierung des Retrievals Evaluierung der Klassifikation Eckdaten des Systems p(ω j ) = 0, p(ω j ) = 0, p(ω j ) = 0, p(ω j ) = 0, Confusion-Matrix Die Confusion-Matrix visualisiert die falsch-negativ Klassifikationen. Sie kann verwendet werden, um schlecht trainierte Klassen ausfindig zu machen.

70 Klassifikation Überblick Evaluierungsmaße Evaluierung des Retrievals Evaluierung der Klassifikation Eckdaten des Systems biplanes fälschlicherweise der Klasse car sunsets fälschlicherweise der Klasse flowers landscapes fälschlicherweise der Klasse mountains motorbikes fälschlicherweise der Klasse cars Das bedeutet, die Modelle der Bildklassen cars, flowers und mountains sind nicht besonders robust trainiert.

71 Evaluierungsmaße Evaluierung des Retrievals Evaluierung der Klassifikation Eckdaten des Systems Klassifikation - ROC Curves für alle 12 Bildklassen 1 ROC Curves for 12 different image classes True Positive Rate 0.8 biplanes buildings buses cars 0.6 coastal faces flowers 0.4 landscapes motorbikes mountains 0.2 sailing sunsets mean False Positive Rate Receiver Operating Characteristic (ROC) Curves Die ROC Curves visualisieren den Zusammenhang von richtig-positiv und falsch-positiv Klassifikationen.

72 Eckdaten Überblick Evaluierungsmaße Evaluierung des Retrievals Evaluierung der Klassifikation Eckdaten des Systems Anzahl der verfügbaren Bilder Speicherplatzbedarf der verwendeten MySQL Tabelle 533MB Speicherplatzbedarf der Bilder 4.180MB Zeitdauer für das Matching <2 s Zeitdauer für das Laden der nötigen Daten 20s Zeitdauer für die Klassifikation 0,4-2,0s (je nach Bildgröße)

73 - Ausblick Der inkrementelle Bayessche Klassifikator verbessert die Leistungsfähigkeit des CBIR Systems um mehr als 10% (auch im PCA-Raum funktionsfähig).

74 - Ausblick Der inkrementelle Bayessche Klassifikator verbessert die Leistungsfähigkeit des CBIR Systems um mehr als 10% (auch im PCA-Raum funktionsfähig). Die verwendeten Features scheinen den Feedback Prozess positiv zu beeinflussen.

75 - Ausblick Der inkrementelle Bayessche Klassifikator verbessert die Leistungsfähigkeit des CBIR Systems um mehr als 10% (auch im PCA-Raum funktionsfähig). Die verwendeten Features scheinen den Feedback Prozess positiv zu beeinflussen. Um das Retrieval zu beschleunigen, muss die Ladezeit verringert werden (RAM-Tables für MySQL).

76 - Ausblick Der inkrementelle Bayessche Klassifikator verbessert die Leistungsfähigkeit des CBIR Systems um mehr als 10% (auch im PCA-Raum funktionsfähig). Die verwendeten Features scheinen den Feedback Prozess positiv zu beeinflussen. Um das Retrieval zu beschleunigen, muss die Ladezeit verringert werden (RAM-Tables für MySQL). Um unterschiedliche CBIR Systeme miteinander vergleichen zu können, ist eine einheitliche Testdatenbank erforderlich.

77 - Ausblick Der inkrementelle Bayessche Klassifikator verbessert die Leistungsfähigkeit des CBIR Systems um mehr als 10% (auch im PCA-Raum funktionsfähig). Die verwendeten Features scheinen den Feedback Prozess positiv zu beeinflussen. Um das Retrieval zu beschleunigen, muss die Ladezeit verringert werden (RAM-Tables für MySQL). Um unterschiedliche CBIR Systeme miteinander vergleichen zu können, ist eine einheitliche Testdatenbank erforderlich. Zur objektiven Beurteilung der Leistungsfähigkeit des Systems, wäre ein CBIR System auf der Basis von SVMs hilfreich.

78 Anhang Zusätzliches Weiterführende Literatur Deskriptoren (Binaries) 3ó- Normierung MySQL Benutzerinteraktion 1 PCA Parameter modifizierte Deskriptoren (Binaries) Vorverarbeitung Modelle der 12 Bildklassen (Binaries) Offline Online

79 Anhang Zusätzliches Weiterführende Literatur

80 Anhang Zusätzliches Weiterführende Literatur 1 Bayesian (short term) precision buses africa flowers elephants horses beach mountains mean values recall

81 Anhang Zusätzliches Weiterführende Literatur precision buses africa flowers elephants horses beach mountains mean values Bayesian (long term) recall

82 Anhang Zusätzliches Weiterführende Literatur 1 different methods compared precision long term bayesian euclidean FIRE recall

83 Anhang Zusätzliches Weiterführende Literatur Confusion-Matrix mit p(ω j ) = 0,

84 Anhang Zusätzliches Weiterführende Literatur Confusion-Matrix mit p(ω j ) = 0,

85 Anhang Zusätzliches Weiterführende Literatur Confusion-Matrix mit p(ω j ) = 0,

86 Anhang Zusätzliches Weiterführende Literatur Confusion-Matrix mit p(ω j ) = 0,

87 Anhang Zusätzliches Weiterführende Literatur 1 ROC Curves for 12 different image classes True Positive Rate False Positive Rate biplanes buildings buses cars coastal faces flowers landscapes motorbikes mountains sailing sunsets mean

88 Anhang Zusätzliches Weiterführende Literatur Überblick über die Features lokale Features Edge Histogram Deskriptor Local Average LUV Deskriptor

89 Anhang Zusätzliches Weiterführende Literatur Überblick über die Features lokale Features Edge Histogram Deskriptor Local Average LUV Deskriptor globale Features Homogenous Texture Deskriptor Color Layout Deskriptor

90 Anhang Zusätzliches Weiterführende Literatur Weiterführende Literatur I [1] Thomas Deselaers, Daniel Keysers, Hermann Ney. FIRE - Flexible Image Retrieval Engine: ImageCLEF Fifth Workshop of the Cross-Language Evaluation Forum (CLEF 2004),Bath, UK, pp , September [2]. Studienarbeit, Cortina: Eine Inhaltsbasierte Bildsuchmachine im WWW. Relevance-Feedback als Unterstützung zur Suche im Hochdimensionalen Merkmalsraum. TU-Berlin, FG Nachrichtenübertragung, Germany, 2004.

91 Anhang Zusätzliches Weiterführende Literatur Weiterführende Literatur II [3]. Diplomarbeit. Verwendung von merkmalsgestütztem Relevanz-Feedback zur Suche in einer Online-Bildergalerie. TU-Berlin, FG Nachrichtenübertragung, Germany, [4] Dong Kwon Park, Yoon Seok Jeon, Chee Sun Won. Efficient Use of Local Edge Histogram Descriptor

Semantische Bildsuche mittels kollaborativer Filterung und visueller Navigation

Semantische Bildsuche mittels kollaborativer Filterung und visueller Navigation Semantische Bildsuche mittels kollaborativer Filterung und visueller Navigation Prof. Dr. Kai Uwe Barthel HTW Berlin / pixolution GmbH Übersicht Probleme der gegenwärtigen Bildsuchsysteme Schlagwortbasierte

Mehr

(query by image content)

(query by image content) Proseminar Multimedia Information-Retrieval-Systeme (query by image content) Das QBIC Projekt 1. Einleitung 1.1 Was ist QBIC 1.2 Wo wird es verwendet 2. QBIC im Detail 2.1 technische Grundlagen 2.2 Aufbau

Mehr

Vorlesung Wissensentdeckung

Vorlesung Wissensentdeckung Gliederung Vorlesung Wissensentdeckung Additive Modelle Katharina Morik, Weihs 1 Merkmalsauswahl Gütemaße und Fehlerabschätzung.6.015 1 von 33 von 33 Ausgangspunkt: Funktionsapproximation Aufteilen der

Mehr

Semestralklausur zur Vorlesung. Web Mining. Prof. J. Fürnkranz Technische Universität Darmstadt Sommersemester 2004 Termin: 22. 7.

Semestralklausur zur Vorlesung. Web Mining. Prof. J. Fürnkranz Technische Universität Darmstadt Sommersemester 2004 Termin: 22. 7. Semestralklausur zur Vorlesung Web Mining Prof. J. Fürnkranz Technische Universität Darmstadt Sommersemester 2004 Termin: 22. 7. 2004 Name: Vorname: Matrikelnummer: Fachrichtung: Punkte: (1).... (2)....

Mehr

Computer Vision: SVM-Anwendungsbeispiele, Generalisierbarkeit

Computer Vision: SVM-Anwendungsbeispiele, Generalisierbarkeit Computer Vision: SVM-Anwendungsbeispiele, Generalisierbarkeit D. Schlesinger TUD/INF/KI/IS Visual Categorization with Bags of Keypoints Recognizing Human Actions: A Local SVM Approach Shape Matching and

Mehr

Algorithmen zur Analyse historischer Landkarten. Benedikt Budig Universität Würzburg

Algorithmen zur Analyse historischer Landkarten. Benedikt Budig Universität Würzburg Algorithmen zur Analyse historischer Landkarten Benedikt Budig Universität Würzburg Einführung Einführung Algorithmen zur Analyse historischer Landkarten Einführung Algorithmen zur Analyse historischer

Mehr

Fakultät für Informatik Übung zu Kognitive Systeme Sommersemester 2016

Fakultät für Informatik Übung zu Kognitive Systeme Sommersemester 2016 Fakultät für Informatik Übung zu Kognitive Systeme Sommersemester 1 M. Sperber (matthias.sperber@kit.edu) S. Nguyen (thai.nguyen@kit.edu) Übungsblatt 3 Maschinelles Lernen und Klassifikation Abgabe online

Mehr

Vorlesungsplan. Von Naïve Bayes zu Bayesischen Netzwerk- Klassifikatoren. Naïve Bayes. Bayesische Netzwerke

Vorlesungsplan. Von Naïve Bayes zu Bayesischen Netzwerk- Klassifikatoren. Naïve Bayes. Bayesische Netzwerke Vorlesungsplan 17.10. Einleitung 24.10. Ein- und Ausgabe 31.10. Reformationstag, Einfache Regeln 7.11. Naïve Bayes, Entscheidungsbäume 14.11. Entscheidungsregeln, Assoziationsregeln 21.11. Lineare Modelle,

Mehr

Principal Component Analysis (PCA)

Principal Component Analysis (PCA) Principal Component Analysis (PCA) Motivation: Klassifikation mit der PCA Berechnung der Hauptkomponenten Theoretische Hintergründe Anwendungsbeispiel: Klassifikation von Gesichtern Weiterführende Bemerkungen

Mehr

Suchmaschinen. Anwendung RN Semester 7. Christian Koczur

Suchmaschinen. Anwendung RN Semester 7. Christian Koczur Suchmaschinen Anwendung RN Semester 7 Christian Koczur Inhaltsverzeichnis 1. Historischer Hintergrund 2. Information Retrieval 3. Architektur einer Suchmaschine 4. Ranking von Webseiten 5. Quellenangabe

Mehr

Seminar Textmining SS 2015 Grundlagen des Maschinellen Lernens

Seminar Textmining SS 2015 Grundlagen des Maschinellen Lernens Seminar Textmining SS 2015 Grundlagen des Maschinellen Lernens Martin Hacker Richard Schaller Künstliche Intelligenz Department Informatik FAU Erlangen-Nürnberg 17.04.2015 Entscheidungsprobleme beim Textmining

Mehr

Entwicklung eines Distanzmaßes zwischen Bildern über dem Modell der Fields of Visual Words

Entwicklung eines Distanzmaßes zwischen Bildern über dem Modell der Fields of Visual Words Entwicklung eines Distanzmaßes zwischen Bildern über dem Modell der Fields of Visual Words André Viergutz 1 Inhalt Einführung. Einordnung der Arbeit in die zugrunde liegenden Konzepte Das Modell der Fields

Mehr

Ein Vergleich von Methoden für Multi-klassen Support Vector Maschinen

Ein Vergleich von Methoden für Multi-klassen Support Vector Maschinen Ein Vergleich von Methoden für Multi-klassen Support Vector Maschinen Einführung Auf binären Klassifikatoren beruhende Methoden One-Against-All One-Against-One DAGSVM Methoden die alle Daten zugleich betrachten

Mehr

Recommender Systems. Stefan Beckers Praxisprojekt ASDL SS 2006 Universität Duisburg-Essen April 2006

Recommender Systems. Stefan Beckers Praxisprojekt ASDL SS 2006 Universität Duisburg-Essen April 2006 Recommender Systems Stefan Beckers Praxisprojekt ASDL SS 2006 Universität Duisburg-Essen April 2006 Inhalt 1 - Einführung 2 Arten von Recommender-Systemen 3 Beispiele für RCs 4 - Recommender-Systeme und

Mehr

Kapitel 11* Grundlagen ME. Aufbau eines ME-Systems Entwicklung eines ME-Systems. Kapitel11* Grundlagen ME p.1/12

Kapitel 11* Grundlagen ME. Aufbau eines ME-Systems Entwicklung eines ME-Systems. Kapitel11* Grundlagen ME p.1/12 Kapitel 11* Kapitel11* Grundlagen ME p.1/12 Grundlagen ME Aufbau eines ME-Systems Entwicklung eines ME-Systems Kapitel11* Grundlagen ME p.2/12 Aufbau eines ME-Systems (1) on line Phase digitalisiertes

Mehr

Vorlesung Maschinelles Lernen

Vorlesung Maschinelles Lernen Vorlesung Maschinelles Lernen Additive Modelle Katharina Morik Informatik LS 8 Technische Universität Dortmund 7.1.2014 1 von 34 Gliederung 1 Merkmalsauswahl Gütemaße und Fehlerabschätzung 2 von 34 Ausgangspunkt:

Mehr

Algorithmus zum Graphen-Matching. und. Anwendung zur inhaltsbasierten Bildersuche

Algorithmus zum Graphen-Matching. und. Anwendung zur inhaltsbasierten Bildersuche Algorithmus zum Graphen-Matching und Anwendung zur inhaltsbasierten Bildersuche Gliederung 1. Einführung 2. Algorithmus Beschreibung Beispiel Laufzeit 3. Anwendung des Algorithmus Seite 1 von 18 1. Einführung

Mehr

Sentiment Analysis (SA) Robert Bärhold & Mario Sänger Text Analytics WS 2012/13 Prof. Leser

Sentiment Analysis (SA) Robert Bärhold & Mario Sänger Text Analytics WS 2012/13 Prof. Leser Sentiment Analysis (SA) Robert Bärhold & Mario Sänger Text Analytics WS 2012/13 Prof. Leser Gliederung Einleitung Problemstellungen Ansätze & Herangehensweisen Anwendungsbeispiele Zusammenfassung 2 Gliederung

Mehr

Evaluation. Caroline Sporleder. Computational Linguistics Universität des Saarlandes. Sommersemester 2011 26.05.2011

Evaluation. Caroline Sporleder. Computational Linguistics Universität des Saarlandes. Sommersemester 2011 26.05.2011 Evaluation Caroline Sporleder Computational Linguistics Universität des Saarlandes Sommersemester 2011 26.05.2011 Caroline Sporleder Evaluation (1) Datensets Caroline Sporleder Evaluation (2) Warum evaluieren?

Mehr

Phishingerkennung mittels visuellem Ähnlichkeitsvergleich. Felix Hill Ruhr-Universität Bochum felix.hill@rub.de

Phishingerkennung mittels visuellem Ähnlichkeitsvergleich. Felix Hill Ruhr-Universität Bochum felix.hill@rub.de Phishingerkennung mittels visuellem Ähnlichkeitsvergleich Felix Hill Ruhr-Universität Bochum felix.hill@rub.de 1 ÜBERSICHT Entwicklung im Bereich Phishing Ansatz Bilderkennung Evaluation G DATA EINFACH

Mehr

20.01.2015 Fabian Grimme und Tino Krüger 1 INDREX. Evaluierung von H2O. Enterprise Data Management Beuth Hochschule für Technik

20.01.2015 Fabian Grimme und Tino Krüger 1 INDREX. Evaluierung von H2O. Enterprise Data Management Beuth Hochschule für Technik 20.01.2015 Fabian Grimme und Tino Krüger 1 INDREX Evaluierung von H2O Enterprise Data Management Beuth Hochschule für Technik 20.01.2015 Fabian Grimme und Tino Krüger 2 INDREX im Überblick In-Database

Mehr

Vorstellung von Bewegung Berlin Brain Computer Interfaces (BBCI)

Vorstellung von Bewegung Berlin Brain Computer Interfaces (BBCI) Vorstellung von Bewegung Berlin Brain Computer Interfaces (BBCI) Let the machines learn! Jela Ruhe, Sara Winter 02.12.2009 BMI Universität Bielefeld ౧ Gliederung 2 Einführung Methoden Experimente & Ergebnisse

Mehr

Personalisierung. Der Personalisierungsprozess Nutzerdaten erheben aufbereiten auswerten Personalisierung. Data Mining.

Personalisierung. Der Personalisierungsprozess Nutzerdaten erheben aufbereiten auswerten Personalisierung. Data Mining. Personalisierung Personalisierung Thomas Mandl Der Personalisierungsprozess Nutzerdaten erheben aufbereiten auswerten Personalisierung Klassifikation Die Nutzer werden in vorab bestimmte Klassen/Nutzerprofilen

Mehr

Computer Vision: AdaBoost. D. Schlesinger () Computer Vision: AdaBoost 1 / 10

Computer Vision: AdaBoost. D. Schlesinger () Computer Vision: AdaBoost 1 / 10 Computer Vision: AdaBoost D. Schlesinger () Computer Vision: AdaBoost 1 / 10 Idee Gegeben sei eine Menge schwacher (einfacher, schlechter) Klassifikatoren Man bilde einen guten durch eine geschickte Kombination

Mehr

Dokumenten-Clustering. Norbert Fuhr

Dokumenten-Clustering. Norbert Fuhr Dokumenten-Clustering Norbert Fuhr Dokumenten-Clustering (Dokumenten-)Cluster: Menge von ähnlichen Dokumenten Ausgangspunkt Cluster-Hypothese : die Ähnlichkeit der relevanten Dokumente untereinander und

Mehr

Inhaltliche Planung für die Vorlesung

Inhaltliche Planung für die Vorlesung Vorlesung: Künstliche Intelligenz - Mustererkennung - P LS ES S ST ME Künstliche Intelligenz Miao Wang 1 Inhaltliche Planung für die Vorlesung 1) Definition und Geschichte der KI, PROLOG 2) Expertensysteme

Mehr

Data Mining mit Rapidminer im Direktmarketing ein erster Versuch. Hasan Tercan und Hans-Peter Weih

Data Mining mit Rapidminer im Direktmarketing ein erster Versuch. Hasan Tercan und Hans-Peter Weih Data Mining mit Rapidminer im Direktmarketing ein erster Versuch Hasan Tercan und Hans-Peter Weih Motivation und Ziele des Projekts Anwendung von Data Mining im Versicherungssektor Unternehmen: Standard

Mehr

Praktikum: Erweiterung eines Machine Learning Frameworks. Author: Richard Stein Betreuer: Oren Halvani Abgabe:

Praktikum: Erweiterung eines Machine Learning Frameworks. Author: Richard Stein Betreuer: Oren Halvani Abgabe: Praktikum: Erweiterung eines Machine Learning Frameworks Author: Richard Stein Betreuer: Oren Halvani Abgabe: 11.04.2016 Zusammenfassung In dieser Arbeit wird ein Framework zur Textanalyse mittels maschinellem

Mehr

Kapitel 8. Inhaltsbasierte Suche in Bilddatenbanken

Kapitel 8. Inhaltsbasierte Suche in Bilddatenbanken Kapitel 8 Inhaltsbasierte Suche in Bilddatenbanken One picture is worth 1000 words. However, a picture is worth far fewer than 1000 words if you cannot find them. Einführung Suche durch Merkmalswerte Suche

Mehr

ML-Werkzeuge und ihre Anwendung

ML-Werkzeuge und ihre Anwendung Kleine Einführung: und ihre Anwendung martin.loesch@kit.edu (0721) 608 45944 Motivation Einsatz von maschinellem Lernen erfordert durchdachtes Vorgehen Programmieren grundlegender Verfahren aufwändig fehlerträchtig

Mehr

SEMINAR AUTOMATISCHE GESICHTSERKENNUNG

SEMINAR AUTOMATISCHE GESICHTSERKENNUNG SEMINAR AUTOMATISCHE GESICHTSERKENNUNG OBERSEMINAR AUTOMATISCHE ANALYSE VON GESICHTSAUSDRÜCKEN Organisation, Überblick, Themen Überblick heutige Veranstaltung 1. Organisatorisches 2. Überblick über beide

Mehr

Methoden & Tools für die Expressionsdatenanalyse. Vorlesung Einführung in die Bioinformatik - Expressionsdatenanalyse U. Scholz & M.

Methoden & Tools für die Expressionsdatenanalyse. Vorlesung Einführung in die Bioinformatik - Expressionsdatenanalyse U. Scholz & M. Methoden & Tools für die Expressionsdatenanalyse U. Scholz & M. Lange Folie #7-1 Vorgehensmodell Expressionsdatenverarbeitung Bildanalyse Normalisierung/Filterung Datenauswertung U. Scholz & M. Lange Folie

Mehr

Kapitel 5. Bayes Klassifikator

Kapitel 5. Bayes Klassifikator Kapitel 5 Bayes Klassifikator Theoretische Grundlagen Bayes Entscheidungstheorie Allgemeiner Bayes Klassifikator Bayes Klassifikator bei Normalverteilung Parameterschätzung Nichtparametrische Klassifikatoren

Mehr

Grundlagen von Support Vector Maschinen und Anwendungen in der Bildverarbeitung

Grundlagen von Support Vector Maschinen und Anwendungen in der Bildverarbeitung Grundlagen von Support Vector Maschinen und Anwendungen in der Bildverarbeitung Jan Eichhorn jan.eichhorn@tuebingen.mpg.de Max-Planck-Institut für biologische Kybernetik 72076 Tübingen Danksagung Olivier

Mehr

WEKA A Machine Learning Interface for Data Mining

WEKA A Machine Learning Interface for Data Mining WEKA A Machine Learning Interface for Data Mining Frank Eibe, Mark Hall, Geoffrey Holmes, Richard Kirkby, Bernhard Pfahringer, Ian H. Witten Reinhard Klaus Losse Künstliche Intelligenz II WS 2009/2010

Mehr

JPlus Platform Independent Learning with Environmental Information in School

JPlus Platform Independent Learning with Environmental Information in School JPlus Platform Independent Learning with Environmental Information in School Mario Härtwig, Pierre Karrasch Salzburg, 7. Juli 2010 Genesis Umweltmonitoring als Beitrag zur Umweltbildung an Schulen. Kulturlandschaftsentwicklung

Mehr

Companion Technologie

Companion Technologie Companion Technologie Emotionen erkennen, verstehen und kai.bielenberg@haw-hamburg.de Agenda 1. Einleitung a. Was war nochmal Companion Technologie? b. Teilbereiche c. Warum Emotionen? 2. Ansätze a. Facial

Mehr

Software vergleichen. Andrea Herrmann AndreaHerrmann3@gmx.de. 25.11.2011 Fachgruppentreffen RE

Software vergleichen. Andrea Herrmann AndreaHerrmann3@gmx.de. 25.11.2011 Fachgruppentreffen RE Software vergleichen Andrea Herrmann AndreaHerrmann3@gmx.de 25.11.2011 Fachgruppentreffen RE Übersicht 1. Motivation 2. Stand der Forschung 3. Gap-Analyse versus Delta-Analyse 4. Grafischer Vergleich 5.

Mehr

2 Evaluierung von Retrievalsystemen

2 Evaluierung von Retrievalsystemen 2. Evaluierung von Retrievalsystemen Relevanz 2 Evaluierung von Retrievalsystemen Die Evaluierung von Verfahren und Systemen spielt im IR eine wichtige Rolle. Gemäß der Richtlinien für IR der GI gilt es,...

Mehr

Eine Einführung in R: Hochdimensionale Daten: n << p Teil II

Eine Einführung in R: Hochdimensionale Daten: n << p Teil II Eine Einführung in R: Hochdimensionale Daten: n

Mehr

Schriftlicher Test Teilklausur 2

Schriftlicher Test Teilklausur 2 Technische Universität Berlin Fakultät IV Elektrotechnik und Informatik Künstliche Intelligenz: Grundlagen und Anwendungen Wintersemester 2009 / 2010 Albayrak, Fricke (AOT) Opper, Ruttor (KI) Schriftlicher

Mehr

Indexstrukturen in XML

Indexstrukturen in XML Seminar XML und Datenbanken Indexstrukturen in XML Vanessa Schäfer 07.02.2003 Übersicht Einführung Indexstrukturen in XML Ein Vergleich SphinX vs. Lore Zusammenfassung und Ausblick Seminar XML und Datenbanken

Mehr

Fahrzeuglokalisierung anhand visueller Landmarken und einer digitalen Karte

Fahrzeuglokalisierung anhand visueller Landmarken und einer digitalen Karte Fahrzeuglokalisierung anhand visueller Landmarken und einer digitalen Karte Oliver Pink INSTITUT FÜR MESS- UND REGELUNGSTECHNIK KIT - Universität des Landes Baden-Württemberg und nationales Großforschungszentrum

Mehr

Entwicklungstand der GUI

Entwicklungstand der GUI 1/13 Entwicklungstand der GUI Dietrich Vogel dvogel@physik.uni-wuppertal.de 7. Juli 2004 2/13 Inhalt 1.Konzept 2.Entwicklungsstand 3.Bestehende Probleme 4.Weitere Entwicklungsstrategie 5.Fragen, Diskussion

Mehr

Implementation of a Framework Component for Processing Tasks within Threads on the Application Level

Implementation of a Framework Component for Processing Tasks within Threads on the Application Level Implementation of a Framework Component for Processing Tasks within Threads on the Application Level Deutsches Krebsforschungszentrum, for Processing Task within Threads on the Application Level Motivation

Mehr

Vorlesung Information Retrieval Wintersemester 04/05

Vorlesung Information Retrieval Wintersemester 04/05 Vorlesung Information Retrieval Wintersemester 04/05 14. Oktober 2004 Institut für Informatik III Universität Bonn Tel. 02 28 / 73-45 31 Fax 02 28 / 73-43 82 jw@informatik.uni-bonn.de 1 Themenübersicht

Mehr

Proseminar - Data Mining

Proseminar - Data Mining Proseminar - Data Mining SCCS, Fakultät für Informatik Technische Universität München SS 2012, SS 2012 1 Data Mining Pipeline Planung Aufbereitung Modellbildung Auswertung Wir wollen nützliches Wissen

Mehr

Datenbanken erstellen Liste von Datenbanken anzeigen Datenbanken löschen. MySQL 4, 5. Kapitel 06: Datenbanken. Marcel Noe

Datenbanken erstellen Liste von Datenbanken anzeigen Datenbanken löschen. MySQL 4, 5. Kapitel 06: Datenbanken. Marcel Noe MySQL 4, 5 Kapitel 06: Datenbanken Gliederung 1 Datenbanken erstellen 2 3 Datenbanken erstellen CREATE DATABASE erstellt. Optional kann der Parameter IF NOT EXISTS die Datenbank bereits existiert.

Mehr

Anwendungen des Fréchet-Abstandes Das Constrained Free Space Diagram zur Analyse von Körperbewegungen

Anwendungen des Fréchet-Abstandes Das Constrained Free Space Diagram zur Analyse von Körperbewegungen Anwendungen des Fréchet-Abstandes Das Constrained Free Space Diagram zur Analyse von Körperbewegungen David Knötel Freie Universität Berlin, Institut für Informatik Seminar über Algorithmen Leitfaden Wiederholung

Mehr

Meteorological measurements at the Offshore Platform FINO 2 - new insights -

Meteorological measurements at the Offshore Platform FINO 2 - new insights - FINO 2011 Conference May 11 th 2011, Hamburg, Germany Meteorological measurements at the Offshore Platform FINO 2 - new insights - Dipl.-Geoök. Stefan Müller, Dipl.-Ing Joachim Schwabe Content 1. FINO

Mehr

DIPLOMARBEIT. Entwurf und Implementierung eines modularen USB-Stacks für eingebettete Controller ohne Betriebssystem. Uwe Pfeiffer

DIPLOMARBEIT. Entwurf und Implementierung eines modularen USB-Stacks für eingebettete Controller ohne Betriebssystem. Uwe Pfeiffer Fakultät Informatik Institut für Technische Informatik, Professur für VLSI-Entwurfssysteme, Diagnostik und Architektur DIPLOMARBEIT Entwurf und Implementierung eines modularen USB-Stacks für eingebettete

Mehr

Webbasierte Exploration von großen 3D-Stadtmodellen mit dem 3DCityDB Webclient

Webbasierte Exploration von großen 3D-Stadtmodellen mit dem 3DCityDB Webclient Webbasierte Exploration von großen 3D-Stadtmodellen mit dem 3DCityDB Webclient Zhihang Yao, Kanishk Chaturvedi, Thomas H. Kolbe Lehrstuhl für Geoinformatik www.gis.bgu.tum.de 11/14/2015 Webbasierte Exploration

Mehr

Multimedia-Metadaten und ihre Anwendung

Multimedia-Metadaten und ihre Anwendung Multimedia-Metadaten und ihre Anwendung 14.02.2006 Video Retrieval und Video Summarization Maria Wagner Aspekte des Video Retrieval 2/14 Videoanalyse Analyse nötig, um Struktur und Metadaten zu erkennen

Mehr

SemTalk Services. SemTalk UserMeeting 29.10.2010

SemTalk Services. SemTalk UserMeeting 29.10.2010 SemTalk Services SemTalk UserMeeting 29.10.2010 Problemstellung Immer mehr Anwender nutzen SemTalk in Verbindung mit SharePoint Mehr Visio Dokumente Viele Dokumente mit jeweils wenigen Seiten, aber starker

Mehr

Weka: Software-Suite mit Maschineller Lernsoftware

Weka: Software-Suite mit Maschineller Lernsoftware : Software-Suite mit Maschineller Lernsoftware Computational Linguistics Universität des Saarlandes Sommersemester 2011 21.04.2011 Erste Schritte Waikato Environment for Knowledge Analysis entwickelt von

Mehr

Kapitel ML: I. I. Einführung. Beispiele für Lernaufgaben Spezifikation von Lernproblemen

Kapitel ML: I. I. Einführung. Beispiele für Lernaufgaben Spezifikation von Lernproblemen Kapitel ML: I I. Einführung Beispiele für Lernaufgaben Spezifikation von Lernproblemen ML: I-8 Introduction c STEIN/LETTMANN 2005-2010 Beispiele für Lernaufgaben Autoeinkaufsberater Welche Kriterien liegen

Mehr

Anfrage Erweiterung 03.11.2011 Jan Schrader

Anfrage Erweiterung 03.11.2011 Jan Schrader Anfrage Erweiterung 03.11.2011 Jan Schrader Vocabulary Mismatch Problem Anfrage und Dokument passen nicht zusammen obwohl Dokument zur Anfrage relevant Grund: Synonymproblem verschiedene Menschen benennen

Mehr

Kapitel IR:I. I. Einführung. Retrieval-Szenarien Begriffsbildung Einordnung Information Retrieval

Kapitel IR:I. I. Einführung. Retrieval-Szenarien Begriffsbildung Einordnung Information Retrieval Kapitel IR:I I. Einführung Retrieval-Szenarien Begriffsbildung Einordnung Information Retrieval IR:I-1 Introduction STEIN 2005-2010 Retrieval-Szenarien Liefere Dokumente, die die Terme «Information» und

Mehr

Information Retrieval in P2P-Netzen

Information Retrieval in P2P-Netzen Information Retrieval in P2P-Netzen Vorstellung der Vortragsthemen zum Seminar Henrik Nottelmann 30. Oktober 2003 Henrik Nottelmann 1/21 Grundstruktur A) Filesharing-Systeme (3 Themen) B) Zugriffsstrukturen

Mehr

Text Mining 4. Seminar Klassifikation

Text Mining 4. Seminar Klassifikation Text Mining 4. Seminar Klassifikation Stefan Bordag 1. Klassifikation Stringklassifikation (männliche-weibliche Vornamen) Dokument klassifikation Bayesian Neuronal network (Decision tree) (Rule learner)

Mehr

Würfelspiele und Zufall

Würfelspiele und Zufall Würfelspiele und Zufall Patrik L. Ferrari 29. August 2010 1 Random horse die Irrfahrt des Pferdchens Betrachte ein Schachbrett mit einem Pferd (Springer), welches sich nach den üblichen Springer-Regeln

Mehr

Implementierung der Jikes Research Virtual Machine

Implementierung der Jikes Research Virtual Machine Fakultät Informatik Institut für technische Informatik, Professur für VLSI-Entwurfssysteme, Diagnostik und Architektur Implementierung der Jikes Research Virtual Machine Hauptseminar Technische Informatik

Mehr

Bayes sches Lernen: Übersicht

Bayes sches Lernen: Übersicht Bayes sches Lernen: Übersicht Bayes sches Theorem MAP, ML Hypothesen MAP Lernen Minimum Description Length Principle Bayes sche Klassifikation Naive Bayes Lernalgorithmus Teil 5: Naive Bayes + IBL (V.

Mehr

Agenda. Eine gute Basis: SAS Base und SAS Graph. Neue Graph Prozeduren Neuerungen in SAS Base Live Demo ausgesuchter Codes.

Agenda. Eine gute Basis: SAS Base und SAS Graph. Neue Graph Prozeduren Neuerungen in SAS Base Live Demo ausgesuchter Codes. Eine gute Basis: SAS Base und SAS Graph Nils-Henrik Wolf Agenda Erweiterungen für SAS Graph Neue Graph Prozeduren Neuerungen in SAS Base Live Demo ausgesuchter Codes 1 ODS Graphics Statistische Prozeduren

Mehr

Continuous Information Quality Assessment in Stream Based Smart City Frameworks

Continuous Information Quality Assessment in Stream Based Smart City Frameworks Continuous Information Quality Assessment in Stream Based Smart City Frameworks 19. VDE/ITG Fachtagung Mobilkommunikation Osnabrück, 22.05.2014 Thorben Iggena Tel.: +49 541/969-2723 E-Mail: t.iggena@hs-osnabrueck.de

Mehr

Mittelwertvergleiche, Teil II: Varianzanalyse

Mittelwertvergleiche, Teil II: Varianzanalyse FB 1 W. Ludwig-Mayerhofer Statistik II 1 Herzlich willkommen zur Vorlesung Mittelwertvergleiche, Teil II: FB 1 W. Ludwig-Mayerhofer Statistik II 2 : Wichtigste Eigenschaften Anwendbar auch bei mehr als

Mehr

Textmining Klassifikation von Texten Teil 1: Naive Bayes

Textmining Klassifikation von Texten Teil 1: Naive Bayes Textmining Klassifikation von Texten Teil 1: Naive Bayes Dept. Informatik 8 (Künstliche Intelligenz) Friedrich-Alexander-Universität Erlangen-Nürnberg (Informatik 8) Klassifikation von Texten 1: Naive

Mehr

Online Wissensüberprüfung mit GIA (Graphisch- Interaktive Assessments)

Online Wissensüberprüfung mit GIA (Graphisch- Interaktive Assessments) Online Wissensüberprüfung mit GIA (Graphisch- Interaktive Assessments) ein Werkzeug zur effizienten Gestaltung von Online-Assessments i3mainz GIA Ein Werkzeug für Online Wissensüberprüfung Onlinetests

Mehr

Superpixels for Skin Segmentation

Superpixels for Skin Segmentation Farbworkshop Wuppertal 2014 1 Superpixels for Skin Segmentation Frerk Saxen und Ayoub Al-Hamadi 2 Fachgebiet Neuro-Informationstechnik Unter Leitung von Prof. Ayoub Al-Hamadi 18 Mitarbeiter Davon 12 Doktoranden

Mehr

INTELLIGENTE DATENANALYSE IN MATLAB

INTELLIGENTE DATENANALYSE IN MATLAB INTELLIGENTE DATENANALYSE IN MATLAB Bildanalyse Literatur David A. Forsyth: Computer Vision i A Modern Approach. Mark S. Nixon und Alberto S. Aguado: Feature Extraction and Image Processing. Ulrich Schwanecke:

Mehr

Mit KI gegen SPAM. Proseminar Künstliche Intelligenz

Mit KI gegen SPAM. Proseminar Künstliche Intelligenz Mit KI gegen SPAM Proseminar Künstliche Intelligenz SS 2006 Florian Laib Ausblick Was ist SPAM? Warum SPAM-Filter? Naive Bayes-Verfahren Fallbasiertes Schließen Fallbasierte Filter TiMBL Vergleich der

Mehr

Einführung in der NI Plattform für WLAN Test. Ken Tobler, System Engineer National Instruments

Einführung in der NI Plattform für WLAN Test. Ken Tobler, System Engineer National Instruments Einführung in der NI Plattform für WLAN Test Ken Tobler, System Engineer National Instruments Agenda WLAN Test Einführung zur NI Tools Vorteile: Geschwindigkeit Flexibilität Kostenreduzierung Einführung

Mehr

Neue Wege der Suche in Medienarchiven

Neue Wege der Suche in Medienarchiven Neue Wege der Suche in Medienarchiven Dr. Harald Sack Hasso-Plattner-Institut für Softwaresystemtechnik Universität Potsdam 3. Leipziger Semantic Web Tag, 5. Mai 2011 Das HPI wurde im Oktober 1998 im Rahmen

Mehr

Vortrag zum Paper Results of the Active Learning Challenge von Guyon, et. al. Sören Schmidt Fachgebiet Knowledge Engineering

Vortrag zum Paper Results of the Active Learning Challenge von Guyon, et. al. Sören Schmidt Fachgebiet Knowledge Engineering Vortrag zum Paper Results of the Active Learning Challenge von Guyon, et. al. Sören Schmidt Fachgebiet Knowledge Engineering 11.12.2012 Vortrag zum Paper Results of the Active Learning Challenge von Isabelle

Mehr

Kapitel 15* Bayes Klassifikator. Theoretische Grundlagen Bayes Entscheidungstheorie

Kapitel 15* Bayes Klassifikator. Theoretische Grundlagen Bayes Entscheidungstheorie Kapitel 15* Bayes Klassifikator p. 1/56 Bayes Klassifikator Theoretische Grundlagen Bayes Entscheidungstheorie Kapitel 15* Allgemeiner Bayes Klassifikator Parametrische Methoden Normalverteilungen Gaussian

Mehr

Kapitel 5: Einfaktorielle Varianzanalyse

Kapitel 5: Einfaktorielle Varianzanalyse Rasch, Friese, Hofmann & Naumann (006). Quantitative Methoden. Band (. Auflage). Heidelberg: Springer. Kapitel 5: Einfaktorielle Varianzanalyse Berechnen der Teststärke a priori bzw. Stichprobenumfangsplanung

Mehr

Visuelle Simulation eines Radiosity Algorithmus und ihre Anwendung in Lernprozessen

Visuelle Simulation eines Radiosity Algorithmus und ihre Anwendung in Lernprozessen Visuelle Simulation eines Radiosity Algorithmus und ihre Anwendung in Lernprozessen Abschlussvortrag zur Diplomarbeit von Jörg Karpf Graphische Datenverarbeitung, Institut für Informatik 3. September 2009

Mehr

Entwicklung eines branchenspezifischen Frameworks. Nicolas With AW2 Betreuer: Olaf Zukunft

Entwicklung eines branchenspezifischen Frameworks. Nicolas With AW2 Betreuer: Olaf Zukunft Entwicklung eines branchenspezifischen Frameworks für Nicolas With AW2 Betreuer: Olaf Zukunft Gliederung Thema Motivation Einstieg Related Work Krcmar Cao Patel Abgrenzung Ausblick 01.06.2011 2 Thema Motivation

Mehr

One-class Support Vector Machines

One-class Support Vector Machines One-class Support Vector Machines Seminar Wissensbasierte Systeme Dietrich Derksen 3. Januar 204 Motivation One-class Support Vector Machines: Detektion von Ausreißern (Systemfehlererkennung) Klassifikation

Mehr

MySQL Queries on "Nmap Results"

MySQL Queries on Nmap Results MySQL Queries on "Nmap Results" SQL Abfragen auf Nmap Ergebnisse Ivan Bütler 31. August 2009 Wer den Portscanner "NMAP" häufig benutzt weiss, dass die Auswertung von grossen Scans mit vielen C- oder sogar

Mehr

Einführung in die Computerlinguistik

Einführung in die Computerlinguistik Einführung in die Computerlinguistik Statistische Modellierung I WS 2010/2011 Manfred Pinkal Wortartinformation Wortartinformation ist eine wichtige Voraussetzung für die syntaktische Analyse. Woher kommt

Mehr

Erfolgstypen & Typenerfolg

Erfolgstypen & Typenerfolg Erfolgstypen & Typenerfolg Zum Zusammenhang zwischen betriebstypologischen Merkmalen und Indikatoren des Betriebserfolgs Philipp Toscani Institut für Agrar- und Forstökonomie Methodische Aspekte und analytische

Mehr

Information Retrieval

Information Retrieval Information Retrieval Bisher: Datenbankabfrage mit Hilfe von SQL in relationalen Datenbanken. Die Informationen liegen geordnet in Tabellen -> exakte Ergebnisse Neu: Die Informationen liegen in Datensammlungen

Mehr

Datenvisualisierung mit JMP

Datenvisualisierung mit JMP Datenvisualisierung mit JMP Patrick René Warnat HMS Analytical Software GmbH Rohrbacherstr. 26 Heidelberg patrick.warnat@analytical-software.de Zusammenfassung Das JMP Paket ist ein Softwareprodukt der

Mehr

Maschinelles Lernen und Data Mining: Methoden und Anwendungen

Maschinelles Lernen und Data Mining: Methoden und Anwendungen Maschinelles Lernen und Data Mining: Methoden und Anwendungen Eyke Hüllermeier Knowledge Engineering & Bioinformatics Fachbereich Mathematik und Informatik GFFT-Jahrestagung, Wesel, 17. Januar 2008 Knowledge

Mehr

Maschinelles Lernen Entscheidungsbäume

Maschinelles Lernen Entscheidungsbäume Universität Potsdam Institut für Informatik Lehrstuhl Maschinelles Lernen Maschinelles Lernen Entscheidungsbäume Paul Prasse Entscheidungsbäume Eine von vielen Anwendungen: Kreditrisiken Kredit - Sicherheiten

Mehr

BINGO! Ein fokussierender Crawler zur Generierung personalisierter Ontologien

BINGO! Ein fokussierender Crawler zur Generierung personalisierter Ontologien BINGO! Ein fokussierender Crawler zur Generierung personalisierter Ontologien Martin Theobald Stefan Siersdorfer,, Sergej Sizov Universität des Saarlandes Lehrstuhl für Datenbanken und Informationssysteme

Mehr

Browser- gestützte Visualisierung komplexer Datensätze: Das ROAD System

Browser- gestützte Visualisierung komplexer Datensätze: Das ROAD System AG Computeranwendungen und QuanLtaLve Methoden in der Archäologie 5. Workshop Tübingen 14. 15. Februar 2014 Browser- gestützte Visualisierung komplexer Datensätze: Das ROAD System Volker Hochschild, Michael

Mehr

Änderungsbasiertes Requirements Management mit agosense.requirements

Änderungsbasiertes Requirements Management mit agosense.requirements Änderungsbasiertes Requirements Management mit agosense.requirements REFERENT Webinar Nr. 3 6. Oktober 2015 15 Uhr bis 16 Uhr Bernd Röser Key Account Manager Kurzer Hinweis zu Beginn Fragen stellen während

Mehr

Exploring the knowledge in Semi Structured Data Sets with Rich Queries

Exploring the knowledge in Semi Structured Data Sets with Rich Queries Exploring the knowledge in Semi Structured Data Sets with Rich Queries Jürgen Umbrich Sebastian Blohm Institut AIFB, Universität Karlsruhe (TH) Forschungsuniversität gegründet 1825 www.kit.ed Overview

Mehr

Funktion Das Skript erstellt ROC-Kurven mit Konfidenzbändern, berechnet (gewichtete) Cutoff-Punkte und (partial) Area under the Curve (AUC, pauc).

Funktion Das Skript erstellt ROC-Kurven mit Konfidenzbändern, berechnet (gewichtete) Cutoff-Punkte und (partial) Area under the Curve (AUC, pauc). Skriptname: ROC_pAUC7.jsl JMP-Version: JMP 7 Datum: 10.09.2007 Download: ROC.zip Funktion Das Skript erstellt ROC-Kurven mit Konfidenzbändern, berechnet (gewichtete) Cutoff-Punkte und (partial) Area under

Mehr

Web Content Management Systeme

Web Content Management Systeme Web Content Management Systeme Konzepte und praktische Anwendung Seminar im Studienschwerpunkt Multimedia von Frithjof Klös Überblick Einleitung Überblick Motivation 1. skriterien 2. 3. Konzeptumsetzung

Mehr

Seminar Text- und Datamining Datamining-Grundlagen

Seminar Text- und Datamining Datamining-Grundlagen Seminar Text- und Datamining Datamining-Grundlagen Martin Hacker Richard Schaller Künstliche Intelligenz Department Informatik FAU Erlangen-Nürnberg 23.05.2013 Gliederung 1 Klassifikationsprobleme 2 Evaluation

Mehr

Lösungsansätze zum Design erfolgreicher mobiler Anwendungen

Lösungsansätze zum Design erfolgreicher mobiler Anwendungen Arbeitskreis Software -Technologien Lösungsansätze zum Design erfolgreicher mobiler Anwendungen Philipp Liebrenz, Samsung Design Europe Inhalt Einführung Was ist Interface/Interactiondesign? Geschichte

Mehr

EXTRAKTION UND KLASSIFIKATION VON BEWERTETEN PRODUKTFEATURES AUF WEBSEITEN

EXTRAKTION UND KLASSIFIKATION VON BEWERTETEN PRODUKTFEATURES AUF WEBSEITEN EXTRAKTION UND KLASSIFIKATION VON BEWERTETEN PRODUKTFEATURES AUF WEBSEITEN T-SYSTEMS MULTIMEDIA SOLUTIONS GMBH, 16. FEBRUAR 2012 1. Schlüsselworte Semantic Web, Opinion Mining, Sentiment Analysis, Stimmungsanalyse,

Mehr

SUCHMASCHINEN XAPIAN. Michael Strzempek FH Wiesbaden, 5. Juni 2008

SUCHMASCHINEN XAPIAN. Michael Strzempek FH Wiesbaden, 5. Juni 2008 SUCHMASCHINEN XAPIAN Michael Strzempek FH Wiesbaden, 5. Juni 2008 INHALT 1. Motivation 2. Prinzip / Vokabular 3. Xapian 4. Omega 5. Datenbank Indizierung 6. Levenshtein Distanz 7. Boolesche Suche 8. Probabilistische

Mehr

The Earth Mover s Distance

The Earth Mover s Distance The Earth Mover s Distance Till Bovermann Technische Fakultät Universität Bielefeld BILDDATENBANKEN Seminar SS 03 Tanja Kämpfe Zusammenfassung Diese Ausarbeitung beschäftigt sich mit der Earth Mover s

Mehr