Information Retrieval und Multimedia Datenbanken 1

Größe: px
Ab Seite anzeigen:

Download "Information Retrieval und Multimedia Datenbanken 1"

Transkript

1 Dr. Wolf-Tilo Balke, Universität Hannover Information Retrieval und Multimedia Datenbanken 1 Vorlesung

2 Multimedia-Datenbanken Persistente Speicherung von Mediendaten, z.b. Text-Dokumente Vektorgraphik, CAD Bild, Audio, Video Content-based Retrieval Effiziente und inhaltsbasierte Suche Standardisierung von Meta-Daten (z.b. MPEG-7)

3 Inhaltsbasierte Suche (CBR) Suche alle Bilder, die einen Sonnenuntergang darstellen! Was genau zeichnet die Bilder aus?

4 Stand-alone vs. Datenbank Spezielle Retrievalfunktionalität und darauf abgestimmte Optimierung Datenbanken haben generelle Vorteile Deklarative Anfragesprachen Orthogonale Kombination der Anfragefunktionalität Query-Optimierung, Indexstrukturen Transaktionsverwaltung, Recovery Etc

5 Historischer Überblick Relationale Datenbanken/SQL seit Ende der 70iger Jahre Text-Dokumente brauchen andere Retrievalverfahren (Information Retrieval, stand-alone Systeme seit den 60-70iger Jahren) Medienobjekte treten verstärkt in den 80igern auf SQL-92 führt BLOBs ein Multimedia Datenbanken seit Beginn der 90iger Jahre

6 Kommerzielle Systeme Relationale Datenbanken verwenden den BLOB (binary large object) Datentyp Uninterpretierte Daten Retrieval durch Metadaten, z.b. file name, size, author, Objektrelationale Erweiterungen lagern erweiterte Retrievalfunktionalität aus Semantische Suche IBM DB2 Extenders, Oracle Cartridges, Einbindung in DB durch Stored Procedures, UDFs,

7 Grundlegende Definitionen

8 Medium und Multimedia Ein Medium ist ein Überträger von Information in einer Kommunikationsbeziehung Es ist unabhängig von der übermittelten Information Bei der Informationsübertragung kann das verwendete Medium auch gewechselt werden (Medienumsetzung)

9 Beispiel: Medium Buch Kommunikation zwischen Autor und Leser unabhängig vom Inhalt hierarchisch auf Schrift und Bild aufbauend Vorlesen ist Medienumsetzung nach Schall/Audio

10 Medienklassifikation Nach empfangendem Sinn Visuelle/optische Medien Sprachgebunden Sprachungebunden Akustische Medien Haptische Medien durch Berührung Olfaktorisache Medien durch Geruch Gustatorische Medien durch Geschmack Nach Zeitbezug Dynamische oder statische Medien

11 Medium und Multimedia Der Begriff Multimedia bezieht sich auf die Integration verschiedener digitaler Medientypen Die Integration findet in der Regel im Rahmen eines Dokuments statt Wesentliche Medientypen sind Text, Bild, Vektorgraphik, Audio und Video

12 Datentypen Text ASCII-basierte Files, Textverarbeitungsdokumente, Spreadsheets, , Bild Sequenz von Pixels, Photos, Vektorgraphik, CAD, Audio Sprach- und Musikaufnahmen, Annotationen, Wave files, MIDI, MP3, Video Dynamische Bildaufnahmen, Frame Sequenzen, MPEG, AVI,

13 Dokument und Medienobjekt Frühe IR Definition: Dokumente sind logisch zusammenhängende digital codierte Texte Erweiterung auf Multimedia-Dokumente (verallgemeinerte Dokumente) erlaubt die zusätzliche Einbindung von anderen Medientypen wie Bildern, Audio oder Video

14 Dokument und Medienobjekt Medienobjekte sind Dokumente, die nicht unbedingt Text enthalten müssen und von einem einzigen Typ sind Multimediaobjekte sind verallgemeinerte Dokumente, die eine beliebige Kombination verschiedener Typen erlauben

15 Retrieval Unter Retrieval versteht man die Auswahl (und nachfolgende Auslieferung an den Benutzer) von Datenbankobjekten, die einer gewissen Selektionsbedingung (exact match) oder einer definierten Ähnlichkeitsbeziehung (best match) entsprechen

16 Multimedia-Datenbanksystem Anforderungen an Multimedia-Datenbanken (S. Chistodoulakis [SIGMOD 85]) Klassische Datenbankfunktionalität Plus Verwaltung unformatierter Daten Plus Berücksichtigung spezieller Speicherund Präsentationsgeräte

17 Multimedia-Datenbanksystem Dafür müssen folgende Aspekte berücksichtigt werden Softwarearchitektur Neu oder als Erweiterung bestehender Datenbanken? Inhaltsadressierung Identifikation der Objekte durch inhaltstragende Merkmale Performanz Gesteigerte Leistungsfähigkeit durch Indexierung, Optimierung, etc.

18 Multimedia-Datenbanksystem Benutzerschnittstelle Wie soll der Nutzer interagieren? Trennung von Struktur und Inhalt Informationsextraktion (Automatische) Generierung inhaltstragender Merkmale Speichergeräte Extrem hohe Kapazitäten, Redundanzkontrolle und Kompression Information Retrieval Integration der erweiterten Suchfunktionalität

19 Schematische Darstellung der Suchfunktionalität

20 Anforderungen an die Suchfunktionalität Semantische Suchfunktionalität Orthogonale Integration klassischer und erweiterter Funktionalität Suche arbeitet nicht direkt auf den Medienobjekten Extraktion, Normalisierung und Indexierung inhaltstragender Merkmale (Features) Geeignete Ähnlichkeits-/Distanzmaße

21 Schematische Darstellung Normalerweise zwei Schritte, z.b. Bilddatenbanken Bildsammlung

22 Genauer Ingo Schmitt, Uni Magdeburg

23 Ingo Schmitt, Uni Magdeburg

24 Anwendungen

25 Grundsätzliche Unterscheidung Statisch: Hohe Anzahl von Suchen, also Lesezugriffen, wenig Änderung des Datenbestandes Dynamisch: Häufige Modifikation der Datenbank Aktiv: Datenbankfunktionalität zwingt Anwendungen Operationen auf Passiv: Datenbank reagiert nur auf Aufforderungen von außen Standardsuche: Multimediadaten werden nur verwaltet und durch Metadaten abgefragt Retrievalfunktionalität: Inhaltsbasierte Suche auf dem Multimediadatenbestand

26 Beispiel: Passiv Statisches Retrieval Kunsthistorische Anwendung

27 Beispiel Treffer in der Multimedia-Datenbank

28 Beispiel: Aktiv Dynamisches Retrieval Wetterwarnungen mittels Satellitenbildauswertung Extraktion Taifun-Warnung auf den Philippinen

29 Literatur

30 Literaturliste I. Schmitt: Ähnlichkeitssuche in Multimedia- Datenbanken. Retrieval, Suchalgorithmen und Anfragebehandlung, Oldenbourg, 2005 R. Steinmetz: Multimedia Technologie: Grundlagen, Komponenten und Systeme, Springer Verlag, 1999 V. Castelli, L. Bergman: Image Databases, Wiley, 2002 S. Khoshafian, B. Baker: MultiMedia and Imaging Databases, Morgan Kaufmann Publishers, 1996

31 Textbasiertes Retrieval

32 Einführung Verschiedenen Arten von Datenzugriff Klassische deklarative Datenbankanfrage anhand exakt formulierter Bedingungen (SQL) select ISBN from Buch where Titel = Multimediale Datenbanken unscharfe Formulierung in IRS Finde alle Text-Dokumente über das Thema Multimediale Datenbanken

33 Unterschiede im Datenzugriff Exaktes Daten-Retrieval Nur wenn der Titel genau stimmt, wird das Buch zurückgeliefert Alle Treffer sind relevant Nicht alle Treffer werden geliefert

34 Unterschiede im Datenzugriff Information Retrieval Alle Bücher, die etwas zum Thema beitragen werden zurückgeliefert Nicht alle Treffer sind relevant Aber mehr Treffer werden geliefert

35 Unterschiede Die Daten sind unstrukturiert (im Gegensatz zum relationalen Modell) Implizit formulierte Information erfordert eine weitergehende Interpretation Stemming, semantische Interpretation, Thesauri, Toleranz bei der Anfrageformulierung Mehr, evtl. auch irrelevante Ergebnisse Ergebnisreihenfolge ist wesentlich Bewertete Listen, Scores, Relevanz durch Schwellwerte,

36 Unterschiede

37 Grundlage für ein IR Modell IR-Modell definiert interne Dokumentdarstellung Anfrageformulierung und interne Anfragedarstellung Vergleichsfunktion zwischen jeweils zwei Dokumenten beziehungsweise zwischen Anfrage und jeweils einem Dokument.

38 Schematische Darstellung IR

39 Grundlegende Modelle

40 Boolesches Modell Einfaches (und wohl ältestes) IR Modell basierend auf Mengentheorie Boolescher Algebra Dokumente und Anfragen sind Term- Mengen Binäres Termgewicht 1 falls ein Term auftritt 0 falls ein Term nicht auftritt

41 Boolesches Modell Dokumente werden als (vordefinierte) Mengen von Termen interpretiert D 1 = {neu, Vorlesungsscript, Multimediadatenbanken, Retrievalkonzepte} Stemming: neues zu neu Stopwords: dies, ist, Dies ist ein neues Vorlesungsscript über Multimediadatenbanken und ihre Retrievalkonzepte D 1

42 Boolesches Modell Die Suche überprüft Enthaltenseinsbedingungen Finde alle Dokumente, die das Wort Multimediadatenbanken enthalten Komplexe Queries werden durch boolesche Junktoren verknüpft Finde alle Dokumente, die das Wort Multimediadatenbanken und das Wort Vorlesungsscript enthalten

43 Boolesches Modell Boolesche Junktoren 0 1 Konjunktion and Disjunktion or Negation not

44 Boolesches Modell Beispiel D 1 = {Vorlesungsscript, Multimediadatenbanken} D 2 = {Buch, Multimediadatenbanken} D 1 D 2 Vorlesungsscript 1 0 Buch 0 1 Multimediadatenbanken 1 1

45 Boolesches Modell Beispiel Q 1 = Buch and Multimediadatenbanken D 2 Q 2 = Buch or Multimediadatenbanken D 1,D 2 D 1 D 2 Vorlesungsscript 1 0 Buch 0 1 Multimediadatenbanken 1 1

46 Boolesches Modell Buch MMDB Buch MMDB Buch and MMDB Buch MMDB Buch MMDB Buch or MMDB Buch and not MMDB

47 Boolesches Modell Vorsicht: not Junktor liefert große Dokumentmengen zurück, wenn er allein (oder in Disjunktionen) verwendet wird Q 3 = not Multimediadatenbanken Verwendung nur in Zusammenhang mit positiven Ausdrücken (Konjunktionen) but statt and not Q 4 = Buch but Multimediadatenbanken

48 Boolesches Modell Eine abkürzende Schreibweise ist of für Termmengen Q 5 = 2 of { Buch, Script, MMDB } Q 5 = ( Buch and Script ) or ( Buch and MMDB ) or ( Script and MMDB )

49 Boolesches Modell Zur Berechnung des Anfrage müssen alle Anfragen normalisiert werden Disjunktive Normalform (DNF) Konjunktive Normalform (KNF) DNF hat kleinere Zwischenergebnisse, weil zuerst alle Schnitte gemacht werden

50 Boolesches Modell Beispiel Q 6 = MMDB and (( Script and neu ) or Buch ) Disjunktive NF Q 6 = ( MMDB and Script and neu ) or ( MMDB and Buch ) Konjunktive NF Q 6 = MMDB and ( Script or Buch ) and ( neu or Buch )

51 Boolesches Modell Implementierung in der Regel durch Inverted File Indexes Für jeden Term des Vokabulars gibt es einen Schlüssel im Index Jedem Term werden alle Dokumente zugeordnet, die den Term enthalten Eine Anfrage besteht aus einer Menge von Termen

52 Boolesches Modell Beispiel V = {Term1, Term2, term3, Term4}, D = {D 1, D 2, D 3, D 4 } Term1 : D 1, D 2, D 3, D 4 (Inverted File Index) Term2 : D 1, D 2 Term3 : D 1, D 2, D 3 Term4 : D 1 Q 7 = (Term1 AND Term2) OR (Term3 AND (NOT Term4)) Schnitt der Term1- und Term2-Liste ergibt {D 1, D 2 } Differenz der Term4- von Term3-Liste ergibt {D 2, D 3 } Vereinigung beider Mengen ergibt {D 1, D 2, D 3 }

53 Boolesches Modell Vorteil Wenn sich alle Dokumentrepräsentationen voneinander unterscheiden, kann man jede beliebige Untermenge von Dokumenten durch eine Anfrage herausschneiden (die richtige Query führt also zu einem perfektem Retrievalergebnis) Konstruktiver Beweis: Wähle für jedes Dokument in der Untermenge eine entsprechende Anfrage (1 für vorkommende, 0 für nicht vorkommende Terme) und bilde die Disjunktion all dieser Anfragen Vorteil ist eher theoretischer Natur, denn diese Anfrage ist zu Beginn des Retrievals unbekannt

54 Boolesches Modell Probleme Einfach, aber beschränkte Ausdrucksmächtigkeit Alle Ergebnisse sind gleich relevant Anfrageformulierung ist schwierig bezüglich Anforderungen an Ergebnismenge ( Empty Result Effekt und Flooding Effekt) Nicht wirklich gut für Ähnlichkeitssuche einsetzbar

55 Fuzzy Modell Erweiterung des Booleschen Modells Nicht nur binäre Termgewichte, sondern beliebige Gewichte in [0,1] Verallgemeinerung Boolescher Junktoren Jedes Dokument ist durch einen Term zu einem gewissem Grad charakterisiert

56 Fuzzy Modell Definition von Fuzzy-Mengen (Theorie der Fuzzy Logik, L. Zadeh, 1965) Eine Fuzzy-Menge A = {(u ; μ A (u))} über einem Universum U ist durch eine Zugehörigkeitsfunktion μ A : U [0,1] charakterisiert, welche jedem Element u des Universums U einen Wert μ A (u) aus dem Intervall [0,1] zuordnet.

57 Fuzzy Modell Retrievalmodell Menge aller Dokumente als Universum Jeder Term ist eine Fuzzy-Menge Der Fuzzy-Wert eines Dokuments drückt die Charakterisierung eines Dokuments bezüglich des Terms aus 0 heißt der Term ist irrelevant 1 heißt der Term ist maximal relevant Alle Zwischenwerte sind möglich

58 Fuzzy Modell Beispiel Gegeben 3 Dokumente D 1, D 2, D 3 Fuzzy-Mengen (Terme): Buch und MMDB Buch = {(D 1 ; 0.1); (D 2 ; 0.6); (D 3 ; 1.0)} MMDB = {(D 1 ; 0.3); (D 2 ; 0.2); (D 3 ; 0.8)} D 1 D 2 D 3 Buch MMDB

59 Fuzzy Modell Fuzzy-Junktoren Konjunktion Disjunktion Negation

60 Fuzzy Modell Beispiel Q 7 = Buch and MMDB Ergebnis {(D 1, 0.1); (D 2, 0.2); (D 3, 0.8)} Q 7 = Buch or MMDB Ergebnis {(D 1, 0.3); (D 2, 0.6); (D 3, 1.0)} D 1 D 2 D 3 Buch MMDB

61 Fuzzy Modell Aber die Definition der Retrievalfunktion ist ungünstig Beispiel: Q = Buch and MMDB Vergleiche Dokumente: D 1 = (0,4; 0,4) D 2 = (0,39; 0,99) Ergebnis {(D 1, 0,4); (D 2, 0.39) } ist unintuitiv, weil der minimale Wert durchschlägt Auch experimentell nachgewiesen

62 Fuzzy Modell Alle Dokumente auf der blauen Linie haben denselben Retrievalwert 0,7 Term 1 1,0 0,7 Term 1 1,0 0,7 Term 1 Term 2 Term 1 Term 2 0,7 1,0 Term 2 0,7 1,0 Term 2

63 Fuzzy Modell Wie bekommt man die Fuzzy-Werte zur Bestimmung der Zugehörigkeit eines Dokuments zu einem Term? Z.B. mit Term-zu-Term Korrelationsmatrizen bestimmen wie häufig Terme in einer Dokumentenmenge gemeinsam auftreten Dann wird für jeden Term T und jedes Dokument ein Wert bestimmt, der die Korrelationen aller anderen im Dokument vorhandenen Terme zu Term T aggregiert

64 Fuzzy Modell Buch Buch 1 Script 0 MMDBS 0.5 MMDBS, Buch Script MMDBS MMDBS, Script C i,j = n i,j n i + n j n i,j n i := # Dokumente die Term i enthalten n i,j := # Dokumente die Term i und Term j enthalten

65 Fuzzy Modell Fuzzy-Wert des Dokuments D j bezüglich Term T i ist gegeben durch μ Ti (D j ) = 1 Π (1 c i,k ) T k D j MMDBS, Buch MMDBS, Script μ MMDBS = 1 (1 0,5) = 0,5 μ Buch = 1 (1 1) = 1,0 μ Script = 1 (1 0) = 0,0 μ MMDBS = 1 (1 0,5) = 0,5 μ Buch = 1 (1 0) = 0,0 μ Script = 1 (1 1) = 1,0

66 Fuzzy Modell Vorteile Ergebnisse beim Fuzzy-Modell bewerten alle Datenbankobjekte Bewertete Ergebnislisten spiegeln die Idee einer Ähnlichkeitssuche deutlich stärker wieder als das Boolesche Modell Top k Retrieval oder Einsatz relevanter Schwellwerte sind möglich

67 Fuzzy Modell Probleme Ableitung der Zugehörigkeitswerte ist meist kostenintensiv Min/Max Funktion lassen kleinsten/größten Wert im Ergebnis durchschlagen (analog zum Booleschen Modell) Keine intuitive Verwendbarkeit der Fuzzy- Konjunktoren

68 Vektorraummodell Wohl bekanntestes IR Modell Grundidee: Lineare Algebra Dokumente und Anfragen sind Punkte in einem (orthonormalen) Vektorraum, der von den Termen des Grundvokabulars aufgespannt wird Ähnliche Vektoren kennzeichnen ähnliche Dokumente

69 Vektorraummodell Anfragen Punkte im Vektorraum ( virtuelle Dokumente ) Abstandsmessung von Anfrage und Dokumenten durch geeignete Distanzmaße Beliebige Termgewichtungen und zudem experimentell den vorigen Modellen überlegen Entwickelt für das SMART Retrievalsystem (G. Salton, 1971)

70 Vektorraummodell Beispiel: (Ähnlichkeit über das Skalarprodukt) Q = Buch über MM oder DBS aber kein Script Terme Anfrage Q D 1 D 2 D 3 Buch 1,0 1,0 0,7 0,8 MM 0,5 0,8 0 0 DBS 0,5 1,0 1,0 0,8 Script -1,0 0 0,5 0 Gesamtgewicht 1,9 0,7 1,2

71 Vektorraummodell Auswertung der Dokumente bezüglich der Anfrage Ähnlichkeitsmaße Je größer, desto ähnlicher Unähnlichkeitsmaße Distanzmaße Je größer, desto unähnlicher

72 Vektorraummodell Ähnlichkeitsmaße zwischen Anfragevektor q und Dokumentvektor d Einfaches Skalarprodukt sim(q,d) = <q,d> := q t * d Cosinusmaß sim cos (q,d) = <q,d> := <q,d> q d <q,q> <d,d> Cosinus ist maximal bei 0 o, Cosinusmaß ist invariant gegen Länge der Vektoren

73 Vektorraummodell Geometrische Anschauung Term 1 1,0 0,5 d 2 x x q x d 1 Aus α < β folgt sim cos (q,d 2 ) > sim cos (q,d 1 ) und damit d 2 erfüllt q besser als d 1 α β 0,5 1,0 Term 2

74 Vektorraummodell Distanzmaß zwischen Anfragevektor q und Dokumentvektor d L 2 Norm oder euklidische Distanz dissim L2 (q,d) = ( q-d ) t ( q-d ) = Σ (q[i] d[i]) 2 i Nicht invariant gegen die Länge der Vektoren

75 Vektorraummodell Geometrische Anschauung Term 1 1,0 0,5 d 2 x x q x d 1 Aus d 1 hat geringeren euklidischen Abstand zu q folgt dissim L2 (q,d 2 ) > dissim L2 (q, d 1 ) und damit d 1 erfüllt q besser als d 2 0,5 1,0 Term 2

76 Vektorraummodell Vorsicht Die Anordnung der ähnlichsten Treffer hängt stark von der Wahl des Ähnlichkeitsoder Distanzmaßes ab Hohe Dokumentenähnlichkeit bezüglich einen Maßes muss in anderen Maßen nicht unbedingt gegeben sein Wichtig: Wahl des richtigen Maßes für die jeweilige Anwendung

77 Vektorraummodell Beispiel Term 1 1,0 d 2 x 0,5 α β x q x d 1 d 2 ist besseres Dokument bzgl. q im Cosinusmaß, d 1 ist besseres Dokument bzgl. q in der L 2 Norm Geringer Abstand => relativ kleiner Winkel, Umkehrung gilt nicht 0,5 1,0 Term 2

78 Nächste Vorlesung Gewichte im Vektorraummodell Dokumentenclustering Bewertung von Information Retrievalsystemen Precision, Recall, Fallout Unterschiede von IR und Multimedia Retrieval

<is web> Information Systems & Semantic Web

<is web> Information Systems & Semantic Web Information Systems University of Koblenz Landau, Germany 3 Prinzipien des Information Retrieval Einführung Information-Retrieval-Modelle Relevance Feedback Bewertung von Retrieval-Systemen Nutzerprofile

Mehr

Boole'sches Modell <is web>

Boole'sches Modell <is web> Boole'sches Modell basiert auf Mengentheorie und Boole'scher Algebra sehr einfaches Modell mit klarer Semantik Dokumente als Mengen von Indextermen Termgewichte sind binär: im Dokument enthalten oder nicht

Mehr

Indexvokabular {Korsika, Sardinien, Strand, Ferienwohnung, Gebirge} Verknüpfung von Enthaltenseinsbedingungen mittels Boole'scher Junktoren.

Indexvokabular {Korsika, Sardinien, Strand, Ferienwohnung, Gebirge} Verknüpfung von Enthaltenseinsbedingungen mittels Boole'scher Junktoren. Boole'sches Modell Boole'sches Modell: Beispiel basiert auf Mengentheorie und Boole'scher Algebra sehr einfaches Modell mit klarer Semantik Dokumente als Mengen von Indextermen Termgewichte sind binär:

Mehr

Übungen zu Multimedia-Datenbanken Aufgabenblatt 2 - Musterlösungen

Übungen zu Multimedia-Datenbanken Aufgabenblatt 2 - Musterlösungen Übungen zu Multimedia-Datenbanken Aufgabenblatt 2 - Musterlösungen Übung: Dipl.-Inform. Tina Walber Vorlesung: Dr.-Ing. Marcin Grzegorzek Fachbereich Informatik, Universität Koblenz Landau Ausgabe: 03.05.200

Mehr

Multimedia-Datenbanken im SS 2010 Einführung in MMDB

Multimedia-Datenbanken im SS 2010 Einführung in MMDB Multimedia-Datenbanken im SS 2010 Einführung in MMDB Dr.-Ing. Marcin Grzegorzek 27.04.2010 Ähnlichkeitssuche in Multimedia-Datenbanken 2/ 28 Inhalte und Termine 1. Einführung in MMDB 1.1 Grundlegende Begriffe

Mehr

Multimedia Retrieval im WS 2011/2012

Multimedia Retrieval im WS 2011/2012 Multimedia Retrieval im WS 2011/2012 2. Prinzipien des Information Retrieval Prof. Dr.-Ing. Marcin Grzegorzek Juniorprofessur für Mustererkennung Institut für Bildinformatik im Department ETI Fakultät

Mehr

T = {t 1,..., t n } sei die Menge der Terme. D = {d 1,..., d m } sei die Menge der Dokumente.

T = {t 1,..., t n } sei die Menge der Terme. D = {d 1,..., d m } sei die Menge der Dokumente. Vektorraummodell T = {t 1,..., t n } sei die Menge der Terme. D = {d 1,..., d m } sei die Menge der Dokumente. Dokumente und Anfragen werden als Vektoren in einem Vektorraum aufgefaßt. Der Vektorraum wird

Mehr

2 Volltext-Suchmaschinen

2 Volltext-Suchmaschinen 2 Volltext-Suchmaschinen Volltext-Suchmaschinen werden vor allem für die Suche im Internet benutzt, jedoch gibt es auch Erweiterungen (Data Cartridge, Oracle) um Volltextsuche bei SQL-Suchmaschinen wie

Mehr

Erweitertes boolsches Retrieval

Erweitertes boolsches Retrieval Erweitertes boolsches Retrieval In diesem Unterabschnitt werden andere Ansätze zur Verbesserung des boolschen Retrievals vorgestellt. Im Gegensatz zum Vektorraummodell wird bei diesen Ansätzen versucht,

Mehr

Information Retrieval. 3 Prinzipien des Information Retrieval. 3.1 Einführung. Historische Entwicklung von Information-Retrieval-Systemen

Information Retrieval. 3 Prinzipien des Information Retrieval. 3.1 Einführung. Historische Entwicklung von Information-Retrieval-Systemen 3 Prinzipien des Information Retrieval Einführung Information-Retrieval-Modelle Relevance Feedback Bewertung von Retrieval-Systemen Nutzerprofile Literaturempfehlungen Information Retrieval notwendig zur

Mehr

Kapitel IR:III (Fortsetzung)

Kapitel IR:III (Fortsetzung) Kapitel IR:III (Fortsetzung) III. Retrieval-Modelle Modelle und Prozesse im IR Klassische Retrieval-Modelle Bool sches Modell Vektorraummodell Retrieval-Modelle mit verborgenen Variablen Algebraisches

Mehr

3. Retrievalmodelle Grundkonzept des Vektorraummodells. Vektorraummodell. Dokumente und Anfragen werden als Vektoren in einem Vektorraum aufgefaßt.

3. Retrievalmodelle Grundkonzept des Vektorraummodells. Vektorraummodell. Dokumente und Anfragen werden als Vektoren in einem Vektorraum aufgefaßt. 3. Retrievalmodelle Grundkonzept des Vektorraummodells Vektorraummodell Dokumente und Anfragen werden als Vektoren in einem Vektorraum aufgefaßt. Der Vektorraum wird durch die in der Datenbank enthaltenen

Mehr

4. Nicht-Probabilistische Retrievalmodelle

4. Nicht-Probabilistische Retrievalmodelle 4. Nicht-Probabilistische Retrievalmodelle 1 4. Nicht-Probabilistische Retrievalmodelle Norbert Fuhr 4. Nicht-Probabilistische Retrievalmodelle 2 Rahmenarchitektur für IR-Systeme Evaluierung Informations

Mehr

Mathematische Grundlagen I Logik und Algebra

Mathematische Grundlagen I Logik und Algebra Logik und Algebra Dr. Tim Haga 21. Oktober 2016 1 Aussagenlogik Erste Begriffe Logische Operatoren Disjunktive und Konjunktive Normalformen Logisches Schließen Dr. Tim Haga 1 / 21 Präliminarien Letzte

Mehr

Information Retrieval, Vektorraummodell

Information Retrieval, Vektorraummodell Universität Potsdam Institut für Informatik Lehrstuhl Maschinelles Lernen Information Retrieval, Vektorraummodell Tobias Scheffer Paul Prasse Michael Großhans Uwe Dick Information Retrieval Konstruktion

Mehr

Information Retrieval

Information Retrieval Information Retrieval Bisher: Datenbankabfrage mit Hilfe von SQL in relationalen Datenbanken. Die Informationen liegen geordnet in Tabellen -> exakte Ergebnisse Neu: Die Informationen liegen in Datensammlungen

Mehr

6. Probabilistische Retrievalmodelle. Norbert Fuhr

6. Probabilistische Retrievalmodelle. Norbert Fuhr 6. Probabilistische Retrievalmodelle Norbert Fuhr Notationen Q α Q Q β Q Q D R rel. judg. D α D D β D D D ρ IR q Q Anfrage d D Dokument q k Q: d m D: Anfragerepräsentation Dokumentrepräsentation qk D QD

Mehr

IR Seminar SoSe 2012 Martin Leinberger

IR Seminar SoSe 2012 Martin Leinberger IR Seminar SoSe 2012 Martin Leinberger Suchmaschinen stellen Ergebnisse häppchenweise dar Google: 10 Ergebnisse auf der ersten Seite Mehr Ergebnisse gibt es nur auf Nachfrage Nutzer geht selten auf zweite

Mehr

Suche in Multimedia-Datenbanken

Suche in Multimedia-Datenbanken Suche in Multimedia-Datenbanken Ingo Schmitt 20. April 2005 Gliederung 1. Motivation 2. Ähnlichkeitssuche in einem MMDBS 3. Semantische Lücke 4. Ähnlichkeitsanfragesprachen 5. Effiziente Ergebnisberechnung

Mehr

Boolesche- und Vektorraum- Modelle

Boolesche- und Vektorraum- Modelle Boolesche- und Vektorraum- Modelle Viele Folien in diesem Abschnitt sind eine deutsche Übersetzung der Folien von Raymond J. Mooney (http://www.cs.utexas.edu/users/mooney/ir-course/). 1 Retrieval Modelle

Mehr

Retrieval Modelle. Boolesche- und Vektorraum- Modelle. Weitere Modell-Dimensionen. Klassen von Retrieval Modellen. Boolesche Modelle (Mengentheorie)

Retrieval Modelle. Boolesche- und Vektorraum- Modelle. Weitere Modell-Dimensionen. Klassen von Retrieval Modellen. Boolesche Modelle (Mengentheorie) Retrieval Modelle Boolesche- und Vektorraum- Modelle Ein Retrieval-Modell spezifiziert die Details der: Repräsentation von Dokumenten Repräsentation von Anfragen Retrievalfunktion Legt die Notation des

Mehr

Information Retrieval und Multimedia Datenbanken 1

Information Retrieval und Multimedia Datenbanken 1 Dr. Wolf-Tilo Balke, Universität Hannover Information Retrieval und Multimedia Datenbanken 1 Vorlesung 12.05.06 Vektorraummodell Bekanntestes IR Modell Grundidee: Lineare Algebra Dokumente und Anfragen

Mehr

Federated Search: Integration von FAST DataSearch und Lucene

Federated Search: Integration von FAST DataSearch und Lucene Federated Search: Integration von FAST DataSearch und Lucene Christian Kohlschütter L3S Research Center BSZ/KOBV-Workshop, Stuttgart 24. Januar 2006 Christian Kohlschütter, 24. Januar 2006 p 1 Motivation

Mehr

Caliph & Emir. Retrieval und Annotation von digitalen Photos mit MPEG-7. Mathias Lux

Caliph & Emir. Retrieval und Annotation von digitalen Photos mit MPEG-7.  Mathias Lux Caliph & Emir Retrieval und Annotation von digitalen Photos mit MPEG-7 Mathias Lux mlux@know-center.at - gefördert durch das Kompetenzzentrenprogramm Overview Einleitung Geschichtliches Annotation mit

Mehr

Midas Metadata yield by Data Analysis

Midas Metadata yield by Data Analysis Midas Metadata yield by Data Analysis Glossar powered by Was ist Text Mining? Unter Text Mining versteht sich im Allgemeinen die Extraktion von strukturierten Informationen aus unstrukturierten oder semistrukturierten

Mehr

Digitale Bibliotheken. Informationssuche, Zugriff und Verbreitung

Digitale Bibliotheken. Informationssuche, Zugriff und Verbreitung Digitale Bibliotheken Informationssuche, Zugriff und Verbreitung Gliederung Einführung Informationssuche Problemstellung Boolesche Suche Vektorraumsuche Stemming Multilinguale Suche Fuzzy Suche Semantische

Mehr

Information Retrieval,

Information Retrieval, Universität Potsdam Institut für Informatik Lehrstuhl Maschinelles Lernen Information Retrieval, Vektorraummodell Tobias Scheffer Uwe Dick Peter Haider Paul Prasse Information Retrieval Konstruktion von

Mehr

Objektrelationale Datenbanken

Objektrelationale Datenbanken Objektrelationale Datenbanken Ein Lehrbuch von Can Türker, Gunther Saake 1. Auflage Objektrelationale Datenbanken Türker / Saake schnell und portofrei erhältlich bei beck-shop.de DIE FACHBUCHHANDLUNG dpunkt.verlag

Mehr

Nachteile Boolesches Retrieval

Nachteile Boolesches Retrieval Nachteile Boolesches Retrieval Komplizierte Anfragen Häufigkeit bzw. Relevanz der Terme in den Dokumenten nicht berücksichtigt 2 von 3 UND-verknüpften Termen im Dokument so schlecht wie 0 Terme Keine Rangfolge

Mehr

HS Information Retrieval

HS Information Retrieval HS Information Retrieval Vergleichende Implementierung der grundlegenden IR-Modelle für eine Desktop-Suche Inhalt 1. Überblick 2. Recap: Modelle 3. Implementierung 4. Demo 5. Evaluation Überblick Ziele:

Mehr

Suchmaschinen. Anwendung RN Semester 7. Christian Koczur

Suchmaschinen. Anwendung RN Semester 7. Christian Koczur Suchmaschinen Anwendung RN Semester 7 Christian Koczur Inhaltsverzeichnis 1. Historischer Hintergrund 2. Information Retrieval 3. Architektur einer Suchmaschine 4. Ranking von Webseiten 5. Quellenangabe

Mehr

Information Retrieval. Überblick

Information Retrieval. Überblick Fachhochschule Köln, Campus Gummersbach Institut für Informatik und Ingenieurwissenschaften Information Retrieval WPF 45 Überblick Prof. Dr. Heide Faeskorn - Woyke Fachhochschule Köln Campus Gummersbach

Mehr

Lineare Algebra. Mathematik II für Chemiker. Daniel Gerth

Lineare Algebra. Mathematik II für Chemiker. Daniel Gerth Lineare Algebra Mathematik II für Chemiker Daniel Gerth Überblick Lineare Algebra Dieses Kapitel erklärt: Was man unter Vektoren versteht Wie man einfache geometrische Sachverhalte beschreibt Was man unter

Mehr

Dokumenten-Clustering. Norbert Fuhr

Dokumenten-Clustering. Norbert Fuhr Dokumenten-Clustering Norbert Fuhr Dokumenten-Clustering (Dokumenten-)Cluster: Menge von ähnlichen Dokumenten Ausgangspunkt Cluster-Hypothese : die Ähnlichkeit der relevanten Dokumente untereinander und

Mehr

Multimedia-Datenbanken im SS 2010 Effiziente Algorithmen und Datenstrukturen II

Multimedia-Datenbanken im SS 2010 Effiziente Algorithmen und Datenstrukturen II Multimedia-Datenbanken im SS 2010 Effiziente und Datenstrukturen II Dr.-Ing. Marcin Grzegorzek 05.07.2010 Inhalte und Termine 1. Einführung in MMDB 1.1 Grundlegende Begriffe 1.2 Suche in einem MMDBS 1.3

Mehr

Kurzskript zur Vorlesung Mathematik I für MB, WI/MB und andere Prof. Dr. Ulrich Reif

Kurzskript zur Vorlesung Mathematik I für MB, WI/MB und andere Prof. Dr. Ulrich Reif 14 Oktober 2008 1 Kurzskript zur Vorlesung Mathematik I für MB, WI/MB und andere Prof Dr Ulrich Reif Inhalt: 1 Vektorrechnung 2 Lineare Gleichungssysteme 3 Matrizenrechnung 4 Lineare Abbildungen 5 Eigenwerte

Mehr

Objektrelationale und erweiterbare Datenbanksysteme

Objektrelationale und erweiterbare Datenbanksysteme Objektrelationale und erweiterbare Datenbanksysteme Erweiterbarkeit SQL:1999 (Objekt-relationale Modellierung) In der Vorlesung werden nur die Folien 1-12 behandelt. Kapitel 14 1 Konzepte objekt-relationaler

Mehr

Information Retrieval. Peter Kolb

Information Retrieval. Peter Kolb Information Retrieval Peter Kolb Semesterplan Einführung Boolesches Retrievalmodell Volltextsuche, invertierter Index Boolesche Logik und Mengen Vektorraummodell Evaluation im IR Term- und Dokumentrepräsentation

Mehr

Einführung in die Theoretische Informatik

Einführung in die Theoretische Informatik Einführung in die Theoretische Informatik Woche 4 Harald Zankl Institut für Informatik @ UIBK Wintersemester 2014/2015 Zusammenfassung Zusammenfassung der letzten LV Modus Ponens A B B A MP Axiome für

Mehr

Boole sches Retrieval als frühes, aber immer noch verbreitetes IR-Modell mit zahlreichen Erweiterungen

Boole sches Retrieval als frühes, aber immer noch verbreitetes IR-Modell mit zahlreichen Erweiterungen Rückblick Boole sches Retrieval als frühes, aber immer noch verbreitetes IR-Modell mit zahlreichen Erweiterungen Vektorraummodell stellt Anfrage und Dokumente als Vektoren in gemeinsamen Vektorraum dar

Mehr

Übersicht. Volltextindex Boolesches Retrieval Termoperationen Indexieren mit Apache Lucene

Übersicht. Volltextindex Boolesches Retrieval Termoperationen Indexieren mit Apache Lucene Übersicht Volltextindex Boolesches Retrieval Termoperationen Indexieren mit Apache Lucene 5.0.07 1 IR-System Peter Kolb 5.0.07 Volltextindex Dokumentenmenge durchsuchbar machen Suche nach Wörtern Volltextindex:

Mehr

Aussagenlogik. Übersicht: 1 Teil 1: Syntax und Semantik. 2 Teil 2: Modellierung und Beweise. Aussagenlogik H. Kleine Büning 1/25

Aussagenlogik. Übersicht: 1 Teil 1: Syntax und Semantik. 2 Teil 2: Modellierung und Beweise. Aussagenlogik H. Kleine Büning 1/25 Aussagenlogik Übersicht: 1 Teil 1: Syntax und Semantik 2 Teil 2: Modellierung und Beweise Aussagenlogik H. Kleine Büning 1/25 Einführendes Beispiel Falls Lisa Peter trifft, dann trifft Lisa auch Gregor.

Mehr

7. XML-Datenbanksysteme und SQL/XML

7. XML-Datenbanksysteme und SQL/XML 7. XML-Datenbanksysteme und SQL/XML Native XML-DBS vs. XML-Erweiterungen von ORDBS Speicherung von XML-Dokumenten Speicherung von XML-Dokumenten als Ganzes Generische Dekomposition von XML-Dokumenten Schemabasierte

Mehr

9. Vorlesung Lineare Algebra, SVD und LSI

9. Vorlesung Lineare Algebra, SVD und LSI 9. Vorlesung Lineare Algebra, SVD und LSI Grundlagen lineare Algebra Vektornorm, Matrixnorm Eigenvektoren und Werte Lineare Unabhängigkeit, Orthogonale Matrizen SVD, Singulärwerte und Matrixzerlegung LSI:Latent

Mehr

Technische Informatik - Eine Einführung

Technische Informatik - Eine Einführung Martin-Luther-Universität Halle-Wittenberg Fachbereich Mathematik und Informatik Lehrstuhl für Technische Informatik Prof. P. Molitor Technische Informatik - Eine Einführung Boolesche Funktionen - Grundlagen

Mehr

42 Orthogonalität Motivation Definition: Orthogonalität Beispiel

42 Orthogonalität Motivation Definition: Orthogonalität Beispiel 4 Orthogonalität 4. Motivation Im euklidischen Raum ist das euklidische Produkt zweier Vektoren u, v IR n gleich, wenn die Vektoren orthogonal zueinander sind. Für beliebige Vektoren lässt sich sogar der

Mehr

Internet-Suchmaschinen Probabilistische Retrievalmodelle

Internet-Suchmaschinen Probabilistische Retrievalmodelle Internet-Suchmaschinen Probabilistische Retrievalmodelle Norbert Fuhr 1 / 41 Notationen Notationen Notationen Q α Q Q β Q Q D R rel. judg. D α D D β D D D ρ IR q Q Anfrage/Info-bed. q Q Anfragerepräs.

Mehr

Kapitel 31 Bild- und Tonretrieval. HHU Düsseldorf, WS 2008/09 Information Retrieval 483

Kapitel 31 Bild- und Tonretrieval. HHU Düsseldorf, WS 2008/09 Information Retrieval 483 Kapitel 31 Bild- und Tonretrieval HHU Düsseldorf, WS 2008/09 Information Retrieval 483 Multimedia Information Retrieval Content-based Information Retrieval gesprochene Sprache Musik und weitere Audio-Dokumente

Mehr

5. Vorlesung: Normalformen

5. Vorlesung: Normalformen 5. Vorlesung: Normalformen Wiederholung Vollständige Systeme Minterme Maxterme Disjunktive Normalform (DNF) Konjunktive Normalform (KNF) 1 XOR (Antivalenz) X X X X X X ( X X ) ( X X ) 1 2 1 2 1 2 1 2 1

Mehr

Warum ist die Verwendung von Ähnlichkeitsmaßen generell problematisch? Problematik beim Messen von Ähnlichkeit mittels Distanzmaß.

Warum ist die Verwendung von Ähnlichkeitsmaßen generell problematisch? Problematik beim Messen von Ähnlichkeit mittels Distanzmaß. Warum ist die Verwendung von Ähnlichkeitsmaßen generell problematisch? Problematik beim Messen von Ähnlichkeit mittels Distanzmaß. Distanz und Ähnlichkeit: Distanzfunktionen Einleitung Distanzfunktionen

Mehr

Technische Informatik I

Technische Informatik I Rechnerstrukturen Dario Linsky Wintersemester 200 / 20 Teil 2: Grundlagen digitaler Schaltungen Überblick Logische Funktionen und Gatter Transistoren als elektronische Schalter Integrierte Schaltkreise

Mehr

Vektoren - Basiswechsel

Vektoren - Basiswechsel Vektoren - Basiswechsel Grundprinzip Für rein geometrische Anwendungen verwendet man üblicherweise die Standardbasis. Damit ergibt sich in den Zahlenangaben der Koordinaten kein Unterschied zu einem Bezug

Mehr

Lineare Algebra und Numerische Mathematik für D-BAUG

Lineare Algebra und Numerische Mathematik für D-BAUG P. Grohs T. Welti F. Weber Herbstsemester 5 Lineare Algebra und Numerische Mathematik für D-BAUG ETH Zürich D-MATH Beispiellösung für Serie Aufgabe. Skalarprodukt und Orthogonalität.a) Bezüglich des euklidischen

Mehr

... Text Clustern. Clustern. Einführung Clustern. Einführung Clustern

... Text Clustern. Clustern. Einführung Clustern. Einführung Clustern Clustern Tet Clustern Teile nicht kategorisierte Beispiele in disjunkte Untermengen, so genannte Cluster, ein, so daß: Beispiele innerhalb eines Clusters sich sehr ähnlich Beispiele in verschiedenen Clustern

Mehr

Allgemeingültige Aussagen

Allgemeingültige Aussagen Allgemeingültige Aussagen Definition 19 Eine (aussagenlogische) Formel p heißt allgemeingültig (oder auch eine Tautologie), falls p unter jeder Belegung wahr ist. Eine (aussagenlogische) Formel p heißt

Mehr

Kapitel 1 Überblick Content Management und Digitale Bibliotheken

Kapitel 1 Überblick Content Management und Digitale Bibliotheken Kapitel 1 Überblick Content Management und Digitale Bibliotheken Prof. Dr.-Ing. Stefan Deßloch Geb. 36, Raum 329 Tel. 0631/205 3275 dessloch@informatik.uni-kl.de 1 Überblick Was ist Content? Daten, Dokumente,

Mehr

Binäre Suchbäume (binary search trees, kurz: bst)

Binäre Suchbäume (binary search trees, kurz: bst) Binäre Suchbäume (binary search trees, kurz: bst) Datenstruktur zum Speichern einer endlichen Menge M von Zahlen. Genauer: Binärbaum T mit n := M Knoten Jeder Knoten v von T ist mit einer Zahl m v M markiert.

Mehr

Fuzzy-Suche in Application Express

Fuzzy-Suche in Application Express Fuzzy-Suche in Application Express So geht s! Carsten Czarski Consulting Member of technical staff - Oracle Application Express September 2017 Copyright 2016 Oracle and/or its affiliates. All rights reserved.

Mehr

L3 Euklidische Geometrie: Längen, Winkel, senkrechte Vektoren...

L3 Euklidische Geometrie: Längen, Winkel, senkrechte Vektoren... L3 Euklidische Geometrie: Längen, Winkel, senkrechte Vektoren... (benötigt neue Struktur über Vektorraumaxiome hinaus) Sei Länge von nach Pythagoras: Länge quadratisch in Komponenten! - Für : Skalarprodukt

Mehr

1 Boolesches Retrieval (2)

1 Boolesches Retrieval (2) 2. Übung zur Vorlesung Internet-Suchmaschinen im Sommersemester 2009 mit Lösungsvorschlägen Prof. Dr. Gerd Stumme, M.Sc. Wi-Inf. Beate Krause 06. Mai 2009 1 Boolesches Retrieval (2) Eine Erweiterung des

Mehr

Datenbanken Unit 4: Das Relationale Modell & Datenintegrität

Datenbanken Unit 4: Das Relationale Modell & Datenintegrität Datenbanken Unit 4: Das Relationale Modell & Datenintegrität 15. III. 2016 Outline 1 Organisatorisches 2 SQL 3 Relationale Algebra Notation 4 Datenintegrität Organisatorisches Erster Zwischentest: nach

Mehr

Logik. Logik. Vorkurs Informatik Theoretischer Teil WS 2013/ September Vorkurs Informatik - Theorie - WS2013/14

Logik. Logik. Vorkurs Informatik Theoretischer Teil WS 2013/ September Vorkurs Informatik - Theorie - WS2013/14 Logik Logik Vorkurs Informatik Theoretischer Teil WS 2013/14 30. September 2013 Logik > Logik > logische Aussagen Logik Logik > Logik > logische Aussagen Motivation Logik spielt in der Informatik eine

Mehr

Mathematik für Naturwissenschaftler II SS 2010

Mathematik für Naturwissenschaftler II SS 2010 Mathematik für Naturwissenschaftler II SS 2010 Lektion 6 4. Mai 2010 Definition 69. Der Vektor f 3 x 2 (x 1, x 2, x 3 ) f 2 x 3 (x 1, x 2, x 3 ) f 1 x 3 (x 1, x 2, x 3 ) f 3 x 1 (x 1, x 2, x 3 ) f 2 x

Mehr

Theorie der Informatik. Theorie der Informatik. 2.1 Äquivalenzen. 2.2 Vereinfachte Schreibweise. 2.3 Normalformen. 2.

Theorie der Informatik. Theorie der Informatik. 2.1 Äquivalenzen. 2.2 Vereinfachte Schreibweise. 2.3 Normalformen. 2. Theorie der Informatik 24. Februar 2014 2. Aussagenlogik II Theorie der Informatik 2. Aussagenlogik II 2.1 Äquivalenzen Malte Helmert Gabriele Röger 2.2 Vereinfachte Schreibweise Universität Basel 24.

Mehr

L3 Euklidische Geometrie: Längen, Winkel, senkrechte Vektoren...

L3 Euklidische Geometrie: Längen, Winkel, senkrechte Vektoren... L3 Euklidische Geometrie: Längen, Winkel, senkrechte Vektoren... (benötigt neue Struktur über Vektorraumaxiome hinaus) Sei Länge von nach Pythagoras: Länge quadratisch in Komponenten! - Für : Skalarprodukt

Mehr

6 Distanzfunktionen (2) 6 Distanzfunktionen. 6.1 Eigenschaften und Klassifikationen. Einführung

6 Distanzfunktionen (2) 6 Distanzfunktionen. 6.1 Eigenschaften und Klassifikationen. Einführung 6 en 6 en (2) 1. Eigenschaften und Klassifikation 2. en auf Punkten Minkowski L m Gewichtete Minkowski L m w Quadratische d q Quadratische Pseudo Dynamical Partial Semi Pseudo Chi Quadrat Semi Pseudo Kullback

Mehr

1.2 Abstände und Winkel

1.2 Abstände und Winkel 5 1.2 Abstände und Winkel Im Folgenden werde zunächst der n-dimensionale affine Standardraum A n = (R n, R n, τ) zugrunde gelegt und in der Regel auch A n = R n gesetzt. Im Vektorraum R n stehen das (euklidische)

Mehr

6 Distanzfunktionen. Quadratische Pseudo. 1. Eigenschaften und Klassifikation

6 Distanzfunktionen. Quadratische Pseudo. 1. Eigenschaften und Klassifikation 6 Distanzfunktionen 1. Eigenschaften und Klassifikation 2. Distanzfunktionen auf Punkten Minkowski Distanzfunktion L m Gewichtete Minkowski Distanzfunktion L m w Quadratische Distanzfunktion d q Quadratische

Mehr

Logik Vorlesung 3: Äquivalenz und Normalformen

Logik Vorlesung 3: Äquivalenz und Normalformen Logik Vorlesung 3: Äquivalenz und Normalformen Andreas Maletti 7. November 2014 Überblick Inhalt 1 Motivation und mathematische Grundlagen 2 Aussagenlogik Syntax und Semantik Äquivalenz und Normalformen

Mehr

Vortrag 20: Kurze Vektoren in Gittern

Vortrag 20: Kurze Vektoren in Gittern Seminar: Wie genau ist ungefähr Vortrag 20: Kurze Vektoren in Gittern Kerstin Bauer Sommerakademie Görlitz, 2007 Definition und Problembeschreibung Definition: Gitter Seien b 1,,b k Q n. Dann heißt die

Mehr

Grundlagen der Logik

Grundlagen der Logik Grundlagen der Logik Denken Menschen logisch? Selektionsaufgabe nach Watson (1966): Gegeben sind vier Karten von denen jede auf der einen Seite mit einem Buchstaben, auf der anderen Seite mit einer Zahl

Mehr

Algorithmen und Datenstrukturen 2

Algorithmen und Datenstrukturen 2 Algorithmen und Datenstrukturen 2 Sommersemester 2006 9. Vorlesung Peter Stadler Universität Leipzig Institut für Informatik studla@bioinf.uni-leipzig.de Invertierte Listen Nutzung vor allem zur Textsuche

Mehr

Resolutionskalkül. wird t als eine Menge K t von Klauseln geschrieben, welche die einzelnen Maxterme repräsentieren:

Resolutionskalkül. wird t als eine Menge K t von Klauseln geschrieben, welche die einzelnen Maxterme repräsentieren: Resolutionskalkül Ein Kalkül ist eine Kollektion von syntaktischen Umformungsregeln, die unter gegebenen Voraussetzungen aus bereits vorhandenen Formeln neue Formeln erzeugen. Der Resolutionskalkül besteht

Mehr

Orthonormalisierung. ein euklidischer bzw. unitärer Vektorraum. Wir setzen

Orthonormalisierung. ein euklidischer bzw. unitärer Vektorraum. Wir setzen Orthonormalisierung Wie schon im Falle V = R n erwähnt, erhalten wir durch ein Skalarprodukt eine zugehörige Norm (Länge) eines Vektors und in weiterer Folge eine Metrik (Abstand zwischen zwei Vektoren).

Mehr

Automatische Klassifikation: Stand der Technik und Veränderungen im Berufsbild des Dokumentars. Automatische Klassifikation:

Automatische Klassifikation: Stand der Technik und Veränderungen im Berufsbild des Dokumentars. Automatische Klassifikation: 02. Mai 2005 P R O J E C T C O N S U L T GmbH GmbH 1 Agenda Einführung Automatische Klassifikation Qualität Veränderung des Arbeitsumfeldes Ausblick GmbH 2 1 Einführung GmbH 3 Eine Herausforderung geordnete

Mehr

183.580, WS2012 Übungsgruppen: Mo., 22.10.

183.580, WS2012 Übungsgruppen: Mo., 22.10. VU Grundlagen digitaler Systeme Übung 2: Numerik, Boolesche Algebra 183.580, WS2012 Übungsgruppen: Mo., 22.10. Aufgabe 1: Binäre Gleitpunkt-Arithmetik Addition & Subtraktion Gegeben sind die Zahlen: A

Mehr

Logik für Informatiker

Logik für Informatiker Vorlesung Logik für Informatiker 5. Aussagenlogik Normalformen Bernhard Beckert Universität Koblenz-Landau Sommersemester 2006 Logik für Informatiker, SS 06 p.1 Normalformen Definition: Literal Atom (aussagenlogische

Mehr

Multimedia-Datenbanken. Ingo Schmitt Vorlesung im SS 2006

Multimedia-Datenbanken. Ingo Schmitt Vorlesung im SS 2006 Multimedia-Datenbanken Ingo Schmitt Vorlesung im SS 2006 Inhaltsverzeichnis 1 Einleitung und Begriffe 3 1.1 Grundlegende Datenbankbegriffe................................ 3 1.2 Aufgaben eines DBMS......................................

Mehr

Anfrageoptimierung Logische Optimierung

Anfrageoptimierung Logische Optimierung Institute for Web Science & Technologies WeST Grundlagen der Datenbanken Logische Optimierung Dr. Thomas Gottron Wintersemester 2012/13 Ablauf der Deklarative Anfrage Scanner Parser Sichtenauflösung Algebraischer

Mehr

GEO-INFORMATIONSSYSTEME

GEO-INFORMATIONSSYSTEME LUDWIG- MAXIMILIANS- UNIVERSITY MUNICH DEPARTMENT INSTITUTE FOR INFORMATICS DATABASE GEO-INFORMATIONSSYSTEME Skript zur Vorlesung Geo-Informationssysteme Wintersemester 2015/16 Ludwig-Maximilians-Universität

Mehr

entspricht der Länge des Vektorpfeils. Im R 2 : x =

entspricht der Länge des Vektorpfeils. Im R 2 : x = Norm (oder Betrag) eines Vektors im R n entspricht der Länge des Vektorpfeils. ( ) Im R : x = x = x + x nach Pythagoras. Allgemein im R n : x x = x + x +... + x n. Beispiele ( ) =, ( 4 ) = 5, =, 4 = 0.

Mehr

3 Prinzipien des Information Retrieval

3 Prinzipien des Information Retrieval 3 Prinzipien des Information Retrieval Einführung Information-Retrieval-Modelle Relevance Feedback Bewertung von Retrieval-Systemen Nutzerprofile Literaturempfehlungen Information Retrieval notwendig zur

Mehr

Kapitel 1. Aussagenlogik

Kapitel 1. Aussagenlogik Kapitel 1 Aussagenlogik Einführung Mathematische Logik (WS 2012/13) Kapitel 1: Aussagenlogik 1/17 Übersicht Teil I: Syntax und Semantik der Aussagenlogik (1.0) Junktoren und Wahrheitsfunktionen (1.1) Syntax

Mehr

Objektrelationale Datenbanken

Objektrelationale Datenbanken Vorlesung Datenbanksysteme vom 26.11.2008 Objektrelationale Datenbanken Konzepte objektrelationaler DBs SQL:1999 OO vs. OR Konzepte objektrelationaler Datenbanken Große Objekte (LOBs: Large Objects) Mengenwertige

Mehr

Gruppe B Bitte tragen Sie SOFORT und LESERLICH Namen und Matrikelnr. ein, und legen Sie Ihren Studentenausweis bereit.

Gruppe B Bitte tragen Sie SOFORT und LESERLICH Namen und Matrikelnr. ein, und legen Sie Ihren Studentenausweis bereit. Gruppe B Bitte tragen Sie SOFORT und LESERLICH Namen und Matrikelnr. ein, und legen Sie Ihren Studentenausweis bereit. PRÜFUNG AUS DATENMODELLIERUNG (184.685) GRUPPE B 22.06.2012 Matrikelnr. Familienname

Mehr

Einführung in die Theoretische Informatik. Inhalte der Lehrveranstaltung. Definition (Boolesche Algebra) Einführung in die Logik

Einführung in die Theoretische Informatik. Inhalte der Lehrveranstaltung. Definition (Boolesche Algebra) Einführung in die Logik Zusammenfassung Einführung in die Theoretische Informatik Woche 5 Harald Zankl Institut für Informatik @ UIBK Wintersemester 2014/2015 Zusammenfassung der letzten LV Jede binäre Operation hat maximal ein

Mehr

Mathematische Grundlagen für die Vorlesung. Differentialgeometrie

Mathematische Grundlagen für die Vorlesung. Differentialgeometrie Mathematische Grundlagen für die Vorlesung Differentialgeometrie Dr. Gabriele Link 13.10.2010 In diesem Text sammeln wir die nötigen mathematischen Grundlagen, die wir in der Vorlesung Differentialgeometrie

Mehr

Kapitel VI. Euklidische Geometrie

Kapitel VI. Euklidische Geometrie Kapitel VI. Euklidische Geometrie 1 Abstände und Lote Wiederholung aus Kapitel IV. Wir versehen R n mit dem Standard Skalarprodukt x 1 y 1.,. := x 1 y 1 +... + x n y n x n y n Es gilt für u, v, w R n und

Mehr

Didaktik der Analysis und der Analytischen Geometrie/ Linearen Algebra

Didaktik der Analysis und der Analytischen Geometrie/ Linearen Algebra A. Filler[-3mm] Didaktik der Analysis und der Analytischen Geometrie/ Linearen Algebra, Teil 8 Folie 1 /27 Didaktik der Analysis und der Analytischen Geometrie/ Linearen Algebra 8. Das Skalarprodukt, metrische

Mehr

Beschreibungslogik Kapitel 7: ABoxen und Anfragebeantwortung

Beschreibungslogik Kapitel 7: ABoxen und Anfragebeantwortung Beschreibungslogik Kapitel 7: ABoxen und Anfragebeantwortung Sommersemester 2017 Thomas Schneider AG Theorie der künstlichen Intelligenz (TdKI) http://tinyurl.com/ss17-bl Beschreibungslogik SoSe 2017 7

Mehr

SQL (Structured Query Language) Schemata Datentypen

SQL (Structured Query Language) Schemata Datentypen 2 SQL Sprachelemente Grundlegende Sprachelemente von SQL. 2.1 Übersicht Themen des Kapitels SQL Sprachelemente Themen des Kapitels SQL (Structured Query Language) Schemata Datentypen Im Kapitel SQL Sprachelemente

Mehr

Rechnerstrukturen. Michael Engel und Peter Marwedel WS 2013/14. TU Dortmund, Fakultät für Informatik

Rechnerstrukturen. Michael Engel und Peter Marwedel WS 2013/14. TU Dortmund, Fakultät für Informatik Rechnerstrukturen Michael Engel und Peter Marwedel TU Dortmund, Fakultät für Informatik WS 2013/14 Folien a. d. Basis von Materialien von Gernot Fink und Thomas Jansen 21. Oktober 2013 1/33 1 Boolesche

Mehr

Vektoren, Vektorräume

Vektoren, Vektorräume Vektoren, Vektorräume Roman Wienands Sommersemester 2010 Mathematisches Institut der Universität zu Köln Roman Wienands (Universität zu Köln) Mathematik II für Studierende der Chemie Sommersemester 2010

Mehr

Grundlagen von Datenbanken SS 2010

Grundlagen von Datenbanken SS 2010 Grundlagen von Datenbanken SS 2010 6. Tupelkalkül und relationale Vollständigkeit Prof. Dr. Stefan Böttcher Universität Paderborn mit Material von Prof. Dr. Gregor Engels Grundlagen von Datenbanken - SS

Mehr

Vorlesung Multimedia-Datenbanken

Vorlesung Multimedia-Datenbanken Vorlesung Multimedia-Datenbanken Prof. Dr. Olaf Görlitz Christoph Ringelstein Organisatorisches Beginn der Übung: 27.04.06 Raum: B 016 Klausur: Di 01.08.06, 12:00 s.t. (1 Zeitstunde) Bedingungen für den

Mehr

Inhaltsverzeichnis. Kurzfassung. Abstract

Inhaltsverzeichnis. Kurzfassung. Abstract Inhaltsverzeichnis Kurzfassung Abstract Inhaltsverzeichnis iii v vii 1 Einleitung 1 1.1 Problemstellung und Einordnung der Arbeit 1 1.2 Lösungsansatz 7 L3 Verwandte Arbeiten S 1.3.1 Datenbank-Suchmaschmen

Mehr

Brückenkurs Mathematik. Mittwoch Freitag

Brückenkurs Mathematik. Mittwoch Freitag Brückenkurs Mathematik Mittwoch 5.10. - Freitag 14.10.2016 Vorlesung 4 Dreiecke, Vektoren, Matrizen, lineare Gleichungssysteme Kai Rothe Technische Universität Hamburg-Harburg Montag 10.10.2016 0 Brückenkurs

Mehr