3 Prinzipien des Information Retrieval

Größe: px
Ab Seite anzeigen:

Download "3 Prinzipien des Information Retrieval"

Transkript

1 3 Prinzipien des Information Retrieval Einführung Information-Retrieval-Modelle Relevance Feedback Bewertung von Retrieval-Systemen Nutzerprofile Literaturempfehlungen

2 Information Retrieval notwendig zur Suche von Multimedia- Objekten in Datenbanken z.b. Bild mit Flusslandschaft Besonderheit: Verwaltung von Daten anhand ihrer Interpretation Suche von relevanten Dokumenten Information Retrieval versus Daten Retrieval Informations-Retrieval-System (IRS)

3 3.1 Einführung Zugriff auf Daten 2 Varianten: 1. Datenbankabfragen anhand exakt formulierter Bedingungen SELECT isbn FROM Buch WHERE Titel = Multimedia-Datenbanken. 2. unscharfe Formulierung in IRS Finde alle Text-Dokumente, die sich mit dem Thema Multimedia-Datenbank beschäftigen.

4 Historische Entwicklung von Information-Retrieval-Systemen Einsatz in Bibliotheken seit 70er Jahren Stärke bei Verwaltung schwachstrukturierter Daten, etwa Text-Dokumente aufgrund Datenflut: Problem des Findens geeigneter Informationen Internet-Suchmaschinen

5 Suche auf Medien-Objekten und Dokumenten Grundproblem: Inhalt von Dokumenten und Medien-Objekten oft nur schwer anhand Datenbankschema strukturier- und erschließbar Lösungsansatz: Ähnlichkeitssuche mittels IR-Techniken

6 Formulierung eines Suchbedarfs Formulierung eines Suchbedarfs... - als Dokument (Ähnlichkeitssuche oder query by example) - Liefere alle Text-Dokumente, die ähnlich zum Text-Dokument #0815 sind - Liefere alle Text-Dokumente die ähnlich zum Dokument Urlaub Sommer Mittelmeer sind

7 Formulierung eines Suchbedarfs (2) Formulierung eines Suchbedarfs... - als Anfrage (Eingrenzung durch Bedingung) Datenbank and (Bild or Video) Im Folgenden umfasst der Begriff Anfrage beide Varianten

8 Daten versus Information Retrieval Information Retrieval (außer Boole'sches Retrieval) Daten sind unstrukturiert Implizit formulierte Information (erfordert Interpretation)

9 Daten versus Information Retrieval (2) Suche nach Dokumenten, die ausreichend wahrscheinlich relevant bzgl. Anfrage sind Beispiel: Suche von Text-Dokumenten anhand Text Toleranz bzgl. Fehler bei Anfrageformulierung

10 Daten versus Information Retrieval (3) auch irrelevante Ergebnisse möglich Anfrage-Iteration oft hilfreich Ergebnisreihenfolge ist wesentlich Einschränkung der Ergebnisgröße durch Schwellwert oder Ergebnisanzahl

11 Daten versus Information Retrieval (4)

12 Schritte des IR-Prozesses NB: kein direkter Vergleich zwischen Anfrage und Dokumenten 1. Überführung Anfrage und Dokumente in interne Darstellung Extraktion von Daten, welche Semantik der Dokumente beschreiben relevante Informationen explizit und kompakt z.b.: Zusammenfassungen von Texten

13 Schritte des IR-Prozesses (2) 2. Vergleich der internen Darstellung durch Ähnlichkeitsfunktion numerischer Relevanzwert drückt Ähnlichkeit aus häufig Distanzfunktion (das ist eine Unähnlichkeitsfunktion)

14 Schritte des IR-Prozesses (3) 3.Ergebnis Dokumente mit höchsten Relevanzwerten absteigend sortiert Einschränkung der Ergebnisliste durch Schwellwert bzw. Ergebnisanzahl

15 Schritte des IR-Prozesses (4) 4. Relevanzbewertung und Feedback, wenn Ergebnis nicht zufriedenstellend Anfrage-Iteration Modifikation der Anfrage Modifikation der internen Darstellung

16 Schritte des IR-Prozesses (5)

17 Modifikation der Anfrage: Beispiel Anfrage Finde alle Text-Dokumente, die sich mit dem Thema Multimedia-Datenbanken beschäftigen.

18 Modifikation der Anfrage: Beispiel (2) Verfeinerung: Finde alle Text-Dokumente, die sich mit dem Thema Bild-Datenbanken beschäftigen.

19 Modifikation der Anfrage: Beispiel (3) Verallgemeinerung: Finde alle Text-Dokumente, die sich mit dem Thema Datenbanken beschäftigen

20 Relevanz-Feedback automatische Anfragemodifikation Nutzer bewertet Ergebnisdokumente bzgl. Relevanz zur Anfrage System nutzt Bewertungen zur automatischen Anfragemodifikation Anfrage-Iteration

21 Extraktionsverfahren Extraktionsverfahren erzeugen interne, kompakte Dokumentdarstellung Verfahren abhängig: vom Typ des Dokuments z.b. Text-Dokument versus Audio-Dokument von der Art beabsichtigter Anfragen in Bild-DB: Ähnlichkeitssuche über Farbverteilung versus über Textur

22 3.2 Information-Retrieval- Modelle IR-Modell definiert interne Dokumentdarstellung, Anfrageformulierung und interne Anfragedarstellung, Vergleichsfunktion zwischen jeweils zwei Dokumenten beziehungsweise zwischen Anfrage und jeweils einem Dokument.

23 Text-Retrieval Modelle ursprünglich fur Text-Retrieval Existenz einer vordefinierten Menge von Indextermen (Indexierungsvokabular) Darstellung eines Dokumentes uber auftretende Indexterme verschiedene Arten von Termgewichten Modelle lassen sich auch auf andere Medien- Typen anwenden

24 Traditionelle Information- Retrieval-Modelle 1.Boole'sches Modell 2.Fuzzy-Modell 3.Vektorraummodell

25 Boole'sches Modell basiert auf Mengentheorie und Boole'scher Algebra sehr einfaches Modell mit klarer Semantik Dokumente als Mengen von Indextermen Termgewichte sind binär: im Dokument enthalten oder nicht enthalten Test auf Enthaltensein als Vergleichsfunktion

26 Boole'sches Modell (2) Verknüpfung von Enthaltenseinsbedingungen mittels Boole'scher Junktoren and (Mengendurchschnitt) or (Mengenvereinigung) not (Mengendifferenz)

27 Boole'sches Modell: Beispiel Indexvokabular {Korsika, Sardinien, Strand, Ferienwohnung, Gebirge} Dokument d1:{sardinien, Strand, Ferienwohnung} Dokument d2:{korsika, Strand, Ferienwohnung} Dokument d3:{korsika, Gebirge}

28 Anfrage Boole'sches Modell: Beispiel (2) Korsika liefert {d2, d3} Ferienwohnung liefert {d1, d2} Ferienwohnung and Korsika liefert {d2} Ferienwohnung or Korsika liefert {d1, d2, d3} Ferienwohnung and not Korsika liefert {d1}

29 Boole'sches Modell: Beispiel (3)

30 but-junktor Anfrage: not Korsika liefert alle Dokumente, die Korsika nicht enthalten, u.u. die ganze Dokumentkollektion statt dessen Verwendung but-junktor (entspricht and not, also Komplement bzgl. Vorauswahl) Beispiel: Ferienwohnung but Korsika

31 of-konstrukt Suche nach Dokumenten, die m von n (m<n) Termen enthalten 2 of (Korsika, Stand, Ferienwohnung) ersetzt komplexen Boole'schen Ausdruck (Korsika and Strand) or (Korsika and Ferienwohnung) or (Strand and Ferienwohnung)

32 Anfragenormalisierung in DNF bzw. KNF Anfrage: Ferienwohnung and ((Sardinien and Strand) or Korsika) in disjunktiver Normalform (DNF): (Ferienwohnung and Sardinien and Strand) or (Ferienwohnung and Korsika) in konjunktiver Normalform (KNF): Ferienwohnung and (Sardinien or Korsika) and (Strand or Korsika)

33 Anfrageauswertung jeder Term liefert Menge von Dokumenten, die diesen Term enthalten komplexe Anfrage: Kombination der Dokumentenmengen durch entsprechende Mengenoperationen kleine Zwischenergebnisse durch DNF (zuerst Durchschnitt, dann Vereinigung)

34 Nachteile des Boole'schen Modells exaktes Modell aufgrund binärer Gewichte eher Daten-Retrieval keine Ähnlichkeitssuche durch zu scharfe suche Größe des Ergebnisses alle Dokumente sind bzgl. Anfrage gleichrangig Präsentation der gesamten Ergebnismenge Ergebnismenge in Abhängigkeit von Anfrage oft zu groß oder zu klein bzw. leer

35 Nachteile des Boole'schen Modells (2) Boole'sche Junktoren schwierige Anwendung Boole'scher Junktoren Verwechslung mit und, oder und nicht Impliziter weiterer Gegensatz: IR wird stärker von Laien benutzt als SQL

36 Milderung Problem exaktes Modell verschiedene Stufen der Relevanz durch Überführung Konjunktion in Disjunktion Präsentation der Ergebnisse sortiert nach Relevanzstufen Beispiel: Umwandlung von Korsika and Strand Korsika or Strand Ergebnis: zuerst die and-({d2}), dann restliche or-dokumente ({d1, d3})

37 Milderung Problem Größe des Ergebnisses faceted query zweistufiges Suchverfahren 1.Formulierung und Verfeinerung der Anfrage anhand benannter Anfragen und Ergebnisabzahl 2.Ergebnis zur finalen Anfrage anzeigen

38 Milderung Problem Größe des Ergebnisses (2) Beispiel: 1 Korsika liefert Q1: Q1 and Strand liefert Q2: 13 2 Anzeige Q2 liefert die 13 Ergebnisdokumente

39 Beispiel Problem Boole'sche Junktoren Anwender sucht Dokumente über Korsika und Dokumente über Sardinien falsche d.h. nicht intendierte Anfrage: Korsika and Sardinien liefert Dokumente, in denen beide Terme gemeinsam auftreten richtige bzw. intendierte Anfrage: Korsika or Sardinien

40 Milderung Problem Boole'sche Junktoren Verwendung besserer Junktorenbegriffe, etwa Ersetzen von and durch all or durch any

41 Fuzzy-Modell Erweiterung des Boole'schen Modells um Unschärfe (fuzzy) Verallgemeinerung Boole'scher Junktoren Unschärfe durch graduelle Zugehörigkeit von Dokumenten zu Termen

42 Fuzzy-Mengen beim Information Retrieval Universum ist Menge aller gespeicherten Dokumente Term definiert Fuzzy-Menge Zugehörigkeit (Fuzzy-Wert) des Dokuments d zu Term t durch Wert 0 für keine Relevanz 1 für maximale Relevanz Wert zwischen 0 und 1 für graduelle Relevanz

43 Beispiel Universum umfasst 3 Dokumente {d1, d2, d3} Fuzzy-Mengen Korsika bzw. Strand drücken Zugehörigkeit zu Term Korsika bzw. Strand aus

44 Fuzzy-Junktoren jedes Dokument in jeder Fuzzy-Menge übliche Mengenoperationen nicht anwendbar Junktoren ermitteln neue Zugehörigkeitswerte and durch Min-Funktion or durch Max-Funktion

45 Fuzzy-Junktoren (2) not durch Subtraktion von 1:

46 Beispiel 1.Korsika and Strand 2.Korsika or Strand 3.not Korsika

47 Fuzzy-Anfragen und Anfragebearbeitung 1.Überführung Anfrage in disjunktive Normalform 2.jeder Suchterm induziert eine Fuzzy-Menge 3.Anwendung entsprechender Fuzzy- Operationen auf Fuzzy-Mengen 4.Ergebnis: Dokumente absteigend sortiert nach Zugehörigkeitsgrad ausgeben

48 Begrenzung Fuzzy- Ähnlichkeitsanfrage Ergebnis umfasst alle Dokumente des Universums Begrenzung der Anzahl durch Schwellwerte für Zugehörigkeitswerte vorgegebene Anzahl von Ergebnisdokumenten

49 Begrenzung Fuzzy- Ähnlichkeitsanfrage (2) Beispiel: Korsika and Strand Schwellwert 0,5 liefert Anzahl 2 liefert d3 d2, d3

50 Zugehörigkeitswert Dokument zu Term viele Möglichkeiten Beispiel: Ansatz von Ogawa, Morita, Kobayashi mittels Term-zu-Term- Korrelationsmatrix Zeile entspricht Term i und Spalte entspricht Term j n i,j ist Anzahl Dokumente, welche Terme t i, t j enthalten

51 Zugehörigkeitswert Dokument zu Term (2) n i ist Anzahl Dokumente, welche Term t i enthalten Zugehörigkeitsgrad:

52 Beispiel: Term-zu-Term- Korrelationsmatrix Dokument d1: {Sardinien, Strand, Ferienwohnung} Dokument d2: {Korsika, Strand, Ferienwohnung} Dokument d3: {Korsika, Gebirge}

53 Beispielrechnung Dokument d1: {Sardinien, Strand, Ferienwohnung} Dokument d2: {Korsika, Strand, Ferienwohnung} Dokument d3: {Korsika, Gebirge} µ Sar (d 1 )=1-Π tk 2{Sar,Str,Fer} (1-c i,k )=1-(1-1)(1-0,5)(1-0,5)=1 µ Kor (d 1 )=1-Π tk 2{Sar,Str,Fer} (1-c i,k )=1-(1-0)(1-0,33)(1-0,33)=5/9

54 Zugehörigkeitswert Dokument zu Anfrageterm Fuzzy-Modell für komplexe Ähnlichkeitsanfragen: Ähnlichkeitswert bzgl. atomarer Anfrage als Zugehörigkeitswert anwendbar für jeden Medien-Typ Beispiel: Suche nach roter Morgensonne Farbe = rot and Gestalt = Kreis

55 Vektorraummodell weit verbreitetes Retrieval-Modell Dokumente als Vektoren eines Vektorraums Überführung Retrieval-Problem in Gebiet der linearen Algebra einsetzbar, wenn jedes Medien-Objekt darstellbar durch feste Anzahl von numerischen Merkmalswerten Beispiel Bild-Retrieval: Vektorwerte etwa anhand der Farbverteilung

56 Vektorraummodell (2) Beispiel Text-Retrieval: jeder Indexterm eine eigene Dimension Termgewicht (meist Häufigkeiten) als Vektorwert einer Dimension

57 Ähnlichkeit im Vektorraum Anfrage selbst als Vektor Ähnlichkeit zwischen Anfrage q und Dokument d über deren Vektoren Kosinusmaß (Kosinus des eingeschlossenen Winkels als Ähnlichkeitsmaß) Distanzmaß (Abstand zwischen Vektoren als Unähnlichkeitsmaß) z.b. Euklid'sche Distanz:

58 Beispiel

59 Darstellung im Vektorraum

60 Ähnlichkeitswerte nach Kosinusmaß

61 Eingeschlossene Winkel

62 Unähnlichkeitswerte anhand Euklid'scher Distanz

63 Abstände

64 Kosinusmaß und Euklid'sche Distanz erzeugen unterschiedliche Ergebnisse (Sortierungen) Kosinusmaß erzeugt <d1, d3, d2> Euklid'sche Distanz erzeugt <d1, d2, d3> Wahl der geeigneten Ähnlichkeitsfunktion abhängig von subjektivem Ähnlichkeitsempfinden Anwendungsszenario

65 Zusammenfassung Vektorraummodell Vektorraummodell sehr weit verbreitet setzt feste Anzahl von numerischen Merkmalswerten pro Dokument voraus

66 Zusammenfassung Vektorraummodell (2) Probleme: Merkmale als orthogonale Dimensionen aufgefasst (unrealistisch) Orthogonalisierung Problem bei hoher Anzahl von Merkmalswerten bzgl. Effektivität und Effizient Dimensionsreduktion Anfrage ist Vektor, also keine Junktoren Boole'sche Junktoren durch Kombination mit dem Fuzzy-Modell

67 3.3 Relevance Feedback 1.Bewertung von Ergebnisdokumenten 2.Auswertung von Bewertungen

68 Vereinfachter IR-Prozess

69 Motivation erstes Ergebnis oft nicht zufriedenstellend Gründe: vage Vorstellung des Nutzers über Suchergebnisse schlechte Anfrageformulierung unbekannte Dokumentenkollektion keine relevanten Dokumente verfügbar

70 Reaktion auf nicht zufriedenstellendes Ergebnis 1.Abbruch 2.Browsing 3.manuelle Abfragemodifikation 4.Relevance Feedback

71 Vorteile Relevance Feedback Anwender braucht keine Anfragemodifikation furchzuführen muss Systeminterna nicht kennen Anwender bewertet nur Ergebnisse Annähern an Ergebnis iterativ oft einfacher als mit einer einzigen Anfrage Relevanzwerte vom Nutzer zum System Relevance Feedback

72 Beispiel Relevance Feedback

73 Bewertung von Ergebnisdokumenten zu berücksichtigende Aspekte: Anzahl der zu bewertenden Dokumente soviel wie möglich versus Aufwand: <=10 reduzierte Darstellung der Ergebnisdokumente z.b. Thumbnails, Zusammenfassungen

74 Bewertung von Ergebnisdokumenten (2) Art der Bewertung relevant und keine Bewertung relevant, irrelevant und keine Bewertung gestufte Relevanzwerte

75 Bewertung von Ergebnisdokumenten (3) Bewertungsgranulat: Dokument oder Dokumenteneigenschaften bzgl. mehreren Anfrageobjekten (Suchtermen) einer zusammengesetzten Anfrage, z.b. Korsika and Strand bzgl. verschiedener Eigenschaftswerte z.b.: Bildersuche anhand Form und Größe, aber getrennte Bewertung

76 Beispiel gestufte Relevanzwerte

77 Pseudorelevanz automatische Bewertung, also Entlastung des Nutzers erste relevante Dokumente gelten automatisch als relevant Anfragemodifikation schlechtere Ergebnisse als bei manueller Relevanzbewertung oft bessere Ergebnisse als ohne Anfrage-Iteration

78 Auswertung von Bewertungen Finden eines besseren Ergebnisses Anfragemodifikation Modifikation von Nutzerprofilen z.b. Text-Retrieval: Profil enthält nutzerspezifische Suchterme (etwa Ferienwohnung für Reisebüro)

79 Auswertung von Bewertungen (2) Modifikation der Dokumentenbeschreibungen z.b. Modifikation des Indexvokabulars erfordert hohen Aufwand Modifikation des Suchalgorithmus z.b. andere Distanzfunktion

80 Auswertung von Bewertungen (3) Modifikation von Anfragetermgewichten in zusammengesetzten, gewichteten Anfragen

81 Anfragemodifikation im Vektorraummodell: Rocchio Verschiebung des Anfragevektors in Richtung der als relevant bewerteten Dokumente weg von als irrelevant bewerteten Dokumenten Anfrage: q alt relevant (irrelevant) bewertete Dokumente: D r (D i )

82 Anfragemodifikation im Verkorraummodell: Rocchio (2) α und β wichten Einfluss relevanter und irrelevanter Dokumente

83 Beispiel Rocchio

84 3.4 Bewertung von Retrieval-Systemen 1.Einführung 2.Precision, Recall und Fallout 3.Kombinierte Precision- und Recall-Werte 4.Precision- und Recall-Werte abhängig von der Ergebnisgröße

85 Einführung Bewertung (Qualitätsvergleich) verschiedener Retrieval-Systeme quantitative Maße vonnöten

86 Ergebnisbewertung bzgl. versch. Formulierungsebenen inwieweit ist Ergebnis relevant zu 0.nicht formuliertem Informationsbedarf 1.Informationsbedarf als natürlichsprachliche Frage 2.Informationsbedarf als Anfrage

87 Ergebnisbewertung bzgl. versch. Formulierungsebenen (2) Bewertungsunterschiede bzgl. Informationsbedarf und Frage: mangelnde Fähigkeit des Nutzers, Informationsbedarf adäquat als Frage zu formulieren (Bewertung des Nutzers) Frage und Anfrage: mangelnde Formulierung einer Frage als Anfrage (Bewertung des Nutzers und der Abfragesprache)

88 Nützlichkeit und Relevanz Relevanz: inwieweit befriedigt Ergebnis den Informationsbedarf Nützlichkeit: inwieweit ist das Ergebnis hilfreich Unabhängigkeit zwischen Nützlichkeit und Relevanz Beispiel: irrelevant aber nützlich: Suche nach Urlaubsmöglichkeiten in Korsika liefert Dokumente über Napoleon

89 Nützlichkeit und Relevanz (2) Beispiel: relevant aber nutzlos: Suche nach Urlaubsmöglichkeiten in Korsika liefert veraltete Dokumente zu Ferienwohnungen im Folgenden Konzentration auf Relevanz und Irrelevanz von Ergebnissen bzgl. Anfrage

90 Precision, Recall und Fallout zunächst Ergebnis als Menge zwei verschiedene Fehlentscheidungen 1.false alarms (fa) bezeichnet diejenigen Dokumente, die vom Retrieval-System irrtümlicherweise als relevant zurückgeliefert werden 2.false dismissals (fd) sind Dokumente, die fälschlicherweise vom Retrieval-System als irrelevant eingestuft wurden

91 Precision, Recall und Fallout (2) zwei korrekte Entscheidungen: 1.correct alarms (ca) 2.correct dismissals (cd) fa, fd, ca, cd stehen für entsprechende Dokumentanzahlen bzgl. einer Anfrage

92 fa, fd, ca, cd

93 fa, fd, ca, cd im Euler-Venn-Diagramm

94 Precision P Precision: Wieviele (als Verhältnis) Ergebnisdokumente sind tatsächlich relevant?

95 Recall R Recall: Wieviele (als Verhältnis) tatsächlich relevante Dokumente erscheinen im Ergebnis

96 Fallout F Verhältnis falsch gefundener zur Gesamtzahl irrelevanter Dokumente

97 Ermittlung von fd und ca normalerweise nur fa+ca+fd+cd und ca+fa bekannt für fd und ca Nutzerbewertung notwendig ca durch Relevanzbewertung der Ergebnisdokumente fd durch Relevanzbewertung der zurückgehaltenen Dokumente

98 Ermittlung von fd und ca (2) Problem: meist hoher Aufwand aufgrund hoher Dokumentenanzahl, insbesondere für fd Lösungsansatz: Verwendung von kleiner, repräsentativer Testdatenbank

99 Durchschnitt über Anfrageserie Precision, Recall, Fallout definiert bzgl. einer Anfrage besser: mehrere Anfragen und entsprechende Durchschnittswerte

100 Beispiel 20 Dokumente, 2 Anfragen, jeweils 10 Ergebnisdokumente

101 Precision versus Recall beide Werte gleich wichtig, da gute Precision auf Kosten Recall: möglichst kleine Ergebnismenge z.b. Ergebnismenge enthält nur ein relevantes Dokument: P = 100% und R 0 gutes Recall auf Kosten Precision: möglichst große Ergebnismenge z.b. Ergebnismenge enthält alle Dokumente: R = 100% und P 0

102 Abhängigkeit von Dokumentanzahl Ergebnis als Liste ca, cd, fa, fd, Precision und Recall sind abhängig von Ergebnisgröße r daher ca(r), cd(r), fa(r), fd(r), P q (r) und R q (r) bzgl. der r ersten Ergebnisdokumente

103 Kombinierte Precision- und Recall-Werte beim Inkrementieren von r, pro neues Dokument zwei Varianten

104 Beispiel 20 Dokumente, 1 Anfrage, 2 Retrieval- Systeme die selben 20 Dokumente, neue Anfrage, 3. Retrieval-System

105 Beispielwerte für Precision und Recall tabellarisch

106 Beispielwerte für Precision und Recall graphisch

107 Abbildung zwischen Precision und Recall Linie ist Sägezahnlinie keine Funktion Ziel: Precision als Funktion über Recall Lösung: pro Recall-Wert maximalen Precision-Wert verwenden Optimum: 100%-Linie System besser, je näher zum Optimum

108 Precision als Funktion über Recall

109 Unterschiedliche Recall-Werte unterschiedliche Anfragen erzeugen oft unterschiedliche Recall-Werte z.b. Anfrage 1,2 versus 3 Ziel: Vergleich Retrieval-System immer bzgl. 11 Standard-Recall-Stufen 11 Standard-Recall-Stufen: 0%, 10%,..., 100%

110 Unterschiedliche Recall- Werte (2) Lösung: Precision-Werte aus Intervallen berechnen: r j S ist j-te Stufe der 11 Stufen und r i sind ursprüngliche Recall-Stufen

111 11 Standard-Recall-Stufen grafisch

112 Alternative Precision-Recall- Funktion ursprüngliche Abbildung ist keine Funktion (Sägezahnlinie) alternative Lösung: pro Recall-Wert den größten Precision-Wert des aktuellen und aller nachfolgenden Recall-Werte übernehmen

113 11 Standard-Recall-Stufen grafisch

114 Durchschnitt über Standard- Recall-Stufen Recall-unabhängiger Vergleich Durchschnittswerte zum Vergleich nutzen wenn gewünscht: zusätzlich Durchschnitt über mehrere Anfragen

115 Precision-Werte abhängig von der Ergebnisgröße

116 Harmonisches Mittel Kombination von Precision und Recall einer Ereignisgröße

117 Beispiel harmonisches Mittel

118 Beispiel harmonisches Mittel grafisch

119 3.5 Nutzerprofile 1.Retrieval-Szenarien 2.Einfluss von Nutzerprofilen auf den Retrieval-Prozess

120 Motivation bis jetzt keine Unterscheidung von Anwender und Anwendergruppen Verhalten bzw. Suchbedarf verschiedener Nutzer differiert oft Idee: Subjektivität wird als Nutzerprofil modelliert und bei Suche berücksichtigt nur sinnvoll bei häufigem Zugriff von einzelnen Nutzern mit Identifikation

121 Beispiel Bibliothekarin in einer Informatik-Bibliothek kennt Nutzer Professoren interessiert an spezieller Fachliteratur Studenten interessiert an Lehrbüchern

122 Bestandteile eines Nutzerprofils etwa eine feste Anfrage vorgegeben vom Nutzer oder aus Suchläufen ermittelt zusätzlich möglich: Bildungsstand: Vorkenntnisse Vertrautheitsgrad mit Interessensgebiet: Anfänger versus Experte

123 Bestandteile eines Nutzerprofils (2) Spachfähigkeit: Deutschkenntnisse Retrieval-Historie: Ergebnisse vorheriger Sitzungen spezielle Präferenzen: z.b. Bevorzugung eines bestimmten Journals

124 Retrieval-Szenarien

125 Filtering mit Profilen Vergleich Nutzerprofile mit neu eingefügten Dokumenten Relevanz Nutzer wird informiert Dokument quasi als Anfrage und Profile als Datenkollektion System ist aktiv Push-Dienst oder Current-Awareness-System oder Subscription

126 Filtering mit Profilen (2) zusätzliche Sortierung anhand Relevanz: Routing Beispiel: Ärzte bleiben informiert anhand medizinischer Artikel, die entsprechend ihren Profilen gefiltert werden

127 Retrieval mit Profilen Nutzerstamm statisch zwei Realisierungsmöglichkeiten 1.Nachfiltern: Filtering auf Anfrageergebnis hoher Berechnungsaufwand durch u.u. großem Zwischenergebnis reduzieren nur false alarms 2.Vorfiltern: Nutzerprofil beeinflusst Retrieval-Prozess direkt Reduzierung von false alarms und false dismissals

128 Nachfiltern

129 Einfluss von Nutzerprofilen auf den Retrieval-Prozess Annahme: Anfrage als Profil einfache Realisierung: Verschiebung Anfragepunkt q in Richtung Profilabfragepunkt p

130 Einfluss von Nutzerprofilen auf den Retrieval-Prozess (2) Problem: relevante Dokumente bzgl. q können irrelevant bzgl. q' werden, gewünscht: Reduzierung false dismissals statt Reduzierung false alarms

131 Minimumsfunktion Erweiterung der Anfragesemantik statt - modifikation naiver Ansatz: Min-Funktion

132 Minimumsfunktion Problem 1: Profil liefert immer selbe Dokumentmenge Problem 2: Dokumente zwischen q und p erscheinen nicht unbedingt im Ergebnis

133 Summenbildung Problem: Suchbereich wird zu groß

134 Multiplikation Kompromiss zwischen Min-Funktion und Summenbildung 3 Varianten in Abhängigkeit von r:

Boole'sches Modell <is web>

Boole'sches Modell <is web> Boole'sches Modell basiert auf Mengentheorie und Boole'scher Algebra sehr einfaches Modell mit klarer Semantik Dokumente als Mengen von Indextermen Termgewichte sind binär: im Dokument enthalten oder nicht

Mehr

Bewertung von Ergebnisdokumenten Auswertung von Bewertungen

Bewertung von Ergebnisdokumenten Auswertung von Bewertungen 3.3 Relevance Feedback Bewertung von Ergebnisdokumenten Auswertung von Bewertungen [email protected] 1 Vereinfachter IR-Prozess [email protected] 2 Motivation erstes Ergebnis oft nicht zufriedenstellend

Mehr

Multimedia-Datenbanken. Ingo Schmitt Vorlesung im SS 2006

Multimedia-Datenbanken. Ingo Schmitt Vorlesung im SS 2006 Multimedia-Datenbanken Ingo Schmitt Vorlesung im SS 2006 Inhaltsverzeichnis 1 Einleitung und Begriffe 3 1.1 Grundlegende Datenbankbegriffe................................ 3 1.2 Aufgaben eines DBMS......................................

Mehr

Erweitertes boolsches Retrieval

Erweitertes boolsches Retrieval Erweitertes boolsches Retrieval In diesem Unterabschnitt werden andere Ansätze zur Verbesserung des boolschen Retrievals vorgestellt. Im Gegensatz zum Vektorraummodell wird bei diesen Ansätzen versucht,

Mehr

2 Volltext-Suchmaschinen

2 Volltext-Suchmaschinen 2 Volltext-Suchmaschinen Volltext-Suchmaschinen werden vor allem für die Suche im Internet benutzt, jedoch gibt es auch Erweiterungen (Data Cartridge, Oracle) um Volltextsuche bei SQL-Suchmaschinen wie

Mehr

5. Vorlesung: Normalformen

5. Vorlesung: Normalformen 5. Vorlesung: Normalformen Wiederholung Vollständige Systeme Minterme Maxterme Disjunktive Normalform (DNF) Konjunktive Normalform (KNF) 1 XOR (Antivalenz) X X X X X X ( X X ) ( X X ) 1 2 1 2 1 2 1 2 1

Mehr

Information Retrieval

Information Retrieval Information Retrieval Bisher: Datenbankabfrage mit Hilfe von SQL in relationalen Datenbanken. Die Informationen liegen geordnet in Tabellen -> exakte Ergebnisse Neu: Die Informationen liegen in Datensammlungen

Mehr

Suche in Multimedia-Datenbanken

Suche in Multimedia-Datenbanken Suche in Multimedia-Datenbanken Ingo Schmitt 20. April 2005 Gliederung 1. Motivation 2. Ähnlichkeitssuche in einem MMDBS 3. Semantische Lücke 4. Ähnlichkeitsanfragesprachen 5. Effiziente Ergebnisberechnung

Mehr

IR Seminar SoSe 2012 Martin Leinberger

IR Seminar SoSe 2012 Martin Leinberger IR Seminar SoSe 2012 Martin Leinberger Suchmaschinen stellen Ergebnisse häppchenweise dar Google: 10 Ergebnisse auf der ersten Seite Mehr Ergebnisse gibt es nur auf Nachfrage Nutzer geht selten auf zweite

Mehr

Multimedia-Datenbanken im SS 2010 Einführung in MMDB

Multimedia-Datenbanken im SS 2010 Einführung in MMDB Multimedia-Datenbanken im SS 2010 Einführung in MMDB Dr.-Ing. Marcin Grzegorzek 27.04.2010 Ähnlichkeitssuche in Multimedia-Datenbanken 2/ 28 Inhalte und Termine 1. Einführung in MMDB 1.1 Grundlegende Begriffe

Mehr

Vorlesung Information Retrieval Wintersemester 04/05

Vorlesung Information Retrieval Wintersemester 04/05 Vorlesung Information Retrieval Wintersemester 04/05 14. Oktober 2004 Institut für Informatik III Universität Bonn Tel. 02 28 / 73-45 31 Fax 02 28 / 73-43 82 [email protected] 1 Themenübersicht

Mehr

Grundlagen der Fuzzy-Logik

Grundlagen der Fuzzy-Logik Grundlagen der Fuzzy-Logik Seminarvortrag Julian Górny Matrikelnummer: 995146 Gliederung 1 Einleitung 2 Grundlagen 3 Fuzzy-Controller 4 Anwendungsbeispiel 5 Fazit und Ausblick Seite 2 Einleitung Bestimmte

Mehr

Normalformen boolescher Funktionen

Normalformen boolescher Funktionen Normalformen boolescher Funktionen Jeder boolesche Ausdruck kann durch (äquivalente) Umformungen in gewisse Normalformen gebracht werden! Disjunktive Normalform (DNF) und Vollkonjunktion: Eine Vollkonjunktion

Mehr

T = {t 1,..., t n } sei die Menge der Terme. D = {d 1,..., d m } sei die Menge der Dokumente.

T = {t 1,..., t n } sei die Menge der Terme. D = {d 1,..., d m } sei die Menge der Dokumente. Vektorraummodell T = {t 1,..., t n } sei die Menge der Terme. D = {d 1,..., d m } sei die Menge der Dokumente. Dokumente und Anfragen werden als Vektoren in einem Vektorraum aufgefaßt. Der Vektorraum wird

Mehr

Boole sches Retrieval als frühes, aber immer noch verbreitetes IR-Modell mit zahlreichen Erweiterungen

Boole sches Retrieval als frühes, aber immer noch verbreitetes IR-Modell mit zahlreichen Erweiterungen Rückblick Boole sches Retrieval als frühes, aber immer noch verbreitetes IR-Modell mit zahlreichen Erweiterungen Vektorraummodell stellt Anfrage und Dokumente als Vektoren in gemeinsamen Vektorraum dar

Mehr

Rückblick. Aufteilung in Dokumente anwendungsabhängig. Tokenisierung und Normalisierung sprachabhängig

Rückblick. Aufteilung in Dokumente anwendungsabhängig. Tokenisierung und Normalisierung sprachabhängig 3. IR-Modelle Rückblick Aufteilung in Dokumente anwendungsabhängig Tokenisierung und Normalisierung sprachabhängig Gesetz von Zipf sagt aus, dass einige Wörter sehr häufig vorkommen; Stoppwörter können

Mehr

2 Evaluierung von Retrievalsystemen

2 Evaluierung von Retrievalsystemen 2. Evaluierung von Retrievalsystemen Relevanz 2 Evaluierung von Retrievalsystemen Die Evaluierung von Verfahren und Systemen spielt im IR eine wichtige Rolle. Gemäß der Richtlinien für IR der GI gilt es,...

Mehr

4 Gleichungen und Ungleichungen

4 Gleichungen und Ungleichungen In diesem Kapitel werden Techniken zur Bestimmung der Lösungsmengen von Gleichungen und Ungleichungen rekapituliert. 4.1 Eindimensionale Gleichungen und Ungleichungen Eine Gleichung oder Ungleichung ohne

Mehr

KAPITEL 5. Damit wird F n (B) selbst zu einer Booleschen Algebra und es gilt f(x) := f(x) 0(x) := 0 B 1(x) := 1 B

KAPITEL 5. Damit wird F n (B) selbst zu einer Booleschen Algebra und es gilt f(x) := f(x) 0(x) := 0 B 1(x) := 1 B KAPITEL 5 Boolesche Polynome Polynome über R, d.h. reelle Funktionen der Form p(x) = a 0 + a 1 x + + a n x n, x R, sind schon aus der Schulmathematik bekannt. Wir beschäftigen uns nun mit Booleschen Polynomen,

Mehr

6. Probabilistische Retrievalmodelle. Norbert Fuhr

6. Probabilistische Retrievalmodelle. Norbert Fuhr 6. Probabilistische Retrievalmodelle Norbert Fuhr Notationen Q α Q Q β Q Q D R rel. judg. D α D D β D D D ρ IR q Q Anfrage d D Dokument q k Q: d m D: Anfragerepräsentation Dokumentrepräsentation qk D QD

Mehr

Künstliche Intelligenz Logische Agenten & Resolution

Künstliche Intelligenz Logische Agenten & Resolution Künstliche Intelligenz Logische Agenten & Resolution Stephan Schwiebert WS 2009/2010 Sprachliche Informationsverarbeitung Institut für Linguistik Universität zu Köln Inferenz-Algorithmus Wie könnte ein

Mehr

(query by image content)

(query by image content) Proseminar Multimedia Information-Retrieval-Systeme (query by image content) Das QBIC Projekt 1. Einleitung 1.1 Was ist QBIC 1.2 Wo wird es verwendet 2. QBIC im Detail 2.1 technische Grundlagen 2.2 Aufbau

Mehr

II. Grundlagen der Programmierung

II. Grundlagen der Programmierung II. Grundlagen der Programmierung II.1. Zahlenssteme und elementare Logik 1.1. Zahlenssteme 1.1.1. Ganze Zahlen Ganze Zahlen werden im Dezimalsstem als Folge von Ziffern 0, 1,..., 9 dargestellt, z.b. 123

Mehr

Einführung in die Theoretische Informatik

Einführung in die Theoretische Informatik Einführung in die Theoretische Informatik Woche 4 Harald Zankl Institut für Informatik @ UIBK Wintersemester 2014/2015 Zusammenfassung Zusammenfassung der letzten LV Modus Ponens A B B A MP Axiome für

Mehr

Vorlesung Suchmaschinen Semesterklausur Sommersemester 2016

Vorlesung Suchmaschinen Semesterklausur Sommersemester 2016 Universität Augsburg, Institut für Informatik Sommersemester 2016 Prof. Dr. W. Kießling 12. Juli 2016 Dr. F. Wenzel, L. Rudenko Suchmaschinen Vorlesung Suchmaschinen Semesterklausur Sommersemester 2016

Mehr

Konjunktive und disjunktive Normalformen

Konjunktive und disjunktive Normalformen Konjunktive und disjunktive Normalformen Nachdem gesprochen wurde, wie man Boolesche Terme unter einer Belegung der Variablen interpretiert und dass somit jeder Boolesche Term eine Boolesche Funktion repräsentiert,

Mehr

Kapitel IR:III (Fortsetzung)

Kapitel IR:III (Fortsetzung) Kapitel IR:III (Fortsetzung) III. Retrieval-Modelle Modelle und Prozesse im IR Klassische Retrieval-Modelle Bool sches Modell Vektorraummodell Retrieval-Modelle mit verborgenen Variablen Algebraisches

Mehr

3. Retrievalmodelle Grundkonzept des Vektorraummodells. Vektorraummodell. Dokumente und Anfragen werden als Vektoren in einem Vektorraum aufgefaßt.

3. Retrievalmodelle Grundkonzept des Vektorraummodells. Vektorraummodell. Dokumente und Anfragen werden als Vektoren in einem Vektorraum aufgefaßt. 3. Retrievalmodelle Grundkonzept des Vektorraummodells Vektorraummodell Dokumente und Anfragen werden als Vektoren in einem Vektorraum aufgefaßt. Der Vektorraum wird durch die in der Datenbank enthaltenen

Mehr

Midas Metadata yield by Data Analysis

Midas Metadata yield by Data Analysis Midas Metadata yield by Data Analysis Glossar powered by Was ist Text Mining? Unter Text Mining versteht sich im Allgemeinen die Extraktion von strukturierten Informationen aus unstrukturierten oder semistrukturierten

Mehr

Information Retrieval. Peter Kolb

Information Retrieval. Peter Kolb Information Retrieval Peter Kolb Semesterplan Einführung Boolesches Retrievalmodell Volltextsuche, invertierter Index Boolesche Logik und Mengen Vektorraummodell Evaluation im IR Term- und Dokumentrepräsentation

Mehr

Lineare Gleichungssysteme

Lineare Gleichungssysteme Lineare Gleichungssysteme 1 Wiederholung Eine Menge von Vektoren a 1, a 2,, a k heisst linear unabhängig, wenn eine Linearkombination c 1 a 1 + c 2 a 2 + + c k a k = k c i a i (1) i=1 nur dann Null sein

Mehr

Analytische Statistik II

Analytische Statistik II Analytische Statistik II Institut für Geographie 1 Schätz- und Teststatistik 2 Grundproblem Generell sind wir nur selten in der Geographie in der Lage, Daten über die Grundgesamtheit zur Verfügung zu haben.

Mehr

Federated Search: Integration von FAST DataSearch und Lucene

Federated Search: Integration von FAST DataSearch und Lucene Federated Search: Integration von FAST DataSearch und Lucene Christian Kohlschütter L3S Research Center BSZ/KOBV-Workshop, Stuttgart 24. Januar 2006 Christian Kohlschütter, 24. Januar 2006 p 1 Motivation

Mehr

Die Lineare Algebra-Methode. Mahir Kilic

Die Lineare Algebra-Methode. Mahir Kilic Die Lineare Algebra-Methode Mahir Kilic 23. Juni 2004 1 Einführung 1.1 Überblick Im Allgemein benutzt man die Lineare Algebra-Methode in der Kombinatorik wie folgt: Für die Bestimmung einer Obergrenze

Mehr

Langzeitarchivierungsaspekte. im Dokumentenlebenszyklus

Langzeitarchivierungsaspekte. im Dokumentenlebenszyklus Document Engineering Langzeitarchivierungsaspekte im enlebenszyklus Motivation Disziplin der Computer Wissenschaft, welche Systeme für e aller Formen und Medien erforscht. enlebenszyklus en Management

Mehr

6. Vorlesung: Minimalformen

6. Vorlesung: Minimalformen 6. Vorlesung: Minimalformen Wiederholung Minterme Maxterme Disjunktive Normalform (DN) Konjunktive Normalform (KN) Minimalformen KV-Diagramme 24..26 fällt aus wegen Dozentenfachexkursion 2 Normalformen

Mehr

TU5 Aussagenlogik II

TU5 Aussagenlogik II TU5 Aussagenlogik II Daniela Andrade [email protected] 21.11.2016 1 / 21 Kleine Anmerkung Meine Folien basieren auf den DS Trainer von Carlos Camino, den ihr auf www.carlos-camino.de/ds findet ;)

Mehr

Retrieval Modelle. Boolesche- und Vektorraum- Modelle. Weitere Modell-Dimensionen. Klassen von Retrieval Modellen. Boolesche Modelle (Mengentheorie)

Retrieval Modelle. Boolesche- und Vektorraum- Modelle. Weitere Modell-Dimensionen. Klassen von Retrieval Modellen. Boolesche Modelle (Mengentheorie) Retrieval Modelle Boolesche- und Vektorraum- Modelle Ein Retrieval-Modell spezifiziert die Details der: Repräsentation von Dokumenten Repräsentation von Anfragen Retrievalfunktion Legt die Notation des

Mehr

Logik (Teschl/Teschl 1.1 und 1.3)

Logik (Teschl/Teschl 1.1 und 1.3) Logik (Teschl/Teschl 1.1 und 1.3) Eine Aussage ist ein Satz, von dem man eindeutig entscheiden kann, ob er wahr (true, = 1) oder falsch (false, = 0) ist. Beispiele a: 1 + 1 = 2 b: Darmstadt liegt in Bayern.

Mehr

Volltextsuche und Text Mining

Volltextsuche und Text Mining Volltextsuche und Text Mining Seminar: Einfuehrung in die Computerlinguistik Dozentin: Wiebke Petersen by Rafael Cieslik 2oo5-Jan-2o 1 Gliederung 1. Volltextsuche 1. Zweck 2. Prinzip 1. Index 2. Retrieval

Mehr

1 Boolesches Retrieval (2)

1 Boolesches Retrieval (2) 2. Übung zur Vorlesung Internet-Suchmaschinen im Sommersemester 2009 mit Lösungsvorschlägen Prof. Dr. Gerd Stumme, M.Sc. Wi-Inf. Beate Krause 06. Mai 2009 1 Boolesches Retrieval (2) Eine Erweiterung des

Mehr

Boolesche- und Vektorraum- Modelle

Boolesche- und Vektorraum- Modelle Boolesche- und Vektorraum- Modelle Viele Folien in diesem Abschnitt sind eine deutsche Übersetzung der Folien von Raymond J. Mooney (http://www.cs.utexas.edu/users/mooney/ir-course/). 1 Retrieval Modelle

Mehr

Vektorgeometrie Ebenen 1

Vektorgeometrie Ebenen 1 Vektorgeometrie Ebenen 1 Parametergleichung von Ebenen Punkte und Geraden in Ebenen. Spezielle Lagen von Punkten in Bezug auf ein Parallelogramm oder Dreieck. Datei Nr. 63021 Stand 1. Juli 2009 INTERNETBIBLIOTHEK

Mehr

2 Arbeiten mit EXCEL-Syntax

2 Arbeiten mit EXCEL-Syntax Seite 4 Bauinformatik - Teil 1 - Übungsskript / 2009 2 Arbeiten mit EXCEL-Syntax 2.1 Bezüge Die Adressierung der EXCEL-Tabellenfelder (Bezüge) erfolgt über relative und absolute Bezüge bzw. über Namen

Mehr

Nachteile Boolesches Retrieval

Nachteile Boolesches Retrieval Nachteile Boolesches Retrieval Komplizierte Anfragen Häufigkeit bzw. Relevanz der Terme in den Dokumenten nicht berücksichtigt 2 von 3 UND-verknüpften Termen im Dokument so schlecht wie 0 Terme Keine Rangfolge

Mehr

Formale Grundlagen der Informatik 1 Kapitel 16 Normalformen und Hornformeln

Formale Grundlagen der Informatik 1 Kapitel 16 Normalformen und Hornformeln Formale Grundlagen der Informatik 1 Kapitel 16 Normalformen und Frank Heitmann [email protected] 9. Juni 2015 Frank Heitmann [email protected] 1/36 Ersetzbarkeitstheorem

Mehr

4 Multimedia Information Retrieval

4 Multimedia Information Retrieval 1 4 Multimedia Information Retrieval 1.Einführung 2.Ablauf des Multimedia Information Retrievals 3.Daten eines Multimedia-Retrieval-Systems 4.Feature 5.Eignung verschiedener Retrieval-Systeme 2 4.1 Einführung

Mehr

Suchmaschinen. Anwendung RN Semester 7. Christian Koczur

Suchmaschinen. Anwendung RN Semester 7. Christian Koczur Suchmaschinen Anwendung RN Semester 7 Christian Koczur Inhaltsverzeichnis 1. Historischer Hintergrund 2. Information Retrieval 3. Architektur einer Suchmaschine 4. Ranking von Webseiten 5. Quellenangabe

Mehr

Evaluation von IR-Systemen

Evaluation von IR-Systemen Evaluation von IR-Systemen Überblick Relevanzbeurteilung Übereinstimmung zwischen Annotatoren Precision Recall (Präzision u. Vollständigkeit) Text Retrieval Conference (TREC) Testkollektionen Beurteilen

Mehr

Kapitel IR:II. II. Grundlagen des Information Retrieval. Retrieval-Evaluierung Indexterme

Kapitel IR:II. II. Grundlagen des Information Retrieval. Retrieval-Evaluierung Indexterme Kapitel IR:II II. Grundlagen des Information Retrieval Retrieval-Evaluierung Indexterme IR:II-1 Basics STEIN 2005-2010 Batch-Mode-Retrieval einmaliges Absetzen einer Anfrage; nur eine Antwort wird geliefert

Mehr

Juristisches Arbeiten

Juristisches Arbeiten ALEPH oder wie finde ich was (und wo) in unserer Bibliothek? Juristisches Arbeiten Einführung Boolsche Operatoren Boolsche Operatoren sind von dem englischen Mathematiker George Boole (1815-1864) erfundene

Mehr

Kapitel 1.3. Normalformen aussagenlogischer Formeln. Mathematische Logik (WS 2010/11) Kapitel 1.3: Normalformen 1 / 1

Kapitel 1.3. Normalformen aussagenlogischer Formeln. Mathematische Logik (WS 2010/11) Kapitel 1.3: Normalformen 1 / 1 Kapitel 1.3 Normalformen aussagenlogischer Formeln Mathematische Logik (WS 2010/11) Kapitel 1.3: Normalformen 1 / 1 Boolesche Formeln, Literale und Klauseln Eine Boolesche Formel ist eine aussagenlogische

Mehr

Optimierung. Optimierung. Vorlesung 2 Optimierung ohne Nebenbedingungen Gradientenverfahren. 2013 Thomas Brox, Fabian Kuhn

Optimierung. Optimierung. Vorlesung 2 Optimierung ohne Nebenbedingungen Gradientenverfahren. 2013 Thomas Brox, Fabian Kuhn Optimierung Vorlesung 2 Optimierung ohne Nebenbedingungen Gradientenverfahren 1 Minimierung ohne Nebenbedingung Ein Optimierungsproblem besteht aus einer zulässigen Menge und einer Zielfunktion Minimum

Mehr

= { } Absolutes Komplement Universe Relatives Komplement von

= { } Absolutes Komplement Universe Relatives Komplement von Allgemeines ist Teiler von Mengen Mächtigkeit Anzahl Elemente in der Menge Potenzmenge Menge aller Teilmengen von { } { { } { } { }} Beziehungen bzw. ist in enthalten ist Teilmenge von ist Obermenge von

Mehr

1. Erläutern Sie die Aufgaben von Datentypen in der imperativen Programmierung.

1. Erläutern Sie die Aufgaben von Datentypen in der imperativen Programmierung. 1. Erläutern Sie die Aufgaben von Datentypen in der imperativen Programmierung. Beschreiben Sie ferner je einen frei gewählten Datentyp aus der Gruppe der skalaren und einen aus der Gruppe der strukturierten

Mehr

Lineare Abbildungen. Es seien V und W Vektorräume über einem Körper K. Eine Abbildung f : V W heißt linear oder Homomorphismus, falls. d.h.

Lineare Abbildungen. Es seien V und W Vektorräume über einem Körper K. Eine Abbildung f : V W heißt linear oder Homomorphismus, falls. d.h. Lineare Abbildungen Es seien V und W Vektorräume über einem Körper K. Eine Abbildung f : V W heißt linear oder Homomorphismus, falls (1) u, v V : f( u + v) = f( u) + f( v). (2) v V α K : f(α v) = αf( v).

Mehr

Wissenschaftliches Arbeiten Quantitative Methoden

Wissenschaftliches Arbeiten Quantitative Methoden Wissenschaftliches Arbeiten Quantitative Methoden Prof. Dr. Stefan Nickel WS 2008 / 2009 Gliederung I. Motivation II. III. IV. Lesen mathematischer Symbole Wissenschaftliche Argumentation Matrizenrechnung

Mehr

Algorithmische Methoden zur Netzwerkanalyse

Algorithmische Methoden zur Netzwerkanalyse Algorithmische Methoden zur Netzwerkanalyse Juniorprof. Dr. Henning Meyerhenke Institut für Theoretische Informatik 1 KIT Henning Universität desmeyerhenke, Landes Baden-Württemberg Institutund für Theoretische

Mehr

Anfragebearbeitung. Logische Optimierung Physische Optimierung (Kostenmodelle Tuning ) Kapitel 8 1

Anfragebearbeitung. Logische Optimierung Physische Optimierung (Kostenmodelle Tuning ) Kapitel 8 1 Anfragebearbeitung Logische Optimierung Physische Optimierung (Kostenmodelle Tuning ) Kapitel 8 1 Ablauf der Anfrageoptimierung Deklarative Anfrage (SQL) Scanner Parser Sichtenauflösung Algebraischer Ausdruck

Mehr

3D-Rekonstruktion aus Bildern

3D-Rekonstruktion aus Bildern Allgemeine Nachrichtentechnik Prof. Dr.-Ing. Udo Zölzer 3D-Rekonstruktion aus Bildern Dipl.-Ing. Christian Ruwwe 41. Treffen der ITG-Fachgruppe Algorithmen für die Signalverarbeitung HSU Hamburg 24. Februar

Mehr

Mathematische und statistische Methoden I

Mathematische und statistische Methoden I Prof. Dr. G. Meinhardt 6. Stock, Wallstr. 3 (Raum 06-206) Sprechstunde jederzeit nach Vereinbarung und nach der Vorlesung. Mathematische und statistische Methoden I Dr. Malte Persike [email protected]

Mehr

Information Retrieval, Vektorraummodell

Information Retrieval, Vektorraummodell Universität Potsdam Institut für Informatik Lehrstuhl Maschinelles Lernen Information Retrieval, Vektorraummodell Tobias Scheffer Paul Prasse Michael Großhans Uwe Dick Information Retrieval Konstruktion

Mehr

Kurzanleitung Geodatenportal Schwäbisch Hall

Kurzanleitung Geodatenportal Schwäbisch Hall Kurzanleitung Geodatenportal Schwäbisch Hall Geodatenportal starten Alternativ kann das Geodatenportal auch direkt in Ihrem Internetbrowser durch Eingabe der Adresse www.giscity.de/schwaebischhall/ aufgerufen

Mehr

Finite Elemente Methoden (aus der Sicht des Mathematikers) Alfred Schmidt

Finite Elemente Methoden (aus der Sicht des Mathematikers) Alfred Schmidt Finite Elemente Methoden (aus der Sicht des Mathematikers) Alfred Schmidt Übersicht Partielle Differentialgleichungen, Approximation der Lösung Finite Elemente, lineare und höhere Ansatzfunktionen Dünn

Mehr

Hierarchische Clusteranalyse

Hierarchische Clusteranalyse Hierarchische Clusteranalyse Unter dem Menupunkt Statistik - Klassifizieren finden sich sowohl agglomerative ( hierarchische ) als auch partitionierende ( Clusterzentren ) Clusteranalyseverfahren. Da die

Mehr

Mathematische Grundlagen I Logik und Algebra

Mathematische Grundlagen I Logik und Algebra Logik und Algebra Dr. Tim Haga 21. Oktober 2016 1 Aussagenlogik Erste Begriffe Logische Operatoren Disjunktive und Konjunktive Normalformen Logisches Schließen Dr. Tim Haga 1 / 21 Präliminarien Letzte

Mehr

Teil 1: Digitale Logik

Teil 1: Digitale Logik Teil 1: Digitale Logik Inhalt: Boolesche Algebra kombinatorische Logik sequentielle Logik kurzer Exkurs technologische Grundlagen programmierbare logische Bausteine 1 Analoge und digitale Hardware bei

Mehr

Übersicht. Volltextindex Boolesches Retrieval Termoperationen Indexieren mit Apache Lucene

Übersicht. Volltextindex Boolesches Retrieval Termoperationen Indexieren mit Apache Lucene Übersicht Volltextindex Boolesches Retrieval Termoperationen Indexieren mit Apache Lucene 5.0.07 1 IR-System Peter Kolb 5.0.07 Volltextindex Dokumentenmenge durchsuchbar machen Suche nach Wörtern Volltextindex:

Mehr

Nutzung der Oracle Database InMemory Option für SAP BW

Nutzung der Oracle Database InMemory Option für SAP BW Nutzung der Oracle Database InMemory Option für SAP BW Schlüsselworte Oracle, SAP-BW, InMemory, Star-Schema. Jörn Bartels Oracle München Einleitung In SAP BW wurde bisher ein erweitertes Snow Flake Schema

Mehr

Allgemeingültige Aussagen

Allgemeingültige Aussagen Allgemeingültige Aussagen Definition 19 Eine (aussagenlogische) Formel p heißt allgemeingültig (oder auch eine Tautologie), falls p unter jeder Belegung wahr ist. Eine (aussagenlogische) Formel p heißt

Mehr

Customizing Datensicht erstellen. Erweiterung der Baumstruktur um eigene Sichten

Customizing Datensicht erstellen. Erweiterung der Baumstruktur um eigene Sichten Customizing Datensicht erstellen Erweiterung der Baumstruktur um eigene Sichten TITEL Customizing Datensicht erstellen AUTOR Docusnap Consulting DATUM 26.04.2017 Die Weitergabe, sowie Vervielfältigung

Mehr

Motivation. Formale Grundlagen der Informatik 1 Kapitel 19. Syntax & Semantik. Motivation - Beispiel. Motivation - Beispiel

Motivation. Formale Grundlagen der Informatik 1 Kapitel 19. Syntax & Semantik. Motivation - Beispiel. Motivation - Beispiel Motivation Formale Grundlagen der Informatik 1 Kapitel 19 & Die ist eine Erweiterung der Aussagenlogik. Sie hat eine größere Ausdrucksstärke und erlaub eine feinere Differenzierung. Ferner sind Beziehungen/Relationen

Mehr

Dokumenten-Clustering. Norbert Fuhr

Dokumenten-Clustering. Norbert Fuhr Dokumenten-Clustering Norbert Fuhr Dokumenten-Clustering (Dokumenten-)Cluster: Menge von ähnlichen Dokumenten Ausgangspunkt Cluster-Hypothese : die Ähnlichkeit der relevanten Dokumente untereinander und

Mehr

KAPITEL 6. Nichtlineare Ausgleichsrechnung

KAPITEL 6. Nichtlineare Ausgleichsrechnung KAPITEL 6 Nichtlineare Ausgleichsrechnung Beispiel 61 Gedämpfte Schwingung: u + b m u + D m u = 0, Lösungen haben die Form: u(t) = u 0 e δt sin(ω d t + ϕ 0 ) Modell einer gedämpften Schwingung y(t; x 1,

Mehr

Logik Vorlesung 5: Grundlagen Resolution

Logik Vorlesung 5: Grundlagen Resolution Logik Vorlesung 5: Grundlagen Resolution Andreas Maletti 21. November 2014 Überblick Inhalt 1 Motivation und mathematische Grundlagen 2 Aussagenlogik Syntax und Semantik Äquivalenz und Normalformen Weitere

Mehr

DisMod-Repetitorium Tag 1

DisMod-Repetitorium Tag 1 DisMod-Repetitorium Tag 1 Aussagenlogik, Mengen 19. März 2018 1 Organisatorisches 2 Tipps zur Klausur 3 Aussagenlogik Was gehört in die Aussagenlogik, was nicht? Notationen für viele Terme Belegungen,

Mehr