Information Retrieval

Größe: px
Ab Seite anzeigen:

Download "Information Retrieval"

Transkript

1 Information Retrieval Ferdinand Hofherr 17. Mai 2005 Zusammenfassung Information Retrieval spielt in vielen Bereichen unseres Lebens eine wichtige Rolle. Wir kommen damit zum Beispiel in Berührung, wenn wir in Bibliotheken oder im Internet nach Information suchen. In dieser Proseminarsarbeit wird zunächst ein Überblick über dieses Thema gegeben. Anschließend werden grundlegende Methoden, wie das Boole sche Retrieval oder Ähnlichkeitsmaße, vorgestellt. Es wird auch auf die Dokumentensuche im Internet eingegangen. Die von Suchmaschinen, wie Google, verwendeten Verfahren werden angesprochen. 1

2 1 Überblick 1.1 Was ist Information Retrieval? In großen Dokumentbeständen, wie zum Beispiel Bibliotheken oder dem Internet, ist Information zunächst versteckt. Sie muss wieder aufgefunden werden. Grob gesagt ist dies die Aufgabe des Information Retrieval. Einige Stichworte, die die gewünschte Information beschreiben, werden übergeben, und das System sucht die zur Anfrage passenden Dokumente. Hierbei sind zwei Grundsätze von Bedeutung (7): 1. Vagheit: Das Informationsbedürfnis ist weder präzise noch formal formulierbar. Daher enthält die Anfrage vage Bedingungen. 2. Unsicherheit: Da dem System Kenntnisse über die Aussage der Dokumente oder einzelner Wörter in Dokumenten fehlen, kann es fehlerhafte Antworten zurück liefern. So bereiten zum Beispiel Homonyme wie Bank, einmal im Sinne von Geldinstitut und einmal im Sinne von Sitzgelegenheit Probleme. Am Ende bleibt es dem Benutzer überlassen die zu seiner Anfrage gefundenen Dokumente entsprechend ihres Nutzens zu bewerten. Das fundamentale Konzept des Information Retrieval ist nach (3, S.8) das Messen von Ähnlichkeiten zwischen Dokumenten. 1.2 Anforderungen an ein Information Retrieval System Lancaster (5) beschreibt ein Information Retrieval System als ein System, dass den Nutzer nicht über das Thema seiner Anfrage, sondern lediglich über die Existenz oder Nichtexistenz von Dokumenten die zu seiner Anfrage passen, sowie über die Orte an denen man sie auffinden kann informiert. Der Benutzer eines Information Retrieval Systems hat, nach (7), in der Regel eine feste Aufgabe oder Fragestellung zu bearbeiten, zu deren Lösung ihm Information fehlt. Dieses Informationsbedürfnis möchte er mit Hilfe des Information Retrieval Systems befriedigen. Hierzu muss er seine Anfrage in einer für das System verarbeitbaren Form stellen. Anschließend ist es Aufgabe des Systems die Anfrage mit den im System vorhandenen Dokumenten zu vergleichen, und zur Anfrage passende Dokumente zurückzuliefern. Um dies erreichen sind die im System vorhandenen Dokumente entsprechend dem Modell, dass dem System zugrunde liegt, auf 2

3 eine Form vereinfacht, die für die Verarbeitung günstig ist. (7). Dies hat nicht nur technische Gründe. Eine solche Vereinfachung ist auch Grundlage für eine erfolgreiche Suche, da diese nicht notwendig wäre, wenn eine vollständige Beschreibung des Inhalts bekannt sein müsste(1, S. 28). 1.3 Einsatzorte für Information Retrieval Systeme Information Retrieval wird dann benötigt, wenn die zu einem Thema passende Dokumente aus einer großen Menge von Dokumenten herauszufinden sind. Dies kann zum Beispiel bei der Literatursuche in Bibliotheken der Fall sein. Einige Bibliotheken sind mit Literaturdatenbanken ausgestattet, die die Suche in ihrem Dokumentbestand vereinfachen. Typischerweise liefern diese Systeme bibliographische Informationen, wie Titel, Autor und eine Beschreibung des Inhalts zurück. Der Benutzer dieser Systeme kann den Datenbestand durchsuchen, oder ihn anhand von Sachgruppen oder Stichworten durchstöbern.(nach (1, S.6)) Ein anderer wichtiger, Einsatzort von Information Retrival Systemen ist das Internet. Suchmaschinen wie Google helfen ihren Benutzern die Informationsflut des Internets zu durchsuchen. Ohne diese Werkzeuge wäre die beinahe alltägliche Recherche im Internet nahezu undenkbar. 2 Auffinden von Information 2.1 Form der Anfrage Um Information auffinden zu können muss das Information Retrieval System zunächst erfahren, wonach es suchen soll. Dies geschieht durch die Anfrage, die ein Benutzer an das System stellt. Für gewöhnlich besteht sie aus einigen Stichworten, die mit dem Themengebiet, für das sich der Anwender interessiert in Zusammenhang stehen. Ein paar Stichworte wird man für gewöhnlich nicht als ein Dokument ansehen, weswegen es etwas verwirrend sein kann, wenn im Folgenden vom Vergleich zwischen zwei oder mehreren Dokumenten gesprochen wird. Nach (3, S. 87f) können diese Stichworte jedoch als kleines Dokument betrachtet werden, das mit den, im Information Retrieval System vorhandenen, Dokumenten verglichen wird. Die Menge der Worte in der Anfrage ist im Vergleich zur Menge der Worte in einem Dokument gering. Daher ist es, außer in einigen Spezialfällen, wahrscheinlich, dass Dokumente aufgefunden werden, die exakt mit der Anfrage 3

4 übereinstimmen, also alle Stichworte enthalten. Hierdurch wird das Problem, der Bestimmung der Ähnlichkeit zwischen zwei Dokumenten, auf das Auffinden von Dokumenten die die gleichen Worte wie die Anfrage enthalten reduziert. Daher kann es von Nöten sein, ein Verfahren zu verwenden, dass die Wertung der einzelnen Treffer ermöglicht. (3, S. 87) 2.2 Modelle des Information Retrieval Information Retrieval Systemen können verschiedene Modelle zu Grunde liegen. Nach (7) können dies mengentheoretische, vektorraum-basierte, sowie probablistische Modelle oder Retrievalstrategien mit Clusteranalyse sein. Bei den mengentheoretischen Modellen wird die natürliche Sprache in Dokumenten auf Mengen abgebildet. Die Ähnlichkeitsbestimmung erfolgt durch die Anwendung von Mengenoperationen. Zu diesem Modell gehört auch das Boole sche Retrieval (7). Vektorraumbasierte oder auch algebraische Modelle stellen Dokumente und Anfragen als Vektoren dar(7). Nach (4, S.61) ist das Vektorraummodell das bekannteste Modell im Information Retrieval. Als ähnlich gelten hierbei Dokumente, deren Vektoren ähnlich zum Vektor der Anfrage sind. Probablistische Modelle wiederum sehen die Bestimmung von Ähnlichkeiten als mehrstufiges Zufallsexperiment an(7). Sie sind der erfolgreichste Lösungsansatz im Umgang mit dem Grundsatz der Unsicherheit(4, S. 72). 2.3 Verfahren des Information Retrieval Boole sches Retrieval Das Boole sche Retrieval ist wohl das Retrievalverfahren, das einem als erstes in den Sinn kommt und in der Tat war es (nach (4, S. 58)) auch das historisch betrachtet Erste. Die Grundidee hinter dem Boole schen Verfahren ist die, dass nur solche Dokumente zurückgeliefert werden, für die die Anfrage den Boole schen Wert wahr zurück gibt. Hieraus ergibt sich, dass die Anfrage aus Termen (Stichworten) bestehen muss, die mit den Boole schen Operatoren AND, OR und NOT verknüpft sind(6, S. 74). Dieses Verfahren war früher das einzig anwendbare Verfahren, da der Speicher der damaligen Rechner nur sehr beschränkt war. Daher war es nötig, sofort nach dem Einlesen eines Dokumentes, in den Speicher, zu entscheiden ob es als Antwort auf eine Anfrage zurückgeliefert werden sollte, oder nicht. Obwohl heutige Rechner nicht mehr unter derartigen Hardwareproblemen leiden, wurde das Boole sche Retrieval Verfahren bis heute nicht in Frage gestellt und lediglich mit einigen funktionalen Erweiterungen versehen.(4, S. 58) Es ist auch heute noch das 4

5 am häufigsten verwendete Verfahren(1, S. 33). Eine Anfrage, die an ein solches Information Retrieval System gestellt wird, wird in der Regel aus einer Verknüpfung einzelner Stichworte bestehen. Wenn die Anfrage zum Beispiel lauten würde: (emacs AND latex) OR (editor AND NOT vi), so würde diese Anfrage alle Dokumente zurückliefern, in denen emacs und latex oder in denen editor aber nicht vi vorkommt.(beispiel nach (6, S. 74)). Eine solche Anfrage kann mit Hilfe von Klammern und Operatoren beliebig kompliziert gestaltet werden, was dazu führen kann, dass die Eingabe für den Nutzer oder andere Personen unverständlich und dadurch unter Umständen auch fehlerhaft wird.(1, S. 34f) Einige Systeme erlauben die Erweiterung oder Einschränkung der Anfrage durch strukturierte Wörterbücher, welche zu jedem Schlüsselwort Präzisierungen oder Verallgemeinerungen enthalten. Hierdurch wird dem Benutzer die Reformulierung seiner Anfrage erleichtert.(6, S. 74) Nach (4, S. 59) ist die Verwendung der Negation, aus implementierungstechnischen Gründen, in realen Systemen meist auf die Kombination mit der Konjunktion eingeschränkt. So sind Anfragen wie a AND NOT b erlaubt, wohingegen NOT b oder a OR NOT b nicht zulässig sind. Nach (4, S. 59) ist das Boole sche Retrieval unter anderem aus folgenden Gründen ungeeignet: 1. Kontrolle der Größe der Antwortmenge schwierig. 2. Keine Ordnung der Antworten nach Dokumenten, die mehr oder weniger gut zur Anfrage passen. 3. Die Trennung zwischen Dokumenten, die zur Anfrage passen und solchen die nicht passen ist oftmals zu streng. Bei einer Anfrage wie zum Beispiel Husten AND Fieber AND Heiserkeit würden sowohl Dokumente, die keines der Suchworte enthalten als auch Dokumente, die lediglich zwei Suchworte (z.b Husten und Fieber) enthalten, als unpassend zurückgewiesen werden. 4. Die Erstellung der Anfrage ist unter Umständen schwierig und überfordert möglicherweise ungeübte oder gelegentliche Benutzer. 5. Die Retrievalqualität ist schlechter, als bei anderen Retrievalmodellen. Sowohl nach (1, S. 35) als auch nach (6, S. 75) wird das Boole sche Retrieval meist mit invertierten Listen implementiert. 5

6 Invertierte Listen Eine invertierte Liste ist im Grunde eine Liste von Worten oder Termen, deren einzelne Einträge auf Dokumente verweisen, anstelle einer Liste von Dokumenten, die auf Worte zeigt. Nach (1, S. 3ff) hat dies den Vorteil, dass der Zugriff schnell erfolgt. Allerdings ist der Speicherplatzbedarf relativ hoch. Wenn der Bestand der im Information Retrieval System vorhandenen Dokumente erweitert wird, so muss unter Umständen die Liste neu berechnet werden. Um eine invertierte Liste zu erstellen, müssen die Terme nach denen der Benutzer suchen können soll bekannt sein. Sie können entweder manuell vorgegeben werden, oder sie werden anhand von Regeln aus den vorhandenen Dokumenten gewonnen. Damit eine invertierte Liste ihren Zweck erfüllen kann, sollte sie möglichst sinntragede Wörter enthalten. Terme die sehr häufig in den Dokumenten vorkommen sind also ungeeignet. Andererseits sollte sie aber, um Speicherplatz zu sparen, auch möglichst klein sein. Die eigentliche Erstellung könnte nun folgendermaßen ablaufen: Zuerst werden die Dokumente anhand der Regeln oder einer Liste bekannter Terme in ihre einzelnen Terme zergliedert. Zu jedem zulässigen Term wird nun das Dokument und die Position an der er in diesem Dokument vorkommt gespeichert. Die nun entstandene Liste, aus Paaren von Termen und Dokumentzeigern, wird alphabetisch sortiert, wobei Paare mit gleichen Termen zusammengefasst werden. Die Bearbeitung einer Anfrage erfolgt nun, indem diese zuerst in einzelne Terme aufgeteilt wird. Zu jedem Term wird nun eine Liste ermittelt, in der die Dokumente in denen er vorkommt und die Positionen der Stellen seines Auftretens stehen. Die für die Terme erstellten Listen werden mit den in der Anfrage angegebenen Boole schen Operatoren verknüpft. Die hieraus entstehende Liste wird als Ergebnis zurückgegeben Berechnung der Ähnlichkeit von Dokumenten und Vektorraummodell Das bisher vorgestellte Boole sche Retrieval untersuchte lediglich, ob Suchworte in einem Dokument vorhanden waren oder nicht. Eine Gewichtung der einzelnen Terme und damit auch der Relevanz der einzelnen Dokumente bezüglich der Anfrage fand nicht statt. Um dies zu ermöglichen wurden weitere Verfahren und Modelle entwickelt. Ein Beispiel hierfür ist das Vektorraummodell. Dokumente und Anfrage werden hierbei als Vektoren dargestellt. Näheres zur Umwandlung von Dokumenten in Vektoren ist in (2) und (3, Kapitel 2, S )zu erfahren. Beim Retrieval im Vektorraummodell wird nun nach solchen Dokumenten gesucht, deren Vektoren ähnlich zum Anfragevektor sind, bzw. die lediglich einen ge- 6

7 wissen Abstand zu diesem haben. Um diese Ähnlichkeiten zu berechnen, werden Ähnlichkeitsmaße verwendet.(4, S. 61) Zur Implementierung des Vektorraummodells wird üblicherweise auch eine invertierte Liste verwendet, wobei zusätzlich noch Gewichtungen gespeichert werden(1, S. 64). Das Gewicht, das ein einzelnes Wort in einem Dokument einnimmt, lässt sich relativ einfach anhand der Häufigkeit seines Auftretens im Dokument errechnen. Bei der Berechnung von Gewichtungen innerhalb von Anfragen ist dies in den meisten Fällen nicht möglich, da diese meist zu kurz sind. Allerdings kann der Benutzer einbezogen werden. Er bekommt auf seine Anfrage eine Liste von Dokumenten präsentiert, die er anhand ihrer Relevanz bezüglich seiner Anfrage bewertet. Mit diesen Daten können die Gewichte der Anfrage berechnet werden. Man kann sich hier zum Beispiel zunutze machen, dass mit den Dokument - und Anfragevektoren wie mit Vektoren innerhalb eines n-dimensionalen Vektorraumes gerechnet werden kann. Wenn man nun annimmt, dass verschiedene Themen an verschiedenen Orten im Raum liegen, dann bedeutet eine Verschiebung der Vektoren durch die Veränderung der Gewichte, eine Verschiebung hin zu den relevanteren Themen. (1, S. 72) Ähnlichkeitsmaße Zählung gemeinsamer Wörter Die wohl einfachste Möglichkeit die Ähnlichkeit zweier Dokumente (oder zwischen Anfrage und Dokumenten) zu messen, ist die Zählung der gemeinsamen Wörter. Es werden alle Wörter in der Anfrage mit den Worten in der Sammlung verglichen. Falls ein Wort sowohl in der Sammlung als auch in der Anfrage enthalten ist, wird es gezählt. In einem Information Retrieval System werden die relevanten Wörter der vorhandenen Dokumente in einem Wörterbuch gespeichert. So werden nicht alle Wörter aller Dokumente verglichen, sondern nur die in dem Wörterbuch(3, S. 89). Das Wörterbuch könnte zum Beispiel eine Invertierte Liste sein. Es können anstelle von Worten auch vektorisierte Dokumente verwendet werden. Hierbei sind die Vektoren der Dokumente Folgen von 0 und 1. Das Maß für die Ähnlichkeit zwischen zwei Dokumenten würde dann dem Skalarprodukt zweier Vektoren entsprechen. Dies würde auch der Boole schen AND Operation entsprechen.(3, S. 89f) Bei diesem Maß werden keine Gewichtungen verwendet, es wird nur überprüft, ob Worte vorhanden sind oder nicht. Es ist also dem Boole sche Retrieval sehr ähnlich. Allerdings ist die Trennung zwischen zur Anfrage passenden und nicht zur Anfrage passenden Dokumenten nicht so strikt. 7

8 Zählung gemeinsamer Wörter mit Bonus Bei einer großen Anzahl von Worten ist die Unterscheidung zwischen für das Ähnlichkeitsmaß aussagekräftigen Worten und solchen die weniger aussagekräftig sind schwierig. Zwar kann man sich behelfen, indem man die Worte im Wörterbuch sorgfältig auswählt, allerdings kann es vorteilhaft sein mehr als lediglich das Auftreten der im Wörterbuch vorhanden Worte zur Bestimmung der Ähnlichkeit heranzuziehen.(3, S. 90) Eine Möglichkeit wäre die in (3, S. 90) vorgeschlagenen Gleichungen zu verwenden: Ähnlichkeit(D i ) = K w(j) j=1 w(j) = { wenn wort(j) in beiden Dokumenten auftritt df(j) 0 sonst Hierbei ist df(j) die Anzahl der Dokumente, in denen ein Wort j auftritt und K die Gesamtanzahl der Dokumente. Die Funktion w(j) ergibt also 0, falls das Wort j nicht in beiden Dokumenten vorkommt, ansonsten 1 plus 1 df(j) einen Bonus, der umso kleiner wird, je mehr Dokumente es gibt, die das Wort enthalten. Hierdurch ist es möglich, die Relevanz eines Wortes für das Ergebnis besser zu berücksichtigen. Kosinus Ähnlichkeit Nach (3, S91) ist die Kosinus Ähnlichkeit, der klassischste Ansatz um zwei Dokumente zu vergleichen. In diesem Ähnlichkeitsmaß werden nur die Worte gewertet, die in beiden Dokumenten enthalten sind, jedoch wird auch die Häufigkeit, mit der die Worte in den Dokumenten und mit der sie allgemein auftreten mit einbezogen. Die Kosinus Ähnlichkeit kann mit Hilfe dieser Gleichungen berechnet werden: w(j) = tf(j) log 2 ( N df(j) ) norm(d) = w(j) 2 KosinusÄhnlichkeit(d1, d2) = (w d1 (j) w d2 (j)) norm(d1) norm(d2) Hierbei ist w(j) die Aussagekraft, die ein Wort j in einem Dokument einnimmt. Sie berechnet sich aus der Häufigkeit tf(j), mit der ein Wort in einem Dokument auftritt, N, der Anzahl der Dokumente in der Sammlung, und df(j) die Anzahl der Dokumente in denen das Wort auftritt. w(j) ist nur 8

9 0, wenn ein Wort in einem Dokument auftritt. Da Dokumente unterschiedlich lang sein können, kann die Aussage über die Häufigkeit des Auftretens eines Wortes in einem Dokument irreführend sein. Aus diesem Grund wird die Information über die Häufigkeit des Auftretens auf die einheitliche Länge eines Dokuments D normiert. In der dritten Formel, die das eigentliche Kosinus Maß zum Ausdruck bringt, wird die Aussagekraft, die ein gemeinsames Wort in jedem Dokument hat, multipliziert, normiert und auf die Ergebnisse für andere gemeinsame Worte addiert.(3, S.91f) 2.4 Dokumentensuche im Internet Die bisher vorgestellten Methoden des Information Retrieval haben nach (3, S. 93) lediglich einen eingeschränkten Nutzen für die Suche von Dokumenten im Internet. Der Grund ist darin zu suchen, dass das Internet aus einer enormen Anzahl von Dokumenten besteht. Daher ist es, außer in dem Fall, dass die Anfrage aus sehr einzigartigen Suchworten besteht, wahrscheinlich, dass eine große Anzahl von Dokumenten aufgefunden wird, die alle Suchworte enthalten. Die Bewertungen der Ähnlichkeit der einzelnen Dokumente zur Anfrage werden wahrscheinlich sehr nahe beieinander liegen. Jedoch ist in den im Internet vorhandenen Dokumenten mehr Information als nur aus Worten bestehende enthalten. Die Hyperlinks, mit denen Dokumente aufeinander verweisen, können zur Bewertung herangezogen werden. Hierbei wird zwischen frageabhängiger und frageunabhängiger Bewertung unterschieden. Einerseits sollte die Bewertung die Relevanz bezüglich der Anfrage ausdrücken, also anfrageabhängig sein. Andererseits gibt es allerdings auch die Möglichkeit, dass Dokumente anfrageunabhängig bewertet werden. In diesem Falle kann man die Wertung als Maß für die Qualität der Webseite betrachten.(3, S.92f) Linkanalyse Bei der Linkanalyse werden die Verweise, die Webseiten auf andere Webseiten haben ausgewertet. Die Suchergebnisse, die am höchsten bewertet werden sollen die sein, auf die am meisten verwiesen wird. Google berechnet die Bewertung einer Seite A, P R(A), nach (3, S. 94) zum Beispiel folgendermaßen: P R(A) = d + (1 d) j P R(T j ) C(T j ) Hierbei sei T j eine Seite, die auf A verweist. d ist ein Mindestwert, der jeder Seite zugewiesen wird und C(T ) die Anzahl, der nach außen führenden Verweise auf Seite T. Die Bewertung einer Seite ist also abhängig, von der 9

10 Anzahl der Verweise auf diese und von den Bewertungen der verweisenden Seiten. Eine andere Möglichkeit die Verweise auf eine Seite zu bewerten besteht darin, den Beschreibungstext eines Hyperlinks zu verwenden. Dieser wurde meist vom Autor der verweisenden Seite erstellt und Beschreibt die Seite auf die er verweist oft sehr gut. Er kann mit einer Überschrift verglichen werden. Zusätzlich hat eine Analyse der Beschreibungstexte verschiedener Links häufig noch den Vorteil, dass diese ziemlich sicher von verschiedenen Personen erstellt wurden. Hierdurch ist es möglich, das Stichpunkte aus der Anfrage, die in der eigentlichen Seite fehlen, immer noch in diesen Beschreibungstexten vorhanden sind. 10

11 Literatur [1] Ferber, Reginald: Information Retrieval. dpunkt.verlag, [2] Forster, Julian: Die Transformation von Text in Vektoren. ProseminarTextMining/index.html, [3] Fred J. Damerau, Sholom M. Weiss Nitin Indurkhya Tong Zhang : Text Mining. Springer, [4] Fuhr, Norbert: Information Retrieval. uni-duisburg.de/courses/ir_ss04/folien/irskall.pdf, [5] Lancaster, F.W.: Information Retrieval Systems: Characteristics, Testing and Evaluation. Wiley, [6] Rijsbergen, C. J. van: Information Retrieval. ac.uk/keith/preface.html, [7] Wikipedia: Information-Retrieval. Information_Retrieval,

Rückblick. Aufteilung in Dokumente anwendungsabhängig. Tokenisierung und Normalisierung sprachabhängig

Rückblick. Aufteilung in Dokumente anwendungsabhängig. Tokenisierung und Normalisierung sprachabhängig 3. IR-Modelle Rückblick Aufteilung in Dokumente anwendungsabhängig Tokenisierung und Normalisierung sprachabhängig Gesetz von Zipf sagt aus, dass einige Wörter sehr häufig vorkommen; Stoppwörter können

Mehr

Rückblick. Aufteilung in Dokumente anwendungsabhängig. Tokenisierung und Normalisierung sprachabhängig

Rückblick. Aufteilung in Dokumente anwendungsabhängig. Tokenisierung und Normalisierung sprachabhängig 3. IR-Modelle Rückblick Aufteilung in Dokumente anwendungsabhängig Tokenisierung und Normalisierung sprachabhängig Gesetz von Zipf sagt aus, dass einige Wörter sehr häufig vorkommen; Stoppwörter können

Mehr

IR Seminar SoSe 2012 Martin Leinberger

IR Seminar SoSe 2012 Martin Leinberger IR Seminar SoSe 2012 Martin Leinberger Suchmaschinen stellen Ergebnisse häppchenweise dar Google: 10 Ergebnisse auf der ersten Seite Mehr Ergebnisse gibt es nur auf Nachfrage Nutzer geht selten auf zweite

Mehr

T = {t 1,..., t n } sei die Menge der Terme. D = {d 1,..., d m } sei die Menge der Dokumente.

T = {t 1,..., t n } sei die Menge der Terme. D = {d 1,..., d m } sei die Menge der Dokumente. Vektorraummodell T = {t 1,..., t n } sei die Menge der Terme. D = {d 1,..., d m } sei die Menge der Dokumente. Dokumente und Anfragen werden als Vektoren in einem Vektorraum aufgefaßt. Der Vektorraum wird

Mehr

4. Webbasierte Recherche

4. Webbasierte Recherche 4. Webbasierte Recherche In diesem Kapitel lernen Sie, was Suchmaschinen sind, und wie Sie sie verwenden können. Am Beispiel von Google werden Sie Suchanfragen formulieren lernen und die erweiterte Suche

Mehr

Webbasierte Recherche

Webbasierte Recherche Online-Grundlagen Webbasierte Recherche In diesem Kapitel lernen Sie, was Suchmaschinen sind, und wie Sie eine Suchmaschine verwenden können. Am Beispiel von Google werden Sie Suchanfragen formulieren

Mehr

Boole'sches Modell <is web>

Boole'sches Modell <is web> Boole'sches Modell basiert auf Mengentheorie und Boole'scher Algebra sehr einfaches Modell mit klarer Semantik Dokumente als Mengen von Indextermen Termgewichte sind binär: im Dokument enthalten oder nicht

Mehr

Information Retrieval, Vektorraummodell

Information Retrieval, Vektorraummodell Universität Potsdam Institut für Informatik Lehrstuhl Maschinelles Lernen Information Retrieval, Vektorraummodell Tobias Scheffer Paul Prasse Michael Großhans Uwe Dick Information Retrieval Konstruktion

Mehr

Kapitel IR:III (Fortsetzung)

Kapitel IR:III (Fortsetzung) Kapitel IR:III (Fortsetzung) III. Retrieval-Modelle Modelle und Prozesse im IR Klassische Retrieval-Modelle Bool sches Modell Vektorraummodell Retrieval-Modelle mit verborgenen Variablen Algebraisches

Mehr

Klassisches Information Retrieval Jan Schrader

Klassisches Information Retrieval Jan Schrader Klassisches Information Retrieval 27.10.2011 Jan Schrader Information Retrieval (IR) Information retrieval (IR) is finding material (usually documents) of an unstructured nature (usually text) that satisfies

Mehr

Indexvokabular {Korsika, Sardinien, Strand, Ferienwohnung, Gebirge} Verknüpfung von Enthaltenseinsbedingungen mittels Boole'scher Junktoren.

Indexvokabular {Korsika, Sardinien, Strand, Ferienwohnung, Gebirge} Verknüpfung von Enthaltenseinsbedingungen mittels Boole'scher Junktoren. Boole'sches Modell Boole'sches Modell: Beispiel basiert auf Mengentheorie und Boole'scher Algebra sehr einfaches Modell mit klarer Semantik Dokumente als Mengen von Indextermen Termgewichte sind binär:

Mehr

Vektoren - Die Basis

Vektoren - Die Basis Vektoren - Die Basis Motivation (Als Vereinfachung - der Schreibarbeit - wählen wir meistens Vektoren in R 2.) Eigentlich ist ja Alles klar! Für einen Vektor a gilt a = ( a x a y )! Am Ende werden wir

Mehr

Suchmaschinenalgorithmen. Vortrag von: Thomas Müller

Suchmaschinenalgorithmen. Vortrag von: Thomas Müller Suchmaschinenalgorithmen Vortrag von: Thomas Müller Kurze Geschichte Erste Suchmaschine für Hypertexte am CERN Erste www-suchmaschine World Wide Web Wanderer 1993 Bis 1996: 2 mal jährlich Durchlauf 1994:

Mehr

Axiomatische Beschreibung der ganzen Zahlen

Axiomatische Beschreibung der ganzen Zahlen Axiomatische Beschreibung der ganzen Zahlen Peter Feigl JKU Linz peter.feigl@students.jku.at 0055282 Claudia Hemmelmeir JKU Linz darja@gmx.at 0355147 Zusammenfassung Wir möchten in diesem Artikel die ganzen

Mehr

Nachteile Boolesches Retrieval

Nachteile Boolesches Retrieval Nachteile Boolesches Retrieval Komplizierte Anfragen Häufigkeit bzw. Relevanz der Terme in den Dokumenten nicht berücksichtigt 2 von 3 UND-verknüpften Termen im Dokument so schlecht wie 0 Terme Keine Rangfolge

Mehr

Vom Suchen und Finden - Google und andere Ansätze

Vom Suchen und Finden - Google und andere Ansätze Vom Suchen und Finden - Google und andere Ansätze Norbert Fuhr Universität Duisburg Essen FB Ingenieurwissenschaften Abteilung Informatik 12. Mai 2005 Gliederung 1 Einführung 2 Grundlagen 3 Erweiterte

Mehr

Fit für die Projektarbeit. Thematische Literatursuche in 5 Schritten Quelle: Lotse, Skript zur Thematischen Literatursuche. Stand 1.10.

Fit für die Projektarbeit. Thematische Literatursuche in 5 Schritten Quelle: Lotse, Skript zur Thematischen Literatursuche. Stand 1.10. Fit für die Projektarbeit Thematische Literatursuche in 5 Schritten Quelle: Lotse, Skript zur Thematischen Literatursuche. Stand 1.10.2010 Thematische Literatursuche in 5 Schritten 1. Was suchen Sie? Analysieren

Mehr

Landau-Theorie. Seminar zur Theorie der Teilchen und Felder. Daniel Schröer

Landau-Theorie. Seminar zur Theorie der Teilchen und Felder. Daniel Schröer Landau-Theorie Seminar zur Theorie der Teilchen und Felder Daniel Schröer 1.Einleitung Um ein Problem der Statistischen Physik zu lösen, wird ein relevantes thermodynamisches Potential, wie beispielsweise

Mehr

1 Mengen und Aussagen

1 Mengen und Aussagen $Id: mengen.tex,v 1.2 2010/10/25 13:57:01 hk Exp hk $ 1 Mengen und Aussagen Der wichtigste Grundbegriff der Mathematik ist der Begriff einer Menge, und wir wollen damit beginnen die klassische, 1878 von

Mehr

cci Wissensportal kompakt erklärt 1. Die Ampeln cci Wissensportal kompakt erklärt

cci Wissensportal kompakt erklärt 1. Die Ampeln cci Wissensportal kompakt erklärt cci Wissensportal kompakt erklärt Herzlich willkommen in cci Wissensportal. Die folgenden Abschnitte sollen helfen, Benutzern die Funktionalität der Plattform näher zu bringen und ein Verständnis für das

Mehr

Datenbank-Recherche. SS Veranstaltung 16. April Philipp Mayr - Philipp Schaer -

Datenbank-Recherche. SS Veranstaltung 16. April Philipp Mayr - Philipp Schaer - Datenbank-Recherche SS 2015 2. Veranstaltung 16. April 2015 Philipp Mayr - philipp.mayr@gesis.org Philipp Schaer - philipp.schaer@gesis.org GESIS Leibniz-Institut für Sozialwissenschaften 2 Vorstellung

Mehr

Übungen zu Multimedia-Datenbanken Aufgabenblatt 2 - Musterlösungen

Übungen zu Multimedia-Datenbanken Aufgabenblatt 2 - Musterlösungen Übungen zu Multimedia-Datenbanken Aufgabenblatt 2 - Musterlösungen Übung: Dipl.-Inform. Tina Walber Vorlesung: Dr.-Ing. Marcin Grzegorzek Fachbereich Informatik, Universität Koblenz Landau Ausgabe: 03.05.200

Mehr

Fit für die Projektarbeit. Literaturrecherche leicht gemacht!

Fit für die Projektarbeit. Literaturrecherche leicht gemacht! Fit für die Projektarbeit Literaturrecherche leicht gemacht! Grundsätzlich 2 Recherchestrategien Formale Suche Es ist Ihnen bekannt was Sie suchen, weil z.b. Ihr Professor Ihnen ein bestimmtes Buch empfiehlt

Mehr

Vom Suchen und Finden der Literatur Mit Verknüpfungen und Suchschlüsseln zum präzisen Ergebnis

Vom Suchen und Finden der Literatur Mit Verknüpfungen und Suchschlüsseln zum präzisen Ergebnis Vom Suchen und Finden der Literatur Mit Verknüpfungen und Suchschlüsseln zum präzisen Ergebnis Berlin, 03.05.2017 Schätzfrage Sie suchen Literatur über die Rolle des Ozeans im Klimawandel. Welche Suchanfrage

Mehr

Fit für die Projektarbeit. Thematische Literatursuche in 5 Schritten Basiert auf: Lotse, Skript zur Thematischen Literatursuche. Stand 1.10.

Fit für die Projektarbeit. Thematische Literatursuche in 5 Schritten Basiert auf: Lotse, Skript zur Thematischen Literatursuche. Stand 1.10. Fit für die Projektarbeit Thematische Literatursuche in 5 Schritten Basiert auf: Lotse, Skript zur Thematischen Literatursuche. Stand 1.10.2010 Thematische Literatursuche in 5 Schritten 1. Was suchen Sie?

Mehr

Multimedia-Datenbanken im SS 2010 Ähnlichkeitsmaße II

Multimedia-Datenbanken im SS 2010 Ähnlichkeitsmaße II Multimedia-Datenbanken im SS 2010 Ähnlichkeitsmaße II Dr.-Ing. Marcin Grzegorzek 22.06.2010 Inhalte und Termine 1. Einführung in MMDB 1.1 Grundlegende Begriffe 1.2 Suche in einem MMDBS 1.3 MMDBMS-Anwendungen

Mehr

Stichwortsuche Themenhefte Bedienungsanleitung

Stichwortsuche Themenhefte Bedienungsanleitung Stichwortsuche Themenhefte Bedienungsanleitung Die in den Themenheften seit 2010 abgedruckten Vorträge und Fragebeantwortungen können online durchsucht werden. Die Stichwortsuche ist erreichbar unter https://www.glzh.ch/index.php/de/zeitschrift-geistige-welt/stichwortsuche.

Mehr

Klassen von Retrieval-Modellen. Boolesche und Vektorraum- Modelle. Weitere Modell-Dimensionen. Retrieval-Modelle. Boolesche Modelle (Mengen-basiert)

Klassen von Retrieval-Modellen. Boolesche und Vektorraum- Modelle. Weitere Modell-Dimensionen. Retrieval-Modelle. Boolesche Modelle (Mengen-basiert) Klassen von Retrieval-Modellen Boolesche und Vektorraum- Modelle Boolesche Modelle (Mengen-basiert) Erweitertes Boolesches Modell Vektorraummodelle (vector space) (statistisch-algebraischer Ansatz) Latente

Mehr

Schritt für Schritt ein neues Profil anlegen

Schritt für Schritt ein neues Profil anlegen Schritt für Schritt ein neues Profil anlegen In dieser Anleitung zeigen wir Ihnen jeden Schritt im Detail. Damit können Sie die Einstellungen und alle Such-Optionen maßgeschneidert nach Ihren Wünschen

Mehr

Boolesche- und Vektorraum- Modelle

Boolesche- und Vektorraum- Modelle Boolesche- und Vektorraum- Modelle Viele Folien in diesem Abschnitt sind eine deutsche Übersetzung der Folien von Raymond J. Mooney (http://www.cs.utexas.edu/users/mooney/ir-course/). 1 Retrieval Modelle

Mehr

Informationsverarbeitung auf Bitebene

Informationsverarbeitung auf Bitebene Informationsverarbeitung auf Bitebene Dr. Christian Herta 5. November 2005 Einführung in die Informatik - Informationsverarbeitung auf Bitebene Dr. Christian Herta Grundlagen der Informationverarbeitung

Mehr

Retrieval Modelle. Boolesche- und Vektorraum- Modelle. Weitere Modell-Dimensionen. Klassen von Retrieval Modellen. Boolesche Modelle (Mengentheorie)

Retrieval Modelle. Boolesche- und Vektorraum- Modelle. Weitere Modell-Dimensionen. Klassen von Retrieval Modellen. Boolesche Modelle (Mengentheorie) Retrieval Modelle Boolesche- und Vektorraum- Modelle Ein Retrieval-Modell spezifiziert die Details der: Repräsentation von Dokumenten Repräsentation von Anfragen Retrievalfunktion Legt die Notation des

Mehr

Zusammenfassung: Stichworte: Stellen Sie Ihre optimale Schriftgröße ein: Größere Schriftzeichen. 2x + 3 = 7. (1)

Zusammenfassung: Stichworte: Stellen Sie Ihre optimale Schriftgröße ein: Größere Schriftzeichen. 2x + 3 = 7. (1) 1 von 5 21.05.2015 14:30 Zusammenfassung: Eine Ungleichung ist die "Behauptung", dass ein Term kleiner, größer, kleiner-gleich oder größer-gleich einem andereren Term ist. Beim Auffinden der Lösungsmenge

Mehr

Teilgebiet Geometrie Aufgabengruppe I. Anlage 3

Teilgebiet Geometrie Aufgabengruppe I. Anlage 3 Anlage 3 Die Abiturprüfung 2013 Analyse von Schülerlösungen dokumentiert von Nora Bender im Rahmen ihrer Hausarbeit im Fach Mathematik an der Universität Würzburg Teilgebiet Geometrie Aufgabengruppe I

Mehr

Transformation - Homogene Koordinaten. y + b )

Transformation - Homogene Koordinaten. y + b ) Transformation - Homogene Koordinaten In der "üblichen" Behandlung werden für die Verschiebung (Translation) und die Drehung (Rotation) verschiedene Rechenvorschriften benutzt - einmal Addition von Vektoren

Mehr

Erweitertes boolsches Retrieval

Erweitertes boolsches Retrieval Erweitertes boolsches Retrieval In diesem Unterabschnitt werden andere Ansätze zur Verbesserung des boolschen Retrievals vorgestellt. Im Gegensatz zum Vektorraummodell wird bei diesen Ansätzen versucht,

Mehr

Formale Grundlagen der Informatik 1 Kapitel 16 Normalformen und Hornformeln

Formale Grundlagen der Informatik 1 Kapitel 16 Normalformen und Hornformeln Formale Grundlagen der Informatik 1 Kapitel 16 Normalformen und Frank Heitmann heitmann@informatik.uni-hamburg.de 9. Juni 2015 Frank Heitmann heitmann@informatik.uni-hamburg.de 1/36 Ersetzbarkeitstheorem

Mehr

Information Retrieval,

Information Retrieval, Universität Potsdam Institut für Informatik Lehrstuhl Maschinelles Lernen Information Retrieval, Vektorraummodell Tobias Scheffer Uwe Dick Peter Haider Paul Prasse Information Retrieval Konstruktion von

Mehr

Boole sches Retrieval als frühes, aber immer noch verbreitetes IR-Modell mit zahlreichen Erweiterungen

Boole sches Retrieval als frühes, aber immer noch verbreitetes IR-Modell mit zahlreichen Erweiterungen Rückblick Boole sches Retrieval als frühes, aber immer noch verbreitetes IR-Modell mit zahlreichen Erweiterungen Vektorraummodell stellt Anfrage und Dokumente als Vektoren in gemeinsamen Vektorraum dar

Mehr

Inverted Files for Text Search Engines

Inverted Files for Text Search Engines Inverted Files for Text Search Engines Justin Zobel, Alistair Moffat PG 520 Intelligence Service Emel Günal 1 Inhalt Einführung Index - Inverted Files - Indexkonstruktion - Indexverwaltung Optimierung

Mehr

RIS-ABFRAGEHANDBUCH AMTLICHE VETERINÄRNACHRICHTEN DES BM FÜR GESUNDHEIT UND FRAUEN

RIS-ABFRAGEHANDBUCH AMTLICHE VETERINÄRNACHRICHTEN DES BM FÜR GESUNDHEIT UND FRAUEN RIS-ABFRAGEHANDBUCH AMTLICHE VETERINÄRNACHRICHTEN DES BM FÜR GESUNDHEIT UND FRAUEN 1 Überblick Seit 15. September 2004 werden die Amtliche Veterinärnachrichten (AVN) des Bundesministeriums für Gesundheit

Mehr

Grundlagen der Suche in der WinIBW

Grundlagen der Suche in der WinIBW 1 von 11 02.02.2017 09:31 Grundlagen der Suche in der WinIBW Kombination von Suchergebnissen Bei umfangreichen Selektionen kann es sinnvoll sein, mehrere Suchanfragen zu kombinieren, anstatt eine einzelne

Mehr

Summen, Indices und Multiindices

Summen, Indices und Multiindices Summen, Indices und Multiindices 1 Einleitung Möchten wir zwei Zahlen a und b addieren, so schreiben wir für gewöhnlich a + b. Genauso schreiben wir a + b + c, für die Summe von drei Zahlen a, b und c.

Mehr

Operatoren für das Fach Mathematik

Operatoren für das Fach Mathematik Operatoren für das Fach Mathematik Anforderungsbereich I Angeben, Nennen Sachverhalte, Begriffe, Daten ohne nähere Erläuterungen und Begründungen, ohne Lösungsweg aufzählen Geben Sie die Koordinaten des

Mehr

Implementierung eines Vektormodells

Implementierung eines Vektormodells Implementierung eines Vektormodells Hauptseminar Information Retrieval WS 2013/14 Dr. Karin Haenelt Amol Phadke, Mirjam Eppinger Institut für Computerlinguistik Ruprecht-Karls-Universität Heidelberg 03.02.2014

Mehr

STACK Mathematische Aufgaben mit ILIAS testen (Ein Frage-Typ im ILIAS-Objekt Test)

STACK Mathematische Aufgaben mit ILIAS testen (Ein Frage-Typ im ILIAS-Objekt Test) STACK Mathematische Aufgaben mit ILIAS testen (Ein Frage-Typ im ILIAS-Objekt Test) Inhalt: Einleitung Vorteile von STACK-Fragen Beispielaufgabe Generierung einer Zufallsfrage 1. Einleitung Der elektronische

Mehr

Kapitel L:IV. IV. Nichtklassische Logiken. Fuzzy-Mengen Modifizierer für Fuzzy-Mengen Operationen auf Fuzzy-Mengen Fuzzy-Inferenz Defuzzifizierung

Kapitel L:IV. IV. Nichtklassische Logiken. Fuzzy-Mengen Modifizierer für Fuzzy-Mengen Operationen auf Fuzzy-Mengen Fuzzy-Inferenz Defuzzifizierung Kapitel L:IV IV. Nichtklassische Logiken Fuzzy-Mengen Modifizierer für Fuzzy-Mengen Operationen auf Fuzzy-Mengen Fuzzy-Inferenz Defuzzifizierung L:IV-45 Nonclassical Logics LETTMANN/STEIN 1998-2013 Aussagenlogik

Mehr

Möglichkeiten der automatischen Sprachverarbeitung mit Django

Möglichkeiten der automatischen Sprachverarbeitung mit Django Möglichkeiten der automatischen Sprachverarbeitung mit März 2009 / Leipzig / Python Stammtisch Möglichkeiten der automatischen Sprachverarbeitung mit Inhalt 1 2 3 4 Möglichkeiten der automatischen Sprachverarbeitung

Mehr

3. Retrievalmodelle Grundkonzept des Vektorraummodells. Vektorraummodell. Dokumente und Anfragen werden als Vektoren in einem Vektorraum aufgefaßt.

3. Retrievalmodelle Grundkonzept des Vektorraummodells. Vektorraummodell. Dokumente und Anfragen werden als Vektoren in einem Vektorraum aufgefaßt. 3. Retrievalmodelle Grundkonzept des Vektorraummodells Vektorraummodell Dokumente und Anfragen werden als Vektoren in einem Vektorraum aufgefaßt. Der Vektorraum wird durch die in der Datenbank enthaltenen

Mehr

Literaturrecherche in Fachdatenbanken Ein Kurzleitfaden des Fachbereiches Pädagogik und Rehabilitation bei intellektueller Beeinträchtigung

Literaturrecherche in Fachdatenbanken Ein Kurzleitfaden des Fachbereiches Pädagogik und Rehabilitation bei intellektueller Beeinträchtigung Literaturrecherche in Fachdatenbanken Ein Kurzleitfaden des Fachbereiches Pädagogik und Rehabilitation bei intellektueller Beeinträchtigung Inhaltsverzeichnis 1. Zugang zu den Datenbanken... 2 2. Literaturrecherche

Mehr

Learning Object-Oriented Programming. Algorithmen. Algorithmusbegriff. Klärung der Herkunft des Begriffs Formale Definition von Algorithmus

Learning Object-Oriented Programming. Algorithmen. Algorithmusbegriff. Klärung der Herkunft des Begriffs Formale Definition von Algorithmus Algorithmen Algorithmusbegriff Klärung der Herkunft des Begriffs Formale Definition von Algorithmus Algorithmusbegriff Algorithmen sind eine der ältesten (abstrakten) Beschreibungstechniken für Abläufe.

Mehr

SPRACHTECHNOLOGIE IN SUCHMASCHINEN IR-GRUNDLAGEN

SPRACHTECHNOLOGIE IN SUCHMASCHINEN IR-GRUNDLAGEN SPRACHTECHNOLOGIE IN SUCHMASCHINEN IR-GRUNDLAGEN HAUPTSEMINAR SUCHMASCHINEN COMPUTERLINGUISTIK SOMMERSEMESTER 2016 STEFAN LANGER STEFAN.LANGER@CIS.UNI -MUENCHEN.DE Übung (Gruppenarbeit, 10-15 min.) Sie

Mehr

Information Retrieval. Peter Kolb

Information Retrieval. Peter Kolb Information Retrieval Peter Kolb Semesterplan Einführung Boolesches Retrievalmodell Volltextsuche, invertierter Index Boolesche Logik und Mengen Vektorraummodell Evaluation im IR Term- und Dokumentrepräsentation

Mehr

Vorkurs: Mathematik für Informatiker

Vorkurs: Mathematik für Informatiker Vorkurs: Mathematik für Informatiker Teil 4 Wintersemester 2017/18 Steven Köhler mathe@stevenkoehler.de mathe.stevenkoehler.de 2 c 2017 Steven Köhler Wintersemester 2017/18 Inhaltsverzeichnis Teil 1 Teil

Mehr

Latent Semantic Indexing: Einführung und Experiment

Latent Semantic Indexing: Einführung und Experiment Latent Semantic Indexing: Einführung und Experiment Jonathan Geiger, Felix Hieber HS: Information Retrieval Dr. Haenelt 12.01.2009 WS 08/09 Motivation Grundsätzlich stecken zwei Ideen hinter, eine praktischer

Mehr

Informatik-Ausbildung. Basis: I-CH Modulbaukasten R3. Autorenteam des HERDT-Verlags

Informatik-Ausbildung. Basis: I-CH Modulbaukasten R3. Autorenteam des HERDT-Verlags Autorenteam des HERDT-Verlags 1. Ausgabe, Juli 2014 Informatik-Ausbildung Basis: I-CH Modulbaukasten R3 Modul 302: Fortgeschrittene Funktionen von Office-Werkzeugen nutzen (Teil 2) I-CH-M302-13-CC_2 1

Mehr

Mathematik: Mag. Schmid Wolfgang Arbeitsblatt 7 1. Semester ARBEITSBLATT 7 ADDIEREN UND SUBTRAHIEREN VON TERMEN UND DIE POTENZSCHREIBWEISE

Mathematik: Mag. Schmid Wolfgang Arbeitsblatt 7 1. Semester ARBEITSBLATT 7 ADDIEREN UND SUBTRAHIEREN VON TERMEN UND DIE POTENZSCHREIBWEISE Mathematik: Mag. Schmid Wolfgang Arbeitsblatt 7. Semester ARBEITSBLATT 7 ADDIEREN UND SUBTRAHIEREN VON TERMEN UND DIE POTENZSCHREIBWEISE ) VARIABLE Beispiel: Ein Rechteck habe einen Umfang von 0 cm. Gib

Mehr

RIS-ABFRAGEHANDBUCH ERLÄSSE DES BUNDESMINSTERIUMS FÜR JUSTIZ

RIS-ABFRAGEHANDBUCH ERLÄSSE DES BUNDESMINSTERIUMS FÜR JUSTIZ RIS-ABFRAGEHANDBUCH ERLÄSSE DES BUNDESMINSTERIUMS FÜR JUSTIZ 1 Überblick Die Dokumentation von Erlässen des österreichischen Bundesministeriums für Justiz (BMJ) ist eine Teilapplikation des Rechtsinformationssystems

Mehr

5 Suchmaschinen Page Rank. Page Rank. Information Retrieval und Text Mining FH Bonn-Rhein-Sieg, SS Suchmaschinen Page Rank

5 Suchmaschinen Page Rank. Page Rank. Information Retrieval und Text Mining FH Bonn-Rhein-Sieg, SS Suchmaschinen Page Rank Page Rank Google versucht die Bedeutung von Seiten durch den sogenannten Page Rank zu ermitteln. A C Page Rank basiert auf der Verweisstruktur des Webs. Das Web wird als großer gerichteter Graph betrachtet.

Mehr

Midas Metadata yield by Data Analysis

Midas Metadata yield by Data Analysis Midas Metadata yield by Data Analysis Glossar powered by Was ist Text Mining? Unter Text Mining versteht sich im Allgemeinen die Extraktion von strukturierten Informationen aus unstrukturierten oder semistrukturierten

Mehr

Abstandsberechnung Gerade - Gerade (Kreuzprodukt)

Abstandsberechnung Gerade - Gerade (Kreuzprodukt) Abstandsberechnung Gerade - Gerade (Kreuzprodukt) 1. Parallele Geraden g1: a + t u g2: b + s u Gleiche Richtungsvektoren, aber verschiedene Aufpunkte. In R 2 : d = (b-a) n o mit n u. In R : d = (b-a) x

Mehr

Einführung in die linearen Funktionen. Autor: Benedikt Menne

Einführung in die linearen Funktionen. Autor: Benedikt Menne Einführung in die linearen Funktionen Autor: Benedikt Menne Inhaltsverzeichnis Vorwort... 3 Allgemeine Definition... 3 3 Bestimmung der Steigung einer linearen Funktion... 4 3. Bestimmung der Steigung

Mehr

Ein XML Dokument zeichnet sich im Wesentlichen durch seine baumartige Struktur aus:

Ein XML Dokument zeichnet sich im Wesentlichen durch seine baumartige Struktur aus: RDF in wissenschaftlichen Bibliotheken 5HWULHYDODXI5') Momentan existiert noch keine standardisierte Anfragesprache für RDF Dokumente. Auf Grund der existierenden XML Repräsentation von RDF liegt es jedoch

Mehr

Tutorium Mathematik I, M Lösungen

Tutorium Mathematik I, M Lösungen Tutorium Mathematik I, M Lösungen 9. Oktober 202 *Aufgabe. Ein Fischauge ist ein Objektiv in der Photographie, welches einen sehr großen Bildwinkel (gewöhnlich 80 ) abbilden kann. Hierfür muss das Bild

Mehr

TEMA Technik und Management

TEMA Technik und Management TEMA Technik und Management Aktualisierung: wöchentlich Berichtszeitraum: 1988 ff (TEMA-Archiv seit 1968) Informationsanbieter: FIZ Technik e.v. Datenbanktyp: Bibliographische Datenbank Inhaltsbeschreibung:

Mehr

Thema 8: Verbesserte Suchstrategien im WWW. Bearbeiter: Robert Barsch Betreuer: Dr. Oliver Ernst

Thema 8: Verbesserte Suchstrategien im WWW. Bearbeiter: Robert Barsch Betreuer: Dr. Oliver Ernst Thema 8: Verbesserte Suchstrategien im WWW Bearbeiter: Robert Barsch Betreuer: Dr. Oliver Ernst Inhaltsverzeichnis 1. Einleitung 2. Grundlagen 3. Google PageRank Algorithmus 4. IBM Clever HITS Algorithmus

Mehr

Problemlösen. Zahl Ebene und Raum Größen Daten und Vorhersagen. Fachsprache, Symbole und Arbeitsmittel anwenden

Problemlösen. Zahl Ebene und Raum Größen Daten und Vorhersagen. Fachsprache, Symbole und Arbeitsmittel anwenden Curriculum Mathematik 3. Klasse Aus den Rahmenrichtlinien Die Schülerin, der Schüler kann Vorstellungen von natürlichen, ganzen rationalen Zahlen nutzen mit diesen schriftlich im Kopf rechnen geometrische

Mehr

Vorkurs: Mathematik für Informatiker

Vorkurs: Mathematik für Informatiker Vorkurs: Mathematik für Informatiker Teil 4 Wintersemester 2018/19 Steven Köhler mathe@stevenkoehler.de mathe.stevenkoehler.de 2 c 2018 Steven Köhler Wintersemester 2018/19 Inhaltsverzeichnis Teil 1 Teil

Mehr

1. Anmeldung, Testmodus und Vollmodus

1. Anmeldung, Testmodus und Vollmodus Willkommen zur Tour durch IT-Servicemanagement online IT-Servicemanagement online ist so gestaltet, dass Sie sich auch ohne Anleitung direkt zurechtfinden können. Wenn Sie sich jedoch einen Gesamteindruck

Mehr

Volltextsuche und Text Mining

Volltextsuche und Text Mining Volltextsuche und Text Mining Seminar: Einfuehrung in die Computerlinguistik Dozentin: Wiebke Petersen by Rafael Cieslik 2oo5-Jan-2o 1 Gliederung 1. Volltextsuche 1. Zweck 2. Prinzip 1. Index 2. Retrieval

Mehr

Fit für die Projektarbeit. Literaturrecherche leicht gemacht!

Fit für die Projektarbeit. Literaturrecherche leicht gemacht! Fit für die Projektarbeit Literaturrecherche leicht gemacht! Die thematische Literaturrecherche Schneeballsystem Ihnen ist eine gute Quelle bereits bekannt Sie werten nun das Literaturverzeichnis aus und

Mehr

Übungen zu gewöhnlichen Differentialgleichungen Lösungen zu Übung 23

Übungen zu gewöhnlichen Differentialgleichungen Lösungen zu Übung 23 Übungen zu gewöhnlichen Differentialgleichungen Lösungen zu Übung 3 3.1 Gegeben sei die Anfangswertaufgabe (AWA) Zeigen Sie, dass die Funktion y (x) = x y(x) mit y(0) = 1 die einzige Lösung dieser AWA

Mehr

ADDIEREN UND SUBTRAHIEREN VON TERMEN POTENZSCHREIBWEISE

ADDIEREN UND SUBTRAHIEREN VON TERMEN POTENZSCHREIBWEISE ADDIEREN UND SUBTRAHIEREN VON TERMEN UND DIE POTENZSCHREIBWEISE ) VARIABLE Beispiel: Ein Rechteck habe einen Umfang von 0 cm. Gib Länge und Breite des Rechtecks in einer Formel an. Es ist natürlich leicht

Mehr

4. Kompetenzorientierter Unterricht im Fach Mathematik

4. Kompetenzorientierter Unterricht im Fach Mathematik 4. Kompetenzorientierter Unterricht im Fach Mathematik 4.1 Bildungsstandards und Kompetenzstrukturmodell 4.2 Voraussetzungen für die Entwicklung mathematischer Kompetenzen 4.3 Klassifizierung von Aufgaben

Mehr

SEITE NEU ANLEGEN & SEITEN BEARBEITEN

SEITE NEU ANLEGEN & SEITEN BEARBEITEN SEITE NEU ANLEGEN & SEITEN BEARBEITEN Nachdem Sie auf "Seite erstellen" oder auf "Bearbeiten" geklickt haben, erscheint das Formular mit dem Sie die Seiten bearbeiten können. Die Herangehensweise ist bei

Mehr

I N T E R N E T. Einsteigerkurs. Teil 6 Suchmaschinen

I N T E R N E T. Einsteigerkurs. Teil 6 Suchmaschinen I N T E R N E T Einsteigerkurs Teil 6 Definition(Wikipedia) Teil 6 Was ist eine Suchmaschine? Eine Suchmaschineist ein Programm zur Recherche von Dokumenten, die in einem Computer oder einem Computernetzwerk

Mehr

Unterrichtsmaterialien in digitaler und in gedruckter Form. Auszug aus: Bruchgleichungen: Diagnosematerial, Übungsmaterial und Vertiefungsmaterial

Unterrichtsmaterialien in digitaler und in gedruckter Form. Auszug aus: Bruchgleichungen: Diagnosematerial, Übungsmaterial und Vertiefungsmaterial Unterrichtsmaterialien in digitaler und in gedruckter Form Auszug aus: Bruchgleichungen: Diagnosematerial, Übungsmaterial und Vertiefungsmaterial Das komplette Material finden Sie hier: School-Scout.de

Mehr

1 Boolesches Retrieval (2)

1 Boolesches Retrieval (2) 2. Übung zur Vorlesung Internet-Suchmaschinen im Sommersemester 2009 mit Lösungsvorschlägen Prof. Dr. Gerd Stumme, M.Sc. Wi-Inf. Beate Krause 06. Mai 2009 1 Boolesches Retrieval (2) Eine Erweiterung des

Mehr

Kapitel IR:II. II. Grundlagen des Information Retrieval. Retrieval-Evaluierung Indexterme

Kapitel IR:II. II. Grundlagen des Information Retrieval. Retrieval-Evaluierung Indexterme Kapitel IR:II II. Grundlagen des Information Retrieval Retrieval-Evaluierung Indexterme IR:II-1 Basics STEIN 2005-2010 Batch-Mode-Retrieval einmaliges Absetzen einer Anfrage; nur eine Antwort wird geliefert

Mehr

Rekursionsbäume Aufstellen eines Baumes dessen Knoten die Laufzeit auf jeder Rekursionsstufe darstellen und Aufsummieren

Rekursionsbäume Aufstellen eines Baumes dessen Knoten die Laufzeit auf jeder Rekursionsstufe darstellen und Aufsummieren Algorithmen und Datenstrukturen 74 3 Rekursionen Vor allem bei rekursiven Algorithmen besitzt die Laufzeitfunktion eine naheliegende rekursive Formulierung, d.h. die Laufzeitfunktion ist konstant für den

Mehr

Gottlieb Duttweiler Lehrstuhl für Internationales Handelsmanagement. Für die Erstellung von Bachelor-Arbeiten massgeblich ist das allgemeine Merkblatt

Gottlieb Duttweiler Lehrstuhl für Internationales Handelsmanagement. Für die Erstellung von Bachelor-Arbeiten massgeblich ist das allgemeine Merkblatt Gottlieb Duttweiler Lehrstuhl für Internationales Handelsmanagement Für die Erstellung von Bachelor-Arbeiten massgeblich ist das allgemeine Merkblatt für Bachelor-Arbeiten, das unter http://www.unisg.ch

Mehr

Partialbruchzerlegung

Partialbruchzerlegung Partialbruchzerlegung Lucas Kunz 27. Januar 207 Inhaltsverzeichnis Theorie 2. Definition.................................... 2.2 Nullstellen höheren Grades........................... 2.3 Residuen-Formel................................

Mehr

- 1 - angeführt. Die Beschleunigung ist die zweite Ableitung des Ortes x nach der Zeit, und das Gesetz lässt sich damit als 2.

- 1 - angeführt. Die Beschleunigung ist die zweite Ableitung des Ortes x nach der Zeit, und das Gesetz lässt sich damit als 2. - 1 - Gewöhnliche Differentialgleichungen Teil I: Überblick Ein großer Teil der Grundgesetze der Phsik ist in Form von Gleichungen formuliert, in denen Ableitungen phsikalischer Größen vorkommen. Als Beispiel

Mehr

Vorkurs: Mathematik für Informatiker

Vorkurs: Mathematik für Informatiker Vorkurs: Mathematik für Informatiker Teil 4 Wintersemester 018/19 Steven Köhler mathe@stevenkoehler.de mathe.stevenkoehler.de c 018 Steven Köhler Wintersemester 018/19 Inhaltsverzeichnis Teil 1 Teil Teil

Mehr

1. Grundlegende Konzepte der Informatik

1. Grundlegende Konzepte der Informatik 1. Grundlegende Konzepte der Informatik Inhalt Algorithmen Darstellung von Algorithmen mit Programmablaufplänen Beispiele für Algorithmen Aussagenlogik Zahlensysteme Kodierung Peter Sobe 1 Aussagenlogik

Mehr

Wissenschaftliches Arbeiten und Informationskompetenz in den Wirtschaftswissenschaften (2a)

Wissenschaftliches Arbeiten und Informationskompetenz in den Wirtschaftswissenschaften (2a) Wissenschaftliches Arbeiten und Informationskompetenz in den Wirtschaftswissenschaften (2a) Schlüsselqualifikationen für Bachelor-Studierende (Ergänzungsbereich Modul E1) SoSe 2011 Alexander Holste / Schreibwerkstatt/Universitätsbibliothek

Mehr

Lineargleichungssysteme Einsetzungsverfahren

Lineargleichungssysteme Einsetzungsverfahren Lineargleichungssysteme Einsetzungsverfahren Wolfgang Kippels 21. Juni 2017 Inhaltsverzeichnis 1 Vorwort 3 2 Lineargleichungssysteme mit zwei Variablen 4 3 Einsetzungsverfahren bei mehr als zwei Variablen

Mehr

3.1 Sukzessive Minima und reduzierte Basen: Resultate

3.1 Sukzessive Minima und reduzierte Basen: Resultate Gitter und Codes c Rudolf Scharlau 4. Juni 2009 202 3.1 Sukzessive Minima und reduzierte Basen: Resultate In diesem Abschnitt behandeln wir die Existenz von kurzen Basen, das sind Basen eines Gitters,

Mehr

Suchen mit der Suchmaschine

Suchen mit der Suchmaschine Suchen mit der Suchmaschine Links einiger Suchmaschinen http://www.google.ch/ http://search.bluewin.ch http://www.altavista.de http://www.fireball.de http://www.metacrawler.de/ http://www.msn.ch Lexikon:

Mehr

Appendix C. Anhang gemäß Promotionsordnung

Appendix C. Anhang gemäß Promotionsordnung Appendix C Anhang gemäß Promotionsordnung 205 206 Zusammenfassung Die Markup-Sprache XML ist ein weithin akzeptierter Standard zur Darstellung von Daten. Je mehr Daten in Form von XML-Dokumenten vorliegen,

Mehr

Vektoren. Vektorrechnung

Vektoren. Vektorrechnung Vektoren Dieser Text behandelt das Thema Vektoren, sowei es die gymnasiale Oberstufe betrifft. Vektoren können mehr als das, aber das würde in diesem Überblich zu weit führen. Ein großes Defizit der meisten

Mehr

1 Information Retrieval Grundlagen

1 Information Retrieval Grundlagen 1. Übung zur Vorlesung Internet-Suchmaschinen im Wintersemester 2007/2008 mit Lösungsvorschlägen Dr. Andreas Hotho, Prof. Dr. Gerd Stumme, M.Sc. Wi-Inf. Beate Krause 01. November 2007 1 Information Retrieval

Mehr

Eine zentrale Recherche-Plattform für Bibliotheksressourcen

Eine zentrale Recherche-Plattform für Bibliotheksressourcen Bibliothek und Archiv der Technischen Universität Graz Mai 2014 Eine zentrale Recherche-Plattform für Bibliotheksressourcen http://tugraz.summon.serialssolutions.com/ Seit Dezember 2012 bietet die TU Graz

Mehr

RIS-ABFRAGEHANDBUCH AMTLICHE VETERINÄRNACHRICHTEN DES BM FÜR ARBEIT, SOZIALES, GESUNDHEIT UND KONSUMENTENSCHUTZ

RIS-ABFRAGEHANDBUCH AMTLICHE VETERINÄRNACHRICHTEN DES BM FÜR ARBEIT, SOZIALES, GESUNDHEIT UND KONSUMENTENSCHUTZ RIS-ABFRAGEHANDBUCH AMTLICHE VETERINÄRNACHRICHTEN DES BM FÜR ARBEIT, SOZIALES, GESUNDHEIT UND KONSUMENTENSCHUTZ 1 Überblick Seit 15. September 2004 werden die Amtliche Veterinärnachrichten (AVN) des Bundesministeriums

Mehr

Mit dem ipad. Webseiten aufrufen. Kapitel

Mit dem ipad. Webseiten aufrufen. Kapitel D3kjd3Di38lk323nnm Kapitel Mit dem ipad 6 Webseiten aufrufen Längst haben auch die Senioren das Internet für sich entdeckt. Es gibt so viele interessante Webseiten, auf denen Sie sich informieren oder

Mehr

Übersicht. Volltextindex Boolesches Retrieval Termoperationen Indexieren mit Apache Lucene

Übersicht. Volltextindex Boolesches Retrieval Termoperationen Indexieren mit Apache Lucene Übersicht Volltextindex Boolesches Retrieval Termoperationen Indexieren mit Apache Lucene 5.0.07 1 IR-System Peter Kolb 5.0.07 Volltextindex Dokumentenmenge durchsuchbar machen Suche nach Wörtern Volltextindex:

Mehr