3 So werden Suchergebnisse gewichtet

Größe: px
Ab Seite anzeigen:

Download "3 So werden Suchergebnisse gewichtet"

Transkript

1

2 3 So werden Suchergebnisse gewichtet Es ist schon lange einer meiner Grundsätze, dass die kleinsten Dinge bei Weitem die wichtigsten sind. Sir Arthur Conan Doyle, britischer Arzt und Kriminalautor Bevor Sie Ihre Seiten optimieren können, müssen Sie wissen, nach welchen Kriterien Suchmaschinen die Relevanz von Suchergebnissen bestimmen. Wie kommt es, dass eine Seite auf Platz 100 geführt wird, während die andere auf Platz 1 steht? Diese Aspekte sind nicht nur wichtig, sondern dazu auch noch interessant. Denn wer versteht, wie Suchmaschinen»ticken«, kann sie auch für seine eigenen Recherchen besser nutzen und so möglicherweise noch bessere Suchergebnisse erzielen. Im ersten Teil dieses Kapitels geht es um die Relevanzermittlung. Das sind die Kriterien nach denen Suchmaschinen festlegen, wie gut eine Seite einer Suchanfrage entspricht. Anschließend wird der Fokus auf den Page- Rank der Suchmaschine Google gerichtet und gezeigt, wie man mit einfacher Mathematik den Google-Algorithmus entschlüsseln 10 und das gewonnene Wissen für die Optimierung seiner eigenen Seite nutzen kann. 10 Zugegeben, völlig entschlüsselt wird er auch in diesem Buch nicht. Denn den genauen Algorithmus hält die Firma Google geheim.

3 Kapitel Statische Modelle Auf den folgenden Seiten erhalten Sie einen Überblick über die wichtigsten Information-Retrieval-Modelle. Wobei unter dem etwas»schwer«anmutenden Begriff Information-Retrieval nichts anderes als die Informationsbeschaffung beziehungsweise Informationswiedergewinnung verstanden wird Das boolesche Modell: Suchen mit Operatoren Im booleschen Modell wird streng nach dem Prinzip der exakten Übereinstimmung gearbeitet. Ein Dokument erscheint nur dann in der Ergebnisliste, wenn es den Suchbegriff exakt in der Form enthält, in der er eingegeben wurde. Das binäre Prinzip erlaubt nur die beiden Zustände 1 und 0. Wobei unter 1 (true) wahr und unter 0 (false) falsch zu verstehen ist. Mittelwerte wie ein möglicherweise gibt es nicht. Um Suchanfragen zu formulieren, stehen klassischerweise die drei Operatoren AND, NOT und OR zur Verfügung. In manchen Systemen kann zusätzlich der Operator XOR (ausschließendes Oder) verwendet werden. Was die einzelnen Operatoren bewirken, zeigt die folgende Tabelle: Beispiel Wort1 AND Wort2 Wort1 NOT Wort2 Wort1 OR Wort2 Wort1 XOR Wort2 Beschreibung Es werden nur Dokumente angezeigt, in denen Wort1 und Wort2 stehen. Das System zeigt ausschließlich Dokumente, die zwar Wort1 enthalten, in denen aber nicht Wort2 steht. In der Trefferliste erscheinen auch solche Dokumente, die entweder nur Wort1 oder nur Wort2 enthalten. Im Dokument muss entweder Wort1 oder Wort2 stehen. Tabelle 3.1: Die booleschen Operatoren am Beispiel erklärt Neben den Operatoren besteht die zusätzliche Möglichkeit der Klammersetzung, um so komplexere Suchanfragen abzugeben. In der Erweiterung des booleschen Modells stehen sogenannte Abstandsoperatoren zur Verfügung, über die sich die Treffermenge weiter einschränken lässt. Die meisten Suchmaschinen ermöglichen heute die Suche anhand boolescher Operatoren. Diese Suchvariante hat allerdings mehrere Nachteile: Viele, eigentlich relevante Dokumente, werden nicht gefunden, da sie die Anfrage nur teilweise erfüllen. Ein Ranking der Ergebnisse findet nicht statt. Die Relevanz der Begriffe innerhalb der Anfrage wird im Text nicht berücksichtigt. Für den»normalbürger«ist allein der Begriff boolescher Operator abschreckend und er kann mit NOT und AND nichts anfangen. 40

4 So werden Suchergebnisse gewichtet Für große Datenmengen, wie sie im Internet verfügbar sind, eignet sich das boolesche Modell somit weniger. Schließlich ist gerade dort die unterschiedliche Relevanzbeurteilung der Dokumente von enormer Bedeutung. Denn Dokumente werden in booleschen Systemen bereits dann als relevant eingestuft, wenn sie die Anfrage erfüllen. Der Grad der Relevanz spielt dabei keine Rolle. Hier setzen Suchmaschinen auf zusätzliche Methoden, wie relative Worthäufigkeit und Keyword-Nähe. Dazu aber später mehr. Das boolesche Modell bildet in den Suchmaschinen dennoch die Basis des Matchings. Dabei werden zunächst die relevanten Dokumente mithilfe des booleschen Modells ermittelt, bevor sie anschließend über verschiedene Rankingverfahren in die richtige Reihenfolge gebracht werden. Abbildung 3.1: Google ermöglicht die Suche mit booleschen Operatoren Unscharfe Suche mit der Fuzzy-Logik Das boolesche Modell liefert sehr oft äußerst umfangreiche Ergebnislisten und auch die Trennung der gefundenen Dokumente ist sehr streng. Entweder ist die Suchanfrage für ein Dokument wahr oder sie ist falsch. Ein möglicherweise oder vielleicht gibt es nicht. Hier setzt die Fuzzy-Logik an. Diese Methode lässt neben wahr und falsch auch abgestufte Werte zu. Für konventionelle Datenbanken und wissenschaftliche Systeme ist die Fuzzy-Logik durchaus interessant. Eine typische Abfrage einer Datenbank auf Fuzzy-Logik-Basis könnte zum Beispiel folgendermaßen aussehen: Stichwort 'seopard' UND 'heimat' Datum 'moeglichst nach 2005' Das System soll in diesem Beispiel auch solche Dokumente liefern, die kurz nach dem Jahr 2005 entstanden sind und in denen möglicherweise nur eines der beiden Stichwörter enthalten ist. 41

5 Kapitel 3 Für WWW-Suchmaschinen hat sich die Fuzzy-Logik allerdings nicht bewährt, da hier eine solche Ungenauigkeit nicht gewollt ist. Denn zwar kann man durch eine detaillierte Abstufung auf das Ranking der Dokumente in der Trefferliste Einfluss nehmen, andere Modelle sind dafür aber besser geeignet. Weiterführende Informationen Da das Fuzzy-Logik-Modell in den WWW-Suchmaschinen keine Rolle spielt, wurde es hier nur kurz angerissen. Interessant ist das Thema aber allemal. Ingo R. Homann hat eine Dissertation mit dem Titel»Fuzzy-Suchmethoden im Information-Retrieval«geschrieben, die allen interessierten Lesern unter zur Verfügung steht Ähnlichkeitensuche mit dem Vektorraummodell Es ist durchaus ein Problem, wenn Modelle ausschließlich auf der Basis der exakten Übereinstimmung zwischen Suchbegriff und Dokument arbeiten. Auf diese Nachteile die natürlich auch und vor allem für WWW-Suchmaschinen äußerst relevant sind wurde bereits hingewiesen. Das größte Problem für WWW-Suchmaschinen ist aber zweifellos, dass durch rein boolesche Verfahren viele irrelevante Dokumente gefunden werden, in denen der Suchbegriff zwar enthalten ist, dort aber in einem völlig anderen Kontext steht, als vom Suchenden erwartet. Andererseits werden relevante Dokumente unterschlagen, nur weil in ihnen der Suchbegriff nicht in exakt der gleichen Form steht, wie er in die Suchanfrage eingegeben wurde. Das Vektorraummodell versucht diese Problematik zu umgehen, indem nicht mehr nach exakten Übereinstimmungen zwischen Suchbegriff und Dokument, sondern nach Ähnlichkeiten zwischen Dokument und Suchanfrage oder zwischen mehreren Dokumenten gesucht wird. Dazu werden die Suchanfrage und die Stichwörter der Dokumente in Vektoren umgewandelt. Anschließend wird berechnet, in welcher Nähe sich die Vektoren zueinander befinden. Realisiert wird dies anhand eines durch die Terme aufgespannten vieldimensionalen Vektorraums, in dem jeder Term eine Dimension darstellt. Bei zwei Termen besitzt der Vektor zwei Dimensionen, bei drei Termen drei Dimensionen und so weiter. Jedes Dokument wird durch einen Vektor repräsentiert, in dem alle für die Indexierung verwendeten Deskriptoren enthalten sind. Berechnet man den Kosinus des Winkels zwischen zwei Dokumenten beziehungsweise zwischen einer Suchanfrage und einem Dokument, lässt sich so deren Ähnlichkeit berechnen. Dabei gilt: Je kleiner der Winkel, umso ähnlicher sind sich Suchanfrage und Dokument. Das folgende Beispiel soll diesen Aspekt verdeutlichen. In einem Dokument steht unter anderem folgender Text: Es gibt im Zoo nur einen Seopard. Der andere Seopard ist weg. 42

6 So werden Suchergebnisse gewichtet Aus diesem Text werden bei der Stoppwort-Erkennung 11 bereits zahlreiche Terme entfernt. Übrig bleiben Zoo und Seopard. In diesem Beispiel erhält man also einen zweidimensionalen Vektor. DV = (1,2) Dabei kommt der Term Zoo einmal, der Term Seopard zweimal vor. Der so ermittelte Vektor wird für jedes indexierte Dokument berechnet. Allerdings sollen die Dokumente nicht untereinander, sondern mit einem von einem Benutzer eingegebenen Suchbegriff verglichen werden. Eine typische Suchanfrage könnte folgendermaßen aussehen: Wo ist der Seopard? Auch hier würden wieder die Stoppwörter entfernt werden, wodurch am Ende der Term Seopard in einen zweidimensionalen Vektor umgewandelt wird. SV = (0,1) Für die Dimensionen, die keine Entsprechung in der Suchanfrage haben, wird eine Null eingetragen. Bei der Berechnung der Ähnlichkeit werden anstelle der tatsächlichen Begriffsanzahl die beiden Zustände vorhanden und nicht vorhanden verwendet. Normalisiert man den Dokumentvektor (1,2) binär, ergibt sich für ihn der Vektor (1,1). DV = (1,1) SV = (0,1) Je näher sich diese beiden Kosinus-Werte sind, umso exakter passt das Dokument zur Suchanfrage. Das Vektorraummodell hat den Vorteil, dass der Benutzer nicht mit Operatoren hantieren muss und somit problemlos damit zurechtkommt. Allerdings hat das Modell auch einige Nachteile. So wird zum Beispiel davon ausgegangen, dass die eingegebenen Suchbegriffe voneinander völlig unabhängig sind. Und auch was für Anfänger möglicherweise ein Vorteil ist, ist für erfahrene Anwender eher schlecht, nämlich das Fehlen von Operatoren. Will man eine wirklich sinnvolle Anfrage stellen, muss man vergleichsweise viele Suchbegriffe angeben. > > > HINWEIS Aus Sicht der Suchmaschinen ist das Vektorraummodell dahingehend interessant, dass mit ihm das Ranking nach Relevanz der Treffer eingeführt wurde. Das führt dazu, dass man in Suchmaschinen die relevantesten Treffer auf den vorderen Ranking-Plätzen angezeigt bekommt. 11 Stoppwörter sind Wörter, die nur eine geringe oder gar keine inhaltliche Bedeutung für den Text haben. 43

7 Kapitel Probabilistisches Modell: Das relativ beste Suchergebnis Bei diesem Modell wird davon ausgegangen, dass aufgrund der natürlichen Sprache nicht garantiert werden kann, dass ein Dokument für eine Suchanfrage tatsächlich relevant ist. Vielmehr wird immer nur die relativ beste Lösung präsentiert und im Allgemeinen existiert keine eindeutig beste Lösung. Die Grundfrage beim probabilistischen Modell lautet somit: Wie groß ist die Wahrscheinlichkeit, dass ein Dokument für eine Anfrage als relevant eingeschätzt wird? Würde man für alle Dokumente diese Wahrscheinlichkeit kennen, könnte man die Dokumente anhand dieser Wahrscheinlichkeit sortieren und die mit der größten Wahrscheinlichkeit ausgeben. Allerdings ist die Wahrscheinlichkeit nicht unmittelbar zugänglich, sodass sie nur geschätzt werden kann. Damit das gelingt, müssen die Dokumente und die Anfragen genauer untersucht sowie Vereinfachungen und Unabhängigkeitsannahmen gemacht werden. Im probabilistischen Modell wird die Relevanz eines Dokuments an der Ähnlichkeit zwischen Suchanfrage und Dokument gemessen. Wobei der Ähnlichkeitswert daran gemessen wird, wie oft der Suchbegriff im Dokument existiert. Kommt in einem Text das Wort Seopard zehnmal und in einem anderen Dokument zwanzigmal vor, ist das zweite Dokument der Suchanfrage ähnlicher. Und je ähnlicher ein Dokument, umso relevanter ist es für die Suchanfrage. Die Ausgabe der Trefferliste erfolgt in diesem Modell sortiert. Dabei wird ein Schwellenwert verwendet, der festlegt, wie hoch die Wahrscheinlichkeit der Relevanz sein muss, damit das Dokument überhaupt in der Trefferliste erscheint. Die Sortierung der Trefferliste erfolgt letztendlich absteigend nach abnehmender Relevanz Relative Worthäufigkeit Bei dem Verfahren der relativen Worthäufigkeit oder Term Frequency (TF) wird davon ausgegangen, dass ein Wort beziehungsweise Term für ein Dokument umso wichtiger wird, je öfter es darin vorkommt. Im einfachsten Fall könnte man also die Häufigkeit TF berechnen, indem man überprüft, wie oft ein Wort innerhalb eines Textes existiert. Ein Beispiel soll diesen Aspekt verdeutlichen: Ein Dokument enthält 200 Wörter. In diesem Dokument taucht das Wort Bücher zehnmal auf. In diesem Fall müsste man davon ausgehen, dass der absolute TF-Wert 10 beträgt, schließlich steht das Wort Bücher zehnmal im Text. Allerdings offenbart dieses Verfahren seine Schwächen, wenn man die gleiche Berechnung auf ein längeres Dokument ansetzt. 44

8 So werden Suchergebnisse gewichtet Das Dokument enthält Wörter. Im Dokument steht zwanzigmal das Wort Bücher. In diesem Fall würde ein TF-Wert von 20 ermittelt werden. Dieses Dokument erhielte demnach ein höheres Gewicht. Nun kann man bei dieser Form der Berechnung davon ausgehen, dass längere Dokumente fast immer höher gewichtet werden. Denn die Wahrscheinlichkeit ist groß, dass in einem langen Text ein Suchterm häufiger als in einem kurzen Text vorkommt. Eine solche Betrachtung ist natürlich nicht praktikabel. Denn selbstverständlich könnten kürzere Dokumente durchaus relevanter als lange sein. Hier kommt das erweiterte Verfahren der relativen Worthäufigkeit zum Einsatz. Dabei setzt man die Häufigkeit des Wortvorkommens mit der Gesamtwortzahl des Dokuments ins Verhältnis. TF= Häufigkeit eines Worts im Dokument / Anzahl aller Wörter im Dokument Wendet man diese Formel auf das 10/200-Beispiel an, ergibt sich ein TF-Wert von 0,05. Für das zweite Dokument mit 20 vorkommenden Wörtern bei einer Gesamtlänge von Wörtern ergibt sich ein TF-Wert von 0,005. Die Bedeutung des ersten kürzeren Dokuments ist mit 0,05 demnach höher. Da man bei dieser Art der Berechnung sehr schnell mit sehr vielen Nullen arbeiten muss, wird in der Praxis meistens eine verfeinerte Formel angewendet, bei der mit logarithmischen Werten gearbeitet wird. Die entsprechende Formel sieht dann folgendermaßen aus: TF= log2 (Häufigkeit von t in d + 1) / log2 Gesamtanzahl der Wörter im Dokument Sie müssen die relative Worthäufigkeit übrigens nicht selbst ausrechnen. Im Internet gibt es zahlreiche Online-Tools, die das ermöglichen. Eines davon finden Sie unter Inverse Dokumenthäufigkeit Bislang ging es um die Relevanzbewertung einzelner Dokumente. Allerdings sind einzelne Dokumente normalerweise Teil einer größeren Dokumentensammlung. Bei der inversen Dokumenthäufigkeit (ITF-Algorithmus) geht man daher davon aus, dass ein Keyword umso höher bewertet wird, je seltener es in einem Dokument vorkommt, beziehungsweise umso niedriger, je häufiger es in anderen Dokumenten zu finden ist. Kommt beispielsweise der Begriff Bücher im gesamten Datenbestand sehr oft vor, dann eignet er sich nicht dazu, die einzelnen Dokumente voneinander zu unterscheiden. Die Formel des ITF-Algorithmus sieht folgendermaßen aus: IDF= log2 Gesamtzahl der Dokumente / Anzahl der Dokumente, in denen der Term vorkommt 45

9 Kapitel 3 Abbildung 3.2: Die Worthäufigkeit können Sie auch mit Online-Tools ermitteln. Bei der Ermittlung von Deskriptoren (Schlagwörtern) für Dokumente geht man heutzutage von folgenden Aspekten aus: Deskriptor-Gewicht bezogen auf das Dokument Besonders gute Deskriptoren kommen, auf die Gesamtlänge eines Dokuments bezogen, vergleichsweise häufig vor. Deskriptor-Gewicht bezogen auf die Dokumentsammlung Gute Deskriptoren sind innerhalb der Dokumentensammlung nur relativ selten enthalten. Die Formel zur Berechnung des Termgewichts sieht folgendermaßen aus: TG= TF x IDF Lage eines Terms Auch die Frage, wo sich ein Term innerhalb eines Dokuments befindet, fließt in die Relevanzbewertung mit ein. Bei diesem Gewichtungsverfahren wird davon ausgegangen, dass der Verfasser des Inhalts besonders relevante Schlüsselwörter eher an den Anfang des Dokuments stellt. Prinzipiell wird hier zwischen zwei Methoden unterschieden: Gewichtungsverfahren, die sich auf die absolute Position des Keywords im Dokument beziehen. Das sogenannte Proximity-Verfahren berücksichtigt den Abstand der Keywords untereinander. 46

10 So werden Suchergebnisse gewichtet Die exakte Position des Terms wird durch einen entsprechenden Parser ermittelt. Ein typisches Beispiel für die Bedeutung der Position eines Terms innerhalb eines Dokuments stellen HTML-Dateien dar. Die lassen sich zumindest grob gesagt in zwei Bereiche einteilen. <head> [...] </head> <body> [...] </body> Im Dokumentkopf sind unter anderem der Dokumenttitel in Form des <title>-tags und diverse Meta-Angaben enthalten. Der Inhalt des <title>-tags wird nicht gemeinsam mit dem Dokumentkörper ausgewertet. Denn schließlich kann man davon ausgehen, dass der Autor des Dokuments den Titel gerade deswegen so gewählt hat, weil er den Dokumentinhalt am besten beschreibt. Aus diesem Grund gewichten viele Suchmaschinen die Worte innerhalb des <title>-tags vergleichsweise hoch. Der Dokumenttext wird im <body>-bereich definiert. Bei der Gewichtung der Inhalte nimmt man an, dass inhaltsrelevante Terme vor allem zu Beginn von Dokumenten verwendet werden. Denn schließlich will der Autor seinen Lesern gleich am Anfang mitteilen, was auf ihn in den folgenden Abschnitten zukommt. Allerdings greift die allgemeine Formel, dass alles was am Dokumentanfang steht, besonders wichtig ist, nicht immer. Denn letztendlich hängt das natürlich auch vom Stil des Autors ab. Will der Verfasser zum Beispiel einen Spannungsbogen aufbauen, tauchen die relevanten Terme höchstwahrscheinlich nicht am Dokumentanfang auf. Aus diesem Grund schwächt man dieses restriktive Verfahren ab. Bei der Abschwächung werden die einzelnen Terme nicht mehr in eine Reihenfolge gebracht, sondern man teilt den Text in verschiedene Klassen auf. So werden beispielsweise Keywords, die sich innerhalb der ersten 50 Wörter befinden, höher bewertet, als solche Schlüsselwörter, die innerhalb der Wörter 51 bis 100 stehen. Viele Nutzer von Suchmaschinen suchen längst nicht mehr nach nur einem Wort, sondern geben zwei oder mehr Schlüsselwörter ein. Vor diesem Hintergrund spielt das Proximity-Verfahren eine immer wichtigere Rolle. Dabei geht man davon aus, dass zwei sehr nah beieinander stehende Wörter, den Text eher abbilden, als Wörter, die weiter auseinander stehen Der URL Zusätzlich zu dem Text des Dokumentkopfes und -körpers werden weitere Daten ausgewertet. Dazu gehört unter anderem auch der URL. So wird untersucht, ob ein URL Schlüsselwörter enthält und damit für das Dokument eine höhere Relevanz ermittelt werden kann. Man kann zum Beispiel davon ausgehen, dass der URL 47

11 Kapitel 3 für das Wort Futter eine höhere Relevanz als der URL aufweist. Dieses Verfahren hat allerdings den Nachteil, dass natürlich vom URL allein noch längst nicht auf den tatsächlichen Inhalt des Dokuments geschlossen werden kann. Deswegen gilt auch hier, dass dies nur eines von mehreren Verfahren zur Relevanzbewertung ist. 3.2 Das Ranking und deren Faktoren Nachdem Sie einige wichtige Verfahren des Information-Retrieval kennengelernt haben, geht es nun darum, wie die Bewertung von Treffern vonstatten geht. Bildlich gesprochen behandelt dieser Abschnitt die Frage, woher die Suchmaschine weiß, welche Seite sie in der Trefferliste an Position 1 und welche an Position 112 setzen soll. Rankingverfahren sollen sicherstellen, dass in der Trefferliste die relevantesten Dokumente oben stehen. Kernpunkt hierfür sind die Rankingfaktoren. Dabei kann man davon ausgehen, dass alle Suchmaschinen prinzipiell auf die gleichen Faktoren setzen. Unterschiede ergeben sich lediglich aus der verschiedenartigen Gewichtung der einzelnen Faktoren. Es wird zwischen zwei Arten von Rankingfaktoren unterschieden: die anfrageabhängigen und die anfrageunabhängigen Faktoren. In Suchmaschinen werden beide Varianten eingesetzt. Zunächst ein Überblick der anfrageabhängigen Faktoren: Metatags Groß-/Kleinschreibung Hervorhebung von Begriffen durch HTML-Tags Sprache Ankertexte Position des Keywords innerhalb des Dokuments Reihenfolge der Suchbegriffe innerhalb der Suchanfrage Wortabstand Dokumentspezifische Wortgewichtung Inverse Dokumenthäufigkeit 48

12 So werden Suchergebnisse gewichtet Und hier die anfrageunabhängigen Faktoren: Kriterium Linkpopularität Aktualität Klickpopularität Anzahl der eingehenden Links Seitengröße Dokumentlänge Dateiformat Verzeichnisebene Auf die meisten der genannten Faktoren wird im weiteren Verlauf dieses Buchs noch ausführlich eingegangen. Allerdings kann bereits jetzt festgestellt werden, dass im Verlauf der letzten Jahre die Bedeutung der Linkstruktur enorm zugenommen hat. Damit ist die Zahl der auf das Dokument zeigenden Links ebenso wichtig, wie die Qualität der Seiten, von denen die Links stammen. 3.3 Der PageRank Ein entscheidendes Kriterium für die Relevanzbewertung von Dokumenten ist deren Verlinkung untereinander. Dabei wird davon ausgegangen, dass häufig verlinkte Seiten für die Benutzer besseren Inhalt bieten. Einen interessanten Einblick in die Verlinkung von Webseiten können Sie sich übrigens auf der Seite touchgraph.com/ TGGoogleBrowser.html verschaffen. Dort trägt man den URL der entsprechenden Webseite ein. Die grafische Aufbereitung zeigt anschließend, wie die Seiten jeweils untereinander verlinkt sind. Und genauso arbeitet Google. Denn der Erfolg von Google natürlich neben der Schnelligkeit ist vor allem auf den Einsatz des PageRank-Verfahrens zurückzuführen. Entwickelt wurde dieses Verfahren von Lawrence Page und Sergey Brin, die im Rahmen ihres Studiums so ganz nebenbei die Suchmaschine Google programmiert haben. Namenswirrwar Gemeinhin wird angenommen, dass der Name PageRank vom Wort Page, also Seite abgeleitet ist. Das ist so allerdings nicht korrekt. Vielmehr hat Lawrence Page den PageRank bescheidenerweise nach sich benannt. 49

13 Kapitel 3 Abbildung 3.3: So kommen Sie den Wirrungen des Webs auf den Grund. Es ist anzunehmen, dass das ursprüngliche PageRank-Verfahren im Laufe der Zeit mehrmals angepasst wurde. Das Grundprinzip ist allerdings gleich geblieben: Je mehr Seiten auf eine Webseite verweisen, umso höher ist das Gewicht der Seite. Und je größer das Gewicht der verweisenden Seiten, umso größer ist dieser Effekt. Auf diese Weise wird verhindert, dass automatisch generierte Webseiten, ohne in die Strukturen des WWW eingebunden zu sein, ganz oben in den Trefferlisten landen. 12 Die Linkpopularität Während der Entwicklung des WWW gab es viele Versuche, automatische Verfahren zur Bewertung von Dokumenten zu entwickeln. Eines der bekanntesten und auch heute noch von fast allen Suchmaschinen angelegten Kriterien für die Relevanz einer Seite ist das Vorkommen eines Suchbegriffs. Dabei spielen zusätzliche Aspekte wie Worthäufigkeit und Position des Schlüsselworts eine entscheidende Rolle. Informationen dazu haben Sie bereits eingangs dieses Kapitels erhalten. Dieses Verfahren allein genügt für eine Relevanzbeurteilung allerdings nicht, da es zu anfällig für Betrügereien (Doorway-Pages) ist. 12 Zumindest ist das die Grundidee. Denn längst haben Suchmaschinen-Spammer diesen Aspekt erkannt und verlinken ihre automatisch generierten Seiten untereinander. 50

14 So werden Suchergebnisse gewichtet Um sich gegen solche Manipulationsversuche zu wehren, setzten viele Suchmaschinen das Prinzip der Linkpopularität ein. Hier wird in die Relevanzbeurteilung einer Webseite auch die Anzahl der eingehenden Links als Kriterium aufgenommen. Dabei wird davon ausgegangen, dass ein Dokument umso wichtiger ist, je mehr eingehende Links es aufzuweisen hat. So gut das Prinzip anfangs auch gewesen sein mag, schnell reagierten Seitenbetreiber darauf und generierten automatisch Seiten die Links für Doorway-Pages enthielten. Das Konzept war somit gescheitert. Vorteile des PageRank-Verfahrens Während bei der Linkpopularität einfach die Anzahl der eingehenden Links genommen wird, geht das PageRank-Verfahren bei der Relevanzbewertung deutlich subtiler vor. Denn bei dem von Google entwickelten PageRank geht man davon aus, dass ein Dokument dann eine hohe Bedeutung hat, wenn andere wichtige Dokumente/Seiten auf dieses verweisen. Die Inhalte selbst spielen dabei zunächst keine Rolle. Erst wird ausschließlich die Vernetzung der Links untersucht. Wie wichtig eine Webseite ist, ergibt sich also aus der Bedeutsamkeit der auf sie verweisenden Seiten. Deren PageRank ergibt sich wiederum aus der Bedeutung von den Seiten, die auf sie verweisen. Die Wichtigkeit eines Dokuments ergibt sich demnach rekursiv aus der Bedeutsamkeit anderer Dokumente. Um den PageRank vor der Öffentlichkeit zu rechtfertigen bzw. ihn anschaulicher zu beschreiben, erfanden Page und Brin den sogenannten Random Surfer. Dieser typische Benutzer bewegt sich von einer Seite zur nächsten und nutzt dabei Hyperlinks, ohne auf deren Inhalt zu achten. Wie groß die Wahrscheinlichkeit ist, dass der Random Surfer einem bestimmten Link folgt, hängt damit ausschließlich von der Anzahl der auf der Seite vorhandenen Links ab. Demzufolge fließt die Anzahl der ausgehenden Links einer Seite ebenfalls mit in die Ermittlung des PageRanks ein Der PageRank-Algorithmus Wie sich der PageRank prinzipiell ermitteln lässt, haben Sie im vorherigen Abschnitt erfahren. Tatsächlich steckt dahinter ein vergleichsweise simpler Algorithmus. Details zum Algorithmus Wer sich für die originalen Texte von Page und Brin über den PageRank interessiert, der wird unter und unter html fündig. Der PageRank lässt sich mit einer rekursiven Formel berechnen. PR(A) = (1-d) + d (PR(T1)/C(T1) PR(Tn)/C(Tn)) 51

15 Kapitel 3 Dabei ist: PR(A) der PageRank der Seite. PR(Ti) der PageRank der Seiten, von denen der Link auf die Seite zeigt. C(Ti) die Gesamtzahl der Links auf der Seite Ti. d ein Dämpfungsfaktor. Nun mag diese Formel auf den ersten Blick etwas abstrakt erscheinen. Sie lässt sich aber auch wunderbar verbal wiedergeben. 1. Jede Seite des WWW wird mit einem Startwert initialisiert. Der tatsächliche Startwert spielt dabei keine Rolle, da der Algorithmus immer konvergiert. Die Wahl des Startwerts hat allerdings Einfluss darauf, wie schnell eine gute Konvergenz erzielt wird. 2. Berechnet wird der PageRank, in dem der PageRank der Seiten der ausgehenden Links ermittelt und dieser durch die Anzahl der ausgehenden Links geteilt wird. 3. Aus dem PageRank der eingehenden Links wird der PageRank neu berechnet. 4. Diese Punkte werden ab Schritt 2 so oft wiederholt, bis der PageRank aller Seiten konvergiert beziehungsweise sich ausreichend angenähert hat. Die iterative Berechnung des PageRanks Aufgrund der Größe des Webs sieht sich die Firma Google zur Anwendung eines iterativen Verfahrens für die Berechnung des PageRanks gezwungen. Dabei wird zunächst jeder Seite ein PageRank von 1 zugewiesen. Wobei die Höhe des Anfangswertes keinen Einfluss auf das Ergebnis hat, da dieses irgendwann konvergiert. Wie schnell, nach wie vielen Iterationen, es konvergiert, kann aber durchaus über einen gut gewählten Startwert beeinflusst werden. Anschließend wird der PageRank aller Seiten in mehreren Berechnungsrunden ermittelt. Wie eine solche näherungsweise Berechnung vonstatten geht, zeigt folgendes Beispiel, bei dem als Ausgangspunkt für den PageRank jeder Seite 1 angenommen wird. Iteration PR(A) PR(B) PR(C) Tabelle 3.2: Eine beispielhafte iterative Berechnung 52

16 So werden Suchergebnisse gewichtet Iteration PR(A) PR(B) PR(C) Tabelle 3.2: Eine beispielhafte iterative Berechnung (Fortsetzung) Dieses Beispiel zeigt, dass sich bereits nach sehr wenigen Iterationen eine sehr gute Näherung an die tatsächlichen Werte ergibt. Brin und Page geben für die PageRank- Berechnung des gesamten Webs etwa 100 Iterationen als ausreichend an Faktoren, die auf den PageRank Einfluss haben Der PageRank wird durch die verschiedensten Faktoren beeinflusst. Lawrence Page hat in der Patentschrift für den PageRank die folgenden potenziellen Einflussfaktoren angegeben: Die Position des Links innerhalb eines Dokuments. Die Distanz zwischen den Webseiten. Die Stärke der Hervorhebung eines Links. Die Aktualität der verweisenden Seite. Die Bedeutung der verweisenden Seite. Ob all diese Faktoren in die aktuellen PageRank-Berechnungen von Google einfließen, lässt sich nicht kontrollieren. Denn verständlicherweise hütet Google dieses Geheimnis bestens. Neben diesen Aspekten fließen allerdings drei weitere wichtige Faktoren in den PageRank mit ein, die auf den folgenden Seiten genauer untersucht werden sollen. Der Dämpfungsfaktor Den Random Surfer haben Sie bereits kennengelernt. Der folgt natürlich nicht jedem Link eines Dokuments, sondern ist nach einer gewissen Zeit gelangweilt und ruft daher eine beliebige andere Seite auf. Aus diesem Grund wird die Wahrscheinlichkeit, mit der ein Surfer ein neues Dokument aufruft, um einen bestimmten Faktor gedämpft. Dieser sogenannte Dämpfungsfaktor ist dann auch der Grund, warum der 53

17 Kapitel 3 PageRank nicht vollständig an ein Dokument weitergegeben wird, sondern sich auf die ausgehenden Links verteilt. In der Praxis wird oft von dem Dämpfungsfaktor 0,85 ausgegangen. Je höher der Wert, umso größer ist die Wahrscheinlichkeit, dass der Random Surfer die Links des Dokuments verfolgt und sich nicht gelangweilt abwendet. Der Effekt eingehender Links Jeder eingehende Link erhöht den PageRank der Seite. In gewisser Weise repräsentieren diese Links die Meinung anderer Seitenbetreiber zur eigenen Seite. Denn normalerweise wird nur ein Link auf eine Seite gesetzt, wenn diese auf irgendeine Weise für den verweisenden Seitenbetreiber interessant oder relevant ist. Betrachtet man den ursprünglichen Algorithmus PR(A) = (1-d) + d (PR(T1)/C(T1) PR(Tn)/C(Tn))..., könnte man davon ausgehen, dass jeder eingehende Link den PageRank der aktuellen Seite um d PR(X) / C(X) erhöht. Dabei ist PR(X) der PageRank der verlinkenden Seite und C(X) die Anzahl der ausgehenden Links. Allerdings kann eine Webseite, die einen zusätzlichen eingehenden Link erhält, selbst auch auf eine andere Seite verlinken. Diese Seite erhält dann ebenfalls einen höheren PageRank, den sie möglicherweise über Links an die Seite mit dem zusätzlichen eingehenden Link zurückgibt. Ein einfaches Beispiel soll den Effekt eingehender Links veranschaulichen: Abbildung 3.4: Einige aneinandergereihte Dokumente 54

18 So werden Suchergebnisse gewichtet Hier wird davon ausgegangen, dass es sich um eine Aneinanderreihung von Dokumenten handelt, die jeweils einen ausgehenden und, bis auf A, einen eingehenden Link besitzen. Ferner wird angenommen, dass der Dämpfungsfaktor 0,85 und der Startwert 1 beträgt. Der PageRank der jeweiligen Seiten lässt sich nun folgendermaßen berechnen: PR(A) = 0,15 PR(B) = 0,15 + 0,85 * PR(A) PR(C) = 0,15 + 0,85 * PR(B) PR(D) = 0,15 + 0,85 * PR(C) Als Ergebnis bekommt man die folgenden Werte: PR(A) 0,15 PR(B) 0,28 PR(C) 0,39 PR(D) 0,48 Eingehende Links erhöhen also den PageRank einer Seite. Demzufolge sollten Sie in Ihrem Webprojekt wenn es hierarchisch aufgebaut ist von den untergeordneten Seiten auf jeden Fall einen Link zur Startseite setzen. Neben einer hierarchischen Struktur gibt es auch Webseiten, die in Kreisform aufgebaut sind. Dabei besitzt jede Seite einen Link auf die nächste Seite. In diesem Fall wird der PageRank gleichmäßig auf alle Seiten verteilt. Ausgehende Links Da eingehende Links Einfluss auf den PageRank einer Seite haben, kann angenommen werden, dass dasselbe auch für ausgehende Links gilt. Dieser Aspekt soll ebenfalls anhand eines Beispiels veranschaulicht werden. Beide Webseiten bestehen aus jeweils zwei Seiten, die untereinander verlinkt sind. Jedes der Dokumente startet mit einem PageRank von 1. Dokument C wird ein ausgehender Link hinzugefügt. Legt man einen Dämpfungsfaktor von 0,85 zugrunde, kann der PageRank für die einzelnen Seiten folgendermaßen berechnet werden: PR(A) = 0,15 + 0,85 * (PR(C) / 2 + PR(B)) PR(B) = 0,15 + 0,85 * PR(A) PR(C) = 0,15 + 0,85 * PR(D) PR(D) = 0,15 + 0,85 * (PR(C) / 2) 55

19 Kapitel 3 Abbildung 3.5: Zwei Webseiten, die untereinander verlinkt sind Löst man diese Gleichungen auf, ergeben sich für die einzelnen Dokumente die folgenden Werte: PR(A) 1,66 PR(B) 1,56 PR(C) 0,43 PR(D) 0,33 Für beide Webseiten (Web 1 und Web 2) ergeben sich die folgenden PageRanks durch das Aufsummieren der Webseiten: PR(Webseite 1) 3,22 PR(Webseite 2) 0,76 Wie Sie sehen, ergibt die Summe aller Dokumente den aufsummierten PageRank aller Dokumente. In diesem Fall also 4. Das Hinzufügen von Links hat somit keinen Einfluss auf den aufsummierten PageRank des Webs. Zusätzlich ist zu erkennen, dass der gewonnene PageRank des verlinkten Dokuments exakt so groß sein muss, wie der PageRank-Verlust des verlinkenden Dokuments. Das Beispiel macht deutlich, dass das verlinkende Dokument deutlich an PageRank verliert. Auch dieser Effekt lässt sich wieder recht plausibel mit dem Verhalten des Random Surfers erklären. Denn mit jedem vorhandenen ausgehenden Link steigt die Wahrscheinlichkeit, dass der Besucher einem ausgehenden eher als einem internen Link folgt. Jeder ausgehende Link sorgt damit für ein Absinken des PageRanks der Seite. Um den PageRank der Seite hoch zu halten, könnte man nun natürlich davon ausgehen, dass man überhaupt keine ausgehenden Links definiert. Dieses Verhalten würde dann allerdings dem Hypertext-Prinzip des WWW entgegenstehen. Zudem 56

20 So werden Suchergebnisse gewichtet besteht durchaus die Möglichkeit, dass ausgehende Links die Bewertung der Webseite durch Google an anderer Stelle positiv beeinflussen. Denn ohne Zweifel werten qualitativ gute ausgehende Links die eigene Webseite auf. Immer wieder kommt es zu dem Problem der sogenannten Dangling Links. Das sind Links, die auf Dokumente verweisen, die selbst keine ausgehenden Links besitzen. In diesen Fällen versickert der PageRank gewissermaßen an diesen Stellen. Meistens verweisen Dangling Links auf solche Dokumente, die noch nicht von Suchmaschinen indexiert wurden. Das kann natürlich ganz unterschiedliche Gründe haben. So könnte der Seitenbetreiber selbst über eine Datei robots.txt bestimmt haben, dass die Seite von Suchmaschinen nicht erfasst werden soll. Ebenso könnte es sich aber auch um ein Dokument handeln, das in einem nur schwer zu indexierenden Format vorliegt. Ein Grund kann aber auch darin liegen, dass Google Dokumenttypen wie PDF- und Word- Dateien indexiert, die oft keine ausgehenden Links enthalten. Diese Aspekte weisen darauf hin, dass es nicht negativ bewertet wird, wenn eine Seite keine ausgehenden Links besitzt. Dangling Links beeinflussen den PageRank demnach nicht direkt. Vielmehr werden sie aus dem Modell entfernt, bis der PageRank berechnet ist. Bei der Entfernung von Dangling Links handelt es sich um einen iterativen Vorgang, da dabei wieder neue Dangling Links entstehen können. Nach Ende der PageRank-Berechnung wird auch den Dangling Links ein PageRank zugewiesen. Dabei werden ebenso viele Iterationen wie beim Entfernen der Dangling Links benötigt. Beim Entfernen der Dangling Links kann es passieren, dass sich der PageRank auf andere ausgehende Links verteilt. Allerdings kann dieser Effekt getrost vernachlässigt werden, da er lediglich marginale Auswirkungen hat. Die Auswirkungen der Anzahl der Seiten Der aufaddierte PageRank aller Seiten des Webs ist gleich der Anzahl der Webseiten. Daraus lässt sich direkt folgern, dass eine zusätzliche Seite den aufaddierten PageRank des Webs um 1 erhöht. Das ist logisch und wenig spektakulär. Viel interessanter ist es, welche Auswirkungen zusätzliche Seiten auf den PageRank einer ganz bestimmten Seite haben. Ein typisches Beispiel beantwortet diese Frage. Hier bilden die Seiten A, B und C ein Mini-Web, bei dem B und C die Unterseiten von A sind. Bei Dokument X handelt es sich um eine externe Webseite, bei der von einem PageRank von 10 ausgegangen wird und die auf A verweist. Legt man einen Dämpfungsfaktor von 0,85 zugrunde, ergeben sich die folgenden PageRank-Gleichungen: PR(A) = 0,15 + 0,85 * (10 + PR(B) + PR(C)) PR(B) = 0,15 + 0,85 * (PR(A) / 2) PR(C) = 0,15 + 0,85 * (PR(A) / 2) 57

21 Kapitel 3 Abbildung 3.6: Ein einfaches Mini-Web Löst man diese Gleichungen auf, ergibt das für die einzelnen Dokumente die folgenden Werte: PR(A) 32,23 PR(B) 13,85 PR(C) 13,85 Im nächsten Schritt wird dem Mini-Web das Dokument D hinzugefügt. Auch hier zunächst die Gleichungen zum Berechnen des PageRanks: PR(A) = 0,15 + 0,85 * (10 + PR(B) + PR(C) + PR(D)) PR(B) = 0,15 + 0,85 * (PR(A) / 3) PR(C) = 0,15 + 0,85 * (PR(A) / 3) PR(D) = 0,15 + 0,85 * (PR(A) / 3) Aufgelöst ergeben die Gleichungen die folgenden Werte: PR(A) 32,43 PR(B) 9,35 PR(C) 9,35 PR(D) 9,35 Der aufaddierte PageRank aller Dokumente steigt durch das Hinzufügen von D um den Faktor 1. Ebenso steigt der PageRank von Dokument A, wenn auch nur äußerst gering. Der PageRank der beiden Dokumente B und C sinkt hingegen erheblich. Grund hierfür: Der PageRank von A verteilt sich jetzt auf drei Dokumente. 58

22 So werden Suchergebnisse gewichtet Abbildung 3.7: Eine zusätzliche Seite ist hinzugekommen Den PageRank mit der Google-Toolbar ermitteln Die wohl einfachste und komfortabelste Möglichkeit, sich den PageRank seiner (oder einer konkurrierenden) Seite anzeigen zu lassen, ist die Verwendung der Google-Toolbar. Diese Browser-Erweiterung kann kostenlos über die Seite google.de/ installiert werden. Derzeit lässt sich die Toolbar in Verbindung mit Mozilla Firefox und dem Internet Explorer verwenden. Abbildung 3.8: So kann man sich ganz bequem den PageRank anzeigen lassen. 59

23 Kapitel 3 Nach der Installation stehen allerlei nützliche und weniger nützliche Optionen zur Verfügung. So kann man zum Beispiel die aktuelle Seite einer Rechtschreibprüfung unterziehen oder nach Nachrichtenartikeln suchen. All diese Funktionen sind selbsterklärend. Viel interessanter zumindest aus Sicht dieses Buches ist jedoch die Möglichkeit, sich den PageRank der gerade aufgerufenen Seite anzeigen zu lassen. Visualisiert wird der PageRank über eine Skala von 1 bis 10. Anders als gemeinhin angenommen, wird damit allerdings nicht der tatsächliche PageRank widergespiegelt. Ein in der Toolbar angezeigter Wert von 9 bedeutet demnach keinesfalls, dass die Seite einen PageRank von 9 hat. Google hält sich äußerst bedeckt damit, welche tatsächlichen Werte hinter der Anzeige der Toolbar stecken. Die folgende Tabelle enthält somit lediglich Schätzwerte, auf die man sich aber in diversen Foren und Diskussionen weitestgehend geeinigt hat. Und auch wenn die Zahlen nicht exakt stimmen (mögen): Ein guter Anhaltspunkt sind sie allemal. PageRank Angezeigter PageRank 0, bis bis bis bis bis bis bis bis bis ab Tabelle 3.3: Angezeigte und tatsächliche PageRanks Mittlerweile ist es ein offenes Geheimnis, dass der von der Toolbar angezeigte Page- Rank-Wert veraltet ist und nur sehr unregelmäßig aktualisiert wird. Hauptgrund dafür dürfte sicherlich sein, dass Google die zahllosen PageRank-Tools missfallen PageRank einkaufen Es dauert ziemlich lange, bis man auf legalem Weg einen annehmbaren PageRank erhält. Das gilt vor allem für solche Seiten, die nicht mit entsprechendem Content aufwarten können. Wer nicht so lange warten will, bis sich der PageRank auf natürliche Weise erhöht, der kann ihn einkaufen. Dabei kauft man natürlich nicht den PageRank direkt, sondern Links. Seitenbetreiber, von denen Sie diese sogenannten Backlinks erwerben, setzen einen Link auf Ihre Seiten, was dann den PageRank erhöht. 60

24 So werden Suchergebnisse gewichtet!!! ACHTUNG Bevor Sie sich allerdings dieser Methode bedienen, sollten Sie sich über einen Punkt im Klaren sein: Google weiß in aller Regel sehr gut darüber Bescheid, welche Seiten PageRanks im großen Stil einkaufen, und straft diese möglicherweise ab. Das Prinzip hinter dem PageRank-Kauf ist simpel. Denn der PageRank ist abhängig von Links. Und eben diese Links kann man kaufen oder mieten. Oft wird beim Einkaufen von diesen sogenannten Backlinks ausschließlich auf den PageRank der betreffenden Seite geachtet. Darüber hinaus gibt es aber noch andere wichtige Faktoren zu beachten: Platzierung Viele Anbieter verkaufen Links, die auf jeder Unterseite an der gleichen Stelle (oft im Footer) erscheinen. Solche Links werden von Suchmaschinen meistens recht schnell erkannt und fließen in die Berechnung des PageRanks nicht mit ein. Sprache Wer eine deutschsprachige Webseite betreibt, sollte normalerweise nur deutschsprachige Backlinks einkaufen. Denn natürlich wissen die Suchmaschinen- Betreiber, dass die Wahrscheinlichkeit, dass eine englische auf eine deutsche Seite verweist, relativ gering ist. PageRank-Vererbung Bemerkt Google, dass eine Webseite massenhaft Links verkauft, vererbt diese Seite keinen PageRank mehr. Ob eine Seite bereits auf diese Weise abgestraft wurde, kann man überprüfen. Dazu kontrolliert man, ob Seiten, die seit längerer Zeit einen Link von der entsprechenden Seite haben, bereits einen PageRank besitzen. Ist dieser lediglich um 1 oder 2 Punkte niedriger als der der linkgebundenen Seite, ist die Seite aus PageRank-Sicht wertlos. Ist das nicht der Fall, sollten Sie den Link von dort nicht kaufen. Es gibt verschiedene Anbieter, bei denen Sie Links kaufen und verkaufen 13 können. Eine der auf dem deutschen Markt bekanntesten Plattformen ist LinkLift ( Die bei LinkLift angebotenen Links sind thematisch geordnet und können wie in einem Online-Shop eingekauft werden. Die Preise für Backlinks variieren natürlich sehr stark. So bekommen Sie Backlinks zum Beispiel schon für 5 Euro. Je nach Thema und Qualität der Seite kann man aber durchaus schon einmal mehrere Hundert Euro investieren. 13 Der Verkauf von Links kann natürlich auch eine Option sein, schließlich ist auch das eine mögliche neue Einnahmequelle. 61

25 Kapitel 3 Abbildung 3.9: Hier können Sie Backlinks kaufen und verkaufen. Nun ist LinkLift natürlich längst nicht der einzige Anbieter. Wer Links von englischsprachigen Seiten einkaufen möchte, wird hier fündig. (Bitte beachten Sie die vorherigen Hinweise, dass Sie mit englischen Backlinks vorsichtig umgehen sollten.) Auf dieser Webseite werden Textlinks angeboten. Aufgenommen werden nur Seiten mit einem PageRank ab 3. Auch hier sind die Angebote thematisch geordnet und die Links lassen sich ganz einfach buchen.!!! ACHTUNG Bleibt das Einkaufen von Links in einem annehmbaren Rahmen, ist dagegen sicherlich nichts einzuwenden. Unbedingt ist aber darauf zu achten, dass man sich damit trotzdem noch in solchen Gefilden bewegt, dass die Suchmaschinen nicht misstrauisch werden. Wer ausschließlich auf gekaufte Backlinks setzt, wird schnell auffliegen und möglicherweise abgestraft. 3.4 Klickpopularität oft angeklickt = gute Seite? Die bisher gezeigten Rankingverfahren werden automatisch auf Seiten der Suchmaschinen-Software ausgeführt. Über die Klickpopularität wird hingegen der Benutzer aktiv in das Rankingverfahren mit einbezogen. Nicht mehr der Algorithmus der Such- 62

26 So werden Suchergebnisse gewichtet maschine hat Vorrang, sondern es wird hauptsächlich das Verhalten des Benutzers ausgewertet. Bei der Klickpopularität wertet die Suchmaschine zunächst einmal aus, wie lange ein Benutzer auf der Zielwebseite verweilt, bis er zur Trefferliste zurückkehrt. Sieht er sich die Seite nur kurz an, geht die Suchmaschine davon aus, dass die Seite für das Suchwort nicht relevant ist, und setzt deren Relevanz herunter. > > > HINWEIS Das Prinzip klingt gut, hat aber bei genauerer Betrachtung deutliche Schwächen. Denn der menschliche Benutzer verhält sich eben nicht immer so logisch, wie es Suchmaschinen gerne hätten. So ist es Ihnen sicherlich auch schon passiert, dass Sie auf eine Seite gekommen sind, die zwar nicht Ihre Erwartungen hinsichtlich des eingegebenen Suchbegriffs erfüllt hat, auf der Sie aber trotzdem lange gelesen haben, weil Sie sie aus anderen Gründen interessant fanden. Die Suchmaschine würde dieser Seite, auch wenn sie nicht zu dem eigentlichen Thema passt, gut bewerten. Das Problem der Klickpopularität liegt damit auf der Hand: Das Verhalten jedes Benutzers wird nach dem gleichen Prinzip bewertet. Viele Suchmaschinen wie Yahoo! und Lycos haben das Click-Popularity-Verfahren in den letzten Jahren eingesetzt, sind aber weitestgehend wieder davon abgerückt. Google hielt von Anfang an nichts von diesem Verfahren und ließ es überhaupt nicht mit in die Bewertung der Suchtreffer einfließen. 3.5 Clustering (Googles»Ähnliche Seiten«-Funktion) Die letzte der hier vorgestellten Rankingmethoden steht nicht umsonst an letzter Stelle. Der Grund dafür ist, dass sich das Clustering-Verfahren von den übrigen Rankingmethoden grundsätzlich unterscheidet. Am besten lässt sich Clustering anhand eines Beispiels erklären. Gibt man bei Google den Suchbegriff Addison-Wesley ein, wird zunächst die ganz normale Trefferliste angezeigt. Die Ergebnisse weisen keine Besonderheiten auf. So weit, so unspektakulär. Interessant ist allerdings der zu jedem Treffer angezeigte Link Ähnliche Seiten. Klickt man diesen an, kann man sich den Cluster zu dem betreffenden Eintrag anzeigen lassen. Im Fall des Suchbegriffs Addison-Wesley sind das andere Verlage. Wie aber kommt Google darauf, dass Seiten von Hanser, Markt und Technik und O Reilly Ähnlichkeit mit den Addison-Wesley-Seiten haben? Google ordnet alle auf die Suchanfrage Addison-Wesley gefundenen Seiten in Dokumentgruppen, die einander ähnlich sind. Welche Seite in welche Gruppe kommt, wird anhand einer Ähnlichkeitsberechnung ermittelt. Bei der werden die Eigenschaften und Inhalte der Dokumente miteinander verglichen. Alle Dokumente, die in hohem Maße ähnlich sind, befinden sich nach der Analyse in einem Cluster. Bei Google basiert die Clusterbildung auf der Linkstruktur. Dabei wird die ausgewählte Seite zusammen mit den auf sie verweisenden Seiten in einem Cluster gesammelt. Dokumente können dabei in unterschiedlichen Clustern liegen. 63

27 Kapitel 3 Abbildung 3.10: Bei dieser Suchanfrage war nichts anderes zu erwarten. Abbildung 3.11: Diese Seiten, findet Google, sind denen von Addison Wesley ähnlich. Nun ist Google längst nicht die einzige Suchmaschine, die das Cluster-Verfahren einsetzt. Und während bei Google das Clustering eine eher untergeordnete Rolle spielt, ist es bei der Suchmaschine Clusty ( das zentrale Werkzeug. 64

28 So werden Suchergebnisse gewichtet Abbildung 3.12: Eine spezielle Cluster-Suchmaschine Clusty bietet drei Typen von Clustern: Topics (Themen), Sources (Quellen) und URLs. Die interessanteste und mit Abstand am schwierigsten zu implementierende Variante ist dabei die thematische Clusterbildung. Andere Suchmaschinen wie Google geben zwar vor, diese Technik zu beherrschen, dem ist aber meistens nicht so. So heißt bei Google der Cluster-Link zwar Ähnliche Seiten, allerdings werden darüber keine thematisch ähnlichen Seiten angezeigt. Bei Clusty werden allerdings auch die Nachteile einer thematischen Clusterung deutlich. Tauchen in den Zieldokumenten sehr oft Akronyme anstelle der ausgeschriebenen Begriffe auf, verwendet Clusty das Akronym auch für die Cluster-Bezeichnung. Das ist vor allem für diejenigen Benutzer ein Problem, die sich im thematischen Umfeld des eingegebenen Suchbegriffs nicht auskennen. Oft werden auch zu allgemeine Begriffe verwendet. So taucht bei der Eingabe des Suchbegriffs Addison-Wesley beispielsweise der Cluster ISBN, Smalltalk auf. Der ist im Allgemeinen nur wenig hilfreich. Um das zu verhindern, müssten umfangreiche Stoppwortlisten in den unterschiedlichsten Sprachen angelegt werden. Für die Suchmaschinen-Betreiber bedeutet das natürlich einen enormen Aufwand. 65

Ihr Weg in die Suchmaschinen

Ihr Weg in die Suchmaschinen Ihr Weg in die Suchmaschinen Suchmaschinenoptimierung Durch Suchmaschinenoptimierung kann man eine höhere Platzierung von Homepages in den Ergebnislisten von Suchmaschinen erreichen und somit mehr Besucher

Mehr

Suchmaschinenoptimierung

Suchmaschinenoptimierung Suchmaschinenoptimierung Oliver Hallmann SEO - Search Engine Optimization Plan B Unternehmer Stammtisch 31. August 2006 http://www.oliverhallmann.de http://www.planb-stammtisch.de Wie arbeitet Google?

Mehr

SEO Erfolg mit themenrelevanten Links

SEO Erfolg mit themenrelevanten Links Hinweis für Leser Dieser Leitfaden soll Ihnen einen Überblick über wichtige Faktoren beim Ranking und Linkaufbau liefern. Die Informationen richten sich insbesondere an Website-Betreiber, die noch keine

Mehr

Lineargleichungssysteme: Additions-/ Subtraktionsverfahren

Lineargleichungssysteme: Additions-/ Subtraktionsverfahren Lineargleichungssysteme: Additions-/ Subtraktionsverfahren W. Kippels 22. Februar 2014 Inhaltsverzeichnis 1 Einleitung 2 2 Lineargleichungssysteme zweiten Grades 2 3 Lineargleichungssysteme höheren als

Mehr

geben. Die Wahrscheinlichkeit von 100% ist hier demnach nur der Gehen wir einmal davon aus, dass die von uns angenommenen

geben. Die Wahrscheinlichkeit von 100% ist hier demnach nur der Gehen wir einmal davon aus, dass die von uns angenommenen geben. Die Wahrscheinlichkeit von 100% ist hier demnach nur der Vollständigkeit halber aufgeführt. Gehen wir einmal davon aus, dass die von uns angenommenen 70% im Beispiel exakt berechnet sind. Was würde

Mehr

Das große ElterngeldPlus 1x1. Alles über das ElterngeldPlus. Wer kann ElterngeldPlus beantragen? ElterngeldPlus verstehen ein paar einleitende Fakten

Das große ElterngeldPlus 1x1. Alles über das ElterngeldPlus. Wer kann ElterngeldPlus beantragen? ElterngeldPlus verstehen ein paar einleitende Fakten Das große x -4 Alles über das Wer kann beantragen? Generell kann jeder beantragen! Eltern (Mütter UND Väter), die schon während ihrer Elternzeit wieder in Teilzeit arbeiten möchten. Eltern, die während

Mehr

Stellen Sie bitte den Cursor in die Spalte B2 und rufen die Funktion Sverweis auf. Es öffnet sich folgendes Dialogfenster

Stellen Sie bitte den Cursor in die Spalte B2 und rufen die Funktion Sverweis auf. Es öffnet sich folgendes Dialogfenster Es gibt in Excel unter anderem die so genannten Suchfunktionen / Matrixfunktionen Damit können Sie Werte innerhalb eines bestimmten Bereichs suchen. Als Beispiel möchte ich die Funktion Sverweis zeigen.

Mehr

Zeichen bei Zahlen entschlüsseln

Zeichen bei Zahlen entschlüsseln Zeichen bei Zahlen entschlüsseln In diesem Kapitel... Verwendung des Zahlenstrahls Absolut richtige Bestimmung von absoluten Werten Operationen bei Zahlen mit Vorzeichen: Addieren, Subtrahieren, Multiplizieren

Mehr

Suchergebnisdarstellung in Google, Bing, Cuil, etc. Christina Ficsor

Suchergebnisdarstellung in Google, Bing, Cuil, etc. Christina Ficsor Suchergebnisdarstellung in Google, Bing, Cuil, etc. Christina Ficsor Allgemeines zu Suchmaschinen Was ist eine Suchmaschine? Ein Programm das die Suche nach Dokumenten/Webseiten im Internet durch die Eingabe

Mehr

Internet Kurs. Suchmaschinen

Internet Kurs. Suchmaschinen Internet Kurs Suchmaschinen M. Stalder Internetkurs M. Stalder 1 / 6 Suchmaschinen Suchmaschinen haben sich in letzter Zeit immer mehr zu einem unverzichtbaren Hilfsmittel entwickelt. Das Internet bietet

Mehr

- Google als Suchmaschine richtig nutzen -

- Google als Suchmaschine richtig nutzen - - Google als Suchmaschine richtig nutzen - Google ist die wohl weltweit bekannteste und genutzte Suchmaschine der Welt. Google indexiert und aktualisiert eingetragene Seiten in bestimmten Intervallen um

Mehr

4 Aufzählungen und Listen erstellen

4 Aufzählungen und Listen erstellen 4 4 Aufzählungen und Listen erstellen Beim Strukturieren von Dokumenten und Inhalten stellen Listen und Aufzählungen wichtige Werkzeuge dar. Mit ihnen lässt sich so ziemlich alles sortieren, was auf einer

Mehr

Diese Ansicht erhalten Sie nach der erfolgreichen Anmeldung bei Wordpress.

Diese Ansicht erhalten Sie nach der erfolgreichen Anmeldung bei Wordpress. Anmeldung http://www.ihredomain.de/wp-admin Dashboard Diese Ansicht erhalten Sie nach der erfolgreichen Anmeldung bei Wordpress. Das Dashboard gibt Ihnen eine kurze Übersicht, z.b. Anzahl der Beiträge,

Mehr

kleines keyword brevier Keywords sind das Salz in der Suppe des Online Marketing Gordian Hense

kleines keyword brevier Keywords sind das Salz in der Suppe des Online Marketing Gordian Hense Keywords sind das Salz in der Suppe des Online Marketing Keywords - Das Salz in der Suppe des Online Marketing Keyword Arten Weitgehend passende Keywords, passende Wortgruppe, genau passende Wortgruppe

Mehr

Web-Kürzel. Krishna Tateneni Yves Arrouye Deutsche Übersetzung: Stefan Winter

Web-Kürzel. Krishna Tateneni Yves Arrouye Deutsche Übersetzung: Stefan Winter Krishna Tateneni Yves Arrouye Deutsche Übersetzung: Stefan Winter 2 Inhaltsverzeichnis 1 Web-Kürzel 4 1.1 Einführung.......................................... 4 1.2 Web-Kürzel.........................................

Mehr

Primzahlen und RSA-Verschlüsselung

Primzahlen und RSA-Verschlüsselung Primzahlen und RSA-Verschlüsselung Michael Fütterer und Jonathan Zachhuber 1 Einiges zu Primzahlen Ein paar Definitionen: Wir bezeichnen mit Z die Menge der positiven und negativen ganzen Zahlen, also

Mehr

Mit suchmaschinenoptimierten Übersetzungen erfolgreich mit fremdsprachigen Webseiten

Mit suchmaschinenoptimierten Übersetzungen erfolgreich mit fremdsprachigen Webseiten 1 Mit suchmaschinenoptimierten Übersetzungen erfolgreich mit fremdsprachigen Webseiten 2 Für das Auffinden im Internet spielt die Suchmaschinenoptimierung eine wichtige Rolle. Je besser die Texte auf der

Mehr

Kapitel 3 Frames Seite 1

Kapitel 3 Frames Seite 1 Kapitel 3 Frames Seite 1 3 Frames 3.1 Allgemeines Mit Frames teilt man eine HTML-Seite in mehrere Bereiche ein. Eine Seite, die mit Frames aufgeteilt ist, besteht aus mehreren Einzelseiten, die sich den

Mehr

Inkrementelles Backup

Inkrementelles Backup Inkrementelles Backup Im Gegensatz zu einer kompletten Sicherung aller Daten werden bei einer inkrementellen Sicherung immer nur die Dateien gesichert, die seit der letzten inkrementellen Sicherung neu

Mehr

Kurzanleitung. MEYTON Aufbau einer Internetverbindung. 1 Von 11

Kurzanleitung. MEYTON Aufbau einer Internetverbindung. 1 Von 11 Kurzanleitung MEYTON Aufbau einer Internetverbindung 1 Von 11 Inhaltsverzeichnis Installation eines Internetzugangs...3 Ist mein Router bereits im MEYTON Netzwerk?...3 Start des YAST Programms...4 Auswahl

Mehr

Lineare Gleichungssysteme

Lineare Gleichungssysteme Lineare Gleichungssysteme 1 Zwei Gleichungen mit zwei Unbekannten Es kommt häufig vor, dass man nicht mit einer Variablen alleine auskommt, um ein Problem zu lösen. Das folgende Beispiel soll dies verdeutlichen

Mehr

Suchmaschinenalgorithmen. Vortrag von: Thomas Müller

Suchmaschinenalgorithmen. Vortrag von: Thomas Müller Suchmaschinenalgorithmen Vortrag von: Thomas Müller Kurze Geschichte Erste Suchmaschine für Hypertexte am CERN Erste www-suchmaschine World Wide Web Wanderer 1993 Bis 1996: 2 mal jährlich Durchlauf 1994:

Mehr

Premium Service für Suchmaschineneintrag - - Wir bringen Sie nach ganz vorne! -

Premium Service für Suchmaschineneintrag - - Wir bringen Sie nach ganz vorne! - Premium Service für Suchmaschineneintrag - - Wir bringen Sie nach ganz vorne! - Sehr geehrter Kunde, heute möchten wir Ihnen unseren neuen Premium Service vorstellen. Haben Sie Ihre Homepage schon ins

Mehr

Binäre Bäume. 1. Allgemeines. 2. Funktionsweise. 2.1 Eintragen

Binäre Bäume. 1. Allgemeines. 2. Funktionsweise. 2.1 Eintragen Binäre Bäume 1. Allgemeines Binäre Bäume werden grundsätzlich verwendet, um Zahlen der Größe nach, oder Wörter dem Alphabet nach zu sortieren. Dem einfacheren Verständnis zu Liebe werde ich mich hier besonders

Mehr

Guide DynDNS und Portforwarding

Guide DynDNS und Portforwarding Guide DynDNS und Portforwarding Allgemein Um Geräte im lokalen Netzwerk von überall aus über das Internet erreichen zu können, kommt man um die Themen Dynamik DNS (kurz DynDNS) und Portweiterleitung(auch

Mehr

Anleitung zur Daten zur Datensicherung und Datenrücksicherung. Datensicherung

Anleitung zur Daten zur Datensicherung und Datenrücksicherung. Datensicherung Anleitung zur Daten zur Datensicherung und Datenrücksicherung Datensicherung Es gibt drei Möglichkeiten der Datensicherung. Zwei davon sind in Ges eingebaut, die dritte ist eine manuelle Möglichkeit. In

Mehr

1. Man schreibe die folgenden Aussagen jeweils in einen normalen Satz um. Zum Beispiel kann man die Aussage:

1. Man schreibe die folgenden Aussagen jeweils in einen normalen Satz um. Zum Beispiel kann man die Aussage: Zählen und Zahlbereiche Übungsblatt 1 1. Man schreibe die folgenden Aussagen jeweils in einen normalen Satz um. Zum Beispiel kann man die Aussage: Für alle m, n N gilt m + n = n + m. in den Satz umschreiben:

Mehr

Professionelle Seminare im Bereich MS-Office

Professionelle Seminare im Bereich MS-Office Der Name BEREICH.VERSCHIEBEN() ist etwas unglücklich gewählt. Man kann mit der Funktion Bereiche zwar verschieben, man kann Bereiche aber auch verkleinern oder vergrößern. Besser wäre es, die Funktion

Mehr

Outlook. sysplus.ch outlook - mail-grundlagen Seite 1/8. Mail-Grundlagen. Posteingang

Outlook. sysplus.ch outlook - mail-grundlagen Seite 1/8. Mail-Grundlagen. Posteingang sysplus.ch outlook - mail-grundlagen Seite 1/8 Outlook Mail-Grundlagen Posteingang Es gibt verschiedene Möglichkeiten, um zum Posteingang zu gelangen. Man kann links im Outlook-Fenster auf die Schaltfläche

Mehr

Kaufkräftige Zielgruppen gewinnen

Kaufkräftige Zielgruppen gewinnen Kaufkräftige Zielgruppen gewinnen Wie Sie Besucher auf Ihre Webseite locken, die hochgradig an Ihrem Angebot interessiert sind 2014 David Unzicker, alle Rechte vorbehalten Hallo, mein Name ist David Unzicker

Mehr

HMC WEB INDEX. Erste große Deutschland Studie. Wie fit sind die Clubs im online marketing? www.webindex.hmc-germany.com.

HMC WEB INDEX. Erste große Deutschland Studie. Wie fit sind die Clubs im online marketing? www.webindex.hmc-germany.com. 21.11.2013 HMC WEB INDEX Erste große Deutschland Studie. Wie fit sind die Clubs im online marketing? www.webindex.hmc-germany.com Ansprechpartner Dirk Kemmerling Geschäftsführer HMC Germany HMC Health

Mehr

infach Geld FBV Ihr Weg zum finanzellen Erfolg Florian Mock

infach Geld FBV Ihr Weg zum finanzellen Erfolg Florian Mock infach Ihr Weg zum finanzellen Erfolg Geld Florian Mock FBV Die Grundlagen für finanziellen Erfolg Denn Sie müssten anschließend wieder vom Gehaltskonto Rückzahlungen in Höhe der Entnahmen vornehmen, um

Mehr

LinguLab GmbH. Bedienungsanleitung Allgemeine Definition

LinguLab GmbH. Bedienungsanleitung Allgemeine Definition LinguLab GmbH Bedienungsanleitung Allgemeine Definition LinguLab GmbH T: +49.711.49030.370 Maybachstr. 50 F: +49.711.49030.22.370 70469 Stuttgart E: mba@lingulab.de I: www.lingulab.de Inhaltsverzeichnis

Mehr

1 topologisches Sortieren

1 topologisches Sortieren Wolfgang Hönig / Andreas Ecke WS 09/0 topologisches Sortieren. Überblick. Solange noch Knoten vorhanden: a) Suche Knoten v, zu dem keine Kante führt (Falls nicht vorhanden keine topologische Sortierung

Mehr

Suche schlecht beschriftete Bilder mit Eigenen Abfragen

Suche schlecht beschriftete Bilder mit Eigenen Abfragen Suche schlecht beschriftete Bilder mit Eigenen Abfragen Ist die Bilderdatenbank über einen längeren Zeitraum in Benutzung, so steigt die Wahrscheinlichkeit für schlecht beschriftete Bilder 1. Insbesondere

Mehr

Mit der Maus im Menü links auf den Menüpunkt 'Seiten' gehen und auf 'Erstellen klicken.

Mit der Maus im Menü links auf den Menüpunkt 'Seiten' gehen und auf 'Erstellen klicken. Seite erstellen Mit der Maus im Menü links auf den Menüpunkt 'Seiten' gehen und auf 'Erstellen klicken. Es öffnet sich die Eingabe Seite um eine neue Seite zu erstellen. Seiten Titel festlegen Den neuen

Mehr

AGROPLUS Buchhaltung. Daten-Server und Sicherheitskopie. Version vom 21.10.2013b

AGROPLUS Buchhaltung. Daten-Server und Sicherheitskopie. Version vom 21.10.2013b AGROPLUS Buchhaltung Daten-Server und Sicherheitskopie Version vom 21.10.2013b 3a) Der Daten-Server Modus und der Tresor Der Daten-Server ist eine Betriebsart welche dem Nutzer eine grosse Flexibilität

Mehr

WordPress. Dokumentation

WordPress. Dokumentation WordPress Dokumentation Backend-Login In das Backend gelangt man, indem man hinter seiner Website-URL einfach ein /wp-admin dranhängt www.domain.tld/wp-admin Dabei gelangt man auf die Administrationsoberfläche,

Mehr

PHPNuke Quick & Dirty

PHPNuke Quick & Dirty PHPNuke Quick & Dirty Dieses Tutorial richtet sich an all die, die zum erstenmal an PHPNuke System aufsetzen und wirklich keine Ahnung haben wie es geht. Hier wird sehr flott, ohne grosse Umschweife dargestellt

Mehr

Handbuch zur Anlage von Turnieren auf der NÖEV-Homepage

Handbuch zur Anlage von Turnieren auf der NÖEV-Homepage Handbuch zur Anlage von Turnieren auf der NÖEV-Homepage Inhaltsverzeichnis 1. Anmeldung... 2 1.1 Startbildschirm... 3 2. Die PDF-Dateien hochladen... 4 2.1 Neue PDF-Datei erstellen... 5 3. Obelix-Datei

Mehr

FIS: Projektdaten auf den Internetseiten ausgeben

FIS: Projektdaten auf den Internetseiten ausgeben Rechenzentrum FIS: Projektdaten auf den Internetseiten ausgeben Ist ein Forschungsprojekt im Forschungsinformationssystem (FIS) erfasst und für die Veröffentlichung freigegeben, können Sie einige Daten

Mehr

Fehler und Probleme bei Auswahl und Installation eines Dokumentenmanagement Systems

Fehler und Probleme bei Auswahl und Installation eines Dokumentenmanagement Systems Fehler und Probleme bei Auswahl und Installation eines Dokumentenmanagement Systems Name: Bruno Handler Funktion: Marketing/Vertrieb Organisation: AXAVIA Software GmbH Liebe Leserinnen und liebe Leser,

Mehr

Hilfedatei der Oden$-Börse Stand Juni 2014

Hilfedatei der Oden$-Börse Stand Juni 2014 Hilfedatei der Oden$-Börse Stand Juni 2014 Inhalt 1. Einleitung... 2 2. Die Anmeldung... 2 2.1 Die Erstregistrierung... 3 2.2 Die Mitgliedsnummer anfordern... 4 3. Die Funktionen für Nutzer... 5 3.1 Arbeiten

Mehr

Kapitalerhöhung - Verbuchung

Kapitalerhöhung - Verbuchung Kapitalerhöhung - Verbuchung Beschreibung Eine Kapitalerhöhung ist eine Erhöhung des Aktienkapitals einer Aktiengesellschaft durch Emission von en Aktien. Es gibt unterschiedliche Formen von Kapitalerhöhung.

Mehr

Kapiteltests zum Leitprogramm Binäre Suchbäume

Kapiteltests zum Leitprogramm Binäre Suchbäume Kapiteltests zum Leitprogramm Binäre Suchbäume Björn Steffen Timur Erdag überarbeitet von Christina Class Binäre Suchbäume Kapiteltests für das ETH-Leitprogramm Adressaten und Institutionen Das Leitprogramm

Mehr

Summenbildung in Bauteiltabellen mit If Then Abfrage

Summenbildung in Bauteiltabellen mit If Then Abfrage Summenbildung in Bauteiltabellen mit If Then Abfrage Die in Bauteiltabellen ausgelesenen Werte lassen sich in jeder Spalte als Summe berechnen. So können selbstverständlich die Flächen der in der Tabelle

Mehr

mysql - Clients MySQL - Abfragen eine serverbasierenden Datenbank

mysql - Clients MySQL - Abfragen eine serverbasierenden Datenbank mysql - Clients MySQL - Abfragen eine serverbasierenden Datenbank In den ersten beiden Abschnitten (rbanken1.pdf und rbanken2.pdf) haben wir uns mit am Ende mysql beschäftigt und kennengelernt, wie man

Mehr

Anwendungshinweise zur Anwendung der Soziometrie

Anwendungshinweise zur Anwendung der Soziometrie Anwendungshinweise zur Anwendung der Soziometrie Einführung Die Soziometrie ist ein Verfahren, welches sich besonders gut dafür eignet, Beziehungen zwischen Mitgliedern einer Gruppe darzustellen. Das Verfahren

Mehr

Und im Bereich Lernschwächen kommen sie, wenn sie merken, das Kind hat Probleme beim Rechnen oder Lesen und Schreiben.

Und im Bereich Lernschwächen kommen sie, wenn sie merken, das Kind hat Probleme beim Rechnen oder Lesen und Schreiben. 5.e. PDF zur Hördatei und Herr Kennedy zum Thema: Unsere Erfahrungen in der Kennedy-Schule Teil 2 Herr Kennedy, Sie haben eine Nachhilfeschule in der schwerpunktmäßig an Lernschwächen wie Lese-Rechtschreibschwäche,

Mehr

VERÖFFENTLICHT VON: ag-pictures Andreas Grzesiak Espenweg 5 86971 Peiting. 2015 Andreas Grzesiak Alle Rechte vorbehalten. www.ag-pictures.

VERÖFFENTLICHT VON: ag-pictures Andreas Grzesiak Espenweg 5 86971 Peiting. 2015 Andreas Grzesiak Alle Rechte vorbehalten. www.ag-pictures. VERÖFFENTLICHT VON: ag-pictures Andreas Grzesiak Espenweg 5 86971 Peiting 2015 Andreas Grzesiak Alle Rechte vorbehalten. www.ag-pictures.com Über Andreas Grzesiak: Andreas Grzesiak hat sich schon in jungen

Mehr

.procmailrc HOWTO. zur Mailfilterung und Verteilung. Stand: 01.01.2011

.procmailrc HOWTO. zur Mailfilterung und Verteilung. Stand: 01.01.2011 .procmailrc HOWTO zur Mailfilterung und Verteilung Stand: 01.01.2011 Copyright 2002-2003 by manitu. Alle Rechte vorbehalten. Alle verwendeten Bezeichnungen dienen lediglich der Kennzeichnung und können

Mehr

Konfiguration VLAN's. Konfiguration VLAN's IACBOX.COM. Version 2.0.1 Deutsch 01.07.2014

Konfiguration VLAN's. Konfiguration VLAN's IACBOX.COM. Version 2.0.1 Deutsch 01.07.2014 Konfiguration VLAN's Version 2.0.1 Deutsch 01.07.2014 In diesem HOWTO wird die Konfiguration der VLAN's für das Surf-LAN der IAC-BOX beschrieben. Konfiguration VLAN's TITEL Inhaltsverzeichnis Inhaltsverzeichnis...

Mehr

Wie Google Webseiten bewertet. François Bry

Wie Google Webseiten bewertet. François Bry Wie Google Webseiten bewertet François Bry Heu6ge Vorlesung 1. Einleitung 2. Graphen und Matrizen 3. Erste Idee: Ranking als Eigenvektor 4. Fragen: Exisi6ert der Eigenvektor? Usw. 5. Zweite Idee: Die Google

Mehr

Das Leitbild vom Verein WIR

Das Leitbild vom Verein WIR Das Leitbild vom Verein WIR Dieses Zeichen ist ein Gütesiegel. Texte mit diesem Gütesiegel sind leicht verständlich. Leicht Lesen gibt es in drei Stufen. B1: leicht verständlich A2: noch leichter verständlich

Mehr

3. Die tägliche E-Mail-Flut effizient verwalten

3. Die tägliche E-Mail-Flut effizient verwalten 3. Es ist wie im normalen Leben: Wenn man etwas vernünftig einsortiert, findet man es auch rasch wieder. In Outlook ist das ähnlich. Denn mit der Zeit sammeln sich sehr viele E-Mails an. Wer da keine logische

Mehr

Wissenswertes über Suchmaschinenoptimierung

Wissenswertes über Suchmaschinenoptimierung Mit dem Begriff ist die Optimierung einer Webseite gemeint, so dass sie unter entsprechend themenrelevanten Suchbegriffen möglichst weit oben in der Trefferliste der Suchmaschinen angezeigt wird. Es gibt

Mehr

Erstellen von x-y-diagrammen in OpenOffice.calc

Erstellen von x-y-diagrammen in OpenOffice.calc Erstellen von x-y-diagrammen in OpenOffice.calc In dieser kleinen Anleitung geht es nur darum, aus einer bestehenden Tabelle ein x-y-diagramm zu erzeugen. D.h. es müssen in der Tabelle mindestens zwei

Mehr

Bereich METIS (Texte im Internet) Zählmarkenrecherche

Bereich METIS (Texte im Internet) Zählmarkenrecherche Bereich METIS (Texte im Internet) Zählmarkenrecherche Über die Zählmarkenrecherche kann man nach der Eingabe des Privaten Identifikationscodes einer bestimmten Zählmarke, 1. Informationen zu dieser Zählmarke

Mehr

Thematische Abfrage mit Computerlinguistik

Thematische Abfrage mit Computerlinguistik Thematische Abfrage mit Computerlinguistik Autor: Dr. Klaus Loth (ETH-Bibliothek Zürich) Zusammenfassung Der Beitrag befasst sich mit dem Einsatz der Computerlinguistik bei der thematischen Abfrage einer

Mehr

etutor Benutzerhandbuch XQuery Benutzerhandbuch Georg Nitsche

etutor Benutzerhandbuch XQuery Benutzerhandbuch Georg Nitsche etutor Benutzerhandbuch Benutzerhandbuch XQuery Georg Nitsche Version 1.0 Stand März 2006 Versionsverlauf: Version Autor Datum Änderungen 1.0 gn 06.03.2006 Fertigstellung der ersten Version Inhaltsverzeichnis:

Mehr

Antolin-Titel jetzt automatisch in WinBIAP kennzeichnen

Antolin-Titel jetzt automatisch in WinBIAP kennzeichnen & Antolin-Titel jetzt automatisch in WinBIAP kennzeichnen Immer mehr Schulen setzen das erfolgreiche Leseförderungsprojekt "Antolin" ein - und die Bibliotheken verzeichnen große Nachfrage nach den Kinderbüchern,

Mehr

Anleitung über den Umgang mit Schildern

Anleitung über den Umgang mit Schildern Anleitung über den Umgang mit Schildern -Vorwort -Wo bekommt man Schilder? -Wo und wie speichert man die Schilder? -Wie füge ich die Schilder in meinen Track ein? -Welche Bauteile kann man noch für Schilder

Mehr

Funktionsbeschreibung. Lieferantenbewertung. von IT Consulting Kauka GmbH

Funktionsbeschreibung. Lieferantenbewertung. von IT Consulting Kauka GmbH Funktionsbeschreibung Lieferantenbewertung von IT Consulting Kauka GmbH Stand 16.02.2010 odul LBW Das Modul LBW... 3 1. Konfiguration... 4 1.1 ppm... 4 1.2 Zertifikate... 5 1.3 Reklamationsverhalten...

Mehr

Windows 10 > Fragen über Fragen

Windows 10 > Fragen über Fragen www.computeria-olten.ch Monatstreff für Menschen ab 50 Merkblatt 103 Windows 10 > Fragen über Fragen Was ist das? Muss ich dieses Upgrade machen? Was bringt mir das neue Programm? Wie / wann muss ich es

Mehr

Welche Unterschiede gibt es zwischen einem CAPAund einem Audiometrie- Test?

Welche Unterschiede gibt es zwischen einem CAPAund einem Audiometrie- Test? Welche Unterschiede gibt es zwischen einem CAPAund einem Audiometrie- Test? Auch wenn die Messungsmethoden ähnlich sind, ist das Ziel beider Systeme jedoch ein anderes. Gwenolé NEXER g.nexer@hearin gp

Mehr

OECD Programme for International Student Assessment PISA 2000. Lösungen der Beispielaufgaben aus dem Mathematiktest. Deutschland

OECD Programme for International Student Assessment PISA 2000. Lösungen der Beispielaufgaben aus dem Mathematiktest. Deutschland OECD Programme for International Student Assessment Deutschland PISA 2000 Lösungen der Beispielaufgaben aus dem Mathematiktest Beispielaufgaben PISA-Hauptstudie 2000 Seite 3 UNIT ÄPFEL Beispielaufgaben

Mehr

Erfolgreich suchen im Internet

Erfolgreich suchen im Internet Erfolgreich suchen im Internet Steffen-Peter Ballstaedt 05.10.2015 Statistik Weltweit: etwa 1 Milliarde Websites BRD: 15 Millionen Websites Das Internet verdoppelt sich alle 5,32 Jahre Die häufigste Aktivität

Mehr

Lösung Fall 8 Anspruch des L auf Lieferung von 3.000 Panini á 2,-

Lösung Fall 8 Anspruch des L auf Lieferung von 3.000 Panini á 2,- Lösung Fall 8 Anspruch des L auf Lieferung von 3.000 Panini á 2,- L könnte gegen G einen Anspruch auf Lieferung von 3.000 Panini á 2,- gem. 433 I BGB haben. Voraussetzung dafür ist, dass G und L einen

Mehr

Die Statistiken von SiMedia

Die Statistiken von SiMedia Die Statistiken von SiMedia Unsere Statistiken sind unter folgender Adresse erreichbar: http://stats.simedia.info Kategorie Titel Einfach Erweitert Übersicht Datum und Zeit Inhalt Besucher-Demographie

Mehr

In diesem Tutorial lernen Sie, wie Sie einen Termin erfassen und verschiedene Einstellungen zu einem Termin vornehmen können.

In diesem Tutorial lernen Sie, wie Sie einen Termin erfassen und verschiedene Einstellungen zu einem Termin vornehmen können. Tutorial: Wie erfasse ich einen Termin? In diesem Tutorial lernen Sie, wie Sie einen Termin erfassen und verschiedene Einstellungen zu einem Termin vornehmen können. Neben den allgemeinen Angaben zu einem

Mehr

Was meinen die Leute eigentlich mit: Grexit?

Was meinen die Leute eigentlich mit: Grexit? Was meinen die Leute eigentlich mit: Grexit? Grexit sind eigentlich 2 Wörter. 1. Griechenland 2. Exit Exit ist ein englisches Wort. Es bedeutet: Ausgang. Aber was haben diese 2 Sachen mit-einander zu tun?

Mehr

1 Mathematische Grundlagen

1 Mathematische Grundlagen Mathematische Grundlagen - 1-1 Mathematische Grundlagen Der Begriff der Menge ist einer der grundlegenden Begriffe in der Mathematik. Mengen dienen dazu, Dinge oder Objekte zu einer Einheit zusammenzufassen.

Mehr

Installationsanleitung für CashPro im Mehrbenutzerzugriff/Netzwerkbetrieb

Installationsanleitung für CashPro im Mehrbenutzerzugriff/Netzwerkbetrieb Installationsanleitung für CashPro im Mehrbenutzerzugriff/Netzwerkbetrieb CashPro basiert auf Accesstechnologie 2003 und ist auch unter den aktuellen Accessversionen 2007 bis 2013 einsetzbar und Mehrbenutzerfähig.

Mehr

impact ordering Info Produktkonfigurator

impact ordering Info Produktkonfigurator impact ordering Info Copyright Copyright 2013 veenion GmbH Alle Rechte vorbehalten. Kein Teil der Dokumentation darf in irgendeiner Form ohne schriftliche Genehmigung der veenion GmbH reproduziert, verändert

Mehr

Windows. Workshop Internet-Explorer: Arbeiten mit Favoriten, Teil 1

Windows. Workshop Internet-Explorer: Arbeiten mit Favoriten, Teil 1 Workshop Internet-Explorer: Arbeiten mit Favoriten, Teil 1 Wenn der Name nicht gerade www.buch.de oder www.bmw.de heißt, sind Internetadressen oft schwer zu merken Deshalb ist es sinnvoll, die Adressen

Mehr

Contao (Teil 37): Suchmaschinenoptimierung (1)

Contao (Teil 37): Suchmaschinenoptimierung (1) Web >> Contao Contao (Teil 37): Suchmaschinenoptimierung (1) Autor: daniel_koch Inhalt: Webseiten können eigentlich nur erfolgreich sein, wenn sie auch vernünftig über Suchmaschinen gefunden werden. Grund

Mehr

Manager. von Peter Pfeifer, Waltraud Pfeifer, Burkhard Münchhagen. Spielanleitung

Manager. von Peter Pfeifer, Waltraud Pfeifer, Burkhard Münchhagen. Spielanleitung Manager von Peter Pfeifer, Waltraud Pfeifer, Burkhard Münchhagen Spielanleitung Manager Ein rasantes Wirtschaftsspiel für 3 bis 6 Spieler. Das Glück Ihrer Firma liegt in Ihren Händen! Bestehen Sie gegen

Mehr

40-Tage-Wunder- Kurs. Umarme, was Du nicht ändern kannst.

40-Tage-Wunder- Kurs. Umarme, was Du nicht ändern kannst. 40-Tage-Wunder- Kurs Umarme, was Du nicht ändern kannst. Das sagt Wikipedia: Als Wunder (griechisch thauma) gilt umgangssprachlich ein Ereignis, dessen Zustandekommen man sich nicht erklären kann, so dass

Mehr

Access [basics] Gruppierungen in Abfragen. Beispieldatenbank. Abfragen gruppieren. Artikel pro Kategorie zählen

Access [basics] Gruppierungen in Abfragen. Beispieldatenbank. Abfragen gruppieren. Artikel pro Kategorie zählen Abfragen lassen sich längst nicht nur dazu benutzen, die gewünschten Felder oder Datensätze einer oder mehrerer Tabellen darzustellen. Sie können Daten auch nach bestimmten Kriterien zu Gruppen zusammenfassen

Mehr

Es gilt das gesprochene Wort. Anrede

Es gilt das gesprochene Wort. Anrede Sperrfrist: 28. November 2007, 13.00 Uhr Es gilt das gesprochene Wort Statement des Staatssekretärs im Bayerischen Staatsministerium für Unterricht und Kultus, Karl Freller, anlässlich des Pressegesprächs

Mehr

In diesem Thema lernen wir die Grundlagen der Datenbanken kennen und werden diese lernen einzusetzen. Access. Die Grundlagen der Datenbanken.

In diesem Thema lernen wir die Grundlagen der Datenbanken kennen und werden diese lernen einzusetzen. Access. Die Grundlagen der Datenbanken. In diesem Thema lernen wir die Grundlagen der Datenbanken kennen und werden diese lernen einzusetzen. Access Die Grundlagen der Datenbanken kurspc15 Inhaltsverzeichnis Access... Fehler! Textmarke nicht

Mehr

Anzeige von eingescannten Rechnungen

Anzeige von eingescannten Rechnungen Anzeige von eingescannten Rechnungen Wenn Sie sich zu einer Eingangsrechnung die eingescannte Originalrechnung ansehen möchten, wählen Sie als ersten Schritt aus Ihrem Benutzermenü unter dem Kapitel Eingangsrechnung

Mehr

Tevalo Handbuch v 1.1 vom 10.11.2011

Tevalo Handbuch v 1.1 vom 10.11.2011 Tevalo Handbuch v 1.1 vom 10.11.2011 Inhalt Registrierung... 3 Kennwort vergessen... 3 Startseite nach dem Login... 4 Umfrage erstellen... 4 Fragebogen Vorschau... 7 Umfrage fertigstellen... 7 Öffentliche

Mehr

Vorlesung Dokumentation und Datenbanken Klausur

Vorlesung Dokumentation und Datenbanken Klausur Dr. Stefan Brass 5. Februar 2002 Institut für Informatik Universität Giessen Vorlesung Dokumentation und Datenbanken Klausur Name: Geburtsdatum: Geburtsort: (Diese Daten werden zur Ausstellung des Leistungsnachweises

Mehr

Novell Client. Anleitung. zur Verfügung gestellt durch: ZID Dezentrale Systeme. Februar 2015. ZID Dezentrale Systeme

Novell Client. Anleitung. zur Verfügung gestellt durch: ZID Dezentrale Systeme. Februar 2015. ZID Dezentrale Systeme Novell Client Anleitung zur Verfügung gestellt durch: ZID Dezentrale Systeme Februar 2015 Seite 2 von 8 Mit der Einführung von Windows 7 hat sich die Novell-Anmeldung sehr stark verändert. Der Novell Client

Mehr

Einrichtung des Cisco VPN Clients (IPSEC) in Windows7

Einrichtung des Cisco VPN Clients (IPSEC) in Windows7 Einrichtung des Cisco VPN Clients (IPSEC) in Windows7 Diese Verbindung muss einmalig eingerichtet werden und wird benötigt, um den Zugriff vom privaten Rechner oder der Workstation im Home Office über

Mehr

Beispiel Shop-Eintrag Ladenlokal & Online-Shop im Verzeichnis www.wir-lieben-shops.de 1

Beispiel Shop-Eintrag Ladenlokal & Online-Shop im Verzeichnis www.wir-lieben-shops.de 1 Beispiel Shop-Eintrag Ladenlokal & Online-Shop. Als Händler haben Sie beim Shop-Verzeichnis wir-lieben-shops.de die Möglichkeit einen oder mehrere Shop- Einträge zu erstellen. Es gibt 3 verschiedene Typen

Mehr

Bedienungsanleitung für den SecureCourier

Bedienungsanleitung für den SecureCourier Bedienungsanleitung für den SecureCourier Wo kann ich den SecureCourier nach der Installation auf meinem Computer finden? Den SecureCourier finden Sie dort, wo Sie mit Dateien umgehen und arbeiten. Bei

Mehr

Layoutmodelle. Steffen Schwientek Große Klostergasse 5 61169 Friedberg Email:schwientek@web.de Web :schlaukopp.org

Layoutmodelle. Steffen Schwientek Große Klostergasse 5 61169 Friedberg Email:schwientek@web.de Web :schlaukopp.org Layoutmodelle HTML wurde von ihren Erfindern nicht als Layoutsprache entworfen, sondern zur Informationsübermittlung entworfen Es gab verschiedene Modelle, welche das Web populär machten und. Bei Erstellung

Mehr

Einfügen von Bildern innerhalb eines Beitrages

Einfügen von Bildern innerhalb eines Beitrages Version 1.2 Einfügen von Bildern innerhalb eines Beitrages Um eigene Bilder ins Forum einzufügen, gibt es zwei Möglichkeiten. 1.) Ein Bild vom eigenem PC wird auf den Webspace von Baue-die-Bismarck.de

Mehr

Favoriten sichern. Sichern der eigenen Favoriten aus dem Webbrowser. zur Verfügung gestellt durch: ZID Dezentrale Systeme.

Favoriten sichern. Sichern der eigenen Favoriten aus dem Webbrowser. zur Verfügung gestellt durch: ZID Dezentrale Systeme. Favoriten sichern Sichern der eigenen Favoriten aus dem Webbrowser zur Verfügung gestellt durch: ZID Dezentrale Systeme Februar 2015 Seite 2 von 20 Inhaltsverzeichnis Einleitung... 3 Mozilla Firefox...

Mehr

Handbuch ECDL 2003 Basic Modul 5: Datenbank Grundlagen von relationalen Datenbanken

Handbuch ECDL 2003 Basic Modul 5: Datenbank Grundlagen von relationalen Datenbanken Handbuch ECDL 2003 Basic Modul 5: Datenbank Grundlagen von relationalen Datenbanken Dateiname: ecdl5_01_00_documentation_standard.doc Speicherdatum: 14.02.2005 ECDL 2003 Basic Modul 5 Datenbank - Grundlagen

Mehr

Nicht kopieren. Der neue Report von: Stefan Ploberger. 1. Ausgabe 2003

Nicht kopieren. Der neue Report von: Stefan Ploberger. 1. Ausgabe 2003 Nicht kopieren Der neue Report von: Stefan Ploberger 1. Ausgabe 2003 Herausgeber: Verlag Ploberger & Partner 2003 by: Stefan Ploberger Verlag Ploberger & Partner, Postfach 11 46, D-82065 Baierbrunn Tel.

Mehr

Erstellen eines Beitrags auf der Homepage Schachverband Schleswig-Holstein - Stand vom 01.06.2015

Erstellen eines Beitrags auf der Homepage Schachverband Schleswig-Holstein - Stand vom 01.06.2015 Erstellen eines Beitrags auf der Homepage Einleitung... 3 01 Startseite aufrufen... 4 02 Anmeldedaten eingeben... 5 03 Anmelden... 6 04 Anmeldung erfolgreich... 7 05 Neuen Beitrag anlegen... 8 06 Titel

Mehr

Der vorliegende Konverter unterstützt Sie bei der Konvertierung der Datensätze zu IBAN und BIC.

Der vorliegende Konverter unterstützt Sie bei der Konvertierung der Datensätze zu IBAN und BIC. Anleitung Konverter Letzte Aktualisierung dieses Dokumentes: 14.11.2013 Der vorliegende Konverter unterstützt Sie bei der Konvertierung der Datensätze zu IBAN und BIC. Wichtiger Hinweis: Der Konverter

Mehr

Urlaubsregel in David

Urlaubsregel in David Urlaubsregel in David Inhaltsverzeichnis KlickDown Beitrag von Tobit...3 Präambel...3 Benachrichtigung externer Absender...3 Erstellen oder Anpassen des Anworttextes...3 Erstellen oder Anpassen der Auto-Reply-Regel...5

Mehr

Schulungsunterlagen zur Version 3.3

Schulungsunterlagen zur Version 3.3 Schulungsunterlagen zur Version 3.3 Versenden und Empfangen von Veranstaltungen im CMS-System Jürgen Eckert Domplatz 3 96049 Bamberg Tel (09 51) 5 02 2 75 Fax (09 51) 5 02 2 71 Mobil (01 79) 3 22 09 33

Mehr

ONLINE-AKADEMIE. "Diplomierter NLP Anwender für Schule und Unterricht" Ziele

ONLINE-AKADEMIE. Diplomierter NLP Anwender für Schule und Unterricht Ziele ONLINE-AKADEMIE Ziele Wenn man von Menschen hört, die etwas Großartiges in ihrem Leben geleistet haben, erfahren wir oft, dass diese ihr Ziel über Jahre verfolgt haben oder diesen Wunsch schon bereits

Mehr