Web Marshals Fighting Curly Link Farms

Ähnliche Dokumente
Herzlich Willkommen zu meinem Webinar!

Quelle. Thematische Verteilungen. Worum geht es? Wiederholung. Link-Analyse: HITS. Link-Analyse: PageRank. Link-Analyse: PageRank. Link-Analyse: HITS

Suchmaschinen- Optimierung Gestern heute - morgen

5. Suchmaschinen Herausforderungen beim Web Information Retrieval. Herausforderungen beim Web Information Retrieval. Architektur von Suchmaschinen

Suchen, um zu finden. Sta,s,k BRD (Quelle: Comscore, 2013) Beziehungsgeflecht der Suchmaschinen. Antworten auf folgende Fragen:

Surfen in der digitalen Welt! So schützen Sie sich im Internet

Wie Google Webseiten bewertet. François Bry

PageRank-Algorithmus

Suchmaschinen- optimierung (SEO)

Übungsaufgaben mit Lösungsvorschlägen

Unbeschränkter Zugang zu Wissen?

Ohne Mathematik undenkbar!

Marketinginformationen Tipps für Suchmaschinenmarketing

Mit Suchmaschinenmarketing in die erste Reihe

SEO SEARCH ENGINE OPTIMIZATION

Die treffende Auswahl anbieten: Im Internet (Referat 3a)

Wie Sie Top-Positionen bei. erreichen und langfristig sichern! Swiss Online Marketingmesse Büros in 87 Ländern. Was funktioniert wirklich?

Web Data Mining. Alexander Hinneburg Sommersemester 2007

suchmaschinen optimierung. // Suchmaschinenmarketing in Google. // Informationen zum Ranking. //

Suchmaschinenoptimierung Referent: Dennis Sohm weit gestreut Internet Marketing

PG520 - Webpageranking

Themenschwerpunkt Social SEO

Google. Reginald Ferber Hochschule Darmstadt Fachbereich Media, Studienbereich Informationswissenschaft

Gefunden werden im Internet - Einblick in die Suchmaschinenoptimierung

SEO Suchmaschinen-Trends

Onsite-Optimierung. Gibt es keinen doppelten Content auf der eigenen Seite oder Tochterseiten?

Detecting Near Duplicates for Web Crawling

Erfolgreich suchen im Internet

Suchmaschinenoptimierung - Der effiziente Weg zur Zielgruppe

Internetsuche und Google Page-Rank - Wie wird was durch wen gefunden? Woche 3

Veranstalter: Lehrstuhl DBIS - Prof. Georg Lausen Betreuer: Thomas Hornung, Michael Schmidt

SEO Campixx Interne Verlinkung

Suchmaschinenoptimierung (SEO) mit Top-Platzierung!

emarketing im Focus: Search Engine Optimization SEO für Google & Co Version 1.0 1

Inhalt. 1 Einführung Funktionsweise von Suchmaschinen So werden Suchergebnisse gewichtet... 39

TYPO3-Suchmaschinenoptimierung für Redakteure

SEO - Optimierung von Websites für Suchmaschinen

Links, zwo, drei, vier! Erhöhung der Popularität Ihrer Website. Handwerkskammer Bremen,

Verlinkung von Webseiten

Wie finden mich meine Kundinnen im Web? (Es muss nicht immer Google sein)

Suchmaschinenoptimierung (SEO) Know-How

Wie Web 2.0 und Suche zusammenwachsen. Prof. Dr. Dirk Lewandowski

9. IR im Web. bei Anfragen im Web gibt es eine Reihe von zusätzlichen Problemen, die gelöst werden

Web Information Retrieval. Web Information Retrieval. Informationssuche im Web Typen von Web-Suche (nach Andrei Broder) Das World Wide Web

Analysebericht. Zusammenfassung. Ergebnisse Website-Analyse: Technische Analyse

Die wich)gsten SEO Ranking Faktoren bei Google. A;erbuy BBQ 2014 Dominik Wojcik

INFORMATIONSLOGISTIK VERSUS SUCHE. Wie die aktive Bereitstellung von Informationen hilft, Zeit zu sparen und Ziele zu erreichen

Die Pressglas-Korrespondenz und die Suchmaschinen GOOGLE und YAHOO

Homepage-Optimierung. Mit der Homepage Kunden gewinnen!

On Page SEO für WordPress. Übersichtliche Zusammenfassung der effektiven Optimierungslösungen für WordPress Blogs

Semestralklausur zur Vorlesung. Web Mining. Prof. J. Fürnkranz Technische Universität Darmstadt Sommersemester 2004 Termin:

Gesucht und gefunden wie geht s?

Social Media. Live Beispiel

Copyright Dirk Henningsen - Herausgeber

Die neue bunte Google-Suche

Suchmaschinenoptimierung. Grundlagen zur Optimierung der eigenen Internetseite

SEO Erfolg mit themenrelevanten Links

Suchmaschinen- Optimierung Gestern heute - morgen

Übungsaufgaben. Aufgabe 1 Internetsuchmaschinen. Einführung in das Information Retrieval, 8. Mai 2008 Veranstaltung für die Berufsakademie Karlsruhe

Informationen für Coaches. Der Coaching- Kompass wird bereitgestellt von:

Mein Internetauftritt auf dem Prüfstand

Suchergebnisdarstellung in Google, Bing, Cuil, etc. Christina Ficsor

Web-Design und Suchmaschinen-Optimierung: Zwei getrennte Welten

Mister Wong Eine Community schafft eine Ergänzung zu klassischen Suchmaschinen

Diskrete Modellierung

Datenschutzerklärung für

Suchmaschinenoptimierung (SEO)

Vortrag. Zur Bedeutung des Linkaufbaus bei der Suchmaschinenoptimierung. Stuttgart, den

Suche, Suchmaschinen, Suchmaschinenoptimierung. Workshop TYPO Sybille Peters

Consulting & Software Repolusk

Ihr Partner, der Sie im Internet nach vorne bringt.

IHK regional Suchmaschinenoptimierung und -marketing

Uwe Stache: Suchmaschinenoptimierung. Werkzeuge Methoden - Erfahrungen

Data Mining im Internet

Automatische Webspam-Erkennung

Online-Marketing für Ingenieurbüros. Wie Sie Ihr Ingenieurbüro professionell im Internet präsentieren

Online-Recherche: Web-Recherche WS 2015/ Veranstaltung 3. Dezember 2015

Webseiten-Bericht für shagor5.net

Arbeiten mit Datenbanken

Erhöhung der Online-Präsenz mit Google My Business (GMB)

Suchmaschinenoptimierung. Dr. Lars Göhler

Datenstrukturen und Algorithmen SS07

Tipps und Tricks der Suchmaschinenoptimierung

Woher kommt die Idee Internet?

Analysebericht 1/15. Projektdetails. Rating History. Inhaltsverzeichnis

O n l i n e - M a r k e t i n g :

5. Suchmaschinen Herausforderungen beim Web Information Retrieval. 5. Suchmaschinen. Herausforderungen beim Web Information Retrieval

SUCHMASCHINENOPTIMIERUNG AUF DEN ERSTEN BLICK

Die Welt der Suchmaschinen-Roboter. Wie Suchmaschinen arbeiten Wie Suchmaschinen die Welt sehen Wie Suchmaschinen die Welt verstehen

Suchmaschinenoptimierung - 16 Tuning-Tipps wie Sie Ihre Website selber auf Platz 1 in allen Suchmaschinen katapultieren

Praxiswissen Suchmaschinenoptimierung

Internet-Marketing Referent: Dipl.-Ök. Elia Awwad WelcomeMedia Internet GbR. Was Sie über Suchmaschinenoptimierung wissen sollten

#SUCHEN-FINDEN SEO-Content Marketing und Content Seeding

Suchmaschinen. Anwendung RN Semester 7. Christian Koczur

Erfolg. 10 Schritte. zum Franz-Rudolf Borsch frborsch.de

Transkript:

Web Marshals Fighting Curly Link Farms Evgeny Anisiforov Freie Universität Berlin 03.06.2009 1 Pagerank Algorithm Ermöglicht die Gewichtung verlinkter Dokumente (z.b. im Web) PR i = (1 d) + d j {(j,i)} PR j C j (1) Ein zufälliger Surfer befindet sich mit einer bestimmten Wahrscheinlichkeit auf einer Website, die sich aus deren PageRank herleiten lässt. PageRank wird von Google für die Positionierung der Seiten in den Suchergebnissen benutzt und stellt somit einen wichtigen wirtschaftlichen Faktor für viele im Internet tätige Unternehmen dar. 2 Link Farmen Eine Methodik, die es ermöglicht den PageRank künstlich hochzutreiben Eine Link Farm ist eine Menge automatisch erzeugter Seiten, die sich gegenseitig verlinken und alle (oder die meisten) einen Link auf die Zielseite P enthalten, deren Ranking beeinflusst werden soll Es werden Links auf die unterschiedlichen Seiten der Farm durch Spamming in Foren, Blogs und anderen Internetseiten gesetzt Die Farm verstärkt den Einfluss der gesetzten Links Abbildung 1: Die Struktur einer Link Farm. Quelle: F. Luccio und L. Pagli - Web Marshals Fighting Curly Link Farms 1

3 Das Problem Es wird ein Verfahren gesucht, um eine bekannt gewordene Link Farm mit geringem Aufwand unschädlich zu machen (ihren Einfluss auf das Ranking der Zielseite zu eliminieren). Annahme 1: Link Farmen haben eine Grundordnung, die mathematisch beschrieben werden kann. Annahme 2: die Suchmaschinen schicken sog. Web Marshals los, wenn eine Linkfarm entdeckt wird. Das Ziel ist es die Farm unschädlich zu machen. Die Web Marshals verändern die Links in den Seiten der Farm, sodass die Zielseite nicht mehr vom höheren Ranking profitiert. Annahme 3: Link Farmen haben einen Schutzmechanismus gegen WebMarshals. Die Adresse der Zielseite wird periodisch zwischen den einzelnen Seiten der Farm abgeglichen. Bei Unstimmigkeiten wird die URL durch Mehrheitsentscheidung bestimmt (50%). Fragestellung: finde ein Verfahren, um eine Link Farm durch Web Marshals mit geringstmöglichem Aufwand unschädlich zu machen (synchron / asynchron) 4 Graphides cincinnatae Ein graphis cincinnata C in (L) ist ein Graph mit den Knoten v 0, v 1,.., v n 1. Jeder Knoten v i ist in einem solchen Graph verbunden mit v i+j und v i j für jedes j in der Liste L. Abbildung 2: Graphides cincinnatae C in (1, 2, 3) und C in (1, 4). Quelle: F. Luccio und L. Pagli - Web Marshals Fighting Curly Link Farms 2

5 Algorithmen 5.1 Algorithmus 1: synchrone Marshals Sei ein Graphis cincinnatae der Form C in (1..k) gegeben. Zum Entschärfen werden m = k + 1 synchrone Marshals auf die Farm geschickt. Abbildung 3: Graphides cincinnatae C in (1, 2), die durch drei Marshals mit dem Algorithmus 1 entschärft wird. Quelle: F. Luccio and L. Pagli - Web Marshals Fighting Curly Link Farms Dieser Algorithmus lässt sich für die allgemeinere Form einer Link Farm F C in (L) erweitern: mit k = max(l) funktioniert das Verfahren für eine beliebige Liste L von Indizes. 3

Abbildung 4: Graphides cincinnatae C in (1, 3), die durch vier Marshals mit dem angepassten Algorithmus 1 entschärft wird. Quelle: F. Luccio und L. Pagli - Web Marshals Fighting Curly Link Farms 5.2 Algorithmus 2: asynchronous Marshals Sei ein Graphis cincinnatae der Form C in (L) gegeben. Zum Entschärfen werden k + 2 asynchrone Marshals auf die Farm geschickt. Ein Marshal gilt dabei als Anführer und koordiniert die Anderen k + 1 Marshals. 4

5.3 Andere Graphide Eine Link Farm wird automatisch durch einen Spamming Algorithm aufgebaut. Sie wird daher immer eine Grundordnung haben. Aber Abwandlungen möglich: Knoten mit Links unterschiedlicher Länge (also Basis L) Knoten mit unterschiedlicher Anzahl von Links Abbildung 5: Graphides cirratae. Quelle: F. Luccio und L. Pagli - Web Marshals Fighting Curly Link Farms Algorithmus 1 und 2 leicht angepassbar, um Link Farms mit Links unterschiedlicher Länge und Knoten unterschiedlicher Anzahl von Links zu entschärfen Knoten v 0 ist der Knoten mit dem längsten Link k = die Länge des längsten Links Literatur [1] Der PageRank-Algorithmus http://pr.efactory.de/ d-pagerank-algorithmus.shtml letzter Zugriff am 01.06.2009 [2] Fabrizio Luccio, Linda Pagli. Web Marshals Fighting Curly Link Farms Fun with Algorithms, 4th International Conference, FUN 2007, Castiglioncello, Italy, June 3-5, 2007, Proceedings, pp. 240-248 5