Motivation Kenngrößen von Graphen Modelle. Small Worlds. in Vorlesung Semantische Suche in P2P-Netzwerken. Florian Holz

Small Worlds in Vorlesung Florian Holz 14.06.2005 in Vorlesung Small Worlds Florian Holz

bekannte Arten der Vernetzung zur Zusammenarbeit (Graphen) regelmäßige, z.b. parallele Hardwarestrukturen vollständige Netze d-dimensionales Gitter/Torus Hypercube (siehe Vorlesung Verbessertes Flooding)... realexistierende Netze/natürliche Graphen Internet soziale Netzwerke, z.b. Bekannschaftsnetzwerke biologische Netzwerke, z.b. Nervensysteme, Metabolismen...

Regelmäßige Graphen sind interessant, wenn beim Kooperationsmodell immer klar ist, wer wofür zuständig ist (siehe Vorlesung Distributed Hashtables). Die natürlichen Graphen sind interessant, weil Milgram the small world problem an den Tag brachte [1]. Das ist von Interesse, weil die Suche nach Information in einem P2P-System als Suche nach Personen/Peers mit dieser Information modelliert, von der Struktur des Netzwerkes, eben ähnlich unserem sozialen Netzwerk, erst ermöglicht wird.

Milgrams Experiment Milgram untersuchte das soziale Netzwerk, indem er Startpersonen Briefe gab, die sie an Zielpersonen weiterleiten sollten. Über die Zielperson waren Name, Stadt und Beruf bekannt, und die Briefe durften nur durch Übergabe an direkt persönlich Bekannte ( on a first-name basis ) weitergeleitet werden, bis sie die Zielperson erreicht hatten. 44 vollständige Ketten deren mittlere Weglänge 6 Stationen six degrees of separation, small world Folgerung: das Bekanntschaftsnetzwerk hat bestimmte, noch genauerzufassende, uns interessierende Eigenschaften

charakteristische Weglänge Definition Sei L u,v der kürzeste Weg zwischen den Knoten u und v eines (stark)zusammenhängenden Graphens mit n Knoten, dann ist die mittlere/charakteristische Weglänge L L := ( 1 n ) L u,v 2 u,vɛv

Clusterkoeffizient I Der lokale Clusterkoeffizient eines Knotens v ist das Verhältnis der existierenden Kanten zwischen seinen Nachbarn zur maximal möglichen Anzahl Kanten zwischen ebendiesen. Definition Sei G N(v) der Subgraph vom Graphen G, der alle Nachbarn von v und deren Kanten untereinander enthält, E die Anzahl der Kanten und V die Anzahl der Knoten eines Graphen, dann ist der lokale Clusterkoeffizient von v G E N(v) C v := ( ) GN(v) V 2

Clusterkoeffizient II Definition Der lokale Clusterkoeffizient eines Graphen G ist das arithmetische Mittel der lokalen Clusterkoeffizienten seiner Knoten: C := 1 n vɛv C v

regelmäßige Graphen allg. Torus mit n Knoten, jeder k (Ausgangs)kanten, mit n k ln(n) 1 (k ln(n) damit der Graph zusammenhängt) lange charakteristische Weglänge L n 2k 1 hohen Clusterkoeffizient C 3 4 z.b. Graph mit n = 20 Knoten auf einem 1-dim. Torus, wobei jeder Knoten mit seinen k = 4 nächsten Nachbarn verbunden ist, hat charakteristische Weglänge L = 3.5 Clusterkoeffizient C = 0.5

Erdös Rényi-Zufallsgraphen erster Ansatz, natürliche Graphen zu modellieren 2 Parameter: n Knoten Wahrscheinlichkeit p für die Existenz jeder Kante Eigenschaften (Erwartungswerte für p ln(n) n, entsprechend k = p(n 1) ln(n) mittlere Anzahl Kanten pro Knoten, s.o.): kurze charakteristische Weglänge L ln(n) ln(k) niedriger Clusterkoeffizient C k n 1

das paßte aber noch nicht ganz: regelm. Graphen Small Worlds Zufallsgraphen char. Weglänge lang kurz kurz Clusterkoeff. hoch hoch niedrig Small-World-Graphen vereinen kurze Weglängen mit starker Strukturierung/Clusterung [2] genau das soll für die semantische Suche ausgenutzt werden

Watts & Strogatz I Annahme: Small-World-Graphen liegen wirklich als Modell zwischen den Extremen regelmäßige und Zufallsgraphen Vorgehen: ausgehend vom 1-dim. Torus eine jede Kante mit Wahrscheinlichkeit p zu neuem Zielknoten umlegen (Zielknoten wird gleichverteilt gewählt) für p = 0 ändert sich nichts, für p = 1 ensteht ein Zufallsgraph

Watts & Strogatz II Hypothese: für geeignete p entsteht durch das Neuverdrahten des Graphen ein Small-World-Graph

Watts & Strogatz III Hypothese bestätigt: die umgelegten Kanten erzeugen Abkürzungen/Fernkontakte durch das Netz ohne die Struktur stark zu zerstören

Kleinberg I die Existenz kurzer Wege reicht nicht sondern die Wege müssen auch findbar sein und zwar bei dezentralen Algorithmen allein aufgrund lokaler Informationen über das Netz siehe Milgram, jeder Knoten leitet die Nachricht nur mithilfe seiner lokalen Informationen über das Netz weiter Zielknoten für Fernkontakte dürfen nicht gleichverteilt gewählt werden wie bei Watts & Strogatz

Kleinberg II Knoten auf n n Gitter (v = (v 1, v 2 )) mit Blockdistanz d(u, v) = v 1 u 1 + v 2 u 2

Kleinberg III Auswahl von v als Fernkontakt mit Wahrscheinlichkeit proportional zu d(u, v) r Zeitkomplexität des lokalen Greedy-Routing-Algorithmus, d.h. die Nachricht wird immer an den Nachbar weitergegeben, dessen Koordinaten dem Ziel am nächsten sind, ist abhängig von r

Kleinberg IV Minimum für die erwartete Laufzeit T der Nachricht für r = 2 0 r < 2: T α r n (2 r) 3 r = 2: T α 2 (log n) 2 r > 2: T α r n r 2 r 1 im allg. Fall auf dem d-dim. Torus Minimum für r = d

Kleinberg V Simulationsergebnisse auf einem 2-dim. Torus mit 20 000 20 000 Knoten dargestellt ist der Logarithmus der durchschnittlichen Weglänge ln(t ) in Abhängigkeit von r als Mittel von jeweils 1000 Simulationsläufen mit einem konkreten r

Literatur [1] S. Milgram: The Small-World Problem, Psych.Tod. 2, 60 67 (1967) [2] P. Erdös, A. Rényi: On Random Graphs, Publ. Mathematicae 6, 290 (1959) [3] P. Erdös, A. Rényi: On the Evolution of Random Graphs, Publ. Math. Inst. Hung. Acad. Sci. 5, 17 (1960) [4] D. J. Watts, S. H. Strogatz: Collective Dynamics of Small-world Networks, Nature 393, 440 442 (1998) [5] J. Kleinberg: The Small-world Phenomenon: An Algorithmic Perspective, Cornell Comp. Sci. Tech. Rep. 99-1776 (1999) [6] J. Kleinberg: Navigation in a Small World, Nature 406, 845 (2000)