Algorithmische Methoden zur Netzwerkanalyse



Ähnliche Dokumente
Algorithmische Methoden zur Netzwerkanalyse

Kombinatorische Optimierung

Algorithmische Methoden zur Netzwerkanalyse Vorlesung für den Bereich Master Informatik

Algorithmen II Vorlesung am

Algorithmische Methoden für schwere Optimierungsprobleme

Algorithmische Methoden zur Netzwerkanalyse Vorlesung für den Bereich Master Informatik

Kombinatorische Optimierung

Das Briefträgerproblem

Theoretische Grundlagen der Informatik

WS 2009/10. Diskrete Strukturen

Algorithmen & Datenstrukturen 1. Klausur

Graphenalgorithmen und lineare Algebra Hand in Hand Vorlesung für den Bereich Diplom/Master Informatik

Das Dilemma des Einbrechers Wer die Wahl hat, hat die Qual!

Grundbegriffe der Informatik

Grundbegriffe der Informatik

Algorithmen und Datenstrukturen

2.5. VERBINDUNGSNETZWERKE GESTALTUNGSKRITERIEN DER NETZWERKE TOPOLOGIE ALS GRAPH. Vorlesung 5 TOPOLOGIE: DEFINITIONEN : Sei G = (V, E) ein Graph mit:

Abschnitt: Algorithmendesign und Laufzeitanalyse

1 topologisches Sortieren

3.1 Konstruktion von minimalen Spannbäumen Es gibt zwei Prinzipien für die Konstruktion von minimalen Spannbäumen (Tarjan): blaue Regel rote Regel

Algorithmentheorie Maximale Flüsse

Algorithmische Methoden zur Netzwerkanalyse

4. Lernen von Entscheidungsbäumen. Klassifikation mit Entscheidungsbäumen. Entscheidungsbaum

Algorithmische Mathematik

Vorlesung Diskrete Strukturen Graphen: Wieviele Bäume?

Kapitel 6. Komplexität von Algorithmen. Xiaoyi Jiang Informatik I Grundlagen der Programmierung

Grundlagen der Theoretischen Informatik, SoSe 2008

13. Binäre Suchbäume

Wie Google Webseiten bewertet. François Bry

Entscheidungsbäume. Definition Entscheidungsbaum. Frage: Gibt es einen Sortieralgorithmus mit o(n log n) Vergleichen?

Literatur. Dominating Set (DS) Dominating Sets in Sensornetzen. Problem Minimum Dominating Set (MDS)

Konzepte der Informatik

Seminarvortag zum Thema Virtual Private Network Design im Rahmen des Seminars Network Design an der Universität Paderborn

Algorithmen und Datenstrukturen 2

Lichtbrechung an Linsen

Kombinatorische Optimierung

Tutorium Algorithmen & Datenstrukturen

Suche in Spielbäumen Spielbäume Minimax Algorithmus Alpha-Beta Suche. Suche in Spielbäumen. KI SS2011: Suche in Spielbäumen 1/20

Komplexe Netzwerke Robustheit

Formale Systeme. Binary Decision Diagrams. Prof. Dr. Bernhard Beckert WS 2010/2011 KIT INSTITUT FÜR THEORETISCHE INFORMATIK

Datenstrukturen & Algorithmen

Eine Baumstruktur sei folgendermaßen definiert. Eine Baumstruktur mit Grundtyp Element ist entweder

Guten Morgen und Willkommen zur Saalübung!

Mandanteninformation Die neue amtliche Muster-Widerrufsbelehrung Art Abs. 3 Satz 1 Anlage 1 EGBGB

Peer-to-Peer- Netzwerke

Wir unterscheiden folgende drei Schritte im Design paralleler Algorithmen:

Informatik-Sommercamp Mastermind mit dem Android SDK

EndTermTest PROGALGO WS1516 A

Lernziele: Ausgleichstechniken für binäre Bäume verstehen und einsetzen können.

Häufige Item-Mengen: die Schlüssel-Idee. Vorlesungsplan. Apriori Algorithmus. Methoden zur Verbessung der Effizienz von Apriori

Die Komplexitätsklassen P und NP

Grundbegriffe der Informatik

Analyse des Normennetzwerks der Internet Requests for Comments

t r Lineare Codierung von Binärbbäumen (Wörter über dem Alphabet {, }) Beispiel code( ) = code(, t l, t r ) = code(t l ) code(t r )

Constraint-Algorithmen in Kürze - Mit der Lösung zur Path-Consistency-Aufgabe 9

Kapiteltests zum Leitprogramm Binäre Suchbäume

8 Diskrete Optimierung

Algorithmen und Datenstrukturen Suchbaum

2. Lernen von Entscheidungsbäumen

Effiziente Algorithmen und Datenstrukturen I. Kapitel 10: Lineare Algebra

Mächtigkeit von WHILE-Programmen

Suchen und Sortieren Sortieren. Heaps

Maximizing the Spread of Influence through a Social Network

Einführung in. Logische Schaltungen

Datenstrukturen und Algorithmen

Teil III: Routing - Inhalt I. Literatur. Geometric Routing. Voraussetzungen. Unit Disk Graph (UDG) Geometric Routing 29

Viele Bilder auf der FA-Homepage

Exploration und Klassifikation von BigData

Tutorium Rechnerorganisation

Idee: Wenn wir beim Kopfknoten zwei Referenzen verfolgen können, sind die Teillisten kürzer. kopf Eine Datenstruktur mit Schlüsselwerten 1 bis 10

Eine molekulare Lösung des Hamiltonkreisproblems mit DNA

6.2 Perfekte Sicherheit

Select & Preprocessing Cluster. SPP Server #1. SPP Server #2. Cluster InterConnection. SPP Server #n

Fragebogen: Abschlussbefragung

Markovketten. Bsp. Page Ranking für Suchmaschinen. Wahlfach Entscheidung unter Risiko und stat. Datenanalyse

Organic Computing: Peer-to-Peer-Netzwerke

Gliederung. Definition Wichtige Aussagen und Sätze Algorithmen zum Finden von Starken Zusammenhangskomponenten

Drahtlosnetzwerke automatisch konfigurieren mit WCN (Windows Connect Now) unter Windows Vista

Numerische Verfahren und Grundlagen der Analysis

Information Systems Engineering Seminar

Grundlagen der Künstlichen Intelligenz

Sortieren durch Einfügen. Prof. Dr. W. Kowalk Sortieren durch Einfügen 1

Erstellung botoptimierter Partnerlinks

Grundbegriffe der Informatik

Datenbanksysteme 2 Frühjahr-/Sommersemester Mai 2014

Print2CAD 2017, 8th Generation. Netzwerkversionen

Definition und Begriffe

Informationsblatt Induktionsbeweis

Algorithmische Methoden zur Netzwerkanalyse Vorlesung 14, Henning Meyerhenke

Programmierkurs Java

Diana Lange. GENERATIVE GESTALTUNG Arten des Zufalls

Anmerkungen zur Übergangsprüfung

Einfache Ausdrücke Datentypen Rekursive funktionale Sprache Franz Wotawa Institut für Softwaretechnologie

Outlook. sysplus.ch outlook - mail-grundlagen Seite 1/8. Mail-Grundlagen. Posteingang

Gemeinsamkeiten und Unterschiede bei der Anwendung für die Analyse von Geschäftsprozessen

WS 2008/09. Diskrete Strukturen

Regionen in Binärbildern

Transkript:

Algorithmische Methoden zur Netzwerkanalyse Juniorprof. Dr. Henning Meyerhenke Institut für Theoretische Informatik 1 KIT Henning Universität desmeyerhenke, Landes Baden-Württemberg Institutund für Theoretische Informatik nationales Algorithmische Forschungszentrum Methoden in der Helmholtz-Gemeinschaft zur Netzwerkanalyse www.kit.edu

Vorlesung 13 Programm des Tages: Generierung von Graphen Barabási-Albert-Modell Chung-Lu-Modell R-MAT-Graphen 2 Henning Meyerhenke, Institut für Theoretische Informatik

Wiederholung Realisierbarkeit von Gradfolgen: Satz von Erdös und Gallai 3 Henning Meyerhenke, Institut für Theoretische Informatik

Inhalt Das Barabási-Albert-Modell Das Chung-Lu-Modell R-MAT-Graphen 4 Henning Meyerhenke, Institut für Theoretische Informatik Das Barabási-Albert-Modell

Das Barabási-Albert-Modell Preferential Attachment Ziele: Gradverteilung ähnlich wie bei realen komplexen Netzwerken Community-Struktur Kleiner Durchmesser Parameter: n: Zahl der Knoten c: Grad eines neuen Knotens Idee: Neuer Knoten verbindet sich zu c bereits bestehenden, Wkt. abhängig vom Grad der anderen Knoten 5 Henning Meyerhenke, Institut für Theoretische Informatik Das Barabási-Albert-Modell

Das Barabási-Albert-Modell Generierung Initial: Nicht genau festgelegt Mindestens c Knoten Bspw. Pfad oder Clique mit c Knoten Einfügen eines Knotens v: c ungerichtete Kanten {v, u} zufällig einfügen Wkt. proportional zum Knotengrad von u Weder Knoten noch Kanten werden jemals entfernt! Beispiel: Siehe Tafel! 6 Henning Meyerhenke, Institut für Theoretische Informatik Das Barabási-Albert-Modell

Das Barabási-Albert-Modell Eigenschaften Proposition (Gradverteilung) Im BA-Modell ergibt sich die Gradverteilung für k c. p k = 2c(c + 1) k(k + 1)(k + 2) Daraus resultiert im Grenzwert eine Power-Law-Gradverteilung mit p k k 3 7 Henning Meyerhenke, Institut für Theoretische Informatik Das Barabási-Albert-Modell

Das Barabási-Albert-Modell Diskussion Vorteile: Einfach zu beschreiben Wenige Parameter Gradverteilung folgt Potenzgesetz Nachteile: Gradverteilung hat festen Power-Law-Exponenten Generierung inhärent sequentiell 8 Henning Meyerhenke, Institut für Theoretische Informatik Das Barabási-Albert-Modell

Inhalt Das Barabási-Albert-Modell Das Chung-Lu-Modell R-MAT-Graphen 9 Henning Meyerhenke, Institut für Theoretische Informatik Das Chung-Lu-Modell

Das Chung-Lu-Modell (CL) Ziele: Vorgegebene Gradverteilung Community-Struktur Kleiner Durchmesser (Parallele Generierung) Parameter: Erwartete Gradfolge D 10 Henning Meyerhenke, Institut für Theoretische Informatik Das Chung-Lu-Modell

Das Chung-Lu-Modell (CL) Generierung Einfügen einer Kante {u, v}: Weder Knoten noch Kanten werden jemals entfernt Kante {u, v} wird mit Wkt. p uv generiert p uv deg(u) deg(v), typischerweise deg(u) deg(v)/ v V deg(v ) p uv unabhängig pro Kante Schleifen sind erlaubt Ähnlichkeiten: Bei D = (pn, pn,..., pn) entspricht CL dem G(n, p)-modell Ähnlich zu SKG- bzw. R-MAT-Modell (später...) 11 Henning Meyerhenke, Institut für Theoretische Informatik Das Chung-Lu-Modell

Das Chung-Lu-Modell Eigenschaften Sei β der Power-Law-Exponent der Gradfolge D. Proposition (Gradverteilung) Im CL-Modell ergibt sich bei absteigender Sortierung von D die Gradverteilung E[deg(v)] = κv 1/(β 1) für κ = β 2 β 1 d n 1/(β 1) und d als arithmetisches Mittel von D. 12 Henning Meyerhenke, Institut für Theoretische Informatik Das Chung-Lu-Modell

Das Chung-Lu-Modell Diskussion Vorteile: Einfach und effizient Beliebige erwartete Gradfolge wird nachgebildet Nachteile: (Eher wenig verwendet) Ähnlichkeiten: Sehr ähnlich zu SKG/R-MAT 13 Henning Meyerhenke, Institut für Theoretische Informatik Das Chung-Lu-Modell

Inhalt Das Barabási-Albert-Modell Das Chung-Lu-Modell R-MAT-Graphen 14 Henning Meyerhenke, Institut für Theoretische Informatik R-MAT-Graphen

Rekursiver Matrix-Generator R-MAT Einführung Ziele: Gradverteilung ähnlich wie bei realen komplexen Netzwerken Community-Struktur Kleiner Durchmesser Skalierbarkeit Parameter: N = 2 n : Zahl der Knoten E: Zahl der Kanten (a, b, c, d): Wkt. für die rekursiven Quadranten der R-MAT-Matrix Generierung einer Kante: Siehe Tafel! 15 Henning Meyerhenke, Institut für Theoretische Informatik R-MAT-Graphen

Bitweise Interpretation der Generierung Für 1 t n assoziieren wir den t-ten Quadranten mit dem t-ten Bit von i und j (v. l. n. r.). Beispiel: Generierung von Kante (i, j) = (21, 7) Schritt 1 2 3 4 5 Quadrant UL OL UR OR UR Bits von i 1 10 101 1010 10101 Bits von j 0 00 001 0011 00111 OL: Oben Links (00) OR: Oben Rechts (01) UL: Unten Links (10) UR: Unten Rechts (11) 16 Henning Meyerhenke, Institut für Theoretische Informatik R-MAT-Graphen

Kontext Literaturhinweise Deepayan Chakrabarti, Yiping Zhan, Christos Faloutsos: R-MAT: A recursive model for graph mining. In Proc. SIAM Data Mining (SDM 04). SIAM, 2004. Chris Groër, Blair D. Sullivan, and Steve Poole: A mathematical analysis of the R-MAT random graph generator. Netw. 58, 3 (October 2011), 159-170. http://www.graph500.org/ 17 Henning Meyerhenke, Institut für Theoretische Informatik R-MAT-Graphen

Example 1: The generation of the edge ij depicted in Figure 1 requires five steps. We begin Algorithmus in Step 0 with 5 empty bit positions for both i and j (these are denoted with a ) and then set each bit to 0 or 1 moving from left to right based on the quadrant selected at each step. Aus [Groër et al., S.4] Algorithm 1 Given parameters,,, with + + + = 1, generate a 0/1-adjacency matrix A = {a ij } for a graph on 2 k vertices containing at most M edges. 1: Set a ij =0for0apple i, j apple 2 k 1 2: for m =1toM do 3: Set i =0,j = 0 // Initialize all bits to 0 4: for t =0tok 1 do 5: Generate r U(0, 1) 6: if r 2 [, + ) then 7: j = j +2 k 1 t // Set bit to 1 in j 8: else if r 2 [ +, + + ) then 9: i = i +2 k 1 t // Set bit to 1 in i 10: else if r 2 [ + +, 1) then 11: i = i +2 k 1 t and j = j +2 k 1 t // Set bit to 1 in i and j 12: end if 13: end for 14: a ij = a ij +1 15: end for 16: Replace all nonzero entries in A with ones Beispiel: Siehe Tafel! 2.3 Preliminaries 18 Henning Meyerhenke, Institut für Theoretische Informatik WeAlgorithmische now give a Methoden number of zurdefinitions Netzwerkanalyse and basic lemmas necessary for our analysis of graphsr-mat-graphen

Kanten und Grade Lemma (Kantenwkt., (Groër et al.)) Die Wkt., eine Kante e = (u, v) in einer Iteration zu generieren, ist p(e) = p(u, v) = a e a b e bc e c d e d. Hierfür gilt, dass bei der Generierung e a mal Quadrant OL, e b mal OR usw. gewählt wurde. Theorem (Knotengrade (Groër et al.)) Sei u ein Knoten im Graphen G, der aus G durch Entfernung von Duplikaten hervorgegangen ist. G wurde als R-MAT-Graph mit N = 2 n Knoten und M = O(N) erzeugt. Dann gilt bei N, M für fast alle Knoten u: d + G (u), d G (u) und d G (u) sind asymptotisch normalverteilt. 19 Henning Meyerhenke, Institut für Theoretische Informatik R-MAT-Graphen

Diskussion Frage: Was kommt raus, wenn 1/4 = a = b = c = d? Mehrfachkanten treten auf, nicht immer gewollt! Vermeidung oft nicht praktikabel Neue experimentelle Auswertungen: Community-Struktur nicht so stark ausgeprägt wie gewünscht Zahl der Dreiecke unterdurchschnittlich Frage: Warum? Ausblick: Andere Modelle 20 Henning Meyerhenke, Institut für Theoretische Informatik R-MAT-Graphen