Mining the Network Value of Customers

Größe: px

Ab Seite anzeigen:

Download "Mining the Network Value of Customers"

Ludo Hauer
vor 7 Jahren
Abrufe

1 Mining the Network Value of Customers Seminar in Datamining bei Prof. Fürnkranz Benjamin Herbert Technische Universität Darmstadt Sommersemester / 34

2 1 2 Werbung Netzwerkwert 3 Bezeichnungen Ansatz Das Expected Lift in Profit 4 Information Training Experimente Zusammenfassung 5 2 / 34

3 Werbung Werbung Netzwerkwert Zweck Bedürfnisse ansprechen Neugier wecken Informieren, überzeugen Hier: Kaufentscheidung beeinflussen Ausgaben in Deutschland: > 30Mrd. in 2006 Zuwachs +2.1% gegenüber 2006 Produktwerbung sinnvoll, wenn Gewinn > Kosten 3 / 34

4 Bewertung Werbung Netzwerkwert Intrinsischer Wert Misst Umsatzsteigerung für best. Kunden durch Werbung Betrachtet keine Beziehungen Kein genauer Wert Netzwerkwert Hoher Einfluss von Freunden, Familie,... Netzwerkwert als Maß für Einfluss Kostengünstig effektiv werben Domingos und Richardson(2002): ELP - Expected Lift in Profit 4 / 34

5 Virales Marketing Werbung Netzwerkwert Prinzip Beispiel Nutzt bestehende Netzwerke aus Verbreitung über Verbindnugen Normalerweise Mundpropaganda ICQ Hotmail oder andere Fre Dienste Blair-Witch Project: $ Kosten, 250 Mio $ Einnahmen bis Ende / 34

6 Bezeichnungen Bezeichnungen Ansatz Das Expected Lift in Profit Kunden System von n potentiellen Kunden/Käufern X = {X 1,..., X n } X i = 1 wenn Kunde i Produkt kauft Kunden X k : Kaufentscheidung bekannt X u : Kaufentscheidung unbekannt 6 / 34

7 Bezeichnungen(fortges.) Bezeichnungen Ansatz Das Expected Lift in Profit Nachbarn N i = {X i,1, X i,2,..., X i,ni } X {X i } Unbekannte Nachbarn = N i X u N u i Unabhängigkeit X i ist nur abhängig von N i (Markov Generalisierung) X i ist unabhängig von X N i {X i } 7 / 34

8 Bezeichnungen(fortges.) Bezeichnungen Ansatz Das Expected Lift in Profit Werbung M = {M 1, M 2,..., M n } M i = 1 wenn i Werbung erhält Produkt Verschiedene Attribute: Y = {Y 1, Y 2,..., Y m } 8 / 34

9 Ansatz Bezeichnungen Ansatz Das Expected Lift in Profit Netzwerk ierung als Soziales Netzwerk Knoten: potentielle Käufer/Kunden Kanten: Beziehungen/Einfluss untereinander um ELP zu berechnen Effekt ausnutzen um Marketing zu optimieren Markov Random Field Zustand nur von Nachbarn abhängig Wahrscheinlichkeitsverteilung von Zufallsvariablen 9 / 34

10 Das Bezeichnungen Ansatz Das Expected Lift in Profit Verteilung der Wahrscheinlichkeit Für alle X i / X k gilt: P(X i X k, Y, M) = C(N u i ) C(N u i ) P P (X i N i, Y, M) P ( ) X i, Ni u X k, Y, M = ( ) Ni u X k, Y, M Erklärung C (N u i ) Alle Kombinationen der unbekannten Nachbarn von i Verbundwahrscheinlichkeit P (A, B) = P (A B) P (B) 10 / 34

11 Das (fortges.) Bezeichnungen Ansatz Das Expected Lift in Profit Approximation nach Pelkowitz P (X i N i, Y, M) P durch C(N u i ) C(N u i ) P (X i N i, Y, M) X j N u i ( ) Ni u X k, Y, M P ( ) X j X k, Y, M Iteratives Lösen Netzwerkloser Ansatz P(X i Y, M) Relaxation Labeling (vgl. Vortrag von Björn Heidenreich) 11 / 34

12 Das (fortges.) Bezeichnungen Ansatz Das Expected Lift in Profit Weitere Umformungen NaïveBayes Ansatz für X i als Funktion aus N i, Y 1,..., Y m und M i P (X i N i, Y, M) = P (X i N i, Y, M i ) = P(X i)p (N i, Y, M X i ) P (N i, Y, M) = P(X i)p (N i X i ) P (M i X i ) m P (Y k X i ) P (N i, Y, M) = P (X i N i ) P (M i X i ) P (Y, M i N i ) k=1 m P (Y k X i ) k=1 12 / 34

13 Das (fortges.) Bezeichnungen Ansatz Das Expected Lift in Profit Anwendung auf Netzwerkwert vereinfacht auf Berechnung von P (X i ), P (X i N i ), P (M i X i ), P (Y k X i ) k Bis auf P (X i N i ) kann alles aus den Daten berechnet werden. (NaïveBayes Ansatz, Zählen) 13 / 34

14 ELP Bezeichnungen Ansatz Das Expected Lift in Profit ELP für Kunden i in Isolation Erklärung ELP i (X k, Y, M) = r 1 P(X = 1 X k, Y, f 1 i (M)) r 0 P(X = 1 X k, Y, f 0 i (M)) c M Marketingvektor 0 oder 1 r 0 Einnahmen ohne Werbung r 1 Einnahmen mit Werbung f 1 x M[i] = x c Marketingkosten (für i) 14 / 34

15 ELP (fortges.) Bezeichnungen Ansatz Das Expected Lift in Profit Globaler ELP für Werbemßnahme M n ELP(X k, Y, M) = r i P(X i = 1 X k, Y, M) r 0 Erklärung i=1 n P(X i = 1 X k, Y, M 0 ) M c i=1 M Marketingaktionen 0 oder 1 M Anzahl der 1 Einträge in M 15 / 34

16 ELP maximieren Bezeichnungen Ansatz Das Expected Lift in Profit Problem Besten Werte für M finden, ELP maximieren. Alle Kombinationen betrachten. Viele Kombinationen, approximierte Lösung für Werbmemaßnahme M Single Pass i setze M i = 1 falls ELP(X k, X, f 1 i (M 0 )) > 0 sonst M i = 0 Vergleich mit Anfangszustand ohne Werbung 16 / 34

17 ELP maximieren (fortges.) Bezeichnungen Ansatz Das Expected Lift in Profit Greedy Suche Starte mit M = M 0 Für jedes M i : if ELP(X k, Y, fi 1 (M)) > ELP(X k, Y, M) setze M i = 1 Wdh. bis keine Verbesserung gefunden Vergleich bezieht Änderungen mit ein Hill-Climbing Suche Starte mit M = M 0 { 1. Berechne argmax i ELP(X k, Y, fi 1 (M)) } { 2. Berechne argmax i ELP(X k, Y, fi 1 (fi 1 1 (M))) } Bis keine Verbesserung mehr erfolgt 17 / 34

18 Ergebnis Bezeichnungen Ansatz Das Expected Lift in Profit Ergebnis Optimale Werbemaßnahme als Vektor 18 / 34

19 Information Training Experimente Zusammenfassung EachMovie Kollaboratives Filtern Betreiber HP Compaq Research (früher DEC Research) frei zugänglich bis Oktober ,811,983 Bewertungen von 0 bis 5 72,916 Benutzer 1628 Filme 19 / 34

20 Daten Information Training Experimente Zusammenfassung Daten 75% d. Bewertungen (0-5 Sterne) für Filme von vor Januar 1996 Später erschienene Filme haben weniger Bewertungen (Information) Trainingsdaten = S old und S recent Aufteilung in Trainings- und Testdaten Filme geringer Wahrscheinlichkeit wurden entfernt(hier 1% der Nutzer) 20 / 34

21 Training Information Training Experimente Zusammenfassung Extraktion aus P (X i ) Apriori Wahrscheinlichkeit: Anteil der von i bewerteten Filme P (Y k X i ) Anzahl der Werte für jeden Wert X i P (M i X i ) Durch Datensammlung berechenbar (Testphase) P (X i N i ) Abhängig von Einfluss der Nachbarn, hier Pearson Korrelation Koeffizient Nachbarn Einfluss von Nachbarn durch P (X i R ) i Unbekannte Bewertungen werden hier durch Naïve Bayes angenähert 21 / 34

22 Experimente Information Training Experimente Zusammenfassung Y = Genre(Action, Familie, Horror, Thriller,...) X i Nutzer i hat Film gesehen R i Wertung eines Nutzers Nur fünf Nachbarn betrachtet in KF Algorithmus. 22 / 34

23 Experimente (fortges.) Information Training Experimente Zusammenfassung Strategien Direktmarketing: isolierter ELP betrachtet Netzwerkbasiertes Marketing: durch globales ELP ermittelte Werbeaktion M Verschiedene Szenarien und Algorithmen Szenarien Free movie: r 0 = 1 r 1 = 0 Discounted Movie r 0 = 1 r 1 = 0.5 Advertising r 0 = 1 r 1 = 1 Faktor α: Werbung für Leute mit Grundinteresse hat höheren Effekt Beeinflusst P(M i X i ) 23 / 34

24 Bewertung Information Training Experimente Zusammenfassung Ergebnis Beispiel Filmbewertungen = Anzahl, die Film gesehen haben Profit: Durchschnittl. Seherzahl - Kosten Durschnitt: 311 Ergebnis Free movie Szenario: 2057 bis 2712 für Massenmarketing (Erinnerung: r 0 = 1) 24 / 34

25 Experimente (fortges.) Information Training Experimente Zusammenfassung 25 / 34

26 Experimente (fortges.) Information Training Experimente Zusammenfassung 26 / 34

27 Experimente (fortges.) Information Training Experimente Zusammenfassung 27 / 34

28 Experimente (fortges.) Information Training Experimente Zusammenfassung 28 / 34

29 Netzwerkwert Information Training Experimente Zusammenfassung Verteilung des Netzwerkwerts für Film Space Jam X : Rang Y : Entspricht Werbung für y weitere Kunden 29 / 34

30 Zusammenfassung Information Training Experimente Zusammenfassung aus ELP berechnen Werbemaßnahme verbessern Verbesserter Nutzen gegenüber Direktmarketing Sehr unterschiedliche Laufzeiten, aber ähnliche Ergebnisse 30 / 34

31 Ende Information Training Experimente Zusammenfassung Noch Fragen? Vielen Dank für Eure Aufmerksamkeit! 31 / 34

32 Ende Information Training Experimente Zusammenfassung Noch Fragen? Vielen Dank für Eure Aufmerksamkeit! 31 / 34

33 Collaboratives Filtern Idee Vorhersage von Werten für Nutzer Basis: Werte der Nachbarn Nachbarn: n ähnlichste Benutzer Ähnlichkeitsmaß erforderlich 32 / 34

34 Ähnlichkeitsmaß Pearson Koeffizient W ij = k (R ik R i )(R jk R j ) k (R ik R i ) 2 k (R jk R j ) 2 i, j Nutzer R ik R jk R i R j Bewertung von i für k Bewertung von j für k Arithmetisches Mittel der Bewertungen von i Arithmetisches Mittel der Bewertungen von j 33 / 34

35 Vorhersage Pearson Koeffizient N i ˆR = R i + ρ X j N i W ij (R jk R j ) 1 ρ Normalisierungsfaktor X j N W ij i n Nachbarn N i durch Pearson Korrelation bestimmt 34 / 34

Ähnliche Dokumente

Recommender Systeme mit Collaborative Filtering

Recommender Systeme mit Collaborative Filtering Fakultät für Informatik Technische Universität München Email: rene.romen@tum.de 6. Juni 2017 Recommender Systeme Definition Ziel eines Recommender Systems ist es Benutzern Items vorzuschlagen die diesem