Miscreants and Misinformation on Twitter Eva Zangerle Ringvorlesung "Datenflut und Informationskanäle" 07.11.2013
/me Eva Zangerle Diplomstudium Informatik, UIBK Promotion Informatik, UIBK PostDoc-Researcher Datenbanken und Informationssysteme, UIBK Social Media (Twitter) Recommender Systems MySQL Graph-Datenbanken 2
Roadmap Twitter Überblick Kriminalität auf Twitter Spam Fake Accounts Hacked Accounts Mensch, Bot oder Cyborg? Zusammenfassung 3
Twitter Bildquelle: tech.fortune.cnn.com
Twitter 1.000.000.000 registrierte Nutzer 250.000.000 aktive Nutzer 100.000.000 aktive Nutzer pro Tag 500.000.000 Tweets pro Tag Rekord für Tweets pro Sekunde: 143.199 (2013-08-02, 25x erhöht) Generation Y (15-34 Jahre alt; 19 Länder) 66% benützen Facebook 29% benützen Twitter 80% loggen sich täglich ein 6
Twitter 7
Kriminalität auf Twitter Bildquelle: gizmodo.co.uk
Ziele personalisierte Informationen sammeln zielgerichtet Informationen verbreiten Benutzer beeinflussen (Meinungsbildung) Daten verkaufen Fake Followers (18$ für 1.000 Followers) Spam Publikum benötigt (Reichweite, Authentizität) Publikum sehr groß Bildquelle: hyphenet.com 9
Spam Spam-Anteil bei Emails: ca. 70% Spam-Anteil auf Social Media Plattformen: ca. 5% Studie: 355% mehr Spam in Social Media Plattformen im ersten Halbjahr 2013 8% aller URLs in Tweets: Betrug, Schadsoftware oder Phishing- Seiten Höhere Click-Through-Raten 0,13% aller Werbe-URLs auf Twitter werden geklickt (~ 4 Mio. Clicks/Tag) 0,003% aller Werbe-URLs in Emails werden geklickt 10
Spam-Studie über fünf Soziale Netzwerke Facebook, Twitter, Google+, YouTube und LinkedIn Erste Hälfte 2013 Abbildung entnommen aus Nexgate 2013 State of Social Media Spam Research Report, nexgate.com. 11
Spam-Studie über fünf Soziale Netzwerke Studie: 355% mehr Spam in Social Media Plattformen im ersten Halbjahr 2013 5 von 7 neuen Accounts auf Social Media-Plattformen sind Spammer 5% aller Apps sind Spammers Facebook und Youtube haben höchsten Spam-Anteil (100- fach) 15% aller Spam-Nachrichten enthalten URLs (Rest: Text-Spam) > 60% aller Spam-Nachrichten auf Twitter enthalten URLs 12
Spam auf Twitter Kategorie Anteil an Spam gratis Musik, Spiele, Bücher, Downloads 29,82% Schmuck, Elektronikartikel, Fahrzeuge 22,22% Glücks- und Gewinnspiele 15,72% Finanzprodukte, Kredite, Immobilien 13,07% Followers gewinnen 11,18% Abnehmen 3,10% Pornographie 2,83% Charity 1,65% Medikamente 0,27% Antivirus-Software 0,14% 13
Arten von Spam auf Twitter Call Outs Win an itouch AND a $150 Apple gift card http://spam.com Retweets RT @scammer: check out the Ipads there having a give-away http://spam.com Tweet Hijacking http://spam.com RT @barackobama A great battle is ahead of us Trend Setting Buy more followers! http://spam.com #fwlr Trend Hijacking Help donate to #haiti relief: http://spam.com Unsolicited Mentions Great ipads here http://spam.com @eva_zangerle @dbisibk Kategorisierung basierend auf Grier et al.: @spam: The Underground in 140 Characters or Less 14
Verbreitung von Spam auf Twitter Cyber-Kriminelle verwenden meist folgende Herangehensweisen: Kompromittieren/Hacken von bestehenden Accounts Anlegen falscher Twitter-Accounts Erzeugen eines Bots Erzeugen eines Cyborgs Identitätsdiebstahl (vermehrt auf anderen SN) Twitter Spam-Filter muss umgangen werden zielgerichtete Werbung wird auch von Twitter verkauft 15
Spam auf Twitter Twitter-Erkennungsalgorithmus für Spam-Accounts Frequenz der Tweets duplizierte Tweets URLs in den Tweets viele Follow,- und Unfollow-Vorgänge ähnliche Tweets, Vorgehensweisen über mehrere Accounts hinweg viele weitere (unbekannte) Charakteristika 16
Eigenschaften von Spam-Accounts Tweet-Frequenz Verteilung über die Klassen (I) 34% (II) 10% (III) 56% Abbildung entnommen aus Kurt Thomas et al. Suspended accounts in retrospect: an analysis of twitter spam. In Proceedings of the 2011 ACM SIGCOMM conference on Internet measurement conference (IMC '11). ACM, New York, NY, USA, 243-258. 17
Eigenschaften von Spam-Accounts Beziehungen (Followers, Friends) B s friend Abbildung entnommen aus K. Thomas et al. Suspended accounts in retrospect: an analysis of twitter spam. In Proceedings of the 2011 ACM SIGCOMM conference on Internet measurement conference (IMC '11). ACM, New York, NY, USA, 243-258. 18
Eigenschaften von Spam-Accounts Inaktive Phasen Abbildung entnommen aus K. Thomas et al. Suspended accounts in retrospect: an analysis of twitter spam. In Proceedings of the 2011 ACM SIGCOMM conference on Internet measurement conference (IMC '11). ACM, New York, NY, USA, 243-258.
Erkennung von Spam-Accounts Twitter Erkennungsalgorithmus Evaluation basierend auf 1,8 Mrd. Tweets Abbildung entnommen aus K. Thomas et al. Suspended accounts in retrospect: an analysis of twitter spam. In Proceedings of the 2011 ACM SIGCOMM conference on Internet measurement conference (IMC '11). ACM, New York, NY, USA, 243-258. 20
Fake Accounts Bildquelle: digitaltrends.com
Fake Accounts Automatisch erzeugte Accounts Verkauf von Fake Accounts zur Spam-Verbreitung 10-200$ für 1.000 Accounts Online-Verkauf Studie über gekaufte Spam-Accounts (10 Monate) 27 Verkäufer (verantwortlich für 10-20% aller Spam-Accounts) 121.027 Accounts 127.000 459.000$ viele doppelte oder weiter verkaufte Accounts 22
Fake Accounts Sehr oft leicht erkennbar Standard-Profilbild Keine Biographie Viele duplizierte Tweets kryptischer Username Verhältnis Freunde/Follower Profilbild von Bildagentur Inhalt der Tweets Umgehende Antwort auf Tweets 23
Fake Accounts Präsidentschaftswahl USA 2013 Abbildung entnommen aus http://www.dailymail.co.uk/news/article-2430875/barack-obama-19-5m-fake-twitter-followers.html. 24
Fake Accounts Ben Sarma als Follower von Mitt Romney (Profilbild gestohlen) 25
Fake Accounts Profilbilder von Bildagenturen
Fake Accounts
Hacked Accounts Bildquelle: jrwoodward.net
Hacked Accounts Hack durch automatisiertes Erzeugen von Passwörtern Hack durch Malware Kompromittieren des Accounts (und der Follower) Reichweite Vertrauensverhältnis ausnützen Direct Messages, Tweets im Namen des Benutzers Neue Follow-Beziehungen Wie gehen Benutzer damit um, dass ihr Account gehackt wurde? Studie mit 1,3 Millionen Tweets (abgegriffen 12/2012 07/2013) Klassifizierung mittels überwachtem Lernen (Support Vector Machines) 29
Studie Hacked Accounts - Klassen Gehackter Account Ooh looks like I've been hacked! That explains the inability to get into my account! Will be putting that right" Entschuldigung für Tweets My Account was hacked pls ignore all the tweets Isent today. I apologize for the inconvenience Entschuldigung für direct messages If I sent you spams via DM, I'm really sorry - my account got hacked Neuer Account Hey guys, go follow my new account because this one is hacked and is sending out spam Neues Passwort Very sorry everyone. My account was hacked. password changed, hopefully that does the trick von Freunden/Verwandten gehackt my brother hacked my account sorry 30
Studie Hacked Accounts 31
Studie Hacked Accounts 27% der Benutzer erzeugen neuen Account Twitter stellt Hilfeseiten zur Verfügung Passwort ändern Berechtigung externer Apps löschen Passwörter in externen Apps ändern Informationsdefizit alter Account verbleibt evtl. bei Hackern 1.105 Tweets an @support 32
Mensch, Bot, Cyborg?
Bots Programm, das automatisiert Aufgaben von Menschen übernimmt Vortäuschung eines menschlichen Nutzers Socialbots Bots in sozialen Medien Schnittstellen von Twitter zum automatisierten Senden, Followen, etc. Einfluss auf Wahlen, Aktienmarkt, etc. können ab 250$ gekauft werden Retweet, Propagation bestimmter Tweets Verkauf von Facebook-Likes über Bots: 200 Mio. $/Jahr 34
Bots nur 35% aller Follower auf Twitter sind Menschen teils sehr intelligent aktuelle Nachrichten Carina Santos populäre Journalistin auf Twitter war Bot Meinungsbild beeinflussen (z.b. Klimawandel) Tweets so oft versenden, bis originale Accounts von Spam-Filter erkannt werden 35
Bots User tweetet, dass er von der Polizei verfolgt wird (in der Nähe einer Bank of America-Filiale) Abbildung entnommen aus Nexgate 2013 State of Social Media Spam Research Report, nexgate.com. 36
Cyborgs Bot unterstützt durch Menschen Mensch unterstützt durch Bot Sehr oft: Mensch registriert sich (Captcha), Bot übernimmt alles Weitere 37
Klassifikation Mensch, Bot oder Cyborg basierend auf Features, z.b. Häufigkeit der Tweets Anzahl Follower/Friends Art, wie der Tweet abgeschickt wurde (Website, App, API) Anzahl URLs Abbildungen entnommen aus Z. Chu et al. Who is tweeting on Twitter: human, bot, or cyborg?. In Proceedings of the 26th Annual Computer Security Applications Conference (ACSAC '10). ACM, New York, NY, USA. 38
Klassifikation Mensch, Bot oder Cyborg Ergebnis (2009) Abbildung entnommen aus Z. Chu et al. Who is tweeting on Twitter: human, bot, or cyborg?. In Proceedings of the 26th Annual Computer Security Applications Conference 2010 (ACSAC '10). ACM, New York, NY, USA. 39
Follower Farming Einfluss des Tweets fließt in Suchmaschinen-Ranking ein Höhere Follower-Anzahl höheres Ranking in Google für Tweet ab 2.000 Friends Twitter-Begrenzung Ziel: Follower finden, die zurück followen Annahme: User, die wenige Kontakte haben, followen zurück Studie mit 54 Mio. Accounts 1,8 Mrd. Tweets 40
Follower Farming Annahme falsch Abbildung entnommen aus S. Ghosh et al. Understanding and combating link farming in the twitter social network. In Proceedings of the 21st international conference on World Wide Web 2012 (WWW '12). ACM, New York, NY, USA, 61-70. 41
Follower Farming Top 100.000 Spam-Followers 71% haben mehr als 1.000 Followers 235 haben bestätigte (verified) Twitter Accounts 76% sind keine Spammer 24% sind nicht mehr aktive Accounts oder Spammer aktive User Tweets über Internet Marketing, Entrepreneurship, Social Media Unternehmen, die ihre Website promoten wollen Social Capitalists 42
Social Capitalists - Motivation Ziel ist Erhöhung des Einflusses im Netzwerk bessere Verbreitung der eigenen Tweets ähnlich zu Spammern Höflichkeit, Follow back Etikette 80% der Beziehungen reziprok gegenseitiges Pushen ( will follow back ) 43
Spammer-Netzwerke Neuere Studie über die Interkonnektivität von Spammern Spam-Accounts sind untereinander dicht vernetzt Gründe für Spammer-Vernetzung Folgen völlig beliebiger Accounts Vernetzung innerhalb gleicher Organisation Abbildung entnommen aus C. Yang et al. Analyzing spammers' social networks for fun and profit: a case study of cyber criminal ecosystem on twitter. In Proceedings of the 21st international conference on World Wide Web (WWW '12). ACM, New York, NY, USA, 71-80. 44
Zusammenfassung Bildquelle: http://www.hdwallpapersinn.com
Zusammenfassung Kriminalität auf Twitter alles dreht sich um persönliche Informationen Spam Studie Umgang mit gehackten Accounts Klassifizierung Bot, Cyborg oder Mensch Follower Farming 46
Kontakt & Social Media @eva_zangerle eva.zangerle@uibk.ac.at http://www.evazangerle.at http://dbis-informatik.uibk.ac.at @dbisibk https://www.facebook.com/dbisibk Bildquelle: jrwoodward.net
Quellen C. Yang et al. Analyzing spammers' social networks for fun and profit: a case study of cyber criminal ecosystem on twitter. In Proceedings of the 21st international conference on World Wide Web 2012 (WWW '12). ACM, New York, NY, USA, 71-80. S. Ghosh et al. Understanding and combating link farming in the twitter social network. In Proceedings of the 21st international conference on World Wide Web 2012 (WWW '12). ACM, New York, NY, USA, 61-70. Zi Chu, Steven Gianvecchio, Haining Wang, and Sushil Jajodia. 2012. Detecting Automation of Twitter Accounts: Are You a Human, Bot, or Cyborg?. IEEE Trans. Dependable Secur. Comput. 9, 6 (November 2012), 811-824. K. Thomas et al. Suspended accounts in retrospect: an analysis of twitter spam. In Proceedings of the 2011 ACM SIGCOMM conference on internet measurement conference (IMC '11). ACM, New York, NY, USA, 243-258. K. Lee et al. Uncovering social spammers: social honeypots + machine learning. In Proceedings of the 33rd international ACM SIGIR conference on Research and development in information retrieval 2010 (SIGIR '10). ACM, New York, NY, USA, 435-442. C. Grier et al. @spam: the underground on 140 characters or less. In Proceedings of the 17th ACM conference on Computer and communications security 2010 (CCS '10). ACM, New York, NY, USA, 27-37. K. Thomas et al. Trafficking fraudulent accounts: the role of the underground market in Twitter spam and abuse. In Proceedings of the 22nd USENIX conference on Security 2013(SEC'13). USENIX Association, Berkeley, CA, USA, 195-210. F. Benevenuto et al. Detecting Spammers on Twitter. In Proceedings of the Annual Collaboration, Electronic messaging, Anti-Abuse and Spam Conference (CEAS 10). Redmond, Washington, USA. July, 2010. K. Lee et al. Seven Months with the Devils: A Long-Term Study of Content Polluters on Twitter. 5th International AAAI Conference on Weblogs and Social Media (ICWSM). Barcelona, July, 2011.
Quellen Research Report: 2013 State of Social Media Spam http://nexgate.com/wp-content/uploads/2013/09/nexgate-2013-state-of-social-media- Spam-Research-Report.pdf Twitter Blog über Tweets pro Sekunde-Rekord https://blog.twitter.com/2013/new-tweets-per-second-record-and-how I flirt and Tweet http://www.nytimes.com/2013/08/11/sunday-review/i-flirt-and-tweet-follow-me-atsocialbot.html Fake Twitter Followers Become Multimillion-Dollar Business http://bits.blogs.nytimes.com/2013/04/05/fake-twitter-followers-becomes-multimilliondollar-busines Millennials & Social Media http://www.digit-ally.co.uk/millennials-gen-y-social-media-infographic Socialbakers http://www.socialbakers.com 49