Jakob Jünger, M.A. Till Keyling, M.A. Facepager. Ein Programm zur automatisierten Datenerhebung im Netz

Ähnliche Dokumente
ONET: FT-NIR-Netzwerke mit zentraler Administration & Datenspeicherung. ONET Server

Apollo Überblick. Klaus Kurz. Manager Business Development Adobe Systems Incorporated. All Rights Reserved.

Open Source als de-facto Standard bei Swisscom Cloud Services

Monitoring Pflicht oder Kür?

E-Mobility am Gemeindeamt

Social Media bei der Kreissparkasse Ludwigsburg

Trends im Suchmaschinen- und Social Media Marketing

Bachelorseminar WS 2007 / 2008 Kartendienst APIs im Web 2.0

Das Event-Management-Tool

Literaturrecherche Thema: Analyse sozialer Netzwerke in wissenschaftlichen Communities. Peter Kraker. Empirische Methoden WS09/10 Prof.

Zur Definition von Web-Services

wima-tage. Dialog statt Tools. Austausch statt Megaphon. Namics. Dr. Christina Schwarze. Consultant. 10. November 2009

T-Systems Multimedia Solutions

Teil 2: Ablauf der Analyse festlegen

Big Data Projekte richtig managen!

empower your network Online-Veran staltungsmanage ment und Bezahlung leicht gemacht

3 MILLIARDEN GIGABYTE AM TAG ODER WELCHE KAPAZITÄTEN MÜSSEN NETZE TRAGEN?

Soziale Netzwerke: Chance zur Verbesserung der Kommunikation mit den Bürgern

Release Automation für Siebel

BigData Wie wichtig ist die Datenqualität bei der Analyse und Auswertung von großen Daten Praxisbeispiel. Christin Otto

Google findet Teilen gut? Eine empirische Studie zum Einfluss von Facebook- Shares und Co. auf das organische Ranking von Suchmaschinen

OERA OpenEdge Reference Architecture. Mike Fechner PUG Infotag 19. Mai 05 Frankfurt

AbaWeb Treuhand. Hüsser Gmür + Partner AG 30. Oktober 2008

Gesundheitswirtschaft

325 Jahre und knackig: Mit einer Social Media Strategie erfolgreich durchs Lambertz- Jubiläumsjahr. Nadja Amireh 2. April 2014

Erstellung botoptimierter Partnerlinks

INSYDE -Integration of Health System Data and Exchange

Ein Open-Source-Projekt im Überblick

Hallo! Social Media in der praktischen Anwendung Warum macht man was und vor allem: wie? Osnabrück, den 07. Juli 2014.

ebay Mode Fokus ebay Partner Network

SWISSVAULT StorageCenter Console Version 5 Kurzanleitung für SWISSVAULT Combo Partner

Datenmanagement und einfache Automatisierungen in Ingenieursanwendungen mit dem DataFinder Eike Hoffmann 5. April 2006 Frankfurt a.m.

VTC CRM Private Cloud

SAP NetWeaver Gateway. 2013

Die perfekte Online-Hilfe auf Basis von HTML5 und Open-Source- Komponenten. Jochen Marczinzik , tekom Führjahrstagung

MyIT Immer und überall Zugriff auf Ihre IT Services

MOUNT10 StoragePlatform Console

Wir befinden uns inmitten einer Zeit des Wandels.

Feedback in Echtzeit. Social Media Monitoring Services von Infopaq. SOCIAL MEDIA

Ob Sie es wollen oder nicht: Im Web wird über Sie geredet.

The Connected Consumer shapes the future

Zwischen Katzenbildern und Selfies

Forum Management. Referent: Gregor Preuschoff -1-

IAB Brand Buzz by BuzzValue Segment: Online- & Direktbanken

Exemplarische Schulungskonzepte für Schule, Aus- und Weiterbildung

Clientkonfiguration für Hosted Exchange 2010

Elfenbeinturm 2.0 Wissenschaftskommunikation in Zeiten von Social Media recensio.net Rezensionsplattform für die europäische Geschichtswissenschaft

SID Social Media Report 2010/2011 Aktuelle Untersuchung zur Nutzung von Social Media im Beruf

Kooperativer Speicher: Schwächen und Gegenmaßnahmen

2010 DACH Konferenz. Willkommen. Aras Momentum Update. Martin Allemann SVP Global Operations aras.com

Erfolgreiche Tourismus-Kommunikation im (Social) Web (2.0) 2011 F.F.T. MedienAgentur 1

LINKSYS Smart Wi-Fi. Für den größtmöglichen Komfort. Software, Cloud-, Partner, High-Performance-Hardware. Benutzerkomfort mit zusätzlichen App s

PACKEN WIR S AN FACEBOOK & CO. FÜR IHREN HAND- WERKSBETRIEB

TalkIT: Internet Communities Tiroler Zukunftsstiftung Donnerstag,

Den Überblick behalten:

Mission. TARGIT macht es einfach und bezahlbar für Organisationen datengetrieben zu werden

Arbeit in der Cloud Dienstleistung in der digitalen

Schnittstellenspezifikation: ZEUS Web Services

Leitlinie zum adaptiven Management von Datenqualität in Kohortenstudien und Registern

Social Media im internationalen Forschungsmarketing

Politische Inhalte in Social Media:

Network your Business. Beziehungen 2.0. Robert Beer, Country Manager XING Schweiz und Österreich, Bern, 4. März 2013

Social Media Marketing

1 Konfigurationsanleitung Hosted Exchange

Output Management trifft Social Media Wirkungsvoller Kundendialog macht Kunden zufriedener

Zwei Wege zur automatisierten SW Verteilung Am Beispiel der Lösungen von Jungheinrich. Matthias Nischwitz,

Einreichung zum Call for Papers

APP MEDIADATEN Stand Juli Kunst Architektur Design Mode Fotografie

Anne Groß GI Fachgruppentreffen RE, 24./ , Hamburg

ACCOUNTINFO 1.01 VERWENDEN DER ACCOUNTINFO-SCHNITTSTELLE ABFARGE VON ACCOUNT-INFORMATIONEN IN ECHTZEIT 02. MÄRZ 2010

100% AUFMERKSAMKEIT & INTERAKTION. GARANTIERT. Revolutionizing Consumer-Brand Communication.

Social Media im Vertrieb. oder. Die Geschichte des Schaufensters. Ralf Pispers, Neuss, (c) 2010.dotkomm rich media solutions

Kurzanleitung GigaMove

Mobile Endgeräte für Führungskräfte und Gremiumsmitglieder. Michael Predeschly Fachbereich eservices 0731/

e-books aus der EBL-Datenbank

Enterprise Social Media in der Automobilbranche

SAP Integration von Business Objects am Beispiel von SAP Student Lifecycle Management. Anke Noßmann Syncwork AG

Facebook, Twitter & Co:

... über OGVIT GmbH & Co. KG

Internetmarketing mit Facebook & Co.

Open Source Einsatz in der Stadt Wien

Web Sockets mit HTML5. Quelle:

100% PERFORMANCE PARTNER PROGRAMM

SolarWinds Engineer s Toolset

ALEXANDER NÉMETH A L E X A N D E R. N E M E T I N T E R N A T I O N A L - P A R T N E R S. O R G ( 0 ) /09/2012

Social Media Analyse Manual

Social Media zwischen Wissenschaftskommunikation 2.0 und Datenschutz ein Praxisbericht

Wir öffnen Benutzerkonten

Science 2.0 Eine Einführung

2. Twitterdaten Korpuserstellung

OnlineAgenda Ihres Zahnarztes

Streaming Media - MPEG-4 mit Linux

Übersicht Die Übersicht zeigt die Zusammenfassung der wichtigsten Daten.

Management gedruckter und elektronischer Ressourcen mit der SwetsWise Title Bank. Meinhard Kettler Deutscher Bibliothekartag, Düsseldorf 15.

Projekt - Zeiterfassung

Transkript:

Jakob Jünger, M.A. Till Keyling, M.A. Ein Programm zur automatisierten Datenerhebung im Netz

Agenda 1. Grundlagen der automatisierten Datenerhebung 2. Überblick über den 3. Fallstricke automatisierter Datenerhebung 9.11.2013 2

Erhebung von Daten im Web Server Client Webseite Browser REST-API Erhebungstool 9.11.2013 3

Erhebung von Daten im Web https:// graph.facebook.com/ Tatort? access_token=xxx https:// www.facebook.com/ Tatort 9.11.2013 4

Hintergrund 2011: Entstehung an der LMU München als Tools zur Speicherung von Facebook-Seiten Seit 2012: Gemeinsame Kooperation Aktuell >200.000 API Zugriffe, 60 Nutzer aus 5 Ländern (Facebook API) Open-Source-Projekt auf GitHub: https://github.com/strohne/ Presets und Installationsdateien (Mac OS, Windows): http://www.ls1.ifkw.uni-muenchen.de/personen/wiss_ma/keyling_till/software.html 9.11.2013 5

- Übersicht Datensätze Details eines Datensatzes Abfragebereich Statusmeldungen des Programms Festlegen von Spalten 9.11.2013 6

Workflow 9.11.2013 7

Workflow 9.11.2013 8

Workflow 9.11.2013 9

Workflow 9.11.2013 10

Workflow 9.11.2013 11

Funktionen API-Module: Facebook, Twitter, Generic, Abfrageparameter frei einstellbar Presets zur Dokumentation und zum Austausch von Erhebungsdesigns Sukzessive (hierarchische) Abfrage, Abfrage paginierter Ergebnisse Einfacher Timer Anzeige der Daten anpassbar Exportieren als CSV-Datei oder über die Zwischenablage 9.11.2013 12

Anforderungen an Tools zur Datenerhebung Abstraktion: Unterschiedliche APIs Kontrolle: Steuerbarkeit jeder Abfrage Transparenz: Offenlegung des Codes Standardisierung: Universelle Exportformate Spezialisierung: Trennung von Datenerhebung & Auswertung. 9.11.2013 13

Selektionsschritte im Prozess der Datengenerierung Forscher Tools API Scraping Rohdaten Ausgewählte Probleme: Vollständigkeit von Daten Validität von Indikatoren Transparenz von APIs Code/Affordances Meaning /Welt. 9.11.2013 14

Vollständigkeit der Daten Repräsentation über API unterscheidet sich von Repräsentation im Web 366 von 570 Kommentaren abrufbar Fehlt Request Status Error: Bad Request 9.11.2013 15

Validität von Aktivitätsmessungen Mehr als 10 Posts pro Tag......eingespeist über RSS Graffiti...hauptsächlich Artikel aus der Frankfurter Neuen Presse. 9.11.2013 16

Transparenz der APIs Veränderte Berechnungsgrundlagen von Parametern YouTube: Channel-Parameter Total Upload Views Mangelnde Dokumentation API-Versionssprünge 9.11.2013 17

Fazit Automatisierte Datenerhebung erleichtert aufwändige Erhebungsarbeit Leitprinzipien bei der Entwicklung: Abstraktion, Kontrolle, Transparenz, Standardisierung, Spezialisierung Automatisierte Datenerhebung garantiert nicht gute Forschung Verführerische Verfügbarkeit: Daten sprechen nicht für sich! Verführerische Einfachheit: Dokumentationen lesen! 9.11.2013 18

Vielen Dank für Ihre Aufmerksamkeit! 9.11.2013 19

Literatur Bruns, A. (2013). Faster than the speed of print: Reconciling big data social media analysis and academic scholarship. First Monday, 18(10). Abgerufen von http://firstmonday.org/ojs/index.php/fm/article/view/4879 De Choudhury, M., Lin, Y. R., Sundaram, H., Candan, K. S., Xie, L., & Kelliher, A. (2010). How does the data sampling strategy impact the discovery of information diffusion in social media. In Proceedings of the 4th International AAAI Conference on Weblogs and Social Media (S. 34 41). Abgerufen von http://www.aaai.org/ocs/index.php/icwsm/icwsm10/paper/viewfile/1521/1832 Gehrau / Fretwurst / Krause (2005) (Hrsg.) Auswahlverfahren in der Kommunikationswissenschaft. Köln: Herbert von Halem Verlag. Gerlitz, C., & Rieder, B. (2013). Mining One Percent of Twitter: Collections, Baselines, Sampling. M/C Journal, 16(2). Abgerufen von http://journal.mediaculture.org.au/index.php/mcjournal/article/view/620 Giglietto, F., Rossi, L., & Bennato, D. (2012). The Open Laboratory: Limits and Possibilities of Using Facebook, Twitter, and YouTube as a Research Data Source. Journal of Technology in Human Services, 30(3-4), 145 159. doi:10.1080/15228835.2012.743797 González-Bailón, S., Wang, N., Rivero, A., Borge-Holthoefer, J., & Moreno, Y. (2012). Assessing the bias in communication networks sampled from twitter. Available at SSRN 2185134. Abgerufen von http://papers.ssrn.com/sol3/papers.cfm?abstract_id=2185134 Mahrt, M., & Scharkow, M. (2013). The Value of Big Data in Digital Media Research. Journal of Broadcasting & Electronic Media, 57(1), 20 33. doi:10.1080/08838151.2012.761700 Morstatter, F., Pfeffer, J., Liu, H., & Carley, K. M. (2013). Is the sample good enough? comparing data from twitter s streaming api with twitter s firehose. Proceedings of ICWSM. Abgerufen von http://www.public.asu.edu/~fmorstat/paperpdfs/icwsm2013.pdf Seibold, B. (2002). Die flüchtigen Web-Informationen einfangen. Publizistik, 47(1), 45 56. doi:10.1007/s11616-002-0003-3 Vis, F. (2013). A critical reflection on Big Data: Considering APIs, researchers and tools as data makers. First Monday, 18(10). doi:10.5210/fm.v18i10.4878 Welker, M., & Wünsch, C. (Hrsg.). (2010). Die Online-Inhaltsanalyse: Forschungsobjekt Internet. Köln: Halem. 9.11.2013 20