Web Data Mining. Albert Weichselbraun

Ähnliche Dokumente
Social Data Mining. Albert Weichselbraun. May 2009

Wordpress am eigenen Server installieren

Programmierschnittstelle API 2 für CMS Day Communiqué: Beispiele Standort

Facebook Kurs Online Kurs Apps Entwicklungen für Facebook

RESTful Web. Representational State Transfer

Anleitung Redmine. Inhalt. Seite 1 von 11. Anleitung Redmine

OWASP Stammtisch München Sep 2014 XSS und andere Sicherheitslücken aus der Perspektive des Programmcodes

Software Engineering. Zur Architektur der Applikation Data Repository. Franz-Josef Elmer, Universität Basel, HS 2015

Application Note. Anbindung von Kunden-Software an SpiderControl Web Visualisierung

Abschlussarbeiten für StudentInnen

BIF/SWE - Übungsbeispiel

Programmers Manual Geodaten Ver. 2.0

«Integration in WebSite» HTML-/Javascript-Code-Beispiele

crm-now/ps Webforms Webdesigner Handbuch Erste Ausgabe

Darstellung von Übersichtsseiten und Präsentationen

Wiederholung: Beginn

Import der Schülerdaten Sokrates Web

Dokumentation Externe Anzeige von Evento Web Dialogen

PHP Kurs Online Kurs Analysten Programmierer Web PHP

Datenbank LAP - Chefexperten Detailhandel

Online Kataloge. Wie binde ich einen SGVSB-Online-Katalog in eine Webseite ein. Versionsnummer: 1.0 Änderungsdatum:

Mobile-Szenario in der Integrationskomponente einrichten

Bewährte Drupal-Module

Destructive AJAX. Stefan Proksch Christoph Kirchmayr

NCDiff Testmanagement leicht gemacht

Designänderungen mit CSS und jquery

Klausurteilnehmer. Wichtige Hinweise. Note: Klausur Informatik Programmierung, Seite 1 von 8 HS OWL, FB 7, Malte Wattenberg.

Design anpassen eine kurze Einführung

SUB-ID- VERWALTUNG MIT GPP SETUP-GUIDE FÜR PUBLISHER

Webseiten sind keine Gemälde. Webstandards für ein besseres Web. Webstandards für ein besseres Web

Google Maps mit PHP und Ajax nutzen Eine kurze Einführung vom Frank Staude vorgetragen beim Treffen der PHP Usergroup Hannover am

EXASOL Anwendertreffen 2012

Radio-Cloud Tools. Dokumentation

This manual cannot be redistributed without permission from joomla-monster.com or vorlagenstudio.de

MOC Entwicklung von ASP.NET MVC 4 Webapplikationen

Online-Publishing mit HTML und CSS für Einsteigerinnen

APEX und Workflows: Spaghetticode oder Integration. Sven Böttcher. Consultant, Apps Associates GmbH

openk platform Dokumentation Setup Liferay Version 0.9.1

Meine erste Homepage - Beispiele

Anleitung Redmine. Inhalt. Seite 1 von 11. Anleitung Redmine

Web 2.0 (In) Security PHPUG Würzburg Björn Schotte

Visualisierung von Geodaten

Diplomarbeit: GOMMA: Eine Plattform zur flexiblen Verwaltung und Analyse von Ontologie Mappings in der Bio-/Medizininformatik

HOW TO CREATE A FACEBOOK PAGE.

Web Sockets mit HTML5. Quelle:

Service Engineering. Nutzung von Servicemarktplätzen im Internet (Bezugsbereich der Übung: integrierbare Service APIs)

BFV Widgets Kurzdokumentation

JavaScript in Drupal

ÜBUNG. Einführung in das IT- Projektmanagement WS 2012/13. Dr. The Anh Vuong

Version Deutsch

IVS Arbeitsgruppe Softwaretechnik Abschnitt Management komplexer Integrationslösungen

Ausgangslage, Rolle und Auftrag

AK Medientechnologien 05 Delegation

Die aktuelle Version des SPIEGEL-Bestseller-Widgets können Sie auf unserer Website unter Entwicklertools herunterladen.

Template Programmierung mit Joomla!

QR-Codes und APEX. Dr. Harry W. Trummer / Alexander Elsas Goethe-Universität Frankfurt

Verteilte Systeme: Übung 4

TTS - TinyTimeSystem. Unterrichtsprojekt BIBI

Anleitung zur Einrichtung einer ODBC Verbindung zu den Übungsdatenbanken

Virtuelle Fachbibliothek Ethnologie:

Themen. Web Services und SOA. Stefan Szalowski Daten- und Online-Kommunikation Web Services

Hinweise zum elektronischen Meldeformular

TIMERATE AG Tel Falkenstrasse Zürich Joomla Templates Kursunterlagen

3. Neuen Newsbeitrag erstellen Klicken Sie auf das Datensatzsymbol mit dem +, damit Sie einen neuen Newsbeitrag erstellen können.

ArenaSchweiz AG. CMS Concrete5.7 Erste Schritte

e-business - Patterns Stefan Brauch (sb058) -- Julian Stoltmann (js057)

INSIEME als Nachfolger einrichten

RECS Box Management API

WEBAPPLIKATIONEN MIT PHP. Wo gibt es Hilfe? Wie fang ich an?

Erstellen eines HTML-Templates mit externer CSS-Datei

MIT NEUEN FACHTHEMEN

Installation des edu- sharing Plug- Ins für Moodle

Android Remote Desktop & WEB

Microsoft SharePoint 2013 Designer

Web Scraping. Seminar Aktuelle Software-Engineering Praktiken für das World Wide Web JK

Webshop Tutorial. E-Commerce ECM ERP SFA EDI. Backup. Integration des Comarch Webshops mit Facebook.

Das HMS-Reporting-Framework Schneller Zugang zu relevanten Reports

Nadine Edelmann // Klaudia Fernowka // Magdalena Kierat // Anne Schwertfeger

Eigene Seiten erstellen

Informatik I: Einführung in die Programmierung

Erstellen einer in OWA (Outlook Web App)

Installation von NetBeans inkl. Glassfish Anwendungs-Server

Mastermind. Testplan. Hochschule Luzern Technik & Architektur. Programmieren 2 FS12. Gruppe 10

Internet Services. Internet für Unternehmer. Worauf achten erfolgreiche Unternehmer heute in Bezug auf das Internet?

Best Practice Infor PM 10 auf Infor Blending

Übung: Verwendung von Java-Threads

S TAND N OVEMBE R 2012 HANDBUCH DUDLE.ELK-WUE.DE T E R M I N A B S P R A C H E N I N D E R L A N D E S K I R C H E

Advanced CMS. Copyright 2015 silbersaiten.de Service&Support:

GameGrid mit BlueJ Seite 1

Aufgabe GBIS (TPCW-Benchmark)

Versionsverwaltung mit SVN

Ora Education GmbH. Lehrgang: Oracle Application Server 10g R3: Administration

Worum geht es in diesem Projekt?

E-Business Architekturen

Mobile Terminated SMS Gateway Datum: Version: 2.3. Inhalt:

Erste Schritte mit WordPress Anleitung WordPress Version 2.8.X

HTML5. Wie funktioniert HTML5? Tags: Attribute:

ACHTUNG: Es können gpx-dateien und mit dem GP7 aufgezeichnete trc-dateien umgewandelt werden.

Elisabeth Stettler. Business Consultant. Andreas Gerig. Consultant/Projekt Manager.

4PLAN. Schulungskatalog. Software4You Planungssysteme GmbH

Transkript:

Web Data Mining Albert Weichselbraun Vienna University of Economics and Business Department of Information Systems and Operations Augasse 2-6, 1090 Vienna albert.weichselbraun@wu.ac.at May 2011

Agenda Aufgabenstellung Facebook Web 2.0 Datenquellen Administration Technologie Facebook Application Web 2.0 Datenquellen Geographische Visualisierungen

Aufgabenstellung Web Mining - Web Corpus Challenge 1. soziale Quellen als Grundlage für sozialwissenschaftliche Forschung und 2. Games with a Purpose zur Erstellung und Evaluierung von derartigen Daten

Aufgabenstellung Ziel dieses Projektes ist es Benutzerrezensionen (Rezension + Bewertung) aus dem Web zu extrahieren und diese in einer Datenbank zu speichern. Ein Game with a Purpose auf einer Social Networking Plattform (Facebook) zu erstellen, welches es dem Benutzer ermöglicht die Top Einflussfaktoren für das gewählte Rating zu identifizieren. Eine (minimale) Applikation zur Administration und Visualisierung der Ergebnisse zu erstellen (optional).

Arbeitspakete Komponenten zum Spiegeln von Bewertungsportalen (Amazon, Ciao, TripAdvisor, IMDB, RottenTomatoes,...) und zum Extrahieren der relevanten Informationen Facebook Game with a Purpose zum Annotieren von Reviews Admin Applikation (optional)

Arbeitsaufteilung Kernaspekte Technische Aspekte: Facebook-Applikation, Spider, Visualisierung,... Organisatorische Aspekte: Zeitplan, Organisation von Treffen, Projektdokumentation,... Strategische Aspekte: Planung, Modellierung, Marketing, Aufteilung der Workpackages,... Wöchentliches Reporting durch mindestens ein Gruppenmitglied Achtung: Es wird erwartet, dass jedes Gruppenmitglied zumindest einen Programmiertask übernimmt.

Facebook - Anforderungen Design, Erstellen und Verteilen einer Facebook Applikation Originelle Spielidee Verhindern von Cheating Empfehlung: Verwendung von vordefinierten Kategorien für die Annotation oder Markieren von Ausdrücken im Text. Beispiel: apps.facebook.com/sentiment-quiz/

Integration von Web 2.0 Datenquellen Recherche: mögliche nützliche Datenquellen (TripAdvisor, Amazon, Ciao) & der entsprechenden Schnittstellen (API,..) Wenn notwendig: Extraktion der relevanten Information aus dem Datenstrom Implementierung von ein bis zwei dieser Quellen und Integration der Quellen ins Datenschema Meta Informationen: Benutzer, Ort, Datum,...

Administration Web Applikation zur Kontrolle der im Repository gespeicherten Daten Visualisierungen: Anzahl der erfassten Rezensionen Anzahl der von Benutzern annotierten Rezensionen Geographische Verteilung der Benutzer

Facebook Application Vorgangsweise: Facebook: Ausgangspunkt: www.facebook.com/developers/ Neue Applikation erstellen Canvas URL: www.facebook.com/sql example/ Callback URL: xmdimrill.ai.wu.ac.at/ aweichse/projects/2011s/sql2/gpa/ xmdimrill: Example Code + Library auf Dimrill kopieren. Applikation mittels Canvas URL oder Canvas Callback URL testen.

Web 2.0 Datenquellen Stand-alone Applikation (PHP, Python, Java) Technologie: anwendungsspezifisch Beginn: Recherche und entsprechende Dokumentation Integration von mindestens ein bis zwei externen Quellen Beachtung der Mirroring Restriktionen (zum Beispiel: maximal ein Request per Sekunde) Extraktion der Reviews: Reguläre Ausdrücke, DOM Tree (DOM Inspector, Firebug)

Web 2.0 Datenquellen - Beispiel: IMDB Review einlesen 1 <? php 2 // Beispiel : read Web page with the first 3 // 10 comments for the movie 4 // tt0120794 ( Prince of Egypt ). 5 $url = http :// www. imdb. com / title / tt0120794 6. / usercomments ; 7 $lines = file ( $url ); 8 print_r ( $lines ); 9?>

Geographische Visualisierungen

Geographische Visualisierungen Verwendung der Google MAPS API Vorgangsweise: API Key Anfordern KML File erstellen (dynamisch/statisch) JavaScript Code in die Webseite integrieren und KML File angeben. Beispiel: www.ai.wu.ac.at/ aweichse/projects/2011s/sql2/examples/maps/ ( aweichse/public html/projects/2011s/sql2/examples/maps)

Geographische Visualisierungen 1 <? xml version =" 1.0 " encoding ="UTF -8"?> 3 <kml xmlns =" http: // earth. google. com / kml /2.1 "> 4 < Document > 5 <name > Example </ name > 6 < description > An Example KML File </ description > 8 < Placemark > 9 <name >Perth </ name > 10 < description > An Example Placemark </ description > 11 <Point >< coordinates > 12 115. 833297729, - 31. 9333000183 13 </ coordinates ></ Point > 14 </ Placemark > 15 </ Document > 16 </ kml >

Geographische Visualisierungen 1 <html xmlns =" http :// www.w3.org /1999/ xhtml "><head > 3 < script 4 src =" http :// maps. google. com / maps? file = api & amp ;v =2& amp ; key = XXXX " 5 type =" text / javascript "></ script > 6 < script type =" text / javascript "> 7 function load () { 8 if ( GBrowserIsCompatible ()) { 9 var map = new GMap2 ( document. getelementbyid (" map " )); 10 var geoxml = new GGeoXml (" http :// t.at/ mygeofile. kml "); 12 map. setcenter ( new GLatLng (48.2,16.36), 3); 13 map. addcontrol ( new GLargeMapControl ()); 14 map. addoverlay ( geoxml ); 15 } 16 } 17 </ script > 19 </ head > 20 <body onload =" load ()" onunload =" GUnload ()"> 21 <div id=" map " style =" width : 680 px; height : 400 px"></ div > 22 </ body > 23 </ html >