Teamprojekt & Projekt



Ähnliche Dokumente
Teamprojekt & Projekt

Teamprojekt & Projekt

Veranstalter: Lehrstuhl DBIS - Prof. Georg Lausen Betreuer: Thomas Hornung, Michael Schmidt

Empirisches Seminar Soziale Netzwerkanalyse

Software-Projekt Mobilkommunikation/Telematik

Neue Ansätze der Softwarequalitätssicherung

Beratung. Results, no Excuses. Consulting. Lösungen. Grown from Experience. Ventum Consulting. SQL auf Hadoop Oliver Gehlert Ventum Consulting

Projektgruppe. Knowledge Representation Persistence and Reasoning

Praktikum BKSPP: Organisatorisches

Prozessoptimierung in der Markt- und Medienforschung bei der Deutschen Welle (DW) mit Big Data Technologien. Berlin, Mai 2013

Anforderungsanalyse: Tutor

Softwareentwicklungspraktikum Nebenfach

PROJEKT- UND HAUPTSEMINAR SSE

Anleitung für die Teilnahme an den Platzvergaben "Studio II, Studio IV und Studio VI" im Studiengang Bachelor Architektur SS15

Blockpraktikum (theoretische Informatik) Effizientes Programmieren

Gesetzliche Aufbewahrungspflicht für s

Bedienungsanleitung Nokia MixRadio

Maschinelle Übersetzung

Siemens Industry Online Support Persönlicher Bereich - Aufrufen

Kundenprojekt Web-Technologien (SoSe 2015)

SQL on Hadoop für praktikables BI auf Big Data.! Hans-Peter Zorn und Dr. Dominik Benz, Inovex Gmbh

Big Data Mythen und Fakten

Projektgruppe Algorithmen für die Cloud-unterstützte 3-D-Darstellung auf mobilen Endgeräten

Techniken der Projektentwicklungen

Verknüpfte Daten abfragen mit SPARQL. Thomas Tikwinski, W3C.DE/AT

Kundenprojekt Web-Technologien (SoSe 2015)

Wissenschaftliches Arbeiten , SE 2.0

MapReduce und Datenbanken Thema 15: Strom bzw. Onlineverarbeitung mit MapReduce

Man liest sich: POP3/IMAP

Agile Vorgehensmodelle in der Softwareentwicklung: Scrum

[Customer Service by KCS.net] KEEPING CUSTOMERS SUCCESSFUL

Web Data Management Systeme

Alumnisoftware. Mit Fokus auf intuitive Bedienung und. die wesentlichen Funktionen für Ihre. Alumniarbeit, unterstützt Sie Konnekt

Pädagogische Hochschule Thurgau. Lehre Weiterbildung Forschung

Hadoop. Eine Open-Source-Implementierung von MapReduce und BigTable. von Philipp Kemkes

Auswertung zu 5510P MES-Praktikum

T-Systems Multimedia Solutions

Workflows verwalten. Tipps & Tricks

Die MPA unibe Alumni stellen sich vor

Übungen zu Übersetzerbau 2

AutoSPARQL. Let Users Query Your Knowledge Base

Infoveranstaltung Bachelor- Thesis und Praxisprojekt

Energieaudit oder Energiemanagementsystem? Eine Entscheidungshilfe

Leitfaden. zur Einführung neuer Studiengänge

In unserer Checkliste finden Sie nützliche Tipps und Hinweise, wie Sie ihre Privatsphäre bei der Nutzung von Facebook schützen können.

Dokumentation. Black- und Whitelists. Absenderadressen auf eine Blacklist oder eine Whitelist setzen. Zugriff per Webbrowser

Apache HBase. A BigTable Column Store on top of Hadoop

vinsight BIG DATA Solution

Platzhalter für Bild, Bild auf Titelfolie hinter das Logo einsetzen. Bachelorstudium Architektur 5./ 6. Semester

CountryDesk. Das internationale Netzwerk der Sparkassen-Finanzgruppe

Verteilte Paarprogrammierung mit Eclipse

Ein Vergleich von Privacy-Policies internationaler sozialer Netzwerke

Berufspraktische Studien (BPS) im Studiengang Wirtschaftsingenieurwesen

Anleitung für Selbsteinträge für Vereine auf der städtischen Homepage.

Bildungsinitiative Schaufenster Elektromobilität Bayern / Sachsen

Management Summary. Zusammenfassung der Ergebnisse aus dem ersten Teil der Analyse des Twitter Follower Netzwerks

PSE: Analysesoftware für Logistiknetzwerke

BGP-Alarmsystem. Gunnar Bornemann Diplomarbeit Lehrstuhl für Netzwerkarchitekturen Technische Universität München

Praktikum Handlungsplanung WS 2010/2011

Arbeitsgruppen innerhalb der Website FINSOZ e.v.

Mobiles SAP für Entscheider. Permanente Verfügbarkeit der aktuellen Unternehmenskennzahlen durch den mobilen Zugriff auf SAP ERP.

Generalisierung von großen Datenbeständen am Beispiel der Gebäudegeneralisierung mit CHANGE

Jetzt drei Anzeigen kostenlos! (pro Unternehmen) Jobmensa. Über Traumkandidaten - ob Schüler, Student oder Absolvent

Teambildung. 1 Einleitung. 2 Messen der Produktivität

OSEK-OS. Oliver Botschkowski. PG AutoLab Seminarwochenende Oktober AutoLab

Institut für Telematik Universität zu Lübeck. Programmieren. Kapitel 0: Organisatorisches. Wintersemester 2008/2009. Prof. Dr.

facebook wie geht das eigentlich? Und was ist überhaupt Social media?

SIG Big Data in der Connect User Group

Selbsthilfe und neue Medien - Chance oder Risiko?

EventAvenue: Event planen und unsere Planungshilfen im Detail

Adami CRM - Outlook Replikation User Dokumentation

Literaturverwaltung mit Citavi. Jacqueline Miehling

Task: Nmap Skripte ausführen

Datenbasiertes QM von Lehre und Studium und seine Verknüpfung mit Akkreditierungsverfahren

Exploration und Klassifikation von BigData

Vierschanzentournee 2015/2016 ANGEBOT 2015/2016

SWE 4 Aufgaben zu Software-Engineering

Algorithmische Methoden zur Netzwerkanalyse Vorlesung für den Bereich Master Informatik

Begleiten und begeistern:

glit.app Handbuch OutlookAddin 13. Juni 2016

Einführung Qualitätssystem quint-essenz Grundlagen Projektmanagment-Tool - Community

Wie erstelle ich (m)einen Stundenplan?

sga Die selbstgestellte Aufgabe

MB Management GmbH. IT Storage Architekt / Consultant (m/w) SPEZIFIKATION. Für ein bekanntes Systemhaus in Baden. Dezember 2015

Autorisierung. Sicherheit und Zugriffskontrolle & Erstellen einer Berechtigungskomponente

Customer and Project Services. Teilnehmerunterlagen Aktivitäten

Kurzanweisung für Google Analytics

Informationsmaterial zum Praxisprojekt Familienunternehmen und Entrepreneurship im Masterstudiengang Unternehmensführung

RWE Power KOHLE FÜRS STUDIUM! Spannender Studieren mit Power Engineers. Power Engineers Die Studienförderung von RWE Power.

Algorithmische Methoden zur Netzwerkanalyse Vorlesung für den Bereich Master Informatik

Scheduling Mechanisms for the Grid

START with Business Planning 2015 an der LMU München

Vertretungsrollen QISPOS

Praxisphase. Infoveranstaltung zur 1/14. Druck- und Medientechnik

MACH. Unser Einstiegsprogramm für Hochschulabsolventen. Microsoft Academy for College Hires. Sales Marketing Technik

Beispiel 1 Nachrichten 1210

GEOPROCESSING UND MODELBUILDER

Evaluation eines kooperativen Entwicklungswerkzeuges zur Unterstützung von Projektteams am Beispiel von IBM Rational Team Concert.

KINDERSCHUTZ Aktivierung und Administration

Transkript:

2. November 2010 Teamprojekt & Projekt Veranstalter: Betreuer: Prof. Dr. Georg Lausen Alexander Schätzle, Martin Przjyaciel-Zablocki, Thomas Hornung dbis

Studienordnung Master: 16 ECTS 480 Semesterstunden ~ 34h/Woche p.p. Bachelor: 6 ECTS 180 Semesterstunden ~ 13h/Woche p.p Teamgröße: 3-4 Studenten Projektbericht Abschlusspräsentation Arbeitsleistung einzelner Teilnehmer muss klar voneinander abzugrenzbar sein Projekt Anforderungen 2

Zeit und Ort: Montag 14-17 Uhr (c.t.) Raum: SR 00 007 (MMR), Geb. 106 Nächstes Treffen: Montag, 8. November 2010 14-17 Uhr (c.t.) Raum: SR 00 007 (MMR), Geb. 106 Weiterer Ablauf: Treffen mit Kurzpräsentationen aller Teams Weitere individuelle Termine auf Anfrage Zeitplan 3

Einarbeitungsphase Bis Dienstag, 2. November 2010 Heute! Themenvergabe + Gruppeneinteilung Kurzpräsentation 8. November 2010 Projektvorstellung Eigene Milestones Interne Arbeitsaufteilung Implementierungsphase Programmierung & Dokumentation 10. / 17. Januar 2011: Zwischenbericht zu den Milestones (Treffen oder Präsentation) Abschlusspräsentation 7. Februar 2011 Abgabe Projektbericht (14. Februar 2011) Zeitplan 4

Bachelor 5

Facebook (2010) 1 > 500 Millionen aktive Nutzer speichern Profile, Bilder, Kommentare, Nachrichten > 900 Millionen Seiten, Gruppen, Events, Nutzung: > 700 Milliarden Minuten pro Monat Wie kann man solche riesigen Datenmengen verwalten & analysieren? Lösung: Distributed-Computing? Quelle: (1) Facebook Pressebereich (22.09.2010) http://www.facebook.com/press/info.php?statistics 6

Analyse sozialer Netzwerke Anfragesprache mit Navigationsmöglichkeit Friend of a Friend (FOAF) Anfragen Suche nach kürzesten Pfaden Ausdrucksmöglichkeiten Startknoten (z.b. Chris ) Spezifikation von Kanten (Lokationsschritte) (z.b. knows ) Filter (z.b. age = 18, gender = female) Kürzeste Pfade 7

Datengrundlage Graph eines sozialen Netzwerkes Freundschaftsbeziehungen Eigenschaften Interessante Charakteristika analysieren Six-Degrees of Separation Repräsentationsform: RDF-Graphen Last.fm Musikdienst mit sozialem Netzwerk Freundschaften, Musiktitel, Hör-Profile, u.v.m.! 8

Peter knows Simon Peter knows Frank Peter country DE Peter age 25 Frank knows Chris Frank age 8... knows country age 8 60 DE Frank Chris Peter Simon 25 42 CH Klaus 9

Peter :: knows. Ergebnis Peter (knows) Frank Peter (knows) Simon Peter (knows) Klaus 8 knows country age 60 DE Frank Chris Peter Simon 25 42 CH Klaus 10

Peter :: knows > knows > age. Zwischenergebnisse Peter (knows) Frank Peter (knows) Klaus Peter (knows) Simon 8 knows country age 60 DE Frank Chris Peter Simon 25 42 CH Klaus 11

Peter :: knows > knows > age. Ergebnisse Peter (knows) Frank (knows) Chris (age) 60 Peter (knows) Klaus (knows) Simon (age) 42 Peter (knows) Simon 8 knows country age 60 DE Frank Chris Peter Simon 25 42 CH Klaus 12

Peter :: knows > country [equals(de)]. Zwischenergebnisse Peter (knows) Frank Peter (knows) Klaus Peter (knows) Simon 8 knows country age 60 DE Frank Chris Peter Simon 25 42 CH Klaus 13

Peter :: knows > country [equals(de)]. Ergebnis Peter (knows) Frank (country) DE Peter (knows) Klaus (country) CH Peter (knows) Simon (country) CH 8 knows country age 60 DE Frank Chris Peter Simon 25 42 CH Klaus 14

Peter :: knows(*3). Ergebnisse Peter (knows) Frank Peter (knows) Frank (knows) Chris Peter (knows) Klaus Peter (knows) Simon 8 knows country age 60 DE Frank Chris Peter Simon 25 42 CH Klaus 15

Realname Gender Country Age Duration User Track Album Artist Playcount 16

User knows: 3814884 topartists: 13101056 toptracks: 13264340 topalbums: 13130619 listenedto: 49830975 country: 180056 playcount: 269247 realname: 144040 gender: 268310 age: 153366 Album artist: 269900 tracks: 181624 playcount: 240347 Track artist: 271237 album: 181624 topfans: 8970531 duration: 271205 playcount: 271205 Artist tracks: 271234 album: 269898 topfans: 7439313 toptracks: 7728443 topalbums: 936749 similar: 59471056 17

Query Query Engine Parser/Interpreter Sequence of MapReduce Jobs Evaluation MapReduce-Framework HDFS Handling Large RDF Graphs with MapReduce 18

(1) Verteilte Analyse von sozialen Netzwerken Parsen einer Pfadanfragesprache Umsetzung/Überführung der Ausdrucksmöglichkeiten in eine Sequenz an MapReduce-Jobs Speicherung von (Zwischen-) Ergebnissen im Cluster Ausführung der MapReduce-Jobs im MapReduce-Framework (Hadoop) (2) Ausdrucksmöglichkeiten Startknoten Mehrere Lokationsschritte Filter Kürzeste Pfade (3) Erfahrung im Umgang mit MapReduce, HDFS, sammeln 19

Master (Master) Team Projekt 20

Studienordnung Master: 16 ECTS 480 Semesterstunden ~ 34h/Woche p.p. Empfehlung: keine parallelen Veranstaltungen nebenher besuchen! Teamgröße: 3-4 Studenten Projektbericht Abschlusspräsentation (Master) Team Projekt 21

Eigenständiges Recherchieren und Einarbeiten in die Themengebiete Triple Stores SPARQL Resource Description Framework (RDF) MapReduce Hadoop Distributed Filesystem HBase Arbeitsleistung einzelner Teilnehmer muss klar voneinander abzugrenzen sein (Master) Team Projekt 22

Zielsetzung Entwurf und Implementierung eines verteilten Triple Stores (RDF-Stores) auf Basis von Hadoop (MapReduce) Rahmenbedingungen SPARQL als Anfragesprache (mindestens Basic Graph Patterns + Filter) Auswertungsprozess im MapReduce-Framework Speicherkonzept auf Grundlage von HDFS oder HBase (Master) Team Projekt 23

Jetzt Gruppeneinteilung: 3-4 Personen pro Team (in Liste eintragen) Kontaktinformationen (E-Mail, Telefon) austauschen Gemeinsame Treffen planen Aktuelle Woche Aufgabenstellung kennenlernen Recherche und konzeptueller Entwurf Milestones mit Zeitplan festlegen (Empfehlung: 3-4 Punkte) Interne Arbeitsaufteilung (bzgl. individueller Fähigkeiten) 8. November Kurzpräsentation aller Teilnehmer (5-10 Minuten) Inhalt: Projektvorstellung, Milestones und Arbeitsaufteilung Nächstes Treffen Montag, 8. November 2010 14-17 Uhr (c.t.) Raum: SR 00 007 (MMR), Geb. 106