Soziale Wissenschaft Wissenschaft als soziales Netzwerk

Ähnliche Dokumente
Überblick und Vergleich von NoSQL. Datenbanksystemen

SQL- & NoSQL-Datenbanken. Speichern und Analysen von großen Datenmengen

Konsistenzproblematik bei der Cloud-Datenspeicherung

Abstrakt zum Vortrag im Oberseminar. Graphdatenbanken. Gero Kraus HTWK Leipzig 14. Juli 2015

Übungsblatt: Protein interaction networks. Ulf Leser and Samira Jaeger

Wissenschaftliches Arbeiten , SE 2.0

Prof. Dr.-Ing. Rainer Schmidt 1

Zeit bedeutet eine Abwägung von Skalierbarkeit und Konsistenz

Apache HBase. A BigTable Column Store on top of Hadoop

Algorithmische Methoden zur Netzwerkanalyse Vorlesung für den Bereich Master Informatik

Datenanalyse im Web. Einführung in das Thema. Prof. Dr. Ingo Claÿen. Beispiele für Daten im Web. Extraktion und Aggregation von Informationen

ANALYTICS, RISK MANAGEMENT & FINANCE ARCHITECTURE. NoSQL Datenbanksysteme Übersicht, Abgrenzung & Charakteristik

Algorithmische Methoden zur Netzwerkanalyse Vorlesung für den Bereich Master Informatik

Übergang vom Diplom zum Bachelor

Einführung in die Informatik II

NoSQL. Was Architekten beachten sollten. Dr. Halil-Cem Gürsoy adesso AG. SEACON 2012 Hamburg

Formale Systeme. Binary Decision Diagrams. Prof. Dr. Bernhard Beckert WS 2010/2011 KIT INSTITUT FÜR THEORETISCHE INFORMATIK

SQL- & NoSQL-Datenbanken - Speichern und Analysen von großen Datenmengen

Zitieren leicht gemacht // Die amerikanische sowie die deutsche Art der Zitation

Seminar: Moderne Web Technologien (MWT)

Seminar. NoSQL Datenbank Technologien. Michaela Rindt - Christopher Pietsch. Richtlinien Ausarbeitung (15. November 2015)

Empirisches Seminar Soziale Netzwerkanalyse

Der Support für Windows Server 2003 endet endgültig alles was Ihnen dann noch bleibt ist diese Broschüre.

Seminar aus Netzwerke und Sicherheit

1 topologisches Sortieren

Outlook 2013 Ablauf des Einrichtens in Outlook, um s zu signieren und/ oder verschlüsseln zu können

GEMA Gesellschaft für musikalische Aufführungs- und mechanische Vervielfältigungsrechte Berlin

WS 2002/03. Prof. Dr. Rainer Manthey. Institut für Informatik III Universität Bonn. Informationssysteme. Kapitel 1. Informationssysteme

Betrieb komplexer IT-Systeme

Einführung in Petri-Netze. Modellierung von Abläufen und Prozessen (1) Abhängigkeitsgraphen: Motivation. Petri-Netze

Java und Grid Computing

THE KNOWLEDGE PEOPLE. CompanyFlyer.indd :48:05

WS 2009/10. Diskrete Strukturen

Wollen Sie einen mühelosen Direkteinstieg zum Online Shop der ÖAG? Sie sind nur einen Klick davon entfernt!

Reporting Services und SharePoint 2010 Teil 1

Kommunikation, Information und mobile verteilte Systeme (KIS)

Big Data Mythen und Fakten

CD einlegen (Moment warten) Die Aktion markieren, die durchgeführt werden soll. (in diesem Beispiel»Audio-CD-Wiedergabe)

10.1 Auflösung, Drucken und Scannen

Gemeinsamkeiten und Unterschiede bei der Anwendung für die Analyse von Geschäftsprozessen

Von Markus Schmied und Manuel Bundschuh. New Trends in IT Das Wikireferat

NoSQL HANSER. Einstieg in die Web 2.0 Datenbanken. Stefan Edlich Achim Friedland Jens Hampe Benjamin Brauer Markus Brückner

Seminar Informationsintegration und Informationsqualität. Dragan Sunjka. 30. Juni 2006

Webseiten sind keine Gemälde. Webstandards für ein besseres Web. Webstandards für ein besseres Web

Übung - Datensicherung und Wiederherstellung in Windows Vista

Konzepte der Informatik

Erfolgreiche Tourismus-Kommunikation im (Social) Web (2.0) 2011 F.F.T. MedienAgentur 1

Einführung in PHP. (mit Aufgaben)

Get ready for the Cloud. Ein limitiertes Angebot für bestehende und zukünftige IAMCP-Mitglieder.

Adressen der BA Leipzig

Pädagogische Hochschule Thurgau. Lehre Weiterbildung Forschung

ER-Modellierung am Beispiel der Universitätsdatenbank aus der DBIS-Vorlesung

Das Schulsystem in Deutschland (Band 2, Lektion 1)

Mächtigkeit von WHILE-Programmen

SimpleVOC-Yetanother. Bausteine für eine Key/Value- Datenbank

Informationsblatt Induktionsbeweis

MS Outlook Integration

Soziale Netzwerkanalyse

Eine molekulare Lösung des Hamiltonkreisproblems mit DNA

4D Server v12 64-bit Version BETA VERSION

PostgreSQL in großen Installationen

Begriff 1 Begriff 2 Datenbank 1

CTX 609 Daten Fax Modem. Installation Creatix V92 Data Fax Modem (CTX 609) unter Windows XP/ Windows Installation unter Windows XP:

1. Erstellung, aus einer Idee wird ein digitaler Bestandteil einer Website.

Schüler-E-Tutorial für mobile Endgeräte. Ein Folgeprojekt des Netzwerks Informationskompetenz Berlin/Brandenburg mit der HdM

Informationslogistik Allgemeine Informationen

5. Bildauflösung ICT-Komp 10

ZUM HANDELN GESCHAFFEN. Stationärer Handel / Multi Channel

Fragenkatalog zum Kurs 1666 (Datenbanken in Rechnernetzen) Kurstext von SS 96

DAS SIND WIR. Kronthalerstraße Königstein phone +49 (0) fax +49 (0) mail web nolinkup.

Die Beitrags-Ordnung vom Verein

Sicherheitseinstellungen... 2 Pop-up-Fenster erlauben... 3

OKB Die MS SQL-Volltextsuche für organice SQL einrichten

Index der Gewerbeflächenvermarktung

4. Relationen. Beschreibung einer binären Relation

Analyse des Normennetzwerks der Internet Requests for Comments

WS 2013/14. Diskrete Strukturen

Sicherheitstechnik VON a bis z

Wirtschaftsinformatik an der Universität Trier. Intelligente Technologien für das Management der Zukunft!

Verteilte Systeme Prof. Dr. Stefan Fischer

WINDOWS 10 Upgrade. Beispiel: Desktop-Ausschnitt von vorhandenem WIN 8.1 (rechte Ecke der Taskleiste)

Preisvergleich ProfitBricks - Amazon Web Services M3 Instanz

Erfahrungen mit Hartz IV- Empfängern

Klausur WS 2006/07 Programmiersprache Java Objektorientierte Programmierung II 15. März 2007

Nominierung Digital Marketer of the Year 2014

Fachhochschule der Wirtschaft Paderborn (FHDW) Fachbereich angewandte Informatik. Pflichtenheft. Anwendungsentwicklung Semester 5

Einsatzbedingungen FAMOS 3.10

Fragebogen zur Evaluation der Vorlesung und Übungen Computer Grafik, CS231, SS05

Artenkataster. Hinweise zur Datenbereitstellung. Freie und Hansestadt Hamburg. IT Solutions GmbH. V e r s i o n

BitDefender Client Security Kurzanleitung

Kapitel 5: Dynamisches Programmieren Gliederung

Social Media Monitoring Was wird über Sie und Ihre Wettbewerber gesagt?

INTERNETZUGANG UND DATENBANKEN IM ZRS

Virtuelles Rollenspiel mit Social Software. David Weiß, Sarah Voß DeLFI 2010 Duisburg

IMS - Learning Design

Seminar Trends beim Softwaretest. Einführung

NoSQL. Einblick in die Welt nicht-relationaler Datenbanken. Christoph Föhrdes. UnFUG, SS

So funktioniert die NetWorker 7.5 Eigenschaft zum Sichern umbenannter Verzeichnisse ( Backup renamed Directories )

802.11N WLAN USB ADAPTER HIGH SPEED WIRELESS CONECTIVITY

Transkript:

Seminar Technologie sozialer Netzwerke Prof. Dr. Krömker WS 13/14 Soziale Wissenschaft Wissenschaft als soziales Netzwerk Sven Köppel koeppel@cs.uni-frankfurt.de Professur für Graphische Datenverarbeitung Institut für Informatik Uni Frankfurt

OpenAccess: ArXiv Data Preservation Zitationsdatenbanken Inspire Kein Facebook Netzwerkanalyse Netzwerk: 1M Akteure Github NoSQL: Neo4j Seminararbeit

NoSQL-Datenbanken Motivation Vorteile Eigenschaften Beispiele Trends und Buzzwords Aus: http://de.slideshare.net/quipo/nosql-databases-why-what-and-when

NoSQL-Datenbanken Motivation Vorteile Eigenschaften Beispiele Relationale Datenbanken Ausgereift Schemagetrieben SQL Skalieren schlecht ACID: Konsistenz Verbreitung Nachzulesen in: Edlich2011, Mehler2013, Stolze2013, Robinson2013

NoSQL-Datenbanken Motivation Vorteile Eigenschaften Beispiele NoSQL-Datenbanken skalieren Vertikales Skalieren scale up Horizontales Skalieren scale out Hardware upgraden Hinzufügen von Rechnern: Parallelisierung Nachzulesen in: Edlich2011, Mehler2013, Stolze2013, Robinson2013

NoSQL-Datenbanken Motivation Vorteile Eigenschaften Beispiele Konsistenzmodelle ACID BASE Atomicity, Consistency, Isolation, Durability Basically Available, Soft state, Eventual consistency Harte Konsistenz Weiche Konsistenz Fokus auf Transmit Lieber Warten und dann richtig Fokus auf Verfügbarkeit Hauptsache Daten da Konservativ/Pessimistisch Näherung akzeptabel Komplexe Transaktionen Einfacher Schneller Graustufen möglich: Think of Spectrum (Brewer 2002) Nachzulesen in: Edlich2011, Robinson2013

NoSQL-Datenbanken Motivation Vorteile Eigenschaften Beispiele Das CAP-Theorem Im verteilten System nie gleichzeitig: Konsistenz Verfügbarkeit Partitionstoleranz Kann stets nur zwei zur Zeit erfüllen! Geschichte 2000: Vermutung von Brewer 2002: Axiomatisch bewiesen durch Gilbert, Lynch Bildquelle: http://noqqe.de/uploads/2012/04/cap-theorem.png Nachzulesen in: Edlich2011

Bildquelle: http://t3n.de/news/wp-content/uploads/2010/03/nathan-hursts-entscheidungspyramide-zu-nosql.png

NoSQL-Datenbanken Speicherstrukturen Bildquelle: Robinson2013 Motivation Vorteile Eigenschaften Beispiele

NoSQL-Datenbanken Motivation Vorteile Eigenschaften Beispiele Graphdatenbanken Index-freie Adjazenz (native Speicherung) Eingebaute Graphalgorithmen Effiziente Traversierung Spezifische API Speichermodelle Eigenschaftsgraphen (Property Graphs) Hypergraphen Triplets (v.a. Semantisches Web; Subjekt-Prädikat-Objekt) Bildquelle: http://www.neotechnology.com/facebook-graphsearch/ Nachzulesen in: Robinson2013

NoSQL-Datenbanken Motivation Vorteile Eigenschaften Beispiele Neo4j Bildquelle: http://www.neotechnology.com/facebook-graphsearch/ Java (native Java-API) Propertygraph JSON-Daten an Knoten und Relationen RESTful-API Webinterface CYPHER Nachzulesen in: Robinson2013

Netzwerkanalyse Bildquelle: http://gephi.org

Netzwerkanalyse Geschichte: Soziale Netzwerkanalyse: Mitte 20. Jahrhundert! Ziel: Quantifizierung/Systematisierung von Netzwerken Beispiel: Zentralitätsmaße für Akteure Degree Betweeness Closeness Literatur: Jansen2006 [nach Jansen 2006]

Netzwerkanalyse Bildquelle: http://www.flickr.com/photos/unileon/8016703324/

RSA-Paper: http://people.csail.mit.edu/rivest/rsapaper.pdf Wissenschaftskommunikation

RSA-Paper: http://people.csail.mit.edu/rivest/rsapaper.pdf Wissenschaftskommunikation

RSA-Paper: http://people.csail.mit.edu/rivest/rsapaper.pdf Wissenschaftskommunikation

Zitationsnetzwerke CIT ED _B Y A Method for Obtaining Digital Signatures and Public-Key Cryptosystems REFERS_TO New directions in Cryptography Diffie, Hellmann IEEE IT-22 1976 Electronic Mail Potter, Science 195 1977 Exhaustive cryptoanalysis Of the NBS data encryption Standard Diffie, Hellmann Computer 10 1977

Arbeitshypothese : Zitationsnetzwerke Soziales Netzwerk (=Online-Communities?) Einfache Beobachtungen: Zitationen sind soziale Interaktion, damit sind Zitationsnetzwerke soziale Netzwerke [Jansen2006] Zitationen sind gerichtet, Freundschaften im Allgemeinen nicht Zitationen sind für die Ewigkeit weniger Dynamik»zitiert«(refers) und»zitiert durch«(cites) sind konvers (inverse Relation), es reicht, eine Relation zu speichern Menschliche Akteure kommen als Autoren, die ein Paper schreiben, in den Graphen, damit wird die einfachste Beziehung (Duade) zu (m1:mensch)-[:author_of]->(p1:paper)-[:refers_to]-> (p2:paper)<-[:author_of]-(m2:mensch)

Scientometrie [Price 1963] Quantifizierung der Wissenschaftsgüte Bibliometrie [Pritchard 1969] statistische Bibliografie Zahlreiche GesetzMäßigkeiten, z.b. Exponentielles Wissenswachstum [Price 1963] Grafiken: S.K.

Little Science, Big Science LifeSciences Weltraumforschung Hochenergiephysik High Energy Physics (Teilchenphysik) Informationssysteme http://www.inspirehep.net http://www.arxiv.org Quellen: Zapkov2012 (DP-HEP), Neuroth2012, Kreitz1996, Gentil-Beccot2008, Brooks2010

Zitationsdatenbanken #Papers Zeitabdeckung bis Bereich Science Citation Index 37 M 1900/1956/1975 allg PubMed 23 M 1966 Medizin 1M 1940/1990 Unterbereich Physik CiteSeer... SPIRES-HEP Quellen: Neuhaus2008

InSpire-Datenbank 1.000.000 Papers 13.000.000 Referenzen 8.000.000 Autoren 500.000 Menschen 4 GB Neo4j-DB { "recid": 1239195, "citations": [51535, 56454, 8486], "title": "Performance in simulating particle detector...", "references": [1220838, 717606, 810152, 890602,...], "abstract": "Geant4 simulations play a crucial role in...", "authors": ["Soti, G."], "creation_date": "2013-06-19", "co-authors": ["Wauters, F.", "Breitenfeldt, M.", ] }

SocialHEP http://socialhep.uni-frankfurt.de Softwarestack Browser jquery D3.js Nginx Proxy Website Middleware Autor: P. Nicolini Neo4j REST-API Py2neo Autor: W. Greiner Neo4j Linux-Server

Preferential Attachment Matthäus-Effekt: Wer hat, dem wird gegeben [Merton 1968] Quellen: Mehler2013, Merton1968, Jansen2006. Bild: S.K.

Publikationsgraph ist ein skalenfreies Netzwerk Kanten pro Knoten exponentiell verteilt, damit Skaleninvarianz bzgl. Graphgröße. Skalenfreiheit Kleine-Welt-Phänomen Dist # ---- -----1 30 2 1.289 3 19.784 4 107.926 5 1.000.000 Quellen: Mehler2013, Merton1968, Jansen2006. Bild: S.K. Dauer ----46ms 93ms 50ms 36sec >min

Soziale Wissenschaft Wissenschaft als soziales Netzwerk Sven Köppel koeppel@cs.uni-frankfurt.de Vorläufige Ausarbeitung sowie Website unter: http://socialhep.uni-frankfurt.de Präsentation am Do 09.01.2013 Seminar Technologie sozialer Netzwerke Prof. Dr. Krömker WS 13/14