Dokumentenorientierte Datenbanken - MongoDB

Ähnliche Dokumente

Cloud-Provider im Vergleich. Markus

Big Data Informationen neu gelebt

Einführung in CouchDB

RSS Push Verfahren. Hongliang Jiang, Roland Höpfner Seminar Moderne Webtechnologien AG-NBI. 18. November 2009

Überblick und Vergleich von NoSQL. Datenbanksystemen

Inhalt. 1 Einleitung AUTOMATISCHE DATENSICHERUNG AUF EINEN CLOUDSPEICHER

Apparo Fast Edit Daten-Management in einer BI-Umgebung. Dateneingabe-Workflows

HD-Kamerasoftware Version 4.1.0

Übung - Datensicherung und Wiederherstellung in Windows Vista

HA Architekturen mit MySQL

4D Server v12 64-bit Version BETA VERSION

Synchronisation von redundanten Datenbeständen

Literaturverwaltungs- programme: Zotero

Topfield Firmware Patcher

Zend Server Cluster Manager

Rechnung Angebot Zeiterfassung

HERZLICH WILLKOMMEN SHAREPOINT DEEP DIVE FOR ADMINS IOZ AG 2

Elasticsearch aus OPS-Sicht Teil1. Markus Rodi Karlsruhe,

Installation SQL- Server 2012 Single Node

SEARCH DRIVEN APPLICATIONS MIT DEM CONTENT SEARCH WEBPART

Virtueller Seminarordner Anleitung für die Dozentinnen und Dozenten

Installation von NetBeans inkl. Glassfish Anwendungs-Server

Überblick über aktuelle Services Überblick über aktuelle Cloud Services

Monitoring mit Graphite

Ihr CMS für die eigene Facebook Page - 1

Anleitung zur Benutzung des jobup.ch Stellensuchendekontos

e-books aus der EBL-Datenbank

Big Data Mythen und Fakten

Acht Gute Gründe für Integration und einen Content Backbone

Preise und Leistungen Dynamic Computing Services

Möglichkeiten für bestehende Systeme

TREND SEARCH VISUALISIERUNG. von Ricardo Gantschew btk Berlin Dozent / Till Nagel

Computeria Urdorf. Treff vom 25. März Clouds

Laborübung - Verwalten von virtuellem Speicher in Windows 7

TYPO3 CMS 6.2 LTS. Die neue TYPO3- Version mit Langzeit- Support

2. ERSTELLEN VON APPS MIT DEM ADT PLUGIN VON ECLIPSE

3. Neuen Newsbeitrag erstellen Klicken Sie auf das Datensatzsymbol mit dem +, damit Sie einen neuen Newsbeitrag erstellen können.

Suche schlecht beschriftete Bilder mit Eigenen Abfragen

Schritt 1: Verwenden von Excel zum Erstellen von Verbindungen mit SQL Server-Daten

Laborübung - Task Manager (Verwalten von Prozessen) in Windows Vista

Auslesen der Fahrtdaten wiederholen Schritt für Schritt erklärt (Funktion Abfrage zur Datensicherung erstellen )

Apache HBase. A BigTable Column Store on top of Hadoop

Korrekturen von Hand ausgeführt, per Post oder als Scan an Sie übermittelt.

Intergraph Geospatial 2014 Download, Installation und Lizenzierung

Übung - Datensicherung und Wiederherstellung in Windows 7

Zeit bedeutet eine Abwägung von Skalierbarkeit und Konsistenz

Stud.IP Performance Testing

Beispiel des Zusammenführens der APV- Tabellen Stammdaten und Verlaufsdaten mithilfe von Access

Planung für Organisation und Technik

June Automic Hadoop Agent. Data Automation - Hadoop Integration

MapReduce und Datenbanken Thema 15: Strom bzw. Onlineverarbeitung mit MapReduce

7 SharePoint Online und Office Web Apps verwenden

EMC. Data Lake Foundation

Konsistenzproblematik bei der Cloud-Datenspeicherung

Bitte beachten Sie die folgenden Systemvoraussetzungen um DocuWare installieren zu können:

Database Exchange Manager. Infinqa IT Solutions GmbH, Berlin Stralauer Allee Berlin Tel.:+49(0) Fax.:+49(0)

Benutzerhandbuch. Bürgel ConsumerCheck für OXID eshop

ETL in den Zeiten von Big Data

Loggen Sie sich in Ihrem teamspace Team ein, wechseln Sie bitte zur Verwaltung und klicken Sie dort auf den Punkt Synchronisation.

Installation des edu-sharing Plug-Ins für Moodle

Web Services stellen eine Integrationsarchitektur dar, die die Kommunikation zwischen verschiedenen Anwendungen

SQL für Trolle. mag.e. Dienstag, Qt-Seminar

Open Source. Hendrik Ebbers 2015

Blumen-bienen-Bären Academy. Kurzanleitung für Google Keyword Planer + Google Trends

SAP NetWeaver Gateway. 2013

Laborübung - Task Manager (Verwalten von Prozessen) in Windows XP

Datenbanken auf Sybase SQL-Anywhere

Lösungsszenarien für die Filearchivierung/ Langzeitdatenspeicherung mit Symantec Enterprise Vault

Laufwerke unter Linux - Festplatten - - USB Sticks - September 2010 Oliver Werner Linuxgrundlagen 1

Werkzeuge für Datenbank Handwerker: IBM Data Studio und IBM Optim QWT

Lizenz Verwaltung. Adami Vista CRM

Anleitung zum Extranet-Portal des BBZ Solothurn-Grenchen

INHALTSVERZEICHNIS Allgemeine Beschreibung... 3 Verwendung der Webseite... 4 Abbildungsverzeichnis... 12

Sehr geehrte Faktor-IPS Anwender,

Storage-Trends am LRZ. Dr. Christoph Biardzki

das Portfolio wurde um eine freie Edition und eine lizenzpflichtige Edition ergänzt

KURZANLEITUNG CLOUD OBJECT STORAGE

TYPO3-Suchmaschinenoptimierung für Redakteure

Storage-Workshop Dresden Marcus Stier

Hilfe zur Dokumentenverwaltung

Dehnbarer Begriff Verteiltes Suchen mit Elasticsearch

Kurzanleitung OOVS. Reseller Interface. Allgemein

DOKUMENTATION VOGELZUCHT 2015 PLUS

Notes / Domino New Features & Was bringt die Eclipse Plattfrom von Lotus Notes für mein Unternehmen. Dipl.-Ing.

Anleitung Redmine. Inhalt. Seite 1 von 11. Anleitung Redmine

KBC Group. Anleitung für Zahlungen via Excel in KBC-Local

Kundeninformation PDF-Erzeugung in Adobe Illustrator, Adobe InDesign und QuarkXPress Datenprüfung und Datenübergabe

Installation des CMS-Systems Contao auf einem Windows-Rechner mit XAMPP

Monitoring - Vorher Wissen was passieren wird

Adminer: Installationsanleitung

2. Konfiguration der Adobe Software für die Überprüfung von digitalen Unterschriften

Handbuch für Redakteure der Vereinshomepage

GE Capital Equipment Financing. GE Capital Leasing-Tool Schulungsunterlagen

Bei der Benutzung des NetWorker Client Configuration Wizards könnten Sie die Namen Ihrer Datenbanken verlieren

datenfabrik. Validieren von -Adressen 1

Die XML-Schnittstelle von FreelancerWelt.de Projektimport

Wie richten Sie Ihr Web Paket bei Netpage24 ein

Bedienungsanleitung PC-Konfigurationssoftware des ID Inclinometers

Transkript:

Dokumentenorientierte Datenbanken - MongoDB Jan Hentschel Ultra Tendency UG

Übersicht Dokumente sind unabhängige Einheiten Bessere Performance (zusammengehörige Daten werden gemeinsam gelesen) Objektmodell der Anwendung kann direkt in die Datenbank geschrieben werden Unstrukturierte Daten können einfach gespeichert werden Keine Schema-Migration bei Updates notwendig Cassandra CouchDB Lotus Notes Redis RethinkDB MongoDB u.v.m. 2

Einsatzgebiete Schnelle Entwicklung Web-freundlich CRUD Entwickler-freundlich JSON REST Natürliche Datenmodellierung 3

Motivation New York Times IBM CERN CMS Foursquare Salesforce Marketing Cloud Cisco Bosch 4

MetLife Insurance The Wall Customer Service Application 360 Grad-Konsolidierung, u.a. Policies Steigert Call Center-Produktivität 45 Millionen Vereinbarungen mit 140 Millionen Transaktionen Go Live innerhalb von 90 Tagen für über 100 Million Kunden Weitere MongoDB-Systeme sind geplant 5

Übersicht Veröffentlicht 2009 Geschrieben in C++ Beinhaltet SQL-freundlichen Techniken (Abfragen, Index) BSON als Protokoll Abfragen und DB-Management via JavaScript-Ausdrücke Geospatial Indexing ACID auf Dokumentenebene 6

Wann nutzt man MongoDB? Dynamische Anfragen benötigt Index bevorzugt (kein Map/Reduce) Gute Performance auf großen Daten Wenn CouchDB eingesetzt werden soll, aber die Daten sich zu oft ändern Wenn man MySQL oder PostgreSQL einsetzt, aber vordefinierte Spalten nicht benötigt werden 7

MongoDB Enterprise Mehr Sicherheitsfunktionalitäten Kerberos LDAP-Authentifizierung On-Demand Training Proaktiver Support Commercial License 8

Schema-Design comments comment_id post_id by_user message data_time likes post id title description urlpost_by tag_list id post_id tag { } _id: POST_ID by: POST_BY, url: URL_OF_POST, tags: [TAG1, TAG2, TAG3], comments: [ { user:'comment_by', message: TEXT, datecreated: DATE_TIME, like: LIKES }, ] 9

Schema-Design Ähnliche Dokumente in Collection zusammenfassen Index-Erstellung passend zu den Anfragen Ein Index per Abfrage Index sollte in den RAM passen Nicht immer ist ein Index ratsam 10

Entwicklung Viele Client-Implementierung (Driver) vs keine HTTP-Schnittstelle Einheitliche Entwicklung der Driver über Sprachen hinweg Primär getrieben von Entwicklern, weniger von Administratoren 11

Entwicklung C Scala Java Ruby C# Driver Python PHP Perl Node.js C++ 12

Replikation Master/Slave-Replikation Automatischer Failover mit Replika Sets Primary Secondary Arbiter Delayed secondary Priority 0 Wird nie als Primary gewählt 13

Replikation Secondary Driver Read Write Primary Secondary 14

Scale-out Shard A 256 GB Collection I 1 TB Shard B 256 GB Shard C 256 GB Shard D 256 GB 15

Performance Performance über Features Eine leere Datenbank benötigt 192 MB Normalisierung in ein großes Dokument bietet manchmal bessere Performance Indexes erstellen die Anfragen unterstützen Limitierung der Ergebnismenge 16

Aggregation Pipeline 17

Single Purpose Aggregation 18

MapReduce 19

MongoDB & Big Data MapReduce ist möglich GridFS für Big Data & Metadaten Spezifikation für das Speichern und Lesen von BSON-Dokumenten, die größer als 16 MB sind Partielles Laden einer Datei möglich 20

Anfragetypen Key-Value-Anfragen Range-Anfragen Geospatial-Anfragen Textsuche-Anfragen Aggreation Framework-Anfragen MapReduce-Anfragen 21

MongoDB MapReduce 22

Hadoop MapReduce 23

MongoDB & Hadoop MapReduce 24

Demo 25