Apache HBase. A BigTable Column Store on top of Hadoop



Ähnliche Dokumente
Prof. Dr.-Ing. Rainer Schmidt 1

VIP-Programm. Herzlich Willkommen!

Was meinen die Leute eigentlich mit: Grexit?

Internet online Update (Internet Explorer)

Hadoop. Eine Open-Source-Implementierung von MapReduce und BigTable. von Philipp Kemkes

Konfiguration des eigenen TUphone-Profils über TISS

Bei der Benutzung des NetWorker Client Configuration Wizards könnten Sie die Namen Ihrer Datenbanken verlieren

Der Gabelstapler: Wie? Was? Wer? Wo?

Internet online Update (Mozilla Firefox)

Geld Verdienen im Internet leicht gemacht

Bilder zum Upload verkleinern

"Ich habe als Vereinsverantwortlicher eine erhalten - was mache ich, um Torwurf.de für meinen Verein einzusetzen?"

Die Wirtschaftskrise aus Sicht der Kinder

Mit dem. zum Traumjob

Jeunesse Autopiloten

Sichere Anleitung Zertifikate / Schlüssel für Kunden der Sparkasse Germersheim-Kandel. Sichere . der

SJ OFFICE - Update 3.0

50 Fragen, um Dir das Rauchen abzugewöhnen 1/6

Wo finde ich die Software? - Jedem ProLiant Server liegt eine Management CD bei. - Über die Internetseite

Fernseher Bild Bildschirm Computergeräte. Festplatte CD DVD Eingabegerät. Computertasten Mauszeiger Cursor rechten Maustaste

Blumen-bienen-Bären Academy. Kurzanleitung für Google Keyword Planer + Google Trends

AGROPLUS Buchhaltung. Daten-Server und Sicherheitskopie. Version vom b

Inhalt. 1 Einleitung AUTOMATISCHE DATENSICHERUNG AUF EINEN CLOUDSPEICHER

Entwicklung des Dentalmarktes in 2010 und Papier versus Plastik.

Windows 8. Der Task-Manager. Dieses Dokument kann frei verwendet werden. Keine Lizenzen, kein Copyright. Do what you want with it.

Wie Sie mit Mastern arbeiten

Die richtigen Partner finden, Ressourcen finden und zusammenführen

Safer Internet Day 2014: DER KLASSEN HANDYCHECK

Informatik 12 Datenbanken SQL-Einführung

Das sogenannte Beamen ist auch in EEP möglich ohne das Zusatzprogramm Beamer. Zwar etwas umständlicher aber es funktioniert

Anleitung für ein Firmware Upgrade auf einem D-Link DIR-615 Router. (Diese Firmware Anleitung ist nur für die Hardware Version D bzw. H!

Anleitung zur Nutzung des SharePort Utility

bilder.tibs.at Upload-Assistent

Südberliner Gemeinde-Bibelschule (SBGBS) September 2008

Tevalo Handbuch v 1.1 vom

Anleitung Grundsetup C3 Mail & SMS Gateway V

ICS-Addin. Benutzerhandbuch. Version: 1.0

Menü auf zwei Module verteilt (Joomla 3.4.0)

Erstellung eines Blogbeitrags

Updatehinweise für die Version forma 5.5.5

B: bei mir war es ja die X, die hat schon lange probiert mich dahin zu kriegen, aber es hat eine Weile gedauert.

Pfötchenhoffung e.v. Tier Manager

Wenn keine Verbindung zwischen den Computern besteht, dann bist du offline.

Umbenennen eines NetWorker 7.x Servers (UNIX/ Linux)

2.1 Erstellung einer Gutschrift über den vollen Rechnungsbetrag

EINBLICKE FÜR KMU-KUNDEN

Stellvertretenden Genehmiger verwalten. Tipps & Tricks

BIA-Wissensreihe Teil 4. Mind Mapping Methode. Bildungsakademie Sigmaringen

boniup das BackOffice Einstiegsmöglichkeiten: Was be.findet sich im BackOffice? oder

Gesucht und Gefunden: Die Funktionsweise einer Suchmaschine

Kurzanleitung für eine erfüllte Partnerschaft


Das Persönliche Budget in verständlicher Sprache

Digitaler*Ausstellungsbegleiter*für*Mobilgeräte ** * * * Alter: Studiengang: Geschlecht: $ $ $ $ Datum: Falls%Ja,%welches? Falls%ja, %welches?

Installation von Office 365 auf einem privaten PC

Sicher unterwegs in YouTube

Installationsanleitung DAISY-CD, Vollversion - Netzwerk -

Datenübernahme von HKO 5.9 zur. Advolux Kanzleisoftware

Bedienungsanleitung für den Online-Shop

changenow THE PLAN Die 7 Brillen der Vergangenheit

Copyright by Steffen Kappesser

Fülle das erste Bild "Erforderliche Information für das Google-Konto" vollständig aus und auch das nachfolgende Bild.

PHPNuke Quick & Dirty

Internet-Wissen. Browser:

teamsync Kurzanleitung

BigTable Else

CSS-Grundlagen. Etwas über Browser. Kapitel. Die Vorbereitung

Affiliate Marketing Schnellstart Seite 1

Die Post hat eine Umfrage gemacht

Teil 1: IT- und Medientechnik

WordPress installieren mit Webhosting

Statuten in leichter Sprache

I. Travel Master CRM Installieren

Lukas 7, nach NGÜ

Tutorial: Wie nutze ich den Mobile BusinessManager?

Was ich als Bürgermeister für Lübbecke tun möchte

Stellen Sie bitte den Cursor in die Spalte B2 und rufen die Funktion Sverweis auf. Es öffnet sich folgendes Dialogfenster

Social Networks als Kundenbindungsinstrument

Reporting Services und SharePoint 2010 Teil 1

So die eigene WEB-Seite von Pinterest verifizieren lassen!

Universal Dashboard auf ewon Alarmübersicht auf ewon eigener HTML Seite.

Was sind Soziale Netzwerke? Stelle dazu selbstständig Überlegungen an!

Einrichten des Elektronischen Postfachs

Kurze Benutzungsanleitung für Dozenten

Jetzt kann ich nicht investieren!

Modul 3: Stellenanzeigenanalyse

Fotogalerie mit PWGallery in Joomla (3.4.0) erstellen

Studieren- Erklärungen und Tipps

Umgekehrte Kurvendiskussion

Bestandesaufnahme und Bedürfnisanalyse

Konvertieren von Settingsdateien

OKB Die MS SQL-Volltextsuche für organice SQL einrichten

TimeMachine. Time CGI. Version 1.5. Stand Dokument: time.odt. Berger EDV Service Tulbeckstr München

Dazu stellen Sie den Cursor in die Zeile, aus der eine Überschrift werden soll, und klicken auf die gewünschte Überschrift.

Website freiburg-bahai.de

Dow Jones am im 1-min Chat

Internet Explorer Version 6

Eine Einführung in die Installation und Nutzung von cygwin

Anleitung C3 IP Tools V loxone.c3online.at. Kontakt & Support. Brielgasse 27. A-6900 Bregenz. TEL +43 (5574) MAIL info@c3online.

BERLINER BASKETBALL VERBAND e.v.

Transkript:

Apache HBase A BigTable Column Store on top of Hadoop

Ich bin... Mitch Köhler Selbstständig seit 2010 Tätig als Softwareentwickler Softwarearchitekt Student an der OVGU seit Oktober 2011 Schwerpunkte Client/Server, hauptsächlich im Web Intelligente Systeme (Big Data, Information Retrieval,...)

HBase ist... Eine verteilte Datenbank nach dem Vorbild von Googles BigTable Paper

BigTable eine sortierte Map <RowKey, ColumnFamily, ColumnQualifier, Timestamp, Value> { "Key_1" : { "data" : { "mycolumn" : { "4" : "Version_4-AKTUELL!", "3" : "Version_3", "2" : "Version_2", "1" : "Version_1" } } }

HBase ist... Eine verteilte Datenbank nach dem Vorbild von Googles BigTable Paper Baut auf Hadoop auf Hohe Integration zwischen HBase und Hadoop OpenSource Thema dieses Vortrages :-)

A few words of caution vergesst, was ihr über relationale Datenbanken wisst Column Oriented Databases sind NICHT relational vergesst, was eine Tabelle in einem RDBMS darstellt In HBase sind Tabellen NUR ein Ort, um Daten zu speichern sie haben nicht die selbe semantische Bedeutung, wie in einem RDBMS! vergesst, wie Spalten in einem RDBMS arbeiten! HBase ist eine multidimensionale, sortierte Map!

A few words of caution Keine Joins! Keine Transaktionen! Atomizität wird nur auf Operationen je Row garantiert Keine Typisierung der Spalten! Kein SQL! KEIN Ersatz für ein RDBMS! HBase ist in manchen Fällen wesentlich komplexer!

A few words of caution KEIN ERSATZ für eine relationale Datenbank!

HBase rockt! Millionen und abermillionen Writes/Reads pro Sekunde Facebook: 75 MRD Read/Writes per Day (Nov. 2011) Bis zu 1.5 Millionen Read/Writes per Second Skaliert linear horizontal (und wurde dafür gebaut!) Daten werden sortiert gespeichert! Datenanalyse mit Hadoop MapReduce at

Open Time Series Database Monitoring Tool, um Metriken von tausenden Servern parallel und in real-time zu verarbeiten Eigentlich lässt sich alles mögliche damit monitoren Klickzahlen Visits Netzauslastung Kekse Daten bleiben historisch erhalten Wie machen die das?

Open Time Series Database MetricID (z.b. myservice.latency.avg) Timestamp (z.b. 1292148123) Tags Bestehen aus einem Namen als Kategorie und einer Unterkategorie z.b. Name: Host, Unterkategorie: web32 Der zu speichernde Wert

Open Time Series Database RowKey: MetricID_Timestamp_<<Tags>> Also zum Beispiel myservice.latency.avg_1292148123_type:get_host:web32 Timestamps werden auf 60 Minuten normiert!

Design des RowKeys für festgelegte Zeitspanne können Analysen je RequestType und Host gefahren werden Beispiel: FROM myservice.latency.avg_1292100000_type:get_host:web32 TO myservice.latency.avg_1292200000_type:get_host:web32

Design des RowKeys MetricID_Timestamp_<<Tags>> myservice.latency.avg_1292148123_type:get_host:web32 Daten zum selben Service liegen beieinander jüngste Daten je Service zuerst für festgelegte Zeitspanne können Analysen je RequestType und Host gefahren werden Timestamps werden auf 60 Minuten normiert!

Design des RowKeys RowKey ist Partitionierungskriterium HBase splittet eine Region, wenn Die Region unter zu hoher Last steht Die Region zu groß wird HBase splittet aber niemals eine Row! Eine Row liegt immer vollständig in einer Region Rows sollten daher nicht zu groß werden

Open Time Series Database RowKey myservice.latency.avg_1292148123_type:get_host:web32 Wie sieht Column Qualifier aus? Enthält zeitliches Delta + Datentype Value: zu speichernder Wert für Metrik

Open Time Series Database RowKey myservice.latency.avg_1292148123_type:get_host:web32 Wie sieht Column Qualifier aus? Delta von Timestamp des RowKeys und aktueller Zeit 4-Bit-Flag, um Datentyp des Wertes festzulegen Value: zu speichernder Wert für Metrik

Facebooks Message Search HBases Versioning-Feature als Inverted Index Column Qualifier Term (z.b. Kekse ) Versionen Verweise auf Nachrichten, die diesen Term enthalten

Facebooks Message Search { "user_mitch" : { "msgbox_index" : { "Kekse" : { "13576884474" : "MSG_Bob", "13576844474" : "MSG_Bob" }, "Schokokekse" : { "13579885434" : "MSG_Bob", "13576844474" : "MSG_Eve" }

One more thing... Support von mir mitch.koehler@st.ovgu.de Du bist engagiert neugierig und an aufstrebenden Technologien interessiert HTML5 und Web-Technologien sind Dir ein Begriff? Dann melde Dich bei mir!