Daten auf mehreren Systemen Swiss Postgres Conference Juni Harald Armin Massa

Ähnliche Dokumente
Ist Dein PostgreSQL logisch genug für bidirektionalität? , Swiss PGDay Harald Armin Massa

Harald Armin Massa. Hochverfügbarkeit mit PostgreSQL - ein Überblick. Swiss PG Day Rapperswil

PostgreSQL im Cluster. Hans-Jürgen Schönig Hans-Jürgen Schönig

Grundlagen der PostgreSQL Administration

Application Business Continuity

PostgreSQL in großen Installationen

Chancen und Wachstumsfelder für PostgreSQL

Johannes Ahrends CarajanDB GmbH

<Insert Picture Here> Web-2.0-Anwendungen mit MySQL

Oracle Core für Einsteiger: Datenbank I/O

Oracle Database Appliance X6-2 Familie. Bernd Löschner

MySQL Replikation. Erkan Yanar linsenraum.de linsenraum.de

Weblogic 12.2 und DB 12.2 das perfekte Duo

MySQL Cluster. Kai Voigt MySQL AB Kiel, 17. Februar 2006

MySQL Replication: Eine Einführung

PostgreSQL Administration

Weltweite Produktionsdatenverwaltung mit MySQL-Replikation

TSM 5.2 Experiences Lothar Wollschläger Zentralinstitut für Angewandte Mathematik Forschungszentrum Jülich

Citrix Cloud Services und nlx.net im Vergleich für Ihren sicheren digitalen Arbeitsplatz

Oracle Database Appliance und Virtualisierung: OVM oder KVM?

MySQL High Availability. DOAG 2013 Datenbank. 14. Mai 2013, Düsseldorf. Oli Sennhauser

ODA Erfahrungen und Neuigkeiten

Veeam Availability Suite. Thomas Bartz System Engineer, Veeam Software

Markus Feichtinger. Power Systems. Der Weg zu POWER! 2009 IBM Corporation

MySQL Cluster und MySQL Proxy

Verteilte Betriebssysteme

Hochverfügbarkeit mit AlwaysOn für die SSISDB. Stefan Grigat,

MySQL Backup und Restore

Gut zu wissen... Lorenz Keller Server Technologies Competence Center Nord

Oracle Backup und Recovery mit RMAN

Oracle Backup und Recovery mit RMAN

Hochverfügbarkeit für die Datenbank. Was ist zu beachten?

Veeam und Microsoft. Marco Horstmann System Engineer, Veeam

RavenDB, schnell und skalierbar

MySQL Administration. Seminarunterlage. Version 3.02 vom

SATA - SAS. Bandbreite ist nicht Performance. MB/s und GB/s sind wichtig für: Backbone Netzwerke Data-Streaming Disk-to-Disk Backup

Agenda. Ausgangssituation (Beispiel) PaaS oder IaaS? Migrationspfade Deep Dives. IaaS via Azure Site Recovery PaaS via SQL Deployment Wizard

Freiberuflicher IT-Berater Schwerpunkte: Unix, Oracle, Netzwerk. IT-Berater. Dipl.-Inform.

DOAG HC ApEx Workshop. OPITZ CONSULTING GmbH 2009 Seite 1

PostgreSQL replizieren Jetzt erst Recht!

MySQL Beispiele aus der Praxis. Wie setzen Kunden MySQL ein?

Inhaltsverzeichnis. a. Standorte PostgreSQL...6. b. Impressum A. PostgreSQL...6. i. Einrichtung und Administration...

NoSQL mit PostgreSQL Swiss Postgres Conference Juni Hannu Krosing Harald Armin Massa

Erfahrungsbericht, Konsolidierung und Administration Real Application Cluster

Die InnoDB Storage Engine. Handy aus?

Datenbankbasierte Lösungen

ifadm Vortrag IUG 2015

MySQL Replikation, Scale-Out, Master- Master Replikation, Backup

Skalierbare Webanwendungen

M5000 einfach ablösen durch T4/T5 LDoms und Solaris Zonen

Vertrieb datentechnischer Geräte

Automatisierung, Virtualisierung & Management Es muss nicht immer VMware sein

Backup und PiTR mit MySQL

Asynchrone Replikation Projekt oder Produkt. Lukas Grützmacher (AIS Automation Dresden GmbH)

Minimal Downtime Oracle 11g Upgrade. DOAG Konferenz 2010 Martin Decker

Datenbankspiegelung mit (Active) Data Guard. und Abgrenzung

Oracle Streams Doag Vortrag Claus Cullmann

MySQL Replikation Neue Features in 5.5 und 5.6


PLATO-Systemanforderungen

Wie profitiert SAP MaxDB von SSD Technologie?

IBM Rechenzentrum Boeblingen. Hardware Entwicklung

HANA Solution Manager als Einstieg

Oracle 10g Einführung

Oracle Snap Management Utility Snap mir eine. Marco Schwab, DOAG 2017,

Oracle HA-Technologien im Überlick

Veeam Software. Backup & Replication. Thomas Dätwyler Veeam System Engineer

Oracle Real Application Cluster

Replikation mit PostgreSQL 9.0

Partitionieren über Rechnergrenzen hinweg

Galera Cluster - Lessons learned Linux höchstpersönlich.

Making Innodb a HA SE: Galera

DOAG Konferenz 2007 in Nürnberg

Active Data Guard. Susanne Jahr. Dezember 2008

SQL Azure Technischer Überblick. Steffen Krause Technical Evangelist Microsoft Deutschland GmbH

Oracle 12c: Migrationswege und Konzepte. Dierk Lenz

Erstes 11gR2 Patchset: Änderungen und Neuigkeiten. Dierk Lenz 9. Juni 2011 DOAG Regio Rhein-Neckar

Preise und Leistungen Dynamic Computing Services

Empfohlene Serverkonfigurationen

MySQL Cluster mit Galera

Upgrade-Leitfaden. Apparo Fast Edit. Wechsel von Version 2 auf Version 3 1 / 10

WAN-Optimierung SAN über WAN mit Riverbed Granite

Oracle Backup und Recovery

Speicherklassen außerhalb des Arrays. Dr. Carsten Haak ESD Practice Manager EMEA EMC Corp.

Benchmarking und Performancetesting von und mit PostgreSQL

<Insert Picture Here> RAC Architektur und Installation

SQL on RAC Pirates of the interconnect

HPE Hyper Converged Systems. Eine Komplettlösung für Virtualisierung, VDI und Cloud-optimierte Workloads

Einführung in Hauptspeicherdatenbanken

HA Storage Cluster Lösung

Entspannter Restore ohne kompliziertes Backup

Use Cases für Change Data Streams Change Data Streams erstellen Change Data Capture mit Kafka (Connect) Demo. #Debezium

IBM DB2 UNIX/Linux/Windows Backup und Hochverfügbarkeit mit HADR

PeakTech Zeitprogramm erstellen über Excel - Beispiel / Timed programs with Excel Example

Neues Lizenzmodell Perpetual Licensing Microsoft Dynamics NAV 2013

Übersicht SAP-BI. DOAG Regionaltreffen

DOAG - Mannheim Dienstag, 9. November Portierung einer komplexen Oracle Express Lösung auf die 9iR2 OLAP Option

TU München, Fakultät für Informatik Lehrstuhl III: Datenbanksysteme Prof. Alfons Kemper, Ph.D.

Transkript:

Daten auf mehreren Systemen Swiss Postgres Conference Juni 2016 Harald Armin Massa

Alle Daten in einer Datenbank, auf einem Computer Eine Quelle der Wahrheit Viele Werkzeuge für Korrektheit Alle Daten können integrierend genutzt und abgefragt werden Geringstmögliche Komplexität

Warum überhaupt mehr als eine Datenbank, und gar auf mehr als einem Computer?

Eigene Erfahrungshistorie CIO bei Vertriebsgesellschaft Steuerung Entwicklung von CRM / Verwaltungssystem Weiterentwicklung Migration FoxPro PostgreSQL + PHP Eigene Firmen seit 1999, diverse Tools rund um Datenbanken großer Wurf Browserbasierte Checklisten-Software Seit 2010 Partner bei 2ndQuadrant

Ziel Überblick der Gründe, warum Daten auf mehr als einer Maschine sein sollen / müssen Überblick einiger Techniken dazu Einsatzbereiche Kontraindikationen Nebenwirkungen Anregungen, die richtigen Fragen zu stellen

Methodik Lehrgeschichte: Handtuchvertrieb Europa (HVE), gegründet in Hamburg (Deutschland) HVVW 1.0 (Handtuchvertriebverwaltung)

Stufe 1 HVVW 1.0 Mehrplatzanwendung Zentrale Datenbank Alles flutscht Angebote, Lieferscheine, Rechnungen Betriebswirtschaftliche Auswertungen

WUMMS.

Server kaputt. Wunsch: Betrieb soll auch in solchen Fällen weitergehen

Schlechte Idee 1 Festplatte, 2 Computer Storage switch over weniger Hardwareaufwand Single point of failure Bei Datenbank PostgreSQL: Mehr eine Frage wann, nicht ob Datenbank kaputt geht

Low level Daten Duplikation Betriebssystem Virtualisierungsebene Storage Oft proprietär (virtualisierung, Storage) Sehr spezieller Skillset

Database Level Duplication Replikation Trigger based WAL shipping Replication PITR / Disaster Recovery Streaming Replication Sync Async

Trigger basierend

Trigger basierend Data werden 4x geschrieben WAL, Datafile, QueueTable, WAL(QT) Schemaänderungen = Schmerzen Kosten der Trigger Kosten des Parsens Zwischen unterschiedlichen Versionen von PostgreSQL möglich (Sogar Other PostgreSQL ist möglich) Replikation einzelner Tabellen möglich

WAL basierte Replikation 1340 in Genua erfunden WALrecords table files

WAL basierte Duplikation Gesamter Cluster Schemaänderungen schmerzfrei wenig Last auf Master Kein Parsingoverhead Slave ist Read Only Sichern des WAL erlaubt PITR und DR

Datenbankbasierte Duplikation Wartungen und Upgrades Ausfallsicherheit Backup Maschine vorhanden Erhöhte Komplexität gegenüber SingleServer More stuff to break

Regen + Hitze Mehr Handtücher werden gekauft HVVW 2.0 Jetzt noch mehr Reportmöglichkeiten mehr Datenbanklast

Technik 1 Readonly Server für Reports Per Trigger Per Streaming Replication Trigger Decoupling Kodier, dekodier, Schreiblast Streaming Replication dichter gekoppelt: vacuum

Technik 2 ETL nach Analyse-Datenbank ETL nach Analyse-Tool (Excel, Qlikview ) Andere Schema möglich Preprocessing Aktualität? Belastung bei Extrakt Full Table Read gegen Cache

Analyse-Datenbank Why not PostgreSQL? 200 Milliarden Records summieren = 200 Milliarden Records lesen parallele Aggregate als Addons verfügbar Parallel Read in Arbeit Beides bestensfalls multiple Prozessoren Immer nur 1 Storage

Analyse DB Viele Bytes lesen evtl. mehr als ein Storage Achtung, aktuelle Geschwindigkeiten Viele PCIe-SSDs: 2,5 GBytes / sec lesen (06-2016) Einzelne 5GBytes / sec lesen 1000 / TB Größenordnung

Analyse DB you really need more PostgresXL Basiert auf PostgreSQL, folgt PostgreSQL eng Selbes SQL Vielen Computer erarbeiten Teilergebnisse Koordinator führt Ergebnisse zusammen

Gut: Nutzen und Nebenwirkungen Bandbreite vieler Storages Rechenleistung vieler Prozessoren Cache-Wirkung vieler Hauptsspeicher Preis Logik des Verteilens & Zusammenführens Rechenzeit des Zusammenführens Netzwerkbandbreite + Latenz

Wir müssen ins Internet Handelspartner fordern Online-Information Kunden wollen Auftragsstand sehen Bestellungen werden zunächst per mail und anruf gemacht

Daten ins Internet Betrieb darf nicht beeinträchtigt werden Level 0: Transfer per Extrakt + LOAD copy from to file, copy from file to server im Web Komplette Entkopplung Minimale technische Anforderungen Dateikopieren Belastung bei Extrakt Aktualität

Per Streaming-Replikation Transaktionsaktuell Kleinstmögliche Belastung operatives System Webserver Read only One Way Ganzer Cluster im Internet Kein Schmerz mit Schema Gleiche Systemumgebung erforderlich (Linux/linux)

Transfer per Trigger-Replikation Slony / Londiste Teile der Datenbank möglich Schemaänderungen machen Schmerzen Spürbare Belastung Master-System Kodierung Schreiblast

Next Generation Replikation = pg_logical WAL-Stream erweitert um einige Informationen wal_level = logical Unterhalb von Logical in WAL files binäre Änderungen in Datei 1804 schreibe an Position xfab708e2 die Bytes AE BF 78 09 Logical decoding macht aus angereichertem WAL- Stream update / insert artige Befehle KEIN Query reengeneering!! Kein Reparsing erforderlich

it s logical, Captain Unterschiedliche PG Versionen möglich, solange >= 9.4 Theorethisch unterschiedliche OS möglich Teile von Datenbanken möglich Geringe Mehrbelastung des Masternodes Schemaänderungen herausfordernd

it s not Query Duplication Volatile Funktionen werden eingefroren auf ihr Ergebnis Insert into wuerfel (augenzahl) values (random()) UPDATE HANDTUECHER SET PRICE=PRICE *1.05 numrec(handtuecher) changesets Breite des Changesets = rowwidth(handtuecher)

Vertriebsbüro auf Mallorca HVVW 3.0 MM-Edition Lokales Lager Betreut Hotels auf der Insel Primär mit Handtüchern aus Vor-Ort-Lager Konsolidierte Umsatzreports gesucht Artikelstammdatenpflege, Marketing Funktionen der Zentrale

Technik: PostgreSQL BDR BDR verfügbar als spoon zu 9.4 Produktiver, 2ndQuadrant supporteter Einsatz Multi Master Replikation Rahmenbedigungen passen: HH betreut Kunden in D, Mallorca Kunde auf Mallorca. Kaum Schreibüberschneidungen

Mehr über BDR Basiert auf logical decoding (PostgreSQL 9.4) Extrahiert wie pg_logical logische Changesets aus dem WAL Erweitert um Handling von Konflikten Erweitert um Globale Sequencen

No free lunch HVVW 3.0, MM Edition muss umfangreich angepasst werden your holding it wrong - es gibt einige Aktivitäten, die in einer MultiMaster Umgebung schädlich sind Hier nur wenige Gedankenanregungen

Gedankenanregungen Eingrenzungen von Massenänderungen siehe pg_logical reserviere 10 Handtücher in HH, halte reserviert, reserviere 5 Handtücher in M, rolle back oder commit 2 Updates können den gleichen PK betreffen, 2 Inserts sollten dies nicht tun. Updates eher konfliktwahrscheinlich Platz nehmen an frischem Gedeck gebrauchten Gedeck