BIG SQL FOR HORTONWORKS (MOGELPACKUNG ODER GENIALER SCHACHZUG?)
|
|
- Hilke Linden
- vor 6 Jahren
- Abrufe
Transkript
1 THOMAS KALB BIG SQL FOR HORTONWORKS (MOGELPACKUNG ODER GENIALER SCHACHZUG?) Big SQL for Hortonworks (Mogelpackung oder genialer Schachzug) Copyright 2017 ITGAIN GmbH 1
2 AGENDA ITGAIN Big SQL Aktionen PoC Cobol meets Hadoop Beta Test Big SQL 4.0 for HDP Sandbox Test Big SQL 5.0 Was ist Big SQL? MPP vs. SMP Architektur DB2 DPF vs. Hadoop (HDFS) Installation, Administration und Monitoring Arbeiten mit BigS QL: Bekanntes und Unbekanntes Performancevergleich DB2 DPF Big SQL HDFS Hadoop Daten mit Big SQL abfragen Big SQL und Hive Einsatz von Big SQL Fragen & Diskussionen Big SQL for Hortonworks (Mogelpackung oder genialer Schachzug) Copyright 2017 ITGAIN GmbH 2
3 BIG SQL IM LAUFE DER ZEIT Big SQL 2.0 Big SQL 3.0 Big SQL for HDP 4.2 Big SQL 4.3 Big SQL / / /2017 Big SQL for Hortonworks (Mogelpackung oder genialer Schachzug) Copyright 2017 ITGAIN GmbH 3
4 BIG SQL AKTIONEN 2014 PoC - Cobol meets Hadoop 2016 Beta Test für Big SQL 4.2 for HDP 2017 Sandbox Test Big SQL 5.0 Copyright 2017 ITGAIN GmbH 4
5 THOMAS KALB DB2/z meets Hadoop Copyright 2017 ITGAIN GmbH 5
6 BIG SQL 3.0 THE ITGAIN CHALLENGE (Cobol with static SQL) Copyright 2017 ITGAIN GmbH 6
7 BIG SQL 3.0 THE ITGAIN CHALLENGE z/os 1.7 (hercules) SLES11 SP 1 DB2 LUW DB2 CONNECT HADOOP (IBM BigInsight) BIGSQL 3.0 SLES11 SP2 Windows 8.1 DB2 V Copyright 2017 ITGAIN GmbH 7
8 BIG SQL 3.0 USING ECLIPSE Copyright 2017 ITGAIN GmbH 8
9 BIG SQL 3.0 VIA DB2 LUW Copyright 2017 ITGAIN GmbH 9
10 DB2 LUW CONNECT VIA FEDERATION Copyright 2017 ITGAIN GmbH 10
11 DB2/Z CONNECT VIA COMMUNICATION DATABASE Copyright 2017 ITGAIN GmbH 11
12 BIG SQL 3.0 THE ITGAIN CHALLENGE CDB DB2 Connect Federation Copyright 2017 ITGAIN GmbH 12
13 BIG SQL 3.0 THE ITGAIN CHALLENGE Copyright 2017 ITGAIN GmbH 13
14 BIG SQL 3.0 THE ITGAIN CHALLENGE Copyright 2017 ITGAIN GmbH 14
15 BIG SQL 3.0 THE ITGAIN CHALLENGE Copyright 2017 ITGAIN GmbH 15
16 AGENDA ITGAIN Big SQL Aktionen (Warmup) PoC Cobol meets Hadoop Beta Test Big SQL 4.2 for HDP Sandbox Test Big SQL 5.0 Was ist Big SQL MPP vs. SMP Architektur DB2 DPF vs. Hadoop (HDFS) Installation, Administration und Monitoring Arbeiten mit Big SQL: Bekanntes und Unbekanntes Performancevergleich DPF Big SQL Hadoop Daten mit BigSQL abfragen Big SQL und Hive Einsatz von BigS QL Fragen & Diskussionen Copyright 2017 ITGAIN GmbH 16
17 BIG SQL UND HORTONWOKS August 2016: Einladung der IBM Analytics Group (San Francisco) als einziger deutscher Beta-Tester für BIG SQL on Hortonworks Bisher nur für IBM Open Platform (IOP) verfügbar September 2016: Release der Beta-Version Installation und Test eines 2 Knoten Clusters Offizielle Ankündigung von BigSQL v.4.2 Ende September Dezember 2016: Vortrag auf der GSE DB2 Tagung Februar 2017 Vortrag auf der GSE Big Data & Analytics Tagung Copyright 2017 ITGAIN GmbH 17
18 HADOOP DISTRIBUTIONEN? Marktanteile weltweit: Cloudera / Hortonworks / MapR / IOP Copyright 2017 ITGAIN GmbH 18
19 WARUM SQL ZUGRIFF AUF HADOOP? Für Hadoop benötigt man Java-Programmierer mit Kenntnissen in MapReduce, Spark, Pig, etc. Analysten können ohne Hilfe von Entwicklern unstrukturierte Hadoop-Daten kaum abfragen SQL-ähnliche Abfragen mit HiveQL basieren auf MapReduce und sind relativ langsam und halten sich nicht an den ANSI-SQL Standard SQL macht Hadoop einem breiteren Publikum zugänglich Copyright 2017 ITGAIN GmbH 19
20 HADOOP SQL ENGINES Copyright 2017 ITGAIN GmbH 20
21 AGENDA ITGAIN Big SQL Aktionen (Warmup) PoC Cobol meets Hadoop Beta Test Big SQL 4.2 for HDP Sandbox Test Big SQL 5.0 Was ist Big SQL? MPP vs. SMP Architektur DB2 DPF vs. Hadoop (HDFS) Installation, Administration und Monitoring Arbeiten mit Big SQL: Bekanntes und Unbekanntes Performancevergleich DB2 DPF Big SQL HDFS Hadoop Daten mit Big SQL abfragen Big SQL und Hive Einsatz von Big SQL Fragen & Diskussionen Copyright 2017 ITGAIN GmbH 21
22 WAS IST BIG SQL? Big SQL builds on a APACHE HIVE FOUNDATION Copyright 2017 ITGAIN GmbH 22
23 WAS IST HIVE? Open Source SQL für Hadoop Hive Komponenten: SQL Execution Engine Hive Metastore Hive Storage Model Quelle: Big SQL: Powerful SQL Optimization - Re-Imagined for open source 2017 IBM Corporation Copyright 2017 ITGAIN GmbH 23
24 BIG SQL UND HIVE Big SQL Tabellen sind Hive Tabellen Big SQL und Hive nutzen die gleichen Tabellen Gemeinsame Daten Gemeinsame Metainformationen Quelle: Big SQL: Powerful SQL Optimization - Re-Imagined for open source 2017 IBM Corporation Big SQL for Hortonworks (Mogelpackung oder genialer Schachzug) Copyright 2017 ITGAIN GmbH 24
25 BIG SQL UND DIE ANDEREN Quelle: Big SQL: Powerful SQL Optimization - Re-Imagined for open source 2017 IBM Corporation Copyright 2017 ITGAIN GmbH 25
26 BIG SQL 4.2 IBM MPP-engine (C++) löst MapReduce-Layer (Java) ab Big SQL ist eine MPP (Massively Parallel Processing) SQL-engine HBASE ist eine verteilte spaltenorientierte Key- Value Datenbank HDFS ist ein hochverfügbares Dateisystem zur Speicherung sehr großer Datenmengen verteilt auf mehreren Knoten Quelle: Big SQL: A Technical Introduction 2016 IBM Corporation Copyright 2017 ITGAIN GmbH 26
27 BIG SQL Federation und Integration Quelle: IBM-Big-SQL-Datasheet_final.pdf Copyright 2017 ITGAIN GmbH 27
28 BIG SQL WHAT S NEW Migrationsunterstützung von IOP(IBM Open Platform) nach HDP (Hortonwork Data Platform) Big SQL Interpreter für Zeppelin (Unterstützung von Tabellen auf Basis von S3 Storage) (Big SQL auch für CentOS) Verbesserte Spark Integration Performanceverbesserungen Erweiterte Hochverfügbarkeit (BLU Acceleration für Big SQL).. Copyright 2017 ITGAIN GmbH 28
29 BIG SQL INNERHALB VON IBM DB2 WAREHOUSE ON CLOUD Copyright 2017 ITGAIN GmbH 29
30 Copyright 2017 ITGAIN GmbH 30
31 DOCKER SANDBOX DOWNLOAD Copyright 2017 ITGAIN GmbH 31
32 DOCKER SANDBOX INSTALLATION Copyright 2017 ITGAIN GmbH 32
33 DOCKER SANDBOX START Copyright 2017 ITGAIN GmbH 33
34 DOCKER SANDBOX HADOOP VERWALTUNG MIT AMBARI Copyright 2017 ITGAIN GmbH 34
35 DOCKER SANDBOX BIGSQL KONFIGURATION DB2 Client Konfiguration Copyright 2017 ITGAIN GmbH 35
36 DOCKER SANDBOX BIGSQL KONFIGURATION SSH Konfiguration.. Copyright 2017 ITGAIN GmbH 36
37 BIG SQL STOPPEN UND STARTEN Copyright 2017 ITGAIN GmbH 37
38 BIG SQL SAMPLE Definition und Befüllung einer Hadoop Tabelle Copyright 2017 ITGAIN GmbH 38
39 BIG SQL UND HDFS Copyright 2017 ITGAIN GmbH 39
40 BIG SQL UND HIVE Copyright 2017 ITGAIN GmbH 40
41 BIG SQL TABELLEN IN HIVE Big SQL Hive Copyright 2017 ITGAIN GmbH 41
42 HBASE BIG SQL TABELLEN Copyright 2017 ITGAIN GmbH 42
43 Copyright 2017 ITGAIN GmbH 43
44 AGENDA ITGAIN Big SQL Aktionen (Warmup) PoC Cobol meets Hadoop Beta Test Big SQL 4.2 for HDP Sandbox Test Big SQL 5.0 Was ist Big SQL? MPP vs. SMP Architektur DB2 DPF vs. Hadoop (HDFS) Installation, Administration und Monitoring Arbeiten mit BigSQL: Bekanntes und Unbekanntes Performancevergleich DB2 DPF Big SQL HDFS Hadoop Daten mit BigSQL abfragen Big SQL und Hive Einsatz von BigSQL Fragen & Diskussionen Copyright 2017 ITGAIN GmbH 44
45 MPP VS. SMP ARCHITEKTUR Symmetric Multi Processing: Dynamische Verteilung laufender Prozesse auf alle verfügbaren Prozessoren, die sich Systemressourcen teilen (=Multiprozessorsystem) Copyright 2017 ITGAIN GmbH 45
46 MPP VS. SMP ARCHITEKTUR Massive Parallel Processing: Verteilung einer Aufgabe auf mehrere voneinander unabhängige Knoten mit eigenem Prozessor, Hauptspeicher und I/O-Subsystem (= Shared Nothing Architektur) Copyright 2017 ITGAIN GmbH 46
47 AGENDA ITGAIN Big SQL Aktionen (Warmup) PoC Cobol meets Hadoop Beta Test Big SQL 4.2 for HDP Sandbox Test Big SQL 5.0 Was ist Big SQL MPP vs. SMP Architektur Db2 DPF vs. Hadoop (HDFS) Installation, Administration und Monitoring Arbeiten mit Big SQL: Bekanntes und Unbekanntes Performancevergleich DB2 DPF Big SQL HDFS Hadoop Daten mit Big SQL abfragen# Big SQL und Hive Einsatz von Big SQL Fragen & Diskussionen Copyright 2017 ITGAIN GmbH 47
48 DB2 DPF DPF Koordinator (1): kommuniziert mit dem Client und weiß auf welcher Partition die angeforderten Daten liegen DB2 Partition (2): führt die Abfrage aus Jede Datenbank-Partition hat ihre eigenen Disks Weitere Partitionen können jederzeit hinzugefügt werden Partitionen kommunizieren nicht untereinander Quelle: Big SQL: Similarities and differences from DB2 LUW 2016 IBM Corporation Copyright 2017 ITGAIN GmbH 48
49 HADOOP HDFS NameNode (1): Verwaltet das Metadaten- Repository(a) (welcher Block gehört zu welcher Datei) kommuniziert mit dem Client und koordiniert den Zugriff auf die Daten DataNode(2): Speichert die Daten in HDFS-Blöcken und kennt die Lokation dieser Blöcke (a) HDFS-Blöcke werden zwischen den Knoten repliziert (b) Quelle: Big SQL: Similarities and differences from DB2 LUW 2016 IBM Corporation Copyright 2017 ITGAIN GmbH 49
50 DB2 DPF VS. BIG SQL CLUSTER TYPOLOGIE (HDFS) DPF: Jede Daten- Partition hat ihr eigenes Set an Disks HADOOP: Jede Daten- Partition kann auf alle HDFS-Daten zugreifen Quelle: Big SQL: Similarities and differences from DB2 LUW 2016 IBM Corporation Copyright 2017 ITGAIN GmbH 50
51 VON DB2 DPF ZU BIG SQL (1) HDFS: Physischen Disks werden durch HDFS ersetzt (DB2 kontrolliert nicht mehr wo die Daten liegen) (2) Temp Data bleibt bestehen (3) SQL Scheduler: Erhält Anfragen für Tabellenzugriff vom DPF Koordinator Interagiert mit dem Hive-Metastore und ermittelt die File-Lokation für Tabellen im HDFS Interagiert mit dem Namenode um die HDFS- Blöcke auf den Datanodes zu ermitteln (4) BigSQL I/O-Engines: Native C++ Reader und Java Reader: Big SQL entscheidet anhand des Dateiformats welcher Reader verwendet wird Big SQL Scheduler erteilt Aufrträge an die I/O Engines Quelle: Big SQL: Similarities and differences from DB2 LUW 2016 IBM Corporation Mogelpackung oder genialer Schachzug? Copyright 2017 ITGAIN GmbH 51
52 BIG SQL ARCHITEKTUR Big SQL Master hört auf JDBC/ODBC Verbindungen kompiliert die Abfrage und koordiniert dies Ausführung auf den Workern Worker führen die Abfrage auf dem Knoten aus, auf dem die Daten liegen (Data Locality) Datenaustausch zwischen den Knoten soweit notwendig Quelle: Big SQL: A Technical Introduction 2016 IBM Corporation Copyright 2017 ITGAIN GmbH 52
53 BIG SQL ERWEITERTE ARCHITEKTUR (HYBRID ENGINE) BigSQL for Hortonworks (Mogelpackung oder genialer Schachzug Copyright 2017 ITGAIN GmbH 53
54 AGENDA ITGAIN Big SQL Aktionen (Warmup) PoC Cobol meets Hadoop Beta Test Big SQL 4.0 for HDP Sandbox Test Big SQL 5.0 Was ist Big SQL MPP vs. SMP Architektur DB2 DPF vs. Hadoop (HDFS) Installation, Administration und Monitoring Arbeiten mit Big SQL: Bekanntes und Unbekanntes Performancevergleich DPF Big SQL Hadoop Daten mit Big SQL abfragen Big SQL und Hive Einsatz von Big SQL Fragen & Diskussionen Copyright 2017 ITGAIN GmbH 54
55 ITGAIN TESTUMGEBUNG Initiale Installation von 2 Knoten-Cluster Hardware 2 virtuelle Server mit 8 Cores / 10 GB RAM / SSDs Software Linux RedHat 7.2 / Cent OS 7.2 Ambari Hortonworks Data Platform (HDP) BETA: Big SQL 4.2 for Hortonworks Data Platform Erweiterung um drei weitere Knoten 1x NameNode / MasterNode 4x DataNodes / WorkerNodes Copyright 2017 ITGAIN GmbH 55
56 INSTALLATION Copyright 2017 ITGAIN GmbH 56
57 HADOOP-ADMINISTRATION UND MONITORING: AMBARI Copyright 2017 ITGAIN GmbH 57
58 BIG SQL INSTALLATION Copyright 2017 ITGAIN GmbH 58
59 BIG SQL MONITORING Copyright 2017 ITGAIN GmbH 59
60 BIG SQL MONITORING Copyright 2017 ITGAIN GmbH 60
61 SPEEDGAIN FOR BIG SQL Copyright 2017 ITGAIN GmbH 61
62 AGENDA ITGAIN Big SQL Aktionen (Warmup) PoC Cobol meets Hadoop Beta Test Big SQL 4.2 for HDP Sandbox Test Big SQL 5.0 Was ist Big SQL? MPP vs. SMP Architektur DB2 DPF vs. Hadoop (HDFS) Installation, Administration und Monitoring Arbeiten mit BigSQL: Bekanntes und Unbekanntes Performancevergleich DB2 DPF Big SQL HDFS Hadoop Daten mit Big SQL abfragen Big SQL und Hive Einsatz von Big SQL Fragen & Diskussionen Copyright 2017 ITGAIN GmbH 62
63 ARBEITEN MIT BIGSQL: BEKANNTES UND UNBEKANNTES DB2 Schnittstelle Copyright 2017 ITGAIN GmbH 63
64 ARBEITEN MIT BIGSQL: BEKANNTES UND UNBEKANNTES Wo findet man die Tabelle in HDFS? /apps/hive/warehouse/bigsql.db/firsttable Copyright 2017 ITGAIN GmbH 64
65 ARBEITEN MIT BIGSQL: BEKANNTES UND UNBEKANNTES Oder über Kommandozeile (HDFS Browse): Copyright 2017 ITGAIN GmbH 65
66 ARBEITEN MIT BIGSQL: BEKANNTES UND UNBEKANNTES Es funktioniert aber noch nicht alles über die DB2-Kommandozeile: Laden von Daten in Hadoop-Tabelle Copyright 2017 ITGAIN GmbH 66
67 ARBEITEN MIT BIGSQL: BEKANNTES UND UNBEKANNTES Es gibt auch eine Kommandozeile für BigSQL: JSqsh (Java SQL Shell) - ausgesprochen "jay-skwish Copyright 2017 ITGAIN GmbH 67
68 ARBEITEN MIT BIGSQL: BEKANNTES UND UNBEKANNTES Tabelle laden Copyright 2017 ITGAIN GmbH 68
69 AGENDA ITGAIN Big SQL Aktionen (Warmup) PoC Cobol meets Hadoop Beta Test Big SQL 4.2 for HDP Sandbox Test Big SQL 5.0 Was ist Big SQL MPP vs. SMP Architektur DB2 DPF vs. Hadoop (HDFS) Installation, Administration und Monitoring Arbeiten mit Big SQL: Bekanntes und Unbekanntes Performancevergleich DB2 DPF Big SQL HDFS Hadoop Daten mit Big SQL abfragen Big SQL und Hive Einsatz von Big SQL Fragen & Diskussionen Copyright 2017 ITGAIN GmbH 69
70 PERFORMANCEVERGLEICH DB2 DPF VS. DB2 HDFS Laden von 10 Mio. Datensätzen Copyright 2017 ITGAIN GmbH 70
71 PERFORMANCE UNTERSCHIEDE DB2 DPF VERSUS DB2 HDFS Random I/O Benchmark (Lesen von 1023 Sätzen) DB2 DPF Cold: DB2 HDFS Cold: Warm: Warm: BIGSQL homerun or merely a major bluff? Copyright 2017 ITGAIN GmbH 71
72 PERFORMANCEVERGLEICH DB2 DPF VS. DB2 HDFS Read Ahead I/O Benchmark (Lesen von 10 Mio. Sätzen) Copyright 2017 ITGAIN GmbH 72
73 AGENDA ITGAIN Big SQL Aktionen (Warmup) PoC Cobol meets Hadoop Beta Test Big SQL 4.2 for HDP Sandbox Test Big SQL 5.0 Was ist Big SQL? MPP vs. SMP Architektur DB2 DPF vs. Hadoop (HDFS) Installation, Administration und Monitoring Arbeiten mit Big SQL: Bekanntes und Unbekanntes Performancevergleich DB2 DPF Big SQL HDFS Hadoop Daten mit Big SQL abfragen Big SQL und Hive Einsatz von Big SQL Fragen & Diskussionen Copyright 2017 ITGAIN GmbH 73
74 HADOOP DATEN MIT BIG SQL ABFRAGEN Arbeiten mit strukturierten Daten SQL Arbeiten mit Datentypen für komplexe Daten (halbstrukturiert) ARRAY: Sammlung von Daten des gleichen Typs MAP: Sammlung von Key/Value Paaren STRUCT: Sammlung von Daten verschiedenen Typs Arbeiten mit unstrukturierten Daten ist über Serializer and Deserializer (SerDe) möglich Das SerDe-Interface instruiert Hive wie es Datensätze verarbeitet soll Es gibt zahlreiche Built-In SerDes z.b für JSON, Avro, Parquet, Regular Expressions, usw. Zahlreiche SerDes sind als PublicDomain verfügbar Kundenspezifische SerDes können nach Bedarf in Java entwickelt werden Copyright 2017 ITGAIN GmbH 74
75 DATEN ABFRAGEN SQL Copyright 2017 ITGAIN GmbH 75
76 SQL ANSI-STANDARD Vergleich: BigSQL Hive Impala TPC-DS Standard Analytic Query Benchmark: typische Abfragen von Business Analytic tools Copyright 2017 ITGAIN GmbH 76
77 DATEN ABFRAGEN ARBEITEN MIT ARRAY-DATENTYPEN Sammlung von Daten des gleichen Typs Copyright 2017 ITGAIN GmbH 77
78 DATEN ABFRAGEN ARBEITEN MIT MAP-TYPEN Sammlung von Key/Value Paaren Copyright 2017 ITGAIN GmbH 78
79 DATEN ABFRAGEN ARBEITEN MIT STRUCTS Sammlung von Daten verschiedenen Typs Copyright 2017 ITGAIN GmbH 79
80 DATEN ABFRAGEN UNSTRUKTURIERTE DATEN Beispiel: Parsen von Logfiles mit RegularExpression (RegexSerDe) Copyright 2017 ITGAIN GmbH 80
81 DATEN ABFRAGEN UNSTRUKTURIERTE DATEN select * from apache_log fetch first 5 rows only; Neue Logfiles werden nicht sofort eingelesen, sondern erst nach Ausführung SP (Cache leeren): CALL SYSHADOOP.HCAT_CACHE_SYNC bigsql, apache_log ); Copyright 2017 ITGAIN GmbH 81
82 AGENDA ITGAIN Big SQL Aktionen (Warmup) PoC Cobol meets Hadoop Beta Test Big SQL 4.0 for HDP Sandbox Test Big SQL 5.0 Was ist Big SQL? MPP vs. SMP Architektur DB2 DPF vs. Hadoop (HDFS) Installation, Administration und Monitoring Arbeiten mit Big SQL: Bekanntes und Unbekanntes Performancevergleich DB2 DPF Big SQL HDFS Hadoop Daten mit Big SQL abfragen Big SQL and Hive Einsatz von Big SQL Fragen & Diskussionen Copyright 2017 ITGAIN GmbH 82
83 HIVE UND BIG SQL GEMEINSAMKEITEN UND UNTERSCHIEDE Am Beispiel vom TPCDS Benchmark performance-benchmark-hive-tpc-ds-queries.html Copyright 2017 ITGAIN GmbH 83
84 TPCDS BENCHMARK DAS DATENMODELL Copyright 2017 ITGAIN GmbH 84
85 TPCDS HIVE BENCHMARK LADEN./tpcds-setup.sh 1000 tee tpcds-setup.log Copyright 2017 ITGAIN GmbH 85
86 TPCDS HIVE BENCHMARK TESTEN./runSuite.pl tpcds 10 tee runsuite.log time hive -i testbench.settings -f query13.sql 4 Std. 45 Min. Copyright 2017 ITGAIN GmbH 86
87 BIG SQL ARCHITEKTUR Copyright 2017 ITGAIN GmbH 87
88 BIG SQL HIVE TABELLEN WERDEN BIG SQL ZUR VERFÜGUNG GESTELLT SYSHADOOP.HACT_SYNC_OBJECTS Copyright 2017 ITGAIN GmbH 88
89 TPCDS BENCHMARK QUERY 13 Big SQL Hive 1 Std. 54 Min. 4 Std. 45 Min. Copyright 2017 ITGAIN GmbH 89
90 TPCDS BENCHMARK QUERY 13 Die Fakt-Tabelle ist eine HADOOP Tabelle Die Dimensions-Tabellen sind auch HADOOP Tabellen Copyright 2017 ITGAIN GmbH 90
91 TPCDS BENCHMARK QUERY 13 Die Fakt-Tabelle ist eine HADOOP Tabelle. Die Dimensions-Tabellen sind DB2 Tabellen Copyright 2017 ITGAIN GmbH 91
92 TPCDS BENCHMARK TABELLEN IMPLEMETIERUNG Hadoop DB2 Copyright 2017 ITGAIN GmbH 92
93 TPCDS BENCHMARK BIG SQL EXPLAIN Die Fakt-Tabelle ist eine HADOOP Tabelle. Die Dimensions-Tabellen sind DB2 Tabellen Copyright 2017 ITGAIN GmbH 93
94 TPCDS BENCHMARK HIVE EXPLAIN Copyright 2017 ITGAIN GmbH 94
95 AGENDA ITGAIN Big SQL Aktionen (Warmup) PoC Cobol meets Hadoop Beta Test Big SQL 4.0 for HDP Sandbox Test Big SQL 5.0 Was ist Big SQL MPP vs. SMP Architektur DB2 DPF vs. Hadoop (HDFS) Installation, Administration und Monitoring Arbeiten mit Big SQL: Bekanntes und Unbekanntes Performancevergleich DB2 DPF Big SQL HDFS Hadoop Daten mit Big SQL abfragen Big SQL und Hive Einsatz von Big SQL Fragen & Diskussionen Copyright 2017 ITGAIN GmbH 95
96 EINSATZ VON BIGSQL Big SQL Hadoop-Tabellen sind kein Ersatz für OLTP-DBMS Technologien Big SQL ermöglicht SQL-Abfragen auf bestehende Hadoop Daten (kein proprietäres Storage-Format) Alle Daten sind Hadoop-Dateien in HDFS Big SQL wurde entwickelt um die Hadoop-Infrastruktur wirksam und effizient einzusetzen SQL Kenntnisse sind in den meisten Unternehmen vorhanden! Kein UPDATE oder DELETE für Hadoop-Tabellen möglich Deutlich geringere Lizenzkosten als für DB2 DPF Sehr gute SQL Kompatibilität Copyright 2017 ITGAIN GmbH 96
97 EINSATZ VON BIGSQL Primäres Einsatzgebiet derzeit vor allem: um wenig frequentierte Daten aus dem Datawarehouse auf günstigere Hardware auszulagern und trotzdem über SQL direct darauf zugreifen zu können um unstrukturierte Daten (wie Logdateien, Sensordaten, Social Media Posts, etc.) zu filtern und zu analysieren und mit strukturierten Daten zu verknüpfen (z.b. über Federation) Copyright 2017 ITGAIN GmbH 97
98 Copyright 2017 ITGAIN GmbH 98
99 Q & A Copyright 2017 ITGAIN GmbH 99
Beratung. Results, no Excuses. Consulting. Lösungen. Grown from Experience. Ventum Consulting. SQL auf Hadoop Oliver Gehlert. 2014 Ventum Consulting
Beratung Results, no Excuses. Consulting Lösungen Grown from Experience. Ventum Consulting SQL auf Hadoop Oliver Gehlert 1 Ventum Consulting Daten und Fakten Results, no excuses Fachwissen Branchenkenntnis
MehrHans-Peter Zorn Inovex GmbH. Wer gewinnt das SQL-Rennen auf der Hadoop-Strecke?
Hans-Peter Zorn Inovex GmbH Wer gewinnt das SQL-Rennen auf der Hadoop-Strecke? War nicht BigData das gleiche NoSQL? Data Lake = Keine Struktur? flickr/matthewthecoolguy Oder gar ein Hadump? flickr/autohistorian
MehrSQL on Hadoop für praktikables BI auf Big Data.! Hans-Peter Zorn und Dr. Dominik Benz, Inovex Gmbh
SQL on Hadoop für praktikables BI auf Big Data! Hans-Peter Zorn und Dr. Dominik Benz, Inovex Gmbh War nicht BigData das gleiche NoSQL? 2 Wie viele SQL Lösungen für Hadoop gibt es mittlerweile? 3 ! No SQL!?
MehrBig-Data-Technologien - Überblick - Prof. Dr. Jens Albrecht
Big-Data-Technologien - Überblick - Quelle: http://www.ingenieur.de/panorama/fussball-wm-in-brasilien/elektronischer-fussball-smartphone-app-helfen-training Big-Data-Anwendungen im Unternehmen Logistik
MehrWEBINAR@LUNCHTIME THEMA: SAS TOOLS FÜR DIE DATENVERARBEITUNG IN HADOOP ODER WIE REITET MAN ELEFANTEN?" HANS-JOACHIM EDERT
WEBINAR@LUNCHTIME THEMA: SAS TOOLS FÜR DIE DATENVERARBEITUNG IN HADOOP ODER WIE REITET MAN ELEFANTEN?" Copyr i g ht 2012, SAS Ins titut e Inc. All rights res er ve d. HANS-JOACHIM EDERT EBINAR@LUNCHTIME
MehrOracle Data Warehouse Mit Big Data neue Horizonte für das Data Warehouse ermöglichen
DATA WAREHOUSE Oracle Data Warehouse Mit Big Data neue Horizonte für das Data Warehouse ermöglichen Alfred Schlaucher, Detlef Schroeder DATA WAREHOUSE Themen Big Data Buzz Word oder eine neue Dimension
MehrBig Data Informationen neu gelebt
Seminarunterlage Version: 1.01 Copyright Version 1.01 vom 21. Mai 2015 Dieses Dokument wird durch die veröffentlicht. Copyright. Alle Rechte vorbehalten. Alle Produkt- und Dienstleistungs-Bezeichnungen
MehrPeter Dikant mgm technology partners GmbH. Echtzeitsuche mit Hadoop und Solr
Peter Dikant mgm technology partners GmbH Echtzeitsuche mit Hadoop und Solr ECHTZEITSUCHE MIT HADOOP UND SOLR PETER DIKANT MGM TECHNOLOGY PARTNERS GMBH WHOAMI peter.dikant@mgm-tp.com Java Entwickler seit
MehrHadoop. Simon Prewo. Simon Prewo
Hadoop Simon Prewo Simon Prewo 1 Warum Hadoop? SQL: DB2, Oracle Hadoop? Innerhalb der letzten zwei Jahre hat sich die Datenmenge ca. verzehnfacht Die Klassiker wie DB2, Oracle usw. sind anders konzeptioniert
MehrEinführung in Hadoop
Einführung in Hadoop Inhalt / Lern-Ziele Übersicht: Basis-Architektur von Hadoop Einführung in HDFS Einführung in MapReduce Ausblick: Hadoop Ökosystem Optimierungen Versionen 10.02.2012 Prof. Dr. Christian
MehrBig Data. Prof. Robert Jäschke Forschungszentrum L3S Leibniz Universität Hannover
Big Data Prof. Robert Jäschke Forschungszentrum L3S Leibniz Universität Hannover Agenda Was ist Big Data? Parallele Programmierung Map/Reduce Der Big Data Zoo 2 3Vs oder: Was ist Big Data? Deutsche Telekom:
MehrHadoop aus IT-Operations Sicht Teil 1 Hadoop-Grundlagen
Hadoop aus IT-Operations Sicht Teil 1 Hadoop-Grundlagen Brownbag am Freitag, den 26.07.2013 Daniel Bäurer inovex GmbH Systems Engineer Wir nutzen Technologien, um unsere Kunden glücklich zu machen. Und
MehrHadoop. Eine Open-Source-Implementierung von MapReduce und BigTable. von Philipp Kemkes
Hadoop Eine Open-Source-Implementierung von MapReduce und BigTable von Philipp Kemkes Hadoop Framework für skalierbare, verteilt arbeitende Software Zur Verarbeitung großer Datenmengen (Terra- bis Petabyte)
MehrNoSQL-Datenbanken und Hadoop im Zusammenspiel mit dem Data Warehouse
NoSQL-Datenbanken und Hadoop im Zusammenspiel mit dem Data Warehouse Carsten Czarski Oracle Deutschland B.V. & Co KG Big Data Betrachten von Daten die bislang nicht betrachtet wurden
MehrFreiberuflicher IT-Berater Schwerpunkte: Unix, Oracle, Netzwerk. www.jj-it.de. www.jj-it.de. Dipl.-Inform. Joachim Jäckel
Freiberuflicher Schwerpunkte: Unix, Oracle, Netzwerk 2005 1 Testaufbauten von Oracle 10g RAC auf preiswerter Hardware 2 3 Typisches Cluster System Clients Public Network Node A Node B Cluster Interconnect
MehrBig Data Hype und Wirklichkeit Bringtmehrauchmehr?
Big Data Hype und Wirklichkeit Bringtmehrauchmehr? Günther Stürner, Vice President Sales Consulting 1 Copyright 2011, Oracle and/or its affiliates. All rights Überschrift 2 Copyright 2011, Oracle and/or
MehrBig Data in a Nutshell. Dr. Olaf Flebbe of ät oflebbe.de
Big Data in a Nutshell Dr. Olaf Flebbe of ät oflebbe.de Zu mir Bigdata Projekt, benutzt Apache Bigtop Linux seit Anfang vor Minix/ATARI Linuxtag 2001? Promoviert in Computational Physics in Tü Seit Jan
MehrEXASOL @ Symposium on Scalable Analytics. www.exasol.com. Skalierbare Analysen mit EXASolution
EXASOL @ Symposium on Scalable Analytics Skalierbare Analysen mit EXASolution EXASOL AG Wer sind wir R&D: + seit 2000 + laufend Forschungsprojekte Produkt: Analytische Datenbank EXASolution Focus auf Komplexität
Mehron Azure mit HDInsight & Script Ac2ons
Willkommen beim #GAB 2015! on Azure mit HDInsight & Script Ac2ons Lokale Sponsoren: HansPeter Grahsl Netconomy Entwickler & Berater FH CAMPUS 02 Twi9er: @hpgrahsl Überblick Inhalte Was ist HDInsight? Wozu
MehrHadoop Eine Erweiterung für die Oracle DB?
Hadoop Eine Erweiterung für die Oracle DB? Nürnberg, 18.11.2015, Matthias Fuchs Sensitive Über mich 10+ Jahre Erfahrung mit Oracle Oracle Certified Professional Exadata Certified Oracle Engineered Systems
MehrBig Data Mythen und Fakten
Big Data Mythen und Fakten Mario Meir-Huber Research Analyst, IDC Copyright IDC. Reproduction is forbidden unless authorized. All rights reserved. About me Research Analyst @ IDC Author verschiedener IT-Fachbücher
MehrSpark, Impala und Hadoop in der Kreditrisikoberechnung
Spark, Impala und Hadoop in der Kreditrisikoberechnung Big Data In-Memory-Technologien für mittelgroße Datenmengen TDWI München, 22. Juni 2015 Joschka Kupilas, Data Scientist, Adastra GmbH 2 Inhalt Vorwort
MehrBig Data in Azure. Ein Beispiel mit HD Insight. Ralf Stemmer
Big in Azure Ein Beispiel mit HD Insight Ralf Stemmer Agenda owas ist Big? Was ist HD Insight? owelche Probleme kann man damit lösen? odemo Was ist Big? Was ist HD Insight? Datenexplosion - Rasanter Zuwachs
MehrCloud-Computing. 1. Definition 2. Was bietet Cloud-Computing. 3. Technische Lösungen. 4. Kritik an der Cloud. 2.1 Industrie 2.
Cloud Computing Frank Hallas und Alexander Butiu Universität Erlangen Nürnberg, Lehrstuhl für Hardware/Software CoDesign Multicorearchitectures and Programming Seminar, Sommersemester 2013 1. Definition
MehrPerformance Tuning & Scale-Out mit MySQL
Performance Tuning & Scale-Out mit MySQL Erfa-Gruppe Internet Briefing 2. März 2010 Oli Sennhauser Senior MySQL Consultant, FromDual oli.sennhauser@fromdual.com www.fromdual.com 1 Inhalt Allgemeines zu
MehrStandardsoftware. SAP Basisarchitektur. Prof. Dr. Bernhard Schiefer 2-1
Standardsoftware SAP Basisarchitektur Prof. Dr. Bernhard Schiefer 2-1 SAP Client/Server Dreistufige Rechnerhierarchie Lesen in der DB und Aktualisierung der Puffer Datenbankänderung Zentrale DB (speichert
MehrIBM Informix Tuning und Monitoring
Seminarunterlage Version: 11.01 Copyright Version 11.01 vom 25. Juli 2012 Dieses Dokument wird durch die veröffentlicht. Copyright. Alle Rechte vorbehalten. Alle Produkt- und Dienstleistungs-Bezeichnungen
MehrBig Data Anwendungen Chancen und Risiken
Big Data Anwendungen Chancen und Risiken Dr. Kurt Stockinger Studienleiter Data Science, Dozent für Informatik Zürcher Hochschule für Angewandte Wissenschaften Big Data Workshop Squeezing more out of Data
MehrErfahrungsbericht: Umstieg von RDBMS auf Big Data-Technologien
Wir unternehmen IT. Erfahrungsbericht: Umstieg von RDBMS auf Big Data-Technologien Karlsruhe, 30.09.2015 $id thgreiner Thorsten Greiner Teamleiter Software Development ConSol* Software GmbH, Düsseldorf
Mehr!"#$"%&'()*$+()',!-+.'/',
Soziotechnische Informationssysteme 5. Facebook, Google+ u.ä. Inhalte Historisches Relevanz Relevante Technologien Anwendungsarchitekturen 4(5,12316,7'.'0,!.80/6,9*$:'0+$.;.,&0$'0, 3, Historisches Facebook
MehrApache Hadoop. Distribute your data and your application. Bernd Fondermann freier Software Architekt bernd.fondermann@brainlounge.de berndf@apache.
Apache Hadoop Distribute your data and your application Bernd Fondermann freier Software Architekt bernd.fondermann@brainlounge.de berndf@apache.org Apache The Apache Software Foundation Community und
MehrArchive / Backup System für OpenVMS
Archive / Backup System für OpenVMS DECUS Symposium 2002 Bonn Vortrag-Nr. 3C04 Günther Fröhlin Compaq Computer Corporation Colorado Springs, USA 1 Highlights V4.0 Auslieferung Januar 2002 Hauptversion
MehrETL in den Zeiten von Big Data
ETL in den Zeiten von Big Data Dr Oliver Adamczak, IBM Analytics 1 1 Review ETL im Datawarehouse 2 Aktuelle Herausforderungen 3 Future of ETL 4 Zusammenfassung 2 2015 IBM Corporation ETL im Datawarehouse
MehrS A P B W O N H A N A P R O O F O F C O N C E P T B E I S. O L I V E R
S A P B W O N H A N A P R O O F O F C O N C E P T B E I S. O L I V E R S T E F A N M A R K 07.07.2015 F O L I E 1 V O N 2 7 F I R M E N P O R T R A I T S. O L I V E R GESCHICHTE F O L I E 2 V O N 2 7 F
MehrBig Data Plattformen für polystrukturierte Daten neue Chancen und Herausforderungen
Big Data Plattformen für polystrukturierte Daten neue Chancen und Herausforderungen Oracle DWH-Konferenz 21. März 2012 Dr. Carsten Bange Gründer & Geschäftsführer BARC Big Data bietet Methoden und Technologien
MehrBusiness Mehrwerte von SAP HANA
Business Mehrwerte von SAP HANA von der Technologie zum Geschäft Halle, 07.05.2013 2013 GISA GmbH Leipziger Chaussee 191 a 06112 Halle (Saale) www.gisa.de Agenda GISA im Überblick Was ist SAP HANA? Was
MehrAnalytische Datenbanken und Appliances als Engine für erfolgreiche Business Intelligence
Analytische Datenbanken und Appliances als Engine für erfolgreiche Business Intelligence IBM Netezza Roadshow 30. November 2011 Carsten Bange Gründer & Geschäftsführer BARC Die Krise hat die Anforderungen
Mehr1 Copyright 2012, Oracle and/or its affiliates. All rights reserved. ileana.somesan@oracle.com
1 Copyright 2012, Oracle and/or its affiliates. All rights reserved. Oracle Datenbanken in der Oracle Public Cloud nutzen Ileana Someşan Systemberaterin ORACLE Deutschland The following is intended to
MehrSmartphone Entwicklung mit Android und Java
Smartphone Entwicklung mit Android und Java predic8 GmbH Moltkestr. 40 53173 Bonn Tel: (0228)5552576-0 www.predic8.de info@predic8.de Was ist Android Offene Plattform für mobile Geräte Software Kompletter
MehrHochverfügbarkeit mit Windows Server vnext. Carsten Rachfahl Microsoft Hyper-V MVP
Hochverfügbarkeit mit Windows Server vnext Carsten Rachfahl Microsoft Hyper-V MVP Carsten Rachfahl www.hyper-v-server.de Roling Cluster Upgrade Herausforderung: Update eines Failover Clusters ohne Downtime
MehrPortierung einer DB2/VM-Datenbank nach DB2 unter zlinux 4 Jahre später - Wie würde ich heute vorgehen?
Portierung einer DB2/VM-Datenbank nach DB2 unter zlinux 4 Jahre später - Wie würde ich heute vorgehen? Tipps aus der Praxis zur Anwendungsentwicklung, Migration und Performanceuntersuchung 1 Einleitung
MehrPVFS (Parallel Virtual File System)
Management grosser Datenmengen PVFS (Parallel Virtual File System) Thorsten Schütt thorsten.schuett@zib.de Management grosser Datenmengen p.1/?? Inhalt Einführung in verteilte Dateisysteme Architektur
MehrWISSENSWERTES ÜBER WINDOWS SCALE-OUT FILE SERVER
WISSENSWERTES ÜBER WINDOWS SCALE-OUT FILE SERVER AGENDA 01 File Server Lösungen mit Windows Server 2012 R2 02 Scale-out File Server 03 SMB 3.0 04 Neue File Server Features mit Windows Server 2016 05 Storage
MehrSymbiose hybrider Architekturen im Zeitalter digitaler Transformation. Hannover, 18.03.2015
Symbiose hybrider Architekturen im Zeitalter digitaler Transformation Hannover, 18.03.2015 Business Application Research Center (BARC) B (Analystengruppe Europas führendes IT-Analysten- und -Beratungshaus
MehrOracle BI&W Referenz Architektur Big Data und High Performance Analytics
DATA WAREHOUSE Oracle BI&W Referenz Architektur Big Data und High Performance Analytics Alfred Schlaucher, Oracle Scale up Unternehmensdaten zusammenfassen Noch mehr Informationen
MehrReview Freelancer-Workshop: Fit für Big Data. Mittwoch, 29.04.2015 in Hamburg
Review Freelancer-Workshop: Fit für Big Data Mittwoch, 29.04.2015 in Hamburg Am Mittwoch, den 29.04.2015, hatten wir von productive-data in Zusammenarbeit mit unserem langjährigen Partner Informatica zu
MehrDATA WAREHOUSE. Big Data Alfred Schlaucher, Oracle
DATA WAREHOUSE Big Data Alfred Schlaucher, Oracle Scale up Unternehmensdaten zusammenfassen Noch mehr Informationen aus Unternehmens- Daten ziehen! Datenmengen, Performance und Kosten Daten als Geschäftsmodell
MehrPlanung auf Aufbau von SharePoint-Suchinfrastrukturen
Building & Connecting Know-how 16.-17. Februar 2011, München Planung auf Aufbau von SharePoint-Suchinfrastrukturen Fabian Moritz SharePoint MVP Partner: Veranstalter: Aufbau von Suchplattformen Planung
MehrEchtzeiterkennung von Cyber-Angriffen auf IT-Infrastrukturen. Frank Irnich SAP Deutschland
Echtzeiterkennung von Cyber-Angriffen auf IT-Infrastrukturen Frank Irnich SAP Deutschland SAP ist ein globales Unternehmen... unser Fokusgebiet... IT Security für... 1 globales Netzwerk > 70 Länder, >
MehrOpenStack bei der SAP SE
OpenStack bei der SAP SE Integration bestehender Dienste in OpenStack dank Workflow Engine und angepasstem Webinterface 23. Juni 2015 Christian Wolter Linux Consultant B1 Systems GmbH wolter@b1-systems.de
MehrWerkzeuge für Datenbank Handwerker: IBM Data Studio und IBM Optim QWT
Werkzeuge für Datenbank Handwerker: IBM Data Studio und IBM Optim QWT Neue Technologien effizient nutzen Ehningen, 3. Juli 2014 Rodney Krick rk@aformatik.de aformatik Training & Consulting GmbH & Co. KG
MehrVorwort zur 5. Auflage... 15 Über den Autor... 16
Vorwort zur 5. Auflage...................................... 15 Über den Autor............................................ 16 Teil I Grundlagen.............................................. 17 1 Einführung
MehrPerformanceoptimierung mit Exadata Verarbeitung extremer Datenmengen mit PL/SQL basierter Datenbewirtschaftung (Erfahrungsbericht)
Performanceoptimierung mit Exadata Verarbeitung extremer Datenmengen mit PL/SQL basierter Datenbewirtschaftung (Erfahrungsbericht) Christian Haag, DATA MART Consulting Consulting Manager Oracle DWH Team
MehrANDREAS PROUZA. Wien, 2015-03-27. andreaspr@aon.at andreas@prouza.at. http://www.prouza.at
DB2 & SQL E I N F Ü H R U N G T U N I N G O P T I M I E R U N G S E C R E T S ANDREAS PROUZA andreaspr@aon.at andreas@prouza.at http://www.prouza.at Wien, 2015-03-27 1 Inhaltsverzeichnis 1 Inhaltsverzeichnis...
MehrAndrea Held. Virtualisierung im Oracle-Umfeld Virtualisierungslayer Voraussetzungen Schnittstellen Workload Management Grid Control
Andrea Held Virtualisierung im Oracle-Umfeld Virtualisierungslayer Voraussetzungen Schnittstellen Workload Management Grid Control 1 Einzelne Server ausgelegt auf Lastspitzen Niedrige durchschnittliche
MehrWas ist Windows Azure? (Stand Juni 2012)
Was ist Windows Azure? (Stand Juni 2012) Windows Azure Microsofts Cloud Plattform zu Erstellung, Betrieb und Skalierung eigener Cloud-basierter Anwendungen Cloud Services Laufzeitumgebung, Speicher, Datenbank,
MehrHERZLICH WILLKOMMEN SHAREPOINT 2013 - DEEP DIVE FOR ADMINS 11.09.2012 IOZ AG 2
11.09.2012 IOZ AG 1 HERZLICH WILLKOMMEN SHAREPOINT 2013 - DEEP DIVE FOR ADMINS 11.09.2012 IOZ AG 2 AGENDA Über mich Architekturänderungen Systemvoraussetzungen Migration Fragen 11.09.2012 IOZ AG 3 ÜBER
MehrSeminar in der Seminarreihe Business Intelligence 1. OLAP und Datawarehousing
Seminar in der Seminarreihe Business Intelligence 1 OLAP und Datawarehousing OLAP & Warehousing Die wichtigsten Produkte Die Gliederung Produkt Bewertung & Vergleiche Die Marktentwicklung Der aktuelle
MehrHadoop I/O. Datenintegrität Kompression Serialisierung Datei-basierte Datenstrukturen. 14.02.2012 Prof. Dr. Christian Herta 1/29
Hadoop I/O Datenintegrität Kompression Serialisierung Datei-basierte Datenstrukturen 14.02.2012 Prof. Dr. Christian Herta 1/29 Data I/O und Hadoop Allgemeine Techniken Data I/O Datenintegrität Kompression
MehrSaaS-Referenzarchitektur. iico-2013-berlin
SaaS-Referenzarchitektur iico-2013-berlin Referent Ertan Özdil Founder / CEO / Shareholder weclapp die Anforderungen 1.000.000 registrierte User 3.000 gleichzeitig aktive user Höchste Performance Hohe
MehrHadoop Demo HDFS, Pig & Hive in Action. Oracle DWH Konferenz 2014 Carsten Herbe
Hadoop Demo HDFS, Pig & Hive in Action Oracle DWH Konferenz 2014 Carsten Herbe Wir wollen eine semi-strukturierte Textdatei in Hadoop verarbeiten und so aufbereiten, dass man die Daten relational speichern
MehrClouds. Erwartungen der Nutzer. Wolkig bis Heiter. (c) 2013, Peter Sturm, Universität Trier. Er ist verwöhnt! Er ist nicht dankbar!
Clouds Wolkig bis Heiter Erwartungen der Nutzer Er ist verwöhnt! Verfügbarkeit Viele Anwendungen Intuitive Interfaces Hohe Leistung Er ist nicht dankbar! Mehr! Mehr! Mehr! Moore 1 Erwartungen der Entwickler
MehrWillkommen zum IBM DB2 Newsletter
Liebe Leserinnen und Leser, Willkommen zum IBM DB2 Newsletter herzlich Willkommen zum 3ten DB2 NL. Aufgrund der Urlaubszeit wurden einige Themen auf die nächsten Ausgaben verschoben, bedingt durch die
MehrKASPERSKY SECURITY FOR VIRTUALIZATION 2015
KASPERSKY SECURITY FOR VIRTUALIZATION 2015 Leistung, Kosten, Sicherheit: Bessere Performance und mehr Effizienz beim Schutz von virtualisierten Umgebungen AGENDA - Virtualisierung im Rechenzentrum - Marktübersicht
MehrALL NEW GROUNDWORK 7.0.2
ALL NEW GROUNDWORK 7.0.2 11 gute Gründe für den Umstieg / Upgrade 1. Benutzerfreundlichkeit 2. Performance 3. Sicherheit 4. CloudHub 1.3 5. Kostenloser Upgrade 6. Business Service Management 7. Authentifikation
MehrDokumentenorientierte Datenbanken - MongoDB
Dokumentenorientierte Datenbanken - MongoDB Jan Hentschel Ultra Tendency UG Übersicht Dokumente sind unabhängige Einheiten Bessere Performance (zusammengehörige Daten werden gemeinsam gelesen) Objektmodell
MehrDatenbearbeitung in der Cloud anhand von Apache Hadoop Hochschule Mannheim
Tobias Neef Cloud-Computing Seminar Hochschule Mannheim WS0910 1/23 Datenbearbeitung in der Cloud anhand von Apache Hadoop Hochschule Mannheim Tobias Neef Fakultät für Informatik Hochschule Mannheim tobnee@gmail.com
MehrStratosphere. Next-Generation Big Data Analytics Made in Germany
Stratosphere Next-Generation Big Data Analytics Made in Germany Robert Metzger Stratosphere Core Developer Technische Universität Berlin Ronald Fromm Head of Big Data Science Telekom Innovation Laboratories
MehrBig Data und SQL - das passt! Philipp Loer ORDIX AG Paderborn
Schlüsselworte Hadoop, Hive, Sqoop, SQL Big Data und SQL - das passt! Philipp Loer ORDIX AG Paderborn Einleitung In diesem Vortrag werden, nach einer kurzen Einführung in Apache Hadoop, die beiden Werkzeuge
MehrDas Zettabyte. CeBIT 2011. Dr. Wolfgang Martin Analyst, ibond Partner und Ventana Research Advisor
Das Zettabyte CeBIT 2011 Dr. Wolfgang Martin Analyst, ibond Partner und Ventana Research Advisor Das Zetabyte: analytische Datenbanken Die Datenflut. Analytische Datenbanken: Was ist neu? Analytische Datenbanken:
MehrOracle Business Intelligence (OBIEE) 12c Ein erster Einblick in die neue Reporting-Engine von Oracle
Oracle Business Intelligence (OBIEE) 12c Ein erster Einblick in die neue Reporting-Engine von Oracle David Michel Consultant Business Intelligence, Apps Associates GmbH Apps Associates Apps Associates
MehrPortal for ArcGIS - Eine Einführung
2013 Europe, Middle East, and Africa User Conference October 23-25 Munich, Germany Portal for ArcGIS - Eine Einführung Dr. Gerd van de Sand Dr. Markus Hoffmann Einsatz Portal for ArcGIS Agenda ArcGIS Plattform
MehrNoSQL mit Postgres 15. Juni 2015
Tag der Datenbanken 15. Juni 2015 Dipl.-Wirt.-Inform. Agenda l Vorstellung l Marktübersicht l Warum PostgreSQL? l Warum NoSQL? l Beispielanwendung Seite: 2 Vorstellung Dipl.-Wirt.-Inform. [1990] Erste
MehrJune 2015. Automic Hadoop Agent. Data Automation - Hadoop Integration
June 2015 Automic Hadoop Agent Data Automation - Hadoop Integration + Aufbau der Hadoop Anbindung + Was ist eigentlich ist MapReduce? + Welches sind die Stärken von Hadoop + Welches sind die Schwächen
MehrOpen Source Data Center Virtualisierung mit OpenNebula. 05.03.2013 CeBIT 2013. Bernd Erk www.netways.de
Open Source Data Center Virtualisierung mit OpenNebula 05.03.2013 CeBIT 2013 Bernd Erk VORSTELLUNG NETWAYS NETWAYS! Firmengründung 1995! GmbH seit 2001! Open Source seit 1997! 35 Mitarbeiter! Spezialisierung
MehrOracle Big Data Technologien Ein Überblick
Oracle Big Data Technologien Ein Überblick Ralf Lange Global ISV & OEM Sales NoSQL: Eine kurze Geschichte Internet-Boom: Erste Ansätze selbstgebauter "Datenbanken" Google stellt "MapReduce"
MehrErneuerungen und Innovatives von Symantec Rene Piuk / Johannes Bedrech Senior Consultants für Symantec / Altiris X-tech
Erneuerungen und Innovatives von Symantec Rene Piuk / Johannes Bedrech Senior Consultants für Symantec / Altiris X-tech Titelmasterformat Agenda durch Klicken What snewin ITMS 7.1 sinceoctober2011 09:15
MehrMapReduce in der Praxis
MapReduce in der Praxis Rolf Daniel Seminar Multicore Programmierung 09.12.2010 1 / 53 Agenda Einleitung 1 Einleitung 2 3 Disco Hadoop BOOM 4 2 / 53 1 Einleitung 2 3 Disco Hadoop BOOM 4 3 / 53 Motivation
MehrIn-Memory Datenbanken im Kontext komplexer Analytics Pojekte am Beispiel der Otto Group BI
In-Memory Datenbanken im Kontext komplexer Analytics Pojekte am Beispiel der Otto Group BI Hanau, 25.02.2015 1 Titel der Präsentation, Name, Abteilung, Ort, xx. Monat 2014 Der Aufbau der Group BI Plattform
MehrPersönlichkeiten bei bluehands
Persönlichkeiten bei Technologien bei Skalierbare Anwendungen mit Windows Azure GmbH & co.mmunication KG am@.de; posts..de/am 1 2 3 4 5 6 7 8 9 Immer mehr Mehr Performance Mehr Menge Mehr Verfügbarkeit
MehrBIW - Überblick. Präsentation und Discoverer Demonstration - Teil 1 - Humboldt Universität zu Berlin am 10. Juni 2004
BIW - Überblick Präsentation und Discoverer Demonstration - Teil 1 - Humboldt Universität zu Berlin am 10. Juni 2004 Annegret Warnecke Senior Sales Consultant Oracle Deutschland GmbH Berlin Agenda Überblick
MehrStorage-Trends am LRZ. Dr. Christoph Biardzki
Storage-Trends am LRZ Dr. Christoph Biardzki 1 Über das Leibniz-Rechenzentrum (LRZ) Seit 50 Jahren Rechenzentrum der Bayerischen Akademie der Wissenschaften IT-Dienstleister für Münchner Universitäten
MehrMySQL Cluster. Kai Voigt MySQL AB kai@mysql.com. Kiel, 17. Februar 2006
MySQL Cluster Kai Voigt MySQL AB kai@mysql.com Kiel, 17. Februar 2006 1 Agenda Warum? Wie? Wie genau? Was sonst? 2 Warum? 3 Kosten runter Hochverfügbarkeit (99,999%) Redundante Daten und Systeme Wiederherstellung
MehrAufbau einer Testumgebung mit VMware Server
Aufbau einer Testumgebung mit VMware Server 1. Download des kostenlosen VMware Servers / Registrierung... 2 2. Installation der Software... 2 2.1 VMware Server Windows client package... 3 3. Einrichten
MehrBig Data: Solaranlagen reparieren Waschmaschinen? 2014 IBM Corporation
Big Data: Solaranlagen reparieren Waschmaschinen? Agenda Kurze Vorstellung Der Kunde und der ursprüngliche Ansatz Bisherige Architektur Vorgeschlagene Architektur Neue Aspekte der vorgeschlagenen Architektur
MehrLiving Lab Big Data Konzeption einer Experimentierplattform
Living Lab Big Data Konzeption einer Experimentierplattform Dr. Michael May Berlin, 10.12.2012 Fraunhofer-Institut für Intelligente Analyseund Informationssysteme IAIS www.iais.fraunhofer.de Agenda n Ziele
MehrEXCHANGE 2013. Neuerungen und Praxis
EXCHANGE 2013 Neuerungen und Praxis EXCHANGE 2013 EXCHANGE 2013 NEUERUNGEN UND PRAXIS Kevin Momber-Zemanek seit September 2011 bei der PROFI Engineering Systems AG Cisco Spezialisierung Cisco Data Center
MehrCompliance erlaubt keine Wartezeit
Compliance erlaubt keine Wartezeit Schnelle Analyse-Verfahren bei der HVB Unicredit AG Anwarul Haq Khan, 26. Mai 2015 Agenda (Stichpunkte) Wer ist Unicredit-HVB AG Compliance - Was ist das? Was waren die
MehrMöglichkeiten für bestehende Systeme
Möglichkeiten für bestehende Systeme Marko Filler Bitterfeld, 27.08.2015 2015 GISA GmbH Leipziger Chaussee 191 a 06112 Halle (Saale) www.gisa.de Agenda Gegenüberstellung Data Warehouse Big Data Einsatz-
MehrMedienbruchfrei analysieren und dabei Karten als Visualisierungselement in BI anbieten
Medienbruchfrei analysieren und dabei Karten als Visualisierungselement in BI anbieten 4 Handeln 1 Überwachen 3 Alternativen modellieren/simulieren 2 Analysieren. Copyright 2012 Oracle and/or its affiliates.
MehrEinführung in Hadoop & MapReduce. Dr. Kathrin Spreyer Big Data Engineer
Einführung in Hadoop & MapReduce Dr. Kathrin Spreyer Big Data Engineer München, 19.06.2013 Agenda Einleitung 1. HDFS 2. MapReduce 3. APIs 4. Hive & Pig 5. Mahout Tools aus Hadoop-Ökosystem 6. HBase 2 Worum
MehrManaged Cloud Services
Managed Cloud Services Autor.: Monika Olschewski Whitepaper Version: 1.0 Erstellt am: 14.07.2010 ADACOR Hosting GmbH Kaiserleistrasse 51 63067 Offenbach am Main info@adacor.com www.adacor.com Cloud Services
MehrCassandra Query Language (CQL)
Cassandra Query Language (CQL) Seminar: NoSQL Wintersemester 2013/2014 Cassandra Zwischenpräsentation 1 Gliederung Basic facts Datentypen DDL/DML ähnlich zu SQL Besonderheiten Basic facts CQL kurz für
MehrHardware- und Software-Anforderungen IBeeS.ERP
Hardware- und Software-Anforderungen IBeeS.ERP IBeeS GmbH Stand 08.2015 www.ibees.de Seite 1 von 8 Inhalt 1 Hardware-Anforderungen für eine IBeeS.ERP - Applikation... 3 1.1 Server... 3 1.1.1 Allgemeines
MehrVorstellung IBM Cognos 10.2. Oliver Linder Client Technical Professional Business Analytics
Vorstellung IBM Cognos 10.2 Oliver Linder Client Technical Professional Business Analytics Agenda IBM Cognos 10.2 Architektur User Interfaces IBM Cognos Workspace IBM Cognos Workspace Advanced IBM Cognos
MehrNeues in Hyper-V Version 2
Michael Korp Technical Evangelist Microsoft Deutschland GmbH http://blogs.technet.com/mkorp Neues in Hyper-V Version 2 - Virtualisieren auf die moderne Art - Windows Server 2008 R2 Hyper-V Robust Basis:
MehrDatenbanken (WS 2015/2016)
Datenbanken (WS 2015/2016) Klaus Berberich (klaus.berberich@htwsaar.de) Wolfgang Braun (wolfgang.braun@htwsaar.de) 0. Organisatorisches Dozenten Klaus Berberich (klaus.berberich@htwsaar.de) Sprechstunde
MehrOpen Source Data Center Virtualisierung mit OpenNebula. 22.05.2013 LinuxTag Berlin. Bernd Erk www.netways.de
Open Source Data Center Virtualisierung mit OpenNebula 22.05.2013 LinuxTag Berlin Bernd Erk VORSTELLUNG NETWAYS NETWAYS! Firmengründung 1995! GmbH seit 2001! Open Source seit 1997! 38 Mitarbeiter! Spezialisierung
MehrWell-Balanced. Performance Tuning
Well-Balanced Real Application Cluster Performance Tuning Über mich virtual7 GmbH Jürgen Bouché Zeppelinstraße 2 76185 Karlsruhe Tel.: +49 (721) 6190170 Fax.: +49 (721) 61901729 Email: jbouche@heine.de
MehrConfiguration Management mit Verbosy 17.04.2013 OSDC 2013. Eric Lippmann www.netways.de
Configuration Management mit Verbosy 17.04.2013 OSDC 2013 Eric Lippmann Kurzvorstellung NETWAYS Expertise OPEN SOURCE SYSTEMS MANAGEMENT OPEN SOURCE DATA CENTER Monitoring & Reporting Configuration Management
Mehr