BIG SQL FOR HORTONWORKS (MOGELPACKUNG ODER GENIALER SCHACHZUG?)

Größe: px
Ab Seite anzeigen:

Download "BIG SQL FOR HORTONWORKS (MOGELPACKUNG ODER GENIALER SCHACHZUG?)"

Transkript

1 THOMAS KALB BIG SQL FOR HORTONWORKS (MOGELPACKUNG ODER GENIALER SCHACHZUG?) Big SQL for Hortonworks (Mogelpackung oder genialer Schachzug) Copyright 2017 ITGAIN GmbH 1

2 AGENDA ITGAIN Big SQL Aktionen PoC Cobol meets Hadoop Beta Test Big SQL 4.0 for HDP Sandbox Test Big SQL 5.0 Was ist Big SQL? MPP vs. SMP Architektur DB2 DPF vs. Hadoop (HDFS) Installation, Administration und Monitoring Arbeiten mit BigS QL: Bekanntes und Unbekanntes Performancevergleich DB2 DPF Big SQL HDFS Hadoop Daten mit Big SQL abfragen Big SQL und Hive Einsatz von Big SQL Fragen & Diskussionen Big SQL for Hortonworks (Mogelpackung oder genialer Schachzug) Copyright 2017 ITGAIN GmbH 2

3 BIG SQL IM LAUFE DER ZEIT Big SQL 2.0 Big SQL 3.0 Big SQL for HDP 4.2 Big SQL 4.3 Big SQL / / /2017 Big SQL for Hortonworks (Mogelpackung oder genialer Schachzug) Copyright 2017 ITGAIN GmbH 3

4 BIG SQL AKTIONEN 2014 PoC - Cobol meets Hadoop 2016 Beta Test für Big SQL 4.2 for HDP 2017 Sandbox Test Big SQL 5.0 Copyright 2017 ITGAIN GmbH 4

5 THOMAS KALB DB2/z meets Hadoop Copyright 2017 ITGAIN GmbH 5

6 BIG SQL 3.0 THE ITGAIN CHALLENGE (Cobol with static SQL) Copyright 2017 ITGAIN GmbH 6

7 BIG SQL 3.0 THE ITGAIN CHALLENGE z/os 1.7 (hercules) SLES11 SP 1 DB2 LUW DB2 CONNECT HADOOP (IBM BigInsight) BIGSQL 3.0 SLES11 SP2 Windows 8.1 DB2 V Copyright 2017 ITGAIN GmbH 7

8 BIG SQL 3.0 USING ECLIPSE Copyright 2017 ITGAIN GmbH 8

9 BIG SQL 3.0 VIA DB2 LUW Copyright 2017 ITGAIN GmbH 9

10 DB2 LUW CONNECT VIA FEDERATION Copyright 2017 ITGAIN GmbH 10

11 DB2/Z CONNECT VIA COMMUNICATION DATABASE Copyright 2017 ITGAIN GmbH 11

12 BIG SQL 3.0 THE ITGAIN CHALLENGE CDB DB2 Connect Federation Copyright 2017 ITGAIN GmbH 12

13 BIG SQL 3.0 THE ITGAIN CHALLENGE Copyright 2017 ITGAIN GmbH 13

14 BIG SQL 3.0 THE ITGAIN CHALLENGE Copyright 2017 ITGAIN GmbH 14

15 BIG SQL 3.0 THE ITGAIN CHALLENGE Copyright 2017 ITGAIN GmbH 15

16 AGENDA ITGAIN Big SQL Aktionen (Warmup) PoC Cobol meets Hadoop Beta Test Big SQL 4.2 for HDP Sandbox Test Big SQL 5.0 Was ist Big SQL MPP vs. SMP Architektur DB2 DPF vs. Hadoop (HDFS) Installation, Administration und Monitoring Arbeiten mit Big SQL: Bekanntes und Unbekanntes Performancevergleich DPF Big SQL Hadoop Daten mit BigSQL abfragen Big SQL und Hive Einsatz von BigS QL Fragen & Diskussionen Copyright 2017 ITGAIN GmbH 16

17 BIG SQL UND HORTONWOKS August 2016: Einladung der IBM Analytics Group (San Francisco) als einziger deutscher Beta-Tester für BIG SQL on Hortonworks Bisher nur für IBM Open Platform (IOP) verfügbar September 2016: Release der Beta-Version Installation und Test eines 2 Knoten Clusters Offizielle Ankündigung von BigSQL v.4.2 Ende September Dezember 2016: Vortrag auf der GSE DB2 Tagung Februar 2017 Vortrag auf der GSE Big Data & Analytics Tagung Copyright 2017 ITGAIN GmbH 17

18 HADOOP DISTRIBUTIONEN? Marktanteile weltweit: Cloudera / Hortonworks / MapR / IOP Copyright 2017 ITGAIN GmbH 18

19 WARUM SQL ZUGRIFF AUF HADOOP? Für Hadoop benötigt man Java-Programmierer mit Kenntnissen in MapReduce, Spark, Pig, etc. Analysten können ohne Hilfe von Entwicklern unstrukturierte Hadoop-Daten kaum abfragen SQL-ähnliche Abfragen mit HiveQL basieren auf MapReduce und sind relativ langsam und halten sich nicht an den ANSI-SQL Standard SQL macht Hadoop einem breiteren Publikum zugänglich Copyright 2017 ITGAIN GmbH 19

20 HADOOP SQL ENGINES Copyright 2017 ITGAIN GmbH 20

21 AGENDA ITGAIN Big SQL Aktionen (Warmup) PoC Cobol meets Hadoop Beta Test Big SQL 4.2 for HDP Sandbox Test Big SQL 5.0 Was ist Big SQL? MPP vs. SMP Architektur DB2 DPF vs. Hadoop (HDFS) Installation, Administration und Monitoring Arbeiten mit Big SQL: Bekanntes und Unbekanntes Performancevergleich DB2 DPF Big SQL HDFS Hadoop Daten mit Big SQL abfragen Big SQL und Hive Einsatz von Big SQL Fragen & Diskussionen Copyright 2017 ITGAIN GmbH 21

22 WAS IST BIG SQL? Big SQL builds on a APACHE HIVE FOUNDATION Copyright 2017 ITGAIN GmbH 22

23 WAS IST HIVE? Open Source SQL für Hadoop Hive Komponenten: SQL Execution Engine Hive Metastore Hive Storage Model Quelle: Big SQL: Powerful SQL Optimization - Re-Imagined for open source 2017 IBM Corporation Copyright 2017 ITGAIN GmbH 23

24 BIG SQL UND HIVE Big SQL Tabellen sind Hive Tabellen Big SQL und Hive nutzen die gleichen Tabellen Gemeinsame Daten Gemeinsame Metainformationen Quelle: Big SQL: Powerful SQL Optimization - Re-Imagined for open source 2017 IBM Corporation Big SQL for Hortonworks (Mogelpackung oder genialer Schachzug) Copyright 2017 ITGAIN GmbH 24

25 BIG SQL UND DIE ANDEREN Quelle: Big SQL: Powerful SQL Optimization - Re-Imagined for open source 2017 IBM Corporation Copyright 2017 ITGAIN GmbH 25

26 BIG SQL 4.2 IBM MPP-engine (C++) löst MapReduce-Layer (Java) ab Big SQL ist eine MPP (Massively Parallel Processing) SQL-engine HBASE ist eine verteilte spaltenorientierte Key- Value Datenbank HDFS ist ein hochverfügbares Dateisystem zur Speicherung sehr großer Datenmengen verteilt auf mehreren Knoten Quelle: Big SQL: A Technical Introduction 2016 IBM Corporation Copyright 2017 ITGAIN GmbH 26

27 BIG SQL Federation und Integration Quelle: IBM-Big-SQL-Datasheet_final.pdf Copyright 2017 ITGAIN GmbH 27

28 BIG SQL WHAT S NEW Migrationsunterstützung von IOP(IBM Open Platform) nach HDP (Hortonwork Data Platform) Big SQL Interpreter für Zeppelin (Unterstützung von Tabellen auf Basis von S3 Storage) (Big SQL auch für CentOS) Verbesserte Spark Integration Performanceverbesserungen Erweiterte Hochverfügbarkeit (BLU Acceleration für Big SQL).. Copyright 2017 ITGAIN GmbH 28

29 BIG SQL INNERHALB VON IBM DB2 WAREHOUSE ON CLOUD Copyright 2017 ITGAIN GmbH 29

30 Copyright 2017 ITGAIN GmbH 30

31 DOCKER SANDBOX DOWNLOAD Copyright 2017 ITGAIN GmbH 31

32 DOCKER SANDBOX INSTALLATION Copyright 2017 ITGAIN GmbH 32

33 DOCKER SANDBOX START Copyright 2017 ITGAIN GmbH 33

34 DOCKER SANDBOX HADOOP VERWALTUNG MIT AMBARI Copyright 2017 ITGAIN GmbH 34

35 DOCKER SANDBOX BIGSQL KONFIGURATION DB2 Client Konfiguration Copyright 2017 ITGAIN GmbH 35

36 DOCKER SANDBOX BIGSQL KONFIGURATION SSH Konfiguration.. Copyright 2017 ITGAIN GmbH 36

37 BIG SQL STOPPEN UND STARTEN Copyright 2017 ITGAIN GmbH 37

38 BIG SQL SAMPLE Definition und Befüllung einer Hadoop Tabelle Copyright 2017 ITGAIN GmbH 38

39 BIG SQL UND HDFS Copyright 2017 ITGAIN GmbH 39

40 BIG SQL UND HIVE Copyright 2017 ITGAIN GmbH 40

41 BIG SQL TABELLEN IN HIVE Big SQL Hive Copyright 2017 ITGAIN GmbH 41

42 HBASE BIG SQL TABELLEN Copyright 2017 ITGAIN GmbH 42

43 Copyright 2017 ITGAIN GmbH 43

44 AGENDA ITGAIN Big SQL Aktionen (Warmup) PoC Cobol meets Hadoop Beta Test Big SQL 4.2 for HDP Sandbox Test Big SQL 5.0 Was ist Big SQL? MPP vs. SMP Architektur DB2 DPF vs. Hadoop (HDFS) Installation, Administration und Monitoring Arbeiten mit BigSQL: Bekanntes und Unbekanntes Performancevergleich DB2 DPF Big SQL HDFS Hadoop Daten mit BigSQL abfragen Big SQL und Hive Einsatz von BigSQL Fragen & Diskussionen Copyright 2017 ITGAIN GmbH 44

45 MPP VS. SMP ARCHITEKTUR Symmetric Multi Processing: Dynamische Verteilung laufender Prozesse auf alle verfügbaren Prozessoren, die sich Systemressourcen teilen (=Multiprozessorsystem) Copyright 2017 ITGAIN GmbH 45

46 MPP VS. SMP ARCHITEKTUR Massive Parallel Processing: Verteilung einer Aufgabe auf mehrere voneinander unabhängige Knoten mit eigenem Prozessor, Hauptspeicher und I/O-Subsystem (= Shared Nothing Architektur) Copyright 2017 ITGAIN GmbH 46

47 AGENDA ITGAIN Big SQL Aktionen (Warmup) PoC Cobol meets Hadoop Beta Test Big SQL 4.2 for HDP Sandbox Test Big SQL 5.0 Was ist Big SQL MPP vs. SMP Architektur Db2 DPF vs. Hadoop (HDFS) Installation, Administration und Monitoring Arbeiten mit Big SQL: Bekanntes und Unbekanntes Performancevergleich DB2 DPF Big SQL HDFS Hadoop Daten mit Big SQL abfragen# Big SQL und Hive Einsatz von Big SQL Fragen & Diskussionen Copyright 2017 ITGAIN GmbH 47

48 DB2 DPF DPF Koordinator (1): kommuniziert mit dem Client und weiß auf welcher Partition die angeforderten Daten liegen DB2 Partition (2): führt die Abfrage aus Jede Datenbank-Partition hat ihre eigenen Disks Weitere Partitionen können jederzeit hinzugefügt werden Partitionen kommunizieren nicht untereinander Quelle: Big SQL: Similarities and differences from DB2 LUW 2016 IBM Corporation Copyright 2017 ITGAIN GmbH 48

49 HADOOP HDFS NameNode (1): Verwaltet das Metadaten- Repository(a) (welcher Block gehört zu welcher Datei) kommuniziert mit dem Client und koordiniert den Zugriff auf die Daten DataNode(2): Speichert die Daten in HDFS-Blöcken und kennt die Lokation dieser Blöcke (a) HDFS-Blöcke werden zwischen den Knoten repliziert (b) Quelle: Big SQL: Similarities and differences from DB2 LUW 2016 IBM Corporation Copyright 2017 ITGAIN GmbH 49

50 DB2 DPF VS. BIG SQL CLUSTER TYPOLOGIE (HDFS) DPF: Jede Daten- Partition hat ihr eigenes Set an Disks HADOOP: Jede Daten- Partition kann auf alle HDFS-Daten zugreifen Quelle: Big SQL: Similarities and differences from DB2 LUW 2016 IBM Corporation Copyright 2017 ITGAIN GmbH 50

51 VON DB2 DPF ZU BIG SQL (1) HDFS: Physischen Disks werden durch HDFS ersetzt (DB2 kontrolliert nicht mehr wo die Daten liegen) (2) Temp Data bleibt bestehen (3) SQL Scheduler: Erhält Anfragen für Tabellenzugriff vom DPF Koordinator Interagiert mit dem Hive-Metastore und ermittelt die File-Lokation für Tabellen im HDFS Interagiert mit dem Namenode um die HDFS- Blöcke auf den Datanodes zu ermitteln (4) BigSQL I/O-Engines: Native C++ Reader und Java Reader: Big SQL entscheidet anhand des Dateiformats welcher Reader verwendet wird Big SQL Scheduler erteilt Aufrträge an die I/O Engines Quelle: Big SQL: Similarities and differences from DB2 LUW 2016 IBM Corporation Mogelpackung oder genialer Schachzug? Copyright 2017 ITGAIN GmbH 51

52 BIG SQL ARCHITEKTUR Big SQL Master hört auf JDBC/ODBC Verbindungen kompiliert die Abfrage und koordiniert dies Ausführung auf den Workern Worker führen die Abfrage auf dem Knoten aus, auf dem die Daten liegen (Data Locality) Datenaustausch zwischen den Knoten soweit notwendig Quelle: Big SQL: A Technical Introduction 2016 IBM Corporation Copyright 2017 ITGAIN GmbH 52

53 BIG SQL ERWEITERTE ARCHITEKTUR (HYBRID ENGINE) BigSQL for Hortonworks (Mogelpackung oder genialer Schachzug Copyright 2017 ITGAIN GmbH 53

54 AGENDA ITGAIN Big SQL Aktionen (Warmup) PoC Cobol meets Hadoop Beta Test Big SQL 4.0 for HDP Sandbox Test Big SQL 5.0 Was ist Big SQL MPP vs. SMP Architektur DB2 DPF vs. Hadoop (HDFS) Installation, Administration und Monitoring Arbeiten mit Big SQL: Bekanntes und Unbekanntes Performancevergleich DPF Big SQL Hadoop Daten mit Big SQL abfragen Big SQL und Hive Einsatz von Big SQL Fragen & Diskussionen Copyright 2017 ITGAIN GmbH 54

55 ITGAIN TESTUMGEBUNG Initiale Installation von 2 Knoten-Cluster Hardware 2 virtuelle Server mit 8 Cores / 10 GB RAM / SSDs Software Linux RedHat 7.2 / Cent OS 7.2 Ambari Hortonworks Data Platform (HDP) BETA: Big SQL 4.2 for Hortonworks Data Platform Erweiterung um drei weitere Knoten 1x NameNode / MasterNode 4x DataNodes / WorkerNodes Copyright 2017 ITGAIN GmbH 55

56 INSTALLATION Copyright 2017 ITGAIN GmbH 56

57 HADOOP-ADMINISTRATION UND MONITORING: AMBARI Copyright 2017 ITGAIN GmbH 57

58 BIG SQL INSTALLATION Copyright 2017 ITGAIN GmbH 58

59 BIG SQL MONITORING Copyright 2017 ITGAIN GmbH 59

60 BIG SQL MONITORING Copyright 2017 ITGAIN GmbH 60

61 SPEEDGAIN FOR BIG SQL Copyright 2017 ITGAIN GmbH 61

62 AGENDA ITGAIN Big SQL Aktionen (Warmup) PoC Cobol meets Hadoop Beta Test Big SQL 4.2 for HDP Sandbox Test Big SQL 5.0 Was ist Big SQL? MPP vs. SMP Architektur DB2 DPF vs. Hadoop (HDFS) Installation, Administration und Monitoring Arbeiten mit BigSQL: Bekanntes und Unbekanntes Performancevergleich DB2 DPF Big SQL HDFS Hadoop Daten mit Big SQL abfragen Big SQL und Hive Einsatz von Big SQL Fragen & Diskussionen Copyright 2017 ITGAIN GmbH 62

63 ARBEITEN MIT BIGSQL: BEKANNTES UND UNBEKANNTES DB2 Schnittstelle Copyright 2017 ITGAIN GmbH 63

64 ARBEITEN MIT BIGSQL: BEKANNTES UND UNBEKANNTES Wo findet man die Tabelle in HDFS? /apps/hive/warehouse/bigsql.db/firsttable Copyright 2017 ITGAIN GmbH 64

65 ARBEITEN MIT BIGSQL: BEKANNTES UND UNBEKANNTES Oder über Kommandozeile (HDFS Browse): Copyright 2017 ITGAIN GmbH 65

66 ARBEITEN MIT BIGSQL: BEKANNTES UND UNBEKANNTES Es funktioniert aber noch nicht alles über die DB2-Kommandozeile: Laden von Daten in Hadoop-Tabelle Copyright 2017 ITGAIN GmbH 66

67 ARBEITEN MIT BIGSQL: BEKANNTES UND UNBEKANNTES Es gibt auch eine Kommandozeile für BigSQL: JSqsh (Java SQL Shell) - ausgesprochen "jay-skwish Copyright 2017 ITGAIN GmbH 67

68 ARBEITEN MIT BIGSQL: BEKANNTES UND UNBEKANNTES Tabelle laden Copyright 2017 ITGAIN GmbH 68

69 AGENDA ITGAIN Big SQL Aktionen (Warmup) PoC Cobol meets Hadoop Beta Test Big SQL 4.2 for HDP Sandbox Test Big SQL 5.0 Was ist Big SQL MPP vs. SMP Architektur DB2 DPF vs. Hadoop (HDFS) Installation, Administration und Monitoring Arbeiten mit Big SQL: Bekanntes und Unbekanntes Performancevergleich DB2 DPF Big SQL HDFS Hadoop Daten mit Big SQL abfragen Big SQL und Hive Einsatz von Big SQL Fragen & Diskussionen Copyright 2017 ITGAIN GmbH 69

70 PERFORMANCEVERGLEICH DB2 DPF VS. DB2 HDFS Laden von 10 Mio. Datensätzen Copyright 2017 ITGAIN GmbH 70

71 PERFORMANCE UNTERSCHIEDE DB2 DPF VERSUS DB2 HDFS Random I/O Benchmark (Lesen von 1023 Sätzen) DB2 DPF Cold: DB2 HDFS Cold: Warm: Warm: BIGSQL homerun or merely a major bluff? Copyright 2017 ITGAIN GmbH 71

72 PERFORMANCEVERGLEICH DB2 DPF VS. DB2 HDFS Read Ahead I/O Benchmark (Lesen von 10 Mio. Sätzen) Copyright 2017 ITGAIN GmbH 72

73 AGENDA ITGAIN Big SQL Aktionen (Warmup) PoC Cobol meets Hadoop Beta Test Big SQL 4.2 for HDP Sandbox Test Big SQL 5.0 Was ist Big SQL? MPP vs. SMP Architektur DB2 DPF vs. Hadoop (HDFS) Installation, Administration und Monitoring Arbeiten mit Big SQL: Bekanntes und Unbekanntes Performancevergleich DB2 DPF Big SQL HDFS Hadoop Daten mit Big SQL abfragen Big SQL und Hive Einsatz von Big SQL Fragen & Diskussionen Copyright 2017 ITGAIN GmbH 73

74 HADOOP DATEN MIT BIG SQL ABFRAGEN Arbeiten mit strukturierten Daten SQL Arbeiten mit Datentypen für komplexe Daten (halbstrukturiert) ARRAY: Sammlung von Daten des gleichen Typs MAP: Sammlung von Key/Value Paaren STRUCT: Sammlung von Daten verschiedenen Typs Arbeiten mit unstrukturierten Daten ist über Serializer and Deserializer (SerDe) möglich Das SerDe-Interface instruiert Hive wie es Datensätze verarbeitet soll Es gibt zahlreiche Built-In SerDes z.b für JSON, Avro, Parquet, Regular Expressions, usw. Zahlreiche SerDes sind als PublicDomain verfügbar Kundenspezifische SerDes können nach Bedarf in Java entwickelt werden Copyright 2017 ITGAIN GmbH 74

75 DATEN ABFRAGEN SQL Copyright 2017 ITGAIN GmbH 75

76 SQL ANSI-STANDARD Vergleich: BigSQL Hive Impala TPC-DS Standard Analytic Query Benchmark: typische Abfragen von Business Analytic tools Copyright 2017 ITGAIN GmbH 76

77 DATEN ABFRAGEN ARBEITEN MIT ARRAY-DATENTYPEN Sammlung von Daten des gleichen Typs Copyright 2017 ITGAIN GmbH 77

78 DATEN ABFRAGEN ARBEITEN MIT MAP-TYPEN Sammlung von Key/Value Paaren Copyright 2017 ITGAIN GmbH 78

79 DATEN ABFRAGEN ARBEITEN MIT STRUCTS Sammlung von Daten verschiedenen Typs Copyright 2017 ITGAIN GmbH 79

80 DATEN ABFRAGEN UNSTRUKTURIERTE DATEN Beispiel: Parsen von Logfiles mit RegularExpression (RegexSerDe) Copyright 2017 ITGAIN GmbH 80

81 DATEN ABFRAGEN UNSTRUKTURIERTE DATEN select * from apache_log fetch first 5 rows only; Neue Logfiles werden nicht sofort eingelesen, sondern erst nach Ausführung SP (Cache leeren): CALL SYSHADOOP.HCAT_CACHE_SYNC bigsql, apache_log ); Copyright 2017 ITGAIN GmbH 81

82 AGENDA ITGAIN Big SQL Aktionen (Warmup) PoC Cobol meets Hadoop Beta Test Big SQL 4.0 for HDP Sandbox Test Big SQL 5.0 Was ist Big SQL? MPP vs. SMP Architektur DB2 DPF vs. Hadoop (HDFS) Installation, Administration und Monitoring Arbeiten mit Big SQL: Bekanntes und Unbekanntes Performancevergleich DB2 DPF Big SQL HDFS Hadoop Daten mit Big SQL abfragen Big SQL and Hive Einsatz von Big SQL Fragen & Diskussionen Copyright 2017 ITGAIN GmbH 82

83 HIVE UND BIG SQL GEMEINSAMKEITEN UND UNTERSCHIEDE Am Beispiel vom TPCDS Benchmark performance-benchmark-hive-tpc-ds-queries.html Copyright 2017 ITGAIN GmbH 83

84 TPCDS BENCHMARK DAS DATENMODELL Copyright 2017 ITGAIN GmbH 84

85 TPCDS HIVE BENCHMARK LADEN./tpcds-setup.sh 1000 tee tpcds-setup.log Copyright 2017 ITGAIN GmbH 85

86 TPCDS HIVE BENCHMARK TESTEN./runSuite.pl tpcds 10 tee runsuite.log time hive -i testbench.settings -f query13.sql 4 Std. 45 Min. Copyright 2017 ITGAIN GmbH 86

87 BIG SQL ARCHITEKTUR Copyright 2017 ITGAIN GmbH 87

88 BIG SQL HIVE TABELLEN WERDEN BIG SQL ZUR VERFÜGUNG GESTELLT SYSHADOOP.HACT_SYNC_OBJECTS Copyright 2017 ITGAIN GmbH 88

89 TPCDS BENCHMARK QUERY 13 Big SQL Hive 1 Std. 54 Min. 4 Std. 45 Min. Copyright 2017 ITGAIN GmbH 89

90 TPCDS BENCHMARK QUERY 13 Die Fakt-Tabelle ist eine HADOOP Tabelle Die Dimensions-Tabellen sind auch HADOOP Tabellen Copyright 2017 ITGAIN GmbH 90

91 TPCDS BENCHMARK QUERY 13 Die Fakt-Tabelle ist eine HADOOP Tabelle. Die Dimensions-Tabellen sind DB2 Tabellen Copyright 2017 ITGAIN GmbH 91

92 TPCDS BENCHMARK TABELLEN IMPLEMETIERUNG Hadoop DB2 Copyright 2017 ITGAIN GmbH 92

93 TPCDS BENCHMARK BIG SQL EXPLAIN Die Fakt-Tabelle ist eine HADOOP Tabelle. Die Dimensions-Tabellen sind DB2 Tabellen Copyright 2017 ITGAIN GmbH 93

94 TPCDS BENCHMARK HIVE EXPLAIN Copyright 2017 ITGAIN GmbH 94

95 AGENDA ITGAIN Big SQL Aktionen (Warmup) PoC Cobol meets Hadoop Beta Test Big SQL 4.0 for HDP Sandbox Test Big SQL 5.0 Was ist Big SQL MPP vs. SMP Architektur DB2 DPF vs. Hadoop (HDFS) Installation, Administration und Monitoring Arbeiten mit Big SQL: Bekanntes und Unbekanntes Performancevergleich DB2 DPF Big SQL HDFS Hadoop Daten mit Big SQL abfragen Big SQL und Hive Einsatz von Big SQL Fragen & Diskussionen Copyright 2017 ITGAIN GmbH 95

96 EINSATZ VON BIGSQL Big SQL Hadoop-Tabellen sind kein Ersatz für OLTP-DBMS Technologien Big SQL ermöglicht SQL-Abfragen auf bestehende Hadoop Daten (kein proprietäres Storage-Format) Alle Daten sind Hadoop-Dateien in HDFS Big SQL wurde entwickelt um die Hadoop-Infrastruktur wirksam und effizient einzusetzen SQL Kenntnisse sind in den meisten Unternehmen vorhanden! Kein UPDATE oder DELETE für Hadoop-Tabellen möglich Deutlich geringere Lizenzkosten als für DB2 DPF Sehr gute SQL Kompatibilität Copyright 2017 ITGAIN GmbH 96

97 EINSATZ VON BIGSQL Primäres Einsatzgebiet derzeit vor allem: um wenig frequentierte Daten aus dem Datawarehouse auf günstigere Hardware auszulagern und trotzdem über SQL direct darauf zugreifen zu können um unstrukturierte Daten (wie Logdateien, Sensordaten, Social Media Posts, etc.) zu filtern und zu analysieren und mit strukturierten Daten zu verknüpfen (z.b. über Federation) Copyright 2017 ITGAIN GmbH 97

98 Copyright 2017 ITGAIN GmbH 98

99 Q & A Copyright 2017 ITGAIN GmbH 99

Beratung. Results, no Excuses. Consulting. Lösungen. Grown from Experience. Ventum Consulting. SQL auf Hadoop Oliver Gehlert. 2014 Ventum Consulting

Beratung. Results, no Excuses. Consulting. Lösungen. Grown from Experience. Ventum Consulting. SQL auf Hadoop Oliver Gehlert. 2014 Ventum Consulting Beratung Results, no Excuses. Consulting Lösungen Grown from Experience. Ventum Consulting SQL auf Hadoop Oliver Gehlert 1 Ventum Consulting Daten und Fakten Results, no excuses Fachwissen Branchenkenntnis

Mehr

Hans-Peter Zorn Inovex GmbH. Wer gewinnt das SQL-Rennen auf der Hadoop-Strecke?

Hans-Peter Zorn Inovex GmbH. Wer gewinnt das SQL-Rennen auf der Hadoop-Strecke? Hans-Peter Zorn Inovex GmbH Wer gewinnt das SQL-Rennen auf der Hadoop-Strecke? War nicht BigData das gleiche NoSQL? Data Lake = Keine Struktur? flickr/matthewthecoolguy Oder gar ein Hadump? flickr/autohistorian

Mehr

SQL on Hadoop für praktikables BI auf Big Data.! Hans-Peter Zorn und Dr. Dominik Benz, Inovex Gmbh

SQL on Hadoop für praktikables BI auf Big Data.! Hans-Peter Zorn und Dr. Dominik Benz, Inovex Gmbh SQL on Hadoop für praktikables BI auf Big Data! Hans-Peter Zorn und Dr. Dominik Benz, Inovex Gmbh War nicht BigData das gleiche NoSQL? 2 Wie viele SQL Lösungen für Hadoop gibt es mittlerweile? 3 ! No SQL!?

Mehr

Big-Data-Technologien - Überblick - Prof. Dr. Jens Albrecht

Big-Data-Technologien - Überblick - Prof. Dr. Jens Albrecht Big-Data-Technologien - Überblick - Quelle: http://www.ingenieur.de/panorama/fussball-wm-in-brasilien/elektronischer-fussball-smartphone-app-helfen-training Big-Data-Anwendungen im Unternehmen Logistik

Mehr

WEBINAR@LUNCHTIME THEMA: SAS TOOLS FÜR DIE DATENVERARBEITUNG IN HADOOP ODER WIE REITET MAN ELEFANTEN?" HANS-JOACHIM EDERT

WEBINAR@LUNCHTIME THEMA: SAS TOOLS FÜR DIE DATENVERARBEITUNG IN HADOOP ODER WIE REITET MAN ELEFANTEN? HANS-JOACHIM EDERT WEBINAR@LUNCHTIME THEMA: SAS TOOLS FÜR DIE DATENVERARBEITUNG IN HADOOP ODER WIE REITET MAN ELEFANTEN?" Copyr i g ht 2012, SAS Ins titut e Inc. All rights res er ve d. HANS-JOACHIM EDERT EBINAR@LUNCHTIME

Mehr

Oracle Data Warehouse Mit Big Data neue Horizonte für das Data Warehouse ermöglichen

Oracle Data Warehouse Mit Big Data neue Horizonte für das Data Warehouse ermöglichen DATA WAREHOUSE Oracle Data Warehouse Mit Big Data neue Horizonte für das Data Warehouse ermöglichen Alfred Schlaucher, Detlef Schroeder DATA WAREHOUSE Themen Big Data Buzz Word oder eine neue Dimension

Mehr

Big Data Informationen neu gelebt

Big Data Informationen neu gelebt Seminarunterlage Version: 1.01 Copyright Version 1.01 vom 21. Mai 2015 Dieses Dokument wird durch die veröffentlicht. Copyright. Alle Rechte vorbehalten. Alle Produkt- und Dienstleistungs-Bezeichnungen

Mehr

Peter Dikant mgm technology partners GmbH. Echtzeitsuche mit Hadoop und Solr

Peter Dikant mgm technology partners GmbH. Echtzeitsuche mit Hadoop und Solr Peter Dikant mgm technology partners GmbH Echtzeitsuche mit Hadoop und Solr ECHTZEITSUCHE MIT HADOOP UND SOLR PETER DIKANT MGM TECHNOLOGY PARTNERS GMBH WHOAMI peter.dikant@mgm-tp.com Java Entwickler seit

Mehr

Hadoop. Simon Prewo. Simon Prewo

Hadoop. Simon Prewo. Simon Prewo Hadoop Simon Prewo Simon Prewo 1 Warum Hadoop? SQL: DB2, Oracle Hadoop? Innerhalb der letzten zwei Jahre hat sich die Datenmenge ca. verzehnfacht Die Klassiker wie DB2, Oracle usw. sind anders konzeptioniert

Mehr

Einführung in Hadoop

Einführung in Hadoop Einführung in Hadoop Inhalt / Lern-Ziele Übersicht: Basis-Architektur von Hadoop Einführung in HDFS Einführung in MapReduce Ausblick: Hadoop Ökosystem Optimierungen Versionen 10.02.2012 Prof. Dr. Christian

Mehr

Big Data. Prof. Robert Jäschke Forschungszentrum L3S Leibniz Universität Hannover

Big Data. Prof. Robert Jäschke Forschungszentrum L3S Leibniz Universität Hannover Big Data Prof. Robert Jäschke Forschungszentrum L3S Leibniz Universität Hannover Agenda Was ist Big Data? Parallele Programmierung Map/Reduce Der Big Data Zoo 2 3Vs oder: Was ist Big Data? Deutsche Telekom:

Mehr

Hadoop aus IT-Operations Sicht Teil 1 Hadoop-Grundlagen

Hadoop aus IT-Operations Sicht Teil 1 Hadoop-Grundlagen Hadoop aus IT-Operations Sicht Teil 1 Hadoop-Grundlagen Brownbag am Freitag, den 26.07.2013 Daniel Bäurer inovex GmbH Systems Engineer Wir nutzen Technologien, um unsere Kunden glücklich zu machen. Und

Mehr

Hadoop. Eine Open-Source-Implementierung von MapReduce und BigTable. von Philipp Kemkes

Hadoop. Eine Open-Source-Implementierung von MapReduce und BigTable. von Philipp Kemkes Hadoop Eine Open-Source-Implementierung von MapReduce und BigTable von Philipp Kemkes Hadoop Framework für skalierbare, verteilt arbeitende Software Zur Verarbeitung großer Datenmengen (Terra- bis Petabyte)

Mehr

NoSQL-Datenbanken und Hadoop im Zusammenspiel mit dem Data Warehouse

NoSQL-Datenbanken und Hadoop im Zusammenspiel mit dem Data Warehouse NoSQL-Datenbanken und Hadoop im Zusammenspiel mit dem Data Warehouse Carsten Czarski Oracle Deutschland B.V. & Co KG Big Data Betrachten von Daten die bislang nicht betrachtet wurden

Mehr

Freiberuflicher IT-Berater Schwerpunkte: Unix, Oracle, Netzwerk. www.jj-it.de. www.jj-it.de. Dipl.-Inform. Joachim Jäckel

Freiberuflicher IT-Berater Schwerpunkte: Unix, Oracle, Netzwerk. www.jj-it.de. www.jj-it.de. Dipl.-Inform. Joachim Jäckel Freiberuflicher Schwerpunkte: Unix, Oracle, Netzwerk 2005 1 Testaufbauten von Oracle 10g RAC auf preiswerter Hardware 2 3 Typisches Cluster System Clients Public Network Node A Node B Cluster Interconnect

Mehr

Big Data Hype und Wirklichkeit Bringtmehrauchmehr?

Big Data Hype und Wirklichkeit Bringtmehrauchmehr? Big Data Hype und Wirklichkeit Bringtmehrauchmehr? Günther Stürner, Vice President Sales Consulting 1 Copyright 2011, Oracle and/or its affiliates. All rights Überschrift 2 Copyright 2011, Oracle and/or

Mehr

Big Data in a Nutshell. Dr. Olaf Flebbe of ät oflebbe.de

Big Data in a Nutshell. Dr. Olaf Flebbe of ät oflebbe.de Big Data in a Nutshell Dr. Olaf Flebbe of ät oflebbe.de Zu mir Bigdata Projekt, benutzt Apache Bigtop Linux seit Anfang vor Minix/ATARI Linuxtag 2001? Promoviert in Computational Physics in Tü Seit Jan

Mehr

EXASOL @ Symposium on Scalable Analytics. www.exasol.com. Skalierbare Analysen mit EXASolution

EXASOL @ Symposium on Scalable Analytics. www.exasol.com. Skalierbare Analysen mit EXASolution EXASOL @ Symposium on Scalable Analytics Skalierbare Analysen mit EXASolution EXASOL AG Wer sind wir R&D: + seit 2000 + laufend Forschungsprojekte Produkt: Analytische Datenbank EXASolution Focus auf Komplexität

Mehr

on Azure mit HDInsight & Script Ac2ons

on Azure mit HDInsight & Script Ac2ons Willkommen beim #GAB 2015! on Azure mit HDInsight & Script Ac2ons Lokale Sponsoren: HansPeter Grahsl Netconomy Entwickler & Berater FH CAMPUS 02 Twi9er: @hpgrahsl Überblick Inhalte Was ist HDInsight? Wozu

Mehr

Hadoop Eine Erweiterung für die Oracle DB?

Hadoop Eine Erweiterung für die Oracle DB? Hadoop Eine Erweiterung für die Oracle DB? Nürnberg, 18.11.2015, Matthias Fuchs Sensitive Über mich 10+ Jahre Erfahrung mit Oracle Oracle Certified Professional Exadata Certified Oracle Engineered Systems

Mehr

Big Data Mythen und Fakten

Big Data Mythen und Fakten Big Data Mythen und Fakten Mario Meir-Huber Research Analyst, IDC Copyright IDC. Reproduction is forbidden unless authorized. All rights reserved. About me Research Analyst @ IDC Author verschiedener IT-Fachbücher

Mehr

Spark, Impala und Hadoop in der Kreditrisikoberechnung

Spark, Impala und Hadoop in der Kreditrisikoberechnung Spark, Impala und Hadoop in der Kreditrisikoberechnung Big Data In-Memory-Technologien für mittelgroße Datenmengen TDWI München, 22. Juni 2015 Joschka Kupilas, Data Scientist, Adastra GmbH 2 Inhalt Vorwort

Mehr

Big Data in Azure. Ein Beispiel mit HD Insight. Ralf Stemmer

Big Data in Azure. Ein Beispiel mit HD Insight. Ralf Stemmer Big in Azure Ein Beispiel mit HD Insight Ralf Stemmer Agenda owas ist Big? Was ist HD Insight? owelche Probleme kann man damit lösen? odemo Was ist Big? Was ist HD Insight? Datenexplosion - Rasanter Zuwachs

Mehr

Cloud-Computing. 1. Definition 2. Was bietet Cloud-Computing. 3. Technische Lösungen. 4. Kritik an der Cloud. 2.1 Industrie 2.

Cloud-Computing. 1. Definition 2. Was bietet Cloud-Computing. 3. Technische Lösungen. 4. Kritik an der Cloud. 2.1 Industrie 2. Cloud Computing Frank Hallas und Alexander Butiu Universität Erlangen Nürnberg, Lehrstuhl für Hardware/Software CoDesign Multicorearchitectures and Programming Seminar, Sommersemester 2013 1. Definition

Mehr

Performance Tuning & Scale-Out mit MySQL

Performance Tuning & Scale-Out mit MySQL Performance Tuning & Scale-Out mit MySQL Erfa-Gruppe Internet Briefing 2. März 2010 Oli Sennhauser Senior MySQL Consultant, FromDual oli.sennhauser@fromdual.com www.fromdual.com 1 Inhalt Allgemeines zu

Mehr

Standardsoftware. SAP Basisarchitektur. Prof. Dr. Bernhard Schiefer 2-1

Standardsoftware. SAP Basisarchitektur. Prof. Dr. Bernhard Schiefer 2-1 Standardsoftware SAP Basisarchitektur Prof. Dr. Bernhard Schiefer 2-1 SAP Client/Server Dreistufige Rechnerhierarchie Lesen in der DB und Aktualisierung der Puffer Datenbankänderung Zentrale DB (speichert

Mehr

IBM Informix Tuning und Monitoring

IBM Informix Tuning und Monitoring Seminarunterlage Version: 11.01 Copyright Version 11.01 vom 25. Juli 2012 Dieses Dokument wird durch die veröffentlicht. Copyright. Alle Rechte vorbehalten. Alle Produkt- und Dienstleistungs-Bezeichnungen

Mehr

Big Data Anwendungen Chancen und Risiken

Big Data Anwendungen Chancen und Risiken Big Data Anwendungen Chancen und Risiken Dr. Kurt Stockinger Studienleiter Data Science, Dozent für Informatik Zürcher Hochschule für Angewandte Wissenschaften Big Data Workshop Squeezing more out of Data

Mehr

Erfahrungsbericht: Umstieg von RDBMS auf Big Data-Technologien

Erfahrungsbericht: Umstieg von RDBMS auf Big Data-Technologien Wir unternehmen IT. Erfahrungsbericht: Umstieg von RDBMS auf Big Data-Technologien Karlsruhe, 30.09.2015 $id thgreiner Thorsten Greiner Teamleiter Software Development ConSol* Software GmbH, Düsseldorf

Mehr

!"#$"%&'()*$+()',!-+.'/',

!#$%&'()*$+()',!-+.'/', Soziotechnische Informationssysteme 5. Facebook, Google+ u.ä. Inhalte Historisches Relevanz Relevante Technologien Anwendungsarchitekturen 4(5,12316,7'.'0,!.80/6,9*$:'0+$.;.,&0$'0, 3, Historisches Facebook

Mehr

Apache Hadoop. Distribute your data and your application. Bernd Fondermann freier Software Architekt bernd.fondermann@brainlounge.de berndf@apache.

Apache Hadoop. Distribute your data and your application. Bernd Fondermann freier Software Architekt bernd.fondermann@brainlounge.de berndf@apache. Apache Hadoop Distribute your data and your application Bernd Fondermann freier Software Architekt bernd.fondermann@brainlounge.de berndf@apache.org Apache The Apache Software Foundation Community und

Mehr

Archive / Backup System für OpenVMS

Archive / Backup System für OpenVMS Archive / Backup System für OpenVMS DECUS Symposium 2002 Bonn Vortrag-Nr. 3C04 Günther Fröhlin Compaq Computer Corporation Colorado Springs, USA 1 Highlights V4.0 Auslieferung Januar 2002 Hauptversion

Mehr

ETL in den Zeiten von Big Data

ETL in den Zeiten von Big Data ETL in den Zeiten von Big Data Dr Oliver Adamczak, IBM Analytics 1 1 Review ETL im Datawarehouse 2 Aktuelle Herausforderungen 3 Future of ETL 4 Zusammenfassung 2 2015 IBM Corporation ETL im Datawarehouse

Mehr

S A P B W O N H A N A P R O O F O F C O N C E P T B E I S. O L I V E R

S A P B W O N H A N A P R O O F O F C O N C E P T B E I S. O L I V E R S A P B W O N H A N A P R O O F O F C O N C E P T B E I S. O L I V E R S T E F A N M A R K 07.07.2015 F O L I E 1 V O N 2 7 F I R M E N P O R T R A I T S. O L I V E R GESCHICHTE F O L I E 2 V O N 2 7 F

Mehr

Big Data Plattformen für polystrukturierte Daten neue Chancen und Herausforderungen

Big Data Plattformen für polystrukturierte Daten neue Chancen und Herausforderungen Big Data Plattformen für polystrukturierte Daten neue Chancen und Herausforderungen Oracle DWH-Konferenz 21. März 2012 Dr. Carsten Bange Gründer & Geschäftsführer BARC Big Data bietet Methoden und Technologien

Mehr

Business Mehrwerte von SAP HANA

Business Mehrwerte von SAP HANA Business Mehrwerte von SAP HANA von der Technologie zum Geschäft Halle, 07.05.2013 2013 GISA GmbH Leipziger Chaussee 191 a 06112 Halle (Saale) www.gisa.de Agenda GISA im Überblick Was ist SAP HANA? Was

Mehr

Analytische Datenbanken und Appliances als Engine für erfolgreiche Business Intelligence

Analytische Datenbanken und Appliances als Engine für erfolgreiche Business Intelligence Analytische Datenbanken und Appliances als Engine für erfolgreiche Business Intelligence IBM Netezza Roadshow 30. November 2011 Carsten Bange Gründer & Geschäftsführer BARC Die Krise hat die Anforderungen

Mehr

1 Copyright 2012, Oracle and/or its affiliates. All rights reserved. ileana.somesan@oracle.com

1 Copyright 2012, Oracle and/or its affiliates. All rights reserved. ileana.somesan@oracle.com 1 Copyright 2012, Oracle and/or its affiliates. All rights reserved. Oracle Datenbanken in der Oracle Public Cloud nutzen Ileana Someşan Systemberaterin ORACLE Deutschland The following is intended to

Mehr

Smartphone Entwicklung mit Android und Java

Smartphone Entwicklung mit Android und Java Smartphone Entwicklung mit Android und Java predic8 GmbH Moltkestr. 40 53173 Bonn Tel: (0228)5552576-0 www.predic8.de info@predic8.de Was ist Android Offene Plattform für mobile Geräte Software Kompletter

Mehr

Hochverfügbarkeit mit Windows Server vnext. Carsten Rachfahl Microsoft Hyper-V MVP

Hochverfügbarkeit mit Windows Server vnext. Carsten Rachfahl Microsoft Hyper-V MVP Hochverfügbarkeit mit Windows Server vnext Carsten Rachfahl Microsoft Hyper-V MVP Carsten Rachfahl www.hyper-v-server.de Roling Cluster Upgrade Herausforderung: Update eines Failover Clusters ohne Downtime

Mehr

Portierung einer DB2/VM-Datenbank nach DB2 unter zlinux 4 Jahre später - Wie würde ich heute vorgehen?

Portierung einer DB2/VM-Datenbank nach DB2 unter zlinux 4 Jahre später - Wie würde ich heute vorgehen? Portierung einer DB2/VM-Datenbank nach DB2 unter zlinux 4 Jahre später - Wie würde ich heute vorgehen? Tipps aus der Praxis zur Anwendungsentwicklung, Migration und Performanceuntersuchung 1 Einleitung

Mehr

PVFS (Parallel Virtual File System)

PVFS (Parallel Virtual File System) Management grosser Datenmengen PVFS (Parallel Virtual File System) Thorsten Schütt thorsten.schuett@zib.de Management grosser Datenmengen p.1/?? Inhalt Einführung in verteilte Dateisysteme Architektur

Mehr

WISSENSWERTES ÜBER WINDOWS SCALE-OUT FILE SERVER

WISSENSWERTES ÜBER WINDOWS SCALE-OUT FILE SERVER WISSENSWERTES ÜBER WINDOWS SCALE-OUT FILE SERVER AGENDA 01 File Server Lösungen mit Windows Server 2012 R2 02 Scale-out File Server 03 SMB 3.0 04 Neue File Server Features mit Windows Server 2016 05 Storage

Mehr

Symbiose hybrider Architekturen im Zeitalter digitaler Transformation. Hannover, 18.03.2015

Symbiose hybrider Architekturen im Zeitalter digitaler Transformation. Hannover, 18.03.2015 Symbiose hybrider Architekturen im Zeitalter digitaler Transformation Hannover, 18.03.2015 Business Application Research Center (BARC) B (Analystengruppe Europas führendes IT-Analysten- und -Beratungshaus

Mehr

Oracle BI&W Referenz Architektur Big Data und High Performance Analytics

Oracle BI&W Referenz Architektur Big Data und High Performance Analytics DATA WAREHOUSE Oracle BI&W Referenz Architektur Big Data und High Performance Analytics Alfred Schlaucher, Oracle Scale up Unternehmensdaten zusammenfassen Noch mehr Informationen

Mehr

Review Freelancer-Workshop: Fit für Big Data. Mittwoch, 29.04.2015 in Hamburg

Review Freelancer-Workshop: Fit für Big Data. Mittwoch, 29.04.2015 in Hamburg Review Freelancer-Workshop: Fit für Big Data Mittwoch, 29.04.2015 in Hamburg Am Mittwoch, den 29.04.2015, hatten wir von productive-data in Zusammenarbeit mit unserem langjährigen Partner Informatica zu

Mehr

DATA WAREHOUSE. Big Data Alfred Schlaucher, Oracle

DATA WAREHOUSE. Big Data Alfred Schlaucher, Oracle DATA WAREHOUSE Big Data Alfred Schlaucher, Oracle Scale up Unternehmensdaten zusammenfassen Noch mehr Informationen aus Unternehmens- Daten ziehen! Datenmengen, Performance und Kosten Daten als Geschäftsmodell

Mehr

Planung auf Aufbau von SharePoint-Suchinfrastrukturen

Planung auf Aufbau von SharePoint-Suchinfrastrukturen Building & Connecting Know-how 16.-17. Februar 2011, München Planung auf Aufbau von SharePoint-Suchinfrastrukturen Fabian Moritz SharePoint MVP Partner: Veranstalter: Aufbau von Suchplattformen Planung

Mehr

Echtzeiterkennung von Cyber-Angriffen auf IT-Infrastrukturen. Frank Irnich SAP Deutschland

Echtzeiterkennung von Cyber-Angriffen auf IT-Infrastrukturen. Frank Irnich SAP Deutschland Echtzeiterkennung von Cyber-Angriffen auf IT-Infrastrukturen Frank Irnich SAP Deutschland SAP ist ein globales Unternehmen... unser Fokusgebiet... IT Security für... 1 globales Netzwerk > 70 Länder, >

Mehr

OpenStack bei der SAP SE

OpenStack bei der SAP SE OpenStack bei der SAP SE Integration bestehender Dienste in OpenStack dank Workflow Engine und angepasstem Webinterface 23. Juni 2015 Christian Wolter Linux Consultant B1 Systems GmbH wolter@b1-systems.de

Mehr

Werkzeuge für Datenbank Handwerker: IBM Data Studio und IBM Optim QWT

Werkzeuge für Datenbank Handwerker: IBM Data Studio und IBM Optim QWT Werkzeuge für Datenbank Handwerker: IBM Data Studio und IBM Optim QWT Neue Technologien effizient nutzen Ehningen, 3. Juli 2014 Rodney Krick rk@aformatik.de aformatik Training & Consulting GmbH & Co. KG

Mehr

Vorwort zur 5. Auflage... 15 Über den Autor... 16

Vorwort zur 5. Auflage... 15 Über den Autor... 16 Vorwort zur 5. Auflage...................................... 15 Über den Autor............................................ 16 Teil I Grundlagen.............................................. 17 1 Einführung

Mehr

Performanceoptimierung mit Exadata Verarbeitung extremer Datenmengen mit PL/SQL basierter Datenbewirtschaftung (Erfahrungsbericht)

Performanceoptimierung mit Exadata Verarbeitung extremer Datenmengen mit PL/SQL basierter Datenbewirtschaftung (Erfahrungsbericht) Performanceoptimierung mit Exadata Verarbeitung extremer Datenmengen mit PL/SQL basierter Datenbewirtschaftung (Erfahrungsbericht) Christian Haag, DATA MART Consulting Consulting Manager Oracle DWH Team

Mehr

ANDREAS PROUZA. Wien, 2015-03-27. andreaspr@aon.at andreas@prouza.at. http://www.prouza.at

ANDREAS PROUZA. Wien, 2015-03-27. andreaspr@aon.at andreas@prouza.at. http://www.prouza.at DB2 & SQL E I N F Ü H R U N G T U N I N G O P T I M I E R U N G S E C R E T S ANDREAS PROUZA andreaspr@aon.at andreas@prouza.at http://www.prouza.at Wien, 2015-03-27 1 Inhaltsverzeichnis 1 Inhaltsverzeichnis...

Mehr

Andrea Held. Virtualisierung im Oracle-Umfeld Virtualisierungslayer Voraussetzungen Schnittstellen Workload Management Grid Control

Andrea Held. Virtualisierung im Oracle-Umfeld Virtualisierungslayer Voraussetzungen Schnittstellen Workload Management Grid Control Andrea Held Virtualisierung im Oracle-Umfeld Virtualisierungslayer Voraussetzungen Schnittstellen Workload Management Grid Control 1 Einzelne Server ausgelegt auf Lastspitzen Niedrige durchschnittliche

Mehr

Was ist Windows Azure? (Stand Juni 2012)

Was ist Windows Azure? (Stand Juni 2012) Was ist Windows Azure? (Stand Juni 2012) Windows Azure Microsofts Cloud Plattform zu Erstellung, Betrieb und Skalierung eigener Cloud-basierter Anwendungen Cloud Services Laufzeitumgebung, Speicher, Datenbank,

Mehr

HERZLICH WILLKOMMEN SHAREPOINT 2013 - DEEP DIVE FOR ADMINS 11.09.2012 IOZ AG 2

HERZLICH WILLKOMMEN SHAREPOINT 2013 - DEEP DIVE FOR ADMINS 11.09.2012 IOZ AG 2 11.09.2012 IOZ AG 1 HERZLICH WILLKOMMEN SHAREPOINT 2013 - DEEP DIVE FOR ADMINS 11.09.2012 IOZ AG 2 AGENDA Über mich Architekturänderungen Systemvoraussetzungen Migration Fragen 11.09.2012 IOZ AG 3 ÜBER

Mehr

Seminar in der Seminarreihe Business Intelligence 1. OLAP und Datawarehousing

Seminar in der Seminarreihe Business Intelligence 1. OLAP und Datawarehousing Seminar in der Seminarreihe Business Intelligence 1 OLAP und Datawarehousing OLAP & Warehousing Die wichtigsten Produkte Die Gliederung Produkt Bewertung & Vergleiche Die Marktentwicklung Der aktuelle

Mehr

Hadoop I/O. Datenintegrität Kompression Serialisierung Datei-basierte Datenstrukturen. 14.02.2012 Prof. Dr. Christian Herta 1/29

Hadoop I/O. Datenintegrität Kompression Serialisierung Datei-basierte Datenstrukturen. 14.02.2012 Prof. Dr. Christian Herta 1/29 Hadoop I/O Datenintegrität Kompression Serialisierung Datei-basierte Datenstrukturen 14.02.2012 Prof. Dr. Christian Herta 1/29 Data I/O und Hadoop Allgemeine Techniken Data I/O Datenintegrität Kompression

Mehr

SaaS-Referenzarchitektur. iico-2013-berlin

SaaS-Referenzarchitektur. iico-2013-berlin SaaS-Referenzarchitektur iico-2013-berlin Referent Ertan Özdil Founder / CEO / Shareholder weclapp die Anforderungen 1.000.000 registrierte User 3.000 gleichzeitig aktive user Höchste Performance Hohe

Mehr

Hadoop Demo HDFS, Pig & Hive in Action. Oracle DWH Konferenz 2014 Carsten Herbe

Hadoop Demo HDFS, Pig & Hive in Action. Oracle DWH Konferenz 2014 Carsten Herbe Hadoop Demo HDFS, Pig & Hive in Action Oracle DWH Konferenz 2014 Carsten Herbe Wir wollen eine semi-strukturierte Textdatei in Hadoop verarbeiten und so aufbereiten, dass man die Daten relational speichern

Mehr

Clouds. Erwartungen der Nutzer. Wolkig bis Heiter. (c) 2013, Peter Sturm, Universität Trier. Er ist verwöhnt! Er ist nicht dankbar!

Clouds. Erwartungen der Nutzer. Wolkig bis Heiter. (c) 2013, Peter Sturm, Universität Trier. Er ist verwöhnt! Er ist nicht dankbar! Clouds Wolkig bis Heiter Erwartungen der Nutzer Er ist verwöhnt! Verfügbarkeit Viele Anwendungen Intuitive Interfaces Hohe Leistung Er ist nicht dankbar! Mehr! Mehr! Mehr! Moore 1 Erwartungen der Entwickler

Mehr

Willkommen zum IBM DB2 Newsletter

Willkommen zum IBM DB2 Newsletter Liebe Leserinnen und Leser, Willkommen zum IBM DB2 Newsletter herzlich Willkommen zum 3ten DB2 NL. Aufgrund der Urlaubszeit wurden einige Themen auf die nächsten Ausgaben verschoben, bedingt durch die

Mehr

KASPERSKY SECURITY FOR VIRTUALIZATION 2015

KASPERSKY SECURITY FOR VIRTUALIZATION 2015 KASPERSKY SECURITY FOR VIRTUALIZATION 2015 Leistung, Kosten, Sicherheit: Bessere Performance und mehr Effizienz beim Schutz von virtualisierten Umgebungen AGENDA - Virtualisierung im Rechenzentrum - Marktübersicht

Mehr

ALL NEW GROUNDWORK 7.0.2

ALL NEW GROUNDWORK 7.0.2 ALL NEW GROUNDWORK 7.0.2 11 gute Gründe für den Umstieg / Upgrade 1. Benutzerfreundlichkeit 2. Performance 3. Sicherheit 4. CloudHub 1.3 5. Kostenloser Upgrade 6. Business Service Management 7. Authentifikation

Mehr

Dokumentenorientierte Datenbanken - MongoDB

Dokumentenorientierte Datenbanken - MongoDB Dokumentenorientierte Datenbanken - MongoDB Jan Hentschel Ultra Tendency UG Übersicht Dokumente sind unabhängige Einheiten Bessere Performance (zusammengehörige Daten werden gemeinsam gelesen) Objektmodell

Mehr

Datenbearbeitung in der Cloud anhand von Apache Hadoop Hochschule Mannheim

Datenbearbeitung in der Cloud anhand von Apache Hadoop Hochschule Mannheim Tobias Neef Cloud-Computing Seminar Hochschule Mannheim WS0910 1/23 Datenbearbeitung in der Cloud anhand von Apache Hadoop Hochschule Mannheim Tobias Neef Fakultät für Informatik Hochschule Mannheim tobnee@gmail.com

Mehr

Stratosphere. Next-Generation Big Data Analytics Made in Germany

Stratosphere. Next-Generation Big Data Analytics Made in Germany Stratosphere Next-Generation Big Data Analytics Made in Germany Robert Metzger Stratosphere Core Developer Technische Universität Berlin Ronald Fromm Head of Big Data Science Telekom Innovation Laboratories

Mehr

Big Data und SQL - das passt! Philipp Loer ORDIX AG Paderborn

Big Data und SQL - das passt! Philipp Loer ORDIX AG Paderborn Schlüsselworte Hadoop, Hive, Sqoop, SQL Big Data und SQL - das passt! Philipp Loer ORDIX AG Paderborn Einleitung In diesem Vortrag werden, nach einer kurzen Einführung in Apache Hadoop, die beiden Werkzeuge

Mehr

Das Zettabyte. CeBIT 2011. Dr. Wolfgang Martin Analyst, ibond Partner und Ventana Research Advisor

Das Zettabyte. CeBIT 2011. Dr. Wolfgang Martin Analyst, ibond Partner und Ventana Research Advisor Das Zettabyte CeBIT 2011 Dr. Wolfgang Martin Analyst, ibond Partner und Ventana Research Advisor Das Zetabyte: analytische Datenbanken Die Datenflut. Analytische Datenbanken: Was ist neu? Analytische Datenbanken:

Mehr

Oracle Business Intelligence (OBIEE) 12c Ein erster Einblick in die neue Reporting-Engine von Oracle

Oracle Business Intelligence (OBIEE) 12c Ein erster Einblick in die neue Reporting-Engine von Oracle Oracle Business Intelligence (OBIEE) 12c Ein erster Einblick in die neue Reporting-Engine von Oracle David Michel Consultant Business Intelligence, Apps Associates GmbH Apps Associates Apps Associates

Mehr

Portal for ArcGIS - Eine Einführung

Portal for ArcGIS - Eine Einführung 2013 Europe, Middle East, and Africa User Conference October 23-25 Munich, Germany Portal for ArcGIS - Eine Einführung Dr. Gerd van de Sand Dr. Markus Hoffmann Einsatz Portal for ArcGIS Agenda ArcGIS Plattform

Mehr

NoSQL mit Postgres 15. Juni 2015

NoSQL mit Postgres 15. Juni 2015 Tag der Datenbanken 15. Juni 2015 Dipl.-Wirt.-Inform. Agenda l Vorstellung l Marktübersicht l Warum PostgreSQL? l Warum NoSQL? l Beispielanwendung Seite: 2 Vorstellung Dipl.-Wirt.-Inform. [1990] Erste

Mehr

June 2015. Automic Hadoop Agent. Data Automation - Hadoop Integration

June 2015. Automic Hadoop Agent. Data Automation - Hadoop Integration June 2015 Automic Hadoop Agent Data Automation - Hadoop Integration + Aufbau der Hadoop Anbindung + Was ist eigentlich ist MapReduce? + Welches sind die Stärken von Hadoop + Welches sind die Schwächen

Mehr

Open Source Data Center Virtualisierung mit OpenNebula. 05.03.2013 CeBIT 2013. Bernd Erk www.netways.de

Open Source Data Center Virtualisierung mit OpenNebula. 05.03.2013 CeBIT 2013. Bernd Erk www.netways.de Open Source Data Center Virtualisierung mit OpenNebula 05.03.2013 CeBIT 2013 Bernd Erk VORSTELLUNG NETWAYS NETWAYS! Firmengründung 1995! GmbH seit 2001! Open Source seit 1997! 35 Mitarbeiter! Spezialisierung

Mehr

Oracle Big Data Technologien Ein Überblick

Oracle Big Data Technologien Ein Überblick Oracle Big Data Technologien Ein Überblick Ralf Lange Global ISV & OEM Sales NoSQL: Eine kurze Geschichte Internet-Boom: Erste Ansätze selbstgebauter "Datenbanken" Google stellt "MapReduce"

Mehr

Erneuerungen und Innovatives von Symantec Rene Piuk / Johannes Bedrech Senior Consultants für Symantec / Altiris X-tech

Erneuerungen und Innovatives von Symantec Rene Piuk / Johannes Bedrech Senior Consultants für Symantec / Altiris X-tech Erneuerungen und Innovatives von Symantec Rene Piuk / Johannes Bedrech Senior Consultants für Symantec / Altiris X-tech Titelmasterformat Agenda durch Klicken What snewin ITMS 7.1 sinceoctober2011 09:15

Mehr

MapReduce in der Praxis

MapReduce in der Praxis MapReduce in der Praxis Rolf Daniel Seminar Multicore Programmierung 09.12.2010 1 / 53 Agenda Einleitung 1 Einleitung 2 3 Disco Hadoop BOOM 4 2 / 53 1 Einleitung 2 3 Disco Hadoop BOOM 4 3 / 53 Motivation

Mehr

In-Memory Datenbanken im Kontext komplexer Analytics Pojekte am Beispiel der Otto Group BI

In-Memory Datenbanken im Kontext komplexer Analytics Pojekte am Beispiel der Otto Group BI In-Memory Datenbanken im Kontext komplexer Analytics Pojekte am Beispiel der Otto Group BI Hanau, 25.02.2015 1 Titel der Präsentation, Name, Abteilung, Ort, xx. Monat 2014 Der Aufbau der Group BI Plattform

Mehr

Persönlichkeiten bei bluehands

Persönlichkeiten bei bluehands Persönlichkeiten bei Technologien bei Skalierbare Anwendungen mit Windows Azure GmbH & co.mmunication KG am@.de; posts..de/am 1 2 3 4 5 6 7 8 9 Immer mehr Mehr Performance Mehr Menge Mehr Verfügbarkeit

Mehr

BIW - Überblick. Präsentation und Discoverer Demonstration - Teil 1 - Humboldt Universität zu Berlin am 10. Juni 2004

BIW - Überblick. Präsentation und Discoverer Demonstration - Teil 1 - Humboldt Universität zu Berlin am 10. Juni 2004 BIW - Überblick Präsentation und Discoverer Demonstration - Teil 1 - Humboldt Universität zu Berlin am 10. Juni 2004 Annegret Warnecke Senior Sales Consultant Oracle Deutschland GmbH Berlin Agenda Überblick

Mehr

Storage-Trends am LRZ. Dr. Christoph Biardzki

Storage-Trends am LRZ. Dr. Christoph Biardzki Storage-Trends am LRZ Dr. Christoph Biardzki 1 Über das Leibniz-Rechenzentrum (LRZ) Seit 50 Jahren Rechenzentrum der Bayerischen Akademie der Wissenschaften IT-Dienstleister für Münchner Universitäten

Mehr

MySQL Cluster. Kai Voigt MySQL AB kai@mysql.com. Kiel, 17. Februar 2006

MySQL Cluster. Kai Voigt MySQL AB kai@mysql.com. Kiel, 17. Februar 2006 MySQL Cluster Kai Voigt MySQL AB kai@mysql.com Kiel, 17. Februar 2006 1 Agenda Warum? Wie? Wie genau? Was sonst? 2 Warum? 3 Kosten runter Hochverfügbarkeit (99,999%) Redundante Daten und Systeme Wiederherstellung

Mehr

Aufbau einer Testumgebung mit VMware Server

Aufbau einer Testumgebung mit VMware Server Aufbau einer Testumgebung mit VMware Server 1. Download des kostenlosen VMware Servers / Registrierung... 2 2. Installation der Software... 2 2.1 VMware Server Windows client package... 3 3. Einrichten

Mehr

Big Data: Solaranlagen reparieren Waschmaschinen? 2014 IBM Corporation

Big Data: Solaranlagen reparieren Waschmaschinen? 2014 IBM Corporation Big Data: Solaranlagen reparieren Waschmaschinen? Agenda Kurze Vorstellung Der Kunde und der ursprüngliche Ansatz Bisherige Architektur Vorgeschlagene Architektur Neue Aspekte der vorgeschlagenen Architektur

Mehr

Living Lab Big Data Konzeption einer Experimentierplattform

Living Lab Big Data Konzeption einer Experimentierplattform Living Lab Big Data Konzeption einer Experimentierplattform Dr. Michael May Berlin, 10.12.2012 Fraunhofer-Institut für Intelligente Analyseund Informationssysteme IAIS www.iais.fraunhofer.de Agenda n Ziele

Mehr

EXCHANGE 2013. Neuerungen und Praxis

EXCHANGE 2013. Neuerungen und Praxis EXCHANGE 2013 Neuerungen und Praxis EXCHANGE 2013 EXCHANGE 2013 NEUERUNGEN UND PRAXIS Kevin Momber-Zemanek seit September 2011 bei der PROFI Engineering Systems AG Cisco Spezialisierung Cisco Data Center

Mehr

Compliance erlaubt keine Wartezeit

Compliance erlaubt keine Wartezeit Compliance erlaubt keine Wartezeit Schnelle Analyse-Verfahren bei der HVB Unicredit AG Anwarul Haq Khan, 26. Mai 2015 Agenda (Stichpunkte) Wer ist Unicredit-HVB AG Compliance - Was ist das? Was waren die

Mehr

Möglichkeiten für bestehende Systeme

Möglichkeiten für bestehende Systeme Möglichkeiten für bestehende Systeme Marko Filler Bitterfeld, 27.08.2015 2015 GISA GmbH Leipziger Chaussee 191 a 06112 Halle (Saale) www.gisa.de Agenda Gegenüberstellung Data Warehouse Big Data Einsatz-

Mehr

Medienbruchfrei analysieren und dabei Karten als Visualisierungselement in BI anbieten

Medienbruchfrei analysieren und dabei Karten als Visualisierungselement in BI anbieten Medienbruchfrei analysieren und dabei Karten als Visualisierungselement in BI anbieten 4 Handeln 1 Überwachen 3 Alternativen modellieren/simulieren 2 Analysieren. Copyright 2012 Oracle and/or its affiliates.

Mehr

Einführung in Hadoop & MapReduce. Dr. Kathrin Spreyer Big Data Engineer

Einführung in Hadoop & MapReduce. Dr. Kathrin Spreyer Big Data Engineer Einführung in Hadoop & MapReduce Dr. Kathrin Spreyer Big Data Engineer München, 19.06.2013 Agenda Einleitung 1. HDFS 2. MapReduce 3. APIs 4. Hive & Pig 5. Mahout Tools aus Hadoop-Ökosystem 6. HBase 2 Worum

Mehr

Managed Cloud Services

Managed Cloud Services Managed Cloud Services Autor.: Monika Olschewski Whitepaper Version: 1.0 Erstellt am: 14.07.2010 ADACOR Hosting GmbH Kaiserleistrasse 51 63067 Offenbach am Main info@adacor.com www.adacor.com Cloud Services

Mehr

Cassandra Query Language (CQL)

Cassandra Query Language (CQL) Cassandra Query Language (CQL) Seminar: NoSQL Wintersemester 2013/2014 Cassandra Zwischenpräsentation 1 Gliederung Basic facts Datentypen DDL/DML ähnlich zu SQL Besonderheiten Basic facts CQL kurz für

Mehr

Hardware- und Software-Anforderungen IBeeS.ERP

Hardware- und Software-Anforderungen IBeeS.ERP Hardware- und Software-Anforderungen IBeeS.ERP IBeeS GmbH Stand 08.2015 www.ibees.de Seite 1 von 8 Inhalt 1 Hardware-Anforderungen für eine IBeeS.ERP - Applikation... 3 1.1 Server... 3 1.1.1 Allgemeines

Mehr

Vorstellung IBM Cognos 10.2. Oliver Linder Client Technical Professional Business Analytics

Vorstellung IBM Cognos 10.2. Oliver Linder Client Technical Professional Business Analytics Vorstellung IBM Cognos 10.2 Oliver Linder Client Technical Professional Business Analytics Agenda IBM Cognos 10.2 Architektur User Interfaces IBM Cognos Workspace IBM Cognos Workspace Advanced IBM Cognos

Mehr

Neues in Hyper-V Version 2

Neues in Hyper-V Version 2 Michael Korp Technical Evangelist Microsoft Deutschland GmbH http://blogs.technet.com/mkorp Neues in Hyper-V Version 2 - Virtualisieren auf die moderne Art - Windows Server 2008 R2 Hyper-V Robust Basis:

Mehr

Datenbanken (WS 2015/2016)

Datenbanken (WS 2015/2016) Datenbanken (WS 2015/2016) Klaus Berberich (klaus.berberich@htwsaar.de) Wolfgang Braun (wolfgang.braun@htwsaar.de) 0. Organisatorisches Dozenten Klaus Berberich (klaus.berberich@htwsaar.de) Sprechstunde

Mehr

Open Source Data Center Virtualisierung mit OpenNebula. 22.05.2013 LinuxTag Berlin. Bernd Erk www.netways.de

Open Source Data Center Virtualisierung mit OpenNebula. 22.05.2013 LinuxTag Berlin. Bernd Erk www.netways.de Open Source Data Center Virtualisierung mit OpenNebula 22.05.2013 LinuxTag Berlin Bernd Erk VORSTELLUNG NETWAYS NETWAYS! Firmengründung 1995! GmbH seit 2001! Open Source seit 1997! 38 Mitarbeiter! Spezialisierung

Mehr

Well-Balanced. Performance Tuning

Well-Balanced. Performance Tuning Well-Balanced Real Application Cluster Performance Tuning Über mich virtual7 GmbH Jürgen Bouché Zeppelinstraße 2 76185 Karlsruhe Tel.: +49 (721) 6190170 Fax.: +49 (721) 61901729 Email: jbouche@heine.de

Mehr

Configuration Management mit Verbosy 17.04.2013 OSDC 2013. Eric Lippmann www.netways.de

Configuration Management mit Verbosy 17.04.2013 OSDC 2013. Eric Lippmann www.netways.de Configuration Management mit Verbosy 17.04.2013 OSDC 2013 Eric Lippmann Kurzvorstellung NETWAYS Expertise OPEN SOURCE SYSTEMS MANAGEMENT OPEN SOURCE DATA CENTER Monitoring & Reporting Configuration Management

Mehr