Stefan Igel inovex GmbH. Hadoop in modern BI-Infrastrukturen
|
|
- Bernt Fromm
- vor 7 Jahren
- Abrufe
Transkript
1 Stefan Igel inovex GmbH Hadoop in modern BI-Infrastrukturen
2 BI-Plattform Access Standard Reporting Information Lifecycle Management Adhoc Queries /MB (SYNAPSE) << /MB (DWH) (Mass) Data Export DWH Oracle 11g EE Database Reporting Layer (Dependent Datamarts) Integration Layer (Core DWH) Acquisition Layer (Staging Area) Value: DWH als Langzeit-Archiv für Informationen Mass Data Aggregation Layer Mass Data Integration Layer Mass Data Acquisition Layer Volume: Hadoop als Kurzzeit-Archiv für Massendaten BI Source Systems Source Data WI Gateway Fileserver Replicated Source Data 51
3 Speichern: Gerne aber wie lange? Auch 500 TByte sind irgendwann einmal voll! IL separat für jede Verarbeitungsebene Je wertvoller die Daten, desto länger die Lebensdauer Bei >> Files hohe Anforderung ans Housekeeping in der SYNAPSE (s. u.) System Ebene Begründung Aufbewahrung Fileserver Import Nachladen 5 Tage Export Fachliche Anforderung 40 Tage SYNAPSE Acquisition Algorithmus / Nachberechnen 30 Tage Integration Fachliche Anforderung Tage Aggregate Nachladen 5 Tage DWH Acquisition Nachberechnen 30 Tage Integration Fachliche Anforderung 0,5-10 Jahre Reporting Fachliche Anforderung 0,5-10 Jahre 52
4 Mehrparteien- Betrieb Wer darf wann? Hadoop Job Scheduler Gleichmäßige Lastverteilung über die Zeit nach Prioritäten Verschiedene Anwendungen können konkurrierend betrieben werden Ermöglicht Adhoc-Queries mit definierten Ressourcen Mechanismus Default Capacity Fair Vergeben von Prioritäten pro Job Job-Queues mit festgelegten Prioritäten Funktionsfähig Ja Ja Ja Clusterauslastung Ja Nein Ja Gefahr von Starvation Ja Nein Nein Job-Queues und Pools mit Gewichten 53
5 Mehrparteien- Betrieb Wer darf überhaupt? Hadoop hat ein Zugriffsberechtigungskonzept angelehnt an POSIX (ohne sticky, setuid or setgid bits) für Files und Directories Hadoop hat keine eigene Benutzer-Authentifizierung Hadoop übernimmt user name (whoami) und group name (bash -c groups) vom aufrufenden Client-Prozess Authorisierung ist damit (nur) auf File- und Verzeichnisebene möglich Das schützt im Mehrparteienbetrieb vor versehentlichem Löschen oder Überschreiben fremder Dateien. Authorisierung muss auf Betriebssystem-Ebene konsequent umgesetzt sein Geeignetes Konzept für Tool -User oder Application Manager / Data Scientists This user identity mechanism combined with the permissions model allows a cooperative community to share file system resources in an organized fashion. 54
6 Best Practice Identifiziere dein BIG DATA Problem Etwas mehr schadet nicht: Alle Systeme müssen skalieren und benötigen Reserven, Namenode HA! Keep Your Ecosystem Simple, weniger kann mehr sein! Die Algorithmen bestimmen die Effizienz! Sorge für geordnete Verhältnisse im Cluster! 55
7 Agenda BI meets BIG DATA Jede Menge Blech: Die Hardware Was darf es denn sein: Das Hadoop Ecosystem Speichern, Mappen, Reduzieren Spielregeln im Cluster Der fleißige Handwerker Essenz 56
8 BI-Plattform Prozess-Steuerung Access Standard Reporting Adhoc Queries (Mass) Data Export DWH Oracle 11g EE Database Reporting Layer (Dependent Datamarts) Integration Layer (Core DWH) Acquisition Layer (Staging Area) ETL im DWH Mass Data Aggregation Layer Mass Data Integration Layer Mass Data Acquisition Layer Integration MR-Jobs in Hadoop BI Source Systems Source Data WI Gateway Fileserver Replicated Source Data 57
9 Prozess-Steuerung Anforderungen Steuerung von ETL-Prozessen im Batch-Mode Steuerung Datei-basierter Datenflüsse Verteilung der ETL-Algorithmen auf dem Cluster Integration in übergreifende Prozessketten Unterstützung des Information Lifecycle Managements (Housekeeping) Nachvollziehbarkeit von Ladeprozessen Fehler-Toleranz durch Wiederaufsetzbarkeit Technisches und fachliches Monitoring 58
10 Steuerung Azkaban (LinkedIn) PRO CONTRA Workflows können graphisch dargestellt und gedrilled werden Einfache Handhabung (Komplexes wird in Scripts ausgelagert) Startet Hadoop-Jobs und Anderes einfach als Unix-Prozesse Minimaler Funktionsumfang Keine Rechte und Zugriffs-Verwaltung Jobausführung nur Zeit-basiert Keine Redundanz (Azkaban-Server wird zum SPOF) Ressoucen (.jar files, pig scripts) werden durch Azkaban verwaltet und deployed 59
11 Steuerung Oozie (Yahoo!) PRO CONTRA Enge Integration mit Hadoop und M/R Kann mit unterschiedlichen Job-Typen umgehen: Java MR, PIG, Java, etc. Webservice- und Java-API Zeit- und Ereignis-basierte Job- Ausführung WEB-Konsole ist Read-Only, keine graphische Aufbereitung von Abhängigkeiten Ressoucen (.jar files, pig scripts) müssen manuell vor der Jobausführung auf dem HDFS deployed werden Müsste um File-Registierung erweitert werden 60
12 BI-Plattform Steuerung Steuerung der Verarbeitung und damit der Datenströme muss über den gesamten BI-Stack sichergestellt sein! Das richtige Werkzeug für die jeweilige Aufgabe: GEPPI = 1&1 EAI-Lösung (Workflow-Steuerung) FUNDI = Eigenentwicklung verlängerter Arm für Hadoop-Anbindung 61
13 Das richtige Werkzeug für die jeweilige Aufgabe PDI ( ETL-Jobs im DWH HDFS-Zugriff delegiert an Pentaho Kettle delegiert an FUNDI GEPPI = Workflow-Engine Übergreifende-Steuerung Functional Dependency Integrator Hadoop Job-Ausführung Data-Repository 62
14 FUNDI Swahili für... Der fleißige Handwerker FUNDI File-Registration Register File & Metadata File Registration Functional Dependency Integrator Search for matching files Data Files 63
15 FUNDI Swahili für... Der fleißige Handwerker FUNDI Job-Run get Jar/PIG Metadata Input-Filenames Register Output-Files & Metadata Inp. Data Files Run Job(name) Functional Dependency Integrator Start MR Job Outp Data Files 64
16 FUNDI Swahili für... Der fleißige Handwerker FUNDI Housekeeping Check Config & Metadata Housekeeping Functional Dependency Integrator Remove matching files Data Files 65
17 FUNDI Swahili für... Der fleißige Handwerker Fundi Job-Ketten (Das EVA-Prinzip) Metadata for Job-Run, Inp.-Files, Outp.-Files E V A Named-Input Named-Output Configuration e.g. Path, Filenames, Jar/PIG-Script, Settings 66
18 Monitoring mit Ganglia :00 Uhr 67
19 Best Practice Identifiziere dein BIG DATA Problem Etwas mehr schadet nicht: Alle Systeme müssen skalieren und benötigen Reserven, Namenode HA! Keep Your Ecosystem Simple, weniger kann mehr sein! Die Algorithmen bestimmen die Effizienz! Sorge für geordnete Verhältnisse im Cluster! Es geht auch ohne Skript-Wüste und cron-jobs! 68
20 Agenda BI meets BIG DATA Jede Menge Blech: Die Hardware Was darf es denn sein: Das Hadoop Ecosystem Speichern, Mappen, Reduzieren Spielregeln im Cluster Der fleißige Handwerker Essenz 69
21 Lange Rede kurzer Sinn: Die Aufgabe ist BIG! Hadoop verlangt ein neues Denken in allen IT-Bereichen: Operations, Entwicklung, QS, Binde alle Stakeholder möglichst früh in deine Planung ein! Know-how zum Entwickeln, Testen und Betreiben einer verteilten Umgebung muss erarbeitet werden! Reduziere Komplexität, wo möglich, es bleibt herausfordernd genug! Identifiziere dein Pilotprojekt! Bleibe nicht zu lange im Spielbetrieb, evaluiere gegen echte Anforderungen! 70
22 Die Belohnung: Hadoop beeindruckt! Hadoop und sein Ecosystem bieten hervorragende Lösungen für viele BIG DATA Probleme! 71
23 Der Nutzen Hadoop beeindruckt Massendatenverarbeitung bei 1&1 ist für Web- und Media-Analytics, Logfile-Verarbeitung und Datawarehousing mit Hadoop messbar performanter, kostengünstiger, skalierbarer, flexibler, und zukunftsfähiger. Vielen Dank! 72
24 Vielen Dank für eure Aufmerksamkeit 73
25 Aufgabenverteilung Aggregationen alle 6 Stunden >15000 Files/Tag ~ 3TB 74
Big Data: Hadoop im Unternehmenseinsatz bei. TDWI Roundtable Frankfurt, 13.09.2012 Patrick Thoma, inovex GmbH
Big Data: Hadoop im Unternehmenseinsatz bei TDWI Roundtable Frankfurt, 13.09.2012 Patrick Thoma, inovex GmbH inovex GmbH Profil inovex IT-Projekthaus individuelle IT-Dienstleistungen 1999 in Pforzheim
MehrHadoop im Unternehmenseinsatz. Präsentation von Dirk Schmid und Dr. Stefan Igel
Hadoop im Unternehmenseinsatz Präsentation von Dirk Schmid und Dr. Stefan Igel Dirk Internet affin seit 1997 durch, einem der zwei ersten Internetprovider Deutschlands. Softwarearchitekt bei der 1&1 Mediafactory
MehrHadoop in modernen BI-Infrastrukturen. Dr. Stefan Igel inovex GmbH
Hadoop in modernen BI-Infrastrukturen Dr. Stefan Igel inovex GmbH Stefan Seit 01/2005 als Projektleiter und Systemarchitekt bei inovex Seit 08/2009 als Business Engineer bei 1&1 Erstkontakt mit Hadoop
MehrHadoop in modernen BI-Infrastrukturen. Dr. Stefan Igel inovex GmbH
Hadoop in modernen BI-Infrastrukturen Dr. Stefan Igel inovex GmbH Zur Person Dr. Stefan Igel Seit 01/2005 als Projektleiter und Systemarchitekt bei inovex Seit 08/2009 als Business Engineer bei 1&1 Web.Intelligence
MehrOracle BI&W Referenz Architektur Big Data und High Performance Analytics
DATA WAREHOUSE Oracle BI&W Referenz Architektur Big Data und High Performance Analytics Alfred Schlaucher, Oracle Scale up Unternehmensdaten zusammenfassen Noch mehr Informationen
MehrOracle Data Integrator Ein Überblick
Oracle Data Integrator Ein Überblick Uwe Barz Christoph Jansen Hamburg, 15.04.2008 Basel Baden Bern Lausanne Zürich Düsseldorf Frankfurt/M. Freiburg i. Br. Hamburg München Stuttgart Wien Agenda Überblick
MehrBIG DATA IM RETAIL-SEKTOR AM BEISPIEL KASSENBONDATEN BUSINESS ANALYTICS DAY
BIG DATA IM RETAIL-SEKTOR AM BEISPIEL KASSENBONDATEN BUSINESS ANALYTICS DAY 08.03.2017 REWE Systems GmbH Jonas Freiknecht inovex GmbH Bernhard Schäfer AGENDA 1 / Vorstellung REWE Systems GmbH und inovex
MehrAgile Methoden als Erfolgsfaktor für BI und Big Data Projekte. Best Practices aus unseren Projekten. Dr. Stefan Igel Karlsruhe, 20.02.
Agile Methoden als Erfolgsfaktor für BI und Big Data Projekte Best Practices aus unseren Projekten Dr. Stefan Igel Karlsruhe, 20.02.2014 Agenda 1. Agile Ziele 2. Agile Teams 3. Agil BI-Projekte managen
MehrProblemstellung. Keine Chance! Ich brauche eine genaue Spezifikation und dann vielleicht in 3-4 Wochen können Sie einen erstes Beispiel haben!
Take aways Mit Power BI wird Excel zum zentralen Tool für Self- Service BI End-End Self-Service Lösungsszenarien werden erstmals möglich Der Information Worker erhält ein flexibles Toolset aus bekannten
MehrDATA WAREHOUSE. Big Data Alfred Schlaucher, Oracle
DATA WAREHOUSE Big Data Alfred Schlaucher, Oracle Scale up Unternehmensdaten zusammenfassen Noch mehr Informationen aus Unternehmens- Daten ziehen! Datenmengen, Performance und Kosten Daten als Geschäftsmodell
MehrData Warehousing. DWH Projekte. Ulf Leser Wissensmanagement in der Bioinformatik
Data Warehousing DWH Projekte Ulf Leser Wissensmanagement in der Bioinformatik Inhalt DWH Projekte Spezifika Die kritischen Punkte Warum scheitern DWH Projekte? Ulf Leser: Data Warehousing, Vorlesung,
MehrStudierenden-Kennzahlen im Griff dank flexiblem Reporting und Ad-hoc-Analysen
Praxistag für die öffentliche Verwaltung 2012 Titel Präsentation Studierenden-Kennzahlen im Griff dank flexiblem Reporting und Ad-hoc-Analysen Referenten-Info Gerhard Tschantré, Leiter Controllerdienste
MehrMarkus Feichtinger. Power Systems. Der Weg zu POWER! 2009 IBM Corporation
Markus Feichtinger Power Systems Der Weg zu POWER! Agenda Motivation Lösung Beispiel Export / Import - Überblick - Migration Beispiel XenoBridge - Überblick - Migration Benefits 2 Motivation Strategisch
MehrBUSINESS INTELLIGENCE (BI) MIT PENTAHO. Schneller, höher, weiter!
BUSINESS INTELLIGENCE (BI) MIT PENTAHO Schneller, höher, weiter! HERZLICH WILLKOMMEN ZUM WEBINAR Business Intelligence (BI) mit Pentaho Die Moderatoren Fragen über Chat Arved Wendt Teammanager Janina Kasten
MehrZeitlich abhängig von OWB?
Zeitlich abhängig von OWB? 24. April 2007 Beat Flühmann Trivadis AG > IT Lösungsanbieter» Application Development, Application Performance Management, Business Communication, Business Intelligence, Managed
MehrOracle Big Data Discovery Ein Überblick
Oracle Big Data Discovery Ein Überblick Hadoop Data Reservoir gewinnt weiter an Bedeutung Data Warehouse Bekannte Datenquellen Data Reservoir Entstehende Datenquellen Hadoop Umsatz und Forecast 49% CAGR,
MehrMicrosoft Azure Deutschland ist jetzt verfügbar -
Einordnung und Überblick Data Scientist Operationalisierung IT-Abteilung Anwendungsentwickler Der Data Scientist agil Tool seiner Wahl möglichst wenig Zeit Skalierung Code für die Operationalisierung Der
MehrDatawarehouse Architekturen. Einheitliche Unternehmenssicht
Datawarehouse Architekturen Einheitliche Unternehmenssicht Was ist Datawarehousing? Welches sind die Key Words? Was bedeuten sie? DATA PROFILING STAGING AREA OWB ETL OMB*PLUS SAS DI DATA WAREHOUSE DATA
MehrOracle Data Warehouse Mit Big Data neue Horizonte für das Data Warehouse ermöglichen
DATA WAREHOUSE Oracle Data Warehouse Mit Big Data neue Horizonte für das Data Warehouse ermöglichen Alfred Schlaucher, Detlef Schroeder DATA WAREHOUSE Themen Big Data Buzz Word oder eine neue Dimension
MehrORACLE CLOUD VERLEIHT ADF ANWENDUNGEN FLÜGEL. Andreas Koop CEO & Consultant Oracle Technologies
ORACLE CLOUD VERLEIHT ADF ANWENDUNGEN FLÜGEL CEO & Consultant Oracle Technologies DOAG 2013 Development, Bonn, 19.06.2013 ÜBER MICH CEO & Consultant Oracle Technologies Beratung, Training Oracle Technologie
MehrWelche BI-Architektur braucht Ihr Reporting?
Welche BI-Architektur braucht Ihr Reporting? Variante 1: Direkter Zugriff Keine redundanten Daten Schnelle Erkenntnisse Echte Daten für PoCs Echtzeit-Reporting ohne Zwischenstufen Belastung der operativen
MehrJune 2015. Automic Hadoop Agent. Data Automation - Hadoop Integration
June 2015 Automic Hadoop Agent Data Automation - Hadoop Integration + Aufbau der Hadoop Anbindung + Was ist eigentlich ist MapReduce? + Welches sind die Stärken von Hadoop + Welches sind die Schwächen
MehrEntwicklung und Deployment. Stefan Raabe DOAG Konferenz
Entwicklung und Deployment Stefan Raabe DOAG Konferenz 2017 22.11.2017 Agenda 1. Vorstellung 2. DWH Automatisierung 3. Möglichkeiten im ODI 4. Demo 5. Fazit 2 Vorstellung Stefan Raabe Selbstständiger Berater
MehrOracle XML Publisher
Oracle 1 Oracle übernimmt Generierung Verwaltung Verteilung der Geschäftsdokumente Rechnungen Invoice Check Print Schecks Etiketten Erfüllt die Anforderungen Reduziert Komplexität geringer Pflegeaufwand
MehrNoSQL-Datenbanken und Hadoop im Zusammenspiel mit dem Data Warehouse
NoSQL-Datenbanken und Hadoop im Zusammenspiel mit dem Data Warehouse Carsten Czarski Oracle Deutschland B.V. & Co KG Big Data Betrachten von Daten die bislang nicht betrachtet wurden
MehrIn-Memory Datenbanken im Kontext komplexer Analytics Pojekte am Beispiel der Otto Group BI
In-Memory Datenbanken im Kontext komplexer Analytics Pojekte am Beispiel der Otto Group BI Hanau, 25.02.2015 1 Titel der Präsentation, Name, Abteilung, Ort, xx. Monat 2014 Der Aufbau der Group BI Plattform
MehrImmer in Bewegung bleiben Oracle Managed File Transfer
Immer in Bewegung bleiben Oracle Managed File Transfer Michael Stapf DOAG 2014 Oracle Deutschland B.V. & Co. KG 18. November 2014 Safe Harbor Statement The following is intended to outline our general
MehrBig Data in der Praxis
Jonas Freiknecht Big Data in der Praxis Lösungen mit Hadoop, HBase und Hive Daten speichern, aufbereiten, visualisieren HANSER Vorwort XI 1 Einleitung 1 2 Big-Data 7 2.1 Historische Entstehung 8 2.2 Big-Data
MehrSQL oder NoSQL: Das ist die Frage! Oracle NoSQL Database
SQL oder NoSQL: Das ist die Frage! Oracle NoSQL Database Carsten Czarski Oracle Deutschland B.V. & Co KG Agenda NoSQL: Was ist das und wozu ist das gut? Anwendungsbereiche für NoSQL-Technologien,
MehrModellierung agiler Data Warehouses mit Data Vault Dani Schnider, Trivadis AG DOAG Konferenz 2015
Modellierung agiler Data Warehouses mit Data Vault Dani Schnider, Trivadis AG DOAG Konferenz 2015 BASEL BERN BRUGG DÜSSELDORF FRANKFURT A.M. FREIBURG I.BR. GENEVA HAMBURG COPENHAGEN LAUSANNE MUNICH STUTTGART
MehrOXO³ technische Aspekte der Oracle EMEA internen BI Implementierung
OXO³ technische Aspekte der Oracle EMEA internen BI Implementierung Bojan Milijaš (bojan.milijas@oracle.com) Senior Business Analyst (OCP) ORACLE Deutschland GmbH Kennen Sie das Sprichwort
MehrIT-Symposium Storage Area Management. Management von Applikationen, SAN und Terrabyte-Speichersystemen am praktischen Beispiel
Storage Area Management Management von Applikationen, SAN und Terrabyte-Speichersystemen am praktischen Beispiel April 21, 200422. April 2004 Steffen Bartsch Product Marketing Manager Vortrag 3C06 Vortrag
MehrOffice 365 Dynamics 365 Azure Cortana Intelligence. Enterprise Mobility + Security Operations Mgmt. + Security
Office 365 Dynamics 365 Azure Cortana Intelligence Enterprise Mobility + Security Operations Mgmt. + Security API Application Availability Bottomless Storage Identity Management Full hybrid
MehrPRODATIS CONSULTING AG. Folie 1
Folie 1 Führend im Gartner Magic Quadranten für verteilte, interagierende SOA Projekte Oracle ist weltweit auf Rang 1 auf dem Markt der Enterprise Service Bus Suiten (ESB) für SOA Software 2010 26,3 %
MehrCALUMMA ETL Tool Benutzerhandbuch
Benutzerhandbuch 2 Inhaltsverzeichnis Teil I Einleitung 3 Teil II Spoon Basics 4 Teil III CALUMMA Steps 9 1 Master... Data Importer 10 2 Data... Importer 11 3 Enumeration... Mapping 12 4 Hierarchie-Mapping...
MehrAnalyse von unstrukturierten Daten. Peter Jeitschko, Nikolaus Schemel Oracle Austria
Analyse von unstrukturierten Daten Peter Jeitschko, Nikolaus Schemel Oracle Austria Evolution von Business Intelligence Manuelle Analyse Berichte Datenbanken (strukturiert) Manuelle Analyse Dashboards
MehrPlatform as a Service (PaaS) & Containerization
Platform as a Service (PaaS) & Containerization Open Source Roundtable Bundesverwaltung; Bern, 23. Juni 2016 André Kunz Chief Communications Officer Peter Mumenthaler Head of System Engineering 1. Puzzle
MehrStep 0: Bestehende Analyse-Plattform
Die Themen 09:30-09:45 Einführung in das Thema (Oracle) 09:45-10:15 Hadoop in a Nutshell (metafinanz) 10:15-10:45 Hadoop Ecosystem (metafinanz) 10:45-11:00 Pause 11:00-11:30 BigData Architektur-Szenarien
Mehrsimply sophisticated Integration von SAP und Non SAP Lösungen Marktüberblick, Techniken, Möglichkeiten & Probleme
simply sophisticated Integration von SAP und Non SAP Lösungen Marktüberblick, Techniken, Möglichkeiten & Probleme Patrick Theobald Zur Person Patrick Theobald Geschäftsführer Theobald Software GmbH seit
MehrBIW - Überblick. Präsentation und Discoverer Demonstration - Teil 1 - Humboldt Universität zu Berlin am 10. Juni 2004
BIW - Überblick Präsentation und Discoverer Demonstration - Teil 1 - Humboldt Universität zu Berlin am 10. Juni 2004 Annegret Warnecke Senior Sales Consultant Oracle Deutschland GmbH Berlin Agenda Überblick
MehrDatenaustausch Hadoop & Oracle DB Carsten Herbe metafinanz Informationssysteme GmbH München
Datenaustausch Hadoop & Oracle DB Carsten Herbe metafinanz Informationssysteme GmbH München Schlüsselworte Hadoop, Sqoop, Sqoop 2, Hive, Oracle Big Data Konnektoren Einleitung Neben der klassischen Data
MehrBIG UNIVERSITÄTSRECHENZENTRUM
UNIVERSITÄTS RECHENZENTRUM LEIPZIG BIG DATA @ UNIVERSITÄTSRECHENZENTRUM Forschung und Entwicklung Entwicklung eines E-Science-Angebots für die Forschenden an der Universität Leipzig Stefan Kühne Axel Ngonga
MehrBest Practices: BI mit Open-Source-Tools
Best Practices: BI mit Open-Source-Tools Alf Hellmund - GIUA 2009 Seite 1 Agenda Einleitung Best Practices Fazit Vorstellung & Motivation Vorteile Architektur & Entwurf Datenmodellierung ETL Reporting
MehrAgenda. Boris Plaumann. Alena Fojtík. Alena Fojtík Boris Plaumann. Smart. Big. Data. Analytics. Science. Analytics im Day-2-Day Business
Agenda 1. 2. 3. 4. 5. Smart. Big. Data. Analytics. Science. Analytics im Day-2-Day Business Alles dreht sich um Daten Methoden & Visualisierung Beispiele aus der Praxis Boris Plaumann Alena Fojtík Alena
Mehri2b2 Wizard Installation
i2b2-workshop am 26.03.2013 in Erlangen i2b2 Wizard Installation Ein Überblick Sebastian Mate (Erlangen) Sebastian Mate et al. // Lehrstuhl für Medizinische Informatik // Universität Erlangen-Nürnberg
MehrBig Data: Apache Hadoop Grundlagen
Seminarunterlage Version: 1.07 Version 1.07 vom 5. September 2018 Dieses Dokument wird durch die veröffentlicht.. Alle Rechte vorbehalten. Alle Produkt- und Dienstleistungs-Bezeichnungen sind Warenzeichen
MehrFlexFrame for Oracle. Torsten Schlautmann OPITZ CONSULTING Gummersbach GmbH
Torsten Schlautmann torsten.schlautmann@opitz-consulting.de OPITZ CONSULTING Gummersbach GmbH +49 2261 6001-1175 Agenda Funktionsweise Einsatzszenarien Rahmenbedingungen Zusammenfassung Fragen und Antworten
MehrBUSINESS INTELLIGENCE IM MITTELSTAND EIN PRAXISBERICHT
BUSINESS INTELLIGENCE IM MITTELSTAND EIN PRAXISBERICHT Meik Truschkowski Architekt für Business Intelligence und Data Warehousing nobilia-werke J. Stickling GmbH & Co. KG Verl, den 31. Oktober 2011 UNTERNEHMENSPROFIL
MehrBig Data im Retail-Sektor am Beispiel Kassenbondaten
Big Data im Retail-Sektor am Beispiel Kassenbondaten REWE Systems GmbH Jonas Freiknecht inovex GmbH Bernhard Schäfer Business Analytics Day, 08.03.2017 AGENDA 1. Vorstellung REWE Systems GmbH und inovex
MehrAufbau einer komplett automatischen Business Intelligence-Umgebung
Aufbau einer komplett automatischen Business Intelligence-Umgebung Toad BI Suite Udo Brede Senior Solutions Architect Databases udo.brede@software.dell.com Agenda Begriffserklärung BI Vorstellung Toad
MehrRaber+Märcker Techno Summit 2014 Microsoft Dynamics NAV 2013 R2 Überblick und Hintergründe zu aktuellen Version. Schimon.Mosessohn@microsoft.
Raber+Märcker Techno Summit 2014 Microsoft Dynamics NAV 2013 R2 Überblick und Hintergründe zu aktuellen Version Schimon.Mosessohn@microsoft.com Herzlich Willkommen 1996 2004 2010 2014 Navision 3.7 Microsoft
MehrAgile Methoden als Erfolgsfaktor für BI und Big Data Projekte. Best Practices aus unseren Projekten. Dr. Stefan Igel Mainz, 13.05.
Agile Methoden als Erfolgsfaktor für BI und Big Data Projekte Best Practices aus unseren Projekten Dr. Stefan Igel Mainz, 13.05.2014 Agenda 1. Agile BI und BI Agilität 2. Agile Teams 3. Agil BI-Projekte
MehrLizenzierung von ODI. Oracle Lizenzierung. Michael Paege, Director License Management Consulting. Lizenzierung ODI, DOAG Data Integration Day 2015
Lizenzierung von ODI Oracle Lizenzierung Michael Paege, Director License Management Consulting OPITZ CONSULTING GmbH 2015 Seite 1 Agenda 1. ODI Historie: vom OWB u.a. zum ODI 2. ODI-Lizenzierung aktuell
MehrOpen Source Data Center Virtualisierung mit OpenNebula. 05.03.2013 CeBIT 2013. Bernd Erk www.netways.de
Open Source Data Center Virtualisierung mit OpenNebula 05.03.2013 CeBIT 2013 Bernd Erk VORSTELLUNG NETWAYS NETWAYS! Firmengründung 1995! GmbH seit 2001! Open Source seit 1997! 35 Mitarbeiter! Spezialisierung
MehrOracle System Application Management in a Nutshell
Oracle System Application Management in a Nutshell Maik Sandmann Principal Sales Consultant - Oracle Global Technology - EMEA Oracle Enterprise Manager Top-Down Application Management
MehrOpen Source Data Center Virtualisierung mit OpenNebula. 22.05.2013 LinuxTag Berlin. Bernd Erk www.netways.de
Open Source Data Center Virtualisierung mit OpenNebula 22.05.2013 LinuxTag Berlin Bernd Erk VORSTELLUNG NETWAYS NETWAYS! Firmengründung 1995! GmbH seit 2001! Open Source seit 1997! 38 Mitarbeiter! Spezialisierung
MehrSuchen allein ist nicht genug!
Suchen allein ist nicht genug! Eine Unternehmensweite Suche aussuchen, einführen und optimieren Jörg Issel Jörg Issel Seit 2001 im Suchmaschinenumfeld Projekte für diverse international tätige Konzerne
Mehrconsulting Ventum Consulting Hadoop im Unternehmenseinsatz, aber sicher Nürnberg, November 2015 Results, no excuses.
Ventum Consulting Hadoop im Unternehmenseinsatz, aber sicher Nürnberg, November 2015 Results, no excuses. Agenda A B C D Ventum Consulting 5 Säulen der Sicherheit Frameworks Fazit Ventum Consulting Grown
MehrÜbersicht Streams nach Liste Produkte/Themen
Stream Datenbank: DB Oracle 9i bis 12c In-Memory Datenbanken Enterprise Manager Appliances EXADATA RAC DataGuard Upgrades, Konsolidierungen Implementationen Administration / Monitoring Performance Tuning
MehrS T O R A G E - LÖ S U N G E N
STORAGE-LÖSUNGEN Im Brennpunkt Storage Systeme rücken in den Mittelpunkt der strategischen IT-Planung der Unternehmen. War es vorher die Entscheidung für die Server-Hardware, ein Betriebssystem, eine Datenbank
MehrIDRT: Unlocking Research Data Sources with ETL for use in a Structured Research Database
First European i2b2 Academic User Meeting IDRT: Unlocking Research Data Sources with ETL for use in a Structured Research Database The IDRT Team (in alphabetical order): Christian Bauer (presenter), Benjamin
MehrCopyright 2014, Oracle and/or its affiliates. All rights reserved.
1 Oracle Fusion Middleware Ordnung im Ganzen Matthias Weiss Direktor Mittelstand Technologie ORACLE Deutschland B.V. & Co. KG 2 Agenda Begriffe & Ordnung Fusion Middleware Wann, was, warum Beispiel für
MehrExadata und In-Memory Datenbewirtschaftung und Analyse Extrem mit Exadata und InMemory (Erfahrungsbericht)
Exadata und In-Memory Datenbewirtschaftung und Analyse Extrem mit Exadata und InMemory (Erfahrungsbericht) Christian Haag, DATA MART Consulting Consulting Manager Oracle DWH Team Inhalt Thematik (Einordnung
Mehrdaniel.kreuzhofer@microsoft.com Image source http://commons.wikimedia.org/wiki/file:modern_warehouse_with_pallet_rack_storage_system.jpg Definitionen Azure Region Eine Ansammlung von Rechenzentren, die
MehrÜberblick Hadoop Einführung HDFS und MapReduce. DOAG Regionaltreffen München/Südbayern Februar 2014
Überblick Hadoop Einführung HDFS und MapReduce DOAG Regionaltreffen München/Südbayern Februar 2014 Wir fokussieren mit unseren Services die Herausforderungen des Marktes und verbinden Mensch und IT. Business
MehrUnsere Vorträge auf der DOAG 2015
Unsere Vorträge auf der DOAG 2015 Dienstag Virtual Reality Analytics 12:00-12:45 Uhr Raum Oslo, Ebene 2 Jörg Osarek SQL Developer Lassen Sie sich anstecken! 12:00-12:45 Uhr Raum Sydney, Ebene 1 Sabine
MehrRapid Deployment von OS, Virtualisierung und Applikation
Rapid Deployment von OS, Virtualisierung und Applikation Marcel Hofstetter hofstetter@jomasoft.ch https://www.jomasoftmarcel.blogspot.ch Geschäftsführer / Enterprise Consultant JomaSoft GmbH Solaris Swiss
MehrRapid Deployment mit JomaSoft VDCF
Rapid Deployment mit JomaSoft VDCF Marcel Hofstetter hofstetter@jomasoft.ch http://www.jomasoftmarcel.blogspot.ch Geschäftsführer / Enterprise Consultant JomaSoft GmbH Oracle ACE Associate Solaris Swiss
MehrEinführung in Hadoop & MapReduce. Dr. Kathrin Spreyer Big Data Engineer
Einführung in Hadoop & MapReduce Dr. Kathrin Spreyer Big Data Engineer München, 19.06.2013 Agenda Einleitung 1. HDFS 2. MapReduce 3. APIs 4. Hive & Pig 5. Mahout Tools aus Hadoop-Ökosystem 6. HBase 2 Worum
MehrCarrier Integration. Wie binden Sie eigentlich Ihre Transportdienstleister in Ihre Prozesse ein?
Carrier Integration Wie binden Sie eigentlich Ihre Transportdienstleister in Ihre Prozesse ein? Ablauf Kurzvorstellung der Teilnehmer Wer sind Sie und wo arbeiten Sie? Was für Lösungen werden eingesetzt?
MehrPortal for ArcGIS Konzepte und Deployment
Portal for ArcGIS Konzepte und Deployment Marcel Frehner Esri Schweiz IGArc Technologie-Sitzung Aarau, 28.1.2016 Agenda + GIS-Implementierungsmuster + Web GIS und Zusammenarbeit + Berechtigungen: Benutzer,
MehrExalytics - Deep dive with OBIEE, Timesten and Essbase
Exalytics - Deep dive with OBIEE, Timesten and Essbase Renate Wendlik Senior DWH Consultant Matthias Fuchs DWH Architekt ISE Information Systems Engineering GmbH Agenda Einleitung Exalytics Konfiguration
MehrDWH Automation - Steigerung von Qualität, Effektivität und Transparenz in der DWH Implementierung und dem Betrieb. Referent: Raphael Henneke
DWH Automation - Steigerung von Qualität, Effektivität und Transparenz in der DWH Implementierung und dem Betrieb Referent: Raphael Henneke Agenda 10.00 10.30 Begrüßung & aktuelle Entwicklungen bei QUNIS
MehrOn-premise owncloud für die Mitarbeiter der Deutschen Bahn - mit "DB Box" flexibel und sicher Dateien austauschen -
On-premise owncloud für die Mitarbeiter der Deutschen Bahn - mit "DB Box" flexibel und sicher Dateien austauschen - Bobby Eichholz, DB Systel GmbH Product Manager Infrastructure & Workplace, ICT Products
MehrCharakteristika von Unternehmensanwendungen
Charakteristika von Unternehmensanwendungen Wozu werden Unternehmensanwendungen genutzt? Enterprise applications are about the display, manipulation, and storage of large amounts of often complex data
MehrSolaris Cluster. Dipl. Inform. Torsten Kasch <tk@cebitec.uni Bielefeld.DE> 8. Januar 2008
Dipl. Inform. Torsten Kasch 8. Januar 2008 Agenda Übersicht Cluster Hardware Cluster Software Konzepte: Data Services, Resources, Quorum Solaris Cluster am CeBiTec: HA Datenbank
MehrBESSER WERDEN DURCH ERSE
Christian Eberhardt BESSER WERDEN DURCH ERSETZUNG EINES ETL-TOOLS MIT PL/SQL Seite 1 Christian Eberhardt POSITION BI Consultant Spezialisierung DWH AUSBILDUNG Diplominformatiker EXPERTISE 6 Jahre Projekterfahrung
MehrIsabel Arnold CICS Technical Sales Germany Isabel.arnold@de.ibm.com. z/os Explorer. 2014 IBM Corporation
Isabel Arnold CICS Technical Sales Germany Isabel.arnold@de.ibm.com z/os Explorer Agenda Introduction and Background Why do you want z/os Explorer? What does z/os Explorer do? z/os Resource Management
MehrKennzahlen und Datenlogistik
Kennzahlen und Datenlogistik Neue Perspektiven auf das Tagesgeschäft für Technologie, KnowHow und Betrieb Martin Genest, Team Manager SAP & Data Solutions Leipzig, Inhalt 1. Das Thema 2. Kennzahlen und
MehrOracle Data Warehouse Mit Big Data neue Horizonte für das Data Warehouse ermöglichen
DATA WAREHOUSE Oracle Data Warehouse Mit Big Data neue Horizonte für das Data Warehouse ermöglichen Alfred Schlaucher, Detlef Schroeder DATA WAREHOUSE Themen Big Data Buzz Word oder eine neue Dimension
MehrPerformanceoptimierung mit Exadata Verarbeitung extremer Datenmengen mit PL/SQL basierter Datenbewirtschaftung (Erfahrungsbericht)
Performanceoptimierung mit Exadata Verarbeitung extremer Datenmengen mit PL/SQL basierter Datenbewirtschaftung (Erfahrungsbericht) Christian Haag, DATA MART Consulting Consulting Manager Oracle DWH Team
MehrBig Data im Call Center: Kundenbindung verbessern, Antwortzeiten verkürzen, Kosten reduzieren! 25.02.2016 Sascha Bäcker Dr.
Big Data im Call Center: Kundenbindung verbessern, Antwortzeiten verkürzen, Kosten reduzieren! 25.02.2016 Sascha Bäcker Dr. Florian Johannsen AGENDA 1. Big Data Projekt der freenet Group Dr. Florian Johannsen
MehrErfolgsfaktor 1 beim Aufbau von DWH. Erik Purwins Unit Manager Business Intelligence 22.03.2012
Erfolgsfaktor beim Aufbau von DWH Erik Purwins Unit Manager Business Intelligence 22.3.22 Inhalt Das Unternehmen PPI Erfolgsfaktoren & Risiken Nutzeffekte durch DWH-/BI-Anwendungen Intuitive Bereitstellung
MehrITGAIN Fach- und Technikspezialist
ITGAIN Fach- und Technikspezialist KOMPETENZ GEWINNBRINGEND EINSETZEN. Copyright 2012 ITGAIN GmbH 1 SPoT Wir bringen Ihre Informationen auf den Punkt. Hamburg, 07.05.2012 FACTORY-ANSATZ FÜR ETL-PROZESSE
MehrBI around the world - Globale Reporting Lösungen bei Continental Automotive
BI around the world - Globale Reporting Lösungen bei Continental Automotive Stefan Hess Trivadis GmbH Stuttgart Herbert Muckenfuss Continental Nürnberg Schlüsselworte: Oracle BI EE, Business Intelligence,
MehrBest of Show on Tour März bis 06. April 2017
Best of Show on Tour 2017 28. März bis 06. April 2017 Service-Orientierung in der IT - Running IT as a business HPE Best of Show on Tour 2017 Stefan Mohr, ITC GmbH ITC GmbH 2017 ITC GmbH 2017 3 Ist Service-Orientierung
MehrSAP Analytics für KMU. Oktober 2017
SAP Analytics für KMU Oktober 2017 1. Trend 2. Lösung Inhalt 3. Szenarien 4. Angebot 5. Vorteile 6. Testen Sie es! 7. Referenz 8. Unsere Kunden 9. Kontakt Reporting mit Excel? Werden Sie es los. Ganz einfach.
MehrBig Data und Oracle bringen die Logistik in Bewegung
OPITZ CONSULTING Deutschland GmbH Dortmund, 07.05.2014 Bild-Quelle: Web-Seite von Pasta ZARA, Big Artikel Data So und entstehen Oracle bringen unsere die Nudeln Logistik in Bewegung http://de.pastazara.com/so-entstehen-unsere-nudeln
MehrMit Excel Know-how webbasierte BI- Applikationen erstellen #MobileBI Business Driven Intelligence
Mit Excel Know-how webbasierte BI- Applikationen erstellen #MobileBI Jochen Heßler, 16.03.2015 2002 Gegründet in Freiburg, Deutschland 2002 Heute Büros in Freiburg, Frankfurt, Düsseldorf, Paris, Boston
MehrMarktübersicht: kostenlose BI-Tools Überblick Open Source Werkzeuge und Praxisbeispiele
Marktübersicht: kostenlose BI-Tools Überblick Open Source Werkzeuge und Praxisbeispiele Dimitri Keil dimitri.keil@eloum.net Informationsveranstaltung ebusiness-lotse Oberschwaben-Ulm Weingarten IHK Bodensee-Oberschwaben,
MehrPowershell DSC Oliver Ryf
1 Powershell DSC Oliver Ryf Partner: 2 Agenda Begrüssung Vorstellung Referent PowerShell Desired State Configuration F&A Weiterführende Kurse 3 Vorstellung Referent Seit 1991 IT-Trainer 1995 MCSE und MCT
MehrDas perfekte Rechenzentrum mit PernixData Architect & FVP
Das perfekte Rechenzentrum mit PernixData Architect & FVP Auf der Reise zu einem RZ ohne Performance Probleme Patrick Schulz - Systems Engineer pschulz@pernixdata.com Twitter: @PatrickSchulz1 Blog: www.vtricks.com
MehrAvalon Anwendertreffen 2016
Avalon Anwendertreffen 2016 Report of the Lab Avalon Server Suite Karst Schaap Manager Server Development 1 Report of the lab, Avalon Server Suite Disclaimer Der Report of the lab -Vortrag reduziert sich
MehrSharePoint 2016 was kommt auf uns zu? SharePoint & Office 365 Community Zentralschweiz
SharePoint 2016 was kommt auf uns zu? SharePoint & Office 365 Community Zentralschweiz Inhalt Wo liegt der Fokus von SharePoint 2016? Experiences Infrastruktur SharePoint Migration auf 2016 Wie sehen die
MehrIn 30 Minuten zur BI-Lösung in der Cloud Aufbau einer BI-Infrastruktur & Entwicklung von Reports Live. Referent: Patrick Eisner & Ronja Schermer
In 30 Minuten zur BI-Lösung in der Cloud Aufbau einer BI-Infrastruktur & Entwicklung von Reports Live Referent: Patrick Eisner & Ronja Schermer Agenda 10.00 10.30 Begrüßung & aktuelle Entwicklungen bei
MehrScrum für Business Intelligence Projekte erfolgreich nutzen. Es begrüßt Sie Thomas Löchte
Scrum für Business Intelligence Projekte erfolgreich nutzen Es begrüßt Sie Thomas Löchte Die Informationsfabrik Die Informationsfabrik macht erfolgreiche BI und DWH Projekte und hat zufriedene, referenzierbare
MehrA central repository for gridded data in the MeteoSwiss Data Warehouse
A central repository for gridded data in the MeteoSwiss Data Warehouse, Zürich M2: Data Rescue management, quality and homogenization September 16th, 2010 Data Coordination, MeteoSwiss 1 Agenda Short introduction
MehrHadoop. Eine Open-Source-Implementierung von MapReduce und BigTable. von Philipp Kemkes
Hadoop Eine Open-Source-Implementierung von MapReduce und BigTable von Philipp Kemkes Hadoop Framework für skalierbare, verteilt arbeitende Software Zur Verarbeitung großer Datenmengen (Terra- bis Petabyte)
MehrData Warehouse schnell gemacht Performanceaspekte im Oracle DWH
Data Warehouse schnell gemacht Performanceaspekte im Oracle DWH Dani Schnider Principal Consultant Business Intelligence BI Trilogie, Zürich/Basel 25./26. November 2009 Basel Baden Bern Lausanne Zürich
MehrAnalytik Mittels R als übergreifende Plattform
Analytik Mittels R als übergreifende Plattform Detlef E. Schröder Oracle DWH Community STCC DB Mitte @DetEgbSchroeder, http://www.oracledwh.de Themen Anforderungen an Datenmanagement R - Grundsätzliches
Mehr