IBM Workshop Hands-on Workshop zur IBM Big Data Plattform und BigInsights

Ähnliche Dokumente
LOG AND SECURITY INTELLIGENCE PLATFORM

"Big Data" - Kompliziert! Teuer! Hype! Wirklich? Ralf Götz, TechSales BigData, IBM Deutschland GmbH

Big Data Eine Einführung ins Thema

Analyse von unstrukturierten Daten. Peter Jeitschko, Nikolaus Schemel Oracle Austria

Oracle BI&W Referenz Architektur Big Data und High Performance Analytics

Big Data: Solaranlagen reparieren Waschmaschinen? 2014 IBM Corporation

Data. Guido Oswald Solution Switzerland. make connections share ideas be inspired

Big-Data and Data-driven Business KMUs und Big Data Imagine bits of tomorrow 2015

DATA WAREHOUSE. Big Data Alfred Schlaucher, Oracle

Management Information System SuperX status quo and perspectives

p^db=`oj===pìééçêíáåñçêã~íáçå=

SAS Predictive Analytics Factory The SAS approach for the production and maintenance of analytical models

Cloud und Big Data als Sprungbrett in die vernetzte Zukunft am Beispiel Viessmann

+++ Bitte nutzen Sie die integrierte Audio-Funktion von WebEx (Menü Audio -> Integrated Voice Conference -> Start auswählen), um uns zu hören!!!.

NEWSLETTER. FileDirector Version 2.5 Novelties. Filing system designer. Filing system in WinClient

Mit In-Memory Technologie zu neuen Business Innovationen. Stephan Brand, VP HANA P&D, SAP AG May, 2014

Big Data Hype und Wirklichkeit Bringtmehrauchmehr?

Big Data & Big Business

Big Data in Azure. Ein Beispiel mit HD Insight. Ralf Stemmer

Die Renaissance von Unified Communication in der Cloud. Daniel Jonathan Valik UC, Cloud and Collaboration

Introducing PAThWay. Structured and methodical performance engineering. Isaías A. Comprés Ureña Ventsislav Petkov Michael Firbach Michael Gerndt

Kann man Big Data managen? Wie passt Big Data in Information Governance Konzepte? Uwe Nadler Senior Managing Consultant Information Agenda Architect

Software EMEA Performance Tour Juni, Berlin

A Big Data Change Detection System. Carsten Lanquillon und Sigurd Schacht

Big Data Anwendungen Chancen und Risiken

One Stack. One install. One Stream.

Business Intelligence. Bereit für bessere Entscheidungen

Industrie 4.0 Predictive Maintenance. Kay Jeschke SAP Deutschland AG & Co. KG., Februar, 2014

Big-Data-Technologien - Überblick - Prof. Dr. Jens Albrecht

TMF projects on IT infrastructure for clinical research

Aufbau einer komplett automatischen Business Intelligence-Umgebung

Customer-specific software for autonomous driving and driver assistance (ADAS)

WCF RIA Services Datengetriebene Apps. Thomas Claudius Huber Senior Consultant Trivadis AG

Cloud Computing in der öffentlichen Verwaltung

Eine neue Hoffnung - Watson Analytics verschmilzt mit Cognos BA. Erik Purwins

Creating OpenSocial Gadgets. Bastian Hofmann

Fluid-Particle Multiphase Flow Simulations for the Study of Sand Infiltration into Immobile Gravel-Beds

Webbasierte Exploration von großen 3D-Stadtmodellen mit dem 3DCityDB Webclient

JONATHAN JONA WISLER WHD.global

Titelmasterformat durch Klicken bearbeiten

THEMA: GUT VORBEREITET IST HALB ZERTIFIZIERT ANTWORTEN ZUR SAS VISUAL ANALYTICS-ZERTIFIZIERUNG" THOMAS WENDE

Microsoft Office SharePoint Server 2007 Überblick. Gernot Kühn Partner Technical Specialist Microsoft Deutschland Gmbh

NoSQL-Datenbanken und Hadoop im Zusammenspiel mit dem Data Warehouse

SARA 1. Project Meeting

Jeffrey Bohn For Your Eyes Only PPI Roadshow 2015

Von Smaller Data zu BIGGER Data Praktische Ansätze zu Data Discovery, Data Blending und Data Visualization

BIG UNIVERSITÄTSRECHENZENTRUM

Mission. TARGIT macht es einfach und bezahlbar für Organisationen datengetrieben zu werden

Microsoft Azure Fundamentals MOC 10979

BIG DATA: EXPECT THE UNEXPECTED. T-SYSTEMS AUSTRIA 2014 Dipl.-Ing. Axel Bundestagung der Jungen Wirtschaft

p^db=`oj===pìééçêíáåñçêã~íáçå=

Komplexität der Information - Ausgangslage

Big Data Neue Erkenntnisse aus Daten gewinnen

IBM Content Manager CM V Proof of Technology

It s magic! PSC Südwest BusinessPartnerstammtisch 17. Oktober 2012 Direktor PSC Südwest Dirk Charbonnier. Herzlich Willkommen IBM Corporation

Kann man Big Data managen?

AS Path-Prepending in the Internet And Its Impact on Routing Decisions

IBM Demokratischere Haushalte, bessere Steuerung, fundierte Entscheidungen? Was leisten das neue kommunale Finanzwesen und Business Intelligence?

Using TerraSAR-X data for mapping of damages in forests caused by the pine sawfly (Dprion pini) Dr. Klaus MARTIN

Symbio system requirements. Version 5.1

Markus BöhmB Account Technology Architect Microsoft Schweiz GmbH

Algorithms for graph visualization

ETHISCHES ARGUMENTIEREN IN DER SCHULE: GESELLSCHAFTLICHE, PSYCHOLOGISCHE UND PHILOSOPHISCHE GRUNDLAGEN UND DIDAKTISCHE ANSTZE (GERMAN

Big Data Informationen neu gelebt

Vorstellung IBM Cognos Oliver Linder Client Technical Professional Business Analytics

JPlus Platform Independent Learning with Environmental Information in School

Apache Hadoop. Distribute your data and your application. Bernd Fondermann freier Software Architekt

Intelligentes Datenmanagement und Architekturen für flexibles Reporting und Analytik

Extensible Visualization

Password Management. Password Management Guide MF-POS 8

Echtzeiterkennung von Cyber-Angriffen auf IT-Infrastrukturen. Frank Irnich SAP Deutschland

June Automic Hadoop Agent. Data Automation - Hadoop Integration

Von Big Data zu Executive Decision BI für den Fachanwender bis hin zu Advanced Analytics

Copyright 2014, Oracle and/or its affiliates. All rights reserved.

If you have any issue logging in, please Contact us Haben Sie Probleme bei der Anmeldung, kontaktieren Sie uns bitte 1

GIS-based Mapping Tool for Urban Energy Demand

Die Microsoft-Komplettlösung für Datawarehousing, Big Data und Business Intelligence im Überblick.

Sicherheit dank Durchblick. Thomas Fleischmann Sales Engineer, Central Europe

Big Data Management Thema 14: Cassandra

Novell for Education. Beratung - Systembetreuung - Supporting Implementation von Ausbildungsschienen für österreichische Schulen

Network premium POP UP Display

MICROSOFT SHAREPOINT 2010 Microsoft s neue Wunderwaffe!? Eike Fiedrich. Herzlich Willkommen!

A central repository for gridded data in the MeteoSwiss Data Warehouse

INTERXION Rechenzentrum & Cloud. Volker Ludwig Sales Director

Betrugserkennung mittels Big Data Analyse Beispiel aus der Praxis TDWI München, Juni 2014

KURZANLEITUNG. Firmware-Upgrade: Wie geht das eigentlich?

VGM. VGM information. HAMBURG SÜD VGM WEB PORTAL USER GUIDE June 2016

MatchPoint. Wirtschaftlichkeit von SharePoint Plattformen optimieren

Das Zettabyte. CeBIT Dr. Wolfgang Martin Analyst, ibond Partner und Ventana Research Advisor

Oracle Business Intelligence (OBIEE) 12c Ein erster Einblick in die neue Reporting-Engine von Oracle

ROOT Tutorial für D. Liko

BIW - Überblick. Präsentation und Discoverer Demonstration - Teil 1 - Humboldt Universität zu Berlin am 10. Juni 2004

Netezza Data Warehouse Performance in neuen Dimensionen

GridMate The Grid Matlab Extension

Open Source Data Center Virtualisierung mit OpenNebula CeBIT Bernd Erk

Ist das Big Data oder kann das weg? Outsourcing ja, aber geistiges Eigentum muss im Unternehmen bleiben

Distributed testing. Demo Video

Transkript:

IBM Workshop Hands-on Workshop zur IBM Big Data Plattform und BigInsights Harald Gröger, Gerhard Wenzel, Martin Clement Client Technical Specialists Big Data

Inhalt Durch Lösungen für Big Data können aus riesigen Datenmengen geschäftsrelevante Informationen gewonnen werden. In diesem Workshop werden Sie unter Anleitung unstrukturierte in Files gespeicherte Massendaten aus dem Internet mit IBM InfoSphere BigInsights administrieren und über Spreadsheets auswerten. Ziel - Sie gewinnen selbst praktische Erfahrung mit den Big Data Lösungen der IBM und können einschätzen, welchen Nutzen dieses topaktuelle Thema Ihrem Unternehmen bringen kann. Teilnehmer - Der Workshop richtet sich an alle Big Data Experten und die, die es werden wollen. Vorkenntnisse der IBM Big Data Lösungen sind nicht notwendig. Agenda Einführung IBM Big Data Plattform und BigInsights (IBM Hadoop Distribution) Übung 1: Komfortable Administration von Systemen und Anwendungen Übung 2: Analyse von Daten aus sozialen Netzwerken über Spreadsheets Live Demo: Text-Analyse zur Gewinnung relevanter Geschäfts-Informationen

Was ist Big Data? Volume Variety Velocity Veracity Data at Scale Terabytes to petabytes of data Data in Many Forms Structured, unstructured, text, multimedia Data in Motion Analysis of streaming data to enable decisions within fractions of a second. Data Uncertainty Managing the reliability and predictability of inherently imprecise data types.

Die IBM Big Data Zonen-Architektur Real-time Analytics Intelligence Analysis Data in Motion Ingestion and Integration Streams Integrated Exploration Decision Management Data at Rest ETL, Quality, MDM Landing, Analytics and Archive Warehouse / Marts BI and Predictive Analytics Data in Many Forms MapReduce Navigation and Discovery Hadoop Information Governance, Security and Business Continuity

Was ist Hadoop? Apache Hadoop is an open source software project that enables the distributed processing of large data sets across clusters of commodity servers. MapReduce - The framework that understands and assigns work to the nodes in a cluster. HDFS - A file system that spans all the nodes in a Hadoop cluster for data storage. It links together the file systems on many local nodes to make them into one big file system. HDFS assumes nodes will fail, so it achieves reliability by replicating data across multiple nodes Scalable add nodes without changing data formats, how data is loaded, how jobs are written, or the applications on top Cost effective massively parallel computing on commodity servers with sizeable decrease in storage cost, which makes it affordable to model all your data Flexible schema-less, can absorb any type of data, data from multiple sources can be joined and aggregated in arbitrary ways enabling deep analyses Fault tolerant loss of a node results in work redirect to another location of the data and continues processing

Umfang der IBM BigInsights Hadoop-Distribution Enterprise class Quick Start Edition New for V2.1. Free. Non-production only Apache Hadoop Basic Edition Free download - Jaql - Integrated install Enterprise Edition Sold by # of terabytes managed PureData for Hadoop - Appliance simplicity Enterprise ready - Integrated web console - Administrative tools, security - RDBMS, warehouse connectivity - Enterprise Integration - Performance Optimization - Pre-built applications Analytics included - Visualization Capabilities - Spreadsheet-style tool - Big SQL - Text analytics - Eclipse development -- Accelerators PureData for Hadoop brings BigInsights as an appliance form factor to the market Breadth of capabilities

Generelle Informationen Name Hostname der VM = bivm Login Benutzer = biadmin Kennwort = biadmin

Tutorial - Managing your Big Data environment Dauer ca. 10 Minuten Start BigInsights Web Console über Desktop Icon, dann weiter mit Chapter 2 / Lesson 1 / Schritt 3 (Seite 4).

Tutorial - Analyzing Big Data with BigSheets Dauer ca. 40 Minuten Alle Prerequisites sind bereits erfüllt. Die Daten sind heruntergeladen und importiert. Start im Files Tab der BigInsights Web Console mit Chapter 4 / Lesson 1 / Schritt 3 (Seite 14), (hdfs/biginsights/sheets/watson_data_preloaded) Ende nach Lesson 6 / Schritt 3 (Seite 21).

Console Demo

BigSheets Demo Blog News Spreadsheet Format From unstructured text to formatted spreadsheets and charts Chart

Text Analytics Demo unstructured text Labels / Examples AQL Regex / Dictionary generate From unstructured text documents to text analytics result table text highlight AQL Candidates create combination of regex and dictionaries plus distance, case,... AQL Filter Result Table result table duplicates, irrelevant candidates,...

Thank You!