Data Science mit Python. Einführung in die Data Science-Programmiersprache Python zur Datenanalyse

Ähnliche Dokumente
Data Science mit Python. Einführung in die Data Science-Programmiersprache Python zur Datenanalyse

Data Science mit Python

Supervised & Unsupervised Machine Learning

UX Workshop User Experience Design Hands-on: Strategien & Werkzeuge für die Praxis

Künstliche Intelligenz (KI) Rechtsgrundlagen und Strategien in der Praxis

User Interface (UI) Design Theorien, UI Patterns und Layouts für optimale Nutzerführung

Manager digitale Plattform-Geschäftsmodelle

Consulting 4.0 Modernisierung von Geschäftsmodellen in der klassischen Unternehmensberatung

Digitalstrategie-Workshop Von der Entwicklung bis zur Umsetzung im eigenen Unternehmen

Vergaberecht 2019 für IT-Vergabestellen Rechtssicher zum besten Bieter. Intensivworkshop

Ausbildung zum externen Datenschutzbeauftragten

Management 3.0 Intensivtraining inkl. Zertifikat. Methoden und Strategien für modernes Führen in agilen Organisationen

IT-Security für Führungskräfte Spezialworkshop

Datenschutzgrundverordnung (DSGVO) 2019 Gesetz und Praxis

IT-Projektmanagement Grundlagen

Python Einführung. Monica Selva Soto. 24 März Mathematisches Institut

Ausbildung zum Compliance Officer Mittelstand

HR-Workshop DSGVO Datenschutz in der Personalabteilung

HR-Workshop DSGVO Datenschutz in der Personalabteilung

Syntax Variablen. mtrx <- matrix (c(1,2,3,4,5,6),ncol=2,nrow=3) Anzeigen des Types: class(var) Umwandeln mit: as.vector(mtrx)

Inhaltsverzeichnis Einleitung xi Kapitel 1: Die Vorbereitung aufs Abenteuer

Praktische Eine Einführung

Sozialwissenschaftliche Datenanalyse mit R

Know-how-Schutz im Unternehmen Erfolgreiche Schutzkonzepte für den Ernstfall

Statistische Software (R)

Vergaberechtsreform 2017/2018: Ausbildung zum Vergabemanager

Einführung in die Angewandte Bioinformatik: Datenanalyse mit R

Toolbox Workshop. PeP et al. Toolbox Workshop. PeP et al. e.v. Physikstudierende und ehemalige Physikstudierende

Minimaleinführung in Python 3

Workshop Statistik mit R

Thomas Theis PHP4. Webserver-Programmierung für Um- und Einsteiger. Galileo Press

Das Studium an der Abteilung Informatik setzt Programmierkenntnisse voraus.

1 Berechnung von Summen (ca = 10 Punkte)

C++ PROGRAM- MIERER/-IN

Einstieg in SPSS. Man kann auch für jede Ausprägung einer Variablen ein Wertelabel vergeben.

Wichtige Befehle in R zur Datenanalyse Ergänzende Unterlagen zur Vorlesung Prof. Dr. Oliver Gansser

Inhalt. Einleitung... XIII

Bitte am PC mit Windows anmelden!

Spieleentwicklung. Diane Hanke, Okan Danyeli & Toni Wirth

Matthias-Claudius-Gymnasium Fachcurriculum Informatik

Software und Visualisierungen. Erich Schubert, Dr. Arthur Zimek X-XX KDD Übung

Makros in OpenOffice.org - Basic/StarBasic

Statistik mit MAXQDA Stats

Übungsaufgaben. zahlen bis auf das 3. und 7. Element enthält. (e) Erstellen Sie einen Vektor. zahlen3, der ein Klon von

Grundlagen der Bioinformatik Übung 5 Einführung in R. Ulf Leser, Yvonne Mayer

Datenbanken mit OpenOffice.org 3 Base und HSQLDB

L A T E X-Kurs. Teil 4 - Datenanalyse - Qti Plot. Fachschaft Physik Uni Konstanz WS 2015/16

Einführung in Python/Matplotlib

Mathematische Computer-Software

Kurs-Dokumentation. Zentrum für Informatik ZFI AG. Refresher Microsoft Access Programmierung (PA1P-0418) -IT Ausbildung nach Mass

Statistik für Informatiker, SS 2017 Organisatorisches, ein Startbeispiel und eine sehr knappe R-Einführung

Lösung 1. die 1 angeben. Alternativ kann man auch. Variable berechnen wählen und dann die Summe von Q2_6 und Q2_7 wählen.

In unserem fünftägigen Kurs "Python - Komplettkurs" erlangen Sie umfassende Kenntnisse in der Anwendungsentwicklung mit Python.

Grundlagen der Bioinformatik Assignment 4: Introduction to R. Yvonne Lichtblau SS 2017

Vorsprung durch Wissen

das ROOT-Framework Datenanaufnahme, Speicherung, Visualisierung & Analyse

DATENANALYSE IN GOOGLE SHEETS

EINFÜHRUNG IN DIE PROGRAMMIERUNG

Stochastik-Praktikum

Vorsemesterkurs Informatik Übungsaufgaben. Tag 4a - Python

Dataport IT Bildungs- und Beratungszentrum. Access Grundlagenseminar Access Aufbauseminar... 3

Labor Software-Entwicklung 1

Grundlagen. Felix Döring, Felix Wittwer 24. April Python-Kurs

MIT3 Serverseitige Programmierung. Claudius Coenen

Labor Software-Entwicklung 1

Python. Grundlagen, fortgeschrittene Programmierung und Praxis

Inhaltsverzeichnis. Jan Tittel. Office 2010 Programmierung mit VSTO und.net 4.0. Word, Excel und Outlook erweitern und anpassen

Datenbanken mit OpenOffice.org Base

Programmieren. Aufgabe 1 (Eine erste Datenstruktur)

Richtig einsteigen: Access 2007 VBA-Programmierung

Felder. M. Jakob. 28. April Gymnasium Pegnitz

image.png Die Dokumentation von Python, welche ich so sehr empfehle, findet ihr hier:

Ulrich Kohler, Frauke Kreuterr. Datenanalyse mit. Stata. Allgemeine Konzepte der Datenanalyse und ihre praktische Anwendung. 5. aktualisierte Auflage

Programmieren lernen in ASP.NET mit C#

Running R. Windows Aus Menü. Lese R Code ein führt den Code auch gleich aus, eventuell muss vorher das Verzeichnis gewechselt werden.

Python - Open-Source-Werkzeuge für Wissenschaftler und Ingenieure

Vorwort. Webseite zum Buch:

WS2018/ Oktober 2018

Wertetabelle für eine Gleichung

Hypothesentests mit R Ashkan Taassob Andreas Reisch

Programmierbüchlein Grundlagen der Programmierung. Rootgames

Java-Grundkurs für Wirtschaftsinformatiker

EINFÜHRUNG IN DIE PROGRAMMIERUNG

Ausbildungsangebot für das Sommersemester 2017

Programmierkurs ( Wintersemester 2017 ) Aufgabenblatt 3 Dr. Ole Klein, Dr. Steffen Müthing Abgabe 20. November 2017 IWR, Universität Heidelberg

Javakurs für Anfänger

Inhaltsverzeichnis 1 Einführung Die Software JGIS Grundlagen raumbezogener Daten

Softwarepraktikum. zu Elemente der Mathematik. Carsten Rezny Institut für angewandte Mathematik Universität Bonn

Probeklausur: Programmierung WS04/05

Bru ckenkurs Programmieren

hue12 January 24, 2017

This image cannot currently be displayed. Java à Matlab. bereitgestellt von Dr. Lukas Faessler 12/4/17

Office 2010 Programmierung mit VSTO und.net 4.0

Transkript:

Data Science mit Python Einführung in die Data Science-Programmiersprache Python zur Datenanalyse

Data Science mit Python Einführung in die Data Science-Programmiersprache Python zur Datenanalyse Kurzbeschreibung Python ist eine Programmiersprache, die auch im Bereich Data Science etabliert ist. Aufgrund ihrer klaren Syntax und leicht verständlichen Struktur eignet sie sich insbesondere für Anfänger. Bei richtiger Anwendung macht Python das analysieren großer Datenmengen einfach, effizient und kann Unternehmen rasch neue Erkenntnisse aus dem eigenen Datenbestand verschaffen. Darüber hinaus ist Python plattformunabhängig es läuft unter Linux, Mac und Windows ebenso wie unter Unix und vielen Unix-Systemen. Inhalt Grundlagen von Python Einführung in das Data Science Paket pandas und dem DataFrame Daten aus flat files oder Datenbanken einlesen und schreiben Daten anpassen, konvertieren, modellieren Visualisierung von Daten Erste Algorithmen aus dem Machine Learning Was lernen Sie in diesem Seminar? Das dreitägige Seminar schafft einen kompakten und umfangreichen Einstieg in die Data Science- und Programmiersprache Python. Sie sind anschließend in der Lage, Python selbstständig für einfache Datenanalysen im Unternehmen zu nutzen. Das Seminar umfasst hierbei eine Einführung in die Datenstruktur DataFrame vom Paket pandas (effizient Daten anpassen und verändern), Daten aus flat files (csv) oder einer Datenbank (SQLite) einlesen bzw. schreiben, Visualisierung mit matplotlib und seaborn, Grundlagen von numpy, erste eigene Funktionen schreiben und enthält einen Einstieg in Machine Learning mit den Algorithmen Lineare Regression und Entscheidungsbaum.

An wen richtet sich das Seminar? Das Seminar richtet sich an angehende data scientists und Datenanalysten und an der Programmierung in Python interessierte Fachkräfte bzw. Projektleiter, welche schon erste Programmierefahrung in Python haben und die Grundlagen der Programmiersprache Python für Data Science-Projekte erlernen möchten, um damit eigenständig an data mining Projekten mitzuwirken oder Python Code besser verstehen zu können. Notwendig sind erste Erfahrungen mit Programmiersprachen (z.b. VBA, Java, C, R, etc.), um das Konzept einer Programmiersprache zu verstehen (Konzept einer Variable in einer Programmiersprache, Zuweisung von Werten zu einer Variablen, Aufrufen von Funktionen, Parameter einer Funktion). Sehr hilfreich sind grundlegende Vorkenntnisse im Bereich der Statistik (Begriffsdefinitionen wie bspw. Mittelwert, Median, Standardabweichung, Quantil, Dichtefunktion, Normalverteilung), Kenntnisse grundlegender mathematischer Symbole und Begriff (Summenzeichen, Integral, Funktion, Ableitung, Menge der natürlichen und reellen Zahlen, Vektor, Matrix) und Kenntnis der booleschen Algebra mit den logischen Operatoren (UND, ODER, NICHT). Didaktischer Aufbau des Seminars? Dieses Seminar ist sehr praxisorientiert. Die Teilnehmer arbeiten direkt und selbstständig mit der Programmiersprache Python in der Entwicklungsumgebung Spyder, so dass das Erlernte direkt geübt und vertieft werden kann. Der Trainer moderiert dabei verschiedene Aufgaben und begleitet die Teilnehmer durch die einzelnen Lehreinheiten. Was ist an Technik mitzubringen? Die Übungen finden auf Laptops statt. Es wird empfohlen, dass Teilnehmer einen eigenen Laptop mit der vorab installierten Software mitbringen. Die Bitkom Akademie kann jedoch auf Anfrage auch eigene Schulungslaptops bereitstellen. Die Teilnehmer sollten prüfen, ob firmeneigene Laptops Zugangsbeschränkungen beim Herunterladen von Dateien und Programmen haben, die der Referent bereitstellt. Die digitalen Unterlagen (Skript, Code, Dateien) werden über eine Cloud zur Verfügung gestellt. Die Einwahl in fremde WLAN-Netze sollte daher möglich sein. Im Idealfall ist der USB Port der Teilnehmer-Laptops freigeschalten, so dass als Backup Pakete, verwendete Daten oder sonstige Unterlagen per USB-Stick übertragen werden können. Die Beispiele werden mit dem Windows Betriebssystem umgesetzt. Wird ein anderes Betriebssystem verwendet (z.b. MacOS), sollte der Umgang vertraut sein.

Zusatzinformationen Das Seminar findet in einer kleinen Gruppe mit mind. 5 und max. 11 Teilnehmern statt. Unser Referent kann dadurch auf individuelle Fragestellungen besser eingehen. Bitte stellen Sie sicher, dass Sie mit dem Betriebssystem (Windows, Mac OS, Linux), mit dem Sie arbeiten, vertraut sind. Die Bitkom Akademie ist anerkannter Bildungsträger in Baden-Württemberg und Nordrhein-Westfalen. Teilnehmer haben im Rahmen des Bildungszeitgesetzes die Möglichkeit, Bildungsurlaub bzw. eine Bildungsfreistellung zu beantragen. Auf Anfrage erstellen wir auch Anträge auf Anerkennung unserer Veranstaltungen in anderen Bundesländern. Lunch und Getränke sind im Seminarpreis enthalten. Tipp: Nutzen Sie für Ihre Anreise zu unseren Akademie-Seminaren die Sonderkonditionen unserer Partner.

Seminarprogramm Data Science mit Python TAG 1 09.30-10:00 Begrüßung durch den Seminarleiter Vorstellungsrunde & Erwartungshaltung der Teilnehmer 10.00-11.30 Hintergrund von Python Anwendungsmöglichkeiten von Python Installieren von Paketen Die Entwicklungsumgebung Spyder Aspekte von Python, welche von anderen Programmiersprachen abweichen 11.30-11.45 11.45-13.15 Datenstrukturen in Python Einführung in die grundlegenden Datenstrukturen (int, float, NaN) Der Wert NaN (not a number) und Besonderheiten Funktionen vs. Methoden Datenstrukturen in Python (number, tuple, list, dictionary, string) list vs. tuple Wann benutze ich welche Klammer [], (), {}? 13.15-14.15 Mittagspause 14.15-15.45 Einführung in das Data Science Paket pandas Elemente eines pandas data.frame Eine Zeile oder Spalte auswählen, hinzufügen und verändern Boolean indexing Ein leeres data.frame erstellen 15.45-16.00 16.00-17.30 Grundlegende Statistiken mit pandas Statistiken mit einem data.frame berechnen (Anzahl an Beobachtungen, Summe, Mittelwert, Median, Minimum, Maximum, Varianz, ) Methoden im data.frame, um einen Überblick der Daten zu erhalten Kreuztabelle (Kontingenztafel) Auswertungen nach einer Variable gruppieren Fehlende Werte löschen oder ergänzen 17.30 Ende des ersten Seminartages

Seminarprogramm Data Science von Python TAG 2 09.00-09:30 Begrüßung durch den Seminarleiter und Rückblick auf Tag 1 09.30-10.45 Visualisierung mit matplotlib und pandas Die Hauptelemente beim Plotten Einen Plot anpassen (x- und y-achse ändern, Beschriftungen, Legende und Titel) und speichern Auswahl von Farben Subplots in einer Grafik erstellen Erstellen von Scatterplot, Linienplot, Barplot, (gruppiertes) Histogram, Boxplot 10.45-11:00 11.00-12.30 Control Flows Die range() Funktion Eine eigene Funktion schreiben und default Parameter setzen For Schleifen, If-Else Bedingungen List comprehension Logische Vergleichsoperatoren 12.30-13.30 Mittagspause 13.30-15.15 Daten einlesen Das Arbeitsverzeichnis setzen Eine CSV Datei einlesen / schreiben Überblick über nützliche Parameter beim Lesen und Schreiben Große Dateien mit dem Paket pandas einlesen Das pickle modul zum Speichern von Python Objekten 15.15-15.30 15.00-17.00 Daten aus Datenbanken einlesen Eine Verbindung zu einer Datenbank aus Python herstellen Eine Tabelle aus der Datenbank abfragen bzw. hinzufügen Eine bestehende Tabelle in der Datenbank erweitern SQL Abfragen über Python 17.00 Ende des zweiten Seminartages

Seminarprogramm Data Science mit Python TAG 3 09.00-09.30 Begrüßung durch den Seminarleiter und Rückblick auf Tag 2 09.30-10.30 Lineare Regression Einführung in den Algorithmus Ein lineares Regressionsmodel in Python umsetzen Erste Ergebnisse validieren 10.30-11.00 11.00-12.30 Entscheidungsbaum Einführung in den Algorithmus Einen Entscheidungsbaum in Python umsetzen Erste Ergebnisse validieren 12.30-13.30 Mittagspause 13.30-15.00 Grundlagen in Numpy Attribute eines arrays (Dimension, shape, Größe) Arrays zusammenfügen und teilen Statistische Funktionen in numpy 15.00-15.30 15.30-17.00 Data Preprocessing Daten normalisieren Kategorisches Enkodieren von Variablen One-Hot Encoding 17.00 Ende des Seminars

Ihr Referent Jan Köhler Technischer Projektleiter und research engineer Bosch Center for Artificial Intelligence, Robert Bosch GmbH Jan Köhler arbeitet und forscht derzeit an den neuesten Technologien im Bereich Data Science, Machine Learning und Deep Learning im Bosch Center for Artificial Intelligence in Stuttgart. Zuvor unterstützte er über viele Jahre als Data Scientist unterschiedliche Geschäftsbereiche bei den verschiedenen Stufen eines Data Mining Projekts von der Beratung bis zur Implementierung. Die technische Umsetzung erfolgte mit R und Python. Seit 2012 ist er als Trainer im Bereich Data Science tätig und schult verschiedene Ebenen, von Projektmitarbeitern bis zum Vorstand. Shortfacts Preise 1.850 * Regulär 1.650 * für Bitkom-Mitglieder *Die angegebenen Preise sind in Netto-Beträgen ausgewiesen. Termine & Veranstaltungsorte Die Termine & Veranstaltungsorte entnehmen Sie der Website der Bitkom Akademie. hier Buchung des Seminars in Kombination mit Supervised & Unsupervised Machine Learning" (optional) Die Bitkom Akademie bietet ein zweitägiges Vertiefungsseminar zu Machine Learning an, welches inhaltlich und didaktisch auf dem Seminar Data Science mit Python aufbaut. Kontaktieren Sie uns wir beraten Sie gern. Bitkom Akademie Albrechtstraße 10 10117 Berlin T 030 27576-540 info@bitkom-akademie.de Weitere Seminare finden Sie unter www.bitkom-akademie.de