Statistische Software



Ähnliche Dokumente
Präsentation Von Laura Baake und Janina Schwemer

lippmannstr hamburg tel: fax:

Datenvisualisierung mit JMP

VBA-Programmierung WS 2008/09

schnell und portofrei erhältlich bei beck-shop.de DIE FACHBUCHHANDLUNG mitp/bhv

Die Software für Visualisierung und Analyse von Strukturinformationen aus EDM- und PDM-Systemen.

1 PIVOT TABELLEN. 1.1 Das Ziel: Basisdaten strukturiert darzustellen. 1.2 Wozu können Sie eine Pivot-Tabelle einsetzen?

Kurze Einführung in IBM SPSS für Windows

Professionelle Seminare im Bereich MS-Office

1 Mit geschätzt weltweit mehr als zwei Millionen Anwendern hat sich die Sprache R seit

Macher Solutions Produktinformation SAP Crystal Reports 2011

Thema: Entwicklungen und Anwendungen im Bereich von ERP- Systemen Christopher Keppler, Kathrin Günther Michael Schenk und Sebastian Viehl

Einführung in SPSS. 1. Die Datei Seegräser

Ihre Interessentendatensätze bei inobroker. 1. Interessentendatensätze

Fachbericht zum Thema: Anforderungen an ein Datenbanksystem

Kap. 35 Swing: Grundlagen Kap Swing: Hauptfenster

WEKA A Machine Learning Interface for Data Mining

3. GLIEDERUNG. Aufgabe:

Statistische Software

Seminar aus dem Bereich E-Learning

Installationsanleitung

Wer wir sind. Qualität ist das Ergebnis gewissenhafter Arbeit. Denn nur die setzt sich durch. Unser Profil

PROGRAMMIEREN MIT VBA IN EXCEL

Der Einsatz von Open-Source-Produkten im Unternehmen, dargestellt am Beispiel von OpenOffice

IBM SPSS Statistics Version 22. Installationsanweisungen für Windows (Lizenz für gleichzeitig angemeldete Benutzer)

MATLAB-Automatisierung von Dymola- Simulationen und Ergebnisauswertung Holger Dittus. Modelica User Group BaWü, Stuttgart,

C++11 C++14 Kapitel Doppelseite Übungen Musterlösungen Anhang

Neue 3D Machine Vision Software im Metro-Stil von Windows 8 lässt in die Zukunft blicken

Installation von NetBeans inkl. Glassfish Anwendungs-Server

2. ERSTELLEN VON APPS MIT DEM ADT PLUGIN VON ECLIPSE

Wofür braucht man eine Tabellenkalkulation? Das Programm Microsoft Excel gehört in Softwarekategorie der Tabellenkalkulationen.

Einführung in PHP. (mit Aufgaben)

Treffpunkt MATLAB Einführung 1. Agenda. Begrüßung. Wie bekomme ich MATLAB? MATLAB im Studium. Vorstellung des Treffpunkt MATLAB. Vortrag von MathWorks

MicroStation V8i bietet eine VBA Schnittstelle, mit der der Programmieranfänger seine ersten Gehversuche machen kann.

Planung. Visualisierung. Programmierung

2-tägiges Seminar. Dieser Workshop ist für Anfänger konzipiert, die noch keine oder nur geringe Erfahrung

Revit Modelle in der Cloud: Autodesk 360 Mobile

OUTSOURCING ADVISOR. Analyse von SW-Anwendungen und IT-Dienstleistungen auf ihre Global Sourcing Eignung. Bewertung von Dienstleistern und Standorten

Es sollte die MS-DOS Eingabeaufforderung starten. Geben Sie nun den Befehl javac ein.

Herzlich Willkommen!

Visual Basic Express Debugging

Smap3D PDM 10. Installation. Stand-Alone-Migration-Analyzer

pro4controlling - Whitepaper [DEU] Whitepaper zur CfMD-Lösung pro4controlling Seite 1 von 9

Leseprobe aus: Budischewski, Kriens, SPSS für Einsteiger, ISBN Beltz Verlag, Weinheim Basel

Programmierung von MS-Office mit Visual Basic

Bedienungsanleitung Einsatzplanung. Bedienungsanleitung Einsatzplanung. Inhalt. Bedienung einer Plan-Tabelle

Das Beste aus zwei Welten

IBM SPSS Statistics Version 24. Windows-Installationsanweisungen (Lizenz für einen berechtigten Benutzer) IBM

Windows 7: Neue Funktionen im praktischen Einsatz - Die neue Taskleiste nutzen

Ein Blick voraus. des Autors von C++: Bjarne Stroustrup Conrad Kobsch

W I N D O W S. Sie lernen einen PC zu bedienen, der mit einer Windows-Oberfläche ausgestattet ist.

Handbuch ECDL 2003 Professional Modul 2: Tabellenkalkulation Arbeiten mit Pivot-Tabellen

Upgrade von Windows Vista auf Windows 7

Anleitung zum Arbeiten mit Microsoft Visual Studio 2008 im Softwarepraktikum ET/IT

Schritt 1: Verwenden von Excel zum Erstellen von Verbindungen mit SQL Server-Daten

Make It Easy Ein Tool zur automatisierten Auswertung und Analyse für einen automatisierten Simulationsprozess

Handbuch Fischertechnik-Einzelteiltabelle V3.7.3

Mit suchmaschinenoptimierten Übersetzungen erfolgreich mit fremdsprachigen Webseiten

Ist Excel das richtige Tool für FMEA? Steve Murphy, Marc Schaeffers

has.to.be Heute individuelle Lösungen, morgen Standards.

Systemvoraussetzungen winvs office winvs advisor

Anleitung zum Extranet-Portal des BBZ Solothurn-Grenchen

APPs personalisiert für Veranstaltungen für SIE

Leere Zeilen aus Excel-Dateien entfernen

Noten ausrechnen mit Excel/Tabellenkalkulation. 1) Individuellen Notenschlüssel/Punkteschlüssel erstellen

Installation und Inbetriebnahme von Microsoft Visual C Express

Windows 7 - Whoami. Whoami liefert Informationen wie z.b. die SID, Anmelde-ID eines Users, sowie Gruppenzuordnungen, Berechtigungen und Attribute.

1.1 Das Ziel: Basisdaten strukturiert darzustellen

PQ Explorer. Netzübergreifende Power Quality Analyse. Copyright by Enetech Alle Rechte vorbehalten.

ENTDECKEN SIE DIE VORTEILE VON SUBSCRIPTION SOFTWARE HERUNTERLADEN

Entwicklungsprozesse und -werkzeuge

OP-LOG

Mining High-Speed Data Streams

Analyse leicht gemacht - SAS Enterprise Guide. Gerd Hoffmann Technical Competence Center SAS Deutschland

Datenbank-Verschlüsselung mit DbDefence und Webanwendungen.

Grundlagen für den erfolgreichen Einstieg in das Business Process Management SHD Professional Service

SMART Newsletter Education Solutions April 2015

Klausur WS 2006/07 Programmiersprache Java Objektorientierte Programmierung II 15. März 2007

Take a BITe! Lasttest für BI-Anwendungen

In diesem Kurs lernen Sie, wie in EXCEL Diagramme erzeugt werden und was Sie dabei beachten sollten.

Mobile Ranking Factors

Ein unverzichtbarer Helfer für den Heizwerksbetrieb!

Dienstprogramme. Dienstprogramme (Werkzeuge)

Albert HAYR Linux, IT and Open Source Expert and Solution Architect. Open Source professionell einsetzen

Die Orgadata AG ist ein stark expandierendes Software-Unternehmen aus Leer. Mit unserem System LogiKal

Herzlich willkommen! SIEVERS-SNC - IT mit Zukunft.

Einführungskus MATLAB

Wo hat mein Computer meine Dateien schon wieder versteckt? Tipps und Tricks Dateien wieder zu finden.

IBM SPSS Statistics für Windows-Installationsanweisungen (Netzwerklizenz)

Wo finde ich die Software? - Jedem ProLiant Server liegt eine Management CD bei. - Über die Internetseite

Die Programmiersprache Java. Dr. Wolfgang Süß Thorsten Schlachter

Programm GArtenlisten. Computerhinweise

Computerorientiertes Problemlösen

Hilfe zur Urlaubsplanung und Zeiterfassung

Duonix Service Software Bedienungsanleitung. Bitte beachten Sie folgende Hinweise vor der Inbetriebnahmen der Service Software.

Transkript:

Seminar: Warum wir falsch liegen und trotzdem weitermachen - Aktuelle Themen in Banken und Versicherungen 16.07.2010 Statistische Software von Martin Dörr Betreuer: Sebastian Kaiser

Gliederung 1 Motivation 2 Statistikwerkzeuge 3 Ökonometrie-Funktionen 4 Leistungsoptimierung 5 Zusammenfassung 6 Links

Motivation für Softwarelösungen viele Probleme analytisch nicht lösbar numerische Lösungen extrem rechenaufwendig viele Wiederholungen des gleichen Problems riesige Datenmengen graphische Ausgabe der Ergebnisse

Statistikwerkzeuge PASW (SPSS) SAS Matlab R MS Excel weitere Software

Geschichte von PASW (SPSS) 1968 Gründung von SPSS Inc. an der Stanford University von Nie, Hull und Bent 1968 Veröffentlichung der Statistik-Software SPSS 1983 erste PC-Version 2009 IBM übernimmt SPSS Inc. 2010 SPSS Statistics heißt nun PASW (Predictive Analysis SoftWare)

Struktur von PASW (SPSS) modular aufgebautes Programmpaket Basismodul für Datenmangement und gängigste statistische Verfahren Dateneditor Syntaxeditor Ausgabenavigator Skripteditor Zusatzmodule für spezielle Anwendungen Forecasting Statistics Developer...

Struktur von PASW (SPSS)

Vorteile von PASW (SPSS) + weltweit das am meisten verbreitete Statistikprogramm + vollständige graphische Benutzeroberfläche (GUI) + eigener und sehr guter Dateneditor + publikumsreife Ausgabe von Graphiken und Analyseergebnissen + automatische Erstellung von Befehlssyntax + umfassende Software-Hilfe bzw. Literatur + Schnittstelle zu R und Python + läuft in schnellem Maschinencode

Nachteile von PASW (SPSS) - kommerzielles Programm, jährliche Lizenzgebühren - Black-Box - jüngere statistische Methoden fehlen - enthält wenig (exotische) statistische Verfahren - Programmierung mit Befehlssyntax und Automatisierungen umständlich - kaum Schnittstellen zu anderer Software - läuft nur unter MS-Windows

Geschichte von SAS Anfang 1970er Entwicklung der Software an der NC State University von Goodnight und Sall 1976 Gründung des SAS Institute 2004 Aufbau der Intelligence Platform

Struktur von SAS/STAT Windowing Environment Explorer Log-Fenster Programmeditor Ausgabefenster Befehlssyntax DATA Step PROC Step Datenbank-Engine Transaktionen finden auf Tabellenebene statt Konzept der Historisierung Bündelung von Tabellen in Libraries

Struktur von SAS/STAT

Vorteile von SAS + leistungsfähigste Datenbankanbindung + weit verbreitetes Statistikprogramm + betriebssystemunabhängig und -übergreifend + läuft in schnellem Maschinencode + umfassende Software-Hilfe bzw. Literatur + Schnittstelle zu R und anderen Datenbanksystemen + ermöglicht komplexe Informationsgewinnungsprozesse in heterogenen IT-Infrastrukturen + geringe Anforderungen an Arbeitsspeicher

Nachteile von SAS - teures kommerzielles Programm, jährliche Lizenzgebühren - Black-Box - jüngere statistische Methoden fehlen - keine graphische Benutzeroberfläche (GUI) - hohe Anforderungen an Festplattenleistung

Geschichte von Matlab Ende 1970er Entwicklung der Software an der New Mexico University von Moler 1984 Gründung von MathWorks durch Moler, Little und Bangert http://www.matlab.rwth-aachen.de/index.php?id=799

Struktur von Matlab Entwicklungssystem für die Programiersprache MATLAB bietet Konzepte der objektorientierten Programmierung an Laufzeitinterpreter vektorbasierte Sprache, auf numerische Berechnungen ausgelegt Bündelung von Funktionen in Toolboxes Arbeitsspeicheraufteilung in 8-Byte-Blöcke

Vorteile von Matlab + flexibles Werkzeug für Automatisierungen, wiederholende Abläufe oder eigene Funktionen + weit verbreitetes Programm + plattformunabhängig + Operationen auf Matrizen oder Vektoren fast so schnell wie Compilersprachen + mannigfaltige Schnittstellen zu anderen Programmiersprachen (C, C++, FORTRAN) Datenbanksystemen + Grafische Ausgabefunktionen enthalten Animationen und interaktive Bedienelemente + umfassende Software-Hilfe bzw. Literatur + Support durch viele Freiwillige, z.b. in Foren

Nachteile von Matlab - kommerzielles Programm, jährliche Lizenzgebühren - Black-Box - Laufzeitinterpreter, sehr langsam z.b. bei Schleifen - jüngere statistische Methoden fehlen - keine graphische Benutzeroberfläche (GUI) - hohe Anforderungen an Arbeitsspeicherkapazität

Geschichte von R 1976 S wird an den Bell Laboratories von AT&T entwickelt 1992 Beginn des R-Projects. 1993 erste Binärversion auf Statlib 1997 R Development Core Team wird gegründet 2000 R-1.0.0 wird veröffentlicht, die erste vollständig kompatible Version zur Sprache S der Version 3. 2001 Die Zeitschrift R News wird erstmalig herausgegeben. 2004 Die erste R Anwenderkonferenz user! wird abgehalten.

Struktur von R rein objektorientierte Programmiersprache Laufzeitinterpreter vektorbasierte Sprache, auf numerische Berechnungen ausgelegt Bündelung von Funktionen in Paketen Arbeitsspeicher wird durch environments organisiert Arbeitsspeicheraufteilung in 8-Byte-Blöcke

Struktur von R

Vorteile von R + flexibles Werkzeug für Automatisierungen, wiederholende Abläufe oder eigene Funktionen + Open-Source-Software, sämtlicher Quellcode einsehbar + kostenlos beziehbar unter www.r-project.org + Operationen auf Matrizen oder Vektoren fast so schnell wie Compilersprachen + plattformunabhängig + liegt am Puls der Forschung + großer Pool an Paketen (Stand 02.07.2010: 2449) + mannigfaltige Schnittstellen zu anderen Programmiersprachen (C, C++, FORTRAN) Datenbanksystemen (Paket RODBC) Graphiktools (Paket RGtk2, ggobi)

Vorteile von R + umfassende Software-Literatur + Support durch viele Freiwillige, z.b. Mailinglisten R-help und R-devel + schnelle Korrektur von fehlerhaften Programmsequenzen + Suchmaschine für Funktionen und Pakete http://finzi/psych.upenn.edu/search.html http://cran.r-project.org/search.html RSiteSearch() in R

Nachteile von R - Laufzeitinterpreter, sehr langsam z.b. bei Schleifen - hohe Anforderungen an Arbeitsspeicherkapazität - keine Benutzeroberfläche (Rcmdr für elementarste Auswertungen) - kein eigener Dateneditor - Graphikausgabe erzeugt weder dynamische interaktive verknüpfte Graphiken

Geschichte von MS Excel 1982 Spreadsheet-Programm Multiplan wird vermarktet 1987 erste MS Excel-Version (2.05) für Windows (unter MS DOS) 1993 Trademark-Gerichtsstreit

Struktur von MS Excel Spreadsheet-Programm Tabellenkalkulation Graphik-Erstellung Pivot-Tabellen Macro-Sprache Visual Basic for Applications (VBA)

Struktur von MS Excel

Vorteile von MS Excel + weltweit das am meisten verbreitete Tabellenkalkulationsprogramm + vollständige graphische Benutzeroberfläche (GUI) + eigener und sehr guter Dateneditor + publikumsreife Ausgabe von Graphiken + umfassende Software-Literatur + dynamische Graphiken

Nachteile von MS Excel - kommerzielles Programm - Black-Box - viele statistische Methoden fehlen - Matrizenrechnung nur über VBA möglich - kaum Schnittstellen zu anderer Software - schlechte Software-Hilfe - historisierendes Menüsystem in MS Excel 2007 - irreführende Statistikfunktionen - begrenzter Datumsbereich - schlechte Rechengenauigkeit - enge Verknüpfung von Daten, Rechenwegen und Ergebnissen - Spreadsheet-Dimension: 65536 Zeilen x 256 Spalten

weitere Software im Überblick EViews gretl Limdep RATS JMulti RiskLink-ALM allgemeine ökonometrische und statistische Analyse Zeitreihenanalyse Ausgabe von Graphen und Tabellen Daten-Organisation inkl. Datenbankzugriffe Regression allgemeine ökonometrische Analyse Zeitreihenanalyse Regression allgemeine ökonometrische Analyse Zeitreihenanalyse Paneldatenanalyse Regression Zeitreihenanalyse Zeitreihenanalyse Schadensmodellierung von Katastrophen

Ökonometrie-Funktionen Vorstellung Software-Pakete von Matlab und R synonyme Funktionen

Matlab Financial Toolbox Berechnung und Analyse von Prices, Yields und Sensitivities für Derivate und anderer Wertpapiere, und für Portfolios von Wertpapieren Ausführen von Securities Industry Association (SIA) kompatiblem Fixed-Income Pricing, Yield und Sensitivity Analyse Portfolios analysieren und verwalten Hedging-Strategien gestalten und bewerten Risiko erkennen, messen und kontrollieren Analyse und Berechnung von Cash Flows, einschließlich Rates of Return und Depreciation Streams Analyse und Vorhersage von ökonomischer Aktivität Visualisierung und Analyse von finanziellen Zeitreihendaten Gestaltung von strukturierten Finanzinstrumenten, einschließlich Auslandswährungs-Instrumenten

Matlab Financial Derivatives Toolbox Bonds Bond Options Caps Fixed-Rate Notes Floating-Rate Notes Floors Swaps Swaption Callable und Puttable Bonds Options (Asian, Barrier, Compound, Lookback und Vanilla stock)

R Pakete Rmetrics foptions, fexoticoptions, fasianoptions, fassets, fbonds, fportfolio, fregression, fextremes, timeseries...

synonyme Funktionen Black-Scholar-Modell Matlab R SAS (Financial Toolbox) (foptions) (?) blsprice GBSOption BLKSHCLPRC BLKSHPTPRC blsgamma GBSGreeks blsdelta blslambda blsrho blstheta blsvega GBSCharacteristics

synonyme Funktionen Heston-Nandi-Garch-Modell Matlab (Financial Toolbox) ugarch ugarchsim R (foptions, fexoticoptions) HNGOption HNGGreeks HNGCharacteristics hngarchfit hngarchsim

synonyme Funktionen exotische Optionen Matlab (Financial (Derivatives Toolbox) barrierbycrr barrierbyeqp barrierbyitt R (fexoticoptions) StandardBarrierOption ForwardStartOption

Leistungsoptimierung Motivation SAS Matlab und R MS Excel

Motivation für Leistungsoptimierung Hardware-Tuning teuer effizientere Programme führen zu der Möglichkeit, aufwendige Berechnungen überhaupt erst durchzuführen schnelleren Ergebnissen detailgetreueren Modellen

Leistungsoptimierung in SAS Ressourcenkontrolle mit FullSTimer und SASTrace SAS-Systemoptionen, z.b. CPUCount, MemSize SAS Option COMPRESS=CHAR bei großen Dateien mit vielen CHAR-Variablen einschalten SAS Option NOSORTEQUALS bei Sortieren von Daten mit PROC SORT einschalten Datei mit SASFILE in den Hauptspeicher laden Views statt Zwischentabellen Hash-Tabellen fürs gleichzeitige Nachschlagen von mehreren Informationen in verschiedenen Tabellen innerhalb eines DATA STEP verwenden... Vorschläge können, müssen jedoch nicht zu schnelleren Programmlaufzeiten führen!

Leistungsoptimierung in Matlab und R Laufzeitmessung mit tic und toc oder Profiling (Matab) und system.time() (R) Schleifen durch Vektoroperationen erstetzen (R und Matlab) Verwendung geeigneter logischer Operatoren (R und Matlab) parallele Programmierung (R und Matlab) Code in C und FORTRAN programmieren (R und Matlab).Last.value löschen (R) Speicherplatz für Variablen reservieren (R und Matlab) Variablentyp beibehalten (R und Matlab) Schleifen statt rekursive Funktionen (R und Matlab)...

Leistungsoptimierung in MS Excel Beispiel Solver

Anmerkung zur Leistungsoptimierung Beachte: Code, der ungenaue oder sogar falsche Ergebnisse liefert, ist unbrauchbar, egal wie schnell er ist!

Zusammenfassung PASW Wegen eigenen Dateneditor und leichter Bedienung gut geeignet für Einsteiger und kleinere Standardanalysen. SAS Wegen leistungsstarker Datenbank-Engine sehr geeignet für die Auswertung riesiger Datenmengen, die zudem von unterschiedlichen Systemen erstellt wurden. Matlab und R Wegen ihrer hohen Flexibilität als Programmiersprachen geeignet für selbstkonzipierte, rechenintensive Verfahren wie z.b. Simulationen. MS Excel Wegen seiner Schlichtheit eher für einfache Berechnungen und Überschlagsrechnungen geeignet.

Links PASW SAS Matlab R sonstige www.spss.com/de/statistics/ www.sas.de www.mathworks.de www.r-project.org www.rmetrics.org http://finzi/psych.upenn.edu/search.html /[R-Ordner]/doc/manual de.wikipedia.org/wiki/liste_von_statistik-software