Stock Market prediction. Veranstaltung: Neueste Trends in Big Data Analytics Betreuer: Julian Kunkel

Ähnliche Dokumente
Seminar. Neueste Trends in Big Data Analytics

Emotion Recognition of Call Center Conversations Robert Bosch Engineering and Business Solutions Private Limited

Bio-Inspired Credit Risk Analysis

Predicting the duration of disruptions in the SBB railway network with RNN

Mastering Social Media, Web, Satellite and Spatial Data with R. Dr. Martin Vogt Seminar

A linear-regression analysis resulted in the following coefficients for the available training data

Künstliche Intelligenz im Maschinen- und Anlagenbau Heilsbringer oder Hypebringer?

Heavy Equipment Demand Prediction with Support Vector Machine Regression Towards a Strategic Equipment Management

Schnelles Denken - Maschinelles Lernen mit Apache Spark 2

Big Data und die Energiewende: Kann man genug Daten haben?

Predictive Analytics für Dummies. Click here if your download doesn"t start automatically

Interest rate volatility prior to monetary union under alternative pre-switch regimes

Big Data-Ansätze zur Vorhersage intra-urbaner Hitzeinseln

Big Data. Timo HARTMANN 1. Technische Universität Berlin, Fachgebiet Systemtechnik baulicher Anlagen, Institut für Bauingenieurwesen, Berlin

A New Target Detector Based on Geometrical Perturbation Filters for Polarimetric Synthetic Aperture Radar (POL-SAR)

Machine Learning and Data Mining Summer 2015 Exercise Sheet 11

Entwicklung einer Anwendung zur Erkennung von Täuschungsversuchen

Was ist, kann und darf Deep Learning? Dr. Beat Tödtli Laboratory for Web Science

Learning to Rank Sven Münnich

Vergleich von SVM und Regel- und Entscheidungsbaum-Lernern

SKOPOS Webinar 22. Mai 2018

1. Referenzpunkt Transformation

Citi Investmentbarometer Q Stimmungen und Tendenzen aus Sicht privater Anleger und professioneller Marktteilnehmer

Accountability in Algorithmic. Decision Making.

Trader Tour: Optionsscheine

Echtzeitdatenanalyse für Risikomanagement im Finanzwesen

Margarita M. Kalamova Kai A. Konrad. Nation Brands and Foreign Direct Investment

Bayesian updating in natural hazard risk assessment

Microsoft Azure Deutschland ist jetzt verfügbar -

Frischer Wind für ein bekanntes Thema Klassifikation 4.0

Statistics, Data Analysis, and Simulation SS 2015

Kapitalmaßnahmeinformation

SEMINAR KLASSIFIKATION & CLUSTERING STATISTISCHE GRUNDLAGEN. Stefan Langer WINTERSEMESTER 2014/15.

Plan. Market Spreads. Volatility Spreads. Straddle Long Straddle Short Straddle. Bull Spread. Strangle. Mit Calls Mit Puts Bear Spread

Einführung in die Bioinformatik: Lernen mit Kernen

Globale und Individuelle Schmerz-Klassifikatoren auf Basis relationaler Mimikdaten

Thema Bankenlandschaft im Umbau Substanz oder bloße Fassade? Verpflegungspauschale: 25 Euro Anmeldung an:

H E R Z L I C H W I L L K O M M E N Z U R D O A G K O N F E R E N Z

Bayesian Networks. Syntax Semantics Parametrized Distributions Inference in Bayesian Networks. Exact Inference. Approximate Inference

Maschinelle Sprachverarbeitung Übung

Conception of Collaborative Project Cockpits with Integrated Interpretation Aids

Predictive. Statistik. Informatik. Daten. Domäne

Selected Topics in Machine Learning and Reverse Engineering

Companion Technologie

Einführung in NLP mit Deep Learning

econstor Make Your Publications Visible.

Aktuelle Themen für die Masterstudiengänge Wirtschaftsingenieurwesen 1

Modellierung mit künstlicher Intelligenz

Dr. Daniel Fasel, CEO DATEN, DAS WERTSCHÖPFENDE GUT FÜR DIE DIGITALISIERUNG

de Gruyter Textbook Risk Management Bearbeitet von Thomas Wolke

Spezifikationen für Future-Kontrakte auf den Deutschen Aktienindex (DAX- Future)

Introduction to Modern Time Series Analysis

Support Technologies based on Bi-Modal Network Analysis. H. Ulrich Hoppe. Virtuelles Arbeiten und Lernen in projektartigen Netzwerken

DATA ANALYSIS AND REPRESENTATION FOR SOFTWARE SYSTEMS

Technische Maßnahmen im Online Angebot. Hohenheim, 15. März, 2017

Mash-Up Personal Learning Environments. Dr. Hendrik Drachsler

Moment: Maintaining Closed Frequent Itemsets over a Stream Sliding Window

MythMiner. Ein Empfehlungssystem für Fernsehprogramme auf Basis von RapidMiner. Balázs Bárány. Linuxwochen Wien,

Naive Bayes für Regressionsprobleme

5. Übung Datenanalyse und Statistik WS07/08 (Boogaart, Jansen)

Der Effekt makroökonomischer Variablen auf den Finanzmarkt

Google = Technologie = Nerds

Positive Berichterstattung über eine Mannschaft in einer Kalenderwoche führt zu erfolgreicheren Ergebnissen.

Der Wert von Daten in Zeiten von Big Data Microsoft Vision Days, Thilo Stadelmann

Lehrangebot. Fachgebiet Informationssysteme Prof. Dr. Norbert Fuhr

Approximate Maximum Margin Algorithms with Rules Controlled by the Number of Mistakes

VALUE ADDED SOFTWOOD

General Online Research Conference GOR February to 2 March 2018, TH Köln University of Applied Sciences, Cologne, Germany

Gerhard Svolba, SAS Austria Mannheim, 2. März KSFE

Bioinformatik I (Einführung)

Analytics Entscheidungsbäume

WE SHAPE INDUSTRY 4.0 BOSCH CONNECTED INDUSTRY DR.-ING. STEFAN AßMANN

Energiewende können Physiker auch?! Dr. Matthias Lange DPG Tagung Rostock,

Dynamic Hybrid Simulation

Artificial Intelligence: Lösungsbeispiele für Knowledge Management, Enterprise Search & Prozessoptimierung. Franz Kögl IntraFind Software AG

Education Day Wissensgold aus Datenminen: wie die Analyse vorhandener Daten Ihre Performance verbessern kann! Education Day

Data Mining Kapitel 11: Machine Learning. Johannes Zschache Wintersemester 2018/19

Beschwerdemanagement / Complaint Management

Data Science Anwendungen bei innogy Netz & Infrastruktur (G&I)

SAP Predictive Challenge - Lösung. DI Walter Müllner, Dr. Ingo Peter, Markus Tempel 22. April 2015

Anteil des Handelsvolumens als Prozentsatz des gesamten Volumens in dieser Kategorie

Mentorium zur Lehrveranstaltung Finanzen 3 Thema: Valuation Aufgaben: 1 VIII, IX; 8

Sustainability Balanced Scorecard as a Framework for Eco-Efficiency Analysis

Thumbs up? Sentiment Classification using Machine Learning Techniques

Final Exam. Friday June 4, 2008, 12:30, Magnus-HS

Finanzierung und Investition

Big Data - und nun? Was kann die Bioinformatik?

Innovation Scouting - Vom Screening weltweiter Trends bis zur Umsetzung in Produkten

Homework II. November Universität Basel Wirtschaftswissenschaftliches Zentrum WWZ.

Einführung in die Computerlinguistik Information Retrieval: tf.idf

Künstliche Intelligenz angewandt bei koronarer Herzkrankheit - Cardioexplorer

Einführung von Futures und Optionen auf Xetra-Gold

Momentum in ATM-Optionspreisen und Momentum in Nachrichten

Seminar: Software Engineering verteilter Systeme

jasimasolutions Simulation based process optimization for the agri food sector jasimabeverageplanner jasima Solutions Spin Off from

Just seen on the way here SEITE 1

Visual Analytics: Personalisierung im E- Commerce

Multicriterial Design Decision Making regarding interdependent Objectives in DfX

Agenda. Strategien, Trends und Technologien. Next-Best-Action Marketing Kundenbeispiele. Zusammenfassung Pegasystems Inc.

Transkript:

Stock Market prediction Veranstaltung: Neueste Trends in Big Data Analytics Betreuer: Julian Kunkel CLEMENS BECKER

Agenda 1. Allgemeine Erläuterung des Aktienmarktes 2. Zeitreihen & ARIMA-Modell 3. Vorhersage durch Finanzartikel 4. Aktuelles Beispiel 5. Zusammenfassung Clemens Becker STOCK MARKET PREDICTION 2/31

Aktien Quelle: Aktienerläuterung, Finanztraum, http://finanz-traum.de/wpcontent/uploads/2015/07/so-funktionieren-anleihen_1435700885142_block_1.png Quelle: Dividendenerläuterung, Finanztraum, http://finanz-traum.de/wpcontent/uploads/2015/07/so-funktionieren-anleihen_1435700885142_block_2.png Clemens Becker STOCK MARKET PREDICTION 3/31

Ankauf und Verkauf: Orderbuch Quelle: Beispiel für das Xetra Orderbuch, Finanznachrichten.de, http://fns1.de/img/xetra-orderbuch1.gif Clemens Becker STOCK MARKET PREDICTION 4/31

Anleihen: Kapitalmarktkredite Quelle: Anleihen Erläuterung, Deutsche Bank AG, https://www.maxblue.de/static/assets/content/20151020_mb_infografiken_1140px_20_anleihen.svg Clemens Becker STOCK MARKET PREDICTION 5/31

Terminkontrakt Januar KAUF 100 Stück Dezember 40 $ * 100 = 4.000$ 360 $ *100 = 36.000$ 400 $ * 100 = 40.000$ Quelle: Gold, Freepik.com, https://www.flaticon.com/free-icon/goldingot_677101#term=gold&page=1&position=7 Clemens Becker STOCK MARKET PREDICTION 6/31

Terminkontrakt Juni VERKAUF 100 Stück Dezember 40 $ * 100 = 4.000$ 400 $ * 100 = 40.000$ 440 $ * 100 = 44.000$ 4.000 $ Gewinn Quelle: Gold, Freepik.com, https://www.flaticon.com/free-icon/goldingot_677101#term=gold&page=1&position=7 Clemens Becker STOCK MARKET PREDICTION 7/31

Optionen Käufer erwirbt nur ein Recht zum Kaufen/Verkaufen Quelle: So funktionieren Call- und Put-Optionen, Dr.Manuel Kay und Sara Zinnecker, http://www.finanztip.de/fileadmin/images/geldanlage/optionen/call_-_put.png Clemens Becker STOCK MARKET PREDICTION 8/31

Zeitreihen gemessene Datenpunkte in bestimmtem Zeitraum Quelle: Apple explodiert, Michael, http://www.newgadgets.de/uploads/2012/08/aktienkurs-applee1345546251378.png Clemens Becker STOCK MARKET PREDICTION 9/31

ARIMA-Modell mögliche zu analysierende Zeitreihen Zeitreihenmuster Quelle: Wetterstation Linz Flughafen, Wetteronline, https://www.wetteronline.de/?pid=p_rueckblick_climatediagram&src=rueckblic k/vermarktung/wom/de/p_rueckblick_climatediagram/temperatur/klimadiagra mm-11010-linz-flughafen-temperatur.gif Quelle: Muster, die auf Zeitreihen bei der Analyse angewendet werden können, Isabell Tran, https://wr.informatik.unihamburg.de/_media/teaching/sommersemester_2016/pir-16-isabella_tranreport.pdf Clemens Becker STOCK MARKET PREDICTION 10/31

Vorhersage durch Finanzartikel: Artikelvorbereitung Verarbeitung und Einteilung der Artikel Quelle: An overview of our stock trend prediction process, Duc Duong, Toan Nguyen, Minh Dang, https://dl.acm.org/citation.cfm?id=3457619 Clemens Becker STOCK MARKET PREDICTION 11/31

Sentiment Dictionary Enthält nur tatsächlich vorkommende Wörter Quelle: An overview of our stock trend prediction process, Duc Duong, Toan Nguyen, Minh Dang, https://dl.acm.org/citation.cfm?id=3457619 Clemens Becker STOCK MARKET PREDICTION 12/31

Gewichtung Unterscheidung ob positive oder negative Auswirkung Quelle: An overview of our stock trend prediction process, Duc Duong, Toan Nguyen, Minh Dang, https://dl.acm.org/citation.cfm?id=3457619 Clemens Becker STOCK MARKET PREDICTION 13/31

TF-IDF: Term frequency-inverse document frequency TFIDF Berechnung Lösung des Problems Term frequency: 1 Document frequency: 2 Quelle: How does Delta TF-IDF work?, Hady Elsahar, https://www.quora.com/how-does-delta-tf-idf-work Clemens Becker STOCK MARKET PREDICTION 14/31

Reduzierung Rechenzeitverkürzung Quelle: An overview of our stock trend prediction process, Duc Duong, Toan Nguyen, Minh Dang, https://dl.acm.org/citation.cfm?id=3457619 Clemens Becker STOCK MARKET PREDICTION 15/31

Support Vector Machine Binäre Artikelklassifizierung Quelle: An overview of our stock trend prediction process, Duc Duong, Toan Nguyen, Minh Dang, https://dl.acm.org/citation.cfm?id=3457619 Clemens Becker STOCK MARKET PREDICTION 16/31

Support Vector Machine Quelle: What is a SVM?, OpenCV, https://docs.opencv.org/2.4/_images/optimalhyperplane.png Clemens Becker STOCK MARKET PREDICTION 17/31

Datensammlung und Testing Sammlung von Artikeln und Aktienkursen Quelle: An overview of our stock trend prediction process, Duc Duong, Toan Nguyen, Minh Dang, https://dl.acm.org/citation.cfm?id=3457619 Clemens Becker STOCK MARKET PREDICTION 18/31

Ergebnisse Genauigkeit = richtig eingeordnete Nachrichten / Gesamtanzahl an Nachrichten Quelle: Comparison of term weighting techniques, Duc Duong, Toan Nguyen, Minh Dang, https://dl.acm.org/citation.cfm?id=3457619 Clemens Becker STOCK MARKET PREDICTION 19/31

Ergebnisse Vorhersage des vietnamesischen Aktienindex Beste Vorhersage Einzelaktie mit 90% Genauigkeit Quelle: VN30 price chart with our model, Duc Duong, Toan Nguyen, Minh Dang, https://dl.acm.org/citation.cfm?id=3457619 Quelle: Trend prediction and VIC price chart, Duc Duong, Toan Nguyen, Minh Dang, https://dl.acm.org/citation.cfm?id=3457619 Clemens Becker STOCK MARKET PREDICTION 20/31

Aktuelles Beispiel Entwicklung Bitcoin 5 Jahre Entwicklung Bitcoin 1 Woche Quelle: Bitcoin Euro Chart 1 Jahr, Finanzen.net, https://www.finanzen.net/devisen/bitcoin-euro/chart Quelle: Bitcoin Euro Chart 1 Woche, Finanzen.net, https://www.finanzen.net/devisen/bitcoin-euro/chart Clemens Becker STOCK MARKET PREDICTION 21/31

Datensetzusammenstellung Täglich (5 Jahre) Preise + 26 Eigenschaften über Markt und Netzwerk Datenset 1 10 Minuten 120.000 Datensätze 10 Sekunden Quelle: Code, Freepik.com, https://www.flaticon.com/free-icon/binary-code_673159#term=code&page=1&position=37 Datenset 2 Quelle: Database, Smashicon, https://www.flaticon.com/freeicon/database_149205#term=database&page=1&position=3 Clemens Becker STOCK MARKET PREDICTION 22/31

Feature Selection 16 von 26 Features ausgewählt Quelle: Feature Selection, Issac Man, Shaurya Saluja, Aojia Zhao, http://cs229.stanford.edu/proj2014/isaac%20madan,%20shaurya%20saluja,%20aojia%20zhao,automated%20bitcoin%20trad ing%20via%20machine%20learning%20algorithms.pdf Clemens Becker STOCK MARKET PREDICTION 23/31

Random Forest Random Forests bestehen aus vielen einzelnen CART-Trees Quelle: Example Decision Tree, Dr.Jason Brownlee, https://3qeqpr26caki16dnhd19sv6by6v-wpengine.netdna-ssl.com/wpcontent/uploads/2016/02/example-decision-tree.png Clemens Becker STOCK MARKET PREDICTION 24/31

Random Forest Classification: abschließendes Voting Quelle: Random Forest Simplified, Venkata Jagannath, https://d2wh20haedxe3f.cloudfront.net/sites/default/files/random_forest_diagram_complete.png Clemens Becker STOCK MARKET PREDICTION 25/31

Random Forest Regression: Bildung von Durchschnitt Quelle: Distribution about salary bands, Tavish Srivastava, https://www.analyticsvidhya.com/blog/2014/06/introduction-random-forest-simplified/ Clemens Becker STOCK MARKET PREDICTION 26/31

GLM: Generalized Linear Model Logistic Regression Quelle: probability of passing exams versus hours of studying, Wikipedia, https://upload.wikimedia.org/wikipedia/commons/thumb/6/6d/exam_pass_logistic_curve.jpeg/400px-exam_pass_logistic_curve.jpeg Clemens Becker STOCK MARKET PREDICTION 27/31

Ergebnisse Voraussage GLM (grün) und Random Forest (blau) im Vergleich zu realer Entwicklung (rot) Quelle: Results on 10 Minute interval Bitcoin data, Issac Man, Shaurya Saluja, Aojia Zhao, http://cs229.stanford.edu/proj2014/isaac%20madan,%20shaurya%20saluja,%20aojia%20zhao,automated %20Bitcoin%20Trading%20via%20Machine%20Learning%20Algorithms.pdf Clemens Becker STOCK MARKET PREDICTION 28/31

Zusammenfassung Unterschiedliche Produkte vorausgesagt Nicht ein State-of-the-art Ansatz Hundert prozentige Voraussage wird schwierig bleiben, da Emotionen der Anleger im Markt eine große Rolle spielen Clemens Becker STOCK MARKET PREDICTION 29/31

Quellen Tavish Srivastava Introduction to Random forest Simplified 01.01.2018 https://www.analyticsvidhya.com/blog/2014/06/introduction-random-forest-simplified/ Hady Elsahar How does Delta TF-IDF work? 29.12.2017 https://www.quora.com/how-does-delta-tf-idf-work Was ist ein Futures-Kontrakt? 17.12.2017 https://www.boerse.de/grundlagen/eurex/was-ist-ein-futures-kontrakt-6 Isabella Tran Einführung und Verarbeitung von Zeitserien 2016 https://wr.informatik.uni-hamburg.de/_media/teaching/sommersemester_2016/pir-16- isabella_tran-report.pdf Clemens Becker STOCK MARKET PREDICTION 30/31

Quellen Isaac Madan, Shaurya Saluja, Aojia Zhao Automated Bitcoin Trading via Machine Learning Algorithms 2014 http://cs229.stanford.edu/proj2014/isaac%20madan,%20shaurya%20saluja,%20aojia%20zhao,auto mated%20bitcoin%20trading%20via%20machine%20learning%20algorithms.pdf Duc Duong, Toan Nguyen, Minh Dang Stock Markt Prediction using Financial News Articles on Ho Chi Minh Stock Exchange 2016 https://dl.acm.org/citation.cfm?id=3457619 Logistic Regression, 06.01.2018 https://en.wikipedia.org/wiki/logistic_regression Feature Selection using Singular Value Decomposition and orthogonal centroid feature selection for text classification 05.01.2018 https://de.scribd.com/document/334772804/feature-selection-using-singular-value- DECOMPOSITION-AND-ORTHOGONAL-CENTROID-FEATURE-SELECTION-FOR-TEXT-CLASSIFICATIONpdf Clemens Becker STOCK MARKET PREDICTION 31/31