Bachelorarbeit. Features of Business Success. Matthias Wagner e1227617@student.tuwien.ac.at Matrikelnummer: 1227617 Studienkennzahl: 033 532



Ähnliche Dokumente
EBC*L Unternehmensziele und Kennzahlen

WinVetpro im Betriebsmodus Laptop

Auswerten mit Excel. Viele Video-Tutorials auf Youtube z.b.

Erfahrungen mit Hartz IV- Empfängern

AGROPLUS Buchhaltung. Daten-Server und Sicherheitskopie. Version vom b

Dieses erste Kreisdiagramm, bezieht sich auf das gesamte Testergebnis der kompletten 182 getesteten Personen. Ergebnis

Änderung des IFRS 2 Anteilsbasierte Vergütung

Lehrer: Einschreibemethoden

Übungsaufgabe 3 - Goodwill

Hilfedatei der Oden$-Börse Stand Juni 2014

Excel Pivot-Tabellen 2010 effektiv

A 20: ROI-Analyse und Shareholder Value-Management (2)

Der Leverage-Effekt wirkt sich unter verschiedenen Umständen auf die Eigenkapitalrendite aus.

Ohne Fehler geht es nicht Doch wie viele Fehler sind erlaubt?

HIER GEHT ES UM IHR GUTES GELD ZINSRECHNUNG IM UNTERNEHMEN

Elexis-BlueEvidence-Connector

Eine der Aktien hat immer einen höheren Gewinn als die andere Aktie. Ihre Aufgabe ist es diese auszuwählen.

V. JAHRGANG. Kennzahlen als Controllinginstrument

Würfelt man dabei je genau 10 - mal eine 1, 2, 3, 4, 5 und 6, so beträgt die Anzahl. der verschiedenen Reihenfolgen, in denen man dies tun kann, 60!.

Serien- mit oder ohne Anhang

Lineargleichungssysteme: Additions-/ Subtraktionsverfahren

MORE Profile. Pass- und Lizenzverwaltungssystem. Stand: MORE Projects GmbH

Nutzung des Retain-Archivs

Tutorial: Homogenitätstest

Erfolgskennzahlen. Direkte Ermittlung des Cash-flow. Indirekte Ermittlung des Cash-flow. Ordentlicher Brutto Cash-flow

Tipp III: Leiten Sie eine immer direkt anwendbare Formel her zur Berechnung der sogenannten "bedingten Wahrscheinlichkeit".

Erläuternder Bericht des Vorstands der GK Software AG zu den Angaben nach 289 Abs. 4 und 5, 315 Abs. 4 Handelsgesetzbuch (HGB)

Arbeitsblätter. Sinnvolle Finanzberichte. Seite 19

Tevalo Handbuch v 1.1 vom

Grundlagen der Informatik

Digital signierte Rechnungen mit ProSaldo.net

Bundesverband Flachglas Großhandel Isolierglasherstellung Veredlung e.v. U g -Werte-Tabellen nach DIN EN 673. Flachglasbranche.

1 Einleitung. Lernziele. Symbolleiste für den Schnellzugriff anpassen. Notizenseiten drucken. eine Präsentation abwärtskompatibel speichern

Dokumentation IBIS Monitor

Auswertung des Jahresabschlusses Bilanzanalyse 2

impact ordering Info Produktkonfigurator

Bereich METIS (Texte im Internet) Zählmarkenrecherche

Infoblatt Lehrer Organisation der Finanzierung und der Buchführung

Verarbeitung von ZV-Dateien im Internetbanking. Inhalt. 1. Datei einlesen Datei anzeigen, ändern, löschen Auftrag ausführen...

Zeichen bei Zahlen entschlüsseln

Druckvorlagen Als Druckvorlagen sind dafür vorhanden:!liste1.ken (Kennzahlen)!Liste2.KEN (Kontennachweis)

Durchführung der Datenübernahme nach Reisekosten 2011

Saldo-Konto eines Mitarbeiters korrigieren

Vorgehensweise bei Lastschriftverfahren

Professionelle Seminare im Bereich MS-Office

Kundeninformation PDF-Erzeugung in Adobe Illustrator, Adobe InDesign und QuarkXPress Datenprüfung und Datenübergabe

Einrichtung einer eduroam Verbindung unter dem Betriebssystem Android

Korrigenda «Rechnungswesen umfassend repetiert»

Umfrage. Didaktischer Kommentar. Lernplattform

GeoPilot (Android) die App

Softwareentwicklungspraktikum Sommersemester Grobentwurf

Anleitung Redmine. Inhalt. Seite 1 von 11. Anleitung Redmine

SICHERN DER FAVORITEN

Vorarlberger Standardschulinstallation Anbindung von Android Mobile Devices

Raiffeisen-Volksbank Wemding eg

Word 2010 Schnellbausteine

Das große ElterngeldPlus 1x1. Alles über das ElterngeldPlus. Wer kann ElterngeldPlus beantragen? ElterngeldPlus verstehen ein paar einleitende Fakten

Häufig wiederkehrende Fragen zur mündlichen Ergänzungsprüfung im Einzelnen:

Vom Inventar zur Bilanz

Änderung des Portals zur MesseCard-Abrechnung

teamsync Kurzanleitung

50. Mathematik-Olympiade 2. Stufe (Regionalrunde) Klasse Lösung 10 Punkte

Sollsaldo und Habensaldo

Leitfaden #1a. "zanox Publisher-Statistik" (next generation)

An die Gläubiger der ALPHA Events UG

Schuldenbarometer 1. Q. 2009

Anbieter auf dem Foto-Marktplatz werden

Schnellanleitung: Verbuchung von Studien- und Prüfungsleistungen

Kurssicherung / Wiederherstellung aus moodle 1.9 in moodle 2.x. 1. Sicherung in moodle 1.9 anlegen. 2. Sicherung in moodle 2.

Anforderungen an die HIS

Informationssystemanalyse Problemstellung 2 1. Trotz aller Methoden, Techniken usw. zeigen Untersuchungen sehr negative Ergebnisse:

Prozentrechnung. Wir können nun eine Formel für die Berechnung des Prozentwertes aufstellen:

Kurzeinführung Moodle

Hilfen zur Verwendung der Word-Dokumentvorlage des BIS-Verlags

Grundlagen der höheren Mathematik Einige Hinweise zum Lösen von Gleichungen

Familienrecht Vorlesung 6. Familienrecht

Teaser-Bilder erstellen mit GIMP. Bildbearbeitung mit GIMP 1

Anleitung SEPA-Lastschriften mit VR-NetWorld Software Version 5.x

Vermögensbildung: Sparen und Wertsteigerung bei Immobilien liegen vorn

Programmteil Bautagebuch

geben. Die Wahrscheinlichkeit von 100% ist hier demnach nur der Gehen wir einmal davon aus, dass die von uns angenommenen

OECD Programme for International Student Assessment PISA Lösungen der Beispielaufgaben aus dem Mathematiktest. Deutschland

Meinungen der Bürgerinnen und Bürger in Hamburg und Berlin zu einer Bewerbung um die Austragung der Olympischen Spiele

Anlage eines neuen Geschäftsjahres in der Office Line

Konvertieren von Settingsdateien

Anbindung des eibport an das Internet

7.10 Betriebliches Rechnungswesen

Einrichten einer Festplatte mit FDISK unter Windows 95/98/98SE/Me

BEDIENUNGSANLEITUNG: EINREICH-TOOL

Update-Anleitung für SFirm 3.1

Risikomanagement bei PPP Projekten: Erfahrungen aus Deutschland

Behörde für Bildung und Sport Abitur 2008 Lehrermaterialien zum Leistungskurs Mathematik

Erfolg und Vermögensrückgänge angefertigt im Rahmen der Lehrveranstaltung Nachrichtentechnik von: Eric Hansen, am:

Auslesen der Fahrtdaten wiederholen Schritt für Schritt erklärt (Funktion Abfrage zur Datensicherung erstellen )

Vermögenskennzahlen. Anlageintensität. Vermögensveränderungen. Anlagevermögen. Anlagenintensität des Anlagevermögens = X100.

Urlaubsregel in David

Anleitung zur Daten zur Datensicherung und Datenrücksicherung. Datensicherung

Anleitung SEPA-Lastschriften in der VR-NetWorld Software Version 5

ECO-Manager - Funktionsbeschreibung

BERECHNUNG DER FRIST ZUR STELLUNGNAHME DES BETRIEBSRATES BEI KÜNDIGUNG

Transkript:

Bachelorarbeit Features of Business Success Matthias Wagner e1227617@student.tuwien.ac.at Matrikelnummer: 1227617 Studienkennzahl: 033 532 Betreuer: Ao.Univ.Prof. Mag. Dr. Horst Eidenberger Mai 2015

1 Projektbeschreibung 1.1 Aufgabenstellung Ziel der Arbeit ist es die Features zu identifizieren, die Erfolg in der Wirtschaft zugrunde liegen. Dazu soll eine Testdatenbank angelegt und mit Bilanzdaten österreichischer Unternehmen, verbunden mit einer Erfolgs-bewertenden Ground-Truth, befüllt werden. Auf diese Daten soll anschließend 1.) ein Feature-Extraktions-Verfahren angewandt werden, um aussagekräftige Kennzahlen zu identifizieren und 2.) versucht werden mit Hilfe eines Machine-Learning-Systems zukünftigen Börsenerfolg, anhand vorhandener Kennzahlen, vorherzusagen. 1.2 Zeitliste Datum von bis Zeit Tätigkeit 26.02.15 10:00 10:30 00:30 Vorbesprechung 06.03.15 13:00 13:30 00:30 Planen; Meilensteinplan 08.03.15 13:30 15:30 02:00 Recherche - Suchen von Daten 09.03.15 10:30 12:00 01:30 Recherche - Suchen von Daten 10.03.15 12:00 14:00 02:00 Recherche; Daten sammeln 11.03.15 10:30 14:30 04:00 Recherche; Kennzahlen selektieren; Datensätze erstellen 12.03.15 10:30 12:30 02:00 Datensätze erstellen 13.03.15 09:30 11:30 02:00 Datensätze erstellen 13.03.15 15:00 16:00 01:00 Datensätze erstellen 14.03.15 10:30 12:00 01:30 Datensätze erstellen 15.03.15 11:00 13:30 02:30 Datensätze erstellen 18.03.15 11:00 12:00 01:00 Datensätze überarbeiten; Börsenkurse recherchieren 18.03.15 13:45 15:30 01:45 Börsenkurse recherchieren 20.03.15 09:30 11:30 02:00 Börsenkurse recherchieren 20.03.15 15:30 16:45 01:15 Dokumentation der Datensätze 21.03.15 10:00 11:00 01:00 Daten: Arff Datei erstellen; Java-Projekt aufsetzen 27.03.15 10:30 12:00 01:30 Weka lernen 16.04.15 17:15 20:15 03:00 Abschlussbericht strukturieren; mit WEKA experimentieren 17.04.15 12:45 14:15 01:30 Abschlussbericht strukturieren; ergänzen 22.04.15 15:15 17:30 02:15 Ergebnisse auswerten; Abschlussbericht schreiben 23.04.15 15:45 19:30 03:45 Abschlussbericht schreiben; Analyse mit R 22.05.15 14:30 16:00 01:30 Abschlussbericht schreiben 24.05.15 12:30 13:00 00:30 Korrekturlesen 27.05.15 17:30 18:00 00:30 Finalisieren Gesamt: 41:00 2 Implementierung 2.1 Technische Details Systemumgebung Mac OSX Yosemite, Version 10.10.2 Verwendete Bibliotheken und Programme Weka 3.6.12 RStudio 0.98.1103 mit R 3.2.0 1

2.2 Vorgehensweise 1. Testdaten erstellen 2. Analyse mit Weka und R: (a) Feature Extraktion (b) Erfolg vorhersagen 2.3 Testdaten Insgesamt gibt es 100 Datensätze, im ARFF Format, von 50 österreichischen Aktiengesellschaften. Die dafür verwendeten Daten entstammen den Bilanzen der jeweiligen Jahresfinanzberichte, aus dem Zeitraum 31.12.2011 bis 31.3.2014, die auf der Internetseite der Österreichischen Kontrollbank erhältlich sind.[1] Da sich Bank-Bilanzen zum Teil stark von Unternehmens-Bilanzen unterscheiden werden keine Daten von Banken verwendet. Die Datensätze bestehen aus dem jeweiligen Firmennamen, Abschlussdatum der Bilanz, der Ground-Truth, die Erfolg oder kein Erfolg symbolisiert, und folgenden 23 betriebswirtschaftlichen Kennzahlen: Direkt der Bilanz entnommene Kennzahlen: (in TEUR) Gesamtkapital Anlagevermögen Umlaufvermögen Eigenkapital Grundkapital Rückstellungen Verbindlichkeiten Umsatzerlöse Betriebserfolg Finanzerfolg EBT Jahresüberschuss Aus der Bilanz berechnete Kennzahlen: Eigenkapitalrentabilität (=Jahresüberschuss/Eigenkapital) Gesamtkapitalrentabilität (=EBT/Gesamtkapital) Umsatzrentabilität (=Betriebserfolg/Umsatz) Kapitalumschlag (=Umsatz/Gesamtkapital) Deckungsgrad A (=Eigenkapital/Anlagevermögen) 2

Vermögensintensität (=Anlagevermögen/Umlaufvermögen) Anlageintensität (=Anlagevermögen/Gesamtkapital) Umlaufintensität (=Umlaufvermögen/Gesamtkapital) Sachanlagenbindung (=Anlagevermögen/Umsatzerlöse) Eigenkapitalquote (=Eigenkapital/Gesamtkapital) Statischer Verschuldungsgrad (=(Verbindlichkeiten+Rückstellungen)/Gesamtkapital) Nicht berechenbare Kennzahlen (z.b. wegen Division durch 0) werden als 0 angenommen. Die Ground-Truth kann die Werte 1 oder 0 annehmen, wobei 1 für Erfolg und 0 für Kein Erfolg steht. Zur Ermittlung der Ground-Truth wurde der Aktienkurs des jeweiligen Unternehmens in den 6 Monaten nach Bilanzstichtag evaluiert und mit dem ursprünglichen Kurs am Bilanzstichtag und dem ATX verglichen: Kurs eher > als am Bilanzstichtag Kurs ca. gleich wie am Bilanzstichtag Kurs eher < als am Bilanzstichtag Kurs eher > als ATX Erfolg Erfolg Kein Erfolg Kurs ca. gleich ATX Erfolg Kein Erfolg Kein Erfolg Kurs eher < als ATX Erfolg Kein Erfolg Kein Erfolg Besonderheiten: Die Vorarlberger Kraftwerke AG (VKW) beschloss im Juni 2013 ein Delisting ihrer Aktie, da nur ein geringer Prozentsatz der Aktien gehandelt wurde. [2] Der Datensatz der VKW mit dem Datum 31.12.2012 wurde daher als Kein Erfolg angenommen. Die Intercell AG fusionierte im Mai 2013 mit Vivalis SA zu dem neuen Unternehmen Valneva SE.[3] Daher wurden die Kursdaten von Valneva SE verwendet. 2.4 Feature-Extraktion Die Feature Extraktion wurde mit der Weka Funktion SVMAttributeEval mit 10-facher Kreuzvalidierung durchgeführt. Die Funktion SVMAttributeEval verwendet einen SVM (Support Vector Machine) Klassifikator, bewertet die einzelnen Attribute mit dem Quadrat ihres SVM-Gewichts und reiht sie, indem sie diesen Wert jedes einzelnen Attributs relativ zu allen anderen evaluiert.[4] Folgende Reihung war das Resultat: (kursive Attribute sind berechnete, normal geschriebene absolute Kennzahlen) 3

Rang +- Attribut 1 0 Eigenkapitalquote 2,7 0,9 Statischer Verschuldungsgrad 3,3 0,9 Gesamtkapitalrentabilität vor Steuern 3,4 1,11 Betriebserfolg 6,2 4,31 Umlaufvermögen 8,3 1,9 Eigenkapitalrentabilität 8,6 2,84 Deckungsgrad A 8,7 2,05 Anlagevermögen 11,5 2,42 Umsatzerlöse 12,4 5,18 Jahresüberschuss 12,7 2,53 Umlaufintensität 13,3 5,48 EBT 13,4 4,59 Verbindlichkeiten 13,8 2,75 Rückstellungen 15,1 5,24 Kapitalumschlag 15,1 3,56 Sachanlagenbindung 15,2 5,25 Eigenkapital 15,5 2,94 Anlageintensität 17,3 5,57 Vermögensintensität 19,2 3,25 Grundkapital 19,4 3,41 Gesamtkapital 19,6 2,62 Finanzerfolg 20,3 1,68 Umsatzrentabilität Die Verteilung der absoluten und berechneten Attribute lässt vermuten, dass berechnete Attribute tendenziell aussagekräftiger sind als absolute. Die Mittelwerte der Durchschnittsränge unterstützen diese Vermutung: -Rang der berechneten Attribute: 10,9 -Rang der absoluten Attribute: 13,01 Es ist möglich, dass bei der Vorhersage von Erfolg an der Börse Relationen von Kennzahlen wichtiger sind als absolute Werte - es sind allerdings weitere, tiefergehendere Analysen notwendig um diese These zu prüfen. 2.4.1 Top 3 Attribute Die Boxplots wurden mit RStudio erstellt und zeigen die unterschiedliche Werteverteilung der beiden Klassen Erfolg und Kein Erfolg. Eigenkapitalquote Die Eigenkapitalquote ist der prozentuelle Anteil des Eigenkapitals am Gesamtkapital, und eindeutig die aussagekräftigste Kennzahl zur Vorhersage von Erfolg an der Börse. Viel Eigenkapital bedeutet wenig Fremdkapital und dies ist, zumindest an der österreichischen Börse, wichtig für eine positive Kursentwicklung. 4

Statischer Verschuldungsgrad Der statische Verschuldungsgrad ist der Anteil von Verbindlichkeiten und Rückstellungen am Gesamtkapital, also ein Gegenstück zur Eigenkapitalquote. Ein hoher Verschuldungsgrad korreliert, wie im Boxplot zu sehen ist, mit einer negativen Kursentwicklung. Gesamtkapitalrentabilität vor Steuern Die Gesamtkapitalrentabilität vor Steuern ist das Verhältnis von Betriebserfolg plus Finanzerfolg (=EBT, also Gewinn vor Steuern) zum eingesetzten Gesamtkapital. Auch diese Kennzahl hat eine große Aussagekraft bezüglich der zukünftigen wirtschaftlichen Entwicklung eines Unternehmens. 5

2.5 Erfolg vorhersagen Zur Vorhersage von Erfolg wurde der SMO Algorithmus von WEKA verwendet. SMO steht für Sequential minimal optimization und ist ein Algorithmus der auf dem Support Vector Machine Modell basiert. Mit dem SMO Algorithmus und 10-facher Kreuzvalidierung 1 konnten 60%, mit einer 80/20 Teilung der Daten 2 sogar 65% der Testdaten richtig klassifiziert werden. Wie in nachstehender Tabelle erkennbar ist, werden Testdaten, deren Ground Truth Erfolg ist, deutlich öfter richtig klassifiziert als die, deren Ground Truth Kein Erfolg ist. Weitere Analysen sind erforderlich um die Gründe hierfür herauszufinden. GT: Erfolg GT: Kein Erfolg Richtig Klassifiziert Klassifizierung: Erfolg 39 14 73,58% Klassifizierung: Kein Erfolg 26 21 44,68% Tabelle 1: Konfusionsmatrix: Klassifizierung gegen Ground Truth 2.5.1 Vergleich: Berechnete gegen absolute Kennzahlen Das Ergebnis der Feature Extraktion lässt vermuten, dass berechnete Kennzahlen aussagekräftiger sein könnten als absolute. Daher wurde der SMO Algorithmus ein weiteres Mal auf die Testdatensätze angewandt, diesmal allerdings einmal nur mit absoluten und einmal nur mit berechneten Kennzahlen. Die Resultate werden in folgender Tabelle dargestellt: absolut berechnet 10-fache Kreuzvalidierung 53% 59% 80/20 Teilung 40% 50% Tabelle 2: Richtig vorhergesagte Testdatensätze in % Auch diese Resulate stützen die These, dass berechnete Kennzahlen generell aussagekräftiger sind als absolute. Im Vergleich zur Vorhersage mit allen Kennzahlen schneidet der Algorithmus hier allerdings deutlich schwächer ab. 2.5.2 Top 5 Kennzahlen Um das Ergebnis der Feature Extraktion weiter zu validieren wurde der SMO Algorithmus nochmals, diesmal nur mit den Top 5 Kennzahlen (siehe 2.4 Feature Extraktion), angewandt. Sowohl mit 10-facher Kreuzvalidierung, als auch mit einer 80/20 Teilung konnten 1 Der SMO Algorithmus wird 10 mal durchgeführt, wobei jeweils 1/10 der Daten zum Testen verwendet wird. 2 80% der Daten werden zum Training, 20% zum Testen verwendet. 6

65% der Testdaten korrekt vorhergesagt werden. Das ist eine kleine Verbesserung im Vergleich zur Verwendung aller 23 Kennzahlen und unterstützt daher das Ergebnis der Feature Extraktion. 2.6 Conclusio Die Feature Extraktion lässt vermuten, dass berechnete Kennzahlen, für zukünftigen Erfolg an der Börse, tendenziell aussagekräftiger sind, als absolute. Die drei stärksten Kennzahlen sind Eigenkapitalquote, Statischer Verschuldungsgrad und Gesamtkapitalrentabilität vor Steuern. Jede dieser drei Kennzahlen ist berechnet und zeigt die Relation von jeweils einer anderen absoluten Größe zum Gesamtkapital an. Mit dem SMO Algorithmus konnten etwa 60% der Testdaten richtig klassifiziert werden. Weitere Versuche mit unterschiedlichen Kennzahlen-Kombinationen unterstützen die Ergebnisse und Erkenntnisse der Feature Extraktion. 3 Potenziale für Weiterentwicklungen Mehr Datensätze In dieser Arbeit wurden, wie im Abschnitt 2.3 erläutert, 100 Datensätze von 50 Unternehmen verwendet. Die Verwendung weiterer Datensätze würde zu noch genaueren Ergebnissen führen. Bankdaten Wie im Abschnitt 2.3 erwähnt, wurden bei dieser Arbeit keine Bankdaten verwendet, da sich Bankbilanzen deutlich von anderen Bilanzen unterscheiden. Das in dieser Arbeit beschriebene Verfahren kann auch auf Bankdaten angewandt werden. Weitergehende Analysen Die hier vorgestellten Ergebnisse könnten tiefergehender analysiert werden, um weitere Erkenntnisse zu gewinnen. Beispielsweise könnte untersucht werden, wie groß der tatsächliche qualitative Unterschied in der Aussagekraft von berechneten und absoluten Kennzahlen ist. Andere Börsen evaluieren In dieser Arbeit wurden nur Unternehmen der österreichischen Börse berücksichtigt. Sämtliche Ergebnisse sind daher nur für Österreich gültig. Das gleiche Verfahren könnte aber ohne weiteres auf jede beliebige andere Börse angewandt werden. Möglicherweise ist die Aussagekraft von Kennzahlen nicht überall gleich stark. 7

Literatur [1] http://issuerinfo.oekb.at, 18.3.2015 [2] https://www.vkw.at/inhalt/at/unternehmen-investoren.htm, 18.3.2015 [3] http://derstandard.at/1363710916654/ Der-Name-Intercell-verschwindet-vom-Kurszettel, 18.3.2015 [4] http://weka.sourceforge.net/doc.packages/svmattributeeval/ weka/attributeselection/svmattributeeval.html, 22.4.2015 8