Erfolgstypen & Typenerfolg



Ähnliche Dokumente
Auf der Suche nach den Brabänder schen Schätzen

Forstbetriebe Zentraleuropas im direkten Leistungsvergleich

Differenzierung der Buchführungsergebnisse anhand einer forstlichen Betriebszweigabrechnung

Körberlgeld, wirtschaftliche Standbeine. und Fässer ohne Boden Nebenerträge und Nebenbetriebe im Lichte der Betriebsabrechnung

Diversifikation im Lichte einer multifunktionalen Waldbewirtschaftung und des Risikomanagements

Statistische Datenanalyse

Prädiktion und Klassifikation mit

Die Regressionsanalyse

Kreditwürdigkeitsprüfung

Statistische Methoden in der Geographie

Entscheidungsbäume aus großen Datenbanken: SLIQ

Inhaltsverzeichnis. 1 Über dieses Buch Zum Inhalt dieses Buches Danksagung Zur Relevanz der Statistik...

Inhalt. I Einführung. Kapitel 1 Konzept des Buches Kapitel 2 Messen in der Psychologie... 27

Polynomiale Regression lässt sich mittels einer Transformation der Merkmale auf multiple lineare Regression zurückführen

Multivariate Statistik

Entscheidungsbäume. Minh-Khanh Do Erlangen,

Vergleich von SVM und Regel- und Entscheidungsbaum-Lernern

» S C H R I T T - F Ü R - S C H R I T T - A N L E I T U N G «M U L T I P L E L I N E A R E R E G R E S S I O N M I T S P S S / I B M Daniela Keller

Institut für Statistik und Mathematische Wirtschaftstheorie Universität Augsburg. Datenanalyse II. Stefan Etschberger Sommersemester 2005

Inhalt. 1 Unvollständige Clusteranalyseverfahren 35

4.1. Verteilungsannahmen des Fehlers. 4. Statistik im multiplen Regressionsmodell Verteilungsannahmen des Fehlers

1 Beispiele multivariater Datensätze... 3

Typologisierung schweizerischer Forstbetriebe

Rainer Diaz-Bone. Statistik für. Soziologen. 3M erweiterte Auflage. UVK Verlagsgesellschaft mbh Konstanz mit UVK/Lucius München

Logistische Regression

llen Betriebsergebnis Kostenstellen BAB Betriebskoeffizient Reinertrag Leistung Kosten Hiebssatz Einschlag

Marktforschung. Methodische Grundlagen und praktische Anwendung. Prof. Dr. L. Berekoven, Dipl.-Kfm. W. Eckert, Dipl.-Kfm. P.

fh management, communication & it Constantin von Craushaar fh-management, communication & it Statistik Angewandte Statistik

Statistik, Geostatistik

Einführung in das Maschinelle Lernen I

Statistische Methoden in der Wirtschaftsund Sozialgeographie

Statistikpraktikum. Carsten Rezny. Sommersemester Institut für angewandte Mathematik Universität Bonn

Statistik- und SPSS-Inhouse-Schulungen von HEUTE UND MORGEN Ansprechpartner: Dr. Michaela Brocke, ,

Reihe: Electronic Commerce Band 22

Beispiel: Multiples Modell/Omitted Variable Bias I

Analytics Entscheidungsbäume

BERICHTE FREIBURGER FORSTLICHE FORSCHUNG

Clusteranalyse. Anwendungsorientierte Einführung. R. Oldenbourg Verlag München Wien. Von Dr. Johann Bacher

Human-machine learning im Bereich Soccer Analytics Vergleich verschiedener Prognoseansätze am Beispiel Fußball

Seilkranhiebe. oder: Klaus Dinser. Amt für Ernährung, Landwirtschaft und Forsten Kempten (Allgäu)

Erfolgreiche Strategien in der (Bio)- Milchproduktion: eine empirische Analyse

Annahmen des linearen Modells

INHALTSÜBERSICHT. 4. Teil: Ausgewählte Anwendungen der Marktforschung Produktforschung Werbeforschung Preisforschung...

Statistik Einführung // Stichprobenverteilung 6 p.2/26

Lineare Diskriminanzanalyse Ein sehr kurzer Einblick

Multivariate Verfahren

Multivariate Lineare Modelle SS Einführung. 1. Organisation. 2. Übersicht. 3. Arbeiten mit SAS

Motivation. Klassifikationsverfahren sagen ein abhängiges nominales Merkmal anhand einem oder mehrerer unabhängiger metrischer Merkmale voraus

10.5 Maximum-Likelihood Klassifikation (I)

Übung V Lineares Regressionsmodell

1 Prognoseverfahren F H

Klassifikation von Wald und Sträuchern anhand multitemporaler RapidEye-Daten - eine Landbedeckungsklassifikation in Südhessen

Deskriptive Beschreibung linearer Zusammenhänge

QUANTITATIVE VS QUALITATIVE STUDIEN

Übung 4 im Fach "Biometrie / Q1"

Modellierung einer forstlichen Betriebszweigabrechnung für freiwillig buchführende Betriebe

Teil: lineare Regression

Schweizer Statistiktage, Aarau, 18. Nov. 2004

Lineare Regression 2: Gute Vorhersagen

Zufallsvariablen. Diskret. Stetig. Verteilung der Stichprobenkennzahlen. Binomial Hypergeometrisch Poisson. Normal Lognormal Exponential

Inhalt. 4.1 Motivation. 4.2 Evaluation. 4.3 Logistische Regression. 4.4 k-nächste Nachbarn. 4.5 Naïve Bayes. 4.6 Entscheidungsbäume

Validation Model Selection Kreuz-Validierung Handlungsanweisungen. Validation. Oktober, von 20 Validation

Lineare Algebra, Optimierung, Wahrscheinlichkeitsrechnung und Statistik

Empirische Forschungsmethoden

Angewandte Statistik 3. Semester

Einführung in die Statistik

JOACHIM BEHNKE / NINA BAUR / NATHALIE BEHNKE. Empirische Methoden der Politikwissenschaft

Nachhaltigkeitsbewertung

Regressionsanalysen mit Stata

Dokumentation und Qualita tsindiktoren in der Notaufnahme

1 Grundlagen der Wahrscheinlichkeitsrechnung Wahrscheinlichkeitsräume. Ein erster mathematischer Blick auf Zufallsexperimente...

5 Beschreibung und Analyse empirischer Zusammenhänge

Techniker Krankenkasse, Heiko Schulz (Bereich Personal)

Kann SAS Ihre Handschrift lesen? Machine Learning am Beispiel von Stacked Denoising Autoencoders

Multivariate Statistische Methoden

Was sind Kennzahlen? Chancen und Risiken für das Management

Statistik für das Psychologiestudium

ELEMENTARE EINFÜHRUNG IN DIE MATHEMATISCHE STATISTIK

Lehr- und Übungsbuch der angewandten Statistik. Von Dr. Bärbel Elpelt und. O. Prof. Dr. Joachim Hartung Fachbereich Statistik der Universität Dortmund

Transkript:

Erfolgstypen & Typenerfolg Zum Zusammenhang zwischen betriebstypologischen Merkmalen und Indikatoren des Betriebserfolgs Philipp Toscani Institut für Agrar- und Forstökonomie

Methodische Aspekte und analytische Potentiale forstökonomischer Untersuchungen am Beispiel der DACH Region Dissertationsprojekt mit dem Ziel verborgene Schätze in etablierten Dokumentationssystemen (BRABÄNDER, 1980) zu heben und Ansätze zur Weiterentwicklung vorhandener Strukturen und Methoden zu entwickeln 1. Aufzeigen, welche Informationen durch Testbetriebsnetze (TBN) der DACH Region standardisiert bzw. durch Sonderauswertungen geliefert werden können 2. Weiterentwicklung einer Betriebszweigabrechnung Forst für kombiniert land- und forstwirtschaftliche Betriebe 3. Identifikation betriebstypologischer Erfolgsmerkmale 2

Betriebstypologien Wozu? Ausgangssituation Kein (Forst)betrieb gleicht dem anderen Bei aller Unterschiedlichkeit gibt es aber auch Gemeinsamkeiten Allgemeines Ziel Zusammenfassung von Betrieben mit ähnlichen Eigenschaften Aber zu welchem ZWECK? 3

Methodische Ansätze Betriebstypologien haben eine lange Tradition Historisch Einteilung nach einzelnen Merkmalen wie Fläche, Waldbesitzart, räumlicher Bezug, etc. (vgl. Dieterich, 1931) Aktuell Computer ermöglichen mehrdimensionale Ähnlichkeitsbeziehungen zu erkennen (vgl. Speich, 1979); (deterministische) clusteranalytische Verfahren In dieser Arbeit: Random Forest (RF): Ein Verfahren zur Klassifikation und Regression (Entscheidungsbaum-basiert) 4

(N)ever change a running system Problemfelder im Umfeld der Clusteranalyse Variablenauswahl: Garbage in, garbage out Faktorenanalyse: Verdichtung vs. Interpretation Skalenniveaus: Normierung der Variablen erforderlich? Normalverteilung: relevant? Korrelation: Bei hoher Korrelation ist Ausschluss erforderlich Variablenanzahl: wenige Beobachtungen wenige Variablen? 5

Random Forest ein Wald aus Entscheidungsbäumen Ein Klassifikationsverfahren der besonderen Art 2001 vorgestellt von Leo Breiman Ermöglicht die Entscheidungsbaum-basierte Klassifikation und Regression von Datensätzen Unbeschränkt bei der Anzahl erklärender Variablen Werte müssen nicht normalverteilt sein Effizientes Arbeiten mit vieldimensionalen Datensätzen Ermittlung von Wichtigkeitsmaßen der erklärenden Variablen 6

Random Forest Ablauf der Klassifikation Zufälliges ziehen (mit Zurücklegen) eines Trainingsdatensatzes (= bootstrapping) Aufteilung in ca. 64% Trainingsdaten und 36% Validierungsdaten Erstellen eines Entscheidungsbaumes mit folgenden Bedingungen: An jedem Knoten zufälliges ziehen erklärender Variablen Bestes Teilungsergebnis dieser Variablen wird genommen Entscheidungsbaum wächst weiter bis zu einem Abbruchkriterium Vom Baum zum Wald? 7

Material - der Datensatz Spezialauswertung Testbetriebsnetz Österreich (> 500ha) 1998-2013 Variablen Betriebsstruktur Naturaldaten FinOpDaten Summe Datensätze Σ mit NAs Σ ohne NAs Median 1998-2013 18 28 71 117 127 43 Median 1998 2013 ohne NAs 18 9 53 80 127 127 NAs. Fehlende Werte Betriebsstruktur nicht beeinflussbare Rahmenbedingungen (keine/kaum Schwankungen) Naturaldaten kurzfristig nicht beeinflussbare Rahmenbedingungen (geringe Schwankungen) FinOpDaten Finanzielle und operative Daten: kurzfristig beeinflussbar (jährlich starke Schwankungen) vgl. Selter, 2006 8

Ziele dieser Untersuchung 1. Überprüfung bestehender Typologien Inwieweit lassen sich die im TBN Österreich gebräuchlichen Typologien anhand des Datensatzes abbilden? 2. Identifikation betrieblicher Erfolgsmerkmale Welche betrieblichen Merkmale im Datensatz stehen in Zusammenhang mit dem Betriebserfolg? 3. Erstellung einer Betriebstypologie Aufbauend auf den erfolgsrelevanten Variablen. 9

Überprüfung bestehender Typologien Illustriert am Beispiel der Forstwirtschaftlichen Produktionsgebiete Forstwirtschaftliche Produktionsgebiete nach Frauendorfer (1968) 2. Identifikation betrieblicher Erfolgsmerkmale Welche betrieblichen Merkmale im Datensatz stehen in Zusammenhang mit dem Betriebserfolg? 3. Erstellung einer Betriebstypologie Aufbauend auf den erfolgsrelevanten Variablen. 10 Abbildung nach Ronijak (1993, S. 66)

Überprüfung bestehender Typologien Illustriert am Beispiel der Forstwirtschaftlichen Produktionsgebiete Forstwirtschaftliche Produktionsgebiete nach Frauendorfer (1968) Ansatz Forstwirtschaftliche Produktionsgebiete (FoPG) entsprechen einer Klasse RF zur Klassifikation nutzen ( trainieren ) Beurteilung von: Klassifikationsgenauigkeit Trennbarkeit der Klassen Identifikation der wichtigen Variablen 11

Überprüfung bestehender Typologien (2) Illustriert am Beispiel der Forstwirtschaftlichen Produktionsgebiete Beispiel eines Entscheidungsbaumes 12

Überprüfung bestehender Typologien (3) Illustriert am Beispiel der Forstwirtschaftlichen Produktionsgebiete Klassifikationsgenauigkeit: 68,5% Trennbarkeit der Klassen (Confusion Matrix) FoPG 1 2 3 4 5 6 User Acc. 1 2 0 0 0 0 0 1,00 2 5 25 0 6 1 0 0,68 3 1 1 9 0 0 0 0,82 4 0 5 1 19 4 5 0,56 5 0 1 0 6 31 4 0,74 6 0 0 0 0 0 1 1,00 Producer Accuracy 0,25 0,78 0,90 0,61 0,86 0,10 Wichtigste Variablen Betriebsstruktur Naturaldaten FinOpDaten

Betriebliche Erfolgsmerkmale Illustriert am Beispiel Erfolg Holzproduktion je ha Wirtschaftswald Ansatz Regressionsschätzung für den Erfolg der Holzproduktion je ha Wirtschaftswald Ausschluss von Variablen, welche den Erfolg implizit beinhalten (z.b. Wertschöpfung je ha) Beurteilung der Erklärungskraft der Regression Identifikation der wichtigen Variablen 14

Betriebliche Erfolgsmerkmale (2) Illustriert am Beispiel Erfolg Holzproduktion je ha Wirtschaftswald Erklärungskraft mit allen Variablen: 80,0 % Erklärungskraft mit 10 wichtigste Variablen: 82,0 % Betriebsstruktur Naturaldaten FinOpDaten 15

Erstellen einer erfolgsorientierten Betriebstypologie (to do) basierend auf der Variablenauswahl der Regressionsschätzung Zwei mögliche Wege Clusteranalytisches Verfahren: Einsatz eines nichtüberlappenden deterministischen Verfahrens z.b. k-means oder Ward Clusterung mittels Random Forest: Entspricht einer unüberwachten Klassifikation 16

Schlussfolgerungen Die für das TBN Österreich vorhandenen Typologien können nur teilweise anhand der ausgewerteten Kennzahlen abgebildet werden Der Betriebserfolg lässt sich anhand der ausgewerteten Kennzahlen in hohem Maße erklären; hohe Erklärungskraft haben dabei kurzfristig beeinflussbare Variablen (Finanzielle und Operative Daten) Random Forest kann helfen: das Wissen über bestehende Typologien zu erhöhen eine Auswahl von aussagekräftigen Variablen zu treffen 17

Institut für Agrar- und Forstökonomie Philipp Toscani philipp.toscani@boku.ac.at Feistmantelstraße 4 A-1180 Vienna Tel.: +43 1 47654-4406 Fax: +43 1 47654-3592 www.boku.ac.at/afo

Quellen Brabänder, Horst Dieter: Zehn Jahre Betriebsvergleich im Privatwald Department von für Wirtschafts- und Westfalen-Lippe. Allgemeine Forstzeitschrift 35, Nr. 7 (1980): 145 148. Breiman, Leo: Random forests. In: Machine learning Bd. 45 (2001), Nr. 1, S. 5 32 Dieterich, Victor: Versuch einer Systematik forstwirtschaftlicher Betriebe. Silva 1931/25. In: Hasel Karl (Hrsg.): Gesammelte Aufsätze, insbesondere zur forstlichen Wirtschaftslehre. Ministerium für Ernährung, Landwirtschaft und Umwelt, Baden- Württemberg, 1976 Ronijak, Gottfried: Forstbetriebswirtschaftliche Analysen auf Basis von Testbetriebsnetzen. Diplomarbeit an der Universität für Bodenkultur, Wien (1993) Selter, Andy: Der Einsatz multivariater statistischer Methoden zur Erarbeitung einer Betriebstypologie für den bäuerlichen Privatwald. Dissertation an der Albert-Ludwigs- Universität Freiburg.(2006) Speich, A.: Eine Typologie der Forstbetriebe. Forstarchiv 50 (1979). S. 134-137 19