Prognose der Überlebenswahrscheinlichkeit von Ich-AG s nach drei Jahren

Ähnliche Dokumente
Nachwuchssituation und Bedarfsprognose der Berufsgruppe der Psychologischen Psychotherapeuten in Schleswig-Holstein

4. Empirische Momente von ZR. 4. Empirische Momente von ZR. 4. Empirische Momente von ZR. 4. Empirische Momente von ZR

Übungsaufgaben, Statistik 1

Demographie und Fußball

Statistische Tests (Signifikanztests)

12GE1 - Wiederholung - Verbesserung Praktikum 01

Übungsscheinklausur,

1 Lambert-Beersches Gesetz

Kapitel 4. Thermodynamisches Gleichgewicht zwischen zwei Systemen. 4.1 Systeme im thermischen Kontakt 1; E 1 =? 2; E 2 =?

Kurzfassung des Forschungsberichts 9/2017 Arbeitsmarktspiegel - Entwicklungen nach Einführung des Mindestlohns (Ausgabe 4)

Politische Arbeitsgruppe der Kantone «Finanzausgleich» Anhang zum Schlussbericht

12. Vorlesung. 19. Dezember 2006 Guido Schäfer

Übungen mit dem Applet Vergleich von zwei Mittelwerten

Geburten und Schwangerschaftsabbrüche bei Jugendlichen. Trend bei den Geburten insgesamt (alle Geburten in Deutschland): fallend

8. Konfidenzintervalle und Hypothesentests

Zeigen Sie mittles vollständiger Induktion, dass für jede natürliche Zahl n 1 gilt: n (2k 1) = n 2.

Controlling mit Excel Jan Götzelmann. 1. Ausgabe, 1. Aktualisierung, März Themen-Special W-EX2010C

Protokoll Grundpraktikum I: T6 Thermoelement und newtonsches Abkühlungsgesetz

Dynamische Systeme und Zeitreihenanalyse // Beschreiben von Zeitreihen 9 p.2/??

2.4 Entscheidung bei Risiko

Grundlagen der Biometrie in Agrarwissenschaften / Ernährungswissenschaften

Orientierungshilfe zum 8. Hausaufgabenblatt. 25. Januar 2013

Klassifikation von Signifikanztests

Binomialverteilung Vertrauensbereich für den Anteil

Fehler- und Ausgleichsrechnung

Diagnose und Prognose: Kurzfassung 4

Protokoll Grundpraktikum: O1 Dünne Linsen

Konformitätsaussagen in Kalibrierzertifikaten

Kapitel GWBS:III. III. Regeln mit Konfidenzen. Einführung. Verrechnung von Konfidenzen. Probleme des Ansatzes. Beispiel für ein Diagnosesystem

Zur Berechnung der Wertziffern bei Teamturnieren

Formalstruktur: Zur Abbildung der Struktur eines mehrstufigen Entscheidungsproblems ist der Entscheidungsbaum geeignet (ungerichteter Graph)

PRIIP-KID: Performance-Szenarien aktuell überarbeiteter RTS

4 Zusammenfassung 111

Zeigen Sie mittles vollständiger Induktion, dass für jede natürliche Zahl n 1 gilt: k = n (n + 1) 2

Deutsche sind Sparfüchse

Aufgabenblock 4. Da Körpergröße normalverteilt ist, erhalten wir aus der Tabelle der t-verteilung bei df = 19 und α = 0.05 den Wert t 19,97.

Kapitel 5. Prognose. Zeitreihenanalyse wird aus drei Gründen betrieben: Beschreibung des Verlaufs von Zeitreihen.

Forschungsstatistik I

FERNUNIVERSITÄT IN HAGEN WIRTSCHAFTSWISSENSCHAFT

Anhang D: Diagramme und Messdaten zu Ziffer 4.5, Korrelation zwischen Substratmenge und Amin-Freisetzung

Johann Wolfgang Goethe-Universität Frankfurt am Main

Statistik Testverfahren. Heinz Holling Günther Gediga. Bachelorstudium Psychologie. hogrefe.de

Zeitreihenanalyse Das Holt-Winters-Verfahren

Kurzinformation. Ermittlung der Jahresdurchschnittswerte Bestand Arbeitslose 2005

6. Das klassische Komponentenmodell. 6. Das klassische Komponentenmodell. 6. Das klassische Komponentenmodell. 6. Das klassische Komponentenmodell

Überlegungen zur Leistung und zum Wirkungsgrad von Solarkochern

SigmaDeWe Risikomanagement

F r a g e n k a t a l o g

R. Brinkmann Seite

Entwurf Gesetzestext Stand Artikel 1 Änderung des Erneuerbare-Energien-Gesetzes

Vorlesung 6: Alternativen zur Erwartungsnutzentheorie

Kapitel X - Lineare Regression

Antwort zu Aufgabe 1.1

Monotonie, Konkavität und Extrema

Bei 10 dieser Würfe wurde gleichzeitig eine 1 gewürfelt. Bei 25 dieser Würfe wurde gleichzeitig eine Augenzahl größer als 2 gewürfelt.

WOHNUNGSMARKT UND STADTENTWICKLUNG ALTE UND NEUE HERAUSFORDERUNGEN FÜR DIE PLANUNG. Großräumiger Trend der Bevölkerungsentwicklung bis 2050

Autofokus für das MONET-Teleskop. Projektwoche 2013 im Pascal-Gymnasium Münster AiM-Projektgruppe

Pro-Kopf-Ausgaben für Kindertagesbetreuung im Zehn-Jahres-Vergleich: 2006 bis 2015

Beurteilende Statistik

STAR: Kostenstrukturen in Anwaltskanzleien 1994 und 1998

Moderne Theoretische Physik III (Theorie F Statistische Mechanik) SS 17

Online-Aufgaben Statistik (BIOL, CHAB) Auswertung und Lösung

Übungsblatt Einführung in die Demographie WS 2015/16 Abgabe bis zum in der Übung!

Multivariate Verfahren

Gesundheitsentwicklung in Deutschland bis Eine volkswirtschaftliche Kostensimulation

4.1. Campylobacter-Keimzahlen auf Hähnchenschenkeln innerhalb einer Handels- Packung

Hauptdiplomprüfung Statik und Dynamik Pflichtfach

Methode der kleinsten Quadrate

Vergleich zweier Erwartungwerte. Wir vereinfachen die Aufgabe zuerst auf einen Einflussfaktor A mit k=2 Stufen: Wir prüfen:

Lineares Wachstum/exponentielles Wachstum

R. Brinkmann Seite

Musterlösung Übung 4

Thüringer Landesanstalt für Landwirtschaft. Einfluss der Aufzuchtintensität auf die Lebensleistung und Nutzungsdauer von Milchkühen

Folgen und Reihen. 1 Konvergenz

Stadt Ingolstadt Statistik und Stadtforschung. Pflege in Ingolstadt. Strukturen, Entwicklung 1999 bis 2013 und Prognose 2014 bis 2034

Physikalische Chemie Praktikum. Elektrolyte: Dissoziationskonstante von Essigsäure λ von NaCl ist zu ermitteln

Pressemitteilung. Tübingen und Linz, 7. Februar 2017

1 Grundprinzipien statistischer Schlußweisen

Verteilungen eindimensionaler stetiger Zufallsvariablen Stetige Verteilungen. Chi-Quadrat-Verteilung Studentverteilung Fisher-Verteilung

Wahrscheinlichkeitstheorie und Statistik vom

Komplexe Zahlen. z = a + i b

Stadtforschung aktuell

Allgemeines zu Tests. Statistische Hypothesentests

1 Beispiel zur Methode der kleinsten Quadrate

7. Wettervorhersage und Vorhersagbarkeit (aus der Theorie-Vorlesung von K. Fraedrich)

Folgen und Reihen Folgen

Richtlinie E-16. Angabe der Messunsicherheit in Eichscheinen. Einleitung

Lösungen zur deskriptiven Statistik

Bonus-/Probeklausur VWL I - Mikroökonomie 13. Dezember 2008

1. Einführung in die induktive Statistik

Konfidenzintervalle Grundlegendes Prinzip Erwartungswert Bekannte Varianz Unbekannte Varianz Anteilswert Differenzen von Erwartungswert Anteilswert

Statistik-Klausur vom

Mögliche Fehler beim Testen

Informationen zur Windmessung und Zusammenfassung der Ertragsberechnung vom

Zur Berechnung der Abschreibungen eines Wirtschaftsgutes liegen folgende Daten vor:

Einführung in die (induktive) Statistik

Bericht des Schätzerkreises zur Entwicklung der Einnahmen und Ausgaben in der gesetzlichen Krankenversicherung für die Jahre 2009 und 2010

Test von Hypothesen: Signifikanz des Zusammenhangs (F-Test)

Stichproben Parameterschätzung Konfidenzintervalle:

2. Lösung weitere Übungsaufgaben Statistik II WiSe 2016/2017

Transkript:

Prognose der Überlebenswahrscheinlichkeit von Ich-AG s nach drei Jahren Dr. Martin Treiber 3.2.25 1 Ausgangsdaten Die Daten vom Statistischen Bundesamt geben den monatlichen Zugang z t und den Bestand B t an Ich-AG s seit der Einführung dieser Betriebsform im Januar 23 an. Der Index t gibt die Kalenderzeiten in Monaten seit Dezember 22 an, also z.b. t = 5 für Mai 23. Aus der Bilanzgleichung B t = B t 1 + z t a t (1) erhält man daraus den monatlichen Abgang a t, d.h. die Zahl der Ich-AGs, welche in diesen Monat -aus welche Gründen auch immer - aufgegeben haben, vgl. Abb. 1. Zu bemerken ist, dass sich für den Oktober 23 (Monat 8) eine Inkonsistenz ergibt, da für diesen Monat die Bestandsänderung größer als die Zugangsrate ist, einige Ich-AGs also ohne Zugangsmeldung entstanden sind, d.h. a 8 negativ ist. Für die durchgeführte Prognose ist dies jedoch unerheblich. Außerdem scheinen jeweils die Daten des letzten Monats mit Unsicherheit behaftet zu sein. Im Januar 25 wurde der Bestand an Ich- AGs für den Dezember 24 nach oben korrigiert, wodurch sich rückwirkend die nach (1) errechnete Abgangsrate für Dezember von etwa 8 auf unter 5 erniedrigt (vgl. Abb. 1). Dies deutet darauf hin, dass die aktuelle Januar-Zahl möglicherweise ebenfalls nicht endgültig ist und u. U. noch nach unten korrigiert werden wird. Die Frage besteht, welche Überlebenswahrscheinlichkeit für dreijährige Ich-AGs längerfristig zu erwarten ist und inwieweit man diese bereits aus den Daten abschätzen kann - noch ist ja die älteste Ich-AG (Stand Januar 25) erst 25 Monate alt. Diese Frage, auf die mich freundlicherweise Dr. Andreas Lutz von www.ueberbrueckungsgeld.de aufmerksam gemacht hat, wird in den Medien ziemlich kontrovers diskutiert. Für einen ziemlich drastischen Artikel siehe einen Bericht von Spiegel-Online. 1

3 25 Monatlicher Zugang Monatlicher Abgang (Stand Januar 25) Monatlicher Abgang (Stand Dezember 24) Monatlicher Zu- und Abgang 2 15 1 5 5 1 15 2 25 t (Monate seit Dez. 22) Abbildung 1: Ausgangsdaten für den monatlichen Zu- und Abgang von Ich-AGs. 2 Verwendetes Modell und Kalibrierung Eine modellgestützte Prognose beruht i.a. darauf, dass es in der zu prognostizierenden Dynamik auch einige mehr oder weniger unveränderliche Größen und dazugehörige Modelle mit diesen Größen als Parameter gibt. Die modellgestützte Prognose wird dann in zwei Schritten durchgeführt: 1. Kalibrierung: Festlegung der Werte der Modellparameter, so dass die gegenwärtigen Daten möglichst gut beschrieben werden, 2. Prognose: Die kalibrierten Modellparameter werden unverändert in die Zukunft fortgeschrieben und die Dynamik mit dem Modell berechnet. Als relativ unveränderliche Größen habe ich die bedingten Aufgabewahrscheinlichkeiten α τ = P (Aufgabe der Ich-AG im Monat τ) = const. (2) identifiziert. Die Bedingung für diese Wahrscheinlichkeit ist, dass die Ich-AG im Vormonat existierte. Diese Wahrscheinlichkeit hängt nur vom Alter τ der Ich-AG, nicht jedoch von deren Gründungszeitpunkt t ab. Des Weiteren nehme ich auch für die Abhängigkeit vom Alter der Ich-AG nur zwei Parameter an: { αcrit τ = 12 oder 13 α τ = (3) sonst. α 2

Hintergrund ist, dass die Reduzierung der Förderung nach Abschluss von 12 Monaten ein kritisches Alter für Ich-AGs darstellt, so dass im letzten Monat der vollen Förderung und im ersten Monat der reduzierten Förderung eine erhöhte Ausfallwahrscheinlichkeit α crit gilt, während in allen anderen Monaten davor und danach die geringere Ausfallwahrscheinlichkeit α angenommen wird. Dieser geringere Wert wird auch für die Prognose angenommen. Zwar weisen die Daten vom Januar 25 auf ein weiteres kritisches Alter nach zweijährigem Bestehen hin. Wegen der oben diskutierten Unsicherheit der Daten wird dies jedoch noch nicht im Prognosemodell berücksichtigt. Bei Kenntnis der Zugangsraten z t im Monat t kann man aus dem Modell (2) alle relevanten statistischen Größen errechnen, z.b. die Überlebenswahrscheinlichkeit einer τ > 1 Monate alten Ich-AG, u τ = u 1 τ τ =2 (1 α τ ) = u 1 (1 α 2 )(1 α 3 )... (1 α τ ) (4) mit u 1 = 1, da die innerhalb ein -und desselben Monats an- und abgemeldeten Ich-AGs nicht in der Statistik auftauchen, die Abgänge im Monat t 2 1 (es gilt a 1 = ), a t = t 1 t =1 z t u t t α t t +1 (5) den Bestand, und die kumulierten Abgänge t B t = (z t a t ) (6) t =1 t A t = a t. (7) t =1 Zur Kalibrierung verwende ich die kumulierte Abgangsrate A t, da die monatlichen Einzeldaten für Kalibrierungszwecke zu stark schwanken. Abbildung 2 zeigt eine Kalibrierung der vom Modell (2)-(5) ermittelten Größe (7) an die Daten. Im vorliegenden Fall kann man α und α crit weitgehend separat bestimmen, da für die ersten 11 Monate nur α relevant ist und die Kalibrierung von α crit mit dem vollen Datensatz wegen der Kleinheit von α weitgehend unabhängig vom Wert α ist. Zur Kalibrierung wird die Least-Square Methode angewandt, d.h. die Fehlerquadratsumme F = 24 t=1 (Ãt A t ) 2! = min α,α crit (8) 1 der Buchstabe t gibt Kalenderzeiten in Monaten seit Dezember 22 an, während τ das Alter von Ich-AGs in Monaten bezeichnet 3

7 6 Daten (Stand Jan. 25) Daten (Stand Dez. 24) Modell (α =.55, α crit =.23) Modell (α =.6, α crit =.216) Kumulierter Abgang an Ich-AGs 5 4 3 2 1 5 1 15 2 25 t (Monate seit Dez. 22) 3 25 Daten Modell (α =.55, α crit =.23) Kumulierter Abgang an Ich-AGs 2 15 1 5 2 4 6 8 1 12 t (Monate seit Dez. 22) Abbildung 2: Kalibrierung der Modellparameter α crit und α anhand der Zeitreihe der kumulierten Abgangszahl. Oben: Gesamter Kalibrierungszeitraum. Unten: Das erste Jahr, in dem, abgesehen vom letzen Monat, nur der Modellparameter α wirksam ist. Die Kalibrierung wurde für die im Haupttext näher spezifizierten Szenarien 1 (rote Kurven) und 3 (blaue Kurve) durchgeführt. 4

zwischen den aus den Daten mit (1), (7) und dem Modell (2), (7) errechneten Werten à t bzw. A t bezüglich der Parameter α und α crit minimiert. Die kalibrierten Werte der Modellparameter betragen α =.55%, α crit = 23.%. (9) Als Maß für die Güte der Kalibrierung und des Modells kann das Unbestimmtheitsmaß U = 24 t=1 24 (Ãt A t ) 2 24 (Ãt = F Ā) 2 (Ãt Ā) 2 (1) t=1 t=1 dienen. Würde man den Verlauf von A t durch eine Konstante beschreiben, A t = c, so würde das Optimum dieser Konstante beim arithmetischen Mittel c = Ā erreicht und das dazugehörige Unbestimmtheitsmaß wäre U = 1, Mit dem vorliegenden Modell wird hingegen ein sehr viel kleineres Unbestimmtheitsmaß von U =.48 erreicht. 3 Prognose Die Prognose hängt im Wesentlichen vom Modellparameter α crit und in wesentich geringerem Maße vom Parameter α sowie der monatlichen Zugangsrate ab. Letztere wurde für den Prognosezeitraum als konstant angenommen. Um zu überprüfen, inwieweit die möglicherweise in der Zukunft noch zu korrigierenden letzten Datenpunkte vom Januar 25 das Ergebnis beeinflussen, wurde die Kalibrierung und Prognose auch ohne Berücksichtigung der Januar-Werte durchgeführt, wobei für den Dezember 24 der korrigierte Wert des Bestands verwendet wurde. Die Kalibrierung ergibt für diesen Fall die Werte α =.6%, α crit = 21.6%, U =.22. (11) Um allfällige Fehler bei den Daten, der Modellierung und der angenommenen Zugangsrate abzuschätzen, wurde die Prognose für drei Szenarien durchgeführt: Szenario 1: Es werden alle Datenpunkte und die im vorigen Abschnitt gewonnenen kalibrierten Werte für die bedingten Ausstiegswahrscheinlichkeiten α und α crit vewendet, vgl. (9). Ferner wurde für den Prognosezeitraum eine konstante monatliche Zugangsrate von 15 angenommen. Szenario2: Wie oben, aber für die Kalibrierung wurden nur Daten bis einschließlich Dezember 24, also die Werte von Gl. (11) verwendet. Szenario 3: Wie Szenario 1, aber mit einer verminderten extrapolierten Zugangsrate von 1 pro Monat. 5

7 6 Individuelle Ausstiegswahrscheinlichkeit in den Szenarios 1 und 3 Szenario 2 Szenario 4 Ausstiegswahrscheinlichkeit (%) 5 4 3 2 1 5 1 15 2 25 3 35 Individuelles Alter der Ich-AG (Monate) Abbildung 3: Prognose der Ausfallwahrscheinlichkeit einer einmal gegründeten Ich-AG als Funktion ihres Alters für die drei im Haupttext definierten Szenarien. Die Abbildungen 3-5 stellen Ergebnisse der Prognose dar. Szenario 1 ist dabei das Referenz-Szenario für die bestmögliche Prognose, während die anderen Szenarios für die Fehlerabschätzung dienen. Als zusätzlicher Backtest der Prognosegüte wurden dem Modell in einem vierten Szenario nur die Daten bis einschließlich Juni 24 zur Verfügung gestellt und die Kalbrierung und Prognose für weitere 12 Monate wie oben durchgeführt. Es ergaben sich geringfügig andere kalibrierte Werte für die bedingten Ausfallwahrscheinlichkeiten und natürlich auch andere prognostizierte Zugangsraten (vgl. Bildunterschrift zu Abb. 6). Für den Dezember 24 ergab der Vergleich der prognostizierten und tatsächlichen kumulierten Ausfallzahl A Daten 24 = 52183, A Modell 24 = 53521.6, d.h. der Backtest ergab einen Prognosefehler für eine 6-Monats-Prognose von etwa 3%. Da es bis Juni 24 nur 24259 Ausfälle gab, also in den 6 prognostizierten Monaten mehr Ausfälle als in den 18 Monaten davor, ist dies nichttrivial. Abb. 6 zeigt, dass der Prognosefehler für alle sechs prognostizierten Monate immer unter 5% liegt. 6

35 3 Daten Prognose, Szenario 1 Prognose, Szenario 2 Prognose, Szenario 3 25 Bestand an Ich-AGs 2 15 1 5 5 1 15 2 25 3 35 t (Monate seit Dez. 22) Abbildung 4: Prognose des Bestands B t an Ich-AGs für die drei im Haupttext definierten Szenarien. 16 Kumulierter Abgang an Ich-AGs 14 12 1 8 6 4 Daten Modell+Prognose, Szenario 1 Szenario 2 Szenario 3 2 5 1 15 2 25 3 35 t (Monate seit Dez. 22) Abbildung 5: Prognose der absoluten kumulierten Abgänge für die drei im Haupttext definierten Szenarien. 7

1 9 8 Daten Juli 24-Jan. 25 Daten bis Juni 24 Prognose im Backtest, Datenstand Juni 24 Kumulierter Abgang an Ich-AGs 7 6 5 4 3 2 1 5 1 15 2 25 3 t (Monate seit Dez. 22) Abbildung 6: Backtest: Prognose der absoluten kumulierten Abgänge für den Datenstand von Juni 24 bis zum Juni 25. Das Ergebnis der Kalibrierung für diesen Datenstand ist α =.5 (statt.55) sowie α crit =.244 (statt.23). Das resultierende Unbestimmtheitsmaß beträgt U =.3. Die prognostizierte Zugangsrate z t = 13 5 wurde als das gerundete Mittel der letzten drei Monate (April-Juni 24) angenommen. 8

4 Die Ergebnisse Die Prognoseszenarien 1-3 sowie das Backtest-Szenario 4 erlauben folgende Aussagen: Der Ansatz ( das Modell ) mit bedingten Wahrscheinlichkeiten und nur zwei Parametern ist erfolgsversprechend, wie das geringe Unbestimmtheitsmaß der Kalibrierung zeigt. Dies wird durch den Backtest der Prognosegüte bestätigt. Die Prognose der Ausfallszahlen hängt wegen des geringen Wertes der anfänglichen Ausfallwahrscheinlichkeit nur sehr schwach von der unbekannten Zahl der Neuzugänge ab. (Dies ist ganz analog zur Dynamik der Alterstruktur!) Die größte Unsicherheit liegt in der möglichen Existenz einer erhöhten bedingten Ausfallwahrscheinlichkeit α crit2 > α nach 24 und 25 Monaten, da dann, analog wie das Jahr zuvor, die Förderung sinkt. Die nächsten beiden Monatszahlen werden dies zeigen. Die Prognosen wurden unter der Prämisse gemacht, dass es keine derartige Erhöhung gibt, stellen also in dieser Hinsicht einen Best-Case dar. Die 12-Monats-Prognose sagt 87 ± 3 ausgefallenen Ich-AGs für das Jahr 25 voraus. Eine individuelle Ich-AG feiert nur mit einer Wahrscheinlichkeit von 49% den dreijährigen Geburtstag. Dies ist das Hauptergebnis. 9