Analyse der Repräsentativität

Ähnliche Dokumente

Stichprobenauslegung. für stetige und binäre Datentypen

Lineargleichungssysteme: Additions-/ Subtraktionsverfahren

Additional Cycle Index (ACIX) Thomas Theuerzeit

Grundlagen der Inferenzstatistik

Berechnung der Erhöhung der Durchschnittsprämien

Statistik I für Betriebswirte Vorlesung 11

Data Mining: Einige Grundlagen aus der Stochastik

«Eine Person ist funktional gesund, wenn sie möglichst kompetent mit einem möglichst gesunden Körper an möglichst normalisierten Lebensbereichen

Psychologie im Arbeitsschutz

QM: Prüfen -1- KN

Interne und externe Modellvalidität

Willkommen zur Vorlesung Statistik

1 Mathematische Grundlagen

50. Mathematik-Olympiade 2. Stufe (Regionalrunde) Klasse Lösung 10 Punkte

Ohne Fehler geht es nicht Doch wie viele Fehler sind erlaubt?

(1) Problemstellung. (2) Kalman Filter

geben. Die Wahrscheinlichkeit von 100% ist hier demnach nur der Gehen wir einmal davon aus, dass die von uns angenommenen

1.3 Die Beurteilung von Testleistungen

2. Psychologische Fragen. Nicht genannt.

Korrelation (II) Korrelation und Kausalität

Auszug aus der Auswertung der Befragung zur Ermittlung der IT-Basiskompetenz

Meinungen der Bürgerinnen und Bürger in Hamburg und Berlin zu einer Bewerbung um die Austragung der Olympischen Spiele

14. Minimale Schichtdicken von PEEK und PPS im Schlauchreckprozeß und im Rheotensversuch

Profil A 49,3 48,2 50,7 50,9 49,8 48,7 49,6 50,1 Profil B 51,8 49,6 53,2 51,1 51,1 53,4 50, ,5 51,7 48,8

4. Erstellen von Klassen

Kapitalerhöhung - Verbuchung

Das große ElterngeldPlus 1x1. Alles über das ElterngeldPlus. Wer kann ElterngeldPlus beantragen? ElterngeldPlus verstehen ein paar einleitende Fakten

Unterrichtsmaterialien in digitaler und in gedruckter Form. Auszug aus: Übungsbuch für den Grundkurs mit Tipps und Lösungen: Analysis

Tipp III: Leiten Sie eine immer direkt anwendbare Formel her zur Berechnung der sogenannten "bedingten Wahrscheinlichkeit".

Lineare Funktionen. 1 Proportionale Funktionen Definition Eigenschaften Steigungsdreieck 3

1. Man schreibe die folgenden Aussagen jeweils in einen normalen Satz um. Zum Beispiel kann man die Aussage:

Leseprobe. Wilhelm Kleppmann. Versuchsplanung. Produkte und Prozesse optimieren ISBN: Weitere Informationen oder Bestellungen unter

Welche Unterschiede gibt es zwischen einem CAPAund einem Audiometrie- Test?

A1.7: Entropie natürlicher Texte

Fragebogen: Abschlussbefragung

Zeichen bei Zahlen entschlüsseln

Prozessbewertung und -verbesserung nach ITIL im Kontext des betrieblichen Informationsmanagements. von Stephanie Wilke am

OECD Programme for International Student Assessment PISA Lösungen der Beispielaufgaben aus dem Mathematiktest. Deutschland

9. Schätzen und Testen bei unbekannter Varianz

Repetitionsaufgaben Wurzelgleichungen

Güte von Tests. die Wahrscheinlichkeit für den Fehler 2. Art bei der Testentscheidung, nämlich. falsch ist. Darauf haben wir bereits im Kapitel über

1 Einleitung. 1.1 Motivation und Zielsetzung der Untersuchung

Zählstatistik. Peter Appel. 31. Januar 2005

R ist freie Software und kann von der Website.

Häufig wiederkehrende Fragen zur mündlichen Ergänzungsprüfung im Einzelnen:

Software Engineering. Sommersemester 2012, Dr. Andreas Metzger

90-minütige Klausur Statistik für Studierende der Kommunikationswissenschaft

Die Quantitative und Qualitative Sozialforschung unterscheiden sich bei signifikanten Punkten wie das Forschungsverständnis, der Ausgangspunkt oder

Einfache Varianzanalyse für abhängige

Statistische Auswertung:

Repräsentativität in der Online-Marktforschung

Die Methode des Robusten Trends und der CAC40 (Frankreich)

Agile Vorgehensmodelle in der Softwareentwicklung: Scrum

WAS finde ich WO im Beipackzettel

Kapiteltests zum Leitprogramm Binäre Suchbäume

GPP Projekte gemeinsam zum Erfolg führen

Binärdarstellung von Fliesskommazahlen

Universität Bonn 28. Juli 2010 Fachbereich Rechts- und Wirtschaftswissenschaften Statistische Abteilung Prof. Dr. A. Kneip. KLAUSUR Statistik B

Lineare Gleichungssysteme

Umgang mit Schaubildern am Beispiel Deutschland surft

6. Bayes-Klassifikation. (Schukat-Talamazzini 2002)

Die Klimaforscher sind sich längst nicht sicher. Hans Mathias Kepplinger Senja Post

40-Tage-Wunder- Kurs. Umarme, was Du nicht ändern kannst.

Vermögensbildung: Sparen und Wertsteigerung bei Immobilien liegen vorn

4. Jeder Knoten hat höchstens zwei Kinder, ein linkes und ein rechtes.

BMV Visionen Ergebnisbericht der Mitglieder Befragung

10 größten SLA Irrtümer. Seminar: 8663 Service-Level-Agreement. Qualified for the Job

CITIES AGAINST RACISM RESPONSIBILITIES OF CITIES IN COUNTERACTING RACISM SUSTAINABILITY. Evaluation der Plakatkampagne der Stadt Graz gegen Rassismus

Lineare Gleichungssysteme

Ist Fernsehen schädlich für die eigene Meinung oder fördert es unabhängig zu denken?

einfache Rendite

Name (in Druckbuchstaben): Matrikelnummer: Unterschrift:

Controlling im Key Account Management

Tangentengleichung. Wie lautet die Geradengleichung für die Tangente, y T =? Antwort:

Multicheck Schülerumfrage 2013

Studie zu unabhängige Vermögensverwalter Die Großen erwirtschaften die Erträge, die Kleinen sind effizient

Theorie qualitativen Denkens

Abituraufgabe zur Stochastik, Hessen 2009, Grundkurs (TR)

Charakteristikum des Gutachtenstils: Es wird mit einer Frage begonnen, sodann werden die Voraussetzungen Schritt für Schritt aufgezeigt und erörtert.

Theoretische Grundlagen der Informatik WS 09/10

Intrinsisch motivierte Mitarbeiter als Erfolgsfaktor für das Ideenmanagement: Eine empirische Untersuchung

Meine Lernplanung Wie lerne ich?

Untersuchungsdesign:

8. Berechnung der kalkulatorischen Zinsen

Das Vermögen der privaten Haushalte in Nordrhein-Westfalen ein Überblick auf der Basis der Einkommens- und Verbrauchsstichprobe

Kapitalerhöhung - Verbuchung

Kurzeinführung Moodle

Zwei einfache Kennzahlen für große Engagements

Statistik II Wahrscheinlichkeitsrechnung und induktive Statistik Erste Klausur zum Sommersemester Juli 2005

Einführung in. Logische Schaltungen

i x k k=1 i u i x i v i 1 0, ,08 2 0, ,18 3 0, ,36 4 0, ,60 5 1, ,00 2,22 G = n 2 n i=1

2 Aufbau der Arbeit und wissenschaftliche Problemstellung

Die Zielpunkt-Marketing -Methodik

Überblick über die Verfahren für Ordinaldaten

Primzahlen und RSA-Verschlüsselung

Der Fristentransformationserfolg aus der passiven Steuerung

Eine Bürokratiekostenfolgenabschätzung zum zweiten Gesetz für moderne Dienstleistungen am Arbeitsmarkt im Hinblick auf die Einführung einer Gleitzone

Transkript:

Diss ETH No. 15868 Analyse der Repräsentativität im schweizerischen landwirtschaftlichen Buchhaltungsnetz Messung und Verbesserung der Schätzqualität ökonomischer Kennzahlen in der Zentralen Auswertung von Buchhaltungsdaten ABHANDLUNG zur Erlangung des Titels DOKTOR DER WISSENSCHAFTEN der EIDGENÖSSISCHEN TECHNISCHEN HOCHSCHULE ZÜRICH vorgelegt von BEAT MEIER Dipl Ing.-Agr. ETH geboren am 1.12.1964 von Hohenrain LU Angenommen auf Antrag von Prof. Dr. Bernard Lehmann, Referent Prof. Dr. Walter Meier, Korreferent Zürich 2005

ii

Dank Die vorliegende Arbeit entstand zu einem grossen Teil während meiner Tätigkeit an der Eidg. Forschungsanstalt für Agrarwirtschaft und Landtechnik in Tänikon (FAT). Mein Dank geht an Vorgesetzte sowie Kolleginnen und Kollegen, die mit Rat und Tat zur Seite standen. Dr. Beat Hulliger, Bundesamt für Statistik, hat aus der Optik des Statistikers die Arbeit be gleitet. Auf der Gratwanderung zwischen der reinen Lehre und dem pragmatischen Alltag war seine geduldige und beharrliche Unterstützung äusserst wertvoll. Die Professoren Dr. Bernard Lehmann und Dr. Walter Meier übernahmen Referat und Korre ferat. Vielen Dank für die hilfreichen Hinweise und die Beiträge zur Abgrenzung nung der Arbeit, ohne die ich das Ziel wohl noch öfter aus den Augen verloren hätte. und Einord Die vorbehaltlose Unterstützung meiner Familie stand am Anfang des Projektes und währte bis zum Ende. Dieser Rückhalt und die unzähligen Aufmunterungen haben, neben der wissen schaftlichen Neugier, wesentlich zum erfolgreichen Abschluss der Arbeit beigetragen. Vielen Dank, Anna und David. m

iv

Inhaltsübersicht Inhaltsübersicht v Zusammenfassung Summary Résumé vii ix xi Inhaltsverzeichnis xiii 1. Problemstellung und Vorgehensweise 1 2. Statistische Grundlagen einer stichprobenbasierten Analyse der schweizerischen Landwirtschaft 3 3. Die Zentrale Auswertung landwirtschaftlicher Buchhaltungsdaten in der Schweiz 28 4. Methodische Überarbeitung des schweizerischen landwirtschaftlichen Buchhaltungsnetzes im Jahr 2000 31 5. Beurteilung der Schätzqualität in der Zentralen Auswertung 55 6. Schlussfolgerungen zur Schätzqualität ökonomischer Kennzahlen 127 Literaturverzeichnis 138 Abbildungsverzeichnis 142 Tabellenverzeichnis 144 Abkürzungsverzeichnis 145 v

vi

Zusammenfassung Die Zentrale Auswertung landwirtschaftlicher Buchhaltungsdaten in der Schweiz beruht bis 1998 auf einer Stichprobe sogenannter Testbetriebe. Diese Stichprobe stellt eine bewusste Selektion betriebswirtschaftlich überdurchschnittlicher Betriebe dar. Der 1999 neu formulier te gesetzliche Auftrag enthält demgegenüber die Zielsetzung, die wirtschaftliche Situation in der Landwirtschaft mit einer Stichprobe repräsentativer Referenzbetriebe abzubilden. Ausge hend vom vorhandenen Datenmaterial wird dieses Ziel mit dem Massnahmenpaket Methode 2000" angestrebt. Die wichtigsten methodischen Änderungen betreffen die Abgrenzung der Grundgesamtheit, die Entwicklung einer neuen Betriebstypologie, die Einführung eines ge schichteten Auswahlplanes und einer Gewichtung der einzelbetrieblichen Ergebnisse. Aufgrund der fehlenden Zufallsauswahl der Referenzbetriebe sind statistische Schlüsse von der Stichprobe auf die Grundgesamtheit problematisch. Für die heute geschätzten Mittelwerte muss mit erheblichen Verzerrungen gerechnet werden. Die Überprüfung der Qualität dieser Schätzungen erfolgt durch mehrere, methodisch unterschiedliche Ansätze. Die Ergebnisse zeigen, dass durch die mangelhafte Vertretung der Spezialkultur- und der Veredlungsbetriebe sowie durch den Ausschluss der Betriebsgemeinschaften von den Referenzbetrieben, die heu te geschätzten landwirtschaftlichen Einkommen gegenüber der Grundgesamtheit eine negati ve Verzerrung in der Grössenordung von 2% aufweisen, d.h. die aktuelle Schätzung aus die sem Grunde zu tief ausfällt. Ein Kalibrierungsmodell zur Korrektur verzerrter Hilfsvariablen (Flächen, Alter, Bildung, Bio-Betriebe) lässt demgegenüber auf eine positive Verzerrung des landwirtschaftlichen Einkommens von 5% bis 6% schliessen. Die in der aktuellen Stichprobe überdurchschnittliche Ausbildung der betriebsleitenden Personen stellt dabei eine Hauptursa che dar. Zusammen mit den Auswirkungen selektiver Kräfte bei der Stichprobenbildung, vor allem durch die hohen Anforderungen an die Buchhaltungsform, lässt sich insgesamt folgern, dass die heute berechneten und publizierten landwirtschaftlichen Einkommen der Referenzbe triebe gegenüber den Werten der Grundgesamtheit Kennzahlen fallen die Verzerrungen grösser oder auch geringer aus. um 3% bis 8% zu hoch sind. Bei anderen Eine aus statistischer Sicht erforderliche Zufallsauswahl würde unter den aktuellen Rahmen bedingungen zu so tiefen Antwortraten führen, dass im Wesentlichen mit ähnlichen Verzer rungen zu rechnen wäre, wie sie zur Zeit an der Stichprobe der Referenzbetriebe beobachtet werden. Eine grobe Schätzung zeigt demgegenüber auf, dass mit den Massnahmen gemäss Methode 2000" über 80% der Einkommensdifferenz zwischen den früheren Testbetrieben und dem vermuteten Mittelwert der neuen Grundgesamtheit korrigiert wird. Somit können diese Massnahmen als wirksam und aufgrund des geringen Umsetzungsaufwandes auch als effizient beurteilt werden. vn

Es besteht jedoch weiteres Verbesserungspotenzial. Die kurzfristig umsetzbaren Vorschläge zur Verbesserung der Schätzqualität betreffen eine Dynamisierung der Schwellen zur Ab grenzung der Grundgesamtheit, Anpassungen beim Gewichtungssystem und bei der Auswahl untervertretener Betriebsgruppen, die Prüfung eines neuen Masses für die Betriebsgrösse, eine Angleichung von angestrebter Grundgesamtheit und Auswahlgesamtheit sowie eine verein fachte regelmässige Verzerrungsschätzung anhand ausgewählter Hilfsvariablen. Etwas aufwändiger in der Umsetzung sind Vorschläge zur Vertiefung der vorliegenden Ver zerrungsschätzung, Erweiterungen des Gewichtungssystems mit zusätzlicher Kalibrierung von Hilf s variablen sowie die Einführung der Zufalls auswähl für Teilstichproben. Die vorliegende Arbeit stellt selektionsbedingte Verzerrungen in den Vordergrund. Eine Op tik für den Gesamtfehler ist jedoch erforderlich, wenn konzeptionelle Alternativen zum aktu ellen Erhebungssystem zu beurteilen sind. Aufbauend auf den hier analysierten Selektionsfeh lern muss dabei den Wechselwirkungen mit Zufallsfehlern und Messfehlern grosse Beachtung geschenkt werden. vni

Summary Until 1998, the Farm Accountancy Data Network in Switzerland was based on a sample of socalled test farms. This sample was deliberately selected to include farms characterised by above-average economic results. However, one of the objectives of the redrafted legal manda te of 1999 was to illustrate the economic situation in agriculture with a sample of representa tive reference farms. Starting from existing data, the aim was to achieve this objective with the "Method 2000" package of measures. The most important methodical changes comprise the delimitation of the population, the development of a new farm typology, the introduction of a stratified selection plan and weighting of the individual farm results. However, statistical conclusions from the sample to the population are problematic because there is no random selection of reference farms. Considerable bias must be expected for the averages estimated today. The quality of these estimates is assessed by several methodically different approaches. The results show that due both to the inadequate representation of speci alist crops and pigs/poultry farms and to the exclusion of farm associations from the reference farms, today's estimated family farm incomes show a negative bias in the order of 2% relative to the target population, i.e. the current estimate is too low. A calibration model for the ad justment of biased auxiliary variables (area, age, education, organic farms) does, however, indicate a positive bias of agricultural income of between 5% and 6%. The above-average education of the farm managers in the current sample constitutes a primary cause. Together with the impact of selective forces in sampling, due mainly to the high the accounting system, it can on the whole be concluded that the family standards demanded of farm incomes of the reference farms calculated and published today are between 3% and 8% too high relative to the figures of the population. The bias is greater or also smaller for other key figures. In the current general framework, a random selection necessary from the statistical point of view would lead to such low response rates that we could basically expect the bias observed today. However, a rough estimate shows that, with the measures under "Method 2000", over 80% of the income difference between the previous test farms and the assumed average of the new population is adjusted. These measures can therefore be judged effective as well as effi cient owing to the low implementation costs. However, there is further potential for improvement. The proposals for improving estimation quality, suitable for short-term implementation, relate to a dynamisation of thresholds for the delimitation of the population, adjustments in the weighting system and in the selection of under-represented farm groups, the examination of a new measurement of farm size, an ad justment of target population and frame population, and a simplified regular based on selected auxiliary variables. estimation of bias IX

Associated in part with higher implementation costs are proposals for bias assessment in grea ter depth than is currently the case, extensions of the weighting system with additional ca libration of auxiliary variables, and the introduction of random selection for sub-samples. The present paper gives priority to selection-related bias. However, total survey error needs to be taken into account if conceptual alternatives to the current survey system are to be asses sed. Building on the selection errors analysed here, careful attention must at the same time be paid to interactions with sampling errors and measurement errors. x

Résumé Jusqu'en 1998, le Dépouillement centralisé des données comptables en Suisse a été effectué avec un échantillon d'exploitations-témoins sciemment sélectionnées sur la base de leur résul tat économique positif. Le mandat légal reformulé en 1999 a pour but de représenter tion économique de l'agriculture suisse au moyen d'un échantillon d'exploitations la situa de réfé rence représentatives. Ce nouvel objectif est poursuivi sur la base des données existantes et au moyen du programme de mesures Méthode 2000". Les principaux changements méthodo logiques concernent la délimitation de la population-cible, le développement d'une nouvelle typologie des exploitations, l'introduction d'un plan de sélection stratifié et de la pondération des résultats des exploitations individuelles. En raison de l'absence d'une sélection aléatoire des exploitations de référence, il est cepen dant problématique de tirer des conclusions statistiques pour la population-cible sur la base de l'échantillon. Il faut s'attendre à ce que les moyennes estimées comprennent des distorsions considérables. La qualité des estimations a été vérifiée avec un nombre de méthodes différen tes. Les résultats montrent que, due à la sous-représentation des exploitations de cultures spé ciales et des exploitations de transformation et à l'exclusion des communautés d'exploitations des exploitations de référence, les revenus agricoles estimés à l'heure actuelle présentent une distorsion négative d'environ 2 % par rapport à ceux de la population-cible, c'est-à-dire que les valeurs estimées sont trop basses. Le modèle de calibration utilisé pour corriger les varia bles auxiliaires distordues (surface, âge, niveau de formation, exploitations biologiques) indi que en revanche une distorsion positive du revenu de 5 % à 6 %, ce qui est principalement dû, dans l'échantillonnage actuel, au niveau de formation du chef d'exploitation supérieur à la moyenne. Tenant compte des effets résultant des forces sélectives lors de la formation de l'échantillon (notamment dus aux exigences à respecter par le système de comptabilité), on peut globalement en conclure que les revenus agricoles calculés et publiés à l'heure actuelle sont de 3 à 8 % trop élevés par rapport à ceux de la population-cible. Pour d'autres paramètres calculés, les distorsions sont plus élevées ou plus basses. Une sélection aléatoire telle qu'elle serait nécessaire d'un point de vue statistique conduirait à des taux de réponse si basses dans les conditions-cadres actuelles qu'il faudrait s'attendre à des distorsions dans l'ordre de grandeur actuelle. Selon une estimation grossière, les mesures de la Méthode 2000" permettront de corriger plus de 80 % de la différence entre le revenu des anciennes exploitations-témoins et la moyenne estimée pour la population-cible. Les me sures peuvent donc être considérées comme efficaces et économiques étant donné leur dépen ses peu élevées. D'autres améliorations sont cependant possibles. Les mesures suivantes peuvent être mises en œuvre à court terme pour améliorer la qualité d'estimation: dynamisation des seuils pour la xi

délimitation de la population-cible, adaptation du système de pondération des groupes d'exploitations sous-représentés, évaluation d'une nouvelle unité pour et de la sélection mesurer la taille des exploitations, adaptation de la population-cible et du cadre de sondage ainsi qu'une estimation simplifiée régulière nées. des distorsions sur la base de variables auxiliaries sélection D'autres mesures d'amélioration impliqueraient de plus grandes modifications: approfondis sement de l'estimation actuelle des distorsions, élargissement du système de pondération par un calibrage supplémentaire des variables auxiliaries ainsi que l'introduction d'une sélection aléatoire pour l'échantillonnage partiel. Le présent travail porte essentiellement sur les distorsions occasionnées par la sélection. Pour développer et évaluer des alternatives ou compléments au système de relevé actuel, il est in dispensable de prendre en compte l'erreur totale afin de pouvoir satisfaire les exigences com plexes du Dépouillement centralisé des données comptables. Pour ce faire, il faut se baser sur les erreurs de sélection analysées ici, tout en tenant compte des interactions avec les erreurs aléatoires et les erreurs de mesure. xn

Inhaltsverzeichnis Inhaltsübersicht v Zusammenfassung Summary Résumé vii ix xi Inhaltsverzeichnis xiii 1. Problemstellung und Vorgehensweise 1 1.1. Problemstellung 1 1.2. Vorgehensweise 2 2. Statistische Grundlagen einer stichprobenbasierten Analyse der schweizerischen Landwirtschaft 3 2.1. Formen von Stichprobenerhebungen 3 2.1.1. Grundgesamtheit und Stichprobe 3 2.1.2. Charakterisierung von Stichprobenerhebungen 4 2.1.3. Geschichtete Zufallsstichprobe 6 2.1.4. Quotenstichprobe 7 2.2. Fehler in Stichprobenerhebungen 8 2.3. Schätzverfahren in Stichprobenerhebungen 10 2.3.1. Einleitung und Notation 10 2.3.2. Gewichtung in Schätzverfahren 12 2.3.2.1. Unterscheidung von Gewichtungsverfahren nach der Zielsetzung 13 2.3.2.2. Unterscheidung von Gewichtungsverfahren nach der Art des Schätzers 15 2.3.3. Schätzverfahren mit Kalibrierung von Hilfsvariablen 17 2.3.3.1. Herkunft und Grundidee des Kalibrierungsansatzes 17 2.3.3.2. Formen von Hilfsvariablen für Kalibrierungen 18 2.3.3.3. Distanzfunktionen 19 2.4. Varianzschätzung bei unterschiedlichen Stichprobenerhebungen 21 2.5. Repräsentativität von Stichprobenerhebungen 24 2.5.1. Geschichtliche Entwicklung des Repräsentativitätsbegriffs 24 2.5.2. Zufallsstichprobe und Quotenstichprobe 25 2.5.3. Synthese 27 3. Die Zentrale Auswertung landwirtschaftlicher Buchhaltungsdaten in der Schweiz 28 3.1. Organisation und Ziele der Zentralen Auswertung von Buchhaltungsdaten 28 3.2. Methodische Grundlagen der Zentralen Auswertung bis zum Jahr 1999 29 4. Methodische Überarbeitung des schweizerischen landwirtschaftlichen Buchhaltungsnetzes im Jahr 2000 31 4.1. Ausgangslage und Vorgehensweise 31 xiii

4.2. Betriebstypologie 32 4.2.1. Begriffe 32 4.2.2. Anforderungen an Betriebstypologien für die Zentrale Auswertung 33 4.2.3. Eignung bisher bekannter Betriebstypologien 34 4.2.3.1. Typologienach Grüner Kommission 34 4.2.3.2. Typologie nach EU-Methodik 38 4.2.3.3. Schlussfolgerung 39 4.2.4. Entwicklung der neuen Betriebstypologie FAT99 40 4.2.4.1. Grundidee und Vorgehensweise zur Entwicklung einer neuen Betriebstypologie 40 4.2.4.2. Definition der neuen Betriebstypologie FAT99 40 4.2.4.3. Beschreibung und Analyse der neuen Betriebstypen nach FAT99 44 4.3. Grundgesamtheit 46 4.4. Stichprobe 48 4.4.1. Auswahlverfahren für Referenzbetriebe 48 4.4.2. Auswahlplan für Stichprobenbetriebe 49 4.5. Gewichtung 50 4.5.1. Begründung der Gewichtung 50 4.5.2. Berechnung der Gewichte je Betrieb 50 4.5.3. Berechnung von gewichteten Kennzahlen 52 4.6. Auswirkungen der neuen Auswertungsmethodik 52 4.7. Einordnung der neuen Auswertungsmethodik in den internationalen Kontext 54 5. Beurteilung der Schätzqualität in der Zentralen Auswertung 55 5.1. Konzept zur Messung der Schätzqualität 55 5.1.1. Eingrenzung der Untersuchung 55 5.1.2. Vorgehensweise 55 5.2. Mängel bei der Abbildung der angestrebten Grundgesamtheit 58 5.2.1. Nicht vertretene oder eingeschränkt vertretene Schichten 58 5.2.2. Konsequenzen der Beschränkung auf Einzelbetriebe 60 5.3. Physische Hilfsvariablen und deren Zusammenhang mit Untersuchungsvariablen 61 5.3.1. Deskriptive Analyse 61 5.3.1.1. Region 62 5.3.1.2. Betriebsgrösse 63 5.3.1.3. Betriebstyp 64 5.3.1.4. Altersstruktur 65 5.3.1.5. Landbauform 66 5.3.1.6. Ausbildung 67 5.3.1.7. Andere erfolgsbestimmende Kriterien 69 5.3.2. Statistische Modellierung 70 5.4. Verzerrungen physischer Hilfsvariablen 73 5.4.1. Flächen und Tierbestände 74 5.4.1.1. Landwirtschaftliche Nutzfläche 75 5.4.1.2. Flächen im Ackerbau 75 5.4.1.3. Flächender Spezialkulturen 77 xiv

5.4.1.4. Entwicklung ausgewählter Kulturen im Zeitablauf 78 5.4.1.5. Rindviehbestände 79 5.4.1.6. Schweinebestände 81 5.4.1.7. Geflügelbestände 82 5.4.2. Altersstruktur 83 5.4.3. Ausbildung 85 5.4.4. Landbauform 86 5.4.5. Arbeitskräfte 87 5.4.6. Eigentumsform 89 5.4.7. Zusammenfassung der Analyse physischer Hilfsvariablen 91 5.5. Anpassung physischer Hilfsvariablen mittels Kalibrierung 93 5.5.1. Basisgewichtung als Vergleichslösung 93 5.5.2. Varianzschätzung für die Basisgewichtung mittels direkter Berechnung 96 5.5.3. Varianzschätzung für die Basisgewichtung mittels Jackknife 98 5.5.4. Auswahl der Hilfsvariablen für die Kalibrierung 101 5.5.5. Formulierung des Kalibrierungsmodells und Wahl der Distanzfunktion 103 5.5.6. Streuung der Gewichte bei alternativen Kalibrierungssystemen 105 5.5.7. Auswirkungen alternativer Kalibrierungssysteme auf die Untersuchungsvariablen 107 5.5.8. Auswirkungen alternativer Kalibrierungssysteme auf die Varianz des landwirtschaftlichen Einkommens 111 5.5.9. Zusammenfassung der Ergebnisse alternativer Kalibrierungssysteme 112 5.6. Selektive Kräfte bei der Stichprobenbildung 114 5.6.1. Problemstellung und Vorgehensweise 114 5.6.2. Anforderungen an die Buchhaltungsform 115 5.6.3. Ablieferungstermin 118 5.6.3.1. Einleitung 118 5.6.3.2. Deskriptive Analyse 119 5.6.3.3. Regressionsanalyse 121 5.6.4. Rotationsverhalten 123 5.6.4.1. Einleitung 123 5.6.4.2. Regressionsanalyse 123 5.6.5. Zusammenfassung der Analyse selektiver Kräfte 125 5.6.5.1. Ergebnisse der quantitativen Untersuchung 125 5.6.5.2. Abschätzung möglicher Grössenordnungen von Verzerrungen aufgrund selektiver Kräfte 125 6. Schlussfolgerungen zur Schätzqualität ökonomischer Kennzahlen 127 6.1. Zusammenfassende Beurteilung der Schätzqualität ökonomischer Kennzahlen 127 6.1.1. Zusammenfassung der festgestellten Verzerrungen 127 6.1.2. Beurteilung aus stichprobenstatistischer Sicht 128 6.1.3. Beurteilung aus praktischer Sicht 129 6.2. Vorschläge zur Verbesserung der Schätzqualität in der Zentralen Auswertung 130 6.2.1. Kurzfristige Massnahmen 130 6.2.2. Mittelfristige Massnahmen 132 6.3. Gesamtfehlerbetrachtung zur Beurteilung methodischer Änderungen 135 xv

Literaturverzeichnis 138 Abbildungsverzeichnis 142 Tabellenverzeichnis 144 Abkürzungsverzeichnis 145 xvi

1. Problemstellung und Vorgehens weise 1.1. Problemstellung Die landwirtschaftliche Tätigkeit ist in der Schweiz von grosser gesellschaftspolitischer Rele vanz. Damit verbunden besteht eine hohe staatliche Regelungsdichte und ein bedeutender Einsatz öffentlicher Mittel. Für Konzeption, Vollzug und Evaluation agrarpolitischer Mass nahmen sind die Entscheidungsträger auf aussagekräftige Informationen über die wirtschaftli che Situation und Entwicklung in der Landwirtschaft angewiesen. Die Zentrale Auswertung von Buchhaltungsdaten landwirtschaftlicher Betriebe durch die Eidg. Forschungsanstalt für Agrarwirtschaft und Landtechnik in Tänikon (FAT, Zentrale Auswertung) ist onssystem, das einen wichtigen Teil dieser Informationsbedürfnisse abdeckt. ein Informati Für die bis 1998 durch die Zentrale Auswertung durchgeführte Analyse der sogenannten Testbetriebe bestand nur ein sehr eingeschränkter Anspruch auf Repräsentativität, da die Be triebe bewusst positiv selektioniert wurden und rationell wirtschaftende" Betrieb abbilden sollten. Mit dem 1999 in Kraft getretenen Landwirtschaftsgesetz beschränkt man sich für den Einkommensvergleich der Landwirtschaft mit der übrigen Bevölkerung nach wie vor auf nachhaltig wirtschaftende und ökologisch leistungsfähige Betriebe" (Art. 5 Landwirtschafts gesetz, Schweizer Bundesrat 1998a). Grundlage für die Auswahl dieser Gruppe bildet aber neu eine Stichprobe repräsentativer Landwirtschaftsbetriebe" (Art. 2 der Verordnung über die Beurteilung der Nachhaltigkeit in der Landwirtschaft, Schweizer Bundesrat 1998b). Daraus ergeben sich folgende Problemstellungen, die im Rahmen dieser Arbeit behandelt werden: 1. Wie ist Repräsentativität in einer Stichprobenerhebung zu definieren? 2. Durch welche methodischen Massnahmen kann, ausgehend von den Testbetriebser gebnissen und ohne Zufallsstichprobe, ein Referenzbetriebsnetz mit Aussagekraft für möglichst die gesamte Landwirtschaft aufgebaut werden? 3. Welche Schätzqualität erreicht dieses Referenzbetriebsnetz, beziehungsweise welche Verzerrungen bleiben gegenüber der Grundgesamtheit bestehen? 4. Welche zusätzlichen Massnahmen zur Verbesserung der Schätzqualität sind sinnvoll? 1

1.2. Vorgehensweise In einem theoretischen Teil werden die methodischen Grundlagen für stichprobenbasierte Erhebungen dargelegt. Besonderes Augenmerk gilt und der Gewichtung von Ergebnissen (Kapitel 2). dabei der Frage des Auswahlverfahrens Eine Beschreibung der Zielsetzung und Organisation der Zentralen Auswertung von Buchhal tungsdaten in der Schweiz dient dem Verständnis der Ausgangssituation und ermöglicht die Beurteilung alternativer methodischer Massnahmen aus umsetzungsorientierter Sicht (Kapi tel 3). Die im Jahr 2000 entwickelten und eingeführten methodischen Anpassungen im Bereich der Betriebstypologie, der Abgrenzung von Grundgesamtheit und Stichprobe sowie der Gewich tung der Ergebnisse bilden einen ersten Schwerpunkt der Arbeit (Kapitel 4). Anschliessend werden ein Konzept zur Analyse der Schätzqualität entwickelt und in einem zweiten Schwerpunkt der Arbeit die Schätzungen gemäss der im Jahr 2000 überarbeiteten Methodik auf vorhandene Verzerrungen untersucht (Kapitel 5). Auf den empirischen Ergebnissen und theoretischen Überlegungen basierende Vorschläge zur methodischen Weiterentwicklung der Zentralen Auswertung von Buchhaltungsdaten bilden den Abschluss der Arbeit (Kapitel 6). 2

2. Statistische Grundlagen einer stichprobenbasierten Analyse der schweizerischen Landwirtschaft Die Betriebe in der Stichprobe der Zentralen Auswertung von Buchhaltungsdaten sind nicht zufällig ausgewählt. Somit sind Methoden zur Analyse der Qualität der Schätzungen, die auf dem Paradigma der Zufalls auswähl und den Prinzipien der Wahrscheinlichkeitsrechnung auf bauen, nicht oder nur bedingt anwendbar. Probleme bereitet insbesondere der Begriff Reprä sentativität", dessen Gebrauch so heterogen ist, dass er von vielen Statistikern und Statistike rinnen gemieden wird. Die folgenden Kapitel dienen somit primär der Klärung und Einordnung von Begriffen und Methoden. Zuerst werden Grundelemente und alternative Formen von Stichprobenerhe bungen erläutert (Kapitel 2.1). Anschliessend erfolgt eine systematische Darstellung von Fehlern in Stichprobenerhebungen (2.2). Zwei weitere Kapitel führen in die Schätzverfah ren unter Verwendung von Gewichtungen oder Kalibrierungen (2.3) sowie in die Varianz schätzung bei unterschiedlichen Stichprobenerhebungen ein (2.4). Abschliessend wird der Begriff der Repräsentativität erläutert und für den vorliegenden Kontext präzisiert (2.5). 2.1. Formen von Stichprobenerhebungen Im Bereich der öffentlichen Statistik dominierten bis weit in das 20. Jahrhundert hinein Voll erhebungen die Datengewinnung, z.b. in Form von Volkszählungen (Kruskal und Mosteller 1980, S. 172ff; Schnell et al. 1999, S. 17ff). Das Bilden von Stichproben gewann und gewinnt jedoch kontinuierlich an Bedeutung. Dabei bietet sich gegenüber einer Vollerhebung die Möglichkeit, durch die Beschränkung der Erhebung auf weniger Objekte den Aufwand zu reduzieren oder durch eine Vertiefung der Erhebung zusätzliche Information zu gewinnen, was in einer Vollerhebung aus Aufwandgründen nicht möglich wäre. Die nachfolgende Beschreibung von Stichprobenverfahren bildet die Grundlage zur Einord nung der Stichprobe der Buchhaltungsbetriebe in der Zentralen Auswertung. Dies ist eine Voraussetzung, um Methoden aus der Literatur korrekt auf unsere Fragestellungen zu über tragen. 2.1.1. Grundgesamtheit und Stichprobe In Anlehnung an Schnell et al. (1999, S. 247ff) werden einleitend wichtige Begriffe definiert. Als Elemente oder Objekte (oft auch Untersuchungseinheiten) werden jene Einheiten be zeichnet, an denen Messungen vorgenommen werden. 3

Die Grundgesamtheit oder Population umfasst sämtliche Elemente, für die die Aussagen einer Untersuchung gelten sollen (auch angestrebte Grundgesamtheit, Zielgesamtheit, engl, population, target population) (Cochran 1972, S. 20). Die Auswahlgesamtheit (auch Auswahlrahmen, engl, frame population) umfasst diejenigen Elemente, die für eine Auswahl tatsächlich zur Verfügung stehen. Aus praktischen Gründen kann die Auswahlgesamtheit von der Grundgesamtheit abweichen. So können Listen, aus denen eine Stichprobe gezogen wird, gewisse Elemente der angestrebten Grundgesamtheit ausschliessen ( Undercoverage", zum Beispiel Haushalte ohne Telefonanschluss bei telefoni schen Befragungen) oder umgekehrt Elemente mit einschliessen, die gar nicht Gegenstand der Untersuchung sein sollen ( Overcoverage"). Die Inferenzgesamtheit (auch Inferenzpopulation) ist schliesslich die Menge jener Elemente, für die mit der vorliegenden Stichprobe tatsächlich Aussagen gemacht werden können. Selbst wenn Grundgesamtheit und Auswahlgesamtheit identisch sind, kann die Inferenzpopulation von der angestrebten Grundgesamtheit abweichen, weil sich bestimmte Elemente nicht erhe ben lassen, zum Beispiel weil sie nicht erreicht werden oder weil sie eine Teilnahme verwei gern. Bei Zufallsstichproben kann die effektiv realisierte Stichprobe als Zufalls Stichprobe aus der Inferenzgesamtheit betrachtet werden. Ziel einer Untersuchung muss es sein, dass die ange strebte Grundgesamtheit und die Inferenzgesamtheit weitgehend deckungsgleich sind. 2.1.2. Charakterisierung von Stichprobenerhebungen In der Literatur werden Stichproben relativ einheitlich aufgrund des Verfahrens charakteri siert, das zur Bildung der Stichprobe führt. Dieses Verfahren spielt auch im Hinblick auf die Beurteilung der Repräsentativität eine entscheidende Rolle. Von Bedeutung ist zuerst, ob eine Zufalls auswähl vorgenommen wird oder nicht. So unterscheiden zum Beispiel Kromrey (1998, S. 260f) zufallsgesteuerte Auswahlverfahren und nicht zufallsgesteuerte Auswahlverfahren oder Schnell et al. (1999, S. 247ff) Zufalls Stichproben und willkürliche oder bewusste Auswahlen. Im englischen Sprachraum sind die Unterscheidungen von gebräuchlich. probability sampling und judgement sampling (je nach Quelle auch nonprobability sampling) 4

Der sprachliche Hintergrund des Begriffes Stichprobe" im Sinne von aus einer homogenen Masse eine Probe stechen" könnte eine Beschränkung auf zufällige Verfahren nahe legen. Im Rahmen der vorliegenden Arbeit wird der Begriff Stichprobe" jedoch in Übereinstimmung mit der Literatur der empirischen Sozialforschung breiter interpretiert gen aus einer zufälligen Auswahl begrenzt. und nicht auf Teilmen Innerhalb der Zufallsstichproben ist folgende Einteilung gebräuchlich (in Anlehnung an Schnell et al. 1999, S. 252): Einfache Zufallsstichproben und geschichtete Zufallsstichproben. Aufgrund des Auswahlsatzes in den einzelnen Schichten, dem Verhältnis zwischen der Anzahl Elemente in der Stichprobe und in der Grundgesamtheit, unterscheidet man zudem o proportional geschichtete Stichproben (konstanter Auswahlsatz in allen Schichten) und o disproportional geschichtete Stichproben (variabler Auswahlsatz von Schicht zu Schicht). Eine zusätzliche Unterscheidungsmöglichkeit betrifft die Anzahl Schritte bei der Auswahl. Im Gegensatz zur einstufigen Auswahl werden bei mehrstufigen Auswahlverfahren zum Beispiel zuerst Haushalte zufällig ausgewählt und in einem zweiten Schritt eine konkrete Person des Haushalts. Ein Spezialfall ist die Klumpenstichprobe, bei der die Grundgesamtheit zuerst in (meist regionale) Einheiten oder Klumpen eingeteilt wird und dann innerhalb der zufällig ausgewählten Klumpen entweder alle Elemente (Vollerhebung) oder wiederum Zufallsstich proben ausgewählt werden. Bei den nicht zufallsgesteuerten Auswahlverfahren werden üblicherweise folgende Verfah ren unterschieden (in Anlehnung an Schnell et al. 1999, S. 277ff): Willkürliche Auswahl Schnelligkeit und Einfachheit der Auswahl steht im Vordergrund; typisch für ad hoc Publikumsbefragungen durch Radio- oder Fernsehanstalten. o o Auswahl aufs Geratewohl Verfügbare Stichproben, anfallende Stichproben Bewusste Auswahl o Extreme Fälle o Typische Fälle (auch Fallstudien, engl, auch: typical case, most frequent case, modal instance sampling, case studies) o Konzentrationsprinzip (auch Abschneideverfahren" oder engl. Cut-off, zum Beispiel die 3 grössten Unternehmen in einem Marktsegment mit einem insge samt sehr hohen Marktanteil) 5