Schätzung von durchschnittlichen Schlachtgewichten anhand von Taxationsdaten

Größe: px
Ab Seite anzeigen:

Download "Schätzung von durchschnittlichen Schlachtgewichten anhand von Taxationsdaten"

Transkript

1 Schätzung von durchschnittlichen Schlachtgewichten anhand von Taxationsdaten Projektarbeit im Rahmen des Weiterbildungslehrgangs in angewandter Statistik des Seminars für Statistik der ETHZ Frühjahr-Sommer 2007 Daniel K. Erdin Dr. sc. tech. ETH 1/50

2 Inhaltsverzeichnis 1. Einleitung Material und Methode Beschreibung der Daten Datenbezug und -handling Anpassung einer Verteilung an die Daten Verteilung der Daten Anpassung einer t-verteilung Anpassung einer Γ-Verteilung Kombination von Normal- und Γ-Verteilung Wahl der besten Anpassung Simulationen zum Vertrauensintervall Resultate Kategorie GI Kategorie JB Kategorie KV Kategorie LA Kategorie MA Kategorie MT Kategorie OB Kategorie RG Kategorie RV Kategorie SM Kategorie VK Kategorie Schweine Überblick Multinomiale Zufallszahlen Simulation Diskussion Beurteilung Interpretation der Verteilungen Subpopulationen Vertrauensintervalle Bedeutung der Methode Anwendung und Ausblick Anhang Detaillierte Resultate /50

3 5.2. Glossar Erfolglose Versuche und anderes Literatur R-Skripte /50

4 Dank Mein Dank geht an meine Frau und meine Kinder, da sie wohl am meisten unter meiner Fortbildung gelitten haben. an meinen Arbeitgeber, dem Schweizerischen Bauernverband, für die grosszügige Unterstützung. an meine Arbeitskollegen und Vorgesetzten, welche von meiner Abwesenheit während der Kurse und meiner zwangsläufig reduzierten Arbeitskapazität betroffen waren. an die Proviande und insbesondere Herrn Mike Schneider, welcher die Basisdaten zur Verfügung stellt. last but not least - an die Organisatoren, Dozenten und Assistenten des Kurses für den interessanten Kurs und die gute Betreuung, insbesondere an Prof. Werner Stahel und Herrn Christoph Birrer für die Unterstützung und Betreuung im Rahmen der vorliegenden Projektarbeit. Nach vielen Jahren Kochbuch-Statistik bot der Weiterbildungslehrgang des Seminars für Statistik der ETHZ endlich die Gelegenheit zu einem vertieften Einblick und dem Gefühl, mindestens ab und zu etwas verstanden zu haben. 4/50

5 Zusammenfassung In der vorliegenden Arbeit wird eine Methode zur Schätzung von durchschnittlichen Schlachtgewichten und Vertrauensintervallen auf der Basis der Taxationsdaten der Proviande beschrieben. Die Taxationsdaten der Proviande liefern für die Schlachttierkategorien Gitzi, Jungvieh, Kälber, Lämmer, ältere Stiere, Muni, Ochsen, Rinder, Jungkühe, Kühe und Schweine grob nach Gewichtsklassen klassierte Tierzahlen nach Monaten. Die Breite der Gewichtsklassen ist innerhalb jeder Tierkategorie konstant. Für jede Tierkategorie gibt es zudem eine untere Klasse von der nur die obere Gewichtsgrenze bekannt ist und eine obere Gewichtsklasse, von der nur die untere Gewichtsgrenze bekannt ist. Die Verteilung der Gewichte der betreffenden Tiere hat in diesem Fall keine vorgegebenen festen Grenzen. Anhand der Tierzahlen in den Klassen werden für jeden Datensatz mittels eines Anpassungstests eine optimierte t- und eine optimierte Gamma- Verteilung angepasst. Mit den Momenten dieser angepassten Verteilungen kann das Durchschnittsgewicht und ein Vertrauensintervall dazu mit Berücksichtigung der untersten und obersten Gewichtsklasse geschätzt werden. Je nach Tierkategorie lässt sich die t-verteilung oder die Γ-Verteilung besser an die beobachteten Tierzahlen anpassen. Dabei weicht die geschätzte Verteilung der Gewichte gemäss Anpassungstest oft signifikant von der beobachteten Verteilung ab. In jenen Fällen, wo sich ein grösserer Anteil der Tiere in den Grenzklassen befindet, kann jedoch mindestens eine Methode mit befriedigender Genauigkeit angepasst werden. Aufgrund von multinomial erzeugten Zufallszahlen erscheinen die geschätzten Vertrauensintervalle einigermassen zuverlässig zu sein, falls eine gute Anpassung der Verteilung vorliegt und sich nicht ein extremer Anteil der Tiere in den Grenzklassen befindet. Die Bedeutung der Methode hängt vom Anteil der Tiere in den Grenzklassen und der wirtschaftlichen Bedeutung der Tierkategorie ab. Die grösste Bedeutung hat die Methode bei den Schlachtkälbern KV, bei denen eine Korrektur des durchschnittlichen Schlachtgewichtes um 5.4 kg zu einer Differenz von ca. 19 Millionen Franken auf Stufe Rohertrag führt. Die mit dieser Methode geschätzten mittleren Gewichte werden seit 2006 durch den Schweizerischen Bauernverband, das Bundesamt für Statistik und weitere Organisationen verwendet. 5/50

6 1. Einleitung Die durchschnittlichen Schlachtgewichte von Rindern, Schweinen, Schafen und Ziegen haben eine grosse Bedeutung, da der Anteil des Rohertrags von Schlachttieren dieser Tiergattungen gemäss der landwirtschaftlichen Gesamtrechnung für das Jahr 2003 ca. 30 % des Rohertrags des landwirtschaftlichen Wirtschaftsbereichs beträgt (Bundesamt für Statistik 2006). Durchschnittsgewichte nach Tierkategorien werden dementsprechend von diversen Organisationen benötigt (u.a. Bundesamt für Statistik, Bundesamt für Landwirtschaft, Schweizerischer Bauernverband, weitere Organisationen der Produzenten und der Verwerter). Bis Ende 2005 (definitive Schlachtviehstatistik) bzw. März 2006 (provisorische Schlachtviehstatistik) hat das Bundesamt für Statistik (BFS) diese Gewichte aufgrund von monatlichen Stichprobenerhebungen in den Schlachthöfen geschätzt. Diese Erhebungen lieferten die Ausgangsdaten für die Erstellung der Schweizerischen Schlachtviehstatistik. Da das BFS die Schätzung der Schlachtviehstatistik in der Folge aufgegeben hat, erteilte das Bundesamt für Landwirtschaft (BLW) dem Geschäftsbereich Statistik des Schweizerischen Bauernverbandes (Statistik SBV) einen entsprechenden Leistungsauftrag zur Erstellung der Schlachtviehstatistik und somit auch zur Schätzung der durchschnittlichen Schlachtgewichte. Im Gegensatz zum bisherigen Erhebungsverfahren sollten die Resultate der neutralen Taxation der Proviande gemäss Schlachtviehverordnung (Schweizerische Eidgenossenschaft 2006) die Basis für die Schätzung der durchschnittlichen Schlachtgewichte bilden. Die Proviande erklärte sich bereit, diese Daten monatlich zu liefern. Die Klassierungsdaten der Proviande liefern Angaben zu den Tierzahlen in Gewichtsklassen nach Tierkategorie (GI, JB, KV, MA, MT, OB, RG, RV, VK und Schlachtschweine) auf Monatsbasis. Diese Daten dienen primär zur Kontrolle der neutralen Taxation und des dazu verwendeten Taxationssystems (CHTAX-System bei Wiederkäuern, Magerfleischanteil bei den Schweinen). Das Ergebnis der Taxation dient dem Schlachthof zur Festlegung des Preises des betreffenden Schlachttieres. Tabelle 1: Durch die Klassierungsdaten der Proviande erfasste Tierkategorien Tierkategorie (CH-TAX) Bedeutung Klassifizierungssystem GI Gitzi Klasse I CH-TAX JB Jungvieh CH-TAX KV Schlachtkälber CH-TAX MA Muni ältere CH-TAX MT Muni ungeschaufelt CH-TAX OB Ochsen bis max. 4 Schaufeln CH-TAX RG Rinder bis max. 4 Schaufeln CH-TAX RV Rinder/Jungkühe bis max. 4 Schaufeln CH-TAX VK Kühe CH-TAX Schweine* Schlachtschweine Magerfleischanteil * Keine Kategorie nach CH-TAX, die Schweine werden vor allem aufgrund des Magerfleischanteils bewertet Im Rahmen der Datenerfassung durch die Proviande werden die Tiere jeder Kategorie nach Gewichtsklassen eingeteilt, wobei die Breite der Gewichtsklassen von der Tierkategorie abhängt. Die Gewichtsklassen haben eine untere und obere Grenze. Von den Tieren ausserhalb der registrierten Gewichtsklassen ist nur die Anzahl und die obere respektiv die untere Grenze der Gewichte bekannt. Die beiden Klassen ausserhalb des definierten Gewichtsbereichs werden in der Folge als untere und obere Grenzklasse bezeichnet. In Tabelle 2 wird dies anhand der Daten für die Kälber des Monats Januar 2005 dargestellt. 6/50

7 Tabelle 2: Gewichtsdaten der Schlachtkälber KV gemäss neutraler Taxation vom Januar 2005 Klasse Gewichtsbereich der Klasse Anzahl Tiere angenäherte Klassenmitte 1 < 70 kg 67 unbekannt kg kg kg kg kg kg kg kg kg kg kg kg 8 > 130 kg unbekannt Um einen zuverlässigen Mittelwert und ein realistisches Vertrauensintervall für den Mittelwert zu erhalten, müssen die beiden Grenzklassen, für welche der Gewichtsbereich nicht bekannt ist, ebenfalls berücksichtigt werden, zumindest falls die beiden Anzahlen von Tieren, welche unterhalb bzw. oberhalb des klassierten Bereichs liegen, sich deutlich unterscheiden und der Anteil der Tiere ausserhalb der Gewichtsklassen mit bekanntem Durchschnittsgewicht relativ gross ist. Dies ist zum Beispiel bei den Schlachtkälbern KV mit mehr als 20 % der Tiere in den beiden Grenzklassen der Fall. Werden diese beiden Grenzklassen bei der Schätzung nicht berücksichtigt, wird die Lage des Mittelwertes nicht zuverlässig bestimmt und die Streuung unterschätzt. Dadurch fällt auch das Vertrauensintervall für den Mittelwert zu klein aus. In der Folge wird eine Methode beschrieben, welche die Durchschnittsgewichte und die Vertrauensintervalle nach Tierkategorie und Monat bzw. Jahr schätzt. Die Ausgangsidee ist die folgende: anhand der klassierten Schlachtgewichtsdaten wird eine Verteilung gesucht, welche möglichst der vorliegenden Datenstruktur entspricht. Mithilfe dieser Verteilung werden dann das Durchschnittsgewicht und die Streuung bestimmt. Die vorliegende Dokumentation beschränkt sich auf die Daten des Jahres Diese dienten zur Bestimmung der Methode und hatten den Vorteil, dass für gewisse Kategorien noch Durchschnittsgewichte des BFS zum Vergleich vorhanden sind. 2. Material und Methode 2.1. Beschreibung der Daten In Tabelle 3 werden die Daten für das Jahr 2005 nach Tierkategorie dargestellt. Z.B. bestehen für die Kategorie KV (Schlachtkälber) 6 Gewichtsklassen mit einer Breite von jeweils 10 kg. Der dadurch abgedeckte Gewichtsbereich reicht von 70 bis 130 kg. 42'762 von 180'250 Kälbern bzw % liegen über respektive unterhalb dieser 6 Gewichtsklassen. 7/50

8 Tabelle 3: Struktur der Gewichtsdaten im Jahr 2005 Kategorie Klassen von bis Klassenbreite Tiere total Tiere in Klassen Anteil mit Bereich mit Gewicht Anzahl kg kg kg Anzahl Anzahl % GI JB KV LA MA MT OB RG RV SM VK Schweine Bei der Kategorie MA (ältere Stiere) liegen sehr viele Tiere ausserhalb der Gewichtsklassen. Bei den Klassen GI (Gitzi) und JB (Jungvieh) liegen insgesamt nur wenige Angaben (37 bzw. 525 Tiere) vor. Bei diesen Kategorien wurden deshalb nur Jahresdaten ausgewertet. Die Daten der Kategorie RV (Jungkühe) mussten korrigiert werden, da von Juni bis Dezember die Daten der untersten Klasse offensichtlich falsch erfasst worden waren Datenbezug und -handling Die Daten werden monatlich durch die Proviande als Excel-Datei zugestellt. Diese Dateien werden über MS Access in eine SQL-Datenbank (Microsoft SQL Server) eingelesen und für die Ablage in ein relationales Datenbankformat transformiert. Ab der SQL-Datenbank werden die Daten nach Tierkategorie und Monat bzw. Jahr über SQL-Queries in CSV-Dateien (Semikolon als Trennzeichen) geschrieben, welche anschliessend ins Statistik-Programm R (R Development Core Team, 2006) importiert werden Anpassung einer Verteilung an die Daten Wahl der Verteilung Die effektive Verteilung der Schlachtgewichtsdaten ist grundsätzlich nicht bekannt. Die Tierzahlen in den einzelnen Gewichtsklassen können durch sehr unterschiedliche Faktoren beeinflusst werden: u.a. durch die Saison, durch die Produktionsbedingungen auf den Landwirtschaftsbetrieben und durch das Bezahlungssystem im Schlachthof. Insbesondere kann nicht vorausgesetzt werden, dass die Gewichte symmetrisch oder normal verteilt sind. Grundsätzlich kann für die Gewichte G einer Tierkategorie eine beliebige Verteilung D (für Distribution), welche durch die entsprechenden Parameter definiert ist, an die Wahrscheinlichkeiten der Tierzahlen in den Gewichtsklassen 1 bis k angepasst werden. Dabei wird vorausgesetzt, dass die Gewichte der Tiere gemäss der entsprechenden Verteilung der Gewichte D(G) verteilt sind.. [1] G ~ D(G) Zur Beurteilung der Anpassungsgüte kann ein χ 2 -Anpassungstest (Stahel 2002) durchgeführt werden. Dieser erfolgt auf der Basis der beobachteten Anzahlen (N) in den vorhandenen der Gewichtsklassen im Vergleich zu den entsprechenden geschätzten Anzahlen (Ne). Die berechnete Testgrösse T ergibt sich somit als: 8/50

9 [2] T = Σ i=1 bis k [(N i - Ne i ) 2 / Ne i ] Der entsprechende Freiheitsgrad (DF) für diese Testgrössen entspricht der Anzahl Klassen abzüglich der geschätzten Parameter korrigiert um 1: [3] DF = k - p - 1 Klassen ohne Beobachtungen am Rand der Verteilung werden nicht berücksichtigt, so dass in der untersten bzw. obersten verbleibenden Klasse jeweils mindestens eine Beobachtung liegt (vgl. Stahel 2002, S. 225). Eigentlich wären für diese optimierte Klassenbildung die erwarteten Werte massgebend, diese sind jedoch erst nach der Approximation der Verteilung bekannt. Die folgenden Ausführungen gelten somit für die entsprechend optimierten Klassen. Die berechnete Testgrösse sollte unter dem theoretischen Wert des Quantils der Chiquadrat- Verteilung für die hier gewählte Irrtumswahrscheinlichkeit α = 0.05 und die Freiheitsgrade DF liegen. Die Parameter einer in Frage kommenden Verteilung können über die R-Funktion optim bestimmt werden. Mit optim werden dabei die Parameter der gewählten Verteilung gesucht, für welche die Testgrösse T am kleinsten wird. Für die berechnete Testgrösse als Quantil der Chiquadrat-Verteilung kann auch die Wahrscheinlichkeit für die k - p - 1 Freiheitsgrade berechnet werden. Der P-Wert wird dabei als 1 abzüglich der Wahrscheinlichkeit des Quantils definiert. Liegt dieser P-Wert unter 0.05, dann entspricht dies einem signifikanten Unterschied zwischen der angepassten Verteilung und der tatsächlichen Verteilung der vorliegenden Gewichtsdaten. Liegt der P-Wert über 0.05, dann kann kein signifikanter Unterschied zwischen der angepassten Verteilung und der effektiven Verteilung der Daten festgestellt werden Schätzung des Mittelwerts Der Mittelwert kann mit den vorhandenen Gewichtsdaten auf unterschiedliche Art geschätzt werden. Bei der ersten und einfachsten Methode werden nur die Mittelpunkte der Klassen (z i ) für die Klassen i von 2 bis k-1 und die beobachteten Anteile der Klassen 2 bis k-1 (p k ) benutzt. D.h. die Grenzklassen werden nicht berücksichtigt. Der Mittelwert m1 ergibt sich als Summe der mit dem jeweiligen Klassenmittelpunkte multiplizierten Tierzahlen der betreffenden Klassen dividiert durch die Summe der Tierzahlen der Klassen 2 bis k-1. [4] m1 = Σ i=2 bis k-1 z i * N i / Σ i=2 bis k-1 N k Diese Schätzung weist zwangsläufig einen Bias auf, falls die Grenzklassen 1 und k existieren und insbesondere, falls sie ungleich gross sind. Falls die Grenzklassen unbedeutend sind, z.b. bei den Kategorien RV (Jungkühe) und VK (Kühe), dann kann diese Schätzung schon eine genügende Genauigkeit aufweisen. Eine Verbesserung der Schätzung wird dadurch erreicht, dass die Mittelwerte aller Gewichtsklassen aufgrund der geschätzten Verteilung approximiert werden. In R wird dazu jede Klasse i in 500 Subklassen (s) unterteilt, um den jeweiligen Klassenmittelwert m i zu schätzen. Die Wahrscheinlichkeiten innerhalb der i Klassen (p is ) werden anhand der approximierten Verteilung geschätzt. Für die Berechnung des Gesamtmittelwertes werden die effektiv in den Klassen beobachteten Tierzahlen verwendet (p i = N i / Σ i=1 bis k N i ) und nicht die aufgrund der approximierten Verteilung geschätzten Wahrscheinlichkeiten verwendet. [5] m2 i = Σ s=1 bis 500 m is * p is [6] m2 = Σ i=1 bis k m2 i * p i Eine dritte Variante besteht darin, den theoretischen Erwartungswert der approximierten Verteilung zu übernehmen, d.h. den Erwartungswert gemäss den geschätzten Parametern der Verteilung D für die Gewichte G. [7] m3 = E(D(G)) Überlegungen zur Varianz Die grobe Klassierung der Taxationsdaten entspricht einer Waage, welche die Gewichte nur mit einer Genauigkeit im Bereich der Klassenbreite der betreffenden Kategorie ermitteln kann. 9/50

10 Dementsprechend setzt sich die Varianz der Gewichtsdaten aus zwei Komponenten zusammen, der Varianz innerhalb der Gewichtsklassen aufgrund der Messgenauigkeit und der Varianz aufgrund der Abweichung der Klassenmittel vom Gesamtmittel (Varianz zwischen Klassen): [8] var(g) = var(zwischen Klassen) + var(innerhalb der Klassen) Die Varianz innerhalb der Klassen mit bekannter Breite (d.h. ohne die Grenzklassen) kann approximativ anhand einer uniformen Verteilung mit der Breite der Gewichtsklassen geschätzt werden. Die Varianz einer uniform verteilten Variablen entspricht der folgenden Formel: [9] var(u(α,β)) = (β- α) 2 / 12 bzw. = Klassenbreite 2 / 12 dabei entsprechen α und β der unteren bzw. oberen Grenze der betreffenden Klasse und β- α somit der Klassenbreite der jeweiligen Gewichtsklassen einer Kategorie. In der Tabelle 4 werden die entsprechenden Schätzwerte für die Intra-Klassen-Varianz dargestellt. Dabei wird die Varianz der Grenzklassen nicht berücksichtigt. Diese Klassen können breiter sein als die restlichen Klassen und somit eine grössere Intra-Klassen-Varianz aufweisen. Tabelle 4: Kategorie, Klassenbreite und geschätzte Intra-Klassen-Varianz Kategorie Klassenbreite in kg Intra-Klassen-Varianz (V ik ) GI (Gitzi) JB (Jungvieh) KV (Kälber) LA (Lämmer) MA (ältere Stiere) MT (Muni) OB (Ochsen) RG (Rinder) RV (Jungkühe) SM (Schafe) VK (Kühe) Schweine Schätzung der Gesamtvarianz Die Gesamtvarianz kann wie der Mittelwert auf unterschiedliche Art geschätzt werden. Dabei soll dieselbe Systematik wie für den Mittelwert verwendet werden. Zuerst wird die Varianz aufgrund der vorhandenen Klassenmittelpunkte z i für die Klassen 2 bis k-1 berechnet, korrigiert um die Freiheitsgrade aufgrund der Anzahl Tiere in den Klassen 2 bis k-1. Es wird der Mittelwert m1 verwendet, gemäss [4]. [10] v1 = Σ N i=2 bis k-1 /(Σ N i=2 bis k-1-1) * Σ i=2 bis k-1 (z k -m1) 2 * N i / Σ i=2 bis k-1 N i Falls sich Tiere in den Grenzklassen befinden, dann wird auf diese Weise die Varianz unterschätzt. Eine Verbesserung kann durch die Unterteilung der Klassen in Subklassen wie für den Mittelwert m2 erzielt werden. Als Gesamtmittel wird dementsprechend m2 gemäss [6] verwendet. [11] v2 = {Σ i=1 bis k Σ s=1 bis 500 (m is -m2) 2 * N i * p is } / ( N -1) Die erwarteten Anzahlen in den Subklassen ergeben sich aus der geschätzten Wahrscheinlichkeit gemäss der angepassten Verteilung und den beobachteten Tierzahlen in den Klassen. Alternativ kann die Gesamtvarianz auch direkt aufgrund der approximierten Verteilung (D) geschätzt werden. [12] v3 = var(d(g)) Vertrauensintervall Standardmässig wird das Vertrauensintervall des Mittelwertes (VI) definiert als [13] VI = m ± q t * (v / N) 0.5 Wobei q t dem Quantil der t-verteilung entspricht, üblicherweise mit einer Irrtumswahrscheinlichkeit von 5 % und dem Freiheitsgrad entsprechend der Anzahl Beobachtungen /50

11 Dies ist die korrekte Berechnungsmethode, falls der Mittelwert m und die Varianz v für eine Stichprobe genau bekannt sind. Da die Varianz im vorliegenden Fall aufgrund von k Klassen mit p Parametern geschätzt wird, ist dieses Vertrauensintervall sicher zu optimistisch. Grundsätzlich müsste man auch die Qualität der Schätzung (Resultat des Anpassungstests) berücksichtigen. Da über die Taxation in Abhängigkeit von der Tierkategorie zum Teil ein beachtlicher Teil aller Schlachttiere der jeweiligen Zeitperiode erfasst werden, bei den Kälbern z.b. ca. 70 %, könnte man für die Varianz grundsätzlich eine Endlichkeitskorrektur vornehmen. Auf diese wird jedoch aus mehreren Gründen verzichtet: Die definitiven Schlachtzahlen sind zum Zeitpunkt der Gewichtsschätzung noch nicht bekannt. Der Einfluss ist erst ab einem hohen Anteil der erfassten Tiere von Bedeutung. In diesem Fall wird die Varianz des Mittelwertes schon durch die entsprechend grosse Tierzahl stark reduziert Verteilung der Daten Grundsätzlich wäre zu erwarten, dass die Tierzahlen eher rechtsschief verteilt sind. Gegen eine herkömmliche Normalverteilung spricht die Tatsache, dass die Skala gegen unten in jedem Fall durch 0 begrenzt wird. Allerdings wird die mögliche Schwankungsbreite der Gewichte durch die Ansprüche der Abnehmer bezüglich Gewicht und Ausmastgrad der Schlachttiere stark eingeschränkt. Eine Schlachtkategorie deckt somit einen vergleichsweise kurzen Zeitabschnitt der Gesamtlebensdauer der betreffenden Ursprungstierart. Trotzdem ist zu erwarten, dass die Verteilung eher rechtsschief ist. Mit diesen Vorgaben wurden mehrere Verteilungen geprüft. Am geeignetsten erschienen die t-verteilung (vgl. Engineering Statistics Handbook, 2006) und die Gamma-Verteilung (vgl. WolframMathWorld, 2006, in der Folge als Γ-Verteilung bezeichnet). Die t- Verteilung lässt im Gegensatz zur Normalverteilung eine breitere Verteilung der Werte zu. Sie ist jedoch ebenfalls symmetrisch und hat keine festen Grenzen. Die Γ-Verteilung ist gegen unten durch 0 begrenzt und nicht symmetrisch. Sie ist eine sehr flexible Verteilungsform. Es kann jedoch nicht davon ausgegangen werden, dass die Gewichtsdaten einer Kategorie mit Sicherheit aus einer homogenen Verteilung stammen. In jeder Kategorie kann man sich Subpopulationen denken. Es sollen einige Beispiele aufgeführt werden. Die Tiere einer Kategorie können unterschiedlichen Rassen angehören, insbesondere Milchrassen und Mastrassen bei der Rindergattung. Die unterschiedliche Professionalität der Halter kann einen Einfluss ausüben: Gelegenheitsmäster und spezialisierte Mastbetriebe. Die unterschiedlichen Haltungsarten und Mastformen können von Bedeutung sein. Bei Rindern und Ochsen sind dies z.b. die konventionelle, eher intensive Mast und die eher extensive Mast im Rahmen der Mutterkuhhaltung (Natura Beef). Dies kann zu unterschiedlichen Schlachtgewichten führen Anpassung einer t-verteilung Es wird angenommen, dass die Gewichte (G) der Tiere an eine t-verteilung (TV) angepasst werden können. Für die t-verteilung muss zusätzlich zu den Parametern der Normalverteilung (Erwartungswert und Varianz) noch die Anzahl Freiheitsgrade (φ) geschätzt werden. Falls der Parameter φ gegen unendlich strebt, so ergibt sich die Normalverteilung. Die Verteilung der Gewichtsdaten aufgrund einer t-verteilung wird dementsprechend durch das Durchschnittsgewicht (µ), die Streuung (σ 2 ) und die Anzahl Freiheitsgrade (φ) definiert. [14] (G - µ) / σ ~ TV(φ) bzw. G = σ * TV(φ) + µ Die Streuung der t-verteilung ist folgendermassen bestimmt: [15] var(tv) = φ /( φ -2) 11/50

12 Dementsprechend ergibt sich die Varianz der Gewichtsdaten aufgrund einer approximierten Verteilung gemäss [12]. Als Startwerte für die Anpassung mit der R-Funktion optim werden m=m1, s=v1 0.5 und φ =10 gewählt. Mit diesen Vorgaben konvergierte die Funktion optim mit den Standardeinstellungen (Methode Nelder-Mead) für die vorliegenden Daten immer Anpassung einer Γ-Verteilung Es wird angenommen, dass die Gewichte an eine Γ-Verteilung angepasst werden können. [16] G ~ Γ(α,θ) Dabei entspricht α dem Shape-Parameter und θ dem Scale-Parameter, durch welche die Γ-Verteilung definiert wird. Gegenüber der t-verteilung muss hier also ein Parameter weniger geschätzt werden. Alternativ kann die Γ-Verteilung auch mit dem Rate-Parameter (ρ) anstelle des Scale-Parameters definiert werden, dabei gilt [17] ρ = 1 / θ Auch diese Verteilung lässt sich mit der R-Funktion optim wie zuvor beschrieben anpassen. Als Startwerte werden a=m1/10 und r=0.1 gewählt. Aufgrund der Γ-Verteilung kann die Varianz geschätzt werden als [18] v3 = var(γ(g)) = αθ 2 bzw. α(1/ρ) 2 Der theoretische Erwartungswert der Verteilung ergibt sich als [19] m3 = α * θ bzw. α / ρ Als Startwerte für die Anpassung mit optim werden r=0.1 und a=m1*r gewählt. Mit diesen Vorgaben konvergierte die Funktion optim mit den Standardeinstellungen (Methode Nelder-Mead) für die vorliegenden Daten immer Kombination von Normal- und Γ-Verteilung Falls weder die t- noch die Γ-Verteilung mit Erfolg angepasst werden können, soll die Hypothese überprüft werden, ob allenfalls mehrere Verteilungen zusammenspielen. Um möglichst wenig Parameter schätzen zu müssen, wird dazu eine Kombination einer Normal- und einer Γ-Verteilung verwendet. Dazu müssen die 4 Parameter der beiden Verteilungen und ein Gewichtungsfaktor für die beiden Verteilungen bestimmt werden. Würde anstelle der Normalverteilung auch hier die t- Verteilung approximiert, müsste noch ein Parameter mehr geschätzt werden. Dabei ist schon bei einer Kombination von Normal- und Γ-Verteilung die Wahl geeigneter Startwerte essentiell und nicht immer einfach. Es wird somit angenommen, dass die Gewichte an eine Kombination einer Normal- und einer Γ- Verteilung angepasst werden können mit den Parametern µ = Erwartungswert der Normalverteilung σ = Standardabweichung der Normalverteilung α = Shape-Parameter der Γ-Verteilung ρ = Rate-Parameter der Γ-Verteilung w = Anteil der Normalverteilung, wobei 0 w w = Anteil der Γ-Verteilung Auch diese Kombination lässt sich mit der R-Funktion optim wie zuvor beschrieben anpassen. Allerdings ist es hier möglich, dass der Algorithmus nicht konvergiert bzw. keine sinnvollen Lösungen ergibt. Der theoretische Erwartungswert der kombinierten Verteilung ergibt sich als [20] m3 = w * µ + (1-w) * α / ρ Die Varianz kann folgendermassen berechnet werden: [21] v3 = w * [σ 2 + (µ - m3) 2 ] + (1-w) * [α(1/ρ) 2 + (α / ρ - m3) 2 ] 12/50

13 Dies entspricht der gewichteten Summe der Varianzen der beiden Verteilungen sowie der gewichteten Abweichungen der Erwartungswerte der beiden Verteilungen vom Gesamtmittelwert Wahl der besten Anpassung Um die Verteilungen anpassen zu können, müssen mindestens k = p + 1 Klassen vorhanden sein, d.h. eine Klasse mehr als Parameter geschätzt werden. Somit können bei den Schweinen mit 6 Klassen jeweils nur die t- oder die Γ-Verteilung alleine angepasst werden. Bei den Kategorien mit 8 Klassen scheint sich die Anpassung der Kombination kaum zu empfehlen, da im besten Fall (falls keine Klassen zusammengelegt werden müssen) 2 Freiheitsgrade für eine gleichzeitige Schätzung von zwei Verteilungen verbleiben. Tabelle 5; Verteilungen und zu schätzende Parameter Verteilung Γ-Verteilung 2 t-verteilung 3 Kombination Normal- und Γ-Verteilung 5 Anzahl Parameter (p) Für die Entscheidung, ob die Resultate der Γ-Verteilung oder t-verteilung verwendet werden soll, wird der P-Wert des betreffenden Anpassungstestes verwendet. D.h. 1 abzüglich der Wahrscheinlichkeit für den gefundenen T-Wert gemäss der Chiquadrat-Verteilung für die k-p-1 Freiheitsgrade. Falls dieser Wert grösser als 0.05 ist, so kann die Hypothese, dass die Verteilung mit Erfolg angepasst worden ist, beibehalten werden. Dementsprechend wird die Verteilung mit dem grösseren P-Wert bevorzugt Simulationen zum Vertrauensintervall Multinomial verteilte Zufallsdaten Um die Zuverlässigkeit des berechneten Vertrauensintervalls zu kontrollieren, werden anhand der in den Klassen vorhandenen Daten multinomial verteilte Zufallszahlen generiert. G ~ M(N,k) Die Ausgangsparameter N (Anzahl Tiere), k (Anzahl Klassen) und die entsprechenden Wahrscheinlichkeiten der Klassen werden dabei vom Datensatz, d.h. von den beobachteten Werten, übernommen. Mit der R-Funktion rmultinom können auf dieser Basis Zufallswerte für die Tierzahlen in den k Klassen erzeugt werden. Anschliessend wird für jeden Datensatz die Verteilung angepasst. Anhand der Quantile der resultierenden Mittelwerte kann ein Vertrauensintervall geschätzt werden. Diese Methode wurde insbesondere bei den Kälbern angewandt Zufallsstichproben Die Zuverlässigkeit des Vertrauensintervalls bei steigendem Anteil der Tiere in den Grenzklassen wird anhand von Simulationen überprüft. Bei den Kälbern KV werden dazu Zufallsstichproben aus einer Kombination von Normal- und Γ-Verteilung erstellt. Der Erwartungswirt wird zunehmend erhöht, so dass immer mehr Tiere in der oberen Grenzklasse anfallen. Für jedes Sample wird die t- Verteilung approximiert. Auf diese Weise wird geprüft, wie exakt die Approximation der Daten ist, falls sich zunehmend mehr Tiere in den Grenzklassen befinden. Es wurden 200 Stichproben mit jeweils Werten erzeugt. Es wurden die folgenden Ausgangsparameter benutzt: µ = 105 σ = 13 rate = 0.3 shape = µ * rate 13/50

14 Die Anteile der beiden Verteilungen wurden für die Normalverteilung auf 70 % und für die Γ- Verteilung auf 30 % festgesetzt. Für jedes neue Sample wurde µ um 0.2 kg erhöht. Bei den älteren Stieren werden Zufallsstichproben anhand einer reinen Gammaverteilung simuliert. Der Erwartungswert der Verteilung wird dabei zunehmend erhöht, während die Gesamtvarianz stabil gelassen wird. Durch die Vorgabe des Erwartungswertes und der Varianz können die Parameter (Shape, Rate) bestimmt werden. 3. Resultate 3.1. Kategorie GI Bei der Kategorie GI liegen für das ganze Jahr 2005 nur die klassierten Gewichte von 37 Tieren vor. Es wird deshalb nur ein Mittelwert für das Jahr 2005 geschätzt. Die unterste Klasse ist nicht besetzt und entfällt somit. Die Γ-Verteilung lässt sich etwas besser anpassen als die t-verteilung (T-Wert von 8.9 mit einem P-Wert von 0.353). Die Korrektur des Mittelwertes (m1 = 8.8 kg, m2 = 10.6 kg) ist relativ gross. Der korrigierte Wert stimmt recht gut mit dem Mittel des BFS (11 kg) überein. Die Präzision ist gering mit einem VI von [8.8,12.9]. Auch der unkorrigierte Mittelwert m1 liegt noch in diesem Intervall. Eine Anpassung der Kombination aus Normal- und Γ-Verteilung erübrigt sich, da die Anpassung der t- und der Γ-Verteilung keine signifikante Abweichung ergibt. Grafik 1: Kategorie GI, Daten 2005 mit angepasster Γ-Verteilung (T-Wert = 8.9, P-Wert = 03.53) 14/50

15 3.2. Kategorie JB Die Kategorie JB sind junge Faseltiere, welche eher zur Weitermast als zur Schlachtung verkauft werden. Deshalb liegen bei der Kategorie JB im Vergleich zu den anderen Kategorien insgesamt für das Jahr 2005 nur wenig Datensätze vor (N = 525). Es wird deshalb wie bei den Gitzi ebenfalls nur ein Jahreswert geschätzt. Dabei ist die Güte der Anpassung für die t- und die Γ-Verteilung sehr ähnlich (T t = 7.3, T G = 7.8 mit entsprechenden P-Werten von bzw ). Beide Verteilungen ergeben beinahe dasselbe Resultat. Übernommen wird das Resultat der Γ-Verteilung mit kg und einem VI von [146.5,151.3]. Dieser Wert liegt 2.3 kg höher als der unkorrigierte Mittelwert m1. Allerdings liegt der unkorrigierte Mittelwert m1 noch im Vertrauensintervall. Grafik 2: Kategorie JB, Daten 2005 mit angepasster Γ-Verteilung (T-Wert = 7.8, P-Wert = 0.170) 15/50

16 3.3. Kategorie KV Bei der wichtigen Kategorie Schlachtkälber KV sind insgesamt 23.7 % der Tiere ohne Gewichtsangabe. Die t-verteilung lässt sich um ein Vielfaches besser anpassen als die Γ- Verteilung, mit T-Werten von 1.9 bis Die approximierte t-verteilung weicht nur in 5 der 12 Monate mit einem P-Wert < 0.05 von den vorhandenen Daten ab. Der approximierte Mittelwert der t-verteilungen (m2) liegt im Durchschnitt 5.3 kg über dem unkorrigierten Mittelwert (m1). Ähnlich gut wie die t-verteilung lässt sich die Kombination von Normal- und Γ-Verteilung anpassen. Allerdings scheint die Gefahr einer Überanpassung relativ gross zu sein, da aufgrund von 8 Klassen 2 Verteilungen mit 5 Parametern angepasst werden. Die Mittelwerte und Vertrauensintervalle werden deshalb mit der t-verteilung geschätzt. Die Vertrauensintervalle für den Mittelwert liegen im Bereich von ± 0.2 bis 0.3 kg. Grafik 3: Kategorie KV, Daten April 2005 mit angepasster t-verteilung (T-Wert = 8.8, P-Wert = 0.067) 16/50

17 Ein Vergleich der Mittelwerte des BFS für das Jahr 2005 mit den approximierten Mittelwerten für 2005 und 2006 zeigt einen ausgeprägt saisonalen Verlauf der Mittelwerte. Der Verlauf der Mittelwerte ist dabei für die Jahre 2005 und 2006 sehr ähnlich. Allerdings liegen die BFS- Mittelwerte 2005 immer tiefer. Ohne den Ausreisser im Monat April beträgt die Differenz im Mittel 0.6 kg. Allerdings scheint der BFS-Wert für April 2005 aufgrund der CHTAX-Daten 2005 sowie 2006 nicht sehr realistisch zu sein. Grafik 4: Mittelwerte des BFS für das Jahr 2005 und approximierte Mittelwerte für die Jahre 2005 sowie 2006, Preise 1 pro kg Schlachtgewicht für die Jahre 2005 sowie 2006, alle Werte nach Monat. Schlachtgewicht in kg / Preis in Fr./kg SG Gewicht BFS 2005 Gewicht Geschätzt 2005 Gewicht Geschätzt 2006 Preis 2005 (Fr./kg SG) Preis 2006 (Fr./kg SG) Monat Realisierte Preise inkl. MwSt gemäss Proviande für die Herkunft QM Schweizer Fleisch und die Qualität T3 Eine mögliche Erklärung für den saisonalen Verlauf der Gewichtskurve besteht darin, dass aufgrund der Milchkontingentierung ab Ende Winter der Anteil jener Kälber zunimmt, welche v.a. mit Vollmilch gemästet werden. Die Mast mit Vollmilch führt zu einer verspäteten Schlachtreife und dementsprechend höheren Schlachtgewichten. Dies ist die Ursache für den Anstieg zu Beginn des Jahres und die hohen Werte in den Monaten April und Mai sein. Anschliessend reduziert sich der Anteil der Kälber aus Vollmilchmast und bei gleichzeitig sinkenden Preisen gehen die Kälber im Durchschnitt leichter an die Schlachtbank. Im Herbst ziehen die Preise normalerweise wieder an und die Produzenten versuchen ihren Ertrag über höhere Schlachtgewichte zu optimieren. Gegen Ende Jahr werden die Schlachtgewicht auf Grund der zu erwartenden tiefen Preise anfangs des Folgejahres wieder abgesenkt. 17/50

18 3.4. Kategorie LA Bei der Kategorie LA haben insgesamt 9.7 % der Tiere keine Gewichtsangabe. Diese Tiere sind jedoch recht gleichmässig in der untersten und obersten Klasse verteilt und nicht so einseitig wie bei den Kälbern. Dies balanciert allfällige Schätzfehler tendenziell wieder etwas aus. Die t- Verteilung lässt sich eher besser anpassen (T=8.9 bis 128.1) als die Γ-Verteilung (T=21.6 bis 163.9). Allerdings weichen beide Verteilungen jeweils signifikant von der gegebenen Verteilung der Daten ab (mit Ausnahme der t-verteilung bei den Dezember-Daten). Aus praktischer Sicht günstig ist dabei jedoch der Umstand, dass es keinen relevanten Unterschied (Differenz 0.1 kg) zwischen den aufgrund der beiden unterschiedlichen Verteilungen geschätzten Mittelwerten gibt. Der geschätzte Mittelwert (m2) liegt im Durchschnitt 0.3 kg über dem unkorrigierten Mittelwert (m1). Die Kombination aus Normal- und Γ-Verteilung lässt sich sehr gut anpassen, allerdings ergibt dies nochmals dieselben Resultate. Die Vertrauensintervalle liegen im Bereich von ± 0.1 bis 0.2 kg. Grafik 5: Kategorie LA, Daten Mai 2005 mit angepasster t-verteilung (T-Wert = 25.9, P-Wert < 0.001) 18/50

19 3.5. Kategorie MA 38.7 % der Tiere dieser Kategorie haben keine Gewichtsangabe, die betreffenden Tiere befinden sich ausschliesslich in der obersten Gewichtsklasse. Die Kategorie MA (ältere Stiere) weist eine sehr grosse Varianz der Gewichte auf. Dies lässt sich dadurch erklären, dass diese Kategorie Tiere von sehr unterschiedlichem Alter erfassen kann. Das Gewicht variiert von den vergleichsweise tiefen Gewichten deklassierter Mastmuni bis zu den hohen Gewichten von alten Zuchtstieren. Von den 16 möglichen Klassen sind vor allem die unteren schlecht besetzt und die Anzahl Klassen muss mit einer Ausnahme auf 11 bis 15 Klassen reduziert werden. Bei den Daten des Jahres 2005 lässt sich die Γ-Verteilung in 10 von 12 Fällen besser anpassen als die t- Verteilung (T-Wert von 13.7 bis 26.5 gegenüber 2.9 bis 34.6). Der Mittelwert m1 liegt durchschnittlich um 76 kg tiefer als der mit der Γ-Verteilung geschätzte Mittelwert m2. Das Vertrauensintervall ist mit ± 13 bis 23 kg sehr breit. Die Kombination aus Normal- und Γ-Verteilung lässt sich zwar gut schätzen, ist jedoch nicht wirklich erforderlich, da die Anpassung der Γ- Verteilung nur in 2 von 12 Monaten eine signifikante Abweichung ergibt. Grafik 6: Kategorie MA, Daten April 2005 mit angepasster Γ-Verteilung (T-Wert = 7.5, P-Wert = 0.482) 19/50

20 3.6. Kategorie MT Bei der Kategorie MT sind nur 1.1 % der Tiere ohne Gewichtsangabe. Die obersten Gewichtsklassen sind wenig besetzt, weshalb bei vier Monaten die Anzahl Klassen von 16 auf 15 bzw. 14 reduziert wurde. Die t-verteilung lässt sich um ein Vielfaches besser anpassen als die Γ- Verteilung, allerdings mit relativ hohen T-Werten von 73.5 bis gegenüber bis bei der Γ-Verteilung. Die entsprechenden P-Werte liegen für beide Verteilungen alle unter Der Unterschied zwischen dem approximierten Mittelwert m2 und dem Mittelwert ohne Grenzklassen m1 ist jedoch für beide Verteilungen gering. Die Kombination aus Normal- und Γ-Verteilung lässt sich weitaus besser anpassen (mit T-Werten von 12.6 bis 56.8), ohne dass sich daraus eine relevante Differenz zum Schätzer m1 oder zum Schätzer m2 gemäss t-verteilung ergeben würde. Interessant ist in diesem Zusammenhang, dass der Anteil der Normalverteilung im Bereich von 68 bis 80 % und somit konstant hoch geschätzt wird. Dies entspricht der Erwartung, dass der Anteil konventionell gemästeter Tiere mit hohen Schlachtgewichten bei dieser Kategorie relativ hoch sein sollte bei einem kleineren Anteil leichterer Tiere aus der Mutterkuh- bzw. Weidehaltung. Grafik 7: Kategorie MT, Daten September 2005 mit angepasster Kombination aus Normalund Γ-Verteilung (T-Wert = 12.6, P-Wert = 0.247) 20/50

21 3.7. Kategorie OB Bei der Kategorie OB liegen nur 0.3 % der Tiere ausserhalb des definierten Gewichtsbereichs und zwar alle in der unteren Grenzklasse. Aufgrund der schwach besetzten oberen Klassen müssen die Klassen mit einer Ausnahme von 14 auf 11 bis 13 Klassen reduziert werden. Die Γ-Verteilung (T-Werte von 11.9 bis 53.9) lässt sich leicht besser anpassen als die t-verteilung (T-Werte von 13.6 bis 97.9). Die Resultate der beiden Methoden sind jedoch sozusagen identisch und die Korrektur der Gewichte ist gering bei einer mittleren Differenz von 0.3 kg zwischen m1 und m2. Sehr gut anpassen lässt sich die Kombination aus Normal- und Γ-Verteilung (T-Werte von 6.4 bis 39.0), wobei die Anteile der beiden Verteilungen wohl in etwa den beiden Subpopulationen aus Mutterkuhhaltung bzw. Weidemast (eher leichter) sowie aus konventioneller Mast (eher schwerer) entsprechen. Aufgrund der nachfolgenden Grafik ergibt sich effektiv der Eindruck, dass die Verteilung aus mindestens zwei Subpopulationen gebildet wird. Grafik 8: Kategorie OB, Daten Januar 2005 mit angepasster Kombination aus Normal- und Γ-Verteilung (T-Wert = 15.0, P-Wert = 0.020) 21/50

22 3.8. Kategorie RG Nur 0.7 % der Rinder haben keine Gewichtsangabe. Diese Tiere liegen wie bei den Ochsen alle in der unteren Grenzklasse. Da die oberen Klassen sehr schwach besetzt sind, wird die Anzahl Klassen auf 12 bis 15 Klassen herabgesetzt. Die Γ-Verteilung (T-Werte von 50.5 bis 196.3) lässt sich besser anpassen als die t-verteilung (T-Werte von 80.1 bis 173.2), wobei keine relevante Differenz zwischen den Resultaten besteht. Allerdings ist die Abweichung von der effektiven Verteilung immer signifikant. Der approximierte Mittelwert m2 liegt im Mittel 0.8 kg unter dem Wert m1. Die Kombination aus Normal- und Γ-Verteilung kann gut angepasst werden (T-Werte von 6.7 bis 46.6). Dabei ist der Anteil der Normalverteilung mit 8 bis 34 % recht einheitlich. Allenfalls könnte es sich hier wie bei den Ochsen um die Anteile von Tieren aus Mutterkuhhaltung bzw. Weidemast (eher leichtere Tiere) und aus konventioneller Mast (eher schwerere Tiere) handeln. Auch rein optisch (vgl. Grafik 9) hat man wie schon bei den Ochsen den Eindruck, dass die Verteilung kaum von einer homogenen Population stammen kann. Grafik 9: Kategorie RG, Daten Juli 2005 mit angepasster Kombination aus Normal- und Γ- Verteilung (T-Wert = 6.7, P-Wert = 0.593) 22/50

23 3.9. Kategorie RV Bei der Kategorie RV sind die Ausgangsdaten von Juni 2005 bis Dezember 2005 offensichtlich nicht korrekt. In diesen 7 Monaten sind bis 40 % der Tiere in der untersten Klasse ohne Gewicht, während ansonsten 0 oder 1 Tier in diese Klasse fallen. Diese offensichtlich falschen Werte werden deshalb nicht berücksichtigt. Leider konnte nicht eruiert werden, was die Ursache für diese fehlerhaften Daten war. Die Klassenzahl muss immer korrigiert werden, von 16 auf 11 bis 15 Klassen. Es ergibt sich so gut wie keine Differenz zwischen m1 und m2. Die t-verteilung lässt sich eher leicht besser anpassen als die Γ-Verteilung, allerdings ergibt sich kein Unterschied bei den Resultaten. Bei den doch recht tiefen T-Werten der t-verteilung (2.6 bis 27.6), welche nur in 4 Fällen eine signifikante Abweichung ergaben, kann die Kombination von Normal- und Γ-Verteilung kaum ein besseres Resultat erbringen. Zudem scheint diese Kategorie auch optisch homogener zu sein als jene der Kategorien OB und RG. Grafik 10: Kategorie RV, Daten Juni 2005 mit angepasster t-verteilung (T-Wert = 8.6, P-Wert = 0.285) 23/50

24 3.10. Kategorie SM 3 % der Schafe haben im Jahr 2005 keine Gewichtsangabe. Es liegen eher wenig klassierte Gewichte vor (N = 4123). In den oberen Klassen sind nur wenige Tiere, weshalb nur in 2 Monaten 8 Klassen berücksichtigt werden konnten und sich die Anzahl Klassen in allen anderen auf 6 bis 7 Klassen reduzierte. Die Γ-Verteilung lässt sich mit T-Werten von 0.2 bis 28.4 besser anpassen als die t-verteilung (T-Werte von 3.8 bis 35.2). Die approximierten Mittelwerte sind jedoch für die t- Verteilung und die Γ-Verteilung exakt dieselben und sind im Mittel 0.6 kg tiefer als die unkorrigierten Mittelwerte m1. Die Anpassung der Kombination ist bei 6 bis 8 Klassen kaum sinnvoll. Grafik 11: Kategorie SM, Daten Oktober 2005 mit angepasster Γ-Verteilung (T-Wert = 10.1, P-Wert = 0.039) 24/50

25 3.11. Kategorie VK Es sind immer alle 16 Klassen besetzt, allerdings nur mit wenigen Tieren in den äussersten Klassen, so dass nur 0.1 % der Kühe ausserhalb der definierten Gewichtsklassen liegen. Es ergibt sich deshalb nur eine unbedeutende Korrektur des Mittelwertes von m1 zu m2 von durchschnittlich 0.1 kg. Die Γ-Verteilung lässt sich immer besser anpassen als die t-verteilung, allerdings sind auch diese T-Werte relativ hoch (27.6 bis 272.5) und die approximierten Verteilungen weichen somit immer signifikant von der effektiven Verteilung der Daten ab. Besser anpassen lässt sich die Kombination aus Normal- und Γ-Verteilung (T-Werte von 15.9 bis 104.7). Allerdings ergibt auch diese Anpassung identische Resultate für die Mittelwerte. Grafik 12: Kategorie VK, Daten Juli 2005 mit angepasster t-verteilung (T-Wert = 245.8, P- Wert < 0.001) 25/50

26 3.12. Kategorie Schweine Nur 2.0 % der Schweine liegen in den Grenzklassen 1 und 6. Die t-verteilung kann besser angepasst werden als die Γ-Verteilung, allerdings ist die Anpassung sehr schlecht (T-Werte von bis ). Zwischen den Resultaten aus den beiden approximierten Verteilungen gibt es jedoch keinen Unterschied. Da der Anteil der Tiere in der oberen Grenzklasse bedeutend grösser ist als in der unteren, liegt der geschätzte Mittelwert m2 im Mittel rund 0.3 kg über dem Mittelwert m1. Bei der grossen Anzahl von Schlachtschweinen hat auch diese geringe Differenz noch eine gewisse Bedeutung. Grafik 13: Schweine, Daten August 2005 mit angepasster t-verteilung (T-Wert = 238.7, P- Wert < 0.001) Überblick Bei den Kategorien mit hohen Anteilen von Tieren in den Grenzklassen kann jeweils mindestens eine der beiden einfachen Verteilungen mit befriedigender Genauigkeit approximiert werden. Dies ist v.a. von Bedeutung für die wichtige Klasse KV. Bei den Tierkategorien mit einer sehr schlechten Anpassung, d.h. insbesondere bei den Schweinen und weniger ausgeprägt bei den Muni MT, den Rindern RG und den Kühen VK, ist nur ein geringer Anteil der Tiere in den Grenzklassen, womit die Bedeutung der Approximation stark relativiert wird Multinomiale Zufallszahlen Die Überprüfung der Mittelwerte und der Vertrauensintervalle mit multinomial erzeugten Zufallszahlen bei der Kategorie KV ergibt eine recht gute Übereinstimmung. Schon mit 99 multinomial generierten Pseudodatensätzen ist das Vertrauensintervall stabil. Wie in Tabelle 6 gezeigt wird, weicht das berechnete Vertrauensintervall kaum vom standardmässig berechneten Vertrauensintervall (vergleiche [14]) ab. Zudem sind die Mittelwerte (vgl. Grafik 14) annähernd normal verteilt. 26/50

27 Tabelle 6: Geschätzte Mittelwerte, Vertrauensintervalle und multinomial geschätzte Vertrauensintervalle für die Kategorie KV Jahr-Monat geschätzter VI multinomial Mittelwert von bis von bis Grafik 14: Verteilung der aufgrund von multinomial verteilten Pseudozufallszahlen geschätzten Mittelwerte, 99 Mittelwerte, Kategorie KV Januar /50

28 3.15. Simulation Kälber KV Die Resultate der Simulation für 200 Zufallsstichproben mit steigendem Erwartungswert ergeben für die Kälber KV das in Grafik 15 gezeigte Resultat. Grafik 15: Abweichung der approximierten Mittelwerte vom Erwartungswert der Stichprobe (Abw. theoretisch) und vom effektiven Mittelwert der Stichprobe (Abw. effektiv), Bereich des Vertrauensintervalls (VI oben, VI unten) und mit 0.02 skalierte T-Werte gemäss Anteil Tiere in den Grenzklassen Wert Abw. theoretisch Abw. effektiv VI oben VI unten T-Wert * 0.02 Anteil der Kälber KV in den Grenzklassen (%) Es zeigt sich, dass der T-Wert tendenziell mit steigendem Anteil der Tiere in den Grenzklassen leicht sinkt und somit die Güte der Anpassung mit steigendem Anteil der Tiere in den Grenzklassen eher überschätzt wird. Allerdings liegt die Abweichung des geschätzten Mittelwertes in den überwiegenden Fällen innerhalb der Bandbreite des geschätzten Vertrauensintervalls. Die Approximation wird erst ab einem sehr hohen Anteil der Tiere in den Grenzklassen unzuverlässig, in etwa ab 50 %. Der Anteil Tiere in den Grenzklassen liegt bei den Kälbern KV jedoch im Bereich zwischen 19 und 29 %, d.h. in einem Bereich, in welchem das Vertrauensintervall gemäss Simulation noch zuverlässig ist. Da die einzelnen Stichproben aufgrund des Anteils der Γ- Verteilung leicht rechtsschief verteilt sind, weist der geschätzte Mittelwert im vorliegenden Fall jedoch einen systematischen Bias auf. Er wird durchschnittlich um 0.1 kg zu tief geschätzt. 28/50

29 Ältere Stiere MA Die Resultate der Simulation für 200 Zufallsstichproben mit steigendem Erwartungswert bei konstanter Varianz (15000) ergeben für die Stiere MA das in Grafik 16 gezeigte Resultat. Grafik 16: Abweichung der approximierten Mittelwerte vom Erwartungswert der Stichprobe (Abw. theoretisch) und vom effektiven Mittelwert der Stichprobe (Abw. effektiv), Bereich des Vertrauensintervalls (VI oben, VI unten) und mit 0.5 skalierte T-Werte gemäss Anteil Tiere in den Grenzklassen Wert Abw. theoretisch Abw. effektiv VI oben VI unten T-Wert * Anteil der Stiere MA in den Grenzklassen (%) Im Gegensatz zu den Kälbern KV liegt der T-Wert immer in einem ähnlichen Bereich. Das Vertrauensintervall scheint sogar bis zu einem Anteil von etwa 60 % der Tiere in den Grenzklassen zuverlässig zu sein. Insgesamt stellen die Simulationen die Zuverlässigkeit der Methode nicht in Frage und die berechneten Vertrauensintervalle werden im Anwendungsbereich der Approximationen nicht in Frage gestellt. 29/50

30 4. Diskussion 4.1. Beurteilung Bei den Tierkategorien mit einem relevanten Anteil an Tieren in den Grenzklassen (v.a. GI, JB, KV, LA, MA, allenfalls auch SM) kann mindestens eine der beiden einfachen Verteilungen (t-verteilung, Γ-Verteilung) befriedigend angepasst werden. Allerdings kann bei einem grösseren Anteil Tieren in den Grenzklassen ein gewisser systematischer Bias nicht ausgeschlossen werden. Das Vertrauensintervall bleibt jedoch in einem weiten Bereich zuverlässig. Auf jeden Fall ergibt sich eine Verbesserung gegenüber einer Mittelwertsschätzung ohne Einbezug der Grenzklassen. Bei den übrigen Kategorien ist der Einfluss der Grenzklassen ohnehin gering. Der aufgrund der korrigierten Klassenanzahl vorgegebene Chiquadrat-Wert kann dabei jedoch meistens nicht unterschritten werden. D.h. es ergeben sich kleine P-Werte, welche eine signifikante (< 0.05) bzw. z.t. eine hoch signifikante (< 0.001) Abweichung der angepassten Verteilung von der effektiven Verteilung der Gewichte bedeuten. Ein befriedigender Anpassungstest kann v.a. dort erreicht werden, wo kleine Tierzahlen vorhanden sind (Kategorien GI, JB und MA). In den restlichen Kategorien ist die Abweichung vom Chiquadrat-Wert häufig signifikant, jedoch kaum von relevanter Bedeutung. t- und Γ-Verteilung liefern meist sehr ähnliche Schätzwerte. Falls sich Unterschiede bei den Schätzwerten - insbesondere beim Mittelwert - ergeben, so kann eine Verteilung auch deutlich besser approximiert werden. Die Frage nach der zu verwendenden Verteilung lässt sich somit aufgrund der P-Werte klar beantworten oder ist nicht von Bedeutung Interpretation der Verteilungen Eine Schlachtkategorie ist bezüglich der möglichen Gesamtlebensdauer der entsprechenden Tierart eine mehr oder weniger enge Auswahl von Tieren. Somit könnte eine mögliche Erklärung für die unterschiedliche Anpassungsgüte der t- und der Γ-Verteilung darin bestehen, dass bei sehr homogenen Tierkategorien bezüglich Alter und Gewicht (z.b. KV, LA, MT, Schweine) eher die t- Verteilung geeignet ist. Bei Tieren mit eher breiterer Herkunft bezüglich Alter und Gewicht (JB, MA, OB, RG, RV, SM und VK) ist dementsprechend eher die Γ-Verteilung geeignet, da in diesem Falle die Gewichte nach oben weiter streuen können Subpopulationen Insbesondere bei den Kategorien MT, OB, RG und VK kann festgestellt werden, dass die Daten kaum von einer homogenen Verteilung stammen können. Bei diesen Kategorien lässt sich eine Kombination aus Normal- und Γ-Verteilung meist besser anpassen als eine einzelne Verteilung. Die Wahl der beiden Verteilungen erfolgt im vorliegenden Fall ziemlich willkürlich mit dem Ziel, die Approximation möglichst einfach zu ermöglichen und die Anzahl Freiheitsgrade nicht zu stark zu reduzieren. Aus der Praxis ist bekannt, dass die Schlachttierkategorien nicht in jedem Fall homogenen Populationen entsprechen müssen. Eine Kombination aus zwei Verteilungen kann jedoch nur dort sinnvoll angepasst werden, wo aus der Sicht der vorliegenden Arbeit eigentlich kein Bedarf danach besteht, nämlich bei Schlachttierkategorien mit zahlreichen Klassen und einem geringen Anteil von Tieren in den Grenzklassen. Für eine präzise Aufteilung der Schlachttierkategorien in zwei Subpopulationen müssten zudem deutlich mehr Gewichtsklassen oder kontinuierliche Messungen vorliegen. Zudem müssten wohl auch weitere Verteilungskombinationen untersucht werden. Dies ist jedoch nicht das Ziel der vorliegenden Arbeit Vertrauensintervalle Die Vertrauensintervalle sind im Rahmen dieser Arbeit von untergeordneter Bedeutung, da in der Praxis einfach die berechneten Mittelwerte verwendet werden, ohne dass jemand aufgrund dieser Mittelwerte eine Fehlerschätzung durchführen würde. Die durchgeführten Simulationen stellen die 30/50

Anpassungstests VORGEHENSWEISE

Anpassungstests VORGEHENSWEISE Anpassungstests Anpassungstests prüfen, wie sehr sich ein bestimmter Datensatz einer erwarteten Verteilung anpasst bzw. von dieser abweicht. Nach der Erläuterung der Funktionsweise sind je ein Beispiel

Mehr

Konfidenzintervalle Grundlegendes Prinzip Erwartungswert Bekannte Varianz Unbekannte Varianz Anteilswert Differenzen von Erwartungswert Anteilswert

Konfidenzintervalle Grundlegendes Prinzip Erwartungswert Bekannte Varianz Unbekannte Varianz Anteilswert Differenzen von Erwartungswert Anteilswert Konfidenzintervalle Grundlegendes Prinzip Erwartungswert Bekannte Varianz Unbekannte Varianz Anteilswert Differenzen von Erwartungswert Anteilswert Beispiel für Konfidenzintervall Im Prinzip haben wir

Mehr

Willkommen zur Vorlesung Statistik (Master)

Willkommen zur Vorlesung Statistik (Master) Willkommen zur Vorlesung Statistik (Master) Thema dieser Vorlesung: Punkt- und Prof. Dr. Wolfgang Ludwig-Mayerhofer Universität Siegen Philosophische Fakultät, Seminar für Sozialwissenschaften Prof. Dr.

Mehr

Chi-Quadrat Verfahren

Chi-Quadrat Verfahren Chi-Quadrat Verfahren Chi-Quadrat Verfahren werden bei nominalskalierten Daten verwendet. Die einzige Information, die wir bei Nominalskalenniveau zur Verfügung haben, sind Häufigkeiten. Die Quintessenz

Mehr

Statistik Testverfahren. Heinz Holling Günther Gediga. Bachelorstudium Psychologie. hogrefe.de

Statistik Testverfahren. Heinz Holling Günther Gediga. Bachelorstudium Psychologie. hogrefe.de rbu leh ch s plu psych Heinz Holling Günther Gediga hogrefe.de Bachelorstudium Psychologie Statistik Testverfahren 18 Kapitel 2 i.i.d.-annahme dem unabhängig. Es gilt also die i.i.d.-annahme (i.i.d = independent

Mehr

Statistische Tests für unbekannte Parameter

Statistische Tests für unbekannte Parameter Konfidenzintervall Intervall, das den unbekannten Parameter der Verteilung mit vorgegebener Sicherheit überdeckt ('Genauigkeitsaussage' bzw. Zuverlässigkeit einer Punktschätzung) Statistischer Test Ja-Nein-Entscheidung

Mehr

Hypothesen: Fehler 1. und 2. Art, Power eines statistischen Tests

Hypothesen: Fehler 1. und 2. Art, Power eines statistischen Tests ue biostatistik: hypothesen, fehler 1. und. art, power 1/8 h. lettner / physik Hypothesen: Fehler 1. und. Art, Power eines statistischen Tests Die äußerst wichtige Tabelle über die Zusammenhänge zwischen

Mehr

8. Konfidenzintervalle und Hypothesentests

8. Konfidenzintervalle und Hypothesentests 8. Konfidenzintervalle und Hypothesentests Dr. Antje Kiesel Institut für Angewandte Mathematik WS 2011/2012 Beispiel. Sie wollen den durchschnittlichen Fruchtsaftgehalt eines bestimmten Orangennektars

Mehr

Kapitel XII - Gleichmäßig beste unverfälschte Tests und Tests zur Normalverteilung

Kapitel XII - Gleichmäßig beste unverfälschte Tests und Tests zur Normalverteilung Institut für Volkswirtschaftslehre (ECON) Lehrstuhl für Ökonometrie und Statistik Kapitel XII - Gleichmäßig beste unverfälschte Tests und Tests zur Normalverteilung Induktive Statistik Prof. Dr. W.-D.

Mehr

Allgemeines zu Tests. Statistische Hypothesentests

Allgemeines zu Tests. Statistische Hypothesentests Statistische Hypothesentests Allgemeines zu Tests Allgemeines Tests in normalverteilten Grundgesamtheiten Asymptotische Tests Statistischer Test: Verfahren Entscheidungsregel), mit dem auf Basis einer

Mehr

Einfache Varianzanalyse für unabhängige Stichproben

Einfache Varianzanalyse für unabhängige Stichproben Einfache Varianzanalyse für unabhängige Stichproben VARIANZANALYSE Die Varianzanalyse ist das dem t-test entsprechende Mittel zum Vergleich mehrerer (k 2) Stichprobenmittelwerte. Sie wird hier mit VA abgekürzt,

Mehr

Entscheidung zwischen zwei Möglichkeiten auf der Basis unsicherer (zufälliger) Daten

Entscheidung zwischen zwei Möglichkeiten auf der Basis unsicherer (zufälliger) Daten Prof. Dr. J. Franke Statistik II für Wirtschaftswissenschaftler 4.1 4. Statistische Entscheidungsverfahren Entscheidung zwischen zwei Möglichkeiten auf der Basis unsicherer (zufälliger) Daten Beispiel:

Mehr

Zweiseitiger Test für den unbekannten Mittelwert µ einer Normalverteilung bei unbekannter Varianz

Zweiseitiger Test für den unbekannten Mittelwert µ einer Normalverteilung bei unbekannter Varianz Grundlage: Zweiseitiger Test für den unbekannten Mittelwert µ einer Normalverteilung bei unbekannter Varianz Die Testvariable T = X µ 0 S/ n genügt der t-verteilung mit n 1 Freiheitsgraden. Auf der Basis

Mehr

Marktlage vom

Marktlage vom Schlachtviehmarkt Woche 36 / 2016 Marktlage vom 02.09.2016 Schlachtschweine QM Schweine Marktpreis ab Hof Marktlage Markttendenz / Aussichten 3.60 Fr. / kg SG Angebot >> Nachfrage Angebot Nachfrage Der

Mehr

Mathematische und statistische Methoden II

Mathematische und statistische Methoden II Statistik & Methodenlehre e e Prof. Dr. G. Meinhardt 6. Stock, Wallstr. 3 (Raum 06-206) Sprechstunde jederzeit nach Vereinbarung und nach der Vorlesung. Mathematische und statistische Methoden II Dr. Malte

Mehr

Statistische Tests. Kapitel Grundbegriffe. Wir betrachten wieder ein parametrisches Modell {P θ : θ Θ} und eine zugehörige Zufallsstichprobe

Statistische Tests. Kapitel Grundbegriffe. Wir betrachten wieder ein parametrisches Modell {P θ : θ Θ} und eine zugehörige Zufallsstichprobe Kapitel 4 Statistische Tests 4.1 Grundbegriffe Wir betrachten wieder ein parametrisches Modell {P θ : θ Θ} und eine zugehörige Zufallsstichprobe X 1,..., X n. Wir wollen nun die Beobachtung der X 1,...,

Mehr

3 Konfidenzintervalle

3 Konfidenzintervalle 3 Konfidenzintervalle Konfidenzintervalle sind das Ergebnis von Intervallschätzungen. Sicheres Wissen über Grundgesamtheiten kann man anhand von Stichproben nicht gewinnen. Aber mit Hilfe der Statistik

Mehr

Mathematik für Biologen

Mathematik für Biologen Mathematik für Biologen Prof. Dr. Rüdiger W. Braun Heinrich-Heine-Universität Düsseldorf 9. Dezember 2010 1 Konfidenzintervalle Idee Schätzung eines Konfidenzintervalls mit der 3-sigma-Regel Grundlagen

Mehr

Jost Reinecke. 7. Juni 2005

Jost Reinecke. 7. Juni 2005 Universität Bielefeld 7. Juni 2005 Testtheorie Test für unabhängige Stichproben Test für abhängige Stichproben Testtheorie Die Testtheorie beinhaltet eine Reihe von Testverfahren, die sich mit der Überprüfung

Mehr

Marktlage vom 18.12.2015

Marktlage vom 18.12.2015 Schlachtviehmarkt Woche 52 / 2015 Marktlage vom 18.12.2015 Schlachtschweine Schweine Marktpreis ab Hof Marktlage Markttendenz / Aussichten 3.40 Fr. / kg SG Angebot = Nachfrage Angebot Nachfrage Die Schlachtschweinepreise

Mehr

Marktlage vom

Marktlage vom Schlachtviehmarkt Woche 8 / 2016 Marktlage vom 19.02.2016 Schlachtschweine Schweine Marktpreis ab Hof Marktlage Markttendenz / Aussichten 3.50 Fr. / kg SG Angebot = Nachfrage Angebot Nachfrage Absolut

Mehr

k np g(n, p) = Pr p [T K] = Pr p [T k] Φ. np(1 p) DWT 4.1 Einführung 359/467 Ernst W. Mayr

k np g(n, p) = Pr p [T K] = Pr p [T k] Φ. np(1 p) DWT 4.1 Einführung 359/467 Ernst W. Mayr Die so genannte Gütefunktion g gibt allgemein die Wahrscheinlichkeit an, mit der ein Test die Nullhypothese verwirft. Für unser hier entworfenes Testverfahren gilt ( ) k np g(n, p) = Pr p [T K] = Pr p

Mehr

Grundlegende Eigenschaften von Punktschätzern

Grundlegende Eigenschaften von Punktschätzern Grundlegende Eigenschaften von Punktschätzern Worum geht es in diesem Modul? Schätzer als Zufallsvariablen Vorbereitung einer Simulation Verteilung von P-Dach Empirische Lage- und Streuungsparameter zur

Mehr

Hypothesenprüfung. Darüber hinaus existieren zahlreiche andere Testverfahren, die alle auf der gleichen Logik basieren

Hypothesenprüfung. Darüber hinaus existieren zahlreiche andere Testverfahren, die alle auf der gleichen Logik basieren Hypothesenprüfung Teil der Inferenzstatistik Befaßt sich mit der Frage, wie Hypothesen über eine (in der Regel unbekannte) Grundgesamtheit an einer Stichprobe überprüft werden können Behandelt werden drei

Mehr

INFERENZSTATISTISCHE AUSSAGEN FÜR LAGEMAßE UND STREUUNGSMAßE. Inferenzstatistik für Lagemaße Inferenzstatistik für Streuungsmaße

INFERENZSTATISTISCHE AUSSAGEN FÜR LAGEMAßE UND STREUUNGSMAßE. Inferenzstatistik für Lagemaße Inferenzstatistik für Streuungsmaße DAS THEMA: INFERENZSTATISTIK III INFERENZSTATISTISCHE AUSSAGEN FÜR LAGEMAßE UND STREUUNGSMAßE Inferenzstatistik für Lagemaße Inferenzstatistik für Streuungsmaße Inferenzstatistik für Lagemaße Standardfehler

Mehr

Lage- und Streuungsparameter

Lage- und Streuungsparameter Lage- und Streuungsparameter Beziehen sich auf die Verteilung der Ausprägungen von intervall- und ratio-skalierten Variablen Versuchen, diese Verteilung durch Zahlen zu beschreiben, statt sie graphisch

Mehr

10. Die Normalverteilungsannahme

10. Die Normalverteilungsannahme 10. Die Normalverteilungsannahme Dr. Antje Kiesel Institut für Angewandte Mathematik WS 2011/2012 Bisher haben wir vorausgesetzt, daß die Beobachtungswerte normalverteilt sind. In diesem Fall kann man

Mehr

R. Brinkmann Seite

R. Brinkmann  Seite R. Brinkmann http://brinkmann-du.de Seite 1 24.2.214 Grundlagen zum Hypothesentest Einführung: Wer Entscheidungen zu treffen hat, weiß oft erst im nachhinein ob seine Entscheidung richtig war. Die Unsicherheit

Mehr

Kapitel XIII - p-wert und Beziehung zwischen Tests und Konfidenzintervallen

Kapitel XIII - p-wert und Beziehung zwischen Tests und Konfidenzintervallen Institut für Volkswirtschaftslehre (ECON) Lehrstuhl für Ökonometrie und Statistik Kapitel XIII - p-wert und Beziehung zwischen Tests und Konfidenzintervallen Induktive Statistik Prof. Dr. W.-D. Heller

Mehr

1 Dichte- und Verteilungsfunktion

1 Dichte- und Verteilungsfunktion Tutorium Yannick Schrör Klausurvorbereitungsaufgaben Statistik Lösungen Yannick.Schroer@rub.de 9.2.26 ID /455 Dichte- und Verteilungsfunktion Ein tüchtiger Professor lässt jährlich 2 Bücher drucken. Die

Mehr

K8 Stetige Zufallsvariablen Theorie und Praxis

K8 Stetige Zufallsvariablen Theorie und Praxis K8 Stetige Zufallsvariablen Theorie und Praxis 8.1 Theoretischer Hintergrund Wir haben (nicht abzählbare) Wahrscheinlichkeitsräume Meßbare Funktionen Zufallsvariablen Verteilungsfunktionen Dichten in R

Mehr

Aussagen hierzu sind mit einer unvermeidbaren Unsicherheit behaftet, die statistisch über eine Irrtumswahrscheinlichkeit bewertet wird.

Aussagen hierzu sind mit einer unvermeidbaren Unsicherheit behaftet, die statistisch über eine Irrtumswahrscheinlichkeit bewertet wird. Stichprobenumfang Für die Fragestellung auf Gleichheit von ein oder zwei Stichproben wird auf Basis von Hypothesentests der notwendige Stichprobenumfang bestimmt. Deshalb werden zunächst die Grundlagen

Mehr

Auswahl von Schätzfunktionen

Auswahl von Schätzfunktionen Auswahl von Schätzfunktionen Worum geht es in diesem Modul? Überblick zur Punktschätzung Vorüberlegung zur Effizienz Vergleich unserer Schätzer für My unter Normalverteilung Relative Effizienz Einführung

Mehr

Lösungen zu den Übungsaufgaben in Kapitel 10

Lösungen zu den Übungsaufgaben in Kapitel 10 Lösungen zu den Übungsaufgaben in Kapitel 10 (1) In einer Stichprobe mit n = 10 Personen werden für X folgende Werte beobachtet: {9; 96; 96; 106; 11; 114; 114; 118; 13; 14}. Sie gehen davon aus, dass Mittelwert

Mehr

Ein- und Zweistichprobentests

Ein- und Zweistichprobentests (c) Projekt Neue Statistik 2003 - Lernmodul: Ein- Zweistichprobentests Ein- Zweistichprobentests Worum geht es in diesem Modul? Wiederholung: allgemeines Ablaufschema eines Tests Allgemeine Voraussetzungen

Mehr

VS PLUS

VS PLUS VS PLUS Zusatzinformationen zu Medien des VS Verlags Statistik II Inferenzstatistik 2010 Übungsaufgaben und Lösungen - Inferenzstatistik 1 [Übungsaufgaben und Lösungenn - Inferenzstatistik 1] ÜBUNGSAUFGABEN

Mehr

Aufgabenblock 4. Da Körpergröße normalverteilt ist, erhalten wir aus der Tabelle der t-verteilung bei df = 19 und α = 0.05 den Wert t 19,97.

Aufgabenblock 4. Da Körpergröße normalverteilt ist, erhalten wir aus der Tabelle der t-verteilung bei df = 19 und α = 0.05 den Wert t 19,97. Aufgabenblock 4 Aufgabe ) Da s = 8. cm nur eine Schätzung für die Streuung der Population ist, müssen wir den geschätzten Standardfehler verwenden. Dieser berechnet sich als n s s 8. ˆ = = =.88. ( n )

Mehr

3 Häufigkeitsverteilungen

3 Häufigkeitsverteilungen 3 Häufigkeitsverteilungen 3.1 Absolute und relative Häufigkeiten 3.2 Klassierung von Daten 3.3 Verteilungsverläufe 3.1 Absolute und relative Häufigkeiten Datenaggregation: Bildung von Häufigkeiten X nominal

Mehr

Wissenschaftliche Nachrichten: https://www.bmbf.gv.at/schulen/sb/wina/wina.html Vol. 131/2006, 19-21

Wissenschaftliche Nachrichten: https://www.bmbf.gv.at/schulen/sb/wina/wina.html Vol. 131/2006, 19-21 Der T-Test in Excel NORBERT BRUNNER und MANFRED KÜHLEITNER Ein häufiges Problem ist der Vergleich eines beobachteten Stichprobenmittelwerts mit einem Sollwert. Dabei wird der T-Test angewandt. Wir zeigen

Mehr

Klausur zu Statistik II

Klausur zu Statistik II GOETHE-UNIVERSITÄT FRANKFURT FB Wirtschaftswissenschaften Statistik und Methoden der Ökonometrie Prof. Dr. Uwe Hassler Wintersemester 03/04 Klausur zu Statistik II Matrikelnummer: Hinweise Hilfsmittel

Mehr

3. Das Prüfen von Hypothesen. Hypothese?! Stichprobe Signifikanztests in der Wirtschaft

3. Das Prüfen von Hypothesen. Hypothese?! Stichprobe Signifikanztests in der Wirtschaft 3. Das Prüfen von Hypothesen Hypothese?! Stichprobe 3.1. Signifikanztests in der Wirtschaft Prüfung, ob eine (theoretische) Hypothese über die Verteilung eines Merkmals X und ihre Parameter mit einer (empirischen)

Mehr

Statistik-Klausur vom

Statistik-Klausur vom Statistik-Klausur vom 27.09.2010 Bearbeitungszeit: 60 Minuten Aufgabe 1 Ein international tätiges Unternehmen mit mehreren Niederlassungen in Deutschland und dem übrigen Europa hat seine überfälligen Forderungen

Mehr

1.8 Kolmogorov-Smirnov-Test auf Normalverteilung

1.8 Kolmogorov-Smirnov-Test auf Normalverteilung 1.8 Kolmogorov-Smirnov-Test auf Normalverteilung Der Kolmogorov-Smirnov-Test ist einer der klassischen Tests zum Überprüfen von Verteilungsvoraussetzungen. Der Test vergleicht die Abweichungen der empirischen

Mehr

Klausur zu Methoden der Statistik II (mit Kurzlösung) Sommersemester Aufgabe 1

Klausur zu Methoden der Statistik II (mit Kurzlösung) Sommersemester Aufgabe 1 Lehrstuhl für Statistik und Ökonometrie der Otto-Friedrich-Universität Bamberg Prof. Dr. Susanne Rässler Klausur zu Methoden der Statistik II (mit Kurzlösung) Sommersemester 2013 Aufgabe 1 In einer Urne

Mehr

Anleitung: Standardabweichung

Anleitung: Standardabweichung Anleitung: Standardabweichung So kann man mit dem V200 Erwartungswert und Varianz bzw. Standardabweichung bei Binomialverteilungen für bestimmte Werte von n, aber für allgemeines p nach der allgemeinen

Mehr

Prof. Dr. Walter F. Tichy Dr. Matthias Müller Sommersemester 2006

Prof. Dr. Walter F. Tichy Dr. Matthias Müller Sommersemester 2006 Empirische Softwaretechnik Prof. Dr. Walter F. Tichy Dr. Matthias Müller Sommersemester 2006 Hypothesentesten, Fehlerarten und Güte 2 Literatur Kreyszig: Statistische Methoden und ihre Anwendungen, 7.

Mehr

Übungen mit dem Applet Vergleich von zwei Mittelwerten

Übungen mit dem Applet Vergleich von zwei Mittelwerten Vergleich von zwei Mittelwerten 1 Übungen mit dem Applet Vergleich von zwei Mittelwerten 1 Statistischer Hintergrund... 2 1.1 Typische Fragestellungen...2 1.2 Fehler 1. und 2. Art...2 1.3 Kurzbeschreibung

Mehr

Einführung in die Maximum Likelihood Methodik

Einführung in die Maximum Likelihood Methodik in die Maximum Likelihood Methodik Thushyanthan Baskaran thushyanthan.baskaran@awi.uni-heidelberg.de Alfred Weber Institut Ruprecht Karls Universität Heidelberg Gliederung 1 2 3 4 2 / 31 Maximum Likelihood

Mehr

Pocket Cards (Winning Probabilities) 6.1 Anzahl der Kombinationen Monte Carlo Simulation Ergebnisse 6

Pocket Cards (Winning Probabilities) 6.1 Anzahl der Kombinationen Monte Carlo Simulation Ergebnisse 6 6 6.1 Anzahl der Kombinationen 6. Monte Carlo Simulation 3 6.3 Ergebnisse 6 in case you do not speak German ignore the description and jump to the preflop win probability tables in chapter 6.3 Poker Trainer

Mehr

10,24 ; 10,18 ; 10,28 ; 10,25 ; 10,31.

10,24 ; 10,18 ; 10,28 ; 10,25 ; 10,31. Bei einer Flaschenabfüllanlage ist die tatsächliche Füllmenge einer Flasche eine normalverteilte Zufallsvariable mit einer Standardabweichung = 3 [ml]. Eine Stichprobe vom Umfang N = 50 ergab den Stichprobenmittelwert

Mehr

b) Bestimmen Sie die Varianz der beiden Schätzer. c) Ist ein oder sind beide Schätzer konsistent? Begründen Sie!

b) Bestimmen Sie die Varianz der beiden Schätzer. c) Ist ein oder sind beide Schätzer konsistent? Begründen Sie! Aufgabe 1 (3 + 3 + 2 Punkte) Ein Landwirt möchte das durchschnittliche Gewicht von einjährigen Ferkeln bestimmen lassen. Dies möchte er aus seinem diesjährigen Bestand an n Tieren schätzen. Er kann dies

Mehr

VU Testtheorie und Testkonstruktion WS 08/09; Lengenfelder, Fritz, Moser, Kogler

VU Testtheorie und Testkonstruktion WS 08/09; Lengenfelder, Fritz, Moser, Kogler VU Testtheorie und Testkonstruktion WS 08/09; Lengenfelder, Fritz, Moser, Kogler Hausübung In der Übung Übungsblatt 06 1. Gegeben: Skala zur Messung der Gesundheitssorge mit 20 Items (dichotomes Antwortformat).

Mehr

Statistik. Datenanalyse mit EXCEL und SPSS. R.01denbourg Verlag München Wien. Von Prof. Dr. Karlheinz Zwerenz. 3., überarbeitete Auflage

Statistik. Datenanalyse mit EXCEL und SPSS. R.01denbourg Verlag München Wien. Von Prof. Dr. Karlheinz Zwerenz. 3., überarbeitete Auflage Statistik Datenanalyse mit EXCEL und SPSS Von Prof. Dr. Karlheinz Zwerenz 3., überarbeitete Auflage R.01denbourg Verlag München Wien Inhalt Vorwort Hinweise zu EXCEL und SPSS Hinweise zum Master-Projekt

Mehr

Übungsaufgaben zu Statistik II

Übungsaufgaben zu Statistik II Übungsaufgaben zu Statistik II Prof. Dr. Irene Prof. Dr. Albrecht Ungerer Die Kapitel beziehen sich auf das Buch: /Ungerer (2016): Statistik für Wirtschaftswissenschaftler Springer Gabler 4 Übungsaufgaben

Mehr

Statistik 2 für SoziologInnen. Normalverteilung. Univ.Prof. Dr. Marcus Hudec. Themen dieses Kapitels sind:

Statistik 2 für SoziologInnen. Normalverteilung. Univ.Prof. Dr. Marcus Hudec. Themen dieses Kapitels sind: Statistik 2 für SoziologInnen Normalverteilung Univ.Prof. Dr. Marcus Hudec Statistik 2 für SoziologInnen 1 Normalverteilung Inhalte Themen dieses Kapitels sind: Das Konzept stetiger Zufallsvariablen Die

Mehr

Auswertung und Lösung

Auswertung und Lösung Dieses Quiz soll Ihnen helfen, Kapitel 4.7 und 4.8 besser zu verstehen. Auswertung und Lösung Abgaben: 71 / 265 Maximal erreichte Punktzahl: 8 Minimal erreichte Punktzahl: 0 Durchschnitt: 5.65 Frage 1

Mehr

Mathematik für Biologen

Mathematik für Biologen Mathematik für Biologen Prof. Dr. Rüdiger W. Braun Heinrich-Heine-Universität Düsseldorf 19. Januar 2011 1 Nichtparametrische Tests Ordinalskalierte Daten 2 Test für ein Merkmal mit nur zwei Ausprägungen

Mehr

Hypothesentest, ein einfacher Zugang mit Würfeln

Hypothesentest, ein einfacher Zugang mit Würfeln R. Brinkmann http://brinkmann-du.de Seite 4..4 ypothesentest, ein einfacher Zugang mit Würfeln Von einem Laplace- Würfel ist bekannt, dass bei einmaligem Wurf jede einzelne der Zahlen mit der Wahrscheinlichkeit

Mehr

Mögliche Fehler beim Testen

Mögliche Fehler beim Testen Mögliche Fehler beim Testen Fehler. Art (Irrtumswahrscheinlichkeit α), Zusammenfassung: Die Nullhypothese wird verworfen, obwohl sie zutrifft. Wir haben uns blamiert, weil wir etwas Wahres abgelehnt haben.

Mehr

Herzlich willkommen zur Vorlesung Statistik. Streuungsmaße oder die Unterschiedlichkeit der Daten nebst kurzen Ausführungen zu Schiefe und Wölbung

Herzlich willkommen zur Vorlesung Statistik. Streuungsmaße oder die Unterschiedlichkeit der Daten nebst kurzen Ausführungen zu Schiefe und Wölbung FB 1 W. Ludwig-Mayerhofer Statistik 1 Herzlich willkommen zur Vorlesung Statistik smaße oder die Unterschiedlichkeit der Daten nebst kurzen Ausführungen zu Schiefe und Wölbung FB 1 W. Ludwig-Mayerhofer

Mehr

Prüfgröße: Ist die durch eine Schätzfunktion zugeordnete reelle Zahl (etwa Mittelwert 7 C).

Prüfgröße: Ist die durch eine Schätzfunktion zugeordnete reelle Zahl (etwa Mittelwert 7 C). Statistik Grundlagen Charakterisierung von Verteilungen Einführung Wahrscheinlichkeitsrechnung Wahrscheinlichkeitsverteilungen Schätzen und Testen Korrelation Regression Einführung Aus praktischen Gründen

Mehr

Was sind Zusammenhangsmaße?

Was sind Zusammenhangsmaße? Was sind Zusammenhangsmaße? Zusammenhangsmaße beschreiben einen Zusammenhang zwischen zwei Variablen Beispiele für Zusammenhänge: Arbeiter wählen häufiger die SPD als andere Gruppen Hochgebildete vertreten

Mehr

Webinar Induktive Statistik. - Wahrscheinlichkeitsrechnung - Stichprobentheorie

Webinar Induktive Statistik. - Wahrscheinlichkeitsrechnung - Stichprobentheorie Webinar Induktive Statistik - Wahrscheinlichkeitsrechnung - Stichprobentheorie Wahrscheinlichkeitstheorie Aufgabe : Zwei Lieferanten decken den Bedarf eines PKW-Herstellers von 00.000 Einheiten pro Monat.

Mehr

Statistiken deuten und erstellen

Statistiken deuten und erstellen Statistiken deuten und erstellen Dipl. Ök. Jens K. Perret, M.Sc. Evgenija Yushkova, M.A. Schumpeter School of Business and Economics Bergische Universität Wuppertal Gaußstraße 20 42097 Wuppertal Inhalt

Mehr

Biostatistik, Winter 2011/12

Biostatistik, Winter 2011/12 Biostatistik, Winter 2011/12 / Übungsaufgaben Prof. Dr. Achim Klenke http://www.aklenke.de 13. Vorlesung: 10.02.2012 1/51 Aufgabe 1 Aufgabenstellung Übungsaufgaben Ein Pharmakonzern möchte ein neues Schlankheitsmedikament

Mehr

Grundlagen der Statistik

Grundlagen der Statistik Grundlagen der Statistik Übung 15 009 FernUniversität in Hagen Alle Rechte vorbehalten Fachbereich Wirtschaftswissenschaft Übersicht über die mit den Übungsaufgaben geprüften Lehrzielgruppen Lehrzielgruppe

Mehr

Statistische Auswertung in der Betriebsprüfung

Statistische Auswertung in der Betriebsprüfung Dr. Harald Krehl Der Einsatz verteilungsbezogener Verfahren Der Einsatz verteilungsbezogener Verfahren etwa des Benford- Newcomb Verfahrens oder der Normalverteilung bzw. der LogNormalverteilung in der

Mehr

1.1.1 Ergebnismengen Wahrscheinlichkeiten Formale Definition der Wahrscheinlichkeit Laplace-Experimente...

1.1.1 Ergebnismengen Wahrscheinlichkeiten Formale Definition der Wahrscheinlichkeit Laplace-Experimente... Inhaltsverzeichnis 0 Einführung 1 1 Zufallsvorgänge und Wahrscheinlichkeiten 5 1.1 Zufallsvorgänge.......................... 5 1.1.1 Ergebnismengen..................... 6 1.1.2 Ereignisse und ihre Verknüpfung............

Mehr

Signalverarbeitung 2. Volker Stahl - 1 -

Signalverarbeitung 2. Volker Stahl - 1 - - 1 - Überblick Bessere Modelle, die nicht nur den Mittelwert von Referenzvektoren sondern auch deren Varianz berücksichtigen Weniger Fehlklassifikationen Mahalanobis Abstand Besseres Abstandsmaß basierend

Mehr

1) Warum ist die Lage einer Verteilung für das Ergebnis einer statistischen Analyse von Bedeutung?

1) Warum ist die Lage einer Verteilung für das Ergebnis einer statistischen Analyse von Bedeutung? 86 8. Lageparameter Leitfragen 1) Warum ist die Lage einer Verteilung für das Ergebnis einer statistischen Analyse von Bedeutung? 2) Was ist der Unterschied zwischen Parametern der Lage und der Streuung?

Mehr

Anhang 4. Bias durch Überdiagnose von papillären Mikrokarzinomen

Anhang 4. Bias durch Überdiagnose von papillären Mikrokarzinomen Anhang 4 Bias durch Überdiagnose von papillären Mikrokarzinomen Bias durch Überdiagnose von papillären Mikrokarzinomen H. Bertelsmann AG Epidemiologie und Medizinische Statistik Universität Bielefeld Dezember

Mehr

Teil: lineare Regression

Teil: lineare Regression Teil: lineare Regression 1 Einführung 2 Prüfung der Regressionsfunktion 3 Die Modellannahmen zur Durchführung einer linearen Regression 4 Dummyvariablen 1 Einführung o Eine statistische Methode um Zusammenhänge

Mehr

Überblick Hypothesentests bei Binomialverteilungen (Ac)

Überblick Hypothesentests bei Binomialverteilungen (Ac) Überblick Hypothesentests bei Binomialverteilungen (Ac) Beim Testen will man mit einer Stichprobe vom Umfang n eine Hypothese H o (z.b.p o =70%) widerlegen! Man geht dabei aus von einer Binomialverteilung

Mehr

Statistik-Übungsaufgaben

Statistik-Übungsaufgaben Statistik-Übungsaufgaben 1) Bei der Produktion eine Massenartikels sind erfahrungsgemäß 20 % aller gefertigten Erzeugnisse unbrauchbar. Es wird eine Stichprobe vom Umfang n =1000 entnommen. Wie groß ist

Mehr

Analyse von Querschnittsdaten. Signifikanztests I Basics

Analyse von Querschnittsdaten. Signifikanztests I Basics Analyse von Querschnittsdaten Signifikanztests I Basics Warum geht es in den folgenden Sitzungen? Kontinuierliche Variablen Generalisierung kategoriale Variablen Datum 13.10.2004 20.10.2004 27.10.2004

Mehr

Einführung in die Induktive Statistik: Testen von Hypothesen

Einführung in die Induktive Statistik: Testen von Hypothesen Einführung in die Induktive Statistik: Testen von Hypothesen Jan Gertheiss LMU München Sommersemester 2011 Vielen Dank an Christian Heumann für das Überlassen von TEX-Code! Testen: Einführung und Konzepte

Mehr

Statistik, Geostatistik

Statistik, Geostatistik Geostatistik Statistik, Geostatistik Statistik Zusammenfassung von Methoden (Methodik), die sich mit der wahrscheinlichkeitsbezogenen Auswertung empirischer (d.h. beobachteter, gemessener) Daten befassen.

Mehr

9. Schätzen und Testen bei unbekannter Varianz

9. Schätzen und Testen bei unbekannter Varianz 9. Schätzen und Testen bei unbekannter Varianz Dr. Antje Kiesel Institut für Angewandte Mathematik WS 2011/2012 Schätzen und Testen bei unbekannter Varianz Wenn wir die Standardabweichung σ nicht kennen,

Mehr

Statistik. Datenanalyse mit EXCEL und SPSS. Prof. Dr. Karlheinz Zwerenz. R.Oldenbourg Verlag München Wien. Von

Statistik. Datenanalyse mit EXCEL und SPSS. Prof. Dr. Karlheinz Zwerenz. R.Oldenbourg Verlag München Wien. Von Statistik Datenanalyse mit EXCEL und SPSS Von Prof. Dr. Karlheinz Zwerenz R.Oldenbourg Verlag München Wien Inhalt Vorwort Hinweise zu EXCEL und SPSS Hinweise zum Master-Projekt XI XII XII TEIL I GRUNDLAGEN

Mehr

Zeit zum Kochen [in min] [10, 20[ [20, 30[ [30, 40[ [40, 50[ [50,60[ [60, 100] Hi

Zeit zum Kochen [in min] [10, 20[ [20, 30[ [30, 40[ [40, 50[ [50,60[ [60, 100] Hi 1. Susi und Fritzi bereiten ein Faschingsfest vor, dazu gehört natürlich ein Faschingsmenü. Ideen haben sie genug, aber sie möchten nicht zu viel Zeit fürs Kochen aufwenden. In einer Zeitschrift fanden

Mehr

Testen von Hypothesen:

Testen von Hypothesen: Testen von Hypothesen: Ein Beispiel: Eine Firma produziert Reifen. In der Entwicklungsabteilung wurde ein neues Modell entwickelt, das wesentlich ruhiger läuft. Vor der Markteinführung muss aber auch noch

Mehr

Übung zu Empirische Ökonomie für Fortgeschrittene SS 2009

Übung zu Empirische Ökonomie für Fortgeschrittene SS 2009 Übung zu Empirische Ökonomie für Fortgeschrittene Steen Elstner, Klaus Wohlrabe, Steen Henzel SS 9 1 Wichtige Verteilungen Die Normalverteilung Eine stetige Zufallsvariable mit der Wahrscheinlichkeitsdichte

Mehr

Zufallsvariablen [random variable]

Zufallsvariablen [random variable] Zufallsvariablen [random variable] Eine Zufallsvariable (Zufallsgröße) X beschreibt (kodiert) die Versuchsausgänge ω Ω mit Hilfe von Zahlen, d.h. X ist eine Funktion X : Ω R ω X(ω) Zufallsvariablen werden

Mehr

Analytische Statistik II

Analytische Statistik II Analytische Statistik II Institut für Geographie 1 Schätz- und Teststatistik 2 Das Testen von Hypothesen Während die deskriptive Statistik die Stichproben nur mit Hilfe quantitativer Angaben charakterisiert,

Mehr

Modul G.1 WS 07/08: Statistik

Modul G.1 WS 07/08: Statistik Modul G.1 WS 07/08: Statistik 10.01.2008 1 2 Test Anwendungen Der 2 Test ist eine Klasse von Verfahren für Nominaldaten, wobei die Verteilung der beobachteten Häufigkeiten auf zwei mehrfach gestufte Variablen

Mehr

Angewandte Statistik 3. Semester

Angewandte Statistik 3. Semester Angewandte Statistik 3. Semester Übung 5 Grundlagen der Statistik Übersicht Semester 1 Einführung ins SPSS Auswertung im SPSS anhand eines Beispieles Häufigkeitsauswertungen Grafiken Statistische Grundlagen

Mehr

Statistics, Data Analysis, and Simulation SS 2015

Statistics, Data Analysis, and Simulation SS 2015 Mainz, May 12, 2015 Statistics, Data Analysis, and Simulation SS 2015 08.128.730 Statistik, Datenanalyse und Simulation Dr. Michael O. Distler Dr. Michael O. Distler

Mehr

Anwendungsaufgaben. Effektgröße bei df Zähler = df A = 1 und N = 40 (zu berechnen aus df Nenner ): Der aufgedeckte Effekt beträgt also etwa 23 %.

Anwendungsaufgaben. Effektgröße bei df Zähler = df A = 1 und N = 40 (zu berechnen aus df Nenner ): Der aufgedeckte Effekt beträgt also etwa 23 %. Anhang A: Lösungen der Aufgaben 39 beiden Kombinationen sehr hoch ist. (Dieses Ergebnis wäre aber in diesem Beispiel nicht plausibel.) 5. Der Faktor A und die Wechselwirkung werden signifikant: Lärm hat

Mehr

Standardisierte Vorgehensweisen und Regeln zur Gewährleistung von: Eindeutigkeit Schlussfolgerungen aus empirischen Befunden sind nur dann zwingend

Standardisierte Vorgehensweisen und Regeln zur Gewährleistung von: Eindeutigkeit Schlussfolgerungen aus empirischen Befunden sind nur dann zwingend Standardisierte Vorgehensweisen und Regeln zur Gewährleistung von: Eindeutigkeit Schlussfolgerungen aus empirischen Befunden sind nur dann zwingend oder eindeutig, wenn keine alternativen Interpretationsmöglichkeiten

Mehr

Inhaltsverzeichnis. Vorwort

Inhaltsverzeichnis. Vorwort V Vorwort XI 1 Zum Gebrauch dieses Buches 1 1.1 Einführung 1 1.2 Der Text in den Kapiteln 1 1.3 Was Sie bei auftretenden Problemen tun sollten 2 1.4 Wichtig zu wissen 3 1.5 Zahlenbeispiele im Text 3 1.6

Mehr

Skript 7 Kreuztabellen und benutzerdefinierte Tabellen

Skript 7 Kreuztabellen und benutzerdefinierte Tabellen Skript 7 Kreuztabellen und benutzerdefinierte Tabellen Ziel: Analysieren und verdeutlichen von Zusammenhängen mehrerer Variablen, wie z.b. Anzahlen pro Kategorien; Mittelwert und Standardabweichung pro

Mehr

Hypothesentests mit SPSS. Beispiel für eine einfaktorielle Varianzanalyse Daten: museum_m_v05.sav

Hypothesentests mit SPSS. Beispiel für eine einfaktorielle Varianzanalyse Daten: museum_m_v05.sav Beispiel für eine einfaktorielle Varianzanalyse Daten: museum_m_v05.sav Hypothese: Die Beschäftigung mit Kunst ist vom Bildungsgrad abhängig. 1. Annahmen Messniveau: Modell: Die Skala zur Erfassung der

Mehr

Methoden der Werkstoffprüfung Kapitel I Grundlagen. WS 2009/2010 Kapitel 1.0

Methoden der Werkstoffprüfung Kapitel I Grundlagen. WS 2009/2010 Kapitel 1.0 Methoden der Werkstoffprüfung Kapitel I Grundlagen WS 2009/2010 Kapitel 1.0 Grundlagen Probenmittelwerte ohne MU Akzeptanzbereich Probe 1 und 2 liegen im Akzeptanzbereich Sie sind damit akzeptiert! Probe

Mehr

die wir als Realisationen von unabhängig und identisch verteilten Zufallsvariablen

die wir als Realisationen von unabhängig und identisch verteilten Zufallsvariablen Kapitel 8 Schätzung von Parametern 8.1 Schätzmethoden Gegeben seien Beobachtungen Ü Ü ¾ Ü Ò die wir als Realisationen von unabhängig und identisch verteilten Zufallsvariablen ¾ Ò auffassen. Die Verteilung

Mehr

Seminar im Wintersemester 2010/2011: Quantitative und implementierte Methoden der Marktrisikobewertung

Seminar im Wintersemester 2010/2011: Quantitative und implementierte Methoden der Marktrisikobewertung M.Sc. Brice Hakwa hakwa@uni-wuppertal.de Seminar im Wintersemester 2010/2011: Quantitative und implementierte Methoden der Marktrisikobewertung - Zusammenfassung zum Thema: Berechnung von Value-at-Risk

Mehr

Eine Einführung in R: Statistische Tests

Eine Einführung in R: Statistische Tests Eine Einführung in R: Statistische Tests Bernd Klaus, Verena Zuber Institut für Medizinische Informatik, Statistik und Epidemiologie (IMISE), Universität Leipzig http://www.uni-leipzig.de/ zuber/teaching/ws11/r-kurs/

Mehr

Statistik II: Signifikanztests /1

Statistik II: Signifikanztests /1 Medien Institut : Signifikanztests /1 Dr. Andreas Vlašić Medien Institut (0621) 52 67 44 vlasic@medien-institut.de Gliederung 1. Noch einmal: Grundlagen des Signifikanztests 2. Der chi 2 -Test 3. Der t-test

Mehr

Physikalische Übungen für Pharmazeuten

Physikalische Übungen für Pharmazeuten Helmholtz-Institut für Strahlen- und Kernphysik Seminar Physikalische Übungen für Pharmazeuten Ch. Wendel Max Becker Karsten Koop Dr. Christoph Wendel Übersicht Inhalt des Seminars Praktikum - Vorbereitung

Mehr