Ein zensiertes Regressionsmodell für Schlachtdaten von Bioschweinen F. BERNARDI, N. BRUNNER, G.M. GEISBERGER, M. KÜHLEITNER und C.

Größe: px
Ab Seite anzeigen:

Download "Ein zensiertes Regressionsmodell für Schlachtdaten von Bioschweinen F. BERNARDI, N. BRUNNER, G.M. GEISBERGER, M. KÜHLEITNER und C."

Transkript

1 Ein zensiertes Regressionsmodell für Schlachtdaten von Bioschweinen F. BERNARDI, N. BRUNNER, G.M. GEISBERGER, M. KÜHLEITNER und C. LEEB 1. Problemstellung. Aufzeichnung und Auswertung von Daten gehören mit zu einer erfolgreichen Schweinemast. Was aber tun, wenn Daten nur unvollständig vorhanden sind? Im Rahmen eines vom Landwirtschaftsministeriums geförderten Projekts 1 BEP Bioschwein stellte sich die Frage, wie hoch in der Endphase der Mast die mittlere Gewichtszunahme eines Schweins pro Tag ist. Dadurch ist es möglich, auf der Basis der zu erwarteten Preisentwicklung zu entscheiden, ob höhere Endgewichte der Schweine im Hinblick auf die längere Mastdauer rentabel sind. Werden tägliche bzw. wöchentliche Gewichtsaufzeichnungen gemacht, so berechnet man die mittleren Gewichtszunahmen problemlos mit Hilfe der linearen Regression, welche in Excel mittels Trendlinie zugänglich ist. Im vorliegenden Fall wurde das Gewicht eines Schweins aber nur einmal, nämlich zum Schlachtzeitpunkt gemessen. Konkret wurden 18 Ferkel mit einem Durchschnittsgewicht von 45 Kilogramm in einer Bucht eingestallt und unter gleichen Bedingungen gemästet. (Es handelt sich um etwas ältere Ferkel; üblich sind 10 Wochen alte Ferkel mit rund 30 bis 35 kg.) Zum Verkauf gelangten sukzessive die schwersten Tiere. Nur diese wurden zum Verkaufszeitpunkt gewogen. 2 Tabelle 1 erfasst das Lebendgewicht dieser Tiere. (Nicht erfasst wurde allerdings das Geschlecht.) Tabelle 1. Verkaufsdaten von Schweinen aus einer Mastbucht. Masttage Anzahl Schlachtschweine Lebendgewichte (kg) , 156, 157, , 150, 151, 153, 153, 154, 154, 156, 158, , 146, 147, 150 Die naheliegende Methode zur Bestimmung der mittleren Gewichtszunahme wäre die lineare Regression. Nur, warum sollte man die Gewichte von 18 verschiedenen Tieren, wo von jedem Tier nur ein Gewichtswert, nämlich der zum Verkaufszeitpunkt vorliegt, mittels Trendlinie verbinden? Tatsächlich liefert diese Vorgehensweise keine brauchbare Schätzung für die Gewichtszunahme. Die Regressionslinie fällt und aus ihrer Formel liest man ab: Die Tiere scheinen pro Tag 0,42 kg an Gewicht zu verlieren! Dies liegt jedoch nicht daran, dass die Tiere eine Fastenkur besuchen, sondern ist durch die Systematik der Datenerfassung bedingt: Nur die schwersten Tiere werden in Tabelle 1 berücksichtigt. Sie verschwinden nach dem Verkauf aus dem Datensatz, während die leichteren Tiere zunächst ignoriert werden. Es handelt sich demnach um einen zensierten Datensatz. Die Behandlung solcher Daten erfordert eine eigene Methode. 1 BEP Bioschwein, Einführung und Monitoring von Betriebs-Entwicklungs-Plänen (BEP) Tiergesundheit und Wohlbefinden in österreichischen Bioschweinebetrieben, Forschungsprojekt Nr , BMLFUW LE.1.3.2/0134-II/1/ Bei der Planung der Verkaufszeitpunkte, die aus organisatorischen Gründen mehrere Wochen vorher fixiert werden, kann es sinnvoll sein, auch individuelle Gewichtszunahmen abzuschätzen. So müssen schwere Tiere rechtzeitig verkauft werden, weil ab 130 kg Nutzgewicht (nach Ausschlachtung) ein Preisabschlag erfolgt.

2 2. Methode. Um eine Regressionslinie für zensierte Daten zu berechnen, wenden wir die Maximum Likelihood (ML) Methode an und nehmen für das mittlere Gewicht der Schweine zum Zeitpunkt t (in Tagen, 164 t 186) einen linearen Zuwachs an: (1) (t) = a + b t. Die Funktion (1) ist die ML-Schätzung der Gewichte. Die Abweichung der tatsächlichen Gewichte von diesem Schätzwert ist zufällig. Wir nehmen dafür eine Normalverteilung mit der zeit-unabhängigen Varianz an. Die Wachstumsparameter a, b und die Varianz kennen wir nicht. Wir berechnen sie durch Maximierung der Likelihood. Wenn ein Schwein zum Zeitpunkt t das Gewicht x hat, so beträgt die Likelihood für diese Beobachtung N(x, (t), ). Hier ist N die Wahrscheinlichkeitsdichte der Normalverteilung. Die Likelihood einer Beobachtungsreihe ist das Produkt der einzelnen Likelihoods. Sie ist eine Funktion der unbekannten Parameter a, b, und. Man sucht jene Parameterwerte, bei denen die Likelihood der beobachteten Datenreihe maximal ist. 3 Das ist die ML-Schätzung. Bei den zensierten Daten der Tabelle 1 ist für jedes Schwein nur das Gewicht zu einem ausgesuchten Zeitpunkt bekannt. Über die Gewichte zu den beiden anderen Zeitpunkten und deren Likelihood können wir nur Vermutungen anstellen. Ohne zusätzliche Annahmen würde die ML Methode die klassische Regressionslinie liefern. Wir modifizieren daher den ursprünglichen ML-Ansatz, indem wir die Likelihood der Beobachtungsreihe zum Zeitpunkt t noch mit geeigneten Wahrscheinlichkeiten über die vermuteten Gewichte der nicht beobachteten Schweine multiplizieren. Unsere Annahme beruht darauf, dass die Schweine auch in der Endphase der Mast Gewicht zunehmen. Wir unterscheiden für jedes der 18 Schweine drei Typen A, B, C von Daten: Das gemessene Gewicht zum Verkaufszeitpunkt (A), das vermutete Gewicht vor dem Verkaufszeitpunkt (B) und das hypothetische Gewicht danach (C), wenn das Schwein weiter gemästet worden wäre. Zu A, von einem Schwein, das zum Zeitpunkt t verkauft wird und dessen Gewicht dann x beträgt, berechnen wir die Likelihood in Excel als: (2) =NORMVERT(x; (t); ; 0). Zu B, wenn das Schwein zu einem späteren Zeitpunkt s > t verkauft und gewogen wird, dann wissen wir zum Zeitpunkt t: Das Schwein war erstens sicher nicht schwerer, als das leichteste zum Zeitpunkt t verkaufte Schwein, dessen Gewicht sei min(t), und es war zweitens sicher nicht schwerer, als zum Zeitpunkt s, wo sein Gewicht x ist. Wir multiplizieren die obige Likelihood mit der Wahrscheinlichkeit dieser Aussage und berechnen diese in Excel als: (3) =NORMVERT(MIN(min(t); x); (t); ; 1). Zu C, wenn das Schwein bereits zu einem früheren Zeitpunkt f < t mit dem Schlachtgewicht x verkauft wurde, dann wäre es zum Zeitpunkt t bei weiterer Mästung sicher schwerer geworden. Wir multiplizieren die obige Likelihood auch mit der Wahrscheinlichkeit dafür: (4) =1 NORMVERT(x; (t); ; 1). 3 Je größer die Likelihood, desto wahrscheinlicher ist die Beobachtung.

3 3. Aufbereitung in Excel. Zur Auswertung dieses Modells erstellen wir ein Tabellenblatt mit der Beschriftung von Tabelle 2. In A1:C2 schreiben wir Text für die gesuchten Parameter. In den Bereich A6:B23 tragen wir die Daten von Tabelle 1 ein. Wir sortieren dabei die Tabelle, zuerst nach dem Verkaufszeitpunkt und bei gleichen Verkaufszeitpunkten nach dem Gewicht. In der Spalte C berechnen wir (t) nach (1). In C6 steht die Formel =$A$3+$B$3*A6. Wir kopieren diese nach unten bis in C23. In A3:C3 stehen plausible Startwerte für das Wachstumsmodell (1): a = 45 kg ist das Durchschnittsgewicht der Ferkel dieses speziellen Datensatzes bei der Einstallung, b = 0,5 kg pro Schwein und Tag liegt an der unteren Grenze der üblichen Gewichtszunahme, = 5 kg ist die gerundete Standardabweichung der Messdaten (Tabelle 1). Tabelle 2. Beschriftung des Tabellenblatts. A B C D 1 Parameter 2 A B 3 45,0 0,5 5,00 t: 4 (t): 5 Tag LG in kg ML-Schätzer min(t): In E3:G3 tragen wir die drei Verkaufszeitpunkte 164, 172, 186 ein. In E4:G4 berechnen wir dazu (t) nach (1), und in E5:G5 stehen min(t), d.h. die kleinsten Gewichte zu den jeweiligen Verkaufsterminen. In E5 steht die Zahl 150 (kleinstes Gewicht zum Verkaufstermin 164), in der Zelle F5 die Zahl 148 (kleinstes Gewicht zum Verkauftermin 172) und in der Zelle G5 die Zahl 143 (kleinstes Gewicht zum Verkaufstermin 186). Im Bereich E6:G24 berechnen wir zu den Verkaufszeitpunkten die Likelihoods und Wahrscheinlichkeiten entsprechend unserem Modell. Es empfiehlt sich zur besseren Übersichtlichkeit, die Bereiche E6:E9, F10:F19 und G20:G23 (zu diesen Terminen sind diese Gewichte bekannt) einzufärben. Wir berechnen zuerst die Likelihoods zu den Beobachtungsdaten (A); in E6 schreiben wir die Formel =NORMVERT($B6;E$4;$C$3;0). Anschließend kopieren wir dies in die Bereiche E6:E9, F10:F19 und G20:G23. (Die $ sind so gesetzt, dass die Bezüge beim Kopieren korrekt bleiben.) Als nächstes berechnen wir die Wahrscheinlichkeiten zu den vermuteten Schweinegewichten (B); in E10 schreiben wir =NORMVERT(MIN(E$5;$B10);E$4;$C$3;1) und kopieren dies in den Bereich E10:E23 und F20:F23. Abschließend berechnen wir die Wahrscheinlichkeiten der hypothetischen Schweinegewichte (C). In F6 schreiben wir =1 NORMVERT($B6;F$4;$C$3;1). Wir kopieren die Formel in die Bereiche F6:F9 und G6:G19. Zur Berechnung der maximalen Likelihood maximieren wir statt des Produkts die Summe der Logarithmen der Likelihoods. Dazu schreiben wir in H6 die Formel =LN(E6) und kopieren dies in den gesamten Bereich H6:J23. In H4 bilden wir die Summe =SUMME(H6:J23); oberhalb beschriften wir die Zelle als Log-Likelihood. Zur Maximierung verwenden wir den Solver: die Zielzelle H4 soll maximal werden; die veränderbaren Zellen sind A3:C3. Nach dem Druck auf den Lösen-Button erhalten wir den

4 Maximalwert 85,271 für die Log-Likelihood bei den Parameterwerten a = 9,218, b = 0,822 und = 9, Ergebnis. Das Modell liefert eine geschätzte mittlere Gewichtszunahme von b = 0,822 kg pro Tag und Schwein in der Endphase der Mast. Dieses Resultat ist mit den Erfahrungswerten des Betriebs kompatibel. Diese Zunahme in der Endphase liegt im Mittel über den Zunahmen während der Mast (0,5 bis 0,7 kg/d). Dies kann für den Datensatz begründet werden, weil in der Endphase die Futtermenge erhöht wurde, da der Lieferant für Ballaststoffbeigaben ausgefallen ist. 5. Alternative Modelle. Das Problem bei der Verwendung zensierter Daten ist es, dass wir über die nicht beobachteten Daten Vermutungen anstellen müssen. Unterschiedliche Vermutungen liefern alternative Modelle, und je weniger Messdaten im Vergleich zu vermuteten Daten verfügbar sind, umso mehr hängt die Schätzung von den Modellannahmen ab. Wir illustrieren dies, indem wir unser Modell mit den Ergebnissen für alternative Modelle vergleichen. 4 Variante 1: Alternatives ML-Modell. Als naheliegende Variante betrachten wir die auf (1) gestützte Hypothese, dass die Schweine während eines Zeitraums t um b t kg zunehmen. Diese Annahme führt zu folgenden Wahrscheinlichkeiten für die vermuteten bzw. hypothetischen Gewichte: (3a) =NORMVERT(MIN(min(t); x b (s t)); (t); ; 1) und (4a) =1 NORMVERT(x + b (t f); (t); ; 1). Wenn wir diese Formeln in das Tabellenblatt einsetzen, erhalten wir aus der ML-Schätzung die Aussage: Das Gewicht nimmt während der Mastendphase im Mittel um 0,25 kg pro Tag und Schwein ab. Die Log-Likelihood beträgt 94,011. Da das erste Modell bei gleichen Daten, gleicher Parameterzahl und einfacherer Struktur eine höhere Log-Likelihood hat, verwerfen wir diese Modellvariante. 5 Die dominanten Tiere in der Bucht wachsen demnach rascher als die anderen Tiere, die ihrerseits nach der Schlachtung der dominanten Tiere rascher zunehmen. Variante 2: Klassische Regression. Wenn wir die Regressionslinie nur durch die gemessenen Verkaufsgewichte legen, erhalten wir einen noch stärkeren täglichen Rückgang von 0,421 kg. Das zugrunde liegende ML-Modell postuliert, dass die Gewichte B und C keinerlei Einschränkungen unterliegen (die Wahrscheinlichkeiten in Formeln 4 und 5 werden gleich 1 gesetzt). Diese Annahme wäre bei der zufälligen Auswahl der verkauften Schweine, unabhängig von ihrem Gewicht, gerechtfertigt. Hier widerspricht das Ergebnis jedoch klar den Erfahrungstatsachen. Aus einem positiven Anstieg der klassischen Regressionslinie lässt sich auch umgekehrt keine qualitative Aussage gewinnen, ob die mittlere Gewichtszunahme größer ist, als bei einem Datensatz mit fallender Regressionslinie. 6 4 Eine Übersicht über verschiedene Modellannahmen und Berechnungsmethoden findet man z.b. bei Dempster et al., J. Royal Statistical Soc. B39/1977, S. 1 ff. 5 Mehr zu dieser Überlegung bei Burnham/Anderson: Model Selection and Multimodel Inference, Berlin Unter den Betriebsdaten gibt es einen Datensatz mit sehr geringer errechneter Gewichtszunahme, wo die Regressionslinie aber ansteigt, weil die Hälfte der Schweine (wegen des langsamen Wachstums) erst am Schluss verkauft wurde.

5 Variante 3: Mastendphase mit Diät. Da die Schweine in der Endphase der Mast bei zuviel Futter leicht verfetten, gibt es auch Fütterungsstrategien, welche die Tiere in der Endphase auf Diät setzen. In diesem Fall ist nicht auszuschließen, dass das Gewicht einzelner Tiere abnimmt. (Im Hinblick auf das Erfordernis der artgerechten Haltung, wo Jungschweine wachsen sollen sie wiegen als erwachsenes Tier ca. 180 bis 250 kg, dient diese Annahme nur der Illustration der theoretischen Flexibilität des Modells.) Auch dies ist mit unserem Tabellenblatt modellierbar: Formel (3b) unten besagt nur: Zum Schlachten werden die fettesten Tiere ausgesucht. Formel (4) wird nicht angewandt (Multiplikation mit 1), weil keine Information über das Wachstum vorhanden ist. (3b) =NORMVERT(min(t); (t); ; 1). 6. Diskussion. Je mehr Messdaten verfügbar sind, umso geringer wird die Abhängigkeit der Schätzung vom Modell. Weil wir nur die Verkaufsdaten A erfasst haben, beruhen unsere Modellrechnungen nur zu 1/3 auf Messdaten. Unsere Ergebnisse dienen daher nur der Illustration der Methode. Ein Betrieb kennt (bzw. kann dies ermitteln) zusätzlich zu den Verkaufsdaten auch die Gewichte der noch nicht verkauften Schweine (Daten B), eventuell auch noch zu weiteren Zeitpunkten, hat also eine mehr als doppelt so große Datenbasis. Unvermeidbar ist nur die Zensierung bei den Daten C über die verkauften Schweine. Diese Zensierung hat aber nicht mehr so starke Auswirkungen auf die Schätzgenauigkeit, denn mit ML-Schätzern wird bereits ab 50% gemessenen Daten eine Genauigkeit erzielt, die der klassischen Regression gleichkommt. 7 Die Methode der zensierten Regression ist daher für Betriebe von Interesse, die ihre bisherigen Endmast-Analysen mittels klassischer Regression unter Berücksichtigung aller verfügbaren Daten verfeinern wollen. Unvermeidbar wird eine zensierte Regression bei allen Fragestellungen, wo nur Daten über die geschlachteten Tiere zur Verfügung stehen. Wenn zum Beispiel befürchtet wird, dass die Gewichtszunahme bei der Fütterungsstrategie vor allem auf Fettzunahme beruht, wird man analog zu oben Modelle über die Fettmasse entwickeln (mit der Hypothese: Die verkauften Schweine sind jene mit der höchsten Fettmasse ). Anschrift der Autoren: Georg-Michael Geisberger, Weilhart 3, 5134 Schwand/Innkreis g.m.geis@aon.at Florian Bernardi und Christine Leeb, Nutztierwissenschaften/NAS Norbert Brunner und Manfred Kühleitner, Mathematik/DIBB BOKU, Gregor Mendel Stasse 33, 1180 Wien Vorname.Nachname@boku.ac.at 7 Dies wurde in Simulationsexperimenten bestätigt von Kuttatharmmakul et al., Analytica Chimica Acta 441/2001, S. 215 ff.

Wissenschaftliche Nachrichten: https://www.bmbf.gv.at/schulen/sb/wina/wina.html Vol. 131/2006, 19-21

Wissenschaftliche Nachrichten: https://www.bmbf.gv.at/schulen/sb/wina/wina.html Vol. 131/2006, 19-21 Der T-Test in Excel NORBERT BRUNNER und MANFRED KÜHLEITNER Ein häufiges Problem ist der Vergleich eines beobachteten Stichprobenmittelwerts mit einem Sollwert. Dabei wird der T-Test angewandt. Wir zeigen

Mehr

Cox-Regression. Ausgangspunkt Ansätze zur Modellierung von Einflussgrößen Das Cox-Modell Eigenschaften des Cox-Modells

Cox-Regression. Ausgangspunkt Ansätze zur Modellierung von Einflussgrößen Das Cox-Modell Eigenschaften des Cox-Modells Cox-Regression Ausgangspunkt Ansätze zur Modellierung von Einflussgrößen Das Cox-Modell Eigenschaften des Cox-Modells In vielen Fällen interessiert, wie die Survivalfunktion durch Einflussgrößen beeinflusst

Mehr

Biometrieübung 10 Lineare Regression. 2. Abhängigkeit der Körpergröße von der Schuhgröße bei Männern

Biometrieübung 10 Lineare Regression. 2. Abhängigkeit der Körpergröße von der Schuhgröße bei Männern Biometrieübung 10 (lineare Regression) - Aufgabe Biometrieübung 10 Lineare Regression Aufgabe 1. Düngungsversuch In einem Düngeversuch mit k=9 Düngungsstufen x i erhielt man Erträge y i. Im (X, Y)- Koordinatensystem

Mehr

Konfidenzintervalle Grundlegendes Prinzip Erwartungswert Bekannte Varianz Unbekannte Varianz Anteilswert Differenzen von Erwartungswert Anteilswert

Konfidenzintervalle Grundlegendes Prinzip Erwartungswert Bekannte Varianz Unbekannte Varianz Anteilswert Differenzen von Erwartungswert Anteilswert Konfidenzintervalle Grundlegendes Prinzip Erwartungswert Bekannte Varianz Unbekannte Varianz Anteilswert Differenzen von Erwartungswert Anteilswert Beispiel für Konfidenzintervall Im Prinzip haben wir

Mehr

Kurvenanpassung mit dem SOLVER

Kurvenanpassung mit dem SOLVER 1 Iterative Verfahren (SOLVER) Bei einem iterativen Verfahren wird eine Lösung durch schrittweise Annäherung gefunden. Der Vorteil liegt in der Verwendung einfacher Rechenoperationen und darin, dass der

Mehr

Zeitreihenanalyse. Zerlegung von Zeitreihen Saisonindex, saisonbereinigte Zeitreihe Trend und zyklische Komponente Prognose Autokorrelation

Zeitreihenanalyse. Zerlegung von Zeitreihen Saisonindex, saisonbereinigte Zeitreihe Trend und zyklische Komponente Prognose Autokorrelation Zeitreihenanalyse Zerlegung von Zeitreihen Saisonindex, saisonbereinigte Zeitreihe Trend und zyklische Komponente Prognose Autokorrelation Beispiel für Zeitreihe Andere Anwendungen Inventarmanagment Produktionsplanung

Mehr

Statistische Tests (Signifikanztests)

Statistische Tests (Signifikanztests) Statistische Tests (Signifikanztests) [testing statistical hypothesis] Prüfen und Bewerten von Hypothesen (Annahmen, Vermutungen) über die Verteilungen von Merkmalen in einer Grundgesamtheit (Population)

Mehr

Statistisches Testen

Statistisches Testen Statistisches Testen Grundlegendes Prinzip Erwartungswert Bekannte Varianz Unbekannte Varianz Differenzen Anteilswert Chi-Quadrat Tests Gleichheit von Varianzen Prinzip des Statistischen Tests Konfidenzintervall

Mehr

3) Testvariable: T = X µ 0

3) Testvariable: T = X µ 0 Beispiel 4.9: In einem Molkereibetrieb werden Joghurtbecher abgefüllt. Der Sollwert für die Füllmenge dieser Joghurtbecher beträgt 50 g. Aus der laufenden Produktion wurde eine Stichprobe von 5 Joghurtbechern

Mehr

Anpassungstests VORGEHENSWEISE

Anpassungstests VORGEHENSWEISE Anpassungstests Anpassungstests prüfen, wie sehr sich ein bestimmter Datensatz einer erwarteten Verteilung anpasst bzw. von dieser abweicht. Nach der Erläuterung der Funktionsweise sind je ein Beispiel

Mehr

Auswahl von Schätzfunktionen

Auswahl von Schätzfunktionen Auswahl von Schätzfunktionen Worum geht es in diesem Modul? Überblick zur Punktschätzung Vorüberlegung zur Effizienz Vergleich unserer Schätzer für My unter Normalverteilung Relative Effizienz Einführung

Mehr

p = h n (K)= Juli vl smart vp qk notebook Praktische Lösung des Problems: mit den Werten

p = h n (K)= Juli vl smart vp qk notebook Praktische Lösung des Problems: mit den Werten I. Eigenschaften von Schätzfunktionen Wir wollen den unbekannten Anteil p von Autos ermitteln, die mit Katalysator fahren. Mathematisch können wir das Problem wie folgt beschreiben: Sei X der Autotyp eines

Mehr

Stichproben Parameterschätzung Konfidenzintervalle:

Stichproben Parameterschätzung Konfidenzintervalle: Stichproben Parameterschätzung Konfidenzintervalle: Beispiel Wahlprognose: Die Grundgesamtheit hat einen Prozentsatz p der Partei A wählt. Wenn dieser Prozentsatz bekannt ist, dann kann man z.b. ausrechnen,

Mehr

Dynamische Systeme und Zeitreihenanalyse // Multivariate Normalverteilung und ML Schätzung 11 p.2/38

Dynamische Systeme und Zeitreihenanalyse // Multivariate Normalverteilung und ML Schätzung 11 p.2/38 Dynamische Systeme und Zeitreihenanalyse Multivariate Normalverteilung und ML Schätzung Kapitel 11 Statistik und Mathematik WU Wien Michael Hauser Dynamische Systeme und Zeitreihenanalyse // Multivariate

Mehr

b) Bestimmen Sie die Varianz der beiden Schätzer. c) Ist ein oder sind beide Schätzer konsistent? Begründen Sie!

b) Bestimmen Sie die Varianz der beiden Schätzer. c) Ist ein oder sind beide Schätzer konsistent? Begründen Sie! Aufgabe 1 (3 + 3 + 2 Punkte) Ein Landwirt möchte das durchschnittliche Gewicht von einjährigen Ferkeln bestimmen lassen. Dies möchte er aus seinem diesjährigen Bestand an n Tieren schätzen. Er kann dies

Mehr

Das (multiple) Bestimmtheitsmaß R 2. Beispiel: Ausgaben in Abhängigkeit vom Einkommen (I) Parameterschätzer im einfachen linearen Regressionsmodell

Das (multiple) Bestimmtheitsmaß R 2. Beispiel: Ausgaben in Abhängigkeit vom Einkommen (I) Parameterschätzer im einfachen linearen Regressionsmodell 1 Lineare Regression Parameterschätzung 13 Im einfachen linearen Regressionsmodell sind also neben σ ) insbesondere β 1 und β Parameter, deren Schätzung für die Quantifizierung des linearen Zusammenhangs

Mehr

Prüfung aus Wahrscheinlichkeitstheorie und Statistik MASCHINENBAU 2002

Prüfung aus Wahrscheinlichkeitstheorie und Statistik MASCHINENBAU 2002 Prüfung aus Wahrscheinlichkeitstheorie und Statistik MASCHINENBAU 2002 1. Ein Chemiestudent hat ein Set von 10 Gefäßen vor sich stehen, von denen vier mit Salpetersäure Stoff A), vier mit Glyzerin Stoff

Mehr

Computergestützte Datenanalyse in der Kern- und Teilchenphysik

Computergestützte Datenanalyse in der Kern- und Teilchenphysik Computergestützte Datenanalysein der Kern- und Teilchenphysik p. 1/?? Computergestützte Datenanalyse in der Kern- und Teilchenphysik Vorlesung 4 Jan Friedrich Computergestützte Datenanalysein der Kern-

Mehr

Aufgabe 1 (8= Punkte) 13 Studenten haben die folgenden Noten (ganze Zahl) in der Statistikklausur erhalten:

Aufgabe 1 (8= Punkte) 13 Studenten haben die folgenden Noten (ganze Zahl) in der Statistikklausur erhalten: Aufgabe 1 (8=2+2+2+2 Punkte) 13 Studenten haben die folgenden Noten (ganze Zahl) in der Statistikklausur erhalten: Die Zufallsvariable X bezeichne die Note. 1443533523253. a) Wie groß ist h(x 5)? Kreuzen

Mehr

Zur Berechnung der Wertziffern bei Teamturnieren

Zur Berechnung der Wertziffern bei Teamturnieren Zur Berechnung der Wertziffern bei Teamturnieren Wolfhart Umlauft und Michael Stieglitz 30. März 2009 1 Das Problem Die in der Rangliste für Teamturniere angegebenen Zahlen sind sog. Wertziffern. Sie spiegeln

Mehr

Statistik, Datenanalyse und Simulation

Statistik, Datenanalyse und Simulation Dr. Michael O. Distler distler@kph.uni-mainz.de Mainz, 24. Mai 2011 3. Schätzung von Parametern Problemstellung: Aus fehlerbehafteten Messungen möglichst genaue Ergebnisse erarbeiten zusammen mit Aussagen

Mehr

Etwas Spezielles: Zielwertsuche und Solver. Zielwertsuche

Etwas Spezielles: Zielwertsuche und Solver. Zielwertsuche Etwas Spezielles: Zielwertsuche und Solver Zielwertsuche EXCEL kann auch Beziehungen indirekt auflösen. Die einfache Variante ist die Zielwertsuche. Für eine bestimmte Zelle ("Zielzelle") wird ein anderer

Mehr

Übungsaufgabe Parameter und Verteilungsschätzung

Übungsaufgabe Parameter und Verteilungsschätzung Übungsaufgabe Parameter und Verteilungsschätzung Prof. Dr. rer. nat. Lüders Datum: 21.01.2019 Autor: Marius Schulte Matr.-Nr.: 10049060 FH Südwestfalen Aufgabenstellung Analysiert werden sollen die Verteilungen

Mehr

Kapitel 3 Schließende lineare Regression Einführung. induktiv. Fragestellungen. Modell. Matrixschreibweise. Annahmen.

Kapitel 3 Schließende lineare Regression Einführung. induktiv. Fragestellungen. Modell. Matrixschreibweise. Annahmen. Kapitel 3 Schließende lineare Regression 3.1. Einführung induktiv Fragestellungen Modell Statistisch bewerten, der vorher beschriebenen Zusammenhänge auf der Basis vorliegender Daten, ob die ermittelte

Mehr

10.5 Maximum-Likelihood Klassifikation (I)

10.5 Maximum-Likelihood Klassifikation (I) Klassifikation (I) Idee Für die Klassifikation sind wir interessiert an den bedingten Wahrscheinlichkeiten p(c i (x,y) D(x,y)). y Wenn man diese bedingten Wahrscheinlichkeiten kennt, dann ordnet man einem

Mehr

7. Übung: Aufgabe 1. b), c), e) Aufgabe 2. a), c), e) Aufgabe 3. c), e) Aufgabe 4. Aufgabe 5. Aufgabe 6. Aufgabe 7. Aufgabe 8. Aufgabe 9.

7. Übung: Aufgabe 1. b), c), e) Aufgabe 2. a), c), e) Aufgabe 3. c), e) Aufgabe 4. Aufgabe 5. Aufgabe 6. Aufgabe 7. Aufgabe 8. Aufgabe 9. 7. Übung: Aufgabe 1 b), c), e) Aufgabe a), c), e) Aufgabe 3 c), e) Aufgabe 4 b) Aufgabe 5 a) Aufgabe 6 b) Aufgabe 7 e) Aufgabe 8 c) Aufgabe 9 a), c), e) Aufgabe 10 b), d) Aufgabe 11 a) Aufgabe 1 b) Aufgabe

Mehr

Statistik, Geostatistik

Statistik, Geostatistik Geostatistik Statistik, Geostatistik Statistik Zusammenfassung von Methoden (Methodik), die sich mit der wahrscheinlichkeitsbezogenen Auswertung empirischer (d.h. beobachteter, gemessener) Daten befassen.

Mehr

i =1 i =2 i =3 x i y i 4 0 1

i =1 i =2 i =3 x i y i 4 0 1 Aufgabe (5+5=0 Punkte) (a) Bei einem Minigolfturnier traten 6 Spieler gegeneinander an. Die Anzahlen der von ihnen über das gesamte Turnier hinweg benötigten Schläge betrugen x = 24, x 2 = 27, x = 2, x

Mehr

Musterlösung. Modulklausur Multivariate Verfahren

Musterlösung. Modulklausur Multivariate Verfahren Musterlösung Modulklausur 31821 Multivariate Verfahren 25. September 2015 Aufgabe 1 (15 Punkte) Kennzeichnen Sie die folgenden Aussagen zur Regressionsanalyse mit R für richtig oder F für falsch. F Wenn

Mehr

So berechnen Sie einen Schätzer für einen Punkt

So berechnen Sie einen Schätzer für einen Punkt htw saar 1 EINFÜHRUNG IN DIE STATISTIK: SCHÄTZEN UND TESTEN htw saar 2 Schätzen: Einführung Ziel der Statistik ist es, aus den Beobachtungen eines Merkmales in einer Stichprobe Rückschlüsse über die Verteilung

Mehr

Mathematik für Biologen

Mathematik für Biologen Mathematik für Biologen Prof. Dr. Rüdiger W. Braun Heinrich-Heine-Universität Düsseldorf 12. Januar 2011 1 Vergleich zweier Erwartungswerte Was heißt verbunden bzw. unverbunden? t-test für verbundene Stichproben

Mehr

Statistik und Wahrscheinlichkeitsrechnung

Statistik und Wahrscheinlichkeitsrechnung Statistik und Wahrscheinlichkeitsrechnung 11. Vorlesung Jochen Köhler 10.05.011 1 Inhalt der heutigen Vorlesung Zusammenfassung Parameterschätzung Übersicht über Schätzung und Modellbildung Modellevaluation

Mehr

Numerische Methoden und Algorithmen in der Physik

Numerische Methoden und Algorithmen in der Physik Numerische Methoden und Algorithmen in der Physik Hartmut Stadie, Christian Autermann 15.01.2009 Numerische Methoden und Algorithmen in der Physik Christian Autermann 1/ 47 Methode der kleinsten Quadrate

Mehr

Varianzkomponentenschätzung

Varianzkomponentenschätzung Qualitas AG Varianzkomponentenschätzung Peter von Rohr Qualitas AG Peter von Rohr Folien ZL I+II LFW C11 October 29, 2015 2 / 23 Multiple Lineare Regression Annahmen Modell y = Xb + e Varianz der Fehler

Mehr

Prüfungsteil 2, Aufgabe 6. Stochastik. Nordrhein-Westfalen 2014LK. Aufgabe 6. Abitur Mathematik: Musterlösung

Prüfungsteil 2, Aufgabe 6. Stochastik. Nordrhein-Westfalen 2014LK. Aufgabe 6. Abitur Mathematik: Musterlösung Abitur Mathematik: Prüfungsteil 2, Aufgabe 6 Nordrhein-Westfalen 2014LK Aufgabe 6 a) (1) 1. SCHRITT: MODELLIERUNG MIT EINER BERNOULLIKETTE Wir modellieren die Situation mit einer Bernoullikette der Länge

Mehr

D-CHAB Frühlingssemester 2017 T =

D-CHAB Frühlingssemester 2017 T = D-CHAB Frühlingssemester 17 Grundlagen der Mathematik II Dr Marcel Dettling Lösung 13 1) Die relevanten Parameter sind n = 3, x = 1867, σ x = und µ = 18 (a) Die Teststatistik T = X µ Σ x / n ist nach Annahme

Mehr

Dr. Maike M. Burda. Welchen Einfluss hat die Körperhöhe auf das Körpergewicht? Eine Regressionsanalyse. HU Berlin, Econ Bootcamp 7.-9.

Dr. Maike M. Burda. Welchen Einfluss hat die Körperhöhe auf das Körpergewicht? Eine Regressionsanalyse. HU Berlin, Econ Bootcamp 7.-9. Dr. Maike M. Burda Welchen Einfluss hat die Körperhöhe auf das Körpergewicht? Eine Regressionsanalyse. HU Berlin, Econ Bootcamp 7.-9. Januar 2011 BOOTDATA11.GDT: 250 Beobachtungen für die Variablen...

Mehr

Auswertung und Lösung

Auswertung und Lösung Körperkraft [Nm] 0 50 100 150 200 250 0 20 40 60 80 Lean Body Mass [kg] Dieses Quiz soll Ihnen helfen, den R Output einer einfachen linearen Regression besser zu verstehen (s. Kapitel 5.4.1) Es wurden

Mehr

Auswertung und Lösung

Auswertung und Lösung Dieses Quiz soll Ihnen helfen, Kapitel 4.6 und 4.7 besser zu verstehen. Auswertung und Lösung Abgaben: 59 / 265 Maximal erreichte Punktzahl: 8 Minimal erreichte Punktzahl: 0 Durchschnitt: 4.78 1 Frage

Mehr

Zeitreihenanalyse. Zerlegung von Zeitreihen Saisonindex, saisonbereinigte Zeitreihe Trend und zyklische Komponente Prognose Autokorrelation

Zeitreihenanalyse. Zerlegung von Zeitreihen Saisonindex, saisonbereinigte Zeitreihe Trend und zyklische Komponente Prognose Autokorrelation Zeitreihenanalyse Zerlegung von Zeitreihen Saisonindex, saisonbereinigte Zeitreihe Trend und zyklische Komponente Prognose Autokorrelation Beispiel für Zeitreihe Zerlegung der Zeitreihe F t Trendkomponente

Mehr

Seminar zur Energiewirtschaft:

Seminar zur Energiewirtschaft: Seminar zur Energiewirtschaft: Ermittlung der Zahlungsbereitschaft für erneuerbare Energien bzw. bessere Umwelt Vladimir Udalov 1 Modelle mit diskreten abhängigen Variablen 2 - Ausgangssituation Eine Dummy-Variable

Mehr

Wie liest man Konfidenzintervalle? Teil II. Premiu m

Wie liest man Konfidenzintervalle? Teil II. Premiu m Wie liest man Konfidenzintervalle? Teil II Premiu m - Hintergrund Anderer Wahrscheinlichkeitsbegriff subjektiver Wahrscheinlichkeitsbegriff Beispiel: Was ist die Wahrscheinlichkeit dafür, dass ein Patient

Mehr

Wichtige Definitionen und Aussagen

Wichtige Definitionen und Aussagen Wichtige Definitionen und Aussagen Zufallsexperiment, Ergebnis, Ereignis: Unter einem Zufallsexperiment verstehen wir einen Vorgang, dessen Ausgänge sich nicht vorhersagen lassen Die möglichen Ausgänge

Mehr

Einführung Fehlerrechnung

Einführung Fehlerrechnung Einführung Fehlerrechnung Bei jeder Messung, ob Einzelmessung oder Messreihe, muss eine Aussage über die Güte ( Wie groß ist der Fehler? ) des Messergebnisses gemacht werden. Mögliche Fehlerarten 1. Systematische

Mehr

Datenanalyse Klausur SS 2014 (nicht wortwörtlich) Lösung (aus einer Nachbesprechung mit Elsenbeer)

Datenanalyse Klausur SS 2014 (nicht wortwörtlich) Lösung (aus einer Nachbesprechung mit Elsenbeer) 1. Ist das folgende Argument gültig? Datenanalyse Klausur SS 2014 (nicht wortwörtlich) Lösung (aus einer Nachbesprechung mit Elsenbeer) Wenn minderjährige Mörder für ihr Vergehen genauso verantwortlich

Mehr

Biostatistik, WS 2017/18 Der Standardfehler

Biostatistik, WS 2017/18 Der Standardfehler 1/70 Biostatistik, WS 2017/18 Matthias Birkner http://www.staff.uni-mainz.de/birkner/biostatistik1718/ 24.11.2017 3/70 Ein Versuch Hirse Bild: Panicum miliaceum 4/70 Ein Versuch Ein Versuch Versuchsaufbau:

Mehr

6. Tutoriumsserie Statistik II

6. Tutoriumsserie Statistik II 6. Tutoriumsserie Statistik II 1. Aufgabe: Eine Unternehmensabteilung ist ausschließlich mit der Herstellung eines einzigen Produktes beschäftigt. Für 10 Perioden wurden folgende Produktmenge y und Gesamtkosten

Mehr

Konkretes Durchführen einer Inferenzstatistik

Konkretes Durchführen einer Inferenzstatistik Konkretes Durchführen einer Inferenzstatistik Die Frage ist, welche inferenzstatistischen Schlüsse bei einer kontinuierlichen Variablen - Beispiel: Reaktionszeit gemessen in ms - von der Stichprobe auf

Mehr

Anleitung: Standardabweichung

Anleitung: Standardabweichung Anleitung: Standardabweichung So kann man mit dem V200 Erwartungswert und Varianz bzw. Standardabweichung bei Binomialverteilungen für bestimmte Werte von n, aber für allgemeines p nach der allgemeinen

Mehr

Kapitel 7. Regression und Korrelation. 7.1 Das Regressionsproblem

Kapitel 7. Regression und Korrelation. 7.1 Das Regressionsproblem Kapitel 7 Regression und Korrelation Ein Regressionsproblem behandelt die Verteilung einer Variablen, wenn mindestens eine andere gewisse Werte in nicht zufälliger Art annimmt. Ein Korrelationsproblem

Mehr

Gewöhnliche Autokorrelationsfunktion (ACF) eines stationären Prozesses {X t } t Z zum Lag h

Gewöhnliche Autokorrelationsfunktion (ACF) eines stationären Prozesses {X t } t Z zum Lag h 5. Die partielle Autokorrelationsfunktion 5.1 Definition, Berechnung, Schätzung Bisher: Gewöhnliche Autokorrelationsfunktion (ACF) eines stationären Prozesses {X t } t Z zum Lag h ρ X (h) = Corr(X t, X

Mehr

3.2 Maximum-Likelihood-Schätzung

3.2 Maximum-Likelihood-Schätzung 291 Die Maximum-Likelihood-Schätzung ist die populärste Methode zur Konstruktion von Punktschätzern bei rein parametrischen Problemstellungen. 292 3.2.1 Schätzkonzept Maximum-Likelihood-Prinzip: Finde

Mehr

Statistik und Datenanalyse (Handout zum Seminarvortrag von Norman Bhatti, gehalten am )

Statistik und Datenanalyse (Handout zum Seminarvortrag von Norman Bhatti, gehalten am ) Statistik und Datenanalyse (Handout zum Seminarvortrag von Norman Bhatti, gehalten am 9.0.) Motivation Unter Statistik versteht man die Lehre von den Methoden zum Umgang mit quantitativen Informationen,

Mehr

Übungen mit dem Applet Vergleich von zwei Mittelwerten

Übungen mit dem Applet Vergleich von zwei Mittelwerten Vergleich von zwei Mittelwerten 1 Übungen mit dem Applet Vergleich von zwei Mittelwerten 1 Statistischer Hintergrund... 2 1.1 Typische Fragestellungen...2 1.2 Fehler 1. und 2. Art...2 1.3 Kurzbeschreibung

Mehr

Universität Potsdam Institut für Informatik Lehrstuhl Maschinelles Lernen. Clusteranalyse. Tobias Scheffer Thomas Vanck

Universität Potsdam Institut für Informatik Lehrstuhl Maschinelles Lernen. Clusteranalyse. Tobias Scheffer Thomas Vanck Universität Potsdam Institut für Informatik Lehrstuhl Maschinelles Lernen Clusteranalyse Tobias Scheffer Thomas Vanck Überblick Problemstellung/Motivation Deterministischer Ansatz: K-Means Probabilistischer

Mehr

x t2 y t = 160, y = 8, y y = 3400 t=1

x t2 y t = 160, y = 8, y y = 3400 t=1 Aufgabe 1 (25 Punkte) 1. Eine Online Druckerei möchte die Abhängigkeit des Absatzes gedruckter Fotos vom Preis untersuchen. Dazu verwendet die Firma das folgende lineare Regressionsmodell: wobei y t =

Mehr

swiss marketing academy GmbH Seite 1 von 11

swiss marketing academy GmbH Seite 1 von 11 AUFGABE 1a Nennen Sie 3 fallbezogene Gliederungszahlen und beschreiben Sie pro Gliederungszahl die Aussagekraft. 6 Punkte Gliederungszahl = Verhältnis eines Teiles zum gleichartigen Ganzen. Nennung Beschreibung

Mehr

Bayessche Lineare Regression

Bayessche Lineare Regression Universität Potsdam Institut für Informatik Lehrstuhl Maschinelles Lernen Baessche Lineare Regression Niels Landwehr Überblick Baessche Lernproblemstellung. Einführendes Beispiel: Münzwurfexperimente.

Mehr

Elisabeth Aufhauser, unveröffentlichter Text Unterrichtsmaterial Statistik-UE für Soziologie

Elisabeth Aufhauser, unveröffentlichter Text Unterrichtsmaterial Statistik-UE für Soziologie Elisabeth Aufhauser, unveröffentlichter Text Unterrichtsmaterial Statistik-UE für Soziologie Konfidenzintervall Statistische Analyse von Stichproben Der Datensatz aus der Übung (social survey 2003) besteht

Mehr

Statistics, Data Analysis, and Simulation SS 2017

Statistics, Data Analysis, and Simulation SS 2017 Statistics, Data Analysis, and Simulation SS 2017 08.128.730 Statistik, Datenanalyse und Simulation Dr. Michael O. Distler Mainz, May 29, 2017 Dr. Michael O. Distler

Mehr

Schätzung im multiplen linearen Modell VI

Schätzung im multiplen linearen Modell VI Schätzung im multiplen linearen Modell VI Wie im einfachen linearen Regressionsmodell definiert man zu den KQ/OLS-geschätzten Parametern β = ( β 0, β 1,..., β K ) mit ŷ i := β 0 + β 1 x 1i +... β K x Ki,

Mehr

Lösung Übungsblatt 5

Lösung Übungsblatt 5 Lösung Übungsblatt 5 5. Januar 05 Aufgabe. Die sogenannte Halb-Normalverteilung spielt eine wichtige Rolle bei der statistischen Analyse von Ineffizienzen von Produktionseinheiten. In Abhängigkeit von

Mehr

T-Test für unabhängige Stichproben

T-Test für unabhängige Stichproben T-Test für unabhängige Stichproben Wir gehen von folgendem Beispiel aus: Wir erheben zwei Zufallstichproben, wobei nur die Probanden der einen Stichprobe einer speziellen experimentellen Behandlung (etwa

Mehr

Übungen mit dem Applet x /s-regelkarte nach Shewhart

Übungen mit dem Applet x /s-regelkarte nach Shewhart x /s-regelkarte nach Shewhart 1 Übungen mit dem Applet x /s-regelkarte nach Shewhart 1 Statistischer Hintergrund... 2 1.1 Ziel und Vorgehensweise der x /s-regelkarte nach Shewhart...2 1.2 Kurzbeschreibung

Mehr

Statistik Übungsblatt 5

Statistik Übungsblatt 5 Statistik Übungsblatt 5 1. Gaussverteilung Die Verteilung der Messwerte einer Grösse sei durch eine Gaussverteilung mit Mittelwert µ = 7.2 und σ = 1.2 gegeben. (a) Wie gross ist die Wahrscheinlichkeit

Mehr

Mustererkennung. Übersicht. Unüberwachtes Lernen. (Un-) Überwachtes Lernen Clustering im Allgemeinen k-means-verfahren Gaussian-Mixture Modelle

Mustererkennung. Übersicht. Unüberwachtes Lernen. (Un-) Überwachtes Lernen Clustering im Allgemeinen k-means-verfahren Gaussian-Mixture Modelle Mustererkennung Unüberwachtes Lernen R. Neubecker, WS 01 / 01 Übersicht (Un-) Überwachtes Lernen Clustering im Allgemeinen k-means-verfahren 1 Lernen Überwachtes Lernen Zum Training des Klassifikators

Mehr

Modellanpassung und Parameterschätzung. A: Übungsaufgaben

Modellanpassung und Parameterschätzung. A: Übungsaufgaben 7 Modellanpassung und Parameterschätzung 1 Kapitel 7: Modellanpassung und Parameterschätzung A: Übungsaufgaben [ 1 ] Bei n unabhängigen Wiederholungen eines Bernoulli-Experiments sei π die Wahrscheinlichkeit

Mehr

Fortgeschrittene Ökonometrie: Maximum Likelihood

Fortgeschrittene Ökonometrie: Maximum Likelihood Universität Regensburg, Lehrstuhl für Ökonometrie Sommersemester 202 Fortgeschrittene Ökonometrie: Maximum Likelihood Poissonverteilung Man betrachte die poisson-verteilten Zufallsvariablen y t, t =, 2,...,

Mehr

1 Grundlagen der Wahrscheinlichkeitsrechnung Wahrscheinlichkeitsräume. Ein erster mathematischer Blick auf Zufallsexperimente...

1 Grundlagen der Wahrscheinlichkeitsrechnung Wahrscheinlichkeitsräume. Ein erster mathematischer Blick auf Zufallsexperimente... Inhaltsverzeichnis 1 Grundlagen der Wahrscheinlichkeitsrechnung 1 1.1 Wahrscheinlichkeitsräume Ein erster mathematischer Blick auf Zufallsexperimente.......... 1 1.1.1 Wahrscheinlichkeit, Ergebnisraum,

Mehr

Allgemeine lineare Modelle

Allgemeine lineare Modelle 262 Merkpunkte Allgemeine lineare Modelle Multiple lineare Regression mit nicht-normalen Zufallsabweichungen bilden eine harmlose" Verallgemeinerung der multiplen lin. Regr. Beispiele: Gumbel-Regression,

Mehr

Basis-Kurs Statistik und SPSS für Mediziner Lösungen. SPSS-Übung Überlebenszeitanalyse

Basis-Kurs Statistik und SPSS für Mediziner Lösungen. SPSS-Übung Überlebenszeitanalyse Basis-Kurs Statistik und SPSS für Mediziner Lösungen SPSS-Übung Überlebenszeitanalyse Mit Datensatz Daten_Übung_Überlebenszeitanalyse.sav 1) Zeichnen Sie die Kaplan-Meier-Kurven des progressionsfreien

Mehr

Regression und Korrelation

Regression und Korrelation Kapitel 7 Regression und Korrelation Ein Regressionsproblem behandeltdie VerteilungeinerVariablen, wenn mindestens eine andere gewisse Werte in nicht zufälliger Art annimmt. Ein Korrelationsproblem dagegen

Mehr

Masterprüfung. Die Klausur besteht aus 3 Aufgaben, die alle bearbeitet werden müssen.

Masterprüfung. Die Klausur besteht aus 3 Aufgaben, die alle bearbeitet werden müssen. Fach: Prüfer: Mikroökonometrie Prof. Regina T. Riphahn, Ph.D. Masterprüfung Vorbemerkungen: Bearbeitungszeit: 60 Minuten. Anzahl der Aufgaben: Bewertung: Erlaubte Hilfsmittel: Wichtige Hinweise: Die Klausur

Mehr

A2.3 Lineare Gleichungssysteme

A2.3 Lineare Gleichungssysteme A2.3 Lineare Gleichungssysteme Schnittpunkte von Graphen Bereits weiter oben wurden die Schnittpunkte von Funktionsgraphen mit den Koordinatenachsen besprochen. Wenn sich zwei Geraden schneiden, dann müssen

Mehr

Wahrscheinlichkeitsrechnung

Wahrscheinlichkeitsrechnung Statistik und Wahrscheinlichkeitsrechnung Prof. Dr. Michael Havbro Faber 8.04.009 Inhalt der heutigen Vorlesung Auswahl einer Verteilungsfunktion: Wahrscheinlichkeitspapier pp Schätzung und Modellentwicklung:

Mehr

Lösungen zur Prüfung Angewandte Statistische Methoden in den Nutzierwissenschaften FS 2016

Lösungen zur Prüfung Angewandte Statistische Methoden in den Nutzierwissenschaften FS 2016 ETH Zürich D-USYS Institut für Agrarwissenschaften Lösungen zur Prüfung Angewandte Statistische Methoden in den Nutzierwissenschaften FS 2016 Peter von Rohr Datum 30. Mai 2016 Beginn 08:00 Uhr Ende 08:45

Mehr

Mehrfache Lineare Regression 1/9

Mehrfache Lineare Regression 1/9 Mehrfache Lineare Regression 1/9 Ziel: In diesem Fallbeispiel soll die Durchführung einer mehrfachen linearen Regressionsanalyse auf der Basis vorhandener Prozessdaten (Felddaten) beschrieben werden. Nach

Mehr

Skript EXCEL Matrizenrechnung/Lineare Gleichungssysteme

Skript EXCEL Matrizenrechnung/Lineare Gleichungssysteme Skript EXCEL 2010 Matrizenrechnung/Lineare Gleichungssysteme 1. Einleitung Eine Matrixformel kann mehrere Berechnungen durchführen und dann entweder ein einzelnes Ergebnis oder mehrere Ergebnisse liefern.

Mehr

Lean Body Mass [kg] Estimate Std. Error t value Pr(> t ) (Intercept) ??? lbm <2e-16 ***

Lean Body Mass [kg] Estimate Std. Error t value Pr(> t ) (Intercept) ??? lbm <2e-16 *** Körperkraft [Nm] 0 50 100 150 200 250 0 20 40 60 80 Lean Body Mass [kg] Dieses Quiz soll Ihnen helfen, den R Output einer einfachen linearen Regression besser zu verstehen (s. Kapitel 5.4.1) Es wurden

Mehr

10. Die Normalverteilungsannahme

10. Die Normalverteilungsannahme 10. Die Normalverteilungsannahme Dr. Antje Kiesel Institut für Angewandte Mathematik WS 2011/2012 Bisher haben wir vorausgesetzt, daß die Beobachtungswerte normalverteilt sind. In diesem Fall kann man

Mehr

Bachelorprüfung: Statistik (1 Stunde)

Bachelorprüfung: Statistik (1 Stunde) Prof. H.R. Künsch D-BIOL, D-CHAB Winter 2010 Bachelorprüfung: Statistik (1 Stunde) Bemerkungen: Es sind alle mitgebrachten schriftlichen Hilfsmittel und der Taschenrechner erlaubt. Natels sind auszuschalten!

Mehr

Dr. Maike M. Burda. Welchen Einfluss hat die Körperhöhe auf das Körpergewicht? Eine Regressionsanalyse. HU Berlin, Econ Bootcamp

Dr. Maike M. Burda. Welchen Einfluss hat die Körperhöhe auf das Körpergewicht? Eine Regressionsanalyse. HU Berlin, Econ Bootcamp Dr. Maike M. Burda Welchen Einfluss hat die Körperhöhe auf das Körpergewicht? Eine Regressionsanalyse. HU Berlin, Econ Bootcamp 8.-10. Januar 2010 BOOTDATA.GDT: 250 Beobachtungen für die Variablen... cm:

Mehr

Teil: lineare Regression

Teil: lineare Regression Teil: lineare Regression 1 Einführung 2 Prüfung der Regressionsfunktion 3 Die Modellannahmen zur Durchführung einer linearen Regression 4 Dummyvariablen 1 Einführung o Eine statistische Methode um Zusammenhänge

Mehr

Schätzung des gemeinen Wertes von Schweinen nach 16 Tiergesundheitsgesetz

Schätzung des gemeinen Wertes von Schweinen nach 16 Tiergesundheitsgesetz Schätzung des gemeinen Wertes vn Schweinen nach 16 Tiergesundheitsgesetz Vrbemerkungen Diese Schätzhilfe sll vr allem Amtstierärzte unterstützen, die im Tierseuchenfall gesetzlich für die Schätzung der

Mehr

Statistik-Klausur vom

Statistik-Klausur vom Statistik-Klausur vom 27.09.2010 Bearbeitungszeit: 60 Minuten Aufgabe 1 Ein international tätiges Unternehmen mit mehreren Niederlassungen in Deutschland und dem übrigen Europa hat seine überfälligen Forderungen

Mehr

Die Regressionsanalyse

Die Regressionsanalyse Die Regressionsanalyse Zielsetzung: Untersuchung und Quantifizierung funktionaler Abhängigkeiten zwischen metrisch skalierten Variablen eine unabhängige Variable Einfachregression mehr als eine unabhängige

Mehr

Landwirtschaftszentrum Haus Düsse, Referat Schweinehaltung Versuchsberichte Einsatz unterschiedlicher Rapskuchenqualitäten in der Schweinemast

Landwirtschaftszentrum Haus Düsse, Referat Schweinehaltung Versuchsberichte Einsatz unterschiedlicher Rapskuchenqualitäten in der Schweinemast Einsatz unterschiedlicher qualitäten in der Schweinemast Dr. Gerhard Stalljohann, Christiane Schulze Langenhorst In einem ersten Versuch zum Einsatz steigender Anteile in Mischungen für Mastschweine hatte

Mehr

Stochastik Musterlösung 2

Stochastik Musterlösung 2 ETH Zürich HS 2018 RW, D-MATL, D-MAVT Prof. Marloes H. Maathuis Koordinator Dr. Marvin S. Müller Stochastik Musterlösung 2 1. Wir betrachten folgende vier Wettersituationen. Es regnet nur am Morgen; Es

Mehr

Aufgabe 1. Die Abweichung Y vom errechneten Geburtstermin sei normalverteilt mit dem Erwartungswert

Aufgabe 1. Die Abweichung Y vom errechneten Geburtstermin sei normalverteilt mit dem Erwartungswert Aufgabe 1 Marina hat ihr Studium satt und beschließt Hebamme zu werden. Sie beginnt ein Praktikum auf der Entbindungsstation eines großen städtischen Klinikums. Roswitha, eine erfahrene Hebamme, erklärt

Mehr

Herzlich willkommen zur Vorlesung Statistik. Streuungsmaße oder die Unterschiedlichkeit der Daten nebst kurzen Ausführungen zu Schiefe und Wölbung

Herzlich willkommen zur Vorlesung Statistik. Streuungsmaße oder die Unterschiedlichkeit der Daten nebst kurzen Ausführungen zu Schiefe und Wölbung FB 1 W. Ludwig-Mayerhofer Statistik 1 Herzlich willkommen zur Vorlesung Statistik smaße oder die Unterschiedlichkeit der Daten nebst kurzen Ausführungen zu Schiefe und Wölbung FB 1 W. Ludwig-Mayerhofer

Mehr

Vorlesung: Statistik II für Wirtschaftswissenschaft

Vorlesung: Statistik II für Wirtschaftswissenschaft Vorlesung: Statistik II für Wirtschaftswissenschaft Prof. Dr. Helmut Küchenhoff Institut für Statistik, LMU München Sommersemester 2017 6 Genzwertsätze Einführung 1 Wahrscheinlichkeit: Definition und Interpretation

Mehr

Statistik Testverfahren. Heinz Holling Günther Gediga. Bachelorstudium Psychologie. hogrefe.de

Statistik Testverfahren. Heinz Holling Günther Gediga. Bachelorstudium Psychologie. hogrefe.de rbu leh ch s plu psych Heinz Holling Günther Gediga hogrefe.de Bachelorstudium Psychologie Statistik Testverfahren 18 Kapitel 2 i.i.d.-annahme dem unabhängig. Es gilt also die i.i.d.-annahme (i.i.d = independent

Mehr

Zeitreihenanalyse Das Holt-Winters-Verfahren

Zeitreihenanalyse Das Holt-Winters-Verfahren Zeitreihenanalyse Das Holt-Winters-Verfahren Worum geht es in diesem Lernmodul? Einleitung Modellannahmen Die Prognoseformel des Holt-Winters-Verfahren Die Glättungskoeffizienten Die Startwerte Weiterführende

Mehr

Kategorielle Zielgrössen

Kategorielle Zielgrössen Kategorielle Zielgrössen 27.11.2017 Motivation Bisher gesehen: Regressionsmodelle für diverse Arten von Zielgrössen Y. kontinuierliche Zielgrösse Lineare Regression Binäre/binomiale Zielgrösse Logistische

Mehr

Klausur zu Methoden der Statistik I (mit Kurzlösung) Sommersemester Aufgabe 1

Klausur zu Methoden der Statistik I (mit Kurzlösung) Sommersemester Aufgabe 1 Lehrstuhl für Statistik und Ökonometrie der Otto-Friedrich-Universität Bamberg Prof. Dr. Susanne Rässler Klausur zu Methoden der Statistik I (mit Kurzlösung) Sommersemester 2015 Aufgabe 1 In der aktuellen

Mehr

Wissenschaftliche Nachrichten: https://www.bmbf.gv.at/schulen/sb/wina/wina.html Vol. 134/2008, 17-20

Wissenschaftliche Nachrichten: https://www.bmbf.gv.at/schulen/sb/wina/wina.html Vol. 134/2008, 17-20 Rückrechnung der Blutalkoholkonzentration: Kritik am forensischen Ansatz, II NORBERT BRUNNER und MANFRED KÜHLEITNER Die Messung des Alkoholgehalts aus der Atemluft ist ungenau. Wir untersuchen, ob zusätzliche

Mehr

Forschungsstatistik I

Forschungsstatistik I Psychologie Prof. Dr. G. Meinhardt 6. Stock, TB II R. 06-206 (Persike) R. 06-321 (Meinhardt) Sprechstunde jederzeit nach Vereinbarung Forschungsstatistik I Dr. Malte Persike persike@uni-mainz.de http://psymet03.sowi.uni-mainz.de/

Mehr

Hypothesenbewertungen: Übersicht

Hypothesenbewertungen: Übersicht Hypothesenbewertungen: Übersicht Wie kann man Fehler einer Hypothese abschätzen? Wie kann man einschätzen, ob ein Algorithmus besser ist als ein anderer? Trainingsfehler, wirklicher Fehler Kreuzvalidierung

Mehr