10. Statistische Verteilungen

Ähnliche Dokumente
Statistik und Wahrscheinlichkeitsrechnung

4.1. Nullhypothese, Gegenhypothese und Entscheidung

12. Arbeiten mit ProActive X

Tutorial: Anpassungstest

Statistische Tests (Signifikanztests)

5. Seminar Statistik

Klassifikation von Signifikanztests

- Normalverteilung (Gaußverteilung) kann auf sehr viele Zufallsprozesse angewendet werden.

4.1. Verteilungsannahmen des Fehlers. 4. Statistik im multiplen Regressionsmodell Verteilungsannahmen des Fehlers

Statistische Methoden der Datenanalyse Wintersemester 2012/2013 Albert-Ludwigs-Universität Freiburg

Statistische Analyse hydrologischer Daten (HW Berechnung)

Teil VIII Hypothesentests für zwei Stichproben

Einführung in die Statistik

6. Schätzverfahren für Parameter

Kapitel 9. Schätzverfahren und Konfidenzintervalle. 9.1 Grundlagen zu Schätzverfahren

Einführung in die Statistik

Tutorial:Unabhängigkeitstest

Theorie Parameterschätzung Ausblick. Schätzung. Raimar Sandner. Studentenseminar "Statistische Methoden in der Physik"

Statistik I für Betriebswirte Vorlesung 14

3 Grundlagen statistischer Tests (Kap. 8 IS)

Hypothesen: Fehler 1. und 2. Art, Power eines statistischen Tests

Statistik II. Statistische Tests. Statistik II

Kapitel XIV - Anpassungstests

8. Konfidenzintervalle und Hypothesentests

Grundlagen der Statistik

Auswertung und Lösung

R. Brinkmann Seite

Chi-Quadrat-Verteilung

das Kleingedruckte...

5. Schließende Statistik (Inferenzstatistik, konfirmatorische Verfahren)

Statistische Messdatenauswertung

DWT 2.1 Maximum-Likelihood-Prinzip zur Konstruktion von Schätzvariablen 330/467 Ernst W. Mayr

Lösungen zu den Übungsaufgaben in Kapitel 10

2. Formulieren von Hypothesen. Nullhypothese: H 0 : µ = 0 Gerät exakt geeicht

R. Brinkmann Seite

73 Hypothesentests Motivation Parametertest am Beispiel eines Münzexperiments

Grundidee. χ 2 Tests. Ausgangspunkt: Klasseneinteilung der Beobachtungen in k Klassen. Grundidee. Annahme: Einfache Zufallsstichprobe (X 1,..., X n ).

Wichtige Definitionen und Aussagen

Statistisches Testen

Mathematische Statistik Aufgaben zum Üben. Schätzer

Allgemeines zu Tests. Statistische Hypothesentests

Die Familie der χ 2 (n)-verteilungen

9. Schätzen und Testen bei unbekannter Varianz

Lösungen zu Janssen/Laatz, Statistische Datenanalyse mit SPSS 1

Korrekturhinweise zum Skript Vertiefung der Wirtschaftsmathematik und Statistik

Anpassungstests VORGEHENSWEISE

Analytische Statistik II

Grundlagen sportwissenschaftlicher Forschung Inferenzstatistik 2

Einführung in die Induktive Statistik: Testen von Hypothesen

Analyse von Querschnittsdaten. Signifikanztests I Basics

Verteilungen eindimensionaler stetiger Zufallsvariablen Stetige Verteilungen. Chi-Quadrat-Verteilung Studentverteilung Fisher-Verteilung

Konkretes Durchführen einer Inferenzstatistik

Trim Size: 176mm x 240mm Lipow ftoc.tex V1 - March 9, :34 P.M. Page 11. Über die Übersetzerin 9. Einleitung 19

GRUNDPRINZIPIEN statistischen Testens

Macht des statistischen Tests (power)

Zweiseitiger Test für den unbekannten Mittelwert µ einer Normalverteilung bei unbekannter Varianz

Einführung in Quantitative Methoden

Fit for Abi & Study Stochastik

Zeigen Sie mittles vollständiger Induktion, dass für jede natürliche Zahl n 1 gilt: n (2k 1) = n 2.

Multivariate Verfahren

Ablaufschema beim Testen

4.1 Stichproben, Verteilungen und Schätzwerte. N(t) = N 0 e λt, (4.1)

Einführung in die statistische Testtheorie

Analytische Statistik: Varianzanpassungstest, Varianzhomogenitätstest. Statistische Methoden in der Korpuslinguistik Heike Zinsmeister WS 2008/09

Beurteilende Statistik

Testen von Hypothesen:

KATA LOGO Mathematik Statistik Roadmap: Von der Hypothese zum p-wert

Klausur zu Statistik II

Statistik II. IV. Hypothesentests. Martin Huber

Prüfgröße: Ist die durch eine Schätzfunktion zugeordnete reelle Zahl (etwa Mittelwert 7 C).

10 Der statistische Test

Statistik II Februar 2005

Forschungsstatistik I

Statistische Methoden in den Umweltwissenschaften

5. Kolmogorov-Smirnov-Test und χ 2 -Anpassungstest

Mathematik für Biologen

2.4 Hypothesentests Grundprinzipien statistischer Hypothesentests. Hypothese:

1.8 Kolmogorov-Smirnov-Test auf Normalverteilung

Klausur Stochastik und Statistik 31. Juli 2012

Modellanpassung und Parameterschätzung. A: Übungsaufgaben

Die Abfüllmenge ist gleich dem Sollwert 3 [Deziliter].

Biomathematik für Mediziner, Klausur SS 2001 Seite 1

Online-Aufgaben Statistik (BIOL, CHAB) Auswertung und Lösung

Test von Hypothesen: Signifikanz des Zusammenhangs (F-Test)

Multivariate Verfahren

Biostatistik. Lösung

Mathematische und statistische Methoden II

Parameterschätzung. Kapitel 14. Modell Es sei {P θ θ Θ}, Θ R m eine Familie von Verteilungen auf χ (sog. Stichprobenraum),

Schließende Statistik

Vergleich von Gruppen I

Hypothesen über die Grundgesamtheit. Aufgabenstellung der Testtheorie Hypothesen (Annahmen, Vermutungen oder

Statistik II. Weitere Statistische Tests. Statistik II

Vorlesung: Statistik II für Wirtschaftswissenschaft

Schließende Statistik: Hypothesentests (Forts.)

Mathematik IV für Maschinenbau und Informatik (Stochastik) Universität Rostock, Institut für Mathematik Sommersemester 2007

Willkommen zur Vorlesung Statistik (Master)

Statistik II Übung 4: Skalierung und asymptotische Eigenschaften

Teilklausur des Moduls Kurs 42221: Vertiefung der Statistik

Angewandte Statistik mit R

Statistik Testverfahren. Heinz Holling Günther Gediga. Bachelorstudium Psychologie. hogrefe.de

Transkript:

10. Statistische Verteilungen Übung Röntgenpraxis XVI Die Patienten der Röntgenpraxis unterscheiden sich durch unterschiedliche Fitness. Daher benötigen die MTRA unterschiedliche Zeiten, um die Patienten auf den jeweiligen Wegen durch die Praxis zu begleiten. Die Begleitzeiten durch die MTRA sind gemäß folgender Abbildung zu implementieren. N(3,1) N(10,3) N(2,1) N(3,1) N(5,3) N(2,1) N(3,3) 171

Gliederung 1. Grundkenntnisse zur Simulation 2. Einführung in ProModel 3. Grundbausteine von ProModel 4. Path Networks 5. Variablen und Counter 6. User Distributions 7. Attribute 8. Uhrzeitabhängiges Routing und Schichtkalender 9. Statistische Auswertung der Simulationsdaten 10. Statistische Verteilungen 11. Aufbereitung empirischer Daten 12. Arbeiten mit ProActive X, Kosten 13. Fallstudie 172

Prozess einer Verteilungsanpassung Datenaufbereitung Mögliche Verteilung auswählen Goodness-of-Fit Test 173

Prozess einer Verteilungsanpassung Datenaufbereitung Datenaufbereitung Mögliche Verteilung auswählen Repräsentativen Zeitraum der zu analysierenden Daten auswählen Goodness-of-Fit Test Entsprechende Daten vergangenheitsbezogen aus vorhandenen IT-Systemen ermitteln 174

Prozess einer Verteilungsanpassung Datenaufbereitung Mögliche Verteilung auswählen Mögliche Verteilung auswählen Beurteilung der Ist-Daten mittels Histogramm und Hintergrundinformationen Goodness-of-Fit Test Auswahl möglicher Verteilungen (siehe Kapitel 10) 175

Prozess einer Verteilungsanpassung Datenaufbereitung Mögliche Verteilung auswählen Goodness-of-Fit Test Schätzwert soll Erwartungstreu sein, d.h. die Schätzfunktion entspricht zumindest im Mittel dem richtigen Wert E Θ ˆ ( X,..., X )]=Θ [ 1 n, X1,,Xn sind beobachtete Zufallsvariablen Daneben soll die Schätzfunktion konsistent sein. Dies ist der Fall, wenn sie mit steigender Zahl an Beobachtungen eine immer kleiner werdende Abweichung von der realen Funktion zeigt. P( Θˆ Θ > ε ) 0 für jedesε > 0 n n 176

Prozess einer Verteilungsanpassung Datenaufbereitung Mögliche Verteilung auswählen Untersuchung der Güte des geschätzten Parameters mittels der Methode Mittlerer quadratischer Fehler (MSE = mean squared error) Goodness-of-Fit Test MSE = E( Θˆ Θ) 2 = E( Θˆ 2 ) 2ΘE( Θˆ ) + Θ 2 2 = E( Θˆ ) [ E( Θˆ )] + [ E( Θˆ )] ˆ ˆ 2 = Var ( Θ) + [ E( Θ) Θ] 2 2 2ΘE( Θˆ ) + Θ 2 Beispiel für eine Methode zur Ermittlung solcher Parameter ist die Maximum-Liklihood Methode 177

Prozess einer Verteilungsanpassung Datenaufbereitung Mögliche Verteilung auswählen Goodness-of-Fit Test Goodness-of-Fit Test Definition der Nullhypothese H0 und der Alternativhypothese H1. Bei Bestätigung der Hypothese H0 wird die Behauptung als wahr angesehen. Festlegung des Signifikanzniveaus α, das die Wahrscheinlichkeit der fälschlichen Ablehnung von H0 angibt. Bestimmung einer Stichproben- bzw. Testfunktion V Definition eines Verwerfungsbereiches B sowie die Beachtung der Entscheidungsregel, die besagt, dass H0 genau dann abgelehnt wird, wenn der Wert der Testfunktion V im Verwerfungsbereich B liegt 178

Prozess einer Verteilungsanpassung Datenaufbereitung Mögliche Verteilung auswählen Goodness-of-Fit Test Goodness-of-Fit Test - Chi-Quadrat-Test Festlegung H0 und H1 H0: Die, durch die Grundgesamtheit beschriebene Verteilung entspricht der vermuteten Verteilung H1: Die, durch die Grundgesamtheit beschriebene Verteilung entspricht nicht der vermuteten Verteilung Festlegung des Signifikanzniveaus α Je kleiner α gewählt wird, umso kleiner ist die Wahrscheinlichkeit, dass die Hypothese H0 abgelehnt wird, obwohl diese stimmt. Problematisch ist jedoch, dass mit einer immer kleineren Wahl von α auch eine Ablehnung von H0 immer unwahrscheinlicher wird, obwohl diese Behauptung falsch ist. Häufig wird α als 10%, 5% oder 1% gewählt. Intervall der Grundgesamtheit in k Klassen unterteilen und die Anzahl der beobachteten Werte (beobachtete Häufigkeit) O i mit i=1, k je Klasse feststellen. Mit dieser Zahl wird jeweils die Anzahl an Werten verglichen E i mit i=1, k, die erwartet werden, wenn die Grundgesamtheit der speziellen Verteilung folgt. 179

Prozess einer Verteilungsanpassung Datenaufbereitung Mögliche Verteilung auswählen Goodness-of-Fit Test Auswertung der Testfunktion Sobald für die Testfunktion gilt: V > χ k 2 1;1 α Goodness-of-Fit Test - Chi-Quadrat-Test Betrachtung folgender Prüfgröße V = k i= 1 ( Oi Ei ) E i 2 Unter der Annahme, dass die Anzahl der beobachteten Werte O i ausreichend groß ist, kann diese Prüfgröße als annähernd Chi-Quadrat-verteilt mit k-1 Freiheitsgraden angenommen werden. Verwerfungsbereich B festlegen Die linke Grenze dieses Intervalls wird bestimmt durch den Quantilswert der oben genannten Chi-Quadrat-Verteilung. Das Intervall lautet: B 2 ( χ1 ; ) = α ist der Funktionswert Element von B und es wird die Nullhypothese H0 abgelehnt. Die Funktionswerte der Chi-Quadrat-Verteilung sind in Tabellen dokumentiert und können daher in Abhängigkeit des gewählten a und k direkt abgelesen werden. 180

Ergebnis einer Datenerhebung? Wie bringe ich meine gemessenen Daten in eine Simulation?. 181

Statistische Verteilungsfunktionen schätzen: Datenaufbereitung Per Hand sehr aufwändig Mögliche Verteilung auswählen Berechnungen mit Hilfe des Statistikprogramms R. Goodness-of-Fit Test 182

Vorgehen: 1. Daten zur Berechnung aufbereiten Daten zeilenweise getrennt in ein Dokument schreiben (z.b.:.txt,.xls, ) Dokument, sofern möglich und kein Schreibschutz, in den R-Ordner unter C:\Programme\R\R-2.4.0 speichern (Ansonsten beim Aufruf des Dokuments in R Angabe des kompletten Pfades beim Einlesen der Daten nötig, bspw. F:\Untersuchungsdauer.txt" Programm R öffnen 183

Workspace: 184

2. Vorauswahl möglicher Familien von Verteilungsfunktionen treffen (sichte Histogramme, Wertebereiche, ) für anzupassendem Datensatz Variablennamen bereithalten (hier: y) anzupassende Daten einlesen und Variablennamen zuweisen: > y<-scan("f:\untersuchungsdauer.txt") R zeigt Anzahl der eingelesenen Daten(zeilen) an: Read 274 items Histogramm des Datensatzes y anzeigen: > hist(y) 185

3., Anpassung an mögliche Verteilungsfunktionen Package MASS aufrufen (umfasst u.a. die Maximum-Likelihood Methode zur Anpassung univariater Verteilungen) > library(mass) Datensatz an erste vermutete Verteilungsfunktion anpassen (), bspw. Gamma > fitdistr(y, gamma ) R gibt die geschätzten Parameter zurück: shape rate 4.33999743 0.63093527 (0.35876018) (0.05529361) 186

4. Goodness-of-Fit Test (Güte der Anpassung evaluieren) Kolmororov-Smirnov-Test (ks-test) > ks.test(y,"pgamma",shape=4.33999743,rate=0.63093527) R gibt Güte zurück: One-sample Kolmogorov-Smirnov test data: y D = 0.0925, p-value = 0.01896 alternative hypothesis: two-sided p-wert sollte - je nach Festlegung - über α = 0.05 (5%) oder 0.01 (1%) liegen (übliche Signifikanz-Level in der Statistik-Literatur) Hier: 1%-Signifikanz-Level: Wir akzeptieren die Nullhypothese dass die Daten einer Gammaverteilung folgen. 5%-Signifikanz-Level: Nullhypothese wird verworfen andere Verteilung suchen 187

Graphische Darstellung der Dichtefunktionen Unseres Datensatzes: > plot(density(y)) Vergleichend die angepasste Gamma- Funktion darüberlegen: > gamma<-rgamma(10000,shape=4.33999743,rate=0.63093527) > lines(density(gamma),col=2) plot erstellt die Graphik neu lines schreibt in geöffnete Graphik hinzu 188

Implementierung der Verteilungsfunktion in ProModel gemäß Folie 155 Befehle für weitere Verteilungsfunktionen: Anmerkung: Bei der Implementierung in ProModel von in R ermittelten Parametern für Gammafunktionen kann es vorkommen, daß vom rate - Parameter der Kehrwert eingesetzt werden muß, um die Generierung korrekter Zufallswerte zu gewährleisten ( stets prüfen!!!) 189

10. Statistische Verteilungen Aufgabe Lassen Sie die Simulation Schreinerei XVI laufen. Die Bearbeitungszeiten auf Mill und Maschine 2 werden in einem externen File ausgelesen. Bereiten Sie diese Daten auf und ermitteln Sie mit Hilfe des Statistik-Programms R die entsprechende Verteilungsfunktion. Welchen Schluß ziehen Sie beim Vergleich der implementierten Funktion in ProModel und der mit R ermittelten Funktion? 190

10. Statistische Verteilungen Aufgabe Suchen Sie passende Verteilungsfunktionen zu den im Excel-Dokument angegebenen Meßwerten. Probieren Sie dabei möglichst viele Funktionen aus. Wählen Sie die mit dem höchsten p-wert. 191