Bootstrap-Konfidenzintervalle
|
|
- Andreas Keller
- vor 7 Jahren
- Abrufe
Transkript
1 Bootstrap-Konfidenzintervalle Worum geht es in diesem Modul? Ausgangspunkt Grundlagen zum Bootstrap Die Idee des Bootstrap Das Bootstrap-t-Konfidenzintervall Simulation: Bootstrap-t-Konfidenzintervall bei Normalverteilung Simulation: Bootstrap-t-Konfidenzintervall bei kontaminierter Normalverteilung Simulation: Bootstrap-t-Konfidenzintervall bei Exponentialverteilung Worum geht es in diesem Modul? Abschließend wird mit dem Bootstrap-Konfidenzintervall eine Methode vorgestellt, mit der sich ein Konfidenzintervall mithilfe von Computer-Simulationen auch in Situationen aufstellen lässt, in denen die Verteilung nicht spezifiziert ist, aus der die Stichprobe stammt. Die Anwendung der Bootstrap-Methode wird an Beispielen demonstriert und kritisch hinterfragt. Dieses Modul hat eher Exkurs-Charakter. Ausgangspunkt In den vorherigen Modulen haben wir einige der gebräuchlichsten Konfidenzintervalle kennengelernt. Diese Konfidenzintervalle haben eine Gemeinsamkeit: Sie unterstellen alle ein bestimmtes Verteilungsmodell. Im Rahmen unserer Robustheitsbetrachtung (vgl. ) haben wir bereits festgestellt, dass sich für viele empirische Stichproben kein passendes theoretisches Verteilungsmodell finden lässt. Wenden wir unsere Konfidenzintervalle an, obwohl die Verteilungsannahmen nicht erfüllt sind, dann kann es zu schwerwiegenden Verletzungen des Konfidenzniveaus (vgl. ) kommen, die unter Umständen unbemerkt bleiben, weil wir in der Praxis den wahren Parameterwert nicht kennen und die Überdeckungshäufigkeit daher nicht bestimmen können. In diesem Modul - das eher Exkurs-Charakter aufweist - soll eine Einführung in ein relativ neues Verfahren zur Konstruktion von Konfidenzintervallen gegeben werden, das ohne spezifische Verteilungsannahmen auskommt. Bereits vorab soll darauf hingewiesen werden, dass auch dieses Verfahren, Bootstrap genannt, keinen Freibrief für die Konstruktion von "guten" Konfidenzintervallen bietet. Grundlagen zum Bootstrap Page 1
2 Die Konfidenzintervalle für und setzen Normalverteilung (vgl. ) voraus, d.h. das Konfidenzniveau wird nur dann eingehalten, wenn die Stichprobe aus einer Normalverteilung stammt. Stammt die Stichprobe aus einer anderen Wahrscheinlichkeitsverteilung, müsste man versuchen, Konfidenzintervalle auf Basis dieser Verteilung aufzustellen. In der Praxis ist aber in der Regel überhaupt nicht bekannt, aus welcher Verteilung die Stichprobe stammt. Die Wahrscheinlichkeitsverteilung ist ja nur ein Modell für das Verhalten der Zufallsvariablen und die Frage sollte daher nicht lauten, ob das Modell richtig oder falsch ist, sondern nur, ob das Modell das Verhalten der Zufallsvariablen ausreichend gut beschreibt. Aber auch diese Frage lässt sich - insbesondere bei kleinen Stichproben - schlecht beantworten. Neben der Möglichkeit, die Anwendung eines bestimmten Verteilungsmodells, z.b. das der Normalverteilung, zu unterstellen (eventuell unterstützt durch eine Modellvalidierung), gibt es auch noch andere Möglichkeiten. Man könnte versuchen, ohne Voraussetzung eines bestimmten Verteilungsmodells zu arbeiten, also weniger Modellvoraussetzungen zu machen. Eventuell könnte man nur die Unabhängigkeit der Beobachtungen oder auch die Symmetrie der Verteilung fordern. Die sich ergebenden Verfahren nennt man verteilungsfreie oder nichtparametrische Verfahren. Im Gegensatz dazu nennt man die statistischen Verfahren, die auf einer ganz bestimmten Verteilung oder Verteilungsfamilie beruhen, parametrische Verfahren. Die Konfidenzintervalle für und bei Normalverteilung und das Konfidenzintervall für den Anteilswert sind also parametrische Verfahren. Verteilungsfreie Konfidenzintervalle haben gegenüber denen, die wir bisher kennen, den Nachteil, dass sie breiter sind als parametrische Konfidenzintervalle zum selben Konfidenzniveau und dem selben Stichprobenumfang. Die geringere Präzision ist die Folge der nicht vorhandenen Verteilungsinformation. Wir wollen verteilungsfreie Konfidenzintervalle hier nicht betrachten. Stattdessen wollen wir uns im Folgenden mit der Bootstrap-Methode beschäftigen, die statt einer theoretischen Verteilung die empirische Verteilung der Stichprobe als Modell verwendet. Die Idee des Bootstrap Ein moderner Ansatz besteht darin, die Stichprobe selbst als Verteilungsmodell zu nehmen. Auf dieser Idee bauen die Bootstrap-Konfidenzintervalle auf, die im Jahre 1979 von Efron vorgeschlagen wurden. Bootstrapping ist zu verstehen als das "sich an den eigenen Haaren aus dem Sumpf ziehen". Page 2
3 Bradley Efron (*1938) Die Idee ist ganz einfach: Für die theoretische Herleitung wie auch für die Simulation der Konfidenzintervalle für und haben wir Normalverteilung unterstellt. D.h. wir haben unterstellt, dass die Stichproben aus einer Wahrscheinlichkeitsverteilung mit der Verteilungsfunktion der Normalverteilung stammen. Jetzt unterstellen wir, dass die Stichprobe aus einer Wahrscheinlichkeitsverteilung stammt, deren Verteilungsfunktion gleich der empirischen Verteilungsfunktion eben dieser Stichprobe ist. Zur Erinnerung: Die empirische Verteilungsfunktion ist eine monoton wachsende Treppenfunktion (vgl. ). Diese Treppenfunktion ist nun unser Modell für die Herleitung der Konfidenzintervalle. Vergleich der empirischen Verteilungsfunktion (schwarz) mit der theoretischen Verteilungsfunktion (rot) bei n=10 (links) und n=100 (rechts) - Modell: Standardnormalverteilung N(0,1) Die empirische Verteilungsfunktion schätzt nach dem Satz von Glivenko-Cantelli (auch "Hauptsatz der Statistik" genannt, vgl. ) ihr theoretisches Pendant um so besser, je größer der Stichprobenumfang ist - dieser Effekt wird in der Grafik deutlich. Das Bootstrap-t-Konfidenzintervall Wir benutzen das Modell der empirischen Verteilungsfunktion prinzipiell genau so wie bereits das Modell Normalverteilung. Entweder wir versuchen, auf dieser Modellgrundlage die Konfidenzintervalle theoretisch zu entwickeln. Das ist - von ganz wenigen Ausnahmen abgesehen - aussichtslos. Oder wir simulieren die Stichprobenergebnisse aus der Wahrscheinlichkeitsverteilung, die durch dieses empirische Modell definiert ist. So wie wir bisher in den Simulationen Zufallsstichproben vom Umfang aus der zugrunde liegenden Normalverteilung gezogen haben, ziehen wir jetzt Stichproben vom Umfang aus der vorliegenden Page 3
4 Basisstichprobe vom Umfang. Genauer gesagt: wir wählen nach dem Zufallsprinzip einen der Werte aus der Basisstichprobe aus, notieren ihn und legen ihn wieder zurück (damit die Unabhängigkeit gewahrt bleibt), wählen den nächsten aus usw., bis wir Werte als simulierte Stichprobe vom Umfang ausgewählt haben (zufälliges Ziehen mit Zurücklegen). Wiederholen wir diesen Vorgang, dann erhalten wir eine zweite, dritte,... Stichprobe vom Umfang aus unserer Basisstichprobe. Diese Stichproben nennen wir Replikationsstichproben, ihre Anzahl bezeichnen wir mit. Natürlich können auf diese Weise nur endlich viele neue Stichproben entstehen; bei jedem Zug eines neuen Wertes kann jeder der Werte der Basisstichprobe gezogen werden, bei Zügen gibt es daher Möglichkeiten. Bei einem Stichprobenumfang von wären das, bei schon Milliarden mögliche Stichproben und bei wären das, eine unvorstellbar große und auch durch schnelle Computer nicht erreichbare Anzahl von Stichproben. Wir ziehen also aus unserer Basisstichprobe in einer Simulation Stichproben nach dem Zufallsprinzip, z.b., und berechnen jeweils und sowie den Wert der Zufallsvariablen, die den Ausgangspunkt der Herleitung des Konfidenzintervalls für gebildet hatte. Für setzen wir jetzt den Mittelwert unseres empirischen Verteilungsmodells, der Basisstichprobe, ein. In der Häufigkeitsverteilung, die sich aus den Werten ergibt, können wir nun die empirischen Quantile und bestimmen. Diese treten jetzt an die Stelle der Quantile der t-verteilung, die wir vorher für die Abgrenzung des Konfidenzintervalls benutzt haben. Nachdem wir die empirischen Quantile und durch Simulation bestimmt haben, gehen wir weiter so vor wie früher: Sind und Mittelwert und Standardabweichung der Basisstichprobe, dann ist ein Bootstrap-Konfidenzintervall für zum Konfidenzniveau gegeben durch Page 4
5 . Wir machen also fast das gleiche wie bisher: nur treten an die Stelle der theoretischen t-quantile (deren Anwendung Normalverteilung voraussetzt) die aus den Bootstrap-Stichproben gewonnen empirischen Quantile und. Schema zur Berechnung eines Bootstrap-Konfidenzintervalls Ein Hersteller von Speziallampen, z.b. für Projektoren, gibt für ein bestimmtes Leuchtmittel eine Farbtemperatur von 5800 Kelvin an. Ist die tatsächliche Farbtemperatur höher, enthält das Licht der Lampe einen höheren Blau-Anteil und wirkt zu "kühl". Ist die Farbtemperatur niedriger, so wirkt das Licht gelblich. Zum Vergleich: Tageslicht hat etwa ein Farbtemperatur von 5600 Kelvin, eine Halogenlampe ca Kelvin. Um die Einhaltung der Spezifikation zu prüfen, werden 15 Leuchtmittel zufällig ausgewählt und getestet. Es ergibt sich folgende Stichprobe ( b2b.xls ). Bilden Sie mit Hilfe des Statistiklabors ( b2d.zmpf ) ein Bootstrap-Konfidenzintervall zum Konfidenzniveau. Verwenden Sie zur Bestimmung der empirischen Quantile und Replikationsstichproben. Simulation: Bootstrap-t-Konfidenzintervall bei Normalverteilung Es ist keinesfalls selbstverständlich, dass das Bootstrap-Verfahren die von uns gewünschten Konfidenzintervalle liefert. Deshalb untersuchen wir das Bootstrap-Verfahren empirisch, wiederum durch eine Simulation. Wir erzeugen uns Stichproben aus einer bekannten Normalverteilung, aus Vergleichsgründen wieder Stichproben vom Umfang aus, und grenzen nun zum Konfidenzniveau jeweils das auf der t-verteilung beruhende Konfidenzintervall für als auch das Bootstrap-Konfidenzintervall für Bootstrap-Simulationen von ab; für das letztere sind also jeweils die mit Replikationsstichproben anzustellen. Dann vergleichen wir die Überdeckungshäufigkeit und die Präzision der beiden Arten von Konfidenzintervallen. k=100 Bootstrap-Konfidenzintervalle aus jeweils d=1000 Replikationsstichproben (oben) und die entsprechenden Page 5
6 t-konfidenzintervalle zum Vergleich (unten) Überdeckung (tatsächlich / erwartet) Breite Bootstrap-t-Konfidenzintervall 96% / 95% t-konfidenzintervall 97% / 95% Das Bootstrap-Verfahren funktioniert also; die Bootstrap-Konfidenzintervalle halten das Konfidenzniveau von 95% ein. Wie erwartet sind die Bootstrap-Konfidenzintervalle allerdings im Vergleich zu den t-konfidenzintervallen geringfügig breiter, weil wir die Verteilungsinformation nicht verwendet haben (schließlich wissen wir, dass es sich um normalverteilte Stichproben handelt). Simulation: Bootstrap-t-Konfidenzintervall bei kontaminierter Normalverteilung Nachdem wir die Bootstrap-Methode erfolgreich in einer Standardsituation getestet haben, wollen wir sie nun mit verschmutzten Stichproben konfrontieren. Die Stichproben wurden aus einer Standardnormalverteilung erzeugt, in denen ca. 16% der Werte zufällig durch Realisierungen einer zweiten Normalverteilung ersetzt wurden. Es werden derartige Stichproben betrachtet. Zum Vergleich sind wieder die entsprechenden t-konfidenzintervalle berechnet worden. Für den Bootstrap wurden je Replikationsstichproben verwendet. Histogramm über alle k=100 Basisstichproben vom Umfang n=10 (abs. Häufigkeiten, oben); Bootstrap-Konfidenzintervalle (mitte); korrespondierende t-konfidenzintervalle (unten) Überdeckung (tatsächlich / erwartet) Breite Bootstrap-t-Konfidenzintervall 95% / 95% 2.84 t-konfidenzintervall 88% / 95% 2.34 Die Bootstrap-t-Konfidenzintervalle sind zwar geringfügig breiter als die t-konfidenzintervalle, halten aber das vorgegebene Konfidenzniveau von ein, während die Überdeckung bei den t-konfidenzintervallen diesen Wert deutlich unterschreitet. Dennoch verkraftet natürlich auch das Bootstrap-t-Verfahren die Verschmutzung nur bis zu einem begrenztem Maß. Simulation: Bootstrap-t-Konfidenzintervall bei Exponentialverteilung Jetzt testen wir das Bootstrap-Verfahren an einer Exponentialverteilung mit. Wir ziehen wieder Stichproben vom Umfang ; für die Bestimmung der empirischen Quantile beim Bootstrap verwenden wir Replikationsstichproben. Dichte der Exponentialverteilung mit Lambda=1 (oben), Bootstrap-Konfidenzintervalle (mitte), t-konfidenzintervalle (unten) Überdeckung (tatsächlich / Breite Page 6
7 erwartet) Bootstrap-t-Konfidenzintervall 85% / 95% 1.71 t-konfidenzintervall 88% / 95% 1.25 Nun versagt auch die Bootstrap-t-Methode, die Überdeckung liegt (wie auch bei den t-konfidenzintervallen) deutlich unter den geforderten. Der Grund ist die Schiefe der Exponentialverteilung, die dem Bootstrap massive Probleme bereitet. In diesem Modul wurde eine Alternative zu den bisher bekannten Konfidenzintervallen vorgestellt. Statt ein theoretisches Verteilungsmodell zu unterstellen, orientiert sich das Bootstrap-Verfahren an der empirischen Verteilung der Basisstichprobe. Aus der Basisstichprobe werden sog. Replikationsstichproben gezogen, anhand derer empirische Quantile bestimmt werden, mit deren Hilfe das Bootstrap-t-Konfidenzintervall abgegrenzt wird. Im Gegensatz zu den Konfidenzintervallen aus Modul 8-11 besteht der große Vorteil des Bootstrap-Verfahrens darin, dass es ohne theoretische Verteilungsannahme auskommt. Unsere erste Simulation zeigt, dass der t-bootstrap problemlos bei Normalverteilung funktioniert, die entsprechenden Konfidenzintervalle in dieser Situation aber geringfügig breiter sind als die t-konfidenzintervalle. Bei den verschmutzen Stichproben kann der t-bootstrap überzeugen, das Verfahren verkraftet die Ausreißer in den Stichproben besser als das t-konfidenzintervall. Die letzte Simulation zeigt jedoch deutlich die Grenzen des Bootstrap-t-Verfahrens. Mit schiefen Verteilungen kommt der t-bootstrap nicht zurecht; das Konfidenzniveau wird nicht eingehalten. Auch der t-bootstrap ist also kein universelles Verfahren, bei dessen Anwendung man sich keine Gedanken mehr über die Stichprobenverteilung machen muss. Es handelt sich jedoch um ein relativ junges Verfahren, dass noch fleißig weiterentwickelt wird. Es gibt zudem verschiedene Varianten, von denen hier nur eine, der t-bootstrap, vorgestellt wurde. Z.B. lässt sich die Robustheit des Bootstrap erhöhen, indem statt Mittelwert und Stichprobenstandardabweichung zur Berechnung robuste Punktschätzer (vgl. ) wie Median und (korrigierter) MAD eingesetzt werden. Basisstichprobes. Bootstrap-Konfidenzintervall ErklärungBootstrap-t-Konfidenzintervall ErklärungModellvalidierung ErklärungReplikationsstichprobes. Bootstrap-Konfidenzintervall ErklärungVerfahren, nichtparametrische ErklärungVerfahren, parametrische Erklärung (c) Projekt Neue Statistik 2003, Freie Universität Berlin, Center für Digitale Systeme Kontakt: Page 7
Grundlegende Eigenschaften von Punktschätzern
Grundlegende Eigenschaften von Punktschätzern Worum geht es in diesem Modul? Schätzer als Zufallsvariablen Vorbereitung einer Simulation Verteilung von P-Dach Empirische Lage- und Streuungsparameter zur
MehrEin- und Zweistichprobentests
(c) Projekt Neue Statistik 2003 - Lernmodul: Ein- Zweistichprobentests Ein- Zweistichprobentests Worum geht es in diesem Modul? Wiederholung: allgemeines Ablaufschema eines Tests Allgemeine Voraussetzungen
MehrAuswahl von Schätzfunktionen
Auswahl von Schätzfunktionen Worum geht es in diesem Modul? Überblick zur Punktschätzung Vorüberlegung zur Effizienz Vergleich unserer Schätzer für My unter Normalverteilung Relative Effizienz Einführung
MehrStatistik Testverfahren. Heinz Holling Günther Gediga. Bachelorstudium Psychologie. hogrefe.de
rbu leh ch s plu psych Heinz Holling Günther Gediga hogrefe.de Bachelorstudium Psychologie Statistik Testverfahren 18 Kapitel 2 i.i.d.-annahme dem unabhängig. Es gilt also die i.i.d.-annahme (i.i.d = independent
MehrWichtige Definitionen und Aussagen
Wichtige Definitionen und Aussagen Zufallsexperiment, Ergebnis, Ereignis: Unter einem Zufallsexperiment verstehen wir einen Vorgang, dessen Ausgänge sich nicht vorhersagen lassen Die möglichen Ausgänge
Mehr1. Eigenschaften einer Zufallsstichprobe
1. Eigenschaften einer Zufallsstichprobe 1.1 Grundkonzepte Definition 1.1.1: Man nennt die Zufallsvariablen X 1,..., X n zufällige Stichprobe oder Zufallsstichprobe vom Umfang n aus der Population (Grundgesamtheit)
MehrStatistische Tests. Kapitel Grundbegriffe. Wir betrachten wieder ein parametrisches Modell {P θ : θ Θ} und eine zugehörige Zufallsstichprobe
Kapitel 4 Statistische Tests 4.1 Grundbegriffe Wir betrachten wieder ein parametrisches Modell {P θ : θ Θ} und eine zugehörige Zufallsstichprobe X 1,..., X n. Wir wollen nun die Beobachtung der X 1,...,
MehrÜbungen mit dem Applet Rangwerte
Rangwerte 1 Übungen mit dem Applet Rangwerte 1 Statistischer Hintergrund... 2 1.1 Verteilung der Einzelwerte und der Rangwerte...2 1.2 Kurzbeschreibung des Applets...2 1.3 Ziel des Applets...4 2 Visualisierungen
Mehr- Normalverteilung (Gaußverteilung) kann auf sehr viele Zufallsprozesse angewendet werden.
Normalverteilung und Standardnormalverteilung als Beispiel einer theoretischen Verteilung - Normalverteilung (Gaußverteilung) kann auf sehr viele Zufallsprozesse angewendet werden. - Stetige (kontinuierliche),
MehrStatistik I für Betriebswirte Vorlesung 14
Statistik I für Betriebswirte Vorlesung 14 Dr. Andreas Wünsche TU Bergakademie Freiberg Institut für Stochastik 13. Juli 017 Dr. Andreas Wünsche Statistik I für Betriebswirte Vorlesung 14 Version: 8. Juli
Mehr2.3 Intervallschätzung
2.3.1 Motivation und Hinführung Bsp. 2.15. [Wahlumfrage] Der wahre Anteil der rot-grün Wähler unter allen Wählern war 2009 auf eine Nachkommastelle gerundet genau 33.7%. Wie groß ist die Wahrscheinlichkeit,
Mehr5 Exkurs: Deskriptive Statistik
5 EXKURS: DESKRIPTIVE STATISTIK 6 5 Ekurs: Deskriptive Statistik Wir wollen zuletzt noch kurz auf die deskriptive Statistik eingehen. In der Statistik betrachtet man für eine natürliche Zahl n N eine Stichprobe
MehrTeil VIII. Zentraler Grenzwertsatz und Vertrauensintervalle. Woche 6: Zentraler Grenzwertsatz und Vertrauensintervalle. Lernziele. Typische Situation
Woche 6: Zentraler Grenzwertsatz und Vertrauensintervalle Patric Müller ETHZ Teil VIII Zentraler Grenzwertsatz und Vertrauensintervalle WBL 17/19, 29.05.2017 Wahrscheinlichkeit
MehrDie Familie der χ 2 (n)-verteilungen
Die Familie der χ (n)-verteilungen Sind Z 1,..., Z m für m 1 unabhängig identisch standardnormalverteilte Zufallsvariablen, so genügt die Summe der quadrierten Zufallsvariablen χ := m Z i = Z 1 +... +
MehrDie Familie der χ 2 (n)-verteilungen
Die Familie der χ (n)-verteilungen Sind Z 1,..., Z m für m 1 unabhängig identisch standardnormalverteilte Zufallsvariablen, so genügt die Summe der quadrierten Zufallsvariablen χ := m Z i = Z 1 +... +
Mehr5. Schließende Statistik (Inferenzstatistik, konfirmatorische Verfahren)
5. Schließende Statistik (Inferenzstatistik, konfirmatorische Verfahren) 5.1. Einführung Schätzen unbekannter Parameter im Modell, z.b. Wahrscheinlichkeiten p i (Anteile in der Gesamtmenge), Erwartungswerte
MehrKonfidenzintervalle Grundlegendes Prinzip Erwartungswert Bekannte Varianz Unbekannte Varianz Anteilswert Differenzen von Erwartungswert Anteilswert
Konfidenzintervalle Grundlegendes Prinzip Erwartungswert Bekannte Varianz Unbekannte Varianz Anteilswert Differenzen von Erwartungswert Anteilswert Beispiel für Konfidenzintervall Im Prinzip haben wir
Mehrunendlich-dimensionalen lästigen Parameter auffassen.
Näherungen mit Bootstrap Werner Stahel, Seminar für Statistik, ETH Zürich, 8. 4. 2009 Dieser Text kann dazu dienen, die Ideen des Bootstrap zusammenzufassen. Es fehlen hier Beispiele. 1 Fragestellung a
Mehr7.2 Theoretische Kennwerte
7.2 Theoretische Kennwerte Theoretische Varianz und Standardabweichung Definition und Notation Verschiebungsformel für die theoretische Varianz 391 7.2 Theoretische Kennwerte Interpretation der theoretischen
Mehr5. Schließende Statistik (Inferenzstatistik, konfirmatorische Verfahren)
5. Schließende Statistik (Inferenzstatistik, konfirmatorische Verfahren) 5.1. Einführung Schätzen unbekannter Parameter im Modell, z.b. Wahrscheinlichkeiten p i (Anteile in der Gesamtmenge), Erwartungswerte
MehrBootstrap: Punktschätzung
Resampling Methoden Dortmund, 2005 (Jenő Reiczigel) 1 Bootstrap: Punktschätzung 1. Die Grundidee 2. Plug-in Schätzer 3. Schätzung des Standardfehlers 4. Schätzung und Korrektur der Verzerrung 5. Konsistenz
MehrZufallsvariablen. Diskret. Stetig. Verteilung der Stichprobenkennzahlen. Binomial Hypergeometrisch Poisson. Normal Lognormal Exponential
Zufallsvariablen Diskret Binomial Hypergeometrisch Poisson Stetig Normal Lognormal Exponential Verteilung der Stichprobenkennzahlen Stetige Zufallsvariable Verteilungsfunktion: Dichtefunktion: Integralrechnung:
MehrLösung parametrischer Bootstrap
Lösung parametrischer Bootstrap Aus Statistik II ist der Momentenschätzer für die Exponentialverteilung bekannt: ˆλ = 1 x = 1 1 n n 1 x. i Damit ergibt sich der Schätzer ˆλ = 1/mean(x) 0.00289 aus den
MehrStatistische Tests für unbekannte Parameter
Konfidenzintervall Intervall, das den unbekannten Parameter der Verteilung mit vorgegebener Sicherheit überdeckt ('Genauigkeitsaussage' bzw. Zuverlässigkeit einer Punktschätzung) Statistischer Test Ja-Nein-Entscheidung
MehrChi-Quadrat-Verteilung
Chi-Quadrat-Verteilung Wikipedia http://de.wikipedia.org/wiki/chi-quadrat-verteilung 1 von 7 6/18/2009 6:13 PM Chi-Quadrat-Verteilung aus Wikipedia, der freien Enzyklopädie Die Chi-Quadrat-Verteilung ist
MehrBeispiel für Gütefunktionen Rechtsseitiger Test (µ 0 = 500) zum Signifikanzniveau α = 0.10
6 Hypothesentests Gauß-Test für den Mittelwert bei bekannter Varianz 6.3 Beispiel für Gütefunktionen Rechtsseitiger Test (µ 0 = 500) zum Signifikanzniveau α = 0.10 G(µ) 0 α 0. 0.4 0.6 0.8 1 n = 10 n =
MehrStatistische Tests für unbekannte Parameter
Konfidenzintervall Intervall, das den unbekannten Parameter der Verteilung mit vorgegebener Sicherheit überdeckt ('Genauigkeitsaussage' bzw. Zuverlässigkeit einer Punktschätzung) Statistischer Test Ja-Nein-Entscheidung
MehrWahrscheinlichkeitsrechnung und schließende Statistik
Karl Mosler Friedrich Schmid Wahrscheinlichkeitsrechnung und schließende Statistik Vierte, verbesserte Auflage Springer Inhaltsverzeichnis 0 Einführung 1 1 Zufalls Vorgänge und Wahrscheinlichkeiten 5 1.1
MehrBootstrapping ein neuer Standard in Anwendung und Lehre?
. Bernd Heinen SAS Institute GmbH In der Neckarhelle 168 Heidelberg Bernd.heinen@jmp.com Zusammenfassung Bootstrapping bietet eine Möglichkeit, Verteilungsinformationen auch komplexer Statistiken aus einem
MehrMathematik für Biologen
Mathematik für Biologen Prof. Dr. Rüdiger W. Braun Heinrich-Heine-Universität Düsseldorf 12. Januar 2011 1 Vergleich zweier Erwartungswerte Was heißt verbunden bzw. unverbunden? t-test für verbundene Stichproben
MehrSchließende Statistik
Schließende Statistik [statistical inference] Sollen auf der Basis von empirischen Untersuchungen (Daten) Erkenntnisse gewonnen und Entscheidungen gefällt werden, sind die Methoden der Statistik einzusetzen.
Mehr2.3 Intervallschätzung
2.3.1 Motivation und Hinführung Bsp. 2.11. [Wahlumfrage] Der wahre Anteil der rot-grün Wähler 2009 war genau 33.7%. Wie groß ist die Wahrscheinlichkeit, in einer Zufallsstichprobe von 1000 Personen genau
Mehr8 Stichprobenkennwerteverteilung
8 Stichprobenkennwerteverteilung 8.1 Vorbemerkungen 8.2 Die Normalverteilung: Teil 2 8.3 Die t Verteilung 8.4 Normalverteilungs Approximation: Der zentrale Grenzwertsatz 8.1 Vorbemerkungen Daten x 1,...,
MehrStatistik für Ökonomen
Wolfgang Kohn Riza Öztürk Statistik für Ökonomen Datenanalyse mit R und SPSS tfü. Springer Inhaltsverzeichnis Teil I Einführung 1 Kleine Einführung in R 3 1.1 Installieren und Starten von R 3 1.2 R-Befehle
MehrKlassifikation von Signifikanztests
Klassifikation von Signifikanztests Nach Verteilungsannahmen: verteilungsabhängig: parametrischer [parametric] Test verteilungsunabhängig: nichtparametrischer [non-parametric] Test Bei parametrischen Tests
MehrStatistik I für Betriebswirte Vorlesung 14
Statistik I für Betriebswirte Vorlesung 14 Prof. Dr. Hans-Jörg Starkloff TU Bergakademie Freiberg Institut für Stochastik 11. Juli 016 Prof. Dr. Hans-Jörg Starkloff Statistik I für Betriebswirte Vorlesung
MehrÜbungen mit dem Applet Wahrscheinlichkeitsnetz
Wahrscheinlichkeitsnetz 1 Übungen mit dem Applet Wahrscheinlichkeitsnetz 1 Statistischer Hintergrund... 1.1 Verteilungen... 1. Darstellung von Daten im Wahrscheinlichkeitsnetz...4 1.3 Kurzbeschreibung
Mehr1 Grundprinzipien statistischer Schlußweisen
Grundprinzipien statistischer Schlußweisen - - Grundprinzipien statistischer Schlußweisen Für die Analyse zufallsbehafteter Eingabegrößen und Leistungsparameter in diskreten Systemen durch Computersimulation
MehrParametrische vs. Non-Parametrische Testverfahren
Parametrische vs. Non-Parametrische Testverfahren Parametrische Verfahren haben die Besonderheit, dass sie auf Annahmen zur Verteilung der Messwerte in der Population beruhen: die Messwerte sollten einer
MehrStoffverteilungsplan Mathematik Leistungskurs. Lambacher Schweizer Stochastik ISBN Klassenarbeit
Lambacher Schweizer Q3.1 Grundlegende Begriffe der Grundlagen der Wahrscheinlichkeitstheorie: Beschreiben von Zufallsexperimenten (Laplace-Experimente) unter Verwendung der Begriffe Ergebnis, Ergebnismenge,
MehrBootstrapping ein neuer Standard in Anwendung und Lehre?
Bootstrapping ein neuer Standard in Anwendung und Lehre? JMP Bernd Heinen SAS Institute GmbH In der Neckarhelle 168 Heidelberg Bernd.heinen@jmp.com Zusammenfassung Bootstrapping bietet eine Möglichkeit,
Mehr1 Wahrscheinlichkeitsrechnung. 2 Zufallsvariablen und ihre Verteilung. 3 Statistische Inferenz. 4 Intervallschätzung
0 Einführung 1 Wahrscheinlichkeitsrechnung Zufallsvariablen und ihre Verteilung 3 Statistische Inferenz 4 Intervallschätzung Motivation und Hinführung Der wahre Anteil der rot-grün Wähler 009 war genau
MehrSozialwissenschaftlerInnen II
Statistik für SozialwissenschaftlerInnen II Henning Best best@wiso.uni-koeln.de Universität zu Köln Forschungsinstitut für Soziologie Statistik für SozialwissenschaftlerInnen II p.1 Wahrscheinlichkeitsfunktionen
MehrKapitel XIV - Anpassungstests
Institut für Volkswirtschaftslehre (ECON) Lehrstuhl für Ökonometrie und Statistik Kapitel XIV - Anpassungstests Induktive Statistik Prof. Dr. W.-D. Heller Hartwig Senska Carlo Siebenschuh 2. Grundannahme:
MehrStatistik I für Betriebswirte Vorlesung 4
Statistik I für Betriebswirte Vorlesung 4 Prof. Dr. Hans-Jörg Starkloff TU Bergakademie Freiberg Institut für Stochastik 25. April 2016 Prof. Dr. Hans-Jörg Starkloff Statistik I für Betriebswirte Vorlesung
MehrInhaltsverzeichnis. 2 Kurzbeschreibung von SPSS Der SPSS-Dateneditor Statistische Analysen mit SPSS DieDaten...
Inhaltsverzeichnis Teil I Einführung 1 Kleine Einführung in R... 3 1.1 Installieren und Starten von R... 3 1.2 R-Befehleausführen... 3 1.3 R-Workspace speichern... 4 1.4 R-History sichern........ 4 1.5
Mehr1.5.4 Quantile und Modi. Bem [Quantil, Modus]
1.5.4 Quantile und Modi 1.5 Erwartungswert und Varianz Bem. 1.73. [Quantil, Modus] und Vertei- Analog zu Statistik I kann man auch Quantile und Modi definieren. Gegeben sei eine Zufallsvariable X mit Wahrscheinlichkeitsverteilung
Mehr6. Schätzverfahren für Parameter
6. Schätzverfahren für Parameter Ausgangssituation: Ein interessierender Zufallsvorgang werde durch die ZV X repräsentiert X habe eine unbekannte Verteilungsfunktion F X (x) Wir interessieren uns für einen
MehrStatistische Methoden in den Umweltwissenschaften
Statistische Methoden in den Umweltwissenschaften Stetige und diskrete Wahrscheinlichkeitsverteilungen Lageparameter Streuungsparameter Diskrete und stetige Zufallsvariablen Eine Variable (oder Merkmal
MehrWolfgang Kohn Riza Öztürk. Statistik für Ökonomen. Datenanalyse mit R und SPSS. 3., überarbeitete Auflage. 4^ Springer Gabler
Wolfgang Kohn Riza Öztürk Statistik für Ökonomen Datenanalyse mit R und SPSS 3., überarbeitete Auflage 4^ Springer Gabler Inhaltsverzeichnis Teil I Einführung 1 Statistik-Programme 3 1.1 Kleine Einführung
Mehr4.1. Nullhypothese, Gegenhypothese und Entscheidung
rof. Dr. Roland Füss Statistik II SS 8 4. Testtheorie 4.. Nullhypothese, Gegenhypothese und Entscheidung ypothesen Annahmen über die Verteilung oder über einzelne arameter der Verteilung eines Merkmals
Mehr= 3. Kapitel 4: Normalverteilung.. und Standardnormalverteilung und: das Konfidenzintervall..
Kapitel : Normalverteilung.. und Standardnormalverteilung und: das Konfidenzintervall.. Mittelwert = Summe aller Einzelwerte / n = durchschnittliche Ausprägung, wenn alle gleich viel hätten. Streuung =
Mehr1. Grundbegri e der Stochastik
Wiederholung von Grundwissen der Stochastik. Grundbegri e der Stochastik Menge der Ereignisse. Die Elemente! der Menge heißen Elementarereignisse und sind unzerlegbare Ereignisse. Das Ereignis A tritt
Mehr1.1.1 Ergebnismengen Wahrscheinlichkeiten Formale Definition der Wahrscheinlichkeit Laplace-Experimente...
Inhaltsverzeichnis 0 Einführung 1 1 Zufallsvorgänge und Wahrscheinlichkeiten 5 1.1 Zufallsvorgänge.......................... 5 1.1.1 Ergebnismengen..................... 6 1.1.2 Ereignisse und ihre Verknüpfung............
MehrPkt. Aufg.1: Aufg.2: Aufg.3: Aufg.4: Aufg.5:
Klausurbeispiel zu den Vorlesungen Statistik für Ingenieure/Stochastik sowie Datenanalyse und Statistik (Herbstsemester 00/003) Die Lösungen der Aufgaben sind jeweils in dieser grünen Farbe dargestellt!
MehrEinführung in die Statistik
Einführung in die Statistik Analyse und Modellierung von Daten von Prof. Dr. Rainer Schlittgen Universität Hamburg 12., korrigierte Auflage Oldenbourg Verlag München Inhaltsverzeichnis 1 Statistische Daten
MehrStatistik für Ökonomen
Wolfgang Kohn Riza Öztürk Statistik für Ökonomen Datenanalyse mit R und SPSS 2., überarbeitete Auflage 4ü Springer Gabler Inhaltsverzeichnis Teil I Einführung 1 Kleine Einführung in R '! 3 1.1 Installieren
MehrKlassifikation von Signifikanztests
Klassifikation von Signifikanztests nach Verteilungsannahmen: verteilungsabhängige = parametrische Tests verteilungsunabhängige = nichtparametrische Tests Bei parametrischen Tests werden im Modell Voraussetzungen
MehrT-Test für den Zweistichprobenfall
T-Test für den Zweistichprobenfall t-test (unbekannte, gleiche Varianzen) Test auf Lageunterschied zweier normalverteilter Grundgesamtheiten mit unbekannten, aber gleichen Varianzen durch Vergleich der
Mehr1 Einleitung und Grundlagen 1
Inhaltsverzeichnis Vorwort vii 1 Einleitung und Grundlagen 1 1.1 Einführende Beispiele 1 1.2 Statistischer Prozess 2 1.3 Grundlagen 2 1.4 Unterscheidung von Merkmalen 3 1.4.1 Skalenniveaus 3 1.4.2 Stetige
Mehr1.8 Kolmogorov-Smirnov-Test auf Normalverteilung
1.8 Kolmogorov-Smirnov-Test auf Normalverteilung Der Kolmogorov-Smirnov-Test ist einer der klassischen Tests zum Überprüfen von Verteilungsvoraussetzungen. Der Test vergleicht die Abweichungen der empirischen
MehrInhaltsverzeichnis. Teil I Einführung
Inhaltsverzeichnis Teil I Einführung 1 Statistik-Programme... 1.1 Kleine Einführung in R... 1.1.1 Installieren und Starten von R. 1.1.2 R-Konsole... 1.1.3 R-Workspace... 1.1.4 R-History... 1.1.5 R-Skripteditor...
MehrEinführung in die Statistik
Einführung in die Statistik Analyse und Modellierung von Daten Von Prof. Dr. Rainer Schlittgen 4., überarbeitete und erweiterte Auflage Fachbereich Materialwissenschaft! der Techn. Hochschule Darmstadt
MehrBootstrap: Konfidenzintervalle
Resampling Methoden Dortmund, 2005 (Jenő Reicigel) Bootstrap: Konfidenintervalle Konfidenintervall Sei T ein Schäter für θ, und nehmen wir an, dass die Verteilung von T θ bekannt ist. Notwendige Bedingung
Mehr1. Was ist eine Wahrscheinlichkeit P(A)?
1. Was ist eine Wahrscheinlichkeit P(A)? Als Wahrscheinlichkeit verwenden wir ein Maß, welches die gleichen Eigenschaften wie die relative Häufigkeit h n () besitzt, aber nicht zufallsbehaftet ist. Jan
MehrFit for Abi & Study Stochastik
Fit for Abi & Study Stochastik Prof. Dr. Tilla Schade Hochschule Harz 15. und 16. April 2014 No. 1 Stochastik besteht aus: Wahrscheinlichkeitsrechnung Statistik No. 2 Gliederung Grundlagen Zufallsgrößen
MehrStatistik II. Statistische Tests. Statistik II
Statistik II Statistische Tests Statistik II - 12.5.2006 1 Test auf Anteilswert: Binomialtest Sei eine Stichprobe unabhängig, identisch verteilter ZV (i.i.d.). Teile diese Stichprobe in zwei Teilmengen
MehrVerteilungen eindimensionaler stetiger Zufallsvariablen Stetige Verteilungen. Chi-Quadrat-Verteilung Studentverteilung Fisher-Verteilung
Verteilungen eindimensionaler stetiger Zufallsvariablen Stetige Verteilungen Chi-Quadrat-Verteilung Studentverteilung Fisher-Verteilung Typisierung der stetigen theoretischen Verteilungen Bibliografie:
MehrBereiche der Statistik
Bereiche der Statistik Deskriptive / Exploratorische Statistik Schließende Statistik Schließende Statistik Inferenz-Statistik (analytische, schließende oder konfirmatorische Statistik) baut auf der beschreibenden
MehrTrim Size: 176mm x 240mm Lipow ftoc.tex V1 - March 9, :34 P.M. Page 11. Über die Übersetzerin 9. Einleitung 19
Trim Size: 176mm x 240mm Lipow ftoc.tex V1 - March 9, 2016 6:34 P.M. Page 11 Inhaltsverzeichnis Über die Übersetzerin 9 Einleitung 19 Was Sie hier finden werden 19 Wie dieses Arbeitsbuch aufgebaut ist
MehrZweiseitiger Test für den unbekannten Mittelwert µ einer Normalverteilung bei unbekannter Varianz
Grundlage: Zweiseitiger Test für den unbekannten Mittelwert µ einer Normalverteilung bei unbekannter Varianz Die Testvariable T = X µ 0 S/ n genügt der t-verteilung mit n 1 Freiheitsgraden. Auf der Basis
MehrStatistik I für Betriebswirte Vorlesung 13
Statistik I für Betriebswirte Vorlesung 13 Prof. Dr. Hans-Jörg Starkloff TU Bergakademie Freiberg Institut für Stochastik 4. Juli 2016 Prof. Dr. Hans-Jörg Starkloff Statistik I für Betriebswirte Vorlesung
MehrBiometrie und Methodik (Statistik) - WiSem08/09 Probeklausur 1
Biometrie und Methodik (Statistik) - WiSem08/09 Probeklausur 1 Aufgabe 1 (10 Punkte). 10 Schüler der zehnten Klasse unterziehen sich zur Vorbereitung auf die Abschlussprüfung einem Mathematiktrainingsprogramm.
MehrPopulation und Stichprobe Wahrscheinlichkeitstheorie II
Population und Stichprobe Wahrscheinlichkeitstheorie II 5. Sitzung 1 S. Peter Schmidt 2003 1 Stichprobenziehung als Zufallsexperiment Definition Stichprobe: Teilmenge der Elemente der Grundgesamtheit bzw.
Mehr8. Konfidenzintervalle und Hypothesentests
8. Konfidenzintervalle und Hypothesentests Dr. Antje Kiesel Institut für Angewandte Mathematik WS 2011/2012 Beispiel. Sie wollen den durchschnittlichen Fruchtsaftgehalt eines bestimmten Orangennektars
MehrStatistik. Ludwig Fahrmeir Rita Künstler Iris Pigeot Gerhard Tutz. Der Weg zur Datenanalyse. Springer. Zweite, verbesserte Auflage
Ludwig Fahrmeir Rita Künstler Iris Pigeot Gerhard Tutz Statistik Der Weg zur Datenanalyse Zweite, verbesserte Auflage Mit 165 Abbildungen und 34 Tabellen Springer Inhaltsverzeichnis Vorwort v 1 Einführung
MehrWillkommen zur Vorlesung Statistik (Master)
Willkommen zur Vorlesung Statistik (Master) Thema dieser Vorlesung: Verteilungen stetiger Zufallsvariablen Prof. Dr. Wolfgang Ludwig-Mayerhofer Universität Siegen Philosophische Fakultät, Seminar für Sozialwissenschaften
MehrÜber den Autor 7. Einführung 21
Inhaltsverzeichnis Über den Autor 7 Einführung 21 Über dieses Buch oder:» für Dummies«verpflichtet! 21 Wie man dieses Buch benutzt 22 Wie ich Sie mir vorstelle 22 Wie dieses Buch aufgebaut ist 23 Teil
MehrInhaltsverzeichnis. Teil I Einführung
Teil I Einführung 1 Was ist Statistik?... 3 1.1 Der Begriff Statistik..................................... 3 1.2 Wozu Statistik?......................................... 4 1.3 Grundbegriffe...........................................
MehrWahrscheinlichkeitsrechnung und schließende Statistik
Springer-Lehrbuch Wahrscheinlichkeitsrechnung und schließende Statistik Bearbeitet von Karl Mosler, Friedrich Schmid 4., verb. Aufl. 2010. Taschenbuch. XII, 347 S. Paperback ISBN 978 3 642 15009 8 Format
Mehr1 EINLEITUNG Allgemeines Kapitelübersicht Gebrauch dieses Buches Verwenden zusätzlicher Literatur...
Inhaltsverzeichnis 1 EINLEITUNG... 1 1.1 Allgemeines... 1 1.2 Kapitelübersicht... 2 1.3 Gebrauch dieses Buches... 3 1.4 Verwenden zusätzlicher Literatur... 4 DESKRIPTIVE STATISTIK 2 GRUNDLAGEN... 5 2.1
MehrStochastik (BSc D-MAVT / BSc D-MATH / BSc D-MATL)
Prof. Dr. M. Schweizer ETH Zürich Winter 2018 Stochastik (BSc D-MAVT / BSc D-MATH / BSc D-MATL) Bitte... Lege deine Legi auf den Tisch. Trage deine Daten in dieses Deckblatt ein, und schreibe auf jedes
MehrUwe Hassler. Statistik im. Bachelor-Studium. Eine Einführung. für Wirtschaftswissenschaftler. ^ Springer Gabler
Uwe Hassler Statistik im Bachelor-Studium Eine Einführung für Wirtschaftswissenschaftler ^ Springer Gabler 1 Einführung 1 2 Beschreibende Methoden univariater Datenanalyse 5 2.1 Grundbegriffe 5 2.2 Häufigkeitsverteilungen
Mehr1. Einführung in die induktive Statistik
Wichtige Begriffe 1. Einführung in die induktive Statistik Grundgesamtheit: Statistische Masse, die zu untersuchen ist, bzw. über die Aussagen getroffen werden soll Stichprobe: Teil einer statistischen
MehrKapitel 3 Schließende Statistik
Beispiel 3.4: (Fortsetzung Bsp. 3.) bekannt: 65 i=1 X i = 6, also ˆp = X = 6 65 = 0, 4 Überprüfen der Voraussetzungen: (1) n = 65 30 () n ˆp = 6 10 (3) n (1 ˆp) = 39 10 Dr. Karsten Webel 194 Beispiel 3.4:
MehrStatistische Tests (Signifikanztests)
Statistische Tests (Signifikanztests) [testing statistical hypothesis] Prüfen und Bewerten von Hypothesen (Annahmen, Vermutungen) über die Verteilungen von Merkmalen in einer Grundgesamtheit (Population)
MehrPrüfung aus Wahrscheinlichkeitstheorie und Statistik MASCHINENBAU 2003
Prüfung aus Wahrscheinlichkeitstheorie und Statistik MASCHINENBAU 2003. Eine seltene Krankheit trete mit Wahrscheinlichkeit : 0000 auf. Die bedingte Wahrscheinlichkeit, dass ein bei einem Erkrankten durchgeführter
MehrStatistik Prüfung 24. Jänner 2008
Statistik Prüfung 24. Jänner 2008 February 10, 2008 Es ist immer nur EINE Antwort richtig, bei falsch beantworteten Fragen gibt es KEINEN Punktabzug. Werden mehrere Antworten bei einer Frage angekreuzt,
MehrPhilipp Sibbertsen Hartmut Lehne. Statistik. Einführung für Wirtschafts- und. Sozialwissenschaftler. 2., überarbeitete Auflage. 4^ Springer Gabler
Philipp Sibbertsen Hartmut Lehne Statistik Einführung für Wirtschafts- und Sozialwissenschaftler 2., überarbeitete Auflage 4^ Springer Gabler Inhaltsverzeichnis Teil I Deskriptive Statistik 1 Einführung
Mehr