Multivariate Analysemethoden und Multivariates Testen

Ähnliche Dokumente
Multivariate Analysemethoden und Multivariates Testen

Evaluation & Forschungsstrategien

Kapitel 5: Schließende Statistik

4 Schwankungsintervalle Schwankungsintervalle 4.2

3 Vergleich zweier unverbundener Stichproben

Schätzen von Populationswerten

Statistik. 5. Schließende Statistik: Typische Fragestellung anhand von Beispielen. Kapitel 5: Schließende Statistik

,,, xn. 3. Intervallschätzungen Zufallsstichproben und Stichprobenfunktionen Zufallsstichproben. Zufallsvariablen mit

Vl Statistische Prozess- und Qualitätskontrolle und Versuchsplanung Übung 5

Vl Statistische Prozess und Qualitätskontrolle und Versuchsplanung Übung 3

Schätzen von Populationswerten

X X Schätzen von Vertrauensintervallen Schwankungsintervall

Lehrstuhl für Empirische Wirtschaftsforschung und Ökonometrie Dr. Roland Füss Statistik II: Schließende Statistik SS 2007

Anwendung für Mittelwerte

2. Repetition relevanter Teilbereiche der Statistik

Die notwendigen Verteilungstabellen finden Sie z.b. hier:

Tests statistischer Hypothesen

Kovarianz und Korrelation

Übungen mit dem Applet erwartungstreu

Kapitel 6 : Punkt und Intervallschätzer

Maschinelle Sprachverarbeitung: Mathematische Grundlagen

Formelsammlung Statistik 29. Januar 2019

Wirksamkeit, Effizienz

Statistische Tests zu ausgewählten Problemen

Forschungsstatistik I

Empirische Verteilungsfunktion

6 Vergleich mehrerer unverbundener Stichproben

Musterlösung für die Klausur zur Vorlesung Stochastik I im WiSe 2014/2015

Mathematik 2 für Naturwissenschaften

Prof. Dr. Roland Füss Statistik II SS 2008

Statistik und Wahrscheinlichkeitsrechnung

Stochastik - Lösung (BSc D-MAVT / BSc D-MATH / BSc D-MATL)

Grundlagen der Biostatistik und Informatik

1) Wahrscheinlichkeitsbegriff und Rechnen mit Wahrscheinlichkeiten. P A = lim r N LI: ={ 1 LII: LIII: P A =1 P A

Übungen Abgabetermin: Freitag, , 10 Uhr THEMEN: Testtheorie

Wirksamkeit, Effizienz. Beispiel: Effizienz. Mittlerer quadratischer Fehler (MSE) Konsistenz im quadratischen Mittel

2. Schätzverfahren 2.1 Punktschätzung wirtschaftlicher Kennzahlen. Allgemein: Punktschätzung eines Parameters:

Wirksamkeit, Effizienz

Parameterschätzung. Numero, pondere et mensura Deus omnia condidit

Einführung in die induktive Statistik. Inferenzstatistik. Konfidenzintervalle. Friedrich Leisch

Lösungsvorschlag Probeklausur zur Elementaren Wahrscheinlichkeitsrechnung

1 Vorbemerkungen 1. 2 Zufallsexperimente - grundlegende Begriffe und Eigenschaften 2. 3 Wahrscheinlichkeitsaxiome 4. 4 Laplace-Experimente 6

Parameterschätzung. Kapitel Schätzfunktionen

Konfidenzintervalle. Praktische Übung Stochastik SS 2017 Lektion 10 1

Empirische Ökonomie 1 Sommersemester Formelsammlung. Statistische Grundlagen. Erwartungswert und Varianz einer Zufallsvariable.

Statistik und Wahrscheinlichkeitsrechnung

Gütefunktion und Fehlerwahrscheinlichkeiten Rechtsseitiger Test (µ 0 = 500) zum Signifikanzniveau α = Interpretation von Testergebnissen I

Einführung in die Wahrscheinlichkeitstheorie Lösungen zum Wiederholungsblatt

Dr. Jürgen Senger INDUKTIVE STATISTIK. Wahrscheinlichkeitstheorie, Schätz- und Testverfahren

2 Induktive Statistik

Eingangsprüfung Stochastik,

Repräsentativität und Unabhängigkeit

Statistische Modelle und Parameterschätzung

Konfidenzbereiche die auf Runden Normaldaten Basiert Sind

Stochastik - Lösung (BSc D-MAVT / BSc D-MATH / BSc D-MATL)

6. Grenzwertsätze. 6.1 Tschebyscheffsche Ungleichung

Kapitel 2: Stochastische Prozesse. Copyright M. Gross, ETH Zürich 2006, 2007

Beispiel: p-wert bei Chi-Quadrat-Anpassungstest (Grafik) Auftragseingangsbeispiel, realisierte Teststatistik χ 2 = , p-wert: 0.

Wissenschaftliches Arbeiten Studiengang Energiewirtschaft

3.2 Wilcoxon Rangsummentest

Grundsätzlich sollen Varianz bzw. Standardabweichung Maße dafür sein, wie stark eine Verteilung um ihren Erwartungswert streut.

3. Grundbegrie der Schätztheorie

Intervallschätzung II 2

Zufallsvariable. Die Wahrscheinlichkeitsverteilung p (probability function) ist definiert durch: p(x i ) := P (X = x i ),

Statistik und Wahrscheinlichkeitsrechnung

Tests für beliebige Zufallsvariable

2 ISO/BIPM-Leitfaden Guide to the Expression of Uncertainty in Measurement, GUM (2008 überarbeitet, die deutsche Fassung ist [3])

Kapitel VI. Einige spezielle diskrete Verteilungen

Einführung in die Stochastik 10. Übungsblatt

Streukreisberechnungen bei ballistischen Versuchen unter der zweidimensionalen Normalverteilungsannahme

Statistik und Wahrscheinlichkeitsrechnung

Musterlösung. Prüfung Statistik Herbstsemester 2011

Wahrscheinlichkeit & Statistik Musterlösung Serie 13

Umrechnung einer tatsächlichen Häufigkeitsverteilung in eine prozentuale Häufigkeitsverteilung

Testen statistischer Hypothesen

Kapitel XI - Korrelationsrechnung

Statistik, Abschnitt (1) Gegeben sei der Stichprobenvektor (X 1,..., X n ). Die Stichprobenfunktion. ˆµ k := 1 n. Xi k (1) i=1.

Statistik und Wahrscheinlichkeitsrechnung

2 Einführung in die mathematische Statistik

Lösungen ausgewählter Übungsaufgaben zum Buch. Elementare Stochastik (Springer Spektrum, 2012) Teil 4: Aufgaben zu den Kapiteln 7 und 8

Praktikum Vorbereitung Fertigungsmesstechnik Statistische Qualitätskontrolle

3. Einführung in die Statistik

Dr. Jürgen Senger INDUKTIVE STATISTIK. Wahrscheinlichkeitstheorie, Schätz- und Testverfahren

3 Kritischer Bereich zum Niveau α = 0.10: K = (χ 2 k 1;1 α, + ) = (χ2 5;0.90, + ) = (9.236, + ) 4 Berechnung der realisierten Teststatistik:

Beispiel: p-wert bei Chi-Quadrat-Anpassungstest (Grafik) Auftragseingangsbeispiel, realisierte Teststatistik χ 2 = , p-wert: 0.

Anwendungen der Wahrscheinlichkeit II. Markovketten

1. Wahrscheinlichkeitsrechnung. 2. Diskrete Zufallsvariable. 3. Stetige Zufallsvariable. 4. Grenzwertsätze. 5. Mehrdimensionale Zufallsvariable

Evaluierung einer Schulungsmaßnahme: Punktezahl vor der Schulung Punktezahl nach der Schulung. Autoritarismusscore vor/nach Projekt

Mathematik 2 für Naturwissenschaften

Der χ 2 Test. Bei Verteilungen Beantwortung der Frage, ob eine gemessene Verteilung Gauß- oder Poisson-verteilt ist oder nicht?

X in einer Grundgesamtheit vollständig beschreiben.

Vorkurs Mathematik für Informatiker Folgen

Teil II Zählstatistik

Dr. Jürgen Senger INDUKTIVE STATISTIK. Wahrscheinlichkeitstheorie, Schätz- und Testverfahren

Ulrich Stein Fehlerrechnung

10. Grundlagen der linearen Regressionsanalyse 10.1 Formulierung linearer Regressionsmodelle

Streuungsmaße. Prof. Dr. Paul Reuber. Institut für Geographie. Seminar Methoden der empirischen Humangeographie

Transkript:

Multivariate Aalysemethode ud Multivariates Teste Stude im Mai Güter Meihardt Johaes Guteberg Uiversität Maiz

Priziie des statistische Schliesses Samlig - Modellvorstellug Poulatio Samlig Stichrobe Kewerte Theoretische Statistik Welche Verteilug vo Kewerte wird sich ergebe, We ma de Samlig Vorgag uedlich oft wiederholt? Herleitug der Kewerte-Verteilug (Samlig Distributio) ud Beschreibug ihrer Parameter. Methode zur Schätzug der Parameter aus Stichrobedate sowohl für uivariate, als auch für multivariate Kewerteverteiluge

Samlig Distributio (D) Uivariate - Verteilug der Stichrobemittelwerte Samlig - Modellvorstellug Poulatio Stichrobe des Umfags Bilde Mittelwert. - mal:. - mal: k. - mal: k k k- maliges Samle vo Stichrobe derselbe Größe ud Bereche der Stichrobemittelwerte führt auf eie Verteilug vo Stichrobemittelwerte (Samlig Distributio)

Mittelwerte Uivariate - Verteilug der Stichrobemittelwerte Samlig - Modellvorstellug Poulatio k - Stichrobe des Umfags Verteilug vo Stichrobemittel k Samlig Distributio Erwartugswert E Erwartugswert E Erwartugstreue Die Samlig Distributio hat deselbe Erwartugswert wie die Poulatio, aus der die Stichrobe gezoge wurde. Schätzstatistike, die deselbe Erwartugswert habe wie die Poulatio, heisse erwartugstreu. Stichrobemittelwerte sid erwartugstreue Schätzuge des Poulatiosarameters

Variaz Uivariate - Verteilug der Stichrobemittelwerte Samlig - Modellvorstellug Poulatio k - Stichrobe des Umfags Verteilug vo Stichrobevariaze s s s sk Variaz Bias E s E s Erwartugstreue: Die Stichrobevariaz uterschätzt die Poulatiosvariaz tedeziell: Stichrobevariaze sid keie erwartugstreue Schätzuge des Poulatiosvariaz s

Uivariate - Verteilug der Stichrobemittelwerte Samlig - Modellvorstellug Bias-Faktor E s Der Bias bei der Schätzug der Po.Variaz aus der Stichrobevariaz ist die Variaz der Stichrobemittelwerte. ˆ E s s i i Erwartugstreue: Die Stichrobevariaz berechet aus korrigiertem Umfag - ist eie erwartugstreue Schätzug der Poulatiosvariaz

Wahrscheilichkeitsdichte Methode der Uivariate - Verteilug der Stichrobemittelwerte Cetral Limit Theorem Die Verteilug vo Samlig-Mittelwerte äher sich mit wachsedem Umfag der Samle-Stichrobe eier Normalverteilug a. Für > 3 ist die Aroimatio scho gut. f..5 Es gilt:.. E o E. m-s m-s m+s m+s Theoretische Samlig Distributio Die theoretische Samlig Distributio ist die Grudlage des statistische Schliesses. Aussage über de Zusammehag vo Stichrobemittelwerte ud Poulatioe werde mithilfe dieser Verteilug gewoe (Iferezstatistischer Schluss).

Uivariate - Verteilug der Stichrobemittelwerte Kofidez- Itervalle.. Awedug P z z / / P z z / / WK- Aussage. Ma habe eie Mittelwert aus eier Stichrobe der Größe vorliege. I welchem Bereich um de Mittelwert ka ma de Poulatiosarameter mit der Wahrscheilichkeit - erwarte?. Der Poulatiosarameter sei bekat. I welchem Bereich um ih liege Mittelwerte mit der Wahrscheilichkeit -? z- Verteilug z Pz z z Mit Y der Verteilugsfuktio der Stadardormalverteilug. Für < 5 sollte die t- Verteilug mit df = verwedet werde.

Uivariate - Verteilug der Stichrobemittelwerte Hyothese t - ud F-Test t F- Äquivalez t H : H : P t t t; df t ˆ / Es gilt t df F ; df Äquivalez vo t- ud F- Test mit df Test- Äquivalez: Eie zweiseitige Wahrscheilichkeitsbestimmug auf der t Verteilug ist der (grudsätzlich eiseitige) Wahrscheilichkeitsbestimmug auf der F - Verteilug äquivalet. ˆ / Bemerke: t ˆ

Multivariate - Verteilug der Stichrobemittelwerte Multivariates t Vektore ei Mittelwertevektor μ ei Mittelwertevektor Hotellig s T Defiitio T ˆ ˆ μ Σ μ μ Σ μ mit ˆΣ die Samle Variaz-Covariaz Matri mit Korrektur - der Date-Zetroid μ ageommeer Zetroid ˆ Σ i i i i i Verteilug T T [JW-Beisiel-5.] ist verteilt wie F ; we die Stichrobe eier multivariat ormalverteilte Grudgesamtheit etomme ist.

Multivariate - Verteilug der Stichrobemittelwerte Verteilug T Sei,,, ei Samle aus eier N μσ, so gilt ˆ P μ Σ μ F Poulatio ; für jedes ageommee μ egal, wie das wahre μ ud Σ sid. F- Test Kofidez- Ellisoide [Beisiele] Ma leht die H : daher auf Sigifikaziveau ab, we ˆ T μ Σ μ F ; Gleichzeitig defiiert die Distazbedigug ˆ μ Σ μ F ; i eiem -variat ormalverteilte Ellisoid Kofidezregioe, die ma für jedes ageommee um für ei sae ka.

Multivariate Cetral Limit Theorem Multivariate - Verteilug der Stichrobemittelwerte Sei,,, eie Stichrobe aus eier Poulatio mit Da gilt ud we Erwartugsvektor μ ud Variaz-Covariaz Matri μ ist aroimativ ˆ N, Σ μ Σ μ ist aroimativ groß ist. c verteilt Σ Regel Für < 5 ist die Voraussetzug der multivariate Normalverteilug i der Stichrobe jedem Falle zu rüfe, ud die T Statistik herazuziehe. Bei grössere Stichrobe ka direkt die c Statistik agewedet werde. I jedem Fall sollte eie Ausreißerbehadlug durchgeführt werde.

Simultae uivariate Kofidezregioe um Mittelwert uivariat [ ] multivariat (=) ˆ i i e i Σe Läge = c Läge = c Kofidezregio im Ellisoid [Beisiele] ˆ μ Σ μ c F ; (-) Kofidezregio für i der bivariat ormalverteilte Samlig- Distributio, die um gesat ist.

Uivariates CI Simultae uivariate Kofidezitervalle Ei (-) Kofidezitervall für eie Variablekomoete wird im Kotet aller uivariate Kofidezaussage betrachtet. Das uivariate Kofidezitervall (CI) j ˆ j t ˆ ˆ / ; j jj das jj-te Elemet vo führt im Kotet aller - mögliche Vergleiche zu eiem iflatioierte - Fehler ud damit zu falsche, rogressive Etscheiduge. ˆΣ Simultae Kofidez Itervalle Kofidezitervalle ro Variablekomoete, die alle mögliche Vergleiche auf eiem (overall) -Niveau absicher, laute ˆ j CI j F ; j ˆ j c Simultae CIs defiiere die Boudig-Bo der CI-Ellise.

Simultae CIs Overall Boferroi Aroimatio CI Simultae uivariate Kofidezitervalle Die simultae CIs sid koservativ, ud köe durch eie Aroimatio für uabhägige Variableachse ersetzt werde. Im simultae Kotet ka die - Fehler Iflatio durch Wahl eies eue Niveaus für jede Eizeltest für ei gewüschtes overall ˆ komesiert werde. Es gilt für ei vorgegebees overall P all comarisos true / Kofidezitervalle ro Variablekomoete werde durch Wahl eies eue -Niveaus alle auf eiem (overall) -Niveau abgesichert. ˆ ˆ ˆ j CI j t a /( );

Uivariate - Multivariate Kofidezregioe Vergleich der CIs.7.65 alha-ce DataCetroid ProbeCetroid.6 Simultaes CI.55 Boferroi D (falsch) CI-Aussage.5.5.55.6.65.7 D Kofidezregioe ud D Kofidezitervalle ermögliche verschiedee Etscheiduge, je achdem, ob Paaruge vo Mittelwerte (Cetroide) oder eizele Mittelwerte iteressiere. Zu beachte ist, dass im multivariate Kotet Aussage für eie Achse streggeomme ie ohe Berücksichtigug des Wertes auf de adere Variableachse gemacht werde köe (Boudig- Bo ud Boferroi-Bo hat immer mehr Fläche als die CI-Ellise)

Uivariate ud multivariate Mittelwertevergleiche Samle uivariat multivariat Meßeiheite uabhägig abhägig uabhägig abhägig Samlig- Distributio Differeze vo Mittelwerte geoolte Variaze Mittelwerte vo Differeze Differezvektor vo Cetroide Geoolte Var-Covar Mat. Cetroide vo Differezvektore Test-Statistik t t T T Multivariate Mittelwertsvergleiche sid die direkte Etsrechug zu uivariate Vergleiche. Es gelte dieselbe Priziie, lediglich agewedet auf Cetroid-Vektor ud Variaz-Covariaz Matri.

Wahrscheilichkeitsdichte Methode der Uivariate Mittelwertevergleiche t- Test für uabhägige Stichrobe Hyothese H H : : (ugerichtet) H: Der Erwartugswert der Differeze vo Mittelwerte ist Null Samlig Distributio f. Es gilt:.. wird geschätzt aus beide Stichrobe 3. ist t- verteilt..5 [t-test ausführlich?].

Uivariate Mittelwertevergleiche t- Test für uabhägige Stichrobe Statistik t ˆ ooled Etscheidug: a) Krit. t-wert b) Überschreitugs-WK Prüfgrösse t- verteilt mit + Freiheitsgrade t t Ablehug vo H, df ; / sost Beibehaltug oder P t t Ablehug vo H, sost Beibehaltug Voraussetzug. Für + < 5 ormalverteilte Stichrobedate. Homogee Stichrobevariaze 3. Uabhägige Messeiheite ierhalb ud zwische de Samles.

Wahrscheilichkeitsdichte Methode der Uivariate Mittelwertevergleiche t- Test für abhägige Stichrobe Hyothese H : H : (ugerichtet) H: Der Erwartugswert der Mittelwerte vo Differeze ist Null Samlig Distributio f. Es gilt:.. wird geschätzt aus Differezestichrobe 3. ist t- verteilt..5.

Uivariate Mittelwertevergleiche Statistik t t- Test für abhägige Stichrobe s s Cov (, ) Etscheidug: a) Krit. t-wert b) Überschreitugs-WK Voraussetzug Prüfgrösse t- verteilt mit Freiheitsgrade ( = Azahl Paare) t t Ablehug vo H, df ; / sost Beibehaltug oder P t t Ablehug vo H, sost Beibehaltug. Für < 3 ormalverteilte Stichrobedate. Homogee Stichrobevariaze müsse icht vorliege 3. Korrelatio der Meßreihe erhöht die Teststärke.

Multivariate Mittelwertevergleiche Hotellig s T - Test für abhägige Stichrobe Hyothese H : μ μ H : μ μ (ugerichtet) δ μ H: Der Erwartugswert des Differezecetroids ist Null Date i i i d i d d d i i i i i i - dimesioaler Differezvektor jeder i- te Perso (Differeze der Zeitukte auf de - Variable)

Multivariate Mittelwertevergleiche Hotellig s T - Test für abhägige Stichrobe Kegröße d di i ˆ Σ d d d d d i i i T - Statistik T ˆ d δ Σ d d δ Etscheidug Lehe die H auf Sigifikazlevel ab, we gilt ˆ T dσd d F ; Mit F (-) dem (-) Quatil der F- Verteilug mit Zählerfreiheitsgrade ud - Neerfreiheitsgrade.

Multivariate Mittelwertevergleiche Hotellig s T - Test für abhägige Stichrobe Kofidezregioe Komoete Kofidezitervalle d δ Σ d δ ˆ d F defiiert eie (-) Kofidezregio im Ellisoid um d für. We - groß ist, gilt F c ; ; ud die Stichrobe müsse icht multivariat ormalverteilt sei. s j j : dj F ; defiiert uivariate (-) Kofidezitervalle um jede Variable- Differezemittelwert. Aalog sid Boferroi-Itervalle defiiert.

Multivariate Mittelwertevergleiche Hotellig s T - Test für uabhägige Stichrobe Hyothese H : μ μ H : μ μ (ugerichtet) μ μ H: Die Differez der Erwartugs-Cetroide ist Null Date i i i i i i i i - dimesioaler Messvektor jeder i- te Perso aus jeder Grue

Multivariate Mittelwertevergleiche Hotellig s T - Test für uabhägige Stichrobe Kegröße i i i i ˆ Σ i i i ˆ Σ i i i Mittelwertevektore ud Variaz-Covariaz Matrize für jede Grue. Geoolte Var-Covar- Matri Σˆ ooled Σˆ Σˆ

Multivariate Mittelwertevergleiche Hotellig s T - Test für uabhägige Stichrobe Kegröße Σ ˆ ooled T - Statistik T ˆ ooled Σ Etscheidug Lehe die H auf Sigifikazlevel ab, we gilt T F ; Mit F (-) dem (-) Quatil der F- Verteilug mit Zählerfreiheitsgrade ud + -- Neerfreiheitsgrade.

Multivariate Mittelwertevergleiche Hotellig s T - Test für uabhägige Stichrobe Kofidezregioe T δ defiiert eie (-) Kofidezregio im Ellisoid um für Distaze. d F ; Komoete Kofidezitervalle Mit c defiiert F ; c s j j jj, ooled uivariate (-) Kofidezitervalle um jede Gruedifferez vo Variablemittelwerte. S jj,ooled ist das jj-te Elemet der geoolte Variaz-Covariaz Matri. Boferroi-Itervalle sid aalog defiiert.

Multivariate Normalverteilug D-Normal Verteilug Beisiel D Die Ellise der Form t Σ c c sid zetriert i ud habe Hautachse mit Eigewertbedigug Σe i e i c e Eie Eigewertzerlegug der Variaz-Kovariaz Matri liefert somit die Hautachse des - variate Ellisoids der multivariate Normalverteilug i Läge = i c Läge = c