Multivariate Aalysemethode ud Multivariates Teste 23.4.27 & 3.4.27 & 7.5.27 Güter Meihardt Johaes Guteberg Uiversität Maiz Weisst du, wieviel Sterlei stehe A dem blaue Himmelszelt? Weisst du, wieviel Wolke gehe Weithi über alle Welt? (W. Hey, zit. ach N. Wieer, Cyberetics, Cotrol ad Commuicatio i the Aimal ad the Machie)
Multivariate Aalysemethode & Multivariates Teste Vorlesug Verfahresdarstellug i Überblick Grudrizi wichtigste mathematische Beziehuge Awedugsbeisiele Übug Vertiefug mit Awedugsbeisiele Arbeite a 3 Project Files Prüfug Ketisse aus WS26/7 & SS27 Freischussklausur: 3.8.27 Abschlussklausur: 9..27
Eiführug Verfahre Versuchsläe Ziele Multivariate Aalysemethode & Multivariates Teste Priziie des iferezstatistische Schliesses Kofidezitervalle multivariate Mittelwertsvergleiche multivariate Variazaalyse (MANOVA) Logistische Regressio Korresodezaalyse Cojoit Measuremet Tyische Desigs aus Allgemeie Eerimetelle Psy. (Project File ) Kliische Psy. (Project File 2) AOW (Project File 3) Wisse über statistische Verfahre Wisse über Utersuchugsstrategie Umsetzug mit Software
Multivariate Aalysemethode & Multivariates Teste Literatur Johso/Wicher a) b) Backhaus Bortz c) d) Wier
Priziie des statistische Schliesses Samlig - Modellvorstellug Poulatio Samlig Stichrobe Kewerte σ Theoretische Statistik Welche Verteilug vo Kewerte wird sich ergebe, We ma de Samlig Vorgag uedlich oft wiederholt? Herleitug der Kewerte-Verteilug (Samlig Distributio) ud Beschreibug ihrer Parameter. Methode zur Schätzug der Parameter aus Stichrobedate sowohl für uivariate, als auch für multivariate Kewerteverteiluge
Samlig Distributio (D) Uivariate - Verteilug der Stichrobemittelwerte Samlig - Modellvorstellug Poulatio Stichrobe des Umfags Bilde Mittelwert. - mal: 2. - mal: k. - mal: ( ) k 2 k k- maliges Samle vo Stichrobe derselbe Größe ud Bereche der Stichrobemittelwerte führt auf eie Verteilug vo Stichrobemittelwerte (Samlig Distributio)
Mittelwerte Uivariate - Verteilug der Stichrobemittelwerte Samlig - Modellvorstellug Poulatio k - Stichrobe des Umfags Verteilug vo Stichrobemittel ( ) k Samlig Distributio Erwartugswert E{ } = μ Erwartugswert E{ } = μ Erwartugstreue Die Samlig Distributio hat deselbe Erwartugswert wie die Poulatio, aus der die Stichrobe gezoge wurde. Schätzstatistike, die deselbe Erwartugswert habe wie die Poulatio, heisse erwartugstreu. Stichrobemittelwerte sid erwartugstreue Schätzuge des Poulatiosarameters μ
Variaz Uivariate - Verteilug der Stichrobemittelwerte Samlig - Modellvorstellug Poulatio k - Stichrobe des Umfags Verteilug vo Stichrobevariaze 2 s ( s 2 2 2 ) s2 sk Variaz 2 σ Bias { } = E s 2 σ 2 2 = σ { } E s = σ 2 2 = σ σ 2 2 Erwartugstreue: Die Stichrobevariaz uterschätzt die Poulatiosvariaz tedeziell: Stichrobevariaze sid keie erwartugstreue Schätzuge des Poulatiosvariaz σ 2
Uivariate - Verteilug der Stichrobemittelwerte Samlig - Modellvorstellug Bias-Faktor { } E s = σ σ = σ σ 2 2 2 2 2 Der Bias bei der Schätzug der Po.Variaz aus der Stichrobevariaz ist die Variaz der Stichrobemittelwerte. ˆ σ { } E s σ σ = = σ 2 2 2 2 = s = i 2 2 i= ( ) 2 Erwartugstreue: Die Stichrobevariaz berechet aus korrigiertem Umfag - ist eie erwartugstreue Schätzug der Poulatiosvariaz
Uivariate - Verteilug der Stichrobemittelwerte Cetral Limit Theorem Die Verteilug vo Samlig Mittelwerte äher sich mit wachsedem Umfag der Samle Stichrobe eier Normalverteilug a. Für > 3 ist die Aroimatio scho gut. f Wahrscheilichkeitsdichte ( )..5 σ Es gilt:. 2. { } = μ = E{ } E σ σ = o. μ 2σ μ σ μ μ+σ μ+2σ Theoretische Samlig Distributio Die theoretische Samlig Distributio ist die Grudlage des statistische Schliesses. Aussage über de Zusammehag vo Stichrobemittelwerte ud Poulatioe werde mithilfe dieser Verteilug gewoe (Iferezstatistischer Schluss).
Uivariate - Verteilug der Stichrobemittelwerte Kofidez- Itervalle. 2. Awedug ( ) P z σ μ + z σ = α α/2 α/2 ( ) P μ z σ μ+ z σ = α α/2 α/2 WK- Aussage. Ma habe eie Mittelwert aus eier Stichrobe der Größe vorliege. I welchem Bereich um de Mittelwert ka ma de Poulatiosarameter μ mit der Wahrscheilichkeit -α erwarte? 2. Der Poulatiosarameter μ sei bekat. I welchem Bereich um ih liege Mittelwerte mit der Wahrscheilichkeit -α? z- Verteilug z μ σ = P( z > z ) = Ψ( z ) Mit Ψ der Verteilugsfuktio der Stadardormalverteilug. Für < 5 sollte die t- Verteilug mit df = verwedet werde.
Uivariate - Verteilug der Stichrobemittelwerte Hyothese t - ud F-Test t 2 F- Äquivalez t H : μ = μ H : μ μ = P( t > t ) = Ψ )( ) ( t ˆ σ / μ ( ) ; 2 tdf mit Es gilt t 2 df = F ( ; df ) Äquivalez vo t- ud F- Test df = Test- Äquivalez: Eie zweiseitige Wahrscheilichkeitsbestimmug auf der t Verteilug ist der (grudsätzlich eiseitige) Wahrscheilichkeitsbestimmug auf der F - Verteilug äquivalet. μ ˆ σ / 2 Bemerke: 2 t = = ( μ )( ˆ σ ) ( μ ) 2
Multivariate - Verteilug der Stichrobemittelwerte Multivariates t Vektore ei Mittelwertevektor μ ei Mittelwertevektor Hotellig s T 2 Defiitio T 2 ˆ = ˆ = ( μ ) Σ ( μ ) ( μ ) Σ ( μ ) mit ˆΣ die Samle Variaz-Covariaz Matri mit Korrektur - der Date-Zetroid μ ageommeer Zetroid ˆ Σ = i i ( ) i= ( )( ) ( ) i i= = Verteilug T 2 2 T [JW-Beisiel-5.] ist verteilt wie ( ) F ( ; ) we die Stichrobe eier multivariat ormalverteilte Grudgesamtheit etomme ist.
Multivariate - Verteilug der Stichrobemittelwerte Verteilug T 2 Sei,,, 2 so gilt ei Samle aus eier (, ) N μσ Poulatio ( ) ( ) ˆ α = P μ Σ ( μ) > F ( )( α ; ) für jedes ageommee μ egal, wie das wahre μ ud Σ sid. F- Test Kofidez- Ellisoide [Beisiele] Ma leht die H : μ = μ daher auf Sigifikaziveau α ab, we ( ) 2 ( ) ˆ T = μ Σ ( μ ) > F ; Gleichzeitig defiiert die Distazbedigug ( ) ˆ μ Σ ( μ) ( ) ( )( α ) F ( )( α ; ) i eiem -variat ormalverteilte Ellisoid Kofidezregioe, die ma für jedes ageommee μ um für ei α sae ka.
Multivariate Cetral Limit Theorem Regel Multivariate - Verteilug der Stichrobemittelwerte Sei, 2,, Da gilt ud we eie Stichrobe aus eier Poulatio mit Erwartugsvektor μ ud Variaz-Covariaz Matri ( μ) ist aroimativ ( ) ˆ ( ) (, Σ) Für < 5 ist die Voraussetzug der multivariate Normalverteilug i der Stichrobe jedem Falle zu rüfe, ud die T 2 Statistik herazuziehe. Bei grössere Stichrobe ka direkt die χ 2 Statistik agewedet werde. I jedem Fall sollte eie Ausreißerbehadlug durchgeführt werde. N μ Σ μ ist aroimativ groß ist. 2 χ verteilt Σ
Simultae uivariate Kofidezregioe um Mittelwert uivariat 2σ σ [ ] + σ + 2σ μ multivariat (=2) ˆ i = λ i e i Σe μ 2 Läge = c λ = 2 Läge = μ c λ2 Kofidezregio im Ellisoid [Beisiele] ( ) ˆ μ Σ ( μ) ( ) = 2 c F ( )( α ; ) (-α) Kofidezregio für μ i der bivariat ormalverteilte Samlig- Distributio, die um gesat ist.
Uivariates CI Simultae uivariate Kofidezitervalle Ei (-α) Kofidezitervall für eie Variablekomoete wird im Kotet aller uivariate Kofidezaussage betrachtet. Das uivariate Kofidezitervall (CI) j ˆ j σ ± t ˆ σ ˆ ( α /2; ) j = σ jj das jj-te Elemet vo ˆΣ führt im Kotet aller - mögliche Vergleiche zu eiem iflatioierte α- Fehler ud damit zu falsche, rogressive Etscheiduge. Simultae Kofidez Itervalle Kofidezitervalle ro Variablekomoete, die alle mögliche Vergleiche auf eiem (overall) α-niveau absicher, laute ( ) ˆ σ j CI = j ± F( ; )( α ) ˆ σ j = j ± c Simultae CIs defiiere die Boudig-Bo der CI-Ellise.
Simultae CIs Overall α Boferroi Aroimatio CI Simultae uivariate Kofidezitervalle Die simultae CIs sid koservativ, ud köe durch eie Aroimatio für uabhägige Variableachse ersetzt werde. Im simultae Kotet ka die α- Fehler Iflatio durch Wahl eies eue α Niveaus für jede Eizeltest für ei gewüschtes overall komesiert werde. Es gilt für ei vorgegebees overall P ( ) ( α ) all comarisos true = α ( ) ( ) ( ) α = α α α = α α ( ) / α α = α Kofidezitervalle ro Variablekomoete werde durch Wahl eies eue α-niveaus alle auf eiem (overall) -Niveau abgesichert. ˆα ˆ σ CI = j j ± t( a /(2 ); ) ˆα ˆα
Uivariate - Multivariate Kofidezregioe Vergleich der CIs.7.65 alha-ce DataCetroid ProbeCetroid 2.6 Simultaes CI.55 Boferroi D (falsch) CI-Aussage.5.5.55.6.65.7 2D Kofidezregioe ud D Kofidezitervalle ermögliche verschiedee Etscheiduge, je achdem, ob Paaruge vo Mittelwerte (Cetroide) oder eizele Mittelwerte iteressiere. Zu beachte ist, dass im multivariate Kotet Aussage für eie Achse streggeomme ie ohe Berücksichtigug des Wertes auf de adere Variableachse gemacht werde köe (Boudig- Bo ud Boferroi-Bo hat immer mehr Fläche als die CI-Ellise)
Uivariate ud multivariate Mittelwertevergleiche Samle uivariat multivariat Meßeiheite uabhägig abhägig uabhägig abhägig Samlig- Distributio Differeze vo Mittelwerte geoolte Variaze Mittelwerte vo Differeze Differezvektor vo Cetroide Geoolte Var-Covar Mat. Cetroide vo Differezvektore Test-Statistik t t T 2 T 2 Multivariate Mittelwertsvergleiche sid die direkte Etsrechug zu uivariate Vergleiche. Es gelte dieselbe Priziie, lediglich agewedet auf Cetroid-Vektor ud Variaz-Covariaz Matri.
Uivariate Mittelwertevergleiche t- Test für uabhägige Stichrobe Hyothese H μ μ : : H μ μ = (ugerichtet) μ Δ = H: Der Erwartugswert der Differeze vo Mittelwerte ist Null Samlig Distributio f Wahrscheilichkeitsdichte ( Δ )..5 σ Δ Es gilt:. μ Δ = 2. σ Δ wird geschätzt aus beide Stichrobe 3. Δ ist t- verteilt. [t-test ausführlich?]. 2σ Δ σ Δ σ Δ 2σ Δ Δ
Uivariate Mittelwertevergleiche t- Test für uabhägige Stichrobe Statistik t = Δ σ Δ σ Δ 2 = ˆ σ ooled + Etscheidug: a) Krit. t-wert b) Überschreitugs-WK Prüfgrösse t- verteilt mit + 2 Freiheitsgrade t t α > Ablehug vo H, ( df ; / 2) sost Beibehaltug oder P( t t ) Ablehug vo H, < α sost Beibehaltug Voraussetzug. Für + < 5 ormalverteilte Stichrobedate 2. Homogee Stichrobevariaze 3. Uabhägige Messeiheite ierhalb ud zwische de Samles.
Uivariate Mittelwertevergleiche t- Test für abhägige Stichrobe Hyothese H μ μ : : H μ μ = (ugerichtet) μ Δ = H: Der Erwartugswert der Mittelwerte vo Differeze ist Null Samlig Distributio f Wahrscheilichkeitsdichte ( Δ)..5 σ Δ Es gilt:. μ Δ = 2. σ Δ wird geschätzt aus Differezestichrobe 3. Δ ist t- verteilt.. 2σ Δ σ Δ σ Δ 2σ Δ Δ
Uivariate Mittelwertevergleiche Statistik t t- Test für abhägige Stichrobe Δ σ Δ s s Cov = ( 2 2 σ ) Δ = + 2 (, ) Etscheidug: a) Krit. t-wert b) Überschreitugs-WK Voraussetzug Prüfgrösse t- verteilt mit 2 Freiheitsgrade ( = Azahl Paare) t t α > Ablehug vo H, ( df ; / 2) sost Beibehaltug oder P( t t ) Ablehug vo H, < α sost Beibehaltug. Für < 3 ormalverteilte Stichrobedate 2. Homogee Stichrobevariaze müsse icht vorliege 3. Korrelatio der Meßreihe erhöht die Teststärke.
Multivariate Mittelwertevergleiche Hotellig s T 2 - Test für abhägige Stichrobe Hyothese H : μ μ H : μ = μ (ugerichtet) δ= μδ = H: Der Erwartugswert des Differezecetroids ist Null Date i i i d i d = di2 = i2 i2 = di i = i - dimesioaler Differezvektor jeder i- te Perso (Differeze der 2 Zeitukte auf de - Variable)
Multivariate Mittelwertevergleiche Hotellig s T 2 - Test für abhägige Stichrobe Kegröße d ( ) di i= = ˆ Σ = d d d d ( ) ( )( ) d i i i= T 2 - Statistik T ( ) ˆ d δ Σ d ( d δ) = 2 Etscheidug Lehe die H auf Sigifikazlevel α ab, we gilt ( ) 2 ˆ T = d Σd d > F ( )( α ; ) Mit F (-α) dem (-α) Quatil der F- Verteilug mit Zählerfreiheitsgrade ud - Neerfreiheitsgrade.
Multivariate Mittelwertevergleiche Hotellig s T 2 - Test für abhägige Stichrobe Kofidezregioe Komoete Kofidezitervalle ( d δ ) Σ ( d δ) ( ) ˆ d F ( )( α ; ) defiiert eie (-α) Kofidezregio im Ellisoid um d für δ. We - groß ist, gilt ( ) F ( )( α ) = χ 2 ; ( α ) ud die Stichrobe müsse icht multivariat ormalverteilt sei. ( ) 2 s j δ j : d j ± F ( )( α ; ) defiiert uivariate (-α) Kofidezitervalle um jede Variable- Differezemittelwert. Aalog sid Boferroi-Itervalle defiiert.
Multivariate Mittelwertevergleiche Hotellig s T 2 - Test für uabhägige Stichrobe Hyothese H : μ μ H : μ = μ (ugerichtet) μ μ = H: Die Differez der Erwartugs-Cetroide ist Null Date i i 2 i 2 i i = i = i i - dimesioaler Messvektor jeder i- te Perso aus jeder Grue
Multivariate Mittelwertevergleiche Hotellig s T 2 - Test für uabhägige Stichrobe Kegröße ( ) i = i= ( ) ( ) i = i= ˆ Σ = ( )( ) i i i= ˆ Σ = ( ) ( )( ) i i i= Mittelwertevektore ud Variaz-Covariaz Matrize für jede Grue. Geoolte Var-Covar- Matri Σˆ ooled = ( ) Σˆ + ( ) + 2 Σˆ
Multivariate Mittelwertevergleiche Hotellig s T 2 - Test für uabhägige Stichrobe Kegröße Σ ˆ ooled T 2 - Statistik T 2 = ˆ + ooled ( ) Σ ( ) Etscheidug Lehe die H auf Sigifikazlevel α ab, we gilt T 2 ( + 2 ) F( ; ( ) )( α ) + + > Mit F (-α) dem (-α) Quatil der F- Verteilug mit Zählerfreiheitsgrade ud + -- Neerfreiheitsgrade.
Multivariate Mittelwertevergleiche Hotellig s T 2 - Test für uabhägige Stichrobe Kofidezregioe Komoete Kofidezitervalle T 2 ( δ) defiiert eie (-α) Kofidezregio im Ellisoid um für Distaze δ. d = Mit c 2 defiiert ( + 2 ) F( ; ( ) )( α ) + + ( + 2 ) F( ; ( ) )( α ) + + = ± c + s ( ) j j jj, ooled uivariate (-α) Kofidezitervalle um jede Gruedifferez vo Variablemittelwerte. S jj,ooled ist das jj-te Elemet der geoolte Variaz-Covariaz Matri. Boferroi-Itervalle sid aalog defiiert.
Multivariate Normalverteilug D-Normal Verteilug Beisiel 2D Die Ellise der Form c = t ( μ ) Σ ( μ) χ ( α) 2 2 sid zetriert i μ ud habe Hautachse mit Eigewertbedigug Σe i = λ e i ± c λ e Eie Eigewertzerlegug der Variaz Kovariaz Matri liefert somit die Hautachse des variate Ellisoids der multivariate Normalverteilug 2 Läge = i i c λ μ = μ2 Läge = c λ 2