3 Bivariate und multivariate Verfahren

Ähnliche Dokumente
Statistische Grundlagen Ein kurzer Überblick (diskret)

Statistik. ist die Kunst, Daten zu gewinnen, darzustellen, zu analysieren und zu interpretieren um zu neuem Wissen zu gelangen.

2.2 Rangkorrelation nach Spearman

Intervallschätzungen geben unter Berücksichtigung des Verteilungstyps von X einen Bereich an, der den Parameter mit vorgegebener Sicherheit enthält.

Erzeugen und Testen von Zufallszahlen

Der Korrelationskoeffizient ist ein Maß für den linearen Zusammenhang zwischen zwei Variablen X und Y. Er ist durch folgende Formel charakterisiert:

Lohnkosten pro Arbeitsstunde. Wie hoch sind die Lohnkosten pro Arbeitsstunde im Jahresdurchschnitt?

Alternative Darstellung des 2-Stichprobentests für Anteile. Beobachtete Response No Response Total absolut DCF CF

Korrelations- und Regressionsanalyse

Regressionsrechnung und Korrelationsrechnung

Prinzip "Proportional Reduction of Error" (PRE)

5 Reproduktions- und Grenzwertsätze

Ordnungsstatistiken und Quantile

Übungen zur Wahrscheinlichkeitsrechnung und Schliessenden Statistik

Aufgaben. 1. Gegeben seien folgende Daten einer statistischen Erhebung, bereits nach Größe sortiert (Rangliste):

Einführung in Statistik

Einführung Fehlerrechnung

Spannweite, Median Quartilsabstand, Varianz und Standardabweichung.

Einführung in die Stochastik 3. Übungsblatt

Konzentrationsanalyse

Asymptotische Normalverteilung nach dem zentralen Grenzwertsatz

Test für Varianz. Test für Varianz. Test für Varianz. Die Kontingenztabelle. Statistik 2 4. Vorlesung. Wiederholung: zweidimensionales Datenmaterial

Stichprobenmodell der linearen Einfachregression

Physikalische Messungen sind immer fehlerbehaftet! Der wahre Wert ist nicht ermittelbar. Der wahre Wert x ist nicht identisch mit dem Mittelwert

Statistik und Wahrscheinlichkeitsrechnung

( x) eine Funktion definiert, in der nur die i-te Komponente variabel ist. Folgende Schreibweisen werden aufgrund dieser Anmerkungen auch verwendet:

Mehrdimensionale Häufigkeitsverteilungen (1)

Formeln für Statistik und Wahrscheinlichkeitstheorie (Dutter)

Klausur Statistik IV Sommersemester 2009

Statistik. (Inferenzstatistik)

Beispiel zur Regression

Der Korrelationskoeffizient ist ein Maß für den linearen Zusammenhang zwischen zwei Variablen X und Y. Er ist durch folgende Formel charakterisiert:

Lösungen. Häufigkeitsverteilung (Stabdiagramm) Aufgabe 1. Häufigkeit (h) Merkmal (x)

4. Marshallsche Nachfragefunktionen Frage: Wie hängt die Nachfrage nach Gütern

Kapitel XI. Funktionen mit mehreren Variablen

die Schadenhöhe ( = Risikoergebnis) des i-ten Versicherungsnehmers i 1,, n).

Quellencodierung I: Redundanzreduktion, redundanzsparende Codes

Regressionsgerade, lineares Modell:

Der Korrelationskoeffizient ist ein Maß für den linearen Zusammenhang zwischen zwei Variablen X und Y. Er ist durch folgende Formel charakterisiert:

Grundgesetze der BOOLEschen Algebra und Rechenregeln

Mathematik: Mag. Schmid Wolfgang & LehrerInnenteam Arbeitsblatt Semester ARBEITSBLATT 7-8 WAHRSCHEINLICHKEITSRECHNUNG UND STATISTIK

Formelzusammenstellung

Eigenschaften der arithmetischen Mittel. Schätzer für die Varianz. Allgeimeines Method: Likelihood Funktion. Schätzer für die Wahrscheinlichkeit

Statistische Tests für unbekannte Parameter. Statistische Tests für unbekannte Parameter. Statistische Tests für unbekannte Parameter

Varianzanalyse. Varianzanalyse. Varianzanalyse. Varianzanalyse

( ) ( ) ( ) ( ) è ø. P A Wahrscheinlichkeitsmaß. lim n. Dr. Christian Schwarz 4. KOMBINATORIK Permutationen

Fehlerrechnung im Praktikum

2. Zusammenhangsanalysen: Korrelation und Regression

Dr. H. Grunert Einführung in die Wahrscheinlichkeitsrechnung Vorlesungscharts. Vorlesung 5.2. Eigenschaften von Zufallsvariablen

Verdichtete Informationen

Histogramm / Säulendiagramm

Ingrid A. Uhlemann (2015): Einführung in die Statistik für Kommunikationswissenschaftler. Online Anhang: Lösung der Übungsaufgaben Kapitel 5-8,

Vl. Statistische Prozess- und Qualitätskontrolle und Versuchsplanung Übung 3: Diskrete Verteilungen

Leitfaden zu den Indexkennzahlen der Deutschen Börse

Universitätslehrgang Sports Physiotherapy Einführung in die Statistik

1 Mathe Formeln Statistik und Wahrscheinlichkeitsrechnung

Maße zur Kennzeichnung der Form einer Verteilung (1)

Korrelations- und Assoziationsmaße

Grundlagen der Entscheidungstheorie

Quantitative Methoden in der klinischen Epidemiologie

Formelsammlung. Unter diesen Annahmen kann der Korrelationskoeffizient nach folgenden Schritten getestet werden:

Die Methode des 2.Moments

Im Wöhlerdiagramm wird die Lebensdauer (Lastwechsel oder Laufzeit) eines Bauteils in Abhängigkeit von der Belastung dargestellt.

Lösungen zum Übungs-Blatt 7 Wahrscheinlichkeitsrechnung

Lösungen zum Übungs-Blatt 7 Wahrscheinlichkeitsrechnung

= k. , mit k als Anzahl der Hypothesen A i und den Daten B. Bestimmtheitsmaß:!Determinationskoeffizient

Das "Alkomatproblem" - Statistische Tests

= 2. Korrelationskoeffizient. Der Korrelationskoeffizient ist ein Maß für den linearen Zusammenhang zwischen zwei Variablen

Zur Interpretation einer Beobachtungsreihe kann man neben der grafischen Darstellung weitere charakteristische Größen heranziehen.

Mehrdimensionale Merkmale

Als Einstieg. Als Einstieg. Verteilungstests. Verteilungstests. Testverfahren. Grafische Verfahren

FH D WS 2007/08 Prof. Dr. Horst Peters Dezember 2007

Sitzplatzreservierungsproblem

3. Das Messergebnis. Was ist ein Messergebnis?

Varianzfortpflanzung

für j=0,1,...,n Lagrange zur Lösung der Interpolation nicht geeignet, da numerisch problematisch und teuer. 1 n

Formelsammlung Statistik

6. Zusammenhangsmaße (Kovarianz und Korrelation)

Quellencodierung I: Redundanzreduktion, redundanzsparende Codes

Standardnormalverteilung. Normalverteilung. Verteilungsfunktion. Intervallwahrscheinlichkeiten

0,066 0,166 0,366 0,566 0,732 0,865 0, Für die Berechnung des Mittelwerts können wir hier schon Vorarbeit leisten, in dem wir rechnen.

Textil & Design Formelsammlung Statistik

(Markowitz-Portfoliotheorie)

Eindimensionale Regression. Eindimensionale Regression. Regressionsgerade. Güte des Regressionsmodells. Vertrauensintervalle

Schiefe-, Wölbungs- und Konzentrationsmaße

Übung Statistik II SS 2006 Musterlösung Arbeitsblatt 6

Kapitel III. Lagemaße. die beobachteten Werte eines Merkmals X mit Ausprägungen a 1

annehmen, so heißt die Funktion, die jedem atomaren Ereignis { x i } mit i { 1; 2; ;

Statistische Kennzahlen für die Streuung

Messfehler, Fehlerberechnung und Fehlerabschätzung

WIB 2 Mathematik und Statistik Formelsammlung. Z Menge der ganzen Zahlen {...,-3,-2,-1,0,1,2,3,...}

Verteilungen und Schätzungen

Beispielklausur BWL B Teil Marketing. 45 Minuten Bearbeitungszeit

1 1 1 x0,25 x200 0,25 x200 0,25 1 x50 x51 1 1

Regression und Korrelation

Einen Spieler interessiert nicht, wie er gewinnt, sondern ob und wie viel er gewinnt.

Statistik mit Excel und SPSS

Definitionen und Aussagen zu Potenzreihen

Grundlagen der Energietechnik Energiewirtschaft Kostenrechnung. Vorlesung EEG Grundlagen der Energietechnik

Transkript:

3 Bvarate ud Multvarate Verfahre 8 3 Bvarate ud multvarate Verfahre Im Gegesatz zu de bsher behadelte Schätz- ud Testverfahre, de stets auf ee Grudgesamthet bzw. auf e Merkmal ausgerchtet ware, trete statstsche Fragestelluge häufg Probleme auf, be dee es darum geht, de Zusammehag zwsche zwe oder mehrere Merkmale aufzudecke ud zu beschrebe, sowe Art ud Ausmaß der Abhäggket zwsche dese Merkmale zu prüfe. Zu desem Zweck muss auseader gehalte werde, ob de bede betrachtete Merkmale qualtatver oder quattatver Natur sd. Im erste Fall ka de Uabhäggket zweer Merkmale mt eem χ -Test überprüft werde, m zwete Fall köe möglche Zusammehäge m Rahme der Korrelatos- ud Regressosaalyse utersucht werde. Schleßlch ethält deser Abschtt e Kaptel zur Aalyse vo Zetrehe sowe ee Überblck über wetere multvarate Verfahre der Statstk. 3. Uabhäggket Kotgeztafel Wr betrachte zuächst de Fall, dass bede Beobachtuge qualtatve Merkmale betreffe, dere Auspräguge (zwe oder mehrere) begrfflch uterschedbare Klasse egetelt werde köe. Ausgagspukt für de folgede Überleguge blde somt zwe qualtatve Merkmale X ud Y, de gemesam varere, also ee zwedmesoale Grudgesamthet blde. Jede Stchprobe aus eer solche Grudgesamthet ka Form eer Kotgeztafel dargestellt werde. Uterschedet ma bem Merkmal X etwa k ud bem Merkmal Y etwa m Ausprägugsstufe, so erhält ma ee k m-kotgeztafel. Im Fall k m wrd daraus ee so geate Verfeldertafel, we dem achfolgede Bespel: Bespel: Wr betrachte achstehede Date über de bede Merkmale Geschlecht ud Rauchgewohhete eer Gruppe vo 69 Studete. Lässt dese Stchprobe ee Aussage über Abhäggket oder Uabhäggket der bede Merkmale zu? Raucher Nchtraucher mälch 9 0. 39 weblch 0 0. 30. 9. 40 69 Im Allgemee köe de bede Merkmale atürlch auch mehr als zwe verschedee Merkmalsauspräguge aufwese. Betrachtet ma de Merkmale X ud Y mt de Auspräguge a, a,..., a k bzw. b l, b,..., b m, so kommt ma auf ee Kotgeztafel der folgede Gestalt:

3 Bvarate ud Multvarate Verfahre 9 a a a a k b k. b k. b j j j j kj. j b m m m m km.m... k. De Tabelle ethält de Besetzugszahle j für alle möglche Merkmalskombatoe sowe de absolute Radhäufgkete. (Zelesumme) für das Merkmal X ud.j (Spaltesumme) für das Merkmal Y. Dvso durch de Gesamtzahl aller Beobachtuge lefert schleßlch de relatve Radhäufgkete h bzw. h..j...j Uter der Aahme, dass de Merkmale X ud Y voeader uabhägg sd, köe daraus mt Hlfe des Multplkatossatzes für uabhägge Eregsse de erwartete absolute Häufgkete j * gemäß..j.. j j* h. h.j berechet werde. De beobachtete Häufgkete j ud de erwartete Häufgkete j * blde u de Grudlage für de Überprüfug auf Uabhäggket eer Kotgeztafel (χ -Uabhäggketstest): Getestet wrd de Nullhypothese H 0, de bede Merkmale X ud Y sd voeader uabhägg, gege de Alteratve, X ud Y sd voeader abhägg. Dazu bldet ma aus de beobachtete ud de erwartete Häufgkete de Testgröße TG ( *) j j,, j j * welche uter H 0 aäherd χ -vertelt st, wobe de Azahl der Frehetsgrade FG durch de Größe der Kotgeztafel gemäß FG (k ) (m ) (Azahl der Zele ) (Azahl der Spalte ) bestmmt st. Be eer Verfeldertafel glt also sbesodere FG. Da ee zuehmede Dskrepaz zwsche de beobachtete ud de erwartete Häufgkete stets ee Vergrößerug der Testgröße zur Folge hat, wrd der Test esetg durchgeführt, wobe große Werte vo TG für ee Abhäggket der bede Merkmale sgfkat sd. Bespel (Fortsetzug): Wäre de Merkmale Geschlecht ud Rauche obger Tabelle uabhägg ud das st gerade de Nullhypothese H 0, so müsste de da erwartete Häufgkete *, *, * ud * folgedermaße aussehe: * (. /)(. /).. / 39 9 / 69 6,4,

3 Bvarate ud Multvarate Verfahre 30 usw. Isgesamt ergebe sch de achsteheder Tabelle zusammegefasste beobachtete ud erwartete absolute Häufgkete: Raucher Nchtraucher mälch 9 0. 39 * 6,4 *,6 weblch 0 0. 30 *,6 * 7,4. 9. 40 69 Wähle wr weder α 0,05 ud ermttel de krtsche Wert c aus F(c) 0,95 für de χ - Vertelug mt eem Frehetsgrad gemäß c 3,84. Nu bereche wr de Testgröße ( ) ( ) ( ) ( ) TG + + + * * * * * * * * (9 6, 4) (0, 6) (0, 6) (0 7, 4) + + + 6, 4,6,6 7, 4,64. Wege TG < c wrd de Nullhypothese bebehalte, d.h., aus dem vorlegede Datemateral ka kee sgfkate Abhäggket zwsche Geschlecht ud de Rauchgewohhete abgeletet werde. 3. Regressos- ud Korrelatosaalyse Im folgede Abschtt wolle wr de Zusammehag zwsche zwe quattatve Größe, etwa X ud Y utersuche. De Regressosaalyse wrd agewedet, we der formelmäßge Zusammehag zwsche X ud Y bestmmt ud Werte des ee Merkmals zu gegebee Werte des adere Merkmals vorhergesagt bzw. geschätzt werde solle. I der Korrelatosaalyse hgege wrd de Stärke des Zusammehags zwsche de bede Varable beurtelt. Leare Regressosaalyse Wr betrachte zwe quattatve Größe X ud Y, be dee de Werte des ee Merkmals X ursprüglch bekat oder vorgegebe sd, währed de Werte des zwete Merkmals Y vo dese we auch mt zufallsbedgte Schwakuge abhäge möge. Be desem Modell (auch Modell I der Regressosaalyse geat) st also Y ee Zufallsvarable ud wrd als Zelgröße agesehe, währed X ee Eflussgröße darstellt. Bespel: Ee Supermarktkette möchte de Zusammehag zwsche der Verkaufsfläche ud dem Umsatz hrer Flale utersuche. Aus eer Stchprobe vo zwölf Flale see jewels de Verkaufsfläche X ( 000 m ) sowe der Jahresumsatz Y ( Mll. ) gegebe.

3 Bvarate ud Multvarate Verfahre 3 Verkaufsfläche X ( 000 m ) 0,55 0,4 0,48,9 0,94 Jahresumsatz Y ( Mll. ) 3,5,5 3,6 7,68 5,77 0,78,49,,9, 0,98 0,3 4,33 8,35 7,0 7,0 6,85 5,7,93 Wr stelle de Wertepaare (, y ),...,(, y ) zuächst eem Korrelogramm dar ud erkee, dass der Zusammehag zwsche de bede Varable recht gut durch ee leare Fukto beschrebe werde ka. Flalumsatz Abhäggket vo der Verkaufsfläche 0 9 8 7 6 5 4 3 y 5, + 0,6057 0 0 0, 0,4 0,6 0,8,,4,6 Dejege Gerade, de dese Zusammehag (m S des Przps der kleste Quadrate) am beste erfasst, heßt emprsche Regressosgerade vo Y bezüglch X ud lässt sch allgeme darstelle der Form y a + b. Zur Berechug der Kostate a ud b bestmmt ma aus der Stchprobe zuächst de arthmetsche Mttelwerte ud y, de Varaz s der -Werte sowe de Kovaraz s ( )(y y) y y y. Damt ergebe sch der so geate emprsche Regressoskoeffzet b gemäß ud de Regressoskostate a aus s b s y a y b.

3 Bvarate ud Multvarate Verfahre 3 Für de Date aus obgem Bespel bereche wr u sukzessve 0,89, y 5,5, s 0,78 ud s y 0,903. Somt erhalte wr b s y / s 5, ud a y b 0,6. De Regressosgerade st also durch de Glechug y 0,6 + 5, bestmmt ud ebefalls obger Abbldug dargestellt. Se erlaubt es, zu eer vorgegebee Ausprägug des Merkmals X ee Näherugswert y des Merkmals Y zu fde, d.h., zu eer bestmmte Verkaufsfläche eer Flale de erwartete (durchschttlche) Jahresumsatz azugebe. Nebe deser re deskrptve Auswertug eer zwedmesoale Stchprobe solle u de vorlegede emprsche Date dazu verwedet werde, de Zusammehag zwsche de Merkmale X ud Y jeer Grudgesamthet zu utersuche, aus der de Stchprobe stammt. Dazu st es otwedg, e geegetes mathematsches Modell aufzustelle. Wr ehme a, dass für jede feste Wert vo X de Varable Y ee ormalvertelte Zufallsvarable mt Mttelwert µ() α + β ud (vo uabhägger) Varaz σ st, d.h. Y() α + β + E(), wobe de Zufallsvarable E() de Abwechug vo Y() vo der Regressosgerade beschrebt ud für alle gemäß N(0, σ ) vertelt st. I desem Modell bezeche wr de Gerade y α + β als Regressosgerade der Grudgesamthet. Se st das theoretsche Gegestück zur obe erwähte emprsche Regressosgerade ud gbt zu jedem -Wert de etsprechede Mttelwert µ() E(Y()) der Varable Y() a. Usere Aufgabe besteht u dar, geegete Schätz- ud Testverfahre für de ubekate Parameter α, β, µ(), σ ud Vorhersagetervalle für de Fuktoswerte Y() zu etwckel. Ist u ee zwedmesoale Stchprobe (, y ),,(, y ) vom Umfag gegebe, so ka gemäß userem Modell jeder Wert y als Realserug eer Zufallsvarable Y Y( ) aufgefasst. Ferer köe der Mttelwert ud de Varaz s der -Werte ud damt de Stchprobefuktoe Y Y, Sy Y Y, Sy Y Y, S B, A Y B s y berechet werde, welche ach Esetze der kokrete Stchprobewerte zu de emprsche Größe y, s y, s y, a ud b führe. De Stchprobefuktoe A ud B sd, we ma zege ka, erwartugstreue Schätzfuktoe für α ud β. Somt erhält ma de Puktschätzuge ˆα a, ˆβ b ud folglch ˆµ () a + b, d.h., de Werte der emprsche Regressosgerade schätze zu vorgegebeem Wert vo X de Erwartugswert des Merkmals Y(). Als Schätzfukto für de Restvaraz σ schleßlch verwedet ma ( ) S (Y A B ) S BS. y y De gesuchte Itervallschätzuge ud Testverfahre habe hre theoretsche Grudlage folgedem Resultat:

3 Bvarate ud Multvarate Verfahre 33 Uter de egags getroffee Aahme ees leare Regressosmodells sd de Verteluge der Zufallsvarable TG 4 A α S + ( )s B β TG ( )s S A + B µ () TG3 ( ) S + ( )s TG Y() (A + B) ( ) S + + ( )s sämtlche durch ee t-vertelug mt Frehetsgrade gegebe. Ferer st de Varable χ -vertelt mt Frehetsgrade. TG ( )S σ 5 Wr sd u der Lage, sämtlche der egags erwähte Schätz- ud Testverfahre durchzuführe. So köe z.b. Kofdeztervalle für de Regressoskostate α ud de Regressoskoeffzet β der Grudgesamthet bestmmt werde, etsprechede Tests durchgeführt werde, usw. Als e Bespel uter vele Möglchkete soll e Kofdeztervall für de Mttelwert µ() E(Y()) sowe für de Ezelwert Y() aus de obge Date bestmmt werde. Bespel (Fortsetzug): Für de Date über de Jahresumsatz eer Supermarktflale Abhäggket vo dere Verkaufsfläche (Stchprobeumfag ) soll e Kofdeztervall für de Regressosgerade ud e Vorhersagetervall für de Jahresumsatz gefude werde. Wr verwede dazu de Testgröße TG 3 ud TG 4, welche bede t-vertelt mt 0 Frehetsgrade sd. Wählt ma zur Kofdezzahl γ das ( + γ)/-quatl c der t-vertelug gemäß F(c) ( + γ)/, da glt mt Wahrschelchket γ, dass TG 3 c. Formt ma dese Uglechug ach µ() um, so erhält ma ach kurzer Rechug mt a + b - µ() a + b + sy bsy c ( ) ( ) cs + + ( )s s. Das st das gesuchte γ-kofdeztervall für de Mttelwert µ(), also für de ubekate Regressosgerade α + β zu vorgegebeem Wert. Aalog ergbt sch uter Verwedug vo TG 4

3 Bvarate ud Multvarate Verfahre 34 mt a + b - y() a + b + sy bsy c ( ) ( )( + ) ( ) cs + + + ( )s s ud damt e γ-kofdeztervall für ee Ezelwert Y() zu vorgegebeem Wert. Für γ 0,95 etwa st c,8 (laut t-vertelug mt 0 Frehetsgrade) ud wr erhalte mt obge Date als Kofdeztervall für de Mttelwert mt 0,6 + 5, () µ() 0,6 + 5, + () ( 0,89) 0, 74 0,967 +. 0,78 Isbesodere ergbt sch m Pukt 0,5, also für ee Verkaufsfläche vo 500 m e mttlerer Jahresumsatz zwsche,85 ud 3,58 Mll. Euro, währed der Jahresumsatz selbst be eer Flale deser Größe m etwas größere Berech vo,4 bs 4,0 Mll. Euro lege wrd. De achfolgede Abbldug zegt ochmals de emprsche Regressosgerade zusamme mt dem etwas egere Kofdezberech für de ubekate Erwartugswerte sowe dem etwas wetere Schätzberech für de ubekate Ezelwerte. Flalumsatz Abhäggket vo der Verkaufsfläche Regressosgerade ud Kofdezberech für Mttelwerte ud Ezelwerte 0 9 8 7 6 5 4 3 y 5, + 0,6057 0 0 0, 0,4 0,6 0,8,,4,6 De Ermttlug eer Regressosgerade st allerdgs ur da svoll, we sch m Korrelogramm tatsächlch e aäherd learer Zusammehag ud cht etwa e deutlcher Kurveverlauf zegt. Da wäre uter Umstäde e Verfahre der chtleare Regresso zelführed. Vo großer praktscher Bedeutug st schleßlch de multple

3 Bvarate ud Multvarate Verfahre 35 Regressosaalyse, be der de Abhäggket eer Zelgröße vo vele Eflussgröße utersucht wrd. Korrelatosaalyse Im Gegesatz zum Regressosmodell sd u de de zwe quattatve Merkmale etsprechede Varable X ud Y bede Zufallsvarable ud stehe eader glechberechtgt gegeüber. Nehme wr a, dass de Varable X ud Y mt eer Stchprobe (,y ), (,y ),..., (,y ) vom Umfag erhobe wurde. Ee Beurtelug des Zusammehages zwsche de bede Größe ermöglcht der emprsche Korrelatoskoeffzet r, der als Maß für de Kovarabltät der bede Merkmale agesehe werde ka; er gbt de Grad der Leartät des Zusammehages zwsche de beobachtete Größe a ud wrd we folgt berechet: s y r. s s Dabe bedeute s ud s y de Stadardabwechuge der - bzw. y-werte, s y st de Kovaraz ud es glt stets r. Bespel: I der achstehede Tabelle sd de Prüfugslestuge vo 0 FH- Studerede Abhäggket vo dere Lestuge de Übuge agegebe. Wr frage ach der Güte des leare Zusammehages zwsche Prüfugs- ud Übugslestug ud bereche dazu de emprsche Korrelatoskoeffzete r. y Übugsbespele (Prozetsatz) Abschlussprüfug (Pukte vo 00) 78 6 53 9 7 8 98 67 6 86 67 58 35 85 49 60 8 64 54 78 Prüfugslestuge bem Abschlusstest Abhäggket vom Prozetsatz der Übugsbespele 00 80 Abschlussprüfug 60 40 0 0 40 50 60 70 80 90 00 Übugsbespele

3 Bvarate ud Multvarate Verfahre 36 Um ee ugefähre Vorstellug über de Zusammehag zwsche de - ud y-werte zu gewe, zeche wr de zeh Wertepaare e Korrelogramm (sehe Abbldug). Deses vermttelt de Edruck, dass e aäherd learer Zusammehag zwsche de Größe X ud Y besteht. Das bestätgt auch de Berechug des Korrelatoskoeffzete, welche mt s 4,48, s y 5,44 ud s y 99, schleßlch de Wert r 0,895 ergbt. Zur Beurtelug des emprsche Korrelatoskoeffzete, also zur Kostrukto ees Kofdeztervalls bzw. zur Durchführug ees Tests für de Korrelatoskoeffzete st u e mathematsches Modell eer geegete Grudgesamthet erforderlch. Wr setze daher voraus, dass de Varable X ud Y eer zwedmesoale Normalvertelug geüge. A de Stelle des emprsche Korrelatoskoeffzete trtt u der Korrelatoskoeffzet ρ der Grudgesamthet, der de leare Zusammehag zwsche X ud Y azegt. Wederum glt ρ. Sd de Varable X ud Y uabhägg, so folgt ρ 0. Adersets sd X ud Y geau da lear abhägg, we ρ st. Es st aheleged, de Korrelatoskoeffzete ρ der Grudgesamthet durch de emprsche Korrelatoskoeffzete r eer Stchprobe zu schätze. Somt erhalte wr de Puktschätzug ˆρ r. Deke wr us de Beobachtuge eer Stchprobe (,y ),..., (,y ) als Realseruge vo Zufallsvarable (X, Y ) alle mt derselbe Vertelug ud betrachte de aalog zum emprsche Korrelatoskoeffzete r deferte Stchprobefukto R X Y XY X X Y Y mt de Stchprobemttle X ud Y. Da st, we ma zege ka, de Zufallsvarable + R Z l R asymptotsch ormalvertelt mt dem Mttelwert bzw. der Varaz + ρ ρ µ Z l +, σ Z ρ ( ) 3 (z-trasformato vo Fsher). De Kets deser Vertelug bldet de Grudlage für Itervallschätzuge ud Testverfahre für de Grad des leare Zusammehags zwsche de bede Merkmale. Zur Überprüfug der Uabhäggket der Merkmale gbt es jedoch ee efachere ud zudem eakte Test. Für de Test der Hypothese ρ 0 für de Korrelatoskoeffzete ρ der Grudgesamthet bldet ma de Prüfgröße TG R R, de uter obger Voraussetzug eer t-vertelug mt Frehetsgrade folgt. Be zwesetger (bzw. esetger) Testvarate mt der Nullhypothese H 0 : ρ 0 (bzw. H 0 : ρ 0) bestmmt ma we üblch zu vorgegebeer Sgfkazzahl α de krtsche Wert c als

3 Bvarate ud Multvarate Verfahre 37 ( α/)-quatl (bzw. ( α)-quatl der t-vertelug mt Frehetsgrade. Daach berechet ma de Korrelatoskoeffzete r aus der Stchprobe ud schleßlch de Wert TG obger Teststatstk. Ist c TG c (bzw. TG c bem esetge Test auf Überschretug), so wrd de Hypothese ageomme, aderfalls wrd se verworfe. Bespel (Fortsetzug): Im Bespel über de Zusammehag zwsche Übugs- ud Prüfugslestuge vo Studerede teste wr ahad der Nullhypothese H 0 : ρ 0, ob de betrachtete Merkmale uabhägg sd oder cht. Ablehug vo H 0 bedeutet also, dass zwsche de Merkmale ee leare Abhäggket besteht. Für de emprsche Korrelatoskoeffzete der gegebee Stchprobe vom Umfag 0 habe wr de Wert r 0,895 erhalte. Damt bereche wr de Testgröße 0 TG 0,895 5,57. 0,895 E Blck auf de t-vertelug mt FG 0 8 Frehetsgrade zegt, dass das errechte Sgfkazveau deutlch uter 0,% legt. (Der krtsche Wert c für α 0,00 beträgt c 4.50.) De Nullhypothese wrd daher verworfe, e learer Zusammehag zwsche bede Merkmale ka als statstsch geschert betrachtet werde. Zur Utersuchug der Zusammehäge zwsche mehr als zwe quattatve Merkmale dee de multple ud partelle Korrelatoe. Mt dem multple Korrelatoskoeffzete r z.y etwa wrd der Zusammehag zwsche eer (Zel)Größe Z ud eer Gruppe vo (Efluss)Größe X ud Y beschrebe. Der partelle Korrelatoskoeffzet r y.z dagege erlaubt de Beurtelug des Zusammehags zwsche de bede Merkmale X ud Y, achdem der Efluss der Größe Z ausgeschaltet wurde. Etspreched sd de Korrelatoskoeffzete m allgemee Fall für mehr als dre Varable erklärt. 3.3 Wetere multvarate Verfahre Im Folgede soll e gaz kurzer Überblck über wetere multvarate Verfahre gegebe werde. Im Gegesatz zur uvarate Statstk geht es be de multvarate Verfahre erster Le darum, durch smultae Betrachtug mehrerer Varabler eue Eschte über de Bezehuge zwsche de Varable oder de Utersuchugsehete zu gewe. Dese Verfahre sd allesamt sehr date- ud rechetesv ud werde der Pras ausschleßlch uter Beutzug eschlägger Statstksoftware durchgeführt. Varazaalyse: Im efachste Fall st de Varazaalyse (efaktorelle Varazaalyse) ee Verallgemeerug des t-test zum Lageverglech vo mehr als zwe uabhägge Stchprobe. Hägt de utersuchte quattatve Varable cht ur vo eer qualtatve Grupperugsvarable soder vo mehrere Faktore ab, so st ee mehrfaktorelle Varazaalyse erforderlch. Multple Regresso ud Korrelato: Her wrd der Efluss vo mehrere quattatve Zelgröße auf ee quattatve Eflussgröße utersucht ud formelmäßg beschrebe. Be der Korrelato geht es um de Stärke des Zusammehags. Allgemees leares Modell: Deses st ee Kombato aus Varazaalyse ud Regressosaalyse. Utersucht wrd der Efluss mehrerer Größe auf ee

3 Bvarate ud Multvarate Verfahre 38 quattatve Zelgröße. De Faktore, d.h. de Eflussgröße köe dabe sowohl quattatv als auch qualtatv se. Clusteraalyse: Se det zur Strukturerug der Mege der Utersuchugsehete (Objekte). Dabe werde de ezele Objekte auf Grud vo hre Dstaze eem mehrdmesoale Merkmalsraum zu Gruppe zusammegefasst. Hauptkompoete- ud Faktoreaalyse: Her stehe de Bezehugsstrukture zwsche de Varable m Vordergrud. Be der Hauptkompoeteaalyse wrd de Zahl der Varable verrgert, dem ma zu ege wchtge, so geate Hauptkompoete übergeht ud de adere Varable weglässt. Be der Faktoreaalyse wrd versucht, de Varato der Ausgagsvarable durch Zusammefassug vo Varable zu ege wege so geate Faktorvarable zu erkläre. Dskrmazaalyse: Ist de Mege der Utersuchugsehete Gruppe gegledert, so versucht ma der Dskrmazaalyse eersets, Uterschede zwsche de Gruppe mt Hlfe vo so geate Dskrmazvarable zu beschrebe. Adersets möchte ma eue Utersuchugsehete, dere Gruppezugehörgket cht bekat st, eer der Gruppe zuorde.