Als lineare Regressionsaufgabe, d. h., Regression von Y auf X, ergibt sich nun:
|
|
- Fabian Simen
- vor 6 Jahren
- Abrufe
Transkript
1 5 Regression Oft interessiert uns der Zusammenhang zwischen zwei Merkmalen X und Y einer Einheit, etwa, wie Gewicht und Größe von Menschen voneinander abhängen. Einfach zu sagen, je größer, desto schwerer genügt wohl nicht, obwohl dies eine Hypothese sein könnte. Der einfachste Zusammenhang, den wir kennen, ist der lineare, d. h., eine Größe wächst oder fällt linear mit der anderen, etwa Y = a + bx. Als lineare Regressionsaufgabe, d. h., Regression von Y auf X, ergibt sich nun: (X, Y ) gemeinsame Verteilung Finde Konstanten a und b so, dass E(Y (a + bx)) minimal ist. Wir sprechen von Einfachregression, im Unterschied zur multiplen oder Mehrfachregression, bei der die Beziehung zwischen drei oder mehr Variablen erklärt werden soll. Bemerkung 5.1 Die Lösung der Regression erhalten wir durch folgende Optimierungsaufgabe a E(Y (a + bx)) = = E(Y (a + bx)) = 0 E(Y ) a be(x) =0 a + be(x) =E(Y ) (I) b E(Y (a + bx)) = = E(X(Y (a + bx))) = 0 E(X Y ) ae(x) be(x )=0 ae(x)+be(x )=E(XY ) (II) ae(x)+b[e(x)] = E(X) E(Y ) b[e(x ) [E(X)] ]=E(X Y ) E(X) E(Y ) (I) E(X) (II) (I) Lösung: b = Cov(X, Y ) Var(X) a = E(Y ) Cov(X, Y ) E(X) Var(X) Die Gleichungen (I) und (II)heißenauchNormalengleichungen. Bemerkung 5. (MSE) Wir sprechen auch davon, dass die Summe der Abweichungsquadrate minimiert wird, d. h., der sogenannte MSE (mean square error) wird minimiert. Daher sprechen wir auch von der sogenannten Least squares-approximation. Definition 5.1 (Regression) Sind X und Y identisch verteilt, so ist die Regressionsgerade Ŷ = a + bx 1
2 gegeben durch den Regressionskoeffizienten b = b Y ;X (regression coefficient) und den Interzept a = a Y ;X (intercept). X heißt auch unabhängige Variable, Regressor oder erklärende Variable, Y abhängige Variable, Regressand oder zu erklärende Variable. b = b Y ;X = Cov(X, Y ) Var(X) a = a Y ;X = E(Y ) Cov(X, Y ) E(X). Var(X) Die Ŷ heißen Vorhersagen (predicted values). Die Fehler e i = Ŷi Y i heißen Residuen (es gilt: n e i =0). Für eine mögliche Implementation ist wieder die Vektorschreibweise sinnvoll: x =(x 1,...,x n ) t, y =(y 1,...,y n ) t und x = x x 1I, ỹ = y y 1I b Y ;X = xt ỹ x, a Y ;X = y bx. Beispiel 5.1 (Größe und Gewicht) Größe X X = 17 Gewicht Y Y = 75 X Var(X) =53.5 Ỹ Var(Y ) = Cov(X, Y ) = 4 1 (( 1)( 3) + ( 4)( 15) + (10)(1) + (4)(8) + ( 9)( )) = = 58.5 Corr(X, Y ) = = ρ XY = Corr(X, Y ) = b Y ;X = = und a Y ;X = = Ŷ = X
3 Abb. 1: Regressionsgerade, Erklärung siehe Text Wenn wir nun die Regressionsgerade betrachten, fällt uns auf, dass 0= X, d. h., bei einer Größe von cm würden 0 kg als Gewicht vorausgesagt! Wir sehen also, dass dies nicht stimmen kann. Einerseits liegen für die lineare Regression in diesem Bereich keine Daten vor, d. h., wir haben extrapoliert, etwas das bei der Regression meistens nicht funktioniert, andererseits muss der Trend der Daten nicht linear sein. Im Abschnitt 5.1 werden wir darauf näher eingehen, indem wir Vertrauensbereiche für die Schätzungen berechnen und kurz die Residualanalyse betrachten. Beispiel 5. (Breakdown) Betrachten wir den einfachen Datensatz X Y so ist der lineare Zusammenhang Ŷ =0+1 X offensichtlich. 3
4 Abb. : Breakdown bei Regression Verändern wir jedoch nur einen Wert, X Y so erhalten wir die völlig andere Regressionsgerade Ŷ =3.+0. X. Wir sprechen von einem sogenannten Regression Breakdown, oder davon, dass die lineare Regression einen Breakdown Wert von 1 hat, oder, mit n, einen Breakdown Wert von 0 % hat. Es n genügt also ein einziger falscher Wert, um die Regression zusammenbrechen zu lassen. Wir betrachteten bisher die Regression von Y auf X. Wir können natürlich auch die Rollen von erklärender Variable x und zu erklärender Variable y vertauschen, und die Regression von X auf Y betrachten. Beispiel 5.3 (Größe und Gewicht) Vertauschen wir nun die Regressionsvariablen, belassen aber die Bezeichnungen, so erhalten wir: b X;Y = =0.54 und a X;Y = = und damit X = Y oder Y = X =1.914 X Beide Regressionsgeraden gehen durch den Schwerpunkt (X,Y ). 4
5 (17,75) Abb. 3: Regression von Y auf X (dünn) und umgekehrt (dick). Die Gerade passt anscheinend besser zu den Werten. Aus b Y ;X b X;Y = Cov(X, Y ) Cov(X, Y ) = [Corr(X, Y )] Var(X) Var(Y ) folgt, dass die Korrelation das geometrische Mittel aus den beiden Regressionskoeffizienten ist, d. h., Corr(X, Y ) = by ;X b X;Y. Weiters ist Var(X) b Y ;X = Corr(X, Y ) Var Y d. h., aus der Korrelation kann der Steigungsparameter b Y ;X der Regression geschätzt werden. Die Korrelation Corr(X, Y ) wird im Zusammenhang mit der Regression oft auch Korrelationskoeffizient genannt und mit ρ oder ρ XY bezeichnet. (Yi B XY = ρ = Corr (X, Y )= Ŷi) (Yi Y ) = s Ŷ s Y ist dann das Bestimmtheitsmaß (coefficient of determination), das 0 ist, falls kein Zusammenhang zwischen den Variablen besteht, und 1, falls ein linearer Zusammenhang besteht. ρ = 0 bedeutet, dass die Regressionsgeraden für ŷ und x achsenparallel sind und normal aufeinander stehen, ρ =1,dassdieseübereinstimmen, und 0 <ρ < 1, dass diese eine Schere bilden (siehe Beispiel 5.3). ρ = Corr ist der Cosinus des Winkels α, den die beiden Geraden zueinander haben. Interpretation: ρ = 1 n (Y i Y ) 1 (Y i n Ŷi) = 1 (Y i Y ) n Var(Y ) σ Ŷ Var(Y ) 5
6 gibt den Anteil der Varianz von Y an, der durch die Regressionsbeziehung erklärt wird. Der unerklärte Teil (Residualteil) der Varianz ist 1 ρ = 1 n 1 n (Y i Ŷi) = (Y i Y ) σ Ŷ σ Y. Bemerkung 5.3 Um die Nachteile der linearen Regression bezüglich des MSE zu umgehen, gibt es verschiedene andere Regressionsverfahren, die auf einer geraden (symmetrischen) Funktion r(x) basieren und i r(e i) minimieren. Es seien nur RM-Schätzer (repeated median), LMS- Schätzer (least median of squares) oder LTS-Schätzer (least trimmed squares) genannt, die alle einen Breakdown Wert von 50 % haben, d. h., selbst dann noch funktionieren, wenn fast die Hälfte der Datensätze falsch ist. Bemerkung 5.4 Viele Größen haben keinen linearen Zusammenhang, etwa Geschwindigkeit und Bremsweg (quadratischer Z.). Hier helfen wir uns, indem wir zuerst die Variablen so transformieren, dass ein linearer Zusammenhang möglich ist (etwa logarithmieren der Daten bei exponentiellen Wachstumsprozessen), dann eine lineare Regression durchführen, und das Ergebnis rücktransformieren. Folgende Tabelle enthält einige Transformationen, die notwendig sind, um ŷ = a + bx über die entsprechend transformierten Variablen y und x und die zu diesen gehörigen Regressionskoeffizienten a und b aus ŷ = a + b x zu berechnen (Quellen [?,?]). Zusammenhang Transformation Rücktransformation y = x = a = b = y = a + x b y 1 x a b y = b + a 1 x y x b 1 a a y = a bx y x a b y = a + x x bx y x a b y = ab x log y x log a log b y = ax b log y log x log a b y = ae bx log y x log a b y = ae b/x log y 1 x log a b y = 1 1 a + be x y exp x a b y = a + bx n y x n a b 6
7 5.1 Test der Regressionsparameter Nach einer kurzen Wiederholung der Einfachregression und einer leichten Erweiterung der Notation dieses Schätzers werden wir die geschätzten Parameter testen und Konfidenzintervalle für diese angeben und berechnen. Wir haben Werte Y 1,...,Y n N(a + bx i,σ ) i.i.d., d. h., Ŷ = a + bx. Wir kennen bereits die folgenden Schätzwerte für die unbekannten Parameter Regressionskoeffizient b und Interzept a b = by,x = Cov(Y,X) Var(X) = (Y i Y )(X i X) (X i X) â = a Y,X = Y b Y,X X = E(Y ) Cov(X, Y ) Var(X) E(X) Außerdem kennen wir den Korrelationskoeffizienten ρ = ρ X,Y bzw. das Bestimmtheitsmaß ρ (siehe Seite 5). Cov(Y,X) ρ Corr(X, Y )=. Var(Y ) Var(X) Als Schätzer erhalten wir ρ = (Y i Y )(X i X) n (Y i Y ) (X i X) Die Regressionsparameter Es wird angenommen, dass die Residuen e i unabhängig nach N(0,σ ) verteilt sind. Dann sind auch â N(a, σ a) und b N(b, σ b ) normalverteilt. Der Schätzer für die Varianz der Residuen ist s e = 1 n (Y i Ŷ ) = 1 n (Y i a bx i ) 7
8 Bemerkung 5.5 Aus s e können wieder die Parameter â und b berechnet werden. s e b = X i (Y i a bx i )=0 â = Y bx s e a = (Y i a bx i )=0 b = (X i X)(Y i Y ) (Xi X) Ein Konfidenzintervall für σ ergibt sich zu Î =[ (n )s e χ ; (n )s e n,1 α/ χ ]. n,α/ Die Varianz der Residuen hängt wiederum mit dem Bestimmtheitsmaß zusammen. Theorem 5.1 Es gilt: s e = σ =[1 ρ 1 ] n (Y i Y ) Beweis. ˆσ = 1 n = 1 n = 1 n = 1 n = 1 n (Y i Ŷi) = 1 (Y n i â bx i ) [Y i Y b(x i X)] (Y i Y ) (Y i Y )(X i X)+ 1 (Y i Y ) n b n n (Y i Y ) [1 ρ ] [ n (Y i Y )(X i X)] (X i X) + 1 n n b n (X i X) [ n (Y i Y )(X i X)] (X i X) Wir wollen nun testen, ob überhaupt ein Zusammenhang zwischen den Zufallsvariablen X i und Y i besteht, oder ob diese unabhängig sind. Dazu testen wir, ob der Regressionskoeffizient b signifikant von 0 verschieden ist oder nicht. H 0 : b =0 H A : b 0 Var(X) Da b = ρ Var(Y ist, können wir für dieses Problem denselben Test wie für das Prüfen ) auf Unabhängigkeit verwenden (F -Test). 8
9 F -Test auf Unabhängigkeit (verb. Stichproben) Seien (X 1,Y 1 )...(X n,y n ) Paare von Beobachtungen, wobei die X i N(µ X,σX ) und die Y i N(µ Y,σY ) jeweils i.i.d. sind. Der Korrelationskoeffizient ρ XY = Corr(X, Y )= (Xi X)(Y i Y ) (Xi X) (Yi Y ) = Cov(X, Y ) Var(X) Var(Y ) hängt nicht mehr von µ 1,µ,σ 1,σ,sondernnurmehrvonn ab. Wie sieht die Verteilung von ρ =cosβ aus? Dazu führen wir die Cotangenstransformation β 1I cos β sin β = 1 cos β cot β = cot(arccos ρ) = cos β 1 cos β = ρ 1 ρ durch. Theorem 5. Falls X i und Y i unabhängig sind, so gilt: ρ n t(n ) Verteilung 1 ρ oder (n ) ρ 1 ρ F (1,n ) Verteilung Daraus entwickeln wir den F -Test auf Unabhängigkeit der beiden Stichproben F -TEST auf Unabhängigkeit Voraussetzung: X 1,...,X n N(µ x,σx ) i.i.d. Y 1,...,Y n N(µ y,σy ) i.i.d. ρ Testgröße: T =(n ) 1 ρ F (1,n ) Hypothesen: H 0 : X i, Y i unabhängig, H A : X i, Y i abhängig H 0 ablehnen, falls T>F 1,n 1;1 α 9
10 Wir testen also, ob der Regressionskoeffizient b signifikant von 0 verschieden ist oder nicht. H 0 : b =0 H A : b 0 Unsere Testgröße ist: T = ρ n t(n ) oder T =(n ) 1 ρ F (1,n ) 1 ρ ρ H 0 wird abgelehnt, falls T>t n,1 α oder T >F 1,n ;1 α. Eine andere Methode stützt sich direkt auf die Verteilung des Regressionskoeffizienten. Sie dient auch gleichzeitig dazu, ein Konfidenzintervall für b anzugeben. Regressionskoeffizient b Varianz s b = s 1 e (Xi X) Testgröße Kritischer Wert Konfidenz-I. b b0 s b t(n ) zweiseitig: c α = t n,1 α einseitig: c α = t n,1 α Î =[ b s b t n,1 α ; b + s b t n,1 α ] Interzept a Varianz Testgröße Kritischer Wert Konfidenz-I. X s a = s i e n (X i X) â a 0 s a t(n ) zweiseitig: c α = t n,1 α einseitig: c α = t n,1 α Î =[â s a t n,1 α ; â + s a t n,1 α ] Ein äquivalenter zweiseitiger Test für den Interzept gegen 0 ist folgender H 0 : a =0 H A : a 0 Mit der F -verteilten Testgröße T = nâ s a F (1,n ) der sich direkt aus obigem zweiseitigen Test ableitet. H 0 wird abgelehnt, falls T>F 1,n ;1 α ist. Beispiel 5.4 (Düngemittel) Zusammenhang zwischen Düngemitteleinsatz X und Ertrag Y 10
11 X i Y i X i X Y i Y X =5. Y =8.0 Var(X) =0.895 Var(Y )=0.115 (Xi X) =3.58, (Y i Y ) =0.46 (Xi X)(Y i Y )=( ) = 1.15 Cov(X, Y )=0.875 ρ = 1.15 = ρ = = b = = =0.31 a = =6.396 Die Regressionsgleichung lautet daher Ŷ = X X i Y i Ŷ i e i = Y i Ŷi Die Summe der Residuen Y i Ŷi muss gleich 0 sein, Rundungsungenauigkeiten können aber auftreten. Die Varianz der Residuen ist s e = 1 3 (Yi Ŷi) = Wir testen, ob b =0 T = ρ n = =3.46 <t 3;0.99 =4.5404, 1 ρ daher kann H 0 nicht abgelehnt werden, d. h., b ist nicht signifikant von 0 verschieden, es ist daher anzunehmen, dass X i und Y i unabhängig sind. Wir testen nun, ob a =0: T =5 (6.396) = 13064, 94 F 1,3;0.99 =34.116, daher wird H 0 abgelehnt. a ist hochsignifikant von 0 verschieden. 11
12 Abb. 4: Spreadsheet: Lineare Einfachregression 5.1. Prognoseintervalle Wie wir Konfidenzintervalle für die Regressionsparameter angeben können, so können wir auch Konfidenz- und Prognoseintervalle für die Prognosen angeben. Prognoseintervall für Y 0 : Konfidenzintervall für E(Y 0 ): s Y = s e( (X 0 X) n (X i X) ) i Î = [Ŷ0 s Y t n,1 α ; Ŷ0 + s Y t n,1 α ] s EY = s e( 1 n + (X 0 X) i (X i X) ) Î = [Ŷ0 s EY t n,1 α ; Ŷ0 + s EY t n,1 α ] Wir sehen leicht, dass das Prognoseintervall für Y 0 größer ist, als das das Konfidenzintervall für E(Y 0 ). Simultanes Konfidenzintervall das zugleich an allen Stellen X 0 den Erwartungswert E(Y X 0 )vony mit der Wahrscheinlichkeit 1 α überdeckt. Y 0 ± s e F,n ;1 α ( 1 n + (X X 0) (Xi X) ) 1
13 Abb. 5: Konfidenz- und Prognoseintervalle bei der Regression Regression durch einen gegebenen Punkt Oft ist es notwendig, dass die Regressionsgerade durch einen bestimmten Punkt (X 0,Y 0 ) verläuft (oft ist dies der Ursprung). Wir wissen, dass die Regressionsgerade immer durch den Schwerpunkt (X,Y ) verläuft, wir brauchen daher in den Regressionsgleichungen nur die Koordinaten der Mittelwerte durch die des Fixpunktes zu ersetzen, um das Gewünschte zu erhalten. Wir haben daher b = (Yi Y 0 )(X i X 0 ) (Xi X 0 ) und â = Y 0 bx Residualanalyse Wir müssen überprüfen, ob unsere Annahme, dass die Residuen N(0,σ e)-verteilt sind, auch stimmt auf ihr basieren alle Tests der Parameter. Dazu bedienen wir uns standardisierter Tests. Oft genügt auch schon ein sogenannter Indexplot der Residuen die Residuen e i = Ŷ Y i werden gegen ihren Index i geplottet um zu sehen, ob die Residuen nicht normalverteilt sind, sondern dass es gewisse Regelmäßigkeiten gibt. Dies lässt auf einen anderen als einen 13
14 linearen Zusammenhang schließen. Oft hilft dann eine entsprechende Transformation der Daten. Weiters hilft der Indexplot, Ausreißer zu eliminieren. Wenn wir die standardisierten Residuen d i = e i s e verwenden, so können etwa Punkte mit d i > 3 als Ausreißer eliminiert werden, sie liegen zu weit von der Geraden weg. 14
15 5. Mehrfachregression Dieser Abschnitt wurde bereits ausführlich in der Mathematik 1 (Abschnitt Regression) behandelt und kann somit als bekannt vorausgesetzt werden. Er wird hier nur nochmals wiedergegeben, um ein vollständiges Skriptum zu liefern. Seien n Datensätze (y (i),x (i) 1,...,x (i) k ), i =1,...,n, gegeben, mit k<n,wobeidieerste Koordinate y (i) jeweils von den restlichen Einträgen, den sogenannten unabhängigen Variablen, x (i) 1,...,x (i) k abhängt. Es soll eine lineare Approximation in x (i) j gefunden werden, sodass y (i) erklärt werden kann, d. h., y (i) = β 0 + β 1 x (i) β k x (i) k, i =1,...,n, und gleichzeitig der Fehler der Approximation (Abstand von den tatsächlichen Werten) minimiert wird, d. h. [y (i) (β 0 + β 1 x (i) β k x (i) k )] min. Das ist der sogenannte kleinste Quadrate Schätzer oder die Gauss-Approximation der Daten. Wir suchen also eine Lösung des überbestimmten Gleichungssystems Xβ = y und Xβ y min mit den Bezeichnungen X =. 1 x (1) 1 x (1) k 1 x () 1 x () k... 1 x (n) 1 x (n) k β = β 0 β 1. β k y = y (1) y (). y (n). y Xβ y Xβ X-Raum 15
16 Da (Xβ y) normal auf alle Vektoren Xz im X-Raum steht, gilt Xz, (Xβ y) =(Xz) t (Xβ y) =0 und da (Xz) t = z t X t, gilt auch (z t X t )(Xβ y) =z t (X t Xβ X t y)=0. Da dies für alle z gilt, muss der zweite Faktor gleich null sein, es gilt also (X t X)β = X t y bzw. β =(X t X) 1 X t y. Bemerkung 5.6 Wir wollten Xβ = y lösen. Mit obigen Ausführungen gilt nun: und somit gilt auch Xβ = X(X t X) 1 X t y X = (X(X t X) 1 X t ) =(X(X t X) 1 X t )(X(X t X) 1 X t ) = X(X t X) 1 (X t X)(X t X) 1 X t = X(X t X) 1 X t = X. Wir sagen: y wird auf Xβ projiziert, mittels der Projektion X(X t X) 1 X t. Definition 5. Eine Projektion P erfüllt P = P und damit auch P n = P, n>0. Falls kein Designfehler (Messdaten) vorliegt, ist die (k +1) (k + 1)-Matrix (X t X) invertierbar, sodass dieses Regressionsproblem lösbar ist. Bemerkung 5.7 Das Verfahren heißt lineare Regression, weil die Koeffizienten β j Konstante sind und y (i) = β 0 + β 1 x (i) β k x (i) k eine Linearkombination von Funktionen 1 und x j,nichtjedoch die Funktionen linear sind. Im Folgenden werden wir sehen, dass statt der Funktionen x j beliebige Funktionen genommen werden können Moore-Penrose-Inverse oder Pseudoinverse Wie lösen wir das System (X t X)β = X t y? Existiert die Inverse von X t X,soistdaskeinallzugroßesProblem: β =(X t X) 1 X t y. 16
17 Da (X t X) 1 X t y das System Xβ = y im obigen Sinn (Gauss Approximation) löst, heißt die Matrix (X t X) 1 X t die Pseudoinverse zu X und wird mit X + bezeichnet. Die Pseudoinverse D + einer Diagonalmatrix D: d 1... D = d k D + = 1 d d k 0 Bei allgemeineren m n-matrizen A wird die Pseudoinverse über die sogenannte Singulärwertzerlegung (siehe später) berechnet. Definition 5.3 Sei A eine m n-matrix und ihre Singulärwertzerlegung A = UDV t. Dann ist die Pseudoinverse oder Moore-Penrose Inverse A + gegeben durch A + = VD + U t, wobei die Pseudoinverse D + der Diagonalmatrix D wie oben gebildet wird. Zur Berechnung der Singulärwertzerlegung siehe Abschnitt??. Die Pseudoinverse A + erfüllt folgende Identitäten AA + A = A, A + AA + = A +, (AA + ) t = AA +, (A + A) t = A + A. Ist die Matrix A invertierbar, so gilt A + = A Regression bezüglich beliebiger Basisfunktionen Es gebe wie oben einen funktionalen Zusammenhang y = f(x 1,...,x n )=β 0 g 0 (x 1,...,x n )+ + β k g k (x 1,...,x n ), wobei die g j bekannte Funktionen sind, und die Koeffizienten β j wie oben konstant sind. Wir wollen die Funktion f(x) =f(x 1,...,x n ) durch die bekannten Funktionen g j (x) approximieren. Durch Messung kennen wir die Funktionswerte von y (i) = f(x) anden Stellen x (i) =(x (i) 1,...,x (i) n ), i = 1,...,n. Mit den Bezeichnungen g 0 (x (1) ) g 1 (x (1) ) g k (x (1) ) β 0 y (1) g 0 (x () ) g 1 (x () ) g k (x () ) β 1 y () X =.... g 0 (x (n) ) g 1 (x (n) ) g k (x (n) ) 17 β =. β k y =. y (n),
18 analog zu oben, erhalten wir das Regressionsproblem Xβ = y und Xβ y min. Falls die Lösung existiert, ist sie wiederum gegeben durch (X t X)β = X t y bzw. β =(X t X) 1 X t y. Beispiel 5.5 Sei f(x 1,x )=β 0 + β 1 x 1 + β x + β 3 x 1 + β 4 x + β 5 x 1 x, so ist g 0 (x) =1,g 1 (x) =x 1, g (x) =x, g 3 (x) =x 1, g 4 (x) =x und g 5 (x) =x 1 x. Beispiel 5.6 Sei f(x 1,x )=β 0 + β 1 x 1 + β x und x x f(x 1,x ) und damit Es folgt somit β = β 0 β 1 β y = X = β =(X t X) 1 X t y β =
19 Aufgaben zur Regressionsanalyse 5.1 Im Rahmen einer Studie soll der Zusammenhang zwischen diastolischem Blutdruck X (mmhg) und Herzgewicht Y (g) von 10 an Gehirnblutung verstorbenen Männern geschätzt werden. X Y Berechne die Regressionsgleichung und das Bestimmtheitsmaß! Stelle die Daten graphisch dar und zeichne die geschätzte Regressionsgerade! 5. In der Grazer Universitäts-Frauenklinik wurden die Länge X und der Kopfumfang Y neugeborener Knaben gemessen. X Y a) Berechne die Regressionsgleichung! b) Teste, ob b signifikant von 0 verschieden ist! c) Berechne das Bestimmtheitsmaß! d) Berechne ein 95 % Konfidenzintervall für Y 0,wennX 0 =49! e) Berechne ein 95 % Konfidenzintervall für E(Y 0 ), wenn X 0 =49! f) Vergleiche d und e! 5.3 Nachstehende Tabelle enthält die Belastbarkeit eines Materials in Abhängigkeit seines Alters in Jahren: Belastbarkeit y Alter x a) Schätze die Regressionsgleichung y = b 1 + b x! b) Gib ein 95 % Konfidenzintervall für den Regressionskoeffizienten β an! c) Prüfe, ob der Stichprobenregressionskoeffizient b statistisch gegen Null gesichert ist (α =0.05)! d) Gib ein 95 % Konfidenzintervall für den Erwartungswert der Belastbarkeit bei einem Alter von 10 Jahren! e) Berechne den Korrelationskoeffizienten und das Bestimmtheitsmaß! 19
20 5.4 Gegeben ist eine Stichprobe folgender Wertepaare: x y a) Berechne die lineare Regressionsfunktion! b) Berechne ein 95 % Konfidenzintervall für die Steigung der Regressionsgeraden! c) Überprüfe, ob die Abweichungen von der Regressionsgeraden normalverteilt sind! 5.5 Gegeben sind folgende, an freiwilligen Versuchspersonen gemessene Daten Armlänge Beinlänge a) Berechne für die Armlänge 60 die zugehörige geschätzte Beinlänge y 60! b) Umgekehrte Regression: Berechne die zur Beinlänge y 60 (wie berechnet) gehörige Armlänge! Warum ist diese nicht gleich 60? c) Zeichne beide Regressionsgleichungen aus (a) und (b) in ein gemeinsames Schaubild! 5.6 Die folgende Tabelle zeigt, wie die Stückkosten eines bestimmten Produktes von der Menge abhängen: Menge (x) Stückkosten (y) a) Bestimme die lineare Regressionsgleichung y = a + bx! b) Wie ändern sich a und b, wenn sämtliche x-werte um 0 % erhöht und sämtliche y-werte um 5 % vermindert werden? c) Bestimme für die Regressionsgleichung y = cx zunächst die Normalengleichungen und wende diese dann auf die obigen Daten an! 0
21 5.7 Es sei x 1 die Anzahl der in Gebrauch befindlichen Autos (in Millionen), x die Anzahl der in Gebrauch befindlichen Lastwagen (in Millionen) und y der Benzinverbrauch in Millionen Barrel. Wir möchten die Regression von y auf x 1 und x ermitteln, d.h., a) Schätze a, b 1, b! b) Schätze σ! c) Schätze Var(b 1 ) und Var(b )! y = a + b 1 x 1 + b x x 1 x y Gegeben sind folgende Werte: Berechne: a) Bestimmtheitsmaß, x y b) Konfidenzintervall für die Regressionskoeffizienten der Grundgesamtheit! c) Teste in a) mit Hilfe eines t-tests die Hypothese, dass in der Grundgesamtheit kein Zusammenhang zwischen den Variablen x und y besteht! 5.9 In einer sehr kleinen Stichprobe (n = 17) korrelieren zwei quantitative Variablen mit r =0.61. Kann der Koeffizient durch Zufall entstanden sein (α =0.05)? 5.10 In einer Stichprobe von n = 59 korrelieren zwei Variable mit r =0.58. Gib ein 95 % Konfidenzintervall für ρ an! 1
22 5.11 Gegeben ist folgende Datenreihe: a) Bestimme ŷ = a + bx! x y b) Prüfe, ob der Stichprobenregressionskoeffizient b gegen 0 gesichert ist (α =0.01)! 5.1 X... Produktmenge Y... Gesamtkosten Bestimme: X Y a) Ŷ = a + bx, b) das Bestimmtheitsmaß, c) ein 99 % Konfidenzintervall für die durchschnittlichen Gesamtkosten mit einer Produktionsmenge von X 0 =5Stück, d) ein 95 % Prognoseintervall für die Gesamtkosten mit einer Produktionsmenge x 0 =70Stück! 5.13 Bei der Messung von Hämoglobingehalt im Blut (X) und mittlerer Oberfläche der Erythrozyten (Y ) bei 1 Personen ergaben sich folgende Daten: Person Hämoglobin- mittl. Oberfläche gehalt (X) d. Erythrozyten (Y) Frauen Männer
23 a) Berechne die Korrelation für alle Daten! b) Berechne die Korrelation für Männer und Frauen getrennt! c) Stelle die Daten grafisch dar! 3
Korrelation - Regression. Berghold, IMI
Korrelation - Regression Zusammenhang zwischen Variablen Bivariate Datenanalyse - Zusammenhang zwischen 2 stetigen Variablen Korrelation Einfaches lineares Regressionsmodell 1. Schritt: Erstellung eines
MehrProfil A 49,3 48,2 50,7 50,9 49,8 48,7 49,6 50,1 Profil B 51,8 49,6 53,2 51,1 51,1 53,4 50,7 50 51,5 51,7 48,8
1. Aufgabe: Eine Reifenfirma hat für Winterreifen unterschiedliche Profile entwickelt. Bei jeweils gleicher Geschwindigkeit und auch sonst gleichen Bedingungen wurden die Bremswirkungen gemessen. Die gemessenen
MehrRegressionsanalysen. Zusammenhänge von Variablen. Ziel der Regression. ( Idealfall )
Zusammenhänge von Variablen Regressionsanalysen linearer Zusammenhang ( Idealfall ) kein Zusammenhang nichtlinearer monotoner Zusammenhang (i.d.regel berechenbar über Variablentransformationen mittels
MehrMultiple Regression. Ziel: Vorhersage der Werte einer Variable (Kriterium) bei Kenntnis der Werte von zwei oder mehr anderen Variablen (Prädiktoren)
Multiple Regression 1 Was ist multiple lineare Regression? Ziel: Vorhersage der Werte einer Variable (Kriterium) bei Kenntnis der Werte von zwei oder mehr anderen Variablen (Prädiktoren) Annahme: Der Zusammenhang
MehrStatistik Einführung // Lineare Regression 9 p.2/72
Statistik Einführung Lineare Regression Kapitel 9 Statistik WU Wien Gerhard Derflinger Michael Hauser Jörg Lenneis Josef Ledold Günter Tirler Rosmarie Wakolbinger Statistik Einführung // Lineare Regression
MehrMultivariate Statistik
Hermann Singer Multivariate Statistik 1 Auflage 15 Oktober 2012 Seite: 12 KAPITEL 1 FALLSTUDIEN Abbildung 12: Logistische Regression: Geschätzte Wahrscheinlichkeit für schlechte und gute Kredite (rot/blau)
MehrStochastische Eingangsprüfung, 17.05.2008
Stochastische Eingangsprüfung, 17.5.8 Wir gehen stets von einem Wahrscheinlichkeitsraum (Ω, A, P) aus. Aufgabe 1 ( Punkte) Sei X : Ω [, ) eine integrierbare Zufallsvariable mit XdP = 1. Sei Q : A R, Q(A)
MehrAllgemeine Regressionsanalyse. Kovariablen / Prädiktoren / unabhängige Variablen X j R d, evtl. deterministisch
Prof. Dr. J. Franke Statistik II für Wirtschaftswissenschaftler 9.1 Allgemeine Regressionsanalyse Daten (X j, Y j ), j = 1,..., N unabhängig Kovariablen / Prädiktoren / unabhängige Variablen X j R d, evtl.
Mehr9. Schätzen und Testen bei unbekannter Varianz
9. Schätzen und Testen bei unbekannter Varianz Dr. Antje Kiesel Institut für Angewandte Mathematik WS 2011/2012 Schätzen und Testen bei unbekannter Varianz Wenn wir die Standardabweichung σ nicht kennen,
MehrKlausur zur Vorlesung Multivariate Verfahren, SS 2006 6 Kreditpunkte, 90 min
Klausur, Multivariate Verfahren, SS 2006, 6 Kreditpunkte, 90 min 1 Prof. Dr. Fred Böker 08.08.2006 Klausur zur Vorlesung Multivariate Verfahren, SS 2006 6 Kreditpunkte, 90 min Gesamtpunkte: 39 Aufgabe
MehrWeitere Fragestellungen im Zusammenhang mit einer linearen Einfachregression
Weitere Fragestellungen im Zusammenhang mit einer linearen Einfachregression Speziell im Zusammenhang mit der Ablehnung der Globalhypothese werden bei einer linearen Einfachregression weitere Fragestellungen
Mehra) Zeichnen Sie in das nebenstehende Streudiagramm mit Lineal eine Regressionsgerade ein, die Sie für passend halten.
Statistik für Kommunikationswissenschaftler Wintersemester 2009/200 Vorlesung Prof. Dr. Helmut Küchenhoff Übung Cornelia Oberhauser, Monia Mahling, Juliane Manitz Thema 4 Homepage zur Veranstaltung: http://www.statistik.lmu.de/~helmut/kw09.html
MehrElemente der Analysis II
Elemente der Analysis II Kapitel 3: Lineare Abbildungen und Gleichungssysteme Informationen zur Vorlesung: http://www.mathematik.uni-trier.de/ wengenroth/ J. Wengenroth () 15. Mai 2009 1 / 35 3.1 Beispiel
Mehr12. Bivariate Datenanalyse. In den Kapiteln 4-11 wurden univariate Daten betrachtet:
12. Bivariate Datenanalyse Während einer nur Zahlen im Kopf hat, kann er nicht auf den Kausalzusammenhang kommen Anonymus In den Kapiteln 4-11 wurden univariate Daten betrachtet: Von univariaten Daten
MehrInhaltsverzeichnis. Regressionsanalyse. http://mesosworld.ch - Stand vom: 20.1.2010 1
Inhaltsverzeichnis Regressionsanalyse... 2 Lernhinweise... 2 Einführung... 2 Theorie (1-8)... 2 1. Allgemeine Beziehungen... 3 2. 'Best Fit'... 3 3. 'Ordinary Least Squares'... 4 4. Formel der Regressionskoeffizienten...
MehrWeiterbildungskurs Stochastik
Hansruedi Künsch Seminar für Statistik Departement Mathematik, ETH Zürich 24. Juni 2009 Inhalt STATISTIK DER BINOMIALVERTEILUNG 1 STATISTIK DER BINOMIALVERTEILUNG 2 Fragestellungen Typische Fragestellungen
MehrBeispiel 48. 4.3.2 Zusammengesetzte Zufallsvariablen
4.3.2 Zusammengesetzte Zufallsvariablen Beispiel 48 Ein Würfel werde zweimal geworfen. X bzw. Y bezeichne die Augenzahl im ersten bzw. zweiten Wurf. Sei Z := X + Y die Summe der gewürfelten Augenzahlen.
MehrKlausur zu Methoden der Statistik I (mit Kurzlösung) Wintersemester 2007/2008. Aufgabe 1
Lehrstuhl für Statistik und Ökonometrie der Otto-Friedrich-Universität Bamberg Prof. Dr. Susanne Rässler Klausur zu Methoden der Statistik I (mit Kurzlösung) Wintersemester 2007/2008 Aufgabe 1 Ihnen liegt
MehrAusarbeitung des Seminarvortrags zum Thema
Ausarbeitung des Seminarvortrags zum Thema Anlagepreisbewegung zum Seminar Finanzmathematische Modelle und Simulationen bei Raphael Kruse und Prof. Dr. Wolf-Jürgen Beyn von Imke Meyer im W9/10 Anlagepreisbewegung
MehrKommentierte Musterlösung zur Klausur HM I für Naturwissenschaftler
Kommentierte Musterlösung zur Klausur HM I für Naturwissenschaftler Wintersemester 3/4 (.3.4). (a) Für z = + i und z = 3 4i berechne man z z und z z. Die Ergebnisse sind in kartesischer Form anzugeben.
Mehr1 Statistische Grundlagen
Konzepte in Empirische Ökonomie 1 (Winter) Hier findest Du ein paar Tipps zu den Konzepten in Empirische 1. Wenn Du aber noch etwas Unterstützung kurz vor der Klausur brauchst, schreib uns eine kurze Email.
MehrKorrelation. Übungsbeispiel 1. Übungsbeispiel 4. Übungsbeispiel 2. Übungsbeispiel 3. Korrel.dtp Seite 1
Korrelation Die Korrelationsanalyse zeigt Zusammenhänge auf und macht Vorhersagen möglich Was ist Korrelation? Was sagt die Korrelationszahl aus? Wie geht man vor? Korrelation ist eine eindeutige Beziehung
MehrStatistische Thermodynamik I Lösungen zur Serie 1
Statistische Thermodynamik I Lösungen zur Serie Zufallsvariablen, Wahrscheinlichkeitsverteilungen 4. März 2. Zwei Lektoren lesen ein Buch. Lektor A findet 2 Druckfehler, Lektor B nur 5. Von den gefundenen
MehrModul G.1 WS 07/08: Statistik 17.01.2008 1. Die Korrelation ist ein standardisiertes Maß für den linearen Zusammenhangzwischen zwei Variablen.
Modul G.1 WS 07/08: Statistik 17.01.2008 1 Wiederholung Kovarianz und Korrelation Kovarianz = Maß für den linearen Zusammenhang zwischen zwei Variablen x und y Korrelation Die Korrelation ist ein standardisiertes
MehrRisikomessung und Value at Risk Wintersemester 2013/14
Risikomessung und Value at Risk Wintersemester 2013/14 Walter Sanddorf-Köhle Statistik und Ökonometrie Foliensatz Nr. 11 Version vom 24. Januar 2014 1 / 45 6.5.1 Bisherige Vorgehensweise zur Berechnung
MehrComputer Vision: Optische Flüsse
Computer Vision: Optische Flüsse D. Schlesinger TUD/INF/KI/IS Bewegungsanalyse Optischer Fluss Lokale Verfahren (Lukas-Kanade) Globale Verfahren (Horn-Schunck) (+ kontinuierliche Ansätze: mathematische
MehrUmgekehrte Kurvendiskussion
Umgekehrte Kurvendiskussion Bei einer Kurvendiskussion haben wir eine Funktionsgleichung vorgegeben und versuchen ihre 'Besonderheiten' herauszufinden: Nullstellen, Extremwerte, Wendepunkte, Polstellen
MehrEine Einführung in R: Statistische Tests
Eine Einführung in R: Statistische Tests Bernd Klaus, Verena Zuber Institut für Medizinische Informatik, Statistik und Epidemiologie (IMISE), Universität Leipzig http://www.uni-leipzig.de/ zuber/teaching/ws12/r-kurs/
MehrEinfache Statistiken in Excel
Einfache Statistiken in Excel Dipl.-Volkswirtin Anna Miller Bergische Universität Wuppertal Schumpeter School of Business and Economics Lehrstuhl für Internationale Wirtschaft und Regionalökonomik Raum
MehrGüte von Tests. die Wahrscheinlichkeit für den Fehler 2. Art bei der Testentscheidung, nämlich. falsch ist. Darauf haben wir bereits im Kapitel über
Güte von s Grundlegendes zum Konzept der Güte Ableitung der Gütefunktion des Gauss im Einstichprobenproblem Grafische Darstellung der Gütefunktionen des Gauss im Einstichprobenproblem Ableitung der Gütefunktion
MehrOptimale Steuerung. Sequentielle Quadratische Programmierung. Kevin Sieg. 14. Juli 2010. Fachbereich für Mathematik und Statistik Universität Konstanz
Optimale Steuerung Kevin Sieg Fachbereich für Mathematik und Statistik Universität Konstanz 14. Juli 2010 1 / 29 Aufgabenstellung 1 Aufgabenstellung Aufgabenstellung 2 Die zusammengesetzte Trapezregel
Mehr9.2. DER SATZ ÜBER IMPLIZITE FUNKTIONEN 83
9.. DER SATZ ÜBER IMPLIZITE FUNKTIONEN 83 Die Grundfrage bei der Anwendung des Satzes über implizite Funktionen betrifft immer die folgende Situation: Wir haben eine Funktion f : V W und eine Stelle x
MehrInterne und externe Modellvalidität
Interne und externe Modellvalidität Interne Modellvalidität ist gegeben, o wenn statistische Inferenz bzgl. der untersuchten Grundgesamtheit zulässig ist o KQ-Schätzer der Modellparameter u. Varianzschätzer
MehrÜbung 3: Einfache Graphiken und Näherungen durch Regression
Übung 3: Einfache Graphiken und Näherungen durch Regression M. Schlup, 9. August 010 Aufgabe 1 Einfache Graphik Für die abgegebene Leistung P = UI eines linearen, aktiven Zweipols mit Leerlaufspannung
MehrBinäre abhängige Variablen
Binäre abhängige Variablen Thushyanthan Baskaran thushyanthan.baskaran@awi.uni-heidelberg.de Alfred Weber Institut Ruprecht Karls Universität Heidelberg Einführung Oft wollen wir qualitative Variablen
MehrKAPITEL 4. Lineare Ausgleichsrechnung Beispiel 4.1. Das Ohmsche Gesetz: U = RI. Eine Meßreihe von Daten:
KAPITEL 4 Lineare Ausgleichsrechnung Beispiel 41 Das Ohmsche Gesetz: Eine Meßreihe von Daten: U = RI (U i, I i ) (Spannung, Stromstärke), i = 1,, m Aufgabe: man bestimme aus diesen Meßdaten den Widerstand
MehrKernel, Perceptron, Regression. Erich Schubert, Arthur Zimek. 2014-07-20 KDD Übung
Kernel, Perceptron, Regression Erich Schubert, Arthur Zimek Ludwig-Maximilians-Universität München 2014-07-20 KDD Übung Kernel-Fukctionen Kernel kann mehrdeutig sein! Unterscheidet zwischen: Kernel function
MehrIn konstanten Modellen wird davon ausgegangen, dass die zu prognostizierende Größe sich über die Zeit hinweg nicht verändert.
Konstante Modelle: In konstanten Modellen wird davon ausgegangen, dass die zu prognostizierende Größe sich über die Zeit hinweg nicht verändert. Der prognostizierte Wert für die Periode T+i entspricht
MehrEinseitig gerichtete Relation: Mit zunehmender Höhe über dem Meeresspiegel sinkt im allgemeinen die Lufttemperatur.
Statistik Grundlagen Charakterisierung von Verteilungen Einführung Wahrscheinlichkeitsrechnung Wahrscheinlichkeitsverteilungen Schätzen und Testen Korrelation Regression Einführung Die Analyse und modellhafte
MehrEinleitung 19. Teil I Datenanalyse und Modellbildung Grundlagen 25
Inhaltsverzeichnis Einleitung 19 Zu diesem Buch 19 Konventionen in diesem Buch 20 Was Sie nicht lesen müssen 21 Falsche Voraussetzungen 21 Wie dieses Buch aufgebaut ist 21 Teil I: Datenanalyse und Grundlagen
Mehr2. Korrelation, lineare Regression und multiple Regression
multiple 2.2 Lineare 2.2 Lineare 1 / 130 2.2 Lineare 2 / 130 2.1 Beispiel: Arbeitsmotivation Untersuchung zur Motivation am Arbeitsplatz in einem Chemie-Konzern 25 Personen werden durch Arbeitsplatz zufällig
MehrInstitut für Soziologie Benjamin Gedon. Methoden 2. Regressionsanalyse IV: Transformation und Interaktion
Institut für Soziologie Methoden 2 Regressionsanalyse IV: Transformation und Interaktion Inhalt 1. Zusammenfassung letzte Sitzung 2. Weitere Annahmen und Diagnostik 3. Transformationen zur besseren Interpretierbarkeit
MehrKorrelation (II) Korrelation und Kausalität
Korrelation (II) Korrelation und Kausalität Situation: Seien X, Y zwei metrisch skalierte Merkmale mit Ausprägungen (x 1, x 2,..., x n ) bzw. (y 1, y 2,..., y n ). D.h. für jede i = 1, 2,..., n bezeichnen
MehrMultivariate Verfahren
Selbstkontrollarbeit 2 Multivariate Verfahren Musterlösung Aufgabe 1 (28 Punkte) Der Marketing-Leiter einer Lebensmittelherstellers möchte herausfinden, mit welchem Richtpreis eine neue Joghurt-Marke auf
MehrKapitel 4: Binäre Regression
Kapitel 4: Binäre Regression Steffen Unkel (basierend auf Folien von Nora Fenske) Statistik III für Nebenfachstudierende WS 2013/2014 4.1 Motivation Ausgangssituation Gegeben sind Daten (y i, x i1,...,
MehrKlausur zur Vorlesung Statistik III für Studenten mit dem Wahlfach Statistik
Ludwig Fahrmeir, Nora Fenske Institut für Statistik Bitte für die Korrektur freilassen! Aufgabe 1 2 3 4 Punkte Klausur zur Vorlesung Statistik III für Studenten mit dem Wahlfach Statistik 29. März 21 Hinweise:
MehrKlausur Statistik Lösungshinweise
Klausur Statistik Lösungshinweise Prüfungsdatum: 1. Juli 2015 Prüfer: Etschberger, Heiden, Jansen Studiengang: IM und BW Aufgabe 1 14 Punkte Ein Freund von Ihnen hat über einen Teil seiner Daten, die er
MehrComputer Vision: 3D-Geometrie. D. Schlesinger () Computer Vision: 3D-Geometrie 1 / 17
Computer Vision: 3D-Geometrie D. Schlesinger () Computer Vision: 3D-Geometrie 1 / 17 Lochkamera Modell C Projektionszentrum, Optische Achse, Bildebene, P Hauptpunkt (optische Achse kreuzt die Bildebene),
MehrAusgewählte Kapitel der Statistik: Regressions- u. varianzanalytische Modelle Lösung von Grundaufgaben mit SPSS Statistics 20.0
1 Ausgewählte Kapitel der Statistik: Regressions- u. varianzanalytische Modelle Lösung von Grundaufgaben mit SPSS Statistics 20.0 Text: grund1_spss20.doc Daten: grund1_?.sav Lehrbuch: W. Timischl, Biostatistik.
MehrNichtlineare Optimierung ohne Nebenbedingungen
Kapitel 2 Nichtlineare Optimierung ohne Nebenbedingungen In diesem Abschnitt sollen im wesentlichen Verfahren zur Bestimmung des Minimums von nichtglatten Funktionen in einer Variablen im Detail vorgestellt
MehrDIPLOMVORPRÜFUNG GRUNDZÜGE DER STATISTIK, TEIL B WINTERSEMESTER 2006/07 28.02.2007
Wirtschaftswissenschaftliches Prüfungsamt DIPLOMVORPRÜFUNG GRUNDZÜGE DER STATISTIK, TEIL B WINTERSEMESTER 006/07 8.0.007 Lösung Prof. Dr. R Friedmann / Dr. R. Hauser Hinweise für die Klausurteilnehmer
Mehr2. Deskriptive Statistik 2.1. Häufigkeitstabellen, Histogramme, empirische Verteilungsfunktionen
4. Datenanalyse und Modellbildung Deskriptive Statistik 2-1 2. Deskriptive Statistik 2.1. Häufigkeitstabellen, Histogramme, empirische Verteilungsfunktionen Für die Auswertung einer Messreihe, die in Form
MehrGleichungen Lösen. Ein graphischer Blick auf Gleichungen
Gleichungen Lösen Was bedeutet es, eine Gleichung zu lösen? Was ist überhaupt eine Gleichung? Eine Gleichung ist, grundsätzlich eine Aussage über zwei mathematische Terme, dass sie gleich sind. Ein Term
Mehr2.Tutorium Generalisierte Regression
2.Tutorium Generalisierte Regression - Binäre Regression - Moritz Berger: 04.11.2013 und 11.11.2013 Shuai Shao: 06.11.2013 und 13.11.2013 Institut für Statistik, LMU München 1 / 16 Gliederung 1 Erweiterte
MehrAnalyse von Zeitreihen in der Umweltphysik und Geophysik Stochastische Prozesse
Analyse von Zeitreihen in der Umweltphysik und Geophysik Stochastische Prozesse Yannik Behr Gliederung 1 Stochastische Prozesse Stochastische Prozesse Ein stochastischer Prozess ist ein Phänomen, dessen
MehrStatistik II für Betriebswirte Vorlesung 3
PD Dr. Frank Heyde TU Bergakademie Freiberg Institut für Stochastik Statistik II für Betriebswirte Vorlesung 3 5. November 2013 Beispiel: Aktiensplit (Aczel & Sounderpandan, Aufg. 14-28) Ein Börsenanalyst
MehrDer Bipolar-Transistor und die Emitterschaltung Gruppe B412
TECHNISCHE UNIVERSITÄT MÜNCHEN Der Bipolar-Transistor und die Emitterschaltung Gruppe B412 Patrick Christ und Daniel Biedermann 16.10.2009 1. INHALTSVERZEICHNIS 1. INHALTSVERZEICHNIS... 2 2. AUFGABE 1...
MehrMathematikaufgaben zur Vorbereitung auf das Studium
Hochschule für Technik und Wirtschaft Dresden (FH) Fachbereich Informatik/Mathematik Mathematikaufgaben zur Vorbereitung auf das Studium Studiengänge Informatik Medieninformatik Wirtschaftsinformatik Wirtschaftsingenieurwesen
MehrPrüfung zu Modul 26 (BA Bw) bzw. 10 (BA IB) (Wirtschaftsstatistik)
2 3 Klausur-Nr = Sitzplatz-Nr Prüfung zu Modul 26 (BA Bw) bzw. 10 (BA IB) (Wirtschaftsstatistik) Klausurteil 1: Beschreibende Statistik BeStat-1 (7 ) n = 400 Personen wurden gefragt, wie viele Stück eines
MehrÜbungsaufgaben zu Kapitel 5. Aufgabe 101. Inhaltsverzeichnis:
Inhaltsverzeichnis: Übungsaufgaben zu Kapitel 5... 1 Aufgabe 101... 1 Aufgabe 102... 2 Aufgabe 103... 2 Aufgabe 104... 2 Aufgabe 105... 3 Aufgabe 106... 3 Aufgabe 107... 3 Aufgabe 108... 4 Aufgabe 109...
Mehr90-minütige Klausur Statistik für Studierende der Kommunikationswissenschaft
Prof. Dr. Helmut Küchenhoff SS08 90-minütige Klausur Statistik für Studierende der Kommunikationswissenschaft am 22.7.2008 Anmerkungen Überprüfen Sie bitte sofort, ob Ihre Angabe vollständig ist. Sie sollte
MehrGrundlagen der Inferenzstatistik: Was Ihnen nicht erspart bleibt!
Grundlagen der Inferenzstatistik: Was Ihnen nicht erspart bleibt! 1 Einführung 2 Wahrscheinlichkeiten kurz gefasst 3 Zufallsvariablen und Verteilungen 4 Theoretische Verteilungen (Wahrscheinlichkeitsfunktion)
Mehr8. Februar 2007. 5. Bei Unterschleif gilt die Klausur als nicht bestanden und es erfolgt eine Meldung an das Prüfungsamt.
L. Fahrmeir, C. Belitz Department für Statistik Bitte für die Korrektur freilassen! Aufgabe 1 2 3 4 Punkte Klausur zur Vorlesung Statistik III für Studenten mit Wahlfach Statistik 8. Februar 2007 Hinweise:
MehrV 2 B, C, D Drinks. Möglicher Lösungsweg a) Gleichungssystem: 300x + 400 y = 520 300x + 500y = 597,5 2x3 Matrix: Energydrink 0,7 Mineralwasser 0,775,
Aufgabenpool für angewandte Mathematik / 1. Jahrgang V B, C, D Drinks Ein gastronomischer Betrieb kauft 300 Dosen Energydrinks (0,3 l) und 400 Liter Flaschen Mineralwasser und zahlt dafür 50, Euro. Einen
MehrNachholklausur STATISTIK II
Nachholklausur STATISTIK II Name, Vorname: Matrikel-Nr.: Die Klausur enthält zwei Typen von Aufgaben: T e i l A besteht aus Fragen mit mehreren vorgegebenen Antwortvorschlägen, von denen mindestens eine
MehrKapitel 3: Interpretationen
Kapitel 3: 1. Interpretation von Outputs allgemein... 1 2. Interpretation von Signifikanzen... 1 2.1. Signifikanztests / Punktschätzer... 1 2.2. Konfidenzintervalle... 2 3. Interpretation von Parametern...
MehrFAKTORIELLE VERSUCHSPLÄNE. Andreas Handl
FAKTORIELLE VERSUCHSPLÄNE Andreas Handl 1 Inhaltsverzeichnis 1 Versuchsplanung 4 2 Einfaktorielle Varianzanalyse 6 2.1 DieAnnahmen... 6 2.2 Die ANOVA-Tabelle und der F -Test... 6 2.3 Versuche mit zwei
Mehr6.2 Regressionsanalyse
c-kennzahlensystem (ROCI) 6. Regressionsanalyse Die Regressionsanalyse zählt zu den wichtigsten Analysemethoden des Kommunikationscontrollings und hat ihre tiefen Wurzeln in der Statistik. Im Rahmen des
MehrZusammenhänge zwischen metrischen Merkmalen
Zusammenhänge zwischen metrischen Merkmalen Darstellung des Zusammenhangs, Korrelation und Regression Daten liegen zu zwei metrischen Merkmalen vor: Datenpaare (x i, y i ), i = 1,..., n Beispiel: x: Anzahl
Mehrklar. Um die zweite Bedingung zu zeigen, betrachte u i U i mit u i = 0. Das mittlere -Zeichen liefert s
Nachtrag zur allgemeinen Vektorraum-Theorie. 1.5.15. Direkte Summen. Sei V ein Vektorraum, seien U 1,..., U t Unterräume, wir schreiben V = U 1 U 2 U t = t i=1 U i falls die folgenden beiden Bedingungen
MehrLösungen zu Janssen/Laatz, Statistische Datenanalyse mit SPSS 1
LÖSUNG 9B a) Lösungen zu Janssen/Laatz, Statistische Datenanalyse mit SPSS 1 Man kann erwarten, dass der Absatz mit steigendem Preis abnimmt, mit höherer Anzahl der Außendienstmitarbeiter sowie mit erhöhten
MehrTeil II. Nichtlineare Optimierung
Teil II Nichtlineare Optimierung 60 Kapitel 1 Einleitung In diesem Abschnitt wird die Optimierung von Funktionen min {f(x)} x Ω betrachtet, wobei Ω R n eine abgeschlossene Menge und f : Ω R eine gegebene
MehrFüllmenge. Füllmenge. Füllmenge. Füllmenge. Mean = 500,0029 Std. Dev. = 3,96016 N = 10.000. 485,00 490,00 495,00 500,00 505,00 510,00 515,00 Füllmenge
2.4 Stetige Zufallsvariable Beispiel. Abfüllung von 500 Gramm Packungen einer bestimmten Ware auf einer automatischen Abfüllanlage. Die Zufallsvariable X beschreibe die Füllmenge einer zufällig ausgewählten
MehrStatistische Verfahren für das Data Mining in einem Industrieprojekt
Statistische Verfahren für das Data Mining in einem Industrieprojekt Thorsten Dickhaus Forschungszentrum Jülich GmbH Zentralinstitut für Angewandte Mathematik Telefon: 02461/61-4193 E-Mail: th.dickhaus@fz-juelich.de
MehrNichtparametrische Analyse longitudinaler Daten in faktoriellen Experimenten. Frank Konietschke
Nichtparametrische Analyse longitudinaler Daten in faktoriellen Experimenten Frank Konietschke Abteilung für Medizinische Statistik Universität Göttingen 1 Übersicht Beispiele CGI (repeated measures) γ-gt
MehrNullserie zur Prüfungsvorbereitung
Nullserie zur Prüfungsvorbereitung Die folgenden Hilfsmittel und Bedingungen sind an der Prüfung zu beachten. Erlaubte Hilfsmittel Beliebiger Taschenrechner (Der Einsatz von Lösungs- und Hilfsprogrammen
MehrLineare Funktionen. 1 Proportionale Funktionen 3 1.1 Definition... 3 1.2 Eigenschaften... 3. 2 Steigungsdreieck 3
Lineare Funktionen Inhaltsverzeichnis 1 Proportionale Funktionen 3 1.1 Definition............................... 3 1.2 Eigenschaften............................. 3 2 Steigungsdreieck 3 3 Lineare Funktionen
MehrPrüfung zu Modul 26 (BA Bw) bzw. 10 (BA IB) (Wirtschaftsstatistik)
2 Klausur-Nr = Sitzplatz-Nr Prüfung zu Modul 26 (BA Bw) bzw. 10 (BA IB) (Wirtschaftsstatistik) Klausurteil 1: Beschreibende Statistik Name, Vorname:... verteilung Teil 1: Beschreibende Statistik Aufgaben
MehrUnsupervised Kernel Regression
9. Mai 26 Inhalt Nichtlineare Dimensionsreduktion mittels UKR (Unüberwachte KernRegression, 25) Anknüpfungspunkte Datamining I: PCA + Hauptkurven Benötigte Zutaten Klassische Kernregression Kerndichteschätzung
Mehrax 2 + bx + c = 0, (4.1)
Kapitel 4 Komplexe Zahlen Wenn wir uns auf die reellen Zahlen beschränken, ist die Operation des Wurzelziehens (also die Umkehrung der Potenzierung) nicht immer möglich. Zum Beispiel können wir nicht die
MehrDIFFERENTIALGLEICHUNGEN
DIFFERENTIALGLEICHUNGEN GRUNDBEGRIFFE Differentialgleichung Eine Gleichung, in der Ableitungen einer unbekannten Funktion y = y(x) bis zur n-ten Ordnung auftreten, heisst gewöhnliche Differentialgleichung
MehrEinfache statistische Testverfahren
Einfache statistische Testverfahren Johannes Hain Lehrstuhl für Mathematik VIII (Statistik) 1/29 Hypothesentesten: Allgemeine Situation Im Folgenden wird die statistische Vorgehensweise zur Durchführung
Mehr3. Grundlagen der Linearen Programmierung
3. Grundlagen der linearen Programmierung Inhalt 3. Grundlagen der Linearen Programmierung Lineares Programm Grafische Lösung linearer Programme Normalform Geometrie linearer Programme Basislösungen Operations
MehrAnleitung zum Physikpraktikum für Oberstufenlehrpersonen Fehlerrechnung und Statistik (FR) Herbstsemester 2015
Anleitung zum Physikpraktikum für Oberstufenlehrpersonen Fehlerrechnung und Statistik (FR) Herbstsemester 2015 Physik-Institut der Universität Zürich Inhaltsverzeichnis 12 Fehlerrechnung und Statistik
MehrHäufigkeitstabellen. Balken- oder Kreisdiagramme. kritischer Wert für χ2-test. Kontingenztafeln
Häufigkeitstabellen Menüpunkt Data PivotTable Report (bzw. entsprechendes Icon): wähle Data Range (Zellen, die die Daten enthalten + Zelle mit Variablenname) wähle kategoriale Variable für Spalten- oder
MehrUniversität Bonn 28. Juli 2010 Fachbereich Rechts- und Wirtschaftswissenschaften Statistische Abteilung Prof. Dr. A. Kneip. KLAUSUR Statistik B
Universität Bonn 28. Juli 2010 Fachbereich Rechts- und Wirtschaftswissenschaften Statistische Abteilung Prof. Dr. A. Kneip Sommersemester 2010 KLAUSUR Statistik B Hinweise zur Bearbeitung: Bei allen Teilaufgaben
Mehrε heteroskedastisch BINARY CHOICE MODELS Beispiele: Wahlentscheidung Kauf langlebiger Konsumgüter Arbeitslosigkeit Schätzung mit OLS?
BINARY CHOICE MODELS 1 mit Pr( Y = 1) = P Y = 0 mit Pr( Y = 0) = 1 P Beispiele: Wahlentscheidung Kauf langlebiger Konsumgüter Arbeitslosigkeit Schätzung mit OLS? Y i = X i β + ε i Probleme: Nonsense Predictions
MehrLineare Strukturgleichungsmodelle (LISREL) Konfirmatorische Faktorenanalyse (CFA)
Interdisziplinäres Seminar Lineare Strukturgleichungsmodelle (LISREL) Konfirmatorische Faktorenanalyse (CFA) WS 2008/09 19.11.2008 Julia Schiele und Lucie Wink Dozenten: Prof. Dr. Bühner, Prof. Dr. Küchenhoff
Mehr3 Zusammenhangsmaße Zusammenhangshypothesen
3 Zusammenhangsmaße Zusammenhangshypothesen Zusammenhänge (zwischen 2 Variablen) misst man mittels Korrelationen. Die Wahl der Korrelation hängt ab von: a) Skalenniveau der beiden Variablen: 1) intervallskaliert
MehrDownload. Mathematik üben Klasse 8 Terme und Gleichungen. Differenzierte Materialien für das ganze Schuljahr. Jens Conrad, Hardy Seifert
Download Jens Conrad, Hardy Seifert Mathematik üben Klasse 8 Terme und Gleichungen Differenzierte Materialien für das ganze Schuljahr Downloadauszug aus dem Originaltitel: Mathematik üben Klasse 8 Terme
Mehr1 Übungsaufgaben. 1.1 Übungsaufgaben zu Operations Research 1 ÜBUNGSAUFGABEN 0
1 ÜBUNGSAUFGABEN 0 1 Übungsaufgaben In diesem Kapitel sind Übungsaufgaben zusammengestellt, die den Stoff der Vorlesung vertiefen und die für Prüfungen erforderliche Praxis und Schnelligkeit vermitteln
MehrKommentierter SPSS-Ausdruck zur logistischen Regression
Daten: POK V AG 3 (POKV_AG3_V07.SAV) Kommentierter SPSS-Ausdruck zur logistischen Regression Fragestellung: Welchen Einfluss hat die Fachnähe und das Geschlecht auf die interpersonale Attraktion einer
MehrStandardab er des. Testwert = 145.5 95% Konfidenzintervall. T df Sig. (2-seitig) Differenz Untere Obere -2.011 698.045-5.82-11.50 -.14.
Aufgabe : einfacher T-Test Statistik bei einer Stichprobe Standardfehl Standardab er des Mittelwert weichung Mittelwertes 699 39.68 76.59 2.894 Test bei einer Sichprobe Testwert = 45.5 95% Konfidenzintervall
MehrDie Gleichung A x = a hat für A 0 die eindeutig bestimmte Lösung. Für A=0 und a 0 existiert keine Lösung.
Lineare Gleichungen mit einer Unbekannten Die Grundform der linearen Gleichung mit einer Unbekannten x lautet A x = a Dabei sind A, a reelle Zahlen. Die Gleichung lösen heißt, alle reellen Zahlen anzugeben,
MehrKapitel 23 Lineare Regression
Kapitel 23 Lineare Regression Sowohl einfache als auch multiple Regressionsanalysen können Sie mit dem Befehl STATISTIK REGRESSION LINEAR... durchführen. Dabei lassen sich mit Hilfe diverser Optionen zahlreiche
Mehr