3 Korrelation und Regression

Größe: px
Ab Seite anzeigen:

Download "3 Korrelation und Regression"

Transkript

1 3 KORRELATION UND REGRESSION 3 Korrelation und Regression Sind zwei Zufallsvariable X und Y unabhängig, so gibt es keinerlei Wechselwirkung zwischen ihnen. Ist ein funktionaler Zusammenhang = f( zwischen den Merkmalsausprägungen und gegeben, so sind die Zufallsvariable funktionell in der Form Y = f(x voneinander abhängig. Dies ist der maimale Grad der Abhängigkeit. Interessant sind die Zwischenstufen. Zum Beispiel wird es einleuchten, dass zwischen der Außentemperatur und dem Brennstoffverbrauch eines Heizkraftwerks eine Abhängigkeit besteht. Jedoch kann wohl kaum aus der genauen Außentemperatur auf den eakten Brennstoffverbrauch geschlossen werden zufällige Einflüsse wie Freizeitverhalten, Lebensgewohnheiten etc. werden ebenfalls einen gewissen Einfluss ausüben. Man wird nun versuchen, aufgrund von Stichproben {(,, (,,..., ( n, n } die Abhängigkeit der beiden zugehörigen Zufallsvariablen X und Y stochastisch zu erfassen. Die denkbaren Zusammenhänge zwischen den Zufallsvariablen X und Y können vielfältiger Natur sein. Ist ein funktionaler Zusammenhang zwischen X und Y nicht eplizit bekannt, so wird man zunächst nach einem linearen (verallgemeinert: polnomialen Zusammenhang suchen. Folgende Fragen sind von praktischem Interesse: a Kann man der Grad der Abhängigkeit zwischen zwei Zufallsgrößen durch eine geeignete Kennzahl quantifizieren. Korrelationsrechnung b Kann man eine näherungsweise funktionelle Abhängigkeit zwischen X und Y mathematisch formulieren. Regressionsrechnung Die folgenden Bilder sollen den Grad einer linearen Abhängigkeit zwischen zwei Zufallsgrößen veranschaulichen. 6

2 3 KORRELATION UND REGRESSION 3. Lineare Korrelation.8.6. Ausgleichsgerade; Korrel. Koeff. =.99 Punkte =p (.8.6. Ausgleichsgerade; Korrel. Koeff. =.67 Punkte =p ( Während beim ersten Bild alle Punkte relativ nahe an einer sogenannten Ausgleichsgeraden liegen, also eine starke lineare Abhängigkeit der beiden Zufallsvariablen angenommen werden kann, streut die Punktewolke des zweiten Bildes ziemlich stark um diese Gerade. 3. Lineare Korrelation Gesucht ist eine Maßzahl für die Stärke und Richtung eines linearen Zusammenhangs zwischen zwei Zufallsvariablen X und Y. Diese Zahl soll nicht vom Nullpunkt der Mess-Skala und den gewählten Maß-Einheiten abhängen. Wir betrachten deshalb die standardisierten Daten: i = i s, ỹ i = i ȳ s ;, ȳ : Mittelwerte s, s : Standardabweichungen Hat ein Wertepaar ( i ỹ i das gleiche Vorzeichen, so deutet dies auf einen positiven Zusammenhang zwischen X und Y hin. Wertepaare ( i ỹ i mit ungleichen Vorzeichen weisen auf einen negativen Zusammenhang hin. Die einfachste Funktion, die diesen Zusammenhang misst, ist das Produkt i ỹ i. Ein Maß für den Zusammenhang zwischen den - und -Werten der Stichprobe erhält man durch Ausmitteln der einzelnen Beiträge r(, = i ỹ i n Für die Originaldaten ( i i ergeben sich mit ỹ i ỹ i ( i ỹ i r(, = n n ( i ( i ȳ ( i n = ( i ȳ s s s 7

3 3 KORRELATION UND REGRESSION 3. Lineare Korrelation s = n ( i ( i ȳ numerische Kovarianz ein Maß für den Zusammenhang zwischen den - und -Werten der Stichprobe, den sogenannten Korrelationskoeffizienten. Diese empirische Größe besitzt als theoretisches Gegenstück (vgl. Wahrscheinlichkeitsrechnung ρ(x, X = E [ (X µ (Y µ ] σ σ. Der Zähler des Ausdrucks heißt Kovarianz und lässt sich wie folgt umformen: Cov(X, Y = E [ (X µ (Y µ ] = E [X Y] E [µ X ] E [µ Y] + E [µ µ ] = E [X Y] µ µ Sind die beiden Zufallsvariablen X und Y stochastisch unabhängig, so ist der Erwartungswert des Produkts gleich dem Produkt der Erwartungswerte: E [ X Y ] = E [ X ] E [ Y ] = µ µ Damit verschwindet für diesen Fall die Kovarianz und der Korrelationskoefffizient ist Null. Liegt ein linearer Zusammenhang i = a + b i vor, so ergibt sich mit i ȳ = b ( i für den Zähler des Korrelationskoeffizienten: n ( i ( i ȳ = b n ( i = b s Weiter gilt für die Varianz der linear abhängigen Zufallsvariablen Y : s = b s s = b s Damit ergibt sich für den Fall linearer Abhängigkeit für den Korrelationskoeffizienten: r(, = n n ( i ( i ȳ ( i n = b = ± b ( i ȳ D.h. für eine positive Steigung des linearen Zusammenhangs wird der Korrelationskoeffizient, bei einer negativen Steigung zu -. 8

4 3 KORRELATION UND REGRESSION 3. Lineare Korrelation In allen anderen Fällen liegt r(, zwischen - und. Der Korrelationskoeffizient kann mittels der Begriffsbildung des Skalarprodukts interpretiert werden. r(, = n n ( i ( i ȳ ( i n = ( i ȳ ( i ( i ȳ ( i ( i ȳ Mit u =. n und v = ȳ ȳ. n ȳ lässt sich der Zähler von r(, als Skalarprodukt interpretieren, die Ausdrücke im Nenner als Beträge und wir erhalten die Darstellung r(, = u v u v Für n = 3 lässt sich r als Kosinus des Winkels zwischen den Vektoren u und v interpretieren. Damit kann r nur Werte zwischen - und + annehmen. Sind u und v linear abhängig, so beträgt der Kosinus des eingeschlossenen Winkels entweder + (parallel oder - (antiparallel. Für n > 3 gilt diese Beziehung ebenfalls (Schwarzsche Ungleichung. Falls r(, = ist, so besteht kein linearer Zusammenhang zwischen den beiden Variablen. Es kann ( i i i i aber sehr wohl ein anderer funktionaler Zusammenhang eistieren. So besitzt z.b. jede Datenmenge, die smmetrisch zu einer Geraden = a liegt, stets den Korrelationskoeffizienten r(, = r(, misst nur die Stärke des linearen Zusammenhangs. Die zu folgenden Streudiagrammen gehörenden Datenmengen besitzen alle den Korrelationskoeffizienten r(,.7. Korrelationskoeffizient r=.7 Korrelationskoeffizient r=.69 Korrelationskoeffizient r=.7 i i i i i i 9

5 3 KORRELATION UND REGRESSION 3. Lineare Korrelation Korrelationskoeffizient r= Korrelationskoeffizient r= Korrelationskoeffizient r= i.. i.. i...5 i.5 i.5 Wie obige Beispiele zeigen, wird der Korrelationskoeffizient stark von Ausreißern beeinflusst. Ein robusteres Maß für einen Zusammenhang zwischen Zufallsvariablen ist der sogenannte Rang-Korrelationskoeffizient. Er misst nicht nur den linearen Anteil. Der Rang einer Zahl X i innerhalb einer Stichprobe gibt an, die wie-vielt-kleinste Zahl sie im Ensemble ist. Bei Gleichheit werden die entsprechenden Rangzahlen gemittelt. Beispiel eine zweidimensionalen Stichprobe: (..5, (..7, (.3.5, (.3.6, (., (.9, (.8 3.7, (.8.3, (.6 9, (.9 i i Rang( i i Rang( i Rangtransformierte Stichprobe: (.5, (9 9, (5.5.5, (5.5 6, (, (3 3, (8 8, (, (, (7 7 Unter der Spearmanschen Rang-Korrelation versteht man die einfache Korrelation zwischen den Rängen der i und den Rängen der i. Da sich die Ränge von i bzw. i bei monotonen Transformationen nicht ändern, ist die Rang-Korrelation bezüglich solchen Transformationen invariant. Ein Ausreißer verändert die Rang-Korrelation nur minimal. Die Spearmansche Rang-Korrelation misst also nicht Stärke und Richtung eines linearen Zusammenhangs, sondern diejenige des monotonen Zusammenhangs. Die folgenden Bilder zeigen die Streudiagramme der rangtransformierten Stichproben von oben. i

6 3 KORRELATION UND REGRESSION 3. Lineare Korrelation Rang Korrelationskoeffizient r= Rang Korrelationskoeffizient r=.67 5 rang( i 5 5 rang( i 3 3 rang( i rang( i Rang Korrelationskoeffizient r=.7 Rang Korrelationskoeffizient r=.6 3 rang( i rang( i Rang Korrelationskoeffizient r=.8 5 rang( i rang( i Rang Korrelationskoeffizient r=.75 8 rang( i rang( i rang( i 5 rang( i

7 3 KORRELATION UND REGRESSION 3. Lineare Korrelation Besitzen die gemessenen Stichprobenwerte ( i, k gewisse Häufigkeiten h ik, so können wir die Konzeption der Kovarianz bzw. Korrelation sofort sinngemäß übertragen. Häufigkeitstabelle einer zweidimensionalen Stichprobe: Übertragung auf Häufigkeitstabellen... k... r h h... h k... h r h h h... h k... h r h i h i h i... h ik... h ir hi m h m h m... h mk... h mr hm h h... h k... h r h = n Dabei sind h k und h i die Summenhäufigkeit der entsprechenden Spalte bzw. Zeile genannt Randhäufigkeiten. h i = h( i = r h k = h( k = m h ik k= h ik Die Summe über alle Häufigkeiten sei gleich n. r m m m h = h k = h i = = n k= k= Die Berechnung des empirischen Korrelationskoeffizienten ergibt sich daraus zu m r h ik i k m r h i i h k k n k= k= r = ( m h i i m ( h i i r r h k k h k k n n Beispiel: Der Zusammenhang zwischen Mathematik- und Phsiknote soll bei Abiturienten untersucht werden. Dazu liege die folgende Häufigkeitstabelle vor. Hierbei sollen die i die Bedeutung der Phsiknote haben, die k stehen für die Mathematiknote. Wir erhalten als Korrelationskoeffizient: h ik k= k= h i h k r = =.38

8 3 KORRELATION UND REGRESSION 3. Lineare Korrelation Man beachte, dass aus der Unabhängigkeit zweier Zufallsvariabler zwar stets ihre Unkorreliertheit 5 folgt, aber aus der Unkorreliertheit nicht unbedingt die Unabhängigkeit. Beispiel: Die gemeinsame Verteilung zweier diskreter Zufallsvariabler X und Y sowie ihre Randverteilungen seien durch folgende Tabelle beschrieben. Es ergeben sich folgende Erwartungswerte: 3 P (X = i 3 P (Y = j E [ X ] = E [ Y ] = = E [ X Y ] = = Cov(X, Y = E [ X ] E [ Y ] E [ X Y ] = Die Zufallsvariable sind also unkorreliert, jedoch nicht stochastisch unabhängig 6. So ist z.b. = P (X =, Y = P (X = P (Y = = Genauere Untersuchungen über Vertrauensintervalle für Kovarianz, Korrelationskoeffizienten und die noch zu behandelnden Koeffizienten der Regressionsgerade setzen i.a. eine zweidimensionale Normalverteilung voraus. Dazu wird auf weiterführende Literatur hingewiesen. Die beiden folgenden Bilder zeigen die Dichten von korrelierten bzw. unkorrelierten normalverteilten Verteilungsfunktionen. Korrelationskoeffizient r =.8 Korrelationskoeffizient r = Man bezeichnet zwei Zufallsvariable als unkorreliert, wenn ihr Korrelationskoeffizient verschwindet. 6 vgl. Wahrscheinlichkeitsrechnung: zwei Zufallsvariable sind stochastisch unabhängig, wenn die Produktregel gilt 3

9 3 KORRELATION UND REGRESSION 3. Regression Korrelationskoeffizient r =.5 Korrelationskoeffizient r = Regression Die Regressionsanalse behandelt die folgende Fragestellung: Aus den Realisierungen (Werten einer Zufallsvariablen sollen Vorhersagen über die Werte einer zweiten Zufallsvariablen gemacht werden. Dabei sind natürlich nur dann sinnvolle Aussagen möglich, wenn die beiden Zufallsvariablen stochastisch voneinander abhängen. Beispiele: a Zwischen der Seitenlänge eines Quadrats und seinem Flächeninhalt besteht die Beziehung: = Es besteht ein funktionaler Zusammenhang. Aus der Seitenlänge kann bis auf etwaige Messfehler eakt die Fläche vorhergesagt werden. b Zwischen der Größe eines zufällig ausgewählten Menschen und seinem Körpergewicht dürfte auch eine Zusammenhang bestehen allerdings kein eakter. Aus Erfahrung weiß man, dass ein größerer Mensch m Mittel auch schwerer ist. Die Faustregel größerer Mensch größeres Gewicht ist aber nicht immer erfüllt. 3.. Empirische Regressionskurven Wir betrachten dazu nochmals den Zusammenhang zwischen Mathematik- und Phsiknote bei Abiturienten. Ergänzend zum alten Schema bestimmen wir noch die bedingten Mittelwerte k = h k m i = h i h ik i, r h ik k, k= k =,,..., r k =,,..., m

10 3 KORRELATION UND REGRESSION 3. Regression h i i h k k Die Punkte ( i, i sind im folgenden Schaubild geradlinig miteinander verbunden. Auf ihr liegen die Mittelwerte der Phsiknoten in Abhängigkeit von der Mathematiknote (gekennzeichnet mit *. Die so entstandene Kurve heißt empirische Regressionskurve der Stichprobe bezüglich. Entsprechend ergibt sich eine Regressionskurve bezüglich (gekennzeichnet mit Numerische Regression = f( = g( 5.5 Phsiknote Mathematiknote Das oben beschriebene Verfahren macht nur dann Sinn, wenn zu einem Merkmalswert i mehrere Ausprägungen des Merkmalswertes k gehören und umgekehrt. Sollte dies nicht der Fall sein, so hilft unter Umständen eine Klasseneinteilung. 5

11 3 KORRELATION UND REGRESSION 3. Regression 3.. Regression zweiter Art Die Bestimmung der Regressionsfunktion im vorangegangenen Abschnittt ist recht mühsam und gestattet nur bei großem n eine zufriedenstellende Beschreibung der gegenseitigen stochastischen Unabhängigkeit. Daher ist es manchmal sinnvoll, unter bestimmten Funktionstpen (z.b. Geraden, Parabeln, Eponentialfunktionen oder Logarithmen diejenige zu bestimmen, die nach dem Prinzip der kleinsten Abweichungsquadrate optimal zur Punktewolke liegt. Man nennt dies Regression zweiter Art Regressionsgerade Es sei... n... n die Realisierung einer Stichprobe. Die Ausgleichsgerade wird so konstruiert, dass die Summe der vertikalen Abstandsquadrate aller Punkte von dieser Geraden minimal wird. Herleitung der Regressionsgeraden mit einfachen Hilfsmitteln der Analsis Die Konstruktion der Gerade geht vom arithmetischen Mittelwert der -Werte der Stichprobe aus. ỹ = ŷ + m ( mit = n i, ŷ, m IR Die Summe der Abstandsquadrate Gerade Messpunkte soll minimal werden! d (ŷ, m = n ( i ŷ m( i = n ( i ŷ m n ( i ŷ( i + m n ( i = n ( i ŷ m{ n i i = ( i ŷ m{ i ŷ ( i } + m n ( i } {{ } } {{ } =D (ŷ =D (M Die beiden Summanden D (Ŷ und D (m hängen jeweils nur von einer Variablen ab. Wir }{{}}{{} =nȳ = i i n ȳ} + m ( i erhalten das Minimum von d (ŷ, m indem wir die Minima der beiden Summanden getrennt bestimmen. Minimum von D d ( dŷ i ŷ = { n i nŷ} =! ŷ = ȳ = n i Minimum [ von D ] d m{ n dm i i n ȳ} + m n ( i = { n i i n ȳ}+m n ( i =! 6

12 3 KORRELATION UND REGRESSION 3. Regression m = i i n ȳ = ( i i i n ȳ ( i n ỹ = ȳ + m ( mit = n i, ȳ = n i Herleitung der Regressionsgeraden mit mittels Funktionen mehrerer Variabler Wir benutzen dazu den Ansatz ỹ = a + b a, b IR Daraus ergibt sich die Summe aller vertikalen Abstandsquadrate d (a, b = [ i (a + b i ] Dies ist eine quadratische Funktion der beiden Variablen a und b. Zur Bestimmung des Minimums berechnen wir die partiellen Ableitungen und setzen diese Null. 7 { d = n n } ( a i a b i = i na b n i { d = n n ( b i a b i i = i i a n i b n Hieraus ergeben sich für die beiden Unbekannten a und b die Gleichungen: i }! =! = a + b = ( n n a + b = n i i mit der Lösung i b = i i n = i n s s ; a = b Damit erhalten wir die Regressionsgerade ỹ = b ( = s s ( 7 Die hinreichenden Bedingungen müssen bei dieser einfachen Funktion nicht überprüft werden 7

13 3 KORRELATION UND REGRESSION 3. Regression Die Gerade eignet sich zur Gewinnung von Schätzwerten von bei gegebenen -Werten. Die Zahl b heißt empirischer Regressionskoeffizient von bezüglich. Werden in obiger Beziehung die Bedeutung der - und -Werte miteinander vertauscht, so ergibt sich mit = b ( = s s ( die Gleichung der empirischen Regressionsgeraden von bezüglich. Die beiden Regressionsgeraden haben die Steigungen m = s s und m = s s. Ist die Kovarianz s =, so ergeben sich für m = und für m =. Der Tangens des Schnittwinkels der beiden Regressionsgeraden hängt mit Kovarianz und Varianz bzgl. und wie folgt zusammen: tan(α β = = tan α tan β + tan α tan β s s s s + s s = s s s s (s + s Wurde die Skalierung im - und -Bereich so vorgenommen, dass die Varianzen zu werden, so erhält man einen einfachen Zusammenhang mit dem Korrelationskoeffizienten r(, = s. tan ϕ = s s = ( r(, r(, Für r = ± wird der Schnittwinkel zu Null, für r = wird ϕ = π. Die folgenden Bilder zeigen einige Beispiele für Regressionsgeraden bei verschiedene Korrelationskoeffizienten. Es fällt auf, dass mit zunehmendem Korrelationskoeffizienten die beiden Regressionsgeraden näher aneinander rücken. 8

14 3 KORRELATION UND REGRESSION 3. Regression.8 Ausgleichsgerade; Korrel. Koeff. =.73 Punkte =p ( =q (.8 Ausgleichsgerade; Korrel. Koeff. =.9 Punkte =p ( =q ( Ausgleichsgerade; Korrel. Koeff. =.6 Punkte =p ( =q ( Ausgleichsgerade; Korrel. Koeff. = Punkte =p ( =q ( 3.. Regressionskurven zweiter Art Bei vielen Problemen in der Prais macht es Sinn, anstelle der Regressionsgeraden einen anderen Kurventp zu wählen z.b. Polnome, Eponentialfunktionen und Logarithmen.(So ist bei konstanter Beschleunigung der Zusammenhang zwischen Weg und Zeit quadratisch!! Ein Regressionspolnom vom Grad m ergibt sich mit dem Ansatz ỹ = a + a + a a m m Die Berechnung der Koeffizienten a i geschieht nach demselben Schema wie bei der Geraden nur rechentechnisch etwas aufwendiger. Die Nutzung entsprechender Software-Pakete ist dazu empfehlenswert. 9

15 3 KORRELATION UND REGRESSION 3. Regression Auch hier kann wieder die Bedeutung von und vertauscht werden. Es ergeben sich dann Regressionsansätze der Bauart: = a + a + a a m m Die folgenden Streudiagramme zeigen Regressionspolnome zweiter und dritter Art. Ausgleichsparabel; Res( /N= Punkte =p (

16 3 KORRELATION UND REGRESSION 3. Regression Ausgleichspolnom vom Grad 3; Res( /N=.9; Res( /N=.7.9 Punkte =p 3 ( =q 3 ( Als Maß für die Güte der Ausgleichsfunktion benutzen wir das Quadrat des Abstands von Messwert i und prognostizierten Wert ỹ( i. Res ( = ( i ỹ( i Regressionsprobleme für Polnome lassen sich stets auf das Lösen von linearen Gleichungssstemen zurückführen. Bei allgemeineren Regressionsansätzen ist dies nicht mehr der Fall. Allgemeinere, nichtlineare Optimierungsverfahren sind dann anzuwenden. Bei manchen Funktionstpen führt eine Koordinatentransformation wieder zum linearen Problem. a ỹ = A e b geht durch Logarithmieren über in: ln ỹ }{{} z b ỹ = A b geht durch Logarithmieren über in: ln ỹ }{{} z = ln A + b = ln A + b ln }{{} t Man erhält zwischen z und bzw. t wieder einen linearen Zusammenhang. Minimiert werden die Abstandsquadrate der transformierten Daten. Die folgende Datenmenge legt eine Wurzelfunktion als Regressionskurve zwischen und nahe. Im transformierten Streudiagramm wird ein linearer Zusammenhang deutlich 3

17 3 KORRELATION UND REGRESSION 3. Regression Regressionskurve =.97*.56 ; Res( /N = i i. Regressionsgerade ln( = *ln(..8.6 ln( i ln( i 3

Geg.: Eine Menge von Elementen, z.b.

Geg.: Eine Menge von Elementen, z.b. 1.3 Zweidimensionale Häufigkeitsverteilungen Geg.: Eine Menge von Elementen, z.b. Schüler einer Schule Soldaten eines Bataillons Schrauben einer Stichprobe Tage eines Jahrhunderts Betrachtet werden zwei

Mehr

13 Mehrdimensionale Zufallsvariablen Zufallsvektoren

13 Mehrdimensionale Zufallsvariablen Zufallsvektoren 3 Mehrdimensionale Zufallsvariablen Zufallsvektoren Bisher haben wir uns ausschließlich mit Zufallsexperimenten beschäftigt, bei denen die Beobachtung eines einzigen Merkmals im Vordergrund stand. In diesem

Mehr

Eine zweidimensionale Stichprobe

Eine zweidimensionale Stichprobe Eine zweidimensionale Stichprobe liegt vor, wenn zwei qualitative Merkmale gleichzeitig betrachtet werden. Eine Urliste besteht dann aus Wertepaaren (x i, y i ) R 2 und hat die Form (x 1, y 1 ), (x 2,

Mehr

7.5 Erwartungswert, Varianz

7.5 Erwartungswert, Varianz 7.5 Erwartungswert, Varianz Def. 7.5.: a) X sei eine diskrete ZV, die bei unendl. vielen Werten x k folgende Zusatzbedingung erfüllt: x k p k

Mehr

Didaktisches Seminar über Stochastik. Themen: ffl Korrelation von zwei Zufallsvariablen

Didaktisches Seminar über Stochastik. Themen: ffl Korrelation von zwei Zufallsvariablen Didaktisches Seminar über Stochastik Themen: ffl Gemeinsame Verteilung von zwei Zufallsvariablen ffl Lineare Regression ffl Korrelation von zwei Zufallsvariablen Michael Ralph Pape Mai 1998 1 1 GEMEINSAME

Mehr

Beschreibende Statistik Zweidimensionale (bivariate) Daten

Beschreibende Statistik Zweidimensionale (bivariate) Daten Mathematik II für Biologen Beschreibende Statistik Zweidimensionale (bivariate) Daten 8. Mai 2009 Lineare Regression Transformationen Produktmomenten-Korrelation Rangkorrelation Warnung Stichprobe ( 1,y

Mehr

1 x 1 y 1 2 x 2 y 2 3 x 3 y 3... n x n y n

1 x 1 y 1 2 x 2 y 2 3 x 3 y 3... n x n y n 3.2. Bivariate Verteilungen zwei Variablen X, Y werden gemeinsam betrachtet (an jedem Objekt werden gleichzeitig zwei Merkmale beobachtet) Beobachtungswerte sind Paare von Merkmalsausprägungen (x, y) Beispiele:

Mehr

Kapitel 7. Regression und Korrelation. 7.1 Das Regressionsproblem

Kapitel 7. Regression und Korrelation. 7.1 Das Regressionsproblem Kapitel 7 Regression und Korrelation Ein Regressionsproblem behandelt die Verteilung einer Variablen, wenn mindestens eine andere gewisse Werte in nicht zufälliger Art annimmt. Ein Korrelationsproblem

Mehr

Die Funktion f wird als Regressionsfunktion bezeichnet.

Die Funktion f wird als Regressionsfunktion bezeichnet. Regressionsanalyse Mit Hilfe der Techniken der klassischen Regressionsanalyse kann die Abhängigkeit metrischer (intervallskalierter) Zielgrößen von metrischen (intervallskalierten) Einflussgrößen untersucht

Mehr

Mathematik für Naturwissenschaften, Teil 2

Mathematik für Naturwissenschaften, Teil 2 Lösungsvorschläge für die Aufgaben zur Vorlesung Mathematik für Naturwissenschaften, Teil Zusatzblatt SS 09 Dr. J. Schürmann keine Abgabe Aufgabe : Eine Familie habe fünf Kinder. Wir nehmen an, dass die

Mehr

Prof. Dr. Walter F. Tichy Dr. Matthias Müller Sommersemester 2006

Prof. Dr. Walter F. Tichy Dr. Matthias Müller Sommersemester 2006 Empirische Softwaretechnik Prof. Dr. Walter F. Tichy Dr. Matthias Müller Sommersemester 2006 1 Experiment zur Vererbungstiefe Softwaretechnik: die Vererbungstiefe ist kein guter Schätzer für den Wartungsaufwand

Mehr

Ausführliche Lösungen zu ausgewählten Aufgaben von ÜB 5 und 6. Streudiagramm

Ausführliche Lösungen zu ausgewählten Aufgaben von ÜB 5 und 6. Streudiagramm y Aufgabe 3 Ausführliche Lösungen zu ausgewählten Aufgaben von ÜB 5 und 6 a) Zur Erstellung des Streudiagramms zeichnet man jeweils einen Punkt für jedes Datenpaar (x i, y i ) aus der zweidimensionalen

Mehr

D-CHAB Frühlingssemester 2017 T =

D-CHAB Frühlingssemester 2017 T = D-CHAB Frühlingssemester 17 Grundlagen der Mathematik II Dr Marcel Dettling Lösung 13 1) Die relevanten Parameter sind n = 3, x = 1867, σ x = und µ = 18 (a) Die Teststatistik T = X µ Σ x / n ist nach Annahme

Mehr

Regression und Korrelation

Regression und Korrelation Kapitel 7 Regression und Korrelation Ein Regressionsproblem behandeltdie VerteilungeinerVariablen, wenn mindestens eine andere gewisse Werte in nicht zufälliger Art annimmt. Ein Korrelationsproblem dagegen

Mehr

2 Regressionsgerade und Korrelation

2 Regressionsgerade und Korrelation 17 2 Regressionsgerade und Korrelation In diesem Kapitel wird gezeigt, wie man üperprüfen kann, ob zwei Datensätze zusammenhängen und wie sich ein allfälliger (linearer) Zusammenhang quantitativ beschreiben

Mehr

Deskriptive Beschreibung linearer Zusammenhänge

Deskriptive Beschreibung linearer Zusammenhänge 9 Mittelwert- und Varianzvergleiche Mittelwertvergleiche bei k > 2 unabhängigen Stichproben 9.4 Beispiel: p-wert bei Varianzanalyse (Grafik) Bedienungszeiten-Beispiel, realisierte Teststatistik F = 3.89,

Mehr

Inhaltsverzeichnis. Inhalt Teil I: Beschreibende (Deskriptive) Statistik Seite. 1.0 Erste Begriffsbildungen Merkmale und Skalen 5

Inhaltsverzeichnis. Inhalt Teil I: Beschreibende (Deskriptive) Statistik Seite. 1.0 Erste Begriffsbildungen Merkmale und Skalen 5 Inhaltsverzeichnis Inhalt Teil I: Beschreibende (Deskriptive) Statistik Seite 1.0 Erste Begriffsbildungen 1 1.1 Merkmale und Skalen 5 1.2 Von der Urliste zu Häufigkeitsverteilungen 9 1.2.0 Erste Ordnung

Mehr

5 Erwartungswerte, Varianzen und Kovarianzen

5 Erwartungswerte, Varianzen und Kovarianzen 47 5 Erwartungswerte, Varianzen und Kovarianzen Zur Charakterisierung von Verteilungen unterscheidet man Lageparameter, wie z. B. Erwartungswert ( mittlerer Wert ) Modus (Maximum der Wahrscheinlichkeitsfunktion,

Mehr

Karl Entacher. FH-Salzburg

Karl Entacher. FH-Salzburg Ahorn Versteinert Bernhard.Zimmer@fh-salzburg.ac.at Statistik @ HTK Karl Entacher FH-Salzburg karl.entacher@fh-salzburg.ac.at Beispiel 3 Gegeben sind 241 NIR Spektren (Vektoren der Länge 223) zu Holzproben

Mehr

Statistik I für Betriebswirte Vorlesung 4

Statistik I für Betriebswirte Vorlesung 4 Statistik I für Betriebswirte Vorlesung 4 Prof. Dr. Hans-Jörg Starkloff TU Bergakademie Freiberg Institut für Stochastik 25. April 2016 Prof. Dr. Hans-Jörg Starkloff Statistik I für Betriebswirte Vorlesung

Mehr

Vorlesung 8b. Kovarianz, Korrelation und Regressionsgerade

Vorlesung 8b. Kovarianz, Korrelation und Regressionsgerade Vorlesung 8b Kovarianz, Korrelation und Regressionsgerade 1 1. Die Kovarianz und ihre Eigenschaften 2 Wir erinnern an die Definition der Kovarianz Für reellwertige Zufallsvariable X, Y mit E[X 2 ] < und

Mehr

1 Grundlagen der Wahrscheinlichkeitsrechnung Wahrscheinlichkeitsräume. Ein erster mathematischer Blick auf Zufallsexperimente...

1 Grundlagen der Wahrscheinlichkeitsrechnung Wahrscheinlichkeitsräume. Ein erster mathematischer Blick auf Zufallsexperimente... Inhaltsverzeichnis 1 Grundlagen der Wahrscheinlichkeitsrechnung 1 1.1 Wahrscheinlichkeitsräume Ein erster mathematischer Blick auf Zufallsexperimente.......... 1 1.1.1 Wahrscheinlichkeit, Ergebnisraum,

Mehr

Statistische Methoden in den Umweltwissenschaften

Statistische Methoden in den Umweltwissenschaften Statistische Methoden in den Umweltwissenschaften Korrelationsanalysen Kreuztabellen und χ²-test Themen Korrelation oder Lineare Regression? Korrelationsanalysen - Pearson, Spearman-Rang, Kendall s Tau

Mehr

Vorlesung 9b. Kovarianz und Korrelation

Vorlesung 9b. Kovarianz und Korrelation Vorlesung 9b Kovarianz und Korrelation 1 Wir erinnern an die Definition der Kovarianz Für reellwertige Zufallsvariable X, Y mit E[X 2 ] < und E[Y 2 ] < ist Cov[X,Y]:= E [ (X EX)(Y EY) ] Insbesondere ist

Mehr

5. Spezielle stetige Verteilungen

5. Spezielle stetige Verteilungen 5. Spezielle stetige Verteilungen 5.1 Stetige Gleichverteilung Eine Zufallsvariable X folgt einer stetigen Gleichverteilung mit den Parametern a und b, wenn für die Dichtefunktion von X gilt: f x = 1 für

Mehr

Dynamische Systeme und Zeitreihenanalyse // Multivariate Normalverteilung und ML Schätzung 11 p.2/38

Dynamische Systeme und Zeitreihenanalyse // Multivariate Normalverteilung und ML Schätzung 11 p.2/38 Dynamische Systeme und Zeitreihenanalyse Multivariate Normalverteilung und ML Schätzung Kapitel 11 Statistik und Mathematik WU Wien Michael Hauser Dynamische Systeme und Zeitreihenanalyse // Multivariate

Mehr

Klausur zur Vorlesung

Klausur zur Vorlesung Institut für Mathematische Stochastik WS 2006/2007 Universität Karlsruhe 12. Februar 2007 Priv.-Doz. Dr. D. Kadelka Dipl.-Math. W. Lao Aufgabe 1 (15 Punkte) Klausur zur Vorlesung Statistik für Biologen

Mehr

Regression ein kleiner Rückblick. Methodenseminar Dozent: Uwe Altmann Alexandra Kuhn, Melanie Spate

Regression ein kleiner Rückblick. Methodenseminar Dozent: Uwe Altmann Alexandra Kuhn, Melanie Spate Regression ein kleiner Rückblick Methodenseminar Dozent: Uwe Altmann Alexandra Kuhn, Melanie Spate 05.11.2009 Gliederung 1. Stochastische Abhängigkeit 2. Definition Zufallsvariable 3. Kennwerte 3.1 für

Mehr

Forschungsstatistik I

Forschungsstatistik I Psychologie Prof. Dr. G. Meinhardt 6. Stock, TB II R. 06-206 (Persike) R. 06-321 (Meinhardt) Sprechstunde jederzeit nach Vereinbarung Forschungsstatistik I Dr. Malte Persike persike@uni-mainz.de http://psymet03.sowi.uni-mainz.de/

Mehr

Allgemeine Chemie Computer Praktikum Frühjahrssemester Regressions-Tutorial Lineare und nicht-lineare Regression

Allgemeine Chemie Computer Praktikum Frühjahrssemester Regressions-Tutorial Lineare und nicht-lineare Regression 1 Einführung Allgemeine Chemie Computer Praktikum Frühjahrssemester Regressions-Tutorial Lineare und nicht-lineare Regression Datenauswertung In einem naturwissenschaftlichen Experiment werden Sie meist

Mehr

Vorlesung 7b. Kovarianz und Korrelation

Vorlesung 7b. Kovarianz und Korrelation Vorlesung 7b Kovarianz und Korrelation 1 Wir erinnern an die Definition der Kovarianz Für reellwertige Zufallsvariable X, Y mit E[X 2 ] < und E[Y 2 ] < ist Cov[X,Y]:= E [ (X EX)(Y EY) ] Insbesondere ist

Mehr

Wichtige Definitionen und Aussagen

Wichtige Definitionen und Aussagen Wichtige Definitionen und Aussagen Zufallsexperiment, Ergebnis, Ereignis: Unter einem Zufallsexperiment verstehen wir einen Vorgang, dessen Ausgänge sich nicht vorhersagen lassen Die möglichen Ausgänge

Mehr

Bivariater Zusammenhang bei metrischen Variablen: Regression und Korrelation

Bivariater Zusammenhang bei metrischen Variablen: Regression und Korrelation Bivariater Zusammenhang bei metrischen Variablen: Regression und Korrelation PEΣO 12. November 2001 Von der Tabellenanalyse zur Regression Die bivariate Verteilung zweier metrischer Variablen kann konzeptionell

Mehr

Statistik. Sommersemester Prof. Dr. Stefan Etschberger Hochschule Augsburg. für Betriebswirtschaft und internationales Management

Statistik. Sommersemester Prof. Dr. Stefan Etschberger Hochschule Augsburg. für Betriebswirtschaft und internationales Management für Betriebswirtschaft und internationales Management Sommersemester 2015 Prof. Dr. Stefan Etschberger Hochschule Augsburg Normalverteilung Eine Zufallsvariable X mit einer Dichtefunktion und σ > 0 heißt

Mehr

Vorlesung 8a. Kovarianz und Korrelation

Vorlesung 8a. Kovarianz und Korrelation Vorlesung 8a Kovarianz und Korrelation 1 Wir erinnern an die Definition der Kovarianz Für reellwertige Zufallsvariable X, Y mit E[X 2 ] < und E[Y 2 ] < ist Cov[X, Y ] := E [ (X EX)(Y EY ) ] Insbesondere

Mehr

Reelle Zufallsvariablen

Reelle Zufallsvariablen Kapitel 3 eelle Zufallsvariablen 3. Verteilungsfunktionen esultat aus der Maßtheorie: Zwischen der Menge aller W-Maße auf B, nennen wir sie W B ), und der Menge aller Verteilungsfunktionen auf, nennen

Mehr

Varianz und Kovarianz

Varianz und Kovarianz KAPITEL 9 Varianz und Kovarianz 9.1. Varianz Definition 9.1.1. Sei (Ω, F, P) ein Wahrscheinlichkeitsraum und X : Ω eine Zufallsvariable. Wir benutzen die Notation (1) X L 1, falls E[ X ]

Mehr

Philipp Sibbertsen Hartmut Lehne. Statistik. Einführung für Wirtschafts- und. Sozialwissenschaftler. 2., überarbeitete Auflage. 4^ Springer Gabler

Philipp Sibbertsen Hartmut Lehne. Statistik. Einführung für Wirtschafts- und. Sozialwissenschaftler. 2., überarbeitete Auflage. 4^ Springer Gabler Philipp Sibbertsen Hartmut Lehne Statistik Einführung für Wirtschafts- und Sozialwissenschaftler 2., überarbeitete Auflage 4^ Springer Gabler Inhaltsverzeichnis Teil I Deskriptive Statistik 1 Einführung

Mehr

Anwendungsaufgaben. a. Anhand des Streudiagramms (. Abb. 1) lässt sich ein linearer Zusammenhang vermuten. Aufgabe 1. Anhang 1: Lösungen der Aufgaben

Anwendungsaufgaben. a. Anhand des Streudiagramms (. Abb. 1) lässt sich ein linearer Zusammenhang vermuten. Aufgabe 1. Anhang 1: Lösungen der Aufgaben Anhang 1: Lösungen der Aufgaben 15 +1). Korrelationskoeffizienten unterschiedlicher Stichproben oder verschiedener Variablen können so miteinander verglichen werden, was mit der Kovarianz nicht möglich

Mehr

Wahrscheinlichkeitstheorie und Statistik vom

Wahrscheinlichkeitstheorie und Statistik vom INSTITUT FÜR STOCHASTIK SS 2007 UNIVERSITÄT KARLSRUHE Priv.-Doz. Dr. D. Kadelka Dipl.-Math. oec. W. Lao Klausur (Maschineningenieure) Wahrscheinlichkeitstheorie und Statistik vom 2.9.2007 Musterlösungen

Mehr

Probeklausur zu Mathematik 3 für Informatik

Probeklausur zu Mathematik 3 für Informatik Gunter Ochs Juli 0 Probeklausur zu Mathematik für Informatik Lösungshinweise wie immel ohne Galantie auf Fehreleiheit Sei f ln a Berechnen Sie die und die Ableitung f und f Mit der Produktregel erhält

Mehr

Beschreibende Statistik Zweidimensionale (bivariate) Daten

Beschreibende Statistik Zweidimensionale (bivariate) Daten Mathematik II für Biologen Beschreibende Statistik Zweidimensionale (bivariate) Daten 26. April 2013 Prolog Lineare Regression Transformationen Produktmomenten-Korrelation Rangkorrelation Warnung Artensterben

Mehr

Lösungen zur Klausur GRUNDLAGEN DER WAHRSCHEINLICHKEITSTHEORIE UND STATISTIK

Lösungen zur Klausur GRUNDLAGEN DER WAHRSCHEINLICHKEITSTHEORIE UND STATISTIK Institut für Stochastik Dr. Steffen Winter Lösungen zur Klausur GRUNDLAGEN DER WAHRSCHEINLICHKEITSTHEORIE UND STATISTIK für Studierende der INFORMATIK vom 17. Juli 01 (Dauer: 90 Minuten) Übersicht über

Mehr

Mathematik 2 für Naturwissenschaften

Mathematik 2 für Naturwissenschaften Hans Walser Mathematik 2 für Naturwissenschaften Modul 202 Regressionsgerade und Korrelation Lernumgebung. Teil Hans Walser: Modul 202, Regressionsgerade und Korrelation. Lernumgebung. ii Inhalt Messwertpaare...

Mehr

Übungsklausur zur Vorlesung Wahrscheinlichkeit und Regression Thema: Wahrscheinlichkeit. Übungsklausur Wahrscheinlichkeit und Regression

Übungsklausur zur Vorlesung Wahrscheinlichkeit und Regression Thema: Wahrscheinlichkeit. Übungsklausur Wahrscheinlichkeit und Regression Übungsklausur Wahrscheinlichkeit und Regression 1. Welche der folgenden Aussagen treffen auf ein Zufallsexperiment zu? a) Ein Zufallsexperiment ist ein empirisches Phänomen, das in stochastischen Modellen

Mehr

Mehrdimensionale Zufallsvariablen

Mehrdimensionale Zufallsvariablen Mehrdimensionale Zufallsvariablen Im Folgenden Beschränkung auf den diskreten Fall und zweidimensionale Zufallsvariablen. Vorstellung: Auswerten eines mehrdimensionalen Merkmals ( ) X Ỹ also z.b. ω Ω,

Mehr

Versuchsplanung und multivariate Statistik Sommersemester 2018

Versuchsplanung und multivariate Statistik Sommersemester 2018 Versuchsplanung und multivariate Statistik Sommersemester 2018 Vorlesung 11: Lineare und nichtlineare Modellierung I Prof. Dr. Hans-Jörg Starkloff TU Bergakademie Freiberg Institut für Stochastik 6.6.2018

Mehr

Inhaltsverzeichnis (Ausschnitt)

Inhaltsverzeichnis (Ausschnitt) 4 Zweidimensionale Daten Inhaltsverzeichnis (Ausschnitt) 4 Zweidimensionale Daten Häufigkeitsverteilungen unklassierter Daten Häufigkeitsverteilungen klassierter Daten Bedingte Häufigkeitsverteilungen

Mehr

Mathematik 2 Probeprüfung 1

Mathematik 2 Probeprüfung 1 WWZ Wirtschaftswissenschaftliche Fakultät der Universität Basel Dr. Thomas Zehrt Bitte in Druckbuchstaben ausfüllen: Name Vorname Mathematik 2 Probeprüfung 1 Zeit: 90 Minuten, Maximale Punktzahl: 72 Zur

Mehr

Statistik für Ingenieure Vorlesung 10

Statistik für Ingenieure Vorlesung 10 Statistik für Ingenieure Vorlesung 10 Prof. Dr. Hans-Jörg Starkloff TU Bergakademie Freiberg Institut für Stochastik 16. Januar 2018 4.2.5. Kenngrößen für kategorielle Daten Für eine diskrete Wahrscheinlichkeitsverteilung

Mehr

Dr. W. Kuhlisch Dresden, Institut für Mathematische Stochastik

Dr. W. Kuhlisch Dresden, Institut für Mathematische Stochastik Dr. W. Kuhlisch Dresden, 12. 08. 2014 Institut für Mathematische Stochastik Klausur Statistik für Studierende der Fachrichtungen Hydrologie und Altlasten/Abwasser zugelassene Hilfsmittel: Taschenrechner

Mehr

Bivariate Verteilungen [bivariate data]

Bivariate Verteilungen [bivariate data] Bivariate Verteilungen [bivariate data] Zwei Variablen X, Y werden gemeinsam betrachtet, d.h. an jedem Objekt i werden zwei Merkmale beobachtet. Beobachtungswerte sind Paare/Kombinationen von Merkmalsausprägungen

Mehr

Statistik. Ronald Balestra CH St. Peter

Statistik. Ronald Balestra CH St. Peter Statistik Ronald Balestra CH - 7028 St. Peter www.ronaldbalestra.ch 17. Januar 2010 Inhaltsverzeichnis 1 Statistik 1 1.1 Beschreibende Statistik....................... 1 1.2 Charakterisierung von Häufigkeitsverteilungen...........

Mehr

Übungsblatt 9 (25. bis 29. Juni)

Übungsblatt 9 (25. bis 29. Juni) Statistik 2 Dr. Andrea Beccarini Dipl.-Vw. Dipl.-Kffr. Heike Bornewasser-Hermes Sommersemester 2012 Übungsblatt 9 (25. bis 29. Juni) Stetiges Verteilungsmodell und Gemeinsame Verteilung Stetiges Verteilungsmodell

Mehr

Statistische Analyseverfahren Abschnitt 2: Zufallsvektoren und mehrdimensionale Verteilungen

Statistische Analyseverfahren Abschnitt 2: Zufallsvektoren und mehrdimensionale Verteilungen Statistische Analyseverfahren Abschnitt 2: Zufallsvektoren und mehrdimensionale Verteilungen Prof. Dr. Hans-Jörg Starkloff TU Bergakademie Freiberg Institut für Stochastik Oktober 2018 Prof. Dr. Hans-Jörg

Mehr

Uwe Hassler. Statistik im. Bachelor-Studium. Eine Einführung. für Wirtschaftswissenschaftler. ^ Springer Gabler

Uwe Hassler. Statistik im. Bachelor-Studium. Eine Einführung. für Wirtschaftswissenschaftler. ^ Springer Gabler Uwe Hassler Statistik im Bachelor-Studium Eine Einführung für Wirtschaftswissenschaftler ^ Springer Gabler 1 Einführung 1 2 Beschreibende Methoden univariater Datenanalyse 5 2.1 Grundbegriffe 5 2.2 Häufigkeitsverteilungen

Mehr

Wahrscheinlichkeitstheorie und Statistik vom

Wahrscheinlichkeitstheorie und Statistik vom INSTITUT FÜR STOCHASTIK SS 2010 Karlsruher Institut für Technologie Priv.-Doz. Dr. D. Kadelka Klausur Wahrscheinlichkeitstheorie und Statistik vom 14.9.2010 Musterlösungen Aufgabe 1: Gegeben sei eine Urliste

Mehr

Statistik. Sommersemester Stefan Etschberger. für Betriebswirtschaft, Internationales Management, Wirtschaftsinformatik und Informatik

Statistik. Sommersemester Stefan Etschberger. für Betriebswirtschaft, Internationales Management, Wirtschaftsinformatik und Informatik Stefan Etschberger für Betriebswirtschaft, Internationales Management, Wirtschaftsinformatik und Informatik Sommersemester 2017 Rechenregeln für den Erwartungswert Ist f symmetrisch bzgl. a, so gilt E(X)

Mehr

K. Eppler, Inst. f. Num. Mathematik Übungsaufgaben. 12. Übung SS 18: Woche vom

K. Eppler, Inst. f. Num. Mathematik Übungsaufgaben. 12. Übung SS 18: Woche vom Übungsaufgaben 12. Übung SS 18: Woche vom 2. 7. 6. 7. 2018 Stochastik VI: Zufallsvektoren; Funktionen von ZG Aufgaben: s. pdf auf der homepage von Dr. Vanselow http://www.math.tu-dresden.de/ vanselow/...

Mehr

Multivariate Verteilungen und Copulas

Multivariate Verteilungen und Copulas Multivariate Verteilungen und Copulas Zufallsvektoren und Modellierung der Abhängigkeiten Ziel: Modellierung der Veränderungen der Risikofaktoren X n = (X n,1, X n,2,..., X n,d ) Annahme: X n,i und X n,j

Mehr

Klassifikation von Signifikanztests

Klassifikation von Signifikanztests Klassifikation von Signifikanztests nach Verteilungsannahmen: verteilungsabhängige = parametrische Tests verteilungsunabhängige = nichtparametrische Tests Bei parametrischen Tests werden im Modell Voraussetzungen

Mehr

Statistik I. 1. Klausur Wintersemester 2010/2011 Hamburg, Art der Anmeldung: STiNE FlexNow Zulassung unter Vorbehalt

Statistik I. 1. Klausur Wintersemester 2010/2011 Hamburg, Art der Anmeldung: STiNE FlexNow Zulassung unter Vorbehalt Statistik I 1. Klausur Wintersemester 2010/2011 Hamburg, 11.02.2011 BITTE LESERLICH IN DRUCKBUCHSTABEN AUSFÜLLEN! Nachname:............................................................................ Vorname:.............................................................................

Mehr

1.5 Mehrdimensionale Verteilungen

1.5 Mehrdimensionale Verteilungen Poisson eine gute Näherung, da np = 0 und 500p = 5 00 = n. Wir erhalten somit als Näherung Exakte Rechnung ergibt P(2 X 0) = k=2 0 k=2 π (k) = 0,26424. 0 ( ) 00 P(2 X 0) = 0,0 k 0,99 00 k = 0,264238. k.4.2.4

Mehr

Dr. Maike M. Burda. Welchen Einfluss hat die Körperhöhe auf das Körpergewicht? Eine Regressionsanalyse. HU Berlin, Econ Bootcamp

Dr. Maike M. Burda. Welchen Einfluss hat die Körperhöhe auf das Körpergewicht? Eine Regressionsanalyse. HU Berlin, Econ Bootcamp Dr. Maike M. Burda Welchen Einfluss hat die Körperhöhe auf das Körpergewicht? Eine Regressionsanalyse. HU Berlin, Econ Bootcamp 8.-10. Januar 2010 BOOTDATA.GDT: 250 Beobachtungen für die Variablen... cm:

Mehr

Kapitel XI - Korrelationsrechnung

Kapitel XI - Korrelationsrechnung Universität Karlsruhe (TH) Institut für Statistik und Mathematische Wirtschaftstheorie Kapitel XI - Korrelationsrechnung Markus Höchstötter Uni Karlsruhe Karlsruhe, SS 2008 Kapitel XI - Korrelationsrechnung

Mehr

TEIL 12: BIVARIATE ANALYSE FÜR METRISCH SKALIERTE VARIABLEN

TEIL 12: BIVARIATE ANALYSE FÜR METRISCH SKALIERTE VARIABLEN TEIL 12: BIVARIATE ANALYSE FÜR METRISCH SKALIERTE VARIABLEN Bivariate Analyse für metrisch skalierte Variablen Grundlagen Verfahren für metrische Daten nutzen den vollen mathematischen Informationsgehalt

Mehr

(f(xi ) y i ) 2. minimal ist: man will also die Summe der quadratischen Abweichungen minimieren ... f(x i ) y i, i=1 (t x i) 2

(f(xi ) y i ) 2. minimal ist: man will also die Summe der quadratischen Abweichungen minimieren ... f(x i ) y i, i=1 (t x i) 2 Mathematik für Biologen, Biotechnologen und Biochemiker Lineare Regression Gegeben seien Datenpaare (, ), (, ),, ( n, n ) Wir stellen die Frage, ob sich die Zahlen i als Werte einer linearen Funktion i

Mehr

Welche der folgenden Aussagen sind richtig? (x aus 5) A Ein metrisches Merkmal, das überabzählbar viele Ausprägungen besitzt heißt diskret.

Welche der folgenden Aussagen sind richtig? (x aus 5) A Ein metrisches Merkmal, das überabzählbar viele Ausprägungen besitzt heißt diskret. Grundlagen der Statistik 25.9.2014 7 Aufgabe 7 Welche der folgenden Aussagen sind richtig? (x aus 5) A Ein metrisches Merkmal, das überabzählbar viele Ausprägungen besitzt heißt diskret. B Ein Merkmal

Mehr

Dr. Maike M. Burda. Welchen Einfluss hat die Körperhöhe auf das Körpergewicht? Eine Regressionsanalyse. HU Berlin, Econ Bootcamp 7.-9.

Dr. Maike M. Burda. Welchen Einfluss hat die Körperhöhe auf das Körpergewicht? Eine Regressionsanalyse. HU Berlin, Econ Bootcamp 7.-9. Dr. Maike M. Burda Welchen Einfluss hat die Körperhöhe auf das Körpergewicht? Eine Regressionsanalyse. HU Berlin, Econ Bootcamp 7.-9. Januar 2011 BOOTDATA11.GDT: 250 Beobachtungen für die Variablen...

Mehr

3. Gemeinsame und bedingte Verteilung, stochastische Unabhängigkeit

3. Gemeinsame und bedingte Verteilung, stochastische Unabhängigkeit 3. Gemeinsame und bedingte Verteilung, stochastische Unabhängigkeit Lernziele dieses Kapitels: Mehrdimensionale Zufallsvariablen (Zufallsvektoren) (Verteilung, Kenngrößen) Abhängigkeitsstrukturen Multivariate

Mehr

Eine Firma will den Zusammenhang zwischen Werbungskosten und Absatz untersuchen. Dazu nimmt sie zunächst eine Stichprobe dieser beiden Merkmale

Eine Firma will den Zusammenhang zwischen Werbungskosten und Absatz untersuchen. Dazu nimmt sie zunächst eine Stichprobe dieser beiden Merkmale Wirtschaftswissenschaftliches Zentrum 4 Universität Basel Statistik Dr. Thomas Zehrt Regression Motivation Eine Firma will den Zusammenhang zwischen Werbungskosten und Absatz untersuchen. Dazu nimmt sie

Mehr

Statistik Probeprüfung 1

Statistik Probeprüfung 1 WWZ Wirtschaftswissenschaftliche Fakultät der Universität Basel Dr. Thomas Zehrt Bitte in Druckbuchstaben ausfüllen: Name Vorname Statistik Probeprüfung 1 Zeit: 90 Minuten, Maximale Punktzahl: 72 Zur Orientierung:

Mehr

Lösungen zur Klausur WAHRSCHEINLICHKEITSTHEORIE UND STATISTIK (STOCHASTIK)

Lösungen zur Klausur WAHRSCHEINLICHKEITSTHEORIE UND STATISTIK (STOCHASTIK) Institut für Stochastik Dr. Steffen Winter Lösungen zur Klausur WAHRSCHEINLICHKEITSTHEORIE UND STATISTIK (STOCHASTIK) für Studierende des Maschinenbaus vom 7. Juli (Dauer: 8 Minuten) Übersicht über die

Mehr

1 Multivariate Zufallsvariablen

1 Multivariate Zufallsvariablen 1 Multivariate Zufallsvariablen 1.1 Multivariate Verteilungen Definition 1.1. Zufallsvariable, Zufallsvektor (ZV) Sei Ω die Ergebnismenge eines Zufallsexperiments. Eine (univariate oder eindimensionale)

Mehr

Übersicht Teil 1 - deskriptive Statistik

Übersicht Teil 1 - deskriptive Statistik 1 Übersicht Teil 1 - deskriptive Statistik x = (x 1, x,, x n ) Stichprobe vom Umfang n Die x i heißen Stichprobenwerte Alle unterschiedlichen Werte, die unter den x i vorkommen, nennt man Merkmalswerte

Mehr

Statistik II. Lineare Regressionsrechnung. Wiederholung Skript 2.8 und Ergänzungen (Schira: Kapitel 4) Statistik II

Statistik II. Lineare Regressionsrechnung. Wiederholung Skript 2.8 und Ergänzungen (Schira: Kapitel 4) Statistik II Statistik II Lineare Regressionsrechnung Wiederholung Skript 2.8 und Ergänzungen (Schira: Kapitel 4) Statistik II - 09.06.2006 1 Mit der Kovarianz und dem Korrelationskoeffizienten können wir den statistischen

Mehr

Wahrscheinlichkeitsrechnung und Statistik

Wahrscheinlichkeitsrechnung und Statistik 7. Vorlesung - 2018 Bemerkung: Sei X = X 1,..., X n Zufallsvektor. Der n dimensionale Vektor EX = EX 1,..., EX n ist der Erwartungswert des Zufallsvektors X. Beispiel: Seien X, Y N0, 1. X, Y sind die Koordinaten

Mehr

TEIL 12: BIVARIATE ANALYSE FÜR METRISCH SKALIERTE VARIABLEN

TEIL 12: BIVARIATE ANALYSE FÜR METRISCH SKALIERTE VARIABLEN TEIL 12: BIVARIATE ANALYSE FÜR METRISCH SKALIERTE VARIABLEN GLIEDERUNG Bivariate Analyse für metrisch skalierte Variablen Grundlagen Streudiagramme und Visualisierungen von Zusammenhängen Positive lineare

Mehr

Statistik I für Betriebswirte Vorlesung 3

Statistik I für Betriebswirte Vorlesung 3 Statistik I für Betriebswirte Vorlesung 3 Dr. Andreas Wünsche TU Bergakademie Freiberg Institut für Stochastik 15. April 2019 Dr. Andreas Wünsche Statistik I für Betriebswirte Vorlesung 3 Version: 1. April

Mehr

ELEMENTARE EINFÜHRUNG IN DIE MATHEMATISCHE STATISTIK

ELEMENTARE EINFÜHRUNG IN DIE MATHEMATISCHE STATISTIK DIETER RASCH ELEMENTARE EINFÜHRUNG IN DIE MATHEMATISCHE STATISTIK MIT 53 ABBILDUNGEN UND 111 TABELLEN ZWEITE, BERICHTIGTE UND ERWEITERTE AUFLAGE s-~v VEB DEUTSCHER VERLAG DER WISSENSCHAFTEN BERLIN 1970

Mehr

7. Grenzwertsätze. Dr. Antje Kiesel Institut für Angewandte Mathematik WS 2011/2012

7. Grenzwertsätze. Dr. Antje Kiesel Institut für Angewandte Mathematik WS 2011/2012 7. Grenzwertsätze Dr. Antje Kiesel Institut für Angewandte Mathematik WS 2011/2012 Mittelwerte von Zufallsvariablen Wir betrachten die arithmetischen Mittelwerte X n = 1 n (X 1 + X 2 + + X n ) von unabhängigen

Mehr

Multiple Regressionsanalyse - Kurzabriss

Multiple Regressionsanalyse - Kurzabriss Multiple Regressionsanalyse - Kurzabriss Ziele: Schätzung eines Kriteriums aus einer Linearkombination von Prädiktoren Meist zu Screening-Untersuchungen, um den Einfluß von vermuteten Ursachenvariablen

Mehr

Zufallsvariablen. Diskret. Stetig. Verteilung der Stichprobenkennzahlen. Binomial Hypergeometrisch Poisson. Normal Lognormal Exponential

Zufallsvariablen. Diskret. Stetig. Verteilung der Stichprobenkennzahlen. Binomial Hypergeometrisch Poisson. Normal Lognormal Exponential Zufallsvariablen Diskret Binomial Hypergeometrisch Poisson Stetig Normal Lognormal Exponential Verteilung der Stichprobenkennzahlen Stetige Zufallsvariable Verteilungsfunktion: Dichtefunktion: Integralrechnung:

Mehr

Die Korrelation von Merkmalen

Die Korrelation von Merkmalen Die Korrelation von Merkmalen In der Analse von Datenmaterial ist eines der Hauptziele der Statistik eine Abhängigkeit bzw. einen Zusammenhang zwischen Merkmalen zu erkennen. Die Korrelation ermittelt

Mehr

Einführung in die Statistik

Einführung in die Statistik Einführung in die Statistik Analyse und Modellierung von Daten Von Prof. Dr. Rainer Schlittgen 4., überarbeitete und erweiterte Auflage Fachbereich Materialwissenschaft! der Techn. Hochschule Darmstadt

Mehr

Grundlagen der Statistik

Grundlagen der Statistik Grundlagen der Statistik Übung 2 2010 FernUniversität in Hagen Alle Rechte vorbehalten Fakultät für Wirtschaftswissenschaft Übersicht über die mit den Übungsaufgaben geprüften Lehrzielgruppen Lehrzielgruppe

Mehr

Biomathematik für Mediziner

Biomathematik für Mediziner Institut für Medizinische Biometrie, Informatik und Epidemiologie der Universität Bonn (Direktor: Prof. Dr. Max P. Baur) Biomathematik für Mediziner Klausur SS 2002 Aufgabe 1: Franz Beckenbauer will, dass

Mehr

Goethe-Universität Frankfurt

Goethe-Universität Frankfurt Goethe-Universität Frankfurt Fachbereich Wirtschaftswissenschaft PD Dr. Martin Biewen Dr. Ralf Wilke Sommersemester 2006 Klausur Statistik II 1. Alle Aufgaben sind zu beantworten. 2. Bitte runden Sie Ihre

Mehr

Teil VIII. Zentraler Grenzwertsatz und Vertrauensintervalle. Woche 6: Zentraler Grenzwertsatz und Vertrauensintervalle. Lernziele. Typische Situation

Teil VIII. Zentraler Grenzwertsatz und Vertrauensintervalle. Woche 6: Zentraler Grenzwertsatz und Vertrauensintervalle. Lernziele. Typische Situation Woche 6: Zentraler Grenzwertsatz und Vertrauensintervalle Patric Müller ETHZ Teil VIII Zentraler Grenzwertsatz und Vertrauensintervalle WBL 17/19, 29.05.2017 Wahrscheinlichkeit

Mehr

Statistik I. Zusammenfassung und wichtiges zur Prüfungsvorbereitung. Malte Wissmann. 9. Dezember Universität Basel.

Statistik I. Zusammenfassung und wichtiges zur Prüfungsvorbereitung. Malte Wissmann. 9. Dezember Universität Basel. Zusammenfassung und wichtiges zur Prüfungsvorbereitung 9. Dezember 2008 Begriffe Kenntnis der wichtigen Begriffe und Unterscheidung dieser. Beispiele: Merkmal, Merkmalsraum, etc. Skalierung: Nominal etc

Mehr

Verteilungen mehrerer Variablen

Verteilungen mehrerer Variablen Kapitel 3 Verteilungen mehrerer Variablen 3. Eigenschaften von Verteilungen mehrerer Variablen Im allgemeinen muss man Wahrscheinlichkeiten für mehrere Variable, die häufig auch voneinander abhängen, gleichzeitig

Mehr

Verteilungen eindimensionaler stetiger Zufallsvariablen Stetige Verteilungen. Chi-Quadrat-Verteilung Studentverteilung Fisher-Verteilung

Verteilungen eindimensionaler stetiger Zufallsvariablen Stetige Verteilungen. Chi-Quadrat-Verteilung Studentverteilung Fisher-Verteilung Verteilungen eindimensionaler stetiger Zufallsvariablen Stetige Verteilungen Chi-Quadrat-Verteilung Studentverteilung Fisher-Verteilung Typisierung der stetigen theoretischen Verteilungen Bibliografie:

Mehr

Einführung in die Statistik

Einführung in die Statistik Einführung in die Statistik Analyse und Modellierung von Daten von Prof. Dr. Rainer Schlittgen Universität Hamburg 12., korrigierte Auflage Oldenbourg Verlag München Inhaltsverzeichnis 1 Statistische Daten

Mehr

Pearson- Korrelationskoeffizienten höherer Grade

Pearson- Korrelationskoeffizienten höherer Grade Pearson- Korrelationskoeffizienten höherer Grade Dipl.- Ing. Björnstjerne Zindler, M.Sc. Erstellt: 13. März 2014 Letzte Revision: 16. März 2014 Inhaltsverzeichnis 1 Einleitung 2 2 Der Lineare Korrelationskoeffizient

Mehr

Teil: lineare Regression

Teil: lineare Regression Teil: lineare Regression 1 Einführung 2 Prüfung der Regressionsfunktion 3 Die Modellannahmen zur Durchführung einer linearen Regression 4 Dummyvariablen 1 Einführung o Eine statistische Methode um Zusammenhänge

Mehr

Biomathematik für Mediziner

Biomathematik für Mediziner Institut für Medizinische Biometrie, Informatik und Epidemiologie der Universität Bonn (Direktor: Prof. Dr. Max P. Baur) Biomathematik für Mediziner Klausur WS 2002/2003 Aufgabe 1: Man gehe davon aus,

Mehr