Wie kann ich überprüfen, welche Verteilung meinen Daten zu Grunde liegt? Chi-Quadrat-Test auf Normalverteilung

Größe: px
Ab Seite anzeigen:

Download "Wie kann ich überprüfen, welche Verteilung meinen Daten zu Grunde liegt? Chi-Quadrat-Test auf Normalverteilung"

Transkript

1 Wie kann ich überprüfen, welche Verteilung meinen Daten zu Grunde liegt? Chi-Quadrat-Test auf Normalverteilung T. Kießling: Fortgeschrittene Fehlerrechnung - Korrelation Vorlesung 03-1

2 Chi-Quadrat-Test: Test auf Normal-Verteilung Konkretes Beispiel (im Geiste R. Schlittgen Einführung in die Statistik (Oldenbourg), 1998.): Studentische Wohnungsuche: Vergleich der Kaltmieten einer -Raum Wohnung. Gewissenhafte Recherche ergibt folgende Liste an Angeboten in EUR: Unser Student fragt sich: Ist das völlige Willkür? Sind vorliegende Daten auf eine bestimmte Art verteilt? Normalverteilt? Festlegen der Irrtumswahrscheinlichkeit: Testen auf 5 % T. Kießling: Fortgeschrittene Fehlerrechnung - Korrelation Vorlesung 03-

3 Chi-Quadrat-Test: Test auf Normal-Verteilung Erster Schritt: Sortieren der Urliste: Mietpreise in EUR Zweiter Schritt: Einteilung nach Klassen: Anzahl der Klassen k? Faustregel: k = 5*log(Spannweite) In unserem Beispiel: k = 5*log(670) 14 Das ist keine harte Regel, die Wahl wird im Rahmen unseres Hypothesentest zu überprüfen sein! Programme wie Excel oder Origin verwenden k =, mit n Anzahl Datenpunkte. Das führt ohne kritische Betrachtung schnell zu Problemen mit der Gleichverteilung der Merkmalsausprägung T. Kießling: Fortgeschrittene Fehlerrechnung - Korrelation Vorlesung 03-3

4 Chi-Quadrat-Test: Test auf Normal-Verteilung Zweiter Schritt: Einteilung nach Klassen in EUR: Klassen Nr. Mietpreisklasse Absolute Häufigkeit Relative Häufigkeit bis 00 0, bis , bis , bis , bis , bis , bis , bis , bis 600 0, bis , bis 700 0, bis , bis , bis ,07 T. Kießling: Fortgeschrittene Fehlerrechnung - Korrelation Vorlesung 03-4

5 Chi-Quadrat-Test: Test auf Normal-Verteilung Zweiter Schritt: Einteilung nach Klassen in EUR: Klassen Nr. Mietpreisklasse Absolute Häufigkeit Relative Häufigkeit 10 Qualitativer Test: Graphische Darstellung Kaltmiete -Raum Wohnung bis 00 0, bis , bis , bis , bis , bis , bis ,1364 Absolute Häufigkeit Mietpreis (EUR) Ist das eine Normalverteilung? bis , bis 600 0, bis , bis 700 0, bis , bis , bis ,07 Annahme: Es ist eine! Bestimme Mittelwert und Stichprobenstandardabweichung = 495,48 = 181,70 T. Kießling: Fortgeschrittene Fehlerrechnung - Korrelation Vorlesung 03-5

6 Chi-Quadrat-Test: Test auf Normal-Verteilung Zweiter Schritt: Einteilung nach Klassen in EUR: Klassen Nr. Mietpreisklasse Absolute Häufigkeit Relative Häufigkeit Qualitativer Test: Graphische Darstellung Kaltmiete -Raum Wohnung bis 00 0, bis , bis , bis , bis ,045 Absolute Häufigkeit Mietpreis (EUR) Ist das eine Normalverteilung? bis , bis , bis , bis 600 0, bis , bis 700 0, bis , bis , bis ,07 Annahme: Es ist eine! Bestimme Mittelwert und Stichprobenstandardabweichung = 495,48 = 181,70 T. Kießling: Fortgeschrittene Fehlerrechnung - Korrelation Vorlesung 03-6

7 Die Fehlerfunktion allgemeine Form Jetzt benötigen wir die Anwort auf die Frage: Wie viel % der Messwerte liegen oberhalb (unterhalb) eines bestimmten Messwertes? Wie groß ist das Integral bis zu einem bestimmten Wert? z 1 zwischen und t σ e dz mit t ( xx) / t T. Kießling: Fortgeschrittene Fehlerrechnung - Korrelation Vorlesung 03-7

8 Chi-Quadrat-Test: Test auf Normal-Verteilung Dritter Schritt: Bestimme theoretische Häufigkeit der Klassen bei Normalverteilung Klassen Nr. Merkmalsgrenze t , , , , , , , , , , , , , ,951 Nun: Bestimme Wahrscheinlichkeit T. Kießling: Fortgeschrittene Fehlerrechnung - Korrelation Vorlesung 03-8

9 Chi-Quadrat-Test: Test auf Normal-Verteilung Erf () t P( x X t ) Px ( X1,66 ) 0,5 0, , 0516 T. Kießling: Fortgeschrittene Fehlerrechnung - Korrelation Vorlesung 03-9

10 Chi-Quadrat-Test: Test auf Normal-Verteilung Dritter Schritt: Bestimme theoretische Häufigkeit der Klassen bei Normalverteilung Klassen Nr. Merkmalsgrenze t Erf(t) ,66 0, ,3510 0, ,0758 0, ,8007 0, ,555 0, ,503 0, ,049 0, ,3001 0, ,5753 0, ,8504 0, ,156 0, ,4008 0, ,6760 0, ,951 0,9744 T. Kießling: Fortgeschrittene Fehlerrechnung - Korrelation Vorlesung 03-10

11 Chi-Quadrat-Test: Test auf Normal-Verteilung Damit bestimmen wir jetzt die Wahrscheinlichkeit für die einzelnen Klassen: Klassen Nr. Merkmalsgrenze t Erf(t) ,66 0, ,3510 0,0885 Die Wahrscheinlichkeit einen Wert zwischen 00 und 50 zu erhalten ist gegeben durch: PX ( 1, 66 x X1,3510 ) 0, , , 0369 Wir hatten insgesamt 44 Werte. Wir würden also folgende Anzahl Werte in dieser Klasse erwarten: np( X 1, 66 x X 1,3510 ) 440, , 64 Damit können wir nun unsere theoretische Häufigkeit bestimmen T. Kießling: Fortgeschrittene Fehlerrechnung - Korrelation Vorlesung 03-11

12 Chi-Quadrat-Test: Test auf Normal-Verteilung Klassen Nr. Mietpreisklasse Theoretische Wahrscheinlichkeit Theoretische Häufigkeit bis 00 0,035 1, bis 50 0,0369 1, bis 300 0,0516, bis 350 0,0718 3, bis 400 0,0871 3, bis 450 0,103 4, bis 500 0,1107 4, bis 550 0,1059 4, bis 600 0,1011 4, bis 650 0,0833 3, bis 700 0,0685 3, bis 750 0,0484, bis 800 0,0343 1, bis 850 0,009 0,9196 T. Kießling: Fortgeschrittene Fehlerrechnung - Korrelation Vorlesung 03-1

13 Chi-Quadrat-Test: Test auf Normal-Verteilung Klassen Nr. Mietpreisklasse Theoretische Wahrscheinlichkeit Theoretische Häufigkeit bis 00 0,035 1, bis 50 0,0369 1, bis 300 0,0516,704 8, bis 350 0,0718 3, bis 400 0,0871 3, bis 450 0,103 4, bis 500 0,1107 4, bis 550 0,1059 4, bis 600 0,1011 4, bis 650 0,0833 3,665 8,3386 9,5304 8, bis 700 0,0685 3, bis 750 0,0484, bis 800 0,0343 1,509 7, bis 850 0,009 0,9196 Hier zeigt sich nun, dass für den Chi-Quadrat-Test die ursprüngliche Klasseneinteilung ungeeignet ist! Der Test darf nur angewandt werden, wenn die theoretische Häufigkeit einer Klasse 5 ist T. Kießling: Fortgeschrittene Fehlerrechnung - Korrelation Vorlesung 03-13

14 Chi-Quadrat-Test: Test auf Normal-Verteilung Klassen Nr. Mietpreisklasse Theoretische Häufigkeit Gemessene Häufigkeit bis 350 8, bis 450 8, bis 550 9, bis 650 8, bis 850 7,574 Sortierte Mietpreise in EUR: T. Kießling: Fortgeschrittene Fehlerrechnung - Korrelation Vorlesung 03-14

15 Chi-Quadrat-Test: Test auf Normal-Verteilung Klassen Nr. Mietpreisklasse Theoretische Häufigkeit Gemessene Häufigkeit bis 350 8, bis 450 8, bis 550 9, bis 650 8, bis 850 7,574 Sortierte Mietpreise in EUR: T. Kießling: Fortgeschrittene Fehlerrechnung - Korrelation Vorlesung 03-15

16 Chi-Quadrat-Test: Test auf Normal-Verteilung Klassen Nr. Mietpreisklasse Theoretische Häufigkeit Gemessene Häufigkeit bis 350 8, bis 450 8, bis 550 9, bis 650 8, bis 850 7,574 Sortierte Mietpreise in EUR: T. Kießling: Fortgeschrittene Fehlerrechnung - Korrelation Vorlesung 03-16

17 Chi-Quadrat-Test: Test auf Normal-Verteilung Klassen Nr. Mietpreisklasse Theoretische Häufigkeit Gemessene Häufigkeit bis 350 8, bis 450 8, bis 550 9, bis 650 8, bis 850 7,574 Sortierte Mietpreise in EUR: T. Kießling: Fortgeschrittene Fehlerrechnung - Korrelation Vorlesung 03-17

18 Chi-Quadrat-Test: Test auf Normal-Verteilung Klassen Nr. Mietpreisklasse Theoretische Häufigkeit Gemessene Häufigkeit bis 350 8, bis 450 8, bis 550 9, bis 650 8, bis 850 7,574 Sortierte Mietpreise in EUR: T. Kießling: Fortgeschrittene Fehlerrechnung - Korrelation Vorlesung 03-18

19 Chi-Quadrat-Test: Test auf Normal-Verteilung Klassen Nr. Mietpreisklasse Theoretische Häufigkeit Gemessene Häufigkeit bis 350 8, bis 450 8, bis 550 9, bis 650 8, bis 850 7,574 1 Sortierte Mietpreise in EUR: Damit testen wir nun auf eine Irrtumswahrscheinlichkeit von 5% E T n n k k Qk k1 Tk k1 8, 6073 T. Kießling: Fortgeschrittene Fehlerrechnung - Korrelation Vorlesung 03-19

20 Chi-Quadrat-Test: Test auf Normal-Verteilung Klassen Nr. Mietpreisklasse Theoretische Häufigkeit Gemessene Häufigkeit bis 350 8, bis 450 8, bis 550 9, bis 650 8, bis 850 7,574 1 Damit testen wir nun auf eine Irrtumswahrscheinlichkeit von 5% E T n n k k Qk k1 Tk k1 Wie viele Freiheitsgrade? 5 Klassen 3 Zwangsbedingungen 8, 6073 T. Kießling: Fortgeschrittene Fehlerrechnung - Korrelation Vorlesung 03-0

21 Chi-Quadrat-Test Sicherheitsschwellen: T. Kießling: Fortgeschrittene Fehlerrechnung - Korrelation Vorlesung 03-1

22 Chi-Quadrat-Test: Test auf Normal-Verteilung Klassen Nr. Mietpreisklasse Theoretische Häufigkeit Gemessene Häufigkeit bis 350 8, bis 450 8, bis 550 9, bis 650 8, bis 850 7,574 1 Damit testen wir nun auf eine Irrtumswahrscheinlichkeit von 5% E T n n k k Qk k1 Tk k1 Wie viele Freiheitsgrade? 5 Klassen 3 Zwangsbedingungen 8, 6073 Bei Annahme einer Irrtumswahrscheinlichkeit von 5 % entsprechen die Daten keiner Normal-Verteilung T. Kießling: Fortgeschrittene Fehlerrechnung - Korrelation Vorlesung 03-

23 Linearer Korrelationskoeffizient T. Kießling: Fortgeschrittene Fehlerrechnung - Korrelation Vorlesung 03-3

24 Fragestellung (Wiederholung) Wir führen eine Messung durch und erhalten folgende Werte 75,0 X i Y i 0,0 5,4 1,17 54,6 1,96 57,7,98 59,5 4,05 6,7 5,1 65,6 5,93 67,0 7,01 69,0 8,4 7,8 Y 70,0 65,0 60,0 55,0 50,0 Testmessung zur linearen Regression 0,00,00 4,00 6,00 8,00 X 1.) Angenommen die Beziehung zwischen x und y ist linear, welche Gerade passt am besten zu den Messwerten?.) Wie können wir objektiv beurteilen, inwieweit die Daten unsere Annahme erfüllen und wirklich einer bestimmten Funktion (hier einer Gerade) folgen? T. Kießling: Fortgeschrittene Fehlerrechnung - Korrelation Vorlesung 03-4

25 Vorüberlegungen Wir messen zur Bestimmung einer Größe q(x, Y) die Größen X und Y jeweils mit einer Messreihe und erhalten N Datenpaare (x i,y i ). Aus den (x 1,,x n ) und (y 1,,y n ) bestimmen wir die Mittelwerte x und y sowie deren Standardfehler s x und s y. Weiterhin bestimmen wir aus den N Messwertepaaren N Werte der gesuchten Größe q q( x, y ) mit ( i 1,..., N) i i i Daraus bestimmen wir q sowie q. Übliche Annahme: Die Fehler seien klein und normalverteilt. Dann hält: q q qi q( xi, yi) q( x, y) ( xi x) ( yi y). x y T. Kießling: Fortgeschrittene Fehlerrechnung - Korrelation Vorlesung 03-5

26 Vorüberlegungen q q qi q( xi, yi) q( x, y) ( xi x) ( yi y). x y Mittelwert: n n 1 1 q q q qi q( x, y) ( xi x) ( yi y) ; N i 1 N i1 x y und damit q q( x, y). Daraus Standardabweichung: 1 n q qi q N i1 ( ), 1 q q ( x x) ( y y), n q i i N i1 x y n n n q 1 q 1 q q 1 q i i i i x N i1 y N i1 x y N i1 ( x x) ( y y) ( x x)( y y). T. Kießling: Fortgeschrittene Fehlerrechnung - Korrelation Vorlesung 03-6

27 Vorüberlegungen n n n q 1 q 1 q q 1 q i i i i x N i1 y N i1 x y N i1 ( x x) ( y y) ( x x)( y y). x y xy Zusammengefasst: q q q q q x y xy. x y x y Bei unendlich vielen Messungen wird xy = 0, falls x und y unabhängig sind. Nach einer endlichen Zahl von Messungen ist es sehr unwahrscheinlich, dass xy exakt gleich Null wird. Wann dürfen wir die xy ignorieren und die Gauß sche Fehlerrechnung anwerfen? T. Kießling: Fortgeschrittene Fehlerrechnung - Korrelation Vorlesung 03-7

28 Kovarianz Der Term: n 1 ( x x)( y y) xy i i N i1 wird als Kovarianz von x und y bezeichnet. Falls x und y voneinander abhängig sind wird xy auch bei unendlich vielen Messungen nie null. Die Kovarianz ist daher ein Maß für die Abhängigkeit von Daten, man spricht dann von Korrelation. Beispiel: Gleichzeitige Messung von Spannung und Strom zur Ermittlung der Leistung mit dem selben Gerät. Die Kovarianz gibt zwar Richtung der Korrelation an, über die Stärke des Zusammenhangs besteht aber keine Aussage. Wir benötigen leistungsfähigere Indikatoren T. Kießling: Fortgeschrittene Fehlerrechnung - Korrelation Vorlesung 03-8

29 Definition des linearen Korrelationskoeffizienten r xy x y y r xi xyi y 1 x x y y i i x Der Korrelationskoeffizient ist ein Indikator dafür, wie gut die Punkte (Xi,Yi) zu einer Geraden passen. Sein Wert liegt zwischen -1 und +1. Ist r nahe bei ±1, dann befinden sich die Punkte dicht bei einer Geraden. Ist r dagegen nahe bei 0, dann zeigen die Punkte wenig oder keine Neigung, auf einer Geraden zu liegen. T. Kießling: Fortgeschrittene Fehlerrechnung - Korrelation Vorlesung 03-9

30 T. Kießling: Fortgeschrittene Fehlerrechnung - Korrelation Vorlesung Annahme alle Punkte (X i,y i ) lägen auf einer Geraden Y = A + BX In diesem Fall ist Y i = A + B X i für alle X i und Y A B X Somit gilt für jedes X i : X X B Y Y i i Setzt man dies in die Definitionsgleichung für r ein, ergibt sich: 1 1 B B x x B x x x x B r i i i [r = +1 bei positivem B; r = - 1 bei negativem B.] Quantitative Bedeutung von r? Linearer Korrelationskoeffizient

31 Linearer Korrelationskoeffizient Selbst wenn wir einen linearen Zusammenhang zwischen X und Y annehmen, ist aufgrund von Messfehlern nicht zu erwarten, dass r = 1 ist. Wir werden erwarten, dass r "hinreichend nahe" bei 1 liegt Was heißt hinreichend nahe? Ist 0,8 hinreichend nahe? Ist 0,6 nicht mehr nahe? Ist r = 0,6 bei 5 Messwerten anders zu bewerten als bei 100? Was wir benötigen, ist eine objektive Entscheidung darüber, was "hinreichend nahe" bei eins heißt. T. Kießling: Fortgeschrittene Fehlerrechnung - Korrelation Vorlesung 03-31

32 Quantitative Bedeutung des linearen Korrelationskoeffizienten Nehmen wir an die zwei Variablen X und Y seien unkorreliert. Bei unendlich vielen Messungen wird r = 0. Nach einer endlichen Zahl von Messungen ist es sehr unwahrscheinlich, dass r exakt gleich Null wird. r = 0,495 r = 1,000 r = 0,995 r = 0,951 r = 0,906 r = 0,70 r = 0,9 T. Kießling: Fortgeschrittene Fehlerrechnung - Korrelation Vorlesung 03-3

33 Quantitative Bedeutung des linearen Korrelationskoeffizienten Nehmen wir an die zwei Variablen X und Y seien unkorreliert. Bei unendlich vielen Messungen wird r = 0. Nach einer endlichen Zahl von Messungen ist es sehr unwahrscheinlich, dass r exakt gleich Null wird. Man kann die Wahrscheinlichkeit dafür berechnen, dass r einen bestimmten Wert r o übersteigt. P( r r o ) bezeichnet die Wahrscheinlichkeit, dass N Messungen von zwei unkorrelierten Variablen X und Y einen Koeffizienten r liefern, der größer ist als irgendein bestimmtes r o. T. Kießling: Fortgeschrittene Fehlerrechnung - Korrelation Vorlesung 03-33

34 Quantitative Bedeutung des linearen Korrelationskoeffizienten Hier sind die Wahrscheinlichkeiten dargestellt, bei N unkorrelierten Paaren (X i, Y i ) ein r einer gewissen Größe zu erhalten. T. Kießling: Fortgeschrittene Fehlerrechnung - Korrelation Vorlesung 03-34

35 Zusammenhang: Lineare Regression - linearer Korrelationskoeffizient Willkürliche Annahme X sei fehlerfrei und Y fehlerbehaftet. X 35, 48 Y 110,15 r = 0,4945 bei N = 0 Y 1,3366 X 6,78 T. Kießling: Fortgeschrittene Fehlerrechnung - Korrelation Vorlesung 03-35

36 Zusammenhang: Lineare Regression - linearer Korrelationskoeffizient Ebenfalls gerechtfertigte und genauso willkürliche Annahme Y sei fehlerfrei und X fehlerbehaftet. T. Kießling: Fortgeschrittene Fehlerrechnung - Korrelation Vorlesung 03-36

37 Quantitative Bedeutung des linearen Korrelationskoeffizienten T. Kießling: Fortgeschrittene Fehlerrechnung - Korrelation Vorlesung 03-37

38 Quantitative Bedeutung des linearen Korrelationskoeffizienten Hier sind die Wahrscheinlichkeiten dargestellt, bei N unkorrelierten Paaren (X i, Y i ) ein r einer gewissen Größe zu erhalten. Bei N=0 unkorrelierten Werten tritt ein r = 0,444 in 5% der Fälle auf; ein r = 0,516 nur in,0% der Fälle. T. Kießling: Fortgeschrittene Fehlerrechnung - Korrelation Vorlesung 03-38

39 Quantitative Bedeutung des linearen Korrelationskoeffizienten In unserem Beispiel ist r = 0,4945 und N = 0 Die Wahrscheinlichkeit, bei 0 unkorrelierten Paaren (X i, Y i ) ein r von 0,4945 zu erhalten, ist etwa,5 % Wenn diese Wahrscheinlichkeit "hinreichend klein" ist, können wir den Schluss ziehen, dass es sehr unwahrscheinlich ist, dass X und Y unkorreliert sind, oder anders Es ist sehr wahrscheinlich, dass die Daten korreliert sind. Ist,5 % eine "hinreichend kleine" Wahrscheinlichkeit? T. Kießling: Fortgeschrittene Fehlerrechnung - Korrelation Vorlesung 03-39

40 Quantitative Bedeutung des linearen Korrelationskoeffizienten Häufig wird eine beobachtete Korrelation r b als signifikant bezeichnet, wenn die Wahrscheinlichkeit bei unkorrelierten Variablen einen Wert größer als r b zu erhalten, der 5 % Schwelle entspricht. Eine Korrelation wird als hochsignifikant bezeichnet, wenn die entsprechende Wahrscheinlichkeit kleiner als 1 % ist. In unserem Beispiel ist die Korrelation (r =0,4945) bei 0 Wertepaaren signifikant (auf 5% Niveau r b = 0,444 ). Sie ist nicht hochsignifikant (1%, r b = 0,561). T. Kießling: Fortgeschrittene Fehlerrechnung - Korrelation Vorlesung 03-40

41 WICHTIG Korrelation bedeutet nicht Kausalität. Wussten Sie, dass..die Handschrift umso lesbarer ist, je größer die Schuhgröße ist?.der Weizenpreis sinkt, je mehr Symptome für Weizenpollenallergie (umgspr. Heuschnupfen) auftreten?.der Kalziumgehalt in den Knochen umso geringer ist, je mehr unverheiratete Tanten jemand hat? Vorsicht es gibt "Scheinkorrelationen" T. Kießling: Fortgeschrittene Fehlerrechnung - Korrelation Vorlesung 03-41

42 Linearer Korrelationskoeffizient: Beispiele Gibt es eine Korrelation zwischen den Ergebnissen der Fehlerrechnung und den Ergebnissen im schriftlichen Vordiplom? Es gibt eine große Anzahl Studierender, die an der Fehlerrechnung teilgenommen haben, aber nicht zum Vordiplom angetreten sind. T. Kießling: Fortgeschrittene Fehlerrechnung - Korrelation Vorlesung 03-4

43 Linearer Korrelationskoeffizient: Beispiele Berücksichtigung von Studierenden, die beide Veranstaltungen absolviert haben. Gestrichelte Linien bedeuten die Punktegrenzen zum Bestehen der Veranstaltung. T. Kießling: Fortgeschrittene Fehlerrechnung - Korrelation Vorlesung 03-43

44 Linearer Korrelationskoeffizient: Beispiele Einzeichnen einer Regressionsgeraden Es liegt eine sehr geringe Korrelation vor, die obendrein durch einen Ausreißer verstärkt wird. T. Kießling: Fortgeschrittene Fehlerrechnung - Korrelation Vorlesung 03-44

45 Linearer Korrelationskoeffizient: Beispiele Vernachlässigung des AUSREIßERS Es liegt eine nahezu kreisförmige Punktwolke vor, was auf eine geringe Korrelation schließen lässt. T. Kießling: Fortgeschrittene Fehlerrechnung - Korrelation Vorlesung 03-45

46 Linearer Korrelationskoeffizient: Beispiele Vernachlässigung des AUSREIßERS führt zu einem noch kleineren Korrelationskoeffizienten. T. Kießling: Fortgeschrittene Fehlerrechnung - Korrelation Vorlesung 03-46

47 Linearer Korrelationskoeffizient: Beispiele Beide REGRESSIONSGERADEN STEHEN NAHEZU SENKRECHT AUFEINANDER. T. Kießling: Fortgeschrittene Fehlerrechnung - Korrelation Vorlesung 03-47

48 Linearer Korrelationskoeffizient: Beispiele N = 140 r = 0, Die Korrelation ist hochsignifikant! T. Kießling: Fortgeschrittene Fehlerrechnung - Korrelation Vorlesung 03-48

Kapitel 7. Regression und Korrelation. 7.1 Das Regressionsproblem

Kapitel 7. Regression und Korrelation. 7.1 Das Regressionsproblem Kapitel 7 Regression und Korrelation Ein Regressionsproblem behandelt die Verteilung einer Variablen, wenn mindestens eine andere gewisse Werte in nicht zufälliger Art annimmt. Ein Korrelationsproblem

Mehr

Regression und Korrelation

Regression und Korrelation Kapitel 7 Regression und Korrelation Ein Regressionsproblem behandeltdie VerteilungeinerVariablen, wenn mindestens eine andere gewisse Werte in nicht zufälliger Art annimmt. Ein Korrelationsproblem dagegen

Mehr

simple lineare Regression kurvilineare Regression Bestimmtheitsmaß und Konfidenzintervall

simple lineare Regression kurvilineare Regression Bestimmtheitsmaß und Konfidenzintervall Regression Korrelation simple lineare Regression kurvilineare Regression Bestimmtheitsmaß und Konfidenzintervall Zusammenhänge zw. Variablen Betrachtet man mehr als eine Variable, so besteht immer auch

Mehr

Eine zweidimensionale Stichprobe

Eine zweidimensionale Stichprobe Eine zweidimensionale Stichprobe liegt vor, wenn zwei qualitative Merkmale gleichzeitig betrachtet werden. Eine Urliste besteht dann aus Wertepaaren (x i, y i ) R 2 und hat die Form (x 1, y 1 ), (x 2,

Mehr

Statistische Methoden

Statistische Methoden Modeling of Data / Maximum Likelyhood methods Institut für Experimentelle und Angewandte Physik Christian-Albrechts-Universität zu Kiel 22.05.2006 Datenmodellierung Messung vs Modell Optimierungsproblem:

Mehr

Deskriptive Beschreibung linearer Zusammenhänge

Deskriptive Beschreibung linearer Zusammenhänge 9 Mittelwert- und Varianzvergleiche Mittelwertvergleiche bei k > 2 unabhängigen Stichproben 9.4 Beispiel: p-wert bei Varianzanalyse (Grafik) Bedienungszeiten-Beispiel, realisierte Teststatistik F = 3.89,

Mehr

Statistik. Ronald Balestra CH St. Peter

Statistik. Ronald Balestra CH St. Peter Statistik Ronald Balestra CH - 7028 St. Peter www.ronaldbalestra.ch 17. Januar 2010 Inhaltsverzeichnis 1 Statistik 1 1.1 Beschreibende Statistik....................... 1 1.2 Charakterisierung von Häufigkeitsverteilungen...........

Mehr

Statistische Methoden in den Umweltwissenschaften

Statistische Methoden in den Umweltwissenschaften Statistische Methoden in den Umweltwissenschaften Korrelationsanalysen Kreuztabellen und χ²-test Themen Korrelation oder Lineare Regression? Korrelationsanalysen - Pearson, Spearman-Rang, Kendall s Tau

Mehr

Erstabgabe Übung nicht abgegeben

Erstabgabe Übung nicht abgegeben Erstabgabe Übung 9 6 5 4 3 2 1 nicht abgegeben T. Kießling: Auswertung von Messungen und Fehlerrechnung - Graphische Darstellungen, Etrapolation 18.01.2018 Vorlesung 10-1 Übungsaufgaben So soll es sein:

Mehr

Didaktisches Seminar über Stochastik. Themen: ffl Korrelation von zwei Zufallsvariablen

Didaktisches Seminar über Stochastik. Themen: ffl Korrelation von zwei Zufallsvariablen Didaktisches Seminar über Stochastik Themen: ffl Gemeinsame Verteilung von zwei Zufallsvariablen ffl Lineare Regression ffl Korrelation von zwei Zufallsvariablen Michael Ralph Pape Mai 1998 1 1 GEMEINSAME

Mehr

Prof. Dr. Walter F. Tichy Dr. Matthias Müller Sommersemester 2006

Prof. Dr. Walter F. Tichy Dr. Matthias Müller Sommersemester 2006 Empirische Softwaretechnik Prof. Dr. Walter F. Tichy Dr. Matthias Müller Sommersemester 2006 1 Experiment zur Vererbungstiefe Softwaretechnik: die Vererbungstiefe ist kein guter Schätzer für den Wartungsaufwand

Mehr

5. Seminar Statistik

5. Seminar Statistik Sandra Schlick Seite 1 5. Seminar 5. Seminar Statistik 30 Kurztest 4 45 Testen von Hypothesen inkl. Übungen 45 Test- und Prüfverfahren inkl. Übungen 45 Repetitorium und Prüfungsvorbereitung 15 Kursevaluation

Mehr

Einführung Fehlerrechnung

Einführung Fehlerrechnung Einführung Fehlerrechnung Bei jeder Messung, ob Einzelmessung oder Messreihe, muss eine Aussage über die Güte ( Wie groß ist der Fehler? ) des Messergebnisses gemacht werden. Mögliche Fehlerarten 1. Systematische

Mehr

Forschungsstatistik I

Forschungsstatistik I Psychologie Prof. Dr. G. Meinhardt 6. Stock, TB II R. 06-206 (Persike) R. 06-321 (Meinhardt) Sprechstunde jederzeit nach Vereinbarung Forschungsstatistik I Dr. Malte Persike persike@uni-mainz.de http://psymet03.sowi.uni-mainz.de/

Mehr

Allgemeine Chemie Computer Praktikum Frühjahrssemester Regressions-Tutorial Lineare und nicht-lineare Regression

Allgemeine Chemie Computer Praktikum Frühjahrssemester Regressions-Tutorial Lineare und nicht-lineare Regression 1 Einführung Allgemeine Chemie Computer Praktikum Frühjahrssemester Regressions-Tutorial Lineare und nicht-lineare Regression Datenauswertung In einem naturwissenschaftlichen Experiment werden Sie meist

Mehr

Statistik und Wahrscheinlichkeitsrechnung

Statistik und Wahrscheinlichkeitsrechnung Statistik und Wahrscheinlichkeitsrechnung Übung 3 1 Inhalt der heutigen Übung Vorrechnen der Hausübung B.7 Beschreibende Statistik Gemeinsames Lösen der Übungsaufgaben C.1: Häufigkeitsverteilung C.2: Tukey

Mehr

1 x 1 y 1 2 x 2 y 2 3 x 3 y 3... n x n y n

1 x 1 y 1 2 x 2 y 2 3 x 3 y 3... n x n y n 3.2. Bivariate Verteilungen zwei Variablen X, Y werden gemeinsam betrachtet (an jedem Objekt werden gleichzeitig zwei Merkmale beobachtet) Beobachtungswerte sind Paare von Merkmalsausprägungen (x, y) Beispiele:

Mehr

Statistik II. Lineare Regressionsrechnung. Wiederholung Skript 2.8 und Ergänzungen (Schira: Kapitel 4) Statistik II

Statistik II. Lineare Regressionsrechnung. Wiederholung Skript 2.8 und Ergänzungen (Schira: Kapitel 4) Statistik II Statistik II Lineare Regressionsrechnung Wiederholung Skript 2.8 und Ergänzungen (Schira: Kapitel 4) Statistik II - 09.06.2006 1 Mit der Kovarianz und dem Korrelationskoeffizienten können wir den statistischen

Mehr

Statistik und Wahrscheinlichkeitsrechnung

Statistik und Wahrscheinlichkeitsrechnung Statistik und Wahrscheinlichkeitsrechnung 3. Vorlesung Dr. Jochen Köhler 1 Inhalte der heutigen Vorlesung Ziel: Daten Modellbildung Probabilistisches Modell Wahrscheinlichkeit von Ereignissen Im ersten

Mehr

1 Grundlagen der Wahrscheinlichkeitsrechnung Wahrscheinlichkeitsräume. Ein erster mathematischer Blick auf Zufallsexperimente...

1 Grundlagen der Wahrscheinlichkeitsrechnung Wahrscheinlichkeitsräume. Ein erster mathematischer Blick auf Zufallsexperimente... Inhaltsverzeichnis 1 Grundlagen der Wahrscheinlichkeitsrechnung 1 1.1 Wahrscheinlichkeitsräume Ein erster mathematischer Blick auf Zufallsexperimente.......... 1 1.1.1 Wahrscheinlichkeit, Ergebnisraum,

Mehr

Inhaltsverzeichnis. Über die Autoren Einleitung... 21

Inhaltsverzeichnis. Über die Autoren Einleitung... 21 Inhaltsverzeichnis Über die Autoren.... 7 Einleitung... 21 Über dieses Buch... 21 Was Sie nicht lesen müssen... 22 Törichte Annahmen über den Leser... 22 Wie dieses Buch aufgebaut ist... 23 Symbole, die

Mehr

Vorlesung 12a. Kann das Zufall sein? Beispiele von statistischen Tests

Vorlesung 12a. Kann das Zufall sein? Beispiele von statistischen Tests Vorlesung 12a Kann das Zufall sein? Beispiele von statistischen Tests 1 Beispiel 1: Passen die Verhältnisse in den Rahmen? Fishers exakter Test (vgl. Buch S. 130/131 2 Sir Ronald Fisher 1890-1962 3 Aus

Mehr

Begleitmaterial zur Vorlesung. Fehlerrechnung und Fehlerabschätzung bei physikalischen Messungen

Begleitmaterial zur Vorlesung. Fehlerrechnung und Fehlerabschätzung bei physikalischen Messungen Institut für Technische Thermodynamik und Kältetechnik Leiter: Prof. Dr.-Ing. K. Schaber Begleitmaterial zur Vorlesung Fehlerrechnung und Fehlerabschätzung bei physikalischen Messungen Verfasst von Dr.

Mehr

Fehler- und Ausgleichsrechnung

Fehler- und Ausgleichsrechnung Fehler- und Ausgleichsrechnung Daniel Gerth Daniel Gerth (JKU) Fehler- und Ausgleichsrechnung 1 / 12 Überblick Fehler- und Ausgleichsrechnung Dieses Kapitel erklärt: Wie man Ausgleichsrechnung betreibt

Mehr

Statistik... formeln für Dummies

Statistik... formeln für Dummies Timm Si99 Statistik... formeln für Dummies Fachkorrektur tlon Christoph Maas und Joachim Gaukel WILEY WILEY-VCH Verlag GmbH & Co. KGaA lnhaftsllerzeichnis Einleitun9 17 Teil I Formeln aus der beschreibenden

Mehr

Statistikpraktikum. Carsten Rezny. Sommersemester Institut für angewandte Mathematik Universität Bonn

Statistikpraktikum. Carsten Rezny. Sommersemester Institut für angewandte Mathematik Universität Bonn Statistikpraktikum Carsten Rezny Institut für angewandte Mathematik Universität Bonn Sommersemester 2014 Mehrdimensionale Datensätze: Multivariate Statistik Multivariate Statistik Mehrdimensionale Datensätze:

Mehr

Wichtige Definitionen und Aussagen

Wichtige Definitionen und Aussagen Wichtige Definitionen und Aussagen Zufallsexperiment, Ergebnis, Ereignis: Unter einem Zufallsexperiment verstehen wir einen Vorgang, dessen Ausgänge sich nicht vorhersagen lassen Die möglichen Ausgänge

Mehr

Statistische Tests funktionieren generell nach obigem Schema; der einzige Unterschied besteht in der unterschiedlichen Berechnung der Testgröße.

Statistische Tests funktionieren generell nach obigem Schema; der einzige Unterschied besteht in der unterschiedlichen Berechnung der Testgröße. Statistische Tests Testen von Hypothesen Fehlerarten wichtigste statistische Tests Hypothesen Jeder statistische Test beruht auf der Widerlegung einer zuvor aufgestellten Hypothese. Die Widerlegung ist

Mehr

Anwendungen der Differentialrechnung

Anwendungen der Differentialrechnung KAPITEL 3 Anwendungen der Differentialrechnung 3.1 Lokale Maxima und Minima Definition 16: Sei f : D R eine Funktion von n Veränderlichen. Ein Punkt x heißt lokale oder relative Maximalstelle bzw. Minimalstelle

Mehr

Kapitel XI - Korrelationsrechnung

Kapitel XI - Korrelationsrechnung Universität Karlsruhe (TH) Institut für Statistik und Mathematische Wirtschaftstheorie Kapitel XI - Korrelationsrechnung Markus Höchstötter Uni Karlsruhe Karlsruhe, SS 2008 Kapitel XI - Korrelationsrechnung

Mehr

Hochschule Darmstadt FB Mathematik und Naturwissenschaften. Statistik. für Wirtschaftsingenieure (B.Sc.) Sommersemester 2017

Hochschule Darmstadt FB Mathematik und Naturwissenschaften. Statistik. für Wirtschaftsingenieure (B.Sc.) Sommersemester 2017 für Wirtschaftsingenieure (B.Sc.) Sommersemester 017 Dr. rer. nat. habil. E-mail: adam-georg.balogh@h-da.de 1 Hochschule Darmstadt, Fachbereich MN Sommersemester 017 Testklausur zur Vorlesung Wirtschaftsstatistik

Mehr

Arbeitsbuch zur deskriptiven und induktiven Statistik

Arbeitsbuch zur deskriptiven und induktiven Statistik Helge Toutenburg Michael Schomaker Malte Wißmann Christian Heumann Arbeitsbuch zur deskriptiven und induktiven Statistik Zweite, aktualisierte und erweiterte Auflage 4ü Springer Inhaltsverzeichnis 1. Grundlagen

Mehr

Einführung 17. Teil I Kopfüber eintauchen in die Statistik 23. Kapitel 1 Kategoriale Daten zusammenfassen: Häufigkeiten und Prozente 25

Einführung 17. Teil I Kopfüber eintauchen in die Statistik 23. Kapitel 1 Kategoriale Daten zusammenfassen: Häufigkeiten und Prozente 25 Inhaltsverzeichnis Einführung 17 Über dieses Buch 17 Törichte Annahmen über den Leser 19 Wie dieses Buch aufgebaut ist 19 Teil I: Kopfüber eintauchen indie Statistik 19 Teil II: Von Wahrscheinlichkeiten,

Mehr

Statistische Messdatenauswertung

Statistische Messdatenauswertung Roland Looser Statistische Messdatenauswertung Praktische Einführung in die Auswertung von Messdaten mit Excel und spezifischer Statistik-Software für naturwissenschaftlich und technisch orientierte Anwender

Mehr

Grundlagen sportwissenschaftlicher Forschung Deskriptive Statistik 2 Inferenzstatistik 1

Grundlagen sportwissenschaftlicher Forschung Deskriptive Statistik 2 Inferenzstatistik 1 Grundlagen sportwissenschaftlicher Forschung Deskriptive Statistik 2 Inferenzstatistik 1 Dr. Jan-Peter Brückner jpbrueckner@email.uni-kiel.de R.216 Tel. 880 4717 Rückblick: Besonders wichtige Themen Wissenschaftstheoretischer

Mehr

Statistik K urs SS 2004

Statistik K urs SS 2004 Statistik K urs SS 2004 3.Tag Grundlegende statistische Maße Mittelwert (mean) Durchschnitt aller Werte Varianz (variance) s 2 Durchschnittliche quadrierte Abweichung aller Werte vom Mittelwert >> Die

Mehr

Statistik II Übung 4: Skalierung und asymptotische Eigenschaften

Statistik II Übung 4: Skalierung und asymptotische Eigenschaften Statistik II Übung 4: Skalierung und asymptotische Eigenschaften Diese Übung beschäftigt sich mit der Skalierung von Variablen in Regressionsanalysen und mit asymptotischen Eigenschaften von OLS. Verwenden

Mehr

Mathematik für Biologen

Mathematik für Biologen Mathematik für Biologen Prof. Dr. Rüdiger W. Braun Heinrich-Heine-Universität Düsseldorf 25. Januar 2013 1 Der χ 2 -Anpassungstest 2 Exakter Test nach Fisher Mendelsche Erbregeln als Beispiel für mehr

Mehr

Brückenkurs Statistik für Wirtschaftswissenschaften

Brückenkurs Statistik für Wirtschaftswissenschaften Peter von der Lippe Brückenkurs Statistik für Wirtschaftswissenschaften Weitere Übungsfragen UVK Verlagsgesellschaft mbh Konstanz Mit UVK/Lucius München UVK Verlagsgesellschaft mbh Konstanz und München

Mehr

5. Spezielle stetige Verteilungen

5. Spezielle stetige Verteilungen 5. Spezielle stetige Verteilungen 5.1 Stetige Gleichverteilung Eine Zufallsvariable X folgt einer stetigen Gleichverteilung mit den Parametern a und b, wenn für die Dichtefunktion von X gilt: f x = 1 für

Mehr

Mittelwert, Standardabweichung, Median und Bereich für alle durchgeführten Messungen (in Prozent)

Mittelwert, Standardabweichung, Median und Bereich für alle durchgeführten Messungen (in Prozent) 3. Ergebnisse 3.1 Kennwerte, Boxplot Die Kennwerte der deskriptiven Statistik sind in der Tabelle 1 für alle Messungen, in der Tabelle 2 für die Messungen, bei denen mit der Referenzmethode eine festgestellt

Mehr

Das (multiple) Bestimmtheitsmaß R 2. Beispiel: Ausgaben in Abhängigkeit vom Einkommen (I) Parameterschätzer im einfachen linearen Regressionsmodell

Das (multiple) Bestimmtheitsmaß R 2. Beispiel: Ausgaben in Abhängigkeit vom Einkommen (I) Parameterschätzer im einfachen linearen Regressionsmodell 1 Lineare Regression Parameterschätzung 13 Im einfachen linearen Regressionsmodell sind also neben σ ) insbesondere β 1 und β Parameter, deren Schätzung für die Quantifizierung des linearen Zusammenhangs

Mehr

Einführung. Fehlerarten

Einführung. Fehlerarten Einführung Jede Messung ist mit einer Messunsicherheit behaftet. Die Unsicherheit bezieht sich dabei nicht auf eine falsche Durchführung der Messung, sondern auf die Tatsache, dass jede von einem Menschen

Mehr

Dr. Maike M. Burda. Welchen Einfluss hat die Körperhöhe auf das Körpergewicht? Eine Regressionsanalyse. HU Berlin, Econ Bootcamp

Dr. Maike M. Burda. Welchen Einfluss hat die Körperhöhe auf das Körpergewicht? Eine Regressionsanalyse. HU Berlin, Econ Bootcamp Dr. Maike M. Burda Welchen Einfluss hat die Körperhöhe auf das Körpergewicht? Eine Regressionsanalyse. HU Berlin, Econ Bootcamp 8.-10. Januar 2010 BOOTDATA.GDT: 250 Beobachtungen für die Variablen... cm:

Mehr

Mehrdimensionale Zufallsvariablen

Mehrdimensionale Zufallsvariablen Mehrdimensionale Zufallsvariablen Im Folgenden Beschränkung auf den diskreten Fall und zweidimensionale Zufallsvariablen. Vorstellung: Auswerten eines mehrdimensionalen Merkmals ( ) X Ỹ also z.b. ω Ω,

Mehr

Biometrieübung 10 Lineare Regression. 2. Abhängigkeit der Körpergröße von der Schuhgröße bei Männern

Biometrieübung 10 Lineare Regression. 2. Abhängigkeit der Körpergröße von der Schuhgröße bei Männern Biometrieübung 10 (lineare Regression) - Aufgabe Biometrieübung 10 Lineare Regression Aufgabe 1. Düngungsversuch In einem Düngeversuch mit k=9 Düngungsstufen x i erhielt man Erträge y i. Im (X, Y)- Koordinatensystem

Mehr

10. Medizinische Statistik

10. Medizinische Statistik 10. Medizinische Statistik Projektplanung Deskriptive Statistik Inferenz-Statistik Literatur: Hüsler, J. und Zimmermann, H.: Statistische Prinzipien für medizinische Projekte, Verlag Hans Huber, 1993.

Mehr

Statistik I für Betriebswirte Vorlesung 14

Statistik I für Betriebswirte Vorlesung 14 Statistik I für Betriebswirte Vorlesung 14 Dr. Andreas Wünsche TU Bergakademie Freiberg Institut für Stochastik 13. Juli 017 Dr. Andreas Wünsche Statistik I für Betriebswirte Vorlesung 14 Version: 8. Juli

Mehr

Messunsicherheit und Fehlerrechnung

Messunsicherheit und Fehlerrechnung Messunsicherheit und Fehlerrechnung p. 1/25 Messunsicherheit und Fehlerrechnung Kurzeinführung Peter Riegler p.riegler@fh-wolfenbuettel.de Fachhochschule Braunschweig/Wolfenbüttel Messunsicherheit und

Mehr

MATHEMATIK 3 STUNDEN

MATHEMATIK 3 STUNDEN EUROPÄISCHES ABITUR 2013 MATHEMATIK 3 STUNDEN DATUM : 10. Juni 2013, Vormittag DAUER DER PRÜFUNG: 2 Stunden (120 Minuten) ERLAUBTES HILFSMITTEL Prüfung mit technologischem Hilfsmittel 1/6 DE AUFGABE B1

Mehr

Modul G.1 WS 07/08: Statistik

Modul G.1 WS 07/08: Statistik Modul G.1 WS 07/08: Statistik 10.01.2008 1 2 Test Anwendungen Der 2 Test ist eine Klasse von Verfahren für Nominaldaten, wobei die Verteilung der beobachteten Häufigkeiten auf zwei mehrfach gestufte Variablen

Mehr

Übungen (HS-2010): Urteilsfehler. Autor: Siegfried Macho

Übungen (HS-2010): Urteilsfehler. Autor: Siegfried Macho Übungen (HS-2010): Urteilsfehler Autor: Siegfried Macho Inhaltsverzeichnis i Inhaltsverzeichnis 1. Übungen zu Kapitel 2 1 Übungen zu Kontingenz- und Kausalurteile 1 Übung 1-1: 1. Übungen zu Kapitel 2 Gegeben:

Mehr

Der Umgang mit Unsicherheiten

Der Umgang mit Unsicherheiten Manfred Drosg Der Umgang mit Unsicherheiten Ein Leitfaden zur Fehleranalyse facultas Inhaltsverzeichnis 1 Einleitung 13 1.1 Wissenschaftlichkeit 14 1.2 Sichere (fehlerfreie) Daten 16 2 Grundlegendes über

Mehr

2. Formulieren von Hypothesen. Nullhypothese: H 0 : µ = 0 Gerät exakt geeicht

2. Formulieren von Hypothesen. Nullhypothese: H 0 : µ = 0 Gerät exakt geeicht 43 Signifikanztests Beispiel zum Gauß-Test Bei einer Serienfertigung eines bestimmten Typs von Messgeräten werden vor der Auslieferung eines jeden Gerätes 10 Kontrollmessungen durchgeführt um festzustellen,

Mehr

Übung 1: Wiederholung Wahrscheinlichkeitstheorie

Übung 1: Wiederholung Wahrscheinlichkeitstheorie Übung 1: Wiederholung Wahrscheinlichkeitstheorie Ü1.1 Zufallsvariablen Eine Zufallsvariable ist eine Variable, deren numerischer Wert solange unbekannt ist, bis er beobachtet wird. Der Wert einer Zufallsvariable

Mehr

(f(xi ) y i ) 2. minimal ist: man will also die Summe der quadratischen Abweichungen minimieren ... f(x i ) y i, i=1 (t x i) 2

(f(xi ) y i ) 2. minimal ist: man will also die Summe der quadratischen Abweichungen minimieren ... f(x i ) y i, i=1 (t x i) 2 Mathematik für Biologen, Biotechnologen und Biochemiker Lineare Regression Gegeben seien Datenpaare (, ), (, ),, ( n, n ) Wir stellen die Frage, ob sich die Zahlen i als Werte einer linearen Funktion i

Mehr

Statistik II. IV. Hypothesentests. Martin Huber

Statistik II. IV. Hypothesentests. Martin Huber Statistik II IV. Hypothesentests Martin Huber 1 / 41 Übersicht Struktur eines Hypothesentests Stichprobenverteilung t-test: Einzelner-Parameter-Test F-Test: Multiple lineare Restriktionen 2 / 41 Struktur

Mehr

7.5 Erwartungswert, Varianz

7.5 Erwartungswert, Varianz 7.5 Erwartungswert, Varianz Def. 7.5.: a) X sei eine diskrete ZV, die bei unendl. vielen Werten x k folgende Zusatzbedingung erfüllt: x k p k

Mehr

Methodenlehre. Vorlesung 10. Prof. Dr. Björn Rasch, Cognitive Biopsychology and Methods University of Fribourg

Methodenlehre. Vorlesung 10. Prof. Dr. Björn Rasch, Cognitive Biopsychology and Methods University of Fribourg Methodenlehre Vorlesung 10 Prof. Dr., Cognitive Biopsychology and Methods University of Fribourg 1 Methodenlehre I Woche Datum Thema 1 FQ Einführung, Verteilung der Termine 1 25.9.13 Psychologie als Wissenschaft

Mehr

Eigene MC-Fragen SPSS. 1. Zutreffend auf die Datenerfassung und Datenaufbereitung in SPSS ist

Eigene MC-Fragen SPSS. 1. Zutreffend auf die Datenerfassung und Datenaufbereitung in SPSS ist Eigene MC-Fragen SPSS 1. Zutreffend auf die Datenerfassung und Datenaufbereitung in SPSS ist [a] In der Variablenansicht werden für die betrachteten Merkmale SPSS Variablen definiert. [b] Das Daten-Editor-Fenster

Mehr

Statistik II: Signifikanztests /2

Statistik II: Signifikanztests /2 Medien Institut : Signifikanztests /2 Dr. Andreas Vlašić Medien Institut (0621) 52 67 44 vlasic@medien-institut.de Gliederung 1. Korrelation 2. Exkurs: Kausalität 3. Regressionsanalyse 4. Key Facts 2 I

Mehr

Mathematik 2 für Naturwissenschaften

Mathematik 2 für Naturwissenschaften Hans Walser Mathematik 2 für Naturwissenschaften 2 3 3 4 6 4 5 0 0 5 6 5 20 5 6 Tabellen (leicht gekürzte Version) Hans Walser: Tabellen ii Inhalt Binomische Verteilung.... Binomische Verteilung (ohne

Mehr

Bivariate Regressionsanalyse

Bivariate Regressionsanalyse Universität Bielefeld 15. März 2005 Kovarianz, Korrelation und Regression Kovarianz, Korrelation und Regression Ausgangspunkt ist folgende Datenmatrix: Variablen 1 2... NI 1 x 11 x 12... x 1k 2 x 21 x

Mehr

Teil XII. Einfache Lineare Regression. Woche 10: Lineare Regression. Lernziele. Zusammenfassung. Patric Müller

Teil XII. Einfache Lineare Regression. Woche 10: Lineare Regression. Lernziele. Zusammenfassung. Patric Müller Woche 10: Lineare Regression Patric Müller Teil XII Einfache Lineare Regression ETHZ WBL 17/19, 03.07.2017 Wahrscheinlichkeit und Statistik Patric Müller WBL 2017 Wahrscheinlichkeit

Mehr

Die Familie der χ 2 (n)-verteilungen

Die Familie der χ 2 (n)-verteilungen Die Familie der χ (n)-verteilungen Sind Z 1,..., Z m für m 1 unabhängig identisch standardnormalverteilte Zufallsvariablen, so genügt die Summe der quadrierten Zufallsvariablen χ := m Z i = Z 1 +... +

Mehr

Die Familie der χ 2 (n)-verteilungen

Die Familie der χ 2 (n)-verteilungen Die Familie der χ (n)-verteilungen Sind Z 1,..., Z m für m 1 unabhängig identisch standardnormalverteilte Zufallsvariablen, so genügt die Summe der quadrierten Zufallsvariablen χ := m Z i = Z 1 +... +

Mehr

73 Hypothesentests Motivation Parametertest am Beispiel eines Münzexperiments

73 Hypothesentests Motivation Parametertest am Beispiel eines Münzexperiments 73 Hypothesentests 73.1 Motivation Bei Hypothesentests will man eine gewisse Annahme über eine Zufallsvariable darauf hin überprüfen, ob sie korrekt ist. Beispiele: ( Ist eine Münze fair p = 1 )? 2 Sind

Mehr

Vorlesung 7b. Kovarianz und Korrelation

Vorlesung 7b. Kovarianz und Korrelation Vorlesung 7b Kovarianz und Korrelation 1 Wir erinnern an die Definition der Kovarianz Für reellwertige Zufallsvariable X, Y mit E[X 2 ] < und E[Y 2 ] < ist Cov[X,Y]:= E [ (X EX)(Y EY) ] Insbesondere ist

Mehr

Philipp Sibbertsen Hartmut Lehne. Statistik. Einführung für Wirtschafts- und. Sozialwissenschaftler. 2., überarbeitete Auflage. 4^ Springer Gabler

Philipp Sibbertsen Hartmut Lehne. Statistik. Einführung für Wirtschafts- und. Sozialwissenschaftler. 2., überarbeitete Auflage. 4^ Springer Gabler Philipp Sibbertsen Hartmut Lehne Statistik Einführung für Wirtschafts- und Sozialwissenschaftler 2., überarbeitete Auflage 4^ Springer Gabler Inhaltsverzeichnis Teil I Deskriptive Statistik 1 Einführung

Mehr

Statistik Prüfung 24. Jänner 2008

Statistik Prüfung 24. Jänner 2008 Statistik Prüfung 24. Jänner 2008 February 10, 2008 Es ist immer nur EINE Antwort richtig, bei falsch beantworteten Fragen gibt es KEINEN Punktabzug. Werden mehrere Antworten bei einer Frage angekreuzt,

Mehr

1 Messfehler. 1.1 Systematischer Fehler. 1.2 Statistische Fehler

1 Messfehler. 1.1 Systematischer Fehler. 1.2 Statistische Fehler 1 Messfehler Jede Messung ist ungenau, hat einen Fehler. Wenn Sie zum Beispiel die Schwingungsdauer eines Pendels messen, werden Sie - trotz gleicher experimenteller Anordnungen - unterschiedliche Messwerte

Mehr

Mathematik 2 für Naturwissenschaften

Mathematik 2 für Naturwissenschaften Hans Walser Mathematik 2 für Naturwissenschaften 2 3 3 4 6 4 5 0 0 5 6 5 20 5 6 Tabellen (leicht gekürzte Version) Hans Walser: Tabellen ii Inhalt Binomische Verteilung.... Binomische Verteilung (ohne

Mehr

MSP Musterlösung. Name, Nummer: Datum: 12. Juli Energie eines Super-Kondensators 2Y6HUB

MSP Musterlösung. Name, Nummer: Datum: 12. Juli Energie eines Super-Kondensators 2Y6HUB WST donat.adams@fhnw.ch IMN MSP Musterlösung Name, Nummer: Datum: 1. Juli 017 1. Energie eines Super-Kondensators Y6HUB An einer Sendung von Super-Kondensatoren mit Energie-Gehalt E = 1 C U wurden folgende

Mehr

Trim Size: 176mm x 240mm Lipow ftoc.tex V1 - March 9, :34 P.M. Page 11. Über die Übersetzerin 9. Einleitung 19

Trim Size: 176mm x 240mm Lipow ftoc.tex V1 - March 9, :34 P.M. Page 11. Über die Übersetzerin 9. Einleitung 19 Trim Size: 176mm x 240mm Lipow ftoc.tex V1 - March 9, 2016 6:34 P.M. Page 11 Inhaltsverzeichnis Über die Übersetzerin 9 Einleitung 19 Was Sie hier finden werden 19 Wie dieses Arbeitsbuch aufgebaut ist

Mehr

Datenanalyse. (PHY231) Herbstsemester Olaf Steinkamp

Datenanalyse. (PHY231) Herbstsemester Olaf Steinkamp Datenanalyse PHY31 Herbstsemester 016 Olaf Steinkamp 36-J- olafs@physik.uzh.ch 044 63 55763 Vorlesungsprogramm Einführung, Messunsicherheiten, Darstellung von Messdaten Grundbegriffe der Wahrscheinlichkeitsrechnung

Mehr

Mathematik für Naturwissenschaften, Teil 2

Mathematik für Naturwissenschaften, Teil 2 Lösungsvorschläge für die Aufgaben zur Vorlesung Mathematik für Naturwissenschaften, Teil Zusatzblatt SS 09 Dr. J. Schürmann keine Abgabe Aufgabe : Eine Familie habe fünf Kinder. Wir nehmen an, dass die

Mehr

Grundlagen der Wahrscheinlichkeitstheorie und Statistik für Studierende der Informatik

Grundlagen der Wahrscheinlichkeitstheorie und Statistik für Studierende der Informatik INSTITUT FÜR STOCHASTIK WS 2007/08 UNIVERSITÄT KARLSRUHE Blatt 1 Dr. B. Klar Übungen zur Vorlesung Grundlagen der Wahrscheinlichkeitstheorie und Statistik für Studierende der Informatik Musterlösungen

Mehr

Wahrscheinlichkeitstheorie und Statistik vom

Wahrscheinlichkeitstheorie und Statistik vom INSTITUT FÜR STOCHASTIK SS 2010 Karlsruher Institut für Technologie Priv.-Doz. Dr. D. Kadelka Klausur Wahrscheinlichkeitstheorie und Statistik vom 14.9.2010 Musterlösungen Aufgabe 1: Gegeben sei eine Urliste

Mehr

Inhaltsverzeichnis. Vorwort

Inhaltsverzeichnis. Vorwort V Vorwort XI 1 Zum Gebrauch dieses Buches 1 1.1 Einführung 1 1.2 Der Text in den Kapiteln 1 1.3 Was Sie bei auftretenden Problemen tun sollten 2 1.4 Wichtig zu wissen 3 1.5 Zahlenbeispiele im Text 3 1.6

Mehr

Ausführliche Lösungen zu ausgewählten Aufgaben von ÜB 5 und 6. Streudiagramm

Ausführliche Lösungen zu ausgewählten Aufgaben von ÜB 5 und 6. Streudiagramm y Aufgabe 3 Ausführliche Lösungen zu ausgewählten Aufgaben von ÜB 5 und 6 a) Zur Erstellung des Streudiagramms zeichnet man jeweils einen Punkt für jedes Datenpaar (x i, y i ) aus der zweidimensionalen

Mehr

13 Mehrdimensionale Zufallsvariablen Zufallsvektoren

13 Mehrdimensionale Zufallsvariablen Zufallsvektoren 3 Mehrdimensionale Zufallsvariablen Zufallsvektoren Bisher haben wir uns ausschließlich mit Zufallsexperimenten beschäftigt, bei denen die Beobachtung eines einzigen Merkmals im Vordergrund stand. In diesem

Mehr

Bei näherer Betrachtung des Diagramms Nr. 3 fällt folgendes auf:

Bei näherer Betrachtung des Diagramms Nr. 3 fällt folgendes auf: 18 3 Ergebnisse In diesem Kapitel werden nun zunächst die Ergebnisse der Korrelationen dargelegt und anschließend die Bedingungen der Gruppenbildung sowie die Ergebnisse der weiteren Analysen. 3.1 Ergebnisse

Mehr

7.1 Korrelationsanalyse. Statistik. Kovarianz. Pearson-Korrelation. Institut für angewandte Statistik & EDV Universität für Bodenkultur Wien

7.1 Korrelationsanalyse. Statistik. Kovarianz. Pearson-Korrelation. Institut für angewandte Statistik & EDV Universität für Bodenkultur Wien Statistik 7.1 Korrelationsanalyse Institut für angewandte Statistik & EDV Universität für Bodenkultur Wien Sommersemester 2012 7 Regressions- und Korrelationsanalyse Kovarianz Pearson-Korrelation Der (lineare)

Mehr

Biomathematik für Mediziner

Biomathematik für Mediziner Institut für Medizinische Biometrie, Informatik und Epidemiologie der Universität Bonn (Direktor: Prof. Dr. Max P. Baur) Biomathematik für Mediziner Klausur SS 2002 Aufgabe 1: Franz Beckenbauer will, dass

Mehr

Zusammenhänge zwischen metrischen Merkmalen

Zusammenhänge zwischen metrischen Merkmalen Zusammenhänge zwischen metrischen Merkmalen Darstellung des Zusammenhangs, Korrelation und Regression Daten liegen zu zwei metrischen Merkmalen vor: Datenpaare (x i, y i ), i = 1,..., n Beispiel: x: Anzahl

Mehr

Wahrscheinlichkeitsrechnung und Statistik

Wahrscheinlichkeitsrechnung und Statistik 10. Vorlesung - 017 Quantil der Ordnung α für die Verteilung des beobachteten Merkmals X ist der Wert z α R für welchen gilt z 1 heißt Median. P(X < z α ) α P(X z α ). Falls X stetige zufällige Variable

Mehr

Schätzung im multiplen linearen Modell VI

Schätzung im multiplen linearen Modell VI Schätzung im multiplen linearen Modell VI Wie im einfachen linearen Regressionsmodell definiert man zu den KQ/OLS-geschätzten Parametern β = ( β 0, β 1,..., β K ) mit ŷ i := β 0 + β 1 x 1i +... β K x Ki,

Mehr

Lösungen zur Klausur GRUNDLAGEN DER WAHRSCHEINLICHKEITSTHEORIE UND STATISTIK

Lösungen zur Klausur GRUNDLAGEN DER WAHRSCHEINLICHKEITSTHEORIE UND STATISTIK Institut für Stochastik Dr. Steffen Winter Lösungen zur Klausur GRUNDLAGEN DER WAHRSCHEINLICHKEITSTHEORIE UND STATISTIK für Studierende der INFORMATIK vom 17. Juli 01 (Dauer: 90 Minuten) Übersicht über

Mehr

Anpassungstests VORGEHENSWEISE

Anpassungstests VORGEHENSWEISE Anpassungstests Anpassungstests prüfen, wie sehr sich ein bestimmter Datensatz einer erwarteten Verteilung anpasst bzw. von dieser abweicht. Nach der Erläuterung der Funktionsweise sind je ein Beispiel

Mehr

D-CHAB Frühlingssemester 2017 T =

D-CHAB Frühlingssemester 2017 T = D-CHAB Frühlingssemester 17 Grundlagen der Mathematik II Dr Marcel Dettling Lösung 13 1) Die relevanten Parameter sind n = 3, x = 1867, σ x = und µ = 18 (a) Die Teststatistik T = X µ Σ x / n ist nach Annahme

Mehr

Wahrscheinlichkeitsrechnung und Statistik. 11. Vorlesung /2019

Wahrscheinlichkeitsrechnung und Statistik. 11. Vorlesung /2019 Wahrscheinlichkeitsrechnung und Statistik 11. Vorlesung - 2018/2019 Quantil der Ordnung α für die Verteilung des beobachteten Merkmals X ist der Wert z α R für welchen gilt z 1 2 heißt Median. P(X < z

Mehr

Biostatistik 101 Korrelation - Regressionsanalysen

Biostatistik 101 Korrelation - Regressionsanalysen Good Data don't need statistics Biostatistik 101 Korrelation - Regressionsanalysen Carl Herrmann IPMB Uni Heidelberg & DKFZ B080 carl.herrmann@uni-heidelberg.de Korrelation Sind Alter und Blutdruck miteinander

Mehr

Vorlesung 8b. Kovarianz, Korrelation und Regressionsgerade

Vorlesung 8b. Kovarianz, Korrelation und Regressionsgerade Vorlesung 8b Kovarianz, Korrelation und Regressionsgerade 1 1. Die Kovarianz und ihre Eigenschaften 2 Wir erinnern an die Definition der Kovarianz Für reellwertige Zufallsvariable X, Y mit E[X 2 ] < und

Mehr