6. Übung (Hypothesenprüfung und einfache Tests)

Größe: px
Ab Seite anzeigen:

Download "6. Übung (Hypothesenprüfung und einfache Tests)"

Transkript

1 6. Übung (Hypothesenprüfung und einfache Tests) Es wird eine H0 Hypothese und eine Gegen- oder Arbeitshypothese aufgestellt. Sie schließen sich aus. Es wird von den betreffenden Populationen eine repräsentative Stichrobe genommen. Anhand eine Formel wird eine Probestatistik, eigentlich eine Zahl berechnet. Gewisse Unterschied zwischen den Stichprobe und der Population kann der Zufall auch resultieren. Es wird berechnet, dass der beobachtete (oder davon größere) Unterschied mit welcher Change vorkommen könnte, wenn die H0 Hypothese richtig wäre. Das wird ein sog. p-wert sein. Wenn dieser Wert genügend groß ist, d.h. grösser als 0.05, dann wird die H0 Hypothese angenommen, sonst wird die H0 Hypothese abgelehnt und es wird die Gegenhypothese H1 für richtig gehalten. Es wird im Weiteren die Daten von Blutparameter und Falter gebraucht. Binomial-Test Der Binomial-Test prüft nach, ob eine Teilproportion einer Gruppe in einer Population mit der von uns angenommener Wert gleich ist. Frage: Es wird Anhand der vorigen Untersuchungen angenommen, dass 53% der behandelten Hunden männlich ist. Kann es auf Grund der genommenen Stichprobe auch für richtig halten? Antwort: Es wird angenommen, dass die einzelne Blutparametern an zufällig ausgewählten Individuen gemessen wurden. Anhand der H0 Hypothese die Proportion der Männlichen ist In der Stichprobe ist dieser Wert nur Es schein so zu sein, dass die Proportion der Männlichen kleiner ist. Zur Beantworten dieser Frage wird der Binomial-Test gebraucht: Statistics/Proportions/Single-samlple proportion test Es wird erst die Veränderliche ausgewählt: Nur aus den Faktoren kann man wählen. (und zwar nur solche die nur zwei Kategorien haben. Wenn mehrere Kategorien vorhanden sind, dann mit Hilfe der Funktion ifelse kann man zwei Kategorien angeben. Bitte aufpassen! Bei der Angabe der Nullhypothese muss man die Aufgabe umformulieren. Die Aufgabe kann mehrere Kategorien haben. (Erinnere, die Kategorien sind die einzelnen Gruppen, in den man die Beobachtungen eingeordnet hat. In unserem Falle male und female wurde gebraucht und das Programm wird immer das brauchen, was alphabetisch vorher steht! Darum muss man die Nullhypothese ändern. Es wird im Weiteren angenommen, dass 47% der Hunde weiblich sind. Das Konfidenzintervall bleibt an 95%. Also im Options Fenster muss man für die Nullhypothese 0.47 angeben. Die Gegenhypothese kann zweiseitige oder einseitige sein. Es wird jetzt zweiseitige gebraucht. Es wird bedeuten, wenn die Proportion der Weiblichen in beliebige Richtung wesentlich von 47% abweicht, dann glaubt man die H0 Hypothese nicht mehr. Wenn man einseitige Gegenhypothese hat, dann betrachtet man nur eine Richtung. Später wird dafür ein Beispiel erläutert. Börzsönyi L. 1

2 Zum Schluss wird den Typ der statistischen Test eingestellt, nämlich man kann von mehreren Möglichkeiten wählen. Exact binomial Test ist zu einem kleinen Fallzahl zu brauchen ist. Wenn die Fallzahl zu groß ist, und der Binomial-Test nicht zu brauchen ist, dann wählt man eine normale Ernährung. Das Ergebnis des Tests ist: >.Table Gender female male > binom.test(rbind(.table), alternative='two.sided', p=.47, conf.level=.95) Exact binomial test data: rbind(.table) number of successes = 40, number of trials = 70, p-value = alternative hypothesis: true probability of success is not equal to probability of success Der p-wert ist , d.h. es ist 9.445%. Das ist grösser, als 5% und darum wird die Nullhypothese nicht abgelehnt. Es wird im Weiteren auch geglaubt, dass das Verhältnis der Weiblichen 47% ist, d.h. das Verhältnis der Männlichen ist 53% ist. Das Konfidenzintervall mit 95% zeigt darauf hin, dass die Proportion der Weiblichen in der Stichprobe mit der Wahrscheinlichkeit 95% zwischen und liegt. In dem Intervall ist die Proportion 47% enthalten, d.h. es wir die Nullhypothese bei zweiseitigen Gegenhypothese nicht abgelehnt. Wie die letzte Reihe zeigt die Proportion der Weiblichen in der Stichprobe ist (Die zwei letzten ist eine Intervall- bzw. eine Punktschätzung für die Proportion der Weiblichen anhand der Stichprobe. Einstichproben t-test Der einstichproben t-test ist dazu geeignet, dass man damit einstscheiden kann, ob ein durchschnittlicher Wert der Population mit von uns angenommenen Wert übereistimmt. Oder eine Stichprobe aus einer bekannt en Population stammt oder nicht. Die Annahme der Anwendung ist die normalverteilte Population. Börzsönyi L. 2

3 Frage: Ist die Annahme zu glauben, ob der Durchschnittswert von HCO3 bei Hunden 18.3 ist? Antwort: Es steht eine Stichprobe zu Verfügung, daraus folgt auch, dass man einstichproben t-test angewendet wird. Erst wird die Normalität der Population, wovon die Stichprobe stammt, überprüft. In Praxis ist die visuelle Überprüfung der Normalität verbreitet. Dazu lässt man ein QQ-Plot durch das folgende Menü: Graphs/Quantile-comparison plot erscheinen. Normalerweise gibt man nur die Name der untersuchende Variable an und in Options Fenster füllt man nichts aus. Prinzipiell könnte man die untersuchenden Daten zu der Normalverteilung vergleichen, aber deren Wichtigkeit ist vernachlässigbar. Das Ergebnis ist folgendes: Die Normalität ist dann zu glauben, wenn eine geringe Anzahl der Punkte außer den gestrichelten Kurven fallen und die Mehrheit der Punkte an der kontinuierlichen Gerade anpassen. Wenn die Punkte hufeisenförmig sind, an den zwei Randen liegen die Punkte über der Gerade und in der Mitte unter der Gerade, dann liegt meist keine Normalität vor. Eine andere Methode zu der visuellen Kontrolle der Normalität ist Zeichnen eines Histogramms. Zu dem Histogramm soll eine symmetrische Glockenkurve gut anpassen und sie muss uni modal (einhöckerig) sein. Börzsönyi L. 3

4 In unserem Falle liegt eine Normalverteilung vor. Der einstichproben t-test wird durch das Menü: Statistics/Means/Single sample berechnet. Es wird die untersuchende Variable HCO3 ausgewählt, für welchen Mittelwert ein Interesse hat. Man gibt den angenommenen Mittelwert 18.3 an. Den Konfidenzniveau kann gelassen (oder geändert) werden. Bei der Angabe der Alternativhypothese wird eine zweiseitige Fragestellung gebraucht. > t.test(blut$hco3, alternative='two.sided', mu=18.3, conf.level=.95) One Sample t-test data: Blut$HCO3 t = 0.151, df = 69, p-value = alternative hypothesis: true mean is not equal to mean of x Der p-wert ist , das ist grösser als 5%, d.h. die Nullhypothese wird beibehalten, daraus folgt bei dieser Konfidenzniveau ist es zu glauben, dass Populationsmittelwert 18.3 ist. In der letzten Zeile findet man den Stichprobenmittelwert und dieser Wert fällt zwischen den 95%-en Konfidenzgrenzen: und Zweistichproben t-test. Mit Hilfe des zweistichproben t-tests wird zu entscheiden, ob zwei Populationsmittelwerte, an Hand zwei unabhängigen Stichprobengruppen übereinstimmen oder nicht. Es ist angenommen, dass die Populationen, wovon die Stichproben stammen, normalverteilt sind. Frage: Ist die Annahme zu glauben, ob die Durchschnittswerte von HCO3 bei männlichen und weiblichen Hunden übereinstimmen? Antwort: Es gibt zwei Gruppen (männliche und weibliche Hunde). Die Durchschnittswerte werden offensichtlich mit Hilfe zweistichproben t-test verglichen. Die Normalität wird jetzt gruppenweise kontrolliert. Für die gesamte Population wurde schon die Normalität der HCO3-Werte überprüft. Jetzt wird dafür ein Boxplot betrachtet. Sonst, wenn der QQ-Plot nicht ganz überzeugend ist, dann wird oft dafür ein Boxplot angegeben. Nun in unserem Falle: Börzsönyi L. 4

5 Die Dosen sind symmetrisch, es gibt keine sichtbare Disproportionalität zwischen den Inneren und Äußeren der Dosen. Wenn es nicht so wäre, dann würde man die Überprüfung nicht mehr fortsetzen. Es werden im Weitern die männlichen und weiblichen getrennt untersucht. Herstellung der Teilmengen Es wird das folgende Menü zweimal nacheinander angewendet: Data/Active data set/subset active data set In der neuen Datenmenge werden alle Spalten eingenommen: Man schreibe die Filterannahme ein. Erst muss man den Name der Spalte angeben, dann schreibt man zwei Gleichheitszeichen nacheinander. (Bitte aufpassen, wenn man nur ein Gleichheitszeichen schreibt, dann kann das Programm die weiblichen auch für männlichen umschreiben!!!) Zum Schluss gibt man den Wert der Variable an, was man in der Teilmenge einnehmen möchte. Im Falle einer Textvariablen muss man den Wert zwischen Gänsefüßchen legen. Selbstverständlich nicht nur Gleichheit kann man angeben. Einige Beispiele für mögliche Teilmengen: HCO3<10, HCO3<=10. HCO3<10&HB<0.5 (Bei einer und- Verknüpfung müssen beiden Seiten der Anknüpfung gelten!), HCO3<10 HB<0.5 (Im Falle einer oder- Verknüpfung muss mindestens eine Anknüpfung gelten.) Es mag noch die Anknüpfung!is.na(HCO3) wichtig zu sein, die nimmt diejenige Zeilen in der Teilmenge ein, bei den die Werte HCO3 angegeben sind. Das Aufrufzeichen bedeutet die Negation, d.h. unter der Verknüpfung HCO3!=10 werden in der Teilmenge eingenommen, wobei die Werte von HCO3 von 10 unterschiedlich sind. Zum Schluss gibt man einem neuen Name für die Datenmenge: Man prüfe die Normalität an, wie es früher gemacht wurde: Börzsönyi L. 5

6 Bei solchem kleinen Stichprobenumfang sind diese Fehlern noch zu erlauben. Man kehre zu den ursprünglichen Daten zurück: die die Daten der weiblichen enthält:. Man fertige die Datenmenge an, Ma überprüfe die Normalität hier auch: Bei denen gilt die Normalität auch. Also die zweistichproben t-test ist anwendbar. Es geht mit dem folgenden Menü: Statistics/Means/Independent samples t-test Jetzt kehre man zu den ursprünglichen Daten Blut zurück. Man muss eine solche Variable auswählen, die zwei Kategorien besitzt und sie teilt derart die Beobachtungen in zwei Börzsönyi L. 6

7 Gruppen. Die Variable Geschlecht (Gender) ist so eine. Die Zielvariable HCO3 sind in zwei Gruppen geteilt, deren Mittelwerte möchte man miteinander vergleichen. Im Options Fenster stellt man die Gegenhypothese ein, was eine zweiseitige Hypothese ist, wie es üblich ist. Das Konfidenzintervall gibt man mit der Sicherheit 95% an. Das Programm fragt noch nach der Gleichheit der Varianzen an. Hier könnte man prinzipiell zwei Methoden anwenden. Einmal für ja, und einmal für nein. In der Praxis wählen ein Teil der Statistiker immer nein. (Nach ihrer Meinung können zwei Varianzen nie gleich sein.) > t.test(hco3~gender, alternative='two.sided', conf.level=.95, + var.equal=false, data=blut) Welch Two Sample t-test data: HCO3 by Gender t = 0.655, df = , p-value = alternative hypothesis: true difference in means is not equal to mean in group female mean in group male Der p-wert ist Dieser Wert ist grösser, als 5%. Daraus folgt, dass die Nullhypothese wird nicht abgelehnt, d.h. der Mittelwert von HCO3 bei den männlichen und weiblichen gleich sind. Wie üblich bekommt man in beiden Gruppen Der Mittelwert, sowie ein Konfidenzintervall für die Differenz der zwei Mittelwerte mit 95% Sicherheit. Zweistichproben t-test (einseitige Gegenhypothese) Frage: Ist die Annahme zu glauben, dass der durchschnittliche HCO3-Wert bei männlichen Hunden grösser, als weiblichen ist? Antwort: Die Frage bezieht sich auf den Durchschnittswert von HCO3. Die Beobachtungen sind in zwei Gruppen (männlich und weiblich) geteilt worden. Es wird offensichtlich eine zweistichproben t-test angewendet. Erst muss man die Normalität der Daten überprüfen. Bei der vorigen Aufgabe wurde es schon angefertigt. Der zweistichproben t-test wird unter den Menü: Statistics/Means/Independent samples t-test angewendet. Die Einstellungen sind fast die selben, wie bei der vorigen Aufgabe. Unsere Nullhypothese ist jetzt, dass der HCO3-Wert bei männlichen grösser, als der weiblichen ist. Weil man die Variable Gender ausgewählt wurde, das Programm zeigt uns, dass die Differenz female-male gerechnet wird. Es wird negativ sein, wenn der HCO3-Wert bei männlichen Börzsönyi L. 7

8 grösser ist. Der Gegenhypothese muss die Nullhypothese ausschließen, d.h. man muss im Options Fenster Difference<0 wählen. > t.test(hco3~gender, alternative='less', conf.level=.95, var.equal=false, + data=blut) Welch Two Sample t-test data: HCO3 by Gender t = 0.655, df = , p-value = alternative hypothesis: true difference in means is less than 0 -Inf mean in group female mean in group male Der p-wert , was grösser als 5%, d.h. die Nullhypothese wird beibehalten, also bei männlichen ist der durchschnittliche HCO3-Wert signifikant nicht grösser, als der weiblichen. Das Programm schreibt in beiden Gruppen den Durchschnitt, und für den Differenz der Mittelwerten ein Konfidenzintervall mit 95% Sicherheit aus. Es lohnt sich beobachten, dass das Konfidenzintervall in dem vorigen Beispiel auf den Differenz der Durchschnitten symmetrisch war. Diese Symmetrie gilt nicht mehr, von links ist sie minus unendlich und von rechts ist sie eine endliche Zahl. Der paarige t-test (verbundener t-test) Dieser Test wird dann angewendet, wenn man bei jeden Individuen zwei zugehörige Beobachtungen registriert wird und die Differenz dieser zwei Werte testen möchte. Frage: Ist die Annahme zu glauben, dass die durchschnittliche Raupenmenge und Larvenmenge bei Falter übereinstimmen? Antwort: Bei dieser Fragestellung wird ein verbundener t-test angewendet. Man muss erst überprüfen, ob die Differenz der zugehörigen Daten normalverteilt ist. Durch den Befehl gibt man die Differenz der Variablen an: Falter$DIFFERENZ=Falter$LARVENMENGE-Falter$RAUPENMENGE0 In diesem Falle braucht man meist den Befehl: Data/Active data set/refresh active data set um die angefertigte neue Spalte anwendbar sei. Börzsönyi L. 8

9 Der QQ-Plot für die Variable DIFFERENZ: (Wenn DIFFERENZ nicht erscheinen würde, dann muss man die Datenmenge erfrischen: Data- Active data set Refresh active data set). Die letzten zwei Plots sind nicht mehr so einfach und eindeutig abzulesen. In solchen Fällen lohnt sich es um die Meinung eines Statistikers zu bitten. Die konkrete Entscheidung ist jetzt dafür, dass diese Daten angenähert normalverteilt betrachtet werden kann. Der paarige T-Test wird durch das folgende Menü angewendet: Statistics/Means/Paired t-test Die Einstellungen sind fast die selben, als bei den zweistichproben t-test. Es gibt zwei Unterschiede: einerseits hier braucht man nicht auf die Gleichheit der Varianzen kümmern, anderseits es wird hier zwei Datenvariable ausgewählt, weil es zu jeden Beobachtung zwei zugehörige Werte angehört, die werden verkoppelt. > t.test(falter$larvenmenge, Falter$RAUPENMENGE0, alternative='two.sided', + conf.level=.95, paired=true) Paired t-test data: Falter$LARVENMENGE and Falter$RAUPENMENGE0 t = , df = 55, p-value < 2.2e-16 alternative hypothesis: true difference in means is not equal to mean of the differences Börzsönyi L. 9

10 Der p-wert ist 2.2x10-16, was keiner als 5% ist, d.h. die Nullhypothese (die durchschnittliche Raupenmenge und Larvenmenge stimmen bei Falter überein) wird abgelehnt. Daraus folgt, dass die durchschnittliche Raupenmenge und Larvenmenge nicht gleich sind. Die üblich Differenz der Durchschnitte und die übliche Konfidenzintervall zu der Sicherheit 95% wird angegeben. Der paarige t-test (verbundener t-test mit einseitiger Gegenhypothese) Frage: Ist die Annahme zu glauben, dass die durchschnittliche Raupenmenge grösser, als die Larvenmenge bei Falter ist? Antwort: Bei dieser Fragestellung wird ein verbundener t-test mit einseitiger Gegenhypothese angewendet. Die Einstellungen sind ähnlich, wie bei der vorigen Fragestellung, bloß die Alternativhypothese wählt man wie folg: Difference>0; d.h. (LARVENMENGE- RAUPENMENGE0>0) ist. > t.test(falter$larvenmenge, Falter$RAUPENMENGE0, alternative='greater', + conf.level=.95, paired=true) Paired t-test data: Falter$LARVENMENGE and Falter$RAUPENMENGE0 t = , df = 55, p-value < 2.2e-16 alternative hypothesis: true difference in means is greater than Inf mean of the differences Der p-wert ist 2.2x10-16, was keiner als 5% ist, d.h. die Nullhypothese wird abgelehnt und die Alternativhypothese beibehalten. Daraus folgt, dass die durchschnittliche Larvenmenge signifikant grösser, als Raupenenmenge0 ist. Es ist einfach zu zeigen, wenn man die Alternativhypothese: Difference<0 ist; d.h. (LARVENMENGE-RAUPENMENGE0<0) wählen würde, dann hätte man den p-wert=1 bekommen, d.h. in diesem Falle müsste man die H0 Hypothese beibehalten. Mit anderen Worten es ist nicht zu glaube, dass die Larvenmenge signifikant kleiner, als die Raupenmenge0 ist. Börzsönyi L. 10

11 > t.test(falter$larvenmenge, Falter$RAUPENMENGE0, alternative='less', + conf.level=.95, paired=true) Paired t-test data: Falter$LARVENMENGE and Falter$RAUPENMENGE0 t = , df = 55, p-value = 1 alternative hypothesis: true difference in means is less than 0 -Inf mean of the differences F-Test Mit Hilfe von F-Test wird entschieden, ob zwei Populationsvarianzen gleich oder unterschiedlich sind. Die Annahme des Tests ist normalverteilte Populationen und Unabhängigkeit der Stichproben. Frage: Ist die Annahme zu glauben, dass die Varianzen der HCO3-Werten bei männlichen und weiblichen Hunden gleich sind? Antwort: Die Normalität der HCO3-Werten wurde schon früher kontrolliert. Die Stichproben bei männlichen und weiblichen Hunden sind unabhängig. Der F-Test ist anwendbar. Man kommt in folgendes Menü: Statistics/Variances/Two-variances F-test Es wird eine zweiseitige Probe angewendet. Die Variablen sind wie üblich ausgewählt. > tapply(blut$hco3, Blut$Gender, var, na.rm=true) female male > var.test(hco3 ~ Gender, alternative='two.sided', conf.level=.95, data=blut) F test to compare two variances data: HCO3 by Gender F = , num df = 39, denom df = 29, p-value = alternative hypothesis: true ratio of variances is not equal to ratio of variances Börzsönyi L. 11

12 Der p-wert ist , was kleiner als 5% ist, d.h. die Nullhypothese wird abgelehnt, die Varianzen sind nicht gleich in den zwei Gruppen. Es ist zu bemerken, dass das Konfidenzintervall auf dem Quotienten der Varianzen berechnet wurde. Levine-Test Mit Hilfe von Levine-Test wird entschieden, ob zwei oder mehrere Populationsvarianzen gleich oder unterschiedlich sind. Mit anderen Worten, ob die untersuchten Varianzen homogen sind. Die Stichproben müssen unabhängig sein, aber die Normalität ist hier nicht vorausgesetzt. Frage: Ist die Annahme zu glauben, dass die Varianzen der Larvenmengen der drei unterschiedlichen Temperaturgruppen gleich sind? Antwort: Es muss mehr, als zwei Gruppen untersucht werden, so wird der Levine-Test angewendet. Die Stichprobengruppen sind von einander unabhängig und es sind drei Gruppen. Man wählt das folgende Menü: Statistics/Variances/Levene s test Man wählt die Gruppierungsvariable TEMP, sowie die untersuchende Variable LARVENMENGE aus. Nachher muss man noch die anwendbare Methode auswählen. Für mean wird ein klassischer Levine-Test angewendet. Wenn man median ausgewählt wird, dann wird ein wesentlich robuster Test angewendet. > tapply(falter$larvenmenge, Falter$TEMP, var, na.rm=true) erwaermt gekuelht zimmert > levenetest(falter$larvenmenge, Falter$TEMP, center=mean) Levene's Test for Homogeneity of Variance (center = mean) Df F value Pr(>F) group Der p-wert ist , was größer als 5% ist, d.h. die Nullhypothese wird beibehalten, die Varianzen können gleich betratet werden. Wenn man eine signifikantes Ergebnis bekommen hätte, das würde bedeuten das unter den drei Varianzen sind mindestens zwei verschieden. Mit diesem Test könnte man es nicht beantworten, dass welche zwei Varianzen sind nicht gleich, sowie weißt man auch nicht ob eventuell alle der Varianzen sind unterschiedlich. Börzsönyi L. 12

Eine Einführung in R: Statistische Tests

Eine Einführung in R: Statistische Tests Eine Einführung in R: Statistische Tests Bernd Klaus, Verena Zuber Institut für Medizinische Informatik, Statistik und Epidemiologie (IMISE), Universität Leipzig http://www.uni-leipzig.de/ zuber/teaching/ws12/r-kurs/

Mehr

Statistische Auswertung der Daten von Blatt 13

Statistische Auswertung der Daten von Blatt 13 Statistische Auswertung der Daten von Blatt 13 Problemstellung 1 Graphische Darstellung der Daten 1 Diskussion der Normalverteilung 3 Mittelwerte und deren Konfidenzbereiche 3 Signifikanz der Behandlung

Mehr

Prüfen von Mittelwertsunterschieden: t-test

Prüfen von Mittelwertsunterschieden: t-test Prüfen von Mittelwertsunterschieden: t-test Sven Garbade Fakultät für Angewandte Psychologie SRH Hochschule Heidelberg sven.garbade@hochschule-heidelberg.de Statistik 1 S. Garbade (SRH Heidelberg) t-test

Mehr

Lösung zu Kapitel 11: Beispiel 1

Lösung zu Kapitel 11: Beispiel 1 Lösung zu Kapitel 11: Beispiel 1 Eine Untersuchung bei 253 Personen zur Kundenzufriedenheit mit einer Einzelhandelskette im Südosten der USA enthält Variablen mit sozialstatistischen Daten der befragten

Mehr

Klausur Statistik Lösungshinweise

Klausur Statistik Lösungshinweise Klausur Statistik Lösungshinweise Prüfungsdatum: 1. Juli 2015 Prüfer: Etschberger, Heiden, Jansen Studiengang: IM und BW Aufgabe 1 14 Punkte Ein Freund von Ihnen hat über einen Teil seiner Daten, die er

Mehr

Biostatistik, WS 2015/2016 Der zwei-stichproben-t-test

Biostatistik, WS 2015/2016 Der zwei-stichproben-t-test 1/29 Biostatistik, WS 2015/2016 Der zwei-stichproben-t-test (t-test für ungepaarte Stichproben) Matthias Birkner http://www.staff.uni-mainz.de/birkner/biostatistik1516/ 11.12.2015 2/29 Inhalt 1 t-test

Mehr

R-WORKSHOP II. Inferenzstatistik. Johannes Pfeffer

R-WORKSHOP II. Inferenzstatistik. Johannes Pfeffer R-WORKSHOP II Inferenzstatistik Johannes Pfeffer Dresden, 25.1.2011 01 Outline Lösung der Übungsaufgabe Selbstdefinierte Funktionen Inferenzstatistik t-test Kruskal-Wallis Test Übungsaufgabe TU Dresden,

Mehr

Einfache statistische Testverfahren

Einfache statistische Testverfahren Einfache statistische Testverfahren Johannes Hain Lehrstuhl für Mathematik VIII (Statistik) 1/29 Hypothesentesten: Allgemeine Situation Im Folgenden wird die statistische Vorgehensweise zur Durchführung

Mehr

Grundlagen der Inferenzstatistik

Grundlagen der Inferenzstatistik Grundlagen der Inferenzstatistik (Induktive Statistik oder schließende Statistik) Dr. Winfried Zinn 1 Deskriptive Statistik versus Inferenzstatistik Die Deskriptive Statistik stellt Kenngrößen zur Verfügung,

Mehr

Motivation. Wilcoxon-Rangsummentest oder Mann-Whitney U-Test. Wilcoxon Rangsummen-Test Voraussetzungen. Bemerkungen

Motivation. Wilcoxon-Rangsummentest oder Mann-Whitney U-Test. Wilcoxon Rangsummen-Test Voraussetzungen. Bemerkungen Universität Karlsruhe (TH) Forschungsuniversität gegründet 825 Wilcoxon-Rangsummentest oder Mann-Whitney U-Test Motivation In Experimenten ist die Datenmenge oft klein Daten sind nicht normalverteilt Dann

Mehr

Varianzanalyse * (1) Varianzanalyse (2)

Varianzanalyse * (1) Varianzanalyse (2) Varianzanalyse * (1) Einfaktorielle Varianzanalyse (I) Die Varianzanalyse (ANOVA = ANalysis Of VAriance) wird benutzt, um Unterschiede zwischen Mittelwerten von drei oder mehr Stichproben auf Signifikanz

Mehr

Business Value Launch 2006

Business Value Launch 2006 Quantitative Methoden Inferenzstatistik alea iacta est 11.04.2008 Prof. Dr. Walter Hussy und David Tobinski UDE.EDUcation College im Rahmen des dokforums Universität Duisburg-Essen Inferenzstatistik Erläuterung

Mehr

Wahrscheinlichkeitsrechnung und Statistik für Biologen 5. Der zwei-stichproben-t-test. und der Wilcoxon-Test

Wahrscheinlichkeitsrechnung und Statistik für Biologen 5. Der zwei-stichproben-t-test. und der Wilcoxon-Test Wahrscheinlichkeitsrechnung und Statistik für Biologen 5. Der zwei-stichproben-t-test (t-test für ungepaarte Stichproben) und der Wilcoxon-Test Dirk Metzler 22. Mai 2015 Inhaltsverzeichnis 1 Wiederholung:

Mehr

Grundlagen der Inferenzstatistik: Was Ihnen nicht erspart bleibt!

Grundlagen der Inferenzstatistik: Was Ihnen nicht erspart bleibt! Grundlagen der Inferenzstatistik: Was Ihnen nicht erspart bleibt! 1 Einführung 2 Wahrscheinlichkeiten kurz gefasst 3 Zufallsvariablen und Verteilungen 4 Theoretische Verteilungen (Wahrscheinlichkeitsfunktion)

Mehr

Weitere (wählbare) Kontraste in der SPSS Prozedur Allgemeines Lineares Modell

Weitere (wählbare) Kontraste in der SPSS Prozedur Allgemeines Lineares Modell Einfaktorielle Versuchspläne 27/40 Weitere (wählbare) Kontraste in der SPSS Prozedur Allgemeines Lineares Modell Abweichung Einfach Differenz Helmert Wiederholt Vergleich Jede Gruppe mit Gesamtmittelwert

Mehr

Aufgabe 1 10 ECTS. y i x j gering mittel hoch n i Hausrat 200 25 0 225 KFZ 0 10 75 85 Unfall 20 35 90 145 Reiserücktritt 40 5 0 45 n j 260 75 165 500

Aufgabe 1 10 ECTS. y i x j gering mittel hoch n i Hausrat 200 25 0 225 KFZ 0 10 75 85 Unfall 20 35 90 145 Reiserücktritt 40 5 0 45 n j 260 75 165 500 Aufgabe 1 Für die Securance-Versicherung liegen Ihnen die gemeinsamen absoluten Häugkeiten der Merkmale X: Schadenshöhe und Y : Versicherungsart für die letzten 500 gemeldeten Schäden vor. 1. Interpretieren

Mehr

Die Varianzanalyse ohne Messwiederholung. Jonathan Harrington. Bi8e noch einmal datasets.zip laden

Die Varianzanalyse ohne Messwiederholung. Jonathan Harrington. Bi8e noch einmal datasets.zip laden Die Varianzanalyse ohne Messwiederholung Jonathan Harrington Bi8e noch einmal datasets.zip laden Variablen, Faktoren, Stufen Eine Varianzanalyse ist die Erweiterung von einem t- test t- test oder ANOVA

Mehr

Ein möglicher Unterrichtsgang

Ein möglicher Unterrichtsgang Ein möglicher Unterrichtsgang. Wiederholung: Bernoulli Experiment und Binomialverteilung Da der sichere Umgang mit der Binomialverteilung, auch der Umgang mit dem GTR und den Diagrammen, eine notwendige

Mehr

Stichprobenauslegung. für stetige und binäre Datentypen

Stichprobenauslegung. für stetige und binäre Datentypen Stichprobenauslegung für stetige und binäre Datentypen Roadmap zu Stichproben Hypothese über das interessierende Merkmal aufstellen Stichprobe entnehmen Beobachtete Messwerte abbilden Schluss von der Beobachtung

Mehr

5. Schließende Statistik. 5.1. Einführung

5. Schließende Statistik. 5.1. Einführung 5. Schließende Statistik 5.1. Einführung Sollen auf der Basis von empirischen Untersuchungen (Daten) Erkenntnisse gewonnen und Entscheidungen gefällt werden, sind die Methoden der Statistik einzusetzen.

Mehr

Analog zu Aufgabe 16.1 werden die Daten durch folgenden Befehl eingelesen: > kredit<-read.table("c:\\compaufg\\kredit.

Analog zu Aufgabe 16.1 werden die Daten durch folgenden Befehl eingelesen: > kredit<-read.table(c:\\compaufg\\kredit. Lösung 16.3 Analog zu Aufgabe 16.1 werden die Daten durch folgenden Befehl eingelesen: > kredit

Mehr

Auswertung mit dem Statistikprogramm SPSS: 30.11.05

Auswertung mit dem Statistikprogramm SPSS: 30.11.05 Auswertung mit dem Statistikprogramm SPSS: 30.11.05 Seite 1 Einführung SPSS Was ist eine Fragestellung? Beispiel Welche statistische Prozedur gehört zu welcher Hypothese? Statistische Berechnungen mit

Mehr

Tutorial: Homogenitätstest

Tutorial: Homogenitätstest Tutorial: Homogenitätstest Eine Bank möchte die Kreditwürdigkeit potenzieller Kreditnehmer abschätzen. Einerseits lebt die Bank ja von der Vergabe von Krediten, andererseits verursachen Problemkredite

Mehr

Evaluation der Normalverteilungsannahme

Evaluation der Normalverteilungsannahme Evaluation der Normalverteilungsannahme. Überprüfung der Normalverteilungsannahme im SPSS P. Wilhelm; HS SPSS bietet verschiedene Möglichkeiten, um Verteilungsannahmen zu überprüfen. Angefordert werden

Mehr

Statistische Datenauswertung. Andreas Stoll Kantonsschule Olten

Statistische Datenauswertung. Andreas Stoll Kantonsschule Olten Statistische Datenauswertung Andreas Stoll Beschreibende vs. schliessende Statistik Wir unterscheiden grundsätzlich zwischen beschreibender (deskriptiver) und schliessender (induktiver) Statistik. Bei

Mehr

Einfache statistische Auswertungen mit dem Programm SPSS

Einfache statistische Auswertungen mit dem Programm SPSS Einfache statistische Auswertungen mit dem Programm SPSS Datensatz: fiktive_daten.sav Dipl. Päd. Anne Haßelkus Dr. Dorothea Dette-Hagenmeyer 11/2011 Überblick 1 Deskriptive Statistiken; Mittelwert berechnen...

Mehr

Lineare Modelle in R: Einweg-Varianzanalyse

Lineare Modelle in R: Einweg-Varianzanalyse Lineare Modelle in R: Einweg-Varianzanalyse Achim Zeileis 2009-02-20 1 Datenaufbereitung Wie schon in der Vorlesung wollen wir hier zur Illustration der Einweg-Analyse die logarithmierten Ausgaben der

Mehr

Klausur: Einführung in die Statistik

Klausur: Einführung in die Statistik 1 Lösungen immer unter die jeweiligen Aufgaben schreiben. Bei Platzmangel auf die Rückseite schreiben (dann Nummer der bearbeiteten Aufgabe mit anmerken!!!). Lösungen, die nicht auf den Aufgabenblättern

Mehr

Statistik II für Betriebswirte Vorlesung 3

Statistik II für Betriebswirte Vorlesung 3 PD Dr. Frank Heyde TU Bergakademie Freiberg Institut für Stochastik Statistik II für Betriebswirte Vorlesung 3 5. November 2013 Beispiel: Aktiensplit (Aczel & Sounderpandan, Aufg. 14-28) Ein Börsenanalyst

Mehr

Einführung in die statistische Datenanalyse I

Einführung in die statistische Datenanalyse I Einführung in die statistische Datenanalyse I Inhaltsverzeichnis 1. EINFÜHRUNG IN THEORIEGELEITETES WISSENSCHAFTLICHES ARBEITEN 2 2. KRITIERIEN ZUR AUSWAHL STATISTISCH METHODISCHER VERFAHREN 2 3. UNIVARIATE

Mehr

Überblick über die Tests

Überblick über die Tests Anhang A Überblick über die Tests A.1 Ein-Stichproben-Tests A.1.1 Tests auf Verteilungsannahmen ˆ Shapiro-Wilk-Test Situation: Test auf Normalverteilung H 0 : X N(µ, σ 2 ) H 1 : X nicht normalverteilt

Mehr

Bachelorabschlussseminar Dipl.-Kfm. Daniel Cracau

Bachelorabschlussseminar Dipl.-Kfm. Daniel Cracau 1 Einführung in die statistische Datenanalyse Bachelorabschlussseminar Dipl.-Kfm. Daniel Cracau 2 Gliederung 1.Grundlagen 2.Nicht-parametrische Tests a. Mann-Whitney-Wilcoxon-U Test b. Wilcoxon-Signed-Rank

Mehr

SZIE Budapest 1. Übung Biomathematik 2016

SZIE Budapest 1. Übung Biomathematik 2016 1. Übung (Dateneingabe, Datenbehandlung) Literatur für R Dubravko Dolic (2003): "Statistik mit R. Einführung für Wirtschafts- und Sozialwissenschaftler", Oldenbourg, ISBN 3486275372 Uwe Ligges (2008):

Mehr

Willkommen zur Vorlesung Statistik (Master)

Willkommen zur Vorlesung Statistik (Master) Willkommen zur Vorlesung Statistik (Master) Thema dieser Vorlesung: Verteilungsfreie Verfahren Prof. Dr. Wolfgang Ludwig-Mayerhofer Universität Siegen Philosophische Fakultät, Seminar für Sozialwissenschaften

Mehr

Willkommen zur Vorlesung Statistik

Willkommen zur Vorlesung Statistik Willkommen zur Vorlesung Statistik Thema dieser Vorlesung: Varianzanalyse Prof. Dr. Wolfgang Ludwig-Mayerhofer Universität Siegen Philosophische Fakultät, Seminar für Sozialwissenschaften Prof. Dr. Wolfgang

Mehr

Kommentierter SPSS-Ausdruck zur logistischen Regression

Kommentierter SPSS-Ausdruck zur logistischen Regression Daten: POK V AG 3 (POKV_AG3_V07.SAV) Kommentierter SPSS-Ausdruck zur logistischen Regression Fragestellung: Welchen Einfluss hat die Fachnähe und das Geschlecht auf die interpersonale Attraktion einer

Mehr

Varianzanalyse (ANOVA: analysis of variance)

Varianzanalyse (ANOVA: analysis of variance) Varianzanalyse (AOVA: analysis of variance) Einfaktorielle VA Auf der Basis von zwei Stichproben wird bezüglich der Gleichheit der Mittelwerte getestet. Variablen müssen Variablen nur nominalskaliert sein.

Mehr

Box-and-Whisker Plot -0,2 0,8 1,8 2,8 3,8 4,8

Box-and-Whisker Plot -0,2 0,8 1,8 2,8 3,8 4,8 . Aufgabe: Für zwei verschiedene Aktien wurde der relative Kurszuwachs (in % beobachtet. Aus den jeweils 20 Quartaldaten ergaben sich die folgenden Box-Plots. Box-and-Whisker Plot Aktie Aktie 2-0,2 0,8,8

Mehr

Einige Statistische Tests für den Ein- Zwei- und k-stichprobenfall (Nach Sachs, Stat. Meth.)

Einige Statistische Tests für den Ein- Zwei- und k-stichprobenfall (Nach Sachs, Stat. Meth.) ue biostatistik: nichtparametrische testverfahren / ergänzung 1/6 h. Lettner / physik Statistische Testverfahren Einige Statistische Tests für den Ein- Zwei- und k-stichprobenfall (Nach Sachs, Stat. Meth.)

Mehr

Kapitel 34 Boxplots und Fehlerbalken

Kapitel 34 Boxplots und Fehlerbalken Kapitel 34 Boxplots und Fehlerbalken Boxplots und Fehlerbalken sind dazu geeignet, die Lage und Verteilung der Werte einer Stichprobe grafisch darzustellen. Die beiden Diagrammtypen sind auf die Darstellungen

Mehr

90-minütige Klausur Statistik für Studierende der Kommunikationswissenschaft

90-minütige Klausur Statistik für Studierende der Kommunikationswissenschaft Prof. Dr. Helmut Küchenhoff SS08 90-minütige Klausur Statistik für Studierende der Kommunikationswissenschaft am 22.7.2008 Anmerkungen Überprüfen Sie bitte sofort, ob Ihre Angabe vollständig ist. Sie sollte

Mehr

Webergänzung zu Kapitel 10

Webergänzung zu Kapitel 10 Webergänzung zu Kapitel 10 10.1.4 Varianzanalyse (ANOVA: analysis of variance) Im Kapitel 10 haben wir uns hauptsächlich mit Forschungsbeispielen beschäftigt, die nur zwei Ergebnissätze hatten (entweder

Mehr

1 Verteilungen und ihre Darstellung

1 Verteilungen und ihre Darstellung GKC Statistische Grundlagen für die Korpuslinguistik Kapitel 2: Univariate Deskription von Daten 8.11.2004 Univariate (= eindimensionale) Daten bestehen aus Beobachtungen eines einzelnen Merkmals. 1 Verteilungen

Mehr

Auswertung und Darstellung wissenschaftlicher Daten (1)

Auswertung und Darstellung wissenschaftlicher Daten (1) Auswertung und Darstellung wissenschaftlicher Daten () Mag. Dr. Andrea Payrhuber Zwei Schritte der Auswertung. Deskriptive Darstellung aller Daten 2. analytische Darstellung (Gruppenvergleiche) SPSS-Andrea

Mehr

Übungen zur Veranstaltung Statistik 2 mit SPSS

Übungen zur Veranstaltung Statistik 2 mit SPSS Raum 22, Tel. 39 4 Aufgabe 5. Wird der neue Film MatchPoint von Woody Allen von weiblichen und männlichen Zuschauern gleich bewertet? Eine Umfrage unter 00 Kinobesuchern ergab folgende Daten: Altersgruppe

Mehr

Statistik II für Betriebswirte Vorlesung 2

Statistik II für Betriebswirte Vorlesung 2 PD Dr. Frank Heyde TU Bergakademie Freiberg Institut für Stochastik Statistik II für Betriebswirte Vorlesung 2 21. Oktober 2014 Verbundene Stichproben Liegen zwei Stichproben vor, deren Werte einander

Mehr

Auswerten mit Excel. Viele Video-Tutorials auf Youtube z.b. http://www.youtube.com/watch?v=vuuky6xxjro

Auswerten mit Excel. Viele Video-Tutorials auf Youtube z.b. http://www.youtube.com/watch?v=vuuky6xxjro Auswerten mit Excel Viele Video-Tutorials auf Youtube z.b. http://www.youtube.com/watch?v=vuuky6xxjro 1. Pivot-Tabellen erstellen: In der Datenmaske in eine beliebige Zelle klicken Registerkarte Einfügen

Mehr

Grundlagen von Versuchsmethodik und Datenanalyse

Grundlagen von Versuchsmethodik und Datenanalyse Grundlagen von Versuchsmethodik und Datenanalyse Der Anfang: Hypothesen über Ursache-Wirkungs-Zusammenhänge Ursache Wirkung Koffein verbessert Kurzzeitgedächtnis Gewaltfilme führen zu aggressivem Verhalten

Mehr

METHODENLEHRE I WS 2013/14 THOMAS SCHÄFER

METHODENLEHRE I WS 2013/14 THOMAS SCHÄFER METHODENLEHRE I WS 2013/14 THOMAS SCHÄFER DAS THEMA: INFERENZSTATISTIK IV INFERENZSTATISTISCHE AUSSAGEN FÜR ZUSAMMENHÄNGE UND UNTERSCHIEDE Inferenzstatistik für Zusammenhänge Inferenzstatistik für Unterschiede

Mehr

Studiendesign und Statistik: Interpretation publizierter klinischer Daten

Studiendesign und Statistik: Interpretation publizierter klinischer Daten Studiendesign und Statistik: Interpretation publizierter klinischer Daten Dr. Antje Jahn Institut für Medizinische Biometrie, Epidemiologie und Informatik Universitätsmedizin Mainz Hämatologie im Wandel,

Mehr

(Repeated-measures ANOVA) path = "Verzeichnis wo Sie anova1 gespeichert haben" attach(paste(path, "anova1", sep="/"))

(Repeated-measures ANOVA) path = Verzeichnis wo Sie anova1 gespeichert haben attach(paste(path, anova1, sep=/)) Varianzanalyse mit Messwiederholungen (Repeated-measures ANOVA) Jonathan Harrington Befehle: anova2.txt path = "Verzeichnis wo Sie anova1 gespeichert haben" attach(paste(path, "anova1", sep="/")) Messwiederholungen:

Mehr

Academic Skills - Befragung und Auswertung

Academic Skills - Befragung und Auswertung Otto-von-Guericke University Magdeburg Allgemein Befragung Eine Befragung ist eine wissenschaftliche Maßnahme zur Erforschung von Verhalten, Einstellung oder Wissen Des Weiteren können auch demographische

Mehr

9. StatistischeTests. 9.1 Konzeption

9. StatistischeTests. 9.1 Konzeption 9. StatistischeTests 9.1 Konzeption Statistische Tests dienen zur Überprüfung von Hypothesen über einen Parameter der Grundgesamtheit (bei einem Ein-Stichproben-Test) oder über die Verteilung einer Zufallsvariablen

Mehr

Grundlagen quantitativer Sozialforschung Interferenzstatistische Datenanalyse in MS Excel

Grundlagen quantitativer Sozialforschung Interferenzstatistische Datenanalyse in MS Excel Grundlagen quantitativer Sozialforschung Interferenzstatistische Datenanalyse in MS Excel 16.11.01 MP1 - Grundlagen quantitativer Sozialforschung - (4) Datenanalyse 1 Gliederung Datenanalyse (inferenzstatistisch)

Mehr

(VU) Übungen zur Einführung in die statistische Datenanalyse II. Inhalte Statistik I. Inhalte Statistik I Deskriptive Statistik

(VU) Übungen zur Einführung in die statistische Datenanalyse II. Inhalte Statistik I. Inhalte Statistik I Deskriptive Statistik II Übungen zur II Organisatorische Hinweise Keine Anwesenheitspflicht (aber empfehlenswert) Einführung in die statistische Datenanalyse II (VU) Lehrinhalte (.ppt Folien): elearning.univie.ac.at 3 Prüfungstermine:

Mehr

Umgang mit und Ersetzen von fehlenden Werten bei multivariaten Analysen

Umgang mit und Ersetzen von fehlenden Werten bei multivariaten Analysen Umgang mit und Ersetzen von fehlenden Werten bei multivariaten Analysen Warum überhaupt Gedanken machen? Was fehlt, ist doch weg, oder? Allgegenwärtiges Problem in psychologischer Forschung Bringt Fehlerquellen

Mehr

Varianzanalyse ANOVA

Varianzanalyse ANOVA Varianzanalyse ANOVA Johannes Hain Lehrstuhl für Mathematik VIII Statistik 1/23 Einfaktorielle Varianzanalyse (ANOVA) Bisher war man lediglich in der Lage, mit dem t-test einen Mittelwertsvergleich für

Mehr

T-TEST BEI EINER STICHPROBE:

T-TEST BEI EINER STICHPROBE: Kapitel 19 T-Test Mit Hilfe der T-TEST-Prozeduren werden Aussagen über Mittelwerte getroffen. Dabei wird versucht, aus den Beobachtungen einer Stichprobe Rückschlüsse auf die Grundgesamtheit zu ziehen.

Mehr

Übungsaufgaben zu Kapitel 5. Aufgabe 101. Inhaltsverzeichnis:

Übungsaufgaben zu Kapitel 5. Aufgabe 101. Inhaltsverzeichnis: Inhaltsverzeichnis: Übungsaufgaben zu Kapitel 5... 1 Aufgabe 101... 1 Aufgabe 102... 2 Aufgabe 103... 2 Aufgabe 104... 2 Aufgabe 105... 3 Aufgabe 106... 3 Aufgabe 107... 3 Aufgabe 108... 4 Aufgabe 109...

Mehr

Statistik für Studenten der Sportwissenschaften SS 2008

Statistik für Studenten der Sportwissenschaften SS 2008 Statistik für Studenten der Sportwissenschaften SS 008 Aufgabe 1 Man weiß von Rehabilitanden, die sich einer bestimmten Gymnastik unterziehen, dass sie im Mittel µ=54 Jahre (σ=3 Jahre) alt sind. a) Welcher

Mehr

Klausur Wirtschaftsmathematik Lösungshinweise

Klausur Wirtschaftsmathematik Lösungshinweise Klausur Wirtschaftsmathematik Lösungshinweise Prüfungsdatum: 27. Juni 2015 Prüfer: Etschberger Studiengang: Wirtschaftsingenieurwesen Aufgabe 1 16 Punkte Anton Arglos hat von seiner Großmutter 30 000 geschenkt

Mehr

FAKTORIELLE VERSUCHSPLÄNE. Andreas Handl

FAKTORIELLE VERSUCHSPLÄNE. Andreas Handl FAKTORIELLE VERSUCHSPLÄNE Andreas Handl 1 Inhaltsverzeichnis 1 Versuchsplanung 4 2 Einfaktorielle Varianzanalyse 6 2.1 DieAnnahmen... 6 2.2 Die ANOVA-Tabelle und der F -Test... 6 2.3 Versuche mit zwei

Mehr

Gibt es einen Geschmacksunterschied zwischen Coca Cola und Cola Zero?

Gibt es einen Geschmacksunterschied zwischen Coca Cola und Cola Zero? Gibt es einen Geschmacksunterschied zwischen Coca Cola und Cola Zero? Manche sagen: Ja, manche sagen: Nein Wie soll man das objektiv feststellen? Kann man Geschmack objektiv messen? - Geschmack ist subjektiv

Mehr

Lösungen zu Janssen/Laatz, Statistische Datenanalyse mit SPSS 1

Lösungen zu Janssen/Laatz, Statistische Datenanalyse mit SPSS 1 LÖSUNG 3A Lösungen zu Janssen/Laatz, Statistische Datenanalyse mit SPSS 1 Mit den Berechnungsfunktionen LG10(?) und SQRT(?) in "Transformieren", "Berechnen" können logarithmierte Werte sowie die Quadratwurzel

Mehr

3. Der t-test. Der t-test

3. Der t-test. Der t-test Der t-test 3 3. Der t-test Dieses Kapitel beschäftigt sich mit einem grundlegenden statistischen Verfahren zur Auswertung erhobener Daten: dem t-test. Der t-test untersucht, ob sich zwei empirisch gefundene

Mehr

1 Interaktion von zwei Dummyvariablen. 2 Interaktion einer Dummyvariablen mit einer kardinalskalierten Variablen

1 Interaktion von zwei Dummyvariablen. 2 Interaktion einer Dummyvariablen mit einer kardinalskalierten Variablen Modelle mit Interationsvariablen I Modelle mit Interationsvariablen II In der beim White-Test verwendeten Regressionsfuntion y = β 0 + β 1 x 1 + β 2 x 2 + β 3 x 2 1 + β 4 x 2 2 + β 5 x 1 x 2, ist anders

Mehr

3. Der t-test. Der t-test

3. Der t-test. Der t-test 3 3. Der t-test Dieses Kapitel beschäftigt sich mit einem grundlegenden statistischen Verfahren zur Auswertung erhobener Daten: dem t-test. Der t-test untersucht, ob sich zwei empirisch gefundene Mittelwerte

Mehr

a) Zeichnen Sie in das nebenstehende Streudiagramm mit Lineal eine Regressionsgerade ein, die Sie für passend halten.

a) Zeichnen Sie in das nebenstehende Streudiagramm mit Lineal eine Regressionsgerade ein, die Sie für passend halten. Statistik für Kommunikationswissenschaftler Wintersemester 2009/200 Vorlesung Prof. Dr. Helmut Küchenhoff Übung Cornelia Oberhauser, Monia Mahling, Juliane Manitz Thema 4 Homepage zur Veranstaltung: http://www.statistik.lmu.de/~helmut/kw09.html

Mehr

Einführung in SPSS. 1. Die Datei Seegräser

Einführung in SPSS. 1. Die Datei Seegräser Einführung in SPSS 1. Die Datei Seegräser An 25 verschiedenen Probestellen wurde jeweils die Anzahl der Seegräser pro m 2 gezählt und das Vorhandensein von Seeigeln vermerkt. 2. Programmaufbau Die wichtigsten

Mehr

Einführung in statistische Testmethoden

Einführung in statistische Testmethoden Einführung in statistische Testmethoden und die Bearbeitung von Messdaten mit Excel 1. Beispielhafte Einführung in den Gebrauch von Testmethoden 2. Typen von Messwerten, Verteilungen 3. Mittelwert, Varianz,

Mehr

Kaplan-Meier-Schätzer

Kaplan-Meier-Schätzer Kaplan-Meier-Schätzer Ausgangssituation Zwei naive Ansätze zur Schätzung der Survivalfunktion Unverzerrte Schätzung der Survivalfunktion Der Kaplan-Meier-Schätzer Standardfehler und Konfidenzintervall

Mehr

Einführung in die Statistik für Wirtschaftswissenschaftler für Betriebswirtschaft und Internationales Management

Einführung in die Statistik für Wirtschaftswissenschaftler für Betriebswirtschaft und Internationales Management Einführung in die Statistik für Wirtschaftswissenschaftler für Betriebswirtschaft und Internationales Management Sommersemester 2013 Hochschule Augsburg : Gliederung 1 Einführung 2 Deskriptive Statistik

Mehr

Performance Messungen

Performance Messungen Performance Messungen 1 Einordnung titativ iv Quan Qualitat Kontrollierte Eperimente mit Probanden Fragebög en 3 Think Aloud Protokolle Mensch Computer Technisch h h Interview Fallstudien Zeitreihen analysen

Mehr

Univariate/ multivariate Ansätze. Klaus D. Kubinger. Test- und Beratungsstelle. Effektgrößen

Univariate/ multivariate Ansätze. Klaus D. Kubinger. Test- und Beratungsstelle. Effektgrößen Univariate/ multivariate Ansätze Klaus D. Kubinger Effektgrößen Rasch, D. & Kubinger, K.D. (2006). Statistik für das Psychologiestudium Mit Softwareunter-stützung zur Planung und Auswertung von Untersuchungen

Mehr

4. Erstellen von Klassen

4. Erstellen von Klassen Statistik mit Tabellenkalkulation 4. Erstellen von Klassen Mit einem einfachen Befehl lässt sich eine Liste von Zahlen auf die Häufigkeit der einzelnen Werte untersuchen. Verwenden Sie dazu den Befehl

Mehr

Klausur zu Methoden der Statistik II (mit Kurzlösung) Wintersemester 2008/2009. Aufgabe 1

Klausur zu Methoden der Statistik II (mit Kurzlösung) Wintersemester 2008/2009. Aufgabe 1 Lehrstuhl für Statistik und Ökonometrie der Otto-Friedrich-Universität Bamberg Prof. Dr. Susanne Rässler Klausur zu Methoden der Statistik II (mit Kurzlösung) Wintersemester 2008/2009 Aufgabe 1 Im Rahmen

Mehr

Statistik und Wahrscheinlichkeitsrechnung

Statistik und Wahrscheinlichkeitsrechnung Statistik und Wahrscheinlichkeitsrechnung Übung 2 28.02.2008 1 Inhalt der heutigen Übung Beschreibende Statistik Gemeinsames Lösen der Übungsaufgaben 2.1: Häufigkeitsverteilung 2.2: Tukey Boxplot 25:Korrelation

Mehr

Log-lineare Analyse I

Log-lineare Analyse I 1 Log-lineare Analyse I Einleitung Die log-lineare Analysemethode wurde von L.A. Goodman in den 60er und 70er Jahren entwickelt. Sie dient zur Analyse von Zusammenhängen in mehrdimensionalen Kontingenztafeln

Mehr

DSR Daten, Statistik, Risikobewertung AUSWERTUNG GAHS. Intervention + BMI

DSR Daten, Statistik, Risikobewertung AUSWERTUNG GAHS. Intervention + BMI DSR Daten, Statistik, Risikobewertung AUSWERTUNG GAHS + BMI Sophie-Helene Narath Klemens Fuchs Günter Polt Bericht Nr.: B09_003_DSR Freigegeben im April 09 Österreichische Agentur für Gesundheit und Ernährungssicherheit

Mehr

Güte von Tests. die Wahrscheinlichkeit für den Fehler 2. Art bei der Testentscheidung, nämlich. falsch ist. Darauf haben wir bereits im Kapitel über

Güte von Tests. die Wahrscheinlichkeit für den Fehler 2. Art bei der Testentscheidung, nämlich. falsch ist. Darauf haben wir bereits im Kapitel über Güte von s Grundlegendes zum Konzept der Güte Ableitung der Gütefunktion des Gauss im Einstichprobenproblem Grafische Darstellung der Gütefunktionen des Gauss im Einstichprobenproblem Ableitung der Gütefunktion

Mehr

Regressionsanalysen. Zusammenhänge von Variablen. Ziel der Regression. ( Idealfall )

Regressionsanalysen. Zusammenhänge von Variablen. Ziel der Regression. ( Idealfall ) Zusammenhänge von Variablen Regressionsanalysen linearer Zusammenhang ( Idealfall ) kein Zusammenhang nichtlinearer monotoner Zusammenhang (i.d.regel berechenbar über Variablentransformationen mittels

Mehr

Von der Untersuchungsfrage zu statistischen Hypothesen, und wie war das nochmal mit dem α- und

Von der Untersuchungsfrage zu statistischen Hypothesen, und wie war das nochmal mit dem α- und Von der Untersuchungsfrage zu statistischen Hypothesen, und wie war das nochmal mit dem α- und β-fehler? Sven Garbade Fakultät für Angewandte Psychologie SRH Hochschule Heidelberg sven.garbade@hochschule-heidelberg.de

Mehr

Arbeiten mit Excel. 1. Allgemeine Hinweise

Arbeiten mit Excel. 1. Allgemeine Hinweise 1. Allgemeine Hinweise Man sollte eine Excel Tabelle immer so übersichtlich wie möglich halten. Dazu empfiehlt es sich, alle benötigten Daten, Konstanten und Messwerte inklusive aller dazugehörigen Einheiten

Mehr

Kapitel 3. Zufallsvariable. Wahrscheinlichkeitsfunktion, Dichte und Verteilungsfunktion. Erwartungswert, Varianz und Standardabweichung

Kapitel 3. Zufallsvariable. Wahrscheinlichkeitsfunktion, Dichte und Verteilungsfunktion. Erwartungswert, Varianz und Standardabweichung Kapitel 3 Zufallsvariable Josef Leydold c 2006 Mathematische Methoden III Zufallsvariable 1 / 43 Lernziele Diskrete und stetige Zufallsvariable Wahrscheinlichkeitsfunktion, Dichte und Verteilungsfunktion

Mehr

Einleitung 19. Teil I Datenanalyse und Modellbildung Grundlagen 25

Einleitung 19. Teil I Datenanalyse und Modellbildung Grundlagen 25 Inhaltsverzeichnis Einleitung 19 Zu diesem Buch 19 Konventionen in diesem Buch 20 Was Sie nicht lesen müssen 21 Falsche Voraussetzungen 21 Wie dieses Buch aufgebaut ist 21 Teil I: Datenanalyse und Grundlagen

Mehr

Eine Einführung in SPSS

Eine Einführung in SPSS Eine Einführung in SPSS Aufbau von SPSS 14 Bemerkung: SPSS 14 kann in den Subzentren in der Kopernikusgasse installiert werden, falls dies noch nicht geschehen ist. Dazu öffnet man den Application Explorer

Mehr

8. Methoden der klassischen multivariaten Statistik

8. Methoden der klassischen multivariaten Statistik 8. Methoden der klassischen multivariaten Statistik 8.1. Darstellung von Daten Voraussetzungen auch in diesem Kapitel: Grundgesamtheit (Datenraum) Ω von Objekten (Fällen, Instanzen), denen J-Tupel von

Mehr

Inhaltsverzeichnis. Regressionsanalyse. http://mesosworld.ch - Stand vom: 20.1.2010 1

Inhaltsverzeichnis. Regressionsanalyse. http://mesosworld.ch - Stand vom: 20.1.2010 1 Inhaltsverzeichnis Regressionsanalyse... 2 Lernhinweise... 2 Einführung... 2 Theorie (1-8)... 2 1. Allgemeine Beziehungen... 3 2. 'Best Fit'... 3 3. 'Ordinary Least Squares'... 4 4. Formel der Regressionskoeffizienten...

Mehr

Füllmenge. Füllmenge. Füllmenge. Füllmenge. Mean = 500,0029 Std. Dev. = 3,96016 N = 10.000. 485,00 490,00 495,00 500,00 505,00 510,00 515,00 Füllmenge

Füllmenge. Füllmenge. Füllmenge. Füllmenge. Mean = 500,0029 Std. Dev. = 3,96016 N = 10.000. 485,00 490,00 495,00 500,00 505,00 510,00 515,00 Füllmenge 2.4 Stetige Zufallsvariable Beispiel. Abfüllung von 500 Gramm Packungen einer bestimmten Ware auf einer automatischen Abfüllanlage. Die Zufallsvariable X beschreibe die Füllmenge einer zufällig ausgewählten

Mehr

Ein bisschen Statistik

Ein bisschen Statistik Prof. Dr. Beat Siebenhaar ein bisschen Statistik 1 Ein bisschen Statistik (orientiert an Hüsler/Zimmermann (006) mit Umsetzung auf die linguistische Fragen) 1. Datentypen und Grafik Grafische Darstellungen

Mehr

Datenanalyse mit Excel. Wintersemester 2013/14

Datenanalyse mit Excel. Wintersemester 2013/14 Datenanalyse mit Excel 1 KORRELATIONRECHNUNG 2 Korrelationsrechnung Ziel der Korrelationsrechnung besteht im bivariaten Fall darin, die Stärke des Zusammenhangs zwischen zwei interessierenden statistischen

Mehr

5 Varianzanalytische Modelle, komplexere lineare Modell und Random Models

5 Varianzanalytische Modelle, komplexere lineare Modell und Random Models 5 Varianzanalytische Modelle, komplexere lineare Modell und Random Models Auch in diesem Kapitel werden nur wenige statistische Hintergründe geliefert. Der Fokus des Kapitels liegt in der Einübung der

Mehr

Datenaufbereitung, Grafische Datenanalyse

Datenaufbereitung, Grafische Datenanalyse Datenaufbereitung, Grafische Datenanalyse R-Übung 2 Statistik III für Nebenfachstudierende LMU WS 2013/14 David Rügamer 6. & 13. November 2013 Nach einer Vorlage von Toni Hilger (WS 11/12) und Arne Kaldhusdal

Mehr

Multivariate Verfahren

Multivariate Verfahren Selbstkontrollarbeit 2 Multivariate Verfahren Musterlösung Aufgabe 1 (28 Punkte) Der Marketing-Leiter einer Lebensmittelherstellers möchte herausfinden, mit welchem Richtpreis eine neue Joghurt-Marke auf

Mehr