T-TEST BEI EINER STICHPROBE:

Größe: px
Ab Seite anzeigen:

Download "T-TEST BEI EINER STICHPROBE:"

Transkript

1 Kapitel 19 T-Test Mit Hilfe der T-TEST-Prozeduren werden Aussagen über Mittelwerte getroffen. Dabei wird versucht, aus den Beobachtungen einer Stichprobe Rückschlüsse auf die Grundgesamtheit zu ziehen. Bei SPSS stehen insgesamt drei Prozeduren zur Durchführung eines T-Tests zur Verfügung: ¾ T-TEST BEI EINER STICHPROBE: Mit dieser Prozedur können Sie anhand der Beobachtungen einer Stichprobe testen, mit welcher Wahrscheinlichkeit der Mittelwert einer beobachteten Variablen in der Grundgesamtheit einen vorgegebenen Wert über- oder unterschreitet. ¾ T-TEST BEI UNABHÄNGIGEN STICHPROBEN: Ein T-Test bei unabhängigen Stichproben testet nicht einen Mittelwert daraufhin, ob dieser einen bestimmten Wert erreicht, sondern er vergleicht zwei Mittelwerte miteinander und testet, ob diese in der Grundgesamtheit gleich groß sind. Diese Mittelwerte müssen aus zwei unabhängigen Stichproben stammen. Dabei mag es zunächst verwunderlich erscheinen, unter welchen Umständen zwei Stichproben als unabhängig bezeichnet werden. Ein typischer Anwendungsfall für einen T-Test bei unabhängigen Stichproben wurde im vorhergehenden Kapitel betrachtet: Soll untersucht werden, ob sich die durchschnittlichen Ausprägungen einer bestimmten Eigenschaft (wie das im vorhergehenden Kapitel betrachtete Magnitude-Prestige) bei Männern und Frauen signifikant voneinander unterscheiden, kann dies mit einem T-Test bei unabhängigen Stichproben untersucht werden. Es werden also die Mittelwerte derselben Variablen in zwei Fallgruppen miteinander verglichen. Die in der Stichprobe enthaltenen Frauen wurden unabhängig von den in der Stichprobe enthaltenen Männern aus der Grundgesamtheit gezogen, die Zusammensetzung der Männer in der Stichprobe hat also keinen Einfluß auf die Zusammensetzung der Frauen (und umgekehrt). Daher ist ein T-Test bei unabhängigen Stichproben das geeignete Instrument zum Vergleich der Mittelwerte. ¾ T-TEST BEI GEPAARTEN STICHPROBEN: Auch der T-Test für gepaarte Stichproben vergleicht zwei Mittelwerte miteinander, allerdings ist dieser Test darauf ausgerichtet, daß die Stichproben systematisch miteinander verbunden sind. Dies liegt zum Beispiel vor, wenn Sie bei der Auswertung von Umfrage-

2 456 Kapitel 19 T-Test ergebnissen die Mittelwerte zweier Variablen (für dieselben Personen) miteinander vergleichen. Die Antworten in den beiden Variablen (und damit die beiden zu vergleichenden Stichproben) sind nicht unabhängig voneinander, da sich beide Variablen auf dieselben Personen beziehen. Unterscheiden sich die in der Stichprobe enthaltenen Personen durch zufällige Einflüsse bei der Stichprobenziehung in bestimmten Eigenschaften von den Personen der Grundgesamtheit, wirkt sich dies auf beide Variablen und damit auf die beiden durch den T-Test miteinander verglichenen Stichproben aus Einführung Beispieldaten Im Rahmen der ALLBUS-Bevölkerungsbefragung wurde den Befragten unter anderem die in Abbildung 19.1 dargestellte Frage vorgelegt. 200 Man hört hier und da verschiedene Meinungen über Juden. Wir haben einmal einige davon hier zusammengestellt. Würden Sie mir bitte - wieder anhand der Liste - sagen, inwieweit Sie diesen Aussagen zustimmen oder nicht zustimmen? Mich beschämt, daß Deutsche so viele Verbrechen an Juden begangen haben. 1 (Stimme überhaupt nicht zu) (Stimme voll und ganz zu) Abbildung 19.1: Fragetext und Antwortkategorien für die Variable v138 Der Grad der Zustimmung der Befragten zu dieser Aussage ist in der Datendatei allbus.sav von der Begleit-CD in der Variablen v138 angegeben. In diesem Kapitel wird in Abschnitt 19.2 untersucht, ob die Befragten aus den neuen und den alten Bundesländern im Durchschnitt eine unterschiedliche Bewertung dieser Aussage vorgenommen haben. Dies kann vor dem Hintergrund, daß die Bevölkerung in den beiden Teilen Deutschlands eine unterschiedliche Aufarbeitung der Ereignisse während des Dritten Reiches erfahren hat, vermutet werden. Weiter unten in Abschnitt 19.4 werden dann noch einmal die Antworten aller Befragten gemeinsam untersucht. Dabei wird getestet, ob aus den Stichprobenergebnissen geschlossen werden kann, daß der durchschnittliche Grad der Zustimmung zu der Aussage aus Abbildung 19.1 in der Grundgesamtheit einen bestimmten Wert übersteigt. 200 Neben dieser Aussage sollten die Befragten noch drei weitere Aussagen über Juden nach dem Grad ihrer Zustimmung oder Ablehnung beurteilen. Daher bezieht sich der einleitende Satz der Frage auf einige Aussagen. In der Datendatei allbus.sav sind die Antworten für alle vier Aussagen enthalten. Sie finden diese in den Variablen v137 bis v140.

3 19.1 Einführung Anforderungen an die Stichprobe Die Grundgesamtheit, also die Menge aller Fälle, über die eine Aussage getroffen werden soll, ist in der Regel viel zu groß, um für jeden Fall der Grundgesamtheit empirische Daten zu erheben. Daher muß man zumeist mit einer Stichprobe vorliebnehmen und anhand dieser überprüfen, ob aufgrund der für die Stichprobe beobachteten Werte Hypothesen über die Grundgesamtheit eher angenommen oder eher abgelehnt werden sollten. Hierzu wird oft eine sogenannte Nullhypothese für die Grundgesamtheit getestet. Bei den folgenden T-Tests formuliert die Nullhypothese Aussagen über die Mittelwerte einzelner Variablen. Eine solche Aussage kann zum Beispiel sein, daß zwischen den Mittelwerten zweier Variablen in der Grundgesamtheit kein Unterschied besteht oder daß der Mittelwert einer Variablen in der Grundgesamtheit mindestens einen bestimmten Wert aufweist. Der T- Test prüft dabei, inwieweit aus einem beobachteten Unterschied zwischen zwei Mittelwerten bzw. aus der beobachteten Größe eines Mittelwertes Rückschlüsse auf entsprechende Unterschiede oder Größenordnungen in der Grundgesamtheit gezogen werden können. Um auf der Grundlage einer Stichprobenbetrachtung unverzerrte Aussagen über die Grundgesamtheit treffen zu können, muß die Stichprobe bestimmte Anforderungen erfüllen. So muß zunächst einmal sichergestellt sein, daß die Stichprobe tatsächlich eine Teilmenge der Grundgesamtheit ist. Jeder Fall der Stichprobe muß auch ein Fall der Grundgesamtheit sein. Eine zweite wesentliche Voraussetzung besteht darin, daß es sich bei der Stichprobe um eine Zufallsstichprobe handeln muß. Dies bedeutet, daß die konkreten Fälle der Stichprobe rein zufällig aus der Grundgesamtheit ausgewählt wurden. Jeder Fall der Grundgesamtheit muß eine gleich große Chance gehabt haben, in die Stichprobe aufgenommen zu werden. 201 Weder ist diese Prämisse immer sehr einfach zu erfüllen, noch ist stets ohne weiteres nachzuprüfen, inwieweit die Zusammensetzung der Stichprobe wirklich zufällig erfolgte. Werden die benötigten Informationen zum Beispiel gesammelt, indem man zufällig ausgewählten Personen der betreffenden Grundgesamtheit einen Fragebogen zukommen läßt, so wird man immer nur solche Personen erfassen können, die bereit sind, einen derartigen Fragebogen auszufüllen und zurückzusenden. Da durch diese Vorgehensweise ein durch ein spezifisches Merkmal gekennzeichneter Teil der Grundgesamtheit systematisch von der Stichprobe ausgeschlossen wird, kann eine solche Stichprobe möglicherweise verzerrte Ergebnisse liefern. Liegt eine verzerrte Stichprobe vor, so ist es nicht möglich, unverzerrte Rückschlüsse auf die Grundgesamtheit zu ziehen. 201 In der den folgenden Beispielen zugrundeliegenden Stichprobe ist diese Voraussetzung nicht erfüllt, da Personen aus den neuen Bundesländern bewußt in überproportional großem Umfang berücksichtigt wurden. Eine Person aus den neuen Bundesländern hatte daher eine größere Chance, in die Stichprobe aufgenommen zu werden, als eine Person aus den alten Bundesländern. Diese Verletzung der Voraussetzung einer Zufallsstichprobe kann in diesem Fall jedoch dadurch korrigiert werden, daß in der Datendatei die Fälle, die sich auf Personen aus den neuen Bundesländern beziehen, geringer gewichtet werden als die Fälle mit Personen aus den alten Bundesländern. Siehe auch unten, Abschnitt , Interpretation der Testergebnisse, S. 461.

4 458 Kapitel 19 T-Test Verteilung der Mittelwerte Es wird also unterstellt, daß die Fälle, die in einer konkreten Stichprobe enthalten sind, alle der Grundgesamtheit entstammen und zufällig aus dieser ausgewählt wurden. Da jeder Fall der Grundgesamtheit mit der gleichen Wahrscheinlichkeit in eine Zufallsstichprobe aufgenommen werden konnte, hätten sich anstelle einer konkreten Stichprobe auch eine Vielzahl anderer Stichproben aus der Grundgesamtheit ergeben können. Die Personen der Datei allbus.sav wurden aus den erwachsenen, in Deutschland lebenden Personen ausgewählt. Damit ist offensichtlich, daß sich aus der Gesamtheit der erwachsenen Personen in Deutschland sehr viele weitere Stichproben mit einem Umfang von Personen ziehen ließen, die zum Teil oder auch vollständig andere Personen beinhalteten. In diesen unterschiedlichen Stichproben könnten dann höchstwahrscheinlich auch mehr oder weniger unterschiedliche Ergebnisse beobachtet werden, obwohl sie sich alle auf dieselbe Grundgesamtheit beziehen. Dies gilt nicht nur für die einzelnen Werte der Fälle (Personen), sondern auch für aggregierte Werte, die sich auf die gesamte Stichprobe beziehen, wie zum Beispiel die Mittelwerte oder Varianzen einzelner Variablen. Für die vorliegende Stichprobe ist zu beobachten, daß die Befragten der Aussage Mich beschämt, daß Deutsche so viele Verbrechen an Juden begangen haben auf einer Skala von 1 (Stimme überhaupt nicht zu) bis 7 (Stimme voll und ganz zu) im Durchschnitt mit einem Skalenwert von 5,70 zustimmten. Wären nicht zufällig exakt die in der Stichprobe enthaltenen Personen, sondern andere Personen derselben Grundgesamtheit (Erwachsene, die in Deutschland leben) befragt worden, hätte die durchschnittliche Zustimmung auf der Skala von 1 bis 7 mit hoher Wahrscheinlichkeit nicht exakt 5,70 betragen, sondern möglicherweise 5,69 oder 5,75. Der Mittelwert, den eine Variable in einer Stichprobe aufweist, hängt also nicht nur von dem Mittelwert der Variablen in der Grundgesamtheit ab, sondern auch davon, welche Fälle (Personen) zufällig aus der Grundgesamtheit herausgegriffen wurden. In verschiedenen Stichproben können daher für dieselbe Variable unterschiedliche Mittelwerte beobachtet werden. Die Mittelwerte werden jedoch mehr oder weniger stark um den Mittelwert der Grundgesamtheit streuen, sie werden also nicht systematisch nach oben oder nach unten von dem wahren Mittelwert aus der Grundgesamtheit abweichen. Sind die Werte in der Grundgesamtheit normalverteilt, so gilt dies auch für die Mittelwerte der aus dieser Grundgesamtheit gezogenen Stichproben. (Der gleiche Zusammenhang gilt annäherungsweise auch für beliebige andere Verteilungsformen, wenn der Umfang der Stichprobe hinreichend groß ist.) Die Normalverteilung, der die Stichprobenmittelwerte folgen, hat den gleichen Mittelwert, den auch die Werte in der Grundgesamtheit aufweisen. Die Mittelwerte der Stichproben streuen somit um den Mittelwert der Grundgesamtheit und neigen dazu, in der Nähe dieses Mittelwertes zu liegen. Wie groß die Streuungen um den Mittelwert ausfallen, hängt dabei von dem Ausmaß der Streuung der Werte in der Grundgesamtheit und von dem Umfang der Stichprobe ab: ¾ Weist eine Variable in der Grundgesamtheit für alle Fälle den gleichen Wert auf, so daß die Streuung gleich null ist, dann werden auch alle Werte der Stichprobe und ebenso ihre arithmetischen Mittel diesen gleichen Wert haben.

5 19.1 Einführung 459 Wenn die Werte in der Grundgesamtheit dagegen sehr unterschiedlich sind und damit eine große Streuung haben, dann können sich auch Stichproben mit sehr unterschiedlichen Werten und stark streuenden arithmetischen Mitteln ergeben. ¾ Wird als Stichprobe nur jeweils ein Wert aus der Grundgesamtheit gezogen, dann können die Stichprobenmittelwerte jeden Wert annehmen, der in der Grundgesamtheit vertreten ist, also zum Beispiel auch den kleinsten oder den größten in der Grundgesamtheit vorkommenden Wert. Die Mittelwerte der Stichproben streuen somit genauso stark wie die einzelnen Werte der Grundgesamtheit. Je umfangreicher die Stichproben jedoch werden, desto weniger extreme Werte nehmen ihre Mittelwerte an. Wenn die Stichproben im Extremfall die gleiche Größe haben wie die Grundgesamtheit, mit dieser also übereinstimmen, dann werden auch die Mittelwerte der Stichproben alle identisch mit dem Wert der Grundgesamtheit sein und folglich keinerlei Streuung mehr aufweisen. Dieser Zusammenhang, daß die Streuung der Stichprobenmittelwerte um den wahren Mittelwert der Grundgesamtheit mit abnehmender Streuung der Einzelwerte in der Grundgesamtheit und mit steigendem Stichprobenumfang abnimmt, läßt sich folgendermaßen durch eine Formel darstellen: σ σ X = N Dabei bezeichnet σ X die Standardabweichung der Stichprobenmittelwerte einer Variablen, σ ist die Standardabweichung dieser Variablen in der Grundgesamtheit und N der Stichprobenumfang, also die Anzahl der Fälle in der Stichprobe. Auch mit dieser Formel ist jedoch die konkrete Berechnung der Standardabweichung der Stichprobenmittelwerte im allgemeinen nicht möglich, da hierzu die Standardabweichung der betrachteten Variablen in der Grundgesamtheit bekannt sein müßte, was jedoch im allgemeinen nicht der Fall ist. Daher nimmt man für praktische Tests die Standardabweichung, die die betreffende Variable in der vorliegenden Stichprobe aufweist, als Schätzwert für die Standardabweichung in der Grundgesamtheit. Dies kommt auch in der Formelschreibweise zum Ausdruck, da auch hier die Standardabweichung der Grundgesamtheit durch die empirische Standardabweichung der vorliegenden Stichprobe ersetzt wird: S S X = N Hierbei bezeichnet S die geschätzte Standardabweichung in der Grundgesamtheit, also die empirische Standardabweichung der Variablen, die in der vorliegenden Stichprobe beobachtet wurde. Mit dieser Formel wird nicht mehr die tatsächliche, sondern eine geschätzte Standardabweichung der Stichprobenmittelwerte errechnet. Dementsprechend steht S X für eben diese geschätzte Standardabweichung der Stichprobenmittelwerte.

6 460 Kapitel 19 T-Test Die Standardabweichung der Stichprobenmittelwerte wird auch als Standardfehler der Stichprobe bezeichnet. Je kleiner der Standardfehler ist, je geringer die Stichprobenmittelwerte bei der Ziehung zahlreicher Stichproben der gleichen Größe also um den Mittelwert der Grundgesamtheit streuen, desto besser wird im allgemeinen der wirkliche Mittelwert der Grundgesamtheit durch die Stichprobe geschätzt. Wegen dieses Hinweises auf die Schätzgüte eines Parameters wird der Standardfehler bei zahlreichen Testverfahren mit angegeben T-Test bei unabhängigen Stichproben Der t-wert als Prüfmaß Um anhand von Stichprobenbeobachtungen Rückschlüsse über Mittelwerte auf die Grundgesamtheit ziehen zu können, wird oftmals der Wert t als Prüfmaß herangezogen. Dieser Wert folgt einer bekannten Verteilung, der t-verteilung, so daß durch Vergleich eines für eine konkrete Stichprobe berechneten t-wertes mit den Werten, die nach der t-verteilung zu erwarten gewesen wären, Rückschlüsse von der Stichprobe auf die Grundgesamtheit möglich sind. Sollen die Mittelwerte zweier unabhängiger Stichproben miteinander verglichen werden (zum Begriff von unabhängigen Stichproben, siehe oben, S. 455) ist der t- Wert folgendermaßen zu berechnen: t = X 1 X 2 2 S1 N1 + 2 S2 N2 X 1 und X 2 sind die Stichprobenmittelwerte der beiden miteinander zu vergleichenden Gruppen, S 1 2 und S 2 2 bezeichnen die empirischen Varianzen, und N 1 und N 2 geben die Anzahl der Fälle in den beiden Gruppen an. Der t-wert hängt damit ab von den empirischen Mittelwerten und Varianzen sowie von dem Umfang der Stichprobe. Sind die beiden zu vergleichenden Gruppenmittelwerte in der Stichprobe gleich groß, hat t den Wert null. Oben wurde deutlich, daß sowohl die Mittelwerte als auch die Varianzen in einer Stichprobe bestenfalls zufällig mit den entsprechenden Werten der Grundgesamtheit übereinstimmen und bei der Ziehung mehrerer Stichproben um die wahren Werte streuen werden. Dies überträgt sich entsprechend auf die t-werte, die von den empirischen Mittelwerten und Varianzen abhängen. Auch für das Prüfmaß t werden sich also bei verschiedenen Stichproben unterschiedliche Werte ergeben. Sind die beiden zu vergleichenden Mittelwerte in der Grundgesamtheit identisch, wird dies aufgrund der zufälligen Einflüsse bei der Stichprobenziehung in der Stichprobe möglicherweise nicht der Fall sein. Dementsprechend wird auch t unter Umständen nicht den Wert null annehmen, obwohl die Mittelwerte in der Grundgesamtheit gleich groß sind. Da aber für den Wert t dessen Verteilung bekannt ist, läßt sich bei gegebenem Stichprobenumfang bestimmen, mit welcher Wahrscheinlich-

7 19.2 T-Test bei unabhängigen Stichproben 461 keit t um ein bestimmtes Ausmaß von dem Wert abweicht, den t angenommen hätte, wenn die in der Stichprobe beobachteten Maßzahlen mit den entsprechenden Werten der Grundgesamtheit übereinstimmen würden. Für den Vergleich der beiden Mittelwerte ist somit zum Beispiel bekannt, mit welcher Wahrscheinlichkeit t einen Wert größer als 0,5 annimmt, wenn die beiden Mittelwerte in der Grundgesamtheit tatsächlich identisch sind, so daß t unter Idealbedingungen den Wert null haben müßte. Errechnet sich für t in einer Stichprobe nun ein Wert, der sich unter der Annahme, daß die Mittelwerte in der Grundgesamtheit gleich groß sind, nur mit sehr geringer Wahrscheinlichkeit ergibt, wird daraus geschlossen, daß die Hypothese, die Mittelwerte seien in der Grundgesamtheit identisch, möglicherweise verworfen werden muß. Nimmt t dagegen einen Wert in der Nähe von null an, deutet dies darauf hin, daß die Annahme gleicher Mittelwerte beibehalten werden kann und sich mögliche in der Stichprobe beobachtete Unterschiede nur zufällig ergeben haben Interpretation der Testergebnisse Im folgenden soll getestet werden, ob die Befragten aus den neuen und den alten Bundesländern im Durchschnitt einen unterschiedlichen Grad der Zustimmung zu der Aussage Mich beschämt, daß Deutsche so viele Verbrechen an Juden begangen haben aufweisen. Hierzu dient der Output aus Abbildung 19.2, den Sie mit folgenden Einstellungen erhalten: ¾ Daten gewichten: Der Test basiert auf der mit der Variablen v434 gewichteten Datendatei allbus.sav. Um die Gewichtung der Datei mit dieser Variablen einzuschalten, verwenden Sie den Befehl DATEN, FÄLLE GEWICHTEN. Wählen Sie in dem damit geöffneten Dialogfeld die Option Fälle gewichten mit, und verschieben Sie die Variable v434 in das Feld Häufigkeitsvariable. ¾ Befehl: Um den T-Test aufzurufen, wählen Sie den Befehl STATISTIK MITTELWERTE VERGLEICHEN T-TEST BEI UNABHÄNGIGEN STICHPROBEN... ¾ Testvariable: Verschieben Sie in dem Dialogfeld T-Test bei unabhängigen Stichproben die Variable v138 in das Feld Testvariable(n). ¾ Gruppierungsvariable: Fügen Sie die Variable v3 in das Feld Gruppenvariable ein, und klicken Sie anschließend auf die Schaltfläche Gruppen definieren. (Diese Schaltfläche ist nur aktiv, wenn v3 in dem Feld Gruppenvariable markiert ist.) In dem damit geöffneten Dialogfeld muß die Option Angegebene Werte verwenden beibehalten werden. Geben Sie in die beiden Eingabefelder Gruppe 1 und Gruppe 2 die Werte 1 und 2 ein. Anschließend können Sie dieses und das Hauptdialogfeld mit der Schaltfläche OK schließen.

8 462 Kapitel 19 T-Test Gruppenstatistiken V138 V3 ALTE BUNDESLAENDER NEUE BUNDESLAENDER Standardfehler des N Mittelwert Standardabweichung Mittelwertes 818 5,60 1,88 6,57E ,08 1,55,11 Test bei unabhängigen Stichproben Levene-Test der Varianzgleichheit T-Test für die Mittelwertgleichheit V138 Varianzen sind gleich Varianzen sind nicht gleich 95% Standardfehler Konfidenzintervall Sig. Mittlere der der Differenz F Signifikanz T df (2-seitig) Differenz Differenz Untere Obere 20,479,000-3, ,001 -,49,14 -,76 -,21-3, ,903,000 -,49,13 -,73 -,24 Abbildung 19.2: Ergebnis des T-Tests für unabhängige Stichproben für die Testvariable v138 und die Gruppierungsvariable v3 Mittelwerte der beiden Gruppen Die obere Tabelle enthält getrennte Angaben für die beiden miteinander verglichenen Gruppen. In der Spalte Mittelwert ist abzulesen, daß die Befragten aus den alten Bundesländern in bezug auf die Aussage Mich beschämt, daß Deutsche so viele Verbrechen an Juden begangen haben auf einer Skala von 1 (Stimme überhaupt nicht zu) bis 7 (Stimme voll und ganz zu) im Durchschnitt den Wert 5,60 gewählt haben. Für die Befragten aus den neuen Bundesländern ist der Grad der durchschnittlichen Zustimmung mit 6,08 etwas höher. Diese Ergebnisse stützen sich auf insgesamt 818 Befragte aus den alten und 210 Befragte aus den neuen Bundesländern (Spalte N). 202 Zusätzlich werden in der Tabelle die Standardabweichungen und die Standardfehler der Mittelwerte für die beiden Gruppen ausgewiesen. Die Angaben dieser Tabelle genügen, um im folgenden die Teststatistik zu berechnen. 202 Bei der mit 818 bzw. 210 angegebenen Anzahl der Fälle wurde die Gewichtung der Daten bereits berücksichtigt. Es wurden also tatsächlich nicht exakt 818 und 210 Personen befragt, sondern die Zahl der (nicht gewichteten) Befragten aus den neuen Bundesländern ist höher als 210 und die der Personen aus den alten Ländern kleiner als 818.

9 19.2 T-Test bei unabhängigen Stichproben 463 t-wert Anhand der Angaben aus der Tabelle Gruppenstatistiken ergibt sich gemäß der Formel von S. 460 folgender t-wert: t = X 1 X 2 2 S1 N1 + 2 S2 N2 = 5,60 6,08 2 1, , = -3,8234 Dieser Wert wird auch (mit geringen Unterschieden, weil wir mit gerundeten Werten gerechnet haben) von SPSS in der Tabelle Test bei unabhängigen Stichproben ausgewiesen. Er erscheint in der Spalte T und der Zeile Varianzen sind nicht gleich. 203 Neben dem t-wert werden in der Spalte df die Freiheitsgrade des Tests mit 382,903 mitgeteilt. Die Freiheitsgrade ergeben sich aus der Anzahl der Fälle in den beiden Gruppen und sind entscheidend für die dem Test zugrundeliegende Verteilung des t-wertes. Oben wurde gesagt, bei gegebener Stichprobengröße sei die Verteilung des t-wertes bekannt. Genauer muß man sagen, daß die Verteilung nicht von der Anzahl der Fälle insgesamt abhängt, sondern von der Anzahl der Fälle in den beiden miteinander verglichenen Gruppen. Aus dieser Fallzahl der beiden Gruppen lassen sich die Freiheitsgrade berechnen, die den einzigen Parameter der t-verteilung darstellen. Irrtumswahrscheinlichkeit Wären die beiden zu vergleichenden Mittelwerte gleich groß gewesen, hätte sich ein t-wert von null ergeben. Tatsächlich ist der t-wert mit -3,8 jedoch deutlich von null verschieden. Wenn in der Grundgesamtheit kein Unterschied zwischen den Mittelwerten für die neuen und die alten Bundesländer besteht, kann sich ein t-wert von -3,8 bei gegebenen Freiheitsgraden (also in einer Stichprobe, die in den beiden zu vergleichenden Gruppen so viele Fälle aufweist, wie es bei der vorliegenden Stichprobe der Fall ist) mit einer Wahrscheinlichkeit von 0,000 bzw. 0,0% ergeben. Dieser Wert wird in der Zeile Varianzen sind nicht gleich und der Spalte Sig. (2-seitig) ausgewiesen. Diese Angabe besagt nicht, daß die Wahrscheinlichkeit für einen t-wert von -3,8 gleich null ist, denn es handelt sich um einen auf drei Dezimalstellen gerundeten Wert. Der ausgewiesene Wert von 0,000 besagt somit nur, daß die Wahrscheinlichkeit kleiner als 0,0005 bzw. 0,05% ist. Im Ausgabenavigator kann man sich den Wert auch mit wesentlich größerer Genauigkeit angeben lassen. Er beträgt 0, also ungefähr 0,012%. Der T-Test wurde durchgeführt, um die Hypothese zu überprüfen, daß der durchschnittliche Grad der Zustimmung zu der Aussage Mich beschämt, daß Deutsche so viele Verbrechen an Juden begangen haben in den neuen und den alten Bundesländern gleich ist. Diese zu testende Hypothese, die in diesem Fall - etwas technischer formuliert - besagt, daß der Unterschied zwischen den beiden Mittel- 203 Die untere Zeile Varianzen sind nicht gleich stellt die Ergebnisse des Tests dar, wie er bisher beschrieben wurde. Die obere Zeile stellt ebenfalls Testergebnisse dar, die jedoch nach einer etwas anderen Berechnungsweise ermittelt wurden. Siehe hierzu auch weiter unten.

10 464 Kapitel 19 T-Test werten für die neuen und die alten Bundesländer in der Grundgesamtheit gleich null ist, wird auch als Nullhypothese bezeichnet. Wenn die Hypothese wahr ist, kann sich der für die Stichprobe berechnete t-wert von -3,8 nur mit einer sehr geringen Wahrscheinlichkeit von 0,012% ergeben. Diese geringe Wahrscheinlichkeit deutet darauf hin, daß die getestete Hypothese falsch ist. Es spricht daher vieles dafür, die Nullhypothese zurückzuweisen. Die Annahme gleicher Mittelwerte in der Grundgesamtheit wird somit aufgegeben, und es wird angenommen, daß auch in der Grundgesamtheit die beiden Mittelwerte voneinander verschieden sind. Beim Zurückweisen der Nullhypothese begeht man mit der Wahrscheinlichkeit von 0,012% einen Irrtum. Diese Wahrscheinlichkeit wird daher auch als Irrtumswahrscheinlichkeit bezeichnet. Das Testergebnis läßt zunächst noch keine Rückschlüsse auf das Ausmaß des Unterschieds zwischen den Mittelwerten in der Grundgesamtheit zu. Insbesondere wäre es unzulässig, einfach davon auszugehen, die Mittelwertdifferenz in der Grundgesamtheit sei ebensogroß wie der in der Stichprobe beobachtete Unterschied. Weiter unten wird jedoch das ebenfalls ausgewiesene Konfidenzintervall für den Mittelwertunterschied betrachtet, das einen Anhaltspunkt für das Ausmaß der Differenz in der Grundgesamtheit gibt. Entscheidung über die Hypothesen In diesem Beispiel ist die Wahrscheinlichkeit für das Eintreten des berechneten t- Wertes bei Gültigkeit der Nullhypothese mit 0,012% derart gering, daß man die Nullhypothese zurückweisen wird. Auch bei einer wesentlich größeren Irrtumswahrscheinlichkeit, etwa bei 0,5%, würde man die Nullhypothese im allgemeinen noch ablehnen. Entscheidet man sich aufgrund der Irrtumswahrscheinlichkeit dafür, die Nullhypothese nicht zurückzuweisen, so impliziert dies nicht, daß die Nullhypothese als wahr erachtet wird. Vielmehr ist lediglich das Risiko, bei der Ablehnung der Hypothese einen Fehler zu begehen, zu groß, um die damit eventuell verbundenen unerwünschten Folgeerscheinungen in Kauf zu nehmen. Als Faustregel wird oft genannt, die Nullhypothese sollte bis zu einer Irrtumswahrscheinlichkeit von 5% zurückgewiesen werden. In Fällen, bei denen mit dem fehlerhaften Zurückweisen der Nullhypothese besonders schwerwiegende negative Folgen verbunden sind, wird oftmals auch ein 1%-Signifikanzniveau gefordert. Diese Faustregel stellt jedoch nur eine grobe - wenn auch weithin anerkannte - Richtschnur dar und sollte nicht unkritisch übernommen werden. Entscheidend für den Grenzwert der Irrtumswahrscheinlichkeit, bei dessen Unterschreiten man zum Zurückweisen der Nullhypothese bereit ist, sind die möglichen Folgewirkungen, die mit einer fehlerhaften Ablehnung der getesteten Hypothese verbunden sein können. Je gewichtiger die mit dem fälschlichen Ablehnen einer wahren Nullhypothese verbundenen Risiken sind, desto höher werden die Anforderungen an die Irrtumswahrscheinlichkeit sein. Werden beispielsweise Medikamente auf das Auftreten von Nebenwirkungen getestet, kann man sich mit einem 5%- Signifikanzniveau und auch mit einer 1%igen Irrtumswahrscheinlichkeit oftmals nicht zufriedengeben. In einem Untersuchungsfeld, in dem zum einen die Datenbasis allgemein sehr beschränkt ist und zum anderen die mit einem fehlerhaften

11 19.2 T-Test bei unabhängigen Stichproben 465 Zurückweisen der Nullhypothese verbundenen Risiken als nicht so gravierend angesehen werden, kann dagegen möglicherweise auch schon eine Irrtumswahrscheinlichkeit von 10% genügen. Konfidenzintervall In dem Output des T-Tests wird auch der Standardfehler sowie das 95%- Konfidenzintervall für den Unterschied zwischen den beiden Mittelwerten ausgewiesen. Das Konfidenzintervall hat die untere Grenze -0,73 und die obere Grenze -0,24. Dies besagt, daß die Differenz zwischen den beiden Mittelwerten in der Grundgesamtheit mit einer Wahrscheinlichkeit von 95% zwischen 0,24 und 0,73 beträgt. Das negative Vorzeichen gibt lediglich an, daß die hier als erstes betrachtete Gruppe (Alte Bundesländer) einen höheren Mittelwert hat als die zweite Gruppe (Neue Bundesländer). Würde das Konfidenzintervall, also der Wertbereich, in dem die Mittelwertdifferenz mit der jeweiligen Wahrscheinlichkeit (hier 95%) liegt, auch den Wert null einschließen, könnte daraus unmittelbar geschlossen werden, daß der Mittelwertunterschied nicht signifikant von null verschieden ist. Per Voreinstellung wird das 95%-Konfidenzintervall ausgewiesen, diese Voreinstellung kann jedoch in dem Dialogfeld Optionen der Prozedur T TEST BEI UNABHÄNGIGEN STICHPROBEN geändert werden. 204 Sie können dort einen Wert zwischen 1% und 99% vorgeben. Da auf der Grundlage einer Stichprobe niemals sichere Rückschlüsse auf die Grundgesamtheit gezogen werden können, läßt sich kein 100%-Konfidenzintervall berechnen. Dieses würde stets den gesamten Bereich zwischen + und - einnehmen. Ebenso ist es nicht möglich, bestimmte Mittelwertdifferenzen für die Grundgesamtheit sicher auszuschließen, so daß auch ein 0%-Konfidenzintervall nicht berechnet werden kann Annahme gleicher Varianzen Zur Berechnung des t-wertes steht noch eine andere Vorgehensweise zur Verfügung. Diese kommt dann zur Anwendung, wenn unterstellt werden kann, daß die Varianz der betrachteten Variablen in den beiden Gruppen in der Grundgesamtheit gleich groß ist. Ist diese Annahme plausibel, wird bei der Berechnung des t- Wertes anstelle der beiden empirischen Gruppen-Varianzen eine Art Mittelwert dieser Varianzen verwendet. Da die in den beiden Gruppen beobachteten Variablen auf diese Weise gewissermaßen zu einer Varianz zusammengefaßt werden, wird der Test auch als pooled-variance T-Test bezeichnet (im Gegensatz zum vorhergehenden Testverfahren, das wegen der getrennten Varianzen als separatevariance T-Test bezeichnet wird). Die gepoolte Varianz errechnet sich als S P = ( ) 2 N 1 S ( N 1 ) N + N S Siehe hierzu auch unten, Abschnitt Optionen, S. 474.

12 466 Kapitel 19 T-Test Bei der Berechnung des t-wertes werden dann lediglich die beiden empirischen Gruppen-Varianzen durch die gepoolte Varianz S p 2 ersetzt: t = X 1 X 2 2 SP N1 + 2 SP N2. Die Ergebnisse des T-Tests auf der Basis gepoolter Varianzen werden von SPSS in der Zeile Varianzen sind gleich ausgewiesen. Für den Test auf die Übereinstimmung des durchschnittlichen Zustimmungsgrades zu der Aussage Mich beschämt, daß Deutsche so viele Verbrechen an Juden begangen haben ergibt sich bei der Annahme gleicher Varianzen mit -3,465 ein vom Betrag her etwas kleinerer t-wert als bei Abwesenheit dieser Annahme. Die Irrtumswahrscheinlichkeit ist mit 0,001 etwas höher, aber immer noch sehr gering. Allgemein gilt, daß sich bei großen Stichproben nur geringe Unterschiede zwischen den beiden Testverfahren ergeben. Der T-Test mit gepoolten Varianzen kann leicht zu Fehlern führen, wenn entgegen der dem Test zugrundeliegenden Annahme doch ein Unterschied zwischen den Varianzen in den beiden betrachteten Gruppen in der Grundgesamtheit besteht. Dieser Fehler wird um so größer, je stärker sich die Varianzen unterscheiden. Wird umgekehrt der separate-variance T-Test angewandt, obwohl in Wirklichkeit gleiche Varianzen vorliegen, so wird die Irrtumswahrscheinlichkeit etwas zu hoch ausgewiesen. Im Zweifelsfall wird daher vorsichtigerweise der separate-variance T-Test betrachtet. Levene-Test - Test auf Gleichheit der Varianzen Bei der Entscheidung darüber, nach welchem Testverfahren die Nullhypothese geprüft werden soll, kann der von SPSS automatisch mit ausgewiesene Levene- Test behilflich sein. Der Levene-Test der Varianzgleichheit prüft die Nullhypothese, daß die Varianzen in der Grundgesamtheit gleich sind. Er weist als statistisches Prüfmaß den F-Wert aus, der - wie schon der t-wert - einer bekannten Zufallsverteilung, der F-Verteilung, folgt. Anhand dieses F-Wertes kann geprüft werden, mit welcher Wahrscheinlichkeit in der Grundgesamtheit eine Differenz zwischen den Varianzen vorliegt. Neben dem F-Wert wird auch hier die Wahrscheinlichkeit ausgewiesen, mit der beim Zurückweisen der Nullhypothese ein Fehler begangen wird. Eine hohe Wahrscheinlichkeit deutet darauf hin, daß die Varianzen der Grundgesamtheit tatsächlich identisch sein könnten, so daß die Nullhypothese nicht abgelehnt werden sollte. Das würde dann wiederum dafür sprechen, den gepoolten T-Test anzuwenden. In unserem Beispiel wird die Wahrscheinlichkeit mit 0,000 angegeben. Bei einer so geringen Irrtumswahrscheinlichkeit ist die Nullhypothese zurückzuweisen. Man kann davon ausgehen, daß sich die Varianzen in der Grundgesamtheit unterscheiden, und sollte die Ergebnisse des Tests für Ungleiche Varianzen betrachten, wie dies oben geschehen ist.

13 19.3 T-Test bei gepaarten Stichproben T-Test bei gepaarten Stichproben Im vorhergehenden Abschnitt wurden zwei Mittelwerte verglichen, die sich aus derselben Variablen für zwei unterschiedliche Fallgruppen ergaben. Die Fallgruppen wurden anhand einer zweiten Variablen, der Gruppierungsvariablen v3 (Erhebungsgebiet: Ost - West), gebildet. Die Antworten der Befragten einer Gruppe waren vollkommen unabhängig von den Antworten der Befragten aus der anderen Gruppe. Der Test zum Vergleich dieser beiden Gruppen wurde daher auch als T- Test bei unabhängigen Stichproben bezeichnet. Im Gegensatz dazu untersucht der T-Test bei gepaarten Stichproben zwei Mittelwerte, die nicht als vollkommen unabhängig voneinander angesehen werden können. Es werden die Mittelwerte zweier unterschiedlicher Variablen verglichen, die sich auf dieselbe Gruppe von Fällen (Befragten) beziehen. Ein entsprechender Anwendungsfall liegt zum Beispiel vor, wenn man dieselben Befragten zwei unterschiedliche Sachverhalte bewerten läßt und anschließend die Bewertungen miteinander vergleichen möchte. Ein anderer Anwendungsfall ergibt sich, wenn die gleichen Merkmale vor und nach Eintreten eines bestimmten Ereignisses gemessen und miteinander verglichen werden sollen. Dies könnten zum Beispiel die Leistungen von Sportlern vor und nach Absolvieren eines bestimmten Trainings- oder Ernährungsprogramms sein. In bestimmten Fällen ist der T-Test bei gepaarten Stichproben auch geeignet, Bewertungen desselben Sachverhaltes durch unterschiedliche Personen miteinander zu vergleichen. Dies ist dann der Fall, wenn die Personen der beiden Gruppen jeweils paarweise bewußt so ausgewählt wurden, daß sie gut miteinander vergleichbar sind und somit nach bestimmten Kriterien ein Paar bilden. Die beiden Personen (zum Beispiel Zwillinge) werden dann mit unterschiedlichen Situationen konfrontiert und anschließend in bezug auf eine bestimmte Fragestellung untersucht. Der Vorteil einer solchen vergleichsweise aufwendigen Vorgehensweise gegenüber der Betrachtung zweier zufällig ausgewählter unabhängiger Personengruppen (die mit einem T-Test bei unabhängigen Stichproben ausgewertet werden können) besteht darin, daß zufällige Unterschiede zwischen den beiden Gruppen in bezug auf deren Zusammensetzung ausgeschlossen oder zumindest verringert werden. Die genannten Anwendungsfälle stellen nur Beispiele dar, und die Aufzählung der Beispiele könnte beliebig verlängert werden. Entscheidend ist, daß die einzelnen Beobachtungen der miteinander zu vergleichenden Gruppen nicht unabhängig voneinander zustande gekommen sind, sondern jeweils paarweise ein systematischer Zusammenhang zwischen den einzelnen Beobachtungen aus den beiden Gruppen besteht. Dies impliziert auch, daß die beiden Gruppen die gleiche Anzahl an Beobachtungen enthalten müssen. Zudem müssen sie bei SPSS in denselben Fällen der Datendatei enthalten sein.

14 468 Kapitel 19 T-Test t-wert Der t-wert für den T-Test bei gepaarten Stichproben errechnet sich nach der Formel t = D. S 2 P N D bezeichnet dabei den Mittelwert der Differenzen zwischen den beiden Werten der einzelnen Beobachtungspaare aus den beiden Variablen. Dieser ist gleich der Differenz aus den beiden Variablenmittelwerten. S D ist die Standardabweichung der einzelnen Differenzen und N die Anzahl der Fälle, auf denen die Untersuchung basiert. Beispiel Neben der oben betrachteten Aussage Mich beschämt, daß Deutsche so viele Verbrechen an Juden begangen haben wurden die Befragten unter anderem auch gebeten, den Grad ihrer Zustimmung zu den beiden folgenden Aussagen anzugeben. Juden haben auf der Welt zuviel Einfluß. und Viele Juden versuchen, aus der Vergangenheit des Dritten Reiches heute ihren Vorteil zu ziehen und die Deutschen dafür zahlen zu lassen. Dabei wurde die gleiche von 1 (Stimme überhaupt nicht zu) bis 7 (Stimme voll und ganz zu) reichende Skala verwendet. In der Datendatei allbus.sav sind die Antworten für die erste Aussage in der Variablen v137 und die für die zweite Aussage in der Variablen v139 enthalten. Im folgenden soll untersucht werden, ob die Befragten den beiden Aussagen im Durchschnitt in deutlich unterschiedlichem Maße zustimmen. Hierzu werden die folgenden Einstellungen vorgenommen: ¾ Daten gewichten: Der Test basiert auf der mit der Variablen v434 gewichteten Datendatei allbus.sav. Zum Gewichten der Daten siehe auch S ¾ Befehl: Um den T-Test für gepaarte Stichproben aufzurufen, wählen Sie den Befehl STATISTIK MITTELWERTE VERGLEICHEN T-TEST BEI GEPAARTEN STICHPROBEN... ¾ Variablen: Markieren Sie in der Variablenliste die beiden Variablen v137 und v139, indem Sie erst die eine und anschließend die andere Variable anklicken. Haben Sie versehentlich eine falsche Variable markiert, können Sie die Markierung durch erneutes Anklicken der Variablen wieder aufheben. Wenn Sie die Variablen v137 und v139 markiert haben, verschieben Sie sie mit der Pfeil- Schaltfläche in das Feld Gepaarte Variablen. Anschließend können Sie die Prozedur mit der Schaltfläche OK starten.

15 19.3 T-Test bei gepaarten Stichproben 469 Diese Einstellungen erzeugen den in Abbildung 19.3 wiedergegebenen Output. Statistik bei gepaarten Stichproben Paaren V137 V139 Standardfehler des Mittelwert N Standardabweichung Mittelwertes 3, ,98 6,17E-02 4, ,04 6,38E-02 Korrelationen bei gepaarten Stichproben Paaren V137 & V139 N Korrelation Signifikanz 1026,466,000 Test bei gepaarten Stichproben Gepaarte Differenzen Paaren V137 - V139 95% Standard Konfidenzinterval Standard fehler des l der Differenz Sig. Mittelwert abweichung Mittelwertes Untere Obere T df (2-seitig) -1,10 2,08 6,49E-02-1,23 -,97-16, ,000 Abbildung 19.3: Output des T-Tests bei gepaarten Stichproben für die beiden Variablen v137 und v139 Der t-wert wird mit -16,981 angegeben. Wenn in der Grundgesamtheit kein Unterschied in der durchschnittlichen Bewertung der beiden Aussagen besteht, kann sich ein (vom Betrag her) so großer t-wert bei gegebener Anzahl von Freiheitsgraden (1.025, Spalte df) mit einer Wahrscheinlichkeit von 0,000 (Sig. 2-seitig) ergeben. Die Nullhypothese, derzufolge die Befragten die beiden Aussagen im Durchschnitt gleich bewertet haben, kann somit zurückgewiesen werden. Es bestehen signifikante Unterschiede in der durchschnittlichen Zustimmung der Befragten zu den beiden Aussagen. Korrelationskoeffizient Zusätzlich zu den bereits aus dem Output des T-Tests bei unabhängigen Stichproben bekannten Angaben über die Mittelwerte und das Konfidenzintervall wird auch ein Korrelationskoeffizient und dessen Signifikanzniveau ausgewiesen. Der Korrelationskoeffizient ist ein Maß für die Stärke des linearen Zusammenhangs zwischen den beiden Variablen. Mit dem Koeffizienten wird daher gemessen, ob Befragte (Fälle), die in bezug auf die eine Aussage einen hohen Grad an Zustimmung angegeben haben, tendenziell auch der anderen Aussage in besonders hohem Maße zustimmen. Der Korrelationskoeffizient kann in diesem Zusammenhang einen Hinweis darauf geben, inwieweit die Benutzung gepaarter Daten zufällige Unterschiede aufgrund ungleicher Gruppen bei der Betrachtung unabhängiger Stichproben verringern kann. Je größer der Betrag des Korrelationskoeffi-

16 470 Kapitel 19 T-Test zienten, desto stärker ist der (lineare) Zusammenhang zwischen den beiden Gruppen, so daß auch das Paaren der Daten eine entsprechend große Auswirkung hat. Mit 0,466 zeigt der Korrelationskoeffizient hier einen mittelstarken Zusammenhang zwischen den Variablen an. Tendenziell gilt somit, daß Befragte mit hoher (geringer) Zustimmung zu der einen Aussage auch eine hohe (geringe) Zustimmung zur anderen Aussage angaben. Der Korrelationskoeffizient ist mit einer Irrtumswahrscheinlichkeit von 0,000 (Spalte Sig.) gegen null gesichert. Die Hypothese, es bestehe kein linearer Zusammenhang zwischen den beiden Variablen, kann daher mit einer Irrtumswahrscheinlichkeit von 0,0% zurückgewiesen werden T-Test für eine Stichprobe Die beiden bisher betrachteten T-Test-Verfahren dienten dem Vergleich zweier Mittelwerte und testeten, ob die Mittelwerte in der Grundgesamtheit voneinander verschieden sind. Der T-Test für eine Stichprobe betrachtet dagegen nur einen einzelnen Mittelwert und testet, ob aus den Stichprobenergebnissen geschlossen werden kann, daß der Mittelwert in der Grundgesamtheit von einem vorgegebenen Testwert signifikant verschieden ist, diesen also deutlich über- oder unterschreitet. In Abbildung 19.3 ist zu erkennen, daß der durchschnittliche Grad der Zustimmung aller Befragten zu der Aussage Viele Juden versuchen, aus der Vergangenheit des Dritten Reiches heute ihren Vorteil zu ziehen und die Deutschen dafür zahlen zu lassen (Variable v139) auf der Skala von 1 (Stimme überhaupt nicht zu) bis 7 (Stimme voll und ganz zu) 4,29 beträgt. Dieser Wert liegt ungefähr in der Mitte der Skala, stellt jedoch nur die Beobachtung in der vorliegenden Stichprobe dar. Im folgenden soll getestet werden, ob aus dieser Beobachtung geschlossen werden kann, daß die durchschnittliche Zustimmung zu der Aussage in der Grundgesamtheit von dem mittleren Skalenwert 4 abweicht. Dies geschieht mit den folgenden Einstellungen: ¾ Daten gewichten: Der Test basiert auf der mit der Variablen v434 gewichteten Datendatei allbus.sav. Zum Gewichten der Daten siehe auch S ¾ Befehl: Um den Ein-Stichproben T-Test durchzuführen, wählen Sie den Befehl STATISTIK MITTELWERTE VERGLEICHEN T-TEST BEI EINER STICHPROBE... ¾ Variable: Verschieben Sie die Testvariable v139 in das Feld Testvariable(n). ¾ Testwert: Geben Sie in das Feld Testwert den Wert 4 ein. Anschließend können Sie die Prozedur mit der Schaltfläche OK starten und damit den Output aus Abbildung 19.4 erstellen.

17 19.5 Einstellungen zum Durchführen eines T-Tests 471 Statistik bei einer Stichprobe V139 Standardfehler des N Mittelwert Standardabweichung Mittelwertes ,30 2,04 6,37E-02 Test bei einer Sichprobe V139 Testwert = 4 95% Konfidenzintervall Sig. Mittlere der Differenz T df (2-seitig) Differenz Untere Obere 4, ,000,30,17,42 Abbildung 19.4: Ergebnis des Ein-Stichproben T-Tests für die Variable v139 mit dem Testwert 4 Die obere Tabelle gibt noch einmal den in der Stichprobe beobachteten Mittelwert von 4,3 sowie dessen Standardabweichung und den Standardfehler an. Das eigentliche Testergebnis wird in der Tabelle Test bei einer Stichprobe dargestellt. Die Signifikanz beträgt 0,000, der Mittelwert ist damit hochsignifikant von 4 verschieden. Das Konfidenzintervall gibt an, daß der Mittelwert in der Grundgesamtheit mit einer Wahrscheinlichkeit von 95% den Testwert um einen Wert zwischen 0,17 und 0,42 überschreitet. 205 Mit einer 95%igen Wahrscheinlichkeit liegt der durchschnittliche Grad der Zustimmung aller Personen aus der Grundgesamtheit zu der Aussage Viele Juden versuchen, aus der Vergangenheit des Dritten Reiches heute ihren Vorteil zu ziehen und die Deutschen dafür zahlen zu lassen somit in dem Bereich zwischen 4,17 und 4,42 und übersteigt damit den mittleren Skalenwert von 4 geringfügig Einstellungen zum Durchführen eines T-Tests T-Test bei unabhängigen Stichproben Um einen T-Test für unabhängige Stichproben durchzuführen, wählen Sie den Befehl STATISTIK MITTELWERTE VERGLEICHEN T-TEST BEI UNABHÄNGIGEN STICHPROBEN... Dieser Befehl öffnet das Dialogfeld aus Abbildung Das dargestellte Dialogfeld zeigt die Einstellungen, die für das Beispiel aus Abschnitt 19.2, T-Test bei unabhängigen Stichproben, S. 460 verwendet wurden. 205 Wären die Grenzen des Konfidenzintervalls negativ, würde der Mittelwert in der Grundgesamtheit den Testwert entsprechend unterschreiten.

18 472 Kapitel 19 T-Test Abbildung 19.5: Dialogfeld des Befehls STATISTIK, MITTELWERTE VERGLEICHEN, T TEST BEI UNABHÄNGIGEN STICHPROBEN Testvariablen auswählen In der Variablenliste links in dem Dialogfeld werden alle numerischen Variablen sowie alle kurzen Textvariablen (Variablen des Typs String mit einer Länge von nicht mehr als acht Zeichen) aus der aktuellen Datendatei aufgeführt. Die Textvariablen können Sie ausschließlich als Gruppierungsvariablen verwenden, denn die Testvariablen müssen selbstverständlich numerisch sein. Dies ist jedoch lediglich eine formale Anforderung an die Testvariable. Darüber hinaus ist es erforderlich, daß die Testvariable Intervallskalenniveau besitzt, da es andernfalls nicht sinnvoll möglich ist, Mittelwerte zu berechnen. Wählen Sie die zu testende Variable aus, und verschieben Sie sie in das Feld Testvariable(n). Wenn Sie hier mehrere Variablen angeben, wird für jede der Variablen ein eigener T-Test durchgeführt. Alternativ könnten Sie also auch die Prozedur wiederholt mit jeweils einer der Testvariablen durchführen. Gegenüber dieser Alternative können sich allerdings Unterschiede in bezug auf den Ausschluß von Fällen mit fehlenden Werten ergeben, siehe unten im Abschnitt Optionen, S Gruppen definieren Fügen Sie die Gruppierungsvariable in des Feld Gruppenvariable ein. Daraufhin wird die Variable mit zwei von Klammern eingeschlossenen Fragezeichen dargestellt. Diese Fragezeichen zeigen an, daß nun noch die Gruppierungsmerkmale festgelegt werden müssen. Sie müssen also noch angeben, welche Werte der Gruppierungsvariablen die beiden miteinander zu vergleichenden Gruppen kennzeichnen. Öffnen Sie hierzu mit der Schaltfläche Gruppen def. das Dialogfeld aus Abbildung Beachten Sie, daß diese Schaltfläche nur aktiv ist, wenn bereits eine Gruppierungsvariable ausgewählt wurde und diese auch in dem Feld Gruppenvariable markiert ist. Das Dialogfeld Gruppen definieren hat für numerische Gruppierungsvariablen ein anderes Erscheinungsbild als für Textvariablen. Abbil-

19 19.5 Einstellungen zum Durchführen eines T-Tests 473 dung 19.6 zeigt das Dialogfeld für die in dem obigen Beispiel verwendete numerische Variable v3. Abbildung 19.6: Dialogfeld der Schaltfläche Gruppen def. für eine numerische Gruppierungsvariable Sie können die beiden Gruppen auf zwei unterschiedliche Arten definieren: ¾ Einzelne Gruppenwerte festlegen: Mit der Option Angegebene Werte verwenden legen Sie zwei Werte der Gruppierungsvariablen fest, durch die die beiden miteinander zu vergleichenden Gruppen definiert werden. Alle Fälle, die in der Gruppierungsvariablen den ersten Gruppenwert enthalten, werden zu einer Gruppe zusammengefaßt. Entsprechend beinhaltet die zweite Gruppe genau die Fälle, die in der Gruppierungsvariablen den zweiten Gruppenwert aufweisen. Fälle, die keinen der beiden Gruppenwerte in der Gruppierungsvariablen enthalten, werden aus der Prozedur ausgeschlossen. Sie können auch Gruppenwerte mit Dezimalstellen verwenden. ¾ Trennwert: Mit dieser Option legen Sie einen Trennwert fest, der die Fälle der Datendatei in zwei Gruppen unterteilt. Alle Fälle, die in der Gruppierungsvariablen einen Wert kleiner dem Trennwert enthalten, werden der ersten Gruppe zugeordnet, die Fälle mit einem Wert größer oder gleich dem Trennwert bilden die zweite Gruppe. Damit werden automatisch alle Fälle mit gültigen Werten in die Analyse einbezogen. Wenn Sie eine Textvariable zur Gruppierung der Fälle verwenden, dann öffnet die Schaltfläche Gruppen def. das Dialogfeld aus Abbildung Dieses Dialogfeld enthält nur zwei Eingabefelder. Geben Sie dort die beiden Textwerte der Gruppierungsvariablen an, die die beiden Gruppen in der Datendatei kennzeichnen. Dies entspricht der Verwendung einzelner Gruppenwerte bei numerischen Gruppierungsvariablen. Beachten Sie, daß die Schreibweise der beiden Textwerte exakt mit der Schreibweise aus der Datendatei übereinstimmen muß und dabei auch zwischen Groß- und Kleinbuchstaben zu unterscheiden ist.

20 474 Kapitel 19 T-Test Abbildung 19.7: Dialogfeld der Schaltfläche Gruppen def. für eine Textvariable als Gruppierungsvariable Möchten Sie die Gruppen so bilden, daß jede Gruppe mehrere unterschiedliche Textwerte in der Gruppierungsvariablen aufweisen kann, können Sie dies nur über einen Umweg realisieren. Hierzu müssen Sie zunächst eine Hilfsvariable erstellen, in der die einzelnen Werte, die dieselbe Gruppe kennzeichnen, zu einem einzigen Wert zusammengefaßt sind. Dies ist zum Beispiel mit dem Befehl TRANS- FORMIEREN, UMKODIEREN, IN ANDERE VARIABLEN möglich. Optionen Nachdem die Test- und die Gruppierungsvariable angegeben und die Gruppen definiert wurden, kann die Prozedur T-TEST gestartet werden. Zuvor können Sie jedoch auch noch weitere Einstellungen in dem Dialogfeld der Schaltfläche Optionen vornehmen. Sie können hier die Breite des Konfidenzintervalls vorgeben und die Behandlung von Fällen mit fehlenden Werten steuern. Abbildung 19.8 gibt das Dialogfeld Optionen wieder. Abbildung 19.8: Dialogfeld der Schaltfläche Optionen Konfidenzintervall: Per Voreinstellung wird das 95%-Konfidenzintervall für die Mittelwertdifferenz berechnet. Diese voreingestellte Breite des Konfidenzintervalls können Sie verändern, indem Sie den gewünschten neuen Prozentwert in das Eingabefeld schreiben. Dieser Wert muß zwischen 1% und 99% liegen und darf bis zu fünf Dezimalstellen (bei Prozentwerten im einstelligen Bereich bis zu sechs Dezimalstellen) aufweisen. Fehlende Werte: Sie können wählen, ob Fälle mit einzelnen Werten jeweils testweise oder für die gesamte Prozedur ausgeschlossen werden sollen. Wenn Sie nur eine Testvariable ausgewählt haben, besteht kein Unterschied zwischen den beiden folgenden Optionen:

Standardab er des. Testwert = 145.5 95% Konfidenzintervall. T df Sig. (2-seitig) Differenz Untere Obere -2.011 698.045-5.82-11.50 -.14.

Standardab er des. Testwert = 145.5 95% Konfidenzintervall. T df Sig. (2-seitig) Differenz Untere Obere -2.011 698.045-5.82-11.50 -.14. Aufgabe : einfacher T-Test Statistik bei einer Stichprobe Standardfehl Standardab er des Mittelwert weichung Mittelwertes 699 39.68 76.59 2.894 Test bei einer Sichprobe Testwert = 45.5 95% Konfidenzintervall

Mehr

5.2. Nichtparametrische Tests. 5.2.1. Zwei unabhängige Stichproben: U- Test nach MANN- WHITNEY

5.2. Nichtparametrische Tests. 5.2.1. Zwei unabhängige Stichproben: U- Test nach MANN- WHITNEY 5.2. Nichtparametrische Tests 5.2.1. Zwei unabhängige Stichproben: U- Test nach MANN- WHITNEY Voraussetzungen: - Die Verteilungen der beiden Grundgesamtheiten sollten eine ähnliche Form aufweisen. - Die

Mehr

Kapitel 33 Hoch-Tief-Diagramme

Kapitel 33 Hoch-Tief-Diagramme Kapitel 33 Hoch-Tief-Diagramme 33.1 Diagrammtypen In einem Hoch-Tief-Diagramm werden Wertepaare oder -tripel dargestellt. Einen typischen Anwendungsfall für Hoch-Tief-Diagramme bildet die Darstellung von

Mehr

Varianzanalyse ANOVA

Varianzanalyse ANOVA Varianzanalyse ANOVA Johannes Hain Lehrstuhl für Mathematik VIII Statistik 1/23 Einfaktorielle Varianzanalyse (ANOVA) Bisher war man lediglich in der Lage, mit dem t-test einen Mittelwertsvergleich für

Mehr

9. StatistischeTests. 9.1 Konzeption

9. StatistischeTests. 9.1 Konzeption 9. StatistischeTests 9.1 Konzeption Statistische Tests dienen zur Überprüfung von Hypothesen über einen Parameter der Grundgesamtheit (bei einem Ein-Stichproben-Test) oder über die Verteilung einer Zufallsvariablen

Mehr

9. Schätzen und Testen bei unbekannter Varianz

9. Schätzen und Testen bei unbekannter Varianz 9. Schätzen und Testen bei unbekannter Varianz Dr. Antje Kiesel Institut für Angewandte Mathematik WS 2011/2012 Schätzen und Testen bei unbekannter Varianz Wenn wir die Standardabweichung σ nicht kennen,

Mehr

6. METRISCHE UND KATEGORIALE MERKMALE

6. METRISCHE UND KATEGORIALE MERKMALE 6. METRISCHE UND KATEGORIALE MERKMALE wenn an einer Beobachtungseinheit eine (oder mehrere) metrische und eine (oder mehrere) kategoriale Variable(n) erhoben wurden Beispiel: Haushaltsarbeit von Teenagern

Mehr

Grundlagen quantitativer Sozialforschung Interferenzstatistische Datenanalyse in MS Excel

Grundlagen quantitativer Sozialforschung Interferenzstatistische Datenanalyse in MS Excel Grundlagen quantitativer Sozialforschung Interferenzstatistische Datenanalyse in MS Excel 16.11.01 MP1 - Grundlagen quantitativer Sozialforschung - (4) Datenanalyse 1 Gliederung Datenanalyse (inferenzstatistisch)

Mehr

12. Vergleich mehrerer Stichproben

12. Vergleich mehrerer Stichproben 12. Vergleich mehrerer Stichproben Dr. Antje Kiesel Institut für Angewandte Mathematik WS 2011/2012 Häufig wollen wir verschiedene Populationen, Verfahren, usw. miteinander vergleichen. Beipiel: Vergleich

Mehr

Willkommen zur Vorlesung Statistik

Willkommen zur Vorlesung Statistik Willkommen zur Vorlesung Statistik Thema dieser Vorlesung: Varianzanalyse Prof. Dr. Wolfgang Ludwig-Mayerhofer Universität Siegen Philosophische Fakultät, Seminar für Sozialwissenschaften Prof. Dr. Wolfgang

Mehr

Kapitel 7: Varianzanalyse mit Messwiederholung

Kapitel 7: Varianzanalyse mit Messwiederholung Kapitel 7: Varianzanalyse mit Messwiederholung Durchführung einer einfaktoriellen Varianzanalyse mit Messwiederholung 1 Durchführung einer zweifaktoriellen Varianzanalyse mit Messwiederholung auf einem

Mehr

Inhaltsverzeichnis. Regressionsanalyse. http://mesosworld.ch - Stand vom: 20.1.2010 1

Inhaltsverzeichnis. Regressionsanalyse. http://mesosworld.ch - Stand vom: 20.1.2010 1 Inhaltsverzeichnis Regressionsanalyse... 2 Lernhinweise... 2 Einführung... 2 Theorie (1-8)... 2 1. Allgemeine Beziehungen... 3 2. 'Best Fit'... 3 3. 'Ordinary Least Squares'... 4 4. Formel der Regressionskoeffizienten...

Mehr

Grundlagen der Inferenzstatistik: Was Ihnen nicht erspart bleibt!

Grundlagen der Inferenzstatistik: Was Ihnen nicht erspart bleibt! Grundlagen der Inferenzstatistik: Was Ihnen nicht erspart bleibt! 1 Einführung 2 Wahrscheinlichkeiten kurz gefasst 3 Zufallsvariablen und Verteilungen 4 Theoretische Verteilungen (Wahrscheinlichkeitsfunktion)

Mehr

Grundlagen von Versuchsmethodik und Datenanalyse

Grundlagen von Versuchsmethodik und Datenanalyse Grundlagen von Versuchsmethodik und Datenanalyse Der Anfang: Hypothesen über Ursache-Wirkungs-Zusammenhänge Ursache Wirkung Koffein verbessert Kurzzeitgedächtnis Gewaltfilme führen zu aggressivem Verhalten

Mehr

Weitere (wählbare) Kontraste in der SPSS Prozedur Allgemeines Lineares Modell

Weitere (wählbare) Kontraste in der SPSS Prozedur Allgemeines Lineares Modell Einfaktorielle Versuchspläne 27/40 Weitere (wählbare) Kontraste in der SPSS Prozedur Allgemeines Lineares Modell Abweichung Einfach Differenz Helmert Wiederholt Vergleich Jede Gruppe mit Gesamtmittelwert

Mehr

Bachelorabschlussseminar Dipl.-Kfm. Daniel Cracau

Bachelorabschlussseminar Dipl.-Kfm. Daniel Cracau 1 Einführung in die statistische Datenanalyse Bachelorabschlussseminar Dipl.-Kfm. Daniel Cracau 2 Gliederung 1.Grundlagen 2.Nicht-parametrische Tests a. Mann-Whitney-Wilcoxon-U Test b. Wilcoxon-Signed-Rank

Mehr

Diskriminanzanalyse Beispiel

Diskriminanzanalyse Beispiel Diskriminanzanalyse Ziel bei der Diskriminanzanalyse ist die Analyse von Gruppenunterschieden, d. h. der Untersuchung von zwei oder mehr Gruppen hinsichtlich einer Vielzahl von Variablen. Diese Methode

Mehr

Übungsaufgaben zu Kapitel 5. Aufgabe 101. Inhaltsverzeichnis:

Übungsaufgaben zu Kapitel 5. Aufgabe 101. Inhaltsverzeichnis: Inhaltsverzeichnis: Übungsaufgaben zu Kapitel 5... 1 Aufgabe 101... 1 Aufgabe 102... 2 Aufgabe 103... 2 Aufgabe 104... 2 Aufgabe 105... 3 Aufgabe 106... 3 Aufgabe 107... 3 Aufgabe 108... 4 Aufgabe 109...

Mehr

2. Korrelation, lineare Regression und multiple Regression

2. Korrelation, lineare Regression und multiple Regression multiple 2.2 Lineare 2.2 Lineare 1 / 130 2.2 Lineare 2 / 130 2.1 Beispiel: Arbeitsmotivation Untersuchung zur Motivation am Arbeitsplatz in einem Chemie-Konzern 25 Personen werden durch Arbeitsplatz zufällig

Mehr

Prüfen von Mittelwertsunterschieden: t-test

Prüfen von Mittelwertsunterschieden: t-test Prüfen von Mittelwertsunterschieden: t-test Sven Garbade Fakultät für Angewandte Psychologie SRH Hochschule Heidelberg sven.garbade@hochschule-heidelberg.de Statistik 1 S. Garbade (SRH Heidelberg) t-test

Mehr

Stichprobenauslegung. für stetige und binäre Datentypen

Stichprobenauslegung. für stetige und binäre Datentypen Stichprobenauslegung für stetige und binäre Datentypen Roadmap zu Stichproben Hypothese über das interessierende Merkmal aufstellen Stichprobe entnehmen Beobachtete Messwerte abbilden Schluss von der Beobachtung

Mehr

Auswertung mit dem Statistikprogramm SPSS: 30.11.05

Auswertung mit dem Statistikprogramm SPSS: 30.11.05 Auswertung mit dem Statistikprogramm SPSS: 30.11.05 Seite 1 Einführung SPSS Was ist eine Fragestellung? Beispiel Welche statistische Prozedur gehört zu welcher Hypothese? Statistische Berechnungen mit

Mehr

Das Dialogfeld für die Regressionsanalyse ("Lineare Regression") findet sich im Statistik- Menu unter "Regression"-"Linear":

Das Dialogfeld für die Regressionsanalyse (Lineare Regression) findet sich im Statistik- Menu unter Regression-Linear: Lineare Regression Das Dialogfeld für die Regressionsanalyse ("Lineare Regression") findet sich im Statistik- Menu unter "Regression"-"Linear": Im einfachsten Fall werden mehrere Prädiktoren (oder nur

Mehr

Einfache Statistiken in Excel

Einfache Statistiken in Excel Einfache Statistiken in Excel Dipl.-Volkswirtin Anna Miller Bergische Universität Wuppertal Schumpeter School of Business and Economics Lehrstuhl für Internationale Wirtschaft und Regionalökonomik Raum

Mehr

Datenanalyse mit SPSS spezifische Analysen

Datenanalyse mit SPSS spezifische Analysen Datenanalyse mit SPSS spezifische Analysen Arnd Florack Tel.: 0251 / 83-34788 E-Mail: florack@psy.uni-muenster.de Raum 2.015 Sprechstunde: Dienstags 15-16 Uhr 25. Mai 2001 2 Auswertung von Häufigkeitsdaten

Mehr

Excel Pivot-Tabellen 2010 effektiv

Excel Pivot-Tabellen 2010 effektiv 7.2 Berechnete Felder Falls in der Datenquelle die Zahlen nicht in der Form vorliegen wie Sie diese benötigen, können Sie die gewünschten Ergebnisse mit Formeln berechnen. Dazu erzeugen Sie ein berechnetes

Mehr

Welch-Test. Welch-Test

Welch-Test. Welch-Test Welch-Test Welch-Test Test auf Lageunterschied zweier normalverteilter Grundgesamtheiten mit unbekannten Varianzen durch Vergleich der Mittelwerte zweier unabhängiger Zufallsstichproben. Beispiel Im Labor

Mehr

Multinomiale logistische Regression

Multinomiale logistische Regression Multinomiale logistische Regression Die multinomiale logistische Regression dient zur Schätzung von Gruppenzugehörigkeiten bzw. einer entsprechenden Wahrscheinlichkeit hierfür, wobei als abhänginge Variable

Mehr

Anhang A: Fragebögen und sonstige Unterlagen

Anhang A: Fragebögen und sonstige Unterlagen Anhang Anhang A: Fragebögen und sonstige Unterlagen A.: Flyer zur Probandenrekrutierung 46 A.: Fragebogen zur Meditationserfahrung 47 48 A.3: Fragebogen Angaben zur Person 49 5 5 A.4: Termin- und Einladungsschreiben

Mehr

Univariate/ multivariate Ansätze. Klaus D. Kubinger. Test- und Beratungsstelle. Effektgrößen

Univariate/ multivariate Ansätze. Klaus D. Kubinger. Test- und Beratungsstelle. Effektgrößen Univariate/ multivariate Ansätze Klaus D. Kubinger Effektgrößen Rasch, D. & Kubinger, K.D. (2006). Statistik für das Psychologiestudium Mit Softwareunter-stützung zur Planung und Auswertung von Untersuchungen

Mehr

Klausur Sommersemester 2010

Klausur Sommersemester 2010 Klausur Sommersemester 2010 Lehrstuhl: Wirtschaftspolitik Prüfungsfach: Empirische Wirtschaftsforschung Prüfer: Prof. Dr. K. Kraft Datum: 04.08.2010 Hilfsmittel: Nicht-programmierbarer Taschenrechner Klausurdauer:

Mehr

Webergänzung zu Kapitel 10

Webergänzung zu Kapitel 10 Webergänzung zu Kapitel 10 10.1.4 Varianzanalyse (ANOVA: analysis of variance) Im Kapitel 10 haben wir uns hauptsächlich mit Forschungsbeispielen beschäftigt, die nur zwei Ergebnissätze hatten (entweder

Mehr

Kommentierter SPSS-Ausdruck zur logistischen Regression

Kommentierter SPSS-Ausdruck zur logistischen Regression Daten: POK V AG 3 (POKV_AG3_V07.SAV) Kommentierter SPSS-Ausdruck zur logistischen Regression Fragestellung: Welchen Einfluss hat die Fachnähe und das Geschlecht auf die interpersonale Attraktion einer

Mehr

werden können. Wenn der Benutzer zudem eine konkrete Differenz mit praktischen Konsequenzen angibt, berechnet der Assistent den Stichprobenumfang,

werden können. Wenn der Benutzer zudem eine konkrete Differenz mit praktischen Konsequenzen angibt, berechnet der Assistent den Stichprobenumfang, Dieses White Paper ist Teil einer Reihe von Veröffentlichungen, welche die Forschungsarbeiten der Minitab-Statistiker erläutern, in deren Rahmen die im Assistenten der Minitab 17 Statistical Software verwendeten

Mehr

Kapitel 3. Zufallsvariable. Wahrscheinlichkeitsfunktion, Dichte und Verteilungsfunktion. Erwartungswert, Varianz und Standardabweichung

Kapitel 3. Zufallsvariable. Wahrscheinlichkeitsfunktion, Dichte und Verteilungsfunktion. Erwartungswert, Varianz und Standardabweichung Kapitel 3 Zufallsvariable Josef Leydold c 2006 Mathematische Methoden III Zufallsvariable 1 / 43 Lernziele Diskrete und stetige Zufallsvariable Wahrscheinlichkeitsfunktion, Dichte und Verteilungsfunktion

Mehr

Einführung in SPSS. 1. Die Datei Seegräser

Einführung in SPSS. 1. Die Datei Seegräser Einführung in SPSS 1. Die Datei Seegräser An 25 verschiedenen Probestellen wurde jeweils die Anzahl der Seegräser pro m 2 gezählt und das Vorhandensein von Seeigeln vermerkt. 2. Programmaufbau Die wichtigsten

Mehr

14.01.14 DAS THEMA: INFERENZSTATISTIK II. Standardfehler Konfidenzintervalle Signifikanztests. Standardfehler

14.01.14 DAS THEMA: INFERENZSTATISTIK II. Standardfehler Konfidenzintervalle Signifikanztests. Standardfehler DAS THEMA: INFERENZSTATISTIK II INFERENZSTATISTISCHE AUSSAGEN Standardfehler Konfidenzintervalle Signifikanztests Standardfehler der Standardfehler Interpretation Verwendung 1 ZUR WIEDERHOLUNG... Ausgangspunkt:

Mehr

Tabelle 6a: Deskriptive Statistiken der metrischen Variablen

Tabelle 6a: Deskriptive Statistiken der metrischen Variablen Ergebnisse 77 5 Ergebnisse Das folgende Kapitel widmet sich der statistischen Auswertung der Daten zur Ü- berprüfung der Hypothesen. Die hier verwendeten Daten wurden mit den in 4.3 beschriebenen Instrumenten

Mehr

Eine Einführung in SPSS

Eine Einführung in SPSS Eine Einführung in SPSS Aufbau von SPSS 14 Bemerkung: SPSS 14 kann in den Subzentren in der Kopernikusgasse installiert werden, falls dies noch nicht geschehen ist. Dazu öffnet man den Application Explorer

Mehr

Multiple Regression. Ziel: Vorhersage der Werte einer Variable (Kriterium) bei Kenntnis der Werte von zwei oder mehr anderen Variablen (Prädiktoren)

Multiple Regression. Ziel: Vorhersage der Werte einer Variable (Kriterium) bei Kenntnis der Werte von zwei oder mehr anderen Variablen (Prädiktoren) Multiple Regression 1 Was ist multiple lineare Regression? Ziel: Vorhersage der Werte einer Variable (Kriterium) bei Kenntnis der Werte von zwei oder mehr anderen Variablen (Prädiktoren) Annahme: Der Zusammenhang

Mehr

Allgemeines Lineares Modell: Univariate Varianzanalyse und Kovarianzanalyse

Allgemeines Lineares Modell: Univariate Varianzanalyse und Kovarianzanalyse Allgemeines Lineares Modell: Univariate Varianzanalyse und Kovarianzanalyse Univariate Varianz- und Kovarianzanlyse, Multivariate Varianzanalyse und Varianzanalyse mit Messwiederholung finden sich unter

Mehr

Konfidenzintervalle so einfach wie möglich erklärt

Konfidenzintervalle so einfach wie möglich erklärt Konfidenzintervalle so einfach wie möglich erklärt Wolfgang Ludwig-Mayerhofer, Universität Siegen, Philosophische Fakultät, Seminar für Sozialwissenschaften Vorbemerkung: Es handelt sich um die Anfang

Mehr

Tutorial: Homogenitätstest

Tutorial: Homogenitätstest Tutorial: Homogenitätstest Eine Bank möchte die Kreditwürdigkeit potenzieller Kreditnehmer abschätzen. Einerseits lebt die Bank ja von der Vergabe von Krediten, andererseits verursachen Problemkredite

Mehr

Profil A 49,3 48,2 50,7 50,9 49,8 48,7 49,6 50,1 Profil B 51,8 49,6 53,2 51,1 51,1 53,4 50,7 50 51,5 51,7 48,8

Profil A 49,3 48,2 50,7 50,9 49,8 48,7 49,6 50,1 Profil B 51,8 49,6 53,2 51,1 51,1 53,4 50,7 50 51,5 51,7 48,8 1. Aufgabe: Eine Reifenfirma hat für Winterreifen unterschiedliche Profile entwickelt. Bei jeweils gleicher Geschwindigkeit und auch sonst gleichen Bedingungen wurden die Bremswirkungen gemessen. Die gemessenen

Mehr

Abhängigkeit zweier Merkmale

Abhängigkeit zweier Merkmale Abhängigkeit zweier Merkmale Johannes Hain Lehrstuhl für Mathematik VIII Statistik 1/33 Allgemeine Situation Neben der Untersuchung auf Unterschiede zwischen zwei oder mehreren Untersuchungsgruppen hinsichtlich

Mehr

Messsystemanalyse (MSA)

Messsystemanalyse (MSA) Messsystemanalyse (MSA) Inhaltsverzeichnis Ursachen & Auswirkungen von Messabweichungen Qualifikations- und Fähigkeitsnachweise Vorteile einer Fähigkeitsuntersuchung Anforderungen an das Messsystem Genauigkeit

Mehr

Einseitig gerichtete Relation: Mit zunehmender Höhe über dem Meeresspiegel sinkt im allgemeinen die Lufttemperatur.

Einseitig gerichtete Relation: Mit zunehmender Höhe über dem Meeresspiegel sinkt im allgemeinen die Lufttemperatur. Statistik Grundlagen Charakterisierung von Verteilungen Einführung Wahrscheinlichkeitsrechnung Wahrscheinlichkeitsverteilungen Schätzen und Testen Korrelation Regression Einführung Die Analyse und modellhafte

Mehr

Stochastik Abitur 2009 Stochastik

Stochastik Abitur 2009 Stochastik Abitur 2009 Stochastik Beilage ea (erhöhtes Anforderungsniveau) ga (grundlegendes Anforderungsniveau) ISBN 978-3-8120-0108-3 und ISBN 978-3-8120-0223-3 1 Aufgabe 2 (ea) Rauchen ist das größte vermeidbare

Mehr

Kapitel 23 Lineare Regression

Kapitel 23 Lineare Regression Kapitel 23 Lineare Regression Sowohl einfache als auch multiple Regressionsanalysen können Sie mit dem Befehl STATISTIK REGRESSION LINEAR... durchführen. Dabei lassen sich mit Hilfe diverser Optionen zahlreiche

Mehr

Multiple Regression II: Signifikanztests, Gewichtung, Multikollinearität und Kohortenanalyse

Multiple Regression II: Signifikanztests, Gewichtung, Multikollinearität und Kohortenanalyse Multiple Regression II: Signifikanztests,, Multikollinearität und Kohortenanalyse Statistik II Übersicht Literatur Kausalität und Regression Inferenz und standardisierte Koeffizienten Statistik II Multiple

Mehr

8. Methoden der klassischen multivariaten Statistik

8. Methoden der klassischen multivariaten Statistik 8. Methoden der klassischen multivariaten Statistik 8.1. Darstellung von Daten Voraussetzungen auch in diesem Kapitel: Grundgesamtheit (Datenraum) Ω von Objekten (Fällen, Instanzen), denen J-Tupel von

Mehr

Varianzanalyse * (1) Varianzanalyse (2)

Varianzanalyse * (1) Varianzanalyse (2) Varianzanalyse * (1) Einfaktorielle Varianzanalyse (I) Die Varianzanalyse (ANOVA = ANalysis Of VAriance) wird benutzt, um Unterschiede zwischen Mittelwerten von drei oder mehr Stichproben auf Signifikanz

Mehr

Modul G.1 WS 07/08: Statistik 17.01.2008 1. Die Korrelation ist ein standardisiertes Maß für den linearen Zusammenhangzwischen zwei Variablen.

Modul G.1 WS 07/08: Statistik 17.01.2008 1. Die Korrelation ist ein standardisiertes Maß für den linearen Zusammenhangzwischen zwei Variablen. Modul G.1 WS 07/08: Statistik 17.01.2008 1 Wiederholung Kovarianz und Korrelation Kovarianz = Maß für den linearen Zusammenhang zwischen zwei Variablen x und y Korrelation Die Korrelation ist ein standardisiertes

Mehr

Kontingenzkoeffizient (nach Pearson)

Kontingenzkoeffizient (nach Pearson) Assoziationsmaß für zwei nominale Merkmale misst die Unabhängigkeit zweier Merkmale gibt keine Richtung eines Zusammenhanges an 46 o jl beobachtete Häufigkeiten der Kombination von Merkmalsausprägungen

Mehr

Kurzbeschreibung. Eingaben zur Berechnung. Das Optionspreismodell. Mit dem Eurex-OptionMaster können Sie

Kurzbeschreibung. Eingaben zur Berechnung. Das Optionspreismodell. Mit dem Eurex-OptionMaster können Sie Kurzbeschreibung Mit dem Eurex-OptionMaster können Sie - theoretische Optionspreise - Optionskennzahlen ( Griechen ) und - implizite Volatilitäten von Optionen berechnen und die errechneten Preise bei

Mehr

HTS-Berichte des ZTD - 01/2002 Vergleichsuntersuchung WILDE-Intelligenz-Test - Daten BFW Leipzig Bearbeiterin: A. Bettinville

HTS-Berichte des ZTD - 01/2002 Vergleichsuntersuchung WILDE-Intelligenz-Test - Daten BFW Leipzig Bearbeiterin: A. Bettinville UNIVERSITÉ DE FRIBOURG SUISSE UNIVERSITÄT FREIBURG SCHWEIZ ZENTRUM FÜR TESTENTWICKLUNG UND DIAGNOSTIK AM DEPARTEMENT FÜR PSYCHOLOGIE CENTRE POUR LE DEVELOPPEMENT DE TESTS ET LE DIAGNOSTIC AU DEPARTEMENT

Mehr

STATISTIK 1 - BEGLEITVERANSTALTUNG

STATISTIK 1 - BEGLEITVERANSTALTUNG STATISTIK 1 - BEGLEITVERANSTALTUNG VORLESUNG 4 ALPHA / BETA-FEHLER 12.12.2014 1 12.12.2014 1 Mona Ulrich, Psychologie (M.Sc.) AGENDA 01 STATISTISCHE HYPOTHESEN 02 POPULATION / STICHPROBE 03 ALPHA/ BETA-FEHLER

Mehr

Box-and-Whisker Plot -0,2 0,8 1,8 2,8 3,8 4,8

Box-and-Whisker Plot -0,2 0,8 1,8 2,8 3,8 4,8 . Aufgabe: Für zwei verschiedene Aktien wurde der relative Kurszuwachs (in % beobachtet. Aus den jeweils 20 Quartaldaten ergaben sich die folgenden Box-Plots. Box-and-Whisker Plot Aktie Aktie 2-0,2 0,8,8

Mehr

25. Januar 2010. Ruhr-Universität Bochum. Methodenlehre III, WS 2009/2010. Prof. Dr. Holger Dette. 4. Multivariate Mittelwertvergleiche

25. Januar 2010. Ruhr-Universität Bochum. Methodenlehre III, WS 2009/2010. Prof. Dr. Holger Dette. 4. Multivariate Mittelwertvergleiche Ruhr-Universität Bochum 25. Januar 2010 1 / 75 2 / 75 4.1 Beispiel: Vergleich von verschiedenen Unterrichtsmethoden Zwei Zufallsstichproben (A und B) mit je 10 Schülern und 8 Schülern Gruppe A wird nach

Mehr

1. Makrozulassung in Excel - Version 2010 -

1. Makrozulassung in Excel - Version 2010 - Damit die Excel-Maske richtig funktioniert, achten Sie bitte unbedingt auf die Reihenfolge der folgenden Schritte! 1. Makrozulassung in Excel - Version 2010 - Da die Excel-Maske Makros enthält, sollten

Mehr

Analog zu Aufgabe 16.1 werden die Daten durch folgenden Befehl eingelesen: > kredit<-read.table("c:\\compaufg\\kredit.

Analog zu Aufgabe 16.1 werden die Daten durch folgenden Befehl eingelesen: > kredit<-read.table(c:\\compaufg\\kredit. Lösung 16.3 Analog zu Aufgabe 16.1 werden die Daten durch folgenden Befehl eingelesen: > kredit

Mehr

Norm- vs. Kriteriumsorientiertes Testen

Norm- vs. Kriteriumsorientiertes Testen Norm- vs. Kriteriumsorientiertes Testen Aus psychologischen Test ergibt sich in der Regel ein numerisches Testergebnis, das Auskunft über die Merkmalsausprägung der Testperson geben soll. Die aus der Testauswertung

Mehr

Beispiel für eine multivariate Varianzanalyse (MANOVA) Daten: POKIV_Terror_V12.sav

Beispiel für eine multivariate Varianzanalyse (MANOVA) Daten: POKIV_Terror_V12.sav Beispiel für eine multivariate Varianzanalyse () Daten: POKIV_Terror_V12.sav Es soll überprüft werden, inwieweit das ATB-Syndrom (Angst vor mit den drei Subskalen affektive Angst von, Terrorpersistenz,

Mehr

Origin Tutorial. 1. Einleitung : 2.Importieren von Dateien in Origin :

Origin Tutorial. 1. Einleitung : 2.Importieren von Dateien in Origin : Origin Tutorial 1. Einleitung : Dieses Tutorial soll Einsteigern das Importieren und Plotten von Daten in Origin erklären. Außerdem werden Möglichkeiten zur Durchführung linearer Anpassungen, polynomieller

Mehr

Klausur zur Vorlesung Statistik III für Studenten mit dem Wahlfach Statistik

Klausur zur Vorlesung Statistik III für Studenten mit dem Wahlfach Statistik Ludwig Fahrmeir, Nora Fenske Institut für Statistik Bitte für die Korrektur freilassen! Aufgabe 1 2 3 4 Punkte Klausur zur Vorlesung Statistik III für Studenten mit dem Wahlfach Statistik 29. März 21 Hinweise:

Mehr

Die Duration von Standard-Anleihen. - Berechnungsverfahren und Einflussgrößen -

Die Duration von Standard-Anleihen. - Berechnungsverfahren und Einflussgrößen - Die Duration von Standard-Anleihen - Berechnungsverfahren und Einflussgrößen - Gliederung Einleitendes Herleitung einer Berechnungsvorschrift Berechnungsvorschriften für Standardfälle Einflussgrößen und

Mehr

Kapitel 27 Distanz- und Ähnlichkeitsmaße

Kapitel 27 Distanz- und Ähnlichkeitsmaße Kapitel 7 Distanz- und Ähnlichkeitsmaße 7.1 Einführung Sowohl Distanz- als auch Ähnlichkeitsmaße dienen dazu, die Ähnlichkeit verschiedener Fälle oder Variablen zu quantifizieren. Beide Maße untersuchen,

Mehr

Beispiel: Sonntagsfrage. Einführung in die induktive Statistik. Statistische Tests. Statistische Tests

Beispiel: Sonntagsfrage. Einführung in die induktive Statistik. Statistische Tests. Statistische Tests Beispiel: Sonntagsfrage Vier Wochen vor der österreichischen Nationalratswahl 1999 wurde 499 Haushalten die Sonntagsfrage gestellt: Falls nächsten Sonntag Wahlen wären, welche Partei würden Sie wählen?

Mehr

Varianzanalytische Methoden Zweifaktorielle Versuchspläne 4/13. Durchführung in SPSS (File Trait Angst.sav)

Varianzanalytische Methoden Zweifaktorielle Versuchspläne 4/13. Durchführung in SPSS (File Trait Angst.sav) Zweifaktorielle Versuchspläne 4/13 Durchführung in SPSS (File Trait Angst.sav) Analysieren > Allgemeines Lineares Modell > Univariat Zweifaktorielle Versuchspläne 5/13 Haupteffekte Geschlecht und Gruppe

Mehr

A1.7: Entropie natürlicher Texte

A1.7: Entropie natürlicher Texte A1.7: Entropie natürlicher Texte Anfang der 1950er Jahre hat Claude E. Shannon die Entropie H der englischen Sprache mit einem bit pro Zeichen abgeschätzt. Kurz darauf kam Karl Küpfmüller bei einer empirischen

Mehr

3.2 Bivariate Verteilungen

3.2 Bivariate Verteilungen 3.2 Bivariate Verteilungen zwei Variablen X, Y werden gemeinsam betrachtet (an jedem Objekt i, i = 1,..., n, werden gleichzeitig zwei Merkmale beobachtet) Beobachtungswerte sind Paare/Kombinationen von

Mehr

Probeklausur Zeitreihenökonometrie (Sommersemester 2014) 1

Probeklausur Zeitreihenökonometrie (Sommersemester 2014) 1 Probeklausur Zeitreihenökonometrie (Sommersemester 2014) 1 Aufgabe 1: Betrachtet wird folgendes Modell zur Erklärung des Managergehalts salary durch den Umsatz sales, die Eigenkapitalrendite roe und die

Mehr

Statistik im Bachelor-Studium der BWL und VWL

Statistik im Bachelor-Studium der BWL und VWL Max C. Wewel Statistik im Bachelor-Studium der BWL und VWL Methoden, Anwendung, Interpretation Mit herausnehmbarer Formelsammlung ein Imprint von Pearson Education München Boston San Francisco Harlow,

Mehr

90-minütige Klausur Statistik für Studierende der Kommunikationswissenschaft

90-minütige Klausur Statistik für Studierende der Kommunikationswissenschaft Prof. Dr. Helmut Küchenhoff SS08 90-minütige Klausur Statistik für Studierende der Kommunikationswissenschaft am 22.7.2008 Anmerkungen Überprüfen Sie bitte sofort, ob Ihre Angabe vollständig ist. Sie sollte

Mehr

29. Mai 2006. 5. Bei Unterschleif gilt die Klausur als nicht bestanden und es erfolgt eine Meldung an das Prüfungsamt.

29. Mai 2006. 5. Bei Unterschleif gilt die Klausur als nicht bestanden und es erfolgt eine Meldung an das Prüfungsamt. L. Fahrmeir, C. Belitz Department für Statistik Bitte für die Korrektur freilassen! Aufgabe 1 2 3 4 Punkte Klausur zur Vorlesung Statistik III für Studenten mit Wahlfach Statistik 29. Mai 2006 Hinweise:

Mehr

Regressionsanalysen. Zusammenhänge von Variablen. Ziel der Regression. ( Idealfall )

Regressionsanalysen. Zusammenhänge von Variablen. Ziel der Regression. ( Idealfall ) Zusammenhänge von Variablen Regressionsanalysen linearer Zusammenhang ( Idealfall ) kein Zusammenhang nichtlinearer monotoner Zusammenhang (i.d.regel berechenbar über Variablentransformationen mittels

Mehr

Institut für Soziologie. Methoden 2. Regressionsanalyse I: Einfache lineare Regression

Institut für Soziologie. Methoden 2. Regressionsanalyse I: Einfache lineare Regression Institut für Soziologie Methoden 2 Regressionsanalyse I: Einfache lineare Regression Programm Anwendungsbereich Vorgehensweise Interpretation Annahmen Zusammenfassung Übungsaufgabe Literatur # 2 Anwendungsbereich

Mehr

Codierungstheorie Rudolf Scharlau, SoSe 2006 9

Codierungstheorie Rudolf Scharlau, SoSe 2006 9 Codierungstheorie Rudolf Scharlau, SoSe 2006 9 2 Optimale Codes Optimalität bezieht sich auf eine gegebene Quelle, d.h. eine Wahrscheinlichkeitsverteilung auf den Symbolen s 1,..., s q des Quellalphabets

Mehr

Methoden Quantitative Datenanalyse

Methoden Quantitative Datenanalyse Leitfaden Universität Zürich ISEK - Andreasstrasse 15 CH-8050 Zürich Telefon +41 44 635 22 11 Telefax +41 44 635 22 19 www.isek.uzh.ch 11. September 2014 Methoden Quantitative Datenanalyse Vorbereitung

Mehr

SPSS-Skriptum. 1. Vorbereitungen für die Arbeit mit SPSS (im Seminar)

SPSS-Skriptum. 1. Vorbereitungen für die Arbeit mit SPSS (im Seminar) Die folgenden Erklärungen und Abbildungen sollen den Umgang mit SPSS im Rahmen des POK erleichtern. Diese beschreiben nicht alle Möglichkeiten, die SPSS bietet, sondern nur die Verfahren, die im Seminar

Mehr

Dokumentation RabattManagerLX Pro. Version 1.0.901.1

Dokumentation RabattManagerLX Pro. Version 1.0.901.1 Dokumentation RabattManagerLX Pro Version 1.0.901.1 Dokumentation RabattManagerLX Pro Version 1.0.901.1 Was ist RabattManagerLX Pro? RabattManagerLX Pro ist ein Programm um individuelle Warengruppen-Rabatte

Mehr

Korrelation - Regression. Berghold, IMI

Korrelation - Regression. Berghold, IMI Korrelation - Regression Zusammenhang zwischen Variablen Bivariate Datenanalyse - Zusammenhang zwischen 2 stetigen Variablen Korrelation Einfaches lineares Regressionsmodell 1. Schritt: Erstellung eines

Mehr

Biostatistik, Winter 2011/12

Biostatistik, Winter 2011/12 Biostatistik, Winter 2011/12 Vergleich zweier Stichproben, nichtparametrische Tests Prof. Dr. Achim Klenke http://www.aklenke.de 11. Vorlesung: 27.01.2012 1/86 Inhalt 1 Tests t-test 2 Vergleich zweier

Mehr

ZERTIFIKATE spielend beherrschen

ZERTIFIKATE spielend beherrschen UDI ZAGST / MICHAEL HUBER RUDI ZAGST / MICHAEL HUBER ZERTIFIKATE ZERTIFIKATE spielend beherrschen spielend beherrschen Der Performance-Kick Der Performance-Kick für Ihr für Portfolio Ihr Portfolio inanzbuch

Mehr

Faktorenanalyse. 1. Grundlegende Verfahren. Bacher, SoSe2007

Faktorenanalyse. 1. Grundlegende Verfahren. Bacher, SoSe2007 Faktorenanalyse Bacher, SoSe2007 1. Grundlegende Verfahren explorative FA (EXFA): Für eine Menge von Variablen/Items werden zugrunde liegende gemeinsame (latente) Dimensionen/Faktoren gesucht, die Faktorstruktur

Mehr

Abschlussklausur (60 Minuten), 15. Juli 2014

Abschlussklausur (60 Minuten), 15. Juli 2014 Prof. Dr. Amelie Wuppermann Volkswirtschaftliche Fakultät Universität München Sommersemester 2014 Empirische Ökonomie 1 Abschlussklausur (60 Minuten), 15. Juli 2014 Bearbeitungshinweise Die Bearbeitungszeit

Mehr

Versuchsauswertung mit Polynom-Regression in Excel

Versuchsauswertung mit Polynom-Regression in Excel Versuchsauswertung mit Polynom-Regression in Excel Aufgabenstellung: Gegeben sei die in Bild 1 gezeigte Excel-Tabelle mit Messwertepaaren y i und x i. Aufgrund bekannter physikalischer Zusammenhänge wird

Mehr

LM2. WAHRSCHEINLICHKEITSRECHNUNG/STATISTIK

LM2. WAHRSCHEINLICHKEITSRECHNUNG/STATISTIK LM2. WAHRSCHEINLICHKEITSRECHNUNG/STATISTIK III. In einer Region haben 60 % der Haushalte einen Internetanschluss. Das Diagramm veranschaulicht die Anteile der Zugangsgeschwindigkeiten unter den Haushalten

Mehr

Wir haben ermittelt, dass Tests 1, 2 und 7 am nützlichsten zum Auswerten der Stabilität der X-quer-Karte und der I-Karte sind:

Wir haben ermittelt, dass Tests 1, 2 und 7 am nützlichsten zum Auswerten der Stabilität der X-quer-Karte und der I-Karte sind: Dieses White Paper ist Teil einer Reihe von Veröffentlichungen, welche die Forschungsarbeiten der Minitab-Statistiker erläutern, in deren Rahmen die im Assistenten der Minitab 17 Statistical Software verwendeten

Mehr

Randziffern in Microsoft Word: Eine Schritt-für-Schritt-Anleitung

Randziffern in Microsoft Word: Eine Schritt-für-Schritt-Anleitung Randziffern in Microsoft Word: Eine Schritt-für-Schritt-Anleitung Einleitung Unzählige Juristen aber mit Sicherheit auch andere Schreibende haben sich schon gefragt, wie man in Microsoft Word Randziffern

Mehr

Regression mit Gretl Eine erste Einführung 1

Regression mit Gretl Eine erste Einführung 1 Kurzeinführung in Gretl S. 1 Regression mit Gretl Eine erste Einführung 1 Installation: Gretl für das entsprechende Betriebssystem herunterladen und die Setup-Datei ausführen. Hinweis: Für die Benutzung

Mehr

Medizinische Statistik Epidemiologie und χ 2 Vierfeldertest

Medizinische Statistik Epidemiologie und χ 2 Vierfeldertest Universität Wien Institut für Mathematik Wintersemester 2009/2010 Medizinische Statistik Epidemiologie und χ 2 Vierfeldertest Seminar Angewandte Mathematik Ao. Univ. Prof. Dr. Peter Schmitt von Nadja Reiterer

Mehr

Varianzananalyse. How to do

Varianzananalyse. How to do Varianzananalyse How to do Die folgende Zusammenfassung zeigt beispielhaft, wie eine Varianzanalyse mit SPSS durchgeführt wird und wie die Ergebnisse in einem Empra-Bericht oder in einer Bachelor- oder

Mehr

Einleitung 19. Teil I SPSS kennen lernen 25. Kapitel 1 In 25 Minuten zum SPSS-Profi 27

Einleitung 19. Teil I SPSS kennen lernen 25. Kapitel 1 In 25 Minuten zum SPSS-Profi 27 Inhaltsverzeichnis Einleitung 19 SPSS oder PASW oder was? 19 Über dieses Buch 20 Konventionen in diesem Buch 20 Was Sie nicht lesen müssen 21 Törichte Annahmen über den Leser 21 Wie dieses Buch aufgebaut

Mehr

Statistik Musterlösungen

Statistik Musterlösungen Statistik Musterlösungen Regina Tüchler & Achim Zeileis Institut für Statistik & Mathematik Wirtschaftsuniversität Wien 1 Grundbegriffe (1.23) Skript Reaktionen auf Videofilm. Aussagen M, E, P, S h(m)

Mehr

Gibt es einen Geschmacksunterschied zwischen Coca Cola und Cola Zero?

Gibt es einen Geschmacksunterschied zwischen Coca Cola und Cola Zero? Gibt es einen Geschmacksunterschied zwischen Coca Cola und Cola Zero? Manche sagen: Ja, manche sagen: Nein Wie soll man das objektiv feststellen? Kann man Geschmack objektiv messen? - Geschmack ist subjektiv

Mehr

Mein erstes Tableau-Dashboard. Tableau Software Schritt für Schritt kennenlernen und ein erstes Dashboard erstellen

Mein erstes Tableau-Dashboard. Tableau Software Schritt für Schritt kennenlernen und ein erstes Dashboard erstellen Tableau Software Schritt für Schritt kennenlernen und ein erstes Dashboard erstellen Vorgehensweise 1) Datenaufbereitung in Microsoft Excel 2) Tableau - Datenimport 3) Erstellung verschiedener Tableau-Arbeitsblätter

Mehr

Verteilungsanalyse. Johannes Hain. Lehrstuhl für Mathematik VIII Statistik 1/35

Verteilungsanalyse. Johannes Hain. Lehrstuhl für Mathematik VIII Statistik 1/35 Verteilungsanalyse Johannes Hain Lehrstuhl für Mathematik VIII Statistik 1/35 Datentypen Als Sammeln von Daten bezeichnet man in der Statistik das Aufzeichnen von Fakten. Erhobene Daten klassifziert man

Mehr

Kaufhaus-Aufgabe. aus Abiturprüfung Bayern LK (abgeändert)

Kaufhaus-Aufgabe. aus Abiturprüfung Bayern LK (abgeändert) Kaufhaus-Aufgabe aus Abiturprüfung Bayern LK (abgeändert) 5. a) Ein Kunde eines Kaufhauses benutzt mit einer Wahrscheinlichkeit von 75% die hauseigene Tiefgarage. Mit einer Wahrscheinlichkeit von 40% bleibt

Mehr

Microsoft Excel 2010 Matrix-Funktionen

Microsoft Excel 2010 Matrix-Funktionen Hochschulrechenzentrum Justus-Liebig-Universität Gießen Microsoft Excel 2010 Matrix-Funktionen Matrix-Funktionen in Excel 2010 Seite 1 von 7 Inhaltsverzeichnis Einleitung... 2 Integrierte Matrixfunktionen...

Mehr