(VU) Übungen zur Einführung in die statistische Datenanalyse II. Inhalte Statistik I. Inhalte Statistik I Deskriptive Statistik

Größe: px
Ab Seite anzeigen:

Download "(VU) Übungen zur Einführung in die statistische Datenanalyse II. Inhalte Statistik I. Inhalte Statistik I Deskriptive Statistik"

Transkript

1 II Übungen zur II Organisatorische Hinweise Keine Anwesenheitspflicht (aber empfehlenswert) Einführung in die statistische Datenanalyse II (VU) Lehrinhalte (.ppt Folien): elearning.univie.ac.at 3 Prüfungstermine: Ende SoSe Anfang WiSe Mitte/Ende WiSe Prüfungsanmeldung: elearning.univie.ac.at Prüfungswiederholung: bei negativem Abschluß -> Wiederholung der LVA Termine: Kalender in elaerning Inhalte Statistik I Deskriptive Statistik Inhalte Statistik I Analytische / Schliessende Statistik univariate Datenanalyse Häufigkeitsanalyse Zentralitätsmaße Streuungsmaße Datenniveaus: ominal Ordinal bivariate Datenanalyse Kreuztabelle Datenniveaus: ominal Ordinal univariate Datenanalyse Vergleich von Verteilungen CHI-Quadrat-Einfach-Ordnung Datenniveaus ominal Ordinal bivariate Datenanalyse CHI-Quadrat Assoziationsmaße Datenniveaus: ominal Ordinal Intervall Rational

2 II Prinzipien schliessenden / analytische Statistik -Logik immer gleich: Inhalte Statistik II Analytische / Schliessende Statistik Formulierung einer ullhypothese (H 0 ) und einer Alternativhypothese (H A ) Abweichung einer beobachteten Verteilung von einer Prüfverteilung Prüfverteilung = erwartete Verteilung: Abhängig von der Fragestellung!! Bestimmung der Irrtumswahrscheinlichkeit (=Signifikanz) Was sagt die Irrtumswahrscheinlichkeit (Signifikanz)? Wahrscheinlichkeit des Irrtums wenn H 0 abgelehnt und Alternativhypothese angenommen wird Merke: p<=0,05 -> signifikant auf dem 95% - iveau p>0,05 -> nicht signifikant auf dem 95% - iveau univariate Datenanalyse Vergleich von Verteilungen Datenniveaus Metrisch (Intervallskaliert) bivariate Datenanalyse Zusammenhang von zwei Merkmalen Datenniveaus: Metrisch (Intervallskaliert) multivariate Datenanalyse Zusammenhang von mehr als zwei Merkmalen II Inhalte Statistik II univariate Datenanalyse Vergleich von Verteilungen Datenniveaus Metrisch (Intervallskaliert) TESTSTATISTIK: Prüft den UTERSCHIED von Verteilungen Analytische / Schliessende Statistik Vergleich von intervallskalierten Stichproben/Verteilungen hinsichtlich ihrer zentralen Tendenz Beim Vergleich von Verteilungen z.b.: hinsichtlich ihrer e bzw. Mediane (allgemein: zentrale Tendenz) werden drei Differenzierungen relevant: (a) une - e Verteilungen (b) Vergleich zweier oder mehrerer Verteilungen (c) normal - beliebig verteilte Werte

3 Übersicht verfahren für intervallskalierte Daten TEST AUF ORMALERTEILUG Verteilung Zahl der Verteilungen Abhängigkeit un t- nach Student Verteilung Zahl der Verteilungen Abhängigkeit un t- nach Student t- für e Stichproben t- für e Stichproben > un einfache Varianzanalyse > un einfache Varianzanalyse > doppelte Varianzanalyse > doppelte Varianzanalyse un U- von MA und Whitney un U- von MA und Whitney WILCOXO- für Paardifferenzen WILCOXO- für Paardifferenzen > > un H- KRUSKAL und WALLIS, Median- FRIEDMA- > > un H- KRUSKAL und WALLIS, Median- FRIEDMA- Verteilungsformen ORMALVERTEILUG Verteilungsformen ORMALVERTEILUG verteilung: Verteilungsform die - ceteris paribus - unter optimalen Zufallsbedingungen zu erwarten wärew verteilung: Verteilungsform die - ceteris paribus - unter optimalen Zufallsbedingungen zu erwarten wäre 3

4 Verteilungsformen - verteilung Verteilungsformen - verteilung Die verteilung kennzeichnet eine Verteilung von Merkmalen die sich aus zufälligen Einflüssen ergibt verteilung: Verteilung von Merkmalen unter optimalen Zufallsbedingungen für metrische Merkmale Generelle Kennzeichen einer verteilung: = Medianwert = Modalwert 95% der Werte befinden sich in einem Intervall von +/- Standardabweichungen symetrisch +/- Standardabweichungen (95% der Werte) = Median = Modalwert +/- Standardabweichungen (95% der Werte) = Median = Modalwert Schiefe (skewness) = 0 Steilheit (kurtosis) = 0 eingipfelig Verteilungsformen - verteilung Ermittlung der theoretischen Zufallsverteilung / verteilung Zu jeder Verteilung kann mittels und Streuungsparameter eine - theoretische - verteilung berechnet werden f x μ σ ( x) = e σ π Verteilungsformen - verteilung Ermittlung der theoretischen Zufallsverteilung / verteilung Die theoretische verteilung gibt an, wie die Werte unter gegebenen Rahmenbedingungen - Rahmenbedingungen definiert durch und Standardabweichung - verteilt wären, wenn die Verteilung unter zufälligen Bedingungen zustande gekommen wäre x μ σ f ( x) = e σ π μ... μ... +/- Standardabweichungen (95% der Werte) = Median = Modalwert ORMALVERTEILUG glockenförmige Verteilung Extremwerte selten mittlere Meßwerte häufig Zufallsverteilung symetrisch σ...s tan dardabweic hung π... KreiszahlPi(3,46...) e...eulersche Zahl (,783...) +/- Standardabweichungen (95% der Werte) = Median = Modalwert ORMALVERTEILUG glockenförmige Verteilung Extremwerte selten mittlere Meßwerte häufig Zufallsverteilung symetrisch σ...s tan dardabweic hung π... KreiszahlPi(3,46...) e...eulersche Zahl (,783...) 4

5 Verteilungsformen - verteilung Räumliche Verteilung der High School students in der Vienna Metropolitan Region Verteilungsformen - verteilung Räumliche Verteilung der High School students in der Vienna Metropolitan Region Statistiken ahsbhs59_0p Median Modus Standardabweichung Schiefe Standardfehler der Schiefe Kurtosis Standardfehler der Kurtosis Gültig ,8856 4,346 30,77 a,85935,33,8,40,36 a. Mehrere Modi vorhanden. Der kleinste Wert wird angezeigt. Frage: entspricht die Verteilung einer Zufallsverteilung = verteilung? auf verteilung auf verteilung Statistiken Möglichkeiten der Überprüfung: Überprüfung mit Hilfe der Zentralitäts ts- und Streuungsmaße: = Median = Modus, Schiefe = 0 Kurtosis = 0 ahsbhs59_0p Median Modus Standardabweichung Schiefe Standardfehler der Schiefe Kurtosis Standardfehler der Kurtosis Gültig a. Mehrere Modi vorhanden. Der kleinste Wert wird angezeigt ,8856 4,346 30,77 a,85935,33,8,40,36 Ergebnis: Abweichungen der beobachteten Verteilung von theoretischer optimaler verteilung feststellbar: Median Modus, Schiefe 0, Kurtosis 0 Frage: Wie groß dürfen diese Abweichungen sein? 5

6 auf verteilung Verteilungsformen - verteilung Für jedes x (hier für jedes Anteil der high school students) ergibt sich eine erwartete Häufigkeit - wie sie unter Zufallsbedingungen zu erwarten wäre Möglichkeiten der Überprüfung: Graphische Überprüfung. Histogramm mit verteilungskurve (in SPSS Häufigkeiten) H Statistiken Anteil high school students an Wohnbevölkerung 5-9 Jahre Gültig ,8856 Median 4,346 Modus 30,77 a Standardabweichung,85935 Schiefe,33 Standardfehler der Schiefe,8 Kurtosis,40 Standardfehler der Kurtosis,36 a Mehrere Modi vorhanden Der kleinste Wert wird x μ σ f ( x) = e σ π μ... σ...s tan dardabweic hung π... KreiszahlPi(3,46...) e...eulersche Zahl (,783...) Berechnung der theoretischen Zufallsverteilung = verteilung? Verteilungsformen - verteilung auf verteilung Erwartete Verteilung des Anteil der high school students, wenn unter zufälligen Bedingungen (standard) normal - verteilt ahsbhs59_0p Median Modus Standardabweichung Schiefe Standardfehler der Schiefe Kurtosis Standardfehler der Kurtosis Statistiken Gültig ,8856 4,346 30,77 a,85935,33,8,40,36 a. Mehrere Modi vorhanden. Der kleinste Wert wird angezeigt. Ergebnis: Abweichungen der beobachteten Verteilung von theoretischer verteilung feststellbar Frage: Wie groß dürfen diese Abweichungen sein? 6

7 auf verteilung Kolmogorov-Smirnov Smirnov- Möglichkeiten der Überprüfung: Überprüfung mit Hilfe der Zentralitäts ts- und Streuungsmaße: = Median = Modus, Schiefe = 0 Graphische Überprüfung. Histogramm mit verteilungskurve ( ( SPSS Häufigkeiten) Statistische Signifikanzprüfung der Abweichung der beobachteten von der Erwarteten optimalen theoretischen verteilung Kolmogorov-Smirnov- Kolmogorov-Smirnov- Prüft ob Verteilung von Werten einer theoretischen Verteilung entspricht In diesem Fall: ORMALVERTEILUG ullhypothese H0: Verteilung entspricht einer zufälligen Verteilung = verteilung Alternativhypothese: Verteilung ist ICHT normalverteilt Kolmogorov-Smirnov- Kolmogorov-Smirnov Smirnov- Ergebnis: p > 0.05 nicht signifikant Alternativhypothese: Verteilung ist ICHT normalverteilt verwerfen ullhypothese: Verteilung ist normalverteilt annehmen Kolmogorov-Smirnov-Anpassungstest Verteilungsformen - verteilung Räumliche Verteilung der Arbeitslosen Vienna Metropolitan Region Parameter der verteilung a,b Standardabweichung Extremste Differenzen Absolut Positiv egativ Kolmogorov-Smirnov-Z Asymptotische Signifikanz (-seitig) Anteil high school students an Wohnbevölk erung 5-9 Jahre 45 4,8856,85935,054,054 -,054,3,68 a. Die zu testende Verteilung ist eine verteilung. b. Aus den Daten berechnet. 7

8 auf verteilung Kolmogorov-Smirnov Smirnov- Statistiken Arbeitslose an Erwerbspersonen WB 00 in % Gültig Median Modus Standardabweichung Schiefe Standardfehler der Schiefe Kurtosis Standardfehler der Kurtosis a. Mehrere Modi vorhanden. Der kleinste Wert wird angezeigt. Ergebnis: Abweichungen der beobachteten Verteilung von theoretischer verteilung feststellbar Frage: Wie groß dürfen diese Abweichungen sein? ,867 6,908,00 a 4,544,940,8 0,876,36 Kolmogorov-Smirnov- Ergebnis: p < 0.05 signifikant Alternativhypothese: Verteilung ist ICHT normalverteilt annehmen ullhypothese: Verteilung ist normalverteilt ablehnen Parameter der verteilung a,b Kolmogorov-Smirnov-Anpassungstest Standardabweichung Extremste Differenzen Absolut Positiv egativ Kolmogorov-Smirnov-Z Asymptotische Signifikanz (-seitig) a. Die zu testende Verteilung ist eine verteilung. b. Aus den Daten berechnet. Arbeitslose an Erwerbsper sonen WB 00 in % 46 7,867 4,544,0,0 -,086,08,000 Kolmogorov-Smirnov- Kolmogorov-Smirnov Smirnov- Ergebnis: p < 0.05 signifikant Alternativhypothese: Verteilung ist ICHT normalverteilt annehmen ullhypothese: Verteilung ist normalverteilt ablehnen Lösungsmöglichkeit: Datenmodifikation z.b.: logarithmieren Anteil der Arbeitslosen an Erwerbspersonen 00 in % Dekadischer Logarithmus des Anteils der Arbeitslosen an Erwerbspersonen 00 in % auf verteilung Statistiken LG0_Arbeitslose an Erwerbspersonen WB 00 in % Gültig Median Modus Standardabweichung Schiefe Standardfehler der Schiefe Kurtosis Standardfehler der Kurtosis 44 7,849,8396,65 a,56 -,067,9 -,6,37 a. Mehrere Modi vorhanden. Der kleinste Wert wird angezeigt. Ergebnis: Verteilung ähnlicher einer verteilung Dennoch: Abweichungen der beobachteten Verteilung von theoretischer her verteilung feststellbar Frage: Wie groß dürfen diese Abweichungen sein? 8

9 Kolmogorov-Smirnov Smirnov- Kolmogorov-Smirnov Smirnov- Kolmogorov-Smirnov- Ergebnis: p > 0.05 nicht signifikant Alternativhypothese: Verteilung ist ICHT normalverteilt ablehnen ullhypothese: Verteilung ist normalverteilt annehmen Parameter der verteilung a,b Kolmogorov-Smirnov-Anpassungstest Standardabweichung Extremste Differenzen Absolut Positiv egativ Kolmogorov-Smirnov-Z Asymptotische Signifikanz (-seitig) LG0_ Arbeitslose an Erwerbsper sonen WB 00 in % 44,849,56,045,040 -,045,95,359 Kolmogorov-Smirnov- Ergebnis: Verteilungen von intervallskallierten Daten die einer verteilung entsprechen: Paramtergebundene verfahren» Anteil der high school students» Logarithmierter Anteil der Arbeitslosen Verteilungen von intervallskallierten Daten die keiner verteilung entsprechen: Parameterfreie verfahren a. Die zu testende Verteilung ist eine verteilung. b. Aus den Daten berechnet. 9

10 II II Einführung in die statistische Datenanalyse II (VU) Vergleich von intervallskalierten Stichproben/Verteilungen hinsichtlich ihrer zentralen Tendenz Beim Vergleich von Verteilungen z.b.: hinsichtlich ihrer e bzw. Mediane (allgemein: zentrale Tendenz) werden drei Differenzierungen relevant: (a) une - e Verteilungen (b) Vergleich zweier oder mehrerer Verteilungen (c) normal - beliebig verteilte Werte Beispiel Unterschied Arbeitslose Wien vs. Umland Übersicht verfahren für intervallskalierte Daten FRAGESTELLUG: Gibt es einen signifikanten Unterschied in der Verteilung des (logarithmierten) Anteils der Arbeitslosen Verteilung Zahl der Verteilungen Abhängigkeit un t- nach Student t- für e Stichproben > un einfache Varianzanalyse > doppelte Varianzanalyse un U- von MA und Whitney WILCOXO- für Paardifferenzen > > un H- KRUSKAL und WALLIS, Median- FRIEDMA- zwischen Wien und den Umlandgemeinden?

11 Beispiel Unterschied Arbeitslose Wien vs. Umland. Schritt: Feststellung der Verteilungsform Beispiel Unterschied Arbeitslose Wien vs. Umland. Schritt Wieviele Verteilungen werden miteinander verglichen? Verteilung Zahl der Verteilungen Abhängigkeit un t- nach Student Verteilung Zahl der Verteilungen Abhängigkeit un t- nach Student t- für e Stichproben t- für e Stichproben > un einfache Varianzanalyse > un einfache Varianzanalyse > doppelte Varianzanalyse > doppelte Varianzanalyse un U- von MA und Whitney un U- von MA und Whitney WILCOXO- für Paardifferenzen WILCOXO- für Paardifferenzen > > un H- KRUSKAL und WALLIS, Median- FRIEDMA- > > un H- KRUSKAL und WALLIS, Median- FRIEDMA- Logarithmierter Anteil der Arbeitslosen ist normalverteilt (siehe K-S K S ) Zahl der Verteilungen: :, Verteilung der Arbeitslosen in Wien -. Verteilung der Arbeitslosen im Umland Beispiel Unterschied Arbeitslose Wien vs. Umland. Schritt Wieviele Verteilungen werden miteinander verglichen? Beispiel Unterschied Arbeitslose Wien vs. Umland 3. Schritt: Sind die Verteilungen (Stichproben) oder un? Verteilung Zahl der Verteilungen Abhängigkeit un t- nach Student Verteilung Zahl der Verteilungen Abhängigkeit un t- nach Student t- für e Stichproben t- für e Stichproben > un einfache Varianzanalyse > un einfache Varianzanalyse > doppelte Varianzanalyse > doppelte Varianzanalyse un U- von MA und Whitney un U- von MA und Whitney WILCOXO- für Paardifferenzen WILCOXO- für Paardifferenzen > > un H- KRUSKAL und WALLIS, Median- FRIEDMA- > > un H- KRUSKAL und WALLIS, Median- FRIEDMA- Zahl der Verteilungen: :, Verteilung der Arbeitslosen in Wien -. Verteilung der Arbeitslosen im Umland

12 vs. un: Un: Verteilungen (Stichproben) stammen von verschiedenen Gruppen = verschiedenen FällenF Der unterschied der Verteilung EIES Merkmales zwischen verschiedenen Gruppen ( Fällen )) wird geprüft Abhängig: Verteilungen (Stichproben) stammen aus EIER Gruppe (Grundgesamtheit) =gleiche FälleF Der unterschied der Verteilung MEHRERER Merkmale innerhalb ein- und derselben Gruppe (Grundgesamtheit) wird geprüft ULLHYPOTHESE: Es besteht KEI Unterschied zwischen den Verteilungen 3. Schritt: Sind die Verteilungen (Stichproben) oder un? Verteilung Beispiel Unterschied Arbeitslose Wien vs. Umland Zahl der Verteilungen > > > > Abhängigkeit un un un un t- nach Student t- für e Stichproben einfache Varianzanalyse doppelte Varianzanalyse U- von MA und Whitney WILCOXO- für Paardifferenzen H- KRUSKAL und WALLIS, Median- FRIEDMA- Unterschied der Verteilung einer Variable ( Arbeitslose( Arbeitslose ) zwischen Gruppen (Stadt und Umland) wird verglichen -> Verteilungen: unahbhängig ngig Beispiel Unterschied Arbeitslose Wien vs. Umland 3. Schritt: Sind die Verteilungen (Stichproben) oder un? Beispiel Unterschied Arbeitslose Wien vs. Umland 4. Schritt: Auswahl des verfahrens Verteilung Zahl der Verteilungen Abhängigkeit un t- nach Student Verteilung Zahl der Verteilungen Abhängigkeit un t- nach Student t- für e Stichproben t- für e Stichproben > un einfache Varianzanalyse > un einfache Varianzanalyse > doppelte Varianzanalyse > doppelte Varianzanalyse un U- von MA und Whitney un U- von MA und Whitney WILCOXO- für Paardifferenzen WILCOXO- für Paardifferenzen > > un H- KRUSKAL und WALLIS, Median- FRIEDMA- > > un H- KRUSKAL und WALLIS, Median- FRIEDMA- Unterschied der Verteilung einer Variable ( Arbeitslose( Arbeitslose ) zwischen Gruppen (Stadt und Umland) wird verglichen -> Verteilungen: unahbhängig ngig 3

13 t- Beispiel Unterschied Arbeitslose Wien vs. Umland. t- nach STUDET Der t- nach STUDET dient zum Vergleich zweier uner Stichproben hinsichtlich ihrer e FRAGESTELLUG: Gibt es einen signifikanten Unterschied in der Verteilung des (logarithmierten) Anteils der Arbeitslosen zwischen Wien und den Umlandgemeinden? Beispiel Unterschied Arbeitslose Wien vs. Umland t- Grundüberlegung FRAGESTELLUG: Gibt es einen signifikanten Unterschied in der Statistiken Verteilung des (logarithmierten) Anteils der Arbeitslosen LG0_Arbeitslose an Erwerbspersonen WB 00 in % Gültig Median Modus Standardabweichung Schiefe Standardfehler der Schiefe Kurtosis Standardfehler der Kurtosis a. Mehrere Modi vorhanden. Der kleinste Wert wird angezeigt. 44 7,849,8396,65 a,56 -,067,9 -,6,37 Häufigkeiten 5% Stichprobe Häufigkeiten 35% Stichprobe Häufigkeiten 50% Stichprobe Statistiken LG0_Arbeitslose an Erwerbspersonen WB 00 in % Gültig Median Modus Standardabweichung Schiefe Standardfehler der Schiefe Kurtosis Standardfehler der Kurtosis a. Mehrere Modi vorhanden. Der kleinste Wert wird Häufigkeiten angezeigt. 50% Stichprobe 44 7,849,8396,65 a,56 -,067,9 -,6,37 zwischen Wien und den Umlandgemeinden? Grundüberlegung Aus jeder Grundgesamtheit können k beliebig viele Zufallsstichproben ausgewählt werden Auswahl von Fällen F nach Zufallskriterien = Zufallstichprobe 4

14 Anteil der Arbeitslosen (logarithmiert) Anteil der Arbeitslosen (logarithmiert) - Stichproben-e Häufigkeiten 5% Statistiken Stichprobe LG0_Arbeitslose an Erwerbspersonen WB 00 in % Gültig Standardabweichung Varianz Häufigkeiten 35% Statistiken Stichprobe LG0_Arbeitslose an Erwerbspersonen WB 00 in % Gültig Standardabweichung Varianz Häufigkeiten 50% Statistiken Stichprobe LG0_Arbeitslose an Erwerbspersonen WB 00 in % Gültig Standardabweichung Varianz 3,845,057,04 33,8394,43, ,843,0967,044 Statistiken LG0_Arbeitslose an Erwerbspersonen WB 00 in % Gültig Median Modus Standardabweichung Schiefe Standardfehler der Schiefe Kurtosis Standardfehler der Kurtosis 44 7,849,8396,65 a,56 -,067,9 -,6,37 a. Mehrere Modi vorhanden. Statistiken Der kleinste Wert wird Häufigkeiten angezeigt. 50% Stichprobe LG0_Arbeitslose an Erwerbspersonen WB 00 in % Gültig Standardabweichung Varianz Grundüberlegung In jeder Zufallsstichprobe werden die e unterschiedlich h sein obwohl sie aus der selben Grundgesamtheit stammen 3 6,8687,8,045 Statistiken Grundgesamtheit LG0_Arbeitslose an Erwerbspersonen WB 00 in % Gültig Median Modus Standardabweichung Schiefe Standardfehler der Schiefe Kurtosis Standardfehler der Kurtosis Sind die Werte in der Grundgesamtheit normalverteilt, So sind auch die e aus den Stichproben (Gruppen) normalverteilt der Verteilung der Gruppenmittelwerte = -Grundgesamtheit 44 7,849,8396,65 a,56 -,067 Statistiken a. Mehrere Modi vorhanden. Der kleinste Wert wird Stichproben-e angezeigt. Gültig 0 0,843880,9 -,6,37 Anteil der Arbeitslosen (logarithmiert) - Stichproben-e Streuung der Gruppenmittelwerte und Stichprobengröße e Grundgesamtheit Stichprobe 50% Grundgesamtheit Stichprobe 5% Stichprobe 35% Stichprobe 50% e streuen mehr oder weniger um den der Grundgesamtheit Streuung der Stichprobenmittelwerte von Streuung der Werte in der Grundgesamtheit Je größer die Streuung der Werte in der Grundgesamtheit Umso größer wird die Streuung der Stichprobenmittelwerte sein Größ öße e der Stichprobe Extremfälle Größ öße e der Stichprobe =» = der jeweils einzelne Wert» e der Gruppen streuen gleich wie Grundgesamtheit Größ öße e der Stichproben = jeweils alle Fälle F der Grundgesamtheit Streuung der e = 0 Mit abnehmender Streuung der Werte in der Grundgesamtheit Mit steigendem/r Umfang/Größe der Stichprobe wird die Streuung der Gruppenmittelwerte um den der Grundgesamtheit abnehmen 5

15 Anteil der Arbeitslosen (logarithmiert) Anteil der Arbeitslosen (logarithmiert) Häufigkeiten 5% Statistiken Stichprobe LG0_Arbeitslose an Erwerbspersonen WB 00 in % Gültig Standardabweichung Varianz Häufigkeiten 35% Statistiken Stichprobe LG0_Arbeitslose an Erwerbspersonen WB 00 in % Gültig Standardabweichung Varianz 3,845,057,04 33,8394,43,049 Statistiken LG0_Arbeitslose an Erwerbspersonen WB 00 in % Gültig Median Modus Standardabweichung Schiefe Standardfehler der Schiefe Kurtosis Standardfehler der Kurtosis 44 7,849,8396,65 a,56 -,067,9 -,6,37 Stichprobe Wien a. Mehrere Modi vorhanden. Statistiken Der kleinste Wert wird angezeigt. LG0_Arbeitslose an Erwerbspersonen WB 00 in % Gültig Häufigkeiten 50% Statistiken Stichprobe Häufigkeiten 50% Stichprobe LG0_Arbeitslose an Erwerbspersonen WB 00 in % Gültig Standardabweichung Varianz 6 4,843,0967,044 Standardabweichung Varianz 3 6,8687,8,045 Stichprobe Umland Problemstellung: Handelt es sich bei den Verteilungen Anteil der Arbeitslosen um Zufallsstichproben aus einer Grundgesamtheit (Vienna Metropolitan Region)? Anteil der Arbeitslosen (logarithmiert) Anteil der Arbeitslosen (logarithmiert) Statistiken Statistiken Stichprobe Wien Statistiken a LG0_Arbeitslose an Erwerbspersonen WB 00 in % Gültig Standardabweichung Varianz a. region = wien 44 6,9667,685,08 LG0_Arbeitslose an Erwerbspersonen WB 00 in % Gültig Median Modus Standardabweichung Schiefe Standardfehler der Schiefe Kurtosis Standardfehler der Kurtosis 44 7,849,8396,65 a,56 -,067,9 -,6,37 Stichprobe Wien Statistiken a LG0_Arbeitslose an Erwerbspersonen WB 00 in % Gültig Standardabweichung Varianz a. region = wien 44 6,9667,685,08 LG0_Arbeitslose an Erwerbspersonen WB 00 in % Gültig Median Modus Standardabweichung Schiefe Standardfehler der Schiefe Kurtosis Standardfehler der Kurtosis 44 7,849,8396,65 a,56 -,067,9 -,6,37 Stichprobe Umland Statistiken a LG0_Arbeitslose an Erwerbspersonen WB 00 in % Gültig Standardabweichung Varianz a. region = umland 80,675,4868,0 a. Mehrere Modi vorhanden. Der kleinste Wert wird angezeigt. Problemstellung: Handelt es sich bei den Verteilungen Anteil der Arbeitslosen um Zufallsstichproben aus einer Grundgesamtheit (Vienna Metropolitan Region)? Stichprobe Umland Statistiken a LG0_Arbeitslose an Erwerbspersonen WB 00 in % Gültig Standardabweichung Varianz a. region = umland 80,675,4868,0 a. Mehrere Modi vorhanden. Der kleinste Wert wird angezeigt. Differenz der e bedingt durch: A) Differenz der Stichprobenmittelwerte durch das Wirken zufälliger Einflüsse von zwei unen ngigen (Zufalls)Stichproben( aus einer Grundgesamtheit 6

16 Anteil der Arbeitslosen (logarithmiert) t- Stichprobe Wien Statistiken a LG0_Arbeitslose an Erwerbspersonen WB 00 in % Gültig Standardabweichung Varianz a. region = umland Statistiken a LG0_Arbeitslose an Erwerbspersonen WB 00 in % Gültig Standardabweichung Varianz a. region = wien Stichprobe Umland 44 6,9667,685,08 80,675,4868,0 Statistiken LG0_Arbeitslose an Erwerbspersonen WB 00 in % Gültig Median Modus Standardabweichung Schiefe Standardfehler der Schiefe Kurtosis Standardfehler der Kurtosis a. Mehrere Modi vorhanden. Der kleinste Wert wird angezeigt. Differenz der e bedingt durch: B) Differenz der Stichprobenmittelwerte durch aus zwei Stichproben aus Grundgesamtheiten mit unterschiedlichen en 44 7,849,8396,65 a,56 -,067,9 -,6,37. t- nach STUDET Der t- nach STUDET dient zum Vergleich zweier uner Stichproben hinsichtlich ihrer e ullhypothese: Verteilungen unterscheiden sich nicht signifikant Alternativhypothese: Verteilungen unterscheiden sich signifikant = keine Zufallsstichproben aus ein- und derselben Grundgesamtheit = (Zufalls)Stichproben aus verschiedenen Grundgesamtheiten Berechnung der Prüfgr fgröße e t t- - Ausgangsüberlegung. t- nach STUDET Der t- nach STUDET dient zum Vergleich zweier uner Stichproben hinsichtlich ihrer e Berechnung der Prüfgr fgröße e t-wertes: t Sind die Gruppenmittelwerte gleich: t = 0 Bei Zufallsstichproben weder der Zufallsstichproben noch Varianz der Zufallsstichprobe durch Grundgesamtheit eindeutig determiniert (z.b.: von der Stichprobengröß öße e = Zahl der Fälle F in den Gruppen) jedoch nicht beliebig! t = x s x s + x Gruppe x Gruppe S Varianz (Standardabweichung) Gruppe S Varianz (Standardabweichung) Gruppe t-wert von: Empirischen en Standardabweichung (Varianzen) Umfang der Stichproben / Verteilungen t = x s x s + x Gruppe x Gruppe S Varianz (Standardabweichung) Gruppe S Varianz (Standardabweichung) Gruppe t-wert von: Empirischen en Standardabweichung (Varianz) Umfang der Stichproben / Verteilungen 7

17 t- - Ausgangsüberlegung In Abhängigkeit zur Stichprobengröß öße e gibt es für f r den t-wert t eine Zufallsverteilung Zufallsverteilung des t-wert t gibt an, mit welcher Wahrscheinlichkeit ein bestimmter t-wert t auftritt t- - Ausgangsüberlegung Mittels der Wahrscheinlichkeit des berechneten t-wertest prüft der t-, t ob: A) der Unterschied zwischen den Gruppen zufällig ist - Zufallsstichproben aus einer Grundgesamtheit Gauss sche verteilung t-verteilung nach Student (Freiheitsgrad größer) t-verteilung nach Student (Freiheitsgrad kleiner) t = x s x s + x Gruppe x Gruppe S Varianz (Standardabweichung) Gruppe S Varianz (Standardabweichung) Gruppe t-wert von: Empirischen en Varianzen Umfang der Stichproben / Verteilungen t = x s x s + x Gruppe x Gruppe S Varianz (Standardabweichung) Gruppe S Varianz (Standardabweichung) Gruppe t-wert von: Empirischen en Varianzen Umfang der Stichproben / Verteilungen t- - Ausgangsüberlegung Mittels der Wahrscheinlichkeit des berechneten t-wertest prüft der t-, t ob: B) Ob der Unterschied zwischen den Gruppen nicht zufällig ist Beispiel Unterschied Arbeitslose Wien vs. Umland FRAGESTELLUG: Gibt es einen signifikanten Unterschied in der Verteilung des (logarithmierten) Anteils der Arbeitslosen t = x s x s + x Gruppe x Gruppe S Varianz (Standardabweichung) Gruppe S Varianz (Standardabweichung) Gruppe t-wert von: Empirischen en Varianzen Umfang der Stichproben / Verteilungen zwischen Wien und den Umlandgemeinden? 8

18 Beispiel Unterschied Arbeitslose Wien vs. Umland Beispiel Unterschied Arbeitslose Wien vs. Umland T- Beispiel Unterschied Arbeitslose Wien vs. Umland FRAGESTELLUG: Gibt es einen signifikanten Unterschied in der Verteilung des (logarithmierten) Anteils der Arbeitslosen Statistiken a LG0_Arbeitslose an Erwerbspersonen WB Gültig 44 6,9667 Standardabweichung Varianz,685,08 a. region = wien t = x x s s + Statistiken a LG0_Arbeitslose an Erwerbspersonen WB Gültig 44 6,9667 Standardabweichung Varianz,685,08 a. region = wien zwischen Wien und den Umlandgemeinden? Statistiken a LG0_Arbeitslose an Erwerbspersonen WB Gültig 80,675 Standardabweichung Varianz,4868,0 a. region = umland t = ² 0,4868² = 0.96 = Statistiken a LG0_Arbeitslose an Erwerbspersonen WB Gültig 80,675 Standardabweichung Varianz,4868,0 a. region = umland Beispiel Unterschied Arbeitslose Wien vs. Umland T--SPSS Gruppenstatistiken Beispiel Unterschied Arbeitslose Wien vs. Umland T- Beispiel Unterschied Arbeitslose Wien vs. Umland Gruppenstatistiken t = x x s s + LG0_Arbeitslose an Erwerbspersonen WB 00 in % region wien umland 44,9667,685, ,675,4868,008 Statistiken a LG0_Arbeitslose an Erwerbspersonen WB Gültig 44 6,9667 Standardabweichung Varianz,685,08 a. region = wien Standardab weichung Standardfe hler des es t = x x s s + LG0_Arbeitslose an Erwerbspersonen WB 00 in % region wien umland bei unen Stichproben Standardfe Standardab hler des weichung es 44,9667,685, ,675,4868,008 t = ² 0,4868² = 0.96 = Statistiken a LG0_Arbeitslose an Erwerbspersonen WB Gültig 80,675 Standardabweichung Varianz,4868,0 a. region = umland LG0_Arbeitslose Erwerbspersonen WB 00 in % Varianzen sind gle Varianzen sind nic gleich Levene- der Varianzgleichheit T- für die gleichheit 5% Konfidenzinterva Mittlere Standardfehle der Differenz F Signifikanz T df Sig. (-seitig) Differenz r der Differenz Untere Obere 4,0,04 8,50 4,000,959,0576,606,357 8, ,657,000,959,0547,69,399 T-Wert wird unter der Annahme Varianzen sind nicht gleich ausgewiesen 9

19 Beispiel Unterschied Arbeitslose Wien vs. Umland T- Beispiel Unterschied Arbeitslose Wien vs. Umland Beispiel Unterschied Arbeitslose Wien vs. Umland T- Beispiel Unterschied Arbeitslose Wien vs. Umland t = x x s s + LG0_Arbeitslose an Erwerbspersonen WB 00 in % region wien umland Gruppenstatistiken Standardfe Standardab hler des weichung es 44,9667,685, ,675,4868,008 LG0_Arbeitslose an Erwerbspersonen WB 00 in % region wien umland Gruppenstatistiken Standardfe Standardab hler des weichung es 44,9667,685, ,675,4868,008 Unter der Annahme Varianzen sind gleich (= homogen homogen ) erfolgt eine etwas andere - genauere Berechung des t-wertes Entscheidung über Homogenität der Varianzen mittels F- F-: Berechnung des F-Wertes: s F = s major min or ² ² S major größere der beiden Standardabweichungen S minor kleinere der beiden Standardabweichungen LG0_Arbeitslose Erwerbspersonen WB 00 in % Varianzen sind gle Varianzen sind nic gleich bei unen Stichproben Levene- der Varianzgleichheit T- für die gleichheit 5% Konfidenzinterva Mittlere Standardfehle der Differenz F Signifikanz T df Sig. (-seitig) Differenz r der Differenz Untere Obere 4,0,04 8,50 4,000,959,0576,606,357 8, ,657,000,959,0547,69,399 LG0_Arbeitslose Erwerbspersonen WB 00 in % Varianzen sind gle Varianzen sind nic gleich bei unen Stichproben Levene- der Varianzgleichheit T- für die gleichheit 5% Konfidenzinterva Mittlere Standardfehle der Differenz F Signifikanz T df Sig. (-seitig) Differenz r der Differenz Untere Obere 4,0,04 8,50 4,000,959,0576,606,357 8, ,657,000,959,0547,69,399 Beispiel Unterschied Arbeitslose Wien vs. Umland T- Beispiel Unterschied Arbeitslose Wien vs. Umland Beispiel Unterschied Arbeitslose Wien vs. Umland T- Beispiel Unterschied Arbeitslose Wien vs. Umland t = x x s s + LG0_Arbeitslose an Erwerbspersonen WB 00 in % region wien umland Gruppenstatistiken Standardfe Standardab hler des weichung es 44,9667,685, ,675,4868,008 t = x x s s + LG0_Arbeitslose an Erwerbspersonen WB 00 in % region wien umland Gruppenstatistiken Standardfe Standardab hler des weichung es 44,9667,685, ,675,4868,008 Levene-: prüft auf Signifikanz des F-WertesF F- - ullhypothese: Varianzen sind in der Grundgesamtheit homogen LG0_Arbeitslose Erwerbspersonen WB 00 in % Varianzen sind gle Varianzen sind nic gleich bei unen Stichproben Levene- der Varianzgleichheit T- für die gleichheit 5% Konfidenzinterva Mittlere Standardfehle der Differenz F Signifikanz T df Sig. (-seitig) Differenz r der Differenz Untere Obere 4,0,04 8,50 4,000,959,0576,606,357 F- - Ergebnis: Signifikanz < 0.05 Annahme der Alternativhypothes: Varianzen sind nicht gleich 8, ,657,000,959,0547,69,399 LG0_Arbeitslose Erwerbspersonen WB 00 in % Varianzen sind gle Varianzen sind nic gleich bei unen Stichproben Levene- der Varianzgleichheit T- für die gleichheit 5% Konfidenzinterva Mittlere Standardfehle der Differenz F Signifikanz T df Sig. (-seitig) Differenz r der Differenz Untere Obere 4,0,04 8,50 4,000,959,0576,606,357 8, ,657,000,959,0547,69,399 Signifikanzprüfung fung des T-Wert T unter der Annahme Varianzen sind nicht gleich 0

20 Beispiel Unterschied Arbeitslose Wien vs. Umland T- Beispiel Unterschied Arbeitslose Wien vs. Umland t = x x s s + LG0_Arbeitslose an Erwerbspersonen WB 00 in % region wien umland Gruppenstatistiken Standardfe Standardab hler des weichung es 44,9667,685, ,675,4868,008 Beispiel Unterschied Arbeitslose Wien vs. Umland T- Beispiel Unterschied Arbeitslose Wien vs. Umland LG0_Arbeitslose Erwerbspersonen WB 00 in % Varianzen sind gle Varianzen sind nic gleich bei unen Stichproben Levene- der Varianzgleichheit T- für die gleichheit 5% Konfidenzinterva Mittlere Standardfehle der Differenz F Signifikanz T df Sig. (-seitig) Differenz r der Differenz Untere Obere 4,0,04 8,50 4,000,959,0576,606,357 8, ,657,000,959,0547,69,399 LG0_Arbeitslose Erwerbspersonen WB 00 in % Varianzen sind gle Varianzen sind nic gleich bei unen Stichproben Levene- der Varianzgleichheit T- für die gleichheit 5% Konfidenzinterva Mittlere Standardfehle der Differenz F Signifikanz T df Sig. (-seitig) Differenz r der Differenz Untere Obere 4,0,04 8,50 4,000,959,0576,606,357 8, ,657,000,959,0547,69,399 Ergebnis: Signifikanz des T-WertesT <0.00 Ergebnis: Die Verteilungen des Anteils Arbeitslosen unterscheidet sich signifkant zwischen Wien und den Umlandgemeinden Beispiel Unterschied Schüler Höherer H Schulen Wien vs. Umland Beispiel Unterschied Schüler Höherer H Schulen Wien vs. Umland FRAGESTELLUG: Gibt es einen signifikanten Unterschied in der Verteilung des Anteils der Schüler Höherer Schulen Anteil high school students an Wohnbevölkerung 5-9 Jahre region wien umland Gruppenstatistiken Standardab weichung Standardfe hler des es 44 43,7 3,34389, ,43 9,5596,7073 Anteil high school students an Wohnbevölkerung 5-9 Jahre bei unen Stichproben Levene- der Varianzgleichheit T- für die gleichheit 95% Konfidenzintervall Mittlere Standardfehle der Differenz F Signifikanz T df Sig. (-seitig) Differenz r der Differenz Untere Obere Varianzen sind gleic 4,858,000,680 43,497,7949,64 -, ,07966 Varianzen sind nich gleich,74 4,389,476,7949,0907 -,38850,9748 zwischen Wien und den Umlandgemeinden? F- - Ergebnis: Signifikanz < 0.05 Annahme der Alternativhypothes: Varianzen sind nicht gleich

21 Beispiel Unterschied Schüler Höherer H Schulen Wien vs. Umland Beispiel Unterschied Schüler H ler Höherer Schulen Wien vs. Umland bei unen Stichproben Anteil high school students an Wohnbevölkerung 5-9 Jahre region wien umland Gruppenstatistiken Standardab weichung Standardfe hler des es 44 43,7 3,34389, ,43 9,5596,7073 Anteil high school students an Wohnbevölkerung 5-9 Jahre Levene- der Varianzgleichheit T- für die gleichheit 95% Konfidenzintervall Mittlere Standardfehle der Differenz F Signifikanz T df Sig. (-seitig) Differenz r der Differenz Untere Obere Varianzen sind gleic 4,858,000,680 43,497,7949,64 -, ,07966 Varianzen sind nich gleich,74 4,389,476,7949,0907 -,38850,9748 Anteil high school students an Wohnbevölkerung 5-9 Jahre bei unen Stichproben Levene- der Varianzgleichheit T- für die gleichheit 95% Konfidenzintervall Mittlere Standardfehle der Differenz F Signifikanz T df Sig. (-seitig) Differenz r der Differenz Untere Obere Varianzen sind gleic 4,858,000,680 43,497,7949,64 -, ,07966 Varianzen sind nich gleich,74 4,389,476,7949,0907 -,38850,9748 Ergebnis: Signifikanz des T-WertesT >0.05 Ergebnis: Die Verteilungen des Anteils der Schüler an Höheren Schulen unterscheidet sich nicht signifkant zwischen Wien und den Umlandgemeinden

22 II Beispiel Unterschied Arbeitslose Wien vs. Umland FRAGESTELLUG: Gibt es einen Unterschied zwischen den Wohngebieten der wenig qualifizierten Inländer zwischen 97 und 00 Einführung in die statistische Datenanalyse II (VU) II Vergleich von intervallskalierten Stichproben/Verteilungen hinsichtlich ihrer zentralen Tendenz Beim Vergleich von Verteilungen z.b.: hinsichtlich ihrer e bzw. Mediane (allgemein: zentrale Tendenz) werden drei Differenzierungen relevant: Übersicht verfahren für intervallskalierte Daten Verteilung Zahl der Verteilungen > > Abhängigkeit un un t- nach Student t- für e Stichproben einfache Varianzanalyse doppelte Varianzanalyse (a) une - e Verteilungen (b) Vergleich zweier oder mehrerer Verteilungen (c) normal - beliebig verteilte Werte > > un un U- von MA und Whitney WILCOXO- für Paardifferenzen H- KRUSKAL und WALLIS, Median- FRIEDMA-

23 Beispiel Unterschied Arbeitslose Wien vs. Umland. Schritt: Feststellung der Verteilungsform Beispiel Unterschied Arbeitslose Wien vs. Umland. Schritt: Wie viele Verteilungen werden miteinander verglichen? Verteilung Zahl der Verteilungen Abhängigkeit un t- nach Student Verteilung Zahl der Verteilungen Abhängigkeit un t- nach Student t- für e Stichproben t- für e Stichproben > un einfache Varianzanalyse > un einfache Varianzanalyse > doppelte Varianzanalyse > doppelte Varianzanalyse un U- von MA und Whitney un U- von MA und Whitney WILCOXO- für Paardifferenzen WILCOXO- für Paardifferenzen > > un H- KRUSKAL und WALLIS, Median- FRIEDMA- > > un H- KRUSKAL und WALLIS, Median- FRIEDMA- Anteil der wenig Qualifizierten 97 und 00 verteilung zunächst angenommen (s.u( s.u.).) Zahl der Verteilungen: :, Verteilung wenig Qualifizierte wenig Qualifizierte 00 Beispiel Unterschied Arbeitslose Wien vs. Umland. Schritt Wie viele Verteilungen werden miteinander verglichen? Beispiel Unterschied Arbeitslose Wien vs. Umland 3. Schritt: Sind die Verteilungen (Stichproben) oder un? Verteilung Zahl der Verteilungen Abhängigkeit un t- nach Student Verteilung Zahl der Verteilungen Abhängigkeit un t- nach Student t- für e Stichproben t- für e Stichproben > un einfache Varianzanalyse > un einfache Varianzanalyse > doppelte Varianzanalyse > doppelte Varianzanalyse un U- von MA und Whitney un U- von MA und Whitney WILCOXO- für Paardifferenzen WILCOXO- für Paardifferenzen > > un H- KRUSKAL und WALLIS, Median- FRIEDMA- > > un H- KRUSKAL und WALLIS, Median- FRIEDMA- Zahl der Verteilungen: :, wenig Qualifizierte wenig Qualifizierte 00

24 vs. un: Un: Verteilungen (Stichproben) stammen von verschiedenen Gruppen = verschiedenen FällenF Der unterschied der Verteilung EIES Merkmales zwischen verschiedenen Gruppen ( Fällen )) wird geprüft Abhängig: Verteilungen (Stichproben) stammen aus EIER Gruppe (Grundgesamtheit) =gleiche FälleF Der unterschied der Verteilung MEHRERER Merkmale innerhalb ein- und derselben Gruppe (Grundgesamtheit) wird geprüft 3. Schritt: Sind die Verteilungen (Stichproben) oder un? Verteilung Beispiel Unterschied Arbeitslose Wien vs. Umland Zahl der Verteilungen > > Abhängigkeit un un un t- nach Student t- für e Stichproben einfache Varianzanalyse doppelte Varianzanalyse U- von MA und Whitney WILCOXO- für Paardifferenzen > > un H- KRUSKAL und WALLIS, Median- FRIEDMA- Unterschied der Verteilung von Variablen (wenig Qualifizierte 97 und 00) innerhalb Gruppe (Zählbezirke Wien) wird verglichen -> Verteilungen: Beispiel Unterschied Arbeitslose Wien vs. Umland 3. Schritt: Sind die Verteilungen (Stichproben) oder un? Beispiel Unterschied Arbeitslose Wien vs. Umland 4. Schritt: Auswahl des verfahrens Verteilung Zahl der Verteilungen Abhängigkeit un t- nach Student Verteilung Zahl der Verteilungen Abhängigkeit un t- nach Student t- für e Stichproben t- für e Stichproben > un einfache Varianzanalyse > un einfache Varianzanalyse > doppelte Varianzanalyse > doppelte Varianzanalyse un U- von MA und Whitney un U- von MA und Whitney WILCOXO- für Paardifferenzen WILCOXO- für Paardifferenzen > > un H- KRUSKAL und WALLIS, Median- FRIEDMA- > > un H- KRUSKAL und WALLIS, Median- FRIEDMA- Unterschied der Verteilung von Variablen (wenig Qualifizierte 97 und 00) innerhalb Gruppe (Zählbezirke Wien) wird verglichen -> Verteilungen: ahbhängig 3

25 t- für f r e Verteilungen ngige Verteilungen ngige Verteilungen t- für f r e Verteilungen Der t- für e Stichproben vergleicht e von Verteilungen durch Berechung der gepoolten Varianzen (Paarvergleiche) Der t- für e Stichproben vergleicht e von Verteilungen durch Berechung der gepoolten Varianzen (Paarvergleiche) ullhypothese: Verteilungen unterscheiden sich nicht signifikant Alternativhypothese: Verteilungen unterscheiden sich signifikant = keine Zufallsstichproben aus ein- und derselben Grundgesamtheit = (Zufalls)Stichproben aus verschiedenen Grundgesamtheiten t t-wert ergibt sich aus Bildung der Differenz der gepaarten Werte Berechung des es dieser Differenzen ormierung durch» Standardabweichung der Differenzen» Zahl der Fälle F = d s n d zwischen den Differenzen zwischen den beiden Variablen in den einzelnen Fällen s n Standardabweichung der Differenzen der Variablen Zahl der gültigen Fälle t- für f r e Verteilungen t- für f r e Verteilungen Der t- für e Stichproben vergleicht e von Verteilungen durch Berechung der gepoolten Varianzen (Paarvergleiche) t-wert ergibt sich aus Bildung der Differenz der gepaarten Werte Berechung des es dieser Differenzen ormierung durch» Standardabweichung der Differenzen» Zahl der Fälle F Der t- für e Stichproben vergleicht e von Verteilungen durch Berechung der gepoolten Varianzen (Paarvergleiche) t-wert ergibt sich aus dif_low_skilled7_0 Bildung der Differenz der gepaarten Werte» Standardabweichung der Differenzen» Zahl der Fälle F Statistiken Gültig Berechung des es dieser Differenzen ormierung durch Standardabweichung ,4083 6,67894 t = d s n d zwischen den Differenzen zwischen den beiden Variablen in den einzelnen Fällen s n Standardabweichung der Differenzen der Variablen Zahl der gültigen Fälle t = d s n d zwischen den Differenzen zwischen den beiden Variablen in den einzelnen Fällen s n Standardabweichung der Differenzen der Variablen Zahl der gültigen Fälle 4

26 t- für f r e Verteilungen t- für f r e Verteilungen Standardabweichung wobei: der Differenzen zwischen den Variablen in den einzelnen Fällen ist gleich der Differenz der e der beiden Variablen d Gültig Statistiken = x x = ,057 dif_low_skilled7_0 wenig wenig Qualifizierte Qualifizierte Standardabweichung ,4654 4,057 8,557 5,756 d zwischen den Differenzen zwischen den beiden Variablen in den einzelnen Fällen x der Variable x Statistiken Gültig der Variable ,4083 6,67894 Voraussetzung: Differenzen zwischen den Variablen in den einzelnen Fällen Müssen aus einer verteilung entsprechen VARIATE A: Differenzen von zwei normalverteilten Verteilungen sind ebenfalls normalverteilt VARIATE B der Differenzen auf verteilung K-S Parameter der verteilung a,b Kolmogorov-Smirnov-Anpassungstest Standardabweichung Extremste Differenzen Absolut Positiv egativ Kolmogorov-Smirnov-Z Asymptotische Signifikanz (-seitig) a. Die zu testende Verteilung ist eine verteilung. b. Aus den Daten berechnet. dif_low_ skilled7_0 45 0,4083 6,67894,08,08 -,04,84,074 P > 0,05 Annahme der ullhypothese: Differenzen zwischen den Variablen sind normalverteilt t-wert für f r e Verteilungen - Berechnung Beispiel low-skilled T--SPSS Statistik bei gepaarten Stichproben t = = 47,8 T-TEST Ergebnis Paaren wenig Qualifizierte 97 wenig Qualifizierte 00 Standardfe Standardab hler des weichung es 44, ,557,5440 4, ,756,33064 Statistiken dif_low_skilled7_0 Standardabweichung t = d s Gültig n d zwischen den Differenzen zwischen den beiden Variablen in den einzelnen Fällen s n ,4083 6,67894 Standardabweichung der Differenzen der Variablen Zahl der gültigen Fälle Häufigkeitsanalyse der einzelnen Variablen Ergebnis Standardabweichung Gültig Statistiken wenig Qualifizierte wenig Qualifizierte ,4654 4,057 8,557 5,756 5

27 Beispiel low-skilled T--SPSS Beispiel low-skilled T--SPSS Paaren wenig Qualifizierte 97 wenig Qualifizierte 00 Statistik bei gepaarten Stichproben Standardfe Standardab hler des weichung es 44, ,557,5440 4, ,756,33064 Anhand der t-verteilung wird überprüft,, ob der Unterschied zwischen den Verteilungen zufällig oder nicht zufällig zustande gekommen ist t d s n = t = = 47, bei gepaarten Stichproben = die Wahrscheinlichkeit des ermittelten t-wertes wird anhand der t-veteilung ermittelt Signifikanzprüfung fung des T-WertesT Wertes: bei gepaarten Stichproben Gepaarte Differenzen Paaren Gepaarte Differenzen Standardfe5% Konfidenzinterva Standardab hler des der Differenz weichung es Untere Obere T df Sig. (-seitig) wenig Qualifizierte 9 0,4083 6,67894,4670 9,5678, ,88 44,000 wenig Qualifizierte 0 Paaren Standardfe5% Konfidenzinterva Standardab hler des der Differenz weichung es Untere Obere T df Sig. (-seitig) wenig Qualifizierte 9 0,4083 6,67894,4670 9,5678, ,88 44,000 wenig Qualifizierte 0 Beispiel low-skilled T--SPSS SPSS SPSS Beispiel low-skilled T--SPSS Ergebnis,, die Wahrschinlichkeit das der ermittelte t-wert zufällig zustande gekommen ist = p < Ergebnis: Die Verteilungen der wenig Qualifizierten 97 und der wenig Qualifzierten 00unterscheiden sich signifikant = Annahme der Alternativhypothese bei gepaarten Stichproben Paaren Gepaarte Differenzen Standardfe5% Konfidenzinterva Standardab hler des der Differenz weichung es Untere Obere T df Sig. (-seitig) wenig Qualifizierte 9 0,4083 6,67894,4670 9,5678, ,88 44,000 wenig Qualifizierte 0 Paaren bei gepaarten Stichproben Gepaarte Differenzen Standardfe5% Konfidenzinterva Standardab hler des der Differenz weichung es Untere Obere T df Sig. (-seitig) wenig Qualifizierte 9 0,4083 6,67894,4670 9,5678, ,88 44,000 wenig Qualifizierte 0 6

28 Beispiel low-skilled T--SPSS Fragestellung Die Verteilungen der wenig Qualifizierten 00 ergibt sich durch die Verteilung der Gemeindewohnungen Social housing apartments, in % <= >= 8.08 vacant Inner city Inner districts Paaren Gemeindewohnungen 00 % - wenig Qualifizierte 00 bei gepaarten Stichproben Standardab weichung Gepaarte Differenzen Standardfe hler des 95% Konfidenzintervall der Differenz es Untere Obere T df Sig. (-seitig) -, ,9749,6 -,8683, ,396 44,69 7

29 II Beispiel Einkommensunterschied Wien vs. Umland FRAGESTELLUG: Gibt es einen signifikanten Einkommensunterschied zwischen Wien und den Umlandgemeinden? Einführung in die statistische Datenanalyse II (VU) Beispiel Einkommensunterschied Wien vs. Umland. Schritt: Feststellung der Verteilungsform Beispiel Einkommensunterschied Wien vs. Umland. Schritt: Feststellung der Verteilungsform K-S Kolmogorov-Smirnov-Anpassungstest Verteilung Zahl der Verteilungen > Abhängigkeit un un t- nach Student t- für e Stichproben einfache Varianzanalyse Parameter der verteilung a,b Standardabweichung income per capita 00/0et simated l_inc_cap 46 46,5358,0963,995,03968 > un doppelte Varianzanalyse U- von MA und Whitney WILCOXO- für Paardifferenzen Extremste Differenzen Absolut Positiv egativ Kolmogorov-Smirnov-Z Asymptotische Signifikanz (-seitig),5,34,5,34 -,099 -,086 3,9,775,000,000 > > un H- KRUSKAL und WALLIS, Median- FRIEDMA- a. Die zu testende Verteilung ist eine verteilung. b. Aus den Daten berechnet. Ergebnis: K-S S sowohl fürf income per capita, als auch fürf logarithmiertes income per capita signifikant. Annahme der Alternativhypothese: : Verteilung ist ICHT normalverteilt

30 Kolmogorov-Smirnov Smirnov- Parametergebundene vs. Parameterfreie verfahren Kolmogorov-Smirnov Smirnov- Ergebnis: Verteilungen von intervallskallierten Daten die einer verteilung entsprechen: Parametergebundene verfahren»» Varianz Verteilung Art der Abhängigkeit Stichproben > > un un t- nach Student t- für e Stichproben einfache Varianzanalyse doppelte Varianzanalyse Verteilungen von intervallskalierten Daten die keiner verteilung eilung entsprechen: Parameterfreie verfahren» Rangordnung von Daten > > un un U- von MA und Whitney WILCOXO- für Paardifferenzen H- KRUSKAL und WALLIS, Median- FRIEDMA- Parametergebundene Prüfverfahren Parameterfreie Prüfverfahren Beispiel Einkommensunterschied Wien vs. Umland. Schritt: Feststellung der Verteilungsform K-S Beispiel Einkommensunterschied Wien vs. Umland. Schritt: Wie viele Verteilungen werden miteinander verglichen? Zahl der Verteilungen: Verteilung Zahl der Verteilungen Abhängigkeit un t- nach Student Verteilung Zahl der Verteilungen Abhängigkeit un t- nach Student t- für e Stichproben t- für e Stichproben > un einfache Varianzanalyse > un einfache Varianzanalyse > doppelte Varianzanalyse > doppelte Varianzanalyse un U- von MA und Whitney un U- von MA und Whitney WILCOXO- für Paardifferenzen WILCOXO- für Paardifferenzen > > un H- KRUSKAL und WALLIS, Median- FRIEDMA- > > un H- KRUSKAL und WALLIS, Median- FRIEDMA-. Verteilung income per capita in Wien. Verteilung income per capita im Umland

31 3. Schritt: Sind die Verteilungen (Stichproben) oder un? Verteilung Beispiel Einkommensunterschied Wien vs. Umland Zahl der Verteilungen > > > > Abhängigkeit un un un un t- nach Student t- für e Stichproben einfache Varianzanalyse doppelte Varianzanalyse U- von MA und Whitney WILCOXO- für Paardifferenzen H- KRUSKAL und WALLIS, Median- FRIEDMA- vs. un: Un: Verteilungen (Stichproben) stammen von verschiedenen Gruppen = verschiedenen FällenF Der Unterschied der Verteilung EIES Merkmales zwischen verschiedenen Gruppen ( Fällen )) wird geprüft Abhängig: Verteilungen (Stichproben) stammen aus EIER Gruppe (Grundgesamtheit) =gleiche FälleF Der Unterschied der Verteilung MEHRERER Merkmale innerhalb ein- und derselben Gruppe (Grundgesamtheit) wird geprüft ULLHYPOTHESE: Es besteht KEI Unterschied zwischen den Verteilungen Beispiel Einkommensunterschied Wien vs. Umland 3. Schritt: Sind die Verteilungen (Stichproben) oder un? Beispiel Einkommensunterschied Wien vs. Umland 4. Schritt: Auswahl des verfahrens Verteilung Zahl der Verteilungen Abhängigkeit un t- nach Student Verteilung Zahl der Verteilungen Abhängigkeit un t- nach Student t- für e Stichproben t- für e Stichproben > un einfache Varianzanalyse > un einfache Varianzanalyse > doppelte Varianzanalyse > doppelte Varianzanalyse un U- von MA und Whitney un U- von MA und Whitney WILCOXO- für Paardifferenzen WILCOXO- für Paardifferenzen > > un H- KRUSKAL und WALLIS, Median- FRIEDMA- > > un H- KRUSKAL und WALLIS, Median- FRIEDMA- Unterschied der Verteilung einer Variable ( income per capita ) ) zwischen Gruppen (Stadt und Umland) wird verglichen -> Verteilungen: un ngig 3

32 Der U- U von MA und WHITEY Der U- U von MA und WHITEY Der U- von MA und WHITEY U- prüft auf Signifikanz des Unterschiedes von zwei unen Veteilungen / Stichproben die nicht die Voraussetzung der verteilung erfüllen müssen Das Prinzip des U-s ist die Ersetzung der gegebenen Variablenwerte durch Rangplätze Grundüberlegung Die Werte zweier Verteilungen (Stichproben) werden zu einer Folge zusammengefasst und nach aufsteigenden Werten geordnet und entsprechend der Rangordnung nach der Größ öße e der Werte mit Rangplätzen versehen Der U- U von MA und WHITEY Der U- U von MA und WHITEY Detail am Rande Die Rangplätze für f r gleiche Werte ergeben sich durch den der Rangplätze der gleichen Werte Wert.3;.3;.3 ;.3 Rangplätze 6; 7; 8; 9; =( )/4 =7.5= Grundüberlegung ullhypothese Die Abfolge der nach aufsteigender Größ öße geordneten Werte ist zufällig z.b. ach Gruppe a (Wien) folgt ein Wert der Gruppe b (Umland), usw. Allgemein: Gruppe a, Gruppe b, Gruppe a, Gruppe b, 4

Standardab er des. Testwert = 145.5 95% Konfidenzintervall. T df Sig. (2-seitig) Differenz Untere Obere -2.011 698.045-5.82-11.50 -.14.

Standardab er des. Testwert = 145.5 95% Konfidenzintervall. T df Sig. (2-seitig) Differenz Untere Obere -2.011 698.045-5.82-11.50 -.14. Aufgabe : einfacher T-Test Statistik bei einer Stichprobe Standardfehl Standardab er des Mittelwert weichung Mittelwertes 699 39.68 76.59 2.894 Test bei einer Sichprobe Testwert = 45.5 95% Konfidenzintervall

Mehr

Einführung in die statistische Datenanalyse I

Einführung in die statistische Datenanalyse I Einführung in die statistische Datenanalyse I Inhaltsverzeichnis 1. EINFÜHRUNG IN THEORIEGELEITETES WISSENSCHAFTLICHES ARBEITEN 2 2. KRITIERIEN ZUR AUSWAHL STATISTISCH METHODISCHER VERFAHREN 2 3. UNIVARIATE

Mehr

Grundlagen quantitativer Sozialforschung Interferenzstatistische Datenanalyse in MS Excel

Grundlagen quantitativer Sozialforschung Interferenzstatistische Datenanalyse in MS Excel Grundlagen quantitativer Sozialforschung Interferenzstatistische Datenanalyse in MS Excel 16.11.01 MP1 - Grundlagen quantitativer Sozialforschung - (4) Datenanalyse 1 Gliederung Datenanalyse (inferenzstatistisch)

Mehr

Einfache statistische Auswertungen mit dem Programm SPSS

Einfache statistische Auswertungen mit dem Programm SPSS Einfache statistische Auswertungen mit dem Programm SPSS Datensatz: fiktive_daten.sav Dipl. Päd. Anne Haßelkus Dr. Dorothea Dette-Hagenmeyer 11/2011 Überblick 1 Deskriptive Statistiken; Mittelwert berechnen...

Mehr

Anhang A: Fragebögen und sonstige Unterlagen

Anhang A: Fragebögen und sonstige Unterlagen Anhang Anhang A: Fragebögen und sonstige Unterlagen A.: Flyer zur Probandenrekrutierung 46 A.: Fragebogen zur Meditationserfahrung 47 48 A.3: Fragebogen Angaben zur Person 49 5 5 A.4: Termin- und Einladungsschreiben

Mehr

METHODENLEHRE I WS 2013/14 THOMAS SCHÄFER

METHODENLEHRE I WS 2013/14 THOMAS SCHÄFER METHODENLEHRE I WS 2013/14 THOMAS SCHÄFER DAS THEMA: INFERENZSTATISTIK IV INFERENZSTATISTISCHE AUSSAGEN FÜR ZUSAMMENHÄNGE UND UNTERSCHIEDE Inferenzstatistik für Zusammenhänge Inferenzstatistik für Unterschiede

Mehr

6. METRISCHE UND KATEGORIALE MERKMALE

6. METRISCHE UND KATEGORIALE MERKMALE 6. METRISCHE UND KATEGORIALE MERKMALE wenn an einer Beobachtungseinheit eine (oder mehrere) metrische und eine (oder mehrere) kategoriale Variable(n) erhoben wurden Beispiel: Haushaltsarbeit von Teenagern

Mehr

Signifikanztests zur Prüfung von Unterschieden in der zentralen Tendenz -Teil 1-

Signifikanztests zur Prüfung von Unterschieden in der zentralen Tendenz -Teil 1- SPSSinteraktiv Signifikanztests (Teil ) - - Signifikanztests zur Prüfung von Unterschieden in der zentralen Tendenz -Teil - t-test bei einer Stichprobe - SPSS-Output Der t-test bei einer Stichprobe wird

Mehr

Business Value Launch 2006

Business Value Launch 2006 Quantitative Methoden Inferenzstatistik alea iacta est 11.04.2008 Prof. Dr. Walter Hussy und David Tobinski UDE.EDUcation College im Rahmen des dokforums Universität Duisburg-Essen Inferenzstatistik Erläuterung

Mehr

Marktforschung I. Marktforschung I 2

Marktforschung I. Marktforschung I 2 Marktforschung I Marktforschung I Einführung in die Testtheorie (Toporowski) Mathematische Grundlagen (Toporowski) Varianzanalyse (Toporowski) Regressionsanalyse (Boztuğ) Diskriminanzanalyse (Hammerschmidt)

Mehr

Willkommen zur Vorlesung Statistik (Master)

Willkommen zur Vorlesung Statistik (Master) Willkommen zur Vorlesung Statistik (Master) Thema dieser Vorlesung: Verteilungsfreie Verfahren Prof. Dr. Wolfgang Ludwig-Mayerhofer Universität Siegen Philosophische Fakultät, Seminar für Sozialwissenschaften

Mehr

Häufigkeitsauszählungen, zentrale statistische Kennwerte und Mittelwertvergleiche

Häufigkeitsauszählungen, zentrale statistische Kennwerte und Mittelwertvergleiche Lehrveranstaltung Empirische Forschung und Politikberatung der Universität Bonn, WS 2007/2008 Häufigkeitsauszählungen, zentrale statistische Kennwerte und Mittelwertvergleiche 30. November 2007 Michael

Mehr

Weitere (wählbare) Kontraste in der SPSS Prozedur Allgemeines Lineares Modell

Weitere (wählbare) Kontraste in der SPSS Prozedur Allgemeines Lineares Modell Einfaktorielle Versuchspläne 27/40 Weitere (wählbare) Kontraste in der SPSS Prozedur Allgemeines Lineares Modell Abweichung Einfach Differenz Helmert Wiederholt Vergleich Jede Gruppe mit Gesamtmittelwert

Mehr

Grundlagen von Versuchsmethodik und Datenanalyse

Grundlagen von Versuchsmethodik und Datenanalyse Grundlagen von Versuchsmethodik und Datenanalyse Der Anfang: Hypothesen über Ursache-Wirkungs-Zusammenhänge Ursache Wirkung Koffein verbessert Kurzzeitgedächtnis Gewaltfilme führen zu aggressivem Verhalten

Mehr

12. Vergleich mehrerer Stichproben

12. Vergleich mehrerer Stichproben 12. Vergleich mehrerer Stichproben Dr. Antje Kiesel Institut für Angewandte Mathematik WS 2011/2012 Häufig wollen wir verschiedene Populationen, Verfahren, usw. miteinander vergleichen. Beipiel: Vergleich

Mehr

Eine Einführung in R: Statistische Tests

Eine Einführung in R: Statistische Tests Eine Einführung in R: Statistische Tests Bernd Klaus, Verena Zuber Institut für Medizinische Informatik, Statistik und Epidemiologie (IMISE), Universität Leipzig http://www.uni-leipzig.de/ zuber/teaching/ws12/r-kurs/

Mehr

UE Angewandte Statistik Termin 4 Gruppenvergleichstests

UE Angewandte Statistik Termin 4 Gruppenvergleichstests UE Angewandte Statistik Termin 4 Gruppenvergleichstests Martina Koller Institut für Pflegewissenschaft SoSe 2015 INHALT 1 Allgemeiner Überblick... 1 2 Normalverteilung... 2 2.1 Explorative Datenanalyse...

Mehr

Lösungen zu Janssen/Laatz, Statistische Datenanalyse mit SPSS 1

Lösungen zu Janssen/Laatz, Statistische Datenanalyse mit SPSS 1 LÖSUNG 3A Lösungen zu Janssen/Laatz, Statistische Datenanalyse mit SPSS 1 Mit den Berechnungsfunktionen LG10(?) und SQRT(?) in "Transformieren", "Berechnen" können logarithmierte Werte sowie die Quadratwurzel

Mehr

Prüfen von Mittelwertsunterschieden: t-test

Prüfen von Mittelwertsunterschieden: t-test Prüfen von Mittelwertsunterschieden: t-test Sven Garbade Fakultät für Angewandte Psychologie SRH Hochschule Heidelberg sven.garbade@hochschule-heidelberg.de Statistik 1 S. Garbade (SRH Heidelberg) t-test

Mehr

Übungsserie Nr. 10 mit Lösungen

Übungsserie Nr. 10 mit Lösungen Übungsserie Nr. 10 mit Lösungen 1 Ein Untersuchungsdesign sieht einen multivariaten Vergleich einer Stichprobe von Frauen mit einer Stichprobe von Männern hinsichtlich der Merkmale X1, X2 und X3 vor (Codierung:

Mehr

Überblick über die Verfahren für Ordinaldaten

Überblick über die Verfahren für Ordinaldaten Verfahren zur Analyse ordinalskalierten Daten 1 Überblick über die Verfahren für Ordinaldaten Unterschiede bei unabhängigen Stichproben Test U Test nach Mann & Whitney H Test nach Kruskal & Wallis parametrische

Mehr

T-TEST BEI EINER STICHPROBE:

T-TEST BEI EINER STICHPROBE: Kapitel 19 T-Test Mit Hilfe der T-TEST-Prozeduren werden Aussagen über Mittelwerte getroffen. Dabei wird versucht, aus den Beobachtungen einer Stichprobe Rückschlüsse auf die Grundgesamtheit zu ziehen.

Mehr

Bitte schreiben Sie in Druckbuchstaben und vergessen Sie nicht zu unterschreiben. Name, Vorname:. Studiengang/ Semester:. Matrikelnummer:..

Bitte schreiben Sie in Druckbuchstaben und vergessen Sie nicht zu unterschreiben. Name, Vorname:. Studiengang/ Semester:. Matrikelnummer:.. Institut für Erziehungswissenschaft der Philipps-Universität Marburg Prof. Dr. Udo Kuckartz Arbeitsbereich Empirische Pädagogik/Methoden der Sozialforschung Wintersemester 004/005 KLAUSUR FEBRUAR 005 /

Mehr

Varianzanalytische Methoden Zweifaktorielle Versuchspläne 4/13. Durchführung in SPSS (File Trait Angst.sav)

Varianzanalytische Methoden Zweifaktorielle Versuchspläne 4/13. Durchführung in SPSS (File Trait Angst.sav) Zweifaktorielle Versuchspläne 4/13 Durchführung in SPSS (File Trait Angst.sav) Analysieren > Allgemeines Lineares Modell > Univariat Zweifaktorielle Versuchspläne 5/13 Haupteffekte Geschlecht und Gruppe

Mehr

SPSS III Mittelwerte vergleichen

SPSS III Mittelwerte vergleichen SPSS III Mittelwerte vergleichen A Zwei Gruppen ------------ Zwei-Stichproben t-test Beispieldatei: Seegräser Fragestellung: Unterscheidet sich die Anzahl der Seegräser in Gebieten mit und ohne Seeigelvorkommen

Mehr

Überblick über die Tests

Überblick über die Tests Anhang A Überblick über die Tests A.1 Ein-Stichproben-Tests A.1.1 Tests auf Verteilungsannahmen ˆ Shapiro-Wilk-Test Situation: Test auf Normalverteilung H 0 : X N(µ, σ 2 ) H 1 : X nicht normalverteilt

Mehr

Grundlagen der Inferenzstatistik

Grundlagen der Inferenzstatistik Grundlagen der Inferenzstatistik (Induktive Statistik oder schließende Statistik) Dr. Winfried Zinn 1 Deskriptive Statistik versus Inferenzstatistik Die Deskriptive Statistik stellt Kenngrößen zur Verfügung,

Mehr

5.2. Nichtparametrische Tests. 5.2.1. Zwei unabhängige Stichproben: U- Test nach MANN- WHITNEY

5.2. Nichtparametrische Tests. 5.2.1. Zwei unabhängige Stichproben: U- Test nach MANN- WHITNEY 5.2. Nichtparametrische Tests 5.2.1. Zwei unabhängige Stichproben: U- Test nach MANN- WHITNEY Voraussetzungen: - Die Verteilungen der beiden Grundgesamtheiten sollten eine ähnliche Form aufweisen. - Die

Mehr

Skriptum zur Veranstaltung. Quantitative Methoden (Mathematik/Statistik) Teil Induktive Statistik. 1. Version (mehr Draft als Skriptum)

Skriptum zur Veranstaltung. Quantitative Methoden (Mathematik/Statistik) Teil Induktive Statistik. 1. Version (mehr Draft als Skriptum) Skriptum zur Veranstaltung Quantitative Methoden (Mathematik/Statistik) Teil Induktive Statistik 1. Version (mehr Draft als Skriptum) Anmerkungen, Aufzeigen von Tippfehlern und konstruktive Kritik erwünscht!!!

Mehr

Vergleiche von Gruppen hinsichtlich Ihrer zentralen Tendenz

Vergleiche von Gruppen hinsichtlich Ihrer zentralen Tendenz Vergleiche von Gruppen hinsichtlich Ihrer zentralen Tendenz Im folgenden sollen Analyseverfahren dargestellt werden, die zwei oder mehr Gruppen hinsichtlich ihrer zentralen Tendenz in einer einzelnen Variablen

Mehr

Franz Kronthaler. Statistik angewandt. Datenanalyse ist (k)eine Kunst. Excel Edition. ^ Springer Spektrum

Franz Kronthaler. Statistik angewandt. Datenanalyse ist (k)eine Kunst. Excel Edition. ^ Springer Spektrum Franz Kronthaler Statistik angewandt Datenanalyse ist (k)eine Kunst Excel Edition ^ Springer Spektrum Inhaltsverzeichnis Teil I Basiswissen und Werkzeuge, um Statistik anzuwenden 1 Statistik ist Spaß 3

Mehr

Konfidenzintervalle Grundlegendes Prinzip Erwartungswert Bekannte Varianz Unbekannte Varianz Anteilswert Differenzen von Erwartungswert Anteilswert

Konfidenzintervalle Grundlegendes Prinzip Erwartungswert Bekannte Varianz Unbekannte Varianz Anteilswert Differenzen von Erwartungswert Anteilswert Konfidenzintervalle Grundlegendes Prinzip Erwartungswert Bekannte Varianz Unbekannte Varianz Anteilswert Differenzen von Erwartungswert Anteilswert Beispiel für Konfidenzintervall Im Prinzip haben wir

Mehr

3. Der t-test. Der t-test

3. Der t-test. Der t-test Der t-test 3 3. Der t-test Dieses Kapitel beschäftigt sich mit einem grundlegenden statistischen Verfahren zur Auswertung erhobener Daten: dem t-test. Der t-test untersucht, ob sich zwei empirisch gefundene

Mehr

Hypothesentests mit SPSS. Beispiel für einen t-test

Hypothesentests mit SPSS. Beispiel für einen t-test Beispiel für einen t-test Daten: museum-f-v04.sav Hypothese: Als Gründe, in ein Museum zu gehen, geben mehr Frauen als Männer die Erweiterung der Bildung für Kinder an. Dies hängt mit der Geschlechtsrolle

Mehr

Biostatistik, WS 2015/2016 Der zwei-stichproben-t-test

Biostatistik, WS 2015/2016 Der zwei-stichproben-t-test 1/29 Biostatistik, WS 2015/2016 Der zwei-stichproben-t-test (t-test für ungepaarte Stichproben) Matthias Birkner http://www.staff.uni-mainz.de/birkner/biostatistik1516/ 11.12.2015 2/29 Inhalt 1 t-test

Mehr

Studiendesign/ Evaluierungsdesign

Studiendesign/ Evaluierungsdesign Jennifer Ziegert Studiendesign/ Evaluierungsdesign Praxisprojekt: Nutzerorientierte Evaluierung von Visualisierungen in Daffodil mittels Eyetracker Warum Studien /Evaluierungsdesign Das Design einer Untersuchung

Mehr

Im Modell der Varianzanalyse (mit festen Effekten) ist das. aus dem Durchschnittsmesswert für y plus dem Effekt des.

Im Modell der Varianzanalyse (mit festen Effekten) ist das. aus dem Durchschnittsmesswert für y plus dem Effekt des. Einfatorielle Varianzanalyse Varianzanalyse untersucht den Einfluss verschiedener Bedingungen ( = nominalsalierte(r) Variable(r)) auf eine metrische Variable. Die Bedingungen heißen auch atoren und ihre

Mehr

Eine computergestützte Einführung mit

Eine computergestützte Einführung mit Thomas Cleff Deskriptive Statistik und Explorative Datenanalyse Eine computergestützte Einführung mit Excel, SPSS und STATA 3., überarbeitete und erweiterte Auflage ^ Springer Inhaltsverzeichnis 1 Statistik

Mehr

Kapitel 5: Einfaktorielle Varianzanalyse

Kapitel 5: Einfaktorielle Varianzanalyse Kapitel 5: Einfaktorielle Varianzanalyse Durchführung einer einfaktoriellen Varianzanalyse ohne Messwiederholung Dieser Abschnitt zeigt die Durchführung der in Kapitel 5 vorgestellten einfaktoriellen Varianzanalyse

Mehr

Auswertung mit dem Statistikprogramm SPSS: 30.11.05

Auswertung mit dem Statistikprogramm SPSS: 30.11.05 Auswertung mit dem Statistikprogramm SPSS: 30.11.05 Seite 1 Einführung SPSS Was ist eine Fragestellung? Beispiel Welche statistische Prozedur gehört zu welcher Hypothese? Statistische Berechnungen mit

Mehr

Statistik für Studenten der Sportwissenschaften SS 2008

Statistik für Studenten der Sportwissenschaften SS 2008 Statistik für Studenten der Sportwissenschaften SS 008 Aufgabe 1 Man weiß von Rehabilitanden, die sich einer bestimmten Gymnastik unterziehen, dass sie im Mittel µ=54 Jahre (σ=3 Jahre) alt sind. a) Welcher

Mehr

Parametrische vs. Non-Parametrische Testverfahren

Parametrische vs. Non-Parametrische Testverfahren Parametrische vs. Non-Parametrische Testverfahren Parametrische Verfahren haben die Besonderheit, dass sie auf Annahmen zur Verteilung der Messwerte in der Population beruhen: die Messwerte sollten einer

Mehr

Ein bisschen Statistik

Ein bisschen Statistik Prof. Dr. Beat Siebenhaar ein bisschen Statistik 1 Ein bisschen Statistik (orientiert an Hüsler/Zimmermann (006) mit Umsetzung auf die linguistische Fragen) 1. Datentypen und Grafik Grafische Darstellungen

Mehr

1,11 1,12 1,13 1,14 1,15 1,16 1,17 1,17 1,17 1,18

1,11 1,12 1,13 1,14 1,15 1,16 1,17 1,17 1,17 1,18 3. Deskriptive Statistik Ziel der deskriptiven (beschreibenden) Statistik (explorativen Datenanalyse) ist die übersichtliche Darstellung der wesentlichen in den erhobenen Daten enthaltene Informationen

Mehr

R-WORKSHOP II. Inferenzstatistik. Johannes Pfeffer

R-WORKSHOP II. Inferenzstatistik. Johannes Pfeffer R-WORKSHOP II Inferenzstatistik Johannes Pfeffer Dresden, 25.1.2011 01 Outline Lösung der Übungsaufgabe Selbstdefinierte Funktionen Inferenzstatistik t-test Kruskal-Wallis Test Übungsaufgabe TU Dresden,

Mehr

Klausur Statistik I. Dr. Andreas Voß Wintersemester 2005/06

Klausur Statistik I. Dr. Andreas Voß Wintersemester 2005/06 Klausur Statistik I Dr. Andreas Voß Wintersemester 2005/06 Hiermit versichere ich, dass ich an der Universität Freiburg mit dem Hauptfach Psychologie eingeschrieben bin. Name: Mat.Nr.: Unterschrift: Bearbeitungshinweise:

Mehr

Evaluation der Normalverteilungsannahme

Evaluation der Normalverteilungsannahme Evaluation der Normalverteilungsannahme. Überprüfung der Normalverteilungsannahme im SPSS P. Wilhelm; HS SPSS bietet verschiedene Möglichkeiten, um Verteilungsannahmen zu überprüfen. Angefordert werden

Mehr

Einführung in statistische Testmethoden

Einführung in statistische Testmethoden Einführung in statistische Testmethoden und die Bearbeitung von Messdaten mit Excel 1. Beispielhafte Einführung in den Gebrauch von Testmethoden 2. Typen von Messwerten, Verteilungen 3. Mittelwert, Varianz,

Mehr

Analytische Statistik I. Statistische Methoden in der Korpuslinguistik Heike Zinsmeister WS 2009/10

Analytische Statistik I. Statistische Methoden in der Korpuslinguistik Heike Zinsmeister WS 2009/10 Analytische Statistik I Statistische Methoden in der Korpuslinguistik Heike Zinsmeister WS 2009/10 Testen Anpassungstests (goodness of fit) Weicht eine gegebene Verteilung signifikant von einer bekannten

Mehr

Statistik im Versicherungs- und Finanzwesen

Statistik im Versicherungs- und Finanzwesen Springer Gabler PLUS Zusatzinformationen zu Medien von Springer Gabler Grimmer Statistik im Versicherungs- und Finanzwesen Eine anwendungsorientierte Einführung 2014 1. Auflage Übungsaufgaben zu Kapitel

Mehr

SFB 833 Bedeutungskonstitution. Kompaktkurs. Datenanalyse. Projekt Z2 Tübingen, Mittwoch, 18. und 20. März 2015

SFB 833 Bedeutungskonstitution. Kompaktkurs. Datenanalyse. Projekt Z2 Tübingen, Mittwoch, 18. und 20. März 2015 SFB 833 Bedeutungskonstitution Kompaktkurs Datenanalyse Projekt Z2 Tübingen, Mittwoch, 18. und 20. März 2015 Messen und Skalen Relativ (Relationensystem): Menge A von Objekten und eine oder mehrere Relationen

Mehr

Mathematische und statistische Methoden II

Mathematische und statistische Methoden II Methodenlehre e e Prof. Dr. G. Meinhardt 6. Stock, Wallstr. 3 (Raum 06-206) Sprechstunde jederzeit nach Vereinbarung und nach der Vorlesung. Mathematische und statistische Methoden II Dr. Malte Persike

Mehr

9. Schätzen und Testen bei unbekannter Varianz

9. Schätzen und Testen bei unbekannter Varianz 9. Schätzen und Testen bei unbekannter Varianz Dr. Antje Kiesel Institut für Angewandte Mathematik WS 2011/2012 Schätzen und Testen bei unbekannter Varianz Wenn wir die Standardabweichung σ nicht kennen,

Mehr

Deskriptive Statistik

Deskriptive Statistik Deskriptive Statistik [descriptive statistics] Ziel der deskriptiven (beschreibenden) Statistik einschließlich der explorativen Datenanalyse [exploratory data analysis] ist zunächst die übersichtliche

Mehr

Wahrscheinlichkeitsrechnung und Statistik für Biologen 5. Der zwei-stichproben-t-test. und der Wilcoxon-Test

Wahrscheinlichkeitsrechnung und Statistik für Biologen 5. Der zwei-stichproben-t-test. und der Wilcoxon-Test Wahrscheinlichkeitsrechnung und Statistik für Biologen 5. Der zwei-stichproben-t-test (t-test für ungepaarte Stichproben) und der Wilcoxon-Test Dirk Metzler 22. Mai 2015 Inhaltsverzeichnis 1 Wiederholung:

Mehr

Übersicht über verschiedene Signifikanztests und ihre Voraussetzungen

Übersicht über verschiedene Signifikanztests und ihre Voraussetzungen SPSSinteraktiv von Signifikanztests - 1 - Übersicht über verschiedene Signifikanztests und ihre Verfahren zur Überprüfung von Unterschieden in der zentralen Tendenz Unterschieden werden können Testsituationen

Mehr

Auswertung und Darstellung wissenschaftlicher Daten (1)

Auswertung und Darstellung wissenschaftlicher Daten (1) Auswertung und Darstellung wissenschaftlicher Daten () Mag. Dr. Andrea Payrhuber Zwei Schritte der Auswertung. Deskriptive Darstellung aller Daten 2. analytische Darstellung (Gruppenvergleiche) SPSS-Andrea

Mehr

Angewandte Statistik 3. Semester

Angewandte Statistik 3. Semester Angewandte Statistik 3. Semester Übung 5 Grundlagen der Statistik Übersicht Semester 1 Einführung ins SPSS Auswertung im SPSS anhand eines Beispieles Häufigkeitsauswertungen Grafiken Statistische Grundlagen

Mehr

Sozialwissenschaftliche Fakultät der Universität Göttingen. Sommersemester Statistik mit SPSS

Sozialwissenschaftliche Fakultät der Universität Göttingen. Sommersemester Statistik mit SPSS Sommersemester 2009 Statistik mit SPSS 09. Mai 2009 09. Mai 2009 Statistik Dozentin: mit Esther SPSSOchoa Fernández 1 Arbeitsschritte bei der Datenanalyse Datenmanagement (Einlesen von Daten, Teilen von

Mehr

Master of Science in Pflege

Master of Science in Pflege Master of Science in Pflege Modul: Statistik Analyse von Kategoriedaten / Nicht-parametrische Methoden Dezember 2012 Prof. Dr. Jürg Schwarz Folie 2 Programm 19. Dezember 2012: Vormittag (09.15 12.30) Vorlesung

Mehr

Einführung in die Statistik für Politikwissenschaftler Sommersemester 2011

Einführung in die Statistik für Politikwissenschaftler Sommersemester 2011 Einführung in die Statistik für Politikwissenschaftler Sommersemester 2011 Es können von den Antworten alle, mehrere oder keine Antwort(en) richtig sein. Nur bei einer korrekten Antwort (ohne Auslassungen

Mehr

Herzlich willkommen zum Thema SPSS

Herzlich willkommen zum Thema SPSS Herzlich willkommen zum Thema SPSS (SUPERIOR PERFORMING SOFTWARE SYSTEM) Qualitative und quantitative Forschungsmethoden Qualitative Methoden: Qualitative Verfahren werden oft benutzt, wenn der Forschungsgegenstand

Mehr

fh management, communication & it Constantin von Craushaar fh-management, communication & it Statistik Angewandte Statistik

fh management, communication & it Constantin von Craushaar fh-management, communication & it Statistik Angewandte Statistik fh management, communication & it Folie 1 Überblick Grundlagen (Testvoraussetzungen) Mittelwertvergleiche (t-test,..) Nichtparametrische Tests Korrelationen Regressionsanalyse... Folie 2 Überblick... Varianzanalyse

Mehr

INFERENZSTATISTISCHE AUSSAGEN FÜR LAGEMAßE UND STREUUNGSMAßE. Inferenzstatistik für Lagemaße Inferenzstatistik für Streuungsmaße

INFERENZSTATISTISCHE AUSSAGEN FÜR LAGEMAßE UND STREUUNGSMAßE. Inferenzstatistik für Lagemaße Inferenzstatistik für Streuungsmaße DAS THEMA: INFERENZSTATISTIK III INFERENZSTATISTISCHE AUSSAGEN FÜR LAGEMAßE UND STREUUNGSMAßE Inferenzstatistik für Lagemaße Inferenzstatistik für Streuungsmaße Inferenzstatistik für Lagemaße Standardfehler

Mehr

Wiederholung. Statistik I. Sommersemester 2009

Wiederholung. Statistik I. Sommersemester 2009 Statistik I Sommersemester 2009 Statistik I (1/21) Daten/graphische Darstellungen Lage- und Streuungsmaße Zusammenhangsmaße Lineare Regression Wahrscheinlichkeitsrechnung Zentraler Grenzwertsatz Konfidenzintervalle

Mehr

Kapitel 13 Häufigkeitstabellen

Kapitel 13 Häufigkeitstabellen Kapitel 13 Häufigkeitstabellen Die gesammelten und erfaßten Daten erscheinen in der Datendatei zunächst als unübersichtliche Liste von Werten. In dieser Form sind die Daten jedoch wenig aussagekräftig

Mehr

J. Bortz/N. Döring: Forschungsmethoden und Evaluation (jeweils neueste Auflage) Springer, Berlin S. 463ff

J. Bortz/N. Döring: Forschungsmethoden und Evaluation (jeweils neueste Auflage) Springer, Berlin S. 463ff J. Bortz/N. Döring: Forschungsmethoden und Evaluation (jeweils neueste Auflage) Springer, Berlin S. 463ff Signifikanztests Zur Logik des Signifikanztests Tests zur statistischen Überprüfung von Hypothesen

Mehr

Kapitel 4: Merkmalszusammenhänge

Kapitel 4: Merkmalszusammenhänge Kapitel 4: Merkmalszusammenhänge Streudiagramme SPSS bietet die Möglichkeit, verschiedene Arten von Streudiagrammen zu zeichnen. Gehen Sie auf Grafiken Streu-/Punkt-Diagramm und wählen Sie die Option Einfaches

Mehr

Forschungsmethodik II Mag.rer.nat. M. Kickmeier-Rust Karl-Franzens-Universität Graz. Lisza Gaiswinkler, Daniela Gusel, Tanja Schlosser

Forschungsmethodik II Mag.rer.nat. M. Kickmeier-Rust Karl-Franzens-Universität Graz. Lisza Gaiswinkler, Daniela Gusel, Tanja Schlosser Kolmogorov-Smirnov-Test Forschungsmethodik II Mag.rer.nat. M. Kickmeier-Rust Karl-Franzens-Universität Graz 1 Kolmogorov- Smirnov Test Andrei Nikolajewitsch Kolmogorov * 25.4.1903-20.10.1987 2 Kolmogorov-

Mehr

1.8 Kolmogorov-Smirnov-Test auf Normalverteilung

1.8 Kolmogorov-Smirnov-Test auf Normalverteilung 1.8 Kolmogorov-Smirnov-Test auf Normalverteilung Der Kolmogorov-Smirnov-Test ist einer der klassischen Tests zum Überprüfen von Verteilungsvoraussetzungen. Der Test vergleicht die Abweichungen der empirischen

Mehr

Einführung in die Varianzanalyse mit SPSS

Einführung in die Varianzanalyse mit SPSS Einführung in die Varianzanalyse mit SPSS SPSS-Benutzertreffen am URZ Carina Ortseifen 6. Mai 00 Inhalt. Varianzanalyse. Prozedur ONEWAY. Vergleich von k Gruppen 4. Multiple Vergleiche 5. Modellvoraussetzungen

Mehr

Etwas positive Tendenz ist beim Wechsel der Temperatur von 120 auf 170 zu erkennen.

Etwas positive Tendenz ist beim Wechsel der Temperatur von 120 auf 170 zu erkennen. Explorative Datenanalyse Erstmal die Grafiken: Aufreisskraft und Temperatur 3 1-1 N = 1 15 17 Temperatur Diagramm 3 1 95% CI -1 N = 1 15 17 Temperatur Etwas positive Tendenz ist beim Wechsel der Temperatur

Mehr

Deskription, Statistische Testverfahren und Regression. Seminar: Planung und Auswertung klinischer und experimenteller Studien

Deskription, Statistische Testverfahren und Regression. Seminar: Planung und Auswertung klinischer und experimenteller Studien Deskription, Statistische Testverfahren und Regression Seminar: Planung und Auswertung klinischer und experimenteller Studien Deskriptive Statistik Deskriptive Statistik: beschreibende Statistik, empirische

Mehr

Willkommen zur Vorlesung Statistik

Willkommen zur Vorlesung Statistik Willkommen zur Vorlesung Statistik Thema dieser Vorlesung: Varianzanalyse Prof. Dr. Wolfgang Ludwig-Mayerhofer Universität Siegen Philosophische Fakultät, Seminar für Sozialwissenschaften Prof. Dr. Wolfgang

Mehr

12.1 Wie funktioniert ein Signifikanztest?

12.1 Wie funktioniert ein Signifikanztest? Sedlmeier & Renkewitz Kapitel 12 Signifikanztests 12.1 Wie funktioniert ein Signifikanztest? Zentrales Ergebnis eine Signifikanztests: Wie wahrscheinlich war es unter der Bedingung dass H0 gilt, diesen

Mehr

Einführung in die Statistik für Politikwissenschaftler Wintersemester 2011/2012

Einführung in die Statistik für Politikwissenschaftler Wintersemester 2011/2012 Einführung in die Statistik für Politikwissenschaftler Wintersemester 2011/2012 Es können von den Antwortmöglichkeiten alle, mehrere, eine oder keine Antwort(en) richtig sein. Nur bei einer korrekten Antwort

Mehr

8. Methoden der klassischen multivariaten Statistik

8. Methoden der klassischen multivariaten Statistik 8. Methoden der klassischen multivariaten Statistik 8.1. Darstellung von Daten Voraussetzungen auch in diesem Kapitel: Grundgesamtheit (Datenraum) Ω von Objekten (Fällen, Instanzen), denen J-Tupel von

Mehr

Güte von Tests. die Wahrscheinlichkeit für den Fehler 2. Art bei der Testentscheidung, nämlich. falsch ist. Darauf haben wir bereits im Kapitel über

Güte von Tests. die Wahrscheinlichkeit für den Fehler 2. Art bei der Testentscheidung, nämlich. falsch ist. Darauf haben wir bereits im Kapitel über Güte von s Grundlegendes zum Konzept der Güte Ableitung der Gütefunktion des Gauss im Einstichprobenproblem Grafische Darstellung der Gütefunktionen des Gauss im Einstichprobenproblem Ableitung der Gütefunktion

Mehr

Lösungen zu Janssen/Laatz, Statistische Datenanalyse mit SPSS 1

Lösungen zu Janssen/Laatz, Statistische Datenanalyse mit SPSS 1 LÖSUNG 9B a) Lösungen zu Janssen/Laatz, Statistische Datenanalyse mit SPSS 1 Man kann erwarten, dass der Absatz mit steigendem Preis abnimmt, mit höherer Anzahl der Außendienstmitarbeiter sowie mit erhöhten

Mehr

Willkommen zur Vorlesung Statistik

Willkommen zur Vorlesung Statistik Willkommen zur Vorlesung Statistik Thema dieser Vorlesung: Analyse von Kreuztabellen Prof. Dr. Wolfgang Ludwig-Mayerhofer Universität Siegen Philosophische Fakultät, Seminar für Sozialwissenschaften Prof.

Mehr

Hypothesentests mit SPSS. Beispiel für eine einfaktorielle Varianzanalyse Daten: museum_m_v05.sav

Hypothesentests mit SPSS. Beispiel für eine einfaktorielle Varianzanalyse Daten: museum_m_v05.sav Beispiel für eine einfaktorielle Varianzanalyse Daten: museum_m_v05.sav Hypothese: Die Beschäftigung mit Kunst ist vom Bildungsgrad abhängig. 1. Annahmen Messniveau: Modell: Die Skala zur Erfassung der

Mehr

SozialwissenschaftlerInnen II

SozialwissenschaftlerInnen II Statistik für SozialwissenschaftlerInnen II Henning Best best@wiso.uni-koeln.de Universität zu Köln Forschungsinstitut für Soziologie Statistik für SozialwissenschaftlerInnen II p.1 Varianzanalyse Statistik

Mehr

Nichtparametrische statistische Verfahren

Nichtparametrische statistische Verfahren Nichtparametrische statistische Verfahren (im Wesentlichen Analyse von Abhängigkeiten) Kategorien von nichtparametrischen Methoden Beispiel für Rangsummentests: Wilcoxon-Test / U-Test Varianzanalysen 1-faktorielle

Mehr

Tabelle 136: Unterschiede zwischen den Clustern in der Bearbeitungszeit des Wissenstests (LT-ZEIT)

Tabelle 136: Unterschiede zwischen den Clustern in der Bearbeitungszeit des Wissenstests (LT-ZEIT) Tabelle 136: Unterschiede zwischen den Clustern in der Bearbeitungszeit des Wissenstests (LT-ZEIT) Einfaktorielle Varianzanalyse Test der Homogenität der Varianzen Levene-Statistik df1 df2 1.938 4 317.104

Mehr

Korrelation - Regression. Berghold, IMI

Korrelation - Regression. Berghold, IMI Korrelation - Regression Zusammenhang zwischen Variablen Bivariate Datenanalyse - Zusammenhang zwischen 2 stetigen Variablen Korrelation Einfaches lineares Regressionsmodell 1. Schritt: Erstellung eines

Mehr

Versuchsplanung. Teil 1 Einführung und Grundlagen. Dr. Tobias Kiesling Einführung in die Versuchsplanung

Versuchsplanung. Teil 1 Einführung und Grundlagen. Dr. Tobias Kiesling <kiesling@stat.uni-muenchen.de> Einführung in die Versuchsplanung Versuchsplanung Teil 1 Einführung und Grundlagen Dr. Tobias Kiesling Inhalt Einführung in die Versuchsplanung Hintergründe Grundlegende Prinzipien und Begriffe Vorgehensweise

Mehr

Bachelorabschlussseminar Dipl.-Kfm. Daniel Cracau

Bachelorabschlussseminar Dipl.-Kfm. Daniel Cracau 1 Einführung in die statistische Datenanalyse Bachelorabschlussseminar Dipl.-Kfm. Daniel Cracau 2 Gliederung 1.Grundlagen 2.Nicht-parametrische Tests a. Mann-Whitney-Wilcoxon-U Test b. Wilcoxon-Signed-Rank

Mehr

3. Der t-test. Der t-test

3. Der t-test. Der t-test 3 3. Der t-test Dieses Kapitel beschäftigt sich mit einem grundlegenden statistischen Verfahren zur Auswertung erhobener Daten: dem t-test. Der t-test untersucht, ob sich zwei empirisch gefundene Mittelwerte

Mehr

Multiple Regression II: Signifikanztests, Gewichtung, Multikollinearität und Kohortenanalyse

Multiple Regression II: Signifikanztests, Gewichtung, Multikollinearität und Kohortenanalyse Multiple Regression II: Signifikanztests,, Multikollinearität und Kohortenanalyse Statistik II Übersicht Literatur Kausalität und Regression Inferenz und standardisierte Koeffizienten Statistik II Multiple

Mehr

Statistik II für Betriebswirte Vorlesung 3

Statistik II für Betriebswirte Vorlesung 3 PD Dr. Frank Heyde TU Bergakademie Freiberg Institut für Stochastik Statistik II für Betriebswirte Vorlesung 3 5. November 2013 Beispiel: Aktiensplit (Aczel & Sounderpandan, Aufg. 14-28) Ein Börsenanalyst

Mehr

? Unterscheiden sich Burschen und Mädchen im Ausmaß der Mithilfe im Haushalt?

? Unterscheiden sich Burschen und Mädchen im Ausmaß der Mithilfe im Haushalt? 341 i Metrische und kategoriale Merkmale An einer Beobachtungseinheit werden metrische und kategoriale Variable erhoben. Beispiel: Hausarbeit von Teenagern (Stunden/Woche) 25 15 STUNDEN 5-5 weiblich männlich?

Mehr

Einfache Statistiken in Excel

Einfache Statistiken in Excel Einfache Statistiken in Excel Dipl.-Volkswirtin Anna Miller Bergische Universität Wuppertal Schumpeter School of Business and Economics Lehrstuhl für Internationale Wirtschaft und Regionalökonomik Raum

Mehr

Statistik II für Betriebswirte Vorlesung 2

Statistik II für Betriebswirte Vorlesung 2 PD Dr. Frank Heyde TU Bergakademie Freiberg Institut für Stochastik Statistik II für Betriebswirte Vorlesung 2 21. Oktober 2014 Verbundene Stichproben Liegen zwei Stichproben vor, deren Werte einander

Mehr

ÜBUNGSAUFGABEN ZU INFERENZSTATISTIK II

ÜBUNGSAUFGABEN ZU INFERENZSTATISTIK II ÜBUNGSAUFGABEN ZU INFERENZSTATISTIK II 1.1 Durch welche Elemente lässt sich laut der Formel für die multiple Regression der Wert einer Person auf einer bestimmten abhängigen Variable Y vorhersagen? a)

Mehr

Aufgaben zu Kapitel 8

Aufgaben zu Kapitel 8 Aufgaben zu Kapitel 8 Aufgabe 1 a) Berechnen Sie einen U-Test für das in Kapitel 8.1 besprochene Beispiel mit verbundenen n. Die entsprechende Testvariable punkte2 finden Sie im Datensatz Rangdaten.sav.

Mehr

Kapitel 8: Verfahren für Rangdaten

Kapitel 8: Verfahren für Rangdaten Kapitel 8: Verfahren für Rangdaten Der Mann-Whitney U-Test In Kapitel 8.1 dient eine Klassenarbeit in einer Schule als Beispielanwendung für einen U-Test. Wir werden an dieser Stelle die Berechnung dieses

Mehr

7. Mai 2010. Ruhr-Universität Bochum. Methodenlehre II, SS 2009. Prof. Dr. Holger Dette

7. Mai 2010. Ruhr-Universität Bochum. Methodenlehre II, SS 2009. Prof. Dr. Holger Dette Ruhr-Universität Bochum 7. Mai 2010 1 / 95 Methodenlehre II NA 3/73 Telefon: 0234 322 8284 Email: holger.dette@rub.de Internet: www.ruhr-uni-bochum.de/mathematik3/index.html Vorlesung: Montag, 8.30-10.00

Mehr

Statistik. Jan Müller

Statistik. Jan Müller Statistik Jan Müller Skalenniveau Nominalskala: Diese Skala basiert auf einem Satz von qualitativen Attributen. Es existiert kein Kriterium, nach dem die Punkte einer nominal skalierten Variablen anzuordnen

Mehr

- Normalverteilung (Gaußverteilung) kann auf sehr viele Zufallsprozesse angewendet werden.

- Normalverteilung (Gaußverteilung) kann auf sehr viele Zufallsprozesse angewendet werden. Normalverteilung und Standardnormalverteilung als Beispiel einer theoretischen Verteilung - Normalverteilung (Gaußverteilung) kann auf sehr viele Zufallsprozesse angewendet werden. - Stetige (kontinuierliche),

Mehr