UNIVARIATE DATENANALYSE STATISTISCHE MASSZAHLEN MODUL 7 PROSEMINAR ANALYSE UND DARSTELLUNG VON DATEN I (DESKRIPTIVE STATISTIK)

Größe: px
Ab Seite anzeigen:

Download "UNIVARIATE DATENANALYSE STATISTISCHE MASSZAHLEN MODUL 7 PROSEMINAR ANALYSE UND DARSTELLUNG VON DATEN I (DESKRIPTIVE STATISTIK)"

Transkript

1 INSTITUT FÜR ERZIEHUNGSWISSENSCHAFT - UNIVERSITÄT SALZBURG PROSEMINAR ANALYSE UND DARSTELLUNG VON DATEN I (DESKRIPTIVE STATISTIK) GÜNTER HAIDER WS 1997/98 MODUL 7 UNIVARIATE DATENANALYSE STATISTISCHE MASSZAHLEN Erziehungswissenschat/Haider 1

2 Wie in den einührenden Modulen beschrieben, ist es Augabe der deskriptiven Statistik, Beragungs- oder Beobachtungsergebnisse in übersichtlicher Form darzustellen und zusammenzuassen. Im Modul 4 wurden dazu Häuigkeitstabellen vorgestellt, die über die Gesamtheit der Verteilung der Werte in einer Variablen Auskunt geben. Im Modul 5 wurden graische Darstellungen (Diagramme) benutzt, die ebenalls die Funktion haben, den Überblick über die Verteilung der Meßwerte zu ermöglichen. Die Augabe der Zusammenassung oder Verdichtung der Inormationen, die in einer Werte- Verteilung stecken, erüllen am besten die statistischen Maßzahlen (synonym spricht man auch von statistischen Kennwerten). Beispiele ür solche Maßzahlen sind Mittelwert oder Standardabweichung. Maßzahlen, die aus Stichproben gewonnen werden (=empirische Verteilungen) werden im allgemeinen Statistiken genannt. Maßzahlen, die die Verteilung in Populationen beschreiben sollen (deren wahre Verteilung man meist nicht kennt, sondern nur schätzt, daher => theoretische Verteilungen) heißen Parameter (Parameter werden durch griechische Buchstaben bezeichnet, z.b. s oder m ). Beispiel: Der Mittelwert von 6,27 der Variable IQTEST aus einer Stichprobenuntersuchung von 651 Salzburger Schülern würde als Statistik bezeichnet - würden wir daraus au den Mittelwert aller Salzburger Schüler derselben Altersgruppe schließen (= die Population), so würde man diesen geschätzten Wert Parameter nennen. Bei dem Bemühen, eine Gesamtheit von Werten (Beobachtungen) prägnant zu charakterisieren, verwendet man zwei Gruppen von Maßzahlen: einerseits Maße der zentralen Tendenz ( Mittelwerte ), die die Lage der Verteilung au der Abszissenachse (x) kennzeichnen und andererseits Maße ür die Streuung der Werte in einer Verteilung ( Streuungswerte ), z.b. die Breite der Verteilung. Mittelwerte und Streuungswerte dienen der numerisch-zusammenassenden Beschreibung von Häuigkeitsverteilungen. Sie können allerdings den Einblick in die originale Datenmatrix und eine Häuigkeitstabelle (tabellarisch oder graisch) nicht völlig ersetzen, denn mit einer Verdichtung von Daten - ausgehend von der originalen Datenmatrix - zu Häuigkeitstabellen und weiter zu Maßzahlen ist stets auch ein gewisser Inormationsverlust verbunden. Die wichtigsten Maßzahlen in der deskriptiven Statistik sind: Maße der zentralen Tendenz (Mittelwerte, means, averages) Maße ür die Streuung (Streuungsmaße, measures o variability) 1.Das arithmetische Mittel (Mittelwert) x 1.Varianz und Standardabweichung s 2,s (Mittel, Durchschnitt, arithmetic mean, average) (variance, standard deviation) 2.Der Median Q 2 2.Der Quartilabstand (die Quartile) Q 1 -Q 4 (mittlerer Wert, Zentralwert, median) (quartiles, interquartile range) 3.Der Modalwert Mode 3.Der Range Range (häuigster Wert, mode) (die Spannweite, range) Für die Erläuterung der Maßzahlen werden bestimmte mathematische Kurzbezeichnungen bzw. Abkürzungen verwendet werden (siehe Tabelle). Weitere wichtige Abkürzungen sind: x i (x 1, x 2,..) ortlauende Bezeichnung der beobachteten Meßwerte (i = Index) x 1, x n der erste und der letzte ( n-te ) Meßwert einer Variable n S Anzahl der Datensätze (untersuchte Personen, Fälle) Summenzeichen Beispiel: ( S x i ) heißt: Summe aller beobachteten Meßwerte entspricht also (x 1 + x 2 + x 3 + x x n ) 2 Skriptum Deskriptive Statistik

3 Die olgenden Graiken zeigen einige Beispiele ür die Formen, die Meßwerteverteilungen einer Variablen annehmen können. Für eine adäquate numerische Beschreibung solcher Verteilungen sind stets sowohl Mittelwerte (= Lage der Kurve au der x-achse) als auch Streuungswerte (= Breite/Form der Kurve) notwendig. symmetrisch (glockenörmig) symmetrisch (U-örmig) asymmetrisch linksschie (rechtssteil) asymmetrisch rechtsschie (linkssteil) J-Verteilung linkssteil J-Verteilung rechtssteil symmetrisch (bimodal) schmalgipelig lach Erziehungswissenschat/Haider 3

4 à Maße der zentralen Tendenz (Mittelwerte) 1. Das arithmetische Mittel (der Mittelwert) Deinition: Der Mittelwert einer Anzahl von Meßwerten einer Variablen ist deren Summe, dividiert durch die Anzahl der Meßwerte. Wir bezeichnen den Mittelwert abgekürzt als x (gesprochen x quer). Voraussetzung zur Berechnung: mindestens intervallskalierte Meßwerte - Voraussetzung zur sinnvollen Interpretation: möglichst eine eingipelige Verteilung, nicht zu stark asymmetrisch Formel: Der Mittelwert wird dadurch bestimmt, daß alle ür die Berechnung relevanten Meßwerte (beobachteten Werte) addiert werden und die so erhaltene Summe durch den Umang der Stichprobe (Anzahl der Meßwerte) n dividiert wird: x... Mittelwert x= S S... Summenzeichen x i x n i... alle Meßwerte n... Anzahl der Meßwerte Eigenschaten des Mittelwerts: a) Die Summe der Dierenzen aller Meßwerte von ihrem Mittelwert ist null => S (x i - x) = 0. b) Addiert oder subtrahiert man zu/von jedem Meßwert einer Stichprobe eine Konstante, so vergrößert/verkleinert sich der Mittelwert genau um diese Konstante. c) Die Summe der Quadrate der Dierenzen aller Meßwerte vom Mittelwert (=Abweichungsquadrate) ist kleiner als die Summe der Quadrate aller Dierenzen aller Meßwerte zu irgendeinem anderen Wert (d.h. die Summe der Abweichungsquadrate ist beim Mittelwert ein Minimum). Beispiel ür die Berechnung: Bei der Messung der Variable Körpergröße der 17 Schüler einer 4. Klasse traten die olgenden Meßwerte au: Im ersten Schritt wird die Summe alle Meßwerte berechnet: Im zweiten Schritt wird diese Summe durch die Anzahl der Meßwerte dividiert: S x i = 2465 cm x = 2465 cm / 17 = 145 cm. Der Mittelwert (das arithmetische Mittel) der 17 Meßwerte der Variable Körpergröße beträgt 145 cm. Valid Missing 0 keine Frequency Bei großen Stichproben - wie in der links dargestellten mit der Geschwisterzahl von 651 bzw. 637 Schülern - kann man den Mittelwert auch aus einer gegebenen Häuigkeitstabelle berechnen: 1. Schritt: Man multipliziert jeden Meßwert mit seiner Häuigkeit. 2. Schritt: Man addiert alle so entstandenen Teilsummen zur Gesamtsumme. 3. Schritt: Man dividiert die Gesamtsumme durch die Anzahl der Meßwerte. In unserem Beispiel würde das Ergebnis lauten: Gesamtsumme = (0*77)+(1*231)+(2*172)+(3*84)+(4*27)+(5*20)+ (6*11)+(7*10)+(8*1)+(9*2)+(10*1)+(14*1) = 1221 Geschwister x = 1221 / 637 Schüler = 1,92 4 Skriptum Deskriptive Statistik

5 à Nachteil des Mittelwertes * Starke Beeinlußbarkeit durch extreme Meßwerte ( Ausreißer ) Vorteile des Mittelwertes * Zuällige Stichprobeneinlüsse sind gering, d.h. heißt: Zieht man hintereinander mehrere Zuallsstichproben aus der gleichen Population und berechnet den Mittelwert, so sind die Abweichungen dieser Mittelwerte augrund von Stichprobeneinlüssen nur relativ gering - geringer jedenalls als beim Median, der im nächsten Abschnitt dargestellt wird. * Weil der Mittelwert ein Maß au Intervallskalenniveau ist, können alle algebraischen Grundoperationen durchgeührt werden. Ein Beispiel ür die letztgenannte Eigenschat ist das gewogene arithmetische Mittel von Mittelwerten aus mehreren Stichproben. Werden Mittelwerte unterschiedlich großer Stichproben zusammengeaßt, müssen sie mit ihrem Stichprobenumang (n) gewichtet werden. Formel: ( n*x x k... Mittelwerte der Stichproben 1 - k k k x n k... Anzahl der Meßwerte in Stichprobe 1 - k gew = S S n k ( Nehmen wir an, in drei 4. Klassen 4A (n 1 =17 Schüler), 4B (n 2 =21 Schüler) und 4C (n 3 =29 Schüler) wären die olgenden Körpergrößen gemessen worden: x 1 (4A) = 145 cm; x 2 (4B) = 148 cm; x 3 (4C) = 142 cm; Um nun den Gesamtmittelwert aller drei vierten Klassen zu berechnen (ohne die Einzelwerte zu kennen), multipliziert man jeden Mittelwert mit dem dazugehörigen n, addiert die drei Teilsummen und dividiert sie durch die Gesamtanzahl (n 1 +n 2 +n 3 ). In unserem Beispiel lautet die Lösung: x gew = (145*17) + (148*21) + (142*29) = ( ) / ( ) = 9691 / 67 = 144,6 cm 2. Der Median Deinition: Der Median ( mittlere Wert) ist derjenige Punkt der Meßwertskala, unterhalb und oberhalb dessen jeweils die Hälte der Meßwerte liegen. Wir bezeichnen den Median abgekürzt als Q 2, weil er dem Wert des 2. Quartils entspricht (siehe Streuungswerte). Voraussetzung zur Berechnung: mindestens ordinalskalierte Meßwerte Formel: Voraussetzung: Eine nach der Größe der Meßwerte austeigend geordnete Stichprobe. 1. Ist der Stichprobenumang n ungeradzahlig (n = 2k+1), so ist der Median der (k+1)te Wert in der geordneten Meßwertreihe. 2. Ist der Stichprobenumang n geradzahlig (n = 2k), so ist der Median der Mittelwert aus dem (k)ten und dem (k+1)tem Meßwert. Beispiel (verwendet das nebenstehende Beispiel vom Mittelwert Körpergröße, n=17) Dieselben Zahlen lauten nach der Größe geordnet: Da es sich um eine Stichprobe mit ungeradzahligem n handelt (n=17), k daher 8 und (k+1) = 9 beträgt, so ist der Median der 9.Wert in dieser Reihe (von links zu zählen anangen): 146 Erziehungswissenschat/Haider 5

6 Bei großen Stichproben kann der Median auch sehr rasch mithile einer geordneten Häuigkeitstabelle geunden werden. Im nächsten Beispiel wird die Häuigkeitstabelle dere Notenverteilung einer 1. Klasse Hauptschule in Deutsch gezeigt: Valid Missing Valid Cumulative Frequency Percent Percent Percent 37 5,7 6,0 6, ,2 26,5 32, ,8 43,9 76, ,4 22,4 98,7 8 1,2 1,3 100, ,2 100,0 31 4,8 31 4, ,0 Man betrachtet bei der Suche nach dem Median die Spalte mit den kumulierten Häuigkeiten (cumulative Percent). Da der Median der mittlere Wert einer Meßwertreihe ist, entspricht ihm der kumulierte Prozentwert 50%. Es gilt nun den Wert zu inden, der den 50%-Wert beinhaltet. In unserem Beispiel ist dies die Note 3 (sie enthält ja die Meßwerte von 32,5 bis 76,3%). Nach herkömmlicher Formel berechnet, würde der Median dieser Verteilung lauten: Nachdem es sich um eine Stichprobe mit geradzahligem n handelt (n=620, k=310), so ist der Median der Mittelwert zwischen dem 320. und dem 321. Meßwert. Da in der geordneten Meßwertreihe vom 202. bis zum 473. Meßwert die Noten 3 vorkommen, so ist sowohl der 320. als auch der 321. Meßwert eine 3 und (3+3)/2 ist ebenalls 3. à Vorteil des Medians * Wird durch einzelne extreme Meßwerte ( Ausreißer ) nicht so stark beeinlußt wie der Mittelwert. * Kann auch bei extrem asymmetrischen Verteilungen sinnvoll eingesetzt werden. * Er kann auch ür ordinalskalierte Variablen ermittelt werden ( und übernimmt dort die Rolle des Mittelwerts) 3. Der Modalwert Deinition: Der Modalwert ist der in einer Verteilung am häuigsten vorkommende Meßwert. Wir bezeichnen den Modalwert abgekürzt ot mit seinem englischen Name als mode. Voraussetzung zur Berechnung: keine Ermittlung: In einer Häuigkeitstabelle den am häuigsten vorkommenden Wert suchen (bei dem die absolute Häuigkeit am größten ist) - haben zwei oder mehrere Meßwerte die gleiche Häuigkeit, so gibt es zwei oder mehrere Modalwerte, d.h. die Verteilung ist zwei- oder mehrgipelig, bzw. bi- oder multimodal (nebeneinanderliegende Modalwerte düren nicht wie ein Median gemittelt werden - zwei nebeneinanderliegende Modalwerte entsprechen aber einer unimodalen Verteilung.). Beispiel (Körpergröße, n=17; wie in den vorhergehenden Abschnitten) Der am häuigsten vorkommende Meßwert und damit der Modalwert ist 146 (er kommt insgesamt dreimal vor). Vorteil des Modalwerts * Kann sehr einach und schnell ermittelt werden * Kann ür Variablen aller Skalenniveaus bestimmt werden Nachteil des Modalwerts * starke Abhängigkeit von zuälligen Stichprobeneinlüssen (zuällige, lokale Meßwerthäuungen) 6 Skriptum Deskriptive Statistik

7 à Der Vergleich zwischen den drei Maßen der zentralen Tendenz Wann ist welches Maß zu empehlen : Modalwert Median Mittelwert ür alle Skalenniveaus, besonders ür mehrgipelige Verteilungen, enthält wenig Inormation ür ordinal- und intervallskalierte Variablen, besonders ür asymmetrische eingipelige Verteilungen, bei kleiner Beobachtungszahl besser als Mittelwert ür mindestens intervallskalierte Variablen, ür symmetrische eingipelige Verteilungen, eindeutig zu berechnen, lieert zuverlässige Parameterschätzung, enthält die meiste Inormation (weil alle Meßwerte darin eingehen) Je nach Art bzw. Form der Verteilung der Meßwerte einer Variable ist auch das Verhältnis der drei Mittelwerte zueinander unterschiedlich - drei Beispiele sollen das verdeutlichen: Bei symmetrischen eingipeligen Verteilungen gilt die Regel, daß Mittelwert, Median und Modalwert zusammenallen, d.h. etwa denselben Wert haben. x = Q 2 = Mode Bei asymmetrischen linkssteilen (rechtsschieen) Verteilungen gilt die Regel: Modalwert < Median < Mittelwert Mode Q 2 x Bei asymmetrischen rechtssteilen (linksschieen) Verteilungen gilt die Regel: Modalwert > Median > Mittelwert x Q 2 Mode Zur Charakterisierung einer Verteilung als lach oder schmalgipelig reicht die Bestimmung eines Mittelwertes (oder Medians) nicht aus => dazu sind auch Maßzahlen ür die Streuung notwendig! x = Q 2 = Mode Erziehungswissenschat/Haider 7

8 à Maße ür die Streuung (Streuungsmaße) 1. Die Varianz und die Standardabweichung Deinition: Die Varianz ist die Summe aller Abweichungsquadrate (SAQ) der Meßwerte einer Verteilung von ihrem arithmetischen Mittel, dividiert durch (n - 1). Wir bezeichnen die Varianz abgekürzt als s 2 (gesprochen s quadrat). Die Standardabweichung (s) ist die Quadratwurzel aus der Varianz. Voraussetzung zur Berechnung: mindestens intervallskalierte Meßwerte, Einsatz wie Mittelwert Formel: Die Varianz wird dadurch bestimmt, daß zuerst alle Abweichungen zwischen den Meßwerten und dem Mittelwert ermittelt werden - diese Abweichungen werden quadriert (wodurch große Abweichungen ein noch stärkeres Gewicht erhalten) und addiert. Die SAQ wird durch (n - 1) dividiert, dies macht Varianz/Standardabweichung zu erwartungstreuen Schätzern ür die Parameter s= S 2 (x - ) i x n-1 2 x... Mittelwert S... Summenzeichen x i... alle Meßwerte n... Anzahl der Meßwerte Die Standardabweichung ist dann s = s 2. Beispiel zur Varianz/Standardabweichung (dasselbe Beispiel wie in den vorigen Abschnitten) Nr. x i x i -x (x i -x) 2 Mittelwert = Varianz (s 2 ) = 616 / = 38, Stdabw (s) = 6,20 cm Σ = 616 Zur händischen Berechnung der Standardabweichung s ist es am günstigsten, sich eine Tabelle anzuertigen wie die nebenstehende. Hier werden von links nach rechts die notwendigen Operationen durchgeührt (in der dritten Spalte die Abweichungen, in der letzten Spalte die quadrierten Abweichungen) - die Summe aus der letzten Spalte ergibt die SAQ (Summe aller Abweichungsquadrate), die dann nur noch durch n - 1 (Anzahl der Meßwerte minus 1) dividiert werden muß, um die Varianz zu erhalten. Die Wurzel aus der Varianz ist die Standardabweichung. 8 Skriptum Deskriptive Statistik

9 Je stärker die beobachteten Meßwerte von ihrem Mittelwert abweichen, desto größer ist die Standardabweichung (desto lacher ist die Verteilung). Je mehr sich die Meßwerte eng um den Mittelwert gruppieren (schmalgipelige Verteilung), desto kleiner werden s und s 2. Standardabweichung und Varianz sind prinzipiell als gleichwertig inormative Streuungsmaße anzusehen, denn wenn s 2 groß (klein) ist, ist auch s groß (klein). Für deskriptive Zwecke ziehen wir jedoch die Standardabweichung s vor, weil sie ein Maß ist, das in den Einheiten der zugrundeliegenden Meßwerte skaliert ist (in unserem Beispiel also cm). Vorteile von Varianz/Standardabweichung * Sie werden von zuälligen Extremwerten der Stichprobe nur wenig beeinlußt. * Sie hängen von allen Meßwerten der Verteilung ab (und nicht von extremen wie beim Range). * Sie sind zuverlässige ( erwartungstreue ) Schätzwerte ür die Streuung s in der Grundgesamtheit Nachteile von Varianz/Standardabweichung * Sie werden durch die Größe der gewählten/verwendeten Maßeinheiten stark bestimmt - man kann also nicht soort sagen, daß s = 6,2 eine große oder eine kleine Streuung darstellt. Will man Streuungen aus unterschiedlichen Stichproben vergleichen, so geht das z.b. über den Variabilitätskoeizienten von PEARSON: V = 100s / x. In unserem Beispiel wäre V= 620/145= 4,28. INTERPRETATION: Ist eine Verteilung einigermaßen symmetrisch/glockenörmig und eingipelig (eine Normalverteilung /Gauß-Kurve), so kann die Standardabweichung olgendermaßen gedeutet werden: -2s -s 95% 68% x +s +2s Normalverteilung, Gauß-Kurve Wenn sehr viele Meßwerte vorliegen (mind. 120) und deren Verteilung der Normalverteilung ausreichend angenähert ist, so beinden sich in einem Intervall von +s bis -s links und rechts vom Mittelwert rund 68% aller Meßwerte. In einem Intervall von +2s und - 2s um den Mittelwerte sind rund 95% aller Meßwerte anzutreen. Im (nicht dargestellten) Intervall von insgesamt +- 3s um den Mittelwert liegen dann 99% der Meßwerte. à 2. Der Quartilabstand (die Quartile) Deinition: Das 1. Quartil (Q1) ist derjenige Punkt der Meßwertskala, unterhalb dessen 25% der Meßwerte liegen. Das 2. Quartil (Q2, Median) ist derjenige Punkt der Meßwertskala, unterhalb und oberhalb dessen 50% der Meßwerte liegen. Das 3. Quartil (Q3) ist derjenige Punkt der Meßwertskala, unterhalb dessen 75% der Meßwerte liegen. Der Quartilabstand (QA, Interquartilabstand IQA) ist das Intervall au der Merkmalsachse, das durch das Q1/das erste Quartil und Q3/das dritte Quartil begrenzt wird (QA = Q3 - Q1). Der QA oder auch der halbe QA sind Streuungsmaße, die zur Charakterisierung der Breite einer Verteilung verwendet werden. Berechnung Im wesentlichen wird dieselbe Berechnungsart wie beim Median gewählt (siehe S.5). Erziehungswissenschat/Haider 9

10 Quartilabstand 50% Eigenschaten des Quartilabstands: Er repräsentiert den mittleren 50%-Abstand zwischen dem 1. und dem letzten Viertel einer Verteilung. Der QA kann auch bei ordinalskalierten Variablen bestimmt werden und ist besonders bei asymmetrischen Verteilungen günstig und besser interpretierbar als die Standardabweichung. Q1 Q2 Q3 Beispiel ür die Berechnung: Nr. des Schülers Größe in cm Reihenolge => Q1 Da es sich um ein ungeradzahliges n (n=17) handelt, geht man olgendermaßen vor: 1. Bestimmung des Q2 (Medians) => (k+1)te Wert => 9.Wert = 146 cm. (siehe S. 5) 2. Bestimmung von Q1: Ein Viertel der Verteilung wären 4,25 Meßwerte (n = 17) - Bruchteile von Meßwerten gibt es aber nicht, so wird - analog zur Medianberechnung - auch hier ein gewichteter Wert der nebeneinanderliegenden Meßwerte 4 (139cm) und 5 (141cm) herangezogen => 140 cm. 3. Bestimmung von Q3 analog zu Q1: gewichteter Wert zwischen 13.Wert (149) und 14.Wert (151) ergibt 150 cm. 4. Der Quartilabstand QA beträgt also: 150cm - 140cm = 10 cm. Es gibt in der Literatur einige unterschiedlich komplizierte (Schätz-)ormeln ür Quartile, wer händisch unbedingt die genauen Werte unter Einberechnung exakter Klassengrenzen berechnen will, wird au ZÖFEL 1985, S. 54. verwiesen. Der Abstand zwischen Q2 - Q1 im Vergleich zum Abstand Q3 - Q2 sagt etwas über die Schiee der Verteilung aus: Ist Q2 - Q1 größer als Q3 - Q2 so handelt es sich um eine linksschiee (rechtssteile) Verteilung. Bei extremer Ausprägung spricht man von ceiling eect loor eect einem Decken-Eekt (ceiling eect) der Untersuchung, d.h. zum Beispiel bei einem Test => ein Großteil der Schüler hat ast alle Punkte erreicht. Das Gegenteil ist der Boden-Eekt (loor eect) - hier ist Q3-Q2 deutlich größer als Q2-Q1 - der Test war zu schwierig ür Q1 Q2 Q3 Q1 Q2 Q3 die meisten Schüler. Q2 Q3 10 Skriptum Deskriptive Statistik

11 à 3. Der Range (die Spannweite) Deinition: Der Range entspricht der Dierenz zwischen dem größten und dem kleinsten vorkommenden Meßwert (x max - x min ). Berechnung Suchen Sie in der geordneten Meßwertreihe (oder in der Häuigkeitstabelle) den größten und den kleinsten vorkommenden Meßwert und subtrahieren Sie x min von x max. Beispiel: In unserem Körpergröße-Beispiel ist der kleinste Wert 133cm und der größte 157cm. Der Range beträgt also = 24 cm. Vorteile des Range: * Er ist einach zu berechnen, leicht verständlich und kann ab Ordinalniveau der Daten auch interpretiert werden. * Repräsentiert die Extremwerte der Verteilung (günstige Inormation, wenn man z.b. Klassen bestimmen will) Nachteile des Range: * Äußerst sensibel au extreme Werte (Range ungünstig, wenn man wissen will, wo die meisten Werte liegen) * wenig stabil gegenüber Zuallseinlüssen der Stichprobe gegenüber (hängt ziemlich von der Stichprobengröße ab und lieert unzuverlässige, weil meist zu niedrige Schätzwerte ür die Streuung in der Grundgesamtheit). Standardwerte (z-transormierte Werte) als Anwendung von x und s Eine wichtige Anwendung des Mittelwerts und der Standardabweichung besteht darin, daß mit ihrer Hile jede (mindestens intervallskalierte und symmetrisch eingipelige) Meßwerteverteilung in Standardwerte bzw. z-werte umgerechnet werden kann (= Standardnormalverteilung). Die Formel ür die Umrechnung lautet: z i... ein Standardwert/z-Wert Beispiel: i x z= x- i s x i... ein Meßwert x... Standardabweichung s... Standardabweichung Nr. des Schülers Größeincm z-wert => -1,94-0,32 1,13-0,16-0,65-1,29 1,94-1,13 0,16 0,32 0,65 1,13 0,16-0,97 0,16 0,97-0,16 Jeder alte Wert der Variablen Körpergröße wird durch die z-transormation in einen neuen Standardwert umgeormt. Diese neu entstandene Standardnormalverteilung (z-verteilung) der Variablen hat die olgenden (günstigen) Eigenschaten: * Der Mittelwert ist stets 0 (null) und die Standardabweichung der neuen z-verteilung ist stets 1. * Die Form der Verteilung ändert sich durch die z-transormation nicht. * Aus dem z-wert ist daher soort ersichtlich, ob ein Wert größer (+) oder kleiner (-) als der Mittelwert ist und um wieviel s-einheiten er oberhalb oder unterhalb des Mittelwerts liegt (z.b. +0,32 entspricht einem Wert, der etwa ein Drittel einer Standardabweichung oberhalb des Mittels liegt) Erziehungswissenschat/Haider 11

12 Die Berechnung der sechs Maße mit SPSS a) Berechnung aller Mittelwerte und Streuungsmaße mit FREQUENCIES Die einachste Berechnung aller gewünschten Maße der zentralen Tendenz sowie der Streuungsmaße erolgt über das Auswahleld Statistics in der Prozedur FREQUENCIES. Nach Anwahl von Statistics önet sich ein Menü, das alle besprochenen Maße (und noch einige mehr) zur Auswahl bereithält. Klicken Sie einach jene Maße an, die Sie berechnet haben wollen. Das Ergebnis könnte z.b. ür die Variable GROESSE im Übungsdatensatz SL.SAV so aussehen: Statistics GROESSE/K rpergr e in cm am Ende der GRUNDSCHULE Valid N Missing Mean Median Mode Std. Percentiles Deviation Variance Range ,78 140, ,27 39, ,00 140,00 144,00 Zur Erklärung muß hinzugeügt werden, daß die Quartile 1 bis 3 dem 25., 50. und 75. Percentil entsprechen (Percentile teilen die Stichprobe in hundert gleich breite Bereiche). b) Berechnung von Mittelwert und Standardabweichung mit DESCRIPTIVES Ein Teil der gewünschten Maßzahlen und die z-standardisierten Werte (!) lassen sich auch rasch über die Prozedur Descriptives (Untermenü Options ) berechnen. Um eine neue Variable mit den z-werten zu berechnen, muß die Option Save standardized values as variables ausgewählt werden. SPSS berechnet dann eine neue Variable mithile der z-transormation und benennt sie mit z +alter Name, also z.b. zgroesse. Mit der Prozedur Descriptives lassen sich keine Quartile, also auch kein Median, berechnen. 12 Skriptum Deskriptive Statistik

13 c) Berechnung von Maßzahlen ür Teilgruppen mit MEANS Es kommt relativ häuig vor, daß man neben dem Gesamtmittelwert einer Gruppe auch an den Mittelwerten von Teilgruppen interessiert ist. Ein Beispiel in unserem Datensatz SL.SAV wäre die Frage, welche Mittelwerte die Mädchen und die Buben im Schulleistungstest (SLTEST) erzielen. Die Mittelwerte und Standardabweichungen solcher Teilgruppen lassen sich mit der Prozedur MEANS berechnen (Sie erreichen MEANS über Statistics - Compare Means - Means. Als dependent variable muß nun die interessierende (intervallskalierte) Variable SLTEST ausgewählt werden - und als independent variable wählen Sie die gruppierende Variable, in unserem Fall also das Geschlecht (GESCHL). Klickt man das Auswahleld Options an, so kann man aus einer Liste verschiedenster Maßzahlen auswählen, welche man ür jede Teilgruppe berechnet haben will. Man erhält dann olgenden Ausdruck von SPSS: Report SCHULLEISTUNGSTEST: Punkte im standardisierten Test 1 M NNLICH 2 WEIBLICH Mean N Std. Deviation Mean N Std. Deviation Mean N Std. Deviation 49, ,90 49, ,85 49, ,87 In dieser Tabelle inden Sie nun: <== Mittelwert und Standardabweichung der 337 Buben in der Stichprobe. <== Mittelwert und Standardabweichung der 293 Mädchen in der Stichprobe. <== Mittelwert und Standardabweichung der 630 Schülerinnen und Schüler in der gesamten Stichprobe. Weitere Berechnungsmöglichkeiten und Tabellen mit Maßzahlen können Sie über die Report -Prozeduren von Statistics - Summarize - Report summaries in Rows/Columns anordern. Diese Prozeduren ermöglichen Ihnen viele verschiedene Variationen von übersichtlichen Maßzahl-Tabellen - experimentieren Sie auch mit diesen Prozeduren, bis Siemit ihren Leistungen vertraut sind. Erziehungswissenschat/Haider 13

14 ÜBUNGSFRAGEN UND PRAKTISCHE ÜBUNGEN zu Modul 7 Univariate Statistik - Maßzahlen 1. Warum berechnet man statistische Maßzahlen? Mit welchen Mitteln lassen sich Verteilungen charakterisieren? 2. Wie unterscheiden sich Statistiken von Parametern? 3. Welche drei Maße der zentralen Tendenz sind am wichtigsten? Wie lauten ihre englischen Namen und ihre Abkürzungen? 4. Welche drei Maße der Streuung sind am wichtigsten? Wie lauten ihre englischen Namen und ihre Abkürzungen? 5. Was bedeuten die Abkürzungen/Zeichen: x i, x 1, x, n, S? 6. Zeichnen Sie verschiedene Verteilungsormen au, z.b. eine lache symmetrische Verteilung, eine rechtsschiee aber relativ schmalgipelige Verteilung, eine Verteilung, die dem ceiling-eect entspricht, usw. Tragen Sie in jede Verteilung ein, wo Ihrer Meinung nach Q2, Mode und Mittelwert liegen. 7. Berechnen Sie die drei Maßzahlen ür die zentrale Tendenz von der olgenden Verteilung (erzielte Testpunkte von 21 Schülerinnen und Schülern in einem Mathe-Test): a) Berechnen Sie die drei Maßzahlen ür die zentrale Tendenz aus der olgenden Häuigkeitstabelle. b) Was kann aus der Häuigkeitstabelle über die Form der Verteilung ausgesagt werden? Valid Frequency Percent , , ,1 52 8,0 18 2, ,6 Missing ,4 22 3, ,0 9. Welche Maße der zentralen Tendenz lassen sich jeweils ür nominal-, ordinal- und intervallskalierte Variablen berechnen? Begründen Sie diese Antwort. 10.Was sind Ausreißer und was bewirken sie bei den jeweiligen Mittel- und Streuungswerten? 11.Konstruieren Sie eine einache Häuigkeitsverteilung, ür die gilt: Mode = Median = Mittelwert. 12.Ein Persönlichkeitstest ist an einer Stichprobe von 36 Personen durchgeührt worden. Die Auswertung ergab: Mittelwert= 12; Median= 9; Mode =9. Welche Werte nehmen die drei Maßzahlen an, wenn jeder der 36 Meßwerte in der Urliste verdoppelt wird (bzw. mit 2 multipliziert wird)? 13.In einer Stichprobe von 24 Buben ergab sich ein Mittelwert bei einem Test von 107 Punkten - die 31 Mädchen erzielten bei demselben Test 112 Punkte. Wie lautet der Gesamtmittelwert der gesamten Gruppe? 14.Berechnen Sie die drei Maßzahlen der Streuung ür die 21 Werte von Augabe Schildern Sie die Vor- und Nachteile der verschiedenen Streuungsmaße. 16.Was ist der Unterschied zwischen s und s, und zwischen x und m? 17.Zeigen Sie an einem vollständigen Beispiel, daß der Satz: Die Summe aller Dierenzen aller Meßwerte von ihrem Mittelwert ist null korrekt ist. 14 Skriptum Deskriptive Statistik

15 18.Deinieren Sie ein neues Datenile mit den 21 Meßwerten der Augabe 7 und berechnen Sie die 6 Maßzahlen mithile von Frequencies - vergleichen Sie die Ergebnisse mit Ihren händisch errechneten Resultaten von 7 und Führen Sie die olgenden Berechnungen mit dem Übungsdatensatz SL.SAV durch und interpretieren Sie die Ergebnisse: a) Berechnen Sie die 6 Maßzahlen der Variablen GEWICHT und IQTEST. Welche Form haben die beiden Verteilungen? b) Wählen Sie in DESCRIPTIVES alle Noten aus (DEUGS1 RECHGS1 DEUGS4 RECHGS4 DEUNGS MA- THNGS ENGNGS DEULJ MATHLJ ENGLJ) - behandeln Sie die Werte wie intervallskalierte Daten und berechnen Sie Mittelwert und Standardabweichung. Lassen Sie sich die Ergebnisse nach der Größe der Mittelwerte sortiert ausgeben (Options - Display order - Ascending means). Was kann man daraus ersehen? c) Bestimmen Sie die Mittelwerte der Variablen SLTEST (Schulleistungstest) je nach der abgeschlossenen Schulbildung des Vaters (MEANS!). Fällt Ihnen dabei etwas au? d) Erzeugen Sie die z-standardisierten Werte der Variable SLTEST. Prüen Sie mit Descriptives, ob die Behauptung, diese Verteilung hätte einen Mittelwert von 0 und eine Standardabweichung von 1 wirklich stimmt. 20.Erklären Sie aus dem Gedächtnis, au welche Weise die sechs Maßzahlen berechnet werden und welche Vor- und Nachteile jede Maßzahl hat. 21.Über eine Häuigkeitsverteilung werden die olgenden Behauptungen augestellt: a) Der Mode ist größer als der Mittelwert. b) s ist größer als der Mittelwert. c) Die Varianz beträgt -3,56. d) Die Standardabweichung ist größer als die Varianz. e) Das Merkmal ist stetig und ordinalskaliert. Welche der Aussagen sind mit Sicherheit alsch? Erziehungswissenschat/Haider 15

1,11 1,12 1,13 1,14 1,15 1,16 1,17 1,17 1,17 1,18

1,11 1,12 1,13 1,14 1,15 1,16 1,17 1,17 1,17 1,18 3. Deskriptive Statistik Ziel der deskriptiven (beschreibenden) Statistik (explorativen Datenanalyse) ist die übersichtliche Darstellung der wesentlichen in den erhobenen Daten enthaltene Informationen

Mehr

Auswertung und Darstellung wissenschaftlicher Daten (1)

Auswertung und Darstellung wissenschaftlicher Daten (1) Auswertung und Darstellung wissenschaftlicher Daten () Mag. Dr. Andrea Payrhuber Zwei Schritte der Auswertung. Deskriptive Darstellung aller Daten 2. analytische Darstellung (Gruppenvergleiche) SPSS-Andrea

Mehr

Evaluation der Normalverteilungsannahme

Evaluation der Normalverteilungsannahme Evaluation der Normalverteilungsannahme. Überprüfung der Normalverteilungsannahme im SPSS P. Wilhelm; HS SPSS bietet verschiedene Möglichkeiten, um Verteilungsannahmen zu überprüfen. Angefordert werden

Mehr

2. Deskriptive Statistik 2.1. Häufigkeitstabellen, Histogramme, empirische Verteilungsfunktionen

2. Deskriptive Statistik 2.1. Häufigkeitstabellen, Histogramme, empirische Verteilungsfunktionen 4. Datenanalyse und Modellbildung Deskriptive Statistik 2-1 2. Deskriptive Statistik 2.1. Häufigkeitstabellen, Histogramme, empirische Verteilungsfunktionen Für die Auswertung einer Messreihe, die in Form

Mehr

Deskriptive Statistik

Deskriptive Statistik Deskriptive Statistik In der beschreibenden Statistik werden Methoden behandelt, mit deren Hilfe man Daten übersichtlich darstellen und kennzeichnen kann. Die Urliste (=Daten in der Reihenfolge ihrer Erhebung)

Mehr

3 Deskriptive Statistik in R (univariat)

3 Deskriptive Statistik in R (univariat) (univariat) Markus Burkhardt (markus.burkhardt@psychologie.tu-chemnitz.de) Inhalt 3.1 Ziel... 1 3.2 Häufigkeiten... 1 3.3 Deskriptive Kennziffern I Lagemaße... 2 3.4 Streuungsmaße... 5 3.5 Standardisierung:

Mehr

Methoden der empirischen Sozialforschung I

Methoden der empirischen Sozialforschung I Methoden der empirischen Sozialforschung I Annelies Blom, PhD TU Kaiserslautern Wintersemester 2011/12 Übersicht Quantitative Datenauswertung: deskriptive und induktive Statistik Wiederholung: Die wichtigsten

Mehr

EINFACHE LINEARE REGRESSION MODUL 13 PROSEMINAR DESKRIPTIVE STATISTIK ANALYSE UND DARSTELLUNG VON DATEN I GÜNTER HAIDER WS 1999/2000

EINFACHE LINEARE REGRESSION MODUL 13 PROSEMINAR DESKRIPTIVE STATISTIK ANALYSE UND DARSTELLUNG VON DATEN I GÜNTER HAIDER WS 1999/2000 INSTITUT FÜR ERZIEHUNGSWISSENSCHAFT - UNIVERSITÄT SALZBURG PROSEMINAR DESKRIPTIVE STATISTIK ANALYSE UND DARSTELLUNG VON DATEN I GÜNTER HAIDER WS 1999/2 MODUL 13 EINFACHE LINEARE REGRESSION Erziehungswissenschaft/Haider

Mehr

Einfache Statistiken in Excel

Einfache Statistiken in Excel Einfache Statistiken in Excel Dipl.-Volkswirtin Anna Miller Bergische Universität Wuppertal Schumpeter School of Business and Economics Lehrstuhl für Internationale Wirtschaft und Regionalökonomik Raum

Mehr

Grundlagen der Inferenzstatistik: Was Ihnen nicht erspart bleibt!

Grundlagen der Inferenzstatistik: Was Ihnen nicht erspart bleibt! Grundlagen der Inferenzstatistik: Was Ihnen nicht erspart bleibt! 1 Einführung 2 Wahrscheinlichkeiten kurz gefasst 3 Zufallsvariablen und Verteilungen 4 Theoretische Verteilungen (Wahrscheinlichkeitsfunktion)

Mehr

2. Eindimensionale (univariate) Datenanalyse

2. Eindimensionale (univariate) Datenanalyse 2. Eindimensionale (univariate) Datenanalyse Dr. Antje Kiesel Institut für Angewandte Mathematik WS 2011/2012 Kennzahlen, Statistiken In der Regel interessieren uns nicht so sehr die beobachteten Einzeldaten

Mehr

Univariate/ multivariate Ansätze. Klaus D. Kubinger. Test- und Beratungsstelle. Effektgrößen

Univariate/ multivariate Ansätze. Klaus D. Kubinger. Test- und Beratungsstelle. Effektgrößen Univariate/ multivariate Ansätze Klaus D. Kubinger Effektgrößen Rasch, D. & Kubinger, K.D. (2006). Statistik für das Psychologiestudium Mit Softwareunter-stützung zur Planung und Auswertung von Untersuchungen

Mehr

Grundbegriffe der Beschreibenden Statistik

Grundbegriffe der Beschreibenden Statistik Grundbegriffe der Beschreibenden Statistik 1. Datenmatrix und Messniveaus...3 1.1. Merkmale, Datenmatrix, uni- und multivariate Analysen...3 1.2. Messniveaus (Skalentypen)...4 2. Ausgewählte Verfahren

Mehr

Univariate Lineare Regression. (eine unabhängige Variable)

Univariate Lineare Regression. (eine unabhängige Variable) Univariate Lineare Regression (eine unabhängige Variable) Lineare Regression y=a+bx Präzise lineare Beziehung a.. Intercept b..anstieg y..abhängige Variable x..unabhängige Variable Lineare Regression y=a+bx+e

Mehr

9. Schätzen und Testen bei unbekannter Varianz

9. Schätzen und Testen bei unbekannter Varianz 9. Schätzen und Testen bei unbekannter Varianz Dr. Antje Kiesel Institut für Angewandte Mathematik WS 2011/2012 Schätzen und Testen bei unbekannter Varianz Wenn wir die Standardabweichung σ nicht kennen,

Mehr

Auswertung mit dem Statistikprogramm SPSS: 30.11.05

Auswertung mit dem Statistikprogramm SPSS: 30.11.05 Auswertung mit dem Statistikprogramm SPSS: 30.11.05 Seite 1 Einführung SPSS Was ist eine Fragestellung? Beispiel Welche statistische Prozedur gehört zu welcher Hypothese? Statistische Berechnungen mit

Mehr

Verteilungsanalyse. Johannes Hain. Lehrstuhl für Mathematik VIII Statistik 1/35

Verteilungsanalyse. Johannes Hain. Lehrstuhl für Mathematik VIII Statistik 1/35 Verteilungsanalyse Johannes Hain Lehrstuhl für Mathematik VIII Statistik 1/35 Datentypen Als Sammeln von Daten bezeichnet man in der Statistik das Aufzeichnen von Fakten. Erhobene Daten klassifziert man

Mehr

Statistik und Wahrscheinlichkeitsrechnung

Statistik und Wahrscheinlichkeitsrechnung Statistik und Wahrscheinlichkeitsrechnung Übung 2 28.02.2008 1 Inhalt der heutigen Übung Beschreibende Statistik Gemeinsames Lösen der Übungsaufgaben 2.1: Häufigkeitsverteilung 2.2: Tukey Boxplot 25:Korrelation

Mehr

Häufigkeitstabellen. Balken- oder Kreisdiagramme. kritischer Wert für χ2-test. Kontingenztafeln

Häufigkeitstabellen. Balken- oder Kreisdiagramme. kritischer Wert für χ2-test. Kontingenztafeln Häufigkeitstabellen Menüpunkt Data PivotTable Report (bzw. entsprechendes Icon): wähle Data Range (Zellen, die die Daten enthalten + Zelle mit Variablenname) wähle kategoriale Variable für Spalten- oder

Mehr

Grundlagen quantitativer Sozialforschung Interferenzstatistische Datenanalyse in MS Excel

Grundlagen quantitativer Sozialforschung Interferenzstatistische Datenanalyse in MS Excel Grundlagen quantitativer Sozialforschung Interferenzstatistische Datenanalyse in MS Excel 16.11.01 MP1 - Grundlagen quantitativer Sozialforschung - (4) Datenanalyse 1 Gliederung Datenanalyse (inferenzstatistisch)

Mehr

Der Internetdienst für Ihre Online-Umfragen. Leitfaden statistische Auswertung

Der Internetdienst für Ihre Online-Umfragen. Leitfaden statistische Auswertung Der Internetdienst für Ihre Online-Umfragen Leitfaden statistische Auswertung Weitere in dieser Reihe bei 2ask erschienene Leitfäden Allgemeiner Leitfaden zur Fragebogenerstellung Sie möchten einen Fragebogen

Mehr

Eine computergestützte Einführung mit

Eine computergestützte Einführung mit Thomas Cleff Deskriptive Statistik und Explorative Datenanalyse Eine computergestützte Einführung mit Excel, SPSS und STATA 3., überarbeitete und erweiterte Auflage ^ Springer Inhaltsverzeichnis 1 Statistik

Mehr

Medizinische Biometrie (L5)

Medizinische Biometrie (L5) Medizinische Biometrie (L5) Vorlesung II Daten Deskription Prof. Dr. Ulrich Mansmann Institut für Medizinische Informationsverarbeitung, Biometrie und Epidemiologie mansmann@ibe.med.uni-muenchen.de IBE,

Mehr

Willkommen zur Vorlesung Statistik

Willkommen zur Vorlesung Statistik Willkommen zur Vorlesung Statistik Thema dieser Vorlesung: Varianzanalyse Prof. Dr. Wolfgang Ludwig-Mayerhofer Universität Siegen Philosophische Fakultät, Seminar für Sozialwissenschaften Prof. Dr. Wolfgang

Mehr

0 Einführung: Was ist Statistik

0 Einführung: Was ist Statistik 0 Einführung: Was ist Statistik 1 Datenerhebung und Messung Die Messung Skalenniveaus 2 Univariate deskriptive Statistik 3 Multivariate Statistik 4 Regression 5 Ergänzungen Grundbegriffe Statistische Einheit,

Mehr

Verteilungsanalyse. Johannes Hain. Lehrstuhl für Mathematik VIII Statistik 1/31

Verteilungsanalyse. Johannes Hain. Lehrstuhl für Mathematik VIII Statistik 1/31 Verteilungsanalyse Johannes Hain Lehrstuhl für Mathematik VIII Statistik 1/31 Datentypen Als Sammeln von Daten bezeichnet man in der Statistik das Aufzeichnen von Fakten. Erhobene Daten klassifziert man

Mehr

Korrelation - Regression. Berghold, IMI

Korrelation - Regression. Berghold, IMI Korrelation - Regression Zusammenhang zwischen Variablen Bivariate Datenanalyse - Zusammenhang zwischen 2 stetigen Variablen Korrelation Einfaches lineares Regressionsmodell 1. Schritt: Erstellung eines

Mehr

Kapitel 3. Zufallsvariable. Wahrscheinlichkeitsfunktion, Dichte und Verteilungsfunktion. Erwartungswert, Varianz und Standardabweichung

Kapitel 3. Zufallsvariable. Wahrscheinlichkeitsfunktion, Dichte und Verteilungsfunktion. Erwartungswert, Varianz und Standardabweichung Kapitel 3 Zufallsvariable Josef Leydold c 2006 Mathematische Methoden III Zufallsvariable 1 / 43 Lernziele Diskrete und stetige Zufallsvariable Wahrscheinlichkeitsfunktion, Dichte und Verteilungsfunktion

Mehr

SFB 833 Bedeutungskonstitution. Kompaktkurs. Datenanalyse. Projekt Z2 Tübingen, Mittwoch, 18. und 20. März 2015

SFB 833 Bedeutungskonstitution. Kompaktkurs. Datenanalyse. Projekt Z2 Tübingen, Mittwoch, 18. und 20. März 2015 SFB 833 Bedeutungskonstitution Kompaktkurs Datenanalyse Projekt Z2 Tübingen, Mittwoch, 18. und 20. März 2015 Messen und Skalen Relativ (Relationensystem): Menge A von Objekten und eine oder mehrere Relationen

Mehr

Kontingenzkoeffizient (nach Pearson)

Kontingenzkoeffizient (nach Pearson) Assoziationsmaß für zwei nominale Merkmale misst die Unabhängigkeit zweier Merkmale gibt keine Richtung eines Zusammenhanges an 46 o jl beobachtete Häufigkeiten der Kombination von Merkmalsausprägungen

Mehr

Webergänzung zu Kapitel 10

Webergänzung zu Kapitel 10 Webergänzung zu Kapitel 10 10.1.4 Varianzanalyse (ANOVA: analysis of variance) Im Kapitel 10 haben wir uns hauptsächlich mit Forschungsbeispielen beschäftigt, die nur zwei Ergebnissätze hatten (entweder

Mehr

Einseitig gerichtete Relation: Mit zunehmender Höhe über dem Meeresspiegel sinkt im allgemeinen die Lufttemperatur.

Einseitig gerichtete Relation: Mit zunehmender Höhe über dem Meeresspiegel sinkt im allgemeinen die Lufttemperatur. Statistik Grundlagen Charakterisierung von Verteilungen Einführung Wahrscheinlichkeitsrechnung Wahrscheinlichkeitsverteilungen Schätzen und Testen Korrelation Regression Einführung Die Analyse und modellhafte

Mehr

Wahrscheinlichkeitsrechnung anhand realer Situationen

Wahrscheinlichkeitsrechnung anhand realer Situationen MaMaEuSch Management Mathematics for European Schools http://www.mathematik.unikl.de/ mamaeusch Wahrscheinlichkeitsrechnung anhand realer Situationen Paula Lagares Barreiro 1 Frederico Perea Rojas-Marcos

Mehr

Übungsserie Nr. 10 mit Lösungen

Übungsserie Nr. 10 mit Lösungen Übungsserie Nr. 10 mit Lösungen 1 Ein Untersuchungsdesign sieht einen multivariaten Vergleich einer Stichprobe von Frauen mit einer Stichprobe von Männern hinsichtlich der Merkmale X1, X2 und X3 vor (Codierung:

Mehr

Stichprobenauslegung. für stetige und binäre Datentypen

Stichprobenauslegung. für stetige und binäre Datentypen Stichprobenauslegung für stetige und binäre Datentypen Roadmap zu Stichproben Hypothese über das interessierende Merkmal aufstellen Stichprobe entnehmen Beobachtete Messwerte abbilden Schluss von der Beobachtung

Mehr

12. Vergleich mehrerer Stichproben

12. Vergleich mehrerer Stichproben 12. Vergleich mehrerer Stichproben Dr. Antje Kiesel Institut für Angewandte Mathematik WS 2011/2012 Häufig wollen wir verschiedene Populationen, Verfahren, usw. miteinander vergleichen. Beipiel: Vergleich

Mehr

Inhaltsverzeichnis. Regressionsanalyse. http://mesosworld.ch - Stand vom: 20.1.2010 1

Inhaltsverzeichnis. Regressionsanalyse. http://mesosworld.ch - Stand vom: 20.1.2010 1 Inhaltsverzeichnis Regressionsanalyse... 2 Lernhinweise... 2 Einführung... 2 Theorie (1-8)... 2 1. Allgemeine Beziehungen... 3 2. 'Best Fit'... 3 3. 'Ordinary Least Squares'... 4 4. Formel der Regressionskoeffizienten...

Mehr

90-minütige Klausur Statistik für Studierende der Kommunikationswissenschaft

90-minütige Klausur Statistik für Studierende der Kommunikationswissenschaft Prof. Dr. Helmut Küchenhoff SS08 90-minütige Klausur Statistik für Studierende der Kommunikationswissenschaft am 22.7.2008 Anmerkungen Überprüfen Sie bitte sofort, ob Ihre Angabe vollständig ist. Sie sollte

Mehr

Übung Statistik I Statistik mit Stata SS07-14.05.2007 5. Dokumentation der Datenanalyse, Datentransformationen II und Univariate Statistiken II

Übung Statistik I Statistik mit Stata SS07-14.05.2007 5. Dokumentation der Datenanalyse, Datentransformationen II und Univariate Statistiken II Übung Statistik I Statistik mit Stata SS07-14.05.2007 5. Dokumentation der Datenanalyse, Datentransformationen II und Univariate Statistiken II Andrea Kummerer (M.A.) Oec R. I-53 Sprechstunde: Di. 15-16

Mehr

Institut für Soziologie Dr. Christian Ganser. Methoden 2. Einführung, grundlegende PASW-Bedienung, univariate Statistik

Institut für Soziologie Dr. Christian Ganser. Methoden 2. Einführung, grundlegende PASW-Bedienung, univariate Statistik Institut für Soziologie Dr. Methoden 2 Einführung, grundlegende PASW-Bedienung, univariate Statistik Programm Wiederholung zentraler Aspekten der Übungen Literatur zur Veranstaltung Erste Schritte mit

Mehr

Skript zur Übung: Grundlagen der empirischen Sozialforschung - Datenanalyse

Skript zur Übung: Grundlagen der empirischen Sozialforschung - Datenanalyse Skript zur Übung: Grundlagen der empirischen Sozialforschung - Datenanalyse Phasen des Forschungsprozesses Auswahl des Forschungsproblems Theoriebildung Theoretische Phase Konzeptspezifikation / Operationalisierung

Mehr

Regressionsanalysen. Zusammenhänge von Variablen. Ziel der Regression. ( Idealfall )

Regressionsanalysen. Zusammenhänge von Variablen. Ziel der Regression. ( Idealfall ) Zusammenhänge von Variablen Regressionsanalysen linearer Zusammenhang ( Idealfall ) kein Zusammenhang nichtlinearer monotoner Zusammenhang (i.d.regel berechenbar über Variablentransformationen mittels

Mehr

Grundlagen der Datenanalyse am Beispiel von SPSS

Grundlagen der Datenanalyse am Beispiel von SPSS Grundlagen der Datenanalyse am Beispiel von SPSS Einführung Dipl. - Psych. Fabian Hölzenbein hoelzenbein@psychologie.uni-freiburg.de Einführung Organisatorisches Was ist Empirie? Was ist Statistik? Dateneingabe

Mehr

Methoden Quantitative Datenanalyse

Methoden Quantitative Datenanalyse Leitfaden Universität Zürich ISEK - Andreasstrasse 15 CH-8050 Zürich Telefon +41 44 635 22 11 Telefax +41 44 635 22 19 www.isek.uzh.ch 11. September 2014 Methoden Quantitative Datenanalyse Vorbereitung

Mehr

Zusammenhänge zwischen metrischen Merkmalen

Zusammenhänge zwischen metrischen Merkmalen Zusammenhänge zwischen metrischen Merkmalen Darstellung des Zusammenhangs, Korrelation und Regression Daten liegen zu zwei metrischen Merkmalen vor: Datenpaare (x i, y i ), i = 1,..., n Beispiel: x: Anzahl

Mehr

Analog zu Aufgabe 16.1 werden die Daten durch folgenden Befehl eingelesen: > kredit<-read.table("c:\\compaufg\\kredit.

Analog zu Aufgabe 16.1 werden die Daten durch folgenden Befehl eingelesen: > kredit<-read.table(c:\\compaufg\\kredit. Lösung 16.3 Analog zu Aufgabe 16.1 werden die Daten durch folgenden Befehl eingelesen: > kredit

Mehr

Grundlagen von Versuchsmethodik und Datenanalyse

Grundlagen von Versuchsmethodik und Datenanalyse Grundlagen von Versuchsmethodik und Datenanalyse Der Anfang: Hypothesen über Ursache-Wirkungs-Zusammenhänge Ursache Wirkung Koffein verbessert Kurzzeitgedächtnis Gewaltfilme führen zu aggressivem Verhalten

Mehr

Schätzung des Lifetime Values von Spendern mit Hilfe der Überlebensanalyse

Schätzung des Lifetime Values von Spendern mit Hilfe der Überlebensanalyse Schätzung Lifetime Values von Spenn mit Hilfe Überlebensanalyse Einführung in das Verfahren am Beispiel Einzugsgenehmigung Überlebensanalysen o Ereignisdatenanalysen behandeln das Problem, mit welcher

Mehr

Konfidenzintervalle so einfach wie möglich erklärt

Konfidenzintervalle so einfach wie möglich erklärt Konfidenzintervalle so einfach wie möglich erklärt Wolfgang Ludwig-Mayerhofer, Universität Siegen, Philosophische Fakultät, Seminar für Sozialwissenschaften Vorbemerkung: Es handelt sich um die Anfang

Mehr

14.01.14 DAS THEMA: INFERENZSTATISTIK II. Standardfehler Konfidenzintervalle Signifikanztests. Standardfehler

14.01.14 DAS THEMA: INFERENZSTATISTIK II. Standardfehler Konfidenzintervalle Signifikanztests. Standardfehler DAS THEMA: INFERENZSTATISTIK II INFERENZSTATISTISCHE AUSSAGEN Standardfehler Konfidenzintervalle Signifikanztests Standardfehler der Standardfehler Interpretation Verwendung 1 ZUR WIEDERHOLUNG... Ausgangspunkt:

Mehr

Linearer Zusammenhang von Datenreihen

Linearer Zusammenhang von Datenreihen Linearer Zusammenhang von Datenreihen Vielen Problemen liegen (möglicherweise) lineare Zusammenhänge zugrunde: Mein Internetanbieter verlangt eine Grundgebühr und rechnet minutenweise ab Ich bestelle ein

Mehr

Modul G.1 WS 07/08: Statistik 17.01.2008 1. Die Korrelation ist ein standardisiertes Maß für den linearen Zusammenhangzwischen zwei Variablen.

Modul G.1 WS 07/08: Statistik 17.01.2008 1. Die Korrelation ist ein standardisiertes Maß für den linearen Zusammenhangzwischen zwei Variablen. Modul G.1 WS 07/08: Statistik 17.01.2008 1 Wiederholung Kovarianz und Korrelation Kovarianz = Maß für den linearen Zusammenhang zwischen zwei Variablen x und y Korrelation Die Korrelation ist ein standardisiertes

Mehr

Korrelation. Übungsbeispiel 1. Übungsbeispiel 4. Übungsbeispiel 2. Übungsbeispiel 3. Korrel.dtp Seite 1

Korrelation. Übungsbeispiel 1. Übungsbeispiel 4. Übungsbeispiel 2. Übungsbeispiel 3. Korrel.dtp Seite 1 Korrelation Die Korrelationsanalyse zeigt Zusammenhänge auf und macht Vorhersagen möglich Was ist Korrelation? Was sagt die Korrelationszahl aus? Wie geht man vor? Korrelation ist eine eindeutige Beziehung

Mehr

Institut für Soziologie. Methoden 2. Regressionsanalyse I: Einfache lineare Regression

Institut für Soziologie. Methoden 2. Regressionsanalyse I: Einfache lineare Regression Institut für Soziologie Methoden 2 Regressionsanalyse I: Einfache lineare Regression Programm Anwendungsbereich Vorgehensweise Interpretation Annahmen Zusammenfassung Übungsaufgabe Literatur # 2 Anwendungsbereich

Mehr

Multiple Regression. Ziel: Vorhersage der Werte einer Variable (Kriterium) bei Kenntnis der Werte von zwei oder mehr anderen Variablen (Prädiktoren)

Multiple Regression. Ziel: Vorhersage der Werte einer Variable (Kriterium) bei Kenntnis der Werte von zwei oder mehr anderen Variablen (Prädiktoren) Multiple Regression 1 Was ist multiple lineare Regression? Ziel: Vorhersage der Werte einer Variable (Kriterium) bei Kenntnis der Werte von zwei oder mehr anderen Variablen (Prädiktoren) Annahme: Der Zusammenhang

Mehr

Box-and-Whisker Plot -0,2 0,8 1,8 2,8 3,8 4,8

Box-and-Whisker Plot -0,2 0,8 1,8 2,8 3,8 4,8 . Aufgabe: Für zwei verschiedene Aktien wurde der relative Kurszuwachs (in % beobachtet. Aus den jeweils 20 Quartaldaten ergaben sich die folgenden Box-Plots. Box-and-Whisker Plot Aktie Aktie 2-0,2 0,8,8

Mehr

Analyse bivariater Kontingenztafeln

Analyse bivariater Kontingenztafeln Analyse bivariater Kontingenztafeln Werden zwei kategoriale Merkmale mit nicht zu vielen möglichen Ausprägungen gemeinsam analysiert, so kommen zur Beschreibung der gemeinsamen Verteilung im allgemeinen

Mehr

Monte Carlo Simulation (Grundlagen)

Monte Carlo Simulation (Grundlagen) Der Titel des vorliegenden Beitrages wird bei den meisten Lesern vermutlich Assoziationen mit Roulette oder Black Jack hervorrufen. Allerdings haben das heutige Thema und die Spieltische nur den Namen

Mehr

Kundenzufriedenheitsbefragung 2014

Kundenzufriedenheitsbefragung 2014 Kundenzufriedenheitsbefragung 2014 Auswertungsband über alle bisher erhobenen Augenoptiker Anton Optik e.k. Februar 2015, V100 Label TÜV SÜD Management Service GmbH 1 1 2 Hintergrund der Erhebung Zusammenfassung

Mehr

Elisabeth Raab-Steiner/Michael Benesch. Der Fragebogen. Von der Forschungsidee zur SPSS/PASW-Auswertung. 2., aktualisierte Auflage. facultas.

Elisabeth Raab-Steiner/Michael Benesch. Der Fragebogen. Von der Forschungsidee zur SPSS/PASW-Auswertung. 2., aktualisierte Auflage. facultas. Elisabeth Raab-Steiner/Michael Benesch Der Fragebogen Von der Forschungsidee zur SPSS/PASW-Auswertung 2., aktualisierte Auflage facultas.wuv Inhaltsverzeichnis 1 Elementare Definitionen 11 1.1 Deskriptive

Mehr

Lineare Modelle in R: Einweg-Varianzanalyse

Lineare Modelle in R: Einweg-Varianzanalyse Lineare Modelle in R: Einweg-Varianzanalyse Achim Zeileis 2009-02-20 1 Datenaufbereitung Wie schon in der Vorlesung wollen wir hier zur Illustration der Einweg-Analyse die logarithmierten Ausgaben der

Mehr

8. Methoden der klassischen multivariaten Statistik

8. Methoden der klassischen multivariaten Statistik 8. Methoden der klassischen multivariaten Statistik 8.1. Darstellung von Daten Voraussetzungen auch in diesem Kapitel: Grundgesamtheit (Datenraum) Ω von Objekten (Fällen, Instanzen), denen J-Tupel von

Mehr

Kapitel 23 Lineare Regression

Kapitel 23 Lineare Regression Kapitel 23 Lineare Regression Sowohl einfache als auch multiple Regressionsanalysen können Sie mit dem Befehl STATISTIK REGRESSION LINEAR... durchführen. Dabei lassen sich mit Hilfe diverser Optionen zahlreiche

Mehr

Prüfen von Mittelwertsunterschieden: t-test

Prüfen von Mittelwertsunterschieden: t-test Prüfen von Mittelwertsunterschieden: t-test Sven Garbade Fakultät für Angewandte Psychologie SRH Hochschule Heidelberg sven.garbade@hochschule-heidelberg.de Statistik 1 S. Garbade (SRH Heidelberg) t-test

Mehr

6. METRISCHE UND KATEGORIALE MERKMALE

6. METRISCHE UND KATEGORIALE MERKMALE 6. METRISCHE UND KATEGORIALE MERKMALE wenn an einer Beobachtungseinheit eine (oder mehrere) metrische und eine (oder mehrere) kategoriale Variable(n) erhoben wurden Beispiel: Haushaltsarbeit von Teenagern

Mehr

3.2 Bivariate Verteilungen

3.2 Bivariate Verteilungen 3.2 Bivariate Verteilungen zwei Variablen X, Y werden gemeinsam betrachtet (an jedem Objekt i, i = 1,..., n, werden gleichzeitig zwei Merkmale beobachtet) Beobachtungswerte sind Paare/Kombinationen von

Mehr

Untersuchungen zum Thema Tracking Error

Untersuchungen zum Thema Tracking Error Untersuchungen zum Thema Tracking Error J. Fulmek 24. August 2003 1 Einleitung Im Folgenden werden folgende Punkte untersucht: 1. verschiedene in der Literatur übliche Definitionen des Tracking Errors

Mehr

1 Ein Beispiel: Das Berechnen eines Schulzeugnisses

1 Ein Beispiel: Das Berechnen eines Schulzeugnisses Funktionen in Excel 1 Ein Beispiel: Das Berechnen eines Schulzeugnisses Jim hat die folgenden Noten im 1. Trimester: Fach Prüfung 1 Prüfung 2 Prüfung 3 Englisch 35 38 43 Deutsch 44 42 48 Französisch 28

Mehr

Prof. Dr. P. von der Lippe Statistik I NK SS 2002 Seite 1

Prof. Dr. P. von der Lippe Statistik I NK SS 2002 Seite 1 Prof. Dr. P. von der Lippe Statistik I NK SS 2002 Seite 1 Aufgabe 1 a) BWL-Student S hat von seinem Lieblingsonkel 10.000 geschenkt bekommen mit der Auflage damit etwas Vernünftiges zu machen. Nachdem

Mehr

Standardisierte kompetenzorientierte schriftliche Reifeprüfung. Mathematik. Probeklausur März 2014. Teil-1-Aufgaben

Standardisierte kompetenzorientierte schriftliche Reifeprüfung. Mathematik. Probeklausur März 2014. Teil-1-Aufgaben Standardisierte kompetenzorientierte schriftliche Reifeprüfung Mathematik Probeklausur März 2014 Teil-1-Aufgaben Beurteilung Jede Aufgabe in Teil 1 wird mit 0 oder 1 Punkt bewertet, jede Teilaufgabe in

Mehr

Messsystemanalyse (MSA)

Messsystemanalyse (MSA) Messsystemanalyse (MSA) Inhaltsverzeichnis Ursachen & Auswirkungen von Messabweichungen Qualifikations- und Fähigkeitsnachweise Vorteile einer Fähigkeitsuntersuchung Anforderungen an das Messsystem Genauigkeit

Mehr

Datenanalyse und Statistik

Datenanalyse und Statistik Datenanalyse und Statistik p. 1/44 Datenanalyse und Statistik Vorlesung 2 (Graphik I) K.Gerald van den Boogaart http://www.stat.boogaart.de Datenanalyse und Statistik p. 2/44 Daten Schätzung Test Mathe

Mehr

$ % + 0 sonst. " p für X =1 $

$ % + 0 sonst.  p für X =1 $ 31 617 Spezielle Verteilungen 6171 Bernoulli Verteilung Wir beschreiben zunächst drei diskrete Verteilungen und beginnen mit einem Zufallsexperiment, indem wir uns für das Eintreffen eines bestimmten Ereignisses

Mehr

Einführung in SPSS. 1. Die Datei Seegräser

Einführung in SPSS. 1. Die Datei Seegräser Einführung in SPSS 1. Die Datei Seegräser An 25 verschiedenen Probestellen wurde jeweils die Anzahl der Seegräser pro m 2 gezählt und das Vorhandensein von Seeigeln vermerkt. 2. Programmaufbau Die wichtigsten

Mehr

Teilbarkeit von natürlichen Zahlen

Teilbarkeit von natürlichen Zahlen Teilbarkeit von natürlichen Zahlen Teilbarkeitsregeln: Die Teilbarkeitsregeln beruhen alle darauf, dass man von einer Zahl einen grossen Teil wegschneiden kann, von dem man weiss, dass er sicher durch

Mehr

Bachelorabschlussseminar Dipl.-Kfm. Daniel Cracau

Bachelorabschlussseminar Dipl.-Kfm. Daniel Cracau 1 Einführung in die statistische Datenanalyse Bachelorabschlussseminar Dipl.-Kfm. Daniel Cracau 2 Gliederung 1.Grundlagen 2.Nicht-parametrische Tests a. Mann-Whitney-Wilcoxon-U Test b. Wilcoxon-Signed-Rank

Mehr

2. Korrelation, lineare Regression und multiple Regression

2. Korrelation, lineare Regression und multiple Regression multiple 2.2 Lineare 2.2 Lineare 1 / 130 2.2 Lineare 2 / 130 2.1 Beispiel: Arbeitsmotivation Untersuchung zur Motivation am Arbeitsplatz in einem Chemie-Konzern 25 Personen werden durch Arbeitsplatz zufällig

Mehr

Kapitel 7: Varianzanalyse mit Messwiederholung

Kapitel 7: Varianzanalyse mit Messwiederholung Kapitel 7: Varianzanalyse mit Messwiederholung Durchführung einer einfaktoriellen Varianzanalyse mit Messwiederholung 1 Durchführung einer zweifaktoriellen Varianzanalyse mit Messwiederholung auf einem

Mehr

Varianzanalyse ANOVA

Varianzanalyse ANOVA Varianzanalyse ANOVA Johannes Hain Lehrstuhl für Mathematik VIII Statistik 1/23 Einfaktorielle Varianzanalyse (ANOVA) Bisher war man lediglich in der Lage, mit dem t-test einen Mittelwertsvergleich für

Mehr

Einführung in die Statistik mir R

Einführung in die Statistik mir R Einführung in die Statistik mir R ww w. syn t egris.de Überblick GESCHÄFTSFÜHRUNG Andreas Baumgart, Business Processes and Service Gunar Hofmann, IT Solutions Sven-Uwe Weller, Design und Development Jens

Mehr

Quantitative Methoden der Bildungsforschung

Quantitative Methoden der Bildungsforschung Glieung Wieholung Korrelationen Grundlagen lineare Regression Lineare Regression in SPSS Übung Wieholung Korrelationen Standardisiertes Zusammenhangsmaß (unstandardisiert: Kovarianz) linearer Zusammenhang

Mehr

Profil A 49,3 48,2 50,7 50,9 49,8 48,7 49,6 50,1 Profil B 51,8 49,6 53,2 51,1 51,1 53,4 50,7 50 51,5 51,7 48,8

Profil A 49,3 48,2 50,7 50,9 49,8 48,7 49,6 50,1 Profil B 51,8 49,6 53,2 51,1 51,1 53,4 50,7 50 51,5 51,7 48,8 1. Aufgabe: Eine Reifenfirma hat für Winterreifen unterschiedliche Profile entwickelt. Bei jeweils gleicher Geschwindigkeit und auch sonst gleichen Bedingungen wurden die Bremswirkungen gemessen. Die gemessenen

Mehr

Statistische Maßzahlen. Statistik Vorlesung, 10. März, 2010. Beispiel. Der Median. Beispiel. Der Median für klassifizierte Werte.

Statistische Maßzahlen. Statistik Vorlesung, 10. März, 2010. Beispiel. Der Median. Beispiel. Der Median für klassifizierte Werte. Statistik Vorlesug,. ärz, Statistische aßzahle Iformatio zu verdichte, Besoderheite hervorzuhebe ittelwerte Aufgabe: die Lage der Verteilug auf der Abszisse zu zeige. Der odus: derjeige Wert, der im Häufigste

Mehr

Varianzanalyse * (1) Varianzanalyse (2)

Varianzanalyse * (1) Varianzanalyse (2) Varianzanalyse * (1) Einfaktorielle Varianzanalyse (I) Die Varianzanalyse (ANOVA = ANalysis Of VAriance) wird benutzt, um Unterschiede zwischen Mittelwerten von drei oder mehr Stichproben auf Signifikanz

Mehr

Termin3 Klassifikation multispektraler Daten unüberwachte Verfahren

Termin3 Klassifikation multispektraler Daten unüberwachte Verfahren Ziel Termin3 Klassifikation multispektraler Daten unüberwachte Verfahren Einteilung (=Klassifikation) der Pixel eines multispektralen Datensatzes in eine endliche Anzahl von Klassen. Es sollen dabei versucht

Mehr

Bisher angenommen: jeder Spieler kennt alle Teile des Spiels. - Diskontfaktor des Verhandlungspartners

Bisher angenommen: jeder Spieler kennt alle Teile des Spiels. - Diskontfaktor des Verhandlungspartners 1 KAP 15. Spiele unter unvollständiger Information Bisher angenommen: jeder Spieler kennt alle Teile des Spiels seine Gegenspieler, deren Aktionen, deren Nutzen, seinen eigenen Nutzen etc. Oft kennt man

Mehr

Prüfung zu Modul 26 (BA Bw) bzw. 10 (BA IB) (Wirtschaftsstatistik)

Prüfung zu Modul 26 (BA Bw) bzw. 10 (BA IB) (Wirtschaftsstatistik) 2 3 Klausur-Nr = Sitzplatz-Nr Prüfung zu Modul 26 (BA Bw) bzw. 10 (BA IB) (Wirtschaftsstatistik) Klausurteil 1: Beschreibende Statistik BeStat-1 (7 ) n = 400 Personen wurden gefragt, wie viele Stück eines

Mehr

Kapitel 27 Distanz- und Ähnlichkeitsmaße

Kapitel 27 Distanz- und Ähnlichkeitsmaße Kapitel 7 Distanz- und Ähnlichkeitsmaße 7.1 Einführung Sowohl Distanz- als auch Ähnlichkeitsmaße dienen dazu, die Ähnlichkeit verschiedener Fälle oder Variablen zu quantifizieren. Beide Maße untersuchen,

Mehr

Verteilungsmodelle. Verteilungsfunktion und Dichte von T

Verteilungsmodelle. Verteilungsfunktion und Dichte von T Verteilungsmodelle Verteilungsfunktion und Dichte von T Survivalfunktion von T Hazardrate von T Beziehungen zwischen F(t), S(t), f(t) und h(t) Vorüberlegung zu Lebensdauerverteilungen Die Exponentialverteilung

Mehr

Kommentierter SPSS-Ausdruck zur logistischen Regression

Kommentierter SPSS-Ausdruck zur logistischen Regression Daten: POK V AG 3 (POKV_AG3_V07.SAV) Kommentierter SPSS-Ausdruck zur logistischen Regression Fragestellung: Welchen Einfluss hat die Fachnähe und das Geschlecht auf die interpersonale Attraktion einer

Mehr

ax 2 + bx + c = 0, (4.1)

ax 2 + bx + c = 0, (4.1) Kapitel 4 Komplexe Zahlen Wenn wir uns auf die reellen Zahlen beschränken, ist die Operation des Wurzelziehens (also die Umkehrung der Potenzierung) nicht immer möglich. Zum Beispiel können wir nicht die

Mehr

Gewichtsentwicklung. der Vorarlberger Kindergartenkinder 2010 / 11 bis 2013 / 14

Gewichtsentwicklung. der Vorarlberger Kindergartenkinder 2010 / 11 bis 2013 / 14 Gewichtsentwicklung der Vorarlberger Kindergartenkinder 2010 / 11 bis 2013 / 14 und der Schülerinnen und Schüler aus Vorarlberger Volks- und Mittelschulen sowie polytechnischen und sonderpädagogischen

Mehr

SPSS-Skriptum. 1. Vorbereitungen für die Arbeit mit SPSS (im Seminar)

SPSS-Skriptum. 1. Vorbereitungen für die Arbeit mit SPSS (im Seminar) Die folgenden Erklärungen und Abbildungen sollen den Umgang mit SPSS im Rahmen des POK erleichtern. Diese beschreiben nicht alle Möglichkeiten, die SPSS bietet, sondern nur die Verfahren, die im Seminar

Mehr

Statistik im Bachelor-Studium der BWL und VWL

Statistik im Bachelor-Studium der BWL und VWL Max C. Wewel Statistik im Bachelor-Studium der BWL und VWL Methoden, Anwendung, Interpretation Mit herausnehmbarer Formelsammlung ein Imprint von Pearson Education München Boston San Francisco Harlow,

Mehr

Der Chi Quadrat Test nicht nur für die digitalen Ziffernanalyse geeignet

Der Chi Quadrat Test nicht nur für die digitalen Ziffernanalyse geeignet Der Chi Quadrat Test nicht nur für die digitalen Ziffernanalyse geeignet 1. Einleitung Seit Anfang 2002 finden elektronische Betriebsprüfungen auf der Grundlage der Grundsätze zum Datenzugriff und zur

Mehr

Kapitel 3. Erste Schritte der Datenanalyse. 3.1 Einlesen und Überprüfen der Daten

Kapitel 3. Erste Schritte der Datenanalyse. 3.1 Einlesen und Überprüfen der Daten Kapitel 3 Erste Schritte der Datenanalyse 3.1 Einlesen und Überprüfen der Daten Nachdem die Daten erfasst worden sind, etwa mit Hilfe eines Fragebogens, ist die nächste Frage, wie ich sie in den Rechner

Mehr

Multivariate and Geostatistical Data Analysis. Multivariate and Geostatistical Data Analysis

Multivariate and Geostatistical Data Analysis. Multivariate and Geostatistical Data Analysis Multivariate and Geostatistical Data Analysis Multivariate and Geostatistical Data Analysis c 2012 Helmut Schaeben Geomathematics and Geoinformatics Technische Universität Bergakademie Freiberg, Germany

Mehr

Multivariate Statistik

Multivariate Statistik Hermann Singer Multivariate Statistik 1 Auflage 15 Oktober 2012 Seite: 12 KAPITEL 1 FALLSTUDIEN Abbildung 12: Logistische Regression: Geschätzte Wahrscheinlichkeit für schlechte und gute Kredite (rot/blau)

Mehr

5.2 Optionen Auswahl der Statistiken, die bei der jeweiligen Prozedur zur Verfügung stehen.

5.2 Optionen Auswahl der Statistiken, die bei der jeweiligen Prozedur zur Verfügung stehen. 5 Statistik mit SPSS Die Durchführung statistischer Auswertungen erfolgt bei SPSS in 2 Schritten, der Auswahl der geeigneten Methode, bestehend aus Prozedur Variable Optionen und der Ausführung. 5.1 Variablen

Mehr