Sozialwissenschaftliche Methoden und Statistik I



Ähnliche Dokumente
Prinzip "Proportional Reduction of Error" (PRE)

Verdichtete Informationen

Spannweite, Median Quartilsabstand, Varianz und Standardabweichung.

Im Wöhlerdiagramm wird die Lebensdauer (Lastwechsel oder Laufzeit) eines Bauteils in Abhängigkeit von der Belastung dargestellt.

Leitfaden zu den Indexkennzahlen der Deutschen Börse

Statistik. ist die Kunst, Daten zu gewinnen, darzustellen, zu analysieren und zu interpretieren um zu neuem Wissen zu gelangen.

(Markowitz-Portfoliotheorie)

Geometrisches Mittel und durchschnittliche Wachstumsraten

Statistik. (Inferenzstatistik)

Aufgaben. 1. Gegeben seien folgende Daten einer statistischen Erhebung, bereits nach Größe sortiert (Rangliste):

Zur Interpretation einer Beobachtungsreihe kann man neben der grafischen Darstellung weitere charakteristische Größen heranziehen.

Sitzplatzreservierungsproblem

= k. , mit k als Anzahl der Hypothesen A i und den Daten B. Bestimmtheitsmaß:!Determinationskoeffizient

WIB 2 Mathematik und Statistik Formelsammlung. Z Menge der ganzen Zahlen {...,-3,-2,-1,0,1,2,3,...}

2. Mittelwerte (Lageparameter)

2.2 Rangkorrelation nach Spearman

Einführung in Statistik

Multiple Regression (1) - Einführung I -

Einführung in die Stochastik 3. Übungsblatt

Deskriptive Statistik - Aufgabe 3

Der Korrelationskoeffizient ist ein Maß für den linearen Zusammenhang zwischen zwei Variablen X und Y. Er ist durch folgende Formel charakterisiert:

Lohnkosten pro Arbeitsstunde. Wie hoch sind die Lohnkosten pro Arbeitsstunde im Jahresdurchschnitt?

Histogramm / Säulendiagramm

2. Zusammenhangsanalysen: Korrelation und Regression

Schiefe-, Wölbungs- und Konzentrationsmaße

Schiefe- und Konzentrationsmaße

Übungen zur Wahrscheinlichkeitsrechnung und Schliessenden Statistik

Beispielklausur BWL B Teil Marketing. 45 Minuten Bearbeitungszeit

Einführung Fehlerrechnung

Statistische Grundlagen Ein kurzer Überblick (diskret)

Konzentrationsanalyse

Formelsammlung für die Lehrveranstaltung Wirtschaftsmathematik / Statistik

die Schadenhöhe ( = Risikoergebnis) des i-ten Versicherungsnehmers i 1,, n).

Maße zur Kennzeichnung der Form einer Verteilung (1)

Ordnungsstatistiken und Quantile

1 1 1 x0,25 x200 0,25 x200 0,25 1 x50 x51 1 1

Statistik mit Excel und SPSS

Physikalische Messungen sind immer fehlerbehaftet! Der wahre Wert ist nicht ermittelbar. Der wahre Wert x ist nicht identisch mit dem Mittelwert

Korrelations- und Regressionsanalyse

Erzeugen und Testen von Zufallszahlen

Mehrdimensionale Häufigkeitsverteilungen (1)

Unter einer Rente versteht man eine regelmässige und konstante Zahlung

Korrelations- und Assoziationsmaße

6. Zusammenhangsmaße (Kovarianz und Korrelation)

Allgemeine Prinzipien

Lösungen. Häufigkeitsverteilung (Stabdiagramm) Aufgabe 1. Häufigkeit (h) Merkmal (x)

Mathematik: Mag. Schmid Wolfgang & LehrerInnenteam Arbeitsblatt Semester ARBEITSBLATT 7-8 WAHRSCHEINLICHKEITSRECHNUNG UND STATISTIK

Grundlagen der Energietechnik Energiewirtschaft Kostenrechnung. Vorlesung EEG Grundlagen der Energietechnik

Kommentierte Formelsammlung der deskriptiven und induktiven Statistik für Wirtschaftswissenschaftler

Lage- und Streuungsmaße

Quellencodierung I: Redundanzreduktion, redundanzsparende Codes

Kapitel XI. Funktionen mit mehreren Variablen

Regressionsrechnung und Korrelationsrechnung

Deskriptive Statistik behaftet.

Universitätslehrgang Sports Physiotherapy Einführung in die Statistik

Schiefe- und Konzentrationsmaße

Lageparameter (Mittelwerte) und Streuungsparameter

2 Regression, Korrelation und Kontingenz

Deskriptive Statistik

( x) eine Funktion definiert, in der nur die i-te Komponente variabel ist. Folgende Schreibweisen werden aufgrund dieser Anmerkungen auch verwendet:

4. Marshallsche Nachfragefunktionen Frage: Wie hängt die Nachfrage nach Gütern

Festverzinsliche Wertpapiere. Kurse und Renditen bei ganzzahligen Restlaufzeiten

Nagl, Einführung in die Statistik Seite 1

Methoden der computergestützten Produktion und Logistik

Investmentfonds. Kennzahlenberechnung. Performance Risiko- und Ertragsanalyse, Risikokennzahlen

Deskriptive Statistik2 Durchschnittswert (der arithmetische Mittelwert)

14. Folgen und Reihen, Grenzwerte

REGRESSION. Marcus Hudec Christian Neumann. Eine anwendungsorientierte Einführung. Unterstützt von Institut für Statistik der Universität Wien

Teil IV Musterklausuren (Univ. Essen) mit Lösungen

6. Zusammenhangsmaße (Kovarianz und Korrelation)

1.1. Jährliche Rentenzahlungen Vorschüssige Rentenzahlungen Jährliche Rentenzahlungen Vorschüssige Rentenzahlungen

Statistische Kennzahlen für die Streuung

Quantitative Methoden in der klinischen Epidemiologie

Definitionen und Aussagen zu Potenzreihen

Fehlerrechnung im Praktikum

nonparametrische Tests werden auch verteilungsfreie Tests genannt, da sie keine spezielle Verteilung der Daten in der Population voraussetzen

Schiefe-, Wölbungs- und Konzentrationsmaße

Marketing- und Innovationsmanagement Herbstsemester Übungsaufgaben Lesender: Prof. Dr. Andreas Fürst

Messfehler, Fehlerberechnung und Fehlerabschätzung

Abschlussprüfung zum/zur Finanzplaner/in mit eidg. Fachausweis. Formelsammlung. Autor: Iwan Brot

Abschlussprüfung zum/zur Finanzplaner/in mit eidg. Fachausweis. Formelsammlung. Autor: Iwan Brot

Formelsammlung zur Zuverlässigkeitsberechnung

Lösungen zum Übungs-Blatt 7 Wahrscheinlichkeitsrechnung

5 Reproduktions- und Grenzwertsätze

Verteilungen und Schätzungen

Grundgesetze der BOOLEschen Algebra und Rechenregeln

Ein Maß für die Ungleichheit bzw. Heterogenität kategorialer Daten ist Simpsons normiertes D:

Die Binomialverteilung als Wahrscheinlichkeitsverteilung für die Schadenversicherung

für j=0,1,...,n Lagrange zur Lösung der Interpolation nicht geeignet, da numerisch problematisch und teuer. 1 n

Wie man für einen Test Peroe testet

Alternative Darstellung des 2-Stichprobentests für Anteile. Beobachtete Response No Response Total absolut DCF CF

1 Mathe Formeln Statistik und Wahrscheinlichkeitsrechnung

Formelsammlung für die Lehrveranstaltung Statistik

Mehrdimensionale Merkmale

EINLEITUNG, FEHLERRECHNUNG

Kapitel III. Lagemaße. die beobachteten Werte eines Merkmals X mit Ausprägungen a 1

Quellencodierung I: Redundanzreduktion, redundanzsparende Codes

wahlberechtigte Personen der BRD zur Bundestagswahl zugelassene Parteien (SPD, CDU, Grüne, FDP)

Transkript:

Sozalwsseschaftlche Methode ud Statstk I Uverstät Dusburg Esse Stadort Dusburg Itegrerter Dplomstudegag Sozalwsseschafte Skrpt zum SMS I Tutorum Vo Mark Lutter Stad: Aprl 004 Tel I Deskrptve Statstk

Mark Lutter SMS I Tutorum Tel I Deskrptve Statstk Sete vo 51 Ihaltsverzechs Sete 1. Grudbegrffe... 04 Deskrptve Statstk Iferezstatstk Utersuchugsehete Varable Merkmalsausprägug 1.1 Uterschedlche Tpe vo Varable... 05 1.1.1 Uterschede ach Werteberech... 05 Qualtatve vs. Quattatve Varable Stetge vs. Dskrete Varable Dchotome, Trchotome, Poltome Varable 1.1. Uterschede ach Beobachtbarket... 07 Mafeste vs. Latete Varable 1.1.3 Uterschede ach Messveau... 07 Nomalskalerte Varable Ordalskalerte varable Itervallskalerte Varable Ratoskalerte Varable. Uvarate Aalse... 09 Urlste, Prmärtabelle Häufgketsvertelug Relatve Häufgkete Prozetuale Häufgkete Kumulerte Häufgkete.1 Statstsche Kewerte... 1.1.1 Lagemaße... 1 Modus Meda Arthmetsches Mttel Exkurs: Smmetreegeschafte eer Vertelug / Schefe.1. Streuugsmaße... 19 Rage Quartlabstad Varaz Stadardabwechug Varatoskoeffzet

Mark Lutter SMS I Tutorum Tel I Deskrptve Statstk Sete 3 vo 51. Graphsche Darstellugsmöglchkete... Balkedagramm Kresdagramm Hstogramm Polgozug Boxplot Stem-Ad-Leaf-Dspla.3 Z-Trasformato... 5 3. Bvarate Aalse 6 3.1 Zusammehagsmaße für omalskalerte Varable... 6 Ch-Quadrat Kotgeztabelle Idffereztabelle Erwartete Häufgkete Ph Cramers V Kotgezkoeffzet C Prozetsatzdfferez 3. Zusammehagsmaße für ordalskalerte Varable... 9 Spearmas rho Kedalls tau Koeffzete Kokordate vs. dskordate Paare tes 3.3 Zusammehagsmaße für metrsche Varable... 34 Produktmomet Korrelato (Pearsos r) 3.3.1 Bvarate leare Regresso. 35 Streudagramm Regressosgerade Methode der kleste Quadrate Determatoskoeffzet Varazzerlegug Regressosaalse mt SPSS 4. Kreuztabelleaalse (SPSS).. 45 Zele-, Spalte-, Gesamtprozetwerte 5. Dverse Übugsaufgabe... 46 6. Lteraturverzechs.. 51

Mark Lutter SMS I Tutorum Tel I Deskrptve Statstk Sete 4 vo 51 1. Grudbegrffe Deskrptve Statstk (Beschrebede Statstk) De deskrptve Statstk det der Aufberetug, Darstellug ud Komprmerug sozalwsseschaftlcher Date Kokret: Ee bestmmte Mege vo Persoe wrd hschtlch bestmmter Egeschafte befragt. Dere Atworte werde mttels tabellarsche ud graphsche Darstelluge, Maßzahle der zetrale Tedez, Streuugsmaße ud Korrelatoskoeffzete aufberetet ud aalsert. De deskrptve Statstk gledert sch dre Bereche: Uvarate Aalse (de Vertelug eer Varable wrd aalsert) Bvarate Aalse (de Bezehug zweer Varable zueader wrd aalsert) Multvarate Aalse (de Bezehug mehrerer Varable zueader werde aalsert) Iferezstatstk (Schleßede Statstk) de Erketsse der deskrptve Statstk bezehe sch mmer ur auf ee bestmmte Stchprobe, mttels der Iferezstatstk soll geklärt werde, mt welcher Wahrschelchket de Ergebsse der Stchprobe auch der Populato / Grudgesamthet gelte. Um vo de Stchprobeergebsse auf de Grudgesamthet schleße zu köe, kommt es besoders auf de rchtge Auswahl a (ree Zufallsauswahl, sstematsche Auswahl, geschchtete Auswahl, usw.) De schleßede Statstk lefert Verfahre, ee rchtge Auswahl aus der Masse zu treffe ud se lefert de Regel zur Verallgemeerug der gewoee Stchprobeergebsse Utersuchugsehete (auch: Merkmalsträger / Objekte / Fälle) De a eer Befragug oder a eem Expermet telehmede Idvdue A he werde bestmmte Egeschafte / Merkmale erhobe (z.b. durch Befragug) Kokrete Utersuchugsehete sd: Befragugspersoe, Versuchspersoe (Probade), Haushalte, Orgasatoe, Natoe, etc.

Mark Lutter SMS I Tutorum Tel I Deskrptve Statstk Sete 5 vo 51 Varable De Varable st das vom Forscher a der Utersuchugsehet erhobee Merkmal. Se st damt de de Forscher teresserede Egeschaft a der Utersuchugsehet Dese Egeschafte werde erhobe z.b. durch Befragug oder Beobachtug Kokrete Varable sd: Geschlechtszugehörgket, Arbetszufredehet, moatlches Nettoekomme, Lebesalter, Idustralserugsgrad vo Natoe, etc. Merkmalsausprägug (auch: Werte; Messwerte) de möglche Werte, de ee Varable aehme ka, heße Merkmalsauspräguge Bsp.: De Varable Geschlechtszugehörgket hat de bede Merkmalsauspräguge mälch ud weblch 1.1 Uterschedlche Tpe vo Varable uterschede ach Werteberech (1.1.1) uterschede ach Beobachtbarket (1.1.) uterschede ach Skale- bzw. Messveau (1.1.3) 1.1.1 uterschede ach Werteberech Qualtatve Varable - De Merkmalsauspräguge eer qualtatve Varable uterschedet ma ur hschtlch hrer uterschedlche Art - Qualtatve Varable sd mmer dskret (s.u.) - Bsp.: Geschlechtszugehörgket, Partepräferez,... Quattatve Varable - De Merkmalsauspräguge eer quattatve Varable uterschedet ma hschtlch hrer uterschedlche Größe - Quattatve Varable werde daach uterschede, ob se dskret oder stetg sd (s.u.) - Bsp: Lebesalter, Körpergröße, Schulote

Mark Lutter SMS I Tutorum Tel I Deskrptve Statstk Sete 6 vo 51 Stetge / Kotuerlche Varable - ee stetge Varable ka erhalb ees bestmmte Berechs jede belebge Wert aehme - es exstere kee Lücke bzw. Sprugstelle - we fe de Messug auch st, stets ka och feere Ehete gemesse werde - zwsche zwe Messwerte sd also belebg vele Zwschewerte möglch - Bsp: Lebesalter, Ekomme, Blutdruck,... Dskrete / Dskotuerlche Varable - Ee dskrete Varable ka ur bestmmte Werte aehme - zwsche de Werte exstere Lücke bzw. Sprugstelle - Ee Frau ka bespelswese 1, oder evtl. 10 Kder habe, aber: 3,5 Kder ka se cht habe - Bsp.: Azahl der Kder eem Haushalt, Geschlecht, Partezugehörgket,... - Allerdgs werde der Praxs oftmals dskrete Varable als quasstetg aufgefasst Dchotome Varable - ee Varable mt ur zwe Merkmalsauspräguge heßt dchotome Varable - Bsp.: de Varable Geschlecht bestzt ur de zwe Auspräguge weblch ud mälch Trchotome Varable - ee Varable mt dre Merkmalsauspräguge heßt trchotome Varable - Bsp.: de Varable Schchtzugehörgket mt de dre Auspräguge Uterschcht, Mttelschcht, Oberschcht Poltome Varable - ee Varable mt mehr als dre Merkmalsauspräguge heßt poltome Varable - Bsp.: jede stetge Varable we Ekomme oder Körpergröße

Mark Lutter SMS I Tutorum Tel I Deskrptve Statstk Sete 7 vo 51 1.1. uterschede ach Beobachtbarket Mafeste (emprsche) Varable - drekt beobachtbar bzw. drekt messbar - Bsp.: Körpergröße, Altersagabe, offzelle Partezugehörgket,... Latete (theoretsche) Varable - cht drekt beobachtbar - köe ur durch relevate Idkatore (s.u.) messbar gemacht werde - Bsp.: Ausläderfedlchket, Arbetszufredehet, Aome, wahre poltsche Meug... Idkatore: Idkatore sd mafeste Varable, de als Ersatz für de latete Varable auftrete, da dese cht drekt gemesse werde ka. I der Regel werde latete Varable durch mehrere Idkatore operatoalsert (messbar gemacht). Bsp: de latete Varable Arbetszufredehet st cht drekt messbar. Se ka aber durch de möglche Idkator-Varable Häufgket des Ferblebes vom Arbetsplatz, sowe Häufgket vo Arbetsplatzwechsel ud/oder subjektve Eschätzug des Betrebsklmas operatoalsert werde Oder: De Umweltverschmutzug st cht drekt beobachtbar. Se ka aber messbar gemacht werde durch Idkatore we: Wasserqualtät vo Flüsse, jährlcher CO Ausstoß, Azahl der PKW pro Ewoher, usw. 1.1.3 uterschede ach Skale- bzw. Messveau Nomalskalerte Varable - De Klassfkato vo Utersuchugsehete gescheht hschtlch hres Bestzes oder Ncht-Bestzes eer bestmmte Merkmalsausprägug. - De ezele Merkmalsauspräguge köe cht ragmäßg uterschede werde - köe also cht ee Rehefolge gebracht werde; - se stelle ledglch Beeuge vo Kategore dar - De ezele Kategore müsse a) vollstädg se ud b) sch gegesetg ausschleße - De Nomalskala repräsetert das edrgste Messveau - Bsp.: Geschlecht, Partezugehörgket, Berufsstatus, Natoaltät,...

Mark Lutter SMS I Tutorum Tel I Deskrptve Statstk Sete 8 vo 51 Ordalskalerte Varable - We omalskalerte Varable, zusätzlch glt: - zwsche de Merkmalsauspräguge köe größer/kleer Aussage getroffe werde, - d.h. de ezele Merkmalsauspräguge köe ragmäßg der Rehefolge ach geordet werde - Jedoch köe kee geaue Abstäde zwsche de Merkmalsauspräguge ausgemacht werde - Bsp.: Schulote, Schchtzugehörgket, Lebeszufredehet Itervallskalerte Varable 1 - her köe de Auspräguge cht ur ragmäßg geordet werde, soder de geaue Abstäde zwsche de Auspräguge köe agegebe werde - zudem sd de Abstäde mmer glech groß - Jedoch: E Nullpukt ka wllkürlch festgelegt se ud hat kee haltlche Bedeutug - Deswege: Aussage über Verhältsse sd uzulässg! Bsp.: Probad A hat ee IQ vo 100; Probad B ee vo 110. De Aussage: A st um 10% tellgeter als B st völlg usg! Es ka höchstes gesagt werde, dass B auf der gemessee Itellgezskala um 10 Pukte höher legt als A. - Bsp.: Zetrechug, Temperatur Celsus oder Fahrehet, Itellgezmessug Ratoskalerte Varable (auch: Verhältsskala) - Repräsetert das höchste Messveau - Her st e absoluter (atürlcher) Nullpukt m Werteberech vorhade, z.b. st der absolute Tefpukt, de de Temperatur je erreche ka, glechzetg der Nullpukt der Temperaturskala ach Kelv. Null Grad Kelv etsprcht eer Temperatur vo 73,15 Grad Celsus. - Deswege: Aussage über Verhältsse sd zulässg - Bsp.: Temperatur Kelv, Körperläge, Körpergewcht, Lebesalter, Ekomme, Ehedauer,... 1 Für vele Aalsezwecke st de Uterschedug zwsche Itervall- ud Ratoskala etbehrlch; zusammefassed werde bede Messveaus auch Varable auf metrschem Messveau geat, da metrsches Messveau de Durchführug arthmetscher Recheoperatoe erlaubt. Außerdem: Varable auf Ordal-Skaleveau werde der Praxs oftmals als (quas-)metrsch behadelt, damt arthmetsche Recheoperatoe, we z.b. Mttelwertbldug, durchgeführt werde köe.

Mark Lutter SMS I Tutorum Tel I Deskrptve Statstk Sete 9 vo 51. Uvarate Aalse Urlste, Prmärtabelle Ausgagspukt der uvarate Aalse sd de (Roh-)Date, de ach der Erhebug ees Merkmals (z.b. durch Befragug) etstehe. Bespel: De 31 Telehmer ees Statstk-Tutorums werde ach hrer Semesterzahl befragt. Jede ezele Befragug stellt ee Messug dar. Ma erhält damt 31 Messwerte der Varable Semesterzahl. Der Größe ach aufgelstet blde dese Date ee geordete Urlste ( = Prmärtabelle): 1,,,,,,,,,,,,,3,3,3,3,3,3,3,3,3,3,4,4,4,4,4,5,5,7 Berets erkebar: de meste Persoe befde sch m zwete ud drtte Semester. De Häufgketsvertelug / Häufgketstabelle De Prmärtabelle lässt sch überschtlcher darstelle, dem de ezele (der Größe ach geordete) Merkmalsauspräguge mt der Häufgket hres Auftretes (f ) versehe werde. x f 1 1 1 3 10 4 5 5 7 1 Gesamt = 31 Wchtge Bezechuge: Messwerte (x ): De Merkmalsauspräguge / Messwerte der Varable X (Semesterzahl) werde als x bezechet absolute Häufgkete (f ): De beobachtete Häufgket jeder Merkmalsausprägug wrd mt f (frequec) bezechet. Azahl der Fälle (): De Größe der Stchprobe wrd mt bezechet Statt f fdet sch auch de Bezechug, so z.b. m Faulbaum-Skrpt

Mark Lutter SMS I Tutorum Tel I Deskrptve Statstk Sete 10 vo 51 Wetere wchtge Darstellugsmöglchkete vo Häufgkete: relatve Häufgkete ( f ) f = f De relatve Häufgket ergbt sch, we ma de absolute Häufgket ees x - Wertes durch de Azahl der Fälle telt Relatve Häufgkete köe ur Werte zwsche 0 ud 1 aehme De Summe aller relatve Häufgkete ergbt 1 x f f 1 1 0,033 1 0,3871 3 10 0,36 4 5 0,1613 5 0,0644 7 1 0,033 Gesamt = 31 1 prozetuale Häufgkete / Prozetwerte ( %f ) f % f = 100 bzw. % f f 100 = De prozetuale Häufgkete ergebe sch, we ma de relatve Häufgket ees x - Wertes mt 100 multplzert Prozetwerte sd besoders da ützlch, we de Häufgketsverteluge zweer uterschedlch großer Stchprobe verglche werde solle x f f %f 1 1 0,033 3,3 1 0,3871 38,71 3 10 0,36 3,6 4 5 0,1613 16,13 5 0,0644 6,44 7 1 0,033 3,3 Gesamt = 31 1 100% 38,71 % der sgesamt 31 Telehmer des Statstk-Tutorums befde sch also m. Semester

Mark Lutter SMS I Tutorum Tel I Deskrptve Statstk Sete 11 vo 51 kumulerte Häufgkete de absolute, relatve ud prozetuale Häufgkete lasse sch auch sukzessve addere (= kumulere) f c = kumulerte absolute Häufgkete f c = kumulerte relatve Häufgkete % f c = kumulerte prozetuale Häufgkete x f f %f f c f c % f c 1 1 0,033 3,3 1 0,033 3,3 1 0,3871 38,71 13 0,4194 41,94 3 10 0,36 3,6 3 0,740 74,0 4 5 0,1613 16,13 8 0,9033 90,33 5 0,0644 6,44 30 0,9677 96,77 7 1 0,033 3,3 31 1 100 Gesamt = 31 1 100 % a de kumulerte Häufgkete lasse sch Iformatoe der folgede Art ablese: 3 Persoe, also 74,0 %, befde sch de erste dre Semester Oder: Nur kapp 10 % aller Persoe befde sch m fortgeschrtteerem 5. ud 7. Semester Achtug: Messveau beachte! Absolute, relatve sowe prozetuale Häufgkete dürfe erst ab ordalem Messveau kumulert werde

Mark Lutter SMS I Tutorum Tel I Deskrptve Statstk Sete 1 vo 51.1 Statstsche Kewerte / Maßzahle Währed Häufgketstabelle Auskuft über de gesamte Vertelug eer Varable gebe, formere statstsche Maßzahle über gaz bestmmte Egeschafte eer Vertelug. Maßzahle dee der Iformatosverdchtug, de: se lefer mt ur eer ezge Zahl komprmerte Iformato über de charakterstsche Egeschafte eer Vertelug Statstsche Maßzahle zur Beschrebug eer uvarate Vertelug gleder sch zwe Gruppe: Lagemaße (auch: Maßzahle der zetrale Tedez; Zetraltätswerte) Streuugsmaße (auch: Dspersosmaße) Währed Lagemaße über Zetraltät Auskuft gebe, also de tpsche (Modus), de zetrale (Meda) oder de durchschttlche (arthmetsches Mttel) Wert eer Vertelug wedergebe, so gebe de Streuugsmaße a, wewet de Date eer Vertelug vo dese tpsche Werte abweche. Se messe auf dese Wese de Grad der Heterogetät eer Vertelug ud zege, we gut oder we schlecht de Lagemaße ee Vertelug repräsetere De: habe wr ee relatv homogee Vertelug, d.h. weche ur sehr weg Messwerte vo de Zetraltätswerte ab (= edrge Streuug), da sd de Zetraltätswerte sehr gute Repräsetate der Vertelug. Habe wr stattdesse ee sehr heterogee Vertelug, d.h. weche de Messwerte recht stark vo de Zetraltätswerte ab (= hohe Streuug), da repräsetere de Zetraltätswerte de Vertelug cht besoders gut. De achfolgede Tabelle zegt, welche Maßzahle m folgede behadelt werde: Lagemaße Streuugsmaße Modus (h) Rage (R) Meda ( ~ x ) (mttlerer) Quartlabstad (QA) Arthmetsches Mttel ( x ) Varaz (s ) Stadardabwechug (s) Varatoskoeffzet (V)

Mark Lutter SMS I Tutorum Tel I Deskrptve Statstk Sete 13 vo 51.1.1 Lagemaße / Maßzahle der zetrale Tedez / Zetraltätsmaße Modus (h) Um de Modalwert zu ermttel, stellt ma sch de Frage Welcher Messwert kommt am häufgste vor? Er st awedbar ab omalem Messveau Egpflge, umodale Vertelug: x f 1 1 1 3 10 4 5 5 7 1 Gesamt = 31 Her st h =. Da wr her ur ee Modalwert habe, hadelt es sch um ee umodale Vertelug. Bmodaltät: (a) edeutg bmodale Vertelug x f 1 1 1 3 10 4 5 5 1 7 1 Gesamt = 41 Her st h 1 = ud h = 5 (b) cht edeutg bmodale Vertelug x f 1 1 1 3 10 4 5 5 13 7 1 Gesamt = 4 Her st auch h 1 = ud h = 5 ACHTUNG: Ncht mt dem f Wert verwechsel; der Modus st mmer der häufgste Messwert x ;

Mark Lutter SMS I Tutorum Tel I Deskrptve Statstk Sete 14 vo 51 Meda ( x ~ ) Der Meda x ~ [les x Schlage ] st der Wert, der ee der Größe ach geordete Messwertrehe halbert Er st awedbar erst ab ordalem Messveau 3 Arte der Berechug, je achdem ob a. ugerade Azahl vo Fälle b. gerade Azahl vo Fälle c. klasserte Date vorlege Medaberechug be ugerader Azahl vo Fälle - der Meda st her der Messwert des mttlere Falles eer geordete Messwertrehe - daher: zuächst de Date der Größe ach orde, so we deser geordete Urlste: 1,,,,,,,,,,,,,3,3,3,3,3,3,3,3,3,3,4,4,4,4,4,5,5,7 = 31 (=ugerade Azahl) der mttlere Fall wrd mt folgeder Formel berechet: ( + 1 ) Her: (31 + 1)/ = 16 ACHTUNG: cht 16, soder der Messwert des 16. Falles st der Meda; demach x ~ = 3 1,,,,,,,,,,,,,3,3,3,3,3,3,3,3,3,3,4,4,4,4,4,5,5,7 = 31 We ma auch de kumulerte absolute Häufgkete etehme ka, gehört der 16. Fall zu Messwert 3: x f f c 1 1 1 1 13 3 10 3 4 5 8 5 30 7 1 31 Gesamt = 31 Allgeme seht de Formel so aus: ~ x = x + 1

Mark Lutter SMS I Tutorum Tel I Deskrptve Statstk Sete 15 vo 51 Medaberechug be gerader Azahl vo Fälle - be gerader Azahl vo Fälle st der Meda der halberte Wert der mttlere bede Fälle Zuäc hst werde de mttlere bede Fälle berechet mt: = 1. mttlerer Fall; + 1 =. mttlerer Fall Bsp.: 1,,,,,,,,,,,,,3,3,3,3,3,3,3,3,3,3,4,4,4,4,4,5,5,7 = 3 (= gerade Azahl) 3 3 = 16. Fall (= Messwert 3); + 1 = 17. Fall (=Messwert 3) Der Meda st u chts aderes als das arthmetsche Mttel ( s.u.) der m ttlere bede Messwerte: ~ x = 3 + 3 = 3 Allgeme seht de Formel so aus: x + x + 1 ~ x = Zu beachte st auch her weder, dass m Zähler zuächst de bede mttlere Fälle [/ bzw. (/)+1] berechet werde, de da durch hre etsprechede Messwerte ausgetauscht werde müsse. M edaberechug be klasserte Date Be klasserte Date berechet sch der Meda mt folgeder Formel: ~ x = U + 1 Fm Fu Mt: 1 = deser Wert gbt a, welchem Itervall der Meda lege wrd (Medatervall) U = exakte utere Greze des Medatervalls = Azahl der Fälle Fu = kumulerte Häufgket uterhalb des Medatervalls (kum. Fälle uterhalb vo U) Fm = Azahl der Fälle m Medatervall Kb = Itervallbrete (wrd berechet mt: exakte obere mus exakte utere Greze eer Klasse) Kb

Mark Lutter SMS I Tutorum Tel I Deskrptve Statstk Sete 16 vo 51 Bsp.: Klasse Ekommesklasse f ( Euro) 1 500 bs < 1000 800 3 = Medatervall 1000 bs < 1500 1500 bs < 000 600 400 4 000 bs < 500 600 5 500 bs < 3000 800 Σ 300 = U = 1500 Fm = 400 = 300 Kb = 499 (z.b. 1999-1500 = 499) Fu = 800 + 600 = 1400 1 = 300 : = 1600; das Medatervall st de 3. Klasse, da de kumulerte Häufgkete der erste 3 Klasse (800 + 600 + 400 = 1800) ee Wert >1600 ergebe Setze wr u dese Werte de Formel e, so erhalte wr für de Meda ee Wert vo: x~ = 1500 + [(1600 1400)/400] 499 = 1749,5 Wchtge Egeschaft des Medas: Uempfdlchket gegeüber Extremwerte (m Gegesatz zum arthmetsche Mttel) A rthmetsches Mttel ( x ) Das arthmetsche Mttel x [les: x quer ] st der Durchschttswert eer Vertelug Setzt metrsches Messveau voraus Ist defert als de Summe aller Messwerte, getelt durch hre Azahl: x x1 + x + x3 +... + x = 1 = = Oder efacher: De ezele Messwerte werde mt hrer Häufgket multplzert: x = 1 = f x x

Mark Lutter SMS I Tutorum Tel I Deskrptve Statstk Sete 17 vo 51 Bsp.: x f 1 1 1 3 10 4 5 5 7 1 Gesamt = 31 ( 1 1 ) + ( 1 ) + ( 3 10 ) + ( 4 5 ) + ( 5 ) + 7 1 ) x = =,96773 31 Zur Berechug be klasserte Date: vgl. Beghaus, a.a.o., S.137f. Wchtge Egeschafte des arthmetsche Mttels: De Summe der Abwechuge aller Messwerte vo hrem arthmetsche Mttel st glech Null: =1 ( x x) = 0 De Summe der quadrerte Abwechuge vo hrem arthmetsche Mttel st kleer als de Summe der quadrerte Abwechuge aller Messwerte vo eem belebge adere Wert De Addto (oder Subtrakto) eer bestmmte Zahl zu alle Ezelwerte eer Vertelug vergrößert (oder verkleert) das arthmetsche Mttel um dese Zahl Das arthmetsche Mttel st - m Gegesatz zum Meda - afällg für Extremwerte

Mark Lutter SMS I Tutorum Tel I Deskrptve Statstk Sete 18 vo 51 Smmetreegeschafte eer Vertelug De dre Lagemaße gebe auch Auskuft über de Schefe eer Vertelug h = ~ x = x de Vertelug st smmetrsch h ~ x < x < de Vertelug st lksstel / rechtsschef h x > > ~ x de Vertelug st rechtsstel / lksschef h > ~ x > x h = ~ x = x h < ~ x < x Geerell glt: Je äher de dre Werte beeader lege, desto weger schef st de Vertelug Umgekehrt glt: je stärker de dre Werte dfferere, desto schefer st de Vertelug De Schefe (Sch) gbt es auch als Maßzahl: Setzt metrsche Date voraus Berechet wrd se mt: ( x x) 3 Sch = = 1 Iterpretato: Sch < 0 Sch > 0 Sch = 0 de Vertelug st rechtsstel de Vertelug st lksstel de Vertelug st smmetrsch

Mark Lutter SMS I Tutorum Tel I Deskrptve Statstk Sete 19 vo 51 Geerell glt auch her: Je äher der Wert be Null legt, desto weger schef st de Vertelug Umgekehrt glt: je weter der Wert vo Null etfert legt, desto schefer st de Vertelug.1. Streuugsmaße alle Streuugsmaße setze metrsches Messveau voraus Ausahme: Quartle, sowe Quartlabstad ud mttlerer Quartlabstad: ab ordalem Messveau Rag e (R) (auch: Spawete, Varatosbrete) Ist defert als de Dfferez aus dem größte ud dem kleste Wert: R = x max x m Nachtel: Da be der Berechug ledglch der größte ud der kleste Wert berückschtgt werde, st er a) stark vo Ausreßerwerte abhägg ud b) chtssaged über de Streuug der übrge Werte Quartlabstad (QA) / mttlerer Quartlabstad De Quartle Q 1, Q ud Q 3 sd Messwerte, de ee Vertelug Abschtte zerlege, de jewels 5% der Utersuchugsehete falle 3 Damt tree se de Vertelug 4 gleche Abschtte Der Quartlabstad st de Dfferez zwsche dem drtte (Q 3 ) ud dem erste (Q 1 ) Quartl: QA = Q 3 - Q 1 Wobe : Q = 1 x 1 Q = x ~ x 3 4 Q = 3 4 Der mttlere Quartlabstad berechet sch mt: QA 3 vgl. herzu ausführlch: Beghaus, a.a.o., S. 145ff. (sb. S.147: Berechug der Quartle be klasserte Date)

Mark Lutter SMS I Tutorum Tel I Deskrptve Statstk Sete 0 vo 51 Varaz (s ) De Varaz st defert als de Summe der quadrerte Abwechuge der ezele Messwerte vo hrem arthmetsche Mttel, dvdert durch de Azahl der Fälle: s = = 1 f ( x x) A der Formel wrd ee Parallele zum arthmetsche Mttel deutlch: währed das arthmetsche Mttel de Summe aller Messwerte durch hre Azahl dvdert, wrd her de Summe aller (quadrerte) Abwechugswerte durch hre Azahl dvdert: de Varaz st also auch ee Art Durchschttswert, ämlch de durchschttlche Streuug Stadardabwechug (s) Ist defert als de Quadratwurzel aus der Varaz: s = s Durch Zehug der Wurzel wrd de Quadrerug weder rückgägg gemacht. Dadurch st de durchschttlche Streuug der ursprüglche Maßehet der Varable zu lese. V aratoskoeffzet (V) Ist der Atel der Stadardabwechug am arthmetsche Mttel: V = s x Im Gegesatz zu adere Streuugsmaße quatfzert V de Varabltät eer Vertelug maßstabsuabhägg

Mark Lutter SMS I Tutorum Tel I Deskrptve Statstk Sete 1 vo 51 V eget sch damt sehr gut als Streuugs-Verglechsmaß be mehrere Verteluge ka als Prozetzahl gelese werde (s.u.) Bs p.: Berechug der Streuugsmaße für de Varable Semesterzahl x f 1 1 1 3 10 4 5 5 7 1 Gesamt = 31 Rage: R = 7 1 = 6 Quartlabstad: Q 3 = ¾ 31 = 3,5.Fall Me sswert 4 Q 1 = ¼ 31 = 7,75.Fall Messwert QA = 4 = Mttlerer QA = : = 1 Zur Berechug der Varaz ud der Stadardabwechug empfehlt es sch, ee Arbetstabelle azulege: x f ( x x) ( x x) f ( x x) x =,96773 1 1-1,96773 3,87195 3,87195 1-0,96773 0,93649 11,3788 3 10 0,037 0,00103 0,0103 4 5 1,037 1,06557 5,3785 5,037 4,13011 8,60 7 1 4,037 16,591 16,591 Ge samt = 31 Σ = 44,9673 s = 44,9673 = 1,450558065 1,50 s = 1,50 1,5 31 Zur Iterpretato der Stadardabwechug ud Varaz der Zahlewert der Stadardabwechug steht m Przp für de durchschttlche Streuug eer Vertelug, wobe mt Streuug de Gesamtabwechug aller Messwerte vo hrem arthmetsche Mttel gemet st. De Varaz steht demach für de durchschttlche quadrerte Streuug deswege st de Stadardabwechug m Verglech zur Varaz besser zu terpretere, da hr Ergebs weder der ursprüglche Ehet, der de Varable gemesse wurde, zu lese st. Für obges Bespel wäre ee

Mark Lutter SMS I Tutorum Tel I Deskrptve Statstk Sete vo 51 der folgede Aussage agemesse: De Messwerte streue m Durchschtt um 1,5 Semester um de Mttelwert De Stadardabwechug st e Gütemaß für das arthmetsche Mttel, de: Je gerger de Streuug, desto homogeer st ee Vertelug bzw. desto weger weche de ezele Messwerte vo hrem arthmetsche Mttel ab. Das bedeutet: je gerger de Stadardabwechug, desto besser repräsetert das arthmetsche Mttel de gesamte Vertelug Zur Berechug ud Iterpretato des Varatoskoeffzete: wr erhalte ee Wert vo V = 1,5/,96773 = 0,418 oder 41,8% das bedeutet, de Streuug macht ca. 41% des Mttelwertes aus. Ee Vertelug west kee Streuug auf we: der Rage glech Null st de Summe der quadrerte Abwechuge aller Messwerte vom arthmetsche Mttel glech Null st alle Messwerte glech groß sd alle Messwerte mt dem Mttelwert überestmme alle Messwerte mt dem Modus überestmme es ur ee Messwert gbt. Graphsche Darstellugsmöglchkete vo Häufgke tsverteluge I Abhäggket vom Messveau exstert ee Velzahl vo graphsche Darstellugsmöglchkete: Nomales Messveau: - Balkedagramm (auch: Strefe- bzw. Säuledagramm) - Kresdagramm Ordales Messveau: - Balkedagramm (auch: Strefe- bzw. Säuledagramm) - Kresdagramm - Boxplot (auch: box-ad-whsker-plot) Metrsches Messveau: - Hstogramm - Polgo (auch: Polgozug) - Boxplot (auch: Box-Ad-Whsker-Plot) - Stem-Ad-Leaf-Dspla bzw. Back-to-Back-Stem-Ad-Leaf-Dspla

Mark Lutter SMS I Tutorum Tel I Deskrptve Statstk Sete 3 vo 51 Balkedagramm (auch: Strefe- bzw. Säuledagramm) 60 WAHLABSICHT, BUNDESTAGSWAHL; BEFR. 50 40 30 0 Prozet 10 0 CDU-CSU SPD F.D.P. REPUBLIKANER ANDERE PARTEI BUENDNIS90-GRUENE PDS WAHLABSICHT, BUNDESTAGSWAHL; BEFR. Kresdagramm WAHLABSICHT, BUNDESTAGSWAHL; BEFR. ANDERE PARTEI 1,1% PDS 6,0% REPUBLIKANER,5% BUENDNIS90-GRUENE 8,6% F.D.P. 4,5% CDU-CSU 9,0% SPD 48,% Hstogramm 400 ALTER: BEFRAGTE<R> 300 00 Häufgket 100 0 0,0 30,0 40,0 50,0 60,0 70,0 80,0 90,0 5,0 35,0 45,0 55,0 65,0 75,0 85,0 95,0 Std.abw. = 17,49 Mttel = 48,7 N = 334,00 ALTER: BEFRAGTE<R>

Mark Lutter SMS I Tutorum Tel I Deskrptve Statstk Sete 4 vo 51 Polgozug,5,0 1,5 1,0,5 Prozet 0,0 18 6 30 34 38 4 46 50 54 58 6 66 70 74 78 8 86 90 94 ALTER: BEFRAGTE<R> Boxplot 10 100 80 60 40 0 0 N = Statstke ALTER: BEFRAGTE<R> N Gültg 334 Fehled 0 Mttelwert 48,7 Meda 47,00 Perzetle 5 = Q1 34,00 50 = Q 47,00 75 = Q3 63,00 334 ALTER: BEFRAGTE<R> Stem-Ad-Leaf-Dspla ALTER: BEFRAGTE<R> Stem-ad-Leaf Plot Frequec Stem & Leaf 73,00 1. 888888999 169,00. 00001111333344444 59, 00. 55555556666667777778888889999999 341,00 3. 000000001111111113333333444444444 34,00 3. 555555566666666777777778888888899999999 70,00 4. 00000001111111333334444444 88, 00 4. 555555555666666677777778888888899999 3,00 5. 0000011111333333444444 88, 00 5. 55555566666667777778888888899999999 85,00 6. 0000000111111113333333444444 67,00 6. 55555556666667777777888888999999 17,00 7. 0000111133334444 150,00 7. 555556666777788899 71,00 8. 00113344 3,00 8. 5678& 10,00 9. & 3,00 9. & Stem wdth: 10 Each leaf: 8 case(s)

Mark Lutter SMS I Tutorum Tel I Deskrptve Statstk Sete 5 vo 51.3 Z-Trasformato (Stadardserug vo Varable) Bsp.: setzt metrsche Date voraus Durch ee Z-Trasformato werde Messwerte ee Form umgewadelt, de es erlaubt, se mt Werte derselbe oder eer adere Vertelug zu vergleche Sd z.b. zwe Varable uterschedlche Ehete erfasst (ee Euro, de adere Jahre), da erlaubt de Stadardserug beder Varable dere Verglechbarket Erzeugt werde se, dem ma das arthmetsche Mttel vo jedem Messwert subtrahert ud de Dfferez durch de Stadardabwechug telt: x x x z = s Z-Werte gebe damt a, um we vele (Stadardabwechugs-)Ehete e Messwert oberhalb (be postvem Vorzeche) oder uterhalb (be egatvem Vorzeche) vom Durchschtt legt x f ( x x) x x z = s 1 1-1,96773-1,605 1-0,96773-0,790 3 10 0,037 0,05 4 5 1,037 0,843 5,037 1,659 7 1 4,037 3,9 Gesamt = 31 x =,96773; s =1,5 Durch de z-trasformato erhält ma ee eue Vertelug mt folgede Egeschafte: x x z = s f -1,605 1-0,790 1 0,05 10 0,843 5 1,659 3,9 1 = 31 das arthmetsche Mttel st mmer Null ( z = 0) de Stadardabwech ug st mmer 1 ( s = 1) z

Mark Lutter SMS I Tutorum Tel I Deskrptve Statstk Sete 6 vo 51 3. Bvarate Aalse be der bvarate Aalse geht es darum, de Bezehug (Assozato, Korrelato) zweer Varable zueader zu utersuche Kokret: es geht darum, Maßzahle zu erreche, de de Stärke (ud de Rchtug) des Zusammehags zwsche zwe Varable ausdrücke Dese Maßzahle werde bezechet als Zusammehagsmaße, Korrelatoskoeffzete oder Assozatosmaße 3.1 Zusammehagsm aße für omalskalerte Varable Ch-Quadrat (χ ) baserte Maßzahle: Ph, Cramers V, Kotgezkoeffzet C Um dese Koeffzete bereche zu köe, muss vorher Ch-Quadrat berechet werde: Utersucht ma de Zusammehag zwsche zwe omalskalerte Varable, ka ma dere Häufgkete eer Kreuztabelle darstelle: Bsp.: Zusammehag zwsche Lohzufredehet (Varable X) ud Beschäftgtestatus (Varable Y) (Kotgeztabelle) Arbeter Agestellter Σ Gerge 40 0 60 Lohzufredehet (Zelle a) (Zelle b) Hohe 10 30 40 Lohzufredehet (Zelle c) (Zelle d) Σ 50 50 100 Für de Berechug vo Ch-Quadrat muss zuächst aus der Kotgeztabelle ee Idffereztabelle erstellt werde bzw. es müsse de erwartete Häufgkete berechet werde Ee Kreuztabelle, der de beobachtete (absolute) Häufgkete ) egetrage sd, et ma Kotgeztabelle ( f b Ee Kreuztabe lle, de r de erwartete Häufgkete ( f e ) egetrage sd, et ma Idffereztabelle Erwartete Häufgkete sd de Häufgkete, de ma jeder Zelle der Kreuztabelle erwarte würde, we zwsche de bede Varable ke Zusammehag besteht

Mark Lutter SMS I Tutorum Tel I Deskrptve Statstk Sete 7 vo 51 Berechet werde de erwartete Häufgkete für jede Zelle we folgt: f e = Zelesumme Spaltesumme Gesamtsumme Her: 60 50 Zelle a: f e = = 30 100 60 50 Zelle b: f e = = 30 100 40 50 Z elle c: f e = = 0 100 40 50 Zelle d: f e = = 0 100 Her st de Kotgeztabelle zusamme mt der Idffereztabelle dargestellt: Arbeter Agestellter Σ Gerge f b =40 f b =0 60 Lohzufredehet f e =30 f e =30 Hohe f b =10 f b =30 40 Lohzufredehet f e =0 f e =0 Σ 50 50 100 Da u de erwartete Häufgkete de Häufgkete sd, de ma erwarte würde, we de bede Varable statstsch voeader uabhägg sd (also ke Zusammehag besteht) deutet de Dfferez zwsche de erwartete ud de beobachtete Häufgkete auf ee Zusammehag zwsche de bede Varable h je stärker dese Dfferez st, desto stärker st auch der Zusammehag. Umgekeh rt: je kleer de Dfferez, desto gerger st der Zusammehag Auf desem Koze pt des Verglechs zwsche de beobachtete ud de erwartete Häufgk ete beruht Ch-Quadrat: χ = ( f f b e ) f e We ahad der Formel schtbar, mmt Ch-Quadrat de Wert Null a, we alle f b s ud f e s glech sd

Mark Lutter SMS I Tutorum Tel I Deskrptve Statstk Sete 8 vo 51 Berechug vo Ch-quadrat (Herfür st weder de Afertgug eer Arbetstabelle svoll): Zelle f b f e f b - f e (f b - f e ) ( f f e A 40 30 10 100 3,333 B 0 30-10 100 3,333 c 10 0-10 100 5 d 30 0 10 100 5 Σ=16,666 = χ Der χ -Wert varert zwsche 0 (ke Zusammehag) ud (perfekter Zusammehag) Zur bessere Iterpretato der geaue Stärke des Zusammehags werde u de Ch-Quadrat baserte Maßzahle (Ph, Cramers V, Kotgezkoeffzet C) berechet: Se sd deswege besser zu terpretere, da se ur Werte zwsche 0 (ke Zusammehag) ud 1 (perfekter Zusammehag) aehme. Ph (Φ) (für x Tabelle bzw. Kreuztabelle mt 4 Zelle) b f e ) Φ = χ Her: Φ = 16,666 100 = 0,4081 Cramers V (für Tabelle größer als x) V = χ m( r 1; c 1) mt r = Azahl der Zele ( rows ) c = Azahl der Spalte ( colums ) m = Nur der kleere Wert geht de Berechug e; z.b.: be 3x4 Tabelle seht de Formel so aus: V χ = (3 1)

Mark Lutter SMS I Tutorum Tel I Deskrptve Statstk Sete 9 vo 51 Kotgezkoeffzet C (für belebge Tabelle) χ C = χ + Merke: We χ = 0, da st auch Φ = 0, V = 0 ud C = 0 We Φ = 1, da st χ = Φ ud V sd detsch be x Tabelle P rozetsatzdfferez E weteres, sehr efaches Assozatosmaß st de sog. Prozetsatzdfferez: vgl. dazu Beghaus, a.a.o., S.199ff. 3. Zusammehagsmaße für ordalskalerte Varable Spearmas Rho (r s ) (auch: Ragkorrelatoskoeffzet) r s beschrebt de Zusammehag zwsche zwe Ragrehe de Berechug erfolgt mt folgeder Formel: 6 d r = 1 s ( 1) mt: = Azahl der Fälle Σ d ) = Summe der quadrerte Ragplatzdffereze = Σ(x - Vorgeheswese: 1. Umwadlug der Messwerte Ragplätze. Ragplatzdffereze blde 3. alle Dffereze quadrere ud aufsummere 4. Berechug vo r s