Mathematische und statistische Methoden I
|
|
- Angelika Albert
- vor 7 Jahren
- Abrufe
Transkript
1 Prof. Dr. G. Meinhardt 6. Stock, Wallstr. 3 (Raum ) Sprechstunde jederzeit nach Vereinbarung und nach der Vorlesung. Mathematische und statistische Methoden I Dr. Malte Persike persike@uni-mainz.de WS 2010/2011 Fachbereich Sozialwissenschaften Psychologisches Institut Johannes Gutenberg Universität Mainz Folie 1
2 Das Summenzeichen Σ Notation Sei X eine Variable mit k möglichen Ausprägungen An n Merkmalsträgern werden nun die Beobachtungen x 1, x 2,,x n erhoben Die Summe aller n Beobachtungen ist definiert als n i= 1 x = x + x x i 1 2 n Folie 2
3 Das Summenzeichen Σ Rechenregeln 1. Multiplikation jeder Beobachtung mit einer Konstanten n i= 1 a x = a x + a x a x ( ) 1 2 i = a ( x + x x ) = a n i= x i mit a= const. n n Folie 3
4 Das Summenzeichen Σ Rechenregeln 2. Summation einer Konstanten n b= b + b b i= 1 n-mal = nb mit b = const. Folie 4
5 Das Summenzeichen Σ Rechenregeln 3. Addition einer Konstanten zu jeder Beobachtung Folie 5 n i= 1 x + b = x + b+ x + b x + b ( ) 1 2 i = x1+ x xn + b + b b n n n i i= 1 i= 1 i= 1 i n n-mal = x + b= x + n b mit b = const.
6 Das Summenzeichen Σ Rechenregeln 4. Addition zweier Variablen n i= 1 x + y = x + y + x + y x + y ( ) i i n n = x + x x + y + y y 1 2 n 1 2 n = x + n i i= 1 i= 1 y i n Folie 6
7 Das Summenzeichen Σ Rechenregeln 5. Verbindung von Multiplikation und Addition einer Konstanten n n n ( ) i + = i + a x b a x b i= 1 i= 1 i= 1 n = a x + n b i= 1 mit a, b = const. i Folie 7
8 Das Summenzeichen Σ Geschachtelte Summen - Notation Sei X eine Variable mit k möglichen Ausprägungen und Y eine Variable mit m möglichen Ausprägungen An n Merkmalsträgern werden die Verbundhäufigkeiten h(x i, y j ) erhoben, wobei i=1 k und j=1 m Die Summe aller Verbundhäufigkeiten ist Folie 8 k m i= 1 j= 1 h( x, y ) = h( x, y ) + h( x, y ) h( x, y ) + i j m hx (, y) + hx (, y) hx (, y) hx (, y) + hx (, y) hx (, y) k 1 k 2 k m m
9 Das Summenzeichen Σ Geschachtelte Summen - Rechenregeln 1. Kommutativgesetz k m m k (, ) (, ) i j = h xi y j h x y i= 1 j= 1 j= 1 i= 1 2. Keine Trennung von geschachtelten Summen k m k m h( x, ) (, ) (, ) i y j h xi y j + h xi y j i= 1 j= 1 i= 1 j= 1 nicht definiert Folie 9
10 Variablen & Skalen Nominaldaten Variablen Skalen Nominalskala Notation Merkmale & Variablen Grundlagen Eigenschaften, deren Werte bei den statistischen Einheiten beobachtet werden, heißen Merkmale Die Werte, die ein Merkmal annehmen kann, heißen Ausprägungen Die Ausprägungen eines Merkmals können beliebiger Art sein (z.b. Worte, Formen, Farben etc.) Eine Variable wird definiert, indem den Ausprägungen des Merkmals Zahlen zugeordnet werden. Diese Zahlen heißen Realisationen oder Werte. Folie 2 Merkmal Punkte auf Fläche 2 5 Variable Zahlen
11 Variablen & Skalen Nominaldaten Variablen Merkmale & Variablen Notation Skalen Nominalskala Notation Variablen werden mit Großbuchstaben symbolisiert, häufig verwendet man X und Y Die Realisationen einer Variablen werden dann mit den entsprechenden Kleinbuchstaben gekennzeichnet, also x und y Die Menge aller möglichen Realisationen ist der Wertebereich einer Variablen Folie 3
12 Variablen & Skalen Nominaldaten Variablen Variablen Definition Skalen Variablen werden immer über eine mathematische Formulierung definiert, z.b. Nominalskala Notation Merkmal X Variable x: 1 1, 0, wenn x: 2 1, 2, wenn = x 65 : 5, 6, wenn Die extensionale Definition zählt alle Realisationen der Variablen auf. Folie 4
13 Variablen & Skalen Nominaldaten Variablen Variablen Definition Skalen Variablen werden immer über eine mathematische Formulierung definiert, z.b. Nominalskala Merkmal Variable Notation { 0 } X = + Die intensionale Definition gibt eine Vorschrift an, die die Variable eindeutig spezifiziert. Folie 5
14 Variablen & Skalen Nominaldaten Variablen Variablen & Messungen Grundlagen Skalen Nominalskala Notation Folie 6 Die empirische Feststellung der Realisation einer Variablen wird als Messung bezeichnet Dabei ist zu unterscheiden zwischen der Beobachtung der Ausprägung des Merkmals und der Messung der Realisation der Variablen Denn: Die Beobachtung kann eine Information in beliebiger Form erheben (z.b. verbal, bildlich), die Messung liefert immer eine Zahl. Die gemessenen Zahlen heißen Messwerte oder Ergebnisse
15 Variablen & Skalen Nominaldaten Variablen Skalen Variablen Unterscheidung nach Art der Daten Eine wesentliche Unterscheidung von Typen von Variablen trennt diskrete von stetigen Variablen Nominalskala Eine diskrete Variable besitzt zumeist endlich viele und feste Ausprägungen, die man über Ganzzahlen beschreiben kann Notation Dichtome Variablen haben genau zwei diskrete Ausprägungen Polytome Variablen haben mehr als zwei diskrete Ausprägungen Eine stetige (kontinuierliche) Variable kann (unendlich viele) beliebige Ausprägungen annehmen, die man über reelle Zahlen beschreibt Folie 7
16 Variablen & Skalen Nominaldaten Variablen Skalen Variablen Unterscheidung nach Art der Daten Achtung: Es sind streng Typen von Merkmalen und Typen von Variablen zu unterscheiden. Nominalskala Notation Alter ist ein kontinuierliches bzw. stetiges Merkmal. Eine Variable Alter kann nun aber diskret definiert werden als x 1: 0, wenn <18 Alter X = x 2: 1, wenn <68 x 3: 2, wenn 68 Folie 8 Gleiches gilt z.b. für Intelligenz, Schulleistung, Sehvermögen, Fahreignung
17 Variablen & Skalen Nominaldaten Variablen Skalen Definition Skalen Nominalskala Notation Definition der Skala (oder richtiger: Skale) Eine Skale ist die Festlegung von Einheiten, in denen ein gegebenes Merkmal gemessen wird Die Einheiten sind zumeist numerisch (Zahlen), können aber auch beliebige andere Symbole sein Nur Variablen, die auf derselben Skale gemessen wurden, sind direkt miteinander vergleichbar In allen anderen Fällen müssen die Skalen sofern möglich ineinander überführt werden (Skalentransformation). Folie 9
18 Variablen & Skalen Nominaldaten Variablen Skalen Vom Merkmal zur Skale Zusammenfassung am Beispiel der CAPS (Blake, 1996) Nominalskala Notation Konstrukt: PTSD Merkmal: Kreuze im CAPS? Skale 39 X x 1: 0, wenn 0 ja x 1: 1, wenn 1 ja = x 135: 136, wenn 136 ja Folie 10 Messung Variable: CAPS-Score
19 Variablen & Skalen Nominaldaten Variablen Skalen Nominalskala Notation Vom Merkmal zur Skale Zusammenfassung am Beispiel der CAPS (Blake, 1996) Y=0: Keine PTSD Y=1: Leichte PTSD (nicht krankheitswertig) Y=2: Mittlere PTSD, (krankheitswertig) Y=3: Schwere PTSD Y=4: Extreme PTSD Konstrukt: PTSD Skalentransformation Merkmal: Kreuze im CAPS { } { } { } { } { } y1: 0, X 0,19 y2: 1, X 20,39 Y( X) = y3: 2, X 40,59 y4: 3, X 60,79 y5: 4, X 80, X 0, wenn 0 ja 1, wenn 1 ja = 136, wenn 136 ja Variable: Schweregrad Messung Variable: CAPS-Score Folie 11
20 Variablen & Skalen Nominaldaten Variablen Skalen Nominalskala Notation Skalenniveaus Übersicht Es gibt verschiedene Typen von Skalen, die als Skalenniveaus bezeichnet werden. Nominalskala qualitativ Ordinalskala Intervallskala Verhältnisskala quantitativ (Ratioskala) Absolutskala Der Informationsgehalt nimmt von der Nominalskala zur Absolutskala hin zu Bei Messungen kognitiver Merkmale kommen die Verhältnis- und die Absolutskala so gut wie nie vor Folie 12
21 Variablen & Skalen Nominaldaten Variablen Skalenniveaus Skalen Nominalskala Notation Folie 13 Frage: Warum ist die Kenntnis des Skalenniveaus so wichtig für die psychologische Forschung? 1. Das Skalenniveau bestimmt die erlaubten mathematischen Operationen (=,, <, > etc.) 2. Das Skalenniveau bestimmt, welche mathematischen Transformationen auf die Messwerte einer Variablen angewandt werden dürfen, ohne Informationen zu verlieren. Beispiele: Hat eine Person mit X=40 eine doppelt so schwere PTSD wie jemand mit X=20? Hat eine Person mit Y=2 eine doppelt so schwere PTSD wie jemand mit Y=1? Verliert man durch die Transformation Y(X) Informationen?
22 Variablen & Skalen Nominaldaten Variablen Skalenniveaus Skalen Nominalskala Notation Frage: Warum ist die Kenntnis des Skalenniveaus so wichtig für die psychologische Forschung? 1. Das Skalenniveau bestimmt die erlaubten mathematischen Operationen (=,, <, > etc.) 2. Das Skalenniveau bestimmt, welche mathematischen Transformationen auf die Messwerte einer Variablen angewandt werden dürfen, ohne Informationen zu verlieren. 3. Das Skalenniveau bestimmt damit auch, welche statistischen Verfahren überhaupt auf Daten angewandt werden dürfen. Also: Ohne Skalenniveau keine Statistik Folie 14
23 Variablen & Skalen Nominaldaten Variablen Skalen Nominalskala Definition Nominalskala Notation Bei einer Nominalskala werden den Realisationen einer Variablen Zahlen mit dem Ziel zugeordnet, Kategorien zu unterscheiden Die Zahlen selbst sind vollständig beliebig und damit nicht interpretierbar Die Anwendung mathematischer Operationen auf die Werte einer nominalskalierten Variablen ist unter bestimmten Voraussetzungen möglich, aber zumeist nicht sinnvoll. Folie 15
24 Variablen & Skalen Nominaldaten Variablen Skalen Nominalskala Beispiele Konstitutionstypen Nominalskala Notation a) Leptosomer Typ b) Athletischer Typ c) Pyknischer Typ Temperamentstypen Folie 16
25 Variablen & Skalen Nominaldaten Variablen Skalen Nominalskala Zulässige Operationen Nominalskala Zulässige Operationen sind ausschließlich Äquivalenzrelationen, d.h. Gleich und Ungleich Notation Jede andere Aussage als A ist gleich/ungleich B ist bei einer nominalskalierten Variable unzulässig! Folie 17
26 Variablen & Skalen Nominaldaten Variablen Nominalskala Zulässige Transformationen Skalen Nominalskala Zulässige Transformationen sind eineindeutige Abbildungen, so dass die Unterscheidbarkeit der Realisationen erhalten bleibt. Notation Folie 18
27 Variablen & Skalen Nominaldaten Variablen Exkurs: Notation Indizierung von Realisationen und Merkmalsträgern Skalen Nominalskala Notation Frage: Wie werden Realisationen formal kodiert? Ziel: Eine symbolische Schreibweise für Der Wert der vierten Ausprägung von X zu finden Hat eine Variable X genau k mögliche Realisationen, so werden diese mit x 1, x 2,, x k indiziert Laufindizes (oft i oder j) helfen, die einzelnen Realisationen symbolisch zu adressieren (Beginn bei 1). x : 1, wenn <18 Alter X : 2, wenn <68 1 = x2 x3 : 3, wenn 68 y : 0, wenn <18 Alter Y : 18, wenn <68 1 = y2 y3 : 68, wenn 68 Folie 19
28 Variablen & Skalen Nominaldaten Variablen Exkurs: Notation Indizierung von Realisationen und Merkmalsträgern Skalen Nominalskala Notation Folie 20 Frage: Wie werden Realisationen formal kodiert? Ziel: Eine symbolische Schreibweise für Der Wert der vierten Ausprägung von X zu finden Hat eine Variable X genau k mögliche Realisationen, so werden diese mit x 1, x 2,, x k indiziert Laufindizes (oft i oder j) helfen, die einzelnen Realisationen symbolisch zu adressieren (Beginn bei 1). Das Symbol x j mit j = 1 k bezeichnet dann die j-te Realisation der Zufallsvariablen X. Diese Indizierung ist nur für diskrete Variablen sinnvoll, da stetige Variablen unendlich viele Realisationen haben
29 Variablen & Skalen Nominaldaten Variablen Exkurs: Notation Indizierung von Realisationen und Merkmalsträgern Skalen Nominalskala Notation Folie 21 Frage: Wie werden Merkmalsträger formal kodiert? Ziel: Eine symbolische Schreibweise für Der Wert der vierten Person in der Stichprobe zu finden Konvention: Für die Gesamtzahl von Personen wird nahezu immer das Zeichen n (oder N) benutzt. Für die Gesamtzahl von Realisationen werden andere Kleinbuchstaben verwendet (z.b. k) Dann dient wieder ein Laufindex dazu, die einzelnen Personen zu adressieren Das Symbol x i mit i = 1 n bezeichnet dann die i-te Messung der Zufallsvariablen X.
30 Variablen & Skalen Nominaldaten Variablen Exkurs: Notation Indizierung von Realisationen und Merkmalsträgern Skalen Nominalskala Notation Problem: Das Symbol x 3 kann die dritte Realisation der Zufallsvariablen X sein oder auch der Wert der 3. Person in der Stichprobe Also: Es muss vorher definiert sein, was der Laufindex bedeutet, z.b. Die Variable X habe k Realisationen und sei an n Personen gemessen worden. x i x j Folie 22 mit i = 1 n mit j = 1 k
31 Variablen & Skalen Nominaldaten Variablen Exkurs: Notation Indizierung von Realisationen und Merkmalsträgern Skalen Nominalskala Notation Folie 23 In psychologischen Experimenten gibt es oft viele Variablen, die als UV oder AV erhoben werden. Beispiel: An einer Stichprobe von Personen verschiedenen Geschlechts wird der durchschnittliche Alkoholkonsum über einen Monat hinweg gemessen. Man hat hier offenbar 3 Variablen sowie mehrere Messungen verschiedener Merkmalsträger IQ als AV: (X) Geschlecht als UV (Y) Alkoholabhängigkeit als UV (Z) Frage: Wie indiziert man z.b. Die IQ-Messung des 4. Mannes in der Gruppe der Alkoholiker?
32 Variablen & Skalen Nominaldaten Variablen Skalen Nominalskala Exkurs: Notation Indizierung von Realisationen und Merkmalsträgern Die Variable Geschlecht (Y) wird in k=2 Ausprägungen gemessen: y 1 : 0 = männlich y 2 : 1 = weiblich Notation Die Variable Alkoholkonsum (Z) wird diskretisiert in m=5 Ausprägungen (Jelinek, 1951) gemessen: z 1 : 0 = Kein Alkoholkonsum z 2 : 1 = Konflikt-/Erleichterungstrinken z 3 : 2 = Gelegenheitstrinken z 4 : 3 = Rauschtrinken (Alkoholiker) z 5 : 4 = Periodisches Trinken (Alkoholiker) Folie 24 Es nehmen insgesamt n=220 Personen teil
33 Variablen & Skalen Nominaldaten Variablen Exkurs: Notation Indizierung von Realisationen und Merkmalsträgern Skalen Nominalskala Notation Die AV ist der IQ. Dies ist die Variable, deren Realisation im Experiment bei den Merkmalsträgern gemessen wird. Die beiden anderen Variablen sind UVen, deren Realisationen vor dem Experiment bereits feststehen, bzw. erhoben werden. Zur eindeutigen Indizierung des IQ eines Merkmalsträgers werden nun mehrere Laufindizes benötigt Folie 25
34 Variablen & Skalen Nominaldaten Variablen Skalen Exkurs: Notation Indizierung von Realisationen und Merkmalsträgern Eine Person fällt immer in eine der k m = 2 5 = 10 Gruppen von Geschlecht und Alkoholkonsum Nominalskala Notation Der Laufindex für Geschlecht sei r = 1 k und für Alkoholkonsum s = 1 m Jede der 10 Gruppen hat also n rs Mitglieder Jede Person kann eindeutig identifiziert werden über x irs mit i=1 n rs r=1 k, s=1 m Folie 26 So ist z.b. x 4,1,3 der vierte Mann unter den Gelegenheitstrinkern
35 Variablen & Skalen Nominaldaten Variablen Exkurs: Notation Indizierung von Realisationen und Merkmalsträgern Skalen Nominalskala Notation Oft möchte man über einen der Indizes integrieren (z.b. mitteln) Beispiel: Alle weiblichen Rauschtrinker Dann kommt die Punktnotation zum Einsatz x rs hier: x,2,5 Der Punkt symbolisiert Alle, in diesem Fall also Alle Personen in Gruppe Y=y r, Z=z s. Folie 27
36 Variablen & Skalen Nominaldaten Häufigkeiten Nominaldaten Numerische Beschreibung: Häufigkeiten Kreuztabellen Kennwerte Darstellung Nominalskalierte Variablen sind praktisch immer diskret und endlich Die empirische beobachtete Häufigkeit des Auftretens einer Ausprägung X = x wird als h(x = x) oder vereinfacht h(x) geschrieben. h(x) bezeichnet man als absolute Häufigkeit Die relative Häufigkeit f(x = x) bzw. f(x) ist dann definiert als der Quotient aus absoluter Häufigkeit und der Anzahl n aller Beobachtungen hx ( ) f ( x) = h( x) = f( x) n n Achtung: Relative Häufigkeiten sind nicht Wahrscheinlichkeiten Folie 28
37 Variablen & Skalen Nominaldaten Häufigkeiten Kreuztabellen Kennwerte Darstellung Nominaldaten Numerische Beschreibung: univariate Kreuztabellen Die Sammlung der Werte der h(x = x j ) und f(x = x j ) für alle möglichen j = 1 k wird als diskrete Häufigkeitsverteilung bezeichnet Wert von X h(x = x j ) f(x = x j ) x 1 h(x 1 ) f(x 1 ) x 2 h(x 2 ) f(x 2 ) x i h(x i ) f(x i ) x k h(x k ) f(x k ) Tabellarische Darstellung über Kreuztabellen (oder Kontingenztabellen) Folie 29
38 Variablen & Skalen Nominaldaten Häufigkeiten Nominaldaten Numerische Beschreibung: bivariate Kreuztabellen Kreuztabellen Kennwerte Darstellung Oft betrachtet man Häufigkeiten für das gemeinsame Auftreten zweier Merkmale Beispiel: Frauen/Männer, die unter-/normal- /übergewichtig sind In diesem Fall werden 2 Variablen betrachtet: X: Geschlecht (x 1, x 2 ) Y: Gewichtsstatus (y 1, y 2, y 3 ) Die Häufigkeiten sind nun so genannte Verbundhäufigkeiten, die das Vorkommen jeder möglichen Kombination aus x und y beschreiben Folie 30
39 Variablen & Skalen Nominaldaten Häufigkeiten Kreuztabellen Kennwerte Darstellung Folie 31 Nominaldaten Numerische Beschreibung: bivariate Kreuztabellen Absolute Verbundhäufigkeiten werden im bivariaten Fall symbolisiert als h(x=x, Y=y) bzw. h(x, y) Relative Verbundhäufigkeiten als f(x=x, Y=y) bzw. f(x, y) Tabellarische Darstellung über bivariate Kreuztabellen Geschlecht Männlich (x 1 ) Weiblich (x 2 ) Σ Unter (y 1 ) f(x 1,y 1 ) f(x 2,y 1 ) f(,y 1 ) Gewicht Normal (y 2 ) f(x 1,y 2 ) f(x 2,y 2 ) f(,y 2 ) Über (y 3 ) f(x 1,y 3 ) f(x 2,y 3 ) f(,y 3 ) Σ f(x 1, ) f(x 2, ) f(, ) Randhäufigkeiten
40 Variablen & Skalen Nominaldaten Häufigkeiten Nominaldaten Numerische Beschreibung: multivariate Kreuztabellen Kreuztabellen Kennwerte Darstellung Auch das gemeinsame Vorkommen von mehr als zwei Merkmalen ist über Kreuztabellen darstellbar Beispiel: Frauen/Männer, die unter-/normal- /übergewichtig sind und Stricken/World of Warcraft spielen In diesem Fall werden 3 Variablen betrachtet: X: Geschlecht (x 1, x 2 ) Y: Gewichtsstatus (y 1, y 2, y 3 ) Z: Freizeitbeschäftigung (z 1, z 2 ) Folie 32
41 Variablen & Skalen Nominaldaten Häufigkeiten Nominaldaten Numerische Beschreibung: multivariate Kreuztabellen Kreuztabellen Kennwerte Absolute Verbundhäufigkeiten werden im multivariaten Fall symbolisiert als h(x=x, Y=y, ) bzw. h(x, y, ) Relative Verbundhäufigkeiten als f(x=x, Y=y, ) bzw. f(x, y, ) Darstellung Tabellarische Darstellung über geschachtelte (oder genestete ) Kreuztabellen Geschlecht Männlich (x 1 ) Weiblich (x 2 ) Freizeit Stricken (z 1 ) WoW (z 2 ) Stricken (z 1 ) WoW (z 2 ) Unter (y 1 ) f(x 1,y 1,z 1 ) f(x 1,y 1,z 2 ) f(x 2,y 1,z 1 ) f(x 2,y 1,z 2 ) Gewicht Normal (y 2 ) f(x 1,y 2,z 1 ) f(x 1,y 2,z 2 ) f(x 2,y 2,z 1 ) f(x 2,y 2,z 2 ) Über (y 3 ) f(x 1,y 3,z 1 ) f(x 1,y 3,z 2 ) f(x 2,y 3,z 1 ) f(x 2,y 3,z 2 ) Folie 33
42 Variablen & Skalen Nominaldaten Häufigkeiten Nominaldaten Rechnen mit Häufigkeiten (am bivariaten Beispiel) Kreuztabellen Kennwerte Darstellung Anzahl Beobachtungen: Randhäufigkeiten für x: analog für f(x i, ) Randhäufigkeiten für y: analog für f(y j, ) k x y n= h(,) = h( xi, yj) k y k i= 1 j= 1 hx (, ) hx (, y) = i i j j= 1 k x h(, y ) h( x, y ) = j i j i= 1 Folie 34 Darüber hinaus gilt: k k x y i= 1 j= 1 f( x, y ) = 1 i j
43 Variablen & Skalen Nominaldaten Häufigkeiten Nominaldaten Numerische Beschreibung: Kennwerte Kreuztabellen Kennwerte Darstellung Als Kennwert bezeichnet man ein statistisches Maß, das eine Menge von Beobachtungen über zumeist nur eine Zahl beschreibt Kennwerte dienen damit der Datenreduktion Kennwerte charakterisieren lediglich bestimmte Eigenschaften der gegebenen Menge von Beobachtungen, sie bedeuten als einen Informationsverlust Folie 35
44 Variablen & Skalen Nominaldaten Häufigkeiten Nominaldaten Numerische Beschreibung: Kennwerte Kreuztabellen Kennwerte Darstellung Ein Kennwert für nominalskalierte Daten ist der Modalwert (oder Modus ) Er bezeichnet die unter den Beobachtungen am häufigsten vorkommende Ausprägung x : x f( x) = max. mod Wichtig: Der Modalwert ist nicht die Häufigkeit, sondern der Wert der häufigsten Ausprägung. Folie 36 Bei mehreren Maxima sinkt die Aussagekraft von x mod
45 Variablen & Skalen Nominaldaten Häufigkeiten Kreuztabellen Kennwerte Darstellung Nominaldaten Beschreibung: Kreisdiagramm Das Kreis- oder Tortendiagramm stellt die relativen oder absoluten Häufigkeiten von Klassen als Kreissegmente eines Vollkreises ( Tortenstücke ) dar. Der Öffnungswinkel α eines Tortenstücks ist dabei durch den Anteil der Klassenelemente an allen Elementen definiert und wird berechnet als hx ( ) α = 360 = 360 f ( x) n Die Summe der Öffnungswinkel aller Kreissegmente sollte wieder 360 ergeben Folie 37
46 Variablen & Skalen Nominaldaten Häufigkeiten Kreuztabellen Nominaldaten Beschreibung: Kreisdiagramm Beispiel: Von den Wahlgängern der Bundestagswahl 2009 haben gewählt: Kennwerte % % Darstellung Folie % % % % SPD CDU/CSU FDP Grüne Linke Sonstige
47 Variablen & Skalen Nominaldaten Häufigkeiten Nominaldaten Beschreibung: Säulendiagramm Kreuztabellen Kennwerte Darstellung Das Balken- oder Säulendiagramm stellt die relativen oder absoluten Häufigkeiten von Ausprägungen als Balken (waagerecht) oder Säulen (senkrecht) dar. Die verschiedenen möglichen Ausprägungen werden auch als Klassen bezeichnet Der Länge der Säulen bzw. Balken ist dabei durch den Anteil der Klassenelemente am Ganzen bzw. die absolute Anzahl definiert. Die Breite der Balken variiert niemals innerhalb eines Balkendiagramms Folie 39
48 Variablen & Skalen Nominaldaten Häufigkeiten Kreuztabellen Nominaldaten Beschreibung: Säulendiagramm Beispiel: Von den Wahlgängern der Bundestagswahl 2009 haben gewählt: Kennwerte Wahlergebnis in Mio. % Darstellung 23.0% % % 10.7% % % 2.60 SPD CDU/CSU FDP Grüne Linke Sonstige Folie 40
49 Variablen & Skalen Nominaldaten Häufigkeiten Kreuztabellen Nominaldaten Beschreibung: Säulendiagramm Warum gleiche Säulenbreiten? Kennwerte Darstellung Folie 41 Menschen neigen zur Größenbewertung anhand der Fläche.
50 Ordinalskala Ordinaldaten Ordinalskala Definition Häufigkeiten Kennwerte Darstellung Bei einer Ordinalskala können die Realisationen einer Variablen (natürlich) geordnet werden Die Zuordnung der Zahlen zu den Ausprägungen spiegelt die Ordnung wieder Abstände zwischen den Zahlen können nicht interpretiert werden Die Anwendung von Rechenoperationen auf die Werte einer ordinalskalierten Variablen ist unter bestimmten Voraussetzungen erlaubt, aber im Allgemeinen eher wenig sinnvoll Folie 42
51 Ordinalskala Ordinaldaten Ordinalskala Beispiel Häufigkeiten Kennwerte Darstellung Folie 43 Social Penetration Theory von Altman und Taylor (1958) (I) (II) (III) (IV) (V) Orientierungsstadium: Sozial erwünschte Normen und Verhaltensschemata werden ausgetauscht (z.b. Smalltalk) Exploratorisch-affektives Stadium: Partielle Öffnung der eigenen Einstellungs- und Wahrnehmungswelt gegenüber dem Anderen im Hinblick auf private, vor allem aber berufliche und weltanschauliche Inhalte. Weiterhin vorsichtige Prüfung der Interaktionsformen ( Bekanntschaftsphase ). Affektives Stadium: Intensiver und möglicherweise kritischer Austausch über private und persönliche Themen. Körperliche Zuwendung wie Berühren und Küssen. Stabiles Stadium: Die Beziehung erreicht ein Plateau, persönliche Inhalte sind geteilt, Verhalten und Emotionen des Anderen vorhersagbar. Depenetration: Zusammenbruch und mögliches Ende der Beziehung, Überwiegen von Kosten gegenüber dem Nutzen.
52 Ordinaldaten Ordinalskala Ordinalskala Zulässige Operationen Häufigkeiten Kennwerte Darstellung Zulässige Operationen sind Äquivalenzrelationen, d.h. Gleich und Ungleich Zudem erlaubt sind qualitative Vergleichsrelationen, d.h. Größer oder Kleiner Wichtig: Diese Vergleichsrelationen umfassen nicht jede Art quantitativer Vergleiche Eine Aussage wie A ist gleich/ungleich/größer/kleiner B ist bei einer ordinalskalierten Variable zulässig, nicht aber A ist viermal so groß wie B. Folie 44
53 Ordinaldaten Ordinalskala Ordinalskala Zulässige Transformationen Häufigkeiten Zulässig sind alle streng monotonen Transformationen, so dass die Rangordnung der Werte erhalten bleibt. Kennwerte Darstellung Folie 45
54 Ordinaldaten Ordinalskala Ordinalskala Kritische Betrachtung Häufigkeiten Kennwerte Darstellung Bei Ordinalskalen und höheren Skalenniveaus können Intransitivitäten auftreten Intransitivität = Eine angenommene Ordnung gilt nicht für bestimmte einzelne Paarungen Beispiel: Nahrungskette in chinesischen Restaurants Mensch Hund Ratte Mensch (nach Glutamatvergiftung) Lösungen: Annahme eines niedrigeren Skalenniveaus, Einführung neuer Skalenstufen Folie 46
55 Ordinaldaten Ordinalskala Ordinaldaten Numerische Beschreibung: Häufigkeiten Häufigkeiten Kennwerte Darstellung Ordinalskalierte Variablen sind sehr häufig diskret und endlich Es gelten die bereits eingeführten Notationen und Berechnungsvorschriften für empirische Häufigkeiten Neben der Häufigkeitsverteilung kann auch noch die empirische Verteilungsfunktion bestimmt werden. Diese gibt an, wie viele Beobachtungen kleiner oder gleich einer bestimmten Ausprägung x sind. Folie 47 Zur Berechnung der Verteilungsfunktion müssen die Ausprägungen zunächst der Größe nach geordnet werden.
56 Ordinaldaten Ordinalskala Ordinaldaten Numerische Beschreibung: Häufigkeiten Häufigkeiten Kennwerte Darstellung Empirische Häufigkeitsverteilung und Verteilungsfunktion: Wert von X (geordnet) f(x = x j ) F(X x j ) x 1 f(x 1 ) f(x 1 ) x 2 f(x 2 ) f(x 1 )+f(x 2 ) x k f(x k ) f(x 1 )+f(x 2 )+ +f(x k ) Berechnungsvorschrift: analog für absolute Vert.funkt. H(X x j ) j F( X x ) f( x ) j = c= 1 c Für Ordinaldaten gelten die bereits eingeführten Konventionen zur Erstellung von Kreuztabellen Folie 48
57 Ordinaldaten Ordinalskala Ordinaldaten Numerische Beschreibung: Kennwerte Häufigkeiten Kennwerte Darstellung Maße der zentralen Tendenz Median Andere Lagemaße Modalwert Extrema (Minimum, Maximum) Quantile Streuungsmaße (Dispersionsmaße) Spannweite (Halber) Interquartilsabstand Folie 49
58 Ordinaldaten Ordinalskala Ordinaldaten Numerische Beschreibung: Median Häufigkeiten Kennwerte Darstellung Mindestens 50% der Beobachtungen einer Variablen sind kleiner oder gleich dem Median Mindestens 50% der Beobachtungen einer Variablen sind größer oder gleich dem Median Notation: xmed oder x Problem: Bei einer geraden Zahl von Beobachtungen ist der Median nicht eindeutig. Er liegt dann zwischen den Beobachtungen Folie 50
59 Ordinaldaten Ordinalskala Ordinaldaten Numerische Beschreibung: Median Häufigkeiten Kennwerte Darstellung Folie 51 Der Median stimmt häufig mit keiner beobachteten Ausprägung überein Median (und auch der Modalwert) sind äquivariant gegenüber gewissen (z.b. linearen) Transformationen Insbesondere 1. Addition einer Konstanten a zu allen n Messwerten x 1 x n x + a= x + a 2. Multiplikation aller n Messwerte x 1 x n mit einer Konstanten a x a= x a
60 Ordinaldaten Ordinalskala Häufigkeiten Kennwerte Darstellung Ordinaldaten Numerische Beschreibung: Quantile Quantile sind Zahlen, die einen Datensatz mit n Beobachtungen in bestimmtem Verhältnis teilen p-quantil (0 < p < 1) besitzt folgende Eigenschaften: 1. Mindestens n p Beobachtungen sind kleiner oder gleich dem Quantil 2. Mindestens n (1 p) Beobachtungen sind größer oder gleich dem Quantil Notation: x p (z. B. x 0.75 ) Je nach der Anzahl von Unterteilungen unterscheidet man Centile (100er Einteilung), Dezentile (10er Einteilung) und Quartile (4er Einteilung) Folie 52
61 Ordinaldaten Ordinalskala Häufigkeiten Ordinaldaten Numerische Beschreibung: Quantile Wichtige Quantile sind: Kennwerte Minimum (0. Quartil) und Maximum (4. Quartil) Darstellung Median (50% Quantil, 2. Quartil) 25% Quantil (1. Quartil, unteres Quartil) und 75% Quantil (3. Quartil, oberes Quartil) Dezile: x.10, x.20,, x.90 Folie 53
62 Ordinaldaten Ordinalskala Häufigkeiten Kennwerte Darstellung Ordinaldaten Quantile A cautionary note about conventions In Literatur und Softwarepaketen sind die Berechnungsvorschriften für Quantile häufig unterschiedlich definiert oder sogar fehlerhaft. Maß Bortz Excel SPSS Median Quartil Quartil Für den Beispieldatensatz mit n=12. Folie 54
63 Ordinaldaten Ordinalskala Ordinaldaten Der Quantilsrang Häufigkeiten Kennwerte Darstellung Als p-quantil war diejenige Ausprägung x der Variablen X definiert, die die Daten in einen Anteil von p Datenwerten unterhalb oder gleich der Ausprägung x sowie 1-p Datenwerten oberhalb oder gleich x teilt. Besonders bei angewandten Fragestellungen ist oft auch die entgegengesetzte Sichtweise relevant. Beispiel: Eine Person habe in einem Leistungstest einen Wert von 105 Punkten erzielt. Wie viele Personen in der Stichprobe sind nun besser/schlechter? Dies kann über den Quantilsrang ermittelt werden. Folie 55
64 Ordinaldaten Ordinalskala Häufigkeiten Kennwerte Darstellung Ordinaldaten Der Quantilsrang Verfahren der Rangbildung Bei der Rangbildung von k Ausprägungen x 1 x k einer Variablen X können maximal k Ränge vergeben werden. Per Konvention erhält die numerisch niedrigste Ausprägung von X den Rangplatz 1, die höchste den Rangplatz k (kleinere Zahl = kleinerer Rang). Bei mehreren gleichen Werten ( Ties ) von X wird der mittlere Rangplatz vergeben nach der Regel: Es gebe m gleiche Werte von X. Wären sie unterschiedlich und direkt aufeinander folgend, erhielten sie die Rangplätze rg j rg j+m-1. Der mittlere Rang ist dann Folie 56 rg Tie rg 1 j + m 1 = m i= rg j rg i
65 Ordinaldaten Ordinalskala Ordinaldaten Der Quantilsrang Berechung Häufigkeiten Kennwerte Darstellung Nach der Berechnung der Rangzahl rg(x) eines Merkmalsträgers ermittelt man seinen Quantilsrang p über p = ( ) 0.5 rg x n = Stichprobengröße (d.h der maximale Rang) Problem: p reicht nicht von 0 bis 1, sondern liegt in einem etwas schmaleren Bereich, abhängig von der Größe des n. n Die Korrekturformel für den Quantilsrang behebt dieses Problem Folie 57 p corr = p p p p max min min
66 Ordinaldaten Ordinalskala Ordinaldaten Numerische Beschreibung: Spannweite Häufigkeiten Kennwerte Darstellung Die Spannweite d k ist die Differenz zwischen dem kleinsten und größten Wert aller Ausprägungen. Sie ist definiert als: d = x x k max min Die Spannweite ist nicht identisch mit der Anzahl unterschiedlicher Ausprägungen. Die Spannweite ist eher uninformativ, da sie nur zwei von k Ausprägungen berücksichtigt. Folie 58
67 Ordinaldaten Ordinalskala Ordinaldaten Numerische Beschreibung: Interquartilsabstand Häufigkeiten Kennwerte Darstellung Der Interquartilsabstand d q ist die Differenz zwischen dem 1. und 3. Quartil Er ist definiert als d = x x q Manchmal wird ein halber Interquartilsabstand berechnet als d q /2. Folie 59
68 Ordinaldaten Ordinalskala Häufigkeiten Kennwerte Darstellung Ordinaldaten Beschreibung: Stamm-Blatt Diagramm Das Stamm-Blatt Diagramm stellt Häufigkeitsdaten grafisch ohne Verlust von Informationen dar. Es eignet sich besonders für kleine Datensätze. Das Diagramm besteht aus 2 Spalten Stamm = Äquivalenzklassen (feste Dezimalstellen) Blätter = Merkmale (variable Dezimalstellen) Die Stammbreite bezeichnet dabei die Breite der Klassen des Stamm-Blatt Diagramms Folie 60
69 Ordinaldaten Ordinalskala Häufigkeiten Kennwerte Darstellung Ordinaldaten Beschreibung: Stamm-Blatt Diagramm Beispiel: Gegeben seien Beobachtungen an einer Stichprobe mit n = 30. (2, 8, 10, 11, 11, 12, 13, 14, 15, 17, 18, 19, 20, 21, 21, 23, 23, 24, 24, 25, 25, 26, 27, 27, 28, 28, 29, 29, 30, 32) Mit Stammbreite = 10 Folie 61
70 Ordinaldaten Ordinalskala Häufigkeiten Kennwerte Darstellung Ordinaldaten Beschreibung: Stamm-Blatt Diagramm Beispiel: Gegeben seien Beobachtungen an einer Stichprobe mit n = 30. (2, 8, 10, 11, 11, 12, 13, 14, 15, 17, 18, 19, 20, 21, 21, 23, 23, 24, 24, 25, 25, 26, 27, 27, 28, 28, 29, 29, 30, 32) Folie 62 Mit Stammbreite = 5
71 Ordinaldaten Ordinalskala Häufigkeiten Kennwerte Ordinaldaten Beschreibung: Stamm-Blatt Diagramm Das Stamm- Blatt Diagramm eignet sich auch zum Vergleich zweier Verteilungen. Darstellung Mit Stammbreite = 5 Folie 63
72 Ordinaldaten Ordinalskala Häufigkeiten Kennwerte Darstellung Ordinaldaten Beschreibung: Empirische Verteilungsfunktion Die empirische Verteilungsfunktion bei k Realisationen ist j F( X x ) = F( x ) = f ( x ) j j c c= 1 mit j = 1 k Note x h(x) f(x) F(x) Zur grafischen Darstellung werden also die empirischen relativen Häufigkeiten aufsummiert Folie 64
73 Ordinaldaten Ordinalskala Ordinaldaten Beschreibung: Box-Whisker-Plot Häufigkeiten Kennwerte Darstellung Mithilfe der Fünf-Punkte- Zusammenfassung (x min, x.25, x med, x.75, x max ) können Häufigkeitsdaten grafisch am Boxplot veranschaulicht werden. Diese Variante ist problematisch, weil Ausreißer die Länge der Whisker erheblich vergrößern können x max x.75 x x.25 x min Note Folie 65
74 Ordinaldaten Ordinalskala Ordinaldaten Beschreibung: Box-Whisker-Plot Häufigkeiten Kennwerte Darstellung Eine zweite häufig verwendete Variante des Boxplots verwendet den 1.5fachen Interquartilsabstand d q für die Länge der Whisker. Box und Whisker enden am letzten Datenpunkt innerhalb ihrer Reichweite Datenpunkte außerhalb der Whisker werden explizit eingetragen () dq x.75 x x dq < 3 dq dq Folie 66 Ausreißer >3d q werden mit Sternchen (*) markiert. Note
75 Ordinaldaten Ordinaldaten Beschreibung: Box-Whisker-Plot Folie 67
76 Ordinaldaten Ordinaldaten Beschreibung: Box-Whisker-Plot Folie 68
77 Ordinaldaten Beschreibung How-not -to Folie 69
78 Ordinaldaten Beschreibung How-not -to Keine Geschlechterlücke mehr beim Gehalt von Führungskräften Folie 70
79 Ordinaldaten Beschreibung How-not -to Bild fragt: Brauchen wir eine Ausländerquote an deutschen Schulen? als Reaktion auf PISA 2008 Folie 71
80 Relevante Excel Funktionen Häufigkeitsberechnungen Grundrechenarten: +, -,, / Formeln: SUMME(), PRODUKT(), QUOTIENT() Häufigkeitsdarstellungen ANZAHL2() ZÄHLENWENN(), ZÄHLENWENNS() HÄUFIGKEIT() Diagramme: Kreisdiagramm, Säulen-/Balkendiagramm Kennwerte MIN(), MAX() MEDIAN(), MODUS.EINF() QUANTIL().INKL(), QUARTILE.INKL(), QUANTILSRANG.INKL() Folie 72
81 Ordinaldaten Intervallskala Kreuztabellen Intervallskala Definition Es wird eine Einheit definiert Darstellung I Es existiert kein natürlicher Nullpunkt Differenzen von Werten können verglichen werden, nicht aber die Werte selbst Wird am häufigsten in empirischen psychologischen Untersuchungen angenommen Intervallskalierte Variablen können diskret oder stetig sein Folie 2
82 Ordinaldaten Intervallskala Intervallskala Beispiel Kreuztabellen Darstellung I Attitudes Toward Housecleaning Scale von Ogletree, Worthen, Turner & Vickers (2006). Ihre Aufgabe ist es, ihre Gefühle gegenüber jeder Aussage dahingehend zu kennzeichnen, ob sie (1) stark zustimmen, (2) etwas zustimmen, (3) weder zustimmen noch ablehnen, (4) etwas ablehnen oder (5) stark ablehnen. Bitte verdeutlichen Sie Ihre Meinung dadurch, dass sie entweder 1, 2, 3, 4 oder 5 auf dem Antwortblatt schwärzen. Folie 3 Einen Stapel dreckigen Geschirrs über Nacht im Spülbecken liegen zu lassen finde ich ekelhaft. Ich finde Staubwischen entspannend. Den Müll rauszubringen macht mir Spaß Frauen sollten die primäre Verantwortung für die Hausarbeit übernehmen. Eine unordentliche Wohnung zu haben macht mir nichts
83 Ordinaldaten Intervallskala Intervallskala Zulässige Transformationen Kreuztabellen Darstellung I Zulässige Operationen sind Äquivalenzrelationen, d.h. Gleich und Ungleich Zudem erlaubt sind qualitative Vergleichsrelationen, d.h. Größer oder Kleiner Erlaubt sind weiterhin quantitative Vergleichsrelationen, die sich auf Differenzen beziehen Eine Aussage wie Der Unterschied zwischen A und B ist doppelt so groß wie zwischen A und C ist bei einer intervallskalierten Variable zulässig, nicht aber A ist doppelt so groß wie B. Folie 4
84 Ordinaldaten Intervallskala Intervallskala Zulässige Transformationen Kreuztabellen Darstellung I Zulässig sind alle linearen Transformationen (die Grundrechenarten), so dass die Verhältnisse zwischen Differenzen erhalten bleiben. Folie 5
85 Ordinaldaten Intervallskala Kreuztabellen Intervallskala Zulässige Transformationen Darstellung I Folie 6 Die Aussage Person E ist doppelt so gut wie Person C, ausgehend von Skala 1, gilt nicht für Skala 3 und 4.
86 Ordinaldaten Intervallskala Kreuztabellen Intervallskala Zulässige Transformationen Darstellung I Folie 7 Wohl aber gilt immer: Der Unterschied zwischen A und B ist doppelt so groß wie zwischen B und C
87 Ordinaldaten Intervallskala Intervallskala Kritische Betrachtung Kreuztabellen Darstellung I Die bekanntesten und am meisten verbreiteten statistischen Verfahren setzen eine Intervallskala voraus Der Umgang mit niedrigeren Skalenniveaus ist mathematisch oftmals weitaus komplexer Die ungeprüfte Annahme der Intervallskala in psychologischen Untersuchungen ist oft problematisch Beispiele: IQ-Skala, 7-Punkte Likert Skala, Becks Depressionsskala (BDI) Folie : Keine bis minimale Depression 14 19: Milde Depression 20 28: Moderate Depression 29 63: Schwere Depression
88 Ordinaldaten Intervallskala Numerische Beschreibung: Kreuztabellen Kreuztabellen Darstellung I Problem: Intervallskalierte Variablen können u.u. beliebige Ausprägungen besitzen, die sich nicht mehr sinnvoll in einer Tabelle darstellen lassen Beispiele: Körpergrößen, Serotoninspiegel, Reaktionszeit Lösung: Es muss eine Aggregation vieler Ausprägungen in wenige Kategorien (oder Klassen ) stattfinden Bei der Klassenbildung für eine Variable X findet im Prinzip nichts anderes als eine Transformation von X in eine neue Variable Y statt, und zwar gemäß Y y1 : X = { } y2 : X = { } = yk : X = { } Folie 9
89 Ordinaldaten Intervallskala Numerische Beschreibung: Klassenbildung Kreuztabellen Darstellung I Folie 10 Die Messwertklassen dürfen sich nicht überschneiden, sie sind also wechselseitig ausschließend. Die untere und obere Klassengrenze UG j und OG j gehören zur Klasse c j, die obere Grenze der vorherigen Klasse OG j-1 jedoch nicht. c j = [UG j OG j ] oder c j = (OG j-1 UG j+1 ] Alle Klassen haben im Normalfall dieselbe Breite. Die Anzahl der Klassen ist zunächst frei wählbar. Es ist aber zu beachten: 1. Es sollte möglichst wenige leere Klassen geben 2. Es sollten keine in den Daten enthaltenen wichtigen Informationen herausggregiert werden (z.b. mehrere Modalwerte)
90 Ordinaldaten Intervallskala Numerische Beschreibung: Klassenbildung Kreuztabellen Darstellung I Folie 11 Zur Bestimmung der Anzahl von Klassen gibt es verschiedene Formeln. Als Faustregeln gelten: Anzahl der Ausprägungen k 5 bis 50 5 bis 8 Klassenzahl c 50 bis bis bis bis 12 >250 8 bis 25 Eine einfache Formel, die oft zu einer sinnvollen Klassenanzahl c führt, lautet ( n) c= log2 + 1 mit = Aufrundung Statt der Beobachtungen n wird manchmal auch die Anzahl der Realisationen k verwendet.
91 Ordinaldaten Intervallskala Numerische Beschreibung: Klassenbildung Kreuztabellen Die Klassenbreite d bei einer gewünschten Anzahl von c gleich breiten Klassen wird berechnet als Darstellung I max( X ) min( X ) d = c Hier ist X die ursprüngliche intervallskalierte Variable Bei der Berechnung der Klassenbreite muss auf Ausreißer in der Variablen X geachtet werden, da solche die Klassenbreite erheblich verzerren können. Folie 12
92 Ordinaldaten Intervallskala Kreuztabellen Darstellung I Numerische Beschreibung: Klassenbildung 25 Abiturienten erreichen in ihrer Abschlussarbeit folgende Punktzahlen: (11, 15, 8, 13, 8, 11, 14, 11, 11, 14, 13, 11, 2, 9, 10, 10, 14, 7, 7, 12, 12, 8, 6, 11, 13) Unter der Annahme, dass die Notenskala von 1 bis 15 reicht, ergibt sich diese Häufigkeitstabelle bei 5 Klassen: Note h(x) f(x) F(x) Folie 13
93 Ordinaldaten Intervallskala Kreuztabellen Darstellung I Numerische Beschreibung: Klassenbildung 25 Ratten erreichen in einem Experiment folgende Reaktionszeiten: (11.23, 15.1, , 13.3, 8.955, 11.0, , 11.63, 11.39, , , 11.32, 2.5, 9.814, 10.03, 10.99, 14.3, 7.523, 7.49, , 12.88, 8.0, 6.748, 11.1, 13.0) Schreibweise der Klassengrenzen in der Tabelle? Note h(x) f(x) F(x) Folie 14 Es galt per Konvention: Die obere Grenze gehört zur Klasse, die untere nicht (außer bei erster Kategorie).
94 Ordinaldaten Intervallskala Kreuztabellen Darstellung I Numerische Beschreibung: Klassenbildung Bei diskreten Daten werden die Klassengrenzen nach Möglichkeit nicht-überlappend angegeben. Die Klassenbreite ist dann d = OG UG + 1 Bei kontinuierlichen Daten werden die Klassengrenzen überlappend angegeben, wobei per Konvention die obere Grenze zur Klasse gehört, die untere aber nicht. Die Klassenbreite ist dann d= OG - UG Folie 15
95 Ordinaldaten Intervallskala Beschreibung: Histogramm Kreuztabellen Darstellung I Das Histogramm stellt die Häufigkeiten vieler Kategorien in einem Säulendiagramm mit weniger Klassen als Kategorien dar Die Klassen müssen nicht notwendig gleich breit sein Für die Klassenbildung beim Histogramm gelten dieselben Faustregeln wie bei den Kreuztabellen Die Häufigkeiten können entweder absolute Häufigkeiten (absolutes Histogramm) sein oder relative Häufigkeiten (relatives Histogramm) Folie 16 Die Fläche einer Säule repräsentiert dabei die Häufigkeit der Elemente in der Klasse.
96 Ordinaldaten Intervallskala Kreuztabellen Darstellung I Beschreibung: Histogramm Frage: Warum soll beim Histogramm die Fläche der Säule die Häufigkeit repräsentieren und nicht wie beim Säulen-/Balkendiagramm die Höhe der Säule Beispiel: Säule 1 ist etwas höher als Säule 3, allerdings ist die Klassenbreite unterschiedlich groß Folie 17 Aufgrund der Flächenbewertung des menschlichen Sehsystems scheint Klasse 3 wesentlich mehr Merkmalsträger zu umfassen als Klasse 1
97 Ordinaldaten Intervallskala Beschreibung: Histogramm Kreuztabellen Darstellung I Prinzip: Wählt man ungleiche Klassenbreiten, muss das Histogramm normiert werden (wegen der Flächenbeurteilung des menschlichen Sehsystems). Da die Fläche A j einer Säule die Häufigkeit repräsentiert, gilt für eine Klasse y j A = f(x j ), und damit f(x j ) = a j d j (a j ist die Höhe der Säule, d j die Klassenbreite) Somit ist die Höhe einer Säule a j = f(x j ) / d j Folie 18 Dies gilt auch für die Darstellung mit absoluten Häufigkeiten h(x j ) Dann ist die Höhe einer Säule a j = h(x j ) / d j
98 Ordinaldaten Intervallskala Beschreibung: Histogramm Kreuztabellen Darstellung I Prinzip: Wählt man ungleiche Klassenbreiten, muss das Histogramm normiert werden (wegen der Flächenbeurteilung des menschlichen Sehsystems). Da die Fläche A j einer Säule die Häufigkeit repräsentiert, gilt für eine Klasse y j A = f(x j ), und damit f(x j ) = a j d j (a j ist die Höhe der Säule, d j die Klassenbreite) Folie 19
99 Ordinaldaten Intervallskala Beschreibung: Histogramm Kreuztabellen Darstellung I Problem: Ein normiertes Histogramm ist in Bezug auf die y-achse nur schwer interpretierbar. Um die relative/absolute Häufigkeit einer Klasse zu bestimmen, muss außer bei einer Klassenbreite von 1 stets gerechnet werden Bei gleichen Klassenbreiten wird ein Histogramm daher oft wie ein Säulendiagramm erstellt. Folie 20
100 Ordinaldaten Intervallskala Kreuztabellen Beschreibung: Histogramm Beispiel: Verteilung des IQ in diesem Raum. Darstellung I Folie 21 Student IQ f(iq) h(iq) 92 Werte zwischen 89 und 140
101 Ordinaldaten Beschreibung: Histogramm Achtung: Die Wahl der Klassenanzahl kann für die Aussage entscheidend sein. Beispiel: Körpergrößen an der Geisteswissenschaftlichen Fakultät der Uni Mainz Klassenanzahl: 25 Klassenanzahl: 10 f(iq) f(iq) Folie 22
102 Ordinaldaten Intervallskala /verbale Beschreibung: Modalität Kreuztabellen Darstellung I Je nach Anzahl der (lokalen) Maxima unterscheidet man uni-, bi- und multimodale Verteilungen. Folie 23
103 Ordinaldaten /verbale Beschreibung: Schiefe Symmetrische Verteilungen: Häufigkeiten für die Ausprägungen einer Zufallsvariablen verlaufen gleichartig um den Mittelwert. Linkssteile/rechtsschiefe Verteilungen: Häufigkeiten laufen rechts des Mittelwertes flacher aus. Rechtssteile/linksschiefe Verteilungen: Häufigkeiten laufen links des Mittelwertes flacher aus. Folie 24
104 Ordinaldaten Intervallskala Kreuztabellen Darstellung I Beschreibung: Empirische Verteilungsfunktion Die empirische Verteilungsfunktion bei c Klassen ist j F( X x ) = F( x ) = f ( x ) j j c c= 1 mit j = 1 k Note x h(x) f(x) F(x) Zur grafischen Darstellung werden also die empirischen relativen Häufigkeiten aufsummiert Folie 25
105 Relevante Excel Funktionen Klassenbildung LOG() AUFRUNDEN() Folie 26
106 z-standardisierung Kreuztabellen Numerische Beschreibung: Kennwerte Darstellung I Kennwerte Darstellung II Maße der zentralen Tendenz Mittelwert Streuungsmaße (Dispersionsmaße) Mittlere Differenz (Abweichungs-)Quadratsumme Varianz Standardabweichung Folie 2
107 z-standardisierung Kreuztabellen Numerische Beschreibung: Mittelwert Darstellung I Kennwerte Darstellung II Folie 3 Der Mittelwert ist bei n Beobachtungen x 1 x n definiert als 1 1 x x x x x n = ( N) = n n i = 1 Ist durch extreme Werte beeinflussbar (ausreißerempfindlich) Ist der Schwerpunkt der Beobachtungen, d.h. n i= 1 x ( ) i x = 0 i
108 z-standardisierung Kreuztabellen Numerische Beschreibung: Mittelwert Darstellung I Kennwerte Darstellung II Folie 4 Der Mittelwert stimmt häufig mit keiner beobachteten Realisation überein Der Mittelwert ist äquivariant gegenüber gewissen (z.b. linearen) Transformationen Insbesondere 1. Addition einer Konstanten a zu allen n Beobachtungen x 1 x n x + a = x + a 2. Multiplikation aller n Beobachtungen x 1 x n mit einer Konstanten c a x= a x
109 z-standardisierung Kreuztabellen Darstellung I Kennwerte Darstellung II Numerische Beschreibung: Mittelwert Lageregeln für die Maße der zentralen Tendenz Bei symmetrischen Verteilungen: x x x med Bei linkssteilen Verteilungen: x > x x med mod mod Bei rechtssteilen Verteilungen x < x x med mod Folie 5
110 z-standardisierung Kreuztabellen Darstellung I Kennwerte Darstellung II Folie 6 Numerische Beschreibung: Mittlere Abweichung Als mittlere Abweichung (MD) von n Beobachtungen x 1 x n in einem Datensatz wird die Summe aller Abweichungsbeträge zum Median bezeichnet. 1 n i n i = 1 MD= x x Für jeden anderen Wert als für den Median ist der mittlere Abweichungsbetrag größer, d.h. n 1 1 n x x x c i i= 1 n i= 1 n i
111 z-standardisierung Kreuztabellen Darstellung I Kennwerte Darstellung II Folie 7 Numerische Beschreibung: Abweichungsquadratsumme Die Abweichungsquadratsumme (oder auch: Fehlerquadratsumme oder einfach Quadratsumme) ist die Summe der quadrierten Abweichungen aller n Beobachtungen x 1 x n vom Mittelwert. n = i i= 1 QS x x x ( ) ( ) 2 Erfasst die Streuung um den Mittelwert Nur falls keine Streuung besteht, ist QS = 0, d.h. alle beobachteten Werte sind gleich. Sonst: QS> 0 Je größer die Streuung, desto größer ist die QS Problem: Die Fehlerquadratsumme wird um so größer, je mehr Beobachtungen vorliegen
112 z-standardisierung Kreuztabellen Darstellung I Kennwerte Darstellung II Folie 8 Numerische Beschreibung: Varianz Die Varianz ist das mittlere Abweichungsquadrat aller n Beobachtungen x 1 x n vom Mittelwert. 2 1 n s x = xi x n i = 1 ( ) ( ) 2 Erfasst die mittlere Streuung um den Mittelwert Nur falls keine Streuung besteht, ist s² = 0, d.h. alle beobachteten Werte sind gleich. Sonst: s² > 0 Je größer die Streuung um den Mittelwert, desto größer ist die Varianz Ist anfällig gegenüber Ausreißern
113 z-standardisierung Kreuztabellen Darstellung I Kennwerte Darstellung II Numerische Beschreibung: Varianz Für jeden anderen Wert als für den Mittelwert ist die Summe der Abweichungsquadrate höher 1 1 n n n ( ) 2 ( ) 2 xi x xi c i= 1 n i= 1 Der Mittelwert minimiert also die quadrierten Abweichungen aller Beobachtungen. Folie 9
114 z-standardisierung Kreuztabellen Darstellung I Kennwerte Darstellung II Folie 10 Numerische Beschreibung: Varianz Die Formel für die Varianz lässt sich leicht umformen in eine rechnerisch manchmal günstigere Variante: n 1 1 n ( ) i i= 1 n i= 1 n x x = x x = x x Die Varianz ist also die Differenz des Mittelwerts der quadrierten Daten und dem quadrierten Mittelwert der Daten. Dies wird auch als Momentenschreibweise der Varianz bezeichnet. i
115 z-standardisierung Kreuztabellen Darstellung I Kennwerte Darstellung II Numerische Beschreibung: Standardabweichung Problem: Die Varianz ist nicht äquivariant zu erlaubten Skalentransformationen s a x = a s x ( ) ( ) (mit a = const.) Durch Wurzelziehen erhält man die Standardabweichung (SD, standard deviation) 1 n i n i = 1 s x = s x = x x ( ) 2 ( ) ( ) 2 Folie 11 Die Standardabweichung ist äquivariant zu den erlaubten Skalentransformationen
116 z-standardisierung Kreuztabellen Darstellung I Kennwerte Darstellung II Folie 12 Numerische Beschreibung: s² und s Verhalten von Varianz und Standardabweichung bei Transformationen der n Beobachtungen x 1 x n 1. Die Addition einer Konstanten a zu allen Werten x verändert Varianz und Standardabweichung nicht s²(x + a) = s²(x) s(x + a) = s(x) 2. Die Multiplikation aller Werte x mit einer Konstanten a führt zu einer Erhöhung der Varianz um a² und der Standardabweichung um a s²(a x) = a² s²(x) s(a x) = a s(x)
117 z-standardisierung Kreuztabellen Darstellung I Kennwerte Darstellung II Mittelwert und Varianz aus kategorisierten Daten Liegen intervallskalierte Daten bereits in kategorisierter Form vor (z.b. in einer Häufigkeitstabelle), so können daraus Mittelwert und Varianz näherungsweise bestimmt werden. Es sei die Kategoriemitte der j-ten von insgesamt k Kategorien mit der Häufigkeit f j (x). Mittelwert k j= 1 x jmid, UG = ( j), x = f x x j j mid + OG 2 j Varianz ( ) ( ) 2 j j, mid k 2 s ( x) = f x x x j= 1 Folie 13
118 z-standardisierung Kreuztabellen Darstellung I Kennwerte Beschreibung: Fehlerbalkendiagramm Das Fehlerbalkendiagramm (Error Bar) veranschaulicht Mittelwerte und die Streuung von Daten für mindestens eine Stichprobe. Für die Länge der Fehlerbalken existieren verschiedene Konventionen (± 1 SD, ± 1.96 SD, ± 2.58 SD) Darstellung II Körpergröße in in cm cm (+/ (+/ SD) SD) Folie Frauen Geschlecht Männer
Mathematische und statistische Methoden I
Prof. Dr. G. Meinhardt 6. Stock, Wallstr. 3 (Raum 06-206) Sprechstunde jederzeit nach Vereinbarung und nach der Vorlesung. Mathematische und statistische Methoden I Dr. Malte Persike persike@uni-mainz.de
MehrForschungsstatistik I
Prof. Dr. G. Meinhardt 6. Stock, TB II R. 06-206 (Persike) R. 06-321 (Meinhardt) Sprechstunde jederzeit nach Vereinbarung Forschungsstatistik I Dr. Malte Persike persike@uni-mainz.de http://psymet03.sowi.uni-mainz.de/
MehrMathematische und statistische Methoden I
Prof. Dr. G. Meinhardt Methodenlehre Mathematische und statistische Methoden I Sprechstunde jederzeit nach Vereinbarung und nach der Vorlesung Wallstr. 3, 6. Stock, Raum 06-206 Dr. Malte Persike persike@uni-mainz.de
MehrMathematische und statistische Methoden I
Prof. Dr. G. Meinhardt & Statistik Mathematische und statistische Methoden I Sprechstunde jederzeit nach Vereinbarung und nach der Vorlesung Wallstr. 3, 6. Stock, Raum 06-206 Dr. Malte Persike persike@uni-mainz.de
MehrMathematische und statistische Methoden I
Methodenlehre e e Prof. Dr. G. Meinhardt 6. Stock, Wallstr. 3 (Raum 06-206) Sprechstunde jederzeit nach Vereinbarung und nach der Vorlesung. Mathematische und statistische Methoden I Dr. Malte Persike
MehrForschungsstatistik I
Psychologie Prof. Dr. G. Meinhardt 2. Stock, Nordflügel R. 02-429 (Persike) R. 02-431 (Meinhardt) Sprechstunde jederzeit nach Vereinbarung Forschungsstatistik I Dr. Malte Persike persike@uni-mainz.de WS
MehrPrimer: Deskriptive Statistik 1.0
Primer: Deskriptive Statistik 1.0 Dr. Malte Persike persike@uni-mainz.de methodenlehre.com twitter.com/methodenlehre methodenlehre.com/g+ Folie 1 Variablen & Skalen Nominaldaten Variablen Deskriptive Statistik
MehrMathematische und statistische Methoden I
Prof. Dr. G. Meinhardt Statistik & Mathematische und statistische Methoden I Sprechstunde jederzeit nach Vereinbarung und nach der Vorlesung Wallstr. 3, 6. Stock, Raum 06-206 Dr. Malte Persike persike@uni-mainz.de
MehrForschungsstatistik I
Psychologie Prof. Dr. G. Meinhardt 6. Stock, TB II R. 06-206 (Persike) R. 06-321 (Meinhardt) Sprechstunde jederzeit nach Vereinbarung Forschungsstatistik I Dr. Malte Persike persike@uni-mainz.de http://psymet03.sowi.uni-mainz.de/
MehrMathematische und statistische Methoden II
Methodenlehre e e Prof. Dr. G. Meinhardt 6. Stock, Wallstr. 3 (Raum 06-206) Sprechstunde jederzeit nach Vereinbarung und nach der Vorlesung. Mathematische und statistische Methoden II Dr. Malte Persike
MehrMathematische und statistische Methoden II
Sprechstunde jederzeit nach Vereinbarung und nach der Vorlesung Wallstr. 3, 6. Stock, Raum 06-206 Mathematische und statistische Methoden II Dr. Malte Persike persike@uni-mainz.de lordsofthebortz.de lordsofthebortz.de/g+
Mehrhtw saar 1 EINFÜHRUNG IN DIE STATISTIK: BESCHREIBENDE STATISTIK
htw saar 1 EINFÜHRUNG IN DIE STATISTIK: BESCHREIBENDE STATISTIK htw saar 2 Grundbegriffe htw saar 3 Grundgesamtheit und Stichprobe Ziel: Über eine Grundgesamtheit (Population) soll eine Aussage über ein
MehrAnteile Häufigkeiten Verteilungen Lagemaße Streuungsmaße Merkmale von Verteilungen. Anteile Häufigkeiten Verteilungen
DAS THEMA: VERTEILUNGEN LAGEMAßE - STREUUUNGSMAßE Anteile Häufigkeiten Verteilungen Lagemaße Streuungsmaße Merkmale von Verteilungen Anteile Häufigkeiten Verteilungen Anteile und Häufigkeiten Darstellung
MehrBitte am PC mit Windows anmelden!
Einführung in SPSS Plan für heute: Grundlagen/ Vorwissen für SPSS Vergleich der Übungsaufgaben Einführung in SPSS http://weknowmemes.com/generator/uploads/generated/g1374774654830726655.jpg Standardnormalverteilung
MehrInhaltsverzeichnis. 1 Über dieses Buch Zum Inhalt dieses Buches Danksagung Zur Relevanz der Statistik...
Inhaltsverzeichnis 1 Über dieses Buch... 11 1.1 Zum Inhalt dieses Buches... 13 1.2 Danksagung... 15 2 Zur Relevanz der Statistik... 17 2.1 Beispiel 1: Die Wahrscheinlichkeit, krank zu sein, bei einer positiven
MehrLage- und Streuungsparameter
Lage- und Streuungsparameter Beziehen sich auf die Verteilung der Ausprägungen von intervall- und ratio-skalierten Variablen Versuchen, diese Verteilung durch Zahlen zu beschreiben, statt sie graphisch
MehrDeskription, Statistische Testverfahren und Regression. Seminar: Planung und Auswertung klinischer und experimenteller Studien
Deskription, Statistische Testverfahren und Regression Seminar: Planung und Auswertung klinischer und experimenteller Studien Deskriptive Statistik Deskriptive Statistik: beschreibende Statistik, empirische
MehrKreisdiagramm, Tortendiagramm
Kreisdiagramm, Tortendiagramm Darstellung der relativen (absoluten) Häufigkeiten als Fläche eines Kreises Anwendung: Nominale Merkmale Ordinale Merkmale (Problem: Ordnung nicht korrekt wiedergegeben) Gruppierte
MehrStatistik und Wahrscheinlichkeitsrechnung
Statistik und Wahrscheinlichkeitsrechnung 3. Vorlesung Dr. Jochen Köhler 1 Inhalte der heutigen Vorlesung Ziel: Daten Modellbildung Probabilistisches Modell Wahrscheinlichkeit von Ereignissen Im ersten
MehrWiederholung Statistik I. Statistik für SozialwissenschaftlerInnen II p.8
Wiederholung Statistik I Statistik für SozialwissenschaftlerInnen II p.8 Konstanten und Variablen Konstante: Merkmal hat nur eine Ausprägung Variable: Merkmal kann mehrere Ausprägungen annehmen Statistik
MehrUnivariate Häufigkeitsverteilungen Kühnel, Krebs 2001: Statistik für die Sozialwissenschaften, S.41-66
Univariate Häufigkeitsverteilungen Kühnel, Krebs 2001: Statistik für die Sozialwissenschaften, S.41-66 Gabriele Doblhammer: Empirische Sozialforschung Teil II, SS 2004 1/19 Skalenniveaus Skalenniveau Relation
MehrForschungsstatistik I
Prof. Dr. G. Meinhardt 6. Stock, Taubertsberg 2 R. 06-206 (Persike) R. 06-214 (Meinhardt) Sprechstunde jederzeit nach Vereinbarung Forschungsstatistik I Dr. Malte Persike persike@uni-mainz.de http://psymet03.sowi.uni-mainz.de/
MehrForschungsstatistik I
Prof. Dr. G. Meinhardt 2. Stock, Nordflügel R. 02-429 (Persike) R. 02-431 (Meinhardt) Sprechstunde jederzeit nach Vereinbarung Forschungsstatistik I Dr. Malte Persike persike@uni-mainz.de WS 2008/2009
MehrSkalenniveaus =,!=, >, <, +, -
ZUSAMMENHANGSMAßE Skalenniveaus Nominalskala Ordinalskala Intervallskala Verhältnisskala =,!= =,!=, >, < =,!=, >, ,
Mehr1. Maße der zentralen Tendenz Beispiel: Variable Anzahl der Geschwister aus Jugend '92. Valid Cum Value Frequency Percent Percent Percent
Deskriptive Statistik 1. Verteilungsformen symmetrisch/asymmetrisch unimodal(eingipflig) / bimodal (zweigipflig schmalgipflig / breitgipflig linkssteil / rechtssteil U-förmig / abfallend Statistische Kennwerte
MehrForschungsstatistik I
Psychologie Prof. Dr. G. Meinhardt 6. Stock, TB II R. 06-206 (Persike) R. 06-321 (Meinhardt) Sprechstunde jederzeit nach Vereinbarung Forschungsstatistik I Dr. Malte Persike persike@uni-mainz.de http://psymet03.sowi.uni-mainz.de/
MehrFachrechnen für Tierpfleger
Z.B.: Fachrechnen für Tierpfleger A10. Statistik 10.1 Allgemeines Was ist Statistik? 1. Daten sammeln: Durch Umfragen, Zählung, Messung,... 2. Daten präsentieren: Tabellen, Grafiken 3. Daten beschreiben/charakterisieren:
Mehr1.1 Graphische Darstellung von Messdaten und unterschiedliche Mittelwerte. D. Horstmann: Oktober
1.1 Graphische Darstellung von Messdaten und unterschiedliche Mittelwerte D. Horstmann: Oktober 2014 4 Graphische Darstellung von Daten und unterschiedliche Mittelwerte Eine Umfrage nach der Körpergröße
MehrMathematische und statistische Methoden II
Methodenlehre e e Prof. Dr. G. Meinhardt 6. Stock, Wallstr. 3 (Raum 06-06) Sprechstunde jederzeit nach Vereinbarung und nach der Vorlesung. Mathematische und statistische Methoden II Dr. Malte Persike
MehrGraphische Darstellung einer univariaten Verteilung:
Graphische Darstellung einer univariaten Verteilung: Die graphische Darstellung einer univariaten Verteilung hängt von dem Messniveau der Variablen ab. Bei einer graphischen Darstellung wird die Häufigkeit
MehrMathematische und statistische Methoden II
Prof. Dr. G. Meinhardt 6. Stock, Wallstr. 3 (Raum 06-206) Sprechstunde jederzeit nach Vereinbarung und nach der Vorlesung. Mathematische und statistische Methoden II Dr. Malte Persike persike@uni-mainz.de
MehrKapitel 2. Häufigkeitsverteilungen
6 Kapitel 2 Häufigkeitsverteilungen Ziel: Darstellung bzw Beschreibung (Exploration) einer Variablen Ausgangssituation: An n Einheiten ω,, ω n sei das Merkmal X beobachtet worden x = X(ω ),, x n = X(ω
MehrEinführung in Quantitative Methoden
Einführung in Quantitative Methoden Mag. Dipl.Ing. Dr. Pantelis Christodoulides & Mag. Dr. Karin Waldherr SS 2011 Christodoulides / Waldherr Einführung in Quantitative Methoden- 2.VO 1/62 Summenzeichen
MehrForschungsstatistik II
Prof. Dr. G. Meinhardt 6. Stock, Taubertsberg R. 06-06 (Persike) R. 06-3 (Meinhardt) Sprechstunde jederzeit nach Vereinbarung Forschungsstatistik II Dr. Malte Persike persike@uni-mainz.de http://psymet03.sowi.uni-mainz.de/
MehrStatistikpraktikum. Carsten Rezny. Sommersemester Institut für angewandte Mathematik Universität Bonn
Statistikpraktikum Carsten Rezny Institut für angewandte Mathematik Universität Bonn Sommersemester 2016 Anmeldung in Basis: 06. 10.06.2016 Organisatorisches Einführung Statistik Analyse empirischer Daten
MehrStatistik II: Grundlagen und Definitionen der Statistik
Medien Institut : Grundlagen und Definitionen der Statistik Dr. Andreas Vlašić Medien Institut (0621) 52 67 44 vlasic@medien-institut.de Gliederung 1. Hintergrund: Entstehung der Statistik 2. Grundlagen
MehrStatistik und Wahrscheinlichkeitsrechnung
Statistik und Wahrscheinlichkeitsrechnung Dr. Jochen Köhler 26.02.2008 1 Warum Statistik und Wahrscheinlichkeits rechnung im Ingenieurwesen? Zusammenfassung der letzten Vorlesung Statistik und Wahrscheinlichkeitsrechnung
MehrStatistik I für Betriebswirte Vorlesung 9
Statistik I für Betriebswirte Vorlesung 9 Dr. Andreas Wünsche TU Bergakademie Freiberg Institut für Stochastik Vorlesung am 8. Juni 2017 im Audi-Max (AUD-1001) Dr. Andreas Wünsche Statistik I für Betriebswirte
MehrMaße der zentralen Tendenz
UStatistische Kennwerte Sagen uns tabellarische und graphische Darstellungen etwas über die Verteilung der einzelnen Werte einer Stichprobe, so handelt es sich bei statistischen Kennwerten um eine Kennzahl,
MehrForschungsstatistik I
Prof. Dr. G. Meinhardt 6. Stock, Taubertsberg R. 06-06 (Persike) R. 06-31 (Meinhardt) Sprechstunde jederzeit nach Vereinbarung Forschungsstatistik I Dr. Malte Persike persike@uni-mainz.de http://psymet03.sowi.uni-mainz.de/
MehrEmpirische Verteilungsfunktion
Empirische Verteilungsfunktion H(x) := Anzahl der Werte x ist. Deskriptive
MehrStatistische Grundlagen I
Statistische Grundlagen I Arten der Statistik Zusammenfassung und Darstellung von Daten Beschäftigt sich mit der Untersuchung u. Beschreibung von Gesamtheiten oder Teilmengen von Gesamtheiten durch z.b.
MehrMathematische und statistische Methoden II
Sprechstunde jederzeit nach Vereinbarung und nach der Vorlesung Wallstr. 3, 6. Stock, Raum 06-206 Mathematische und statistische Methoden II Dr. Malte Persike persike@uni-mainz.de lordsofthebortz.de lordsofthebortz.de/g+
MehrWISTA WIRTSCHAFTSSTATISTIK
WISTA WIRTSCHAFTSSTATISTIK PROF DR ROLF HÜPEN FAKULTÄT FÜR WIRTSCHAFTSWISSENSCHAFT Seminar für Theoretische Wirtschaftslehre Vorlesungsprogramm 23042013 Datenlagen und Darstellung eindimensionaler Häufigkeitsverteilungen
MehrDeskriptivstatistik a) Univariate Statistik Weiters zum Thema der statistischen Informationsverdichtung
20 Weiters zum Thema der statistischen Informationsverdichtung M a ß z a h l e n Statistiken bei Stichproben Parameter bei Grundgesamtheiten Maßzahlen zur Beschreibung univariater Verteilungen Maßzahlen
MehrForschungsstatistik I
Prof. Dr. G. Meinhardt 2. Stock, Nordflügel R. 02-429 (Persike) R. 02-431 (Meinhardt) Sprechstunde jederzeit nach Vereinbarung Forschungsstatistik I Dr. Malte Persike persike@uni-mainz.de WS 2008/2009
MehrForschungsstatistik I
Prof. Dr. G. Meinhardt 2. Stock, Nordflügel R. 02-429 (Persike) R. 02-431 (Meinhardt) Sprechstunde jederzeit nach Vereinbarung Forschungsstatistik I Dr. Malte Persike persike@uni-mainz.de WS 2008/2009
Mehrfh management, communication & it Constantin von Craushaar fh-management, communication & it Statistik Angewandte Statistik
fh management, communication & it Folie 1 Überblick Grundlagen (Testvoraussetzungen) Mittelwertvergleiche (t-test,..) Nichtparametrische Tests Korrelationen Regressionsanalyse... Folie 2 Überblick... Varianzanalyse
MehrForschungsstatistik I
Prof. Dr. G. Meinhardt 2. Stock, Nordflügel R. 02-429 (Persike) R. 02-431 (Meinhardt) Sprechstunde jederzeit nach Vereinbarung Forschungsstatistik I Dr. Malte Persike persike@uni-mainz.de http://psymet03.sowi.uni-mainz.de/
MehrBeispiel für Anwendung: z-tabelle kann genutzt werden, um z.b. Poissonverteilung näherungsweise zu integrieren. Beispiel: wie wahrscheinlich ist es
Beispiel für Anwendung: z-tabelle kann genutzt werden, um z.b. Poissonverteilung näherungsweise zu integrieren. Beispiel: wie wahrscheinlich ist es beim radioaktiven Zerfall, zwischen 100 und 110 Zerfälle
MehrMathematische und statistische Methoden I
Prof. Dr. G. Meinhardt 6. Stock, Wallstr. 3 (Raum 06-206) Sprechstunde jederzeit nach Vereinbarung und nach der Vorlesung. Mathematische und statistische Methoden I Dr. Malte Persike persike@uni-mainz.de
MehrStatistikpraktikum. Carsten Rezny. Sommersemester Institut für angewandte Mathematik Universität Bonn
Statistikpraktikum Carsten Rezny Institut für angewandte Mathematik Universität Bonn Sommersemester 2017 Organisatorisches Anmeldung in Basis: 19. 23.06.2017 Skript und Übungsaufgaben unter: http://www.iam.uni-bonn.de/users/rezny/statistikpraktikum
MehrForschungsmethoden in der Sozialen Arbeit
Forschungsmethoden in der Sozialen Arbeit Fachhochschule für Sozialarbeit und Sozialpädagogik Alice- Salomon Hochschule für Soziale arbeit, Gesundheit, Erziehung und Bildung University of Applied Sciences
MehrAngewandte Statistik 3. Semester
Angewandte Statistik 3. Semester Übung 5 Grundlagen der Statistik Übersicht Semester 1 Einführung ins SPSS Auswertung im SPSS anhand eines Beispieles Häufigkeitsauswertungen Grafiken Statistische Grundlagen
Mehr2. Deskriptive Statistik
Philipps-Universitat Marburg 2.1 Stichproben und Datentypen Untersuchungseinheiten: mogliche, statistisch zu erfassende Einheiten je Untersuchungseinheit: ein oder mehrere Merkmale oder Variablen beobachten
MehrHäufigkeitsverteilungen und Statistische Maßzahlen. Häufigkeitsverteilungen und Statistische Maßzahlen. Variablentypen. Stichprobe und Grundgesamtheit
TECHNISCHE UNIVERSITÄT MÜNCHEN-WEIHENSTEPHAN MATHEMATIK UND STATISTIK INFORMATIONS- UND DOKUMENTATIONSZENTRUM R. Häufigkeitsverteilungen und Statistische Maßzahlen Statistik SS Variablentypen Qualitative
MehrEinführung in die Statistik
Einführung in die Statistik 1. Deskriptive Statistik 2. Induktive Statistik 1. Deskriptive Statistik 1.0 Grundbegriffe 1.1 Skalenniveaus 1.2 Empirische Verteilungen 1.3 Mittelwerte 1.4 Streuungsmaße 1.0
MehrVerteilungsfunktion und Quantile
Statistik 1 für SoziologInnen Verteilungsfunktion und Quantile Univ.Prof. Dr. Marcus Hudec Kumulierte Häufigkeiten Hinweis: Damit das Kumulieren inhaltlich sinnvoll ist, muss das Merkmal zumindest ordinal
MehrStatistische Methoden der Datenanalyse Wintersemester 2012/2013 Albert-Ludwigs-Universität Freiburg
Statistische Methoden der Datenanalyse Wintersemester 2012/2013 Albert-Ludwigs-Universität Freiburg Prof. Markus Schumacher, Dr. Stan Lai Physikalisches Institut Westbau 2 OG Markus.Schumacher@physik.uni-freiburg.de
Mehr3. Merkmale und Daten
3. Merkmale und Daten Ziel dieses Kapitels: Vermittlung des statistischen Grundvokabulars Zu klärende Begriffe: Grundgesamtheit Merkmale (Skalenniveau etc.) Stichprobe 46 3.1 Grundgesamtheiten Definition
MehrMathematische und statistische Methoden I
Prof. Dr. G. Meinhardt Statistik & Mathematische und statistische Methoden I Sprechstunde jederzeit nach Vereinbarung und nach der Vorlesung Wallstr. 3, 6. Stock, Raum 06-206 Dr. Malte Persike persike@uni-mainz.de
MehrDer Mittelwert (arithmetisches Mittel)
Der Mittelwert (arithmetisches Mittel) x = 1 n n x i bekanntestes Lagemaß instabil gegen extreme Werte geeignet für intervallskalierte Daten Deskriptive Statistik WiSe 2015/2016 Helmut Küchenhoff (Institut
MehrDeskriptive Statistik
Deskriptive Statistik Deskriptive Statistik: Ziele Daten zusammenfassen durch numerische Kennzahlen. Grafische Darstellung der Daten. Quelle: Ursus Wehrli, Kunst aufräumen 1 Modell vs. Daten Bis jetzt
MehrVerteilungsfunktion und Quantile
Statistik 1 für SoziologInnen Verteilungsfunktion und Quantile Univ.Prof. Dr. Marcus Hudec Kumulierte Häufigkeiten Hinweis: Damit das Kumulieren inhaltlich sinnvoll ist, muss das auszuwertende Merkmal
MehrErmitteln Sie auf 2 Dezimalstellen genau die folgenden Kenngrößen der bivariaten Verteilung der Merkmale Weite und Zeit:
1. Welche der folgenden Kenngrößen, Statistiken bzw. Grafiken sind zur Beschreibung der Werteverteilung des Merkmals Konfessionszugehörigkeit sinnvoll einsetzbar? A. Der Modalwert. B. Der Median. C. Das
MehrStatistik und Wahrscheinlichkeitsrechnung
Statistik und Wahrscheinlichkeitsrechnung Übung 3 1 Inhalt der heutigen Übung Vorrechnen der Hausübung B.7 Beschreibende Statistik Gemeinsames Lösen der Übungsaufgaben C.1: Häufigkeitsverteilung C.2: Tukey
MehrMathematische und statistische Methoden II
Prof. Dr. G. Meinhardt 6. Stock, Wallstr. 3 (Raum 06-206) Sprechstunde jederzeit nach Vereinbarung und nach der Vorlesung. Mathematische und statistische Methoden II Dr. Malte Persike persike@uni-mainz.de
MehrMerkmalstypen Univ.-Prof. Dr. rer. nat. et med. habil. Andreas Faldum
1 Merkmalstypen Quantitativ: Geordnete Werte, Vielfache einer Einheit Stetig: Prinzipiell sind alle Zwischenwerte beobachtbar Beispiele: Gewicht, Größe, Blutdruck Diskret: Nicht alle Zwischenwerte sind
MehrMathematische und statistische Methoden II
Sprechstunde jederzeit nach Vereinbarung und nach der Vorlesung Wallstr. 3, 6. Stock, Raum 06-206 Mathematische und statistische Methoden II Dr. Malte Persike persike@uni-mainz.de lordsofthebortz.de lordsofthebortz.de/g+
MehrGrundlagen der empirischen Sozialforschung
Grundlagen der empirischen Sozialforschung Sitzung 10 - Datenanalyseverfahren Jan Finsel Lehrstuhl für empirische Sozialforschung Prof. Dr. Petra Stein 22. Dezember 2008 1 / 21 Online-Materialien Die Materialien
Mehr4. Kumulierte Häufigkeiten und Quantile
4. Kumulierte Häufigkeiten und Quantile Statistik für SoziologInnen 1 4. Kumulierte Häufigkeiten und Quantile Kumulierte Häufigkeiten Oft ist man nicht an der Häufigkeit einzelner Merkmalsausprägungen
MehrMathematische und statistische Methoden I
Prof. Dr. G. Meinhardt 6. Stock, Wallstr. 3 (Raum 6-6) Sprechstunde jederzeit nach Vereinbarung und nach der Vorlesung. Mathematische und statistische Methoden I Dr. Malte Persike persike@uni-mainz.de
MehrSTATISTIK FÜR STATISTIK-AGNOSTIKER Teil 1 (wie mich)
WS 07/08-1 STATISTIK FÜR STATISTIK-AGNOSTIKER Teil 1 (wie mich) Nur die erlernbaren Fakten, keine Hintergrundinfos über empirische Forschung etc. (und ich übernehme keine Garantie) Bei der Auswertung von
MehrForschungsstatistik I
Prof. Dr. G. Meinhardt 2. Stock, Nordflügel R. 02-429 (Persike) R. 02-431 (Meinhardt) Sprechstunde jederzeit nach Vereinbarung Forschungsstatistik I Dr. Malte Persike persike@uni-mainz.de http://psmet03.sowi.uni-mainz.de/
MehrLagemaße Übung. Zentrale Methodenlehre, Europa Universität - Flensburg
Lagemaße Übung M O D U S, M E D I A N, M I T T E L W E R T, M O D A L K L A S S E, M E D I A N, K L A S S E, I N T E R P O L A T I O N D E R M E D I A N, K L A S S E M I T T E Zentrale Methodenlehre, Europa
MehrLösungen zur Klausur zur Statistik Übung am
Lösungen zur Klausur zur Statistik Übung am 28.06.2013 Fabian Kleine Staatswissenschaftliche Fakultät Aufgabe 1 Gegeben sei die folgende geordneten Urliste des Merkmals Y. 30 Punkte Y : 5 5 5 5 10 10 10
MehrStreuungsmaße von Stichproben
Streuungsmaße von Stichproben S P A N N W E I T E, V A R I A N Z, S T A N D A R D A B W E I C H U N G, Q U A R T I L E, K O V A R I A N Z, K O R R E L A T I O N S K O E F F I Z I E N T Zentrale Methodenlehre,
Mehr2 Häufigkeitsverteilungen
2 Häufigkeitsverteilungen Ziel: Darstellung bzw Beschreibung (Exploration) einer Variablen Ausgangssituation An n Einheiten ω 1,,ω n sei das Merkmal X beobachtet worden x 1 = X(ω 1 ),,x n = X(ω n ) Also
Mehr1 x 1 y 1 2 x 2 y 2 3 x 3 y 3... n x n y n
3.2. Bivariate Verteilungen zwei Variablen X, Y werden gemeinsam betrachtet (an jedem Objekt werden gleichzeitig zwei Merkmale beobachtet) Beobachtungswerte sind Paare von Merkmalsausprägungen (x, y) Beispiele:
MehrMathematische Statistik. Zur Notation
Mathematische Statistik dient dazu, anhand von Stichproben Informationen zu gewinnen. Während die Wahrscheinlichkeitsrechnung Prognosen über das Eintreten zufälliger (zukünftiger) Ereignisse macht, werden
MehrGrundlagen der empirischen Sozialforschung
Grundlagen der empirischen Sozialforschung Sitzung 11 - Datenanalyseverfahren Jan Finsel Lehrstuhl für empirische Sozialforschung Prof. Dr. Petra Stein 5. Januar 2009 1 / 22 Online-Materialien Die Materialien
MehrBeispiel 2 (Einige Aufgaben zu Lageparametern) Aufgabe 1 (Lageparameter)
Beispiel (Einige Aufgaben zu Lageparametern) Aufgabe 1 (Lageparameter) 1 Ein Statistiker ist zu früh zu einer Verabredung gekommen und vertreibt sich nun die Zeit damit, daß er die Anzahl X der Stockwerke
MehrStatistik. Jan Müller
Statistik Jan Müller Skalenniveau Nominalskala: Diese Skala basiert auf einem Satz von qualitativen Attributen. Es existiert kein Kriterium, nach dem die Punkte einer nominal skalierten Variablen anzuordnen
MehrHerzlich willkommen zur Vorlesung Statistik. Streuungsmaße oder die Unterschiedlichkeit der Daten nebst kurzen Ausführungen zu Schiefe und Wölbung
FB 1 W. Ludwig-Mayerhofer Statistik 1 Herzlich willkommen zur Vorlesung Statistik smaße oder die Unterschiedlichkeit der Daten nebst kurzen Ausführungen zu Schiefe und Wölbung FB 1 W. Ludwig-Mayerhofer
MehrSTATISTIK I Übung 04 Spannweite und IQR. 1 Kurze Wiederholung. Was sind Dispersionsparameter?
STATISTIK I Übung 04 Spannweite und IQR 1 Kurze Wiederholung Was sind Dispersionsparameter? Die sogenannten Dispersionsparameter oder statistischen Streuungsmaße geben Auskunft darüber, wie die Werte einer
MehrStatistik I. 1. Klausur Wintersemester 2010/2011 Hamburg, Art der Anmeldung: STiNE FlexNow Zulassung unter Vorbehalt
Statistik I 1. Klausur Wintersemester 2010/2011 Hamburg, 11.02.2011 BITTE LESERLICH IN DRUCKBUCHSTABEN AUSFÜLLEN! Nachname:............................................................................ Vorname:.............................................................................
MehrDas harmonische Mittel
Das harmonische Mittel x H := 1 1 n n 1 x i Das harmonische Mittel entspricht dem Mittel durch Transformation t 1 t Beispiel: x 1,..., x n Geschwindigkeiten, mit denen konstante Wegstrecken l zurückgelegt
Mehr1,11 1,12 1,13 1,14 1,15 1,16 1,17 1,17 1,17 1,18
3. Deskriptive Statistik Ziel der deskriptiven (beschreibenden) Statistik (explorativen Datenanalyse) ist die übersichtliche Darstellung der wesentlichen in den erhobenen Daten enthaltene Informationen
MehrTeil I: Deskriptive Statistik
Teil I: Deskriptive Statistik 2 Grundbegriffe 2.1 Merkmal und Stichprobe 2.2 Skalenniveau von Merkmalen 2.3 Geordnete Stichproben und Ränge 2.1 Merkmal und Stichprobe An (geeignet ausgewählten) Untersuchungseinheiten
MehrBiomathematik für Mediziner, Klausur WS 1999/2000 Seite 1
Biomathematik für Mediziner, Klausur WS 1999/2000 Seite 1 Aufgabe 1: Wieviele der folgenden Variablen sind quantitativ stetig? Schulnoten, Familienstand, Religion, Steuerklasse, Alter, Reaktionszeit, Fahrzeit,
Mehr5. Spezielle stetige Verteilungen
5. Spezielle stetige Verteilungen 5.1 Stetige Gleichverteilung Eine Zufallsvariable X folgt einer stetigen Gleichverteilung mit den Parametern a und b, wenn für die Dichtefunktion von X gilt: f x = 1 für
Mehr3 Lage- und Streuungsmaße
3 Lage- und Streuungsmaße Grafische Darstellungen geben einen allgemeinen Eindruck der Verteilung eines Merkmals, u.a. von Lage und Zentrum der Daten, Streuung der Daten um dieses Zentrum, Schiefe / Symmetrie
Mehr3. Lektion: Deskriptive Statistik
Seite 1 von 5 3. Lektion: Deskriptive Statistik Ziel dieser Lektion: Du kennst die verschiedenen Methoden der deskriptiven Statistik und weißt, welche davon für Deine Daten passen. Inhalt: 3.1 Deskriptive
Mehra) x = 1150 ; x = 950 ; x = 800 b) Die Lagemaße unterscheiden sich voneinander. c) Der Median charakterisiert die Stichprobe am besten.
R. Brinkmann http://brinkmann-du.de Seite 6.0.2009 Lösungen Mittelwert, Median II se: E E2 E3 E4 E5 E6 a) Notendurchschnitt 2,6 b) Säulendiagramm siehe ausführliche Lösung. c) Kreisdiagramm siehe ausführliche
MehrGundlagen empirischer Forschung & deskriptive Statistik. Statistische Methoden in der Korpuslinguistik Heike Zinsmeister WS 2008/09
Gundlagen empirischer Forschung & deskriptive Statistik Statistische Methoden in der Korpuslinguistik Heike Zinsmeister WS 2008/09 Grundlagen Vorbereitung einer empirischen Studie Allgemeine Beschreibung
MehrStandardisierte Vorgehensweisen und Regeln zur Gewährleistung von: Eindeutigkeit Schlussfolgerungen aus empirischen Befunden sind nur dann zwingend
Standardisierte Vorgehensweisen und Regeln zur Gewährleistung von: Eindeutigkeit Schlussfolgerungen aus empirischen Befunden sind nur dann zwingend oder eindeutig, wenn keine alternativen Interpretationsmöglichkeiten
MehrForschungsstatistik I
Prof. Dr. G. Meinhardt. Stock, Taubertsberg R. 0-0 (Persike) R. 0-1 (Meinhardt) Sprechstunde jederzeit nach Vereinbarung Forschungsstatistik I Dr. Malte Persike persike@uni-mainz.de http://psymet0.sowi.uni-mainz.de/
MehrWas sind Zusammenhangsmaße?
Was sind Zusammenhangsmaße? Zusammenhangsmaße beschreiben einen Zusammenhang zwischen zwei Variablen Beispiele für Zusammenhänge: Arbeiter wählen häufiger die SPD als andere Gruppen Hochgebildete vertreten
MehrStatistik SS Deskriptive Statistik. Bernhard Spangl 1. Universität für Bodenkultur. March 1, 2012
Statistik SS 2012 Deskriptive Statistik Bernhard Spangl 1 1 Institut für angewandte Statistik und EDV Universität für Bodenkultur March 1, 2012 B. Spangl (Universität für Bodenkultur) Statistik SS 2012
Mehr5 Exkurs: Deskriptive Statistik
5 EXKURS: DESKRIPTIVE STATISTIK 6 5 Ekurs: Deskriptive Statistik Wir wollen zuletzt noch kurz auf die deskriptive Statistik eingehen. In der Statistik betrachtet man für eine natürliche Zahl n N eine Stichprobe
Mehr