Primer: Deskriptive Statistik 1.0

Größe: px
Ab Seite anzeigen:

Download "Primer: Deskriptive Statistik 1.0"

Transkript

1 Primer: Deskriptive Statistik 1.0 Dr. Malte Persike methodenlehre.com twitter.com/methodenlehre methodenlehre.com/g+ Folie 1

2 Variablen & Skalen Nominaldaten Variablen Deskriptive Statistik Warum das Alles? Skalen Nominalskala Notation Was ist eigentlich Deskriptive Statistik? Und wozu brauchen wir sie überhaupt? Folie 2

3 Variablen & Skalen Nominaldaten Variablen Deskriptive Statistik Warum das Alles? Skalen Nominalskala Notation Folie 3

4 Variablen & Skalen Nominaldaten Variablen Deskriptive Statistik Warum das Alles? Skalen Nominalskala Notation Statistik ist ein Grundpfeiler der empirischen Forschung und Wissenschaft Empirie = Erfahrungswissen Empirische Forschung = auf Messung und systematischer Beobachtung beruhende Forschung Empirische Forschung produziert immer Daten, zumeist sehr viele davon, in numerischer Form ( Zahlen ) Folie 4

5 Variablen & Skalen Nominaldaten Variablen Deskriptive Statistik Warum das Alles? Skalen Nominalskala Notation Deskriptive Statistik ist ein Verfahren zur Beschreibung von Zahlen vielen Daten durch andere Zahlen wenige Werte ( Kennwerte ) Folie 5 Die Deskriptive Statistik dient also der Reduktion einer Datenmenge auf einen überschaubaren Satz an zahlenmäßigen Charakterisierungen

6 Variablen & Skalen Nominaldaten Variablen Skalen Nominalskala Notation Merkmale & ihre Träger Grundbegriffe empirischer Forschung Merkmal: Isolierte Eigenschaft eines größeren Ganzen, z.b. Intelligenz, Farbe, BMI, Einkommen Ausprägung: Zustand des Merkmals, z.b. IQ = 115, Farbe =, BMI = 21.3, Einkommen = hoch Ein Merkmal hat mindestens zwei Ausprägungen, die beliebig beschrieben sein können, z.b. verbal (jung/alt), numerisch (0/1), bildlich ( / ) Folie 6

7 Variablen & Skalen Nominaldaten Variablen Skalen Nominalskala Notation Merkmale & ihre Träger Grundbegriffe empirischer Forschung Merkmalsträger (statistische Einheiten, Beobachtungseinheiten) sind alle Objekte, bei denen man die Ausprägung von Merkmalen feststellen kann In den Humanwissenschaften sind Merkmalsträger zumeist Menschen oder Tiere, aber auch Aggregate wie z.b. Abteilungen in Firmen Beobachtungen: Feststellung der Ausprägung von Merkmalen bei Merkmalsträgern Folie 7

8 Variablen & Skalen Nominaldaten Variablen Skalen Nominalskala Notation Merkmale & ihre Träger Grundbegriffe empirischer Forschung Beobachtungen im engeren Sinn sind z.b. die echte Verhaltensbeobachtung oder bildgebende Verfahren Zu den Beobachtungen im weiteren Sinn zählen aber auch Ergebnisse in einem Leistungstest oder Selbst- und Fremdauskünfte in Fragebögen Daten sind sämtliche Beobachtungen bei der Informationssammlung Statistik sind Methoden zur Sammlung und Analyse von Daten Folie 8

9 Variablen & Skalen Nominaldaten Variablen Vom Merkmal zur Variable Statistik braucht Zahlen Skalen Nominalskala Notation Die Ausprägungen eines Merkmals können beliebiger Art sein (z.b. Worte, Formen, Farben) Die Statistik als mathematische Disziplin arbeitet nur mit Zahlen und benutzt deshalb Variablen Eine Variable wird definiert, indem den Ausprägungen des Merkmals Zahlen zugeordnet werden. Diese Zahlen heißen Realisationen oder Werte. Merkmal Punkte auf Fläche 2 5 Variable Zahlen Folie 9

10 Variablen & Skalen Nominaldaten Variablen Skalen Variablen Notation Nominalskala Notation Variablen werden mit Großbuchstaben symbolisiert, häufig verwendet man X und Y Die Realisationen einer Variablen werden dann mit den entsprechenden Kleinbuchstaben gekennzeichnet, also x und y Die Menge aller möglichen Realisationen ist der Wertebereich einer Variablen Folie 10

11 Variablen & Skalen Nominaldaten Variablen Variablen Definition Skalen Variablen werden immer über eine mathematische Formulierung definiert, z.b. Nominalskala Notation Merkmal X Variable x: 1 1, 0, wenn x: 2 2, 1, wenn x: 6 6, 5, wenn Die extensionale Definition zählt alle Realisationen der Variablen auf. Folie 11

12 Variablen & Skalen Nominaldaten Variablen Variablen Definition Skalen Variablen werden immer über eine mathematische Formulierung definiert, z.b. Nominalskala Merkmal Variable Notation X 0 Die intensionale Definition gibt eine Vorschrift an, die die Variable eindeutig spezifiziert. Folie 12

13 Variablen & Skalen Nominaldaten Variablen Variablen & Messungen Grundlagen Skalen Nominalskala Notation Folie 13 Die empirische Feststellung der Realisation einer Variablen wird als Messung bezeichnet Dabei ist zu unterscheiden zwischen der Beobachtung der Ausprägung des Merkmals und der Messung der Realisation der Variablen Denn: Die Beobachtung kann eine Information in beliebiger Form erheben (z.b. verbal, bildlich), die Messung liefert immer eine Zahl. Die gemessenen Zahlen heißen Messwerte oder Ergebnisse

14 Variablen & Skalen Nominaldaten Variablen Skalen Variablen Unterscheidung nach Art der Daten Eine wesentliche Unterscheidung von Typen von Variablen trennt diskrete von stetigen Variablen Nominalskala Eine diskrete Variable besitzt zumeist endlich viele und feste Werte, die man über Ganzzahlen beschreiben kann Notation Dichtome Variablen haben genau zwei diskrete Werte Polytome Variablen haben mehr als zwei diskrete Werte Eine stetige (kontinuierliche) Variable kann (unendlich viele) beliebige Werte annehmen, die man über reelle Zahlen beschreibt Folie 14

15 Variablen & Skalen Nominaldaten Variablen Skalen Variablen Unterscheidung nach Art der Daten Achtung: Es sind streng Typen von Merkmalen und Typen von Variablen zu unterscheiden. Nominalskala Notation Alter ist ein kontinuierliches bzw. stetiges Merkmal. Eine Variable Alter kann nun aber diskret definiert werden als x1: -1, wenn <18 Alter X x2: 0, wenn <67 x3: 1, wenn 67 Folie 15 Gleiches gilt z.b. für Intelligenz, Schulleistung, Sehvermögen, Fahreignung

16 Variablen & Skalen Nominaldaten Variablen Skalen Definition Skalen Nominalskala Notation Definition der Skala (oder richtiger: Skale) Eine Skale ist die Festlegung von Einheiten, in denen ein gegebenes Merkmal gemessen wird Die Einheiten sind zumeist numerisch (Zahlen), können aber auch beliebige andere Symbole sein Nur Variablen, die auf derselben Skale gemessen wurden, sind direkt miteinander vergleichbar In allen anderen Fällen müssen die Skalen sofern möglich ineinander überführt werden (Skalentransformation). Folie 16

17 Variablen & Skalen Nominaldaten Variablen Skalen Vom Merkmal zur Skale Am Beispiel des MOCI (Hodgson & Rachman, 1977) Nominalskala Notation Konstrukt: OCSD Merkmal: Kreuze im MOCI? Skale 19 X x : 0, wenn 0 ja 1 x : 1, wenn 1 ja 2 x : 30, wenn 30 ja 31 Folie 17 Messung Variable: MOCI-Score

18 Variablen & Skalen Nominaldaten Variablen Skalen Nominalskala Notation Vom Merkmal zur Skale Am Beispiel des MOCI (Hodgson & Rachman, 1977) Y=1: Keine OCSD Y=2: Leichte OCSD Y=3: Mittlere OCSD Y=4: Schwere OCSD Konstrukt: OCSD Skalentransformation Merkmal: Kreuze im MOCI y1: 1, X 0,14 y2: 2, X 15,18 Y( X) y3: 3, X 19, 23 y4: 4, X 24,30 19 X 0, wenn 0 ja 1, wenn 1 ja 30, wenn 30 ja Variable: Schweregrad Messung Variable: MOCI-Score Folie 18

19 Variablen Skalen Nominalskala Notation Variablen & Skalen Skalenniveaus Übersicht Es gibt verschiedene Typen von Skalen, die als Skalenniveaus bezeichnet werden. Nominalskala qualitativ Ordinalskala Intervallskala Verhältnisskala quantitativ (Ratioskala) Absolutskala Nominaldaten Bortz, S Der Informationsgehalt nimmt von der Nominalskala zur Absolutskala hin zu Bei Messungen kognitiver Merkmale kommen die Verhältnis- und die Absolutskala so gut wie nie vor Folie 19

20 Variablen & Skalen Nominaldaten Variablen Skalenniveaus Skalen Nominalskala Notation Folie 20 Frage: Warum ist die Kenntnis des Skalenniveaus so wichtig für die empirische Forschung? 1. Das Skalenniveau bestimmt die erlaubten mathematischen Operationen (=,, <, > etc.) 2. Das Skalenniveau bestimmt, welche mathematischen Transformationen auf die Messwerte einer Variablen angewandt werden dürfen, ohne Informationen zu verlieren. Beispiele: Hat eine Person mit X=20 eine doppelt so schwere OCSD wie jemand mit X=10? Hat eine Person mit Y=2 eine doppelt so schwere OCSD wie jemand mit Y=1? Verliert man durch die Transformation Y(X) Informationen?

21 Variablen & Skalen Nominaldaten Variablen Skalenniveaus Skalen Nominalskala Notation Frage: Warum ist die Kenntnis des Skalenniveaus so wichtig für die empirische Forschung? 1. Das Skalenniveau bestimmt die erlaubten mathematischen Operationen (=,, <, > etc.) 2. Das Skalenniveau bestimmt, welche mathematischen Transformationen auf die Messwerte einer Variablen angewandt werden dürfen, ohne Informationen zu verlieren. 3. Das Skalenniveau bestimmt damit auch, welche statistischen Verfahren überhaupt auf Daten angewandt werden dürfen. Also: Ohne Skalenniveau keine Statistik Folie 21

22 Variablen Skalen Variablen & Skalen Nominalskala Definition Nominaldaten Bortz, S. 12 Nominalskala Notation Bei einer Nominalskala werden den Realisationen einer Variablen Zahlen mit dem Ziel zugeordnet, Kategorien zu unterscheiden Die Zahlen selbst sind vollständig beliebig und damit nicht interpretierbar Die Anwendung mathematischer Operationen auf die Werte einer nominalskalierten Variablen ist unter bestimmten Voraussetzungen möglich, aber zumeist nicht sinnvoll. Folie 22

23 Variablen & Skalen Nominaldaten Variablen Skalen Nominalskala Beispiele Konstitutionstypen Nominalskala Notation a) Leptosomer Typ b) Athletischer Typ c) Pyknischer Typ Temperamentstypen Folie 23

24 Variablen & Skalen Nominaldaten Variablen Skalen Nominalskala Zulässige Operationen Nominalskala Zulässige Operationen sind ausschließlich Äquivalenzrelationen, d.h. Gleich und Ungleich Notation Jede andere Aussage als A ist gleich/ungleich B ist bei einer nominalskalierten Variable unzulässig! Folie 24

25 Variablen & Skalen Nominaldaten Variablen Nominalskala Zulässige Transformationen Skalen Nominalskala Zulässige Transformationen sind eineindeutige Abbildungen, so dass die Unterscheidbarkeit der Realisationen erhalten bleibt. Notation Folie 25

26 Variablen & Skalen Nominaldaten Variablen Exkurs: Notation Indizierung von Realisationen und Merkmalsträgern Skalen Nominalskala Notation Frage: Wie werden Realisationen formal kodiert? Ziel: Eine symbolische Schreibweise für Der Wert der vierten Ausprägung von X zu finden Hat eine Variable X genau k mögliche Realisationen, so werden diese mit x 1, x 2,, x k indiziert Laufindizes (oft i oder j) helfen, die einzelnen Realisationen symbolisch zu adressieren (Beginn bei 1). x1: 1, wenn <18 Alter X x2: 2, wenn <68 x3: 3, wenn 68 y1: 0, wenn <18 Alter Y y2: 18, wenn <68 y3: 68, wenn 68 Folie 26

27 Variablen & Skalen Nominaldaten Variablen Exkurs: Notation Indizierung von Realisationen und Merkmalsträgern Skalen Nominalskala Notation Folie 27 Frage: Wie werden Realisationen formal kodiert? Ziel: Eine symbolische Schreibweise für Der Wert der vierten Ausprägung von X zu finden Hat eine Variable X genau k mögliche Realisationen, so werden diese mit x 1, x 2,, x k indiziert Laufindizes (oft i oder j) helfen, die einzelnen Realisationen symbolisch zu adressieren (Beginn bei 1). Das Symbol x j mit j = 1 k bezeichnet dann die j-te Realisation der Zufallsvariablen X. Diese Indizierung ist nur für diskrete Variablen sinnvoll, da stetige Variablen unendlich viele Realisationen haben

28 Variablen & Skalen Nominaldaten Variablen Exkurs: Notation Indizierung von Realisationen und Merkmalsträgern Skalen Nominalskala Notation Folie 28 Frage: Wie werden Merkmalsträger formal kodiert? Ziel: Eine symbolische Schreibweise für Der Wert der vierten Person in der Stichprobe zu finden Konvention: Für die Gesamtzahl von Personen wird nahezu immer das Zeichen n (oder N) benutzt. Für die Gesamtzahl von Realisationen werden andere Kleinbuchstaben verwendet (z.b. k) Dann dient wieder ein Laufindex dazu, die einzelnen Personen zu adressieren Das Symbol x i mit i = 1 n bezeichnet dann die i-te Messung der Zufallsvariablen X.

29 Variablen & Skalen Nominaldaten Variablen Exkurs: Notation Indizierung von Realisationen und Merkmalsträgern Skalen Nominalskala Notation Problem: Das Symbol x 3 kann die dritte Realisation der Zufallsvariablen X sein oder auch der Wert der 3. Person in der Stichprobe Also: Es muss vorher definiert sein, was der Laufindex bedeutet, z.b. Die Variable X habe k Realisationen und sei an n Personen gemessen worden. x i x j Folie 29 mit i = 1 n mit j = 1 k

30 Variablen & Skalen Nominaldaten Variablen Exkurs: Notation Indizierung von Realisationen und Merkmalsträgern Skalen Nominalskala Notation Folie 30 In der empirischen Forschung gibt es oft viele Variablen, die als UV oder AV erhoben werden. Beispiel: An einer Stichprobe von Personen verschiedenen Geschlechts wird der durchschnittliche Alkoholkonsum über einen Monat hinweg gemessen. Man hat hier offenbar 3 Variablen sowie mehrere Messungen verschiedener Merkmalsträger IQ als AV: (X) Geschlecht als UV (Y) Alkoholabhängigkeit als UV (Z) Frage: Wie indiziert man z.b. Die IQ-Messung des 4. Mannes in der Gruppe der Alkoholiker?

31 Variablen & Skalen Nominaldaten Variablen Skalen Nominalskala Exkurs: Notation Indizierung von Realisationen und Merkmalsträgern Die Variable Geschlecht (Y) wird in k=2 Ausprägungen gemessen: y 1 : 0 = männlich y 2 : 1 = weiblich Notation Die Variable Alkoholkonsum (Z) wird diskretisiert in m=5 Ausprägungen (Jelinek, 1951) gemessen: Z = z 1 : 0 = Kein Alkoholkonsum z 2 : 1 = Konflikt-/Erleichterungstrinker z 3 : 2 = Gelegenheitstrinken z 4 : 3 = Rauschtrinken (Alkoholiker) z 5 : 4 = Periodisches Trinken (Alkoholiker) Folie 31 Es nehmen insgesamt n=220 Personen teil

32 Variablen & Skalen Nominaldaten Variablen Exkurs: Notation Indizierung von Realisationen und Merkmalsträgern Skalen Nominalskala Notation Die AV ist der IQ. Dies ist die Variable, deren Realisation im Experiment bei den Merkmalsträgern gemessen wird. Die beiden anderen Variablen sind UVen, deren Realisationen vor dem Experiment bereits feststehen, bzw. erhoben werden. Zur eindeutigen Indizierung des IQ eines Merkmalsträgers werden nun mehrere Laufindizes benötigt Folie 32

33 Variablen & Skalen Nominaldaten Variablen Skalen Exkurs: Notation Indizierung von Realisationen und Merkmalsträgern Eine Person fällt immer in eine der km = 25 = 10 Gruppen von Geschlecht und Alkoholkonsum Nominalskala Notation Der Laufindex für Geschlecht sei r = 1 k und für Alkoholkonsum s = 1 m Jede der 10 Gruppen hat also n rs Mitglieder Jede Person kann eindeutig identifiziert werden über x irs mit i=1 n rs r=1 k, s=1 m Folie 33 So ist z.b. x 4,1,3 der IQ des vierten Mannes unter den Gelegenheitstrinkern

34 Variablen & Skalen Nominaldaten Variablen Exkurs: Notation Indizierung von Realisationen und Merkmalsträgern Skalen Nominalskala Notation Oft möchte man über einen der Indizes aggregieren (z.b. mitteln) Beispiel: Alle weiblichen Rauschtrinker Dann kommt die Punktnotation zum Einsatz x rs hier: x,2,5 Der Punkt symbolisiert Alle, in diesem Fall also Alle Personen in Gruppe Y=y r, Z=z s. Folie 34

35 Variablen & Skalen Nominaldaten Bortz, S. 47 Häufigkeiten Nominaldaten Numerische Beschreibung: Häufigkeiten Kreuztabellen Kennwerte Grafische Darstellung Nominalskalierte Variablen sind praktisch immer diskret und endlich Die empirische beobachtete Häufigkeit des Auftretens einer Realisation X = x wird als h(x = x) oder vereinfacht h(x) geschrieben. h(x) bezeichnet man als absolute Häufigkeit Die relative Häufigkeit f(x = x) bzw. f(x) ist dann definiert als der Quotient aus absoluter Häufigkeit und der Anzahl n aller Beobachtungen hx ( ) f ( x) h( x) f( x) n n Achtung: Relative Häufigkeiten sind nicht Wahrscheinlichkeiten Folie 35

36 Variablen & Skalen Nominaldaten Häufigkeiten Nominaldaten Numerische Beschreibung: univariate Kreuztabellen Kreuztabellen Kennwerte Grafische Darstellung Folie 36 Wert von X h(x = x j ) f(x = x j ) x 1 h(x 1 ) f(x 1 ) x 2 h(x 2 ) f(x 2 ) x i h(x i ) f(x i ) x k h(x k ) f(x k ) Die Sammlung der Zahlenwerte der h(x = x j ) und f(x = x j ) für alle möglichen j = 1 k wird als diskrete Häufigkeitsverteilung bezeichnet Die tabellarische Darstellung erfolgt über Häufigkeitstabellen

37 Variablen & Skalen Nominaldaten Häufigkeiten Nominaldaten Numerische Beschreibung: bivariate Kreuztabellen Kreuztabellen Kennwerte Grafische Darstellung Oft betrachtet man Häufigkeiten für das gemeinsame Auftreten zweier Merkmale Beispiel: Frauen/Männer, die unter-/normal- /übergewichtig sind In diesem Fall werden 2 Variablen betrachtet: X: Geschlecht (x 1, x 2 ) Y: Gewichtsstatus (y 1, y 2, y 3 ) Die Häufigkeiten sind nun so genannte Verbundhäufigkeiten, die das Vorkommen jeder möglichen Kombination aus x und y beschreiben Folie 37

38 Variablen & Skalen Nominaldaten Häufigkeiten Nominaldaten Numerische Beschreibung: bivariate Kreuztabellen Kreuztabellen Absolute Verbundhäufigkeiten werden im bivariaten Fall symbolisiert als h(x=x, Y=y) bzw. h(x, y) Kennwerte Grafische Darstellung Folie 38 Relative Verbundhäufigkeiten als f(x=x, Y=y) bzw. f(x, y) Tabellarische Darstellung über Kreuztabellen (oder Kontingenztabellen) Geschlecht Männlich (x 1 ) Weiblich (x 2 ) Σ Unter (y 1 ) f(x 1,y 1 ) f(x 2,y 1 ) f(,y 1 ) Gewicht Normal (y 2 ) f(x 1,y 2 ) f(x 2,y 2 ) f(,y 2 ) Über (y 3 ) f(x 1,y 3 ) f(x 2,y 3 ) f(,y 3 ) Σ f(x 1, ) f(x 2, ) f(, ) Randhäufigkeiten

39 Variablen & Skalen Nominaldaten Häufigkeiten Nominaldaten Numerische Beschreibung: multivariate Kreuztabellen Kreuztabellen Kennwerte Grafische Darstellung Auch das gemeinsame Vorkommen von mehr als zwei Merkmalen ist über Kreuztabellen darstellbar Beispiel: Frauen/Männer, die unter-/normal- /übergewichtig sind und Stricken/World of Warcraft spielen In diesem Fall werden 3 Variablen betrachtet: X: Geschlecht (x 1, x 2 ) Y: Gewichtsstatus (y 1, y 2, y 3 ) Z: Freizeitbeschäftigung (z 1, z 2 ) Folie 39

40 Variablen & Skalen Nominaldaten Häufigkeiten Nominaldaten Numerische Beschreibung: multivariate Kreuztabellen Kreuztabellen Kennwerte Absolute Verbundhäufigkeiten werden im multivariaten Fall symbolisiert als h(x=x, Y=y, ) bzw. h(x, y, ) Relative Verbundhäufigkeiten als f(x=x, Y=y, ) bzw. f(x, y, ) Grafische Darstellung Tabellarische Darstellung über geschachtelte (oder genestete ) Kreuztabellen Geschlecht Männlich (x 1 ) Weiblich (x 2 ) Freizeit Stricken (z 1 ) WoW (z 2 ) Stricken (z 1 ) WoW (z 2 ) Unter (y 1 ) f(x 1,y 1,z 1 ) f(x 1,y 1,z 2 ) f(x 2,y 1,z 1 ) f(x 2,y 1,z 2 ) Gewicht Normal (y 2 ) f(x 1,y 2,z 1 ) f(x 1,y 2,z 2 ) f(x 2,y 2,z 1 ) f(x 2,y 2,z 2 ) Über (y 3 ) f(x 1,y 3,z 1 ) f(x 1,y 3,z 2 ) f(x 2,y 3,z 1 ) f(x 2,y 3,z 2 ) Folie 40

41 Variablen & Skalen Nominaldaten Häufigkeiten Nominaldaten Numerische Beschreibung: Kennwerte Kreuztabellen Kennwerte Grafische Darstellung Als Kennwert bezeichnet man ein statistisches Maß, das eine Menge von Messwerten über zumeist nur eine Zahl beschreibt Kennwerte dienen damit der Datenreduktion Kennwerte charakterisieren lediglich bestimmte Eigenschaften der gegebenen Menge von Messwerten, sie bedeuten als einen Informationsverlust Folie 41

42 Variablen & Skalen Nominaldaten Bortz, S Häufigkeiten Nominaldaten Numerische Beschreibung: Kennwerte Kreuztabellen Kennwerte Grafische Darstellung Ein Kennwert für nominalskalierte Daten ist der Modalwert (oder Modus ) Er bezeichnet die unter den Messwerten am häufigsten vorkommende Realisation x : x f( x) max. mod Wichtig: Der Modalwert ist nicht die Häufigkeit des Messwertes, sondern der Wert selbst. Folie 42 Bei mehreren Maxima sinkt die Aussagekraft von x mod

43 Variablen & Skalen Nominaldaten Bortz, S Häufigkeiten Kreuztabellen Kennwerte Grafische Darstellung Nominaldaten Grafische Beschreibung: Kreisdiagramm Das Kreis- oder Tortendiagramm stellt die absoluten oder relativen Häufigkeiten von Klassen als Kreissegmente eines Vollkreises ( Tortenstücke ) dar. Der Öffnungswinkel α eines Tortenstücks ist dabei durch den Anteil der Klassenelemente an allen Elementen definiert und wird berechnet als hx ( ) f ( x) n Die Summe der Öffnungswinkel aller Kreissegmente sollte wieder 360 ergeben Folie 43

44 Variablen & Skalen Nominaldaten Häufigkeiten Kreuztabellen Nominaldaten Grafische Beschreibung: Kreisdiagramm Beispiel: Von den Wahlgängern der Bundestagswahl 2009 haben gewählt: Kennwerte % % Grafische Darstellung Folie % % % % SPD CDU/CSU FDP Grüne Linke Sonstige

45 Variablen & Skalen Nominaldaten Häufigkeiten Nominaldaten Grafische Beschreibung: Säulendiagramm Kreuztabellen Kennwerte Grafische Darstellung Das Balken- oder Säulendiagramm stellt die absoluten oder relativen Häufigkeiten von Realisationen einer Variablen als Balken (waagerecht) oder Säulen (senkrecht) dar. Die verschiedenen möglichen Realisationen werden hier auch als Klassen bezeichnet Der Länge der Säulen bzw. Balken ist dabei durch den Anteil der Klassenelemente am Ganzen bzw. die absolute Anzahl definiert. Die Breite der Balken variiert niemals innerhalb eines Balkendiagramms Folie 45

46 Variablen & Skalen Nominaldaten Häufigkeiten Kreuztabellen Nominaldaten Grafische Beschreibung: Säulendiagramm Beispiel: Von den Wahlgängern der Bundestagswahl 2009 haben gewählt: Kennwerte Grafische Darstellung Folie 46

47 Variablen & Skalen Nominaldaten Häufigkeiten Kreuztabellen Nominaldaten Grafische Beschreibung: Säulendiagramm Warum gleiche Säulenbreiten? Kennwerte Grafische Darstellung Folie 47 Menschen neigen zur Größenbewertung anhand der Fläche.

48 Variablen & Skalen Nominaldaten Grafische Beschreibung How-not -to Folie 48 Quelle:

49 Ordinaldaten Intervalldaten Grafische Beschreibung How-not -to Bild fragt: Brauchen wir eine Ausländerquote an deutschen Schulen? als Reaktion auf PISA 2008 Folie 49

50 Variablen & Skalen Nominaldaten Grafische Beschreibung How-not -to Quelle: Folie 50

51 Variablen & Skalen Nominaldaten Grafische Beschreibung How-not -to Keine Geschlechterlücke mehr beim Gehalt von Führungskräften Folie 51

52 Variablen & Skalen Nominaldaten Variablen Indexnotation Indizierung von Realisationen und Merkmalsträgern Skalen Nominalskala Notation Frage: Wie werden Realisationen formal kodiert? Ziel: Eine symbolische Schreibweise für Der Wert der vierten Ausprägung von X zu finden Hat eine Variable X genau k mögliche Realisationen, so werden diese mit x 1, x 2,, x k indiziert Laufindizes (oft i oder j) helfen, die einzelnen Realisationen symbolisch zu adressieren (Beginn bei 1). x1: 1, wenn <18 Alter X x2: 2, wenn <68 x3: 3, wenn 68 y1: 0, wenn <18 Alter Y y2: 18, wenn <68 y3: 68, wenn 68 Folie 2

53 Variablen & Skalen Nominaldaten Variablen Indexnotation Indizierung von Realisationen und Merkmalsträgern Skalen Nominalskala Notation Folie 3 Frage: Wie werden Realisationen formal kodiert? Ziel: Eine symbolische Schreibweise für Der Wert der vierten Ausprägung von X zu finden Hat eine Variable X genau k mögliche Realisationen, so werden diese mit x 1, x 2,, x k indiziert Laufindizes (oft i oder j) helfen, die einzelnen Realisationen symbolisch zu adressieren (Beginn bei 1). Das Symbol x j mit j = 1 k bezeichnet dann die j-te Realisation der Zufallsvariablen X. Diese Indizierung ist nur für diskrete Variablen sinnvoll, da stetige Variablen unendlich viele Realisationen haben

54 Variablen & Skalen Nominaldaten Variablen Indexnotation Indizierung von Realisationen und Merkmalsträgern Skalen Nominalskala Notation Folie 4 Frage: Wie werden Merkmalsträger formal kodiert? Ziel: Eine symbolische Schreibweise für Der Wert der vierten Person in der Stichprobe zu finden Konvention: Für die Gesamtzahl von Personen wird nahezu immer das Zeichen n (oder N) benutzt. Für die Gesamtzahl von Realisationen werden andere Kleinbuchstaben verwendet (z.b. k) Dann dient wieder ein Laufindex dazu, die einzelnen Personen zu adressieren Das Symbol x i mit i = 1 n bezeichnet dann die i-te Messung der Zufallsvariablen X.

55 Variablen & Skalen Nominaldaten Variablen Indexnotation Indizierung von Realisationen und Merkmalsträgern Skalen Nominalskala Notation Problem: Das Symbol x 3 kann die dritte Realisation der Zufallsvariablen X sein oder auch der Wert der 3. Person in der Stichprobe Also: Es muss vorher definiert sein, was der Laufindex bedeutet, z.b. Die Variable X habe k Realisationen und sei an n Personen gemessen worden. x i x j Folie 5 mit i = 1 n mit j = 1 k

56 Variablen & Skalen Nominaldaten Variablen Indexnotation Indizierung von Realisationen und Merkmalsträgern Skalen Nominalskala Notation Folie 6 In empirischen Forschung gibt es oft viele Variablen, die erhoben werden. Beispiel: An einer Stichprobe von Personen verschiedenen Geschlechts wird der durchschnittliche Alkoholkonsum über einen Monat hinweg gemessen. Man hat hier offenbar 3 Variablen sowie mehrere Messungen verschiedener Merkmalsträger IQ: X Geschlecht: Y Alkoholabhängigkeit: Z Frage: Wie indiziert man z.b. Die IQ-Messung des 4. Mannes in der Gruppe der Alkoholiker?

57 Variablen & Skalen Nominaldaten Variablen Indexnotation Indizierung von Realisationen und Merkmalsträgern Skalen Nominalskala Notation Die Variable Geschlecht (Y) wird in k=2 Realisationen gemessen: y 1 : 0 = männlich y 2 : 1 = weiblich Die Variable Alkoholkonsum (Z) wird diskretisiert in m=5 Realisationen (Jelinek, 1951) gemessen: Z = z 1 : 0 = Kein Alkoholkonsum z 2 : 1 = Konflikt-/Erleichterungstrinker z 3 : 2 = Gelegenheitstrinken z 4 : 3 = Rauschtrinken (Alkoholiker) z 5 : 4 = Periodisches Trinken (Alkoholiker) Folie 7 Es nehmen insgesamt n=220 Personen teil

58 Variablen & Skalen Nominaldaten Variablen Indexnotation Indizierung von Realisationen und Merkmalsträgern Skalen Nominalskala Notation Die AV ist der IQ. Dies ist die Variable, deren Realisation im Experiment bei den Merkmalsträgern gemessen wird. Die beiden anderen Variablen sind UVen, deren Realisationen vor dem Experiment bereits feststehen, bzw. erhoben werden. Zur eindeutigen Indizierung des IQ eines Merkmalsträgers werden nun mehrere Laufindizes benötigt Folie 8

59 Variablen & Skalen Nominaldaten Variablen Skalen Indexnotation Indizierung von Realisationen und Merkmalsträgern Eine Person fällt immer in eine der km = 25 = 10 Gruppen von Geschlecht und Alkoholkonsum Nominalskala Notation Der Laufindex für Geschlecht sei r = 1 k und für Alkoholkonsum s = 1 m Jede der 10 Gruppen hat also n rs Mitglieder Jede Person kann eindeutig identifiziert werden über x irs mit i=1 n rs r=1 k, s=1 m Folie 9 So ist z.b. x 4,1,3 der IQ des vierten Mannes unter den Gelegenheitstrinkern

60 Variablen & Skalen Nominaldaten Variablen Indexnotation Indizierung von Realisationen und Merkmalsträgern Skalen Nominalskala Notation Oft möchte man über einen der Indizes aggregieren (z.b. mitteln) Beispiel: Alle weiblichen Rauschtrinker Dann kommt die Punktnotation zum Einsatz x rs hier: x,2,5 Der Punkt symbolisiert Alle, in diesem Fall also Alle Personen in Gruppe Y=y r, Z=z s. Folie 10

61 Notation Das Summenzeichen Σ Notation Rechenregeln Schachtelung X sei irgendeine Variable, z.b. Körpergröße An n Messobjekten seien die Werte dieser Variablen gemessen worden Es liegen also die n Messungen x 1, x 2,,x n vor, wobei jedes der x irgendeine Zahl ist Wenn man alle n Messungen aufsummieren wollte, so müsste man schreiben Summe aller x x1x2... xn Folie 2

62 Notation Rechenregeln Schachtelung Das Summenzeichen Σ Notation Für die linke Seite der Gleichung, also die Summe aller x hat die Mathematik ein Symbol entwickelt Man schreibt Und spricht n i1 x x x... x i 1 2 n Summe aller x i, wobei i von 1 bis n läuft Der Laufindex i bezeichnet dabei einfach die laufende Nummer des Messwertes von einem der n Messobjekte Folie 3

63 Notation Rechenregeln Schachtelung Das Summenzeichen Σ Beispiel Messung Nr. Symbol Messwert 1 x x x x x 5 2 Die Summe aller fünf x i mithilfe des Summenzeichens wird nun geschrieben als Folie 4 5 i1 x i

64 Notation Rechenregeln Schachtelung Das Summenzeichen Σ Rechenregeln 1. Multiplikation jeder Beobachtung mit einer Konstanten n i1 a x ax ax... ax i 1 2 a( x x... x ) a n i1 1 2 x i mit a const. n n Folie 5

65 Notation Rechenregeln Das Summenzeichen Σ Rechenregeln 2. Summation einer Konstanten Schachtelung n b b b... b i1 n-mal nb mit b const. Folie 6

66 Notation Rechenregeln Schachtelung Das Summenzeichen Σ Rechenregeln 3. Addition einer Konstanten zu jeder Beobachtung n i1 x b x bx b... x b i 1 2 x1x2... xn b b... n n n i i1 i1 i1 i n n-mal x b x nb mit b const. Folie 7

67 Ordinaldaten Intervalldaten Notation Rechenregeln Schachtelung Das Summenzeichen Σ Rechenregeln 4. Verbindung von Multiplikation und Addition einer Konstanten n n n i i a x b a x b i1 i1 i1 n a x nb i1 mit a, b const. i Folie 8

68 Ordinaldaten Intervalldaten Notation Rechenregeln Schachtelung Das Summenzeichen Σ Rechenregeln 5. Addition zweier Variablen n i1 x y x y x y... x y i i n n x x... x y y... y 1 2 n 1 2 n x n i i1 i1 y i n Hinweis: Diese Addition ist nur sinnvoll, wenn die Messwerte x und y paarweise zuordenbar sind. Folie 9

69 Ordinaldaten Intervalldaten Notation Das Summenzeichen Σ Geschachtelte Summen - Notation Rechenregeln Schachtelung X sei eine Variable und Y eine zweite Variable X wird n-mal gemessen und Y wird m-mal gemessen. Die Messwerte von X erhalten den Laufindex i und die Messwerte von Y erhalten den Laufindex j Angenommen, alle Kombinationen von x i und y j sollen nun über eine mathematische Funktion miteinander verrechnet und aufsummiert werden Die mathematische Funktion könnte z.b. sein y i j i j f ( x, y ) x Folie 10

70 Ordinaldaten Intervalldaten Notation Das Summenzeichen Σ Geschachtelte Summen - Notation Rechenregeln Schachtelung Daraus ergibt sich eine geschachtelte Summe Sie wird geschrieben als f ( x, y ) f( x, y )... f( x, y ) n m m f( xi, yj) i1 j1 f x2 y1 f x2 y2 f x2 ym... (, ) (, )... (, ) f ( x, y ) f( x, y )... f( x, y ) n 1 n 2 n m Folie 11

71 Ordinaldaten Intervalldaten Notation Das Summenzeichen Σ Geschachtelte Summen - Beispiel Rechenregeln Schachtelung Daraus ergibt sich eine geschachtelte Summe Oder mit der gerade beispielhaft angegebenen mathematischen Funktion, y1 y2 x x... x n m y y j x i i1 j1 y1 y2 y x2 x2... x2... x y1 xy2 x... y n n n m m m Folie 12

72 Notation Rechenregeln Schachtelung Das Summenzeichen Σ Geschachtelte Summen - Rechenregeln 1. Es gilt das Kommutativgesetz n m m n,, f x y f x y i j i j i1 j1 j1 i1 2. Aber keine Trennung von geschachtelten Summen n m n m,,, f x y f x y f x y i j i j i j i1 j1 i1 j1 nicht definiert Folie 13

73 Notation Rechenregeln Schachtelung Das Summenzeichen Σ Geschachtelte Summen Beispiel Messung Nr. Symbol Messwert Symbol Messwert 1 x 1 4 y x 2 2 y x 3 9 Die Summe aller Kombinationen wird für dieses Beispiel geschrieben als geschachtelte Summe: 3 2 i1 j1 f x, y i j f f f 4,5 f 4, 7 2,5 f 2, 7 9,5 f 9, 7 Folie 14

74 Notation Rechenregeln Schachtelung Das Summenzeichen Σ Geschachtelte Summen Beispiel Messung Nr. Symbol Messwert Symbol Messwert 1 x 1 4 y x 2 2 y x 3 9 Mit dem Kommutativgesetz kann also die geschachtelte Summe auch so geschrieben werden: 2 3 j1 i1 f x, y i j f 4,5 f 2,5 f 9,5 f 4,7 f 2,7 f 9,7 Folie 15

75 Ordinalskala Ordinalskala Ordinalskala Definition Darstellungen Bortz, S Häufigkeiten Kennwerte Grafische Darstellung Bei einer Ordinalskala können die Realisationen einer Variablen (natürlich) geordnet werden Die Zuordnung der Zahlen zu den Ausprägungen des Merkmals spiegelt deren Ordnung wider Numerische Abstände zwischen den Realisationen können nicht interpretiert werden Die Anwendung von Rechenoperationen auf die Werte einer ordinalskalierten Variablen ist unter bestimmten Voraussetzungen erlaubt, aber im Allgemeinen eher wenig sinnvoll Folie 2

76 Ordinalskala Darstellungen Ordinalskala Ordinalskala Beispiel Häufigkeiten Kennwerte Grafische Darstellung Folie 3 Social Penetration Theory von Altman und Taylor (1958) (I) (II) (III) (IV) (V) Orientierungsstadium: Sozial erwünschte Normen und Verhaltensschemata werden ausgetauscht (z.b. Smalltalk) Exploratorisch-affektives Stadium: Partielle Öffnung der eigenen Einstellungs- und Wahrnehmungswelt gegenüber dem Anderen im Hinblick auf private, vor allem aber berufliche und weltanschauliche Inhalte. Weiterhin vorsichtige Prüfung der Interaktionsformen ( Bekanntschaftsphase ). Affektives Stadium: Intensiver und möglicherweise kritischer Austausch über private und persönliche Themen. Körperliche Zuwendung wie Berühren und Küssen. Stabiles Stadium: Die Beziehung erreicht ein Plateau, persönliche Inhalte sind geteilt, Verhalten und Emotionen des Anderen vorhersagbar. Depenetration: Zusammenbruch und mögliches Ende der Beziehung, Überwiegen von Kosten gegenüber dem Nutzen.

77 Ordinalskala Darstellungen Ordinalskala Ordinalskala Zulässige Operationen Häufigkeiten Kennwerte Grafische Darstellung Zulässige Operationen sind Äquivalenzrelationen, d.h. Gleich und Ungleich Zudem erlaubt sind qualitative Vergleichsrelationen, d.h. Größer oder Kleiner Wichtig: Diese Vergleichsrelationen umfassen nicht jede Art quantitativer Vergleiche Eine Aussage wie A ist gleich/ungleich/größer/kleiner B ist bei einer ordinalskalierten Variable zulässig, nicht aber A ist viermal so groß wie B. Folie 4

78 Ordinalskala Darstellungen Ordinalskala Ordinalskala Zulässige Transformationen Häufigkeiten Zulässig sind alle streng monotonen Transformationen, so dass die Rangordnung der Werte erhalten bleibt. Kennwerte Grafische Darstellung Folie 5

79 Ordinalskala Darstellungen Ordinalskala Ordinalskala Kritische Betrachtung Häufigkeiten Kennwerte Grafische Darstellung Bei Ordinalskalen und höheren Skalenniveaus können Intransitivitäten auftreten Intransitivität = Eine angenommene Ordnung gilt nicht für bestimmte einzelne Paarungen Beispiel: Nahrungskette in chinesischen Restaurants Mensch Hund Ratte Mensch (nach Glutamatvergiftung) Lösungen: Annahme eines niedrigeren Skalenniveaus, Einführung neuer Skalenstufen Folie 6

80 Ordinalskala Darstellungen Ordinalskala Ordinaldaten Numerische Beschreibung: Häufigkeiten Häufigkeiten Kennwerte Grafische Darstellung Folie 7 Ordinalskalierte Variablen sind sehr häufig diskret und endlich Es gelten die bereits eingeführten Notationen und Berechnungsvorschriften für Häufigkeiten Neben der Häufigkeitsverteilung kann auch noch die empirische Verteilungsfunktion bestimmt werden. Diese gibt an, wie viele Beobachtungen kleiner oder gleich einer bestimmten Realisation sind. Zur Berechnung der Verteilungsfunktion müssen die Realisationen zunächst der Größe nach geordnet werden.

81 Ordinalskala Darstellungen Bortz, S. 47 Ordinalskala Ordinaldaten Numerische Beschreibung: Häufigkeiten Häufigkeiten Kennwerte Grafische Darstellung Empirische Häufigkeitsverteilung und Verteilungsfunktion: Wert von X (geordnet) h(x f(x = x j ) H(X F(X x j ) x 1 h(x f(x 1 ) h(x f(x 1 ) x 2 h(x f(x 2 ) h(x f(x 1 )+h(x )+f(x 2 ) x k h(x f(x k ) h(x f(x 1 )+h(x )+f(x 2 )+ +f(x )+ +h(x k ) k ) Berechnungsvorschrift: analog für absolute Vert.funkt. H(X x j ) HF ( X x ) hf ( x ) j j c 1 c Für Ordinaldaten gelten die bereits eingeführten Konventionen zur Erstellung von Kreuztabellen Folie 8

82 Ordinalskala Darstellungen Ordinalskala Ordinaldaten Numerische Beschreibung: Kennwerte Häufigkeiten Kennwerte Grafische Darstellung Maße der zentralen Tendenz Modalwert Median Andere Lagemaße Extrema (Minimum, Maximum) Quantile, Quantilsrang Generell gilt: Kennwerte für niedrigere Skalenniveaus sind für alle höheren anwendbar Folie 9

83 Ordinalskala Darstellungen Bortz, S Ordinalskala Ordinaldaten Numerische Beschreibung: Modalwert Häufigkeiten Kennwerte Grafische Darstellung Der Modus oder Modalwert für ordinalskalierte Daten ist genau so definiert wie für nominalskalierte Daten Er ist schlichtweg die Realisation x der Variablen X mit dem häufigsten Vorkommen h(x) Aber: Der Modalwert von Ordinaldaten sagt uns mehr über ihre Häufigkeitsverteilung als bei Nominaldaten: 1. Der Modalwert markiert die Lage der häufigsten Realisation relativ zu den anderen Realisationen Folie 10

84 Ordinalskala Darstellungen Ordinalskala Ordinaldaten Numerische Beschreibung: Modalwert Häufigkeiten Kennwerte Grafische Darstellung Folie 11

85 Ordinalskala Darstellungen Bortz, S Ordinalskala Ordinaldaten Numerische Beschreibung: Modalwert Häufigkeiten Kennwerte Grafische Darstellung Der Modus oder Modalwert für ordinalskalierte Daten ist genau so definiert wie für nominalskalierte Daten Er ist schlichtweg die Realisation x der Variablen X mit dem häufigsten Vorkommen h(x) Aber: Der Modalwert von Ordinaldaten sagt uns mehr über ihre Häufigkeitsverteilung als bei Nominaldaten: 1. Der Modalwert markiert die Lage der häufigsten Realisation relativ zu den anderen Realisationen 2. Und man kann uni-, bi- und multimodale Verteilungen unterscheiden Folie 12

86 Ordinalskala Darstellungen Ordinalskala Ordinaldaten Numerische Beschreibung: Modalwert Häufigkeiten Kennwerte Grafische Darstellung Folie 13

87 Ordinalskala Darstellungen Bortz, S Ordinalskala Ordinaldaten Numerische Beschreibung: Median Häufigkeiten Kennwerte Der Median ist der Grafische Darstellung 50 : 50 Punkt einer Datenreihe Folie 14

88 Ordinalskala Darstellungen Bortz, S Ordinalskala Ordinaldaten Numerische Beschreibung: Median Häufigkeiten Kennwerte Der Median ist der Grafische Darstellung 0.50 : 0.50 Punkt einer Datenreihe Folie 15

89 Ordinalskala Darstellungen Ordinalskala Ordinaldaten Numerische Beschreibung: Median Häufigkeiten Kennwerte Grafische Darstellung Der Median ist der Wert, der einen Datensatz mit n Messwerten in zwei gleich große Hälften teilt. Notation: x med oder x med besitzt folgende Eigenschaften: x 1. Mindestens 0.5 n (50%) der Messwerte sind kleiner oder gleich dem Median 2. Mindestens 0.5 n (50%) der Messwerte sind größer oder gleich dem Median Folie 16 Problem: Bei einer geraden Zahl von Messwerten ist der Median nicht eindeutig er liegt dann zwischen den Messwerten

90 Ordinalskala Darstellungen Ordinalskala Ordinaldaten Numerische Beschreibung: Median Häufigkeiten Kennwerte Grafische Darstellung Folie 17 Der Median stimmt häufig mit keinem tatsächlichen Messwert überein Median (wie auch der Modalwert) sind äquivariant gegenüber gewissen (z.b. linearen) Transformationen Insbesondere 1. Addition einer Konstanten a zu allen n Messwerten x 1 x n x a x a 2. Multiplikation aller n Messwerte x 1 x n mit einer Konstanten a x a x a

91 Ordinalskala Darstellungen Ordinalskala Ordinaldaten Numerische Beschreibung: Quantile Häufigkeiten Kennwerte Ein Quantil ist der Grafische Darstellung p : q Punkt einer Datenreihe, wobei q = 1 p Folie 18

92 Ordinalskala Darstellungen Ordinalskala Ordinaldaten Numerische Beschreibung: Quantile Häufigkeiten Kennwerte Ein Quantil ist z.b. der Grafische Darstellung 0.50 : 0.50 Punkt einer Datenreihe. Folie 19

93 Ordinalskala Darstellungen Ordinalskala Ordinaldaten Numerische Beschreibung: Quantile Häufigkeiten Kennwerte Ein Quantil ist z.b. der Grafische Darstellung 0.10 : 0.90 Punkt einer Datenreihe. Folie 20

94 Ordinalskala Darstellungen Ordinalskala Ordinaldaten Numerische Beschreibung: Quantile Häufigkeiten Kennwerte Ein Quantil ist z.b. der Grafische Darstellung 0.75 : 0.25 Punkt einer Datenreihe. Folie 21

95 Ordinalskala Darstellungen Bortz, S Ordinalskala Häufigkeiten Kennwerte Grafische Darstellung Folie 22 Ordinaldaten Numerische Beschreibung: Quantile Quantile sind Zahlen, die einen Datensatz mit n Messwerten in bestimmtem Verhältnis teilen Notation: x p (z. B. x 0.75 ) x p (0 p 1) besitzt folgende Eigenschaften: 1. Mindestens n p Messwerte sind kleiner oder gleich dem Quantil 2. Mindestens n (1 p) Messwerte sind größer oder gleich dem Quantil Je nach der Anzahl von Unterteilungen unterscheidet man Percentile (100er Einteilung), Dezentile (10er Einteilung) und Quartile (4er Einteilung)

96 Ordinalskala Darstellungen Ordinalskala Häufigkeiten Kennwerte Ordinaldaten Numerische Beschreibung: Quantile Wichtige Quantile sind: Perzentile: x.01, x.02,, x.99, x 1.0 bzw. x 1%, x 2%,, x 99%, x 100% Grafische Darstellung Median (2. Quartil, 50% Perzentil) 25% Perzentil (1. Quartil, unteres Quartil) und 75% Perzentil (3. Quartil, oberes Quartil) Dezile: x.10, x.20,, x.90 Folie 23

97 Ordinalskala Darstellungen Ordinalskala Häufigkeiten Kennwerte Grafische Darstellung Ordinaldaten Quantile A cautionary note about conventions In Literatur und Softwarepaketen sind die Berechnungsvorschriften für Quantile häufig unterschiedlich definiert. Maß Bortz Excel SPSS Median Quartil Quartil Für einen Beispieldatensatz mit n=12. Folie 24

98 Ordinalskala Darstellungen Ordinalskala Ordinaldaten Der Quantilsrang Häufigkeiten Kennwerte Grafische Darstellung Als Quantil x p war diejenige Realisation x der Variablen X definiert, die die Daten in einen Anteil von p Messwerten unterhalb oder gleich der Realisation x sowie 1-p Messwerten oberhalb oder gleich x teilt. Besonders bei angewandten Fragestellungen ist oft auch die entgegengesetzte Sichtweise relevant. Beispiel: Eine Person habe in einem Leistungstest einen Wert von 105 Punkten erzielt. Wie viele Personen in der Stichprobe sind nun besser/schlechter? Dies kann über den Quantilsrang p x ermittelt werden. Folie 25

99 Ordinalskala Darstellungen Ordinalskala Häufigkeiten Kennwerte Grafische Darstellung Ordinaldaten Der Quantilsrang Verfahren der Rangbildung Bei der Rangbildung von n Messwerten x 1 x n einer Variablen X können maximal n Ränge vergeben werden. Per Konvention erhält die numerisch niedrigste Ausprägung von X den Rangplatz 1, die höchste den Rangplatz n (kleinere Zahl = kleinerer Rang). Bei mehreren gleichen Werten ( Ties ) von X wird der mittlere Rangplatz vergeben nach der Regel: Es gebe m gleiche Werte von X. Wären sie unterschiedlich und direkt aufeinander folgend, erhielten sie die Rangplätze rg j rg j+m-1. Der mittlere Rang ist dann Folie 26 rg Tie rg 1 j m m1 irg j rg i

100 Ordinalskala Darstellungen Ordinalskala Ordinaldaten Der Quantilsrang Berechung Häufigkeiten Kennwerte Grafische Darstellung Folie 27 Nach der Berechnung der Rangzahl rg(x) eines Merkmalsträgers ermittelt man seinen Quantilsrang p x über p x 0.5 rg x n = Stichprobengröße (d.h. der maximale Rang) Problem: p x reicht nicht von 0 bis 1, sondern liegt in einem etwas schmaleren Bereich, abhängig von der Größe des n. Die Korrekturformel für den Quantilsrang behebt dieses Problem p xcorr, p p n x max p min p min

101 Ordinalskala Darstellungen Ordinalskala Ordinaldaten Der Quantilsrang Berechung Häufigkeiten Kennwerte Grafische Darstellung Folie 28 Nach der Berechnung der Rangzahl rg(x) eines Merkmalsträgers ermittelt man seinen Quantilsrang p über p x 0.5 rg x n = Stichprobengröße (d.h. der maximale Rang) Problem: p reicht nicht von 0 bis 1, sondern liegt in einem etwas schmaleren Bereich, abhängig von der Größe des n. Statt der Korrekturformel gilt einfacher auch direkt p xcorr, n rg x 1 n 1

102 Ordinalskala Darstellungen Bortz, S Ordinalskala Häufigkeiten Kennwerte Grafische Darstellung Ordinaldaten Numerische Beschreibung: Extrema Extrema sind die Grenzen des beobachteten Bereichs von Messwerten Das Minimum x min ist die untere Grenze (UG) Das Maximum x max ist die obere Grenze (OG) Die Extrema können als spezielle Quantile aufgefasst werden (0. und 4. Quartil) Achtung: Die Extrema einer Messwertreihe sind nicht notwendigerweise identisch mit den Grenzen des Wertebereichs der Variablen Folie 29

103 Ordinalskala Darstellungen Ordinalskala Häufigkeiten Kennwerte Grafische Darstellung Ordinaldaten Grafische Beschreibung: Häufigkeitsverteilung Für die empirische Häufigkeitsverteilung von Ordinaldaten werden dieselben Darstellungen verwendet wie bei Nominaldaten Achtung: Die Abfolge auf der x-achse ist geordnet! Note x h(x) f(x) F(x) Folie 30

104 Ordinalskala Darstellungen Ordinalskala Häufigkeiten Kennwerte Grafische Darstellung Ordinaldaten Grafische Beschreibung: Verteilungsfunktion Die empirische Verteilungsfunktion bei k Realisationen ist j F( X x ) F( x ) f ( x ) j j c c1 mit j = 1 k Note x h(x) f(x) F(x) Zur grafischen Darstellung werden also die empirischen relativen Häufigkeiten aufsummiert Folie 31

105 Ordinalskala Ordinalskala Ordinaldaten Lagemaße veranschaulicht Darstellungen Häufigkeiten Kennwerte Grafische Darstellung Folie 32

106 Ordinalskala Ordinalskala Ordinaldaten Lagemaße veranschaulicht Darstellungen Häufigkeiten Kennwerte Grafische Darstellung Folie 33

107 Einführung Kreuztabellen Intervalldaten I Intervallskala Definition Es wird eine Einheit definiert Intervalldaten II Bortz, S Grafische Darstellung I Es existiert kein natürlicher Nullpunkt Differenzen von Werten können verglichen werden, nicht aber die Werte selbst Wird am häufigsten in empirischen Untersuchungen angenommen Intervallskalierte Variablen können diskret oder stetig sein Folie 2

108 Intervalldaten I Intervalldaten II Einführung Intervallskala Beispiel Kreuztabellen Grafische Darstellung I Attitudes Toward Housecleaning Scale von Ogletree, Worthen, Turner & Vickers (2006). Ihre Aufgabe ist es, ihre Gefühle gegenüber jeder Aussage dahingehend zu kennzeichnen, ob sie (1) stark zustimmen, (2) etwas zustimmen, (3) weder zustimmen noch ablehnen, (4) etwas ablehnen oder (5) stark ablehnen. Bitte verdeutlichen Sie Ihre Meinung dadurch, dass sie entweder 1, 2, 3, 4 oder 5 auf dem Antwortblatt schwärzen. Folie 3 Einen Stapel dreckigen Geschirrs über Nacht im Spülbecken liegen zu lassen finde ich ekelhaft. Ich finde Staubwischen entspannend. Den Müll rauszubringen macht mir Spaß Frauen sollten die primäre Verantwortung für die Hausarbeit übernehmen. Eine unordentliche Wohnung zu haben macht mir nichts

109 Intervalldaten I Intervalldaten II Einführung Intervallskala Zulässige Transformationen Kreuztabellen Grafische Darstellung I Zulässige Operationen sind Äquivalenzrelationen, d.h. Gleich und Ungleich Zudem erlaubt sind qualitative Vergleichsrelationen, d.h. Größer oder Kleiner Erlaubt sind weiterhin quantitative Vergleichsrelationen, die sich auf Differenzen beziehen Eine Aussage wie Der Unterschied zwischen A und B ist doppelt so groß wie zwischen A und C ist bei einer intervallskalierten Variable zulässig, nicht aber A ist doppelt so groß wie B. Folie 4

110 Intervalldaten I Intervalldaten II Einführung Intervallskala Zulässige Transformationen Kreuztabellen Grafische Darstellung I Zulässig sind alle linearen Transformationen (die Grundrechenarten), so dass die Verhältnisse zwischen Differenzen erhalten bleiben. Folie 5

111 Intervalldaten I Intervalldaten II Einführung Kreuztabellen Intervallskala Zulässige Transformationen Grafische Darstellung I Folie 6 Die Aussage Person E ist doppelt so gut wie Person C, ausgehend von Skala 1, gilt nicht für Skala 3 und 4.

112 Intervalldaten I Intervalldaten II Einführung Kreuztabellen Intervallskala Zulässige Transformationen Grafische Darstellung I Folie 7 Wohl aber gilt immer: Der Unterschied zwischen A und B ist doppelt so groß wie zwischen B und C

113 Intervalldaten I Intervalldaten II Einführung Intervallskala Kritische Betrachtung Kreuztabellen Grafische Darstellung I Die bekanntesten und am meisten verbreiteten statistischen Verfahren setzen eine Intervallskala voraus Der Umgang mit niedrigeren Skalenniveaus ist mathematisch oftmals weitaus komplexer Die ungeprüfte Annahme der Intervallskala in empirischen Untersuchungen ist oft problematisch Folie 8

114 Intervalldaten I Intervalldaten II Einführung Intervalldaten Numerische Beschreibung: Das Problem Häufigkeit Kreuztabellen Grafische Darstellung I Problem: Intervallskalierte Variablen können u.u. beliebige Ausprägungen besitzen, die sich nicht mehr sinnvoll in einer Tabelle darstellen lassen Beispiele: Körpergrößen, Serotoninspiegel, Reaktionszeit Lösung: Es muss eine Aggregation vieler Realisationen in wenige Kategorien (oder Klassen ) stattfinden Bei der Klassenbildung für eine Variable X findet im Prinzip nichts anderes als eine Transformation von X in eine neue Variable C statt, und zwar gemäß: C c1 : 1, wenn X { } c2 : 2, wenn X { } ck : k, wenn X { } Folie 9

115 Intervalldaten I Intervalldaten II Einführung Kreuztabellen Grafische Darstellung I Intervalldaten Numerische Beschreibung: Klassenbildung Bei der Klassen-/Kategoriebildung sind zwei Fragen zu beantworten: 1. Wie viele Klassen sollen gebildet werden? 2. Wie werden die Grenzen dieser Klassen festgelegt? Dabei kommt es entscheidend darauf an, ob die Daten diskret oder stetig sind Folie 10

116 Intervalldaten I Intervalldaten II Einführung Intervalldaten Numerische Beschreibung: Klassenbildung Kreuztabellen Grafische Darstellung I Folie 11 Zur Bestimmung der Anzahl k von Klassen gibt es verschiedene Formeln. Als Faustregeln gelten: Anzahl der Beobachtungen n 5 bis 50 5 bis 8 Klassenzahl k 50 bis bis bis bis 12 >250 8 bis 25 Eine einfache Formel, die oft zu einer sinnvollen Klassenanzahl k führt, lautet k n log2 1 mit Aufrundung Statt der Beobachtungen n wird zuweilen auch die Anzahl der Realisationen verwendet.

117 Intervalldaten I Intervalldaten II Bortz, S Einführung Intervalldaten Numerische Beschreibung: Klassenbildung Kreuztabellen Grafische Darstellung I Folie 12 Die k Messwertklassen dürfen sich nicht überschneiden, sie sind also wechselseitig ausschließend. Die untere und obere Klassengrenze UG j und OG j gehören zur Klasse c j, die obere Grenze der vorherigen Klasse OG j-1 jedoch nicht (j = 1 k) c j = [UG j OG j ] oder c j = (OG j-1 OG j ] Alle Klassen haben im Normalfall dieselbe Breite. Die Anzahl der Klassen ist zunächst frei wählbar. Es ist aber zu beachten: 1. Es sollte möglichst wenige leere Klassen geben 2. Es sollten keine in den Daten enthaltenen wichtigen Informationen herausggregiert werden (z.b. mehrere Modalwerte)

118 Intervalldaten I Intervalldaten II Einführung Intervalldaten Numerische Beschreibung: Klassenbildung Kreuztabellen Grafische Darstellung I Folie 13 Die Klassenbreite d bei einer gewünschten Anzahl von k gleich breiten Klassen wird berechnet als d max( X) min( X) k Hier ist X die ursprüngliche intervallskalierte Variable Es können die beobachteten Messwerte oder die theoretischen Realisationen von X verwendet werden Bei der Berechnung der Klassenbreite muss auf Ausreißer in der Variablen X geachtet werden, da solche die Klassenbreite erheblich verzerren können.

Forschungsstatistik I

Forschungsstatistik I Prof. Dr. G. Meinhardt 6. Stock, TB II R. 06-206 (Persike) R. 06-321 (Meinhardt) Sprechstunde jederzeit nach Vereinbarung Forschungsstatistik I Dr. Malte Persike persike@uni-mainz.de http://psymet03.sowi.uni-mainz.de/

Mehr

Mathematische und statistische Methoden I

Mathematische und statistische Methoden I Prof. Dr. G. Meinhardt 6. Stock, Wallstr. 3 (Raum 06-206) Sprechstunde jederzeit nach Vereinbarung und nach der Vorlesung. Mathematische und statistische Methoden I Dr. Malte Persike persike@uni-mainz.de

Mehr

Mathematische und statistische Methoden I

Mathematische und statistische Methoden I Prof. Dr. G. Meinhardt & Statistik Mathematische und statistische Methoden I Sprechstunde jederzeit nach Vereinbarung und nach der Vorlesung Wallstr. 3, 6. Stock, Raum 06-206 Dr. Malte Persike persike@uni-mainz.de

Mehr

Forschungsstatistik I

Forschungsstatistik I Psychologie Prof. Dr. G. Meinhardt 6. Stock, TB II R. 06-206 (Persike) R. 06-321 (Meinhardt) Sprechstunde jederzeit nach Vereinbarung Forschungsstatistik I Dr. Malte Persike persike@uni-mainz.de http://psymet03.sowi.uni-mainz.de/

Mehr

Mathematische und statistische Methoden I

Mathematische und statistische Methoden I Methodenlehre e e Prof. Dr. G. Meinhardt 6. Stock, Wallstr. 3 (Raum 06-206) Sprechstunde jederzeit nach Vereinbarung und nach der Vorlesung. Mathematische und statistische Methoden I Dr. Malte Persike

Mehr

Mathematische und statistische Methoden I

Mathematische und statistische Methoden I Prof. Dr. G. Meinhardt Statistik & Mathematische und statistische Methoden I Sprechstunde jederzeit nach Vereinbarung und nach der Vorlesung Wallstr. 3, 6. Stock, Raum 06-206 Dr. Malte Persike persike@uni-mainz.de

Mehr

Mathematische und statistische Methoden I

Mathematische und statistische Methoden I Prof. Dr. G. Meinhardt Statistik & Mathematische und statistische Methoden I Sprechstunde jederzeit nach Vereinbarung und nach der Vorlesung Wallstr. 3, 6. Stock, Raum 06-206 Dr. Malte Persike persike@uni-mainz.de

Mehr

Mathematische und statistische Methoden I

Mathematische und statistische Methoden I Prof. Dr. G. Meinhardt 6. Stock, Wallstr. 3 (Raum 06-206) Sprechstunde jederzeit nach Vereinbarung und nach der Vorlesung. Mathematische und statistische Methoden I Dr. Malte Persike persike@uni-mainz.de

Mehr

Mathematische und statistische Methoden II

Mathematische und statistische Methoden II Methodenlehre e e Prof. Dr. G. Meinhardt 6. Stock, Wallstr. 3 (Raum 06-206) Sprechstunde jederzeit nach Vereinbarung und nach der Vorlesung. Mathematische und statistische Methoden II Dr. Malte Persike

Mehr

Mathematische und statistische Methoden I

Mathematische und statistische Methoden I Prof. Dr. G. Meinhardt Methodenlehre Mathematische und statistische Methoden I Sprechstunde jederzeit nach Vereinbarung und nach der Vorlesung Wallstr. 3, 6. Stock, Raum 06-206 Dr. Malte Persike persike@uni-mainz.de

Mehr

Mathematische und statistische Methoden II

Mathematische und statistische Methoden II Sprechstunde jederzeit nach Vereinbarung und nach der Vorlesung Wallstr. 3, 6. Stock, Raum 06-206 Mathematische und statistische Methoden II Dr. Malte Persike persike@uni-mainz.de lordsofthebortz.de lordsofthebortz.de/g+

Mehr

Mathematische und statistische Methoden II

Mathematische und statistische Methoden II Methodenlehre e e Prof. Dr. G. Meinhardt 6. Stock, Wallstr. 3 (Raum 06-206) Sprechstunde jederzeit nach Vereinbarung und nach der Vorlesung. Mathematische und statistische Methoden II Dr. Malte Persike

Mehr

Forschungsstatistik I

Forschungsstatistik I Psychologie Prof. Dr. G. Meinhardt 2. Stock, Nordflügel R. 02-429 (Persike) R. 02-431 (Meinhardt) Sprechstunde jederzeit nach Vereinbarung Forschungsstatistik I Dr. Malte Persike persike@uni-mainz.de WS

Mehr

Mathematische und statistische Methoden II

Mathematische und statistische Methoden II Sprechstunde jederzeit nach Vereinbarung und nach der Vorlesung Wallstr. 3, 6. Stock, Raum 06-206 Mathematische und statistische Methoden II Dr. Malte Persike persike@uni-mainz.de lordsofthebortz.de lordsofthebortz.de/g+

Mehr

Mathematische und statistische Methoden II

Mathematische und statistische Methoden II Methodenlehre e e Prof. Dr. G. Meinhardt 6. Stock, Wallstr. 3 (Raum 06-206) Sprechstunde jederzeit nach Vereinbarung und nach der Vorlesung. Mathematische und statistische Methoden II Dr. Malte Persike

Mehr

Forschungsstatistik I

Forschungsstatistik I Psychologie Prof. Dr. G. Meinhardt 6. Stock, TB II R. 06-206 (Persike) R. 06-321 (Meinhardt) Sprechstunde jederzeit nach Vereinbarung Forschungsstatistik I Dr. Malte Persike persike@uni-mainz.de http://psymet03.sowi.uni-mainz.de/

Mehr

Primer: Wahrscheinlichkeitstheorie 1.0

Primer: Wahrscheinlichkeitstheorie 1.0 : Wahrscheinlichkeitstheorie 1.0 Dr. Malte Persike persike@uni-mainz.de methodenlehre.com twitter.com/methodenlehre methodenlehre.com/g+ iversity.org/schoolinger Inhalte der nächsten Minuten Von der Pike

Mehr

htw saar 1 EINFÜHRUNG IN DIE STATISTIK: BESCHREIBENDE STATISTIK

htw saar 1 EINFÜHRUNG IN DIE STATISTIK: BESCHREIBENDE STATISTIK htw saar 1 EINFÜHRUNG IN DIE STATISTIK: BESCHREIBENDE STATISTIK htw saar 2 Grundbegriffe htw saar 3 Grundgesamtheit und Stichprobe Ziel: Über eine Grundgesamtheit (Population) soll eine Aussage über ein

Mehr

Skalenniveaus =,!=, >, <, +, -

Skalenniveaus =,!=, >, <, +, - ZUSAMMENHANGSMAßE Skalenniveaus Nominalskala Ordinalskala Intervallskala Verhältnisskala =,!= =,!=, >, < =,!=, >, ,

Mehr

Forschungsmethoden VORLESUNG WS 2017/2018

Forschungsmethoden VORLESUNG WS 2017/2018 Forschungsmethoden VORLESUNG WS 2017/2018 SOPHIE LUKES Übersicht Letzte Sitzung: Psychologie als empirische Wissenschaft Heute: Messen Rückblick: Qualitativer vs. quantitativer Ansatz Qualitativ Quantitativ

Mehr

Bitte am PC mit Windows anmelden!

Bitte am PC mit Windows anmelden! Einführung in SPSS Plan für heute: Grundlagen/ Vorwissen für SPSS Vergleich der Übungsaufgaben Einführung in SPSS http://weknowmemes.com/generator/uploads/generated/g1374774654830726655.jpg Standardnormalverteilung

Mehr

Deskription, Statistische Testverfahren und Regression. Seminar: Planung und Auswertung klinischer und experimenteller Studien

Deskription, Statistische Testverfahren und Regression. Seminar: Planung und Auswertung klinischer und experimenteller Studien Deskription, Statistische Testverfahren und Regression Seminar: Planung und Auswertung klinischer und experimenteller Studien Deskriptive Statistik Deskriptive Statistik: beschreibende Statistik, empirische

Mehr

3. Merkmale und Daten

3. Merkmale und Daten 3. Merkmale und Daten Ziel dieses Kapitels: Vermittlung des statistischen Grundvokabulars Zu klärende Begriffe: Grundgesamtheit Merkmale (Skalenniveau etc.) Stichprobe 46 3.1 Grundgesamtheiten Definition

Mehr

Forschungsmethoden VORLESUNG SS 2017

Forschungsmethoden VORLESUNG SS 2017 Forschungsmethoden VORLESUNG SS 2017 SOPHIE LUKES Übersicht Letzte Sitzung: Psychologie als empirische Wissenschaft Heute: Messen Rückblick: Qualitativer vs. quantitativer Ansatz Qualitativ Quantitativ

Mehr

Wiederholung Statistik I. Statistik für SozialwissenschaftlerInnen II p.8

Wiederholung Statistik I. Statistik für SozialwissenschaftlerInnen II p.8 Wiederholung Statistik I Statistik für SozialwissenschaftlerInnen II p.8 Konstanten und Variablen Konstante: Merkmal hat nur eine Ausprägung Variable: Merkmal kann mehrere Ausprägungen annehmen Statistik

Mehr

1.1 Graphische Darstellung von Messdaten und unterschiedliche Mittelwerte. D. Horstmann: Oktober

1.1 Graphische Darstellung von Messdaten und unterschiedliche Mittelwerte. D. Horstmann: Oktober 1.1 Graphische Darstellung von Messdaten und unterschiedliche Mittelwerte D. Horstmann: Oktober 2014 4 Graphische Darstellung von Daten und unterschiedliche Mittelwerte Eine Umfrage nach der Körpergröße

Mehr

Mathematische und statistische Methoden II

Mathematische und statistische Methoden II Prof. Dr. G. Meinhardt 6. Stock, Wallstr. 3 (Raum 06-206) Sprechstunde jederzeit nach Vereinbarung und nach der Vorlesung. Mathematische und statistische Methoden II Dr. Malte Persike persike@uni-mainz.de

Mehr

Forschungsstatistik I

Forschungsstatistik I Prof. Dr. G. Meinhardt 2. Stock, Nordflügel R. 02-429 (Persike) R. 02-43 (Meinhardt) Sprechstunde jederzeit nach Vereinbarung Forschungsstatistik I Dr. Malte Persike persike@uni-mainz.de http://psymet03.sowi.uni-mainz.de/

Mehr

Statistik und Wahrscheinlichkeitsrechnung

Statistik und Wahrscheinlichkeitsrechnung Statistik und Wahrscheinlichkeitsrechnung 3. Vorlesung Dr. Jochen Köhler 1 Inhalte der heutigen Vorlesung Ziel: Daten Modellbildung Probabilistisches Modell Wahrscheinlichkeit von Ereignissen Im ersten

Mehr

Forschungsmethoden in der Sozialen Arbeit

Forschungsmethoden in der Sozialen Arbeit Forschungsmethoden in der Sozialen Arbeit Fachhochschule für Sozialarbeit und Sozialpädagogik Alice- Salomon Hochschule für Soziale arbeit, Gesundheit, Erziehung und Bildung University of Applied Sciences

Mehr

fh management, communication & it Constantin von Craushaar fh-management, communication & it Statistik Angewandte Statistik

fh management, communication & it Constantin von Craushaar fh-management, communication & it Statistik Angewandte Statistik fh management, communication & it Folie 1 Überblick Grundlagen (Testvoraussetzungen) Mittelwertvergleiche (t-test,..) Nichtparametrische Tests Korrelationen Regressionsanalyse... Folie 2 Überblick... Varianzanalyse

Mehr

Deskriptivstatistik a) Univariate Statistik Weiters zum Thema der statistischen Informationsverdichtung

Deskriptivstatistik a) Univariate Statistik Weiters zum Thema der statistischen Informationsverdichtung 20 Weiters zum Thema der statistischen Informationsverdichtung M a ß z a h l e n Statistiken bei Stichproben Parameter bei Grundgesamtheiten Maßzahlen zur Beschreibung univariater Verteilungen Maßzahlen

Mehr

Statistikpraktikum. Carsten Rezny. Sommersemester Institut für angewandte Mathematik Universität Bonn

Statistikpraktikum. Carsten Rezny. Sommersemester Institut für angewandte Mathematik Universität Bonn Statistikpraktikum Carsten Rezny Institut für angewandte Mathematik Universität Bonn Sommersemester 2016 Anmeldung in Basis: 06. 10.06.2016 Organisatorisches Einführung Statistik Analyse empirischer Daten

Mehr

Standardisierte Vorgehensweisen und Regeln zur Gewährleistung von: Eindeutigkeit Schlussfolgerungen aus empirischen Befunden sind nur dann zwingend

Standardisierte Vorgehensweisen und Regeln zur Gewährleistung von: Eindeutigkeit Schlussfolgerungen aus empirischen Befunden sind nur dann zwingend Standardisierte Vorgehensweisen und Regeln zur Gewährleistung von: Eindeutigkeit Schlussfolgerungen aus empirischen Befunden sind nur dann zwingend oder eindeutig, wenn keine alternativen Interpretationsmöglichkeiten

Mehr

Anteile Häufigkeiten Verteilungen Lagemaße Streuungsmaße Merkmale von Verteilungen. Anteile Häufigkeiten Verteilungen

Anteile Häufigkeiten Verteilungen Lagemaße Streuungsmaße Merkmale von Verteilungen. Anteile Häufigkeiten Verteilungen DAS THEMA: VERTEILUNGEN LAGEMAßE - STREUUUNGSMAßE Anteile Häufigkeiten Verteilungen Lagemaße Streuungsmaße Merkmale von Verteilungen Anteile Häufigkeiten Verteilungen Anteile und Häufigkeiten Darstellung

Mehr

Forschungsstatistik I

Forschungsstatistik I Prof. Dr. G. Meinhardt 6. Stock, Taubertsberg 2 R. 06-206 (Persike) R. 06-214 (Meinhardt) Sprechstunde jederzeit nach Vereinbarung Forschungsstatistik I Dr. Malte Persike persike@uni-mainz.de http://psymet03.sowi.uni-mainz.de/

Mehr

Kreisdiagramm, Tortendiagramm

Kreisdiagramm, Tortendiagramm Kreisdiagramm, Tortendiagramm Darstellung der relativen (absoluten) Häufigkeiten als Fläche eines Kreises Anwendung: Nominale Merkmale Ordinale Merkmale (Problem: Ordnung nicht korrekt wiedergegeben) Gruppierte

Mehr

1 x 1 y 1 2 x 2 y 2 3 x 3 y 3... n x n y n

1 x 1 y 1 2 x 2 y 2 3 x 3 y 3... n x n y n 3.2. Bivariate Verteilungen zwei Variablen X, Y werden gemeinsam betrachtet (an jedem Objekt werden gleichzeitig zwei Merkmale beobachtet) Beobachtungswerte sind Paare von Merkmalsausprägungen (x, y) Beispiele:

Mehr

Statistikpraktikum. Carsten Rezny. Sommersemester Institut für angewandte Mathematik Universität Bonn

Statistikpraktikum. Carsten Rezny. Sommersemester Institut für angewandte Mathematik Universität Bonn Statistikpraktikum Carsten Rezny Institut für angewandte Mathematik Universität Bonn Sommersemester 2017 Organisatorisches Anmeldung in Basis: 19. 23.06.2017 Skript und Übungsaufgaben unter: http://www.iam.uni-bonn.de/users/rezny/statistikpraktikum

Mehr

Variablen und Skalenniveaus

Variablen und Skalenniveaus Analytics Grundlagen Variablen und Skalenniveaus : Photo Credit: Unsplash, Roman Mager Statistik Was ist eigentlich eine Variable? Variable In der Datenanalyse wird häufig die Bezeichnung Variable verwendet.

Mehr

Empirische Verteilungsfunktion

Empirische Verteilungsfunktion Empirische Verteilungsfunktion H(x) := Anzahl der Werte x ist. Deskriptive

Mehr

Angewandte Statistik 3. Semester

Angewandte Statistik 3. Semester Angewandte Statistik 3. Semester Übung 5 Grundlagen der Statistik Übersicht Semester 1 Einführung ins SPSS Auswertung im SPSS anhand eines Beispieles Häufigkeitsauswertungen Grafiken Statistische Grundlagen

Mehr

1. Tutorial. Online-Tutorium-Statistik von T.B.

1. Tutorial. Online-Tutorium-Statistik von T.B. Online-Tutorium-Statistik von T.B. 1 Grundbegriffe I Gegenstand einer statistischen Untersuchung sind bestimmte Objekte (z.b. Personen, Unternehmen) bei denen man sich für gewisse Eigenschaften (z.b. Geschlecht,

Mehr

Inhaltsverzeichnis. 1 Über dieses Buch Zum Inhalt dieses Buches Danksagung Zur Relevanz der Statistik...

Inhaltsverzeichnis. 1 Über dieses Buch Zum Inhalt dieses Buches Danksagung Zur Relevanz der Statistik... Inhaltsverzeichnis 1 Über dieses Buch... 11 1.1 Zum Inhalt dieses Buches... 13 1.2 Danksagung... 15 2 Zur Relevanz der Statistik... 17 2.1 Beispiel 1: Die Wahrscheinlichkeit, krank zu sein, bei einer positiven

Mehr

Kapitel 2. Häufigkeitsverteilungen

Kapitel 2. Häufigkeitsverteilungen 6 Kapitel 2 Häufigkeitsverteilungen Ziel: Darstellung bzw Beschreibung (Exploration) einer Variablen Ausgangssituation: An n Einheiten ω,, ω n sei das Merkmal X beobachtet worden x = X(ω ),, x n = X(ω

Mehr

Statistiktutorium (Kurs Frau Jacobsen)

Statistiktutorium (Kurs Frau Jacobsen) Statistiktutorium (Kurs Frau Jacobsen) von Timo Beddig Einführungsveranstaltung am 16.4.2012 1 Grundbegriffe I Gegenstand einer statistischen Untersuchung sind bestimmte Objekte (z.b. Personen, Unternehmen)

Mehr

W-Seminar: Versuche mit und am Menschen 2017/2019 Skript

W-Seminar: Versuche mit und am Menschen 2017/2019 Skript 3. Deskriptive Statistik Die deskriptive (auch: beschreibende) Statistik hat zum Ziel, [ ] Daten durch Tabellen, Kennzahlen [ ] und Grafiken übersichtlich darzustellen und zu ordnen. Dies ist vor allem

Mehr

Mathematische und statistische Methoden II

Mathematische und statistische Methoden II Sprechstunde jederzeit nach Vereinbarung und nach der Vorlesung Wallstr. 3, 6. Stock, Raum 06-206 Mathematische und statistische Methoden II Dr. Malte Persike persike@uni-mainz.de lordsofthebortz.de lordsofthebortz.de/g+

Mehr

Beispiel für Anwendung: z-tabelle kann genutzt werden, um z.b. Poissonverteilung näherungsweise zu integrieren. Beispiel: wie wahrscheinlich ist es

Beispiel für Anwendung: z-tabelle kann genutzt werden, um z.b. Poissonverteilung näherungsweise zu integrieren. Beispiel: wie wahrscheinlich ist es Beispiel für Anwendung: z-tabelle kann genutzt werden, um z.b. Poissonverteilung näherungsweise zu integrieren. Beispiel: wie wahrscheinlich ist es beim radioaktiven Zerfall, zwischen 100 und 110 Zerfälle

Mehr

Daten, Datentypen, Skalen

Daten, Datentypen, Skalen Bildung kommt von Bildschirm und nicht von Buch, sonst hieße es ja Buchung. Daten, Datentypen, Skalen [main types of data; levels of measurement] Die Umsetzung sozialwissenschaftlicher Forschungsvorhaben

Mehr

3 Lage- und Streuungsmaße

3 Lage- und Streuungsmaße 3 Lage- und Streuungsmaße Grafische Darstellungen geben einen allgemeinen Eindruck der Verteilung eines Merkmals, u.a. von Lage und Zentrum der Daten, Streuung der Daten um dieses Zentrum, Schiefe / Symmetrie

Mehr

WISTA WIRTSCHAFTSSTATISTIK

WISTA WIRTSCHAFTSSTATISTIK WISTA WIRTSCHAFTSSTATISTIK PROF DR ROLF HÜPEN FAKULTÄT FÜR WIRTSCHAFTSWISSENSCHAFT Seminar für Theoretische Wirtschaftslehre Vorlesungsprogramm 23042013 Datenlagen und Darstellung eindimensionaler Häufigkeitsverteilungen

Mehr

Forschungsmethoden VORLESUNG SS 2018

Forschungsmethoden VORLESUNG SS 2018 Forschungsmethoden VORLESUNG SS 2018 SOPHIE LUKES Übersicht Letzte Sitzung: Psychologie als empirische Wissenschaft Heute: Nachtrag Messen Forschungsethik Freiwilligkeit, Aufklärung nicht möglich/nötig,

Mehr

Parametrische vs. Non-Parametrische Testverfahren

Parametrische vs. Non-Parametrische Testverfahren Parametrische vs. Non-Parametrische Testverfahren Parametrische Verfahren haben die Besonderheit, dass sie auf Annahmen zur Verteilung der Messwerte in der Population beruhen: die Messwerte sollten einer

Mehr

Fachrechnen für Tierpfleger

Fachrechnen für Tierpfleger Z.B.: Fachrechnen für Tierpfleger A10. Statistik 10.1 Allgemeines Was ist Statistik? 1. Daten sammeln: Durch Umfragen, Zählung, Messung,... 2. Daten präsentieren: Tabellen, Grafiken 3. Daten beschreiben/charakterisieren:

Mehr

Statistische Grundlagen I

Statistische Grundlagen I Statistische Grundlagen I Arten der Statistik Zusammenfassung und Darstellung von Daten Beschäftigt sich mit der Untersuchung u. Beschreibung von Gesamtheiten oder Teilmengen von Gesamtheiten durch z.b.

Mehr

Einführung in Quantitative Methoden

Einführung in Quantitative Methoden Einführung in Quantitative Methoden Mag. Dipl.Ing. Dr. Pantelis Christodoulides & Mag. Dr. Karin Waldherr SS 2014 Christodoulides / Waldherr Einführung in Quantitative Methoden- 2.VO 1/57 Die Deskriptivstatistik

Mehr

Grundbegriffe. Bibliografie

Grundbegriffe. Bibliografie Grundbegriffe Merkmale und Merkmalsausprägungen Skalen und Skalentransformation Einführung und Grundbegriffe II 1 Bibliografie Bleymüller / Gehlert / Gülicher Verlag Vahlen Statistik für Wirtschaftswissenschaftler

Mehr

Einführung in Quantitative Methoden

Einführung in Quantitative Methoden Einführung in Quantitative Methoden Mag. Dipl.Ing. Dr. Pantelis Christodoulides & Mag. Dr. Karin Waldherr SS 2011 Christodoulides / Waldherr Einführung in Quantitative Methoden- 2.VO 1/62 Summenzeichen

Mehr

Mathematische und statistische Methoden II

Mathematische und statistische Methoden II Sprechstunde jederzeit nach Vereinbarung und nach der Vorlesung Wallstr. 3, 6. Stock, Raum 06-206 Mathematische und statistische Methoden II Dr. Malte Persike persike@uni-mainz.de lordsofthebortz.de lordsofthebortz.de/g+

Mehr

Einführung in die Statistik

Einführung in die Statistik Einführung in die Statistik 1. Deskriptive Statistik 2. Induktive Statistik 1. Deskriptive Statistik 1.0 Grundbegriffe 1.1 Skalenniveaus 1.2 Empirische Verteilungen 1.3 Mittelwerte 1.4 Streuungsmaße 1.0

Mehr

5 Assoziationsmessung in Kontingenztafeln

5 Assoziationsmessung in Kontingenztafeln 5 Assoziationsmessung in Kontingenztafeln 51 Multivariate Merkmale 51 Multivariate Merkmale Gerade in der Soziologie ist die Analyse eindimensionaler Merkmale nur der allererste Schritt zur Beschreibung

Mehr

TEIL 7: EINFÜHRUNG UNIVARIATE ANALYSE TABELLARISCHE DARSTELLUNG / AUSWERTUNG

TEIL 7: EINFÜHRUNG UNIVARIATE ANALYSE TABELLARISCHE DARSTELLUNG / AUSWERTUNG TEIL 7: EINFÜHRUNG UNIVARIATE ANALYSE TABELLARISCHE DARSTELLUNG / AUSWERTUNG GLIEDERUNG Statistik eine Umschreibung Gliederung der Statistik in zwei zentrale Teilbereiche Deskriptive Statistik Inferenzstatistik

Mehr

Statistik und Wahrscheinlichkeitsrechnung

Statistik und Wahrscheinlichkeitsrechnung Statistik und Wahrscheinlichkeitsrechnung Dr. Jochen Köhler 26.02.2008 1 Warum Statistik und Wahrscheinlichkeits rechnung im Ingenieurwesen? Zusammenfassung der letzten Vorlesung Statistik und Wahrscheinlichkeitsrechnung

Mehr

Mathematische und statistische Methoden II

Mathematische und statistische Methoden II Prof. Dr. G. Meinhardt 6. Stock, Wallstr. 3 (Raum 06-206) Sprechstunde jederzeit nach Vereinbarung und nach der Vorlesung. Mathematische und statistische Methoden II Dr. Malte Persike persike@uni-mainz.de

Mehr

Statistik II: Grundlagen und Definitionen der Statistik

Statistik II: Grundlagen und Definitionen der Statistik Medien Institut : Grundlagen und Definitionen der Statistik Dr. Andreas Vlašić Medien Institut (0621) 52 67 44 vlasic@medien-institut.de Gliederung 1. Hintergrund: Entstehung der Statistik 2. Grundlagen

Mehr

P (X = 2) = 1/36, P (X = 3) = 2/36,...

P (X = 2) = 1/36, P (X = 3) = 2/36,... 2.3 Zufallsvariablen 2.3 Zufallsvariablen Meist sind die Ereignisse eines Zufallseperiments bereits reelle Zahlen. Ist dies nicht der Fall, kann man Ereignissen eine reelle Zahl zuordnen. Zum Beispiel

Mehr

Graphische Darstellung einer univariaten Verteilung:

Graphische Darstellung einer univariaten Verteilung: Graphische Darstellung einer univariaten Verteilung: Die graphische Darstellung einer univariaten Verteilung hängt von dem Messniveau der Variablen ab. Bei einer graphischen Darstellung wird die Häufigkeit

Mehr

absolute Häufigkeit h: Anzahl einer bestimmten Note relative Häufigkeit r: Anzahl einer bestimmten Note, gemessen an der Gesamtzahl der Noten

absolute Häufigkeit h: Anzahl einer bestimmten Note relative Häufigkeit r: Anzahl einer bestimmten Note, gemessen an der Gesamtzahl der Noten Statistik Eine Aufgabe der Statistik ist es, Datenmengen zusammenzufassen und darzustellen. Man verwendet dazu bestimmte Kennzahlen und wertet Stichproben aus, um zu Aussagen bzw. Prognosen über die Gesamtheit

Mehr

Alle weiteren Messoperationen schließen die Klassifikation als Minimaloperation ein.

Alle weiteren Messoperationen schließen die Klassifikation als Minimaloperation ein. 1 unterschiedliche Skalenniveaus Wir haben zuvor schon kurz von unterschiedlichen Skalenniveaus gehört, nämlich dem: - Nominalskalenniveau - Ordinalskalenniveau - Intervallskalenniveau - Ratioskalenniveau

Mehr

Lage- und Streuungsparameter

Lage- und Streuungsparameter Lage- und Streuungsparameter Beziehen sich auf die Verteilung der Ausprägungen von intervall- und ratio-skalierten Variablen Versuchen, diese Verteilung durch Zahlen zu beschreiben, statt sie graphisch

Mehr

Institut für Biometrie und klinische Forschung. WiSe 2012/2013

Institut für Biometrie und klinische Forschung. WiSe 2012/2013 Klinische Forschung WWU Münster Pflichtvorlesung zum Querschnittsfach Epidemiologie, Biometrie und Med. Informatik Praktikum der Medizinischen Biometrie () Überblick. Deskriptive Statistik I - Grundlegende

Mehr

Univariate Häufigkeitsverteilungen Kühnel, Krebs 2001: Statistik für die Sozialwissenschaften, S.41-66

Univariate Häufigkeitsverteilungen Kühnel, Krebs 2001: Statistik für die Sozialwissenschaften, S.41-66 Univariate Häufigkeitsverteilungen Kühnel, Krebs 2001: Statistik für die Sozialwissenschaften, S.41-66 Gabriele Doblhammer: Empirische Sozialforschung Teil II, SS 2004 1/19 Skalenniveaus Skalenniveau Relation

Mehr

Lösungen zur Klausur zur Statistik Übung am

Lösungen zur Klausur zur Statistik Übung am Lösungen zur Klausur zur Statistik Übung am 28.06.2013 Fabian Kleine Staatswissenschaftliche Fakultät Aufgabe 1 Gegeben sei die folgende geordneten Urliste des Merkmals Y. 30 Punkte Y : 5 5 5 5 10 10 10

Mehr

0 Einführung: Was ist Statistik

0 Einführung: Was ist Statistik 0 Einführung: Was ist Statistik 1 Datenerhebung und Messung 2 Univariate deskriptive Statistik Häufigkeitsverteilungen Statistische Kennwerte 3 Multivariate Statistik 4 Regression 5 Ergänzungen Deskriptive

Mehr

Statistik K urs SS 2004

Statistik K urs SS 2004 Statistik K urs SS 2004 3.Tag Grundlegende statistische Maße Mittelwert (mean) Durchschnitt aller Werte Varianz (variance) s 2 Durchschnittliche quadrierte Abweichung aller Werte vom Mittelwert >> Die

Mehr

Vorlesung Gesamtbanksteuerung Mathematische Grundlagen II Dr. Klaus Lukas Carsten Neundorf. Vorlesung 04 Mathematische Grundlagen II,

Vorlesung Gesamtbanksteuerung Mathematische Grundlagen II Dr. Klaus Lukas Carsten Neundorf. Vorlesung 04 Mathematische Grundlagen II, Vorlesung Gesamtbanksteuerung Mathematische Grundlagen II Dr. Klaus Lukas Carsten Neundorf 1 Was sollen Sie heute lernen? 2 Agenda Wiederholung stetige Renditen deskriptive Statistik Verteilungsparameter

Mehr

3 Häufigkeitsverteilungen

3 Häufigkeitsverteilungen 3 Häufigkeitsverteilungen 3.1 Absolute und relative Häufigkeiten 3.2 Klassierung von Daten 3.3 Verteilungsverläufe 3.1 Absolute und relative Häufigkeiten Datenaggregation: Bildung von Häufigkeiten X nominal

Mehr

Die folgende Tabelle 1 wurde im Rahmen einer Umfrage unter den Studenten eines Statistikseminars erstellt.

Die folgende Tabelle 1 wurde im Rahmen einer Umfrage unter den Studenten eines Statistikseminars erstellt. Nr. Die folgende Tabelle wurde im Rahmen einer Umfrage unter den Studenten eines Statistikseminars erstellt. Gewicht (x i ) Raucher Geschlecht Lieblingssportart Ausübung des Sports Geld pro Monat Klassenmitte

Mehr

Was sind Zusammenhangsmaße?

Was sind Zusammenhangsmaße? Was sind Zusammenhangsmaße? Zusammenhangsmaße beschreiben einen Zusammenhang zwischen zwei Variablen Beispiele für Zusammenhänge: Arbeiter wählen häufiger die SPD als andere Gruppen Hochgebildete vertreten

Mehr

Statistik und Wahrscheinlichkeitsrechnung

Statistik und Wahrscheinlichkeitsrechnung Statistik und Wahrscheinlichkeitsrechnung Übung 3 1 Inhalt der heutigen Übung Vorrechnen der Hausübung B.7 Beschreibende Statistik Gemeinsames Lösen der Übungsaufgaben C.1: Häufigkeitsverteilung C.2: Tukey

Mehr

Diskrete Zufallsvariablen (Forts.) I

Diskrete Zufallsvariablen (Forts.) I 9 Eindimensionale Zufallsvariablen Diskrete Zufallsvariablen 9.4 Diskrete Zufallsvariablen (Forts.) I T (X ) ist endlich oder abzählbar unendlich, die Elemente von T (X ) werden daher im Folgenden häufig

Mehr

Diskrete Zufallsvariablen (Forts.) I

Diskrete Zufallsvariablen (Forts.) I 9 Eindimensionale Zufallsvariablen Diskrete Zufallsvariablen 9.4 Diskrete Zufallsvariablen (Forts.) I T (X ) ist endlich oder abzählbar unendlich, die Elemente von T (X ) werden daher im Folgenden häufig

Mehr

Statistik I für Betriebswirte Vorlesung 9

Statistik I für Betriebswirte Vorlesung 9 Statistik I für Betriebswirte Vorlesung 9 Dr. Andreas Wünsche TU Bergakademie Freiberg Institut für Stochastik Vorlesung am 8. Juni 2017 im Audi-Max (AUD-1001) Dr. Andreas Wünsche Statistik I für Betriebswirte

Mehr

Forschungsstatistik II

Forschungsstatistik II Prof. Dr. G. Meinhardt 6. Stock, Taubertsberg R. 06-06 (Persike) R. 06-3 (Meinhardt) Sprechstunde jederzeit nach Vereinbarung Forschungsstatistik II Dr. Malte Persike persike@uni-mainz.de http://psymet03.sowi.uni-mainz.de/

Mehr

Häufigkeitsverteilungen und Statistische Maßzahlen. Häufigkeitsverteilungen und Statistische Maßzahlen. Variablentypen. Stichprobe und Grundgesamtheit

Häufigkeitsverteilungen und Statistische Maßzahlen. Häufigkeitsverteilungen und Statistische Maßzahlen. Variablentypen. Stichprobe und Grundgesamtheit TECHNISCHE UNIVERSITÄT MÜNCHEN-WEIHENSTEPHAN MATHEMATIK UND STATISTIK INFORMATIONS- UND DOKUMENTATIONSZENTRUM R. Häufigkeitsverteilungen und Statistische Maßzahlen Statistik SS Variablentypen Qualitative

Mehr

Deskriptive Statistik Erläuterungen

Deskriptive Statistik Erläuterungen Grundlagen der Wirtschaftsmathematik und Statistik Erläuterungen Lernmaterial zum Modul - 40601 - der Fernuniversität Hagen 7 2.1 Einfache Lageparameter aus einer gegebenen Messreihe ablesen Erklärung

Mehr

Inhaltsverzeichnis (Ausschnitt)

Inhaltsverzeichnis (Ausschnitt) 4 Zweidimensionale Daten Inhaltsverzeichnis (Ausschnitt) 4 Zweidimensionale Daten Häufigkeitsverteilungen unklassierter Daten Häufigkeitsverteilungen klassierter Daten Bedingte Häufigkeitsverteilungen

Mehr

Forschungsstatistik I

Forschungsstatistik I Psychologie Prof. Dr. G. Meinhardt 6. Stock, TB II R. 06-206 (Persike) R. 06-321 (Meinhardt) Sprechstunde jederzeit nach Vereinbarung Forschungsstatistik I Dr. Malte Persike persike@uni-mainz.de http://psymet03.sowi.uni-mainz.de/

Mehr

Voraussetzung für statistische Auswertung: jeder Fall besitzt in bezug auf jedes Merkmal genau eine Ausprägung

Voraussetzung für statistische Auswertung: jeder Fall besitzt in bezug auf jedes Merkmal genau eine Ausprägung Rohdaten Urliste oder Rohdaten sind die auszuwertenden Daten in der Form, wie sie nach der Datenerhebung vorliegen. Dimensionen der Urliste sind die Fälle, Merkmale und ihre Ausprägungen. Voraussetzung

Mehr

Quantitative Methoden der Agrarmarktanalyse und des Agribusiness

Quantitative Methoden der Agrarmarktanalyse und des Agribusiness Quantitative Methoden der Agrarmarktanalyse und des Agribusiness Teil Quantitative Methoden der Agrarmarktanalyse Vorlesung: Montag und Mittwoch 8:30-10:00 Dr. Bernhard Brümmer Tel.: 0431-880-4449, Fax:

Mehr

Mathematische und statistische Methoden II

Mathematische und statistische Methoden II Prof. Dr. G. Meinhardt 6. Stock, Wallstr. 3 (Raum 06-206) Sprechstunde jederzeit nach Vereinbarung und nach der Vorlesung. Mathematische und statistische Methoden II Dr. Malte Persike persike@uni-mainz.de

Mehr

Serie 1 Serie 2 Serie 3 Serie 4 Serie 5 Serie 6. Statistik-Tutorium. Lösungsskizzen Übung SS2005. Thilo Klein. Grundstudium Sommersemester 2008

Serie 1 Serie 2 Serie 3 Serie 4 Serie 5 Serie 6. Statistik-Tutorium. Lösungsskizzen Übung SS2005. Thilo Klein. Grundstudium Sommersemester 2008 Serie 1 Serie 2 Serie 3 Serie 4 Serie 5 Serie 6 Lösungsskizzen Übung SS2005 Grundstudium Sommersemester 2008 Serie 1 Serie 2 Serie 3 Serie 4 Serie 5 Serie 6 Inhalt Serie 1 Serie 2 Serie 3 Serie 4 Serie

Mehr

Weitere Lagemaße: Quantile/Perzentile I

Weitere Lagemaße: Quantile/Perzentile I 3 Auswertung von eindimensionalen Daten Lagemaße 3.3 Weitere Lagemaße: Quantile/Perzentile I Für jeden Median x med gilt: Mindestens 50% der Merkmalswerte sind kleiner gleich x med und ebenso mindestens

Mehr

Maße der zentralen Tendenz

Maße der zentralen Tendenz UStatistische Kennwerte Sagen uns tabellarische und graphische Darstellungen etwas über die Verteilung der einzelnen Werte einer Stichprobe, so handelt es sich bei statistischen Kennwerten um eine Kennzahl,

Mehr

Mathematische Statistik. Zur Notation

Mathematische Statistik. Zur Notation Mathematische Statistik dient dazu, anhand von Stichproben Informationen zu gewinnen. Während die Wahrscheinlichkeitsrechnung Prognosen über das Eintreten zufälliger (zukünftiger) Ereignisse macht, werden

Mehr