Statistik I im Sommersemester 2006

Größe: px
Ab Seite anzeigen:

Download "Statistik I im Sommersemester 2006"

Transkript

1 Statistik I im Sommersemester 2006 Themen am : Univariate Häufigkeitsverteilungen I Darstellung univariater Verteilungen in Häufigkeitstabellen Verteilungsfunktionen und Quantile Grafische Darstellungen metrischer Verteilungen Lernziele: 1. Aufbau und Interpretation von Häufigkeitstabellen 2. Bedeutung und Berechnung von Quantilen aus Rohdaten und gruppierten und ungruppierten Häufigkeitstabellen 3. Stabbiagramme, Histogramme und Dichtedarstellungen 4. Formen von Verteilungen

2 Wiederholung der wichtigsten Inhalte der letzten Sitzung Gegenstand der Statistk: Mathematische Modellierung von Verteilungen Univariate Verteilungen Deskriptive Statistik Verteilungsparameter (Quantile, Lagemaße, Streuungsmaße) Induktive Statistik / Inferenzstatistik Wahrscheinlichkeitstheorie, Schätzen und Testen Bivariate Verteilungen Multivariate Verteilungen Beschreibung und Prüfung von bivariaten Zuammenhängen Drittvariablenkontrolle Konditionale u. Partielle Effekte Prüfung der Angemessenheit statistischer Modelle Vorlesung Statistik I 2

3 Wiederholung: Warum Statistik? Zur Klärung von empirischen Fragen, Formulierung und Prüfung von Vermutungen benötigen die Sozialwissenschaften empirische Daten. Bei der Analyse der Daten besteht Gefahr von Fehlinterpretationen. Fehlerquellen: - ungenügendes inhaltliches Vorwissen über Forschungsgebiet, - ungenügende Kenntnisse über statistische Datenanalyse. Ziel der Statistikausbildung: Gewinnung von Kenntnissen über statistische Datenanalyse, + um Aussagekraft von empirischen Studien zu beurteilen, + um bei eigenen Analysen aussagekräftige Ergebnisse zu erhalten Vorlesung Statistik I 3

4 Wiederholung: Methoden-Modul 2. Grundlagen sozialwissenschaftlicher Datenanalyse MM2 beinhaltet 2 Veranstaltungen: Workload = 8 Credits a 30 Stunden 1.Vorlesung Statistik I dazu Tutorien zur Vorlesung 2. Übung zu Statistik I A. Statistik mit Excel oder B. Statistik mit SPSS oder C. Statistik mit STATA Abschlussklausur Teil A (90 Minuten) ( 90 Minuten Stoffvermittlung, Fragen, Beispielaufgaben) (90 Minuten Diskussion offener Fragen, Lösung der Übungsaufgaben, bei Bedarf Auffrischung von Mathe-Kenntnissen) Abschlussklausur Teil B (90 Minuten) A. und B. Vermittlung/Vorführung (45 Minuten Vorlesung) + praktische Übung (45 Minuten Tutorium) C. Vermittlung u. Übung (90 Minuten) ohne Tutorium Vorlesung Statistik I 4

5 Wiederholung: Operationalisierung Benennung von Korrespondenzregeln, mit deren Hilfe das Ausmaß des Vorliegens eines durch einen Begriff bezeichneten Sachverhalts festgestellt wird Über Operationalisierung erfolgt also Verbindung zwischen Begriffen und empirisch beobachtbaren Sachverhalten. Forschungsfrage mit Begriffen, die empirische Sachverhalte beinhalten Explikation der Begriffe Formulierung einer Messtheorie mit Korrepondenzhypothesen Formulierung von Korrespondenzregeln Variablen, Ausprägungen und Realisierungen Variable (z.b. Geschlecht ) hat Menge möglicher Ausprägungen (z.b.: {männlich, weiblich] bezieht sich auf Konkretisierung Fälle (z.b. Personen) Element aus der Menge aller Fälle Realisierung bei einem Fall (z.b. Herr X ist männlich) Vorlesung Statistik I 5

6 Wiederholung: Beobachten und Messen (1) Messen im weiteren Sinne bezieht sich auf den Akt der Datenerhebung. In der Sozialforschung spricht man auch von Beobachtung. (2) Messen im engeren Sinne bezieht sich auf die Zuordnung von Zahlen zu den bereits beobachteten empirischen Eigenschaften eines Objekts Messen im engeren Sinne wird technisch auch als Kodierung bezeichnet. Messen in der axiomatischen Messtheorie: Messen ist eine homomorphe Abbildung eines empirischen Relativs in ein numerisches Relativ Interpretierbare Relationen Identität Ränge Abstände Quotienten Nominalskala ja nein nein nein Ordinalskala ja ja nein nein Intervallskala ja ja ja nein Ratioskala ja ja ja ja Intervall- und Ratioskalen werden auch als metrische Skalen bezeichnet. Vorlesung Statistik I 6

7 Wiederholung: Messniveau: Zulässige Transformationen Skalen- Zulässige Transformationen Beispiele für erlaubte mathematische niveau Operationen Nominal Alle ein-eindeutigen Transfor- Logarithmieren, Multiplikation, mationen Addition (Subtraktion) einer Konstanten Ordninal Alle positiv-monotonen, die Wenn Ausgangswerte > 0: Rangordnung wahrenden Trans- Quadrieren, Logarithmieren, Wurzelformationen ziehen Intervall Alle positiven linearen Trans- Y = a + b X mit b> 0 formationen Ratio Streckungen und Stauchungen Y = b X mit b> 0 Die axiomatischen Messtheorie nennt als Voraussetzungen Repräsentation, Eindeutigkeit und Bedeutsamkeit, die zur Erreichung eines bestimmten Messniveaus nachgewiesen werden müssen. Vorlesung Statistik I 7

8 Wiederholung: Datenmatrix Untersuchungseinheiten (Fälle) Fall - nummer Merkmale der Untersuchungseinheiten (Variablen) Antwort Frage 1 Antwort Frage 2a Antwort Frage 2b Geschlecht Geburtsjahr ID F1 F2A F2B F3 F In einer Datenmatrix sind die Informationen i.a. so angeordnet, dass jede Zeile die gesamten verfügbaren Informationen (Realisierungen aller Variablen) bei einem Fall enthält, und dass jede Spalte alle Realisierungen einer Variablen über alle Fälle enthält. Vorlesung Statistik I 8

9 Datenmatrix: Kodierkonventionen für ungültige Fälle Bei empirischen Datenanalysen muss für jeden Fall und jede Variable eine Realisierung vorliegen. Wenn z.b. aufgrund von Antwortverweigerungen keine Antworten in einer vorgegebenen Antwortskala vorliegen, werden spezielle Ausprägungen, die sogenannten ungültigen oder fehlende Werte (missing values) verwendet. Dabei haben sich Konventionen eingespielt, die möglichst eingehalten werden sollten: einstellige zweistellige dreistellige Endziffer Variablen Variablen Variablen Verweigerung weiß nicht keine Angabe trifft nicht zu Da die meisten Analysemodelle davon ausgehen, dass es bei den betrachteten Variablen keine fehlenden Werte gibt, werden oft Fälle mit fehlenden Werten bei mindestens einer Variablen aus der Analyse ausgeschlossen (engl: listwise deletion of missing values). Vorlesung Statistik I 9

10 Häufigkeitstabellen Die empirische Verteilung einer Variablen gibt an, wie oft welche Ausprägungen einer Variable in der Datenmatrix (dem Datensatz), d.h. der Menge aller Untersuchungseinheiten, vorkommen. Bei einer nicht zu hohen Anzahl von realisierten Ausprägungen lässt sich eine univariate Häufigkeitsverteilung ohne Informationsverlust in einer Häufigkeitstabelle darstellen. Anteile kumulierte Ausprägung Kode Häufigkeit insgesamt nur gültige Anteile völlig unzufrieden eher unzufrieden eher zufrieden sehr zufrieden weiß nicht keine Angabe Summe (gültige Fälle: 8; fehlende Fälle 2) Vorlesung Statistik I 10

11 Häufigkeitstabellen Anteile kumulierte Ausprägung Kode Häufigkeit insgesamt nur gültige Anteile völlig unzufrieden eher unzufrieden eher zufrieden sehr zufrieden weiß nicht keine Angabe Summe (gültige Fälle: 8; fehlende Fälle 2) Die Tabelle enthält die absoluten Häufigkeiten mit der eine Ausprägung im Datensatz vorkommt. Im Beispiel kommt die 1. Ausprägung ( völlig unzufrieden, Kode 1 ) mit der absoluten Häufigkeit 1 vor, die zweite Ausprägung ( eher unzufrieden ) mit der Häufigkeit 2, die dritte Ausprägung ( eher zufrieden ) mit der Häufigkeit 2, die 4. Ausprägung ( sehr zufrieden ) mit der absoluten Häufigkeit 3, die ungültige Ausprägung weiß nicht mit der absoluten Häufigkeit 1 und die ungültige Ausprägung keine Angabe mit der Häufigkeit 1. Vorlesung Statistik I 11

12 Häufigkeitstabellen Anteile kumulierte Ausprägung Kode Häufigkeit insgesamt nur gültige Anteile völlig unzufrieden eher unzufrieden eher zufrieden sehr zufrieden weiß nicht keine Angabe Summe (gültige Fälle: 8; fehlende Fälle 2) Aus der Tabelle ist auch ersichtlich, dass es neben den vier gültigen Ausprägungen zwei Ausprägungen gibt, die als ungültig deklariert sind. Ob eine Ausprägung als ungültig bewertet wird, hängt von der jeweiligen Fragestellung ab. Dies Festlegun ungültiger Werte hat Auswirkungen auf die Berechnung der Anteile (relativen Häufigkeiten), die sich aus der Divison der absoluten Häufigkeiten durch die Gesamtzahl berechnen. Anteile können sich auf die gesamte Fallzahl (4. Spalte) oder nur auf die Zahl der Fälle mit gültigen Antworten (5. Spalte) beziehen Vorlesung Statistik I 12

13 Häufigkeitstabellen Anteile kumulierte Ausprägung Kode Häufigkeit insgesamt nur gültige Anteile völlig unzufrieden eher unzufrieden eher zufrieden sehr zufrieden weiß nicht keine Angabe Summe (gültige Fälle: 8; fehlende Fälle 2) In der letzten Spalte werden die relativen Häufigkeiten der gültigen Fälle aufsummiert. Die Zahl in der Zeile mit dem Kode 2 eher unzufrieden ist also die Summe der Anteile, die diesen oder einen kleineren Wert aufweisen, hier also die Summe der völlig unzufriedenen (Anteil = 0.125) plus der eher unzufriedenen (Anteil = 0.250) Personen: = Kumulierte Anteile machen nur bei ordinalem oder höherem Messniveau Sinn. Vorlesung Statistik I 13

14 Konventionen Zur Darstellung in Formeln gibt es eine Reihe von Konventionen, mit denen Variablen, Ausprägungen und Realisierungen, gemessene Werte und Transformationen gekennzeichnet werden. Variable X, Y, Z, V 2 Ausprägung x, y, z, v 2 Anzahl der Fälle n Realisation des i-ten Falles (i=1,2,...,n) der Variablen X x i Realisation des i-ten sortierten Falles (Rangplatz) x (i) Mittelwert der k-ten Gruppe bei gruppierten Daten m (k) Ausprägung k (k=1,2,...,k) der Variablen X x k, x (k) Anzahl der Fälle mit der Ausprägung x k n k, n (k) Anteil der Fälle mit der Ausprägung x k p k, p (k) Prozent der Fälle mit der Ausprägung x k p k % = p k 100 Vorlesung Statistik I 14

15 Häufigkeitstabellen: Berechnung von Anteilen p Anteile kumulierte Ausprägung Kode Häufigkeit insgesamt nur gültige Anteile völlig unzufrieden eher unzufrieden eher zufrieden sehr zufrieden weiß nicht keine Angabe Summe (gültige Fälle: 8; fehlende Fälle 2) n p1 = n/n 1 = 1/10= 0.1 k = p = n /n = 2/10= 0.2 k n Bei der Indizierung wird manchmal auch die zugeordnete Ausprägung als Indexwert verwendet. n k p k p k cp k = p k 2 2 p3 = n 3/n = 2/10= 0.2 p4 = n 4/n = 3/10= 0.3 p5 = n 5/n = 1/10= 0.1 p = n /n = 1/10= 0.1 alternativ: = p 8 = n 8 / n = p 9 = n 9 / n Bei geordneten (sortierten) Werten 6 6 wird immer die Rangnummer verwendet, d.h. im Beispiel p (5), aber nicht p (8) für die fünfte der Größe nach geordnete Kategorie. Vorlesung Statistik I 15

16 Häufigkeitstabellen: Berechnung von Anteilen n (k) p (k) p (k) cp (k) = p (k) Anteile kumulierte Ausprägung Kode Häufigkeit insgesamt nur gültige Anteile völlig unzufrieden eher unzufrieden eher zufrieden sehr zufrieden weiß nicht keine Angabe Summe (gültige Fälle: 8; fehlende Fälle 2) In Häufigkeitstabellen sind die Ausprägungen stets geordnet. Die Summe der Anteile über alle (berücksichtigten) Kategorien ist stets 1.0. Abweichungen kann es nur als Folge von Rundungsfehlern geben, Prozentuierung auf der Basis der gültigen Fälle: p(1) = n (1) / n = 1/ 8 = p(2) = n (2) / n = 2/8 = p(3) = n (3) / n = 2/8 = p = n / n = 3/ 8 = (4) (4) p (k) = n (k) n Vorlesung Statistik I 16

17 Häufigkeitstabellen: Berechnung der kumulierten Anteile Anteile kumulierte Ausprägung Kode Häufigkeit insgesamt nur gültige Anteile völlig unzufrieden eher unzufrieden eher zufrieden sehr zufrieden weiß nicht keine Angabe Summe (gültige Fälle: 8; fehlende Fälle 2) ( ) cp = p X x = p = (k) (k) j j= 1 cp = p = = 1/8 (1) (1) (2) (1) (2) (3) (1) (2) (3) k (4) (1) (2) (3) (4) k j= 1 n n (j) ( ) cp = p + p = = = 1+ 2 /8 n (k) p (k) p (k) cp (k) = p (k) ( ) ( ) cp = p + p + p = = = /8 cp = p + p + p + p = = 1 = /8 Vorlesung Statistik I 17

18 Häufigkeitstabellen: Berechnung von Prozenten n (k) p (k) p (k) p (k) % Anteile Anteile Ausprägung Kode Häufigkeit insgesamt nur gültige in Prozemt völlig unzufrieden % eher unzufrieden % eher zufrieden % sehr zufrieden % weiß nicht keine Angabe Summe (gültige Fälle: 8; fehlende Fälle 2) Anstelle von Anteilen werden oft Prozentwerte verwendet. Prozentwerte sind Anteilswerte mal 100: p% = p 100 p = k k k p % k 100 p % = p 100 = = 12.5 (1) (1) p % = p 100 = = 25.0 (2) (2) p % = p 100 = = 25.0 (3) (3) p % = p 100 = = 37.5 (4) (4) Vorlesung Statistik I 18

19 Häufigkeitstabellen bei gruppierten Daten Wenn eine Variable sehr viele Ausprägungen hat, werden aus Gründen der Übersichtlichkeit Ausprägungen zu Klassen (oder Gruppen) zusammengefasst. Messtheoretisch gesehen ist jede Klassenbildung eine unzulässige Trandformation. Die Zusammenfassung von Ausprägungen einer Variablen zu Klassen bedeutet grundsätzlich einen Informationsverlust. Regeln für die Definition der Klassen: 1. Die Klassengrenzen dürfen sich nicht überschneiden, d.h. jede Ausprägung darf nur einer einzigen Klasse zugeordnet werden. 2. Die Klassen sollen lückenlos aufeinander folgen, d.h. jede Ausprägung muss einer Klasse zugeordnet werden können ( exakte Klassengrenzen), 3. Die Klassenbreiten sollen möglichst jeweils gleich sein. (Ausnahmen: ungleiche Klassenbreite bei erster oder letzer Klasse, wenn diese sonst sehr gering besetzt wären; Klassen werden manchmal aber so gebildet, dass sie in etwa gleich stark besetzt sind. Als Folge sind die Klassenbreiten dann i.a. unterschiedlich.) Vorlesung Statistik I 19

20 Häufigkeitstabellen bei gruppierten Daten Tabelle 3.5: Häufigkeitstabelle für gruppierte Altersangaben u (k) o (k) m (k) n (k) p (k) cp (k) Ausprägung in Jahren Kode = Gültige Kumulierte (exakte Klassengenzen) Klassenmitte Häufigkeit Prozente Prozente Prozente 17.5 bis < bis < bis < bis < bis < keine Angabe Missing Total Gültige Fälle: 3512 Fehlende Fälle: 6 (Quelle: Allbus 1996) (nach Kühnel/Krebs 2006: 49) Als Wert (Kode) der Ausprägungen gruppierter Variablen wird oft die Klassenmitte m (k) einer Klasse berechnet, das ist der Durchschnittswert aus Oberund Untergrenze einer Klasse: m (k) = u (k) + o 2 (k) (1) (5) ( ) m = / 2 = 23.5 ( ) m = / 2 = 84.5 Vorlesung Statistik I 20

21 Verteilungsfunktion und Quantile Häufigkeitstabelle für die Bewertung der allgemeinen Wirtschaftslage Gültige Kumulierte Ausprägung Kode Häufigkeit Prozente Prozente Prozente sehr gut gut teils/teils schlecht sehr schlecht weiß nicht Missing Verteilungs Total funktion Gültige Fälle: 3494 Fehlende Fälle: 24 (Daten: ALLBUS 1996) Quelle: Kühnel/Krebs, 2006: 44 x (k) n (k) p (k) p (k) cp (k) Die empirische Verteilungsfunktion ˆF(X) gibt an, welcher Anteil der Realisationen kleiner oder gleich diesem Wert sind: n i ˆF( X x() i ) = n ( ) i= 1 k n k (j) (k) (j) (j) j= 1 n j= 1 ˆF X x = = p = cp In der Häufigkeitstabelle ist diese Information in der letzten Spalte mit den kumulierten Anteilen (cp (k) ) aufgelistet. Vorlesung Statistik I 21

22 Grafische Darstellung der Verteilungsfunktion 1.0 Anstieg um p (5) =0.066 Anstieg um p (4) =0.311 Kumulierte Häufigkeiten Anstieg um p (1) =0.009 Anstieg um p (2) =0.124 Anstieg um p (3) =0.489 Gültige Kumulierte X Anteile Anteile Bewertung der allgemeinen Wirtschaftslage (X) In der grafischen Darstellung ist die empirische Verteilungsfunktion eine Treppenfunktion, die bei jeder Ausprägung der Variablen um die relative Häufigkeit dieser Ausprägung ansteigt. Vorlesung Statistik I 22

23 Quantile Gültige Kumulierte X Prozente Prozente Quantile teilen eine Verteilung in zwei 13.3% Teilmengen auf: % 13.3% = 86.7 % > Kumulierte Häufigkeiten % 13.3% = 86.7 % > % Bewertung der allgemeinen Wirtschaftslage (X) Vorlesung Statistik I 23

24 Quantile: Quantilwert und Quantilanteil Gültige Kumulierte X Prozente Prozente Der Quantilwert Q gibt die Trennstelle α = 13.3% an, an der die Teilung erfolgt. Q = Kumulierte Häufigkeiten Q =2 α = 13.3% 13.3%-Quantil: Q 13.3% = Q = 2 Der Quantilanteil α gibt den Anteil an, der im unteren Teilbereich liegt Bewertung der allgemeinen Wirtschaftslage (X) Vorlesung Statistik I 24

25 Quantile Gültige Kumulierte X Prozente Prozente Der Quantilwert Q α ist der kleinste Wert für den gilt, dass mindestens ein Anteil α von allen Realisierungen kleiner oder gleich diesem Wert ist Kumulierte Häufigkeiten Bewertung der allgemeinen Wirtschaftslage (X) Q 0.90 = 4? Q 0.50 = 3? Q 0.25 = 3? Q 0.10 = 2? Vorlesung Statistik I 25

26 Quantile: Berechnung aus Häufigkeitstabellen ungruppierter Daten Wenn eine Häufigkeitstabelle ungruppierter Daten vorliegt, können die Quantilwerte direkt aus der Häufigkeitstabelle abgelesen werden: Der Quantilwert ist die Ausprägung, bei der in der Spalte mit den kumulierten Anteilen bzw. kumulierten Prozentwerten erstmals der Quantilanteil erreicht oder überschritten wird: Gültige Kumulierte X Prozente Prozente Q 0.10 = Q 10% =? 0.9% < 10 % Q 10% > % > 10 % Q 10% 2 2 ist die kleinste Ausprägung, für die gilt, mindestens 10% aller Fälle sind 2 Q 0.1 = 2. Gültige Kumulierte X Prozente Prozente Q α=0.0% bis Q α=0.9% = 1 Qα >0.9% bis Q α=13.3% = 2 Q α>13.3% bis Q α=62.2% = 3 Q α>62.2% bis Q α=93.4% = 4 Q α>93.4% bis Q α=100% = 5 Vorlesung Statistik I 26

27 Quantile: Berechnung aus geordneten Messwerten Quantilwerte können auch direkt aus den Messwerten berechnet werden, wenn die Messwertreihe vorher der Größe nach sortiert wurde. Untersuchungseinheiten (Fälle) Fall - nummer Merkmale der Untersuchungseinheiten (Variablen) Antwort Frage 1 Antwort Frage 2a Antwort Frage 2b Geschlecht Geburtsjahr ID F1 F2A F2B F3 F Nach Größe sortiertes Geburtsjahr (ohne missing values) Fall Rang F 4(i) Wert 8 1 f 4(1) f 4(2) f 4(3) f 4(4) f 4(5) f 4(6) f 4(7) f 4(8) f 4(9) Vorlesung Statistik I 27

28 Quantile: Berechnung aus geordneten Messwerten Die Berechnung erfolgt in drei Schritten: Schritt 1: Multiplikation des Quantilanteils mit der Fallzahl: i = n α Schritt 2: Falls i keine ganze Zahl ist, sondern Nachkommastellen hat, Aufrunden zur nächsten ganzen Zahl j, anderenfalls: j=i. Schritt 3: Der Quantilwert Q α ist der Wert der Variablen auf dem j-ten Rangplatz: x (j). Beispiel: Q 50% =? bei ungerader Fallzahl Schritt 1: i = n α = = 4.5 X Fall Rang Schritt 2: Aufrunden zur nächsten ganzen Zahl: j = Schritt 3: Q 50% = x (5) = Wert auf Rangplatz 5: x (5) = Fallzahl n = 9. der Datensatz enthält n=9 Fälle mit gültigen Altersangaben Vorlesung Statistik I 28

29 Quantile: Berechnung aus geordneten Messwerten Die Berechnung erfolgt in drei Schritten: Schritt 1: Multiplikation des Quantilanteils mit der Fallzahl: i = n α Schritt 2: Falls i keine ganze Zahl ist, sondern Nachkommastellen hat, Aufrunden zur nächsten ganzen Zahl j, anderenfalls: j=i. Schritt 3: Der Quantilwert Q α ist der Wert der Variablen auf dem j-ten Rangplatz: x (j). Beispiel: Q 50% =? bei geraden Zahlen Schritt 1: i = n α = = 4 X Rang Schritt 2: keine Aufrunden notwendig: j = i = Schritt 3: Q 50% = x (4) = Wert auf Rangplatz 4: x (4) = Fallzahl n = 8. Der Datensatz enthält n=8 Fälle Vorlesung Statistik I 29

30 Bedeutung von Quantilen Wozu werden Quantile benötigt? Quantile geben Informationen über eine Verteilung: So besagt das 50%-Quantil, bei welchem Wert die Mitte einer Verteilung in etwa liegt, Die Differenzen des 5%- und des 95%-Quantils geben an, in welchen Grenzen die mittleren 90% aller Fälle liegen. Die Gesamtheit aller Quantile enthält alle Informationen über eine Verteilung. Besondere Namen: Das 25%-, das 50-% und das 75%-Quantil werden auch als Quartile bezeichnet, weil sie die Verteilung in vier gleich stark besetzte Klassen aufteilen; entsprechend werden das 10%-, 20%-, 30%-,..., 90%-Quantil als Zentile bezeichnet, weil sie die Verteilung in 10 gleich stark besetzte Klassen aufteilen; das 1%-, 2%-,..., 98%-, 99%-Quantil werden analog als Perzentile bezeichnet. Messniveau: Voraussetzung für die Berechnung von Quantilen ist mindestens ordinales, besser metrisches Skalenniveau. Bei ordinalen Skalenniveau sind Quantilwerte Ausprägungen von Rangplätzen (Kategorien). Vorlesung Statistik I 30

31 Hinweise zu Quantilen Die vorgestellte Berechnungsweise ergibt die sogenannten empirischen Quantile der empirischen Verteilungsfunktion. Darüber hinaus gibt es weitere Berechnungsformeln, die zu leicht unterschiedlichen Ergebnissen führen. Ursache ist die Unstetigkeit der empirischen Verteilungsfunktion bei ungruppierten Daten. X Rang Kumulierte Häufigkeiten So ist bei den links wiedergegebenen n=10 Fällen das 50%-Quantil Q 0.50 = 3. In zwei Hälften mit jeweils 50% (=5) Fällen kann die Verteilung aber durch jede beliebige Zahl zwischen 3 und kleiner 4 eingeteilt werden Bewertung der allgemeinen Wirtschaftslage (X) Vorlesung Statistik I 31

32 Quantilberechnung bei gruppierten Daten Wenn wie bei metrischen Variablen mit sehr vielen Ausprägungen Klassen gebildet worden sind, werden die Quantilwerte über lineare Interpolation innerhalb der Klasse ermittelt, die das Quantil enthält. Tabelle 3.5: Häufigkeitstabelle für gruppierte Altersangaben u (k) o (k) m (k) n (k) p (k) cp (k) Ausprägung in Jahren Kode = Gültige Kumulierte (exakte Klassengenzen) Klassenmitte Häufigkeit Prozente Prozente Prozente 17.5 bis < bis < bis < bis < bis < keine Angabe Missing Total Gültige Fälle: 3512 Fehlende Fälle: 6 (Quelle: Allbus 1996) (nach Kühnel/Krebs 2006: 49) So ist das 25%-Quantil der Altersverteilung der Befragten aus dem Allbus 1996 in der Klasse von 29.5 bis unter 44.5 Jahren, da die kumulierten Prozentwerte in dieser Klasse das erste Mal größer oder gleich 25% sind. Vorlesung Statistik I 32

33 Verteilungsfunktion bei gruppierten Daten: Die Summenkurve Ausgangspunkt ist die Summenkurve, bei der in jeder Klasse eine Gerade zwischen Unter -und Obergrenze der Klasse gezogen wird. k u (k) o (k) m (k) p (k) cp (k) < < < < < Kumulierte Häufigkeiten Jahre 19.2 % 15 Jahre 15 Jahre 30.5 % 26.9 % 15 Jahre 18.2 % 19 Jahre % Bei exakten Klassengrenzen berühren sich die Geraden und bilden zusammenhängend die Summenkurve, die eine Annäherung an die empirische Verteilungsfunktion der ungruppierten Daten ist. Vorlesung Statistik I 33

34 Quantilberechnung bei gruppierten Daten über die Summenkurve Der Quantilwert Q α bei gruppierten Daten ist dann der Wert von X, an der eine horizontale Gerade auf der Höhe α die Summenkurve schneidet. k u (k) o (k) m (k) p (k) cp (k) < < < < < Kumulierte Häufigkeiten % = cp (2) o (2) = 44.5 (Obergrenze der zweiten Klasse) α = 25 % Q % = % = cp (1) 0.1 o (1) = 29.5 (Obergrenze der ersten Klasse) Vorlesung Statistik I 34

35 Quantilberechnung bei gruppierten Daten: Interpolation innerhalb der Quantilklasse 0.5 o (1) = 29.5 o (2) = p 0.3 (2) = 30.5 % α = 25 % % 19.5% cp (1) = 19.2 % x Q 25% = k u (k) o (k) m (k) p (k) cp (k) < < < < < cp Q = o + o o ( ) (1) 0.25 (1) (2) (1) p(2) 25% 19.2% x = 30.5% Q25% = ( ) = x = 2.85 α cp (k 1) Qα = o(k 1) + ( o(k) o(k 1) ) p (k) wobei k die Klasse ist, in der das gesuchte Quantil liegt. Vorlesung Statistik I 35

36 Anwendung von Quantilen bei gruppierten Daten Fragestellung: In welchen Bereich um das 50%-Quantil liegen 90% aller Fälle einer Altersverteilung? Daten: Häufigkeitstabelle für gruppierte Altersangaben Ausprägung in Jahren Kode = Gültige Kumulierte (exakte Klassengenzen) Klassenmitte Häufigkeit Prozente Prozente Prozente 17.5 bis < bis < bis < bis < bis < keine Angabe Missing Total Gültige Fälle: 3512 Fehlende Fälle: 6 (Quelle: Allbus 1996) (nach Kühnel/Krebs 2006: 49) Das 50%-Quantil teilt die Verteilung in eine obere und eine untere Hälfte. Wenn 90% um das 50%-Quantil verteilt sind, liegen jeweils 45% unterhalb und oberhalb dieses Werts. Der gesuchte Bereich wird daher durch das 5%-Quantil (5% = 50% 45%) und durch das 95%- Quantil (95% = 50% + 45%) begrenzt. Vorlesung Statistik I 36

37 Anwendung von Quantilen bei gruppierten Daten Fragestellung: In welchen Bereich um das 50%-Quantil liegen 90% aller Fälle? Kumulierte Häufigkeiten % 95% % aller Befragten sind zwischen 20.6 und 75.2 Jahre alt. 5% Q 5% = 20.6 Q 95% = 75.2 Vorlesung Statistik I 37

38 Quantilberechnung bei gruppierten Daten: Interpolation innerhalb der Quantilklasse α cp Q = o + o o ( ) (k 1) α (k 1) (k) (k 1) p(k) k=1 k=2 k=3 k=4 k=5 Tabelle 3.5: Häufigkeitstabelle für gruppierte Altersangaben u (k) o (k) m (k) n (k) p (k) cp (k) Ausprägung in Jahren Kode = Gültige Kumulierte (exakte Klassengenzen) Klassenmitte Häufigkeit Prozente Prozente Prozente 17.5 bis < bis < bis < bis < bis < keine Angabe Missing Total Gültige Fälle: 3512 Fehlende Fälle: 6 (Quelle: Allbus 1996) (nach Kühnel/Krebs 2006: 49) Da cp (1) = 19.2% > 5% liegt das 5%-Quantil in der ersten Klasse cp Q = o + ( o o ) = ( ) = p.192 (1 1) 0.05 (1 1) (1) (1 1) (1) Vorlesung Statistik I 38

39 Quantilberechnung bei gruppierten Daten: Interpolation innerhalb der Quantilklasse α cp Q = o + o o ( ) (k 1) α (k 1) (k) (k 1) p(k) k=1 k=2 k=3 k=4 k=5 Tabelle 3.5: Häufigkeitstabelle für gruppierte Altersangaben u (k) o (k) m (k) n (k) p (k) cp (k) Ausprägung in Jahren Kode = Gültige Kumulierte (exakte Klassengenzen) Klassenmitte Häufigkeit Prozente Prozente Prozente 17.5 bis < bis < bis < bis < bis < keine Angabe Missing Total Gültige Fälle: 3512 Fehlende Fälle: 6 (Quelle: Allbus 1996) (nach Kühnel/Krebs 2006: 49) Da cp (4) = 94.8% < 95% liegt das 95%-Quantil in der fünften Klasse cp Q = o + ( o o ) = ( ) = p.052 (5 1) 0.95 (5 1) (5) (5 1) (5) Vorlesung Statistik I 39

40 Grafische Darstellung univariater Verteilungen Grafische Darstellungen vermitteln einen Eindruck von der Form einer Verteilung. Darstellungen metrischer Daten: Stabdiagramm 6 5 Häufigkeiten Alter in Jahren In Stabdiagrammen werden die absoluten oder relativen Häufigkeiten der Ausprägungen als senkrechte Linien symbolisiert. Dies ergibt einen schnellen Überblick über die Form einer Verteilung. Vorlesung Statistik I 40

41 Grafische Darstellung univariater Verteilungen: metrische Variablen Empirische Dichte Histogramm Alter in Jahren empirische Dichte: fˆ (k) p (k) ( o(k) u(k) ) Die Balkenhöhe ist gleich der empirischen Dichte im Intervall. Diese ist der Quotient aus der relativen Häufigkeit p (k) in einem Intervall geteilt durch die Intervallbreite (o (k) u (k) ) = In Histogrammen wird die Häufigkeitsverteilung durch einander berührende Balken dargestellt. Histogramme sind besonders für die Darstellung der Verteilung bei gruppierten Daten sinvoll, da sie das Prinzip der Flächentreue berücksichtigen: Die Fläche eines Balkens entspricht der relativen Häufigkeit in dem durch die Balkenbreite definierten Intervall. Vorlesung Statistik I 41

42 Grafische Darstellung univariater Verteilungen: metrische Variablen Kern-Dichte-Schätzer Empirische Dichte Alter in Jahren In Abhängigkeit von der verwendeten Formel und der Länge des berücksichigten Abstands um den jeweiligen Wert, für den die emprische Dichte geschätzt wird, sind die resultierenden Kurvenverläufe glätter oder zerklüfteter. Die Form eines Histogramms hängt allerdings nicht nur von der Verteilung, sondern auch von den Intervallbreiten und der gewählten Untergrenze für das erste (ganz links angeordnete) Intervall ab. Um dieses Problem zu umgehen, sind Kern-Dichte-Schätzer entwickelt worden. Diese berechnen die empirische Dichte einer Verteilung an jedem beliebigen Punkt, wobei jeweils alle Realisierungen in einem vorgegebenen Abstand berücksichtigt werden und der Einfluss eines Wertes auf die berechnete Dichte mit steigendem Abstand sinkt. Werden die Dichten der Punkte verbunden, ergibt sich eine Kurve, die die Form einer Verteilung besser wiedergibt, als die Balken eines Histogramms. Vorlesung Statistik I 42

43 Grafische Darstellung univariater Verteilungen: metrische Variablen unimodal, linksschief bzw. rechtssteil unimodal, symmetrisch unimodal, rechtsschief bzw. linkssteil unimodal, steil ansteigend, symmetrisch uförmig bimodal, symmetrisch unimodal, flach ansteigend symmetrisch Mit Hilfe von Kern-Dichte-Schätzern bzw. Histogrammen lassen sich Verteilungen nach kennzeichnenden Charakteristika, wie Schiefe, U-Förmigkeit etc. beschreiben. Vorlesung Statistik I 43

Univariate Häufigkeitsverteilungen Kühnel, Krebs 2001: Statistik für die Sozialwissenschaften, S.41-66

Univariate Häufigkeitsverteilungen Kühnel, Krebs 2001: Statistik für die Sozialwissenschaften, S.41-66 Univariate Häufigkeitsverteilungen Kühnel, Krebs 2001: Statistik für die Sozialwissenschaften, S.41-66 Gabriele Doblhammer: Empirische Sozialforschung Teil II, SS 2004 1/19 Skalenniveaus Skalenniveau Relation

Mehr

Graphische Darstellung einer univariaten Verteilung:

Graphische Darstellung einer univariaten Verteilung: Graphische Darstellung einer univariaten Verteilung: Die graphische Darstellung einer univariaten Verteilung hängt von dem Messniveau der Variablen ab. Bei einer graphischen Darstellung wird die Häufigkeit

Mehr

Einführung in Quantitative Methoden

Einführung in Quantitative Methoden Einführung in Quantitative Methoden Mag. Dipl.Ing. Dr. Pantelis Christodoulides & Mag. Dr. Karin Waldherr SS 2014 Christodoulides / Waldherr Einführung in Quantitative Methoden- 2.VO 1/57 Die Deskriptivstatistik

Mehr

Kapitel 2. Häufigkeitsverteilungen

Kapitel 2. Häufigkeitsverteilungen 6 Kapitel 2 Häufigkeitsverteilungen Ziel: Darstellung bzw Beschreibung (Exploration) einer Variablen Ausgangssituation: An n Einheiten ω,, ω n sei das Merkmal X beobachtet worden x = X(ω ),, x n = X(ω

Mehr

3. Lektion: Deskriptive Statistik

3. Lektion: Deskriptive Statistik Seite 1 von 5 3. Lektion: Deskriptive Statistik Ziel dieser Lektion: Du kennst die verschiedenen Methoden der deskriptiven Statistik und weißt, welche davon für Deine Daten passen. Inhalt: 3.1 Deskriptive

Mehr

0 Einführung: Was ist Statistik

0 Einführung: Was ist Statistik 0 Einführung: Was ist Statistik 1 Datenerhebung und Messung 2 Univariate deskriptive Statistik Häufigkeitsverteilungen Statistische Kennwerte 3 Multivariate Statistik 4 Regression 5 Ergänzungen Deskriptive

Mehr

Einführung in Quantitative Methoden

Einführung in Quantitative Methoden Einführung in Quantitative Methoden Mag. Dipl.Ing. Dr. Pantelis Christodoulides & Mag. Dr. Karin Waldherr SS 2011 Christodoulides / Waldherr Einführung in Quantitative Methoden- 2.VO 1/62 Summenzeichen

Mehr

Forschungsmethoden in der Sozialen Arbeit

Forschungsmethoden in der Sozialen Arbeit Forschungsmethoden in der Sozialen Arbeit Fachhochschule für Sozialarbeit und Sozialpädagogik Alice- Salomon Hochschule für Soziale arbeit, Gesundheit, Erziehung und Bildung University of Applied Sciences

Mehr

Deskription, Statistische Testverfahren und Regression. Seminar: Planung und Auswertung klinischer und experimenteller Studien

Deskription, Statistische Testverfahren und Regression. Seminar: Planung und Auswertung klinischer und experimenteller Studien Deskription, Statistische Testverfahren und Regression Seminar: Planung und Auswertung klinischer und experimenteller Studien Deskriptive Statistik Deskriptive Statistik: beschreibende Statistik, empirische

Mehr

WISTA WIRTSCHAFTSSTATISTIK

WISTA WIRTSCHAFTSSTATISTIK WISTA WIRTSCHAFTSSTATISTIK PROF DR ROLF HÜPEN FAKULTÄT FÜR WIRTSCHAFTSWISSENSCHAFT Seminar für Theoretische Wirtschaftslehre Vorlesungsprogramm 07052013 Mittelwerte und Lagemaße II 1 Anwendung und Berechnung

Mehr

Deskriptivstatistik a) Univariate Statistik Weiters zum Thema der statistischen Informationsverdichtung

Deskriptivstatistik a) Univariate Statistik Weiters zum Thema der statistischen Informationsverdichtung 20 Weiters zum Thema der statistischen Informationsverdichtung M a ß z a h l e n Statistiken bei Stichproben Parameter bei Grundgesamtheiten Maßzahlen zur Beschreibung univariater Verteilungen Maßzahlen

Mehr

3. Deskriptive Statistik

3. Deskriptive Statistik 3. Deskriptive Statistik Eindimensionale (univariate) Daten: Pro Objekt wird ein Merkmal durch Messung / Befragung/ Beobachtung erhoben. Resultat ist jeweils ein Wert (Merkmalsausprägung) x i : - Gewicht

Mehr

3 Häufigkeitsverteilungen

3 Häufigkeitsverteilungen 3 Häufigkeitsverteilungen 3.1 Absolute und relative Häufigkeiten 3.2 Klassierung von Daten 3.3 Verteilungsverläufe 3.1 Absolute und relative Häufigkeiten Datenaggregation: Bildung von Häufigkeiten X nominal

Mehr

htw saar 1 EINFÜHRUNG IN DIE STATISTIK: BESCHREIBENDE STATISTIK

htw saar 1 EINFÜHRUNG IN DIE STATISTIK: BESCHREIBENDE STATISTIK htw saar 1 EINFÜHRUNG IN DIE STATISTIK: BESCHREIBENDE STATISTIK htw saar 2 Grundbegriffe htw saar 3 Grundgesamtheit und Stichprobe Ziel: Über eine Grundgesamtheit (Population) soll eine Aussage über ein

Mehr

Willkommen zur Vorlesung Statistik

Willkommen zur Vorlesung Statistik Willkommen zur Vorlesung Statistik Thema dieser Vorlesung: Häufigkeiten und ihre Verteilung, oder: Zusammenfassende Darstellungen einzelner Variablen Prof. Dr. Wolfgang Ludwig-Mayerhofer Universität Siegen

Mehr

4. Kumulierte Häufigkeiten und Quantile

4. Kumulierte Häufigkeiten und Quantile 4. Kumulierte Häufigkeiten und Quantile Statistik für SoziologInnen 1 4. Kumulierte Häufigkeiten und Quantile Kumulierte Häufigkeiten Oft ist man nicht an der Häufigkeit einzelner Merkmalsausprägungen

Mehr

Wiederholung Statistik I. Statistik für SozialwissenschaftlerInnen II p.8

Wiederholung Statistik I. Statistik für SozialwissenschaftlerInnen II p.8 Wiederholung Statistik I Statistik für SozialwissenschaftlerInnen II p.8 Konstanten und Variablen Konstante: Merkmal hat nur eine Ausprägung Variable: Merkmal kann mehrere Ausprägungen annehmen Statistik

Mehr

Herzlich willkommen zur Vorlesung Statistik. Streuungsmaße oder die Unterschiedlichkeit der Daten nebst kurzen Ausführungen zu Schiefe und Wölbung

Herzlich willkommen zur Vorlesung Statistik. Streuungsmaße oder die Unterschiedlichkeit der Daten nebst kurzen Ausführungen zu Schiefe und Wölbung FB 1 W. Ludwig-Mayerhofer Statistik 1 Herzlich willkommen zur Vorlesung Statistik smaße oder die Unterschiedlichkeit der Daten nebst kurzen Ausführungen zu Schiefe und Wölbung FB 1 W. Ludwig-Mayerhofer

Mehr

Mathematische und statistische Methoden II

Mathematische und statistische Methoden II Methodenlehre e e Prof. Dr. G. Meinhardt 6. Stock, Wallstr. 3 (Raum 06-206) Sprechstunde jederzeit nach Vereinbarung und nach der Vorlesung. Mathematische und statistische Methoden II Dr. Malte Persike

Mehr

Kreisdiagramm, Tortendiagramm

Kreisdiagramm, Tortendiagramm Kreisdiagramm, Tortendiagramm Darstellung der relativen (absoluten) Häufigkeiten als Fläche eines Kreises Anwendung: Nominale Merkmale Ordinale Merkmale (Problem: Ordnung nicht korrekt wiedergegeben) Gruppierte

Mehr

Verteilungsfunktion und dquantile

Verteilungsfunktion und dquantile Statistik 1 für SoziologInnen Verteilungsfunktion und dquantile Univ.Prof. Dr. Marcus Hudec Kumulierte Häufigkeiten Hinweis: Damit die Kumulation inhaltlich sinnvoll ist, muss das Merkmal zumindest ordinal

Mehr

4. Kumulierte Häufigkeiten und Quantile

4. Kumulierte Häufigkeiten und Quantile 4. Kumulierte Häufigkeiten und Quantile Kumulierte Häufigkeiten Oft ist man nicht an der Häufigkeit einzelner Merkmalsausprägungen interessiert, sondern an der Häufigkeit von Intervallen. Typische Fragestellung:

Mehr

Voraussetzung für statistische Auswertung: jeder Fall besitzt in bezug auf jedes Merkmal genau eine Ausprägung

Voraussetzung für statistische Auswertung: jeder Fall besitzt in bezug auf jedes Merkmal genau eine Ausprägung Rohdaten Urliste oder Rohdaten sind die auszuwertenden Daten in der Form, wie sie nach der Datenerhebung vorliegen. Dimensionen der Urliste sind die Fälle, Merkmale und ihre Ausprägungen. Voraussetzung

Mehr

Grundlagen der empirischen Sozialforschung

Grundlagen der empirischen Sozialforschung Grundlagen der empirischen Sozialforschung Sitzung 10 - Datenanalyseverfahren Jan Finsel Lehrstuhl für empirische Sozialforschung Prof. Dr. Petra Stein 22. Dezember 2008 1 / 21 Online-Materialien Die Materialien

Mehr

Lagemaße Übung. Zentrale Methodenlehre, Europa Universität - Flensburg

Lagemaße Übung. Zentrale Methodenlehre, Europa Universität - Flensburg Lagemaße Übung M O D U S, M E D I A N, M I T T E L W E R T, M O D A L K L A S S E, M E D I A N, K L A S S E, I N T E R P O L A T I O N D E R M E D I A N, K L A S S E M I T T E Zentrale Methodenlehre, Europa

Mehr

Median 2. Modus < Median < Mittelwert. Mittelwert < Median < Modus. 2 Modalwerte oder Modus viel größer bzw. viel kleiner als Mittelwert

Median 2. Modus < Median < Mittelwert. Mittelwert < Median < Modus. 2 Modalwerte oder Modus viel größer bzw. viel kleiner als Mittelwert Universität Flensburg Zentrum für Methodenlehre Tutorium Statistik I Modus oder Modalwert (D) : - Geeignet für nominalskalierte Daten - Wert der häufigsten Merkmalsausprägung - Es kann mehrere Modalwerte

Mehr

WISTA WIRTSCHAFTSSTATISTIK

WISTA WIRTSCHAFTSSTATISTIK WISTA WIRTSCHAFTSSTATISTIK PROF DR ROLF HÜPEN FAKULTÄT FÜR WIRTSCHAFTSWISSENSCHAFT Seminar für Theoretische Wirtschaftslehre Vorlesungsprogramm 23042013 Datenlagen und Darstellung eindimensionaler Häufigkeitsverteilungen

Mehr

2 Häufigkeitsverteilungen

2 Häufigkeitsverteilungen 2 Häufigkeitsverteilungen Ziel: Darstellung bzw Beschreibung (Exploration) einer Variablen Ausgangssituation An n Einheiten ω 1,,ω n sei das Merkmal X beobachtet worden x 1 = X(ω 1 ),,x n = X(ω n ) Also

Mehr

Der Mittelwert (arithmetisches Mittel)

Der Mittelwert (arithmetisches Mittel) Der Mittelwert (arithmetisches Mittel) x = 1 n n x i bekanntestes Lagemaß instabil gegen extreme Werte geeignet für intervallskalierte Daten Deskriptive Statistik WiSe 2015/2016 Helmut Küchenhoff (Institut

Mehr

Statistik SS Deskriptive Statistik. Bernhard Spangl 1. Universität für Bodenkultur. March 6, 2012

Statistik SS Deskriptive Statistik. Bernhard Spangl 1. Universität für Bodenkultur. March 6, 2012 Statistik SS 2012 Bernhard Spangl 1 1 Institut für angewandte Statistik und EDV Universität für Bodenkultur March 6, 2012 B. Spangl (Universität für Bodenkultur) Statistik SS 2012 March 6, 2012 1 / 19

Mehr

Mathematische und statistische Methoden I

Mathematische und statistische Methoden I Prof. Dr. G. Meinhardt Methodenlehre Mathematische und statistische Methoden I Sprechstunde jederzeit nach Vereinbarung und nach der Vorlesung Wallstr. 3, 6. Stock, Raum 06-206 Dr. Malte Persike persike@uni-mainz.de

Mehr

1 x 1 y 1 2 x 2 y 2 3 x 3 y 3... n x n y n

1 x 1 y 1 2 x 2 y 2 3 x 3 y 3... n x n y n 3.2. Bivariate Verteilungen zwei Variablen X, Y werden gemeinsam betrachtet (an jedem Objekt werden gleichzeitig zwei Merkmale beobachtet) Beobachtungswerte sind Paare von Merkmalsausprägungen (x, y) Beispiele:

Mehr

Statistik I im Sommersemester 2006

Statistik I im Sommersemester 2006 Statistik I im Sommersemester 2006 Themen am 18.4.2006: Was ist Statistik, wozu Statistik? Überblick über das Modul M2: Grundlagen sozialwissenschaftlicher Datenanalyse (Statistik I) Einige Ergebnisse

Mehr

3 Häufigkeitsverteilungen

3 Häufigkeitsverteilungen 3 Häufigkeitsverteilungen 3.1 Absolute und relative Häufigkeiten 3.2 Klassierung von Daten 3.3 Verteilungsverläufe 3.1 Absolute und relative Häufigkeiten Datenaggregation: Bildung von Häufigkeiten X nominal

Mehr

Verfahren für metrische Variable

Verfahren für metrische Variable Verfahren für metrische Variable Grafische Methoden Histogramm Mittelwertsplot Boxplot Lagemaße Mittelwert, Median, Quantile Streuungsmaße Standardabweichung, Interquartilsabstand Lagemaße und Streumaße

Mehr

1. Maße der zentralen Tendenz Beispiel: Variable Anzahl der Geschwister aus Jugend '92. Valid Cum Value Frequency Percent Percent Percent

1. Maße der zentralen Tendenz Beispiel: Variable Anzahl der Geschwister aus Jugend '92. Valid Cum Value Frequency Percent Percent Percent Deskriptive Statistik 1. Verteilungsformen symmetrisch/asymmetrisch unimodal(eingipflig) / bimodal (zweigipflig schmalgipflig / breitgipflig linkssteil / rechtssteil U-förmig / abfallend Statistische Kennwerte

Mehr

Statistik SS Deskriptive Statistik. Bernhard Spangl 1. Universität für Bodenkultur. March 1, 2012

Statistik SS Deskriptive Statistik. Bernhard Spangl 1. Universität für Bodenkultur. March 1, 2012 Statistik SS 2012 Deskriptive Statistik Bernhard Spangl 1 1 Institut für angewandte Statistik und EDV Universität für Bodenkultur March 1, 2012 B. Spangl (Universität für Bodenkultur) Statistik SS 2012

Mehr

Wahrscheinlichkeits - rechnung und Statistik

Wahrscheinlichkeits - rechnung und Statistik Michael Sachs Mathematik-Studienhilfen Wahrscheinlichkeits - rechnung und Statistik für Ingenieurstudenten an Fachhochschulen 4., aktualisierte Auflage 2.2 Eindimensionale Häufigkeitsverteilungen 19 absolute

Mehr

Verteilungsfunktion und Quantile

Verteilungsfunktion und Quantile Statistik 1 für SoziologInnen Verteilungsfunktion und Quantile Univ.Prof. Dr. Marcus Hudec Kumulierte Häufigkeiten Hinweis: Damit das Kumulieren inhaltlich sinnvoll ist, muss das Merkmal zumindest ordinal

Mehr

Verteilungsfunktion und Quantile

Verteilungsfunktion und Quantile Statistik 1 für SoziologInnen Verteilungsfunktion und Quantile Univ.Prof. Dr. Marcus Hudec Kumulierte Häufigkeiten Hinweis: Damit das Kumulieren inhaltlich sinnvoll ist, muss das auszuwertende Merkmal

Mehr

Weitere Lagemaße: Quantile/Perzentile I

Weitere Lagemaße: Quantile/Perzentile I 3 Auswertung von eindimensionalen Daten Lagemaße 3.3 Weitere Lagemaße: Quantile/Perzentile I Für jeden Median x med gilt: Mindestens 50% der Merkmalswerte sind kleiner gleich x med und ebenso mindestens

Mehr

Verteilungen und ihre Darstellungen

Verteilungen und ihre Darstellungen Verteilungen und ihre Darstellungen Übung: Stamm-Blatt-Diagramme Wie sind die gekennzeichneten Beobachtungswerte eweils zu lesen? Tragen Sie in beiden Diagrammen den Wert 0.452 an der richtigen Stelle

Mehr

Bitte am PC mit Windows anmelden!

Bitte am PC mit Windows anmelden! Einführung in SPSS Plan für heute: Grundlagen/ Vorwissen für SPSS Vergleich der Übungsaufgaben Einführung in SPSS http://weknowmemes.com/generator/uploads/generated/g1374774654830726655.jpg Standardnormalverteilung

Mehr

Deskriptive Statistik

Deskriptive Statistik Fakultät für Humanwissenschaften Sozialwissenschaftliche Methodenlehre Prof. Dr. Daniel Lois Deskriptive Statistik Stand: April 2015 (V2) Inhaltsverzeichnis 1. Notation 2 2. Messniveau 3 3. Häufigkeitsverteilungen

Mehr

Alle weiteren Messoperationen schließen die Klassifikation als Minimaloperation ein.

Alle weiteren Messoperationen schließen die Klassifikation als Minimaloperation ein. 1 unterschiedliche Skalenniveaus Wir haben zuvor schon kurz von unterschiedlichen Skalenniveaus gehört, nämlich dem: - Nominalskalenniveau - Ordinalskalenniveau - Intervallskalenniveau - Ratioskalenniveau

Mehr

Lagemasse und Streuung

Lagemasse und Streuung Lagemasse und Streuung Benjamin Schlegel 07. März 2016 Lagemasse sagen etwas über die Lage und das Zentrum der Daten aus, Streuungsmasse, wie die Daten um dieses Zentrum gestreut sind. Lagemasse Lagemasse

Mehr

Statistik K urs SS 2004

Statistik K urs SS 2004 Statistik K urs SS 2004 3.Tag Grundlegende statistische Maße Mittelwert (mean) Durchschnitt aller Werte Varianz (variance) s 2 Durchschnittliche quadrierte Abweichung aller Werte vom Mittelwert >> Die

Mehr

Statistik I für Betriebswirte Vorlesung 9

Statistik I für Betriebswirte Vorlesung 9 Statistik I für Betriebswirte Vorlesung 9 Dr. Andreas Wünsche TU Bergakademie Freiberg Institut für Stochastik Vorlesung am 8. Juni 2017 im Audi-Max (AUD-1001) Dr. Andreas Wünsche Statistik I für Betriebswirte

Mehr

1) Warum ist die Lage einer Verteilung für das Ergebnis einer statistischen Analyse von Bedeutung?

1) Warum ist die Lage einer Verteilung für das Ergebnis einer statistischen Analyse von Bedeutung? 86 8. Lageparameter Leitfragen 1) Warum ist die Lage einer Verteilung für das Ergebnis einer statistischen Analyse von Bedeutung? 2) Was ist der Unterschied zwischen Parametern der Lage und der Streuung?

Mehr

Daten, Datentypen, Skalen

Daten, Datentypen, Skalen Bildung kommt von Bildschirm und nicht von Buch, sonst hieße es ja Buchung. Daten, Datentypen, Skalen [main types of data; levels of measurement] Die Umsetzung sozialwissenschaftlicher Forschungsvorhaben

Mehr

Grundlagen der empirischen Sozialforschung

Grundlagen der empirischen Sozialforschung Grundlagen der empirischen Sozialforschung Sitzung 11 - Datenanalyseverfahren Jan Finsel Lehrstuhl für empirische Sozialforschung Prof. Dr. Petra Stein 5. Januar 2009 1 / 22 Online-Materialien Die Materialien

Mehr

Mathematische und statistische Methoden I

Mathematische und statistische Methoden I Prof. Dr. G. Meinhardt 6. Stock, Wallstr. 3 (Raum 06-206) Sprechstunde jederzeit nach Vereinbarung und nach der Vorlesung. Mathematische und statistische Methoden I Dr. Malte Persike persike@uni-mainz.de

Mehr

Maße der zentralen Tendenz

Maße der zentralen Tendenz UStatistische Kennwerte Sagen uns tabellarische und graphische Darstellungen etwas über die Verteilung der einzelnen Werte einer Stichprobe, so handelt es sich bei statistischen Kennwerten um eine Kennzahl,

Mehr

Fachrechnen für Tierpfleger

Fachrechnen für Tierpfleger Z.B.: Fachrechnen für Tierpfleger A10. Statistik 10.1 Allgemeines Was ist Statistik? 1. Daten sammeln: Durch Umfragen, Zählung, Messung,... 2. Daten präsentieren: Tabellen, Grafiken 3. Daten beschreiben/charakterisieren:

Mehr

Variablen und Skalenniveaus

Variablen und Skalenniveaus Analytics Grundlagen Variablen und Skalenniveaus : Photo Credit: Unsplash, Roman Mager Statistik Was ist eigentlich eine Variable? Variable In der Datenanalyse wird häufig die Bezeichnung Variable verwendet.

Mehr

Analyse von Kontingenztafeln

Analyse von Kontingenztafeln Analyse von Kontingenztafeln Mit Hilfe von Kontingenztafeln (Kreuztabellen) kann die Abhängigkeit bzw. die Inhomogenität der Verteilungen kategorialer Merkmale beschrieben, analysiert und getestet werden.

Mehr

beruflicher Bildungsabschluss incl. Hochschulabschl. 4Kat.(m) Häufigkeit Prozent Gültig Lehre/Beruffachgesundh.Schule ,2 59,2 59,2

beruflicher Bildungsabschluss incl. Hochschulabschl. 4Kat.(m) Häufigkeit Prozent Gültig Lehre/Beruffachgesundh.Schule ,2 59,2 59,2 Häufigkeiten Deskriptive Statistiken Häufigkeiten Beruflicher Bildungsabschluss (Mbfbil4) Zielvariablenliste OK Er erscheint: Statistiken beruflicher Bildungsabschluss incl. N Gültig 3445 Fehlend 0 beruflicher

Mehr

Deskriptive Statistik

Deskriptive Statistik Deskriptive Statistik Deskriptive Statistik: Ziele Daten zusammenfassen durch numerische Kennzahlen. Grafische Darstellung der Daten. Quelle: Ursus Wehrli, Kunst aufräumen 1 Modell vs. Daten Bis jetzt

Mehr

Standardisierte Vorgehensweisen und Regeln zur Gewährleistung von: Eindeutigkeit Schlussfolgerungen aus empirischen Befunden sind nur dann zwingend

Standardisierte Vorgehensweisen und Regeln zur Gewährleistung von: Eindeutigkeit Schlussfolgerungen aus empirischen Befunden sind nur dann zwingend Standardisierte Vorgehensweisen und Regeln zur Gewährleistung von: Eindeutigkeit Schlussfolgerungen aus empirischen Befunden sind nur dann zwingend oder eindeutig, wenn keine alternativen Interpretationsmöglichkeiten

Mehr

Diese Lücken sollten nicht auch bei Ihnen vorhanden sein: Aufgrund einer statistischen Untersuchung entsteht eine geordnete bzw. ungeordnete, die durc

Diese Lücken sollten nicht auch bei Ihnen vorhanden sein: Aufgrund einer statistischen Untersuchung entsteht eine geordnete bzw. ungeordnete, die durc SS 2017 Torsten Schreiber 222 Diese Lücken sollten nicht auch bei Ihnen vorhanden sein: Aufgrund einer statistischen Untersuchung entsteht eine geordnete bzw. ungeordnete, die durch Summierung je Ausprägung

Mehr

3 Lage- und Streuungsmaße

3 Lage- und Streuungsmaße 3 Lage- und Streuungsmaße Grafische Darstellungen geben einen allgemeinen Eindruck der Verteilung eines Merkmals, u.a. von Lage und Zentrum der Daten, Streuung der Daten um dieses Zentrum, Schiefe / Symmetrie

Mehr

Statistik und Wahrscheinlichkeitsrechnung

Statistik und Wahrscheinlichkeitsrechnung Statistik und Wahrscheinlichkeitsrechnung 3. Vorlesung Dr. Jochen Köhler 1 Inhalte der heutigen Vorlesung Ziel: Daten Modellbildung Probabilistisches Modell Wahrscheinlichkeit von Ereignissen Im ersten

Mehr

Das harmonische Mittel

Das harmonische Mittel Das harmonische Mittel x H := 1 1 n n 1 x i Das harmonische Mittel entspricht dem Mittel durch Transformation t 1 t Beispiel: x 1,..., x n Geschwindigkeiten, mit denen konstante Wegstrecken l zurückgelegt

Mehr

Übung 1 im Fach "Biometrie / Q1"

Übung 1 im Fach Biometrie / Q1 Universität Ulm, Institut für Epidemiologie und Medizinische Biometrie, D-89070 Ulm Institut für Epidemiologie und Medizinische Biometrie Leiter: Prof. Dr. D. Rothenbacher Schwabstr. 13, 89075 Ulm Tel.

Mehr

Deskriptive Statistik. (basierend auf Slides von Lukas Meier)

Deskriptive Statistik. (basierend auf Slides von Lukas Meier) Deskriptive Statistik (basierend auf Slides von Lukas Meier) Deskriptive Statistik: Ziele Daten zusammenfassen durch numerische Kennzahlen. Grafische Darstellung der Daten. Quelle: Ursus Wehrli, Kunst

Mehr

Beispiel für Anwendung: z-tabelle kann genutzt werden, um z.b. Poissonverteilung näherungsweise zu integrieren. Beispiel: wie wahrscheinlich ist es

Beispiel für Anwendung: z-tabelle kann genutzt werden, um z.b. Poissonverteilung näherungsweise zu integrieren. Beispiel: wie wahrscheinlich ist es Beispiel für Anwendung: z-tabelle kann genutzt werden, um z.b. Poissonverteilung näherungsweise zu integrieren. Beispiel: wie wahrscheinlich ist es beim radioaktiven Zerfall, zwischen 100 und 110 Zerfälle

Mehr

Beschreibung von Daten

Beschreibung von Daten Kapitel 2 Beschreibung von Daten In diesem Kapitel geht es um die Beschreibung von empirisch erhobenen Daten Größere Datenmengen sind schwer zu überblicken Weil ein Bild leichter als eine Ansammlung von

Mehr

5 Assoziationsmessung in Kontingenztafeln

5 Assoziationsmessung in Kontingenztafeln 5 Assoziationsmessung in Kontingenztafeln 51 Multivariate Merkmale 51 Multivariate Merkmale Gerade in der Soziologie ist die Analyse eindimensionaler Merkmale nur der allererste Schritt zur Beschreibung

Mehr

Statistische Grundlagen I

Statistische Grundlagen I Statistische Grundlagen I Arten der Statistik Zusammenfassung und Darstellung von Daten Beschäftigt sich mit der Untersuchung u. Beschreibung von Gesamtheiten oder Teilmengen von Gesamtheiten durch z.b.

Mehr

Deskriptive Statistik

Deskriptive Statistik Deskriptive Statistik [descriptive statistics] Ziel der deskriptiven (beschreibenden) Statistik einschließlich der explorativen Datenanalyse [exploratory data analysis] ist zunächst die übersichtliche

Mehr

Analyse von Querschnittsdaten. Arten von Variablen und Strategien der Datenanalyse

Analyse von Querschnittsdaten. Arten von Variablen und Strategien der Datenanalyse Analyse von Querschnittsdaten Arten von Variablen und Strategien der Datenanalyse Gliederung 1. Arten von Variablen 2. Analyse einzelner Variablen (univariate Verteilungen) 3. Analyse der Zusammenhänge

Mehr

Teil / Ein paar statistische Grundlagen 25. Kapitel 1 Was Statistik ist und Warum sie benötigt Wird 2 7

Teil / Ein paar statistische Grundlagen 25. Kapitel 1 Was Statistik ist und Warum sie benötigt Wird 2 7 Inhaltsverzeichnis Einführung 21 Über dieses Buch 21 Törichte Annahmen über den Leser 22 Wie dieses Buch aufgebaut ist 23 Teil I: Ein paar statistische Grundlagen 23 Teil II: Die beschreibende Statistik

Mehr

Statistik I für Humanund Sozialwissenschaften

Statistik I für Humanund Sozialwissenschaften Statistik I für Humanund Sozialwissenschaften 1 Übung Lösungsvorschlag Gruppenübung G 1 Auf einer Touristeninsel in der Karibik wurden in den letzten beiden Juliwochen morgens zur gleichen Zeit die folgenden

Mehr

STATISTIK I Übung 04 Spannweite und IQR. 1 Kurze Wiederholung. Was sind Dispersionsparameter?

STATISTIK I Übung 04 Spannweite und IQR. 1 Kurze Wiederholung. Was sind Dispersionsparameter? STATISTIK I Übung 04 Spannweite und IQR 1 Kurze Wiederholung Was sind Dispersionsparameter? Die sogenannten Dispersionsparameter oder statistischen Streuungsmaße geben Auskunft darüber, wie die Werte einer

Mehr

Deskriptive Statistik

Deskriptive Statistik Deskriptive Statistik 1 Ziele In der deskriptiven (=beschreibenden) Statistik werden Untersuchungsergebnisse übersichtlich dargestellt, durch Kennzahlen charakterisiert und grafisch veranschaulicht. 2

Mehr

Statistik II: Grundlagen und Definitionen der Statistik

Statistik II: Grundlagen und Definitionen der Statistik Medien Institut : Grundlagen und Definitionen der Statistik Dr. Andreas Vlašić Medien Institut (0621) 52 67 44 vlasic@medien-institut.de Gliederung 1. Hintergrund: Entstehung der Statistik 2. Grundlagen

Mehr

Verteilungsfunktion und Quantile

Verteilungsfunktion und Quantile Statistik 1 für SoziologInnen Verteilungsfunktion und Quantile Univ.Prof. Dr. Marcus Hudec Kumulierte Häufigkeiten Hinweis: Damit das Kumulieren inhaltlich sinnvoll ist, muss das Merkmal zumindest ordinal

Mehr

Anteile Häufigkeiten Verteilungen Lagemaße Streuungsmaße Merkmale von Verteilungen. Anteile Häufigkeiten Verteilungen

Anteile Häufigkeiten Verteilungen Lagemaße Streuungsmaße Merkmale von Verteilungen. Anteile Häufigkeiten Verteilungen DAS THEMA: VERTEILUNGEN LAGEMAßE - STREUUUNGSMAßE Anteile Häufigkeiten Verteilungen Lagemaße Streuungsmaße Merkmale von Verteilungen Anteile Häufigkeiten Verteilungen Anteile und Häufigkeiten Darstellung

Mehr

5 Exkurs: Deskriptive Statistik

5 Exkurs: Deskriptive Statistik 5 EXKURS: DESKRIPTIVE STATISTIK 6 5 Ekurs: Deskriptive Statistik Wir wollen zuletzt noch kurz auf die deskriptive Statistik eingehen. In der Statistik betrachtet man für eine natürliche Zahl n N eine Stichprobe

Mehr

Einführung in SPSS. Sitzung 4: Bivariate Zusammenhänge. Knut Wenzig. 27. Januar 2005

Einführung in SPSS. Sitzung 4: Bivariate Zusammenhänge. Knut Wenzig. 27. Januar 2005 Sitzung 4: Bivariate Zusammenhänge 27. Januar 2005 Inhalt der letzten Sitzung Übung: ein Index Umgang mit missing values Berechnung eines Indexes Inhalt der letzten Sitzung Übung: ein Index Umgang mit

Mehr

Streuungsmaße von Stichproben

Streuungsmaße von Stichproben Streuungsmaße von Stichproben S P A N N W E I T E, V A R I A N Z, S T A N D A R D A B W E I C H U N G, Q U A R T I L E, K O V A R I A N Z, K O R R E L A T I O N S K O E F F I Z I E N T Zentrale Methodenlehre,

Mehr

Forschungsstatistik I

Forschungsstatistik I Psychologie Prof. Dr. G. Meinhardt 6. Stock, TB II R. 06-206 (Persike) R. 06-321 (Meinhardt) Sprechstunde jederzeit nach Vereinbarung Forschungsstatistik I Dr. Malte Persike persike@uni-mainz.de http://psymet03.sowi.uni-mainz.de/

Mehr

Lage- und Streuungsparameter

Lage- und Streuungsparameter Lage- und Streuungsparameter Beziehen sich auf die Verteilung der Ausprägungen von intervall- und ratio-skalierten Variablen Versuchen, diese Verteilung durch Zahlen zu beschreiben, statt sie graphisch

Mehr

Statistik I für Betriebswirte Vorlesung 9

Statistik I für Betriebswirte Vorlesung 9 Statistik I für Betriebswirte Vorlesung 9 Prof. Dr. Hans-Jörg Starkloff TU Bergakademie Freiberg Institut für Stochastik 06. Juni 2016 Prof. Dr. Hans-Jörg Starkloff Statistik I für Betriebswirte Vorlesung

Mehr

I.V. Methoden 2: Deskriptive Statistik WiSe 02/03

I.V. Methoden 2: Deskriptive Statistik WiSe 02/03 I.V. Methoden 2: Deskriptive Statistik WiSe 02/03 Vorlesung am 04.11.2002 Figures won t lie, but liars will figure. General Charles H.Grosvenor Dr. Wolfgang Langer Institut für Soziologie Martin-Luther-Universität

Mehr

W-Seminar: Versuche mit und am Menschen 2017/2019 Skript

W-Seminar: Versuche mit und am Menschen 2017/2019 Skript 3. Deskriptive Statistik Die deskriptive (auch: beschreibende) Statistik hat zum Ziel, [ ] Daten durch Tabellen, Kennzahlen [ ] und Grafiken übersichtlich darzustellen und zu ordnen. Dies ist vor allem

Mehr

Wirtschaftswissenschaftliches Prüfungssekretariat Bachelor-Prüfung Deskriptive Statistik und Wahrscheinlichkeitsrechnung Sommersemester 2015

Wirtschaftswissenschaftliches Prüfungssekretariat Bachelor-Prüfung Deskriptive Statistik und Wahrscheinlichkeitsrechnung Sommersemester 2015 Wirtschaftswissenschaftliches Prüfungssekretariat Bachelor-Prüfung Deskriptive Statistik und Wahrscheinlichkeitsrechnung Sommersemester 205 Namensschild Dr. Martin Becker Hinweise für die Klausurteilnehmer

Mehr

3 Lage- und Streuungsmaße

3 Lage- und Streuungsmaße 3 Lage- und Streuungsmaße 3.0 Kumulierte Häufigkeiten und empirische Verteilungsfunktion Grafische Darstellungen geben einen allgemeinen Eindruck der Verteilung eines Merkmals: Lage und Zentrum der Daten,

Mehr

PROC MEANS. zum Berechnen statistischer Maßzahlen (für quantitative Merkmale)

PROC MEANS. zum Berechnen statistischer Maßzahlen (für quantitative Merkmale) PROC MEAS zum Berechnen statistischer Maßzahlen (für quantitative Merkmale) Allgemeine Form: PROC MEAS DATA=name Optionen ; VAR variablenliste ; CLASS vergleichsvariable ; Beispiel und Beschreibung der

Mehr

Einführung in die Statistik für Wirtschaftswissenschaftler für Betriebswirtschaft und Internationales Management

Einführung in die Statistik für Wirtschaftswissenschaftler für Betriebswirtschaft und Internationales Management Einführung in die Statistik für Wirtschaftswissenschaftler für Betriebswirtschaft und Internationales Management Sommersemester 03 Hochschule Augsburg : Gliederung Einführung Deskriptive Statistik 3 Wahrscheinlichkeitstheorie

Mehr

Grundlagen der Wahrscheinlichkeitstheorie und Statistik für Studierende der Informatik

Grundlagen der Wahrscheinlichkeitstheorie und Statistik für Studierende der Informatik INSTITUT FÜR STOCHASTIK WS 2007/08 UNIVERSITÄT KARLSRUHE Blatt 1 Dr. B. Klar Übungen zur Vorlesung Grundlagen der Wahrscheinlichkeitstheorie und Statistik für Studierende der Informatik Musterlösungen

Mehr

Quantitative Analyseverfahren

Quantitative Analyseverfahren Markus Tausendpfund et al. Quantitative Analyseverfahren Eine Einführung Fakultät für Kultur- und Sozialwissenschaften Das Werk ist urheberrechtlich geschützt. Die dadurch begründeten Rechte, insbesondere

Mehr

Hypothesentests mit SPSS

Hypothesentests mit SPSS Beispiel für eine zweifaktorielle Varianzanalyse mit Messwiederholung auf einem Faktor (univariate Lösung) Daten: POKIII_AG4_V06.SAV Hypothese: Die physische Attraktivität der Bildperson und das Geschlecht

Mehr

Statistik eindimensionaler Größen

Statistik eindimensionaler Größen Statistik eindimensionaler Größen Michael Spielmann Inhaltsverzeichnis 1 Aufgabe der eindimensionalen Statistik 2 2 Grundbegriffe 2 3 Aufbereiten der Stichprobe 3 4 Die Kennzahlen Mittelwert und Streuung,

Mehr

Modul 04: Messbarkeit von Merkmalen, Skalen und Klassierung. Prof. Dr. W. Laufner Beschreibende Statistik

Modul 04: Messbarkeit von Merkmalen, Skalen und Klassierung. Prof. Dr. W. Laufner Beschreibende Statistik Modul 04: Messbarkeit von Merkmalen, Skalen und 1 Modul 04: Informationsbedarf empirische (statistische) Untersuchung Bei einer empirischen Untersuchung messen wir Merkmale bei ausgewählten Untersuchungseinheiten

Mehr

fh management, communication & it Constantin von Craushaar fh-management, communication & it Statistik Angewandte Statistik

fh management, communication & it Constantin von Craushaar fh-management, communication & it Statistik Angewandte Statistik fh management, communication & it Folie 1 Überblick Grundlagen (Testvoraussetzungen) Mittelwertvergleiche (t-test,..) Nichtparametrische Tests Korrelationen Regressionsanalyse... Folie 2 Überblick... Varianzanalyse

Mehr

Inhaltsverzeichnis. Teil I Einführung

Inhaltsverzeichnis. Teil I Einführung Teil I Einführung 1 Was ist Statistik?... 3 1.1 Der Begriff Statistik..................................... 3 1.2 Wozu Statistik?......................................... 4 1.3 Grundbegriffe...........................................

Mehr