Deskriptive Statistik



Ähnliche Dokumente
Statistische Grundlagen I

Statistik K urs SS 2004

Kapitel 5 Kenngrößen empirischer Verteilungen 5.1. Lagemaße. x mod (lies: x-mod) Wofür? Lageparameter. Modus/ Modalwert Zentrum. Median Zentralwert

1. Maße der zentralen Tendenz Beispiel: Variable Anzahl der Geschwister aus Jugend '92. Valid Cum Value Frequency Percent Percent Percent

Lage- und Streuungsparameter

Anteile Häufigkeiten Verteilungen Lagemaße Streuungsmaße Merkmale von Verteilungen. Anteile Häufigkeiten Verteilungen

Mittelwert und Standardabweichung

3.2 Streuungsmaße. 3 Lage- und Streuungsmaße 133. mittlere Variabilität. geringe Variabilität. große Variabilität

Graphische Darstellung einer univariaten Verteilung:

Wiederholung Statistik I. Statistik für SozialwissenschaftlerInnen II p.8

Bitte am PC mit Windows anmelden!

Statistik II: Grundlagen und Definitionen der Statistik

Inferenzstatistik (=schließende Statistik)

Maße der zentralen Tendenz

Analytische Statistik II

Kapitel 1: Deskriptive Statistik

Einführung in Quantitative Methoden

W-Seminar: Versuche mit und am Menschen 2017/2019 Skript

Parametrische vs. Non-Parametrische Testverfahren

Herzlich willkommen zum Thema SPSS

Statistik und Wahrscheinlichkeitsrechnung

Das arithmetische Mittel. x i = = 8. x = 1 4. und. y i = = 8

Einführung in Quantitative Methoden

N

Häufigkeitsverteilungen und Statistische Maßzahlen. Häufigkeitsverteilungen und Statistische Maßzahlen. Variablentypen. Stichprobe und Grundgesamtheit

Deskriptivstatistik a) Univariate Statistik Weiters zum Thema der statistischen Informationsverdichtung

Lösungen. w58r4p Lösungen. w58r4p. Name: Klasse: Datum:

Signifikanztests zur Prüfung von Unterschieden in der zentralen Tendenz -Teil 1-

Deskriptive Statistik Kapitel IX - Kontingenzkoeffizient

Statistik I. Methodologie der Psychologie

Herzlich willkommen zur Vorlesung Statistik. Streuungsmaße oder die Unterschiedlichkeit der Daten nebst kurzen Ausführungen zu Schiefe und Wölbung

Deskription, Statistische Testverfahren und Regression. Seminar: Planung und Auswertung klinischer und experimenteller Studien

htw saar 1 EINFÜHRUNG IN DIE STATISTIK: BESCHREIBENDE STATISTIK

STATISTIK FÜR STATISTIK-AGNOSTIKER Teil 1 (wie mich)

Univ.-Prof. Dr. Georg Wydra

Streuungsmaße von Stichproben

Lagemasse und Streuung

Methodenlehre. Vorlesung 10. Prof. Dr. Björn Rasch, Cognitive Biopsychology and Methods University of Fribourg

ÜBUNGSAUFGABEN ZU INFERENZSTATISTIK II

Inhaltsverzeichnis. 1 Über dieses Buch Zum Inhalt dieses Buches Danksagung Zur Relevanz der Statistik...

Häufigkeitsauszählungen, zentrale statistische Kennwerte und Mittelwertvergleiche

1 45, 39, 44, 48, 42, 39, 40, , 31, 46, 35, 31, 42, 51, , 42, 33, 46, 33, 44, 43

11. Sitzung Auswertungsstrategien; Darstellung von Forschungsergebnissen

Kenngrößen von Zufallsvariablen

Kennwerte zur Charakterisierung von Datenreihen. Mittelwerte

Hypothesentests mit SPSS. Beispiel für eine einfaktorielle Varianzanalyse Daten: museum_m_v05.sav

Klausur Statistik I Dr. Andreas Voß Wintersemester 2005/06

1.1 Graphische Darstellung von Messdaten und unterschiedliche Mittelwerte. D. Horstmann: Oktober

Sommersemester Marktforschung

TEIL 7: EINFÜHRUNG UNIVARIATE ANALYSE TABELLARISCHE DARSTELLUNG / AUSWERTUNG

Teil / Ein paar statistische Grundlagen 25. Kapitel 1 Was Statistik ist und Warum sie benötigt Wird 2 7

Univariate Häufigkeitsverteilungen Kühnel, Krebs 2001: Statistik für die Sozialwissenschaften, S.41-66

Konfidenzintervall für den Anteilswert θ. Konfidenzintervalle. Jost Reinecke. Universität Bielefeld. 13. Juni 2005

Mittelwertvergleiche, Teil II: Varianzanalyse

Gundlagen empirischer Forschung & deskriptive Statistik. Statistische Methoden in der Korpuslinguistik Heike Zinsmeister WS 2008/09

Statistik eindimensionaler Größen

beruflicher Bildungsabschluss incl. Hochschulabschl. 4Kat.(m) Häufigkeit Prozent Gültig Lehre/Beruffachgesundh.Schule ,2 59,2 59,2

Dr. Reinhard Vonthein, Dipl. Statistiker (Univ.)

Deskriptive Statistik

Teil I: Deskriptive Statistik

TEIL 13: DIE EINFACHE LINEARE REGRESSION

Deskriptive Statistik Erläuterungen

absolute Häufigkeit h: Anzahl einer bestimmten Note relative Häufigkeit r: Anzahl einer bestimmten Note, gemessen an der Gesamtzahl der Noten

Chi-Quadrat Verfahren

3) Lagemaße: Mittelwert, Median, Modus

Wahrscheinlichkeitsverteilungen

Deskriptive Statistik Beschreiben, Zusammenfassen, Darstellen gegebener Daten (Datenreduktion!)

Einfache Varianzanalyse für unabhängige Stichproben

2. Deskriptive Statistik

Mathematische und statistische Methoden II

Fachrechnen für Tierpfleger

ÜBUNGSAUFGABEN ZUR DESKRIPTIVEN UND EXPLORATIVEN DATENANALYSE

Diese Lücken sollten nicht auch bei Ihnen vorhanden sein: Aufgrund einer statistischen Untersuchung entsteht eine geordnete bzw. ungeordnete, die durc

Lage- und Streuungsmaße

Kapitel 1: Deskriptive Statistik

Messung von Rendite und Risiko. Finanzwirtschaft I 5. Semester

Statistik. Jan Müller

= = =0,2=20% 25 Plätze Zufallsübereinstimmung: 0.80 x x 0.20 = %

Modul G.1 WS 07/08: Statistik

fh management, communication & it Constantin von Craushaar fh-management, communication & it Statistik Angewandte Statistik

Von der Normalverteilung zu z-werten und Konfidenzintervallen

Wiederholung. Statistik I. Sommersemester 2009

3. Lektion: Deskriptive Statistik

Mittelwertvergleiche, Teil I: Zwei Gruppen

Methodenlehre. Vorlesung 10. Prof. Dr. Björn Rasch, Cognitive Biopsychology and Methods University of Fribourg

Statistik für SozialwissenschaftlerInnen II p.85

Grundlagen der empirischen Sozialforschung

Es können keine oder mehrere Antworten richtig sein. Eine Frage ist NUR dann richtig beantwortet, wenn ALLE richtigen Antworten angekreuzt wurden.

Deskriptive Statistik

Weitere Lagemaße: Quantile/Perzentile I

Deskriptive Statistik & grafische Darstellung

3. Deskriptive Statistik

= 3. Kapitel 4: Normalverteilung.. und Standardnormalverteilung und: das Konfidenzintervall..

Transkript:

Modul G.1 WS 07/08: Statistik 8.11.2006 1 Deskriptive Statistik Unter deskriptiver Statistik versteht man eine Gruppe statistischer Methoden zur Beschreibung von Daten anhand statistischer Kennwerte, Graphiken, Diagramme und/oder Tabellen. Ziel Die deskriptive Statistik beschreibt und analysiert Merkmalseigenschaften in einer bestimmten Stichprobe zum Erhebungszeitpunkt der Daten, so dass Aussagen über genau jene Objekte gemacht werden, welche tatsächlich untersucht wurden. Beispiel Wenn an einem Tag das Alter aller Patienten in einem Krankenhaus erhoben wurde, können mit Hilfe einer deskriptiven Statistik Aussagen über das Alter der Patienten an genau diesem Tag in genau diesem Krankenhaus gemacht werden. Klingt trivial wir alle haben uns an diese Art der Beschreibung der messbaren Wirklichkeit gewöhnt. (Arbeitslosenzahlen, Verkehrstote etc.) Schließende Statistik (Inferenzstatistik) schließt aus den Daten einer Stichprobe auf Werte in der Population. Z.B. Einschätzung der Altersstruktur in anderen Krankenhäusern. So eine Schätzung ist immer nur mit einer gewissen Fehlerwahrscheinlichkeit möglich. Wie kommen wir zu unseren Daten? Wir messen. Danach können wir analysieren und interpretieren, d.h. Schlüsse über die reale Welt ziehen. Um mit Hilfe von statistischen Methoden analysieren und interpretieren zu können müssen wir unsere Messungen in Merkmalsausprägungen und Variablen umwandeln. z.b. männlich = 1 und weiblich =0. Was sind Merkmale und Variablen? Ein Merkmal ist eine Eigenschaft, die zu einem Objekt oder einer Person gehört und eine bestimmte Anzahl von Merkmalsausprägungen hat. Es wird versucht diese Merkmale durch Messungen in Zahlen zu überführen. Merkmale, die in Zahlen überführt wurden, werden als Variablen bezeichnet. Es wird zwischen qualitativen und quantitativen Merkmalen unterschieden: Qualitative Merkmale Mit qualitativen Merkmalen wird die Zugehörigkeit zu einer Kategorie beschrieben. z.b. Geschlecht entweder/oder Quantitative Merkmale: Quantitative Merkmale beschreiben die Ausprägung eines Objekts oder einer Person in diesem Merkmal. Dies geschieht auf einem Kontinuum von Werten. Z.B. Körpergröße. Jede Person hat zum Messzeitpunkt einen bestimmten Wert. Hinweis: Skalen. Qualitative Merkmale > Nominalskala. Quantitative Merkmale: höhere Skalen. (Ordinal, Intervall und Verhältnis) Eine Variable ist ein in Zahlen überführtes Merkmal. Diese Überführung wird auch Operationalisierung genannt.

Modul G.1 WS 07/08: Statistik 8.11.2006 2 Es gibt zwei Arten von Variablen, die sich parallel zu qualitativen und quantitativen Merkmalen verhalten: Diskrete Variablen Merkmale bei denen nur endlich viele, bzw. abzählbar unendlich viele Ausprägungen möglich sind werden in diskrete Variablen überführt. Es gibt keine Zwischenstufen zwischen zwei Kategorien. Beispiele: Parteizugehörigkeit, Berufe, Pflanzenarten Kontinuierliche Variablen Kontinuierliche Variablen können (zumindest) theoretisch auf einem beliebig genauen Kontinuum beschrieben werden. Beispiel: Körpergröße, Reaktionszeiten, Lautdauern Wie kommen wir zu unseren Variablen? Durch Messen. Messen ist also eine Zuordnung von Objekten zu Zahlen. Die Relationen zwischen den gemessenen Zahlen reflektieren dann die analogen Relationen zwischen den Objekten. Maße der zentralen Tendenz und der Dispersion Maße der zentralen Tendenz und der Dispersion stellen Beschreibungen der Verteilung der Messwerte einer Variablen dar. Z.B die Mitte einer Menge von Werten oder die Streuung von Werten. D.h. letzlich wird die Verteilungsform dargestellt. Maße der zentralen Tendenz Modalwert oder Modus (engl. mode) Der Modalwert ist derjenige Wert einer Verteilung, welcher am häufigsten besetzt ist. Eigenschaften stabil gegenüber Extremwerten (erklären > Ausreißer) kann für alle Skalenniveaus verwendet werden Maximum einer Verteilung unimodale vs. bimodale vs. multimodale Verteilungen wird oft bei nominalskalierten Daten und bei Daten mit asymmetrischer Verteilung verwendet Bsp. gehörte Kategorie

Modul G.1 WS 07/08: Statistik 8.11.2006 3 Median Der Median ist derjenige Wert, der die geordnete Reihe der Messwerte in die oberen und unteren 50 Prozent aufteilt. Somit ist die Anzahl der Messwerte über und unter dem Median gleich. Beispiel Bei 17 Personen belegt die neunte (17+1/2) den Median. Bei 16 Personen wird der Median über den Mittelwert zwischen der achten und der neunten Person der Rangreihe berechnet. Eigenschaften Anzahl der Messwerte über und unter dem Median ist gleich (entspricht einem Prozentrang von 50) mindestens Ordinalskalenniveau stabil gegenüber Extremwerten Arithmetisches Mittel (mean, arithmetic average) Das arithmetische Mittel ist die Summe aller Messwerte, geteilt durch deren Anzahl N. Beim artihmetischen Mittel handelt es sich um den Durchschnitt aller Messwerte.

Modul G.1 WS 07/08: Statistik 8.11.2006 4 Das Rechnen mit dem Summenzeichen (Sigma). Das Summenzeichen ermöglicht eine kürzere Schreibweise für additive Verknüpfungen. Die sog. Zählervariable i gibt den Startwert einer Addition an, er ist hier 1. N ist die obere Grenze der Summe, sozusagen der Endwert. Hinter dem Summenzeichen wird der zu addierende Term angegeben. D.h. obige Formel würde in Langschreibweise folgendermaßen aussehen: x = x 1 + x 2 + x 3 +..+ x n N Eigenschaften Summe der Zentralen Momente ergibt Null. Zentrales Moment= (xi x ) Formel: N i=1 xi x = 0 Bei kleinen Stichproben sehr abhängig von Extremwerten Die Daten müssen mindestens intervallskaliert sein. Gewichtete arithmetische Mittel Gewichtete artihmetische Mittel werden sinnvoll, wenn ein Gesamtmittelwert aus verschiedenen Stichproben unterschiedlicher Größe gebildet werden soll. : Beim Gewichteten arithmetischen Mittel (GAM) werden die einzelnen Gruppenmittelwerte an der jeweiligen Gruppengröße gewichtet. Vergleich Modus, Median und Mittelwert

Modul G.1 WS 07/08: Statistik 8.11.2006 5 Maße der Dispersion Mittelwerte sind Maße der Mitte von Verteilungen. Nun soll die Variabilität oder auch Streuung von Verteilungen definiert werden. Variationsbreite (range) Der Range, die Spannweite, beschreibt bei kontinuierlichen Daten Differenz zwischen Maximum und Minimum; bei nominalskalierten Daten die Anzahl der Kategorien Vorteile sehr einfach zu berechnen kann für alle Skalenniveaus verwendet werden Nachteile sehr abhängig von nur 2 Werten keine Aussage über die dazwischen liegenden Werte kann nicht für theoretische Verteilungen verwendet werden, da z.b. die Normalverteilung für einen Bereich von definiert ist. Quartile, Interquartilabstand (interquartile range) Als Quartile werden jene Punkte Q 1, Q 2 und Q 3 bezeichnet, welche eine Verteilung in vier gleich große Abschnitte aufteilen. Das mittlere Quartil Q 2 entspricht dem Median, das untere Quartil Q 1 einem Prozentrang von 25 und das obere Quartil Q 3 von 75. Die Differenz von Q 3 und Q 1 wird als Interquartilabstand (IQA) bezeichnet.

Frequency 0 5 10 15 Modul G.1 WS 07/08: Statistik 8.11.2006 6 Vorteile Kann auch auf ordinalskalierte Daten angewendet werden. Der Interquartilabstand bezieht sich nur auf die mittleren 50 % der Daten, weshalb Ausreißer keine Rolle spielen. Nachteil Q1 Median Q3 Die Werte außerhalb 300 werden 350 nicht berücksichtigt. 400 450 Varianz (variance) formants$f1 Quadrieren, da einfache Summe null ergeben würde unterschiedliche Stichproben können verglichen werden Mittelwert aller Abweichungsquadrate Unterschied Population (griechische Buchstaben) und Stichprobe (lateinische Buchstaben) (Wir können oft nicht die gesamte Population untersuchen (z.b. alle Sprecher des Deutschen), so müssen wir von einer Stichprobe ausgehen und übertragen die Ergebnisse auf die Gesamtpopulation. > Wir machen Vorhersagen. Freiheitsgrade (degrees of freedom): beschreibt die Anzahl der frei wählbaren Werte. Durch die Berechnung eines Kennwerts aus N Messwerten wird ein Messwert unfrei. Beispiel Wenn vier Freunde um Geld gespielt haben: Der erste sagt er habe 20 Euro gewonnen, Der zweite sagt: 20 Euro verloren, der dritte: 10 Euro gewonnen, dann MUSS der vierte 10 Euro verloren haben. Der Messwert wird unfrei. Also: df=n-1 Im Prinzip führt das Rechnen mit N-1 zu einer größeren Varianz (vorsichtige oder auch konservative Schätzung). Die Varianz mit N-1 wird natürlich bei zunehmender Stichprobengröße N immer ähnlicher.

Modul G.1 WS 07/08: Statistik 8.11.2006 7 Standardabweichung(standard deviation) Durch das Quadrieren der Werte bei der Berechnung der Varianz ensteht ein schwierig zu interpretierender Kennwert. Deshalb wird die Wurzel aus der Varianz gezogen und so die Standardabweichung (Streuung des Mittelwerts) berechnet. Die Standardabweichnung hat so auch wieder die gleiche physikalische Einheit wie das arithmetische Mittel. Da die Abweichungen für die Varianz quadriert wurden, muss die Wurzel gezogen werden, um wieder die gleiche physikalische Einheit der Messwerte zu erhalten. Variabilitätskoeffizient Die Standardabweichung hängt von der Größe des Mittelswert ab, d.h. je größer der Mittelwert umso größer auch die Standardabweichung. Um feststellen zu können, ob zwei Stichproben mit sehr unterschiedlichen Mittelwerten unterschiedlich stark streuen, wird der Variabilitätskoeffizient berechnet. Der Variabilitätskoeffizient gibt an, wie viel Prozent des arithmetischen Mittels die Standardabweichung beträgt. sx 100 x Beispiel Zwei Psychologen testen soziale Kompetenz mit unterschiedlichen Fragebögen an der selben Gruppe. Beide Fragebögen ergeben einen verhältnisskalierten Messwert. Die Befragungen ergeben unterschiedliche Mittelwerte und Standardabweichungen. Der Variabilitätskoeffizient kann klären, welche Erhebung eine größere Streuung hat.

Modul G.1 WS 07/08: Statistik 8.11.2006 8 Ein Überblick zu den Maßen Die folgende Tabelle gibt einen Überblick zu den vorausgesetzten Skalenniveaus bei den verschiedenen Lage- und Streuungsmaßen Maß Nominal Ordinal Intervall Verhältnis Häufigkeit + + + + Modalwert + + + + Range + + + + Quartile - + + + Median - + + + Arithmetisches Mittel - - + + Varianz - - + + Standardabweichung - - + + Variabilitätskoeffizient - - - +