3 Deskriptive Statistik in R (univariat)

Größe: px
Ab Seite anzeigen:

Download "3 Deskriptive Statistik in R (univariat)"

Transkript

1 (univariat) Markus Burkhardt Inhalt 3.1 Ziel Häufigkeiten Deskriptive Kennziffern I Lagemaße Streuungsmaße Standardisierung: z-werte Weiterführende Deskriptive Statistik Literatur Ziel In diesem Kapitel zeigen wir Ihnen die Grundtechniken der deskriptiven Datenanalyse in R. Ziel einer deskriptiven Analyse ist es, Variablen bzw. Datenreihen so zu beschreiben, dass möglichst viele Information in einer möglichst kleinen Menge an Zahlen ausgedrückt wird. Letztlich geht es also darum nicht die gesamte Zahlenreihe zu berichten, sondern einzelne Kennziffern die etwas über die Beschaffenheit der Zahlenreihe aussagen. Allerdings ist die Aussagekraft stets an bestimmte Bedingungen geknüpft wie das Skalenniveau oder die Verteilung der Daten. Genau diese Bedingungen können Gegenstand der explorativen Datenanalyse. Die deskriptiven Kennziffern bieten des Weiteren die Grundlage für grafische Explorationsverfahren, die wir im nächsten Kapitel vorstellen 3.2 Häufigkeiten Das Auszählen von Häufigkeiten ist wohl die einfachste Form der deskriptiven Statistik. Ob diese Art der Analyse sinnvoll ist, hängt natürlich von der Struktur Ihrer Daten ab. Insbesondere für nominal- und ordinalskalierte Daten bieten sich Häufigkeitsanalysen an. Aber auch für intervallskalierte Daten kann eine Häufigkeitsanalyse sinnvoll sein. Wir führen zunächst eine Häufigkeitsanalyse für das Geschlecht in der Datei bsp01 durch, um herauszufinden, wie viele Männer und Frauen in unserem Beispieldatensatz vorhanden sind. Die Grundlage für Häufigkeitsanalysen bietet die Funktion table().das Ergebnis wird in der R-Console ausgegeben (Abb. 1). Die table() Funktion schließt standardmäßig NA-Werte aus. > table(bsp01$sex) female male Abbildung 1. Häufigkeitstabelle in R. 1

2 Durch die Eingabe mehrere Objekte, erhalten Sie mehrdimensionale Tabellen. Eine solche Darstellung, kann die Häufigkeit des Geschlechts in Abhängigkeit der Körpergröße sein. Dazu sollte die Körpergröße für eine bessere Übersichtlichkeit kategorisiert werden. Beispielsweise wollen wir die Körpergröße in zwei Kategorien einteilen, Menschen die kleiner als zwei Meter sind und Menschen die größer als zwei Meter sind. Die Funktion cut() bildet neue Kategorien. Wenn Sie sich die Hilfe zu dieser Funktion ansehen help(cut), sehen Sie, dass die Argumente x und breaks definiert werden müssen. (Die anderen Argumente sind vordefiniert. Sie können aber natürlich auch diese Werte spezifisch einstellen.) Dem Argument x weisen Sie Ihr Objekt zu, welches in kategorisiert werden soll und dem Argument breaks die Grenzwerte in Form einer Variable (Abb. 2). Wenn Sie eine Tabelle als Objekt speichern, sehen Sie, dass auch Tabellen eine eigene Objekt-Klasse in R sind. Für diese Klasse gibt es einige weitere sehr nützliche Funktionen. Wenn Sie lediglich an dem häufigsten Wert (dem Modalwert), nicht aber an der gesamten Häufigkeitstabelle interessiert sind, können Sie die Funktion which.max() anwenden. Diese gibt den Index des größten Wertes eines R-Objektes zurück. Im Falle eines Objektes der Klasse table, die entsprechende Kategorie. Allerdings wird bei mehreren Maxima nur das jeweils Erste Maximum ausgegeben. Mit Hilfe von barplot() können Sie sehr schnell eine Häufigkeitsverteilung grafisch darstellen (wir gehen auf diese Funktion ausführlicher im nächsten Kapitel ein). Die Funktion prop.table() ermöglicht es Ihnen, relative Anteile darzustellen. Natürlich können Sie auch arithmetische Operationen oder Indizierungen in Tabellen vornehmen (Beispiele in Abbildung 2). Einen guten Überblick über den Umgang mit Tabellen gibt auch die Internetseite: # Häufigkeitsanalyse mit der Funktion table() # Häufigkeitstabelle für das Geschlecht table(bsp01$sex) # Kategorisierung der Variable height in 2 Gruppen, # von 0 bis einschließlich 200 und größer 200 bis 250 # mit entsprechenden lables height_kategorien <- cut(x=bsp01$height, breaks=c(0,200,250), labels=c("kleiner/gleich 200 cm", "groesser 200 cm") ) # Mehrdimensionale Tabelle aus Geschlecht und der kategoriserten Körpergröße table(bsp01$sex, height_kategorien) # Grafische Darstellung von Häufigkeiten barplot(table(bsp01$sex)) # relative Häufigketien prop.table(table(sex)) # in Prozent prop.table(table(sex))*100 # Aufsteigende Sortierung mit sort() sort(table(bsp01$sex), decreasing=false) # Modalwert which.max(table(bsp01$sex)) Abbildung 2. Häufigkeitsanalysen mit der Funktion table(). 3.3 Deskriptive Kennziffern I Lagemaße Deskriptive Kennziffern lassen sich in Lagemaße (wo liegt die Verteilung bzw. wo konzentriert sie sich) und Streuungsmaße (wie breit ist die Verteilung bzw. wie stark konzentriert sich) unterscheiden. 2

3 Sie kennen bereits die Funktion des arithmetischen Mittelwertes 1 mean(). Der Mittelwert ist vermutlich das am häufigsten berichtete Lagemaß der deskriptiven Datenanalyse (Formel 1). (1) Allerdings verlangt die sinnvolle Verwendung des Mittelwerts zwei Voraussetzungen: Zum einen müssen die Daten mindestens Intervallskalenniveau besitzen, zum anderen sollte der Mittelwert aus einer weitgehend symmetrischen Verteilung stammen. Ein Beispiel für eine asymmetrische Verteilung geben Sedlmeier und Renkewitz (2013) aus der Arbeit von Pedersen, Miller, Putcha- Bhagavatula und Yang (2002). Auf die Frage: Was wäre Ihre ideale Anzahl an Sexualpartnern in den nächsten 30 Jahren? gaben Männer im Mittel 7,7 Partner und Frauen 2,8 Partner an. Diese Unterschiede scheinen zunächst einmal zu gängigen Geschlechterstereotypen zu passen. Allerdings zeigen Pedersen et al. (2002), dass diese Mittelwertsunterschiede weniger durch geschlechtsspezifische Sexualstrategien, sondern vielmehr durch die Asymmetrie der Antwortverteilung zustande kommen. Wir haben die Daten einmal nachgestellt 2 (Abb. 3). Sie können erkennen, dass der Mittelwert der Männer vor allem durch die 3 Männer beeinflusst wird, die 99 als Antwort gaben. In diesem Fall, ist der Mittelwert also nicht gut geeignet, um die Datenreihe der idealen Anzahl an Sexualpartnern für Männer zu beschreiben. Zwei gute Alternativen sind im vorliegenden Fall der getrimmte Mittelwert und der Median. Abbildung 3. Asymmetrische Verteilung adaptiert nach Pedersen et al. (2002) mit Mittelwert. Beachten Sie, dass die Skalierung der x-achse nur bis zum Wert 20 sinnvoll gewählt ist. 1 Wir bezeichnen den arithmetischen Mittelwert im Folgenden kurz als Mittelwert. 2 Da wir nicht die Originalwerte vorliegen haben gibt es leichte Abweichungen zwischen unseren Daten und den Originaldaten. Unsere Daten können heruntergeladen werden: 3

4 Der getrimmte Mittelwert ist ein Mittelwert aus einem Anteil um die Daten in der Mitte. In der Funktion mean() können sie dem Argument trim einen Wert zwischen null und eins zuweisen, um den Anteil an Daten zu bestimmen, der von jedem Ende der Verteilung abgeschnitten werden soll (Abb. 4). Eine Alternative zum Mittelwert stellt die Berechnung des Medians dem Wert in der Mitte aller (aufsteigend oder absteigend sortierten) Werte dar. Der Vorteil dieser Kennziffer ist, dass sie relativ robust gegenüber einzelnen extremen Werten ist. Bei einer Zahlenreihe von: {1; 2; 5; 8; 12; 15; 20; 27; 30; 100} beträgt der Median 13,5 (da dieser Wert in der Mitte liegt) 3. Der Mittelwert hingegen liegt bei 22, also deutlich oberhalb des Medians. Zur Berechnung des Medians in R wird die Funktion median() genutzt. Die Mitte aller Werte lässt sich auch als den Punkt beschreiben, der eine Datenreihe in zwei Teile teilt, sodass unterhalb des Medians 50% der Daten, und oberhalb des Medians 50% der Daten liegen (Abbildung 4). Ausgehend von dieser Überlegung, können wir auch die Mitte der Daten unterhalb des Medians berechnen. Dieser Wert wird 25% Quantil 4 genannt, da 25% der Daten unterhalb dieses Wertes und 75% oberhalb dieses Wertes liegen. Entsprechend können beliebige Quantile berechnet werden, am geläufigsten sind das 25% Quantil, Median und 75% Quantil. Diese werden durch die summary() oder etwas variabler mit quantile()und dem Argument probs bestimmt. Beachten Sie bei der Quantilberechnung, dass mehrere Algorithmen in R implementiert sind (siehe dazu help(quartile)) und mit dem Argument type definiert werden. Die Auswirkungen der verschiedenen Quantilalgorithmen nehmen mit zunehmender Stichprobengröße ab und sind im Bezug auf sozialwissenschaftlicher Datenanalyse als eher unbedeutend zu bewerten. Abbildung 4. Mittelwerte, getrimmte Mittelwerte, Median und Quartile einer Zahlenreihe. 3 Bei einer geraden Anzahl an Elemente innerhalb einer Variablen wird in der Regel der Mittelwert zwischen den beiden in der Mitte liegenden Elementen genutzt. 4 Zum Teil wird das 25% Quantil auch als unteres Quartil, das 75% Quantil als oberes Quartil bezeichnet. 4

5 In Abbildung 5 haben wir exemplarisch die Berechnung der deskriptiven Kennziffern für die Daten von Pedersen et al. (2002) vorgenommen. In Abbildung 6 veranschaulichen wir nochmal die verschiedenen Lageparameter bei der unsymmetrischen Verteilung der erwünschten Sexualpartner für die untersuchten Männer. # Herunterladen der Daten (Kapitel 1) von attach(pederseon_2002) # Deskriptive Statistik nur für die Gruppe der Männer (des_m) des_m <- subset(desired, sex=="male") # Mittelwert mean(des_m) # getrimmter Mittelwert # hier der Mittelwert ohne die oberen und unteren 10% der Daten mean(des_m, trim=.1) # hier der Mittelwert ohne die oberen und unteren 25% der Daten mean(des_m, trim=.25) # Median median(des_m) # 25% und 75% Quantil quantile(des_m, probs=.25) quantile(des_m, probs=.75) # Zusammenfassung der deskriptiven Statistik mit summary() summary(des_m) Abbildung 5. Quellcode für Lagemaße der Daten von Pedersen Abbildung 6. Veranschaulichung der Lageparameter bei unsymmetrischer Verteilung. 3.4 Streuungsmaße Streuungsmaße geben an, wie breit die Verteilung der Daten ist bzw. wie stark sich diese Verteilung konzentriert. Für intervallskalierte Variablen wird häufig auf die Varianz bzw. die Standardabweichung zurück gegriffen. Diese werden durch die Funktionen var() bzw. sd() berechnet. Auch hier ist die Angabe v. a. dann sinnvoll, wenn normalverteilte Werte vorliegen. Varianz ist ein Mittelwert, der ausdrückt, wie weit die einzelnen Werte im Durchschnitt vom Mittelwert entfernt sind. Die Entfernung wir dabei durch die Summe der quadrierten Abweichungen gemessen (Formel 2 und 3). 5

6 Varianz (2) Standardabweichung (3) Der Nachteil der Varianz ist, dass im Ergebnis quadrierte Einheiten vorliegen, die inhaltlich kaum interpretierbar sind. Die Standardabweichung als Quadratwurzel der Varianz (Formel 3) löst dieses Problem. Wenn Sie die Funktionen var() bzw. sd() in einem Script selbst programmieren, werden Sie feststellen, dass R und Sie nicht zum selben Ergebnis kommen. Das liegt daran, dass die R Funktionen auf der korrigierten Stichprobenvarianz beruhen. Die korrigierte Stichprobenvarianz spielt im Bereich der Inferenzstatistik eine entscheidende Rolle, weshalb R diese ausgibt (Formel 4 und 5). Es ist ersichtlich, dass die Unterschiede in der Varianz vor allem bei sehr kleinen Stichproben (geringes n) auftreten. korrigierte Stichprobenvarianz (4) korrigierte Standardabweichung (5) Alternative Streuungsangaben für nicht intervallskalierte Variablen sind der Interquartilsabstand oder die Spannweite. Die Berechnung des Interquartilsabstand, der Differenz des 75% Quantils und des 25% Quantils, erfolgt mit der Funktion IQR(). Die Spannweite (die Differenz zwischen größten und kleinsten Wert der Datenreihe) wird Ihnen nicht direkt angegeben. Sie können sich aber mit der Funktion range() das Minimum und das Maximum der Variable ausgeben lassen. In Abbildung 7 stellen wir die Verwendung einiger Streuungsmaße am IQ unserer Beispieldatei bsp01 vor. In Abbildung 8 zeigen wir Ihnen verschiedene Verteilungen mit zugehöriger Standardabweichung. # Berechnung von Streuungsmaßen der Variable IQ des Dataframe bsp01 attach(bsp01) # Varianz und Standardabweichung des IQ var(iq) sd(iq) # Interquartilsabstand und Range IQR(IQ) range(iq) # Spannweite max(iq)-min(iq) # Vergleich empirische Varianz vs. korrigierte Stichprobenvarianz # empirische Varianz sum((iq-mean(iq))^2/length(iq)) # korrigierte stichprobenvarianz var(iq) detach(bsp01) Abbildung 7. Berechnung von Streuungsmaßen mit R. 6

7 Abbildung 8. Verschiedene Verteilungen mit gleichem Mittelwert und unterschiedlichen Standardabweichungen (SD). 3.5 Standardisierung: z-werte Die Lage und Streuungsmaße die Sie bisher kennengelernt, haben sind in ihrer Größe abhängig von der jeweiligen Einheit der zugrundeliegenden Daten. Es kann natürlich vorkommen, dass Sie Werte gleicher Gegenstandsbereich miteinander vergleichen wollen, die unterschiedlich skaliert sind oder aber Sie wollen die relativen Abstände bzgl. einer gegebenen Verteilung bewerten. Zur Veranschaulichung betrachten wir das folgende Beispiel (der dazugehörige Quellcode findet sich in Abbildung 9). Die mittlere Körpergröße von Männern sollte in einer repräsentativen Stichprobe größer sein als die Körpergröße von Frauen. Betrachten wir die Mittelwerte der Männer (x = 182 cm) und der Frauen (x = 164) in unserem Beispieldatensatz, sehen wir diese Unterschiede im Mittelwert. Was wir aber nicht wissen ist, ob eine Frau mit 182 cm Körpergröße relativ zu den anderen Frauen größer ist als ein Mann mit der Größe von 200 cm relativ zu den anderen Männern. Um diese Frage zu beantworten helfen sogenannte Standardisierungsverfahren. Standardisierungen bieten die Möglichkeit Daten zu vergleichen, die ursprünglich unterschiedliche Skalierungen haben oder, wie in unserem Beispiel, aus unterschiedlichen Populationen stammen. Es gibt mehrere standardisierte Skalen (z.b. IQ Werte oder Abiturnoten) die geläufigste und grundlegendste ist jedoch die z-standardisierung. Diese wird in R über die Funktion scale() ausgeführt. Die z- Standardisierung erfolgt, indem jeder einzelne Messwert durch die Standardabweichung geteilt wird (Formel 6). Die neuen Daten haben dabei die Eigenschaft, dass der Mittelwert gleich null und die Standardabweichung gleich 1 ist. Jeder einzelne Messwert kann nun auch relativ zu jedem anderen Messwert mit ursprünglich anderer Skalierung verglichen werden. 7

8 (6) # Mittelwerte der Körpergröße von Männer und Frauen height_male <- subset(height, sex=="male") height_female <- subset(height, sex=="female") mean(height_male) mean(height_female) # z-standaradisierung z_height_male <- scale(height_male) z_height_female <- scale(height_female) # Mittelwert z_standardisierter Werte ist 0 (gerundet auf 4 Kommastellen) round(mean(z_height_male),4) round(mean(z_height_female),4) # Standardabweichung von 1 round(sd(z_height_male),4) round(sd(z_height_female),4) # Wie groß ist eine Frau von 182 cm relativ zu den anderen Frauen? (182-mean(height_female))/sd(height_female) # Wie groß ist ein Mann von 200 cm relativ zu den anderen Männern? (200-mean(height_male))/sd(height_male) ## relativ zur jeweiligen Bezugsgruppe ist eine Frau von 182 cm ## größer als ein Mann von 200 cm Körpergröße Abbildung 9. Quellcode für die z-standardisierung. 3.6 Weiterführende Deskriptive Statistik Es gibt eine ganze Reihe weitere Funktionen der deskriptiven Statistik. Wir haben einige in Tabelle 1 ohne Anspruch auf Vollständigkeit zusammengestellt. Sie werden im Laufe Ihrer Nutzung von R merken, dass Sie mit den gängigen Lage und Streuungsmaßen ziemlich viel erreichen können, wenn Sie diese in eigenen Funktionen (Kapitel 5) nutzen. In verschiedenen Paketen finden Sie weitere Funktionen. Auch hier lohnt sich die Such im Internet. Tabelle 1. Wichtige Funktionen der deskriptiven Statistik. Statistische Funktionen in R mean median var sd quantile min max which.min which.max table IQR range summary length Beschreibung Mittelwert Median korrigierte Stichprobenvarianz Standardabweichung Quantil Minimum Maximum Welcher Wert bildet das Minimum Welcher Wert bildet das Maximum Häufigkeitstabelle Interquartilabstand Spannweite Zusammenfassung deskriptiver Kennziffern Anzahl der Elemente 8

9 3.7 Literatur Pedersen, W. C., Miller, L., Putcha-Bhagavatula, A. D., & Yang, Y. (2002). Evolved Sex Differences in the Number of Partners Desired? The Long and the Short of It. Psychological Science (Wiley Blackwell), 13(2), 157. Sedlmeier, P. & Renkewitz, F. (2013). Forschungsmethoden und Statistik: Ein Lehrbuch für Psychologen und Sozialwissenschaftler (2. überarbeitete und erweiterte Auflage). München, Pearson. 9

Standardisierung von Daten Darstellung von Daten in Texten, Tabellen und Abbildungen. Standardisierung von Daten

Standardisierung von Daten Darstellung von Daten in Texten, Tabellen und Abbildungen. Standardisierung von Daten DAS THEMA: TABELLEN UND ABBILDUNGEN Standardisierung von Daten Darstellung von Daten in Texten, Tabellen und Abbildungen Standardisierung von Daten z-standardisierung Standardnormalverteilung 1 DIE Z-STANDARDISIERUNG

Mehr

1,11 1,12 1,13 1,14 1,15 1,16 1,17 1,17 1,17 1,18

1,11 1,12 1,13 1,14 1,15 1,16 1,17 1,17 1,17 1,18 3. Deskriptive Statistik Ziel der deskriptiven (beschreibenden) Statistik (explorativen Datenanalyse) ist die übersichtliche Darstellung der wesentlichen in den erhobenen Daten enthaltene Informationen

Mehr

Auswertung und Darstellung wissenschaftlicher Daten (1)

Auswertung und Darstellung wissenschaftlicher Daten (1) Auswertung und Darstellung wissenschaftlicher Daten () Mag. Dr. Andrea Payrhuber Zwei Schritte der Auswertung. Deskriptive Darstellung aller Daten 2. analytische Darstellung (Gruppenvergleiche) SPSS-Andrea

Mehr

Bitte am PC mit Windows anmelden!

Bitte am PC mit Windows anmelden! Einführung in SPSS Plan für heute: Grundlagen/ Vorwissen für SPSS Vergleich der Übungsaufgaben Einführung in SPSS http://weknowmemes.com/generator/uploads/generated/g1374774654830726655.jpg Standardnormalverteilung

Mehr

Mittelwert und Standardabweichung

Mittelwert und Standardabweichung Professur E-Learning und Neue Medien Institut für Medienforschung Philosophische Fakultät Einführung in die Statistik Mittelwert und Standardabweichung Überblick Mittelwert Standardabweichung Weitere Maße

Mehr

Willkommen zur Vorlesung Statistik

Willkommen zur Vorlesung Statistik Willkommen zur Vorlesung Statistik Thema dieser Vorlesung: Maßzahlen für zentrale Tendenz, Streuung und andere Eigenschaften von Verteilungen Prof. Dr. Wolfgang Ludwig-Mayerhofer Universität Siegen Philosophische

Mehr

2. Deskriptive Statistik 2.1. Häufigkeitstabellen, Histogramme, empirische Verteilungsfunktionen

2. Deskriptive Statistik 2.1. Häufigkeitstabellen, Histogramme, empirische Verteilungsfunktionen 4. Datenanalyse und Modellbildung Deskriptive Statistik 2-1 2. Deskriptive Statistik 2.1. Häufigkeitstabellen, Histogramme, empirische Verteilungsfunktionen Für die Auswertung einer Messreihe, die in Form

Mehr

Methoden der empirischen Sozialforschung I

Methoden der empirischen Sozialforschung I Methoden der empirischen Sozialforschung I Annelies Blom, PhD TU Kaiserslautern Wintersemester 2011/12 Übersicht Quantitative Datenauswertung: deskriptive und induktive Statistik Wiederholung: Die wichtigsten

Mehr

Deskription, Statistische Testverfahren und Regression. Seminar: Planung und Auswertung klinischer und experimenteller Studien

Deskription, Statistische Testverfahren und Regression. Seminar: Planung und Auswertung klinischer und experimenteller Studien Deskription, Statistische Testverfahren und Regression Seminar: Planung und Auswertung klinischer und experimenteller Studien Deskriptive Statistik Deskriptive Statistik: beschreibende Statistik, empirische

Mehr

Auswertung mit dem Statistikprogramm SPSS: 30.11.05

Auswertung mit dem Statistikprogramm SPSS: 30.11.05 Auswertung mit dem Statistikprogramm SPSS: 30.11.05 Seite 1 Einführung SPSS Was ist eine Fragestellung? Beispiel Welche statistische Prozedur gehört zu welcher Hypothese? Statistische Berechnungen mit

Mehr

Einfache statistische Auswertungen mit dem TI-Nspire

Einfache statistische Auswertungen mit dem TI-Nspire 1. Neues Dokument und darin eine neue Seite anlegen Als Typ 6: Lists & Spreadsheet wählen. Darin die Messwerte in einer Spalte erfassen. Dies ergibt die Urliste. Wenn mehrere Messwerte vorliegen, die diejenigen,

Mehr

Lage- und Streuungsparameter

Lage- und Streuungsparameter Lage- und Streuungsparameter Beziehen sich auf die Verteilung der Ausprägungen von intervall- und ratio-skalierten Variablen Versuchen, diese Verteilung durch Zahlen zu beschreiben, statt sie graphisch

Mehr

METHODENLEHRE I WS 2013/14 THOMAS SCHÄFER

METHODENLEHRE I WS 2013/14 THOMAS SCHÄFER METHODENLEHRE I WS 2013/14 THOMAS SCHÄFER DAS THEMA: INFERENZSTATISTIK IV INFERENZSTATISTISCHE AUSSAGEN FÜR ZUSAMMENHÄNGE UND UNTERSCHIEDE Inferenzstatistik für Zusammenhänge Inferenzstatistik für Unterschiede

Mehr

Business Value Launch 2006

Business Value Launch 2006 Quantitative Methoden Inferenzstatistik alea iacta est 11.04.2008 Prof. Dr. Walter Hussy und David Tobinski UDE.EDUcation College im Rahmen des dokforums Universität Duisburg-Essen Inferenzstatistik Erläuterung

Mehr

Anteile Häufigkeiten Verteilungen Lagemaße Streuungsmaße Merkmale von Verteilungen. Anteile Häufigkeiten Verteilungen

Anteile Häufigkeiten Verteilungen Lagemaße Streuungsmaße Merkmale von Verteilungen. Anteile Häufigkeiten Verteilungen DAS THEMA: VERTEILUNGEN LAGEMAßE - STREUUUNGSMAßE Anteile Häufigkeiten Verteilungen Lagemaße Streuungsmaße Merkmale von Verteilungen Anteile Häufigkeiten Verteilungen Anteile und Häufigkeiten Darstellung

Mehr

2.3 Univariate Datenanalyse in R

2.3 Univariate Datenanalyse in R 2.3. UNIVARIATE DATENANALYSE IN R 47 2.3 Univariate Datenanalyse in R Wir wollen nun lernen, wie man in R Daten elementar analysiert. R bietet eine interaktive Umgebung, Befehlsmodus genannt, in der man

Mehr

Einfache Statistiken in Excel

Einfache Statistiken in Excel Einfache Statistiken in Excel Dipl.-Volkswirtin Anna Miller Bergische Universität Wuppertal Schumpeter School of Business and Economics Lehrstuhl für Internationale Wirtschaft und Regionalökonomik Raum

Mehr

1. Maße der zentralen Tendenz Beispiel: Variable Anzahl der Geschwister aus Jugend '92. Valid Cum Value Frequency Percent Percent Percent

1. Maße der zentralen Tendenz Beispiel: Variable Anzahl der Geschwister aus Jugend '92. Valid Cum Value Frequency Percent Percent Percent Deskriptive Statistik 1. Verteilungsformen symmetrisch/asymmetrisch unimodal(eingipflig) / bimodal (zweigipflig schmalgipflig / breitgipflig linkssteil / rechtssteil U-förmig / abfallend Statistische Kennwerte

Mehr

Statistik und Wahrscheinlichkeitsrechnung

Statistik und Wahrscheinlichkeitsrechnung Statistik und Wahrscheinlichkeitsrechnung Übung 2 28.02.2008 1 Inhalt der heutigen Übung Beschreibende Statistik Gemeinsames Lösen der Übungsaufgaben 2.1: Häufigkeitsverteilung 2.2: Tukey Boxplot 25:Korrelation

Mehr

3. Deskriptive Statistik

3. Deskriptive Statistik 3. Deskriptive Statistik Eindimensionale (univariate) Daten: Pro Objekt wird ein Merkmal durch Messung / Befragung/ Beobachtung erhoben. Resultat ist jeweils ein Wert (Merkmalsausprägung) x i : - Gewicht

Mehr

Lage- und Streuungsmaße

Lage- und Streuungsmaße Sommersemester 2009 Modus Median Arithmetisches Mittel Symmetrie/Schiefe Wölbung/Exzess 4 6 8 10 ALQ Tutorien Begleitend zur Vorlesung, inhaltlich identisch mit der Übung Mögliche Zeiten: Do 10-12, Do

Mehr

1 Verteilungen und ihre Darstellung

1 Verteilungen und ihre Darstellung GKC Statistische Grundlagen für die Korpuslinguistik Kapitel 2: Univariate Deskription von Daten 8.11.2004 Univariate (= eindimensionale) Daten bestehen aus Beobachtungen eines einzelnen Merkmals. 1 Verteilungen

Mehr

Grundlagen der Datenanalyse am Beispiel von SPSS

Grundlagen der Datenanalyse am Beispiel von SPSS Grundlagen der Datenanalyse am Beispiel von SPSS Einführung Dipl. - Psych. Fabian Hölzenbein hoelzenbein@psychologie.uni-freiburg.de Einführung Organisatorisches Was ist Empirie? Was ist Statistik? Dateneingabe

Mehr

Grundlagen quantitativer Sozialforschung Interferenzstatistische Datenanalyse in MS Excel

Grundlagen quantitativer Sozialforschung Interferenzstatistische Datenanalyse in MS Excel Grundlagen quantitativer Sozialforschung Interferenzstatistische Datenanalyse in MS Excel 16.11.01 MP1 - Grundlagen quantitativer Sozialforschung - (4) Datenanalyse 1 Gliederung Datenanalyse (inferenzstatistisch)

Mehr

Forschungsstatistik I

Forschungsstatistik I Prof. Dr. G. Meinhardt. Stock, Nordflügel R. 0-49 (Persike) R. 0- (Meinhardt) Sprechstunde jederzeit nach Vereinbarung Forschungsstatistik I Dr. Malte Persike persike@uni-mainz.de WS 008/009 Fachbereich

Mehr

a) Zeichnen Sie in das nebenstehende Streudiagramm mit Lineal eine Regressionsgerade ein, die Sie für passend halten.

a) Zeichnen Sie in das nebenstehende Streudiagramm mit Lineal eine Regressionsgerade ein, die Sie für passend halten. Statistik für Kommunikationswissenschaftler Wintersemester 2009/200 Vorlesung Prof. Dr. Helmut Küchenhoff Übung Cornelia Oberhauser, Monia Mahling, Juliane Manitz Thema 4 Homepage zur Veranstaltung: http://www.statistik.lmu.de/~helmut/kw09.html

Mehr

E ektgrößen Metaanalysen. Zusammenhänge und Unterschiede quantifizieren E ektgrößen

E ektgrößen Metaanalysen. Zusammenhänge und Unterschiede quantifizieren E ektgrößen DAS THEMA: EFFEKTGRÖßEN UND METAANALYSE E ektgrößen Metaanalysen Zusammenhänge und Unterschiede quantifizieren E ektgrößen Was ist ein E ekt? Was sind E ektgrößen? Berechnung von E ektgrößen Interpretation

Mehr

Statistische Grundlagen I

Statistische Grundlagen I Statistische Grundlagen I Arten der Statistik Zusammenfassung und Darstellung von Daten Beschäftigt sich mit der Untersuchung u. Beschreibung von Gesamtheiten oder Teilmengen von Gesamtheiten durch z.b.

Mehr

2. Eindimensionale (univariate) Datenanalyse

2. Eindimensionale (univariate) Datenanalyse 2. Eindimensionale (univariate) Datenanalyse Dr. Antje Kiesel Institut für Angewandte Mathematik WS 2011/2012 Kennzahlen, Statistiken In der Regel interessieren uns nicht so sehr die beobachteten Einzeldaten

Mehr

Einführung in die statistische Datenanalyse I

Einführung in die statistische Datenanalyse I Einführung in die statistische Datenanalyse I Inhaltsverzeichnis 1. EINFÜHRUNG IN THEORIEGELEITETES WISSENSCHAFTLICHES ARBEITEN 2 2. KRITIERIEN ZUR AUSWAHL STATISTISCH METHODISCHER VERFAHREN 2 3. UNIVARIATE

Mehr

Parametrische vs. Non-Parametrische Testverfahren

Parametrische vs. Non-Parametrische Testverfahren Parametrische vs. Non-Parametrische Testverfahren Parametrische Verfahren haben die Besonderheit, dass sie auf Annahmen zur Verteilung der Messwerte in der Population beruhen: die Messwerte sollten einer

Mehr

Eine computergestützte Einführung mit

Eine computergestützte Einführung mit Thomas Cleff Deskriptive Statistik und Explorative Datenanalyse Eine computergestützte Einführung mit Excel, SPSS und STATA 3., überarbeitete und erweiterte Auflage ^ Springer Inhaltsverzeichnis 1 Statistik

Mehr

Korrelation, Regression und Signifikanz

Korrelation, Regression und Signifikanz Professur Forschungsmethodik und Evaluation in der Psychologie Übung Methodenlehre I, und Daten einlesen in SPSS Datei Textdaten lesen... https://d3njjcbhbojbot.cloudfront.net/api/utilities/v1/imageproxy/https://d15cw65ipcts

Mehr

1 45, 39, 44, 48, 42, 39, 40, , 31, 46, 35, 31, 42, 51, , 42, 33, 46, 33, 44, 43

1 45, 39, 44, 48, 42, 39, 40, , 31, 46, 35, 31, 42, 51, , 42, 33, 46, 33, 44, 43 1) Ermittle jeweils das arithmetische Mittel. Ordne die Datenerhebungen nach der Größe der arithmetischen Mittel. Beginne mit dem Größten. 1 45, 39, 44, 48, 42, 39, 40, 31 2 35, 31, 46, 35, 31, 42, 51,

Mehr

Statistik. Jan Müller

Statistik. Jan Müller Statistik Jan Müller Skalenniveau Nominalskala: Diese Skala basiert auf einem Satz von qualitativen Attributen. Es existiert kein Kriterium, nach dem die Punkte einer nominal skalierten Variablen anzuordnen

Mehr

Analog zu Aufgabe 16.1 werden die Daten durch folgenden Befehl eingelesen: > kredit<-read.table("c:\\compaufg\\kredit.

Analog zu Aufgabe 16.1 werden die Daten durch folgenden Befehl eingelesen: > kredit<-read.table(c:\\compaufg\\kredit. Lösung 16.3 Analog zu Aufgabe 16.1 werden die Daten durch folgenden Befehl eingelesen: > kredit

Mehr

Herzlich willkommen zur Vorlesung Statistik. Streuungsmaße oder die Unterschiedlichkeit der Daten nebst kurzen Ausführungen zu Schiefe und Wölbung

Herzlich willkommen zur Vorlesung Statistik. Streuungsmaße oder die Unterschiedlichkeit der Daten nebst kurzen Ausführungen zu Schiefe und Wölbung FB 1 W. Ludwig-Mayerhofer Statistik 1 Herzlich willkommen zur Vorlesung Statistik smaße oder die Unterschiedlichkeit der Daten nebst kurzen Ausführungen zu Schiefe und Wölbung FB 1 W. Ludwig-Mayerhofer

Mehr

Statistik I für Betriebswirte Vorlesung 2

Statistik I für Betriebswirte Vorlesung 2 Statistik I für Betriebswirte Vorlesung 2 PD Dr. Frank Heyde TU Bergakademie Freiberg Institut für Stochastik 16. April 2015 PD Dr. Frank Heyde Statistik I für Betriebswirte Vorlesung 2 1 ii) empirische

Mehr

Deskriptive Statistik

Deskriptive Statistik Deskriptive Statistik In der beschreibenden Statistik werden Methoden behandelt, mit deren Hilfe man Daten übersichtlich darstellen und kennzeichnen kann. Die Urliste (=Daten in der Reihenfolge ihrer Erhebung)

Mehr

Expertenrunde Gruppe 1: Wiederholungsgruppe EXCEL (Datenerfassung, Darstellungsformen, Verwertung)

Expertenrunde Gruppe 1: Wiederholungsgruppe EXCEL (Datenerfassung, Darstellungsformen, Verwertung) Epertenrunde Gruppe 1: Wiederholungsgruppe EXCEL (Datenerfassung, Darstellungsformen, Verwertung) Im Folgenden wird mit Hilfe des Programms EXEL, Version 007, der Firma Microsoft gearbeitet. Die meisten

Mehr

1. Allgemeine Hinweise Alexander.Martin.Koenig@TU-Clausthal.de

1. Allgemeine Hinweise Alexander.Martin.Koenig@TU-Clausthal.de 1. Allgemeine Hinweise Alexander.Martin.Koenig@TU-Clausthal.de Man sollte eine Excel-Tabelle immer so übersichtlich wie möglich halten. Dazu empfiehlt es sich, alle benötigten Daten, Konstanten und Messwerte

Mehr

fh management, communication & it Constantin von Craushaar fh-management, communication & it Statistik Angewandte Statistik

fh management, communication & it Constantin von Craushaar fh-management, communication & it Statistik Angewandte Statistik fh management, communication & it Folie 1 Überblick Grundlagen (Testvoraussetzungen) Mittelwertvergleiche (t-test,..) Nichtparametrische Tests Korrelationen Regressionsanalyse... Folie 2 Überblick... Varianzanalyse

Mehr

Kapitel 13 Häufigkeitstabellen

Kapitel 13 Häufigkeitstabellen Kapitel 13 Häufigkeitstabellen Die gesammelten und erfaßten Daten erscheinen in der Datendatei zunächst als unübersichtliche Liste von Werten. In dieser Form sind die Daten jedoch wenig aussagekräftig

Mehr

Lösungen zu Janssen/Laatz, Statistische Datenanalyse mit SPSS 1

Lösungen zu Janssen/Laatz, Statistische Datenanalyse mit SPSS 1 LÖSUNG 3A Lösungen zu Janssen/Laatz, Statistische Datenanalyse mit SPSS 1 Mit den Berechnungsfunktionen LG10(?) und SQRT(?) in "Transformieren", "Berechnen" können logarithmierte Werte sowie die Quadratwurzel

Mehr

Wiederholung Statistik I. Statistik für SozialwissenschaftlerInnen II p.8

Wiederholung Statistik I. Statistik für SozialwissenschaftlerInnen II p.8 Wiederholung Statistik I Statistik für SozialwissenschaftlerInnen II p.8 Konstanten und Variablen Konstante: Merkmal hat nur eine Ausprägung Variable: Merkmal kann mehrere Ausprägungen annehmen Statistik

Mehr

Häufigkeitsauszählungen, zentrale statistische Kennwerte und Mittelwertvergleiche

Häufigkeitsauszählungen, zentrale statistische Kennwerte und Mittelwertvergleiche Lehrveranstaltung Empirische Forschung und Politikberatung der Universität Bonn, WS 2007/2008 Häufigkeitsauszählungen, zentrale statistische Kennwerte und Mittelwertvergleiche 30. November 2007 Michael

Mehr

Deskriptive Statistik & grafische Darstellung

Deskriptive Statistik & grafische Darstellung Deskriptive Statistik & grafische Darstellung Sven Garbade Fakultät für Angewandte Psychologie SRH Hochschule Heidelberg sven.garbade@hochschule-heidelberg.de Statistik 1 S. Garbade (SRH Heidelberg) Deskriptive

Mehr

Franz Kronthaler. Statistik angewandt. Datenanalyse ist (k)eine Kunst. Excel Edition. ^ Springer Spektrum

Franz Kronthaler. Statistik angewandt. Datenanalyse ist (k)eine Kunst. Excel Edition. ^ Springer Spektrum Franz Kronthaler Statistik angewandt Datenanalyse ist (k)eine Kunst Excel Edition ^ Springer Spektrum Inhaltsverzeichnis Teil I Basiswissen und Werkzeuge, um Statistik anzuwenden 1 Statistik ist Spaß 3

Mehr

Univariate Kennwerte mit SPSS

Univariate Kennwerte mit SPSS Univariate Kennwerte mit SPSS In diesem Paper wird beschrieben, wie eindimensionale Tabellen und Kennwerte mit SPSS erzeugt werden. Eine Herleitung der Kennwerte und eine inhaltliche Interpretation der

Mehr

Webergänzung zu Kapitel 10

Webergänzung zu Kapitel 10 Webergänzung zu Kapitel 10 10.1.4 Varianzanalyse (ANOVA: analysis of variance) Im Kapitel 10 haben wir uns hauptsächlich mit Forschungsbeispielen beschäftigt, die nur zwei Ergebnissätze hatten (entweder

Mehr

SFB 833 Bedeutungskonstitution. Kompaktkurs. Datenanalyse. Projekt Z2 Tübingen, Mittwoch, 18. und 20. März 2015

SFB 833 Bedeutungskonstitution. Kompaktkurs. Datenanalyse. Projekt Z2 Tübingen, Mittwoch, 18. und 20. März 2015 SFB 833 Bedeutungskonstitution Kompaktkurs Datenanalyse Projekt Z2 Tübingen, Mittwoch, 18. und 20. März 2015 Messen und Skalen Relativ (Relationensystem): Menge A von Objekten und eine oder mehrere Relationen

Mehr

Fachrechnen für Tierpfleger

Fachrechnen für Tierpfleger Z.B.: Fachrechnen für Tierpfleger A10. Statistik 10.1 Allgemeines Was ist Statistik? 1. Daten sammeln: Durch Umfragen, Zählung, Messung,... 2. Daten präsentieren: Tabellen, Grafiken 3. Daten beschreiben/charakterisieren:

Mehr

Willkommen zur Vorlesung Statistik

Willkommen zur Vorlesung Statistik Willkommen zur Vorlesung Statistik Thema dieser Vorlesung: Varianzanalyse Prof. Dr. Wolfgang Ludwig-Mayerhofer Universität Siegen Philosophische Fakultät, Seminar für Sozialwissenschaften Prof. Dr. Wolfgang

Mehr

Einige Statistische Tests für den Ein- Zwei- und k-stichprobenfall (Nach Sachs, Stat. Meth.)

Einige Statistische Tests für den Ein- Zwei- und k-stichprobenfall (Nach Sachs, Stat. Meth.) ue biostatistik: nichtparametrische testverfahren / ergänzung 1/6 h. Lettner / physik Statistische Testverfahren Einige Statistische Tests für den Ein- Zwei- und k-stichprobenfall (Nach Sachs, Stat. Meth.)

Mehr

Faustformeln / Zusammenhänge a) Binomialverteilung als Poissonverteilung:

Faustformeln / Zusammenhänge a) Binomialverteilung als Poissonverteilung: Faustformeln / Zusammenhänge a) Binomialverteilung als Poissonverteilung: k ( np) np B( n, p; k) Poi( np, k) e k! falls gilt: p

Mehr

Einfache statistische Auswertungen mit dem Programm SPSS

Einfache statistische Auswertungen mit dem Programm SPSS Einfache statistische Auswertungen mit dem Programm SPSS Datensatz: fiktive_daten.sav Dipl. Päd. Anne Haßelkus Dr. Dorothea Dette-Hagenmeyer 11/2011 Überblick 1 Deskriptive Statistiken; Mittelwert berechnen...

Mehr

Erstellen einer Formel

Erstellen einer Formel Software Erstellen einer Formel In Excel kann man individuelle Formeln erstellen, dabei wird eine Formel mit ein Gleichzeichen = eingeleitet. Man kann direkt in eine Zelle schreiben oder in dem dafür vorgesehen

Mehr

Grundlagen der Inferenzstatistik: Was Ihnen nicht erspart bleibt!

Grundlagen der Inferenzstatistik: Was Ihnen nicht erspart bleibt! Grundlagen der Inferenzstatistik: Was Ihnen nicht erspart bleibt! 1 Einführung 2 Wahrscheinlichkeiten kurz gefasst 3 Zufallsvariablen und Verteilungen 4 Theoretische Verteilungen (Wahrscheinlichkeitsfunktion)

Mehr

1 Einführung in RStudio

1 Einführung in RStudio Markus Burkhardt (markus.burkhardt@psychologie.tu-chemnitz.de) Inhalt 1.1 Ziel... 1 1.2 Installation... 2 1.3 Nutzung von RStudio... 2 1.4 Ein neues Projekt... 3 1.5 Einlesen von Daten... 3 1.6 Einlesen

Mehr

Mathematische und statistische Methoden II

Mathematische und statistische Methoden II Methodenlehre e e Prof. Dr. G. Meinhardt 6. Stock, Wallstr. 3 (Raum 06-206) Sprechstunde jederzeit nach Vereinbarung und nach der Vorlesung. Mathematische und statistische Methoden II Dr. Malte Persike

Mehr

Evaluation der Normalverteilungsannahme

Evaluation der Normalverteilungsannahme Evaluation der Normalverteilungsannahme. Überprüfung der Normalverteilungsannahme im SPSS P. Wilhelm; HS SPSS bietet verschiedene Möglichkeiten, um Verteilungsannahmen zu überprüfen. Angefordert werden

Mehr

1.1 Graphische Darstellung von Messdaten und unterschiedliche Mittelwerte. D. Horstmann: Oktober

1.1 Graphische Darstellung von Messdaten und unterschiedliche Mittelwerte. D. Horstmann: Oktober 1.1 Graphische Darstellung von Messdaten und unterschiedliche Mittelwerte D. Horstmann: Oktober 2014 4 Graphische Darstellung von Daten und unterschiedliche Mittelwerte Eine Umfrage nach der Körpergröße

Mehr

Elisabeth Raab-Steiner/Michael Benesch. Der Fragebogen. Von der Forschungsidee zur SPSS/PASW-Auswertung. 2., aktualisierte Auflage. facultas.

Elisabeth Raab-Steiner/Michael Benesch. Der Fragebogen. Von der Forschungsidee zur SPSS/PASW-Auswertung. 2., aktualisierte Auflage. facultas. Elisabeth Raab-Steiner/Michael Benesch Der Fragebogen Von der Forschungsidee zur SPSS/PASW-Auswertung 2., aktualisierte Auflage facultas.wuv Inhaltsverzeichnis 1 Elementare Definitionen 11 1.1 Deskriptive

Mehr

Willkommen zur Vorlesung Statistik (Master)

Willkommen zur Vorlesung Statistik (Master) Willkommen zur Vorlesung Statistik (Master) Thema dieser Vorlesung: Verteilungsfreie Verfahren Prof. Dr. Wolfgang Ludwig-Mayerhofer Universität Siegen Philosophische Fakultät, Seminar für Sozialwissenschaften

Mehr

Teil I: Deskriptive Statistik

Teil I: Deskriptive Statistik Teil I: Deskriptive Statistik 2 Grundbegriffe 2.1 Merkmal und Stichprobe 2.2 Skalenniveau von Merkmalen 2.3 Geordnete Stichproben und Ränge 2.1 Merkmal und Stichprobe An (geeignet ausgewählten) Untersuchungseinheiten

Mehr

PROC MEANS. zum Berechnen statistischer Maßzahlen (für quantitative Merkmale)

PROC MEANS. zum Berechnen statistischer Maßzahlen (für quantitative Merkmale) PROC MEAS zum Berechnen statistischer Maßzahlen (für quantitative Merkmale) Allgemeine Form: PROC MEAS DATA=name Optionen ; VAR variablenliste ; CLASS vergleichsvariable ; Beispiel und Beschreibung der

Mehr

Auswerten mit Excel. Viele Video-Tutorials auf Youtube z.b. http://www.youtube.com/watch?v=vuuky6xxjro

Auswerten mit Excel. Viele Video-Tutorials auf Youtube z.b. http://www.youtube.com/watch?v=vuuky6xxjro Auswerten mit Excel Viele Video-Tutorials auf Youtube z.b. http://www.youtube.com/watch?v=vuuky6xxjro 1. Pivot-Tabellen erstellen: In der Datenmaske in eine beliebige Zelle klicken Registerkarte Einfügen

Mehr

5 Statistik in der Psychologie

5 Statistik in der Psychologie 5 Statistik in der Psychologie Für Anfänger in der Psychologie ist es nicht unbedingt einsichtig, warum man sich überhaupt statistische Kompetenzen in einer Sozialwissenschaft aneignen muss, wo es doch

Mehr

Veranstaltungsort Bildungsherberge der Studierendenschaft der FernUniversität Hagen

Veranstaltungsort Bildungsherberge der Studierendenschaft der FernUniversität Hagen Bildungsurlaub-Seminare: Lerninhalte und Programm Seminartitel SPSS für Psychologen/innen (BH15113) Termin Mo, den 18.05.bis Fr, den 22.05.2015 (40 UStd.) Veranstaltungsort Bildungsherberge der Studierendenschaft

Mehr

Univariate Häufigkeitsverteilungen Kühnel, Krebs 2001: Statistik für die Sozialwissenschaften, S.41-66

Univariate Häufigkeitsverteilungen Kühnel, Krebs 2001: Statistik für die Sozialwissenschaften, S.41-66 Univariate Häufigkeitsverteilungen Kühnel, Krebs 2001: Statistik für die Sozialwissenschaften, S.41-66 Gabriele Doblhammer: Empirische Sozialforschung Teil II, SS 2004 1/19 Skalenniveaus Skalenniveau Relation

Mehr

ÜBUNGSAUFGABEN ZUR DESKRIPTIVEN UND EXPLORATIVEN DATENANALYSE

ÜBUNGSAUFGABEN ZUR DESKRIPTIVEN UND EXPLORATIVEN DATENANALYSE ÜBUNGSAUFGABEN ZUR DESKRIPTIVEN UND EXPLORATIVEN DATENANALYSE 1.1 Füllen Sie bitte folgenden Lückentext aus. Daten, die in Untersuchungen erhoben werden, muss man grundsätzlich nach ihrem unterscheiden.

Mehr

Statistik II: Grundlagen und Definitionen der Statistik

Statistik II: Grundlagen und Definitionen der Statistik Medien Institut : Grundlagen und Definitionen der Statistik Dr. Andreas Vlašić Medien Institut (0621) 52 67 44 vlasic@medien-institut.de Gliederung 1. Hintergrund: Entstehung der Statistik 2. Grundlagen

Mehr

Tabelle 6a: Deskriptive Statistiken der metrischen Variablen

Tabelle 6a: Deskriptive Statistiken der metrischen Variablen Ergebnisse 77 5 Ergebnisse Das folgende Kapitel widmet sich der statistischen Auswertung der Daten zur Ü- berprüfung der Hypothesen. Die hier verwendeten Daten wurden mit den in 4.3 beschriebenen Instrumenten

Mehr

3.2 Streuungsmaße. 3 Lage- und Streuungsmaße 133. mittlere Variabilität. geringe Variabilität. große Variabilität 0.0 0.1 0.2 0.3 0.4 0.

3.2 Streuungsmaße. 3 Lage- und Streuungsmaße 133. mittlere Variabilität. geringe Variabilität. große Variabilität 0.0 0.1 0.2 0.3 0.4 0. Eine Verteilung ist durch die Angabe von einem oder mehreren Mittelwerten nur unzureichend beschrieben. Beispiel: Häufigkeitsverteilungen mit gleicher zentraler Tendenz: geringe Variabilität mittlere Variabilität

Mehr

Statistik eindimensionaler Größen

Statistik eindimensionaler Größen Statistik eindimensionaler Größen Michael Spielmann Inhaltsverzeichnis 1 Aufgabe der eindimensionalen Statistik 2 2 Grundbegriffe 2 3 Aufbereiten der Stichprobe 3 4 Die Kennzahlen Mittelwert und Streuung,

Mehr

Angewandte Statistik 3. Semester

Angewandte Statistik 3. Semester Angewandte Statistik 3. Semester Übung 5 Grundlagen der Statistik Übersicht Semester 1 Einführung ins SPSS Auswertung im SPSS anhand eines Beispieles Häufigkeitsauswertungen Grafiken Statistische Grundlagen

Mehr

absolute Häufigkeit h: Anzahl einer bestimmten Note relative Häufigkeit r: Anzahl einer bestimmten Note, gemessen an der Gesamtzahl der Noten

absolute Häufigkeit h: Anzahl einer bestimmten Note relative Häufigkeit r: Anzahl einer bestimmten Note, gemessen an der Gesamtzahl der Noten Statistik Eine Aufgabe der Statistik ist es, Datenmengen zusammenzufassen und darzustellen. Man verwendet dazu bestimmte Kennzahlen und wertet Stichproben aus, um zu Aussagen bzw. Prognosen über die Gesamtheit

Mehr

Übung Statistik I Statistik mit Stata SS07-14.05.2007 5. Dokumentation der Datenanalyse, Datentransformationen II und Univariate Statistiken II

Übung Statistik I Statistik mit Stata SS07-14.05.2007 5. Dokumentation der Datenanalyse, Datentransformationen II und Univariate Statistiken II Übung Statistik I Statistik mit Stata SS07-14.05.2007 5. Dokumentation der Datenanalyse, Datentransformationen II und Univariate Statistiken II Andrea Kummerer (M.A.) Oec R. I-53 Sprechstunde: Di. 15-16

Mehr

4 Statistische Maßzahlen

4 Statistische Maßzahlen 4 Statistische Maßzahlen 4.1 Maßzahlen der mittleren Lage 4.2 Weitere Maßzahlen der Lage 4.3 Maßzahlen der Streuung 4.4 Lineare Transformationen, Schiefemaße 4.5 Der Box Plot Ziel: Charakterisierung einer

Mehr

Schätzung des Lifetime Values von Spendern mit Hilfe der Überlebensanalyse

Schätzung des Lifetime Values von Spendern mit Hilfe der Überlebensanalyse Schätzung Lifetime Values von Spenn mit Hilfe Überlebensanalyse Einführung in das Verfahren am Beispiel Einzugsgenehmigung Überlebensanalysen o Ereignisdatenanalysen behandeln das Problem, mit welcher

Mehr

12. Vergleich mehrerer Stichproben

12. Vergleich mehrerer Stichproben 12. Vergleich mehrerer Stichproben Dr. Antje Kiesel Institut für Angewandte Mathematik WS 2011/2012 Häufig wollen wir verschiedene Populationen, Verfahren, usw. miteinander vergleichen. Beipiel: Vergleich

Mehr

90-minütige Klausur Statistik für Studierende der Kommunikationswissenschaft

90-minütige Klausur Statistik für Studierende der Kommunikationswissenschaft Prof. Dr. Helmut Küchenhoff SS08 90-minütige Klausur Statistik für Studierende der Kommunikationswissenschaft am 22.7.2008 Anmerkungen Überprüfen Sie bitte sofort, ob Ihre Angabe vollständig ist. Sie sollte

Mehr

Ein bisschen Statistik

Ein bisschen Statistik Prof. Dr. Beat Siebenhaar ein bisschen Statistik 1 Ein bisschen Statistik (orientiert an Hüsler/Zimmermann (006) mit Umsetzung auf die linguistische Fragen) 1. Datentypen und Grafik Grafische Darstellungen

Mehr

Mathematische und statistische Methoden I

Mathematische und statistische Methoden I Prof. Dr. G. Meinhardt Methodenlehre Mathematische und statistische Methoden I Sprechstunde jederzeit nach Vereinbarung und nach der Vorlesung Wallstr. 3, 6. Stock, Raum 06-206 Dr. Malte Persike persike@uni-mainz.de

Mehr

Einführung in statistische Analysen

Einführung in statistische Analysen Einführung in statistische Analysen Andreas Thams Econ Boot Camp 2008 Wozu braucht man Statistik? Statistik begegnet uns jeden Tag... Weihnachten macht Deutschen Einkaufslaune. Im Advent überkommt die

Mehr

9. Schätzen und Testen bei unbekannter Varianz

9. Schätzen und Testen bei unbekannter Varianz 9. Schätzen und Testen bei unbekannter Varianz Dr. Antje Kiesel Institut für Angewandte Mathematik WS 2011/2012 Schätzen und Testen bei unbekannter Varianz Wenn wir die Standardabweichung σ nicht kennen,

Mehr

Häufigkeitsverteilungen und Statistische Maßzahlen. Häufigkeitsverteilungen und Statistische Maßzahlen. Variablentypen. Stichprobe und Grundgesamtheit

Häufigkeitsverteilungen und Statistische Maßzahlen. Häufigkeitsverteilungen und Statistische Maßzahlen. Variablentypen. Stichprobe und Grundgesamtheit TECHNISCHE UNIVERSITÄT MÜNCHEN-WEIHENSTEPHAN MATHEMATIK UND STATISTIK INFORMATIONS- UND DOKUMENTATIONSZENTRUM R. Häufigkeitsverteilungen und Statistische Maßzahlen Statistik SS Variablentypen Qualitative

Mehr

Arbeiten mit Excel. 1. Allgemeine Hinweise

Arbeiten mit Excel. 1. Allgemeine Hinweise 1. Allgemeine Hinweise Man sollte eine Excel Tabelle immer so übersichtlich wie möglich halten. Dazu empfiehlt es sich, alle benötigten Daten, Konstanten und Messwerte inklusive aller dazugehörigen Einheiten

Mehr

Korrelation - Regression. Berghold, IMI

Korrelation - Regression. Berghold, IMI Korrelation - Regression Zusammenhang zwischen Variablen Bivariate Datenanalyse - Zusammenhang zwischen 2 stetigen Variablen Korrelation Einfaches lineares Regressionsmodell 1. Schritt: Erstellung eines

Mehr

Access [basics] Gruppierungen in Abfragen. Beispieldatenbank. Abfragen gruppieren. Artikel pro Kategorie zählen

Access [basics] Gruppierungen in Abfragen. Beispieldatenbank. Abfragen gruppieren. Artikel pro Kategorie zählen Abfragen lassen sich längst nicht nur dazu benutzen, die gewünschten Felder oder Datensätze einer oder mehrerer Tabellen darzustellen. Sie können Daten auch nach bestimmten Kriterien zu Gruppen zusammenfassen

Mehr

TÜV Service tested Prüfgrundlagen

TÜV Service tested Prüfgrundlagen TÜV Service tested Prüfgrundlagen 60 Grundsätzliche Prüfgrundlagen Für die Auszeichnung TÜV Service tested müssen drei Voraussetzungen erfüllt sein: 1. Die Gesamtzufriedenheit muss von den Kunden des Unternehmens

Mehr

Teil II: Einführung in die Statistik

Teil II: Einführung in die Statistik Teil II: Einführung in die Statistik (50 Punkte) Bitte beantworten Sie ALLE Fragen. Es handelt sich um multiple choice Fragen. Sie müssen die exakte Antwortmöglichkeit angeben, um die volle Punktzahl zu

Mehr

Bachelorabschlussseminar Dipl.-Kfm. Daniel Cracau

Bachelorabschlussseminar Dipl.-Kfm. Daniel Cracau 1 Einführung in die statistische Datenanalyse Bachelorabschlussseminar Dipl.-Kfm. Daniel Cracau 2 Gliederung 1.Grundlagen 2.Nicht-parametrische Tests a. Mann-Whitney-Wilcoxon-U Test b. Wilcoxon-Signed-Rank

Mehr

Graphische Darstellung einer univariaten Verteilung:

Graphische Darstellung einer univariaten Verteilung: Graphische Darstellung einer univariaten Verteilung: Die graphische Darstellung einer univariaten Verteilung hängt von dem Messniveau der Variablen ab. Bei einer graphischen Darstellung wird die Häufigkeit

Mehr

SPSS-Skriptum. 1. Vorbereitungen für die Arbeit mit SPSS (im Seminar)

SPSS-Skriptum. 1. Vorbereitungen für die Arbeit mit SPSS (im Seminar) Die folgenden Erklärungen und Abbildungen sollen den Umgang mit SPSS im Rahmen des POK erleichtern. Diese beschreiben nicht alle Möglichkeiten, die SPSS bietet, sondern nur die Verfahren, die im Seminar

Mehr

Kapitel 5 Kenngrößen empirischer Verteilungen 5.1. Lagemaße. x mod (lies: x-mod) Wofür? Lageparameter. Modus/ Modalwert Zentrum. Median Zentralwert

Kapitel 5 Kenngrößen empirischer Verteilungen 5.1. Lagemaße. x mod (lies: x-mod) Wofür? Lageparameter. Modus/ Modalwert Zentrum. Median Zentralwert Kapitel 5 Kenngrößen empirischer Verteilungen 5.1. Lagemaße Wofür? Lageparameter Modus/ Modalwert Zentrum Median Zentralwert Im Datensatz stehende Informationen auf wenige Kenngrößen verdichten ermöglicht

Mehr

Übungen zur Vorlesung Einführung in die Informatik Wintersemester 2010/11

Übungen zur Vorlesung Einführung in die Informatik Wintersemester 2010/11 Übungen zur Vorlesung Einführung in die Informatik Wintersemester 2010/11 Fakultät für Informatik Lehrstuhl 1 Dr. Lars Hildebrand Carla Delgado-Battenfeld Fatih Gedikli Tobias Marschall Benjamin Schowe

Mehr

Anwendung A_0801_Quantile_Minimum_Maximum

Anwendung A_0801_Quantile_Minimum_Maximum 8. Lageparameter 63 8.3 Interaktive EXCEL-Anwendungen (CD-ROM) Anwendung A_080_Quantile_Minimum_Maimum Die Anwendung besteht aus einem Tabellenblatt Simulation : In der Simulation wird aus einer Urliste

Mehr

Verteilungsanalyse. Johannes Hain. Lehrstuhl für Mathematik VIII Statistik 1/35

Verteilungsanalyse. Johannes Hain. Lehrstuhl für Mathematik VIII Statistik 1/35 Verteilungsanalyse Johannes Hain Lehrstuhl für Mathematik VIII Statistik 1/35 Datentypen Als Sammeln von Daten bezeichnet man in der Statistik das Aufzeichnen von Fakten. Erhobene Daten klassifziert man

Mehr