3 Deskriptive Statistik in R (univariat)

Größe: px
Ab Seite anzeigen:

Download "3 Deskriptive Statistik in R (univariat)"

Transkript

1 (univariat) Markus Burkhardt Inhalt 3.1 Ziel Häufigkeiten Deskriptive Kennziffern I Lagemaße Streuungsmaße Standardisierung: z-werte Weiterführende Deskriptive Statistik Literatur Ziel In diesem Kapitel zeigen wir Ihnen die Grundtechniken der deskriptiven Datenanalyse in R. Ziel einer deskriptiven Analyse ist es, Variablen bzw. Datenreihen so zu beschreiben, dass möglichst viele Information in einer möglichst kleinen Menge an Zahlen ausgedrückt wird. Letztlich geht es also darum nicht die gesamte Zahlenreihe zu berichten, sondern einzelne Kennziffern die etwas über die Beschaffenheit der Zahlenreihe aussagen. Allerdings ist die Aussagekraft stets an bestimmte Bedingungen geknüpft wie das Skalenniveau oder die Verteilung der Daten. Genau diese Bedingungen können Gegenstand der explorativen Datenanalyse. Die deskriptiven Kennziffern bieten des Weiteren die Grundlage für grafische Explorationsverfahren, die wir im nächsten Kapitel vorstellen 3.2 Häufigkeiten Das Auszählen von Häufigkeiten ist wohl die einfachste Form der deskriptiven Statistik. Ob diese Art der Analyse sinnvoll ist, hängt natürlich von der Struktur Ihrer Daten ab. Insbesondere für nominal- und ordinalskalierte Daten bieten sich Häufigkeitsanalysen an. Aber auch für intervallskalierte Daten kann eine Häufigkeitsanalyse sinnvoll sein. Wir führen zunächst eine Häufigkeitsanalyse für das Geschlecht in der Datei bsp01 durch, um herauszufinden, wie viele Männer und Frauen in unserem Beispieldatensatz vorhanden sind. Die Grundlage für Häufigkeitsanalysen bietet die Funktion table().das Ergebnis wird in der R-Console ausgegeben (Abb. 1). Die table() Funktion schließt standardmäßig NA-Werte aus. > table(bsp01$sex) female male Abbildung 1. Häufigkeitstabelle in R. 1

2 Durch die Eingabe mehrere Objekte, erhalten Sie mehrdimensionale Tabellen. Eine solche Darstellung, kann die Häufigkeit des Geschlechts in Abhängigkeit der Körpergröße sein. Dazu sollte die Körpergröße für eine bessere Übersichtlichkeit kategorisiert werden. Beispielsweise wollen wir die Körpergröße in zwei Kategorien einteilen, Menschen die kleiner als zwei Meter sind und Menschen die größer als zwei Meter sind. Die Funktion cut() bildet neue Kategorien. Wenn Sie sich die Hilfe zu dieser Funktion ansehen help(cut), sehen Sie, dass die Argumente x und breaks definiert werden müssen. (Die anderen Argumente sind vordefiniert. Sie können aber natürlich auch diese Werte spezifisch einstellen.) Dem Argument x weisen Sie Ihr Objekt zu, welches in kategorisiert werden soll und dem Argument breaks die Grenzwerte in Form einer Variable (Abb. 2). Wenn Sie eine Tabelle als Objekt speichern, sehen Sie, dass auch Tabellen eine eigene Objekt-Klasse in R sind. Für diese Klasse gibt es einige weitere sehr nützliche Funktionen. Wenn Sie lediglich an dem häufigsten Wert (dem Modalwert), nicht aber an der gesamten Häufigkeitstabelle interessiert sind, können Sie die Funktion which.max() anwenden. Diese gibt den Index des größten Wertes eines R-Objektes zurück. Im Falle eines Objektes der Klasse table, die entsprechende Kategorie. Allerdings wird bei mehreren Maxima nur das jeweils Erste Maximum ausgegeben. Mit Hilfe von barplot() können Sie sehr schnell eine Häufigkeitsverteilung grafisch darstellen (wir gehen auf diese Funktion ausführlicher im nächsten Kapitel ein). Die Funktion prop.table() ermöglicht es Ihnen, relative Anteile darzustellen. Natürlich können Sie auch arithmetische Operationen oder Indizierungen in Tabellen vornehmen (Beispiele in Abbildung 2). Einen guten Überblick über den Umgang mit Tabellen gibt auch die Internetseite: # Häufigkeitsanalyse mit der Funktion table() # Häufigkeitstabelle für das Geschlecht table(bsp01$sex) # Kategorisierung der Variable height in 2 Gruppen, # von 0 bis einschließlich 200 und größer 200 bis 250 # mit entsprechenden lables height_kategorien <- cut(x=bsp01$height, breaks=c(0,200,250), labels=c("kleiner/gleich 200 cm", "groesser 200 cm") ) # Mehrdimensionale Tabelle aus Geschlecht und der kategoriserten Körpergröße table(bsp01$sex, height_kategorien) # Grafische Darstellung von Häufigkeiten barplot(table(bsp01$sex)) # relative Häufigketien prop.table(table(sex)) # in Prozent prop.table(table(sex))*100 # Aufsteigende Sortierung mit sort() sort(table(bsp01$sex), decreasing=false) # Modalwert which.max(table(bsp01$sex)) Abbildung 2. Häufigkeitsanalysen mit der Funktion table(). 3.3 Deskriptive Kennziffern I Lagemaße Deskriptive Kennziffern lassen sich in Lagemaße (wo liegt die Verteilung bzw. wo konzentriert sie sich) und Streuungsmaße (wie breit ist die Verteilung bzw. wie stark konzentriert sich) unterscheiden. 2

3 Sie kennen bereits die Funktion des arithmetischen Mittelwertes 1 mean(). Der Mittelwert ist vermutlich das am häufigsten berichtete Lagemaß der deskriptiven Datenanalyse (Formel 1). (1) Allerdings verlangt die sinnvolle Verwendung des Mittelwerts zwei Voraussetzungen: Zum einen müssen die Daten mindestens Intervallskalenniveau besitzen, zum anderen sollte der Mittelwert aus einer weitgehend symmetrischen Verteilung stammen. Ein Beispiel für eine asymmetrische Verteilung geben Sedlmeier und Renkewitz (2013) aus der Arbeit von Pedersen, Miller, Putcha- Bhagavatula und Yang (2002). Auf die Frage: Was wäre Ihre ideale Anzahl an Sexualpartnern in den nächsten 30 Jahren? gaben Männer im Mittel 7,7 Partner und Frauen 2,8 Partner an. Diese Unterschiede scheinen zunächst einmal zu gängigen Geschlechterstereotypen zu passen. Allerdings zeigen Pedersen et al. (2002), dass diese Mittelwertsunterschiede weniger durch geschlechtsspezifische Sexualstrategien, sondern vielmehr durch die Asymmetrie der Antwortverteilung zustande kommen. Wir haben die Daten einmal nachgestellt 2 (Abb. 3). Sie können erkennen, dass der Mittelwert der Männer vor allem durch die 3 Männer beeinflusst wird, die 99 als Antwort gaben. In diesem Fall, ist der Mittelwert also nicht gut geeignet, um die Datenreihe der idealen Anzahl an Sexualpartnern für Männer zu beschreiben. Zwei gute Alternativen sind im vorliegenden Fall der getrimmte Mittelwert und der Median. Abbildung 3. Asymmetrische Verteilung adaptiert nach Pedersen et al. (2002) mit Mittelwert. Beachten Sie, dass die Skalierung der x-achse nur bis zum Wert 20 sinnvoll gewählt ist. 1 Wir bezeichnen den arithmetischen Mittelwert im Folgenden kurz als Mittelwert. 2 Da wir nicht die Originalwerte vorliegen haben gibt es leichte Abweichungen zwischen unseren Daten und den Originaldaten. Unsere Daten können heruntergeladen werden: 3

4 Der getrimmte Mittelwert ist ein Mittelwert aus einem Anteil um die Daten in der Mitte. In der Funktion mean() können sie dem Argument trim einen Wert zwischen null und eins zuweisen, um den Anteil an Daten zu bestimmen, der von jedem Ende der Verteilung abgeschnitten werden soll (Abb. 4). Eine Alternative zum Mittelwert stellt die Berechnung des Medians dem Wert in der Mitte aller (aufsteigend oder absteigend sortierten) Werte dar. Der Vorteil dieser Kennziffer ist, dass sie relativ robust gegenüber einzelnen extremen Werten ist. Bei einer Zahlenreihe von: {1; 2; 5; 8; 12; 15; 20; 27; 30; 100} beträgt der Median 13,5 (da dieser Wert in der Mitte liegt) 3. Der Mittelwert hingegen liegt bei 22, also deutlich oberhalb des Medians. Zur Berechnung des Medians in R wird die Funktion median() genutzt. Die Mitte aller Werte lässt sich auch als den Punkt beschreiben, der eine Datenreihe in zwei Teile teilt, sodass unterhalb des Medians 50% der Daten, und oberhalb des Medians 50% der Daten liegen (Abbildung 4). Ausgehend von dieser Überlegung, können wir auch die Mitte der Daten unterhalb des Medians berechnen. Dieser Wert wird 25% Quantil 4 genannt, da 25% der Daten unterhalb dieses Wertes und 75% oberhalb dieses Wertes liegen. Entsprechend können beliebige Quantile berechnet werden, am geläufigsten sind das 25% Quantil, Median und 75% Quantil. Diese werden durch die summary() oder etwas variabler mit quantile()und dem Argument probs bestimmt. Beachten Sie bei der Quantilberechnung, dass mehrere Algorithmen in R implementiert sind (siehe dazu help(quartile)) und mit dem Argument type definiert werden. Die Auswirkungen der verschiedenen Quantilalgorithmen nehmen mit zunehmender Stichprobengröße ab und sind im Bezug auf sozialwissenschaftlicher Datenanalyse als eher unbedeutend zu bewerten. Abbildung 4. Mittelwerte, getrimmte Mittelwerte, Median und Quartile einer Zahlenreihe. 3 Bei einer geraden Anzahl an Elemente innerhalb einer Variablen wird in der Regel der Mittelwert zwischen den beiden in der Mitte liegenden Elementen genutzt. 4 Zum Teil wird das 25% Quantil auch als unteres Quartil, das 75% Quantil als oberes Quartil bezeichnet. 4

5 In Abbildung 5 haben wir exemplarisch die Berechnung der deskriptiven Kennziffern für die Daten von Pedersen et al. (2002) vorgenommen. In Abbildung 6 veranschaulichen wir nochmal die verschiedenen Lageparameter bei der unsymmetrischen Verteilung der erwünschten Sexualpartner für die untersuchten Männer. # Herunterladen der Daten (Kapitel 1) von attach(pederseon_2002) # Deskriptive Statistik nur für die Gruppe der Männer (des_m) des_m <- subset(desired, sex=="male") # Mittelwert mean(des_m) # getrimmter Mittelwert # hier der Mittelwert ohne die oberen und unteren 10% der Daten mean(des_m, trim=.1) # hier der Mittelwert ohne die oberen und unteren 25% der Daten mean(des_m, trim=.25) # Median median(des_m) # 25% und 75% Quantil quantile(des_m, probs=.25) quantile(des_m, probs=.75) # Zusammenfassung der deskriptiven Statistik mit summary() summary(des_m) Abbildung 5. Quellcode für Lagemaße der Daten von Pedersen Abbildung 6. Veranschaulichung der Lageparameter bei unsymmetrischer Verteilung. 3.4 Streuungsmaße Streuungsmaße geben an, wie breit die Verteilung der Daten ist bzw. wie stark sich diese Verteilung konzentriert. Für intervallskalierte Variablen wird häufig auf die Varianz bzw. die Standardabweichung zurück gegriffen. Diese werden durch die Funktionen var() bzw. sd() berechnet. Auch hier ist die Angabe v. a. dann sinnvoll, wenn normalverteilte Werte vorliegen. Varianz ist ein Mittelwert, der ausdrückt, wie weit die einzelnen Werte im Durchschnitt vom Mittelwert entfernt sind. Die Entfernung wir dabei durch die Summe der quadrierten Abweichungen gemessen (Formel 2 und 3). 5

6 Varianz (2) Standardabweichung (3) Der Nachteil der Varianz ist, dass im Ergebnis quadrierte Einheiten vorliegen, die inhaltlich kaum interpretierbar sind. Die Standardabweichung als Quadratwurzel der Varianz (Formel 3) löst dieses Problem. Wenn Sie die Funktionen var() bzw. sd() in einem Script selbst programmieren, werden Sie feststellen, dass R und Sie nicht zum selben Ergebnis kommen. Das liegt daran, dass die R Funktionen auf der korrigierten Stichprobenvarianz beruhen. Die korrigierte Stichprobenvarianz spielt im Bereich der Inferenzstatistik eine entscheidende Rolle, weshalb R diese ausgibt (Formel 4 und 5). Es ist ersichtlich, dass die Unterschiede in der Varianz vor allem bei sehr kleinen Stichproben (geringes n) auftreten. korrigierte Stichprobenvarianz (4) korrigierte Standardabweichung (5) Alternative Streuungsangaben für nicht intervallskalierte Variablen sind der Interquartilsabstand oder die Spannweite. Die Berechnung des Interquartilsabstand, der Differenz des 75% Quantils und des 25% Quantils, erfolgt mit der Funktion IQR(). Die Spannweite (die Differenz zwischen größten und kleinsten Wert der Datenreihe) wird Ihnen nicht direkt angegeben. Sie können sich aber mit der Funktion range() das Minimum und das Maximum der Variable ausgeben lassen. In Abbildung 7 stellen wir die Verwendung einiger Streuungsmaße am IQ unserer Beispieldatei bsp01 vor. In Abbildung 8 zeigen wir Ihnen verschiedene Verteilungen mit zugehöriger Standardabweichung. # Berechnung von Streuungsmaßen der Variable IQ des Dataframe bsp01 attach(bsp01) # Varianz und Standardabweichung des IQ var(iq) sd(iq) # Interquartilsabstand und Range IQR(IQ) range(iq) # Spannweite max(iq)-min(iq) # Vergleich empirische Varianz vs. korrigierte Stichprobenvarianz # empirische Varianz sum((iq-mean(iq))^2/length(iq)) # korrigierte stichprobenvarianz var(iq) detach(bsp01) Abbildung 7. Berechnung von Streuungsmaßen mit R. 6

7 Abbildung 8. Verschiedene Verteilungen mit gleichem Mittelwert und unterschiedlichen Standardabweichungen (SD). 3.5 Standardisierung: z-werte Die Lage und Streuungsmaße die Sie bisher kennengelernt, haben sind in ihrer Größe abhängig von der jeweiligen Einheit der zugrundeliegenden Daten. Es kann natürlich vorkommen, dass Sie Werte gleicher Gegenstandsbereich miteinander vergleichen wollen, die unterschiedlich skaliert sind oder aber Sie wollen die relativen Abstände bzgl. einer gegebenen Verteilung bewerten. Zur Veranschaulichung betrachten wir das folgende Beispiel (der dazugehörige Quellcode findet sich in Abbildung 9). Die mittlere Körpergröße von Männern sollte in einer repräsentativen Stichprobe größer sein als die Körpergröße von Frauen. Betrachten wir die Mittelwerte der Männer (x = 182 cm) und der Frauen (x = 164) in unserem Beispieldatensatz, sehen wir diese Unterschiede im Mittelwert. Was wir aber nicht wissen ist, ob eine Frau mit 182 cm Körpergröße relativ zu den anderen Frauen größer ist als ein Mann mit der Größe von 200 cm relativ zu den anderen Männern. Um diese Frage zu beantworten helfen sogenannte Standardisierungsverfahren. Standardisierungen bieten die Möglichkeit Daten zu vergleichen, die ursprünglich unterschiedliche Skalierungen haben oder, wie in unserem Beispiel, aus unterschiedlichen Populationen stammen. Es gibt mehrere standardisierte Skalen (z.b. IQ Werte oder Abiturnoten) die geläufigste und grundlegendste ist jedoch die z-standardisierung. Diese wird in R über die Funktion scale() ausgeführt. Die z- Standardisierung erfolgt, indem jeder einzelne Messwert durch die Standardabweichung geteilt wird (Formel 6). Die neuen Daten haben dabei die Eigenschaft, dass der Mittelwert gleich null und die Standardabweichung gleich 1 ist. Jeder einzelne Messwert kann nun auch relativ zu jedem anderen Messwert mit ursprünglich anderer Skalierung verglichen werden. 7

8 (6) # Mittelwerte der Körpergröße von Männer und Frauen height_male <- subset(height, sex=="male") height_female <- subset(height, sex=="female") mean(height_male) mean(height_female) # z-standaradisierung z_height_male <- scale(height_male) z_height_female <- scale(height_female) # Mittelwert z_standardisierter Werte ist 0 (gerundet auf 4 Kommastellen) round(mean(z_height_male),4) round(mean(z_height_female),4) # Standardabweichung von 1 round(sd(z_height_male),4) round(sd(z_height_female),4) # Wie groß ist eine Frau von 182 cm relativ zu den anderen Frauen? (182-mean(height_female))/sd(height_female) # Wie groß ist ein Mann von 200 cm relativ zu den anderen Männern? (200-mean(height_male))/sd(height_male) ## relativ zur jeweiligen Bezugsgruppe ist eine Frau von 182 cm ## größer als ein Mann von 200 cm Körpergröße Abbildung 9. Quellcode für die z-standardisierung. 3.6 Weiterführende Deskriptive Statistik Es gibt eine ganze Reihe weitere Funktionen der deskriptiven Statistik. Wir haben einige in Tabelle 1 ohne Anspruch auf Vollständigkeit zusammengestellt. Sie werden im Laufe Ihrer Nutzung von R merken, dass Sie mit den gängigen Lage und Streuungsmaßen ziemlich viel erreichen können, wenn Sie diese in eigenen Funktionen (Kapitel 5) nutzen. In verschiedenen Paketen finden Sie weitere Funktionen. Auch hier lohnt sich die Such im Internet. Tabelle 1. Wichtige Funktionen der deskriptiven Statistik. Statistische Funktionen in R mean median var sd quantile min max which.min which.max table IQR range summary length Beschreibung Mittelwert Median korrigierte Stichprobenvarianz Standardabweichung Quantil Minimum Maximum Welcher Wert bildet das Minimum Welcher Wert bildet das Maximum Häufigkeitstabelle Interquartilabstand Spannweite Zusammenfassung deskriptiver Kennziffern Anzahl der Elemente 8

9 3.7 Literatur Pedersen, W. C., Miller, L., Putcha-Bhagavatula, A. D., & Yang, Y. (2002). Evolved Sex Differences in the Number of Partners Desired? The Long and the Short of It. Psychological Science (Wiley Blackwell), 13(2), 157. Sedlmeier, P. & Renkewitz, F. (2013). Forschungsmethoden und Statistik: Ein Lehrbuch für Psychologen und Sozialwissenschaftler (2. überarbeitete und erweiterte Auflage). München, Pearson. 9

1,11 1,12 1,13 1,14 1,15 1,16 1,17 1,17 1,17 1,18

1,11 1,12 1,13 1,14 1,15 1,16 1,17 1,17 1,17 1,18 3. Deskriptive Statistik Ziel der deskriptiven (beschreibenden) Statistik (explorativen Datenanalyse) ist die übersichtliche Darstellung der wesentlichen in den erhobenen Daten enthaltene Informationen

Mehr

Methoden der empirischen Sozialforschung I

Methoden der empirischen Sozialforschung I Methoden der empirischen Sozialforschung I Annelies Blom, PhD TU Kaiserslautern Wintersemester 2011/12 Übersicht Quantitative Datenauswertung: deskriptive und induktive Statistik Wiederholung: Die wichtigsten

Mehr

Auswertung und Darstellung wissenschaftlicher Daten (1)

Auswertung und Darstellung wissenschaftlicher Daten (1) Auswertung und Darstellung wissenschaftlicher Daten () Mag. Dr. Andrea Payrhuber Zwei Schritte der Auswertung. Deskriptive Darstellung aller Daten 2. analytische Darstellung (Gruppenvergleiche) SPSS-Andrea

Mehr

2. Deskriptive Statistik 2.1. Häufigkeitstabellen, Histogramme, empirische Verteilungsfunktionen

2. Deskriptive Statistik 2.1. Häufigkeitstabellen, Histogramme, empirische Verteilungsfunktionen 4. Datenanalyse und Modellbildung Deskriptive Statistik 2-1 2. Deskriptive Statistik 2.1. Häufigkeitstabellen, Histogramme, empirische Verteilungsfunktionen Für die Auswertung einer Messreihe, die in Form

Mehr

Grundlagen quantitativer Sozialforschung Interferenzstatistische Datenanalyse in MS Excel

Grundlagen quantitativer Sozialforschung Interferenzstatistische Datenanalyse in MS Excel Grundlagen quantitativer Sozialforschung Interferenzstatistische Datenanalyse in MS Excel 16.11.01 MP1 - Grundlagen quantitativer Sozialforschung - (4) Datenanalyse 1 Gliederung Datenanalyse (inferenzstatistisch)

Mehr

Einfache Statistiken in Excel

Einfache Statistiken in Excel Einfache Statistiken in Excel Dipl.-Volkswirtin Anna Miller Bergische Universität Wuppertal Schumpeter School of Business and Economics Lehrstuhl für Internationale Wirtschaft und Regionalökonomik Raum

Mehr

Deskriptive Statistik

Deskriptive Statistik Deskriptive Statistik In der beschreibenden Statistik werden Methoden behandelt, mit deren Hilfe man Daten übersichtlich darstellen und kennzeichnen kann. Die Urliste (=Daten in der Reihenfolge ihrer Erhebung)

Mehr

Auswertung mit dem Statistikprogramm SPSS: 30.11.05

Auswertung mit dem Statistikprogramm SPSS: 30.11.05 Auswertung mit dem Statistikprogramm SPSS: 30.11.05 Seite 1 Einführung SPSS Was ist eine Fragestellung? Beispiel Welche statistische Prozedur gehört zu welcher Hypothese? Statistische Berechnungen mit

Mehr

Eine computergestützte Einführung mit

Eine computergestützte Einführung mit Thomas Cleff Deskriptive Statistik und Explorative Datenanalyse Eine computergestützte Einführung mit Excel, SPSS und STATA 3., überarbeitete und erweiterte Auflage ^ Springer Inhaltsverzeichnis 1 Statistik

Mehr

2. Eindimensionale (univariate) Datenanalyse

2. Eindimensionale (univariate) Datenanalyse 2. Eindimensionale (univariate) Datenanalyse Dr. Antje Kiesel Institut für Angewandte Mathematik WS 2011/2012 Kennzahlen, Statistiken In der Regel interessieren uns nicht so sehr die beobachteten Einzeldaten

Mehr

UNIVARIATE DATENANALYSE STATISTISCHE MASSZAHLEN MODUL 7 PROSEMINAR ANALYSE UND DARSTELLUNG VON DATEN I (DESKRIPTIVE STATISTIK)

UNIVARIATE DATENANALYSE STATISTISCHE MASSZAHLEN MODUL 7 PROSEMINAR ANALYSE UND DARSTELLUNG VON DATEN I (DESKRIPTIVE STATISTIK) INSTITUT FÜR ERZIEHUNGSWISSENSCHAFT - UNIVERSITÄT SALZBURG PROSEMINAR ANALYSE UND DARSTELLUNG VON DATEN I (DESKRIPTIVE STATISTIK) GÜNTER HAIDER WS 1997/98 MODUL 7 UNIVARIATE DATENANALYSE STATISTISCHE MASSZAHLEN

Mehr

1 Einführung in RStudio

1 Einführung in RStudio Markus Burkhardt (markus.burkhardt@psychologie.tu-chemnitz.de) Inhalt 1.1 Ziel... 1 1.2 Installation... 2 1.3 Nutzung von RStudio... 2 1.4 Ein neues Projekt... 3 1.5 Einlesen von Daten... 3 1.6 Einlesen

Mehr

Verteilungsanalyse. Johannes Hain. Lehrstuhl für Mathematik VIII Statistik 1/35

Verteilungsanalyse. Johannes Hain. Lehrstuhl für Mathematik VIII Statistik 1/35 Verteilungsanalyse Johannes Hain Lehrstuhl für Mathematik VIII Statistik 1/35 Datentypen Als Sammeln von Daten bezeichnet man in der Statistik das Aufzeichnen von Fakten. Erhobene Daten klassifziert man

Mehr

Grundlagen der Datenanalyse am Beispiel von SPSS

Grundlagen der Datenanalyse am Beispiel von SPSS Grundlagen der Datenanalyse am Beispiel von SPSS Einführung Dipl. - Psych. Fabian Hölzenbein hoelzenbein@psychologie.uni-freiburg.de Einführung Organisatorisches Was ist Empirie? Was ist Statistik? Dateneingabe

Mehr

Elisabeth Raab-Steiner/Michael Benesch. Der Fragebogen. Von der Forschungsidee zur SPSS/PASW-Auswertung. 2., aktualisierte Auflage. facultas.

Elisabeth Raab-Steiner/Michael Benesch. Der Fragebogen. Von der Forschungsidee zur SPSS/PASW-Auswertung. 2., aktualisierte Auflage. facultas. Elisabeth Raab-Steiner/Michael Benesch Der Fragebogen Von der Forschungsidee zur SPSS/PASW-Auswertung 2., aktualisierte Auflage facultas.wuv Inhaltsverzeichnis 1 Elementare Definitionen 11 1.1 Deskriptive

Mehr

Übung Statistik I Statistik mit Stata SS07-14.05.2007 5. Dokumentation der Datenanalyse, Datentransformationen II und Univariate Statistiken II

Übung Statistik I Statistik mit Stata SS07-14.05.2007 5. Dokumentation der Datenanalyse, Datentransformationen II und Univariate Statistiken II Übung Statistik I Statistik mit Stata SS07-14.05.2007 5. Dokumentation der Datenanalyse, Datentransformationen II und Univariate Statistiken II Andrea Kummerer (M.A.) Oec R. I-53 Sprechstunde: Di. 15-16

Mehr

Grundlagen der Inferenzstatistik: Was Ihnen nicht erspart bleibt!

Grundlagen der Inferenzstatistik: Was Ihnen nicht erspart bleibt! Grundlagen der Inferenzstatistik: Was Ihnen nicht erspart bleibt! 1 Einführung 2 Wahrscheinlichkeiten kurz gefasst 3 Zufallsvariablen und Verteilungen 4 Theoretische Verteilungen (Wahrscheinlichkeitsfunktion)

Mehr

Medizinische Biometrie (L5)

Medizinische Biometrie (L5) Medizinische Biometrie (L5) Vorlesung II Daten Deskription Prof. Dr. Ulrich Mansmann Institut für Medizinische Informationsverarbeitung, Biometrie und Epidemiologie mansmann@ibe.med.uni-muenchen.de IBE,

Mehr

SFB 833 Bedeutungskonstitution. Kompaktkurs. Datenanalyse. Projekt Z2 Tübingen, Mittwoch, 18. und 20. März 2015

SFB 833 Bedeutungskonstitution. Kompaktkurs. Datenanalyse. Projekt Z2 Tübingen, Mittwoch, 18. und 20. März 2015 SFB 833 Bedeutungskonstitution Kompaktkurs Datenanalyse Projekt Z2 Tübingen, Mittwoch, 18. und 20. März 2015 Messen und Skalen Relativ (Relationensystem): Menge A von Objekten und eine oder mehrere Relationen

Mehr

Statistik und Wahrscheinlichkeitsrechnung

Statistik und Wahrscheinlichkeitsrechnung Statistik und Wahrscheinlichkeitsrechnung Übung 2 28.02.2008 1 Inhalt der heutigen Übung Beschreibende Statistik Gemeinsames Lösen der Übungsaufgaben 2.1: Häufigkeitsverteilung 2.2: Tukey Boxplot 25:Korrelation

Mehr

Evaluation der Normalverteilungsannahme

Evaluation der Normalverteilungsannahme Evaluation der Normalverteilungsannahme. Überprüfung der Normalverteilungsannahme im SPSS P. Wilhelm; HS SPSS bietet verschiedene Möglichkeiten, um Verteilungsannahmen zu überprüfen. Angefordert werden

Mehr

Analog zu Aufgabe 16.1 werden die Daten durch folgenden Befehl eingelesen: > kredit<-read.table("c:\\compaufg\\kredit.

Analog zu Aufgabe 16.1 werden die Daten durch folgenden Befehl eingelesen: > kredit<-read.table(c:\\compaufg\\kredit. Lösung 16.3 Analog zu Aufgabe 16.1 werden die Daten durch folgenden Befehl eingelesen: > kredit

Mehr

Datenanalyse und Statistik

Datenanalyse und Statistik Datenanalyse und Statistik p. 1/44 Datenanalyse und Statistik Vorlesung 2 (Graphik I) K.Gerald van den Boogaart http://www.stat.boogaart.de Datenanalyse und Statistik p. 2/44 Daten Schätzung Test Mathe

Mehr

Verteilungsanalyse. Johannes Hain. Lehrstuhl für Mathematik VIII Statistik 1/31

Verteilungsanalyse. Johannes Hain. Lehrstuhl für Mathematik VIII Statistik 1/31 Verteilungsanalyse Johannes Hain Lehrstuhl für Mathematik VIII Statistik 1/31 Datentypen Als Sammeln von Daten bezeichnet man in der Statistik das Aufzeichnen von Fakten. Erhobene Daten klassifziert man

Mehr

3.2 Bivariate Verteilungen

3.2 Bivariate Verteilungen 3.2 Bivariate Verteilungen zwei Variablen X, Y werden gemeinsam betrachtet (an jedem Objekt i, i = 1,..., n, werden gleichzeitig zwei Merkmale beobachtet) Beobachtungswerte sind Paare/Kombinationen von

Mehr

Univariate/ multivariate Ansätze. Klaus D. Kubinger. Test- und Beratungsstelle. Effektgrößen

Univariate/ multivariate Ansätze. Klaus D. Kubinger. Test- und Beratungsstelle. Effektgrößen Univariate/ multivariate Ansätze Klaus D. Kubinger Effektgrößen Rasch, D. & Kubinger, K.D. (2006). Statistik für das Psychologiestudium Mit Softwareunter-stützung zur Planung und Auswertung von Untersuchungen

Mehr

Häufigkeitstabellen. Balken- oder Kreisdiagramme. kritischer Wert für χ2-test. Kontingenztafeln

Häufigkeitstabellen. Balken- oder Kreisdiagramme. kritischer Wert für χ2-test. Kontingenztafeln Häufigkeitstabellen Menüpunkt Data PivotTable Report (bzw. entsprechendes Icon): wähle Data Range (Zellen, die die Daten enthalten + Zelle mit Variablenname) wähle kategoriale Variable für Spalten- oder

Mehr

Tabelle 6a: Deskriptive Statistiken der metrischen Variablen

Tabelle 6a: Deskriptive Statistiken der metrischen Variablen Ergebnisse 77 5 Ergebnisse Das folgende Kapitel widmet sich der statistischen Auswertung der Daten zur Ü- berprüfung der Hypothesen. Die hier verwendeten Daten wurden mit den in 4.3 beschriebenen Instrumenten

Mehr

Der Internetdienst für Ihre Online-Umfragen. Leitfaden statistische Auswertung

Der Internetdienst für Ihre Online-Umfragen. Leitfaden statistische Auswertung Der Internetdienst für Ihre Online-Umfragen Leitfaden statistische Auswertung Weitere in dieser Reihe bei 2ask erschienene Leitfäden Allgemeiner Leitfaden zur Fragebogenerstellung Sie möchten einen Fragebogen

Mehr

Norm- vs. Kriteriumsorientiertes Testen

Norm- vs. Kriteriumsorientiertes Testen Norm- vs. Kriteriumsorientiertes Testen Aus psychologischen Test ergibt sich in der Regel ein numerisches Testergebnis, das Auskunft über die Merkmalsausprägung der Testperson geben soll. Die aus der Testauswertung

Mehr

Kapitel 27 Distanz- und Ähnlichkeitsmaße

Kapitel 27 Distanz- und Ähnlichkeitsmaße Kapitel 7 Distanz- und Ähnlichkeitsmaße 7.1 Einführung Sowohl Distanz- als auch Ähnlichkeitsmaße dienen dazu, die Ähnlichkeit verschiedener Fälle oder Variablen zu quantifizieren. Beide Maße untersuchen,

Mehr

Übungsserie Nr. 10 mit Lösungen

Übungsserie Nr. 10 mit Lösungen Übungsserie Nr. 10 mit Lösungen 1 Ein Untersuchungsdesign sieht einen multivariaten Vergleich einer Stichprobe von Frauen mit einer Stichprobe von Männern hinsichtlich der Merkmale X1, X2 und X3 vor (Codierung:

Mehr

SPSS-Skriptum. 1. Vorbereitungen für die Arbeit mit SPSS (im Seminar)

SPSS-Skriptum. 1. Vorbereitungen für die Arbeit mit SPSS (im Seminar) Die folgenden Erklärungen und Abbildungen sollen den Umgang mit SPSS im Rahmen des POK erleichtern. Diese beschreiben nicht alle Möglichkeiten, die SPSS bietet, sondern nur die Verfahren, die im Seminar

Mehr

0 Einführung: Was ist Statistik

0 Einführung: Was ist Statistik 0 Einführung: Was ist Statistik 1 Datenerhebung und Messung Die Messung Skalenniveaus 2 Univariate deskriptive Statistik 3 Multivariate Statistik 4 Regression 5 Ergänzungen Grundbegriffe Statistische Einheit,

Mehr

Statistik mit Excel 2010. Themen-Special. Peter Wies. 1. Ausgabe, September 2011 W-EX2010S

Statistik mit Excel 2010. Themen-Special. Peter Wies. 1. Ausgabe, September 2011 W-EX2010S Statistik mit Excel 2010 Peter Wies 1. Ausgabe, September 2011 Themen-Special W-EX2010S 3 Statistik mit Excel 2010 - Themen-Special 3 Statistische Maßzahlen In diesem Kapitel erfahren Sie wie Sie Daten

Mehr

Einführung in die Statistik mir R

Einführung in die Statistik mir R Einführung in die Statistik mir R ww w. syn t egris.de Überblick GESCHÄFTSFÜHRUNG Andreas Baumgart, Business Processes and Service Gunar Hofmann, IT Solutions Sven-Uwe Weller, Design und Development Jens

Mehr

Webergänzung zu Kapitel 10

Webergänzung zu Kapitel 10 Webergänzung zu Kapitel 10 10.1.4 Varianzanalyse (ANOVA: analysis of variance) Im Kapitel 10 haben wir uns hauptsächlich mit Forschungsbeispielen beschäftigt, die nur zwei Ergebnissätze hatten (entweder

Mehr

Willkommen zur Vorlesung Statistik

Willkommen zur Vorlesung Statistik Willkommen zur Vorlesung Statistik Thema dieser Vorlesung: Varianzanalyse Prof. Dr. Wolfgang Ludwig-Mayerhofer Universität Siegen Philosophische Fakultät, Seminar für Sozialwissenschaften Prof. Dr. Wolfgang

Mehr

Grundbegriffe der Beschreibenden Statistik

Grundbegriffe der Beschreibenden Statistik Grundbegriffe der Beschreibenden Statistik 1. Datenmatrix und Messniveaus...3 1.1. Merkmale, Datenmatrix, uni- und multivariate Analysen...3 1.2. Messniveaus (Skalentypen)...4 2. Ausgewählte Verfahren

Mehr

Einseitig gerichtete Relation: Mit zunehmender Höhe über dem Meeresspiegel sinkt im allgemeinen die Lufttemperatur.

Einseitig gerichtete Relation: Mit zunehmender Höhe über dem Meeresspiegel sinkt im allgemeinen die Lufttemperatur. Statistik Grundlagen Charakterisierung von Verteilungen Einführung Wahrscheinlichkeitsrechnung Wahrscheinlichkeitsverteilungen Schätzen und Testen Korrelation Regression Einführung Die Analyse und modellhafte

Mehr

Veranstaltungsort Bildungsherberge der Studierendenschaft der FernUniversität Hagen

Veranstaltungsort Bildungsherberge der Studierendenschaft der FernUniversität Hagen Bildungsurlaub-Seminare: Lerninhalte und Programm Seminartitel SPSS für Psychologen/innen (BH15113) Termin Mo, den 18.05.bis Fr, den 22.05.2015 (40 UStd.) Veranstaltungsort Bildungsherberge der Studierendenschaft

Mehr

Bachelorabschlussseminar Dipl.-Kfm. Daniel Cracau

Bachelorabschlussseminar Dipl.-Kfm. Daniel Cracau 1 Einführung in die statistische Datenanalyse Bachelorabschlussseminar Dipl.-Kfm. Daniel Cracau 2 Gliederung 1.Grundlagen 2.Nicht-parametrische Tests a. Mann-Whitney-Wilcoxon-U Test b. Wilcoxon-Signed-Rank

Mehr

Statistik im Bachelor-Studium der BWL und VWL

Statistik im Bachelor-Studium der BWL und VWL Max C. Wewel Statistik im Bachelor-Studium der BWL und VWL Methoden, Anwendung, Interpretation Mit herausnehmbarer Formelsammlung ein Imprint von Pearson Education München Boston San Francisco Harlow,

Mehr

Univariate Lineare Regression. (eine unabhängige Variable)

Univariate Lineare Regression. (eine unabhängige Variable) Univariate Lineare Regression (eine unabhängige Variable) Lineare Regression y=a+bx Präzise lineare Beziehung a.. Intercept b..anstieg y..abhängige Variable x..unabhängige Variable Lineare Regression y=a+bx+e

Mehr

Methoden Quantitative Datenanalyse

Methoden Quantitative Datenanalyse Leitfaden Universität Zürich ISEK - Andreasstrasse 15 CH-8050 Zürich Telefon +41 44 635 22 11 Telefax +41 44 635 22 19 www.isek.uzh.ch 11. September 2014 Methoden Quantitative Datenanalyse Vorbereitung

Mehr

Schätzer (vgl. Kapitel 1): Stichprobenmittel X N. Stichprobenmedian X N

Schätzer (vgl. Kapitel 1): Stichprobenmittel X N. Stichprobenmedian X N Prof. Dr. J. Franke Statistik II für Wirtschaftswissenschaftler 8.1 Schätzer für Lage- und Skalenparameter und Verteilungsmodellwahl Lageparameter (l(x + a) = l(x) + a): Erwartungswert EX Median von X

Mehr

Skript zur Übung: Grundlagen der empirischen Sozialforschung - Datenanalyse

Skript zur Übung: Grundlagen der empirischen Sozialforschung - Datenanalyse Skript zur Übung: Grundlagen der empirischen Sozialforschung - Datenanalyse Phasen des Forschungsprozesses Auswahl des Forschungsproblems Theoriebildung Theoretische Phase Konzeptspezifikation / Operationalisierung

Mehr

Prof. Dr. Gabriele Helga Franke TESTTHEORIE UND TESTKONSTRUKTION

Prof. Dr. Gabriele Helga Franke TESTTHEORIE UND TESTKONSTRUKTION Prof. Dr. Gabriele Helga Franke TESTTHEORIE UND TESTKONSTRUKTION 2. FS Master Rehabilitationspsychologie, SoSe 2012 Faktorenanalyse/ faktorielle Validität 2 Einleitung Allgemeines zu Faktorenanalysen (FA)

Mehr

Varianzanalytische Methoden Zweifaktorielle Versuchspläne 4/13. Durchführung in SPSS (File Trait Angst.sav)

Varianzanalytische Methoden Zweifaktorielle Versuchspläne 4/13. Durchführung in SPSS (File Trait Angst.sav) Zweifaktorielle Versuchspläne 4/13 Durchführung in SPSS (File Trait Angst.sav) Analysieren > Allgemeines Lineares Modell > Univariat Zweifaktorielle Versuchspläne 5/13 Haupteffekte Geschlecht und Gruppe

Mehr

Korrelation - Regression. Berghold, IMI

Korrelation - Regression. Berghold, IMI Korrelation - Regression Zusammenhang zwischen Variablen Bivariate Datenanalyse - Zusammenhang zwischen 2 stetigen Variablen Korrelation Einfaches lineares Regressionsmodell 1. Schritt: Erstellung eines

Mehr

Prüfen von Mittelwertsunterschieden: t-test

Prüfen von Mittelwertsunterschieden: t-test Prüfen von Mittelwertsunterschieden: t-test Sven Garbade Fakultät für Angewandte Psychologie SRH Hochschule Heidelberg sven.garbade@hochschule-heidelberg.de Statistik 1 S. Garbade (SRH Heidelberg) t-test

Mehr

90-minütige Klausur Statistik für Studierende der Kommunikationswissenschaft

90-minütige Klausur Statistik für Studierende der Kommunikationswissenschaft Prof. Dr. Helmut Küchenhoff SS08 90-minütige Klausur Statistik für Studierende der Kommunikationswissenschaft am 22.7.2008 Anmerkungen Überprüfen Sie bitte sofort, ob Ihre Angabe vollständig ist. Sie sollte

Mehr

Forschungsmethoden und Statistik in der Psychologie

Forschungsmethoden und Statistik in der Psychologie Peter Sedlmeier Frank Renkewitz Forschungsmethoden und Statistik in der Psychologie PEARSON Studium ein Imprint von Pearson Education München Boston San Francisco Harlow, England Don Mills, Ontario Sydney

Mehr

Anhang A: Fragebögen und sonstige Unterlagen

Anhang A: Fragebögen und sonstige Unterlagen Anhang Anhang A: Fragebögen und sonstige Unterlagen A.: Flyer zur Probandenrekrutierung 46 A.: Fragebogen zur Meditationserfahrung 47 48 A.3: Fragebogen Angaben zur Person 49 5 5 A.4: Termin- und Einladungsschreiben

Mehr

12. Vergleich mehrerer Stichproben

12. Vergleich mehrerer Stichproben 12. Vergleich mehrerer Stichproben Dr. Antje Kiesel Institut für Angewandte Mathematik WS 2011/2012 Häufig wollen wir verschiedene Populationen, Verfahren, usw. miteinander vergleichen. Beipiel: Vergleich

Mehr

Schätzung des Lifetime Values von Spendern mit Hilfe der Überlebensanalyse

Schätzung des Lifetime Values von Spendern mit Hilfe der Überlebensanalyse Schätzung Lifetime Values von Spenn mit Hilfe Überlebensanalyse Einführung in das Verfahren am Beispiel Einzugsgenehmigung Überlebensanalysen o Ereignisdatenanalysen behandeln das Problem, mit welcher

Mehr

Analyse bivariater Kontingenztafeln

Analyse bivariater Kontingenztafeln Analyse bivariater Kontingenztafeln Werden zwei kategoriale Merkmale mit nicht zu vielen möglichen Ausprägungen gemeinsam analysiert, so kommen zur Beschreibung der gemeinsamen Verteilung im allgemeinen

Mehr

Prof. Dr. P. von der Lippe Statistik I NK SS 2002 Seite 1

Prof. Dr. P. von der Lippe Statistik I NK SS 2002 Seite 1 Prof. Dr. P. von der Lippe Statistik I NK SS 2002 Seite 1 Aufgabe 1 a) BWL-Student S hat von seinem Lieblingsonkel 10.000 geschenkt bekommen mit der Auflage damit etwas Vernünftiges zu machen. Nachdem

Mehr

Felix-Nicolai Müller. Seminar Fragebogenmethodik - WS2009/2010 - Universität Trier Dr. Dirk Kranz 24.11.2009

Felix-Nicolai Müller. Seminar Fragebogenmethodik - WS2009/2010 - Universität Trier Dr. Dirk Kranz 24.11.2009 Cohen s Kappa Felix-Nicolai Müller Seminar Fragebogenmethodik - WS2009/2010 - Universität Trier Dr. Dirk Kranz 24.11.2009 Felix-Nicolai Müller Cohen s Kappa 24.11.2009 1 / 21 Inhaltsverzeichnis 1 2 3 4

Mehr

Wahrscheinlichkeitsrechnung anhand realer Situationen

Wahrscheinlichkeitsrechnung anhand realer Situationen MaMaEuSch Management Mathematics for European Schools http://www.mathematik.unikl.de/ mamaeusch Wahrscheinlichkeitsrechnung anhand realer Situationen Paula Lagares Barreiro 1 Frederico Perea Rojas-Marcos

Mehr

GeODin Newsletter: Januar 2012

GeODin Newsletter: Januar 2012 Beyond Geology 25: Ein neues Eingabegitter macht die Datenerfassung- und pflege mit den Proben-, Ausbau- und Sondierungseditoren viel übersichtlicher. Außerdem ein wichtiger Update-Hinweis! Eingabegitter

Mehr

Standardab er des. Testwert = 145.5 95% Konfidenzintervall. T df Sig. (2-seitig) Differenz Untere Obere -2.011 698.045-5.82-11.50 -.14.

Standardab er des. Testwert = 145.5 95% Konfidenzintervall. T df Sig. (2-seitig) Differenz Untere Obere -2.011 698.045-5.82-11.50 -.14. Aufgabe : einfacher T-Test Statistik bei einer Stichprobe Standardfehl Standardab er des Mittelwert weichung Mittelwertes 699 39.68 76.59 2.894 Test bei einer Sichprobe Testwert = 45.5 95% Konfidenzintervall

Mehr

Kapitel 3. Erste Schritte der Datenanalyse. 3.1 Einlesen und Überprüfen der Daten

Kapitel 3. Erste Schritte der Datenanalyse. 3.1 Einlesen und Überprüfen der Daten Kapitel 3 Erste Schritte der Datenanalyse 3.1 Einlesen und Überprüfen der Daten Nachdem die Daten erfasst worden sind, etwa mit Hilfe eines Fragebogens, ist die nächste Frage, wie ich sie in den Rechner

Mehr

IBM SPSS Statistics Base 21

IBM SPSS Statistics Base 21 IBM SPSS Statistics Base 21 Hinweis: Lesen Sie zunächst die allgemeinen Informationen unter Hinweise auf S. 343, bevor Sie dieses Informationsmaterial sowie das zugehörige Produkt verwenden. Diese Ausgabe

Mehr

Kontingenzkoeffizient (nach Pearson)

Kontingenzkoeffizient (nach Pearson) Assoziationsmaß für zwei nominale Merkmale misst die Unabhängigkeit zweier Merkmale gibt keine Richtung eines Zusammenhanges an 46 o jl beobachtete Häufigkeiten der Kombination von Merkmalsausprägungen

Mehr

Anwendung von Statistik in Excel Deskriptive Statistik und Wirtschaftsstatistik

Anwendung von Statistik in Excel Deskriptive Statistik und Wirtschaftsstatistik Anwendung von Statistik in Excel Deskriptive Statistik und Wirtschaftsstatistik Wintersemester 08/09 Kai Schaal Universität zu Köln Organisatorisches und Einleitung (1) Was, wann, wo? Anwendung von Statistik

Mehr

Linearer Zusammenhang von Datenreihen

Linearer Zusammenhang von Datenreihen Linearer Zusammenhang von Datenreihen Vielen Problemen liegen (möglicherweise) lineare Zusammenhänge zugrunde: Mein Internetanbieter verlangt eine Grundgebühr und rechnet minutenweise ab Ich bestelle ein

Mehr

Multivariate and Geostatistical Data Analysis. Multivariate and Geostatistical Data Analysis

Multivariate and Geostatistical Data Analysis. Multivariate and Geostatistical Data Analysis Multivariate and Geostatistical Data Analysis Multivariate and Geostatistical Data Analysis c 2012 Helmut Schaeben Geomathematics and Geoinformatics Technische Universität Bergakademie Freiberg, Germany

Mehr

Modul G.1 WS 07/08: Statistik 17.01.2008 1. Die Korrelation ist ein standardisiertes Maß für den linearen Zusammenhangzwischen zwei Variablen.

Modul G.1 WS 07/08: Statistik 17.01.2008 1. Die Korrelation ist ein standardisiertes Maß für den linearen Zusammenhangzwischen zwei Variablen. Modul G.1 WS 07/08: Statistik 17.01.2008 1 Wiederholung Kovarianz und Korrelation Kovarianz = Maß für den linearen Zusammenhang zwischen zwei Variablen x und y Korrelation Die Korrelation ist ein standardisiertes

Mehr

Statistische Verfahren für das Data Mining in einem Industrieprojekt

Statistische Verfahren für das Data Mining in einem Industrieprojekt Statistische Verfahren für das Data Mining in einem Industrieprojekt Thorsten Dickhaus Forschungszentrum Jülich GmbH Zentralinstitut für Angewandte Mathematik Telefon: 02461/61-4193 E-Mail: th.dickhaus@fz-juelich.de

Mehr

Marktliquidität von Aktien

Marktliquidität von Aktien Marktliquidität von Aktien Inauguraldissertation zur Erlangung der Würde eines Doctor rerum oeconomicarum der Wirtschafts- und Sozialwissenschaftlichen Fakultät der Universität Bern Lukas Roth Die Fakultät

Mehr

6. METRISCHE UND KATEGORIALE MERKMALE

6. METRISCHE UND KATEGORIALE MERKMALE 6. METRISCHE UND KATEGORIALE MERKMALE wenn an einer Beobachtungseinheit eine (oder mehrere) metrische und eine (oder mehrere) kategoriale Variable(n) erhoben wurden Beispiel: Haushaltsarbeit von Teenagern

Mehr

Der Chi Quadrat Test nicht nur für die digitalen Ziffernanalyse geeignet

Der Chi Quadrat Test nicht nur für die digitalen Ziffernanalyse geeignet Der Chi Quadrat Test nicht nur für die digitalen Ziffernanalyse geeignet 1. Einleitung Seit Anfang 2002 finden elektronische Betriebsprüfungen auf der Grundlage der Grundsätze zum Datenzugriff und zur

Mehr

Varianzanalyse * (1) Varianzanalyse (2)

Varianzanalyse * (1) Varianzanalyse (2) Varianzanalyse * (1) Einfaktorielle Varianzanalyse (I) Die Varianzanalyse (ANOVA = ANalysis Of VAriance) wird benutzt, um Unterschiede zwischen Mittelwerten von drei oder mehr Stichproben auf Signifikanz

Mehr

9. Schätzen und Testen bei unbekannter Varianz

9. Schätzen und Testen bei unbekannter Varianz 9. Schätzen und Testen bei unbekannter Varianz Dr. Antje Kiesel Institut für Angewandte Mathematik WS 2011/2012 Schätzen und Testen bei unbekannter Varianz Wenn wir die Standardabweichung σ nicht kennen,

Mehr

Kapitel 3. Zufallsvariable. Wahrscheinlichkeitsfunktion, Dichte und Verteilungsfunktion. Erwartungswert, Varianz und Standardabweichung

Kapitel 3. Zufallsvariable. Wahrscheinlichkeitsfunktion, Dichte und Verteilungsfunktion. Erwartungswert, Varianz und Standardabweichung Kapitel 3 Zufallsvariable Josef Leydold c 2006 Mathematische Methoden III Zufallsvariable 1 / 43 Lernziele Diskrete und stetige Zufallsvariable Wahrscheinlichkeitsfunktion, Dichte und Verteilungsfunktion

Mehr

14.01.14 DAS THEMA: INFERENZSTATISTIK II. Standardfehler Konfidenzintervalle Signifikanztests. Standardfehler

14.01.14 DAS THEMA: INFERENZSTATISTIK II. Standardfehler Konfidenzintervalle Signifikanztests. Standardfehler DAS THEMA: INFERENZSTATISTIK II INFERENZSTATISTISCHE AUSSAGEN Standardfehler Konfidenzintervalle Signifikanztests Standardfehler der Standardfehler Interpretation Verwendung 1 ZUR WIEDERHOLUNG... Ausgangspunkt:

Mehr

5.2 Optionen Auswahl der Statistiken, die bei der jeweiligen Prozedur zur Verfügung stehen.

5.2 Optionen Auswahl der Statistiken, die bei der jeweiligen Prozedur zur Verfügung stehen. 5 Statistik mit SPSS Die Durchführung statistischer Auswertungen erfolgt bei SPSS in 2 Schritten, der Auswahl der geeigneten Methode, bestehend aus Prozedur Variable Optionen und der Ausführung. 5.1 Variablen

Mehr

Box-and-Whisker Plot -0,2 0,8 1,8 2,8 3,8 4,8

Box-and-Whisker Plot -0,2 0,8 1,8 2,8 3,8 4,8 . Aufgabe: Für zwei verschiedene Aktien wurde der relative Kurszuwachs (in % beobachtet. Aus den jeweils 20 Quartaldaten ergaben sich die folgenden Box-Plots. Box-and-Whisker Plot Aktie Aktie 2-0,2 0,8,8

Mehr

Grundlagen von Versuchsmethodik und Datenanalyse

Grundlagen von Versuchsmethodik und Datenanalyse Grundlagen von Versuchsmethodik und Datenanalyse Der Anfang: Hypothesen über Ursache-Wirkungs-Zusammenhänge Ursache Wirkung Koffein verbessert Kurzzeitgedächtnis Gewaltfilme führen zu aggressivem Verhalten

Mehr

Statistische Software P. Fink. Statistische Software (R) Wiederholungshausübung SoSe 2015

Statistische Software P. Fink. Statistische Software (R) Wiederholungshausübung SoSe 2015 Allgmeine Hinweise Die Hausübung umfasst 7 Aufgaben mit insgesamt 120 Punkten. Erstellen Sie eine R Skript-Datei mit Ihrer Matrikelnummer als Dateinamen. Diese Datei enthält Ihren vollständigen und mit

Mehr

Einführung in R. Mike Kühne 1 Einführung in R

Einführung in R. Mike Kühne 1 Einführung in R Einführung in R Mike Kühne 1 Einführung in R 1 WAS IST R? 1 Was ist R? R ist eine Open-Source-Software sowie eine flexible Programmiersprache für statistische Datenanalyse und Grafikerstellung. Zugleich

Mehr

Multiple Regression. Ziel: Vorhersage der Werte einer Variable (Kriterium) bei Kenntnis der Werte von zwei oder mehr anderen Variablen (Prädiktoren)

Multiple Regression. Ziel: Vorhersage der Werte einer Variable (Kriterium) bei Kenntnis der Werte von zwei oder mehr anderen Variablen (Prädiktoren) Multiple Regression 1 Was ist multiple lineare Regression? Ziel: Vorhersage der Werte einer Variable (Kriterium) bei Kenntnis der Werte von zwei oder mehr anderen Variablen (Prädiktoren) Annahme: Der Zusammenhang

Mehr

KVP & Six Sigma. Hirschmann Automotive GmbH Thomas Zimmermann April 2009. Thomas Zimmermann Seite 1

KVP & Six Sigma. Hirschmann Automotive GmbH Thomas Zimmermann April 2009. Thomas Zimmermann Seite 1 Hirschmann Automotive GmbH Thomas Zimmermann April 2009 Thomas Zimmermann Seite 1 Vorstellung Gedanken zu KVP Was ist Six Sigma Wie passen diese Methoden zusammen Umsetzung bei Hirschmann Thomas Zimmermann

Mehr

Allgemeines Lineares Modell: Univariate Varianzanalyse und Kovarianzanalyse

Allgemeines Lineares Modell: Univariate Varianzanalyse und Kovarianzanalyse Allgemeines Lineares Modell: Univariate Varianzanalyse und Kovarianzanalyse Univariate Varianz- und Kovarianzanlyse, Multivariate Varianzanalyse und Varianzanalyse mit Messwiederholung finden sich unter

Mehr

Lineare Modelle in R: Einweg-Varianzanalyse

Lineare Modelle in R: Einweg-Varianzanalyse Lineare Modelle in R: Einweg-Varianzanalyse Achim Zeileis 2009-02-20 1 Datenaufbereitung Wie schon in der Vorlesung wollen wir hier zur Illustration der Einweg-Analyse die logarithmierten Ausgaben der

Mehr

Beispiel: Sonntagsfrage. Einführung in die induktive Statistik. Statistische Tests. Statistische Tests

Beispiel: Sonntagsfrage. Einführung in die induktive Statistik. Statistische Tests. Statistische Tests Beispiel: Sonntagsfrage Vier Wochen vor der österreichischen Nationalratswahl 1999 wurde 499 Haushalten die Sonntagsfrage gestellt: Falls nächsten Sonntag Wahlen wären, welche Partei würden Sie wählen?

Mehr

Abhängigkeit zweier Merkmale

Abhängigkeit zweier Merkmale Abhängigkeit zweier Merkmale Johannes Hain Lehrstuhl für Mathematik VIII Statistik 1/33 Allgemeine Situation Neben der Untersuchung auf Unterschiede zwischen zwei oder mehreren Untersuchungsgruppen hinsichtlich

Mehr

Varianzananalyse. How to do

Varianzananalyse. How to do Varianzananalyse How to do Die folgende Zusammenfassung zeigt beispielhaft, wie eine Varianzanalyse mit SPSS durchgeführt wird und wie die Ergebnisse in einem Empra-Bericht oder in einer Bachelor- oder

Mehr

Lösung zu Kapitel 11: Beispiel 1

Lösung zu Kapitel 11: Beispiel 1 Lösung zu Kapitel 11: Beispiel 1 Eine Untersuchung bei 253 Personen zur Kundenzufriedenheit mit einer Einzelhandelskette im Südosten der USA enthält Variablen mit sozialstatistischen Daten der befragten

Mehr

Weitere (wählbare) Kontraste in der SPSS Prozedur Allgemeines Lineares Modell

Weitere (wählbare) Kontraste in der SPSS Prozedur Allgemeines Lineares Modell Einfaktorielle Versuchspläne 27/40 Weitere (wählbare) Kontraste in der SPSS Prozedur Allgemeines Lineares Modell Abweichung Einfach Differenz Helmert Wiederholt Vergleich Jede Gruppe mit Gesamtmittelwert

Mehr

Bland-Altman-Plot in Excel 2010 erstellen

Bland-Altman-Plot in Excel 2010 erstellen Bland-Altman-Plot in Excel 2010 erstellen 1. Sie berechnen für jedes Messwertpaar den Mittelwert der beiden Methoden nach der Formel: (messwert_verfahren1 + messwert_verfahren2)/2, im Beispiel =(A5+B5)/2:

Mehr

Institut für Soziologie Dr. Christian Ganser. Methoden 2. Einführung, grundlegende PASW-Bedienung, univariate Statistik

Institut für Soziologie Dr. Christian Ganser. Methoden 2. Einführung, grundlegende PASW-Bedienung, univariate Statistik Institut für Soziologie Dr. Methoden 2 Einführung, grundlegende PASW-Bedienung, univariate Statistik Programm Wiederholung zentraler Aspekten der Übungen Literatur zur Veranstaltung Erste Schritte mit

Mehr

8. Methoden der klassischen multivariaten Statistik

8. Methoden der klassischen multivariaten Statistik 8. Methoden der klassischen multivariaten Statistik 8.1. Darstellung von Daten Voraussetzungen auch in diesem Kapitel: Grundgesamtheit (Datenraum) Ω von Objekten (Fällen, Instanzen), denen J-Tupel von

Mehr

Grundbegriffe der Statistik

Grundbegriffe der Statistik Grundbegriffe der Statistik Quelle: Statistica (2003). Auszug aus dem elektronischen Handbuch des Statistikprogramms Statistica 6.1. Tula, OK: StatSoft, Inc. 1 Inhaltsverzeichnis Überblick über Grundbegriffe

Mehr

Vergleich verschiedener Optimierungsansätze

Vergleich verschiedener Optimierungsansätze Vergleich verschiedener Optimierungsansätze Inhaltsverzeichnis 1 Einleitung... 2 2 Welchen Nutzen schafft munio?... 3 3 Analysen... 3 3.1 Schritt 1: Optimierung anhand von Indizes... 3 3.2 Schritt 2: Manuell

Mehr

Grundbegriffe (1) Grundbegriffe (2)

Grundbegriffe (1) Grundbegriffe (2) Grundbegriffe (1) S.1 Äquivalenzklasse Unter einer Äquivalenzklasse versteht man eine Klasse von Objekten, die man hinsichtlich bestimmter Merkmalsausprägungen als gleich (äquivalent) betrachtet. (z.b.

Mehr

Stichprobenauslegung. für stetige und binäre Datentypen

Stichprobenauslegung. für stetige und binäre Datentypen Stichprobenauslegung für stetige und binäre Datentypen Roadmap zu Stichproben Hypothese über das interessierende Merkmal aufstellen Stichprobe entnehmen Beobachtete Messwerte abbilden Schluss von der Beobachtung

Mehr

DATEN- ANALYSE. Marcus Hudec Christian Neumann. mit Excel. Institut für Statistik der Universität Wien

DATEN- ANALYSE. Marcus Hudec Christian Neumann. mit Excel. Institut für Statistik der Universität Wien DATEN- ANALYSE mit Excel Marcus Hudec Christian Neumann Institut für Statistik der Universität Wien Vorwort Wir leben im Jahrhundert der Statistik! lautet der Leitsatz von STAT 4 U, dem Projekt zur Vermittlung

Mehr