Statistische Datenanalyse mit R, Statistische Tests. Dr. Andrea Denecke Leibniz Universität IT-Services
|
|
- Bastian Bayer
- vor 6 Jahren
- Abrufe
Transkript
1 Statistische Datenanalyse mit R, Statistische Tests Dr. Andrea Denecke Leibniz Universität IT-Services
2 Testdatensätze In R kann man auf viele Testdatensätze zurückgreifen: Die Eingabe von try(data(package = datasets ))zeigt die im Paket datasets verfügbaren Datensätze mit kurzer Beschreibung, Zugriff erfolgt über data(name), weitere Informationen über help(name). Auch in weiteren Paketen gibt es eine Reihe an Testdatensätzen, z. B. im Paket car. Zugriff erfolgt wie oben beschrieben.
3 Statistische Tests Mittelwertvergleiche: Eine Fragestellung kann z.b. sein: Unterscheidet sich Gruppe A zu Gruppe B hinsichtlich des Merkmals C? Bevor ich einen statistischen Test anwenden kann, müssen einige Dinge geklärt werden: Ist die Fragestellung zweiseitig ( Unterscheiden sich A und B? ) oder einseitig ( Hat A höhere Werte als B? oder Hat A niedrigere Werte als B? ) Sind die Werte von C kategorial (z.b. ja, nein Antworten), ordinal (z.b. Schulnoten) oder metrisch (z.b. Körpergröße). Wenn metrisch: normalverteilt oder nicht normalverteilt? Haben die Gruppen A und B homogene Varianzen?
4 Mittelwertvergleiche Eine metrische Variable normal verteilt Ein-Stichproben T-test t.test() nicht normal verteilt Wilcoxon Test wilcox.test() Zwei metrische Variablen Korrelationsanalyse s. später Regressionsanalyse s. später Gepaarte Stichproben normal verteilt t.test() nicht normal verteilt wilcox.test() Metrische und kategoriale Variablen (unabhängige Stichproben) Verteilung Varianzen 2 Kategorien >2 Kategorien normal homogen T-test ANOVA nicht homog. Welch t-test nicht normal Wilcoxon test Kruskal-Wallis
5 Metrische Variablen Variablen auf Normalverteilung untersuchen: - visuelle Inspektion, z.b. durch Q-Q-plots, Boxplots (qqplot(), boxplot()) - Shapiro-Wilk test shapiro.test() wobei ein p-wert < 0.05 Hinweis auf eine Abweichung von der Normalverteilung ist - Unterschiede zwischen dem Mittelwert und dem Median der Variable weisen auf Abweichungen von der Normalverteilung hin ebenso wie Werte 0 der Kurtosis (Steilheit) und der Schiefe. (skewness(), kurtosis(), beide package e1071) - für Stichproben < 10 sollte generell keine Normalverteilung angenommen werden Variablen auf Varianzhomogenität untersuchen: - Visuelle Inspektion (boxplot()) - Levene Test (levenetest() - Bartlett Test für >2 Variablen (bartlett.test() Generell zeigt ein p-wert < 0.05 Varianzheterogenität an, teilweise wird 0.2 als Signifikanzgrenze empfohlen.
6 Ein-Stichproben T-Test Die Datei Rohre beinhaltet eine Stichprobe der Durchmesser einer Rohrlieferung. Der Zulieferer hat einen mittleren Durchmesser von 10cm zugesichert. Dies soll geprüft werden. Ist die Variable normal verteilt? Visuelle Inspektion (z.b. Boxplot, boxplot(rohre$diam)) und Shapiro-Wilk-Test ( shapiro.test(rohre$diam)) deuten nicht auf eine Abweichung von der Normalverteilung hin (p=0.2). Man würde also den parametrischen Ein-Stichproben T-Test anwenden zur Überprüfung der Hypothese.
7 Ein-Stichproben T-Test Der Befehl für den Test lautet: t.test(rohre$diam,mu=10, alternative = t ) Der p-wert von zeigt keine signifikante Abweichung der Stichprobe von dem vorgegebenen Durchmesser von 10cm an, also hat der Zulieferer seine Zusage gehalten (bzw. es kann ihm nichts Gegenteiliges bewiesen werden). Der Befehl für den entsprechenden nicht-parametrischen Test lautet: wilcox.test(rohre$diam, mu=10, alternative= t ) Beachten: im Prinzip sinnvoller wäre es, eine Grenze für die Abweichungen festzulegen, da man z.b. nur Rohre mit einem Durchmesser von z.b. 9,8 10,2 cm noch zusammenstecken kann und der Rest Schrott ist, also den Zulieferer auf diese Weise verpflichten muss, die Abweichungen klein zu halten.
8 Gepaarte Stichproben Der Testdatensatz Burt (package car ) enthält IQ-Werte von Zwillingen, einer wuchs bei den leiblichen Eltern auf (IQbio), der andere bei Zieheltern (IQfoster). Unterscheiden sich die beiden Gruppen hinsichtlich des IQ-Wertes? Die Werte scheinen normalverteilt und varianzhomogen zu sein, daher könnte man den T-Test für gepaarte Stichproben anwenden, man wählt zweiseitig, da man keine Vermutung hat, welche der Gruppen einen höheren IQ besitzt. Der p-wert von 0,902 zeigt, dass man keine Unterschiede im IQ zwischen den Gruppen feststellen kann, die Aufzucht durch fremde Eltern also keinen Einfluss auf den IQ hat. Die Befehle lauten: t.test(burt$iqbio, Burt$IQfoster, alternative= t, paired=true) bzw. nichtparametrisch wilcox.test(burt$iqbio, Burt$IQfoster,alternative= t, paired=true)
9 Unabhängige Stichproben Der Testdatensatz ToothGrowth enthält Daten zum Zahnwachstum bei Meerschweinchen bei drei unterschiedlichen Vitamin C Dosen und zwei Darreichungsformen. Zuerst soll untersucht werden, ob die Darreichungsform (Orangensaft oder Ascorbinsäure) des Vitamin C einen Einfluss auf das Zahnwachstum hat. Sind die len -Werte der beiden supp -Gruppen normalverteilt und varianzhomogen? Visuelle Inspektion über Boxplot: OJ zeigt schon eine recht schiefe Verteilung, VJ sieht relativ normalverteilt aus. Die Varianzen sehen relativ homogen aus. Bestätigung über Tests: Beachten: Um den Shapiro-Wilk-Test nach der Darreichungsform zu gruppieren, muss man den Befehl tapply(toothgrowth$len,toothgrowth$supp, shapiro.test) verwenden.
10 Unabhängige Stichproben Das Ergebnis des Shapiro-Wilk-Tests bestätigt unsere Beobachtung: p-wert OJ , VJ Beim Levene-Test levenetest(len ~ supp, data=toothgrowth)) bestätigt sich mit einem p-wert von auch unsere Beobachtung, dass die Varianzen als homogen angesehen werden können. Wir würden also auf einen nicht-parametrischen Test zurück greifen (da OJ nicht normalverteilt ist), in diesem Fall den Wilcoxon-Test für unabhängige Stichproben: wilcox.test(toothgrowth$len ~ ToothGrowth$supp, alternative="two.sided") Der p-wert von zeigt, dass keine signifikanten Unterschiede in der Zahnlänge bei den unterschiedlichen Darreichungsformen festgestellt werden können.
11 Unabhängige Stichproben Als nächstes würden wir gerne bei diesem Datensatz den Einfluss der Vitamin C-Dosis (dose) auf die Zahnlänge untersuchen. Auch hier untersuchen wir, ob die einzelnen Werte normalverteilt sind: boxplot(toothgrowth$len ~ ToothGrowth$dose) Die Boxen sehen halbwegs normalverteilt und varianzhomogen aus, der Shapiro-Wilk Test ( tapply(toothgrowth$len,toothgrowth$dose, shapiro.test)) zeigt auch keine Einwände gegen die Annahme der Normalverteilung (p-werte 0,25, 0,16 und 0,90). Beim Levene-Test (Überprüfung Varianzhomogenität) levenetest(toothgrowth$len ~ ToothGrowth$dose) erhalten wir allerdings eine Fehlermeldung!
12 Unabhängige Stichproben str(toothgrowth) zeigt, dass die Variable dose vom Typ numeric ist, supp hingegen factor. Der Levene-Test verlangt als Gruppierungsvariable einen Factor, also müssen wir die Variable abändern: ToothGrowth$doseF <- as.factor(toothgrowth$dose) Es wurde also im Datensatz eine neue Variable dosef angelegt mit den gleichen Werten, die aber als factor klassifiziert werden. Dann ergibt der Levene-Test levenetest(toothgrowth$len ~ ToothGrowth$doseF) einen p-wert von 0,53, Varianzhomogenität kann also angenommen werden.
13 Unabhängige Stichproben Man würde also einen parametrischen Test wählen, um Unterschiede zwischen den Gruppen heraus zu finden, da es mehr als zwei Gruppen sind, wählt man die ANOVA (nicht-parametrisch: Kruskal-Wallis): summary(aov(toothgrowth$len ~ ToothGrowth$doseF) Dieser Test ergibt einen p-wert von 1.23e-14, es liegen also signifikante Unterschiede zwischen den Gruppen vor. Wo genau diese Unterschiede liegen, kann man mit einem Post-Hoc Test nach Tukey untersuchen: TukeyHSD(aov(ToothGrowth$len ~ ToothGrowth$doseF)) Für alle drei Einzelvergleiche liegt der p-wert deutlich unter (hier 0.5/3 -> Bonferronisierung), es liegen also signifikante Unterschiede zwischen allen drei Gruppen vor.
14 Übung Öffnen Sie den Testdatensatz LakeHuron Welche Variablen enthält dieser Datensatz? Welche Fallzahl? Erzeugen Sie eine Grafik für die Häufigkeitsverteilung von x (Histogramm) Erzeugen Sie ein Liniendiagramm um die Entwicklung über die Jahre zu verfolgen
15 Lösung I Welche Variablen enthält dieser Datensatz? Welche Fallzahl? Der Datensatz LakeHuron besteht nur aus einer Variable, die als Time-Series von 1875 bis 1972 angelegt ist, also 98 Fälle beinhaltet (str(lakehuron)). Erzeugen Sie eine Grafik für die Häufigkeitsverteilung hist(lakehuron)
16 Lösung II Erzeugen Sie ein Liniendiagramm um die Entwicklung über die Jahre zu verfolgen. Eine Besonderheit der Daten/Variable ist, dass sie eine time series ist (str(lakehuron)). Es sind intern also schon die Jahreszahlen hinterlegt. Über die Eingabe von plot(lakehuron) würde man schon die gewünschte Grafik erhalten.
17 Mehr Übung Wir befinden uns im Jahr In 1889 wurde eine Fabrik errichtet an einem der Zuflüsse von Lake Huron. Beweisen Sie, dass die Einrichtung dieser Fabrik einen negativen Effekt auf den Wasserstand von Lake Huron hatte. Hierzu muss man zuerst die time series in einen Datensatz umwandeln: LakeHuronD <- as.data.frame(lakehuron) Dann die Jahreszahlen als Variable hinzu fügen: LakeHuronD$year <- 1875:1972 Danach benötigt man einen Teildatensatz, der nur die Daten von 1872 bis 1920 enthält
18 Mehr Übung 1. Anlegung eines neuen Datensatzes LakeHuron1920 LakeHuron1920 <- subset(lakehurond, year<=1920) 2. Erzeugen Sie eine neue Variable industry mit 1 = ohne Fabrik (vor 1889) 2 = mit Fabrik (von 1889 an) LakeHuron1920$industry <- recode (LakeHuron1920$year, 1875:1888 = 1; 1889:1920 = 2 ) 3. Anschauen der Variablen: liegt Normalverteilung und Varianzhomogenität vor?
19 Mehr Übung boxplot(lakehuron1920$x ~LakeHuron1920$industry) Der Boxplot zeigt relativ normalverteilte und varianzhomogene Daten. Bestätigung über Tests: Shapiro-Wilk Test: tapply(lakehuron1920$x, LakeHuron1920$industry, shapiro.test) Die p-werte liegen bei 0.89 und 0.29, es spricht also nichts gegen die Annahme der Normalverteilung. Levene Test levenetest(lakehuron1920$x ~ LakeHuron1920$industry) Ergebnis: p-wert ist 0.85, also keine statistische Differenz zwischen Varianzen feststellbar
20 Mehr Übung 4. Führen Sie einen t-test durch, um den Wasserstand vor und nach der Errichtung der Fabrik zu vergleichen. t.test(lakehuron1920$x~lakehuron1920$industry, alternative= greater, var.equal=true) Ergebnis: der p-wert für diesen Test ist 9.949e-12 Die Wasserstände von 1889 bis 1920 von Lake Huron zeigen eine signifikante Reduktion verglichen mit den Wasserständen von 1875 bis 1888 (p<0.01), mit der Errichtung der Fabrik sind die Wasserstände signifikant gesunken.
5. Lektion: Einfache Signifikanztests
Seite 1 von 7 5. Lektion: Einfache Signifikanztests Ziel dieser Lektion: Du ordnest Deinen Fragestellungen und Hypothesen die passenden einfachen Signifikanztests zu. Inhalt: 5.1 Zwei kategoriale Variablen
MehrUE Angewandte Statistik Termin 4 Gruppenvergleichstests
UE Angewandte Statistik Termin 4 Gruppenvergleichstests Martina Koller Institut für Pflegewissenschaft SoSe 2015 INHALT 1 Allgemeiner Überblick... 1 2 Normalverteilung... 2 2.1 Explorative Datenanalyse...
MehrBlockpraktikum zur Statistik mit R
Blockpraktikum zur Statistik mit R 08. Oktober 2010 Till Breuer, Sebastian Mentemeier und Matti Schneider Institut für Mathematische Statistik Universität Münster WS 2010/11 Gliederung 1 Ein-Stichproben-Fall
Mehr# Befehl für den Lilliefors-Test
1/5 Matthias Rudolf & Diana Vogel R-Kurs Graduiertenakademie September 2017 Loesungsskript: Tests 1a library(nortest) 1b lillie.test Befehl für den Lilliefors-Test 2a, Datensatz "Schachbeispiel einlesen"
MehrTesten von Unterschiedshypothesen mit parametrischen Verfahren Der t-test
Schäfer A & Schöttker-Königer T, Statistik und quantitative Methoden für (2015) Arbeitsblatt 1 SPSS Kapitel 5 Seite 1 Testen von Unterschiedshypothesen mit parametrischen Verfahren Der t-test Im Folgenden
MehrAufgaben zu Kapitel 8
Aufgaben zu Kapitel 8 Aufgabe 1 a) Berechnen Sie einen U-Test für das in Kapitel 8.1 besprochene Beispiel mit verbundenen Rängen. Die entsprechende Testvariable punkte2 finden Sie im Datensatz Rangdaten.sav.
MehrKategoriale und metrische Daten
Kategoriale und metrische Daten Johannes Hain Lehrstuhl für Mathematik VIII Statistik 1/14 Übersicht Abhängig von der Anzahl der Ausprägung der kategorialen Variablen unterscheidet man die folgenden Szenarien:
MehrStatistische Methoden in den Umweltwissenschaften
Statistische Methoden in den Umweltwissenschaften Post Hoc Tests A priori Tests (Kontraste) Nicht-parametrischer Vergleich von Mittelwerten 50 Ergebnis der ANOVA Sprossdichte der Seegräser 40 30 20 10
MehrEinfaktorielle Varianzanalyse
Kapitel 16 Einfaktorielle Varianzanalyse Im Zweistichprobenproblem vergleichen wir zwei Verfahren miteinander. Nun wollen wir mehr als zwei Verfahren betrachten, wobei wir unverbunden vorgehen. Beispiel
MehrBasis-Kurs Statistik und SPSS für Mediziner Lösungen. SPSS-Übung Statistische Tests
Basis-Kurs Statistik und SPSS für Mediziner Lösungen SPSS-Übung Statistische Tests Testentscheidung: Deskriptive Statistik Basis-Kurs Statistik und SPSS für Mediziner 2 Mit Datensatz Daten_SPSS_Kurs_I.sav
MehrFerienkurse Mathematik Sommersemester 2009
Ferienkurse Mathematik Sommersemester 2009 Statistik: Grundlagen 1.Aufgabenblatt mit praktischen R-Aufgaben Aufgabe 1 Lesen Sie den Datensatz kid.weights aus dem Paket UsingR ein und lassen sie die Hilfeseite
MehrOnline Statistik-Coaching
Online Statistik-Coaching Modul 3 Statistisches Testen - Auswahl der passenden Methode - Durchführung mit SPSS - Interpretation und Darstellung Dipl.-Math. Daniela Keller www.statistik-und-beratung.de
MehrStatistik. Jan Müller
Statistik Jan Müller Skalenniveau Nominalskala: Diese Skala basiert auf einem Satz von qualitativen Attributen. Es existiert kein Kriterium, nach dem die Punkte einer nominal skalierten Variablen anzuordnen
MehrUnterschiedshypothesen für maximal 2 Gruppen, wenn die Voraussetzungen für parametrische Verfahren nicht erfüllt sind
Schäfer A & Schöttker-Königer T, Statistik und quantitative Methoden für (2015) Arbeitsblatt 1 SPSS Kapitel 6 Seite 1 Unterschiedshypothesen für maximal 2 Gruppen, wenn die Voraussetzungen für parametrische
MehrÜbung 4 im Fach "Biometrie / Q1"
Universität Ulm, Institut für Epidemiologie und Medizinische Biometrie, D-89070 Ulm Institut für Epidemiologie und Medizinische Biometrie Leiter: Prof. Dr. D. Rothenbacher Schwabstr. 13, 89075 Ulm Tel.
MehrAngewandte Statistik 3. Semester
Angewandte Statistik 3. Semester Übung 5 Grundlagen der Statistik Übersicht Semester 1 Einführung ins SPSS Auswertung im SPSS anhand eines Beispieles Häufigkeitsauswertungen Grafiken Statistische Grundlagen
MehrStatistische Datenanalyse mit R, R-Studio. Dr. Andrea Denecke Leibniz Universität IT-Services
Statistische Datenanalyse mit R, R-Studio Dr. Andrea Denecke Leibniz Universität IT-Services R Studio Ist ein separat zu installierendes Programm, das aber mit dem eigentlichen R-Programm kommuniziert.
MehrWeitere (wählbare) Kontraste in der SPSS Prozedur Allgemeines Lineares Modell
Einfaktorielle Versuchspläne 27/40 Weitere (wählbare) Kontraste in der SPSS Prozedur Allgemeines Lineares Modell Abweichung Einfach Differenz Helmert Wiederholt Vergleich Jede Gruppe mit Gesamtmittelwert
MehrSozialwissenschaftliche Fakultät der Universität Göttingen. Sommersemester 2009, Statistik mit SPSS
Sommersemester 2009, Statistik mit SPSS 26. August 2009 26. August 2009 Statistik Dozentin: mit Anja SPSS Mays 1 Bivariate Datenanalyse, Überblick bis Freitag heute heute Donnerstag Donnerstag Freitag
Mehrdas Kleingedruckte...
Gepaarte t-tests das Kleingedruckte... Datenverteilung ~ Normalverteilung QQ-plot statistischer Test (Shapiro-Wilk, Kolmogorov-Smirnov) wenn nicht : nicht-parametrische Tests gleiche Varianz (2-Proben
MehrInhaltsverzeichnis. Über die Autoren Einleitung... 21
Inhaltsverzeichnis Über die Autoren.... 7 Einleitung... 21 Über dieses Buch... 21 Was Sie nicht lesen müssen... 22 Törichte Annahmen über den Leser... 22 Wie dieses Buch aufgebaut ist... 23 Symbole, die
MehrKlassifikation von Signifikanztests
Klassifikation von Signifikanztests nach Verteilungsannahmen: verteilungsabhängige = parametrische Tests verteilungsunabhängige = nichtparametrische Tests Bei parametrischen Tests werden im Modell Voraussetzungen
Mehr7. Lösungen weitere Übungsaufgaben Statistik für Ingenieure WiSe 16/17
7. Lösungen weitere Übungsaufgaben Statistik für Ingenieure WiSe 16/17 1. Aufgabe: a) Grundgesamtheit sind alle Reifen aus der Produktion von Langstone aus dem Monat März der entsprechenden Reifentypen.
MehrParametrische vs. Non-Parametrische Testverfahren
Parametrische vs. Non-Parametrische Testverfahren Parametrische Verfahren haben die Besonderheit, dass sie auf Annahmen zur Verteilung der Messwerte in der Population beruhen: die Messwerte sollten einer
MehrAufgaben zu Kapitel 8
Aufgaben zu Kapitel 8 Aufgabe 1 a) Berechnen Sie einen U-Test für das in Kapitel 8.1 besprochene Beispiel mit verbundenen n. Die entsprechende Testvariable punkte2 finden Sie im Datensatz Rangdaten.sav.
MehrHypothesentests mit SPSS. Beispiel für einen t-test
Beispiel für einen t-test Daten: museum-f-v04.sav Hypothese: Als Gründe, in ein Museum zu gehen, geben mehr Frauen als Männer die Erweiterung der Bildung für Kinder an. Dies hängt mit der Geschlechtsrolle
Mehrfh management, communication & it Constantin von Craushaar fh-management, communication & it Statistik Angewandte Statistik
fh management, communication & it Folie 1 Überblick Grundlagen (Testvoraussetzungen) Mittelwertvergleiche (t-test,..) Nichtparametrische Tests Korrelationen Regressionsanalyse... Folie 2 Überblick... Varianzanalyse
MehrDeskription, Statistische Testverfahren und Regression. Seminar: Planung und Auswertung klinischer und experimenteller Studien
Deskription, Statistische Testverfahren und Regression Seminar: Planung und Auswertung klinischer und experimenteller Studien Deskriptive Statistik Deskriptive Statistik: beschreibende Statistik, empirische
MehrStatistik II Übung 3: Hypothesentests
Statistik II Übung 3: Hypothesentests Diese Übung beschäftigt sich mit der Anwendung diverser Hypothesentests (zum Beispiel zum Vergleich der Mittelwerte und Verteilungen zweier Stichproben). Verwenden
MehrSPSS III Mittelwerte vergleichen
SPSS III Mittelwerte vergleichen A Zwei Gruppen ------------ Zwei-Stichproben t-test Beispieldatei: Seegräser Fragestellung: Unterscheidet sich die Anzahl der Seegräser in Gebieten mit und ohne Seeigelvorkommen
MehrStatistische Messdatenauswertung
Roland Looser Statistische Messdatenauswertung Praktische Einführung in die Auswertung von Messdaten mit Excel und spezifischer Statistik-Software für naturwissenschaftlich und technisch orientierte Anwender
MehrKapitel 8: Verfahren für Rangdaten
Kapitel 8: Verfahren für Rangdaten Anmerkung 1 Mann-Whitney U-Test 1 Wilcoxon-Test 3 Kruskal-Wallis H-Test 3 Literatur 6 Anmerkung In Kapitel 8 der Bücher wird erwähnt, dass für nichtparametrische Daten
MehrKonfidenzintervalle Grundlegendes Prinzip Erwartungswert Bekannte Varianz Unbekannte Varianz Anteilswert Differenzen von Erwartungswert Anteilswert
Konfidenzintervalle Grundlegendes Prinzip Erwartungswert Bekannte Varianz Unbekannte Varianz Anteilswert Differenzen von Erwartungswert Anteilswert Beispiel für Konfidenzintervall Im Prinzip haben wir
MehrStatistik II: Signifikanztests /1
Medien Institut : Signifikanztests /1 Dr. Andreas Vlašić Medien Institut (0621) 52 67 44 vlasic@medien-institut.de Gliederung 1. Noch einmal: Grundlagen des Signifikanztests 2. Der chi 2 -Test 3. Der t-test
MehrInhaltsverzeichnis. Teil 1 Basiswissen und Werkzeuge, um Statistik anzuwenden
Inhaltsverzeichnis Teil 1 Basiswissen und Werkzeuge, um Statistik anzuwenden 1 Statistik ist Spaß 3 Warum Statistik? 3 Checkpoints 4 Daten 4 Checkpoints 7 Skalen - lebenslang wichtig bei der Datenanalyse
MehrSPSS V Gruppenvergleiche ( 2 Gruppen) abhängige (verbundene) Stichproben
SPSS V Gruppenvergleiche ( 2 Gruppen) abhängige (verbundene) Stichproben ÜBERSICHT: Testverfahren bei abhängigen (verbundenen) Stichproben parametrisch nicht-parametrisch 2 Gruppen t-test bei verbundenen
MehrEine Einführung in R: Statistische Tests
Eine Einführung in R: Statistische Tests Bernd Klaus, Verena Zuber Institut für Medizinische Informatik, Statistik und Epidemiologie (IMISE), Universität Leipzig 9. Dezember 2009 Bernd Klaus, Verena Zuber
MehrMetrische und kategoriale Merkmale
Kapitel 6 Metrische und kategoriale Merkmale 6.1 Wie kann man metrische und kategoriale Merkmale numerisch beschreiben? Typischerweise will man geeignete Maßzahlen (beispielsweise Lage- oder Streuungsmaße)
MehrEinführung in die Statistik für Politikwissenschaftler Sommersemester 2011
Einführung in die Statistik für Politikwissenschaftler Sommersemester 2011 Es können von den Antworten alle, mehrere oder keine Antwort(en) richtig sein. Nur bei einer korrekten Antwort (ohne Auslassungen
Mehr6. Übung (Hypothesenprüfung und einfache Tests)
6. Übung (Hypothesenprüfung und einfache Tests) Es wird eine H0 Hypothese und eine Gegen- oder Arbeitshypothese aufgestellt. Sie schließen sich aus. Es wird von den betreffenden Populationen eine repräsentative
MehrStatistisches Testen
Statistisches Testen Grundlegendes Prinzip Erwartungswert Bekannte Varianz Unbekannte Varianz Differenzen Anteilswert Chi-Quadrat Tests Gleichheit von Varianzen Prinzip des Statistischen Tests Konfidenzintervall
MehrEin- und Zweistichprobentests
(c) Projekt Neue Statistik 2003 - Lernmodul: Ein- Zweistichprobentests Ein- Zweistichprobentests Worum geht es in diesem Modul? Wiederholung: allgemeines Ablaufschema eines Tests Allgemeine Voraussetzungen
MehrStatistik II. IV. Hypothesentests. Martin Huber
Statistik II IV. Hypothesentests Martin Huber 1 / 22 Übersicht Weitere Hypothesentests in der Statistik 1-Stichproben-Mittelwert-Tests 1-Stichproben-Varianz-Tests 2-Stichproben-Tests Kolmogorov-Smirnov-Test
MehrMathematische und statistische Methoden II
Methodenlehre e e Prof. Dr. G. Meinhardt 6. Stock, Wallstr. 3 (Raum 06-06) Sprechstunde jederzeit nach Vereinbarung und nach der Vorlesung. Mathematische und statistische Methoden II Dr. Malte Persike
MehrKlassifikation von Signifikanztests
Klassifikation von Signifikanztests nach Verteilungsannahmen: verteilungsabhängige = parametrische Tests verteilungsunabhängige = nichtparametrische Tests Bei parametrischen Tests werden im Modell Voraussetzungen
MehrHäufigkeitsauszählungen, zentrale statistische Kennwerte und Mittelwertvergleiche
Lehrveranstaltung Empirische Forschung und Politikberatung der Universität Bonn, WS 2007/2008 Häufigkeitsauszählungen, zentrale statistische Kennwerte und Mittelwertvergleiche 30. November 2007 Michael
MehrBonus-Lektion: Prüfung der Voraussetzungen und Transformationen
Seite 1 von 8 Bonus-Lektion: Prüfung der Voraussetzungen und Transformationen Ziel dieser Lektion: Du weißt, wie Du die einzelnen Voraussetzungen für die Signifikanztests und komplexeren Modelle prüfen
MehrBereiche der Statistik
Bereiche der Statistik Deskriptive / Exploratorische Statistik Schließende Statistik Schließende Statistik Inferenz-Statistik (analytische, schließende oder konfirmatorische Statistik) baut auf der beschreibenden
MehrVS PLUS
VS PLUS Zusatzinformationen zu Medien des VS Verlags Statistik II Inferenzstatistik 2010 Übungsaufgaben und Lösungen Inferenzstatistik 2 [Übungsaufgaben und Lösungenn - Inferenzstatistik 2] ÜBUNGSAUFGABEN
Mehr- Normalverteilung (Gaußverteilung) kann auf sehr viele Zufallsprozesse angewendet werden.
Normalverteilung und Standardnormalverteilung als Beispiel einer theoretischen Verteilung - Normalverteilung (Gaußverteilung) kann auf sehr viele Zufallsprozesse angewendet werden. - Stetige (kontinuierliche),
MehrSozialwissenschaftliche Fakultät der Universität Göttingen. Sommersemester Statistik mit SPSS
Sommersemester 2009 Statistik mit SPSS 09. Mai 2009 09. Mai 2009 Statistik Dozentin: mit Esther SPSSOchoa Fernández 1 Arbeitsschritte bei der Datenanalyse Datenmanagement (Einlesen von Daten, Teilen von
MehrPROC NPAR1WAY. zum Durchführen des U-Tests für zwei unverbundene Stichproben (für quantitative nicht-normalverteilte Merkmale)
PROC NPAR1WAY zum Durchführen des U-Tests für zwei unverbundene Stichproben (für quantitative nicht-normalverteilte Merkmale) Allgemeine Form: PROC NPAR1WAY DATA=name Optionen ; VAR variablenliste ; CLASS
MehrHerzlich willkommen zum Thema SPSS
Herzlich willkommen zum Thema SPSS (SUPERIOR PERFORMING SOFTWARE SYSTEM) Qualitative und quantitative Forschungsmethoden Qualitative Methoden: Qualitative Verfahren werden oft benutzt, wenn der Forschungsgegenstand
Mehr1.6 Der Vorzeichentest
.6 Der Vorzeichentest In diesem Kapitel soll der Vorzeichentest bzw. Zeichentest vorgestellt werden, mit dem man Hypothesen bezüglich des Medians der unabhängig und identisch stetig verteilten Zufallsvariablen
MehrDie ungeliebten Verwandten: nicht-parametrische Alternativen
1.1.1. Die ungeliebten Verwandten: nicht-parametrische Alternativen 1.1.1.1. Was zur Hölle? Ted richtet seine Waffe auf Dr. Bob Kelso: Nein, Bob! Das werde ich nicht tun! Nicht nach all dem, was ich durchmachen
MehrSigmaStat Nina Becker, Christoph. Rothenwöhrer. Copyright 2004 Systat Software, Inc.
SigmaStat 3.11 Copyright 2004 Systat Software, Inc. http://www.systat.com Nina Becker, Christoph Rothenwöhrer Die Aufgabe der Statistik ist die Zusammenfassung von Daten, deren Darstellung, Analyse und
MehrEinführung in die Varianzanalyse mit SPSS
Einführung in die Varianzanalyse mit SPSS SPSS-Benutzertreffen am URZ Carina Ortseifen 6. Mai 00 Inhalt. Varianzanalyse. Prozedur ONEWAY. Vergleich von k Gruppen 4. Multiple Vergleiche 5. Modellvoraussetzungen
MehrBitte am PC mit Windows anmelden!
Einführung in SPSS Plan für heute: Grundlagen/ Vorwissen für SPSS Vergleich der Übungsaufgaben Einführung in SPSS http://weknowmemes.com/generator/uploads/generated/g1374774654830726655.jpg Standardnormalverteilung
MehrStatistische Tests (Signifikanztests)
Statistische Tests (Signifikanztests) [testing statistical hypothesis] Prüfen und Bewerten von Hypothesen (Annahmen, Vermutungen) über die Verteilungen von Merkmalen in einer Grundgesamtheit (Population)
MehrNicht-parametrische Statistik Eine kleine Einführung
Nicht-parametrische Statistik Eine kleine Einführung Überblick Anwendung nicht-parametrischer Statistik Behandelte Tests Mann-Whitney U Test Kolmogorov-Smirnov Test Wilcoxon Test Binomialtest Chi-squared
MehrInhaltsverzeichnis. Vorwort
V Vorwort XI 1 Zum Gebrauch dieses Buches 1 1.1 Einführung 1 1.2 Der Text in den Kapiteln 1 1.3 Was Sie bei auftretenden Problemen tun sollten 2 1.4 Wichtig zu wissen 3 1.5 Zahlenbeispiele im Text 3 1.6
MehrHypothesentests mit SPSS. Beispiel für eine einfaktorielle Varianzanalyse Daten: museum_m_v05.sav
Beispiel für eine einfaktorielle Varianzanalyse Daten: museum_m_v05.sav Hypothese: Die Beschäftigung mit Kunst ist vom Bildungsgrad abhängig. 1. Annahmen Messniveau: Modell: Die Skala zur Erfassung der
MehrVerfahren für metrische Variable
Verfahren für metrische Variable Grafische Methoden Histogramm Mittelwertsplot Boxplot Lagemaße Mittelwert, Median, Quantile Streuungsmaße Standardabweichung, Interquartilsabstand Lagemaße und Streumaße
MehrStatistik II Übung 3: Hypothesentests Aktualisiert am
Statistik II Übung 3: Hypothesentests Aktualisiert am 12.04.2017 Diese Übung beschäftigt sich mit der Anwendung diverser Hypothesentests (zum Beispiel zum Vergleich der Mittelwerte und Verteilungen zweier
MehrTeil: lineare Regression
Teil: lineare Regression 1 Einführung 2 Prüfung der Regressionsfunktion 3 Die Modellannahmen zur Durchführung einer linearen Regression 4 Dummyvariablen 1 Einführung o Eine statistische Methode um Zusammenhänge
MehrHypothesentests mit R Ashkan Taassob Andreas Reisch 21.04.09 1
Hypothesentests mit R Ashkan Taassob Andreas Reisch 21.04.09 1 Inhalt Programmiersprache R Syntax Umgang mit Dateien Tests t Test F Test Wilcoxon Test 2 Test Zusammenfassung 2 Programmiersprache R Programmiersprache
MehrMerkmalstypen Univ.-Prof. Dr. rer. nat. et med. habil. Andreas Faldum
1 Merkmalstypen Quantitativ: Geordnete Werte, Vielfache einer Einheit Stetig: Prinzipiell sind alle Zwischenwerte beobachtbar Beispiele: Gewicht, Größe, Blutdruck Diskret: Nicht alle Zwischenwerte sind
MehrEine Einführung in R: Statistische Tests
Eine Einführung in R: Statistische Tests Bernd Klaus, Verena Zuber Institut für Medizinische Informatik, Statistik und Epidemiologie (IMISE), Universität Leipzig http://www.uni-leipzig.de/ zuber/teaching/ws11/r-kurs/
MehrAnalytische Statistik: Varianzanpassungstest, Varianzhomogenitätstest. Statistische Methoden in der Korpuslinguistik Heike Zinsmeister WS 2008/09
Analytische Statistik: Varianzanpassungstest, Varianzhomogenitätstest Statistische Methoden in der Korpuslinguistik Heike Zinsmeister WS 2008/09 Varianzanpassungstest Untersuchung der Streuung einer bzw.
MehrMittelwertvergleiche, Teil I: Zwei Gruppen
FB W. Ludwig-Mayerhofer Statistik II Mittelwertvergleiche Herzlich willkommen zur Vorlesung Mittelwertvergleiche, Teil I: Zwei Gruppen FB W. Ludwig-Mayerhofer Statistik II Mittelwertvergleiche Mittelwertvergleiche:
MehrPrüfen von Unterschiedshypothesen für ordinale Variablen: Mann-Whitney Test und Ko
Prüfen von Unterschiedshypothesen für ordinale Variablen: Mann-Whitney Test und Ko Sven Garbade Fakultät für Angewandte Psychologie SRH Hochschule Heidelberg sven.garbade@hochschule-heidelberg.de Statistik
Mehr3. Lektion: Deskriptive Statistik
Seite 1 von 5 3. Lektion: Deskriptive Statistik Ziel dieser Lektion: Du kennst die verschiedenen Methoden der deskriptiven Statistik und weißt, welche davon für Deine Daten passen. Inhalt: 3.1 Deskriptive
MehrAngewandte Statistik für Naturwissenschaftler
Pareys Studientexte 74 2008 AGI-Information Management Consultants May be used for personal purporses only or by libraries associated to dandelon.com network. Jose L. Lozän Hartmut Kausch Angewandte Statistik
Mehr12 Rangtests zum Vergleich zentraler Tendenzen
12 Rangtests zum Vergleich zentraler Tendenzen 12.1 Allgemeine Bemerkungen 12.2 Gepaarte Stichproben: Der Wilcoxon Vorzeichen- Rangtest 12.3 Unabhängige Stichproben: Der Wilcoxon Rangsummentest und der
MehrWerkzeuge der empirischen Forschung
Werkzeuge der empirischen Forschung I. Daten und Beschreibende Statistik 1. Einführung 2. Dateneingabe, Datentransformation, Datenbehandlung 3. Beschreibende Statistik II. Schließende Statistik 1 III.
Mehr1 Univariate Statistiken
1 Univariate Statistiken Im ersten Kapitel berechnen wir zunächst Kenngrößen einer einzelnen Stichprobe bzw. so genannte empirische Kenngrößen, wie beispielsweise den Mittelwert. Diese können, unter gewissen
MehrWillkommen zur Vorlesung Statistik (Master)
Willkommen zur Vorlesung Statistik (Master) Thema dieser Vorlesung: Mittelwertvergleiche Prof. Dr. Wolfgang Ludwig-Mayerhofer Universität Siegen Philosophische Fakultät, Seminar für Sozialwissenschaften
MehrStatistik und Wahrscheinlichkeitsrechnung
Statistik und Wahrscheinlichkeitsrechnung 3. Vorlesung Dr. Jochen Köhler 1 Inhalte der heutigen Vorlesung Ziel: Daten Modellbildung Probabilistisches Modell Wahrscheinlichkeit von Ereignissen Im ersten
MehrBiometrieübung 7 t-test (gepaarte Daten) & Wilcoxon-Test
Biometrieübung 7 (t-test gepaarte Daten & Wilcoxon-Test) - Aufgabe Biometrieübung 7 t-test (gepaarte Daten) & Wilcoxon-Test Aufgabe 1 Hirschläufe An 10 Hirschen wurde die Länge der rechten Vorder- und
MehrErmitteln Sie auf 2 Dezimalstellen genau die folgenden Kenngrößen der bivariaten Verteilung der Merkmale Weite und Zeit:
1. Welche der folgenden Kenngrößen, Statistiken bzw. Grafiken sind zur Beschreibung der Werteverteilung des Merkmals Konfessionszugehörigkeit sinnvoll einsetzbar? A. Der Modalwert. B. Der Median. C. Das
Mehr1. Erklären Sie den Unterschied zwischen einem einseitigen und zweiseitigen Hypothesentest.
Statistik II Übung 3: Hypothesentests Diese Übung beschäftigt sich mit der Anwendung diverser Hypothesentests (zum Beispiel zum Vergleich der Mittelwerte und Verteilungen zweier Stichproben). Verwenden
MehrFranz Kronthaler. Statistik angewandt. Datenanalyse ist (k)eine Kunst. mit dem R Commander. A Springer Spektrum
Franz Kronthaler Statistik angewandt Datenanalyse ist (k)eine Kunst mit dem R Commander A Springer Spektrum Inhaltsverzeichnis Teil I Basiswissen und Werkzeuge, um Statistik anzuwenden 1 Statistik ist
Mehr(VU) Übungen zur Einführung in die statistische Datenanalyse II. Inhalte Statistik I. Inhalte Statistik I Deskriptive Statistik
II Übungen zur II Organisatorische Hinweise Keine Anwesenheitspflicht (aber empfehlenswert) Einführung in die statistische Datenanalyse II (VU) Lehrinhalte (.ppt Folien): elearning.univie.ac.at 3 Prüfungstermine:
MehrSTATISTISCHE MUSTERANALYSE - DARSTELLUNGSVORSCHLAG
STATISTISCHE MUSTERANALYSE - DARSTELLUNGSVORSCHLAG Statistische Methoden In der vorliegenden fiktiven Musterstudie wurden X Patienten mit XY Syndrom (im folgenden: Gruppe XY) mit Y Patienten eines unauffälligem
MehrVorlesung: Statistik II für Wirtschaftswissenschaft
Vorlesung: Statistik II für Wirtschaftswissenschaft Prof. Dr. Helmut Küchenhoff Institut für Statistik, LMU München Sommersemester 2017 Einführung 1 Wahrscheinlichkeit: Definition und Interpretation 2
MehrInhaltsverzeichnis 1 SPSS Statistics 2 SPSS Datenmanagement 3 Verteilungsanalyse
VII 1 SPSS Statistics... 1 1.1 Wofür steht SPSS?... 2 1.2 SPSS starten und beenden... 3 1.3 SPSS Editoren und SPSS Viewer... 5 SPSS Dateneditor... 5 SPSS Viewer... 6 SPSS Pivot-Tabellen-Editor... 7 SPSS
MehrTrim Size: 176mm x 240mm Lipow ftoc.tex V1 - March 9, :34 P.M. Page 11. Über die Übersetzerin 9. Einleitung 19
Trim Size: 176mm x 240mm Lipow ftoc.tex V1 - March 9, 2016 6:34 P.M. Page 11 Inhaltsverzeichnis Über die Übersetzerin 9 Einleitung 19 Was Sie hier finden werden 19 Wie dieses Arbeitsbuch aufgebaut ist
MehrVII. Inhaltsverzeichnis
VII Inhaltsverzeichnis Vorwort XIII Teil 1 Datentypen 1 Datentypen 3 1.1 Kommt es wirklich darauf an? 3 1.2 Daten auf einer Intervallskala 3 1.3 Daten auf einer Ordinalskala 4 1.4 Daten auf einer Nominalskala
MehrTESTTHEORIE UND TESTKONSTRUKTION - PRAKTISCHE ANWENDUNG - TEIL 1
TESTTHEORIE UND TESTKONSTRUKTION - PRAKTISCHE ANWENDUNG - TEIL 1 Prof. Dr. Franke SS2012 Hochschule Magdeburg-Stendal (FH) M.Sc. Rehabilitationspsychologie Gliederung Einführung in Datensatz Stichprobenbeschreibung
MehrComputergestützte Methoden. Master of Science Prof. Dr. G. H. Franke WS 07/08
Computergestützte Methoden Master of Science Prof. Dr. G. H. Franke WS 07/08 1 Seminarübersicht 1. Einführung 2. Recherchen mit Datenbanken 3. Erstellung eines Datenfeldes 4. Skalenniveau und Skalierung
Mehr10. Medizinische Statistik
10. Medizinische Statistik Projektplanung Deskriptive Statistik Inferenz-Statistik Literatur: Hüsler, J. und Zimmermann, H.: Statistische Prinzipien für medizinische Projekte, Verlag Hans Huber, 1993.
MehrName...LÖSUNGEN...Vorname...
PRÜFUNG STATISTIK VO 19. März 2010 Name...LÖSUNGEN...Vorname... Matrikelnummer... Einsichtnahme: Di, 20. April 2010 BITTE DEUTLICH UND LESERLICH SCHREIBEN! Es wird nur gewertet, was in diesem Exemplar
MehrKlausur Statistik I. Dr. Andreas Voß Wintersemester 2005/06
Klausur Statistik I Dr. Andreas Voß Wintersemester 2005/06 Hiermit versichere ich, dass ich an der Universität Freiburg mit dem Hauptfach Psychologie eingeschrieben bin. Name: Mat.Nr.: Unterschrift: Bearbeitungshinweise:
MehrMathematik für Biologen
Mathematik für Biologen Prof. Dr. Rüdiger W. Braun Heinrich-Heine-Universität Düsseldorf 12. Januar 2011 1 Vergleich zweier Erwartungswerte Was heißt verbunden bzw. unverbunden? t-test für verbundene Stichproben
MehrVergleich von Gruppen I
Vergleich von Gruppen I t-test und einfache Varianzanalyse (One Way ANOVA) Werner Brannath VO Biostatistik im WS 2006/2007 Inhalt Der unverbundene t-test mit homogener Varianz Beispiel Modell Teststatistik
MehrStatistische Methoden in den Umweltwissenschaften
Statistische Methoden in den Umweltwissenschaften Korrelationsanalysen Kreuztabellen und χ²-test Themen Korrelation oder Lineare Regression? Korrelationsanalysen - Pearson, Spearman-Rang, Kendall s Tau
MehrAblaufschema beim Testen
Ablaufschema beim Testen Schritt 1 Schritt 2 Schritt 3 Schritt 4 Schritt 5 Schritt 6 Schritt 7 Schritt 8 Schritt 9 Starten Sie die : Flashanimation ' Animation Ablaufschema Testen ' siehe Online-Version
MehrVergleich zweier Stichproben
zurück zum Inhaltsverzeichnis Die Werte sind verbunden, abhängig oder korreliert. Beispiel: Eine Probe wird mit zwei Messgeräten bestimmt. Es gibt eine paarweise Zuordnung. Die Werte sind unabhängig also
Mehr