Frage: Wie kann man die Achsenbeschriftung ändern? Antwort: Mit plot(...,axes=f) sagt man R, dass keine Achsen eingezeichnet werden sollen. Mit axis(j,at=x,labels=y) werden neue Achsen eingezeichnet. j gibt an wo (1=unten, 2=links, usw.), x ist ein Vektor der sagt, wo die Achsenstriche gemacht werden sollen (die Tickmarks) und y gibt die dazugehörigen Beschriftungen an. Frage: Was kann man tun damit im stripchart bei vielen Punkten diese nicht übereinander gezeichnet werden? Antwort: stripchart(...,method= jitter ). Frage: Wenn ich in R den Befehl anova(lm(y factor(x))) verwende, wo sehe ich in der resultierenden ANOVA-Tabelle den p-wert? Antwort: Der p-wert ist durch den Eintrag Pr(>F) gegeben. Frage: Werden noch weitere Vorlesungsfolien online gestellt? Antwort: Nein. Die Vorlesungsfolien waren nur zur Einführung für die ersten zwei Semesterwochen gedacht. Die Vorlesung wird nun wie üblich an der Tafel gehalten. Frage: Muss man in Aufgabe 6 a) die Tschebyscheff Ungleichung benutzen? Antwort: Nein. Es soll gelten Ws H0 ( X > k) 0.05. Wie ist k zu wählen? Dafür muss man wissen wie X verteilt ist. Es hat aber (zumindest asymptotisch - für große n) eine bekannnte Verteilung. Welche? 1
Frage: Was ist die Vorgehensweise bei Aufgabe 6 b)? Aufgabe: Es soll gelten: Ws HA ( X > k) 0.8. Das setzt vorraus, dass man k in a) bestimmt hat. Dann standardisiert man X (Erwartungswert abziehen und durch Standardabweichung teilen). Das Ganze dann mit Hilfe der Verteilungsfunktion geschrieben. Diese mittels Quantilfunktion auflösen und schließelich die Ungleichung nach n umstellen. Frage: Wie kann ich das Histogramm auf die Dichte umstellen? Antwort: hist(...,probability=t) Frage: Wo sind beim Output des t-tests die Differenzen der Mittelwerte die ich für Aufgabe 5c) brauche? Antwort: In Aufgabe 5c) ist nach einem 95%-Konfidenzintervall für diese Differenzen gefragt. Dieses wird direkt im Output angegeben. Frage: Was sind das für Mittelwerte beim Output des t-tests? Antwort: Das sind die jeweiligen Gruppenmittelwerte. Frage: Was bedeuten beim Output des t-tests df und -Inf? Antwort: df = degrees of freedom = Freiheitsgrade (Parameter der t-verteilung). Inf = infinity = unendlich. Frage: Kann das t (Wert der t-statistik) in Aufgabe 5 b) negativ sein? 2
Antwort: Na klar. Der Zähler der t-statistik beinhaltet eine Differenz von Mittelwerten, je nachdem welcher Mittelwert größer ist, haben wir eine positive oder negative Differenz. Dementsprechend auch ein positives oder negatives t. Frage: Was ist ein 95%-Konfidenzintervall für den Mittelwert? Antwort: Ein 95%-KI ist ein zufälliges (!) Intervall, welches den wahren (!) Mittelwert (welcher fest ist) mit einer Wahrscheinlichkeit von mindestens 0.95 enthält. Frage: In Aufgabe 3 benutze ich h<-2*geburtsgewichtsklasse+behandlung z<-gewichtszunahme stripchart(z h,method="stack",col="blue",offset=0.5, group.names=grpnms,pch=16,cex=1.0,ylim=c(0.5,3),xlab=xlb) doch trotzdem bekomme ich nur 3 Gruppen angezeigt und nicht 6? Antwort: ylim=c(0.5,3) sagt R von wo bis wo die y-achse gehen soll. Wählt man diesen Bereich zu klein, so wird möglicherweise nicht alles angezeigt. Um den Fehler zu beheben, sollte man den zweiten Wert erhöhen. Man kann mal ylim=c(0.5,10) angeben und schauen was passiert. Frage: Wie kann man bei einem Boxplot die Gruppenbeschriftung festlegen? Antwort: boxplot(z h,names=c("kontrolle","behandlung")) Frage: Wie bekommt man in Aufgabe 3 die Babys in die richtigen Gruppen für das Stripchart? Antwort: Man definiere sich die Gruppenvariable wie folgt: 3
h<-2*geburtsgewichtsklasse+behandlung stripchart(z h) Frage: Wie schreibt man eine Gesamtüberschrift wenn man mehrere Diagramme hat? Antwort: Bevor man die gewünschten Grafiken erstellt, benutzt man folgendes: par(oma=c(0,0,3,0)) Dadurch erhält man zusätzliche Ränder. In diesem Fall nur oben. Damit zum Beispiel zwei Histogramme untereinander erscheinen, macht man par(mfrow=c(2,1)) Als nächstes erstellt man die Histogramme wie gewohnt. Um die Gesamtüberschrift zu bekommen: mtext("vergleich beider Gruppen",outer=T,col="blue",line=1,cex=3) Frage: Wie kann ich in Aufgabe 2 Boxplot und Histogramm benutzen? Antwort: hist() erzeugt ein Histogramm, aber R muss wissen von welchen Daten. Als Beispiel erzeugen wir einfach mal 100 Zufallszahlen: x<-rnorm(100) x und die schauen wir uns als Histogramm an: hist(x) Das war es auch schon :-) So macht man ein Histogramm. Die restlichen Befehle dienen nur dazu die Grafik aufzupeppeln: hist(x,col="blue") # blaues Histogramm hist(x,col="yellow") # gelbes Histogramm 4
# Beschriftungen hist(x,col="yellow",xlab="x-achse",ylab="y-achse",main="titel") col, xlab, ylab, main kann man auch für den Boxplot verwenden!!!! Boxplots sind super um mehrere Gruppen parallel anzuzeigen. Beispiel: Angenommen die ersten 50 Werte von x gehören zur Gruppe 1 und die restlichen zur Gruppe 2 y<-c(rep(1,50),rep(2,50)) # erzeuge eine Gruppenvariable "y" boxplot(x y) sprich: zerlege x in die Gruppen die durch y definiert werden (das erste x ist in Gruppe 1, das zweite x gehört auch zu 1... bis zum 50 x. Das 51 x gehört zu 2 usw.) und mache aus diesen Gruppen Boxplots! Für weitere Details siehe?hist?boxplot 5