Statistik und ihre Anwendungen Parametrische Statistik Verteilungen, maximum likelihood und GLM in R Bearbeitet von Carsten F. Dormann 1. Auflage 2013. Taschenbuch. xxii, 350 S. Paperback ISBN 978 3 642 34785 6 Format (B x L): 16,8 x 24 cm Gewicht: 622 g Weitere Fachgebiete > Philosophie, Wissenschaftstheorie, Informationswissenschaft > Forschungsmethodik, Wissenschaftliche Ausstattung > Datenanalyse, Datenverarbeitung schnell und portofrei erhältlich bei Die Online-Fachbuchhandlung beck-shop.de ist spezialisiert auf Fachbücher, insbesondere Recht, Steuern und Wirtschaft. Im Sortiment finden Sie alle Medien (Bücher, Zeitschriften, CDs, ebooks, etc.) aller Verlage. Ergänzt wird das Programm durch Services wie Neuerscheinungsdienst oder Zusammenstellungen von Büchern zu Sonderpreisen. Der Shop führt mehr als 8 Millionen Produkte.
Inhaltsverzeichnis 0 Die technische Seite und die Wahl der Statistiksoftware XIII 0.1 R herunterladen und installieren................... XIV 0.2 Ein kurzer R-Test............................ XV 0.3 Editoren und Umgebungen für R................... XVII 0.4 Übungen................................. XX 1 Stichprobe, Zufallsvariable Histogramm, Dichteverteilung 1 1.1 Stichprobenstatistiken......................... 5 1.1.1 Zentralitätsmaße........................ 6 1.1.2 Maße für Streuung....................... 7 1.1.3 Stichprobenstatistiken am Beispiel.............. 11 1.2 Häufigkeit, Dichte und Verteilung................... 14 2 Stichprobe, Zufallsvariable Histogramm, Dichteverteilung in R 17 2.1 Datenerhebung............................. 17 2.2 Dateneingabe.............................. 18 2.3 Daten importieren nach R....................... 21 2.3.1 Kleine Datensätze manuell eingeben............. 21 2.3.2 Größere Datensätze aus einer Datei einlesen......... 23 2.4 Einfache, deskriptive Statistik und grafische Darstellung... 25 2.4.1 Grafische Darstellung von Stichprobenstatistiken mit R.. 25 2.4.2 Deskriptive Statistik mit R................... 28 2.4.3 Dichtehistogramm und empirische Dichte.......... 33 2.5 Übungen................................. 35 3 Verteilungen, ihre Parameter und deren Schätzer 37 3.1 Verteilung................................ 38 3.1.1 Zentraler Grenzwertsatz.................... 40 3.2 Parameter einer Verteilung....................... 41 3.3 Schätzer (für Parameter einer Verteilung).............. 44 3.3.1 Die likelihood.......................... 45 3.3.2 Maximierung der likelihood.................. 46 3.3.3 Maximum likelihood analytisch............... 48 VII
VIII Inhaltsverzeichnis 3.3.4 Maximum likelihood numerisch............... 51 3.3.5 Maximum likelihood EineLaudatio............. 51 3.4 Einige wichtige Verteilungen...................... 53 3.4.1 Normalverteilung........................ 53 3.4.2 Bernoulli-Verteilung...................... 54 3.4.3 Binomialverteilung....................... 54 3.4.4 Poisson-Verteilung....................... 55 3.4.5 Negative Binomialverteilung.................. 56 3.4.6 Lognormal-Verteilung..................... 57 3.4.7 Uniforme Verteilung...................... 58 3.4.8 β-verteilung........................... 59 3.4.9 γ-verteilung........................... 60 3.4.10 Beschränkte Verteilungen (truncated distributions)..... 60 3.5 Auswahl der Verteilung......................... 61 3.5.1 Vergleich zweier Verteilungen: der Kolmogorov-Smirnov Test............................... 62 3.5.2 Vergleich von Fits: likelihood und der informationstheoretische Ansatz........... 63 4 Verteilungen, Parameter und Schätzer in R 67 4.1 Darstellen von Verteilungen...................... 69 4.1.1 Kontinuierliche Verteilungen................. 69 4.1.2 Diskrete Verteilungen..................... 72 4.2 Berechnung der likelihood eines Datensatzes............. 74 4.3 Empirische kumulative Häufigkeitsverteilungen und der Kolmogorov-Smirnov-Test.................. 80 4.4 Test auf Normalverteilung....................... 82 4.5 Übungen................................. 83 5 Korrelation und Assoziation 85 5.1 Korrelation............................... 86 5.1.1 Nicht-parametrische Korrelation............... 88 5.1.2 Korrelation mit und zwischen diskreten Variablen... 89 5.1.3 Multiple Korrelationen..................... 90 5.2 Test auf Assoziation der χ 2 Test................... 91 6 Korrelation und Assoziation in R 93 6.1 Nicht-parametrische Korrelation.................... 95 6.2 Multiple Korrelationen und die Korrelationsmatrix......... 97 6.3 Punktbiseriale und punktpolyseriale Korrelation........... 100 6.4 Der χ 2 -Test mit R............................ 102 6.5 Übungen................................. 103
Inhaltsverzeichnis IX 7 Regression Teil I 105 7.1 Regression................................ 105 7.1.1 Regression: ein Verteilungsparameter variiert mit dem Prädiktor....................... 106 7.1.2 Regression und maximum likelihood............. 109 7.1.3 Die andere Skala und die link-funktion........... 109 7.2 Kategoriale Prädiktoren........................ 113 7.2.1 Ein kategorialer Prädiktor mit zwei Leveln.......... 113 7.2.2 Ein kategorialer Prädiktor mit mehr als zwei Leveln..... 115 7.3 Ein paar Beispiele............................ 118 7.3.1 Größe und Geschlecht ein GLM ohne G........... 118 7.3.2 Raucher und Geschlecht der χ 2 -Test als binomiales GLM. 120 8 Regression in R Teil I 123 8.1 Regression mittels GLM........................ 123 8.2 Regression: maximum likelihood zu Fuß............... 131 8.2.1 Poisson-Modell zu Fuß..................... 132 8.2.2 Nicht-lineare Regression zu Fuß................ 138 8.3 GLM mit VGAM............................. 142 8.4 Modellierung beliebiger Verteilungsparameter (nicht nur des Mittelwerts)...................... 144 8.5 Übungen................................. 148 9 Regression Teil II 151 9.1 Modelldiagnostik............................ 153 9.1.1 Analyse des Prädiktors..................... 153 9.1.2 Analyse einflussreicher Punkte................ 153 9.1.3 Analyse der Dispersion..................... 155 9.1.4 Analyse der Residuen..................... 156 9.1.5 Analyse des funktionellen Zusammenhangs von y und x.. 159 10 Regression in R Teil II 165 10.1 Modelldiagnostik............................ 165 10.1.1 Analyse des Prädiktors..................... 167 10.1.2 Analyse einflussreicher Punkte................ 168 10.1.3 Analyse der Dispersion..................... 170 10.1.4 Analyse der Residuen..................... 173 10.1.5 Analyse des funktionellen Zusammenhangs von y und x.. 175 10.2 Regressionsdiagnostik im linearen Modell (lm)........... 182 10.3 Übungen................................. 186 11 Das Lineare Modell: t-test und ANOVA 187 11.1 Der t-test................................ 188 11.1.1 Statistik mit nur einer Stichprobe (one sample test)..... 188
X Inhaltsverzeichnis 11.1.2 Vergleich zweier gepaarter Stichproben (paired sample test) 190 11.1.3 Vergleich zweier ungepaarter Stichproben (two sample test) 191 11.2 Varianzanalyse (ANOVA): Die Analyse auf signifikante Unterschiede 191 11.2.1 ANOVA mit kontinuierlichem Prädiktor: ein Beispiel.... 196 11.2.2 Annahmen der ANOVA..................... 197 11.2.3 Nicht-normalverteilte Daten ANOVA-fähig machen..... 198 11.2.4 ANOVA für mehr als 2 Level.................. 199 11.2.5 Post-hoc Vergleiche....................... 200 11.3 Von der Regression zur ANOVA.................... 203 11.3.1 ANOVA und Regression: Ein Ergebnisvergleich........ 203 11.3.2 Freiheitsgrade der ANOVA und ihre Erklärung durch die Regression...................... 204 11.4 ANOVAs für GLMs........................... 206 12 Das Lineare Modell: t-test und ANOVA in R 209 12.1 t-test und Varianten in R........................ 209 12.2 ANOVA in R............................... 212 12.2.1 Test auf Varianzhomogenität................. 213 12.2.2 Aus F-Werten die Signifikanz berechnen........... 216 12.2.3 Post-hoc Vergleiche mit R.................... 218 12.3 ANOVA zur Regression und zurück.................. 219 12.4 ANOVAs für GLM............................ 221 12.5 Übungen................................. 222 13 Hypothesen und Tests 225 13.1 Wissenschaftliche Methodik: Beobachtungen, Ideen, Modellvorstellungen, Hypothesen, Experimente, Tests und wieder von vorn.......................... 226 13.2 Das Testen von Hypothesen...................... 227 13.2.1 Kochrezept für den Test von Hypothesen........... 227 13.2.2 Testfehler............................ 228 13.3 Tests................................... 232 13.3.1 Weitere Begriffe zum Thema Tests.............. 232 13.3.2 Schlussbemerkungen zu Tests................. 233 13.4 Übungen................................. 234 14 Experimentelles Design 235 14.1 Manipulative Experimente....................... 238 14.1.1 Randomisierung im Feld.................... 239 14.2 Designs für manipulative Experimente................ 240 14.2.1 Vollständig randomisiertes Blockdesign (fully randomised block design)................ 241 14.2.2 Split-plot Design........................ 245 14.2.3 Nested design.......................... 251
Inhaltsverzeichnis XI 14.3 Stichprobendesigns für deskriptive Studien (survey designs).... 254 14.3.1 Einstufige Stichprobeverfahren: simple random sampling.. 255 14.3.2 Mehrstufige Stichprobeverfahren............... 258 15 Multiple Regression: mehrere Prädiktoren 265 15.1 Visualisierung von mehreren Prädiktoren............... 266 15.1.1 Visualisierung bei zwei kategorialen Prädiktoren... 266 15.1.2 Visualisierung bei einem kategorialen und einem kontinuierlichen Prädiktor............ 268 15.2 Interaktionen zwischen Prädiktoren.................. 270 15.3 Kollinearität............................... 274 15.3.1 Hauptkomponentenanalyse.................. 274 15.3.2 Cluster-Analyse......................... 280 15.4 Modellselektion............................. 282 15.4.1 Zwei-Wege ANOVA zu Fuß................... 286 15.5 Exkurs für Mathematikinteressierte: Die Mathematik hinter dem linearen Modell............. 290 16 Multiple Regression in R 295 16.1 Interaktionen visualisieren und fitten................. 296 16.1.1 Zwei kategoriale Prädiktoren: Regression und ANOVA... 296 16.1.2 Ein kontinuierlicher und ein kategorialer Prädiktor..... 300 16.1.3 Multiple Regression mit zwei kontinuierlichen Variablen.. 307 16.2 Kollinearität............................... 315 16.2.1 Hauptkomponentenanalyse in R............... 316 16.2.2 Cluster-Analyse in R...................... 319 16.3 Modellselektion............................. 321 16.3.1 Modellselektion per Hand................... 321 16.3.2 Automatische Modellselektion................. 326 16.4 Übungen................................. 331 17 Ausblick 333 Literaturverzeichnis 335 Index 343