Reihenherausgeber: Prof. Dr. Holger Dette Prof. Dr. Wolfgang Härdle
Statistik und ihre Anwendungen Weitere Bände dieser Reihe finden Sie unter http://www.springer.com/series/5100
Fred Böker Stefan Sperlich Walter Zucchini Statistikübungen für Bachelorund Masterstudenten Ein Arbeitsbuch mit einer Einführung in R 2. Auflage
Stefan Sperlich Universität Genf Genf, Schweiz Fred Böker Walter Zucchini Georg-August-Universität Göttingen Göttingen, Deutschland ISBN 978-3-642-34787-0 DOI 10.1007/978-3-642-34788-7 ISBN 978-3-642-34788-7 (ebook) Die Deutsche Nationalbibliothek verzeichnet diese Publikation in der Deutschen Nationalbibliografie; detaillierte bibliografische Daten sind im Internet über http://dnb.d-nb.de abrufbar. Springer Gabler c Springer-Verlag Berlin Heidelberg 2013 Das Werk einschließlich aller seiner Teile ist urheberrechtlich geschützt. Jede Verwertung, die nicht ausdrücklich vom Urheberrechtsgesetz zugelassen ist, bedarf der vorherigen Zustimmung des Verlags. Das gilt insbesondere für Vervielfältigungen, Bearbeitungen, Übersetzungen, Mikroverfilmungen und die Einspeicherung und Verarbeitung in elektronischen Systemen. Die Wiedergabe von Gebrauchsnamen, Handelsnamen, Warenbezeichnungen usw. in diesem Werk berechtigt auch ohne besondere Kennzeichnung nicht zu der Annahme, dass solche Namen im Sinne der Warenzeichenund Markenschutz-Gesetzgebung als frei zu betrachten wären und daher von jedermann benutzt werden dürften. Gedruckt auf säurefreiem und chlorfrei gebleichtem Papier Springer Gabler ist eine Marke von Springer DE. Springer DE ist Teil der Fachverlagsgruppe Springer Science+Business Media www.springer-gabler.de
Vorwort Wie im Titel angedeutet, richtet sich dieses Buch an Anfänger im Fach Statistik. Es ist insbesondere für Bachelor- und Masterstudenten aller Disziplinen geeignet, selbst wenn die meisten Beispiele aus dem Bereich der Wirtschaftswissenschaften genommen wurden. In der umfangreichen Aufgabensammlung im ersten Teil werden alle wesentlichen Konzepte statistischer Methoden, inklusive ihrer Ideen und insbesondere auch ihre Anwendung wiederholt und geübt. Die Probleme beschränken sich daher auf viele, aber zumeist recht einfache Beispiele aus der Praxis, die die Anwendung der Methoden verdeutlichen sollen. Das Buch ist mathematisch informell gehalten und dient dem Selbststudium. Das vorliegende Werk entstand aus den vorlesungsbegleitenden Unterlagen der Statistik-Grundvorlesungen an der Wirtschaftswissenschaftlichen Fakultät der Georg- August-Universität Göttingen. Der Umfang des abgeprüften Lehrstoffes ist auf eine Veranstaltung mit ca. 42 Stunden Vorlesung und 42 Stunden Übungen ausgerichtet. Außerdem liegen noch ca. 13 Stunden praktische Computerübung, für gewöhnlich mit der statistischen Programmiersprache R, der Veranstaltung zugrunde. Dieses Buch kann sowohl als eigenständiges Arbeitsbuch, als auch als Begleitung zu dem ebenfalls in Springer erschienenem Lehrbuch Statistik für Bachelor- und Masterstudenten von Zucchini, Schlegel, Nenadić und Sperlich angesehen und genutzt werden. Der erste Teil des Buches besteht aus einer umfangreichen Aufgabensammlung, die nach 13 Themen untergliedert ist, die inhaltlich den Kapiteln des oben genannten Lehrbuches entsprechen. Diese Untergliederung soll das zielgerichtete Studium nach verschiedenen Inhalten und Gebieten wie zum Beispiel der deskriptiven Statistik, Hypothesentests oder der Regressionsanalyse erleichtern. Jedes Kapitel enthält sowohl Aufgaben zum Berechnen, Herleiten oder Interpretieren als auch das Verständnis fördernde, einfache multiple-choice Aufgaben zum Ankreuzen. Die ausführlichen Lösungen zu allen Problemstellungen finden Sie im zweiten Teil des Buches, das der Themeneinteilung des ersten Teils folgt. Im Anhang (Anhang B in dieser Version) befindet sich eine ausführliche Einführung in die Statistiksoftware R, die wir zum Erstellen einiger Aufgaben, aller Grafiken und vieler Lösungen verwendet haben. Es ist vorgesehen, die meisten dieser Prov
vi Vorwort gramme im Internetportal der Springerverlages öffentlich zur Verfügung zu stellen. Da R selbst gratis im Internet zur Verfügung steht und sich jeder unentgeltlich auf seinem eigenen Rechner installieren kann, können Sie somit fast alle Aufgaben nachrechnen und die Lösungsschritte in den Programmen noch einmal nachvollziehen. Am einige Jahre dauernden Prozess, in dem dieses Buch gewachsen ist, haben viele Personen mitgewirkt, sowohl bei den Lösungen als auch dem Bereitstellen von Daten. Wir danken für ihre Beiträge und Hilfe insbesondere allen Mitwirkenden des Instituts für Statistik und Ökonometrie der Georg-August Universität Göttingen. Änderungen in der zweiten Auflage Die wesentliche Änderung gegenüber der ersten Auflage ist die Formelsammlung im Anhang des Übungsbuches (Anhang C), die die wichtigsten im Übungsbuch verwendeten Formeln enthält und bisher nur online verfügbar war. Ebenso wurden am Ende der Lösungen die Tabellen der hier verwendeten Wahrscheinlichkeitsverteilungen angefügt (Anhang A). Weiterhin wurden zahlreiche Fehler im Übungsbuch korrigiert. Wir danken allen, die uns auf diese Fehler aufmerksam gemacht haben. Insbesondere danken wir all unseren Tutorinnen und Tutoren in Göttingen für zahlreiche Verbesserungsvorschläge. Für Hinweise auf noch vorhandene Fehler per mail an fboeker@uni-goettingen.de sind wir weiterhin sehr dankbar. Göttingen und Genève, Dezember 2012 Fred Böker Stefan Sperlich Walter Zucchini
Inhaltsverzeichnis 1 Aufgabensammlung... 1 1.1 Einführende Konzepte und Grundbegriffe... 1 1.2 Deskriptive Statistik... 6 1.3 Wahrscheinlichkeiten... 23 1.4 Verteilungen und ihre Eigenschaften.... 31 1.5 Diskrete Verteilungen... 43 1.6 Stetige Verteilungen... 54 1.7 Modellanpassung und Parameterschätzung.... 65 1.8 Hypothesentests... 80 1.9 Paare von Zufallsvariablen...100 1.10 Anpassungs- und Unabhängigkeitstest...111 1.11 Einfache Regressionsanalyse..... 123 1.12 Varianzanalyse.... 144 1.13 Zeitreihen und Indizes...... 153 2 Lösungen...171 2.1 Einführende Konzepte und Grundbegriffe - Lösungen....171 2.2 Deskriptive Statistik - Lösungen....173 2.3 Wahrscheinlichkeiten - Lösungen...187 2.4 Verteilungen und ihre Eigenschaften - Lösungen.....192 2.5 Diskrete Verteilungen - Lösungen....205 2.6 Stetige Verteilungen - Lösungen....212 2.7 Modellanpassung und Parameterschätzung - Lösungen.....225 2.8 Hypothesentests - Lösungen....234 2.9 Paare von Zufallsvariablen - Lösungen......249 2.10 Anpassungs- und Unabhängigkeitstest - Lösungen...... 258 2.11 Einfache Regressionsanalyse - Lösungen......265 2.12 Varianzanalyse - Lösungen..... 275 2.13 Zeitreihen und Indizes - Lösungen...280 A Verteilungstabellen...293 vii
viii Inhaltsverzeichnis B Eine Einführung in die Statistiksoftware R...299 B.1 Warum soll man R lernen?......299 B.2 Installation von R auf Ihrem Computer......300 B.3 Erste Schritte..... 301 B.3.1 Starten und Beenden...301 B.3.2 Einfache Berechnungen.....301 B.4 Hilfefunktionen...303 B.5 Vektoren and Indizes...304 B.5.1 Numerische, logische und Zeichenketten Vektoren.....304 B.5.2 Spezielle Werte...306 B.5.3 Objekte und ihre Attribute...306 B.5.4 Erzeugung regulärer Folgen...307 B.5.5 Indizierung von Vektoreinträgen...308 B.6 Nützliche einfache Funktionen....309 B.7 Matrizen, Listen und Data Frames......310 B.7.1 Indizierung von Matrix-Elementen..... 311 B.7.2 Matrixoperationen..... 312 B.7.3 Listen und Data Frames....313 B.8 Einlesen der Daten aus einer Datei und Datenaufbereitung...315 B.9 Zufallsstichproben und einfache statistische Berechnungen...315 B.10 Statistische Funktionen...... 317 B.10.1 Wahrscheinlichkeitsverteilungen...... 317 B.10.2 Funktionen zum Berechnen einfacher Statistiken...318 B.10.3 Beispiel einer Modellanpassung...319 B.11 Grafiken....321 B.12 Das Schreiben von Funktionen...327 B.13 Wo man noch viel mehr über R findet....333 C Formelsammlung...335 C.2 Deskriptive Statistik - Formeln...335 C.3 Wahrscheinlichkeiten - Formeln...338 C.4 Verteilungen und ihre Eigenschaften - Formeln....339 C.5 Diskrete Verteilungen - Formeln...343 C.6 Stetige Verteilungen - Formeln...346 C.7 Modellanpassung und Parameterschätzung - Formeln....349 C.8 Hypothesentests - Formeln...354 C.9 Paare von Zufallsvariablen - Formeln...359 C.10 Anpassungs- und Unabhängigkeitstest - Formeln...362 C.11 Einfache Regressionsanalyse - Formeln..... 365 C.12 Varianzanalyse - Formeln....370 C.13 Zeitreihen und Indizes - Formeln...374