Ludwig Fahrmeir Christian Heumann Rita Künstler Iris Pigeot Gerhard Tutz. Statistik. Der Weg zur Datenanalyse. 8., überarbeitete und ergänzte Auflage

Ähnliche Dokumente
Statistik. Ludwig Fahrmeir Rita Künstler Iris Pigeot Gerhard Tutz. Der Weg zur Datenanalyse. Springer. Zweite, verbesserte Auflage

Statistik. Ludwig Fahrmeir Rita Künstler Iris Pigeot Gerhard Tutz. Der Weg zur Datenanalyse. Springer. Fünfte, verbesserte Auflage

Statistik. ~ Springer Spektrum. 8., überarbeitete und ergänzte Auflage. Ludwig Fahrmeir Christian Heumann Rita Künstler Iris Pigeot Gerhard Tutz

Springer-Lehrbuch. Statistik. Der Weg zur Datenanalyse. Bearbeitet von Ludwig Fahrmeir, Christian Heumann, Rita Künstler, Iris Pigeot, Gerhard Tutz

Springer-Lehrbuch. Statistik. Der Weg zur Datenanalyse. Bearbeitet von Ludwig Fahrmeir, Rita Künstler, Iris Pigeot, Gerhard Tutz

Springer-Verlag Berlin Heidelberg GmbH

Philipp Sibbertsen Hartmut Lehne. Statistik. Einführung für Wirtschafts- und. Sozialwissenschaftler. 2., überarbeitete Auflage. 4^ Springer Gabler

Inhaltsverzeichnis. Robert Galata, Sandro Scheid. Deskriptive und Induktive Statistik für Studierende der BWL. Methoden - Beispiele - Anwendungen

Hans-Friedrich Eckey / Reinhold Kosfeld / Christian Dreger. Statistik. Grundlagen - Methoden - Beispiele GABLER

Arbeitsbuch zur deskriptiven und induktiven Statistik

Einführung in die Statistik

Arbeitsbuch Statistik

Inhaltsverzeichnis DESKRIPTIVE STATISTIK. 1 Grundlagen Grundbegriffe Skalen... 15

Statistik mit und ohne Zufall

Arbeitsbuch Statistik

Einführung in die Statistik

1 GRUNDLAGEN Grundbegriffe Skalen...15

Uwe Hassler. Statistik im. Bachelor-Studium. Eine Einführung. für Wirtschaftswissenschaftler. ^ Springer Gabler

Wolfgang Kohn Riza Öztürk. Statistik für Ökonomen. Datenanalyse mit R und SPSS. 3., überarbeitete Auflage. 4^ Springer Gabler

I Beschreibende Statistik 1

Wahrscheinlichkeitsrechnung und schließende Statistik

Einführung in die computergestützte Datenanalyse

Wahrscheinlichkeitsrechnung und schließende Statistik

Grundlagen der Wahrscheinlichkeitsrechnung und Statistik

Statistik. Datenanalyse mit EXCEL und SPSS. R.01denbourg Verlag München Wien. Von Prof. Dr. Karlheinz Zwerenz. 3., überarbeitete Auflage

Die mit * gekennzeichneten Abschnitte beinhalten Themen, die über die Anforderungen des Gegenstandskatalogs hinausgehen.

Statistik. Einführung in die com putergestützte Daten an alyse. Oldenbourg Verlag München B , überarbeitete Auflage

1 Einleitung und Grundlagen 1

Vorwort zur 3. Auflage 15. Vorwort zur 2. Auflage 15. Vorwort 16 Kapitel 0 Einführung 19. Teil I Beschreibende Statistik 29

Statistik für Ökonomen

Springer-Verlag Berlin Heidelberg GmbH

1 EINLEITUNG Allgemeines Kapitelübersicht Gebrauch dieses Buches Verwenden zusätzlicher Literatur...

Deskriptive Statistik

Statistik. Von Dr. Günter Bamberg. o. Professor für Statistik und Dr. habil. Franz Baur. Universität Augsburg. 12., überarbeitete Auflage

Statistik. Einführendes Lehrbuch für Wirtschafts- und Sozialwissenschaftler. Von Dr. Peter Bohley. Professor an der Universität Zürich

Inhaltsverzeichnis Grundlagen aufigkeitsverteilungen Maßzahlen und Grafiken f ur eindimensionale Merkmale

Statistik. Prof. em. Dr. Dr. h.c. Günter Bamberg PD Dr. Franz Baur Prof. Dr.Michael Krapp. 17., überarbeitete Auflage. Oldenbourg Verlag München.

Inhalt. I. Deskriptive Statistik Einführung Die Grundgesamtheit Merkmale und Verteilungen Tabellen und Grafiken...

Statistik. Datenanalyse mit EXCEL und SPSS. Prof. Dr. Karlheinz Zwerenz. R.Oldenbourg Verlag München Wien. Von

Statistik für. von. Prof. Dr. Josef Bleymüller. und. Prof. Dr. Rafael Weißbach. sowie. Dr. Günther Gehlert. und. Prof. Dr.

I. Deskriptive Statistik 1

Statistik für Ökonomen

Repetitorium Statistik

Helmut Reichardt/ Agnes Reichardt. Statistische Methodenlehre für Wirtschaftswissenschaftler

1.1.1 Ergebnismengen Wahrscheinlichkeiten Formale Definition der Wahrscheinlichkeit Laplace-Experimente...

Statistik im iadhetocr-studi der BWL und VWl

Klausurtraining Deskriptive und Induktive Statistik

Angewandte Statistik mit R. Eine Einführung für Ökonomen und

Inhaltsverzeichnis. Vorwort 13. Teil I Beschreibende Statistik 17. Kapitel 1 Statistische Merkmale und Variablen 19

Statistische Methoden der VWL und BWL Theorie und Praxis ST?

Inhaltsverzeichnis. Teil I Einführung

JosefPuhani. Kleine Formelsammlung zur Statistik. 10. Auflage. averiag i

Wirtschaftsstatistik für Studienanfänger

Angewandte Statistik mit R

Inhaltsverzeichnis. 2 Kurzbeschreibung von SPSS Der SPSS-Dateneditor Statistische Analysen mit SPSS DieDaten...

Klausurtraining Statistik

Angewandte Statistik 1

Gianfranco Walsh David Dose Maria Schwabe. Marketingübungsbuch. Aufgaben und Lösungen. 2., überarbeitete und erweiterte Auflage 2016

Reihenherausgeber: Prof. Dr. Holger Dette Prof. Dr. Wolfgang Härdle

Arbeitsbuch Mathematik

Statistik für Ingenieure und Naturwissenschaftler

Werkzeuge der empirischen Forschung

Bio- Statistik 1. mit 87 Abbildungen, 40 Tabellen und 102 Beispielen

Aufgabensammlung zur Einführung in die Statistik

Inhaltsverzeichnis. Vorwort. Abbildungsverzeichnis. Tabellenverzeichnis. 1 Einleitung Gegenstand Aufbau 4

Fachwissen Technische Akustik

Schwierige Menschen am Arbeitsplatz

Über dieses Buch Die Anfänge Wichtige Begriffe... 21

Statistik für Bachelorund Masterstudenten

Grundlagen der Statistik

ELEMENTARE EINFÜHRUNG IN DIE MATHEMATISCHE STATISTIK

Basiswissen Psychologie

Stichwortverzeichnis. Robert Galata, Sandro Scheid. Deskriptive und Induktive Statistik für Studierende der BWL. Methoden - Beispiele - Anwendungen

Inhaltsverzeichnis. Inhalt Teil I: Beschreibende (Deskriptive) Statistik Seite. 1.0 Erste Begriffsbildungen Merkmale und Skalen 5

Wahrscheinlichkeitsrechnung und schließende Statistik

Statistische Datenanalyse

Mathematik für Physiker Band 3

Vorwort. Das Lehrbuch vermittelt anwendungsorientiert den Lehrinhalt der Wahrscheinlichkeitsrechnung

360 -Beurteilung und Persönlichkeitstest in der Führungsbeurteilung

Gleichungen, Umformungen, Terme

Thomas Schäfer. Statistik I

Statistik für Wirtschaftswissenschaftler

1 Grundlagen der Wahrscheinlichkeitsrechnung Wahrscheinlichkeitsräume. Ein erster mathematischer Blick auf Zufallsexperimente...

Statistik im Bachelor-Studium der BWL und VWL

Inhaltsverzeichnis. Teil I Einführung

Holiand/Scharnbacher. Grundlagen statistischer Wahrscheinlichkeiten

Modulbeschreibung Statistik

Transkript:

Springer-Lehrbuch

Ludwig Fahrmeir Christian Heumann Rita Künstler Iris Pigeot Gerhard Tutz Statistik Der Weg zur Datenanalyse 8., überarbeitete und ergänzte Auflage

Ludwig Fahrmeir LMU München Institut für Statistik München, Deutschland Christian Heumann LMU München Institut für Statistik München, Deutschland Iris Pigeot Leibniz-Institut für Präventionsforschung und Epidemiologie BIPS Bremen, Deutschland Gerhard Tutz LMU München Institut für Statistik München, Deutschland Rita Künstler Zürich, Schweiz ISSN 0937-7433 Springer-Lehrbuch ISBN 978-3-662-50371-3 DOI 10.1007/978-3-662-50372-0 ISBN 978-3-662-50372-0 (ebook) Die Deutsche Nationalbibliothek verzeichnet diese Publikation in der Deutschen Nationalbibliografie; detaillierte biblio grafische Daten sind im Internet über http://dnb.d-nb.de abrufbar. Springer Spektrum Springer-Verlag Berlin Heidelberg 1997, 1999, 2001, 2003, 2004, 2007, 2010, 2016 Das Werk einschließlich aller seiner Teile ist urheberrechtlich geschützt. Jede Verwertung, die nicht ausdrücklich vom Urheberrechtsgesetz zugelassen ist, bedarf der vorherigen Zustimmung des Verlags. Das gilt insbesondere für Vervielfältigungen, Bearbeitungen, Übersetzungen, Mikroverfilmungen und die Einspeicherung und Verarbeitung in elektronischen Systemen. Die Wiedergabe von Gebrauchsnamen, Handelsnamen, Warenbezeichnungen usw. in diesem Werk berechtigt auch ohne besondere Kennzeichnung nicht zu der Annahme, dass solche Namen im Sinne der Warenzeichen- und Markenschutz- Gesetzgebung als frei zu betrachten wären und daher von jedermann benutzt werden dürften. Der Verlag, die Autoren und die Herausgeber gehen davon aus, dass die Angaben und Informationen in diesem Werk zum Zeitpunkt der Veröffentlichung vollständig und korrekt sind. Weder der Verlag noch die Autoren oder die Herausgeber übernehmen, ausdrücklich oder implizit, Gewähr für den Inhalt des Werkes, etwaige Fehler oder Äußerungen. Planung: Iris Ruhmann Gedruckt auf säurefreiem und chlorfrei gebleichtem Papier Springer Spektrum ist Teil von Springer Nature Die eingetragene Gesellschaft ist Springer-Verlag GmbH Berlin Heidelberg

Vorwort Statistische Verfahren werden stets dann benötigt und eingesetzt, wenn im Rahmen empirischer Fragestellungen Daten erhoben, dargestellt und analysiert werden sollen. Dabei spiegelt die große Vielfalt statistischer Methoden die Breite praktischer Fragestellungen etwa aus den Wirtschafts- und Sozialwissenschaften, der Medizin und den Natur- und Ingenieurwissenschaften wider. Diese Verknüpfung der Statistik mit ihren Anwendungsdisziplinen zeigt sich unter anderem darin, dass die Vermittlung der Grundlagen statistischer Methodik integrierter Bestandteil vieler Studiengänge ist. Dieses Buch wendet sich vorwiegend an Studierende der Wirtschafts- und Sozialwissenschaften, aber auch anderer Disziplinen wie Informatik oder Biometrie. Es ist zudem als Einführungstext für Studierende der Statistik geeignet. Ausgehend von einer Reihe realer Fragestellungen, die typische Anwendungssituationen statistischer Verfahren veranschaulichen, werden in Kapitel 1 die Grundbegriffe der Datenanalyse und - erhebung dargestellt. Diese realen Daten werden ergänzt durch weitere Beispiele in den einzelnen Kapiteln erneut aufgegriffen, um die Auseinandersetzung mit statistischen Methoden inhaltlich zu motivieren, ihre Anwendung zu illustrieren und die gewonnenen Ergebnisse zu interpretieren. Damit zielt die Darstellung der Methoden eher darauf ab, das Verständnis für die statistischen Verfahren und die dahinterstehende Denkweise zu erhöhen, als die Methoden in mathematischer Ausführlichkeit zu diskutieren. Zahlreiche grafische Darstellungen sollen zu diesem Ziel beitragen. Das Buch bietet insgesamt eine integrierte Einführung sowohl in die deskriptive Statistik und in moderne Methoden der explorativen Datenanalyse (Kapitel 2, 3) als auch in die induktive Statistik (Kapitel 9 bis 14). Letztere beinhaltet insbesondere auch Methoden der Regressions- (Kapitel 12) und der Varianzanalyse (Kapitel 13) sowie die Analyse von Zeitreihen (Kapitel 14). Eingeschlossen ist dabei eine ausführliche Beschreibung der Grundlagen der Stochastik (Kapitel 4 bis 8), die die Basis zum Verständnis der induktiven Statistik bildet. Zur Erhöhung der Übersichtlichkeit und der Lesbarkeit werden die wesentlichen Aspekte der einzelnen Kapitel im Text und durch Einrahmungen hervorgehoben. Stichwörter am Rand weisen auf die jeweils behandelten Aspekte hin. Einige Abschnitte sind mit einem Stern versehen. Diese behandeln spezielle Fragestellungen, die für das weitere Verständnis nicht erforderlich sind und gegebenenfalls übersprungen werden können. Am Ende eines jeden Kapitels werden zunächst die wichtigsten Aussagen dieses Kapitels noch einmal zusammengefasst und Hinweise auf weiterführende Literatur gegeben. Abschließend dienen einige Aufgaben zur Vertiefung des jeweiligen Stoffes. Auf eine große Anzahl von Aufgaben und die Angabe von Lösungen wurde verzichtet, da uns die Bereitstellung einer eigenen, auf dieses Lehrbuch abgestimmten Aufgabensammlung zweckmäßiger erscheint. Unser besonderer Dank gilt Norbert Behrens und Thomas Fürniss, die mit außergewöhnlichem Einsatz den größten Teil des L A TEX-Manuskripts erstellt haben. Bedanken möchten wir uns auch bei Thomas Billenkamp, Stefan Lang, Lisa Pritscher, Evi Rainer, Andrea Schöpp und Kurt Watzka für ihre Beiträge zu Beispielen, Grafiken, Aufgaben und Tabellen. Für Anregungen und Korrekturvorschläge sei zudem Artur Klinger, Leo Knorr-Held, Helmut Küchenhoff, Joachim Kunert, Nanny Wermuth und unseren Studenten gedankt sowie Joachim Hartung für das Überlassen der Tabellen zu den Wilcoxon-Tests. Schließlich gilt unser Dank dem Springer-Verlag für die stets gute Zusammenarbeit und für die Umsetzung all unserer Wünsche und besonders Herrn Dr. Werner A. Müller, der die Erstellung dieses Lehrbuches angeregt und durch seine Unterstützung erst ermöglicht hat. München und Berlin, im Juni 1997 Ludwig Fahrmeir, Rita Künstler, Iris Pigeot, Gerhard Tutz

vi Vorwort Bei der vorliegenden Auflage handelt es sich um eine durchgesehene und korrigierte Version der Erstauflage des Buches. Wir bedanken uns bei allen Kollegen, Freunden, Mitarbeitern und Studenten für Hinweise auf Fehler und für Verbesserungsvorschläge. Zu diesem Buch gibt es eine Homepage: Fahrmeir, Künstler, Pigeot, Tutz, Caputo und Lang (1999) http://www.stat.uni-muenchen.de/ fahrmeir/buchstat/ Die Homepage enthält insbesondere einen Großteil der verwendeten Daten. München, im Juli 1998 Ludwig Fahrmeir, Rita Künstler, Iris Pigeot, Gerhard Tutz Die neue Auflage ist gegenüber der vorhergehenden im Wesentlichen unverändert. Kleinere Textkorrekturen dienen nur der Vermeidung von Unstimmigkeiten. Als Ergänzung zum Lehrbuch liegt seit 1999 Fahrmeir, L., Künstler, R., Pigeot, I., Tutz, G., Caputo, A., Lang, S. : Arbeitsbuch Statistik vor, das ebenfalls im Springer-Verlag erschienen ist. Die im Arbeitsbuch verwendeten Datensätze finden sich unter http://www.stat.uni-muenchen.de/ fahrmeir/uebbuch/uebbuch.html München, im Juli 2000 Ludwig Fahrmeir, Rita Künstler, Iris Pigeot, Gerhard Tutz In der vierten Auflage wurde das Schriftbild leicht verändert. Neu hinzugekommen ist eine kurze Einführung in Bayesianische Schätzverfahren bzw. Bayesianisches Lernen sowie ein Abschnitt über kategoriale Regression, in der die Grundideee der Regression auf binäre abhängige Variablen übertragen wird. Eine Übersicht über die verwendeten Beispiele, die das Aufsuchen bestimmter Beispiele erleichtern soll, findet sich am Ende des Buches. Zu den Aufgaben am Ende der einzelnen Kapitel finden sich nun die Lösungen im Arbeitsbuch Fahrmeir, L., Künstler, R., Pigeot, I., Tutz, G., Caputo, A., Lang, S (2002). Arbeitsbuch Statistik (3. Auflage). Springer-Verlag, Berlin. Datensätze, die als Beispiele für das Arbeiten mit realen Daten dienen können, finden sich in unserem Datenarchiv http://www.stat.uni-muenchen.de/service/datenarchiv/ Unser besonderer Dank gilt Herrn Michael Schindler für die gründliche und engagierte Aufbereitung des Textbildes mit L A TEX. München, im Juni 2002 Ludwig Fahrmeir, Rita Künstler, Iris Pigeot, Gerhard Tutz

Vorwort vii In der fünften Fassung wurden neben einigen Druckfehlern insbesondere die Beispiele und Aufgaben überarbeitet. Die Beispiele, die noch auf der Einheit DM beruhten, wurden durchwegs durch Beispiele auf Euro-Basis ersetzt. Dem in vielen Kapiteln dargestellten Mietspiegel liegt nun eine zeitgemäße Währung zugrunde. Die aktuellen Datensätze finden sich unter http://www.stat.uni-muenchen.de/service/datenarchiv/. Wir danken Studenten und Lesern für Kommentare und Korrekturhinweise, sowie Frau Petra Menn für ihre Hilfe bei der Überarbeitung. München, im Januar 2004 Ludwig Fahrmeir, Rita Künstler, Iris Pigeot, Gerhard Tutz In der sechsten Auflage wurden einige noch verbliebene Druckfehler korrigiert. Wir danken Herrn Böker für die Hinweise zur Korrektur der Tabelle zum Wilcoxon-Rangsummen-Test. Dank für alle hilfreichen Kommentare von Lesern und Studenten. München, im Dezember 2006 Ludwig Fahrmeir, Rita Künstler, Iris Pigeot, Gerhard Tutz In der siebten Auflage wurden einige noch verbliebene Druckfehler korrigiert. Dank für alle hilfreichen Kommentare von Lesern und Studenten. München, im Mai 2009 Vorwort zur 8. Auflage Ludwig Fahrmeir, Rita Künstler, Iris Pigeot, Gerhard Tutz Wir freuen uns sehr, dass unser Buch weiterhin auf so großes Interesse stößt, und haben daher für die nunmehr 8. Auflage die Gelegenheit zu einer gründlichen Renovierung genutzt. Zu den wesentlichen Neuerungen dieser Auflage zählen die Aktualisierung von Anwendungsbeispielen, die Durchführung zugehöriger Datenanalysen mit dem Programmpaket R und die damit verbundene Möglichkeit, die Resultate nachzuvollziehen. Darüber hinaus haben wir einige Ergänzungen des Stoffes vorgenommen. Für das bisherige Autorenteam war es sehr erfreulich, dazu Christian Heumann als kompetente Verstärkung gewinnen zu können. Bereits in früheren Auflagen verwendete Anwendungsbeispiele haben wir mit aktuellen realen Daten mit Hilfe von R vollständig runderneuert, d.h. wir haben sie reanalysiert und die Ergebnisse neu aufbereitet. Zudem haben wir weitere Anwendungsbeispiele hinzugefügt. Ausgewählte R-Codes mit kommentierten Hinweisen zeigen am Ende entsprechender Kapitel exemplarisch, wie wir die Ergebnisse erzielt haben. Ergänzend soll eine kurze Einführung in R (Kap. 15) Interessierten den Einstieg in R erleichtern. Die Homepage http : //chris.userweb.mwn.de/statistikbuch.html zu dieser Neuauflage stellt Datensätze, R-Codes, nützliche Links und weiteres Material zur Verfügung. Dies ermöglicht es unsere Analysen nachzuvollziehen, um so die im Buch dargestellten Resultate reproduzieren und durch eigenständige Analysen ergänzen zu können. Zudem wird das selbständige Arbeiten mit R oder anderer Software durch zusätzliche Aufgaben am Ende von Kapiteln unterstützt. Dort finden sich auch weiterhin Aufgaben im üblichen Stil. Deren Lösungen und weitere Aufgaben sind im Arbeitsbuch Fahrmeir, Künstler, Pigeot, Tutz, Caputo und Lang (1999) enthalten. Die methodischen Inhalte haben wir weitgehend beibehalten. Neu aufgenommen wurde insbesondere der Korrelationskoeffizient von Kendall in Kap. 3 und der exakte Test von Fisher in Kap. 11.

viii Vorwort Wir danken unseren aufmerksamen Leserinnen und Lesern für Anregungen und Hinweise auf hartnäckige Fehler, die trotz sorgfältigen Korrekturlesens die bisherigen Auflagen überstanden haben. Schließlich gilt unser Dank Frau Iris Burger und Frau Pia Oberschmidt vom Institut für Statistik, sowie Frau Iris Ruhmann, Frau Barbara Lühker und dem gesamten Verlagsteam für die angenehme und konstruktive Zusammenarbeit. München, im Mai 2016 Ludwig Fahrmeir, Christian Heumann, Rita Künstler, Iris Pigeot, Gerhard Tutz

Vorwort v 1 Einführung 1 1.1 Wo braucht man Statistik?............................... 1 1.2 Was macht man mit Statistik?.............................. 10 1.3 Was steht am Anfang?................................. 12 1.3.1 Statistische Einheiten, Merkmale und Gesamtheiten.............. 13 1.3.2 Merkmalstypen................................. 14 Stetige und diskrete Merkmale......................... 15 Skalen...................................... 15 Quantitative und qualitative Merkmale..................... 17 1.4 Wie gewinnt man Daten?................................ 18 1.4.1 Elemente der Versuchsplanung......................... 19 1.4.2 Datengewinnung und Erhebungsarten..................... 21 Einfache Zufallsstichproben.......................... 22 Geschichtete Zufallsstichproben........................ 23 Klumpenstichprobe............................... 23 Mehrstufige Auswahlverfahren......................... 24 Bewusste Auswahlverfahren.......................... 24 Studiendesigns................................. 25 1.5 Zusammenfassung und Bemerkungen......................... 25 1.6 Statistische Software.................................. 26 1.7 Aufgaben........................................ 27 2 Univariate Deskription und Exploration von Daten 29 2.1 Verteilungen und ihre Darstellungen.......................... 29 2.1.1 Häufigkeiten.................................. 30 2.1.2 Grafische Darstellungen............................ 32 Stab- und Kreisdiagramme........................... 32 Stamm-Blatt-Diagramme............................ 34 Histogramme.................................. 38 Unimodale und multimodale Verteilungen................... 43 Symmetrie und Schiefe............................. 44 2.1.3 Kumulierte Häufigkeitsverteilung und empirische Verteilungsfunktion.... 45

x 2.2 Beschreibung von Verteilungen............................. 48 2.2.1 Lagemaße.................................... 49 Arithmetisches Mittel............................. 49 Das getrimmte und das winsorisierte Mittel.................. 51 Median..................................... 52 Modus..................................... 53 Berechnung der Lagemaße bei gruppierten Daten............... 55 Lageregeln................................... 56 Das geometrische Mittel............................ 57 Das harmonische Mittel............................ 59 2.2.2 Quantile und Box-Plot............................. 59 2.2.3 Standardabweichung, Varianz und Variationskoeffizient............ 64 2.2.4 Maßzahlen für Schiefe und Wölbung..................... 69 2.3 Konzentrationsmaße.................................. 71 2.3.1 Relative Konzentration: Lorenzkurve und Gini-Koeffizient.......... 72 Lorenzkurve aus den geordneten Daten.................... 72 Lorenzkurve bei gruppierten Daten...................... 75 Gini-Koeffizient................................ 76 2.3.2 Alternative Konzentrationsmaße........................ 78 Konzentrationsrate CR g............................ 78 Herfindahl-Index................................ 79 2.4 Dichtekurven und Normalverteilung.......................... 80 2.4.1 Dichtekurven.................................. 80 2.4.2 Normalverteilungen.............................. 83 Normal-Quantil-Plots.............................. 87 2.4.3 Approximation von Dichtekurven....................... 91 2.5 Zusammenfassung und Bemerkungen......................... 94 2.6 Univariate Datenanalyse mit R............................. 96 2.6.1 Verteilungen und ihre Darstellungen...................... 97 2.6.2 Beschreibung von Verteilungen........................ 98 2.6.3 Konzentrationsmaße.............................. 100 2.6.4 Dichtekurven und Normalverteilung...................... 100 2.7 Aufgaben........................................ 101 3 Multivariate Deskription und Exploration 105 3.1 Diskrete und gruppierte Merkmale........................... 105 3.1.1 Zweidimensionale Daten: Die Kontingenztabelle............... 105 3.1.2 Bedingte Häufigkeiten............................. 110 3.2 Zusammenhangsanalyse in Kontingenztabellen.................... 113 3.2.1 Chancen und relative Chancen......................... 113 3.2.2 Kontingenz- und χ 2 -Koeffizient........................ 115 3.3 Grafische Darstellungen quantitativer Merkmale.................... 120 3.3.1 Streudiagramm................................. 121

xi 3.3.2 Zweidimensionale Histogramme und Dichten................. 122 3.3.3 Mehrdimensionale Darstellungen....................... 124 3.4 Zusammenhangsmaße bei metrischen Merkmalen................... 126 3.4.1 Empirischer Korrelationskoeffizient nach Bravais-Pearson.......... 126 3.4.2 Spearmans Korrelationskoeffizient....................... 133 3.4.3 Alternative Rangkorrelationsmaße....................... 136 3.4.4 Invarianzeigenschaften............................. 138 3.5 Korrelation und Kausalität............................... 140 3.6 Regression........................................ 144 3.6.1 Das lineare Regressionsmodell......................... 144 3.6.2 Die Berechnung der Ausgleichsgeraden.................... 145 3.6.3 Bestimmtheitsmaß und Residualanalyse.................... 149 3.6.4 Nichtlineare Regression............................ 155 3.7 Zusammenfassung und Bemerkungen......................... 156 3.8 Multivariate Deskription mit R............................. 158 3.8.1 Diskrete und gruppierte Daten......................... 158 3.8.2 Zusammenhangsanalyse in Kontingenztabellen................ 160 3.8.3 Grafische Darstellungen quantitativer Merkmale............... 160 3.8.4 Zusammenhangsmaße bei metrischen Merkmalen............... 161 3.8.5 Regression................................... 161 3.9 Aufgaben........................................ 162 4 Wahrscheinlichkeitsrechnung 165 4.1 Definition und Begriff der Wahrscheinlichkeit..................... 166 4.1.1 Mengen und Mengenoperationen....................... 167 4.1.2 Zufallsereignisse................................ 170 4.1.3 Wahrscheinlichkeiten.............................. 172 4.2 Zur empirischen Interpretation von Wahrscheinlichkeiten............... 177 4.2.1 Die Laplace-Wahrscheinlichkeit........................ 178 4.2.2 Objektive Wahrscheinlichkeiten als Grenzwert relativer Häufigkeiten.... 181 4.2.3 Subjektive Wahrscheinlichkeiten........................ 183 4.3 Zufallsstichproben und Kombinatorik......................... 184 4.3.1 Modell mit Zurücklegen............................ 184 4.3.2 Modell ohne Zurücklegen........................... 185 4.3.3 Permutationen................................. 186 4.3.4 Modell ohne Zurücklegen und ohne Berücksichtigung der Reihenfolge... 187 4.4 Bedingte Wahrscheinlichkeiten............................. 190 4.5 Unabhängigkeit von zwei Ereignissen......................... 193 4.6 Totale Wahrscheinlichkeit................................ 196 4.7 Der Satz von Bayes................................... 198 4.8 Unendliche Grundgesamtheiten............................. 203 4.9 Zusammenfassung und Bemerkungen......................... 205 4.10 Aufgaben........................................ 206

xii 5 Diskrete Zufallsvariablen 209 5.1 Zufallsvariablen..................................... 209 5.2 Verteilungen und Parameter von diskreten Zufallsvariablen.............. 212 5.2.1 Definition und Verteilung............................ 212 Diskrete Gleichverteilung........................... 218 Geometrische Verteilung............................ 219 5.2.2 Unabhängigkeit von diskreten Zufallsvariablen................ 222 5.2.3 Lageparameter, Quantile und Streuungsparameter einer diskreten Verteilung. 225 Erwartungswert................................. 225 5.2.4 Weitere Lageparameter............................. 230 Varianz und Standardabweichung....................... 231 5.3 Spezielle diskrete Verteilungsmodelle......................... 234 5.3.1 Die Binomialverteilung............................. 235 5.3.2 Die hypergeometrische Verteilung....................... 240 5.3.3 Die Poisson-Verteilung............................. 242 5.4 Zusammenfassung und Bemerkungen......................... 245 5.5 Diskrete Verteilungen in R............................... 247 5.6 Aufgaben........................................ 248 6 Stetige Zufallsvariablen 251 6.1 Definition und Verteilung................................ 251 Unabhängigkeit von stetigen Zufallsvariablen................. 256 Exponentialverteilung............................. 260 6.2 Lageparameter, Quantile und Varianz von stetigen Zufallsvariablen.......... 262 Erwartungswert................................. 262 Modus..................................... 265 Median und Quantile.............................. 265 Varianz..................................... 267 Standardisierung von Zufallsvariablen..................... 269 Symmetrie und Schiefe............................. 269 6.3 Spezielle stetige Verteilungsmodelle.......................... 271 6.3.1 Die Normalverteilung............................. 271 Quantile..................................... 274 6.3.2 Die logarithmische Normalverteilung..................... 278 6.3.3 Chi-Quadrat-, Student- und Fisher-Verteilung................. 279 Die Chi-Quadrat-Verteilung.......................... 279 Die Student-Verteilung............................. 280 Die Fisher-Verteilung.............................. 281 6.4 Zusammenfassung und Bemerkungen......................... 283 6.5 Stetige Zufallsvariablen in R.............................. 284 6.6 Aufgaben........................................ 285

xiii 7 Mehr über Zufallsvariablen und Verteilungen 289 7.1 Gesetz der großen Zahlen und Grenzwertsätze..................... 289 7.1.1 Das Gesetz der großen Zahlen und der Hauptsatz der Statistik........ 291 7.1.2 Der zentrale Grenzwertsatz........................... 293 7.2 Approximation von Verteilungen............................ 296 7.3 Zufallszahlen und Simulation.............................. 298 7.4 Einige Ergänzungen................................... 300 7.4.1 Zufallsvariablen als Abbildungen....................... 301 7.4.2 Verteilungsfunktion und ihre Eigenschaften.................. 302 7.4.3 Ungleichung von Tschebyscheff........................ 304 7.4.4 Maßzahlen für Schiefe und Wölbung..................... 306 7.5 Zusammenfassung und Bemerkungen......................... 307 7.6 Zufallszahlen mit R................................... 307 7.7 Aufgaben........................................ 309 8 Mehrdimensionale Zufallsvariablen 311 8.1 Begriff mehrdimensionaler Zufallsvariablen...................... 311 8.2 Zweidimensionale diskrete Zufallsvariablen...................... 313 8.3 Zweidimensionale stetige Zufallsvariablen....................... 319 8.4 Unabhängigkeit von Zufallsvariablen.......................... 321 8.5 Kovarianz und Korrelation............................... 323 8.6 Die zweidimensionale Normalverteilung........................ 330 8.7 Zusammenfassung und Bemerkungen......................... 333 8.8 Die zweidimensionale Normalverteilung in R..................... 334 8.9 Aufgaben........................................ 334 9 Parameterschätzung 337 9.1 Punktschätzung..................................... 338 9.2 Eigenschaften von Schätzstatistiken.......................... 340 9.2.1 Erwartungstreue................................ 340 9.2.2 Erwartete mittlere quadratische Abweichung und Konsistenz......... 343 9.2.3 Wirksamste Schätzstatistiken.......................... 346 9.3 Konstruktion von Schätzfunktionen.......................... 348 9.3.1 Maximum Likelihood-Schätzung....................... 348 9.3.2 Kleinste-Quadrate-Schätzung......................... 351 9.3.3 Bayes-Schätzung................................ 351 9.4 Intervallschätzung.................................... 356 9.4.1 Konfidenzintervalle für Erwartungswert und Varianz............. 358 9.4.2 Konfidenzintervalle für den Anteilswert.................... 362 9.5 Zusammenfassung und Bemerkungen......................... 363 9.6 Konfidenzintervalle in R................................ 364 9.7 Aufgaben........................................ 366

xiv 10 Testen von Hypothesen 369 10.1 Der Binomial- und der Gauß-Test........................... 369 10.1.1 Der exakte Binomialtest............................ 372 10.1.2 Der approximative Binomialtest........................ 375 10.1.3 Der Gauß-Test................................. 378 10.2 Prinzipien des Testens.................................. 381 10.2.1 Fehlentscheidungen............................... 384 10.2.2 Statistische Tests und Konfidenzintervalle................... 386 10.2.3 Überschreitungswahrscheinlichkeit...................... 387 10.2.4 Gütefunktion.................................. 389 Multiple Testprobleme................................. 395 10.3 Zusammenfassung und Bemerkungen......................... 396 10.4 Aufgaben........................................ 397 11 Spezielle Testprobleme 399 11.1 Ein-Stichproben-Fall.................................. 400 11.1.1 Tests zu Lagealternativen............................ 401 11.1.2 Anpassungstests................................ 409 11.2 Vergleiche aus unabhängigen Stichproben....................... 417 11.2.1 Tests zu Lagealternativen............................ 418 11.2.2 χ 2 -Homogenitätstest.............................. 423 11.2.3 Exakter Test von Fisher............................. 426 11.3 Vergleiche aus verbundenen Stichproben........................ 428 11.4 Zusammenhangsanalyse................................ 428 11.4.1 χ 2 -Unabhängigkeitstest............................ 429 11.4.2 Korrelation bei metrischen Merkmalen.................... 431 11.5 Zusammenfassung und Bemerkungen......................... 433 11.6 Tests mit R....................................... 434 11.7 Aufgaben........................................ 435 12 Regressionsanalyse 437 12.1 Lineare Einfachregression............................... 438 12.1.1 Das Modell der linearen Einfachregression.................. 438 12.1.2 Schätzen, Testen und Prognose......................... 441 Schätzen.................................... 441 Testen...................................... 445 Prognose.................................... 448 12.1.3 Residualanalyse................................. 449 12.2 Multiple lineare Regression............................... 450 12.2.1 Das multiple lineare Regressionsmodell.................... 453 12.2.2 Schätzen, Testen und Prognose......................... 454 Schätzen.................................... 455 Testen...................................... 457 Prognose.................................... 460

xv 12.2.3 Multiple lineare Regression in Matrixnotation................. 461 12.3 Binäre Regression.................................... 463 12.4 Nichtlineare und nichtparametrische Regression.................... 465 12.5 Zusammenfassung und Bemerkungen......................... 468 12.6 Regressionsanalysen mit R............................... 470 12.6.1 Einfache lineare Regression.......................... 470 12.6.2 Multiple lineare Regression.......................... 472 12.6.3 Weitere Regressionsmodelle.......................... 473 12.7 Aufgaben........................................ 474 13 Varianzanalyse 477 13.1 Einfaktorielle Varianzanalyse.............................. 478 Modellformulierung (I)............................. 479 Modellformulierung (II)............................ 480 13.2 Zweifaktorielle Varianzanalyse mit festen Effekten.................. 486 Modellformulierung (I)............................. 488 Modellformulierung (II)............................ 488 13.3 Zusammenfassung und Bemerkungen......................... 498 13.4 Aufgaben........................................ 499 14 Zeitreihen 503 14.1 Indizes.......................................... 507 14.2 Komponentenmodelle.................................. 509 14.3 Globale Regressionsansätze............................... 511 14.3.1 Trendbestimmung............................... 511 14.3.2 Bestimmung der Saisonkomponente...................... 513 14.4 Lokale Ansätze..................................... 516 14.4.1 Trendbestimmung............................... 516 Gleitende Durchschnitte............................ 516 Lokale Regression............................... 517 Spline-Glättung................................. 518 14.4.2 Bestimmung der Saisonkomponente...................... 520 Gleitende Durchschnitte und lokale Regression................ 520 Spline-Glättung................................. 523 14.5 Zusammenfassung und Bemerkungen......................... 523 14.6 Zeitreihenanalyse mit R................................ 524 14.7 Aufgaben........................................ 525

xvi 15 Einführung in R 529 15.1 R als Taschenrechner.................................. 529 15.2 Grundlegende Datenstrukturen in R.......................... 532 15.2.1 Vektoren.................................... 532 15.2.2 Matrizen und Datensätze............................ 533 15.2.3 Listen...................................... 536 15.2.4 Arrays...................................... 537 15.2.5 Mehr zu Faktorvariablen............................ 538 15.2.6 Mehr zur Indizierung.............................. 539 15.3 Funktionen und mathematische Konstanten...................... 540 15.3.1 Statistische Funktionen............................. 540 15.3.2 Weitere praktische mathematische Funktionen................ 540 15.3.3 Mathematische Konstanten........................... 541 15.3.4 Eigene Funktionen in R............................ 541 15.4 Datenverarbeitung.................................... 542 15.4.1 Sortieren.................................... 542 15.4.2 Ränge bilden.................................. 543 15.4.3 Duplikate und eindeutige Werte, Minimum und Maximum finden...... 543 15.4.4 Diskretisierung numerischer Variablen..................... 544 15.5 Verteilungen und Zufallsvariablen........................... 545 15.6 Grafiken......................................... 545 15.7 Weiterführende Hinweise................................ 546 Tabellen 547 A Standardnormalverteilung................................ 547 B Binomialverteilung................................... 548 C χ 2 -Verteilung...................................... 556 D Students t-verteilung.................................. 557 E F -Verteilung...................................... 558 F Wilcoxon-Vorzeichen-Rang-Test............................ 562 G Wilcoxon-Rangsummen-Test.............................. 564 Literatur 565 Verzeichnis der Beispiele 569 Sachregister 575