Statistik für Wirtschaftswissenschaftler
Peter P. Eckstein Statistik für Wirtschaftswissenschaftler Eine realdatenbasierte Einführung mit SPSS 3., überarbeitete und erweiterte Auflage
Prof. Dr. Peter P. Eckstein HTW Berlin, Deutschland ISBN 978-3-8349-3568-7 DOI 10.1007/978-3-8349-3569-4 ISBN 978-3-8349-3569-4 (ebook) Die Deutsche Nationalbibliothek verzeichnet diese Publikation in der Deutschen Nationalbibliografie; detaillierte bibliografische Daten sind im Internet über http://dnb.d-nb.de abrufbar. Springer Gabler Gabler Verlag Springer Fachmedien Wiesbaden 2008, 2010, 2012 Das Werk einschließlich aller seiner Teile ist urheberrechtlich geschützt. Jede Verwertung, die nicht ausdrücklich vom Urheberrechtsgesetz zugelassen ist, bedarf der vorherigen Zustimmung des Verlags. Das gilt insbesondere für Vervielfältigungen, Bearbeitungen, Übersetzungen, Mikroverfilmungen und die Einspeicherung und Verarbeitung in elektronischen Systemen. Die Wiedergabe von Gebrauchsnamen, Handelsnamen, Warenbezeichnungen usw. in diesem Werk berechtigt auch ohne besondere Kennzeichnung nicht zu der Annahme, dass solche Namen im Sinne der Warenzeichen und Markenschutz-Gesetzgebung als frei zu betrachten wären und daher von jedermann benutzt werden dürften. Lektorat: Irene Buttkus, Renate Schilling Einbandentwurf: KünkelLopka GmbH, Heidelberg Gedruckt auf säurefreiem und chlorfrei gebleichtem Papier Springer Gabler ist eine Marke von Springer DE. Springer DE ist Teil der Fachverlagsgruppe Springer Science+Business Media www.springer-gabler.de
Vorwort V Vorwort zur 3. Auflage Die überaus positive Resonanz, die das Lehrbuch erfuhr, bestärkte mich, umgehend eine dritte, überarbeitete und aktualisierte Auflage bereitzustellen. Die augenscheinlichen Neuerungen der dritten Auflage werden vor allem durch aktualisierte Daten und durch die Nutzung des Programmpakets IBM SPSS Statistics in der Version 20 getragen. Die im Lehrbuch benutzten SPSS Datendateien stehen im Internet unter der im Anhang B angegebenen Adresse zur freien Verfügung. Zudem erfährt das vorliegende Lehrbuch eine inhaltliche Ergänzung durch das gleichermaßen im Jahr 2012 im GABLER-Verlag erschienene Lehrbuch Datenanalyse mit SPSS, das in einer zweiten und erweiterten Auflage als Kompendium eine breite Palette realdatenbasierter Übungs- und Klausuraufgaben mit vollständigen Lösungen bereitstellt. Die vorliegende Auflage wäre ohne die Unterstützung von geschätzten Damen und Herren nicht möglich gewesen. In diesem Zusammenhang gilt mein besonderer Dank: Frau Mag. theol. Irene BUTTKUS und Frau Dipl.-Ing. Renate SCHIL- LING für die Betreuung dieses Buchprojekts seitens des Verlages, Frau Professor Dr. Monika KUMMER sowie den Herren Professor Dr. Rudolf SWAT, Dr. Manfred MOCKER, Dr. Gerhard BUROW und Dr. Manfred PACKEISER für die sachdienlichen Hinweise zur inhaltlichen Gestaltung des Lehrbuches. Herrn Diplom- Wirtschaftsinformatiker Frank STEINKE gilt mein Dank für die Gestaltung und Betreuung des Downloadbereichs. Berlin, im Februar 2012 Peter P. ECKSTEIN Aus dem Vorwort zur 1. Auflage Die Einrichtung von Bachelor- und Master-Studiengängen an den deutschen Universitäten und Hochschulen hat in logischer Konsequenz auch die Installation und Umsetzung geeigneter und effizienter Methoden der akademischen Bildung zur Folge. Der politische, gesellschaftliche und unternehmerische Ruf nach einer theoretisch anspruchsvollen, problemorientierten, praxisrelevanten und zeitlich straffen akademischen Bildung ist nicht zu überhören. Soll der fordernde Ruf nicht ungehört verhallen, bedarf es gleichermaßen Anstrengungen seitens der Lehrenden und der Studierenden. Bloßes theoretisches Dozieren ist ebenso wenig zielführend wie amorphes und stupides Absorbieren vermittelten Wissens. Eine theoretisch profunde, praxisrelevante, anschauliche und zugleich verständliche curriculare Wissensvermittlung gilt es durch ein konsequentes, kontinuierliches und effektives extracurriculares Selbststudium zu ergänzen. Das vorliegende Lehrbuch ist in diesem Sinne konzipiert und soll einen Beitrag zur Qualifizierung akademischer Lehre auf dem Gebiet der Statistik in wirtschaftswissenschaftlichen Bachelor- und Master-Studiengängen leisten.
VI Vorwort Der Zugang zur Statistik, der in diesem Lehrbuch angeboten wird, ist sowohl das Resultat meiner langjährigen Lehrerfahrungen auf dem Gebiet der Statistik als auch das Komprimat von vorlesungs- und übungsbegleitenden Skripten sowie der gleichsam im GABLER Verlag in mehreren Auflagen publizierten Statistik- Lehrbücher. Anhand realer Daten werden mit Hilfe des Statistik-Programm- Pakets SPSS 15 einfache und anspruchsvolle Verfahren und Modelle der Deskriptiven Statistik, der Explorativen Datenanalyse, der Stochastik und der Induktiven Statistik paradigmatisch dargestellt. Dabei liegt der inhaltliche Schwerpunkt des Lehrbuches nicht auf der mathematischen Herleitung und theoretischen Begründung der dargestellten statistischen Verfahren, sondern auf ihrer wirtschaftswissenschaftlichen und realdatenbasierten Applikation, worin stets eine sachlogische Interpretation der Analyseergebnisse eingeschlossen ist. Das Lehrbuch ist in zwölf Kapitel gegliedert. Das erste Kapitel beinhaltet einige historische Notizen zur Statistik. Das zweite Kapitel hat die Erläuterung statistischer Grundbegriffe zum Gegenstand, ohne deren elementares Verständnis ein statistisches Arbeiten nicht möglich ist. Im dritten Kapitel werden zwei praxisrelevante Datenerhebungskonzepte paradigmatisch eingeführt: das sogenannte Urlisten- und das Fragebogenkonzept. Das vierte Kapitel hat eine Einführung in das Statistik-Programm-Paket SPSS 15 in der deutschen Ausgabe zum Inhalt. Das fünfte Kapitel ist der Beschreibung statistisch erhobener Daten gewidmet. Das sechste Kapitel hat eine elementare Einführung in die Stochastik zum Gegenstand, ohne die das Verständnis von Verfahren der statistischen Induktion, die ein spezieller Gegenstand des siebenten Kapitels sind, nicht denkbar ist. Im achten Kapitel werden klassische Verfahren der statistischen Zusammenhangsanalyse exemplarisch dargestellt. Während das neunte Kapitel eine Einführung in die Regressionsanalyse zum Gegenstand hat, vermittelt das zehnte Kapitel die Grundidee der Zeitreihenanalyse. Schließlich und endlich werden im elften und zwölften Kapitel zwei Analysekonzepte am praktischen Sachverhalt skizziert, ohne die man in der empirischen Wirtschaftsforschung nicht mehr auskommt: die Faktorenanalyse und die Clusteranalyse. Um die Arbeit mit dem Lehrbuch zu erleichtern, wurden die Beispiele, Tabellen und Abbildungen verschlüsselt. So besitzt zum Beispiel der Schlüssel Abbildung 1.2-1 (Statistik als empirische Wissenschaft) die folgende Semantik: eine Abbildung, die im Abschnitt 1.2 dargestellt ist und innerhalb des Abschnittes 1.2 die fortlaufende Nummer 1 besitzt. Analog sind die Schlüssel für die Beispiele und Tabellen zu deuten. Für meine Frau Regina Berlin, im Februar 2008 Peter P. ECKSTEIN
Inhaltsverzeichnis VII Inhaltsverzeichnis 1 Statistik... 1 1.1 Historische Notizen... 2 1.2 Statistik-Begriff... 9 2 Grundbegriffe... 11 2.1 Einheit, Gesamtheit, Stichprobe... 12 Reine Zufallsauswahl... 16 Systematische Zufallsauswahl... 17 Geschichtete Zufallsauswahl... 18 2.2 Merkmal, Merkmalsausprägung, Skala... 21 Zustandsmenge... 23 Nominale Skala... 24 Ordinale Skala... 25 Metrische Skala... 26 Diskretes Merkmal... 28 Stetiges Merkmal... 29 Zusammenfassung... 30 3 Datenerhebung... 31 3.1 Grundbegriffe... 32 3.2 Urlistenkonzept... 34 3.3 Fragebogenkonzept... 37 4 SPSS Statistics... 41 4.1 Wofür steht SPSS?... 42 4.2 SPSS starten und beenden... 43 4.3 SPSS Editoren und Viewer... 44 4.4 SPSS Dialogfelder... 47 4.5 SPSS Hilfesystem und Optionen... 48 4.6 SPSS Daten- und Datei-Management... 50 4.6.1 SPSS Variablendefinition... 51 4.6.2 Daten eingeben und speichern... 56 4.6.3 Einlesen einer Datendatei... 58 4.6.4 SPSS Datendateien bearbeiten... 61 Dateien zusammenfügen, Fälle hinzufügen... 62 Merkmalsträger nummerieren... 65 Variablenwerte berechnen... 66 Merkmalsträger auswählen und/oder löschen... 68
VIII Inhaltsverzeichnis 5 Datendeskription... 71 5.1 Häufigkeiten und Häufigkeitsverteilungen... 72 Empirische Verteilungsfunktion... 74 PARETO-Diagramm... 78 Analyse von Mehrfachantworten... 80 Kreisdiagramm... 86 Balkendiagramm... 89 Stem-and-Leaf-Plot... 92 Histogramm... 96 5.2 Lagemaße... 98 5.2.1 Modus... 99 5.2.2 Quantile... 100 Box-and-Whisker-Plot... 106 5.2.3 Arithmetisches Mittel... 108 5.3 Streuungsmaße... 114 5.3.1 Spannweite und zentraler Quantilsabstand... 114 5.3.2 Varianz und Standardabweichung... 118 5.4 Verteilungsmaße... 124 5.4.1 Schiefemaße... 125 5.4.2 Wölbungsmaß... 127 5.5 Standardisierung... 128 6 Stochastik... 131 6.1 Zufallsexperimente und Ereignisse... 132 6.2 Wahrscheinlichkeitsbegriffe... 140 Axiomatische Wahrscheinlichkeit... 140 Klassische Wahrscheinlichkeit... 141 Subjektive Wahrscheinlichkeit... 143 Statistische Wahrscheinlichkeit... 144 6.3 Rechenregeln für Wahrscheinlichkeiten... 146 Elementare Rechenregeln... 146 Additionsregel... 147 Bedingte Wahrscheinlichkeit... 148 Stochastische Unabhängigkeit... 150 Multiplikationsregel... 151 Totale Wahrscheinlichkeit... 152 BAYESsche Formel... 154 6.4 Zufallsgrößen... 156 Diskrete Zufallsgröße... 157 Stetige Zufallsgröße... 164
Inhaltsverzeichnis IX 6.5 Wahrscheinlichkeitsverteilungen... 169 6.5.1 Diskrete Wahrscheinlichkeitsverteilungen... 169 Binomialverteilung... 169 POISSON-Verteilung... 175 6.5.2 Stetige Wahrscheinlichkeitsverteilungen... 180 Normalverteilung... 180 Exponentialverteilung... 190 6.6 Grenzwertsätze und das Gesetz großer Zahlen... 194 7 Statistische Induktion... 201 7.1 Stichprobenverfahren... 202 7.1.1 Stichprobenziehung... 202 7.1.2 Stichprobenvariablen und Stichprobenfunktionen... 205 7.1.3 Stichprobenverteilungen... 212 STUDENT t-verteilung... 214 7.2 Schätzverfahren... 218 7.2.1 Punktschätzung... 218 7.2.2 Intervallschätzung... 223 Konfidenzintervall für einen Erwartungswert... 224 Konfidenzintervall für einen Anteil... 233 7.3 Testverfahren... 236 7.3.1 Aufbau eines statistischen Tests... 237 7.3.2 Chi-Quadrat-Anpassungstest... 240 Chi-Quadrat-Verteilung... 249 7.3.3 KOLMOGOROV-SMIRNOV-Anpassungstest... 253 7.3.4 t-test für zwei unabhängige Stichproben... 259 Doppelter t-test... 259 WELCH-Test... 265 7.3.5 Einfaktorielle Varianzanalyse... 267 Varianzhomogene Faktorgruppen... 268 Varianzinhomogene Faktorgruppen... 271 FISHER-Verteilung... 275 8 Zusammenhangsanalyse... 277 8.1 Kontingenzanalyse... 278 8.1.1 Kontingenztabelle... 278 Konditionalverteilungen... 283 8.1.2 Chi-Quadrat-Unabhängigkeitstest... 286 Kontingenzmaß nach CRAMÉR... 287 8.1.3 CHAID-basierter Entscheidungsbaum... 289 8.2 Rangkorrelationsanalyse... 295
X Inhaltsverzeichnis 8.3 Maßkorrelationsanalyse... 301 Streudiagramm... 301 Maßkorrelationskoeffizient... 302 Maßkorrelationsbasierter Unabhängigkeitstest... 307 Partielle Maßkorrelationsanalyse... 309 Scheinkorrelation... 313 9 Regressionsanalyse... 315 9.1 Bivariate lineare Regression... 316 Kleinste-Quadrate-Regression... 317 Grenz- und Elastizitätsfunktion... 318 9.2 Bivariate nichtlineare Regression... 330 Funktionstypen... 330 Grenz- und Elastizitätsfunktionen... 331 9.3 Multiple Regression... 336 10 Zeitreihenanalyse... 343 10.1 Zeitreihen... 344 10.2 Gleitende Durchschnitte... 350 10.3 Trend-Saison-Modelle... 355 Additives Trend-Saison-Modell... 356 Multiplikatives Trend-Saison-Modell... 363 10.4 ARIMA-Modelle... 366 ARIMA-Modell ohne saisonale Parameter... 367 ARIMA-Modell mit saisonalen Parametern... 374 BOX-JENKINS-Diagnostik... 378 11 Faktorenanalyse... 381 11.1 Grundprinzip... 382 11.2 Faktoren-Extraktion... 383 11.3 Faktoren-Rotation... 393 11.4 Faktorwerte... 397 12 Clusteranalyse... 401 12.1 Grundprinzip und Verfahrensüberblick... 402 12.2 Geometrische Klassifikation... 405 12.3 Hierarchisch-agglomerative Klassifikation... 409 12.4 Partitionierende Klassifikation... 415 Anhang... 421 A Verzeichnis der SPSS Datendateien... 422 B Datenzugriff via Internet... 424 Stichwortverzeichnis... 425