EINFÜHRUNG IN DIE MATHEMATISCHE STATISTIK UND IHRE ANWENDUNG VON MARTIN HENGST a. o. Professor an der PH Berlin BIBLIOGRAPHISCHES INSTITUT MANNHEIM HOCHSCHULTASCHENBÜCHER-VERLAG
INHALTSVERZEICHNIS Vorwort 6 1 Einleitung 13 1.1 Vorbemerkung 13 1.2 Sichere, zufällige und stochastische Ereignisse 14 1.3 Zufall und Kausalität 17 1.4 Statistik und Empirie 22 1.5 Mathematik und Statistik 24 2 Grundlagen 25 2.1 Merkmale 25 2.1.1 Qualitative, komparative und quantitative Merkmale.... 25 2.1.2 Diskrete und stetige Merkmale 27 2.1.3 Extensive und intensive Merkmale 29 2.1.4 Zustand und Ereignis 29 2.2 Zufällige Veränderliche (Zufallsvariablen) 30 2.2.1 Vorbemerkung 30 2.2.2 Elementarereignisse 31 2.2.3 Beobachtungsgrößen und Zufallsvariablen 32 2.3 Statistische Mengen und Kollektive 36 2.3.1 Vorbemerkung 36 2.3.2 Definition der statistischen Menge 36 2.3.3 Kollektive von Beobachtungsgrößen 37 2.3.4 Einteilung statistischer Mengen 37 2.3.4.1 Dauer der Elemente 37 2.3.4.2 Stabile und instabile Mengen 39 2.3.4.3 Zugangs- und Abgangsmengen 39 2.3.4.4 Geschlossene und offene Mengen 40 2.3.4.5 Aufgliederung statistischer Mengen 40 2.4 Statistische Gesetze, Methoden und Begriffe 41
8 Inhaltsverzeichnis 2.5 Das Rechnen mit relativen Häufigkeiten 47 2.5.1 Absolute und relative Häufigkeiten; Häufigkeitsdichten... 47 2.5.2 Die bedingte relative Häufigkeit 48 2.5.3 Die relativen Häufigkeiten von Merkmalsverknüpfungen.. 49 2.5.4 Unabhängige Ereignisse 49 2.6 Stichproben 50 2.6.1 Vorbemerkung 50 2.6.2 Zufallsstichproben 51 2.6.3 Geschichtete Stichproben und Klumpenstichproben.... 52 2.7 Der Hauptsatz der mathematischen Statistik 52 2.7.1 Die Gesetze der großen Zahlen 52 2.7.2 Das Bernoullische Gesetz der großen Zahlen 53 2.7.3 Der Hauptsatz der mathematischen Statistik 54 2.8 Statistische Fragestellungen 54 2.8.1 Vorbemerkung 54 2.8.2 Beschreiben, Schätzen und Entscheiden 55 2.8.3 Ursachenkomplexe 56 2.8.4 Mono- und polycharaktere Fragestellungen 57 2.9 Stochastische Modelle und theoretische Verteilungen 58 2.9.1 Vorbemerkung 58 2.9.2 Beispiele stochastischer Modelle 58 2.9.3 Einige theoretische Verteilungen 60 2.9.3.1 Erwartungswert und Varianz 60 2.9.3.2 Die hypergeometrische Verteilung 61 2.9.3.3 Die Binomialverteilung 65 2.9.3.4 Die Poisson-Verteilung 67 2.9.3.5 Die Normalverteilung 70 2.9.3.6 Logarithmische Normalverteilungen 72 2.9.3.6.1 Zweiparametrige lognormale Verteilungen 72 2.9.3.6.2 Dreiparametrige lognormale Verteilungen 73 2.9.3.6.3 Vierparametrige lognormale Verteilungen 73 2.9.3.6.4 Die Entstehung lognormaler Verteilungen 74 2.9.4 Grenzverteilungen 76 2.9.4.1 Vorbemerkung 76 2.9.4.2 Der zentrale Grenzwertsatz 77 2.9.4.3 Annäherungen an die Normalverteilung 77 2.9.4.3.1 Binominalverteilungen 77
Inhaltsverzeichnis 9 2.9.4.3.2 Poissonverteilungen 79 2.9.4.4 Annäherungen der hypergeometrischen, Binomial- und Poisson-Verteilung 79 2.9.4.5 Die Ungleichung von Bienayme-Tschebyscheff 80 3 Monocharaktere Fragestellungen 82 3.1 Deskriptive Statistik 82.1 Aufgabenbereich 82.2 Herausarbeitung empirischer Verteilungen 82.3 Empirische Verteilungen 89.3.1 Gestalt, Lage und Ausbreitung einer Verteilung 89.3.2 Grundformen empirischer Verteilungen 91.4 Parameter empirischer Verteilungen 96 3.1.4.1 Vorbemerkung 96 3.1.4.2 Positionsparameter 97 3.1.4.2.1 Definition 97 3.1.4.2.2 Das arithmetische Mittel 97 3.1.4.2.3 Das geometrische Mittel 98 3.1.4.2.4 Der Mediän oder Zentralwert 98 3.1.4.2.5 Das Dichtemittel 99 3.1.4.2.6 Lageregeln für C, D und M 99 3.1.4.3 Dispersionsparameter 99 3.1.4.3.1 Die Spannweite 99 3.1.4.3.2 Die durchschnittliche Abweichung 100 3.1.4.3.3 Die mittlere quadratische Abweichung 100 3.1.4.3.4 Die Grundspanne 101 3.1.4.3.5 Der Variationskoeffizient 101 3.1.4.4 Gestaltparameter... 101 3.1.4.4.1 Die Schiefe 101 3.1.4.4.2 DerExzeß 101 3.1.4.5 Strukturparameter 102 3.1.4.5.1 Unbestimmtheit oder Information einer Verteilung... 102 3.1.4.5.2 Konzentrationsmaße 102 3.1.4.5.2.1 Die Konzentration einer Zufallsvariablen 102 3.1.4.5.2.2 Die Redundanz 102 3.1.4.5.2.3 Das Disparitäts-oder Konzentrationsmaß 103 3.1.5 Analytische Darstellung empirischer Verteilungen 103 3.1.5.1 Vorbemerkung 103
10 Inhaltsverzeichnis 3.1.5.2 Diskrete Verteilungen 104 3.1.5.2.1 Binomialverteilungen 104 3.1.5.2.2 Poisson-Verteilungen 104 3.1.5.2.3 Verteilungen dreiklassiger Merkmale 105 3.1.5.2.4 Rangordnungsverteilungen (Lorenz-Pareto-Verteilungen) 107 3.1.5.3 Stetige Verteilungen 111 3.1.5.3.1 Normalverteilungen 111 3.1.5.3.2 Lognormale Verteilungen 115 3.1.6 Anpassungen 118 3.1.6.1 Das Glätten von Kurven 118 3.1.6.1.1 Gleitende Durchschnitte 118 3.1.6.1.2 Die Methode von Behrens 123 3.1.6.2 Merkmalstransformationen 124 3.1.6.2.1 Vorbemerkung 124 3.1.6.2.2 Dreiparametrige logarithmische Transformationen... 125 3.1.6.2.3 Das doppelte Wahrscheinlichkeits-Netz 127 3.1.6.2.4 Scores 127 3.1.7 Operative Bedeutung der deskriptiven Statistik 127 3.1.7.1 Einheitlichkeit und Reproduzierbarkeit 127 3.1.7.2 Verteilungskurven als heuristische Hilfsmittel 128 3.2 Analytische Statistik 129 3.2.1 Statistische Schlüsse 129 3.2.2 Stichprobenfunktionen 131 3.2.2.1 Definitionen und Problemstellungen 131 3.2.2.2 Stichprobenmittelwerte 132 3.2.2.2.1 Normalverteilung 132 3.2.2.2.2 Asymmetrische und Mischverteilungen 132 3.2.2.3 Stichprobenstreuung (Grenzverteilung) 132 3.2.2.4 Die ^-Verteilung 133 3.2.2.5 Die t-verteilung 135 3.2.2.6 Die F-Verteilung 136 3.2.2.7 Beziehungen zwischen % 2 -, t- und F-Verteilung 138 3.2.3 Schätzungen 138 3.2.3.1 Vorbemerkungen 138 3.2.3.2 Konstruktionsmethoden für Schätzfunktionen 141 3.2.3.3 Beurteilungskriterien für Schätzfunktionen 143 3.2.3.4 Vertrauensintervalle 146 3.2.3.5 Direkte Schlüsse 152 3.2.3.6 Indirekte Schlüsse (Rückschluß) 155 3.2.3.6.1 Diskrete Zufallsgrößen 155
Inhaltsverzeichnis 11 3.2.3.6.2 Stetige Zufallsgrößen 156 3.2.3.7 Graphische Schätzverfahren 158 3.2.3.7.1 Das Binomial-Netz 158 3.2.3.7.2 Das Wahrscheinlichkeits-Netz 161 3.2.4 Entscheidungen (Tests) 161 3.2.4.1 Grundlagen statistischer Urteile 161 3.2.4.1.1 Die logische Valenz statistischer Urteile 161 3.2.4.1.2 Klassifikation statistischer Hypothesen und Tests.... 163 3.2.4.1.3 Konsequenzen statistischer Urteile 165 3.2.4.1.4 Testbewertung 168 3.2.4.1.5 Testplanung 170 3.2.4.2 Anpassungs-und Parameter-Tests 172 3.2.4.2.1 Vorbemerkungen 172 3.2.4.2.2 Anpassungstests 173 3.2.4.2.3 Parametertests 175 3.2.4.2.3.1 Vorbemerkung 175 3.2.4.2.3.2 Einseitiger Test für p 175 3.2.4.2.3.3 Vergleich zweier empirischer Häufigkeiten 180 3.2.4.2.3.4 Sollwert und Stichprobenmittelwert (n groß) 181 3.2.4.2.3.5 Sollwert und Stichprobenmittelwert (n klein) 185 3.2.4.2.3.6 Vergleich von Stichprobenmittelwerten 186 3.2.4.2.3.6.1 Bei bekannter Streuung 186 3.2.4.2.3.6.2 Bei unbekannter, aber gleicher Streuung 187 3.2.4.2.3.7 Vergleich von Stichprobenvarianz und Sollwert.... 187 3.2.4.2.4 Planung des Stichprobenumfanges 188 3.2.4.3 Graphische Testverfahren 189 3.2.4.3.1 Das Binomial-Netz 189 3.2.4.3.2 Das Wahrscheinlichkeits-Netz 191 3.2.4.3.3 Kontrollkarten 191 3.2.4.3.4 Der Folgetest 192 3.2.4.4 Spezielle Fragen der Testpraxis (Stichprobenprüfungen).. 192 3.2.4.4.1 Vorbemerkungen 192 3.2.4.4.2 Einige Folgerungen aus der Testcharakteristik 192 3.2.4.4.2.1 Prüfplanparameter und OC 192 3.2.4.4.2.2 Prozent-Stichprobenpläne 195 3.2.4.4.2.3 Durchschlupf p bei korrigierenden Stichprobenverfahren 196 3.2.4.4.3 Mehrfache Stichprobenpläne 198 3.2.4.4.4 Folgetest 207 3.2.4.4.5 Prüfaufwand 209 3.2.4.4.6 Eingangsgrößen einiger Stichprobensysteme 212
12 Inhaltsverzeichnis 4 Polycharaktere Fragestellungen 215 4.1 Vorbemerkungen 215 4.2 Die Häufigkeits-Analyse 216 4.2.1 Mischverteilungen und ihre Parameter 216 4.2.2 Grundlagen der Häufigkeitsanalyse 220 4.2.3 Systematik der Mischkollektive aus zwei Teilkollektiven.. 222 4.2.4 Analyse von Mischkollektiven 225 4.3 Funktionen von Zufallsväriablen 229 4.4 Korrelationen von Zufallsgrößen 231 4.4.1 Vorbemerkungen 231 4.4.2 Korrelation qualitativer Merkmale - 233 4.4.2.1 Zusammenhänge zwischen zwei alternativen Merkmalen. 233 4.4.2.2 Korrelation von zwei mehrklassigen Merkmalen 234 4.4.3 Korrelation quantitativer Merkmale 235 4.4.3.1 Der Korrelationskoeffizient 235 4.4.3.2 Einfache lineare Korrelation 237 4.4.3.3 Graphische Verfahren 239 4.5 Zufällige Funktionen 240 4.5.1 Vorbemerkungen 240 4.5.2 Deskriptive Methoden 244 4.5.2.1 Lineare Regressionen 244 4.5.2.2 Streuung als Funktion des Mittelwertes 244 4.5.2.3 Nichtlineare zufällige Funktionen 246 4.5.3 Stochastische Prozesse 247 Abkürzungen und Symbole 248 Literaturverzeichnis 250 Namenverzeichnis 254 Sachverzeichnis 256