Grundgesamtheitsanaylsen und Stichproben. Betrachtungen zur Stichprobenfindung



Ähnliche Dokumente
Statistik Einführung // Konfidenzintervalle für einen Parameter 7 p.2/39

Statistik I/Empirie I

2 Vollständige Induktion

15.4 Diskrete Zufallsvariablen

Übungen zur Vorlesung Funktionentheorie Sommersemester Musterlösung zu Blatt 0

BINOMIALKOEFFIZIENTEN. Stochastik und ihre Didaktik Referentin: Iris Winkler

n 1,n 2,n 3,...,n k in der Stichprobe auftreten. Für die absolute Häufigkeit können wir auch die relative Häufigkeit einsetzen:

Innerbetriebliche Leistungsverrechnung

Mit Ideen begeistern. Mit Freude schenken.

PrivatKredit. Direkt ans Ziel Ihrer Wünsche

2. Diophantische Gleichungen

1 Analysis T1 Übungsblatt 1

Aufgaben und Lösungen der Probeklausur zur Analysis I

Heute Kapitalanlage morgen ein Zuhause

Auch im Risikofall ist das Entscheidungsproblem gelöst, wenn eine dominante Aktion in A existiert.

APPENDX 3 MPS Umfragebögen

3Landlust auf Hofweier? Kaufpreis: ,00 Euro Courtage: 3,57% incl. 19% MwSt für den Käufer

Versicherungstechnik

AUFGABENSTELLUNG (ZUSAMMENFASSUNG) 2 SPEZIFIKATION 2. Datenfluß und Programmablauf 2. Vorbedingung 3. Nachbedingung 3. Schleifeninvariante 3

VAIO-Link Kundenservice Broschüre

evohome Millionen Familien verfolgen ein Ziel: Energie zu sparen ohne auf Komfort zu verzichten

Kapitel 6: Quadratisches Wachstum

Korrekturrichtlinie zur Studienleistung Wirtschaftsmathematik am Betriebswirtschaft BB-WMT-S

Ausgangspunkt: Über einen endlichen Zeitraum wird aus einem Kapital (Rentenbarwert RBW v n,i

KUNDENPROFIL FÜR GELDANLAGEN

Allgemeine Lösungen der n-dimensionalen Laplace-Gleichung und ihre komplexe Variable

Übungsblatt 1 zur Vorlesung Angewandte Stochastik

Baugrundstück für Individualisten

IM OSTEN VIEL NEUES... Kaufpreis: ,00 Euro 3,57% incl. 19% MwSt für den Käufer

Medienzentrum. Bibliothek. Handreichung zur Literatursuche

GIBS. Übungsaufgaben zur Vertiefung. V1. Beschriften Sie die Konstruktionen! n n n n ' ' ' ' Modul 1.5. Geometrische Optik 1 58.

Kryptologie: Kryptographie und Kryptoanalyse Kryptologie ist die Wissenschaft, die sich mit dem Ver- und Entschlüsseln von Informationen befasst.

Institut für Stochastik Prof. Dr. N. Bäuerle Dipl.-Math. S. Urban

Gruppe 108: Janina Bär Christian Hörr Robert Rex

Vorlesung Informationssysteme

Arbeitsplätze in SAP R/3 Modul PP

Statistik mit Excel Themen-Special. Peter Wies. 1. Ausgabe, Februar 2014 W-EX2013S

Stichproben im Rechnungswesen, Stichprobeninventur

Satz Ein Boolescher Term t ist eine Tautologie genau dann, wenn t unerfüllbar ist.

Lerneinheit 2: Grundlagen der Investition und Finanzierung

e) ( 4a + 8b + 9a + 18b ) : a + 2b f) 2 log (x) + 3 log (2y) 0.5 log (z)

Logarithmus - Übungsaufgaben. I. Allgemeines

Solvency II Bewertungen, Vorbereitungen und Erwartungen deutscher Versicherungen und Pensionskassen. Studie Oktober 2012

Finanzmathematische Formeln und Tabellen

Projektmanagement Solarkraftwerke

NEL Suchspulen - für jeden Detektor! TOP Leistung von unabhängigen Experten bestätigt. Such Spulen. nel-coils.de Shop ww.nuggets24.

Wiederkehrende XML-Inhalte in Adobe InDesign importieren

... a ik) i=1...m, k=1...n A = = ( a mn

Nachklausur - Analysis 1 - Lösungen

Bau- und Wohncenter Stephansplatz

3. Tilgungsrechnung Tilgungsarten

Das FSB Geldkonto. Einfache Abwicklung und attraktive Verzinsung. +++ Verzinsung aktuell bis zu 3,7% p.a. +++

Stochastik für WiWi - Klausurvorbereitung

Flexibilität beim Lagern und Kommissionieren: Schienengeführte Regalbediengeräte

1. 7 Abs. 10 Satz 3 erhält folgende Fassung:

Qualitätskennzahlen für IT-Verfahren in der öffentlichen Verwaltung Lösungsansätze zur Beschreibung von Metriken nach V-Modell XT

Feldeffekttransistoren in Speicherbauelementen

Klausur Grundlagen der Investition und Finanzierung

Prof. Dr.-Ing. Bernd Kochendörfer. Bauwirtschaft und Baubetrieb. Investitionsrechnung

Finanzmathematik für HAK

Statistische Maßzahlen. Statistik Vorlesung, 10. März, Beispiel. Der Median. Beispiel. Der Median für klassifizierte Werte.

Aufgabenblatt 4. A1. Definitionen. Lösungen. Zins = Rate Zinskurve = Zinsstruktur Rendite = Yield

Wissenschaftliches Arbeiten Studiengang Energiewirtschaft

Kleines Matrix-ABC. Fachgebiet Regelungstechnik Leiter: Prof. Dr.-Ing. Johann Reger. 1 Elementares

Betriebswirtschaft Wirtschaftsmathematik Studienleistung BW-WMT-S

Zahlenfolgen, Grenzwerte und Zahlenreihen

Kunde. Kontobewegung

3. Einführung in die Statistik

Projektmanagement. Changing the way people work together

Karten für das digitale Kontrollgerät

BILANZ. Bilanzbericht

Zur Definition. der wirksamen. Wärmespeicherkapazität

Inhaltsverzeichnis. 1 Leistungsbeschreibung... 3

Lineargleichungssysteme: Additions-/ Subtraktionsverfahren

Tao De / Pan JiaWei. Ihrig/Pflaumer Finanzmathematik Oldenburg Verlag 1999 =7.173,55 DM. ges: A m, A v

Evaluierung einer Schulungsmaßnahme: Punktezahl vor der Schulung Punktezahl nach der Schulung. Autoritarismusscore vor/nach Projekt

Linsengesetze und optische Instrumente

Gebraucht, aber sicher!

Gliederung. Value-at-Risk

Energetisches Feng Shui

5 Bernoulli-Kette. 5.1 Bernoulli-Experiment. Jakob Bernoulli Schweizer Mathematiker und Physiker Einleitung

17. Kapitel: Die Investitionsplanung

Beurteilung des Businessplans zur Tragfähigkeitsbescheinigung

10 Aussagen mit Quantoren und

Kapitel 6: Statistische Qualitätskontrolle

Sichtbar im Web! Websites für Handwerksbetriebe. Damit Sie auch online gefunden werden.

LOHN Betriebswirtschaftliche Planung & Controlling

Private Altersvorsorge. Berufsunfähigkeitsschutz plus Steuerersparnis. Günstig vorsorgen durch Kombination mit unserer fondsgebundenen Basisrente.

HONORAR Honorarabrechnung

BERUFSKOLLEG KAUFMÄNNISCHE SCHULEN DES KREISES DÜREN Zweijährige Höhere Handelsschule

Die OÖGKK auf einen Klick Information und e-services für Unternehmen

Sicherheitspreis Baden-Württemberg

Übungen zu QM III Mindeststichprobenumfang

Arbeiten in der Schweiz

SUCHPROBLEME UND ALPHABETISCHE CODES

Abschlussprüfung 2013 an den Realschulen in Bayern

Einführung in die Investitionsrechnung

Finanzwirtschaftliche Formeln

Die Gasgesetze. Die Beziehung zwischen Volumen und Temperatur (Gesetz von J.-L. und J. Charles): Gay-Lussac

Transkript:

MaMaEuSch Maagemet Mathematics for Europea Schools http://www.mathematik.uikl.de/ mamaeusch Grudgesamtheitsaaylse ud Stichprobe. Betrachtuge zur Stichprobefidug Paula Lagares Justo Puerto 1 MaMaEuSch 2 Maagemet Mathematics for Europea Schools 94342 - CP - 1-2001 - DE - COMENIUS - C21 1 Uiversität Sevilla 2 Dieses Projekt wurde veröffetlicht mit Uterstützug durch die EU mittels eier teilweise Förderug im Rahme des Sokrates Programms. Der Ihalt des Projektes reflektiert icht otwedigerweise de Stadpukt der EU, och uterliegt es irgedeier Veratwortug seites der EU.

Kapitel 1 Grudgesamtheitsaaylse ud Stichprobe. Betrachtuge zur Stichprobefidug User Wusch ist i diesem Kapitel die bereits besprochee Stichprobe-Techike aus der deskriptive Statistik auszubaue, um die jeweils richtige i de verschiedee Zusammehäge zu fide. Stelle wir us vor, das eie Schulklasse als Stichprobe der Grudgesamtheit ausgewählt wurde. Verschiedeste Theme köe u erforscht werde, wie zum Beispiel: 1. Die Meiug über die Durchführug vo alterative Aktivitäte i der Stadt ud Vorschläge, welche diese sei köe. 2. Eie Befragug über die Meiug der verschiedee Parteivorsitzede. 3. Die Meiug über mögliche Trips für die Maturareise. Dekst du, dass deie Klasse eie gute Stichprobe für diese Fragestelluge ist? Die Atwort ist, dass speziell für die zweite Fragestellug die Klasse keie agemessee Stichprobe ist. Bezüglich der erste Frage bekomme wir wahrscheilich iteressate Iformatioe, es wird wahrscheilich aber die Gruppe zu klei sei, um eie gute Abschätzug zu bekomme, weil es viele adere Alters- ud Persoegruppe auch i der Grudgesamtheit gibt. Higege ist für die dritte Frage die Stichprobe sehr ützlich. Es scheit, dass es sehr wichtig ist die richtige Stichprobe-Strategie zu wähle um agemessee Aussage der Grudgesamtheit zu bekomme. 1.1 Grüde für eie Stichprobeauswahl. Vorhergehede Überleguge Stelle wir us vor, wir wolle Utersuchuge über die folgede zwei Theme mache: Die Prozetzahl der Spaier, die eie Iteretzugag habe. 1

Die durchschittliche Lebesdauer eier kokrete Batteriemarke. Im erste Fall müsste ma 40 Millioe Persoe befrage. Es ist offesichtlich, dass dies ei riesiger Aufwad wäre. Zuerst eimal würde ma sehr viel Zeit beötige ud weiters viel Geld, da ma viele Persoe zum Befrage egagiere müsste, für die ma ihre Reise a alle Orte i Spaie bezahle müsste, usw. Es gibt och eie adere Schwierigkeit: Jede Spaier zu befrage ist auch deswege schwierig, weil mache i Spitäler liege, auf Urlaub oder beruflich uterwegs sid,... Deswege ist es sicherlich geeigeter, ur eie gewisse Teil der Grudgesamtheit, eie Stichprobe, ausgewählt ach agemessee Kriterie, zu befrage, um da Rückschlüsse auf die Grudgesamtheit mache zu köe. Im zweite Fall habe wir eie adere Schwierigkeit. We wir die Lebesdauer eier bestimmte Batterie wisse wolle, da müsse wir diese beütze, bis sie leer ist. Dafür müsste wir aber die Batterie zerstöre. We wir da alle Batterie teste würde, hätte wir keie mehr umso sie zielgerichtet verwede zu köe. Auch hier wäre es also sivoller ur eie gewisse Azahl zu teste ud so eie möglichst sichere Iformatio über alle Batterie zu bekomme. Ifolge dieser Grüde ist es oft sivoll ur Stichprobe zu verwede. Um aber gut Rückschlüsse auf die Allgemeiheit durchführe zu köe, müsse wir eie gute Stichprobe wähle. Für die Fragestellug des Iteretzugags i Spaie würde zeh Persoe sicherlich icht repräsetativ für eie Azahl vo 40 Millioe Spaier sei. Auch 100 Befragte aus Madrid wäre keie gute Stichprobe, oder alle deie Verwadte ud Bekate. Deswege möchte wir u eiige Aspekte der Stichprobefidug geau beleuchte. 1. Die Auswahlmethode der Befragte eier Grudgesamtheit (Welche Stichprobemethode wird verwedet). 2. Stichprobegröße. 3. Der Verläßlichkeitsgrad der Rückschlüsse, die wir bekomme, dies ist eie Abschätzug des Fehlers, de wir habe werde (bezoge auf die Wahrscheilichkeit). Es ist offesichtlich, dass eie schlecht ausgewählte Stichprobe die Fehlerrate stark asteige läßt. Aber es gibt och adere Arte vo Fehlerquelle: Der Iterviewer köte Atworte suggeriere, oder der Befragte möchte oder ka gewisse Frage icht beatworte. Diese mögliche Fehlerquelle wolle wir u klassifiziere: 1. Auswahlfehler: Falls irgedeier der Elemete der Grudgesamtheit ei höhere Wahrscheilichkeit zur Auswahl hat als adere. Stelle wir us vor, wir möchte de Zufriedeheitsgrad der Schüler i eiem Gymasium messe. Hierfür befrage wir eiige zwische 10 ud 12 Uhr. Dies bedeutet, dass wir Schüler, die erst am Nachmittag komme, icht beachte. Das bedeutet, dass diese Stichprobe icht repräsetativ für alle Schüler ist. Ei Weg diese Fehler zu vermeide ist die Stichprobe so zu wähle, dass alle Schüler die gleiche Wahrscheilichkeit habe ausgewählt zu werde. 2. Nicht-Beatwortugs Fehler: Es ist auch möglich, dass gewisse Persoe eiige Frage icht beatworte köe oder wolle. Oder aber, dass speziell bei persoebezogee Frage die Befragte icht ehrlich atworte. Diese Fehler sid im Allgemeie sehr schwierig zu vermeide. Wir köe Kotrollfrage eibaue um solche Aspekte besser zu etdecke. Was wir bis jetzt festhalte köe ist, dass we wir eie uausgewogee Stichprobe habe ist diese icht repräsetativ für die Grudgesamtheit. 2

1.2 Betrachtuge zur Stichprobefidug Wir habe bereits mehrfach darauf higewiese wie wichtig die richtige Wahl der Stichprobe ist, aber wie köe wir die verschiedee Wege der Auswahl der Stichprobe klassifiziere? Es gibt drei Arte vo Stichprobe: 1. Stichprobefidug über die Wahrscheilichkeit: Jede Perso hat die gleiche Wahrscheilichkeit ausgewählt zu werde. 2. Zweckmäßige Stichprobe: Die Perso, welche die Stichprobe auswählt, versucht, ach seier Meiug ach eie repräsetative Stichprobe aus zu wähle. 3. Stichprobefidug ohe Regel: Wir wähle die Stichprobe ohe Regel. We die Gruppe homoge ist, ist auch die Stichprobe repräsetativ. Allgemei verwede wir immer die Stichprobefidug über die Wahrscheilichkeit, weil wir so jeweils eie repräsetative Stichprobe erhalte ud gute Rückschlüsse auf die Gesamtheit mache köe. Auch bei der Stichprobefidug über die Wahrscheilichkeit gibt es verschiedee Arte: Zufällige Stichprobe mit ud ohe zurücklege. Geschichtete Stichprobe. Gehäufte Stichprobe. Systematische Stichprobe. ud adere Arte der Stichprobefidug. Stelle wir us vor, dass wir bereits eie Stichprobe ausgewählt habe. Vo eiem Gymasium vo 560 Schüler, befrage wir 28, ob sie zu Hause Iteretzugag habe. Was aber bedeutet u 28 vo 560 zu befrage? Welche Ateil der Schüler befrage wir? We wir Rückschlüsse treffe wolle, wie viele Schüler werde vo eiem Befragte repräsetiert? Um das Verhältis der befragte Schüler zu bereche, dividiere wir die Stichprobeazahl durch die Schülerazahl, dies bedeutet hier: 28/560 = 0.05, daraus folgt, dass wir eie Befragug mit 5% der Schüler durchführe. Nu bereche wir wie viele Schüler werde vo eiem Befragte repräsetiert werde. Hierbei bereche wir de umgekehrte Quotiete: 560/28 = 20, dies bedeutet, dass jeder Befragte repräsetiert 20 Schüler der Schule. Die beide vorgestellte Kozepte habe folgede formale Defiitio: 1. Ateilsfaktor: Das ist der Quotiet zwische der Größe der Grudgesamtheit ud der Größe der Stichprobe, N. Es repräsetiert die Azahl der Elemete der Grudgesamtheit für jedes Mitglied der Befragte. 2. Stichprobefaktor: Das ist der Quotiet zwische der Größe der Stichprobe ud der Größe der Grudgesamtheit, N. We wir de Quotiete mit 100 multipliziere, da bekomme wir de Prozetsatz der Grudgesamtheit repräsetiert i der Stichprobe. 3

1.3 Zufällige Stichprobe mit ud ohe zurücklege Wir habe scho erwäht, dass um eie repräsetative Stichprobe zu erhalte, wähle wir de Wahrscheilichkeitsasatz. Wie würde das i userem Fall mit de 28 Schüler aussehe? Das leichteste wäre aus alle Name zu ziehe. So hätte jeder die gleiche Chace ausgewählt zu werde. Dieser Selektiosprozess etspricht der zufällige Stichprobe. Alle Elemete der Grudgesamtheit habe die gleiche Wahrscheilichkeit gewählt zu werde. We u ei bestimmtes Elemet ausgewählt wurde, ud dies ochmals ausgewählt werde köte, da es ach der Befragug wieder zum ziehe zurückgelegt wird spricht ma vo eier zufällige Stichprobe mit zurücklege. Im adere Fall spricht ma vo der zufällige Stichprobe ohe zurücklege. I userem Beispiel wäre es uiteressat dieselbe Perso ochmals zum Iteretzugag zu befrage, deswege würde ma hier die zufällige Stichprobe ohe zurücklege verwede. Vorausgesetzt die Gesamtheit ist uedlich groß oder wir vereifache sie zu uedlicher Größe, da führe us diese beide Methode zu sehr ähliche Ergebisse. Nichts desto trotz, we der Stichprobequotiet /N größer als 0.1 ist, (die Stichprobe ethält mehr als 10% der Grudgesamtheit) da sid die Uterschiede i de Ergebisse relevat. We wir die Schüler befrage, ob sie Iteretzugag zu Hause habe, iteressiert us icht ur die Azahl derer, soder auch de Ateil uter alle Schüler. Diese beide Werte ud i adere Fälle auch der Durchschitt (we wir zum Beispiel ach der Größe der Schüler frage) sid die Parameter, die meistes vo Itersse sid. Im Falle vo zufälliger Stichprobe mit oder ohe zurücklege habe die Abschätzugsparameter folgede Gestalt: Summe: X i X = N Durchschitt: Verhältis: X = P = Das Verhältis wäre der Durchschitt eier Variable, welche ur ull oder eis sei ka. Zur Erklärug: X i ist der Wert der Variable, die wir utersuche N ist die Größe der Gesamtheit ist die Größe der Stichprobe P i ist die Variable, die de Wert 0 oder 1 aimmt Die Abschätzug des Fehlers dieser Schätzwerte ist: Summe: Für die Stichprobe mit zurücklege: X i P i V ( X) = N 2 S2 4

Für die Stichprobe ohe zurücklege: V ( X) = N 2 (1 N )S2 Durchschitt: Für die Stichprobe mit zurücklege: Für die Stichprobe ohe zurücklege: V ( X) = S2 V ( X) = (1 N )S2 Verhältis: Für die Stichprobe mit zurücklege: Für die Stichprobe ohe zurücklege: V ( P ) = P Q 1 1.4 Geschichtete Stichprobe V ( P ) = (1 P Q ) N 1 Stelle wir us vor, wir mache eie Umfrage, was die Bevölkerug userer Stadt i ihrer Freizeit macht. Wir wisse, das ältere Persoe adere Gewohheite habe wie Jügere, Familie, Schülere,... Wir sid dara iteressiert all diese Iformatioe zu bekomme um eie repräsetative Umfrage durchführe zu köe. Deswege wolle wir all diese Gruppe i userer Stichprobe vertrete habe. Diese vo us defiierte Gruppe (i userem Fall ach dem Alter) ee wir Klasse. So müsse wir jetzt usere Stichprobe so eiteile, dass wir vo alle Schichte Elemete befrage. Versuche wir diese Stichprobe u zu defiiere: Beachte wir, dass wir usere Grudgesamtheit der Größe N i k Utergruppe der Größe N 1, N 2,..., N k uterteilt habe. Diese Utergruppe sid disjukt ud N 1 + N 2 + + N k = N. Jede dieser Utergruppe ee wir Klasse. We wir eie Stichprobe vo Elemete aus der Gesamtheit habe wolle, so wähle wir eie Stichprobe der Größe i so dass 1 + 2 + + k =. Welche Vor- bzw. Nachteile hat die geschichtete Stichprobe? Vorteile: Wir habe geauere Iformatioe über die Variable ierhalb der Utergruppe. Wir köe die Geauigkeit der Schätzwerte der Variable der Grudgesamtheit erhöhe. Nachteile: Die Wahl der Größe der Stichprobe ierhalb der Klasse mit der Stichprobegröße. 5

Es ka machmal schwierig sei Klasse zu bilde. Im Allgemeie liefert die geschichtete Stichprobe bessere Ergebisse als die zufällige, we die Klasse gut ausgewählt ud ierhalb homoge sid. Nu wolle wir drei Methode der Größefidug der Klasse eier Stichprobe beschreibe: 1. Ateilsmäßig zur Größe jeder Klasse, zum Beispiel hat i der jte Klasse mit der Größe N j die Stichprobe die Größe (N j /N) mit N als die Größe der Gesamtheit ud der Größe der Stichprobe. 2. Ateilsmäßig zur Variabilität der Parameter betrachte wir für jede Klasse: Zum Beispiel, we wir wisse, dass die Variaz der Körpergröße der mäliche Schüler 15cm beträgt, für die der weibliche 5cm, ist das Verhältis zwische mäliche ud weibliche 3:1, so sollte auch die Stichprobe dieses Verhältis habe. 3. Wir kreiere die gleiche Größe aller Klasse. Als Kosequez begüstige wir die kleiere Klasse ud beachteilige die Größere. Für de Fall vo geschichtete Stichprobe sid die Hauptschätzwerte: Summe: Durchschitt: Verhältis: wobei X = X = N h X h w h X h = P = w h Ph N h N x h X h ist der Stichprobedurchschitt der Variable X i der Klasse h N h ist die Größe der Klasse h N ist die Größe der Gesamtheit h ist die Stichprobegröße i der Klasse h ist die Stichprobegröße P h ist das Stichprobeverhältis der Variable i der Klasse h ud die Fehlerabschätzug mache wir, idem wir die Gesamtheitsparameter so abschätze: Summe: V ( X) = N 2 h(1 f h )Ŝ2 h h 6

mit Durchschitt: f h = h N h y Ŝ 2 h = h h 1 [ 1 h h X 2 hi x h ] V ( X) = wobei w h, f h y Sh 2 sid die Gleiche wie zuvor. Verhältis: wobei Q h = 1 P h V ( P ) = 1.5 Gehäufte Stichprobe w 2 h(1 f h )Ŝ2 h h w 2 h(1 f h ) P h Qh h 1 Wir überlege jetzt eie Umfrage zu mache über die Durchschittsgröße der Schüler i userer Stadt. Astelle vo eier Stichprobe uter alle Schüler zu mache, wir köte auch überlege Viertel zu bilde, da bezoge auf die Körpergröße Viertel wie kleie Gesamtheite zu betrachte sid. Köe wir so die Stichprobe vereifache ohe a Geauigkeit zu verliere? Die Atwort ist ja. Wir präsetiere u die Methode, die dieses erlaubt: Bei der gehäufte Stichprobe, die Grudgesamtheit wird i Eiheite oder Gruppe uterteilt, die Klasse geat werde (ormaler Weise sid es Eiheite oder Bereiche, i die die Gesamtheit eigeteilt wird), welche so repräsetative als möglich für die Gesamtheit sei solle. Diese sollte eierseits die Heterogeität der Gesamtheit ud die Homogeität ierhalb der Gruppe widerspiegel. Der Grud dieser Stichprobeeiteilug ist, dass es machmal zu viele verschiede Auspräguge der Gesamtheit gibt, die es fiaziell ud ihaltlich icht möglich mache alle zu betrachte. Der Hauptachteil dieser Methode ist, we die Häufuge (Cluster) icht ierhalb homoge sid, de da wird auch die Stichprobe icht repräsetativ sei. We wir aehme, dass die Cluster gleich heteroge wie die Gesamtheit sid ud die Cluster uter sich homoge sid, da brauche wir ur eiige Cluster auswähle für die Stichprobe. Da sage wir, wir mache gehäufte Stichprobe der erste Ebee. Die Stichprobefidug erleichtert das Sammel der Stichprobeiformatioe. Betrachte wir u die Ausdrücke der Schätzwerte dieser Stichprobefidug: Summe: X = M X i M i 7

Durchschitt: X = X i M i Verhältis: P = A i M i wobei X i ist die Summe der Variable X im Cluster i X i ist der Stichprobedurchschitt der Variable X im Cluster i N ist die Azahl der Cluster der Gesamtheit M ist die Größe der Gesamtheit ist die Azahl der Cluster der Stichprobe M i ist die Größe des Clusters i A i ist die Summe der Variable A, welche de wert 0 oder 1 im Cluster i aehme ud die Fehlerabschätzug mache wir, idem wir diese Ausdrücke wie folgt abschätze: Summe: Durchschitt: Verhältis: V ( X) = N(N ) V ( X) = M 2 N(N ) 1 1 (X i XM i ) 1 1 (X i XM i ) V ( P ) = M 2 N(N ) 1.6 Systematische Stichprobe 1 1 (P i P M i ) Deke wir u über eie adere Stichprobefidug ach. Gehe wir zurück zu userem Gymasiums Iteretzugagsbeispiel ud erier us, dass wir 28 Schüler ausgewählt habe. I diesem Fall ist der Ateilsfaktor: 560/28 = 20. Wir ummeriere die Schüler vo 1 bis 560. Da wähle wir eie Zahl x zufällig zwische 1 ud 20 aus, welcher der erste ausgewählte Schüler ist. Da wähle wir die Zahle x + 20, x + 2 20 ud so weiter aus. dies ist aber keie zufällige Stichprobe, da icht alle Stichprobe die gleiche Wahrscheilichkeit habe. Defiiere wir diese Stichprobefidug: Stelle wir us vor, wir habe eie Grudgesamtheit vo N Elemete ummeriert ud sortiert vo 1 bis N ud wir wolle eie Stichprobe vo Elemete. Diese Gesamtheit ka i Teilmege geteilt werde, jede vo dee mit v = N Elemete, zum Beispiel hat jede Teilmege gleich viele Elemete, wie der Ateilsfaktor agibt. 8

Wir wähle u ei ummeriertes Elemet vo 1, 2, bis N aus ud ee es x 0. Da ehme wir die folgede Elemete: x 0 + v, x 0 + 2v, x 0 + 3v, x 0 + 4v,... Im Fall, dass v keie atürliche Zahl ist, etscheide wir us für die äherste gaze (kleiere) Zahl, da köe mache Stichprobe die Größe 1 habe. Diese Tatsache brigt us eie kleie Störug i die Theorie der systematische Stichprobe, die wir aber weiters icht beachte müsse, we > 50. Diese Art der Stichprobefidug verlagt, dass die geordete Elemete keie Periodizität bezoge auf die Variable aufweise, de we wir eie fide ud diese ist ahe a v, da wäre das Ergebis icht ausgewoge ud ka icht gewertet werde. Die systematische Stichprobe ist äquivalet mit der zufällige Stichprobe, we die Elemete zufällig ummeriert werde. Die Vorteile dieser Methode sid: 1. Erweitert die Stichprobe zur Grudgesamtheit. 2. Sie ist sehr leicht zu verwede. Die Nachteile sid: 1. Bei eier Periodizität bei der Nummerierug der Elemete steigt die Variaz ud eie Uausgewogeheit der Auswahl tritt auf. 2. Schwierigkeite beim Abschätze der Variaz. Betrachte wir u ei Beispiel eier Stichprobe. Jedes Cluster hat Elemete mit de Nummer i der Liste: Erster Cluster: 1, 1 + v, 1 + 2v, 1 + 3v, 1 + 4v,... Zweiter Cluster: 2, 2 + v, 2 + 2v, 2 + 3v, 2 + 4v,...... v-ter Cluster: v, 2v, 3v, 4v,... v Eie systematische Stichprobe ist äquivalet zur zufällige Auswahl mit eiem Cluster. Dafür ist es aber otwedig, dass alle Cluster eie ähliche Struktur wie die Gesamtheit aufweise. Wir köe die systematische Stichprobe auch als geschichtete Stihprobe mit Klasse auffasse, jede vo ihe mit v Elemete, so dass wir immer ur ei Elemet aus jeder Klasse auswähle. Bei der geschichtete Stichprobe sid alle ausgewählte Elemete zufällig, im Gegesatz zu dieser Techik, wo ur das erste Elemet zufällig ud der Rest determiistisch mit dem Faktor v ausgewählt werde. Die Schätzwerte für diese Art der Stichprobe sid: Summe: Durchschitt: X = v X i X = 1 X i 9

Verhältis: P = 1 wobei P eie Variable mit de Werte 0 oder 1 ist. 1.7 Adere Stichprobefidugs-Methode Die 2-Ebee Stichprobefidug ist ei Spezialfall der Cluster- Stichprobe, bei der i der zweite Ebee icht alle Elemete des Clusters gewählt werde, soder ur eiige zufällig. Cluster i der erste Ebee werde Primär-Eiheite geat, die i der zweite Sekudär-Eiheite. Mehrebee-Stichprobefidug ist eie Verallgemeierug der bisherige Techik, so dass jeder Cluster eie Gruppe vo Cluster ist, usw. Gaz allgemei ist es so, dass bei komplizierte Utersuchuge geschichtete-, Cluster- ud auch zufällige Stichprobe verwedet werde. Zum Beispiel köe die Eiwoher eies Lades i Cluster (Regioe, Städte, Viertel,...) uterteilt werde. die ach auße hi heteroge (uterschiedlich) aber ierhalb homoge sid. Aschließed ist es otwedig diese Eiheite i homogee Klasse zu teile. Diese Eiheite werde da i eue, kleiere Eiheite geteilt (z.b. Gebäudeblöcke), die sekudäre Eiheite geat werde, die wiederum i Häuser uterteilt werde. So köe wir jetzt folgede Stichprobe auswähle: 1. Wir wähle eie geschichtete Stichprobe. Wir ehme zu midest eie Klasse (ei Viertel) 2. Wir wähle zufällig eiige Gebäude vo jedem Viertel aus. 3. Wir ehme zufällig eies der Häuser vo de ausgewählte Gebäudeblöcke aus. P i 10

Kapitel 2 Ei Awedugsbeispiel vo der Stichprobefidug Wir habe us etschiede eie Studie i eiem Gymasium zu mache. Wir beötige Iformatioe, über die Azahl der Likshäder, über die Azahl der Schüler mit Iteretzugag zu Hause, die Körpergröße ud das wöchetliche Taschegeld. Die Sihaftigkeit über das Wisse der Likshäder ist augescheilich, da die Schule geüged agepaßte Sitzgelegeheite habe sollte. Iteretzugag zu Hause ist eie wichtige Iformatio. Dies ka verwedet werde um de Schüler zusätzliche Iformatioe zu maile oder ob sie Recherche im Iteret durchführe köe. Die Utersuchug der Körpergröße ist klassisch. Es ist auf jede Fall iteressat, ob sich die Schüler gleiche Alters über die Jahre größemäßig veräder. Taschegeld ist eie gesellschaftliche relevate Iformatio. Es ist spaed zu wisse, mit wie viel Geld die Schüler ausgestattet werde, was sie damit kaufe ud womit sie ihre Freizeit verbrige. We wir eimal etschiede habe, was wir erhebe wolle, defiiere wir die Stichprobe, damit wir icht alle Schüler befrage müsse. Die Iformatioe teile wir i Alter ud Schulklasse. A B C D E Summe 1. Jahr 33 20 53 2. Jahr 20 15 30 65 3. Jahr 20 15 26 14 75 4. Jahr 27 27 25 79 5. Jahr 33 28 30 31 23 145 6. Jahr 30 34 32 31 127 Isgesamt habe wir 558 Schüler i diesem Gymasium. Wir starte damit, dass wir eie Stichprobegröße vo 60 Schüler eiplae. Mehr dürfe wir icht befrage ud trotzdem soll die Utersuchug gute Ergebisse liefer. 11

So bekomme wir die erste Iformatioe f = N = 60 544 = 0.1102 Damit wolle wir 11% der Schüler befrage. Wir köe auch de Ateilsfaktor bereche: E = N = 558 60 = 9.3 oder äquivalet, jeder iterviewte Schüler repräsetiert 9 Kollege. Nu müsse wir die Methode der Stichprobe etscheide. Betrachte wir folgede Aspekte: X repräsetiert die Körpergröße. Y repräsetiert das Taschegeld. Z repräsetiert die Variable Likshäder ud ist 1, we der Schüler Likshäder ist, sost 0. I repräsetiert die Variable hat Iteretzugag zu Hause ud ist 1 we der Schüler eie hat, sost 0. Wir betrachte die 4 Variable vo zwei verschiedee Ausgagspukte. Die Frage ist, ob usere willkürliche Eiteilug Auswirkuge auf das Ergebis habe köte? Die Körpergröße ud das Taschegeld wird wahrscheilich mit dem Alter mehr werde. Die Azahl der Likshäder aber icht. Auch der Iteretzugag sollte altersuabhägig sei. Deswege betrachte wir diese beide Arte uterschiedlich. Fall I: Die Variable Taschegeld ud Körpergröße Wir habe scho besproche, dass wir die Schüler i Gruppe uterteilt habe. Hier etspricht die Eiteilug i Gruppe de Schulklasse (Klasse). Weil für diese beide Variable die Schulkasse eie wichtige Rolle spielt, etscheide wir us für diese Uterteilug ud verwede die zufällig geschichtete Stichprobe. Nu müsse wir die Azahl der Stichprobe ierhalb der Klasse etscheide. Wir habe sechs Klasse mit folgede Größe: (Schul)Klasse Azahl 1. Jahrgag (Klasse 1) N 1 = 53 2. Jahrgag (Klasse 2) N 2 = 65 3. Jahrgag (Klasse 3) N 3 = 75 4. Jahrgag (Klasse 4) N 4 = 79 5. Jahrgag (Klasse 5) N 5 = 145 6. Jahrgag (Klasse 6) N 6 = 127 Gewöhlich verwedet ma ateilig der Klassegröße vo der Gesamtheit die Stichprobegröße. So bereche wir diese Ateil mit. i = Ni N 12

ud wir bekomme folgede Stichprobegröße: 1 = 60 53 544 = 5.84 so ehme wir 1 = 6 2 = 60 65 544 = 7.16 so ehme wir 2 = 8 3 = 60 75 544 = 8.27 so ehme wir 3 = 8 4 = 60 79 544 = 8.71 so ehme wir 1 = 8 5 = 60 145 544 = 15.99 so ehme wir 5 = 16 6 = 60 127 544 = 14.00 so ehme wir 6 = 14 wobei wir berücksichtige mußte, dass die Stichprobegröße 60 sei soll. Somit habe wir die Azahl der Stichprobe ierhalb der Klasse ud führe die Befragug durch. Usere Ergebisse sid die folgede: Für die Körpergröße bekomme wir: Klasse 1 165 161 153 150 151 153 Klasse 2 157 161 168 162 165 171 169 164 Klasse 3 168 165 175 175 165 163 165 165 Klasse 4 164 171 177 163 170 165 160 175 Klasse 5 175 173 161 158 175 164 158 161 158 171 175 170 187 168 170 185 Klasse 6 190 178 194 183 165 170 176 173 168 183 173 183 174 177 ud für das Taschegeld: Klasse 1 10 0 3.5 0 0 3 Klasse 2 0 5 0 15 0 3 2 0 Klasse 3 5 8 8 0 20 5 10 10 Klasse 4 12 6 5 12 12 6 0 0 Klasse 5 5 10 12 15 10 12 30 12 30 10 6 5 10 21 40 15 Klasse 6 12 10 9 6 8 9.4 15 0 20 10 15 10 0 0 Wir fahre fort mit de Schätzwerte. Zuerst eimal bereche wir de Durchschitt ierhalb der Klasse. Aschließed de Durchschitt des Taschegeldes ud der Körpergröße gesamt. Weiters versuche wir eie Abschätzug des mögliche Fehlers zu bereche ud mache alles für beide Variable. Für die Körpergröße erhalte wir: Klasse Durchschitt Stadartabweichug 1 x 1 = 155.5 S 2 x1 = 36.7 2 x 2 = 164.625 S 2 x2 = 21.4107 3 x 3 = 167.625 S 2 x3 = 22.5535 4 x 4 = 168.125 S 2 x4 = 36.6964 5 x 5 = 169.3125 S 2 x5 = 81.6958 6 x 6 = 177.642857 S 2 x6 = 67.478 Wir erkee scho, dass der Durchschitt i jedem Jahr wächst. Das führt us zur Vermutug, dass die geschichtete Stichprobe als Methode gut gewählt ist. 13

Wir bereche auch das gleiche für das Taschegeld: Klasse Durchschitt Stadartabweichug 1 y 1 = 2.75 Sy1 2 = 4.026 2 y 2 = 3.125 Sy2 2 = 26.4107 3 y 3 = 8.25 Sy3 2 = 33.3571 4 y 4 = 6.625 Sy4 2 = 25.4107 5 y 5 = 15.1875 Sy5 2 = 101.2291 6 y 6 = 8.8857 Sy6 2 = 35.229 Nu bereche wir de geschätzte Durchschitt vo der gesamte Stichprobe ud de geschätzte Fehlerwert. Für die Körpergröße: X = 6 w h x h = 6 N h N x h = 53 65 75 79 155.5 + 164.625 + 167.625 + 544 544 544 544 168.125+ + 145 127 169.3125 + 177.642857 = 168.8379 544 544 Der Ausdruck für die Variaz ist: ud so bekomme wir: V ( X) = w 2 h(1 f h )Ŝ2 h h Klasse w h wh 2 f h 1 f h 53 1 544 = 0.095 0.009 6 53 = 0.1132 0.8868 65 2 544 = 0.1194 0.014 8 79 = 0.123 0.8769 75 3 544 = 0.1344 0.018 8 75 = 0.1066 0.8934 79 4 544 = 0.1415 0.02 8 79 = 0.1012 0.8988 145 5 544 = 0.2598 0.0675 16 145 = 0.1103 0.8897 127 6 544 = 0.2276 0.0518 14 127 = 0.1102 0.8898 Diese Zahle ersetze wir u im vorige Ausdruck ud bekomme: V ( X) = wh(1 2 )Ŝ2 h f h = 0.009 0.8868 36.7 h 6 + 0.014 0.8769 21.4107 8 + 0.018 0.8934 22.5535 + 8 +0.02 0.8988 36.6964 8 + 0.0675 0.8897 81.6958 16 + 0.0518 0.8898 64.478 14 = 0.7541 Für de Fall der Körpergröße habe wir jetzt die Abschätzuge. Die geschätzte Durchschittskörpergröße beträgt 168.8379 ud der berechete Fehlerwert ist 0.7541. 14

Das Gleiche führe wir für das Taschegeld durch. Wir begie mit dem Durchschitt: Y = 6 w h y h = 6 N h N y h = 53 65 75 79 2.75 + 3.125 + 8.25 + 544 544 544 544 6.625+ + 145 127 15.1875 + 8.8857 = 8.7194 544 544 Die Abschätzug der Variaz ist leicht zu bereche, da sich die Werte vo w h ud f h icht geädert habe: V (Ŷ ) = wh(1 2 )Ŝ2 h f h 0.009 0.8868 4.026 + 0.014 0.8769 26.4107 h 6 8 + 0.018 0.8934 33.3571 + 8 +0.02 0.8988 25.4107 8 + 0.0675 0.8897 101.2291 16 + 0.0518 0.8898 35.229 14 = 0.6854 Fall II: Die Variable Likshäder ad Iteretzugag zu Hause habe Im Fall Zwei wolle wir die Variable Likshäder ud Iteretzugag zu Haus habe betrachte. Es ist leicht zu erkee, dass es i diese Fälle keie Si macht die Variable i Klasse zu uterteile. Deswege sollte wir eie adere Stichprobemethode heraziehe. Wir wolle weiterhi eie Stichprobegröße vo 60. Wir köe aber sage, dass die Schule i Schulklasse eigeteilt ist, dass diese Utergruppe die Gesamtheit darstelle. Diese Gruppe verhalte sich (hoffetlich) wie die Grudgesamtheit. Deswege ist es wesetlich eifacher 2 bis 3 Schulkasse als Gazes zu befrage als wahllos 60 Schüler aufzuspüre. Damit auch hier eie gewisse Breite gewahrt bleibt, etscheide wir us für 3 Schulklasse. Die Date der Ergebisse sid die folgede: Für die Variable Likshäder : Cluster 1: 1 0 0 0 1 0 0 0 0 0 0 0 0 0 1 0 0 0 0 Cluster 2: 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 Cluster 3: 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 1 0 0 0 0 0 0 0 0 wobei 1 bedeutet ei Likshäder zu sei ud 0 icht (Rechtshäder). Für die Variable Iteretzugag zu Hause habe bekomme wir: Cluster 1: 1 0 0 1 0 1 0 1 0 1 1 1 1 0 1 0 0 1 0 Cluster 2: 1 1 1 0 1 1 0 1 1 0 1 0 0 1 1 1 1 1 1 1 1 1 0 0 Cluster 3: 1 1 0 1 0 1 1 1 1 0 1 1 1 1 1 1 0 1 1 1 0 1 1 1 1 wobei 1 bedeutet eie Iteretzugag zu habe, 0 icht. 15

Wir begie u ab zu schätze, wie viele Likshäder i der gesamte Schule sei werde, geauso wie die Azahl der Iteretzugäge. Geauso iteressiere us die Verhältisse bezoge auf die Gesamtheit. Likshäder Iteret Cluster Summe Verhältis Summe Verhältis 1 3 0.1579 10 0.5263 2 0 0 17 0.7083 3 2 0.0833 20 0.8 Nu köe wir die Abschätzuge der Summe ud des Verhältis der Variable Z ud I mache. Wir begie mit Variable Z: Ẑi Ẑ = M M i 3 Ẑi = 558 3 M i = 558 3 + 0 + 2 19 + 24 + 25 = 558 5 68 = 41.03 P Z = A i M = 3 + 0 + 2 i 19 + 24 + 25 = 5 68 = 0.0735 ud wir mache das Gleiche für die Variable I Îi Î = M M i 3 Îi = 558 3 M i = 558 10 + 17 + 20 47 = 558 19 + 24 + 25 68 = 385.6764 P I = A i 10 + 17 + 20 M = i 19 + 24 + 25 = 47 68 = 0.6911 Wir gehe weiter mit der Abschätzug des Fehlerwertes für die Variable Likshäder : V (Ẑ) = N(N ) 1 1 (Z i ZM i ) = 22(22 3) 1 3 2 [(3 0.0735 19)2 +(0 0.0735 24) 2 ]+(2 0.0735 25) 2 = = 397.78 V ( P Z ) = N(N ) M 2 1 1 (P Zi P M i ) = 22(22 3) 1 3 2 [(3 0.0735 19)2 +(0 0.0735 24) 2 ]+(2 0.0735 25) 2 = = 0.00127 16

ud abschließed die Abschätzug des Fehlerwertes für die Variable Iteretzugag zu Hause habe : V (Î) = N(N ) 1 1 (I i IM i ) = 22(22 3) 1 3 2 [(10 0.6911 19)2 +(17 0.6911 24) 2 ]+(20 0.6911 25) 2 = = 1211 V ( P I ) = N(N ) M 2 1 1 (P Ii P M i ) = 22(22 3) 1 3 2 [(10 0.6911 19)2 +(17 0.6911 24) 2 ]+(20 0.6911 25) 2 = = 0.0038 17