3. Merkmale und Daten Ziel dieses Kapitels: Vermittlung des statistischen Grundvokabulars Zu klärende Begriffe: Grundgesamtheit Merkmale (Skalenniveau etc.) Stichprobe 46
3.1 Grundgesamtheiten Definition 3.1: (Grundgesamtheit, Merkmalsträger) Die Grundgesamtheit ist die Gesamtheit aller Einheiten, die statistisch untersucht werden sollen. Die Grundgesamtheit ist eine Menge und wird mit G bezeichnet. Ihre Elemente heißen Untersuchungseinheiten oder Merkmalsträger. Wir schreiben G = {e 1, e 2,..., e n }. Die Anzahl n der Elemente von G bezeichnet den Umfang der Grundgesamtheit. Wir notieren die Anzahl der Elemente von G mit G = n. 47
Weitere Begriffe: Bestandsmasse: GG, die durch einen Zeitpunkt abgegrenzt wird Bewegungsmasse: GG, die durch einen Zeitraum abgegrenzt wird Beispiele für Bestandsmassen: Lagerbestand eines Unternehmens am 31.12.2010 Handwerksbetriebe im Münsterland am 01.01.2010 48
Beispiele für Bewegungsmassen: Neugegründete Betriebe in Münster im Jahr 2010 Studierende an der Uni Münster im WS 2010/2011 Offensichtlich: Bestands- und Bewegungsmassen hängen zusammen, und zwar über die sogenannte Bestandsveränderung 49
3.2 Merkmale Definition 3.2: (Merkmal, Merkmalsausprägung) Unter einem Merkmal versteht man eine Eigenschaft der Merkmalsträger, die statistisch untersucht werden soll. Ein Merkmal hat gewöhnlich verschiedene Merkmalsausprägungen. Merkmale notieren wir meist mit Großbuchstaben (X, Y etc.). Merkmalsausprägungen notieren wir meist mit indizierten griechischen Buchstaben (z.b. ξ 1, ξ 2 etc.). 50
Bisherige Notationszusammenfassung: Merkmalsträger: e 1, e 2,..., e n Grundgesamtheit: G = {e 1,..., e n } Merkmal (interessierende Eigenschaft): X, Y etc. Merkmalsausprägungen (Merkmalswerte): ξ 1, ξ 2,... 51
Beispiele: Grundgesamtheit Merkmal Ausprägungen Haushalte in der verfügbares [0, ) Euro BRD am 1.1.2010 Monatseinkommen Studierende der Geschlecht weibl., männl. WWU am 1.10.2010 52
Typisierungen von Merkmalen: [I] Diskrete vs. stetige Merkmale Ein Merkmal heißt diskret, falls es nur eine abzählbare Menge von Ausprägungen annehmen kann (Vorsicht: abzählbar bedeutet nicht endlich!) Beispiele: Typischerweise Zählmerkmale wie Anzahl von Kindern, Anzahl von Fachsemestern etc. Ein Merkmal heißt stetig, falls es theoretisch alle reellen Zahlen (eines Intervalls) annehmen kann Beispiele: Gewichte, Temperaturen, Preise, Einkommen 53
Typisierungen von Merkmalen: [II] Qualitative vs. quantitative Merkmale Ein Merkmal heißt qualitativ, wenn seine Ausprägungen durch verbale Ausdrücke gegeben sind Beispiele: Beruf, Geschlecht, Farbe, Status Ein Merkmal heißt quantitativ, wenn seine Ausprägungen Zahlen sind Beispiele: Alter, Einkommen, Noten (falls Note durch Zahl ausgedrückt wird) 54
Wichtige Frage für den Statistiker: Welche Rechenoperationen sind mit den erhobenen Werten möglich? Antwort über Skalenniveaus der Daten: [I] Nominalskala Merkmalswerte haben nur Bezeichnungsfunktion (Codes) Rechenoperationen (Addition, Multiplikation etc.) sinnlos sind Beispiele: Geschlecht, Religionszugehörigkeit 55
Skalenniveaus: [II] Ordinalskala Es existiert eine natürliche Ordnung der Merkmalswerte Größe der Abstände zwischen den Merkmalswerten ist irrelevant Rechenoperationen sind sinnlos Beispiele: Klausurnoten, Windstärken Intervallskala Differenzen von je zwei Merkmalswerten können sinnvoll verglichen werden Frei wählbarer Maßstab Beispiel: Temperaturen (in Grad Celsius oder Fahrenheit) 56
Skalenniveaus: [III] Verhältnisskala Besitzt natürlichen Nullpunkt, aber keine natürliche Messeinheit Beispiele: Einkommen, Geldmenge (wenn keine Messeinheit vorgegeben ist) Absolute Skala Ist eindeutig bestimmt (natürlicher Nullpunkt und natürliche Messeinheit) Beipiele: Einkommen in Euro, Alter in Jahren etc. Ausdrucksweise: Intervall-, Verhältnis- und absolute Skala werden auch metrische Skalen genannt 57
3.3 Daten und ihre Erhebung Begriffserklärung: Unter dem Begriff Daten versteht man die beobachteten Werte eines oder mehrerer Merkmale Schreibweisen für Daten: Bei einem Merkmal X: x 1,..., x n Bei 2 Merkmalen X und Y : (x 1, y 1 ),..., (x n, y n ) 58
Weitere Begriffe: [I] Urliste: Die Gesamtheit aller erhobenen Daten nennt man Urliste Häufigkeitsverteilung: Die Häufigkeitsverteilung gibt für jeden Merkmalswert die Häufigkeit an, mit der dieser in den erhobenen Daten vorkommt Häufigkeitsverteilung (inklusive grafischer Darstellung) ausführlich in Kapitel 4 59
Weitere Begriffe: [II] Vollerhebung / Teilerhebung Vollerhebung: Ermittlung der Merkmalswerte aller Untersuchungseinheiten der Grundgesamtheit (z.b. Volkszählung) Auswertung nur eines Teils der Grundge- Teilerhebung: samtheit Mögliche Gründe: GG ist zu groß (Vollerhebung zu teuer) Beobachtung des Merkmals zerstört den Merkmalsträger (Qualitätskontrolle) 60
Weitere Begriffe: [III] Querschnitte / Zeitreihen / Panels Querschnitt: Erhebung der Werte eines Merkmals zur selben Zeit an verschiedenen Untersuchungseinheiten (z.b. Umsätze von Unternehmen im Jahre 2002) Zeitreihen: Erhebung der Werte eines Merkmals an derselben Untersuchungseinheit zu verschiedenen Zeitpunkten (z.b. BSP eines Landes über verschiedene Jahre) Panel: Kombination von Querschnitten und Zeitreihen (z.b. Jährliche Befragung von Haushalten nach ihrem Einkommen) 61
3.4 Amtliche und nichtamtliche Statistik Träger der Wirtschafts- und Sozialstatistik in der BRD: Amtliche Statistik Nichtamtliche Statistik Institutionen der amtlichen Statistik: Statistisches Bundesamt Bundesministerien Deutsche Bundesbank Bundesanstalten 62
Träger der nichtamtlichen Statistik: Unabhängige Wirtschaftswissenschaftliche Institute IFO (Institut für Wirtschaftsforschung, München) DIW (Deutsches Institut für Wirtschaftsforschung, Berlin) IfW (Institut für Weltwirtschaft, Kiel) RWI (Rheinisch-Westfälisches Institut für Wirtschaftsforschung, Essen) Wirtschaftsforschungsinstitute von Interessenverbänden Unabhängige, quasi halbamtliche Institutionen (z.b. Sachverständigenrat, Monopolkommission) Markt-, Meinungs- und Umfrageinstitute 63