Teil I: Deskriptive Statistik



Ähnliche Dokumente
Teil I: Deskriptive Statistik

1. GEGENSTAND UND GRUNDBEGRIFFE DER STATISTIK

Würfelt man dabei je genau 10 - mal eine 1, 2, 3, 4, 5 und 6, so beträgt die Anzahl. der verschiedenen Reihenfolgen, in denen man dies tun kann, 60!.

Korrelation (II) Korrelation und Kausalität

Umfrage zum Thema Flüchtlinge/Integration Eine repräsentative Umfrage im Auftrag des NDR Redaktion PANORAMA Die Reporter

Lineargleichungssysteme: Additions-/ Subtraktionsverfahren

Fachhochschule Düsseldorf Wintersemester 2008/09

Grundbegriffe (1) Grundbegriffe (2)

Primzahlen und RSA-Verschlüsselung

Die Gleichung A x = a hat für A 0 die eindeutig bestimmte Lösung. Für A=0 und a 0 existiert keine Lösung.

Klausur zu Methoden der Statistik I (mit Kurzlösung) Wintersemester 2007/2008. Aufgabe 1

Bevor lineare Gleichungen gelöst werden, ein paar wichtige Begriffe, die im Zusammenhang von linearen Gleichungen oft auftauchen.

Statistik I für Betriebswirte Vorlesung 5

4. Erstellen von Klassen

Vertrauen in Medien-Berichterstattung über den Ukraine-Konflikt Eine Studie von infratest dimap für das Medienmagazin ZAPP. Tabellarische Übersichten

1 Mathematische Grundlagen

15.3 Bedingte Wahrscheinlichkeit und Unabhängigkeit

Meinungen zur Altersvorsorge

Media Teil III. Begriffe, Definitionen, Übungen

OECD Programme for International Student Assessment PISA Lösungen der Beispielaufgaben aus dem Mathematiktest. Deutschland

Aufgabe 1: Nehmen Sie Stellung zu den folgenden Behauptungen (richtig/falsch mit stichwortartiger Begründung).

Meinungen der Bürgerinnen und Bürger in Hamburg und Berlin zu einer Bewerbung um die Austragung der Olympischen Spiele

Junge Leute Repräsentative Onlinebefragung. D-MM-MAB Marktforschung, Januar 2011

Zeichen bei Zahlen entschlüsseln

7 Rechnen mit Polynomen

Informationsblatt Induktionsbeweis

Crowdfunding Umfrage Bekanntheit & Beteiligung

Einführung in die Algebra

50. Mathematik-Olympiade 2. Stufe (Regionalrunde) Klasse Lösung 10 Punkte

Verband der TÜV e. V. STUDIE ZUM IMAGE DER MPU

Felix Klug SS Tutorium Deskriptive Statistik

Diana Lange. Generative Gestaltung Operatoren

Glaube an die Existenz von Regeln für Vergleiche und Kenntnis der Regeln

Jahresbericht Schuldnerberatung 1997

Melanie Kaspar, Prof. Dr. B. Grabowski 1

Skalenniveau Grundlegende Konzepte

Vorlesung Diskrete Strukturen Graphen: Wieviele Bäume?

Erfahrungen mit Hartz IV- Empfängern

Abschlussprüfung Realschule Bayern II / III: 2009 Haupttermin B 1.0 B 1.1

Statistische Auswertung:

Forschungsmethoden in der Sozialen Arbeit

Mathematik: Mag. Schmid Wolfgang Arbeitsblatt 3 1. Semester ARBEITSBLATT 3 RECHNEN MIT GANZEN ZAHLEN

R ist freie Software und kann von der Website.

Wie lässt sich die Multiplikation von Bruchzahlen im Operatorenmodell und wie im Größenmodell einführen?

Aufgabensammlung Bruchrechnen

Die reellen Lösungen der kubischen Gleichung

Umfrage Bedeutung von Innovationen und gesellschaftliche Relevanz

Neues Namens- und Bürgerrecht

Lineare Gleichungssysteme I (Matrixgleichungen)

Anleitung. Empowerment-Fragebogen VrijBaan / AEIOU

August Umfrage zum Verbraucherschutz im Auftrag des Verbraucherzentrale Bundesverbandes e.v. Untersuchungsanlage

Kontingenzkoeffizient (nach Pearson)

Kosten-Leistungsrechnung Rechenweg Optimales Produktionsprogramm

90-minütige Klausur Statistik für Studierende der Kommunikationswissenschaft

Studienplatzbeschaffung

Deutliche Mehrheit der Bevölkerung für aktive Sterbehilfe

Lineare Gleichungssysteme

QM: Prüfen -1- KN

Elternzeit Was ist das?

Bundesverband Flachglas Großhandel Isolierglasherstellung Veredlung e.v. U g -Werte-Tabellen nach DIN EN 673. Flachglasbranche.

Unterrichtsmaterialien in digitaler und in gedruckter Form. Auszug aus: Übungsbuch für den Grundkurs mit Tipps und Lösungen: Analysis

Lineare Gleichungssysteme

Energetische Klassen von Gebäuden

Deutschland-Check Nr. 34

Zusammenhänge zwischen metrischen Merkmalen

Professionelle Seminare im Bereich MS-Office

Profil A 49,3 48,2 50,7 50,9 49,8 48,7 49,6 50,1 Profil B 51,8 49,6 53,2 51,1 51,1 53,4 50, ,5 51,7 48,8

Hautkrebsscreening. 49 Prozent meinen, Hautkrebs sei kein Thema, das sie besorgt. Thema Hautkrebs. Ist Hautkrebs für Sie ein Thema, das Sie besorgt?

Statistik für Studenten der Sportwissenschaften SS 2008

Tutorial: Homogenitätstest

Wurzeln als Potenzen mit gebrochenen Exponenten. Vorkurs, Mathematik

Statuten in leichter Sprache

Kinderarmut in Deutschland Eine Studie von infratest dimap im Auftrag des Deutschen Kinderhilfswerkes e.v. Berlin,

Umfrage zum Thema Fremdsprachen (Spanisch)

Im Jahr t = 0 hat eine Stadt Einwohner. Nach 15 Jahren hat sich die Einwohnerzahl verdoppelt. z(t) = at + b

Das Vermögen der privaten Haushalte in Nordrhein-Westfalen ein Überblick auf der Basis der Einkommens- und Verbrauchsstichprobe

Zeitarbeit in Österreich

Allensbach: Das Elterngeld im Urteil der jungen Eltern

Expertenrunde Gruppe 1: Wiederholungsgruppe EXCEL (Datenerfassung, Darstellungsformen, Verwertung)

Mathematik für Studierende der Biologie und des Lehramtes Chemie Wintersemester 2013/14. Auswahl vorausgesetzter Vorkenntnisse

Welche Staatsangehörigkeit(en) haben Sie?... Mutter geboren?...

Resultate GfS-Umfrage November Wie bekannt ist das Phänomen Illettrismus bei der Schweizer Bevölkerung?

Prozentrechnung. Wir können nun eine Formel für die Berechnung des Prozentwertes aufstellen:

Lösungsmethoden gewöhnlicher Differentialgleichungen (Dgl.)

Grundlagen der Theoretischen Informatik, SoSe 2008

Datenbanken Microsoft Access 2010

Lichtbrechung an Linsen

Grundlagen der Datenanalyse

Univariates Chi-Quadrat-Verfahren für ein dichotomes Merkmal und eine Messwiederholung: Test nach McNemar

Der Wert von Lebensmitteln Umfragen im Auftrag des BMELV

Fremdsprachen. 1. Untersuchungsziel

Berechnung der Erhöhung der Durchschnittsprämien

Mathematischer Vorbereitungskurs für Ökonomen

Insiderwissen Hintergrund

Grundlagen der höheren Mathematik Einige Hinweise zum Lösen von Gleichungen

NKR in Schleswig-Holstein Was hat sich geändert und was kommt noch?

Auswerten mit Excel. Viele Video-Tutorials auf Youtube z.b.

Matrizennorm. Definition 1. Sei A M r,s (R). Dann heißt A := sup die Matrixnorm. Wir wissen zunächst nicht, ob A eine reelle Zahl ist.

Lineare Funktionen. 1 Proportionale Funktionen Definition Eigenschaften Steigungsdreieck 3

Bürger legen Wert auf selbstbestimmtes Leben

Transkript:

Teil I: Deskriptive Statistik 2 Grundbegriffe 2.1 Merkmal und Stichprobe 2.2 Skalenniveau von Merkmalen 2.3 Geordnete Stichproben und Ränge 2.1 Merkmal und Stichprobe An (geeignet ausgewählten) Untersuchungseinheiten (Beobachtungsein heiten, Merkmalsträger) werden Werte eines oder mehrerer Merkmale festgestellt. Merkmal (Variable) ist die zu untersuchende Größe einer Untersuchungseinheit. StatSoz 25

Merkmalsausprägungen sind die möglichen Werte, die von einem Merkmal angenommen werden können. Tabelle 2 1 Merkmale und ihre Ausprägungen Einheit Merkmal Ausprägung Person Geschlecht weiblich, männlich Berufsstatus Arbeiter, Beamter,... Alter in Jahren 1, 2, 3,... Lebensraum ländl. Region, Stadt Haushalt Anzahl der Personen 1, 2, 3... Realeinkommen Beträge in e Grundgesamtheit (Kollektiv, Population): Menge aller potentiellen Untersuchungseinheiten für eine bestimmte Fragestellung. Vollerhebung: Alle Merkmalsträger einer Grundgesamtheit werden in die Untersuchung einbezogen. StatSoz 26

Stichprobe: Endliche Teilmenge einer Grundgesamtheit. Hat diese Menge n Elemente, so spricht man von einer Stichprobe vom Umfang n (sample of size n). Daten, Beobachtungen: konkrete Werte der Merkmalsausprägungen einer Stichprobe. Beispiel: Grundgesamtheit: Haushalte einer Stadt Merkmal: Anzahl der Haushaltsmitglieder Stichprobe vom Umfang 5: H 1, H 2, H 3, H 4, H 5 Daten: 4, 5, 6, 6, 4 Bemerkung: Die Begriffe Stichprobe und Daten werden auch häufig synonym verwendet (so auch im Folgenden). Es gibt verschiedene Merkmalstypen: StatSoz 27

Ein qualitatives (artmäßig erfassbares) Merkmal hat nur endlich viele Ausprägungen, die Namen oder Kategorien sind. Qualitative Merkmale werden auch als kategoriale Merkmale bezeichnet. Beispiele: Familienstand: ledig - verheiratet - eheähnliche Partnerschaft - geschieden - verwitwet Schulabschluss: kein Schulabschluss - Hauptschulabschluss - mittlere Reife - Fachhochschulreife - Abitur Ein quantitatives (in natürlicher Weise zahlenmäßig erfassbares) Merkmal liegt vor, wenn seine Ausprägungen eine Größe wiedergeben. Beispiele: Einwohnerzahl Intelligenzquotient Zeitmessung StatSoz 28

Eine andere Unterscheidung ist in diskrete und stetige Merkmale. Diskretes Merkmal (discrete variable): Ein solches Merkmal kann nur endlich viele oder höchstens abzählbar unendlich viele Ausprägungen annehmen (häufig ganzzahlig, also 0, 1, 2,...). Qualitative Merkmale sind immer diskret. Quantitative Merkmale sind dann diskret, wenn ihre Merkmalsausprägungen durch einen Zählvorgang ermittelt werden (sogenannte Zähldaten). Beispiele für Zähldaten: Anzahl der Einwohner Anzahl der Mitglieder eines Haushaltes Anzahl der Pendler einer Region Anzahl der Geburten eines Jahres in einem Land StatSoz 29

Stetiges Merkmal (continuous variable): Die Ausprägungen können (wenigstens dem Prinzip nach) beliebige Werte aus einem Intervall annehmen, alle Werte aus einem Intervall sind also denkbar. Die Ausprägungen werden in der Regel durch einen Messvorgang ermittelt, sogenannte Messdaten. Beispiele: Längenmessung Zeitmessung Zusammenfassung: Merkmal diskret stetig qualitativ ja nein quantitativ ja ja (Zähldaten) (Messdaten) StatSoz 30

Bemerkung: Stetige Merkmale können nur diskret beobachtet werden (Messgenauigkeit), Angaben z. B. auf zwei Dezimalstellen hinter dem Komma genau (Rundungen). In der Praxis ist die Unterscheidung diskret/stetig vielfach willkürlich. 2.2 Skalenniveau von Merkmalen Für statistische Analysen ist die Einteilung in qualitative und quantitative Merkmale zu grob. Von entscheidender Bedeutung für die Interpretation von Daten und Eignung statistischer Verfahren ist es, wie bzw. nach welchen Kriterien die Merkmalsausprägungen gemessen und geordnet werden können. StatSoz 31

Grundsätzlich erfolgt die Messung der Merkmalswerte mit Hilfe einer Skala (Messvorschrift). Skala: Anordnung von Zahlen, denen die Merkmalsausprägungen eindeutig zugordnet werden. Skalenwerte: Zahlenwerte, die auf einer Skala Berücksichtigung finden. Man spricht in diesem Zusammenhang auch von Skalierung. Das Skalenniveau gibt an 1. welche Vergleichsaussagen und welche rechnerischen Operationen für die Skalenwerte sinnvoll und somit zulässig sind 2. welche Transformationen von Skalenwerten die Messung erhalten (sogenannte zulässige Transformationen). StatSoz 32

Die verschiedenen Skalenniveaus (Übersicht): Qualitative Merkmale Quantitative Merkmale Nominalskala Ordinalskala Metrische Skala Intervallskala Verhältnisskala StatSoz 33

Nominalskala (Skala mit dem niedrigsten Niveau) Charakteristika: keine natürliche Rangordnung der Skalenwerte Zuordnung von Zahlen ist lediglich eine Kodierung der Merkmalsausprägungen Anordnung hat keine inhaltliche Bedeutung Vergleichsaussagen: gleich (=), ungleich ( ) Rechnerische Operationen: Häufigkeiten Zulässige Transformationen: bijektive (eineindeutige) Abbildungen (siehe Aufgabe 3, Blatt 1) StatSoz 34

Tabelle 2 2 Nominale Merkmale und Kodierungen Merkmal Merkmalsausprägungen Kodierung Familienstand ledig 1 verheiratet 2 geschieden 3 verwitwet 4 eheähnliche Partnerschaft 5 Erwerbsstatus Selbstständige 1 Beamte 2 Angestellte 3 Arbeiter 4 Rentner 5 Arbeitslose 6 Sozialhilfeempfänger 7 Geschlecht männlich 0 weiblich 1 Spezialfall nominalskalierter Merkmale sind binäre Merkmale (dichotome Merkmale): Merkmale mit nur zwei Ausprägungen (häufig 0/1 kodiert). StatSoz 35

Ordinalskala (Rangskala) Charakteristika: Die Merkmalsausprägungen sind Kategorien, bei denen eine natürliche Rangordnung aufgrund ihrer Größe bzw. Intensität gegeben ist. Vergleichsaussagen: gleich (=), ungleich ( ) sowie kleiner (<), größer (>) Rechnerische Operationen: Häufigkeiten, Ränge Zulässige Transformationen: streng monotone (ordnungserhaltende) Abbildungen (siehe Aufgabe 3, Blatt 1) StatSoz 36

Tabelle 2 3 Beispiele für ordinalskalierte Merkmale Merkmal Merkmalsausprägungen Skala politisches sehr stark 1 Interesse stark 2 mittel 3 wenig 4 überhaupt nicht 5 Meinung Ablehnung 1 (1) neutral 0 (2) Zustimmung 1 (3) Beachte: Bei nominal und ordinalskalierten Merkmalen haben Abstände (Differenzen) und Verhältnisse (Quotienten) von Skalenwerten keine inhaltliche Bedeutung, sind also nicht vergleichbar. StatSoz 37

Bei quantitativen Merkmalen verwendet man eine metrische Skala. Hier liegt Messbarkeit im engeren Sinne vor, wobei Skalenwerte im Allgemeinen eine Dimension haben (Minute, km, km 2, e, usw.). Charakteristika: Abstände zwischen Skalenwerten sind interpretierbar natürliche Rangordnung durch die Größe der Merkmalswerte Bei der metrischen Skala wird zwischen Intervall und Verhältnisskala unterschieden. StatSoz 38

Intervallskala (Differenzenskala) Charakteristika: Bezugspunkt dieser Skala (Nullpunkt, Durchschnittswert) ist willkürlich festgelegt. Konsequenz: Vergleich von Differenzen ist sinnvoll, nicht aber von Quotienten. Vergleichsaussagen: gleich (=), ungleich ( ) sowie kleiner (<), größer (>) Rechnerische Operationen: Häufigkeiten, Ränge, Subtraktionen Zulässige Transformationen: lineare Abbildungen (siehe Aufgabe 3, Blatt 1) Beispiele intervallskalierter Merkmale: Intelligenzquotient (Wechsler Skala) Jahreszahlen StatSoz 39

Verhältnisskala (Ratioskala) Charakteristika: Natürlicher (absoluter) Nullpunkt ist gegeben, Vergleich von Verhältnissen (Quotienten) ist daher sinnvoll. Gleiche Quotienten drücken einen gleich großen Unterschied aus. Vergleichsaussagen: gleich (=), ungleich ( ) sowie kleiner (<), größer (>) Rechnerische Operationen: Häufigkeiten, Ränge, Subtraktionen, Divisionen Zulässige Transformationen: lineare homogene Abbildungen (siehe Aufgabe 3, Blatt 1) Beispiele verhältnisskalierter Merkmale: Alter in Jahren Einkommen in e Entfernung in km StatSoz 40

Die verschiedenen Skalenniveaus stellen eine Hierachie dar: Tabelle 2 4 Sinnvoll interpretierbare Berechnungen Skala zählen ordnen subtrahieren dividieren Nominal ja nein nein nein Ordinal ja ja nein nein Intervall ja ja ja nein Verhältnis ja ja ja ja Bemerkung: Statistische Methoden, die für ein niedriges Skalenniveau geeignet sind, können auch für ein höheres Skalenniveau verwendet werden (zählen und ordnen ist stets für metrische Merkmale durchführbar). Die Umkehrung gilt nicht! Für metrische Merkmale kann etwa der Durchschnittswert (arithmetisches Mittel) berechnet werden, was für ordinal und nominalskalierte Merkmale im Allgemeinen völlig sinnlos ist. StatSoz 41

Skalentransformationen Für die statistische Analyse kann es sinnvoll sein, metrische Daten so zu transformieren, dass ihre Ausprägungen ordinalskaliert sind, auch wenn solche Transformationen immer mit einem gewissen Informationsverlust verbunden sind (denn aus der Kenntnis der transformierten Werte können die ursprünglichen Werte nicht mehr zurückgewonnen werden). Die wichtigsten Transformationen sind der Übergang zu Kategorien, Klassen (Klassenbildung,,von... bis,,,klassierung der Daten ) Rängen (Daten werden der Größe nach geordnet, der kleinste Wert erhält Rang 1, der zweitkleinste Wert Rang 2, usw.) StatSoz 42

Beispiel: (i) Klassierung von Daten Tabelle 2 5 Einkommensklassen (monatl. Einkommen) von bis unter Skala 1 2400 1 2400 4800 2 4800 7200 3 7200 9600 4 9600 12000 5 12000 16000 6 16000 20000 7 20000 25000 8 25000 36000 9 36000 50000 10 50000 75000 11 75000 100000 12 100000 und mehr 13 StatSoz 43

(ii) Rangbildung Es wurden 12 Haushalte nach ihrem verfügbaren Einkommen (in e) befragt: Tabelle 2 6 Einkommens Daten Haushalt Nr. Einkommen 1 1240 2 1700 3 2040 4 1990 5 1240 6 1350 7 1060 8 920 9 1620 10 1480 11 1120 12 1780 StatSoz 44

Tabelle 2 7 Ränge der Einkommens Daten Durchschnittsrang Einkommen Rang geordnet 920 1 1060 2 1120 3 1240 4.5 1240 4.5 1350 6 1480 7 1620 8 1700 9 1780 10 1990 11 2040 12 Der Beobachtungswert 1240 kommt zweimal vor. Es sind die Ränge 4 und 5 zu vergeben. Man bildet den Durchschnittsrang: Rang(1240) = 4 + 5 2 = 4.5 StatSoz 45

2.3 Geordnete Stichproben und Ränge Gegeben seien Daten x 1, x 2,..., x n Bezeichne x (1) die kleinste der n Zahlen x 1,..., x n x (2) die zweitkleinste der n Zahlen x 1,..., x n. x (n) die größte der n Zahlen x 1,..., x n x (k) heißt k te Ordnungsgröße. Per Definition gilt stets x (1) x (2)... x (n) x (1),..., x (n) heißt geordnete Stichprobe. StatSoz 46

Tabelle 2 8 Einkommens Daten, geordnet i x i x (i) 1 1240 920 2 1700 1060 3 2040 1120 4 1990 1240 5 1240 1240 6 1350 1350 7 1060 1480 8 920 1620 9 1620 1700 10 1480 1780 11 1120 1990 12 1780 2040 Der Rang einer Zahl x i innerhalb einer Stichprobe gibt an, die wie vielt kleinste Zahl sie ist. Um den Rang einer Beobachtung zu bestimmen ist es sinnvoll, die Daten der Größe nach zu ordnen. Formaler versteht man unter einem Rang folgendes: StatSoz 47

1. Fall: Der Beobachtungswert x i kommt in der Stichprobe nur einmal vor. Dann ist der Rang von x i gleich 1 plus Anzahl der Beobachtungen die kleiner als x i sind: Rang(x i ) = 1 + Anzahl der x j mit x j < x i 2. Fall: Der Beobachtungswert x i kommt in der Stichprobe k mal vor, k 2 (man spricht von einer Bindung der Länge k). Dann hat man für diese k gleichen Beobachtungswerte die Ränge zu vergeben, wobei r i, r i + 1,..., r i + (k 1) r i = 1 + Anzahl der x j mit x j < x i Käme der Beobachtungswert x i nur einmal vor, so wäre die Zahl r i der Rang von x i. StatSoz 48

Diese k gleichen Beobachtungswerte bekommen alle den gleichen Rang, den Durchschnittsrang. Dieser ist definiert als das arithmetische Mittel der zu vergebenden Ränge: Rang(x i ) = r i + (r i + 1) +... + [r i + (k 1)] k (2.1) Formel (2.1) lässt sich vereinfachen (Aufgabe 5, Blatt 1). Beachte: Die Rang Transformation x i Rang(x i ) einer Beobachtung x i ist immer nur in Bezug auf die Daten x 1,..., x n festgelegt! (Vgl. Aufgabe 6, Blatt 1) StatSoz 49