Auswertung univariater Datenmengen - deskriptiv

Ähnliche Dokumente
Auswertung univariater Datenmengen - deskriptiv

Datenaufbereitung und -darstellung III

Auswertung univariater Datenmengen - deskriptiv

FORMELSAMMLUNG STATISTIK (I)

Gliederung des Kurses:

Darstellung univariater Datenmengen

Auswertung univariater Datenmengen - deskriptiv

ÜbungsaufgabeN mit Lösungen

Streuungs-, Schiefe und Wölbungsmaße

In der beschreibenden Statistik werden Daten erhoben, aufbereitet und analysiert. Beispiel einer Datenerhebung mit Begriffserklärungen (Vokabel)

Entscheidungstheorie Teil 3. Thomas Kämpke

Funktionsgleichungen folgende Funktionsgleichungen aus der Vorlesung erhält. = e

wird auch Spannweite bzw. Variationsbreite genannt ist definiert als die Differenz zwischen dem größten und kleinsten Messwert einer Verteilung:

Item-response Theorie (Probablistiche Testtheorie) Grundidee der item-response Theorie ist, dass die Antworten auf die Testitems lediglich

Sind die nachfolgenden Aussagen richtig oder falsch? (1 Punkt pro korrekter Beantwortung)

Auswertung univariater Datenmengen - deskriptiv

Arbeitsgruppe Radiochemie Radiochemisches Praktikum P 06. Einführung in die Statistik. 1. Zählung von radioaktiven Zerfällen und Statistik 2

Auswertung von Umfragen und Experimenten. Umgang mit Statistiken in Maturaarbeiten Realisierung der Auswertung mit Excel 07

nonparametrische Tests werden auch verteilungsfreie Tests genannt, da sie keine spezielle Verteilung der Daten in der Population voraussetzen

Die Annäherung der Binomialverteilung durch die Normalverteilung am Beispiel eines Modells der Schadenversicherung

Die Schnittstellenmatrix Autor: Jürgen P. Bläsing

2 Zufallsvariable und Verteilungen

Statistische Kennzahlen für die Lage

Definition des linearen Korrelationskoeffizienten

Verteilungen eindimensionaler diskreter Zufallsvariablen

Beim Wiegen von 50 Reispaketen ergaben sich folgende Gewichte X(in Gramm):

Lösungen zum 3. Aufgabenblock

Maße der zentralen Tendenz (10)

Statistik. 1. Vorbereitung / Planung - präzise Formulierung der Ziele - detaillierte Definition des Untersuchungsgegenstandes

Kapitel V. Parameter der Verteilungen

Zur Interpretation einer Beobachtungsreihe kann man neben der grafischen Darstellung weitere charakteristische Größen heranziehen.

Die hierzu formulierte Nullhypothese H lautet: X wird durch die Verteilungsdichtefunktion h(x)

Dynamisches Programmieren

F E R N U N I V E R S I T Ä T

12 LK Ph / Gr Elektrische Leistung im Wechselstromkreis 1/ ω Additionstheorem: 2 sin 2 2

Man erkennt, dass an der Induktivität die Spannung unendlich groß wird, wenn der Strom einen Sprung

Prof. Dr. Roland Füss Statistik II SS 2008

Abbildung 3.1: Besetzungszahlen eines Fermigases im Grundzustand (a)) und für eine angeregte Konfiguration (b)).

Lernsituation: Eine Leuchtstofflampe an Wechselspannung untersuchen. Arbeitsauftrag 1: Errechnen von Spannungswerten und Zeichnen einer Sinuslinie

1 Definition und Grundbegriffe

Aspekte zur Approximation von Quadratwurzeln

6.5. Rückgewinnung des Zeitvorgangs: Rolle der Pole und Nullstellen

Grundlagen sportwissenschaftlicher Forschung Deskriptive Statistik

z.b. Münzwurf: Kopf = 1 Zahl = 2 oder z.b. 2 Würfel: Merkmal = Summe der Augenzahlen, also hier: Bilde die Summe der Augenzahlen der beiden Würfel!

U Test (Rangsummentest) Parameterfreie Tests. U -Test. U -Test. χ ²- Unabhängigkeitstest Test auf Unabhängigkeit von zwei Zufallsgrößen

4. Indexzahlen. 5.1 Grundlagen 5.2 Preisindizes 5.3 Indexzahlenumrechnungen. Dr. Rebecca Schmitt, WS 2013/2014

Itemanalyse und Itemkennwerte. Itemanalyse und Itemkennwerte. Itemanalyse und Itemkennwerte: Itemschwierigkeit P i

Statistik und Wahrscheinlichkeitsrechnung

Unsicherheit und Vergleichbarkeit von Prüfergebnissen A. Subaric-Leitis Bundesanstalt für Materialforschung und -prüfung, Berlin

Lineare Regression (1) - Einführung I -

6. Modelle mit binären abhängigen Variablen

Beschreibung des Zusammenhangs zweier metrischer Merkmale. Streudiagramme Korrelationskoeffizienten Regression

Sei T( x ) die Tangente an den Graphen der Funktion f(x) im Punkt ( x 0, f(x 0 ) ) : T( x ) = f(x 0 ) + f (x 0 ) ( x - x 0 ).

Klasse : Name1 : Name 2 : Datum : Nachweis des Hookeschen Gesetzes und Bestimmung der Federkonstanten

Bedingte Entropie. Bedingte Entropie. Bedingte Entropie. Kapitel 4: Bedingte Entropie I(X;Y) H(X Y) H(Y) H(X) H(XY)

Multilineare Algebra und ihre Anwendungen. Nr. 6: Normalformen. Verfasser: Yee Song Ko Adrian Jenni Rebecca Huber Damian Hodel

Fallstudie 1 Diskrete Verteilungen Abgabe: Aufgabentext und Lösungen schriftlich bis zum

Verteilungen, sondern nur, wenn ein. Eignet sich nicht bei flachen. Bei starker Streuung wenig. Wert eindeutig dominiert.

Elemente der Mathematik - Sommer 2016

-70- Anhang: -Lineare Regression-

Statistik. Finanzmathematik 1-15

Daten sind in Tabellenform gegeben durch die Eingabe von FORMELN können mit diesen Daten automatisierte Berechnungen durchgeführt werden.

Hochschule Heilbronn Technik Wirtschaft Informatik Heilbronn University Institut für math.-naturw. Grundlagen

Spannweite, Median Quartilsabstand, Varianz und Standardabweichung.

Lineare Optimierung Dualität

Für wen ist dieses Buch? Was ist dieses Buch? Besonderheiten. Neu in dieser Auflage

Gruppe. Lineare Block-Codes

Statistik Exponentialfunktion

3. Lineare Algebra (Teil 2)

NSt. Der Wert für: x= +1 liegt, erkennbar an dem zugehörigen Funktionswert, der gesuchten Nullstelle näher.

Konkave und Konvexe Funktionen

Netzwerkstrukturen. Entfernung in Kilometer:

Spule, Induktivität und Gegeninduktivität

Erwartungswert, Varianz, Standardabweichung

6 Wandtafeln. 6.3 Berechnung der Kräfte und des Schubflusses auf Wandtafeln Allgemeines

(Theoretische) Konfidenzintervalle für die beobachteten Werte: Die Standardabweichung des Messfehlers wird Standardmessfehler genannt:

6. Übung zur Linearen Algebra II

Protokoll zu Versuch C1-Mischungsvolumina

Resultate / "states of nature" / mögliche Zustände / möglicheentwicklungen

Musterklausur Wirtschaftsmathematik und Statistik. Zusatzstudium für Wirtschaftsingenieur

Grundgedanke der Regressionsanalyse

Prof. Dr. P. Kischka WS 2012/13 Lehrstuhl für Wirtschafts- und Sozialstatistik. Klausur Statistische Inferenz

Lösungen der Aufgaben zu Kapitel 2

Kursthemen 2. Sitzung. Tabellarische und graphische Darstellung diskreter Daten. Tabellarische und graphische Darstellung diskreter Daten

Mathematik für MolekularbiologInnen. Vorlesung VII Block III: Wahrscheinlichkeit und Statistik Verteilungen und Lagemaßzahlen

Lehrstuhl für Empirische Wirtschaftsforschung und Ökonometrie Dr. Roland Füss Statistik II: Schließende Statistik SS 2007

Zufallsvariable, Wahrscheinlichkeitsverteilungen und Erwartungswert

Polygonalisierung einer Kugel. Verfahren für die Polygonalisierung einer Kugel. Eldar Sultanow, Universität Potsdam,

Standardnormalverteilung / z-transformation

Teil IV: Drei Musterklausuren

Beschreibende Statistik Mittelwert

Weitere NP-vollständige Probleme

Zweck. Radiometrische Kalibrierung. Traditioneller Ansatz. Kalibrierung ohne Kalibrierkörper

Ein metrisches Merkmal

Aufgabe 8 (Gewinnmaximierung bei vollständiger Konkurrenz):

Die Jordansche Normalform

Invariantentheorie. Vorlesung 3. Lineare Operationen

Datenaufbereitung und Darstellung

Grundpraktikum M5 Oberflächenspannung

9 Komplexe Zahlen ( ) ( ) 9.1 Ziele. 9.2 Warum braucht man komplexe Zahlen? 9.3 Darstellung von komplexen Zahlen. r 2. j 2. j 1.

Transkript:

Aswertng nvarater Datenmengen - deskrptv Maßzahlen zr Beschrebng der Häfgketsvertelngen Häfgster Wert (Mods) Zentralwert (Medan) Arthmetsches Mttel Bblografe Prof. Dr. Kück; Statstk, Vorlesngsskrpt Abschntt 6.. Bleymüller/Gehlert/Gülcher; Statstk für Wrtschaftswssenschaftler Verlag Vahlen Bleymüller/Gehlert; Formeln, Tabellen nd Programme Verlag Vahlen

Beschrebng endmensonaler Datenmengen - Vorgehenswese Tabellarsche nd grafsche Aswertng der Häfgketsvertelng (Abschntt 4.3, 4.4). Maßzahlen oder Parameter zr Beschrebng der Häfgketsvertelngen. 3 Tabellarsche nd grafsche Aswertng ener Vertelng Tabellen nd Grafken geben en anschalches nd mfangreches Bld über de z beschrebende nd z analyserende statstsche Masse. Se snd mt großem Afberetngsafwand verbnden. Se rechen oft ncht as, m endetge zsammenfassende Assagen über de statstsche Masse z gewnnen. 4

Maßzahlen zr Beschrebng von Vertelngen Maßzahlen (Parameter) qantfzeren de Vertelngsegenschaften n komprmerter Form mt nmerschen Werten, de sch ach mestens n geegneter Form m Box-Plot vsalseren lassen. Se erlechtern de Verglechbarket nterschedlcher statstscher Massen. Se charakterseren de statstschen Massen nd geben endetge Informatonen über de Lage, Streng nd Form der Vertelng. Se snd jedoch mt enem Informatonsverlst verbnden, der drch das Komprmat gewollt st. 5 Mttelwerte, Lageparameter oder Maßzahlen der zentralen Tendenz Drch enen Mttelwert werden de enzelnen Merkmalsasprägngen af enen Wert redzert. Er fngert als Repräsentant der statstschen Masse. Mttelwerte charakterseren de Lage der Vertelng af der Merkmalsachse. Se beschreben das Zentrm ener Vertelng drch enen nmerschen Wert. 6 3

Anforderngen an Mttelwerte Repräsentanz der statstschen Masse, Maßstab für de Bertelng von Grppen von Enzelwerten oder für de Bertelng von Enzelwerten selbst, Maßstab für den Verglech von statstschen Massen (Verglech verschedener Häfgketsvertelngen). Dese Anforderngen werden drch nterschedlche Parameter erfüllt! 7 Altersvertelng der Erwerbstätgen (DESTATIS) - Bespel Alter von bs nter Insgesamt Arthm. Mttel Medan nter 0 0-5 5-30 30-35 35-40 40-45 45-50 50-55 55-60 60-65 65 nd mehr Männlch 54.80.05.838..570.67.79.099.95.93.46.55.96.80.566 885.605 45.0 65.78.69.893 39,76 39,46 Weblch 408.55.036.837.090.94.40.876.487.635.47.680.74.75.074.954 67.556 06.93 36.09 0.000.554 39,07 39, Tabelle: Altersvertelng der erwerbstätgen Fraen nd Männer n Detschland per 30.09.003 Das Zentrm der Altersvertelng wrd mt den beden Lagemaßen arthmetsches Mttel nd Medan angegeben. Für de Berechnng des arthmetschen Mttels wrde 8 Jahre als ntere Grenze der ersten Klasse nd 70 Jahre als obere Grenze der letzten Klasse verwendet. Unterschedlche Parameter! Was sagen se as? 8 4

Temperatrmttel - Bespel Für Moska nd Dbln wrd de gleche Jahresdrchschnttstemperatr von 0 C asgewesen. Der Verglech der gemessenen Enzelwerte zegt folgendes Bld: 30 0 0 0-0 -0 J F M A M J J A S O N D 30 0 0 0-0 -0 J F M A M J J A S O N D Das Temperatrmttel erfüllt ncht de Repräsentanzanforderng! 9 Drchschnttsstdent - Bespel Gesehen als Poster n der Mensa der Unverstät Rostock! Deser Drchschnttsstdent st nreal, als Sbjekt ncht exstent. Es gbt andere Lageparameter, welche z. B. de Natonaltät der Stderenden (m Mttel) real aswesen. Im Kontext ener Unterschng können aber ach nreale Werte snnvoll sen, we zm Bespel n der Assage, dass das gegenwärtge Fertltätsnvea n Detschland,4 Knder pro Fra beträgt. 0 5

Trügersche Mtte - Bespel Bewertng von Mttelwerten Mt welchem Lagemaß de Mtte angegeben werden soll, hängt ab: vom Kontext ener analytschen Fragestellng, von der Datenstaton, vom Skalennvea des z analyserenden Merkmals. Denken Se an de bekannte Assage: Im Drchschntt war der Graben enen halben Meter tef, trotzdem st de Kh ersoffen. 6

Typen von Mttelwerten Es gbt nterschedlche Möglchketen, Mttelwerte für de statstsche Aswertng z defneren. De m Abschntt 6.. vermttelten Mttelwerte snd: Häfgster Wert (Mods) Zentralwert (Medan) Arthmetsches Mttel Harmonsches Mttel Chronologsches Mttel Geometrsches Mttel 3 Egnng nach Skalennvea De jewelgen Mttelwerte snd für nterschedlche Datenarten entsprechend hrer Skalerng mehr oder wenger gt () oder ach gar ncht geegnet. Nomnalskala Ordnalskala Kardnalskala Häfgketen aszählen Asprägngen anordnen Dfferenzen/ Qotenten blden Zr Ernnerng, Abschntt.. 4 7

Mttelwerte nach Skalennvea De nterschedlchen Mttelwerte können nr snnvoll () für bestmmte Skalen verwendet werden: Nomnalskala Ordnalskala Kardnalskala Modalwert (Mods) Medan Arthmetsches Mttel 5 Egnng nach Datenstaton Neben der Skalerng der Merkmale st ach der Datenstaton Rechnng z tragen. Grndsätzlch können de Daten als Enzelwerte (n Urlsten) oder aggregert (n Tabellen afberetet) vorlegen. Ene sehr häfg vorlegende Form von aggregerten Daten snd Regonaldaten. Af se wrd besonders engegangen, da se für Wrtschafts- nd Bevölkerngsangaben typsch snd. Dabe nterschedet man: Gehäfte Daten Klasserte Daten 6 8

Enzeldaten oder Urlsten - Bespel De Messngen der z nterschenden Egenschaften (Merkmale) legen für jedes Objekt (Merkmalsträger) vor. De Lste enthält alle Merkmalsasprägngen. Bespel: Körpergewcht n kg (Merkmal) von 0 etwa glechaltrgen Personen (Merkmalsträger): Name Lsa Anna Antje Mare Dörte Sven Uwe Ka Jan Nls Nr. 3 4 5 6 7 8 9 0 a 44 46 50 54 56 69 7 78 80 0 7 Gehäfte Daten - Bespel Be gehäften Daten snd exakt gleche Merkmalsasprägngen z Klassen n ener Häfgketstabelle ohne Informatonsverlst zsammengefasst. In der Tabelle werden de nterschedlchen Asprägngen mt den entsprechenden Häfgketen organsert. Dese Form der Darstellng kommt mest be dskreten Merkmalen vor. Bespel: Anzahl der Personen (Merkmal) m Hashalt (Merkmalsträger) Qelle: Erwerbsstatstk 003 ( DESTATIS) Anzahl der Personen m HH 3 4 5 nd mehr Früheres Bndesgebet 36,8 33,6 3,7,4 4,6 Nee Länder nd Berln-Ost 35,6 36,4 6,9 9,7,4 De Asprägngen 5, 6, wrden n ener Klasse zsammengefasst. 8 9

Klasserte Daten - Bespel Be klasserten Daten snd ähnlche Merkmalsasprägngen z Klassen zsammengefasst. De ndvdelle Merkmalsasprägng st ncht mehr erschtlch. De Klasserng der Daten bedngt enen gewssen Informatonsverlst. Se kommt mest be stetgen Merkmalen vor. Bespel: Hashaltsnettoenkommen (HHNE) n der BRD. Erwerbsstatstk 003 (DESTATIS) Merkmalsträger snd de befragten Hashalte. HHNE von bs nter Ero Unter 900 900 300 300 500 500 000 000 600 600 3600 3600 5000 Früheres Bndesgebet 7,,7 6,6 4,7 4,7 8, 4,6 Nee Länder nd Berln-Ost,8 6,7 7,6 7,3 6,0 5,3 8,8 5000 8000, 5,4 9 Häfgster Wert (Mods) Der häfgste Wert wrd oft ach als dchtester Wert, Modalwert oder Mods bezechnet. Er gbt de Merkmalsasprägng an, de am häfgsten aftrtt. Ene Vertelng kann en, zwe oder mehrere Modalwerte haben, se wrd entsprechend als n-, b- oder mltmodale Vertelng bezechnet. Der Mods st der enzge zlässge Mttelwert be nomnalskalerten Merkmalen. 0 0

Mods be gehäften Daten -Bespel Be gehäften Daten st der Mods jede Asprägng x k, für de glt: h(x k ) = max h(x ) bzw. f(x k ) = max f(x ). Bespel: Anzahl der Personen (Merkmal) m Hashalt (Merkmalsträger). Erwerbsstatstk 003 (DESTATIS) Anzahl der Personen m HH Früheres Bndesgebet 36,8 33,6 3 3,7 4,4 5 nd mehr 4,6 Nee Länder nd Berln-Ost 35,6 36,4 6,9 9,7,4 Früheres Bndesgebet Nee Länder nd Berln-Ost Modalwert Person Personen f(x k ) f()=36,8 f()=36,4 Mods be klasserten Daten Der Mods be klasserten Daten st de Klassemtte, für de das Hstogramm en Maxmm bestzt (Modalklasse). Man nterschedet folgende Fälle: gleche Klassenbrete: Der Mods st n desem Fall de Klassemtte x k, für de glt: h(x k ) = max h(x ) bzw. f(x k ) = max f(x ) nterschedlche Klassenbrete: Der Mods st n desem Fall de Klassemtte x k, für de glt: h (x k ) = max h(x )/c bzw. f (x k ) = max f(x )/c, de c snd de entsprechenden Klassenbreten

Mods be glech breten Klassen - Bespel Bespel: Für de n Lestngsklassen (Klassenbrete = 0 PS) ntertelten 50 Fahrzege der Bespeldate ato_50.sav ergbt sch: 50 40 30 0 Absolte Werte 0 0 60 00 40 80 0 60 80 0 60 00 40 300 Lestng [PS] Am häfgsten st de Klasse 90 bs nter 0 PS besetzt. Der Modalwert beträgt 00 PS. 3 Mods be nterschedlch breten Klassen. Afgabe der Klasr Febrar 005 In der Verkehrsstatstk werden de Straßenverkehrsnfälle mt Personenschaden nach dem Alter nd nach dem Geschlecht der Verrsacher erfasst. Für ene Regon gelten für en Jahr folgende Angaben: Altersgrppe n Jahren Von bs nter 8 - Männer.00 Fraen 840 Klassenbrete 3 Afgabenstellng.3 : Bestmmen Se für Fraen den Modalwert des Alters. 5 5-30 30 35 35 40 40 50 50 80.600.00.000.000.000.000 640 440 400 440 400 840 4 5 5 5 5 30 Lösng.3: De Altersgrppe 8 bs nter Jährger Fraen kommt am häfgsten vor. Der Mods der Vertelng st 9,5 Jahre. 4

Mehrgpfelge Vertelngen Dese Vertelng hat zwe Modalwerte, es legt ene zwegpfelge Häfgketsvertelng vor. f(x) x 5 Mods für kategorale Merkmale -Bespel Der Modalwert st de enzge Möglchket, für kategorale, qaltatve Merkmale enen Mttelwert anzgeben. Bespel: Das arthmetsche Mttel as enem nomnalskalerten Merkmal st ncht snnvoll, ncht möglch. Das glt ach dann, wenn das Merkmal nmersch erfasst wrd. Arthmetsches Mttel as Ja nd Nen Jen? Man kann ledglch sagen, we oft Ja oder Nen aftreten. De häfgste Asprägng wrd als Repräsentant der Masse, als Mttelwert gentzt. 6 3

Mods für ordnale Merkmale - Bespel Be dem Modalwert handelt es sch m den am häfgsten vorkommenden nd damt m enen realserten Wert, mt dem man de Vorstellng von Normaltät verbndet. Her wrd de Ordnngsegenschaft der Skala ncht gebracht. Bespel: Af de Frage der benrhgten Eltern, Welche Noten haben denn de Mtschüler, wrd der Spross zr Entschldgng sener Lestng den Modalwert angeben. De mesten haben ach ene 4. 7 Mods für kardnale Merkmale -Bespel Be kardnalskalerten Merkmalen kann der Modalwert de geegnete Redkton lefern, wenn kene genaeren Informatonen über den Mttelwert erforderlch snd. Bespel:Fragt man nach der mttleren Damenschhgröße n Detschland, lefert der häfgste Wert ene snnvolle Assage. De von Fraen am häfgsten gekafte Schhgröße st de Größe 38. 8 4

Zentralwert oder Medan Der Medan st derjenge Wert der nach der Rangfolge geordneten Merkmalswerte, der glech vele größere Werte über sch we klenere nter sch hat. (Ernnerng: p 0,5 -Qantl) Sene Bestmmng setzt mndestens Ordnalskalennvea voras. Der Zentralwert st der wchtgste Lageparameter für ordnalskalerte Merkmale. 9 Zentralwert für geordnete Enzelwerte Be ngerader Anzahl der Beobachtngswerte gbt es gena enen zentralen Wert. Der legt an der N/. Poston. Es glt: Me = a N+ Be gerader Anzahl der Beobachtngswerte gbt es zwe mttlere Werte: den N/-ten nd (N/+)-ten. De Bestmmng des Medan erfolgt n desem Fall als arthmetsches Mttel as den beden mttleren Werten: Me = a N + a N + De Asprägngen sollen kardnalskalert sen, sonst macht das Mttel kenen Snn. 30 5

Zentralwert für Enzeldaten - Bespel Bespel: Körpergewcht n kg von 9 Personen: Name Lsa Anna Antje Mare Dörte Sven Uwe Ka Jan Nr. 3 4 5 6 7 8 9 a [] 44 46 50 54 56 69 7 78 80 Me = a = a = a [ 5 ] 56 = N + 9+ Bespel: Körpergewcht n kg von 0 Personen: Name Lsa Anna Antje Mare Dörte Sven Uwe Ka Jan Nls Nr. 3 4 5 6 7 8 9 0 a [] 44 46 50 54 56 69 7 78 80 0 Me = a 6 + ( ) ( ) 6,5 + a = a [ 5] + a [ ] = 56 + 69 = N N 3 Zentralwert für gehäfte Daten - Bespel Bespel: Anzahl der Personen (Merkmal) m Hashalt (Merkmalsträger). Erwerbsstatstk 003 von DESTATIS Anzahl der Personen je HH 3 4 5 nd mehr Früheres Bndesgebet 36,8 33,6 3,7,4 4,6 Nee Länder nd Berln-Ost 35,6 35,4 6,9 9,7,4 Kmlerte Häfgketen ABL NBL 36,8 35,6 70,4 7,0 84, 87,9 95,5 97,6 00, 00,0 Früheres Bndesgebet Nee Länder nd Berln-Ost Medan Personen Personen 3 6

Mods, Zentralwert nd Symmetre Früheres Bndesgebet Nee Länder nd Berln-Ost Prozent 40 35 30 5 0 5 0 5 0 36,8 33,6 3,7,4 4,6 3 4 5 nd mehr Prozent 40 35 30 5 0 5 0 5 0 35,6 35,4 6,9 9,7,4 3 4 5 nd mehr Personen m HH Personen m HH Früheres Bndesgebet Nee Länder nd Berln-Ost Mods Medan Bede Vertelngen snd lnksstel (rechtsschef). Mods nd Medan nterscheden sch m nmerschen Wert. 33 Mods, Zentralwert nd Symmetre Be asymmetrschen Vertelngen stmmen Mods nd Medan ncht überen. f(x) Lnksstele bzw. rechtsschefe Vertelng f(x) Lnksschefe bzw. rechtsstele Vertelng häfgster Wert Zentralwert Zentralwert häfgster Wert f(x) Symmetrsche Vertelng Me=Mo Be symmetrschen Vertelngen stmmen Mods nd Medan überen. 34 7

Zentralwert für klasserte Daten Um den Medan be klasserten Daten z berechnen, bracht man de kmlerte Häfgketsvertelng. Der Medan st dann der Wert der Merkmalsachse, für den F(x)=0,5 glt. Wenn der Medan ncht af ene Klassengrenze sondern n ene bestmmte Klasse (Enfallsklasse) fällt, wrd sen nmerscher Wert approxmatv bestmmt. f F(x) = F(x) = 0,5 Me x Me x 35 Lneare Interpolaton zr Berechnng des Zentralwertes Drch Unterstellng ener Glechvertelng nnerhalb der Enfallsklasse des Medan erfolgt de Bestmmng des nmerschen Wertes drch lneare Interpolaton: F(x o ) p F p F(x ) o F(x ) F(x ) ) F(x Me x x Me o x gescht x = x x o Klassenbrete 36 8

Medan für klasserte Daten p F(x ) o F(x ) F(x ) a c b d a = b c d Me x x = x x o Klassenbrete Me x x = p F(x ) F(x 0 o 0 ) x F(x p F(x ) o Me = (x x ) + x F(x ) F(x ) ) 0,5 F(x F(x ) ) F(x ) o Für p=0,5 glt: Me = x + (x x ) 0 37 Berechnng des Medan - Bespel Bespel: Hashaltnettoenkommen (HHNE) m früheren Bndesgebet. Erwerbsstatstk 003 ( DESTATIS) HHNE von bs nter Ero Unter 900 900 300 300 500 Früheres Bndesgebet 7,,7 6,6 F(x) 0,07 0,89 0,55 Der Medan legt n der Klasse von 000 bs nter 600 Ero. An der Grenze deser Klasse kennt man de Werte der Vertelngsfnkton: 0,40 nd 0,549. Daras folgt: 500 000 4,7 0,40 000 600 600 3600 3600 5000 5000 8000 4,7 8, 4,6, 0,549 0,730 0,876 0,998 0,5 F(x ) o Me = x + (x x ) 0 F(x ) F(x ) 0,5 0,40 Me = 000 + (600 000) = 400 Ero 0,549 0,40 38 9

Berechnng des Medan - Bespel Bespel: Hashaltnettoenkommen (HHNE) n den Neen Ländern nd Berln-Ost. Erwerbsstatstk 003 (DESTATIS) HHNE von bs nter Ero Unter 900 900 300 300 500 500 000 Nee Länder nd Berln-Ost,8 6,7 7,6 7,3 F(x) 0,8 0,95 0,37 0,544 Der Medan legt n der Klasse von 500 bs nter 000 Ero. An der Grenze deser Klasse kennt man de Werte der Vertelngsfnkton: 0,37 nd 0,544. Daras folgt: 000 600 600 3600 3600 5000 5000 8000 6,0 5,3 8,8 5,4 0,704 0,857 0,945 0,999 0,5 F(x ) o Me = x + (x x ) 0 F(x ) F(x ) 0,5 0,37 Me = 500 + (000 500) = 87,83 Ero 0,544 0,37 39 Verglech des HHNE n der BRD - Bespel HHNE von bs nter Ero Unter 900 Früheres Bndesgebet 7, Nee Länder nd Berln- Ost,8,0 Verglech 900 300 300 500,7 6,6 6,7 7,6 0,8 500 000 4,7 7,3 F 0,5 000 600 600 3600 4,7 8, 6,0 5,3 0,3 3600 5000 5000 8000 4,6, 8,8 5,4 0,0 0 500 5000 7500 0000 500 5000 7500 0000 Hashaltnettoenkommen Nee Länder nd Berln-Ost Früheres Bndesgebet Me=87,83 Ero Me=400 Ero 40 0

Bertelng des Zentralwertes De Rehe der geordneten Beobachtngswerte wrd drch den Zentralwert n zwe gleche Tele zerlegt. De Smme der Abstände zwschen Zentralwert nd allen Enzelwerten st mnmal (lneare Mnmmsegenschaft, de be Standortbestmmngen gentzt wrd). Der Zentralwert egnet sch besonders für ordnalskalerte Daten. Für kardnalskalerte Daten st sene Ermttlng möglch, allerdngs mt Verlst der metrschen Egenschaften der Skala. Für kategorale Daten st sene Ermttlng ncht möglch. Der Zentralwert reagert ncht af Verschebngen der Extremwerte, wenn de verschobenen Werte af der selben Sete des Zentralwertes bleben. 4 Arthmetsches Mttel Sene Berechnng st nr für kardnalskalerte Merkmale snnvoll. Man benötgt de metrsche Egenschaft deser Skala. Dese Forderng wrd oft ncht engehalten, we z. B. be der Berechnng von Drchschnttsnoten. Zensren coderen de Rangstfen sehr gt, gt Se egnen sch ncht für ene snnvolle arthmetsche Mttelwertberechnng, da sch en nmerscher Wert ergeben kann, der selbst kene vergebene Bewertng st. Legen N Enzelwerte a des Merkmals vor, so glt: µ = N N a = 4

Arthmetsches Mttel as Enzelwerten - Bespel Bespel: Das drchschnttlche Körpergewcht n Kg der 0 Personen beträgt: Name Lsa Anna Antje Mare Dörte Sven Uwe Ka Jan Nls Nr. 3 4 5 6 7 8 9 0 a 44 46 50 54 56 69 7 78 80 0 N µ = a N = µ = ( 44 + 46 + 50 + 54 + 56 + 69 + 7 + 78 + 80 + 0) = 65kg 0 Da jede Merkmalsasprägng glechberechtgt, d.h. mt glechem Gewcht n de Berechnng engeht, sprcht man vom ngewogenen oder enfachen arthmetschen Mttel. 43 Arthmetsches Mttel für gehäfte Daten Kommen bestmmte Merkmalsasprägngen x mehrmals vor, glt: Anzahl der verschedenen Merkmalsasprägngen µ = N k ( x h ) = ( x f ) = = -te Merkmalsasprägng Smme aller abs. Häfgketen Abs. Häfgket der -ten Merkmalsasprägng k Desen Wert bezechnet man als gewogenes arthmetsches Mttel. De Häfgketen der Merkmalsasprägngen fngeren als Gewchte. f = h N Rel. Häfgket der -ten Merkmalsasprägng 44

Arthmetsches Mtte für gehäfte Daten - Bespel Bespel: Anzahl der Personen (Merkmal) m Hashalt (Merkmalsträger). Erwerbsstatstk 003 ( DESTATIS) Anzahl der Personen m HH 3 4 5 nd mehr Früheres Bndesgebet Nee Länder nd Berln-Ost 36,8 35,6 33,6 35,4 3,7 6,9,4 9,7 4,6,4 Um de drchschnttlche Anzahl der Personen m Hashalt z berechnen, mss man enen geegneten Repräsentanten für de letzte Klasse festlegen. Unter Annahme von 7 Personen für de obere Randklasse ergbt sch: k µ ABL = xf = 0,368 + 0,336 + 3 0,37 + 4 0,4 + 7 0,046 =,9 = k µ NBL = xf = 0,356 + 0,354 + 3 0,69 + 4 0,097 + 7 0,04 =,7 = 45 Arthmetsches Mttel für klasserte Daten Für klasserte Daten erfolgt de Berechnng des arthmetschen Mttels n ener ähnlchen Form we für gehäfte Daten. Unterstellt man Glechvertelng nnerhalb der Klassen, repräsentert x, de Klassenmtte, alle Beobachtngen, de z der Klasse gehören. Anzahl der Klassen µ = N Smme aller abs. Häfgketen k x h = k = = Abs. Häfgket der -ten Klasse x Mtte der -ten Klasse f o (x + x ) x = f = h N Rel. Häfgket der -ten Klasse 46 3

Arthmetsches Mttel für klasserte Daten -Bespel Bespel: Hashaltnettoenkommen (HHNE) n der BRD. Erwerbsstatstk 003 (DESTATIS) HHNE von bs nter Ero Unter 900 900 300 300 500 500 000 000 600 600 3600 3600 5000 5000 8000 Smme Arthmetsches Mttel Klassemtte 675 00 400 750 300 300 4300 500 Verwendete Formeln: Früheres Bndesgebet 7,,7 6,6 4,7 4,7 8, 4,6, 00 x = 4860 870 940 575 3380 560 6780 40300 345695 3.456,95 (x + x Nee Länder nd Berln-Ost,8 6,7 7,6 7,3 6,0 5,3 8,8 5,4 00 o 8640 8370 0640 3075 36800 47430 37840 600 5095.50,95 ) nd Es werden 450 Ero als ntere Grenze der ersten Klasse nterstellt. De Smmen müssen drch 00 dvdert werden, da de relatven Häfgketen als Prozentwerte angegeben snd. µ = k = x f 47 Arthmetsches Mttel as Regonaldaten -Bespel Bespel: As den Regonaldaten soll das arthmetsche Mttel des prvaten Verbrachs für Bremen nd Hambrg bestmmt werden: Land Prvater Verbrach Verbrachsantel des Landes n % Enwohnerantel des Landes n % T je Enwohner Bayern 5,6 7 5 Bremen 3,6 Hambrg 8, 3 Mecklenbrg-V. 8, Sachsen 9,6 4 6 : Zr Ernnerng: De ndvdellen Merkmalsasprägngen snd ncht erhoben, ledglch de Smme aller Merkmalsasprägngen legt vor sowe de Zahl der Enheten (Enwohner). Daras wrd de Pro-Kopf-Größe berechnet. Prvater Verbrach je Enwohner (HH,HB): (3,6 ) + (8, ) µ = = 6,7 3 Tsd. De Länderwerte snd für sch berets als arthmetsches Mttel nterpreterbar. 48 4

Arthmetsches Mttel as Regonaldaten Bespel Bespel: Klasrafgabe 3 vom Febrar 003 In Norddetschland lebten m Jahr 00 5 Mll. Enwohner. Für de 5 Bndesländer legen für 00 folgende Eckdaten über Bevölkerng, Erwerb, Arbetslosgket nd Brttonlandsprodkt vor: Bndesland Bevölkerngsantel (%) Erwerbstätge (Tsd.) Erwerbsqote (%) Arbetslosenzahl (Tsd.) Arbetslosenqote (%) Brttonlandprodkt (Mrd: ) HB 4,8 385 53,5 40 3,6 3,4 HH,6.048 60, 7 9,3 75,5 MV,8 730 4, 68 9,6 9,7 NI 53,0 3.48 43,8 350 0,0 80,4 SH 8,8.30 43,6 6 9,4 66,0 49 Arthmetsches Mttel as Regonaldaten Bespel Klasrafgabe 3 vom Febrar 003, Afgabenstellng: 3. Berechnen Se de Erwerbsqote (Erwerbstätge je Bevölkerng) für Norddetschland nd wesen Se den Prozentwert as. 3. Berechnen Se de Arbetslosenqote (Arbetslosenzahl je Arbetskräftepotenzal) als Prozentwert für Norddetschland. 3.3 Geben Se für de 5 Bndesländer nd Norddetschland gesamt de Qote des Brttonlandsprodktes n Tsd. Ero je Enwohner an. Lösng 3. Unter Verwendng der Gesamtgrößen ergbt sch als (mttleres) Verhältns der Erwerbsqote für Norddetschland 45,8%. We st deser Wert z berechnen, wenn de angegebenen Landeswerte der Erwerbsqote verwendet werden? 3. Es st znächst das Arbetskräftepotenzal z berechnen, m nter Verwendng der Gesamtgrößen das (mttlere) Verhältns der Arbetslosenqote für Norddetschland bestmmen z können. De Qote beträgt,%. 3.3 Unter Verwendng der Gesamtgrößen ergbt sch en (mttleres) Verhältns von 5000 BIP je Enwohner für Norddetschland. Für de Berechnng der Landeswerte mss zerst de Bevölkerngszahl nach Bndesländern berechnet werden. 50 5