Kapitel 2. Mittelwerte

Ähnliche Dokumente
Kapitel 1 Beschreibende Statistik

Empirische Verteilungsfunktion

Thema: Mittelwert einer Häufigkeitsverteilung. Welche Informationen kann der Mittelwert geben?

Raimund Alt. Statistik. Eine Einführung für Wirtschaftswissenschaftler. 2. Auflage

Beispiel 2 (Einige Aufgaben zu Lageparametern) Aufgabe 1 (Lageparameter)

Lage- und Streuungsparameter

3. Deskriptive Statistik

8. Statistik Beispiel Noten. Informationsbestände analysieren Statistik

1) Warum ist die Lage einer Verteilung für das Ergebnis einer statistischen Analyse von Bedeutung?

WISTA WIRTSCHAFTSSTATISTIK

Herzlich willkommen zur Vorlesung Statistik. Streuungsmaße oder die Unterschiedlichkeit der Daten nebst kurzen Ausführungen zu Schiefe und Wölbung

Anwendung A_0801_Quantile_Minimum_Maximum

Kapitel 5 Kenngrößen empirischer Verteilungen 5.1. Lagemaße. x mod (lies: x-mod) Wofür? Lageparameter. Modus/ Modalwert Zentrum. Median Zentralwert

Statistik eindimensionaler Größen

Fachrechnen für Tierpfleger

Auf dem Schulfest bietet Peter als Spielleiter das Glücksspiel "GlücksPasch" an.

4. Kumulierte Häufigkeiten und Quantile

Inhaltsverzeichnis. Teil 1 Basiswissen und Werkzeuge, um Statistik anzuwenden

Bitte am PC mit Windows anmelden!

Anteile Häufigkeiten Verteilungen Lagemaße Streuungsmaße Merkmale von Verteilungen. Anteile Häufigkeiten Verteilungen

Beide Verteilungen der Zeiten sind leicht schief. Der Quartilsabstand für Zeiten zum Surfen ist kleiner als der zum Fernsehen.

Statistik Testverfahren. Heinz Holling Günther Gediga. Bachelorstudium Psychologie. hogrefe.de

Erwartungswert, Varianz und Standardabweichung einer Zufallsgröße. Was ist eine Zufallsgröße und was genau deren Verteilung?

Inhaltsverzeichnis. Inhalt Teil I: Beschreibende (Deskriptive) Statistik Seite. 1.0 Erste Begriffsbildungen Merkmale und Skalen 5

I. Deskriptive Statistik 1

Brückenkurs Statistik für Wirtschaftswissenschaften

Es können keine oder mehrere Antworten richtig sein. Eine Frage ist NUR dann richtig beantwortet, wenn ALLE richtigen Antworten angekreuzt wurden.

Bitte bearbeite zunächst alle Aufgaben bevor du einen Blick in die Lösungen wirfst.

Lagemaße Übung. Zentrale Methodenlehre, Europa Universität - Flensburg

Statistik-Klausur vom

Statistische Grundlagen I

3.5 Beschreibende Statistik. Inhaltsverzeichnis

Kapitel 7. Crossvalidation

Verteilungen und ihre Darstellungen

Wahrscheinlichkeits - rechnung und Statistik

absolute Häufigkeit h: Anzahl einer bestimmten Note relative Häufigkeit r: Anzahl einer bestimmten Note, gemessen an der Gesamtzahl der Noten

3.2 Streuungsmaße. 3 Lage- und Streuungsmaße 133. mittlere Variabilität. geringe Variabilität. große Variabilität

Mathematik für Biologen

Inhaltsverzeichnis. Teil I Einführung

1 45, 39, 44, 48, 42, 39, 40, , 31, 46, 35, 31, 42, 51, , 42, 33, 46, 33, 44, 43

Übungen zur Vorlesung Wirtschaftsstatistik Lageparameter Aufgabe 5.1 Drei Studierende A, B, C zahlen folgende Miete pro Monat:

Leseprobe. Michael Sachs. Wahrscheinlichkeitsrechnung und Statistik. für Ingenieurstudenten an Fachhochschulen. ISBN (Buch):

Deskriptive Statistik & grafische Darstellung

Chi-Quadrat Verfahren

Univariate Häufigkeitsverteilungen Kühnel, Krebs 2001: Statistik für die Sozialwissenschaften, S.41-66

Einführung in die computergestützte Datenanalyse

PROC MEANS. zum Berechnen statistischer Maßzahlen (für quantitative Merkmale)

Statistik und Wahrscheinlichkeitsrechnung

Annahmen des linearen Modells

Statistik. Datenanalyse mit EXCEL und SPSS. R.01denbourg Verlag München Wien. Von Prof. Dr. Karlheinz Zwerenz. 3., überarbeitete Auflage

Wahrscheinlichkeitsrechnung und Statistik

Statistik für Ökonomen

Statistik. Datenanalyse mit EXCEL und SPSS. Prof. Dr. Karlheinz Zwerenz. R.Oldenbourg Verlag München Wien. Von

Verteilungsfunktion und dquantile

Statistik Klausur Wintersemester 2012/2013 Hamburg, BITTE LESERLICH IN DRUCKBUCHSTABEN AUSFÜLLEN!

Mathematik IV für Maschinenbau und Informatik (Stochastik) Universität Rostock, Institut für Mathematik Sommersemester 2007

Beispiel für Anwendung: z-tabelle kann genutzt werden, um z.b. Poissonverteilung näherungsweise zu integrieren. Beispiel: wie wahrscheinlich ist es

Grundkompetenzen (Mathematik Oberstufe)

Inhaltsverzeichnis. 2 Kurzbeschreibung von SPSS Der SPSS-Dateneditor Statistische Analysen mit SPSS DieDaten...

Mathematik: LehrerInnenteam Arbeitsblatt Semester ARBEITSBLATT 12. Erwartungswert, Varianz und Standardabweichung

registrierte Fußballvereine Männer im besten Fußballalter (20 34 Jahre) Bruttoinlandsprodukt je Einwohner Farben der Nationalflagge

Kapitel 35 Histogramme

Konfidenzintervalle Grundlegendes Prinzip Erwartungswert Bekannte Varianz Unbekannte Varianz Anteilswert Differenzen von Erwartungswert Anteilswert

1.5 Berechnung von Rangzahlen

Kapitel 5. Univariate Zufallsvariablen. 5.1 Diskrete Zufallsvariablen

P (X = 2) = 1/36, P (X = 3) = 2/36,...

Informatik II Grundbegriffe der Wahrscheinlichkeitsrechnung

9. Kapitel: Grafische Darstellung quantitativer Informationen

Prüfung aus Statistik 1 für SoziologInnen. Musterlösung

Eine zweidimensionale Stichprobe

Verteilungsfunktion und Quantile

Relative Häufigkeiten: Grundlagenaufgaben: Weitere tolle Übungsbeispiele mit Lösungen:

Statistik 2 für SoziologInnen. Normalverteilung. Univ.Prof. Dr. Marcus Hudec. Themen dieses Kapitels sind:

Ein- und Zweistichprobentests

Inhaltsverzeichnis. Vorwort

3. Merkmale und Daten

Deskriptive Statistik Kapitel VI - Lage- und Streuungsparameter

Wiederholung Statistik I. Statistik für SozialwissenschaftlerInnen II p.8

Diskrete Wahrscheinlichkeitsverteilungen

Hydrologie und Flussgebietsmanagement

1. Maße der zentralen Tendenz Beispiel: Variable Anzahl der Geschwister aus Jugend '92. Valid Cum Value Frequency Percent Percent Percent

Erzbischöfliche Liebfrauenschule Köln. Schulinternes Curriculum Fach: Mathematik Jg. 6

Identifikation von Zeitwerten für LEP-Pflegeinterventionen. Reto Bürgin, Dieter Baumberger,

Erläuterung des Vermögensplaners Stand: 3. Juni 2016

Vorwort Zufallsvariable X, Erwartungswert E(X), Varianz V(X) 1.1 Zufallsvariable oder Zufallsgröße Erwartungswert und Varianz...

Verteilungsfunktion und Quantile

Lösung Aufgabe 19. ( ) = [Mio Euro]. Empirische Varianz s 2 = 1 n

Statistik. Ludwig Fahrmeir Rita Künstler Iris Pigeot Gerhard Tutz. Der Weg zur Datenanalyse. Springer. Zweite, verbesserte Auflage

Lösungen zu Janssen/Laatz, Statistische Datenanalyse mit SPSS 1

Kapitel 4. Daten. Indizes: Preis-, Mengen- und Umsatzindex

Über den Autor 7 Über den Fachkorrektor 7. Einführung 19

Musterlösung zur Aufgabensammlung Statistik I Teil 3

Beschreibende Statistik

Institut für Biometrie und klinische Forschung. WiSe 2012/2013

Statistik II. Statistische Tests. Statistik II

Kapitel 1. Einführung

Übung 1: Wiederholung Wahrscheinlichkeitstheorie

Einführung in die Statistik für Politikwissenschaftler Sommersemester 2011

<; ;6 ++9,1, + ( #, + 6( 6( 4, 6,% 6 ;, 86': ; 3'!(( A 0 "( J% ;;,,,' "" ,+ ; & "+ <- ( + " % ; ; ( 0 + A,)"%1%#( + ", #( +. +!

1.8 Kolmogorov-Smirnov-Test auf Normalverteilung

Transkript:

Kapitel 2. Mittelwerte Im Zusammenhang mit dem Begriff der Verteilung, der im ersten Kapitel eingeführt wurde, taucht häufig die Frage auf, wie man die vorliegenden Daten durch eine geeignete Größe repräsentieren kann. Dabei werden oft Begriffe wie Mittelwert oder Durchschnitt verwendet, die einem bereits aus der Umgangssprache bekannt sind. Bei unserem Kaffeehaus-Beispiel wäre etwa die Frage naheliegend, wie viel eine Melange im Durchschnitt kostet. Gesucht ist hier also nichts anderes als eine quantitative Zusammenfassung der Daten, was zu den typischen Aufgaben der Statistik gehört. Mit diesem aus praktischer Sicht sehr wichtigen Thema werden wir uns auf den folgenden Seiten näher beschäftigen. Wir werden dabei verschiedene Maßzahlen kennenlernen, die auf unterschiedliche Weise der Vorstellung von einem Mittelwert oder Durchschnitt entsprechen. Etwas allgemeiner spricht man in diesem Zusammenhang auch von Lagemaßzahlen. Diese stellen eine Form von komprimierter Information dar. Außerdem erleichtern sie die Vergleichbarkeit von Daten für den Fall, dass nicht nur ein, sondern mehrere Datensätze vorliegen. Wenn man zum Beispiel an den Preis von Produkten wie Kaffee, Bier, Brot, Obst oder auch Benzin denkt, dann hat man es ja nicht mit Einheitspreisen, sondern mit einer Vielzahl von Einzelpreisen zu tun. Wenn daher in Medienberichten vom aktuellen Benzinpreis oder dem diesjährigen Bierpreis am Münchner Oktoberfest die Rede ist, dann sind natürlich Durchschnittspreise gemeint, auch wenn dies nicht immer eigens erwähnt wird. Betrachten wir ein anderes Beispiel. Abbildung 2.1 zeigt die jährlichen Wachstumsraten des Bruttoinlandsprodukts (BIP) für die EU, Deutschland, Österreich und die Schweiz. Eine naheliegende Frage in diesem Fall wäre wohl die nach einer geeigneten Maßzahl, um das durchschnittliche jährliche Wachstum zu beschreiben. Dies würde nicht nur die Vergleichbarkeit der einzelnen Zeitreihen erleichtern. Es könnte nämlich auch von Interesse sein, das jeweilige Wachstum für verschiedene Abschnitte einer gegebenen Zeitreihe miteinander zu vergleichen. Wir 25

Kapitel 2. Mittelwerte % 4,0 3,0 Schweiz Österreich EU 2,0 Deutschland 1,0 0 1,0 2000 2001 2002 2003 2004 2005 2006 2007 Abbildung 2.1. BIP-Wachstumsraten für die EU, Deutschland, Österreich und die Schweiz, 2000 2007 (Jahresdaten, real, in %) werden sehen, dass die Beschreibung des Wachstums einer Zeitreihe ein spezielles Mittelwertkonzept erfordert, das man auch in der Finanzmathematik verwendet. Falls nicht anders vermerkt, setzen wir ab jetzt voraus, dass die verwendeten Ausprägungen immer von quantitativen Merkmalen stammen und dass man uneingeschränkt mit ihnen operieren kann. Beobachtungen, das heißt beobachtete Daten, werden dabei üblicherweise symbolisch mit x 1, x 2,..., x n bezeichnet. Es folgt ein kurzer Überblick über den Inhalt dieses Kapitels. Der erste Abschnitt beschäftigt sich mit dem am häufigsten verwendeten Mittelwert, dem arithmetischen Mittel. Dabei werden wir neben der traditionellen Variante auch eine Variante präsentieren, bei der die einzelnen Werte eine Gewichtung aufweisen können. Im zweiten Abschnitt wird das geometrische Mittel behandelt, das typischerweise bei Zeitreihendaten verwendet wird, wenn es darum geht, so etwas wie eine durchschnittliche Wachstumsrate zu bestimmen. Im nächsten Abschnitt wird kurz auf einige weitere Maßzahlen eingegangen, die ebenfalls im Zusammenhang mit Mittelwerten relevant sind, nämlich der Modus, der Median bzw. allgemeiner die Quantile. Eine spezielle grafische Darstellungsform, die Boxplots, wird im vierten Abschnitt vorgestellt. Im letzten Abschnitt schließlich werden die vier Aktienindizes an Hand der durchschnittlichen Wachstumsrate bzw. Rendite miteinander verglichen. 26

2.1. Arithmetisches Mittel 2.1. Arithmetisches Mittel Wann immer die Frage nach einem Durchschnitt, einem durchschnittlichen Wert oder Mittelwert gestellt wird, wird man häufig zunächst an das arithmetische Mittel denken 1. Es ist die mit Abstand populärste Lagemaßzahl und wird üblicherweise durch einen Querstrich, zum Beispiel x, gekennzeichnet 2. Arithmetisches Mittel x = x 1 + + x n n = 1 n x i Das arithmetische Mittel erhält man also dadurch, indem die Summe der Daten durch ihre Anzahl dividiert wird. Bei den gesamten Melange-Preisen ergibt sich daher für das arithmetische Mittel der Wert x = 3,10 + 2,40 + + 4,40 + 2,60 70 = 3,10 Die Frage nach dem durchschnittlichen Preis für eine Melange wäre in diesem Fall mit der Angabe des Wertes x = 3,10 beantwortet. Berechnet man noch separat die arithmetischen Mittel der Datensätze für den 1. Bezirk bzw. für die übrigen Bezirke, dann erhält man die Werte x 1 = 3,40 bzw. x 2 = 2,85, was erwartungsgemäß den Unterschied im Preisniveau zwischen dem Stadtzentrum und den übrigen Bezirken widerspiegelt. Das arithmetische Mittel kann man vergleichen mit dem Gleichgewichtspunkt einer Waage. Betrachtet man die Abweichungen der Beobachtungen vom arithmetischen Mittel, das heißt die Differenzen x i x, dann zeigt sich, dass sich negative und positive Abweichungen gegenseitig aufheben. Es gilt nämlich: (x i x) = x i nx = nx nx = 0 Durch diese Eigenschaft wird das arithmetische Mittel charakterisiert. Mit anderen Worten, bei gegebenen Beobachtungen x 1, x 2,..., x n ist das arithmetische Mittel x gerade diejenige Zahl, für die die Summe der Abweichungen den Wert Null ergibt. Fasst man die 70 Einzelwerte in einer Häufigkeitstabelle zusammen, wie wir es bereits in Kapitel 1 getan haben, dann wird die Darstellung der Melange-Preise 27

Kapitel 2. Mittelwerte Tabelle 2.1. Häufigkeiten der Melange-Preise absolute absolute Preis Häufigkeit Preis Häufigkeit 2,30 2 3,40 3 2,40 4 3,50 3 2,50 2 3,60 3 2,60 9 3,70 3 2,70 3 3,80 0 2,80 2 3,90 0 2,90 8 4,00 1 3,00 8 4,10 0 3,10 6 4,20 1 3,20 4 4,30 0 3,30 4 4,40 4 nicht nur übersichtlicher, sondern erlaubt auch eine alternative und elegantere Berechnung des arithmetischen Mittels. Das arithmetische Mittel lässt sich nämlich jetzt auch so berechnen: x = 2,30 2 + 2,40 4 + + 4,40 4 70 = 3,10 Dabei wird jeder Preis mit der Häufigkeit seines Auftretens multipliziert ( gewichtet ). Bezeichnet man allgemein die verschiedenen Merkmalsausprägungen mit a 1, a 2,..., a k, dann erhält man also das arithmetische Mittel, indem die einzelnen Merkmalsausprägungen mit den entsprechenden absoluten Häufigkeiten h 1, h 2,..., h k gewichtet werden. Auf diese Weise erhält man formal das sogenannte gewichtete arithmetische Mittel. Gewichtetes arithmetisches Mittel x = a 1 h 1 + + a k h k n = 1 n a i h i Diese Darstellung des arithmetischen Mittels ermöglicht übrigens eine Modifikation, bei der man statt der absoluten Häufigkeiten spezielle positive Gewichte g 1, g 2,..., g k verwenden kann, wobei dann der Zähler durch die Summe der 28

2.1. Arithmetisches Mittel Gewichte dividiert wird. Auf diese Weise könnte man die einzelnen Merkmalsausprägungen quasi mit ihrer Bedeutung gewichten. Man denke etwa an die Gewichtung von Punktezahlen bei Prüfungen mit unterschiedlichem Schwierigkeitsgrad. Wenn man das mit den absoluten Häufigkeiten berechnete arithmetische Mittel etwas umformt, dann zeigt sich, dass man x darstellen kann als die Summe der Produkte aus den verschiedenen Merkmalsausprägungen und den zugehörigen relativen Häufigkeiten x = 1 n a i h i = a i hi n = a i f i Auf diese Darstellung werden wir in der Wahrscheinlichkeitsrechnung noch einmal zurückkommen. Mit ihrer Hilfe lässt sich nämlich der Begriff des Erwartungswerts einer Zufallsvariablen motivieren. klausurtipp Falls man das gewichtete arithmetische Mittel verwendet, sollte man sich klar darüber sein, über welche Werte eigentlich gemittelt wird. Hier kommt es immer wieder zu Verwechslungen. Betrachten wir zum Beispiel die folgende Berechnung des arithmetischen Mittels der Ausprägungen 1, 2, 3 und 4 eines Merkmals mit den absoluten Häufigkeiten 5, 3, 4 und 8: x = 1 5 + 2 3 + 3 4 + 4 8 10 = 3,5 Dieses Ergebnis ist natürlich falsch! In diesem Fall ist nämlich der Nenner nicht gleich der Summe der Häufigkeiten, sondern gleich der Summe der vier verschiedenen Ausprägungen, die tatsächlich den Wert 10 hat. Wenn man will, könnte man sagen, dass hier das gewichtete arithmetische Mittel von vier Zahlen berechnet wurde, wobei die Ausprägungen 5, 3, 4 und 8 mit den Häufigkeiten 1, 2, 3 und 4 gewichtet wurden. Das war aber nicht gefragt! Obwohl das arithmetische Mittel derjenige Mittelwert ist, der am häufigsten verwendet wird, ist seine Anwendung nicht immer ganz unproblematisch. Da nämlich bei seiner Berechnung sämtliche Beobachtungen berücksichtigt werden, können zum Beispiel extreme Werte, sogenannte Ausreißer, den Mittelwert unter Umständen stark beeinflussen. Das ist nicht unbedingt eine wünschenswerte Eigenschaft, wenn man an einem repräsentativen Mittelwert interessiert ist. Auf diesen Aspekt werden wir bei der Definition des Medians noch eingehen. 29