Einführung in elementare Statistik und Wahrscheinlichkeitsrechnung. Bodo Werner

Größe: px
Ab Seite anzeigen:

Download "Einführung in elementare Statistik und Wahrscheinlichkeitsrechnung. Bodo Werner mailto:werner@math.uni-hamburg.de"

Transkript

1 Einführung in elementare Statistik und Wahrscheinlichkeitsrechnung Bodo Werner 17. Juni 2009

2 2

3 Inhaltsverzeichnis 1 Vorwort Internet-Seiten Lehrbücher Beschreibende Statistik Einführung Die wichtigsten Begriffe Merkmalraum und andere wichtige Begriffe Stichprobe Quantitative und qualitative Merkmale Diskrete und kontinuierliche Merkmale Absolute, relative Häufigkeiten und ihre Verteilungen Grafische Darstellungen von Erhebungen Beispiel Diagramme in Excel Histogramme Eigenschaften von Häufigkeitsverteilungen Grafische Manipulationen Maßzahlen (Kenngrößen) Mittelwert Charakterisierung des Mittelwertes Mittelwert als Schwerpunkt Skaleneinfluss auf den Mittelwert Varianz, Streuung Skaleneinfluss Berechnungen mit Excel Median, Quantile, Quartile Empirische Verteilungsfunktion Statistik und Wahrscheinlichkeitstheorie Korrelation zweier Merkmale Kontingenztafel

4 4 INHALTSVERZEICHNIS Korrelationskoeffizient Regression Eine Warnung Einführung in die elementare Wahrscheinlichkeitsrechnung Einführung Elementare Anwendungen der Kombinatorik auf die Wahrscheinlichkeits- Rechnung Beispiele für Fragen aus der Stochastik Kombinatorik - eine Steilkurs Merkmalraum Zufallsvariable: Ein erster Zugang Zufällige Ereignisse Häufigkeit und Wahrscheinlichkeit Häufigkeiten Wahrscheinlichkeit bei Zufallsexperimenten Wahrscheinlichkeiten in der Statistik Wahrscheinlichkeit: Axiome von Kolmogoroff Einschluss (Inklusion) - Ausschluss (Exklusion)-Formel Wahrscheinlichkeits-Modelle, Verteilungen Diskrete Verteilungsfunktion bei quantitativen Merkmalen Bernoulli-, Binomial-, Laplace-Modelle und ihre Verteilungen Kontinuierliche Verteilungen Rechtecksverteilung Wahrscheinlichkeits-Dichte Exkurs Integration Normalverteilung - erster Zugang Bemerkungen zu kontinuierlichen Verteilungen in der Statistik Bedingte Wahrscheinlichkeiten, unabhängige Ereignisse Beispiel für bedingte Wahrscheinlichkeiten aus der Medizin Reelle Zufallsvariable Verteilung und Verteilungsfunktion Kenngrößen von Zufallsvariablen Erwartungswert Berechnung der Erwartungswerte für bestimmte Verteilungen Median, Quantile Varianz, Streuung Varianz von bestimmten Verteilungen Kenngrößen bei kontinuierlichen Verteilungen Rechnen mit Zufallsvariablen Unabhängigkeit und Kovarianz von Zufallsvariablen

5 INHALTSVERZEICHNIS Zufallsstichprobe und stochastische Unabhängigkeit Normalverteilung Zentraler Grenzwertsatz

6 6 INHALTSVERZEICHNIS

7 Kapitel 1 Vorwort Die mit den Begriffen Statistik, Zufall, und Wahrscheinlichkeit verbundene Stochastik 1 spielt auch außerhalb der Mathematik eine herausragende Rolle. Sei es die Wahrscheinlichkeit, im Glücksspiel zu gewinnen, die morgige Regenwahrscheinlichkeit in einem Wetterbericht, die Wahrscheinlichkeit, an einer bestimmten Krankheit zu erkranken, die neuesten Arbeitslosenstatistiken oder eine Umfrage vor der Bundestagswahl. Die Wahrscheinlichkeit, dass eine Bank, ein Unternehmen, ein Häuslebauer oder gar ein Staat einen Kredit nicht zurückzahlen kann, prägt die Unsicherheit der derzeitigen Finanzkrise. Dass der Begriff Risiko vor dem Hintergund dieser Krise sowohl für den individuellen Geldanleger als auch für Banken, Versicherungen, ja für unsere demokratische Gesellschaft ein mit Wahrscheinlichkeit verbundener mathematischer Begriff ist, wird meist nur am Rande erwähnt. Die gesamte Versicherungsbranche ruht auf statistischen Grundlagen wie die (steigende) Lebenserwartungen bei Lebensversicherungen oder die Häufigkeit von Sturmschäden bei Gebäudeversicherungen. Diese Statistik dient der Riskoeinschätzung und der damit verbundenen Höhe der Versicherungsprämien. Auch die Medizin kommt ohne statistische Fallstudien bei der Erprobung neuer Medikamente oder bei der Frage, ob gewisse Umwelteinflüsse verantwortlich für das Auftreten bestimmter Krankheiten sind, nicht aus. Stochastik hat auch mit Warteschlangen an Fahrkartenschaltern der Bahn oder in Wartezimmern von Ärzten zu tun. Allgemein befasst sie sich mit Untersuchungen von Ereignissen, die vom Zufall beeinflusst werden. Zufällige Ereignisse werden oft durch erhobene Daten ( Zufällige Stichproben ) dokumentiert, für deren Analyse die Statistik geeignete Methoden bereitstellt. Für viele Studierende der Wirtschaftswissenschaften, Psychologie, Biologie, u.a. sind Mathematik und Statistik identisch. Wegen ihrer großen Bedeutung zählt die Stochastik heute zur Schulmathematik. Sie ist auch 1 Der Begriff Stochastik stammt ursprünglich aus dem Griechischen und bedeutet dort: die Kunst des geschickten Vermutens. Er umfasst sowohl die Wahrscheinlichkeitstheorie, auch Wahrscheinlichkeitsrechnung genannt, als auch die Statistik. 7

8 8 KAPITEL 1. VORWORT in Lehramtsstudiengängen i.a. ein Pflichtfach. Dieses Manuskript versucht einen Einstieg in die Stochastik, genauer in die beschreibende Statistik und in die Wahrscheinlichkeitsrechnung zu geben. Es beruht auf einem im SoSe 05 im Rahmen der Mathematik IV für Studierende des Lehramts an der Grund- und Mittelstufe benutzten Skript, siehe Mathematik IV SoSe 05. Ich habe auch das sehr nützliche handschriftliche Skript von Susanne Koch (Mathematik IV - Elementare Wahrscheinlichkeitsrechnung vom SoSe 08) teilweise eingearbeitet. Die Kernpunkte dieses Skripts, die Gegenstand der Vorlesung und der Übungen im SoSe 09 sind, werden durch einen größeren Schrifttyp hervorgehoben. Ziel ist es in erster Linie nicht, Rezepte und Schemata zu vermitteln, wie man Wahrscheinlichkeiten berechnet oder wie man Daten einer Stichprobe auswertet oder gar statistische Tests durchführt. Vielmehr ist das Ziel, dass die grundlegenden Konzepte so weit verstanden werden, dass wenigstens exemplarisch Berechnungen und Auswertungen durchgeführt werden können und dass das nötige Vermögen 2 vorliegt, um im gesellschaftlichen Umfeld mitdenken und mitargumentieren zu können. Diese Konzepte der Stochastik verbinden sich in der Regel mit speziellen sprachlichen Begriffen ( Vokabeln ) wie diskreter und kontinuierlicher, qualitiver und quantitativer Merkmalraum, Häufigkeiten, (Häufigkeits- und Wahrscheinlichkeits-) Verteilungen von Stichproben bzw. Zufallsvariablen und (empirische) Verteilungsfunktionen und deren Kenngrößen wie Mittelwert, Erwartungswert, Standardabweichung, Streung, Varianz, Median, Quantile, Quartile, spezielle Wahrscheinlichkeits-Verteilungen wie Bernoulli-, Binomial-, Laplace-, Normalverteilung, stochastische Unabhängigkeit von Ereignissen, bedingte Wahrscheinlichkeit sowie die Schätzung der Kenngrößen zugehöriger Zufallsvariable und Tests zur Absicherung von Hypothesen. Das Verständnis dieser Basisbegriffe kann man nicht mit der Unterstreichenkompetenz erzielen, es bedarf vielmehr einer wirklich anstrengenden Auseinandersetzung mit diesen Begriffen, die letztendlich zum Verständnis führt. Ich werde mit der sog. Beschreibenden (deskriptiven) Statistik beginnen, weil diese zum einen wesentlich einfacher ist als die Wahrscheinlichkeits-Rechnung, zum anderen aber auch im Alltag gegenwärtiger ist. Ich vermute auch 3, dass die Statistik vordergründig eine größere gesellschaftliche Bedeutung als die reine Wahrscheinlichkeitsrechnung hat. Ich denke nur an die Medizin und die Wirtschaftsstatistik. Allerdings sind beide Gebiete sehr eng verwoben, was hoffentlich deutlich werden wird. 1.1 Internet-Seiten Die möglichen Internetlinks sind in der pdf-datei rot hervorgehoben. In der Regel müssten Sie durch einen Doppelklick auf das rot Hervorgehobene einen Internet-Browser aufrufen können 2 Heute würde man von Kompetenz reden. 3 Ich bin kein Experte!

9 1.2. LEHRBÜCHER 9 Abbildung 1.1: JUMBO und so sofort zur entsprechenden Internetseite gelangen sofern Sie online sind. Übungsaufgaben werden ebenfalls solche Links enthalten, meist zu Java-Applets, die von Ihnen Aktionen erfordern. Dabei wird es keine Gebrauchsanweisungen zur Benutzung dieser Applets geben. Meist genügt ein zuweilen auch zeitaufwändiges Herumprobieren. Wichtig ist, dass Ihr Internetbrowser so eingestellt ist, dass er das Öffnen dieser Java-Applets zulässt. Unter Einstellungen müssen Sie Java und Java-Skripte aktivieren. 1. In den folgenden Seiten werden sehr häufig Bezüge zu einem hervorragenden Multi-Media- Manuskripts über Biometrie 4 der Uni Münster (Autoren: Achim Heinecke und Wolfgang Köpcke) hergestellt: Java unterstützte Münsteraner Biometrie-Oberfläche 5 Viele Beispiele und Grafiken verdanke ich diesem Skript. Die können eine CD-ROM mit allen Unterlagen bei Prof. Köpcke für nur 8 Euro bestellen (Stand 2005). Ich werde mich auf dieses Skript mit dem sympathischen Namen JUMBO beziehen, da dies die Kurzform des Arbeitstitels des Skripts (Java-Unterstützte Münsteraner Biometrie-Oberfläche) ist, siehe Abb Zu diesem Skript zitiere ich (H. Grahlki: Die akademische Lehre im Netz. Forschung und Lehre 2 (1998) 69-71): Es ergibt sich manchmal der Eindruck, dass die Begeisterung der Autoren über ihre Produkte in einem umgekehrten Verhältnis zu der Bereitschaft der Adressaten steht, die Systeme wirklich systematisch fr Lernzwecke zu nutzen. 2. Statistik I - Skript im Internet 6 (Uni Ulm) 1.2 Lehrbücher 1. Gerhard Hübner: Stochastik. Vieweg. 2. G. Fischer: Stochastik einmal anders. Vieweg Walter Krämer: Statistik verstehen. Piper. 4 Es geht im Wesentlichen um Statistik mit Anwendungen in der Medizin 5 6

10 10 KAPITEL 1. VORWORT 4. Johann Pfanzagl: Elementare Wahrscheinlichkeitsrechnung. de Gruyter. 5. Regina Storm: Wahrscheinlichkeitsrechnung, Mathematische Statistik, Statistische Qualitätskontrolle. VEB.

11 Kapitel 2 Beschreibende Statistik 2.1 Einführung Alle empirischen Untersuchungen in Pädagogik, Psychologie, Marktforschung, Medizin, Biologie, Sozialwissenschaften etc. bedienen sich der beschreibenden (deskriptiven) Statistik, um ihre quantitativen Untersuchungsergebnisse für eine Analyse in Form von Tabellen, Grafiken und statistischen Maßzahlen aufzubereiten. Die Schließende Statistik dagegen befasst sich mit den Schlussfolgerungen aus den erhobenen Daten. Sie erfordert wesentlich tiefere Mathematik. Ohne verlässliches Zahlenmaterial kann man nur schwerlich planen. In der Politik ist es Aufgabe des Statistischen Bundesamtes und der statistischen Landesämter, solches Zahlenmaterial zur Information der Bevölkerung, der Gesetzgebung und Verwaltung, aber auch als Grundlage von Entscheidungen und zu wissenschaftlichen Analysen zu ermitteln. Dabei begnügt man sich mit Schätzungen auf Grund von (Teil-) Erhebungen, da nur selten die wahren Zahlen bekannt sind hierzu bedürfte es einer Totalerhebung. Das Wort Statistik hat etwas mit dem Staat zu tun, es bedeutet ursprünglich eine Art Staatskunde, einer Staatsbeschreibung, in der es vor allem um Zahlen geht! Schon in der Weihnachtsgeschichte (...auf dass alle Welt geschätzet werde... ) geht es um eine Volkszählung, die der römische Kaiser Augustus befahl. Noch heute ist die Bevölkerungsstatistik ein ganz wesentlicher Anlass zu politischen Diskussionen, von der Arbeitslosenstatistik ganz zu schweigen. Umweltschutz und Klimaschutz ist ohne Statistik gar nicht denkbar, da man nur durch Messungen auf Probleme hinweisen kann! Auch die Pädagogik hat wohl mittlerweile erkannt, dass ihre Lerntheorien ohne Empirie, d.h. ohne systematische statistische Auswertungen, unwissenschaftlich bleiben. Die Beziehung zur Wahrscheinlichkeitsrechnung der Stochastik kommt dann zum Tragen, wenn man den empirischen Verteilungsfunktionen bekannte Verteilungen der Stochastik (Binomialverteilung, Normalverteilung, etc.) gegenüberstellt. Man kann Stichproben als eine Möglichkeit auffassen, Zufallsexperimente und die mit ihnen verbundenen Zufallsvariablen zu realisieren. Ausgangspunkt jeder Statistik sind statistische Daten in Gestalt von Erhebungen, meist Teilerhebungen in Form von (Zufalls-) Stichproben. Mathematisch formuliert wird bei quantitativen Merkmalen eine Stichprobe im einfachsten Fall durch einen einen Vektor x := (x 1, x 2,..., x n ) 11

12 12 KAPITEL 2. BESCHREIBENDE STATISTIK IR n wiedergegeben, den ich Stichprobenvektor nenne 1. Dabei ist n IN der Umfang der Stichprobe, die Komponenten x k sind Zahlen die am k-ten Objekt (oder auch Individuum ) erhobenen Daten. Zum Beispiel könnte es sich bei x k um das Geburtsgewicht des k-ten Neugeborenen in einem Krankenhaus handeln, n ist dann die Anzahl der Neugeborenen, deren Gewicht man in der Erhebung misst. In den meisten praktischen Anwendungen, ist n relativ groß und die einzelnen Objekte gehen in der Statistik unter. Ferner sind die x k meist Zahlen. In solchen Fällen ist die typische grafische Darstellung ein Histogramm mit klassierten Daten. Die Reihenfolge der Daten, ausgedrückt durch eine spezielle Indizierung, spielt i.a. keine Rolle. Häufig werden aber nicht nur einzelne Zahlen x k erhoben, sondern gleich ein ganzer Datensatz wie z.b. bei Neugeborenen Gewicht, Name, Blutgruppe, Körperlänge, Alter und Beruf der Eltern, Datum und Uhrzeit der Geburt, etc. Dabei müssen die einzelnen Merkmale (wie z.b. Geschlecht und Blutgruppe) nicht quantitativ sein. Solche Merkmale heißen auch qualitative Merkmale. Betrachte das Beispiel des Histogramms in Abb Es sollen nur die langen roten Balken interessieren. Erfragt wird das Merkmal Schulwegzeit (in Minuten). Die Komponenten der Stichprobe waren ursprünglich eigentlich kontinuierliche Merkmale, auch wenn Zeiten nicht beliebig genau gemessen werden. Diese werden schon aus Genauigkeitsgründen in Zeitintervallen zusammengefasst (klassiert): Der Merkmalraum (s.u.) lautet Ω = {[0, 15], [16, 30],..., [91, 120], [121, )}, wobei immer auf ganze Minuten gerundet wird. Der Umfang der Stichprobe ergibt sich aus der Summe der Längen der roten Rechtecke, also etwa zu n = Die absolute Häufigkeit für eine Schulwegzeit zwischen 91 und 120 Minuten beträgt ca. 70, die relative Häufigkeit etwa 70/1620 = 4, 3%. Stichproben haben in der Regel ein Ziel. So will man beispielsweise durch eine Umfrage ermitteln, wie die Altersverteilung von Raucherinnen und Raucher ist. Man stellt sich z.b. die Frage: Wieviel Prozent aller 17-jährigen Jugendlichen rauchen mehr als 5 Zigaretten am Tag? Das Objekt der Begierde ist dann diese (unbekannte) Prozentzahl, die mit Hilfe einer Stichprobe geschätzt wird, man will von der Stichprobe auf die Grundgesamtheit schließen. Die k-te Komponente des Stichprobenvektors x gibt dann die Anzahl der täglichen Zigaretten des k-ten befragten 17-jährigen Jugendlichen an. Allgemein will man aus einer kleinen Teilgesamtheit Rückschlüsse auf die Grundgesamtheit ziehen 2. An dem letzten Beispiel kann man auch den Bezug zur Wahrscheinlichkeitsrechnung erkennen: Die gesuchte Prozentzahl kann man auch als Wahrscheinlichkeit interpretieren, dass ein zufällig ausgewählter 17-jähriger Jugendliche mehr als 5 Zigaretten raucht. Diese Wahrscheinlichkeit wird nun mit Hilfe 1 Ich habe auch den Namen Urliste gefunden. 2 Auch hier ist es unerheblich, welcher 17-jährige Jugendliche mit dem Index k verbunden ist.

13 2.1. EINFÜHRUNG 13 Abbildung 2.1: Schulwegzeiten einer relativen Häufigkeit aller derjenigen 17-jährigen Jugendlichen der Stichprobe, die mehr als 5 Zigaretten rauchen, geschätzt. Einen noch engeren Bezug der Statistik zur Wahrscheinlichkeitsrechnung wird deutlich, wenn man das immer wieder strapazierte Würfelspiel heranzieht. Angenommen, man möchte empirisch die Wahrscheinlichkeit dafür berechnen, dass man mit zwei Würfeln die Augensumme 10 würfelt 3. Dann kann man eine Stichprobe vom Umfang z.b. n = 100 Würfen mit zwei Würfeln durchführen und die Anzahl der Würfe zählen, die 10 als Ergebnis haben. Die relative Häufigkeit für ein solches Ereignis ist dann das Ergebnis der Stichprobe und kann als Schätzung für die gesuchte Wahrscheinlichkeit dienen. Das empirische Gesetz der großen Zahl (n ) ist es dann auch, was über diesen Weg zum Wahrscheinlichkeitsbegriff führt. Durch diese Einführung sollte schon deutlich werden, dass es eine enge Beziehung zwischen relativer Häufigkeit und Wahrscheinlichkeit gibt. Ziel des vorliegenden Skripts über Statistik ist nicht die Fähigkeit, den praktischen Umgang mit Statistiken einzuüben. Ziel ist es vielmehr, die mathematischen Grundprinzipien der Statistik als ein reiches Anwendungsfeld der Mathematik kennen und verstehen zu lernen, zumal diese im gesellschaftspolitischen Alltag eine große Bedeutung haben. Viele Ihrer Freundinnen und Freunde, die im Studium mit Mathematik zu tun haben, werden sich mit Statistik befassen müssen. Es wäre doch schön, wenn Sie mitreden können. Ich empfehle Ihnen, auf die grafischen Darstellungen in den Medien (Fernsehen, Zeitungen) zu achten und zu versuchen, diese hier einzuordnen. Dabei werden Sie sehr häufig auf einen Typ stoßen, den ich hier nicht behandeln werde: Grafiken, die die zeitliche Entwicklung irgendeiner Wachstumsgröße (z.b. Arbeitslosenzahlen) beschreiben. Bei der Analyse und Darstellung solcher Zeitreihen treten andere Fragestellungen als die hier behandelten auf. 3 Bei einem fairen Würfel beträgt diese 1 9.

14 14 KAPITEL 2. BESCHREIBENDE STATISTIK Die wichtigsten Begriffe Die folgenden Begriffe aus der Statistik sollten Sie am Ende der Vorlesung erklären können: Relative Häufigkeit eines Merkmals einer Stichprobe vom Umfang n in Gestalt eines Stichprobenvektors, die Häufigkeitsverteilung aller Merkmale in einer Stichprobe und ihre grafische Darstellung z.b. durch Histogramme, die zugehörige empirische Verteilungsfunktion, die Lagemaße (Kenngrößen) Mittelwert, Median, Quantile, Quartile einer quantitativen Stichprobe, die Streumaße Varianz und Standardabweichung sowie der Korrelationskoeffizient zwischen zwei Stichprobenvektoren. 2.2 Merkmalraum und andere wichtige Begriffe Zentraler Begriff sowohl der Statistik als auch der Wahrscheinlichkeits- Rechnung ist der des Merkmalraums, den wir Ω nennen. Dieser enthält alle möglichen 4 Ergebnisse einer Erhebung, auch Merkmalsausprägungen des jeweiligen Merkmals genannt. Die Elemente von Ω heißen Elementarereignisse und werden bei endlichem Ω mit ω 1, ω 2,..., ω m durchnummeriert. Die Merkmale sind i.w. der Gegenstand der Erhebung, also kurz Alter, Gewicht, Geschlecht, Zeitdauer, Nationalität,... Die formal präzise Form des Merkmalraums als Menge ist nicht immer so einfach, weil es häufig um Klassen und formal präzise um Intervalle von Zahlen geht. In der Wahrscheinlichkeitsrechnung enthält der Merkmalraum die Ergebnisse von Zufallsexperimenten Stichprobe Da eine Totalerhebung nur bei kleinen Grundgesamtheiten möglich ist, wird man meist auf Teilerhebungen in Form von (Zufalls-) Stichproben angewiesen sein. Deren Ergebnisse sind gerade die Komponenten des Stichprobenvektors d.h. es gilt x k Ω, k = 1, 2,..., n. x = (x 1,..., x n ), 4 Man sagt, dass die durch die Merkmale gegebene Klasseneinteilung aller Erhebungsgegenstände disjunkt und erschöpfend sein muss.

15 2.2. MERKMALRAUM UND ANDERE WICHTIGE BEGRIFFE 15 In der Praxis muss der Datensatz nicht die formale Form eines Vektors haben. Die einzelnen Daten können auch durch Semikola getrennt sein, sie können auch untereinander aufgelistet werden. Man kann die Stichprobe auch als eine Funktion X : M Ω mit einer Menge M von n Individuen auffassen. Mit einer Durchnummerierung der Individuen, also von M := {1, 2,..., n}, ist dann x j = X(j) gerade der Funktionswert der Stichprobenfunktion X für das Individuum Nr.j. Auch Stichproben in der Statistik haben einen Zufallsaspekt: Das Ergebnis ist von vornerein nicht bekannt, es erscheint zuweilen zufällig. In diesem Sinne ist z.b. die Beobachtung der Blutgruppe eines Neugeborenen oder das Ergebnis einer Prüfung auch ein Zufallsexperiment. Man kann eine Stichprobe mit dem Begriff Zufallsvariable verbinden. Man spricht von einer echten Zufallsstichprobe, wenn dieser formal n Zufallsvariable X 1, X 2,..., X n zugeordnet werden können, die identisch verteilt und stochastisch unabhängig sind. Die Komponente x k der Stichprobe ist dann das Ergebnis des Zufallsexperiments X k, k = 1, 2,..., n. Beispiele von Erhebungen aus der Statistik: Eine Erhebung, die das Merkmal Geschlecht einer Person betrifft. Ω besteht aus den beiden Merkmalsausprägungen weiblich und männlich. Pisastudie Mathematik: Eine Testperson bearbeitet einen Aufgabensatz und wird mit einer Gesamtpunktzahl zwischen 0 und 1000 bewertet, d.h. Ω = {k IN 0 : 0 k 1000} IN. Wahlerhebung: Ω besteht aus allen zur Wahl stehenden Parteien. Es werden n WählerInnen befragt. Länge (in Metern) eines Menschen: Ω = [0, 3] IR. n ist die Anzahl der Menschen, die ausgemessen werden. Es wird von n Erwachsenen das Geschlecht, das Alter und die Anzahl der täglichen Zigaretten erhoben. Dann ist Ω das kartesische Produkt Ω = Ω 1 Ω 2 Ω 3 mit Ω 1 := { weiblich, männlich }, Ω 2 := [18, 120] IN, Ω 3 = IN 0. Man könnte N 0 durch ein Intervall [0, 1000] ersetzen, wenn man realistischerweise annimmt, dass kein Mensch mehr als tausend Zigaretten täglich rauchen wird. Es wird während eines Gewitters die Anzahl von Blitzen in einer Minute gezählt. Dann ist Ω := IN 0. Auch hierbei wird keine Obergrenze für die Anzahl der Blitze angenommen. n ist die Anzahl der jeweils eine Minute andauernden Zählungen ( Experimente ).

16 16 KAPITEL 2. BESCHREIBENDE STATISTIK Abbildung 2.2: Warenkorb Quantitative und qualitative Merkmale Man unterscheidet quantitative (zahlenmäßige) und qualitative (begriffliche) Merkmale. So sind die Merkmale Geschlecht und Blutgruppe qualitative, Alter und Gewicht sind quantitative Merkmale. Quantitative Merkmale sind immer ordinal, d.h., sie können angeordnet werden. Aber auch einige qualitative Merkmale sind ordinal, z.b. verbale Beurteilungen wie sehr gut, gut, befriedigend,..., viele Klassen (im Sport: Kreisliga, Bezirksliga,..., Bundesliga), aber auch Gewichtsklassen, Einkommensklassen,... Qualitative Merkmale, die nicht ordinal sind, heißen nominal. Die ganz aktuelle Abb. 2.2 kann man so interpretieren: Jeder ausgegebene Euro eines Bundesbürgers wird befragt, wofür er ausgegeben wird. Dabei gibt es 12 Klassen. Das Merkmal ist natürlich qualitativ und nominal. Die relativen Häufigkeiten liefern die Gewichtung bei der Berechnung der Preisentwicklung für einen Warenkorb. Achtung: Bei der Erhebung mehrerer verbundener Daten ist Ω ein kartesisches Produkt von Mengen. Wenn Daten zu jeweils einer Person durch einen Fragebogen ermittelt werden, gibt es zu jeder Person einen Datensatz. Der Umfang n ist dann die Anzahl der erhobenen Datensätze. In der Regel wird ein Teil der Daten qualitativ, ein anderer Teil quantitativ sein. Im einfachsten

17 2.2. MERKMALRAUM UND ANDERE WICHTIGE BEGRIFFE 17 Fall ist Ω IR 2. Dann kan die Stichprobe in Form einer Tabelle wiedergegeben werden, siehe auch Kap Bemerkung zum Begriff Datensatz: Dieser Begriff ist zentral für eine Datenbank, deren Tabellen aus lauter Datensätzen bestehen. Die Anzahl n der Datensätze entspricht dem Umfang der Stichprobe, die Datenfelder eines Datensatzes sind von verschiedenem Typ, z.b. vom Typ Text (Name), vom Typ Datum (Geburtsdatum), vom Typ Zahl (Gewicht) ein quantitatives Merkmal - oder auch vom Typ einer Grafik (Foto). So kann ich unter STiNE auf eine Datenbank aller TeilnehmerInnen dieser LV zurückgreifen. Wichtigste Daten der Datensätze sind Nachname, Vorname und Matrikelnummer. Aber auch die adresse, die Studienfächer, der angestrebte Abschluss und das Fachsemester werden erhoben. Aus der Sicht der TeilnehmerInnen besteht jede von ihnen besuchte LV ebenfalls aus einem Datensatz, der sicher den Titel der LV, den Namen der DozentIn sowie Ort und Zeiten enthält Diskrete und kontinuierliche Merkmale Ist Ω endlich oder wenigstens abzählbar, so heißt der Merkmalraum diskret, ansonsten kontinuierlich (manchmal auch stetig). Kontinuierliche Merkmale treten häufig bei statistischen Erhebungen der Länge 5, Gewicht, des Blutdrucks, der Temperatur, etc. auf. In der Regel fasst man gewisse Intervalle zu einer Merkmalsausprägung zusammen, man spricht von Klassierung (z.b. Gewichtsklassen ). So werden aus kontinuierlichen Merkmalen diskrete Merkmale, die in diesem Skript im Vordergrund stehen. Eine solche Klassierung ist jedenfalls immer dann angebracht, wenn der Umfang n der Stichprobe bzw. die Anzahl n der befragten Individuen sehr groß ist. Qualitative Merkmale sind immer diskret (z.b. Nationalität, Blutgruppe, Beruf, Partei,...) Absolute, relative Häufigkeiten und ihre Verteilungen Ist der Merkmalraum diskret, so kann man jedem Elementarereignis (auch Merkmalsausprägung genannt) ω Ω eine absolute und eine relative Häufigkeit innerhalb einer Stichprobe vom Umfang n zuordnen der vielleicht fundamentalste Begriff der Statistik. 5 Da man nur mit einer gewissen Genauigkeit misst, hat man es im Grunde auch nur mit endlich vielen Merkmalen zu tun. Dies sind aber zu viele, mathematisch ist es einfacher, mit kontinuierlichen Merkmalen zu arbeiten

18 18 KAPITEL 2. BESCHREIBENDE STATISTIK Definition 2.1. Die Anzahl H n (ω) der Beobachtungen innerhalb der Stichprobe des Umfangs n mit Ergebnis ω heißt absolute Häufigkeit 6, während der Quotient H n (ω)/n die relative Häufigkeit von ω ist. Nummeriert man die Elementarereignisse in Ω zu Ω := {ω 1, ω 2,..., ω m }, so setzen wir H j := H n (ω j ) als absolute Häufigkeit und h j := H j /n als relative Häufigkeit des j-ten Merkmals ω j.. Sei x = (x 1, x 2,..., x n ) Ω n mit x k Ω, k = 1, 2,.., n. das Ergebnis der Stichprobe. Dann gilt 7 und H n (ω) := {k : 1 k n und x k = ω} H 1 + H H m = n bzw. h 1 + h h m = 1. Die relativen Häufigkeiten werden auch in Prozent angegeben. So kann beispielsweise h j = 0, 31 = 31% gelten. Die Zusammenstellung aller relativer Häufigkeiten zu einem Vektor kann man auch als Häufigkeitsverteilung bezeichnen, deren grafische Darstellung im nächsten Abschnitt Kap. 2.3 erörtert wird. Definition 2.2. Sei h j die relative Häufigkeit von ω j Ω, j = 1, 2,..., m, im Stichprobenvektor x. Dann heißt der Vektor h := (h 1, h 2,..., h m ) Häufigkeitsverteilung der Stichprobe. Bemerkung: Es ist wichtig, die Ergebnisse x k, k = 1, 2,..., n, der Stichprobe von den potentiellen Merkmalsausprägungen ω j, j = 1, 2,..., m, zu unterscheiden. Ist n der Umfang der Stichprobe, so heißt dies nicht, dass es n verschiedene Ergebnisse x k gibt; Vielmehr werden i.a. mehrere x k mit einem ω j zusammenfallen, nämlich dann, wenn H j > 1. Meist gilt n >> m, so dass zwangsläufig einige H j > 1 sein müssen. 6 Diese wird in der Praxis häufig durch Strichlisten ermittelt. 7 Beachten Sie, dass die Anzahl A einer Menge A auch als #A bezeichnet wird.

19 2.3. GRAFISCHE DARSTELLUNGEN VON ERHEBUNGEN 19 Abbildung 2.3: Häufigkeitstabelle Ich versuche im Folgenden konsequent, den Index j für Merkmalsausprägungen ω j und den Index k für Stichprobenergebnisse x k zu verwenden. 2.3 Grafische Darstellungen von Erhebungen Die einfachste Form der grafischen Darstellung ist die durch ein Blockdiagramm, s. Abb Die Merkmalausprägungen werden an einer Achse in beliebiger bzw. in der natürlichen Reihenfolge (bei sogenannten ordinalen Merkmalen) angetragen. Darüber wird ein Block gezeichnet, dessen Höhe der absoluten bzw. der relativen Häufigkeit des jeweiligen Merkmals entspricht. Die Breite der Blöcke ist beliebig, sie sollte aber für alle Blöcke gleich sein. Bei einem Kreisdiagramm (s. Abb. 2.5) entspricht der absoluten bzw. der relativen Häufigkeit der Ausprägung der zentrale Winkel des zugeordneten Kreissegments. Bei einem Flächendiagramm (s. Abb. 2.6) entspricht der absoluten bzw. der relativen Häufigkeit der Ausprägung der Flächeninhalt des zugeordneten Segments. Neben grafischen Darstellungen kann man natürlich auch Tabellen verwenden, s. Abb. 2.3 mit klassierten Daten Beispiel Bei einer Stichprobe von Patienten, die unter Krampfadern im Unterschenkelbereich litten 8, wurde eine Salbe zur Linderung der Beschwerden angewandt. Eine halbe Stunde nach Auftragen der Salbe wurden die Patienten befragt, ob eine Besserung eingetreten sei. Es ergab sich folgende Liste: 8 Dieses für die LeserIn nicht so spannende Beispiel stammt aus JUMBO. Wenn Sie keine Krampfadern mögen, können Sie auch irgendwelche Muskelbeschwerden nach einer jugendlichen Betätigung betrachten.

20 20 KAPITEL 2. BESCHREIBENDE STATISTIK Besserung absolute Häufigkeit relative Häufigkeit keine 3 12,5% gering 10 41,7% deutlich 7 29,2% keine Angabe 4 16,6% Gesamt: % Tabelle 2.1: Auswertung der Krampfaderbehandlung Patient Besserung Patient Besserung 1 gering 13 gering 2 deutlich 14 gering 3 gering 15 keine 4 deutlich 16 keine Angabe 5 gering 17 gering 6 keine 18 deutlich 7 deutlich 19 deutlich 8 deutlich 20 gering 9 keine Angabe 21 keine Angabe 10 gering 22 gering 11 keine 23 gering 12 keine Angabe 24 deutlich Der (qualitative und ordinale) Merkmalraum Ω besteht aus den vier möglichen Antworten keine, gering, deutlich und keine Angabe. Hieraus ergibt sich die Tabelle 2.1 der absoluten und relativen Häufigkeiten. Eine grafische Darstellung durch Block-, Kreis- und Flächendiagramme findet man in den Abb Diagramme in Excel Das Microsoft-Tabellenkalkulationsprogramm Excel erlaubt statistische Berechnungen mit grafischer Aufbereitung durch Diagramme. Da es mit Open Office und Star Office auch kostenfreie und (fast) gleichwertige Software gibt, empfehle ich dringend deren Benutzung zum spielerischen Umgang mit Statistiken. Davon können Sie in der Schule profitieren! Beispiel: Man trage die absoluten Häufigkeiten der Tabelle 2.1 in eine Excel-Spalte, kann diese aufsummieren und in einer Nachbarspalte die relativen Häufigkeiten (in Prozent) berechnen.

1,11 1,12 1,13 1,14 1,15 1,16 1,17 1,17 1,17 1,18

1,11 1,12 1,13 1,14 1,15 1,16 1,17 1,17 1,17 1,18 3. Deskriptive Statistik Ziel der deskriptiven (beschreibenden) Statistik (explorativen Datenanalyse) ist die übersichtliche Darstellung der wesentlichen in den erhobenen Daten enthaltene Informationen

Mehr

2. Eindimensionale (univariate) Datenanalyse

2. Eindimensionale (univariate) Datenanalyse 2. Eindimensionale (univariate) Datenanalyse Dr. Antje Kiesel Institut für Angewandte Mathematik WS 2011/2012 Kennzahlen, Statistiken In der Regel interessieren uns nicht so sehr die beobachteten Einzeldaten

Mehr

Kapitel 3. Zufallsvariable. Wahrscheinlichkeitsfunktion, Dichte und Verteilungsfunktion. Erwartungswert, Varianz und Standardabweichung

Kapitel 3. Zufallsvariable. Wahrscheinlichkeitsfunktion, Dichte und Verteilungsfunktion. Erwartungswert, Varianz und Standardabweichung Kapitel 3 Zufallsvariable Josef Leydold c 2006 Mathematische Methoden III Zufallsvariable 1 / 43 Lernziele Diskrete und stetige Zufallsvariable Wahrscheinlichkeitsfunktion, Dichte und Verteilungsfunktion

Mehr

2. Deskriptive Statistik 2.1. Häufigkeitstabellen, Histogramme, empirische Verteilungsfunktionen

2. Deskriptive Statistik 2.1. Häufigkeitstabellen, Histogramme, empirische Verteilungsfunktionen 4. Datenanalyse und Modellbildung Deskriptive Statistik 2-1 2. Deskriptive Statistik 2.1. Häufigkeitstabellen, Histogramme, empirische Verteilungsfunktionen Für die Auswertung einer Messreihe, die in Form

Mehr

Grundlagen der Inferenzstatistik: Was Ihnen nicht erspart bleibt!

Grundlagen der Inferenzstatistik: Was Ihnen nicht erspart bleibt! Grundlagen der Inferenzstatistik: Was Ihnen nicht erspart bleibt! 1 Einführung 2 Wahrscheinlichkeiten kurz gefasst 3 Zufallsvariablen und Verteilungen 4 Theoretische Verteilungen (Wahrscheinlichkeitsfunktion)

Mehr

Statistik im Bachelor-Studium der BWL und VWL

Statistik im Bachelor-Studium der BWL und VWL Max C. Wewel Statistik im Bachelor-Studium der BWL und VWL Methoden, Anwendung, Interpretation Mit herausnehmbarer Formelsammlung ein Imprint von Pearson Education München Boston San Francisco Harlow,

Mehr

Einfache Statistiken in Excel

Einfache Statistiken in Excel Einfache Statistiken in Excel Dipl.-Volkswirtin Anna Miller Bergische Universität Wuppertal Schumpeter School of Business and Economics Lehrstuhl für Internationale Wirtschaft und Regionalökonomik Raum

Mehr

Beschreibende Statistik

Beschreibende Statistik Beschreibende Statistik Daten graphisch darstellen 21. April 2009 Dr. Katja Krüger Universität Paderborn Grundlagen der Schulmathematik SoSe 2009 1 Daten graphisch darstellen warum? Die rasche und sichere

Mehr

Statistik und Wahrscheinlichkeitsrechnung

Statistik und Wahrscheinlichkeitsrechnung Statistik und Wahrscheinlichkeitsrechnung Übung 2 28.02.2008 1 Inhalt der heutigen Übung Beschreibende Statistik Gemeinsames Lösen der Übungsaufgaben 2.1: Häufigkeitsverteilung 2.2: Tukey Boxplot 25:Korrelation

Mehr

Linearer Zusammenhang von Datenreihen

Linearer Zusammenhang von Datenreihen Linearer Zusammenhang von Datenreihen Vielen Problemen liegen (möglicherweise) lineare Zusammenhänge zugrunde: Mein Internetanbieter verlangt eine Grundgebühr und rechnet minutenweise ab Ich bestelle ein

Mehr

$ % + 0 sonst. " p für X =1 $

$ % + 0 sonst.  p für X =1 $ 31 617 Spezielle Verteilungen 6171 Bernoulli Verteilung Wir beschreiben zunächst drei diskrete Verteilungen und beginnen mit einem Zufallsexperiment, indem wir uns für das Eintreffen eines bestimmten Ereignisses

Mehr

Prüfung zu Modul 26 (BA Bw) bzw. 10 (BA IB) (Wirtschaftsstatistik)

Prüfung zu Modul 26 (BA Bw) bzw. 10 (BA IB) (Wirtschaftsstatistik) 2 3 Klausur-Nr = Sitzplatz-Nr Prüfung zu Modul 26 (BA Bw) bzw. 10 (BA IB) (Wirtschaftsstatistik) Klausurteil 1: Beschreibende Statistik BeStat-1 (7 ) n = 400 Personen wurden gefragt, wie viele Stück eines

Mehr

Deskriptive Statistik

Deskriptive Statistik Deskriptive Statistik In der beschreibenden Statistik werden Methoden behandelt, mit deren Hilfe man Daten übersichtlich darstellen und kennzeichnen kann. Die Urliste (=Daten in der Reihenfolge ihrer Erhebung)

Mehr

90-minütige Klausur Statistik für Studierende der Kommunikationswissenschaft

90-minütige Klausur Statistik für Studierende der Kommunikationswissenschaft Prof. Dr. Helmut Küchenhoff SS08 90-minütige Klausur Statistik für Studierende der Kommunikationswissenschaft am 22.7.2008 Anmerkungen Überprüfen Sie bitte sofort, ob Ihre Angabe vollständig ist. Sie sollte

Mehr

Box-and-Whisker Plot -0,2 0,8 1,8 2,8 3,8 4,8

Box-and-Whisker Plot -0,2 0,8 1,8 2,8 3,8 4,8 . Aufgabe: Für zwei verschiedene Aktien wurde der relative Kurszuwachs (in % beobachtet. Aus den jeweils 20 Quartaldaten ergaben sich die folgenden Box-Plots. Box-and-Whisker Plot Aktie Aktie 2-0,2 0,8,8

Mehr

Grundbegriffe (1) Grundbegriffe (2)

Grundbegriffe (1) Grundbegriffe (2) Grundbegriffe (1) S.1 Äquivalenzklasse Unter einer Äquivalenzklasse versteht man eine Klasse von Objekten, die man hinsichtlich bestimmter Merkmalsausprägungen als gleich (äquivalent) betrachtet. (z.b.

Mehr

Kontingenzkoeffizient (nach Pearson)

Kontingenzkoeffizient (nach Pearson) Assoziationsmaß für zwei nominale Merkmale misst die Unabhängigkeit zweier Merkmale gibt keine Richtung eines Zusammenhanges an 46 o jl beobachtete Häufigkeiten der Kombination von Merkmalsausprägungen

Mehr

Codierungstheorie Rudolf Scharlau, SoSe 2006 9

Codierungstheorie Rudolf Scharlau, SoSe 2006 9 Codierungstheorie Rudolf Scharlau, SoSe 2006 9 2 Optimale Codes Optimalität bezieht sich auf eine gegebene Quelle, d.h. eine Wahrscheinlichkeitsverteilung auf den Symbolen s 1,..., s q des Quellalphabets

Mehr

0 Einführung: Was ist Statistik

0 Einführung: Was ist Statistik 0 Einführung: Was ist Statistik 1 Datenerhebung und Messung Die Messung Skalenniveaus 2 Univariate deskriptive Statistik 3 Multivariate Statistik 4 Regression 5 Ergänzungen Grundbegriffe Statistische Einheit,

Mehr

Schätzung des Lifetime Values von Spendern mit Hilfe der Überlebensanalyse

Schätzung des Lifetime Values von Spendern mit Hilfe der Überlebensanalyse Schätzung Lifetime Values von Spenn mit Hilfe Überlebensanalyse Einführung in das Verfahren am Beispiel Einzugsgenehmigung Überlebensanalysen o Ereignisdatenanalysen behandeln das Problem, mit welcher

Mehr

Elemente der Analysis II

Elemente der Analysis II Elemente der Analysis II Kapitel 3: Lineare Abbildungen und Gleichungssysteme Informationen zur Vorlesung: http://www.mathematik.uni-trier.de/ wengenroth/ J. Wengenroth () 15. Mai 2009 1 / 35 3.1 Beispiel

Mehr

9. Schätzen und Testen bei unbekannter Varianz

9. Schätzen und Testen bei unbekannter Varianz 9. Schätzen und Testen bei unbekannter Varianz Dr. Antje Kiesel Institut für Angewandte Mathematik WS 2011/2012 Schätzen und Testen bei unbekannter Varianz Wenn wir die Standardabweichung σ nicht kennen,

Mehr

Statistik I für Wirtschaftswissenschaftler Klausur am 06.07.2007, 14.00 16.00.

Statistik I für Wirtschaftswissenschaftler Klausur am 06.07.2007, 14.00 16.00. 1 Statistik I für Wirtschaftswissenschaftler Klausur am 06.07.2007, 14.00 16.00. Bitte unbedingt beachten: a) Gewertet werden alle 9 gestellten Aufgaben. b) Lösungswege sind anzugeben. Die Angabe des Endergebnisses

Mehr

Füllmenge. Füllmenge. Füllmenge. Füllmenge. Mean = 500,0029 Std. Dev. = 3,96016 N = 10.000. 485,00 490,00 495,00 500,00 505,00 510,00 515,00 Füllmenge

Füllmenge. Füllmenge. Füllmenge. Füllmenge. Mean = 500,0029 Std. Dev. = 3,96016 N = 10.000. 485,00 490,00 495,00 500,00 505,00 510,00 515,00 Füllmenge 2.4 Stetige Zufallsvariable Beispiel. Abfüllung von 500 Gramm Packungen einer bestimmten Ware auf einer automatischen Abfüllanlage. Die Zufallsvariable X beschreibe die Füllmenge einer zufällig ausgewählten

Mehr

Webergänzung zu Kapitel 10

Webergänzung zu Kapitel 10 Webergänzung zu Kapitel 10 10.1.4 Varianzanalyse (ANOVA: analysis of variance) Im Kapitel 10 haben wir uns hauptsächlich mit Forschungsbeispielen beschäftigt, die nur zwei Ergebnissätze hatten (entweder

Mehr

Multivariate Statistik

Multivariate Statistik Hermann Singer Multivariate Statistik 1 Auflage 15 Oktober 2012 Seite: 12 KAPITEL 1 FALLSTUDIEN Abbildung 12: Logistische Regression: Geschätzte Wahrscheinlichkeit für schlechte und gute Kredite (rot/blau)

Mehr

Anwendung von Statistik in Excel Deskriptive Statistik und Wirtschaftsstatistik

Anwendung von Statistik in Excel Deskriptive Statistik und Wirtschaftsstatistik Anwendung von Statistik in Excel Deskriptive Statistik und Wirtschaftsstatistik Wintersemester 08/09 Kai Schaal Universität zu Köln Organisatorisches und Einleitung (1) Was, wann, wo? Anwendung von Statistik

Mehr

x 2 2x + = 3 + Es gibt genau ein x R mit ax + b = 0, denn es gilt

x 2 2x + = 3 + Es gibt genau ein x R mit ax + b = 0, denn es gilt - 17 - Die Frage ist hier also: Für welche x R gilt x = x + 1? Das ist eine quadratische Gleichung für x. Es gilt x = x + 1 x x 3 = 0, und man kann quadratische Ergänzung machen:... ( ) ( ) x x + = 3 +

Mehr

Datenanalyse und Statistik

Datenanalyse und Statistik Datenanalyse und Statistik p. 1/44 Datenanalyse und Statistik Vorlesung 2 (Graphik I) K.Gerald van den Boogaart http://www.stat.boogaart.de Datenanalyse und Statistik p. 2/44 Daten Schätzung Test Mathe

Mehr

3.2 Bivariate Verteilungen

3.2 Bivariate Verteilungen 3.2 Bivariate Verteilungen zwei Variablen X, Y werden gemeinsam betrachtet (an jedem Objekt i, i = 1,..., n, werden gleichzeitig zwei Merkmale beobachtet) Beobachtungswerte sind Paare/Kombinationen von

Mehr

Häufigkeitstabellen. Balken- oder Kreisdiagramme. kritischer Wert für χ2-test. Kontingenztafeln

Häufigkeitstabellen. Balken- oder Kreisdiagramme. kritischer Wert für χ2-test. Kontingenztafeln Häufigkeitstabellen Menüpunkt Data PivotTable Report (bzw. entsprechendes Icon): wähle Data Range (Zellen, die die Daten enthalten + Zelle mit Variablenname) wähle kategoriale Variable für Spalten- oder

Mehr

Auswertung und Darstellung wissenschaftlicher Daten (1)

Auswertung und Darstellung wissenschaftlicher Daten (1) Auswertung und Darstellung wissenschaftlicher Daten () Mag. Dr. Andrea Payrhuber Zwei Schritte der Auswertung. Deskriptive Darstellung aller Daten 2. analytische Darstellung (Gruppenvergleiche) SPSS-Andrea

Mehr

Bachelorabschlussseminar Dipl.-Kfm. Daniel Cracau

Bachelorabschlussseminar Dipl.-Kfm. Daniel Cracau 1 Einführung in die statistische Datenanalyse Bachelorabschlussseminar Dipl.-Kfm. Daniel Cracau 2 Gliederung 1.Grundlagen 2.Nicht-parametrische Tests a. Mann-Whitney-Wilcoxon-U Test b. Wilcoxon-Signed-Rank

Mehr

Varianzanalyse ANOVA

Varianzanalyse ANOVA Varianzanalyse ANOVA Johannes Hain Lehrstuhl für Mathematik VIII Statistik 1/23 Einfaktorielle Varianzanalyse (ANOVA) Bisher war man lediglich in der Lage, mit dem t-test einen Mittelwertsvergleich für

Mehr

Stichprobenauslegung. für stetige und binäre Datentypen

Stichprobenauslegung. für stetige und binäre Datentypen Stichprobenauslegung für stetige und binäre Datentypen Roadmap zu Stichproben Hypothese über das interessierende Merkmal aufstellen Stichprobe entnehmen Beobachtete Messwerte abbilden Schluss von der Beobachtung

Mehr

Statistik mit Excel 2010. Themen-Special. Peter Wies. 1. Ausgabe, September 2011 W-EX2010S

Statistik mit Excel 2010. Themen-Special. Peter Wies. 1. Ausgabe, September 2011 W-EX2010S Statistik mit Excel 2010 Peter Wies 1. Ausgabe, September 2011 Themen-Special W-EX2010S 3 Statistik mit Excel 2010 - Themen-Special 3 Statistische Maßzahlen In diesem Kapitel erfahren Sie wie Sie Daten

Mehr

Skript zur Übung: Grundlagen der empirischen Sozialforschung - Datenanalyse

Skript zur Übung: Grundlagen der empirischen Sozialforschung - Datenanalyse Skript zur Übung: Grundlagen der empirischen Sozialforschung - Datenanalyse Phasen des Forschungsprozesses Auswahl des Forschungsproblems Theoriebildung Theoretische Phase Konzeptspezifikation / Operationalisierung

Mehr

12. Vergleich mehrerer Stichproben

12. Vergleich mehrerer Stichproben 12. Vergleich mehrerer Stichproben Dr. Antje Kiesel Institut für Angewandte Mathematik WS 2011/2012 Häufig wollen wir verschiedene Populationen, Verfahren, usw. miteinander vergleichen. Beipiel: Vergleich

Mehr

Analog zu Aufgabe 16.1 werden die Daten durch folgenden Befehl eingelesen: > kredit<-read.table("c:\\compaufg\\kredit.

Analog zu Aufgabe 16.1 werden die Daten durch folgenden Befehl eingelesen: > kredit<-read.table(c:\\compaufg\\kredit. Lösung 16.3 Analog zu Aufgabe 16.1 werden die Daten durch folgenden Befehl eingelesen: > kredit

Mehr

Übungsaufgaben zu Kapitel 5. Aufgabe 101. Inhaltsverzeichnis:

Übungsaufgaben zu Kapitel 5. Aufgabe 101. Inhaltsverzeichnis: Inhaltsverzeichnis: Übungsaufgaben zu Kapitel 5... 1 Aufgabe 101... 1 Aufgabe 102... 2 Aufgabe 103... 2 Aufgabe 104... 2 Aufgabe 105... 3 Aufgabe 106... 3 Aufgabe 107... 3 Aufgabe 108... 4 Aufgabe 109...

Mehr

5 Zusammenhangsmaße, Korrelation und Regression

5 Zusammenhangsmaße, Korrelation und Regression 5 Zusammenhangsmaße, Korrelation und Regression 5.1 Zusammenhangsmaße und Korrelation Aufgabe 5.1 In einem Hauptstudiumsseminar des Lehrstuhls für Wirtschafts- und Sozialstatistik machten die Teilnehmer

Mehr

Prof. Dr. P. von der Lippe Statistik I NK SS 2002 Seite 1

Prof. Dr. P. von der Lippe Statistik I NK SS 2002 Seite 1 Prof. Dr. P. von der Lippe Statistik I NK SS 2002 Seite 1 Aufgabe 1 a) BWL-Student S hat von seinem Lieblingsonkel 10.000 geschenkt bekommen mit der Auflage damit etwas Vernünftiges zu machen. Nachdem

Mehr

Data Mining (ehem. Entscheidungsunterstützungssysteme)

Data Mining (ehem. Entscheidungsunterstützungssysteme) Data Mining (ehem. Entscheidungsunterstützungssysteme) Melanie Pfoh Anja Tetzner Christian Schieder Übung WS 2014/15 AGENDA TEIL 1 Aufgabe 1 (Wiederholung OPAL / Vorlesungsinhalte) ENTSCHEIDUNG UND ENTSCHEIDUNGSTHEORIE

Mehr

Vorlesung. Funktionen/Abbildungen 1

Vorlesung. Funktionen/Abbildungen 1 Vorlesung Funktionen/Abbildungen 1 1 Grundlagen Hinweis: In dieser Vorlesung werden Funktionen und Abbildungen synonym verwendet. In der Schule wird eine Funktion häufig als eindeutige Zuordnung definiert.

Mehr

Schleswig-Holsteinische Ergänzung der Musteraufgaben für den hilfsmittelfreien Teil der schriftlichen Abiturprüfung im Fach Mathematik ab 2015

Schleswig-Holsteinische Ergänzung der Musteraufgaben für den hilfsmittelfreien Teil der schriftlichen Abiturprüfung im Fach Mathematik ab 2015 ische Ergänzung der für den hilfsmittelfreien Teil der schriftlichen Abiturprüfung im Fach Mathematik ab 2015 Ministerium für ildung und Wissenschaft des Landes Juni 2013 1 für Aufgabenpool 1 Analysis

Mehr

Einseitig gerichtete Relation: Mit zunehmender Höhe über dem Meeresspiegel sinkt im allgemeinen die Lufttemperatur.

Einseitig gerichtete Relation: Mit zunehmender Höhe über dem Meeresspiegel sinkt im allgemeinen die Lufttemperatur. Statistik Grundlagen Charakterisierung von Verteilungen Einführung Wahrscheinlichkeitsrechnung Wahrscheinlichkeitsverteilungen Schätzen und Testen Korrelation Regression Einführung Die Analyse und modellhafte

Mehr

Methoden der empirischen Sozialforschung I

Methoden der empirischen Sozialforschung I Methoden der empirischen Sozialforschung I Annelies Blom, PhD TU Kaiserslautern Wintersemester 2011/12 Übersicht Quantitative Datenauswertung: deskriptive und induktive Statistik Wiederholung: Die wichtigsten

Mehr

1.5 Folgerungen aus dem Kolmogoroff- Axiomensystem P( ) = 0.

1.5 Folgerungen aus dem Kolmogoroff- Axiomensystem P( ) = 0. 1.5 Folgerungen aus dem Kolmogoroff- Axiomensystem Folg. 2 Sei (Ω, E, P) W.-raum. Seien A, B,A 1,...,A n Ereignisse. Es gelten die folgenden Aussagen: 1. P(A) = 1 P(A). 2. Für das unmögliche Ereignis gilt:

Mehr

Willkommen zur Vorlesung Statistik

Willkommen zur Vorlesung Statistik Willkommen zur Vorlesung Statistik Thema dieser Vorlesung: Varianzanalyse Prof. Dr. Wolfgang Ludwig-Mayerhofer Universität Siegen Philosophische Fakultät, Seminar für Sozialwissenschaften Prof. Dr. Wolfgang

Mehr

Schätzer (vgl. Kapitel 1): Stichprobenmittel X N. Stichprobenmedian X N

Schätzer (vgl. Kapitel 1): Stichprobenmittel X N. Stichprobenmedian X N Prof. Dr. J. Franke Statistik II für Wirtschaftswissenschaftler 8.1 Schätzer für Lage- und Skalenparameter und Verteilungsmodellwahl Lageparameter (l(x + a) = l(x) + a): Erwartungswert EX Median von X

Mehr

Standardisierte kompetenzorientierte schriftliche Reifeprüfung. Mathematik. Probeklausur März 2014. Teil-1-Aufgaben

Standardisierte kompetenzorientierte schriftliche Reifeprüfung. Mathematik. Probeklausur März 2014. Teil-1-Aufgaben Standardisierte kompetenzorientierte schriftliche Reifeprüfung Mathematik Probeklausur März 2014 Teil-1-Aufgaben Beurteilung Jede Aufgabe in Teil 1 wird mit 0 oder 1 Punkt bewertet, jede Teilaufgabe in

Mehr

Wahrscheinlichkeitsrechnung anhand realer Situationen

Wahrscheinlichkeitsrechnung anhand realer Situationen MaMaEuSch Management Mathematics for European Schools http://www.mathematik.unikl.de/ mamaeusch Wahrscheinlichkeitsrechnung anhand realer Situationen Paula Lagares Barreiro 1 Frederico Perea Rojas-Marcos

Mehr

Diskriminanzanalyse Beispiel

Diskriminanzanalyse Beispiel Diskriminanzanalyse Ziel bei der Diskriminanzanalyse ist die Analyse von Gruppenunterschieden, d. h. der Untersuchung von zwei oder mehr Gruppen hinsichtlich einer Vielzahl von Variablen. Diese Methode

Mehr

Grundlagen quantitativer Sozialforschung Interferenzstatistische Datenanalyse in MS Excel

Grundlagen quantitativer Sozialforschung Interferenzstatistische Datenanalyse in MS Excel Grundlagen quantitativer Sozialforschung Interferenzstatistische Datenanalyse in MS Excel 16.11.01 MP1 - Grundlagen quantitativer Sozialforschung - (4) Datenanalyse 1 Gliederung Datenanalyse (inferenzstatistisch)

Mehr

34 5. FINANZMATHEMATIK

34 5. FINANZMATHEMATIK 34 5. FINANZMATHEMATIK 5. Finanzmathematik 5.1. Ein einführendes Beispiel Betrachten wir eine ganz einfache Situation. Wir haben einen Markt, wo es nur erlaubt ist, heute und in einem Monat zu handeln.

Mehr

29. Mai 2006. 5. Bei Unterschleif gilt die Klausur als nicht bestanden und es erfolgt eine Meldung an das Prüfungsamt.

29. Mai 2006. 5. Bei Unterschleif gilt die Klausur als nicht bestanden und es erfolgt eine Meldung an das Prüfungsamt. L. Fahrmeir, C. Belitz Department für Statistik Bitte für die Korrektur freilassen! Aufgabe 1 2 3 4 Punkte Klausur zur Vorlesung Statistik III für Studenten mit Wahlfach Statistik 29. Mai 2006 Hinweise:

Mehr

Einführung in die Statistik mir R

Einführung in die Statistik mir R Einführung in die Statistik mir R ww w. syn t egris.de Überblick GESCHÄFTSFÜHRUNG Andreas Baumgart, Business Processes and Service Gunar Hofmann, IT Solutions Sven-Uwe Weller, Design und Development Jens

Mehr

Teil II. Nichtlineare Optimierung

Teil II. Nichtlineare Optimierung Teil II Nichtlineare Optimierung 60 Kapitel 1 Einleitung In diesem Abschnitt wird die Optimierung von Funktionen min {f(x)} x Ω betrachtet, wobei Ω R n eine abgeschlossene Menge und f : Ω R eine gegebene

Mehr

bedingte Wahrscheinlichkeit

bedingte Wahrscheinlichkeit bedingte Wahrscheinlichkeit 1. Neun von zehn Ungeborenen bevorzugen im Mutterleib den rechten Daumen zum Lutschen. Forscher fanden heraus, dass alle Kinder, die rechts genuckelt hatten, im Alter von 10

Mehr

Grundlagen der Datenanalyse am Beispiel von SPSS

Grundlagen der Datenanalyse am Beispiel von SPSS Grundlagen der Datenanalyse am Beispiel von SPSS Einführung Dipl. - Psych. Fabian Hölzenbein hoelzenbein@psychologie.uni-freiburg.de Einführung Organisatorisches Was ist Empirie? Was ist Statistik? Dateneingabe

Mehr

Schleswig-Holsteinische Ergänzung der Musteraufgaben für den hilfsmittelfreien Teil der schriftlichen Abiturprüfung im Fach Mathematik ab 2015

Schleswig-Holsteinische Ergänzung der Musteraufgaben für den hilfsmittelfreien Teil der schriftlichen Abiturprüfung im Fach Mathematik ab 2015 ische Ergänzung der für den hilfsmittelfreien Teil der schriftlichen Abiturprüfung im Fach Mathematik ab 2015 Ministerium für ildung und Wissenschaft des Landes Juni 2013 1 Inhaltsverzeichnis Vorbemerkungen

Mehr

Einführung in die Vektor- und Matrizenrechnung. Matrizen

Einführung in die Vektor- und Matrizenrechnung. Matrizen Einführung in die Vektor- und Matrizenrechnung Matrizen Definition einer Matrix Unter einer (reellen) m x n Matrix A versteht man ein rechteckiges Schema aus reellen Zahlen, die wie folgt angeordnet sind:

Mehr

Bisher angenommen: jeder Spieler kennt alle Teile des Spiels. - Diskontfaktor des Verhandlungspartners

Bisher angenommen: jeder Spieler kennt alle Teile des Spiels. - Diskontfaktor des Verhandlungspartners 1 KAP 15. Spiele unter unvollständiger Information Bisher angenommen: jeder Spieler kennt alle Teile des Spiels seine Gegenspieler, deren Aktionen, deren Nutzen, seinen eigenen Nutzen etc. Oft kennt man

Mehr

Datenanalyse aus einer unklassierten Häufigkeitstabelle

Datenanalyse aus einer unklassierten Häufigkeitstabelle Datenanalyse aus einer unklassierten Häufigkeitstabelle Worum geht es in diesem Modul? Häufigkeitstabelle Stabdiagramm Die empirische Verteilungsfunktion Quantile Worum geht es in diesem Modul? Nachdem

Mehr

Modul G.1 WS 07/08: Statistik 17.01.2008 1. Die Korrelation ist ein standardisiertes Maß für den linearen Zusammenhangzwischen zwei Variablen.

Modul G.1 WS 07/08: Statistik 17.01.2008 1. Die Korrelation ist ein standardisiertes Maß für den linearen Zusammenhangzwischen zwei Variablen. Modul G.1 WS 07/08: Statistik 17.01.2008 1 Wiederholung Kovarianz und Korrelation Kovarianz = Maß für den linearen Zusammenhang zwischen zwei Variablen x und y Korrelation Die Korrelation ist ein standardisiertes

Mehr

Methoden Quantitative Datenanalyse

Methoden Quantitative Datenanalyse Leitfaden Universität Zürich ISEK - Andreasstrasse 15 CH-8050 Zürich Telefon +41 44 635 22 11 Telefax +41 44 635 22 19 www.isek.uzh.ch 11. September 2014 Methoden Quantitative Datenanalyse Vorbereitung

Mehr

Eine computergestützte Einführung mit

Eine computergestützte Einführung mit Thomas Cleff Deskriptive Statistik und Explorative Datenanalyse Eine computergestützte Einführung mit Excel, SPSS und STATA 3., überarbeitete und erweiterte Auflage ^ Springer Inhaltsverzeichnis 1 Statistik

Mehr

Untersuchungen zum Thema Tracking Error

Untersuchungen zum Thema Tracking Error Untersuchungen zum Thema Tracking Error J. Fulmek 24. August 2003 1 Einleitung Im Folgenden werden folgende Punkte untersucht: 1. verschiedene in der Literatur übliche Definitionen des Tracking Errors

Mehr

Regressionsanalysen. Zusammenhänge von Variablen. Ziel der Regression. ( Idealfall )

Regressionsanalysen. Zusammenhänge von Variablen. Ziel der Regression. ( Idealfall ) Zusammenhänge von Variablen Regressionsanalysen linearer Zusammenhang ( Idealfall ) kein Zusammenhang nichtlinearer monotoner Zusammenhang (i.d.regel berechenbar über Variablentransformationen mittels

Mehr

Die Duration von Standard-Anleihen. - Berechnungsverfahren und Einflussgrößen -

Die Duration von Standard-Anleihen. - Berechnungsverfahren und Einflussgrößen - Die Duration von Standard-Anleihen - Berechnungsverfahren und Einflussgrößen - Gliederung Einleitendes Herleitung einer Berechnungsvorschrift Berechnungsvorschriften für Standardfälle Einflussgrößen und

Mehr

ax 2 + bx + c = 0, (4.1)

ax 2 + bx + c = 0, (4.1) Kapitel 4 Komplexe Zahlen Wenn wir uns auf die reellen Zahlen beschränken, ist die Operation des Wurzelziehens (also die Umkehrung der Potenzierung) nicht immer möglich. Zum Beispiel können wir nicht die

Mehr

Universität Bonn 28. Juli 2010 Fachbereich Rechts- und Wirtschaftswissenschaften Statistische Abteilung Prof. Dr. A. Kneip. KLAUSUR Statistik B

Universität Bonn 28. Juli 2010 Fachbereich Rechts- und Wirtschaftswissenschaften Statistische Abteilung Prof. Dr. A. Kneip. KLAUSUR Statistik B Universität Bonn 28. Juli 2010 Fachbereich Rechts- und Wirtschaftswissenschaften Statistische Abteilung Prof. Dr. A. Kneip Sommersemester 2010 KLAUSUR Statistik B Hinweise zur Bearbeitung: Bei allen Teilaufgaben

Mehr

Stochastik Abitur 2009 Stochastik

Stochastik Abitur 2009 Stochastik Abitur 2009 Stochastik Beilage ea (erhöhtes Anforderungsniveau) ga (grundlegendes Anforderungsniveau) ISBN 978-3-8120-0108-3 und ISBN 978-3-8120-0223-3 1 Aufgabe 2 (ea) Rauchen ist das größte vermeidbare

Mehr

Risiko und Versicherung - Übung

Risiko und Versicherung - Übung Sommer 2009 Risiko und Versicherung - Übung Entscheidungstheoretische Grundlagen Renate Bodenstaff Vera Brinkmann r.bodenstaff@uni-hohenheim.de vera.brinkmann@uni-hohenheim.de https://insurance.uni-hohenheim.de

Mehr

P X =3 = 2 36 P X =5 = 4 P X =6 = 5 36 P X =8 = 5 36 P X =9 = 4 P X =10 = 3 36 P X =11 = 2 36 P X =12 = 1

P X =3 = 2 36 P X =5 = 4 P X =6 = 5 36 P X =8 = 5 36 P X =9 = 4 P X =10 = 3 36 P X =11 = 2 36 P X =12 = 1 Übungen zur Stochastik - Lösungen 1. Ein Glücksrad ist in 3 kongruente Segmente aufgeteilt. Jedes Segment wird mit genau einer Zahl beschriftet, zwei Segmente mit der Zahl 0 und ein Segment mit der Zahl

Mehr

Aufgabe 2.1. Ergebnis, Ergebnismenge, Ereignis

Aufgabe 2.1. Ergebnis, Ergebnismenge, Ereignis Aufgabe 2. Ergebnis, Ergebnismenge, Ereignis Ergebnis und Ergebnismenge Vorgänge mit zufälligem Ergebnis, oft Zufallsexperiment genannt Bei der Beschreibung der Ergebnisse wird stets ein bestimmtes Merkmal

Mehr

Monte Carlo Simulation (Grundlagen)

Monte Carlo Simulation (Grundlagen) Der Titel des vorliegenden Beitrages wird bei den meisten Lesern vermutlich Assoziationen mit Roulette oder Black Jack hervorrufen. Allerdings haben das heutige Thema und die Spieltische nur den Namen

Mehr

i x k k=1 i u i x i v i 1 0,2 24 24 0,08 2 0,4 30 54 0,18 3 0,6 54 108 0,36 4 0,8 72 180 0,60 5 1,0 120 300 1,00 2,22 G = 1 + 1 n 2 n i=1

i x k k=1 i u i x i v i 1 0,2 24 24 0,08 2 0,4 30 54 0,18 3 0,6 54 108 0,36 4 0,8 72 180 0,60 5 1,0 120 300 1,00 2,22 G = 1 + 1 n 2 n i=1 1. Aufgabe: Der E-Commerce-Umsatz (in Millionen Euro) der fünf größten Online- Shopping-Clubs liegt wie folgt vor: Club Nr. Umsatz 1 120 2 72 3 54 4 30 5 24 a) Bestimmen Sie den Ginikoeffizienten. b) Zeichnen

Mehr

0, v 6 = 2 2. 1, v 4 = 1. 2. span(v 1, v 5, v 6 ) = span(v 1, v 2, v 3, v 4, v 5, v 6 ) 4. span(v 1, v 2, v 4 ) = span(v 2, v 3, v 5, v 6 )

0, v 6 = 2 2. 1, v 4 = 1. 2. span(v 1, v 5, v 6 ) = span(v 1, v 2, v 3, v 4, v 5, v 6 ) 4. span(v 1, v 2, v 4 ) = span(v 2, v 3, v 5, v 6 ) Aufgabe 65. Ganz schön span(n)end. Gegeben sei folgende Menge M von 6 Vektoren v, v,..., v 6 R 4 aus Aufgabe P 6: M = v =, v =, v =, v 4 =, v 5 =, v 6 = Welche der folgenden Aussagen sind wahr? span(v,

Mehr

Beispiel 48. 4.3.2 Zusammengesetzte Zufallsvariablen

Beispiel 48. 4.3.2 Zusammengesetzte Zufallsvariablen 4.3.2 Zusammengesetzte Zufallsvariablen Beispiel 48 Ein Würfel werde zweimal geworfen. X bzw. Y bezeichne die Augenzahl im ersten bzw. zweiten Wurf. Sei Z := X + Y die Summe der gewürfelten Augenzahlen.

Mehr

Zuammenfassung: Reelle Funktionen

Zuammenfassung: Reelle Funktionen Zuammenfassung: Reelle Funktionen 1 Grundlegendes a) Zahlenmengen IN = {1; 2; 3; 4;...} Natürliche Zahlen IN 0 = IN {0} Natürliche Zahlen mit 0 ZZ = {... ; 2; 1; 0; 1; 2;...} Ganze Zahlen Q = { z z ZZ,

Mehr

6. Bayes-Klassifikation. (Schukat-Talamazzini 2002)

6. Bayes-Klassifikation. (Schukat-Talamazzini 2002) 6. Bayes-Klassifikation (Schukat-Talamazzini 2002) (Böhm 2003) (Klawonn 2004) Der Satz von Bayes: Beweis: Klassifikation mittels des Satzes von Bayes (Klawonn 2004) Allgemeine Definition: Davon zu unterscheiden

Mehr

Verteilungsmodelle. Verteilungsfunktion und Dichte von T

Verteilungsmodelle. Verteilungsfunktion und Dichte von T Verteilungsmodelle Verteilungsfunktion und Dichte von T Survivalfunktion von T Hazardrate von T Beziehungen zwischen F(t), S(t), f(t) und h(t) Vorüberlegung zu Lebensdauerverteilungen Die Exponentialverteilung

Mehr

11 Diskrete Zufallsvariablen

11 Diskrete Zufallsvariablen 11 Diskrete Zufallsvariablen 11.1 Wahrscheinlichkeitsfunktion und Verteilungsfunktion In Kapitel 2 wurde zwischen diskreten und stetigen Zufallsvariablen unterschieden. Eine Zufallsvariable X wurde als

Mehr

Medizinische Biometrie (L5)

Medizinische Biometrie (L5) Medizinische Biometrie (L5) Vorlesung II Daten Deskription Prof. Dr. Ulrich Mansmann Institut für Medizinische Informationsverarbeitung, Biometrie und Epidemiologie mansmann@ibe.med.uni-muenchen.de IBE,

Mehr

3 Deskriptive Statistik in R (univariat)

3 Deskriptive Statistik in R (univariat) (univariat) Markus Burkhardt (markus.burkhardt@psychologie.tu-chemnitz.de) Inhalt 3.1 Ziel... 1 3.2 Häufigkeiten... 1 3.3 Deskriptive Kennziffern I Lagemaße... 2 3.4 Streuungsmaße... 5 3.5 Standardisierung:

Mehr

geben. Die Wahrscheinlichkeit von 100% ist hier demnach nur der Gehen wir einmal davon aus, dass die von uns angenommenen

geben. Die Wahrscheinlichkeit von 100% ist hier demnach nur der Gehen wir einmal davon aus, dass die von uns angenommenen geben. Die Wahrscheinlichkeit von 100% ist hier demnach nur der Vollständigkeit halber aufgeführt. Gehen wir einmal davon aus, dass die von uns angenommenen 70% im Beispiel exakt berechnet sind. Was würde

Mehr

Trainingsaufgaben zur Klausurvorbereitung in Statistik I und II Thema: Satz von Bayes

Trainingsaufgaben zur Klausurvorbereitung in Statistik I und II Thema: Satz von Bayes Trainingsaufgaben zur Klausurvorbereitung in Statistik I und II Thema: Satz von Bayes Aufgabe 1: Wetterbericht Im Mittel sagt der Wetterbericht für den kommenden Tag zu 60 % schönes und zu 40% schlechtes

Mehr

Profil A 49,3 48,2 50,7 50,9 49,8 48,7 49,6 50,1 Profil B 51,8 49,6 53,2 51,1 51,1 53,4 50,7 50 51,5 51,7 48,8

Profil A 49,3 48,2 50,7 50,9 49,8 48,7 49,6 50,1 Profil B 51,8 49,6 53,2 51,1 51,1 53,4 50,7 50 51,5 51,7 48,8 1. Aufgabe: Eine Reifenfirma hat für Winterreifen unterschiedliche Profile entwickelt. Bei jeweils gleicher Geschwindigkeit und auch sonst gleichen Bedingungen wurden die Bremswirkungen gemessen. Die gemessenen

Mehr

1.1 Was ist Statistik und warum ist Statistik wichtig?

1.1 Was ist Statistik und warum ist Statistik wichtig? 1.1 Was ist Statistik und warum ist Statistik wichtig? Typischer Lexikon-Eintrag für den Begriff Statistik : Methode zur Untersuchung von Massenerscheinungen Versuch, den Umfang, die Gliederung oder Struktur

Mehr

Die unterschätzte Bedrohung: Öffentliche Wahrnehmung zur Fettleibigkeit in Europa

Die unterschätzte Bedrohung: Öffentliche Wahrnehmung zur Fettleibigkeit in Europa Die unterschätzte Bedrohung: Öffentliche Wahrnehmung zur Fettleibigkeit in Europa ZUSAMMENFASSUNG FÜR DEUTSCHLAND Durchgeführt von der unabhängigen Strategieberatung Opinium in Zusammenarbeit mit der Europäischen

Mehr

Wolfgang Trutschnig. Salzburg, 2014-05-08. FB Mathematik Universität Salzburg www.trutschnig.net

Wolfgang Trutschnig. Salzburg, 2014-05-08. FB Mathematik Universität Salzburg www.trutschnig.net Auffrischungskurs Angewandte Statistik/Datenanalyse (Interne Weiterbildung FOR SS14-08) Block 1: Deskriptive Statistik, Wiederholung grundlegender Konzepte, R FB Mathematik Universität Salzburg www.trutschnig.net

Mehr

OPERATIONS-RESEARCH (OR)

OPERATIONS-RESEARCH (OR) OPERATIONS-RESEARCH (OR) Man versteht darunter die Anwendung mathematischer Methoden und Modelle zur Vorbereitung optimaler Entscheidungen bei einem Unternehmen. Andere deutsche und englische Bezeichnungen:

Mehr

Unsupervised Kernel Regression

Unsupervised Kernel Regression 9. Mai 26 Inhalt Nichtlineare Dimensionsreduktion mittels UKR (Unüberwachte KernRegression, 25) Anknüpfungspunkte Datamining I: PCA + Hauptkurven Benötigte Zutaten Klassische Kernregression Kerndichteschätzung

Mehr

Zusammenhänge zwischen metrischen Merkmalen

Zusammenhänge zwischen metrischen Merkmalen Zusammenhänge zwischen metrischen Merkmalen Darstellung des Zusammenhangs, Korrelation und Regression Daten liegen zu zwei metrischen Merkmalen vor: Datenpaare (x i, y i ), i = 1,..., n Beispiel: x: Anzahl

Mehr

Statistik. R. Frühwirth. Statistik. fru@hephy.oeaw.ac.at. VO 142.090 http://tinyurl.com/tu142090. Februar 2010. R. Frühwirth Statistik 1/536

Statistik. R. Frühwirth. Statistik. fru@hephy.oeaw.ac.at. VO 142.090 http://tinyurl.com/tu142090. Februar 2010. R. Frühwirth Statistik 1/536 fru@hephy.oeaw.ac.at VO 142.090 http://tinyurl.com/tu142090 Februar 2010 1/536 Übersicht über die Vorlesung Teil 1: Deskriptive Teil 2: Wahrscheinlichkeitsrechnung Teil 3: Zufallsvariable Teil 4: Parameterschätzung

Mehr

Bei vielen Zufallsexperimenten interessiert man sich lediglich für das Eintreten bzw. das Nichteintreten eines bestimmten Ereignisses.

Bei vielen Zufallsexperimenten interessiert man sich lediglich für das Eintreten bzw. das Nichteintreten eines bestimmten Ereignisses. XI. Binomialverteilung ================================================================== 11.1 Definitionen -----------------------------------------------------------------------------------------------------------------

Mehr

Sprechen wir über Zahlen (Karl-Heinz Wolff)

Sprechen wir über Zahlen (Karl-Heinz Wolff) Sprechen wir über Zahlen (Karl-Heinz Wolff) Die Überschrift ist insoweit irreführend, als der Autor ja schreibt und nicht mit dem Leser spricht. Was Mathematik im allgemeinen und Zahlen im besonderen betrifft,

Mehr

Statistische Software P. Fink. Statistische Software (R) Wiederholungshausübung SoSe 2015

Statistische Software P. Fink. Statistische Software (R) Wiederholungshausübung SoSe 2015 Allgmeine Hinweise Die Hausübung umfasst 7 Aufgaben mit insgesamt 120 Punkten. Erstellen Sie eine R Skript-Datei mit Ihrer Matrikelnummer als Dateinamen. Diese Datei enthält Ihren vollständigen und mit

Mehr

Folge 19 - Bäume. 19.1 Binärbäume - Allgemeines. Grundlagen: Ulrich Helmich: Informatik 2 mit BlueJ - Ein Kurs für die Stufe 12

Folge 19 - Bäume. 19.1 Binärbäume - Allgemeines. Grundlagen: Ulrich Helmich: Informatik 2 mit BlueJ - Ein Kurs für die Stufe 12 Grundlagen: Folge 19 - Bäume 19.1 Binärbäume - Allgemeines Unter Bäumen versteht man in der Informatik Datenstrukturen, bei denen jedes Element mindestens zwei Nachfolger hat. Bereits in der Folge 17 haben

Mehr