VII.Praktischer Umgang mit Daten

Größe: px
Ab Seite anzeigen:

Download "VII.Praktischer Umgang mit Daten"

Transkript

1 Gliederung I. Motivation II. III. IV. Lesen mathematischer Symbole Wissenschaftliche Argumentation Matrizenrechnung V. Metriken VI. Algorithmen VII.Praktischer Umgang mit Daten Seite 126

2 VII. Praktischer Umgang mit Daten Datenanalyse: Bei der Analyse von Daten lassen sich in 3 Grundaufgaben der Statistik unterscheiden: Deskription: Die deskriptive Statistik dient zur Beschreibung und graphischen Aufbereitung von Daten (besonders bei großen Datenmengen). Sie umfasst 1.) die Darstellung und Verdichtung von Daten in Grafiken (Diagramme & Verlaufskurven) Tabellen Kenngrößen (Mittelwert, Streuung, etc.) 2.) die Datenvalidierung 3.) die Gewinnung erster Eindrücke oder Ideen zur weiteren Analyse Seite 127

3 VII. Praktischer Umgang mit Daten Exploration: Die Exploration baut auf der deskriptiven Analyse auf. Über die Darstellung der Daten hinaus befasst sie sich mit der Suche nach Strukturen und Besonderheiten in den Daten. Sie kann richtungweisend sein, wenn die Fragestellung nicht genau definiert ist und bei der Wahl eines geeigneten Modells helfen. Darüber hinaus kann die Exploration empirische Evidenz für bestimmte Tatsachen oder Forschungshypothesen liefern. Induktion: Grundsätzlich lässt sich die induktive Statistik in die Bereiche der Schätz- und Testprobleme unterteilen: 1.) Bei Schätzproblemen ist die Aufgabe, Parameter aus den gemessenen Daten zu schätzen (z.b. den Erwartungswert der zugrundeliegenden Verteilung). 2.) Bei Testproblemen überprüft man, ob eine bestimmte Behauptung (z.b. dass der Erwartungswert der Verteilung, der den Daten zugrunde liegt, einen bestimmten Wert annimmt) von den Daten unterstützt wird. Seite 128

4 VII. Praktischer Umgang mit Daten Elementare Grundbegriffe: Statistische Einheit: Objekt, an denen interessierende Größen erfasst werden. Grundgesamtheit: Menge aller für die Fragestellung relevanten statistischen Einheiten. Teilgesamtheit: Teilmenge der Grundgesamtheit. Stichprobe: Tatsächlich untersuchte Teilmenge der Grundgesamtheit. Markmale: Interessierende Größen (= Variablen). Merkmalsausprägung: Konkreter Wert des Merkmals für eine bestimmte statistische Einheit. Seite 129

5 VII. Praktischer Umgang mit Daten Seite 130

6 VII. Praktischer Umgang mit Daten Statistische Einheit: Mensa in Saarbrücken, Unigelände. Grundgesamtheit: Menge aller Mensen, die es weltweit gibt. Teilgesamtheit: Menge aller deutschen Uni-Mensen. Stichprobe: Menge aller Uni-Mensen, für die genug Stimmen abgegeben werden. Markmale: Freundlichkeit, Auswahl, Service, Atmosphäre, Geschmack, Wohnort. Merkmalsausprägung: Freundlichkeit(SB,1) = 5Tabletts, Auswahl(SB,1) = 4Tabletts, etc. Seite 131

7 VII. Praktischer Umgang mit Daten Merkmalstypen diskret: endlich oder abzählbar unendlich viele Ausprägungen stetig: alle Werte eines Intervalls sind mögliche Ausprägungen (überabzählbar unendlich viele Ausprägungen) nominalskaliert: ordinalskaliert: intervallskaliert: Ausprägungen sind Namen, keine Ordnung möglich Ausprägungen können geordnet, Abstände aber nicht interpretiert werden Ausprägungen sind Zahlen, Interpretation der Abstände möglich verhältnisskaliert:ausprägungen besitzen sinnvollen absoluten Nullpunkt qualitativ: endlich viele Ausprägungen, höchstens ordinalskaliert quantitativ: Ausprägungen geben Intensität wieder Seite 132

8 VII. Praktischer Umgang mit Daten Beispiele: Alter: Name: Geschlecht: Einkommen: Temperatur (in Kelvin): diskret, intervallskaliert, quantitativ diskret, nominalskaliert, qualitativ diskret, nominalskaliert, qualitativ stetig (oder diskret), verhältnisskaliert, quantitativ stetig, verhältnisskaliert, quantitativ Anzahl Tabletts bei Mensaumfrage: diskret, ordinalskaliert, qualitativ Benzinverbrauch in Liter: stetig, verhältnisskaliert, quantitativ Seite 133

9 VII. Praktischer Umgang mit Daten Versuchsplan: Erfasst man Merkmale, um eine bestimmte Fragestellung zu untersuchen, so ist dafür die Erstellung eines Versuchsplans erforderlich. Dieser Versuchsplan muss festhalten 1.) welches Ziel mit dem Experiment oder welche Studie verfolgt wird, 2.) wie dieses Ziel erreicht werden kann, 3.) welche statistischen Methoden geeignet sind, um die erzielten Resultate statistisch zu manifestieren. Es muss vor dem Erheben der Stichprobe festgelegt werden, wie groß der Stichprobenumfang zu sein hat, um eine gewünschte Präzision zu erreichen. Außerdem ist zu bestimmen, welche Erhebungsart geeignet ist, um diese Stichprobe zu ziehen. Seite 134

10 VII. Praktischer Umgang mit Daten Bemerkung: Sind die interessierenden Daten bereits vorhanden (z.b. Verkaufszahlen eines Unternehmens), spricht man beim Ziehen einer Stichprobe von einer Erhebung. Wird die Erhebung speziell in Hinblick auf die aktuelle Fragestellung ausgeführt, spricht man von einer primärstatistischen Erhebung. Wird auf bereits vorhandene Originaldaten zurückgegriffen, bezeichnet man dies als sekundärstatistische Erhebung. Stehen nur bereits transformierte oder komprimierte Daten zur Verfügung, nennt man dies eine tertiärstatistische Erhebung. Müssen die Daten erst in geeigneter Weise Erzeugt werden (z.b. in einer Klinischen Studie), spricht man von Experiment. Seite 135

11 VII. Praktischer Umgang mit Daten Stichproben: Einfache Zufallsstichprobe: Bei einer einfachen Zufallsstichprobe werden Teilmengen der Grundgesamtheit so erhoben, dass jeder dieser Teilmengen dieselbe Wahrscheinlichkeit besitzt gezogen zu werden. Daraus folgt sofort, dass auch jede Untersuchungseinheit mit derselbe Wahrscheinlichkeit gezogen wird. Die Umkehrung gilt jedoch nicht, d.h. alleine aus der Tatsache, dass jedes Element aus der Grundgesamtheit mit derselben Wahrscheinlichkeit gezogen wird, kann noch nicht auf das Vorliegen einer einfachen Stichprobe geschlossen werden. Um eine einfache Stichprobe ziehen zu können, müssen die Elemente der Grundgesamtheit nummerierbar sein und zumindest theoretisch als Liste vorliegen. Seite 136

12 VII. Praktischer Umgang mit Daten Geschichtete Zufallsstichprobe: Bei geschichteten Zufallsstichproben wird die Grundgesamtheit in sich nicht überlappende Schichten zu zerlegen und anschließend aus jeder Schicht eine einfache Zufallswahl zu ziehen. Dieses Vorgehen ist nicht nur einfacher umzusetzen, sondern führt in der Regel auch zu genaueren Schätzungen für die eigentlich interessierende Größe in der Grundgesamtheit, d.h., dass eine geschichtete Stichprobe häufig informativer ist, als eine einfache Stichprobe. Beispiel: Interessiert das durchschnittliche Einkommen der Bundesbürger, so bietet sich beispielsweise eine Schichtung nach Bildungsgrad, Alter oder nach Berufsfeldern. Seite 137

13 VII. Praktischer Umgang mit Daten Klumpenstichprobe: Bei einer geschichteten Zufallsstichprobe wird die Schichtenbildung künstlich durchgeführt. Bei sogenannten Klumpen hingegen zerfällt die Stichprobe auf natürliche Weise in derartige Schichten (z.b. Gemeinden). Bei einer Klumpenstichprobe wird die praktische Anwendbarkeit weiter erhöht, da aus der Gesamtheit aller Klumpen einige wenige ausgewählt werden, die dann vollständig erfasst werden. Beispiele: Es werden einige wenige Gemeinden zufällig ausgewählt, in denen dann alle Bürger befragt werden. Es werden wenige Tage festgelegt, in denen alle Patienten im Krankenhaus erfasst werden. Bemerkung: Eine solche Erhebung ist nur sinnvoll, wenn die einzelnen Klumpen hinsichtlich der Untersuchungsvariable sehr heterogen sind (also kleine Abbilder der Grundgesamtheit) und die Klumpen untereinander sehr homogen sind. Seite 138

14 VII. Praktischer Umgang mit Daten Mehrstufige Auswahlverfahren: Meistens ist eine direkte Ziehung der Untersuchungseinheiten nur schwer oder gar nicht umzusetzen. Dann muss die Auswahl der eigentlichen Untersuchungseinheiten stufenweise Erfolgen. Beispiel: In der ersten Stufe könnten alle deutschen Städte zugrunde liegen und aus ihnen eine Stichprobe gezogen werden. Im nächsten Schritt können dann aus den gezogenen Städten Schulen ausgewählt werden. Erst im dritten Schritt kann man aus den Schülern dieser Schulen eine Zufallsauswahl treffen. Seite 139

15 VII. Praktischer Umgang mit Daten Bewusstes Auswahlverfahren: Neben der Zufallsstichprobe werden bei Meinungsumfragen häufig Verfahren eingesetzt, denen zwar ein bestimmter Stichprobenplan zugrunde liegt, die aber nicht mehr als zufällig angesehen werden können. Sei werden mit dem Ziel durchgeführt, die Repräsentativität der gezogenen Stichprobe zu erhöhen. Beispiele: Quotenpläne, die die Quoten für verschiedene Merkmale (z.b. Geschlecht) enthalten. Auswahl typischer Fälle, bei der nach subjektiven Kriterien des Verantwortlichen für die Untersuchungseinheiten als typische Vertreter der Grundgesamtheit ausgewählt werden. Seite 140

16 VII. Praktischer Umgang mit Daten Studiendesigns: Querschnittsstudie: Es wird an einer bestimmten Anzahl an Objekten, den statistischen Einheiten, zu einem bestimmten Zeitpunkt ein oder mehrere Merkmale erfasst. Zeitreihe: Es wird ein Objekt hinsichtlich eines Merkmals über einen ganzen Zeitraum hinweg beobachtet. Längsschnittstudie: Es wird eine ganze Gruppe gleichartiger Objekte über einen ganzen Zeitraum hinweg beobachtet. Seite 141

17 VII. Praktischer Umgang mit Daten: Graphische Darstellung von Daten Stamm-Blatt-Diagramm (Steam-leaf display): Das Stamm-Blatt-Diagramm ist eine semigrafische Darstellungsform für metrische Merkmale bei mittlerem Datenumfang. Das Diagramm wird in 2 Schritten erstellt: 1. Teile den Datenbereich in Intervalle gleicher Breite ein. Trage die erste(n) Ziffer(n) der Werte im jeweiligen Intervall links von einer senkrechten Linie der Größe nach geordnet ein. Dies ergibt den Stamm. 2. Runde die beobachteten Werte auf die Stelle, die nach den Ziffern des Stamms kommt. Diese werden zeilenweise, der Größe nach geordnet, rechts vom Stamm eingetragen. Diese Ziffern nennt man Blätter. Stamm-Blatt-Diagramme besitzen den Vorteil, dass sie alle Werte der Stichprobe enthalten und somit einen guten Einblick in die Datenstruktur ermöglichen. Bei großen Datensätzen wird das Diagramm jedoch sehr unübersichtlich. Seite 142

18 VII. Praktischer Umgang mit Daten: Graphische Darstellung von Daten Beispiel: Die folgenden Daten werden beobachtet: Seite 143

19 VII. Praktischer Umgang mit Daten: Graphische Darstellung von Daten Fortsetzung Beispiel: Seite 144

20 VII. Praktischer Umgang mit Daten: Graphische Darstellung von Daten Histogramm: Für große Datensätze ist es zweckmäßig, die Daten zu gruppieren und die resultierende Häufigkeiten der Gruppen in einem Histogramm zu visualisieren. Es wird dabei von einem ordinalskalierten Merkmal ausgegangen, das in vielen Ausprägungen vorliegt. Für die Gruppierung wählt man benachbarte Intervalle. Nun wird das Histogramm so konstruiert, dass die Fläche über den Intervallen gleich oder proportional zu den absoluten bzw. relativen Häufigkeiten ist (Prinzip der Flächentreue). Dazu werden über den Intervallen Rechtecke gezeichnet, mit: Breite: Höhe: gleich (oder proportional zu) Fläche: gleich (oder proportional zu) Seite 145

21 VII. Praktischer Umgang mit Daten: Graphische Darstellung von Daten Falls es möglich und sinnvoll ist, sollten die Klassenbreiten gleichgroß gewählt werden. Dadurch können als Höhe der Rechtecke direkt die absoluten bzw. relative Häufigkeiten verwendet werden. Da die Anzahl der Klassen und damit die Wahl der Klassenbreite den Eindruck über die Daten entschieden beeinflussen kann, existieren Faustregeln für die Zahl der Klassen. Bsp.: Anzahl Klassen: Seite 146

22 VII. Praktischer Umgang mit Daten: Graphische Darstellung von Daten Fortsetzung Beispiel: Seite 147

23 VII. Praktischer Umgang mit Daten: Graphische Darstellung von Daten Beispiel: Histogramme zu 4000 normalverteilten Werten: Seite 148

24 VII. Praktischer Umgang mit Daten: Graphische Darstellung von Daten Das Histogramm ist ein erster Schätzer für die Dichte, der die Daten zugrunde liegen. Der Schätzer ist umso genauer, je kleiner die Intervalle gewählt werden. Grund: Für eine beliebige differenzierbare Verteilungsfunktion gilt: Seite 149

25 VII. Praktischer Umgang mit Daten: Graphische Darstellung von Daten Kerndichteschätzer: Ein Nachteil beim Histogramm besteht darin, dass man als geschätzte Dichte eine unstetige Treppenfunktion in erhält. Über den Kerndichteschätzer erhält man ein rollierendes Histogramm, welches die Dichte in der Umgebung eines jeden abschätzt. Die Grundidee ist dabei die selbe, wie im Histogramm: Der Wert entspricht im Histogramm der Höhe des Rechtecks mit der Breite. Lässt man dieses Rechteck nun über die x-achse gleiten, so erhält man den Graphen des gleitende Histogramms. Dieses gleitende Histogramm lässt sich über ein Rechteckfenster, das mit über die Zahlenachse gleitet wie folgt schreiben:, mit Seite 150

26 VII. Praktischer Umgang mit Daten: Graphische Darstellung von Daten Es werden hier also zunächst für jeden -Wert genau so viele Rechteckshöhen aufaddiert, wie Beobachtungen im Intervall liegen und anschleißend durch die Zahl aller Beobachtungen dividiert. Da hier unstetige Rechteckfenster aufaddiert werden, ergibt sich als Kerndichteschätzer immer noch eine unstetige Treppenfunktion. Um einen stetigen Kerndichteschätzer zu erhalten, muss man an Stelle des unstetigen Rechteckkerns einen stetigen Kern verwenden. Beispiele: Seite 151

27 VII. Praktischer Umgang mit Daten: Graphische Darstellung von Daten Beispiel: Gegeben seien die Beobachtungen: Damit ergibt sich mit dem Rechteckkern der folgende Kerndichteschätzer: Seite 152

28 VII. Praktischer Umgang mit Daten: Graphische Darstellung von Daten Beispiel: Gegeben seien die Beobachtungen: Damit ergibt sich mit dem Rechteckkern der folgende Kerndichteschätzer: Seite 153

29 VII. Praktischer Umgang mit Daten: Graphische Darstellung von Daten Fortsetzung Beispiel: Über den Epanechnikow-Kern erhält man für die Dichte: Seite 154

30 VII. Praktischer Umgang mit Daten: Graphische Darstellung von Daten Fortsetzung Beispiel: Über den Gauß-Kern erhält man für die Dichte: Seite 155

31 VII. Praktischer Umgang mit Daten: Graphische Darstellung von Daten Beispiel: Für die 30 Beobachtungen von vorhin ergibt sich somit als Kerndichteschätzer: Seite 156

32 VII. Praktischer Umgang mit Daten: Graphische Darstellung von Daten Quantile und Box-Plot: Das p%-quantil einer Verteilung trennt die Daten so in zwei Teile, dass p% der Daten darunter und (100-p)% darüber liegen. Der Median ist damit gerade das 50%-Quantil. Quantile und die daraus abgeleiteten Box-Plots als graphische Zusammenfassung sind geeignete Mittel, um die Streuung der Daten zu charakterisieren. Sie sind somit sehr gut zum Vergleich verschiedener Verteilungen geeignet. Mit Hilfe der Box-Plots lässt sich schnell ein Eindruck darüber gewinnen, ob die Beobachtungen z.b. annähernd symmetrisch verteilt sind, oder ob Ausreißer in dem Datensatz auftreten. Seite 157

33 VII. Praktischer Umgang mit Daten: Graphische Darstellung von Daten Ein Box-Plot ist bestimmt durch 1. x 0,25 = Anfang der Schachtel ( box ) x 0,75 x 0,75 -x 0,25 = Ende der Schachtel = Länge der Schachtel 2. Der Median wird durch einen Strich in der Box markiert. 3. Zwei Linien ( whiskers ) außerhalb der Box gehen bis zu x min und x max Seite 158

34 VII. Praktischer Umgang mit Daten: Graphische Darstellung von Daten Beispiel: Seite 159

35 VII. Praktischer Umgang mit Daten: Graphische Darstellung von Daten Über die aufgeführten graphischen Werkzeuge kann man eine Idee davon erhalten, welche Verteilungsfamilien auf den Datensatz passen können und in die nähere Auswahl gezogen werden sollten. Auf den nachfolgenden Seiten findet sich eine Auswahl der wichtigsten Verteilungsfamilien Seite 160

36 VII. Praktischer Umgang mit Daten: Graphische Darstellung von Daten Exkurs: Gammafunktion Seite 161

37 VII. Praktischer Umgang mit Daten: Diskrete Verteilungen Binomialverteilung: Seite 162

38 VII. Praktischer Umgang mit Daten: Diskrete Verteilung Poisson-Verteilung: Seite 163

39 VII. Praktischer Umgang mit Daten: Stetige Verteilungen Beta-Verteilung: Seite 164

40 VII. Praktischer Umgang mit Daten: Stetige Verteilungen Cauchy-Verteilung: Seite 165

41 VII. Praktischer Umgang mit Daten: Stetige Verteilungen Exponentialverteilung: Seite 166

42 VII. Praktischer Umgang mit Daten: Stetige Verteilungen F-Verteilung: Seite 167

43 VII. Praktischer Umgang mit Daten: Stetige Verteilungen Gamma-Verteilung: Seite 168

44 VII. Praktischer Umgang mit Daten: Stetige Verteilungen Log - Normalverteilung: Seite 169

45 VII. Praktischer Umgang mit Daten: Stetige Verteilungen Normalverteilung: Seite 170

46 VII. Praktischer Umgang mit Daten: Stetige Verteilungen Gleichverteilung: Seite 171

47 VII. Praktischer Umgang mit Daten: Stetige Verteilungen Weibull-Verteilung: Seite 172

48 VII. Praktischer Umgang mit Daten: Parameterschätzung Fortsetzung Beispiel: Aus der bisherigen Datenanalyse kann man erkenne, dass wir eine stetige Verteilung benötigen und dass die realisierten Daten ausschließlich positive Werte annehmen (Zufall? Woher kommen die Daten?). Außerdem scheinen Werte nahe Null tendenziell häufiger aufzutreten, als große Werte. Damit kommen von den vorhin aufgeführten Verteilungen die Exponential-, F-, Gamma-, Log-Normal- und Weibull-Verteilung in Frage. Im nächsten Schritt müssen nun die Parameter für diese Verteilungen geschätzt werden, um anschließend testen zu können, durch welche Verteilung die Daten repräsentiert werden können. Seite 173

49 VII. Praktischer Umgang mit Daten: Parameterschätzung Schätzfunktion Eine Schätzfunktion oder Schätzstatistik für einen gesuchten Parameter ist eine Funktion in den Stichprobenvariablen. Der aus den Realisationen resultierende numerische Wert ist der zugehörige Schätzwert. Seite 174

50 VII. Praktischer Umgang mit Daten: Parameterschätzung Maximum Likelihood-Schätzfunktion Sind die Parameter einer Verteilung bekannt, kann über die Dichte die Wahrscheinlichkeit dafür ausgerechnet werden, dass bestimmte Werte realisiert werden. Beispiele: Poisson-Verteilung mit dem Parameter : Normalverteilung mit den Parametern : Seite 175

51 VII. Praktischer Umgang mit Daten: Parameterschätzung Sind die Variablen unabhängig und identisch Verteilt, mit den Parametern, so kann dann die Wahrscheinlichkeit bzw. die Dichte dafür, dass eine bestimmte Kombination an realisierten Werten beobachtet wird wie folgt berechnet werden: Bei der Parameterschätzung sind nun aber nicht die Parameter, sondern Realisationen bekannt. Dabei muss die Dichte dann für die festen Realisationen als Funktion in aufgefasst werden: Bemerkung: Im Folgenden wird das Vektorzeichen zur besseren Übersichtlichkeit weggelassen. Seite 176

52 VII. Praktischer Umgang mit Daten: Parameterschätzung Maximum Likelihood-Schätzfunktion Ansatz: Wähle zu als Parameterschätzung diejenigen Parameter, für die die Likelihood maximal ist, d.h. bzw. Es werden also zu den Beobachtungen diejenigen Parameter gesucht, für welche die Wahrscheinlichkeit (bzw. Dichte), dass grade diese Werte auftreten am größten ist. Anders gesagt: Man sucht zu den Realisationen diejenigen Parameter, welche die plausibelste Erklärung für das Zustandekommen dieser Werte liefern. Seite 177

53 VII. Praktischer Umgang mit Daten: Parameterschätzung In den meisten Fällen kann das Maximum der Likelihood-Funktion über die erste Ableitung bestimmt werden. Da diese Funktion sich aus dem Produkt vieler einzelner Faktoren zusammensetzt, empfiehlt es sich die Likelihood-Funktion vorab zu logarithmieren und die Ableitung der daraus resultierenden Log-Likelihood-Funktion zu betrachten: Seite 178

54 VII. Praktischer Umgang mit Daten: Parameterschätzung Beispiel: Es wird eine Poisson-Verteilung unterstellt und es wurden die Realisationen beobachtet. Seite 179

55 VII. Praktischer Umgang mit Daten: Parameterschätzung Beispiel: Es wird eine Normalverteilung unterstellt und es wurden die Realisationen beobachtet. Seite 180

56 VII. Praktischer Umgang mit Daten: Güte der Anpassung Nachdem die Parameter geschätzt wurden, stellt sich die Frage, ob die angepasste Verteilung wirklich auf die Daten passt. Dazu können zum einen graphische Ansätze verwendet werden, um einen ersten Eindruck über die Qualität der Anpassung zu gewinnen und alternative Verteilungen miteinander zu vergleichen. Die letztendliche Entscheidung über die Annahme / Ablehnung der Verteilungsannahme sollte über einen Test getroffen werden. Seite 181

57 VII. Praktischer Umgang mit Daten: Güte der Anpassung Kerndichteschätzer vs. theoretische Verteilung Zunächst sollte der Verlauf des Kerndichteschätzers, der direkt die beobachteten Häufigkeiten abbildet mit der theoretischen Verteilung verglichen werden. Fortsetzung Beispiel: Seite 182

58 VII. Praktischer Umgang mit Daten: Güte der Anpassung Q-Q-Plot Im Q-Q-Plot werden die theoretischen Quantile den beobachteten Quantilen gegenübergestellt. Dazu werden die Quantile als Punkte der Form (x,y) = (theoretisches Quantil, beobachtetes Quantil) in ein Koordinatensystem abgetragen. Passt die Verteilung auf die Daten, müssten die Punkte in etwa auf der ersten Winkelhalbierenden liegen. Seite 183

59 VII. Praktischer Umgang mit Daten: Güte der Anpassung Fortsetzung Beispiel: Seite 184

60 VII. Praktischer Umgang mit Daten: Güte der Anpassung Kolmogorov-Smirnov-Test Annahmen: Die einzelnen Zufallsvariablen sind identisch und unabhängig Verteilt. Die unbekannte Verteilungsfunktion ist stetig. Nullhypothese: Gegenhypothese: Teststatistik: mit ist die empirische Verteilungsfunktion zu. Die Nullhypothese wird für ein vorgegebenes Signifikanzniveau abgelehnt, wenn, bzw. wenn für den entsprechenden p-wert gilt:. Seite 185

61 VII. Praktischer Umgang mit Daten: Güte der Anpassung Fortsetzung Beispiel: Bei Normalverteilungsannahme ergibt sich ein Wert für die Teststatistik von: KS = 0,1469. Der zugehörige p-wert beträgt: KS = 0,4908. Die Verteilungsannahme kann also nicht verworfen werden. Bei Log-Normalverteilungsannahme ergibt sich ein Wert für die Teststatistik von: KS = 0,1272. Der zugehörige p-wert beträgt: KS = 0,6697. Die Verteilungsannahme kann also ebenfalls nicht verworfen werden. Seite 186

htw saar 1 EINFÜHRUNG IN DIE STATISTIK: BESCHREIBENDE STATISTIK

htw saar 1 EINFÜHRUNG IN DIE STATISTIK: BESCHREIBENDE STATISTIK htw saar 1 EINFÜHRUNG IN DIE STATISTIK: BESCHREIBENDE STATISTIK htw saar 2 Grundbegriffe htw saar 3 Grundgesamtheit und Stichprobe Ziel: Über eine Grundgesamtheit (Population) soll eine Aussage über ein

Mehr

Kreisdiagramm, Tortendiagramm

Kreisdiagramm, Tortendiagramm Kreisdiagramm, Tortendiagramm Darstellung der relativen (absoluten) Häufigkeiten als Fläche eines Kreises Anwendung: Nominale Merkmale Ordinale Merkmale (Problem: Ordnung nicht korrekt wiedergegeben) Gruppierte

Mehr

Statistik. Ludwig Fahrmeir Rita Künstler Iris Pigeot Gerhard Tutz. Der Weg zur Datenanalyse. Springer. Zweite, verbesserte Auflage

Statistik. Ludwig Fahrmeir Rita Künstler Iris Pigeot Gerhard Tutz. Der Weg zur Datenanalyse. Springer. Zweite, verbesserte Auflage Ludwig Fahrmeir Rita Künstler Iris Pigeot Gerhard Tutz Statistik Der Weg zur Datenanalyse Zweite, verbesserte Auflage Mit 165 Abbildungen und 34 Tabellen Springer Inhaltsverzeichnis Vorwort v 1 Einführung

Mehr

Statistische Tests (Signifikanztests)

Statistische Tests (Signifikanztests) Statistische Tests (Signifikanztests) [testing statistical hypothesis] Prüfen und Bewerten von Hypothesen (Annahmen, Vermutungen) über die Verteilungen von Merkmalen in einer Grundgesamtheit (Population)

Mehr

Statistik. Sommersemester Prof. Dr. Stefan Etschberger HSA. für Betriebswirtschaft und International Management

Statistik. Sommersemester Prof. Dr. Stefan Etschberger HSA. für Betriebswirtschaft und International Management Statistik für Betriebswirtschaft und International Management Sommersemester 2014 Prof. Dr. Stefan Etschberger HSA Streuungsparameter Varianz Var(X) bzw. σ 2 : [x i E(X)] 2 f(x i ), wenn X diskret Var(X)

Mehr

Statistisches Testen

Statistisches Testen Statistisches Testen Grundlegendes Prinzip Erwartungswert Bekannte Varianz Unbekannte Varianz Differenzen Anteilswert Chi-Quadrat Tests Gleichheit von Varianzen Prinzip des Statistischen Tests Konfidenzintervall

Mehr

5. Schließende Statistik (Inferenzstatistik, konfirmatorische Verfahren)

5. Schließende Statistik (Inferenzstatistik, konfirmatorische Verfahren) 5. Schließende Statistik (Inferenzstatistik, konfirmatorische Verfahren) 5.1. Einführung Schätzen unbekannter Parameter im Modell, z.b. Wahrscheinlichkeiten p i (Anteile in der Gesamtmenge), Erwartungswerte

Mehr

Statistik II. Statistische Tests. Statistik II

Statistik II. Statistische Tests. Statistik II Statistik II Statistische Tests Statistik II - 12.5.2006 1 Test auf Anteilswert: Binomialtest Sei eine Stichprobe unabhängig, identisch verteilter ZV (i.i.d.). Teile diese Stichprobe in zwei Teilmengen

Mehr

Arbeitsbuch zur deskriptiven und induktiven Statistik

Arbeitsbuch zur deskriptiven und induktiven Statistik Helge Toutenburg Michael Schomaker Malte Wißmann Christian Heumann Arbeitsbuch zur deskriptiven und induktiven Statistik Zweite, aktualisierte und erweiterte Auflage 4ü Springer Inhaltsverzeichnis 1. Grundlagen

Mehr

Einführung in die Statistik

Einführung in die Statistik Einführung in die Statistik Analyse und Modellierung von Daten Von Prof. Dr. Rainer Schlittgen 4., überarbeitete und erweiterte Auflage Fachbereich Materialwissenschaft! der Techn. Hochschule Darmstadt

Mehr

3 Grundlagen statistischer Tests (Kap. 8 IS)

3 Grundlagen statistischer Tests (Kap. 8 IS) 3 Grundlagen statistischer Tests (Kap. 8 IS) 3.1 Beispiel zum Hypothesentest Beispiel: Betrachtet wird eine Abfüllanlage für Mineralwasser mit dem Sollgewicht µ 0 = 1000g und bekannter Standardabweichung

Mehr

Klassifikation von Signifikanztests

Klassifikation von Signifikanztests Klassifikation von Signifikanztests Nach Verteilungsannahmen: verteilungsabhängig: parametrischer [parametric] Test verteilungsunabhängig: nichtparametrischer [non-parametric] Test Bei parametrischen Tests

Mehr

Wichtige Definitionen und Aussagen

Wichtige Definitionen und Aussagen Wichtige Definitionen und Aussagen Zufallsexperiment, Ergebnis, Ereignis: Unter einem Zufallsexperiment verstehen wir einen Vorgang, dessen Ausgänge sich nicht vorhersagen lassen Die möglichen Ausgänge

Mehr

Klassifikation von Signifikanztests

Klassifikation von Signifikanztests Klassifikation von Signifikanztests nach Verteilungsannahmen: verteilungsabhängige = parametrische Tests verteilungsunabhängige = nichtparametrische Tests Bei parametrischen Tests werden im Modell Voraussetzungen

Mehr

Institut für Biometrie und klinische Forschung. WiSe 2012/2013

Institut für Biometrie und klinische Forschung. WiSe 2012/2013 Klinische Forschung WWU Münster Pflichtvorlesung zum Querschnittsfach Epidemiologie, Biometrie und Med. Informatik Praktikum der Medizinischen Biometrie (3) Überblick. Deskriptive Statistik I 2. Deskriptive

Mehr

Konfidenzintervalle Grundlegendes Prinzip Erwartungswert Bekannte Varianz Unbekannte Varianz Anteilswert Differenzen von Erwartungswert Anteilswert

Konfidenzintervalle Grundlegendes Prinzip Erwartungswert Bekannte Varianz Unbekannte Varianz Anteilswert Differenzen von Erwartungswert Anteilswert Konfidenzintervalle Grundlegendes Prinzip Erwartungswert Bekannte Varianz Unbekannte Varianz Anteilswert Differenzen von Erwartungswert Anteilswert Beispiel für Konfidenzintervall Im Prinzip haben wir

Mehr

Mathematische Statistik. Zur Notation

Mathematische Statistik. Zur Notation Mathematische Statistik dient dazu, anhand von Stichproben Informationen zu gewinnen. Während die Wahrscheinlichkeitsrechnung Prognosen über das Eintreten zufälliger (zukünftiger) Ereignisse macht, werden

Mehr

Die Familie der χ 2 (n)-verteilungen

Die Familie der χ 2 (n)-verteilungen Die Familie der χ (n)-verteilungen Sind Z 1,..., Z m für m 1 unabhängig identisch standardnormalverteilte Zufallsvariablen, so genügt die Summe der quadrierten Zufallsvariablen χ := m Z i = Z 1 +... +

Mehr

Statistische Datenanalyse

Statistische Datenanalyse Werner A. Stahel Statistische Datenanalyse Eine Einführung für Naturwissenschaftler 3., durchgesehene Auflage vieweg VII 1 Einleitung 1 1.1 Was ist Statistische Datenanalyse? 1 1.2 Ziele 6 1.3 Hinweise

Mehr

Willkommen zur Vorlesung Statistik (Master)

Willkommen zur Vorlesung Statistik (Master) Willkommen zur Vorlesung Statistik (Master) Thema dieser Vorlesung: Verteilung diskreter Zufallsvariablen Prof. Dr. Wolfgang Ludwig-Mayerhofer Universität Siegen Philosophische Fakultät, Seminar für Sozialwissenschaften

Mehr

SozialwissenschaftlerInnen II

SozialwissenschaftlerInnen II Statistik für SozialwissenschaftlerInnen II Henning Best best@wiso.uni-koeln.de Universität zu Köln Forschungsinstitut für Soziologie Statistik für SozialwissenschaftlerInnen II p.1 Wahrscheinlichkeitsfunktionen

Mehr

Deskriptive Statistik 1 behaftet.

Deskriptive Statistik 1 behaftet. Die Statistik beschäftigt sich mit Massenerscheinungen, bei denen die dahinterstehenden Einzelereignisse meist zufällig sind. Statistik benutzt die Methoden der Wahrscheinlichkeitsrechnung. Fundamentalregeln:

Mehr

Wahrscheinlichkeitsverteilungen

Wahrscheinlichkeitsverteilungen Universität Bielefeld 3. Mai 2005 Wahrscheinlichkeitsrechnung Wahrscheinlichkeitsrechnung Das Ziehen einer Stichprobe ist die Realisierung eines Zufallsexperimentes. Die Wahrscheinlichkeitsrechnung betrachtet

Mehr

Statistik Testverfahren. Heinz Holling Günther Gediga. Bachelorstudium Psychologie. hogrefe.de

Statistik Testverfahren. Heinz Holling Günther Gediga. Bachelorstudium Psychologie. hogrefe.de rbu leh ch s plu psych Heinz Holling Günther Gediga hogrefe.de Bachelorstudium Psychologie Statistik Testverfahren 18 Kapitel 2 i.i.d.-annahme dem unabhängig. Es gilt also die i.i.d.-annahme (i.i.d = independent

Mehr

Chi-Quadrat-Verteilung

Chi-Quadrat-Verteilung Chi-Quadrat-Verteilung Wikipedia http://de.wikipedia.org/wiki/chi-quadrat-verteilung 1 von 7 6/18/2009 6:13 PM Chi-Quadrat-Verteilung aus Wikipedia, der freien Enzyklopädie Die Chi-Quadrat-Verteilung ist

Mehr

Einführung in die Statistik für Wirtschaftswissenschaftler für Betriebswirtschaft und Internationales Management

Einführung in die Statistik für Wirtschaftswissenschaftler für Betriebswirtschaft und Internationales Management Einführung in die Statistik für Wirtschaftswissenschaftler für Betriebswirtschaft und Internationales Management Sommersemester 2013 Hochschule Augsburg Lageparameter: Erwartungswert d) Erwartungswert

Mehr

Statistik und Wahrscheinlichkeitsrechnung

Statistik und Wahrscheinlichkeitsrechnung Statistik und Wahrscheinlichkeitsrechnung 3. Vorlesung Dr. Jochen Köhler 1 Inhalte der heutigen Vorlesung Ziel: Daten Modellbildung Probabilistisches Modell Wahrscheinlichkeit von Ereignissen Im ersten

Mehr

Inhaltsverzeichnis. Robert Galata, Sandro Scheid. Deskriptive und Induktive Statistik für Studierende der BWL. Methoden - Beispiele - Anwendungen

Inhaltsverzeichnis. Robert Galata, Sandro Scheid. Deskriptive und Induktive Statistik für Studierende der BWL. Methoden - Beispiele - Anwendungen Inhaltsverzeichnis Robert Galata, Sandro Scheid Deskriptive und Induktive Statistik für Studierende der BWL Methoden - Beispiele - Anwendungen Herausgegeben von Robert Galata, Markus Wessler ISBN (Buch):

Mehr

Dr. Maike M. Burda. Welchen Einfluss hat die Körperhöhe auf das Körpergewicht? Eine Regressionsanalyse. HU Berlin, Econ Bootcamp 7.-9.

Dr. Maike M. Burda. Welchen Einfluss hat die Körperhöhe auf das Körpergewicht? Eine Regressionsanalyse. HU Berlin, Econ Bootcamp 7.-9. Dr. Maike M. Burda Welchen Einfluss hat die Körperhöhe auf das Körpergewicht? Eine Regressionsanalyse. HU Berlin, Econ Bootcamp 7.-9. Januar 2011 BOOTDATA11.GDT: 250 Beobachtungen für die Variablen...

Mehr

Empirische Verteilungsfunktion

Empirische Verteilungsfunktion Empirische Verteilungsfunktion H(x) := Anzahl der Werte x ist. Deskriptive

Mehr

3 Häufigkeitsverteilungen

3 Häufigkeitsverteilungen 3 Häufigkeitsverteilungen 3.1 Absolute und relative Häufigkeiten 3.2 Klassierung von Daten 3.3 Verteilungsverläufe 3.1 Absolute und relative Häufigkeiten Datenaggregation: Bildung von Häufigkeiten X nominal

Mehr

Kapitel 2. Häufigkeitsverteilungen

Kapitel 2. Häufigkeitsverteilungen 6 Kapitel 2 Häufigkeitsverteilungen Ziel: Darstellung bzw Beschreibung (Exploration) einer Variablen Ausgangssituation: An n Einheiten ω,, ω n sei das Merkmal X beobachtet worden x = X(ω ),, x n = X(ω

Mehr

Schließende Statistik

Schließende Statistik Schließende Statistik [statistical inference] Sollen auf der Basis von empirischen Untersuchungen (Daten) Erkenntnisse gewonnen und Entscheidungen gefällt werden, sind die Methoden der Statistik einzusetzen.

Mehr

2. Deskriptive Statistik

2. Deskriptive Statistik Philipps-Universitat Marburg 2.1 Stichproben und Datentypen Untersuchungseinheiten: mogliche, statistisch zu erfassende Einheiten je Untersuchungseinheit: ein oder mehrere Merkmale oder Variablen beobachten

Mehr

Auswahlverfahren. Zufallsauswahl Bewusste Auswahl Willkürliche Auswahl. Dipl.-Päd. Ivonne Bemerburg

Auswahlverfahren. Zufallsauswahl Bewusste Auswahl Willkürliche Auswahl. Dipl.-Päd. Ivonne Bemerburg Auswahlverfahren Zufallsauswahl Bewusste Auswahl Willkürliche Auswahl Blockseminar: Methoden quantitativer Grundgesamtheit und Stichprobe Die Festlegung einer Menge von Objekten, für die die Aussagen der

Mehr

Einführung in die Statistik

Einführung in die Statistik Einführung in die Statistik Analyse und Modellierung von Daten von Prof. Dr. Rainer Schlittgen Universität Hamburg 12., korrigierte Auflage Oldenbourg Verlag München Inhaltsverzeichnis 1 Statistische Daten

Mehr

1 Einleitung und Grundlagen 1

1 Einleitung und Grundlagen 1 Inhaltsverzeichnis Vorwort vii 1 Einleitung und Grundlagen 1 1.1 Einführende Beispiele 1 1.2 Statistischer Prozess 2 1.3 Grundlagen 2 1.4 Unterscheidung von Merkmalen 3 1.4.1 Skalenniveaus 3 1.4.2 Stetige

Mehr

I Beschreibende Statistik 1

I Beschreibende Statistik 1 Inhaltsverzeichnis Vorwort ix I Beschreibende Statistik 1 Lernziele zu Teil I 2 1 Statistik, Daten und statistische Methoden 3 1.1 Statistik im Alltag, in Politik und Gesellschaft...... 3 1.2 Aufgaben

Mehr

Statistik II. IV. Hypothesentests. Martin Huber

Statistik II. IV. Hypothesentests. Martin Huber Statistik II IV. Hypothesentests Martin Huber 1 / 22 Übersicht Weitere Hypothesentests in der Statistik 1-Stichproben-Mittelwert-Tests 1-Stichproben-Varianz-Tests 2-Stichproben-Tests Kolmogorov-Smirnov-Test

Mehr

Statistik und Wahrscheinlichkeitsrechnung

Statistik und Wahrscheinlichkeitsrechnung Statistik und Wahrscheinlichkeitsrechnung Dr. Jochen Köhler 1 Inhalt der heutigen Vorlesung Statistik und Wahrscheinlichkeitsrechnung Zusammenfassung der vorherigen Vorlesung Übersicht über Schätzung und

Mehr

Standardisierte Vorgehensweisen und Regeln zur Gewährleistung von: Eindeutigkeit Schlussfolgerungen aus empirischen Befunden sind nur dann zwingend

Standardisierte Vorgehensweisen und Regeln zur Gewährleistung von: Eindeutigkeit Schlussfolgerungen aus empirischen Befunden sind nur dann zwingend Standardisierte Vorgehensweisen und Regeln zur Gewährleistung von: Eindeutigkeit Schlussfolgerungen aus empirischen Befunden sind nur dann zwingend oder eindeutig, wenn keine alternativen Interpretationsmöglichkeiten

Mehr

Vorlesung: Statistik II für Wirtschaftswissenschaft

Vorlesung: Statistik II für Wirtschaftswissenschaft Vorlesung: Statistik II für Wirtschaftswissenschaft Prof. Dr. Helmut Küchenhoff Institut für Statistik, LMU München Sommersemester 2017 Einführung 1 Wahrscheinlichkeit: Definition und Interpretation 2

Mehr

Zusammenfassung Mathe II. Themenschwerpunkt 2: Stochastik (ean) 1. Ein- und mehrstufige Zufallsexperimente; Ergebnismengen

Zusammenfassung Mathe II. Themenschwerpunkt 2: Stochastik (ean) 1. Ein- und mehrstufige Zufallsexperimente; Ergebnismengen Zusammenfassung Mathe II Themenschwerpunkt 2: Stochastik (ean) 1. Ein- und mehrstufige Zufallsexperimente; Ergebnismengen Zufallsexperiment: Ein Vorgang, bei dem mindestens zwei Ereignisse möglich sind

Mehr

Mathematik für Biologen

Mathematik für Biologen Mathematik für Biologen Prof. Dr. Rüdiger W. Braun Heinrich-Heine Universität Düsseldorf 14. Oktober 2010 Übungen Aufgabenblatt 1 wird heute Nachmittag auf das Weblog gestellt. Geben Sie die Lösungen dieser

Mehr

Ermitteln Sie auf 2 Dezimalstellen genau die folgenden Kenngrößen der bivariaten Verteilung der Merkmale Weite und Zeit:

Ermitteln Sie auf 2 Dezimalstellen genau die folgenden Kenngrößen der bivariaten Verteilung der Merkmale Weite und Zeit: 1. Welche der folgenden Kenngrößen, Statistiken bzw. Grafiken sind zur Beschreibung der Werteverteilung des Merkmals Konfessionszugehörigkeit sinnvoll einsetzbar? A. Der Modalwert. B. Der Median. C. Das

Mehr

Statistische Tests. Kapitel Grundbegriffe. Wir betrachten wieder ein parametrisches Modell {P θ : θ Θ} und eine zugehörige Zufallsstichprobe

Statistische Tests. Kapitel Grundbegriffe. Wir betrachten wieder ein parametrisches Modell {P θ : θ Θ} und eine zugehörige Zufallsstichprobe Kapitel 4 Statistische Tests 4.1 Grundbegriffe Wir betrachten wieder ein parametrisches Modell {P θ : θ Θ} und eine zugehörige Zufallsstichprobe X 1,..., X n. Wir wollen nun die Beobachtung der X 1,...,

Mehr

2 Häufigkeitsverteilungen

2 Häufigkeitsverteilungen 2 Häufigkeitsverteilungen Ziel: Darstellung bzw Beschreibung (Exploration) einer Variablen Ausgangssituation An n Einheiten ω 1,,ω n sei das Merkmal X beobachtet worden x 1 = X(ω 1 ),,x n = X(ω n ) Also

Mehr

Zufallsvariablen. Diskret. Stetig. Verteilung der Stichprobenkennzahlen. Binomial Hypergeometrisch Poisson. Normal Lognormal Exponential

Zufallsvariablen. Diskret. Stetig. Verteilung der Stichprobenkennzahlen. Binomial Hypergeometrisch Poisson. Normal Lognormal Exponential Zufallsvariablen Diskret Binomial Hypergeometrisch Poisson Stetig Normal Lognormal Exponential Verteilung der Stichprobenkennzahlen Zufallsvariable Erinnerung: Merkmal, Merkmalsausprägung Deskriptive Statistik:

Mehr

2.3 Intervallschätzung

2.3 Intervallschätzung 2.3.1 Motivation und Hinführung Bsp. 2.11. [Wahlumfrage] Der wahre Anteil der rot-grün Wähler 2009 war genau 33.7%. Wie groß ist die Wahrscheinlichkeit, in einer Zufallsstichprobe von 1000 Personen genau

Mehr

Grundlagen der Biometrie in Agrarwissenschaften / Ernährungswissenschaften

Grundlagen der Biometrie in Agrarwissenschaften / Ernährungswissenschaften Grundlagen der Biometrie in Agrarwissenschaften / Ernährungswissenschaften Dr. Antje Kiesel Institut für Angewandte Mathematik WS 2011/2012 Grundlagen der Biometrie, WS 2011/12 Vorlesung: Dienstag 8.15-9.45,

Mehr

Lösungen zu Übungsblatt 9 Höhere Mathematik2/Stochastik 2 Master KI/PI

Lösungen zu Übungsblatt 9 Höhere Mathematik2/Stochastik 2 Master KI/PI Lösungen zu Übungsblatt 9 Höhere Mathematik/Stochastik Anpassung von Verteilungen Zu Aufgabe ) a) Zeichnen des Histogranmmes: Um das Histogramm zu zeichnen, benötigen wir die Höhe der Balken. Die Höhe

Mehr

DWT 2.1 Maximum-Likelihood-Prinzip zur Konstruktion von Schätzvariablen 330/467 Ernst W. Mayr

DWT 2.1 Maximum-Likelihood-Prinzip zur Konstruktion von Schätzvariablen 330/467 Ernst W. Mayr 2.1 Maximum-Likelihood-Prinzip zur Konstruktion von Schätzvariablen Wir betrachten nun ein Verfahren zur Konstruktion von Schätzvariablen für Parameter von Verteilungen. Sei X = (X 1,..., X n ). Bei X

Mehr

T-Test für den Zweistichprobenfall

T-Test für den Zweistichprobenfall T-Test für den Zweistichprobenfall t-test (unbekannte, gleiche Varianzen) Test auf Lageunterschied zweier normalverteilter Grundgesamtheiten mit unbekannten, aber gleichen Varianzen durch Vergleich der

Mehr

Statistische Methoden in den Umweltwissenschaften

Statistische Methoden in den Umweltwissenschaften Statistische Methoden in den Umweltwissenschaften Stetige und diskrete Wahrscheinlichkeitsverteilungen Lageparameter Streuungsparameter Diskrete und stetige Zufallsvariablen Eine Variable (oder Merkmal

Mehr

Forschungsstatistik I

Forschungsstatistik I Prof. Dr. G. Meinhardt 6. Stock, Taubertsberg 2 R. 06-206 (Persike) R. 06-214 (Meinhardt) Sprechstunde jederzeit nach Vereinbarung Forschungsstatistik I Dr. Malte Persike persike@uni-mainz.de http://psymet03.sowi.uni-mainz.de/

Mehr

Statistik II. Weitere Statistische Tests. Statistik II

Statistik II. Weitere Statistische Tests. Statistik II Statistik II Weitere Statistische Tests Statistik II - 19.5.2006 1 Überblick Bisher wurden die Test immer anhand einer Stichprobe durchgeführt Jetzt wollen wir die statistischen Eigenschaften von zwei

Mehr

Statistik I für Betriebswirte Vorlesung 14

Statistik I für Betriebswirte Vorlesung 14 Statistik I für Betriebswirte Vorlesung 14 Dr. Andreas Wünsche TU Bergakademie Freiberg Institut für Stochastik 13. Juli 017 Dr. Andreas Wünsche Statistik I für Betriebswirte Vorlesung 14 Version: 8. Juli

Mehr

Modellanpassung und Parameterschätzung. A: Übungsaufgaben

Modellanpassung und Parameterschätzung. A: Übungsaufgaben 7 Modellanpassung und Parameterschätzung 1 Kapitel 7: Modellanpassung und Parameterschätzung A: Übungsaufgaben [ 1 ] Bei n unabhängigen Wiederholungen eines Bernoulli-Experiments sei π die Wahrscheinlichkeit

Mehr

Mathematik für Biologen

Mathematik für Biologen Mathematik für Biologen Prof. Dr. Rüdiger W. Braun Heinrich-Heine Universität Düsseldorf 13. Januar 2010 Termine Letzte Vorlesung am 28.01.2010 Letzte Übung am 27.01.2010, und zwar für alle Anfangsbuchstaben

Mehr

Grundlagen der Statistik

Grundlagen der Statistik www.nwb.de NWB Studium Betriebswirtschaft Grundlagen der Statistik Band 2: Wahrscheinlichkeitsrechnung und induktive Statistik Von Professor Dr. Jochen Schwarze 9., vollständig überarbeitete Auflage STUDIUM

Mehr

Klausur zur Vorlesung

Klausur zur Vorlesung Institut für Mathematische Stochastik WS 2006/2007 Universität Karlsruhe 12. Februar 2007 Priv.-Doz. Dr. D. Kadelka Dipl.-Math. W. Lao Aufgabe 1 (15 Punkte) Klausur zur Vorlesung Statistik für Biologen

Mehr

Fit for Abi & Study Stochastik

Fit for Abi & Study Stochastik Fit for Abi & Study Stochastik Prof. Dr. Tilla Schade Hochschule Harz 15. und 16. April 2014 No. 1 Stochastik besteht aus: Wahrscheinlichkeitsrechnung Statistik No. 2 Gliederung Grundlagen Zufallsgrößen

Mehr

Zufallsvariablen [random variable]

Zufallsvariablen [random variable] Zufallsvariablen [random variable] Eine Zufallsvariable (Zufallsgröße) X beschreibt (kodiert) die Versuchsausgänge ω Ω mit Hilfe von Zahlen, d.h. X ist eine Funktion X : Ω R ω X(ω) Zufallsvariablen werden

Mehr

Klausur zur Vorlesung

Klausur zur Vorlesung Institut für Mathematische Stochastik WS 2004/2005 Universität Karlsruhe 14. Februar 2005 Dr. Bernhard Klar Sebastian Müller Aufgabe 1: (15 Punkte) Klausur zur Vorlesung Statistik für Biologen Musterlösungen

Mehr

Verteilungen eindimensionaler stetiger Zufallsvariablen Stetige Verteilungen. Chi-Quadrat-Verteilung Studentverteilung Fisher-Verteilung

Verteilungen eindimensionaler stetiger Zufallsvariablen Stetige Verteilungen. Chi-Quadrat-Verteilung Studentverteilung Fisher-Verteilung Verteilungen eindimensionaler stetiger Zufallsvariablen Stetige Verteilungen Chi-Quadrat-Verteilung Studentverteilung Fisher-Verteilung Typisierung der stetigen theoretischen Verteilungen Bibliografie:

Mehr

Beispiel 6 (Einige Aufgaben zur Gleichverteilung)

Beispiel 6 (Einige Aufgaben zur Gleichverteilung) Beispiel 6 (Einige Aufgaben zur Gleichverteilung) Aufgabe (Anwendung der Chebyshev-Ungleichung) Sei X eine Zufallsvariable mit E(X) = µ und var(x) = σ a) Schätzen Sie die Wahrscheinlichkeit dafür, daß

Mehr

Willkommen zur Vorlesung Statistik (Master)

Willkommen zur Vorlesung Statistik (Master) Willkommen zur Vorlesung Statistik (Master) Thema dieser Vorlesung: Verteilung diskreter Zufallsvariablen Prof. Dr. Wolfgang Ludwig-Mayerhofer Universität Siegen Philosophische Fakultät, Seminar für Sozialwissenschaften

Mehr

Statistik. Von Dr. Günter Bamberg. o. Professor für Statistik und Dr. habil. Franz Baur. Universität Augsburg. 12., überarbeitete Auflage

Statistik. Von Dr. Günter Bamberg. o. Professor für Statistik und Dr. habil. Franz Baur. Universität Augsburg. 12., überarbeitete Auflage Statistik Von Dr. Günter Bamberg o. Professor für Statistik und Dr. habil. Franz Baur Universität Augsburg 12., überarbeitete Auflage R.01denbourg Verlag München Wien V INHALTSVERZEICHNIS Vorwort Liste

Mehr

Biomathematik für Mediziner, Klausur SS 2000 Seite 1

Biomathematik für Mediziner, Klausur SS 2000 Seite 1 Biomathematik für Mediziner, Klausur SS 2000 Seite 1 Aufgabe 1: Bei der Diagnose einer bestimmten Krankheit mit einem speziellen Diagnoseverfahren werden Patienten, die tatsächlich an der Krankheit leiden,

Mehr

4. Schließende Statistik (Inferenzstatistik, konfirmatorische Verfahren)

4. Schließende Statistik (Inferenzstatistik, konfirmatorische Verfahren) 4. Schließende Statistik (Inferenzstatistik, konfirmatorische Verfahren) 4.1. Einführung Schätzen unbekannter Parameter im Modell, z.b. Wahrscheinlichkeiten p i (Anteile in der Gesamtmenge), Erwartungswerte

Mehr

Ein- und Zweistichprobentests

Ein- und Zweistichprobentests (c) Projekt Neue Statistik 2003 - Lernmodul: Ein- Zweistichprobentests Ein- Zweistichprobentests Worum geht es in diesem Modul? Wiederholung: allgemeines Ablaufschema eines Tests Allgemeine Voraussetzungen

Mehr

4.1. Nullhypothese, Gegenhypothese und Entscheidung

4.1. Nullhypothese, Gegenhypothese und Entscheidung rof. Dr. Roland Füss Statistik II SS 8 4. Testtheorie 4.. Nullhypothese, Gegenhypothese und Entscheidung ypothesen Annahmen über die Verteilung oder über einzelne arameter der Verteilung eines Merkmals

Mehr

3. Merkmale und Daten

3. Merkmale und Daten 3. Merkmale und Daten Ziel dieses Kapitels: Vermittlung des statistischen Grundvokabulars Zu klärende Begriffe: Grundgesamtheit Merkmale (Skalenniveau etc.) Stichprobe 46 3.1 Grundgesamtheiten Definition

Mehr

5. Auswahlverfahren für Stichprobenelemente

5. Auswahlverfahren für Stichprobenelemente Grundlagen Uneingeschränkte Zufallsauswahl (z.b. Roulette, Würfeln) Zufallszahlen müssen eine vorgegebene Verteilung erfüllen (Gleichverteilung) Zufallszahlen müssen zufällig aufeinander folgen (keine

Mehr

Kapitel XIV - Anpassungstests

Kapitel XIV - Anpassungstests Institut für Volkswirtschaftslehre (ECON) Lehrstuhl für Ökonometrie und Statistik Kapitel XIV - Anpassungstests Induktive Statistik Prof. Dr. W.-D. Heller Hartwig Senska Carlo Siebenschuh 2. Grundannahme:

Mehr

Inhaltsverzeichnis Inhaltsverzeichnis VII Erst mal locker bleiben: Es f angt ganz einfach an! Keine Taten ohne Daten!

Inhaltsverzeichnis Inhaltsverzeichnis VII Erst mal locker bleiben: Es f angt ganz einfach an! Keine Taten ohne Daten! Inhaltsverzeichnis Inhaltsverzeichnis VII 1 Erst mal locker bleiben: Es fängt ganz einfach an! 1 1.1 Subjektive Wahrscheinlichkeit - oder warum...?..... 4 1.2 Was Ethik mit Statistik zu tun hat - Pinocchio

Mehr

Das (multiple) Bestimmtheitsmaß R 2. Beispiel: Ausgaben in Abhängigkeit vom Einkommen (I) Parameterschätzer im einfachen linearen Regressionsmodell

Das (multiple) Bestimmtheitsmaß R 2. Beispiel: Ausgaben in Abhängigkeit vom Einkommen (I) Parameterschätzer im einfachen linearen Regressionsmodell 1 Lineare Regression Parameterschätzung 13 Im einfachen linearen Regressionsmodell sind also neben σ ) insbesondere β 1 und β Parameter, deren Schätzung für die Quantifizierung des linearen Zusammenhangs

Mehr

Statistik III. Walter Zucchini Fred Böker Andreas Stadie

Statistik III. Walter Zucchini Fred Böker Andreas Stadie Statistik III Walter Zucchini Fred Böker Andreas Stadie Inhaltsverzeichnis 1 Zufallsvariablen und ihre Verteilung 1 1.1 Diskrete Zufallsvariablen........................... 1 1.2 Stetige Zufallsvariablen............................

Mehr

3 Häufigkeitsverteilungen

3 Häufigkeitsverteilungen 3 Häufigkeitsverteilungen 3.1 Absolute und relative Häufigkeiten 3.2 Klassierung von Daten 3.3 Verteilungsverläufe 3.1 Absolute und relative Häufigkeiten Datenaggregation: Bildung von Häufigkeiten X nominal

Mehr

Nachklausur zur Vorlesung. Statistik für Studierende der Biologie

Nachklausur zur Vorlesung. Statistik für Studierende der Biologie Institut für Mathematische Stochastik WS 1999/2000 Universität Karlsruhe 11. Mai 2000 Dr. Bernhard Klar Nachklausur zur Vorlesung Statistik für Studierende der Biologie Bearbeitungszeit: 90 Minuten Name:

Mehr

Deskription, Statistische Testverfahren und Regression. Seminar: Planung und Auswertung klinischer und experimenteller Studien

Deskription, Statistische Testverfahren und Regression. Seminar: Planung und Auswertung klinischer und experimenteller Studien Deskription, Statistische Testverfahren und Regression Seminar: Planung und Auswertung klinischer und experimenteller Studien Deskriptive Statistik Deskriptive Statistik: beschreibende Statistik, empirische

Mehr

Bereiche der Statistik

Bereiche der Statistik Bereiche der Statistik Deskriptive / Exploratorische Statistik Schließende Statistik Schließende Statistik Inferenz-Statistik (analytische, schließende oder konfirmatorische Statistik) baut auf der beschreibenden

Mehr

Warum Stichproben? Vollerhebungen sind teuer Nehmen (zu)viel Zeit in Anspruch Sind evtl. destruktiv

Warum Stichproben? Vollerhebungen sind teuer Nehmen (zu)viel Zeit in Anspruch Sind evtl. destruktiv Warum Stichproben? Vollerhebungen sind teuer Nehmen (zu)viel Zeit in Anspruch Sind evtl. destruktiv Voraussetzung für die Anwendung von Stichproben: Stichproben müssen repräsentativ sein, d.h. ein verkleinertes

Mehr

Kapitel 3 Schließende Statistik

Kapitel 3 Schließende Statistik Motivation Grundgesamtheit mit unbekannter Verteilung F Stichprobe X 1,...,X n mit Verteilung F Realisation x 1,...,x n der Stichprobe Rückschluss auf F Dr. Karsten Webel 160 Motivation (Fortsetzung) Kapitel

Mehr

Inhaltsverzeichnis. Inhalt Teil I: Beschreibende (Deskriptive) Statistik Seite. 1.0 Erste Begriffsbildungen Merkmale und Skalen 5

Inhaltsverzeichnis. Inhalt Teil I: Beschreibende (Deskriptive) Statistik Seite. 1.0 Erste Begriffsbildungen Merkmale und Skalen 5 Inhaltsverzeichnis Inhalt Teil I: Beschreibende (Deskriptive) Statistik Seite 1.0 Erste Begriffsbildungen 1 1.1 Merkmale und Skalen 5 1.2 Von der Urliste zu Häufigkeitsverteilungen 9 1.2.0 Erste Ordnung

Mehr

Biomathematik für Mediziner, Klausur WS 1999/2000 Seite 1

Biomathematik für Mediziner, Klausur WS 1999/2000 Seite 1 Biomathematik für Mediziner, Klausur WS 1999/2000 Seite 1 Aufgabe 1: Wieviele der folgenden Variablen sind quantitativ stetig? Schulnoten, Familienstand, Religion, Steuerklasse, Alter, Reaktionszeit, Fahrzeit,

Mehr

Statistik. Datenanalyse mit EXCEL und SPSS. R.01denbourg Verlag München Wien. Von Prof. Dr. Karlheinz Zwerenz. 3., überarbeitete Auflage

Statistik. Datenanalyse mit EXCEL und SPSS. R.01denbourg Verlag München Wien. Von Prof. Dr. Karlheinz Zwerenz. 3., überarbeitete Auflage Statistik Datenanalyse mit EXCEL und SPSS Von Prof. Dr. Karlheinz Zwerenz 3., überarbeitete Auflage R.01denbourg Verlag München Wien Inhalt Vorwort Hinweise zu EXCEL und SPSS Hinweise zum Master-Projekt

Mehr

5. Stichproben und Statistiken

5. Stichproben und Statistiken 5. Stichproben und Statistiken Problem: Es sei X eine ZV, die einen interessierenden Zufallsvorgang repräsentiere Man möchte die tatsächliche Verteilung von X kennenlernen (z.b. mittels der VF F X (x)

Mehr

Parametrische vs. Non-Parametrische Testverfahren

Parametrische vs. Non-Parametrische Testverfahren Parametrische vs. Non-Parametrische Testverfahren Parametrische Verfahren haben die Besonderheit, dass sie auf Annahmen zur Verteilung der Messwerte in der Population beruhen: die Messwerte sollten einer

Mehr

6. Schätzverfahren für Parameter

6. Schätzverfahren für Parameter 6. Schätzverfahren für Parameter Ausgangssituation: Ein interessierender Zufallsvorgang werde durch die ZV X repräsentiert X habe eine unbekannte Verteilungsfunktion F X (x) Wir interessieren uns für einen

Mehr

Mathematik IV für Maschinenbau und Informatik (Stochastik) Universität Rostock, Institut für Mathematik Sommersemester 2007

Mathematik IV für Maschinenbau und Informatik (Stochastik) Universität Rostock, Institut für Mathematik Sommersemester 2007 Mathematik IV für Maschinenbau und Informatik Stochastik Universität Rostock, Institut für Mathematik Sommersemester 007 Prof. Dr. F. Liese Dipl.-Math. M. Helwich Serie Termin: 9. Juni 007 Aufgabe 3 Punkte

Mehr

Dr. Maike M. Burda. Welchen Einfluss hat die Körperhöhe auf das Körpergewicht? Eine Regressionsanalyse. HU Berlin, Econ Bootcamp

Dr. Maike M. Burda. Welchen Einfluss hat die Körperhöhe auf das Körpergewicht? Eine Regressionsanalyse. HU Berlin, Econ Bootcamp Dr. Maike M. Burda Welchen Einfluss hat die Körperhöhe auf das Körpergewicht? Eine Regressionsanalyse. HU Berlin, Econ Bootcamp 8.-10. Januar 2010 BOOTDATA.GDT: 250 Beobachtungen für die Variablen... cm:

Mehr

Mathematik für Biologen

Mathematik für Biologen Mathematik für Biologen Prof. Dr. Rüdiger W. Braun Heinrich-Heine-Universität Düsseldorf 25. Januar 2013 1 Der χ 2 -Anpassungstest 2 Exakter Test nach Fisher Mendelsche Erbregeln als Beispiel für mehr

Mehr

Statistik. Prof. em. Dr. Dr. h.c. Günter Bamberg PD Dr. Franz Baur Prof. Dr.Michael Krapp. 17., überarbeitete Auflage. Oldenbourg Verlag München.

Statistik. Prof. em. Dr. Dr. h.c. Günter Bamberg PD Dr. Franz Baur Prof. Dr.Michael Krapp. 17., überarbeitete Auflage. Oldenbourg Verlag München. Statistik von Prof. em. Dr. Dr. h.c. Günter Bamberg PD Dr. Franz Baur Prof. Dr.Michael Krapp 17., überarbeitete Auflage Oldenbourg Verlag München Inhaltsverzeichnis Vorwort Liste wichtiger Symbole IX XI

Mehr

Exponentialverteilung

Exponentialverteilung Exponentialverteilung Dauer von kontinuierlichen Vorgängen (Wartezeiten; Funktionszeiten technischer Geräte) Grenzübergang von der geometrischen Verteilung Pro Zeiteinheit sei die Eintrittswahrscheinlichkeit

Mehr

Philipp Sibbertsen Hartmut Lehne. Statistik. Einführung für Wirtschafts- und. Sozialwissenschaftler. 2., überarbeitete Auflage. 4^ Springer Gabler

Philipp Sibbertsen Hartmut Lehne. Statistik. Einführung für Wirtschafts- und. Sozialwissenschaftler. 2., überarbeitete Auflage. 4^ Springer Gabler Philipp Sibbertsen Hartmut Lehne Statistik Einführung für Wirtschafts- und Sozialwissenschaftler 2., überarbeitete Auflage 4^ Springer Gabler Inhaltsverzeichnis Teil I Deskriptive Statistik 1 Einführung

Mehr

Einführung in die computergestützte Datenanalyse

Einführung in die computergestützte Datenanalyse Karlheinz Zwerenz Statistik Einführung in die computergestützte Datenanalyse 6., überarbeitete Auflage DE GRUYTER OLDENBOURG Vorwort Hinweise zu EXCEL und SPSS Hinweise zum Master-Projekt XI XII XII TEIL

Mehr

Statistik I für Betriebswirte Vorlesung 9

Statistik I für Betriebswirte Vorlesung 9 Statistik I für Betriebswirte Vorlesung 9 Dr. Andreas Wünsche TU Bergakademie Freiberg Institut für Stochastik Vorlesung am 8. Juni 2017 im Audi-Max (AUD-1001) Dr. Andreas Wünsche Statistik I für Betriebswirte

Mehr

Ablaufschema beim Testen

Ablaufschema beim Testen Ablaufschema beim Testen Schritt 1 Schritt 2 Schritt 3 Schritt 4 Schritt 5 Schritt 6 Schritt 7 Schritt 8 Schritt 9 Starten Sie die : Flashanimation ' Animation Ablaufschema Testen ' siehe Online-Version

Mehr

Statistik. Datenanalyse mit EXCEL und SPSS. Prof. Dr. Karlheinz Zwerenz. R.Oldenbourg Verlag München Wien. Von

Statistik. Datenanalyse mit EXCEL und SPSS. Prof. Dr. Karlheinz Zwerenz. R.Oldenbourg Verlag München Wien. Von Statistik Datenanalyse mit EXCEL und SPSS Von Prof. Dr. Karlheinz Zwerenz R.Oldenbourg Verlag München Wien Inhalt Vorwort Hinweise zu EXCEL und SPSS Hinweise zum Master-Projekt XI XII XII TEIL I GRUNDLAGEN

Mehr