VII.Praktischer Umgang mit Daten
|
|
- Arwed Kurzmann
- vor 7 Jahren
- Abrufe
Transkript
1 Gliederung I. Motivation II. III. IV. Lesen mathematischer Symbole Wissenschaftliche Argumentation Matrizenrechnung V. Metriken VI. Algorithmen VII.Praktischer Umgang mit Daten Seite 126
2 VII. Praktischer Umgang mit Daten Datenanalyse: Bei der Analyse von Daten lassen sich in 3 Grundaufgaben der Statistik unterscheiden: Deskription: Die deskriptive Statistik dient zur Beschreibung und graphischen Aufbereitung von Daten (besonders bei großen Datenmengen). Sie umfasst 1.) die Darstellung und Verdichtung von Daten in Grafiken (Diagramme & Verlaufskurven) Tabellen Kenngrößen (Mittelwert, Streuung, etc.) 2.) die Datenvalidierung 3.) die Gewinnung erster Eindrücke oder Ideen zur weiteren Analyse Seite 127
3 VII. Praktischer Umgang mit Daten Exploration: Die Exploration baut auf der deskriptiven Analyse auf. Über die Darstellung der Daten hinaus befasst sie sich mit der Suche nach Strukturen und Besonderheiten in den Daten. Sie kann richtungweisend sein, wenn die Fragestellung nicht genau definiert ist und bei der Wahl eines geeigneten Modells helfen. Darüber hinaus kann die Exploration empirische Evidenz für bestimmte Tatsachen oder Forschungshypothesen liefern. Induktion: Grundsätzlich lässt sich die induktive Statistik in die Bereiche der Schätz- und Testprobleme unterteilen: 1.) Bei Schätzproblemen ist die Aufgabe, Parameter aus den gemessenen Daten zu schätzen (z.b. den Erwartungswert der zugrundeliegenden Verteilung). 2.) Bei Testproblemen überprüft man, ob eine bestimmte Behauptung (z.b. dass der Erwartungswert der Verteilung, der den Daten zugrunde liegt, einen bestimmten Wert annimmt) von den Daten unterstützt wird. Seite 128
4 VII. Praktischer Umgang mit Daten Elementare Grundbegriffe: Statistische Einheit: Objekt, an denen interessierende Größen erfasst werden. Grundgesamtheit: Menge aller für die Fragestellung relevanten statistischen Einheiten. Teilgesamtheit: Teilmenge der Grundgesamtheit. Stichprobe: Tatsächlich untersuchte Teilmenge der Grundgesamtheit. Markmale: Interessierende Größen (= Variablen). Merkmalsausprägung: Konkreter Wert des Merkmals für eine bestimmte statistische Einheit. Seite 129
5 VII. Praktischer Umgang mit Daten Seite 130
6 VII. Praktischer Umgang mit Daten Statistische Einheit: Mensa in Saarbrücken, Unigelände. Grundgesamtheit: Menge aller Mensen, die es weltweit gibt. Teilgesamtheit: Menge aller deutschen Uni-Mensen. Stichprobe: Menge aller Uni-Mensen, für die genug Stimmen abgegeben werden. Markmale: Freundlichkeit, Auswahl, Service, Atmosphäre, Geschmack, Wohnort. Merkmalsausprägung: Freundlichkeit(SB,1) = 5Tabletts, Auswahl(SB,1) = 4Tabletts, etc. Seite 131
7 VII. Praktischer Umgang mit Daten Merkmalstypen diskret: endlich oder abzählbar unendlich viele Ausprägungen stetig: alle Werte eines Intervalls sind mögliche Ausprägungen (überabzählbar unendlich viele Ausprägungen) nominalskaliert: ordinalskaliert: intervallskaliert: Ausprägungen sind Namen, keine Ordnung möglich Ausprägungen können geordnet, Abstände aber nicht interpretiert werden Ausprägungen sind Zahlen, Interpretation der Abstände möglich verhältnisskaliert:ausprägungen besitzen sinnvollen absoluten Nullpunkt qualitativ: endlich viele Ausprägungen, höchstens ordinalskaliert quantitativ: Ausprägungen geben Intensität wieder Seite 132
8 VII. Praktischer Umgang mit Daten Beispiele: Alter: Name: Geschlecht: Einkommen: Temperatur (in Kelvin): diskret, intervallskaliert, quantitativ diskret, nominalskaliert, qualitativ diskret, nominalskaliert, qualitativ stetig (oder diskret), verhältnisskaliert, quantitativ stetig, verhältnisskaliert, quantitativ Anzahl Tabletts bei Mensaumfrage: diskret, ordinalskaliert, qualitativ Benzinverbrauch in Liter: stetig, verhältnisskaliert, quantitativ Seite 133
9 VII. Praktischer Umgang mit Daten Versuchsplan: Erfasst man Merkmale, um eine bestimmte Fragestellung zu untersuchen, so ist dafür die Erstellung eines Versuchsplans erforderlich. Dieser Versuchsplan muss festhalten 1.) welches Ziel mit dem Experiment oder welche Studie verfolgt wird, 2.) wie dieses Ziel erreicht werden kann, 3.) welche statistischen Methoden geeignet sind, um die erzielten Resultate statistisch zu manifestieren. Es muss vor dem Erheben der Stichprobe festgelegt werden, wie groß der Stichprobenumfang zu sein hat, um eine gewünschte Präzision zu erreichen. Außerdem ist zu bestimmen, welche Erhebungsart geeignet ist, um diese Stichprobe zu ziehen. Seite 134
10 VII. Praktischer Umgang mit Daten Bemerkung: Sind die interessierenden Daten bereits vorhanden (z.b. Verkaufszahlen eines Unternehmens), spricht man beim Ziehen einer Stichprobe von einer Erhebung. Wird die Erhebung speziell in Hinblick auf die aktuelle Fragestellung ausgeführt, spricht man von einer primärstatistischen Erhebung. Wird auf bereits vorhandene Originaldaten zurückgegriffen, bezeichnet man dies als sekundärstatistische Erhebung. Stehen nur bereits transformierte oder komprimierte Daten zur Verfügung, nennt man dies eine tertiärstatistische Erhebung. Müssen die Daten erst in geeigneter Weise Erzeugt werden (z.b. in einer Klinischen Studie), spricht man von Experiment. Seite 135
11 VII. Praktischer Umgang mit Daten Stichproben: Einfache Zufallsstichprobe: Bei einer einfachen Zufallsstichprobe werden Teilmengen der Grundgesamtheit so erhoben, dass jeder dieser Teilmengen dieselbe Wahrscheinlichkeit besitzt gezogen zu werden. Daraus folgt sofort, dass auch jede Untersuchungseinheit mit derselbe Wahrscheinlichkeit gezogen wird. Die Umkehrung gilt jedoch nicht, d.h. alleine aus der Tatsache, dass jedes Element aus der Grundgesamtheit mit derselben Wahrscheinlichkeit gezogen wird, kann noch nicht auf das Vorliegen einer einfachen Stichprobe geschlossen werden. Um eine einfache Stichprobe ziehen zu können, müssen die Elemente der Grundgesamtheit nummerierbar sein und zumindest theoretisch als Liste vorliegen. Seite 136
12 VII. Praktischer Umgang mit Daten Geschichtete Zufallsstichprobe: Bei geschichteten Zufallsstichproben wird die Grundgesamtheit in sich nicht überlappende Schichten zu zerlegen und anschließend aus jeder Schicht eine einfache Zufallswahl zu ziehen. Dieses Vorgehen ist nicht nur einfacher umzusetzen, sondern führt in der Regel auch zu genaueren Schätzungen für die eigentlich interessierende Größe in der Grundgesamtheit, d.h., dass eine geschichtete Stichprobe häufig informativer ist, als eine einfache Stichprobe. Beispiel: Interessiert das durchschnittliche Einkommen der Bundesbürger, so bietet sich beispielsweise eine Schichtung nach Bildungsgrad, Alter oder nach Berufsfeldern. Seite 137
13 VII. Praktischer Umgang mit Daten Klumpenstichprobe: Bei einer geschichteten Zufallsstichprobe wird die Schichtenbildung künstlich durchgeführt. Bei sogenannten Klumpen hingegen zerfällt die Stichprobe auf natürliche Weise in derartige Schichten (z.b. Gemeinden). Bei einer Klumpenstichprobe wird die praktische Anwendbarkeit weiter erhöht, da aus der Gesamtheit aller Klumpen einige wenige ausgewählt werden, die dann vollständig erfasst werden. Beispiele: Es werden einige wenige Gemeinden zufällig ausgewählt, in denen dann alle Bürger befragt werden. Es werden wenige Tage festgelegt, in denen alle Patienten im Krankenhaus erfasst werden. Bemerkung: Eine solche Erhebung ist nur sinnvoll, wenn die einzelnen Klumpen hinsichtlich der Untersuchungsvariable sehr heterogen sind (also kleine Abbilder der Grundgesamtheit) und die Klumpen untereinander sehr homogen sind. Seite 138
14 VII. Praktischer Umgang mit Daten Mehrstufige Auswahlverfahren: Meistens ist eine direkte Ziehung der Untersuchungseinheiten nur schwer oder gar nicht umzusetzen. Dann muss die Auswahl der eigentlichen Untersuchungseinheiten stufenweise Erfolgen. Beispiel: In der ersten Stufe könnten alle deutschen Städte zugrunde liegen und aus ihnen eine Stichprobe gezogen werden. Im nächsten Schritt können dann aus den gezogenen Städten Schulen ausgewählt werden. Erst im dritten Schritt kann man aus den Schülern dieser Schulen eine Zufallsauswahl treffen. Seite 139
15 VII. Praktischer Umgang mit Daten Bewusstes Auswahlverfahren: Neben der Zufallsstichprobe werden bei Meinungsumfragen häufig Verfahren eingesetzt, denen zwar ein bestimmter Stichprobenplan zugrunde liegt, die aber nicht mehr als zufällig angesehen werden können. Sei werden mit dem Ziel durchgeführt, die Repräsentativität der gezogenen Stichprobe zu erhöhen. Beispiele: Quotenpläne, die die Quoten für verschiedene Merkmale (z.b. Geschlecht) enthalten. Auswahl typischer Fälle, bei der nach subjektiven Kriterien des Verantwortlichen für die Untersuchungseinheiten als typische Vertreter der Grundgesamtheit ausgewählt werden. Seite 140
16 VII. Praktischer Umgang mit Daten Studiendesigns: Querschnittsstudie: Es wird an einer bestimmten Anzahl an Objekten, den statistischen Einheiten, zu einem bestimmten Zeitpunkt ein oder mehrere Merkmale erfasst. Zeitreihe: Es wird ein Objekt hinsichtlich eines Merkmals über einen ganzen Zeitraum hinweg beobachtet. Längsschnittstudie: Es wird eine ganze Gruppe gleichartiger Objekte über einen ganzen Zeitraum hinweg beobachtet. Seite 141
17 VII. Praktischer Umgang mit Daten: Graphische Darstellung von Daten Stamm-Blatt-Diagramm (Steam-leaf display): Das Stamm-Blatt-Diagramm ist eine semigrafische Darstellungsform für metrische Merkmale bei mittlerem Datenumfang. Das Diagramm wird in 2 Schritten erstellt: 1. Teile den Datenbereich in Intervalle gleicher Breite ein. Trage die erste(n) Ziffer(n) der Werte im jeweiligen Intervall links von einer senkrechten Linie der Größe nach geordnet ein. Dies ergibt den Stamm. 2. Runde die beobachteten Werte auf die Stelle, die nach den Ziffern des Stamms kommt. Diese werden zeilenweise, der Größe nach geordnet, rechts vom Stamm eingetragen. Diese Ziffern nennt man Blätter. Stamm-Blatt-Diagramme besitzen den Vorteil, dass sie alle Werte der Stichprobe enthalten und somit einen guten Einblick in die Datenstruktur ermöglichen. Bei großen Datensätzen wird das Diagramm jedoch sehr unübersichtlich. Seite 142
18 VII. Praktischer Umgang mit Daten: Graphische Darstellung von Daten Beispiel: Die folgenden Daten werden beobachtet: Seite 143
19 VII. Praktischer Umgang mit Daten: Graphische Darstellung von Daten Fortsetzung Beispiel: Seite 144
20 VII. Praktischer Umgang mit Daten: Graphische Darstellung von Daten Histogramm: Für große Datensätze ist es zweckmäßig, die Daten zu gruppieren und die resultierende Häufigkeiten der Gruppen in einem Histogramm zu visualisieren. Es wird dabei von einem ordinalskalierten Merkmal ausgegangen, das in vielen Ausprägungen vorliegt. Für die Gruppierung wählt man benachbarte Intervalle. Nun wird das Histogramm so konstruiert, dass die Fläche über den Intervallen gleich oder proportional zu den absoluten bzw. relativen Häufigkeiten ist (Prinzip der Flächentreue). Dazu werden über den Intervallen Rechtecke gezeichnet, mit: Breite: Höhe: gleich (oder proportional zu) Fläche: gleich (oder proportional zu) Seite 145
21 VII. Praktischer Umgang mit Daten: Graphische Darstellung von Daten Falls es möglich und sinnvoll ist, sollten die Klassenbreiten gleichgroß gewählt werden. Dadurch können als Höhe der Rechtecke direkt die absoluten bzw. relative Häufigkeiten verwendet werden. Da die Anzahl der Klassen und damit die Wahl der Klassenbreite den Eindruck über die Daten entschieden beeinflussen kann, existieren Faustregeln für die Zahl der Klassen. Bsp.: Anzahl Klassen: Seite 146
22 VII. Praktischer Umgang mit Daten: Graphische Darstellung von Daten Fortsetzung Beispiel: Seite 147
23 VII. Praktischer Umgang mit Daten: Graphische Darstellung von Daten Beispiel: Histogramme zu 4000 normalverteilten Werten: Seite 148
24 VII. Praktischer Umgang mit Daten: Graphische Darstellung von Daten Das Histogramm ist ein erster Schätzer für die Dichte, der die Daten zugrunde liegen. Der Schätzer ist umso genauer, je kleiner die Intervalle gewählt werden. Grund: Für eine beliebige differenzierbare Verteilungsfunktion gilt: Seite 149
25 VII. Praktischer Umgang mit Daten: Graphische Darstellung von Daten Kerndichteschätzer: Ein Nachteil beim Histogramm besteht darin, dass man als geschätzte Dichte eine unstetige Treppenfunktion in erhält. Über den Kerndichteschätzer erhält man ein rollierendes Histogramm, welches die Dichte in der Umgebung eines jeden abschätzt. Die Grundidee ist dabei die selbe, wie im Histogramm: Der Wert entspricht im Histogramm der Höhe des Rechtecks mit der Breite. Lässt man dieses Rechteck nun über die x-achse gleiten, so erhält man den Graphen des gleitende Histogramms. Dieses gleitende Histogramm lässt sich über ein Rechteckfenster, das mit über die Zahlenachse gleitet wie folgt schreiben:, mit Seite 150
26 VII. Praktischer Umgang mit Daten: Graphische Darstellung von Daten Es werden hier also zunächst für jeden -Wert genau so viele Rechteckshöhen aufaddiert, wie Beobachtungen im Intervall liegen und anschleißend durch die Zahl aller Beobachtungen dividiert. Da hier unstetige Rechteckfenster aufaddiert werden, ergibt sich als Kerndichteschätzer immer noch eine unstetige Treppenfunktion. Um einen stetigen Kerndichteschätzer zu erhalten, muss man an Stelle des unstetigen Rechteckkerns einen stetigen Kern verwenden. Beispiele: Seite 151
27 VII. Praktischer Umgang mit Daten: Graphische Darstellung von Daten Beispiel: Gegeben seien die Beobachtungen: Damit ergibt sich mit dem Rechteckkern der folgende Kerndichteschätzer: Seite 152
28 VII. Praktischer Umgang mit Daten: Graphische Darstellung von Daten Beispiel: Gegeben seien die Beobachtungen: Damit ergibt sich mit dem Rechteckkern der folgende Kerndichteschätzer: Seite 153
29 VII. Praktischer Umgang mit Daten: Graphische Darstellung von Daten Fortsetzung Beispiel: Über den Epanechnikow-Kern erhält man für die Dichte: Seite 154
30 VII. Praktischer Umgang mit Daten: Graphische Darstellung von Daten Fortsetzung Beispiel: Über den Gauß-Kern erhält man für die Dichte: Seite 155
31 VII. Praktischer Umgang mit Daten: Graphische Darstellung von Daten Beispiel: Für die 30 Beobachtungen von vorhin ergibt sich somit als Kerndichteschätzer: Seite 156
32 VII. Praktischer Umgang mit Daten: Graphische Darstellung von Daten Quantile und Box-Plot: Das p%-quantil einer Verteilung trennt die Daten so in zwei Teile, dass p% der Daten darunter und (100-p)% darüber liegen. Der Median ist damit gerade das 50%-Quantil. Quantile und die daraus abgeleiteten Box-Plots als graphische Zusammenfassung sind geeignete Mittel, um die Streuung der Daten zu charakterisieren. Sie sind somit sehr gut zum Vergleich verschiedener Verteilungen geeignet. Mit Hilfe der Box-Plots lässt sich schnell ein Eindruck darüber gewinnen, ob die Beobachtungen z.b. annähernd symmetrisch verteilt sind, oder ob Ausreißer in dem Datensatz auftreten. Seite 157
33 VII. Praktischer Umgang mit Daten: Graphische Darstellung von Daten Ein Box-Plot ist bestimmt durch 1. x 0,25 = Anfang der Schachtel ( box ) x 0,75 x 0,75 -x 0,25 = Ende der Schachtel = Länge der Schachtel 2. Der Median wird durch einen Strich in der Box markiert. 3. Zwei Linien ( whiskers ) außerhalb der Box gehen bis zu x min und x max Seite 158
34 VII. Praktischer Umgang mit Daten: Graphische Darstellung von Daten Beispiel: Seite 159
35 VII. Praktischer Umgang mit Daten: Graphische Darstellung von Daten Über die aufgeführten graphischen Werkzeuge kann man eine Idee davon erhalten, welche Verteilungsfamilien auf den Datensatz passen können und in die nähere Auswahl gezogen werden sollten. Auf den nachfolgenden Seiten findet sich eine Auswahl der wichtigsten Verteilungsfamilien Seite 160
36 VII. Praktischer Umgang mit Daten: Graphische Darstellung von Daten Exkurs: Gammafunktion Seite 161
37 VII. Praktischer Umgang mit Daten: Diskrete Verteilungen Binomialverteilung: Seite 162
38 VII. Praktischer Umgang mit Daten: Diskrete Verteilung Poisson-Verteilung: Seite 163
39 VII. Praktischer Umgang mit Daten: Stetige Verteilungen Beta-Verteilung: Seite 164
40 VII. Praktischer Umgang mit Daten: Stetige Verteilungen Cauchy-Verteilung: Seite 165
41 VII. Praktischer Umgang mit Daten: Stetige Verteilungen Exponentialverteilung: Seite 166
42 VII. Praktischer Umgang mit Daten: Stetige Verteilungen F-Verteilung: Seite 167
43 VII. Praktischer Umgang mit Daten: Stetige Verteilungen Gamma-Verteilung: Seite 168
44 VII. Praktischer Umgang mit Daten: Stetige Verteilungen Log - Normalverteilung: Seite 169
45 VII. Praktischer Umgang mit Daten: Stetige Verteilungen Normalverteilung: Seite 170
46 VII. Praktischer Umgang mit Daten: Stetige Verteilungen Gleichverteilung: Seite 171
47 VII. Praktischer Umgang mit Daten: Stetige Verteilungen Weibull-Verteilung: Seite 172
48 VII. Praktischer Umgang mit Daten: Parameterschätzung Fortsetzung Beispiel: Aus der bisherigen Datenanalyse kann man erkenne, dass wir eine stetige Verteilung benötigen und dass die realisierten Daten ausschließlich positive Werte annehmen (Zufall? Woher kommen die Daten?). Außerdem scheinen Werte nahe Null tendenziell häufiger aufzutreten, als große Werte. Damit kommen von den vorhin aufgeführten Verteilungen die Exponential-, F-, Gamma-, Log-Normal- und Weibull-Verteilung in Frage. Im nächsten Schritt müssen nun die Parameter für diese Verteilungen geschätzt werden, um anschließend testen zu können, durch welche Verteilung die Daten repräsentiert werden können. Seite 173
49 VII. Praktischer Umgang mit Daten: Parameterschätzung Schätzfunktion Eine Schätzfunktion oder Schätzstatistik für einen gesuchten Parameter ist eine Funktion in den Stichprobenvariablen. Der aus den Realisationen resultierende numerische Wert ist der zugehörige Schätzwert. Seite 174
50 VII. Praktischer Umgang mit Daten: Parameterschätzung Maximum Likelihood-Schätzfunktion Sind die Parameter einer Verteilung bekannt, kann über die Dichte die Wahrscheinlichkeit dafür ausgerechnet werden, dass bestimmte Werte realisiert werden. Beispiele: Poisson-Verteilung mit dem Parameter : Normalverteilung mit den Parametern : Seite 175
51 VII. Praktischer Umgang mit Daten: Parameterschätzung Sind die Variablen unabhängig und identisch Verteilt, mit den Parametern, so kann dann die Wahrscheinlichkeit bzw. die Dichte dafür, dass eine bestimmte Kombination an realisierten Werten beobachtet wird wie folgt berechnet werden: Bei der Parameterschätzung sind nun aber nicht die Parameter, sondern Realisationen bekannt. Dabei muss die Dichte dann für die festen Realisationen als Funktion in aufgefasst werden: Bemerkung: Im Folgenden wird das Vektorzeichen zur besseren Übersichtlichkeit weggelassen. Seite 176
52 VII. Praktischer Umgang mit Daten: Parameterschätzung Maximum Likelihood-Schätzfunktion Ansatz: Wähle zu als Parameterschätzung diejenigen Parameter, für die die Likelihood maximal ist, d.h. bzw. Es werden also zu den Beobachtungen diejenigen Parameter gesucht, für welche die Wahrscheinlichkeit (bzw. Dichte), dass grade diese Werte auftreten am größten ist. Anders gesagt: Man sucht zu den Realisationen diejenigen Parameter, welche die plausibelste Erklärung für das Zustandekommen dieser Werte liefern. Seite 177
53 VII. Praktischer Umgang mit Daten: Parameterschätzung In den meisten Fällen kann das Maximum der Likelihood-Funktion über die erste Ableitung bestimmt werden. Da diese Funktion sich aus dem Produkt vieler einzelner Faktoren zusammensetzt, empfiehlt es sich die Likelihood-Funktion vorab zu logarithmieren und die Ableitung der daraus resultierenden Log-Likelihood-Funktion zu betrachten: Seite 178
54 VII. Praktischer Umgang mit Daten: Parameterschätzung Beispiel: Es wird eine Poisson-Verteilung unterstellt und es wurden die Realisationen beobachtet. Seite 179
55 VII. Praktischer Umgang mit Daten: Parameterschätzung Beispiel: Es wird eine Normalverteilung unterstellt und es wurden die Realisationen beobachtet. Seite 180
56 VII. Praktischer Umgang mit Daten: Güte der Anpassung Nachdem die Parameter geschätzt wurden, stellt sich die Frage, ob die angepasste Verteilung wirklich auf die Daten passt. Dazu können zum einen graphische Ansätze verwendet werden, um einen ersten Eindruck über die Qualität der Anpassung zu gewinnen und alternative Verteilungen miteinander zu vergleichen. Die letztendliche Entscheidung über die Annahme / Ablehnung der Verteilungsannahme sollte über einen Test getroffen werden. Seite 181
57 VII. Praktischer Umgang mit Daten: Güte der Anpassung Kerndichteschätzer vs. theoretische Verteilung Zunächst sollte der Verlauf des Kerndichteschätzers, der direkt die beobachteten Häufigkeiten abbildet mit der theoretischen Verteilung verglichen werden. Fortsetzung Beispiel: Seite 182
58 VII. Praktischer Umgang mit Daten: Güte der Anpassung Q-Q-Plot Im Q-Q-Plot werden die theoretischen Quantile den beobachteten Quantilen gegenübergestellt. Dazu werden die Quantile als Punkte der Form (x,y) = (theoretisches Quantil, beobachtetes Quantil) in ein Koordinatensystem abgetragen. Passt die Verteilung auf die Daten, müssten die Punkte in etwa auf der ersten Winkelhalbierenden liegen. Seite 183
59 VII. Praktischer Umgang mit Daten: Güte der Anpassung Fortsetzung Beispiel: Seite 184
60 VII. Praktischer Umgang mit Daten: Güte der Anpassung Kolmogorov-Smirnov-Test Annahmen: Die einzelnen Zufallsvariablen sind identisch und unabhängig Verteilt. Die unbekannte Verteilungsfunktion ist stetig. Nullhypothese: Gegenhypothese: Teststatistik: mit ist die empirische Verteilungsfunktion zu. Die Nullhypothese wird für ein vorgegebenes Signifikanzniveau abgelehnt, wenn, bzw. wenn für den entsprechenden p-wert gilt:. Seite 185
61 VII. Praktischer Umgang mit Daten: Güte der Anpassung Fortsetzung Beispiel: Bei Normalverteilungsannahme ergibt sich ein Wert für die Teststatistik von: KS = 0,1469. Der zugehörige p-wert beträgt: KS = 0,4908. Die Verteilungsannahme kann also nicht verworfen werden. Bei Log-Normalverteilungsannahme ergibt sich ein Wert für die Teststatistik von: KS = 0,1272. Der zugehörige p-wert beträgt: KS = 0,6697. Die Verteilungsannahme kann also ebenfalls nicht verworfen werden. Seite 186
htw saar 1 EINFÜHRUNG IN DIE STATISTIK: BESCHREIBENDE STATISTIK
htw saar 1 EINFÜHRUNG IN DIE STATISTIK: BESCHREIBENDE STATISTIK htw saar 2 Grundbegriffe htw saar 3 Grundgesamtheit und Stichprobe Ziel: Über eine Grundgesamtheit (Population) soll eine Aussage über ein
MehrKreisdiagramm, Tortendiagramm
Kreisdiagramm, Tortendiagramm Darstellung der relativen (absoluten) Häufigkeiten als Fläche eines Kreises Anwendung: Nominale Merkmale Ordinale Merkmale (Problem: Ordnung nicht korrekt wiedergegeben) Gruppierte
MehrStatistik. Ludwig Fahrmeir Rita Künstler Iris Pigeot Gerhard Tutz. Der Weg zur Datenanalyse. Springer. Zweite, verbesserte Auflage
Ludwig Fahrmeir Rita Künstler Iris Pigeot Gerhard Tutz Statistik Der Weg zur Datenanalyse Zweite, verbesserte Auflage Mit 165 Abbildungen und 34 Tabellen Springer Inhaltsverzeichnis Vorwort v 1 Einführung
MehrStatistische Tests (Signifikanztests)
Statistische Tests (Signifikanztests) [testing statistical hypothesis] Prüfen und Bewerten von Hypothesen (Annahmen, Vermutungen) über die Verteilungen von Merkmalen in einer Grundgesamtheit (Population)
MehrStatistik. Sommersemester Prof. Dr. Stefan Etschberger HSA. für Betriebswirtschaft und International Management
Statistik für Betriebswirtschaft und International Management Sommersemester 2014 Prof. Dr. Stefan Etschberger HSA Streuungsparameter Varianz Var(X) bzw. σ 2 : [x i E(X)] 2 f(x i ), wenn X diskret Var(X)
MehrStatistisches Testen
Statistisches Testen Grundlegendes Prinzip Erwartungswert Bekannte Varianz Unbekannte Varianz Differenzen Anteilswert Chi-Quadrat Tests Gleichheit von Varianzen Prinzip des Statistischen Tests Konfidenzintervall
Mehr5. Schließende Statistik (Inferenzstatistik, konfirmatorische Verfahren)
5. Schließende Statistik (Inferenzstatistik, konfirmatorische Verfahren) 5.1. Einführung Schätzen unbekannter Parameter im Modell, z.b. Wahrscheinlichkeiten p i (Anteile in der Gesamtmenge), Erwartungswerte
MehrStatistik II. Statistische Tests. Statistik II
Statistik II Statistische Tests Statistik II - 12.5.2006 1 Test auf Anteilswert: Binomialtest Sei eine Stichprobe unabhängig, identisch verteilter ZV (i.i.d.). Teile diese Stichprobe in zwei Teilmengen
MehrArbeitsbuch zur deskriptiven und induktiven Statistik
Helge Toutenburg Michael Schomaker Malte Wißmann Christian Heumann Arbeitsbuch zur deskriptiven und induktiven Statistik Zweite, aktualisierte und erweiterte Auflage 4ü Springer Inhaltsverzeichnis 1. Grundlagen
MehrEinführung in die Statistik
Einführung in die Statistik Analyse und Modellierung von Daten Von Prof. Dr. Rainer Schlittgen 4., überarbeitete und erweiterte Auflage Fachbereich Materialwissenschaft! der Techn. Hochschule Darmstadt
Mehr3 Grundlagen statistischer Tests (Kap. 8 IS)
3 Grundlagen statistischer Tests (Kap. 8 IS) 3.1 Beispiel zum Hypothesentest Beispiel: Betrachtet wird eine Abfüllanlage für Mineralwasser mit dem Sollgewicht µ 0 = 1000g und bekannter Standardabweichung
MehrKlassifikation von Signifikanztests
Klassifikation von Signifikanztests Nach Verteilungsannahmen: verteilungsabhängig: parametrischer [parametric] Test verteilungsunabhängig: nichtparametrischer [non-parametric] Test Bei parametrischen Tests
MehrWichtige Definitionen und Aussagen
Wichtige Definitionen und Aussagen Zufallsexperiment, Ergebnis, Ereignis: Unter einem Zufallsexperiment verstehen wir einen Vorgang, dessen Ausgänge sich nicht vorhersagen lassen Die möglichen Ausgänge
MehrKlassifikation von Signifikanztests
Klassifikation von Signifikanztests nach Verteilungsannahmen: verteilungsabhängige = parametrische Tests verteilungsunabhängige = nichtparametrische Tests Bei parametrischen Tests werden im Modell Voraussetzungen
MehrInstitut für Biometrie und klinische Forschung. WiSe 2012/2013
Klinische Forschung WWU Münster Pflichtvorlesung zum Querschnittsfach Epidemiologie, Biometrie und Med. Informatik Praktikum der Medizinischen Biometrie (3) Überblick. Deskriptive Statistik I 2. Deskriptive
MehrKonfidenzintervalle Grundlegendes Prinzip Erwartungswert Bekannte Varianz Unbekannte Varianz Anteilswert Differenzen von Erwartungswert Anteilswert
Konfidenzintervalle Grundlegendes Prinzip Erwartungswert Bekannte Varianz Unbekannte Varianz Anteilswert Differenzen von Erwartungswert Anteilswert Beispiel für Konfidenzintervall Im Prinzip haben wir
MehrMathematische Statistik. Zur Notation
Mathematische Statistik dient dazu, anhand von Stichproben Informationen zu gewinnen. Während die Wahrscheinlichkeitsrechnung Prognosen über das Eintreten zufälliger (zukünftiger) Ereignisse macht, werden
MehrDie Familie der χ 2 (n)-verteilungen
Die Familie der χ (n)-verteilungen Sind Z 1,..., Z m für m 1 unabhängig identisch standardnormalverteilte Zufallsvariablen, so genügt die Summe der quadrierten Zufallsvariablen χ := m Z i = Z 1 +... +
MehrStatistische Datenanalyse
Werner A. Stahel Statistische Datenanalyse Eine Einführung für Naturwissenschaftler 3., durchgesehene Auflage vieweg VII 1 Einleitung 1 1.1 Was ist Statistische Datenanalyse? 1 1.2 Ziele 6 1.3 Hinweise
MehrWillkommen zur Vorlesung Statistik (Master)
Willkommen zur Vorlesung Statistik (Master) Thema dieser Vorlesung: Verteilung diskreter Zufallsvariablen Prof. Dr. Wolfgang Ludwig-Mayerhofer Universität Siegen Philosophische Fakultät, Seminar für Sozialwissenschaften
MehrSozialwissenschaftlerInnen II
Statistik für SozialwissenschaftlerInnen II Henning Best best@wiso.uni-koeln.de Universität zu Köln Forschungsinstitut für Soziologie Statistik für SozialwissenschaftlerInnen II p.1 Wahrscheinlichkeitsfunktionen
MehrDeskriptive Statistik 1 behaftet.
Die Statistik beschäftigt sich mit Massenerscheinungen, bei denen die dahinterstehenden Einzelereignisse meist zufällig sind. Statistik benutzt die Methoden der Wahrscheinlichkeitsrechnung. Fundamentalregeln:
MehrWahrscheinlichkeitsverteilungen
Universität Bielefeld 3. Mai 2005 Wahrscheinlichkeitsrechnung Wahrscheinlichkeitsrechnung Das Ziehen einer Stichprobe ist die Realisierung eines Zufallsexperimentes. Die Wahrscheinlichkeitsrechnung betrachtet
MehrStatistik Testverfahren. Heinz Holling Günther Gediga. Bachelorstudium Psychologie. hogrefe.de
rbu leh ch s plu psych Heinz Holling Günther Gediga hogrefe.de Bachelorstudium Psychologie Statistik Testverfahren 18 Kapitel 2 i.i.d.-annahme dem unabhängig. Es gilt also die i.i.d.-annahme (i.i.d = independent
MehrChi-Quadrat-Verteilung
Chi-Quadrat-Verteilung Wikipedia http://de.wikipedia.org/wiki/chi-quadrat-verteilung 1 von 7 6/18/2009 6:13 PM Chi-Quadrat-Verteilung aus Wikipedia, der freien Enzyklopädie Die Chi-Quadrat-Verteilung ist
MehrEinführung in die Statistik für Wirtschaftswissenschaftler für Betriebswirtschaft und Internationales Management
Einführung in die Statistik für Wirtschaftswissenschaftler für Betriebswirtschaft und Internationales Management Sommersemester 2013 Hochschule Augsburg Lageparameter: Erwartungswert d) Erwartungswert
MehrStatistik und Wahrscheinlichkeitsrechnung
Statistik und Wahrscheinlichkeitsrechnung 3. Vorlesung Dr. Jochen Köhler 1 Inhalte der heutigen Vorlesung Ziel: Daten Modellbildung Probabilistisches Modell Wahrscheinlichkeit von Ereignissen Im ersten
MehrInhaltsverzeichnis. Robert Galata, Sandro Scheid. Deskriptive und Induktive Statistik für Studierende der BWL. Methoden - Beispiele - Anwendungen
Inhaltsverzeichnis Robert Galata, Sandro Scheid Deskriptive und Induktive Statistik für Studierende der BWL Methoden - Beispiele - Anwendungen Herausgegeben von Robert Galata, Markus Wessler ISBN (Buch):
MehrDr. Maike M. Burda. Welchen Einfluss hat die Körperhöhe auf das Körpergewicht? Eine Regressionsanalyse. HU Berlin, Econ Bootcamp 7.-9.
Dr. Maike M. Burda Welchen Einfluss hat die Körperhöhe auf das Körpergewicht? Eine Regressionsanalyse. HU Berlin, Econ Bootcamp 7.-9. Januar 2011 BOOTDATA11.GDT: 250 Beobachtungen für die Variablen...
MehrEmpirische Verteilungsfunktion
Empirische Verteilungsfunktion H(x) := Anzahl der Werte x ist. Deskriptive
Mehr3 Häufigkeitsverteilungen
3 Häufigkeitsverteilungen 3.1 Absolute und relative Häufigkeiten 3.2 Klassierung von Daten 3.3 Verteilungsverläufe 3.1 Absolute und relative Häufigkeiten Datenaggregation: Bildung von Häufigkeiten X nominal
MehrKapitel 2. Häufigkeitsverteilungen
6 Kapitel 2 Häufigkeitsverteilungen Ziel: Darstellung bzw Beschreibung (Exploration) einer Variablen Ausgangssituation: An n Einheiten ω,, ω n sei das Merkmal X beobachtet worden x = X(ω ),, x n = X(ω
MehrSchließende Statistik
Schließende Statistik [statistical inference] Sollen auf der Basis von empirischen Untersuchungen (Daten) Erkenntnisse gewonnen und Entscheidungen gefällt werden, sind die Methoden der Statistik einzusetzen.
Mehr2. Deskriptive Statistik
Philipps-Universitat Marburg 2.1 Stichproben und Datentypen Untersuchungseinheiten: mogliche, statistisch zu erfassende Einheiten je Untersuchungseinheit: ein oder mehrere Merkmale oder Variablen beobachten
MehrAuswahlverfahren. Zufallsauswahl Bewusste Auswahl Willkürliche Auswahl. Dipl.-Päd. Ivonne Bemerburg
Auswahlverfahren Zufallsauswahl Bewusste Auswahl Willkürliche Auswahl Blockseminar: Methoden quantitativer Grundgesamtheit und Stichprobe Die Festlegung einer Menge von Objekten, für die die Aussagen der
MehrEinführung in die Statistik
Einführung in die Statistik Analyse und Modellierung von Daten von Prof. Dr. Rainer Schlittgen Universität Hamburg 12., korrigierte Auflage Oldenbourg Verlag München Inhaltsverzeichnis 1 Statistische Daten
Mehr1 Einleitung und Grundlagen 1
Inhaltsverzeichnis Vorwort vii 1 Einleitung und Grundlagen 1 1.1 Einführende Beispiele 1 1.2 Statistischer Prozess 2 1.3 Grundlagen 2 1.4 Unterscheidung von Merkmalen 3 1.4.1 Skalenniveaus 3 1.4.2 Stetige
MehrI Beschreibende Statistik 1
Inhaltsverzeichnis Vorwort ix I Beschreibende Statistik 1 Lernziele zu Teil I 2 1 Statistik, Daten und statistische Methoden 3 1.1 Statistik im Alltag, in Politik und Gesellschaft...... 3 1.2 Aufgaben
MehrStatistik II. IV. Hypothesentests. Martin Huber
Statistik II IV. Hypothesentests Martin Huber 1 / 22 Übersicht Weitere Hypothesentests in der Statistik 1-Stichproben-Mittelwert-Tests 1-Stichproben-Varianz-Tests 2-Stichproben-Tests Kolmogorov-Smirnov-Test
MehrStatistik und Wahrscheinlichkeitsrechnung
Statistik und Wahrscheinlichkeitsrechnung Dr. Jochen Köhler 1 Inhalt der heutigen Vorlesung Statistik und Wahrscheinlichkeitsrechnung Zusammenfassung der vorherigen Vorlesung Übersicht über Schätzung und
MehrStandardisierte Vorgehensweisen und Regeln zur Gewährleistung von: Eindeutigkeit Schlussfolgerungen aus empirischen Befunden sind nur dann zwingend
Standardisierte Vorgehensweisen und Regeln zur Gewährleistung von: Eindeutigkeit Schlussfolgerungen aus empirischen Befunden sind nur dann zwingend oder eindeutig, wenn keine alternativen Interpretationsmöglichkeiten
MehrVorlesung: Statistik II für Wirtschaftswissenschaft
Vorlesung: Statistik II für Wirtschaftswissenschaft Prof. Dr. Helmut Küchenhoff Institut für Statistik, LMU München Sommersemester 2017 Einführung 1 Wahrscheinlichkeit: Definition und Interpretation 2
MehrZusammenfassung Mathe II. Themenschwerpunkt 2: Stochastik (ean) 1. Ein- und mehrstufige Zufallsexperimente; Ergebnismengen
Zusammenfassung Mathe II Themenschwerpunkt 2: Stochastik (ean) 1. Ein- und mehrstufige Zufallsexperimente; Ergebnismengen Zufallsexperiment: Ein Vorgang, bei dem mindestens zwei Ereignisse möglich sind
MehrMathematik für Biologen
Mathematik für Biologen Prof. Dr. Rüdiger W. Braun Heinrich-Heine Universität Düsseldorf 14. Oktober 2010 Übungen Aufgabenblatt 1 wird heute Nachmittag auf das Weblog gestellt. Geben Sie die Lösungen dieser
MehrErmitteln Sie auf 2 Dezimalstellen genau die folgenden Kenngrößen der bivariaten Verteilung der Merkmale Weite und Zeit:
1. Welche der folgenden Kenngrößen, Statistiken bzw. Grafiken sind zur Beschreibung der Werteverteilung des Merkmals Konfessionszugehörigkeit sinnvoll einsetzbar? A. Der Modalwert. B. Der Median. C. Das
MehrStatistische Tests. Kapitel Grundbegriffe. Wir betrachten wieder ein parametrisches Modell {P θ : θ Θ} und eine zugehörige Zufallsstichprobe
Kapitel 4 Statistische Tests 4.1 Grundbegriffe Wir betrachten wieder ein parametrisches Modell {P θ : θ Θ} und eine zugehörige Zufallsstichprobe X 1,..., X n. Wir wollen nun die Beobachtung der X 1,...,
Mehr2 Häufigkeitsverteilungen
2 Häufigkeitsverteilungen Ziel: Darstellung bzw Beschreibung (Exploration) einer Variablen Ausgangssituation An n Einheiten ω 1,,ω n sei das Merkmal X beobachtet worden x 1 = X(ω 1 ),,x n = X(ω n ) Also
MehrZufallsvariablen. Diskret. Stetig. Verteilung der Stichprobenkennzahlen. Binomial Hypergeometrisch Poisson. Normal Lognormal Exponential
Zufallsvariablen Diskret Binomial Hypergeometrisch Poisson Stetig Normal Lognormal Exponential Verteilung der Stichprobenkennzahlen Zufallsvariable Erinnerung: Merkmal, Merkmalsausprägung Deskriptive Statistik:
Mehr2.3 Intervallschätzung
2.3.1 Motivation und Hinführung Bsp. 2.11. [Wahlumfrage] Der wahre Anteil der rot-grün Wähler 2009 war genau 33.7%. Wie groß ist die Wahrscheinlichkeit, in einer Zufallsstichprobe von 1000 Personen genau
MehrGrundlagen der Biometrie in Agrarwissenschaften / Ernährungswissenschaften
Grundlagen der Biometrie in Agrarwissenschaften / Ernährungswissenschaften Dr. Antje Kiesel Institut für Angewandte Mathematik WS 2011/2012 Grundlagen der Biometrie, WS 2011/12 Vorlesung: Dienstag 8.15-9.45,
MehrLösungen zu Übungsblatt 9 Höhere Mathematik2/Stochastik 2 Master KI/PI
Lösungen zu Übungsblatt 9 Höhere Mathematik/Stochastik Anpassung von Verteilungen Zu Aufgabe ) a) Zeichnen des Histogranmmes: Um das Histogramm zu zeichnen, benötigen wir die Höhe der Balken. Die Höhe
MehrDWT 2.1 Maximum-Likelihood-Prinzip zur Konstruktion von Schätzvariablen 330/467 Ernst W. Mayr
2.1 Maximum-Likelihood-Prinzip zur Konstruktion von Schätzvariablen Wir betrachten nun ein Verfahren zur Konstruktion von Schätzvariablen für Parameter von Verteilungen. Sei X = (X 1,..., X n ). Bei X
MehrT-Test für den Zweistichprobenfall
T-Test für den Zweistichprobenfall t-test (unbekannte, gleiche Varianzen) Test auf Lageunterschied zweier normalverteilter Grundgesamtheiten mit unbekannten, aber gleichen Varianzen durch Vergleich der
MehrStatistische Methoden in den Umweltwissenschaften
Statistische Methoden in den Umweltwissenschaften Stetige und diskrete Wahrscheinlichkeitsverteilungen Lageparameter Streuungsparameter Diskrete und stetige Zufallsvariablen Eine Variable (oder Merkmal
MehrForschungsstatistik I
Prof. Dr. G. Meinhardt 6. Stock, Taubertsberg 2 R. 06-206 (Persike) R. 06-214 (Meinhardt) Sprechstunde jederzeit nach Vereinbarung Forschungsstatistik I Dr. Malte Persike persike@uni-mainz.de http://psymet03.sowi.uni-mainz.de/
MehrStatistik II. Weitere Statistische Tests. Statistik II
Statistik II Weitere Statistische Tests Statistik II - 19.5.2006 1 Überblick Bisher wurden die Test immer anhand einer Stichprobe durchgeführt Jetzt wollen wir die statistischen Eigenschaften von zwei
MehrStatistik I für Betriebswirte Vorlesung 14
Statistik I für Betriebswirte Vorlesung 14 Dr. Andreas Wünsche TU Bergakademie Freiberg Institut für Stochastik 13. Juli 017 Dr. Andreas Wünsche Statistik I für Betriebswirte Vorlesung 14 Version: 8. Juli
MehrModellanpassung und Parameterschätzung. A: Übungsaufgaben
7 Modellanpassung und Parameterschätzung 1 Kapitel 7: Modellanpassung und Parameterschätzung A: Übungsaufgaben [ 1 ] Bei n unabhängigen Wiederholungen eines Bernoulli-Experiments sei π die Wahrscheinlichkeit
MehrMathematik für Biologen
Mathematik für Biologen Prof. Dr. Rüdiger W. Braun Heinrich-Heine Universität Düsseldorf 13. Januar 2010 Termine Letzte Vorlesung am 28.01.2010 Letzte Übung am 27.01.2010, und zwar für alle Anfangsbuchstaben
MehrGrundlagen der Statistik
www.nwb.de NWB Studium Betriebswirtschaft Grundlagen der Statistik Band 2: Wahrscheinlichkeitsrechnung und induktive Statistik Von Professor Dr. Jochen Schwarze 9., vollständig überarbeitete Auflage STUDIUM
MehrKlausur zur Vorlesung
Institut für Mathematische Stochastik WS 2006/2007 Universität Karlsruhe 12. Februar 2007 Priv.-Doz. Dr. D. Kadelka Dipl.-Math. W. Lao Aufgabe 1 (15 Punkte) Klausur zur Vorlesung Statistik für Biologen
MehrFit for Abi & Study Stochastik
Fit for Abi & Study Stochastik Prof. Dr. Tilla Schade Hochschule Harz 15. und 16. April 2014 No. 1 Stochastik besteht aus: Wahrscheinlichkeitsrechnung Statistik No. 2 Gliederung Grundlagen Zufallsgrößen
MehrZufallsvariablen [random variable]
Zufallsvariablen [random variable] Eine Zufallsvariable (Zufallsgröße) X beschreibt (kodiert) die Versuchsausgänge ω Ω mit Hilfe von Zahlen, d.h. X ist eine Funktion X : Ω R ω X(ω) Zufallsvariablen werden
MehrKlausur zur Vorlesung
Institut für Mathematische Stochastik WS 2004/2005 Universität Karlsruhe 14. Februar 2005 Dr. Bernhard Klar Sebastian Müller Aufgabe 1: (15 Punkte) Klausur zur Vorlesung Statistik für Biologen Musterlösungen
MehrVerteilungen eindimensionaler stetiger Zufallsvariablen Stetige Verteilungen. Chi-Quadrat-Verteilung Studentverteilung Fisher-Verteilung
Verteilungen eindimensionaler stetiger Zufallsvariablen Stetige Verteilungen Chi-Quadrat-Verteilung Studentverteilung Fisher-Verteilung Typisierung der stetigen theoretischen Verteilungen Bibliografie:
MehrBeispiel 6 (Einige Aufgaben zur Gleichverteilung)
Beispiel 6 (Einige Aufgaben zur Gleichverteilung) Aufgabe (Anwendung der Chebyshev-Ungleichung) Sei X eine Zufallsvariable mit E(X) = µ und var(x) = σ a) Schätzen Sie die Wahrscheinlichkeit dafür, daß
MehrWillkommen zur Vorlesung Statistik (Master)
Willkommen zur Vorlesung Statistik (Master) Thema dieser Vorlesung: Verteilung diskreter Zufallsvariablen Prof. Dr. Wolfgang Ludwig-Mayerhofer Universität Siegen Philosophische Fakultät, Seminar für Sozialwissenschaften
MehrStatistik. Von Dr. Günter Bamberg. o. Professor für Statistik und Dr. habil. Franz Baur. Universität Augsburg. 12., überarbeitete Auflage
Statistik Von Dr. Günter Bamberg o. Professor für Statistik und Dr. habil. Franz Baur Universität Augsburg 12., überarbeitete Auflage R.01denbourg Verlag München Wien V INHALTSVERZEICHNIS Vorwort Liste
MehrBiomathematik für Mediziner, Klausur SS 2000 Seite 1
Biomathematik für Mediziner, Klausur SS 2000 Seite 1 Aufgabe 1: Bei der Diagnose einer bestimmten Krankheit mit einem speziellen Diagnoseverfahren werden Patienten, die tatsächlich an der Krankheit leiden,
Mehr4. Schließende Statistik (Inferenzstatistik, konfirmatorische Verfahren)
4. Schließende Statistik (Inferenzstatistik, konfirmatorische Verfahren) 4.1. Einführung Schätzen unbekannter Parameter im Modell, z.b. Wahrscheinlichkeiten p i (Anteile in der Gesamtmenge), Erwartungswerte
MehrEin- und Zweistichprobentests
(c) Projekt Neue Statistik 2003 - Lernmodul: Ein- Zweistichprobentests Ein- Zweistichprobentests Worum geht es in diesem Modul? Wiederholung: allgemeines Ablaufschema eines Tests Allgemeine Voraussetzungen
Mehr4.1. Nullhypothese, Gegenhypothese und Entscheidung
rof. Dr. Roland Füss Statistik II SS 8 4. Testtheorie 4.. Nullhypothese, Gegenhypothese und Entscheidung ypothesen Annahmen über die Verteilung oder über einzelne arameter der Verteilung eines Merkmals
Mehr3. Merkmale und Daten
3. Merkmale und Daten Ziel dieses Kapitels: Vermittlung des statistischen Grundvokabulars Zu klärende Begriffe: Grundgesamtheit Merkmale (Skalenniveau etc.) Stichprobe 46 3.1 Grundgesamtheiten Definition
Mehr5. Auswahlverfahren für Stichprobenelemente
Grundlagen Uneingeschränkte Zufallsauswahl (z.b. Roulette, Würfeln) Zufallszahlen müssen eine vorgegebene Verteilung erfüllen (Gleichverteilung) Zufallszahlen müssen zufällig aufeinander folgen (keine
MehrKapitel XIV - Anpassungstests
Institut für Volkswirtschaftslehre (ECON) Lehrstuhl für Ökonometrie und Statistik Kapitel XIV - Anpassungstests Induktive Statistik Prof. Dr. W.-D. Heller Hartwig Senska Carlo Siebenschuh 2. Grundannahme:
MehrInhaltsverzeichnis Inhaltsverzeichnis VII Erst mal locker bleiben: Es f angt ganz einfach an! Keine Taten ohne Daten!
Inhaltsverzeichnis Inhaltsverzeichnis VII 1 Erst mal locker bleiben: Es fängt ganz einfach an! 1 1.1 Subjektive Wahrscheinlichkeit - oder warum...?..... 4 1.2 Was Ethik mit Statistik zu tun hat - Pinocchio
MehrDas (multiple) Bestimmtheitsmaß R 2. Beispiel: Ausgaben in Abhängigkeit vom Einkommen (I) Parameterschätzer im einfachen linearen Regressionsmodell
1 Lineare Regression Parameterschätzung 13 Im einfachen linearen Regressionsmodell sind also neben σ ) insbesondere β 1 und β Parameter, deren Schätzung für die Quantifizierung des linearen Zusammenhangs
MehrStatistik III. Walter Zucchini Fred Böker Andreas Stadie
Statistik III Walter Zucchini Fred Böker Andreas Stadie Inhaltsverzeichnis 1 Zufallsvariablen und ihre Verteilung 1 1.1 Diskrete Zufallsvariablen........................... 1 1.2 Stetige Zufallsvariablen............................
Mehr3 Häufigkeitsverteilungen
3 Häufigkeitsverteilungen 3.1 Absolute und relative Häufigkeiten 3.2 Klassierung von Daten 3.3 Verteilungsverläufe 3.1 Absolute und relative Häufigkeiten Datenaggregation: Bildung von Häufigkeiten X nominal
MehrNachklausur zur Vorlesung. Statistik für Studierende der Biologie
Institut für Mathematische Stochastik WS 1999/2000 Universität Karlsruhe 11. Mai 2000 Dr. Bernhard Klar Nachklausur zur Vorlesung Statistik für Studierende der Biologie Bearbeitungszeit: 90 Minuten Name:
MehrDeskription, Statistische Testverfahren und Regression. Seminar: Planung und Auswertung klinischer und experimenteller Studien
Deskription, Statistische Testverfahren und Regression Seminar: Planung und Auswertung klinischer und experimenteller Studien Deskriptive Statistik Deskriptive Statistik: beschreibende Statistik, empirische
MehrBereiche der Statistik
Bereiche der Statistik Deskriptive / Exploratorische Statistik Schließende Statistik Schließende Statistik Inferenz-Statistik (analytische, schließende oder konfirmatorische Statistik) baut auf der beschreibenden
MehrWarum Stichproben? Vollerhebungen sind teuer Nehmen (zu)viel Zeit in Anspruch Sind evtl. destruktiv
Warum Stichproben? Vollerhebungen sind teuer Nehmen (zu)viel Zeit in Anspruch Sind evtl. destruktiv Voraussetzung für die Anwendung von Stichproben: Stichproben müssen repräsentativ sein, d.h. ein verkleinertes
MehrKapitel 3 Schließende Statistik
Motivation Grundgesamtheit mit unbekannter Verteilung F Stichprobe X 1,...,X n mit Verteilung F Realisation x 1,...,x n der Stichprobe Rückschluss auf F Dr. Karsten Webel 160 Motivation (Fortsetzung) Kapitel
MehrInhaltsverzeichnis. Inhalt Teil I: Beschreibende (Deskriptive) Statistik Seite. 1.0 Erste Begriffsbildungen Merkmale und Skalen 5
Inhaltsverzeichnis Inhalt Teil I: Beschreibende (Deskriptive) Statistik Seite 1.0 Erste Begriffsbildungen 1 1.1 Merkmale und Skalen 5 1.2 Von der Urliste zu Häufigkeitsverteilungen 9 1.2.0 Erste Ordnung
MehrBiomathematik für Mediziner, Klausur WS 1999/2000 Seite 1
Biomathematik für Mediziner, Klausur WS 1999/2000 Seite 1 Aufgabe 1: Wieviele der folgenden Variablen sind quantitativ stetig? Schulnoten, Familienstand, Religion, Steuerklasse, Alter, Reaktionszeit, Fahrzeit,
MehrStatistik. Datenanalyse mit EXCEL und SPSS. R.01denbourg Verlag München Wien. Von Prof. Dr. Karlheinz Zwerenz. 3., überarbeitete Auflage
Statistik Datenanalyse mit EXCEL und SPSS Von Prof. Dr. Karlheinz Zwerenz 3., überarbeitete Auflage R.01denbourg Verlag München Wien Inhalt Vorwort Hinweise zu EXCEL und SPSS Hinweise zum Master-Projekt
Mehr5. Stichproben und Statistiken
5. Stichproben und Statistiken Problem: Es sei X eine ZV, die einen interessierenden Zufallsvorgang repräsentiere Man möchte die tatsächliche Verteilung von X kennenlernen (z.b. mittels der VF F X (x)
MehrParametrische vs. Non-Parametrische Testverfahren
Parametrische vs. Non-Parametrische Testverfahren Parametrische Verfahren haben die Besonderheit, dass sie auf Annahmen zur Verteilung der Messwerte in der Population beruhen: die Messwerte sollten einer
Mehr6. Schätzverfahren für Parameter
6. Schätzverfahren für Parameter Ausgangssituation: Ein interessierender Zufallsvorgang werde durch die ZV X repräsentiert X habe eine unbekannte Verteilungsfunktion F X (x) Wir interessieren uns für einen
MehrMathematik IV für Maschinenbau und Informatik (Stochastik) Universität Rostock, Institut für Mathematik Sommersemester 2007
Mathematik IV für Maschinenbau und Informatik Stochastik Universität Rostock, Institut für Mathematik Sommersemester 007 Prof. Dr. F. Liese Dipl.-Math. M. Helwich Serie Termin: 9. Juni 007 Aufgabe 3 Punkte
MehrDr. Maike M. Burda. Welchen Einfluss hat die Körperhöhe auf das Körpergewicht? Eine Regressionsanalyse. HU Berlin, Econ Bootcamp
Dr. Maike M. Burda Welchen Einfluss hat die Körperhöhe auf das Körpergewicht? Eine Regressionsanalyse. HU Berlin, Econ Bootcamp 8.-10. Januar 2010 BOOTDATA.GDT: 250 Beobachtungen für die Variablen... cm:
MehrMathematik für Biologen
Mathematik für Biologen Prof. Dr. Rüdiger W. Braun Heinrich-Heine-Universität Düsseldorf 25. Januar 2013 1 Der χ 2 -Anpassungstest 2 Exakter Test nach Fisher Mendelsche Erbregeln als Beispiel für mehr
MehrStatistik. Prof. em. Dr. Dr. h.c. Günter Bamberg PD Dr. Franz Baur Prof. Dr.Michael Krapp. 17., überarbeitete Auflage. Oldenbourg Verlag München.
Statistik von Prof. em. Dr. Dr. h.c. Günter Bamberg PD Dr. Franz Baur Prof. Dr.Michael Krapp 17., überarbeitete Auflage Oldenbourg Verlag München Inhaltsverzeichnis Vorwort Liste wichtiger Symbole IX XI
MehrExponentialverteilung
Exponentialverteilung Dauer von kontinuierlichen Vorgängen (Wartezeiten; Funktionszeiten technischer Geräte) Grenzübergang von der geometrischen Verteilung Pro Zeiteinheit sei die Eintrittswahrscheinlichkeit
MehrPhilipp Sibbertsen Hartmut Lehne. Statistik. Einführung für Wirtschafts- und. Sozialwissenschaftler. 2., überarbeitete Auflage. 4^ Springer Gabler
Philipp Sibbertsen Hartmut Lehne Statistik Einführung für Wirtschafts- und Sozialwissenschaftler 2., überarbeitete Auflage 4^ Springer Gabler Inhaltsverzeichnis Teil I Deskriptive Statistik 1 Einführung
MehrEinführung in die computergestützte Datenanalyse
Karlheinz Zwerenz Statistik Einführung in die computergestützte Datenanalyse 6., überarbeitete Auflage DE GRUYTER OLDENBOURG Vorwort Hinweise zu EXCEL und SPSS Hinweise zum Master-Projekt XI XII XII TEIL
MehrStatistik I für Betriebswirte Vorlesung 9
Statistik I für Betriebswirte Vorlesung 9 Dr. Andreas Wünsche TU Bergakademie Freiberg Institut für Stochastik Vorlesung am 8. Juni 2017 im Audi-Max (AUD-1001) Dr. Andreas Wünsche Statistik I für Betriebswirte
MehrAblaufschema beim Testen
Ablaufschema beim Testen Schritt 1 Schritt 2 Schritt 3 Schritt 4 Schritt 5 Schritt 6 Schritt 7 Schritt 8 Schritt 9 Starten Sie die : Flashanimation ' Animation Ablaufschema Testen ' siehe Online-Version
MehrStatistik. Datenanalyse mit EXCEL und SPSS. Prof. Dr. Karlheinz Zwerenz. R.Oldenbourg Verlag München Wien. Von
Statistik Datenanalyse mit EXCEL und SPSS Von Prof. Dr. Karlheinz Zwerenz R.Oldenbourg Verlag München Wien Inhalt Vorwort Hinweise zu EXCEL und SPSS Hinweise zum Master-Projekt XI XII XII TEIL I GRUNDLAGEN
Mehr