Klassifikation von Daten Einleitung
|
|
- Rainer Burgstaller
- vor 6 Jahren
- Abrufe
Transkript
1 Klassifikation von Daten Einleitung Lehrstuhl für Künstliche Intelligenz Institut für Informatik Friedrich-Alexander-Universität Erlangen-Nürnberg (Lehrstuhl Informatik 8) Klassifikation von Daten Einleitung 1 / 1
2 Messwerte sind nie ganz exakt Beispiel: Restzuckergehalt in vergorenem Apfelmost In zwei verschiedenen Gärballons (rot bzw. grün) wird mehrfach hintereinander der Restzuckergehalt bestimmt. Jeder Messwert gibt einen Wert zwischen -1 und +7 %mas (Masseanteil) an. Lassen sich die Ballons anhand der Messwerte unterscheiden? Vergleich von drei Fällen Die Werte streuen. Je nach Stärke der Streuung und Abstand der richtigen Werte fällt die optische Unterscheidung unterschiedlich schwer. (Lehrstuhl Informatik 8) Klassifikation von Daten Einleitung 2 / 1
3 Annäherung an eine algorithmische Unterscheidung Wir können versuchen, für jeden Gäransatz den richtigen Wert zu rekonstruieren. Dabei gehen wir von einem Sensormodell aus: Der Sensor trifft grundsätzlich den richtigen Wert. Oft liegt er ein bißchen daneben. Selten liegt er sehr weit daneben. Mit einem Histogram lässt sich abzählen, wie oft der Sensor welchen Wert getroffen hat. Bei zwei verschiedenen richtigen Werten müssten sich im Histogramm zwei Häufungspunkte zeigen. (Lehrstuhl Informatik 8) Klassifikation von Daten Einleitung 3 / 1
4 Analytische Annahmen zum Sensormodell Wir können das Sensormodell mathematisch präziser formulieren, wenn wir eine Messung als Zufallsexperiment betrachten. Für die Messung gibt es dann eine Zufallsvariable, die verschiedene (Mess-)Werte annimmt. Der Zufallsvariablen wird eine Verteilungsfunktion zugeordnet. Ein Messwert x kann in einer von K Klassen liegen. P (C k x) ist die Wahrscheinlichkeit, dass x in der k-ten Klasse liegt. (Lehrstuhl Informatik 8) Klassifikation von Daten Einleitung 4 / 1
5 Entscheidungsregel (Klassifikator) Zur Bestimmung einer Entscheidungsregel gehen wir von drei Größen aus: Einflussgrößen für eine Entscheidung 1 Welche Wahrscheinlichkeit gibt ein Orakel dafür an, dass das Muster x auftritt, wenn man Beispiele für die Klasse C k sucht: P (x C) 2 Welche Wahrscheinlichkeit berechnet der Klassifikator für die Klasse C l, wenn ihm das Muster x gegeben wird: P (C l x) 3 Mit welcher Wahrscheinlichkeit tritt x auf: P (x) Die Ereignisse in 1. und 2. sind voneinander unabhängig, weil der Klassifikator die Antwort des Orakels nicht kennen kann. Eine Entscheidung ist optimal, wenn der Klassifikator im Mittel die Wahrscheinlichkeit minimiert, eine falsche Klasse zu wählen. (Lehrstuhl Informatik 8) Klassifikation von Daten Einleitung 5 / 1
6 Entscheidungsregel (2) Der Raum der Beobachtungen X wird in Entscheidungsregionen R k (typischerweise nicht zusammenhängend!) aufgeteilt. Der Klassifikator entscheidet sich für ein x R k für die Klasse k Welches ist die beste Aufteilung? Diejenige, welche die Fehlerwahrscheinlichkeit minimiert! Für zwei Klassen C l und C k ist der Verwechslungswahrscheinlichkeit 1 folgendermaßen gegeben: P (Ver.wech.) = P (x R l, C k ) + P (x R k C l ) = P (x, C k )dx + P (x, C l )dx R l R k Wie also R l und R k wählen? Für jeden Vektor x X so, dass die kleinere der beiden Verwechslungswahrscheinlichkeiten verbleibt Wenn also P (x, C k ) > P (x, C l ): Fordere x R k 1 = Fehlerwahrscheinlichkeit (Lehrstuhl Informatik 8) Klassifikation von Daten Einleitung 6 / 1
7 Entscheidungsregel (3) Beachte: und P (x, C k ) = P (C k x)p (x) P (x, C l ) = P (C l x)p (x) Da der Faktor P (x) in beiden Fällen gleich ist, gilt: Die Fehlerwahrscheinlichkeit wird minimiert, wenn man sich für die Klasse mit der höchsten a-posteriori Wahrscheinlichkeit entscheidet. (Lehrstuhl Informatik 8) Klassifikation von Daten Einleitung 7 / 1
8 Entscheidungsregel (4) Für K Klassen (bisher K=2): Betrachte die Wahrscheinlichkeit, eine korrekte Entscheidung zu treffen: P (korrekt) = = K P (x R k, C k ) k=1 K k=1 R k P (x, C k )dx Analog zu vorher: Wie die Regionen Rk wählen, so dass P (korrekt) maximal? Für jeden Vektor x X diejenige Klasse Ck, für die P (x, C k ) maximal (jede andere Wahl wäre schlechter) Somit: Die Korrektheit wird maximiert, wenn man sich für die Klasse mit der höchsten a-posteriori Wahrscheinlichkeit entscheidet. (Lehrstuhl Informatik 8) Klassifikation von Daten Einleitung 8 / 1
9 Entscheidungsregel (5) Illustration (Lehrstuhl Informatik 8) Klassifikation von Daten Einleitung 9 / 1
10 Entschedungsregel (6) Verwechslungskosten Typischerweise sind mit verschiednen Verwechslungspaaren (C i, C j ) unterschiedliche Kosten verbunden Die Kostenmatrix L kj gibt an, wieviel eine Verwechslung von C k mit C j kostet Der Erwartungswert der Kosten für Verwechslungen: E[L] = L kj P (x R j, C k ) k j (Lehrstuhl Informatik 8) Klassifikation von Daten Einleitung 10 / 1
11 Wähle die Regionen R j so, dass der Erwartungswert der Verwechslungskosten minimal ist Analog zu vorher: Minimiere den Beitrag, den jedes x R j zu den Gesamtkosten leistet Dies ist für jeden Vektor x R j die Größe L kj P (x, C k ) k wähle für jedes x das R j für welches diese Größe minimal ist (Bei bekannten Wahrscheinlichkeiten und Kostenfunktion einfach!) Ein Klassifikator (eine Entscheidungsfunktion), der diese Regionen realisiert heißt optimal. (Lehrstuhl Informatik 8) Klassifikation von Daten Einleitung 11 / 1
12 Maximum-Likelihood Maximum-Likelihood-Methode zur Parameterschätzung (1821, CARL F. GAUSS; 1922, SIR RONALD A. FISHER): Ausgangspunkt: Gegen die Stichproben x = x 1,..., x N einer Zufallsvariable X mit einer Verteilungsfunktion (Dichte) f(x; θ) = P (X = x i ; θ) deren Typ bekannt ist θ = (θ 1, θ 2,..., θ m ) ist Parametervektor der Wahrscheinlichkeitsfunktion Ziel: Wähle den Parametervektor θ so, dass L(x; θ) = P θ (X 1 = x 1,..., X n = x n ) = f(x 1 ; θ)... f(x n ; θ) des Ereignisses {X 1 = x 1,..., X n = x n } maximiert wird. Beachte: Es wird angenommen, dass die Elemente von x i.i.d! L heißt Likelihood von x für Parameter θ (Lehrstuhl Informatik 8) Klassifikation von Daten Einleitung 12 / 1
13 Beispiel: Normalverteilung Rezept Normalverteilung mit Parametern Mittelwert µ R und Standardabweichung σ > 0 ist gegeben durch: N (x; µ, σ 2 ) = 1 (x µ)2 e 2σ 2 2πσ 2 Die Likelihood-Funktion eines Satzes von N i.i.d. Stichproben x ist N L(x; µ, σ) = N (x n ; µ, σ 2 ) n=1 Maximiere L durch geeignete Wahl von µ und σ Beachte Max. von L ist Max. von ln L Betrachte µ und σ getrennt: Bestimme die ersten und zweiten Ableitungen Finde Maxima: Beachte u.a. für festes µ die Grenzen limσ 0 und lim σ (Lehrstuhl Informatik 8) Klassifikation von Daten Einleitung 13 / 1
14 Grundsätzliche Schwierigkeiten bei der Klassifikation Selbst wenn eine Verteilungsfunktion bekannt ist, kann nicht immer richtig zwischen den verschiedenen Klassen getrennt werden. Je nach wahren Werten und Messfehlern fällt die Aufgabe unterschiedlich schwer. Das Bestimmen der Parameter für eine Verteilungsfunktion aus Messwerten ist ein komplexes Optimierungsproblem. Oft ist es gar nicht möglich, eine plausible Annahme über die Verteilung einer Zufallsvariablen zu machen. (Lehrstuhl Informatik 8) Klassifikation von Daten Einleitung 14 / 1
15 Parameterfreie Klassifikation Aus der MAP-Entscheidung leitet sich eine geometrische Interpretation ab: Im eindimensionalen Fall lassen sich Klassen also durch Intervalle repräsentieren. Gefahr: Verschiedene Klassen lassen sich nicht ohne falsche Zuordnung einzelner Punkte trennen. (Lehrstuhl Informatik 8) Klassifikation von Daten Einleitung 15 / 1
16 Parameterfreie Klassifikation in mehreren Dimensionen Fast immer besteht eine Beobachtung aus mehreren simultanen Messungen. Jede Beobachtung wird also als Vektor von Messwerten definiert. Oft wird die Annahme getroffen, dass die einzelnen Messungen voneinander stochastisch unabhängig sind: P ( (x 1, x 2,..., x n ) T) = n i=1 P (x i) Beispiel für den (noch darstellbaren) zweidimensionalen Fall: (Lehrstuhl Informatik 8) Klassifikation von Daten Einleitung 16 / 1
17 Parameterfreie Klassifikation in mehreren Dimensionen Ab Dimension 2 gibt es viele Möglichkeiten, Klassengrenzen geometrisch zu definieren: Die entscheidende Frage bei der Klassifikation lautet also: Welches geometrische Modell ermöglicht eine optimale Anpassung der Klassengrenzen an eine gegebene Menge von Beispielen? (Lehrstuhl Informatik 8) Klassifikation von Daten Einleitung 17 / 1
18 Parameterfreie Klassifikation in mehreren Dimensionen Dabei gibt es viele Schwierigkeiten: Überlappung, nicht zusammenhängende Gebiete, Ausreißer, Formen ohne geometrisches Modell Wenn die Form nicht zu den Beispielen passt, ist die Gefahr der Fehlklassifikation sehr hoch. (Lehrstuhl Informatik 8) Klassifikation von Daten Einleitung 18 / 1
19 Fluch der Dimension Bei Dimension 2 ist der Einheitswürfel ein Quadrat mit Seitenlänge 1 und Fläche 1. Um eine Klasse unterzubringen, die einen Anteil 0 < c < 1 am Einheitswürfel hat (die Wahrscheinlichkeit der Klasse ist also c), benötigt man die Seitenlänge d mit: Bei Dimension k gilt für d: d = c d = c 1 k Wegen 0 < c < 1 konvergiert d gegen 1 für k! (Lehrstuhl Informatik 8) Klassifikation von Daten Einleitung 19 / 1
20 Optimale Merkmalsauswahl Konsequenz aus dem Fluch der Dimension ist, dass man immer versuchen muss, so wenige Merkmale wie möglich zu benutzen. Um aus einer Menge von Merkmalen diejenigen herauszufinden, die das beste Klassifikationsergebnis liefern, gibt es zahlreiche Gütemaße. SignifikanzTests Korrelationstests Informationstheoretische Tests... Bekanntes Verfahren zur Elimination korrelierter Dimensionen: Die Hauptachsentransformation. (Lehrstuhl Informatik 8) Klassifikation von Daten Einleitung 20 / 1
Konfidenzintervalle Grundlegendes Prinzip Erwartungswert Bekannte Varianz Unbekannte Varianz Anteilswert Differenzen von Erwartungswert Anteilswert
Konfidenzintervalle Grundlegendes Prinzip Erwartungswert Bekannte Varianz Unbekannte Varianz Anteilswert Differenzen von Erwartungswert Anteilswert Beispiel für Konfidenzintervall Im Prinzip haben wir
MehrEinführung in die Maximum Likelihood Methodik
in die Maximum Likelihood Methodik Thushyanthan Baskaran thushyanthan.baskaran@awi.uni-heidelberg.de Alfred Weber Institut Ruprecht Karls Universität Heidelberg Gliederung 1 2 3 4 2 / 31 Maximum Likelihood
MehrStatistik Testverfahren. Heinz Holling Günther Gediga. Bachelorstudium Psychologie. hogrefe.de
rbu leh ch s plu psych Heinz Holling Günther Gediga hogrefe.de Bachelorstudium Psychologie Statistik Testverfahren 18 Kapitel 2 i.i.d.-annahme dem unabhängig. Es gilt also die i.i.d.-annahme (i.i.d = independent
MehrWahrscheinlichkeitstheorie und Statistik vom
INSTITUT FÜR STOCHASTIK SS 2007 UNIVERSITÄT KARLSRUHE Priv.-Doz. Dr. D. Kadelka Dipl.-Math. oec. W. Lao Klausur (Maschineningenieure) Wahrscheinlichkeitstheorie und Statistik vom 2.9.2007 Musterlösungen
MehrFakultät für Informatik Übung zu Kognitive Systeme Sommersemester 2016
Fakultät für Informatik Übung zu Kognitive Systeme Sommersemester 1 M. Sperber (matthias.sperber@kit.edu) S. Nguyen (thai.nguyen@kit.edu) Übungsblatt 3 Maschinelles Lernen und Klassifikation Abgabe online
MehrSignalverarbeitung 2. Volker Stahl - 1 -
- 1 - Überblick Bessere Modelle, die nicht nur den Mittelwert von Referenzvektoren sondern auch deren Varianz berücksichtigen Weniger Fehlklassifikationen Mahalanobis Abstand Besseres Abstandsmaß basierend
MehrZufallsvariablen [random variable]
Zufallsvariablen [random variable] Eine Zufallsvariable (Zufallsgröße) X beschreibt (kodiert) die Versuchsausgänge ω Ω mit Hilfe von Zahlen, d.h. X ist eine Funktion X : Ω R ω X(ω) Zufallsvariablen werden
MehrLösungen zur Klausur GRUNDLAGEN DER WAHRSCHEINLICHKEITSTHEORIE UND STATISTIK
Institut für Stochastik Dr. Steffen Winter Lösungen zur Klausur GRUNDLAGEN DER WAHRSCHEINLICHKEITSTHEORIE UND STATISTIK für Studierende der INFORMATIK vom 17. Juli 01 (Dauer: 90 Minuten) Übersicht über
Mehr1 Dichte- und Verteilungsfunktion
Tutorium Yannick Schrör Klausurvorbereitungsaufgaben Statistik Lösungen Yannick.Schroer@rub.de 9.2.26 ID /455 Dichte- und Verteilungsfunktion Ein tüchtiger Professor lässt jährlich 2 Bücher drucken. Die
MehrKapitel 3 Schließende Statistik
Beispiel 3.4: (Fortsetzung Bsp. 3.) bekannt: 65 i=1 X i = 6, also ˆp = X = 6 65 = 0, 4 Überprüfen der Voraussetzungen: (1) n = 65 30 () n ˆp = 6 10 (3) n (1 ˆp) = 39 10 Dr. Karsten Webel 194 Beispiel 3.4:
MehrAllgemeines zu Tests. Statistische Hypothesentests
Statistische Hypothesentests Allgemeines zu Tests Allgemeines Tests in normalverteilten Grundgesamtheiten Asymptotische Tests Statistischer Test: Verfahren Entscheidungsregel), mit dem auf Basis einer
MehrClusteranalyse: Gauß sche Mischmodelle
Universität Potsdam Institut für Informatik Lehrstuhl Maschinelles Lernen Clusteranalyse: Gauß sche Mischmodelle iels Landwehr Überblick Problemstellung/Motivation Deterministischer Ansatz: K-Means Probabilistischer
MehrKlausur zu Methoden der Statistik II (mit Kurzlösung) Sommersemester Aufgabe 1
Lehrstuhl für Statistik und Ökonometrie der Otto-Friedrich-Universität Bamberg Prof. Dr. Susanne Rässler Klausur zu Methoden der Statistik II (mit Kurzlösung) Sommersemester 2013 Aufgabe 1 In einer Urne
MehrMathematische und statistische Methoden II
Statistik & Methodenlehre e e Prof. Dr. G. Meinhardt 6. Stock, Wallstr. 3 (Raum 06-206) Sprechstunde jederzeit nach Vereinbarung und nach der Vorlesung. Mathematische und statistische Methoden II Dr. Malte
MehrETWR Teil B. Spezielle Wahrscheinlichkeitsverteilungen (stetig)
ETWR Teil B 2 Ziele Bisher (eindimensionale, mehrdimensionale) Zufallsvariablen besprochen Lageparameter von Zufallsvariablen besprochen Übertragung des gelernten auf diskrete Verteilungen Ziel des Kapitels
MehrKlausur Stochastik und Statistik 31. Juli 2012
Klausur Stochastik und Statistik 31. Juli 2012 Prof. Dr. Matthias Schmid Institut für Statistik, LMU München Wichtig: ˆ Überprüfen Sie, ob Ihr Klausurexemplar vollständig ist. Die Klausur besteht aus fünf
MehrScheinklausur Stochastik 1 für Studierende des Lehramts und der Diplom-Pädagogik
Universität Karlsruhe (TH) Institut für Stochastik Dr. Bernhard Klar Dipl.-Math. oec. Volker Baumstark Name Vorname Matr.-Nr.: Scheinklausur Stochastik für Studierende des Lehramts und der Diplom-Pädagogik
MehrEinführung in die Fehlerrechnung und Messdatenauswertung
Grundpraktikum der Physik Einführung in die Fehlerrechnung und Messdatenauswertung Wolfgang Limmer Institut für Halbleiterphysik 1 Fehlerrechnung 1.1 Motivation Bei einem Experiment soll der Wert einer
MehrKapitel XIII - p-wert und Beziehung zwischen Tests und Konfidenzintervallen
Institut für Volkswirtschaftslehre (ECON) Lehrstuhl für Ökonometrie und Statistik Kapitel XIII - p-wert und Beziehung zwischen Tests und Konfidenzintervallen Induktive Statistik Prof. Dr. W.-D. Heller
Mehr10 Der statistische Test
10 Der statistische Test 10.1 Was soll ein statistischer Test? 10.2 Nullhypothese und Alternativen 10.3 Fehler 1. und 2. Art 10.4 Parametrische und nichtparametrische Tests 10.1 Was soll ein statistischer
MehrEinführung in die statistische Testtheorie II
1 Seminar: Simulation und Bildanalyse mit Java Einführung in die statistische Testtheorie II Guntram Seitz Sommersemester 2004 1 WIEDERHOLUNG 2 1 Wiederholung Grundprinzip: Annahme: Beobachtungen bzw.
MehrK8 Stetige Zufallsvariablen Theorie und Praxis
K8 Stetige Zufallsvariablen Theorie und Praxis 8.1 Theoretischer Hintergrund Wir haben (nicht abzählbare) Wahrscheinlichkeitsräume Meßbare Funktionen Zufallsvariablen Verteilungsfunktionen Dichten in R
MehrWahrscheinlichkeitsrechnung und Quantentheorie
Physikalische Chemie II: Atombau und chemische Bindung Winter 2013/14 Wahrscheinlichkeitsrechnung und Quantentheorie Messergebnisse können in der Quantenmechanik ganz prinzipiell nur noch mit einer bestimmten
MehrKapitel VIII - Tests zum Niveau α
Institut für Volkswirtschaftslehre (ECON) Lehrstuhl für Ökonometrie und Statistik Kapitel VIII - Tests zum Niveau α Induktive Statistik Prof. Dr. W.-D. Heller Hartwig Senska Carlo Siebenschuh Testsituationen
Mehrdie wir als Realisationen von unabhängig und identisch verteilten Zufallsvariablen
Kapitel 8 Schätzung von Parametern 8.1 Schätzmethoden Gegeben seien Beobachtungen Ü Ü ¾ Ü Ò die wir als Realisationen von unabhängig und identisch verteilten Zufallsvariablen ¾ Ò auffassen. Die Verteilung
MehrKapitel VI - Lage- und Streuungsparameter
Universität Karlsruhe (TH) Institut für Statistik und Mathematische Wirtschaftstheorie Wahrscheinlichkeitstheorie Kapitel VI - Lage- und Streuungsparameter Markus Höchstötter Lehrstuhl für Statistik, Ökonometrie
MehrR. Brinkmann Seite
R. Brinkmann http://brinkmann-du.de Seite 1 24.2.214 Grundlagen zum Hypothesentest Einführung: Wer Entscheidungen zu treffen hat, weiß oft erst im nachhinein ob seine Entscheidung richtig war. Die Unsicherheit
MehrÜbung 1: Wiederholung Wahrscheinlichkeitstheorie
Übung 1: Wiederholung Wahrscheinlichkeitstheorie Ü1.1 Zufallsvariablen Eine Zufallsvariable ist eine Variable, deren numerischer Wert solange unbekannt ist, bis er beobachtet wird. Der Wert einer Zufallsvariable
MehrUniversität Potsdam Institut für Informatik Lehrstuhl Maschinelles Lernen. Clusteranalyse. Tobias Scheffer Thomas Vanck
Universität Potsdam Institut für Informatik Lehrstuhl Maschinelles Lernen Clusteranalyse Tobias Scheffer Thomas Vanck Überblick Problemstellung/Motivation Deterministischer Ansatz: K-Means Probabilistischer
MehrÜberblick. Einführung in die automatische Mustererkennung Grundlagen der Wahrscheinlichkeitsrechnung
Grundlagen Überblick Einführung in die automatische Mustererkennung Grundlagen der Wahrscheinlichkeitsrechnung Klassifikation bei bekannter Wahrscheinlichkeitsverteilung Entscheidungstheorie Bayes- Entscheidungsfunktionen
MehrEinführung in die Statistik Kapitel 6: Crash-Course in Statistik: Testtheorie
Einführung in die Statistik Kapitel 6: Crash-Course in Statistik: Testtheorie Jung Kyu Canci Universität Basel HS2015 1 / 15 Literatur Kapitel 6 Statistik in Cartoons : Kapitel 8 Krengel : 6 und 14 Storrer
MehrStatistik 2 für SoziologInnen. Normalverteilung. Univ.Prof. Dr. Marcus Hudec. Themen dieses Kapitels sind:
Statistik 2 für SoziologInnen Normalverteilung Univ.Prof. Dr. Marcus Hudec Statistik 2 für SoziologInnen 1 Normalverteilung Inhalte Themen dieses Kapitels sind: Das Konzept stetiger Zufallsvariablen Die
MehrDatenanalyse. (PHY231) Herbstsemester Olaf Steinkamp
Datenanalyse (PHY31) Herbstsemester 015 Olaf Steinkamp 36-J- olafs@physik.uzh.ch 044 63 55763 Einführung, Messunsicherheiten, Darstellung von Messdaten Grundbegriffe der Wahrscheinlichkeitsrechnung und
MehrAuswertung und Lösung
Dieses Quiz soll Ihnen helfen, Kapitel 4.7 und 4.8 besser zu verstehen. Auswertung und Lösung Abgaben: 71 / 265 Maximal erreichte Punktzahl: 8 Minimal erreichte Punktzahl: 0 Durchschnitt: 5.65 Frage 1
MehrHypothesen: Fehler 1. und 2. Art, Power eines statistischen Tests
ue biostatistik: hypothesen, fehler 1. und. art, power 1/8 h. lettner / physik Hypothesen: Fehler 1. und. Art, Power eines statistischen Tests Die äußerst wichtige Tabelle über die Zusammenhänge zwischen
MehrElementare Wahrscheinlichkeitsrechnung
Johann Pfanzagl Elementare Wahrscheinlichkeitsrechnung 2., überarbeitete und erweiterte Auflage W DE G Walter de Gruyter Berlin New York 1991 Inhaltsverzeichnis 1. Zufallsexperimente und Wahrscheinlichkeit
MehrKapitel 13. Grundbegriffe statistischer Tests
Kapitel 13 Grundbegriffe statistischer Tests Oft hat man eine Vermutung über die Verteilung einer Zufallsvariablen X. Diese Vermutung formuliert man als Hypothese H 0.Sokönnte man daran interessiert sein
MehrStatistische Tests. Kapitel Grundbegriffe. Wir betrachten wieder ein parametrisches Modell {P θ : θ Θ} und eine zugehörige Zufallsstichprobe
Kapitel 4 Statistische Tests 4.1 Grundbegriffe Wir betrachten wieder ein parametrisches Modell {P θ : θ Θ} und eine zugehörige Zufallsstichprobe X 1,..., X n. Wir wollen nun die Beobachtung der X 1,...,
MehrKapitel 12 Stetige Zufallsvariablen Dichtefunktion und Verteilungsfunktion. stetig. Verteilungsfunktion
Kapitel 12 Stetige Zufallsvariablen 12.1. Dichtefunktion und Verteilungsfunktion stetig Verteilungsfunktion Trägermenge T, also die Menge der möglichen Realisationen, ist durch ein Intervall gegeben Häufig
Mehr3. Das Prüfen von Hypothesen. Hypothese?! Stichprobe Signifikanztests in der Wirtschaft
3. Das Prüfen von Hypothesen Hypothese?! Stichprobe 3.1. Signifikanztests in der Wirtschaft Prüfung, ob eine (theoretische) Hypothese über die Verteilung eines Merkmals X und ihre Parameter mit einer (empirischen)
MehrI. Deskriptive Statistik 1
I. Deskriptive Statistik 1 1. Einführung 3 1.1. Grundgesamtheit und Stichprobe.................. 5 1.2. Merkmale und Verteilungen..................... 6 1.3. Tabellen und Grafiken........................
MehrMathematik für Biologen
Mathematik für Biologen Prof. Dr. Rüdiger W. Braun Heinrich-Heine-Universität Düsseldorf 9. Dezember 2010 1 Konfidenzintervalle Idee Schätzung eines Konfidenzintervalls mit der 3-sigma-Regel Grundlagen
MehrGrundbegriffe der Wahrscheinlichkeitsrechnung
Algorithmen und Datenstrukturen 349 A Grundbegriffe der Wahrscheinlichkeitsrechnung Für Entwurf und Analyse randomisierter Algorithmen sind Hilfsmittel aus der Wahrscheinlichkeitsrechnung erforderlich.
MehrMethodenlehre. Vorlesung 10. Prof. Dr. Björn Rasch, Cognitive Biopsychology and Methods University of Fribourg
Methodenlehre Vorlesung 10 Prof. Dr., Cognitive Biopsychology and Methods University of Fribourg 1 Methodenlehre II Woche Datum Thema 1 FQ Einführung, Verteilung der Termine 1 18.2.15 Psychologie als Wissenschaft
MehrEine zweidimensionale Stichprobe
Eine zweidimensionale Stichprobe liegt vor, wenn zwei qualitative Merkmale gleichzeitig betrachtet werden. Eine Urliste besteht dann aus Wertepaaren (x i, y i ) R 2 und hat die Form (x 1, y 1 ), (x 2,
MehrEin- und Zweistichprobentests
(c) Projekt Neue Statistik 2003 - Lernmodul: Ein- Zweistichprobentests Ein- Zweistichprobentests Worum geht es in diesem Modul? Wiederholung: allgemeines Ablaufschema eines Tests Allgemeine Voraussetzungen
MehrLösungen zur Klausur WAHRSCHEINLICHKEITSTHEORIE UND STATISTIK (STOCHASTIK)
Institut für Stochastik Dr. Steffen Winter Lösungen zur Klausur WAHRSCHEINLICHKEITSTHEORIE UND STATISTIK (STOCHASTIK) für Studierende des Maschinenbaus vom 7. Juli (Dauer: 8 Minuten) Übersicht über die
MehrStatistische Tests für unbekannte Parameter
Konfidenzintervall Intervall, das den unbekannten Parameter der Verteilung mit vorgegebener Sicherheit überdeckt ('Genauigkeitsaussage' bzw. Zuverlässigkeit einer Punktschätzung) Statistischer Test Ja-Nein-Entscheidung
MehrBiomathematik für Mediziner, Klausur SS 2001 Seite 1
Biomathematik für Mediziner, Klausur SS 2001 Seite 1 Aufgabe 1: Von den Patienten einer Klinik geben 70% an, Masern gehabt zu haben, und 60% erinnerten sich an eine Windpockeninfektion. An mindestens einer
MehrBayes sches Lernen: Übersicht
Bayes sches Lernen: Übersicht Bayes sches Theorem MAP, ML Hypothesen MAP Lernen Minimum Description Length Principle Bayes sche Klassifikation Naive Bayes Lernalgorithmus Teil 5: Naive Bayes + IBL (V.
MehrÜbungsblatt 9. f(x) = e x, für 0 x
Aufgabe 1: Übungsblatt 9 Basketball. Ein Profi wirft beim Training aus einer Entfernung von sieben Metern auf den Korb. Er trifft bei jedem Wurf mit einer Wahrscheinlichkeit von p = 1/2. Die Zufallsvariable
MehrRegelmäßigkeit (Erkennen von Mustern und Zusammenhängen) versus Zufall
Wahrscheinlichkeitstheorie Was will die Sozialwissenschaft damit? Regelmäßigkeit (Erkennen von Mustern und Zusammenhängen) versus Zufall Auch im Alltagsleben arbeiten wir mit Wahrscheinlichkeiten, besteigen
MehrMathematik für Biologen
Mathematik für Biologen Prof. Dr. Rüdiger W. Braun Heinrich-Heine-Universität Düsseldorf 8. Dezember 2010 Teil V Schließende Statistik 1 Parameterschätzung Erwartungstreue und Konsistenz Maximum-Likelihood
MehrEntscheidung zwischen zwei Möglichkeiten auf der Basis unsicherer (zufälliger) Daten
Prof. Dr. J. Franke Statistik II für Wirtschaftswissenschaftler 4.1 4. Statistische Entscheidungsverfahren Entscheidung zwischen zwei Möglichkeiten auf der Basis unsicherer (zufälliger) Daten Beispiel:
MehrMathematische und statistische Methoden II
Prof. Dr. G. Meinhardt 6. Stock, Wallstr. 3 (Raum 06-206) Sprechstunde jederzeit nach Vereinbarung und nach der Vorlesung. Mathematische und statistische Methoden II Dr. Malte Persike persike@uni-mainz.de
MehrÜbungsaufgaben, Statistik 1
Übungsaufgaben, Statistik 1 Kapitel 3: Wahrscheinlichkeiten [ 4 ] 3. Übungswoche Der Spiegel berichtet in Heft 29/2007 von folgender Umfrage vom 3. und 4. Juli 2007:,, Immer wieder werden der Dalai Lama
MehrDie Varianz (Streuung) Definition
Die (Streuung) Definition Diskrete Stetige Ang., die betrachteten e existieren. var(x) = E(X EX) 2 heißt der Zufallsvariable X. σ = Var(X) heißt Standardabweichung der X. Bez.: var(x), Var(X), varx, σ
MehrErwartungswert, Varianz und Standardabweichung einer Zufallsgröße. Was ist eine Zufallsgröße und was genau deren Verteilung?
Erwartungswert, Varianz und Standardabweichung einer Zufallsgröße Von Florian Modler In diesem Artikel möchte ich einen kleinen weiteren Exkurs zu meiner Serie Vier Wahrscheinlichkeitsverteilungen geben
MehrP (X = 2) = 1/36, P (X = 3) = 2/36,...
2.3 Zufallsvariablen 2.3 Zufallsvariablen Meist sind die Ereignisse eines Zufallseperiments bereits reelle Zahlen. Ist dies nicht der Fall, kann man Ereignissen eine reelle Zahl zuordnen. Zum Beispiel
MehrÜbung zu Empirische Ökonomie für Fortgeschrittene SS 2009
Übung zu Empirische Ökonomie für Fortgeschrittene Steen Elstner, Klaus Wohlrabe, Steen Henzel SS 9 1 Wichtige Verteilungen Die Normalverteilung Eine stetige Zufallsvariable mit der Wahrscheinlichkeitsdichte
MehrAnpassungstests VORGEHENSWEISE
Anpassungstests Anpassungstests prüfen, wie sehr sich ein bestimmter Datensatz einer erwarteten Verteilung anpasst bzw. von dieser abweicht. Nach der Erläuterung der Funktionsweise sind je ein Beispiel
MehrStochastik für die Naturwissenschaften
Stochastik für die Naturwissenschaften Dr. C.J. Luchsinger 5. Erwartungswert E und Varianz V Literatur Kapitel 5 * Storrer: (37.9)-(37.12), (38.4), (40.6)-(40.9), (41.2) * Stahel: Kapitel 5 und 6 (nur
Mehr3.4 Asymptotische Evaluierung von Sch atzer Konsistenz Konsistenz Definition 3.4.1: konsistente Folge von Sch atzer
3.4 Asymptotische Evaluierung von Schätzer 3.4.1 Konsistenz Bis jetzt haben wir Kriterien basierend auf endlichen Stichproben betrachtet. Konsistenz ist ein asymptotisches Kriterium (n ) und bezieht sich
MehrFehlerfortpflanzung. M. Schlup. 27. Mai 2011
Fehlerfortpflanzung M. Schlup 7. Mai 0 Wird eine nicht direkt messbare physikalische Grösse durch das Messen anderer Grössen ermittelt, so stellt sich die Frage, wie die Unsicherheitsschranke dieser nicht-messbaren
MehrTesten von Hypothesen, Beurteilende Statistik
Testen von Hypothesen, Beurteilende Statistik Was ist ein Test? Ein Test ist ein Verfahren, mit dem man anhand von Beobachtungen eine begründete Entscheidung über die Gültigkeit oder Ungültigkeit einer
MehrÜbungen mit dem Applet Vergleich von zwei Mittelwerten
Vergleich von zwei Mittelwerten 1 Übungen mit dem Applet Vergleich von zwei Mittelwerten 1 Statistischer Hintergrund... 2 1.1 Typische Fragestellungen...2 1.2 Fehler 1. und 2. Art...2 1.3 Kurzbeschreibung
MehrMathematische und statistische Methoden II
Sprechstunde jederzeit nach Vereinbarung und nach der Vorlesung Wallstr. 3, 6. Stock, Raum 06-206 Mathematische und statistische Methoden II Dr. Malte Persike persike@uni-mainz.de lordsofthebortz.de lordsofthebortz.de/g+
MehrWahrscheinlichkeitsrechnung
Statistik und Wahrscheinlichkeitsrechnung Prof. Dr. Michael Havbro Faber 28.05.2009 1 Korrektur zur letzten Vorlesung Bsp. Fehlerfortpflanzung in einer Messung c B a 2 2 E c Var c a b A b 2 2 2 n h( x)
MehrMethoden der Werkstoffprüfung Kapitel II Statistische Verfahren I. WS 2009/2010 Kapitel 2.0
Methoden der Werkstoffprüfung Kapitel II Statistische Verfahren I WS 009/010 Kapitel.0 Schritt 1: Bestimmen der relevanten Kenngrößen Kennwerte Einflussgrößen Typ A/Typ B einzeln im ersten Schritt werden
MehrM13 Übungsaufgaben / pl
Die Histogramme von Binomialverteilungen werden bei wachsendem Stichprobenumfang n immer flacher und breiter. Dem Maximum einer solchen Verteilung kommt daher keine allzu große Wahrscheinlichkeit zu. Vielmehr
Mehr1. Übungsblatt zu Wahrscheinlichkeitsrechnung und Statistik in den Ingenieurswissenschaften
1. Übungsblatt zu Aufgabe 1: In R können die Logarithmen zu verschiedenen Basen mit der Funktion log berechnet werden, wobei im Argument base die Basis festgelegt wird. Plotten Sie die Logarithmusfunktion
MehrStatistik II. Statistische Tests. Statistik II
Statistik II Statistische Tests Statistik II - 12.5.2006 1 Test auf Anteilswert: Binomialtest Sei eine Stichprobe unabhängig, identisch verteilter ZV (i.i.d.). Teile diese Stichprobe in zwei Teilmengen
Mehr1. Ziehg.: N M. falls nicht-rote K. in 1. Ziehg. gezogen
6.4 Hyergeometrische Verteilung Gegeben ist eine Urne, die mit N Kugeln gefüllt ist. Es seien M dieser Kugeln rot und N-M Kugeln nicht rot. Wir entnehmen n Kugeln, d.h. eine Stichrobe des Umfangs n. Dabei
MehrBeschreibende Statistik und der Übergang zur beurteilenden Statistik
Beschreibende Statistik und der Übergang zur beurteilenden Statistik Guido Herweyers KHBO Campus Oostende K.U.Leuven 1. Vorwort Der Einsatz des Voyage 200 erleichert die Verarbeitung von Daten und erlaubt
MehrBachelor BEE Statistik Übung: Blatt 1 Ostfalia - Hochschule für angewandte Wissenschaften Fakultät Versorgungstechnik Aufgabe (1.1): Gegeben sei die folgende Messreihe: Nr. ph-werte 1-10 6.4 6.3 6.7 6.5
MehrAufgabenblock 4. Da Körpergröße normalverteilt ist, erhalten wir aus der Tabelle der t-verteilung bei df = 19 und α = 0.05 den Wert t 19,97.
Aufgabenblock 4 Aufgabe ) Da s = 8. cm nur eine Schätzung für die Streuung der Population ist, müssen wir den geschätzten Standardfehler verwenden. Dieser berechnet sich als n s s 8. ˆ = = =.88. ( n )
MehrStatistik, Datenanalyse und Simulation
Dr. Michael O. Distler distler@kph.uni-mainz.de Mainz, 31. Mai 2011 4. Methode der kleinsten Quadrate Geschichte: Von Legendre, Gauß und Laplace zu Beginn des 19. Jahrhunderts eingeführt. Die Methode der
Mehr10. Vorlesung. Grundlagen in Statistik. Seite 291. Martin-Luther-Universität Halle/Wittenberg
. Vorlesung Grundlagen in Statistik Seite 29 Beispiel Gegeben: Termhäufigkeiten von Dokumenten Problemstellung der Sprachmodellierung Was sagen die Termhäufigkeiten über die Wahrscheinlichkeit eines Dokuments
MehrDefinition 2.1 Der Erwartungswert einer diskreten Zufallsvariablen mit Wahrscheinlichkeitsfunktion
Kapitel 2 Erwartungswert 2.1 Erwartungswert einer Zufallsvariablen Definition 2.1 Der Erwartungswert einer diskreten Zufallsvariablen mit Wahrscheinlichkeitsfunktion È ist definiert als Ü ÜÈ Üµ Für spätere
Mehrk np g(n, p) = Pr p [T K] = Pr p [T k] Φ. np(1 p) DWT 4.1 Einführung 359/467 Ernst W. Mayr
Die so genannte Gütefunktion g gibt allgemein die Wahrscheinlichkeit an, mit der ein Test die Nullhypothese verwirft. Für unser hier entworfenes Testverfahren gilt ( ) k np g(n, p) = Pr p [T K] = Pr p
MehrElementäre Bausteine m = 10 micron. Blutzelle Atom 1800 D.N.A Elektron m = 0.1 nanometer Photon 1900
Was ist Physik? Das Studium der uns umgebenden Welt vom Universum bis zum Atomkern, bzw. vom Urknall bis weit in die Zukunft, mit Hilfe von wenigen Grundprinzipien. Diese gesetzmäßigen Grundprinzipien
MehrEinführung in die Induktive Statistik: Testen von Hypothesen
Einführung in die Induktive Statistik: Testen von Hypothesen Jan Gertheiss LMU München Sommersemester 2011 Vielen Dank an Christian Heumann für das Überlassen von TEX-Code! Testen: Einführung und Konzepte
Mehr4 Diskrete Wahrscheinlichkeitsverteilungen
4 Diskrete Wahrscheinlichkeitsverteilungen 4.1 Wahrscheinlichkeitsräume, Ereignisse und Unabhängigkeit Definition: Ein diskreter Wahrscheinlichkeitsraum ist ein Paar (Ω, Pr), wobei Ω eine endliche oder
MehrSchätzer und Konfidenzintervalle
Kapitel 2 Schätzer und Konfidenzintervalle Bisher haben wir eine mathematische Theorie entwickelt, die es uns erlaubt, gewisse zufällige Phänomene zu modellieren. Zum Beispiel modellieren wir die Anzahl
MehrVon der Normalverteilung zu z-werten und Konfidenzintervallen
Von der Normalverteilung zu z-werten und Konfidenzintervallen Sven Garbade Fakultät für Angewandte Psychologie SRH Hochschule Heidelberg sven.garbade@hochschule-heidelberg.de Statistik 1 S. Garbade (SRH
MehrStetige Verteilungen. A: Beispiele Beispiel 1: a) In den folgenden Abbildungen sind die Dichtefunktionen von drei bekannten Verteilungen graphisch
6 Stetige Verteilungen 1 Kapitel 6: Stetige Verteilungen A: Beispiele Beispiel 1: a) In den folgenden Abbildungen sind die Dichtefunktionen von drei bekannten Verteilungen graphisch dargestellt. 0.2 6
MehrKern- und Schulcurriculum Mathematik Klasse 11/12. Stand Schuljahr 2012/13
Kern- und Schulcurriculum Mathematik Klasse 11/12 Stand Schuljahr 2012/13 UE 1 Wiederholung Funktionen Änderungsrate Ableitung Ableitung berechnen Ableitungsfunktion Ableitungsregeln für Potenz, Summe
Mehr4. Schließende Statistik (Inferenzstatistik, konfirmatorische Verfahren)
4. Schließende Statistik (Inferenzstatistik, konfirmatorische Verfahren) 4.1. Einführung Schätzen unbekannter Parameter im Modell, z.b. Wahrscheinlichkeiten p i (Anteile in der Gesamtmenge), Erwartungswerte
Mehr1,11 1,12 1,13 1,14 1,15 1,16 1,17 1,17 1,17 1,18
3. Deskriptive Statistik Ziel der deskriptiven (beschreibenden) Statistik (explorativen Datenanalyse) ist die übersichtliche Darstellung der wesentlichen in den erhobenen Daten enthaltene Informationen
MehrBeurteilende Statistik
Beurteilende Statistik Wahrscheinlichkeitsrechnung und Beurteilende Statistik was ist der Unterschied zwischen den beiden Bereichen? In der Wahrscheinlichkeitstheorie werden aus gegebenen Wahrscheinlichkeiten
MehrInhaltsverzeichnis. Inhalt Teil I: Beschreibende (Deskriptive) Statistik Seite. 1.0 Erste Begriffsbildungen Merkmale und Skalen 5
Inhaltsverzeichnis Inhalt Teil I: Beschreibende (Deskriptive) Statistik Seite 1.0 Erste Begriffsbildungen 1 1.1 Merkmale und Skalen 5 1.2 Von der Urliste zu Häufigkeitsverteilungen 9 1.2.0 Erste Ordnung
Mehr9 Die Normalverteilung
9 Die Normalverteilung Dichte: f(x) = 1 2πσ e (x µ)2 /2σ 2, µ R,σ > 0 9.1 Standard-Normalverteilung µ = 0, σ 2 = 1 ϕ(x) = 1 2π e x2 /2 Dichte Φ(x) = 1 x 2π e t2 /2 dt Verteilungsfunktion 331 W.Kössler,
MehrKeine Panik vor Statistik!
Markus Oestreich I Oliver Romberg Keine Panik vor Statistik! Erfolg und Spaß im Horrorfach nichttechnischer Studiengänge STUDIUM 11 VIEWEG+ TEUBNER Inhaltsverzeichnis 1 Erstmal locker bleiben: Es längt
MehrUnivariates Datenmaterial
Univariates Datenmaterial 1.6.1 Deskriptive Statistik Zufallstichprobe: Umfang n, d.h. Stichprobe von n Zufallsvariablen o Merkmal/Zufallsvariablen: Y = {Y 1, Y 2,..., Y n } o Realisationen/Daten: x =
MehrHypothesentest, ein einfacher Zugang mit Würfeln
R. Brinkmann http://brinkmann-du.de Seite 4..4 ypothesentest, ein einfacher Zugang mit Würfeln Von einem Laplace- Würfel ist bekannt, dass bei einmaligem Wurf jede einzelne der Zahlen mit der Wahrscheinlichkeit
MehrHauptprüfung Fachhochschulreife Baden-Württemberg
Hauptprüfung Fachhochschulreife 2014 Baden-Württemberg Aufgabe 7 Mathematik in der Praxis Hilfsmittel: grafikfähiger Taschenrechner Berufskolleg Alexander Schwarz www.mathe-aufgaben.com Juni 2015 1 Die
Mehr5.8 Anpassungstests. W. Kössler (IfI HU Berlin) Werkzeuge der empirischen Forschung 389 / 419
5.8 8.1 Einführung empirische Verteilungsfunktion 8.2 EDF- Kolmogorov-Smirnov-Test Anderson-Darling-Test Cramer-von Mises-Test 8.3 Anpassungstest auf Normalverteilung - Shapiro-Wilk-Test 8.4. auf weitere
Mehr1.1.1 Ergebnismengen Wahrscheinlichkeiten Formale Definition der Wahrscheinlichkeit Laplace-Experimente...
Inhaltsverzeichnis 0 Einführung 1 1 Zufallsvorgänge und Wahrscheinlichkeiten 5 1.1 Zufallsvorgänge.......................... 5 1.1.1 Ergebnismengen..................... 6 1.1.2 Ereignisse und ihre Verknüpfung............
MehrKlausur zu Statistik II
GOETHE-UNIVERSITÄT FRANKFURT FB Wirtschaftswissenschaften Statistik und Methoden der Ökonometrie Prof. Dr. Uwe Hassler Wintersemester 03/04 Klausur zu Statistik II Matrikelnummer: Hinweise Hilfsmittel
MehrUrsula Meiler DGQ-Regionalkreis
Von Toleranzen, Prüfmitteleignung und Prozessfähigkeit Interpretation von Daten durch Anwendung statistischer Methoden BEISPIEL 1 von Maßen, Toleranzen, Prüfmitteleignung und Prozessfähigkeit 2 1 Fokus
Mehr