Bioinformatik und Medizin. Brustkrebs. Population. Molekulare Eigenschaften des Brustkrebs

Größe: px
Ab Seite anzeigen:

Download "Bioinformatik und Medizin. Brustkrebs. Population. Molekulare Eigenschaften des Brustkrebs"

Transkript

1 Molekulare Eigenschaften des Brustkrebs Bioinformatik und Medizin Genomische Datenanalyse 11. Kapitel Medizinischer Fortschritt ist das vornehmste Ziel der Genomforschung und damit auch der Bioinformatik Deshalb untersucht man molekulare Vorgänge, die in einem Bezug zu einer Krankheit stehen Wie findet man heraus, ob ein molekularer Vorgang krankeitsrelevant ist? Man muß molekulare Daten von erkrankten Patienten erheben und diese auswerten. Brustkrebs Angenommen wir wollen molekulare Vorgänge im Brustkrebs untersuchen - Instabilität der Chromosomen - Veränderungen der Genexpression - Wie kommt es zu den unkontrollierten Zellteilungen, die den Tumor entstehen lassen? - Wie kommt es zu Metastasen? Worauf sollen sich Antworten auf diese Fragen beziehen? Auf Patienten die Brustkrebs haben! Population Brustkrebs = alle Menschen die jemals Brustkrebs hatten + alle Menschen die Brustkrebs haben + alle Menschen die jemals Brustkrebs bekommen werden Auf diesen sehr großen Kreis von Menschen müssen sich brauchbare Aussagen zu molekularen Mechanismen im Brustkrebs beziehen. Man spricht von der Population oder der Grundgesammtheit. Die Population ist der Brustkrebs an sich

2 Stichprobe Brustkrebs = alle Menschen die jemals Brustkrebs hatten + alle Menschen die Brustkrebs haben + alle Menschen die jemals Brustkrebs bekommen werden Eine ganze Population ist nicht beobachtbar! Beobachtbar sind nur Stichproben (Sample) aus der Population Dies sind einzelne Patienten mit Brustkrebs Lexikon: Statistische Inferenz: = Schluß von einer Inferenz Stichprobe auf die Population Etwas über Brustkrebs an sich zu lernen ist also ein Problem der statistischen Inferenz Wie schließt man von einer Stichprobe auf eine Population? Variabilität Stichprobenerhebung: Wir wählen zufällig 100 Brustkrebspatienten aus und messen die Expression des Östrogenrezeptors. Diese Menge ist in allen Patienten unterschiedlich Ursachen: - Biologische Variabilität - Messungenauigkeit Wir können die Stichprobe durch eine empirische Verteilung von Expressionsmessungen beschreiben. Diese Verteilung besitzt einen Mittelwert, eine Varianz, Quantile etc. 100 andere Patienten Wir wählen nocheinmal 100 weitere Brustkrebspatienten aus Auch aus dieser Stichprobe können wir eine empirische Verteilung des Expressionswertes des Östrogenrezeptors ableiten Sie ist ähnlich aber nicht gleich der der ersten 100 Patienten Auch sie hat einen Mittelwert, eine Varianz, Quantile etc. Diese sind ähnlich aber nicht gleich wie bei den ersten 100 Patienten

3 Sampling-Variabilität Aus der Stichprobenerhebung (dem Sampling) selbst resultiert eine Variabilität der Daten. Man Spricht von Sampling-Variabilität Zufälliges auswählen von Patienten ist ein Zufallsexperiment! Und es verhält sich auch so Sampling aus einer Population vs. Simulation einer Zufallsvariablen Das wiederholte Sampling hat analoge Eigenschaften wie das wiederholte Ausführen der Zufallsexperimente in Kapitel 4. Die Population spielt die Rolle der theoretischen Verteilung einer Zufallsvariablen X Das Sampling spielt die Rolle der Realisation dieser Zufallsvariablen (durch Simulation) Der entscheidende Unterschied: In der Simulation kennen wir die Verteilung p von X Die Verteilung p der Östrogenrezeptorexpression in der Population kennen wir nicht! Simulationen Aus den Simulationen in Kapitel 4 haben wir gelernt, daß sich die theoretische Verteilung bei häufigem Simulieren verrät. Die empirischen Häufigkeiten sind den theoretischen ähnlich. L A S V G E K I T D R P N F Q YMHCW 0 1 Histogramm W-Plot Populationsgrößen Der Expressionswert des Östrogenrezeptors muß nicht nur für die Stichprobe, sondern auch für die Population mit Hilfe einer Verteilung charakterisiert werden. Wir können uns die Population als eine Zufallsvariable X mit Verteilung p vorstellen. X hat einen Erwartungswert µ=e[x], eine Varianz σ 2 =Var(X),... Diese Größen sind nicht direkt beobachtbar (dazu müßte man die ganze Population untersuchen) Wir können aber mit Hilfe von Stichproben etwas über p, µ und σ 2 lernen... Wir können sie schätzen.

4 Gesetz großer Zahlen Für eine iid. Folge X 1,X 2,... gilt: r i (n) p i für n Wobei: r i (n) = X j = i, j n / n relative Häufigkeit des Werts i in den ersten i Simulationen p i =P[ X 1 =i ] (... = P [ X 17 =i ] = P [ X i =i ] ) theoretische Wahrscheinlichkeit Relative Häufigkeiten konvergieren gegen theoretische Wahrscheinlichkeiten X 1 steht stellvertret end für alle X i (sie sind ja alle gleich verteilt.) Gesetz großer Zahlen Für kontinuierliche Zufallsvariablen macht die vorherige Aussage wenig Sinn, aber auch da gilt ein Gesetz großer Zahlen: Für eine i.i.d. Folge X 1,X 2,... mit E[X 1 ]=µ gilt: für jede Realisation der Zufallsvariablen X 1,X 2,... Gesetz großer Zahlen Gesetze großer Zahlen Relative Häufigkeiten konvergieren gegen Wahrscheinlichkeiten Mittelwerte konvergieren gegen Erwartungswerte Emp. Varianzen konvergieren gegen theoretische Varianzen etc... Jede Realisation einer unendlichen Folge diskreter Zufallsvariablen enthält also die gesamte Information der zugrunde liegenden Verteilung der X i. Die Zufallsvariable hat sich völlig verraten.

5 Der frequentistische Ansatz der Statistik Aufgrund des Gesetzes großer Zahlen können wir mit Hilfe von Stichproben etwas über Populationsgrößen lernen. Der Mittelwert einer Stichprobe approximiert den Erwartungswert der Population Die empirische Verteilung approximiert die Populationsverteilung Etc. In Gegensatz zum Bayes Ansatz der Statistik (später) Mögliche Ursachen für Fehlschlüsse 1. Sampling-Variabilität: Die Stichprobengrößen approximieren die Populationsgrössen nur, sie sind ihnen nicht gleich. Besonders für kleine Stichproben kann dies zu Fehlschlüssen führen. 2. Studien-Design: Die Grundidee ist: Sampling = i.i.d. Realisation der Population. Es ist aber oft nicht klar ob aus der richtigen Population gesampled wird! Stichprobengewinnung Der Prozeß des Auswählens von Patienten (Sample) aus der Population hat entscheidenden Einfluß auf die Qualität der Aussage Ein Paar Beispiele jenseits der Bioinformatik Männer Frauen

6 Confounding Diskriminierung? Erhebt man nur Daten von Männern, sieht man keinen Zusammenhang zwischen Schuhgröße und Einkommen Erhebt man nur Daten von Frauen, sieht man auch keinen Zusammenhang zwischen Schuhgröße und Einkommen Erhebt man Daten von Männern und Frauen gleichzeitig, sieht man, daß Männer besser bezahlt werden als Frauen und die größeren Füße haben. Lexikon: Scheinkorrelation: Eine statistisch signifikante Korrelation zwischen zwei oder mehr Variablen, die nicht auf einen kausalen Zusammenhang zwischen ihnen zurückzuführen ist Confounding: Finding an association for the wrong reason Keine Diskriminierung von Frauen sondern wieder Confounding! Unklare Stichprobenerhebung Unklare Definition der Population

7 Zurück zur Bioinformatik Modelle Splicestellen: Angenommen wir hätten jeweils nur ein Sample von 10 Splicestellen zur Verfügung um ein Modell zu schätzen. Wir schätzen das Modell aus den ersten 10 Datenpunkten dann unabhängig davon nochmal aus den zweiten 10 Daten punkten und so weiter: A C G T A C G T A C G T Block von Block von 10 n. Block von 10 Was haben wir getan? Wir untersuchen auch hier eine Population: Alle Splicestellen (Bekannte wie unbekannte) Zu dieser Population gehören Basenhäufigkeiten für die einzelnen Donor Positionen, die wir aber nicht kennen Wir tun dies mehrfach mit Hilfe von Stichproben: 10 zufällig ausgesuchte Splicestellen Die relativen Häufigkeiten sind Schätzer für die Populationshäufigkeiten Dabei tritt Sampling-Variabilität auf die wir deutlich beobachten können, wenn wir die einzelnen Modelle vergleichen. Samplingvariabilität Wir schätzen die relativen Häufigkeiten der Basen in den einzelnen Positionen der Splicestellen. Diese Schätzung hängt von dem zugrunde liegenden Sample ab. Sampling ein zufälliger Prozeß. Die Relativen Häufigkeiten in den Stichproben sind also Zufallsvariablen Sie selbst haben Verteilungen mit Mittelwerten und Varianzen Allgemein: Schätzer sind Zufallsvariablen Grund: Die Samplingvariabilität

8 Setup der Schätztheorie Gegeben sind: 1. Eine Population X 2. Eine Stichprobe x 1,...,x n 3. Eine parametrisierte Familie von Verteilungen als mögliche Modelle der Population p θ Beispiel: Wir nehmen an, daß die Population Poissonverteilt ist, wir die Intensität λ der Poissonverteilung aber nicht kennen. Aufgabe: Benutze eine Stichprobe um λ zu schätzen Beispiel: Poissonverteilung Parametrisierte Familie von Verteilungen: Poissonverteilungen mit Parameter λ X~p E [X] = λ Stichprobe: Beobachtete Werte x_1,...x_n Gesetz großer Zahlen: Also erscheint ein brauchbarer Schätzer für den Parameter λ zu sein Parameter und Schätzer λ ist ein Parameter (keine Zufallsvariable) ist ein Schätzer für λ. Er hängt von dem Sampling der Stichprobe ab. Ist also eine Zufallsvariable Allgemein notiert man Schätzer in den man ein ^ über den geschätzten Parameter schreibt. Wie ist verteilt? also Verteilung des Schätzers Sind X 1 und X 2 unabhängige poissonverteilte Zufallsvariablen, dann ist X 1 +X 2 ebenfalls poissonverteilt mit Intensität λ 1 +λ 2 Der Schätzer hat eine skalierte Poissonverteilung. Dies ist im allgemeinen selbst keine Poissonverteilung.

9 Beispiel: Normalverteilung Parametrisierte Familie von Verteilungen: Normalverteilungen mit Parametern (µ,σ) X~N(µ,σ) E [X] = µ und Var(X)=σ 2 Stichprobe: Beobachtete Werte x 1,...x n Schätzer: Schätzen wir wieder den Erwartungswert der Population durch den Mittelwert der Stichprobe: Verteilung des Schätzers Sind X 1 und X 2 unabhängig N(µ 1,σ 1 ) bzw. N(µ 2,σ 2 ) verteilt, dann gilt: X 1 +X 2 ~N(µ 1 +µ 2,(σ 12 +σ 22 ) 1/2 ). ist also auch normalverteilt mit einer reduzierten Standardabweichung Präzision von Messungen Der Mittelwert normalverteilter Zufallsvariablen ist wieder normalverteilt, aber mit einer reduzierten Standardabweichung. Dies ist auch ein interessantes Ergebnis in Bezug auf normalverteilte Meßwerte: Die Ungenauigkeit einer einzelnen Messung kann durch die Standardabweichung σ beschrieben werden. Sie ist der mittlere quadratische Abstand zum wahren Wert µ. Wiederholte Messungen X 1,...,X n können zu einer einzigen Messung verdichtet werden. Diese ist um den Faktor präziser als die Einzelmessungen. Standardfehler Wiederholtes Messen erhöht die Präzision im Vergleich zu den Einzelmessungen. Die Standardabweichung des Mittelwertes nennt man auch den Standardfehler der Messungen. Die Standardabweichung bezieht sich auf die Streuung der Einzelmessungen. Der Standardfehler bezieht sich auf die Streuung des Mittelwertes der Messungen. Man gewinnt Präzision (verliert Streuung) mit Rate:

10 Qualität eines Schätzers In beiden Beispielen hatten wir Lageparameter geschätzt und dabei das arithmetische Mittel der Stichprobenwerte benutzt. Wir könnten aber auch andere empirische Lagemaße benutzen. Zum Beispiel den Median Was ist besser? Wie kann man Schätzer beurteilen? Ein guter Schätzer sollte möglichst gut die Eigenschaften der Population X widerspiegeln. Das wahre Modell Wir sind wieder in der allgemeinen Schätzsituation mit 1. Einer Population X 2. Einer Stichprobe (x 1,...,x 2 ) 3. Einer parametrisierten Familie von Verteilungen p θ 4. Und einem Schätzer Wir nehmen an, daß es ein wahres Modell in der parametrisierten Familie gibt. Ein Modell das die Population perfekt beschreibt. Es hat den Parameter θ Mean Squared Error Ein einfaches Maß für die Güte eines Schätzers ist der Mean Squared Error (MSE): Varianz und Bias = 0 Lesen sie diese Rechnung einmal laut vor! Der Schätzer: Eine Zufallsvariable Der wahre Parameter: Im Allgemeinen unbekannt. Auch der Erwartungswert wird im Kontext der unbekannten wahren Verteilung ausgerechnet. Den MSE kann man scheinbar auch nur ausrechnen, wenn man kennen würde, was man ja gerade nicht kennt! Die Varianz des Schätzers Der Bias (systematische Fehler) des Schätzers

11 Erwartungstreue Schätzer Der MSE setzt sich aus zwei Komponenten zusammen: Die erste mißt die Streuung des Schätzers, die zweite den systematischen Fehler. MSE = Varianz + Bias 2 Gilt für alle θ: Schätzung von Erwartungswerten Schätzt man einen Parameter, der gleichzeitig der Erwartungswert der Verteilung ist, durch den Mittelwert, ist dies immer eine erwartungstreue Schätzung.... dann macht der Schätzer nie einen systematischen Fehler. Er heißt dann auch unbiased oder erwartungstreu. Dies ist zum Beispiel in unseren Beispielen zur Schätzung der Intensität einer Poissonverteilung oder dem Lageparameter einer Normalverteilung der Fall. Für symmetrische Verteilungen ist auch der Median ein erwartungstreuer Schätzer für µ. Bias Mittelwert oder der Median Ein Bias bedeutet, daß der Schätzer voreingenommen ist, und nicht ausschließlich auf den Daten fußt, sondern noch von etwas anderem beeinflußt wird. Für erwartungstreue Schätzer ist ein Summand im MSE bereits Null. Dann bleibt nur noch die Varianz. Diese kann in einzelnen Fällen jedoch sehr hoch sein, und ließe sich durch einen Schätzer mit Bias senken. Ein bisschen Bias ist manchmal gar nicht so schlecht > X=matrix(rnorm(50000,5,1),10000,5) > md=apply(x, 1, FUN="median") > m=apply(x, 1, FUN="mean") > mean(m) [1] > mean(md) [1] > sd(m) [1] > sd(md) [1] > sd(md)/sd(m) [1]

12 Effizienz Sowohl der Mittelwert als auch der Median sind erwartungstreue Schätzer. Der MSE besteht also nur aus der Varianz des Schätzers. Die Varianz des Medians ist etwa 1.2 mal so groß wie die des Mittelwertes. Der Mittelwert ist also die genauere Schätzung. Man sagt, der Mittelwert ist der effizientere Schätzer. Dies gilt zunächst nur für diese Situation mit den N(5,1)-verteilten Variablen. Die Aussage, daß der Mittelwert effizienter als der Median ist, läßt sich aber für normalverteilte Daten generell beweisen. Wir haben aber schon in Kapitel 2 gesehen, daß der Mittelwert Probleme mit Ausreißern hat. In diesen Fällen faßt er die Populationsverteilung schlecht zusammen. Man kann zeigen, daß für Verteilungen mit langsamer abfallender Dichte (hohe Wahrscheinlichkeit für Ausreißer) der Median der effizientere Schätzer ist. Er ist robuster. Robustheit Zwei Wege zum Schätzer Bisher war die Form des Schätzers immer sehr einfach und man ist ganz natürlich darauf gekommen. Wir benutzten: Relative Häufigkeiten, Mittelwerte und Mediane zum schätzen von Wahrscheinlichkeiten und Erwartungswerten Was macht man, wenn der Parameter mal nicht einen Erwartungswert kodiert? Wir diskutieren zwei Königswege zum Schätzer: 1. Momenten-Schätzer 2. Maximum-Likelihood-Schätzer Die Erwartungswerte... Momente... nennt man auch das erste, zweite, dritte bzw. n-te Moment der Verteilung. Rechts stehen typische Schätzer für diese Größen. Läßt sich ein Parameter durch geschätzte Momente eindeutig bestimmen (schätzen) so spricht man von einem Momentenschätzer. Die Methode der Momente ist ein probates Mittel gute Schätzer auch für etwas kompliziertere Verteilungen zu finden.

13 Beispiel: Extremwertverteilung Bei Extremwertverteilungen sind der Lageparameter ξ und der Skalierungsparameter θ zu schätzen. Sie entsprechen aber beide weder dem Erwartungswert noch der Varianz der Verteilungen. Stattdessen gilt: E [ X ] = ξ + c θ, wobei c die Eulerkonstante c ist. und Var ( X ) = 1/6 π 2 θ 2. Beispiel: Extremwertverteilung Methode der Momente: Schätze zunächst den Erwartungswert durch den Mittelwert und die Populationsvarianz durch die empirische Varianz der Stichprobe Schätze dann zunächst den Skalierungsparameter θ: und danach den Lageparameter ξ: Likelihoodfunktion Sei p θ eine Familie von Verteilungen und x 1,...,x n beobachtete Daten. Für jedes mögliche θ können wir seine Likelihood ausrechnen, also die Wahrscheinlichkeit der Daten in dem durch θ definiertem Modell. Sei L(θ)= i p θ (x i ) diese Wahrscheinlichkeit. L(θ) heißt Likelihoodfunktion. Bei kontinuierlichen Verteilungen sind die p θ (x i ) alle Null... deshalb ersetzt man in diesem Fall die Wahrscheinlichkeiten p θ durch die dazugehörigen Dichten φ θ. Dann ist L(θ)= i φ θ (x i ) Maximum Likelihood Schätzer Man kann argumentieren, daß falls θ 1 ein besserer Schätzer für θ als θ 2 ist. Es kann aber trotzdem durchaus sein, daß die Daten aus θ 2 generiert wurden. Nur sind sie für θ 1 eben noch typischer. Es liegt nahe die Likelihood nicht nur für zwei, sondern für alle p θ zu vergleichen, und das θ auszuwählen, für das die Likelihood am größten ist. Dieses θ nehmen wir als Schätzer. Definiere: dem Maximum-Likelihood-Schätzer für θ.

14 Log-Likelihood-Funktion Zum Berechnen des Maximum Likelihood Schätzers ist es nützlich statt L(θ) die Log-Likelihood-Funktion Berechnung des Maximum- Likelihood-Schätzers Berechne die (partielle(n)) Ableitung(en) der Log-Likelihood-Funktion: zu maximieren. Das Ergebnis ist das gleiche, da der Logarithmus monoton steigend ist. Wie rechnet man den ML-Schätzer aus? Man muß das Maximum der Likelihoodfunktion L(θ) finden: Beachte das θ=(θ 1,...,θ n ) mehrdimensional sein kann: Beispiele: θ=(µ,σ) bei Normalverteilungen θ=(ξ,ϑ) bei Extremwertverteilungen wobei die Likelihood-Scores sind. ψ i (θ) hängt nur vom i-ten Datenpunkt ab. Berechnung des Maximum- Likelihood-Schätzers Beispiel: Normalverteilung Wenn alles gutartig ist, fällt das Maximum mit der Nullstelle der Ableitung zusammen: Wir lösen also: Für mehrdimensionales θ ist dies ein System von Gleichungen! Ableitungen: Nullsetzen: Der ML-Schätzer für σ ist nicht der übliche erwartungstreue Schätzer mit 1/(n-1) als Faktor

15 Anwendung: BLAST Problem: Sequenzlängen Für die Verteilung des lokalen Alignmentscores der i-ten Datenbanksequenz gilt: Wie können wir γ und θ schätzen? Idee: Wir nehmen eine i.i.d. Sequenz und verwenden sie als Query in einer BLAST-Datenbanksuche. Dabei entstehen zehntausende Realisierungen von Zufallsvariablen H i. Nennen wir sie (h 1,...,h N ) Die Datenbanksequenzen haben alle unterschiedliche Längen und damit stammt jede Realisierung aus einer anderen Verteilung. Das simulierte Sample stammt aus einer Mischung von Extremwertverteilungen. Die Parameter γ und θ sind jedoch ein gemeinsamer Bestanteil aller dieser Verteilungen. Können wir die Parameter trotzdem aus der Mischung schätzen? BLAST Aus der längenabhängigen Verteilungsfunktion: BLAST Ableiten und Nullsetzen ergibt das nicht-lineare Gleichungssystem: ergibt sich durch Ableiten nach t die längenabhängige Dichte: Damit ergibt sich für die LogLikelihood der Beobachtungen (h 1,...,h N ): Nimmt man jetzt ein Numerisches Verfahren zum Lösen dieses Gleichungssystems (z.b. Newton-Verfahren oder CG- Verfahren... in der Praxis ist das nur ein Programmaufruf), erhält man die ML-Schätzer

16 Zusammenfassung Schätzer Gesetz der großen Zahlen Sample (Stichprobe) Population Standardfehler Mean Squared Error des Schätzers Varianz des Schätzers Bias erwartungstreu Effizienz n-tes Moment einer Zufallsvariablen Momentenschätzer Maximum-Likelihood-Schätzer

Modellanpassung und Parameterschätzung. A: Übungsaufgaben

Modellanpassung und Parameterschätzung. A: Übungsaufgaben 7 Modellanpassung und Parameterschätzung 1 Kapitel 7: Modellanpassung und Parameterschätzung A: Übungsaufgaben [ 1 ] Bei n unabhängigen Wiederholungen eines Bernoulli-Experiments sei π die Wahrscheinlichkeit

Mehr

Teil VIII. Zentraler Grenzwertsatz und Vertrauensintervalle. Woche 6: Zentraler Grenzwertsatz und Vertrauensintervalle. Lernziele. Typische Situation

Teil VIII. Zentraler Grenzwertsatz und Vertrauensintervalle. Woche 6: Zentraler Grenzwertsatz und Vertrauensintervalle. Lernziele. Typische Situation Woche 6: Zentraler Grenzwertsatz und Vertrauensintervalle Patric Müller ETHZ Teil VIII Zentraler Grenzwertsatz und Vertrauensintervalle WBL 17/19, 29.05.2017 Wahrscheinlichkeit

Mehr

Mehrdimensionale Zufallsvariablen

Mehrdimensionale Zufallsvariablen Mehrdimensionale Zufallsvariablen Im Folgenden Beschränkung auf den diskreten Fall und zweidimensionale Zufallsvariablen. Vorstellung: Auswerten eines mehrdimensionalen Merkmals ( ) X Ỹ also z.b. ω Ω,

Mehr

die wir als Realisationen von unabhängig und identisch verteilten Zufallsvariablen

die wir als Realisationen von unabhängig und identisch verteilten Zufallsvariablen Kapitel 8 Schätzung von Parametern 8.1 Schätzmethoden Gegeben seien Beobachtungen Ü Ü ¾ Ü Ò die wir als Realisationen von unabhängig und identisch verteilten Zufallsvariablen ¾ Ò auffassen. Die Verteilung

Mehr

Parameterschätzung. Kapitel 14. Modell Es sei {P θ θ Θ}, Θ R m eine Familie von Verteilungen auf χ (sog. Stichprobenraum),

Parameterschätzung. Kapitel 14. Modell Es sei {P θ θ Θ}, Θ R m eine Familie von Verteilungen auf χ (sog. Stichprobenraum), Kapitel 14 Parameterschätzung Modell Es sei {P θ θ Θ}, Θ R m eine Familie von Verteilungen auf χ (sog. Stichprobenraum), = ( 1,..., n ) sei eine Realisierung der Zufallsstichprobe X = (X 1,..., X n ) zu

Mehr

Vorlesung: Statistik II für Wirtschaftswissenschaft

Vorlesung: Statistik II für Wirtschaftswissenschaft Vorlesung: Statistik II für Wirtschaftswissenschaft Prof. Dr. Helmut Küchenhoff Institut für Statistik, LMU München Sommersemester 2017 Einführung 1 Wahrscheinlichkeit: Definition und Interpretation 2

Mehr

Dr. L. Meier Statistik und Wahrscheinlichkeitsrechnung Sommer Musterlösung

Dr. L. Meier Statistik und Wahrscheinlichkeitsrechnung Sommer Musterlösung Dr. L. Meier Statistik und Wahrscheinlichkeitsrechnung Sommer 014 Musterlösung 1. 8 Punkte) a) 1 Pt)Für das Komplement gilt PR A) = 1 PR c A) = 0.968. b) 1 Pt)Nach Definition der bedingten Wahrscheinlichkeit

Mehr

Theorie Parameterschätzung Ausblick. Schätzung. Raimar Sandner. Studentenseminar "Statistische Methoden in der Physik"

Theorie Parameterschätzung Ausblick. Schätzung. Raimar Sandner. Studentenseminar Statistische Methoden in der Physik Studentenseminar "Statistische Methoden in der Physik" Gliederung 1 2 3 Worum geht es hier? Gliederung 1 2 3 Stichproben Gegeben eine Beobachtungsreihe x = (x 1, x 2,..., x n ): Realisierung der n-dimensionalen

Mehr

6. Schätzverfahren für Parameter

6. Schätzverfahren für Parameter 6. Schätzverfahren für Parameter Ausgangssituation: Ein interessierender Zufallsvorgang werde durch die ZV X repräsentiert X habe eine unbekannte Verteilungsfunktion F X (x) Wir interessieren uns für einen

Mehr

Einführung in die Maximum Likelihood Methodik

Einführung in die Maximum Likelihood Methodik in die Maximum Likelihood Methodik Thushyanthan Baskaran thushyanthan.baskaran@awi.uni-heidelberg.de Alfred Weber Institut Ruprecht Karls Universität Heidelberg Gliederung 1 2 3 4 2 / 31 Maximum Likelihood

Mehr

Stochastik Praktikum Parametrische Schätztheorie

Stochastik Praktikum Parametrische Schätztheorie Stochastik Praktikum Parametrische Schätztheorie Thorsten Dickhaus Humboldt-Universität zu Berlin 05.10.2010 Prolog Momentenmethode X : Ω 1 Ω Zufallsgröße, die Experiment beschreibt. Ein statistisches

Mehr

Musterlösung der Klausur vom 29. Juli 2003

Musterlösung der Klausur vom 29. Juli 2003 Statistik für Bioinformatiker SoSe 2003 Rainer Spang Musterlösung der Klausur vom 29. Juli 2003 Aufgabe 1. 10 Definieren Sie die folgenden statistischen Begriffe in einem Satz oder in einer Formel: 1.

Mehr

Kapitel 9. Schätzverfahren und Konfidenzintervalle. 9.1 Grundlagen zu Schätzverfahren

Kapitel 9. Schätzverfahren und Konfidenzintervalle. 9.1 Grundlagen zu Schätzverfahren Kapitel 9 Schätzverfahren und Konfidenzintervalle 9.1 Grundlagen zu Schätzverfahren Für eine Messreihe x 1,...,x n wird im Folgenden angenommen, dass sie durch n gleiche Zufallsexperimente unabhängig voneinander

Mehr

Biostatistik, Sommer 2017

Biostatistik, Sommer 2017 1/51 Biostatistik, Sommer 2017 Wahrscheinlichkeitstheorie: Verteilungen, Kenngrößen Prof. Dr. Achim Klenke http://www.aklenke.de 8. Vorlesung: 09.06.2017 2/51 Inhalt 1 Verteilungen Normalverteilung Normalapproximation

Mehr

Mathematik für Biologen

Mathematik für Biologen Mathematik für Biologen Prof. Dr. Rüdiger W. Braun Heinrich-Heine-Universität Düsseldorf 8. Dezember 2010 Teil V Schließende Statistik 1 Parameterschätzung Erwartungstreue und Konsistenz Maximum-Likelihood

Mehr

Dynamische Systeme und Zeitreihenanalyse // Multivariate Normalverteilung und ML Schätzung 11 p.2/38

Dynamische Systeme und Zeitreihenanalyse // Multivariate Normalverteilung und ML Schätzung 11 p.2/38 Dynamische Systeme und Zeitreihenanalyse Multivariate Normalverteilung und ML Schätzung Kapitel 11 Statistik und Mathematik WU Wien Michael Hauser Dynamische Systeme und Zeitreihenanalyse // Multivariate

Mehr

Zufallsvariablen. Diskret. Stetig. Verteilung der Stichprobenkennzahlen. Binomial Hypergeometrisch Poisson. Normal Lognormal Exponential

Zufallsvariablen. Diskret. Stetig. Verteilung der Stichprobenkennzahlen. Binomial Hypergeometrisch Poisson. Normal Lognormal Exponential Zufallsvariablen Diskret Binomial Hypergeometrisch Poisson Stetig Normal Lognormal Exponential Verteilung der Stichprobenkennzahlen Stetige Zufallsvariable Verteilungsfunktion: Dichtefunktion: Integralrechnung:

Mehr

Wichtige Definitionen und Aussagen

Wichtige Definitionen und Aussagen Wichtige Definitionen und Aussagen Zufallsexperiment, Ergebnis, Ereignis: Unter einem Zufallsexperiment verstehen wir einen Vorgang, dessen Ausgänge sich nicht vorhersagen lassen Die möglichen Ausgänge

Mehr

Biostatistik, Sommer 2017

Biostatistik, Sommer 2017 1/39 Biostatistik, Sommer 2017 Wahrscheinlichkeitstheorie: Gesetz der großen Zahl, Zentraler Grenzwertsatz Schließende Statistik: Grundlagen Prof. Dr. Achim Klenke http://www.aklenke.de 9. Vorlesung: 16.06.2017

Mehr

Lösungen zu Übungsblatt 9 Höhere Mathematik2/Stochastik 2 Master KI/PI

Lösungen zu Übungsblatt 9 Höhere Mathematik2/Stochastik 2 Master KI/PI Lösungen zu Übungsblatt 9 Höhere Mathematik/Stochastik Anpassung von Verteilungen Zu Aufgabe ) a) Zeichnen des Histogranmmes: Um das Histogramm zu zeichnen, benötigen wir die Höhe der Balken. Die Höhe

Mehr

7. Übung: Aufgabe 1. b), c), e) Aufgabe 2. a), c), e) Aufgabe 3. c), e) Aufgabe 4. Aufgabe 5. Aufgabe 6. Aufgabe 7. Aufgabe 8. Aufgabe 9.

7. Übung: Aufgabe 1. b), c), e) Aufgabe 2. a), c), e) Aufgabe 3. c), e) Aufgabe 4. Aufgabe 5. Aufgabe 6. Aufgabe 7. Aufgabe 8. Aufgabe 9. 7. Übung: Aufgabe 1 b), c), e) Aufgabe a), c), e) Aufgabe 3 c), e) Aufgabe 4 b) Aufgabe 5 a) Aufgabe 6 b) Aufgabe 7 e) Aufgabe 8 c) Aufgabe 9 a), c), e) Aufgabe 10 b), d) Aufgabe 11 a) Aufgabe 1 b) Aufgabe

Mehr

Man kann also nicht erwarten, dass man immer den richtigen Wert trifft.

Man kann also nicht erwarten, dass man immer den richtigen Wert trifft. 2.2.2 Gütekriterien Beurteile die Schätzfunktionen, also das Verfahren an sich, nicht den einzelnen Schätzwert. Besonders bei komplexeren Schätzproblemen sind klar festgelegte Güteeigenschaften wichtig.

Mehr

Fakultät Verkehrswissenschaften Friedrich List Professur für Ökonometrie und Statistik, insb. im Verkehrswesen. Statistik II. Prof. Dr.

Fakultät Verkehrswissenschaften Friedrich List Professur für Ökonometrie und Statistik, insb. im Verkehrswesen. Statistik II. Prof. Dr. Statistik II Fakultät Verkehrswissenschaften Friedrich List Professur für Ökonometrie und Statistik, insb. im Verkehrswesen Statistik II 2. Parameterschätzung: 2.1 Grundbegriffe; 2.2 Maximum-Likelihood-Methode;

Mehr

Modellanpassung. Einführung in die induktive Statistik. Statistik. Statistik. Friedrich Leisch

Modellanpassung. Einführung in die induktive Statistik. Statistik. Statistik. Friedrich Leisch Modellanpassung Einführung in die induktive Statistik Friedrich Leisch Institut für Statistik Ludwig-Maximilians-Universität München SS 2009 Statistik Statistik Wahrscheinlichkeitsrechnung: Gesetze bekannt,

Mehr

Statistik, Datenanalyse und Simulation

Statistik, Datenanalyse und Simulation Dr. Michael O. Distler distler@kph.uni-mainz.de Mainz, 24. Mai 2011 3. Schätzung von Parametern Problemstellung: Aus fehlerbehafteten Messungen möglichst genaue Ergebnisse erarbeiten zusammen mit Aussagen

Mehr

Statistische Inferenz

Statistische Inferenz Statistische Inferenz Prinzip der statistischen Inferenz Datensätze = Stichproben aus einer Gesamtpopulation Beispiel : Messung der Körpertemperatur von 106 gesunden Individuen man vermutet, dass sie repräsentativ

Mehr

Wahrscheinlichkeitsrechnung und Statistik

Wahrscheinlichkeitsrechnung und Statistik 10. Vorlesung - 2018 Grundbegriffe der Statistik statistische Einheiten = Objekte an denen interessierende Größen erfaßt werden z.b. Bevölkerung einer Stadt; Schüler einer bestimmten Schule; Patienten

Mehr

DWT 2.1 Maximum-Likelihood-Prinzip zur Konstruktion von Schätzvariablen 330/467 Ernst W. Mayr

DWT 2.1 Maximum-Likelihood-Prinzip zur Konstruktion von Schätzvariablen 330/467 Ernst W. Mayr 2.1 Maximum-Likelihood-Prinzip zur Konstruktion von Schätzvariablen Wir betrachten nun ein Verfahren zur Konstruktion von Schätzvariablen für Parameter von Verteilungen. Sei X = (X 1,..., X n ). Bei X

Mehr

Mathematische Statistik Aufgaben zum Üben. Schätzer

Mathematische Statistik Aufgaben zum Üben. Schätzer Prof. Dr. Z. Kabluchko Wintersemester 2016/17 Philipp Godland 14. November 2016 Mathematische Statistik Aufgaben zum Üben Keine Abgabe Aufgabe 1 Schätzer Es seien X 1,..., X n unabhängige und identisch

Mehr

Marcel Dettling. GdM 2: LinAlg & Statistik FS 2017 Woche 12. Winterthur, 17. Mai Institut für Datenanalyse und Prozessdesign

Marcel Dettling. GdM 2: LinAlg & Statistik FS 2017 Woche 12. Winterthur, 17. Mai Institut für Datenanalyse und Prozessdesign Marcel Dettling Institut für Datenanalyse und Prozessdesign Zürcher Hochschule für Angewandte Wissenschaften marcel.dettling@zhaw.ch http://stat.ethz.ch/~dettling Winterthur, 17. Mai 2017 1 Verteilung

Mehr

ETWR Teil B. Spezielle Wahrscheinlichkeitsverteilungen (stetig)

ETWR Teil B. Spezielle Wahrscheinlichkeitsverteilungen (stetig) ETWR Teil B 2 Ziele Bisher (eindimensionale, mehrdimensionale) Zufallsvariablen besprochen Lageparameter von Zufallsvariablen besprochen Übertragung des gelernten auf diskrete Verteilungen Ziel des Kapitels

Mehr

Wahrscheinlichkeitsverteilungen

Wahrscheinlichkeitsverteilungen Universität Bielefeld 3. Mai 2005 Wahrscheinlichkeitsrechnung Wahrscheinlichkeitsrechnung Das Ziehen einer Stichprobe ist die Realisierung eines Zufallsexperimentes. Die Wahrscheinlichkeitsrechnung betrachtet

Mehr

Statistik I für Betriebswirte Vorlesung 4

Statistik I für Betriebswirte Vorlesung 4 Statistik I für Betriebswirte Vorlesung 4 Prof. Dr. Hans-Jörg Starkloff TU Bergakademie Freiberg Institut für Stochastik 25. April 2016 Prof. Dr. Hans-Jörg Starkloff Statistik I für Betriebswirte Vorlesung

Mehr

Statistics, Data Analysis, and Simulation SS 2015

Statistics, Data Analysis, and Simulation SS 2015 Mainz, 2. Juli 2015 Statistics, Data Analysis, and Simulation SS 2015 08.128.730 Statistik, Datenanalyse und Simulation Dr. Michael O. Distler Konjugierte Prior Konjugierte Prior

Mehr

Vorlesung Gesamtbanksteuerung Mathematische Grundlagen II Dr. Klaus Lukas Carsten Neundorf. Vorlesung 04 Mathematische Grundlagen II,

Vorlesung Gesamtbanksteuerung Mathematische Grundlagen II Dr. Klaus Lukas Carsten Neundorf. Vorlesung 04 Mathematische Grundlagen II, Vorlesung Gesamtbanksteuerung Mathematische Grundlagen II Dr. Klaus Lukas Carsten Neundorf 1 Was sollen Sie heute lernen? 2 Agenda Wiederholung stetige Renditen deskriptive Statistik Verteilungsparameter

Mehr

Statistics, Data Analysis, and Simulation SS 2017

Statistics, Data Analysis, and Simulation SS 2017 Mainz, 26. Juni 2017 Statistics, Data Analysis, and Simulation SS 2017 08.128.730 Statistik, Datenanalyse und Simulation Dr. Michael O. Distler Dr. Michael O. Distler

Mehr

Statistik K urs SS 2004

Statistik K urs SS 2004 Statistik K urs SS 2004 3.Tag Grundlegende statistische Maße Mittelwert (mean) Durchschnitt aller Werte Varianz (variance) s 2 Durchschnittliche quadrierte Abweichung aller Werte vom Mittelwert >> Die

Mehr

Korollar 116 (Grenzwertsatz von de Moivre)

Korollar 116 (Grenzwertsatz von de Moivre) Ein wichtiger Spezialfall das Zentralen Grenzwertsatzes besteht darin, dass die auftretenden Zufallsgrößen Bernoulli-verteilt sind. Korollar 116 (Grenzwertsatz von de Moivre) X 1,..., X n seien unabhängige

Mehr

Statistik III. Walter Zucchini Fred Böker Andreas Stadie

Statistik III. Walter Zucchini Fred Böker Andreas Stadie Statistik III Walter Zucchini Fred Böker Andreas Stadie Inhaltsverzeichnis 1 Zufallsvariablen und ihre Verteilung 1 1.1 Diskrete Zufallsvariablen........................... 1 1.2 Stetige Zufallsvariablen............................

Mehr

2.3 Intervallschätzung

2.3 Intervallschätzung 2.3.1 Motivation und Hinführung Bsp. 2.11. [Wahlumfrage] Der wahre Anteil der rot-grün Wähler 2009 war genau 33.7%. Wie groß ist die Wahrscheinlichkeit, in einer Zufallsstichprobe von 1000 Personen genau

Mehr

Wahrscheinlichkeit und Statistik: Zusammenfassung

Wahrscheinlichkeit und Statistik: Zusammenfassung HSR Hochschule für Technik Rapperswil Wahrscheinlichkeit und Statistik: Zusammenfassung beinhaltet Teile des Skripts von Herrn Hardy von Lukas Wilhelm lwilhelm.net 12. Januar 2007 Inhaltsverzeichnis 1

Mehr

Statistik I für Betriebswirte Vorlesung 13

Statistik I für Betriebswirte Vorlesung 13 Statistik I für Betriebswirte Vorlesung 13 Prof. Dr. Hans-Jörg Starkloff TU Bergakademie Freiberg Institut für Stochastik 4. Juli 2016 Prof. Dr. Hans-Jörg Starkloff Statistik I für Betriebswirte Vorlesung

Mehr

Bootstrap: Punktschätzung

Bootstrap: Punktschätzung Resampling Methoden Dortmund, 2005 (Jenő Reiczigel) 1 Bootstrap: Punktschätzung 1. Die Grundidee 2. Plug-in Schätzer 3. Schätzung des Standardfehlers 4. Schätzung und Korrektur der Verzerrung 5. Konsistenz

Mehr

2.3 Intervallschätzung

2.3 Intervallschätzung 2.3.1 Motivation und Hinführung Bsp. 2.15. [Wahlumfrage] Der wahre Anteil der rot-grün Wähler unter allen Wählern war 2009 auf eine Nachkommastelle gerundet genau 33.7%. Wie groß ist die Wahrscheinlichkeit,

Mehr

Biostatistik, Winter 2011/12

Biostatistik, Winter 2011/12 Biostatistik, Winter 2011/12 Wahrscheinlichkeitstheorie:, Kenngrößen Prof. Dr. Achim Klenke http://www.aklenke.de 7. Vorlesung: 09.12.2011 1/58 Inhalt 1 2 Kenngrößen von Lagemaße 2/58 mit Dichte Normalverteilung

Mehr

Beispiel 6 (Einige Aufgaben zur Gleichverteilung)

Beispiel 6 (Einige Aufgaben zur Gleichverteilung) Beispiel 6 (Einige Aufgaben zur Gleichverteilung) Aufgabe (Anwendung der Chebyshev-Ungleichung) Sei X eine Zufallsvariable mit E(X) = µ und var(x) = σ a) Schätzen Sie die Wahrscheinlichkeit dafür, daß

Mehr

Statistik Testverfahren. Heinz Holling Günther Gediga. Bachelorstudium Psychologie. hogrefe.de

Statistik Testverfahren. Heinz Holling Günther Gediga. Bachelorstudium Psychologie. hogrefe.de rbu leh ch s plu psych Heinz Holling Günther Gediga hogrefe.de Bachelorstudium Psychologie Statistik Testverfahren 18 Kapitel 2 i.i.d.-annahme dem unabhängig. Es gilt also die i.i.d.-annahme (i.i.d = independent

Mehr

1.8 Mehrdimensionale Zufallsvariablen

1.8 Mehrdimensionale Zufallsvariablen 1.8 Mehrdimensionale Zufallsvariablen 1.8 Mehrdimensionale Zufallsvariablen Im Folgenden Beschränkung auf den diskreten Fall und zweidimensionale Zufallsvariablen. Schnelldurchgang unter Bezug auf das

Mehr

UE Statistische Mustererkennung WS 2018 Angaben zur 2ten Aufgabengruppe

UE Statistische Mustererkennung WS 2018 Angaben zur 2ten Aufgabengruppe UE Statistische Mustererkennung WS 2018 Angaben zur 2ten Aufgabengruppe 1 Aufgabe UE-II.1 Generieren Sie je 1000 Stichproben (samples) mit Umfang 5/30/100/500 für die Normalverteilung N(µ, σ 2 ) = N(4,

Mehr

Vorlesung: Statistik II für Wirtschaftswissenschaft

Vorlesung: Statistik II für Wirtschaftswissenschaft Vorlesung: Statistik II für Wirtschaftswissenschaft Prof. Dr. Helmut Küchenhoff Institut für Statistik, LMU München Sommersemester 2017 6 Genzwertsätze Einführung 1 Wahrscheinlichkeit: Definition und Interpretation

Mehr

Binomialverteilung. Häufigkeit, mit der Ereignis A bei n unabhängigen Versuchen eintritt. Träger von X : X = {0, 1, 2,..., n}.

Binomialverteilung. Häufigkeit, mit der Ereignis A bei n unabhängigen Versuchen eintritt. Träger von X : X = {0, 1, 2,..., n}. Binomialverteilung Konstruktionsprinzip: Ein Zufallsexperiment wird n mal unabhängig durchgeführt. Wir interessieren uns jeweils nur, ob ein bestimmtes Ereignis A eintritt oder nicht. X = Häufigkeit, mit

Mehr

Wahrscheinlichkeitstheorie und Statistik vom

Wahrscheinlichkeitstheorie und Statistik vom INSTITUT FÜR STOCHASTIK SS 2010 Karlsruher Institut für Technologie Priv.-Doz. Dr. D. Kadelka Klausur Wahrscheinlichkeitstheorie und Statistik vom 14.9.2010 Musterlösungen Aufgabe 1: Gegeben sei eine Urliste

Mehr

2 Aufgaben aus [Teschl, Band 2]

2 Aufgaben aus [Teschl, Band 2] 20 2 Aufgaben aus [Teschl, Band 2] 2.1 Kap. 25: Beschreibende Statistik 25.3 Übungsaufgabe 25.3 a i. Arithmetisches Mittel: 10.5 ii. Median: 10.4 iii. Quartile: x 0.25 Y 4 10.1, x 0.75 Y 12 11.1 iv. Varianz:

Mehr

Auswahl von Schätzfunktionen

Auswahl von Schätzfunktionen Auswahl von Schätzfunktionen Worum geht es in diesem Modul? Überblick zur Punktschätzung Vorüberlegung zur Effizienz Vergleich unserer Schätzer für My unter Normalverteilung Relative Effizienz Einführung

Mehr

3.3 Methoden zur Evaluierung von Schätzern

3.3 Methoden zur Evaluierung von Schätzern 3.3 Methoden zur Evaluierung von Schätzern Bis jetzt haben wir nur glaubwürdige Techniken zur Konstruktion von Punktschätzern besprochen. Falls unterschiedliche Schätzer für einen Parameter resultieren,

Mehr

WS 2014/15. (d) Bestimmen Sie die Wahrscheinlichkeitsfunktion von X. (e) Bestimmen Sie nun den Erwartungswert und die Varianz von X.

WS 2014/15. (d) Bestimmen Sie die Wahrscheinlichkeitsfunktion von X. (e) Bestimmen Sie nun den Erwartungswert und die Varianz von X. Fragenkatalog zur Übung Methoden der empirischen Sozialforschung WS 2014/15 Hier finden Sie die denkbaren Fragen zum ersten Teil der Übung. Das bedeutet, dass Sie zu diesem Teil keine anderen Fragen im

Mehr

Vorlesung Gesamtbanksteuerung Mathematische Grundlagen II Dr. Klaus Lukas Carsten Neundorf

Vorlesung Gesamtbanksteuerung Mathematische Grundlagen II Dr. Klaus Lukas Carsten Neundorf Vorlesung Gesamtbanksteuerung Mathematische Grundlagen II Dr. Klaus Lukas Carsten Neundorf 1 Agenda Wiederholung stetige Renditen deskriptive Statistik Verteilungsparameter Erwartsungswert und Varianz

Mehr

Teil VII. Deskriptive Statistik. Woche 5: Deskriptive Statistik. Arbeitsschritte der Datenanalyse. Lernziele

Teil VII. Deskriptive Statistik. Woche 5: Deskriptive Statistik. Arbeitsschritte der Datenanalyse. Lernziele Woche 5: Deskriptive Statistik Teil VII Patric Müller Deskriptive Statistik ETHZ WBL 17/19, 22.05.2017 Wahrscheinlichkeit und Statistik Patric Müller WBL 2017 Wahrscheinlichkeit

Mehr

Statistik Einführung // Stichprobenverteilung 6 p.2/26

Statistik Einführung // Stichprobenverteilung 6 p.2/26 Statistik Einführung Kapitel 6 Statistik WU Wien Gerhard Derflinger Michael Hauser Jörg Lenneis Josef Leydold Günter Tirler Rosmarie Wakolbinger Statistik Einführung // 6 p.0/26 Lernziele 1. Beschreiben

Mehr

Auswertung und Lösung

Auswertung und Lösung Dieses Quiz soll Ihnen helfen, Kapitel 4.6 und 4.7 besser zu verstehen. Auswertung und Lösung Abgaben: 59 / 265 Maximal erreichte Punktzahl: 8 Minimal erreichte Punktzahl: 0 Durchschnitt: 4.78 1 Frage

Mehr

Lösungen zur Klausur GRUNDLAGEN DER WAHRSCHEINLICHKEITSTHEORIE UND STATISTIK

Lösungen zur Klausur GRUNDLAGEN DER WAHRSCHEINLICHKEITSTHEORIE UND STATISTIK Institut für Stochastik Dr. Steffen Winter Lösungen zur Klausur GRUNDLAGEN DER WAHRSCHEINLICHKEITSTHEORIE UND STATISTIK für Studierende der INFORMATIK vom 17. Juli 01 (Dauer: 90 Minuten) Übersicht über

Mehr

Hypothesentests für Erwartungswert und Median. Statistik (Biol./Pharm./HST) FS 2015

Hypothesentests für Erwartungswert und Median. Statistik (Biol./Pharm./HST) FS 2015 Hypothesentests für Erwartungswert und Median Statistik (Biol./Pharm./HST) FS 2015 Normalverteilung X N μ, σ 2 X ist normalverteilt mit Erwartungswert μ und Varianz σ 2 pdf: pdf cdf:??? cdf 1 Zentraler

Mehr

Notgepäck Genauigkeit

Notgepäck Genauigkeit Notgepäck Genauigkeit Beat Hulliger Dienst Statistische Methoden, Bundesamt für Statistik 20.4.2006 1 Was ist Genauigkeit genau? Um zu beschreiben, was Genauigkeit in der Statistik ist, müssen wir untersuchen,

Mehr

Statistik. Sommersemester Prof. Dr. Stefan Etschberger HSA. für Betriebswirtschaft und International Management

Statistik. Sommersemester Prof. Dr. Stefan Etschberger HSA. für Betriebswirtschaft und International Management Statistik für Betriebswirtschaft und International Management Sommersemester 2014 Prof. Dr. Stefan Etschberger HSA Streuungsparameter Varianz Var(X) bzw. σ 2 : [x i E(X)] 2 f(x i ), wenn X diskret Var(X)

Mehr

Einführung in die Statistik

Einführung in die Statistik Einführung in die Statistik Analyse und Modellierung von Daten Von Prof. Dr. Rainer Schlittgen 4., überarbeitete und erweiterte Auflage Fachbereich Materialwissenschaft! der Techn. Hochschule Darmstadt

Mehr

Statistik Klausur Sommersemester 2013 Hamburg, BITTE LESERLICH IN DRUCKBUCHSTABEN AUSFÜLLEN!

Statistik Klausur Sommersemester 2013 Hamburg, BITTE LESERLICH IN DRUCKBUCHSTABEN AUSFÜLLEN! Statistik 2 1. Klausur Sommersemester 2013 Hamburg, 26.07.2013 A BITTE LESERLICH IN DRUCKBUCHSTABEN AUSFÜLLEN! Nachname:............................................................................ Vorname:.............................................................................

Mehr

Statistische Methoden in den Umweltwissenschaften

Statistische Methoden in den Umweltwissenschaften Statistische Methoden in den Umweltwissenschaften Stetige und diskrete Wahrscheinlichkeitsverteilungen Lageparameter Streuungsparameter Diskrete und stetige Zufallsvariablen Eine Variable (oder Merkmal

Mehr

5. Schließende Statistik (Inferenzstatistik, konfirmatorische Verfahren)

5. Schließende Statistik (Inferenzstatistik, konfirmatorische Verfahren) 5. Schließende Statistik (Inferenzstatistik, konfirmatorische Verfahren) 5.1. Einführung Schätzen unbekannter Parameter im Modell, z.b. Wahrscheinlichkeiten p i (Anteile in der Gesamtmenge), Erwartungswerte

Mehr

Statistik II. Version A. 1. Klausur Sommersemester 2011 Hamburg, BITTE LESERLICH IN DRUCKBUCHSTABEN AUSFÜLLEN!

Statistik II. Version A. 1. Klausur Sommersemester 2011 Hamburg, BITTE LESERLICH IN DRUCKBUCHSTABEN AUSFÜLLEN! Statistik II Version A 1. Klausur Sommersemester 2011 Hamburg, 27.07.2011 BITTE LESERLICH IN DRUCKBUCHSTABEN AUSFÜLLEN! Nachname:............................................................................

Mehr

Zufallsvariablen [random variable]

Zufallsvariablen [random variable] Zufallsvariablen [random variable] Eine Zufallsvariable (Zufallsgröße) X beschreibt (kodiert) die Versuchsausgänge ω Ω mit Hilfe von Zahlen, d.h. X ist eine Funktion X : Ω R ω X(ω) Zufallsvariablen werden

Mehr

1.4 Stichproben aus einer Normalverteilung

1.4 Stichproben aus einer Normalverteilung 1.4 Stichproben aus einer Normalverteilung Die Normalverteilung ist wohl das am stärksten verbreitete Modell. Stichproben daraus führen zu nützlichen Eigenschaften der Statistiken und ergeben bekannte

Mehr

Stichproben Parameterschätzung Konfidenzintervalle:

Stichproben Parameterschätzung Konfidenzintervalle: Stichproben Parameterschätzung Konfidenzintervalle: Beispiel Wahlprognose: Die Grundgesamtheit hat einen Prozentsatz p der Partei A wählt. Wenn dieser Prozentsatz bekannt ist, dann kann man z.b. ausrechnen,

Mehr

Mathematische und statistische Methoden II

Mathematische und statistische Methoden II Methodenlehre e e Prof. Dr. G. Meinhardt 6. Stock, Wallstr. 3 (Raum 06-206) Sprechstunde jederzeit nach Vereinbarung und nach der Vorlesung. Mathematische und statistische Methoden II Dr. Malte Persike

Mehr

Statistische Methoden der Datenanalyse Wintersemester 2011/2012 Albert-Ludwigs-Universität Freiburg

Statistische Methoden der Datenanalyse Wintersemester 2011/2012 Albert-Ludwigs-Universität Freiburg Statistische Methoden der Datenanalyse Wintersemester 2011/2012 Albert-Ludwigs-Universität Freiburg Dr. Stan Lai und Prof. Markus Schumacher Physikalisches Institut Westbau 2 OG Raum 008 Telefonnummer

Mehr

Forschungsstatistik I

Forschungsstatistik I Prof. Dr. G. Meinhardt 6. Stock, Taubertsberg R. 06-06 (Persike) R. 06-31 (Meinhardt) Sprechstunde jederzeit nach Vereinbarung Forschungsstatistik I Dr. Malte Persike persike@uni-mainz.de http://psymet03.sowi.uni-mainz.de/

Mehr

Vorlesung: Statistik II für Wirtschaftswissenschaft

Vorlesung: Statistik II für Wirtschaftswissenschaft Vorlesung: Statistik II für Wirtschaftswissenschaft Prof. Dr. Helmut Küchenhoff Institut für Statistik, LMU München Sommersemester 017 4 Spezielle Zufallsgrößen Einführung 1 Wahrscheinlichkeit: Definition

Mehr

EGRESSIONSANALYSE AVID BUCHATZ NIVERSITÄT ZU KÖLN

EGRESSIONSANALYSE AVID BUCHATZ NIVERSITÄT ZU KÖLN 1 EGRESSIONSANALYSE AVID BUCHATZ NIVERSITÄT ZU KÖLN UFBAU 1 Historie 2 Anwendungen / Ziele 3 Lineare Regression/ Beispiel KQ 4 Nichtlineare Regression 5 Eigenschaften der Schätzer istorie früheste Form

Mehr

Übungen mit dem Applet Wahrscheinlichkeitsnetz

Übungen mit dem Applet Wahrscheinlichkeitsnetz Wahrscheinlichkeitsnetz 1 Übungen mit dem Applet Wahrscheinlichkeitsnetz 1 Statistischer Hintergrund... 1.1 Verteilungen... 1. Darstellung von Daten im Wahrscheinlichkeitsnetz...4 1.3 Kurzbeschreibung

Mehr

Willkommen zur Vorlesung Statistik (Master)

Willkommen zur Vorlesung Statistik (Master) Willkommen zur Vorlesung Statistik (Master) Thema dieser Vorlesung: Verteilungen stetiger Zufallsvariablen Prof. Dr. Wolfgang Ludwig-Mayerhofer Universität Siegen Philosophische Fakultät, Seminar für Sozialwissenschaften

Mehr

Biomathematik für Mediziner

Biomathematik für Mediziner Institut für Medizinische Biometrie, Informatik und Epidemiologie der Universität Bonn (Direktor: Prof. Dr. Max P. Baur) Biomathematik für Mediziner Klausur SS 2002 Aufgabe 1: Franz Beckenbauer will, dass

Mehr

9 Robuste Methoden. 9.1 Einfluss und Robustheit. i (x i x) 2 = i x iy i. c 1 = x 2 + i (x i x) 2. Einfache Regression: 9.1 Einfluss und Robustheit 205

9 Robuste Methoden. 9.1 Einfluss und Robustheit. i (x i x) 2 = i x iy i. c 1 = x 2 + i (x i x) 2. Einfache Regression: 9.1 Einfluss und Robustheit 205 9.1 Einfluss und Robustheit 205 9 Robuste Methoden 9.1 Einfluss und Robustheit a Sensitivität. Eine Beobachtung hinzufügen. Effekt? Einfache Regression: β = i(x i x)y i i (x i x) 2 = i x iy i β = β+ x,

Mehr

Kapitel 3 Schließende Statistik

Kapitel 3 Schließende Statistik Motivation Grundgesamtheit mit unbekannter Verteilung F Stichprobe X 1,...,X n mit Verteilung F Realisation x 1,...,x n der Stichprobe Rückschluss auf F Dr. Karsten Webel 160 Motivation (Fortsetzung) Kapitel

Mehr

K. Eppler, Inst. f. Num. Mathematik Übungsaufgaben. 10. Übung SS 18: Woche vom

K. Eppler, Inst. f. Num. Mathematik Übungsaufgaben. 10. Übung SS 18: Woche vom Übungsaufgaben 10. Übung SS 18: Woche vom 18. 6. 22. 6. 2016 Stochastik IV: ZG (diskret + stetig); Momente von ZG Aufgaben: s. pdf auf der homepage von Dr. Vanselow http://www.math.tu-dresden.de/ vanselow/...

Mehr

1 Wahrscheinlichkeitsrechnung. 2 Zufallsvariablen und ihre Verteilung. 3 Statistische Inferenz. 4 Intervallschätzung

1 Wahrscheinlichkeitsrechnung. 2 Zufallsvariablen und ihre Verteilung. 3 Statistische Inferenz. 4 Intervallschätzung 0 Einführung 1 Wahrscheinlichkeitsrechnung Zufallsvariablen und ihre Verteilung 3 Statistische Inferenz 4 Intervallschätzung Motivation und Hinführung Der wahre Anteil der rot-grün Wähler 009 war genau

Mehr

5. Schließende Statistik (Inferenzstatistik, konfirmatorische Verfahren)

5. Schließende Statistik (Inferenzstatistik, konfirmatorische Verfahren) 5. Schließende Statistik (Inferenzstatistik, konfirmatorische Verfahren) 5.1. Einführung Schätzen unbekannter Parameter im Modell, z.b. Wahrscheinlichkeiten p i (Anteile in der Gesamtmenge), Erwartungswerte

Mehr

1. Grundbegri e der Stochastik

1. Grundbegri e der Stochastik Wiederholung von Grundwissen der Stochastik. Grundbegri e der Stochastik Menge der Ereignisse. Die Elemente! der Menge heißen Elementarereignisse und sind unzerlegbare Ereignisse. Das Ereignis A tritt

Mehr

3.4 Asymptotische Evaluierung von Sch atzer Konsistenz Konsistenz Definition 3.4.1: konsistente Folge von Sch atzer

3.4 Asymptotische Evaluierung von Sch atzer Konsistenz Konsistenz Definition 3.4.1: konsistente Folge von Sch atzer 3.4 Asymptotische Evaluierung von Schätzer 3.4.1 Konsistenz Bis jetzt haben wir Kriterien basierend auf endlichen Stichproben betrachtet. Konsistenz ist ein asymptotisches Kriterium (n ) und bezieht sich

Mehr

Wahrscheinlichkeitsfunktion. Binomialverteilung. Binomialverteilung. Wahrscheinlichkeitshistogramme

Wahrscheinlichkeitsfunktion. Binomialverteilung. Binomialverteilung. Wahrscheinlichkeitshistogramme Binomialverteilung Wahrscheinlichkeitsfunktion Konstruktionsprinzip: Ein Zufallsexperiment wird n mal unabhängig durchgeführt. Wir interessieren uns jeweils nur, ob ein bestimmtes Ereignis A eintritt oder

Mehr

Heute. Die Binomialverteilung. Poissonverteilung. Approximation der Binomialverteilung durch die Normalverteilung

Heute. Die Binomialverteilung. Poissonverteilung. Approximation der Binomialverteilung durch die Normalverteilung Heute Die Binomialverteilung Poissonverteilung Approximation der Binomialverteilung durch die Normalverteilung Arbeiten mit Wahrscheinlichkeitsverteilungen Die Binomialverteilung Man werfe eine Münze n

Mehr

Statistik. R. Frühwirth Teil 1: Deskriptive Statistik. Statistik. Einleitung Grundbegriffe Merkmal- und Skalentypen Aussagen und

Statistik. R. Frühwirth Teil 1: Deskriptive Statistik. Statistik. Einleitung Grundbegriffe Merkmal- und Skalentypen Aussagen und Übersicht über die Vorlesung Teil : Deskriptive fru@hephy.oeaw.ac.at VO 42.090 http://tinyurl.com/tu42090 Teil 2: Wahrscheinlichkeitsrechnung Teil 3: Zufallsvariable und Verteilungen Februar 200 Teil 4:

Mehr

Abbildung 1: Dieses Quiz soll Ihnen helfen, die Residuenplots besser zu verstehen. Am Schluss kommen noch vermischte Aufgaben zur Wiederholung.

Abbildung 1: Dieses Quiz soll Ihnen helfen, die Residuenplots besser zu verstehen. Am Schluss kommen noch vermischte Aufgaben zur Wiederholung. Residuals vs Fitted Normal Q Q Residuals 2 1 0 1 2 16 18 30 Standardized residuals 2 1 0 1 2 18 30 16 5 10 15 20 25 30 Fitted values 2 1 0 1 2 Theoretical Quantiles Abbildung 1: Dieses Quiz soll Ihnen

Mehr

Biostatistik, WS 2017/18 Der Standardfehler

Biostatistik, WS 2017/18 Der Standardfehler 1/70 Biostatistik, WS 2017/18 Matthias Birkner http://www.staff.uni-mainz.de/birkner/biostatistik1718/ 24.11.2017 3/70 Ein Versuch Hirse Bild: Panicum miliaceum 4/70 Ein Versuch Ein Versuch Versuchsaufbau:

Mehr