2. Statistische Methoden in der Diagnostik. Elemente des Studiendesigns

Save this PDF as:
 WORD  PNG  TXT  JPG

Größe: px
Ab Seite anzeigen:

Download "2. Statistische Methoden in der Diagnostik. Elemente des Studiendesigns"

Transkript

1 2. Statistische Methoden in der Diagnostik Elemente des Studiendesigns Diagnosestudien in der Medizin Klassifikation in krank - nicht krank basierend auf diagnostischem Test Beispiel: Diagnose von Brustkrebs durch Mammographie Prognosestudien prognostische Faktoren In gewissem Sinne Spezialfall einer Diagnosestudie Beispiel: Prognose ob ein Patient bei vorliegenden klinischen Daten in einem definierten Zeitraum stationär behandelt werden muss. Skalentyp des Testergebnisses Auswahl der Studienteilnehmer Vergleich von diagnostischen Tests Test Integrität Screening: Population wird mit kostengünstigem diagnostischen Test untersucht, Bsp.: Pap smear screening. Biostatistische Methoden 1 Biostatistische Methoden 2 Skalentyp des Testergebnisses Auswahl der Studienteilnehmer Typischerweise binär, ordinal oder stetig nicht-binäre Skalen werden häufig mit einem Schwellenwert in zwei Kategorien eingeteilt. Fall-Kontroll-Design : Eine feste Anzahl von kranken und gesunden Personen wird mit diagnostischem Test untersucht Kohorten-Design : Eine Gruppe von Personen wird mit Test untersucht, gleichzeitig wird wahrer Krankheitszustand durch gold standard definite test, kurz Gold Standard erhoben ( ascertainment, Verifikation) Es gibt weitere Varianten, z.b. wiederholte Anwendung eines diagnostischen Tests und Verifikation nur dann, wenn mindestens ein Testergebnis positiv war. Biostatistische Methoden 3 Biostatistische Methoden 4

2 Vergleich von zwei Tests Test Integrität Verbundene Stichproben: Anwendung beider Tests auf jeden Studienteilnehmer Unverbundene Stichproben: Jeder Teilnehmer wird nur mit einem Test untersucht. Kenntnis des wahren Krankheitsstatus darf nicht das Testergebnis beeinflussen. Beispiel: Radiologe beurteilt Röntgenbild von Patientinnen, von denen er weiss dass sie Brustkerbs haben. Abhilfe: Verblindete Studien: Person, die den Test durchführt, kennt Krankheitsstatus nicht. Person, die den wahren Status ermittelt, kennt Testergebnis nicht. Biostatistische Methoden 5 Biostatistische Methoden 6 Beispiel: CASS Studie 2.1 Einfache Verfahren bei binären Tests CASS: coronary artery surgery study exercise stress test (EST) und chest pain history (CPH) bei 1465 Männern mit möglicher Herzerkrankung. Gebundene Stichprobe. Arteriographie: Gold Standard Kohortenstudie, wobei bestimmte Einschlußkriterien gelten müssen. Notation: Y = D = { 1 disease 0 non-disease { 1 test positive for disease 0 test negative for disease D = 0 D = 1 Y = 0 True negative False negative Y = 1 False positive True positive Biostatistische Methoden 7 Biostatistische Methoden 8

3 Klassifikationswahrscheinlichkeiten Fehlklassifikationswahrscheinlichkeit Man definiert nun (oft auch als Raten bezeichnet): false positive fraction FPF = P (Y = 1 D = 0) true positive fraction TPF = P (Y = 1 D = 1) false negative fraction FNF = P (Y = 0 D = 1) = 1 TPF true negative fraction TNF = P (Y = 0 D = 0) = 1 FPF Im Deutschen sind die Begriffe Sensitivität für TPF und Spezifität für TNF üblich. Mit Hilfe der Prävalenz ρ läßt sich die Fehlklassifikationswahrscheinlichkeit bestimmen: Probleme: P (Y D) = FPF (1 ρ) + FNF ρ Die zwei Möglichkeiten für Fehlklassifikation können sehr unterschiedliche Konsequenzen haben, werden hier aber gleich behandelt Die Fehlklassifikationswahrscheinlichkeit hängt von der Prävalenz ab. Biostatistische Methoden 9 Biostatistische Methoden 10 Prädiktive Werte Idealer und nutzloser Test Alternativ lässt sich die Güte eines Tests auch über die prädiktiven Werte beschreiben: positive predictive value PPV = P (D = 1 Y = 1) negative predictive value NPV = P (D = 0 Y = 0) Prädiktive Werte werden häufig zusammen mit der Wahrscheinlichkeit für ein positives Testergebnis τ = P (Y = 1) angegeben. Beachte: Prädiktive Werte hängen von der Prävalenz ρ ab. Ein idealer, perfekter Test hat die Eigenschaften TPF = 1 und FPF = 0 bzw. PPV = NPV = 1 Ein nutzloser Test hat die Eigenschaften TPF = FPF bzw. PPV = ρ und NPV = 1 ρ Biostatistische Methoden 11 Biostatistische Methoden 12

4 Wahl der Parametrisierung Die gemeinsame Verteilung von D und Y kann mit drei Parametern beschrieben werden, hierbei kann sowohl (TPF, FPF, ρ) als auch (PPV, NPV, τ) verwendet werden: PPV = NPV = ρ TPF ρ TPF + (1 ρ) FPF (1 ρ) (1 FPF) (1 ρ) (1 FPF) + ρ (1 TPF) τ = ρ TPF + (1 ρ) FPF TPF = FPF = τ PPV τ PPV + (1 τ) (1 NPV) τ (1 PPV) τ (1 PPV) + (1 τ) NPV ρ = τ PPV + (1 τ) NPV Beispiel: CASS Studie D: CAD: coronary artery disease Y : EST: exercise stress test Es ergibt sich: D = 0 D = 1 Y = % 14.2% 36.5% Y = 1 7.8% 55.6% 63.5% 30.2% 69.8% 100% TPF = 0.797, FPF=0.259, ρ = PPV = 0.877, NPV = 0.611, τ = Biostatistische Methoden 13 Biostatistische Methoden 14 Likelihood-Quotienten Interpretation von Likelihood-Quotienten diagnostic likelihood ratio : DLR Man definiert: positive DLR = DLR + = negative DLR = DLR = Auch Bayes-Faktoren genannt. P (Y = 1 D = 1) P (Y = 1 D = 0) = TPF FPF P (Y = 0 D = 1) P (Y = 0 D = 0) = 1 TPF 1 FPF PPV 1 PPV = ρ DLR+ 1 ρ 1 NPV NPV = ρ DLR 1 ρ Posteriori-Odds = Likelihood-Quotient Priori-Odds DLRs quantifizieren, wie viel man durch ein Testergebnis lernt, genauer: um wieviel sich die Chance für Krankheit bei einem positivem bzw. negativem Testergebnis ändert. DLRs hängen nicht von der Prävalenz ab. Im Beispiel ergibt sich DLR + = 3.08 und DLR = 0.27 Biostatistische Methoden 15 Biostatistische Methoden 16

5 Datengrundlage: Schätzen der Kenngrößen D = 0 D = 1 Y = 0 n D n D n Y = 1 n + D n + D n+ n D n D ML-Schätzung der Klassifikationswahrscheinlichkeiten und der prädiktiven Werte durch übliche Anteilsschätzung: ˆπ = n 1 /(n 1 + n 2 ) = n 1 /n Bsp: TPF = n + D /n D und PPV = n + D /n+ 1. Über se(ˆπ) = 2. Über se(log ˆπ) = ˆπ (1 ˆπ) n 1 ˆπ nˆπ 3. Über se(logit ˆπ) = 1 n n 2 4. Über Likelihood-Intervalle Standardfehler (wird später benötigt) 3. und 4. sind im Allgemeinen zur Berechnung von Konfidenzintervallen (KI) zu bevorzugen, wenn ˆπ nahe bei 0 bzw. 1 liegt. Biostatistische Methoden 17 Biostatistische Methoden 18 Simultane Konfidenzregion für (FPF, TPF) Gesucht ist eine simultane Konfidenzregion (KR) für das Paar (FPF, TPF) zum Niveau 1 α. Da die Schätzungen TPF und FPF unabhängig sind (sie basieren auf unterschiedlichen Daten), kann man leicht eine rechteckige KR über zwei univariate KI für TPF bzw. FPF zum Niveau 1 α mit α = 1 1 α definieren. Alternativ: Ellipsoide KR basierend auf asymptotischer Normalität. Diese sind aber schwieriger zu vermitteln. Analog: Simultane KR für prädiktive Werte. Schätzung von Likelihood-Quotienten ML-Schätzung wegen Invarianz: DLR + = TPF FPF und DLR = 1 TPF 1 FPF Standardfehler auf Log-Skala (se(log DLR ) analog): se(log DLR + ) = 1 TPF 1 FPF + n D TPF n D FPF Im Beispiel ergibt sich DLR + = 3.1 (2.6, 3.6) und DLR = 0.27 (0.24, 0.31) Biostatistische Methoden 19 Biostatistische Methoden 20

6 Simultane Konfidenzregionen für DLR + und DLR Schätzungen bei Fall-Kontroll-Design Problem: DLR + und DLR sind abhängig mit asymptotische Kovarianz gleich ( Cov(log DLR +, log DLR 1 ) = + 1 ) n D n D Beweis über multivariate Delta-Regel Kovarianz hängt nur vom Stichprobenumfang ab, kann zur Konstruktion von KRen basierend auf as. Normalität verwendet werden. Klassifikationswahrscheinlichkeiten und DLRs lassen sich genauso schätzen Schätzung der prädiktiven Werte ist nicht möglich, da Prävalenz unbekannt ist. Fall-Kontroll-Design kann aber bei seltenen Krankheiten deutlich effizienter sein, d.h. einen kleineren Stichprobenumfang benötigen. Rechteckige KRen sind hier wegen der Korrelation weniger geeignet. Biostatistische Methoden 21 Biostatistische Methoden 22 Vergleich der Genauigkeit von Tests In der CASS Studie wurden zwei Tests verglichen: FPF TPF EST 26% 80% CPH 55% 95% Als Maß zum Vergleich von Test A (CPH) mit Test B (EST) bieten sich relative Klassifikationswahrscheinlichkeiten an: rtpf(a, B) = TPF A /TPF B Alternative Größen zum Vergleich von Tests Absolute Differenzen: TPF(A, B) = TPF A TPF B FPF(A, B) = FPF A FPF B Odds Ratios: otpf(a, B) = TPF A (1 TPF B ) TPF B (1 TPF A ) ofpf(a, B) = analog rfpf(a, B) = FPF A /FPF B Hier ergibt sich rtpf(a, B) = 1.19 und rfpf(a, B) = Biostatistische Methoden 23 Biostatistische Methoden 24

7 Vergleich von prädiktiven Werten Vergleich von Likelihood-Quotienten Die gleichen Größen lassen sich auch für prädiktive Werte definieren: rppv(a, B), oppv(a, B), rnpv(a, B), onpv(a, B) und rnpv(a, B) = (1 NPV A )/(1 NPV B ) Zum Vergleich von Likelihood-Quotienten bieten sich relative Likelihood-Quotienten an: rdlr + (A, B) = DLR + A /DLR+ B Bei geringer Prävalenz ( rare disease assumption ) gilt: rppv(a, B) oppv(a, B) rnpv(a, B) 1 rnpv(a, B) 1/oNPV(B, A) Es gilt: rdlr (A, B) = DLR A /DLR B rdlr + (A, B) = oppv(a, B) rdlr (A, B) = 1/oNPV(A, B) Biostatistische Methoden 25 Biostatistische Methoden 26 Beispiel: CASS Studie Welcher Test ist besser? Hier ist DLR + EST = 3.06, DLR+ CPH = 1.71, DLR EST DLR CPH = Somit: rdlr + (CPH, EST) = 0.56 rdlr (CPH, EST) = 0.43 Interpretation? = 0.28 und Antwort einfach wenn sowohl rtpf(a, B) > 1 als auch rfpf(a, B) < 1, da gilt: Die folgenden Bedingungen sind äquivalent: (i) rtpf(a, B) > 1 und rfpf(a, B) < 1 (ii) rppv(a, B) > 1 und rnpv(a, B) > 1 Weiterhin folgt aus (i) (iii) rdlr + (A, B) > 1 und rdlr (A, B) < 1, der Umkehrschluss ist aber im Allgemeinen nicht gültig. Biostatistische Methoden 27 Biostatistische Methoden 28

8 Welcher Test ist besser? Wenn beide Dimensionen des Vergleichs nicht übereinstimmen, bietet sich ein entscheidungstheoretischer Ansatz mit erwarteten Kosten an. Beispiel: Pap smear Test und Zervikalkarzinom. Biostatistische Methoden 29

Statistical Coaching. Thomas Forstner

Statistical Coaching. Thomas Forstner Statistical Coaching Thomas Forstner Diagnoseverfahren Allgemein Vergleich: wahrer Befund mit Test (Diagnose) wahrer Befund muss bekannt sein (Goldstandard) 3 Analogie zur Testtheorie 4 Beurteilung von

Mehr

Vorlesung - Medizinische Biometrie

Vorlesung - Medizinische Biometrie Vorlesung - Medizinische Biometrie Stefan Wagenpfeil Institut für Medizinische Biometrie, Epidemiologie und Medizinische Informatik Universität des Saarlandes, Homburg / Saar Vorlesung - Medizinische Biometrie

Mehr

9. Schätzen und Testen bei unbekannter Varianz

9. Schätzen und Testen bei unbekannter Varianz 9. Schätzen und Testen bei unbekannter Varianz Dr. Antje Kiesel Institut für Angewandte Mathematik WS 2011/2012 Schätzen und Testen bei unbekannter Varianz Wenn wir die Standardabweichung σ nicht kennen,

Mehr

Themenblock. Diagnose und Prognose. Querschnittsbereich Epidemiologie, Med. Biometrie und Med. Informatik. Themen im Block Diagnose und Prognose

Themenblock. Diagnose und Prognose. Querschnittsbereich Epidemiologie, Med. Biometrie und Med. Informatik. Themen im Block Diagnose und Prognose Themenblock Diagnose und Prognose Querschnittsbereich Epidemiologie, Med. Biometrie und Med. Informatik Themen im Block Diagnose und Prognose Diagnose Prävalenz und prädiktive Werte Güte von diagnostischen

Mehr

Statistik II für Betriebswirte Vorlesung 2

Statistik II für Betriebswirte Vorlesung 2 PD Dr. Frank Heyde TU Bergakademie Freiberg Institut für Stochastik Statistik II für Betriebswirte Vorlesung 2 21. Oktober 2014 Verbundene Stichproben Liegen zwei Stichproben vor, deren Werte einander

Mehr

Statistische Inferenz bei ROC Kurven. Notation. Man unterscheidet:

Statistische Inferenz bei ROC Kurven. Notation. Man unterscheidet: Statistische Inferenz bei ROC Kurven Notation Man unterscheidet: 1. Nichtparametrische, empirische Methoden zur Berechnung der empirischen ROC Kurve 2. Parametrische Ansätze, die recht starke Annahmen

Mehr

90-minütige Klausur Statistik für Studierende der Kommunikationswissenschaft

90-minütige Klausur Statistik für Studierende der Kommunikationswissenschaft Prof. Dr. Helmut Küchenhoff SS08 90-minütige Klausur Statistik für Studierende der Kommunikationswissenschaft am 22.7.2008 Anmerkungen Überprüfen Sie bitte sofort, ob Ihre Angabe vollständig ist. Sie sollte

Mehr

Kapitel 4: Binäre Regression

Kapitel 4: Binäre Regression Kapitel 4: Binäre Regression Steffen Unkel (basierend auf Folien von Nora Fenske) Statistik III für Nebenfachstudierende WS 2013/2014 4.1 Motivation Ausgangssituation Gegeben sind Daten (y i, x i1,...,

Mehr

Medizinische Biometrie (L5)

Medizinische Biometrie (L5) Medizinische Biometrie (L5) Vorlesung V Der diagnostische Test Prof. Dr. Ulrich Mansmann Institut für Medizinische Informationsverarbeitung, Biometrie und Epidemiologie mansmann@ibe.med.uni-muenchen.de

Mehr

Diagnostische Verfahren

Diagnostische Verfahren 6. Diagnostische s Jede Registrierung oder Auswertung einer Information mit dem Ziel der Erkennung einer Erung oder eines speziellen Zustandes wird diagnostischer genannt. Beispiele Reaktion auf Ansprechen

Mehr

Profil A 49,3 48,2 50,7 50,9 49,8 48,7 49,6 50,1 Profil B 51,8 49,6 53,2 51,1 51,1 53,4 50,7 50 51,5 51,7 48,8

Profil A 49,3 48,2 50,7 50,9 49,8 48,7 49,6 50,1 Profil B 51,8 49,6 53,2 51,1 51,1 53,4 50,7 50 51,5 51,7 48,8 1. Aufgabe: Eine Reifenfirma hat für Winterreifen unterschiedliche Profile entwickelt. Bei jeweils gleicher Geschwindigkeit und auch sonst gleichen Bedingungen wurden die Bremswirkungen gemessen. Die gemessenen

Mehr

Täuschung und Manipulation mit Zahlen Teil 1

Täuschung und Manipulation mit Zahlen Teil 1 Täuschung und Manipulation mit Zahlen Teil 1 Kleines Statistikseminar zum kritischen Umgang mit Zahlen 23.3.2011 Dr. med. H.-J. Koubenec Mammasprechstunde im Immanuel Krankenhaus Berlin Folien: Mammographie-Screening.de

Mehr

ε heteroskedastisch BINARY CHOICE MODELS Beispiele: Wahlentscheidung Kauf langlebiger Konsumgüter Arbeitslosigkeit Schätzung mit OLS?

ε heteroskedastisch BINARY CHOICE MODELS Beispiele: Wahlentscheidung Kauf langlebiger Konsumgüter Arbeitslosigkeit Schätzung mit OLS? BINARY CHOICE MODELS 1 mit Pr( Y = 1) = P Y = 0 mit Pr( Y = 0) = 1 P Beispiele: Wahlentscheidung Kauf langlebiger Konsumgüter Arbeitslosigkeit Schätzung mit OLS? Y i = X i β + ε i Probleme: Nonsense Predictions

Mehr

Multinomiale logistische Regression

Multinomiale logistische Regression Multinomiale logistische Regression Die multinomiale logistische Regression dient zur Schätzung von Gruppenzugehörigkeiten bzw. einer entsprechenden Wahrscheinlichkeit hierfür, wobei als abhänginge Variable

Mehr

5.2. Nichtparametrische Tests. 5.2.1. Zwei unabhängige Stichproben: U- Test nach MANN- WHITNEY

5.2. Nichtparametrische Tests. 5.2.1. Zwei unabhängige Stichproben: U- Test nach MANN- WHITNEY 5.2. Nichtparametrische Tests 5.2.1. Zwei unabhängige Stichproben: U- Test nach MANN- WHITNEY Voraussetzungen: - Die Verteilungen der beiden Grundgesamtheiten sollten eine ähnliche Form aufweisen. - Die

Mehr

5. Schließende Statistik. 5.1. Einführung

5. Schließende Statistik. 5.1. Einführung 5. Schließende Statistik 5.1. Einführung Sollen auf der Basis von empirischen Untersuchungen (Daten) Erkenntnisse gewonnen und Entscheidungen gefällt werden, sind die Methoden der Statistik einzusetzen.

Mehr

Medizinische Statistik Epidemiologie und χ 2 Vierfeldertest

Medizinische Statistik Epidemiologie und χ 2 Vierfeldertest Universität Wien Institut für Mathematik Wintersemester 2009/2010 Medizinische Statistik Epidemiologie und χ 2 Vierfeldertest Seminar Angewandte Mathematik Ao. Univ. Prof. Dr. Peter Schmitt von Nadja Reiterer

Mehr

Statistik II für Betriebswirte Vorlesung 3

Statistik II für Betriebswirte Vorlesung 3 PD Dr. Frank Heyde TU Bergakademie Freiberg Institut für Stochastik Statistik II für Betriebswirte Vorlesung 3 5. November 2013 Beispiel: Aktiensplit (Aczel & Sounderpandan, Aufg. 14-28) Ein Börsenanalyst

Mehr

Einige Statistische Tests für den Ein- Zwei- und k-stichprobenfall (Nach Sachs, Stat. Meth.)

Einige Statistische Tests für den Ein- Zwei- und k-stichprobenfall (Nach Sachs, Stat. Meth.) ue biostatistik: nichtparametrische testverfahren / ergänzung 1/6 h. Lettner / physik Statistische Testverfahren Einige Statistische Tests für den Ein- Zwei- und k-stichprobenfall (Nach Sachs, Stat. Meth.)

Mehr

Fortgeschrittene Statistik Logistische Regression

Fortgeschrittene Statistik Logistische Regression Fortgeschrittene Statistik Logistische Regression O D D S, O D D S - R A T I O, L O G I T T R A N S F O R M A T I O N, I N T E R P R E T A T I O N V O N K O E F F I Z I E N T E N, L O G I S T I S C H E

Mehr

METHODENLEHRE I WS 2013/14 THOMAS SCHÄFER

METHODENLEHRE I WS 2013/14 THOMAS SCHÄFER METHODENLEHRE I WS 2013/14 THOMAS SCHÄFER DAS THEMA: INFERENZSTATISTIK IV INFERENZSTATISTISCHE AUSSAGEN FÜR ZUSAMMENHÄNGE UND UNTERSCHIEDE Inferenzstatistik für Zusammenhänge Inferenzstatistik für Unterschiede

Mehr

Eine Einführung in R: Statistische Tests

Eine Einführung in R: Statistische Tests Eine Einführung in R: Statistische Tests Bernd Klaus, Verena Zuber Institut für Medizinische Informatik, Statistik und Epidemiologie (IMISE), Universität Leipzig http://www.uni-leipzig.de/ zuber/teaching/ws12/r-kurs/

Mehr

Bisher angenommen: jeder Spieler kennt alle Teile des Spiels. - Diskontfaktor des Verhandlungspartners

Bisher angenommen: jeder Spieler kennt alle Teile des Spiels. - Diskontfaktor des Verhandlungspartners 1 KAP 15. Spiele unter unvollständiger Information Bisher angenommen: jeder Spieler kennt alle Teile des Spiels seine Gegenspieler, deren Aktionen, deren Nutzen, seinen eigenen Nutzen etc. Oft kennt man

Mehr

2. Übung Diagnostik. Ein erfundenes Beispiel (H.P.Beck-Bornholt und H.-H.Dubben)

2. Übung Diagnostik. Ein erfundenes Beispiel (H.P.Beck-Bornholt und H.-H.Dubben) Querschnittsbereich 1: Epidemiologie, Medizinische Biometrie und Medizinische Informatik - Übungsmaterial - Erstellt von Mitarbeitern des IMISE und des ZKS Leipzig 2. Übung Diagnostik Universität Leipzig

Mehr

Naive Bayes. 5. Dezember 2014. Naive Bayes 5. Dezember 2014 1 / 18

Naive Bayes. 5. Dezember 2014. Naive Bayes 5. Dezember 2014 1 / 18 Naive Bayes 5. Dezember 2014 Naive Bayes 5. Dezember 2014 1 / 18 Inhaltsverzeichnis 1 Thomas Bayes 2 Anwendungsgebiete 3 Der Satz von Bayes 4 Ausführliche Form 5 Beispiel 6 Naive Bayes Einführung 7 Naive

Mehr

Fall-Kontroll Studien und Selection Bias. 1.4 Fall-Kontroll Studien: Vorbemerkungen

Fall-Kontroll Studien und Selection Bias. 1.4 Fall-Kontroll Studien: Vorbemerkungen 1.4 Fall-Kontroll Studien: Vorbemerkungen Fall-Kontroll Studien und Selection Bias Fall-Kontroll Studien versuchen in gewisser Weise, eine Kohortenstudie zu imitieren, aber auf das oft zeit- und kostenaufwendige

Mehr

Interne und externe Modellvalidität

Interne und externe Modellvalidität Interne und externe Modellvalidität Interne Modellvalidität ist gegeben, o wenn statistische Inferenz bzgl. der untersuchten Grundgesamtheit zulässig ist o KQ-Schätzer der Modellparameter u. Varianzschätzer

Mehr

Trainingsaufgaben zur Klausurvorbereitung in Statistik I und II Thema: Satz von Bayes

Trainingsaufgaben zur Klausurvorbereitung in Statistik I und II Thema: Satz von Bayes Trainingsaufgaben zur Klausurvorbereitung in Statistik I und II Thema: Satz von Bayes Aufgabe 1: Wetterbericht Im Mittel sagt der Wetterbericht für den kommenden Tag zu 60 % schönes und zu 40% schlechtes

Mehr

Täuschung und Manipulation mit Zahlen

Täuschung und Manipulation mit Zahlen 58. Ärztekongress Berlin/Charité 4.11.2010 Täuschung und Manipulation mit Zahlen Kleines Statistikseminar zum kritischen Umgang mit Zahlen Dr. med. H.-J. Koubenec Mammasprechstunde im Immanuel Krankenhaus

Mehr

Standardab er des. Testwert = 145.5 95% Konfidenzintervall. T df Sig. (2-seitig) Differenz Untere Obere -2.011 698.045-5.82-11.50 -.14.

Standardab er des. Testwert = 145.5 95% Konfidenzintervall. T df Sig. (2-seitig) Differenz Untere Obere -2.011 698.045-5.82-11.50 -.14. Aufgabe : einfacher T-Test Statistik bei einer Stichprobe Standardfehl Standardab er des Mittelwert weichung Mittelwertes 699 39.68 76.59 2.894 Test bei einer Sichprobe Testwert = 45.5 95% Konfidenzintervall

Mehr

Epidemiologie / Biometrie

Epidemiologie / Biometrie Wintersemester 2004 / 2005 Epidemiologie / Biometrie Robert Hochstrat 14. März 2005 Zusammenschrift der Übung zur Vorlesung aus dem WS 04/05 Rückfragen, Ergänzungen und Korrekturen an robert hochstrat@web.de

Mehr

BSc Bioinformatik Wintersemester 2013/2014 Nachklausur zur Statistik I Freie Universität Berlin

BSc Bioinformatik Wintersemester 2013/2014 Nachklausur zur Statistik I Freie Universität Berlin Sc ioinformatik Wintersemester 013/014 Nachklausur zur Statistik I Freie Universität erlin 4. pril 014 Matrikelnummer Nachname Vorname Unterschrift ufgabe 1 (4 Punkte): Zu einem Wahrscheinlichkeitsraum

Mehr

Projekt zur Entwicklung, Umsetzung und Evaluation von Leitlinien zum adaptiven Management von Datenqualität in Kohortenstudien und Registern

Projekt zur Entwicklung, Umsetzung und Evaluation von Leitlinien zum adaptiven Management von Datenqualität in Kohortenstudien und Registern Projekt zur Entwicklung, Umsetzung und Evaluation von Leitlinien zum adaptiven Management von Datenqualität in Kohortenstudien und Registern gefördert durch die Indikatoren von Datenqualität Michael Nonnemacher

Mehr

Sensitivität und Spezifität (95% Konfidenzintervalle)

Sensitivität und Spezifität (95% Konfidenzintervalle) Prädiktive Werte als Gütemaÿe in Diagnosestudien: Anwendungsmöglichkeiten und Analysemethoden Katharina Lange Abteilung Medizinische Statistik Georg-August-Universität Göttingen Inhalt Beispiel: Diagnostische

Mehr

Anwendung: Vergleich der diagnostischen Güte Tumormarker Bronchialkarzinom: AUC

Anwendung: Vergleich der diagnostischen Güte Tumormarker Bronchialkarzinom: AUC Anwendung: Vergleich der diagnostischen Güte Tumormarker Bronchialkarzinom: AUC ROC curve for CYFRA21_1 Area under the ROC curve = 0,860 Standard error = 0,018 95% Confidence interval = 0,822 to 0,892

Mehr

Medizinische Psychologie. Bewertung wissenschaftlicher Ergebnisse, Evidenzbasierte Medizin, Anwendung statistischer Information

Medizinische Psychologie. Bewertung wissenschaftlicher Ergebnisse, Evidenzbasierte Medizin, Anwendung statistischer Information Medizinische Psychologie Bewertung wissenschaftlicher Ergebnisse, Evidenzbasierte Medizin, Anwendung statistischer Information Bewertung wissenschaftlicher Ergebnisse Replizierbarkeit (Wiederholbarkeit)

Mehr

Analyse bivariater Kontingenztafeln

Analyse bivariater Kontingenztafeln Analyse bivariater Kontingenztafeln Werden zwei kategoriale Merkmale mit nicht zu vielen möglichen Ausprägungen gemeinsam analysiert, so kommen zur Beschreibung der gemeinsamen Verteilung im allgemeinen

Mehr

12. Vergleich mehrerer Stichproben

12. Vergleich mehrerer Stichproben 12. Vergleich mehrerer Stichproben Dr. Antje Kiesel Institut für Angewandte Mathematik WS 2011/2012 Häufig wollen wir verschiedene Populationen, Verfahren, usw. miteinander vergleichen. Beipiel: Vergleich

Mehr

Diagnose und Prognose: Kurzfassung 4

Diagnose und Prognose: Kurzfassung 4 Diagnose und Prognose: Kurzfassung 4 Ziele der 4. Vorlesung Inhaltliche Verbindung zwischen inhaltlicher Statistisches Konzept / Problemstellung Problemstellung und statistischem statistische Methode Konzept/Methode

Mehr

Aufabe 7: Baum-Welch Algorithmus

Aufabe 7: Baum-Welch Algorithmus Effiziente Algorithmen VU Ausarbeitung Aufabe 7: Baum-Welch Algorithmus Florian Fest, Matr. Nr.0125496 baskit@generationfun.at Claudia Hermann, Matr. Nr.0125532 e0125532@stud4.tuwien.ac.at Matteo Savio,

Mehr

Modellbasierte Diagnosesysteme

Modellbasierte Diagnosesysteme Modellbasierte Diagnosesysteme Diagnose: Identifikation eines vorliegenden Fehlers (Krankheit) auf der Basis von Beobachtungen (Symptomen) und Hintergrundwissen über das System 2 Arten von Diagnosesystemen:

Mehr

Univariate/ multivariate Ansätze. Klaus D. Kubinger. Test- und Beratungsstelle. Effektgrößen

Univariate/ multivariate Ansätze. Klaus D. Kubinger. Test- und Beratungsstelle. Effektgrößen Univariate/ multivariate Ansätze Klaus D. Kubinger Effektgrößen Rasch, D. & Kubinger, K.D. (2006). Statistik für das Psychologiestudium Mit Softwareunter-stützung zur Planung und Auswertung von Untersuchungen

Mehr

Kommentierter SPSS-Ausdruck zur logistischen Regression

Kommentierter SPSS-Ausdruck zur logistischen Regression Daten: POK V AG 3 (POKV_AG3_V07.SAV) Kommentierter SPSS-Ausdruck zur logistischen Regression Fragestellung: Welchen Einfluss hat die Fachnähe und das Geschlecht auf die interpersonale Attraktion einer

Mehr

6 Mehrstufige zufällige Vorgänge Lösungshinweise

6 Mehrstufige zufällige Vorgänge Lösungshinweise 6 Mehrstufige zufällige Vorgänge Lösungshinweise Aufgabe 6.: Begründen Sie, warum die stochastische Unabhängigkeit zweier Ereignisse bzw. zufälliger Vorgänge nur ein Modell der Realität darstellen kann.

Mehr

Tutorial: Homogenitätstest

Tutorial: Homogenitätstest Tutorial: Homogenitätstest Eine Bank möchte die Kreditwürdigkeit potenzieller Kreditnehmer abschätzen. Einerseits lebt die Bank ja von der Vergabe von Krediten, andererseits verursachen Problemkredite

Mehr

Einflußfaktoren auf die serologische Einzeltierdiagnostik der Paratuberkulose mittels ELISA

Einflußfaktoren auf die serologische Einzeltierdiagnostik der Paratuberkulose mittels ELISA Einflußfaktoren auf die serologische Einzeltierdiagnostik der Paratuberkulose mittels ELISA Heike Köhler Bundesforschungsanstalt für Viruskrankheiten der Tiere, Standort Jena NRL Paratuberkulose Diagnostik

Mehr

Diagnose und Prognose: Kurzfassung 3

Diagnose und Prognose: Kurzfassung 3 Diagnose und Prognose: Kurzfassung 3 Themen und Ziele der 3. Vorlesung 1. Diagnostische Tests: Fehlentscheidungen möglich 2. Prädiktive Werte: Beschreibung der Wahrscheinlichkeit einer Fehlentscheidung

Mehr

Diagnostikstudien. Dr. Dirk Hasenclever IMISE, Leipzig.

Diagnostikstudien. Dr. Dirk Hasenclever IMISE, Leipzig. Diagnostikstudien Dr. Dirk Hasenclever IMISE, Leipzig Hasenclever@IMISE.uni-Leipzig.de Diagnostische Tests Krankheit ja Krankheit nein Test positiv TrueP FP Test negativ FN TrueN Test- Positive Test- Negative

Mehr

Einfache statistische Auswertungen mit dem Programm SPSS

Einfache statistische Auswertungen mit dem Programm SPSS Einfache statistische Auswertungen mit dem Programm SPSS Datensatz: fiktive_daten.sav Dipl. Päd. Anne Haßelkus Dr. Dorothea Dette-Hagenmeyer 11/2011 Überblick 1 Deskriptive Statistiken; Mittelwert berechnen...

Mehr

Verbessert Bildung den Gesundheitszustand? Ergebnisse für die Bildungsexpansion in West-Deutschland

Verbessert Bildung den Gesundheitszustand? Ergebnisse für die Bildungsexpansion in West-Deutschland Verbessert Bildung den Gesundheitszustand? Ergebnisse für die Bildungsexpansion in West-Deutschland Hendrik Jürges, MEA Steffen Reinhold, MEA Martin Salm, Universität Tilburg Siebte Jahreskonferenz des

Mehr

Ein möglicher Unterrichtsgang

Ein möglicher Unterrichtsgang Ein möglicher Unterrichtsgang. Wiederholung: Bernoulli Experiment und Binomialverteilung Da der sichere Umgang mit der Binomialverteilung, auch der Umgang mit dem GTR und den Diagrammen, eine notwendige

Mehr

Klausur zu Methoden der Statistik I (mit Kurzlösung) Wintersemester 2007/2008. Aufgabe 1

Klausur zu Methoden der Statistik I (mit Kurzlösung) Wintersemester 2007/2008. Aufgabe 1 Lehrstuhl für Statistik und Ökonometrie der Otto-Friedrich-Universität Bamberg Prof. Dr. Susanne Rässler Klausur zu Methoden der Statistik I (mit Kurzlösung) Wintersemester 2007/2008 Aufgabe 1 Ihnen liegt

Mehr

Stichprobenauslegung. für stetige und binäre Datentypen

Stichprobenauslegung. für stetige und binäre Datentypen Stichprobenauslegung für stetige und binäre Datentypen Roadmap zu Stichproben Hypothese über das interessierende Merkmal aufstellen Stichprobe entnehmen Beobachtete Messwerte abbilden Schluss von der Beobachtung

Mehr

Nichtparametrische Analyse longitudinaler Daten in faktoriellen Experimenten. Frank Konietschke

Nichtparametrische Analyse longitudinaler Daten in faktoriellen Experimenten. Frank Konietschke Nichtparametrische Analyse longitudinaler Daten in faktoriellen Experimenten Frank Konietschke Abteilung für Medizinische Statistik Universität Göttingen 1 Übersicht Beispiele CGI (repeated measures) γ-gt

Mehr

Überblick über die Verfahren für Ordinaldaten

Überblick über die Verfahren für Ordinaldaten Verfahren zur Analyse ordinalskalierten Daten 1 Überblick über die Verfahren für Ordinaldaten Unterschiede bei unabhängigen Stichproben Test U Test nach Mann & Whitney H Test nach Kruskal & Wallis parametrische

Mehr

14.01.14 DAS THEMA: INFERENZSTATISTIK II. Standardfehler Konfidenzintervalle Signifikanztests. Standardfehler

14.01.14 DAS THEMA: INFERENZSTATISTIK II. Standardfehler Konfidenzintervalle Signifikanztests. Standardfehler DAS THEMA: INFERENZSTATISTIK II INFERENZSTATISTISCHE AUSSAGEN Standardfehler Konfidenzintervalle Signifikanztests Standardfehler der Standardfehler Interpretation Verwendung 1 ZUR WIEDERHOLUNG... Ausgangspunkt:

Mehr

Ferienakademie 2001: Kryptographie und Sicherheit offener Systeme. Faktorisierung. Stefan Büttcher stefan@buettcher.org

Ferienakademie 2001: Kryptographie und Sicherheit offener Systeme. Faktorisierung. Stefan Büttcher stefan@buettcher.org Ferienakademie 2001: Kryptographie und Sicherheit offener Systeme Faktorisierung Stefan Büttcher stefan@buettcher.org 1 Definition. (RSA-Problem) Gegeben: Ò ÔÕ, ein RSA-Modul mit unbekannten Primfaktoren

Mehr

Auswahl von Schätzfunktionen

Auswahl von Schätzfunktionen Auswahl von Schätzfunktionen Worum geht es in diesem Modul? Überblick zur Punktschätzung Vorüberlegung zur Effizienz Vergleich unserer Schätzer für My unter Normalverteilung Relative Effizienz Einführung

Mehr

Schätzung des Lifetime Values von Spendern mit Hilfe der Überlebensanalyse

Schätzung des Lifetime Values von Spendern mit Hilfe der Überlebensanalyse Schätzung Lifetime Values von Spenn mit Hilfe Überlebensanalyse Einführung in das Verfahren am Beispiel Einzugsgenehmigung Überlebensanalysen o Ereignisdatenanalysen behandeln das Problem, mit welcher

Mehr

Suche schlecht beschriftete Bilder mit Eigenen Abfragen

Suche schlecht beschriftete Bilder mit Eigenen Abfragen Suche schlecht beschriftete Bilder mit Eigenen Abfragen Ist die Bilderdatenbank über einen längeren Zeitraum in Benutzung, so steigt die Wahrscheinlichkeit für schlecht beschriftete Bilder 1. Insbesondere

Mehr

Übungsserie Nr. 10 mit Lösungen

Übungsserie Nr. 10 mit Lösungen Übungsserie Nr. 10 mit Lösungen 1 Ein Untersuchungsdesign sieht einen multivariaten Vergleich einer Stichprobe von Frauen mit einer Stichprobe von Männern hinsichtlich der Merkmale X1, X2 und X3 vor (Codierung:

Mehr

Willkommen zur Vorlesung Statistik (Master)

Willkommen zur Vorlesung Statistik (Master) Willkommen zur Vorlesung Statistik (Master) Thema dieser Vorlesung: Verteilungsfreie Verfahren Prof. Dr. Wolfgang Ludwig-Mayerhofer Universität Siegen Philosophische Fakultät, Seminar für Sozialwissenschaften

Mehr

2.3 Intervallschätzung

2.3 Intervallschätzung 2.3.1 Motivation und Hinführung Bsp. 2.11. [Wahlumfrage] Der wahre Anteil der rot-grün Wähler 2009 war genau 33.7%. Wie groß ist die Wahrscheinlichkeit, in einer Zufallsstichprobe von 1000 Personen genau

Mehr

Bedingte Wahrscheinlichkeiten & Unabhängigkeit

Bedingte Wahrscheinlichkeiten & Unabhängigkeit Statistik 1 für SoziologInnen Bedingte Wahrscheinlichkeiten & Univ.Prof. Dr. Marcus Hudec Bedingte Wahrscheinlichkeit Das Konzept bedingter Wahrscheinlichkeit erlaubt zu untersuchen, inwieweit sich die

Mehr

Algorithmen und Datenstrukturen

Algorithmen und Datenstrukturen Algorithmen und Datenstrukturen Dipl. Inform. Andreas Wilkens 1 Organisatorisches Freitag, 05. Mai 2006: keine Vorlesung! aber Praktikum von 08.00 11.30 Uhr (Gruppen E, F, G, H; Vortestat für Prototyp)

Mehr

Kategorielle Zielgrössen

Kategorielle Zielgrössen Kategorielle Zielgrössen 27.11.2017 Motivation Bisher gesehen: Regressionsmodelle für diverse Arten von Zielgrössen Y. kontinuierliche Zielgrösse Lineare Regression Binäre/binomiale Zielgrösse Logistische

Mehr

1,11 1,12 1,13 1,14 1,15 1,16 1,17 1,17 1,17 1,18

1,11 1,12 1,13 1,14 1,15 1,16 1,17 1,17 1,17 1,18 3. Deskriptive Statistik Ziel der deskriptiven (beschreibenden) Statistik (explorativen Datenanalyse) ist die übersichtliche Darstellung der wesentlichen in den erhobenen Daten enthaltene Informationen

Mehr

9.2. DER SATZ ÜBER IMPLIZITE FUNKTIONEN 83

9.2. DER SATZ ÜBER IMPLIZITE FUNKTIONEN 83 9.. DER SATZ ÜBER IMPLIZITE FUNKTIONEN 83 Die Grundfrage bei der Anwendung des Satzes über implizite Funktionen betrifft immer die folgende Situation: Wir haben eine Funktion f : V W und eine Stelle x

Mehr

Nutzen einer diagnostischen Tests in der Praxis: prädiktive Werte

Nutzen einer diagnostischen Tests in der Praxis: prädiktive Werte EbM-Splitter 11 Nutzen einer diagnostischen Tests in der Praxis: prädiktive Werte In den beiden letzten EbM-Splittern [6, 7] wurden die Maßzahlen Sensitivität (Wahrscheinlichkeit, eine kranke Person als

Mehr

Zusammenhänge zwischen metrischen Merkmalen

Zusammenhänge zwischen metrischen Merkmalen Zusammenhänge zwischen metrischen Merkmalen Darstellung des Zusammenhangs, Korrelation und Regression Daten liegen zu zwei metrischen Merkmalen vor: Datenpaare (x i, y i ), i = 1,..., n Beispiel: x: Anzahl

Mehr

Statistische Auswertung der Daten von Blatt 13

Statistische Auswertung der Daten von Blatt 13 Statistische Auswertung der Daten von Blatt 13 Problemstellung 1 Graphische Darstellung der Daten 1 Diskussion der Normalverteilung 3 Mittelwerte und deren Konfidenzbereiche 3 Signifikanz der Behandlung

Mehr

Konfidenzintervalle Grundlegendes Prinzip Erwartungswert Bekannte Varianz Unbekannte Varianz Anteilswert Differenzen von Erwartungswert Anteilswert

Konfidenzintervalle Grundlegendes Prinzip Erwartungswert Bekannte Varianz Unbekannte Varianz Anteilswert Differenzen von Erwartungswert Anteilswert Konfidenzintervalle Grundlegendes Prinzip Erwartungswert Bekannte Varianz Unbekannte Varianz Anteilswert Differenzen von Erwartungswert Anteilswert Beispiel für Konfidenzintervall Im Prinzip haben wir

Mehr

Statistische Analyse von Ereigniszeiten

Statistische Analyse von Ereigniszeiten Statistische Analyse von Survival Analysis VO Biostatistik im WS 2006/2007 1 2 3 : Leukemiedaten (unzensiert) 33 Patienten mit Leukemie; Zielvariable Überlebenszeit. Alle Patienten verstorben und Überlebenszeit

Mehr

Kaplan-Meier-Schätzer

Kaplan-Meier-Schätzer Kaplan-Meier-Schätzer Ausgangssituation Zwei naive Ansätze zur Schätzung der Survivalfunktion Unverzerrte Schätzung der Survivalfunktion Der Kaplan-Meier-Schätzer Standardfehler und Konfidenzintervall

Mehr

Einführung. Vorlesungen zur Komplexitätstheorie: Reduktion und Vollständigkeit (3) Vorlesungen zur Komplexitätstheorie. K-Vollständigkeit (1/5)

Einführung. Vorlesungen zur Komplexitätstheorie: Reduktion und Vollständigkeit (3) Vorlesungen zur Komplexitätstheorie. K-Vollständigkeit (1/5) Einführung 3 Vorlesungen zur Komplexitätstheorie: Reduktion und Vollständigkeit (3) Univ.-Prof. Dr. Christoph Meinel Hasso-Plattner-Institut Universität Potsdam, Deutschland Hatten den Reduktionsbegriff

Mehr

Künstliche Intelligenz Unsicherheit. Stephan Schwiebert WS 2009/2010 Sprachliche Informationsverarbeitung Institut für Linguistik Universität zu Köln

Künstliche Intelligenz Unsicherheit. Stephan Schwiebert WS 2009/2010 Sprachliche Informationsverarbeitung Institut für Linguistik Universität zu Köln Künstliche Intelligenz Unsicherheit Stephan Schwiebert WS 2009/2010 Sprachliche Informationsverarbeitung Institut für Linguistik Universität zu Köln Rückblick Agent in der Wumpuswelt konnte Entscheidungen

Mehr

Lösungen zu Janssen/Laatz, Statistische Datenanalyse mit SPSS 1

Lösungen zu Janssen/Laatz, Statistische Datenanalyse mit SPSS 1 LÖSUNG 3A Lösungen zu Janssen/Laatz, Statistische Datenanalyse mit SPSS 1 Mit den Berechnungsfunktionen LG10(?) und SQRT(?) in "Transformieren", "Berechnen" können logarithmierte Werte sowie die Quadratwurzel

Mehr

Bedingte Wahrscheinlichkeiten & Unabhängigkeit

Bedingte Wahrscheinlichkeiten & Unabhängigkeit Statistik 1 für SoziologInnen Bedingte Wahrscheinlichkeiten & Univ.Prof. Dr. Marcus Hudec Bedingte Wahrscheinlichkeit Das Konzept bedingter Wahrscheinlichkeit erlaubt zu untersuchen, inwieweit sich die

Mehr

Kontingenzkoeffizient (nach Pearson)

Kontingenzkoeffizient (nach Pearson) Assoziationsmaß für zwei nominale Merkmale misst die Unabhängigkeit zweier Merkmale gibt keine Richtung eines Zusammenhanges an 46 o jl beobachtete Häufigkeiten der Kombination von Merkmalsausprägungen

Mehr

Güte von Tests. die Wahrscheinlichkeit für den Fehler 2. Art bei der Testentscheidung, nämlich. falsch ist. Darauf haben wir bereits im Kapitel über

Güte von Tests. die Wahrscheinlichkeit für den Fehler 2. Art bei der Testentscheidung, nämlich. falsch ist. Darauf haben wir bereits im Kapitel über Güte von s Grundlegendes zum Konzept der Güte Ableitung der Gütefunktion des Gauss im Einstichprobenproblem Grafische Darstellung der Gütefunktionen des Gauss im Einstichprobenproblem Ableitung der Gütefunktion

Mehr

Nichtlineare Optimierung ohne Nebenbedingungen

Nichtlineare Optimierung ohne Nebenbedingungen Kapitel 2 Nichtlineare Optimierung ohne Nebenbedingungen In diesem Abschnitt sollen im wesentlichen Verfahren zur Bestimmung des Minimums von nichtglatten Funktionen in einer Variablen im Detail vorgestellt

Mehr

RUPRECHTS-KARLS-UNIVERSITÄT HEIDELBERG

RUPRECHTS-KARLS-UNIVERSITÄT HEIDELBERG Die Poisson-Verteilung Jianmin Lu RUPRECHTS-KARLS-UNIVERSITÄT HEIDELBERG Ausarbeitung zum Vortrag im Seminar Stochastik (Wintersemester 2008/09, Leitung PD Dr. Gudrun Thäter) Zusammenfassung: In der Wahrscheinlichkeitstheorie

Mehr

4. Woche Decodierung; Maximale, Perfekte und Optimale Codes. 4. Woche: Decodierung; Maximale, Perfekte und Optimale Codes 69/ 140

4. Woche Decodierung; Maximale, Perfekte und Optimale Codes. 4. Woche: Decodierung; Maximale, Perfekte und Optimale Codes 69/ 140 4 Woche Decodierung; Maximale, Perfekte und Optimale Codes 4 Woche: Decodierung; Maximale, Perfekte und Optimale Codes 69/ 140 Szenario für fehlerkorrigierende Codes Definition (n, M)-Code Sei C {0, 1}

Mehr

Motivation. Themenblock: Klassifikation. Binäre Entscheidungsbäume. Ansätze. Praktikum: Data Warehousing und Data Mining.

Motivation. Themenblock: Klassifikation. Binäre Entscheidungsbäume. Ansätze. Praktikum: Data Warehousing und Data Mining. Motivation Themenblock: Klassifikation Praktikum: Data Warehousing und Data Mining Ziel Item hat mehrere Attribute Anhand von n Attributen wird (n+)-tes vorhergesagt. Zusätzliches Attribut erst später

Mehr

Klausur in Epidemiologie SS 2006 Freitag, den 14. Juli 2006

Klausur in Epidemiologie SS 2006 Freitag, den 14. Juli 2006 Klausur in Epidemiologie SS 2006 Freitag, den 14. Juli 2006 Name: Matrikelnummer: Unterschrift: Aufgabe 1: Odds Ratio Im Rahmen einer Studie wurden 20 Frauen mit Uteruskarzinom, die stationär behandelt

Mehr

Querschnittsbereich Epidemiologie, Med. Biometrie und Med. Informatik Diagnose und Prognose WS 06/07 Übung 5

Querschnittsbereich Epidemiologie, Med. Biometrie und Med. Informatik Diagnose und Prognose WS 06/07 Übung 5 Informationsblatt zum Gestationsdiabetes (Schwangerschaftsdiabetes) Gruppe B Der Schwangerschafts- oder Gestationsdiabetes () ist eine spezielle Form der Zuckerkrankheit, die sich während einer Schwangerschaft

Mehr

Künstliche Intelligenz Maschinelles Lernen

Künstliche Intelligenz Maschinelles Lernen Künstliche Intelligenz Maschinelles Lernen Stephan Schwiebert Sommersemester 2009 Sprachliche Informationsverarbeitung Institut für Linguistik Universität zu Köln Maschinelles Lernen Überwachtes Lernen

Mehr

Statistische Thermodynamik I Lösungen zur Serie 1

Statistische Thermodynamik I Lösungen zur Serie 1 Statistische Thermodynamik I Lösungen zur Serie Zufallsvariablen, Wahrscheinlichkeitsverteilungen 4. März 2. Zwei Lektoren lesen ein Buch. Lektor A findet 2 Druckfehler, Lektor B nur 5. Von den gefundenen

Mehr

Bewertung diagnostischer Tests

Bewertung diagnostischer Tests n g c gesund krank n k c Segreganz negativ positiv negativ positiv Relevanz Beertung diagnostischer Tests gesund krank c Annahme: Überlappende Populationen eine messbare Grösse (z.b Konzentration) vergrössert

Mehr

3. Entscheidungsbäume. Verfahren zum Begriffslernen (Klassifikation) Beispiel: weiteres Beispiel: (aus Böhm 2003) (aus Morik 2002)

3. Entscheidungsbäume. Verfahren zum Begriffslernen (Klassifikation) Beispiel: weiteres Beispiel: (aus Böhm 2003) (aus Morik 2002) 3. Entscheidungsbäume Verfahren zum Begriffslernen (Klassifikation) Beispiel: weiteres Beispiel: (aus Böhm 2003) (aus Morik 2002) (aus Wilhelm 2001) Beispiel: (aus Böhm 2003) Wann sind Entscheidungsbäume

Mehr

2.3 Intervallschätzung

2.3 Intervallschätzung 2.3.1 Motivation und Hinführung Bsp. 2.15. [Wahlumfrage] Der wahre Anteil der rot-grün Wähler unter allen Wählern war 2009 auf eine Nachkommastelle gerundet genau 33.7%. Wie groß ist die Wahrscheinlichkeit,

Mehr

Übung zur Vorlesung Statistik I WS Übungsblatt 12

Übung zur Vorlesung Statistik I WS Übungsblatt 12 Übung zur Vorlesung Statistik I WS 2013-2014 Übungsblatt 12 20. Januar 2014 Die folgenden ufgaben sind aus ehemaligen Klausuren! ufgabe 38.1 (1 Punkt: In einer Studie werden 10 Patienten therapiert. Die

Mehr

Studiendesign/ Evaluierungsdesign

Studiendesign/ Evaluierungsdesign Jennifer Ziegert Studiendesign/ Evaluierungsdesign Praxisprojekt: Nutzerorientierte Evaluierung von Visualisierungen in Daffodil mittels Eyetracker Warum Studien /Evaluierungsdesign Das Design einer Untersuchung

Mehr

Mathematische und statistische Methoden II

Mathematische und statistische Methoden II Methodenlehre e e Prof. Dr. G. Meinhardt 6. Stock, Wallstr. 3 (Raum 06-206) Sprechstunde jederzeit nach Vereinbarung und nach der Vorlesung. Mathematische und statistische Methoden II Dr. Malte Persike

Mehr

Bewertung diagnostischer Tests

Bewertung diagnostischer Tests n g c gesund krank n k c Segreganz negativ positiv negativ positiv Relevanz Beertung diagnostischer Tests gesund krank c Annahme: Überlappende Populationen eine messbare Grösse (z.b Konzentration) vergrössert

Mehr

3. Zusammenhang. 22 Andreas Gathmann

3. Zusammenhang. 22 Andreas Gathmann 22 Andreas Gathmann 3. Zusammenhang Eine der anschaulichsten Eigenschaften eines topologischen Raumes ist wahrscheinlich, ob er zusammenhängend ist oder aus mehreren Teilen besteht. Wir wollen dieses Konzept

Mehr

Grundlagen der Inferenzstatistik

Grundlagen der Inferenzstatistik Grundlagen der Inferenzstatistik (Induktive Statistik oder schließende Statistik) Dr. Winfried Zinn 1 Deskriptive Statistik versus Inferenzstatistik Die Deskriptive Statistik stellt Kenngrößen zur Verfügung,

Mehr

Univariates Chi-Quadrat-Verfahren für ein dichotomes Merkmal und eine Messwiederholung: Test nach McNemar

Univariates Chi-Quadrat-Verfahren für ein dichotomes Merkmal und eine Messwiederholung: Test nach McNemar Univariates Chi-Quadrat-Verfahren für ein dichotomes Merkmal und eine Messwiederholung: Test nach McNemar Inhaltsverzeichnis Univariates Chi-Quadrat-Verfahren für ein dichotomes Merkmal und eine Messwiederholung:

Mehr

Der Provider möchte möglichst vermeiden, dass die Werbekampagne auf Grund des Testergebnisses irrtümlich unterlassen wird.

Der Provider möchte möglichst vermeiden, dass die Werbekampagne auf Grund des Testergebnisses irrtümlich unterlassen wird. Hypothesentest ================================================================== 1. Ein Internetprovider möchte im Fichtelgebirge eine Werbekampagne durchführen, da er vermutet, dass dort höchstens 40%

Mehr