Affymetrix Evaluierung
|
|
- Berndt Lenz
- vor 6 Jahren
- Abrufe
Transkript
1 technische universität Affymetrix Evaluierung Evaluation mit Benchmark Datensätzen Datensätze Spike-in Datensatz von Affymetrix (59 x HGU95A) 16 Gene wurden in 14 Konzentration kontrolliert einer Probe hinzugefügt Dilution (Verdünnungs-)Datensatz von GeneLogic (60 x HGU95v2) Leber und ZNS-Gewebe in verschiedenen Mengen und relativen Anteilen Benchmark (Rafael Irizarry: 15 Qualitätsmaße in Bezug auf Reproduzierbarkeit Sensitivität Spezifität Jörg Rahnenführer, Statistik in der Bioinformatik, SS09, TU Dortmund
2 technische universität Affymetrix Evaluierung Kriterien/Qualitätsmaße für den Methodenvergleich (Übungsaufgabe) Median SD - median SD across replicates null log-fc IQR - Inter-quartile range of the log-fold-changes from genes that should not change null log-fc 99.9% % percentile of the log-fold-changes if from the genes that should not change Signal detect R 2 - R-squared obtained from regressing expression values on nominal concentrations in the spike-in data Signal detect slope - slope obtained from regressing expression values on nominal concentrations in the spike-in data low.slope - Slope from regression of observed log concentration versus nominal log concentraion for genes with low intensities med.slope - As above but for genes with medium intensities high.slope - As above but for genes with high intensities Obs-intended-fc slope - slope obtained from regressing observed log-fold-changes against nominal log-fold-changes Obs-(low)int-fc slope - slope obtained from regressing observed log-fold-changes against nominal logfold-changes for genes with nominal concentrations less than or equal to 2 low AUC - Area under the ROC curve (up to 100 false positives) for genes with low intensity standardized so that optimum is 1 med AUC - As above but for genes with medium intensities high AUC - As above but for genes with high intensities weighted avg AUC - A weighted average of the previous 3 ROC curves with weights related to amount of data in each class (low,medium,high) Jörg Rahnenführer, Statistik in der Bioinformatik, SS09, TU Dortmund
3 Affymetrix Evaluierung technische universität Resultate für Methodenvergleich Vergleich von sehr vielen verschiedenen Qualitätsmaßen ergibt differenziertes Bild Dunklere Farbe steht für bessere Ergebnisse Für Regressionsmaße schneidet GC/RMA besonders gut ab MAS 5.0 schneidet besonders schlecht ab für Klassifikationsmaße Jörg Rahnenführer, Statistik in der Bioinformatik, SS09, TU Dortmund
4 10. Expressionsdaten: Klassifikation Jörg Rahnenführer, Statistik in der Bioinformatik, SS09, TU Dortmund
5 ROC Kurven technische universität ROC-Kurve (Receiver Operating Characteristic) Auftragung von Sensitivität gegen (1 Spezifität) jeweils im Intervall [0,1] Verschiedenste Alternativen für die Bedeutung der Achsen sind üblich in verschiedenen Wissenschafts-Disziplinen, selbst innerhalb der Bioinformatik Erläuterung des Prinzips anhand einer Klassifikation von Gesunden (D-, Negative) und Kranken (D+, Positive) Hypothetische Annahme: Normalverteilung der Messwerte jeweils für Gesunde und Kranke Jörg Rahnenführer, Statistik in der Bioinformatik, SS09, TU Dortmund
6 technische universität ROC Kurven Kenngrößen für Vierfeldertafeln zur Beurteilung der Güte von Klassifikationsverfahren (hier am Beispiel aus der Medizin: Diagnoseverfahren) Sensitivität Bedingte Wahrscheinlichkeit, dass das Diagnoseverfahren die Erkrankung erkennt (T+), unter der Bedingung, dass sie tatsächlich vorliegt (D+): P(T+ D+) Schätzer: Anteil richtig Positiver Spezifität Bedingte Wahrscheinlichkeit, dass das Diagnoseverfahren auf Nichterkrankung entscheidet (T-), unter der Bedingung, dass tatsächlich keine Erkrankung vorliegt (D-): P(T- D-) Schätzer: Anteil richtig Negativer Gesucht ist Kompromiss zwischen Sensitivität und Spezifität Jörg Rahnenführer, Statistik in der Bioinformatik, SS09, TU Dortmund
7 ROC Kurven technische universität ROC-Kurve (Receiver Operating Characteristic) Auftragung von Sensitivität gegen (1 Spezifität) jeweils im Intervall [0,1] Theoretische ROC- Kurve im Normalverteilungs- Beispiel Cutpoint µ + Cutpoint ½ (µ + +µ - ) Cutpoint µ - Jörg Rahnenführer, Statistik in der Bioinformatik, SS09, TU Dortmund
8 ROC Kurven technische universität Schätzung der ROC-Kurve aus den Daten Normalverteilungsmodell (parametrisch) Definition: a = ( µ µ ) σ und b = σ σ Φ Verteilungsfunktion der Standardnormalverteilung ROC-Kurve: 1 sens x = Φ ( a + bφ ( x)), 0 x 1 Schätzung der Parameter a und b aus den Daten mit Maximum-Likelihood Direkte Schätzung (nichtparametrisch) Zunächst Schätzung von Sensitivität und Spezifität aus den Daten für alle möglichen Cutpoints Dann Auftragung der Schätzwerte gegeneinander und lineare Interpolation (Analoges Vorgehen für andere Kenngrößen als Sensitivität und Spezifität) Zur Schätzung der Variabilität der ROC-Kurve existieren verschiedene Verfahren (sowohl punktweise als auch simultane Konfidenzbänder) Jörg Rahnenführer, Statistik in der Bioinformatik, SS09, TU Dortmund
9 technische universität ROC Kurven AUC (Area under the Curve) AUC ist definiert als Fläche unter der ROC-Kurve AUC kann zur Bewertung eines Diagnoseverfahrens mit einer univariaten Maßzahl verwendet werden AUC nahe bei 1.0: Zuverlässiges Diagnoseverfahren AUC nahe bei 0.5: Wertloses, zufälliges Diagnoseverfahren pauc (Partial Area under the Curve) Berechnung der Fläche nur bis zu einer vorgegebenen Spezifität Äquivalenz von AUC und Mann-Whitney-Statistik AUC entspricht der Wahrscheinlichkeit, ein zufälliges Paar aus (D+, D-) korrekt zu diagnostizieren Schätzer für diese Wahrscheinlichkeit liefert Mann-Whitney-Statistik, die zur Wilcoxon-Rangsummen-Statistik äquivalent ist Dieser Zusammenhang kann zur Schätzung der Variabilität der geschätzten AUC verwendet werden Jörg Rahnenführer, Statistik in der Bioinformatik, SS09, TU Dortmund
10 ROC Kurven technische universität Wichtiges Beispiel für ROC-Analyse bei Microarray- Experimenten Fragestellung: Welches der Gene ist (univariat) für die Diagnose einer Krankheit geeignet Lösung: Ranking der Gene mit Hilfe von AUC bzw. pauc Szenarien für die Trennung von Kranken und Gesunden Jörg Rahnenführer, Statistik in der Bioinformatik, SS09, TU Dortmund
11 ROC Kurven technische universität Jörg Rahnenführer, Statistik in der Bioinformatik, SS09, TU Dortmund
12 ROC Kurven technische universität Visualisierung von AUC und pauc pauc(t 0 ) ist die Fläche unter der ROC-Kurve bis zu einem cutoff von t 0 für die FDR (false positive rate) Jörg Rahnenführer, Statistik in der Bioinformatik, SS09, TU Dortmund
13 technische universität ROC Kurven Krebs-Beispiel Subklassifikation bei Leukämie Ziel: Diagnose soll B-cell ALL (Leukämie-Variante) mit und ohne BCR/ABL-Translokation unterscheiden Mit Translokation steht für die kranke Gruppe Datensatz erhältlich im Bioconductor-Paket ALL Das probe set 1636_g_at (repräsentiert gerade das betroffene ABL1-Gen) hat höchsten AUC-Wert und höchsten pauc(0.1)-wert Jörg Rahnenführer, Statistik in der Bioinformatik, SS09, TU Dortmund
14 technische universität Expressionsdaten: Klassifikation Wichtigste Unterscheidung Sind Gruppenzugehörigkeiten im Vorhinein gegeben oder sollen erste Gruppen gefunden werden? Statistische Unerteilung: Clusteranalyse Diskriminanzanalyse Oft wissen Anwender nicht, welches dieser Ziele sie verfolgen Übersicht der Themen für die Vorlesung Unüberwachtes Lernen Ähnlichkeitsmaße und Clusteralgorithmen Bewertung der Qualität von Ergebnissen von Clusterverfahren Überwachtes Lernen Klassen-Vorhersage mit PAM (Prediction Analysis for Microarrays) Klassifikation mit Support Vector Maschinen Jörg Rahnenführer, Statistik in der Bioinformatik, SS09, TU Dortmund
15 technische universität Expressionsdaten: Klassifikation Wichtige Unterscheidung Klassifikation von Proben (Arrays, Samples) Ziel: Finde Genexpressionsprofile, die zwischen bekannten Zelltypen- oder Bedingungen unterscheiden (klassisch: Tumorgewebe gegen gesundes Gewebe) verschiedene zuvor unbekannte Zelltypen- oder Bedingungen unterscheiden, zum Beispiel neue Unterklassen einer bekannten Klasse von Tumoren Klassifikation von Genen Ordne eine unbekannte cdna-sequenz einer bekannten Genklasse zu Unterteile eine Gengruppe in neue (unbekannte) funktionelle Klassen aufgrund der Genexpressionsprofile in verschiedenen Proben Krebsklassifikation Machine learning Statistik Class discovery Unüberwachtes Lernen Clusteranalyse Class prediction Überwachtes Lernen Diskriminanzanalyse Jörg Rahnenführer, Statistik in der Bioinformatik, SS09, TU Dortmund
Pareto optimale lineare Klassifikation
Seminar aus Maschinellem Lernen Pareto optimale lineare Klassifikation Vesselina Poulkova Betreuer: Eneldo Loza Mencía Gliederung 1. Einleitung 2. Pareto optimale lineare Klassifizierer 3. Generelle Voraussetzung
MehrStatistische Inferenz bei ROC Kurven. Notation. Man unterscheidet:
Statistische Inferenz bei ROC Kurven Notation Man unterscheidet: 1. Nichtparametrische, empirische Methoden zur Berechnung der empirischen ROC Kurve 2. Parametrische Ansätze, die recht starke Annahmen
MehrThemenblock. Diagnose und Prognose. Querschnittsbereich Epidemiologie, Med. Biometrie und Med. Informatik. Themen im Block Diagnose und Prognose
Themenblock Diagnose und Prognose Querschnittsbereich Epidemiologie, Med. Biometrie und Med. Informatik Themen im Block Diagnose und Prognose Diagnose Prävalenz und prädiktive Werte Güte von diagnostischen
MehrStatistics, Data Analysis, and Simulation SS 2017
Mainz, 8. Juni 2017 Statistics, Data Analysis, and Simulation SS 2017 08.128.730 Statistik, Datenanalyse und Simulation Dr. Michael O. Distler Dr. Michael O. Distler
MehrSignalentdeckungstheorie, Dichteschätzung
Signalentdeckungstheorie, Dichteschätzung Mustererkennung und Klassifikation, Vorlesung No. 6 1 M. O. Franz 15.11.2007 1 falls nicht anders vermerkt, sind die Abbildungen entnommen aus Duda et al., 2001.
MehrMedizinische Biometrie (L5)
Medizinische Biometrie (L5) Vorlesung V Der diagnostische Test Prof. Dr. Ulrich Mansmann Institut für Medizinische Informationsverarbeitung, Biometrie und Epidemiologie mansmann@ibe.med.uni-muenchen.de
MehrMusterlösung der Klausur vom 29. Juli 2003
Statistik für Bioinformatiker SoSe 2003 Rainer Spang Musterlösung der Klausur vom 29. Juli 2003 Aufgabe 1. 10 Definieren Sie die folgenden statistischen Begriffe in einem Satz oder in einer Formel: 1.
MehrStatistical Coaching. Thomas Forstner
Statistical Coaching Thomas Forstner Diagnoseverfahren Allgemein Vergleich: wahrer Befund mit Test (Diagnose) wahrer Befund muss bekannt sein (Goldstandard) 3 Analogie zur Testtheorie 4 Beurteilung von
MehrINTELLIGENTE DATENANALYSE IN MATLAB. Evaluation & Exploitation von Modellen
INTELLIGENTE DATENANALYSE IN MATLAB Evaluation & Exploitation von Modellen Überblick Schritte der Datenanalyse: Datenvorverarbeitung Problemanalyse Problemlösung Anwendung der Lösung Aggregation und Selektion
MehrInhaltsverzeichnis. 0 Einleitung 1
Inhaltsverzeichnis 0 Einleitung 1 1 Univariate Statistik 3 1.1 Begriffsdefinitionen... 3 1.1.1 Beobachtungseinheit, Merkmal... 3 1.1.2 Merkmalstypen... 3 1.1.3 Skalenniveaus... 4 1.1.4 Häufigkeiten...
MehrINTELLIGENTE DATENANALYSE IN MATLAB. Evaluation & Exploitation von Modellen
INTELLIGENTE DATENANALYSE IN MATLAB Evaluation & Exploitation von Modellen Überblick Schritte der Datenanalyse: Datenvorverarbeitung Problemanalyse Problemlösung Anwendung der Lösung Aggregation und Selektion
MehrEine Einführung in R: Statistische Tests
I. Einführungsbeispiel II. Theorie: Statistische Tests III. Zwei Klassiker: t-test und Wilcoxon-Rangsummen - Test IV. t-test und Wilcoxon-Rangsummen - Test in R Eine Einführung in R: Statistische Tests
Mehr1 Grundlagen der Wahrscheinlichkeitsrechnung Wahrscheinlichkeitsräume. Ein erster mathematischer Blick auf Zufallsexperimente...
Inhaltsverzeichnis 1 Grundlagen der Wahrscheinlichkeitsrechnung 1 1.1 Wahrscheinlichkeitsräume Ein erster mathematischer Blick auf Zufallsexperimente.......... 1 1.1.1 Wahrscheinlichkeit, Ergebnisraum,
MehrHypothesentests für Erwartungswert und Median. für D-UWIS, D-ERDW, D-USYS und D-HEST SS15
Hypothesentests für Erwartungswert und Median für D-UWIS, D-ERDW, D-USYS und D-HEST SS15 Normalverteilung X N(μ, σ 2 ) : «X ist normalverteilt mit Erwartungswert μ und Varianz σ 2» pdf: f x = 1 2 x μ exp
MehrNeuere Ansätze zur Auswahl von Prädiktionsmodellen. Von Veronika Huber
Neuere Ansätze zur Auswahl von Prädiktionsmodellen Von Veronika Huber Gliederung Anwendungsbereiche von Prädiktionsmodellen Traditionelle Methoden zur Prüfung der Wirksamkeit Neuere Ansätze zur Prüfung
MehrEine Einführung in R: Statistische Tests
Eine Einführung in R: Statistische Tests Bernd Klaus, Verena Zuber Institut für Medizinische Informatik, Statistik und Epidemiologie (IMISE), Universität Leipzig 9. Dezember 2009 Bernd Klaus, Verena Zuber
MehrThe ROC curve in screening with multiple markers: An application to the triple test in prenatal diagnostics
Statistische Methoden in Evidenz-basierter Medizin und Health Technology Assessment 20. bis 21. November 2003 Freiburg The ROC curve in screening with multiple markers: An application to the triple test
MehrGrundlagen der Bioinformatik Übung 5: Microarray Analysis. Yvonne Lichtblau
Grundlagen der Bioinformatik Übung 5: Microarray Analysis Yvonne Lichtblau Vorstellung Lösungen Übung 4 Yvonne Lichtblau: Grundlagen der Bioinformatik, Sommer Semester 2017 2 Lösungen vorstellen - Übung
MehrWerkzeuge der empirischen Forschung
Werkzeuge der empirischen Forschung I. Daten und Beschreibende Statistik 1. Einführung 2. Dateneingabe, Datentransformation, Datenbehandlung 3. Beschreibende Statistik II. Schließende Statistik 1 III.
MehrTesting in Microarray Experiments, StatisticalScience(18), Seiten
261 Literatur: I Lehmann & Romano, Kapitel 9 I Dudoit, Sha er & Boldrick (2003): Multiple Hypothesis Testing in Microarray Experiments, StatisticalScience(18), Seiten 71-103 Problem: Eine endliche Menge
MehrGrundlagen der Bioinformatik Übung 6: Microarray Analysis. Yvonne Lichtblau
Grundlagen der Bioinformatik Übung 6: Microarray Analysis Yvonne Lichtblau Vorstellung Lösungen Übung 4/Übung 5 Yvonne Lichtblau: Grundlagen der Bioinformatik, Sommer Semester 2016 2 Lösungen vorstellen
MehrFunktion Das Skript erstellt ROC-Kurven mit Konfidenzbändern, berechnet (gewichtete) Cutoff-Punkte und (partial) Area under the Curve (AUC, pauc).
Skriptname: ROC_pAUC7.jsl JMP-Version: JMP 7 Datum: 10.09.2007 Download: ROC.zip Funktion Das Skript erstellt ROC-Kurven mit Konfidenzbändern, berechnet (gewichtete) Cutoff-Punkte und (partial) Area under
MehrStatistik II für Betriebswirte Vorlesung 11
Statistik II für Betriebswirte Vorlesung 11 Dr. Andreas Wünsche TU Bergakademie Freiberg Institut für Stochastik 08. Januar 2018 Dr. Andreas Wünsche Statistik II für Betriebswirte Vorlesung 11 Version:
MehrTeil XI. Hypothesentests für zwei Stichproben. Woche 9: Hypothesentests für zwei Stichproben. Lernziele. Beispiel: Monoaminooxidase und Schizophrenie
Woche 9: Hypothesentests für zwei Stichproben Patric Müller Teil XI Hypothesentests für zwei Stichproben ETHZ WBL 17/19, 26.06.2017 Wahrscheinlichkeit und Statistik Patric
Mehr1 Beispiel zur Methode der kleinsten Quadrate
1 Beispiel zur Methode der kleinsten Quadrate 1.1 Daten des Beispiels t x y x*y x 2 ŷ ˆɛ ˆɛ 2 1 1 3 3 1 2 1 1 2 2 3 6 4 3.5-0.5 0.25 3 3 4 12 9 5-1 1 4 4 6 24 16 6.5-0.5 0.25 5 5 9 45 25 8 1 1 Σ 15 25
MehrÄhnlichkeits- und Distanzmaße
Ähnlichkeits- und Distanzmaße Jörg Rahnenführer, Multivariate Verfahren, WS89, TU Dortmund 11.1.8-1 - Ähnlichkeits- und Distanzmaße Jörg Rahnenführer, Multivariate Verfahren, WS89, TU Dortmund 11.1.8 -
MehrVorlesung: Statistik II für Wirtschaftswissenschaft
Vorlesung: Statistik II für Wirtschaftswissenschaft Prof. Dr. Helmut Küchenhoff Institut für Statistik, LMU München Sommersemester 2017 6 Genzwertsätze Einführung 1 Wahrscheinlichkeit: Definition und Interpretation
MehrNachklausur zur Vorlesung
Institut für Mathematische Stochastik WS 003/004 Universität Karlsruhe 30. April 004 Priv.-Doz. Dr. D. Kadelka Nachklausur zur Vorlesung Statistik für Biologen Musterlösungen Aufgabe 1 Gemessen wurde bei
MehrBayesianische FDR (Teil 1)
Bayesianische FDR (Teil 1) Mareile Große Ruse Seminar Multiples Testen 08.11.2010 Übersicht Übersicht Übersicht Alternative: Übersicht Alternative: Übersicht Alternative: Bedingte Wahrscheinlichkeit (Ω,
MehrAlternative Darstellung des 2-Stichprobentests für Anteile
Alternative Darstellung des -Stichprobentests für Anteile DCF CF Total n= 111 11 3 Response 43 6 69 Resp. Rate 0,387 0,3 0,309 Bei Gültigkeit der Nullhypothese Beobachtete Response No Response Total absolut
MehrEpidemiologie / Biometrie
Wintersemester 2004 / 2005 Epidemiologie / Biometrie Robert Hochstrat 14. März 2005 Zusammenschrift der Übung zur Vorlesung aus dem WS 04/05 Rückfragen, Ergänzungen und Korrekturen an robert hochstrat@web.de
MehrHypothesentests für Erwartungswert und Median. Statistik (Biol./Pharm./HST) FS 2015
Hypothesentests für Erwartungswert und Median Statistik (Biol./Pharm./HST) FS 2015 Normalverteilung X N μ, σ 2 X ist normalverteilt mit Erwartungswert μ und Varianz σ 2 pdf: pdf cdf:??? cdf 1 Zentraler
MehrMotivation. Klassifikationsverfahren sagen ein abhängiges nominales Merkmal anhand einem oder mehrerer unabhängiger metrischer Merkmale voraus
3. Klassifikation Motivation Klassifikationsverfahren sagen ein abhängiges nominales Merkmal anhand einem oder mehrerer unabhängiger metrischer Merkmale voraus Beispiel: Bestimme die Herkunft eines Autos
MehrWie liest man Konfidenzintervalle? Teil II. Premiu m
Wie liest man Konfidenzintervalle? Teil II Premiu m - Hintergrund Anderer Wahrscheinlichkeitsbegriff subjektiver Wahrscheinlichkeitsbegriff Beispiel: Was ist die Wahrscheinlichkeit dafür, dass ein Patient
MehrBeurteilung von Analysenwerten im Hinblick auf eine Grenzwertüberschreitung
Beurteilung von Analysenwerten im Hinblick auf eine Grenzwertüberschreitung K. Molt Universität Duisburg-Essen, Fak. 4, FG Instrumentelle Analytik 3. Juni 2007 K. Molt (Fachgeb. IAC) 3. Juni 2007 1 / 41
MehrEine Einführung in R: Statistische Tests
Eine Einführung in R: Statistische Tests Bernd Klaus, Verena Zuber Institut für Medizinische Informatik, Statistik und Epidemiologie (IMISE), Universität Leipzig http://www.uni-leipzig.de/ zuber/teaching/ws11/r-kurs/
MehrStatistik I für Betriebswirte Vorlesung 4
Statistik I für Betriebswirte Vorlesung 4 Prof. Dr. Hans-Jörg Starkloff TU Bergakademie Freiberg Institut für Stochastik 25. April 2016 Prof. Dr. Hans-Jörg Starkloff Statistik I für Betriebswirte Vorlesung
Mehr3.3.1 Referenzwerte für Fruchtwasser-Schätzvolumina ( SSW)
50 3.3 Das Fruchtwasser-Schätzvolumen in der 21.-24.SSW und seine Bedeutung für das fetale Schätzgewicht in der 21.-24.SSW und für das Geburtsgewicht bei Geburt in der 36.-43.SSW 3.3.1 Referenzwerte für
Mehr6. Schätzverfahren für Parameter
6. Schätzverfahren für Parameter Ausgangssituation: Ein interessierender Zufallsvorgang werde durch die ZV X repräsentiert X habe eine unbekannte Verteilungsfunktion F X (x) Wir interessieren uns für einen
MehrStatistik. Sommersemester Prof. Dr. Stefan Etschberger Hochschule Augsburg. für Betriebswirtschaft und internationales Management
für Betriebswirtschaft und internationales Management Sommersemester 2015 Prof. Dr. Stefan Etschberger Hochschule Augsburg Testverteilungen Chi-Quadrat-Verteilung Sind X 1,..., X n iid N(0; 1)-verteilte
MehrAlternative Darstellung des 2-Stcihprobentests für Anteile
Alternative Darstellung des -Stcihprobentests für Anteile DCF CF Total n 111 11 3 Response 43 6 69 Resp. Rate 0,387 0,3 0,309 Bei Gültigkeit der Nullhypothese Beobachtete Response No Response Total absolut
MehrTeil VIII Hypothesentests für zwei Stichproben
Woche 9: Hypothesentests für zwei Stichproben Teil VIII Hypothesentests für zwei Stichproben WBL 15/17, 22.06.2015 Alain Hauser Berner Fachhochschule, Technik und Informatik Berner
MehrInhaltsverzeichnis. Bibliografische Informationen digitalisiert durch
Inhaltsverzeichnis 1 Statistische Grundbegriffe 1 1.1 Skalenniveaus von Merkmalen 1 1.2 Wahrscheinlichkeitsrechnung 2 1.3 Eindimensionale Verteilungen 7 1.4 Mehrdimensionale Verteilungen 9 1.5 Momente,
MehrAnhang: Statistische Tafeln und Funktionen
A1 Anhang: Statistische Tafeln und Funktionen Verteilungsfunktion Φ(z) der Standardnormalverteilung Die Tabelle gibt die Werte Φ(z) der Verteilungsfunktion zu vorgegebenem Wert z 0 an; ferner gilt Φ( z)
MehrStatistische Methoden in den Umweltwissenschaften
Statistische Methoden in den Umweltwissenschaften Stetige und diskrete Wahrscheinlichkeitsverteilungen Lageparameter Streuungsparameter Diskrete und stetige Zufallsvariablen Eine Variable (oder Merkmal
MehrHypothesenbewertungen: Übersicht
Hypothesenbewertungen: Übersicht Wie kann man Fehler einer Hypothese abschätzen? Wie kann man einschätzen, ob ein Algorithmus besser ist als ein anderer? Trainingsfehler, wirklicher Fehler Kreuzvalidierung
MehrAlgoBio WS 16/17 Differenzielle Genexpression. Annalisa Marsico
AlgoBio WS 16/17 Differenzielle Genexpression Annalisa Marsico 04.01.2017 Pipeline für die Mikroarray-Analyse Bildanalyse Hintergrundkorrektur Normalisierung Vorverarbeitung Zusammenfassung Quantifizierung
MehrTeil VII. Deskriptive Statistik. Woche 5: Deskriptive Statistik. Arbeitsschritte der Datenanalyse. Lernziele
Woche 5: Deskriptive Statistik Teil VII Patric Müller Deskriptive Statistik ETHZ WBL 17/19, 22.05.2017 Wahrscheinlichkeit und Statistik Patric Müller WBL 2017 Wahrscheinlichkeit
MehrINTELLIGENTE DATENANALYSE IN MATLAB
INTELLIGENTE DATENANALYSE IN MATLAB Evaluation & Exploitation von Modellen Überblick Sh Schritte der Datenanalyse: Datenvorverarbeitung Problemanalyse Problemlösung Anwendung der Lösung Aggregation und
MehrWichtige Definitionen und Aussagen
Wichtige Definitionen und Aussagen Zufallsexperiment, Ergebnis, Ereignis: Unter einem Zufallsexperiment verstehen wir einen Vorgang, dessen Ausgänge sich nicht vorhersagen lassen Die möglichen Ausgänge
MehrVarianzkomponentenschätzung
Qualitas AG Varianzkomponentenschätzung Peter von Rohr Qualitas AG Peter von Rohr Folien ZL I+II LFW C11 October 29, 2015 2 / 23 Multiple Lineare Regression Annahmen Modell y = Xb + e Varianz der Fehler
MehrMathematik für Biologen
Mathematik für Biologen Prof. Dr. Rüdiger W. Braun Heinrich-Heine-Universität Düsseldorf 9. Dezember 2010 1 Konfidenzintervalle Idee Schätzung eines Konfidenzintervalls mit der 3-sigma-Regel Grundlagen
MehrÜbung V Lineares Regressionsmodell
Universität Ulm 89069 Ulm Germany Dipl.-WiWi Michael Alpert Institut für Wirtschaftspolitik Fakultät für Mathematik und Wirtschaftswissenschaften Ludwig-Erhard-Stiftungsprofessur Sommersemester 2007 Übung
MehrD-CHAB Frühlingssemester 2017 T =
D-CHAB Frühlingssemester 17 Grundlagen der Mathematik II Dr Marcel Dettling Lösung 13 1) Die relevanten Parameter sind n = 3, x = 1867, σ x = und µ = 18 (a) Die Teststatistik T = X µ Σ x / n ist nach Annahme
MehrStatistik I für Betriebswirte Vorlesung 13
Statistik I für Betriebswirte Vorlesung 13 Prof. Dr. Hans-Jörg Starkloff TU Bergakademie Freiberg Institut für Stochastik 4. Juli 2016 Prof. Dr. Hans-Jörg Starkloff Statistik I für Betriebswirte Vorlesung
MehrKonfidenzintervalle Grundlegendes Prinzip Erwartungswert Bekannte Varianz Unbekannte Varianz Anteilswert Differenzen von Erwartungswert Anteilswert
Konfidenzintervalle Grundlegendes Prinzip Erwartungswert Bekannte Varianz Unbekannte Varianz Anteilswert Differenzen von Erwartungswert Anteilswert Beispiel für Konfidenzintervall Im Prinzip haben wir
MehrW-Rechnung und Statistik für Ingenieure Übung 13
W-Rechnung und Statistik für Ingenieure Übung 13 Nächste Woche: Probeklausur Bringen Sie sich ein leeres Exemplar der Probeklausur mit, um sich eine Musterlösung zu erstellen. Aufgabe 1 : Testproblem Testproblem:
MehrEine Einführung in R: Hochdimensionale Daten: n << p Teil II
Eine Einführung in R: Hochdimensionale Daten: n
MehrKendall s Tau. Betrachte Paare von Beobachtungen (x i, y i ) und (x j, y j ) Ein Paar heißt:
Kendall s Tau Betrachte Paare von Beobachtungen (x i, y i ) und (x j, y j ) Ein Paar heißt: konkordant, diskordant, falls x i < x j und y i < y j oder x i > x j und y i > y j falls x i < x j und y i >
MehrInhaltsverzeichnis Statistische Grundbegriffe Einf uhrung in SAS
Inhaltsverzeichnis 1 Statistische Grundbegriffe... 1 1.1 SkalenniveausvonMerkmalen... 1 1.2 Wahrscheinlichkeitsrechnung... 2 1.3 EindimensionaleVerteilungen... 7 1.4 MehrdimensionaleVerteilungen... 9 1.5
MehrPrüfung aus Wahrscheinlichkeitstheorie und Statistik MASCHINENBAU 2003
Prüfung aus Wahrscheinlichkeitstheorie und Statistik MASCHINENBAU 2003. Eine seltene Krankheit trete mit Wahrscheinlichkeit : 0000 auf. Die bedingte Wahrscheinlichkeit, dass ein bei einem Erkrankten durchgeführter
MehrDie mit * gekennzeichneten Abschnitte beinhalten Themen, die über die Anforderungen des Gegenstandskatalogs hinausgehen.
Die mit * gekennzeichneten Abschnitte beinhalten Themen, die über die Anforderungen des Gegenstandskatalogs hinausgehen. 1 Einleitung...1 1.1 Die Bedeutung der Statistik für die Medizin...1 1.2 Die medizinische
MehrTests für Erwartungswert & Median
Mathematik II für Biologen 26. Juni 2015 Prolog Varianz des Mittelwerts Beispiel: Waage z-test t-test Vorzeichentest Wilcoxon-Rangsummentest Varianz des Mittelwerts Beispiel: Waage Zufallsvariable X 1,...,X
MehrBSc Bioinformatik Wintersemester 2013/2014 Nachklausur zur Statistik I Freie Universität Berlin
Sc ioinformatik Wintersemester 013/014 Nachklausur zur Statistik I Freie Universität erlin 4. pril 014 Matrikelnummer Nachname Vorname Unterschrift ufgabe 1 (4 Punkte): Zu einem Wahrscheinlichkeitsraum
MehrAuswertung und Lösung
Dieses Quiz soll Ihnen helfen, Kapitel 4.6 und 4.7 besser zu verstehen. Auswertung und Lösung Abgaben: 59 / 265 Maximal erreichte Punktzahl: 8 Minimal erreichte Punktzahl: 0 Durchschnitt: 4.78 1 Frage
MehrComputerübung zu Multivariaten Verfahren
Computerübung zu Multivariaten Verfahren Klaus Schliep & Klaus Hechenbichler 18. Februar 2004 Daten Bevor mit dem Einstieg in die eigentliche Anwendung von multivariaten statistischen Verfahren begonnen
MehrVorlesung: Statistik II für Wirtschaftswissenschaft
Vorlesung: Statistik II für Wirtschaftswissenschaft Prof. Dr. Helmut Küchenhoff Institut für Statistik, LMU München Sommersemester 2017 Einführung 1 Wahrscheinlichkeit: Definition und Interpretation 2
Mehr2 Aufgaben aus [Teschl, Band 2]
20 2 Aufgaben aus [Teschl, Band 2] 2.1 Kap. 25: Beschreibende Statistik 25.3 Übungsaufgabe 25.3 a i. Arithmetisches Mittel: 10.5 ii. Median: 10.4 iii. Quartile: x 0.25 Y 4 10.1, x 0.75 Y 12 11.1 iv. Varianz:
MehrStatistische Methoden
Modeling of Data / Maximum Likelyhood methods Institut für Experimentelle und Angewandte Physik Christian-Albrechts-Universität zu Kiel 22.05.2006 Datenmodellierung Messung vs Modell Optimierungsproblem:
MehrStatistische Messdatenauswertung
Roland Looser Statistische Messdatenauswertung Praktische Einführung in die Auswertung von Messdaten mit Excel und spezifischer Statistik-Software für naturwissenschaftlich und technisch orientierte Anwender
MehrStatistik für Ingenieure Vorlesung 5
Statistik für Ingenieure Vorlesung 5 Prof. Dr. Hans-Jörg Starkloff TU Bergakademie Freiberg Institut für Stochastik 28. November 2017 3.4 Wichtige stetige Verteilungen 3.4.1 Exponentialverteilung Parameter:
MehrStatistik für Ingenieure Vorlesung 12
Statistik für Ingenieure Vorlesung 12 Prof. Dr. Hans-Jörg Starkloff TU Bergakademie Freiberg Institut für Stochastik 23. Januar 2017 5.1.1. Tests für eine Stichprobe mit stetiger Skala a) Shapiro-Wilk-Test
MehrStochastik (BSc D-MAVT / BSc D-MATH / BSc D-MATL)
Prof. Dr. M. Schweizer ETH Zürich Winter 2018 Stochastik (BSc D-MAVT / BSc D-MATH / BSc D-MATL) Bitte... Lege deine Legi auf den Tisch. Trage deine Daten in dieses Deckblatt ein, und schreibe auf jedes
Mehrdas Kleingedruckte...
Gepaarte t-tests das Kleingedruckte... Datenverteilung ~ Normalverteilung QQ-plot statistischer Test (Shapiro-Wilk, Kolmogorov-Smirnov) wenn nicht : nicht-parametrische Tests gleiche Varianz (2-Proben
MehrDiagnostikstudien. Dr. Dirk Hasenclever IMISE, Leipzig.
Diagnostikstudien Dr. Dirk Hasenclever IMISE, Leipzig Hasenclever@IMISE.uni-Leipzig.de Diagnostische Tests Krankheit ja Krankheit nein Test positiv TrueP FP Test negativ FN TrueN Test- Positive Test- Negative
MehrAllgemeine lineare Modelle
262 Merkpunkte Allgemeine lineare Modelle Multiple lineare Regression mit nicht-normalen Zufallsabweichungen bilden eine harmlose" Verallgemeinerung der multiplen lin. Regr. Beispiele: Gumbel-Regression,
MehrBiostatistik, Sommer 2017
1/52 Biostatistik, Sommer 2017 Prof. Dr. Achim Klenke http://www.aklenke.de 7. Vorlesung: 02.06.2017 2/52 Inhalt 1 Wahrscheinlichkeit Bayes sche Formel 2 Diskrete Stetige 3/52 Wahrscheinlichkeit Bayes
MehrKommentierter SPSS-Output für hierarchische log-lineare Modelle (Modul Modellauswahl) 3 Dimensionen
Kommentierter SPSS-Output für hierarchische log-lineare Modelle (Modul Modellauswahl) 3 Dimensionen Hierarchisches log-lineares Modell: Saturiertes Modell (SPSS-Modul Modellauswahl ) HILOGLINEAR polview(1
MehrBiostatistik, Winter 2011/12
Biostatistik, Winter 2011/12 Wahrscheinlichkeitstheorie:, Kenngrößen Prof. Dr. Achim Klenke http://www.aklenke.de 7. Vorlesung: 09.12.2011 1/58 Inhalt 1 2 Kenngrößen von Lagemaße 2/58 mit Dichte Normalverteilung
MehrChestpain in primary care: a systematic research programme to support guideline development
allgemeinmedizin Chestpain in primary care: a systematic research programme to support guideline development Norbert Donner-Banzhoff Jörg Haasenritter Stefan Bösner Department of General Practice University
MehrDiagnostische Verfahren
6. Diagnostische s Jede Registrierung oder Auswertung einer Information mit dem Ziel der Erkennung einer Erung oder eines speziellen Zustandes wird diagnostischer genannt. Beispiele Reaktion auf Ansprechen
Mehr- Normalverteilung (Gaußverteilung) kann auf sehr viele Zufallsprozesse angewendet werden.
Normalverteilung und Standardnormalverteilung als Beispiel einer theoretischen Verteilung - Normalverteilung (Gaußverteilung) kann auf sehr viele Zufallsprozesse angewendet werden. - Stetige (kontinuierliche),
MehrKonfidenzintervalle. Gesucht: U = U(X 1,..., X n ), O = O(X 1,..., X n ), sodass für das wahre θ gilt
Konfidenzintervalle Annahme: X 1,..., X n iid F θ. Gesucht: U = U(X 1,..., X n ), O = O(X 1,..., X n ), sodass für das wahre θ gilt P θ (U θ O) = 1 α, α (0, 1). Das Intervall [U, O] ist ein Konfidenzintervall
MehrLehr- und Übungsbuch der angewandten Statistik. Von Dr. Bärbel Elpelt und. O. Prof. Dr. Joachim Hartung Fachbereich Statistik der Universität Dortmund
Grundkurs Statistik Lehr- und Übungsbuch der angewandten Statistik Von Dr. Bärbel Elpelt und O. Prof. Dr. Joachim Hartung Fachbereich Statistik der Universität Dortmund Mit ausführlichen Übungs- und Klausurteilen
MehrIf something has a 50% chance of happening, then 9 times out of 10 it will. Yogi Berra
If something has a 50% chance of happening, then 9 times out of 10 it will. Yogi Berra If you torture your data long enough, they will tell you whatever you want to hear. James L. Mills Warum Biostatistik?
Mehri =1 i =2 i =3 x i y i 4 0 1
Aufgabe (5+5=0 Punkte) (a) Bei einem Minigolfturnier traten 6 Spieler gegeneinander an. Die Anzahlen der von ihnen über das gesamte Turnier hinweg benötigten Schläge betrugen x = 24, x 2 = 27, x = 2, x
MehrNaive Bayes für Regressionsprobleme
Naive Bayes für Regressionsprobleme Vorhersage numerischer Werte mit dem Naive Bayes Algorithmus Nils Knappmeier Fachgebiet Knowledge Engineering Fachbereich Informatik Technische Universität Darmstadt
MehrMehrdimensionale Zufallsvariablen
Mehrdimensionale Zufallsvariablen Im Folgenden Beschränkung auf den diskreten Fall und zweidimensionale Zufallsvariablen. Vorstellung: Auswerten eines mehrdimensionalen Merkmals ( ) X Ỹ also z.b. ω Ω,
MehrUniversität Potsdam Institut für Informatik Lehrstuhl Maschinelles Lernen. Maschinelles Lernen
Universität Potsdam Institut für Informatik Lehrstuhl Niels Landwehr, Silvia Makowski, Christoph Sawade, Tobias Scheffer Organisation Vorlesung/Übung, praktische Informatik. 4 SWS. Übung: Di 10:00-11:30
MehrBIOMETRIE I - KLINISCHE EPIDEMIOLOGIE
BIOMETRIE I - KLINISCHE EPIDEMIOLOGIE Wintersemester 2003/04 - Übung zur Vorlesung Biometrie I Ein Lösungsvorschlag von Christian Brockly Lösungsvorschlag zur Übung Biometrie I Bei diesem Dokument handelt
MehrInhalt. 4.1 Motivation. 4.2 Evaluation. 4.3 Logistische Regression. 4.4 k-nächste Nachbarn. 4.5 Naïve Bayes. 4.6 Entscheidungsbäume
4. Klassifikation Inhalt 4.1 Motivation 4.2 Evaluation 4.3 Logistische Regression 4.4 k-nächste Nachbarn 4.5 Naïve Bayes 4.6 Entscheidungsbäume 4.7 Support Vector Machines 4.8 Neuronale Netze 4.9 Ensemble-Methoden
MehrGrundlagen der schließenden Statistik
Grundlagen der schließenden Statistik Schätzer, Konfidenzintervalle und Tests 1 46 Motivation Daten erhoben (Umfrage, Messwerte) Problem: Bei Wiederholung des Experiments wird man andere Beobachtungen
MehrStatistics, Data Analysis, and Simulation SS 2015
Mainz, June 11, 2015 Statistics, Data Analysis, and Simulation SS 2015 08.128.730 Statistik, Datenanalyse und Simulation Dr. Michael O. Distler Dr. Michael O. Distler
MehrFRAGESTUNDE WS 2016/17 QM 2. Dr. Christian Schwarz 1
FRAGESTUNDE Dr. Christian Schwarz 1 #2 - Allgemein Q: Müssen wir den Standard Error händisch berechnen können? R: Nein. Q: Hat das Monte Carlo Experiment irgendeine Bedeutung für uns im Hinblick auf die
MehrAlternative Darstellung des 2-Stichprobentests für Anteile
Alternative Darstellung des -Stichprobentests für Anteile DCF CF Total n= 111 11 3 Response 43 6 69 Resp. Rate 0,387 0,3 0,309 Bei Gültigkeit der Nullhypothese Beobachtete Response No Response Total absolut
Mehrlimhatewerzeoelhiniii
limhatewerzeoelhiniii Vorwort 13 Kapitel 1 Einleitung 15 1.1 Wozu brauchen wir Statistik? 16 1.2 Medizinische Statistik 16 1.3 Beschreibende und schließende Statistik 17 1.4 Das Buch in Kürze 17 Kapitel
Mehr