Interaktive internetbasierte Auswertung der Krebsregister am OSP Stuttgart mittels der Software OCDM Online Clinical Data Mining Version 2.

Größe: px
Ab Seite anzeigen:

Download "Interaktive internetbasierte Auswertung der Krebsregister am OSP Stuttgart mittels der Software OCDM Online Clinical Data Mining Version 2."

Transkript

1 Interaktive internetbasierte Auswertung der Krebsregister am OSP Stuttgart mittels der Software OCDM Online Clinical Data Mining Version 2.5 Handbuch 4. August 2009 c Random Research, c/o Institut für Stochastik und Anwendungen, Fachbereich Mathematik, Universität Stuttgart, Pfaffenwaldring 57, Stuttgart Kontakt: Jürgen Dippon, phone 0711/ , fax 0711/ , mobile

2 Inhaltsverzeichnis 1 Interaktive internetbasierte Auswertung von klinischen Krebsregistern 3 2 Startseite 4 3 Methoden Subgruppenanalyse Auswahl ähnlicher Fälle Cox-Regression Ergebnisse Profilbeschreibung Diagramme Kaplan-Meier Hazard-Rate Jahre Alter Histologie pt Tumorgröße pn Anzahl der befallenen Lymphknoten pm Metastasierung Klassifikation ER Östrogenrezeptorstatus PR Progesteronrezeptorstatus Todesursache Adjuvant Klinik Menopausenstatus Brusterhaltende Therapie Überleben Daten Cox A Glossar zu einigen statistischen Begriffen 17 Literatur 19 2

3 1 Interaktive internetbasierte Auswertung von klinischen Krebsregistern Die Software OCDM (Online Clinical Data Mining) dient zur statistischen Auswertung von klinischen Krebsregistern. Hierzu gehören deskriptive, grafische, exploratorive und konfirmatorische statistische Methoden. Die Auswertung erfolgt interaktiv und internetbasiert über einen Browser. Es muss keine zusätzliche Software installiert werden. Alle Anfragen und Berechnungen erfolgen auf einem Server. Der Zugang zu diesem Server ist passwortgeschützt und läuft in geschützter Weise über eine VPN-Verbindung. Eine besondere Stärke der Software liegt in der Möglichkeit des explorativen Vorgehens. Hierbei werden von dem Ergebnis einer vorangegangenen statistischen Analyse weitere Hypothesen abgeleitet und in einem Dialog untersucht. Als Beispiele für Fragestellungen, die mit OCDM behandelt werden können, seien die folgenden genannt: Konnte meine Klinik die Ergebnisqualität bei nichtmetastasiereten Patientinnen in den letzten fünf Jahren steigern? Wenn ja, bei welchen Subgruppen von Patienten? Ist die relative Anzahl der brusterhaltenden Operationen an den einzelnen Kliniken in Stuttgart unterschiedlich? Falls ja, könnte dies eventuell mit der Altersverteilung der Patientinnen an den jeweiligen Kliniken zusammenhängen? In welchen Subgruppen werden brusterhaltende Operationen vorwiegend durchgeführt? Hat die Wahl dieser Methode einen Einfluss auf die Restlebenszeit? Gibt es Unterschiede in der Ergebnisqualität im Vergleich der einzelnen Kliniken? Woran könnte dies gegebenenfalls liegen? Hat der histologische Befund bei Brustkrebs einen Einfluss auf den klinischen Verlauf der Erkrankung? Wie ist der zu erwartende klinische Verlauf einer Patientin mit Brustkrebs im Alter von 45 Jahren, Östrogenrezeptorstatus negativ, Progesteronrezeptorstatus positiv, keinen befallenen Lymphknoten, Tumorgröße < 2cm und weiteren klinischen Parametern? Kann man zu einem neuen Fall die zehn ähnlichsten Fälle aus der Datenbank extrahieren? Wie war deren klinischer Verlauf? Welche Therapie wurde bei diesen Patienten gewählt? 3

4 Kann man die Unterschiede im klinischen Verlauf zweier Subgruppen unter Verwendung des Hazard Ratios quantifizieren, ferner hierfür einen p-wert und ein Konfidenzintervall angeben? Wie kann ich die Daten einer bestimmten Subgruppe zu einer weiteren statistischen und grafischen Verarbeitung an meinem Arbeitsplatz aus der Datenbank extrahieren? Warnung: Die Interpretation der Ergebnisse verlangt in der Regel statistischen Sachverstand, um mögliche Verzerrungen zu erkennen oder Fehlschlüsse zu vermeiden. 2 Startseite Zur Zeit können die Daten von Patienten mit einer der fünf folgenden Krebserkrankungen untersucht werden (siehe Abbildung 1): Brustkrebs Bronchialkrebs Kolonkarzinom Rektumkarzinom Prostatakrebs 3 Methoden Nach Wahl einer Krebsentität stehen drei verschiedene Analysemethoden zur Verfügung: Subgruppenanlyse Auswahl ähnlicher Fälle Cox-Regression 3.1 Subgruppenanalyse Bei einer Subgruppenanalyse kann eine Subgruppe untersucht oder mehrere Subgruppen miteinander verglichen werden. Die Anzahl der zu untersuchenden Subgruppen kann unter Anzahl der Profile gewählt werden (siehe Abb. 2. Soll einem Patienten eine gewisse Subgruppe zugeordnet werden, so können dessen Daten zur leichteren späteren Zuordnung 4

5 Abbildung 1: Startseite eingegeben werden. Hierzu ist unter Dokumentation die Alternative ja zu wählen. Standardmäßig werden die Daten zu den zehn ersten Patienten eines jeden Profils ausgegeben. Es können aber auch andere Anzahlen gewählt werden. Für die Überlebenszeitanalyse ist noch von Bedeutung, welche Ereignisse als Tod und welche als zensiert zu interpretieren sind. Hierbei hat man die drei Wahlmöglichkeiten jede Todesursache, unbekannt oder Krebs, nur Krebs. Es ist allerdings zu beachten, dass bei vielen Patienten die genaue Todesursache nicht bekannt ist. Deshalb wird man hier meist jede Todesursache als Ereignis ansehen. Die Definition von Profilen kann verwendet werden, um die Verlaufsdaten und Struktur von Patientengruppen mehrerer Krankenhäuser miteinander zu vergleichen. Ebenso können auch verschiedene Subgruppen von Patienten miteinander verglichen werden. Z.B. können bei Brustkrebs die Verlaufsdaten von prä-, peri- und postmenopauselen Frauen miteinander verglichen werden. Bei der Krebsart Brustkrebs kann der Zeitraum der Erstdiagnose, das Alter bei Erstdiagnose, der histologische Typ des Tumors, die Größe des Tumors, die Anzahl der befallenen Lymphknoten, das Vorliegen von Fernmetastasen, die Klassifikation des Tumors (Grading), der Menopausenstatus, der Östrogenrezeptorstatus, der Progesteronrezeporstatus und die Art der OP-Methode (brusterhaltende Therapie) gewählt werden. Wurde oben die Eingabemöglichkeit für eine Dokumentation gewählt, so erscheinen anschließend noch drei Felder für einen Freitexteintrag (Name des Patienten, Geburtsdatum, Therapie). Wird im Feld Alter für Erstdiagnose ein Intervall angegeben, so wird zu dem Alter, 5

6 welches der Intervallmitte entspricht, die Sterbekurve der Gesamtbevölkerung berechnet und im Kaplan-Meier-Chart jedem Profil entsprechend ausgegeben. Als Beispiel vergleichen wir die Überlebenszeiten und klinischen Faktoren von östrogenrezeptorpositiven und -negativen Frauen bei Brustkrebs. Hierbei schließen wir all diejenigen Fälle aus, die bei der Erstdiagnose bereits Metastasen aufwiesen. Das Formular zur Erstellung dieser beiden Profile ist in Abbildung 2, die beiden dazugehörigen Überlebenszeitkurven sind in Abbildung 3 zu finden. 3.2 Auswahl ähnlicher Fälle Anstelle der Definition von Subgruppen werden hier die zu einem gegebenen Profil k ähnlichsten Fälle aus der Datenbank ausgewählt. Hierbei wird das Ähnlichkeitsmaß auf dem von den Faktoren (Einflussgrößen) aufgespannten Raum vermittels deren Einfluss (Hazard Ratio) auf die Überlebenszeit konstruiert. Die zu betrachtenden Faktoren können hierbei vom Benutzer ausgewählt werden. Es ist sogar möglich, alle Faktoren auszuwählen. Werden bei einer Subgruppenanalyse zuviele Faktoren ausgewählt, kann dies zur Folge haben, dass nur sehr wenige oder gar keine Fälle mit dem dadurch vorgegebenen Profil übereinstimmen. Dieses Phänomen ist unter dem Namen Fluch der hohen Dimension bekannt. Im Gegensatz dazu werden bei der Methode der Suche nach den k ähnlichsten Fällen immer genau k Fälle ausgewählt. Weitere Details hierzu findet man in [2, 3]. Die hier vorgestellte Methode dient dazu, zu einem gegebenen vorliegenden neuen Fall die hinsichtlich der Überlebenszeit ähnlichsten Fälle zu suchen, um deren bekannte Überlebenszeit zu verwenden, die Überlebenszeitfunktion des vorliegenden neuen Falles zu schätzen. Zusätzlich könnte das Studium der Verläufe und Therapien der ähnlichsten Fälle Hinweise auf den Verlauf und die Wahl der Therapie für den neuen vorliegenden Fall liefern (Case based reasoning). 3.3 Cox-Regression Um den Einfluss von Faktoren auf die Überlebenszeit genauer abschätzen zu können, gibt es auch die Möglichkeit, eine Cox-Regression durchzuführen. Hierbei werden in der ersten Spalte zunächst diejenigen Faktoren ausgewählt, die in das Modell aufgenommen werden sollen. Rechts davon können verschiedene Profile definiert werden, deren Vereinigung diejenige Teilmenge von Fällen definiert, für die das Cox-Modell berechnet werden soll. Zum Beispiel könnte es von Interesse sein, nur prämenopausale oder metastasierte Patienten oder Fälle mit Klassifikation (Grading) 1 oder 2 zu betrachten. Als Beispiel untersuchen wir die Frage, welchen Einfluss der Östrogenrezeptorstatus und die Wahl einer brusterhaltenden Therapie auf Verteilung der Überlebenszeit besitzt, 6

7 Abbildung 2: Durch die Wahl Anzahl der Profile gleich 2 erscheint ein Formular mit zwei Profilen. Werden dann anschließende beim Faktor Östrogenrezeptorstatus die Alternativen Positiv und Negativ gewählt und bei Fernmetastasen bei Erstdiagnose der Eintrag nein, so können diese beiden Subgruppen miteinander verglichen werden. Weitere Einschränkungen sind möglich, z.b. hinsichtlich des Alters oder der Klinik. Diese weiteren Einschränkungen werden bei den meisten Fragestellungen in beiden Profilen jedoch übereinstimmen, um eine sinnvolle Interpretation der Ergebnisse zu ermöglichen. Bei der Wahl eines Altersintervalles wird im Kaplan-Meier-Chart noch die Überlebenszeitkurve einer weiblichen Person aus der deutschen Normalbevölkerung angegeben, deren Alter dem Intervallmittelpunkt entspricht (Daten vom Statistischen Bundesamt). und zwar in der in der Gruppe derjenigen Patientinnen, die zwischen 20 und 40 Jahre alt sind und T1-Tumore aufwiesen. Die Anfrage kann wie in Abbildung 4 durchgeführt werden. Das Ergebnis ist in Abbildung 8 zu finden. Die Ausgabe erfolgt in Tabellenform unter der Karteikarte Cox. Hierbei werden die zu den einzelnen Faktoren gehörigen Schätzung für die log-hazards-ratios, Hazard-Ratios, Standardfehler, z-werte, p-werte, untere und obere 95%-Konfidenzintervallgrenzen für die 7

8 Abbildung 3: Über eine Seite dieses Typs können die Ergebnisse abgerufen werden. Zu sehen ist die Definition der Profile und die Überlebenszeitkurven samt in heller Farbe dargestellte Konfidenzbereiche. Beim Vergleich der Überlebenszeitkurven mittels Log-Rang-Test ergibt sich der im Titel der Grafik angegebene p-wert. Im gewählten Beispiel sind die beiden Überlebenszeitkurven hoch signifikant verschieden. Der Überlebenszeitvorteil östrogenrezeptorpositiver Frauen (rot) kehrt sich nach etwa 12 Jahren um. Eine mögliche Ursache könnte darin liegen, dass Frauen mit positivem Östrogenrezeptorstatus im Durchschnitt etwas älter sind als Frauen mit negativem Östrogenrezeptorstatus. Dies kann durch Vergleich der Altersverteilungen bestätigt werden (siehe Abb. 6). Ob dadurch die beschriebene Beobachtung vollständig erklärt werden kann, sei hier dahingestellt. Eine Überprüfung dieser Vermutung mittels einer Cox-Regression mit den Faktoren Östrogenrezptorstatus und Alter, basierend auf der Subgruppe der Frauen, die bei Erstdiagnose noch keine Metastasen aufwiesen, ist hier jedoch nicht zulässig, da die Überlebenszeitkurven die Proportional-Hazard-Annahme offensichtlich nicht erfüllen. Eine mögliche Strategie könnte z.b. darin bestehen, altersadjustierte Überlebenszeiten zu analysieren. Hazard-Ratios und weitere mit der Likelihood-Schätzung in Verbindung stehende Kenngrößen angegeben. Als Baseline-Werte dienen für die einzelnen Faktoren immer die nicht genannten Ausprägungen. Weitere Details hierzu findet man in der einschlägigen Litera- 8

9 Abbildung 4: Formular zur Berechnung einer Cox-Regression mit den beiden Faktoren Östrogenrezeptorstatus und brusterhaltende Therapie, wobei nur diejenigen Patientinnen betrachtet werden sollen, die zwischen 20 und 40 Jahre alt sind und T1-Tumore aufweisen. tur zur Überlebenszeitanalyse, z.b. [1]. Hier finden sich auch die Voraussetzungen, unter denen eine solche Analyse zulässig ist (z.b. die Proportional-Hazards-Annahme). 4 Ergebnisse Die Daten werden gemäß der gewählten Methode in verschiedenerlei Hinsicht ausgewertet: grafisch, deskriptiv und konfirmatorisch. Die vorzufindenden Grafiken und Analysen hängen von der gewünschten Methode und der zu untersuchenden Krebsentität ab. Die nachfolgende Beschreibung konzentriert sich auf die für Brustkrebs verfügbaren Faktoren. 4.1 Profilbeschreibung Hier werden die gewählten Profile in übersichtlicher Form auf der Ergebnisseite wiederholt. Ein Beispiel hierzu ist in Abbildung 3 zu finden. 9

10 4.2 Diagramme Neben der grafischen Darstellung der jeweiligen Zielgröße für jedes Profil werden meist noch statistische Tests auf Homogenität durchgeführt. Bei Überlebenszeiten ist dies der Log-Rang-Test, bei Zähldaten der χ 2 -Test. Die dazugehörigen p-werte erscheint in der jeweiligen Titelzeile. Die χ 2 -Tests können dazu dienen, mögliche Ursachen im unterschiedlichen Überleben der einzelnen Profile zu identifizieren. Es ist zu beachten, dass bei zu kleinen Zellenzahlen in den Kontingenztafeln in dieser Version noch keine Warnung ausgegeben wird. Ist der Wert eines Faktors zu einem Patienten unbekannt, so erhält der Faktor die Ausprägung NA (not available). Deshalb taucht in den Häufigkeitsgrafiken die Ausprägung NA auf Kaplan-Meier Zu jedem Profil wird eine Überlebenszeitkurve generiert. Punktweise 95%-Konfidenzbereiche werden in schraffierter Form angegeben. Mittels Log-Rang-Test wird die Hypothese überprüft, ob die Profile unterschiedliche Überlebenszeitverteilungen besitzen. Der dazugehörige p-wert wird im Titel der Grafik angezeigt. Ein Beispiel hierzu ist in Abbildung 3 zu finden Hazard-Rate Die zu den Hazard-Raten gehörigen Kurven bieten oft eine genauere Art der Analyse als die Überlebenszeitverteilungen. Da in dieser Version noch keine Konfidenzbereiche angezeigt werden, sind die Kurven im rechten Bereich (große Überlebenszeiten) mit Vorsicht zu interpretieren, siehe Abb Jahre Diese Kurven geben die absolute oder relative Anzahl der Fälle mit Erstdiagnose in den genannten Jahren zu den einzelnen Profilen an Alter Diese Kurven geben die absolute oder relative Anzahl der Fälle mit Erstdiagnose in den genannten Lebensjahren zu den einzelnen Profilen an. In Abbildung 6 werden die Altersverteilungen östrogenrezeptorpositiven und -negativen Patientinnen verglichen. 10

11 Abbildung 5: Vergleich der Hazardraten von Brustkrebspatientinnen mit positivem bzw. negativen Östrogenrezeptorstatus in der Subgruppe der Frauen ohne Frühmetastasierung. Die Hazardraten werden in Abhängigkeit der Zeit nach Erstdiagnose der Erkrankung angegeben. Es ist zu erkennen, dass die momentane Gefahr innerhalb der ersten fünf Jahre zu versterben bei einer östrogenrezeptorpositiven Frau kleiner ist als bei einer östrogenrezeptornegativen Frau, danach ist es umgekehrt. Der dargestellte Verlauf der Hazardkurven ab dem 15. Jahr sollte jedoch mit Vorsicht betrachtet werden, da die dazugehörigen Konfidenzbereiche vermutlich sehr breit sind. Es sei noch bemerkt, dass viele klinische Studien meist nur ein Follow-Up bis zu fünf Jahre betrachten. Ein Langzeit-Follow-Up der hier dargestellten Art ist eine besondere Stärke eines klinischen Krebsregisters. Schließlich sei noch erwähnt, dass die Fläche unter einer Hazardratenkurve bis zum Zeitpunkt t gleich dem Wert H(t) der sogenannten kumulativen Hazardfunktion ist. Diese ist mit der Wahrscheinlichkeit S(t) bis zum Zeitpunkt t zu versterben durch die Gleichung S(t) = exp( H(t)) gekoppelt Histologie Hier werden die absoluten oder relativen Häufigkeiten der Patienten mit der Ausprägungen invasiv duktal, invasiv lobulär, sonstige oder NA angegeben, siehe Abbildung 7. 11

12 Abbildung 6: Altersverteilung von Brustkrebspatientinnen mit positivem bzw. negativem Östrogenrezeptorstatus. Die Ordinate gibt die (geglättete) Anzahl der Patientinnen zu dem jeweiligen Alter an. Offensichtlich sind östrogenrezeptornegative Frauen im Mittel etwas jünger. Eine Darstellung mit relativen Häufigkeiten (Button rechts) stellt diesen Sachverhalt noch klarer dar pt Tumorgröße Hier werden die absoluten oder relativen Häufigkeiten der Patienten mit den Tumorgrößen T1, T2, T3, T4, Sonstige, NA dargestellt pn Anzahl der befallenen Lymphknoten Hier werden die absoluten oder relativen Häufigkeiten derjenigen Patienten mit Anzahl der befallenen Lymphknoten mit einer der Ausprägungen pn0, pn1, pn2, pn3, pn4, NA dargestellt pm Metastasierung Hier werden die absoluten oder relativen Häufigkeiten derjenigen Patienten dargestellt, bei denen eine oder keine Metastasierung bei Erstdiagnose festgestellt wurde. Ist darüber nichts bekannt, erfolgt die Angabe NA. 12

13 Abbildung 7: Vergleich der Histologie von östrogenrezeptorpositiven und -negativen Patientinnen. Durch Wahl des Buttons relativ werden die relativen Häufigkeiten angezeigt, was einen Vergleich Profile erleichtert. Der χ 2 -Test bestätigt, dass die Verteilungen der histologischen Typen bei östrogenrezeptorpositiven und -negativen Patientinnen signifikant unterschiedlich sind. Eine Darstellung mit relativen Häufigkeiten (Button rechts) visualisiert diesen Sachverhalt noch offensichtlicher Klassifikation Hier werden die absoluten oder relativen Häufigkeiten derjenigen Patienten dargestellt, bei denen die Klassifikation des Tumors in eine der Klassen G1, G2, G3, G4 oder NA fällt ER Östrogenrezeptorstatus Hier werden die absoluten oder relativen Häufigkeiten derjenigen Patienten dargestellt, bei denen positiver oder negativer Östrogenrezeptorstatus diagnostiziert wurde. Ist darüber nichts bekannt, erfolgt die Angabe NA. 13

14 PR Progesteronrezeptorstatus Hier werden die absoluten oder relativen Häufigkeiten derjenigen Patienten dargestellt, bei denen positiver oder negativer Progesteronrezeptorstatus diagnostiziert wurde. Ist darüber nichts bekannt, erfolgt die Angabe NA Todesursache Hier werden die absoluten oder relativen Häufigkeiten derjenigen Patienten dargestellt, die noch am Leben sind, eines nicht in Beziehung zur betrachteten Krebserkrankung stehenden Todes gestorben sind, deren Todesursache unbekannt ist, oder die an den Folgen der Krebserkrankung gestorben sind Adjuvant Hier wird angegeben, wieviele der Patienten in den betrachteten Profilen eine eine adjuvanten oder palliative Versorgung erhielten. Auch hier ist eine Darstellung in absoluten oder relativen Häufigkeiten möglich Klinik Hier werden die absoluten oder relativen Häufigkeiten der Patienten in den einzelnen Kliniken dargestellt Menopausenstatus Hier werden die absoluten oder relativen Häufigkeiten derjenigen Patienten dargestellt, die sich bei Erstdiagnose im prä-, peri- oder postmenopausalen Status befinden. Ist darüber nichts bekannt, erfolgt die Angabe NA Brusterhaltende Therapie Hier werden die absoluten oder relativen Häufigkeiten derjenigen Patienten dargestellt, bei denen eine oder keine brusterhaltende Therapie durchgeführt wurde. Ist darüber nichts bekannt, erfolgt die Angabe NA. 4.3 Überleben Diese Karteikarte liefert statistische Kennziffern zum Überleben der einzelnen Profile, welche durch Anklicken abgerufen werden können: Mediane Überlebenszeit 14

15 Untere Grenze eines 95%-Konfidenzintervalles zur n-jahresüberlebenswahrscheinlichkeit Geschätze n-jahresüberlebenswahrscheinlichkeit Obere Grenze eines 95%-Konfidenzintervalles zur n-jahresüberlebenswahrscheinlichkeit Die n-jahreswahrscheinlichkeit des Überlebens wird sofern aufgrund der Datenlage möglich zu den Jahren n = 2, 5, 10 und 20 geschätzt. 4.4 Daten Die zu den einzelnen Profilen passenden Daten können unter dieser Karteikarte eingesehen werden. Außer dem Alter werden keine weiteren biografischen Angaben gezeigt. Die maximale Anzahl der hier dargestellten Fälle kann auf der Seite, auf welcher die Profile definiert werden, eingestellt werden. Am unteren Ende dieser Tabelle befindet sich ein Link, über den die Tabelle zu dem betrachteten Profil als csv-datei zur weiteren Analyse heruntergeladen werden kann. 4.5 Cox Wird als Methode die Cox-Regression gewählt, so wird unter der Karte Cox das Ergebnis ausgegeben. 15

16 Abbildung 8: Output der Cox-Regression mit den beiden Faktoren Östrogenrezeptorstatus und brusterhaltende Therapie, basierend auf der Gruppe derjenigen Patientinnen, die zwischen 20 und 40 Jahre alt sind und T1-Tumore aufwiesen. 16

17 A Glossar zu einigen statistischen Begriffen Im Folgenden werden einige wichtige biostatistische Begriffe erläutert. Für weitere und tiefergehende Erklärungen wird auf die einschlägige Literatur verwiesen. χ 2 -Test auf Unabhängigkeit: Dient zur Überprüfung der Hypothese, ob eine kategorielle Zufallsgröße von einer weiteren kategoriellen Zufallsgröße abhängt, z.b. ob die Anzahl der befallenen Lymphknoten stochastisch unabhängig von einem gewissen Hormonrezeptorstatus ist. Ganz allgemein kann mit OCDM überprüft werden, ob ein gewisses kategorielles Merkmal stochastisch unabhängig von einer Serie von vom Anwender gewählten Profilen ist. Cox-Regression: Das von Sir David Cox vorgeschlagene Regressionsmodell dient zur Untersuchung des Verhaltens der Hazardfunktion in Abhängigkeit von gewissen Einflussfaktoren, wie epidemiologischen oder klinischen Parametern. Liegen zum Beispiel die Werte x 1,..., x q von q dichotomen Einflussfaktoren für ein gewisses Individuum vor, so wird die Hazardfunktion dieses Individuums über die Relation h(t) = h 0 (t) exp(β 1 x β q x q ) (1) modelliert. h 0 bezeichnet dabei eine unbekannte Baseline-Hazardfunktion, die unabhängig von den Einflussfaktoren ist und zur Modellierung der Zeitabhängigkeit dient. Der Faktor x i hat den Wert 1, falls der betreffende Einflussfaktor vorliegt, ansonsten den Wert 0. Die unbekannten Parameter β 1,..., β q müssen über die vorliegenden Daten geschätzt werden. Ist der i-te Einflussfaktor x i dichotom, so kann β i als logarithmiertes Hazardverhältnis zweier Individuen interpretiert werden, die sich nur in der Ausprägung dieses i-ten Faktors unterscheiden, in den anderen Faktoren aber identisch sind. Weist der betrachtete Faktor k Faktorstufen auf mit k > 2, so werden zu diesem Faktor k 1 Parameter βi 1,..., β k 1 i Parameter geschätzt. Der Summand β i x i in Gleichung (1) muss dann durch die Summe βi 1 x 1 i β k 1 i x k 1 i ersetzt werden, wobei x j i genau dann gleich 1 ist, wenn die (j +1)-te Faktorstufe des Faktors i vorliegt, sonst gleich 0. Die zu Faktor i gehörigen Werte β j i können als die logarithmierten Hazardraten zu den Faktorstufen j + 1 und 0 interpretiert werden. Hazardrate, Hazardfunktion: Die zu einem Zeitpunkt t bestehende Neigung, dass eine gewisses Ereignis, z.b. Rezidiv oder Tod, eintritt. Formal ist die Hazardrate h(t) definiert als P (t T t + t T t) h(t) = lim t 0 t wobei T die zufällige Zeit des betrachteten Ereignis und t der Zeitpunkt, zu dem die Hazardrate berechnet werden soll. Die im Zähler stehende Ausdruck ist die bedingte 17

18 Wahrscheinlichkeit, dass das zufällige Ereignis im Zeitintervall zwischen t und t+ t eintritt unter der Voraussetzung, dass das Ereignis nicht schon vor dem Zeitpunkt t eingetreten ist. Hazardverhältnis: Verhältnis der Hazardraten zweier Individuen oder Subgruppen. partielle Likelihood: Wird zur Berechnung der Koeffizienten β i im Regressions-Modell verwendet. Hierbei werden grob gesagt diejenigen Werte für β 1,..., β q gewählt, die das Auftreten der tatsächlich ermittelten Daten (Überlebenszeiten, Faktorwerte) am wahrscheinlichsten erscheinen lassen. Log-Rang-Test: Dient zur Überprüfung der Hypothese H 0 über die Gleichheit mehrerer Überlebenszeitkurven. Ist der dazugehörige p-wert kleiner als 0,05, so wird die Hypothese H 0 zum Signifikanzniveau 0,05 verworfen. Median: Teilt den Wertebereich einer numerischen Zufallsgröße in zwei Hälften, die jeweils das Wahrscheinlichkeitmaß 0,5 besitzten. p-wert: Gibt bei einem statistischen Signifikanztest das größte Signifikanzniveau an, zu welchem die Nullhypothese des Tests gerade noch fälschlicherweise verworfen würde. stochastische Unabhängigkeit zweier Ereignisse: Liegt vor, wenn die Wahrscheinlichkeit des Eintretens des einen Ereignisses unabhängi vom Eintritt des anderen Ereignisses ist. Sind zwei Ereignisse stochastisch unabhängig, so sind diese nicht notwendigerweise auch in einem kausalen Sinne unabhängig und umgekehrt. Überlebensfunktion, Survivalfunktion: Eine Funktion in Abhängigkeit von der Variablen t, die die Wahrscheinlichkeit S(t) angibt, dass das betrachtete Ereignis (z.b. Tod) nach dem Zeitpunkt t eintritt. 95%-Konfidenzintervall für einen Parameter: Ein Intervall, dessen Grenzen unter Verwendung der vorliegenden Daten berechnet wird. Würde man unter denselben Voraussetzungen die Datenerhebung und die darauf basierende Berechnung der Intervallgrenzen wiederholen, so würden diese Intervalle in mindestens 95% aller Fälle den gesuchten aber unbekannten Parameter einschließen. 18

19 Literatur [1] David Collett. Modelling Survival Data in Medical Research, 2nd ed. Chapman & Hall (2003). [2] Jürgen Dippon, Peter Fritz, Michael Kohler. A statistical approach to case based reasoning, with application to breast cancer data. Computational Statistics & Data Analysis 40(2002), [3] Sebastian Klenk, Jürgen Dippon, Peter Fritz, Gunther Heidemann. Interactive survival analysis with the OCDM system: from development to application. Information Systems Frontiers. Erscheint

Statistische Analyse von Ereigniszeiten

Statistische Analyse von Ereigniszeiten Statistische Analyse von Survival Analysis VO Biostatistik im WS 2006/2007 1 2 3 : Leukemiedaten (unzensiert) 33 Patienten mit Leukemie; Zielvariable Überlebenszeit. Alle Patienten verstorben und Überlebenszeit

Mehr

5. Schließende Statistik. 5.1. Einführung

5. Schließende Statistik. 5.1. Einführung 5. Schließende Statistik 5.1. Einführung Sollen auf der Basis von empirischen Untersuchungen (Daten) Erkenntnisse gewonnen und Entscheidungen gefällt werden, sind die Methoden der Statistik einzusetzen.

Mehr

9. Schätzen und Testen bei unbekannter Varianz

9. Schätzen und Testen bei unbekannter Varianz 9. Schätzen und Testen bei unbekannter Varianz Dr. Antje Kiesel Institut für Angewandte Mathematik WS 2011/2012 Schätzen und Testen bei unbekannter Varianz Wenn wir die Standardabweichung σ nicht kennen,

Mehr

Integration und Auswertung extern erhobener Daten in einem Klinischen Krebsregister am Beispiel von Schilddrüsenkarzinomen

Integration und Auswertung extern erhobener Daten in einem Klinischen Krebsregister am Beispiel von Schilddrüsenkarzinomen 197 Wegener Folien-5/4_SD/D Dienstag 19.4.25 12:35:3 Integration und Auswertung extern erhobener Daten in einem Klinischen Krebsregister am Beispiel von Schilddrüsenkarzinomen G. Wegener 1, B. Braatz 2,

Mehr

Statistik II für Betriebswirte Vorlesung 2

Statistik II für Betriebswirte Vorlesung 2 PD Dr. Frank Heyde TU Bergakademie Freiberg Institut für Stochastik Statistik II für Betriebswirte Vorlesung 2 21. Oktober 2014 Verbundene Stichproben Liegen zwei Stichproben vor, deren Werte einander

Mehr

Christian FG Schendera. Regressionsanalyse. mit SPSS. 2. korrigierte und aktualisierte Auflage DE GRUYTER OLDENBOURG

Christian FG Schendera. Regressionsanalyse. mit SPSS. 2. korrigierte und aktualisierte Auflage DE GRUYTER OLDENBOURG Christian FG Schendera Regressionsanalyse mit SPSS 2. korrigierte und aktualisierte Auflage DE GRUYTER OLDENBOURG Inhalt Vorworte V 1 Korrelation 1 1.1 Einführung 1 1.2 Erste Voraussetzung: Das Skalenniveau

Mehr

Das Dialogfeld für die Regressionsanalyse ("Lineare Regression") findet sich im Statistik- Menu unter "Regression"-"Linear":

Das Dialogfeld für die Regressionsanalyse (Lineare Regression) findet sich im Statistik- Menu unter Regression-Linear: Lineare Regression Das Dialogfeld für die Regressionsanalyse ("Lineare Regression") findet sich im Statistik- Menu unter "Regression"-"Linear": Im einfachsten Fall werden mehrere Prädiktoren (oder nur

Mehr

Multivariate Analyse: Einführung in das COX-Modell

Multivariate Analyse: Einführung in das COX-Modell Auswertung Multivariate Analyse: Einführung in das COX-Modell Deskriptive Statistik Häufigkeiten, Univariate Statistiken, Explorative Datenanalyse, Kreuztabellen) Induktive Statistik, Vergleich von Mittelwerten

Mehr

6 Mehrstufige zufällige Vorgänge Lösungshinweise

6 Mehrstufige zufällige Vorgänge Lösungshinweise 6 Mehrstufige zufällige Vorgänge Lösungshinweise Aufgabe 6.: Begründen Sie, warum die stochastische Unabhängigkeit zweier Ereignisse bzw. zufälliger Vorgänge nur ein Modell der Realität darstellen kann.

Mehr

Schätzung des Lifetime Values von Spendern mit Hilfe der Überlebensanalyse

Schätzung des Lifetime Values von Spendern mit Hilfe der Überlebensanalyse Schätzung Lifetime Values von Spenn mit Hilfe Überlebensanalyse Einführung in das Verfahren am Beispiel Einzugsgenehmigung Überlebensanalysen o Ereignisdatenanalysen behandeln das Problem, mit welcher

Mehr

Verteilungsmodelle. Verteilungsfunktion und Dichte von T

Verteilungsmodelle. Verteilungsfunktion und Dichte von T Verteilungsmodelle Verteilungsfunktion und Dichte von T Survivalfunktion von T Hazardrate von T Beziehungen zwischen F(t), S(t), f(t) und h(t) Vorüberlegung zu Lebensdauerverteilungen Die Exponentialverteilung

Mehr

Corpus uteri. 3.4 Corpus uteri

Corpus uteri. 3.4 Corpus uteri 77 Corpus uteri 3.4 Corpus uteri Das Korpuskarzinom ist nach Brust- und Darmkrebs gleich häufig wie Tumoren der Atmungsorgane und somit die dritthäufigste Krebserkrankung der Frau in Deutschland, die allerdings

Mehr

90-minütige Klausur Statistik für Studierende der Kommunikationswissenschaft

90-minütige Klausur Statistik für Studierende der Kommunikationswissenschaft Prof. Dr. Helmut Küchenhoff SS08 90-minütige Klausur Statistik für Studierende der Kommunikationswissenschaft am 22.7.2008 Anmerkungen Überprüfen Sie bitte sofort, ob Ihre Angabe vollständig ist. Sie sollte

Mehr

Varianzanalyse ANOVA

Varianzanalyse ANOVA Varianzanalyse ANOVA Johannes Hain Lehrstuhl für Mathematik VIII Statistik 1/23 Einfaktorielle Varianzanalyse (ANOVA) Bisher war man lediglich in der Lage, mit dem t-test einen Mittelwertsvergleich für

Mehr

Fortgeschrittene Statistik Logistische Regression

Fortgeschrittene Statistik Logistische Regression Fortgeschrittene Statistik Logistische Regression O D D S, O D D S - R A T I O, L O G I T T R A N S F O R M A T I O N, I N T E R P R E T A T I O N V O N K O E F F I Z I E N T E N, L O G I S T I S C H E

Mehr

Name (in Druckbuchstaben): Matrikelnummer: Unterschrift:

Name (in Druckbuchstaben): Matrikelnummer: Unterschrift: 20-minütige Klausur zur Vorlesung Lineare Modelle im Sommersemester 20 PD Dr. Christian Heumann Ludwig-Maximilians-Universität München, Institut für Statistik 2. Oktober 20, 4:5 6:5 Uhr Überprüfen Sie

Mehr

Business Value Launch 2006

Business Value Launch 2006 Quantitative Methoden Inferenzstatistik alea iacta est 11.04.2008 Prof. Dr. Walter Hussy und David Tobinski UDE.EDUcation College im Rahmen des dokforums Universität Duisburg-Essen Inferenzstatistik Erläuterung

Mehr

Tumorregister München

Tumorregister München Tumorregister München Inzidenz und Mortalität Auswahlmatrix Homepage English ICD-1 C62: Hodentumor Survival Diagnosejahr 1988-1997 1998-214 Patienten 935 3 262 Erkrankungen 95 3 33 Fälle in Auswertung

Mehr

Qualitätssicherung Brustkrebs auf Grundlage des Datensatzes gemäß der DMP-Richtlinie, Teil B I. Ziffer 5

Qualitätssicherung Brustkrebs auf Grundlage des Datensatzes gemäß der DMP-Richtlinie, Teil B I. Ziffer 5 Anlage 8 zur Vereinbarung über die Durchführung strukturierter Behandlungsprogramme nach 137f SGB V zur Verbesserung der Versorgungssituation von Brustkrebs-Patientinnen Qualitätssicherung Brustkrebs auf

Mehr

Florian Frötscher und Demet Özçetin

Florian Frötscher und Demet Özçetin Statistische Tests in der Mehrsprachigkeitsforschung Aufgaben, Anforderungen, Probleme. Florian Frötscher und Demet Özçetin florian.froetscher@uni-hamburg.de SFB 538 Mehrsprachigkeit Max-Brauer-Allee 60

Mehr

2. Statistische Methoden in der Diagnostik. Elemente des Studiendesigns

2. Statistische Methoden in der Diagnostik. Elemente des Studiendesigns 2. Statistische Methoden in der Diagnostik Elemente des Studiendesigns Diagnosestudien in der Medizin Klassifikation in krank - nicht krank basierend auf diagnostischem Test Beispiel: Diagnose von Brustkrebs

Mehr

12. Vergleich mehrerer Stichproben

12. Vergleich mehrerer Stichproben 12. Vergleich mehrerer Stichproben Dr. Antje Kiesel Institut für Angewandte Mathematik WS 2011/2012 Häufig wollen wir verschiedene Populationen, Verfahren, usw. miteinander vergleichen. Beipiel: Vergleich

Mehr

Methoden Quantitative Datenanalyse

Methoden Quantitative Datenanalyse Leitfaden Universität Zürich ISEK - Andreasstrasse 15 CH-8050 Zürich Telefon +41 44 635 22 11 Telefax +41 44 635 22 19 www.isek.uzh.ch 11. September 2014 Methoden Quantitative Datenanalyse Vorbereitung

Mehr

Analog zu Aufgabe 16.1 werden die Daten durch folgenden Befehl eingelesen: > kredit<-read.table("c:\\compaufg\\kredit.

Analog zu Aufgabe 16.1 werden die Daten durch folgenden Befehl eingelesen: > kredit<-read.table(c:\\compaufg\\kredit. Lösung 16.3 Analog zu Aufgabe 16.1 werden die Daten durch folgenden Befehl eingelesen: > kredit

Mehr

Weitere Fragestellungen im Zusammenhang mit einer linearen Einfachregression

Weitere Fragestellungen im Zusammenhang mit einer linearen Einfachregression Weitere Fragestellungen im Zusammenhang mit einer linearen Einfachregression Speziell im Zusammenhang mit der Ablehnung der Globalhypothese werden bei einer linearen Einfachregression weitere Fragestellungen

Mehr

5.2. Nichtparametrische Tests. 5.2.1. Zwei unabhängige Stichproben: U- Test nach MANN- WHITNEY

5.2. Nichtparametrische Tests. 5.2.1. Zwei unabhängige Stichproben: U- Test nach MANN- WHITNEY 5.2. Nichtparametrische Tests 5.2.1. Zwei unabhängige Stichproben: U- Test nach MANN- WHITNEY Voraussetzungen: - Die Verteilungen der beiden Grundgesamtheiten sollten eine ähnliche Form aufweisen. - Die

Mehr

Aufgaben und Ziele Klinischer Krebsregister

Aufgaben und Ziele Klinischer Krebsregister Aufgaben und Ziele Klinischer Krebsregister Dr. Peter Schmidt Klinisches Tumorregister, Med. Fakultät der Uni Halle Universitätsklinikum Halle, Ernst-Grube-Str. 40, 06097 Halle e-mail: tumorzentrum@medizin.uni-halle.de

Mehr

Kaplan-Meier-Schätzer

Kaplan-Meier-Schätzer Kaplan-Meier-Schätzer Ausgangssituation Zwei naive Ansätze zur Schätzung der Survivalfunktion Unverzerrte Schätzung der Survivalfunktion Der Kaplan-Meier-Schätzer Standardfehler und Konfidenzintervall

Mehr

Live -Statistiken zur Zertifizierung von Brustzentren welche Patientenauswahl ist für f welche Fragestellung korrekt?

Live -Statistiken zur Zertifizierung von Brustzentren welche Patientenauswahl ist für f welche Fragestellung korrekt? 18. Informationstagung für f r Tumordokumentation Live -Statistiken zur Zertifizierung von Brustzentren welche Patientenauswahl ist für f welche Fragestellung korrekt? Dipl.-Phys. Heike Lüders Heike Soltendieck

Mehr

Statistische Auswertung der Daten von Blatt 13

Statistische Auswertung der Daten von Blatt 13 Statistische Auswertung der Daten von Blatt 13 Problemstellung 1 Graphische Darstellung der Daten 1 Diskussion der Normalverteilung 3 Mittelwerte und deren Konfidenzbereiche 3 Signifikanz der Behandlung

Mehr

Analyse bivariater Kontingenztafeln

Analyse bivariater Kontingenztafeln Analyse bivariater Kontingenztafeln Werden zwei kategoriale Merkmale mit nicht zu vielen möglichen Ausprägungen gemeinsam analysiert, so kommen zur Beschreibung der gemeinsamen Verteilung im allgemeinen

Mehr

Leistungen klinischer Krebsregister für Versorgungszentren, Kliniken und niedergelassene Ärzte Jutta Engel für das Forum KKR

Leistungen klinischer Krebsregister für Versorgungszentren, Kliniken und niedergelassene Ärzte Jutta Engel für das Forum KKR Leistungen klinischer Krebsregister für Versorgungszentren, Kliniken und niedergelassene Ärzte Jutta Engel für das Forum KKR Krebsregistrierung im Zeichen des Nationalen Krebsplans Jena 1.-3. April 2009

Mehr

Statistik II für Betriebswirte Vorlesung 3

Statistik II für Betriebswirte Vorlesung 3 PD Dr. Frank Heyde TU Bergakademie Freiberg Institut für Stochastik Statistik II für Betriebswirte Vorlesung 3 5. November 2013 Beispiel: Aktiensplit (Aczel & Sounderpandan, Aufg. 14-28) Ein Börsenanalyst

Mehr

Dossierbewertung A13-10 Version 1.0 Pertuzumab Nutzenbewertung gemäß 35a SGB V 27.06.2013

Dossierbewertung A13-10 Version 1.0 Pertuzumab Nutzenbewertung gemäß 35a SGB V 27.06.2013 2 Nutzenbewertung 2.1 Kurzfassung der Nutzenbewertung Hintergrund Der G-BA hat das IQWiG mit der Nutzenbewertung des Wirkstoffs Pertuzumab gemäß 35a SGB V beauftragt. Die Bewertung erfolgte auf Basis eines

Mehr

Prüfung eines Datenbestandes

Prüfung eines Datenbestandes Prüfung eines Datenbestandes auf Abweichungen einzelner Zahlen vom erwarteten mathematisch-statistischen Verhalten, die nicht mit einem Zufall erklärbar sind (Prüfung auf Manipulationen des Datenbestandes)

Mehr

Auswertung mit dem Statistikprogramm SPSS: 30.11.05

Auswertung mit dem Statistikprogramm SPSS: 30.11.05 Auswertung mit dem Statistikprogramm SPSS: 30.11.05 Seite 1 Einführung SPSS Was ist eine Fragestellung? Beispiel Welche statistische Prozedur gehört zu welcher Hypothese? Statistische Berechnungen mit

Mehr

Einführung in die Geostatistik (7) Fred Hattermann (Vorlesung), hattermann@pik-potsdam.de Michael Roers (Übung), roers@pik-potsdam.

Einführung in die Geostatistik (7) Fred Hattermann (Vorlesung), hattermann@pik-potsdam.de Michael Roers (Übung), roers@pik-potsdam. Einführung in die Geostatistik (7) Fred Hattermann (Vorlesung), hattermann@pik-potsdam.de Michael Roers (Übung), roers@pik-potsdam.de 1 Gliederung 7 Weitere Krigingverfahren 7.1 Simple-Kriging 7.2 Indikator-Kriging

Mehr

Tutorial: Homogenitätstest

Tutorial: Homogenitätstest Tutorial: Homogenitätstest Eine Bank möchte die Kreditwürdigkeit potenzieller Kreditnehmer abschätzen. Einerseits lebt die Bank ja von der Vergabe von Krediten, andererseits verursachen Problemkredite

Mehr

Auswertung von kritischen Daten Vorgehensweise anhand eines Beispiels Visual-XSel 10.0

Auswertung von kritischen Daten Vorgehensweise anhand eines Beispiels Visual-XSel 10.0 Auswertung von kritischen Daten Vorgehensweise anhand eines Beispiels Visual-XSel 10.0??? Curt Ronniger 2007 Bei Neueinstieg in das Programm, sollte zunächst die Dokumentation XSelDoE10.pdf gelesen werden.

Mehr

Bachelorabschlussseminar Dipl.-Kfm. Daniel Cracau

Bachelorabschlussseminar Dipl.-Kfm. Daniel Cracau 1 Einführung in die statistische Datenanalyse Bachelorabschlussseminar Dipl.-Kfm. Daniel Cracau 2 Gliederung 1.Grundlagen 2.Nicht-parametrische Tests a. Mann-Whitney-Wilcoxon-U Test b. Wilcoxon-Signed-Rank

Mehr

7.4 Analyse anhand der SQL-Trace. 7.3.5 Vorabanalyse mit dem Code Inspector

7.4 Analyse anhand der SQL-Trace. 7.3.5 Vorabanalyse mit dem Code Inspector 7.4 Analyse anhand der SQL-Trace 337 7.3.5 Vorabanalyse mit dem Code Inspector Der Code Inspector (SCI) wurde in den vorangegangenen Kapiteln immer wieder erwähnt. Er stellt ein paar nützliche Prüfungen

Mehr

Qualitätssicherung Brustkrebs auf Grundlage des Datensatzes gemäß Teil B Ziffer I. Nr. 5 DMP-RL

Qualitätssicherung Brustkrebs auf Grundlage des Datensatzes gemäß Teil B Ziffer I. Nr. 5 DMP-RL Anlage 6 Qualitätssicherung auf Grlage der Datensätze nach Teil B Ziffer I Nr. 5 der DMP-Richtlinie zur Durchführung des strukturierten Behandlungsprogramms nach 73a i.v. mit 137f SGB V Brustkrebs zwischen

Mehr

Studiendesign und Statistik: Interpretation publizierter klinischer Daten

Studiendesign und Statistik: Interpretation publizierter klinischer Daten Studiendesign und Statistik: Interpretation publizierter klinischer Daten Dr. Antje Jahn Institut für Medizinische Biometrie, Epidemiologie und Informatik Universitätsmedizin Mainz Hämatologie im Wandel,

Mehr

Biometrie und Methodik (Statistik) - WiSem08/09 Probeklausur 1

Biometrie und Methodik (Statistik) - WiSem08/09 Probeklausur 1 Biometrie und Methodik (Statistik) - WiSem08/09 Probeklausur 1 Aufgabe 1 (10 Punkte). 10 Schüler der zehnten Klasse unterziehen sich zur Vorbereitung auf die Abschlussprüfung einem Mathematiktrainingsprogramm.

Mehr

Chemotherapie und Antikörpertherapie bei Brustkrebs. Onkologische Gemeinschaftspraxis Siegburg Dr. med. Franz-Josef Heidgen

Chemotherapie und Antikörpertherapie bei Brustkrebs. Onkologische Gemeinschaftspraxis Siegburg Dr. med. Franz-Josef Heidgen Chemotherapie und Antikörpertherapie bei Brustkrebs Onkologische Gemeinschaftspraxis Siegburg Dr. med. Franz-Josef Heidgen Grundlegende Therapieverfahren Operation Chemotherapie und Antikörpertherapie

Mehr

a) Zeichnen Sie in das nebenstehende Streudiagramm mit Lineal eine Regressionsgerade ein, die Sie für passend halten.

a) Zeichnen Sie in das nebenstehende Streudiagramm mit Lineal eine Regressionsgerade ein, die Sie für passend halten. Statistik für Kommunikationswissenschaftler Wintersemester 2009/200 Vorlesung Prof. Dr. Helmut Küchenhoff Übung Cornelia Oberhauser, Monia Mahling, Juliane Manitz Thema 4 Homepage zur Veranstaltung: http://www.statistik.lmu.de/~helmut/kw09.html

Mehr

Hinweise zur. Auswertung. Markus Scholz Michael Wagner Version 1.0

Hinweise zur. Auswertung. Markus Scholz Michael Wagner Version 1.0 Hinweise zur Auswertung Markus Scholz Michael Wagner Version 1.0 Struktur der Auswertung Die Auswertung der Ergebnisse und somit der Vergleich der Einschätzungen verschiedener Personen erfolgt mittels

Mehr

Gibt es einen Geschmacksunterschied zwischen Coca Cola und Cola Zero?

Gibt es einen Geschmacksunterschied zwischen Coca Cola und Cola Zero? Gibt es einen Geschmacksunterschied zwischen Coca Cola und Cola Zero? Manche sagen: Ja, manche sagen: Nein Wie soll man das objektiv feststellen? Kann man Geschmack objektiv messen? - Geschmack ist subjektiv

Mehr

Auszug (Seite 16 bis 20)

Auszug (Seite 16 bis 20) Auszug (Seite 16 bis 20) aus der Richtlinie des Gemeinsamen Bundesauschusses zur Regelung von Anforderungen an die Ausgestaltung von Strukturierten Behandlungsprogrammen nach 137f Abs. 2 SGB V (DMP-Richtlinie/DMP-RL)

Mehr

Kapitel 7: Varianzanalyse mit Messwiederholung

Kapitel 7: Varianzanalyse mit Messwiederholung Kapitel 7: Varianzanalyse mit Messwiederholung Durchführung einer einfaktoriellen Varianzanalyse mit Messwiederholung 1 Durchführung einer zweifaktoriellen Varianzanalyse mit Messwiederholung auf einem

Mehr

Flächendeckende Darstellung der Qualität der onkologischen Versorgung durch klinische Krebsregister im Sinne des Nationalen Krebsplanes

Flächendeckende Darstellung der Qualität der onkologischen Versorgung durch klinische Krebsregister im Sinne des Nationalen Krebsplanes Flächendeckende Darstellung der Qualität der onkologischen Versorgung durch klinische Krebsregister im Sinne des Nationalen Krebsplanes Anett Tillack, Wolfgang Hartmann Tumorzentrum Land Brandenburg Gliederung

Mehr

Kapitel 4: Binäre Regression

Kapitel 4: Binäre Regression Kapitel 4: Binäre Regression Steffen Unkel (basierend auf Folien von Nora Fenske) Statistik III für Nebenfachstudierende WS 2013/2014 4.1 Motivation Ausgangssituation Gegeben sind Daten (y i, x i1,...,

Mehr

Data Mining-Modelle und -Algorithmen

Data Mining-Modelle und -Algorithmen Data Mining-Modelle und -Algorithmen Data Mining-Modelle und -Algorithmen Data Mining ist ein Prozess, bei dem mehrere Komponenten i n- teragieren. Sie greifen auf Datenquellen, um diese zum Training,

Mehr

Koeffizienten der Logitanalyse. Kurt Holm. Almo Statistik-System www.almo-statistik.de holm@almo-statistik.de kurt.holm@jku.at

Koeffizienten der Logitanalyse. Kurt Holm. Almo Statistik-System www.almo-statistik.de holm@almo-statistik.de kurt.holm@jku.at Koeffizienten der Logitanalyse Kurt Holm Almo Statistik-System www.almo-statistik.de holm@almo-statistik.de kurt.holm@jku.at 1 Kurt Holm Koeffizienten der Logitanalyse Eine häufig gestellte Frage lautet:

Mehr

Jahresabschluss- rechnung und Rückstände

Jahresabschluss- rechnung und Rückstände ACS Data Systems AG Jahresabschluss- rechnung und Rückstände (Version 10.08.2009) Buchhaltung für Schulen ACS Data Systems AG Bozen / Brixen / Trient Tel +39 0472 27 27 27 obu@acs.it 2 Inhaltsverzeichnis

Mehr

8. Konfidenzintervalle und Hypothesentests

8. Konfidenzintervalle und Hypothesentests 8. Konfidenzintervalle und Hypothesentests Dr. Antje Kiesel Institut für Angewandte Mathematik WS 2011/2012 Beispiel. Sie wollen den durchschnittlichen Fruchtsaftgehalt eines bestimmten Orangennektars

Mehr

Grundlagen der Inferenzstatistik: Was Ihnen nicht erspart bleibt!

Grundlagen der Inferenzstatistik: Was Ihnen nicht erspart bleibt! Grundlagen der Inferenzstatistik: Was Ihnen nicht erspart bleibt! 1 Einführung 2 Wahrscheinlichkeiten kurz gefasst 3 Zufallsvariablen und Verteilungen 4 Theoretische Verteilungen (Wahrscheinlichkeitsfunktion)

Mehr

Einfache statistische Auswertungen mit dem Programm SPSS

Einfache statistische Auswertungen mit dem Programm SPSS Einfache statistische Auswertungen mit dem Programm SPSS Datensatz: fiktive_daten.sav Dipl. Päd. Anne Haßelkus Dr. Dorothea Dette-Hagenmeyer 11/2011 Überblick 1 Deskriptive Statistiken; Mittelwert berechnen...

Mehr

Evaluation der Normalverteilungsannahme

Evaluation der Normalverteilungsannahme Evaluation der Normalverteilungsannahme. Überprüfung der Normalverteilungsannahme im SPSS P. Wilhelm; HS SPSS bietet verschiedene Möglichkeiten, um Verteilungsannahmen zu überprüfen. Angefordert werden

Mehr

Häufigkeitstabellen. Balken- oder Kreisdiagramme. kritischer Wert für χ2-test. Kontingenztafeln

Häufigkeitstabellen. Balken- oder Kreisdiagramme. kritischer Wert für χ2-test. Kontingenztafeln Häufigkeitstabellen Menüpunkt Data PivotTable Report (bzw. entsprechendes Icon): wähle Data Range (Zellen, die die Daten enthalten + Zelle mit Variablenname) wähle kategoriale Variable für Spalten- oder

Mehr

Übungsserie Nr. 10 mit Lösungen

Übungsserie Nr. 10 mit Lösungen Übungsserie Nr. 10 mit Lösungen 1 Ein Untersuchungsdesign sieht einen multivariaten Vergleich einer Stichprobe von Frauen mit einer Stichprobe von Männern hinsichtlich der Merkmale X1, X2 und X3 vor (Codierung:

Mehr

Leben mit Brustkrebs Was gibt es Neues? Was kann ich tun? Über- und Untertherapie vermeiden- Was leisten die sogenannten Gentests?

Leben mit Brustkrebs Was gibt es Neues? Was kann ich tun? Über- und Untertherapie vermeiden- Was leisten die sogenannten Gentests? Campus Innenstadt Campus Großhadern Klinik und Poliklinik für Frauenheilkunde und Geburtshilfe Leben mit Brustkrebs Was gibt es Neues? Was kann ich tun? Über- und Untertherapie vermeiden- Was leisten die

Mehr

Phase-II-Paket. R-Paket und Software-Tool für Planung, Monitoring und Auswertung onkologischer Phase-II-Studien

Phase-II-Paket. R-Paket und Software-Tool für Planung, Monitoring und Auswertung onkologischer Phase-II-Studien Phase-II-Paket R-Paket und Software-Tool für Planung, Monitoring und Auswertung onkologischer Phase-II-Studien Impressum TMF Technologie- und Methodenplattform für die vernetzte medizinische Forschung

Mehr

Analytische Statistik I. Statistische Methoden in der Korpuslinguistik Heike Zinsmeister WS 2009/10

Analytische Statistik I. Statistische Methoden in der Korpuslinguistik Heike Zinsmeister WS 2009/10 Analytische Statistik I Statistische Methoden in der Korpuslinguistik Heike Zinsmeister WS 2009/10 Testen Anpassungstests (goodness of fit) Weicht eine gegebene Verteilung signifikant von einer bekannten

Mehr

Stochastische Eingangsprüfung, 17.05.2008

Stochastische Eingangsprüfung, 17.05.2008 Stochastische Eingangsprüfung, 17.5.8 Wir gehen stets von einem Wahrscheinlichkeitsraum (Ω, A, P) aus. Aufgabe 1 ( Punkte) Sei X : Ω [, ) eine integrierbare Zufallsvariable mit XdP = 1. Sei Q : A R, Q(A)

Mehr

Multinomiale logistische Regression

Multinomiale logistische Regression Multinomiale logistische Regression Die multinomiale logistische Regression dient zur Schätzung von Gruppenzugehörigkeiten bzw. einer entsprechenden Wahrscheinlichkeit hierfür, wobei als abhänginge Variable

Mehr

riskkv Scorenalyse riskkv Scoring Seite 1 von 9

riskkv Scorenalyse riskkv Scoring Seite 1 von 9 riskkv Scorenalyse riskkv Scoring Seite 1 von 9 Das Modul dient der flexiblen Erstellung, Auswertung und Verwendung von Scores. Durch vordefinierte Templates können in einer Einklicklösung bspw. versichertenbezogene

Mehr

Non-Deterministische CFD Simulationen in FINE /Turbo

Non-Deterministische CFD Simulationen in FINE /Turbo Non-Deterministische CFD Simulationen in FINE /Turbo Dipl.-Ing. (FH) Peter Thiel Dr.-Ing. Thomas Hildebrandt NUMECA Ingenieurbüro NUMECA, a New Wave in Fluid Dynamics Überblick 1. Motivation: Warum non-deterministische

Mehr

Maßnahmen zur Verbesserung der Datenqualität

Maßnahmen zur Verbesserung der Datenqualität Maßnahmen zur Verbesserung der Datenqualität in der Klinischen Landesregisterstelle des Krebsregisters Baden-Württemberg 11. DVMD Fachtagung, 17.02.2011 Regina Schönthaler, Klinische Landesregisterstelle

Mehr

Aufgabenstellung Aufgabe 1: Betrachten Sie das folgende ökonometrische Modell: y t = α + βx t + u t (1)

Aufgabenstellung Aufgabe 1: Betrachten Sie das folgende ökonometrische Modell: y t = α + βx t + u t (1) Klausur: Einführung in die Ökonometrie Prüfer: Prof. Dr. Karl-Heinz Paqué Dr.Ludwigv.Auer Semester: WS 1999/00 Als Hilfsmittel sind zugelassen: nicht-programmierbarer Taschenrechner Diese Klausur besteht

Mehr

Univariates Chi-Quadrat-Verfahren für ein dichotomes Merkmal und eine Messwiederholung: Test nach McNemar

Univariates Chi-Quadrat-Verfahren für ein dichotomes Merkmal und eine Messwiederholung: Test nach McNemar Univariates Chi-Quadrat-Verfahren für ein dichotomes Merkmal und eine Messwiederholung: Test nach McNemar Inhaltsverzeichnis Univariates Chi-Quadrat-Verfahren für ein dichotomes Merkmal und eine Messwiederholung:

Mehr

Inhaltsverzeichnis. I Einführung in STATISTICA 1. 1 Erste Schritte in STATISTICA 3

Inhaltsverzeichnis. I Einführung in STATISTICA 1. 1 Erste Schritte in STATISTICA 3 I Einführung in STATISTICA 1 1 Erste Schritte in STATISTICA 3 2 Datenhaltung in STATISTICA 11 2.1 Die unterschiedlichen Dateitypen in STATISTICA....... 11 2.2 Import von Daten......... 12 2.3 Export von

Mehr

Auswerten mit Excel. Viele Video-Tutorials auf Youtube z.b. http://www.youtube.com/watch?v=vuuky6xxjro

Auswerten mit Excel. Viele Video-Tutorials auf Youtube z.b. http://www.youtube.com/watch?v=vuuky6xxjro Auswerten mit Excel Viele Video-Tutorials auf Youtube z.b. http://www.youtube.com/watch?v=vuuky6xxjro 1. Pivot-Tabellen erstellen: In der Datenmaske in eine beliebige Zelle klicken Registerkarte Einfügen

Mehr

Datenanalyse mit Excel. Wintersemester 2013/14

Datenanalyse mit Excel. Wintersemester 2013/14 Datenanalyse mit Excel 1 KORRELATIONRECHNUNG 2 Korrelationsrechnung Ziel der Korrelationsrechnung besteht im bivariaten Fall darin, die Stärke des Zusammenhangs zwischen zwei interessierenden statistischen

Mehr

Probeklausur Zeitreihenökonometrie (Sommersemester 2014) 1

Probeklausur Zeitreihenökonometrie (Sommersemester 2014) 1 Probeklausur Zeitreihenökonometrie (Sommersemester 2014) 1 Aufgabe 1: Betrachtet wird folgendes Modell zur Erklärung des Managergehalts salary durch den Umsatz sales, die Eigenkapitalrendite roe und die

Mehr

Lösungen zu Janssen/Laatz, Statistische Datenanalyse mit SPSS 1

Lösungen zu Janssen/Laatz, Statistische Datenanalyse mit SPSS 1 LÖSUNG 3A Lösungen zu Janssen/Laatz, Statistische Datenanalyse mit SPSS 1 Mit den Berechnungsfunktionen LG10(?) und SQRT(?) in "Transformieren", "Berechnen" können logarithmierte Werte sowie die Quadratwurzel

Mehr

Allgemeines Lineares Modell: Univariate Varianzanalyse und Kovarianzanalyse

Allgemeines Lineares Modell: Univariate Varianzanalyse und Kovarianzanalyse Allgemeines Lineares Modell: Univariate Varianzanalyse und Kovarianzanalyse Univariate Varianz- und Kovarianzanlyse, Multivariate Varianzanalyse und Varianzanalyse mit Messwiederholung finden sich unter

Mehr

Grundlagen der Inferenzstatistik

Grundlagen der Inferenzstatistik Grundlagen der Inferenzstatistik (Induktive Statistik oder schließende Statistik) Dr. Winfried Zinn 1 Deskriptive Statistik versus Inferenzstatistik Die Deskriptive Statistik stellt Kenngrößen zur Verfügung,

Mehr

Alle WGKT-Empfehlungen können unter www.wgkt.de eingesehen und heruntergeladen werden.

Alle WGKT-Empfehlungen können unter www.wgkt.de eingesehen und heruntergeladen werden. WGKT-Empfehlung Betriebswirtschaftliche Kennzahlen von Krankenhäusern Stand: 05.11.2009 Arbeitskreismitglieder: Prof. Dr. K. Lennerts (Leitung), Karlsruhe; Prof. Dr. C. Hartung, Hannover; Dr. T. Förstemann,

Mehr

Einführung in die Logistische Regression. Fortbildung zur 19.Informationstagung Tumordokumentation

Einführung in die Logistische Regression. Fortbildung zur 19.Informationstagung Tumordokumentation Einführung in die Logistische Regression Fortbildung zur 9.Informationstagung Tumordokumentation Bernd Schicke, Tumorzentrum Berlin FB Bayreuth, 29.März 20 Gliederung Einleitung Schätzen von Maßzahlen

Mehr

Eigenen Feedbackbogen erstellen

Eigenen Feedbackbogen erstellen Wegleitung für Lehrpersonen Eigenen Feedbackbogen erstellen 1. Vorgehensweise klären 2. Bestehenden Fragebogen ergänzen 3. Fragebogen neu erstellen 4. Bestehenden Fragebogen ändern 5. Statistische Datenerhebung

Mehr

Nichtlineare Optimierung ohne Nebenbedingungen

Nichtlineare Optimierung ohne Nebenbedingungen Kapitel 2 Nichtlineare Optimierung ohne Nebenbedingungen In diesem Abschnitt sollen im wesentlichen Verfahren zur Bestimmung des Minimums von nichtglatten Funktionen in einer Variablen im Detail vorgestellt

Mehr

Checks und Aufgabensammlung im Bildungsraum Nordwestschweiz

Checks und Aufgabensammlung im Bildungsraum Nordwestschweiz Checks und Aufgabensammlung im Bildungsraum Nordwestschweiz Checks 22. August 2014 Institut für Bildungsevaluation Assoziiertes Institut der Institut Universität für Bildungsevaluation Zürich Assoziiertes

Mehr

Einfluss von prognoserelevanten Faktoren auf die Lokalrezidivrate im Vergleich zur Fernmetastasierung beim Mammakarzinom

Einfluss von prognoserelevanten Faktoren auf die Lokalrezidivrate im Vergleich zur Fernmetastasierung beim Mammakarzinom Einfluss von prognoserelevanten Faktoren auf die Lokalrezidivrate im Vergleich zur Fernmetastasierung beim Mammakarzinom Dissertation zur Erlangung des akademischen Grades Dr. med. an der Medizinischen

Mehr

Schleswig-Holsteinische Ergänzung der Musteraufgaben für den hilfsmittelfreien Teil der schriftlichen Abiturprüfung im Fach Mathematik ab 2015

Schleswig-Holsteinische Ergänzung der Musteraufgaben für den hilfsmittelfreien Teil der schriftlichen Abiturprüfung im Fach Mathematik ab 2015 ische Ergänzung der für den hilfsmittelfreien Teil der schriftlichen Abiturprüfung im Fach Mathematik ab 2015 Ministerium für ildung und Wissenschaft des Landes Juni 2013 1 für Aufgabenpool 1 Analysis

Mehr

Data Mining: Einige Grundlagen aus der Stochastik

Data Mining: Einige Grundlagen aus der Stochastik Data Mining: Einige Grundlagen aus der Stochastik Hagen Knaf Studiengang Angewandte Mathematik Hochschule RheinMain 21. Oktober 2015 Vorwort Das vorliegende Skript enthält eine Zusammenfassung verschiedener

Mehr

Ein möglicher Unterrichtsgang

Ein möglicher Unterrichtsgang Ein möglicher Unterrichtsgang. Wiederholung: Bernoulli Experiment und Binomialverteilung Da der sichere Umgang mit der Binomialverteilung, auch der Umgang mit dem GTR und den Diagrammen, eine notwendige

Mehr

Vorlesung - Medizinische Biometrie

Vorlesung - Medizinische Biometrie Vorlesung - Medizinische Biometrie Stefan Wagenpfeil Institut für Medizinische Biometrie, Epidemiologie und Medizinische Informatik Universität des Saarlandes, Homburg / Saar Vorlesung - Medizinische Biometrie

Mehr

Interne und externe Modellvalidität

Interne und externe Modellvalidität Interne und externe Modellvalidität Interne Modellvalidität ist gegeben, o wenn statistische Inferenz bzgl. der untersuchten Grundgesamtheit zulässig ist o KQ-Schätzer der Modellparameter u. Varianzschätzer

Mehr

Standardisierung von Daten Darstellung von Daten in Texten, Tabellen und Abbildungen. Standardisierung von Daten

Standardisierung von Daten Darstellung von Daten in Texten, Tabellen und Abbildungen. Standardisierung von Daten DAS THEMA: TABELLEN UND ABBILDUNGEN Standardisierung von Daten Darstellung von Daten in Texten, Tabellen und Abbildungen Standardisierung von Daten z-standardisierung Standardnormalverteilung 1 DIE Z-STANDARDISIERUNG

Mehr

Leitfaden. Brusttumore. Univ Prof Dr Florian Fitzal. Welche Unterlagen benötige ich bei der Erstvorstellung

Leitfaden. Brusttumore. Univ Prof Dr Florian Fitzal. Welche Unterlagen benötige ich bei der Erstvorstellung 1von5 Leitfaden Brusttumore von Univ Prof Dr Florian Fitzal Welche Unterlagen benötige ich bei der Erstvorstellung Mammographie und Ultraschall (Befund in Kopie und Bilder, sowohl die neue als auch die

Mehr

Studiendesign/ Evaluierungsdesign

Studiendesign/ Evaluierungsdesign Jennifer Ziegert Studiendesign/ Evaluierungsdesign Praxisprojekt: Nutzerorientierte Evaluierung von Visualisierungen in Daffodil mittels Eyetracker Warum Studien /Evaluierungsdesign Das Design einer Untersuchung

Mehr

Willkommen zur Vorlesung Statistik (Master)

Willkommen zur Vorlesung Statistik (Master) Willkommen zur Vorlesung Statistik (Master) Thema dieser Vorlesung: Verteilungsfreie Verfahren Prof. Dr. Wolfgang Ludwig-Mayerhofer Universität Siegen Philosophische Fakultät, Seminar für Sozialwissenschaften

Mehr

Motivation. Themenblock: Klassifikation. Binäre Entscheidungsbäume. Ansätze. Praktikum: Data Warehousing und Data Mining.

Motivation. Themenblock: Klassifikation. Binäre Entscheidungsbäume. Ansätze. Praktikum: Data Warehousing und Data Mining. Motivation Themenblock: Klassifikation Praktikum: Data Warehousing und Data Mining Ziel Item hat mehrere Attribute Anhand von n Attributen wird (n+)-tes vorhergesagt. Zusätzliches Attribut erst später

Mehr

Statistische Thermodynamik I Lösungen zur Serie 1

Statistische Thermodynamik I Lösungen zur Serie 1 Statistische Thermodynamik I Lösungen zur Serie Zufallsvariablen, Wahrscheinlichkeitsverteilungen 4. März 2. Zwei Lektoren lesen ein Buch. Lektor A findet 2 Druckfehler, Lektor B nur 5. Von den gefundenen

Mehr

Überlebenszeitanalyse Teil 15 der Serie zur Bewertung wissenschaftlicher Publikationen

Überlebenszeitanalyse Teil 15 der Serie zur Bewertung wissenschaftlicher Publikationen ÜBERSICHTSARBEIT Überlebenszeitanalyse Teil 5 der Serie zur Bewertung wissenschaftlicher Publikationen Isabella Zwiener, Maria Blettner, Gerhard Hommel ZUSAMMENFASSUNG Hintergrund: Zum Vergleich von zwei

Mehr

Survival-Analyse mit zeitabhängigen Variablen

Survival-Analyse mit zeitabhängigen Variablen Klinische/Epidemiologische Anwendungen II Survival-Analyse mit zeitabhängigen Variablen Anja Schoeps Universität Heidelberg Institut für Public Health Im Neuenheimer Feld 324 69120 Heidelberg Schoeps@uni-heidelberg.de

Mehr

Analyse alt- und mittelpaläolithischer Steinartefaktinventare mittels Parallelkoordinatenplots

Analyse alt- und mittelpaläolithischer Steinartefaktinventare mittels Parallelkoordinatenplots Einleitung Analyse alt- und mittelpaläolithischer Steinartefaktinventare mittels Parallelkoordinatenplots von Irmela Herzog Im Rahmen der Herbsttagung der AG DANK (Datenanalyse und Numerische Klassifikation)

Mehr

Krebs - was kann ich tun?

Krebs - was kann ich tun? Krebs - was kann ich tun? von Dr. Ursula Vehling-Kaiser 1. Auflage Krebs - was kann ich tun? Vehling-Kaiser schnell und portofrei erhältlich bei beck-shop.de DIE FACHBUCHHANDLUNG W. Zuckschwerdt 2010 Verlag

Mehr

Dokumentation RabattManagerLX Pro. Version 1.0.901.1

Dokumentation RabattManagerLX Pro. Version 1.0.901.1 Dokumentation RabattManagerLX Pro Version 1.0.901.1 Dokumentation RabattManagerLX Pro Version 1.0.901.1 Was ist RabattManagerLX Pro? RabattManagerLX Pro ist ein Programm um individuelle Warengruppen-Rabatte

Mehr