Interaktive internetbasierte Auswertung der Krebsregister am OSP Stuttgart mittels der Software OCDM Online Clinical Data Mining Version 2.

Größe: px
Ab Seite anzeigen:

Download "Interaktive internetbasierte Auswertung der Krebsregister am OSP Stuttgart mittels der Software OCDM Online Clinical Data Mining Version 2."

Transkript

1 Interaktive internetbasierte Auswertung der Krebsregister am OSP Stuttgart mittels der Software OCDM Online Clinical Data Mining Version 2.5 Handbuch 4. August 2009 c Random Research, c/o Institut für Stochastik und Anwendungen, Fachbereich Mathematik, Universität Stuttgart, Pfaffenwaldring 57, Stuttgart Kontakt: Jürgen Dippon, phone 0711/ , fax 0711/ , mobile

2 Inhaltsverzeichnis 1 Interaktive internetbasierte Auswertung von klinischen Krebsregistern 3 2 Startseite 4 3 Methoden Subgruppenanalyse Auswahl ähnlicher Fälle Cox-Regression Ergebnisse Profilbeschreibung Diagramme Kaplan-Meier Hazard-Rate Jahre Alter Histologie pt Tumorgröße pn Anzahl der befallenen Lymphknoten pm Metastasierung Klassifikation ER Östrogenrezeptorstatus PR Progesteronrezeptorstatus Todesursache Adjuvant Klinik Menopausenstatus Brusterhaltende Therapie Überleben Daten Cox A Glossar zu einigen statistischen Begriffen 17 Literatur 19 2

3 1 Interaktive internetbasierte Auswertung von klinischen Krebsregistern Die Software OCDM (Online Clinical Data Mining) dient zur statistischen Auswertung von klinischen Krebsregistern. Hierzu gehören deskriptive, grafische, exploratorive und konfirmatorische statistische Methoden. Die Auswertung erfolgt interaktiv und internetbasiert über einen Browser. Es muss keine zusätzliche Software installiert werden. Alle Anfragen und Berechnungen erfolgen auf einem Server. Der Zugang zu diesem Server ist passwortgeschützt und läuft in geschützter Weise über eine VPN-Verbindung. Eine besondere Stärke der Software liegt in der Möglichkeit des explorativen Vorgehens. Hierbei werden von dem Ergebnis einer vorangegangenen statistischen Analyse weitere Hypothesen abgeleitet und in einem Dialog untersucht. Als Beispiele für Fragestellungen, die mit OCDM behandelt werden können, seien die folgenden genannt: Konnte meine Klinik die Ergebnisqualität bei nichtmetastasiereten Patientinnen in den letzten fünf Jahren steigern? Wenn ja, bei welchen Subgruppen von Patienten? Ist die relative Anzahl der brusterhaltenden Operationen an den einzelnen Kliniken in Stuttgart unterschiedlich? Falls ja, könnte dies eventuell mit der Altersverteilung der Patientinnen an den jeweiligen Kliniken zusammenhängen? In welchen Subgruppen werden brusterhaltende Operationen vorwiegend durchgeführt? Hat die Wahl dieser Methode einen Einfluss auf die Restlebenszeit? Gibt es Unterschiede in der Ergebnisqualität im Vergleich der einzelnen Kliniken? Woran könnte dies gegebenenfalls liegen? Hat der histologische Befund bei Brustkrebs einen Einfluss auf den klinischen Verlauf der Erkrankung? Wie ist der zu erwartende klinische Verlauf einer Patientin mit Brustkrebs im Alter von 45 Jahren, Östrogenrezeptorstatus negativ, Progesteronrezeptorstatus positiv, keinen befallenen Lymphknoten, Tumorgröße < 2cm und weiteren klinischen Parametern? Kann man zu einem neuen Fall die zehn ähnlichsten Fälle aus der Datenbank extrahieren? Wie war deren klinischer Verlauf? Welche Therapie wurde bei diesen Patienten gewählt? 3

4 Kann man die Unterschiede im klinischen Verlauf zweier Subgruppen unter Verwendung des Hazard Ratios quantifizieren, ferner hierfür einen p-wert und ein Konfidenzintervall angeben? Wie kann ich die Daten einer bestimmten Subgruppe zu einer weiteren statistischen und grafischen Verarbeitung an meinem Arbeitsplatz aus der Datenbank extrahieren? Warnung: Die Interpretation der Ergebnisse verlangt in der Regel statistischen Sachverstand, um mögliche Verzerrungen zu erkennen oder Fehlschlüsse zu vermeiden. 2 Startseite Zur Zeit können die Daten von Patienten mit einer der fünf folgenden Krebserkrankungen untersucht werden (siehe Abbildung 1): Brustkrebs Bronchialkrebs Kolonkarzinom Rektumkarzinom Prostatakrebs 3 Methoden Nach Wahl einer Krebsentität stehen drei verschiedene Analysemethoden zur Verfügung: Subgruppenanlyse Auswahl ähnlicher Fälle Cox-Regression 3.1 Subgruppenanalyse Bei einer Subgruppenanalyse kann eine Subgruppe untersucht oder mehrere Subgruppen miteinander verglichen werden. Die Anzahl der zu untersuchenden Subgruppen kann unter Anzahl der Profile gewählt werden (siehe Abb. 2. Soll einem Patienten eine gewisse Subgruppe zugeordnet werden, so können dessen Daten zur leichteren späteren Zuordnung 4

5 Abbildung 1: Startseite eingegeben werden. Hierzu ist unter Dokumentation die Alternative ja zu wählen. Standardmäßig werden die Daten zu den zehn ersten Patienten eines jeden Profils ausgegeben. Es können aber auch andere Anzahlen gewählt werden. Für die Überlebenszeitanalyse ist noch von Bedeutung, welche Ereignisse als Tod und welche als zensiert zu interpretieren sind. Hierbei hat man die drei Wahlmöglichkeiten jede Todesursache, unbekannt oder Krebs, nur Krebs. Es ist allerdings zu beachten, dass bei vielen Patienten die genaue Todesursache nicht bekannt ist. Deshalb wird man hier meist jede Todesursache als Ereignis ansehen. Die Definition von Profilen kann verwendet werden, um die Verlaufsdaten und Struktur von Patientengruppen mehrerer Krankenhäuser miteinander zu vergleichen. Ebenso können auch verschiedene Subgruppen von Patienten miteinander verglichen werden. Z.B. können bei Brustkrebs die Verlaufsdaten von prä-, peri- und postmenopauselen Frauen miteinander verglichen werden. Bei der Krebsart Brustkrebs kann der Zeitraum der Erstdiagnose, das Alter bei Erstdiagnose, der histologische Typ des Tumors, die Größe des Tumors, die Anzahl der befallenen Lymphknoten, das Vorliegen von Fernmetastasen, die Klassifikation des Tumors (Grading), der Menopausenstatus, der Östrogenrezeptorstatus, der Progesteronrezeporstatus und die Art der OP-Methode (brusterhaltende Therapie) gewählt werden. Wurde oben die Eingabemöglichkeit für eine Dokumentation gewählt, so erscheinen anschließend noch drei Felder für einen Freitexteintrag (Name des Patienten, Geburtsdatum, Therapie). Wird im Feld Alter für Erstdiagnose ein Intervall angegeben, so wird zu dem Alter, 5

6 welches der Intervallmitte entspricht, die Sterbekurve der Gesamtbevölkerung berechnet und im Kaplan-Meier-Chart jedem Profil entsprechend ausgegeben. Als Beispiel vergleichen wir die Überlebenszeiten und klinischen Faktoren von östrogenrezeptorpositiven und -negativen Frauen bei Brustkrebs. Hierbei schließen wir all diejenigen Fälle aus, die bei der Erstdiagnose bereits Metastasen aufwiesen. Das Formular zur Erstellung dieser beiden Profile ist in Abbildung 2, die beiden dazugehörigen Überlebenszeitkurven sind in Abbildung 3 zu finden. 3.2 Auswahl ähnlicher Fälle Anstelle der Definition von Subgruppen werden hier die zu einem gegebenen Profil k ähnlichsten Fälle aus der Datenbank ausgewählt. Hierbei wird das Ähnlichkeitsmaß auf dem von den Faktoren (Einflussgrößen) aufgespannten Raum vermittels deren Einfluss (Hazard Ratio) auf die Überlebenszeit konstruiert. Die zu betrachtenden Faktoren können hierbei vom Benutzer ausgewählt werden. Es ist sogar möglich, alle Faktoren auszuwählen. Werden bei einer Subgruppenanalyse zuviele Faktoren ausgewählt, kann dies zur Folge haben, dass nur sehr wenige oder gar keine Fälle mit dem dadurch vorgegebenen Profil übereinstimmen. Dieses Phänomen ist unter dem Namen Fluch der hohen Dimension bekannt. Im Gegensatz dazu werden bei der Methode der Suche nach den k ähnlichsten Fällen immer genau k Fälle ausgewählt. Weitere Details hierzu findet man in [2, 3]. Die hier vorgestellte Methode dient dazu, zu einem gegebenen vorliegenden neuen Fall die hinsichtlich der Überlebenszeit ähnlichsten Fälle zu suchen, um deren bekannte Überlebenszeit zu verwenden, die Überlebenszeitfunktion des vorliegenden neuen Falles zu schätzen. Zusätzlich könnte das Studium der Verläufe und Therapien der ähnlichsten Fälle Hinweise auf den Verlauf und die Wahl der Therapie für den neuen vorliegenden Fall liefern (Case based reasoning). 3.3 Cox-Regression Um den Einfluss von Faktoren auf die Überlebenszeit genauer abschätzen zu können, gibt es auch die Möglichkeit, eine Cox-Regression durchzuführen. Hierbei werden in der ersten Spalte zunächst diejenigen Faktoren ausgewählt, die in das Modell aufgenommen werden sollen. Rechts davon können verschiedene Profile definiert werden, deren Vereinigung diejenige Teilmenge von Fällen definiert, für die das Cox-Modell berechnet werden soll. Zum Beispiel könnte es von Interesse sein, nur prämenopausale oder metastasierte Patienten oder Fälle mit Klassifikation (Grading) 1 oder 2 zu betrachten. Als Beispiel untersuchen wir die Frage, welchen Einfluss der Östrogenrezeptorstatus und die Wahl einer brusterhaltenden Therapie auf Verteilung der Überlebenszeit besitzt, 6

7 Abbildung 2: Durch die Wahl Anzahl der Profile gleich 2 erscheint ein Formular mit zwei Profilen. Werden dann anschließende beim Faktor Östrogenrezeptorstatus die Alternativen Positiv und Negativ gewählt und bei Fernmetastasen bei Erstdiagnose der Eintrag nein, so können diese beiden Subgruppen miteinander verglichen werden. Weitere Einschränkungen sind möglich, z.b. hinsichtlich des Alters oder der Klinik. Diese weiteren Einschränkungen werden bei den meisten Fragestellungen in beiden Profilen jedoch übereinstimmen, um eine sinnvolle Interpretation der Ergebnisse zu ermöglichen. Bei der Wahl eines Altersintervalles wird im Kaplan-Meier-Chart noch die Überlebenszeitkurve einer weiblichen Person aus der deutschen Normalbevölkerung angegeben, deren Alter dem Intervallmittelpunkt entspricht (Daten vom Statistischen Bundesamt). und zwar in der in der Gruppe derjenigen Patientinnen, die zwischen 20 und 40 Jahre alt sind und T1-Tumore aufwiesen. Die Anfrage kann wie in Abbildung 4 durchgeführt werden. Das Ergebnis ist in Abbildung 8 zu finden. Die Ausgabe erfolgt in Tabellenform unter der Karteikarte Cox. Hierbei werden die zu den einzelnen Faktoren gehörigen Schätzung für die log-hazards-ratios, Hazard-Ratios, Standardfehler, z-werte, p-werte, untere und obere 95%-Konfidenzintervallgrenzen für die 7

8 Abbildung 3: Über eine Seite dieses Typs können die Ergebnisse abgerufen werden. Zu sehen ist die Definition der Profile und die Überlebenszeitkurven samt in heller Farbe dargestellte Konfidenzbereiche. Beim Vergleich der Überlebenszeitkurven mittels Log-Rang-Test ergibt sich der im Titel der Grafik angegebene p-wert. Im gewählten Beispiel sind die beiden Überlebenszeitkurven hoch signifikant verschieden. Der Überlebenszeitvorteil östrogenrezeptorpositiver Frauen (rot) kehrt sich nach etwa 12 Jahren um. Eine mögliche Ursache könnte darin liegen, dass Frauen mit positivem Östrogenrezeptorstatus im Durchschnitt etwas älter sind als Frauen mit negativem Östrogenrezeptorstatus. Dies kann durch Vergleich der Altersverteilungen bestätigt werden (siehe Abb. 6). Ob dadurch die beschriebene Beobachtung vollständig erklärt werden kann, sei hier dahingestellt. Eine Überprüfung dieser Vermutung mittels einer Cox-Regression mit den Faktoren Östrogenrezptorstatus und Alter, basierend auf der Subgruppe der Frauen, die bei Erstdiagnose noch keine Metastasen aufwiesen, ist hier jedoch nicht zulässig, da die Überlebenszeitkurven die Proportional-Hazard-Annahme offensichtlich nicht erfüllen. Eine mögliche Strategie könnte z.b. darin bestehen, altersadjustierte Überlebenszeiten zu analysieren. Hazard-Ratios und weitere mit der Likelihood-Schätzung in Verbindung stehende Kenngrößen angegeben. Als Baseline-Werte dienen für die einzelnen Faktoren immer die nicht genannten Ausprägungen. Weitere Details hierzu findet man in der einschlägigen Litera- 8

9 Abbildung 4: Formular zur Berechnung einer Cox-Regression mit den beiden Faktoren Östrogenrezeptorstatus und brusterhaltende Therapie, wobei nur diejenigen Patientinnen betrachtet werden sollen, die zwischen 20 und 40 Jahre alt sind und T1-Tumore aufweisen. tur zur Überlebenszeitanalyse, z.b. [1]. Hier finden sich auch die Voraussetzungen, unter denen eine solche Analyse zulässig ist (z.b. die Proportional-Hazards-Annahme). 4 Ergebnisse Die Daten werden gemäß der gewählten Methode in verschiedenerlei Hinsicht ausgewertet: grafisch, deskriptiv und konfirmatorisch. Die vorzufindenden Grafiken und Analysen hängen von der gewünschten Methode und der zu untersuchenden Krebsentität ab. Die nachfolgende Beschreibung konzentriert sich auf die für Brustkrebs verfügbaren Faktoren. 4.1 Profilbeschreibung Hier werden die gewählten Profile in übersichtlicher Form auf der Ergebnisseite wiederholt. Ein Beispiel hierzu ist in Abbildung 3 zu finden. 9

10 4.2 Diagramme Neben der grafischen Darstellung der jeweiligen Zielgröße für jedes Profil werden meist noch statistische Tests auf Homogenität durchgeführt. Bei Überlebenszeiten ist dies der Log-Rang-Test, bei Zähldaten der χ 2 -Test. Die dazugehörigen p-werte erscheint in der jeweiligen Titelzeile. Die χ 2 -Tests können dazu dienen, mögliche Ursachen im unterschiedlichen Überleben der einzelnen Profile zu identifizieren. Es ist zu beachten, dass bei zu kleinen Zellenzahlen in den Kontingenztafeln in dieser Version noch keine Warnung ausgegeben wird. Ist der Wert eines Faktors zu einem Patienten unbekannt, so erhält der Faktor die Ausprägung NA (not available). Deshalb taucht in den Häufigkeitsgrafiken die Ausprägung NA auf Kaplan-Meier Zu jedem Profil wird eine Überlebenszeitkurve generiert. Punktweise 95%-Konfidenzbereiche werden in schraffierter Form angegeben. Mittels Log-Rang-Test wird die Hypothese überprüft, ob die Profile unterschiedliche Überlebenszeitverteilungen besitzen. Der dazugehörige p-wert wird im Titel der Grafik angezeigt. Ein Beispiel hierzu ist in Abbildung 3 zu finden Hazard-Rate Die zu den Hazard-Raten gehörigen Kurven bieten oft eine genauere Art der Analyse als die Überlebenszeitverteilungen. Da in dieser Version noch keine Konfidenzbereiche angezeigt werden, sind die Kurven im rechten Bereich (große Überlebenszeiten) mit Vorsicht zu interpretieren, siehe Abb Jahre Diese Kurven geben die absolute oder relative Anzahl der Fälle mit Erstdiagnose in den genannten Jahren zu den einzelnen Profilen an Alter Diese Kurven geben die absolute oder relative Anzahl der Fälle mit Erstdiagnose in den genannten Lebensjahren zu den einzelnen Profilen an. In Abbildung 6 werden die Altersverteilungen östrogenrezeptorpositiven und -negativen Patientinnen verglichen. 10

11 Abbildung 5: Vergleich der Hazardraten von Brustkrebspatientinnen mit positivem bzw. negativen Östrogenrezeptorstatus in der Subgruppe der Frauen ohne Frühmetastasierung. Die Hazardraten werden in Abhängigkeit der Zeit nach Erstdiagnose der Erkrankung angegeben. Es ist zu erkennen, dass die momentane Gefahr innerhalb der ersten fünf Jahre zu versterben bei einer östrogenrezeptorpositiven Frau kleiner ist als bei einer östrogenrezeptornegativen Frau, danach ist es umgekehrt. Der dargestellte Verlauf der Hazardkurven ab dem 15. Jahr sollte jedoch mit Vorsicht betrachtet werden, da die dazugehörigen Konfidenzbereiche vermutlich sehr breit sind. Es sei noch bemerkt, dass viele klinische Studien meist nur ein Follow-Up bis zu fünf Jahre betrachten. Ein Langzeit-Follow-Up der hier dargestellten Art ist eine besondere Stärke eines klinischen Krebsregisters. Schließlich sei noch erwähnt, dass die Fläche unter einer Hazardratenkurve bis zum Zeitpunkt t gleich dem Wert H(t) der sogenannten kumulativen Hazardfunktion ist. Diese ist mit der Wahrscheinlichkeit S(t) bis zum Zeitpunkt t zu versterben durch die Gleichung S(t) = exp( H(t)) gekoppelt Histologie Hier werden die absoluten oder relativen Häufigkeiten der Patienten mit der Ausprägungen invasiv duktal, invasiv lobulär, sonstige oder NA angegeben, siehe Abbildung 7. 11

12 Abbildung 6: Altersverteilung von Brustkrebspatientinnen mit positivem bzw. negativem Östrogenrezeptorstatus. Die Ordinate gibt die (geglättete) Anzahl der Patientinnen zu dem jeweiligen Alter an. Offensichtlich sind östrogenrezeptornegative Frauen im Mittel etwas jünger. Eine Darstellung mit relativen Häufigkeiten (Button rechts) stellt diesen Sachverhalt noch klarer dar pt Tumorgröße Hier werden die absoluten oder relativen Häufigkeiten der Patienten mit den Tumorgrößen T1, T2, T3, T4, Sonstige, NA dargestellt pn Anzahl der befallenen Lymphknoten Hier werden die absoluten oder relativen Häufigkeiten derjenigen Patienten mit Anzahl der befallenen Lymphknoten mit einer der Ausprägungen pn0, pn1, pn2, pn3, pn4, NA dargestellt pm Metastasierung Hier werden die absoluten oder relativen Häufigkeiten derjenigen Patienten dargestellt, bei denen eine oder keine Metastasierung bei Erstdiagnose festgestellt wurde. Ist darüber nichts bekannt, erfolgt die Angabe NA. 12

13 Abbildung 7: Vergleich der Histologie von östrogenrezeptorpositiven und -negativen Patientinnen. Durch Wahl des Buttons relativ werden die relativen Häufigkeiten angezeigt, was einen Vergleich Profile erleichtert. Der χ 2 -Test bestätigt, dass die Verteilungen der histologischen Typen bei östrogenrezeptorpositiven und -negativen Patientinnen signifikant unterschiedlich sind. Eine Darstellung mit relativen Häufigkeiten (Button rechts) visualisiert diesen Sachverhalt noch offensichtlicher Klassifikation Hier werden die absoluten oder relativen Häufigkeiten derjenigen Patienten dargestellt, bei denen die Klassifikation des Tumors in eine der Klassen G1, G2, G3, G4 oder NA fällt ER Östrogenrezeptorstatus Hier werden die absoluten oder relativen Häufigkeiten derjenigen Patienten dargestellt, bei denen positiver oder negativer Östrogenrezeptorstatus diagnostiziert wurde. Ist darüber nichts bekannt, erfolgt die Angabe NA. 13

14 PR Progesteronrezeptorstatus Hier werden die absoluten oder relativen Häufigkeiten derjenigen Patienten dargestellt, bei denen positiver oder negativer Progesteronrezeptorstatus diagnostiziert wurde. Ist darüber nichts bekannt, erfolgt die Angabe NA Todesursache Hier werden die absoluten oder relativen Häufigkeiten derjenigen Patienten dargestellt, die noch am Leben sind, eines nicht in Beziehung zur betrachteten Krebserkrankung stehenden Todes gestorben sind, deren Todesursache unbekannt ist, oder die an den Folgen der Krebserkrankung gestorben sind Adjuvant Hier wird angegeben, wieviele der Patienten in den betrachteten Profilen eine eine adjuvanten oder palliative Versorgung erhielten. Auch hier ist eine Darstellung in absoluten oder relativen Häufigkeiten möglich Klinik Hier werden die absoluten oder relativen Häufigkeiten der Patienten in den einzelnen Kliniken dargestellt Menopausenstatus Hier werden die absoluten oder relativen Häufigkeiten derjenigen Patienten dargestellt, die sich bei Erstdiagnose im prä-, peri- oder postmenopausalen Status befinden. Ist darüber nichts bekannt, erfolgt die Angabe NA Brusterhaltende Therapie Hier werden die absoluten oder relativen Häufigkeiten derjenigen Patienten dargestellt, bei denen eine oder keine brusterhaltende Therapie durchgeführt wurde. Ist darüber nichts bekannt, erfolgt die Angabe NA. 4.3 Überleben Diese Karteikarte liefert statistische Kennziffern zum Überleben der einzelnen Profile, welche durch Anklicken abgerufen werden können: Mediane Überlebenszeit 14

15 Untere Grenze eines 95%-Konfidenzintervalles zur n-jahresüberlebenswahrscheinlichkeit Geschätze n-jahresüberlebenswahrscheinlichkeit Obere Grenze eines 95%-Konfidenzintervalles zur n-jahresüberlebenswahrscheinlichkeit Die n-jahreswahrscheinlichkeit des Überlebens wird sofern aufgrund der Datenlage möglich zu den Jahren n = 2, 5, 10 und 20 geschätzt. 4.4 Daten Die zu den einzelnen Profilen passenden Daten können unter dieser Karteikarte eingesehen werden. Außer dem Alter werden keine weiteren biografischen Angaben gezeigt. Die maximale Anzahl der hier dargestellten Fälle kann auf der Seite, auf welcher die Profile definiert werden, eingestellt werden. Am unteren Ende dieser Tabelle befindet sich ein Link, über den die Tabelle zu dem betrachteten Profil als csv-datei zur weiteren Analyse heruntergeladen werden kann. 4.5 Cox Wird als Methode die Cox-Regression gewählt, so wird unter der Karte Cox das Ergebnis ausgegeben. 15

16 Abbildung 8: Output der Cox-Regression mit den beiden Faktoren Östrogenrezeptorstatus und brusterhaltende Therapie, basierend auf der Gruppe derjenigen Patientinnen, die zwischen 20 und 40 Jahre alt sind und T1-Tumore aufwiesen. 16

17 A Glossar zu einigen statistischen Begriffen Im Folgenden werden einige wichtige biostatistische Begriffe erläutert. Für weitere und tiefergehende Erklärungen wird auf die einschlägige Literatur verwiesen. χ 2 -Test auf Unabhängigkeit: Dient zur Überprüfung der Hypothese, ob eine kategorielle Zufallsgröße von einer weiteren kategoriellen Zufallsgröße abhängt, z.b. ob die Anzahl der befallenen Lymphknoten stochastisch unabhängig von einem gewissen Hormonrezeptorstatus ist. Ganz allgemein kann mit OCDM überprüft werden, ob ein gewisses kategorielles Merkmal stochastisch unabhängig von einer Serie von vom Anwender gewählten Profilen ist. Cox-Regression: Das von Sir David Cox vorgeschlagene Regressionsmodell dient zur Untersuchung des Verhaltens der Hazardfunktion in Abhängigkeit von gewissen Einflussfaktoren, wie epidemiologischen oder klinischen Parametern. Liegen zum Beispiel die Werte x 1,..., x q von q dichotomen Einflussfaktoren für ein gewisses Individuum vor, so wird die Hazardfunktion dieses Individuums über die Relation h(t) = h 0 (t) exp(β 1 x β q x q ) (1) modelliert. h 0 bezeichnet dabei eine unbekannte Baseline-Hazardfunktion, die unabhängig von den Einflussfaktoren ist und zur Modellierung der Zeitabhängigkeit dient. Der Faktor x i hat den Wert 1, falls der betreffende Einflussfaktor vorliegt, ansonsten den Wert 0. Die unbekannten Parameter β 1,..., β q müssen über die vorliegenden Daten geschätzt werden. Ist der i-te Einflussfaktor x i dichotom, so kann β i als logarithmiertes Hazardverhältnis zweier Individuen interpretiert werden, die sich nur in der Ausprägung dieses i-ten Faktors unterscheiden, in den anderen Faktoren aber identisch sind. Weist der betrachtete Faktor k Faktorstufen auf mit k > 2, so werden zu diesem Faktor k 1 Parameter βi 1,..., β k 1 i Parameter geschätzt. Der Summand β i x i in Gleichung (1) muss dann durch die Summe βi 1 x 1 i β k 1 i x k 1 i ersetzt werden, wobei x j i genau dann gleich 1 ist, wenn die (j +1)-te Faktorstufe des Faktors i vorliegt, sonst gleich 0. Die zu Faktor i gehörigen Werte β j i können als die logarithmierten Hazardraten zu den Faktorstufen j + 1 und 0 interpretiert werden. Hazardrate, Hazardfunktion: Die zu einem Zeitpunkt t bestehende Neigung, dass eine gewisses Ereignis, z.b. Rezidiv oder Tod, eintritt. Formal ist die Hazardrate h(t) definiert als P (t T t + t T t) h(t) = lim t 0 t wobei T die zufällige Zeit des betrachteten Ereignis und t der Zeitpunkt, zu dem die Hazardrate berechnet werden soll. Die im Zähler stehende Ausdruck ist die bedingte 17

18 Wahrscheinlichkeit, dass das zufällige Ereignis im Zeitintervall zwischen t und t+ t eintritt unter der Voraussetzung, dass das Ereignis nicht schon vor dem Zeitpunkt t eingetreten ist. Hazardverhältnis: Verhältnis der Hazardraten zweier Individuen oder Subgruppen. partielle Likelihood: Wird zur Berechnung der Koeffizienten β i im Regressions-Modell verwendet. Hierbei werden grob gesagt diejenigen Werte für β 1,..., β q gewählt, die das Auftreten der tatsächlich ermittelten Daten (Überlebenszeiten, Faktorwerte) am wahrscheinlichsten erscheinen lassen. Log-Rang-Test: Dient zur Überprüfung der Hypothese H 0 über die Gleichheit mehrerer Überlebenszeitkurven. Ist der dazugehörige p-wert kleiner als 0,05, so wird die Hypothese H 0 zum Signifikanzniveau 0,05 verworfen. Median: Teilt den Wertebereich einer numerischen Zufallsgröße in zwei Hälften, die jeweils das Wahrscheinlichkeitmaß 0,5 besitzten. p-wert: Gibt bei einem statistischen Signifikanztest das größte Signifikanzniveau an, zu welchem die Nullhypothese des Tests gerade noch fälschlicherweise verworfen würde. stochastische Unabhängigkeit zweier Ereignisse: Liegt vor, wenn die Wahrscheinlichkeit des Eintretens des einen Ereignisses unabhängi vom Eintritt des anderen Ereignisses ist. Sind zwei Ereignisse stochastisch unabhängig, so sind diese nicht notwendigerweise auch in einem kausalen Sinne unabhängig und umgekehrt. Überlebensfunktion, Survivalfunktion: Eine Funktion in Abhängigkeit von der Variablen t, die die Wahrscheinlichkeit S(t) angibt, dass das betrachtete Ereignis (z.b. Tod) nach dem Zeitpunkt t eintritt. 95%-Konfidenzintervall für einen Parameter: Ein Intervall, dessen Grenzen unter Verwendung der vorliegenden Daten berechnet wird. Würde man unter denselben Voraussetzungen die Datenerhebung und die darauf basierende Berechnung der Intervallgrenzen wiederholen, so würden diese Intervalle in mindestens 95% aller Fälle den gesuchten aber unbekannten Parameter einschließen. 18

19 Literatur [1] David Collett. Modelling Survival Data in Medical Research, 2nd ed. Chapman & Hall (2003). [2] Jürgen Dippon, Peter Fritz, Michael Kohler. A statistical approach to case based reasoning, with application to breast cancer data. Computational Statistics & Data Analysis 40(2002), [3] Sebastian Klenk, Jürgen Dippon, Peter Fritz, Gunther Heidemann. Interactive survival analysis with the OCDM system: from development to application. Information Systems Frontiers. Erscheint

Statistische Analyse von Ereigniszeiten

Statistische Analyse von Ereigniszeiten Statistische Analyse von Survival Analysis VO Biostatistik im WS 2006/2007 1 2 3 : Leukemiedaten (unzensiert) 33 Patienten mit Leukemie; Zielvariable Überlebenszeit. Alle Patienten verstorben und Überlebenszeit

Mehr

Multivariate Analyse: Einführung in das COX-Modell

Multivariate Analyse: Einführung in das COX-Modell Auswertung Multivariate Analyse: Einführung in das COX-Modell Deskriptive Statistik Häufigkeiten, Univariate Statistiken, Explorative Datenanalyse, Kreuztabellen) Induktive Statistik, Vergleich von Mittelwerten

Mehr

Christian FG Schendera. Regressionsanalyse. mit SPSS. 2. korrigierte und aktualisierte Auflage DE GRUYTER OLDENBOURG

Christian FG Schendera. Regressionsanalyse. mit SPSS. 2. korrigierte und aktualisierte Auflage DE GRUYTER OLDENBOURG Christian FG Schendera Regressionsanalyse mit SPSS 2. korrigierte und aktualisierte Auflage DE GRUYTER OLDENBOURG Inhalt Vorworte V 1 Korrelation 1 1.1 Einführung 1 1.2 Erste Voraussetzung: Das Skalenniveau

Mehr

Schätzung des Lifetime Values von Spendern mit Hilfe der Überlebensanalyse

Schätzung des Lifetime Values von Spendern mit Hilfe der Überlebensanalyse Schätzung Lifetime Values von Spenn mit Hilfe Überlebensanalyse Einführung in das Verfahren am Beispiel Einzugsgenehmigung Überlebensanalysen o Ereignisdatenanalysen behandeln das Problem, mit welcher

Mehr

9. Schätzen und Testen bei unbekannter Varianz

9. Schätzen und Testen bei unbekannter Varianz 9. Schätzen und Testen bei unbekannter Varianz Dr. Antje Kiesel Institut für Angewandte Mathematik WS 2011/2012 Schätzen und Testen bei unbekannter Varianz Wenn wir die Standardabweichung σ nicht kennen,

Mehr

Chemotherapie und Antikörpertherapie bei Brustkrebs. Onkologische Gemeinschaftspraxis Siegburg Dr. med. Franz-Josef Heidgen

Chemotherapie und Antikörpertherapie bei Brustkrebs. Onkologische Gemeinschaftspraxis Siegburg Dr. med. Franz-Josef Heidgen Chemotherapie und Antikörpertherapie bei Brustkrebs Onkologische Gemeinschaftspraxis Siegburg Dr. med. Franz-Josef Heidgen Grundlegende Therapieverfahren Operation Chemotherapie und Antikörpertherapie

Mehr

Varianzanalyse ANOVA

Varianzanalyse ANOVA Varianzanalyse ANOVA Johannes Hain Lehrstuhl für Mathematik VIII Statistik 1/23 Einfaktorielle Varianzanalyse (ANOVA) Bisher war man lediglich in der Lage, mit dem t-test einen Mittelwertsvergleich für

Mehr

Kennzahlenbogen für Brustkrebszentren (EB Stand: 21.08.2012) Auslegungshinweise (Letzte Aktualisierung: 22.11.2012)

Kennzahlenbogen für Brustkrebszentren (EB Stand: 21.08.2012) Auslegungshinweise (Letzte Aktualisierung: 22.11.2012) Nr. EB Kennzahldefinition Kennzahlenziel 2 1.2.3 Prätherapeutische Fallbesprechung Adäquate Rate an prätherapeutischen Fallbesprechungen Anzahl Primärfälle, die in der prätherapeutischen Tumorkonferenz

Mehr

Überlebenszeitanalyse Teil 15 der Serie zur Bewertung wissenschaftlicher Publikationen

Überlebenszeitanalyse Teil 15 der Serie zur Bewertung wissenschaftlicher Publikationen ÜBERSICHTSARBEIT Überlebenszeitanalyse Teil 5 der Serie zur Bewertung wissenschaftlicher Publikationen Isabella Zwiener, Maria Blettner, Gerhard Hommel ZUSAMMENFASSUNG Hintergrund: Zum Vergleich von zwei

Mehr

Grundlagen der Inferenzstatistik: Was Ihnen nicht erspart bleibt!

Grundlagen der Inferenzstatistik: Was Ihnen nicht erspart bleibt! Grundlagen der Inferenzstatistik: Was Ihnen nicht erspart bleibt! 1 Einführung 2 Wahrscheinlichkeiten kurz gefasst 3 Zufallsvariablen und Verteilungen 4 Theoretische Verteilungen (Wahrscheinlichkeitsfunktion)

Mehr

Einfluss von prognoserelevanten Faktoren auf die Lokalrezidivrate im Vergleich zur Fernmetastasierung beim Mammakarzinom

Einfluss von prognoserelevanten Faktoren auf die Lokalrezidivrate im Vergleich zur Fernmetastasierung beim Mammakarzinom Einfluss von prognoserelevanten Faktoren auf die Lokalrezidivrate im Vergleich zur Fernmetastasierung beim Mammakarzinom Dissertation zur Erlangung des akademischen Grades Dr. med. an der Medizinischen

Mehr

Verteilungsmodelle. Verteilungsfunktion und Dichte von T

Verteilungsmodelle. Verteilungsfunktion und Dichte von T Verteilungsmodelle Verteilungsfunktion und Dichte von T Survivalfunktion von T Hazardrate von T Beziehungen zwischen F(t), S(t), f(t) und h(t) Vorüberlegung zu Lebensdauerverteilungen Die Exponentialverteilung

Mehr

Analyse bivariater Kontingenztafeln

Analyse bivariater Kontingenztafeln Analyse bivariater Kontingenztafeln Werden zwei kategoriale Merkmale mit nicht zu vielen möglichen Ausprägungen gemeinsam analysiert, so kommen zur Beschreibung der gemeinsamen Verteilung im allgemeinen

Mehr

Survival Analysis (Modul: Lebensdaueranalyse)

Survival Analysis (Modul: Lebensdaueranalyse) Survival Analysis (Modul: Lebensdaueranalyse) ROLAND RAU Universität Rostock, Sommersemester 2015 12. Mai 2015 c Roland Rau Survival Analysis 1 / 24 Hausaufgabe 1 Schreiben Sie die Log-Likelihood Gleichung

Mehr

90-minütige Klausur Statistik für Studierende der Kommunikationswissenschaft

90-minütige Klausur Statistik für Studierende der Kommunikationswissenschaft Prof. Dr. Helmut Küchenhoff SS08 90-minütige Klausur Statistik für Studierende der Kommunikationswissenschaft am 22.7.2008 Anmerkungen Überprüfen Sie bitte sofort, ob Ihre Angabe vollständig ist. Sie sollte

Mehr

Das Dialogfeld für die Regressionsanalyse ("Lineare Regression") findet sich im Statistik- Menu unter "Regression"-"Linear":

Das Dialogfeld für die Regressionsanalyse (Lineare Regression) findet sich im Statistik- Menu unter Regression-Linear: Lineare Regression Das Dialogfeld für die Regressionsanalyse ("Lineare Regression") findet sich im Statistik- Menu unter "Regression"-"Linear": Im einfachsten Fall werden mehrere Prädiktoren (oder nur

Mehr

Survival-Analyse mit zeitabhängigen Variablen

Survival-Analyse mit zeitabhängigen Variablen Klinische/Epidemiologische Anwendungen II Survival-Analyse mit zeitabhängigen Variablen Anja Schoeps Universität Heidelberg Institut für Public Health Im Neuenheimer Feld 324 69120 Heidelberg Schoeps@uni-heidelberg.de

Mehr

Multinomiale logistische Regression

Multinomiale logistische Regression Multinomiale logistische Regression Die multinomiale logistische Regression dient zur Schätzung von Gruppenzugehörigkeiten bzw. einer entsprechenden Wahrscheinlichkeit hierfür, wobei als abhänginge Variable

Mehr

Kapitel 4: Binäre Regression

Kapitel 4: Binäre Regression Kapitel 4: Binäre Regression Steffen Unkel (basierend auf Folien von Nora Fenske) Statistik III für Nebenfachstudierende WS 2013/2014 4.1 Motivation Ausgangssituation Gegeben sind Daten (y i, x i1,...,

Mehr

29. Mai 2006. 5. Bei Unterschleif gilt die Klausur als nicht bestanden und es erfolgt eine Meldung an das Prüfungsamt.

29. Mai 2006. 5. Bei Unterschleif gilt die Klausur als nicht bestanden und es erfolgt eine Meldung an das Prüfungsamt. L. Fahrmeir, C. Belitz Department für Statistik Bitte für die Korrektur freilassen! Aufgabe 1 2 3 4 Punkte Klausur zur Vorlesung Statistik III für Studenten mit Wahlfach Statistik 29. Mai 2006 Hinweise:

Mehr

Gibt es einen Geschmacksunterschied zwischen Coca Cola und Cola Zero?

Gibt es einen Geschmacksunterschied zwischen Coca Cola und Cola Zero? Gibt es einen Geschmacksunterschied zwischen Coca Cola und Cola Zero? Manche sagen: Ja, manche sagen: Nein Wie soll man das objektiv feststellen? Kann man Geschmack objektiv messen? - Geschmack ist subjektiv

Mehr

Leitfaden. Brusttumore. Univ Prof Dr Florian Fitzal. Welche Unterlagen benötige ich bei der Erstvorstellung

Leitfaden. Brusttumore. Univ Prof Dr Florian Fitzal. Welche Unterlagen benötige ich bei der Erstvorstellung 1von5 Leitfaden Brusttumore von Univ Prof Dr Florian Fitzal Welche Unterlagen benötige ich bei der Erstvorstellung Mammographie und Ultraschall (Befund in Kopie und Bilder, sowohl die neue als auch die

Mehr

Live -Statistiken zur Zertifizierung von Brustzentren welche Patientenauswahl ist für f welche Fragestellung korrekt?

Live -Statistiken zur Zertifizierung von Brustzentren welche Patientenauswahl ist für f welche Fragestellung korrekt? 18. Informationstagung für f r Tumordokumentation Live -Statistiken zur Zertifizierung von Brustzentren welche Patientenauswahl ist für f welche Fragestellung korrekt? Dipl.-Phys. Heike Lüders Heike Soltendieck

Mehr

Probeklausur Zeitreihenökonometrie (Sommersemester 2014) 1

Probeklausur Zeitreihenökonometrie (Sommersemester 2014) 1 Probeklausur Zeitreihenökonometrie (Sommersemester 2014) 1 Aufgabe 1: Betrachtet wird folgendes Modell zur Erklärung des Managergehalts salary durch den Umsatz sales, die Eigenkapitalrendite roe und die

Mehr

Tutorial: Homogenitätstest

Tutorial: Homogenitätstest Tutorial: Homogenitätstest Eine Bank möchte die Kreditwürdigkeit potenzieller Kreditnehmer abschätzen. Einerseits lebt die Bank ja von der Vergabe von Krediten, andererseits verursachen Problemkredite

Mehr

Modul G.1 WS 07/08: Statistik 17.01.2008 1. Die Korrelation ist ein standardisiertes Maß für den linearen Zusammenhangzwischen zwei Variablen.

Modul G.1 WS 07/08: Statistik 17.01.2008 1. Die Korrelation ist ein standardisiertes Maß für den linearen Zusammenhangzwischen zwei Variablen. Modul G.1 WS 07/08: Statistik 17.01.2008 1 Wiederholung Kovarianz und Korrelation Kovarianz = Maß für den linearen Zusammenhang zwischen zwei Variablen x und y Korrelation Die Korrelation ist ein standardisiertes

Mehr

1. Biometrische Planung

1. Biometrische Planung 1. Biometrische Planung Die biometrische Planung ist Teil der Studienplanung für wissenschaftliche Studien, in denen eine statistische Bewertung von Daten erfolgen soll. Sie stellt alle erforderlichen

Mehr

Kapitel 7: Varianzanalyse mit Messwiederholung

Kapitel 7: Varianzanalyse mit Messwiederholung Kapitel 7: Varianzanalyse mit Messwiederholung Durchführung einer einfaktoriellen Varianzanalyse mit Messwiederholung 1 Durchführung einer zweifaktoriellen Varianzanalyse mit Messwiederholung auf einem

Mehr

Klausur zur Vorlesung Statistik III für Studenten mit dem Wahlfach Statistik

Klausur zur Vorlesung Statistik III für Studenten mit dem Wahlfach Statistik Ludwig Fahrmeir, Nora Fenske Institut für Statistik Bitte für die Korrektur freilassen! Aufgabe 1 2 3 4 Punkte Klausur zur Vorlesung Statistik III für Studenten mit dem Wahlfach Statistik 29. März 21 Hinweise:

Mehr

Abschlussklausur (60 Minuten), 15. Juli 2014

Abschlussklausur (60 Minuten), 15. Juli 2014 Prof. Dr. Amelie Wuppermann Volkswirtschaftliche Fakultät Universität München Sommersemester 2014 Empirische Ökonomie 1 Abschlussklausur (60 Minuten), 15. Juli 2014 Bearbeitungshinweise Die Bearbeitungszeit

Mehr

Analog zu Aufgabe 16.1 werden die Daten durch folgenden Befehl eingelesen: > kredit<-read.table("c:\\compaufg\\kredit.

Analog zu Aufgabe 16.1 werden die Daten durch folgenden Befehl eingelesen: > kredit<-read.table(c:\\compaufg\\kredit. Lösung 16.3 Analog zu Aufgabe 16.1 werden die Daten durch folgenden Befehl eingelesen: > kredit

Mehr

Analyse alt- und mittelpaläolithischer Steinartefaktinventare mittels Parallelkoordinatenplots

Analyse alt- und mittelpaläolithischer Steinartefaktinventare mittels Parallelkoordinatenplots Einleitung Analyse alt- und mittelpaläolithischer Steinartefaktinventare mittels Parallelkoordinatenplots von Irmela Herzog Im Rahmen der Herbsttagung der AG DANK (Datenanalyse und Numerische Klassifikation)

Mehr

12. Vergleich mehrerer Stichproben

12. Vergleich mehrerer Stichproben 12. Vergleich mehrerer Stichproben Dr. Antje Kiesel Institut für Angewandte Mathematik WS 2011/2012 Häufig wollen wir verschiedene Populationen, Verfahren, usw. miteinander vergleichen. Beipiel: Vergleich

Mehr

Methoden Quantitative Datenanalyse

Methoden Quantitative Datenanalyse Leitfaden Universität Zürich ISEK - Andreasstrasse 15 CH-8050 Zürich Telefon +41 44 635 22 11 Telefax +41 44 635 22 19 www.isek.uzh.ch 11. September 2014 Methoden Quantitative Datenanalyse Vorbereitung

Mehr

Phase-II-Paket. R-Paket und Software-Tool für Planung, Monitoring und Auswertung onkologischer Phase-II-Studien

Phase-II-Paket. R-Paket und Software-Tool für Planung, Monitoring und Auswertung onkologischer Phase-II-Studien Phase-II-Paket R-Paket und Software-Tool für Planung, Monitoring und Auswertung onkologischer Phase-II-Studien Impressum TMF Technologie- und Methodenplattform für die vernetzte medizinische Forschung

Mehr

Grundzüge der Ereignisdatenanalyse

Grundzüge der Ereignisdatenanalyse Grundzüge der Ereignisdatenanalyse Regressionsmodelle Sommersemester 2009 Regressionsmodelle Event History Analysis (1/48) Übersicht Wiederholung Exponential- und Weibull-Modell Weitere Modelle Regressionsmodelle

Mehr

Bachelorabschlussseminar Dipl.-Kfm. Daniel Cracau

Bachelorabschlussseminar Dipl.-Kfm. Daniel Cracau 1 Einführung in die statistische Datenanalyse Bachelorabschlussseminar Dipl.-Kfm. Daniel Cracau 2 Gliederung 1.Grundlagen 2.Nicht-parametrische Tests a. Mann-Whitney-Wilcoxon-U Test b. Wilcoxon-Signed-Rank

Mehr

Auf dem Weg zur individualisierten Behandlung des Brustkrebses. Welche Möglichkeiten bieten Biomarker?

Auf dem Weg zur individualisierten Behandlung des Brustkrebses. Welche Möglichkeiten bieten Biomarker? Auf dem Weg zur individualisierten Behandlung des Brustkrebses Welche Möglichkeiten bieten Biomarker? Prof. Dr. med. O. Ortmann Klinik für Frauenheilkunde und Geburtshilfe der Universität Regensburg am

Mehr

Prognostische und prädiktive Faktoren beim Mammakarzinom

Prognostische und prädiktive Faktoren beim Mammakarzinom Prognostische und prädiktive Faktoren beim Mammakarzinom Von Petra Jungmayr, Esslingen Prognostische und prädiktive Faktoren gewinnen bei der individualisierten Therapie des Mammakarzinoms zunehmend an

Mehr

Datenqualität Kennzahlen

Datenqualität Kennzahlen Anlage Version F2.3 (Auditjahr 2013 / Kennzahlenjahr 2012) Kennzahlenbogen Brust Zentrum Reg.-Nr. Erstelldatum Kennzahlen In Ordnung Plausibel Plausibilität unklar nicht erfüllt Bearbeitungsqualität Fehlerhaft

Mehr

Jahresabschluss- rechnung und Rückstände

Jahresabschluss- rechnung und Rückstände ACS Data Systems AG Jahresabschluss- rechnung und Rückstände (Version 10.08.2009) Buchhaltung für Schulen ACS Data Systems AG Bozen / Brixen / Trient Tel +39 0472 27 27 27 obu@acs.it 2 Inhaltsverzeichnis

Mehr

Schleswig-Holsteinische Ergänzung der Musteraufgaben für den hilfsmittelfreien Teil der schriftlichen Abiturprüfung im Fach Mathematik ab 2015

Schleswig-Holsteinische Ergänzung der Musteraufgaben für den hilfsmittelfreien Teil der schriftlichen Abiturprüfung im Fach Mathematik ab 2015 ische Ergänzung der für den hilfsmittelfreien Teil der schriftlichen Abiturprüfung im Fach Mathematik ab 2015 Ministerium für ildung und Wissenschaft des Landes Juni 2013 1 Inhaltsverzeichnis Vorbemerkungen

Mehr

Publikationskonzept Prävalenzmessung Sturz & Dekubitus

Publikationskonzept Prävalenzmessung Sturz & Dekubitus Publikationskonzept Prävalenzmessung Sturz & Dekubitus Anhang 1 September 2013, Version 2.0 Das vorliegende Publikationskonzept der Prävalenzmessung Sturz & Dekubitus V.2.0 ist Bestandteil des Grundlagendokumentes

Mehr

14.01.14 DAS THEMA: INFERENZSTATISTIK II. Standardfehler Konfidenzintervalle Signifikanztests. Standardfehler

14.01.14 DAS THEMA: INFERENZSTATISTIK II. Standardfehler Konfidenzintervalle Signifikanztests. Standardfehler DAS THEMA: INFERENZSTATISTIK II INFERENZSTATISTISCHE AUSSAGEN Standardfehler Konfidenzintervalle Signifikanztests Standardfehler der Standardfehler Interpretation Verwendung 1 ZUR WIEDERHOLUNG... Ausgangspunkt:

Mehr

Non-Deterministische CFD Simulationen in FINE /Turbo

Non-Deterministische CFD Simulationen in FINE /Turbo Non-Deterministische CFD Simulationen in FINE /Turbo Dipl.-Ing. (FH) Peter Thiel Dr.-Ing. Thomas Hildebrandt NUMECA Ingenieurbüro NUMECA, a New Wave in Fluid Dynamics Überblick 1. Motivation: Warum non-deterministische

Mehr

Evaluation der Normalverteilungsannahme

Evaluation der Normalverteilungsannahme Evaluation der Normalverteilungsannahme. Überprüfung der Normalverteilungsannahme im SPSS P. Wilhelm; HS SPSS bietet verschiedene Möglichkeiten, um Verteilungsannahmen zu überprüfen. Angefordert werden

Mehr

Koeffizienten der Logitanalyse. Kurt Holm. Almo Statistik-System www.almo-statistik.de holm@almo-statistik.de kurt.holm@jku.at

Koeffizienten der Logitanalyse. Kurt Holm. Almo Statistik-System www.almo-statistik.de holm@almo-statistik.de kurt.holm@jku.at Koeffizienten der Logitanalyse Kurt Holm Almo Statistik-System www.almo-statistik.de holm@almo-statistik.de kurt.holm@jku.at 1 Kurt Holm Koeffizienten der Logitanalyse Eine häufig gestellte Frage lautet:

Mehr

Maßnahmen zur Verbesserung der Datenqualität

Maßnahmen zur Verbesserung der Datenqualität Maßnahmen zur Verbesserung der Datenqualität in der Klinischen Landesregisterstelle des Krebsregisters Baden-Württemberg 11. DVMD Fachtagung, 17.02.2011 Regina Schönthaler, Klinische Landesregisterstelle

Mehr

Übertherapie vermeiden

Übertherapie vermeiden Übertherapie vermeiden Inhalt Brustkrebs: Chemotherapie ja oder nein? 2 EndoPredict für eine personalisierte Therapiestrategie 4 Für wen eignet sich EndoPredict? 4 Wie wurde EndoPredict entwickelt? 5

Mehr

Dokumentation RabattManagerLX Pro. Version 1.0.901.1

Dokumentation RabattManagerLX Pro. Version 1.0.901.1 Dokumentation RabattManagerLX Pro Version 1.0.901.1 Dokumentation RabattManagerLX Pro Version 1.0.901.1 Was ist RabattManagerLX Pro? RabattManagerLX Pro ist ein Programm um individuelle Warengruppen-Rabatte

Mehr

Formaler Entwurf mit Event-B Die Eventbank

Formaler Entwurf mit Event-B Die Eventbank Institut für Theoretische Informatik Anwendungsorientierte Formale Verifikation Vorlesung Anwendung Formaler Verifikation SS 2015, 9.6.15 Dr. V. Klebanov, Dr. M. Ulbrich Formaler Entwurf mit Event-B Die

Mehr

Inhaltsverzeichnis. I Einführung in STATISTICA 1. 1 Erste Schritte in STATISTICA 3

Inhaltsverzeichnis. I Einführung in STATISTICA 1. 1 Erste Schritte in STATISTICA 3 I Einführung in STATISTICA 1 1 Erste Schritte in STATISTICA 3 2 Datenhaltung in STATISTICA 11 2.1 Die unterschiedlichen Dateitypen in STATISTICA....... 11 2.2 Import von Daten......... 12 2.3 Export von

Mehr

Data Mining-Projekte

Data Mining-Projekte Data Mining-Projekte Data Mining-Projekte Data Mining stellt normalerweise kein ei nmaliges Projekt dar, welches Erkenntnisse liefert, die dann nur einmal verwendet werden, sondern es soll gewöhnlich ein

Mehr

8. Februar 2007. 5. Bei Unterschleif gilt die Klausur als nicht bestanden und es erfolgt eine Meldung an das Prüfungsamt.

8. Februar 2007. 5. Bei Unterschleif gilt die Klausur als nicht bestanden und es erfolgt eine Meldung an das Prüfungsamt. L. Fahrmeir, C. Belitz Department für Statistik Bitte für die Korrektur freilassen! Aufgabe 1 2 3 4 Punkte Klausur zur Vorlesung Statistik III für Studenten mit Wahlfach Statistik 8. Februar 2007 Hinweise:

Mehr

Kommentierter SPSS-Ausdruck zur logistischen Regression

Kommentierter SPSS-Ausdruck zur logistischen Regression Daten: POK V AG 3 (POKV_AG3_V07.SAV) Kommentierter SPSS-Ausdruck zur logistischen Regression Fragestellung: Welchen Einfluss hat die Fachnähe und das Geschlecht auf die interpersonale Attraktion einer

Mehr

DISSERTATION. Analyse palliativer Therapiesequenzen beim metastasierten Mammakarzinom unter Anwendung von Multi-State-Modellen

DISSERTATION. Analyse palliativer Therapiesequenzen beim metastasierten Mammakarzinom unter Anwendung von Multi-State-Modellen DISSERTATION Analyse palliativer Therapiesequenzen beim metastasierten Mammakarzinom unter Anwendung von Multi-State-Modellen ausgeführt zum Zwecke der Erlangung des akademischen Grades eines Doktors der

Mehr

Wie wird ausgewertet?

Wie wird ausgewertet? Wie wird ausgewertet? Im Klinischen Krebsregister Südthüringen des Regionalen Tumorzentrums Suhl werden seit 1995 Daten von Tumorpatienten aus dem Einzugsgebiet Südthüringen (ehemaliger Bezirk Suhl) registriert.

Mehr

Dr. med. Michael Ehmann Urologe Hauptstrasse 18 66953 Pirmasens Tel. 06331 / 13500

Dr. med. Michael Ehmann Urologe Hauptstrasse 18 66953 Pirmasens Tel. 06331 / 13500 Moderne Nachsorge und Nachbehandlung des Nierenzellkarziom Das Nierenzellkarzinom stellt mit 2 3 % aller bösartigen Tumore einen relativ seltenen bösartige Tumorentität dar. Der Krankheitsgipfel liegt

Mehr

Gene, Umwelt und Aktivität

Gene, Umwelt und Aktivität Neuigkeiten aus der Huntington-Forschung. In einfacher Sprache. Von Wissenschaftlern geschrieben Für die Huntington-Gemeinschaft weltweit. Ein aktiver Lebensstil beeinflusst vielleicht die Krankheitssymptome

Mehr

Epidemiologie CH 2008

Epidemiologie CH 2008 Das Bronchuskarzinom: Diagnostik, Therapie und Screening Ärzteforum Davos 06.03.2014 Michael Mark Stv. Leitender Arzt Onkologie/Hämatologie Kantonsspital GR Epidemiologie CH 2008 Krebsliga Schweiz Epidemiologische

Mehr

Schleswig-Holsteinische Ergänzung der Musteraufgaben für den hilfsmittelfreien Teil der schriftlichen Abiturprüfung im Fach Mathematik ab 2015

Schleswig-Holsteinische Ergänzung der Musteraufgaben für den hilfsmittelfreien Teil der schriftlichen Abiturprüfung im Fach Mathematik ab 2015 ische Ergänzung der für den hilfsmittelfreien Teil der schriftlichen Abiturprüfung im Fach Mathematik ab 2015 Ministerium für ildung und Wissenschaft des Landes Juni 2013 1 für Aufgabenpool 1 Analysis

Mehr

Suche schlecht beschriftete Bilder mit Eigenen Abfragen

Suche schlecht beschriftete Bilder mit Eigenen Abfragen Suche schlecht beschriftete Bilder mit Eigenen Abfragen Ist die Bilderdatenbank über einen längeren Zeitraum in Benutzung, so steigt die Wahrscheinlichkeit für schlecht beschriftete Bilder 1. Insbesondere

Mehr

Häufigkeitstabellen. Balken- oder Kreisdiagramme. kritischer Wert für χ2-test. Kontingenztafeln

Häufigkeitstabellen. Balken- oder Kreisdiagramme. kritischer Wert für χ2-test. Kontingenztafeln Häufigkeitstabellen Menüpunkt Data PivotTable Report (bzw. entsprechendes Icon): wähle Data Range (Zellen, die die Daten enthalten + Zelle mit Variablenname) wähle kategoriale Variable für Spalten- oder

Mehr

Prognostische und prädiktive Faktoren

Prognostische und prädiktive Faktoren Diagnostik und Therapie primärer und metastasierter Mammakarzinome Prognostische und prädiktive Faktoren Prognostische und prädiktive Faktoren Version 2002: Thomssen / Harbeck Version 2003 2009: Costa

Mehr

Auswertung mit dem Statistikprogramm SPSS: 30.11.05

Auswertung mit dem Statistikprogramm SPSS: 30.11.05 Auswertung mit dem Statistikprogramm SPSS: 30.11.05 Seite 1 Einführung SPSS Was ist eine Fragestellung? Beispiel Welche statistische Prozedur gehört zu welcher Hypothese? Statistische Berechnungen mit

Mehr

Behandlung von Krebsvorstufen. Dr. K. Röder Klinik für Frauenheilkunde und Geburtshilfe

Behandlung von Krebsvorstufen. Dr. K. Röder Klinik für Frauenheilkunde und Geburtshilfe Behandlung von Krebsvorstufen Dr. K. Röder Klinik für Frauenheilkunde und Geburtshilfe Krebsvorstufen - Was sind Vorstufen von Brustkrebs? - Wie fallen die Krebsvorstufen in der Diagnostik auf? - Welche

Mehr

Bachelor-Thesis. Analyse und Erweiterung einer Software zur statistischen Auswertung von Daten aus einem Krebsregister

Bachelor-Thesis. Analyse und Erweiterung einer Software zur statistischen Auswertung von Daten aus einem Krebsregister Bachelor-Thesis Analyse und Erweiterung einer Software zur statistischen Auswertung von Daten aus einem Krebsregister Studiengang Medizinische Informatik der Hochschule Heilbronn und der Universität Heidelberg.

Mehr

NSCLC: Diagnostik. PD Dr. med. F. Griesinger Abtl. Hämatologie und Onkologie Universität Göttingen

NSCLC: Diagnostik. PD Dr. med. F. Griesinger Abtl. Hämatologie und Onkologie Universität Göttingen NSCLC: Diagnostik PD Dr. med. F. Griesinger Abtl. Hämatologie und Onkologie Universität Göttingen Bronchialkarzinom Inzidenz: weltweit Jährliche Alters-bezogene Inzidenz des Bronchial-Karzinoms/100.000

Mehr

Binäre abhängige Variablen

Binäre abhängige Variablen Binäre abhängige Variablen Thushyanthan Baskaran thushyanthan.baskaran@awi.uni-heidelberg.de Alfred Weber Institut Ruprecht Karls Universität Heidelberg Einführung Oft wollen wir qualitative Variablen

Mehr

1. Neoadjuvante Therapie. 2. Adjuvante Therapie. 3. Metastasiertes Mamma-Ca. 4. Mamma-Ca. in der Schwangerschaft. 5. Nicht-interventionelle Studien

1. Neoadjuvante Therapie. 2. Adjuvante Therapie. 3. Metastasiertes Mamma-Ca. 4. Mamma-Ca. in der Schwangerschaft. 5. Nicht-interventionelle Studien 1. Neoadjuvante Therapie GeparOcto-Studie Penelope-Studie 2. Adjuvante Therapie GAIN II-Studie Katherine-Studie TREAT CTC-Studie OLYMPIA Studie 3. Metastasiertes Mamma-Ca. First-line Therapie: Ab Second-line

Mehr

Ausfüllanleitung zur Erst- und Folgedokumentation im strukturierten Behandlungsprogramm Brustkrebs

Ausfüllanleitung zur Erst- und Folgedokumentation im strukturierten Behandlungsprogramm Brustkrebs Ausfüllanleitung zur Erst- und Folgedokumentation im strukturierten Behandlungsprogramm Brustkrebs Stand der letzten Bearbeitung: 18. April 2013 Version 2.2 Bearbeitungshinweis zur Dokumentation Brustkrebs

Mehr

Multivariate Verfahren

Multivariate Verfahren Selbstkontrollarbeit 2 Multivariate Verfahren Musterlösung Aufgabe 1 (28 Punkte) Der Marketing-Leiter einer Lebensmittelherstellers möchte herausfinden, mit welchem Richtpreis eine neue Joghurt-Marke auf

Mehr

Übersicht. VL Forschungsmethoden. Ereignisdatenanalyse

Übersicht. VL Forschungsmethoden. Ereignisdatenanalyse VL Forschungsmethoden Ereignisdatenanalyse 1 2 3 4 5 Übersicht VL Forschungsmethoden Event Data (1/45) Harold Macmillan, PM 1957-1963 The greatest challenge in politics: events, my dear boy, events Was

Mehr

7.4 Analyse anhand der SQL-Trace. 7.3.5 Vorabanalyse mit dem Code Inspector

7.4 Analyse anhand der SQL-Trace. 7.3.5 Vorabanalyse mit dem Code Inspector 7.4 Analyse anhand der SQL-Trace 337 7.3.5 Vorabanalyse mit dem Code Inspector Der Code Inspector (SCI) wurde in den vorangegangenen Kapiteln immer wieder erwähnt. Er stellt ein paar nützliche Prüfungen

Mehr

Anleitung zu Projekte

Anleitung zu Projekte Web Site Engineering GmbH Anleitung zu Projekte Projekte im WPS Version 4.3 Seite 1 Projekte verwalten...1 2 Projekt hinzufügen...4 3 Projekt löschen...9 4 Projekt ändern...9 5 Projektdaten drucken und

Mehr

5.2. Nichtparametrische Tests. 5.2.1. Zwei unabhängige Stichproben: U- Test nach MANN- WHITNEY

5.2. Nichtparametrische Tests. 5.2.1. Zwei unabhängige Stichproben: U- Test nach MANN- WHITNEY 5.2. Nichtparametrische Tests 5.2.1. Zwei unabhängige Stichproben: U- Test nach MANN- WHITNEY Voraussetzungen: - Die Verteilungen der beiden Grundgesamtheiten sollten eine ähnliche Form aufweisen. - Die

Mehr

Data Mining-Modelle und -Algorithmen

Data Mining-Modelle und -Algorithmen Data Mining-Modelle und -Algorithmen Data Mining-Modelle und -Algorithmen Data Mining ist ein Prozess, bei dem mehrere Komponenten i n- teragieren. Sie greifen auf Datenquellen, um diese zum Training,

Mehr

Kapitel 3. Zufallsvariable. Wahrscheinlichkeitsfunktion, Dichte und Verteilungsfunktion. Erwartungswert, Varianz und Standardabweichung

Kapitel 3. Zufallsvariable. Wahrscheinlichkeitsfunktion, Dichte und Verteilungsfunktion. Erwartungswert, Varianz und Standardabweichung Kapitel 3 Zufallsvariable Josef Leydold c 2006 Mathematische Methoden III Zufallsvariable 1 / 43 Lernziele Diskrete und stetige Zufallsvariable Wahrscheinlichkeitsfunktion, Dichte und Verteilungsfunktion

Mehr

Multiple Regression. Ziel: Vorhersage der Werte einer Variable (Kriterium) bei Kenntnis der Werte von zwei oder mehr anderen Variablen (Prädiktoren)

Multiple Regression. Ziel: Vorhersage der Werte einer Variable (Kriterium) bei Kenntnis der Werte von zwei oder mehr anderen Variablen (Prädiktoren) Multiple Regression 1 Was ist multiple lineare Regression? Ziel: Vorhersage der Werte einer Variable (Kriterium) bei Kenntnis der Werte von zwei oder mehr anderen Variablen (Prädiktoren) Annahme: Der Zusammenhang

Mehr

Survival Analysis. Rene.Boeheim@jku.at. December 2008

Survival Analysis. Rene.Boeheim@jku.at. December 2008 Survival Analysis René Böheim Rene.Boeheim@jku.at December 2008 Basierend auf Cleves, Gould, and Gutierrez (2004), An Introduction to Survival Analysis using Stata, Revised Edition, Stata Press, Texas.

Mehr

A-Plan 12.0. Zeiterfassung 2.0. Ausgabe 1.1. Copyright. Warenzeichenhinweise

A-Plan 12.0. Zeiterfassung 2.0. Ausgabe 1.1. Copyright. Warenzeichenhinweise A-Plan 12.0 Zeiterfassung 2.0 Ausgabe 1.1 Copyright Copyright 1996-2014 braintool software gmbh Kein Teil dieses Handbuches darf ohne ausdrückliche Genehmigung von braintool software gmbh auf mechanischem

Mehr

Das Studiengangsinformationssystem (SGIS)

Das Studiengangsinformationssystem (SGIS) Das Studiengangsinformationssystem (SGIS) Manual für Typo3-Redakteure Version 1.a Mai 2015 Kontakt: Referat 1.4 - Allgemeine Studienberatung und Career Service Christian Birringer, christian.birringer@uni-rostock.de

Mehr

Angewandte Ökonometrie, WS 2012/13, 1. Teilprüfung am 6.12.2012 - Lösungen. Das folgende Modell ist ein GARCH(1,1)-Modell:

Angewandte Ökonometrie, WS 2012/13, 1. Teilprüfung am 6.12.2012 - Lösungen. Das folgende Modell ist ein GARCH(1,1)-Modell: Angewandte Ökonometrie, WS 2012/13, 1. Teilprüfung am 6.12.2012 - Lösungen LV-Leiterin: Univ.Prof.Dr. Sylvia Frühwirth-Schnatter 1 Wahr oder falsch? 1. Das folgende Modell ist ein GARCH(1,1)-Modell: Y

Mehr

Die Auswertungen beziehen sich auf gemeldete Patienten mit Wohnort innerhalb des Einzugsbereichs der Kooperationsgemeinschaft.

Die Auswertungen beziehen sich auf gemeldete Patienten mit Wohnort innerhalb des Einzugsbereichs der Kooperationsgemeinschaft. Datenpool Wie wird ausgewertet? Datenstand vom: 24.08.2015 In den Klinischen Krebsregistern (KKR) der Kooperationsgemeinschaft der Klinischen Krebsregister im Direktionsbezirk Chemnitz des Freistaates

Mehr

Verteilungsanalyse. Johannes Hain. Lehrstuhl für Mathematik VIII Statistik 1/35

Verteilungsanalyse. Johannes Hain. Lehrstuhl für Mathematik VIII Statistik 1/35 Verteilungsanalyse Johannes Hain Lehrstuhl für Mathematik VIII Statistik 1/35 Datentypen Als Sammeln von Daten bezeichnet man in der Statistik das Aufzeichnen von Fakten. Erhobene Daten klassifziert man

Mehr

Einführung in die Logistische Regression. Fortbildung zur 19.Informationstagung Tumordokumentation

Einführung in die Logistische Regression. Fortbildung zur 19.Informationstagung Tumordokumentation Einführung in die Logistische Regression Fortbildung zur 9.Informationstagung Tumordokumentation Bernd Schicke, Tumorzentrum Berlin FB Bayreuth, 29.März 20 Gliederung Einleitung Schätzen von Maßzahlen

Mehr

Was ist der Her2-Status?

Was ist der Her2-Status? Was ist der Her2-Status? Dieser Artikel knüpft an die Resultate einer Umfrage im Frühjahr 2006 mit Frauen von LEBEN WIE ZUVOR an. 1'500 Fragebogen wurden versendet und eine beeindruckende Rücklaufquote

Mehr

Therapie des Bronchialkarzinoms Welcher Patient profitiert von der Operation?

Therapie des Bronchialkarzinoms Welcher Patient profitiert von der Operation? Therapie des Bronchialkarzinoms Welcher Patient profitiert von der Operation? H.-S. Hofmann Thoraxchirurgisches Zentrum Universitätsklinikum Regensburg Krankenhaus Barmherzige Brüder Regensburg Problem:

Mehr

1,11 1,12 1,13 1,14 1,15 1,16 1,17 1,17 1,17 1,18

1,11 1,12 1,13 1,14 1,15 1,16 1,17 1,17 1,17 1,18 3. Deskriptive Statistik Ziel der deskriptiven (beschreibenden) Statistik (explorativen Datenanalyse) ist die übersichtliche Darstellung der wesentlichen in den erhobenen Daten enthaltene Informationen

Mehr

CentreWare Web 5.8.107 und höher August, 2013 702P01947. Xerox CentreWare Web Firmware-Patch zum Scannen - erkennen und anwenden

CentreWare Web 5.8.107 und höher August, 2013 702P01947. Xerox CentreWare Web Firmware-Patch zum Scannen - erkennen und anwenden CentreWare Web 5.8.107 und höher August, 2013 702P01947 Firmware-Patch zum Scannen - erkennen und anwenden 2013 Xerox Corporation. Alle Rechte vorbehalten. Xerox, Xerox und Design, CentreWare, ColorQube

Mehr

7. Qualitätssicherungskonferenz

7. Qualitätssicherungskonferenz 7. Qualitätssicherungskonferenz Externe stationäre Qualitätssicherung Mammachirurgie (Modul 18/1) Berlin, 02.10.2015 Dr. med. Steffen Handstein Städtisches Klinikum Görlitz ggmbh, Görlitz 2015 AQUA-Institut

Mehr

Diskriminanzanalyse Beispiel

Diskriminanzanalyse Beispiel Diskriminanzanalyse Ziel bei der Diskriminanzanalyse ist die Analyse von Gruppenunterschieden, d. h. der Untersuchung von zwei oder mehr Gruppen hinsichtlich einer Vielzahl von Variablen. Diese Methode

Mehr

Anwendung eines SAS/STAT-Modells ohne SAS/STAT in einem CRM-Projekt

Anwendung eines SAS/STAT-Modells ohne SAS/STAT in einem CRM-Projekt Poster Anwendung eines SAS/STAT-Modells ohne SAS/STAT in einem CRM-Projekt Timm Euler Tobias Otte viadee GmbH viadee GmbH Anton-Bruchausen-Str. 8 Anton-Bruchausen-Str. 8 48147 Münster 48147 Münster Timm.Euler@viadee.de

Mehr

Präventionspotenzial endoskopischer Vorsorgeuntersuchungen für kolorektale Karzinome

Präventionspotenzial endoskopischer Vorsorgeuntersuchungen für kolorektale Karzinome Präventionspotenzial endoskopischer Vorsorgeuntersuchungen für kolorektale Karzinome Symposium Das Früherkennungsprogramm kolorektaler Karzinome in Deutschland eine Zwischenbilanz Oldenburg, 30.10.2004

Mehr

Tipps zur Handhabung der Historischen Datenbank

Tipps zur Handhabung der Historischen Datenbank Tipps zur Handhabung der Historischen Datenbank Kein Problem ist der Weg im Internet zur Historischen Datenbank. Über die Internetseite des Böhmerwaldbundes klicken Sie auf Historische Datenbank, die drei

Mehr

Grundlagen von Versuchsmethodik und Datenanalyse

Grundlagen von Versuchsmethodik und Datenanalyse Grundlagen von Versuchsmethodik und Datenanalyse Der Anfang: Hypothesen über Ursache-Wirkungs-Zusammenhänge Ursache Wirkung Koffein verbessert Kurzzeitgedächtnis Gewaltfilme führen zu aggressivem Verhalten

Mehr

Abhängigkeit zweier Merkmale

Abhängigkeit zweier Merkmale Abhängigkeit zweier Merkmale Johannes Hain Lehrstuhl für Mathematik VIII Statistik 1/33 Allgemeine Situation Neben der Untersuchung auf Unterschiede zwischen zwei oder mehreren Untersuchungsgruppen hinsichtlich

Mehr

Ereignisanalyse. Sterbetafel-Methode Kaplan-Meier-Verfahren Cox-Regression. Kurt Holm. Almo Statistik-System

Ereignisanalyse. Sterbetafel-Methode Kaplan-Meier-Verfahren Cox-Regression. Kurt Holm. Almo Statistik-System Ereignisanalyse Sterbetafel-Methode Kaplan-Meier-Verfahren Cox-Regression Kurt Holm Almo Statistik-System www.almo-statistik.de holm@almo-statistik.de kurt.holm@jku.at 2013 1 Im Text wird häufig auf das

Mehr

6. METRISCHE UND KATEGORIALE MERKMALE

6. METRISCHE UND KATEGORIALE MERKMALE 6. METRISCHE UND KATEGORIALE MERKMALE wenn an einer Beobachtungseinheit eine (oder mehrere) metrische und eine (oder mehrere) kategoriale Variable(n) erhoben wurden Beispiel: Haushaltsarbeit von Teenagern

Mehr