Merkmale zur Beschreibung der Intensitätsvariation für die Klassifikation von Herdbefunden in Mammogrammen

Ähnliche Dokumente
Referenzdaten für die computerassistierte Diagnose in der Mammographie

Automatic segmentation for dental operation planning. Diplomarbeit. Nguyen The Duy

Kranial-kaudale Korrespondenz in MR-Aufnahmen

Statistical Coaching. Thomas Forstner

Früherkennung und Diagnostik

Praktikum 2. Grauwert - Histogramme, Bimodalitätsanalyse Bildstatistik

Prototyp eines Mammographie-CAD-Systems auf Basis der Cognition Network Technology

Neuere Ansätze zur Auswahl von Prädiktionsmodellen. Von Veronika Huber

Tomosynthese und Tomosynthese gesteuerte Stereotaxie. Dr. med. Sibylle Dubach Schwizer Brust-Zentrum Zürich

Früherkennung und Diagnostik

Mod. 2 p. 1. Prof. Dr. Christoph Kleinn Institut für Waldinventur und Waldwachstum Arbeitsbereich Fernerkundung und Waldinventur

Flächen- und Volumenmessung lokaler Objekte in DICOM-Bildern und Bildfolgen

3.3.1 Referenzwerte für Fruchtwasser-Schätzvolumina ( SSW)

Brustkrebs Screening mittels Mammographie : Contra oder «a case for reasonable doubts»

5 DISKUSSION. 5.1 Normalwerte. 5.2 Korrelation von Hochfrequenzdämpfung und F- Chronodispersion

Diagnostische Verfahren

Die B3-Läsion. Veränderung mit unsicherem biologischen Potential. Prof. Dr. Michael Heine. Pathologisches Institut Bremerhaven

Distributed Algorithms. Image and Video Processing

Bild-Erkennung & -Interpretation

Magnetresonanz-Tomographie der Leber zugelassen

Ich habe einen Knoten in der Brust Wie weiter?

Brustkrebs Screening mittels Mammographie : Contra oder «a case for reasonable doubts»

Segmentierung von Biopsienadeln in transrektalen Ultraschallaufnahmen der Prostata

Mammasonographie in der Praxis: eine Standortbestimmung. Dr. med. Ellen Marzotko Frauenarztpraxis Erfurt

Optimierte Segmentierung der Papille in HRT-Retinaaufnahmen

Wann hilft die Magnetresonanztomografie (MRT)?

Funktion Das Skript erstellt ROC-Kurven mit Konfidenzbändern, berechnet (gewichtete) Cutoff-Punkte und (partial) Area under the Curve (AUC, pauc).

Verarbeitung von Volumenbildern wichtige Werkzeuge

Mammadiagnostik. Anna Maaßen Katharina May Arpad Bischof

Data Mining und Maschinelles Lernen

Bei näherer Betrachtung des Diagramms Nr. 3 fällt folgendes auf:

Tabelle 12: Zystendiagnosen im Verlauf der Laktation nach Palpation vom Rektum her

Proseminar "Aufgabenstellungen der Bildanalyse und Mustererkennung"

Tabelle 11: AgNOR- und Zellparameter aller benignen Tumoren

Was bisher geschah. digitale Bilder: Funktion B : pos col Matrix B col

3. Analyse der Kamerabewegung Video - Inhaltsanalyse

The ROC curve in screening with multiple markers: An application to the triple test in prenatal diagnostics

3D-Rekonstruktion aus Bildern

Methode einer Fehleranalyse von systematischen Messfehlern für die Time-Bin-Konfiguration unter cw-laserbestrahlung

geometrische Merkmale densitometrische (photometrische) Merkmale (aus Grauwerthistogramm) Texturmerkmale Farbmerkmale

Kamera-Sensorforensik: Erkennungsraten im Kontext von Bildkompression

MM Proteinmodelling. Michael Meyer. Vorlesung XVII

4.2.6 HAUT Durchschnittliche Mastzelldichte Heterogenität caniner Mastzellen

Brustkrebs aktuell - OSP am Was ist eigentlich die Aufgabe des Pathologen in Diagnostik und Therapie des Mammakarzinoms?

Bachelorverteidigung Marco Franke

Bivariate explorative Datenanalyse in R

Die Präparatesonographie als Qualitätsindikator

3.2.1 Neurogeneserate der magnetfeldbehandelten Tiere aus restriktiver Haltung

Protokoll. Biologische Übungen III Donnerstag, Kurs 4 Sehen. Arbeitsgruppe D6: Clara Dees Susanne Duncker Anja Hartmann Kristin Hofmann

Täuschung und Manipulation mit Zahlen

Tomosynthese. Dipl.-Ing. A. Sommer. Referenzzentrum für Mammographie am Universitätsklinikum Münster

Forschungsstatistik I

Modell zur Einflussanalyse Ein Modell zur Einflussanalyse von Methodenänderungen in Entwicklungsprozessen

Segmentierung von Blutgefäßstrukturen in koloskopischen NBI-Bilddaten

Kapitel 7. Crossvalidation

13. Übungswoche - Lösungen

Qualitätssicherung in der Mammachirurgie. Qualitätsindikatoren

Gewebeproben von 52 Tumoren der Niere und 52 Proben von Nierennormalgewebe wurden mittels TRAP-Assay auf Telomeraseaktivität untersucht.

4 Ergebnisse. 4.1 Evaluierung der Methode. 4.2 Allgemeine Beobachtungen. 4.3 CD68-positive Zellen 4 ERGEBNISSE 17

Medienforensik - Manipulationserkennung. Multimedia Sicherheit, Martin Steinebach

4.2 Ergebnisse der Versuche mit einem exemplarisch gewählten flexiblen Cranioskop

Neue Ansätze für Mustererkennung und automatisches Lernen

Hauptkomponenten-basierte Klassifikationsverfahren (PCA)

Manuelle Lymphdrainage bei Krebserkrankungen. erstellt von Dr. inanna Glechner.

Täuschung und Manipulation mit Zahlen Teil 1

Grundlagen von Rasterdaten

Statistische Kenngrößen. Histogramm. Grundlagen zur statistischen Signalverarbeitung. Statistische Beschreibung von Audio

Parallele Algorithmen in der Bildverarbeitung

Seminar: Multi-Core Architectures and Programming. Viola-Jones Gesichtsdetektor

k-nächste-nachbarn-schätzung

Früherkennung und Diagnostik

INTELLIGENTE DATENANALYSE IN MATLAB

Erkennung des Brustkarzinoms mittels Computerthermographie

Jalid Sehouli. Direktor der Kliniken für Gynäkologie Campus Virchow Klinikum und Campus Benjamin Franklin Charité Comprehensive Cancer Center

Automatische Segmentierung der Lungenflügel in CT-Daten

Klassifikation von Textabschnitten

GEFÜGEANALYSE VON METALLISCHEN LEGIERUNGEN MIT QUANTITATIVEN COMPUTERTOMOGRAFIEMETHODEN

Intraoperative Strahlentherapie bei Brustkrebs. Patienteninformation zur intraoperativen Strahlentherapie des Tumorbettes (Boost)

Medizinische Biometrie (L5)

Ingenieur- und Beratungsbüro B. Villing, Target Costing

Automatische Erkennung und Klassifikation von Körperhaltungen und Aktivitäten

Produktgruppen als mögliche Hilfe für die Auswahl zutreffender CE-Richtlinien

7. Grundlagen von Rasterdaten

Verzeichnung und Messgenauigkeit aufgrund der Verzeichnung. Tutorial

Mustererkennung. Übersicht. Unüberwachtes Lernen. (Un-) Überwachtes Lernen Clustering im Allgemeinen k-means-verfahren Gaussian-Mixture Modelle

f(x) = P (X = x) = 0, sonst heißt Poisson-verteilt mit Parameter (oder Rate) λ > 0, kurz X P o(λ). Es gilt x x! 1 Wahrscheinlichkeitsrechnung 212

Mammographie-Screening in Deutschland: Positiver Trend der Vorjahre bestätigt

Gesundheitsakademie Der Pathologe als Lotse der Therapie

Versuchsprotokoll. Mathematisch-Naturwissenschaftliche Fakultät I Institut für Physik. Versuch O8: Fraunhofersche Beugung Arbeitsplatz Nr.

Überblick. Einführung in die automatische Mustererkennung Grundlagen der Wahrscheinlichkeitsrechnung

Prof. Dr. Christoph Rochlitz, Chefarzt Onkologie und Vorsitzender Tumorzentrum am Universitätsspital Basel. BH

Anhang 2. zum SKBF-Staff-Paper 21 «Analysen der frühen Studienverläufe am Beispiel der Universität Bern»

Modul F - Sprachanalyse (2)

Auswertung P2-10 Auflösungsvermögen

2 Darstellung von Zahlen und Zeichen

Dissertation. zur Erlangung des akademischen Grades Doktor der Medizin (Dr. med.)

Der Weg eines Betrunkenen

Shape Gradient for Image and Video Segmentation

Bitte lesen Sie die folgende Musteraufgabe konzentriert durch. Musteraufgabe I

Transkript:

Merkmale zur Beschreibung der Intensitätsvariation für die Klassifikation von Herdbefunden in Mammogrammen Florian Wagner, Matthias Elter Fraunhofer-Institut für Integrierte Schaltungen IIS, Erlangen wagnerfn@iis.fraunhofer.de Kurzfassung. Die computerassistierte Diagnose (CADx) für die Unterscheidung von Herdbefunden in Mammogrammen hat das Potential, Radiologen bei der Entscheidungsfindung zu unterstützen. Für ein von uns entwickeltes CADx-System haben wir eine Gruppe von neuen Merkmalen entwickelt, die auf einem Ansatz basieren, bei dem die Läsion in Abhängigkeit vom Abstand zum Rand der Segmentierung in verschiedene Regionen aufgeteilt wird. Für jede Region wird der Mittelwert der Grauwertintensität berechnet. Diese Mittelwerte dienen als Merkmal und als Eingabe für die Berechnung weiter Merkmale, welche den Übergang zwischen den einzelnen Regionen und das Verhältnis zwischen den am weitesten entfernten Regionen beschreiben. Auf einer Testdatenbank mit 750 verschiedenen Läsionen erreichte die von einem Genetischen Algorithmus ermittelte optimale Merkmalsmenge auf 8 bit Bildern einen A z-wert von 0,72 und auf 12bit Bildern einen A z-wert von 0,74. Die Ergebnisse zeigen, dass diese einfach zu berechnenden Merkmale gut für die Unterscheidung von benignen und malignen Herdbefunden geeignet sind. 1 Einleitung Die Mammografie ist die aktuell wichtigste, für das Brustkrebs-Screening geeignete Methode und in der Mammadiagnostik unverzichtbar. Leider weist sie bei der Klassifikation von gut- und bösartigen Tumoren eine relative geringe Spezifität auf, sodass von den Patientinnen oftmals als unangenehm empfundene Folgeuntersuchungen durchgeführt werden müssen. Ein Beispiel für eine solche Untersuchung ist die Biopsie, bei der Gewebe zur pathologischen Untersuchung entnommen wird. Studien zeigen, dass nur 20 bis 30 Prozent der Biopsien bösartige Tumore identifizieren [1]. Für die Patientinnen bedeutet dies unnötige und vor allem unangenehme körperliche Eingriffe und für die Krankenkassen unnötige Kosten. Um zur Reduktion von benignen Biopsien beizutragen, haben wir ein computerassistiertes Diagnose (CADx)-System zur automatischen Klassifikation von benignen und malignen Herdbefunden entwickelt. Das System berechnet für eine gegebene Läsion eine Vielzahl von Merkmalen (statistische Merkmale, Form-

72 Wagner & Elter und Texturmerkmale) und ermittelt anhand dieser die Wahrscheinlichkeit für die Bösartigkeit der vorliegenden Läsion. Es werden zudem Merkmale berechnet, die speziell bei Herdbefunden zu beobachtende Eigenschaften beschreiben. Weisen Herdbefunde eine relativ hohe Dichte auf (d.h. sie erscheinen im Bild relativ hell), ist dies ein Indiz für einen malignen Befund. Transparenz ist hingegen eher ein Indikator für Gutartigkeit. Ein weiteres wichtiges Merkmal zur Charakterisierung ist die Umrandungsschärfe. Benigne Herdbefunde grenzen sich zumeist gut vom umgebenden Gewebe ab. Im Gegensatz dazu ist zu beobachten, dass maligne Läsionen oftmals fließend in das umgebende Gewebe übergehen. In dieser Arbeit wollen wir eine neue Gruppe von Merkmalen vorstellen, welche die Helligkeitsverteilung vom Zentrum des Tumors bis hin zum Rand beschreiben. Die Merkmalsgruppe ist in der Lage, die Dichte innerhalb des Tumors sowie den Übergang in das umgebende Gewebe zu beschreiben. Varela et al. berechneten in [2] spezielle Merkmale für drei verschiedene Regionen des Herdbefundes. Unter anderem wurden Merkmale implementiert, die den Kontrast und die Umrandungsschärfe des Tumors charakterisieren. Die Klassifikationsleistung wurde anhand eines Datensatzes mit 981 Mammogrammen überprüft. Für jede Region wurde die optimale Merkmalskombination bestimmt. Die ROC-Analyse ergab für die innere Region einen A z -Wert von 0.69, für die Randregion einen A z -Wert von 0.76 und für die äußere einen A z -Wert von 0.75. Die Kombination der Merkmale aller Regionen ergab einen A z -Wert von 0.81. Rangayyan et al. [3] präsentierten Merkmale, welche die Umrandungsschärfe und die Form von Herdbefunden beschreiben. Die Umrandungsschärfe eines Tumors wurde durch paarweise Pixeldifferenzen entlang der Normalen der Konturpixel charakterisiert. Auf einem Datensatz mit 54 Mammogrammen erzielte die beste Merkmalskombination bei der Klassifikation zwischen benignen und malignen Herdbefunden eine Genauigkeit von 94.4 Prozent. Das Merkmal zur Charakterisierung der Umrandungsschärfe zeichnete sich mit einer Genauigkeit von 92.6 Prozent als bestes Einzelmerkmal aus. In [4] wurden Merkmale vorgestellt, die auf Grundlage eines polygonalen Modells der Kontur des Tumors berechnet werden. Nachdem der Rand des Herdbefundes als ein n-seitiges Vieleck modelliert wurde, berechnete man darauf Merkmale, welche die Konvexität bzw. Konkavität, die Wahrscheinlichkeit der Spikuliertheit und die Kompaktheit charakterisieren. Die Klassifikationsleistung aller Merkmale wurde auf einem Datensatz mit 54 Mammogrammen getestet. Das Merkmal für die Spikuliertheit eines Tumors wies den besten A z -Wert von 0.82 auf. Die Merkmale für die Konvexität und Kompaktheit lieferten A z -Werte von 0.75 bzw. 0.76. Die Kombination der drei Merkmale ergab einen A z -Wert von 0.79. Der Rest der Arbeit ist wie folgt gegliedert: In Kap. 2 stellen wir die für die Evaluierung verwendete Mammografie-Datenbank vor und beschreiben den Ablauf der Experimente sowie den Ansatz für die neue Merkmalsgruppe. Die Ergebnisse unserer Experimente werden in Kap. 3 vorgestellt und in Kap. 4 diskutiert.

Klassifikation von Herdbefunden 73 2 Material und Methoden Für die Auswertungen in dieser Arbeit wurde die öffentlich zugängliche Digital Database for Screening Mammography (DDSM) verwendet [5]. Berücksichtigt wurden alle Mammogramme von Fällen, die durch einen Lumisys Laserscanner digitalisiert wurden und mindestens einen Biopsie-geprüften Herdbefund enthielten. Für jeden Fall existiert eine Datei, welche die Annotation und die Grundwahrheit enthält. Für jedes Mammogramm ist eine manuell markierte Region von Interesse (ROI) gegeben, welche den Herdbefund enthält. Diese ROI wurde von einem Experten definiert, dient zur Lokalisation und als Eingabe für unser semi-automatischen Segmentierungsverfahren. Bilder die Artefakte oder Herdbefunde, die zu nah am Rand liegen enthalten, wurden ausgeschlossen, da unser Segmentierungsverfahren diese Fälle nicht behandeln kann. Letztendlich enthielt unsere Testdatenbank 750 Regionen (387 maligne und 363 benigne) von insgesamt 423 Patienten. Alle Bilder wurden mit einer Farbtiefe von 12 bit und einer Auflösung von 50 µm digitalisiert. Die Grundidee des neu entwickelten Merkmalsextraktors ist die Beschreibung des Herdbefundes durch eine Vielzahl von konzentrischen Regionen, die in Abhängigkeit vom Abstand zu seinem Rand bzw. zum Rand der Segmentierung definiert werden. Um auch das umgebende Gewebe beschreiben zu können, wird die Segmentierung des Tumors in Abhängigkeit von der kleinsten Achse nach außen vergrößert. Durch die Anwendung der Chamfer-Abstands-Transformation (Details in [6]) auf die Segmentierung erhalten wir von jedem Pixel innerhalb der Segmentierung des Tumors den Abstand zur äußeren Begrenzung. Abhängig vom maximal berechneten Abstand dist Max teilen wir den Tumor in k konzentrische Regionen R auf. Jede Region R i enthält alle Pixel p(x,y) für die gilt ( ) ( ) maxvalue maxvalue i dist(p(x,y)) < (i+1) +1 (1) k k wobei dist(p(x,y)) den Abstand des Pixels p(x,y) zum Rand des Tumors bezeichnet. Für die k ermittelten Regionen werden dann die Grauwerthistogramme H R bestimmt und daraus der Mittelwert wie folgt berechnet Mean i = 1/ H Ri H Ri (j)j, i = 0,...,k 1 (2) H Ri bezeichnet die Anzahl der Pixel in der Region i, N bezeichnet die Anzahl der Grauwerte und H Ri (j) steht für die Anzahl der Pixel mit dem Grauwert j in der Region i. Die k Mittelwerte der Regionen werden als Merkmale verwendet. Zusätzlich wird daraus ein Merkmal abgeleitet, welches die durchschnittliche Intensitätsveränderung zwischen den einzelnen Regionen charakterisiert k 1 IntensityChange = 1/(k 1) Mean i Mean i 1 (3) i=1

74 Wagner & Elter Tabelle 1. Klassifikationsleistung (A z) der vorgestellten Merkmale für k = 10. Merkmal 8 bit 12 bit Mean 0 0,51 0,54 Mean 1 0,54 0,54 Mean 2 0,55 0,59 Mean 3 0,53 0,54 Mean 4 0,57 0,59 Mean 5 0,58 0,61 Mean 6 0,61 0,65 Mean 7 0,61 0,64 Merkmal 8 bit 12 bit Mean 8 0,59 0,63 Mean 9 0,64 0,66 IntensityChange 0,62 0,63 MaxRatio 1 0,58 0,55 MaxRatio 2 0,59 0,56 HistoDiff 1 0,63 0,63 HistoDiff 2 0,63 0,62 Um den Kontrast des Tumors im Vergleich zum umgebenden Gewebe und damit auch die Umrandungsschärfe zu beschreiben, wurden die vier folgenden Merkmale konzipiert MaxRatio 1 = Mean k 1 /Mean 0 (4) MaxRatio 2 = (Mean k 1 +Mean k 2 )/(Mean 0 +Mean 1 ) (5) HistoDiff 1 = HistoDiff 2 = HR0 (j)/ H R0 H Rk 1 (j)/ HRk 1 (6) (H R0 (j)/ H R0 +H R1 (j)/ H R1 ) (H Rk 1 (j)/ HRk 1 +HRk 2 (j)/ (7) HRk 2 ) Somit werden insgesamt k + 5 Merkmale berechnet, welche die Intensitätsverteilung innerhalb und außerhalb des Tumors sowie den Übergang in das umgebende Gewebe beschreiben. 3 Ergebnisse Die Klassifikationsleistung der einzelnen Merkmale wurde durch die leave-oneout -Validation und receiver operating characteristic (ROC)-Analyse ausgewertet. Die Fläche unter der ROC-Kurve A z wurde als Referenz verwendet. Ein k-nächste Nachbarn (knn)-klassifikator wurde für den Klassifikationvorgang verwendet. Die vorgestellten Merkmale wurden sowohl für die 12 bit als auch für auf 8bit herunter gerechnete Bilder für k = 10 berechnet. Um die gemeinsame Klassifikationsleistung aller Merkmale zu beschreiben, wurde durch einen genetischen Algorithmus eine möglichst optimale Merkmalsmenge ermittelt (sowohl für die 12bit als auch für die 8bit Merkmale). Tabelle 1 zeigt die Klassifikationsleistungen für jedes einzelne Merkmal. Die A z -Werte der jeweils in der optimalen Merkmalsmenge enthaltenen Merkmale

Klassifikation von Herdbefunden 75 sind fett markiert. Für die auf 8 bit Bildern berechneten Merkmale erhält man eine optimale Gesamtklassifikationsleistung von 0,72 und für die auf 12 bit Bildern berechneten Merkmale einen A z -Wert von 0,74. 4 Diskussion Die in Tab. 1 dargestellten Ergebnisse zeigen, dass jedes einzelne Merkmal für die Unterscheidung von benignen und malignen Herdbefunden geeignet ist. Bei den einfachen Mittelwerten der Regionen (Mean 0 bis Mean 9 ) fällt auf, dass mit größerer Entfernung zum Rand der Segmentierung die Klassifikationsleistung steigt. Dies zeigt, dass die Grauwertintensität und somit auch die Dichte im Zentrum des Tumors charakteristischer für die Unterscheidung von gut- und bösartigen Läsionen ist als in den äußeren Bereichen. Außerdem ist zu beobachten, dass diese Merkmale, auf 12 bit Bildern berechnet, zu besseren Ergebnissen führen als das jeweilige, auf 8 bit Bildern berechnete Pendant. Somit spiegelt sich hier der Informationsverlust zwischen 12 bit und 8 bit in den Klassifikationsleistungen der einzelnen Merkmale wider. Wir haben die Läsion in Abhängigkeit vom Abstand zum Rand der Segmentierung in verschiedene Regionen aufgeteilt und für jede Region den Mittelwert der Grauwertintensität berechnet. Diese Mittelwerte dienten als Merkmal und als Eingabe für die Berechnung weiterer Merkmale, welche den Übergang zwischen den einzelnen Regionen und das Verhältnis der am weitesten entfernten Regionen beschreiben. Die von einem Genetischen Algorithmus ermittelte optimale Merkmalsmenge erreichte auf 8 bit Bildern einen A z -Wert von 0,72 bzw. einen A z -Wert von 0,74 auf 12bit Bildern berechnet. Die Ergebnisse zeigen, dass diese einfach zu berechnenden Merkmale gut für die Unterscheidung von benignen und malignen Herdbefunden geeignet sind. Es ist denkbar, dass eine Erweiterung der Merkmale, z.b. durch die Varianz der Grauwertverteilung in den einzelnen Regionen, zu einer Verbesserung der Gesamtklassifikationsleistung führen kann. Literaturverzeichnis 1. Kopans DB. The positive predictive value of mammography. AJR Am J Roentgenol. 1992;158(3):521 6. 2. Varela C, Timp S, Karssemeijer N. Use of border information in the classification of mammographic masses. Phys Med Biol. 2006;51(2):425 41. 3. Rangayyan RM, El-Faramawy NM, Desautels JE, et al. Measures of acutance and shape for classification of breast tumors. IEEE Trans Med Imaging. 1997;16(6):799 810. 4. Rangayyan RM, Mudigonda NR, Desautels JE. Boundary modelling and shape analysis methods for classification of mammographic masses. Med Biol Eng Comput. 2000;38(5):487 96. 5. Heath M, Bowyer K, Kopans D, et al. The digital database for screening mammography. In: Proc Int Works Digital Mammogr; 2001. p. 212 8. 6. Butt MA, Maragos P. Optimum design of chamfer distance transforms. IEEE Trans Image Process. 1998;7:1477 84.