Un modelo basado en mamografía de aprendizaje profundo para una mejor predicción del riesgo de cáncer de mama

Ronald Palacios Castrillo

Sinopsis

Yala A., et al. .(Un modelo basado en mamografía de aprendizaje profundo para una mejor predicción del riesgo de cáncer de mama. Radiología. doi.org/10.1148/radiol.2019182716), desarrollaron un modelo de aprendizaje profundo que utiliza mamografías de campo completo y factores de riesgo tradicionales, y descubrieron que su modelo era más preciso que el modelo Tyrer-Cusick (versión 8), un estándar clínico actual.



Puntos clave

■ Un modelo mamográfico basado en aprendizaje profundo (DL) identificó a las mujeres con alto riesgo de cáncer de mama y colocó al 31 % de todas las pacientes con cáncer de mama futuro en el decil de riesgo superior, en comparación con solo el 18 % del modelo Tyrer-Cuzick (versión 8).

=> Recibir por Whatsapp las noticias destacadas

■ El  modelo híbrido DL de Yala y colegas  [Un modelo basado en mamografía de aprendizaje profundo para una mejor predicción del riesgo de cáncer de mama. Radiología. doi.org/10.1148/radiol.2019182716.], es igualmente preciso para mujeres blancas y afroamericanas (área bajo la curva característica operativa del receptor [AUC], 0,71 para ambas etnias), mientras que el AUC del modelo Tyrer-Cuzick fue de 0,62 y 0,45 para mujeres blancas y afroamericanas, respectivamente; la mejora del AUC fue significativa para las mujeres blancas (P < 0,001) y afroamericanas (P < 0,01).

  • Cuando se comparó su modelo híbrido DL con la densidad mamaria, los investigadores descubrieron que las pacientes con mamas no densas y riesgo alto evaluado por el modelo tenían 3,9 veces más incidencia de cáncer que las pacientes con mamas densas y riesgo bajo evaluado por el modelo.

 

Resumen

La densidad mamográfica mejora la precisión de los modelos de riesgo de cáncer de mama. Sin embargo, el uso de la densidad mamaria está limitado por la evaluación subjetiva, la variación entre radiólogos y los datos restringidos. Un modelo de aprendizaje profundo (DL) basado en mamografía puede proporcionar una predicción del riesgo más precisa.

Objetivo

Desarrollar un modelo de riesgo de cáncer de mama de DL basado en mamografía que sea más preciso que los modelos de riesgo de cáncer de mama clínicos establecidos.

Materiales y métodos

Este estudio retrospectivo incluyó 88 994 mamografías de detección consecutivas en 39 571 mujeres entre el 1 de enero de 2009 y el 31 de diciembre de 2012. Para cada paciente, todos los exámenes se asignaron a conjuntos de entrenamiento, validación o prueba, lo que dio como resultado 71 689, 8554 y 8751 exámenes, respectivamente.

Los resultados del cáncer se obtuvieron a través de la vinculación con un registro regional de tumores. Utilizando información sobre factores de riesgo de cuestionarios de pacientes y revisión de registros médicos electrónicos, se desarrollaron tres modelos para evaluar el riesgo de cáncer de mama en un plazo de 5 años: un modelo de regresión logística basado en factores de riesgo (RF-LR) que utilizó factores de riesgo tradicionales, un modelo DL (DL solo con imágenes) que utilizó solo mamografías y un modelo DL híbrido que utilizó tanto factores de riesgo tradicionales como mamografías.

Se realizaron comparaciones con un modelo de riesgo de cáncer de mama establecido que incluía la densidad mamaria (modelo Tyrer-Cuzick, versión 8 [TC]). El rendimiento del modelo se comparó utilizando áreas bajo la curva característica operativa del receptor (AUC) con la prueba DeLong (P < .05).

Resultados

El conjunto de prueba incluyó 3937 mujeres, de 56,20 años ± 10,04. La DL híbrida y la DL solo con imágenes mostraron AUC de 0,70 (intervalo de confianza [IC] del 95 %: 0,66, 0,75) y 0,68 (IC del 95 %: 0,64, 0,73), respectivamente. La RF-LR y la TC mostraron AUC de 0,67 (IC del 95 %: 0,62, 0,72) y 0,62 (IC del 95 %: 0,57, 0,66), respectivamente. La DL híbrida mostró un AUC significativamente mayor (0,70) que la TC (0,62; P < 0,001) y la RF-LR (0,67; P = 0,01).

En Detalle

Desde la creación del modelo de Gail en 1989 , los modelos de riesgo han respaldado la detección y la prevención ajustadas al riesgo y su evolución continua ha sido un pilar central de la investigación sobre el cáncer de mama.

Investigaciones anteriores  exploraron múltiples factores de riesgo relacionados con la información hormonal y genética. La densidad mamaria mamográfica, que se relaciona con la cantidad de tejido fibroglandular en la mama de una mujer, es un factor de riesgo que recibió una atención sustancial.

Brentnall et al incorporaron la densidad mamaria mamográfica al modelo de riesgo de Gail y al modelo Tyrer-Cuzick (TC), mejorando sus áreas bajo la curva característica operativa del receptor (AUC) de 0,55 y 0,57 a 0,59 y 0,61, respectivamente.

El uso de la densidad mamaria como un indicador de la información detallada incorporada en la mamografía es limitado porque la evaluación de la densidad mamaria es una evaluación subjetiva y varía ampliamente entre radiólogos , y la densidad mamaria resume la información contenida en las imágenes digitales en un solo valor.

Pacientes de la misma edad a las que se les asigna la misma puntuación de densidad pueden tener mamografías drásticamente diferentes con resultados muy diferentes.

Mientras que estudios anteriores exploraron métodos automatizados para evaluar la densidad mamaria, estos esfuerzos redujeron la entrada mamográfica a unas pocas estadísticas relacionadas en gran medida con el volumen de tejido glandular que no son suficientes para distinguir a las pacientes que desarrollarán cáncer de mama y las que no.

Los autores se plantearon la hipótesis de que existen señales sutiles pero informativas en las mamografías que pueden no ser discernibles por humanos o simples mediciones de volumen de densidad, y el aprendizaje profundo (DL) puede aprovechar estas señales para producir modelos de riesgo mejorados.

Por lo tanto, Yala, et.al.,desarrollaron un modelo DL que opera sobre una imagen mamográfica de campo completo para evaluar el riesgo futuro de cáncer de mama de una paciente.

En lugar de identificar manualmente patrones de imagen discriminativos, confiaron en su modelo de aprendizaje automático para descubrir estos patrones directamente a partir de los datos.

Específicamente, su modelo se proporciona con mamografías de campo completo y el resultado de interés, es decir, si la paciente desarrolló o no cáncer de mama dentro de los 5 años a partir de la fecha del examen.

Además de su modelo basado únicamente en imágenes, desarrollaron dos modelos adicionales en la misma cohorte: un modelo de regresión logística que opera sobre la base de factores de riesgo tradicionales y que proporciona una línea de base sólida para nuestra población, y un modelo híbrido que opera tanto con la mamografía de campo completo como con los factores de riesgo tradicionales. Compararon los tres con TC, un modelo de riesgo popular que incluye la densidad mamaria y se utiliza de manera rutinaria en la práctica clínica.

Yala y colegas ,desarrollaron un modelo de aprendizaje profundo (DL) (DL híbrido) que utilizó mamografías de campo completo además de la información tradicional de los factores de riesgo para evaluar el riesgo de cáncer de mama.

El DL híbrido fue significativamente más preciso que el modelo Tyrer-Cuzick (TC), un modelo utilizado en la práctica clínica (área bajo la curva característica operativa del receptor [AUC], 0,70 frente a 0,62, respectivamente).

Esta AUC mejorada indicó que el DL híbrido fue mejor para identificar cohortes de alto riesgo: el DL híbrido colocó al 31,2 % (84 de 269) de los pacientes con cáncer dentro del decil de riesgo superior frente al TC, que colocó al 18,2 % (49 de 269) de los pacientes con cáncer dentro del decil de riesgo superior.

La mayoría de los modelos de riesgo existentes se desarrollaron en poblaciones predominantemente blancas  y tienen limitaciones conocidas para predecir el riesgo de otros grupos étnicos.

El modelo de DL híbrido superó al TC tanto en poblaciones blancas como afroamericanas; Esta brecha de desempeño fue especialmente pronunciada para las mujeres afroamericanas, en quienes la TC obtuvo un AUC que fue menor que la de la DL híbrida (AUC, 0,45 frente a 0,71, respectivamente).

Además, la DL híbrida fue más precisa que la TC en otros subgrupos (por ejemplo, mujeres con antecedentes familiares de cáncer de mama o de ovario y mujeres posmenopáusicas). Descubrieron que en los casos en los que la DL híbrida no estaba de acuerdo con la TC sobre el riesgo de una paciente, la DL híbrida fue más precisa.

Mientras que la DL híbrida fue el mejor modelo en general, su modelo de DL basado únicamente en mamografías (es decir, DL solo con imágenes) también superó a la TC y proporcionó una evaluación precisa del riesgo cuando no estaba disponible la información tradicional sobre los factores de riesgo.

Esto puede ser especialmente beneficioso para las pacientes que no conocen sus antecedentes familiares de cáncer de mama o de ovario.

Además, la evaluación del riesgo de la DL solo con imágenes podría implementarse rápidamente en los programas de detección mediante imágenes mamarias, y el riesgo de la paciente se evaluaría automáticamente a partir de la mamografía únicamente.

Con la legislación actual sobre densidad mamaria en 37 estados de EE. UU., a casi la mitad de las mujeres que se someten a pruebas de detección se les dice que tienen un mayor riesgo de cáncer de mama debido a su tejido mamario denso. Aunque sea bien intencionado, compartir el tejido mamario denso como indicador de un mayor riesgo puede llevar a muchas mujeres a creer, comprensiblemente, que tienen un riesgo alto.

Al mismo tiempo, esta práctica puede inducir a error a las mujeres que no tienen tejido mamario denso y hacerlas creer que no tienen un mayor riesgo de cáncer de mama.

La DL solo con imágenes proporcionaría información más precisa para ayudar a fundamentar las decisiones sobre imágenes complementarias y estrategias de prevención a nivel individual. En los centros equipados para recopilar información adicional sobre las pacientes, se podría utilizar el modelo de riesgo de DL híbrido.

Los resultados de Yala y colegas demostraron que las imágenes de campo completo y los factores de riesgo tradicionales contienen información complementaria, como lo ilustra la mejora del AUC de la DL híbrida en comparación con la DL solo con imágenes y un modelo de regresión logística que utilizó solo información de factores de riesgo tradicionales.

En trabajos futuros, los autores piensan explorar qué factores de riesgo están incluidos en la imagen y cuáles son complementarios. Debido a que el DL híbrido incorporó información de fuentes heterogéneas, también se espera que este enfoque pueda ampliarse para incorporar otras fuentes ricas de información, como grandes paneles de genes.

Será importante investigar en qué tipo de patrones de imágenes se basa la DL híbrida para predecir el riesgo de cáncer. Cuando se observa la mamografía de los casos en los que la DL híbrida y la TC no estaban de acuerdo sobre el riesgo de una paciente,se  descubrió que el modelo no se basaba en una simple medición de densidad para determinar el.

Se   especula que el modelo puede basarse en diferentes patrones de tejido de grano fino y orientaciones relativas de esos patrones según los patrones globales en la mama de una paciente, y que existen patrones distintivos tanto para mujeres con mamas densas como no densas.

Si bien existen métodos  para obtener mapas de prominencia a nivel de instancia (es decir, una explicación específica para una mamografía individual), se requerirá más trabajo para obtener los patrones que sean más informativos en todo el conjunto de prueba.

El estudio tuvo limitaciones. Se usaron  datos de pacientes de una única institución académica terciaria y mamografías capturadas mediante un único proveedor (Hologic). Además, a algunas pacientes les faltaba información sobre los factores de riesgo, aunque esta limitación es común tanto en la práctica clínica como en estudios previos .

En conclusión, un modelo de aprendizaje profundo (DL) que aprovecha directamente las mamografías de campo completo además de los factores de riesgo tradicionales supera al modelo Tyrer-Cuzick (versión 8) por un amplio margen; esta mejora es consistente en todos los subgrupos demográficos.

Estos resultados respaldan la hipótesis de que la mamografía contiene indicadores informativos de riesgo que no capturan los factores de riesgo tradicionales, y los modelos de DL pueden deducir estos patrones a partir de los datos.

Estos modelos tienen el potencial de reemplazar a los modelos convencionales de predicción de riesgos. Se requieren más investigaciones para validar este modelo en todas las instituciones y proveedores antes de que pueda implementarse ampliamente y, con este fin, los investigadores han puesto su modelo entrenado y el código a disposición para la investigación (learningtocure.csail.mit.edu).

Figura 5b: Incidencias de cáncer divididas por el modelo de evaluación de riesgo de Tyrer-Cuzick (TCv8) y la evaluación de riesgo de aprendizaje profundo (DL) híbrido. (a) Cada mosaico muestra el porcentaje y los numeradores/denominadores de mujeres con exámenes dentro de un rango de riesgo específico que desarrollaron cáncer dentro de los 5 años. (b) Ejemplos de exámenes de detección, seleccionados aleatoriamente de todos los exámenes en ese grupo.