Skip to main content
European Commission logo
español español
CORDIS - Resultados de investigaciones de la UE
CORDIS
CORDIS Web 30th anniversary CORDIS Web 30th anniversary

Machine learning prediction for breast cancer therapy

Article Category

Article available in the following languages:

Algoritmos de aprendizaje automático emparejan tumores con tratamientos

Mediante la combinación de datos de la Unión Europea y los Estados Unidos, el proyecto PredAlgoBC ha identificado nuevos biomarcadores de los tumores del cáncer de mama. Estos podrían llegar a utilizarse para determinar nuevas opciones de tratamiento personalizado.

Los oncólogos e investigadores sobre el cáncer se inclinan cada vez más por reemplazar los tratamientos estándar por otros específicos para los pacientes individuales y que tengan en cuenta la heterogeneidad de la enfermedad. En el caso del cáncer de mama, el hecho de que el personal clínico no disponga de información suficiente sobre las características del tumor específico de los pacientes da lugar en ocasiones a recidivas en forma de cáncer metastatizante. Pese a que los tratamientos de primera línea para el cáncer de mama permiten tratar con éxito a aproximadamente el 90 % de los pacientes, la tasa de supervivencia se reduce hasta el 27 % en el caso del cáncer metastatizante. Para solucionar este problema, los expertos han creado enormes bases de datos que emparejan determinadas características tumorales (biomarcadores potenciales) con respuestas al tratamiento específicas en los pacientes. Sin embargo, su labor no ha hecho más que empezar, dado que hasta el momento tan solo se han encontrado unas cuantas firmas de biomarcadores. «Esto es lo que conocemos como la “maldición de la dimensionalidad”», explica Agnes Basseville, investigadora del Instituto Oncológico del Oeste (ICO, por sus siglas en francés) de Francia y coordinadora del proyecto PredAlgoBC (Machine learning prediction for breast cancer therapy). Esta investigación se llevó a cabo con el apoyo de las Acciones Marie Skłodowska-Curie. «Actualmente, contamos con un número demasiado elevado de características medidas para un número insuficiente de pacientes, y los algoritmos de aprendizaje automático que usamos para analizar los datos de biomarcadores no ofrecen unos resultados buenos en este contexto». El proyecto PredAlgoBC busca cubrir esta brecha mediante la combinación de diversos métodos matemáticos con un profundo análisis biológico. Con este trabajo, Basseville espera garantizar que la información proporcionada por el algoritmo pueda utilizarse en la práctica clínica. «Construimos el proyecto principalmente en torno a dos bases de datos públicas: GEO (estadounidense) y ENA (europea). Hemos recopilado datos de más de cuatro mil pacientes con cáncer de mama, así como información de seguimiento asociada. Al combinar los dos conjuntos de datos, obtenemos una potencia estadística suficiente para proporcionar una amplia visión general sobre la complejidad tumoral, pese a que algunos de los datos que queremos recopilar, especialmente los de secuenciación del ARN, solamente están disponibles previa solicitud y tras un período de seis meses para la evaluación de dicha solicitud. Debido a las limitaciones temporales, decidimos no usarlos».

Un gran avance en hormonoterapia

El conjunto de datos recopilado se dividió en dos partes. Utilizamos la primera para enseñar al algoritmo a predecir mejor el desenlace del tratamiento y, a continuación, usamos la segunda para comprobar el rendimiento de la predicción realizada por el modelo del proyecto. «De este modo, podemos comparar las predicciones del modelo con la respuesta conocida y determinar si nuestros modelos ofrecen o no unos buenos resultados», explica Basseville. Para cada modelo, se ordenaron las variables de acuerdo con su importancia en la predicción global. Las variables con una mejor clasificación son aquellas que pueden probarse como posibles biomarcadores. Pese a que las predicciones todavía no son lo suficientemente buenas como para usarlas en la práctica clínica, la clasificación variable ha permitido al equipo identificar actores del desarrollo neuronal como componentes tumorales clave que se asocian con una mala respuesta a la hormonoterapia. Esto supone un gran avance, dado que hasta ahora no se había podido identificar formalmente este vínculo. Otro resultado del proyecto es la aplicación de un algoritmo de aprendizaje profundo para crear cohortes de pacientes virtuales. Estas resultan especialmente útiles porque permiten compartir datos a nivel del paciente sin revelar ningún dato sobre los sujetos reales. Por último, los nuevos biomarcadores encontrados por el proyecto se presentarán próximamente en un artículo sometido a revisión por expertos. Basseville y su equipo seguirán trabajando en la recopilación de nuevos conjuntos de datos que permitirán validar todavía más estos biomarcadores. «El siguiente paso consistirá en definir la mejor manera de evaluar estos componentes en la práctica clínica, usando las herramientas del ICO para realizar de forma rutinaria la prueba mediante ensayos, como una PCR o un análisis de inmunohistoquímica. Una vez que hayamos seleccionado el mejor ensayo, tendremos que realizar un análisis retrospectivo de pacientes en el ICO para validar nuestros nuevos marcadores y confirmar en qué medida resultan útiles para decidir qué pacientes deberían recibir hormonoterapia», señala Basseville. Se espera que este proceso, el cual se combinará con una investigación sobre la mejor manera de utilizar los nuevos biomarcadores como una diana terapéutica novedosa, se prolongue durante varios años.

Palabras clave

PredAlgoBC, cáncer de mama, algoritmo, biomarcadores, recidiva, predicciones, tratamiento

Descubra otros artículos del mismo campo de aplicación