Aplicación de Modelos de Aprendizaje Automático para el Pronóstico de Supervivencia en Estudios de Cáncer de Mama
Autores: Mihaylov, Iliyan; Nisheva, Maria; Vassilev, Dimitar
Idioma: Inglés
Editor: MDPI
Año: 2019
Acceso abierto
Artículo científico
2019
Aplicación de Modelos de Aprendizaje Automático para el Pronóstico de Supervivencia en Estudios de Cáncer de Mama
Categoría
Gestión y administración
Subcategoría
Gestión de la tecnología y la inovación
Palabras clave
Aplicación
Modelos de aprendizaje automático
Predicción
Tiempo de supervivencia
Cáncer de mama
Regresión
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
La aplicación de modelos de aprendizaje automático para la predicción y el pronóstico del desarrollo de enfermedades se ha convertido en una parte irrevocable de los estudios sobre el cáncer, con el objetivo de mejorar la terapia y el manejo posterior de los pacientes. La aplicación de modelos de aprendizaje automático para la predicción precisa del tiempo de supervivencia en el cáncer de mama, basada en datos clínicos, es el principal objetivo del estudio presentado. El artículo discute un enfoque al problema en el que el principal factor utilizado para predecir el tiempo de supervivencia es la característica clínica integrada del tumor, desarrollada originalmente, que combina el estadio del tumor, el tamaño del tumor y la edad al diagnóstico. Dos conjuntos de datos de estudios correspondientes sobre el cáncer de mama se unen aplicando un enfoque de integración de datos basado en la integración horizontal y vertical mediante el uso de bases de datos orientadas a documentos y bases de datos de grafos adecuadas, que muestran un buen rendimiento y sin pérdidas de datos. Aparte de la normalización y clasificación de datos, los métodos de aprendizaje automático aplicados proporcionan resultados prometedores en términos de precisión en la predicción del tiempo de supervivencia. El análisis de nuestros experimentos muestra una ventaja de la regresión lineal de soporte vectorial, la regresión Lasso, la regresión de Kernel Ridge, la regresión de K-vecinos y la regresión de árbol de decisión; estos modelos logran los resultados de pronóstico de supervivencia más precisos. La validación cruzada para la precisión demuestra el mejor rendimiento de los mismos modelos en los datos estudiados sobre el cáncer de mama. Como apoyo para el enfoque propuesto, se ha desarrollado un flujo de trabajo basado en Python y finalmente se discuten los planes para su mejora futura en el artículo.
Descripción
La aplicación de modelos de aprendizaje automático para la predicción y el pronóstico del desarrollo de enfermedades se ha convertido en una parte irrevocable de los estudios sobre el cáncer, con el objetivo de mejorar la terapia y el manejo posterior de los pacientes. La aplicación de modelos de aprendizaje automático para la predicción precisa del tiempo de supervivencia en el cáncer de mama, basada en datos clínicos, es el principal objetivo del estudio presentado. El artículo discute un enfoque al problema en el que el principal factor utilizado para predecir el tiempo de supervivencia es la característica clínica integrada del tumor, desarrollada originalmente, que combina el estadio del tumor, el tamaño del tumor y la edad al diagnóstico. Dos conjuntos de datos de estudios correspondientes sobre el cáncer de mama se unen aplicando un enfoque de integración de datos basado en la integración horizontal y vertical mediante el uso de bases de datos orientadas a documentos y bases de datos de grafos adecuadas, que muestran un buen rendimiento y sin pérdidas de datos. Aparte de la normalización y clasificación de datos, los métodos de aprendizaje automático aplicados proporcionan resultados prometedores en términos de precisión en la predicción del tiempo de supervivencia. El análisis de nuestros experimentos muestra una ventaja de la regresión lineal de soporte vectorial, la regresión Lasso, la regresión de Kernel Ridge, la regresión de K-vecinos y la regresión de árbol de decisión; estos modelos logran los resultados de pronóstico de supervivencia más precisos. La validación cruzada para la precisión demuestra el mejor rendimiento de los mismos modelos en los datos estudiados sobre el cáncer de mama. Como apoyo para el enfoque propuesto, se ha desarrollado un flujo de trabajo basado en Python y finalmente se discuten los planes para su mejora futura en el artículo.