Aprendizaje profundo basado en análisis de supervivencia para datos de supervivencia de alta dimensionalidad
Autores: Hao, Lin; Kim, Juncheol; Kwon, Sookhee; Ha, Il Do
Idioma: Inglés
Editor: MDPI
Año: 2021
Acceso abierto
Artículo científico
2021
Aprendizaje profundo basado en análisis de supervivencia para datos de supervivencia de alta dimensionalidad
Categoría
Matemáticas
Subcategoría
Matemáticas generales
Palabras clave
Desarrollo
Tecnologías de alto rendimiento
Datos genómicos
Algoritmos de aprendizaje automático
Red neuronal profunda de múltiples capas
Modelo de predicción de supervivencia
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 37
Citaciones: Sin citaciones
Con el desarrollo de tecnologías de alto rendimiento, se están generando cada vez más datos genómicos de alta dimensión o ultra alta dimensión. Por lo tanto, analizar de manera efectiva estos datos se ha convertido en un desafío significativo. Los algoritmos de aprendizaje automático (ML) se han aplicado ampliamente para modelar interacciones no lineales y complicadas en una variedad de campos prácticos como los datos de supervivencia de alta dimensión. Recientemente, los modelos de redes neuronales profundas de varias capas (DNN) han logrado logros notables. Por lo tanto, se desarrolló un modelo de predicción de supervivencia basado en DNN (modelo DNNSurv), que se construyó con Keras y TensorFlow. Sin embargo, sus resultados solo se evaluaron en conjuntos de datos de supervivencia con alta dimensión o tamaños de muestra grandes. En este artículo, evaluamos el rendimiento de predicción del modelo DNNSurv utilizando conjuntos de datos de supervivencia de ultra alta dimensión y alta dimensión y lo comparamos con tres modelos de predicción de supervivencia de ML populares (es decir, bosque de supervivencia aleatorio y los modelos LASSO y Ridge basados en Cox). Para este propósito, también presentamos la configuración óptima de varios hiperparámetros, incluida la selección de un parámetro de ajuste. El método propuesto demostró a través del análisis de datos que el modelo DNNSurv tuvo un buen desempeño en general en comparación con los modelos de ML, en términos de las tres principales medidas de evaluación (es decir, índice de concordancia, puntaje de Brier dependiente del tiempo y el AUC dependiente del tiempo) para el rendimiento de predicción de supervivencia.
Descripción
Con el desarrollo de tecnologías de alto rendimiento, se están generando cada vez más datos genómicos de alta dimensión o ultra alta dimensión. Por lo tanto, analizar de manera efectiva estos datos se ha convertido en un desafío significativo. Los algoritmos de aprendizaje automático (ML) se han aplicado ampliamente para modelar interacciones no lineales y complicadas en una variedad de campos prácticos como los datos de supervivencia de alta dimensión. Recientemente, los modelos de redes neuronales profundas de varias capas (DNN) han logrado logros notables. Por lo tanto, se desarrolló un modelo de predicción de supervivencia basado en DNN (modelo DNNSurv), que se construyó con Keras y TensorFlow. Sin embargo, sus resultados solo se evaluaron en conjuntos de datos de supervivencia con alta dimensión o tamaños de muestra grandes. En este artículo, evaluamos el rendimiento de predicción del modelo DNNSurv utilizando conjuntos de datos de supervivencia de ultra alta dimensión y alta dimensión y lo comparamos con tres modelos de predicción de supervivencia de ML populares (es decir, bosque de supervivencia aleatorio y los modelos LASSO y Ridge basados en Cox). Para este propósito, también presentamos la configuración óptima de varios hiperparámetros, incluida la selección de un parámetro de ajuste. El método propuesto demostró a través del análisis de datos que el modelo DNNSurv tuvo un buen desempeño en general en comparación con los modelos de ML, en términos de las tres principales medidas de evaluación (es decir, índice de concordancia, puntaje de Brier dependiente del tiempo y el AUC dependiente del tiempo) para el rendimiento de predicción de supervivencia.