logo móvil
Contáctanos

Aumento de Datos con Autoencoders Variacionales Cross-Modal (DACMVA) para la Predicción de Supervivencia en Cáncer

Autores: Rajaram, Sara; Mitchell, Cassie S.

Idioma: Inglés

Editor: MDPI

Año: 2023

Descargar PDF

Acceso abierto

Artículo científico
2023

Aumento de Datos con Autoencoders Variacionales Cross-Modal (DACMVA) para la Predicción de Supervivencia en Cáncer


Categoría

Gestión y administración

Subcategoría

Gestión de la tecnología y la inovación

Palabras clave

Redes generativas antagónicas
Autoencoders variacionales
Aprendizaje profundo
Aumento de datos
Medicina predictiva

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 1

Citaciones: Sin citaciones


Descripción
La capacidad de traducir Redes Generativas Antagónicas (GAN) y Autoencoders Variacionales (VAE) a diferentes modalidades y tipos de datos es esencial para mejorar el Aprendizaje Profundo (DL) en medicina predictiva. Este trabajo presenta DACMVA, un marco novedoso para realizar aumento de datos en un conjunto de datos cruzado-modal al traducir entre modalidades y sobrerrepresentar imputaciones de datos faltantes. DACMVA se inspiró en trabajos anteriores sobre la alineación de espacios latentes en Autoencoders. DACMVA es una tubería de aumento de datos de DL que mejora el rendimiento en una tarea de predicción posterior. El único marco DACMVA aprovecha una pérdida cruzada-modal para mejorar la calidad de la imputación y emplea estrategias de entrenamiento para permitir espacios latentes regularizados. La sobrerrepresentación de datos aumentados se integra en el entrenamiento de predicción. Se demuestra empíricamente que el nuevo marco DACMVA es efectivo en el escenario a menudo descuidado del entrenamiento de DL en datos tabulares con etiquetas continuas. Específicamente, DACMVA se aplica a la predicción de supervivencia del cáncer en datos tabulares de expresión génica donde hay una porción de datos faltantes en una modalidad dada. DACMVA superó significativamente (p << 0.001, prueba de rango con signo de Wilcoxon unilateral) la línea base no aumentada y los métodos de aumento en competencia con diferentes porcentajes de datos faltantes (4%, 90%, 95% faltantes). Como tal, DACMVA proporciona mejoras significativas en el rendimiento, incluso en regímenes de muy pocos datos, sobre los métodos existentes de última generación, incluidos TDImpute y la sobrerrepresentación por sí sola.

Otros recursos que podrían interesarte

Temas Virtualpro