Validación estadística de datos sintéticos para pacientes con cáncer de pulmón generados mediante el uso de redes generativas adversarias
Autores: Gonzalez-Abril, Luis; Angulo, Cecilio; Ortega, Juan Antonio; Lopez-Guerra, José-Luis
Idioma: Inglés
Editor: MDPI
Año: 2022
Acceso abierto
Artículo científico
2022
Validación estadística de datos sintéticos para pacientes con cáncer de pulmón generados mediante el uso de redes generativas adversarias
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Cuidado de la salud
Gemelos digitales
Aprendizaje automático
Datos sintéticos
Redes generativas adversarias
Toma de decisiones estadísticas
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 24
Citaciones: Sin citaciones
El desarrollo de gemelos digitales de pacientes de salud en combinación con tecnologías de aprendizaje automático ayuda a los médicos en la prescripción terapéutica y en procedimientos de intervención mínimamente invasivos. La confidencialidad de los registros médicos o la disponibilidad limitada de datos en muchos ámbitos de la salud son inconvenientes que pueden superarse con la generación de datos sintéticos conformados a datos reales. El uso de redes generativas adversarias (GAN) para la generación de datos sintéticos de pacientes con cáncer de pulmón ha sido previamente introducido como una herramienta para resolver este problema en forma de pacientes sintéticos anonimizados. Sin embargo, los datos sintéticos generados son validados principalmente desde el dominio del aprendizaje automático (funciones de pérdida) o del dominio de expertos (oncólogos). En este documento, proponemos la toma de decisiones estadísticas como una herramienta de validación: ¿Es el modelo lo suficientemente bueno para ser utilizado? ¿El modelo cumple con criterios rigurosos de pruebas de hipótesis? Mostramos para el caso en cuestión cómo las funciones de pérdida y la validación de hipótesis no siempre están bien alineadas.
Descripción
El desarrollo de gemelos digitales de pacientes de salud en combinación con tecnologías de aprendizaje automático ayuda a los médicos en la prescripción terapéutica y en procedimientos de intervención mínimamente invasivos. La confidencialidad de los registros médicos o la disponibilidad limitada de datos en muchos ámbitos de la salud son inconvenientes que pueden superarse con la generación de datos sintéticos conformados a datos reales. El uso de redes generativas adversarias (GAN) para la generación de datos sintéticos de pacientes con cáncer de pulmón ha sido previamente introducido como una herramienta para resolver este problema en forma de pacientes sintéticos anonimizados. Sin embargo, los datos sintéticos generados son validados principalmente desde el dominio del aprendizaje automático (funciones de pérdida) o del dominio de expertos (oncólogos). En este documento, proponemos la toma de decisiones estadísticas como una herramienta de validación: ¿Es el modelo lo suficientemente bueno para ser utilizado? ¿El modelo cumple con criterios rigurosos de pruebas de hipótesis? Mostramos para el caso en cuestión cómo las funciones de pérdida y la validación de hipótesis no siempre están bien alineadas.