Desarrollo Temporal GAN (TD-GAN): Creando Secuencias de Imágenes Más Precisos del Desarrollo Biológico
Autores: Celard, Pedro; Seara Vieira, Adrián; Sorribes-Fdez, José Manuel; Iglesias, Eva Lorenzo; Borrajo, Lourdes
Idioma: Inglés
Editor: MDPI
Año: 2023
Acceso abierto
Artículo científico
2023
Desarrollo Temporal GAN (TD-GAN): Creando Secuencias de Imágenes Más Precisos del Desarrollo Biológico
Categoría
Gestión y administración
Subcategoría
Gestión de la tecnología y la inovación
Palabras clave
Red generativa adversarial de desarrollo temporal
Videos
Aplicaciones biológicas
Médicas
Múltiples discriminadores
Métricas de evaluación
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
En este estudio, proponemos una nueva Red Generativa Antagónica de Desarrollo Temporal (TD-GAN) para la generación y análisis de videos, con un enfoque particular en aplicaciones biológicas y médicas. Inspirado en Progressive Growing GAN (PG-GAN) y Temporal GAN (T-GAN), nuestro enfoque emplea múltiples discriminadores para analizar videos generados en diferentes resoluciones y enfoques. Se introduce un nuevo Discriminador Temporal (TD) que evalúa la coherencia del desarrollo del contenido del video, asegurando que las secuencias de imágenes generadas sigan un orden realista de etapas. La TD-GAN propuesta se evalúa en tres conjuntos de datos: Mold, Yeast y Embryo, cada uno con características únicas. Se utilizan múltiples métricas de evaluación para evaluar de manera integral los videos generados, incluyendo la Distancia de Fréchet Inception (FID), Distancia de Video Frechet (FVD), precisión de clase, precisión de orden y Error Cuadrático Medio (MSE). Los resultados indican que TD-GAN mejora significativamente las puntuaciones de FVD, demostrando su efectividad en la generación de videos más coherentes. Logra puntuaciones competitivas de FID, particularmente al seleccionar el número apropiado de clases para cada conjunto de datos y resolución. Además, TD-GAN mejora la precisión de clase, la precisión de orden y reduce el MSE en comparación con el modelo por defecto, demostrando su capacidad para generar secuencias de video más realistas y coherentes. Además, nuestro análisis de la distribución de etapas en los videos generados muestra que TD-GAN produce videos que se asemejan estrechamente a los conjuntos de datos reales, ofreciendo un potencial prometedor para generar y analizar videos en diferentes dominios, incluyendo biología y medicina.
Descripción
En este estudio, proponemos una nueva Red Generativa Antagónica de Desarrollo Temporal (TD-GAN) para la generación y análisis de videos, con un enfoque particular en aplicaciones biológicas y médicas. Inspirado en Progressive Growing GAN (PG-GAN) y Temporal GAN (T-GAN), nuestro enfoque emplea múltiples discriminadores para analizar videos generados en diferentes resoluciones y enfoques. Se introduce un nuevo Discriminador Temporal (TD) que evalúa la coherencia del desarrollo del contenido del video, asegurando que las secuencias de imágenes generadas sigan un orden realista de etapas. La TD-GAN propuesta se evalúa en tres conjuntos de datos: Mold, Yeast y Embryo, cada uno con características únicas. Se utilizan múltiples métricas de evaluación para evaluar de manera integral los videos generados, incluyendo la Distancia de Fréchet Inception (FID), Distancia de Video Frechet (FVD), precisión de clase, precisión de orden y Error Cuadrático Medio (MSE). Los resultados indican que TD-GAN mejora significativamente las puntuaciones de FVD, demostrando su efectividad en la generación de videos más coherentes. Logra puntuaciones competitivas de FID, particularmente al seleccionar el número apropiado de clases para cada conjunto de datos y resolución. Además, TD-GAN mejora la precisión de clase, la precisión de orden y reduce el MSE en comparación con el modelo por defecto, demostrando su capacidad para generar secuencias de video más realistas y coherentes. Además, nuestro análisis de la distribución de etapas en los videos generados muestra que TD-GAN produce videos que se asemejan estrechamente a los conjuntos de datos reales, ofreciendo un potencial prometedor para generar y analizar videos en diferentes dominios, incluyendo biología y medicina.