Biogan: mejorando la generación de datos transcriptómicos con conocimiento biológico
Autores: Panaccione, Francesca Pia; Mongardi, Sofia; Masseroli, Marco; Pinoli, Pietro
Idioma: Inglés
Editor: MDPI
Año: 2025
Acceso abierto
Artículo científico
2025
Biogan: mejorando la generación de datos transcriptómicos con conocimiento biológico
Categoría
Ingeniería y Tecnología
Subcategoría
Bioingeniería
Palabras clave
Genómica computacional
Soluciones basadas en datos
Generación de datos sintéticos
BioGAN
Datos transcriptómicos
Conocimiento biológico
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 22
Citaciones: Sin citaciones
El avance de la genómica computacional ha mejorado significativamente el uso de soluciones basadas en datos en la predicción de enfermedades y la medicina de precisión. Sin embargo, persisten desafíos como la escasez de datos, restricciones de privacidad y sesgos. La generación de datos sintéticos ofrece una solución prometedora a estos problemas. Sin embargo, enfoques existentes basados en inteligencia artificial generativa a menudo no logran incorporar conocimiento biológico, limitando el realismo y la utilidad de las muestras generadas. En este trabajo, presentamos BioGAN, un nuevo marco generativo que, por primera vez, incorpora redes neuronales gráficas en una arquitectura de red generativa adversarial para la generación de datos transcriptómicos. Al aprovechar las redes de regulación génica y co-expresión, nuestro modelo conserva las propiedades biológicas en los perfiles transcriptómicos generados. Validamos su efectividad en conjuntos de datos de expresión génica humana a través de experimentos extensos utilizando métricas de evaluación no supervisadas y supervisadas. Los resultados muestran que incorporar conocimiento biológico a priori es una estrategia efectiva para mejorar tanto la calidad como la utilidad de los datos transcriptómicos sintéticos. En datos humanos, BioGAN logra una mejora del 4.3% en precisión y una correlación de hasta un 2.6% más alta con perfiles reales en comparación con modelos de vanguardia. En tareas de clasificación de enfermedades y tejidos, nuestros datos sintéticos mejoran el rendimiento de predicción en un promedio del 5.7%. Los resultados confirman aún más la robustez de BioGAN, mostrando un recuerdo sólido y utilidad predictiva consistentemente fuerte.
Descripción
El avance de la genómica computacional ha mejorado significativamente el uso de soluciones basadas en datos en la predicción de enfermedades y la medicina de precisión. Sin embargo, persisten desafíos como la escasez de datos, restricciones de privacidad y sesgos. La generación de datos sintéticos ofrece una solución prometedora a estos problemas. Sin embargo, enfoques existentes basados en inteligencia artificial generativa a menudo no logran incorporar conocimiento biológico, limitando el realismo y la utilidad de las muestras generadas. En este trabajo, presentamos BioGAN, un nuevo marco generativo que, por primera vez, incorpora redes neuronales gráficas en una arquitectura de red generativa adversarial para la generación de datos transcriptómicos. Al aprovechar las redes de regulación génica y co-expresión, nuestro modelo conserva las propiedades biológicas en los perfiles transcriptómicos generados. Validamos su efectividad en conjuntos de datos de expresión génica humana a través de experimentos extensos utilizando métricas de evaluación no supervisadas y supervisadas. Los resultados muestran que incorporar conocimiento biológico a priori es una estrategia efectiva para mejorar tanto la calidad como la utilidad de los datos transcriptómicos sintéticos. En datos humanos, BioGAN logra una mejora del 4.3% en precisión y una correlación de hasta un 2.6% más alta con perfiles reales en comparación con modelos de vanguardia. En tareas de clasificación de enfermedades y tejidos, nuestros datos sintéticos mejoran el rendimiento de predicción en un promedio del 5.7%. Los resultados confirman aún más la robustez de BioGAN, mostrando un recuerdo sólido y utilidad predictiva consistentemente fuerte.