logo móvil
Contáctanos

Biogan: mejorando la generación de datos transcriptómicos con conocimiento biológico

Autores: Panaccione, Francesca Pia; Mongardi, Sofia; Masseroli, Marco; Pinoli, Pietro

Idioma: Inglés

Editor: MDPI

Año: 2025

Descargar PDF

Acceso abierto

Artículo científico
2025

Biogan: mejorando la generación de datos transcriptómicos con conocimiento biológico


Categoría

Ingeniería y Tecnología

Subcategoría

Bioingeniería

Palabras clave

Genómica computacional
Soluciones basadas en datos
Generación de datos sintéticos
BioGAN
Datos transcriptómicos
Conocimiento biológico

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 22

Citaciones: Sin citaciones


Descripción
El avance de la genómica computacional ha mejorado significativamente el uso de soluciones basadas en datos en la predicción de enfermedades y la medicina de precisión. Sin embargo, persisten desafíos como la escasez de datos, restricciones de privacidad y sesgos. La generación de datos sintéticos ofrece una solución prometedora a estos problemas. Sin embargo, enfoques existentes basados en inteligencia artificial generativa a menudo no logran incorporar conocimiento biológico, limitando el realismo y la utilidad de las muestras generadas. En este trabajo, presentamos BioGAN, un nuevo marco generativo que, por primera vez, incorpora redes neuronales gráficas en una arquitectura de red generativa adversarial para la generación de datos transcriptómicos. Al aprovechar las redes de regulación génica y co-expresión, nuestro modelo conserva las propiedades biológicas en los perfiles transcriptómicos generados. Validamos su efectividad en conjuntos de datos de expresión génica humana a través de experimentos extensos utilizando métricas de evaluación no supervisadas y supervisadas. Los resultados muestran que incorporar conocimiento biológico a priori es una estrategia efectiva para mejorar tanto la calidad como la utilidad de los datos transcriptómicos sintéticos. En datos humanos, BioGAN logra una mejora del 4.3% en precisión y una correlación de hasta un 2.6% más alta con perfiles reales en comparación con modelos de vanguardia. En tareas de clasificación de enfermedades y tejidos, nuestros datos sintéticos mejoran el rendimiento de predicción en un promedio del 5.7%. Los resultados confirman aún más la robustez de BioGAN, mostrando un recuerdo sólido y utilidad predictiva consistentemente fuerte.

Otros recursos que podrían interesarte

Temas Virtualpro