logo móvil
Contáctanos

Los modelos generativos que utilizan relleno pueden integrar y generar eficientemente datos multiómicos

Autores: Lee, Hyeon-Su; Hong, Seung-Hwan; Kim, Gwan-Heon; You, Hye-Jin; Lee, Eun-Young; Jeong, Jae-Hwan; Ahn, Jin-Woo; Kim, June-Hyuk

Idioma: Inglés

Editor: MDPI

Año: 2024

Descargar PDF

Acceso abierto

Artículo científico
2024

Los modelos generativos que utilizan relleno pueden integrar y generar eficientemente datos multiómicos


Categoría

Ingeniería y Tecnología

Subcategoría

Inteligencia Artificial

Palabras clave

Avances tecnológicos
Datos de omics múltiples
Inteligencia artificial
Modelo de clasificación
Fenotipos de cáncer
Aprendizaje profundo

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 23

Citaciones: Sin citaciones


Descripción
Los avances tecnológicos en capacidad de procesamiento de información han permitido análisis integrados (multi-ómicos) de diferentes tipos de datos ómicos, mejorando el descubrimiento de objetivos y el diagnóstico clínico. Este estudio propone nuevas estrategias de aprendizaje de inteligencia artificial (IA) para conjuntos de datos incompletos, comunes en la investigación ómica. El modelo comprende (1) un modelo generativo multi-ómico basado en un auto-codificador variacional que aprende patrones genéticos tumorales basados en diferentes tipos de datos ómicos y (2) un modelo de clasificación ampliado que predice fenotipos de cáncer. Se aplicó relleno para reemplazar datos faltantes con datos virtuales. Los datos de incrustación generados por el modelo clasificaron con precisión los fenotipos de cáncer, abordando el problema de desequilibrio de clases (puntuación F1 ponderada: tipo de cáncer > 0.95, sitio primario > 0.92, tipo de muestra > 0.97). El rendimiento de clasificación se mantuvo en ausencia de datos ómicos, y los datos virtuales se asemejaron a los datos ómicos reales (similitud de coseno expresión génica de ARNm > 0.96, expresión de isoforma de ARNm > 0.95, metilación de ADN > 0.96). Mientras tanto, en presencia de datos ómicos, se generaron datos ómicos no existentes de alta calidad (similitud de coseno expresión génica de ARNm: 0.9702, expresión de isoforma de ARNm: 0.9546, metilación de ADN: 0.9687). Este modelo puede clasificar efectivamente los fenotipos de cáncer basados en datos ómicos incompletos con robustez de esparsidad de datos, generando datos ómicos a través de aprendizaje profundo y permitiendo la medicina de precisión.

Otros recursos que podrían interesarte

Temas Virtualpro