Aprovechando esquema para predicciones de aprendizaje automático de microbiomas entre estudios y evaluaciones de características
Autores: Song, Kuncheng; Zhou, Yi-Hui
Idioma: Inglés
Editor: MDPI
Año: 2023
Acceso abierto
Artículo científico
2023
Aprovechando esquema para predicciones de aprendizaje automático de microbiomas entre estudios y evaluaciones de características
Categoría
Ingeniería y Tecnología
Subcategoría
Bioingeniería
Palabras clave
Microbiota
Enfermedades
Datos del microbioma
Modelos de aprendizaje automático
Cáncer colorrectal
Enfermedad de Crohn
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 27
Citaciones: Sin citaciones
La microbiota ha demostrado ser uno de los factores críticos para muchas enfermedades, y los investigadores han estado utilizando datos del microbioma para la predicción de enfermedades. Sin embargo, los modelos entrenados en un estudio independiente de microbioma pueden no ser fácilmente aplicables a otros estudios independientes debido al alto nivel de variabilidad en los datos del microbioma. En este estudio, desarrollamos un método para mejorar la generalizabilidad y la interpretabilidad de los modelos de aprendizaje automático para predecir tres enfermedades diferentes (cáncer colorrectal, enfermedad de Crohn y respuesta a la inmunoterapia) utilizando nueve conjuntos de datos de microbioma independientes. Nuestro método implica combinar un conjunto de datos más pequeño con un conjunto de datos más grande, y encontramos que el uso de al menos el 25% de las muestras objetivo en los datos fuente resultó en un mejor rendimiento del modelo. Determinamos el bosque aleatorio como nuestro modelo principal y empleamos la selección de características para identificar taxones comunes e importantes para la predicción de enfermedades en los diferentes estudios. Nuestros resultados sugieren que este esquema de aprovechamiento es un enfoque prometedor para mejorar la precisión y la interpretabilidad de los modelos de aprendizaje automático para predecir enfermedades basadas en datos del microbioma.
Descripción
La microbiota ha demostrado ser uno de los factores críticos para muchas enfermedades, y los investigadores han estado utilizando datos del microbioma para la predicción de enfermedades. Sin embargo, los modelos entrenados en un estudio independiente de microbioma pueden no ser fácilmente aplicables a otros estudios independientes debido al alto nivel de variabilidad en los datos del microbioma. En este estudio, desarrollamos un método para mejorar la generalizabilidad y la interpretabilidad de los modelos de aprendizaje automático para predecir tres enfermedades diferentes (cáncer colorrectal, enfermedad de Crohn y respuesta a la inmunoterapia) utilizando nueve conjuntos de datos de microbioma independientes. Nuestro método implica combinar un conjunto de datos más pequeño con un conjunto de datos más grande, y encontramos que el uso de al menos el 25% de las muestras objetivo en los datos fuente resultó en un mejor rendimiento del modelo. Determinamos el bosque aleatorio como nuestro modelo principal y empleamos la selección de características para identificar taxones comunes e importantes para la predicción de enfermedades en los diferentes estudios. Nuestros resultados sugieren que este esquema de aprovechamiento es un enfoque prometedor para mejorar la precisión y la interpretabilidad de los modelos de aprendizaje automático para predecir enfermedades basadas en datos del microbioma.