Mejorando la categorización taxonómica de secuencias de ADN con aprendizaje profundo: un enfoque de múltiples etiquetas
Autores: Hossain, Prommy Sultana; Kim, Kyungsup; Uddin, Jia; Samad, Md Abdus; Choi, Kwonhue
Idioma: Inglés
Editor: MDPI
Año: 2023
Acceso abierto
Artículo científico
2023
Mejorando la categorización taxonómica de secuencias de ADN con aprendizaje profundo: un enfoque de múltiples etiquetas
Categoría
Ingeniería y Tecnología
Subcategoría
Bioingeniería
Palabras clave
Aprendizaje profundo
Secuencias de ADN
MLELM
VCAE
SCAE
Categorización taxonómica
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 31
Citaciones: Sin citaciones
La aplicación del aprendizaje profundo para la categorización taxonómica de secuencias de ADN se investiga en este estudio. Dos arquitecturas de aprendizaje profundo, a saber, el Codificador Automático Convolucional Apilado (SCAE) con Máquina de Aprendizaje Extremo Multietiqueta (MLELM) y el Codificador Automático Convolucional Variacional (VCAE) con MLELM, han sido propuestas. Estos diseños proporcionan mapas de características precisos para interacciones individuales e interetiquetas dentro de las secuencias de ADN, capturando sus propiedades espaciales y temporales. Las características recopiladas se alimentan posteriormente en redes MLELM, que producen puntajes de clasificación suaves y etiquetas duras. Los algoritmos propuestos fueron sometidos a un entrenamiento exhaustivo y pruebas en datos no supervisados, donde se tuvieron en cuenta una o más etiquetas simultáneamente. La introducción de la etiqueta de clado resultó en una precisión mejorada para ambos modelos en comparación con las etiquetas de clase o género, probablemente debido a la ocurrencia de grandes agrupaciones de nucleótidos similares dentro de una cadena de ADN. En todas las circunstancias, el modelo VCAE-MLELM superó consistentemente al modelo SCAE-MLELM. La mejor precisión alcanzada por el modelo VCAE-MLELM cuando se combinaron las etiquetas de clado y familia fue del 94%. Sin embargo, las calificaciones de precisión para la categorización de etiquetas únicas utilizando cualquiera de los enfoques fueron inferiores al 65%. La efectividad del enfoque se basa en las redes MLELM, que registran patrones conectados a través de clases para una categorización precisa de etiquetas. Este estudio avanza en el aprendizaje profundo en taxonomía biológica al enfatizar la importancia de combinar numerosas etiquetas para aumentar la precisión de la clasificación.
Descripción
La aplicación del aprendizaje profundo para la categorización taxonómica de secuencias de ADN se investiga en este estudio. Dos arquitecturas de aprendizaje profundo, a saber, el Codificador Automático Convolucional Apilado (SCAE) con Máquina de Aprendizaje Extremo Multietiqueta (MLELM) y el Codificador Automático Convolucional Variacional (VCAE) con MLELM, han sido propuestas. Estos diseños proporcionan mapas de características precisos para interacciones individuales e interetiquetas dentro de las secuencias de ADN, capturando sus propiedades espaciales y temporales. Las características recopiladas se alimentan posteriormente en redes MLELM, que producen puntajes de clasificación suaves y etiquetas duras. Los algoritmos propuestos fueron sometidos a un entrenamiento exhaustivo y pruebas en datos no supervisados, donde se tuvieron en cuenta una o más etiquetas simultáneamente. La introducción de la etiqueta de clado resultó en una precisión mejorada para ambos modelos en comparación con las etiquetas de clase o género, probablemente debido a la ocurrencia de grandes agrupaciones de nucleótidos similares dentro de una cadena de ADN. En todas las circunstancias, el modelo VCAE-MLELM superó consistentemente al modelo SCAE-MLELM. La mejor precisión alcanzada por el modelo VCAE-MLELM cuando se combinaron las etiquetas de clado y familia fue del 94%. Sin embargo, las calificaciones de precisión para la categorización de etiquetas únicas utilizando cualquiera de los enfoques fueron inferiores al 65%. La efectividad del enfoque se basa en las redes MLELM, que registran patrones conectados a través de clases para una categorización precisa de etiquetas. Este estudio avanza en el aprendizaje profundo en taxonomía biológica al enfatizar la importancia de combinar numerosas etiquetas para aumentar la precisión de la clasificación.