Un mejorado enjambre artificial de abejas para la selección de características en QSAR
Autores: Lin, Yanhong; Wang, Jing; Li, Xiaolin; Zhang, Yuanzi; Huang, Shiguo
Idioma: Inglés
Editor: MDPI
Año: 2021
Acceso abierto
Artículo científico
2021
Un mejorado enjambre artificial de abejas para la selección de características en QSAR
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería de Software
Palabras clave
Relación estructura-actividad cuantitativa
Selección de características
Algoritmo de colonia de abejas artificiales
Descriptores moleculares
Análisis de regresión
Predicción
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 53
Citaciones: Sin citaciones
La Relación Cuantitativa Estructura-Actividad (QSAR) tiene como objetivo correlacionar las propiedades de la estructura molecular con la bioactividad correspondiente. Las correlaciones aleatorias y la multicolinealidad son dos problemas principales que se encuentran a menudo al generar modelos QSAR. La selección de características puede mejorar significativamente la precisión y la interpretabilidad de QSAR al eliminar descriptores moleculares redundantes o irrelevantes. Un algoritmo de colonia de abejas artificiales (ABC) que imita los comportamientos de forrajeo de una colonia de abejas melíferas fue originalmente propuesto para problemas de optimización continua. Se ha aplicado a la selección de características para clasificación pero rara vez para análisis de regresión y predicción. En este documento, se utiliza un algoritmo ABC binario para seleccionar características (descriptores moleculares) en QSAR. Además, proponemos un algoritmo basado en ABC mejorado para la selección de características en QSAR, denominado ABC-PLS-1. Se introducen operadores de cruce y mutación en la fase de abeja empleada y abeja observadora para modificar varias dimensiones de cada solución, lo que no solo ahorra el proceso de convertir valores continuos en valores discretos, sino que también reduce los recursos computacionales. Además, una novedosa estrategia de selección codiciosa que selecciona subconjuntos de características con mayor precisión y menos características ayuda al algoritmo a converger rápidamente. Se utilizan tres conjuntos de datos QSAR para la evaluación del algoritmo propuesto. Los resultados experimentales muestran que ABC-PLS-1 supera a PSO-PLS, WS-PSO-PLS y BFDE-PLS en precisión, error cuadrático medio y número de características seleccionadas. Además, también estudiamos si implementar la fase de abeja exploradora al rastrear problemas de regresión y llegamos a la interesante conclusión de que la fase de abeja exploradora es redundante al tratar la selección de características en problemas de regresión de baja y mediana dimensionalidad.
Descripción
La Relación Cuantitativa Estructura-Actividad (QSAR) tiene como objetivo correlacionar las propiedades de la estructura molecular con la bioactividad correspondiente. Las correlaciones aleatorias y la multicolinealidad son dos problemas principales que se encuentran a menudo al generar modelos QSAR. La selección de características puede mejorar significativamente la precisión y la interpretabilidad de QSAR al eliminar descriptores moleculares redundantes o irrelevantes. Un algoritmo de colonia de abejas artificiales (ABC) que imita los comportamientos de forrajeo de una colonia de abejas melíferas fue originalmente propuesto para problemas de optimización continua. Se ha aplicado a la selección de características para clasificación pero rara vez para análisis de regresión y predicción. En este documento, se utiliza un algoritmo ABC binario para seleccionar características (descriptores moleculares) en QSAR. Además, proponemos un algoritmo basado en ABC mejorado para la selección de características en QSAR, denominado ABC-PLS-1. Se introducen operadores de cruce y mutación en la fase de abeja empleada y abeja observadora para modificar varias dimensiones de cada solución, lo que no solo ahorra el proceso de convertir valores continuos en valores discretos, sino que también reduce los recursos computacionales. Además, una novedosa estrategia de selección codiciosa que selecciona subconjuntos de características con mayor precisión y menos características ayuda al algoritmo a converger rápidamente. Se utilizan tres conjuntos de datos QSAR para la evaluación del algoritmo propuesto. Los resultados experimentales muestran que ABC-PLS-1 supera a PSO-PLS, WS-PSO-PLS y BFDE-PLS en precisión, error cuadrático medio y número de características seleccionadas. Además, también estudiamos si implementar la fase de abeja exploradora al rastrear problemas de regresión y llegamos a la interesante conclusión de que la fase de abeja exploradora es redundante al tratar la selección de características en problemas de regresión de baja y mediana dimensionalidad.