Un optimizador de enjambre de partículas basado en el aprendizaje para resolver problemas combinatorios matemáticos
Autores: Olivares, Rodrigo; Soto, Ricardo; Crawford, Broderick; Ríos, Víctor; Olivares, Pablo; Ravelo, Camilo; Medina, Sebastian; Nauduan, Diego
Idioma: Inglés
Editor: MDPI
Año: 2023
Acceso abierto
Artículo científico
2023
Un optimizador de enjambre de partículas basado en el aprendizaje para resolver problemas combinatorios matemáticos
Categoría
Matemáticas
Subcategoría
Análisis matemático
Palabras clave
Métodos de control de parámetros adaptativos
Aprendizaje por refuerzo
Algoritmo de enjambre de partículas
Q-Learning
Problema de la mochila multidimensional
Metaheurísticas
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 19
Citaciones: Sin citaciones
Este documento presenta un conjunto de métodos de control de parámetros adaptativos a través del aprendizaje por refuerzo para el algoritmo de enjambre de partículas. El objetivo es ajustar los parámetros del algoritmo durante la ejecución, para proporcionar a las metaheurísticas la capacidad de aprender y adaptarse dinámicamente al problema y su contexto. La propuesta integra el Q-Learning en el algoritmo de optimización para el control de parámetros. Las estrategias aplicadas incluyen una tabla Q compartida, tablas separadas por parámetro y una representación flexible del estado. El estudio fue evaluado a través de varias instancias del problema de la mochila multidimensional perteneciente a la clase NP-hard. Se puede formular como un problema combinatorio matemático que involucra un conjunto de elementos con múltiples atributos o dimensiones, con el objetivo de maximizar el valor total o la utilidad respetando las restricciones de capacidad total o recursos disponibles. Se realizaron pruebas experimentales y estadísticas para comparar los resultados obtenidos por cada una de estas hibridaciones, concluyendo que pueden mejorar significativamente la calidad de las soluciones encontradas en comparación con la versión nativa del algoritmo.
Descripción
Este documento presenta un conjunto de métodos de control de parámetros adaptativos a través del aprendizaje por refuerzo para el algoritmo de enjambre de partículas. El objetivo es ajustar los parámetros del algoritmo durante la ejecución, para proporcionar a las metaheurísticas la capacidad de aprender y adaptarse dinámicamente al problema y su contexto. La propuesta integra el Q-Learning en el algoritmo de optimización para el control de parámetros. Las estrategias aplicadas incluyen una tabla Q compartida, tablas separadas por parámetro y una representación flexible del estado. El estudio fue evaluado a través de varias instancias del problema de la mochila multidimensional perteneciente a la clase NP-hard. Se puede formular como un problema combinatorio matemático que involucra un conjunto de elementos con múltiples atributos o dimensiones, con el objetivo de maximizar el valor total o la utilidad respetando las restricciones de capacidad total o recursos disponibles. Se realizaron pruebas experimentales y estadísticas para comparar los resultados obtenidos por cada una de estas hibridaciones, concluyendo que pueden mejorar significativamente la calidad de las soluciones encontradas en comparación con la versión nativa del algoritmo.