Transfer learning para la selección de operadores: un enfoque de aprendizaje por refuerzo
Autores: Durgut, Rafet; Aydin, Mehmet Emin; Rakib, Abdur
Idioma: Inglés
Editor: MDPI
Año: 2022
Acceso abierto
Artículo científico
2022
Transfer learning para la selección de operadores: un enfoque de aprendizaje por refuerzo
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería de Software
Palabras clave
Algoritmos de optimización metaheurística
Estrategias
Selección adaptativa de operadores
Aprendizaje por Refuerzo
Aprendizaje de transferencia
Velocidad de convergencia
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 36
Citaciones: Sin citaciones
En las últimas dos décadas, los algoritmos de optimización metaheurística (MOAs) han sido cada vez más populares, especialmente en problemas logísticos, científicos y de ingeniería. Las características fundamentales de dichos algoritmos son que dependen de un parámetro o una estrategia. Se emplean algunas estrategias en línea y fuera de línea para obtener configuraciones óptimas de los algoritmos. La selección adaptativa de operadores es una de ellas, y determina si se debe o no actualizar una estrategia del conjunto de estrategias durante el proceso de búsqueda. En el campo del aprendizaje automático, el Aprendizaje por Refuerzo (RL) se refiere a algoritmos orientados a objetivos, que aprenden del entorno cómo lograr un objetivo. En los MOAs, el aprendizaje por refuerzo se ha utilizado para controlar el proceso de selección de operadores. Sin embargo, la investigación existente no muestra que la información aprendida pueda transferirse de un procedimiento de resolución de problemas a otro. El objetivo principal de la investigación propuesta es determinar el impacto del aprendizaje por transferencia en el RL y los MOAs. Como problema de prueba, se utiliza un problema de mochila de unión de conjuntos con 30 instancias de problemas de referencia separadas. Los resultados se comparan estadísticamente en profundidad. Según los hallazgos, el proceso de aprendizaje mejoró la velocidad de convergencia al tiempo que redujo significativamente el tiempo de CPU.
Descripción
En las últimas dos décadas, los algoritmos de optimización metaheurística (MOAs) han sido cada vez más populares, especialmente en problemas logísticos, científicos y de ingeniería. Las características fundamentales de dichos algoritmos son que dependen de un parámetro o una estrategia. Se emplean algunas estrategias en línea y fuera de línea para obtener configuraciones óptimas de los algoritmos. La selección adaptativa de operadores es una de ellas, y determina si se debe o no actualizar una estrategia del conjunto de estrategias durante el proceso de búsqueda. En el campo del aprendizaje automático, el Aprendizaje por Refuerzo (RL) se refiere a algoritmos orientados a objetivos, que aprenden del entorno cómo lograr un objetivo. En los MOAs, el aprendizaje por refuerzo se ha utilizado para controlar el proceso de selección de operadores. Sin embargo, la investigación existente no muestra que la información aprendida pueda transferirse de un procedimiento de resolución de problemas a otro. El objetivo principal de la investigación propuesta es determinar el impacto del aprendizaje por transferencia en el RL y los MOAs. Como problema de prueba, se utiliza un problema de mochila de unión de conjuntos con 30 instancias de problemas de referencia separadas. Los resultados se comparan estadísticamente en profundidad. Según los hallazgos, el proceso de aprendizaje mejoró la velocidad de convergencia al tiempo que redujo significativamente el tiempo de CPU.