logo móvil
Contáctanos

Transfer learning para la selección de operadores: un enfoque de aprendizaje por refuerzo

Autores: Durgut, Rafet; Aydin, Mehmet Emin; Rakib, Abdur

Idioma: Inglés

Editor: MDPI

Año: 2022

Descargar PDF

Acceso abierto

Artículo científico
2022

Transfer learning para la selección de operadores: un enfoque de aprendizaje por refuerzo


Categoría

Ingeniería y Tecnología

Subcategoría

Ingeniería de Software

Palabras clave

Algoritmos de optimización metaheurística
Estrategias
Selección adaptativa de operadores
Aprendizaje por Refuerzo
Aprendizaje de transferencia
Velocidad de convergencia

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 36

Citaciones: Sin citaciones


Descripción
En las últimas dos décadas, los algoritmos de optimización metaheurística (MOAs) han sido cada vez más populares, especialmente en problemas logísticos, científicos y de ingeniería. Las características fundamentales de dichos algoritmos son que dependen de un parámetro o una estrategia. Se emplean algunas estrategias en línea y fuera de línea para obtener configuraciones óptimas de los algoritmos. La selección adaptativa de operadores es una de ellas, y determina si se debe o no actualizar una estrategia del conjunto de estrategias durante el proceso de búsqueda. En el campo del aprendizaje automático, el Aprendizaje por Refuerzo (RL) se refiere a algoritmos orientados a objetivos, que aprenden del entorno cómo lograr un objetivo. En los MOAs, el aprendizaje por refuerzo se ha utilizado para controlar el proceso de selección de operadores. Sin embargo, la investigación existente no muestra que la información aprendida pueda transferirse de un procedimiento de resolución de problemas a otro. El objetivo principal de la investigación propuesta es determinar el impacto del aprendizaje por transferencia en el RL y los MOAs. Como problema de prueba, se utiliza un problema de mochila de unión de conjuntos con 30 instancias de problemas de referencia separadas. Los resultados se comparan estadísticamente en profundidad. Según los hallazgos, el proceso de aprendizaje mejoró la velocidad de convergencia al tiempo que redujo significativamente el tiempo de CPU.

Otros recursos que podrían interesarte

Temas Virtualpro