Transfer learning para la selección de operadores: un enfoque de aprendizaje por refuerzo

Contáctanos

Temas

Artículos

XBooks

Revistas

Laboratorios

Showroom

Infografías

Recorridos

Videos

Perfiles

Actualidad

Transfer learning para la selección de operadores: un enfoque de aprendizaje por refuerzo

Autores: Durgut, Rafet; Aydin, Mehmet Emin; Rakib, Abdur

Idioma: Inglés

Editor: MDPI

Año: 2022

Descargar PDF

Acceso abierto

Artículo científico

2022

Transfer learning para la selección de operadores: un enfoque de aprendizaje por refuerzo

Categoría

Ingeniería y Tecnología

Subcategoría

Ingeniería de Software

Palabras clave

Algoritmos de optimización metaheurística

Estrategias

Selección adaptativa de operadores

Aprendizaje por Refuerzo

Aprendizaje de transferencia

Velocidad de convergencia

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 36

Citaciones: Sin citaciones

En las últimas dos décadas, los algoritmos de optimización metaheurística (MOAs) han sido cada vez más populares, especialmente en problemas logísticos, científicos y de ingeniería. Las características fundamentales de dichos algoritmos son que dependen de un parámetro o una estrategia. Se emplean algunas estrategias en línea y fuera de línea para obtener configuraciones óptimas de los algoritmos. La selección adaptativa de operadores es una de ellas, y determina si se debe o no actualizar una estrategia del conjunto de estrategias durante el proceso de búsqueda. En el campo del aprendizaje automático, el Aprendizaje por Refuerzo (RL) se refiere a algoritmos orientados a objetivos, que aprenden del entorno cómo lograr un objetivo. En los MOAs, el aprendizaje por refuerzo se ha utilizado para controlar el proceso de selección de operadores. Sin embargo, la investigación existente no muestra que la información aprendida pueda transferirse de un procedimiento de resolución de problemas a otro. El objetivo principal de la investigación propuesta es determinar el impacto del aprendizaje por transferencia en el RL y los MOAs. Como problema de prueba, se utiliza un problema de mochila de unión de conjuntos con 30 instancias de problemas de referencia separadas. Los resultados se comparan estadísticamente en profundidad. Según los hallazgos, el proceso de aprendizaje mejoró la velocidad de convergencia al tiempo que redujo significativamente el tiempo de CPU.

Descripción

Otros recursos que podrían interesarte

Ver todas

Temas Virtualpro

Ver todas

Categoría

Subcategoría

Palabras clave

Licencia

Citación bibliográfica

Formato

¡Regístrate ahora y conoce todos los espacios virtuales disponibles para tu institución!

Otros recursos que podrían interesarte

Temas Virtualpro