logo móvil
Contáctanos

Deephive: un enfoque de aprendizaje por refuerzo para el descubrimiento automatizado de políticas de optimización basadas en enjambres

Autores: Ikponmwoba, Eloghosa; Owoyele, Opeoluwa

Idioma: Inglés

Editor: MDPI

Año: 2024

Descargar PDF

Acceso abierto

Artículo científico
2024

Deephive: un enfoque de aprendizaje por refuerzo para el descubrimiento automatizado de políticas de optimización basadas en enjambres


Categoría

Ingeniería y Tecnología

Subcategoría

Ingeniería de Software

Palabras clave

Optimizadores basados en enjambres
Optimización global
Aprendizaje por refuerzo
Políticas de optimización
Funciones de referencia
Optimizadores específicos de dominio

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 26

Citaciones: Sin citaciones


Descripción
Presentamos un enfoque para diseñar optimizadores basados en enjambres para la optimización global de funciones de caja negra costosas. En el enfoque propuesto, el problema de encontrar optimizadores eficientes se plantea como un problema de aprendizaje por refuerzo, donde el objetivo es encontrar políticas de optimización que requieran unas pocas evaluaciones de funciones para converger al óptimo global. El estado de cada partícula dentro del enjambre se define como su posición actual y el valor de la función dentro de un espacio de diseño, y las partículas aprenden a tomar acciones favorables que maximicen la recompensa, la cual se basa en el valor final de la función objetivo. El enfoque propuesto se prueba en 50 funciones de optimización de referencia y se compara con el rendimiento de otras estrategias de optimización global. Además, se investigan las capacidades de generalización de las partículas entrenadas en las cuatro categorías de funciones de optimización de referencia. Los resultados muestran un rendimiento superior en comparación con los otros optimizadores, una escalabilidad deseada cuando varía la dimensión de las funciones y un rendimiento aceptable incluso cuando se aplica a funciones no vistas. En una escala más amplia, los resultados muestran promesas para el desarrollo rápido de optimizadores específicos de dominio.

Otros recursos que podrían interesarte

Temas Virtualpro