Deephive: un enfoque de aprendizaje por refuerzo para el descubrimiento automatizado de políticas de optimización basadas en enjambres

Contáctanos

Temas

Artículos

XBooks

Revistas

Laboratorios

Showroom

Infografías

Recorridos

Videos

Perfiles

Actualidad

Deephive: un enfoque de aprendizaje por refuerzo para el descubrimiento automatizado de políticas de optimización basadas en enjambres

Autores: Ikponmwoba, Eloghosa; Owoyele, Opeoluwa

Idioma: Inglés

Editor: MDPI

Año: 2024

Descargar PDF

Acceso abierto

Artículo científico

2024

Deephive: un enfoque de aprendizaje por refuerzo para el descubrimiento automatizado de políticas de optimización basadas en enjambres

Categoría

Ingeniería y Tecnología

Subcategoría

Ingeniería de Software

Palabras clave

Optimizadores basados en enjambres

Optimización global

Aprendizaje por refuerzo

Políticas de optimización

Funciones de referencia

Optimizadores específicos de dominio

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 26

Citaciones: Sin citaciones

Presentamos un enfoque para diseñar optimizadores basados en enjambres para la optimización global de funciones de caja negra costosas. En el enfoque propuesto, el problema de encontrar optimizadores eficientes se plantea como un problema de aprendizaje por refuerzo, donde el objetivo es encontrar políticas de optimización que requieran unas pocas evaluaciones de funciones para converger al óptimo global. El estado de cada partícula dentro del enjambre se define como su posición actual y el valor de la función dentro de un espacio de diseño, y las partículas aprenden a tomar acciones favorables que maximicen la recompensa, la cual se basa en el valor final de la función objetivo. El enfoque propuesto se prueba en 50 funciones de optimización de referencia y se compara con el rendimiento de otras estrategias de optimización global. Además, se investigan las capacidades de generalización de las partículas entrenadas en las cuatro categorías de funciones de optimización de referencia. Los resultados muestran un rendimiento superior en comparación con los otros optimizadores, una escalabilidad deseada cuando varía la dimensión de las funciones y un rendimiento aceptable incluso cuando se aplica a funciones no vistas. En una escala más amplia, los resultados muestran promesas para el desarrollo rápido de optimizadores específicos de dominio.

Descripción

Otros recursos que podrían interesarte

Ver todas

Temas Virtualpro

Ver todas

Categoría

Subcategoría

Palabras clave

Licencia

Citación bibliográfica

Formato

¡Regístrate ahora y conoce todos los espacios virtuales disponibles para tu institución!

Otros recursos que podrían interesarte

Temas Virtualpro