Algoritmo Híbrido de Optimización por Enjambre de Partículas Basado en la Teoría del Aprendizaje por Refuerzo en Psicología

Contáctanos

Temas

Artículos

XBooks

Revistas

Laboratorios

Showroom

Infografías

Recorridos

Videos

Perfiles

Actualidad

Algoritmo Híbrido de Optimización por Enjambre de Partículas Basado en la Teoría del Aprendizaje por Refuerzo en Psicología

Autores: Huang, Wenya; Liu, Youjin; Zhang, Xizheng

Idioma: Inglés

Editor: MDPI

Año: 2023

Descargar PDF

Acceso abierto

Artículo científico

2023

Algoritmo Híbrido de Optimización por Enjambre de Partículas Basado en la Teoría del Aprendizaje por Refuerzo en Psicología

Categoría

Ingeniería y Tecnología

Subcategoría

Ingeniería de Sistemas

Palabras clave

Problemas de optimización complejos

No lineales

De alta dimensión

De gran muestra

Optimización por enjambre de partículas

HRLPSO

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 28

Citaciones: Sin citaciones

Para resolver de manera más efectiva los complejos problemas de optimización que existen en sistemas no lineales, de alta dimensión, de gran muestra y complejos, se han propuesto muchos métodos de optimización inteligente. Entre estos algoritmos, el algoritmo de optimización por enjambre de partículas (PSO) ha atraído la atención de los académicos. Sin embargo, el PSO tradicional puede convertirse fácilmente en una solución óptima individual, lo que lleva a la transición del proceso de optimización de la exploración global al desarrollo local. Para resolver este problema, en este artículo, proponemos un Algoritmo Híbrido de Aprendizaje por Refuerzo y Optimización por Enjambre de Partículas (HRLPSO) basado en la teoría del aprendizaje por refuerzo en psicología. Primero, utilizamos la estrategia de aprendizaje por refuerzo para optimizar la población inicial en la etapa de inicialización de la población; luego, se utilizaron pesos adaptativos caóticos y factores de aprendizaje adaptativos para equilibrar el proceso de exploración global y desarrollo local, y se obtuvieron la solución óptima individual y la solución óptima global utilizando el aprendizaje por dimensiones. Finalmente, se aplicaron la estrategia de aprendizaje por refuerzo mejorada y la estrategia de mutación al PSO tradicional para mejorar la calidad de la solución óptima individual y la solución óptima global. El algoritmo HRLPSO fue probado optimizando la solución de 12 puntos de referencia, así como el conjunto de pruebas CEC2013, y los resultados muestran que puede equilibrar la capacidad de aprendizaje individual y la capacidad de aprendizaje social, verificando su efectividad.

Descripción

Otros recursos que podrían interesarte

Ver todas

Temas Virtualpro

Ver todas

Categoría

Subcategoría

Palabras clave

Licencia

Citación bibliográfica

Formato

¡Regístrate ahora y conoce todos los espacios virtuales disponibles para tu institución!

Otros recursos que podrían interesarte

Temas Virtualpro