Algoritmo Híbrido de Optimización por Enjambre de Partículas Basado en la Teoría del Aprendizaje por Refuerzo en Psicología
Autores: Huang, Wenya; Liu, Youjin; Zhang, Xizheng
Idioma: Inglés
Editor: MDPI
Año: 2023
Acceso abierto
Artículo científico
2023
Algoritmo Híbrido de Optimización por Enjambre de Partículas Basado en la Teoría del Aprendizaje por Refuerzo en Psicología
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería de Sistemas
Palabras clave
Problemas de optimización complejos
No lineales
De alta dimensión
De gran muestra
Optimización por enjambre de partículas
HRLPSO
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 28
Citaciones: Sin citaciones
Para resolver de manera más efectiva los complejos problemas de optimización que existen en sistemas no lineales, de alta dimensión, de gran muestra y complejos, se han propuesto muchos métodos de optimización inteligente. Entre estos algoritmos, el algoritmo de optimización por enjambre de partículas (PSO) ha atraído la atención de los académicos. Sin embargo, el PSO tradicional puede convertirse fácilmente en una solución óptima individual, lo que lleva a la transición del proceso de optimización de la exploración global al desarrollo local. Para resolver este problema, en este artículo, proponemos un Algoritmo Híbrido de Aprendizaje por Refuerzo y Optimización por Enjambre de Partículas (HRLPSO) basado en la teoría del aprendizaje por refuerzo en psicología. Primero, utilizamos la estrategia de aprendizaje por refuerzo para optimizar la población inicial en la etapa de inicialización de la población; luego, se utilizaron pesos adaptativos caóticos y factores de aprendizaje adaptativos para equilibrar el proceso de exploración global y desarrollo local, y se obtuvieron la solución óptima individual y la solución óptima global utilizando el aprendizaje por dimensiones. Finalmente, se aplicaron la estrategia de aprendizaje por refuerzo mejorada y la estrategia de mutación al PSO tradicional para mejorar la calidad de la solución óptima individual y la solución óptima global. El algoritmo HRLPSO fue probado optimizando la solución de 12 puntos de referencia, así como el conjunto de pruebas CEC2013, y los resultados muestran que puede equilibrar la capacidad de aprendizaje individual y la capacidad de aprendizaje social, verificando su efectividad.
Descripción
Para resolver de manera más efectiva los complejos problemas de optimización que existen en sistemas no lineales, de alta dimensión, de gran muestra y complejos, se han propuesto muchos métodos de optimización inteligente. Entre estos algoritmos, el algoritmo de optimización por enjambre de partículas (PSO) ha atraído la atención de los académicos. Sin embargo, el PSO tradicional puede convertirse fácilmente en una solución óptima individual, lo que lleva a la transición del proceso de optimización de la exploración global al desarrollo local. Para resolver este problema, en este artículo, proponemos un Algoritmo Híbrido de Aprendizaje por Refuerzo y Optimización por Enjambre de Partículas (HRLPSO) basado en la teoría del aprendizaje por refuerzo en psicología. Primero, utilizamos la estrategia de aprendizaje por refuerzo para optimizar la población inicial en la etapa de inicialización de la población; luego, se utilizaron pesos adaptativos caóticos y factores de aprendizaje adaptativos para equilibrar el proceso de exploración global y desarrollo local, y se obtuvieron la solución óptima individual y la solución óptima global utilizando el aprendizaje por dimensiones. Finalmente, se aplicaron la estrategia de aprendizaje por refuerzo mejorada y la estrategia de mutación al PSO tradicional para mejorar la calidad de la solución óptima individual y la solución óptima global. El algoritmo HRLPSO fue probado optimizando la solución de 12 puntos de referencia, así como el conjunto de pruebas CEC2013, y los resultados muestran que puede equilibrar la capacidad de aprendizaje individual y la capacidad de aprendizaje social, verificando su efectividad.