Un algoritmo mejorado de aprendizaje profundo de refuerzo multiobjetivo basado en actualización de sobre
Autores: Hu, Can; Zhu, Zhengwei; Wang, Lijia; Zhu, Chenyang; Yang, Yanfei
Idioma: Inglés
Editor: MDPI
Año: 2022
Acceso abierto
Artículo científico
2022
Un algoritmo mejorado de aprendizaje profundo de refuerzo multiobjetivo basado en actualización de sobre
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Aprendizaje por refuerzo
Multiobjetivo
Aprendizaje profundo por refuerzo
Frontera de Pareto
Exploración
Convergencia
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 29
Citaciones: Sin citaciones
El algoritmo de aprendizaje por refuerzo multiobjetivo (MORL) tiene como objetivo aproximar uniformemente la frontera de Pareto en problemas de toma de decisiones multiobjetivo, lo cual sufre de exploración insuficiente y convergencia inestable.
Descripción
El algoritmo de aprendizaje por refuerzo multiobjetivo (MORL) tiene como objetivo aproximar uniformemente la frontera de Pareto en problemas de toma de decisiones multiobjetivo, lo cual sufre de exploración insuficiente y convergencia inestable.