logo móvil
Contáctanos

Un algoritmo mejorado de aprendizaje profundo de refuerzo multiobjetivo basado en actualización de sobre

Autores: Hu, Can; Zhu, Zhengwei; Wang, Lijia; Zhu, Chenyang; Yang, Yanfei

Idioma: Inglés

Editor: MDPI

Año: 2022

Descargar PDF

Acceso abierto

Artículo científico
2022

Un algoritmo mejorado de aprendizaje profundo de refuerzo multiobjetivo basado en actualización de sobre


Categoría

Ingeniería y Tecnología

Subcategoría

Ingeniería Eléctrica y Electrónica

Palabras clave

Aprendizaje por refuerzo
Multiobjetivo
Aprendizaje profundo por refuerzo
Frontera de Pareto
Exploración
Convergencia

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 29

Citaciones: Sin citaciones


Descripción
El algoritmo de aprendizaje por refuerzo multiobjetivo (MORL) tiene como objetivo aproximar uniformemente la frontera de Pareto en problemas de toma de decisiones multiobjetivo, lo cual sufre de exploración insuficiente y convergencia inestable.

Otros recursos que podrían interesarte

Temas Virtualpro