Un método de aprendizaje por refuerzo para resolver procesos de decisión de Markov: un modelo de exploración adaptativa basado en el error de diferencia temporal
Autores: Wang, Xianjia; Yang, Zhipeng; Chen, Guici; Liu, Yanli
Idioma: Inglés
Editor: MDPI
Año: 2023
Acceso abierto
Artículo científico
2023
Un método de aprendizaje por refuerzo para resolver procesos de decisión de Markov: un modelo de exploración adaptativa basado en el error de diferencia temporal
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Métodos de recursión hacia atrás tradicionales
Procesos de Decisión de Markov (MDP)
Exploración Adaptativa Basada en Error Temporal (TEAE)
Técnicas de aprendizaje por refuerzo
DQN-PER-TEAE
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 46
Citaciones: Sin citaciones
Los resultados de la simulación y los análisis de casos indican consistentemente que TEAE muestra una mayor eficiencia, destacando su potencial para impulsar avances en el campo.
Descripción
Los resultados de la simulación y los análisis de casos indican consistentemente que TEAE muestra una mayor eficiencia, destacando su potencial para impulsar avances en el campo.