logo móvil
Contáctanos

Un método de aprendizaje por refuerzo para resolver procesos de decisión de Markov: un modelo de exploración adaptativa basado en el error de diferencia temporal

Autores: Wang, Xianjia; Yang, Zhipeng; Chen, Guici; Liu, Yanli

Idioma: Inglés

Editor: MDPI

Año: 2023

Descargar PDF

Acceso abierto

Artículo científico
2023

Un método de aprendizaje por refuerzo para resolver procesos de decisión de Markov: un modelo de exploración adaptativa basado en el error de diferencia temporal


Categoría

Ingeniería y Tecnología

Subcategoría

Ingeniería Eléctrica y Electrónica

Palabras clave

Métodos de recursión hacia atrás tradicionales
Procesos de Decisión de Markov (MDP)
Exploración Adaptativa Basada en Error Temporal (TEAE)
Técnicas de aprendizaje por refuerzo
DQN-PER-TEAE

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 46

Citaciones: Sin citaciones


Descripción
Los resultados de la simulación y los análisis de casos indican consistentemente que TEAE muestra una mayor eficiencia, destacando su potencial para impulsar avances en el campo.

Otros recursos que podrían interesarte

Temas Virtualpro