Un método de aprendizaje por refuerzo para resolver procesos de decisión de Markov: un modelo de exploración adaptativa basado en el error de diferencia temporal

Contáctanos

Temas

Artículos

XBooks

Revistas

Laboratorios

Showroom

Infografías

Recorridos

Videos

Perfiles

Actualidad

Un método de aprendizaje por refuerzo para resolver procesos de decisión de Markov: un modelo de exploración adaptativa basado en el error de diferencia temporal

Autores: Wang, Xianjia; Yang, Zhipeng; Chen, Guici; Liu, Yanli

Idioma: Inglés

Editor: MDPI

Año: 2023

Descargar PDF

Acceso abierto

Artículo científico

2023

Un método de aprendizaje por refuerzo para resolver procesos de decisión de Markov: un modelo de exploración adaptativa basado en el error de diferencia temporal

Categoría

Ingeniería y Tecnología

Subcategoría

Ingeniería Eléctrica y Electrónica

Palabras clave

Métodos de recursión hacia atrás tradicionales

Procesos de Decisión de Markov (MDP)

Exploración Adaptativa Basada en Error Temporal (TEAE)

Técnicas de aprendizaje por refuerzo

DQN-PER-TEAE

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 46

Citaciones: Sin citaciones

Los resultados de la simulación y los análisis de casos indican consistentemente que TEAE muestra una mayor eficiencia, destacando su potencial para impulsar avances en el campo.

Descripción

Los resultados de la simulación y los análisis de casos indican consistentemente que TEAE muestra una mayor eficiencia, destacando su potencial para impulsar avances en el campo.

Otros recursos que podrían interesarte

Ver todas

Temas Virtualpro

Ver todas

Categoría

Subcategoría

Palabras clave

Licencia

Citación bibliográfica

Formato

¡Regístrate ahora y conoce todos los espacios virtuales disponibles para tu institución!

Otros recursos que podrían interesarte

Temas Virtualpro