logo móvil
Contáctanos

La aplicación del método de normalización de estado basado en conexión residual en GAIL

Autores: Ge, Yanning; Huang, Tao; Wang, Xiaoding; Zheng, Guolong; Yang, Xu

Idioma: Inglés

Editor: MDPI

Año: 2024

Descargar PDF

Acceso abierto

Artículo científico
2024

La aplicación del método de normalización de estado basado en conexión residual en GAIL


Categoría

Matemáticas

Subcategoría

Matemáticas generales

Palabras clave

Aprendizaje por refuerzo
Representaciones de estado
Estabilidad algorítmica
Procedimiento de normalización
Mecanismos de atención
GAIL

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 33

Citaciones: Sin citaciones


Descripción
En el dominio del aprendizaje por refuerzo (RL), derivar representaciones estatales eficaces y mantener la estabilidad algorítmica son cruciales para el rendimiento óptimo del agente. Sin embargo, el dinamismo inherente de las representaciones estatales a menudo complica el procedimiento de normalización. Para superar estos desafíos, presentamos un innovador marco de RL que integra técnicas de normalización estatal con conexiones residuales e incorpora mecanismos de atención en el aprendizaje de imitación generativo adversarial (GAIL). Esta combinación no solo mejora la capacidad expresiva de las representaciones estatales, mejorando así la precisión del agente en el reconocimiento estatal, sino que también mitiga significativamente los problemas comunes de disipación y explosión de gradientes. En comparación con los algoritmos de RL tradicionales, GAIL combinado con el método de normalización estatal basado en conexiones residuales capacita al agente para reducir notablemente la duración de la exploración de manera que la retroalimentación sobre recompensas en el estado actual pueda proporcionarse en tiempo real. Las evaluaciones empíricas demuestran la eficacia superior de esta metodología en diversos entornos de RL.

Otros recursos que podrían interesarte

Temas Virtualpro