La aplicación del método de normalización de estado basado en conexión residual en GAIL

Contáctanos

Temas

Artículos

XBooks

Revistas

Laboratorios

Showroom

Infografías

Recorridos

Videos

Perfiles

Actualidad

La aplicación del método de normalización de estado basado en conexión residual en GAIL

Autores: Ge, Yanning; Huang, Tao; Wang, Xiaoding; Zheng, Guolong; Yang, Xu

Idioma: Inglés

Editor: MDPI

Año: 2024

Descargar PDF

Acceso abierto

Artículo científico

2024

La aplicación del método de normalización de estado basado en conexión residual en GAIL

Categoría

Matemáticas

Subcategoría

Matemáticas generales

Palabras clave

Aprendizaje por refuerzo

Representaciones de estado

Estabilidad algorítmica

Procedimiento de normalización

Mecanismos de atención

GAIL

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 33

Citaciones: Sin citaciones

En el dominio del aprendizaje por refuerzo (RL), derivar representaciones estatales eficaces y mantener la estabilidad algorítmica son cruciales para el rendimiento óptimo del agente. Sin embargo, el dinamismo inherente de las representaciones estatales a menudo complica el procedimiento de normalización. Para superar estos desafíos, presentamos un innovador marco de RL que integra técnicas de normalización estatal con conexiones residuales e incorpora mecanismos de atención en el aprendizaje de imitación generativo adversarial (GAIL). Esta combinación no solo mejora la capacidad expresiva de las representaciones estatales, mejorando así la precisión del agente en el reconocimiento estatal, sino que también mitiga significativamente los problemas comunes de disipación y explosión de gradientes. En comparación con los algoritmos de RL tradicionales, GAIL combinado con el método de normalización estatal basado en conexiones residuales capacita al agente para reducir notablemente la duración de la exploración de manera que la retroalimentación sobre recompensas en el estado actual pueda proporcionarse en tiempo real. Las evaluaciones empíricas demuestran la eficacia superior de esta metodología en diversos entornos de RL.

Descripción

Otros recursos que podrían interesarte

Ver todas

Temas Virtualpro

Ver todas

Categoría

Subcategoría

Palabras clave

Licencia

Citación bibliográfica

Formato

¡Regístrate ahora y conoce todos los espacios virtuales disponibles para tu institución!

Otros recursos que podrían interesarte

Temas Virtualpro