Aprendiendo a utilizar la curiosidad: un nuevo enfoque de aprendizaje de currículo automático para Deep RL

Contáctanos

Temas

Artículos

XBooks

Revistas

Laboratorios

Showroom

Infografías

Recorridos

Videos

Perfiles

Actualidad

Aprendiendo a utilizar la curiosidad: un nuevo enfoque de aprendizaje de currículo automático para Deep RL

Autores: Lin, Zeyang; Lai, Jun; Chen, Xiliang; Cao, Lei; Wang, Jun

Idioma: Inglés

Editor: MDPI

Año: 2022

Descargar PDF

Acceso abierto

Artículo científico

2022

Aprendiendo a utilizar la curiosidad: un nuevo enfoque de aprendizaje de currículo automático para Deep RL

Categoría

Matemáticas

Subcategoría

Matemáticas generales

Palabras clave

Aprendizaje por refuerzo

Aprendizaje automático de currículo

Sistema multiagente

Entorno de recompensa escasa

Velocidad de convergencia

Modelo de curiosidad

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 34

Citaciones: Sin citaciones

En los últimos años, los algoritmos de aprendizaje por refuerzo basados en el aprendizaje automático del currículo han sido cada vez más aplicados a problemas de sistemas multiagente. Sin embargo, en entornos de recompensa escasa, los agentes de aprendizaje por refuerzo apenas reciben comentarios del entorno durante todo el proceso de entrenamiento, lo que conduce a una disminución en la velocidad de convergencia y la eficiencia de aprendizaje del algoritmo de aprendizaje por refuerzo del currículo. Basado en el algoritmo de aprendizaje automático del currículo, este artículo propone un método de aprendizaje por refuerzo del currículo basado en el modelo de curiosidad (CMCL). El método divide los criterios de clasificación del currículo en error de diferencia temporal y recompensa de curiosidad, utiliza el método de validación cruzada K-fold para evaluar la prioridad de dificultad de las muestras de tarea, utiliza el Módulo de Curiosidad Intrínseca (ICM) para evaluar la prioridad de curiosidad de las muestras de tarea y utiliza el factor del currículo para ajustar la probabilidad de aprendizaje de las muestras de tarea. Este estudio compara el algoritmo CMCL con otros algoritmos de referencia en entornos cooperativos-competitivos, y los resultados de la simulación experimental muestran que el método CMCL puede mejorar el rendimiento de entrenamiento y la robustez de los algoritmos de aprendizaje profundo por refuerzo multiagente.

Descripción

Otros recursos que podrían interesarte

Ver todas

Temas Virtualpro

Ver todas

Categoría

Subcategoría

Palabras clave

Licencia

Citación bibliográfica

Formato

¡Regístrate ahora y conoce todos los espacios virtuales disponibles para tu institución!

Otros recursos que podrían interesarte

Temas Virtualpro