Exploración jerárquica basada en motivación intrínseca para el aprendizaje de modelos y habilidades

Contáctanos

Temas

Artículos

XBooks

Revistas

Laboratorios

Showroom

Infografías

Recorridos

Videos

Perfiles

Actualidad

Exploración jerárquica basada en motivación intrínseca para el aprendizaje de modelos y habilidades

Autores: Lu, Lina; Zhang, Wanpeng; Gu, Xueqiang; Chen, Jing

Idioma: Inglés

Editor: MDPI

Año: 2020

Descargar PDF

Acceso abierto

Artículo científico

2020

Exploración jerárquica basada en motivación intrínseca para el aprendizaje de modelos y habilidades

Categoría

Ingeniería y Tecnología

Subcategoría

Ingeniería Eléctrica y Electrónica

Palabras clave

Aprendizaje de habilidades jerárquicas

Recompensas escasas

Horizonte temporal largo

Exploración jerárquica basada en sorpresas

Aprendizaje de modelos

Aprendizaje de habilidades

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 27

Citaciones: Sin citaciones

El aprendizaje jerárquico de habilidades es una dirección de investigación importante en la inteligencia humana. Sin embargo, muchos problemas del mundo real tienen recompensas escasas y un horizonte temporal largo, lo que suele plantear desafíos en el aprendizaje jerárquico de habilidades y llevar a un rendimiento deficiente en la exploración ingenua. En este trabajo, proponemos un marco algorítmico llamado exploración jerárquica basada en la sorpresa para el aprendizaje de modelos y habilidades (Surprise-HEL). El marco aprovecha la motivación intrínseca basada en la sorpresa para mejorar la eficiencia del muestreo y promover la exploración. También combina la motivación intrínseca basada en la sorpresa y la exploración jerárquica para acelerar el aprendizaje de modelos y habilidades. Además, el marco incorpora reglas de aprendizaje incremental independientes de la recompensa y la técnica de alternancia entre el aprendizaje de modelos y la actualización de políticas para manejar las recompensas intrínsecas cambiantes y los modelos cambiantes. Estos trabajos permiten que el marco implemente el aprendizaje incremental y evolutivo de modelos y habilidades jerárquicas. Probamos Surprise-HEL en un dominio de referencia común: Household Robot Pickup and Place. Los resultados de la evaluación muestran que el marco Surprise-HEL puede mejorar significativamente la eficiencia del agente en el aprendizaje de modelos y habilidades en un dominio complejo típico.

Descripción

Otros recursos que podrían interesarte

Ver todas

Temas Virtualpro

Ver todas

Categoría

Subcategoría

Palabras clave

Licencia

Citación bibliográfica

Formato

¡Regístrate ahora y conoce todos los espacios virtuales disponibles para tu institución!

Otros recursos que podrían interesarte

Temas Virtualpro