Exploración jerárquica basada en motivación intrínseca para el aprendizaje de modelos y habilidades
Autores: Lu, Lina; Zhang, Wanpeng; Gu, Xueqiang; Chen, Jing
Idioma: Inglés
Editor: MDPI
Año: 2020
Acceso abierto
Artículo científico
2020
Exploración jerárquica basada en motivación intrínseca para el aprendizaje de modelos y habilidades
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Aprendizaje de habilidades jerárquicas
Recompensas escasas
Horizonte temporal largo
Exploración jerárquica basada en sorpresas
Aprendizaje de modelos
Aprendizaje de habilidades
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 27
Citaciones: Sin citaciones
El aprendizaje jerárquico de habilidades es una dirección de investigación importante en la inteligencia humana. Sin embargo, muchos problemas del mundo real tienen recompensas escasas y un horizonte temporal largo, lo que suele plantear desafíos en el aprendizaje jerárquico de habilidades y llevar a un rendimiento deficiente en la exploración ingenua. En este trabajo, proponemos un marco algorítmico llamado exploración jerárquica basada en la sorpresa para el aprendizaje de modelos y habilidades (Surprise-HEL). El marco aprovecha la motivación intrínseca basada en la sorpresa para mejorar la eficiencia del muestreo y promover la exploración. También combina la motivación intrínseca basada en la sorpresa y la exploración jerárquica para acelerar el aprendizaje de modelos y habilidades. Además, el marco incorpora reglas de aprendizaje incremental independientes de la recompensa y la técnica de alternancia entre el aprendizaje de modelos y la actualización de políticas para manejar las recompensas intrínsecas cambiantes y los modelos cambiantes. Estos trabajos permiten que el marco implemente el aprendizaje incremental y evolutivo de modelos y habilidades jerárquicas. Probamos Surprise-HEL en un dominio de referencia común: Household Robot Pickup and Place. Los resultados de la evaluación muestran que el marco Surprise-HEL puede mejorar significativamente la eficiencia del agente en el aprendizaje de modelos y habilidades en un dominio complejo típico.
Descripción
El aprendizaje jerárquico de habilidades es una dirección de investigación importante en la inteligencia humana. Sin embargo, muchos problemas del mundo real tienen recompensas escasas y un horizonte temporal largo, lo que suele plantear desafíos en el aprendizaje jerárquico de habilidades y llevar a un rendimiento deficiente en la exploración ingenua. En este trabajo, proponemos un marco algorítmico llamado exploración jerárquica basada en la sorpresa para el aprendizaje de modelos y habilidades (Surprise-HEL). El marco aprovecha la motivación intrínseca basada en la sorpresa para mejorar la eficiencia del muestreo y promover la exploración. También combina la motivación intrínseca basada en la sorpresa y la exploración jerárquica para acelerar el aprendizaje de modelos y habilidades. Además, el marco incorpora reglas de aprendizaje incremental independientes de la recompensa y la técnica de alternancia entre el aprendizaje de modelos y la actualización de políticas para manejar las recompensas intrínsecas cambiantes y los modelos cambiantes. Estos trabajos permiten que el marco implemente el aprendizaje incremental y evolutivo de modelos y habilidades jerárquicas. Probamos Surprise-HEL en un dominio de referencia común: Household Robot Pickup and Place. Los resultados de la evaluación muestran que el marco Surprise-HEL puede mejorar significativamente la eficiencia del agente en el aprendizaje de modelos y habilidades en un dominio complejo típico.