Navegación visual utilizando aprendizaje por refuerzo inverso y una máquina de aprendizaje extremo
Autores: Fang, Qiang; Zhang, Wenzhuo; Wang, Xitong
Idioma: Inglés
Editor: MDPI
Año: 2021
Acceso abierto
Artículo científico
2021
Navegación visual utilizando aprendizaje por refuerzo inverso y una máquina de aprendizaje extremo
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Desafíos
Eficiencia del entrenamiento
Funciones de recompensa
Generalización
Aprendizaje por refuerzo
Navegación
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 35
Citaciones: Sin citaciones
En este documento, nos enfocamos en los desafíos de eficiencia de entrenamiento, la designación de funciones de recompensa y la generalización en el aprendizaje por refuerzo para la navegación visual y proponemos un enfoque de aprendizaje inverso basado en máquinas de aprendizaje extremo regularizadas (RELM-IRL) para mejorar el rendimiento de navegación. Nuestras contribuciones son principalmente tres: En primer lugar, se presenta un marco que combina máquinas de aprendizaje extremo con aprendizaje inverso. Este marco puede mejorar la eficiencia de muestra y obtener la función de recompensa directamente de la información de imagen observada por el agente y mejorar la generación para el nuevo objetivo y el nuevo entorno. En segundo lugar, la máquina de aprendizaje extremo se regulariza mediante regresión dispersa de múltiples respuestas y el método de dejar uno fuera, lo que puede mejorar aún más la capacidad de generalización. Experimentos de simulación en el entorno AI-THOR mostraron que el enfoque propuesto superó a enfoques anteriores de extremo a extremo, demostrando así la efectividad y eficiencia de nuestro enfoque.
Descripción
En este documento, nos enfocamos en los desafíos de eficiencia de entrenamiento, la designación de funciones de recompensa y la generalización en el aprendizaje por refuerzo para la navegación visual y proponemos un enfoque de aprendizaje inverso basado en máquinas de aprendizaje extremo regularizadas (RELM-IRL) para mejorar el rendimiento de navegación. Nuestras contribuciones son principalmente tres: En primer lugar, se presenta un marco que combina máquinas de aprendizaje extremo con aprendizaje inverso. Este marco puede mejorar la eficiencia de muestra y obtener la función de recompensa directamente de la información de imagen observada por el agente y mejorar la generación para el nuevo objetivo y el nuevo entorno. En segundo lugar, la máquina de aprendizaje extremo se regulariza mediante regresión dispersa de múltiples respuestas y el método de dejar uno fuera, lo que puede mejorar aún más la capacidad de generalización. Experimentos de simulación en el entorno AI-THOR mostraron que el enfoque propuesto superó a enfoques anteriores de extremo a extremo, demostrando así la efectividad y eficiencia de nuestro enfoque.