Aprendizaje por Refuerzo para Operaciones de Recogida y Colocación en Robótica: Una Encuesta
Autores: Lobbezoo, Andrew; Qian, Yanjun; Kwon, Hyock-Ju
Idioma: Inglés
Editor: MDPI
Año: 2021
Acceso abierto
Artículo científico
2021
Aprendizaje por Refuerzo para Operaciones de Recogida y Colocación en Robótica: Una Encuesta
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Robótica
Palabras clave
Campo
Robótica
Aprendizaje por refuerzo
Operaciones de recogida y colocación
Optimización de políticas
Entorno de simulación
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 28
Citaciones: Sin citaciones
El campo de la robótica ha estado desarrollándose rápidamente en los últimos años, y el trabajo relacionado con la formación de agentes robóticos mediante aprendizaje por refuerzo ha sido un enfoque principal de investigación. Esta encuesta revisa la aplicación del aprendizaje por refuerzo para operaciones de recogida y colocación, una tarea que un robot logístico puede ser entrenado para completar sin el apoyo de un ingeniero en robótica. Para introducir este tema, primero revisamos los fundamentos del aprendizaje por refuerzo y varios métodos de optimización de políticas, como la iteración de valor y la búsqueda de políticas. A continuación, se examinan factores que tienen un impacto en la tarea de recogida y colocación, como la modelación de recompensas, el aprendizaje por imitación, la estimación de poses y el entorno de simulación. Tras la revisión de los fundamentos y factores clave para el aprendizaje por refuerzo, presentamos una extensa revisión de todos los métodos implementados por investigadores en el campo hasta la fecha. Se discuten las fortalezas y debilidades de cada método de la literatura, y se revisan los detalles sobre la contribución de cada manuscrito al campo. La discusión crítica final de la literatura disponible y el resumen de problemas abiertos indican que la validación de experimentos, la generalización de modelos y la selección de poses de agarre son temas que requieren investigación adicional.
Descripción
El campo de la robótica ha estado desarrollándose rápidamente en los últimos años, y el trabajo relacionado con la formación de agentes robóticos mediante aprendizaje por refuerzo ha sido un enfoque principal de investigación. Esta encuesta revisa la aplicación del aprendizaje por refuerzo para operaciones de recogida y colocación, una tarea que un robot logístico puede ser entrenado para completar sin el apoyo de un ingeniero en robótica. Para introducir este tema, primero revisamos los fundamentos del aprendizaje por refuerzo y varios métodos de optimización de políticas, como la iteración de valor y la búsqueda de políticas. A continuación, se examinan factores que tienen un impacto en la tarea de recogida y colocación, como la modelación de recompensas, el aprendizaje por imitación, la estimación de poses y el entorno de simulación. Tras la revisión de los fundamentos y factores clave para el aprendizaje por refuerzo, presentamos una extensa revisión de todos los métodos implementados por investigadores en el campo hasta la fecha. Se discuten las fortalezas y debilidades de cada método de la literatura, y se revisan los detalles sobre la contribución de cada manuscrito al campo. La discusión crítica final de la literatura disponible y el resumen de problemas abiertos indican que la validación de experimentos, la generalización de modelos y la selección de poses de agarre son temas que requieren investigación adicional.