Ajuste de Punto de Vista Colaborativo y Agarre a través del Aprendizaje por Refuerzo Profundo en Escenas de Desorden
Autores: Liu, Ning; Guo, Cangui; Liang, Rongzhao; Li, Deping
Idioma: Inglés
Editor: MDPI
Año: 2022
Acceso abierto
Artículo científico
2022
Ajuste de Punto de Vista Colaborativo y Agarre a través del Aprendizaje por Refuerzo Profundo en Escenas de Desorden
Categoría
Tecnología de Equipos y Accesorios
Subcategoría
Diseño de equipos y herramientas
Palabras clave
Agarre robótico
Método de múltiples puntos de vista
Capacidad de percepción del entorno
Sinergia de ajuste de puntos de vista y agarre
Aprendizaje profundo por refuerzo
Espacio de exploración de acciones dinámicas
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 18
Citaciones: Sin citaciones
Para el agarre robótico de objetos apilados aleatoriamente en un entorno desordenado, el método de múltiples puntos de vista activos puede mejorar el rendimiento del agarre al mejorar la capacidad de percepción del entorno. Sin embargo, en muchas escenas, es redundante utilizar siempre múltiples puntos de vista para la detección de agarre, lo que reducirá la eficiencia del agarre del robot. Para mejorar el rendimiento del agarre del robot, presentamos una estrategia de Sinergia de Ajuste de Punto de Vista y Agarre (VAGS) basada en el aprendizaje por refuerzo profundo que coordina directamente el ajuste del punto de vista y el agarre. Para la eficiencia de entrenamiento de VAGS, proponemos un método de Espacio de Exploración de Acción Dinámico (DAES) basado en -codicioso para reducir el tiempo de entrenamiento. Para abordar el problema de la recompensa escasa en el aprendizaje por refuerzo, se crea una función de recompensa para evaluar el impacto del ajuste de la pose de la cámara en el rendimiento del agarre. Según los hallazgos experimentales en simulación y en el mundo real, el método VAGS puede mejorar la tasa de éxito del agarre y la tasa de limpieza de la escena. En comparación con el agarre directo, nuestra estrategia propuesta aumenta la tasa de éxito del agarre y la tasa de limpieza de la escena en un 10.49% y un 11%.
Descripción
Para el agarre robótico de objetos apilados aleatoriamente en un entorno desordenado, el método de múltiples puntos de vista activos puede mejorar el rendimiento del agarre al mejorar la capacidad de percepción del entorno. Sin embargo, en muchas escenas, es redundante utilizar siempre múltiples puntos de vista para la detección de agarre, lo que reducirá la eficiencia del agarre del robot. Para mejorar el rendimiento del agarre del robot, presentamos una estrategia de Sinergia de Ajuste de Punto de Vista y Agarre (VAGS) basada en el aprendizaje por refuerzo profundo que coordina directamente el ajuste del punto de vista y el agarre. Para la eficiencia de entrenamiento de VAGS, proponemos un método de Espacio de Exploración de Acción Dinámico (DAES) basado en -codicioso para reducir el tiempo de entrenamiento. Para abordar el problema de la recompensa escasa en el aprendizaje por refuerzo, se crea una función de recompensa para evaluar el impacto del ajuste de la pose de la cámara en el rendimiento del agarre. Según los hallazgos experimentales en simulación y en el mundo real, el método VAGS puede mejorar la tasa de éxito del agarre y la tasa de limpieza de la escena. En comparación con el agarre directo, nuestra estrategia propuesta aumenta la tasa de éxito del agarre y la tasa de limpieza de la escena en un 10.49% y un 11%.