Un nuevo algoritmo de detección de agarre con segmentación semántica de múltiples objetivos para que un robot manipule objetos desordenados
Autores: Zhong, Xungao; Chen, Yijun; Luo, Jiaguo; Shi, Chaoquan; Hu, Huosheng
Idioma: Inglés
Editor: MDPI
Año: 2024
Acceso abierto
Artículo científico
2024
Un nuevo algoritmo de detección de agarre con segmentación semántica de múltiples objetivos para que un robot manipule objetos desordenados
Categoría
Tecnología de Equipos y Accesorios
Subcategoría
Diseño de equipos y herramientas
Palabras clave
Objetos
Entornos desordenados
Manipulación de agarre de robots
Métodos de segmentación
Algoritmo de detección de agarre
Modelo de segmentación semántica
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 20
Citaciones: Sin citaciones
Los objetos en entornos desordenados pueden tener tamaños y formas similares, lo que sigue siendo un gran desafío para la manipulación de agarre de robots. Los métodos de segmentación existentes, como Mask R-CNN y Yolo-v8, tienden a perder los detalles de forma de los objetos al tratar con escenas desordenadas, y esta pérdida de detalle limita el rendimiento de agarre de los robots en entornos complejos. Este artículo propone un algoritmo de detección de agarre de alto rendimiento con un modelo de segmentación semántica de múltiples objetivos, que puede mejorar efectivamente la tasa de éxito de agarre de un robot en entornos desordenados. El algoritmo consta de dos cascadas: módulos de Segmentación Semántica y Detección de Agarre (SS-GD), en el que la red base del módulo de segmentación semántica se desarrolla utilizando la estructura de vanguardia Swin Transformer. Puede extraer las características detalladas de los objetos en entornos desordenados y permitir que un robot entienda la posición y forma del objeto candidato. Para construir el esquema de agarre, SS-GD se centró en características visuales importantes, y se diseñó un módulo de detección de agarre basado en el mecanismo de atención Squeeze-and-Excitation (SE), para predecir con precisión la configuración de agarre correspondiente. Los experimentos de detección de agarre se llevaron a cabo en una plataforma de robot UR5 real para verificar la robustez y generalización del método SS-GD propuesto en entornos desordenados. Se logró una mejor tasa de éxito de agarre del 91.7% para espacios de trabajo desordenados de múltiples objetivos.
Descripción
Los objetos en entornos desordenados pueden tener tamaños y formas similares, lo que sigue siendo un gran desafío para la manipulación de agarre de robots. Los métodos de segmentación existentes, como Mask R-CNN y Yolo-v8, tienden a perder los detalles de forma de los objetos al tratar con escenas desordenadas, y esta pérdida de detalle limita el rendimiento de agarre de los robots en entornos complejos. Este artículo propone un algoritmo de detección de agarre de alto rendimiento con un modelo de segmentación semántica de múltiples objetivos, que puede mejorar efectivamente la tasa de éxito de agarre de un robot en entornos desordenados. El algoritmo consta de dos cascadas: módulos de Segmentación Semántica y Detección de Agarre (SS-GD), en el que la red base del módulo de segmentación semántica se desarrolla utilizando la estructura de vanguardia Swin Transformer. Puede extraer las características detalladas de los objetos en entornos desordenados y permitir que un robot entienda la posición y forma del objeto candidato. Para construir el esquema de agarre, SS-GD se centró en características visuales importantes, y se diseñó un módulo de detección de agarre basado en el mecanismo de atención Squeeze-and-Excitation (SE), para predecir con precisión la configuración de agarre correspondiente. Los experimentos de detección de agarre se llevaron a cabo en una plataforma de robot UR5 real para verificar la robustez y generalización del método SS-GD propuesto en entornos desordenados. Se logró una mejor tasa de éxito de agarre del 91.7% para espacios de trabajo desordenados de múltiples objetivos.