Samfenet: red de codificación de fusión de características multi-escala basada en autoatención y restricción de información de bordes para estimación de pose 6D
Autores: Li, Zhuoxiao; Li, Xiaobing; Chen, Shihao; Du, Jialong; Li, Yong
Idioma: Inglés
Editor: MDPI
Año: 2022
Acceso abierto
Artículo científico
2022
Samfenet: red de codificación de fusión de características multi-escala basada en autoatención y restricción de información de bordes para estimación de pose 6D
Categoría
Matemáticas
Subcategoría
Matemáticas generales
Palabras clave
Estimación precisa
Pose de 6d
Manipuladores robóticos
Basado en autoatención
Fusión de características
Información de borde
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 21
Citaciones: Sin citaciones
La estimación precisa de la posición 6D de un objeto es una de las tecnologías cruciales para los manipuladores robóticos. Especialmente cuando las condiciones de iluminación cambian o el objeto está oculto, lo que resulta en la falta o la interferencia de la información del objeto, lo que hace que la estimación precisa de la posición 6D sea más desafiante. Para estimar con precisión la posición 6D del objeto, se propone una red de estimación de posición 6D basada en autoatención, fusión de características de múltiples escalas y restricción de información de bordes, que puede lograr una estimación precisa de la posición 6D empleando imágenes RGB-D. El algoritmo propuesto primero introduce el módulo de reconstrucción de bordes en la red de estimación de posición, lo que mejora la atención de la red de extracción de características a las características de los bordes. Además, se propone un módulo de extracción de características de nube de puntos de autoatención multi-escala, es decir, MSPNet, para extraer características geométricas de la nube de puntos, que se reconstruyen a partir de mapas de profundidad. Finalmente, se propone el módulo de codificación de características de agrupamiento, es decir, SE-NetVLAD, para codificar secuencias de características densas multimodales y construir características globales más expresivas. El método propuesto se evalúa en los conjuntos de datos LineMOD y YCB-Video, y los resultados experimentales ilustran que el método propuesto tiene un rendimiento sobresaliente, que se acerca a los métodos actuales más avanzados.
Descripción
La estimación precisa de la posición 6D de un objeto es una de las tecnologías cruciales para los manipuladores robóticos. Especialmente cuando las condiciones de iluminación cambian o el objeto está oculto, lo que resulta en la falta o la interferencia de la información del objeto, lo que hace que la estimación precisa de la posición 6D sea más desafiante. Para estimar con precisión la posición 6D del objeto, se propone una red de estimación de posición 6D basada en autoatención, fusión de características de múltiples escalas y restricción de información de bordes, que puede lograr una estimación precisa de la posición 6D empleando imágenes RGB-D. El algoritmo propuesto primero introduce el módulo de reconstrucción de bordes en la red de estimación de posición, lo que mejora la atención de la red de extracción de características a las características de los bordes. Además, se propone un módulo de extracción de características de nube de puntos de autoatención multi-escala, es decir, MSPNet, para extraer características geométricas de la nube de puntos, que se reconstruyen a partir de mapas de profundidad. Finalmente, se propone el módulo de codificación de características de agrupamiento, es decir, SE-NetVLAD, para codificar secuencias de características densas multimodales y construir características globales más expresivas. El método propuesto se evalúa en los conjuntos de datos LineMOD y YCB-Video, y los resultados experimentales ilustran que el método propuesto tiene un rendimiento sobresaliente, que se acerca a los métodos actuales más avanzados.