Una Red de Votación de Puntos Clave 3D para la Estimación de Pose 6DoF en Escenas Interiores
Autores: Liu, Huikai; Liu, Gaorui; Zhang, Yue; Lei, Linjian; Xie, Hui; Li, Yan; Sun, Shengli
Idioma: Inglés
Editor: MDPI
Año: 2021
Acceso abierto
Artículo científico
2021
Una Red de Votación de Puntos Clave 3D para la Estimación de Pose 6DoF en Escenas Interiores
Categoría
Tecnología de Equipos y Accesorios
Subcategoría
Diseño de equipos y herramientas
Palabras clave
Problema
Nivel de instancia
Estimación de pose
Imagen RGBD
Puntos clave
Red
Atención
Característica RGB
Bloque de atención dividida
Puntos clave ORB
Algoritmo FPS
Selección de puntos clave
Conjunto de datos Linemod
Conjunto de datos YCB-Video
Resultados experimentales.
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 20
Citaciones: Sin citaciones
Este documento aborda el problema de la estimación de pose 6DoF a nivel de instancia a partir de una única imagen RGBD en una escena interior. Muchos trabajos recientes han demostrado que una red de dos etapas, que primero detecta los puntos clave y luego regresa los puntos clave para la estimación de pose 6D, logra un rendimiento notable. Sin embargo, los métodos anteriores prestan poca atención a la atención por canal y los puntos clave no se seleccionan mediante el uso integral de la información RGBD, lo que limita el rendimiento de la red. Para mejorar la capacidad de representación de características RGB, se propone un bloque modular de Atención Dividida que permite la atención a través de grupos de mapas de características. Además, al combinar los puntos clave Oriented FAST y Rotated BRIEF (ORB) con el algoritmo de Muestra del Punto Más Lejano (FPS), se presenta un método de selección de puntos clave simple pero efectivo llamado ORB-FPS para evitar que los puntos clave aparezcan en regiones no salientes. El algoritmo propuesto se prueba en los conjuntos de datos Linemod y YCB-Video, y los resultados experimentales demuestran que nuestro método supera los enfoques actuales, logrando una precisión ADD(S) del 94.5% en el conjunto de datos Linemod y del 91.4% en el conjunto de datos YCB-Video.
Descripción
Este documento aborda el problema de la estimación de pose 6DoF a nivel de instancia a partir de una única imagen RGBD en una escena interior. Muchos trabajos recientes han demostrado que una red de dos etapas, que primero detecta los puntos clave y luego regresa los puntos clave para la estimación de pose 6D, logra un rendimiento notable. Sin embargo, los métodos anteriores prestan poca atención a la atención por canal y los puntos clave no se seleccionan mediante el uso integral de la información RGBD, lo que limita el rendimiento de la red. Para mejorar la capacidad de representación de características RGB, se propone un bloque modular de Atención Dividida que permite la atención a través de grupos de mapas de características. Además, al combinar los puntos clave Oriented FAST y Rotated BRIEF (ORB) con el algoritmo de Muestra del Punto Más Lejano (FPS), se presenta un método de selección de puntos clave simple pero efectivo llamado ORB-FPS para evitar que los puntos clave aparezcan en regiones no salientes. El algoritmo propuesto se prueba en los conjuntos de datos Linemod y YCB-Video, y los resultados experimentales demuestran que nuestro método supera los enfoques actuales, logrando una precisión ADD(S) del 94.5% en el conjunto de datos Linemod y del 91.4% en el conjunto de datos YCB-Video.