logo móvil
Contáctanos

Una Red de Votación de Puntos Clave 3D para la Estimación de Pose 6DoF en Escenas Interiores

Autores: Liu, Huikai; Liu, Gaorui; Zhang, Yue; Lei, Linjian; Xie, Hui; Li, Yan; Sun, Shengli

Idioma: Inglés

Editor: MDPI

Año: 2021

Descargar PDF

Acceso abierto

Artículo científico
2021

Una Red de Votación de Puntos Clave 3D para la Estimación de Pose 6DoF en Escenas Interiores


Categoría

Tecnología de Equipos y Accesorios

Subcategoría

Diseño de equipos y herramientas

Palabras clave

Problema
Nivel de instancia
Estimación de pose
Imagen RGBD
Puntos clave
Red
Atención
Característica RGB
Bloque de atención dividida
Puntos clave ORB
Algoritmo FPS
Selección de puntos clave
Conjunto de datos Linemod
Conjunto de datos YCB-Video
Resultados experimentales.

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 20

Citaciones: Sin citaciones


Descripción
Este documento aborda el problema de la estimación de pose 6DoF a nivel de instancia a partir de una única imagen RGBD en una escena interior. Muchos trabajos recientes han demostrado que una red de dos etapas, que primero detecta los puntos clave y luego regresa los puntos clave para la estimación de pose 6D, logra un rendimiento notable. Sin embargo, los métodos anteriores prestan poca atención a la atención por canal y los puntos clave no se seleccionan mediante el uso integral de la información RGBD, lo que limita el rendimiento de la red. Para mejorar la capacidad de representación de características RGB, se propone un bloque modular de Atención Dividida que permite la atención a través de grupos de mapas de características. Además, al combinar los puntos clave Oriented FAST y Rotated BRIEF (ORB) con el algoritmo de Muestra del Punto Más Lejano (FPS), se presenta un método de selección de puntos clave simple pero efectivo llamado ORB-FPS para evitar que los puntos clave aparezcan en regiones no salientes. El algoritmo propuesto se prueba en los conjuntos de datos Linemod y YCB-Video, y los resultados experimentales demuestran que nuestro método supera los enfoques actuales, logrando una precisión ADD(S) del 94.5% en el conjunto de datos Linemod y del 91.4% en el conjunto de datos YCB-Video.

Otros recursos que podrían interesarte

Temas Virtualpro