Un red de estimación de posición 6D ligero basado en una mejora de la agrupación piramidal espacial atrous
Autores: Wang, Fupan; Tang, Xiaohang; Wu, Yadong; Wang, Yinfan; Chen, Huarong; Wang, Guijuan; Liao, Jing
Idioma: Inglés
Editor: MDPI
Año: 2024
Acceso abierto
Artículo científico
2024
Un red de estimación de posición 6D ligero basado en una mejora de la agrupación piramidal espacial atrous
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Redes neuronales
Estimación de postura
Ligero
Precisión
Robustez
Convolución
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 40
Citaciones: Sin citaciones
Es difícil para las redes neuronales livianas producir efectos precisos de estimación de posición 6DoF debido a que su precisión se ve afectada por cambios de escala. Para resolver este problema, proponemos un método con buen rendimiento y robustez basado en investigaciones previas. El método mejorado basado en PVNet utiliza convolución de profundidad para construir una red liviana. Además, se utilizan atención de coordenadas y agrupación de pirámide espacial atrous para garantizar precisión y robustez. Este método reduce efectivamente el tamaño de la red y la complejidad computacional y es un método liviano de estimación de posición 6DoF basado en imágenes RGB monoculares. Los experimentos en conjuntos de datos públicos y conjuntos de datos creados muestran que la precisión de estimación promedio ADD(-S) y el índice de proyección 2D del método mejorado se mejoran. Para conjuntos de datos con grandes cambios en la escala del objeto, la precisión de la estimación del promedio ADD(-S) se mejora significativamente.
Descripción
Es difícil para las redes neuronales livianas producir efectos precisos de estimación de posición 6DoF debido a que su precisión se ve afectada por cambios de escala. Para resolver este problema, proponemos un método con buen rendimiento y robustez basado en investigaciones previas. El método mejorado basado en PVNet utiliza convolución de profundidad para construir una red liviana. Además, se utilizan atención de coordenadas y agrupación de pirámide espacial atrous para garantizar precisión y robustez. Este método reduce efectivamente el tamaño de la red y la complejidad computacional y es un método liviano de estimación de posición 6DoF basado en imágenes RGB monoculares. Los experimentos en conjuntos de datos públicos y conjuntos de datos creados muestran que la precisión de estimación promedio ADD(-S) y el índice de proyección 2D del método mejorado se mejoran. Para conjuntos de datos con grandes cambios en la escala del objeto, la precisión de la estimación del promedio ADD(-S) se mejora significativamente.