Rff-posenet: una red de estimación de pose de objeto 6d basada en fusión de características robusta en escenas complejas
Autores: Lei, Xiaomei; Lu, Wenhuan; Yong, Jiu; Wei, Jianguo
Idioma: Inglés
Editor: MDPI
Año: 2024
Acceso abierto
Artículo científico
2024
Rff-posenet: una red de estimación de pose de objeto 6d basada en fusión de características robusta en escenas complejas
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Estimación de la posición del objeto
6d
Rff-posenet
Escenas complejas
Fusión de características
Rendimiento en tiempo real
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 40
Citaciones: Sin citaciones
La estimación de la pose de objetos de seis grados de libertad (6D) juega un papel importante en el reconocimiento de patrones en campos como la robótica y la realidad aumentada. Sin embargo, existen problemas con la baja precisión y el rendimiento en tiempo real de la estimación de la pose de objetos 6D en escenas complejas. Para abordar estos desafíos, en este artículo se propone RFF-PoseNet (una red de estimación de la pose de objetos 6D basada en una fusión robusta de características) para escenas complejas. En primer lugar, se utiliza un módulo Ghost más ligero para reemplazar los bloques convolucionales en la red de extracción de características. Luego, se agrega un módulo de agrupamiento piramidal a la rama de etiquetas semánticas de PoseCNN para fusionar las características de diferentes capas de agrupamiento y mejorar la capacidad de la red para capturar información sobre objetos en escenas complejas y las correlaciones entre la información contextual. Finalmente, se utiliza un módulo de regresión y optimización de pose para mejorar aún más la estimación de la pose de objetos en escenas complejas. Experimentos de simulación realizados en los conjuntos de datos YCB-Video y Occlusion LineMOD muestran que el algoritmo RFF-PoseNet puede fortalecer la correlación de características entre diferentes niveles y la capacidad de reconocimiento de objetivos poco claros, logrando así una excelente precisión y rendimiento en tiempo real, así como una fuerte robustez.
Descripción
La estimación de la pose de objetos de seis grados de libertad (6D) juega un papel importante en el reconocimiento de patrones en campos como la robótica y la realidad aumentada. Sin embargo, existen problemas con la baja precisión y el rendimiento en tiempo real de la estimación de la pose de objetos 6D en escenas complejas. Para abordar estos desafíos, en este artículo se propone RFF-PoseNet (una red de estimación de la pose de objetos 6D basada en una fusión robusta de características) para escenas complejas. En primer lugar, se utiliza un módulo Ghost más ligero para reemplazar los bloques convolucionales en la red de extracción de características. Luego, se agrega un módulo de agrupamiento piramidal a la rama de etiquetas semánticas de PoseCNN para fusionar las características de diferentes capas de agrupamiento y mejorar la capacidad de la red para capturar información sobre objetos en escenas complejas y las correlaciones entre la información contextual. Finalmente, se utiliza un módulo de regresión y optimización de pose para mejorar aún más la estimación de la pose de objetos en escenas complejas. Experimentos de simulación realizados en los conjuntos de datos YCB-Video y Occlusion LineMOD muestran que el algoritmo RFF-PoseNet puede fortalecer la correlación de características entre diferentes niveles y la capacidad de reconocimiento de objetivos poco claros, logrando así una excelente precisión y rendimiento en tiempo real, así como una fuerte robustez.