FusionNetV2: mejora explícita de las características de borde para la estimación de la pose de objetos en 6D
Autores: Ye, Yuning; Park, Hanhoon
Idioma: Inglés
Editor: MDPI
Año: 2024
Acceso abierto
Artículo científico
2024
FusionNetV2: mejora explícita de las características de borde para la estimación de la pose de objetos en 6D
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Fusionnet
Redes neuronales convolucionales
Transformadores
Mecanismos de atención
Bloque de refuerzo de bordes
Estimación de la pose de objetos en 6d
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 37
Citaciones: Sin citaciones
FusionNet es un modelo híbrido que incorpora redes neuronales convolucionales y Transformers, logrando un rendimiento de vanguardia en la estimación de la posición de objetos en 6D mientras reduce significativamente el número de parámetros del modelo. Nuestro estudio revela que FusionNet tiene mecanismos de atención locales y globales para mejorar las características profundas en dos caminos y que los mecanismos de atención juegan un papel en mejorar implícitamente las características alrededor de los bordes de los objetos. Encontramos que mejorar las características alrededor de los bordes de los objetos fue la razón principal de la mejora en el rendimiento en la estimación de la posición de objetos en 6D. Por lo tanto, en este estudio, intentamos mejorar las características alrededor de los bordes de los objetos de manera explícita e intuitiva. Con este fin, se introduce un bloque de refuerzo de bordes (EBB) que reemplaza a los bloques de atención responsables de la atención local en FusionNet. EBB es ligero y se puede aplicar directamente a FusionNet con modificaciones mínimas. EBB mejoró significativamente el rendimiento de FusionNet en la estimación de la posición de objetos en 6D en experimentos en el conjunto de datos LINEMOD.
Descripción
FusionNet es un modelo híbrido que incorpora redes neuronales convolucionales y Transformers, logrando un rendimiento de vanguardia en la estimación de la posición de objetos en 6D mientras reduce significativamente el número de parámetros del modelo. Nuestro estudio revela que FusionNet tiene mecanismos de atención locales y globales para mejorar las características profundas en dos caminos y que los mecanismos de atención juegan un papel en mejorar implícitamente las características alrededor de los bordes de los objetos. Encontramos que mejorar las características alrededor de los bordes de los objetos fue la razón principal de la mejora en el rendimiento en la estimación de la posición de objetos en 6D. Por lo tanto, en este estudio, intentamos mejorar las características alrededor de los bordes de los objetos de manera explícita e intuitiva. Con este fin, se introduce un bloque de refuerzo de bordes (EBB) que reemplaza a los bloques de atención responsables de la atención local en FusionNet. EBB es ligero y se puede aplicar directamente a FusionNet con modificaciones mínimas. EBB mejoró significativamente el rendimiento de FusionNet en la estimación de la posición de objetos en 6D en experimentos en el conjunto de datos LINEMOD.