Estimación de pose de objeto a nivel de categoría a través de agrupación global de alto orden
Autores: Jiang, Changhong; Mu, Xiaoqiao; Zhang, Bingbing; Xie, Mujun; Liang, Chao
Idioma: Inglés
Editor: MDPI
Año: 2024
Acceso abierto
Artículo científico
2024
Estimación de pose de objeto a nivel de categoría a través de agrupación global de alto orden
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Estimación de la pose del objeto
Red de estimación de pose de alto orden
Características geométricas
Agrupación promedio global
Información contextual
Estimación de pose de vanguardia.
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 31
Citaciones: Sin citaciones
La estimación de la posición de objetos de nivel 6D en la categoría tiene como objetivo predecir la rotación, traslación y tamaño de instancias de objetos en cualquier escena. En los métodos de investigación actuales, el agrupamiento promedio global (de primer orden) se usa generalmente para explorar características geométricas, lo que solo puede capturar la información estadística de primer orden de las características y no utiliza completamente el potencial de la red. En este trabajo, proponemos una nueva red de estimación de pose de alto orden (HoPENet), que mejora la representación de características al recopilar estadísticas de alto orden para modelar características geométricas de alto orden en cada etapa de la red. HoPENet introduce un módulo de mejora global de alto orden y utiliza operaciones de agrupamiento global de alto orden para capturar la correlación entre características y fusionar información global. Además, este módulo puede capturar correlaciones estadísticas a largo plazo y hacer uso completo de la información contextual. La red completa finalmente obtiene una representación de características más discriminativa. Experimentos en dos puntos de referencia, el conjunto de datos virtual CAMERA25 y el conjunto de datos real REAL275, demuestran la efectividad de HoPENet, logrando un rendimiento de estimación de pose de última generación (SOTA).
Descripción
La estimación de la posición de objetos de nivel 6D en la categoría tiene como objetivo predecir la rotación, traslación y tamaño de instancias de objetos en cualquier escena. En los métodos de investigación actuales, el agrupamiento promedio global (de primer orden) se usa generalmente para explorar características geométricas, lo que solo puede capturar la información estadística de primer orden de las características y no utiliza completamente el potencial de la red. En este trabajo, proponemos una nueva red de estimación de pose de alto orden (HoPENet), que mejora la representación de características al recopilar estadísticas de alto orden para modelar características geométricas de alto orden en cada etapa de la red. HoPENet introduce un módulo de mejora global de alto orden y utiliza operaciones de agrupamiento global de alto orden para capturar la correlación entre características y fusionar información global. Además, este módulo puede capturar correlaciones estadísticas a largo plazo y hacer uso completo de la información contextual. La red completa finalmente obtiene una representación de características más discriminativa. Experimentos en dos puntos de referencia, el conjunto de datos virtual CAMERA25 y el conjunto de datos real REAL275, demuestran la efectividad de HoPENet, logrando un rendimiento de estimación de pose de última generación (SOTA).