logo móvil
Contáctanos

Un algoritmo de estimación mejorado de la pose de objetivos espaciales basado en la fusión de características multi-modales

Autores: Hua, Jiang; Hao, Tonglin; Zeng, Liangcai; Yu, Gui

Idioma: Inglés

Editor: MDPI

Año: 2021

Descargar PDF

Acceso abierto

Artículo científico
2021

Un algoritmo de estimación mejorado de la pose de objetivos espaciales basado en la fusión de características multi-modales


Categoría

Matemáticas

Subcategoría

Matemáticas generales

Palabras clave

Métodos de estimación tradicionales
Objetivos espaciales
Tecnología de aprendizaje profundo
Redes neuronales
Estimación de postura
Algoritmo
Segmentación de instancias
Imagen de nube de puntos
Mapa de profundidad
Parámetros de cámara
Fusión de características multimodales
Conjunto de datos YCB-Video
Imágenes complejas
Estimación rápida de postura
Objetos apilados
Estabilidad

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 36

Citaciones: Sin citaciones


Descripción
Los métodos tradicionales de estimación de la pose de objetivos espaciales se basan en características artificiales para igualar la relación de transformación entre la imagen y el modelo del objeto. Con la explosión de la tecnología de aprendizaje profundo, el enfoque basado en redes neuronales profundas (DNN) ha mejorado significativamente el rendimiento de la estimación de pose. Sin embargo, los métodos actuales todavía tienen problemas como cálculos complejos, baja precisión y pobre rendimiento en tiempo real. Por lo tanto, en este documento se propone un nuevo algoritmo de estimación de pose. Primero, se obtiene la imagen de máscara del objetivo mediante el algoritmo de segmentación de instancias, y su imagen de nube de puntos se obtiene en base a un mapa de profundidad combinado con parámetros de cámara. Finalmente, se establece la correlación entre puntos para realizar la predicción de la pose basada en la fusión de características multimodales. Los resultados experimentales en el conjunto de datos YCB-Video muestran que el algoritmo propuesto puede reconocer imágenes complejas a una velocidad de aproximadamente 24 imágenes por segundo con una precisión de más del 80%. En conclusión, el algoritmo propuesto puede realizar una estimación rápida de la pose para objetos apilados complejos y tiene una fuerte estabilidad para diferentes objetos.

Otros recursos que podrían interesarte

Temas Virtualpro