Un algoritmo de estimación mejorado de la pose de objetivos espaciales basado en la fusión de características multi-modales

Contáctanos

Temas

Artículos

XBooks

Revistas

Laboratorios

Showroom

Infografías

Recorridos

Videos

Perfiles

Actualidad

Un algoritmo de estimación mejorado de la pose de objetivos espaciales basado en la fusión de características multi-modales

Autores: Hua, Jiang; Hao, Tonglin; Zeng, Liangcai; Yu, Gui

Idioma: Inglés

Editor: MDPI

Año: 2021

Descargar PDF

Acceso abierto

Artículo científico

2021

Un algoritmo de estimación mejorado de la pose de objetivos espaciales basado en la fusión de características multi-modales

Categoría

Matemáticas

Subcategoría

Matemáticas generales

Palabras clave

Métodos de estimación tradicionales

Objetivos espaciales

Tecnología de aprendizaje profundo

Redes neuronales

Estimación de postura

Algoritmo

Segmentación de instancias

Imagen de nube de puntos

Mapa de profundidad

Parámetros de cámara

Fusión de características multimodales

Conjunto de datos YCB-Video

Imágenes complejas

Estimación rápida de postura

Objetos apilados

Estabilidad

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 36

Citaciones: Sin citaciones

Los métodos tradicionales de estimación de la pose de objetivos espaciales se basan en características artificiales para igualar la relación de transformación entre la imagen y el modelo del objeto. Con la explosión de la tecnología de aprendizaje profundo, el enfoque basado en redes neuronales profundas (DNN) ha mejorado significativamente el rendimiento de la estimación de pose. Sin embargo, los métodos actuales todavía tienen problemas como cálculos complejos, baja precisión y pobre rendimiento en tiempo real. Por lo tanto, en este documento se propone un nuevo algoritmo de estimación de pose. Primero, se obtiene la imagen de máscara del objetivo mediante el algoritmo de segmentación de instancias, y su imagen de nube de puntos se obtiene en base a un mapa de profundidad combinado con parámetros de cámara. Finalmente, se establece la correlación entre puntos para realizar la predicción de la pose basada en la fusión de características multimodales. Los resultados experimentales en el conjunto de datos YCB-Video muestran que el algoritmo propuesto puede reconocer imágenes complejas a una velocidad de aproximadamente 24 imágenes por segundo con una precisión de más del 80%. En conclusión, el algoritmo propuesto puede realizar una estimación rápida de la pose para objetos apilados complejos y tiene una fuerte estabilidad para diferentes objetos.

Descripción

Otros recursos que podrían interesarte

Ver todas

Temas Virtualpro

Ver todas

Categoría

Subcategoría

Palabras clave

Licencia

Citación bibliográfica

Formato

¡Regístrate ahora y conoce todos los espacios virtuales disponibles para tu institución!

Otros recursos que podrían interesarte

Temas Virtualpro