logo móvil
Contáctanos

Detección de objetos 3D monocular basada en la predicción de incertidumbre de puntos clave

Autores: Chen, Mu; Zhao, Huaici; Liu, Pengfei

Idioma: Inglés

Editor: MDPI

Año: 2021

Descargar PDF

Acceso abierto

Artículo científico
2021

Detección de objetos 3D monocular basada en la predicción de incertidumbre de puntos clave


Categoría

Tecnología de Equipos y Accesorios

Subcategoría

Diseño de equipos y herramientas

Palabras clave

Detección de objetos
Visión por computadora
Visión monocular
Predicción de puntos clave
Predicción de incertidumbre
Detección de objetos en 3D

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 32

Citaciones: Sin citaciones


Descripción
La detección de objetos tridimensionales (3D) es una tarea importante en el campo de la visión por máquina, en la que la detección de objetos 3D utilizando visión monocular es aún más desafiante. Observamos que la mayoría de los métodos monoculares existentes se centran en el diseño del marco de extracción de características o en las restricciones geométricas integradas, pero ignoran los posibles errores en el proceso intermedio de la tubería de detección. Estos errores pueden amplificarse aún más en los procesos posteriores. Después de explorar el marco de detección existente de puntos clave, encontramos que la precisión de la predicción de puntos clave afectará seriamente la solución de la posición del objeto 3D. Por lo tanto, proponemos una nueva red de predicción de incertidumbre de puntos clave (KUP-Net) para la detección de objetos 3D monoculares. En este trabajo, diseñamos un módulo de predicción de incertidumbre para caracterizar la incertidumbre que existe en la predicción de puntos clave. Luego, la incertidumbre se utiliza para la optimización conjunta con la posición del objeto. Además, adoptamos la codificación de posición para ayudar en la predicción de incertidumbre y utilizamos un coeficiente de tiempo para optimizar el proceso de aprendizaje. Los experimentos en nuestro detector se realizan en el benchmark. Para los dos niveles de fácil y moderado, logramos una precisión de 17.26 y 11.78, y logramos una precisión de 23.59 y 16.63, que son más altas que el último método KM3D.

Otros recursos que podrían interesarte

Temas Virtualpro