Detección de objetos 3D monocular basada en la predicción de incertidumbre de puntos clave
Autores: Chen, Mu; Zhao, Huaici; Liu, Pengfei
Idioma: Inglés
Editor: MDPI
Año: 2021
Acceso abierto
Artículo científico
2021
Detección de objetos 3D monocular basada en la predicción de incertidumbre de puntos clave
Categoría
Tecnología de Equipos y Accesorios
Subcategoría
Diseño de equipos y herramientas
Palabras clave
Detección de objetos
Visión por computadora
Visión monocular
Predicción de puntos clave
Predicción de incertidumbre
Detección de objetos en 3D
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 32
Citaciones: Sin citaciones
La detección de objetos tridimensionales (3D) es una tarea importante en el campo de la visión por máquina, en la que la detección de objetos 3D utilizando visión monocular es aún más desafiante. Observamos que la mayoría de los métodos monoculares existentes se centran en el diseño del marco de extracción de características o en las restricciones geométricas integradas, pero ignoran los posibles errores en el proceso intermedio de la tubería de detección. Estos errores pueden amplificarse aún más en los procesos posteriores. Después de explorar el marco de detección existente de puntos clave, encontramos que la precisión de la predicción de puntos clave afectará seriamente la solución de la posición del objeto 3D. Por lo tanto, proponemos una nueva red de predicción de incertidumbre de puntos clave (KUP-Net) para la detección de objetos 3D monoculares. En este trabajo, diseñamos un módulo de predicción de incertidumbre para caracterizar la incertidumbre que existe en la predicción de puntos clave. Luego, la incertidumbre se utiliza para la optimización conjunta con la posición del objeto. Además, adoptamos la codificación de posición para ayudar en la predicción de incertidumbre y utilizamos un coeficiente de tiempo para optimizar el proceso de aprendizaje. Los experimentos en nuestro detector se realizan en el benchmark. Para los dos niveles de fácil y moderado, logramos una precisión de 17.26 y 11.78, y logramos una precisión de 23.59 y 16.63, que son más altas que el último método KM3D.
Descripción
La detección de objetos tridimensionales (3D) es una tarea importante en el campo de la visión por máquina, en la que la detección de objetos 3D utilizando visión monocular es aún más desafiante. Observamos que la mayoría de los métodos monoculares existentes se centran en el diseño del marco de extracción de características o en las restricciones geométricas integradas, pero ignoran los posibles errores en el proceso intermedio de la tubería de detección. Estos errores pueden amplificarse aún más en los procesos posteriores. Después de explorar el marco de detección existente de puntos clave, encontramos que la precisión de la predicción de puntos clave afectará seriamente la solución de la posición del objeto 3D. Por lo tanto, proponemos una nueva red de predicción de incertidumbre de puntos clave (KUP-Net) para la detección de objetos 3D monoculares. En este trabajo, diseñamos un módulo de predicción de incertidumbre para caracterizar la incertidumbre que existe en la predicción de puntos clave. Luego, la incertidumbre se utiliza para la optimización conjunta con la posición del objeto. Además, adoptamos la codificación de posición para ayudar en la predicción de incertidumbre y utilizamos un coeficiente de tiempo para optimizar el proceso de aprendizaje. Los experimentos en nuestro detector se realizan en el benchmark. Para los dos niveles de fácil y moderado, logramos una precisión de 17.26 y 11.78, y logramos una precisión de 23.59 y 16.63, que son más altas que el último método KM3D.