Detección y seguimiento de objetos en tiempo real basado en dispositivos integrados para la generación de mapas dinámicos locales
Autores: Choi, Kyoungtaek; Moon, Jongwon; Jung, Ho Gi; Suhr, Jae Kyu
Idioma: Inglés
Editor: MDPI
Año: 2024
Acceso abierto
Artículo científico
2024
Detección y seguimiento de objetos en tiempo real basado en dispositivos integrados para la generación de mapas dinámicos locales
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Propone
Sistema de cámara
Generación de LDM
Detección de objetos
Seguimiento
Estimación de posición 3D
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 23
Citaciones: Sin citaciones
Este artículo propone un sistema de cámara diseñado para la generación de mapas dinámicos locales (LDM), capaz de realizar simultáneamente la detección de objetos, seguimiento y estimación de posición en 3D. Este artículo se centra en mejorar enfoques existentes para adaptarlos mejor a nuestra aplicación, en lugar de proponer métodos novedosos. Modificamos la cabeza de detección de YOLOv4 para mejorar el rendimiento de detección de objetos pequeños y predecir puntos fiduciales para la estimación de posición en 3D. El detector modificado, en comparación con YOLOv4, muestra una mejora de aproximadamente 5% en mAP en el conjunto de datos Visdrone2019 y alrededor del 3% en nuestra base de datos. También propusimos un rastreador basado en DeepSORT. A diferencia de DeepSORT, que aplica una red de extracción de características para cada objeto detectado, el rastreador propuesto aplica una red de extracción de características una vez para toda la imagen. Para aumentar la resolución de los mapas de características, el rastreador integra la estructura de red de agregación de características (FAN) en la red DeepSORT. La diferencia en la precisión de seguimiento de múltiples objetos (MOTA) entre el rastreador propuesto y DeepSORT es mínima en un 0.3%. Sin embargo, el rastreador propuesto tiene una carga computacional consistente, independientemente del número de objetos detectados, porque extrae un mapa de características una vez para toda la imagen. Esta característica lo hace adecuado para dispositivos integrados en el borde. Los métodos propuestos se han implementado en un sistema en chip (SoC), Qualcomm QCS605, utilizando poda y cuantificación de red. Esto permite que todo el proceso se ejecute a 10 Hz en este dispositivo integrado.
Descripción
Este artículo propone un sistema de cámara diseñado para la generación de mapas dinámicos locales (LDM), capaz de realizar simultáneamente la detección de objetos, seguimiento y estimación de posición en 3D. Este artículo se centra en mejorar enfoques existentes para adaptarlos mejor a nuestra aplicación, en lugar de proponer métodos novedosos. Modificamos la cabeza de detección de YOLOv4 para mejorar el rendimiento de detección de objetos pequeños y predecir puntos fiduciales para la estimación de posición en 3D. El detector modificado, en comparación con YOLOv4, muestra una mejora de aproximadamente 5% en mAP en el conjunto de datos Visdrone2019 y alrededor del 3% en nuestra base de datos. También propusimos un rastreador basado en DeepSORT. A diferencia de DeepSORT, que aplica una red de extracción de características para cada objeto detectado, el rastreador propuesto aplica una red de extracción de características una vez para toda la imagen. Para aumentar la resolución de los mapas de características, el rastreador integra la estructura de red de agregación de características (FAN) en la red DeepSORT. La diferencia en la precisión de seguimiento de múltiples objetos (MOTA) entre el rastreador propuesto y DeepSORT es mínima en un 0.3%. Sin embargo, el rastreador propuesto tiene una carga computacional consistente, independientemente del número de objetos detectados, porque extrae un mapa de características una vez para toda la imagen. Esta característica lo hace adecuado para dispositivos integrados en el borde. Los métodos propuestos se han implementado en un sistema en chip (SoC), Qualcomm QCS605, utilizando poda y cuantificación de red. Esto permite que todo el proceso se ejecute a 10 Hz en este dispositivo integrado.