Detección de Objetos a Pequeña Escala a Bordo para Vehículos Aéreos No Tripulados (VANT)
Autores: Saeed, Zubair; Yousaf, Muhammad Haroon; Ahmed, Rehan; Velastin, Sergio A.; Viriri, Serestina
Idioma: Inglés
Editor: MDPI
Año: 2023
Acceso abierto
Artículo científico
2023
Detección de Objetos a Pequeña Escala a Bordo para Vehículos Aéreos No Tripulados (VANT)
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Robótica
Palabras clave
Detección de objetos
Imágenes aéreas
Técnica de visión por computadora
Estructuras basadas en CNN
CenterNet
Detectores de objetos
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
La detección de objetos es una tarea crítica que se vuelve difícil cuando se trata de detección a bordo utilizando imágenes aéreas y técnicas de visión por computadora. Los principales desafíos con las imágenes aéreas son los tamaños pequeños de los objetivos, la baja resolución, la oclusión, la actitud y las variaciones de escala, que afectan el rendimiento de muchos detectores de objetos. La precisión de la detección y la eficiencia de la inferencia siempre son compensaciones. Modificamos la arquitectura de CenterNet y utilizamos diferentes espinas dorsales basadas en CNN de ResNet18, ResNet34, ResNet50, ResNet101, ResNet152, Res2Net50, Res2Net101, DLA-34 y hourglass14. Se realizó una comparación del CenterNet modificado con nueve espinas dorsales basadas en CNN y se validó utilizando tres conjuntos de datos desafiantes, es decir, VisDrone, el conjunto de datos de drones de Stanford (SSD) y AU-AIR. También implementamos detectores de objetos bien conocidos y disponibles en el mercado, es decir, YoloV1 a YoloV7, SSD-MobileNet-V2 y Faster RCNN. El enfoque propuesto y los detectores de objetos de última generación se optimizaron y luego se implementaron en plataformas de borde cruzadas, es decir, NVIDIA Jetson Xavier, NVIDIA Jetson Nano y Neuro Compute Stick 2 (NCS2). Se proporciona una comparación detallada del rendimiento entre las plataformas de borde. Nuestra combinación de CenterNet modificado con hourglass como espina dorsal logró un 91.62%, 75.61% y 34.82% de mAP utilizando los conjuntos de validación de AU-AIR, SSD y VisDrone, respectivamente. Se logró un FPS de 40.02 utilizando la espina dorsal ResNet18. También comparamos nuestro enfoque con la investigación de vanguardia más reciente y encontramos resultados prometedores tanto para GPU discretas como para plataformas de borde.
Descripción
La detección de objetos es una tarea crítica que se vuelve difícil cuando se trata de detección a bordo utilizando imágenes aéreas y técnicas de visión por computadora. Los principales desafíos con las imágenes aéreas son los tamaños pequeños de los objetivos, la baja resolución, la oclusión, la actitud y las variaciones de escala, que afectan el rendimiento de muchos detectores de objetos. La precisión de la detección y la eficiencia de la inferencia siempre son compensaciones. Modificamos la arquitectura de CenterNet y utilizamos diferentes espinas dorsales basadas en CNN de ResNet18, ResNet34, ResNet50, ResNet101, ResNet152, Res2Net50, Res2Net101, DLA-34 y hourglass14. Se realizó una comparación del CenterNet modificado con nueve espinas dorsales basadas en CNN y se validó utilizando tres conjuntos de datos desafiantes, es decir, VisDrone, el conjunto de datos de drones de Stanford (SSD) y AU-AIR. También implementamos detectores de objetos bien conocidos y disponibles en el mercado, es decir, YoloV1 a YoloV7, SSD-MobileNet-V2 y Faster RCNN. El enfoque propuesto y los detectores de objetos de última generación se optimizaron y luego se implementaron en plataformas de borde cruzadas, es decir, NVIDIA Jetson Xavier, NVIDIA Jetson Nano y Neuro Compute Stick 2 (NCS2). Se proporciona una comparación detallada del rendimiento entre las plataformas de borde. Nuestra combinación de CenterNet modificado con hourglass como espina dorsal logró un 91.62%, 75.61% y 34.82% de mAP utilizando los conjuntos de validación de AU-AIR, SSD y VisDrone, respectivamente. Se logró un FPS de 40.02 utilizando la espina dorsal ResNet18. También comparamos nuestro enfoque con la investigación de vanguardia más reciente y encontramos resultados prometedores tanto para GPU discretas como para plataformas de borde.