Un algoritmo de detección en tiempo real mejorado y ligero basado en la plataforma de cómputo en el borde para imágenes de UAV
Autores: Cao, Lijia; Song, Pinde; Wang, Yongchao; Yang, Yang; Peng, Baoyu
Idioma: Inglés
Editor: MDPI
Año: 2023
Acceso abierto
Artículo científico
2023
Un algoritmo de detección en tiempo real mejorado y ligero basado en la plataforma de cómputo en el borde para imágenes de UAV
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Uav
Algoritmos de detección de imágenes
Yolo
Mobilenetv3
Mecanismo de atención eca
Flops
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 34
Citaciones: Sin citaciones
Los algoritmos de detección de imágenes de vehículos aéreos no tripulados (UAV) son críticos para llevar a cabo contramedidas militares y búsqueda y rescate en desastres. El algoritmo de detección de objetos de vanguardia conocido como you only look once (YOLO) es ampliamente utilizado para detectar imágenes de UAV. Sin embargo, enfrenta desafíos como altas operaciones de punto flotante (FLOPs), parámetros redundantes, velocidad lenta de inferencia y bajo rendimiento en la detección de objetos pequeños. Para abordar los problemas anteriores, se propuso un algoritmo de detección mejorado, ligero y en tiempo real basado en la plataforma de cómputo en el borde para imágenes de UAV. En el método presentado, se utilizó MobileNetV3 como la red principal YOLOv5 para reducir el número de parámetros y FLOPs. Para mejorar la capacidad de extracción de características de MobileNetV3, se introdujo el mecanismo de atención de canal eficiente (ECA) en MobileNetV3. Además, para mejorar la capacidad de detección de objetos pequeños, se introdujo una cabeza de predicción adicional en la estructura del cuello, y se diseñaron dos tipos de estructuras de cuello con diferentes escalas de parámetros para satisfacer los requisitos de diferentes dispositivos integrados. Finalmente, la función de pérdida FocalEIoU se introdujo en YOLOv5 para acelerar la regresión de cuadros delimitadores y mejorar la precisión de localización del algoritmo. Para validar el rendimiento del algoritmo mejorado propuesto, comparamos nuestro algoritmo con otros algoritmos en el conjunto de datos VisDrone-Det2021. Los resultados mostraron que en comparación con YOLOv5s, MELF-YOLOv5-S logró una reducción del 51.4% en el número de parámetros y un descenso del 38.6% en el número de FLOPs. MELF-YOLOv5-L tenía un 87.4% y un 47.4% menos de parámetros y FLOPs, respectivamente, y logró una mayor precisión de detección que YOLOv5l.
Descripción
Los algoritmos de detección de imágenes de vehículos aéreos no tripulados (UAV) son críticos para llevar a cabo contramedidas militares y búsqueda y rescate en desastres. El algoritmo de detección de objetos de vanguardia conocido como you only look once (YOLO) es ampliamente utilizado para detectar imágenes de UAV. Sin embargo, enfrenta desafíos como altas operaciones de punto flotante (FLOPs), parámetros redundantes, velocidad lenta de inferencia y bajo rendimiento en la detección de objetos pequeños. Para abordar los problemas anteriores, se propuso un algoritmo de detección mejorado, ligero y en tiempo real basado en la plataforma de cómputo en el borde para imágenes de UAV. En el método presentado, se utilizó MobileNetV3 como la red principal YOLOv5 para reducir el número de parámetros y FLOPs. Para mejorar la capacidad de extracción de características de MobileNetV3, se introdujo el mecanismo de atención de canal eficiente (ECA) en MobileNetV3. Además, para mejorar la capacidad de detección de objetos pequeños, se introdujo una cabeza de predicción adicional en la estructura del cuello, y se diseñaron dos tipos de estructuras de cuello con diferentes escalas de parámetros para satisfacer los requisitos de diferentes dispositivos integrados. Finalmente, la función de pérdida FocalEIoU se introdujo en YOLOv5 para acelerar la regresión de cuadros delimitadores y mejorar la precisión de localización del algoritmo. Para validar el rendimiento del algoritmo mejorado propuesto, comparamos nuestro algoritmo con otros algoritmos en el conjunto de datos VisDrone-Det2021. Los resultados mostraron que en comparación con YOLOv5s, MELF-YOLOv5-S logró una reducción del 51.4% en el número de parámetros y un descenso del 38.6% en el número de FLOPs. MELF-YOLOv5-L tenía un 87.4% y un 47.4% menos de parámetros y FLOPs, respectivamente, y logró una mayor precisión de detección que YOLOv5l.