Un algoritmo eficiente de detección de objetos de imagen UAV basado en atención global y fusión de características a múltiples escalas
Autores: Qian, Rui; Ding, Yong
Idioma: Inglés
Editor: MDPI
Año: 2024
Acceso abierto
Artículo científico
2024
Un algoritmo eficiente de detección de objetos de imagen UAV basado en atención global y fusión de características a múltiples escalas
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Tecnología de detección de objetos
Vehículo aéreo no tripulado (UAV)
YOLOv5s
Módulo de extracción de características
Transformador de Visión
Detección de objetos pequeños.
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 33
Citaciones: Sin citaciones
La tecnología de detección de objetos tiene un gran potencial en las aplicaciones de vehículos aéreos no tripulados (UAV). Sin embargo, los métodos tradicionales enfrentan desafíos en la detección de objetivos más densos, más pequeños y más complejos dentro de las imágenes aéreas de UAV. Para abordar problemas como la oclusión del objetivo y los objetos pequeños densos, este documento propone un algoritmo de detección de objetos a múltiples escalas basado en YOLOv5s. Se introduce un módulo de extracción de características novedoso, DCNCSPELAN4, que combina CSPNet y ELAN, para mejorar el campo receptivo de la extracción de características manteniendo la eficiencia de la red. Además, se integra un módulo ligero de Transformador de Visión, el Bloque CloFormer, para proporcionar a la red un campo receptivo global. Además, el algoritmo incorpora un módulo de fusión de características a tres escalas (TFE) y un módulo de fusión de características de secuencia de escalas (SSFF) en la red del cuello para aprovechar efectivamente la información espacial a múltiples escalas a través de diferentes mapas de características. Para abordar objetos pequeños densos, se agregó una cabeza de detección de objetos pequeños adicional a la capa de detección. Se eliminó la cabeza de detección de objetos grandes original para reducir la carga computacional. El algoritmo propuesto ha sido evaluado a través de experimentos de ablación y comparado con otros métodos de última generación en los conjuntos de datos VisDrone2019 y AU-AIR. Los resultados demuestran que nuestro algoritmo supera a otros métodos de referencia en términos de precisión y velocidad. En comparación con el modelo de referencia YOLOv5s, el algoritmo mejorado logra mejoras del 12.4% y 8.4% en y métricas, respectivamente, con solo un aumento marginal de parámetros de 0.3 M. Estos experimentos validan la efectividad de nuestro algoritmo para la detección de objetos en imágenes de drones.
Descripción
La tecnología de detección de objetos tiene un gran potencial en las aplicaciones de vehículos aéreos no tripulados (UAV). Sin embargo, los métodos tradicionales enfrentan desafíos en la detección de objetivos más densos, más pequeños y más complejos dentro de las imágenes aéreas de UAV. Para abordar problemas como la oclusión del objetivo y los objetos pequeños densos, este documento propone un algoritmo de detección de objetos a múltiples escalas basado en YOLOv5s. Se introduce un módulo de extracción de características novedoso, DCNCSPELAN4, que combina CSPNet y ELAN, para mejorar el campo receptivo de la extracción de características manteniendo la eficiencia de la red. Además, se integra un módulo ligero de Transformador de Visión, el Bloque CloFormer, para proporcionar a la red un campo receptivo global. Además, el algoritmo incorpora un módulo de fusión de características a tres escalas (TFE) y un módulo de fusión de características de secuencia de escalas (SSFF) en la red del cuello para aprovechar efectivamente la información espacial a múltiples escalas a través de diferentes mapas de características. Para abordar objetos pequeños densos, se agregó una cabeza de detección de objetos pequeños adicional a la capa de detección. Se eliminó la cabeza de detección de objetos grandes original para reducir la carga computacional. El algoritmo propuesto ha sido evaluado a través de experimentos de ablación y comparado con otros métodos de última generación en los conjuntos de datos VisDrone2019 y AU-AIR. Los resultados demuestran que nuestro algoritmo supera a otros métodos de referencia en términos de precisión y velocidad. En comparación con el modelo de referencia YOLOv5s, el algoritmo mejorado logra mejoras del 12.4% y 8.4% en y métricas, respectivamente, con solo un aumento marginal de parámetros de 0.3 M. Estos experimentos validan la efectividad de nuestro algoritmo para la detección de objetos en imágenes de drones.