YOLO-UIR: Una Red de Detección de Objetos Infrarrojos Ligera y Precisa Usando Plataformas UAV
Autores: Wang, Chao; Wang, Rongdi; Wu, Ziwei; Bian, Zetao; Huang, Tao
Idioma: Inglés
Editor: MDPI
Año: 2025
Acceso abierto
Artículo científico
2025
YOLO-UIR: Una Red de Detección de Objetos Infrarrojos Ligera y Precisa Usando Plataformas UAV
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Robótica
Palabras clave
Campo
Teledetección
UAV
Detección de objetos infrarrojos
YOLO-UIR
Objetos pequeños
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
Dentro del campo de la teledetección, la detección de objetos infrarrojos con vehículos aéreos no tripulados (VANT) juega un papel fundamental, especialmente en entornos complejos. Sin embargo, los métodos existentes enfrentan desafíos como la precisión insuficiente o la baja eficiencia computacional, particularmente en la detección de objetos pequeños. Este artículo propone un modelo de detección de objetos infrarrojos ligero y preciso, YOLO-UIR, para la detección de objetos pequeños desde la perspectiva de un VANT. El modelo se basa en la arquitectura YOLO e incluye principalmente el módulo Efficient C2f, el módulo de percepción espacial ligera (LSP) y el módulo de fusión de interacción de características bidireccional (BFIF). El módulo Efficient C2f mejora significativamente las capacidades de extracción de características al combinar características locales y globales a través de un Mecanismo de Atención de Doble Flujo Adaptativo. En comparación con el módulo C2f existente, la introducción de la Convolución Parcial reduce el número de parámetros del modelo mientras mantiene una alta precisión de detección. El módulo BFIF mejora aún más los efectos de fusión de características a través de la interacción semántica entre niveles, mejorando así la capacidad del modelo para fusionar características contextuales. Además, el módulo LSP combina eficientemente características de diferentes distancias utilizando Capas de Convolución de Gran Campo Receptivo, mejorando significativamente la capacidad del modelo para capturar información a larga distancia. Además, el uso de Convolución Reparametrizada y Convolución Separada por Profundidad asegura la naturaleza ligera del modelo, haciéndolo altamente adecuado para aplicaciones en tiempo real. En los conjuntos de datos DroneVehicle y HIT-UAV, YOLO-UIR logra un rendimiento de detección superior en comparación con los métodos existentes, con un mAP de 71.1% y 90.7%, respectivamente. El modelo también demuestra ventajas significativas en términos de eficiencia computacional y número de parámetros. Los experimentos de ablación verifican la efectividad de cada módulo de optimización.
Descripción
Dentro del campo de la teledetección, la detección de objetos infrarrojos con vehículos aéreos no tripulados (VANT) juega un papel fundamental, especialmente en entornos complejos. Sin embargo, los métodos existentes enfrentan desafíos como la precisión insuficiente o la baja eficiencia computacional, particularmente en la detección de objetos pequeños. Este artículo propone un modelo de detección de objetos infrarrojos ligero y preciso, YOLO-UIR, para la detección de objetos pequeños desde la perspectiva de un VANT. El modelo se basa en la arquitectura YOLO e incluye principalmente el módulo Efficient C2f, el módulo de percepción espacial ligera (LSP) y el módulo de fusión de interacción de características bidireccional (BFIF). El módulo Efficient C2f mejora significativamente las capacidades de extracción de características al combinar características locales y globales a través de un Mecanismo de Atención de Doble Flujo Adaptativo. En comparación con el módulo C2f existente, la introducción de la Convolución Parcial reduce el número de parámetros del modelo mientras mantiene una alta precisión de detección. El módulo BFIF mejora aún más los efectos de fusión de características a través de la interacción semántica entre niveles, mejorando así la capacidad del modelo para fusionar características contextuales. Además, el módulo LSP combina eficientemente características de diferentes distancias utilizando Capas de Convolución de Gran Campo Receptivo, mejorando significativamente la capacidad del modelo para capturar información a larga distancia. Además, el uso de Convolución Reparametrizada y Convolución Separada por Profundidad asegura la naturaleza ligera del modelo, haciéndolo altamente adecuado para aplicaciones en tiempo real. En los conjuntos de datos DroneVehicle y HIT-UAV, YOLO-UIR logra un rendimiento de detección superior en comparación con los métodos existentes, con un mAP de 71.1% y 90.7%, respectivamente. El modelo también demuestra ventajas significativas en términos de eficiencia computacional y número de parámetros. Los experimentos de ablación verifican la efectividad de cada módulo de optimización.