Estudio del Modelo Óptimo de Detector Visual YOLO para Mejorar la Detección y Clasificación de UAV en Canales Optoelectrónicos de Sistemas de Fusión de Sensores
Autores: Kurmashev, Ildar; Semenyuk, Vladislav; Lupidi, Alberto; Alyoshin, Dmitriy; Kurmasheva, Liliya; Cantelli-Forti, Alessandro
Idioma: Inglés
Editor: MDPI
Año: 2025
Acceso abierto
Artículo científico
2025
Estudio del Modelo Óptimo de Detector Visual YOLO para Mejorar la Detección y Clasificación de UAV en Canales Optoelectrónicos de Sistemas de Fusión de Sensores
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Robótica
Palabras clave
Propagación rápida
Vehículos aéreos no tripulados
Drones
YOLOv12-ADBC
Vigilancia
Seguridad del espacio aéreo
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
La rápida expansión de los vehículos aéreos no tripulados (VANT) ha creado nuevos desafíos para la seguridad del espacio aéreo, ya que los drones se utilizan cada vez más para la vigilancia, el contrabando y potencialmente para ataques cerca de infraestructuras críticas. Una dificultad clave radica en distinguir de manera confiable los VANT de aves visualmente similares en canales de vigilancia electro-óptica, donde los fondos complejos y el ruido visual a menudo aumentan las falsas alarmas. Para abordar esto, investigamos arquitecturas recientes de YOLO y desarrollamos un modelo mejorado llamado YOLOv12-ADBC, que incorpora un mecanismo de integración de características jerárquicas adaptativas para fortalecer la fusión espacial a múltiples escalas. Este refinamiento arquitectónico mejora la sensibilidad a las sutiles diferencias interclase entre drones y aves. Se utilizó un conjunto de datos dedicado de 7291 imágenes para entrenar y evaluar cinco versiones de YOLO (v8-v12), junto con el propuesto YOLOv12-ADBC. Los experimentos comparativos demostraron que YOLOv12-ADBC logró el mejor rendimiento general, con precisión = 0.892, recuperación = 0.864, mAP50 = 0.881, mAP50-95 = 0.633, y una precisión por clase que alcanzó el 96.4% para drones y el 80% para aves. En pruebas de inferencia en tres secuencias de video que simulan condiciones de monitoreo realistas, YOLOv12-ADBC superó constantemente las líneas base, logrando una precisión de detección del 92.1-95.5% y niveles de confianza de hasta el 88.6%, mientras mantenía un procesamiento en tiempo real de 118-135 fotogramas por segundo (FPS). Estos resultados demuestran que YOLOv12-ADBC no solo supera a los modelos anteriores de YOLO, sino que también ofrece un fuerte potencial como módulo óptico en marcos de fusión de múltiples sensores. Se espera que su integración con canales de radar, RF y acústicos mejore aún más la robustez a nivel de sistema, proporcionando un camino práctico hacia la detección confiable de VANT en los sistemas modernos de protección del espacio aéreo.
Descripción
La rápida expansión de los vehículos aéreos no tripulados (VANT) ha creado nuevos desafíos para la seguridad del espacio aéreo, ya que los drones se utilizan cada vez más para la vigilancia, el contrabando y potencialmente para ataques cerca de infraestructuras críticas. Una dificultad clave radica en distinguir de manera confiable los VANT de aves visualmente similares en canales de vigilancia electro-óptica, donde los fondos complejos y el ruido visual a menudo aumentan las falsas alarmas. Para abordar esto, investigamos arquitecturas recientes de YOLO y desarrollamos un modelo mejorado llamado YOLOv12-ADBC, que incorpora un mecanismo de integración de características jerárquicas adaptativas para fortalecer la fusión espacial a múltiples escalas. Este refinamiento arquitectónico mejora la sensibilidad a las sutiles diferencias interclase entre drones y aves. Se utilizó un conjunto de datos dedicado de 7291 imágenes para entrenar y evaluar cinco versiones de YOLO (v8-v12), junto con el propuesto YOLOv12-ADBC. Los experimentos comparativos demostraron que YOLOv12-ADBC logró el mejor rendimiento general, con precisión = 0.892, recuperación = 0.864, mAP50 = 0.881, mAP50-95 = 0.633, y una precisión por clase que alcanzó el 96.4% para drones y el 80% para aves. En pruebas de inferencia en tres secuencias de video que simulan condiciones de monitoreo realistas, YOLOv12-ADBC superó constantemente las líneas base, logrando una precisión de detección del 92.1-95.5% y niveles de confianza de hasta el 88.6%, mientras mantenía un procesamiento en tiempo real de 118-135 fotogramas por segundo (FPS). Estos resultados demuestran que YOLOv12-ADBC no solo supera a los modelos anteriores de YOLO, sino que también ofrece un fuerte potencial como módulo óptico en marcos de fusión de múltiples sensores. Se espera que su integración con canales de radar, RF y acústicos mejore aún más la robustez a nivel de sistema, proporcionando un camino práctico hacia la detección confiable de VANT en los sistemas modernos de protección del espacio aéreo.