Método de Detección de Objetivos de UAV Multimodal Basado en Hibridación Acústico-Óptica
Autores: He, Tianlun; Hou, Jiayu; Chen, Da
Idioma: Inglés
Editor: MDPI
Año: 2025
Acceso abierto
Artículo científico
2025
Método de Detección de Objetivos de UAV Multimodal Basado en Hibridación Acústico-Óptica
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Robótica
Palabras clave
Urbano
Vehículo aéreo no tripulado
Vigilancia
Marco de detección multimodal
Sistema de imagen acústica
Sistema de fusión
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
La vigilancia urbana con vehículos aéreos no tripulados (UAV) enfrenta obstáculos significativos debido a obstrucciones visuales, iluminación inadecuada, dimensiones pequeñas de los objetivos y la interferencia de señales acústicas causada por el ruido ambiental y la propagación multipath. Para abordar estos problemas, este estudio propone un marco de detección multimodal que integra un módulo de detección visual eficiente basado en YOLOv11, entrenado con un conjunto de datos completo que contiene más de 50,000 imágenes de UAV, con un sistema de imagen acústica basado en formación de haces de Capon utilizando una matriz de micrófonos de brazo en espiral de 144 elementos. Se implementan estrategias de compensación adaptativa para mejorar la robustez de cada modalidad de detección, mientras que los resultados de detección se validan a través de métricas de intersección sobre unión y desviación angular. La validación angular se logra mapeando las estimaciones de dirección de llegada acústica en el plano de la imagen de la cámara utilizando parámetros de calibración establecidos. La evaluación experimental revela que el sistema de fusión logra un rendimiento excepcional en condiciones óptimas, superando el 99% de precisión. Sin embargo, su principal ventaja se hace evidente en entornos desafiantes donde las modalidades individuales presentan limitaciones considerables. El enfoque de fusión demuestra mejoras sustanciales en el rendimiento en tres escenarios críticos. En condiciones de poca luz, el sistema de fusión alcanza un 78% de precisión, superando significativamente a los métodos solo de visión que alcanzan solo un 25% de precisión. En escenarios de oclusión, el sistema de fusión mantiene un 99% de precisión mientras que el rendimiento solo de visión cae drásticamente al 9.75%, aunque la detección solo acústica sigue siendo altamente efectiva con un 99%. En escenarios de detección de múltiples objetivos, el sistema de fusión alcanza un 96.8% de precisión, cerrando la brecha de rendimiento entre los sistemas solo de visión al 99% y los sistemas solo acústicos al 54%, donde las variaciones de intensidad acústica limitan la capacidad de detección. Estos hallazgos experimentales validan la efectividad de la estrategia de fusión complementaria y establecen el valor práctico del sistema para aplicaciones de monitoreo del espacio aéreo urbano.
Descripción
La vigilancia urbana con vehículos aéreos no tripulados (UAV) enfrenta obstáculos significativos debido a obstrucciones visuales, iluminación inadecuada, dimensiones pequeñas de los objetivos y la interferencia de señales acústicas causada por el ruido ambiental y la propagación multipath. Para abordar estos problemas, este estudio propone un marco de detección multimodal que integra un módulo de detección visual eficiente basado en YOLOv11, entrenado con un conjunto de datos completo que contiene más de 50,000 imágenes de UAV, con un sistema de imagen acústica basado en formación de haces de Capon utilizando una matriz de micrófonos de brazo en espiral de 144 elementos. Se implementan estrategias de compensación adaptativa para mejorar la robustez de cada modalidad de detección, mientras que los resultados de detección se validan a través de métricas de intersección sobre unión y desviación angular. La validación angular se logra mapeando las estimaciones de dirección de llegada acústica en el plano de la imagen de la cámara utilizando parámetros de calibración establecidos. La evaluación experimental revela que el sistema de fusión logra un rendimiento excepcional en condiciones óptimas, superando el 99% de precisión. Sin embargo, su principal ventaja se hace evidente en entornos desafiantes donde las modalidades individuales presentan limitaciones considerables. El enfoque de fusión demuestra mejoras sustanciales en el rendimiento en tres escenarios críticos. En condiciones de poca luz, el sistema de fusión alcanza un 78% de precisión, superando significativamente a los métodos solo de visión que alcanzan solo un 25% de precisión. En escenarios de oclusión, el sistema de fusión mantiene un 99% de precisión mientras que el rendimiento solo de visión cae drásticamente al 9.75%, aunque la detección solo acústica sigue siendo altamente efectiva con un 99%. En escenarios de detección de múltiples objetivos, el sistema de fusión alcanza un 96.8% de precisión, cerrando la brecha de rendimiento entre los sistemas solo de visión al 99% y los sistemas solo acústicos al 54%, donde las variaciones de intensidad acústica limitan la capacidad de detección. Estos hallazgos experimentales validan la efectividad de la estrategia de fusión complementaria y establecen el valor práctico del sistema para aplicaciones de monitoreo del espacio aéreo urbano.