PHSI-RTDETR: Un algoritmo ligero de detección de pequeños objetivos infrarrojos basado en fotografía aérea de UAV
Autores: Wang, Sen; Jiang, Huiping; Li, Zhongjie; Yang, Jixiang; Ma, Xuan; Chen, Jiamin; Tang, Xingqun
Idioma: Inglés
Editor: MDPI
Año: 2024
Acceso abierto
Artículo científico
2024
PHSI-RTDETR: Un algoritmo ligero de detección de pequeños objetivos infrarrojos basado en fotografía aérea de UAV
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Robótica
Palabras clave
Problemas
Precisión del modelo
Complejidad computacional
Detección de objetivos en imágenes infrarrojas aéreas de UAV
Algoritmo ligero
Detección de pequeños objetivos
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
Para abordar los problemas de baja precisión del modelo causados por entornos terrestres complejos y escalas de objetivos desiguales, así como la alta complejidad computacional en la detección de objetivos en imágenes infrarrojas aéreas de vehículos aéreos no tripulados (UAV), este estudio propone un algoritmo ligero de detección de pequeños objetivos infrarrojos aéreos de UAV llamado PHSI-RTDETR. Inicialmente, se diseña una red de extracción de características de respaldo mejorada utilizando el módulo ligero RPConv-Block propuesto en este documento, que captura eficazmente las características de los pequeños objetivos, reduciendo significativamente la complejidad del modelo y la carga computacional, al tiempo que mejora la precisión. Posteriormente, se combina el mecanismo de atención HiLo con un módulo de interacción de características intraescala para formar un módulo AIFI-HiLo, que se integra en un codificador híbrido para mejorar el enfoque del modelo en objetivos densos, reduciendo las tasas de detecciones perdidas y falsas. Además, se introduce la arquitectura slimneck-SSFF como la arquitectura de fusión de características a través de escalas del modelo, utilizando módulos GSConv y VoVGSCSP para mejorar la adaptabilidad a objetivos infrarrojos de diversas escalas, produciendo más información semántica mientras se reducen los cálculos de la red. Finalmente, la pérdida GIoU original se reemplaza por la pérdida Inner-GIoU, que utiliza un factor de escalado para controlar las cajas delimitadoras auxiliares y acelerar la convergencia, mejorando la precisión de detección para pequeños objetivos. Los resultados experimentales muestran que, en comparación con RT-DETR, PHSI-RTDETR reduce los parámetros del modelo en un 30.55% y las operaciones de punto flotante en un 17.10%. Además, la precisión y la velocidad de detección aumentan en un 3.81% y un 13.39%, respectivamente, y el mAP50, de manera impresionante, alcanza el 82.58%, demostrando el gran potencial de este modelo para la detección de pequeños objetivos infrarrojos con drones.
Descripción
Para abordar los problemas de baja precisión del modelo causados por entornos terrestres complejos y escalas de objetivos desiguales, así como la alta complejidad computacional en la detección de objetivos en imágenes infrarrojas aéreas de vehículos aéreos no tripulados (UAV), este estudio propone un algoritmo ligero de detección de pequeños objetivos infrarrojos aéreos de UAV llamado PHSI-RTDETR. Inicialmente, se diseña una red de extracción de características de respaldo mejorada utilizando el módulo ligero RPConv-Block propuesto en este documento, que captura eficazmente las características de los pequeños objetivos, reduciendo significativamente la complejidad del modelo y la carga computacional, al tiempo que mejora la precisión. Posteriormente, se combina el mecanismo de atención HiLo con un módulo de interacción de características intraescala para formar un módulo AIFI-HiLo, que se integra en un codificador híbrido para mejorar el enfoque del modelo en objetivos densos, reduciendo las tasas de detecciones perdidas y falsas. Además, se introduce la arquitectura slimneck-SSFF como la arquitectura de fusión de características a través de escalas del modelo, utilizando módulos GSConv y VoVGSCSP para mejorar la adaptabilidad a objetivos infrarrojos de diversas escalas, produciendo más información semántica mientras se reducen los cálculos de la red. Finalmente, la pérdida GIoU original se reemplaza por la pérdida Inner-GIoU, que utiliza un factor de escalado para controlar las cajas delimitadoras auxiliares y acelerar la convergencia, mejorando la precisión de detección para pequeños objetivos. Los resultados experimentales muestran que, en comparación con RT-DETR, PHSI-RTDETR reduce los parámetros del modelo en un 30.55% y las operaciones de punto flotante en un 17.10%. Además, la precisión y la velocidad de detección aumentan en un 3.81% y un 13.39%, respectivamente, y el mAP50, de manera impresionante, alcanza el 82.58%, demostrando el gran potencial de este modelo para la detección de pequeños objetivos infrarrojos con drones.