Mejorando la Detección de Objetos Pequeños en Imágenes Aéreas: Un Enfoque Nuevo con el Modelo PCSG
Autores: An, Kang; Duanmu, Huiping; Wu, Zhiyang; Liu, Yuqiang; Qiao, Jingzhen; Shangguan, Qianqian; Song, Yaqing; Xu, Xiaonong
Idioma: Inglés
Editor: MDPI
Año: 2024
Acceso abierto
Artículo científico
2024
Mejorando la Detección de Objetos Pequeños en Imágenes Aéreas: Un Enfoque Nuevo con el Modelo PCSG
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Aeroespacial
Palabras clave
Algoritmos de detección
Objetivos pequeños
Extracción de características
Modelo PCSG
Yolov5
Imágenes aéreas
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 25
Citaciones: Sin citaciones
Los algoritmos de detección de objetivos generalizados funcionan bien para objetivos grandes y medianos, pero tienen dificultades con los pequeños. Sin embargo, con la creciente importancia de las imágenes aéreas en el transporte urbano y el monitoreo ambiental, la detección de pequeños objetivos en tales imágenes se ha convertido en un área de investigación prometedora. El desafío en la detección de objetos pequeños radica en la limitada proporción de píxeles y la complejidad de la extracción de características. Además, los algoritmos de detección actuales tienden a ser excesivamente complejos, lo que lleva a una redundancia estructural para los objetos pequeños. Para hacer frente a estos desafíos, este documento recomienda el modelo PCSG basado en yolov5, que optimiza tanto la cabeza de detección como las redes de backbone. (1) Se introduce un encabezado de detección mejorado, que presenta una nueva estructura que mejora la red de pirámide de características y la red de agregación de caminos. Esta mejora refuerza la capacidad de reutilización de características superficiales del modelo e introduce una capa de detección dedicada para objetos más pequeños. Además, se podan las estructuras redundantes en la red y se utiliza el operador de sobremuestreo ligero y versátil CARAFE para optimizar el algoritmo de sobremuestreo. (2) El documento propone el módulo llamado SPD-Conv para reemplazar la operación de convolución estriada y las estructuras de agrupamiento en yolov5, mejorando así la capacidad de extracción de características del backbone. Además, se utiliza la convolución Ghost para optimizar el conteo de parámetros, asegurando que el backbone cumpla con las necesidades en tiempo real de la detección de imágenes aéreas. Los resultados experimentales del conjunto de datos RSOD muestran que el modelo PCSG exhibe un rendimiento de detección superior. El valor de mAP aumenta del 97.1% al 97.8%, mientras que el número de parámetros del modelo disminuye en un 22.3%, de 1,761,871 a 1,368,823. Estos hallazgos destacan inequívocamente la efectividad de este enfoque.
Descripción
Los algoritmos de detección de objetivos generalizados funcionan bien para objetivos grandes y medianos, pero tienen dificultades con los pequeños. Sin embargo, con la creciente importancia de las imágenes aéreas en el transporte urbano y el monitoreo ambiental, la detección de pequeños objetivos en tales imágenes se ha convertido en un área de investigación prometedora. El desafío en la detección de objetos pequeños radica en la limitada proporción de píxeles y la complejidad de la extracción de características. Además, los algoritmos de detección actuales tienden a ser excesivamente complejos, lo que lleva a una redundancia estructural para los objetos pequeños. Para hacer frente a estos desafíos, este documento recomienda el modelo PCSG basado en yolov5, que optimiza tanto la cabeza de detección como las redes de backbone. (1) Se introduce un encabezado de detección mejorado, que presenta una nueva estructura que mejora la red de pirámide de características y la red de agregación de caminos. Esta mejora refuerza la capacidad de reutilización de características superficiales del modelo e introduce una capa de detección dedicada para objetos más pequeños. Además, se podan las estructuras redundantes en la red y se utiliza el operador de sobremuestreo ligero y versátil CARAFE para optimizar el algoritmo de sobremuestreo. (2) El documento propone el módulo llamado SPD-Conv para reemplazar la operación de convolución estriada y las estructuras de agrupamiento en yolov5, mejorando así la capacidad de extracción de características del backbone. Además, se utiliza la convolución Ghost para optimizar el conteo de parámetros, asegurando que el backbone cumpla con las necesidades en tiempo real de la detección de imágenes aéreas. Los resultados experimentales del conjunto de datos RSOD muestran que el modelo PCSG exhibe un rendimiento de detección superior. El valor de mAP aumenta del 97.1% al 97.8%, mientras que el número de parámetros del modelo disminuye en un 22.3%, de 1,761,871 a 1,368,823. Estos hallazgos destacan inequívocamente la efectividad de este enfoque.