Un método de aprendizaje profundo para la detección de objetivos pequeños en infrarrojo basado en YOLOv7, llamado DFK-YOLO, que se basa en la atención de convolución en profundidad, la fusión de características y la divergencia KL
Autores: Ji, Peng; Wu, Changhao; Zhang, Xiangyue; Liu, Hean; He, Dongsheng
Idioma: Inglés
Editor: MDPI
Año: 2024
Acceso abierto
Artículo científico
2024
Un método de aprendizaje profundo para la detección de objetivos pequeños en infrarrojo basado en YOLOv7, llamado DFK-YOLO, que se basa en la atención de convolución en profundidad, la fusión de características y la divergencia KL
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Imagen infrarroja
Detección
Aprendizaje profundo
YOLOv7
Módulo de atención
Fusión de características
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 26
Citaciones: Sin citaciones
La tecnología de imágenes infrarrojas tiene una amplia gama de aplicaciones en varios campos, siendo uno de sus usos más críticos la detección de pequeños objetivos infrarrojos. Sin embargo, los enfoques basados en modelos a menudo carecen de robustez para identificar estos pequeños objetivos, mientras que los métodos actuales basados en aprendizaje profundo enfrentan desafíos para extraer e integrar eficazmente características. Además, las estrategias de etiquetado apropiadas para pequeños objetivos infrarrojos siguen estando poco desarrolladas. Para abordar estas limitaciones, este documento propone un nuevo método de detección basado en YOLOv7. Específicamente, se incorpora un módulo de atención que aprovecha la Convolución Profunda en la columna vertebral de YOLOv7. Además, se diseña un nuevo Cuello de Fusión de Características para reemplazar el componente de cuello original de YOLOv7. Por último, se introduce una nueva estrategia de asignación de etiquetas. El método propuesto logra un mAP@0.5 del 99.5% y un mAP@0.75 del 71.6% en un conjunto de datos público, superando al YOLOv7 base en un 1% y 4.6%, respectivamente. En comparación con los métodos de detección de objetos basados en aprendizaje profundo de última generación, el enfoque propuesto demuestra un rendimiento superior.
Descripción
La tecnología de imágenes infrarrojas tiene una amplia gama de aplicaciones en varios campos, siendo uno de sus usos más críticos la detección de pequeños objetivos infrarrojos. Sin embargo, los enfoques basados en modelos a menudo carecen de robustez para identificar estos pequeños objetivos, mientras que los métodos actuales basados en aprendizaje profundo enfrentan desafíos para extraer e integrar eficazmente características. Además, las estrategias de etiquetado apropiadas para pequeños objetivos infrarrojos siguen estando poco desarrolladas. Para abordar estas limitaciones, este documento propone un nuevo método de detección basado en YOLOv7. Específicamente, se incorpora un módulo de atención que aprovecha la Convolución Profunda en la columna vertebral de YOLOv7. Además, se diseña un nuevo Cuello de Fusión de Características para reemplazar el componente de cuello original de YOLOv7. Por último, se introduce una nueva estrategia de asignación de etiquetas. El método propuesto logra un mAP@0.5 del 99.5% y un mAP@0.75 del 71.6% en un conjunto de datos público, superando al YOLOv7 base en un 1% y 4.6%, respectivamente. En comparación con los métodos de detección de objetos basados en aprendizaje profundo de última generación, el enfoque propuesto demuestra un rendimiento superior.