Un método de aprendizaje profundo para la detección de objetivos pequeños en infrarrojo basado en YOLOv7, llamado DFK-YOLO, que se basa en la atención de convolución en profundidad, la fusión de características y la divergencia KL

Contáctanos

Temas

Artículos

XBooks

Revistas

Laboratorios

Showroom

Infografías

Recorridos

Videos

Perfiles

Actualidad

Un método de aprendizaje profundo para la detección de objetivos pequeños en infrarrojo basado en YOLOv7, llamado DFK-YOLO, que se basa en la atención de convolución en profundidad, la fusión de características y la divergencia KL

Autores: Ji, Peng; Wu, Changhao; Zhang, Xiangyue; Liu, Hean; He, Dongsheng

Idioma: Inglés

Editor: MDPI

Año: 2024

Descargar PDF

Acceso abierto

Artículo científico

2024

Categoría

Ingeniería y Tecnología

Subcategoría

Ingeniería Eléctrica y Electrónica

Palabras clave

Imagen infrarroja

Detección

Aprendizaje profundo

YOLOv7

Módulo de atención

Fusión de características

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 26

Citaciones: Sin citaciones

La tecnología de imágenes infrarrojas tiene una amplia gama de aplicaciones en varios campos, siendo uno de sus usos más críticos la detección de pequeños objetivos infrarrojos. Sin embargo, los enfoques basados en modelos a menudo carecen de robustez para identificar estos pequeños objetivos, mientras que los métodos actuales basados en aprendizaje profundo enfrentan desafíos para extraer e integrar eficazmente características. Además, las estrategias de etiquetado apropiadas para pequeños objetivos infrarrojos siguen estando poco desarrolladas. Para abordar estas limitaciones, este documento propone un nuevo método de detección basado en YOLOv7. Específicamente, se incorpora un módulo de atención que aprovecha la Convolución Profunda en la columna vertebral de YOLOv7. Además, se diseña un nuevo Cuello de Fusión de Características para reemplazar el componente de cuello original de YOLOv7. Por último, se introduce una nueva estrategia de asignación de etiquetas. El método propuesto logra un mAP@0.5 del 99.5% y un mAP@0.75 del 71.6% en un conjunto de datos público, superando al YOLOv7 base en un 1% y 4.6%, respectivamente. En comparación con los métodos de detección de objetos basados en aprendizaje profundo de última generación, el enfoque propuesto demuestra un rendimiento superior.

Descripción

Otros recursos que podrían interesarte

Ver todas

Temas Virtualpro