ITD-YOLOv8: Un modelo de detección de objetivos infrarrojos basado en YOLOv8 para vehículos aéreos no tripulados
Autores: Zhao, Xiaofeng; Zhang, Wenwen; Zhang, Hui; Zheng, Chao; Ma, Junyi; Zhang, Zhili
Idioma: Inglés
Editor: MDPI
Año: 2024
Acceso abierto
Artículo científico
2024
ITD-YOLOv8: Un modelo de detección de objetivos infrarrojos basado en YOLOv8 para vehículos aéreos no tripulados
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Robótica
Palabras clave
Drones
Infrarrojo
Yolo
Modelo
Detección de objetivos
Ligero
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
Se propone un modelo de detección de objetivos infrarrojos de UAV ITD-YOLOv8 basado en YOLOv8 para abordar los problemas de detecciones perdidas y falsas causadas por un fondo terrestre complejo y una escala de objetivos desigual en la detección de objetivos en imágenes infrarrojas aéreas de UAV, así como la alta complejidad computacional. En primer lugar, se diseña una red de extracción de características de respaldo YOLOv8 mejorada basada en la red ligera GhostHGNetV2. Esta puede capturar de manera efectiva la información de características de los objetivos a diferentes escalas, mejorando la precisión de detección de objetivos en entornos complejos mientras se mantiene ligera. En segundo lugar, el VoVGSCSP mejora las habilidades perceptivas del modelo al referenciar información contextual global y características multiescala para mejorar la estructura del cuello. Al mismo tiempo, se introduce una operación de convolución ligera llamada AXConv para reemplazar el módulo de convolución regular. Reemplazar los núcleos de convolución de tamaño fijo tradicional por núcleos de convolución de diferentes tamaños reduce efectivamente la complejidad del modelo. Luego, para optimizar aún más el modelo y reducir las detecciones perdidas y falsas durante la detección de objetos, se introduce el mecanismo de atención CoordAtt en el cuello del modelo para ponderar las dimensiones de canal del mapa de características, permitiendo que la red preste más atención a la información de características importante, mejorando así la precisión y robustez de la detección de objetos. Finalmente, la implementación de XIoU como función de pérdida para las cajas de límite mejora la precisión de la localización de objetivos. Los hallazgos experimentales demuestran que ITD-YOLOv8, en comparación con YOLOv8n, reduce efectivamente la tasa de detecciones perdidas y falsas para detectar objetivos pequeños de múltiples escalas en fondos complejos. Además, logra una reducción del 41.9% en los parámetros del modelo y una disminución del 25.9% en las operaciones de punto flotante. Además, la precisión media (mAP) alcanza un impresionante 93.5%, confirmando así la aplicabilidad del modelo para la detección de objetivos infrarrojos en vehículos aéreos no tripulados (UAV).
Descripción
Se propone un modelo de detección de objetivos infrarrojos de UAV ITD-YOLOv8 basado en YOLOv8 para abordar los problemas de detecciones perdidas y falsas causadas por un fondo terrestre complejo y una escala de objetivos desigual en la detección de objetivos en imágenes infrarrojas aéreas de UAV, así como la alta complejidad computacional. En primer lugar, se diseña una red de extracción de características de respaldo YOLOv8 mejorada basada en la red ligera GhostHGNetV2. Esta puede capturar de manera efectiva la información de características de los objetivos a diferentes escalas, mejorando la precisión de detección de objetivos en entornos complejos mientras se mantiene ligera. En segundo lugar, el VoVGSCSP mejora las habilidades perceptivas del modelo al referenciar información contextual global y características multiescala para mejorar la estructura del cuello. Al mismo tiempo, se introduce una operación de convolución ligera llamada AXConv para reemplazar el módulo de convolución regular. Reemplazar los núcleos de convolución de tamaño fijo tradicional por núcleos de convolución de diferentes tamaños reduce efectivamente la complejidad del modelo. Luego, para optimizar aún más el modelo y reducir las detecciones perdidas y falsas durante la detección de objetos, se introduce el mecanismo de atención CoordAtt en el cuello del modelo para ponderar las dimensiones de canal del mapa de características, permitiendo que la red preste más atención a la información de características importante, mejorando así la precisión y robustez de la detección de objetos. Finalmente, la implementación de XIoU como función de pérdida para las cajas de límite mejora la precisión de la localización de objetivos. Los hallazgos experimentales demuestran que ITD-YOLOv8, en comparación con YOLOv8n, reduce efectivamente la tasa de detecciones perdidas y falsas para detectar objetivos pequeños de múltiples escalas en fondos complejos. Además, logra una reducción del 41.9% en los parámetros del modelo y una disminución del 25.9% en las operaciones de punto flotante. Además, la precisión media (mAP) alcanza un impresionante 93.5%, confirmando así la aplicabilidad del modelo para la detección de objetivos infrarrojos en vehículos aéreos no tripulados (UAV).