Detección y percepción de pequeños objetivos con UAV ligeros basada en YOLOv8-E mejorado
Autores: Zhao, Yongjuan; Wang, Lijin; Lei, Guannan; Guo, Chaozhe; Ma, Qiang
Idioma: Inglés
Editor: MDPI
Año: 2024
Acceso abierto
Artículo científico
2024
Detección y percepción de pequeños objetivos con UAV ligeros basada en YOLOv8-E mejorado
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Robótica
Palabras clave
Vehículo aéreo no tripulado
Métodos de detección
Aprendizaje profundo
YOLOv8-E
Objetivos de UAV pequeños
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
Los métodos tradicionales de detección de vehículos aéreos no tripulados (UAV) tienen dificultades con las variaciones multiescala durante el vuelo, fondos complejos y baja precisión, mientras que los métodos de detección basados en aprendizaje profundo existentes tienen alta precisión pero una gran dependencia del equipo, lo que dificulta la detección eficiente de pequeños objetivos UAV. Para abordar los desafíos mencionados, este documento propone un modelo mejorado, ligero y de alta precisión, YOLOv8-E (YOLOv8 Mejorado), para la detección e identificación rápida y precisa de pequeños UAV en entornos complejos. Primero, se introduce un filtro Sobel para mejorar el módulo C2f y formar el módulo C2f-ESCFFM (Módulo de Fusión de Características Sensibles a Bordes entre Etapas), que logra una mayor eficiencia computacional y capacidad de representación de características mientras preserva la precisión de detección tanto como sea posible al fusionar la rama SobelConv para la extracción de bordes y la rama de convolución para extraer información espacial. En segundo lugar, la red de cuello se basa en la arquitectura HSFPN (Red Pirámide de Características de Filtrado de Alto Nivel), y se introduce el mecanismo CAA (Atención de Anclaje Contextual) para mejorar el análisis semántico de características de bajo nivel y formar una nueva red CAHS-FPN (Red Pirámide de Características de Escala Jerárquica Aumentada por Contexto), lo que permite la fusión de características profundas y superficiales. Esto mejora la capacidad de representación de características del modelo, permitiéndole detectar objetivos de diferentes tamaños de manera eficiente. Finalmente, se introduce la técnica de convolución mejorada por detalles (DEConv) en la red de cabeza, formando el módulo LSCOD (Módulo de Detector de Objetos Convolucional Compartido Ligero), mejorando la capacidad de generalización del modelo al integrar información a priori y adoptar la estrategia de convolución compartida. Esto asegura que el modelo mejore su rendimiento de localización y clasificación sin aumentar los parámetros o los costos computacionales, mejorando así de manera efectiva el rendimiento de detección de pequeños objetivos UAV. Los resultados experimentales muestran que, en comparación con el modelo base, el modelo YOLOv8-E logró una mejora del mAP@0.5 del 6.3%, alcanzando el 98.4%, mientras que la escala de parámetros del modelo se redujo en más del 50%. En general, YOLOv8-E reduce significativamente la demanda de recursos computacionales mientras asegura una detección de alta precisión.
Descripción
Los métodos tradicionales de detección de vehículos aéreos no tripulados (UAV) tienen dificultades con las variaciones multiescala durante el vuelo, fondos complejos y baja precisión, mientras que los métodos de detección basados en aprendizaje profundo existentes tienen alta precisión pero una gran dependencia del equipo, lo que dificulta la detección eficiente de pequeños objetivos UAV. Para abordar los desafíos mencionados, este documento propone un modelo mejorado, ligero y de alta precisión, YOLOv8-E (YOLOv8 Mejorado), para la detección e identificación rápida y precisa de pequeños UAV en entornos complejos. Primero, se introduce un filtro Sobel para mejorar el módulo C2f y formar el módulo C2f-ESCFFM (Módulo de Fusión de Características Sensibles a Bordes entre Etapas), que logra una mayor eficiencia computacional y capacidad de representación de características mientras preserva la precisión de detección tanto como sea posible al fusionar la rama SobelConv para la extracción de bordes y la rama de convolución para extraer información espacial. En segundo lugar, la red de cuello se basa en la arquitectura HSFPN (Red Pirámide de Características de Filtrado de Alto Nivel), y se introduce el mecanismo CAA (Atención de Anclaje Contextual) para mejorar el análisis semántico de características de bajo nivel y formar una nueva red CAHS-FPN (Red Pirámide de Características de Escala Jerárquica Aumentada por Contexto), lo que permite la fusión de características profundas y superficiales. Esto mejora la capacidad de representación de características del modelo, permitiéndole detectar objetivos de diferentes tamaños de manera eficiente. Finalmente, se introduce la técnica de convolución mejorada por detalles (DEConv) en la red de cabeza, formando el módulo LSCOD (Módulo de Detector de Objetos Convolucional Compartido Ligero), mejorando la capacidad de generalización del modelo al integrar información a priori y adoptar la estrategia de convolución compartida. Esto asegura que el modelo mejore su rendimiento de localización y clasificación sin aumentar los parámetros o los costos computacionales, mejorando así de manera efectiva el rendimiento de detección de pequeños objetivos UAV. Los resultados experimentales muestran que, en comparación con el modelo base, el modelo YOLOv8-E logró una mejora del mAP@0.5 del 6.3%, alcanzando el 98.4%, mientras que la escala de parámetros del modelo se redujo en más del 50%. En general, YOLOv8-E reduce significativamente la demanda de recursos computacionales mientras asegura una detección de alta precisión.