Detección de objetos pequeños ligera y eficiente basada en YOLOv8n mejorado para imágenes aéreas de UAV
Autores: Yue, Min; Zhang, Liqiang; Huang, Juan; Zhang, Haifeng
Idioma: Inglés
Editor: MDPI
Año: 2024
Acceso abierto
Artículo científico
2024
Detección de objetos pequeños ligera y eficiente basada en YOLOv8n mejorado para imágenes aéreas de UAV
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Robótica
Palabras clave
Detección
Objetos pequeños
LE-YOLO
Columna vertebral LHGNet
Red de extracción de características
Eficiencia del modelo
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
La tarea de detección de múltiples objetos pequeños desde diversas perspectivas en vehículos aéreos no tripulados (UAV) utilizando dispositivos de borde a bordo es un desafío significativo y complejo dentro de la visión por computadora. Para abordar este desafío, proponemos un algoritmo de detección de objetos pequeños ligero y eficiente llamado LE-YOLO, basado en la arquitectura YOLOv8n. Para mejorar el rendimiento de detección y optimizar la eficiencia del modelo, presentamos la columna vertebral LHGNet, una red de extracción de características más extensa, que integra convolución separable por profundidad y módulos de mezcla de canales. Esta integración facilita una exploración exhaustiva de las características inherentes dentro de la red en capas más profundas, promoviendo la fusión de información de detalles locales y características de canal. Además, introducimos el cuello de botella LGS y el módulo de fusión LGSCSP incorporado en el cuello, con el objetivo de disminuir la complejidad computacional mientras se preserva la precisión del detector. Adicionalmente, mejoramos la precisión de detección modificando su estructura y el tamaño de los mapas de características. Estas mejoras aumentan significativamente la capacidad del modelo para capturar objetos pequeños. El detector LE-YOLO propuesto se examina en experimentos de ablación y comparativos en el conjunto de datos VisDrone2019. En contraste con YOLOv8n, el modelo LE-YOLO propuesto logró una reducción del 30.0% en el conteo de parámetros, acompañado de un aumento del 15.9% en el mAP(0.5). Estos experimentos exhaustivos indican que nuestro enfoque puede mejorar significativamente la precisión de detección y optimizar la eficiencia del modelo a través de la combinación orgánica de nuestras mejoras sugeridas.
Descripción
La tarea de detección de múltiples objetos pequeños desde diversas perspectivas en vehículos aéreos no tripulados (UAV) utilizando dispositivos de borde a bordo es un desafío significativo y complejo dentro de la visión por computadora. Para abordar este desafío, proponemos un algoritmo de detección de objetos pequeños ligero y eficiente llamado LE-YOLO, basado en la arquitectura YOLOv8n. Para mejorar el rendimiento de detección y optimizar la eficiencia del modelo, presentamos la columna vertebral LHGNet, una red de extracción de características más extensa, que integra convolución separable por profundidad y módulos de mezcla de canales. Esta integración facilita una exploración exhaustiva de las características inherentes dentro de la red en capas más profundas, promoviendo la fusión de información de detalles locales y características de canal. Además, introducimos el cuello de botella LGS y el módulo de fusión LGSCSP incorporado en el cuello, con el objetivo de disminuir la complejidad computacional mientras se preserva la precisión del detector. Adicionalmente, mejoramos la precisión de detección modificando su estructura y el tamaño de los mapas de características. Estas mejoras aumentan significativamente la capacidad del modelo para capturar objetos pequeños. El detector LE-YOLO propuesto se examina en experimentos de ablación y comparativos en el conjunto de datos VisDrone2019. En contraste con YOLOv8n, el modelo LE-YOLO propuesto logró una reducción del 30.0% en el conteo de parámetros, acompañado de un aumento del 15.9% en el mAP(0.5). Estos experimentos exhaustivos indican que nuestro enfoque puede mejorar significativamente la precisión de detección y optimizar la eficiencia del modelo a través de la combinación orgánica de nuestras mejoras sugeridas.