Drone-YOLO: Un método eficiente de red neuronal para la detección de objetivos en imágenes de drones
Autores: Zhang, Zhengxin
Idioma: Inglés
Editor: MDPI
Año: 2023
Acceso abierto
Artículo científico
2023
Drone-YOLO: Un método eficiente de red neuronal para la detección de objetivos en imágenes de drones
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Robótica
Palabras clave
Detección de objetos
Imágenes de UAV
Drone-YOLO
Modelo YOLOv8
Objetos de pequeño tamaño
Características a múltiples escalas
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
La detección de objetos en imágenes de vehículos aéreos no tripulados (UAV) es una base significativa en varios dominios de investigación. Sin embargo, las imágenes de UAV presentan desafíos únicos, incluyendo grandes tamaños de imagen, objetos de detección de pequeño tamaño, distribución densa, instancias superpuestas y una iluminación insuficiente que impacta la efectividad de la detección de objetos. En este artículo, proponemos Drone-YOLO, una serie de algoritmos de detección de objetos en imágenes de UAV a múltiples escalas basados en el modelo YOLOv8, diseñados para superar los desafíos específicos asociados con la detección de objetos en imágenes de UAV. Para abordar los problemas de grandes tamaños de escena y objetos de detección pequeños, introducimos mejoras en el componente del cuello del modelo YOLOv8. Específicamente, empleamos una estructura PAFPN de tres capas e incorporamos una cabeza de detección adaptada para objetos de pequeño tamaño utilizando mapas de características a gran escala, mejorando significativamente la capacidad del algoritmo para detectar objetivos de pequeño tamaño. Además, integramos el módulo de fusión sándwich en cada capa de la rama de arriba hacia abajo del cuello. Este mecanismo de fusión combina características de la red con características de bajo nivel, proporcionando rica información espacial sobre los objetos en diferentes cabezas de detección de capas. Logramos esta fusión utilizando evolución separable por profundidad, que equilibra los costos de parámetros y un gran campo receptivo. En la columna vertebral de la red, empleamos módulos RepVGG como capas de submuestreo, mejorando la capacidad de la red para aprender características a múltiples escalas y superando a las capas convolucionales tradicionales. Los métodos propuestos de Drone-YOLO han sido evaluados en experimentos de ablación y comparados con otros enfoques de vanguardia en el conjunto de datos VisDrone2019. Los resultados demuestran que nuestro Drone-YOLO (grande) supera a otros métodos de referencia en la precisión de la detección de objetos. En comparación con YOLOv8, nuestro método logra una mejora significativa en las métricas mAP0.5, con un aumento del 13.4% en el VisDrone2019-test y un aumento del 17.40% en el VisDrone2019-val. Además, el Drone-YOLO (pequeño) eficiente en parámetros, con solo 5.25 M de parámetros, se desempeña de manera equivalente o mejor que el método de referencia con 9.66M de parámetros en el conjunto de datos. Estos experimentos validan la efectividad de los métodos Drone-YOLO en la tarea de detección de objetos en imágenes de drones.
Descripción
La detección de objetos en imágenes de vehículos aéreos no tripulados (UAV) es una base significativa en varios dominios de investigación. Sin embargo, las imágenes de UAV presentan desafíos únicos, incluyendo grandes tamaños de imagen, objetos de detección de pequeño tamaño, distribución densa, instancias superpuestas y una iluminación insuficiente que impacta la efectividad de la detección de objetos. En este artículo, proponemos Drone-YOLO, una serie de algoritmos de detección de objetos en imágenes de UAV a múltiples escalas basados en el modelo YOLOv8, diseñados para superar los desafíos específicos asociados con la detección de objetos en imágenes de UAV. Para abordar los problemas de grandes tamaños de escena y objetos de detección pequeños, introducimos mejoras en el componente del cuello del modelo YOLOv8. Específicamente, empleamos una estructura PAFPN de tres capas e incorporamos una cabeza de detección adaptada para objetos de pequeño tamaño utilizando mapas de características a gran escala, mejorando significativamente la capacidad del algoritmo para detectar objetivos de pequeño tamaño. Además, integramos el módulo de fusión sándwich en cada capa de la rama de arriba hacia abajo del cuello. Este mecanismo de fusión combina características de la red con características de bajo nivel, proporcionando rica información espacial sobre los objetos en diferentes cabezas de detección de capas. Logramos esta fusión utilizando evolución separable por profundidad, que equilibra los costos de parámetros y un gran campo receptivo. En la columna vertebral de la red, empleamos módulos RepVGG como capas de submuestreo, mejorando la capacidad de la red para aprender características a múltiples escalas y superando a las capas convolucionales tradicionales. Los métodos propuestos de Drone-YOLO han sido evaluados en experimentos de ablación y comparados con otros enfoques de vanguardia en el conjunto de datos VisDrone2019. Los resultados demuestran que nuestro Drone-YOLO (grande) supera a otros métodos de referencia en la precisión de la detección de objetos. En comparación con YOLOv8, nuestro método logra una mejora significativa en las métricas mAP0.5, con un aumento del 13.4% en el VisDrone2019-test y un aumento del 17.40% en el VisDrone2019-val. Además, el Drone-YOLO (pequeño) eficiente en parámetros, con solo 5.25 M de parámetros, se desempeña de manera equivalente o mejor que el método de referencia con 9.66M de parámetros en el conjunto de datos. Estos experimentos validan la efectividad de los métodos Drone-YOLO en la tarea de detección de objetos en imágenes de drones.