Eficiente YOLOv7-Drone: Un Enfoque Mejorado de Detección de Objetos para Imágenes Aéreas de Drones
Autores: Fu, Xiaofeng; Wei, Guoting; Yuan, Xia; Liang, Yongshun; Bo, Yuming
Idioma: Inglés
Editor: MDPI
Año: 2023
Acceso abierto
Artículo científico
2023
Eficiente YOLOv7-Drone: Un Enfoque Mejorado de Detección de Objetos para Imágenes Aéreas de Drones
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Robótica
Palabras clave
Aumento
Tecnología de drones
Detección de objetos
Eficiencia computacional
YOLOv7
Imágenes aéreas
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
En los últimos años, el auge de la tecnología de drones de ala rotativa mini de bajo costo en diversos sectores ha enfatizado el papel crucial de la detección de objetos en las imágenes aéreas de drones. Los drones de ala rotativa mini de bajo costo vienen con limitaciones intrínsecas, especialmente en poder computacional. Este contexto subraya la necesidad urgente de soluciones que sinergicen baja latencia, alta precisión y eficiencia computacional. Las metodologías anteriores han dependido principalmente de imágenes de alta resolución, lo que ha llevado a cargas computacionales considerables. Para mejorar la eficiencia y precisión de la detección de objetos en imágenes aéreas de drones, y basándonos en el YOLOv7, proponemos el Efficient YOLOv7-Drone. Reconociendo la presencia común de objetos pequeños en las imágenes aéreas, eliminamos la cabeza de detección P5 menos eficiente e incorporamos la cabeza de detección P2 para aumentar la precisión en la detección de objetos pequeños. Para asegurar una transmisión eficiente de características desde el Backbone hasta el Neck, se optimizaron los canales dentro del módulo CBS. Para enfocar más el modelo en el primer plano y reducir cálculos redundantes, se introdujo el módulo TGM-CESC, logrando la generación de máscaras de convolución dispersas restringidas a nivel de píxel. Además, para mitigar posibles pérdidas de datos por convolución dispersa, incorporamos el método mejorado de contexto de cabeza (HCEM). Una evaluación exhaustiva utilizando los conjuntos de datos VisDrone y UAVDT demostró la eficacia y aplicabilidad práctica de nuestro modelo. El Efficient Yolov7-Drone logró puntuaciones de vanguardia mientras aseguraba un rendimiento de detección en tiempo real.
Descripción
En los últimos años, el auge de la tecnología de drones de ala rotativa mini de bajo costo en diversos sectores ha enfatizado el papel crucial de la detección de objetos en las imágenes aéreas de drones. Los drones de ala rotativa mini de bajo costo vienen con limitaciones intrínsecas, especialmente en poder computacional. Este contexto subraya la necesidad urgente de soluciones que sinergicen baja latencia, alta precisión y eficiencia computacional. Las metodologías anteriores han dependido principalmente de imágenes de alta resolución, lo que ha llevado a cargas computacionales considerables. Para mejorar la eficiencia y precisión de la detección de objetos en imágenes aéreas de drones, y basándonos en el YOLOv7, proponemos el Efficient YOLOv7-Drone. Reconociendo la presencia común de objetos pequeños en las imágenes aéreas, eliminamos la cabeza de detección P5 menos eficiente e incorporamos la cabeza de detección P2 para aumentar la precisión en la detección de objetos pequeños. Para asegurar una transmisión eficiente de características desde el Backbone hasta el Neck, se optimizaron los canales dentro del módulo CBS. Para enfocar más el modelo en el primer plano y reducir cálculos redundantes, se introdujo el módulo TGM-CESC, logrando la generación de máscaras de convolución dispersas restringidas a nivel de píxel. Además, para mitigar posibles pérdidas de datos por convolución dispersa, incorporamos el método mejorado de contexto de cabeza (HCEM). Una evaluación exhaustiva utilizando los conjuntos de datos VisDrone y UAVDT demostró la eficacia y aplicabilidad práctica de nuestro modelo. El Efficient Yolov7-Drone logró puntuaciones de vanguardia mientras aseguraba un rendimiento de detección en tiempo real.