Eagle-YOLO: un YOLO inspirado en águilas para la detección de objetos en escenarios de vehículos aéreos no tripulados
Autores: Liao, Lyuchao; Luo, Linsen; Su, Jinya; Xiao, Zhu; Zou, Fumin; Lin, Yuyuan
Idioma: Inglés
Editor: MDPI
Año: 2023
Acceso abierto
Artículo científico
2023
Eagle-YOLO: un YOLO inspirado en águilas para la detección de objetos en escenarios de vehículos aéreos no tripulados
Categoría
Matemáticas
Subcategoría
Matemáticas generales
Palabras clave
Detección de objetos
UAVs
Tamaño de escala
Objetos pequeños
Complejidad del fondo
Eagle-YOLO
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 37
Citaciones: Sin citaciones
La detección de objetos en imágenes tomadas por vehículos aéreos no tripulados (UAVs) está atrayendo un interés de investigación cada vez mayor. Debido a la flexibilidad de los UAVs, su altitud de disparo a menudo cambia rápidamente, lo que resulta en cambios drásticos en el tamaño de escala de los objetos identificados. Mientras tanto, a menudo hay muchos objetos pequeños oscurecidos entre sí en la fotografía de gran altitud, y el fondo de las imágenes capturadas también es complejo y variable. Estos problemas conducen a un desafío colosal con la detección de objetos en imágenes de fotografía aérea de UAV. Inspirados en las características de las águilas, proponemos un modelo de detección Eagle-YOLO para abordar los problemas mencionados anteriormente. Primero, de acuerdo con las características estructurales de los ojos de águila, integramos el Módulo de Atención de Núcleo Grande (LKAM) para permitir que el modelo encuentre áreas de objetos en las que se debe enfocar. Luego, en respuesta a la característica del águila de experimentar cambios drásticos en su campo de visión al zambullirse para cazar a gran altitud, introducimos un mapa de características de gran tamaño con información rica sobre objetos pequeños en la red de fusión de características. La red de fusión de características adopta una Red Piramidal de Características Bidireccional (Bi-FPN) ponderada de manera más razonable. Finalmente, inspirados en las características agudas de los ojos de águila, proponemos una pérdida de IoU llamada pérdida Eagle-IoU. Se realizaron experimentos extensos en el conjunto de datos VisDrone2021-DET para compararlo con el modelo base YOLOv5x. Los experimentos mostraron que Eagle-YOLO superó a YOLOv5x en un 2.86% y 4.23% en términos de mAP y AP50, respectivamente, lo que demuestra la efectividad de Eagle-YOLO para la detección de objetos en escenas de imágenes aéreas de UAV.
Descripción
La detección de objetos en imágenes tomadas por vehículos aéreos no tripulados (UAVs) está atrayendo un interés de investigación cada vez mayor. Debido a la flexibilidad de los UAVs, su altitud de disparo a menudo cambia rápidamente, lo que resulta en cambios drásticos en el tamaño de escala de los objetos identificados. Mientras tanto, a menudo hay muchos objetos pequeños oscurecidos entre sí en la fotografía de gran altitud, y el fondo de las imágenes capturadas también es complejo y variable. Estos problemas conducen a un desafío colosal con la detección de objetos en imágenes de fotografía aérea de UAV. Inspirados en las características de las águilas, proponemos un modelo de detección Eagle-YOLO para abordar los problemas mencionados anteriormente. Primero, de acuerdo con las características estructurales de los ojos de águila, integramos el Módulo de Atención de Núcleo Grande (LKAM) para permitir que el modelo encuentre áreas de objetos en las que se debe enfocar. Luego, en respuesta a la característica del águila de experimentar cambios drásticos en su campo de visión al zambullirse para cazar a gran altitud, introducimos un mapa de características de gran tamaño con información rica sobre objetos pequeños en la red de fusión de características. La red de fusión de características adopta una Red Piramidal de Características Bidireccional (Bi-FPN) ponderada de manera más razonable. Finalmente, inspirados en las características agudas de los ojos de águila, proponemos una pérdida de IoU llamada pérdida Eagle-IoU. Se realizaron experimentos extensos en el conjunto de datos VisDrone2021-DET para compararlo con el modelo base YOLOv5x. Los experimentos mostraron que Eagle-YOLO superó a YOLOv5x en un 2.86% y 4.23% en términos de mAP y AP50, respectivamente, lo que demuestra la efectividad de Eagle-YOLO para la detección de objetos en escenas de imágenes aéreas de UAV.