SODCNN: Un modelo de red neuronal convolucional para la detección de objetos pequeños en imágenes capturadas por drones
Autores: Meng, Lu; Zhou, Lijun; Liu, Yangqian
Idioma: Inglés
Editor: MDPI
Año: 2023
Acceso abierto
Artículo científico
2023
SODCNN: Un modelo de red neuronal convolucional para la detección de objetos pequeños en imágenes capturadas por drones
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Robótica
Palabras clave
Imágenes de drones
Objetos pequeños
Detección de objetos
Red YOLOv7
Cajas de anclaje
Fusión de características
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
Las imágenes de drones contienen una gran cantidad de objetivos pequeños y densos. Y son vitales para la agricultura, la seguridad, el monitoreo y más. Sin embargo, la detección de objetos pequeños sigue siendo un desafío no resuelto, ya que ocupan una pequeña proporción de la imagen y tienen características menos distintivas. Los algoritmos convencionales de detección de objetos no logran producir resultados satisfactorios para objetos pequeños. Para abordar este problema, se propone un algoritmo mejorado para la detección de objetos pequeños mediante la modificación de la estructura de la red YOLOv7. En primer lugar, se elimina la cabeza de detección redundante para objetos grandes, y se avanza en la extracción de características para la detección de objetos pequeños. En segundo lugar, se aumenta el número de cajas de anclaje para mejorar la tasa de recuperación de objetos pequeños. Y, considerando las limitaciones de la función de pérdida CIoU en la optimización, se emplea la función de pérdida EIoU como función de pérdida de la caja delimitadora, para lograr una regresión más estable y efectiva. Por último, se introduce un módulo de fusión de características basado en atención para reemplazar el módulo Concat en FPN. Este módulo considera tanto la información global como la local, abordando efectivamente los desafíos en la fusión de objetos multiescala y pequeños. Los resultados experimentales en el conjunto de datos VisDrone2019 demuestran que el algoritmo propuesto logra un mAP50 del 54.03% y un mAP50:90 del 32.06%, superando los últimos trabajos de investigación similares y mejorando significativamente la capacidad del modelo para la detección de objetos pequeños en escenas densas.
Descripción
Las imágenes de drones contienen una gran cantidad de objetivos pequeños y densos. Y son vitales para la agricultura, la seguridad, el monitoreo y más. Sin embargo, la detección de objetos pequeños sigue siendo un desafío no resuelto, ya que ocupan una pequeña proporción de la imagen y tienen características menos distintivas. Los algoritmos convencionales de detección de objetos no logran producir resultados satisfactorios para objetos pequeños. Para abordar este problema, se propone un algoritmo mejorado para la detección de objetos pequeños mediante la modificación de la estructura de la red YOLOv7. En primer lugar, se elimina la cabeza de detección redundante para objetos grandes, y se avanza en la extracción de características para la detección de objetos pequeños. En segundo lugar, se aumenta el número de cajas de anclaje para mejorar la tasa de recuperación de objetos pequeños. Y, considerando las limitaciones de la función de pérdida CIoU en la optimización, se emplea la función de pérdida EIoU como función de pérdida de la caja delimitadora, para lograr una regresión más estable y efectiva. Por último, se introduce un módulo de fusión de características basado en atención para reemplazar el módulo Concat en FPN. Este módulo considera tanto la información global como la local, abordando efectivamente los desafíos en la fusión de objetos multiescala y pequeños. Los resultados experimentales en el conjunto de datos VisDrone2019 demuestran que el algoritmo propuesto logra un mAP50 del 54.03% y un mAP50:90 del 32.06%, superando los últimos trabajos de investigación similares y mejorando significativamente la capacidad del modelo para la detección de objetos pequeños en escenas densas.