Un método de detección de objetos en superficies de agua de tipo multi-escala basado en la red YOLOv5 mejorada
Autores: Ma, Zhongli; Wan, Yi; Liu, Jiajia; An, Ruojin; Wu, Lili
Idioma: Inglés
Editor: MDPI
Año: 2023
Acceso abierto
Artículo científico
2023
Un método de detección de objetos en superficies de agua de tipo multi-escala basado en la red YOLOv5 mejorada
Categoría
Matemáticas
Subcategoría
Matemáticas generales
Palabras clave
Sistemas de detección de objetos
Entornos de superficie de agua
Modelo YOLOv5
Cuadros delimitadores
Objetivos a múltiples escalas
Mecanismo de atención GAM.
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 39
Citaciones: Sin citaciones
Los sistemas de detección de objetos basados en visión son componentes esenciales de equipos inteligentes para entornos de superficie de agua. La diversidad de tipos de objetivos en la superficie del agua, la distribución desigual de tamaños y las dificultades en la construcción de conjuntos de datos representan desafíos significativos para la detección de objetos en la superficie del agua. Este artículo propone un método de detección de objetivos YOLOv5 mejorado para abordar las características de diversos tipos, grandes cantidades y múltiples escalas de objetivos reales en la superficie del agua. El modelo YOLOv5 mejorado optimiza la extracción de cuadros delimitadores utilizando K-means++ para obtener una distribución más amplia de cuadros delimitadores predefinidos, mejorando así la precisión de detección para objetivos de múltiples escalas. Introducimos el mecanismo GAMAttention en la red principal del modelo para aliviar la significativa diferencia de rendimiento entre objetivos grandes y pequeños causada por su naturaleza multi-escala. El módulo de pirámide espacial en la red principal se reemplaza para mejorar la capacidad de percepción del modelo en la segmentación de objetivos de diferentes escalas. Finalmente, se incorpora la función de pérdida de clasificación Focal loss para abordar los problemas de sobreajuste y baja precisión causados por la distribución desequilibrada de clases en los datos de entrenamiento. Realizamos pruebas comparativas en un conjunto de datos autoconstruido que comprende diez categorías de objetivos en la superficie del agua utilizando cuatro algoritmos: Faster R-CNN, YOLOv4, YOLOv5 y el YOLOv5 mejorado propuesto. Los resultados experimentales demuestran que el modelo mejorado logra la mejor precisión de detección, con una mejora del 8% en mAP@0.5 en comparación con el YOLOv5 original en la detección de objetos en la superficie del agua a múltiples escalas.
Descripción
Los sistemas de detección de objetos basados en visión son componentes esenciales de equipos inteligentes para entornos de superficie de agua. La diversidad de tipos de objetivos en la superficie del agua, la distribución desigual de tamaños y las dificultades en la construcción de conjuntos de datos representan desafíos significativos para la detección de objetos en la superficie del agua. Este artículo propone un método de detección de objetivos YOLOv5 mejorado para abordar las características de diversos tipos, grandes cantidades y múltiples escalas de objetivos reales en la superficie del agua. El modelo YOLOv5 mejorado optimiza la extracción de cuadros delimitadores utilizando K-means++ para obtener una distribución más amplia de cuadros delimitadores predefinidos, mejorando así la precisión de detección para objetivos de múltiples escalas. Introducimos el mecanismo GAMAttention en la red principal del modelo para aliviar la significativa diferencia de rendimiento entre objetivos grandes y pequeños causada por su naturaleza multi-escala. El módulo de pirámide espacial en la red principal se reemplaza para mejorar la capacidad de percepción del modelo en la segmentación de objetivos de diferentes escalas. Finalmente, se incorpora la función de pérdida de clasificación Focal loss para abordar los problemas de sobreajuste y baja precisión causados por la distribución desequilibrada de clases en los datos de entrenamiento. Realizamos pruebas comparativas en un conjunto de datos autoconstruido que comprende diez categorías de objetivos en la superficie del agua utilizando cuatro algoritmos: Faster R-CNN, YOLOv4, YOLOv5 y el YOLOv5 mejorado propuesto. Los resultados experimentales demuestran que el modelo mejorado logra la mejor precisión de detección, con una mejora del 8% en mAP@0.5 en comparación con el YOLOv5 original en la detección de objetos en la superficie del agua a múltiples escalas.