LCSC-UAVNet: Un modelo de alta precisión y ligero para la identificación y detección de objetos pequeños desde la perspectiva de UAV marítimos
Autores: Wang, Yanjuan; Liu, Jiayue; Zhao, Jun; Li, Zhibin; Yan, Yuxian; Yan, Xiaohong; Xu, Fengqiang; Li, Fengqi
Idioma: Inglés
Editor: MDPI
Año: 2025
Acceso abierto
Artículo científico
2025
LCSC-UAVNet: Un modelo de alta precisión y ligero para la identificación y detección de objetos pequeños desde la perspectiva de UAV marítimos
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Robótica
Palabras clave
Vehículo aéreo no tripulado
Detección de objetos
Red neuronal convolucional
Sobrecarga computacional
Precisión de detección
Objetos pequeños
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
La detección de objetos con vehículos aéreos no tripulados (VANT) es crucial en diversos campos, como el rescate marítimo y la investigación de desastres. Sin embargo, debido a los objetos pequeños y las limitaciones del hardware y la potencia de cálculo de los VANT, la precisión de detección y la sobrecarga computacional son los problemas críticos de la detección de objetos con VANT. Para abordar estos problemas, se propone un nuevo modelo de red neuronal convolucional (CNN), LCSC-UAVNet, que mejora sustancialmente la precisión de detección y ahorra recursos computacionales. Para resolver los problemas de baja utilización de parámetros y captura de detalles insuficiente, diseñamos la Cabeza de Detección de Convolución de Diferencia Compartida Ligera (LSDCH). Esta combina capas de convolución compartida con diversas convoluciones diferenciales para mejorar la capacidad de captura de detalles para objetos pequeños. En segundo lugar, se diseñó e integró un módulo CScConv ligero para mejorar la velocidad de detección mientras se reduce el número de parámetros y el costo computacional. Además, se diseñó un Módulo Global Contextual Ligero (CGM) para extraer información contextual global de la superficie del mar y características de objetos pequeños en entornos marítimos, reduciendo así la tasa de falsos negativos para objetos pequeños. Por último, empleamos la función de pérdida WIoUv2 para abordar el problema de desequilibrio de muestras de los conjuntos de datos, mejorando la capacidad de detección. Para evaluar el rendimiento del algoritmo propuesto, se realizaron experimentos en tres conjuntos de datos comúnmente utilizados: SeaDroneSee, AFO y MOBdrone. En comparación con los algoritmos de última generación, el modelo propuesto muestra mejoras en mAP, recuperación y eficiencia, donde el mAP aumentó en más del 10%. Además, utiliza solo 5.6 M de parámetros y 16.3 G de operaciones de punto flotante, superando a modelos de última generación como YOLOv10 y RT-DETR.
Descripción
La detección de objetos con vehículos aéreos no tripulados (VANT) es crucial en diversos campos, como el rescate marítimo y la investigación de desastres. Sin embargo, debido a los objetos pequeños y las limitaciones del hardware y la potencia de cálculo de los VANT, la precisión de detección y la sobrecarga computacional son los problemas críticos de la detección de objetos con VANT. Para abordar estos problemas, se propone un nuevo modelo de red neuronal convolucional (CNN), LCSC-UAVNet, que mejora sustancialmente la precisión de detección y ahorra recursos computacionales. Para resolver los problemas de baja utilización de parámetros y captura de detalles insuficiente, diseñamos la Cabeza de Detección de Convolución de Diferencia Compartida Ligera (LSDCH). Esta combina capas de convolución compartida con diversas convoluciones diferenciales para mejorar la capacidad de captura de detalles para objetos pequeños. En segundo lugar, se diseñó e integró un módulo CScConv ligero para mejorar la velocidad de detección mientras se reduce el número de parámetros y el costo computacional. Además, se diseñó un Módulo Global Contextual Ligero (CGM) para extraer información contextual global de la superficie del mar y características de objetos pequeños en entornos marítimos, reduciendo así la tasa de falsos negativos para objetos pequeños. Por último, empleamos la función de pérdida WIoUv2 para abordar el problema de desequilibrio de muestras de los conjuntos de datos, mejorando la capacidad de detección. Para evaluar el rendimiento del algoritmo propuesto, se realizaron experimentos en tres conjuntos de datos comúnmente utilizados: SeaDroneSee, AFO y MOBdrone. En comparación con los algoritmos de última generación, el modelo propuesto muestra mejoras en mAP, recuperación y eficiencia, donde el mAP aumentó en más del 10%. Además, utiliza solo 5.6 M de parámetros y 16.3 G de operaciones de punto flotante, superando a modelos de última generación como YOLOv10 y RT-DETR.