YOLO-LSM: Un algoritmo ligero de detección de objetivos de UAV basado en el aprendizaje de información superficial y multiescala
Autores: Wu, Chenxing; Cai, Changlong; Xiao, Feng; Wang, Jiahao; Guo, Yulin; Ma, Longhui
Idioma: Inglés
Editor: MDPI
Año: 2025
Acceso abierto
Artículo científico
2025
YOLO-LSM: Un algoritmo ligero de detección de objetivos de UAV basado en el aprendizaje de información superficial y multiescala
Categoría
Gestión y administración
Subcategoría
Gestión de la tecnología y la inovación
Palabras clave
Desafíos
Objetivos pequeños
Aprendizaje profundo
Plataformas de UAV
Algoritmo ligero
Extracción de características
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
Para abordar desafíos como variaciones a gran escala, alta densidad de pequeños objetivos y el gran número de parámetros en modelos de detección de objetivos basados en aprendizaje profundo, que limitan su implementación en plataformas UAV con rendimiento fijo y recursos computacionales limitados, se propone un algoritmo de detección de objetivos ligero para UAV, YOLO-LSM. Primero, para mitigar la pérdida de información de pequeños objetivos, se desarrolla una Capa de Detección de Objetivos Pequeños Eficiente (ESTDL), junto con mejoras estructurales al modelo base para reducir parámetros. En segundo lugar, se diseña una Convolución Ligera Multiescala (MLConv), y se construye un módulo de extracción de características ligero, MLCSP, para mejorar la extracción de información detallada. Se incorpora el IoU interno de Focaler para mejorar la coincidencia y localización de cajas delimitadoras, acelerando así la convergencia del modelo. Finalmente, se propone una nueva red de fusión de características, DFSPP, para mejorar la precisión optimizando la selección y ajuste de los rangos de escala de los objetivos. Las validaciones en los conjuntos de datos VisDrone2019 y Tiny Person demuestran que, en comparación con la red de referencia, el YOLO-LSM logra una mejora de mAP0.5 de 6.9 y 3.5 puntos porcentuales, respectivamente, con un conteo de parámetros de 1.9 M, lo que representa una reducción de aproximadamente el 72%. A diferencia de trabajos anteriores sobre detección médica, este estudio adapta YOLO-LSM para la detección de pequeños objetos basada en UAV al introducir mejoras específicas en la extracción de características, cabezales de detección y funciones de pérdida, logrando una mejor adaptación a escenarios aéreos.
Descripción
Para abordar desafíos como variaciones a gran escala, alta densidad de pequeños objetivos y el gran número de parámetros en modelos de detección de objetivos basados en aprendizaje profundo, que limitan su implementación en plataformas UAV con rendimiento fijo y recursos computacionales limitados, se propone un algoritmo de detección de objetivos ligero para UAV, YOLO-LSM. Primero, para mitigar la pérdida de información de pequeños objetivos, se desarrolla una Capa de Detección de Objetivos Pequeños Eficiente (ESTDL), junto con mejoras estructurales al modelo base para reducir parámetros. En segundo lugar, se diseña una Convolución Ligera Multiescala (MLConv), y se construye un módulo de extracción de características ligero, MLCSP, para mejorar la extracción de información detallada. Se incorpora el IoU interno de Focaler para mejorar la coincidencia y localización de cajas delimitadoras, acelerando así la convergencia del modelo. Finalmente, se propone una nueva red de fusión de características, DFSPP, para mejorar la precisión optimizando la selección y ajuste de los rangos de escala de los objetivos. Las validaciones en los conjuntos de datos VisDrone2019 y Tiny Person demuestran que, en comparación con la red de referencia, el YOLO-LSM logra una mejora de mAP0.5 de 6.9 y 3.5 puntos porcentuales, respectivamente, con un conteo de parámetros de 1.9 M, lo que representa una reducción de aproximadamente el 72%. A diferencia de trabajos anteriores sobre detección médica, este estudio adapta YOLO-LSM para la detección de pequeños objetos basada en UAV al introducir mejoras específicas en la extracción de características, cabezales de detección y funciones de pérdida, logrando una mejor adaptación a escenarios aéreos.