Lcfanet: un novedoso ligero red de agregación de características a través de niveles para la detección de pequeñas plagas agrícolas
Autores: Huang, Shijian; Tian, Yunong; Tan, Yong; Liang, Zize
Idioma: Inglés
Editor: MDPI
Año: 2025
Acceso abierto
Artículo científico
2025
Lcfanet: un novedoso ligero red de agregación de características a través de niveles para la detección de pequeñas plagas agrícolas
Categoría
Ciencias Agrícolas y Biológicas
Subcategoría
Agronomía y Ciencia de los Cultivos
Palabras clave
Detección de plagas agrícolas
Red de Agregación de Características Liviana entre Niveles
Agregación de Características Temporales Duales C3k2
Convolución de Muestreo Agregado
Pirámide de Características Jerárquicas entre Niveles
Fusión Espacial Adaptativa Multiescala
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 23
Citaciones: Sin citaciones
En la detección de plagas agrícolas, el tamaño pequeño de las plagas representa un obstáculo crítico para la precisión de la detección. Para mitigar esta preocupación, proponemos una Red de Agregación de Características Cruzadas de Peso Ligero (LCFANet), que consta de tres componentes clave: una red de extracción de características profundas, una red de fusión de características profundas y una cabeza de detección de objetos a múltiples escalas. Dentro de las redes de extracción y fusión de características, introducimos el módulo de Agregación de Características Temporales Duales C3k2 (DTFA-C3k2), aprovechando un mecanismo de fusión espacio-temporal para integrar características de múltiples campos receptivos mientras se preservan los detalles texturales y estructurales detallados a través de escalas. Esto mejora significativamente el rendimiento de detección para objetos con variaciones de escala grandes. Además, proponemos el módulo de Convolución de Muestreo Agregado (ADown-Conv), una unidad de compresión de doble vía que mejora la representación de características al reducir eficientemente las dimensiones espaciales. Para la fusión de características, diseñamos una Pirámide de Características Jerárquicas Cruzadas (CLHFP), que emplea una construcción de pirámide bidireccional para la fusión de profundo a superficial y una construcción de pirámide hacia adelante para el refinamiento de características. La cabeza de detección incorpora un módulo de Fusión Espacial Adaptativa a Múltiples Escalas (MSASF), fusionando de manera adaptativa características en escalas específicas para mejorar la precisión en objetos de diferentes tamaños. Además, introducimos la función de pérdida MPDINIoU, que combina InnerIoU y MPDIoU para optimizar la regresión de cuadros delimitadores. El modelo LCFANet-n tiene parámetros y un costo computacional de GFLOPs, lo que permite un despliegue ligero. Experimentos extensos en el conjunto de datos público demuestran que el modelo LCFANet-n logra una precisión de , un recall de , un mAP50 de , y un mAP50-95 de , alcanzando un rendimiento de vanguardia (SOTA) en la detección de plagas de tamaño pequeño mientras mantiene una arquitectura ligera.
Descripción
En la detección de plagas agrícolas, el tamaño pequeño de las plagas representa un obstáculo crítico para la precisión de la detección. Para mitigar esta preocupación, proponemos una Red de Agregación de Características Cruzadas de Peso Ligero (LCFANet), que consta de tres componentes clave: una red de extracción de características profundas, una red de fusión de características profundas y una cabeza de detección de objetos a múltiples escalas. Dentro de las redes de extracción y fusión de características, introducimos el módulo de Agregación de Características Temporales Duales C3k2 (DTFA-C3k2), aprovechando un mecanismo de fusión espacio-temporal para integrar características de múltiples campos receptivos mientras se preservan los detalles texturales y estructurales detallados a través de escalas. Esto mejora significativamente el rendimiento de detección para objetos con variaciones de escala grandes. Además, proponemos el módulo de Convolución de Muestreo Agregado (ADown-Conv), una unidad de compresión de doble vía que mejora la representación de características al reducir eficientemente las dimensiones espaciales. Para la fusión de características, diseñamos una Pirámide de Características Jerárquicas Cruzadas (CLHFP), que emplea una construcción de pirámide bidireccional para la fusión de profundo a superficial y una construcción de pirámide hacia adelante para el refinamiento de características. La cabeza de detección incorpora un módulo de Fusión Espacial Adaptativa a Múltiples Escalas (MSASF), fusionando de manera adaptativa características en escalas específicas para mejorar la precisión en objetos de diferentes tamaños. Además, introducimos la función de pérdida MPDINIoU, que combina InnerIoU y MPDIoU para optimizar la regresión de cuadros delimitadores. El modelo LCFANet-n tiene parámetros y un costo computacional de GFLOPs, lo que permite un despliegue ligero. Experimentos extensos en el conjunto de datos público demuestran que el modelo LCFANet-n logra una precisión de , un recall de , un mAP50 de , y un mAP50-95 de , alcanzando un rendimiento de vanguardia (SOTA) en la detección de plagas de tamaño pequeño mientras mantiene una arquitectura ligera.