GC-Faster RCNN: El algoritmo de detección de objetos para plagas agrícolas basado en un mecanismo de atención híbrido mejorado
Autores: Guan, Bolun; Wu, Yaqian; Zhu, Jingbo; Kong, Juanjuan; Dong, Wei
Idioma: Inglés
Editor: MDPI
Año: 2025
Acceso abierto
Artículo científico
2025
GC-Faster RCNN: El algoritmo de detección de objetos para plagas agrícolas basado en un mecanismo de atención híbrido mejorado
Categoría
Ciencias Agrícolas y Biológicas
Subcategoría
Botánica
Palabras clave
Infestaciones de plagas
Agricultura global
Rendimiento de cultivos
Detección de plagas
Conjuntos de datos a múltiples escalas
Modelos de detección
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 9
Citaciones: Sin citaciones
Las infestaciones de plagas siguen siendo una amenaza crítica para la agricultura global, comprometiendo significativamente el rendimiento y la calidad de los cultivos. Si bien la detección precisa de plagas forma la base de la gestión de plagas de precisión, los enfoques actuales enfrentan dos desafíos principales: (1) la escasez de conjuntos de datos de plagas multi-escala y multi-categoría y (2) las limitaciones de rendimiento en los modelos de detección causadas por variaciones sustanciales en la escala del objetivo y una alta similitud morfológica entre clases. Para abordar estos problemas, presentamos tres contribuciones clave: Primero, introducimos Insect25, un nuevo conjunto de datos de detección de plagas agrícolas que contiene 25 categorías distintas de plagas, que comprende 18,349 imágenes de alta resolución. Este conjunto de datos aborda específicamente la diversidad de escalas a través de protocolos de adquisición multi-resolución, enriqueciendo significativamente la distribución de características para un entrenamiento robusto del modelo. En segundo lugar, proponemos GC-Faster RCNN, un marco de detección mejorado que integra un mecanismo de atención híbrido que combina sinérgicamente correlaciones a nivel de canal y dependencias espaciales. Este diseño de atención dual permite una extracción de características más discriminativa, que es particularmente efectiva para distinguir especies de plagas morfológicamente similares. En tercer lugar, implementamos una estrategia de entrenamiento optimizada que presenta un programador de enfriamiento coseno con calentamiento lineal, acelerando la convergencia del modelo mientras se mantiene la estabilidad del entrenamiento. Los experimentos han demostrado que, en comparación con el modelo original Faster RCNN, GC-Faster RCNN ha mejorado la precisión promedio mAP0.5 en el conjunto de datos Insect25 en 4.5 puntos porcentuales, y mAP0.75 en 20.4 puntos porcentuales, mAP0.5:0.95 aumentó en 20.8 puntos porcentuales, y la tasa de recuperación aumentó en 16.6 puntos porcentuales. Además, los experimentos también han demostrado que el método de detección GC-Faster RCNN puede reducir la interferencia de múltiples escalas y la alta similitud entre categorías, mejorando el rendimiento de detección.
Descripción
Las infestaciones de plagas siguen siendo una amenaza crítica para la agricultura global, comprometiendo significativamente el rendimiento y la calidad de los cultivos. Si bien la detección precisa de plagas forma la base de la gestión de plagas de precisión, los enfoques actuales enfrentan dos desafíos principales: (1) la escasez de conjuntos de datos de plagas multi-escala y multi-categoría y (2) las limitaciones de rendimiento en los modelos de detección causadas por variaciones sustanciales en la escala del objetivo y una alta similitud morfológica entre clases. Para abordar estos problemas, presentamos tres contribuciones clave: Primero, introducimos Insect25, un nuevo conjunto de datos de detección de plagas agrícolas que contiene 25 categorías distintas de plagas, que comprende 18,349 imágenes de alta resolución. Este conjunto de datos aborda específicamente la diversidad de escalas a través de protocolos de adquisición multi-resolución, enriqueciendo significativamente la distribución de características para un entrenamiento robusto del modelo. En segundo lugar, proponemos GC-Faster RCNN, un marco de detección mejorado que integra un mecanismo de atención híbrido que combina sinérgicamente correlaciones a nivel de canal y dependencias espaciales. Este diseño de atención dual permite una extracción de características más discriminativa, que es particularmente efectiva para distinguir especies de plagas morfológicamente similares. En tercer lugar, implementamos una estrategia de entrenamiento optimizada que presenta un programador de enfriamiento coseno con calentamiento lineal, acelerando la convergencia del modelo mientras se mantiene la estabilidad del entrenamiento. Los experimentos han demostrado que, en comparación con el modelo original Faster RCNN, GC-Faster RCNN ha mejorado la precisión promedio mAP0.5 en el conjunto de datos Insect25 en 4.5 puntos porcentuales, y mAP0.75 en 20.4 puntos porcentuales, mAP0.5:0.95 aumentó en 20.8 puntos porcentuales, y la tasa de recuperación aumentó en 16.6 puntos porcentuales. Además, los experimentos también han demostrado que el método de detección GC-Faster RCNN puede reducir la interferencia de múltiples escalas y la alta similitud entre categorías, mejorando el rendimiento de detección.