logo móvil
Contáctanos

Módulo de atención espacial de canal mejorado por frecuencia para la clasificación de plagas de granos

Autores: Yu, Junwei; Shen, Yi; Liu, Nan; Pan, Quan

Idioma: Inglés

Editor: MDPI

Año: 2022

Descargar PDF

Acceso abierto

Artículo científico
2022

Módulo de atención espacial de canal mejorado por frecuencia para la clasificación de plagas de granos


Categoría

Ciencias Agrícolas y Biológicas

Subcategoría

Ciencias Agrícolas y Biológicas Generales

Palabras clave

Almacenamiento de granos
Reconocimiento de especies de plagas de granos
Tecnología de aprendizaje profundo
Redes neuronales convolucionales
Conjunto de datos de plagas de insectos primarios
Mecanismos de atención

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 20

Citaciones: Sin citaciones


Descripción
Para el almacenamiento y protección de granos, el reconocimiento de especies de plagas de granos y la estimación de la densidad de población son de gran importancia. Con el rápido desarrollo de la tecnología de aprendizaje profundo, muchos estudios han demostrado que los métodos basados en redes neuronales convolucionales (CNN) funcionan extremadamente bien en la clasificación de imágenes. Sin embargo, dichos estudios sobre la clasificación de plagas de granos todavía son limitados en los siguientes dos aspectos. En primer lugar, no existe un conjunto de datos de alta calidad de plagas de insectos primarios especificados por la norma ISO 6322-3 y el Criterio Técnico Chino para el Almacenamiento de Granos y Semillas Oleaginosas (GB/T 29890). Las imágenes de escenas realistas de almacenamiento plantean grandes desafíos para la identificación de plagas de granos, ya que las imágenes tienen atributos de objetos pequeños, formas de plagas variables y fondos desordenados. En segundo lugar, los estudios existentes principalmente utilizan mecanismos de atención de canal o espaciales, y como consecuencia, la información útil en otros dominios no se ha utilizado completamente. Para abordar estas limitaciones, recopilamos un conjunto de datos llamado GP10, que consiste en 1082 imágenes de plagas de insectos primarios en 10 especies. Además, involucramos la transformada discreta de ondícula (DWT) en una red neuronal convolucional para construir una nueva red de triple atención (FcsNet) combinada con módulos de atención de frecuencia, canal y espaciales. A continuación, comparamos el rendimiento y los parámetros de la red con varios redes de última generación basadas en diferentes mecanismos de atención. Evaluamos la red propuesta en nuestro conjunto de datos GP10 y en el conjunto de datos abierto D0, logrando una precisión de clasificación del 73.79% y 98.16%. La red propuesta obtiene más de un 3% de ganancias de precisión en el desafiante conjunto de datos GP10 con parámetros y operaciones de cálculo ligeramente aumentados. La visualización con mapeo de activación de clase ponderada por gradiente (Grad-CAM) demuestra que FcsNet tiene ventajas comparativas en tareas de clasificación de imágenes.

Otros recursos que podrían interesarte

Temas Virtualpro