Frecuencia-Dominio colaborativo Super-Resolución Ligera para Mejora de Textura Fina en Imágenes de Arroz
Autores: Zhang, Zexiao; Zhang, Jie; Du, Jinyang; Chen, Xiangdong; Zhang, Wenjing; Peng, Changmeng
Idioma: Inglés
Editor: MDPI
Año: 2025
Acceso abierto
Artículo científico
2025
Frecuencia-Dominio colaborativo Super-Resolución Ligera para Mejora de Textura Fina en Imágenes de Arroz
Categoría
Ciencias Agrícolas y Biológicas
Subcategoría
Agronomía y Ciencia de los Cultivos
Palabras clave
Tareas de detección de arroz
Rayas en las hojas
Distribución de plagas y enfermedades
Jerarquías de espiguillas
Método de reconstrucción de imágenes
Estructura heterogénea de dos ramas adaptativa
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 21
Citaciones: Sin citaciones
En tareas de detección de arroz, la identificación precisa de rayas en las hojas, la distribución de plagas y enfermedades, y las jerarquías de espiguillas depende de imágenes de alta calidad para distinguir entre textura y jerarquía. Sin embargo, las imágenes existentes a menudo sufren de difuminación de textura y desplazamiento de contornos debido a limitaciones de equipo y entorno, lo que afecta el rendimiento de detección. Dado que las plagas y enfermedades afectan toda la situación y los pequeños detalles están mayormente localizados, proponemos un método de reconstrucción de imágenes de arroz basado en una estructura heterogénea de dos ramas adaptativas. El método consta de una rama de baja frecuencia (LFB) que recupera características globales utilizando campos receptivos extendidos conscientes de la orientación para capturar características globales a rayas, como plagas y enfermedades, y una rama de alta frecuencia (HFB) que mejora los bordes de los detalles a través de un mecanismo de mejora adaptativa para aumentar la claridad de las regiones de detalles locales. Al introducir el mecanismo de fusión de peso dinámico (CSDW) y la red de compuerta ligera (LFFN), se resuelve el problema de la fusión desequilibrada de información de frecuencia para imágenes de arroz en métodos tradicionales. Los experimentos en el conjunto de prueba de arroz submuestreado 4 veces demuestran que el método propuesto logra una reducción del 62% en parámetros en comparación con EDSR, un costo computacional un 41% menor (30 G) que MambaIR-light, y una mejora promedio de 0.68% en PSNR sobre otros métodos en el estudio al mismo tiempo que equilibra el uso de memoria (227 M) y la velocidad de inferencia. En la validación de tareas posteriores, la detección de madurez de panícula de arroz logra un aumento del 61.5% en mAP50 (0.480 - 0.775) en comparación con los métodos de interpolación, y la detección de plagas en las hojas muestra una mejora del 2.7% en el mAP50 promedio (0.949 - 0.975). Esta investigación proporciona una solución efectiva para la mejora de imágenes de arroz ligero, con su mecanismo colaborativo de doble rama y estrategia de fusión dinámica estableciendo un nuevo paradigma en el procesamiento de imágenes agrícolas de arroz.
Descripción
En tareas de detección de arroz, la identificación precisa de rayas en las hojas, la distribución de plagas y enfermedades, y las jerarquías de espiguillas depende de imágenes de alta calidad para distinguir entre textura y jerarquía. Sin embargo, las imágenes existentes a menudo sufren de difuminación de textura y desplazamiento de contornos debido a limitaciones de equipo y entorno, lo que afecta el rendimiento de detección. Dado que las plagas y enfermedades afectan toda la situación y los pequeños detalles están mayormente localizados, proponemos un método de reconstrucción de imágenes de arroz basado en una estructura heterogénea de dos ramas adaptativas. El método consta de una rama de baja frecuencia (LFB) que recupera características globales utilizando campos receptivos extendidos conscientes de la orientación para capturar características globales a rayas, como plagas y enfermedades, y una rama de alta frecuencia (HFB) que mejora los bordes de los detalles a través de un mecanismo de mejora adaptativa para aumentar la claridad de las regiones de detalles locales. Al introducir el mecanismo de fusión de peso dinámico (CSDW) y la red de compuerta ligera (LFFN), se resuelve el problema de la fusión desequilibrada de información de frecuencia para imágenes de arroz en métodos tradicionales. Los experimentos en el conjunto de prueba de arroz submuestreado 4 veces demuestran que el método propuesto logra una reducción del 62% en parámetros en comparación con EDSR, un costo computacional un 41% menor (30 G) que MambaIR-light, y una mejora promedio de 0.68% en PSNR sobre otros métodos en el estudio al mismo tiempo que equilibra el uso de memoria (227 M) y la velocidad de inferencia. En la validación de tareas posteriores, la detección de madurez de panícula de arroz logra un aumento del 61.5% en mAP50 (0.480 - 0.775) en comparación con los métodos de interpolación, y la detección de plagas en las hojas muestra una mejora del 2.7% en el mAP50 promedio (0.949 - 0.975). Esta investigación proporciona una solución efectiva para la mejora de imágenes de arroz ligero, con su mecanismo colaborativo de doble rama y estrategia de fusión dinámica estableciendo un nuevo paradigma en el procesamiento de imágenes agrícolas de arroz.