Una técnica general de reconstrucción de superresolución de imágenes para el modelo de detección de objetos de nuez
Autores: Wu, Mingjie; Yang, Xuanxi; Yun, Lijun; Yang, Chenggui; Chen, Zaiqing; Xia, Yuelong
Idioma: Inglés
Editor: MDPI
Año: 2024
Acceso abierto
Artículo científico
2024
Una técnica general de reconstrucción de superresolución de imágenes para el modelo de detección de objetos de nuez
Categoría
Ciencias Agrícolas y Biológicas
Subcategoría
Ciencias Agrícolas y Biológicas Generales
Palabras clave
Modelos de detección de objetos
Walnut-SR
Módulo de reconstrucción de super resolución
MDAARB
RRDB
CBAM
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 25
Citaciones: Sin citaciones
Los modelos de detección de objetos son comúnmente utilizados en procesos de estimación de rendimiento en la producción inteligente de nueces. La precisión de estos modelos en capturar características de nueces depende en gran medida de la calidad de las imágenes de entrada. Sin cambiar los dispositivos de adquisición de imágenes existentes, este estudio propone un módulo de reconstrucción de súper resolución para imágenes de nueces adquiridas por drones, llamado Walnut-SR, para mejorar las características detalladas de las frutas de nuez en las imágenes, mejorando así la precisión de detección del modelo de detección de objetos. En Walnut-SR, se diseña una red de extracción de características profundas llamada MDAARB (bloque residual de atención adaptativa de profundidad multinivel) para capturar información a múltiples escalas a través de conexiones de canal multinivel. Además, Walnut-SR incorpora una rama RRDB (bloque denso residual en residual), lo que permite que el módulo se enfoque en información de características importantes y reconstruya imágenes con detalles ricos. Finalmente, el mecanismo de atención CBAM (módulo de atención de bloque convolucional) se integra en la rama residual de extracción de características superficial para mitigar el ruido en las características superficiales. En experimentos de reconstrucción de 2x y 4x, los resultados de evaluación objetiva muestran que el PSNR y SSIM para la reconstrucción de 2x y 4x alcanzaron 24.66 dB y 0.8031, y 19.26 dB y 0.4991, respectivamente. Los resultados de evaluación subjetiva indican que Walnut-SR puede reconstruir imágenes con información de detalle más rica y características de textura más claras. Los resultados experimentales comparativos del módulo integrado Walnut-SR muestran mejoras significativas en mAP50 y mAP50:95 para modelos de detección de objetos en comparación con los resultados de detección utilizando las imágenes originales de baja resolución.
Descripción
Los modelos de detección de objetos son comúnmente utilizados en procesos de estimación de rendimiento en la producción inteligente de nueces. La precisión de estos modelos en capturar características de nueces depende en gran medida de la calidad de las imágenes de entrada. Sin cambiar los dispositivos de adquisición de imágenes existentes, este estudio propone un módulo de reconstrucción de súper resolución para imágenes de nueces adquiridas por drones, llamado Walnut-SR, para mejorar las características detalladas de las frutas de nuez en las imágenes, mejorando así la precisión de detección del modelo de detección de objetos. En Walnut-SR, se diseña una red de extracción de características profundas llamada MDAARB (bloque residual de atención adaptativa de profundidad multinivel) para capturar información a múltiples escalas a través de conexiones de canal multinivel. Además, Walnut-SR incorpora una rama RRDB (bloque denso residual en residual), lo que permite que el módulo se enfoque en información de características importantes y reconstruya imágenes con detalles ricos. Finalmente, el mecanismo de atención CBAM (módulo de atención de bloque convolucional) se integra en la rama residual de extracción de características superficial para mitigar el ruido en las características superficiales. En experimentos de reconstrucción de 2x y 4x, los resultados de evaluación objetiva muestran que el PSNR y SSIM para la reconstrucción de 2x y 4x alcanzaron 24.66 dB y 0.8031, y 19.26 dB y 0.4991, respectivamente. Los resultados de evaluación subjetiva indican que Walnut-SR puede reconstruir imágenes con información de detalle más rica y características de textura más claras. Los resultados experimentales comparativos del módulo integrado Walnut-SR muestran mejoras significativas en mAP50 y mAP50:95 para modelos de detección de objetos en comparación con los resultados de detección utilizando las imágenes originales de baja resolución.