Segmentación semántica de imágenes de roya de la espiga de trigo utilizando aprendizaje profundo
Autores: Li, Yang; Qiao, Tianle; Leng, Wenbo; Jiao, Wenrui; Luo, Jing; Lv, Yang; Tong, Yiran; Mei, Xuanjing; Li, Hongsheng; Hu, Qiongqiong; Yao, Qiang
Idioma: Inglés
Editor: MDPI
Año: 2022
Acceso abierto
Artículo científico
2022
Segmentación semántica de imágenes de roya de la espiga de trigo utilizando aprendizaje profundo
Categoría
Ciencias Agrícolas y Biológicas
Subcategoría
Agronomía y Ciencia de los Cultivos
Palabras clave
Trigo
Roya de la paja
Segmentación
Aprendizaje profundo
Conjunto de datos
Modelo Octave-UNet
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 22
Citaciones: Sin citaciones
Las hojas dañadas por el óxido rayado del trigo presentan desafíos para el cálculo automático del índice de enfermedad, incluida la alta similitud entre esporas y manchas, y la dificultad para distinguir los contornos de los bordes. En las aplicaciones de campo reales, los investigadores confían en el ojo humano para juzgar la extensión de la enfermedad, lo cual es subjetivo, de baja precisión y fundamentalmente cualitativo. Para abordar los problemas anteriores, este estudio se embarcó en una tarea de segmentación semántica de imágenes de daños por óxido rayado del trigo utilizando aprendizaje profundo. Para abordar el problema de conjuntos de datos pequeños disponibles, se construyó el primer conjunto de datos abierto a gran escala de imágenes de óxido rayado del trigo de la provincia de Qinghai a través de adquisición de imágenes de campo e invernadero, selección, filtrado y anotación manual. Había 33,238 imágenes en nuestro conjunto de datos con un tamaño de 512 x 512 píxeles. Se definió un nuevo paradigma de segmentación. Dividiendo esporas y manchas indistinguibles en diferentes clases, se investigó la tarea de segmentación precisa del fondo, la hoja (que contiene manchas) y las esporas. Para asignar diferentes pesos a las características de alta y baja frecuencia, utilizamos el modelo Octave-UNet que reemplaza la operación convolucional original con la convolución octava en el modelo U-Net. El modelo Octave-UNet obtuvo los mejores resultados de referencia entre cuatro modelos (PSPNet, DeepLabv3, U-Net, Octave-UNet), la intersección media sobre una unión del modelo Octave-UNet fue del 83.44%, la precisión media de píxeles fue del 94.58% y la precisión fue del 96.06%, respectivamente. Los resultados mostraron que el modelo Octave-UNet de última generación puede representar y discernir mejor la información semántica sobre una región pequeña y mejorar la precisión de segmentación de esporas, hojas y fondos en nuestro conjunto de datos construido.
Descripción
Las hojas dañadas por el óxido rayado del trigo presentan desafíos para el cálculo automático del índice de enfermedad, incluida la alta similitud entre esporas y manchas, y la dificultad para distinguir los contornos de los bordes. En las aplicaciones de campo reales, los investigadores confían en el ojo humano para juzgar la extensión de la enfermedad, lo cual es subjetivo, de baja precisión y fundamentalmente cualitativo. Para abordar los problemas anteriores, este estudio se embarcó en una tarea de segmentación semántica de imágenes de daños por óxido rayado del trigo utilizando aprendizaje profundo. Para abordar el problema de conjuntos de datos pequeños disponibles, se construyó el primer conjunto de datos abierto a gran escala de imágenes de óxido rayado del trigo de la provincia de Qinghai a través de adquisición de imágenes de campo e invernadero, selección, filtrado y anotación manual. Había 33,238 imágenes en nuestro conjunto de datos con un tamaño de 512 x 512 píxeles. Se definió un nuevo paradigma de segmentación. Dividiendo esporas y manchas indistinguibles en diferentes clases, se investigó la tarea de segmentación precisa del fondo, la hoja (que contiene manchas) y las esporas. Para asignar diferentes pesos a las características de alta y baja frecuencia, utilizamos el modelo Octave-UNet que reemplaza la operación convolucional original con la convolución octava en el modelo U-Net. El modelo Octave-UNet obtuvo los mejores resultados de referencia entre cuatro modelos (PSPNet, DeepLabv3, U-Net, Octave-UNet), la intersección media sobre una unión del modelo Octave-UNet fue del 83.44%, la precisión media de píxeles fue del 94.58% y la precisión fue del 96.06%, respectivamente. Los resultados mostraron que el modelo Octave-UNet de última generación puede representar y discernir mejor la información semántica sobre una región pequeña y mejorar la precisión de segmentación de esporas, hojas y fondos en nuestro conjunto de datos construido.