El preprocesamiento de datos de entrenamiento mejora la precisión y la generalización de la segmentación semántica de paisajes basada en redes neuronales convolucionales
Autores: Clark, Andrew; Phinn, Stuart; Scarth, Peter
Idioma: Inglés
Editor: MDPI
Año: 2023
Acceso abierto
Artículo científico
2023
El preprocesamiento de datos de entrenamiento mejora la precisión y la generalización de la segmentación semántica de paisajes basada en redes neuronales convolucionales
Categoría
Ciencias Medioambientales
Subcategoría
Ciencias medioambientales generales
Palabras clave
Preprocesamiento de datos
Aprendizaje profundo
Uso del suelo y cobertura terrestre
Red neuronal convolucional
Datos de observación de la Tierra
Segmentación semántica
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
El preprocesamiento de datos para desarrollar un modelo de aprendizaje profundo generalizado de uso y cobertura del suelo (LULC) utilizando datos de observación de la Tierra es importante para la clasificación de diferentes fechas y/o sensores. Sin embargo, no está claro cómo abordar los problemas de segmentación de aprendizaje profundo en los datos de observación de la Tierra. En este artículo, probamos diferentes métodos de preparación de datos para el entrenamiento de Redes Neuronales Convolucionales (CNN) y la segmentación semántica de características LULC dentro de la fotografía aérea sobre los Trópicos Húmedos y las Mesetas de Atherton, Queensland, Australia. Esto se llevó a cabo probando y clasificando varias estrategias de muestreo de selección de parches de entrenamiento, tamaños de parches y lotes, aumentaciones de datos y estrategias de escalado e inferencia. Nuestros resultados mostraron: un enfoque de muestreo aleatorio estratificado para producir parches de entrenamiento contrarrestó los desequilibrios de clase; un menor número de parches más grandes (tamaño de lote pequeño) mejora la precisión del modelo; las aumentaciones de datos y el escalado son imperativos para crear un modelo generalizado capaz de clasificar con precisión las características LULC en imágenes de diferentes fechas y sensores; y producir la clasificación de salida promediando múltiples cuadrículas de parches y tres versiones rotadas de cada parche produjo un resultado más preciso y estético. Combinando los hallazgos de los ensayos, entrenamos completamente cinco modelos con la imagen de entrenamiento de 2018 y aplicamos el modelo a la imagen de prueba de 2015. Las clasificaciones de LULC de salida lograron un kappa promedio de 0.84, una precisión del usuario de 0.81 y una precisión del productor de 0.87. La investigación futura utilizando CNN y datos de observación de la Tierra debería implementar los hallazgos de este proyecto para aumentar la precisión y transferibilidad del modelo LULC.
Descripción
El preprocesamiento de datos para desarrollar un modelo de aprendizaje profundo generalizado de uso y cobertura del suelo (LULC) utilizando datos de observación de la Tierra es importante para la clasificación de diferentes fechas y/o sensores. Sin embargo, no está claro cómo abordar los problemas de segmentación de aprendizaje profundo en los datos de observación de la Tierra. En este artículo, probamos diferentes métodos de preparación de datos para el entrenamiento de Redes Neuronales Convolucionales (CNN) y la segmentación semántica de características LULC dentro de la fotografía aérea sobre los Trópicos Húmedos y las Mesetas de Atherton, Queensland, Australia. Esto se llevó a cabo probando y clasificando varias estrategias de muestreo de selección de parches de entrenamiento, tamaños de parches y lotes, aumentaciones de datos y estrategias de escalado e inferencia. Nuestros resultados mostraron: un enfoque de muestreo aleatorio estratificado para producir parches de entrenamiento contrarrestó los desequilibrios de clase; un menor número de parches más grandes (tamaño de lote pequeño) mejora la precisión del modelo; las aumentaciones de datos y el escalado son imperativos para crear un modelo generalizado capaz de clasificar con precisión las características LULC en imágenes de diferentes fechas y sensores; y producir la clasificación de salida promediando múltiples cuadrículas de parches y tres versiones rotadas de cada parche produjo un resultado más preciso y estético. Combinando los hallazgos de los ensayos, entrenamos completamente cinco modelos con la imagen de entrenamiento de 2018 y aplicamos el modelo a la imagen de prueba de 2015. Las clasificaciones de LULC de salida lograron un kappa promedio de 0.84, una precisión del usuario de 0.81 y una precisión del productor de 0.87. La investigación futura utilizando CNN y datos de observación de la Tierra debería implementar los hallazgos de este proyecto para aumentar la precisión y transferibilidad del modelo LULC.