Compensación entre la Complejidad del Modelo de Datos en la Teledetección Ultra-Alta Resolución Adquirida por UAV: Estudio Empírico sobre la Segmentación de Paneles Fotovoltaicos
Autores: Zou, Zhigang; Zhou, Xinhui; Yang, Pukaiyuan; Liu, Jingyi; Yang, Wu
Idioma: Inglés
Editor: MDPI
Año: 2025
Acceso abierto
Artículo científico
2025
Compensación entre la Complejidad del Modelo de Datos en la Teledetección Ultra-Alta Resolución Adquirida por UAV: Estudio Empírico sobre la Segmentación de Paneles Fotovoltaicos
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Robótica
Palabras clave
Aprendizaje profundo
Teledetección
Segmentación de paneles fotovoltaicos
Conjunto de datos
Arquitectura del modelo
Intersección sobre Unión
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
Con la creciente adopción del aprendizaje profundo en la teledetección, la creciente diversidad de modelos y conjuntos de datos ha hecho que la selección de métodos y la experimentación sean más desafiantes, especialmente para usuarios no expertos. Este estudio presenta una evaluación integral de la segmentación de paneles fotovoltaicos utilizando un banco de pruebas de ultra alta resolución a gran escala de más de 25,000 parches de imágenes de vehículos aéreos no tripulados anotados manualmente, cuantificando sistemáticamente el impacto de las características del modelo y los datos. Nuestros resultados indican que aumentar la diversidad espacial de los datos de entrenamiento tiene un impacto más sustancial en la estabilidad del entrenamiento y la precisión de la segmentación que simplemente agregar bandas espectrales o aumentar el volumen del conjunto de datos. En todos los ajustes experimentales, los modelos de tamaño moderado (DeepLabV3_50, ResUNet50 y SegFormer B4) a menudo ofrecieron el mejor equilibrio entre el rendimiento de segmentación y la eficiencia computacional, logrando un promedio de Intersección sobre Unión (IoU) de 0.8966 comparable a 0.8970 de modelos más grandes. Además, la arquitectura del modelo juega un papel más crítico que el tamaño del modelo; ya que los modelos ResUNet lograron consistentemente un IoU medio más alto que los modelos DeepLabV3 y SegFormer, con mejoras promedio de 0.047 y 0.143, respectivamente. Nuestros hallazgos ofrecen orientación cuantitativa para equilibrar las elecciones arquitectónicas, la complejidad del modelo y el diseño del conjunto de datos, promoviendo en última instancia un despliegue más robusto y eficiente de modelos de aprendizaje profundo en aplicaciones de teledetección de alta resolución.
Descripción
Con la creciente adopción del aprendizaje profundo en la teledetección, la creciente diversidad de modelos y conjuntos de datos ha hecho que la selección de métodos y la experimentación sean más desafiantes, especialmente para usuarios no expertos. Este estudio presenta una evaluación integral de la segmentación de paneles fotovoltaicos utilizando un banco de pruebas de ultra alta resolución a gran escala de más de 25,000 parches de imágenes de vehículos aéreos no tripulados anotados manualmente, cuantificando sistemáticamente el impacto de las características del modelo y los datos. Nuestros resultados indican que aumentar la diversidad espacial de los datos de entrenamiento tiene un impacto más sustancial en la estabilidad del entrenamiento y la precisión de la segmentación que simplemente agregar bandas espectrales o aumentar el volumen del conjunto de datos. En todos los ajustes experimentales, los modelos de tamaño moderado (DeepLabV3_50, ResUNet50 y SegFormer B4) a menudo ofrecieron el mejor equilibrio entre el rendimiento de segmentación y la eficiencia computacional, logrando un promedio de Intersección sobre Unión (IoU) de 0.8966 comparable a 0.8970 de modelos más grandes. Además, la arquitectura del modelo juega un papel más crítico que el tamaño del modelo; ya que los modelos ResUNet lograron consistentemente un IoU medio más alto que los modelos DeepLabV3 y SegFormer, con mejoras promedio de 0.047 y 0.143, respectivamente. Nuestros hallazgos ofrecen orientación cuantitativa para equilibrar las elecciones arquitectónicas, la complejidad del modelo y el diseño del conjunto de datos, promoviendo en última instancia un despliegue más robusto y eficiente de modelos de aprendizaje profundo en aplicaciones de teledetección de alta resolución.