logo móvil
Contáctanos

Mejorando la Clasificación de Cobertura del Suelo Desbalanceada con K-Means SMOTE: Detectando y Sobremuestreando Firmas Espectrales Minoritarias Distintivas

Autores: Fonseca, Joao; Douzas, Georgios; Bacao, Fernando

Idioma: Inglés

Editor: MDPI

Año: 2021

Descargar PDF

Acceso abierto

Artículo científico
2021

Mejorando la Clasificación de Cobertura del Suelo Desbalanceada con K-Means SMOTE: Detectando y Sobremuestreando Firmas Espectrales Minoritarias Distintivas


Categoría

Gestión y administración

Subcategoría

Gestión de la tecnología y la inovación

Palabras clave

Mapas de cobertura terrestre
Teledetección
Aprendizaje desbalanceado
K-means SMOTE
Métodos de sobremuestreo
Clasificación

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 1

Citaciones: Sin citaciones


Descripción
Los mapas de cobertura del suelo son una herramienta crítica para apoyar el desarrollo de políticas informadas, la planificación y las decisiones de gestión de recursos. Con beneficios significativos, la producción automática de mapas de Uso/Cobertura del Suelo ha sido un tema de interés para la comunidad de teledetección durante varios años, pero todavía está plagada de desafíos técnicos. Uno de esos desafíos es la naturaleza desequilibrada de la mayoría de los datos obtenidos por teledetección. La distribución asimétrica de clases impacta negativamente en el rendimiento de los clasificadores y añade una nueva fuente de error a la producción de estos mapas. En este artículo, abordamos el problema del aprendizaje desequilibrado, utilizando K-means y la Técnica de Sobremuestreo Sintético de Minorías (SMOTE) como un algoritmo de sobremuestreo mejorado. K-means SMOTE mejora la calidad de los nuevos datos artificiales creados al abordar tanto el desequilibrio entre clases, como lo hacen los sobremuestreadores tradicionales, pero también el desequilibrio dentro de la clase, evitando la generación de datos ruidosos mientras supera eficazmente el desequilibrio de datos. El rendimiento de K-means SMOTE se compara con tres métodos de sobremuestreo populares (Sobremuestreo Aleatorio, SMOTE y Borderline-SMOTE) utilizando siete conjuntos de datos de referencia de teledetección, tres clasificadores (Regresión Logística, K-Vecinos Más Cercanos y Clasificador de Bosques Aleatorios) y tres métricas de evaluación utilizando un enfoque de validación cruzada de cinco pliegues con tres semillas de inicialización diferentes. El análisis estadístico de los resultados muestra que el método propuesto supera consistentemente a los demás sobremuestreadores, produciendo clasificaciones de cobertura del suelo de mayor calidad. Estos resultados sugieren que los datos de LULC pueden beneficiarse significativamente del uso de sobremuestreadores más sofisticados, ya que las firmas espectrales para la misma clase pueden variar según la distribución geográfica.

Otros recursos que podrían interesarte

Temas Virtualpro