Recuperación de la Altura de la Base de la Nube de Ceniza Volcánica Utilizando Algoritmos de Aprendizaje Automático
Autores: Zhao, Fenghua; Xia, Jiawei; Zhu, Lin; Sun, Hongfu; Zhao, Dexin
Idioma: Inglés
Editor: MDPI
Año: 2023
Acceso abierto
Artículo científico
2023
Recuperación de la Altura de la Base de la Nube de Ceniza Volcánica Utilizando Algoritmos de Aprendizaje Automático
Categoría
Ciencias Naturales y Subdisciplinas
Subcategoría
Astronomía
Palabras clave
Ceniza volcánica
Altura de la base de la nube
Aprendizaje automático
Datos de teledetección
Volcán Eyjafjallajökull
PCA
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 8
Citaciones: Sin citaciones
Existen diferencias distintas entre las características de radiación de las cenizas volcánicas y las nubes meteorológicas, y los métodos convencionales para la determinación de la altura de la base de las nubes (CBH) de estas últimas son difíciles de aplicar a las cenizas volcánicas sin una parametrización y corrección del modelo sustanciales. Además, los métodos de inversión de CBH existentes tienen limitaciones, incluyendo la implicación de muchas fórmulas empíricas y una dependencia de la precisión de los productos de nubes aguas arriba. Se desarrolló un método de aprendizaje automático (ML) para la determinación de la altura de la base de las nubes de ceniza volcánica (VBH) con el fin de reducir las incertidumbres en los métodos físicos de determinación de CBH. Esta nueva metodología aprovecha los datos de teledetección activa en órbita polar del Lidar de Nubes y Aerosoles con Polarización Ortogonal (CALIOP), de la información del perfil vertical y de las mediciones de teledetección pasiva geoestacionaria del Imager Visible y de Infrarrojo Mejorado en Rotación (SEVIRI) y del Imager de Radiación Geoestacionario Avanzado (AGRI) a bordo de los satélites Meteosat Segunda Generación (MSG) y FengYun-4B (FY-4B), respectivamente. La metodología implica un algoritmo basado en estadísticas con uso híbrido de análisis de componentes principales (PCA) y uno de cuatro algoritmos de ML, incluyendo el vecino más cercano (KNN), el aumento extremo de gradiente (XGBoost), el bosque aleatorio (RF) y los métodos de árbol de decisión de aumento de gradiente (GBDT). Las erupciones del volcán Eyjafjallajökull (Islandia) durante abril-mayo de 2010, el complejo volcánico Puyehue-Cordón Caulle (Andes chilenos) en junio de 2011, y el volcán Hunga Tonga-Hunga Ha"apai (Tonga) en enero de 2022 fueron seleccionadas como casos típicos para la construcción de los conjuntos de muestras de entrenamiento y validación. Demostramos que una combinación de PCA y GBDT tiene un rendimiento más preciso que otras combinaciones, con un error absoluto medio (MAE) de 1.152 km, un error cuadrático medio (RMSE) de 1.529 km y un coeficiente de correlación de Pearson (r) de 0.724. El uso de PCA como un proceso adicional antes del entrenamiento reduce la relevancia de las características entre los predictores de entrada y mejora la precisión del algoritmo. Aunque el algoritmo de ML funciona bien bajo condiciones relativamente simples de nubes de ceniza volcánica de una sola capa, tiende a sobreestimar la VBH en condiciones de múltiples capas, lo cual es un problema no resuelto en la determinación de CBH meteorológica.
Descripción
Existen diferencias distintas entre las características de radiación de las cenizas volcánicas y las nubes meteorológicas, y los métodos convencionales para la determinación de la altura de la base de las nubes (CBH) de estas últimas son difíciles de aplicar a las cenizas volcánicas sin una parametrización y corrección del modelo sustanciales. Además, los métodos de inversión de CBH existentes tienen limitaciones, incluyendo la implicación de muchas fórmulas empíricas y una dependencia de la precisión de los productos de nubes aguas arriba. Se desarrolló un método de aprendizaje automático (ML) para la determinación de la altura de la base de las nubes de ceniza volcánica (VBH) con el fin de reducir las incertidumbres en los métodos físicos de determinación de CBH. Esta nueva metodología aprovecha los datos de teledetección activa en órbita polar del Lidar de Nubes y Aerosoles con Polarización Ortogonal (CALIOP), de la información del perfil vertical y de las mediciones de teledetección pasiva geoestacionaria del Imager Visible y de Infrarrojo Mejorado en Rotación (SEVIRI) y del Imager de Radiación Geoestacionario Avanzado (AGRI) a bordo de los satélites Meteosat Segunda Generación (MSG) y FengYun-4B (FY-4B), respectivamente. La metodología implica un algoritmo basado en estadísticas con uso híbrido de análisis de componentes principales (PCA) y uno de cuatro algoritmos de ML, incluyendo el vecino más cercano (KNN), el aumento extremo de gradiente (XGBoost), el bosque aleatorio (RF) y los métodos de árbol de decisión de aumento de gradiente (GBDT). Las erupciones del volcán Eyjafjallajökull (Islandia) durante abril-mayo de 2010, el complejo volcánico Puyehue-Cordón Caulle (Andes chilenos) en junio de 2011, y el volcán Hunga Tonga-Hunga Ha"apai (Tonga) en enero de 2022 fueron seleccionadas como casos típicos para la construcción de los conjuntos de muestras de entrenamiento y validación. Demostramos que una combinación de PCA y GBDT tiene un rendimiento más preciso que otras combinaciones, con un error absoluto medio (MAE) de 1.152 km, un error cuadrático medio (RMSE) de 1.529 km y un coeficiente de correlación de Pearson (r) de 0.724. El uso de PCA como un proceso adicional antes del entrenamiento reduce la relevancia de las características entre los predictores de entrada y mejora la precisión del algoritmo. Aunque el algoritmo de ML funciona bien bajo condiciones relativamente simples de nubes de ceniza volcánica de una sola capa, tiende a sobreestimar la VBH en condiciones de múltiples capas, lo cual es un problema no resuelto en la determinación de CBH meteorológica.