Xgb+fm para pronóstico de convección severa y selección de factores
Autores: Lu, Zhiying; Ding, Xudong; Li, Xin; Wu, Haopeng; Sun, Xiaolei
Idioma: Inglés
Editor: MDPI
Año: 2021
Acceso abierto
Artículo científico
2021
Xgb+fm para pronóstico de convección severa y selección de factores
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Meteorología
Datos de radiosonda
Datos de observación
XGBoost
FM
Att-Bi-LSTM
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 42
Citaciones: Sin citaciones
En el campo de la meteorología, los datos de radiosonda y los datos de observación son críticos para analizar las características meteorológicas regionales. Debido a la alta tasa de falsas alarmas, la predicción de convección severa sigue siendo un desafío. Además, los métodos existentes son difíciles de usar para capturar la interacción de factores meteorológicos al mismo tiempo. En esta investigación, se propone una cascada de aumento extremo de gradiente (XGBoost) para la transformación de características y una máquina de factorización (FM) para la interacción de características de segundo orden para capturar la interacción no lineal-XGB+FM. Se propone una red de memoria a corto y largo plazo bidireccional basada en atención (Att-Bi-LSTM) para imputar los datos faltantes de las estaciones de observación meteorológica. El problema del desequilibrio de clases se resuelve mediante la técnica de sobremuestreo de minorías sintéticas de máquinas de vectores de soporte (SVM-SMOTE), en la que se proponen dos estrategias de sobremuestreo basadas en el mecanismo de discriminación de vectores de soporte. Se ha demostrado que el método es efectivo y el puntaje de amenaza (TS) es 7.27~14.28% más alto que otros métodos. Además, proponemos el método de selección de factores meteorológicos basado en XGB+FM y mejoramos la precisión de la predicción, que es una de nuestras contribuciones, así como el sistema de pronóstico.
Descripción
En el campo de la meteorología, los datos de radiosonda y los datos de observación son críticos para analizar las características meteorológicas regionales. Debido a la alta tasa de falsas alarmas, la predicción de convección severa sigue siendo un desafío. Además, los métodos existentes son difíciles de usar para capturar la interacción de factores meteorológicos al mismo tiempo. En esta investigación, se propone una cascada de aumento extremo de gradiente (XGBoost) para la transformación de características y una máquina de factorización (FM) para la interacción de características de segundo orden para capturar la interacción no lineal-XGB+FM. Se propone una red de memoria a corto y largo plazo bidireccional basada en atención (Att-Bi-LSTM) para imputar los datos faltantes de las estaciones de observación meteorológica. El problema del desequilibrio de clases se resuelve mediante la técnica de sobremuestreo de minorías sintéticas de máquinas de vectores de soporte (SVM-SMOTE), en la que se proponen dos estrategias de sobremuestreo basadas en el mecanismo de discriminación de vectores de soporte. Se ha demostrado que el método es efectivo y el puntaje de amenaza (TS) es 7.27~14.28% más alto que otros métodos. Además, proponemos el método de selección de factores meteorológicos basado en XGB+FM y mejoramos la precisión de la predicción, que es una de nuestras contribuciones, así como el sistema de pronóstico.