Viabilidad del Análisis de Componentes Principales para un Modelo de Aprendizaje Automático de Predicción de Terremotos Multiclase Utilizando Datos del Campo Geomagnético
Autores: Qaedi, Kasyful; Abdullah, Mardina; Yusof, Khairul Adib; Hayakawa, Masashi
Idioma: Inglés
Editor: MDPI
Año: 2024
Acceso abierto
Artículo científico
2024
Viabilidad del Análisis de Componentes Principales para un Modelo de Aprendizaje Automático de Predicción de Terremotos Multiclase Utilizando Datos del Campo Geomagnético
Categoría
Ciencias Naturales y Subdisciplinas
Subcategoría
Ciencias de la Tierra y Geología
Palabras clave
Datos del campo geomagnético
Señales precoces de terremotos
Aprendizaje automático
Análisis de componentes principales
Modelos predictivos de terremotos
Modelo de conjunto
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 18
Citaciones: Sin citaciones
Se ha encontrado que los datos del campo geomagnético contienen señales precursoras de terremotos (EQ); sin embargo, analizar estos datos de alta resolución y desbalanceados presenta desafíos al implementar el aprendizaje automático (ML). Este estudio exploró la viabilidad de los análisis de componentes principales (PCA) para reducir la dimensionalidad de los datos globales del campo geomagnético y mejorar la precisión de los modelos predictivos de EQ. Se desarrollaron modelos de ML de múltiples clases capaces de predecir la intensidad de los EQ en términos de la Escala de Intensidad de Mercalli. Se entrenaron modelos de conjunto y de Máquina de Vectores de Soporte (SVM), conocidos por su robustez y capacidades para manejar relaciones complejas, mientras que se empleó una Técnica de Sobremuestreo de Minorías Sintéticas (SMOTE) para abordar los datos desbalanceados de EQ. Ambos modelos se entrenaron con características extraídas mediante PCA del conjunto de datos balanceado, lo que resultó en un rendimiento razonable del modelo. El modelo de conjunto superó al modelo SVM en varios aspectos, incluida la precisión (77.50% frente a 75.88%), especificidad (96.79% frente a 96.55%), F1-score (77.05% frente a 76.16%) y Coeficiente de Correlación de Matthew (73.88% frente a 73.11%). Estos hallazgos sugieren el potencial de un modelo de ML basado en PCA para una predicción de EQ más confiable.
Descripción
Se ha encontrado que los datos del campo geomagnético contienen señales precursoras de terremotos (EQ); sin embargo, analizar estos datos de alta resolución y desbalanceados presenta desafíos al implementar el aprendizaje automático (ML). Este estudio exploró la viabilidad de los análisis de componentes principales (PCA) para reducir la dimensionalidad de los datos globales del campo geomagnético y mejorar la precisión de los modelos predictivos de EQ. Se desarrollaron modelos de ML de múltiples clases capaces de predecir la intensidad de los EQ en términos de la Escala de Intensidad de Mercalli. Se entrenaron modelos de conjunto y de Máquina de Vectores de Soporte (SVM), conocidos por su robustez y capacidades para manejar relaciones complejas, mientras que se empleó una Técnica de Sobremuestreo de Minorías Sintéticas (SMOTE) para abordar los datos desbalanceados de EQ. Ambos modelos se entrenaron con características extraídas mediante PCA del conjunto de datos balanceado, lo que resultó en un rendimiento razonable del modelo. El modelo de conjunto superó al modelo SVM en varios aspectos, incluida la precisión (77.50% frente a 75.88%), especificidad (96.79% frente a 96.55%), F1-score (77.05% frente a 76.16%) y Coeficiente de Correlación de Matthew (73.88% frente a 73.11%). Estos hallazgos sugieren el potencial de un modelo de ML basado en PCA para una predicción de EQ más confiable.