Mgad: detección de anomalías basada en información mutua e incrustación de gráficos en series temporales multivariadas
Autores: Huang, Yuehua; Liu, Wenfen; Li, Song; Guo, Ying; Chen, Wen
Idioma: Inglés
Editor: MDPI
Año: 2024
Acceso abierto
Artículo científico
2024
Mgad: detección de anomalías basada en información mutua e incrustación de gráficos en series temporales multivariadas
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Popularidad
Datos del sensor
Detección de anomalías
Datos de series temporales multivariados
Información mutua
Incrustación de gráficos
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 31
Citaciones: Sin citaciones
Junto con la popularidad de Internet móvil y aplicaciones inteligentes, cada vez aparecen más datos de sensores de alta dimensionalidad, y estos datos de sensores de alta dimensionalidad contienen información oculta sobre la degradación del rendimiento del sistema, fallos del sistema, etc., y cómo extraer esa información es un problema muy difícil. Este desafío puede resolverse mediante técnicas de detección de anomalías, que es un campo importante de investigación en minería de datos, especialmente en los dominios de seguridad de redes, detección de fraudes con tarjetas de crédito, identificación de fallas industriales, etc. Sin embargo, existen muchas dificultades en la detección de anomalías en datos de series temporales multivariadas, incluida la baja precisión, la generación rápida de datos, la falta de datos etiquetados y cómo capturar información entre sensores. Para abordar estos problemas, presentamos un algoritmo de detección de anomalías en series temporales multivariadas basado en información mutua y incrustación de gráficos, llamado MGAD (detección de anomalías basada en información mutua y incrustación de gráficos). El algoritmo MGAD consta de cuatro pasos: (1) Incrustación de datos de sensores, donde los datos de sensores heterogéneos se convierten en diferentes vectores en el mismo espacio vectorial; (2) Construcción de un grafo de relaciones entre sensores utilizando su información mutua entre sí; (3) Aprendizaje del grafo de relaciones entre sensores utilizando un mecanismo de atención de gráficos, para predecir los datos del sensor en el siguiente momento; (4) Comparar los valores predichos con los datos reales del sensor para detectar posibles valores atípicos. Nuestras contribuciones son las siguientes: (1) proponemos una detección de valores atípicos no supervisada llamada MGAD con una alta interpretabilidad y precisión; (2) experimentos masivos en conjuntos de datos de referencia han demostrado el rendimiento superior del algoritmo MGAD, en comparación con las líneas base de vanguardia en términos de ROC, F1 y AP.
Descripción
Junto con la popularidad de Internet móvil y aplicaciones inteligentes, cada vez aparecen más datos de sensores de alta dimensionalidad, y estos datos de sensores de alta dimensionalidad contienen información oculta sobre la degradación del rendimiento del sistema, fallos del sistema, etc., y cómo extraer esa información es un problema muy difícil. Este desafío puede resolverse mediante técnicas de detección de anomalías, que es un campo importante de investigación en minería de datos, especialmente en los dominios de seguridad de redes, detección de fraudes con tarjetas de crédito, identificación de fallas industriales, etc. Sin embargo, existen muchas dificultades en la detección de anomalías en datos de series temporales multivariadas, incluida la baja precisión, la generación rápida de datos, la falta de datos etiquetados y cómo capturar información entre sensores. Para abordar estos problemas, presentamos un algoritmo de detección de anomalías en series temporales multivariadas basado en información mutua y incrustación de gráficos, llamado MGAD (detección de anomalías basada en información mutua y incrustación de gráficos). El algoritmo MGAD consta de cuatro pasos: (1) Incrustación de datos de sensores, donde los datos de sensores heterogéneos se convierten en diferentes vectores en el mismo espacio vectorial; (2) Construcción de un grafo de relaciones entre sensores utilizando su información mutua entre sí; (3) Aprendizaje del grafo de relaciones entre sensores utilizando un mecanismo de atención de gráficos, para predecir los datos del sensor en el siguiente momento; (4) Comparar los valores predichos con los datos reales del sensor para detectar posibles valores atípicos. Nuestras contribuciones son las siguientes: (1) proponemos una detección de valores atípicos no supervisada llamada MGAD con una alta interpretabilidad y precisión; (2) experimentos masivos en conjuntos de datos de referencia han demostrado el rendimiento superior del algoritmo MGAD, en comparación con las líneas base de vanguardia en términos de ROC, F1 y AP.