Aprendizaje auto-supervisado para la detección de anomalías en línea en flujos de datos de alta dimensión
Autores: Mozaffari, Mahsa; Doshi, Keval; Yilmaz, Yasin
Idioma: Inglés
Editor: MDPI
Año: 2023
Acceso abierto
Artículo científico
2023
Aprendizaje auto-supervisado para la detección de anomalías en línea en flujos de datos de alta dimensión
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Problema
Detección
Aprendizaje
Anomalías
Flujos de datos de alta dimensionalidad
Tiempo real
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 43
Citaciones: Sin citaciones
En este documento, abordamos el problema de detectar y aprender anomalías en flujos de datos de alta dimensión en tiempo real. Siguiendo un enfoque basado en datos, proponemos un método de detección de anomalías en línea y multivariado que es adecuado para la detección oportuna y precisa de anomalías. Proponemos nuestro método tanto para configuraciones semisupervisadas como supervisadas. Al combinar los algoritmos semisupervisados y supervisados, presentamos un algoritmo de aprendizaje en línea auto supervisado en el que el algoritmo semisupervisado entrena al algoritmo supervisado para mejorar su rendimiento de detección con el tiempo. Los métodos se analizan exhaustivamente en términos de complejidad computacional, optimalidad asintótica y tasa de falsas alarmas. El rendimiento de los algoritmos propuestos también se evalúa utilizando conjuntos de datos de ciberseguridad del mundo real, que muestran una mejora significativa sobre los resultados de vanguardia.
Descripción
En este documento, abordamos el problema de detectar y aprender anomalías en flujos de datos de alta dimensión en tiempo real. Siguiendo un enfoque basado en datos, proponemos un método de detección de anomalías en línea y multivariado que es adecuado para la detección oportuna y precisa de anomalías. Proponemos nuestro método tanto para configuraciones semisupervisadas como supervisadas. Al combinar los algoritmos semisupervisados y supervisados, presentamos un algoritmo de aprendizaje en línea auto supervisado en el que el algoritmo semisupervisado entrena al algoritmo supervisado para mejorar su rendimiento de detección con el tiempo. Los métodos se analizan exhaustivamente en términos de complejidad computacional, optimalidad asintótica y tasa de falsas alarmas. El rendimiento de los algoritmos propuestos también se evalúa utilizando conjuntos de datos de ciberseguridad del mundo real, que muestran una mejora significativa sobre los resultados de vanguardia.