Aprovechando grandes modelos de lenguaje y BERT para el análisis de registros y detección de anomalías
Autores: Zhou, Yihan; Chen, Yan; Rao, Xuanming; Zhou, Yukang; Li, Yuxin; Hu, Chao
Idioma: Inglés
Editor: MDPI
Año: 2024
Acceso abierto
Artículo científico
2024
Aprovechando grandes modelos de lenguaje y BERT para el análisis de registros y detección de anomalías
Categoría
Matemáticas
Subcategoría
Matemáticas generales
Palabras clave
Sistemas informáticos
Registros
Registro de anomalías
Modelo BERT
Computación distribuida
Analizador de registros
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 34
Citaciones: Sin citaciones
Los sistemas informáticos y las aplicaciones generan grandes cantidades de registros para medir y registrar información, lo cual es vital para proteger los sistemas de ataques maliciosos y útil para reparar fallas, especialmente con el rápido desarrollo de la computación distribuida. Entre varios registros, el registro de anomalías es beneficioso para que el personal de operaciones y mantenimiento (O&M) pueda localizar fallas y mejorar la eficiencia. En este documento, utilizamos un gran modelo de lenguaje, ChatGPT, para la tarea de análisis de registros. Elegimos el modelo BERT, un marco de trabajo auto-supervisado para la detección de anomalías en los registros. BERT, un codificador de transformadores integrado, con un mecanismo de autoatención puede manejar mejor tareas dependientes del contexto como la detección de registros de anomalías. Mientras tanto, se basa en la tarea de modelo de lenguaje enmascarado y la tarea de predicción de la siguiente oración en el período de preentrenamiento para capturar el patrón de secuencia de registro normal. Los resultados experimentales en dos conjuntos de datos de registros muestran que el modelo BERT combinado con un LLM funcionó mejor que otros modelos clásicos como Deelog y Loganomaly.
Descripción
Los sistemas informáticos y las aplicaciones generan grandes cantidades de registros para medir y registrar información, lo cual es vital para proteger los sistemas de ataques maliciosos y útil para reparar fallas, especialmente con el rápido desarrollo de la computación distribuida. Entre varios registros, el registro de anomalías es beneficioso para que el personal de operaciones y mantenimiento (O&M) pueda localizar fallas y mejorar la eficiencia. En este documento, utilizamos un gran modelo de lenguaje, ChatGPT, para la tarea de análisis de registros. Elegimos el modelo BERT, un marco de trabajo auto-supervisado para la detección de anomalías en los registros. BERT, un codificador de transformadores integrado, con un mecanismo de autoatención puede manejar mejor tareas dependientes del contexto como la detección de registros de anomalías. Mientras tanto, se basa en la tarea de modelo de lenguaje enmascarado y la tarea de predicción de la siguiente oración en el período de preentrenamiento para capturar el patrón de secuencia de registro normal. Los resultados experimentales en dos conjuntos de datos de registros muestran que el modelo BERT combinado con un LLM funcionó mejor que otros modelos clásicos como Deelog y Loganomaly.