Iplog: un método eficiente de análisis de registros basado en aprendizaje de pocas muestras
Autores: Liu, Shuxian; Yun, Libo; Nie, Shuaiqi; Zhang, Guiheng; Li, Wei
Idioma: Inglés
Editor: MDPI
Año: 2024
Acceso abierto
Artículo científico
2024
Iplog: un método eficiente de análisis de registros basado en aprendizaje de pocas muestras
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Mensajes de registro
Análisis
Datos estructurados
Detección de anomalías
Formatos de registro
IPLog
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 43
Citaciones: Sin citaciones
Los mensajes de registro de sistemas de software de nivel empresarial contienen detalles cruciales en tiempo de ejecución. Los ingenieros pueden convertir los mensajes de registro en datos estructurados a través del análisis de registros, sentando las bases para tareas posteriores como la detección de anomalías en los registros. Los esquemas de análisis de registros existentes suelen tener un rendimiento deficiente en entornos de producción por varias razones: primero, a menudo ignoran la semántica de los mensajes de registro; segundo, a menudo no están adaptados a diferentes sistemas y su rendimiento varía considerablemente; y finalmente, son difíciles de adaptar a la complejidad y variedad de formatos de registro en el entorno real. En respuesta a las limitaciones de los enfoques actuales, presentamos IPLog (Intelligent Parse Log), un método de análisis diseñado para abordar estos problemas. IPLog muestrea un conjunto limitado de muestras de registro basadas en la distribución de plantillas en los registros históricos del sistema, lo que permite al modelo aprovechar al máximo el pequeño número de muestras de registro para reconocer patrones comunes de palabras clave y parámetros a través del aprendizaje de pocas muestras, y así puede adaptarse fácilmente a diferentes sistemas. Además, IPLog puede mejorar aún más la precisión de agrupación de plantillas de registro a través de una novedosa estrategia de consulta de fusión de retroalimentación manual basada en el prefijo común más largo, mejorando así la capacidad del modelo para manejar formatos de registro complejos en entornos de producción. Realizamos experimentos en cuatro conjuntos de datos de registro públicos recién lanzados, y los resultados experimentales muestran que IPLog puede lograr una precisión de agrupación promedio (GA) de 0.987 y una precisión de análisis (PA) de 0.914 en los cuatro conjuntos de datos públicos, que son los mejores entre los esquemas de análisis principales. Estos resultados demuestran que IPLog es efectivo para tareas de análisis de registros.
Descripción
Los mensajes de registro de sistemas de software de nivel empresarial contienen detalles cruciales en tiempo de ejecución. Los ingenieros pueden convertir los mensajes de registro en datos estructurados a través del análisis de registros, sentando las bases para tareas posteriores como la detección de anomalías en los registros. Los esquemas de análisis de registros existentes suelen tener un rendimiento deficiente en entornos de producción por varias razones: primero, a menudo ignoran la semántica de los mensajes de registro; segundo, a menudo no están adaptados a diferentes sistemas y su rendimiento varía considerablemente; y finalmente, son difíciles de adaptar a la complejidad y variedad de formatos de registro en el entorno real. En respuesta a las limitaciones de los enfoques actuales, presentamos IPLog (Intelligent Parse Log), un método de análisis diseñado para abordar estos problemas. IPLog muestrea un conjunto limitado de muestras de registro basadas en la distribución de plantillas en los registros históricos del sistema, lo que permite al modelo aprovechar al máximo el pequeño número de muestras de registro para reconocer patrones comunes de palabras clave y parámetros a través del aprendizaje de pocas muestras, y así puede adaptarse fácilmente a diferentes sistemas. Además, IPLog puede mejorar aún más la precisión de agrupación de plantillas de registro a través de una novedosa estrategia de consulta de fusión de retroalimentación manual basada en el prefijo común más largo, mejorando así la capacidad del modelo para manejar formatos de registro complejos en entornos de producción. Realizamos experimentos en cuatro conjuntos de datos de registro públicos recién lanzados, y los resultados experimentales muestran que IPLog puede lograr una precisión de agrupación promedio (GA) de 0.987 y una precisión de análisis (PA) de 0.914 en los cuatro conjuntos de datos públicos, que son los mejores entre los esquemas de análisis principales. Estos resultados demuestran que IPLog es efectivo para tareas de análisis de registros.