Método de filtrado de actividad caótica basado en cercanía conductual de entropía
Autores: Li, Juan; Fang, Xianwen; Zuo, Yinkai
Idioma: Inglés
Editor: MDPI
Año: 2024
Acceso abierto
Artículo científico
2024
Método de filtrado de actividad caótica basado en cercanía conductual de entropía
Categoría
Matemáticas
Subcategoría
Matemáticas generales
Palabras clave
Grandes datos
Modelos de procesos
Datos de eventos
Actividades caóticas
Filtrado basado en entropía
Cercanía conductual
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 40
Citaciones: Sin citaciones
En la era del big data, uno de los principales desafíos es descubrir modelos de procesos y obtener información sobre los procesos empresariales mediante el análisis de datos de eventos registrados en sistemas de información. Sin embargo, la actividad caótica o comportamientos infrecuentes a menudo aparecen en los registros de eventos reales. Los modelos de procesos que contienen tales comportamientos son complejos, difíciles de entender y ocultan los comportamientos clave relevantes de los procesos subyacentes. Los estudios establecidos generalmente han logrado filtrar la actividad caótica filtrando actividades infrecuentes o actividades con valores de entropía altos e ignorando las relaciones de comportamiento que existen entre actividades, lo que resulta en que los comportamientos de baja frecuencia efectivos sean filtrados. Para resolver este problema, este documento propone un método de filtrado de actividades caóticas basado en la cercanía de comportamiento de entropía. En primer lugar, basándose en la teoría del perfil de comportamiento de actividades de registro de alta frecuencia, el modelo de proceso se construye combinando la red de características y la red de módulos. Luego, la identificación de conjuntos de actividades caóticas sospechosas se logra a través del valor de entropía de Laplace. A continuación, se construye un modelo de consulta basado en registros que contienen actividad caótica sospechosa. Finalmente, basándose en la relación de sucesión, se analiza la cercanía de comportamiento del modelo de consulta y el modelo de proceso empresarial para lograr el objetivo de filtrar con precisión las actividades caóticas para retener los comportamientos beneficiosos para el proceso. Para evaluar el rendimiento del método, validamos la efectividad del algoritmo propuesto en registros sintéticos y registros reales, respectivamente. Los resultados experimentales mostraron que el método propuesto tiene un mejor rendimiento en precisión después de filtrar actividades caóticas.
Descripción
En la era del big data, uno de los principales desafíos es descubrir modelos de procesos y obtener información sobre los procesos empresariales mediante el análisis de datos de eventos registrados en sistemas de información. Sin embargo, la actividad caótica o comportamientos infrecuentes a menudo aparecen en los registros de eventos reales. Los modelos de procesos que contienen tales comportamientos son complejos, difíciles de entender y ocultan los comportamientos clave relevantes de los procesos subyacentes. Los estudios establecidos generalmente han logrado filtrar la actividad caótica filtrando actividades infrecuentes o actividades con valores de entropía altos e ignorando las relaciones de comportamiento que existen entre actividades, lo que resulta en que los comportamientos de baja frecuencia efectivos sean filtrados. Para resolver este problema, este documento propone un método de filtrado de actividades caóticas basado en la cercanía de comportamiento de entropía. En primer lugar, basándose en la teoría del perfil de comportamiento de actividades de registro de alta frecuencia, el modelo de proceso se construye combinando la red de características y la red de módulos. Luego, la identificación de conjuntos de actividades caóticas sospechosas se logra a través del valor de entropía de Laplace. A continuación, se construye un modelo de consulta basado en registros que contienen actividad caótica sospechosa. Finalmente, basándose en la relación de sucesión, se analiza la cercanía de comportamiento del modelo de consulta y el modelo de proceso empresarial para lograr el objetivo de filtrar con precisión las actividades caóticas para retener los comportamientos beneficiosos para el proceso. Para evaluar el rendimiento del método, validamos la efectividad del algoritmo propuesto en registros sintéticos y registros reales, respectivamente. Los resultados experimentales mostraron que el método propuesto tiene un mejor rendimiento en precisión después de filtrar actividades caóticas.