logo móvil
Contáctanos

Sobre la mejora del algoritmo de Isolation Forest para la detección de valores atípicos con datos en continuo

Autores: Heigl, Michael; Anand, Kumar Ashutosh; Urmann, Andreas; Fiala, Dalibor; Schramm, Martin; Hable, Robert

Idioma: Inglés

Editor: MDPI

Año: 2021

Descargar PDF

Acceso abierto

Artículo científico
2021

Sobre la mejora del algoritmo de Isolation Forest para la detección de valores atípicos con datos en continuo


Categoría

Ingeniería y Tecnología

Subcategoría

Ingeniería Eléctrica y Electrónica

Palabras clave

Anomalías
Redes informáticas
Detección de valores atípicos en línea
PCB-iForest
Datos en continuo
Bosque de aislamiento

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 48

Citaciones: Sin citaciones


Descripción
En los últimos años, detectar anomalías en redes informáticas del mundo real se ha convertido en una tarea cada vez más desafiante debido al constante aumento de datos de transmisión de alto volumen, alta velocidad y alta dimensionalidad, para los cuales no se dispone de información verídica. Los esquemas de detección eficientes aplicados en dispositivos integrados en red deben ser rápidos y limitados en memoria, y deben ser capaces de manejar cambios conceptuales cuando ocurran. Se han diseñado diferentes enfoques para la detección de valores atípicos en línea no supervisados para hacer frente a estas circunstancias con el fin de detectar de manera confiable actividades maliciosas. En este documento, presentamos un nuevo marco llamado PCB-iForest, que generalizado, es capaz de incorporar cualquier método de detección de valores atípicos en línea basado en conjuntos para funcionar con datos de transmisión. Los requisitos cuidadosamente diseñados se comparan con los métodos en línea más populares del estado del arte con un enfoque profundo en variantes basadas en el ampliamente aceptado algoritmo de bosque de aislamiento, resaltando así la falta de una solución flexible y eficiente que sea satisfecha por PCB-iForest. Por lo tanto, integramos dos variantes en PCB-iForest: una mejora del bosque de aislamiento llamada bosque de aislamiento extendido y una variante clásica del bosque de aislamiento equipada con la funcionalidad para puntuar características según sus contribuciones a la anomalía de una muestra. Se realizaron experimentos exhaustivos en 23 conjuntos de datos del mundo real multidisciplinarios y relacionados con la seguridad para evaluar exhaustivamente el rendimiento de nuestra implementación en comparación con los métodos listos para usar. La discusión de los resultados, incluido el puntaje y la métrica de tiempo de ejecución promedio, muestra que PCB-iForest superó claramente a los competidores del estado del arte en el 61% de los casos e incluso logró resultados más prometedores en términos del equilibrio entre costos de clasificación y computacionales.

Otros recursos que podrían interesarte

Temas Virtualpro