logo móvil
Contáctanos

Un análisis de los algoritmos de factor local de atípicos para la detección de valores atípicos en flujos de datos masivos

Autores: Alghushairy, Omar; Alsini, Raed; Soule, Terence; Ma, Xiaogang

Idioma: Inglés

Editor: MDPI

Año: 2020

Descargar PDF

Acceso abierto

Artículo científico
2020

Un análisis de los algoritmos de factor local de atípicos para la detección de valores atípicos en flujos de datos masivos


Categoría

Ingeniería y Tecnología

Subcategoría

Ingeniería de Sistemas

Palabras clave

Detección de valores atípicos
Conjunto de datos
Minería de datos
Aprendizaje automático
Detección de fraudes
Flujos de datos

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 51

Citaciones: Sin citaciones


Descripción
La detección de valores atípicos es un procedimiento estadístico que tiene como objetivo encontrar eventos o elementos sospechosos que son diferentes de la forma normal de un conjunto de datos. Ha despertado un considerable interés en el campo de la minería de datos y el aprendizaje automático. La detección de valores atípicos es importante en muchas aplicaciones, incluida la detección de fraudes en transacciones con tarjeta de crédito y la detección de intrusiones en redes. Hay dos tipos generales de detección de valores atípicos: global y local. Los valores atípicos globales se encuentran fuera del rango normal para un conjunto de datos completo, mientras que los valores atípicos locales pueden estar dentro del rango normal para todo el conjunto de datos, pero fuera del rango normal para los puntos de datos circundantes. Este documento aborda la detección local de valores atípicos. La técnica más conocida para la detección local de valores atípicos es el Factor de Valor Atípico Local (LOF), una técnica basada en la densidad. Hay muchos algoritmos LOF para un entorno de datos estático; sin embargo, estos algoritmos no se pueden aplicar directamente a flujos de datos, que son un tipo importante de big data. En general, los algoritmos de detección local de valores atípicos para flujos de datos todavía son deficientes y se necesitan mejores algoritmos que puedan analizar de manera efectiva la alta velocidad de los flujos de datos para detectar valores atípicos locales. Este documento presenta una revisión de la literatura de algoritmos de detección local de valores atípicos en entornos estáticos y de flujo, con énfasis en los algoritmos LOF. Recopila y categoriza los algoritmos de detección local de valores atípicos existentes y analiza sus características. Además, el documento discute las ventajas y limitaciones de esos algoritmos y propone varias direcciones prometedoras para desarrollar métodos mejorados de detección local de valores atípicos para flujos de datos.

Otros recursos que podrían interesarte

Temas Virtualpro