Un algoritmo de detección de valores atípicos sin parámetros basado en un método de optimización de conjuntos de datos
Autores: Wang, Liying; Shi, Lei; Xu, Liancheng; Liu, Peiyu; Zhang, Lindong; Dong, Yanru
Idioma: Inglés
Editor: MDPI
Año: 2019
Acceso abierto
Artículo científico
2019
Un algoritmo de detección de valores atípicos sin parámetros basado en un método de optimización de conjuntos de datos
Categoría
Gestión y administración
Subcategoría
Gestión de la tecnología y la inovación
Palabras clave
Detección de valores atípicos
Método de optimización de conjuntos de datos
Selección de parámetros
Costo computacional
Sin parámetros
Vecinos residuales
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
Recientemente, la detección de valores atípicos tiene aplicaciones generalizadas en diferentes áreas. La tarea consiste en identificar valores atípicos en el conjunto de datos y extraer información potencial. Los algoritmos de detección de valores atípicos existentes principalmente no resuelven los problemas de selección de parámetros y alto costo computacional, lo que deja suficiente margen para mejoras adicionales. Para resolver los problemas mencionados, nuestro artículo propone un algoritmo de detección de valores atípicos sin parámetros basado en un método de optimización de conjuntos de datos. En primer lugar, proponemos un método de optimización de conjuntos de datos (DOM), que inicializa el conjunto de datos original en el que la densidad es mayor que un umbral específico. En este método, proponemos los conceptos de función de partición (P) y función de umbral (T). En segundo lugar, establecemos un método de detección de valores atípicos sin parámetros. De manera similar, proponemos el concepto del número de vecinos residuales, ya que el número de vecinos residuales y el tamaño de los clústeres de datos se utilizan como base para la detección de valores atípicos para obtener un conjunto de valores atípicos más preciso. Finalmente, se llevan a cabo extensos experimentos en una variedad de conjuntos de datos y los resultados experimentales muestran que nuestro método funciona bien en términos de eficiencia en la detección de valores atípicos y complejidad temporal.
Descripción
Recientemente, la detección de valores atípicos tiene aplicaciones generalizadas en diferentes áreas. La tarea consiste en identificar valores atípicos en el conjunto de datos y extraer información potencial. Los algoritmos de detección de valores atípicos existentes principalmente no resuelven los problemas de selección de parámetros y alto costo computacional, lo que deja suficiente margen para mejoras adicionales. Para resolver los problemas mencionados, nuestro artículo propone un algoritmo de detección de valores atípicos sin parámetros basado en un método de optimización de conjuntos de datos. En primer lugar, proponemos un método de optimización de conjuntos de datos (DOM), que inicializa el conjunto de datos original en el que la densidad es mayor que un umbral específico. En este método, proponemos los conceptos de función de partición (P) y función de umbral (T). En segundo lugar, establecemos un método de detección de valores atípicos sin parámetros. De manera similar, proponemos el concepto del número de vecinos residuales, ya que el número de vecinos residuales y el tamaño de los clústeres de datos se utilizan como base para la detección de valores atípicos para obtener un conjunto de valores atípicos más preciso. Finalmente, se llevan a cabo extensos experimentos en una variedad de conjuntos de datos y los resultados experimentales muestran que nuestro método funciona bien en términos de eficiencia en la detección de valores atípicos y complejidad temporal.