Alto rendimiento en el descubrimiento de anomalías en series temporales en procesadores gráficos
Autores: Zymbler, Mikhail; Kraeva, Yana
Idioma: Inglés
Editor: MDPI
Año: 2023
Acceso abierto
Artículo científico
2023
Alto rendimiento en el descubrimiento de anomalías en series temporales en procesadores gráficos
Categoría
Matemáticas
Subcategoría
Matemáticas generales
Palabras clave
Descubriendo
Subsecuencias
Anomalías
Series temporales
Discordancia
PALMAD
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 31
Citaciones: Sin citaciones
Actualmente, descubrir anomalías de subsecuencias en series temporales sigue siendo uno de los problemas de investigación más actuales. Una anomalía de subsecuencia se refiere a puntos sucesivos en el tiempo que son colectivamente anormales, aunque no necesariamente cada punto es un valor atípico. Entre los numerosos enfoques para descubrir anomalías de subsecuencias, el concepto de discordancia se considera uno de los mejores. Una discordancia en una serie temporal se define intuitivamente como una subsecuencia de una longitud dada que está maximamente alejada de su vecino más cercano que no se superpone. Recientemente introducido, el algoritmo MERLIN descubre discordancias en series temporales de todas las longitudes posibles en un rango especificado, eliminando así la necesidad de establecer incluso ese único parámetro para descubrir discordancias en una serie temporal. Sin embargo, MERLIN es serial y su paralelización podría aumentar el rendimiento en el descubrimiento de discordancias. En este artículo, presentamos un nuevo esquema de paralelización para GPUs llamado PALMAD, descubrimiento de anomalías basado en MERLIN de longitud arbitraria. A diferencia de su predecesor serial, PALMAD emplea fórmulas recurrentes que hemos derivado para evitar cálculos redundantes y estructuras de datos avanzadas para la implementación eficiente de procesamiento paralelo. La evaluación experimental en series temporales del mundo real y sintéticas muestra que nuestro algoritmo supera a sus análogos paralelos. También aplicamos PALMAD para descubrir anomalías en una serie temporal del mundo real, empleando nuestra técnica propuesta de mapa de calor de discordancias para ilustrar los resultados.
Descripción
Actualmente, descubrir anomalías de subsecuencias en series temporales sigue siendo uno de los problemas de investigación más actuales. Una anomalía de subsecuencia se refiere a puntos sucesivos en el tiempo que son colectivamente anormales, aunque no necesariamente cada punto es un valor atípico. Entre los numerosos enfoques para descubrir anomalías de subsecuencias, el concepto de discordancia se considera uno de los mejores. Una discordancia en una serie temporal se define intuitivamente como una subsecuencia de una longitud dada que está maximamente alejada de su vecino más cercano que no se superpone. Recientemente introducido, el algoritmo MERLIN descubre discordancias en series temporales de todas las longitudes posibles en un rango especificado, eliminando así la necesidad de establecer incluso ese único parámetro para descubrir discordancias en una serie temporal. Sin embargo, MERLIN es serial y su paralelización podría aumentar el rendimiento en el descubrimiento de discordancias. En este artículo, presentamos un nuevo esquema de paralelización para GPUs llamado PALMAD, descubrimiento de anomalías basado en MERLIN de longitud arbitraria. A diferencia de su predecesor serial, PALMAD emplea fórmulas recurrentes que hemos derivado para evitar cálculos redundantes y estructuras de datos avanzadas para la implementación eficiente de procesamiento paralelo. La evaluación experimental en series temporales del mundo real y sintéticas muestra que nuestro algoritmo supera a sus análogos paralelos. También aplicamos PALMAD para descubrir anomalías en una serie temporal del mundo real, empleando nuestra técnica propuesta de mapa de calor de discordancias para ilustrar los resultados.