Un método de aproximación simbólica basado en la distancia de frontera para datos de series temporales
Autores: He, Zhenwen; Long, Shirong; Ma, Xiaogang; Zhao, Hong
Idioma: Inglés
Editor: MDPI
Año: 2020
Acceso abierto
Artículo científico
2020
Un método de aproximación simbólica basado en la distancia de frontera para datos de series temporales
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería de Software
Palabras clave
Datos de series temporales
Aproximación simbólica agregada
Representación SAX
Distancia de frontera
Segmentos
Resultados experimentales
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 31
Citaciones: Sin citaciones
Se genera una gran cantidad de datos de series temporales cada día en una amplia gama de dominios de aplicación de sensores. La aproximación de agregación simbólica (SAX) es un método conocido de representación de series temporales, que tiene un límite inferior a la distancia euclidiana y puede discretizar series temporales continuas. SAX ha sido ampliamente utilizado para aplicaciones en varios dominios, como la gestión de datos móviles, la inversión financiera y el descubrimiento de formas. Sin embargo, la representación SAX tiene una limitación: los símbolos se asignan a partir de los valores promedio de los segmentos, pero SAX no considera la distancia de límite en los segmentos. Diferentes segmentos con valores promedio similares pueden asignarse a los mismos símbolos, y la distancia SAX entre ellos es 0. En este documento, proponemos una representación novedosa llamada SAX-BD (distancia de límite) integrando la distancia SAX con una distancia de límite ponderada. Los resultados experimentales muestran que SAX-BD supera significativamente a la representación SAX, la representación ESAX y la representación SAX-TD.
Descripción
Se genera una gran cantidad de datos de series temporales cada día en una amplia gama de dominios de aplicación de sensores. La aproximación de agregación simbólica (SAX) es un método conocido de representación de series temporales, que tiene un límite inferior a la distancia euclidiana y puede discretizar series temporales continuas. SAX ha sido ampliamente utilizado para aplicaciones en varios dominios, como la gestión de datos móviles, la inversión financiera y el descubrimiento de formas. Sin embargo, la representación SAX tiene una limitación: los símbolos se asignan a partir de los valores promedio de los segmentos, pero SAX no considera la distancia de límite en los segmentos. Diferentes segmentos con valores promedio similares pueden asignarse a los mismos símbolos, y la distancia SAX entre ellos es 0. En este documento, proponemos una representación novedosa llamada SAX-BD (distancia de límite) integrando la distancia SAX con una distancia de límite ponderada. Los resultados experimentales muestran que SAX-BD supera significativamente a la representación SAX, la representación ESAX y la representación SAX-TD.