Medición de similitud y clasificación de datos temporales basada en representación de doble media
Autores: He, Zhenwen; Zhang, Chi; Cheng, Yunhui
Idioma: Inglés
Editor: MDPI
Año: 2023
Acceso abierto
Artículo científico
2023
Medición de similitud y clasificación de datos temporales basada en representación de doble media
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería de Software
Palabras clave
Datos de series temporales
Métodos de aproximación
Métodos de compresión
Medición de similitud
Representación de doble media
SAX-DM
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 27
Citaciones: Sin citaciones
Los datos de series temporales suelen exhibir alta dimensionalidad y complejidad, lo que hace necesario el uso de métodos de aproximación específicos para realizar cálculos en los datos. Los métodos de compresión actualmente empleados sufren de diferentes grados de pérdida de características, lo que conlleva a posibles distorsiones en los resultados de la medición de similitud. Considerando los desafíos y preocupaciones mencionados, este artículo propone un método de representación de doble media, SAX-DM (Aproximación de Agregado Simbólico Basada en Doble Media), para datos de series temporales, junto con un enfoque de medición de similitud basado en SAX-DM. Abordando el equilibrio entre la relación de compresión y la precisión en la representación mejorada de SAX, SAX-DM utiliza la media del segmento y la distancia de tendencia del segmento para representar segmentos correspondientes de datos de series temporales. Este método reduce la dimensionalidad de las secuencias originales mientras preserva las características originales y la información de tendencia de los datos de series temporales, lo que resulta en una representación unificada de segmentos de series temporales. Los resultados experimentales demuestran que, bajo la misma relación de compresión, SAX-DM combinado con su método de medición de similitud logra una mayor precisión de expresión, una tasa de compresión equilibrada y precisión, en comparación con SAX-TD y SAX-BD, en más del 80% del conjunto de datos de series temporales de UCR. Este enfoque mejora la eficiencia y precisión del cálculo de similitud.
Descripción
Los datos de series temporales suelen exhibir alta dimensionalidad y complejidad, lo que hace necesario el uso de métodos de aproximación específicos para realizar cálculos en los datos. Los métodos de compresión actualmente empleados sufren de diferentes grados de pérdida de características, lo que conlleva a posibles distorsiones en los resultados de la medición de similitud. Considerando los desafíos y preocupaciones mencionados, este artículo propone un método de representación de doble media, SAX-DM (Aproximación de Agregado Simbólico Basada en Doble Media), para datos de series temporales, junto con un enfoque de medición de similitud basado en SAX-DM. Abordando el equilibrio entre la relación de compresión y la precisión en la representación mejorada de SAX, SAX-DM utiliza la media del segmento y la distancia de tendencia del segmento para representar segmentos correspondientes de datos de series temporales. Este método reduce la dimensionalidad de las secuencias originales mientras preserva las características originales y la información de tendencia de los datos de series temporales, lo que resulta en una representación unificada de segmentos de series temporales. Los resultados experimentales demuestran que, bajo la misma relación de compresión, SAX-DM combinado con su método de medición de similitud logra una mayor precisión de expresión, una tasa de compresión equilibrada y precisión, en comparación con SAX-TD y SAX-BD, en más del 80% del conjunto de datos de series temporales de UCR. Este enfoque mejora la eficiencia y precisión del cálculo de similitud.