Preptimize: automatización del preprocesamiento y pronóstico de datos de series temporales
Autores: Usmani, Mehak; Memon, Zulfiqar Ali; Zulfiqar, Adil; Qureshi, Rizwan
Idioma: Inglés
Editor: MDPI
Año: 2024
Acceso abierto
Artículo científico
2024
Preptimize: automatización del preprocesamiento y pronóstico de datos de series temporales
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería de Software
Palabras clave
Análisis de series temporales
Pronóstico
Preprocesamiento
Valores faltantes
Valores atípicos
Aprendizaje automático
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 30
Citaciones: Sin citaciones
El análisis de series temporales es fundamental para la toma de decisiones comerciales y financieras, especialmente con la creciente integración del Internet de las Cosas (IoT). Sin embargo, aprovechar los datos de series temporales para la predicción requiere un extenso preprocesamiento para abordar desafíos como valores faltantes, heterocedasticidad, estacionalidad, valores atípicos y ruido. Diferentes enfoques son necesarios para series temporales univariadas y multivariadas, series temporales gaussianas y no gaussianas, y series temporales estacionarias versus no estacionarias. El manejo de datos faltantes por sí solo es complejo, exigiendo soluciones únicas para cada tipo. Extraer características estadísticas, identificar problemas de calidad de datos y seleccionar técnicas adecuadas de limpieza y pronóstico requieren un esfuerzo, tiempo y experiencia significativos. Para agilizar este proceso, proponemos una estrategia automatizada llamada Preptimize, que integra técnicas estadísticas y de aprendizaje automático y recomienda modelos de predicción, sugiriendo los enfoques más adecuados para un conjunto de datos dado como un paso inicial hacia un análisis más profundo. Preptimize lee una muestra de un gran conjunto de datos y recomienda el modelo de diseño basado en la optimización, lo que lo hace fácil de usar incluso para no expertos. Los resultados de varios experimentos indicaron que Preptimize superó o tuvo un rendimiento comparable a modelos de referencia en múltiples sectores, incluidos precios de acciones, criptomonedas y predicción de consumo de energía. Esto demuestra la efectividad del marco en recomendar modelos de predicción adecuados para varios conjuntos de datos de series temporales, resaltando su amplia aplicabilidad en diferentes dominios en la predicción de series temporales.
Descripción
El análisis de series temporales es fundamental para la toma de decisiones comerciales y financieras, especialmente con la creciente integración del Internet de las Cosas (IoT). Sin embargo, aprovechar los datos de series temporales para la predicción requiere un extenso preprocesamiento para abordar desafíos como valores faltantes, heterocedasticidad, estacionalidad, valores atípicos y ruido. Diferentes enfoques son necesarios para series temporales univariadas y multivariadas, series temporales gaussianas y no gaussianas, y series temporales estacionarias versus no estacionarias. El manejo de datos faltantes por sí solo es complejo, exigiendo soluciones únicas para cada tipo. Extraer características estadísticas, identificar problemas de calidad de datos y seleccionar técnicas adecuadas de limpieza y pronóstico requieren un esfuerzo, tiempo y experiencia significativos. Para agilizar este proceso, proponemos una estrategia automatizada llamada Preptimize, que integra técnicas estadísticas y de aprendizaje automático y recomienda modelos de predicción, sugiriendo los enfoques más adecuados para un conjunto de datos dado como un paso inicial hacia un análisis más profundo. Preptimize lee una muestra de un gran conjunto de datos y recomienda el modelo de diseño basado en la optimización, lo que lo hace fácil de usar incluso para no expertos. Los resultados de varios experimentos indicaron que Preptimize superó o tuvo un rendimiento comparable a modelos de referencia en múltiples sectores, incluidos precios de acciones, criptomonedas y predicción de consumo de energía. Esto demuestra la efectividad del marco en recomendar modelos de predicción adecuados para varios conjuntos de datos de series temporales, resaltando su amplia aplicabilidad en diferentes dominios en la predicción de series temporales.