Modelos de aprendizaje automático informados por componentes de mezcla conectados para pronósticos de series temporales a corto y medio plazo
Autores: Gorshenin, Andrey K.; Vilyaev, Anton L.
Idioma: Inglés
Editor: MDPI
Año: 2024
Acceso abierto
Artículo científico
2024
Modelos de aprendizaje automático informados por componentes de mezcla conectados para pronósticos de series temporales a corto y medio plazo
Categoría
Ingeniería y Tecnología
Subcategoría
Inteligencia Artificial
Palabras clave
Enfoque
Informado por probabilidad
Aprendizaje automático
Redes neuronales
Componentes de mezcla
Pronóstico
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 25
Citaciones: Sin citaciones
Este documento presenta un nuevo enfoque en el campo del aprendizaje automático (ML) informado por la probabilidad. Implica mejorar los resultados de los algoritmos de ML y las redes neuronales (NNs) utilizando modelos de probabilidad como fuente de características adicionales en situaciones donde es imposible aumentar los conjuntos de datos de entrenamiento por diversas razones. Introducimos componentes de mezcla conectados como fuente de información adicional que puede extraerse de un modelo matemático. Estos componentes se forman utilizando modelos de mezcla de probabilidad y un algoritmo especial para fusionar parámetros en el modo de ventana deslizante. Este enfoque ha demostrado ser efectivo cuando se aplica a datos de series temporales del mundo real para pronósticos a corto y mediano plazo. En todos los casos, los modelos informados por los componentes de mezcla conectados mostraron mejores resultados que aquellos que no los utilizaban, aunque diferentes modelos informados pueden ser efectivos para varios conjuntos de datos. La novedad fundamental de la investigación radica tanto en un nuevo enfoque matemático para informar modelos de ML como en el aumento demostrado en la precisión de pronóstico en diversas aplicaciones. Para datos geofísicos espacio-temporales, la disminución en el Error Cuadrático Medio (RMSE) fue de hasta , y la reducción en el Error Porcentual Absoluto Medio (MAPE) fue de hasta en comparación con los modelos de ML sin información de probabilidad. Los mejores valores de métricas se obtuvieron mediante una arquitectura de conjunto informada que fusiona los resultados de una red LSTM (Long Short-Term Memory) y un transformer. El Error Cuadrático Medio (MSE) para la temperatura del aceite del transformador eléctrico del ETDataset había mejorado hasta en comparación con los métodos convencionales. El mejor valor de MSE se obtuvo mediante un bosque aleatorio informado. El enfoque informado por probabilidad introducido nos permite superar los resultados tanto de las arquitecturas de NN de transformador como de los métodos clásicos estadísticos y de aprendizaje automático.
Descripción
Este documento presenta un nuevo enfoque en el campo del aprendizaje automático (ML) informado por la probabilidad. Implica mejorar los resultados de los algoritmos de ML y las redes neuronales (NNs) utilizando modelos de probabilidad como fuente de características adicionales en situaciones donde es imposible aumentar los conjuntos de datos de entrenamiento por diversas razones. Introducimos componentes de mezcla conectados como fuente de información adicional que puede extraerse de un modelo matemático. Estos componentes se forman utilizando modelos de mezcla de probabilidad y un algoritmo especial para fusionar parámetros en el modo de ventana deslizante. Este enfoque ha demostrado ser efectivo cuando se aplica a datos de series temporales del mundo real para pronósticos a corto y mediano plazo. En todos los casos, los modelos informados por los componentes de mezcla conectados mostraron mejores resultados que aquellos que no los utilizaban, aunque diferentes modelos informados pueden ser efectivos para varios conjuntos de datos. La novedad fundamental de la investigación radica tanto en un nuevo enfoque matemático para informar modelos de ML como en el aumento demostrado en la precisión de pronóstico en diversas aplicaciones. Para datos geofísicos espacio-temporales, la disminución en el Error Cuadrático Medio (RMSE) fue de hasta , y la reducción en el Error Porcentual Absoluto Medio (MAPE) fue de hasta en comparación con los modelos de ML sin información de probabilidad. Los mejores valores de métricas se obtuvieron mediante una arquitectura de conjunto informada que fusiona los resultados de una red LSTM (Long Short-Term Memory) y un transformer. El Error Cuadrático Medio (MSE) para la temperatura del aceite del transformador eléctrico del ETDataset había mejorado hasta en comparación con los métodos convencionales. El mejor valor de MSE se obtuvo mediante un bosque aleatorio informado. El enfoque informado por probabilidad introducido nos permite superar los resultados tanto de las arquitecturas de NN de transformador como de los métodos clásicos estadísticos y de aprendizaje automático.