¿El aprendizaje automático automático supera a la predicción ingenua?
Autores: Paldino, Gian Marco; De Stefani, Jacopo; De Caro, Fabrizio; Bontempi, Gianluca
Idioma: Inglés
Editor: MDPI
Año: 2021
Acceso abierto
Artículo científico
2021
¿El aprendizaje automático automático supera a la predicción ingenua?
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería General
Palabras clave
Grandes cantidades
Datos temporales
Toma de decisiones automatizada
Aprendizaje automático
Marcos de AutoML
Predicción de series temporales
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 20
Citaciones: Sin citaciones
La disponibilidad de grandes cantidades de datos temporales abre nuevas perspectivas de extracción de conocimiento y toma de decisiones automatizadas para empresas y profesionales. Sin embargo, aprender modelos de pronóstico a partir de datos requiere un conocimiento especializado en ciencia de datos o aprendizaje automático (ML), que no siempre está disponible para los usuarios finales. Esta brecha fomenta una creciente demanda de marcos que automatizan el proceso de ML y garantizan un acceso más amplio al público en general. El aprendizaje automático automático (AutoML) proporciona soluciones para construir y validar tuberías de aprendizaje automático minimizando la intervención del usuario. La mayoría de esas tuberías han sido validadas en entornos estáticos de aprendizaje supervisado, mientras que aún falta una validación extensa en la predicción de series temporales. Este problema es particularmente importante en la comunidad de pronósticos, donde la relevancia de los enfoques de aprendizaje automático aún está en debate. Este documento evalúa cuatro marcos de AutoML existentes (AutoGluon, HO, TPOT, Auto-sklearn) en una serie de desafíos de pronóstico (univariados y multivariados, de un paso y de varios pasos) comparándolos con estrategias de pronóstico simples y convencionales (por ejemplo, ingenuos y suavizado exponencial). Los resultados obtenidos destacan que los enfoques de AutoML aún no son lo suficientemente maduros para abordar tareas de pronóstico genéricas en comparación con pronosticadores estadísticos más rápidos pero básicos. En particular, las configuraciones de AutoML probadas, en promedio, no superan significativamente a un estimador ingenuo. Estos resultados, aunque preliminares, no deben interpretarse como un rechazo de las soluciones de AutoML en pronósticos, sino como un estímulo para una validación más rigurosa de sus límites y perspectivas.
Descripción
La disponibilidad de grandes cantidades de datos temporales abre nuevas perspectivas de extracción de conocimiento y toma de decisiones automatizadas para empresas y profesionales. Sin embargo, aprender modelos de pronóstico a partir de datos requiere un conocimiento especializado en ciencia de datos o aprendizaje automático (ML), que no siempre está disponible para los usuarios finales. Esta brecha fomenta una creciente demanda de marcos que automatizan el proceso de ML y garantizan un acceso más amplio al público en general. El aprendizaje automático automático (AutoML) proporciona soluciones para construir y validar tuberías de aprendizaje automático minimizando la intervención del usuario. La mayoría de esas tuberías han sido validadas en entornos estáticos de aprendizaje supervisado, mientras que aún falta una validación extensa en la predicción de series temporales. Este problema es particularmente importante en la comunidad de pronósticos, donde la relevancia de los enfoques de aprendizaje automático aún está en debate. Este documento evalúa cuatro marcos de AutoML existentes (AutoGluon, HO, TPOT, Auto-sklearn) en una serie de desafíos de pronóstico (univariados y multivariados, de un paso y de varios pasos) comparándolos con estrategias de pronóstico simples y convencionales (por ejemplo, ingenuos y suavizado exponencial). Los resultados obtenidos destacan que los enfoques de AutoML aún no son lo suficientemente maduros para abordar tareas de pronóstico genéricas en comparación con pronosticadores estadísticos más rápidos pero básicos. En particular, las configuraciones de AutoML probadas, en promedio, no superan significativamente a un estimador ingenuo. Estos resultados, aunque preliminares, no deben interpretarse como un rechazo de las soluciones de AutoML en pronósticos, sino como un estímulo para una validación más rigurosa de sus límites y perspectivas.