Procedimientos de evaluación para el pronóstico con datos espaciotemporales
Autores: Oliveira, Mariana; Torgo, Luís; Santos Costa, Vítor
Idioma: Inglés
Editor: MDPI
Año: 2021
Acceso abierto
Artículo científico
2021
Procedimientos de evaluación para el pronóstico con datos espaciotemporales
Categoría
Matemáticas
Subcategoría
Matemáticas generales
Palabras clave
Redes de sensores
Conjuntos de datos espacio-temporales
Enfoques de pronóstico
Procedimientos de estimación de rendimiento
Validación cruzada
Dependencias de datos
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 33
Citaciones: Sin citaciones
El aumento del uso de redes de sensores ha dado lugar a un número cada vez mayor de conjuntos de datos espacio-temporales disponibles. Las aplicaciones de pronóstico que utilizan este tipo de datos suelen estar motivadas por dominios importantes como el monitoreo ambiental. Ser capaz de evaluar adecuadamente el rendimiento de diferentes enfoques de pronóstico es fundamental para lograr avances. Sin embargo, los procedimientos tradicionales de estimación de rendimiento, como la validación cruzada, enfrentan desafíos debido a la dependencia implícita entre las observaciones en los conjuntos de datos espacio-temporales. En este documento, comparamos empíricamente varias variantes de validación cruzada (CV) y procedimientos de estimación de rendimiento fuera de muestra (OOS), utilizando tanto conjuntos de datos espacio-temporales generados artificialmente como reales. Nuestros resultados muestran que tanto la CV como la OOS proporcionan estimaciones útiles, pero sugieren que bloquear los datos en el espacio y/o en el tiempo puede ser útil para mitigar el sesgo de la CV de subestimar el error. En general, nuestro estudio muestra la importancia de considerar las dependencias de los datos al estimar el rendimiento de los modelos de pronóstico espacio-temporales.
Descripción
El aumento del uso de redes de sensores ha dado lugar a un número cada vez mayor de conjuntos de datos espacio-temporales disponibles. Las aplicaciones de pronóstico que utilizan este tipo de datos suelen estar motivadas por dominios importantes como el monitoreo ambiental. Ser capaz de evaluar adecuadamente el rendimiento de diferentes enfoques de pronóstico es fundamental para lograr avances. Sin embargo, los procedimientos tradicionales de estimación de rendimiento, como la validación cruzada, enfrentan desafíos debido a la dependencia implícita entre las observaciones en los conjuntos de datos espacio-temporales. En este documento, comparamos empíricamente varias variantes de validación cruzada (CV) y procedimientos de estimación de rendimiento fuera de muestra (OOS), utilizando tanto conjuntos de datos espacio-temporales generados artificialmente como reales. Nuestros resultados muestran que tanto la CV como la OOS proporcionan estimaciones útiles, pero sugieren que bloquear los datos en el espacio y/o en el tiempo puede ser útil para mitigar el sesgo de la CV de subestimar el error. En general, nuestro estudio muestra la importancia de considerar las dependencias de los datos al estimar el rendimiento de los modelos de pronóstico espacio-temporales.