Optimización de hiperparámetros y arquitectura multiobjetivo en modelos de dinámica oceánica con operadores neuronales de Fourier
Autores: Sun, Yixuan; Sowunmi, Ololade; Egele, Romain; Narayanan, Sri Hari Krishna; Van Roekel, Luke; Balaprakash, Prasanna
Idioma: Inglés
Editor: MDPI
Año: 2024
Acceso abierto
Artículo científico
2024
Optimización de hiperparámetros y arquitectura multiobjetivo en modelos de dinámica oceánica con operadores neuronales de Fourier
Categoría
Matemáticas
Subcategoría
Matemáticas generales
Palabras clave
Entrenamiento
Modelo de aprendizaje profundo
Hiperparámetros
DeepHyper
FNOs
Pronóstico oceánico
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 20
Citaciones: Sin citaciones
Entrenar un modelo efectivo de aprendizaje profundo para aprender procesos oceánicos implica hacer elecciones cuidadosas de varios hiperparámetros. Aprovechamos los avanzados algoritmos de búsqueda de DeepHyper para la optimización multiobjetivo, agilizando el desarrollo de redes neuronales adaptadas para la modelización oceánica. El enfoque se centra en optimizar los operadores neuronales de Fourier (FNOs), un modelo basado en datos capaz de simular comportamientos oceánicos complejos. Seleccionar el modelo correcto y ajustar los hiperparámetros son tareas desafiantes que requieren mucho esfuerzo para garantizar la precisión del modelo. DeepHyper permite una exploración eficiente de los hiperparámetros asociados con el preprocesamiento de datos, los hiperparámetros relacionados con la arquitectura de FNO y diversas estrategias de entrenamiento de modelos. Nuestro objetivo es obtener un conjunto óptimo de hiperparámetros que conduzcan al modelo más eficiente. Además, además del error cuadrático medio comúnmente utilizado para el entrenamiento del modelo, proponemos adoptar el coeficiente de correlación de anomalía negativa como término de pérdida adicional para mejorar el rendimiento del modelo e investigar el posible equilibrio entre los dos términos. Los experimentos numéricos muestran que el conjunto óptimo de hiperparámetros mejoró el rendimiento del modelo en la predicción de un único paso de tiempo y superó ampliamente la configuración base en la proyección autorregresiva para la predicción a largo plazo de hasta 30 días. Utilizando DeepHyper, demostramos un enfoque para mejorar el uso de FNO en la predicción de la dinámica oceánica, ofreciendo una solución escalable con una precisión mejorada.
Descripción
Entrenar un modelo efectivo de aprendizaje profundo para aprender procesos oceánicos implica hacer elecciones cuidadosas de varios hiperparámetros. Aprovechamos los avanzados algoritmos de búsqueda de DeepHyper para la optimización multiobjetivo, agilizando el desarrollo de redes neuronales adaptadas para la modelización oceánica. El enfoque se centra en optimizar los operadores neuronales de Fourier (FNOs), un modelo basado en datos capaz de simular comportamientos oceánicos complejos. Seleccionar el modelo correcto y ajustar los hiperparámetros son tareas desafiantes que requieren mucho esfuerzo para garantizar la precisión del modelo. DeepHyper permite una exploración eficiente de los hiperparámetros asociados con el preprocesamiento de datos, los hiperparámetros relacionados con la arquitectura de FNO y diversas estrategias de entrenamiento de modelos. Nuestro objetivo es obtener un conjunto óptimo de hiperparámetros que conduzcan al modelo más eficiente. Además, además del error cuadrático medio comúnmente utilizado para el entrenamiento del modelo, proponemos adoptar el coeficiente de correlación de anomalía negativa como término de pérdida adicional para mejorar el rendimiento del modelo e investigar el posible equilibrio entre los dos términos. Los experimentos numéricos muestran que el conjunto óptimo de hiperparámetros mejoró el rendimiento del modelo en la predicción de un único paso de tiempo y superó ampliamente la configuración base en la proyección autorregresiva para la predicción a largo plazo de hasta 30 días. Utilizando DeepHyper, demostramos un enfoque para mejorar el uso de FNO en la predicción de la dinámica oceánica, ofreciendo una solución escalable con una precisión mejorada.