Un marco de programación de GPU para acelerar la optimización de hiperparámetros en clusters de aprendizaje profundo
Autores: Son, Jaewon; Yoo, Yonghyuk; Kim, Khu-rai; Kim, Youngjae; Lee, Kwonyong; Park, Sungyong
Idioma: Inglés
Editor: MDPI
Año: 2021
Acceso abierto
Artículo científico
2021
Un marco de programación de GPU para acelerar la optimización de hiperparámetros en clusters de aprendizaje profundo
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Contenedor
GPU
Programación
Optimización de hiperparámetros
Aprendizaje profundo
Kubernetes
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 30
Citaciones: Sin citaciones
Este documento propone Hermes, un marco de programación de GPU preemptivo basado en contenedores para acelerar la optimización de hiperparámetros en clústeres de aprendizaje profundo (DL). Hermes acelera la optimización de hiperparámetros mediante el intercambio de tiempo entre trabajos de DL y priorizando trabajos con combinaciones de hiperparámetros más prometedoras. La política de programación de Hermes se basa en la observación de que las buenas combinaciones de hiperparámetros convergen rápidamente en las fases iniciales del entrenamiento. Al dar prioridad a los contenedores que convergen rápidamente, el mecanismo de preemptación de GPU de Hermes puede acelerar el entrenamiento. Esto permite a los usuarios encontrar hiperparámetros óptimos más rápido sin perder el progreso de un contenedor. Hemos implementado Hermes sobre Kubernetes y comparado su rendimiento con marcos de programación existentes. Los experimentos muestran que Hermes reduce el tiempo de optimización de hiperparámetros hasta 4.04 veces en comparación con políticas de programación previamente propuestas como FIFO, round-robin (RR) y SLAQ, con un mínimo sobrecoste de intercambio de tiempo.
Descripción
Este documento propone Hermes, un marco de programación de GPU preemptivo basado en contenedores para acelerar la optimización de hiperparámetros en clústeres de aprendizaje profundo (DL). Hermes acelera la optimización de hiperparámetros mediante el intercambio de tiempo entre trabajos de DL y priorizando trabajos con combinaciones de hiperparámetros más prometedoras. La política de programación de Hermes se basa en la observación de que las buenas combinaciones de hiperparámetros convergen rápidamente en las fases iniciales del entrenamiento. Al dar prioridad a los contenedores que convergen rápidamente, el mecanismo de preemptación de GPU de Hermes puede acelerar el entrenamiento. Esto permite a los usuarios encontrar hiperparámetros óptimos más rápido sin perder el progreso de un contenedor. Hemos implementado Hermes sobre Kubernetes y comparado su rendimiento con marcos de programación existentes. Los experimentos muestran que Hermes reduce el tiempo de optimización de hiperparámetros hasta 4.04 veces en comparación con políticas de programación previamente propuestas como FIFO, round-robin (RR) y SLAQ, con un mínimo sobrecoste de intercambio de tiempo.