Distribuido aprendizaje profundo: de arquitectura de un solo nodo a multi-nodo
Autores: Lerat, Jean-Sébastien; Mahmoudi, Sidi Ahmed; Mahmoudi, Saïd
Idioma: Inglés
Editor: MDPI
Año: 2022
Acceso abierto
Artículo científico
2022
Distribuido aprendizaje profundo: de arquitectura de un solo nodo a multi-nodo
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Aprendizaje profundo
Aprendizaje profundo distribuido
Estrategias de paralelismo
Recursos computacionales
GPU
Aceleración
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 25
Citaciones: Sin citaciones
Durante los últimos años, los modelos de aprendizaje profundo (DL) se han utilizado en varias aplicaciones con grandes conjuntos de datos y modelos complejos. Estas aplicaciones requieren métodos para entrenar modelos más rápido, como el aprendizaje profundo distribuido (DDL). Este artículo propone un enfoque empírico con el objetivo de medir la aceleración de DDL lograda al utilizar diferentes estrategias de paralelismo en los nodos. El paralelismo local se considera bastante importante en el diseño de una arquitectura de múltiples nodos de alto rendimiento porque DDL depende del tiempo requerido por todos los nodos. También se discute el impacto de los recursos computacionales (CPU y GPU) ya que se sabe que la GPU acelera los cálculos. Los resultados experimentales muestran que el paralelismo local impacta la aceleración global de DDL dependiendo de la complejidad del modelo neuronal y del tamaño del conjunto de datos. Además, nuestro enfoque logra una aceleración mejor que Horovod.
Descripción
Durante los últimos años, los modelos de aprendizaje profundo (DL) se han utilizado en varias aplicaciones con grandes conjuntos de datos y modelos complejos. Estas aplicaciones requieren métodos para entrenar modelos más rápido, como el aprendizaje profundo distribuido (DDL). Este artículo propone un enfoque empírico con el objetivo de medir la aceleración de DDL lograda al utilizar diferentes estrategias de paralelismo en los nodos. El paralelismo local se considera bastante importante en el diseño de una arquitectura de múltiples nodos de alto rendimiento porque DDL depende del tiempo requerido por todos los nodos. También se discute el impacto de los recursos computacionales (CPU y GPU) ya que se sabe que la GPU acelera los cálculos. Los resultados experimentales muestran que el paralelismo local impacta la aceleración global de DDL dependiendo de la complejidad del modelo neuronal y del tamaño del conjunto de datos. Además, nuestro enfoque logra una aceleración mejor que Horovod.