Planificación consciente del rendimiento de aplicaciones paralelas en clústeres no dedicados
Autores: Cascajo, Alberto; Singh, David E.; Carretero, Jesus
Idioma: Inglés
Editor: MDPI
Año: 2019
Acceso abierto
Artículo científico
2019
Planificación consciente del rendimiento de aplicaciones paralelas en clústeres no dedicados
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Marco
Gestión de recursos
Programación de trabajos
Nodos de cálculo
Degradación del rendimiento
Migración de aplicaciones
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 22
Citaciones: Sin citaciones
Este trabajo presenta un marco de trabajo de HPC que proporciona nuevas estrategias para la gestión de recursos y la programación de trabajos, basado en la ejecución de diferentes aplicaciones en nodos de cálculo compartidos, maximizando la utilización de la plataforma. El marco de trabajo incluye una herramienta de monitoreo escalable que es capaz de analizar la utilización de los nodos de cálculo de la plataforma. También presentamos una extensión de CLARISSE, un middleware para coordinación y control de transferencia de datos en plataformas de HPC a gran escala que utiliza la información proporcionada por el monitor en combinación con análisis a nivel de aplicación para detectar la degradación del rendimiento en las aplicaciones en ejecución. Esta degradación, causada por el hecho de que las aplicaciones comparten los nodos de cálculo y pueden competir por sus recursos, se evita mediante la migración dinámica de aplicaciones. Una descripción de la arquitectura, así como una evaluación práctica de la propuesta, muestra mejoras significativas de rendimiento de hasta un 20% en el makespan y un 10% en el consumo de energía en comparación con una ejecución no optimizada.
Descripción
Este trabajo presenta un marco de trabajo de HPC que proporciona nuevas estrategias para la gestión de recursos y la programación de trabajos, basado en la ejecución de diferentes aplicaciones en nodos de cálculo compartidos, maximizando la utilización de la plataforma. El marco de trabajo incluye una herramienta de monitoreo escalable que es capaz de analizar la utilización de los nodos de cálculo de la plataforma. También presentamos una extensión de CLARISSE, un middleware para coordinación y control de transferencia de datos en plataformas de HPC a gran escala que utiliza la información proporcionada por el monitor en combinación con análisis a nivel de aplicación para detectar la degradación del rendimiento en las aplicaciones en ejecución. Esta degradación, causada por el hecho de que las aplicaciones comparten los nodos de cálculo y pueden competir por sus recursos, se evita mediante la migración dinámica de aplicaciones. Una descripción de la arquitectura, así como una evaluación práctica de la propuesta, muestra mejoras significativas de rendimiento de hasta un 20% en el makespan y un 10% en el consumo de energía en comparación con una ejecución no optimizada.