Un modelo teórico para la optimización global de algoritmos paralelos
Autores: Miller, Julian; Trümper, Lukas; Terboven, Christian; Müller, Matthias S.
Idioma: Inglés
Editor: MDPI
Año: 2021
Acceso abierto
Artículo científico
2021
Un modelo teórico para la optimización global de algoritmos paralelos
Categoría
Matemáticas
Subcategoría
Matemáticas generales
Palabras clave
Paisaje de hardware en evolución
Computación de alto rendimiento
Abstracción de software
Modelo de algoritmo paralelo
Sincronización
Flujo de datos
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 35
Citaciones: Sin citaciones
Con el panorama de hardware de alto rendimiento (HPC) que evoluciona rápidamente y su creciente especialización, la implementación de aplicaciones de software eficientes se vuelve más desafiante. Esto es especialmente prevalente para científicos de dominio y puede obstaculizar los avances en software de simulación a gran escala. Una idea para superar estos desafíos es a través de la abstracción de software. Presentamos un modelo de algoritmo paralelo que permite la optimización global de su sincronización y flujo de datos y el mapeo óptimo a arquitecturas complejas y heterogéneas. El modelo presentado separa estrictamente la estructura de un algoritmo de sus funciones ejecutadas. Utiliza una descomposición jerárquica de patrones de diseño paralelo como bloques de construcción bien establecidos para estructuras algorítmicas y los captura en un. Se construye un grafo de flujo centrado en datos basado en el APT, que actúa como una representación intermedia para transformaciones estructurales ricas y automatizadas. Demostramos la aplicabilidad de este modelo a tres algoritmos representativos y mostramos mejoras de velocidad de ejecución entre 1.83 y 2.45 en una arquitectura típica heterogénea de CPU/GPU.
Descripción
Con el panorama de hardware de alto rendimiento (HPC) que evoluciona rápidamente y su creciente especialización, la implementación de aplicaciones de software eficientes se vuelve más desafiante. Esto es especialmente prevalente para científicos de dominio y puede obstaculizar los avances en software de simulación a gran escala. Una idea para superar estos desafíos es a través de la abstracción de software. Presentamos un modelo de algoritmo paralelo que permite la optimización global de su sincronización y flujo de datos y el mapeo óptimo a arquitecturas complejas y heterogéneas. El modelo presentado separa estrictamente la estructura de un algoritmo de sus funciones ejecutadas. Utiliza una descomposición jerárquica de patrones de diseño paralelo como bloques de construcción bien establecidos para estructuras algorítmicas y los captura en un. Se construye un grafo de flujo centrado en datos basado en el APT, que actúa como una representación intermedia para transformaciones estructurales ricas y automatizadas. Demostramos la aplicabilidad de este modelo a tres algoritmos representativos y mostramos mejoras de velocidad de ejecución entre 1.83 y 2.45 en una arquitectura típica heterogénea de CPU/GPU.