Un estudio comparativo de precondicionamiento de inversas aproximadas dispersas incompletas en bloque en GPUs Tesla K20 y V100
Autores: Ma, Wenpeng; Yuan, Wu; Liu, Xiazhen
Idioma: Inglés
Editor: MDPI
Año: 2021
Acceso abierto
Artículo científico
2021
Un estudio comparativo de precondicionamiento de inversas aproximadas dispersas incompletas en bloque en GPUs Tesla K20 y V100
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería de Software
Palabras clave
Inversos aproximados dispersos
GPUs
LU incompleto
Precondicionador
Block-Jacobi
PETSc
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 42
Citaciones: Sin citaciones
Los precondicionadores Inversos Aproximados Escasos e Incompletos (ISAI) han mostrado algunas ventajas sobre las resoluciones triangulares escasas en las GPUs cuando se utilizan para el precondicionador basado en LU incompleto. En este artículo, extendemos el método de GPU único para el Bloque-ISAI a un algoritmo de múltiples GPUs acoplando el precondicionador de Bloque-Jacobi, e introducimos la implementación detallada en el paquete numérico de código abierto PETSc. En los experimentos, se realizan dos casos representativos y se lleva a cabo un estudio comparativo de Bloque-ISAI en hasta cuatro GPUs en dos generaciones principales de GPUs de NVIDIA (Tesla K20 y Tesla V100). El precondicionamiento de Bloque-Jacobi con Bloque-ISAI (BJPB-ISAI) muestra una ventaja sobre las resoluciones triangulares basadas en programación de nivel de la biblioteca cuSPARSE para los casos, y el costo adicional de configurar Bloque-ISAI y los tiempos totales de reloj de GMRES se reducen considerablemente utilizando las GPUs Tesla V100 en comparación con las GPUs Tesla K20.
Descripción
Los precondicionadores Inversos Aproximados Escasos e Incompletos (ISAI) han mostrado algunas ventajas sobre las resoluciones triangulares escasas en las GPUs cuando se utilizan para el precondicionador basado en LU incompleto. En este artículo, extendemos el método de GPU único para el Bloque-ISAI a un algoritmo de múltiples GPUs acoplando el precondicionador de Bloque-Jacobi, e introducimos la implementación detallada en el paquete numérico de código abierto PETSc. En los experimentos, se realizan dos casos representativos y se lleva a cabo un estudio comparativo de Bloque-ISAI en hasta cuatro GPUs en dos generaciones principales de GPUs de NVIDIA (Tesla K20 y Tesla V100). El precondicionamiento de Bloque-Jacobi con Bloque-ISAI (BJPB-ISAI) muestra una ventaja sobre las resoluciones triangulares basadas en programación de nivel de la biblioteca cuSPARSE para los casos, y el costo adicional de configurar Bloque-ISAI y los tiempos totales de reloj de GMRES se reducen considerablemente utilizando las GPUs Tesla V100 en comparación con las GPUs Tesla K20.