logo móvil
Contáctanos

Un estudio comparativo de precondicionamiento de inversas aproximadas dispersas incompletas en bloque en GPUs Tesla K20 y V100

Autores: Ma, Wenpeng; Yuan, Wu; Liu, Xiazhen

Idioma: Inglés

Editor: MDPI

Año: 2021

Descargar PDF

Acceso abierto

Artículo científico
2021

Un estudio comparativo de precondicionamiento de inversas aproximadas dispersas incompletas en bloque en GPUs Tesla K20 y V100


Categoría

Ingeniería y Tecnología

Subcategoría

Ingeniería de Software

Palabras clave

Inversos aproximados dispersos
GPUs
LU incompleto
Precondicionador
Block-Jacobi
PETSc

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 42

Citaciones: Sin citaciones


Descripción
Los precondicionadores Inversos Aproximados Escasos e Incompletos (ISAI) han mostrado algunas ventajas sobre las resoluciones triangulares escasas en las GPUs cuando se utilizan para el precondicionador basado en LU incompleto. En este artículo, extendemos el método de GPU único para el Bloque-ISAI a un algoritmo de múltiples GPUs acoplando el precondicionador de Bloque-Jacobi, e introducimos la implementación detallada en el paquete numérico de código abierto PETSc. En los experimentos, se realizan dos casos representativos y se lleva a cabo un estudio comparativo de Bloque-ISAI en hasta cuatro GPUs en dos generaciones principales de GPUs de NVIDIA (Tesla K20 y Tesla V100). El precondicionamiento de Bloque-Jacobi con Bloque-ISAI (BJPB-ISAI) muestra una ventaja sobre las resoluciones triangulares basadas en programación de nivel de la biblioteca cuSPARSE para los casos, y el costo adicional de configurar Bloque-ISAI y los tiempos totales de reloj de GMRES se reducen considerablemente utilizando las GPUs Tesla V100 en comparación con las GPUs Tesla K20.

Otros recursos que podrían interesarte

Temas Virtualpro