Algoritmos de GPU para multiplicación de matrices dispersas estructuradas con esquemas de almacenamiento diagonal
Autores: Haque, Sardar Anisul; Parvez, Mohammad Tanvir; Hossain, Shahadat
Idioma: Inglés
Editor: MDPI
Año: 2024
Acceso abierto
Artículo científico
2024
Algoritmos de GPU para multiplicación de matrices dispersas estructuradas con esquemas de almacenamiento diagonal
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería de Software
Palabras clave
Multiplicación de matrices-matrices
Operaciones de álgebra lineal
Estructuras de datos
Método de almacenamiento diagonal compacto
Implementaciones paralelas aceleradas por GPU
Matrices dispersas bandadas y/o estructuradas
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 25
Citaciones: Sin citaciones
La multiplicación de matrices es de singular importancia en operaciones de álgebra lineal con una multitud de aplicaciones en computación científica e ingeniería. Las estructuras de datos para almacenar elementos de matrices están diseñadas para minimizar la información adicional, así como para optimizar el conteo de operaciones. En este estudio, utilizamos el concepto del método de almacenamiento diagonal compacto (CDM), que se basa en el método de almacenamiento diagonal previamente desarrollado, un esquema uniforme independiente de la orientación para almacenar los elementos no nulos de una variedad de matrices. Este estudio explota ambos esquemas de almacenamiento y presenta implementaciones paralelas eficientes aceleradas por GPU de la multiplicación de matrices cuando las matrices de entrada son bandadas y/o dispersas estructuradas. Explotamos los diseños de datos en los esquemas de almacenamiento diagonal para exponer una cantidad sustancial de paralelismo detallado y utilizar de manera efectiva la memoria compartida de la GPU para mejorar la localidad del acceso a los datos para cálculos numéricos. Los resultados de un extenso conjunto de experimentos numéricos con los tipos mencionados de matrices demuestran mejoras de velocidad de varias órdenes de magnitud en comparación con el rendimiento secuencial.
Descripción
La multiplicación de matrices es de singular importancia en operaciones de álgebra lineal con una multitud de aplicaciones en computación científica e ingeniería. Las estructuras de datos para almacenar elementos de matrices están diseñadas para minimizar la información adicional, así como para optimizar el conteo de operaciones. En este estudio, utilizamos el concepto del método de almacenamiento diagonal compacto (CDM), que se basa en el método de almacenamiento diagonal previamente desarrollado, un esquema uniforme independiente de la orientación para almacenar los elementos no nulos de una variedad de matrices. Este estudio explota ambos esquemas de almacenamiento y presenta implementaciones paralelas eficientes aceleradas por GPU de la multiplicación de matrices cuando las matrices de entrada son bandadas y/o dispersas estructuradas. Explotamos los diseños de datos en los esquemas de almacenamiento diagonal para exponer una cantidad sustancial de paralelismo detallado y utilizar de manera efectiva la memoria compartida de la GPU para mejorar la localidad del acceso a los datos para cálculos numéricos. Los resultados de un extenso conjunto de experimentos numéricos con los tipos mencionados de matrices demuestran mejoras de velocidad de varias órdenes de magnitud en comparación con el rendimiento secuencial.