Algoritmos de GPU para multiplicación de matrices dispersas estructuradas con esquemas de almacenamiento diagonal

Contáctanos

Temas

Artículos

XBooks

Revistas

Laboratorios

Showroom

Infografías

Recorridos

Videos

Perfiles

Actualidad

Algoritmos de GPU para multiplicación de matrices dispersas estructuradas con esquemas de almacenamiento diagonal

Autores: Haque, Sardar Anisul; Parvez, Mohammad Tanvir; Hossain, Shahadat

Idioma: Inglés

Editor: MDPI

Año: 2024

Descargar PDF

Acceso abierto

Artículo científico

2024

Algoritmos de GPU para multiplicación de matrices dispersas estructuradas con esquemas de almacenamiento diagonal

Categoría

Ingeniería y Tecnología

Subcategoría

Ingeniería de Software

Palabras clave

Multiplicación de matrices-matrices

Operaciones de álgebra lineal

Estructuras de datos

Método de almacenamiento diagonal compacto

Implementaciones paralelas aceleradas por GPU

Matrices dispersas bandadas y/o estructuradas

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 25

Citaciones: Sin citaciones

La multiplicación de matrices es de singular importancia en operaciones de álgebra lineal con una multitud de aplicaciones en computación científica e ingeniería. Las estructuras de datos para almacenar elementos de matrices están diseñadas para minimizar la información adicional, así como para optimizar el conteo de operaciones. En este estudio, utilizamos el concepto del método de almacenamiento diagonal compacto (CDM), que se basa en el método de almacenamiento diagonal previamente desarrollado, un esquema uniforme independiente de la orientación para almacenar los elementos no nulos de una variedad de matrices. Este estudio explota ambos esquemas de almacenamiento y presenta implementaciones paralelas eficientes aceleradas por GPU de la multiplicación de matrices cuando las matrices de entrada son bandadas y/o dispersas estructuradas. Explotamos los diseños de datos en los esquemas de almacenamiento diagonal para exponer una cantidad sustancial de paralelismo detallado y utilizar de manera efectiva la memoria compartida de la GPU para mejorar la localidad del acceso a los datos para cálculos numéricos. Los resultados de un extenso conjunto de experimentos numéricos con los tipos mencionados de matrices demuestran mejoras de velocidad de varias órdenes de magnitud en comparación con el rendimiento secuencial.

Descripción

Otros recursos que podrían interesarte

Ver todas

Temas Virtualpro

Ver todas

Categoría

Subcategoría

Palabras clave

Licencia

Citación bibliográfica

Formato

¡Regístrate ahora y conoce todos los espacios virtuales disponibles para tu institución!

Otros recursos que podrían interesarte

Temas Virtualpro