logo móvil
Contáctanos

Análisis de rendimiento de multiplicación de matriz-vector dispersa (SpMV) en unidades de procesamiento gráfico (GPU)

Autores: AlAhmadi, Sarah; Mohammed, Thaha; Albeshri, Aiiad; Katib, Iyad; Mehmood, Rashid

Idioma: Inglés

Editor: MDPI

Año: 2020

Descargar PDF

Acceso abierto

Artículo científico
2020

Análisis de rendimiento de multiplicación de matriz-vector dispersa (SpMV) en unidades de procesamiento gráfico (GPU)


Categoría

Ingeniería y Tecnología

Subcategoría

Ingeniería Eléctrica y Electrónica

Palabras clave

Unidades de procesamiento de gráficos
Cálculos de matriz-vector dispersa
Análisis de rendimiento
Esquema híbrido heterogéneo de CPU-GPU
Patrones de dispersión
Aplicaciones de computación de alto rendimiento

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 31

Citaciones: Sin citaciones


Descripción
Las unidades de procesamiento gráfico (GPU) han brindado un rendimiento notable para una variedad de aplicaciones de cómputo de alto rendimiento (HPC) a través de un gran paralelismo. Una de esas aplicaciones es el cálculo de matriz-vector dispersa (SpMV), que es central para muchas aplicaciones científicas, de ingeniería y otras, incluido el aprendizaje automático. Ningún esquema de almacenamiento o cálculo único de SpMV proporciona un rendimiento consistente y suficientemente alto para todas las matrices debido a sus diferentes patrones de dispersión. Una revisión exhaustiva de la literatura revela que el rendimiento de las técnicas de SpMV en las GPU no ha sido estudiado con suficiente detalle. En este documento, proporcionamos un análisis detallado del rendimiento de SpMV en las GPU utilizando cuatro esquemas de almacenamiento de matrices dispersas notables (fila dispersa comprimida (CSR), ELLAPCK (ELL), híbrido ELL/COO (HYB) y fila dispersa comprimida 5 (CSR5)), cinco métricas de rendimiento (tiempo de ejecución, operaciones de punto flotante gigantes por segundo (GFLOPS), ocupación lograda, instrucciones por warp y eficiencia de ejecución de warp), cinco características de dispersión de matrices (, , , , y ), y 17 matrices dispersas de 10 dominios de aplicación (simulaciones químicas, dinámica de fluidos computacional (CFD), electromagnetismo, programación lineal, economía, etc.). Posteriormente, basándonos en las ideas más profundas obtenidas a través del análisis detallado del rendimiento, proponemos una técnica llamada el esquema híbrido CPU-GPU heterogéneo (HCGHYB). Utiliza tanto la CPU como la GPU en paralelo y proporciona un mejor rendimiento sobre el formato HYB con una aceleración promedio de 1.7x. La computación heterogénea es una dirección importante para SpMV y otras áreas de aplicación. Además, hasta donde sabemos, este es el primer trabajo en el que se ha discutido en profundidad el rendimiento de SpMV en las GPU. Creemos que este trabajo sobre el análisis de rendimiento de SpMV y el esquema heterogéneo abrirá muchas nuevas direcciones y mejoras para el campo de cómputo de SpMV en el futuro.

Otros recursos que podrían interesarte

Temas Virtualpro