Elegante+: Un marco de optimización basado en aprendizaje automático para cálculos de matriz-vector dispersos en la arquitectura de CPU
Autores: Ahmad, Muhammad; Usman, Sardar; Hamza, Ameer; Muzamil, Muhammad; Batyrshin, Ildar
Idioma: Inglés
Editor: MDPI
Año: 2025
Acceso abierto
Artículo científico
2025
Elegante+: Un marco de optimización basado en aprendizaje automático para cálculos de matriz-vector dispersos en la arquitectura de CPU
Categoría
Gestión y administración
Subcategoría
Gestión de la tecnología y la inovación
Palabras clave
Multiplicación de matriz dispersa por vector
Costos computacionales
Herramienta basada en aprendizaje automático
Políticas de programación
Matrices dispersas
Computación de alto rendimiento
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
La multiplicación de matrices dispersas por vectores (SpMV) juega un papel significativo en los costos computacionales de muchas aplicaciones científicas, como la robótica 2D/3D, problemas de redes eléctricas y visión por computadora. Se han introducido numerosas implementaciones utilizando diferentes formatos de matrices dispersas para optimizar este núcleo en CPUs y GPUs. Sin embargo, debido a los patrones de dispersión de las matrices y las diversas configuraciones de hardware, modelar con precisión el rendimiento de SpMV sigue siendo un desafío complejo. El cálculo de SpMV es a menudo un proceso que consume mucho tiempo debido a su estructura de matriz dispersa. Para abordar esto, proponemos una herramienta basada en aprendizaje automático, llamada Elegante+, que predice políticas de programación óptimas al analizar las estructuras de las matrices. Este enfoque elimina la necesidad de pruebas y errores repetitivos, minimiza errores y encuentra la mejor solución del núcleo SpMV, lo que permite a los usuarios tomar decisiones informadas sobre políticas de programación que maximizan la eficiencia computacional. Con este propósito, recopilamos más de 1000 matrices dispersas de la colección SuiteSparse y las convertimos al formato de fila dispersa comprimida (CSR), y se realizó el cálculo de SpMV extrayendo 14 características clave de matrices dispersas. Después de crear un conjunto de datos completo, entrenamos varios modelos de aprendizaje automático para predecir la política de programación óptima, mejorando significativamente la eficiencia computacional y reduciendo la sobrecarga en entornos de computación de alto rendimiento. Nuestra herramienta propuesta, Elegante+ (XGB con todas las características de SpMV), logró la puntuación más alta en validación cruzada del 79% y funcionó cinco veces más rápido que la política de programación predeterminada durante SpMV en un entorno de computación de alto rendimiento (HPC).
Descripción
La multiplicación de matrices dispersas por vectores (SpMV) juega un papel significativo en los costos computacionales de muchas aplicaciones científicas, como la robótica 2D/3D, problemas de redes eléctricas y visión por computadora. Se han introducido numerosas implementaciones utilizando diferentes formatos de matrices dispersas para optimizar este núcleo en CPUs y GPUs. Sin embargo, debido a los patrones de dispersión de las matrices y las diversas configuraciones de hardware, modelar con precisión el rendimiento de SpMV sigue siendo un desafío complejo. El cálculo de SpMV es a menudo un proceso que consume mucho tiempo debido a su estructura de matriz dispersa. Para abordar esto, proponemos una herramienta basada en aprendizaje automático, llamada Elegante+, que predice políticas de programación óptimas al analizar las estructuras de las matrices. Este enfoque elimina la necesidad de pruebas y errores repetitivos, minimiza errores y encuentra la mejor solución del núcleo SpMV, lo que permite a los usuarios tomar decisiones informadas sobre políticas de programación que maximizan la eficiencia computacional. Con este propósito, recopilamos más de 1000 matrices dispersas de la colección SuiteSparse y las convertimos al formato de fila dispersa comprimida (CSR), y se realizó el cálculo de SpMV extrayendo 14 características clave de matrices dispersas. Después de crear un conjunto de datos completo, entrenamos varios modelos de aprendizaje automático para predecir la política de programación óptima, mejorando significativamente la eficiencia computacional y reduciendo la sobrecarga en entornos de computación de alto rendimiento. Nuestra herramienta propuesta, Elegante+ (XGB con todas las características de SpMV), logró la puntuación más alta en validación cruzada del 79% y funcionó cinco veces más rápido que la política de programación predeterminada durante SpMV en un entorno de computación de alto rendimiento (HPC).