Mempa: un coprocesador m-simd mapeado en memoria para hacer frente al problema de la barrera de memoria
Autores: Guastamacchia, Angela; Coluccio, Andrea; Riente, Fabrizio; Turvani, Giovanna; Graziano, Mariagrazia; Zamboni, Maurizio; Vacca, Marco
Idioma: Inglés
Editor: MDPI
Año: 2024
Acceso abierto
Artículo científico
2024
Mempa: un coprocesador m-simd mapeado en memoria para hacer frente al problema de la barrera de memoria
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Tecnología de transistores
Aplicaciones intensivas en datos
Enfoque más allá de von Neumann
Coprocesador mapeado en memoria
Algoritmos de procesamiento de datos
Sistema basado en RISC-V
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 36
Citaciones: Sin citaciones
El asombroso desarrollo de la tecnología de transistor ha sido la principal fuerza impulsora detrás de la electrónica moderna. Con el tiempo, este proceso se ha ralentizado, introduciendo cuellos de botella de rendimiento en aplicaciones intensivas en datos. Una causa principal es la arquitectura clásica de von Neumann, que implica intercambios constantes de datos entre unidades de procesamiento y memoria de datos, desperdiciando tiempo y energía. Como posible alternativa, el enfoque Beyond von Neumann se está extendiendo rápidamente. Aunque las arquitecturas que siguen este paradigma varían mucho en diseño y funcionamiento, todas comparten el mismo principio: acercar los elementos de computación lo más posible a la memoria mientras se insertan elementos de procesamiento personalizados, capaces de elaborar más datos. Así, se ahorra energía y tiempo a través de la ejecución en paralelo y el uso de componentes de procesamiento con elementos de memoria locales, optimizados para ejecutar algoritmos intensivos en datos. Aquí se presenta un nuevo coprocesador mapeado en memoria (MeMPA) para aumentar el rendimiento de los sistemas. MeMPA se basa en una matriz programable de bloques de procesamiento completamente interconectados, cada uno provisto de elementos de memoria, siguiendo el modelo de Múltiples Instrucciones Múltiples Datos. Específicamente, MeMPA puede realizar hasta tres instrucciones diferentes, cada una en bloques de datos diferentes, simultáneamente. Por lo tanto, MeMPA procesa eficientemente algoritmos de procesamiento de datos, logrando ahorros de energía y tiempo de hasta 81.2% y 68.9%, respectivamente, en comparación con un sistema basado en RISC-V.
Descripción
El asombroso desarrollo de la tecnología de transistor ha sido la principal fuerza impulsora detrás de la electrónica moderna. Con el tiempo, este proceso se ha ralentizado, introduciendo cuellos de botella de rendimiento en aplicaciones intensivas en datos. Una causa principal es la arquitectura clásica de von Neumann, que implica intercambios constantes de datos entre unidades de procesamiento y memoria de datos, desperdiciando tiempo y energía. Como posible alternativa, el enfoque Beyond von Neumann se está extendiendo rápidamente. Aunque las arquitecturas que siguen este paradigma varían mucho en diseño y funcionamiento, todas comparten el mismo principio: acercar los elementos de computación lo más posible a la memoria mientras se insertan elementos de procesamiento personalizados, capaces de elaborar más datos. Así, se ahorra energía y tiempo a través de la ejecución en paralelo y el uso de componentes de procesamiento con elementos de memoria locales, optimizados para ejecutar algoritmos intensivos en datos. Aquí se presenta un nuevo coprocesador mapeado en memoria (MeMPA) para aumentar el rendimiento de los sistemas. MeMPA se basa en una matriz programable de bloques de procesamiento completamente interconectados, cada uno provisto de elementos de memoria, siguiendo el modelo de Múltiples Instrucciones Múltiples Datos. Específicamente, MeMPA puede realizar hasta tres instrucciones diferentes, cada una en bloques de datos diferentes, simultáneamente. Por lo tanto, MeMPA procesa eficientemente algoritmos de procesamiento de datos, logrando ahorros de energía y tiempo de hasta 81.2% y 68.9%, respectivamente, en comparación con un sistema basado en RISC-V.