Luaema: un enfoque de desenrollado de bucles que extiende el acceso a la memoria para un procesador de señal digital de palabra muy larga vectorial con múltiples archivos de registro
Autores: Hu, Yonghua; Cheng, Aobo; Tang, Zhuoyou; Liu, Peng; Liang, Wei
Idioma: Inglés
Editor: MDPI
Año: 2024
Acceso abierto
Artículo científico
2024
Luaema: un enfoque de desenrollado de bucles que extiende el acceso a la memoria para un procesador de señal digital de palabra muy larga vectorial con múltiples archivos de registro
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Desenrollado de bucles
Paralelismo a nivel de instrucción
Procesadores de señal digital
Acceso a memoria
LUAEMA
Proporción de aceleración
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 40
Citaciones: Sin citaciones
El desenrollado de bucles puede proporcionar más oportunidades de paralelismo a nivel de instrucción para el código y permite una mayor variedad de programación del pipeline de instrucciones. En procesadores de señal digital (DSP) de muy larga palabra de instrucción (VLIW) de alto rendimiento, existen registros especiales para abordar. Para mejorar aún más el paralelismo a nivel de instrucción del código para tales DSP aprovechando al máximo estos registros, en este documento, proponemos un enfoque de desenrollado de bucles más efectivo a través de la extensión del acceso a memoria (LUAEMA). En este enfoque, el factor de desenrollado final se calcula mediante un modelo en el que se consideran cada tipo de registro y cada operación de acceso a memoria. Para algoritmos básicos de procesamiento de señales digitales, el factor de desenrollado bajo LUAEMA es mayor que el bajo el enfoque de desenrollado de bucles convencional. También brindamos la oportunidad de reducir el número de instrucciones en un bucle durante la transformación del código de desenrollado de bucles. Los resultados experimentales muestran que el enfoque de desenrollado de bucles propuesto en este documento puede lograr una relación de aceleración promedio que va desde 1.14 a 1.81 en comparación con el enfoque de desenrollado de bucles convencional. Para algunos algoritmos, la relación de aceleración máxima es de hasta 2.11.
Descripción
El desenrollado de bucles puede proporcionar más oportunidades de paralelismo a nivel de instrucción para el código y permite una mayor variedad de programación del pipeline de instrucciones. En procesadores de señal digital (DSP) de muy larga palabra de instrucción (VLIW) de alto rendimiento, existen registros especiales para abordar. Para mejorar aún más el paralelismo a nivel de instrucción del código para tales DSP aprovechando al máximo estos registros, en este documento, proponemos un enfoque de desenrollado de bucles más efectivo a través de la extensión del acceso a memoria (LUAEMA). En este enfoque, el factor de desenrollado final se calcula mediante un modelo en el que se consideran cada tipo de registro y cada operación de acceso a memoria. Para algoritmos básicos de procesamiento de señales digitales, el factor de desenrollado bajo LUAEMA es mayor que el bajo el enfoque de desenrollado de bucles convencional. También brindamos la oportunidad de reducir el número de instrucciones en un bucle durante la transformación del código de desenrollado de bucles. Los resultados experimentales muestran que el enfoque de desenrollado de bucles propuesto en este documento puede lograr una relación de aceleración promedio que va desde 1.14 a 1.81 en comparación con el enfoque de desenrollado de bucles convencional. Para algunos algoritmos, la relación de aceleración máxima es de hasta 2.11.