Acceso adaptativo y particionamiento de caché consciente de hilos en sistemas multinúcleo
Autores: Huang, Kai; Wang, Ke; Zheng, Dandan; Zhang, Xiaoxu; Yan, Xiaolang
Idioma: Inglés
Editor: MDPI
Año: 2018
Acceso abierto
Artículo científico
2018
Acceso adaptativo y particionamiento de caché consciente de hilos en sistemas multinúcleo
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Partición de caché
Aplicación multi-hilo
Datos compartidos
Datos privados
Consumo de energía
Rendimiento
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 34
Citaciones: Sin citaciones
La partición de caché es una técnica exitosa para ahorrar energía en una caché compartida y todos los estudios existentes se centran en cargas de trabajo multiprograma que se ejecutan en sistemas multinúcleo. En este documento, estamos motivados por el hecho de que una aplicación de subprocesos múltiples generalmente se ejecuta más rápido que su contraparte de un solo hilo y su comportamiento de acceso a la caché es bastante diferente. Basándonos en esta observación, estudiamos aplicaciones que se ejecutan en modo de subprocesos múltiples y clasificamos los datos de las aplicaciones de subprocesos múltiples en categorías compartidas y privadas, lo que ayuda a reducir las interferencias entre los datos compartidos y privados y contribuye a construir un esquema de partición de caché más eficiente. También proponemos una estructura de hardware para admitir estas operaciones. Luego, se propone un esquema de partición de caché adaptativo y consciente de los subprocesos (ATCP), que asigna porciones de caché separadas a datos compartidos y privados para evitar las evicciones causadas por los conflictos de los datos de diferentes categorías en la caché compartida. El ATCP propuesto logra un menor consumo de energía, al mismo tiempo que mejora el rendimiento de las aplicaciones en comparación con los esquemas de gestión basados en el uso menos reciente (LRU), partición uniforme basada en núcleos (EVEN) y partición de caché basada en utilidad (UCP). Los resultados experimentales muestran que ATCP puede lograr un ahorro de energía promedio del 29,6% y 19,9% en comparación con los esquemas LRU y UCP en un sistema de cuatro núcleos. Además, la aceleración promedio de ATCP de subprocesos múltiples con respecto a LRU de un solo hilo es de 1,89.
Descripción
La partición de caché es una técnica exitosa para ahorrar energía en una caché compartida y todos los estudios existentes se centran en cargas de trabajo multiprograma que se ejecutan en sistemas multinúcleo. En este documento, estamos motivados por el hecho de que una aplicación de subprocesos múltiples generalmente se ejecuta más rápido que su contraparte de un solo hilo y su comportamiento de acceso a la caché es bastante diferente. Basándonos en esta observación, estudiamos aplicaciones que se ejecutan en modo de subprocesos múltiples y clasificamos los datos de las aplicaciones de subprocesos múltiples en categorías compartidas y privadas, lo que ayuda a reducir las interferencias entre los datos compartidos y privados y contribuye a construir un esquema de partición de caché más eficiente. También proponemos una estructura de hardware para admitir estas operaciones. Luego, se propone un esquema de partición de caché adaptativo y consciente de los subprocesos (ATCP), que asigna porciones de caché separadas a datos compartidos y privados para evitar las evicciones causadas por los conflictos de los datos de diferentes categorías en la caché compartida. El ATCP propuesto logra un menor consumo de energía, al mismo tiempo que mejora el rendimiento de las aplicaciones en comparación con los esquemas de gestión basados en el uso menos reciente (LRU), partición uniforme basada en núcleos (EVEN) y partición de caché basada en utilidad (UCP). Los resultados experimentales muestran que ATCP puede lograr un ahorro de energía promedio del 29,6% y 19,9% en comparación con los esquemas LRU y UCP en un sistema de cuatro núcleos. Además, la aceleración promedio de ATCP de subprocesos múltiples con respecto a LRU de un solo hilo es de 1,89.