Algoritmo DiamondTorre para modelado de ondas de alto rendimiento
Autores: Levchenko, Vadim; Perepelkina, Anastasia; Zakirov, Andrey
Idioma: Inglés
Editor: MDPI
Año: 2016
Acceso abierto
Artículo científico
2016
Algoritmo DiamondTorre para modelado de ondas de alto rendimiento
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería de Sistemas
Palabras clave
Algoritmos
Medios físicos
Modelado numérico
Ecuación de onda
Algoritmo DiamondTorre
CUDA
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 26
Citaciones: Sin citaciones
Se discuten algoritmos efectivos de modelado numérico de problemas de medios físicos. La tasa de cálculo de tales problemas está limitada por el ancho de banda de memoria si se implementa con algoritmos tradicionales. Se considera la solución numérica de la ecuación de onda. Se utiliza un esquema de diferencias finitas con un estarcido en cruz y un alto orden de aproximación. Se construye el algoritmo DiamondTorre, teniendo en cuenta las especificidades de la jerarquía de memoria y el paralelismo de las GPGPU (unidad de procesamiento gráfico de propósito general). Las ventajas de estos algoritmos son un alto nivel de localización de datos, así como la propiedad de asincronía, que permite utilizar de manera efectiva todos los niveles de paralelismo de las GPGPU. La intensidad computacional del algoritmo es mayor que la de los mejores algoritmos tradicionales con sincronización paso a paso. Como consecuencia, se vuelve posible superar la limitación mencionada anteriormente. El algoritmo se implementa con CUDA. Para el esquema con segundo orden de aproximación, se logra un rendimiento de cálculo de 50 mil millones de celdas por segundo. Esto supera el resultado del mejor algoritmo tradicional en un factor de cinco.
Descripción
Se discuten algoritmos efectivos de modelado numérico de problemas de medios físicos. La tasa de cálculo de tales problemas está limitada por el ancho de banda de memoria si se implementa con algoritmos tradicionales. Se considera la solución numérica de la ecuación de onda. Se utiliza un esquema de diferencias finitas con un estarcido en cruz y un alto orden de aproximación. Se construye el algoritmo DiamondTorre, teniendo en cuenta las especificidades de la jerarquía de memoria y el paralelismo de las GPGPU (unidad de procesamiento gráfico de propósito general). Las ventajas de estos algoritmos son un alto nivel de localización de datos, así como la propiedad de asincronía, que permite utilizar de manera efectiva todos los niveles de paralelismo de las GPGPU. La intensidad computacional del algoritmo es mayor que la de los mejores algoritmos tradicionales con sincronización paso a paso. Como consecuencia, se vuelve posible superar la limitación mencionada anteriormente. El algoritmo se implementa con CUDA. Para el esquema con segundo orden de aproximación, se logra un rendimiento de cálculo de 50 mil millones de celdas por segundo. Esto supera el resultado del mejor algoritmo tradicional en un factor de cinco.