Prefetching Codicioso para Reducir los Accesos a la Memoria Fuera del Chip en la Inferencia de Redes Neuronales Convolucionales
Autores: Yang, Dengtian; Chen, Lan
Idioma: Inglés
Editor: MDPI
Año: 2025
Acceso abierto
Artículo científico
2025
Prefetching Codicioso para Reducir los Accesos a la Memoria Fuera del Chip en la Inferencia de Redes Neuronales Convolucionales
Categoría
Gestión y administración
Subcategoría
Gestión de la tecnología y la inovación
Palabras clave
Parámetro
Demandas de acceso a memoria
CNNs
Métodos de prefetching
Reutilización de datos
Estrategia de implementación
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
Las altas demandas de parámetros y acceso a memoria de las CNN destacan la necesidad de reducir los accesos a memoria fuera del chip. Si bien los enfoques recientes han mejorado la reutilización de datos para disminuir estos accesos, aún faltan métodos de prefetching simples y eficientes. Este artículo presenta un método de prefetching codicioso que utiliza la repetición de datos para optimizar la ruta de prefetching, disminuyendo así los accesos a memoria fuera del chip. El método también se implementa en un simulador de hardware para organizar una estrategia de implementación con optimizaciones adicionales. Nuestra estrategia de implementación supera los trabajos recientes, con una mejora máxima en la reutilización de datos de 1.98x.
Descripción
Las altas demandas de parámetros y acceso a memoria de las CNN destacan la necesidad de reducir los accesos a memoria fuera del chip. Si bien los enfoques recientes han mejorado la reutilización de datos para disminuir estos accesos, aún faltan métodos de prefetching simples y eficientes. Este artículo presenta un método de prefetching codicioso que utiliza la repetición de datos para optimizar la ruta de prefetching, disminuyendo así los accesos a memoria fuera del chip. El método también se implementa en un simulador de hardware para organizar una estrategia de implementación con optimizaciones adicionales. Nuestra estrategia de implementación supera los trabajos recientes, con una mejora máxima en la reutilización de datos de 1.98x.