Optimización de algoritmos de convolución directa en procesadores ARM para inferencia de aprendizaje profundo
Autores: Li, Shang; Yu, Fei; Zhang, Shankou; Yin, Huige; Lin, Hairong
Idioma: Inglés
Editor: MDPI
Año: 2025
Acceso abierto
Artículo científico
2025
Optimización de algoritmos de convolución directa en procesadores ARM para inferencia de aprendizaje profundo
Categoría
Matemáticas
Subcategoría
Matemáticas generales
Palabras clave
Aprendizaje profundo
Capas convolucionales
Carga computacional
Cuellos de botella de rendimiento
Convolución directa
Algoritmo
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 32
Citaciones: Sin citaciones
En este documento, proponemos una implementación de alto rendimiento del algoritmo de convolución directa para inferencia que conserva el diseño de datos de canal primero de las entradas/salidas de las capas convolucionales.
Descripción
En este documento, proponemos una implementación de alto rendimiento del algoritmo de convolución directa para inferencia que conserva el diseño de datos de canal primero de las entradas/salidas de las capas convolucionales.