Escalado variable de poda para la compresión de modelos Transformer en el reconocimiento de habla de extremo a extremo
Autores: Ben Letaifa, Leila; Rouas, Jean-Luc
Idioma: Inglés
Editor: MDPI
Año: 2023
Acceso abierto
Artículo científico
2023
Escalado variable de poda para la compresión de modelos Transformer en el reconocimiento de habla de extremo a extremo
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería de Software
Palabras clave
Modelos de transformador
Reconocimiento de voz de extremo a extremo
Atención
Capas feedforward
Poda
Recuento de parámetros
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 30
Citaciones: Sin citaciones
Los modelos de transformador se utilizan cada vez más en sistemas de reconocimiento de voz de extremo a extremo por su rendimiento. Sin embargo, su tamaño sustancial plantea desafíos para desplegarlos en aplicaciones del mundo real. Estos modelos dependen en gran medida de capas de atención y de alimentación directa, siendo estas últimas las que contienen una gran cantidad de parámetros que contribuyen significativamente a la huella de memoria del modelo. En consecuencia, resulta pertinente considerar la poda de estas capas para reducir el tamaño del modelo.
Descripción
Los modelos de transformador se utilizan cada vez más en sistemas de reconocimiento de voz de extremo a extremo por su rendimiento. Sin embargo, su tamaño sustancial plantea desafíos para desplegarlos en aplicaciones del mundo real. Estos modelos dependen en gran medida de capas de atención y de alimentación directa, siendo estas últimas las que contienen una gran cantidad de parámetros que contribuyen significativamente a la huella de memoria del modelo. En consecuencia, resulta pertinente considerar la poda de estas capas para reducir el tamaño del modelo.