Un metodología para diseñar redes neuronales profundas cuantizadas para el reconocimiento automático de modulación
Autores: Góez, David; Soto, Paola; Latré, Steven; Gaviria, Natalia; Camelo, Miguel
Idioma: Inglés
Editor: MDPI
Año: 2022
Acceso abierto
Artículo científico
2022
Un metodología para diseñar redes neuronales profundas cuantizadas para el reconocimiento automático de modulación
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería de Software
Palabras clave
Sistemas de comunicación
DL
Enfoques de optimización
Técnicas de cuantificación
Costos computacionales
Modelo DNN
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 22
Citaciones: Sin citaciones
Los sistemas de comunicación de próxima generación enfrentarán nuevos desafíos relacionados con la gestión eficiente de los recursos disponibles, como el espectro de radio. DL es uno de los enfoques de optimización para abordar y resolver estos desafíos. Sin embargo, existe una brecha entre la investigación y la industria. La mayoría de los modelos de IA que resuelven problemas de comunicación no pueden implementarse en los dispositivos de comunicación actuales debido a sus altos requisitos de capacidad computacional. Los nuevos enfoques buscan reducir el tamaño de los modelos de DL a través de técnicas de cuantificación, cambiando el método tradicional de operaciones de una representación de punto flotante de 32 (o 64) a un punto fijo (generalmente pequeño). Sin embargo, no existe un método analítico para determinar el nivel de cuantificación que se puede utilizar para obtener el mejor equilibrio entre la reducción de costos computacionales y una precisión aceptable en un problema específico. En este trabajo, proponemos una metodología de análisis para determinar el grado de cuantificación en un modelo DNN para resolver el problema de AMR en un sistema de radio. Utilizamos el marco de trabajo Brevitas para construir y analizar diferentes variantes cuantizadas de la arquitectura de DL VGG10 adaptada al problema de AMR. La evaluación del costo computacional se realiza con el marco de trabajo FINN de Xilinx Research Labs para obtener el costo de inferencia computacional. La metodología de diseño propuesta nos permite obtener la combinación de bits de cuantificación por capa que proporciona un equilibrio óptimo entre el rendimiento del modelo (es decir, precisión) y la complejidad del modelo (es decir, tamaño) de acuerdo con un conjunto de pesos asociados con cada objetivo de optimización. Por ejemplo, utilizando la metodología propuesta, encontramos una arquitectura de modelo que redujo el 75.8% del tamaño del modelo en comparación con el modelo base no cuantizado, con una degradación del rendimiento de solo 0.06%.
Descripción
Los sistemas de comunicación de próxima generación enfrentarán nuevos desafíos relacionados con la gestión eficiente de los recursos disponibles, como el espectro de radio. DL es uno de los enfoques de optimización para abordar y resolver estos desafíos. Sin embargo, existe una brecha entre la investigación y la industria. La mayoría de los modelos de IA que resuelven problemas de comunicación no pueden implementarse en los dispositivos de comunicación actuales debido a sus altos requisitos de capacidad computacional. Los nuevos enfoques buscan reducir el tamaño de los modelos de DL a través de técnicas de cuantificación, cambiando el método tradicional de operaciones de una representación de punto flotante de 32 (o 64) a un punto fijo (generalmente pequeño). Sin embargo, no existe un método analítico para determinar el nivel de cuantificación que se puede utilizar para obtener el mejor equilibrio entre la reducción de costos computacionales y una precisión aceptable en un problema específico. En este trabajo, proponemos una metodología de análisis para determinar el grado de cuantificación en un modelo DNN para resolver el problema de AMR en un sistema de radio. Utilizamos el marco de trabajo Brevitas para construir y analizar diferentes variantes cuantizadas de la arquitectura de DL VGG10 adaptada al problema de AMR. La evaluación del costo computacional se realiza con el marco de trabajo FINN de Xilinx Research Labs para obtener el costo de inferencia computacional. La metodología de diseño propuesta nos permite obtener la combinación de bits de cuantificación por capa que proporciona un equilibrio óptimo entre el rendimiento del modelo (es decir, precisión) y la complejidad del modelo (es decir, tamaño) de acuerdo con un conjunto de pesos asociados con cada objetivo de optimización. Por ejemplo, utilizando la metodología propuesta, encontramos una arquitectura de modelo que redujo el 75.8% del tamaño del modelo en comparación con el modelo base no cuantizado, con una degradación del rendimiento de solo 0.06%.