Implementación paralela de detección de modulación de amplitud en cuadratura K-Best para sistemas masivos de entrada múltiple y salida múltiple
Autores: Gokalgandhi, Bhargav; Ling, Jonathan; Latinovi, Zoran; Samardzija, Dragan; Seskar, Ivan
Idioma: Inglés
Editor: MDPI
Año: 2024
Acceso abierto
Artículo científico
2024
Implementación paralela de detección de modulación de amplitud en cuadratura K-Best para sistemas masivos de entrada múltiple y salida múltiple
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Mimo masivo
Detección qam
Métodos de detección no lineales
Algoritmo k-best
Implementación de gpu
Consumo de energía
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 33
Citaciones: Sin citaciones
Los sistemas Massive MIMO (Múltiple Entrada Múltiple Salida) imponen cargas de procesamiento significativas junto con estrictos requisitos de latencia. La combinación de matrices de antenas a gran escala y amplios requisitos de ancho de banda para los sistemas inalámbricos de próxima generación crea un aumento exponencial en los datos de frontend a backend. Equilibrar la latencia de procesamiento y la confiabilidad es crítico para tareas de procesamiento de banda base como la detección QAM. Mientras que los algoritmos de detección lineal tienen baja complejidad computacional, su uso en escenarios Massive MIMO tiene una fuerte degradación en el rendimiento de errores. Los métodos de detección no lineal como Máxima Verosimilitud y Decodificación de Esfera tienen buen rendimiento de errores, pero sufren de una complejidad computacional alta, variable e incontrolable. Para tales casos, el algoritmo de detección QAM K-best puede proporcionar control requerido sobre el rendimiento del sistema manteniendo un rendimiento de errores cercano a ML. En este documento, la detección QAM K-best de salida dura, así como de salida suave, se implementa en una CPU utilizando los múltiples núcleos combinados con procesamiento vectorial. De manera similar, la detección de salida dura en una GPU se implementa aprovechando la arquitectura SIMD (Instrucción Única, Múltiples Datos) y el modelo de ejecución basado en Warps. Se comparan el tiempo de procesamiento por bit y el consumo de energía por bit para las implementaciones de CPU y GPU para densidades de constelación QAM y tamaños de matriz MIMO. La implementación de GPU muestra hasta 5 veces de mejora en la latencia de procesamiento por bit y hasta 120 veces de mejora en el consumo de energía por bit sobre la implementación de CPU para constelaciones QAM típicas como 4, 16 y 64 QAM. La implementación de GPU también muestra hasta 125 veces de mejora sobre la implementación de CPU en el consumo de energía por bit para configuraciones MIMO más grandes como 24 x 24 y 32 x 32. Finalmente, el detector de salida suave se combina con un decodificador LDPC (Comprobación de Paridad de Baja Densidad) para obtener el rendimiento FER (Tasa de Error de Trama) para la implementación de CPU. El FER se combina luego con la latencia de procesamiento de trama para formar una métrica que demuestra el equilibrio entre latencia y confiabilidad.
Descripción
Los sistemas Massive MIMO (Múltiple Entrada Múltiple Salida) imponen cargas de procesamiento significativas junto con estrictos requisitos de latencia. La combinación de matrices de antenas a gran escala y amplios requisitos de ancho de banda para los sistemas inalámbricos de próxima generación crea un aumento exponencial en los datos de frontend a backend. Equilibrar la latencia de procesamiento y la confiabilidad es crítico para tareas de procesamiento de banda base como la detección QAM. Mientras que los algoritmos de detección lineal tienen baja complejidad computacional, su uso en escenarios Massive MIMO tiene una fuerte degradación en el rendimiento de errores. Los métodos de detección no lineal como Máxima Verosimilitud y Decodificación de Esfera tienen buen rendimiento de errores, pero sufren de una complejidad computacional alta, variable e incontrolable. Para tales casos, el algoritmo de detección QAM K-best puede proporcionar control requerido sobre el rendimiento del sistema manteniendo un rendimiento de errores cercano a ML. En este documento, la detección QAM K-best de salida dura, así como de salida suave, se implementa en una CPU utilizando los múltiples núcleos combinados con procesamiento vectorial. De manera similar, la detección de salida dura en una GPU se implementa aprovechando la arquitectura SIMD (Instrucción Única, Múltiples Datos) y el modelo de ejecución basado en Warps. Se comparan el tiempo de procesamiento por bit y el consumo de energía por bit para las implementaciones de CPU y GPU para densidades de constelación QAM y tamaños de matriz MIMO. La implementación de GPU muestra hasta 5 veces de mejora en la latencia de procesamiento por bit y hasta 120 veces de mejora en el consumo de energía por bit sobre la implementación de CPU para constelaciones QAM típicas como 4, 16 y 64 QAM. La implementación de GPU también muestra hasta 125 veces de mejora sobre la implementación de CPU en el consumo de energía por bit para configuraciones MIMO más grandes como 24 x 24 y 32 x 32. Finalmente, el detector de salida suave se combina con un decodificador LDPC (Comprobación de Paridad de Baja Densidad) para obtener el rendimiento FER (Tasa de Error de Trama) para la implementación de CPU. El FER se combina luego con la latencia de procesamiento de trama para formar una métrica que demuestra el equilibrio entre latencia y confiabilidad.