AbFTNet: un eficiente red transformadora con alineación antes de la fusión para el reconocimiento automático multimodal de modulación
Autores: Ning, Meng; Zhou, Fan; Wang, Wei; Wang, Shaoqiang; Zhang, Peiying; Wang, Jian
Idioma: Inglés
Editor: MDPI
Año: 2024
Acceso abierto
Artículo científico
2024
AbFTNet: un eficiente red transformadora con alineación antes de la fusión para el reconocimiento automático multimodal de modulación
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Multimodal
Fusión
Características
Intensidad de la información
Modalidades
Eficiencia
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 43
Citaciones: Sin citaciones
El reconocimiento automático de modulación multimodal (MAMR) ha surgido como un área de investigación prominente. La fusión efectiva de características de diferentes modalidades es crucial para las tareas de MAMR. Un mecanismo de fusión multimodal efectivo debería maximizar la extracción e integración de información complementaria. Recientemente, los métodos de fusión basados en atención cruzada han mostrado un alto rendimiento. Sin embargo, pasan por alto las diferencias en la intensidad de la información entre diferentes modalidades, sufriendo de complejidad cuadrática.
Descripción
El reconocimiento automático de modulación multimodal (MAMR) ha surgido como un área de investigación prominente. La fusión efectiva de características de diferentes modalidades es crucial para las tareas de MAMR. Un mecanismo de fusión multimodal efectivo debería maximizar la extracción e integración de información complementaria. Recientemente, los métodos de fusión basados en atención cruzada han mostrado un alto rendimiento. Sin embargo, pasan por alto las diferencias en la intensidad de la información entre diferentes modalidades, sufriendo de complejidad cuadrática.