Sistema de Recomendación Multimodal Basado en Fusión de Autoatención Cruzada
Autores: Li, Peishan; Zhan, Weixiao; Gao, Lutao; Wang, Shuran; Yang, Linnan
Idioma: Inglés
Editor: MDPI
Año: 2025
Acceso abierto
Artículo científico
2025
Sistema de Recomendación Multimodal Basado en Fusión de Autoatención Cruzada
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería de Sistemas
Palabras clave
Avances
Redes neuronales gráficas
Sistemas de recomendación multimodal
MR-CSAF
Fusión de atención cruzada
Recomendaciones personalizadas
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 18
Citaciones: Sin citaciones
Los avances recientes en redes neuronales de grafos (GNNs) han mejorado la capacidad de los sistemas de recomendación multimodal para procesar interacciones complejas entre usuarios y productos. Sin embargo, los enfoques actuales enfrentan dos limitaciones clave: dependen de métricas de similitud estáticas para los grafos de relaciones de productos y tienen dificultades para fusionar efectivamente la información a través de modalidades. Proponemos MR-CSAF, un nuevo algoritmo de recomendación multimodal que utiliza fusión de atención cruzada. Basándonos en FREEDOM, nuestro enfoque introduce un selector de modalidad adaptativo que pondera dinámicamente la contribución de cada modalidad a la similitud del producto, lo que permite grafos de relaciones de productos más precisos y representaciones de modalidades optimizadas. Empleamos un mecanismo de atención cruzada para facilitar tanto la transferencia de información intermodal como intramodal, mientras utilizamos la convolución de grafos para incorporar características actualizadas en las representaciones de modalidades de ítems y productos. Los resultados experimentales en tres conjuntos de datos públicos demuestran que MR-CSAF supera a ocho métodos de referencia, validando su efectividad en la provisión de recomendaciones personalizadas y avanzando en el campo de la recomendación personalizada en entornos multimodales complejos.
Descripción
Los avances recientes en redes neuronales de grafos (GNNs) han mejorado la capacidad de los sistemas de recomendación multimodal para procesar interacciones complejas entre usuarios y productos. Sin embargo, los enfoques actuales enfrentan dos limitaciones clave: dependen de métricas de similitud estáticas para los grafos de relaciones de productos y tienen dificultades para fusionar efectivamente la información a través de modalidades. Proponemos MR-CSAF, un nuevo algoritmo de recomendación multimodal que utiliza fusión de atención cruzada. Basándonos en FREEDOM, nuestro enfoque introduce un selector de modalidad adaptativo que pondera dinámicamente la contribución de cada modalidad a la similitud del producto, lo que permite grafos de relaciones de productos más precisos y representaciones de modalidades optimizadas. Empleamos un mecanismo de atención cruzada para facilitar tanto la transferencia de información intermodal como intramodal, mientras utilizamos la convolución de grafos para incorporar características actualizadas en las representaciones de modalidades de ítems y productos. Los resultados experimentales en tres conjuntos de datos públicos demuestran que MR-CSAF supera a ocho métodos de referencia, validando su efectividad en la provisión de recomendaciones personalizadas y avanzando en el campo de la recomendación personalizada en entornos multimodales complejos.