logo móvil
Contáctanos

Mkgcn: red de convolución de gráficos de conocimiento multimodal para sistemas recomendadores de música

Autores: Cui, Xiaohui; Qu, Xiaolong; Li, Dongmei; Yang, Yu; Li, Yuxun; Zhang, Xiaoping

Idioma: Inglés

Editor: MDPI

Año: 2023

Descargar PDF

Acceso abierto

Artículo científico
2023

Mkgcn: red de convolución de gráficos de conocimiento multimodal para sistemas recomendadores de música


Categoría

Ingeniería y Tecnología

Subcategoría

Ingeniería Eléctrica y Electrónica

Palabras clave

Aparición
Plataformas de música en línea
Sistemas de recomendación
Grafos de conocimiento
Datos multimodales
Videos musicales

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 49

Citaciones: Sin citaciones


Descripción
Con la aparición de plataformas de música en línea, los sistemas recomendadores de música se están volviendo cada vez más cruciales en la recuperación de información musical. Los grafos de conocimiento (KGs) son una rica fuente de información semántica para entidades y relaciones, lo que permite mejorar el modelado y análisis de las relaciones de entidades para mejorar las recomendaciones. La investigación existente se ha centrado principalmente en el modelado y análisis de triples estructurales, mientras que ha ignorado en gran medida la representación y capacidades de procesamiento de información de datos multimodales como videos musicales y letras, lo que ha dificultado la mejora y la experiencia del usuario de los sistemas recomendadores de música. Para abordar estos problemas, proponemos una Red Convolucional de Grafos de Conocimiento Multimodal (MKGCN) para mejorar la recomendación musical aprovechando el conocimiento multimodal de los elementos musicales y su información estructural y semántica de alto orden. Específicamente, hay tres agregadores en MKGCN: el agregador multimodal que agrega las características de texto, imagen, audio y sentimiento de cada elemento musical en un grafo de conocimiento multimodal (MMKG); el agregador de usuario y el agregador de elemento utilizan redes convolucionales de grafos para agregar nodos vecinos de múltiples saltos en MMKGs para modelar representaciones de alto orden de las preferencias de los usuarios y elementos musicales, respectivamente. Finalmente, utilizamos las representaciones de incrustación agregadas para la recomendación. En el entrenamiento de MKGCN, adoptamos la estrategia de muestreo negativo de proporción para generar muestras negativas de alta calidad. Construimos cuatro MMKGs musicales de diferentes tamaños utilizando el conjunto de datos público Last-FM y realizamos experimentos extensos en ellos. Los resultados experimentales demuestran que MKGCN logra mejoras significativas y supera a varios baselines de vanguardia.

Otros recursos que podrían interesarte

Temas Virtualpro