Mkgcn: red de convolución de gráficos de conocimiento multimodal para sistemas recomendadores de música
Autores: Cui, Xiaohui; Qu, Xiaolong; Li, Dongmei; Yang, Yu; Li, Yuxun; Zhang, Xiaoping
Idioma: Inglés
Editor: MDPI
Año: 2023
Acceso abierto
Artículo científico
2023
Mkgcn: red de convolución de gráficos de conocimiento multimodal para sistemas recomendadores de música
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Aparición
Plataformas de música en línea
Sistemas de recomendación
Grafos de conocimiento
Datos multimodales
Videos musicales
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 49
Citaciones: Sin citaciones
Con la aparición de plataformas de música en línea, los sistemas recomendadores de música se están volviendo cada vez más cruciales en la recuperación de información musical. Los grafos de conocimiento (KGs) son una rica fuente de información semántica para entidades y relaciones, lo que permite mejorar el modelado y análisis de las relaciones de entidades para mejorar las recomendaciones. La investigación existente se ha centrado principalmente en el modelado y análisis de triples estructurales, mientras que ha ignorado en gran medida la representación y capacidades de procesamiento de información de datos multimodales como videos musicales y letras, lo que ha dificultado la mejora y la experiencia del usuario de los sistemas recomendadores de música. Para abordar estos problemas, proponemos una Red Convolucional de Grafos de Conocimiento Multimodal (MKGCN) para mejorar la recomendación musical aprovechando el conocimiento multimodal de los elementos musicales y su información estructural y semántica de alto orden. Específicamente, hay tres agregadores en MKGCN: el agregador multimodal que agrega las características de texto, imagen, audio y sentimiento de cada elemento musical en un grafo de conocimiento multimodal (MMKG); el agregador de usuario y el agregador de elemento utilizan redes convolucionales de grafos para agregar nodos vecinos de múltiples saltos en MMKGs para modelar representaciones de alto orden de las preferencias de los usuarios y elementos musicales, respectivamente. Finalmente, utilizamos las representaciones de incrustación agregadas para la recomendación. En el entrenamiento de MKGCN, adoptamos la estrategia de muestreo negativo de proporción para generar muestras negativas de alta calidad. Construimos cuatro MMKGs musicales de diferentes tamaños utilizando el conjunto de datos público Last-FM y realizamos experimentos extensos en ellos. Los resultados experimentales demuestran que MKGCN logra mejoras significativas y supera a varios baselines de vanguardia.
Descripción
Con la aparición de plataformas de música en línea, los sistemas recomendadores de música se están volviendo cada vez más cruciales en la recuperación de información musical. Los grafos de conocimiento (KGs) son una rica fuente de información semántica para entidades y relaciones, lo que permite mejorar el modelado y análisis de las relaciones de entidades para mejorar las recomendaciones. La investigación existente se ha centrado principalmente en el modelado y análisis de triples estructurales, mientras que ha ignorado en gran medida la representación y capacidades de procesamiento de información de datos multimodales como videos musicales y letras, lo que ha dificultado la mejora y la experiencia del usuario de los sistemas recomendadores de música. Para abordar estos problemas, proponemos una Red Convolucional de Grafos de Conocimiento Multimodal (MKGCN) para mejorar la recomendación musical aprovechando el conocimiento multimodal de los elementos musicales y su información estructural y semántica de alto orden. Específicamente, hay tres agregadores en MKGCN: el agregador multimodal que agrega las características de texto, imagen, audio y sentimiento de cada elemento musical en un grafo de conocimiento multimodal (MMKG); el agregador de usuario y el agregador de elemento utilizan redes convolucionales de grafos para agregar nodos vecinos de múltiples saltos en MMKGs para modelar representaciones de alto orden de las preferencias de los usuarios y elementos musicales, respectivamente. Finalmente, utilizamos las representaciones de incrustación agregadas para la recomendación. En el entrenamiento de MKGCN, adoptamos la estrategia de muestreo negativo de proporción para generar muestras negativas de alta calidad. Construimos cuatro MMKGs musicales de diferentes tamaños utilizando el conjunto de datos público Last-FM y realizamos experimentos extensos en ellos. Los resultados experimentales demuestran que MKGCN logra mejoras significativas y supera a varios baselines de vanguardia.