Recomendación de recetas multimodal con redes neuronales gráficas heterogéneas
Autores: Ouyang, Ruiqi; Huang, Haodong; Ou, Weihua; Liu, Qilong
Idioma: Inglés
Editor: MDPI
Año: 2024
Acceso abierto
Artículo científico
2024
Recomendación de recetas multimodal con redes neuronales gráficas heterogéneas
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Recomendación de recetas
Modalidades
Multimodal
Red Neuronal Gráfica
Preferencias del usuario
Necesidades dietéticas
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 33
Citaciones: Sin citaciones
La recomendación de recetas es el proceso de recomendar recetas adecuadas a los usuarios en función de factores como las preferencias del usuario y las necesidades dietéticas. Las recetas suelen implicar múltiples modalidades, siendo comunes el texto y las imágenes, mientras que la mayoría de los métodos típicos de recomendación de recetas recomiendan recetas a los usuarios basándose en texto. Obviamente, la expresividad de una sola modalidad a menudo no es suficiente, y la información semántica de las imágenes es más abundante. Además, es difícil captar la granularidad de fusión de características de diferentes tipos de información modal y la relación entre recetas y usuarios. Para resolver el problema anterior, este artículo propone una arquitectura de Recomendación de Recetas de Red Neuronal Gráfica Heterogénea Multimodal (MHGRR), que tiene como objetivo fusionar completamente los diversos tipos de información modal de recetas y manejar la relación entre usuarios y recetas. Utilizamos incrustaciones y redes neuronales convolucionales poco profundas (CNN) para extraer información original de texto e imagen para fusionar la granularidad de características de manera unificada, y utilizamos Redes Neuronales de Gráficos Heterogéneos basadas en GraphSAGE para capturar la compleja relación entre usuarios y recetas. Para verificar la efectividad de nuestro modelo propuesto, realizamos algunos experimentos comparativos en un conjunto de datos reales; los experimentos muestran que nuestro método supera a la mayoría de los métodos populares de recomendación de recetas. A través de un experimento de ablación, descubrimos que agregar información de imagen a la recomendación de recetas es más efectivo, y adicionalmente encontramos que a medida que aumentaban las dimensiones de salida de GraphSAGE, el rendimiento del modelo variaba poco.
Descripción
La recomendación de recetas es el proceso de recomendar recetas adecuadas a los usuarios en función de factores como las preferencias del usuario y las necesidades dietéticas. Las recetas suelen implicar múltiples modalidades, siendo comunes el texto y las imágenes, mientras que la mayoría de los métodos típicos de recomendación de recetas recomiendan recetas a los usuarios basándose en texto. Obviamente, la expresividad de una sola modalidad a menudo no es suficiente, y la información semántica de las imágenes es más abundante. Además, es difícil captar la granularidad de fusión de características de diferentes tipos de información modal y la relación entre recetas y usuarios. Para resolver el problema anterior, este artículo propone una arquitectura de Recomendación de Recetas de Red Neuronal Gráfica Heterogénea Multimodal (MHGRR), que tiene como objetivo fusionar completamente los diversos tipos de información modal de recetas y manejar la relación entre usuarios y recetas. Utilizamos incrustaciones y redes neuronales convolucionales poco profundas (CNN) para extraer información original de texto e imagen para fusionar la granularidad de características de manera unificada, y utilizamos Redes Neuronales de Gráficos Heterogéneos basadas en GraphSAGE para capturar la compleja relación entre usuarios y recetas. Para verificar la efectividad de nuestro modelo propuesto, realizamos algunos experimentos comparativos en un conjunto de datos reales; los experimentos muestran que nuestro método supera a la mayoría de los métodos populares de recomendación de recetas. A través de un experimento de ablación, descubrimos que agregar información de imagen a la recomendación de recetas es más efectivo, y adicionalmente encontramos que a medida que aumentaban las dimensiones de salida de GraphSAGE, el rendimiento del modelo variaba poco.