Un modelo de recomendación de lista de aprendizaje por refuerzo fusionado con redes neuronales gráficas
Autores: Lv, Zhongming; Tong, Xiangrong
Idioma: Inglés
Editor: MDPI
Año: 2023
Acceso abierto
Artículo científico
2023
Un modelo de recomendación de lista de aprendizaje por refuerzo fusionado con redes neuronales gráficas
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Métodos de recomendación de listas
Recomendación de retroalimentación
Solicitudes de usuario
Red neuronal gráfica
Aprendizaje por refuerzo
Entrenamiento de extremo a extremo.
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 33
Citaciones: Sin citaciones
Los métodos tradicionales de recomendación de listas presentan una lista que consiste en múltiples elementos para la recomendación de retroalimentación a las solicitudes de los usuarios, lo que tiene ventajas de alta flexibilidad y retroalimentación directa del usuario. Sin embargo, la representación estructurada de datos de estado limita la incrustación de usuarios y elementos, haciéndolos aislados entre sí, perdiendo así alguna información útil para la recomendación. Además, las series de aprendizaje no de extremo a extremo tradicionales tardan mucho tiempo y acumulan errores. Durante el proceso de entrenamiento del modelo, los resultados de cada tarea pueden afectar fácilmente el cálculo siguiente, afectando así el efecto de entrenamiento completo. Con el objetivo de abordar los problemas mencionados, este artículo propone un Modelo de Recomendación de Listas de Aprendizaje por Refuerzo Fusionado con una Red Neural de Grafos, GNLR. El objetivo de este modelo es maximizar el efecto de recomendación mientras asegura que el sistema de recomendación de listas analice con precisión las preferencias de los usuarios para mejorar la experiencia del usuario. Para lograr esto, en primer lugar, utilizamos un grafo bipartito de usuario-elemento y una Red Neural de Grafos para agregar información del vecindario para usuarios y elementos y generar una representación estructurada de grafo; en segundo lugar, adoptamos un mecanismo de atención para asignar pesos correspondientes a la información del vecindario para reducir la influencia de nodos de ruido en redes de información heterogéneas; finalmente, aliviamos los problemas de los métodos tradicionales no de extremo a extremo a través de métodos de entrenamiento de extremo a extremo. Los resultados experimentales muestran que el método propuesto en este artículo puede aliviar los problemas mencionados, y la tasa de acierto de la recomendación y la tasa de precisión aumentan aproximadamente un 10%.
Descripción
Los métodos tradicionales de recomendación de listas presentan una lista que consiste en múltiples elementos para la recomendación de retroalimentación a las solicitudes de los usuarios, lo que tiene ventajas de alta flexibilidad y retroalimentación directa del usuario. Sin embargo, la representación estructurada de datos de estado limita la incrustación de usuarios y elementos, haciéndolos aislados entre sí, perdiendo así alguna información útil para la recomendación. Además, las series de aprendizaje no de extremo a extremo tradicionales tardan mucho tiempo y acumulan errores. Durante el proceso de entrenamiento del modelo, los resultados de cada tarea pueden afectar fácilmente el cálculo siguiente, afectando así el efecto de entrenamiento completo. Con el objetivo de abordar los problemas mencionados, este artículo propone un Modelo de Recomendación de Listas de Aprendizaje por Refuerzo Fusionado con una Red Neural de Grafos, GNLR. El objetivo de este modelo es maximizar el efecto de recomendación mientras asegura que el sistema de recomendación de listas analice con precisión las preferencias de los usuarios para mejorar la experiencia del usuario. Para lograr esto, en primer lugar, utilizamos un grafo bipartito de usuario-elemento y una Red Neural de Grafos para agregar información del vecindario para usuarios y elementos y generar una representación estructurada de grafo; en segundo lugar, adoptamos un mecanismo de atención para asignar pesos correspondientes a la información del vecindario para reducir la influencia de nodos de ruido en redes de información heterogéneas; finalmente, aliviamos los problemas de los métodos tradicionales no de extremo a extremo a través de métodos de entrenamiento de extremo a extremo. Los resultados experimentales muestran que el método propuesto en este artículo puede aliviar los problemas mencionados, y la tasa de acierto de la recomendación y la tasa de precisión aumentan aproximadamente un 10%.