Sistema de Recomendación Recíproco Explicable para la Coincidencia Afiliado-Vendedor: Un Enfoque de Aprendizaje Profundo en Dos Etapas
Autores: Almutairi, Hanadi; Ykhlef, Mourad
Idioma: Inglés
Editor: MDPI
Año: 2026
Acceso abierto
Artículo científico
2026
Sistema de Recomendación Recíproco Explicable para la Coincidencia Afiliado-Vendedor: Un Enfoque de Aprendizaje Profundo en Dos Etapas
Categoría
Gestión y administración
Subcategoría
Gestión de la tecnología y la inovación
Palabras clave
Sistema de recomendación
Aprendizaje automático
Ciencia de datos
Listas de clasificación personalizadas
Modelo de aprendizaje de representación
Enfoque de aprendizaje para clasificar
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
Este documento presenta un sistema de recomendación explicable en dos etapas para la coincidencia recíproca entre afiliados y vendedores que utiliza aprendizaje automático y ciencia de datos para manejar grandes volúmenes de datos y generar listas de clasificación personalizadas para cada usuario. En la primera etapa, se entrenó un modelo de aprendizaje de representación para crear incrustaciones densas para afiliados y vendedores, asegurando una identificación eficiente de pares relevantes. En la segunda etapa, se aplicó un enfoque de aprendizaje para clasificar para refinar la lista de recomendaciones en función de la idoneidad y relevancia del usuario. También se implementaron técnicas de reordenamiento que mejoran la diversidad (relevancia marginal máxima/diversificación de aspectos de consulta explícitos) y se aplicaron penalizaciones por popularidad, cuantificando sus efectos en la precisión y diversidad del lado del proveedor. Se utilizaron técnicas de interpretabilidad del modelo para identificar qué características afectan una recomendación. El sistema se evaluó en un conjunto de datos completamente sintético que imita las estadísticas de alto nivel generadas por plataformas de afiliados, y los resultados se compararon con líneas base clásicas (ALS, clasificación personalizada bayesiana) y variantes abladas del modelo propuesto. Si bien las métricas de clasificación reportadas (por ejemplo, ganancia acumulativa descontada normalizada a 10 (NDCG@10)) están cerca de 1.0 en condiciones controladas, se abordan el potencial sobreajuste, las limitaciones de los datos sintéticos y la necesidad de una validación adicional en conjuntos de datos del mundo real. Las atribuciones basadas en explicaciones aditivas de Shapley se calcularon fuera de línea para el modelo de clasificación y se excluyeron del presupuesto de latencia en línea, que estuvo dominado por la recuperación basada en vecinos más cercanos aproximados y la clasificación por lista. Nuestro trabajo demuestra que una alta precisión en el top-K, el reordenamiento consciente de la diversidad y la explicabilidad post hoc pueden integrarse dentro de un único pipeline de recomendación. Si bien se validó inicialmente bajo evaluación sintética, el pipeline se evaluó además en un conjunto de datos de comportamiento real público, destacando los desafíos de implementación en plataformas de afiliados y vendedores y revelando limitaciones prácticas relacionadas con metadatos incompletos.
Descripción
Este documento presenta un sistema de recomendación explicable en dos etapas para la coincidencia recíproca entre afiliados y vendedores que utiliza aprendizaje automático y ciencia de datos para manejar grandes volúmenes de datos y generar listas de clasificación personalizadas para cada usuario. En la primera etapa, se entrenó un modelo de aprendizaje de representación para crear incrustaciones densas para afiliados y vendedores, asegurando una identificación eficiente de pares relevantes. En la segunda etapa, se aplicó un enfoque de aprendizaje para clasificar para refinar la lista de recomendaciones en función de la idoneidad y relevancia del usuario. También se implementaron técnicas de reordenamiento que mejoran la diversidad (relevancia marginal máxima/diversificación de aspectos de consulta explícitos) y se aplicaron penalizaciones por popularidad, cuantificando sus efectos en la precisión y diversidad del lado del proveedor. Se utilizaron técnicas de interpretabilidad del modelo para identificar qué características afectan una recomendación. El sistema se evaluó en un conjunto de datos completamente sintético que imita las estadísticas de alto nivel generadas por plataformas de afiliados, y los resultados se compararon con líneas base clásicas (ALS, clasificación personalizada bayesiana) y variantes abladas del modelo propuesto. Si bien las métricas de clasificación reportadas (por ejemplo, ganancia acumulativa descontada normalizada a 10 (NDCG@10)) están cerca de 1.0 en condiciones controladas, se abordan el potencial sobreajuste, las limitaciones de los datos sintéticos y la necesidad de una validación adicional en conjuntos de datos del mundo real. Las atribuciones basadas en explicaciones aditivas de Shapley se calcularon fuera de línea para el modelo de clasificación y se excluyeron del presupuesto de latencia en línea, que estuvo dominado por la recuperación basada en vecinos más cercanos aproximados y la clasificación por lista. Nuestro trabajo demuestra que una alta precisión en el top-K, el reordenamiento consciente de la diversidad y la explicabilidad post hoc pueden integrarse dentro de un único pipeline de recomendación. Si bien se validó inicialmente bajo evaluación sintética, el pipeline se evaluó además en un conjunto de datos de comportamiento real público, destacando los desafíos de implementación en plataformas de afiliados y vendedores y revelando limitaciones prácticas relacionadas con metadatos incompletos.