Un algoritmo para enriquecimiento de densidad de conjuntos de datos de filtrado colaborativo escasos utilizando predicciones robustas como calificaciones derivadas
Autores: Margaris, Dionisis; Spiliotopoulos, Dimitris; Karagiorgos, Gregory; Vassilakis, Costas
Idioma: Inglés
Editor: MDPI
Año: 2020
Acceso abierto
Artículo científico
2020
Un algoritmo para enriquecimiento de densidad de conjuntos de datos de filtrado colaborativo escasos utilizando predicciones robustas como calificaciones derivadas
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería de Software
Palabras clave
Algoritmos de filtrado colaborativo
Recomendaciones personalizadas
Conjuntos de datos dispersos
Vecinos cercanos
Predicciones robustas
Precisión
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 27
Citaciones: Sin citaciones
Los algoritmos de filtrado colaborativo formulan recomendaciones personalizadas para un usuario, primero analizando las calificaciones ya ingresadas para identificar otros usuarios con gustos similares al usuario (llamados vecinos cercanos), y luego utilizando las opiniones de los vecinos cercanos para predecir qué elementos le gustarían al usuario objetivo. Sin embargo, en conjuntos de datos dispersos, se pueden identificar muy pocos vecinos cercanos, lo que resulta en predicciones de baja precisión e incluso en una incapacidad total para formular predicciones personalizadas. Este artículo aborda el problema de la dispersión al presentar un algoritmo que utiliza predicciones robustas, es decir, predicciones consideradas altamente probables de ser precisas, como calificaciones derivadas. De esta manera, la densidad de los conjuntos de datos dispersos aumenta y se logra una cobertura de predicción de calificaciones mejorada y una mayor precisión. El algoritmo propuesto, denominado CF, se evalúa exhaustivamente utilizando (1) siete conjuntos de datos de filtrado colaborativo ampliamente utilizados, (2) las dos métricas de correlación más utilizadas en la investigación de filtrado colaborativo, a saber, el coeficiente de correlación de Pearson y la similitud del coseno, y (3) las dos métricas de error más utilizadas en el filtrado colaborativo, a saber, el error absoluto medio y el error cuadrático medio. Los resultados de la evaluación muestran que, al aumentar con éxito la densidad de los conjuntos de datos, la capacidad de los sistemas de filtrado colaborativo para formular recomendaciones precisas y personalizadas mejora considerablemente.
Descripción
Los algoritmos de filtrado colaborativo formulan recomendaciones personalizadas para un usuario, primero analizando las calificaciones ya ingresadas para identificar otros usuarios con gustos similares al usuario (llamados vecinos cercanos), y luego utilizando las opiniones de los vecinos cercanos para predecir qué elementos le gustarían al usuario objetivo. Sin embargo, en conjuntos de datos dispersos, se pueden identificar muy pocos vecinos cercanos, lo que resulta en predicciones de baja precisión e incluso en una incapacidad total para formular predicciones personalizadas. Este artículo aborda el problema de la dispersión al presentar un algoritmo que utiliza predicciones robustas, es decir, predicciones consideradas altamente probables de ser precisas, como calificaciones derivadas. De esta manera, la densidad de los conjuntos de datos dispersos aumenta y se logra una cobertura de predicción de calificaciones mejorada y una mayor precisión. El algoritmo propuesto, denominado CF, se evalúa exhaustivamente utilizando (1) siete conjuntos de datos de filtrado colaborativo ampliamente utilizados, (2) las dos métricas de correlación más utilizadas en la investigación de filtrado colaborativo, a saber, el coeficiente de correlación de Pearson y la similitud del coseno, y (3) las dos métricas de error más utilizadas en el filtrado colaborativo, a saber, el error absoluto medio y el error cuadrático medio. Los resultados de la evaluación muestran que, al aumentar con éxito la densidad de los conjuntos de datos, la capacidad de los sistemas de filtrado colaborativo para formular recomendaciones precisas y personalizadas mejora considerablemente.