Metodología para analizar el rendimiento de los algoritmos tradicionales de reseñas de usuarios utilizando técnicas de aprendizaje automático
Autores: Karim, Abdul; Azhari, Azhari; Belhaouri, Samir Brahim; Qureshi, Ali Adil; Ahmad, Maqsood
Idioma: Inglés
Editor: MDPI
Año: 2020
Acceso abierto
Artículo científico
2020
Metodología para analizar el rendimiento de los algoritmos tradicionales de reseñas de usuarios utilizando técnicas de aprendizaje automático
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería de Software
Palabras clave
Aplicaciones basadas en Android
Internet
Tienda de Google Play
Opiniones de los usuarios
Algoritmos de aprendizaje automático
Regresión logística
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 27
Citaciones: Sin citaciones
Las aplicaciones basadas en Android son ampliamente utilizadas por casi todos en todo el mundo. Debido a la disponibilidad de Internet casi en todas partes sin cargo, casi la mitad del mundo está involucrada en redes sociales, navegación en redes sociales, mensajería, navegación y complementos. En la tienda Google Play Store, que es una de las tiendas de aplicaciones de Internet más populares, se anima a los usuarios a descargar miles de aplicaciones y varios tipos de software. En este estudio de investigación, hemos recopilado miles de reseñas de usuarios y las calificaciones de diferentes aplicaciones. Recopilamos 148 reseñas de aplicaciones de 14 categorías diferentes. Se acumularon y evaluaron un total de 506,259 reseñas. Basándonos en la semántica de las reseñas de las aplicaciones, los resultados de las reseñas se clasificaron como negativos, positivos o neutrales. En esta investigación, se ajustaron y probaron diferentes algoritmos de aprendizaje automático como regresión logística, bosque aleatorio y Bayes ingenuo. También evaluamos el resultado de la frecuencia de términos (TF) y la frecuencia inversa de documentos (IDF), medimos diferentes parámetros como precisión, recuperación y puntuación F1 y presentamos los resultados en forma de gráfico de barras. En conclusión, comparamos el resultado de cada algoritmo y encontramos que la regresión logística es uno de los mejores algoritmos para el análisis de reseñas de la Google Play Store desde una perspectiva de precisión. Además, pudimos demostrar que la regresión logística es mejor en términos de velocidad, tasa de precisión, recuperación y perspectiva F1. Esta conclusión se logró después de preprocesar una serie de valores de datos de estos conjuntos de datos.
Descripción
Las aplicaciones basadas en Android son ampliamente utilizadas por casi todos en todo el mundo. Debido a la disponibilidad de Internet casi en todas partes sin cargo, casi la mitad del mundo está involucrada en redes sociales, navegación en redes sociales, mensajería, navegación y complementos. En la tienda Google Play Store, que es una de las tiendas de aplicaciones de Internet más populares, se anima a los usuarios a descargar miles de aplicaciones y varios tipos de software. En este estudio de investigación, hemos recopilado miles de reseñas de usuarios y las calificaciones de diferentes aplicaciones. Recopilamos 148 reseñas de aplicaciones de 14 categorías diferentes. Se acumularon y evaluaron un total de 506,259 reseñas. Basándonos en la semántica de las reseñas de las aplicaciones, los resultados de las reseñas se clasificaron como negativos, positivos o neutrales. En esta investigación, se ajustaron y probaron diferentes algoritmos de aprendizaje automático como regresión logística, bosque aleatorio y Bayes ingenuo. También evaluamos el resultado de la frecuencia de términos (TF) y la frecuencia inversa de documentos (IDF), medimos diferentes parámetros como precisión, recuperación y puntuación F1 y presentamos los resultados en forma de gráfico de barras. En conclusión, comparamos el resultado de cada algoritmo y encontramos que la regresión logística es uno de los mejores algoritmos para el análisis de reseñas de la Google Play Store desde una perspectiva de precisión. Además, pudimos demostrar que la regresión logística es mejor en términos de velocidad, tasa de precisión, recuperación y perspectiva F1. Esta conclusión se logró después de preprocesar una serie de valores de datos de estos conjuntos de datos.