Marco para mejorar el análisis de sentimientos a través de Random Minority Oversampling para la clasificación de reseñas de tweets de usuarios
Autores: Almuayqil, Saleh Naif; Humayun, Mamoona; Jhanjhi, N. Z.; Almufareh, Maram Fahaad; Javed, Danish
Idioma: Inglés
Editor: MDPI
Año: 2022
Acceso abierto
Artículo científico
2022
Marco para mejorar el análisis de sentimientos a través de Random Minority Oversampling para la clasificación de reseñas de tweets de usuarios
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Redes sociales
Análisis de sentimientos
Aprendizaje automático
Datos desequilibrados
Remuestreo
Clasificación
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 24
Citaciones: Sin citaciones
Las redes sociales como Twitter han surgido como plataformas sociales que pueden proporcionar una base de conocimiento masiva para que las personas compartan sus ideas y perspectivas únicas sobre varios temas y problemas con amigos y familiares. El análisis de sentimientos basado en aprendizaje automático ha tenido éxito en descubrir la opinión de las personas utilizando datos redundantes disponibles. Sin embargo, estudios recientes han señalado que los datos desequilibrados pueden tener un impacto negativo en los resultados. En este documento, proponemos un marco para mejorar el análisis de sentimientos a través de varios pasos de preprocesamiento ordenados con la combinación de remuestreo de clases minoritarias para producir un mejor rendimiento. El rendimiento de la técnica puede variar dependiendo del conjunto de datos, ya que su enfoque inicial está en la selección y combinación de características. Se utilizan múltiples algoritmos de aprendizaje automático para la clasificación de tweets en positivos, negativos o neutrales. Los resultados han revelado que el sobremuestreo aleatorio de minorías puede proporcionar un rendimiento mejorado y puede abordar el problema del desequilibrio de clases.
Descripción
Las redes sociales como Twitter han surgido como plataformas sociales que pueden proporcionar una base de conocimiento masiva para que las personas compartan sus ideas y perspectivas únicas sobre varios temas y problemas con amigos y familiares. El análisis de sentimientos basado en aprendizaje automático ha tenido éxito en descubrir la opinión de las personas utilizando datos redundantes disponibles. Sin embargo, estudios recientes han señalado que los datos desequilibrados pueden tener un impacto negativo en los resultados. En este documento, proponemos un marco para mejorar el análisis de sentimientos a través de varios pasos de preprocesamiento ordenados con la combinación de remuestreo de clases minoritarias para producir un mejor rendimiento. El rendimiento de la técnica puede variar dependiendo del conjunto de datos, ya que su enfoque inicial está en la selección y combinación de características. Se utilizan múltiples algoritmos de aprendizaje automático para la clasificación de tweets en positivos, negativos o neutrales. Los resultados han revelado que el sobremuestreo aleatorio de minorías puede proporcionar un rendimiento mejorado y puede abordar el problema del desequilibrio de clases.