Mejorando el análisis de sentimientos a través de la submuestreo aleatorio mayoritario con complejidad temporal reducida para clasificar reseñas de tweets
Autores: Almuayqil, Saleh Naif; Humayun, Mamoona; Jhanjhi, N. Z.; Almufareh, Maram Fahaad; Khan, Navid Ali
Idioma: Inglés
Editor: MDPI
Año: 2022
Acceso abierto
Artículo científico
2022
Mejorando el análisis de sentimientos a través de la submuestreo aleatorio mayoritario con complejidad temporal reducida para clasificar reseñas de tweets
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Twitter
Análisis de sentimientos
Modelos de aprendizaje automático
Conjuntos de datos desequilibrados
Complejidad temporal
Técnicas de preprocesamiento de texto
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 25
Citaciones: Sin citaciones
Twitter se ha convertido en una plataforma única para la interacción social de personas de todo el mundo, lo que lleva a una cantidad extensa de conocimiento que puede ser utilizado para diversas razones. La gente comparte y difunde sus propias ideologías y puntos de vista sobre temas únicos, lo que conduce a la producción de mucho contenido. El análisis de sentimientos es de extrema importancia para varias empresas, ya que puede impactar directamente en sus decisiones importantes. Varios desafíos relacionados con el tema de investigación del análisis de sentimientos incluyen problemas como conjuntos de datos desequilibrados, singularidad léxica y complejidad en el tiempo de procesamiento. La mayoría de los modelos de aprendizaje automático son secuenciales: necesitan una cantidad considerable de tiempo para completar la ejecución. Por lo tanto, proponemos un modelo de análisis de sentimientos específicamente diseñado para conjuntos de datos desequilibrados que puede reducir la complejidad temporal de la tarea mediante el uso de diversas técnicas de preprocesamiento de secuencias de texto combinadas con submuestreo aleatorio de la mayoría. Nuestro modelo propuesto proporciona resultados competitivos en comparación con otros modelos, al mismo tiempo que reduce la complejidad temporal para el análisis de sentimientos. Los resultados obtenidos después de la experimentación corroboran que nuestro modelo proporciona excelentes resultados produciendo una precisión del 86.5% y una puntuación F1 de 0.874 a través de XGB.
Descripción
Twitter se ha convertido en una plataforma única para la interacción social de personas de todo el mundo, lo que lleva a una cantidad extensa de conocimiento que puede ser utilizado para diversas razones. La gente comparte y difunde sus propias ideologías y puntos de vista sobre temas únicos, lo que conduce a la producción de mucho contenido. El análisis de sentimientos es de extrema importancia para varias empresas, ya que puede impactar directamente en sus decisiones importantes. Varios desafíos relacionados con el tema de investigación del análisis de sentimientos incluyen problemas como conjuntos de datos desequilibrados, singularidad léxica y complejidad en el tiempo de procesamiento. La mayoría de los modelos de aprendizaje automático son secuenciales: necesitan una cantidad considerable de tiempo para completar la ejecución. Por lo tanto, proponemos un modelo de análisis de sentimientos específicamente diseñado para conjuntos de datos desequilibrados que puede reducir la complejidad temporal de la tarea mediante el uso de diversas técnicas de preprocesamiento de secuencias de texto combinadas con submuestreo aleatorio de la mayoría. Nuestro modelo propuesto proporciona resultados competitivos en comparación con otros modelos, al mismo tiempo que reduce la complejidad temporal para el análisis de sentimientos. Los resultados obtenidos después de la experimentación corroboran que nuestro modelo proporciona excelentes resultados produciendo una precisión del 86.5% y una puntuación F1 de 0.874 a través de XGB.