logo móvil
Contáctanos

Un enfoque novedoso para la detección de emociones y análisis de sentimientos para el idioma urdu de recursos limitados basado en CNN-LSTM

Autores: Ullah, Farhat; Chen, Xin; Shah, Syed Bilal Hussain; Mahfoudh, Saoucene; Hassan, Muhammad Abul; Saeed, Nagham

Idioma: Inglés

Editor: MDPI

Año: 2022

Descargar PDF

Acceso abierto

Artículo científico
2022

Un enfoque novedoso para la detección de emociones y análisis de sentimientos para el idioma urdu de recursos limitados basado en CNN-LSTM


Categoría

Ingeniería y Tecnología

Subcategoría

Ingeniería Eléctrica y Electrónica

Palabras clave

Detección de emociones
Análisis de sentimientos
Urdu romano
Corpus
Procesamiento de lenguaje natural
Cnn-lstm

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 27

Citaciones: Sin citaciones


Descripción
La detección de emociones (ED) y el análisis de sentimientos (SA) desempeñan un papel vital en la identificación del nivel de interés de un individuo en cualquier campo dado. Los humanos utilizan expresiones faciales, tono de voz, gestos y palabras para transmitir sus emociones. La detección de emociones y el análisis de sentimientos en inglés y chino han recibido mucha atención en la última década. Sin embargo, idiomas con pocos recursos como el urdu han sido en su mayoría ignorados, lo cual es el enfoque principal de esta investigación. El urdu romano también debería ser investigado como otros idiomas porque las plataformas de redes sociales se utilizan con frecuencia para la comunicación. El urdu romano enfrenta un desafío significativo ante la ausencia de un corpus para la detección de emociones y el análisis de sentimientos, ya que los recursos lingüísticos son vitales para el procesamiento del lenguaje natural. En este estudio, creamos un corpus de 1021 oraciones para la detección de emociones y 20,251 oraciones para el análisis de sentimientos, obtenidas de diversas áreas, y lo anotamos con la ayuda de anotadores humanos de seis y tres clases, respectivamente. Para entrenar datos no etiquetados a gran escala, se emplean los modelos de bolsa de palabras, frecuencia de términos-frecuencia inversa de documentos y Skip-gram, y el vector de palabras aprendido se introduce en el modelo CNN-LSTM. Además de nuestro enfoque propuesto, también utilizamos otros algoritmos fundamentales, incluyendo una red neuronal convolucional, memoria a corto plazo a largo plazo, redes neuronales artificiales y redes neuronales recurrentes para la comparación. El resultado indica que el método propuesto CNN-LSTM emparejado con Word2Vec es más efectivo que otros en cuanto a la detección de emociones y la evaluación del análisis de sentimientos en urdu romano. Además, comparamos nuestro modelo basado con algunos trabajos anteriores. Tanto la detección de emociones como el análisis de sentimientos han experimentado mejoras significativas, pasando de una precisión del 85% al 95% y del 89% al 93.3%, respectivamente.

Otros recursos que podrían interesarte

Temas Virtualpro