Desarrollo de un modelo multilingüe para el análisis de sentimientos en máquinas en el idioma serbio
Autores: Draskovic, Drazen; Zecevic, Darinka; Nikolic, Bosko
Idioma: Inglés
Editor: MDPI
Año: 2022
Acceso abierto
Artículo científico
2022
Desarrollo de un modelo multilingüe para el análisis de sentimientos en máquinas en el idioma serbio
Categoría
Matemáticas
Subcategoría
Matemáticas generales
Palabras clave
Desarrollo de modelo de máquina
Procesamiento de sentimientos
Idioma serbio
Conjuntos de datos
Algoritmos de clasificación
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 21
Citaciones: Sin citaciones
En esta investigación, se presenta un método para desarrollar un modelo de máquina para el procesamiento de sentimientos en el idioma serbio. El idioma serbio, a diferencia del inglés y otros idiomas populares, pertenece al grupo de idiomas con recursos limitados. Tres conjuntos de datos diferentes se utilizaron como fuente de datos: un conjunto equilibrado de reseñas de álbumes de música, un conjunto equilibrado de reseñas de películas y un conjunto equilibrado de reseñas de álbumes de música en inglés-MARD- que fue traducido al serbio. La evaluación incluyó la aplicación de modelos desarrollados con tres algoritmos estándar para problemas de clasificación (Bayes ingenuo, regresión logística y máquina de vectores de soporte) y la aplicación de un modelo híbrido, que produjo los mejores resultados. Los modelos fueron entrenados en cada uno de los tres conjuntos de datos, mientras que un conjunto de reseñas de música originalmente escritas en serbio se utilizó para probar el modelo. Al comparar los resultados del modelo desarrollado, también se evaluó la posibilidad de expandir el conjunto de datos para el desarrollo del modelo de máquina.
Descripción
En esta investigación, se presenta un método para desarrollar un modelo de máquina para el procesamiento de sentimientos en el idioma serbio. El idioma serbio, a diferencia del inglés y otros idiomas populares, pertenece al grupo de idiomas con recursos limitados. Tres conjuntos de datos diferentes se utilizaron como fuente de datos: un conjunto equilibrado de reseñas de álbumes de música, un conjunto equilibrado de reseñas de películas y un conjunto equilibrado de reseñas de álbumes de música en inglés-MARD- que fue traducido al serbio. La evaluación incluyó la aplicación de modelos desarrollados con tres algoritmos estándar para problemas de clasificación (Bayes ingenuo, regresión logística y máquina de vectores de soporte) y la aplicación de un modelo híbrido, que produjo los mejores resultados. Los modelos fueron entrenados en cada uno de los tres conjuntos de datos, mientras que un conjunto de reseñas de música originalmente escritas en serbio se utilizó para probar el modelo. Al comparar los resultados del modelo desarrollado, también se evaluó la posibilidad de expandir el conjunto de datos para el desarrollo del modelo de máquina.