Ajuste de hiperparámetros para algoritmos de aprendizaje automático utilizados en el análisis de sentimientos en árabe
Autores: Elgeldawi, Enas; Sayed, Awny; Galal, Ahmed R.; Zaki, Alaa M.
Idioma: Inglés
Editor: MDPI
Año: 2021
Acceso abierto
Artículo científico
2021
Ajuste de hiperparámetros para algoritmos de aprendizaje automático utilizados en el análisis de sentimientos en árabe
Categoría
Gestión y administración
Subcategoría
Gestión de la tecnología y la inovación
Palabras clave
Modelos de aprendizaje automático
Ajuste de hiperparámetros
Técnicas
Algoritmos
Análisis de sentimientos
árabe
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
Los modelos de aprendizaje automático se utilizan hoy en día para resolver problemas en una amplia variedad de disciplinas. Si se realiza la correcta sintonización de hiperparámetros de un clasificador de aprendizaje automático, se puede obtener una precisión significativamente mayor. En este documento, se realiza un análisis comparativo exhaustivo de varias técnicas de sintonización de hiperparámetros; estas son Búsqueda en Rejilla, Búsqueda Aleatoria, Optimización Bayesiana, Optimización por Enjambre de Partículas (PSO) y Algoritmo Genético (GA). Se utilizan para optimizar la precisión de seis algoritmos de aprendizaje automático, a saber, Regresión Logística (LR), Clasificador Ridge (RC), Clasificador de Máquinas de Vectores de Soporte (SVC), Árbol de Decisión (DT), Bosque Aleatorio (RF) y clasificadores Naive Bayes (NB). Para probar el rendimiento de cada técnica de sintonización de hiperparámetros, se utilizan los modelos de aprendizaje automático para resolver un problema de clasificación de sentimientos en árabe. El análisis de sentimientos es el proceso de detectar si un texto tiene un sentimiento positivo, negativo o neutral. Sin embargo, extraer dicho sentimiento de un lenguaje con una morfología derivacional compleja como el árabe siempre ha sido muy desafiante. El rendimiento de todos los clasificadores se prueba utilizando nuestro conjunto de datos construido tanto antes como después del proceso de sintonización de hiperparámetros. Se describe un análisis detallado, junto con las fortalezas y limitaciones de cada técnica de sintonización de hiperparámetros. Los resultados muestran que la mayor precisión fue dada por SVC tanto antes como después del proceso de sintonización de hiperparámetros, con una puntuación de 95.6208 obtenida al utilizar la Optimización Bayesiana.
Descripción
Los modelos de aprendizaje automático se utilizan hoy en día para resolver problemas en una amplia variedad de disciplinas. Si se realiza la correcta sintonización de hiperparámetros de un clasificador de aprendizaje automático, se puede obtener una precisión significativamente mayor. En este documento, se realiza un análisis comparativo exhaustivo de varias técnicas de sintonización de hiperparámetros; estas son Búsqueda en Rejilla, Búsqueda Aleatoria, Optimización Bayesiana, Optimización por Enjambre de Partículas (PSO) y Algoritmo Genético (GA). Se utilizan para optimizar la precisión de seis algoritmos de aprendizaje automático, a saber, Regresión Logística (LR), Clasificador Ridge (RC), Clasificador de Máquinas de Vectores de Soporte (SVC), Árbol de Decisión (DT), Bosque Aleatorio (RF) y clasificadores Naive Bayes (NB). Para probar el rendimiento de cada técnica de sintonización de hiperparámetros, se utilizan los modelos de aprendizaje automático para resolver un problema de clasificación de sentimientos en árabe. El análisis de sentimientos es el proceso de detectar si un texto tiene un sentimiento positivo, negativo o neutral. Sin embargo, extraer dicho sentimiento de un lenguaje con una morfología derivacional compleja como el árabe siempre ha sido muy desafiante. El rendimiento de todos los clasificadores se prueba utilizando nuestro conjunto de datos construido tanto antes como después del proceso de sintonización de hiperparámetros. Se describe un análisis detallado, junto con las fortalezas y limitaciones de cada técnica de sintonización de hiperparámetros. Los resultados muestran que la mayor precisión fue dada por SVC tanto antes como después del proceso de sintonización de hiperparámetros, con una puntuación de 95.6208 obtenida al utilizar la Optimización Bayesiana.