Desambiguación de comas chinas en problemas matemáticos utilizando SMOTE y bosques aleatorios
Autores: Huang, Jingxiu; Liu, Qingtang; Zheng, Yunxiang; Wu, Linjing
Idioma: Inglés
Editor: MDPI
Año: 2021
Acceso abierto
Artículo científico
2021
Desambiguación de comas chinas en problemas matemáticos utilizando SMOTE y bosques aleatorios
Categoría
Ingeniería y Tecnología
Subcategoría
Inteligencia Artificial
Palabras clave
Comprensión del lenguaje natural
Problemas de palabras de matemáticas
Desambiguación de comas
Aprendizaje automático
Bosques aleatorios
SMOTE
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 24
Citaciones: Sin citaciones
Las tecnologías de comprensión del lenguaje natural desempeñan un papel esencial en la resolución automática de problemas matemáticos en palabras. En el proceso de comprensión automática de problemas matemáticos chinos, la desambiguación de comas, que está asociada con un problema de aprendizaje binario de desequilibrio de clases, se aborda como un instrumento valioso para transformar la declaración del problema de problemas matemáticos en una representación estructurada. Con el objetivo de resolver este problema, empleamos la técnica de sobremuestreo sintético de minorías (SMOTE) y bosques aleatorios para la clasificación de comas después de que sus hiperparámetros fueran optimizados conjuntamente. Proponemos una medida estricta para evaluar el rendimiento de los modelos de clasificación de comas implementados en la desambiguación de comas en problemas matemáticos. Para verificar la efectividad de los clasificadores de bosques aleatorios con SMOTE en la desambiguación de comas, realizamos experimentos de dos etapas en dos conjuntos de datos con una colección de medidas de evaluación. Los resultados experimentales mostraron que los clasificadores de bosques aleatorios fueron significativamente superiores a los métodos de referencia en la desambiguación de comas en chino. El algoritmo SMOTE con ajustes de hiperparámetros optimizados basados en la distribución categórica de diferentes conjuntos de datos es preferible, en lugar de con sus valores predeterminados. Para los profesionales, sugerimos que los hiperparámetros de los modelos de clasificación se vuelvan a optimizar después de que se hayan cambiado los ajustes de parámetros de SMOTE.
Descripción
Las tecnologías de comprensión del lenguaje natural desempeñan un papel esencial en la resolución automática de problemas matemáticos en palabras. En el proceso de comprensión automática de problemas matemáticos chinos, la desambiguación de comas, que está asociada con un problema de aprendizaje binario de desequilibrio de clases, se aborda como un instrumento valioso para transformar la declaración del problema de problemas matemáticos en una representación estructurada. Con el objetivo de resolver este problema, empleamos la técnica de sobremuestreo sintético de minorías (SMOTE) y bosques aleatorios para la clasificación de comas después de que sus hiperparámetros fueran optimizados conjuntamente. Proponemos una medida estricta para evaluar el rendimiento de los modelos de clasificación de comas implementados en la desambiguación de comas en problemas matemáticos. Para verificar la efectividad de los clasificadores de bosques aleatorios con SMOTE en la desambiguación de comas, realizamos experimentos de dos etapas en dos conjuntos de datos con una colección de medidas de evaluación. Los resultados experimentales mostraron que los clasificadores de bosques aleatorios fueron significativamente superiores a los métodos de referencia en la desambiguación de comas en chino. El algoritmo SMOTE con ajustes de hiperparámetros optimizados basados en la distribución categórica de diferentes conjuntos de datos es preferible, en lugar de con sus valores predeterminados. Para los profesionales, sugerimos que los hiperparámetros de los modelos de clasificación se vuelvan a optimizar después de que se hayan cambiado los ajustes de parámetros de SMOTE.