logo móvil
Contáctanos

Desambiguación de comas chinas en problemas matemáticos utilizando SMOTE y bosques aleatorios

Autores: Huang, Jingxiu; Liu, Qingtang; Zheng, Yunxiang; Wu, Linjing

Idioma: Inglés

Editor: MDPI

Año: 2021

Descargar PDF

Acceso abierto

Artículo científico
2021

Desambiguación de comas chinas en problemas matemáticos utilizando SMOTE y bosques aleatorios


Categoría

Ingeniería y Tecnología

Subcategoría

Inteligencia Artificial

Palabras clave

Comprensión del lenguaje natural
Problemas de palabras de matemáticas
Desambiguación de comas
Aprendizaje automático
Bosques aleatorios
SMOTE

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 24

Citaciones: Sin citaciones


Descripción
Las tecnologías de comprensión del lenguaje natural desempeñan un papel esencial en la resolución automática de problemas matemáticos en palabras. En el proceso de comprensión automática de problemas matemáticos chinos, la desambiguación de comas, que está asociada con un problema de aprendizaje binario de desequilibrio de clases, se aborda como un instrumento valioso para transformar la declaración del problema de problemas matemáticos en una representación estructurada. Con el objetivo de resolver este problema, empleamos la técnica de sobremuestreo sintético de minorías (SMOTE) y bosques aleatorios para la clasificación de comas después de que sus hiperparámetros fueran optimizados conjuntamente. Proponemos una medida estricta para evaluar el rendimiento de los modelos de clasificación de comas implementados en la desambiguación de comas en problemas matemáticos. Para verificar la efectividad de los clasificadores de bosques aleatorios con SMOTE en la desambiguación de comas, realizamos experimentos de dos etapas en dos conjuntos de datos con una colección de medidas de evaluación. Los resultados experimentales mostraron que los clasificadores de bosques aleatorios fueron significativamente superiores a los métodos de referencia en la desambiguación de comas en chino. El algoritmo SMOTE con ajustes de hiperparámetros optimizados basados en la distribución categórica de diferentes conjuntos de datos es preferible, en lugar de con sus valores predeterminados. Para los profesionales, sugerimos que los hiperparámetros de los modelos de clasificación se vuelvan a optimizar después de que se hayan cambiado los ajustes de parámetros de SMOTE.

Otros recursos que podrían interesarte

Temas Virtualpro