Estudio de Desambiguación de Sentido de Palabras: Un Sistema Flexible para la Extracción de Características de WSD
Autores: Agre, Gennady; Petrov, Daniel; Keskinova, Simona
Idioma: Inglés
Editor: MDPI
Año: 2019
Acceso abierto
Artículo científico
2019
Estudio de Desambiguación de Sentido de Palabras: Un Sistema Flexible para la Extracción de Características de WSD
Categoría
Gestión y administración
Subcategoría
Gestión de la tecnología y la inovación
Palabras clave
Sistema
Características
Incrustaciones de palabras
Incrustaciones de sentido
Ejemplos de entrenamiento
Ejemplos de prueba
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
El documento presenta un sistema flexible para extraer características y crear ejemplos de entrenamiento y prueba para resolver la tarea de desambiguación de sentido de todas las palabras (WSD). El sistema permite integrar incrustaciones de palabras y sentidos como parte de la descripción de un ejemplo. El sistema posee dos características únicas que lo distinguen de todos los sistemas WSD similares: la capacidad de construir una representación comprimida especial para las incrustaciones de palabras y la capacidad de construir conjuntos de ejemplos de entrenamiento y prueba con diferentes granularidades de datos. La primera característica permite la generación de conjuntos de datos con una dimensionalidad bastante pequeña, que se pueden utilizar para entrenar clasificadores de diferentes tipos con alta precisión. La segunda característica permite generar conjuntos de ejemplos que se pueden utilizar para entrenar clasificadores especializados en desambiguar una palabra concreta, palabras que pertenecen a la misma categoría gramatical (POS) o todas las palabras de clase abierta. Experimentaciones intensivas han demostrado que los clasificadores entrenados con ejemplos creados por el sistema superan las líneas base estándar para medir el comportamiento de los clasificadores WSD de todas las palabras.
Descripción
El documento presenta un sistema flexible para extraer características y crear ejemplos de entrenamiento y prueba para resolver la tarea de desambiguación de sentido de todas las palabras (WSD). El sistema permite integrar incrustaciones de palabras y sentidos como parte de la descripción de un ejemplo. El sistema posee dos características únicas que lo distinguen de todos los sistemas WSD similares: la capacidad de construir una representación comprimida especial para las incrustaciones de palabras y la capacidad de construir conjuntos de ejemplos de entrenamiento y prueba con diferentes granularidades de datos. La primera característica permite la generación de conjuntos de datos con una dimensionalidad bastante pequeña, que se pueden utilizar para entrenar clasificadores de diferentes tipos con alta precisión. La segunda característica permite generar conjuntos de ejemplos que se pueden utilizar para entrenar clasificadores especializados en desambiguar una palabra concreta, palabras que pertenecen a la misma categoría gramatical (POS) o todas las palabras de clase abierta. Experimentaciones intensivas han demostrado que los clasificadores entrenados con ejemplos creados por el sistema superan las líneas base estándar para medir el comportamiento de los clasificadores WSD de todas las palabras.