Aprendiendo las gramáticas morfológicas y sintácticas para el reconocimiento de entidades nombradas
Autores: Sun, Mengtao; Yang, Qiang; Wang, Hao; Pasquine, Mark; Hameed, Ibrahim A.
Idioma: Inglés
Editor: MDPI
Año: 2022
Acceso abierto
Artículo científico
2022
Aprendiendo las gramáticas morfológicas y sintácticas para el reconocimiento de entidades nombradas
Categoría
Gestión y administración
Subcategoría
Gestión de la tecnología y la inovación
Palabras clave
Idiomas
Reconocimiento de Entidades Nombradas
NER
Red neuronal
Morfológico
Gramáticas sintácticas
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
En algunos idiomas, el Reconocimiento de Entidades Nombradas (NER) se ve gravemente obstaculizado por estructuras lingüísticas complejas, como la inflexión, que confunden a los modelos basados en datos al percibir el significado real de la palabra. Este trabajo intenta aliviar estos problemas al introducir una nueva red neuronal basada en gramáticas morfológicas y sintácticas. Los experimentos se realizaron en cuatro idiomas nórdicos, que tienen muchas reglas gramaticales. El modelo se denominó red NorG (Nor: Idiomas Nórdicos, G: Gramática). Además de aprender del contenido del texto, la red NorG también aprende de la forma de escritura de la palabra, la etiqueta de categoría gramatical (POS) y la dependencia. La red neuronal propuesta consiste en una capa de Memoria a Largo y Corto Plazo Bidireccional (Bi-LSTM) para capturar gramáticas a nivel de palabra, mientras que se utiliza una capa de Atención Gráfica Bidireccional (Bi-GAT) para capturar gramáticas a nivel de oración. Los resultados experimentales de cuatro idiomas muestran que la red asistida por gramática mejora significativamente los resultados en comparación con las líneas base. También investigamos cómo funciona la red NorG en cada componente gramatical mediante algunos experimentos exploratorios.
Descripción
En algunos idiomas, el Reconocimiento de Entidades Nombradas (NER) se ve gravemente obstaculizado por estructuras lingüísticas complejas, como la inflexión, que confunden a los modelos basados en datos al percibir el significado real de la palabra. Este trabajo intenta aliviar estos problemas al introducir una nueva red neuronal basada en gramáticas morfológicas y sintácticas. Los experimentos se realizaron en cuatro idiomas nórdicos, que tienen muchas reglas gramaticales. El modelo se denominó red NorG (Nor: Idiomas Nórdicos, G: Gramática). Además de aprender del contenido del texto, la red NorG también aprende de la forma de escritura de la palabra, la etiqueta de categoría gramatical (POS) y la dependencia. La red neuronal propuesta consiste en una capa de Memoria a Largo y Corto Plazo Bidireccional (Bi-LSTM) para capturar gramáticas a nivel de palabra, mientras que se utiliza una capa de Atención Gráfica Bidireccional (Bi-GAT) para capturar gramáticas a nivel de oración. Los resultados experimentales de cuatro idiomas muestran que la red asistida por gramática mejora significativamente los resultados en comparación con las líneas base. También investigamos cómo funciona la red NorG en cada componente gramatical mediante algunos experimentos exploratorios.