Reconocimiento de Entidades Nombradas en el Campo Deportivo Basado en una Red Neuronal Convolucional de Grado de Caracteres
Autores: Seti, Xieraili; Wumaier, Aishan; Yibulayin, Turgen; Paerhati, Diliyaer; Wang, Lulu; Saimaiti, Alimu
Idioma: Inglés
Editor: MDPI
Año: 2020
Acceso abierto
Artículo científico
2020
Reconocimiento de Entidades Nombradas en el Campo Deportivo Basado en una Red Neuronal Convolucional de Grado de Caracteres
Categoría
Gestión y administración
Subcategoría
Gestión de la tecnología y la inovación
Palabras clave
Métodos tradicionales
Reconocimiento de entidades nombradas
Texto deportivo
Red neuronal de convolución de gráficos de caracteres
Mecanismo de autoatención
Información estructural jerárquica
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
Los métodos tradicionales para identificar nombres ignoran la correlación entre las entidades nombradas y pierden información estructural jerárquica entre las entidades nombradas en un texto dado. Aunque los métodos tradicionales de entidades nombradas son efectivos para conjuntos de datos convencionales que tienen estructuras simples, no son tan efectivos para textos deportivos. Este artículo propone un método de reconocimiento de entidades nombradas en textos deportivos chinos basado en una red neuronal convolucional de gráficos de caracteres (Char GCN) con un modelo de mecanismo de autoatención. En este método, cada carácter chino en el texto deportivo se considera un nodo. El borde entre los nodos se construye utilizando una posición de carácter similar y la característica del carácter de la entidad nombrada en el texto deportivo. La información estructural interna de la entidad se extrae utilizando una red neuronal convolucional de mapas de caracteres. La información semántica jerárquica del texto deportivo se captura mediante el modelo de autoatención para mejorar la relación entre las entidades nombradas y capturar la relevancia y dependencia entre los caracteres. La función de clasificación de campos aleatorios condicionales puede identificar con precisión las entidades nombradas en el texto deportivo chino. Los resultados obtenidos en cuatro conjuntos de datos demuestran que el método propuesto mejora significativamente los valores de F-Score a 92.51%, 91.91%, 93.98% y 95.01%, respectivamente, en comparación con los métodos tradicionales de nombramiento.
Descripción
Los métodos tradicionales para identificar nombres ignoran la correlación entre las entidades nombradas y pierden información estructural jerárquica entre las entidades nombradas en un texto dado. Aunque los métodos tradicionales de entidades nombradas son efectivos para conjuntos de datos convencionales que tienen estructuras simples, no son tan efectivos para textos deportivos. Este artículo propone un método de reconocimiento de entidades nombradas en textos deportivos chinos basado en una red neuronal convolucional de gráficos de caracteres (Char GCN) con un modelo de mecanismo de autoatención. En este método, cada carácter chino en el texto deportivo se considera un nodo. El borde entre los nodos se construye utilizando una posición de carácter similar y la característica del carácter de la entidad nombrada en el texto deportivo. La información estructural interna de la entidad se extrae utilizando una red neuronal convolucional de mapas de caracteres. La información semántica jerárquica del texto deportivo se captura mediante el modelo de autoatención para mejorar la relación entre las entidades nombradas y capturar la relevancia y dependencia entre los caracteres. La función de clasificación de campos aleatorios condicionales puede identificar con precisión las entidades nombradas en el texto deportivo chino. Los resultados obtenidos en cuatro conjuntos de datos demuestran que el método propuesto mejora significativamente los valores de F-Score a 92.51%, 91.91%, 93.98% y 95.01%, respectivamente, en comparación con los métodos tradicionales de nombramiento.