Innovador modelado de red neuronal profunda para el reconocimiento de entidades chinas detallado
Autores: Liu, Jingang; Xia, Chunhe; Yan, Haihua; Xu, Wenjing
Idioma: Inglés
Editor: MDPI
Año: 2020
Acceso abierto
Artículo científico
2020
Innovador modelado de red neuronal profunda para el reconocimiento de entidades chinas detallado
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Reconocimiento de entidades nombradas
Chino
NER
Detallado
En2BiLSTM-CRF
Modelo de red neuronal
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 26
Citaciones: Sin citaciones
El reconocimiento de entidades nombradas (NER) es una tarea básica pero crucial en el campo del procesamiento del lenguaje natural (NLP) y el análisis de big data. La identificación de entidades nombradas basadas en chino es más complicada y difícil que en inglés, lo que hace que la tarea de NER en chino sea más desafiante. En particular, el reconocimiento de entidades nombradas detallado es más desafiante que las tareas tradicionales de reconocimiento de entidades nombradas, principalmente porque las tareas detalladas tienen mayores requisitos para la capacidad de extracción automática de características y representación de información de modelos neuronales profundos. En este documento, proponemos un modelo innovador de red neuronal llamado En2BiLSTM-CRF para mejorar el efecto de las tareas de reconocimiento de entidades chinas detalladas. Este modelo propuesto, que incluye la capa de codificación inicial, la capa de codificación mejorada y la capa de decodificación, combina las ventajas de la codificación de modelos de pre-entrenamiento, redes neuronales de memoria a corto y largo plazo bidireccionales (BiLSTM) duales y un mecanismo de conexión residual. Por lo tanto, puede codificar la información múltiples veces y extraer características contextuales jerárquicamente. Realizamos experimentos suficientes en dos conjuntos de datos representativos utilizando múltiples métricas importantes y los comparamos con otros baselines avanzados. Presentamos resultados prometedores que muestran que nuestro propuesto En2BiLSTM-CRF tiene un mejor rendimiento y una mejor capacidad de generalización tanto en tareas de reconocimiento de entidades chinas detalladas como generales.
Descripción
El reconocimiento de entidades nombradas (NER) es una tarea básica pero crucial en el campo del procesamiento del lenguaje natural (NLP) y el análisis de big data. La identificación de entidades nombradas basadas en chino es más complicada y difícil que en inglés, lo que hace que la tarea de NER en chino sea más desafiante. En particular, el reconocimiento de entidades nombradas detallado es más desafiante que las tareas tradicionales de reconocimiento de entidades nombradas, principalmente porque las tareas detalladas tienen mayores requisitos para la capacidad de extracción automática de características y representación de información de modelos neuronales profundos. En este documento, proponemos un modelo innovador de red neuronal llamado En2BiLSTM-CRF para mejorar el efecto de las tareas de reconocimiento de entidades chinas detalladas. Este modelo propuesto, que incluye la capa de codificación inicial, la capa de codificación mejorada y la capa de decodificación, combina las ventajas de la codificación de modelos de pre-entrenamiento, redes neuronales de memoria a corto y largo plazo bidireccionales (BiLSTM) duales y un mecanismo de conexión residual. Por lo tanto, puede codificar la información múltiples veces y extraer características contextuales jerárquicamente. Realizamos experimentos suficientes en dos conjuntos de datos representativos utilizando múltiples métricas importantes y los comparamos con otros baselines avanzados. Presentamos resultados prometedores que muestran que nuestro propuesto En2BiLSTM-CRF tiene un mejor rendimiento y una mejor capacidad de generalización tanto en tareas de reconocimiento de entidades chinas detalladas como generales.