Modelo de Reconocimiento de Entidades Nombradas Basado en Fusión de Características
Autores: Sun, Zhen; Li, Xinfu
Idioma: Inglés
Editor: MDPI
Año: 2023
Acceso abierto
Artículo científico
2023
Modelo de Reconocimiento de Entidades Nombradas Basado en Fusión de Características
Categoría
Gestión y administración
Subcategoría
Gestión de la tecnología y la inovación
Palabras clave
Reconocimiento de entidades
Atención multi-cabeza
Chino
Word2vec
ALBERT
BiLSTM
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
El reconocimiento de entidades nombradas puede explorar profundamente las características semánticas y mejorar la capacidad de representación vectorial de los datos textuales. Este artículo propone un método de reconocimiento de entidades nombradas basado en atención multi-cabeza para abordar el problema de los límites léxicos difusos en el reconocimiento de entidades nombradas en chino. En primer lugar, se utiliza Word2vec para extraer vectores de palabras, HMM para extraer vectores de límites, ALBERT para extraer vectores de caracteres, se utiliza el mecanismo de atención de avance para fusionar los tres vectores, y luego la representación de los vectores fusionados se utiliza para eliminar características mediante BiLSTM. Luego, se utiliza la atención multi-cabeza para extraer la información potencial de palabras en las características del texto. Finalmente, se obtienen los resultados de clasificación de etiquetas de texto después de la selección del campo aleatorio condicional. A través de la verificación de los conjuntos de datos WeiboNER, MSRA y CLUENER2020, los resultados muestran que el algoritmo propuesto puede mejorar efectivamente el rendimiento del reconocimiento de entidades nombradas.
Descripción
El reconocimiento de entidades nombradas puede explorar profundamente las características semánticas y mejorar la capacidad de representación vectorial de los datos textuales. Este artículo propone un método de reconocimiento de entidades nombradas basado en atención multi-cabeza para abordar el problema de los límites léxicos difusos en el reconocimiento de entidades nombradas en chino. En primer lugar, se utiliza Word2vec para extraer vectores de palabras, HMM para extraer vectores de límites, ALBERT para extraer vectores de caracteres, se utiliza el mecanismo de atención de avance para fusionar los tres vectores, y luego la representación de los vectores fusionados se utiliza para eliminar características mediante BiLSTM. Luego, se utiliza la atención multi-cabeza para extraer la información potencial de palabras en las características del texto. Finalmente, se obtienen los resultados de clasificación de etiquetas de texto después de la selección del campo aleatorio condicional. A través de la verificación de los conjuntos de datos WeiboNER, MSRA y CLUENER2020, los resultados muestran que el algoritmo propuesto puede mejorar efectivamente el rendimiento del reconocimiento de entidades nombradas.