logo móvil
Contáctanos

Uniendo la conciencia de características locales a múltiples escalas y el mecanismo de autoatención para el reconocimiento de entidades nombradas

Autores: Shi, Lin; Zou, Xianming; Dai, Chenxu; Ji, Zhanlin

Idioma: Inglés

Editor: MDPI

Año: 2023

Descargar PDF

Acceso abierto

Artículo científico
2023

Uniendo la conciencia de características locales a múltiples escalas y el mecanismo de autoatención para el reconocimiento de entidades nombradas


Categoría

Matemáticas

Subcategoría

Matemáticas generales

Palabras clave

Diabetes
Reconocimiento de entidades nombradas
Modelo RMBC
RoBERTa
CRF
Características de contexto local

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 30

Citaciones: Sin citaciones


Descripción
En los últimos años, una gran cantidad de información textual requiere procesamiento para apoyar el diagnóstico y tratamiento de la diabetes en el campo médico; por lo tanto, el reconocimiento de entidades nombradas de diabetes (DNER) está dando lugar a la popularidad de este tema de investigación dentro de este campo en particular. Aunque los métodos principales para el reconocimiento de entidades nombradas médicas chinas pueden capturar efectivamente información de contexto global, ignoran la información local potencial en las oraciones, y por lo tanto no pueden extraer las características de contexto local a través de un marco eficiente. Para superar estos desafíos, este documento construye un corpus de diabetes y propone el modelo RMBC (RoBERTa Multi-scale CNN BiGRU Self-attention CRF). Este modelo es un modelo de reconocimiento de entidades nombradas que une la conciencia de características locales a múltiples escalas y el mecanismo de autoatención. Este documento primero utiliza RoBERTa-wwm para codificar los caracteres; luego, diseña un módulo contextual local, que captura la información de contexto que contiene características localmente importantes fusionando la atención de múltiples ventanas con convolución residual a múltiples escalas y agrega un mecanismo de autoatención para abordar la restricción de la unidad recurrente bidireccional (BiGRU) capturando dependencias a larga distancia y obtener información semántica global. Finalmente, se recurre a los campos aleatorios condicionales (CRF) para aprender la dependencia entre etiquetas adyacentes y obtener la secuencia de etiquetas óptima. Los resultados experimentales en nuestro conjunto de datos privado construido, denominado DNER, junto con dos conjuntos de datos de referencia, demuestran la efectividad del modelo en este documento.

Otros recursos que podrían interesarte

Temas Virtualpro