Rographer: extracción mejorada de relaciones de entidad médica china utilizando el modelo preentrenado RoFormer y convolución de gráficos ponderados
Autores: Zhang, Qinghui; Sun, Yaya; Lv, Pengtao; Lu, Lei; Zhang, Mengya; Wang, Jinhui; Wan, Chenxia; Wang, Jingping
Idioma: Inglés
Editor: MDPI
Año: 2024
Acceso abierto
Artículo científico
2024
Rographer: extracción mejorada de relaciones de entidad médica china utilizando el modelo preentrenado RoFormer y convolución de gráficos ponderados
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Extracción
Relaciones de entidad
Textos médicos
RoFormer
Codificación de posición
Profesionales de la salud
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 35
Citaciones: Sin citaciones
Los textos médicos chinos no estructurados son fuentes ricas de información de entidad y relaciones. La extracción de relaciones de entidad de textos médicos es fundamental para la construcción de grafos de conocimiento médico y para ayudar a los profesionales de la salud a tomar decisiones rápidas e informadas. Sin embargo, la extracción de relaciones de entidad de estos textos presenta un desafío formidable, principalmente debido al problema de relaciones de entidad superpuestas. Este estudio introduce un nuevo modelo de extracción que aprovecha la técnica de codificación de posición rotacional (RoPE) de RoFormer para una implementación eficiente de la codificación de posición relativa. Este enfoque no solo optimiza la utilización de la información posicional, sino que también captura información de dependencia sintáctica mediante la construcción de una matriz de adyacencia ponderada. Durante la fase de fusión de características, el modelo emplea un mecanismo de atención de entidad para una integración más profunda de características, abordando efectivamente el desafío de relaciones de entidad superpuestas. Los resultados experimentales demuestran que nuestro modelo logra un puntaje F1 de 83.42 en conjuntos de datos que presentan relaciones de entidad superpuestas, superando significativamente a otros modelos de referencia.
Descripción
Los textos médicos chinos no estructurados son fuentes ricas de información de entidad y relaciones. La extracción de relaciones de entidad de textos médicos es fundamental para la construcción de grafos de conocimiento médico y para ayudar a los profesionales de la salud a tomar decisiones rápidas e informadas. Sin embargo, la extracción de relaciones de entidad de estos textos presenta un desafío formidable, principalmente debido al problema de relaciones de entidad superpuestas. Este estudio introduce un nuevo modelo de extracción que aprovecha la técnica de codificación de posición rotacional (RoPE) de RoFormer para una implementación eficiente de la codificación de posición relativa. Este enfoque no solo optimiza la utilización de la información posicional, sino que también captura información de dependencia sintáctica mediante la construcción de una matriz de adyacencia ponderada. Durante la fase de fusión de características, el modelo emplea un mecanismo de atención de entidad para una integración más profunda de características, abordando efectivamente el desafío de relaciones de entidad superpuestas. Los resultados experimentales demuestran que nuestro modelo logra un puntaje F1 de 83.42 en conjuntos de datos que presentan relaciones de entidad superpuestas, superando significativamente a otros modelos de referencia.