logo móvil
Contáctanos

Un método de extracción de relaciones entre entidades basado en la fusión de múltiples mecanismos y redes adaptativas dinámicas

Autores: Jiang, Xiantao; Hu, Xin; Zhou, Bowen

Idioma: Inglés

Editor: MDPI

Año: 2026

Descargar PDF

Acceso abierto

Artículo científico
2026

Un método de extracción de relaciones entre entidades basado en la fusión de múltiples mecanismos y redes adaptativas dinámicas


Categoría

Gestión y administración

Subcategoría

Gestión de la tecnología y la inovación

Palabras clave

Estudio
Modelo de extracción de entidad-relación
Procesamiento de lenguaje natural
Información contextual
Codificador Chinese-RoBERTa-wwm-ext
Atención multi-cabeza

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 1

Citaciones: Sin citaciones


Descripción
Este estudio presenta un modelo de extracción de entidades y relaciones de múltiples mecanismos diseñado para abordar los desafíos persistentes en el procesamiento del lenguaje natural, incluyendo la complejidad sintáctica, el modelado de dependencias a largo plazo y la utilización subóptima de la información contextual. La arquitectura propuesta integra varios componentes complementarios. Primero, se emplea un codificador chino-RoBERTa-wwm-ext preentrenado con una estrategia de enmascaramiento de palabras completas para preservar la semántica léxica y mejorar las representaciones contextuales para texto chino de múltiples caracteres. En segundo lugar, se incorpora un modelado secuencial basado en BiLSTM para capturar dependencias contextuales bidireccionales, facilitando la identificación de relaciones de entidades distantes. En tercer lugar, la combinación de mecanismos de atención de múltiples cabezas y atención controlada permite que el modelo enfatice selectivamente las pistas semánticas salientes mientras suprime información irrelevante. Para mejorar aún más la consistencia de la predicción global, se aplica una capa de Campo Aleatorio Condicional (CRF) en la etapa de salida. Basándose en este marco de múltiples mecanismos, se introduce una red dinámica adaptativa para permitir la activación dependiente de la entrada de los módulos de modelado de características según la complejidad semántica a nivel de oración. En lugar de imponer un pipeline de computación fijo, el mecanismo propuesto apoya la interacción de características flexible y consciente del contexto, permitiendo que el modelo se adapte mejor a estructuras de oraciones heterogéneas. Los resultados experimentales en conjuntos de datos de referencia demuestran que el enfoque propuesto logra un fuerte rendimiento de extracción y una mejor robustez, convirtiéndolo en una solución flexible para aplicaciones posteriores como la construcción de grafos de conocimiento y la recuperación de información semántica.

Otros recursos que podrían interesarte

Temas Virtualpro