Un método de extracción de relaciones entre entidades basado en la fusión de múltiples mecanismos y redes adaptativas dinámicas
Autores: Jiang, Xiantao; Hu, Xin; Zhou, Bowen
Idioma: Inglés
Editor: MDPI
Año: 2026
Acceso abierto
Artículo científico
2026
Un método de extracción de relaciones entre entidades basado en la fusión de múltiples mecanismos y redes adaptativas dinámicas
Categoría
Gestión y administración
Subcategoría
Gestión de la tecnología y la inovación
Palabras clave
Estudio
Modelo de extracción de entidad-relación
Procesamiento de lenguaje natural
Información contextual
Codificador Chinese-RoBERTa-wwm-ext
Atención multi-cabeza
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
Este estudio presenta un modelo de extracción de entidades y relaciones de múltiples mecanismos diseñado para abordar los desafíos persistentes en el procesamiento del lenguaje natural, incluyendo la complejidad sintáctica, el modelado de dependencias a largo plazo y la utilización subóptima de la información contextual. La arquitectura propuesta integra varios componentes complementarios. Primero, se emplea un codificador chino-RoBERTa-wwm-ext preentrenado con una estrategia de enmascaramiento de palabras completas para preservar la semántica léxica y mejorar las representaciones contextuales para texto chino de múltiples caracteres. En segundo lugar, se incorpora un modelado secuencial basado en BiLSTM para capturar dependencias contextuales bidireccionales, facilitando la identificación de relaciones de entidades distantes. En tercer lugar, la combinación de mecanismos de atención de múltiples cabezas y atención controlada permite que el modelo enfatice selectivamente las pistas semánticas salientes mientras suprime información irrelevante. Para mejorar aún más la consistencia de la predicción global, se aplica una capa de Campo Aleatorio Condicional (CRF) en la etapa de salida. Basándose en este marco de múltiples mecanismos, se introduce una red dinámica adaptativa para permitir la activación dependiente de la entrada de los módulos de modelado de características según la complejidad semántica a nivel de oración. En lugar de imponer un pipeline de computación fijo, el mecanismo propuesto apoya la interacción de características flexible y consciente del contexto, permitiendo que el modelo se adapte mejor a estructuras de oraciones heterogéneas. Los resultados experimentales en conjuntos de datos de referencia demuestran que el enfoque propuesto logra un fuerte rendimiento de extracción y una mejor robustez, convirtiéndolo en una solución flexible para aplicaciones posteriores como la construcción de grafos de conocimiento y la recuperación de información semántica.
Descripción
Este estudio presenta un modelo de extracción de entidades y relaciones de múltiples mecanismos diseñado para abordar los desafíos persistentes en el procesamiento del lenguaje natural, incluyendo la complejidad sintáctica, el modelado de dependencias a largo plazo y la utilización subóptima de la información contextual. La arquitectura propuesta integra varios componentes complementarios. Primero, se emplea un codificador chino-RoBERTa-wwm-ext preentrenado con una estrategia de enmascaramiento de palabras completas para preservar la semántica léxica y mejorar las representaciones contextuales para texto chino de múltiples caracteres. En segundo lugar, se incorpora un modelado secuencial basado en BiLSTM para capturar dependencias contextuales bidireccionales, facilitando la identificación de relaciones de entidades distantes. En tercer lugar, la combinación de mecanismos de atención de múltiples cabezas y atención controlada permite que el modelo enfatice selectivamente las pistas semánticas salientes mientras suprime información irrelevante. Para mejorar aún más la consistencia de la predicción global, se aplica una capa de Campo Aleatorio Condicional (CRF) en la etapa de salida. Basándose en este marco de múltiples mecanismos, se introduce una red dinámica adaptativa para permitir la activación dependiente de la entrada de los módulos de modelado de características según la complejidad semántica a nivel de oración. En lugar de imponer un pipeline de computación fijo, el mecanismo propuesto apoya la interacción de características flexible y consciente del contexto, permitiendo que el modelo se adapte mejor a estructuras de oraciones heterogéneas. Los resultados experimentales en conjuntos de datos de referencia demuestran que el enfoque propuesto logra un fuerte rendimiento de extracción y una mejor robustez, convirtiéndolo en una solución flexible para aplicaciones posteriores como la construcción de grafos de conocimiento y la recuperación de información semántica.