Un nuevo método de extracción de relaciones de entidad para documentos de patentes semi-estructurados
Autores: Zhang, Liyuan; Sun, Xiangyu; Ma, Xianghua; Hu, Kaitao
Idioma: Inglés
Editor: MDPI
Año: 2024
Acceso abierto
Artículo científico
2024
Un nuevo método de extracción de relaciones de entidad para documentos de patentes semi-estructurados
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Limitaciones
Métodos de extracción de relaciones de entidades
Modelo de ontología de documentos de patentes
Clustering jerárquico
Reglas de asociación
Mecanismo de atención
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 42
Citaciones: Sin citaciones
Dirigido a mitigar las limitaciones de los métodos existentes de extracción de relaciones de entidades en documentos, especialmente la compleja interacción de información entre diferentes entidades en el documento y el escaso efecto de la clasificación de relaciones de entidades, de acuerdo con las características semiestructuradas de los datos de documentos de patentes, se propuso un método de construcción de modelo de ontología de documentos de patentes basado en agrupamiento jerárquico y reglas de asociación para describir las entidades y sus relaciones en el documento de patente, denominado como MPreA. Combinado con algoritmos de aprendizaje estadístico y de aprendizaje profundo, el modelo pre-entrenado del mecanismo de atención se fusionó para lograr la extracción efectiva de relaciones de entidades. Los resultados de la simulación numérica muestran que, en comparación con los métodos tradicionales, nuestro método propuesto ha logrado una mejora significativa en la resolución del problema de información contextual insuficiente y proporciona una solución más efectiva para la extracción de relaciones de entidades en documentos de patentes.
Descripción
Dirigido a mitigar las limitaciones de los métodos existentes de extracción de relaciones de entidades en documentos, especialmente la compleja interacción de información entre diferentes entidades en el documento y el escaso efecto de la clasificación de relaciones de entidades, de acuerdo con las características semiestructuradas de los datos de documentos de patentes, se propuso un método de construcción de modelo de ontología de documentos de patentes basado en agrupamiento jerárquico y reglas de asociación para describir las entidades y sus relaciones en el documento de patente, denominado como MPreA. Combinado con algoritmos de aprendizaje estadístico y de aprendizaje profundo, el modelo pre-entrenado del mecanismo de atención se fusionó para lograr la extracción efectiva de relaciones de entidades. Los resultados de la simulación numérica muestran que, en comparación con los métodos tradicionales, nuestro método propuesto ha logrado una mejora significativa en la resolución del problema de información contextual insuficiente y proporciona una solución más efectiva para la extracción de relaciones de entidades en documentos de patentes.