Desambiguación de entidades nombradas libre de contexto computacionalmente eficiente con Wikipedia
Autores: Simos, Michael Angelos; Makris, Christos
Idioma: Inglés
Editor: MDPI
Año: 2022
Acceso abierto
Artículo científico
2022
Desambiguación de entidades nombradas libre de contexto computacionalmente eficiente con Wikipedia
Categoría
Gestión y administración
Subcategoría
Gestión de la tecnología y la inovación
Palabras clave
Semántica
Corpora de texto no estructurados
Desambiguación de entidades nombradas
Extracción de conocimiento del dominio
Modelo de lógica difusa
Enlace de entidades
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
La inducción de la semántica de los corpus de texto no estructurado es una tarea crucial para el procesamiento del lenguaje natural moderno y las aplicaciones de inteligencia artificial. La tarea de Desambiguación de Entidades Nombradas comprende la extracción de Entidades Nombradas y su vinculación a una representación apropiada de una ontología de conceptos basada en la información disponible. Este trabajo introduce metodologías novedosas, aprovechando la extracción de conocimiento del dominio de Wikipedia en un enfoque simple pero altamente efectivo. Además, introducimos un modelo de lógica difusa con un fuerte enfoque en la eficiencia computacional. También presentamos una nueva medida, decisiva en ambos métodos para la selección de vinculación de entidades y la cuantificación de la confianza de los enlaces de entidades producidos, a saber, la medida de común relativo. Los resultados experimentales de nuestro enfoque en conjuntos de datos establecidos revelaron una precisión y un rendimiento en tiempo de ejecución de vanguardia en el dominio de la Wikificación rápida y libre de contexto, al depender de una etapa de preprocesamiento fuera de línea en el corpus de Wikipedia. Las metodologías introducidas pueden ser aprovechadas como metodologías NED independientes, propicias para aplicaciones en dispositivos móviles, o en el contexto de reducir drásticamente la complejidad de los enfoques de redes neuronales profundas como una primera capa libre de contexto.
Descripción
La inducción de la semántica de los corpus de texto no estructurado es una tarea crucial para el procesamiento del lenguaje natural moderno y las aplicaciones de inteligencia artificial. La tarea de Desambiguación de Entidades Nombradas comprende la extracción de Entidades Nombradas y su vinculación a una representación apropiada de una ontología de conceptos basada en la información disponible. Este trabajo introduce metodologías novedosas, aprovechando la extracción de conocimiento del dominio de Wikipedia en un enfoque simple pero altamente efectivo. Además, introducimos un modelo de lógica difusa con un fuerte enfoque en la eficiencia computacional. También presentamos una nueva medida, decisiva en ambos métodos para la selección de vinculación de entidades y la cuantificación de la confianza de los enlaces de entidades producidos, a saber, la medida de común relativo. Los resultados experimentales de nuestro enfoque en conjuntos de datos establecidos revelaron una precisión y un rendimiento en tiempo de ejecución de vanguardia en el dominio de la Wikificación rápida y libre de contexto, al depender de una etapa de preprocesamiento fuera de línea en el corpus de Wikipedia. Las metodologías introducidas pueden ser aprovechadas como metodologías NED independientes, propicias para aplicaciones en dispositivos móviles, o en el contexto de reducir drásticamente la complejidad de los enfoques de redes neuronales profundas como una primera capa libre de contexto.