Algoritmo para el cálculo acelerado de distancias conceptuales en grandes grafos de conocimiento
Autores: Quintero, Rolando; Mendiola, Esteban; Guzmán, Giovanni; Torres-Ruiz, Miguel; Guzmán Sánchez-Mejorada, Carlos
Idioma: Inglés
Editor: MDPI
Año: 2023
Acceso abierto
Artículo científico
2023
Algoritmo para el cálculo acelerado de distancias conceptuales en grandes grafos de conocimiento
Categoría
Matemáticas
Subcategoría
Matemáticas generales
Palabras clave
Distancia conceptual
Similitud semántica
Relaciones
DIS-C
Computación
Algoritmos
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 28
Citaciones: Sin citaciones
La distancia conceptual se refiere al grado de proximidad entre dos conceptos dentro de una conceptualización. Está estrechamente relacionada con la similitud semántica y las relaciones, pero su medición depende fuertemente del contexto de los conceptos dados. DIS-C representa un avance en el cálculo de la similitud/relaciones semánticas que es independiente del tipo de estructura de conocimiento y relaciones semánticas al generar un grafo a partir de una base de conocimiento (ontologías, redes semánticas, jerarquías, entre otros). Este enfoque determina la similitud semántica entre dos conceptos conectados indirectamente en una ontología propagando distancias locales mediante la aplicación de un algoritmo basado en el problema de Todos los Pares de Caminos Más Cortos (APSP). Este proceso se implementa para cada par de conceptos para establecer los caminos más efectivos y eficientes para conectar estos conceptos. El algoritmo identifica el camino más corto entre conceptos, lo que permite inferir las relaciones más relevantes entre ellos. Sin embargo, uno de los problemas críticos con este proceso es la complejidad computacional, combinada con el diseño de algoritmos APSP, como Dijkstra, que es. Este documento estudia diferentes alternativas para mejorar el enfoque DIS-C adaptando algoritmos de aproximación, centrándose en Dijkstra, Dijkstra podado y métodos basados en esbozos, para calcular la distancia conceptual de acuerdo con la necesidad de escalar DIS-C para analizar grafos muy grandes; por lo tanto, reducir la complejidad computacional relacionada es crítico. Se realizaron pruebas utilizando diferentes conjuntos de datos para calcular la distancia conceptual al usar la versión original de DIS-C y al usar el área de influencia de los nodos. En situaciones donde la optimización del tiempo es necesaria para generar resultados, usar el modelo DIS-C original no es el método óptimo. Por lo tanto, proponemos una versión simplificada de DIS-C para calcular distancias conceptuales basadas en la estimación de centralidad. Los resultados obtenidos para la versión simple de DIS-C indicaron que el tiempo de procesamiento disminuyó 2.381 veces en comparación con la versión original de DIS-C. Además, para ambas versiones de DIS-C (normal y simple), el algoritmo APSP disminuyó el costo computacional al utilizar un enfoque basado en la cobertura de dos saltos.
Descripción
La distancia conceptual se refiere al grado de proximidad entre dos conceptos dentro de una conceptualización. Está estrechamente relacionada con la similitud semántica y las relaciones, pero su medición depende fuertemente del contexto de los conceptos dados. DIS-C representa un avance en el cálculo de la similitud/relaciones semánticas que es independiente del tipo de estructura de conocimiento y relaciones semánticas al generar un grafo a partir de una base de conocimiento (ontologías, redes semánticas, jerarquías, entre otros). Este enfoque determina la similitud semántica entre dos conceptos conectados indirectamente en una ontología propagando distancias locales mediante la aplicación de un algoritmo basado en el problema de Todos los Pares de Caminos Más Cortos (APSP). Este proceso se implementa para cada par de conceptos para establecer los caminos más efectivos y eficientes para conectar estos conceptos. El algoritmo identifica el camino más corto entre conceptos, lo que permite inferir las relaciones más relevantes entre ellos. Sin embargo, uno de los problemas críticos con este proceso es la complejidad computacional, combinada con el diseño de algoritmos APSP, como Dijkstra, que es. Este documento estudia diferentes alternativas para mejorar el enfoque DIS-C adaptando algoritmos de aproximación, centrándose en Dijkstra, Dijkstra podado y métodos basados en esbozos, para calcular la distancia conceptual de acuerdo con la necesidad de escalar DIS-C para analizar grafos muy grandes; por lo tanto, reducir la complejidad computacional relacionada es crítico. Se realizaron pruebas utilizando diferentes conjuntos de datos para calcular la distancia conceptual al usar la versión original de DIS-C y al usar el área de influencia de los nodos. En situaciones donde la optimización del tiempo es necesaria para generar resultados, usar el modelo DIS-C original no es el método óptimo. Por lo tanto, proponemos una versión simplificada de DIS-C para calcular distancias conceptuales basadas en la estimación de centralidad. Los resultados obtenidos para la versión simple de DIS-C indicaron que el tiempo de procesamiento disminuyó 2.381 veces en comparación con la versión original de DIS-C. Además, para ambas versiones de DIS-C (normal y simple), el algoritmo APSP disminuyó el costo computacional al utilizar un enfoque basado en la cobertura de dos saltos.