Un modelo híbrido novedoso de optimización genética de ballenas para el aprendizaje de ontologías a partir de texto en árabe
Autores: Ghoniem, Rania M.; Alhelwa, Nawal; Shaalan, Khaled
Idioma: Inglés
Editor: MDPI
Año: 2019
Acceso abierto
Artículo científico
2019
Un modelo híbrido novedoso de optimización genética de ballenas para el aprendizaje de ontologías a partir de texto en árabe
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería de Software
Palabras clave
Ontologías
Aprendizaje de ontología
Texto árabe
Relaciones semánticas
Pesos de frecuencia de conceptos
Algoritmo de optimización de ballenas genéticas
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 20
Citaciones: Sin citaciones
Las ontologías se utilizan para modelar conocimiento en varios dominios de interés, como el dominio biomédico. La conceptualización es la tarea básica para la construcción de la ontología. Los conceptos se identifican y luego se vinculan a través de sus relaciones semánticas. Recientemente, las ontologías han constituido una parte crucial de las redes semánticas modernas porque pueden convertir una red de documentos en una red de cosas. Aunque el aprendizaje de ontologías generalmente ocupa un gran espacio en la informática, el aprendizaje de ontologías árabes, en particular, está subdesarrollado debido a la naturaleza del idioma árabe y a la profundidad requerida en este dominio. La investigación previamente publicada sobre el aprendizaje de ontologías árabes a partir de texto se divide en tres categorías: desarrollo de reglas hechas a mano de forma manual, uso de algoritmos de aprendizaje automático supervisados/no supervisados ordinarios, o una combinación híbrida de estos dos enfoques. El modelo propuesto en este trabajo contribuye al aprendizaje de ontologías árabes de dos maneras. Primero, se propone un algoritmo de minería de texto para extraer conceptos y sus relaciones semánticas de documentos de texto. El algoritmo calcula los pesos de frecuencia de los conceptos utilizando los pesos de frecuencia de términos. Luego, calcula los pesos de similitud de conceptos utilizando la información de la estructura de la ontología, que involucra (1) la distancia del camino del concepto, (2) la capa de distribución del concepto, y (3) la capa de distribución del concepto padre mutuo. Luego, se realiza un mapeo de características asignando las similitudes de los conceptos a las características del concepto. En segundo lugar, se propuso un algoritmo híbrido de optimización genética-ballena para optimizar el aprendizaje de ontologías a partir de texto árabe. El operador del G-WOA es un operador híbrido que integra la mutación, el cruce y los procesos de selección de GA con los procesos de WOA (cercar a la presa, atacar la red de burbujas y buscar presas) para cumplir con el equilibrio entre la explotación y la exploración, y encontrar las soluciones que presentan la mayor aptitud. Para evaluar el rendimiento del enfoque de aprendizaje de ontologías, se realizan comparaciones extensas utilizando diferentes corpora árabes y algoritmos de optimización bioinspirados. Además, se utilizan dos corpora públicos no árabes para comparar la eficiencia del enfoque propuesto con la de otros idiomas. Los resultados revelan que el algoritmo de optimización genética-ballena propuesto supera a los otros algoritmos comparados en todos los corpora árabes en términos de precisión, recuperación y medidas de puntuación F. Además, el enfoque propuesto supera a los métodos de vanguardia de aprendizaje de ontologías de textos árabes y no árabes en términos de estas tres medidas.
Descripción
Las ontologías se utilizan para modelar conocimiento en varios dominios de interés, como el dominio biomédico. La conceptualización es la tarea básica para la construcción de la ontología. Los conceptos se identifican y luego se vinculan a través de sus relaciones semánticas. Recientemente, las ontologías han constituido una parte crucial de las redes semánticas modernas porque pueden convertir una red de documentos en una red de cosas. Aunque el aprendizaje de ontologías generalmente ocupa un gran espacio en la informática, el aprendizaje de ontologías árabes, en particular, está subdesarrollado debido a la naturaleza del idioma árabe y a la profundidad requerida en este dominio. La investigación previamente publicada sobre el aprendizaje de ontologías árabes a partir de texto se divide en tres categorías: desarrollo de reglas hechas a mano de forma manual, uso de algoritmos de aprendizaje automático supervisados/no supervisados ordinarios, o una combinación híbrida de estos dos enfoques. El modelo propuesto en este trabajo contribuye al aprendizaje de ontologías árabes de dos maneras. Primero, se propone un algoritmo de minería de texto para extraer conceptos y sus relaciones semánticas de documentos de texto. El algoritmo calcula los pesos de frecuencia de los conceptos utilizando los pesos de frecuencia de términos. Luego, calcula los pesos de similitud de conceptos utilizando la información de la estructura de la ontología, que involucra (1) la distancia del camino del concepto, (2) la capa de distribución del concepto, y (3) la capa de distribución del concepto padre mutuo. Luego, se realiza un mapeo de características asignando las similitudes de los conceptos a las características del concepto. En segundo lugar, se propuso un algoritmo híbrido de optimización genética-ballena para optimizar el aprendizaje de ontologías a partir de texto árabe. El operador del G-WOA es un operador híbrido que integra la mutación, el cruce y los procesos de selección de GA con los procesos de WOA (cercar a la presa, atacar la red de burbujas y buscar presas) para cumplir con el equilibrio entre la explotación y la exploración, y encontrar las soluciones que presentan la mayor aptitud. Para evaluar el rendimiento del enfoque de aprendizaje de ontologías, se realizan comparaciones extensas utilizando diferentes corpora árabes y algoritmos de optimización bioinspirados. Además, se utilizan dos corpora públicos no árabes para comparar la eficiencia del enfoque propuesto con la de otros idiomas. Los resultados revelan que el algoritmo de optimización genética-ballena propuesto supera a los otros algoritmos comparados en todos los corpora árabes en términos de precisión, recuperación y medidas de puntuación F. Además, el enfoque propuesto supera a los métodos de vanguardia de aprendizaje de ontologías de textos árabes y no árabes en términos de estas tres medidas.