Anotación Semántica Ontológica de un Corpus en Inglés a Través de Campos Aleatorios Condicionados
Autores: de Andrade, Guidson Coelho; de Paiva Oliveira, Alcione; Moreira, Alexandra
Idioma: Inglés
Editor: MDPI
Año: 2019
Acceso abierto
Artículo científico
2019
Anotación Semántica Ontológica de un Corpus en Inglés a Través de Campos Aleatorios Condicionados
Categoría
Gestión y administración
Subcategoría
Gestión de la tecnología y la inovación
Palabras clave
Información semántica
Etiquetas de metadatos
Anotación semántica
Ontologías
Técnicas de aprendizaje automático
Corpus
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
Una forma de aumentar la comprensión de los textos por parte de las máquinas es a través de la adición de información semántica a los elementos léxicos mediante la inclusión de etiquetas de metadatos, un proceso también llamado anotación semántica. Hay varios aspectos semánticos que se pueden añadir a las palabras, entre ellos la información sobre la naturaleza del concepto denotado a través de la asociación con una categoría de una ontología. La aplicación de ontologías en la tarea de anotación puede abarcar múltiples dominios. Sin embargo, esta investigación en particular centró su enfoque en ontologías de alto nivel debido a su característica de generalización. Considerando que la anotación es una tarea ardua que requiere tiempo y personal especializado para llevarla a cabo, se están explorando muchas formas de implementar la anotación semántica de manera automática. El uso de técnicas de aprendizaje automático es el enfoque más efectivo en el proceso de anotación. Otro factor de gran importancia para el éxito del proceso de entrenamiento de los algoritmos de aprendizaje supervisado es el uso de un corpus suficientemente grande que pueda condensar la variación lingüística del lenguaje natural. En este sentido, este artículo tiene como objetivo presentar un enfoque automático para enriquecer documentos del corpus de inglés americano a través de un modelo CRF para la anotación semántica de ontologías de alto nivel de Schema.org. La investigación utiliza dos enfoques del modelo obteniendo resultados prometedores para el desarrollo de la anotación semántica basada en ontologías de alto nivel. Aunque es una nueva línea de investigación, el uso de ontologías de alto nivel para el enriquecimiento semántico automático de textos puede contribuir significativamente a la mejora de la interpretación de textos por parte de las máquinas.
Descripción
Una forma de aumentar la comprensión de los textos por parte de las máquinas es a través de la adición de información semántica a los elementos léxicos mediante la inclusión de etiquetas de metadatos, un proceso también llamado anotación semántica. Hay varios aspectos semánticos que se pueden añadir a las palabras, entre ellos la información sobre la naturaleza del concepto denotado a través de la asociación con una categoría de una ontología. La aplicación de ontologías en la tarea de anotación puede abarcar múltiples dominios. Sin embargo, esta investigación en particular centró su enfoque en ontologías de alto nivel debido a su característica de generalización. Considerando que la anotación es una tarea ardua que requiere tiempo y personal especializado para llevarla a cabo, se están explorando muchas formas de implementar la anotación semántica de manera automática. El uso de técnicas de aprendizaje automático es el enfoque más efectivo en el proceso de anotación. Otro factor de gran importancia para el éxito del proceso de entrenamiento de los algoritmos de aprendizaje supervisado es el uso de un corpus suficientemente grande que pueda condensar la variación lingüística del lenguaje natural. En este sentido, este artículo tiene como objetivo presentar un enfoque automático para enriquecer documentos del corpus de inglés americano a través de un modelo CRF para la anotación semántica de ontologías de alto nivel de Schema.org. La investigación utiliza dos enfoques del modelo obteniendo resultados prometedores para el desarrollo de la anotación semántica basada en ontologías de alto nivel. Aunque es una nueva línea de investigación, el uso de ontologías de alto nivel para el enriquecimiento semántico automático de textos puede contribuir significativamente a la mejora de la interpretación de textos por parte de las máquinas.