Otnel: una metodología de anotación semántica en línea distribuida de aprendizaje profundo
Autores: Makris, Christos; Simos, Michael Angelos
Idioma: Inglés
Editor: MDPI
Año: 2020
Acceso abierto
Artículo científico
2020
Otnel: una metodología de anotación semántica en línea distribuida de aprendizaje profundo
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería de Sistemas
Palabras clave
Representación semántica
Texto no estructurado
Metodología de aprendizaje profundo
Desambiguación de entidades nombradas
Wikipedia
Entrenamiento en línea
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 45
Citaciones: Sin citaciones
La representación semántica del texto no estructurado es crucial en las aplicaciones modernas de inteligencia artificial y recuperación de información. El proceso de extracción de información semántica de un fragmento de texto no estructurado a una representación correspondiente de una ontología de conceptos se conoce como desambiguación de entidades nombradas. En este trabajo, presentamos una metodología distribuida, supervisada de aprendizaje profundo que emplea un modelo de arquitectura de aprendizaje profundo basado en memoria a corto y largo plazo para la vinculación de entidades con Wikipedia. En el contexto de un mundo en línea que cambia con frecuencia, presentamos y estudiamos el dominio de la desambiguación de entidades nombradas de entrenamiento en línea, que destaca la adaptación sobre la marcha a los cambios de conocimiento subyacentes. Nuestra metodología novedosa evalúa menciones de anclaje polisémicas con compatibilidad de sentido basada en la segmentación temática de la representación del grafo de conocimiento de Wikipedia. Nuestro objetivo es lograr tanto un rendimiento robusto como resultados de alta precisión en la vinculación de entidades. El proceso de modelado presentado aborda eficientemente los desafíos de conceptualización, formalización y computación para la tarea de vinculación de entidades de entrenamiento en línea. El novedoso concepto de entrenamiento en línea puede ser explotado para una adopción más amplia, ya que es considerablemente beneficioso para un consenso de contexto global en línea para la desambiguación de entidades en un tema específico dirigido.
Descripción
La representación semántica del texto no estructurado es crucial en las aplicaciones modernas de inteligencia artificial y recuperación de información. El proceso de extracción de información semántica de un fragmento de texto no estructurado a una representación correspondiente de una ontología de conceptos se conoce como desambiguación de entidades nombradas. En este trabajo, presentamos una metodología distribuida, supervisada de aprendizaje profundo que emplea un modelo de arquitectura de aprendizaje profundo basado en memoria a corto y largo plazo para la vinculación de entidades con Wikipedia. En el contexto de un mundo en línea que cambia con frecuencia, presentamos y estudiamos el dominio de la desambiguación de entidades nombradas de entrenamiento en línea, que destaca la adaptación sobre la marcha a los cambios de conocimiento subyacentes. Nuestra metodología novedosa evalúa menciones de anclaje polisémicas con compatibilidad de sentido basada en la segmentación temática de la representación del grafo de conocimiento de Wikipedia. Nuestro objetivo es lograr tanto un rendimiento robusto como resultados de alta precisión en la vinculación de entidades. El proceso de modelado presentado aborda eficientemente los desafíos de conceptualización, formalización y computación para la tarea de vinculación de entidades de entrenamiento en línea. El novedoso concepto de entrenamiento en línea puede ser explotado para una adopción más amplia, ya que es considerablemente beneficioso para un consenso de contexto global en línea para la desambiguación de entidades en un tema específico dirigido.