Extracción y Representación de Eventos: Un Estudio de Caso para el Idioma Portugués
Autores: Quaresma, Paulo; Nogueira, Vítor Beires; Raiyani, Kashyap; Bayot, Roy
Idioma: Inglés
Editor: MDPI
Año: 2019
Acceso abierto
Artículo científico
2019
Extracción y Representación de Eventos: Un Estudio de Caso para el Idioma Portugués
Categoría
Gestión y administración
Subcategoría
Gestión de la tecnología y la inovación
Palabras clave
Extracción de información
Extracción de eventos
Procesamiento de lenguaje natural
Ontologías
Extracción de conocimiento
Documentos en portugués
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
La extracción de información de texto es una tarea importante del procesamiento del lenguaje natural (NLP), que tiene como objetivo identificar, extraer y representar automáticamente información del texto. En este contexto, la extracción de eventos juega un papel relevante, permitiendo identificar y representar acciones, agentes, objetos, lugares y períodos de tiempo. La información extraída puede ser representada por ontologías especializadas, apoyando procesos de razonamiento e inferencia basados en el conocimiento. En este trabajo, describiremos, en detalle, nuestra propuesta para la extracción de eventos de documentos en portugués. El enfoque propuesto se basa en un conjunto de herramientas especializadas de procesamiento del lenguaje natural; a saber, un etiquetador de partes del discurso, un reconocedor de entidades nombradas, un analizador de dependencias, etiquetado de roles semánticos y un módulo de extracción de conocimiento. La arquitectura es independiente del idioma, pero sus módulos son dependientes del idioma y pueden ser construidos utilizando metodologías adecuadas de IA (es decir, basadas en reglas o aprendizaje automático). El sistema desarrollado fue evaluado con un corpus de textos en portugués y los resultados obtenidos se presentan y analizan. Las limitaciones actuales y el trabajo futuro se discuten en detalle.
Descripción
La extracción de información de texto es una tarea importante del procesamiento del lenguaje natural (NLP), que tiene como objetivo identificar, extraer y representar automáticamente información del texto. En este contexto, la extracción de eventos juega un papel relevante, permitiendo identificar y representar acciones, agentes, objetos, lugares y períodos de tiempo. La información extraída puede ser representada por ontologías especializadas, apoyando procesos de razonamiento e inferencia basados en el conocimiento. En este trabajo, describiremos, en detalle, nuestra propuesta para la extracción de eventos de documentos en portugués. El enfoque propuesto se basa en un conjunto de herramientas especializadas de procesamiento del lenguaje natural; a saber, un etiquetador de partes del discurso, un reconocedor de entidades nombradas, un analizador de dependencias, etiquetado de roles semánticos y un módulo de extracción de conocimiento. La arquitectura es independiente del idioma, pero sus módulos son dependientes del idioma y pueden ser construidos utilizando metodologías adecuadas de IA (es decir, basadas en reglas o aprendizaje automático). El sistema desarrollado fue evaluado con un corpus de textos en portugués y los resultados obtenidos se presentan y analizan. Las limitaciones actuales y el trabajo futuro se discuten en detalle.