Modelando la tarea de detección de paráfrasis sobre una red de grafos heterogénea con aumento de datos
Autores: Anchiêta, Rafael T.; Sousa, Rogério F. de; Pardo, Thiago A. S.
Idioma: Inglés
Editor: MDPI
Año: 2020
Acceso abierto
Artículo científico
2020
Modelando la tarea de detección de paráfrasis sobre una red de grafos heterogénea con aumento de datos
Categoría
Gestión y administración
Subcategoría
Gestión de la tecnología y la inovación
Palabras clave
Detección de paráfrasis
Procesamiento del lenguaje natural
Solución de aprendizaje automático
Representación de estructura gráfica
Estrategia de retrotraducción
Relación semántica
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
La detección de paráfrasis es una tarea de Procesamiento de Lenguaje Natural (NLP) que tiene como objetivo identificar automáticamente si dos oraciones transmiten el mismo significado (incluso con diferentes palabras). Para el idioma portugués, la mayoría de los trabajos modelan esta tarea como una solución de aprendizaje automático, extrayendo características y entrenando un clasificador. En este artículo, siguiendo una línea diferente, exploramos una representación de estructura gráfica y modelamos la tarea de identificación de paráfrasis sobre una red heterogénea. También adoptamos una estrategia de retrotraducción para la augmentación de datos con el fin de equilibrar el conjunto de datos que utilizamos. Nuestro enfoque, aunque simple, supera los mejores resultados reportados para la tarea de detección de paráfrasis en portugués, mostrando que las estructuras gráficas pueden capturar mejor la relación semántica entre las oraciones.
Descripción
La detección de paráfrasis es una tarea de Procesamiento de Lenguaje Natural (NLP) que tiene como objetivo identificar automáticamente si dos oraciones transmiten el mismo significado (incluso con diferentes palabras). Para el idioma portugués, la mayoría de los trabajos modelan esta tarea como una solución de aprendizaje automático, extrayendo características y entrenando un clasificador. En este artículo, siguiendo una línea diferente, exploramos una representación de estructura gráfica y modelamos la tarea de identificación de paráfrasis sobre una red heterogénea. También adoptamos una estrategia de retrotraducción para la augmentación de datos con el fin de equilibrar el conjunto de datos que utilizamos. Nuestro enfoque, aunque simple, supera los mejores resultados reportados para la tarea de detección de paráfrasis en portugués, mostrando que las estructuras gráficas pueden capturar mejor la relación semántica entre las oraciones.