logo móvil
Contáctanos

Relaciones Semánticas de Texto Explicables: Un Marco de Preguntas y Respuestas para Comparar el Contenido de Documentos

Autores: Aperstein, Yehudit; Gottlib, Alon; Benita, Gal; Apartsin, Alexander

Idioma: Inglés

Editor: MDPI

Año: 2025

Descargar PDF

Acceso abierto

Artículo científico
2025

Relaciones Semánticas de Texto Explicables: Un Marco de Preguntas y Respuestas para Comparar el Contenido de Documentos


Categoría

Gestión y administración

Subcategoría

Gestión de la tecnología y la inovación

Palabras clave

Relaciones semánticas
Tareas de gestión de información
Salidas explicables
Relación semántica de texto
Conjuntos de preguntas respondibles
Relaciones informativas detalladas

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 1

Citaciones: Sin citaciones


Descripción
Entender las relaciones semánticas entre dos textos es crucial para muchas tareas de gestión de información y documentos, en las que se debe determinar si el contenido se superpone completamente, es completamente reemplazado por otro documento, o se superpone solo parcialmente, con información única en cada uno. Más allá de establecer esta relación, es igualmente importante proporcionar resultados explicables que especifiquen qué piezas de información están presentes, faltantes o recién añadidas entre el par de textos. En este estudio, definimos formalmente las relaciones semánticas entre dos textos a través de la relación de teoría de conjuntos entre sus respectivos Conjuntos de Preguntas Respondibles (AQS), los conjuntos de preguntas que cada texto puede responder. Bajo esta formulación, la Relación Semántica de Texto (STR), como equivalencia, inclusión y superposición mutua, se convierte en una relación de conjunto bien definida entre los AQS correspondientes de los textos. Las diferencias de conjunto entre los AQS también sirven como una herramienta de explicación o diagnóstico para identificar cómo la información en los textos diverge. Usando esta definición, construimos un banco de pruebas sintético que captura relaciones informativas detalladas a través de parafraseo controlado y eliminación deliberada de información apoyada por manipulaciones de AQS. Luego utilizamos este conjunto de datos para evaluar varios modelos discriminativos y generativos para clasificar pares de textos en categorías de STR, evaluando qué tan bien diferentes arquitecturas de modelos capturan relaciones semánticas más allá de la similitud superficial. Publicamos tanto el conjunto de datos como el código de generación de datos para apoyar investigaciones futuras.

Otros recursos que podrían interesarte

Temas Virtualpro