Relaciones Semánticas de Texto Explicables: Un Marco de Preguntas y Respuestas para Comparar el Contenido de Documentos
Autores: Aperstein, Yehudit; Gottlib, Alon; Benita, Gal; Apartsin, Alexander
Idioma: Inglés
Editor: MDPI
Año: 2025
Acceso abierto
Artículo científico
2025
Relaciones Semánticas de Texto Explicables: Un Marco de Preguntas y Respuestas para Comparar el Contenido de Documentos
Categoría
Gestión y administración
Subcategoría
Gestión de la tecnología y la inovación
Palabras clave
Relaciones semánticas
Tareas de gestión de información
Salidas explicables
Relación semántica de texto
Conjuntos de preguntas respondibles
Relaciones informativas detalladas
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
Entender las relaciones semánticas entre dos textos es crucial para muchas tareas de gestión de información y documentos, en las que se debe determinar si el contenido se superpone completamente, es completamente reemplazado por otro documento, o se superpone solo parcialmente, con información única en cada uno. Más allá de establecer esta relación, es igualmente importante proporcionar resultados explicables que especifiquen qué piezas de información están presentes, faltantes o recién añadidas entre el par de textos. En este estudio, definimos formalmente las relaciones semánticas entre dos textos a través de la relación de teoría de conjuntos entre sus respectivos Conjuntos de Preguntas Respondibles (AQS), los conjuntos de preguntas que cada texto puede responder. Bajo esta formulación, la Relación Semántica de Texto (STR), como equivalencia, inclusión y superposición mutua, se convierte en una relación de conjunto bien definida entre los AQS correspondientes de los textos. Las diferencias de conjunto entre los AQS también sirven como una herramienta de explicación o diagnóstico para identificar cómo la información en los textos diverge. Usando esta definición, construimos un banco de pruebas sintético que captura relaciones informativas detalladas a través de parafraseo controlado y eliminación deliberada de información apoyada por manipulaciones de AQS. Luego utilizamos este conjunto de datos para evaluar varios modelos discriminativos y generativos para clasificar pares de textos en categorías de STR, evaluando qué tan bien diferentes arquitecturas de modelos capturan relaciones semánticas más allá de la similitud superficial. Publicamos tanto el conjunto de datos como el código de generación de datos para apoyar investigaciones futuras.
Descripción
Entender las relaciones semánticas entre dos textos es crucial para muchas tareas de gestión de información y documentos, en las que se debe determinar si el contenido se superpone completamente, es completamente reemplazado por otro documento, o se superpone solo parcialmente, con información única en cada uno. Más allá de establecer esta relación, es igualmente importante proporcionar resultados explicables que especifiquen qué piezas de información están presentes, faltantes o recién añadidas entre el par de textos. En este estudio, definimos formalmente las relaciones semánticas entre dos textos a través de la relación de teoría de conjuntos entre sus respectivos Conjuntos de Preguntas Respondibles (AQS), los conjuntos de preguntas que cada texto puede responder. Bajo esta formulación, la Relación Semántica de Texto (STR), como equivalencia, inclusión y superposición mutua, se convierte en una relación de conjunto bien definida entre los AQS correspondientes de los textos. Las diferencias de conjunto entre los AQS también sirven como una herramienta de explicación o diagnóstico para identificar cómo la información en los textos diverge. Usando esta definición, construimos un banco de pruebas sintético que captura relaciones informativas detalladas a través de parafraseo controlado y eliminación deliberada de información apoyada por manipulaciones de AQS. Luego utilizamos este conjunto de datos para evaluar varios modelos discriminativos y generativos para clasificar pares de textos en categorías de STR, evaluando qué tan bien diferentes arquitecturas de modelos capturan relaciones semánticas más allá de la similitud superficial. Publicamos tanto el conjunto de datos como el código de generación de datos para apoyar investigaciones futuras.