logo móvil
Contáctanos

Polaridad Lingüística y Arquitectura de Decisiones en el Filtrado Abstracto Basado en LLM para Revisiones Sistemáticas

Autores: Behrouzian, Amir M.; Meleti, Marco; Colangelo, Maria Teresa; Calciolari, Elena; Galli, Carlo

Idioma: Inglés

Editor: MDPI

Año: 2026

Descargar PDF

Acceso abierto

Artículo científico
2026

Polaridad Lingüística y Arquitectura de Decisiones en el Filtrado Abstracto Basado en LLM para Revisiones Sistemáticas


Categoría

Gestión y administración

Subcategoría

Gestión de la tecnología y la inovación

Palabras clave

Modelos de lenguaje
Cribado abstracto
Complejidad lingüística
Criterios de elegibilidad
Variantes de polaridad
Arquitectura de decisiones

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 1

Citaciones: Sin citaciones


Descripción
Los modelos de lenguaje grandes (LLMs) están siendo cada vez más investigados para el cribado abstracto en revisiones sistemáticas, sin embargo, sigue sin estar claro si los errores de cribado atribuidos a la complejidad lingüística surgen de la sensibilidad semántica intrínseca o de su interacción con la arquitectura de decisión. Examinamos cómo cinco variantes de polaridad de criterios de elegibilidad lógicamente equivalentes -inclusión afirmativa, exclusión antónima, negación de predicado, negación a nivel de verbo y doble negación- afectan los resultados del cribado en una tarea biomédica controlada. Utilizando 1000 resúmenes de un corpus de revisión de Cochrane reconstruido (50 OBJETIVO; 950 no objetivos), implementamos cuatro criterios visibles en el resumen dentro de un pipeline secuencial de puertas duras, donde el fallo en cualquier paso desencadenaba una exclusión irreversible. Bajo el gating duro, la polaridad lingüística por sí sola produjo una variación sustancial y estadísticamente significativa en la recuperación. Para GPT-5.1, la recuperación osciló entre 0.72 y 0.32 a pesar de los predicados lógicos e datos de entrada idénticos. La replicación con GPT-3.5 Turbo arrojó una divergencia similar (0.92-0.18), confirmando la generalización a través de generaciones de modelos. Las pérdidas de OBJETIVO se concentraron en criterios que típicamente se satisfacen pero se informan de manera inconsistente en los resúmenes, lo que indica una exclusión conservadora bajo la especificación insuficiente de evidencia. Para evaluar si este efecto es semántico o arquitectónico, reimplementamos el cribado utilizando un marco de acumulación de evidencia basado en puntuaciones en el que cada criterio contribuía con apoyo graduado y la inclusión se determinaba mediante un umbral ajustable. Bajo la puntuación, la recuperación aumentó en todas las variantes y convergió dentro de un régimen de alta sensibilidad, mientras que los efectos de polaridad residuales se atenuaron pero permanecieron detectables. Las diferencias lingüísticas cambiaron de un colapso estructural de recuperación a compensaciones controladas de precisión-recall. Estos hallazgos muestran que la sensibilidad a la negación está fuertemente mediada por la arquitectura de decisión. El gating irreversible amplifica la incertidumbre local en exclusiones de falsos negativos, mientras que la puntuación acumulativa preserva la incertidumbre y permite umbrales operativos controlables.

Otros recursos que podrían interesarte

Temas Virtualpro