Polaridad Lingüística y Arquitectura de Decisiones en el Filtrado Abstracto Basado en LLM para Revisiones Sistemáticas

Contáctanos

Temas

Artículos

XBooks

Revistas

Laboratorios

Showroom

Infografías

Recorridos

Videos

Perfiles

Actualidad

Polaridad Lingüística y Arquitectura de Decisiones en el Filtrado Abstracto Basado en LLM para Revisiones Sistemáticas

Autores: Behrouzian, Amir M.; Meleti, Marco; Colangelo, Maria Teresa; Calciolari, Elena; Galli, Carlo

Idioma: Inglés

Editor: MDPI

Año: 2026

Descargar PDF

Acceso abierto

Artículo científico

2026

Polaridad Lingüística y Arquitectura de Decisiones en el Filtrado Abstracto Basado en LLM para Revisiones Sistemáticas

Categoría

Gestión y administración

Subcategoría

Gestión de la tecnología y la inovación

Palabras clave

Modelos de lenguaje

Cribado abstracto

Complejidad lingüística

Criterios de elegibilidad

Variantes de polaridad

Arquitectura de decisiones

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 1

Citaciones: Sin citaciones

Los modelos de lenguaje grandes (LLMs) están siendo cada vez más investigados para el cribado abstracto en revisiones sistemáticas, sin embargo, sigue sin estar claro si los errores de cribado atribuidos a la complejidad lingüística surgen de la sensibilidad semántica intrínseca o de su interacción con la arquitectura de decisión. Examinamos cómo cinco variantes de polaridad de criterios de elegibilidad lógicamente equivalentes -inclusión afirmativa, exclusión antónima, negación de predicado, negación a nivel de verbo y doble negación- afectan los resultados del cribado en una tarea biomédica controlada. Utilizando 1000 resúmenes de un corpus de revisión de Cochrane reconstruido (50 OBJETIVO; 950 no objetivos), implementamos cuatro criterios visibles en el resumen dentro de un pipeline secuencial de puertas duras, donde el fallo en cualquier paso desencadenaba una exclusión irreversible. Bajo el gating duro, la polaridad lingüística por sí sola produjo una variación sustancial y estadísticamente significativa en la recuperación. Para GPT-5.1, la recuperación osciló entre 0.72 y 0.32 a pesar de los predicados lógicos e datos de entrada idénticos. La replicación con GPT-3.5 Turbo arrojó una divergencia similar (0.92-0.18), confirmando la generalización a través de generaciones de modelos. Las pérdidas de OBJETIVO se concentraron en criterios que típicamente se satisfacen pero se informan de manera inconsistente en los resúmenes, lo que indica una exclusión conservadora bajo la especificación insuficiente de evidencia. Para evaluar si este efecto es semántico o arquitectónico, reimplementamos el cribado utilizando un marco de acumulación de evidencia basado en puntuaciones en el que cada criterio contribuía con apoyo graduado y la inclusión se determinaba mediante un umbral ajustable. Bajo la puntuación, la recuperación aumentó en todas las variantes y convergió dentro de un régimen de alta sensibilidad, mientras que los efectos de polaridad residuales se atenuaron pero permanecieron detectables. Las diferencias lingüísticas cambiaron de un colapso estructural de recuperación a compensaciones controladas de precisión-recall. Estos hallazgos muestran que la sensibilidad a la negación está fuertemente mediada por la arquitectura de decisión. El gating irreversible amplifica la incertidumbre local en exclusiones de falsos negativos, mientras que la puntuación acumulativa preserva la incertidumbre y permite umbrales operativos controlables.

Descripción

Otros recursos que podrían interesarte

Ver todas

Temas Virtualpro

Ver todas

Categoría

Subcategoría

Palabras clave

Licencia

Citación bibliográfica

Formato

¡Regístrate ahora y conoce todos los espacios virtuales disponibles para tu institución!

Otros recursos que podrían interesarte

Temas Virtualpro