Detección de Indicadores de Riesgo de Corrupción Impulsados por IA: Una Evaluación Comparativa de Modelos de PLN Basados en Transformadores en Datos de Adquisición No Estructurados
Autores: Peppes, Nikolaos; Alexakis, Theodoros; Daskalakis, Emmanouil; Adamopoulou, Evgenia
Idioma: Inglés
Editor: MDPI
Año: 2026
Acceso abierto
Artículo científico
2026
Detección de Indicadores de Riesgo de Corrupción Impulsados por IA: Una Evaluación Comparativa de Modelos de PLN Basados en Transformadores en Datos de Adquisición No Estructurados
Categoría
Gestión y administración
Subcategoría
Gestión de la tecnología y la inovación
Palabras clave
Detección
Indicadores relacionados con la corrupción
Arquitecturas de PLN basadas en transformadores
Textos de adquisiciones
Evaluación del rendimiento
Modelos de transformadores contextuales
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
La detección de indicadores relacionados con la corrupción en datos de adquisiciones textuales no estructurados sigue siendo una tarea compleja debido a la ambigüedad lingüística, la variación contextual y la terminología específica del dominio. Este estudio presenta una evaluación comparativa de tres arquitecturas de Procesamiento de Lenguaje Natural (NLP) basadas en transformadores (BERT-base-uncased, RoBERTa-base y DeBERTa-v3-base) para la detección automatizada de indicadores de riesgo de corrupción en textos de adquisiciones provenientes de fuentes heterogéneas. Se construye un conjunto de datos unificado al vincular documentación técnica no estructurada con resultados de adquisiciones estructurados, lo que permite una estrategia de etiquetado de riesgo impulsada por resultados. La evaluación del rendimiento se lleva a cabo a través de diferentes métricas, incluyendo precisión, recuperación, puntuación F1 y ROC-AUC, complementada por un análisis de explicabilidad utilizando Gradientes Integrados. Los resultados demuestran una clara progresión en el rendimiento y destacan las fortalezas comparativas de las arquitecturas evaluadas. En general, este estudio resalta el potencial de los modelos de transformadores contextuales para apoyar sistemas de monitoreo anticorrupción escalables, transparentes y operativos.
Descripción
La detección de indicadores relacionados con la corrupción en datos de adquisiciones textuales no estructurados sigue siendo una tarea compleja debido a la ambigüedad lingüística, la variación contextual y la terminología específica del dominio. Este estudio presenta una evaluación comparativa de tres arquitecturas de Procesamiento de Lenguaje Natural (NLP) basadas en transformadores (BERT-base-uncased, RoBERTa-base y DeBERTa-v3-base) para la detección automatizada de indicadores de riesgo de corrupción en textos de adquisiciones provenientes de fuentes heterogéneas. Se construye un conjunto de datos unificado al vincular documentación técnica no estructurada con resultados de adquisiciones estructurados, lo que permite una estrategia de etiquetado de riesgo impulsada por resultados. La evaluación del rendimiento se lleva a cabo a través de diferentes métricas, incluyendo precisión, recuperación, puntuación F1 y ROC-AUC, complementada por un análisis de explicabilidad utilizando Gradientes Integrados. Los resultados demuestran una clara progresión en el rendimiento y destacan las fortalezas comparativas de las arquitecturas evaluadas. En general, este estudio resalta el potencial de los modelos de transformadores contextuales para apoyar sistemas de monitoreo anticorrupción escalables, transparentes y operativos.