Mejorando la Interpretabilidad de los Modelos de NLI Usando LLMs y Algoritmos de Aprendizaje Activo
Autores: Wang, Qi; Liu, Junqiang
Idioma: Inglés
Editor: MDPI
Año: 2026
Acceso abierto
Artículo científico
2026
Mejorando la Interpretabilidad de los Modelos de NLI Usando LLMs y Algoritmos de Aprendizaje Activo
Categoría
Gestión y administración
Subcategoría
Gestión de la tecnología y la inovación
Palabras clave
Inferencia de lenguaje natural
Interpretabilidad
Aprendizaje activo
Modelo de generación de explicaciones
Modelos de lenguaje grandes
Ingeniería de prompts
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
En el campo de la Inferencia de Lenguaje Natural (NLI), la interpretabilidad del modelo sigue siendo un desafío urgente y no resuelto. Los conjuntos de datos anotados orientados a la interpretabilidad existentes son muy limitados, y construir manualmente explicaciones en lenguaje natural es costoso e inconsistente, lo que dificulta equilibrar el rendimiento del modelo y la interpretabilidad. Para abordar este problema, este artículo propone un marco de NLI interpretable basado en aprendizaje activo, Modelo de Generación de Explicaciones - Modelo de Predicción (EGM-PM), y diseña un algoritmo de muestreo de aprendizaje activo, Transición Consciente de Explicaciones de Clustering a Margen (ETCM), que incorpora información de explicaciones en lenguaje natural. En este marco, se emplean Modelos de Lenguaje Grande (LLMs) para automatizar la anotación de explicaciones, reduciendo la dependencia de expertos humanos en el aprendizaje activo tradicional. Un pequeño número de muestras de alto valor obtenidas a través del muestreo ETCM se utilizan para entrenar el EGM, cuyas explicaciones generadas en lenguaje natural se utilizan para guiar al PM en la inferencia de etiquetas. Los resultados experimentales muestran que los datos muestreados por ETCM mejoran sustancialmente la capacidad del modelo para aprender estructuras relacionales y lógicas entre pares de premisa e hipótesis. En comparación con otros algoritmos de aprendizaje activo, ETCM se acerca más rápidamente al rendimiento de datos completos mientras utiliza significativamente menos muestras etiquetadas. Este hallazgo confirma el valor de la semántica de la explicación en lenguaje natural para mejorar tanto el rendimiento del modelo como la interpretabilidad. Además, este artículo emplea ingeniería de prompts para construir un conjunto de datos de NLI orientado a la interpretabilidad, Inferencia de Lenguaje Natural Explicable (ExNLI), que augments los pares de premisa e hipótesis tradicionales con explicaciones en lenguaje natural. Las evaluaciones humanas y automatizadas confirman la consistencia y fidelidad de estas explicaciones. El conjunto de datos ha sido publicado públicamente, ofreciendo un enfoque de construcción de datos de bajo costo y escalable para futuras investigaciones sobre NLI explicable.
Descripción
En el campo de la Inferencia de Lenguaje Natural (NLI), la interpretabilidad del modelo sigue siendo un desafío urgente y no resuelto. Los conjuntos de datos anotados orientados a la interpretabilidad existentes son muy limitados, y construir manualmente explicaciones en lenguaje natural es costoso e inconsistente, lo que dificulta equilibrar el rendimiento del modelo y la interpretabilidad. Para abordar este problema, este artículo propone un marco de NLI interpretable basado en aprendizaje activo, Modelo de Generación de Explicaciones - Modelo de Predicción (EGM-PM), y diseña un algoritmo de muestreo de aprendizaje activo, Transición Consciente de Explicaciones de Clustering a Margen (ETCM), que incorpora información de explicaciones en lenguaje natural. En este marco, se emplean Modelos de Lenguaje Grande (LLMs) para automatizar la anotación de explicaciones, reduciendo la dependencia de expertos humanos en el aprendizaje activo tradicional. Un pequeño número de muestras de alto valor obtenidas a través del muestreo ETCM se utilizan para entrenar el EGM, cuyas explicaciones generadas en lenguaje natural se utilizan para guiar al PM en la inferencia de etiquetas. Los resultados experimentales muestran que los datos muestreados por ETCM mejoran sustancialmente la capacidad del modelo para aprender estructuras relacionales y lógicas entre pares de premisa e hipótesis. En comparación con otros algoritmos de aprendizaje activo, ETCM se acerca más rápidamente al rendimiento de datos completos mientras utiliza significativamente menos muestras etiquetadas. Este hallazgo confirma el valor de la semántica de la explicación en lenguaje natural para mejorar tanto el rendimiento del modelo como la interpretabilidad. Además, este artículo emplea ingeniería de prompts para construir un conjunto de datos de NLI orientado a la interpretabilidad, Inferencia de Lenguaje Natural Explicable (ExNLI), que augments los pares de premisa e hipótesis tradicionales con explicaciones en lenguaje natural. Las evaluaciones humanas y automatizadas confirman la consistencia y fidelidad de estas explicaciones. El conjunto de datos ha sido publicado públicamente, ofreciendo un enfoque de construcción de datos de bajo costo y escalable para futuras investigaciones sobre NLI explicable.