Mejorando la Interpretabilidad de los Modelos de NLI Usando LLMs y Algoritmos de Aprendizaje Activo

Contáctanos

Temas

Artículos

XBooks

Revistas

Laboratorios

Showroom

Infografías

Recorridos

Videos

Perfiles

Actualidad

Mejorando la Interpretabilidad de los Modelos de NLI Usando LLMs y Algoritmos de Aprendizaje Activo

Autores: Wang, Qi; Liu, Junqiang

Idioma: Inglés

Editor: MDPI

Año: 2026

Descargar PDF

Acceso abierto

Artículo científico

2026

Mejorando la Interpretabilidad de los Modelos de NLI Usando LLMs y Algoritmos de Aprendizaje Activo

Categoría

Gestión y administración

Subcategoría

Gestión de la tecnología y la inovación

Palabras clave

Inferencia de lenguaje natural

Interpretabilidad

Aprendizaje activo

Modelo de generación de explicaciones

Modelos de lenguaje grandes

Ingeniería de prompts

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 1

Citaciones: Sin citaciones

En el campo de la Inferencia de Lenguaje Natural (NLI), la interpretabilidad del modelo sigue siendo un desafío urgente y no resuelto. Los conjuntos de datos anotados orientados a la interpretabilidad existentes son muy limitados, y construir manualmente explicaciones en lenguaje natural es costoso e inconsistente, lo que dificulta equilibrar el rendimiento del modelo y la interpretabilidad. Para abordar este problema, este artículo propone un marco de NLI interpretable basado en aprendizaje activo, Modelo de Generación de Explicaciones - Modelo de Predicción (EGM-PM), y diseña un algoritmo de muestreo de aprendizaje activo, Transición Consciente de Explicaciones de Clustering a Margen (ETCM), que incorpora información de explicaciones en lenguaje natural. En este marco, se emplean Modelos de Lenguaje Grande (LLMs) para automatizar la anotación de explicaciones, reduciendo la dependencia de expertos humanos en el aprendizaje activo tradicional. Un pequeño número de muestras de alto valor obtenidas a través del muestreo ETCM se utilizan para entrenar el EGM, cuyas explicaciones generadas en lenguaje natural se utilizan para guiar al PM en la inferencia de etiquetas. Los resultados experimentales muestran que los datos muestreados por ETCM mejoran sustancialmente la capacidad del modelo para aprender estructuras relacionales y lógicas entre pares de premisa e hipótesis. En comparación con otros algoritmos de aprendizaje activo, ETCM se acerca más rápidamente al rendimiento de datos completos mientras utiliza significativamente menos muestras etiquetadas. Este hallazgo confirma el valor de la semántica de la explicación en lenguaje natural para mejorar tanto el rendimiento del modelo como la interpretabilidad. Además, este artículo emplea ingeniería de prompts para construir un conjunto de datos de NLI orientado a la interpretabilidad, Inferencia de Lenguaje Natural Explicable (ExNLI), que augments los pares de premisa e hipótesis tradicionales con explicaciones en lenguaje natural. Las evaluaciones humanas y automatizadas confirman la consistencia y fidelidad de estas explicaciones. El conjunto de datos ha sido publicado públicamente, ofreciendo un enfoque de construcción de datos de bajo costo y escalable para futuras investigaciones sobre NLI explicable.

Descripción

Otros recursos que podrían interesarte

Ver todas

Temas Virtualpro

Ver todas

Categoría

Subcategoría

Palabras clave

Licencia

Citación bibliográfica

Formato

¡Regístrate ahora y conoce todos los espacios virtuales disponibles para tu institución!

Otros recursos que podrían interesarte

Temas Virtualpro