Interpretabilidad como aproximación: entendiendo modelos de caja negra por límite de decisión
Autores: Dong, Hangcheng; Liu, Bingguo; Ye, Dong; Liu, Guodong
Idioma: Inglés
Editor: MDPI
Año: 2024
Acceso abierto
Artículo científico
2024
Interpretabilidad como aproximación: entendiendo modelos de caja negra por límite de decisión
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Interpretabilidad
Teoría de aproximación
Modelos explicables
Límite de decisión
Perceptrones multicapa
GIME
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 44
Citaciones: Sin citaciones
Actualmente, los métodos de interpretabilidad se centran más en semánticas menos objetivas y comprensibles para los humanos. Para objetivar y estandarizar la investigación sobre interpretabilidad, en este estudio proporcionamos nociones de interpretabilidad basadas en la teoría de aproximación. Primero definimos modelos explicables en términos de explicitud y luego utilizamos la completitud para definir la interpretabilidad, convirtiéndola así en el proceso de aproximación de modelos de caja negra con modelos interpretables. En particular, creemos que el límite de decisión de un modelo de clasificación es equivalente a su interpretabilidad. A continuación, implementamos esta interpretación de aproximación en perceptrones multicapa (MLP) y luego proponemos utilizar el MLP como un intérprete universal para explicar otros modelos complejos de caja negra. En comparación con el método LIME, que solo puede extraer características lineales locales, nuestro método es global y, por lo tanto, se denomina GIME. Experimentos extensos demuestran la efectividad de nuestros enfoques.
Descripción
Actualmente, los métodos de interpretabilidad se centran más en semánticas menos objetivas y comprensibles para los humanos. Para objetivar y estandarizar la investigación sobre interpretabilidad, en este estudio proporcionamos nociones de interpretabilidad basadas en la teoría de aproximación. Primero definimos modelos explicables en términos de explicitud y luego utilizamos la completitud para definir la interpretabilidad, convirtiéndola así en el proceso de aproximación de modelos de caja negra con modelos interpretables. En particular, creemos que el límite de decisión de un modelo de clasificación es equivalente a su interpretabilidad. A continuación, implementamos esta interpretación de aproximación en perceptrones multicapa (MLP) y luego proponemos utilizar el MLP como un intérprete universal para explicar otros modelos complejos de caja negra. En comparación con el método LIME, que solo puede extraer características lineales locales, nuestro método es global y, por lo tanto, se denomina GIME. Experimentos extensos demuestran la efectividad de nuestros enfoques.