Cómo abrir un clasificador de caja negra para datos tabulares
Autores: Walters, Bradley; Ortega-Martorell, Sandra; Olier, Ivan; Lisboa, Paulo J. G.
Idioma: Inglés
Editor: MDPI
Año: 2023
Acceso abierto
Artículo científico
2023
Cómo abrir un clasificador de caja negra para datos tabulares
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería de Software
Palabras clave
Transparencia
Modelos de aprendizaje automático
Métodos ANOVA
Modelos predictivos interpretables
Clasificadores de caja negra
GAMs
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 31
Citaciones: Sin citaciones
La falta de transparencia en los modelos de aprendizaje automático puede limitar su aplicación. Mostramos que los métodos de análisis de varianza (ANOVA) extraen modelos predictivos interpretables de ellos. Esto es posible porque las descomposiciones de ANOVA representan funciones multivariadas como sumas de funciones de menos variables. Conservar los términos en la suma de ANOVA que involucran funciones de solo una o dos variables proporciona un método eficiente para abrir clasificadores de caja negra. El método propuesto construye modelos aditivos generalizados (GAMs) mediante la aplicación de regresión logística regularizada L1 a los términos componentes retenidos de la descomposición de ANOVA de la función logit. Los GAMs resultantes se derivan utilizando dos medidas alternativas, Dirac y Lebesgue. Ambas medidas producen funciones que son suaves y consistentes. El término respuestas parciales en modelos estructurados (PRiSM) describe la familia de modelos que se derivan de clasificadores de caja negra mediante la aplicación de descomposiciones de ANOVA. Demostramos su interpretabilidad y rendimiento para el perceptrón multicapa, máquinas de vectores de soporte y máquinas de aumento de gradiente aplicadas a datos sintéticos y varios conjuntos de datos del mundo real, a saber, Diabetes de Pima, Tarjeta de Crédito Alemana y Statlog Shuttle del repositorio de UCI. Se muestra que los GAMs cumplen con los principios básicos de un marco formal de interpretabilidad.
Descripción
La falta de transparencia en los modelos de aprendizaje automático puede limitar su aplicación. Mostramos que los métodos de análisis de varianza (ANOVA) extraen modelos predictivos interpretables de ellos. Esto es posible porque las descomposiciones de ANOVA representan funciones multivariadas como sumas de funciones de menos variables. Conservar los términos en la suma de ANOVA que involucran funciones de solo una o dos variables proporciona un método eficiente para abrir clasificadores de caja negra. El método propuesto construye modelos aditivos generalizados (GAMs) mediante la aplicación de regresión logística regularizada L1 a los términos componentes retenidos de la descomposición de ANOVA de la función logit. Los GAMs resultantes se derivan utilizando dos medidas alternativas, Dirac y Lebesgue. Ambas medidas producen funciones que son suaves y consistentes. El término respuestas parciales en modelos estructurados (PRiSM) describe la familia de modelos que se derivan de clasificadores de caja negra mediante la aplicación de descomposiciones de ANOVA. Demostramos su interpretabilidad y rendimiento para el perceptrón multicapa, máquinas de vectores de soporte y máquinas de aumento de gradiente aplicadas a datos sintéticos y varios conjuntos de datos del mundo real, a saber, Diabetes de Pima, Tarjeta de Crédito Alemana y Statlog Shuttle del repositorio de UCI. Se muestra que los GAMs cumplen con los principios básicos de un marco formal de interpretabilidad.