Traducción Global de Modelos de Clasificación
Autores: Al-Merri, Mohammad; Ben Miled, Zina
Idioma: Inglés
Editor: MDPI
Año: 2022
Acceso abierto
Artículo científico
2022
Traducción Global de Modelos de Clasificación
Categoría
Gestión y administración
Subcategoría
Gestión de la tecnología y la inovación
Palabras clave
Modelos de aprendizaje automático
Interpretabilidad global
Sesgos
Modelos localmente interpretables
MTRE-PAN
Fronteras de decisión
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
El uso generalizado y creciente de modelos de aprendizaje automático, particularmente en áreas críticas como el derecho, predica la necesidad de una interpretabilidad global. Los modelos que no pueden ser auditados son vulnerables a sesgos heredados de los conjuntos de datos que se utilizaron para desarrollarlos. Además, los modelos localmente interpretables son vulnerables a ataques adversariales. Para abordar este problema, el presente documento propone una nueva metodología que puede traducir cualquier modelo de aprendizaje automático existente en uno globalmente interpretable. MTRE-PAN es una arquitectura híbrida de SVM-árbol de decisión que aprovecha la interpretabilidad de los hiperplanos lineales al crear un conjunto de polígonos que delimitan los límites de decisión del modelo objetivo. Además, el presente documento introduce dos nuevas métricas: paridades de modelo ciertas y de límite. Estas métricas se pueden utilizar para evaluar con precisión el rendimiento del modelo interpretable cerca de los límites de decisión. Estas métricas se utilizan para comparar MTRE-PAN con una arquitectura interpretable previamente propuesta llamada TRE-PAN. Al igual que en el caso de TRE-PAN, MTRE-PAN tiene como objetivo proporcionar interpretabilidad global. Las comparaciones se realizan sobre modelos objetivo desarrollados utilizando tres conjuntos de datos de referencia: Abalone, Censo y datos de Diabetes. Los resultados muestran que MTRE-PAN genera modelos interpretables que tienen un menor número de hojas y un mayor acuerdo con los modelos objetivo, especialmente alrededor de las regiones más importantes en el espacio de características, a saber, los límites de decisión.
Descripción
El uso generalizado y creciente de modelos de aprendizaje automático, particularmente en áreas críticas como el derecho, predica la necesidad de una interpretabilidad global. Los modelos que no pueden ser auditados son vulnerables a sesgos heredados de los conjuntos de datos que se utilizaron para desarrollarlos. Además, los modelos localmente interpretables son vulnerables a ataques adversariales. Para abordar este problema, el presente documento propone una nueva metodología que puede traducir cualquier modelo de aprendizaje automático existente en uno globalmente interpretable. MTRE-PAN es una arquitectura híbrida de SVM-árbol de decisión que aprovecha la interpretabilidad de los hiperplanos lineales al crear un conjunto de polígonos que delimitan los límites de decisión del modelo objetivo. Además, el presente documento introduce dos nuevas métricas: paridades de modelo ciertas y de límite. Estas métricas se pueden utilizar para evaluar con precisión el rendimiento del modelo interpretable cerca de los límites de decisión. Estas métricas se utilizan para comparar MTRE-PAN con una arquitectura interpretable previamente propuesta llamada TRE-PAN. Al igual que en el caso de TRE-PAN, MTRE-PAN tiene como objetivo proporcionar interpretabilidad global. Las comparaciones se realizan sobre modelos objetivo desarrollados utilizando tres conjuntos de datos de referencia: Abalone, Censo y datos de Diabetes. Los resultados muestran que MTRE-PAN genera modelos interpretables que tienen un menor número de hojas y un mayor acuerdo con los modelos objetivo, especialmente alrededor de las regiones más importantes en el espacio de características, a saber, los límites de decisión.