Más allá de las puntuaciones de importancia: Interpretando el aprendizaje automático tabular mediante la visualización de la semántica de las características
Autores: Ghorbani, Amirata; Berenbaum, Dina; Ivgi, Maor; Dafna, Yuval; Zou, James Y.
Idioma: Inglés
Editor: MDPI
Año: 2021
Acceso abierto
Artículo científico
2021
Más allá de las puntuaciones de importancia: Interpretando el aprendizaje automático tabular mediante la visualización de la semántica de las características
Categoría
Gestión y administración
Subcategoría
Gestión de la tecnología y la inovación
Palabras clave
Interpretabilidad
Aprendizaje automático
Datos tabulares
Vectores de características
Importancia de características
Visualización
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
La interpretabilidad se está convirtiendo en un tema de investigación activo a medida que los modelos de aprendizaje automático (ML) se utilizan más ampliamente para tomar decisiones críticas. Los datos tabulares son uno de los modos de datos más comúnmente utilizados en diversas aplicaciones, como la atención médica y las finanzas. Muchos de los métodos de interpretabilidad existentes utilizados para datos tabulares solo informan sobre las puntuaciones de importancia de las características, ya sea localmente (por ejemplo) o globalmente (por modelo), pero no proporcionan interpretación ni visualización de cómo interactúan las características. Abordamos esta limitación introduciendo Vectores de Características, un nuevo método de interpretabilidad global diseñado para conjuntos de datos tabulares. Además de proporcionar la importancia de las características, los Vectores de Características descubren la relación semántica inherente entre las características a través de una técnica intuitiva de visualización de características. Nuestros experimentos sistemáticos demuestran la utilidad empírica de este nuevo método al aplicarlo a varios conjuntos de datos del mundo real. Además, proporcionamos un paquete de Python fácil de usar para los Vectores de Características.
Descripción
La interpretabilidad se está convirtiendo en un tema de investigación activo a medida que los modelos de aprendizaje automático (ML) se utilizan más ampliamente para tomar decisiones críticas. Los datos tabulares son uno de los modos de datos más comúnmente utilizados en diversas aplicaciones, como la atención médica y las finanzas. Muchos de los métodos de interpretabilidad existentes utilizados para datos tabulares solo informan sobre las puntuaciones de importancia de las características, ya sea localmente (por ejemplo) o globalmente (por modelo), pero no proporcionan interpretación ni visualización de cómo interactúan las características. Abordamos esta limitación introduciendo Vectores de Características, un nuevo método de interpretabilidad global diseñado para conjuntos de datos tabulares. Además de proporcionar la importancia de las características, los Vectores de Características descubren la relación semántica inherente entre las características a través de una técnica intuitiva de visualización de características. Nuestros experimentos sistemáticos demuestran la utilidad empírica de este nuevo método al aplicarlo a varios conjuntos de datos del mundo real. Además, proporcionamos un paquete de Python fácil de usar para los Vectores de Características.