Explicando redes neuronales convolucionales basadas en detección de intrusiones utilizando explicaciones aditivas de Shapley (SHAP)
Autores: Younisse, Remah; Ahmad, Ashraf; Abu Al-Haija, Qasem
Idioma: Inglés
Editor: MDPI
Año: 2022
Acceso abierto
Artículo científico
2022
Explicando redes neuronales convolucionales basadas en detección de intrusiones utilizando explicaciones aditivas de Shapley (SHAP)
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería de Sistemas
Palabras clave
Inteligencia artificial
Aprendizaje automático
Modelos
XAI
Características
Rendimiento
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 37
Citaciones: Sin citaciones
Los modelos de inteligencia artificial (IA) y aprendizaje automático (ML) se han convertido en herramientas esenciales utilizadas en muchos sistemas críticos para tomar decisiones significativas; las decisiones tomadas por estos modelos deben ser confiables y explicadas en muchas ocasiones. Por otro lado, el rendimiento de diferentes modelos de ML e IA varía con el mismo conjunto de datos utilizado. A veces, los desarrolladores han intentado usar múltiples modelos antes de decidir cuál modelo debería ser utilizado sin entender las razones detrás de esta variación en el rendimiento. Los modelos de inteligencia artificial explicables (XAI) han presentado una explicación para el rendimiento de los modelos basada en resaltar las características que el modelo consideró necesarias al tomar la decisión. Este trabajo presenta un enfoque analítico para estudiar las funciones de densidad de las características del conjunto de datos de detección de intrusiones. El estudio explica cómo y por qué estas características son esenciales durante el proceso de XAI. Nuestro objetivo, en este estudio, es explicar el comportamiento de XAI para agregar una capa adicional de explicabilidad. El análisis de la función de densidad presentado en este documento agrega una comprensión más profunda de la importancia de las características en diferentes modelos de IA. Específicamente, presentamos un método para explicar los resultados de SHAP (explicaciones aditivas de Shapley) para diferentes modelos de aprendizaje automático basados en los gráficos de KDE (estimación de densidad del núcleo) de los datos de características. También investigamos las especificaciones de las características del conjunto de datos que pueden funcionar mejor para los modelos basados en redes neuronales convolucionales (CNN).
Descripción
Los modelos de inteligencia artificial (IA) y aprendizaje automático (ML) se han convertido en herramientas esenciales utilizadas en muchos sistemas críticos para tomar decisiones significativas; las decisiones tomadas por estos modelos deben ser confiables y explicadas en muchas ocasiones. Por otro lado, el rendimiento de diferentes modelos de ML e IA varía con el mismo conjunto de datos utilizado. A veces, los desarrolladores han intentado usar múltiples modelos antes de decidir cuál modelo debería ser utilizado sin entender las razones detrás de esta variación en el rendimiento. Los modelos de inteligencia artificial explicables (XAI) han presentado una explicación para el rendimiento de los modelos basada en resaltar las características que el modelo consideró necesarias al tomar la decisión. Este trabajo presenta un enfoque analítico para estudiar las funciones de densidad de las características del conjunto de datos de detección de intrusiones. El estudio explica cómo y por qué estas características son esenciales durante el proceso de XAI. Nuestro objetivo, en este estudio, es explicar el comportamiento de XAI para agregar una capa adicional de explicabilidad. El análisis de la función de densidad presentado en este documento agrega una comprensión más profunda de la importancia de las características en diferentes modelos de IA. Específicamente, presentamos un método para explicar los resultados de SHAP (explicaciones aditivas de Shapley) para diferentes modelos de aprendizaje automático basados en los gráficos de KDE (estimación de densidad del núcleo) de los datos de características. También investigamos las especificaciones de las características del conjunto de datos que pueden funcionar mejor para los modelos basados en redes neuronales convolucionales (CNN).