¿los transformadores neuronales aprenden conceptos definidos por humanos? un estudio extenso en el dominio del procesamiento de código fuente
Autores: Ferretti, Claudio; Saletta, Martina
Idioma: Inglés
Editor: MDPI
Año: 2022
Acceso abierto
Artículo científico
2022
¿los transformadores neuronales aprenden conceptos definidos por humanos? un estudio extenso en el dominio del procesamiento de código fuente
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería de Software
Palabras clave
Redes neuronales
XAI
Clasificación
Ciberseguridad
Código fuente
TCAV
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 39
Citaciones: Sin citaciones
Las redes neuronales de vanguardia construyen un modelo interno de los datos de entrenamiento, adaptado a una tarea de clasificación específica. El estudio de dicho modelo es de interés, por lo tanto, la investigación en inteligencia artificial explicativa (XAI) tiene como objetivo investigar si, en los estados internos de una red, es posible identificar reglas que asocien los datos con su clasificación correspondiente. Este trabajo avanza hacia la investigación de XAI en redes neuronales entrenadas en la clasificación de fragmentos de código fuente, en el dominio específico de la ciberseguridad. En este contexto, típicamente, las instancias textuales deben codificarse primero con una transformación no invertible en vectores numéricos para alimentar los modelos, lo que limita la aplicabilidad de los métodos de XAI conocidos basados en la diferenciación de señales neuronales con respecto a instancias de valores reales. En este trabajo, partimos del método conocido como TCAV, diseñado para estudiar los conceptos comprensibles por humanos que emergen en las capas internas de una red neuronal, y lo adaptamos a arquitecturas de transformadores entrenadas en resolver problemas de clasificación de código fuente. Primero determinamos conceptos específicos del dominio (por ejemplo, la presencia de patrones dados en el código fuente), y para cada concepto, entrenamos clasificadores de vectores de soporte para separar puntos en los espacios de activación vectorial que representan instancias de entrada con el concepto de aquellos sin el concepto. Luego, estudiamos si la presencia (o ausencia) de tales conceptos afecta el proceso de decisión de la red neuronal. Finalmente, discutimos cómo nuestro enfoque contribuye a los objetivos generales de XAI y sugerimos aplicaciones específicas en el campo del análisis de código fuente.
Descripción
Las redes neuronales de vanguardia construyen un modelo interno de los datos de entrenamiento, adaptado a una tarea de clasificación específica. El estudio de dicho modelo es de interés, por lo tanto, la investigación en inteligencia artificial explicativa (XAI) tiene como objetivo investigar si, en los estados internos de una red, es posible identificar reglas que asocien los datos con su clasificación correspondiente. Este trabajo avanza hacia la investigación de XAI en redes neuronales entrenadas en la clasificación de fragmentos de código fuente, en el dominio específico de la ciberseguridad. En este contexto, típicamente, las instancias textuales deben codificarse primero con una transformación no invertible en vectores numéricos para alimentar los modelos, lo que limita la aplicabilidad de los métodos de XAI conocidos basados en la diferenciación de señales neuronales con respecto a instancias de valores reales. En este trabajo, partimos del método conocido como TCAV, diseñado para estudiar los conceptos comprensibles por humanos que emergen en las capas internas de una red neuronal, y lo adaptamos a arquitecturas de transformadores entrenadas en resolver problemas de clasificación de código fuente. Primero determinamos conceptos específicos del dominio (por ejemplo, la presencia de patrones dados en el código fuente), y para cada concepto, entrenamos clasificadores de vectores de soporte para separar puntos en los espacios de activación vectorial que representan instancias de entrada con el concepto de aquellos sin el concepto. Luego, estudiamos si la presencia (o ausencia) de tales conceptos afecta el proceso de decisión de la red neuronal. Finalmente, discutimos cómo nuestro enfoque contribuye a los objetivos generales de XAI y sugerimos aplicaciones específicas en el campo del análisis de código fuente.