logo móvil
Contáctanos

¿los transformadores neuronales aprenden conceptos definidos por humanos? un estudio extenso en el dominio del procesamiento de código fuente

Autores: Ferretti, Claudio; Saletta, Martina

Idioma: Inglés

Editor: MDPI

Año: 2022

Descargar PDF

Acceso abierto

Artículo científico
2022

¿los transformadores neuronales aprenden conceptos definidos por humanos? un estudio extenso en el dominio del procesamiento de código fuente


Categoría

Ingeniería y Tecnología

Subcategoría

Ingeniería de Software

Palabras clave

Redes neuronales
XAI
Clasificación
Ciberseguridad
Código fuente
TCAV

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 39

Citaciones: Sin citaciones


Descripción
Las redes neuronales de vanguardia construyen un modelo interno de los datos de entrenamiento, adaptado a una tarea de clasificación específica. El estudio de dicho modelo es de interés, por lo tanto, la investigación en inteligencia artificial explicativa (XAI) tiene como objetivo investigar si, en los estados internos de una red, es posible identificar reglas que asocien los datos con su clasificación correspondiente. Este trabajo avanza hacia la investigación de XAI en redes neuronales entrenadas en la clasificación de fragmentos de código fuente, en el dominio específico de la ciberseguridad. En este contexto, típicamente, las instancias textuales deben codificarse primero con una transformación no invertible en vectores numéricos para alimentar los modelos, lo que limita la aplicabilidad de los métodos de XAI conocidos basados en la diferenciación de señales neuronales con respecto a instancias de valores reales. En este trabajo, partimos del método conocido como TCAV, diseñado para estudiar los conceptos comprensibles por humanos que emergen en las capas internas de una red neuronal, y lo adaptamos a arquitecturas de transformadores entrenadas en resolver problemas de clasificación de código fuente. Primero determinamos conceptos específicos del dominio (por ejemplo, la presencia de patrones dados en el código fuente), y para cada concepto, entrenamos clasificadores de vectores de soporte para separar puntos en los espacios de activación vectorial que representan instancias de entrada con el concepto de aquellos sin el concepto. Luego, estudiamos si la presencia (o ausencia) de tales conceptos afecta el proceso de decisión de la red neuronal. Finalmente, discutimos cómo nuestro enfoque contribuye a los objetivos generales de XAI y sugerimos aplicaciones específicas en el campo del análisis de código fuente.

Otros recursos que podrían interesarte

Temas Virtualpro