EX-CODE: Un modelo robusto y explicable para detectar código generado por IA
Autores: Bulla, Luana; Midolo, Alessandro; Mongiovì, Misael; Tramontana, Emiliano
Idioma: Inglés
Editor: MDPI
Año: 2024
Acceso abierto
Artículo científico
2024
EX-CODE: Un modelo robusto y explicable para detectar código generado por IA
Categoría
Gestión y administración
Subcategoría
Gestión de la tecnología y la inovación
Palabras clave
Código
Inteligencia artificial
Clasificación
Validación
Seguridad
Modelo explicable
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
Distinguir si algunas porciones de código fueron implementadas por humanos o generadas por una herramienta basada en inteligencia artificial se ha vuelto difícil. Sin embargo, tal clasificación sería importante ya que podría orientar a los desarrolladores hacia una validación adicional del código producido. Además, tiene una importancia significativa en contextos de seguridad, legales y educativos, donde mantener la integridad académica es de suma importancia. Presentamos EX-CODE, un modelo novedoso y explicable que aprovecha la probabilidad de la ocurrencia de algunos tokens, dentro de un fragmento de código, estimada según un modelo de lenguaje, para distinguir el código escrito por humanos del generado por IA. EX-CODE ha sido evaluado en un conjunto de datos heterogéneo del mundo real y se destaca por su capacidad para proporcionar explicaciones comprensibles para los humanos sobre sus resultados. Logra esto al descubrir las características que, para un fragmento de código, lo clasifican como código escrito por humanos (o código generado por IA).
Descripción
Distinguir si algunas porciones de código fueron implementadas por humanos o generadas por una herramienta basada en inteligencia artificial se ha vuelto difícil. Sin embargo, tal clasificación sería importante ya que podría orientar a los desarrolladores hacia una validación adicional del código producido. Además, tiene una importancia significativa en contextos de seguridad, legales y educativos, donde mantener la integridad académica es de suma importancia. Presentamos EX-CODE, un modelo novedoso y explicable que aprovecha la probabilidad de la ocurrencia de algunos tokens, dentro de un fragmento de código, estimada según un modelo de lenguaje, para distinguir el código escrito por humanos del generado por IA. EX-CODE ha sido evaluado en un conjunto de datos heterogéneo del mundo real y se destaca por su capacidad para proporcionar explicaciones comprensibles para los humanos sobre sus resultados. Logra esto al descubrir las características que, para un fragmento de código, lo clasifican como código escrito por humanos (o código generado por IA).