El impacto de los tipos de entrada en el rendimiento de la detección de vulnerabilidades de contratos inteligentes basado en aprendizaje profundo: un estudio preliminar
Autores: Aldyaflah, Izdehar M.; Zhao, Wenbing; Yang, Shunkun; Luo, Xiong
Idioma: Inglés
Editor: MDPI
Año: 2024
Acceso abierto
Artículo científico
2024
El impacto de los tipos de entrada en el rendimiento de la detección de vulnerabilidades de contratos inteligentes basado en aprendizaje profundo: un estudio preliminar
Categoría
Gestión y administración
Subcategoría
Gestión de la tecnología y la inovación
Palabras clave
Stemming
Vulnerabilidades
Contrato inteligente
Tipos de entrada
TF-IDF
Rendimiento de detección
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
Eliminar las vulnerabilidades de un contrato inteligente antes de su implementación es esencial para garantizar la seguridad de las aplicaciones descentralizadas. Por lo tanto, se han propuesto numerosas herramientas y métodos basados en aprendizaje automático para ayudar a detectar vulnerabilidades en contratos inteligentes. Además, también se han propuesto diversas formas de codificar los contratos inteligentes para su análisis. Sin embargo, el impacto de estos métodos de entrada no ha sido estudiado de manera sistemática, que es el objetivo principal de este artículo. En este estudio preliminar, experimentamos con cuatro tipos comunes de entrada, incluyendo Word2Vec, FastText, Bag-of-Words (BoW) y Frecuencia de Término-Frecuencia Inversa de Documento (TF-IDF). Para centrarnos en la comparación de estos tipos de entrada, utilizamos el mismo modelo de aprendizaje profundo, es decir, redes neuronales convolucionales, en todos los experimentos. Usando un conjunto de datos público, comparamos el rendimiento de detección de vulnerabilidades de los cuatro tipos de entrada tanto en escenarios de clasificación binaria como en el escenario de clasificación multiclase. Nuestros hallazgos muestran que TF-IDF es el mejor tipo de entrada en general entre los cuatro. TF-IDF tiene un excelente rendimiento de detección en todos los escenarios: (1) tiene la mejor puntuación F1 y precisión en clasificaciones binarias para todos los tipos de vulnerabilidad, excepto para la vulnerabilidad delegada donde TF-IDF ocupa un cercano segundo lugar, y (2) ocupa un muy cercano segundo lugar detrás de BoW (dentro del 0.8%) en la clasificación multiclase.
Descripción
Eliminar las vulnerabilidades de un contrato inteligente antes de su implementación es esencial para garantizar la seguridad de las aplicaciones descentralizadas. Por lo tanto, se han propuesto numerosas herramientas y métodos basados en aprendizaje automático para ayudar a detectar vulnerabilidades en contratos inteligentes. Además, también se han propuesto diversas formas de codificar los contratos inteligentes para su análisis. Sin embargo, el impacto de estos métodos de entrada no ha sido estudiado de manera sistemática, que es el objetivo principal de este artículo. En este estudio preliminar, experimentamos con cuatro tipos comunes de entrada, incluyendo Word2Vec, FastText, Bag-of-Words (BoW) y Frecuencia de Término-Frecuencia Inversa de Documento (TF-IDF). Para centrarnos en la comparación de estos tipos de entrada, utilizamos el mismo modelo de aprendizaje profundo, es decir, redes neuronales convolucionales, en todos los experimentos. Usando un conjunto de datos público, comparamos el rendimiento de detección de vulnerabilidades de los cuatro tipos de entrada tanto en escenarios de clasificación binaria como en el escenario de clasificación multiclase. Nuestros hallazgos muestran que TF-IDF es el mejor tipo de entrada en general entre los cuatro. TF-IDF tiene un excelente rendimiento de detección en todos los escenarios: (1) tiene la mejor puntuación F1 y precisión en clasificaciones binarias para todos los tipos de vulnerabilidad, excepto para la vulnerabilidad delegada donde TF-IDF ocupa un cercano segundo lugar, y (2) ocupa un muy cercano segundo lugar detrás de BoW (dentro del 0.8%) en la clasificación multiclase.