Ceat: categorizando el comportamiento de transacciones de direcciones de Ethereum con algoritmos de aprendizaje automático de conjunto
Autores: Pragasam, Tiffany Tien Nee; Thomas, John Victor Joshua; Vensuslaus, Maria Anu; Radhakrishnan, Subhashini
Idioma: Inglés
Editor: MDPI
Año: 2023
Acceso abierto
Artículo científico
2023
Ceat: categorizando el comportamiento de transacciones de direcciones de Ethereum con algoritmos de aprendizaje automático de conjunto
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería de Sistemas
Palabras clave
Criptomonedas
Anonimato
Ethereum
Direcciones
Conjunto de datos
Clasificación
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 39
Citaciones: Sin citaciones
Las criptomonedas están creciendo rápidamente y son cada vez más aceptadas por los principales vendedores comerciales. Sin embargo, junto con su creciente popularidad, también se han convertido en la moneda preferida para actividades ilícitas impulsadas por el anonimato que proporcionan. Las criptomonedas, como la que se encuentra en la cadena de bloques de Ethereum, ofrecen una forma para que las entidades oculten sus identidades del mundo real detrás de seudónimos, también conocidos como direcciones. Por lo tanto, el propósito de este trabajo es descubrir el nivel de anonimato en Ethereum investigando modelos de clasificación multiclase para Cuentas de Propiedad Externa (EOAs) de Ethereum. Los investigadores tienen como objetivo lograr esto examinando patrones de actividad de transacciones asociadas con estas direcciones. Utilizando un conjunto de datos de direcciones de Ethereum etiquetadas de Kaggle y el conjunto de datos de cripto de Ethereum de Google BigQuery, se compiló un conjunto de datos de perfiles de direcciones basado en el historial de transacciones de las direcciones. El conjunto de datos compilado, que consta de 4371 muestras, se utilizó para ajustar y evaluar el clasificador Random Forest, Gradient Boosting y XGBoost para predecir la categoría de las direcciones. El modelo de mejor rendimiento encontrado para el problema fue el clasificador XGBoost, logrando una precisión del 75.3% con un F1-Score macro promediado de 0.689. A continuación, se encontraba el clasificador Random Forest, con una precisión del 73.7% y un F1-Score macro promediado de 0.641. Gradient Boosting fue el último con una precisión del 73% y un F1-Score macro promediado de 0.659. Debido a las limitaciones de datos en este estudio, las puntuaciones generales del mejor modelo fueron más débiles en comparación con investigaciones similares, con la excepción de la precisión, que obtuvo una puntuación ligeramente más alta. Sin embargo, los resultados demostraron que es posible predecir la categoría de una dirección de billetera Ethereum, como Phish/Hack, Estafas, Intercambios y billeteras ICO, basándose en su comportamiento de transacción.
Descripción
Las criptomonedas están creciendo rápidamente y son cada vez más aceptadas por los principales vendedores comerciales. Sin embargo, junto con su creciente popularidad, también se han convertido en la moneda preferida para actividades ilícitas impulsadas por el anonimato que proporcionan. Las criptomonedas, como la que se encuentra en la cadena de bloques de Ethereum, ofrecen una forma para que las entidades oculten sus identidades del mundo real detrás de seudónimos, también conocidos como direcciones. Por lo tanto, el propósito de este trabajo es descubrir el nivel de anonimato en Ethereum investigando modelos de clasificación multiclase para Cuentas de Propiedad Externa (EOAs) de Ethereum. Los investigadores tienen como objetivo lograr esto examinando patrones de actividad de transacciones asociadas con estas direcciones. Utilizando un conjunto de datos de direcciones de Ethereum etiquetadas de Kaggle y el conjunto de datos de cripto de Ethereum de Google BigQuery, se compiló un conjunto de datos de perfiles de direcciones basado en el historial de transacciones de las direcciones. El conjunto de datos compilado, que consta de 4371 muestras, se utilizó para ajustar y evaluar el clasificador Random Forest, Gradient Boosting y XGBoost para predecir la categoría de las direcciones. El modelo de mejor rendimiento encontrado para el problema fue el clasificador XGBoost, logrando una precisión del 75.3% con un F1-Score macro promediado de 0.689. A continuación, se encontraba el clasificador Random Forest, con una precisión del 73.7% y un F1-Score macro promediado de 0.641. Gradient Boosting fue el último con una precisión del 73% y un F1-Score macro promediado de 0.659. Debido a las limitaciones de datos en este estudio, las puntuaciones generales del mejor modelo fueron más débiles en comparación con investigaciones similares, con la excepción de la precisión, que obtuvo una puntuación ligeramente más alta. Sin embargo, los resultados demostraron que es posible predecir la categoría de una dirección de billetera Ethereum, como Phish/Hack, Estafas, Intercambios y billeteras ICO, basándose en su comportamiento de transacción.