Identificando usuarios similares entre la web oscura y la web superficial utilizando BERTopic y atribución de autoría
Autores: Shin, Gun-Yoon; Kim, Dong-Wook; Park, SungJin; Park, A-ran; Kim, Younghwan; Han, Myung-Mook
Idioma: Inglés
Editor: MDPI
Año: 2025
Acceso abierto
Artículo científico
2025
Identificando usuarios similares entre la web oscura y la web superficial utilizando BERTopic y atribución de autoría
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Web oscuro
Web profunda
Actividades maliciosas
Drogas
Armas de fuego
Ciberataque
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 44
Citaciones: Sin citaciones
La web oscura es una parte de la web profunda que garantiza el anonimato a los usuarios, facilitando así diversas actividades maliciosas, como la venta de drogas, armas de fuego e información personal o la difusión de malware y herramientas de ciberataque. Estas actividades se extienden más allá de la web oscura y tienen efectos negativos en la web superficial, a la que comúnmente acceden los usuarios de internet. Los estudios recientes sobre la web oscura se limitan a la detección y clasificación de actividades maliciosas específicas; es decir, no pueden rastrear ni identificar a los autores del contenido de la web oscura ni la fuente de una información determinada. Por lo tanto, proponemos aquí un método para identificar autores similares entre la web superficial y la web oscura utilizando BERTopic y atribución de autoría. Aplicamos BERTopic a la web superficial y a la web oscura para extraer temas previamente no identificados y medimos la similitud entre los temas para detectar temas similares entre las dos webs. Además, aplicamos atribución de autoría a los contenidos escritos por los autores de temas similares para extraer las características únicas del autor. La similitud entre los autores se midió para identificar autores con características similares. Así, identificamos autores que habían escrito contenidos sobre temas similares tanto en la web superficial como en la web oscura, así como autores que están activos simultáneamente en ambas webs.
Descripción
La web oscura es una parte de la web profunda que garantiza el anonimato a los usuarios, facilitando así diversas actividades maliciosas, como la venta de drogas, armas de fuego e información personal o la difusión de malware y herramientas de ciberataque. Estas actividades se extienden más allá de la web oscura y tienen efectos negativos en la web superficial, a la que comúnmente acceden los usuarios de internet. Los estudios recientes sobre la web oscura se limitan a la detección y clasificación de actividades maliciosas específicas; es decir, no pueden rastrear ni identificar a los autores del contenido de la web oscura ni la fuente de una información determinada. Por lo tanto, proponemos aquí un método para identificar autores similares entre la web superficial y la web oscura utilizando BERTopic y atribución de autoría. Aplicamos BERTopic a la web superficial y a la web oscura para extraer temas previamente no identificados y medimos la similitud entre los temas para detectar temas similares entre las dos webs. Además, aplicamos atribución de autoría a los contenidos escritos por los autores de temas similares para extraer las características únicas del autor. La similitud entre los autores se midió para identificar autores con características similares. Así, identificamos autores que habían escrito contenidos sobre temas similares tanto en la web superficial como en la web oscura, así como autores que están activos simultáneamente en ambas webs.