Ampliando taxonomías y mapeando foros de fraude con tarjetas de crédito P2P (carding) en la dark web
Autores: Medina-Merodio, Jose-Amelio; Ferrer-Oliva, Mikel; Fernández López, José; Ruiz-Zambrano, Alejandro; Domínguez-Díaz, Adrián
Idioma: Inglés
Editor: MDPI
Año: 2026
Acceso abierto
Artículo científico
2026
Ampliando taxonomías y mapeando foros de fraude con tarjetas de crédito P2P (carding) en la dark web
Categoría
Gestión y administración
Subcategoría
Gestión de la tecnología y la inovación
Palabras clave
Fraude con tarjetas de crédito
Economía del cibercrimen
Foros de carding en la dark web
Taxonomía
LLMs
Foros de carding P2P
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
El fraude con tarjetas de crédito constituye un componente central de la economía contemporánea del cibercrimen, en la que los foros de carding en la dark web juegan un papel fundamental en la coordinación, comercialización y difusión de actividades ilícitas. Si bien investigaciones anteriores se han centrado principalmente en la detección de fraudes a nivel de transacciones, se ha prestado comparativamente poca atención al análisis sistemático de los ecosistemas sociales y organizacionales dentro de los cuales se llevan a cabo estas prácticas. Este estudio aborda esta brecha proponiendo y validando una taxonomía específica del dominio para la clasificación automatizada de contenido en foros de carding P2P. Para ello, adoptamos una metodología iterativa y basada en datos que integra modelos de lenguaje grandes (LLMs), análisis de coocurrencia léxica y análisis de redes semánticas. Utilizando un corpus de 3260 publicaciones, definimos y operacionalizamos una taxonomía estructurada en torno a cuatro predicados: contexto de actividad, rol del actor, productos y servicios, y herramientas técnicas, apoyados por un LLM (Llama 4 Scout) implementado localmente. Además, se utilizó un subconjunto anotado por humanos para evaluar el acuerdo entre anotadores y métricas de clasificación estándar, complementando la evaluación basada en cobertura y permitiendo la comparación con una línea base basada en palabras clave. La evaluación se fortaleció aún más a través de la comparación manual, intervalos de confianza, análisis de sensibilidad de componentes clave del proceso, y comparación con modelos alternativos de pesos abiertos. Los resultados indican que la taxonomía propuesta logra una amplia cobertura representacional a nivel de corpus, con al menos una dimensión semántica identificada en el 98.71% de las publicaciones. Sin embargo, la cobertura es desigual entre los predicados: el contexto de actividad es altamente explícito, mientras que el rol del actor y el producto-servicio muestran solo una cobertura moderada y la técnica-herramienta permanece sustancialmente subrepresentada y ambigua. En general, los hallazgos muestran que combinar taxonomías específicas del dominio con clasificación asistida por LLM y análisis de redes ofrece un marco robusto para entender y monitorear los ecosistemas de carding en la dark web.
Descripción
El fraude con tarjetas de crédito constituye un componente central de la economía contemporánea del cibercrimen, en la que los foros de carding en la dark web juegan un papel fundamental en la coordinación, comercialización y difusión de actividades ilícitas. Si bien investigaciones anteriores se han centrado principalmente en la detección de fraudes a nivel de transacciones, se ha prestado comparativamente poca atención al análisis sistemático de los ecosistemas sociales y organizacionales dentro de los cuales se llevan a cabo estas prácticas. Este estudio aborda esta brecha proponiendo y validando una taxonomía específica del dominio para la clasificación automatizada de contenido en foros de carding P2P. Para ello, adoptamos una metodología iterativa y basada en datos que integra modelos de lenguaje grandes (LLMs), análisis de coocurrencia léxica y análisis de redes semánticas. Utilizando un corpus de 3260 publicaciones, definimos y operacionalizamos una taxonomía estructurada en torno a cuatro predicados: contexto de actividad, rol del actor, productos y servicios, y herramientas técnicas, apoyados por un LLM (Llama 4 Scout) implementado localmente. Además, se utilizó un subconjunto anotado por humanos para evaluar el acuerdo entre anotadores y métricas de clasificación estándar, complementando la evaluación basada en cobertura y permitiendo la comparación con una línea base basada en palabras clave. La evaluación se fortaleció aún más a través de la comparación manual, intervalos de confianza, análisis de sensibilidad de componentes clave del proceso, y comparación con modelos alternativos de pesos abiertos. Los resultados indican que la taxonomía propuesta logra una amplia cobertura representacional a nivel de corpus, con al menos una dimensión semántica identificada en el 98.71% de las publicaciones. Sin embargo, la cobertura es desigual entre los predicados: el contexto de actividad es altamente explícito, mientras que el rol del actor y el producto-servicio muestran solo una cobertura moderada y la técnica-herramienta permanece sustancialmente subrepresentada y ambigua. En general, los hallazgos muestran que combinar taxonomías específicas del dominio con clasificación asistida por LLM y análisis de redes ofrece un marco robusto para entender y monitorear los ecosistemas de carding en la dark web.