Detección de Ransomware en Tiempo Real Usando Agentes de Aprendizaje por Refuerzo
Autores: Thakur, Kutub; Ali, Md Liakat; Schmeelk, Suzanna; Debello, Joan; Rahman, Md Mustafizur
Idioma: Inglés
Editor: MDPI
Año: 2026
Acceso abierto
Artículo científico
2026
Detección de Ransomware en Tiempo Real Usando Agentes de Aprendizaje por Refuerzo
Categoría
Gestión y administración
Subcategoría
Gestión de la tecnología y la inovación
Palabras clave
Basado en firmas
Herramientas anti-malware
Detección de ransomware
Aprendizaje por Refuerzo
Análisis dinámico
Familias de ransomware
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
Las herramientas tradicionales de anti-malware basadas en firmas a menudo no logran detectar ataques de ransomware de día cero debido a su dependencia de patrones conocidos. Este documento presenta un marco de detección de ransomware en tiempo real que modela el comportamiento del sistema como un entorno de Aprendizaje por Refuerzo (RL). Se extraen características de comportamiento, incluyendo la entropía de archivos, el uso de CPU y los cambios en el registro, de los registros de análisis dinámico generados por Cuckoo Sandbox. Un agente (DQN) se entrena para bloquear proactivamente acciones maliciosas maximizando las recompensas a largo plazo basadas en el comportamiento observado. La evaluación experimental a través de múltiples familias de ransomware como WannaCry, Locky, Cerber y Ryuk demuestra que el agente RL propuesto logra una precisión de detección, precisión y puntuación F1 superiores en comparación con los métodos de aprendizaje estático y supervisado existentes. Además, las pruebas de ablación y el análisis de latencia confirman la robustez y la idoneidad del modelo para su implementación en tiempo real. Este trabajo introduce un enfoque impulsado por el comportamiento y generalizable para la defensa contra ransomware que se adapta a amenazas no vistas a través del aprendizaje continuo.
Descripción
Las herramientas tradicionales de anti-malware basadas en firmas a menudo no logran detectar ataques de ransomware de día cero debido a su dependencia de patrones conocidos. Este documento presenta un marco de detección de ransomware en tiempo real que modela el comportamiento del sistema como un entorno de Aprendizaje por Refuerzo (RL). Se extraen características de comportamiento, incluyendo la entropía de archivos, el uso de CPU y los cambios en el registro, de los registros de análisis dinámico generados por Cuckoo Sandbox. Un agente (DQN) se entrena para bloquear proactivamente acciones maliciosas maximizando las recompensas a largo plazo basadas en el comportamiento observado. La evaluación experimental a través de múltiples familias de ransomware como WannaCry, Locky, Cerber y Ryuk demuestra que el agente RL propuesto logra una precisión de detección, precisión y puntuación F1 superiores en comparación con los métodos de aprendizaje estático y supervisado existentes. Además, las pruebas de ablación y el análisis de latencia confirman la robustez y la idoneidad del modelo para su implementación en tiempo real. Este trabajo introduce un enfoque impulsado por el comportamiento y generalizable para la defensa contra ransomware que se adapta a amenazas no vistas a través del aprendizaje continuo.