SINNER: Un algoritmo sensible a recompensas para la clasificación de malware desbalanceado utilizando redes neuronales con repetición de experiencias
Autores: Coscia, Antonio; Iannacone, Andrea; Maci, Antonio; Stamerra, Alessandro
Idioma: Inglés
Editor: MDPI
Año: 2024
Acceso abierto
Artículo científico
2024
SINNER: Un algoritmo sensible a recompensas para la clasificación de malware desbalanceado utilizando redes neuronales con repetición de experiencias
Categoría
Gestión y administración
Subcategoría
Gestión de la tecnología y la inovación
Palabras clave
Servicios de análisis de malware
Muestras disponibles
Algoritmos de aprendizaje profundo
Tareas de clasificación multiclase
Aprendizaje por refuerzo profundo
Problema de desequilibrio de datos
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
Los informes producidos por servicios populares de análisis de malware mostraron una disparidad en las muestras disponibles para diferentes familias de malware. La distribución desigual entre tales clases puede atribuirse a varios factores, como los avances tecnológicos y el dominio de aplicación que busca infectar un virus informático. Estudios recientes han demostrado la efectividad de los algoritmos de aprendizaje profundo (DL) al aprender tareas de clasificación multiclase utilizando conjuntos de datos desbalanceados. Esto se puede lograr actualizando la función de aprendizaje de manera que las predicciones correctas e incorrectas realizadas sobre la clase minoritaria sean más recompensadas o penalizadas, respectivamente. Este procedimiento se puede implementar lógicamente aprovechando el paradigma de aprendizaje por refuerzo profundo (DRL) a través de una formulación adecuada del proceso de decisión de Markov (MDP). Este artículo propone SINNER, es decir, un clasificador multiclase basado en DRL que aborda el problema del desbalance de datos a nivel algorítmico al explotar una función de recompensa rediseñada, que modifica el modelo MDP tradicional utilizado para aprender esta tarea. Basado en los resultados experimentales, la fórmula propuesta parece ser exitosa. Además, SINNER se ha comparado con varios modelos basados en DL que pueden manejar el sesgo de clase sin depender de técnicas a nivel de datos. Utilizando tres de cuatro conjuntos de datos obtenidos de la literatura existente, el modelo propuesto logró un rendimiento de clasificación de vanguardia.
Descripción
Los informes producidos por servicios populares de análisis de malware mostraron una disparidad en las muestras disponibles para diferentes familias de malware. La distribución desigual entre tales clases puede atribuirse a varios factores, como los avances tecnológicos y el dominio de aplicación que busca infectar un virus informático. Estudios recientes han demostrado la efectividad de los algoritmos de aprendizaje profundo (DL) al aprender tareas de clasificación multiclase utilizando conjuntos de datos desbalanceados. Esto se puede lograr actualizando la función de aprendizaje de manera que las predicciones correctas e incorrectas realizadas sobre la clase minoritaria sean más recompensadas o penalizadas, respectivamente. Este procedimiento se puede implementar lógicamente aprovechando el paradigma de aprendizaje por refuerzo profundo (DRL) a través de una formulación adecuada del proceso de decisión de Markov (MDP). Este artículo propone SINNER, es decir, un clasificador multiclase basado en DRL que aborda el problema del desbalance de datos a nivel algorítmico al explotar una función de recompensa rediseñada, que modifica el modelo MDP tradicional utilizado para aprender esta tarea. Basado en los resultados experimentales, la fórmula propuesta parece ser exitosa. Además, SINNER se ha comparado con varios modelos basados en DL que pueden manejar el sesgo de clase sin depender de técnicas a nivel de datos. Utilizando tres de cuatro conjuntos de datos obtenidos de la literatura existente, el modelo propuesto logró un rendimiento de clasificación de vanguardia.