logo móvil
Contáctanos

Clasificadores basados en árboles para análisis de malware de PE: una revisión de rendimiento

Autores: Louk, Maya Hilda Lestari; Tama, Bayu Adhi

Idioma: Inglés

Editor: MDPI

Año: 2022

Descargar PDF

Acceso abierto

Artículo científico
2022

Clasificadores basados en árboles para análisis de malware de PE: una revisión de rendimiento


Categoría

Ingeniería y Tecnología

Subcategoría

Ingeniería de Software

Palabras clave

Malware
Aprendizaje automático
Conjunto de árboles
Medidas de rendimiento
Conjuntos de datos
Clasificadores

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 25

Citaciones: Sin citaciones


Descripción
Dado su creciente número y variedad, combatir el malware se está volviendo cada vez más arduo. Las técnicas de aprendizaje automático se utilizan con frecuencia en la literatura para descubrir automáticamente los modelos y patrones detrás de tales desafíos y crear soluciones que puedan mantener el ritmo rápido al que evoluciona el malware. Este artículo compara varios métodos de aprendizaje de conjuntos basados en árboles que se han propuesto en el análisis de malware PE. Un conjunto basado en árboles es un paradigma de aprendizaje no convencional que construye y combina una colección de aprendices base (por ejemplo, árboles de decisión), a diferencia del paradigma de aprendizaje convencional, que tiene como objetivo construir aprendices individuales a partir de datos de entrenamiento. Se tienen en cuenta varias técnicas de conjuntos basados en árboles, como bosques aleatorios, XGBoost, CatBoost, GBM y LightGBM, y se evalúan utilizando diferentes medidas de rendimiento, como precisión, MCC, precisión, recall, AUC y F1. Además, el experimento incluye muchos conjuntos de datos públicos, como BODMAS, Kaggle y CIC-MalMem-2022, para demostrar la generalizabilidad de los clasificadores en una variedad de contextos. Según los hallazgos de la prueba, todos los conjuntos basados en árboles tuvieron un buen desempeño y las diferencias de rendimiento entre los algoritmos no son estadísticamente significativas, especialmente cuando sus hiperparámetros respectivos están configurados adecuadamente. Las técnicas de conjuntos basados en árboles propuestas también superaron a otros detectores de malware PE similares que se han publicado en los últimos años.

Otros recursos que podrían interesarte

Temas Virtualpro