Detección de malware en PDF basada en árboles de decisión optimizables
Autores: Abu Al-Haija, Qasem; Odeh, Ammar; Qattous, Hazem
Idioma: Inglés
Editor: MDPI
Año: 2022
Acceso abierto
Artículo científico
2022
Detección de malware en PDF basada en árboles de decisión optimizables
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Pdf
Malware
Detection system
Machine learning methods
Security threats
AdaBoost decision treeSistema de detección de malware en PDF mediante métodos de aprendizaje automático
Amenazas de seguridad
árbol de decisión adaBoost
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 40
Citaciones: Sin citaciones
Los archivos en formato de documento portátil (PDF) son uno de los tipos de archivo más universalmente utilizados. Esto ha incentivado a los hackers a desarrollar métodos para utilizar estos archivos PDF normalmente inocentes para crear amenazas de seguridad a través de archivos PDF como vectores de infección. Esto suele lograrse ocultando código malicioso incrustado en los documentos PDF de las víctimas para infectar sus equipos. Esto, por supuesto, resulta en malware en PDF y requiere técnicas para identificar archivos benignos de archivos maliciosos. Estudios de investigación indicaron que los métodos de aprendizaje automático proporcionan técnicas de detección eficientes contra dicho malware. En este documento, presentamos un nuevo sistema de detección que puede analizar documentos PDF para identificar archivos PDF benignos de archivos PDF con malware. El sistema propuesto utiliza el árbol de decisión AdaBoost con hiperparámetros óptimos, que se entrena y evalúa en un conjunto de datos moderno y completo, es decir, Evasive-PDFMal2022. La evaluación investigativa demuestra un sistema de detección de PDF ligero y preciso, logrando una precisión de predicción del 98.84% con un intervalo de predicción corto de 2.174 segundos. Por lo tanto, el modelo propuesto supera a otros modelos de vanguardia en la misma área de estudio. Por lo tanto, el sistema propuesto puede utilizarse de manera efectiva para descubrir malware en PDF con un alto rendimiento de detección y bajo sobrecosto de detección.
Descripción
Los archivos en formato de documento portátil (PDF) son uno de los tipos de archivo más universalmente utilizados. Esto ha incentivado a los hackers a desarrollar métodos para utilizar estos archivos PDF normalmente inocentes para crear amenazas de seguridad a través de archivos PDF como vectores de infección. Esto suele lograrse ocultando código malicioso incrustado en los documentos PDF de las víctimas para infectar sus equipos. Esto, por supuesto, resulta en malware en PDF y requiere técnicas para identificar archivos benignos de archivos maliciosos. Estudios de investigación indicaron que los métodos de aprendizaje automático proporcionan técnicas de detección eficientes contra dicho malware. En este documento, presentamos un nuevo sistema de detección que puede analizar documentos PDF para identificar archivos PDF benignos de archivos PDF con malware. El sistema propuesto utiliza el árbol de decisión AdaBoost con hiperparámetros óptimos, que se entrena y evalúa en un conjunto de datos moderno y completo, es decir, Evasive-PDFMal2022. La evaluación investigativa demuestra un sistema de detección de PDF ligero y preciso, logrando una precisión de predicción del 98.84% con un intervalo de predicción corto de 2.174 segundos. Por lo tanto, el modelo propuesto supera a otros modelos de vanguardia en la misma área de estudio. Por lo tanto, el sistema propuesto puede utilizarse de manera efectiva para descubrir malware en PDF con un alto rendimiento de detección y bajo sobrecosto de detección.