Detección de anomalías a nivel de carácter profundo basada en un autoencoder convolucional para la detección de URL de phishing de día cero
Autores: Bu, Seok-Jun; Cho, Sung-Bae
Idioma: Inglés
Editor: MDPI
Año: 2021
Acceso abierto
Artículo científico
2021
Detección de anomalías a nivel de carácter profundo basada en un autoencoder convolucional para la detección de URL de phishing de día cero
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Ataques de phishing
Enfoque basado en datos
Ciberseguridad
Aprendizaje supervisado
Autoencoder convolucional profundo
Caracteres de URL
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 29
Citaciones: Sin citaciones
Considerando la letalidad de los ataques de phishing, se ha verificado que el enfoque basado en datos utilizando observaciones masivas de URL es especialmente efectivo en el campo de la ciberseguridad. Por otro lado, el enfoque de aprendizaje supervisado que se basa en ataques conocidos tiene limitaciones en cuanto a la robustez contra ataques de phishing de día cero. Además, se sabe que es fundamental para la tarea de detección de phishing aprovechar al máximo las características secuenciales de los caracteres de la URL. En conjunto, para garantizar tanto la sostenibilidad como la inteligibilidad, proponemos la combinación de una operación de convolución para modelar las características de la URL a nivel de caracteres y un autoencoder convolucional profundo (CAE) para considerar la naturaleza de los ataques de día cero. Experimentos extensos en tres conjuntos de datos del mundo real que constan de 222,541 URLs mostraron el mejor rendimiento entre los últimos métodos de aprendizaje profundo. Demostramos la superioridad del método propuesto mediante un análisis de la curva característica de operación del receptor (ROC), además de validación cruzada de 10 pliegues y confirmamos que la sensibilidad mejoró en un 3.98% en comparación con el último modelo profundo.
Descripción
Considerando la letalidad de los ataques de phishing, se ha verificado que el enfoque basado en datos utilizando observaciones masivas de URL es especialmente efectivo en el campo de la ciberseguridad. Por otro lado, el enfoque de aprendizaje supervisado que se basa en ataques conocidos tiene limitaciones en cuanto a la robustez contra ataques de phishing de día cero. Además, se sabe que es fundamental para la tarea de detección de phishing aprovechar al máximo las características secuenciales de los caracteres de la URL. En conjunto, para garantizar tanto la sostenibilidad como la inteligibilidad, proponemos la combinación de una operación de convolución para modelar las características de la URL a nivel de caracteres y un autoencoder convolucional profundo (CAE) para considerar la naturaleza de los ataques de día cero. Experimentos extensos en tres conjuntos de datos del mundo real que constan de 222,541 URLs mostraron el mejor rendimiento entre los últimos métodos de aprendizaje profundo. Demostramos la superioridad del método propuesto mediante un análisis de la curva característica de operación del receptor (ROC), además de validación cruzada de 10 pliegues y confirmamos que la sensibilidad mejoró en un 3.98% en comparación con el último modelo profundo.