Un método de detección de páginas web maliciosas basado en redes convolucionales de grafos
Autores: Wang, Yilin; Xue, Siqing; Song, Jun
Idioma: Inglés
Editor: MDPI
Año: 2022
Acceso abierto
Artículo científico
2022
Un método de detección de páginas web maliciosas basado en redes convolucionales de grafos
Categoría
Matemáticas
Subcategoría
Matemáticas generales
Palabras clave
Internet
Tecnología de la información
Páginas web maliciosas
Métodos de detección
Sintáctico
Semántico
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 21
Citaciones: Sin citaciones
En los últimos años, con el rápido desarrollo de Internet y la tecnología de la información, los sitios web de video, los sitios de compras y otros portales han crecido rápidamente. Sin embargo, las páginas web maliciosas pueden disfrazarse de sitios web benignos y robar la información privada de los usuarios, lo que amenaza seriamente la seguridad en línea. Los métodos actuales de detección de páginas web maliciosas no utilizan completamente la información sintáctica y semántica en el código fuente web. En este artículo, proponemos un método de detección de páginas web maliciosas (GMWD) basado en GCN, que construye un grafo de texto para describir y luego un modelo GCN para aprender las correlaciones sintácticas y semánticas dentro y entre los códigos fuente de las páginas web. Reemplazamos los nodos de palabras en el grafo de texto con nodos de frases para mantener mejor la integridad sintáctica y semántica del código fuente de la página web. Además, utilizamos los enlaces URL que aparecen en el código fuente como información de detección auxiliar para mejorar aún más la precisión de la detección. Los experimentos mostraron que el método propuesto puede lograr una precisión del 99.86% y una tasa de falsos negativos del 0.137%, obteniendo un mejor rendimiento que otros métodos relacionados de detección de páginas web maliciosas.
Descripción
En los últimos años, con el rápido desarrollo de Internet y la tecnología de la información, los sitios web de video, los sitios de compras y otros portales han crecido rápidamente. Sin embargo, las páginas web maliciosas pueden disfrazarse de sitios web benignos y robar la información privada de los usuarios, lo que amenaza seriamente la seguridad en línea. Los métodos actuales de detección de páginas web maliciosas no utilizan completamente la información sintáctica y semántica en el código fuente web. En este artículo, proponemos un método de detección de páginas web maliciosas (GMWD) basado en GCN, que construye un grafo de texto para describir y luego un modelo GCN para aprender las correlaciones sintácticas y semánticas dentro y entre los códigos fuente de las páginas web. Reemplazamos los nodos de palabras en el grafo de texto con nodos de frases para mantener mejor la integridad sintáctica y semántica del código fuente de la página web. Además, utilizamos los enlaces URL que aparecen en el código fuente como información de detección auxiliar para mejorar aún más la precisión de la detección. Los experimentos mostraron que el método propuesto puede lograr una precisión del 99.86% y una tasa de falsos negativos del 0.137%, obteniendo un mejor rendimiento que otros métodos relacionados de detección de páginas web maliciosas.