Phish responder: un enfoque híbrido de aprendizaje automático para detectar correos electrónicos de phishing y spam
Autores: Dewis, Molly; Viana, Thiago
Idioma: Inglés
Editor: MDPI
Año: 2022
Acceso abierto
Artículo científico
2022
Phish responder: un enfoque híbrido de aprendizaje automático para detectar correos electrónicos de phishing y spam
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería de Sistemas
Palabras clave
Tecnología
Ciberataques
Suplantación de identidad
Correos no deseados
Controles de seguridad
Solución de detección
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 21
Citaciones: Sin citaciones
El uso de la tecnología para prevenir ciberataques ha permitido a las organizaciones automatizar en cierta medida la ciberseguridad. A pesar de las soluciones para ayudar a las organizaciones, muchas son susceptibles a correos electrónicos de phishing y spam que pueden tener un impacto no deseado si no se mitigan. Los rasgos que hacen a las organizaciones susceptibles a correos electrónicos de phishing y spam incluyen la falta de conciencia en la identificación de correos maliciosos, la confianza explícita y la falta de controles básicos de seguridad. Para cualquier organización, los correos electrónicos de phishing y spam pueden ser recibidos y las consecuencias de un ataque podrían resultar en interrupciones. Esta investigación investigó la amenaza de phishing y spam y desarrolló una solución de detección para abordar este desafío. El aprendizaje profundo y el procesamiento del lenguaje natural son dos técnicas que se han utilizado en investigaciones relacionadas, lo que ha demostrado mejoras en la detección de phishing. Por lo tanto, esta investigación contribuye desarrollando Phish Responder, una solución que utiliza un enfoque híbrido de aprendizaje automático combinando procesamiento del lenguaje natural para detectar correos electrónicos de phishing y spam. Para asegurar su eficacia, Phish Responder fue sometido a un experimento en el que alcanzó una precisión promedio del 99% con el modelo LSTM para conjuntos de datos basados en texto. Además, Phish Responder ha presentado una precisión promedio del 94% con el modelo MLP para conjuntos de datos basados en números. Phish Responder fue evaluado comparándolo con otras soluciones y a través de una prueba t independiente que demostró que la técnica basada en números es estadísticamente significativamente mejor que los enfoques existentes.
Descripción
El uso de la tecnología para prevenir ciberataques ha permitido a las organizaciones automatizar en cierta medida la ciberseguridad. A pesar de las soluciones para ayudar a las organizaciones, muchas son susceptibles a correos electrónicos de phishing y spam que pueden tener un impacto no deseado si no se mitigan. Los rasgos que hacen a las organizaciones susceptibles a correos electrónicos de phishing y spam incluyen la falta de conciencia en la identificación de correos maliciosos, la confianza explícita y la falta de controles básicos de seguridad. Para cualquier organización, los correos electrónicos de phishing y spam pueden ser recibidos y las consecuencias de un ataque podrían resultar en interrupciones. Esta investigación investigó la amenaza de phishing y spam y desarrolló una solución de detección para abordar este desafío. El aprendizaje profundo y el procesamiento del lenguaje natural son dos técnicas que se han utilizado en investigaciones relacionadas, lo que ha demostrado mejoras en la detección de phishing. Por lo tanto, esta investigación contribuye desarrollando Phish Responder, una solución que utiliza un enfoque híbrido de aprendizaje automático combinando procesamiento del lenguaje natural para detectar correos electrónicos de phishing y spam. Para asegurar su eficacia, Phish Responder fue sometido a un experimento en el que alcanzó una precisión promedio del 99% con el modelo LSTM para conjuntos de datos basados en texto. Además, Phish Responder ha presentado una precisión promedio del 94% con el modelo MLP para conjuntos de datos basados en números. Phish Responder fue evaluado comparándolo con otras soluciones y a través de una prueba t independiente que demostró que la técnica basada en números es estadísticamente significativamente mejor que los enfoques existentes.